アルコール度数、糖度、pHで美味しさを見積もることができるか?
師範 @yasushihan の最近のリストにはアルコール度数のみならず、糖度とpHの測定結果が公開されている。それらを可能な範囲でマイニングしているのだが、おそらく皆さん気になるのは、それらの数値と美味しさの関係だと思う。その関係がわかれば、目に見える数値で美味しいワインを手に入れる道が見えるんじゃない!?(生産者の方々には、お前ワインなめてんじゃねえ!って怒られそう…)
ということでPythonを使ってプロットしてみた。対象は全世界で現状データのある307本のワインで、数値の離れたデータの間は線形補間してあります。まずはpHとアルコール度数に対する点数の等高線。色が薄くなるほど点数が高い。以前に書いたようにアルコール度数に対して点数は正の相関があるように見える(上に行けば点数が高そう)。まあ横方向にも分布もあるけど、そっちは傾向としてつかめるほどではないかな。
じゃあ、他のパラメータはどうかってことですが、糖度とアルコール度数で等高線を書くと、やっぱりアルコール度数に対する相関が強い。上の方が点数高そうです。あ、ちなみにデザートワインの糖度は高すぎるのでこの図の右外側になります。
そして糖度とpHでプロットすると群雄割拠。もうわかんねえや。pHが低すぎたり、糖度が低すぎるのがあかんのはわかるけど、図の真ん中はすごいことになってる。なお、図の上の方の糖度の8以上のところはデザートワインの点数に引きずられたものなので、参考にしづらいっす。
ということで結論
結論:糖度とpHの値だけで美味しさは決まらない。アルコール度数もぼんやり関係がありそうな程度。美味しさの起源は分析可能な数値だけじゃないからな!(分析屋としての戒め)。
(3次元以上のパラメータを分析したらまた違った結果になるかもしれないけど、図にできなくてわかりづらいので保留)