アルコール度数ー点数分布
師範 @yasushihan のリストにはアルコール度数が(最近のものには糖度・pHも)記載されている。せっかくデータがあるので、アルコール度数の影響も分析したくなった。そこで横軸をアルコール度数、縦軸を点数にしたものが下図である。アルコール度数は通常0.5単位での表記になるので、グラフの横軸方向データは若干離散的である。近似線は単なる線形近似であるが、アルコール度数が高くなるにつれ点数は上がってるようにっ見える。
ただしFortfiedの高いアルコール度数とアルコール度数6度というものが含まれるので、横軸上で外れ値があるのが気になる。で、外れ値を除外すると、下図のようにさらにアルコール度数と点数の相関は強くなった(近似線が見えづらいですね。。。数式中のxの係数を見てください!)。まあ経験上そうかな、と思ってたのだけど、師範のデータで明確になった。つまり今回の結論、アルコール度数が高いほど美味しい可能性が(ちょっとだけだけど)高い!
現時点の総マイニング本数=1201 (価格やアルコール度数の表記がないワインも多いので他のグラフのデータ点数とは一致しません)
なお筆者は統計の専門家ではないので、趣味で勉強しながら分析してます。まずは仕事の勉強しろよ、って話ですが、この経験をいつか人生に活かします!