アルコール度数ー点数分布

師範 @yasushihan のリストにはアルコール度数が(最近のものには糖度・pHも)記載されている。せっかくデータがあるので、アルコール度数の影響も分析したくなった。そこで横軸をアルコール度数、縦軸を点数にしたものが下図である。アルコール度数は通常0.5単位での表記になるので、グラフの横軸方向データは若干離散的である。近似線は単なる線形近似であるが、アルコール度数が高くなるにつれ点数は上がってるようにっ見える。

f:id:QtCsf:20201201195205p:plain

今のところの世界全体のアルコール度数ー点数分布

 ただしFortfiedの高いアルコール度数とアルコール度数6度というものが含まれるので、横軸上で外れ値があるのが気になる。で、外れ値を除外すると、下図のようにさらにアルコール度数と点数の相関は強くなった(近似線が見えづらいですね。。。数式中のxの係数を見てください!)。まあ経験上そうかな、と思ってたのだけど、師範のデータで明確になった。つまり今回の結論、アルコール度数が高いほど美味しい可能性が(ちょっとだけだけど)高い!

f:id:QtCsf:20201201195301p:plain

外れ値補正した今のところの世界全体のアルコール度数ー点数分布

 

現時点の総マイニング本数=1201 (価格やアルコール度数の表記がないワインも多いので他のグラフのデータ点数とは一致しません)

 

 なお筆者は統計の専門家ではないので、趣味で勉強しながら分析してます。まずは仕事の勉強しろよ、って話ですが、この経験をいつか人生に活かします!