地域別分析 Deutsch

地域別分析の2つ目はドイツ(Deutsch)にしてみた(前回の投稿から随分間が空いてしまいました…もう年末かよ...)。分析時点でリスト全部のワインの数値が得られたし、師範 @yasushihan の周囲で先日ドイツワインを飲む会があったようなので、なんとなくですwということでCWF分布は以下。平均は

Deutsh平均CWF=23.44

と優秀!でもばらつきはJapanより幅広いかな。

f:id:QtCsf:20201228173554p:plain

DeutschワインのCWF分布

価格-点数分布は以下で、1万円以下のものでも高い点数のものがあって、良い感じです。個人的にはこれまであまりドイツワインを飲む機会がなかったけど、今後は積極的に飲んでみたいと思わせる結果。

f:id:QtCsf:20201228174143p:plain

Deutschワインの価格-点数分布

師範の稽古本数は相対的には他地域に比べて少ないので、統計的には誤差を無視できないかもだけど、最近のビンテージほどコスパも良い感じ。これは良いこと!

f:id:QtCsf:20201228174619p:plain

CWFのビンテージ依存

ということで結論。

結論:ドイツワイン、特に最近のものは、たぶんコスパ良さそうです!皆さん飲んで確かめてください!

ビンテージ推移 Japan

先の投稿で示したようにJapanワイン、コスパは低めだけど安定しているわけです。しかし時系列ではどうだろうか。日本もワイナリーが増えてきてて、近年では古きJapanワインも減り、価格も変わってきてるかもしれない。コスパが良くなってるといーなー、という淡い期待を持ちつつ分析。

 ということでビンテージに対する図を作りました。ビンテージ対CWFの図がこちら

f:id:QtCsf:20201205223600p:plain

Japan CWFのビンテージ依存


若干の増加傾向でした。分析中は減少傾向の時もあり、途中で残念な気分にもなりましたが、最終的には増加傾向。よかった!で、点数だけに絞ると、下図になります。

f:id:QtCsf:20201205223728p:plain

点数のビンテージ依存


ビンテージと点数をプロットすると明確に上がってるんですよね。最近のJapanすげえ!古いものはデータ点数が少ないのもあるけど結構バラバラで残念。

 で、価格をプロットしたのが下図。

f:id:QtCsf:20201205223911p:plain

価格のビンテージ依存

 

うひゃあ、価格も増加傾向!

 師範の稽古価格帯は基本安いものだけど、たまに高い日本ワインとも稽古してるのでそのせいかな?それにしても、日本のワイナリーは良いもの作ろうとしてて、それが販売価格に転嫁されっちゃったのかなあ…どうなんでしょ?

【訂正】

師範からコメントあって、師範の日本ワインの購入価格帯が過去から変わってきているのがデータに反映されているとのことです。ということでデータ解釈と結論を訂正します(特に下2つの図)。

 

結論:Japanワインの品質は良くなってきてるけど、その分価格も上がっちゃったかも

結論として言えることは、一番上の図から、コスパはやっぱ安定しているってことですかねぇ。

地域別分析 Japan

世界全体のデータ分析はひとまず置いておいて、地域ごとの分析結果を示していきたい。まずは我らがJapan。日本ワインのコスパについてはネガティブな意見を言う人もいるけど、それが本当かどうかを見ていきたい。ちなみに、現時点での師範 @yasushihanの Japanのリストを全て拾ってある(価格と点数がつくもので156本)。ただし師範がJapanワインを飲むとこの結果も古くなるけど…

 まずはCWFの平均値であるが、

Japan平均CWF=22.27

と、やはり世界平均値の23.08より低い。ただし下図のように、一点外れ値があるが(古きJapanテイストのワインのようです)CWFの分布は固まっていて、非常に安定していることがわかる。

f:id:QtCsf:20201205170804p:plain

JapanワインのCWF分布

 で、下図の価格-点数分布を見ると、ほぼ対数近似の直線に乗っている。つまり、支払った価格に対しての品質はおおよそ担保されているのだ。コスパは悪くても、安心感があると言えるだろう。今はふるさと納税で税金の控除を受けながら購入もできるし、それを考えるとJapanワイン、悪くないんじゃないの?(筆者も最近ふるさと納税使って買ってます) 

f:id:QtCsf:20201205171234p:plain

Japanワインの価格-点数分布

結論:日本ワインはコスパはあんま良くないけど、安心して買えそうです。

アルコール度数ー点数分布

師範 @yasushihan のリストにはアルコール度数が(最近のものには糖度・pHも)記載されている。せっかくデータがあるので、アルコール度数の影響も分析したくなった。そこで横軸をアルコール度数、縦軸を点数にしたものが下図である。アルコール度数は通常0.5単位での表記になるので、グラフの横軸方向データは若干離散的である。近似線は単なる線形近似であるが、アルコール度数が高くなるにつれ点数は上がってるようにっ見える。

f:id:QtCsf:20201201195205p:plain

今のところの世界全体のアルコール度数ー点数分布

 ただしFortfiedの高いアルコール度数とアルコール度数6度というものが含まれるので、横軸上で外れ値があるのが気になる。で、外れ値を除外すると、下図のようにさらにアルコール度数と点数の相関は強くなった(近似線が見えづらいですね。。。数式中のxの係数を見てください!)。まあ経験上そうかな、と思ってたのだけど、師範のデータで明確になった。つまり今回の結論、アルコール度数が高いほど美味しい可能性が(ちょっとだけだけど)高い!

f:id:QtCsf:20201201195301p:plain

外れ値補正した今のところの世界全体のアルコール度数ー点数分布

 

現時点の総マイニング本数=1201 (価格やアルコール度数の表記がないワインも多いので他のグラフのデータ点数とは一致しません)

 

 なお筆者は統計の専門家ではないので、趣味で勉強しながら分析してます。まずは仕事の勉強しろよ、って話ですが、この経験をいつか人生に活かします!

 

価格ー点数分布

先の記事のCWFの基になるのは、師範 @yasushihan の入手価格と、師範が付けた点数になるのだが、その相関を見るだけでもそこそこ面白い。横軸を価格の対数として、縦軸を点数にしたのが以下の図である(点数については、時間経過による加点前の抜栓直後のものを採用している)。

 図中には対数関数の近似曲線を挿入し、数式も表示した。数式は常用対数(10が底)の方がグラフ的にもCWF的にもわかり易いのだが、エクセルの仕様上自然対数(ネイピア数が底)になっている。いずれにしてもこの数式を使えば、支払った価格に対して得られる品質が予測できる。90点のものを飲みたいなら1万円程度払おうね、って感じ。とはいえ、普及価格帯の千円付近は点数のバラつきも大きいので、この数式はあくまで目安でしょうね。

 バラツキといえば、当初はCWFを正規分布として分散も評価していたのだが、ブショネやら謎の劣化ワインなどが繰り出す低評価(外れ値?)に大きく影響を受けるので、バラツキの評価は今後の検討課題である(どなたか良い案があったらご教示ください!)。

 なお、下図の分布の近似線はサンプル数が少ない時からほとんど変わってないので、ある程度ユニバーサルな線になっているように思える。もっとも師範という巨人の肩の上に立った素人が引いた線ですけどね(汗)。
 

f:id:QtCsf:20201130195423p:plain

今のところの世界全体の価格ー点数分布図
 

安ワイン道場のリストを使ってワインコスパ分析始めました

「 美味い酒が飲みたい!でも高い金は出したくない!」

これは資産家でもない限り、酒飲みに共通する願望だと思う。あらゆる酒の中でもワインは価格帯も品質も幅広く、初心者にはコストパフォーマンス(コスパ)の良いものを見つけることは容易ではない。ただし価格は明確であるが、そもそも品質を定義することが困難である。美味いと感じるかどうかは、個々人の主観である。

 とはいえ、コスパの良いワインを購入前に推定することは不可能なのだろうか?飲んだことのあるボトルや、雑誌などの推薦があるものなら、ある程度の推定は可能である。一方で、初見のボトルを前にして購入に値する品質が期待できるかどうか、推定することは困難である。

 であるならば、過去の統計を利用して、コスパ期待値をはじき出せないだろうか?世の中には飲んだワインを評価してポイントを出している雑誌、ウェブサイトが多数存在する。その情報を利用できないだろうか?

 ここで筆者が数年前から参考にしているウェブサイト、安ワイン道場

www2s.biglobe.ne.jp

がある。そのワインリストは7000件を超え、統計的な処理をするには十分な数を有している。さらに購入価格帯は手に届くものが多く、それ以外にも王道やハズレにも挑戦しているという、リストの幅広さも魅力である。そこで道場の師範 @yasushihan の許可を得て、リストの分析を始めることにした。これだとワインの品質評価は師範の出した得点に完全に依存するが、複数の方が出した得点を混ぜるよりは統計的には信頼できると思われる。

 さて、コスパを分析するためには次にコスパの指標となる数値を作る必要がある。得点に対して増加し、価格に対して減少する関数を用いた指標とすべきで、単純に思いつくのは(得点)/(価格)という割り算の関数である。ただし得点が0~100点に分布するのに対して、価格の振れ幅がおおよそ百円から数万円と広い。これで試しに分析すると、得点48点の謎のベトナムワインが暫定一位になってしまった。いくら安くても不味いのはイヤだ!そこで、価格の影響を圧縮するために対数とすることにした。その結果、コスパ指数を

Cost-effective Wine Factor (CWF) = 得点/Log10 (価格)

とした。もっと複雑な関数とした方がコスパとしては正確になるかもしれないが(実際友人にそのような提案もされた)、学術雑誌の質?を示すインパクトファクターのように、単純な指標の方が理解しやすいので、このCWFを採用した。なお、価格は飲食店で飲むと市販価格よりかなり高価になるので、気がついた限りは飲食店価格のものは統計から外した。またセット購入されたものは、単品価格が記載されていれば単品価格を使用し、記載がなければセット価格を本数で割った価格を採用した。

 ただし、CWFは全体やあるグループの傾向を見て、ワインのコスパを予測するためのものであり、「このワインのCWFを知りたい」「私が飲んできたワインのCWFの合計はいくつか」という問いに用いてはいけない。ぶっちゃけ、CWFによる分析は筆者のただの遊びであるため、個々のワインや個人のワインの飲み方を比較する意図もないし、そのような能力を持つものでもない。

 分析はまだ途中だが、現状800本程度のワインのデータを根性でマイニングし、産地を分けない世界全体の分析では下記のようなCWF分布が得られている。Twitterでも進捗を呟いているが、文章としてまとめられる成果が出次第(そして筆者が作文する時間がある時)、こちらでも公表していきたい。

 今のところの世界平均CWF=23.08

(ご参考:例えば千円のワインが100点だとCWFは33.3で、この図の右端を超えます。逆に千円のワインが30点だとCWFは10でこの図の左端に来ます。1万円のワインが100点だとCWFは25で、平均よりちょっと上です。)

f:id:QtCsf:20201128164727p:plain

世界のCWF分布