安ワイン道場のリストを使ってワインコスパ分析始めました

「 美味い酒が飲みたい!でも高い金は出したくない!」

これは資産家でもない限り、酒飲みに共通する願望だと思う。あらゆる酒の中でもワインは価格帯も品質も幅広く、初心者にはコストパフォーマンス(コスパ)の良いものを見つけることは容易ではない。ただし価格は明確であるが、そもそも品質を定義することが困難である。美味いと感じるかどうかは、個々人の主観である。

 とはいえ、コスパの良いワインを購入前に推定することは不可能なのだろうか?飲んだことのあるボトルや、雑誌などの推薦があるものなら、ある程度の推定は可能である。一方で、初見のボトルを前にして購入に値する品質が期待できるかどうか、推定することは困難である。

 であるならば、過去の統計を利用して、コスパ期待値をはじき出せないだろうか?世の中には飲んだワインを評価してポイントを出している雑誌、ウェブサイトが多数存在する。その情報を利用できないだろうか?

 ここで筆者が数年前から参考にしているウェブサイト、安ワイン道場

www2s.biglobe.ne.jp

がある。そのワインリストは7000件を超え、統計的な処理をするには十分な数を有している。さらに購入価格帯は手に届くものが多く、それ以外にも王道やハズレにも挑戦しているという、リストの幅広さも魅力である。そこで道場の師範 @yasushihan の許可を得て、リストの分析を始めることにした。これだとワインの品質評価は師範の出した得点に完全に依存するが、複数の方が出した得点を混ぜるよりは統計的には信頼できると思われる。

 さて、コスパを分析するためには次にコスパの指標となる数値を作る必要がある。得点に対して増加し、価格に対して減少する関数を用いた指標とすべきで、単純に思いつくのは(得点)/(価格)という割り算の関数である。ただし得点が0~100点に分布するのに対して、価格の振れ幅がおおよそ百円から数万円と広い。これで試しに分析すると、得点48点の謎のベトナムワインが暫定一位になってしまった。いくら安くても不味いのはイヤだ!そこで、価格の影響を圧縮するために対数とすることにした。その結果、コスパ指数を

Cost-effective Wine Factor (CWF) = 得点/Log10 (価格)

とした。もっと複雑な関数とした方がコスパとしては正確になるかもしれないが(実際友人にそのような提案もされた)、学術雑誌の質?を示すインパクトファクターのように、単純な指標の方が理解しやすいので、このCWFを採用した。なお、価格は飲食店で飲むと市販価格よりかなり高価になるので、気がついた限りは飲食店価格のものは統計から外した。またセット購入されたものは、単品価格が記載されていれば単品価格を使用し、記載がなければセット価格を本数で割った価格を採用した。

 ただし、CWFは全体やあるグループの傾向を見て、ワインのコスパを予測するためのものであり、「このワインのCWFを知りたい」「私が飲んできたワインのCWFの合計はいくつか」という問いに用いてはいけない。ぶっちゃけ、CWFによる分析は筆者のただの遊びであるため、個々のワインや個人のワインの飲み方を比較する意図もないし、そのような能力を持つものでもない。

 分析はまだ途中だが、現状800本程度のワインのデータを根性でマイニングし、産地を分けない世界全体の分析では下記のようなCWF分布が得られている。Twitterでも進捗を呟いているが、文章としてまとめられる成果が出次第(そして筆者が作文する時間がある時)、こちらでも公表していきたい。

 今のところの世界平均CWF=23.08

(ご参考:例えば千円のワインが100点だとCWFは33.3で、この図の右端を超えます。逆に千円のワインが30点だとCWFは10でこの図の左端に来ます。1万円のワインが100点だとCWFは25で、平均よりちょっと上です。)

f:id:QtCsf:20201128164727p:plain

世界のCWF分布