葡萄酒分数的随机性

“醉汉的脚步”(The Drunkard's Walk)是用来解释随机性的一种数学统计模型,起源于英国数学家卡尔·皮尔逊的“随机游走”理论,比如液体的分子运动、股市的价格波动、动物的觅食路径、醉汉的脚步,都是以不规则的、不可预测的“随机游走”模式运动的。根据随机性定律,酒评家们的分数也是一种具有随机性和偶然性的随机变量。请同一位品尝者再过一小时重新品尝同一款酒,可能会给出不同的分数;请不同品尝者在同一时间或相近时间品尝同一款酒,大家给出的分数可能更是天壤之别。例如加州塔布拉斯-格里克酒庄(Tablas Creek Vineyard)的2002年份塔布拉斯干红(Côtes de Tablas),《Wine Advocate》杂志在2004年8月给予90分,《Wine Spectator》杂志在2005年1月只给予78分。在《Wine Spectator》评分体系,90分(90-95分范围)属于“具有特殊的复杂性和个性的出色的葡萄酒”;在《Wine Spectator》评分体系,78分(70- 79分范围)属于“尚可饮用但可能有轻微缺陷的平庸的葡萄酒”。那么,消费者究竟该如何判断这款葡萄酒?是不是可以把两家杂志给予的分数加起来去平均,也即“90+78”除以2,最终得出84分的结论?
 
  在书中,列纳德·蒙洛迪诺还提出一种假设:如果葡萄酒的得分是90分,品酒记录表为15份,一种可能是15份品酒记录表给予的分数都是90分,另一种可能是15份品酒记录表给予的分数分别为80、81、82、87、89、89、90、90、90、91、91、94、97、99、100分,这15个分数的均值同样是90分,那么这意味着什么呢?蒙洛迪诺分析指出:“所有酒评分数都是90分的数据,其样本标准差为0,这告诉我们,所有数据都与均值相同。但当样本标准差较大时,数据就没有簇集在均值附近。那个取值在80分到100分的葡萄酒分数集,其样本标准差为6分。根据一个经验规则可知,大多数评分与均值的差都落在6分之内。此时我们对这种酒所能真正给出的评价,是它的分数很可能落在84分到96分之间。”
 
  我们在品酒会上给一款葡萄酒打分时,通常是以各位评委的分数之和除以评委人数,去取一个平均值。而根据随机性定律,均值并不能准确地反映一款葡萄酒的真实水平,甚至还会掩盖部分真相。除了均值,我们还应该考虑到反映数据离散程度的样本标准差,也即样本方差的算术平方根。如此说来,葡萄酒评比大赛不但需要邀请公证员监督公证,似乎还应该邀请一位研究概率与统计的数学家。