預測世界杯新工具——大數(shù)據(jù)
最近,有報道稱,一些公司利用大數(shù)據(jù)成功地預測了世界杯8分之1決賽的結(jié)果。不少人提出疑惑:若大數(shù)據(jù)預測世界杯靠譜,那誰會樂翻天?
一、有公司聲稱場場預測準確
近日,對于利用大數(shù)據(jù)預測世界杯的報道屢見不鮮。 有公司聲稱他們利用大數(shù)據(jù)預測世界杯的結(jié)果準確率貌似很高。
例如谷歌。其產(chǎn)品營銷經(jīng)理本杰明·貝托謝姆(Benjamin Bechtolsheim)周三在一篇博客中表示,到目前為止,谷歌的云計算平臺已成功預測了世界杯16強比賽每場比賽的勝利者。注意:是16強(即8分之1決賽)比賽勝利者。
谷歌稱,他們使用了來自Opta Sports的數(shù)據(jù),評估了每個職業(yè)足球聯(lián)盟過去多個賽季的情況,以及世界杯小組賽期間的統(tǒng)計數(shù)據(jù)。這一系統(tǒng)還使用了由BigQuery工程師喬丹·提加尼(Jordan Tigani)開發(fā)的實力排行榜系統(tǒng),同時考慮了觀眾熱情程度數(shù)據(jù),以計算主隊優(yōu)勢。
不過,谷歌也承認,他們并不是唯一做出完美預測的公司,而世界杯16強比賽中也沒有冷門出現(xiàn)?!皼]有冷門出現(xiàn)”這很關鍵。當然,如果實力均衡,也不算什么冷門,那要預測準確也不容易。
其實,剛看了下百度的8分之1決賽的預測,也全部命中。這說明,谷歌還真不是謙虛。因為想想:若大數(shù)據(jù)預測世界杯之類的球賽結(jié)果非常準確的話,那么誰會樂翻天?至少體彩參與者會!
二、說全都能預測準確不會靠譜
問題,對于預測,無論用不用大數(shù)據(jù),多數(shù)情況下都不能保證百分之百的準確度。如果都能準確預測,那么體彩、股票、基金甚至戰(zhàn)爭,都可能有人大賺特賺。
即使是利用大數(shù)據(jù)準確預測的典型案例中,也難覓百分之百準確率的。例如,微軟紐約研究院經(jīng)濟學家 David Rothschild 通過大數(shù)據(jù)分析,成功預測了2014年奧斯卡24項獎項中的21項,還有3項沒預測對。
同樣是他,成功預測了 2013 年奧斯卡的獲獎名單,他以 24 個中預測對了 19個。在 2012 年美國總統(tǒng)大選中,David Rothschild 正確預測了 51 個選區(qū)中 50 個地區(qū)的選舉結(jié)果,也還有1個沒預測對。
所以,不想妄想利用大數(shù)據(jù)就能做到觀測百發(fā)百中。然而,預測跑的是概率。利用大數(shù)據(jù)預測比不利用大數(shù)據(jù)預測準確度要高。只是,對于足球而言,要看是否有其他偶然因素,例如傷病、運氣及誤判等因素。
三、說預測完全不靠譜也不靠譜
這樣說來,大數(shù)據(jù)預測世界杯之類的比賽結(jié)果還是很有價值的。有些大數(shù)據(jù)的分析依賴于海量的數(shù)據(jù),預測的結(jié)果可能也會相對更精準,甚至超出你的預測結(jié)果。至少,大數(shù)據(jù)預測世界杯要比大嘴烏鴉貝利、章魚保羅、熊貓寶寶及烏賊劉要靠譜得多。
據(jù)了解,除了谷歌及百度在預測世界杯,還有高盛、德銀及科隆體育等機構(gòu),甚至還有科學家霍金。
霍金的許多關于足球的預測還挺有數(shù)據(jù)感,例如:提到點球大戰(zhàn),霍金認為助跑必須不少于三步,如果速度上不去,進球幾率只有58%。瞄準上角的點球有84%的命中率,金發(fā)和禿頭的球員射中的概率達到更高的84%,前鋒的進球概率超過80%,中場與后衛(wèi)遞減。
說到這里,我們不妨看看谷歌及百度對于4分之1決賽結(jié)果的預測:
谷歌預測的結(jié)果是——巴西對哥倫比亞:巴西勝概率為71%;法國對德國:法國勝概率為69%;荷蘭對哥斯達黎加:荷蘭勝概率為68%;阿根廷對比利時:阿根廷勝概率為81%。 百度預測的結(jié)果是——巴西對哥倫比亞:巴西勝概率為71%;法國對德國:德國勝概率為58%;荷蘭對哥斯達黎加:荷蘭勝概率為82%;阿根廷對比利時:阿根廷勝概率為63%。
好吧,這樣PK一下,谷歌與百度在法國對德國比賽的結(jié)果預測是相反的。它們二者至少有一方4分之1決賽預測準確度將最多是75%。
不過,所有的預測不能單獨看8分之1決賽或4分之1決賽的準確度,甚至不能僅看這一次世界杯的準確度,要在更大范圍里觀察預測結(jié)果。
其實,最令人吃驚的是,霍金曾經(jīng)預測過:“世界將在兩百年之后滅亡”,這個預測結(jié)果可能比任何一場比賽的結(jié)果要更讓你揪心吧!
作者:陳永東,中國十大IT博主,新媒體研究者
原創(chuàng)文章,作者:王琪,如若轉(zhuǎn)載,請注明出處:http://m.qyysmy.cn/blog/archives/8885