經濟客飯|如何一眼睇出數據造假|曾國平

經濟客飯|如何一眼睇出數據造假|曾國平

曾國平 | 2021.10.25

先跟大家玩個好像很無聊的數字遊戲。

在過去七年,比特幣價格的第一個數字(例如現價6萬幾美元,數字就是6),那些出現得較多?那些較少?

你可能會想,這段期間比特幣價格如過山車上上落落,由幾千元、幾萬元甚麼水平也試過,由1到9的第一個數字,出現次數照理是差不多吧?

我利用比特幣每日「收市價」(其實比特幣市場沒有收市,這只是每日凌晨同一時間的價格)找出正確答案:數字1出現得最多,佔16%,其次是2和3, 各佔15%,出現得最少的是8,不夠7%,數字5和9多一點點。也就是說,數字越細,在第一個數字出現的機會較高;數字越大,則越少亮相。

不信邪的,可看幣值跟比特幣大為不同的以太幣。 在過去六年,數字1也是出現得最多,高達40%,其次是2和3,分別約佔23%和13%,出現得最少的是6至9,各有3%左右。

若果大家有時間,可以隨便找一隻股票的價格,又或香港過去幾十年的經濟增長,又或世界各國面積或人口,又或六合彩累積獎金,相信都會有類似發現:第一個數字越小,出現次數越多。當然了,你分析的數據不能太少(例如只看過去幾個月的比特幣價格),其波幅也不能太狹窄(例如香港氣溫絕大部份時間都是十幾至三十幾度)。

這個統計現象稱為Benford’s law。不是甚麼神奇魔法,是有其數學解釋的,但內容太複雜就無謂講太多,大家知道如何日常應用就夠了:以後見到一些統計數字,若果第一個字越細反而越少出現,又或某個數字表現太過突出,那統計數字就很有機會是捏造出來,而非自然產生。

曾國平
維珍尼亞理工大學經濟系副教授
——————

支持 BossMind 三步曲:

▴Click 入 BossMind FB啦

▴Follow 埋個 Instagram

▴Subcribe 咗個 Youtube Channel

曾國平
 | 2021.10.25

維珍尼亞理工大學經濟系副教授

分享這個帖子
文章精選