貝氏機率,偽科學充斥社會嘅原因?(Bayesian statistics, the reason why pseudoscience prevails?)

最近有線新聞節目《新聞刺針》對近年興起嘅動物傳心做了深入調查,訪問咗5位傳心師同親身上堂聆聽工X會所謂有認證,讀完有證書嘅傳心課程。結果最後動物傳心被踢爆只係騙局,被訪嘅5位傳心師雖然聲稱睇過動物嘅相後就可以同動物隔空對話,但佢地睇完記者提供「布歐」嘅玉照後唔單止講嘅故仔自相矛盾,甚至連「布歐」只係一隻玩具龜呢個事實都睇唔出 [sosad]詳細報導請睇番[1]

報導出咗後喺社會同「傳心業界」帶嚟好大迴響。除左生物、物理學界有人出嚟同所謂有科學根據嘅「動物傳心業界」劃清界線,釐清乜嘢先係量子糾纏(quantum entanglement)[2],亦有唔少人從科學、哲學、人性等唔同方面探討呢個現象同其他偽科學出現背後嘅成因,研究點解呢啲睇落咁匪夷所思嘅偽科學嘢會有咁多人信[3]。小弟今日都想講吓呢個話題,不過喺由比較學術性嘅另一方面—數學探討呢個現象 [slick]

機率都有分類?貝氏機率係乜嘢?(What? There are different types of probability? What is Bayesian statistics?)

又關數學事?係呀,小弟雖然唔係科學/數學至上主義者,不過科學家同偽科學信徒點睇同一件事、一個假設/理論,有冇預設立場呢啲討論的確係可以客觀咁由數學,機率方面探討分析 [slick]

喺入正題前,小弟首先想問大家兩條可能會令大家痴線諗爆頭,有關機率嘅數學題 😀

1)小弟朋友屋企有一對細路,佢話俾小弟知至少其中一個係女仔(淨係知咁多,其他嘢完全唔知),咁另一個都係女仔機會係幾多?
2)小弟去探另一位一樣有一對細路嘅朋友。小弟本身唔知對細路性別係乜,但朋友屋企幫手開門嘅係一個細路女 (假設開門嘅細路係嗰對細路隨機 50/50一位)。咁另一個細路佢係女仔嘅機會率係幾多?

(假設生男/女機會率同為1/2,不考慮LGBT)

兩條問題好似一樣,不過兩者答案係(可以)唔同o架!(答案同詳細解釋請睇文章結尾 [slick])

相信大家中學讀數時都學過簡單機率問題,好似擲骰仔擲到1、喺一副啤牌入面抽到A嘅機率係幾大咁。呢啲其實都係頻率論(Frequentist probability),統計學入面機率分析其實仲有另一種,就係貝氏機率(Bayesian probability

貝氏機率係由貝氏定理(Bayes theorem)所提供嘅一種對機率嘅解釋,它採用將機率定義為某個人對一個命題信任程度嘅概念。唔同頻率論入面機率嘅分佈係固定同假設咗係已知 (通常為平均分佈uniform distribution或高斯分佈 Gaussian distribution) ,貝氏機率嘅概念似賭博投注,講嘅係根據已知數據或資訊推測結果/背後嘅機率分佈。而且預測會隨著所得數據或資訊改變。簡單例子就好似預測天氣,甚至極端啲預測十二碼入唔入咁,如果根據頻率論推測,隨時會由桂神「十二碼一係入一係唔入」嘅金句得出射入十二碼,聽日落雨嘅機率為50%呢啲荒謬答案。另外用頻率論去討論聽日會唔會落雨,下球十二碼美x或x朗射唔射得入呢啲情況本身就存在定義問題。因為聽日/下球十二碼只會出現一次,即係統計上只會得落雨/冇落雨,入/唔入,用頻率去定義機率嘅話結果只會係0或者100%…所以只有從貝氏角度出發,講你幾有信心件事結果會係咁先符合討論情況

氏定理,前設/先驗機率 (Bayes’ theorem, prior probability)

講咗咁耐,貝氏機率同呢人盲目咁信偽科學又有乜關係呢?喺解釋兩者關係之前,首先要了解乜嘢係貝氏定理。

貝氏定理係一條關於兩件隨機事件條件概率 (conditional probability)嘅定理。簡單講就係如果有兩件隨機事件A同B,咁當已知B發生後A發生嘅條件概率 – P(A|B) 同當已知A發生後B會發生嘅條件概率 – P(B|A),兩者間存在著上圖嘅關係。上面P(A) = 事件A發生機率,P(B) = 事件B發生機率。

貝氏定理應用嘅簡單經典例子包括蒙提.荷爾問題(Monty Hall problem)同罕有疾病嘅醫學檢測。假設一個國家入面有1%嘅人患有某種罕見疾病。醫院為左搵出所有患者,研發出一種針對呢種病嘅醫學檢測法,準確率達99%。呢度準確率係指真正嘅患者有99%對檢測法呈陽性反應,1%呈陰性;同樣地非患者有99%對檢測法呈陰性反應,1%呈陽性。咁如果醫院隨機喺國家入面挑選一個人做檢測,而結果呈陽性,咁嗰個人真係有病嘅機率係幾多呢?99%?錯啦,正確答案其實得50% [slick] 99%準確率睇落好似好準,不過由於呢種病屬罕見只得1%人有,所以檢測屬假陽性嘅人統計上數目其實同檢測屬真陽性一樣。 類似情況嘅詳細解釋請睇[4]

model_equation_bayesian

根據貝氏定理,科學家就可以有意義咁討論數據,實驗結果點影響佢地對一個假設理論模型啱唔啱嘅信心 (如上圖)。簡單例子就好似擲骰仔咁。假設你擲一粒骰仔連續擲到6多達N次,咁粒擲仔被人做咗手腳嘅機率係幾多呢?到N+1次都係擲到6嘅時候你嘅睇法又會點變呢?貝氏定理/貝氏機率就可以解答到呢啲問題。不過貝氏定理只係話到俾我地知點根據每次觀察結果去更新,修正原先嘅睇法、模型,但佢唔會話到俾我地知乜嘢前設/先驗機率(prior probability),即上圖嘅 P(模型A) 先係啱。而選擇乜嘢前設/先驗機率係會影響最後根據觀察結果得出嘅結論。

講番擲骰仔嘅例子,假設你一開始未擲之前已經偏向相信粒骰仔被人做咗手腳,咁只要連續擲到未必好多次6你就可能認定粒骰仔真係被人做咗手腳;相反如果你唔太信粒骰仔被人做咗手腳而篤信自己「行運一條龍」,咁可能就要連續擲到好多好多次6你先會信粒骰仔真係被人做咗手腳。當然只要有足夠多甚至唔同類型嘅觀察結果,例如擲骰仔擲足夠多次咁,大部份人最後得出嘅結論應該會殊途同歸,除左兩類人:100%認定自己係啱或者人地係錯嘅人 [banghead] 呢兩類人就算有無限多而且唔同種類嘅觀察結果或數據都唔會改變睇法,某程度上就好似某啲偽科學、反氣候轉變信徒咁。正如Nate Silver《The Signal and the Noise》一書所講,同呢類人討論根本晒心機同時間,因為佢地永遠可以自圓其說,為自己嘅睇法搵到「解釋」[banghead] 科學家雖然唔係萬能,一樣可能會有個人偏見,但佢地基本上係會盡量客觀咁睇一件事或模型,歡迎同鼓勵合理客觀嘅討論。佢地好少真係會100%認定自己係啱或者錯,除左某啲科學至上嘅人,不過嗰類人某程度上唔算得上係真.科學家。而且佢地好多時甚至希望任何同自己睇法相違嘅事/理論係真(因為咁代表有好多新研究方向可以做,好似係[sosad]),就好似小弟偶像湯川學咁 [slick] 所以偽科學,量子乜乜乜充斥社會呢啲問題一切都係貝氏機率嘅錯,好似係 [sosad]

 

有關貝氏定理點樣同一個人嘅信念相關可以睇下面短片(含中文字幕)

https://www.youtube.com/watch?v=R13BD8qKeTg

 

今次講住咁多先,下次再講 #bye#

 

引申延讀:

[1] http://cablenews.i-cable.com/ci/videopage/program/122490332/%E6%96%B0%E8%81%9E%E5%88%BA%E9%87%9D/%E5%82%B3%E5%BF%83%E5%B8%AB%E8%81%B2%E7%A8%B1%E9%9D%A0%E7%85%A7%E7%89%87%E5%8F%AF%E7%9F%A5%E5%8B%95%E7%89%A9%E6%83%B3%E6%B3%95

[2] 想認識乜嘢係量子糾纏可以睇番小弟嘅拙文

https://godfreyleungcosmo.wordpress.com/2017/05/24/%E6%89%80%E6%9C%89%E5%98%A2%E9%83%BD%E4%BF%82%E9%87%8F%E5%AD%90%E7%B3%BB%E5%88%97-%E8%B6%85%E9%81%A0%E8%B7%9D%E9%9B%A2%E5%98%85%E9%AC%BC%E9%AD%85%E6%95%88%E6%87%89%EF%BC%9F%E6%84%9B%E5%9B%A0/

[3] (未能盡錄) https://www.thestandnews.com/cosmos/%E5%8B%95%E7%89%A9%E5%82%B3%E5%BF%83-%E9%82%84%E6%98%AF%E6%AC%BA%E9%A8%99%E4%BA%BA%E5%BF%83/

https://www.thestandnews.com/cosmos/%E7%84%A1%E7%9F%A5%E5%AE%B3%E4%BA%BA%E5%AE%B3%E7%95%9C-%E7%9B%B8%E4%BF%A1%E5%8B%95%E7%89%A9%E5%82%B3%E5%BF%83%E9%9D%9E%E4%BD%86%E8%BF%B7%E4%BF%A1%E4%B8%94%E4%B8%8D%E9%81%93%E5%BE%B7/

https://www.thestandnews.com/cosmos/%E6%8B%86%E8%A7%A3%E5%8B%95%E7%89%A9%E5%82%B3%E5%BF%83/

[4] https://www.idomaths.com/zh-Hant/probability5.php

[5] 有關貝氏機率嘅online course (英文)

https://www.coursera.org/learn/bayesian-statistics

 

 

[文章開頭機率問題答案︰

1) 答案係1/3。兩個細路仔嘅性別組合有男男、男女、女男、女女,各組合機率同樣係1/4。由於已知其中一個係女仔,所以得番男女、女男、女女三個可能性。結論另一個細路都係女仔可能性係1/3(註:男女≠女男)

2) 答案係1/2。雖然同上題一樣知道其中一個細路係女仔,但由於見到個細路,如果假設幫手開門嘅細路係嗰對細路隨機50/50一位,咁可能性係男女*、女*男、女*女、女女*。*為開門者。所以另一個細路都係女仔可能性係1/2 。其實呢條題目入面「知道開門的是女孩」這呢個訊息同問題「另一個細路性別係乜」是冇關係o架!

PS︰其實呢兩條問題某程度上有一定「爭議性」,因為答案結論同前設(假設),點樣接收到「其中一個是女孩」呢個訊息有關。不過咁就正正講出前設、貝氏機率嘅重要性。

https://en.wikipedia.org/wiki/Boy_or_Girl_paradox

]

 

書面語版︰https://www.thestandnews.com/cosmos/%E8%B2%9D%E6%B0%8F%E6%A9%9F%E7%8E%87-%E5%81%BD%E7%A7%91%E5%AD%B8%E5%85%85%E6%96%A5%E7%A4%BE%E6%9C%83%E7%9A%84%E5%8E%9F%E5%9B%A0/

 

Advertisements

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s