首頁 / 航向月刊
航向月刊
大數據 時代的反思
期數:2017/12
作者:魏榮祈牧師
從天空白雲看見飛鷹圖騰,或神似耶穌的圖像,這是「神蹟」,抑或是我們太低估巧合所發生的機率?是美麗巧合,抑或是自欺欺人?其實,這可能都犯了心理學家所稱的「錯覺聯想」(apophenia),也就是因著先入為主的模式,所產生的一種「空想錯覺」(pareidolia)。
 
 
數字也會胡說八道
面對近年來大數據(big data)和資料探勘(data mining)的大為風行,試問:由複雜回歸演算法所得出的預測結果,其統計的顯著性、相關性、偏差和變異性,真的值得信賴嗎?
 
「數字確實會說話, 但更要當心的是, 它會胡說八道!資料探勘正流行,但你挖到的是金礦,還是垃圾? 」由英國皇家統計學會研究員羅伯‧ 麥斯修(Robert Matthews)所寫的《機率思考—大數據時代下,不犯錯的決斷武器》,內容取材自日常生活事物。作者以生動活潑的筆觸,揭開機率千變萬化的樣貌。期待能幫助讀者,藉由機率思考,在你我無法捉摸之際(to be or not to be),擁有決斷的勇氣與勝出的能力。
 
誠如作者在導論中所言:「對於機率、風險和不確定性的理解,需求從未像現在這般迫切。面對政治動盪、金融脫序,以及接踵而至的各種風險、威脅與災禍,我們都渴望正確性。可惜,正確性從來不曾存在。但儘管這是事實,我們也不應因此接受宿命論,或拒絕接受現實。」到底, 有什麼簡單的經驗法則或決策理論,可以幫助我們判斷,並做好決策,以降低風險?對信仰而言,機率的法則和我們有什麼相關性?這是本書的可看之處!
 
 
了解機率三大定律
作者提到要理解「機率」,第一定律是:不要管原始次數,要關注的是「相對頻率」(如惡名昭彰的百慕達三角洲,若從相對頻率來看,甚至擠不進全世界10大危險海洋區域)。
 
第二定律:看似「隨機」的事件,「不要自動假設它們為獨立事件」,否則很容易被誤導。作者以1912年鐵達尼號(Titanic)在大西洋撞上冰山的沉沒事件為例,早在該船難發生的14年前,就有一本小說精準地預言種種細節,甚至小說中的船名,就是「泰坦號」(SS Titan,意為「巨無霸」)。難道這本小說有預言能力?本書作者就破解了這個預言,他認為這純粹是巧合,因為在那些年間,國際間正好在流行打造巨無霸客輪。而一般小說在選材上,都受當時的時代背景所影響。所以,這本小說並不是獨立事件。
 
機率的第三定律:真正的隨機沒有規律或道理,也沒有模式可循。但這不表示,隨機絕不可能出現規律。在有限的規模下,仍有可能出現規律,誘導我們去追尋規則模式,例如彩球開獎出現的奇數連號。
 
 
謹慎推論因果關係
作者提醒我們,因果關係的判斷通常相當難捉摸。作者以2014年英國大曼徹斯特郡16歲少年自殺事件為例。當時這名資優生沉迷某款電玩,而被推論其自殺與該電玩有關。但如果與最近玩過該款遊戲,卻沒有自殺的青少年比較,幾乎可以確定,玩該款遊戲的正常青少年比率更高。
 
又比如紅肉,是否真的比較容易導致癌症、心血管疾病?還是與牛肉的成分、烹調與食用方式的差異比較有關?許多事件的因果關聯性,或許只是巧合,需要更深入研究樣本規模和潛在偏誤,才能找到令人信服的關聯證據。所以最好先考量相關性是否可靠,再下判斷,才不會被誤導。
 
 
貝氏定律讓證據說話
250年前有一個簡單又直覺的定理,曾長期受到爭議,但如今已逐漸成為「讓證據說話」的最佳模式。這位英國長老會牧師、業餘數學家湯瑪士.貝葉斯(Thomas Bayes,1702-1761),發明了貝氏定理:Pr(B/A)=Pr(A/B) x Pr(B)/ Pr(A)。即「對某事新的相信程度=過去的相信程度+新證據的份量。」
 
貝氏定理的最基本形式,顯示出事件A的發生機率,會對後續事件B的發生機率造成什麼影響。具體來說,在A事件已經發生的情況下,B事件的「條件或然率」為何?貝氏定理指出,對於某個聲明或理論的相信程度,應該隨著新證據的出現而改變。
 
 
更務實於教會建造
大數據存在於我們生活的每個層面中,我們每天都與它產生關聯。從商品促銷,到選舉預測等,不勝枚舉。這是一個讓證據說話、找出關聯性的時代。不只企業,包含各種組織都不斷地投入研究,試圖推論出因果關係,進而找出最佳的決策。
 
對信仰而言,我期待這是給眾教會的重要提醒:在沒有確切證據下,不要輕易地以感性或任意的推論,來自我陶醉。舉例而言,近年來不斷有國內外牧者宣稱,神要復興台灣教會,或要使台灣成為亞洲或華人福音的重要根據地,或關鍵門戶。若果真如此,台灣教會理當差派出更多宣教士才對,因為復興與宣教息息相關,但實際情況恐非如此。
 
讓新證據說話,即在提醒牧者們:要更多著眼於真理的教導與信徒生命更新的關聯性,並更加務實於教會的建造!