[“邪惡”嘅物理學] 點解唔打掃間房就咁亂?一切都係熵嘅錯?! 

(圖擷取自:《魔法少女小圓》動畫)

「無聊」開場白問題:「如果冇人打掃嘅話,經過時間嘅洗禮,間房/屋只會愈嚟愈污糟,愈嚟愈亂。點解會咁嘅呢?」

因為你懶,唔執屋清潔囉,咁都要問!……嗯,啱嘅,不過你有冇諗過,點解自然世界嘅演化,係會傾向愈嚟愈「亂」,而唔係掉番轉,變得愈嚟愈整齊、有秩序呢?其實歸根究底,哩啲全部都係「物理學嘅錯」,因為現實物理世界有熵(entropy)哩樣作怪#(笑)。

#一樣連魔法少女都搞唔掂嘅嘢,好似係。PS:《魔法少女小圓》係一套好有深度嘅「神作」動畫嚟


熵係乜嚟?(What is entropy?)

(credits: HMP Comics)

要了解點解熵咁「邪惡」,我哋要首先明白乜嘢係熵。「溫馨提示」:以下內容不適合未成年人仕閱讀,好似係(見上圖,笑)

熵,簡單概括講嘅話,係形容一個物理系統,佢包含嘅「資訊量」嘅一個參數,同著名物理學家波士文(Ludwig Boltzmann)開創嘅統計力學(statistical mechanics)有關。根據統計力學,宏觀世界嘅物質係由龐大數量嘅微觀粒子構成。我哋喺宏觀世界,大尺度下觀察、測量到嘅物理量、物理規律,只係表象,背後其實係將大量微觀粒子各自嘅運動或狀態,總合起嚟取平均或期望值,而得出嚟嘅表述。好似根據分子運動論(kinetic theory of gases),氣體嘅溫度,其實就係組成氣體堆微觀粒子,佢哋平均動能嘅描述。

而一個(宏觀)物理系統嘅熵值,就係同微觀狀態(microstates)數量,同啲微觀狀態嘅機率有關*。哩度微觀狀態,係指微觀粒子嘅位置、動量、位能等;而數量就係指喺同一宏觀狀態(macrostates),好似相同系統能量、體積、壓力下,有幾多相對應嘅微觀狀態組合可能性。

*哩度講嘅係熵嘅統計力學定義。而熵嘅各種經典熱力學(classical thermodynamics)定義,雖然睇落唔同,但其實一樣可以由統計力學定義出發,根據各種系統情況,用對應嘅微觀狀態概率密度函數推導出嚟。


熵=混亂程度?常見嘅坊間誤解(Entropy = disorder? The common misconception of entropy)

一般坊間科普,甚至係某啲教材,好多時都會將熵同混亂程度,直接劃上等號。好似一個系統愈混亂,佢嘅熵值就愈高。不過哩個簡單嘅詮釋又啱唔啱呢?

事實上,哩個詮釋其實係錯㗎!正確嚟講,熵真正描述同量化嘅,係我哋表述一個(宏觀)物理系統時,忽略咗嘅微觀世界資訊量,而唔係混亂程度。而且混亂、秩序,本身就係一個好主觀概念嚟,係唔可以客觀量化嘅。就好似和理非遊行示威,有人會覺得有秩序,但某啲人同某強國就覺得係「混亂邪惡」咁。又好似一杯水同一堆碎冰,一般人都會認為一堆碎冰比較混亂。不過事實上,碎冰嘅熵值係比較細先啱。


熵=忽略咗嘅微觀世界資訊量(entropy is a measure of ignored information)

(credits: smbc)

想真正明白熵係乜,同點解有人會將佢同「混亂、秩序」扯上關係,我哋可以用以下嘅比喻:

試諗吓擲N粒骰仔,或喺圍棋棋盤上,隨機擺N粒棋子嘅情況。而家忽略擲骰仔/擺棋子嘅過程,假設啲骰仔/棋子係全部一模一樣,只係睇最後骰仔數字組合(唔理次序),或棋子整體分佈形狀。「整齊」、有規律嘅棋子排列分佈或數字組合,比起隨機、冇規律嘅組合/排列,可能性數量相對係少好多。好似全部數字一樣嘅組合,例如111111咁,我哋可以確定每粒骰仔對應嘅數字必然係1,只有一種可能性;相反冇規律嘅組合,好似134265咁,每粒骰仔對應嘅就會係1-6任何一個數字,可能性係6!=720種。

如果啲骰仔係公平,每個數字擲到嘅機率一樣,或每個棋子位置擺放機率一樣,咁每個可能性嘅資訊量亦會係一樣。再比較番有規律同冇規律嘅整體組合/排列,如果只睇整體組合/排列,我哋可以睇到結果係冇規律時,忽略嘅資訊量係最大,亦即熵值最大。哩個就係點解坊間好多解釋,會錯誤直接將熵簡化理解成混亂程度。

有興趣想了解更多嘅,可以睇下面ZAP Physics《Entropy is NOT About Disorder》嘅英文短片:


「邪惡」嘅熱力學第二定律(The second law of thermodynamics)

(credits: xkcd #2315)

熵哩個詞,之所以為人「熟識」嘅原因,相信就係熱力學第二定律(the second law of thermodynamics)。哩條定律表述嘅係熱力學過程嘅不可逆性。一個封閉嘅孤立系统,必定無何避免,會自發咁向住熱力學平衡(thermal equilibrium)方向演化,即熵值必然隨時間增加,直至去到最大值為止。熱力學第二定律,係物理學少數有時間方向性嘅定律,所以有人會將熵值同時間掛勾,就好似上年科幻電影《天能》嘅「逆熵」設定出現咁。

熱力學第二定律背後嘅原理,係可以從統計力學,由機率去理解。熵值不斷增大嘅真正含意,喺自然界會自發咁向住分布可能性,即機率更大嘅方向發展。用番上一節骰仔數字組合/棋子分佈嘅比喻,熵值愈大嘅宏觀整體結果,佢嘅骰仔組合/棋子排列可能性就愈多,出現嘅機率就愈大;相反熵值愈細,出現嘅機率就愈少。如果假設個系統,係會不斷隨機試勻所有可能性組合,咁好自然熵值最大嘅結果係最有可能出現。

喺自然界,絕大部分情況下,「混亂、冇序」嘅微觀物理態組合,熵值通常愈大。所以坊間先會出現熱力學第二定律,等同自然世界演化偏向混亂、冇序,宇宙必然趨向「混亂邪惡」嘅誤解。事實上,即使係封閉嘅孤立系统,喺某啲特殊情況或物理條件下,有序嘅微觀物理態組合,佢嘅熵值係可以更大;系統嘅演化係可以由冇序 -> 有序。試諗吓如果用唔公平,擲到1比起其他數字,機率高很多嘅骰仔,番到之前骰子數字組合嘅比喻時,得出嘅結論會點?詳細嘅「違反秩序」例子,可以睇以下Sixty Symbols嘅短片(英文)


總結:熵=/=混亂程度

雖然小弟拙文開頭,話世界愈嚟愈亂,係「物理學同熵嘅錯」,不過哩個講法嚴格上係錯㗎,唔好再將你間房/屋亂,賴落物理學度啦!今次講到哩度,最後送首《魔法少女小圓》主題曲嘅二次創作粵語版作結,下次有機會再講。


後記/補充說明:

(一)物理學嘅熵,同資訊/電腦科學嘅資訊熵,又叫夏農熵(Shannon entropy),係息息相關。前者可以理解為後者嘅應用例子。

(二)熵公式定義為

 kB:波士文常數

pi:微觀物理態i,佢對應嘅機率


延伸閱讀:

[1] 《The Misunderstood Nature of Entropy》by PBS Space Time (英文字幕)

[2] 《Second Law of Thermodynamics 》by Sixty Symbols (英文字幕)

[3]《時間可以倒流嗎?甚麼是熵增定律?電影《天能》中的科學假設》by 媽咪說(蝗語慎入)

[4] 《柴知道》科普:甚麼是热力学第二定律?by 《柴知道》(蝗語慎入)

[5] 《觀賞”天能”所需要了解的物理學概念”熵”》by mouchou2

[6]《Is ENTROPY Really a “Measure of Disorder”? Physics of Entropy EXPLAINED and MADE EASY》by Parth G (英文)


中文「書面語」版:
https://medium.com/@godfrey.leung.cosmo/%E9%82%AA%E6%83%A1-%E7%9A%84%E7%89%A9%E7%90%86%E5%AD%B8-%E6%88%BF%E9%96%93%E4%B8%8D%E6%89%93%E6%8E%83%E6%84%88%E4%BE%86%E6%84%88%E4%BA%82-%E4%B8%80%E5%88%87%E7%9C%9F%E7%9A%84%E9%83%BD%E6%98%AF%E7%86%B5%E7%9A%84%E9%8C%AF%E5%97%8E-69802f5a375c

[上編]「哩個實驗否證/驗證咗個理論」,科學真係咁簡單?(Part I: This experiment “disproves/proves” the theory. Is science really that simple and straightforward?)

科學,可以話係人類文明最重要嘅基石之一。人類文明最近幾百年發展得咁快、咁蓬勃,好大程度係因為文藝復興同工業革命,由人類開始重視同發展科學開始。隨著近年量子資訊科技(quantum information)、人工智能AI嘅興起,世界(又?)開始流行要求著重STEM教育,即科學(Science)、科技(Technology)、工程(Engineering)同數學(Mathematics)嘅聲音。某某自稱「國際都會」,向來以金錢掛帥,急功近利,唔重視科研嘅金融中心城市,個政府都話要「玩埋一份」(?)。不過事實上,究竟其實又有幾多人真係(真正)了解、明白乜嘢(先)係科學*呢?

*哩度科學係指自然科學/科學方法,唔包括數學或邏輯嗰類形式科學(formal science)


謬誤1):實驗=科學嘅全部,做實驗就可以得出答案(Stereotype I: Science is “just” about doing experiments)

(credits: xkcd #669, https://www.explainxkcd.com/wiki/index.php/669:_Experiment)

關於「科學係乜」哩個問題,之前小弟已經寫過篇拙文講過吓 [1]。而今次就想講吓實驗(experiments)哩個題目。無容置疑,實驗係科學非常重要嘅其中一環。不過,咁又代唔代表實驗=科學,有做實驗就係科學,實驗就係科學嘅全部呢?

「實驗=科學嘅全部」/「有做實驗就係科學」,哩個都算係幾常見嘅謬誤,尤其係喺填鴨式教育下,將科學過度簡化去理解嘅結果。事實上,科學哩門建立知識嘅系統/方法,由問題->假說->實驗->結論嘅過程,係複雜同迂迴漫長好多,唔係單純肯花時間不停「亂」做實驗,就可以輕易得出答案或結論。


設計實驗係一門學問

首先,點樣設計實驗本身就已經係一門可以「獨立成科」嘅學問,尤其喺係現今前沿科研嘅世界。就算係一個睇落「直觀、簡單」嘅問題,好似「光喺真空行幾快?」,唔通真係可以攞支電筒加部電話/計時器,就咁直接走去測?

真正落手做實驗之前,其實根本有一大堆技術上嘅問題要處理,好似點搵/整個真空空間出嚟咁。就算撇除唔講技術問題,都仲要做一大堆假設(assumptions),確立清楚定義,同儘可能篩選/去除出可能會影響實驗結果嘅因素,再從中設計出實驗可變參數。而且喺唔同理論框架下,需要做嘅假設係可以完全唔同:例如想將兩個地點嘅時鐘同步,喺相對論下,需要考慮同做嘅修正已經同牛頓力學好唔同;另外「真空」定義係咩?以太存唔存在?哩啲問題全部需要事先考慮同釐清。

PS:事實上,冇人真係測過(單程嘅)光速,好似係。請睇下面Veritasium條片(有殘體字幕)


理論基礎係「指南針」

(Credits: Theresa McCracken)

“Experiment without theory is blind, theory without experiment is empty.”

事實上,實驗同理論係雙輔相成,兩者缺一不可。做(科學)實驗同搞理論或辯論一樣,係需要先搞清楚定義同確定前設。而搞清楚同確保哩啲定義/前設正確,係需要一定嘅理論背景基礎。冇理論基礎同忽略考慮前設啱唔啱,就咁走去設計同做實驗,同摸黑探路撞彩冇分別,就好似唔識煮嘢食,但走去開餐廳咁on9。

另外時間同資源係有限嘅,你冇可能試勻晒所有可能影響結果嘅變數,更何況係某啲千年一遇或需長時間觀察嘅實驗(就算你有愛迪生咁嘅堅持都冇可能)。如果係大型嘅科研課題,需要嘅專業知識由工程學,設計專門實驗器材,到數據分析甚至係搞IT/電腦軟件,會分好多唔同部門小組,動員嘅人員隨時係上百甚至千為單位,就好似起大型基建咁。要動員咁多人手同洗咁多錢,但冇計劃咁做,甚至冇考慮背後風險,咁同某強國/國際都會走去亂起大橋、人工島嗰啲大白象工程有咩分別?

因此實驗並唔係科學嘅全部,理論基礎同樣重要。


最後送番首近期好hit嘅「情歌」《玻璃心》,希望大家睇小弟拙文時,唔好咁玻璃心,對號入座,好似係。今次講住咁多,下編再講實驗嘅另一常見誤解—p值。


延伸閱讀:

[1] 《究竟乜嘢係科學?》


更新白話文版:
https://medium.com/@godfrey.leung.cosmo/%E4%B8%8A-%E9%80%99%E5%AF%A6%E9%A9%97%E5%90%A6%E8%AD%89-%E9%A9%97%E8%AD%89%E4%BA%86%E8%A9%B2%E7%90%86%E8%AB%96-%E7%A7%91%E5%AD%B8%E7%9C%9F%E7%9A%84%E9%80%99%E9%BA%BC%E7%B0%A1%E5%96%AE-b5862adbbe9d

[“old news” is so exciting] 淺談最近同muon有關嘅粒子物理學新「發現(s)」 (Recent muon-related particle physics “discoveries” explained)

(credits: Chris Madden)

好耐冇出文啦,唔知哩期最受大家關注嘅新聞係乜呢?台灣嘅「鮭魚之亂」?單春表態撐新疆棉?長賜號擱淺?叫人白票=犯法?定英國事頭婆老公菲臘親王逝世?除咗嗰堆之外,大家又有冇留意科學方面嘅新聞呢?喺近一個月,理論/粒子物理學又再次成為咗科學新聞嘅頭條啦!而當中嘅主角,就係muon(渺子)啦!唔知大家對相關嘅新聞又知幾多呢?今次等小弟為大家做個「(非?)專業」講解啦!

PS:個人覺得粒子物理學入面,好多粒子嘅(坊間)中文譯名太膠,所以小弟會用番英文。


muon係乜嚟?(What is a muon?)

(credits: Jorge Cham [4]) 

開始之前,我哋首先需要認識一下muon係乜嚟。muon係一種fermion(費米子),係lepton(輕子)嘅一種,同一般我哋認識嘅電子非常相似。佢幾乎大部份嘅物理特性,包括電荷、自旋(spin),都同電子一樣,同樣有相對應嘅反粒子(叫anti-muon),分別只係質量重好多,本身唔穩定,會通過弱作用力,衰變成電子而已。狹義相對論(special relativity)嘅時間膨脹(time dilation)現象,早期其中一個實驗觀察證據,就係同觀察muon衰變有關。簡單嚟講,你可以將muon睇成係「電子」嘅「肥版表兄妹」。而亦因為muon夠「肥」,所以理論上佢更容易受未知嘅物理影響,更容易同質量極重嘅未知粒子發生(間接)相互作用(記得E=mc2嗎?)。

由於muon帶有量子自旋嘅物理特性(註:同電荷一樣,係固有量子特性嚟,唔係真係指粒粒子「自轉」𡁵),佢自己帶固有嘅角動量。而因為muon同時間帶有電荷,所以同經典電磁學嘅電流磁效應情況類似,muon會隨之而自帶磁性/有自己嘅磁場,哩個就係muon嘅磁矩(magnetic moment)。而今次嗰單最多人講,同muon有關嘅新聞,就係同測量muon嘅磁矩有關。


LHCb最近同muon有關嘅初步「發現」(Recent “discovery” at LHCb)

The LHCb experiment at CERN (Image: CERN)

好啦,簡單介紹完muon後,係時間入正題。不過講之前,「戴番個頭盔」先,跟住落嚟講嘅哩兩單新聞,嚴格上未可以叫「發現」,仲未達理論/粒子物理學真.發現所需嘅標準。

首先,最近第一單同muon有關嘅粒子物理學「新發現」,係上月底由位處CERN嘅大型強子對撞機(Large Hadron Collider, LHC),入面其中一個實驗LHCb公佈。 個實驗係測量由超重夸克,bottom quarks(又叫”beauty” quarks)組成嘅b-meson^嘅超罕有衰變過程。

^中文叫介子(「戒指」sosad)

實驗團隊發現有初步「證據」顯示,衰變成正負電子對嘅比例,高於衰變正負muons對[1]。哩個「發現」違反咗標準模型(Standard Model)lepton flavour universality,即撇除質量外,所有Standard Model唔同flavour嘅帶電荷lepton特性同gauge boson coupling$應該一樣先啱。

$ 哩度唔計希格斯場(Higgs field)嘅Yukawa coupling,而哩個Yukawa coupling亦即係lepton嘅質量嚟。因為Higgs boson唔係gauge boson嚟,所以一般嚟講,粒子/理論物理學係唔會當Higgs field相互作用為「第5種基本力」,尤其基本粒子同Higgs field嘅相互作用,背後原理係同自發性對稱破缺(spontaneous symmetry breaking )有關嘅希格斯機制。喺高能量時,電磁力同弱作用力會結合番做同一種力,即電弱相互作用,electroweak gauge symmetry會回復返,Higgs field嘅真空數值,同其相關嘅coupling會全部變0,即相互作用同粒子質量變0。


Fermi Lab muon g-2實驗結果公佈 (Recent results of the Fermi Lab g-2 experiments)

(credits: Jorge Cham [4] )

另一單新聞就係好多人講,上星期由美國費米國家加速器實驗室(Fermi National Acceleration Laboratory),公佈嘅muon g-2實驗結果。

之前提到muon自己帶有磁性,即磁矩。如果將muon放喺一個外磁場入面,佢嘅磁矩會同外磁場有相互作用,繼而衍生出微小嘅擾動,情況就好似轉陀螺咁。Fermi Lab實驗做嘅,就係透過精確測量哩啲微小擾動,去計算muon嘅固有磁性。準確啲講,係測量相關嘅g-factor,即磁矩嘅相關dimensionless數值,而且係測到小數點後好多個位。

點解要測到咁精確?因為哩啲小數點後好多個位嘅細微數值修正,其實係源自背後粒子理論模型嘅量子修正(quantum corrections)。而哩啲量子修正,相對應嘅物理過程,係可以涉及一堆罕有同超高能量嘅粒子,甚至過程間(註:指測量時,initial同final state中間嘅直接觀察唔到嘅過程。有興趣嘅,可以去睇吓乜嘢係量子場論QFT同loop Feynman diagrams)「違反」一堆守恆定律,包括粒子數同能量守恆。

量子場論世界下嘅「真空」
(Creator:Chandra X-ray Observatory Center
Credit:NASA/CXC/FIT/E.Perlman et al, Illustration: NASA/CXC/M.Weiss)

(不準確)比喻嚟講,喺高能粒子嘅量子場論世界,我哋嘅宇宙係好似「一煲由唔同材料煲成嘅湯」,空間充斥著一堆又一堆不停起伏擾動嘅量子場,包括真空狀態時。而哩「煲湯」,係會同muon有相互作用,修正muon嘅磁矩數值。哩個修正,係會根據「煲湯」嘅組成成份(量子場)而唔同。所以準確咁測量哩啲細微數值修正,係可以用嚟驗證Standard Model或粒子理論模型。

而上星期,Fermi Lab就公佈「發現」這個g-factor測量值同Standard Model嘅理論值有明顯分別,顯示有機會有未知嘅新粒子/基本力*影響𡁵muon。睇嚟屹立不倒多年嘅Standard Model,終於要迎嚟被推翻嘅一日?

* 喺標準模型同量子場論,力同粒子某程度上係「同一樣嘢」嚟,而基本力係由gauge boson傳遞


後記

(戴番頭盔先,一早未證實,都唔好開心得太早住)

Fermi Lab嗰單可以話係「old news is so exciting」,因為muon g-2值實驗同理論嘅差異,其實唔算「新發現」,早喺廿年前布魯克海文國家實驗室(Brookhaven National Lab)已經做過類似實驗,搵到類似嘅初步「證據」。今次Fermi Lab實驗,就係進一步驗證究竟哩個「發現」係真定假。所以哩個muon g-2差異,其實喺理論/粒子物理學界,可以話係「舊聞」喔!


另喺Fermi Lab公佈結果嘅同一日,有一組比較細,叫BMW嘅理論團隊,喺Nature發表一篇研究論文。佢哋研究喺完全唔參考量子色動力學實驗數值,單純透過格點量子色動力學(lattice quantum chromodynamics, lattice QCD),用超級電腦計算標準模型入面所有同QCD有關嘅費曼圖貢獻,發現標準模型嘅muon g-2理論數值,可能同一般粒子物理界其他團隊得出嘅值有出入,實驗數值仍然有機會同標準模型吻合 [2]。

最後正如小弟之前講,哩兩單「發現」,暫時都只係屬hints級別,統計數顯著性分別為3.1σ同4.2σ,仲未達理論物理真·發現級別,即純粹屬random chance嘅統計誤差要少於3,500,000份之一


最後送首改編自單春歌曲嘅《棉棉》畀大家。

今次講到哩度,下次再講。


延伸閱讀:

[1] 《Intriguing new result from the LHCb experiment at CERN》CERN News

[2] 《Leading hadronic contribution to the muon magnetic moment from lattice QCD》

[3] 《第242話:新的物理學要出現了嗎?(Muon g-2實驗結果發佈》by 超中二物理宅

[4] 《The Muon g–2 Anomaly Explained》by Jorge Cham,即畫PhD Comic條友(英文漫畫圖解)

[5] 《‘Last Hope’ Experiment Finds Evidence for Unknown Particles》by Quanta Magazine

[6] 《NEWS: What’s up with Muons? – Sixty Symbols》 by Sixty Symbols (英文高質片)

[7] 《Why the Muon g-2 Results Are So Exciting!》by PBS Space Time (英文高質「非入門級」科普片)

[8] 《This result could change physics forever》by Physics Girl 

[無聊隨筆] [非物理系列] 《閱讀、文字嘅價值》

網絡圖片

最近坊間忽然興起一隻吹水(或9up?),主打純粹用「把聲」交流嘅social media平台,叫Clubhouse嘅app。撇除app嘅背景、私隱隱憂[1]、淨係侵iOS iphone用家玩等嘅問題,坊間好似一面倒好評如潮,有人甚至認為Clubhouse呢種「新模式」(其實都唔算新,好似係),令討論或意見方享「門檻降低」,「方便快捷」又「慳咗時間」,甚至令討論「更有意思」*。或者小弟「思想守舊」,見到呢啲睇法,小弟只係諗起近年啲人但求方便,鍾意用語音輸入、甚至語音留言嘅潮流趨勢,尤其嗰啲「每秒幾廿萬上落」,冇乜耐性嘅XX人。

*註:這裡指嘅係將Clubhouse睇成「高人一等」,超然於網上(文字)討論區。


說話交流更方便、更優越?

用說話交流,比起「冷冰冰」嘅文字,或者無礙係多咗一份「人性」、親切感,但說話真係比起文字優越,更能夠帶動思考同討論?純個人意見,現在用家睇到嘅,只係新興社交平台啱啱開始,「密月期」時嘅景況,就好似FB或YouTube啱啱開始時,那種自由、百花齊放嘅感覺。不過當用家或KOL增多,啲人要爭奪話語權、發言時間、聽眾關注嘅時候,這百花齊放、和平互相尊重嘅交流情況就會消失,變番留於圍爐取暖嘅交流,甚至可能更差。你試諗吓,2揀1,你會寧願坐低晒時間聽5毛或阿叻9up,定睇一篇佢哋寫嘅9up文?而事實上除非你是主持人,或本身反應快,能言善辯,說話有感染力,唔係嘅話,喺一班陌生人入面,爭取發言機會同分享意見嘅難度,恐怕遠比分享一段文字更大[2]。最後剩番低主導平台嘅,隨時更大可能係「老高」嗰種只係講嘢好聽,但內容貧乏或冇深度,甚至錯漏百出嘅人。

個人認為,最能啟發思考,準確表達意見同思想嘅,從來都係文字。閱讀同文字,本身有佢哋無可被取締嘅價值(除非人類發展出「讀心術」,可以直接讀取其他人腦入面諗乜。不過真係咁話,你應該會冇晒私隱同想死)。無錯,文字作為語言嘅其中一種載體,或許好「冷冰冰」,唔可以直接刺激感官,人與人交流間好似多咗層「隔膜」。不過正正就係呢層「隔膜」、冇「即時性」,先可以令作者有時間同空間,可以細心諗清楚,自己想表達嘅意思同點樣表達;令讀者閱讀時,更容易摒除感官感受、情感所導致嘅誤解或錯判;同時間亦更容易刺激大腦思考,亦可以反覆閱讀,去深入了解及甚至咀嚼作者想表達嘅意思。


事實上雖然今時今日,人類大腦嘅整體運算能力,仍然強過電腦及人工智能好多,但如果講感官溝通嘅交流能力,人類其實連廿年前56k互聯網都不如,好似係[3]。說話交流嘅好處,更多係情感交流層面上。說話交流所謂嘅「方便」,其實只係「表面上嘅方便」,「方便咗」嘅好多時只係講嗰個(其實都未必。如果你有花時間預先整理、諗你想講或討論嘅內容,花嘅時間隨時仲多,情況就好似演講或辯論),但換嚟嘅聆聽者嘅時間,甚至犧牲咗內容同準確性。同一段說話,睇文字只需要幾秒鐘,但聽人講隨時需要幾十秒甚至更長,更加唔好講好多時,啲人講嘢1999,完全冇經過思考就發言。


最後,送首《低科技之歌》畀大家,希望各位喺呢個現代生活節奏急促,人人「患上」社交網絡焦慮症嘅世界,至少花啲時間慢同靜落嚟,欣賞一下閱讀文字嘅樂趣(好似睇小弟拙文lol)。

利申:冇玩過Clubhouse,但應該唔會有興趣玩


後記:見到某些(政治)KOL,只係因為透過平台觀察或參與咗久違且難得,同某國人相對比較「理性、真誠」嘅政見交流同分享,就自我感覺良好,甚至幻想或者呢個先係某國主流大眾嘅真面目,幻想藉機會「感化」某國,不知點解小弟諗番起過去幾十年某國同某城市嘅「民主運動」……


延伸閱讀:

[1] https://m.facebook.com/story.php?story_fbid=4376082699087403&id=100000571470160

[2]【Clubhouse 的階級強化】

[3] 《Human speech may have a universal transmission rate: 39 bits per second》

[4] 《Clubhouse成了社交網絡焦慮下的情緒出口?》

根據AI、大數據(?)沖咖啡?淺談乜嘢先係真·數據科學(What is data science?)

(Credits: 《Dilbert》by Scott Adams)

近年,尤其自從幾年前DeepMind研發出「神之一手」,能夠捉圍棋打敗所有職業棋士嘅AlphaGo後,人工智能(artificial intelligence,AI)機械學習(machine learning)、數據科學(data science)、大數據(big data)哩啲就成為咗潮流用語,差唔多所有行業都聽到嘅buzzword。情況就好似10幾年前嘅科網熱潮;或者原子彈冷戰年代,乜嘢都加「原子」兩隻字,又或者而家唔少嘢都加「量子」喺前面咁。

不過事實上,入面有幾多先係真材實料,有幾多其實只係9up吹水呢?真正嘅數據科學、大數據又係指𡁵乜呢?


AI大數據沖咖啡?(AI & Big Data coffee?)

(AI大數據咖啡Preface Coffee,圖擷取自[1])

就好似最近香港有單新聞講有間coffee shop,根據當日嘅時事新聞、天氣等,分析哩堆「大數據」去調節口味,沖出最適合嗰日嘅咖啡[1]。

小弟未有幸幫襯過嗰間coffee shop,唔敢貿貿然妄下判斷,就話佢哋係「咖啡機兄弟」哩類騙局啲friends。不過一杯咖啡沖得好唔好飲,啱唔啱客人心水,好明顯最重要、最關鍵嘅係師傅嘅手勢同咖啡豆嘅質素。當時附近環境嘅溫度、當日新聞頭條等等哩啲數據,好多其實唔太關事,就算有影響,都只會係次要同非常細微。

而且每個人嘅喜好準則唔同,好似有人鍾意天氣凍/熱啲,有人鍾意苦/酸啲;政治上又有黃絲/藍絲、「中立x/中間超人」,唔通喺客人買咖啡前,要做一份詳細個人問卷先?另外「開心」哩樣嘢,本身就好難可以好客觀、準確咁定義到。就好似有人見到「私煙BB」染肺炎死咗會好開心,但有人(?)就會惋惜、悼念。現實係唔存在一套適用於所有人嘅單一標準,去定義一個所謂「開心指數」。

(網上圖片)

如其花錢同時間去研發一個複雜,聲稱用到自然語言處理(Natural Language Processing)*嘅程式,去分析一堆次要或唔太關事嘅數據,其實去培訓師傅手藝、改善工作同coffee shop環境、選取優質嘅原料同鑽研唔同配方仲實際。就算真係用人工智能或大數據嘅話,都應該用嚟分析員工、咖啡豆原材料等,優先同實際過乜嘢用時事新聞、天氣等數據去分析所謂「開心指數」。所以個人認為哩個「AI大數據沖咖啡」多數只係玩綽頭,多過真係實際改善到咖啡品質或口味,增加到營業額。

*自然語言處理簡單講就係將人類語言翻譯成電腦「睇得明」嘅嘢,指用電腦將語言變成有相關意思嘅符號同關係,再根據目的作處理同分析。詳細嘅講解有機會再講。


數據科學同數據分析嘅分別(Difference between data scientists and data analysts

好啦,講咗咁耐,咁究竟乜嘢先算係數據科學或大數據呢?好老實講,始終數據科學/大數據唔係數學或理論物理學範疇,佢哋其實係冇一套統一標準定義。不過小弟都可以用自己現時做𡁵數據科學家(data scientist)嘅經驗,講吓數據科學業界,通常係點界定乜嘢係數據科學。

固名思義,數據科學要做嘅當然係分析數據(data)啦!當中數據可以包括任何範疇,基本上所有你諗得到嘅嘢都可以係數據,好似你講嘅一句說話、去過邊度、上過咩網站等等,尤其係而家哩個digital era。

不過除左分析數據之外,更加重要嘅深入理解同洞悉數據背後嘅意義,建構數學或機械學習模型,去嘗試模擬同作出準確客觀嘅預測,去幫助人類執行,甚至自動化一啲決定(decision making process)。就好似透過你上網嘅行為,去推測你鍾意嘅嘢(甚至係政治取態或價值觀,如強國)。所以識得寫程式,甚至係軟件可以話係必須,另了解整個機械學習運作流程,包括數據點得番嚟、數據清洗(data cleaning/cleansing)、點安全同有效儲存數據等等,都好重要。單純淨係用Power BI、Tableau,甚至Excel等坊間軟件,去分析數據嘅,一般只會叫數據分析師(data analyst)#。

#雖然廣義上嚟講,就咁用Excel執行曲線擬合(curve fitting),都係迴歸分析(regression analysis),係機械學習嘅一種。


數據科學嘅重點係科學(Data science should be “scientific”)

(credits: xkcd #925, https://www.explainxkcd.com/wiki/index.php/925:_Cell_Phones

除左上面講嘅之外,作為(前)物理學家,個人覺得「真.數據科學」要叫得「科學」,當然仲需要包含自然科學嘅精神喺入面。即係要(至少某種程度上)理解唔同機械學習演算法(algorithms)同模型背後嘅邏輯、合理性,甚至係唔同數據、現象背後嘅因果關係,而唔係單純嘅統計學數據分析,不求甚解咁追求最準確嘅預測,尤其哩個世界咁多數據,統計學上相關嘅巧合根本多到數都數唔晒^[2]。

^記住相關不蘊涵因果,相關不蘊涵因果,相關不蘊涵因果(correlation does not imply causation)。好重要所以要講三次,好似係

另一方面,communication、數據可視化(data visualisation)都係重要嘅一環。 數據科學家好多時仲要明白同理解哩啲模型所做出嘅決定(至少某種程度上,例如知道邊啲數據影響決定較大),然後透過簡單易明嘅圖像同語言,去講解番畀其他人聽,而唔係當機械學習模型係black-box咁。


今次講到哩度,下次有機會再講多啲人工智能、數據科學嘅嘢。最後,喺2020年嘅最後一日,等小弟送首由AI寫嘅聖誕歌[3],為哩個咁特別嘅一年劃上句號,祝大家假期愉快同新年快樂(雖然聖誕已經過咗lol)!

延伸閱讀:

[1] 《AI大數據沖咖啡 分析時事調節口味》,刊於信報財經新聞「StartupBeat創科鬥室

[2] 偽相關嘅數據例子 https://www.tylervigen.com/spurious-correlations

[3] 《It’s no Christmas No 1, but AI-generated song brings festive cheer to researchers》

https://www.theguardian.com/technology/2016/nov/29/its-no-christmas-no-1-but-ai-generated-song-brings-festive-cheer-to-researchers