0

1
0

文字

分享

0
1
0

用哪種統計方法已成信仰?「貝葉斯統計」與「頻率論」差在哪?——《重力的幽靈》

左岸文化_96
・2019/05/08 ・2091字 ・閱讀時間約 4 分鐘 ・SR值 611 ・十年級

-----廣告,請繼續往下閱讀-----

編按:在前沿天文學中,所有觀測的結果都會是數字,而所有的數字解讀都需倚仗統計學。《重力的幽靈》第五章探討了統計檢測的隱藏歷史。

在物理學中,是要使用貝葉斯統計 (Bayesian Methods) 還是頻率論 (Frequentist probability) ,長期以來有著爭論。

哪邊才是對的呢?圖/pxhere

兩者究竟差在哪?該選哪邊站?

事實上,這種爭論是如此長期地存在,並存在著如此熱情,使雙方有時會開玩笑地把他們喜好的偏好當成是統計的「信仰」。有幾個原因值得讓我們看一下這個信仰。

首先,檢視信仰之間的爭論是一個方法,得以顯示出統計數據的解釋總是主觀的,無論它看起來是如何的客觀。

其二,如我將在本章所論證的,貝葉斯方法可以用來正當化涉及弱宣稱 (weakclaim) 的發表策略。

-----廣告,請繼續往下閱讀-----

這兩個統計信仰之間關鍵的區別似乎是在於:

貝葉斯統計相信,所有基於統計學聲稱核心的不可能性敘述,必須考慮到你已經相信的世界,也就是聲稱的「先驗概率」(priorprobability),是真實的。

所有基於統計學聲稱核心的不可能性敘述,必須考慮到你已經相信的世界。圖/pixabay

頻率論則認為先驗概率過於主觀,不能出現在統計計算中;那樣只是產生了一個數字,而這個數字只反應了你所計算的可能性為何,並非計算可信與否。

很明顯地,在貝葉斯統計和頻率論對不可能性的評估中,先驗可信度扮演了一定的角色。如果頻率論正在尋找一個恆星,而計算暗示望遠鏡發現了天空中有頭噴火的巨龍,他們也不大可能進行舉報。

在一封電子郵件中,我的受訪者是一位堅定的貝葉斯主義者,關於尋找重力波,他是這樣看的:

-----廣告,請繼續往下閱讀-----

我覺得首次偵測的評斷標準多半是社會學的。要說服人,需要的是證據與團隊信譽的水準,我們看到的東西完全超出他們的經驗(重力源),並非全是他們所經驗過的東西(偵測器雜訊、飛機等等)。這個水準主要取決於我們希望說服的人所持的態度,以及他們對於將數據解釋為重力波的先驗傾向 (priorpredisposition) 。一旦我們做到了這一點,重力波就會很神奇地進入他們的經驗之中。一切都變得更容易,我們就可以自由自在地,像個正常的天體物理學家。(即,瘋狂臆測並亂搞,而不會受到責備!)

先驗預期以更為不起眼的方式,扮演著它的角色。例如,在相隔遙遠的兩個偵測器上偵測到的信號有時間巧合,而背景中僅有極為少數的時間巧合,這樣的聲稱有賴於重力波的先驗模型,也就是重力波是來自於一個侷限的天區,並且是以光速傳遞。我們知道在這樣的速度下,相隔兩千英里的兩個偵測器之間的「時間巧合」,發出兩個信號的時間間隔不能超過 1/100 秒。

這意味著,如果試圖找出可能只由雜訊所引起時間巧合的背景信號,可以忽略所有時間間隔超過 1/100 秒的事件——那些並非「時間巧合」。

取決於光速?還是音速?

音速?還是光速?圖/pxhere

如果重力波是以音速傳遞,就必須要考慮包含兩個事件的間隔是三個小時(或更短)的「時間巧合」。而人們只好將兩個產生作用相隔三個小時以上的事件,當成背景並予以排除。就我們所知,在這種情況下是不可能進行重力波探測的。

然而,卻也從來沒有實驗或觀測「證明」,重力波是以光速傳播——而它卻正是目前章節中所描述的科學重點的一部分。

更具體地說,相同的迴圈也適用於所有試圖憑藉著模板的偵測,像在連續波與隨機背景的情況中,甚至是有賴於發射源的粗糙模型。頻率論中的等效先驗模型,也就是韋伯和羅馬集團的陽性宣稱受到批評的核心。

-----廣告,請繼續往下閱讀-----

貝葉斯主義者只不過是說,在完成計算之前,所有的這些先驗預期應該是計算的一個明確部分,而且應該透過一個數字來表示。頻率論傾向「在事件發生後」否認不太可能出現的結果。在大多數的情況下,頻率論者和貝葉斯主義者會在計算結束時得到相同的結論,但並不總是如此。但這個「不總是」可能會是重要的。在這個故事中的確十分重要。

一場關於「信仰」的戰爭

信仰的戰爭仍在繼續,因為貝葉斯主義者相信,頻率論丟棄或歪曲有價值的信息並(或)掩飾其運用,或者將其作為事後的決策機制。

另一方面,頻率論者指出了一個事實,要正確地將一個數字賦予某些事的「先驗機率」,是非常困難的;將先驗資訊給予數字的形式,是試圖將「主觀」的猜測偽裝成「客觀」的資訊。

貝葉斯主義者說,這也許是個猜測,但至少每個人都可以看到猜的是什麼,如果有人想要,他可以批評,也可以提出自己的猜測。貝葉斯主義者說,每個人都同意奇蹟(意想不到的效應)需要額外的證據,如果要證明的話,他們的做法是讓這項要求成為明確程序的一部分,而頻率論者只是頷首微笑同意,有些東西真是令人難以置信,然後默默接受。

本文為《重力的幽靈:關於實驗室、觀測,以及統計數據在21世紀的科學探險》推薦序,2018 年 10 月,左岸文化出版。

-----廣告,請繼續往下閱讀-----
-----廣告,請繼續往下閱讀-----
文章難易度
左岸文化_96
39 篇文章 ・ 11 位粉絲
左岸的出版旨趣側重歷史(文明史、政治史、戰爭史、人物史、物質史、醫療史、科學史)、政治時事(中國因素及其周邊,以及左岸專長的獨裁者)、社會學與人類學田野(大賣場、國會、工廠、清潔隊、農漁村、部落、精神病院,哪裡都可以去)、科學普通讀物(數學和演化生物學在這裡,心理諮商和精神分析也在這裡)。

0

1
0

文字

分享

0
1
0
拆解邊緣AI熱潮:伺服器如何提供穩固的運算基石?
鳥苷三磷酸 (PanSci Promo)_96
・2025/05/21 ・5071字 ・閱讀時間約 10 分鐘

本文與 研華科技 合作,泛科學企劃執行。

每次 NVIDIA 執行長黃仁勳公開發言,總能牽動整個 AI 產業的神經。然而,我們不妨設想一個更深層的問題——如今的 AI 幾乎都倚賴網路連線,那如果哪天「網路斷了」,會發生什麼事?

想像你正在自駕車打個盹,系統突然警示:「網路連線中斷」,車輛開始偏離路線,而前方竟是萬丈深谷。又或者家庭機器人被駭,開始暴走跳舞,甚至舉起刀具向你走來。

這會是黃仁勳期待的未來嗎?當然不是!也因為如此,「邊緣 AI」成為業界關注重點。不靠雲端,AI 就能在現場即時反應,不只更安全、低延遲,還能讓數據當場變現,不再淪為沉沒成本。

什麼是邊緣 AI ?

邊緣 AI,乍聽之下,好像是「孤單站在角落的人工智慧」,但事實上,它正是我們身邊最可靠、最即時的親密數位夥伴呀。

當前,像是企業、醫院、學校內部的伺服器,個人電腦,甚至手機等裝置,都可以成為「邊緣節點」。當數據在這些邊緣節點進行運算,稱為邊緣運算;而在邊緣節點上運行 AI ,就被稱為邊緣 AI。簡單來說,就是將原本集中在遠端資料中心的運算能力,「搬家」到更靠近數據源頭的地方。

-----廣告,請繼續往下閱讀-----

那麼,為什麼需要這樣做?資料放在雲端,集中管理不是更方便嗎?對,就是不好。

當數據在這些邊緣節點進行運算,稱為邊緣運算;而在邊緣節點上運行 AI ,就被稱為邊緣 AI。/ 圖片來源:MotionArray

第一個不好是物理限制:「延遲」。
即使光速已經非常快,數據從你家旁邊的路口傳到幾千公里外的雲端機房,再把分析結果傳回來,中間還要經過各種網路節點轉來轉去…這樣一來一回,就算只是幾十毫秒的延遲,對於需要「即刻反應」的 AI 應用,比如說工廠裡要精密控制的機械手臂、或者自駕車要判斷路況時,每一毫秒都攸關安全與精度,這點延遲都是無法接受的!這是物理距離與網路架構先天上的限制,無法繞過去。

第二個挑戰,是資訊科學跟工程上的考量:「頻寬」與「成本」。
你可以想像網路頻寬就像水管的粗細。隨著高解析影像與感測器數據不斷來回傳送,湧入的資料數據量就像超級大的水流,一下子就把水管塞爆!要避免流量爆炸,你就要一直擴充水管,也就是擴增頻寬,然而這樣的基礎建設成本是很驚人的。如果能在邊緣就先處理,把重要資訊「濃縮」過後再傳回雲端,是不是就能減輕頻寬負擔,也能節省大量費用呢?

第三個挑戰:系統「可靠性」與「韌性」。
如果所有運算都仰賴遠端的雲端時,一旦網路不穩、甚至斷線,那怎麼辦?很多關鍵應用,像是公共安全監控或是重要設備的預警系統,可不能這樣「看天吃飯」啊!邊緣處理讓系統更獨立,就算暫時斷線,本地的 AI 還是能繼續運作與即時反應,這在工程上是非常重要的考量。

所以你看,邊緣運算不是科學家們沒事找事做,它是順應數據特性和實際應用需求,一個非常合理的科學與工程上的最佳化選擇,是我們想要抓住即時數據價值,非走不可的一條路!

邊緣 AI 的實戰魅力:從工廠到倉儲,再到你的工作桌

知道要把 AI 算力搬到邊緣了,接下來的問題就是─邊緣 AI 究竟強在哪裡呢?它強就強在能夠做到「深度感知(Deep Perception)」!

-----廣告,請繼續往下閱讀-----

所謂深度感知,並非僅僅是對數據進行簡單的加加減減,而是透過如深度神經網路這類複雜的 AI 模型,從原始數據裡面,去「理解」出更高層次、更具意義的資訊。

研華科技為例,旗下已有多項邊緣 AI 的實戰應用。以工業瑕疵檢測為例,利用物件偵測模型,快速將工業產品中的瑕疵挑出來,而且由於 AI 模型可以使用同一套參數去檢測,因此品管上能達到一致性,減少人為疏漏。尤其在高產能工廠中,檢測速度必須快、狠、準。研華這套 AI 系統每分鐘最高可處理 8,000 件產品,替工廠節省大量人力,同時確保品質穩定。這樣的效能來自於一台僅有膠囊咖啡機大小的邊緣設備—IPC-240。

這樣的效能來自於一台僅有膠囊咖啡機大小的邊緣設備—IPC-240。/ 圖片提供:研華科技

此外,在智慧倉儲場域,研華與威剛合作,研華與威剛聯手合作,在 MIC-732AO 伺服器上搭載輝達的 Nova Orin 開發平台,打造倉儲系統的 AMR(Autonomous Mobile Robot) 自走車。這跟過去在倉儲系統中使用的自動導引車 AGV 技術不一樣,AMR 不需要事先規劃好路線,靠著感測器偵測,就能輕鬆避開障礙物,識別路線,並且將貨物載到指定地點存放。

當然,還有語言模型的應用。例如結合檢索增強生成 ( RAG ) 跟上下文學習 ( in-context learning ),除了可以做備忘錄跟排程規劃以外,還能將實務上碰到的問題記錄下來,等到之後碰到類似的問題時,就能詢問 AI 並得到解答。

你或許會問,那為什麼不直接使用 ChatGPT 就好了?其實,對許多企業來說,內部資料往往具有高度機密性與商業價值,有些場域甚至連手機都禁止員工帶入,自然無法將資料上傳雲端。對於重視資安,又希望運用 AI 提升效率的企業與工廠而言,自行部署大型語言模型(self-hosted LLM)才是理想選擇。而這樣的應用,並不需要龐大的設備。研華的 SKY-602E3 塔式 GPU 伺服器,體積僅如後背包大小,卻能輕鬆支援語言模型的運作,實現高效又安全的 AI 解決方案。

但問題也接著浮現:要在這麼小的設備上跑大型 AI 模型,會不會太吃資源?這正是目前 AI 領域最前沿、最火熱的研究方向之一:如何幫 AI 模型進行「科學瘦身」,又不減智慧。接下來,我們就來看看科學家是怎麼幫 AI 減重的。

-----廣告,請繼續往下閱讀-----

語言模型瘦身術之一:量化(Quantization)—用更精簡的數位方式來表示知識

當硬體資源有限,大模型卻越來越龐大,「幫模型減肥」就成了邊緣 AI 的重要課題。這其實跟圖片壓縮有點像:有些畫面細節我們肉眼根本看不出來,刪掉也不影響整體感覺,卻能大幅減少檔案大小。

模型量化的原理也是如此,只不過對象是模型裡面的參數。這些參數原先通常都是以「浮點數」表示,什麼是浮點數?其實就是你我都熟知的小數。舉例來說,圓周率是個無窮不循環小數,唸下去就會是3.141592653…但實際運算時,我們常常用 3.14 或甚至直接用 3,也能得到夠用的結果。降低模型參數中浮點數的精度就是這個意思! 

然而,量化並不是那麼容易的事情。而且實際上,降低精度多少還是會影響到模型表現的。因此在設計時,工程師會精密調整,確保效能在可接受範圍內,達成「瘦身不減智」的目標。

當硬體資源有限,大模型卻越來越龐大,「幫模型減肥」就成了邊緣 AI 的重要課題。/ 圖片來源:MotionArray

模型剪枝(Model Pruning)—基於重要性的結構精簡

建立一個 AI 模型,其實就是在搭建一整套類神經網路系統,並訓練類神經元中彼此關聯的參數。然而,在這麼多參數中,總會有一些參數明明佔了一個位置,卻對整體模型沒有貢獻。既然如此,不如果斷將這些「冗餘」移除。

這就像種植作物的時候,總會雜草叢生,但這些雜草並不是我們想要的作物,這時候我們就會動手清理雜草。在語言模型中也會有這樣的雜草存在,而動手去清理這些不需要的連結參數或神經元的技術,就稱為 AI 模型的模型剪枝(Model Pruning)。

-----廣告,請繼續往下閱讀-----

模型剪枝的效果,大概能把100變成70這樣的程度,說多也不是太多。雖然這樣的縮減對於提升效率已具幫助,但若我們要的是一個更小幾個數量級的模型,僅靠剪枝仍不足以應對。最後還是需要從源頭著手,採取更治本的方法:一開始就打造一個很小的模型,並讓它去學習大模型的知識。這項技術被稱為「知識蒸餾」,是目前 AI 模型壓縮領域中最具潛力的方法之一。

知識蒸餾(Knowledge Distillation)—讓小模型學習大師的「精髓」

想像一下,一位經驗豐富、見多識廣的老師傅,就是那個龐大而強悍的 AI 模型。現在,他要培養一位年輕學徒—小型 AI 模型。與其只是告訴小型模型正確答案,老師傅 (大模型) 會更直接傳授他做判斷時的「思考過程」跟「眉角」,例如「為什麼我會這樣想?」、「其他選項的可能性有多少?」。這樣一來,小小的學徒模型,用它有限的「腦容量」,也能學到老師傅的「智慧精髓」,表現就能大幅提升!這是一種很高級的訓練技巧,跟遷移學習有關。

舉個例子,當大型語言模型在收到「晚餐:鳳梨」這組輸入時,它下一個會接的詞語跟機率分別為「炒飯:50%,蝦球:30%,披薩:15%,汁:5%」。在知識蒸餾的過程中,它可以把這套機率表一起教給小語言模型,讓小語言模型不必透過自己訓練,也能輕鬆得到這個推理過程。如今,許多高效的小型語言模型正是透過這項技術訓練而成,讓我們得以在資源有限的邊緣設備上,也能部署愈來愈強大的小模型 AI。

但是!即使模型經過了這些科學方法的優化,變得比較「苗條」了,要真正在邊緣環境中處理如潮水般湧現的資料,並且高速、即時、穩定地運作,仍然需要一個夠強的「引擎」來驅動它們。也就是說,要把這些經過科學千錘百鍊、但依然需要大量計算的 AI 模型,真正放到邊緣的現場去發揮作用,就需要一個強大的「硬體平台」來承載。

-----廣告,請繼續往下閱讀-----

邊緣 AI 的強心臟:SKY-602E3 的三大關鍵

像研華的 SKY-602E3 塔式 GPU 伺服器,就是扮演「邊緣 AI 引擎」的關鍵角色!那麼,它到底厲害在哪?

一、核心算力
它最多可安裝 4 張雙寬度 GPU 顯示卡。為什麼 GPU 這麼重要?因為 GPU 的設計,天生就擅長做「平行計算」,這正好就是 AI 模型裡面那種海量數學運算最需要的!

你想想看,那麼多數據要同時處理,就像要請一大堆人同時算數學一樣,GPU 就是那個最有效率的工具人!而且,有多張 GPU,代表可以同時跑更多不同的 AI 任務,或者處理更大流量的數據。這是確保那些科學研究成果,在邊緣能真正「跑起來」、「跑得快」、而且「能同時做更多事」的物理基礎!

二、工程適應性——塔式設計。
邊緣環境通常不是那種恆溫恆濕的標準機房,有時是在工廠角落、辦公室一隅、或某個研究實驗室。這種塔式的機箱設計,體積相對緊湊,散熱空間也比較好(這對高功耗的 GPU 很重要!),部署起來比傳統機架式伺服器更有彈性。這就是把高性能計算,進行「工程化」,讓它能適應台灣多樣化的邊緣應用場景。

三、可靠性
SKY-602E3 用的是伺服器等級的主機板、ECC 糾錯記憶體、還有備援電源供應器等等。這些聽起來很硬的規格,背後代表的是嚴謹的工程可靠性設計。畢竟在邊緣現場,系統穩定壓倒一切!你總不希望 AI 分析跑到一半就掛掉吧?這些設計確保了部署在現場的 AI 系統,能夠長時間、穩定地運作,把實驗室裡的科學成果,可靠地轉化成實際的應用價值。

-----廣告,請繼續往下閱讀-----
研華的 SKY-602E3 塔式 GPU 伺服器,體積僅如後背包大小,卻能輕鬆支援語言模型的運作,實現高效又安全的 AI 解決方案。/ 圖片提供:研華科技

台灣製造 × 在地智慧:打造專屬的邊緣 AI 解決方案

研華科技攜手八維智能,能幫助企業或機構提供客製化的AI解決方案。他們的技術能力涵蓋了自然語言處理、電腦視覺、預測性大數據分析、全端軟體開發與部署,及AI軟硬體整合。

無論是大小型語言模型的微調、工業瑕疵檢測的模型訓練、大數據分析,還是其他 AI 相關的服務,都能交給研華與八維智能來協助完成。他們甚至提供 GPU 與伺服器的租借服務,讓企業在啟動 AI 專案前,大幅降低前期投入門檻,靈活又實用。

台灣有著獨特的產業結構,從精密製造、城市交通管理,到因應高齡化社會的智慧醫療與公共安全,都是邊緣 AI 的理想應用場域。更重要的是,這些情境中許多關鍵資訊都具有高度的「時效性」。像是產線上的一處異常、道路上的突發狀況、醫療設備的即刻警示,這些都需要分秒必爭的即時回應。

如果我們還需要將數據送上雲端分析、再等待回傳結果,往往已經錯失最佳反應時機。這也是為什麼邊緣 AI,不只是一項技術創新,更是一條把尖端 AI 科學落地、真正發揮產業生產力與社會價值的關鍵路徑。讓數據在生成的那一刻、在事件發生的現場,就能被有效的「理解」與「利用」,是將數據垃圾變成數據黃金的賢者之石!

👉 更多研華Edge AI解決方案
👉 立即申請Server租借

-----廣告,請繼續往下閱讀-----
-----廣告,請繼續往下閱讀-----
文章難易度

討論功能關閉中。

2

2
2

文字

分享

2
2
2
諦聽宇宙深處的低吟,宇宙低頻重力波訊號代表的意義——《科學月刊》
科學月刊_96
・2023/11/01 ・3782字 ・閱讀時間約 7 分鐘

  • 作者/陳哲佑
    • 任職於日本理化學研究所,專長為黑洞物理、宇宙學、重力理論等。
    • 熱愛旅行、排球與珍珠奶茶
  • Take Home Message
    • 今(2023)年 6 月,北美奈赫茲重力波天文臺(NANOGrav)團隊觀察到宇宙中的低頻重力波。
    • NANOGrav 團隊利用數個脈衝星組成「脈衝星陣列」(PTA),測量各脈衝星訊號到達的時間,計算不同訊號的到達時間是否存在著相關性。
    • PTA 得到的重力波訊號相當持續,沒有明確的波源。科學家推測此訊號可能來自多個超大質量雙黑洞系統互繞而產生的疊加背景。

2015 年 9 月,位於美國的雷射干涉儀重力波天文臺(Laser Interferometer Gravitational-Wave Observatory, LIGO)成功偵測來自雙黑洞碰撞的重力波訊號(請見延伸閱讀 1)。

這個發現不僅再次驗證愛因斯坦(Albert Einstein)「廣義相對論」的成功,更引領人類進入嶄新的重力波天文學時代。到了現在,我們不僅能使用各種電磁波波段進行觀測,還多了重力波這個強而有力的工具能夠窺探我們身處的宇宙,甚至還有同時結合兩者的多信使天文學(multi-messenger astronomy)註1,皆能帶給人類許多單純電磁波波段觀測無法觸及的資訊(請見延伸閱讀 2)。

如同不同波段的電磁波觀測結果為我們捎來不同的訊息,重力波也有不同的頻譜,且頻譜與產生重力波的波源性質有非常密切的關係。以雙黑洞碰撞為例,系統中黑洞的質量與碰撞過程中發出的重力波頻率大致上成反比,因此當系統中黑洞的質量愈大,它產生的重力波頻率就愈低。

目前地球上的三個重力波天文臺:LIGO、處女座重力波團隊(The Virgo Collaboration, Virgo),以及神岡重力波探測器(Kamioka Gravitational wave detector, KAGRA, or Large-scale Cryogenic Gravitational wave Telescope, LCGT)都受限於干涉儀的長度,只對頻率範圍 10~1000 赫茲(Hz)的重力波有足夠的靈敏度,此範圍的重力波對應到的波源即是一般恆星質量大小的雙黑洞系統。

-----廣告,請繼續往下閱讀-----

然而,來自超大質量黑洞互繞所發出的重力波頻率幾乎是奈赫茲(Nano Hertz,即 10-9 Hz)級別,如果想要探測到此重力波,就需要一個「星系」規模的重力波探測器。雖然這聽起來彷彿天方夜譚,但就在今年 6 月,北美奈赫茲重力波天文臺(North American Nanohertz Observatory for Gravitational Waves, NANOGrav)的團隊利用「脈衝星計時陣列」(pulsar timing array, PTA)成功地觀測到這些低頻重力波存在的證據。

以不同方式觀察不同頻率的重力波

與電磁波相似,重力波也有不同的頻率。不同頻率的重力波會對應到不同性質的波源,且需要不同的方式觀測。圖/科學月刊 資料來源/Barack, et al. 2018

NANOGrav 如何觀測低頻重力波?

讀者聽過脈衝星(pulsar)嗎?它是一種高速旋轉且高度磁化的中子星(neutron star)註2,會從磁極放出電磁波。隨著脈衝星的旋轉,它的電磁波會以非常規律的時間間隔掃過地球,因而被身處於地球上的我們偵測到,就像是海邊的燈塔所發出的光,會規律地掃過地平面一般。由於脈衝星的旋轉模式相當穩定,掃過地球的脈衝就如同宇宙中天然的時鐘,因此在天文學上有相當多的應用——甚至可以用來觀測重力波。

利用脈衝星觀測重力波的第一步,首先要記錄各個脈衝星的電磁脈衝到達地球的時間(time of arrival),並且將這些訊號與脈衝星電磁脈衝的理論模型做比對。

如果訊號和理論模型相符,那麼兩者相減後所得到的訊號差(residual)只會剩下一堆雜訊;相反的,如果宇宙中存在著重力波,並且扭曲了該脈衝星和地球之間的時空,那麼兩訊號相減之後就不會只有雜訊,而會出現時空擾動的蹤跡。

-----廣告,請繼續往下閱讀-----
利用數個脈衝星組成的脈衝星計時陣列,可用來尋找宇宙中低頻的重力波訊號。圖/Tonia Klein, NANOGrav 

然而以觀測的角度來看,即便我們從來自單一脈衝星的訊號中發現訊號差出現偏離雜訊的跡象,也不能直接推論這些跡象一定是來自重力波。畢竟科學家對脈衝星的內部機制和脈衝傳遞的過程也並未完全了解,這些未知的機制都可能會使單一脈衝星的訊號差偏離雜訊。

因此為了要判斷重力波是否存在,就必須進行更進一步的觀測:利用數個脈衝星組成脈衝星陣列,測量每個脈衝星訊號到達的時間,並且計算這些不同脈衝星訊號的到達時間是否存在某種相關性。

舉例來說,如果脈衝星和地球之間沒有重力波造成的時空擾動,那麼即便每顆脈衝星的訊號差都出現偏離雜訊的跡象,彼此之間的訊號也會完全獨立且不相干;反之,如果脈衝星和地球之間有重力波經過,這些重力波便會扭曲時空,不僅會改變這些脈衝訊號的到達時間,且不同脈衝星訊號到達的時間變化也會具有某種特定的相關性。

根據廣義相對論的計算,一旦有重力波經過,不同脈衝星訊號之間的相關性與脈衝星在天球上的夾角會滿足一條特定的曲線,稱為 HD 曲線(Hellings-Downs curve)。

-----廣告,請繼續往下閱讀-----

科學家以兩顆脈衝星為一組觀測單位,藉由觀測多組脈衝星的訊號、計算它們之間的相關性,再比較這些數據是否符合 HD 曲線,就能夠進一步推斷低頻重力波是否存在。值得一提的是,由於重力波訊號非常微弱,用來作為陣列的脈衝星必須有非常穩定的計時條件,因此一般會選擇自轉週期在毫秒(ms)級別的毫秒脈衝星作為觀測對象。

NANOGrav 在今年 6 月發布的觀測結果就是利用位於波多黎各的阿雷西博天文台(Arecibo Observatory,已於 2020 年因結構老舊而退役)、美國的綠堤望遠鏡(Robert C. Byrd Green Bank Telescope)和甚大天線陣(Very Large Array, VLA)觀測 68 顆毫秒脈衝星。

他們分析了長達 15 年的觀測數據後,發現這些脈衝星訊號的相關性與 HD 曲線相當吻合,證實了低頻重力波確實存在於我們的宇宙中。

除了 NANOGrav,其他團隊例如歐洲的脈衝星計時陣列(European Pulsar Timing Array, EPTA)、澳洲的帕克斯脈衝星計時陣列(Parkes Pulsar Timing Array, PPTA)、印度的脈衝星定時陣列(Indian Pulsar Timing Array, InPTA),以及中國的脈衝星計時陣列(Chinese Pulsar Timing Array, CPTA)等,皆得到相符的結果。

-----廣告,請繼續往下閱讀-----

NANOGrav 觀測結果帶來的意義

與先前 LIGO 觀測到的瞬時重力波訊號不同,目前利用 PTA 得到的重力波訊號是相當持續的,而且並沒有較明確的單一波源,反而像是由來自四面八方數個波源組成的隨機背景訊號。

打個比方,LIGO 收到的重力波訊號像是我們站在海邊,迎面而來一波一波分明的海浪,每一波海浪分別對應到不同黑洞碰撞事件所發出的重力波;而 PTA 的訊號則是位於大海正中央,感受到隨機且不規則的海面起伏。

目前對這些奈赫茲級別的重力波訊號最合理也最自然的解釋,是來自多個超大質量雙黑洞系統互繞而產生的疊加背景。若真是如此,那這項發現將對天文學產生重大的意義。

過去科學界對於如此巨大的雙黑洞系統能否在可觀測宇宙(observable universe)的時間內互繞仍普遍存疑,如果PTA觀測到的重力波真的來自超大質量雙黑洞互繞,那代表這類系統不僅存在,它們的出現還比過去我們預期的更為頻繁,且產生的訊號也更強。

-----廣告,請繼續往下閱讀-----

NANOGrav 的觀測結果

橫軸為脈衝星陣列中,兩脈衝星位置之間的夾角;縱軸為訊號之間的相關性;藍色數據點為 NANOGrav 15 年的觀測結果;黑色虛線為 HD 曲線。可看出數據點的分布與 HD 曲線相當吻合。圖/科學月刊 資料來源/Agazie et al. 2023

不過除了雙黑洞系統,也有其他「相對新奇」的物理機制也可能產生這樣的重力波背景,包含早期宇宙的相變、暗物質,以及其他非標準模型的物理等。若要從觀測的角度去區分這些成因,最重要的關鍵在於,能否從隨機背景中找到特定的波源方向。

如果是雙黑洞系統造成的重力波,勢必會有來自某些方向的訊號比較強;反之,如果是早期宇宙產生的重力波,那麼這些重力波將會隨著宇宙的膨脹瀰漫在整個宇宙中,因此它們勢必是相當均向的。

為了找到波源方向,提升訊號的靈敏度成為了當務之急。而若要提升 PTA 的靈敏度,最主要的方式有兩種——其一是將更多的脈衝星加入陣列;其二則是延長觀測的時間。

目前,不同的 PTA 團隊已經組成國際脈衝星計時陣列(International PTA)互相分享彼此的脈衝星觀測資料。隨著觀測技術的進步,解密這些奈赫茲級別的神祕重力波將指日可待。

-----廣告,請繼續往下閱讀-----

註解

  1. 相較於過往只能以可見光觀測宇宙,多信使天文學能利用多種探測訊號,如電磁波、微中子、重力波、宇宙射線等工具探索宇宙現象,獲得更多不同資訊及宇宙更細微的面貌。
  2. 質量較重的恆星在演化到末期、發生超新星爆炸(supernova)後,就有可能成為中子星。

延伸閱讀

  1. 林俊鈺(2016)。發現重力波!,科學月刊556,248–249。
  2. 金升光(2017)。重力波獨白落幕 多角觀測閃亮登場,科學月刊576,892–893。
  3. NANOgrav. (Jun 28 2023). Scientists use Exotic Stars to Tune into Hum from Cosmic Symphony. NANOgrav.
  • 〈本文選自《科學月刊》2023 年 10 月號〉
  • 科學月刊/在一個資訊不值錢的時代中,試圖緊握那知識餘溫外,也不忘科學事實和自由價值至上的科普雜誌。
-----廣告,請繼續往下閱讀-----
所有討論 2
科學月刊_96
249 篇文章 ・ 3742 位粉絲
非營利性質的《科學月刊》創刊於1970年,自創刊以來始終致力於科學普及工作;我們相信,提供一份正確而完整的科學知識,就是回饋給讀者最好的品質保證。

2

2
2

文字

分享

2
2
2
買樂透真的可以賺錢?大數法則揭示了賭博的真相!——《統計,讓數字說話》
天下文化_96
・2023/03/05 ・2394字 ・閱讀時間約 4 分鐘

  • id S. Moore、諾茨 William I. Notz
  • 譯者:鄭惟厚、吳欣蓓

什麼是大數法則?

期望值的定義是:它是可能結果的一種平均,但在計算平均時,機率大的結果占的比重較高。我們認為期望值也是另一種意義的平均結果,它代表了如果我們重複賭很多次,或者隨機選出很多家戶,實際上會看到的長期平均。這並不只是直覺而已。數學家只要用機率的基本規則就可以證明,用機率模型算出來的期望值,真的就是「長期平均」。這個有名的事實叫做大數法則。

大數法則
大數法則(law of large numbers)是指,如果結果為數值的隨機現象,獨立重複執行許多次,實際觀察到的結果的平均值,會趨近期望值。

大數法則和機率的概念密切相關。在許多次獨立的重複當中,每個可能結果的發生比例會接近它的機率,而所得到的平均結果就會接近期望值。這些事實表達了機遇事件的長期規律性。正如我們在第 17 章提過的,它們是真正的「平均數定律」。

大數法則解釋了:為什麼對個人來說是消遣甚至是會上癮的賭博,對賭場來說卻是生意。經營賭場根本就不是在賭博。大量的賭客贏錢的平均金額會很接近期望值。賭場經營者事先就算好了期望值,並且知道長期下來收入會是多少,所以並不需要在骰子裡灌鉛或者做牌來保證利潤。

賭場只要花精神提供不貴的娛樂和便宜的交通工具,讓顧客川流不息進場就行了。只要賭注夠多,大數法則就能保證賭場賺錢。保險公司的運作也很像賭場,他們賭買了保險的人不會死亡。當然有些人確實會死亡,但是保險公司知道機率,並且依賴大數法則來預測必須給付的平均金額。然後保險公司就把保費訂得夠高,來保證有利潤。

-----廣告,請繼續往下閱讀-----
  • 在樂透彩上做手腳

我們都在電視上看過樂透開獎的實況轉播,看到號碼球上下亂跳,然後由於空氣壓力而隨機彈跳出來。我們可以怎麼樣對開出的號碼做手腳呢? 1980 年的時候,賓州樂透就曾被面帶微笑的主持人以及幾個舞台工作人員動了手腳。

他們把 10 個號碼球中的 8 顆注入油漆,這樣做會把球變重,因此可保證開出中獎號碼的 3 個球必定有那 2 個沒被注入油漆的號碼。然後這些傢伙就下注買該 2 個號碼的所有組合。當 6-6-6 跳出來的時候,他們贏了 120 萬美元。是的,他們後來全被逮到。

歷史上曾有主持人在樂透上做手腳,後來賺了 120 萬美元隨後被逮捕。圖/envatoelements

深入探討期望值

跟機率一樣,期望值和大數法則都值得再花些時間,探討相關的細節問題。

  • 多大的數才算是「大數」?

大數法則是說,當試驗的次數愈來愈多,許多次試驗的實際平均結果會愈來愈接近期望值。可是大數法則並沒有說,究竟需要多少次試驗,才能保證平均結果會接近期望值。這點是要看機結果的變異性決定。

-----廣告,請繼續往下閱讀-----

結果的變異愈大,就需要愈多次的試驗,來確保平均結果接近期望值。機遇遊戲一定要變化大,才能保住賭客的興趣。即使在賭場待上好幾個鐘頭,結果也是無法預測的。結果變異性極大的賭博,例如累積彩金數額極大但極不可能中獎的州彩券,需要極多次的試驗,幾乎要多到不可能的次數,才能保證平均結果會接近期望值。

(州政府可不需要依賴大數法則,因為樂透彩金不像賭場的遊戲,樂透彩用的是同注分彩系統。在同注分彩系統裡面,彩金和賠率是由實際下注金額決定的。舉例來說,各州所辦的樂透彩金,是由全部賭金扣除州政府所得部分之後的剩餘金額來決定的。賭馬的賠率則是決定於賭客對不同馬匹的下注金額。)

雖然大部分的賭博遊戲不及樂透彩這樣多變化,但要回答大數法則的適用範圍,較實際的答案就是:賭場的贏錢金額期望值是正的,而賭場玩的次數夠多,所以可以靠著這個期望值贏錢。你的問題則是,你贏錢金額的期望值是負的。全體賭客玩的次數合起來算的話,當然和賭場一樣多,但因為期望值是負的,所以以賭客整體來看,長期下來一定輸錢。

然而輸的金額並不是由賭客均攤。有些人贏很多錢,有些人輸很多,而有些人沒什麼輸贏。賭博帶給人的誘惑,大部分是來自賭博結果的無法預測。而賭博這門生意仰賴的則是:對賭場來說,結果並非不可測的。

-----廣告,請繼續往下閱讀-----
對賭場來說,贏錢金額期望值為正。圖/envatoelements
  • 有沒有保證贏錢的賭法?

把賭博很當回事的賭客常常遵循某種賭法,這種賭法每次下注的金額,是看前幾次的結果而定。比如說,在賭輪盤時,你可以每次把賭注加倍,直到你贏為止—或者,當然,直到你輸光為止。即使輪盤並沒有記憶,這種玩法仍想利用你有記憶這件事來贏。

你可以用一套賭法來戰勝機率嗎?不行,數學家建立的另一種大數法則說:如果你沒有無窮盡的賭本,那麼只要遊戲的各次試驗(比如輪盤的各次轉動)之間是獨立的,你的平均獲利(期望值)就會是一樣的。抱歉啦!

  • 高科技賭博

全美國有超過 700,000 台吃角子老虎(拉霸)。從前,你丟硬幣進去再拉下把手,轉動三個輪子,每個輪子有 20 個圖案。但早就不是這樣了。現在的機器是電動遊戲,會閃出許多很炫的畫面,而結果是由隨機數字產生器決定的。

機器可以同時接受許多硬幣,有各種讓你眼花撩亂的中獎結果,還可以多台連線,共同累積成連線大獎。賭徒仍在尋找可以贏錢的賭法,但是長期下來,隨機數字產生器會保證賭場有 5% 的利潤。

-----廣告,請繼續往下閱讀-----

——本文摘自《統計,讓數字說話》,2023 年 1 月,天下文化出版,未經同意請勿轉載。

-----廣告,請繼續往下閱讀-----
所有討論 2
天下文化_96
142 篇文章 ・ 624 位粉絲
天下文化成立於1982年。一直堅持「傳播進步觀念,豐富閱讀世界」,已出版超過2,500種書籍,涵括財經企管、心理勵志、社會人文、科學文化、文學人生、健康生活、親子教養等領域。每一本書都帶給讀者知識、啟發、創意、以及實用的多重收穫,也持續引領台灣社會與國際重要管理潮流同步接軌。
OSZAR »