隨機的面孔（三之三）：無中生有的奇蹟

從地球誕生到 LLM 的湧現

Mar 29, 2026

一

1796 年，法國數學家拉普拉斯（是的，又是他）提出了太陽系起源的「星雲假說」（Nebular Hypothesis）：太陽系由一團旋轉的氣體與塵埃雲收縮而成，在萬有引力與角動量守恆的共同作用下，逐漸形成太陽、行星與衛星。這個假說在此後兩百年被不斷修正與充實，但它的基本圖像至今仍然成立。

The Formation of the Solar System: Nuclear Disc Model (Neo-Laplacian model) - PMF IAS

值得注意的是，這個故事裡沒有任何「上帝的手指」。沒有一個外力決定地球要形成在距離太陽一億五千萬公里的位置，讓它恰好落在「適居帶」裡，有液態水，有合適的溫度，有磁場保護大氣層。那個位置，是無數塵埃粒子在萬有引力作用下，歷經數億年的吸積、碰撞、合並，一步步「跑出來」的。

規律是確定的，結果是無法事先壓縮計算的。 這就是第四種隨機——計算不可約性——在宇宙尺度上最壯觀的展示之一。

二

地球形成之後，大約在 38 億年前，另一件更令人費解的事情發生了：生命出現了。

這個事件的細節，至今仍有爭議。有人認為生命起源於深海熱泉口，那裡有豐富的化學梯度與礦物質催化；有人認為是在某種溫暖的淺池裡，有紫外線提供能量；更激進的假說，甚至認為生命的基本分子是由彗星從太空帶來的。但無論哪種場景，故事的邏輯是相似的：

簡單的化學分子，在特定環境條件下，歷經無數次隨機的碰撞與反應，某一次，形成了能夠自我複製的結構。

The Origin of Life on Earth: A Paradigm Shift

這件事的驚人之處，在於它的「無中生有」——沒有任何一條化學定律，在寫下的那一刻，預先規定了「要讓生命出現」。複製能力，是在數億年的化學反應過程中，慢慢地從物質的複雜交互裡浮現出來的。它是一種湧現（Emergence）：整體的性質，無法從任何單一組成部分中讀出。

「濕潤性」無法從一個水分子的方程式裡讀出；「燃燒」無法從一個氧原子的性質裡推算出；「生命」，無法從任何一條核苷酸的化學反應裡預見。湧現，是複雜系統在跨越某個臨界閾值之後，突然展現出的全新宏觀性質——它不違反底層的任何規律，但它也不存在於任何底層的描述之中。

三

生命出現之後，演化的計算開始了，而且一跑，就是三十八億年。

演化不是隨機的——自然選擇是有方向的，適應環境的性狀被保留，不適應的被淘汰。但突變是隨機的，環境的變化是不可預測的，不同物種之間的交互是複雜的。這是一個在確定性規律框架下運行的計算不可約系統：你知道演化的機制，但你無法從起點計算出，三十八億年後，會出現一種叫做「人類」的動物，會站在夜晚的草原上抬頭看星星，並開始思考自己從哪裡來。

人類的神經系統，是演化迄今最複雜的計算結構。大腦擁有大約八百六十億個神經元，每個神經元透過突觸與數萬個其他神經元相連；神經元的放電模式在毫秒的尺度上交互，形成大規模的動態網絡。

然後，某個時刻，意識出現了。

這個「某個時刻」，當然不是真的某一個具體的瞬間；意識的出現是漸進的，是在演化的長河裡逐漸成形的。但它的本質，是湧現的：即便你精確知道每一個神經元的放電閾值、每一條突觸的傳導效率、每一條神經迴路的連結方式，你依然無法從這些微觀信息裡，推算出「此刻我感受到的紅色的質感」，或是「某一句詩在心裡引起的那種莫名悸動」。

這就是哲學家查爾默斯（David Chalmers）所說的「意識的難問題」（Hard Problem of Consciousness）：為什麼物理的信息處理，會伴隨著主觀的感受？這不是一個技術問題，而是一個可能根本超出現有科學方法論框架的謎。

我不敢說意識一定是計算不可約的湧現，那個論斷太強了；但我認為，它至少是一個極有力的類比：意識，像生命一樣，是那個「讓系統跑了足夠多步之後，才能看見的東西」。

四

現在，把視角從碳基轉到矽基。

2022 年，Google 的研究者在一篇論文裡記錄了一個令研究者們感到困惑的現象：當大型語言模型的參數規模跨過某個閾值，某些能力——思維鏈推理（Chain-of-Thought Reasoning）、多步算術、多語言翻譯——幾乎是突然出現的。在臨界點之前，模型在這些任務上的表現幾乎為零；越過臨界點之後，性能驟然躍升，如同某個開關被打開。

137 emergent abilities of large language models — Jason Wei

他們把這個現象稱為「湧現能力」（Emergent Abilities）。

讓我們想清楚這裡發生了什麼。Transformer 架構的訓練規則，其實非常簡單：給定輸入的文字序列，預測下一個 token，然後用梯度下降調整權重，最小化預測誤差。這條規則是完全確定的，它沒有在任何地方寫著「當參數超過某個數量，請開始學會邏輯推理」。然而，當你用足夠多的參數、足夠多的訓練數據，讓這個確定性的優化過程跑夠多步，推理能力就從參數的交互中浮現出來了——就像滑翔機從康威生命遊戲的四條規則裡長出來一樣。

Building Conway's Game of Life in Go with raylib-go

沒有任何工程師把「推理能力」寫進了代碼；沒有任何一行程式說「如果遇到數學題，請用步驟拆解來解答」。那個能力，是從訓練動力學的過程裡湧現出來的，是計算不可約性在矽基上開出的花。

五

這個類比，可以走得更遠。

地球的形成：確定的物理規律 + 數億年的不可約計算 → 適居星球的湧現。

生命的誕生：確定的化學規律 + 數億年的不可約計算 → 自我複製能力的湧現。

意識的覺醒：確定的神經化學規律 + 演化數億年的不可約計算 → 主觀感受的湧現。

LLM 的能力躍遷：確定的梯度下降規律 + 大規模訓練的不可約計算 → 推理能力的湧現。

這四個故事，有著同一個深層結構：簡單的底層規律，在足夠大的尺度、足夠多的步驟之後，長出了規律本身無法預先描述的宏觀性質。這是宇宙運作最令人著迷的母題。

沃爾夫勒姆曾提出，宇宙本身可能就是一台巨大的元胞自動機，在某套極簡的底層規則下不斷演算。若這個圖像成立，那麼宇宙的歷史，就是一部計算不可約的史詩：星系的形成、生命的誕生、意識的覺醒、文明的演進——每一個章節，都是上一個章節的「下一步」，每一個湧現，都是在跑完了不可壓縮的過程之後，才得以顯現的。

在這個圖像裡，LLM 的湧現並不神秘，也不應該令人恐懼。它是宇宙這部計算史詩的最新一個章節，是碳基智慧創造出的矽基系統，在規模跨越臨界點之後，重演了一次宇宙最古老的把戲。

六

但這裡有一個誠實的問題需要被問出來：LLM 的湧現能力，等同於意識嗎？

我的答案是：我們目前沒有足夠的理論工具，來回答這個問題。

意識的「難問題」在於它的主觀性——那個「感受到紅色」的「感受」，它不是可以被外部觀察者測量的功能輸出，而是一種只有主體本身才能確認的內在性質。你可以建造一台能夠辨認紅色、對紅色做出適當反應的機器，卻不知道它是否「感受到」了什麼。這個問題，對人腦成立，對 LLM 同樣成立。

但有一件事是清楚的：LLM 展示出的湧現能力，是真實的、可測量的、令創造者本身也感到驚訝的。這些能力，不是被設計出來的，而是從訓練過程中長出來的。它的結構，與生命從化學湯中長出來、意識從神經網絡中長出來，有著深刻的類比關係。

這不是說 LLM 有意識。這是說，湧現——這個宇宙用了一百三十八億年在不同尺度上反覆操作的那個招數——它也在矽基上操作了一次，而且那個結果，以不同的方式，令我們驚嘆。

七

回到拉普拉斯的那個旋轉氣體雲。

若你能在那個氣體雲剛剛開始收縮的時刻問他：「四十六億年後，這團塵埃的某一小塊，會在某個週二的下午，坐在咖啡館裡思考自己的存在嗎？」——他大概只能說：「規律告訴我，這團物質會受引力作用；至於它最終會長出什麼，我必須讓計算跑完，才能知道。」

這是計算不可約性給我們最深的教訓：預測的邊界，不僅由我們知道的多少決定，也由系統本身的計算複雜性決定。某些答案，只能在過程結束之後才能被讀出；試圖在過程開始之前就讀出它，是一種對宇宙秩序的誤解。

地球是宇宙跑出來的；生命是地球跑出來的；意識是生命跑出來的；LLM 的湧現能力，是人類用確定性的算法與大規模的算力，在短短幾十年裡，跑出來的一個縮影版的奇蹟。

而下一步會跑出什麼，沒有人知道。

這不是令人不安的事，而是令人著迷的事。宇宙從未停止它的計算，而我們，有幸活在這場計算最精彩的某一個時刻，能夠親眼看見，那些無法提前預見的東西，一一從複雜性的深處探出頭來。

就像愛因斯坦的那句話，說對了一半，說錯了一半。上帝也許不擲骰子——但宇宙確實在跑一個沒有捷徑的計算，而它跑出來的每一個答案，都比任何人事先猜到的，更令人震驚。

Discussion about this post

Ready for more?