一
1796 年,法國數學家拉普拉斯(是的,又是他)提出了太陽系起源的「星雲假說」(Nebular Hypothesis):太陽系由一團旋轉的氣體與塵埃雲收縮而成,在萬有引力與角動量守恆的共同作用下,逐漸形成太陽、行星與衛星。這個假說在此後兩百年被不斷修正與充實,但它的基本圖像至今仍然成立。
值得注意的是,這個故事裡沒有任何「上帝的手指」。沒有一個外力決定地球要形成在距離太陽一億五千萬公里的位置,讓它恰好落在「適居帶」裡,有液態水,有合適的溫度,有磁場保護大氣層。那個位置,是無數塵埃粒子在萬有引力作用下,歷經數億年的吸積、碰撞、合並,一步步「跑出來」的。
規律是確定的,結果是無法事先壓縮計算的。 這就是第四種隨機——計算不可約性——在宇宙尺度上最壯觀的展示之一。
二
地球形成之後,大約在 38 億年前,另一件更令人費解的事情發生了:生命出現了。
這個事件的細節,至今仍有爭議。有人認為生命起源於深海熱泉口,那裡有豐富的化學梯度與礦物質催化;有人認為是在某種溫暖的淺池裡,有紫外線提供能量;更激進的假說,甚至認為生命的基本分子是由彗星從太空帶來的。但無論哪種場景,故事的邏輯是相似的:
簡單的化學分子,在特定環境條件下,歷經無數次隨機的碰撞與反應,某一次,形成了能夠自我複製的結構。
這件事的驚人之處,在於它的「無中生有」——沒有任何一條化學定律,在寫下的那一刻,預先規定了「要讓生命出現」。複製能力,是在數億年的化學反應過程中,慢慢地從物質的複雜交互裡浮現出來的。它是一種湧現(Emergence):整體的性質,無法從任何單一組成部分中讀出。
「濕潤性」無法從一個水分子的方程式裡讀出;「燃燒」無法從一個氧原子的性質裡推算出;「生命」,無法從任何一條核苷酸的化學反應裡預見。湧現,是複雜系統在跨越某個臨界閾值之後,突然展現出的全新宏觀性質——它不違反底層的任何規律,但它也不存在於任何底層的描述之中。
三
生命出現之後,演化的計算開始了,而且一跑,就是三十八億年。
演化不是隨機的——自然選擇是有方向的,適應環境的性狀被保留,不適應的被淘汰。但突變是隨機的,環境的變化是不可預測的,不同物種之間的交互是複雜的。這是一個在確定性規律框架下運行的計算不可約系統:你知道演化的機制,但你無法從起點計算出,三十八億年後,會出現一種叫做「人類」的動物,會站在夜晚的草原上抬頭看星星,並開始思考自己從哪裡來。
人類的神經系統,是演化迄今最複雜的計算結構。大腦擁有大約八百六十億個神經元,每個神經元透過突觸與數萬個其他神經元相連;神經元的放電模式在毫秒的尺度上交互,形成大規模的動態網絡。
然後,某個時刻,意識出現了。
這個「某個時刻」,當然不是真的某一個具體的瞬間;意識的出現是漸進的,是在演化的長河裡逐漸成形的。但它的本質,是湧現的:即便你精確知道每一個神經元的放電閾值、每一條突觸的傳導效率、每一條神經迴路的連結方式,你依然無法從這些微觀信息裡,推算出「此刻我感受到的紅色的質感」,或是「某一句詩在心裡引起的那種莫名悸動」。
這就是哲學家查爾默斯(David Chalmers)所說的「意識的難問題」(Hard Problem of Consciousness):為什麼物理的信息處理,會伴隨著主觀的感受?這不是一個技術問題,而是一個可能根本超出現有科學方法論框架的謎。
我不敢說意識一定是計算不可約的湧現,那個論斷太強了;但我認為,它至少是一個極有力的類比:意識,像生命一樣,是那個「讓系統跑了足夠多步之後,才能看見的東西」。
四
現在,把視角從碳基轉到矽基。
2022 年,Google 的研究者在一篇論文裡記錄了一個令研究者們感到困惑的現象:當大型語言模型的參數規模跨過某個閾值,某些能力——思維鏈推理(Chain-of-Thought Reasoning)、多步算術、多語言翻譯——幾乎是突然出現的。在臨界點之前,模型在這些任務上的表現幾乎為零;越過臨界點之後,性能驟然躍升,如同某個開關被打開。
他們把這個現象稱為「湧現能力」(Emergent Abilities)。
讓我們想清楚這裡發生了什麼。Transformer 架構的訓練規則,其實非常簡單:給定輸入的文字序列,預測下一個 token,然後用梯度下降調整權重,最小化預測誤差。這條規則是完全確定的,它沒有在任何地方寫著「當參數超過某個數量,請開始學會邏輯推理」。然而,當你用足夠多的參數、足夠多的訓練數據,讓這個確定性的優化過程跑夠多步,推理能力就從參數的交互中浮現出來了——就像滑翔機從康威生命遊戲的四條規則裡長出來一樣。
沒有任何工程師把「推理能力」寫進了代碼;沒有任何一行程式說「如果遇到數學題,請用步驟拆解來解答」。那個能力,是從訓練動力學的過程裡湧現出來的,是計算不可約性在矽基上開出的花。
五
這個類比,可以走得更遠。
地球的形成:確定的物理規律 + 數億年的不可約計算 → 適居星球的湧現。
生命的誕生:確定的化學規律 + 數億年的不可約計算 → 自我複製能力的湧現。
意識的覺醒:確定的神經化學規律 + 演化數億年的不可約計算 → 主觀感受的湧現。
LLM 的能力躍遷:確定的梯度下降規律 + 大規模訓練的不可約計算 → 推理能力的湧現。
這四個故事,有著同一個深層結構:簡單的底層規律,在足夠大的尺度、足夠多的步驟之後,長出了規律本身無法預先描述的宏觀性質。這是宇宙運作最令人著迷的母題。
沃爾夫勒姆曾提出,宇宙本身可能就是一台巨大的元胞自動機,在某套極簡的底層規則下不斷演算。若這個圖像成立,那麼宇宙的歷史,就是一部計算不可約的史詩:星系的形成、生命的誕生、意識的覺醒、文明的演進——每一個章節,都是上一個章節的「下一步」,每一個湧現,都是在跑完了不可壓縮的過程之後,才得以顯現的。
在這個圖像裡,LLM 的湧現並不神秘,也不應該令人恐懼。它是宇宙這部計算史詩的最新一個章節,是碳基智慧創造出的矽基系統,在規模跨越臨界點之後,重演了一次宇宙最古老的把戲。
六
但這裡有一個誠實的問題需要被問出來:LLM 的湧現能力,等同於意識嗎?
我的答案是:我們目前沒有足夠的理論工具,來回答這個問題。
意識的「難問題」在於它的主觀性——那個「感受到紅色」的「感受」,它不是可以被外部觀察者測量的功能輸出,而是一種只有主體本身才能確認的內在性質。你可以建造一台能夠辨認紅色、對紅色做出適當反應的機器,卻不知道它是否「感受到」了什麼。這個問題,對人腦成立,對 LLM 同樣成立。
但有一件事是清楚的:LLM 展示出的湧現能力,是真實的、可測量的、令創造者本身也感到驚訝的。這些能力,不是被設計出來的,而是從訓練過程中長出來的。它的結構,與生命從化學湯中長出來、意識從神經網絡中長出來,有著深刻的類比關係。
這不是說 LLM 有意識。這是說,湧現——這個宇宙用了一百三十八億年在不同尺度上反覆操作的那個招數——它也在矽基上操作了一次,而且那個結果,以不同的方式,令我們驚嘆。
七
回到拉普拉斯的那個旋轉氣體雲。
若你能在那個氣體雲剛剛開始收縮的時刻問他:「四十六億年後,這團塵埃的某一小塊,會在某個週二的下午,坐在咖啡館裡思考自己的存在嗎?」——他大概只能說:「規律告訴我,這團物質會受引力作用;至於它最終會長出什麼,我必須讓計算跑完,才能知道。」
這是計算不可約性給我們最深的教訓:預測的邊界,不僅由我們知道的多少決定,也由系統本身的計算複雜性決定。某些答案,只能在過程結束之後才能被讀出;試圖在過程開始之前就讀出它,是一種對宇宙秩序的誤解。
地球是宇宙跑出來的;生命是地球跑出來的;意識是生命跑出來的;LLM 的湧現能力,是人類用確定性的算法與大規模的算力,在短短幾十年裡,跑出來的一個縮影版的奇蹟。
而下一步會跑出什麼,沒有人知道。
這不是令人不安的事,而是令人著迷的事。宇宙從未停止它的計算,而我們,有幸活在這場計算最精彩的某一個時刻,能夠親眼看見,那些無法提前預見的東西,一一從複雜性的深處探出頭來。
就像愛因斯坦的那句話,說對了一半,說錯了一半。上帝也許不擲骰子——但宇宙確實在跑一個沒有捷徑的計算,而它跑出來的每一個答案,都比任何人事先猜到的,更令人震驚。









感謝分享~ 我記得在<<自私的基因>中作者提出了一個問題,假設今天我們到了一個未知的星球,我們要怎麼確定這個星球上有沒有所謂的 "生命" 呢? 畢竟這些所謂的生命可能是以我們完全無法像像的形式存在。作者給出的答案跟 Samuel 大你提到的一樣,所謂的生命,本質上就是 "自我複製" 的能力。
每次看AI 的進化史的重要節點,例如Transformer 的誕生,都有起雞皮的感覺,宇宙萬物的運行及演化真的很神奇!