認真思考

認真思考

AI/ML

GenAI 演進之路:是什麼人,做了什麼決定,讓這一切成為可能

從深度學習到生成式 AI 的爆炸,背後有一群人在關鍵時刻做出了關鍵選擇。這篇文章試圖還原那些時刻,以及站在那些時刻前的人

Mar 17, 2026
∙ Paid

核心命題:三件事湊齊,世界才改變

在整個AI革命的背後,蘊藏著一個深刻的理念:模式預測可以引導智能。機器所感知或聽到的一切、它所執行的每個動作,甚至思想本身,都可以透過模式來理解。一旦機器學會預測這些模式,它便能創造出新的模式,進而模仿並常常超越人類的能力。

但「可以」和「真的做到」之間,隔著漫長的等待。

回頭看這二十年的AI發展,我認為有三件事必須同時成熟,GenAI才能引爆:夠深的模型架構、夠多的資料與算力、以及讓機器學會「人真正想要什麼」的對齊技術。這三件事,各自花了十年以上才找到正確的解法。而且每一個解法,都不是一個天才在某個夜晚靈光一現——而是一群人,在特定的機構、特定的時間節點,做出了看似平凡卻改變一切的選擇。

自然界在三個不同的層次上解決了學習問題。第一層是進化學習,它基於一個簡單的策略:嘗試隨機的變異,並保留那些能夠存活下來的變異。然而,這是一個極為緩慢的學習過程,跨越數代進行,難以適應生命中快速的環境變化。於是,自然界演化出了第二層學習,其速度快得多——利用大腦在個體的生命週期內適應行為。大腦使生物能夠進行隨機探索,並根據獎勵或痛苦的經驗,選擇更有效的行為,這便是所謂的強化學習。

早在 1960 年代,當時在 MIT 任職的 Donald Michie 就展示了他的第一台強化學習機器。這台機器利用火柴盒和彩色珠子來玩井字遊戲——機器贏了就在對應的火柴盒加入更多獲勝顏色的珠子,輸了就移除。透過這一簡單的基於獎勵的過程,機器逐漸發現了完美的遊戲策略。這些獲勝的策略並非透過編程預先設定,而是從經驗中自然湧現的。

這個原理,正是整個 AI 革命的哲學基石。它在 1960 年代就已成立——但接下來的五十年,我們缺的不是想法,而是讓想法得以實現的工具。


第一部分:地基——讓深度成為可能(2012–2017)

AlexNet:一個賭注,一張 GPU,一個翻轉

2012 年 9 月,多倫多大學的一個小團隊在 ImageNet 競賽上交出了一份成績單,讓整個電腦視覺領域沉默了幾秒鐘。

他們的錯誤率是 15.3%。第二名是 25.8%。

這不是小幅進步。這是斷崖式的跨越。

這個團隊由 Geoffrey Hinton 帶領,成員包括他的兩位博士生 Ilya Sutskever 和 Alex Krizhevsky。他們的模型叫 AlexNet,核心武器是:多層卷積神經網路,加上GPU運算,加上一個抑制過度擬合的技巧(Dropout)。

在此之前,電腦視覺的主流做法是手工設計特徵——工程師要明確告訴電腦「邊緣長這樣、紋理長那樣、耳朵的輪廓是這個形狀」。AlexNet 的做法是:給它看一千萬張圖,讓它自己找規律。

AlexNet

AlexNet 證明的不只是一個模型有多準確——它證明了「讓機器自己學特徵」這條路是對的。 這個消息讓整個產業的假設都需要重新來過。Ilya Sutskever 後來離開多倫多,成為 OpenAI 的共同創辦人;Hinton 在 2023 年離開 Google,公開表達對AI風險的憂慮——這個當年在多倫多相信神經網路的人,成為了後來最認真思考 AI 後果的人之一。


何愷明與 ResNet:讓深度變成超能力而非詛咒

AlexNet 打開了大門,但很快遇到了一堵牆:網路越深,訓練越難。

當你把神經網路疊到三十層、五十層,一個奇怪的現象出現了——網路變深,表現反而變差。這不是過度擬合,是更根本的問題:訓練時的梯度訊號在往回傳遞的過程中,逐層衰減,到了最前面幾層已經「聽不見」了。這個問題叫梯度消失,它讓「更深 = 更好」的假設在現實中碰壁。

2015年,一位在微軟亞洲研究院工作的中國研究員提出了一個看似簡單的解法。他叫何愷明,2003年廣東省高考第一名,清華大學本科,香港中文大學博士。他的解法叫做殘差連接(residual connection),又稱「捷徑連接(skip connection)」:在神經網路的每幾層之間,加一條「抄捷徑」的通道,讓原始輸入可以直接跳過那幾層傳到後面。

這樣一來,網路只需要學習「差異」(殘差)而不是完整的映射。梯度訊號可以沿著捷徑順暢流回最前面的層。結果:152 層的網路,可以被穩定訓練,而且越深越好。

何愷明與張翔宇、任少卿、孫劍共同署名的 ResNet 論文,在 2016 年的 CVPR 上獲得最佳論文獎,在 2020 和 2021 年連續成為 Google Scholar 全球引用量最高的論文。何愷明後來加入 FAIR,再轉往 MIT 擔任教授,現兼任 Google DeepMind 的傑出科學家。

User's avatar

Continue reading this post for free, courtesy of Samuel6788.

Or purchase a paid subscription.
© 2026 Samuel6788 · Privacy ∙ Terms ∙ Collection notice
Start your SubstackGet the app
Substack is the home for great culture