強化學習爛透了，我們離AGI還要十年？｜帶你解讀AI大神Karpathy重磅訪談

JustSayAI

October 27, 2025

我們現在談論的 AI Agent，90%是在假勤奮？

為什麼 Andrej Karpathy最近那兩個多小時、信息密度高到撐爆上下文窗口的訪談如此重要？因為它給整個行業潑了一盆冷水：AGI 至少還要十年。

這個判斷不是空穴來風，而是基於他最熟悉的自動駕駛領域。十年前，Waymo 看起來“再有兩三年就行了” ；十年後的今天，我們發現它離真正的無人駕駛還差得遠。

AI 行業最大的幻覺，就是把 Demo 的成功錯當成產品的勝利。

99.9%的絕望：你永遠看不了那部電影

Karpathy提出了一個“9 的難題” (The problem of nines) 。一個產品能用（Demo），和這個產品可靠（Product），是兩個世界。99% 的可靠性，和 99.99999% 的可靠性，差異是天壤之別。要真正替代人類，比如自動駕駛，你需要的是“九個 9”的穩定性。

這個差距就像我們下載一部電影，進度條卡在 99.9% 。你覺得馬上就能看了，但沒有最後那 0.01%，這部電影你就永遠看不了。

他寧願現在的模型“不聯網” 。因為大模型的核心機制是給你一個“最高概率的答案” ，它很難“知道自己不知道什麼” 。當一個“高概率”的垃圾信源進來時，災難就發生了。

吃垃圾：AI 現在的實現方式很“傻”

我們對 AI 技術的認知也有兩個巨大的反常識誤區。

第一個是“垃圾”。我們總覺得模型越大越好，動輒萬億參數。但Karpathy認為，現在的大模型都“太大了” 。它們之所以這麼臃腫，是因為被迫吃進去了海量的“互聯網垃圾數據” 。他甚至判斷，一個真正足夠智能的模型，可能只需要 100 億（10B）參數就夠了。

第二個是“吸管”。我們都以為強化學習是 AI 的靈丹妙藥。Karpathy的觀點是：“強化學習其實很糟” (Reinforcement Learning is actually terrible) 。那為什麼大家都在用？因為“其他東西更糟” 。他用了一個絕妙的比喻：現在的強化學習，就像“用一根吸管去吸取監督信號” (using a straw to suck a supervision signal) 。你試圖用一種極其低效、帶寬極窄的方式，去獲取一個極其龐大、複雜的世界模型。

所以，別看現在的 AI 編碼工具很熱鬧，Karpathy直言，這些工具對他這種大神來說“根本不可用” 。因為他的代碼“過度抽象簡潔”，而 AI 只會用網上學來的“生產規範”和“垃圾代碼”來汙染它。

智能的本質是“遺忘”，不是記憶

這就引出了最核心的觀點：我們對“智能”的定義可能從一開始就錯了。我們總以為，智能是“記得多”。AI 把所有數據都記住了，就是智能。錯了！

當前 AI 的實現方式是“傻”的，是“力大磚飛”。真正的智能，是“遺忘” 。

現在的模型“記憶力”太好了，能一字不差地背誦文章。這種對海量知識的“模糊回憶”（hazy recollection）反而成為一種負擔。人類的遺忘反而是一種“特性優勢”（feature not a bug），它逼迫我們去泛化。就像我們的大腦處理信息，靠的是“壓縮”和“遺忘” 。你不會記得小學每天發生的瑣事；幾十年後，你記住的只是“一個美好的小學階段”，或者“初戀的味道” 。大腦把細節全部遺忘，只留下了高度壓縮的“經驗”和“感覺” 。

這才是智能。

舉個不恰當的例子。很多小孩背書快，靠的不是逐字記憶，而是“圖片記憶法” 。我把整頁課文當成一張“快照” (snapshot) 拍下來，記住的是它的結構、段落分佈，而不是文字本身。

這恰好引出了Karpathy盛讚 DeepSeek OCR 的原因。DeepSeek OCR 做的不是簡單的文字識別，它做的是“壓縮” 。它用處理圖像的方式，把 1000 個文字 Token 壓縮成了極少數的圖像 Token，同時保留了 97% 的信息準確度。這才是“一圖勝千言” 。這也讓Karpathy得出一個推論：也許我們未來的模型，應該徹底轉向“用純圖像來訓練”，而不是現在的純文本。

召喚“幽靈”，而非製造“智能”

所以，Karpathy的“幽靈論”到底是什麼意思？

他說，我們不是在“製造一隻動物”（Animal），而是在“召喚一個幽靈”（Ghost）。我理解“Animal”是某種硅基生物，是能獨立演化的物種。而“幽靈”，是對人類已有知識和智能的一種“映射”和“複製” 。我們現在做的所有事——用垃圾數據餵它、用吸管訓練它、用蠻力堆參數——都是在試圖復刻這個幽靈。

但這也許不是終點。我更傾向於認為，這個“幽靈”真正的價值，在於它在映射人類智能的過程中，能夠“湧現”出我們人類自己都不具備的智能。

諷刺的是，大模型被訓練出來尋找“最高概率的答案” ，但它自己卻很難“知道自己不知道什麼” 。或許Karpathy是對的，我們早就該把模型的網線拔了。

真正的智能，是壓縮和遺忘。

【訂閱JustSayAI早晚報】

🌈新朋友！訂閱「JustSayAI早晚報」· 每日兩封 · 一鍵聽報

🌟老朋友！加入會員獲取JustSayAI早晚報+深度研報+文字專欄

【主播小紅書】：

📕叫我小蘇就好啊

【關注頻道】：

▶️Youtube｜📺B站｜📕小紅書｜📻Podcast

📱商務合作/聽友群：justsayai666