人民公園說AI

主播專欄

人民公園說AI主播專欄

強化學習爛透了,我們離AGI還要十年?|帶你解讀AI大神Karpathy重磅訪談

強化學習爛透了,我們離AGI還要十年?|帶你解讀AI大神Karpathy重磅訪談
JustSayAI

JustSayAI

我們現在談論的 AI Agent,90%是在假勤奮?

為什麼 Andrej Karpathy最近那兩個多小時、信息密度高到撐爆上下文窗口的訪談 如此重要?因為它給整個行業潑了一盆冷水:AGI 至少還要十年 。

這個判斷不是空穴來風,而是基於他最熟悉的自動駕駛領域 。十年前,Waymo 看起來“再有兩三年就行了” ;十年後的今天,我們發現它離真正的無人駕駛還差得遠 。

AI 行業最大的幻覺,就是把 Demo 的成功錯當成產品的勝利 。

99.9%的絕望:你永遠看不了那部電影

Karpathy提出了一個“9 的難題” (The problem of nines) 。一個產品能用(Demo),和這個產品可靠(Product),是兩個世界。99% 的可靠性,和 99.99999% 的可靠性,差異是天壤之別 。要真正替代人類,比如自動駕駛,你需要的是“九個 9”的穩定性 。

這個差距就像我們下載一部電影,進度條卡在 99.9% 。你覺得馬上就能看了,但沒有最後那 0.01%,這部電影你就永遠看不了 。

他寧願現在的模型“不聯網” 。因為大模型的核心機制是給你一個“最高概率的答案” ,它很難“知道自己不知道什麼” 。當一個“高概率”的垃圾信源進來時,災難就發生了。

吃垃圾:AI 現在的實現方式很“傻”

我們對 AI 技術的認知也有兩個巨大的反常識誤區。

第一個是“垃圾”。我們總覺得模型越大越好,動輒萬億參數。但Karpathy認為,現在的大模型都“太大了” 。它們之所以這麼臃腫,是因為被迫吃進去了海量的“互聯網垃圾數據” 。他甚至判斷,一個真正足夠智能的模型,可能只需要 100 億(10B)參數就夠了 。

第二個是“吸管”。我們都以為強化學習是 AI 的靈丹妙藥。Karpathy的觀點是:“強化學習其實很糟” (Reinforcement Learning is actually terrible) 。那為什麼大家都在用?因為“其他東西更糟” 。他用了一個絕妙的比喻:現在的強化學習,就像“用一根吸管去吸取監督信號” (using a straw to suck a supervision signal) 。你試圖用一種極其低效、帶寬極窄的方式,去獲取一個極其龐大、複雜的世界模型。

所以,別看現在的 AI 編碼工具很熱鬧,Karpathy直言,這些工具對他這種大神來說“根本不可用” 。因為他的代碼“過度抽象簡潔”,而 AI 只會用網上學來的“生產規範”和“垃圾代碼”來汙染它 。

智能的本質是“遺忘”,不是記憶

這就引出了最核心的觀點:我們對“智能”的定義可能從一開始就錯了。我們總以為,智能是“記得多”。AI 把所有數據都記住了,就是智能。錯了!

當前 AI 的實現方式是“傻”的,是“力大磚飛”。真正的智能,是“遺忘” 。

現在的模型“記憶力”太好了,能一字不差地背誦文章。這種對海量知識的“模糊回憶”(hazy recollection)反而成為一種負擔。人類的遺忘反而是一種“特性優勢”(feature not a bug),它逼迫我們去泛化。就像我們的大腦處理信息,靠的是“壓縮”和“遺忘” 。你不會記得小學每天發生的瑣事 ;幾十年後,你記住的只是“一個美好的小學階段”,或者“初戀的味道” 。大腦把細節全部遺忘,只留下了高度壓縮的“經驗”和“感覺” 。

這才是智能。

舉個不恰當的例子。很多小孩背書快,靠的不是逐字記憶,而是“圖片記憶法” 。我把整頁課文當成一張“快照” (snapshot) 拍下來,記住的是它的結構、段落分佈 ,而不是文字本身。

這恰好引出了Karpathy盛讚 DeepSeek OCR 的原因 。DeepSeek OCR 做的不是簡單的文字識別,它做的是“壓縮” 。它用處理圖像的方式,把 1000 個文字 Token 壓縮成了極少數的圖像 Token,同時保留了 97% 的信息準確度 。這才是“一圖勝千言” 。這也讓Karpathy得出一個推論:也許我們未來的模型,應該徹底轉向“用純圖像來訓練”,而不是現在的純文本 。

召喚“幽靈”,而非製造“智能”

所以,Karpathy的“幽靈論”到底是什麼意思?

他說,我們不是在“製造一隻動物”(Animal),而是在“召喚一個幽靈”(Ghost)。我理解“Animal”是某種硅基生物,是能獨立演化的物種 。而“幽靈”,是對人類已有知識和智能的一種“映射”和“複製” 。我們現在做的所有事——用垃圾數據餵它、用吸管訓練它、用蠻力堆參數——都是在試圖復刻這個幽靈。

但這也許不是終點。我更傾向於認為,這個“幽靈”真正的價值,在於它在映射人類智能的過程中,能夠“湧現”出我們人類自己都不具備的智能 。

諷刺的是,大模型被訓練出來尋找“最高概率的答案” ,但它自己卻很難“知道自己不知道什麼” 。或許Karpathy是對的,我們早就該把模型的網線拔了 。

真正的智能,是壓縮和遺忘。

【訂閱JustSayAI早晚報】

🌈新朋友!訂閱「JustSayAI早晚報」· 每日兩封 · 一鍵聽報 

🌟老朋友!加入會員獲取JustSayAI早晚報+深度研報+文字專欄

【主播小紅書】:

📕叫我小蘇就好啊

【關注頻道】:

▶️Youtube|📺B站|📕小紅書|📻Podcast

📱商務合作/聽友群:justsayai666

強化學習爛透了,我們離AGI還要十年?|帶你解讀AI大神Karpathy重磅訪談 | JustSayAI