人民公園說AI

主播專欄

人民公園說AI主播專欄

特斯拉解散 Dojo 超級計算機團隊,這背後原因有哪些?

特斯拉解散 Dojo 超級計算機團隊,這背後原因有哪些?
JustSayAI

JustSayAI

我必須承認,當馬斯克突然宣佈砍掉整個Dojo團隊時,我的第一反應是:這是假新聞嗎? 這可不是小打小鬧,這是一個投入了數年、耗費了數十億美金、在每一季財報裡都被寄予厚望的“親兒子”。用一個不那麼恰當但足夠形象的比喻,這無異於一箇中年男人,在事業巔峰期,親手割掉了自己的一個腎。你得想象一下,這有多疼。

但這絕不是一次簡單的戰略收縮,更不是一次愚蠢的投資失敗。這是一次痛苦、決絕、但又無比理性的“獻祭”。馬斯克揮刀砍向的,不僅僅是一個落後英偉達四代、已然走進“進化死衚衕”的自研芯片項目 ,更是向整個行業宣告:基於純粹大語言模型(LLM)的舊神正在黃昏,一個名為“世界模型”(World Model)的新神,即將降臨。特斯拉,或者說馬斯克的整個AI帝國,正在完成一次架構上的“換腦手術”,一次從大腦到身體的徹底解耦。

語言模型的黃昏:六指“幻覺”與架構的盡頭

讓我們先談談那個被獻祭的“舊神”——大語言模型。我們必須面對一個殘酷的現實:LLM的進化正在明顯見頂。別看GPT-5鬧得沸沸揚揚,但它相較於前代,並沒有帶來“從3.5到4”那樣的飛躍式突破,面對Grok和Claude,也只是微弱勝出。這背後,是架構的根本性瓶頸。

一個流傳甚廣的“六指測試”絕妙地揭示了LLM的軟肋:

你給GPT-5一張P過的六指手掌照片,它會無比堅定地告訴你,這是五個手指。 它甚至會幫你把“正確的”五根手指標出來,而對那多出來的第六指視而不見,將其當成背景。這不是蠢,這是它世界觀的底層缺陷。LLM的世界是靠海量文本“學習”來的,它擁有龐大的知識,卻沒有真實的常識。 它的認知裡,“人有五指”是一條鐵律,當現實與它的知識庫衝突時,它選擇相信知識,而不是相信現實。

這個問題,無法通過堆砌更多的數據和算力來解決。

LLM這種純粹基於語言符號的二維壓縮模式,在理解和交互三維物理世界時,存在著不可逾越的鴻溝。就像王興興所言,機器人端的模型根本用不上預訓練的那些數據,也像李飛飛那句充滿哲學意味的斷言:“世界是三維的”。語言,終究只是三維世界在我們二維認知裡的一個扁平投影。

世界模型降臨:當AI睜眼看見三維真實

正當LLM在二維世界裡卷生卷死時,Google DeepMind發佈的Genie 3,為我們展示了通往三維世界的大門。它不再滿足於閱讀文字,而是通過觀看海量的視頻,以無監督的方式,自己“悟”出了一個可以交互、遵循物理規律、並且在時空上保持一致性的虛擬3D世界。

這與LLM是根本性的不同。它像AlphaZero不依賴人類棋譜、自我博弈進化一樣,Genie 3正在擺脫人類語言的“標籤”束縛,直接從像素中理解世界的運轉方式。視頻中的塗鴉,在你轉了一圈後回來,它依然在那裡;它能以每秒24幀的速度連續生成一分鐘以上的流暢視頻,每一幀都經過回溯計算,確保了驚人的物理一致性。

這才是具身智能的未來。過去,我們把機器人扔進真實世界裡,通過一次次昂貴的碰撞去積累經驗;而現在,我們可以在世界模型裡,以接近零的邊際成本,讓無數個智能體24小時不間斷地進行虛擬訓練。

這也解釋了馬斯克為何要“換腦”——將“大腦”的預訓練(交給X.AI和英偉達的通用能力)與“身體”的端側推理(數百萬輛特斯拉和機器人組成的真實世界數據採集器)徹底分開。大腦在上奧數班,身體則在練體育搏擊,專業分工,效率至上。

道與術之爭:真正的分野不在算力,而在模型之魂

所以,Dojo的死亡,並非特斯拉一家的得失,而是整個AI行業從“術”的競爭轉向“道”的競爭的標誌性事件。]過去,我們比拼的是誰的參數更多、算力更猛,這是“術”的層面。而現在,真正的分野在於你選擇了哪條路,你的模型之魂是什麼——是停留在二維語言的LLM,還是擁抱三維真實的World Model?

馬斯克已經用割掉一個“腎”的慘痛代價,給出了他的答案。他選擇放棄在“術”的層面與英偉達進行低效的追趕,而將所有賭注押在“道”的革新上。他要的,是一個能與物理世界深度交互、不斷採集高質量真實數據的“身體”,而“大腦”則可以採用開放市場上最強的方案。這是一種更聰明、也更務實的策略。

黃仁勳的甜蜜煩惱

聊到這裡,就不得不提那個皮衣下永遠一身汗的男人——黃仁勳。 Dojo死了,最大的贏家看起來是他。但這背後,或許是更甜蜜的煩惱。無論是LLM還是World Model,都像饕餮巨獸般吞噬著算力,這讓英偉達和臺積電在短期內穩坐釣魚臺。 但真正的變革在於,市場的天平正在從“訓練”端向“推理”端急劇傾斜。過去,客戶是少數幾家巨頭;未來,每一個智能終端背後,都可能是一個推理芯片的新客戶。蛋糕的切法,已經變了。

說到底,馬斯克只是提前看到了語言的盡頭。那個由文字和符號構建的精妙世界,終究只是一個“平面國”。

告別語言的平面國,世界終歸是三維的。

觀點整理自我的播客:人民公園說AI

👉訂閱「JustSayAI早晚報」· 每日兩封 · 一鍵聽報:https://justsayai.org/newsletter (需科學上網)

【關注頻道】:

📺B站:叫我小蘇就好啊

📕小紅書:人民公園說AI

▶️油管:人民公園說AI