人民公園說AI

主播專欄

人民公園說AI主播專欄

Gemini3前瞻:Google能否遙遙領先?

Gemini3前瞻:Google能否遙遙領先?
JustSayAI

JustSayAI

別等Gemini 3了,Google根本沒那個產品基因

講真!我對即將發佈的Gemini 3,在產品層面毫無期待。但,技術上我從不懷疑Google,它就像《天龍八部》裡的段譽,內力無窮,但偏偏就是使不好六脈神劍,時靈時不靈。 

特別是Google,根據我的研究,Google一個產品的水平,基本上取決於它的組織能力整合到了哪一步…就像發佈Nano Banana之前,DeepMind和Gemini團隊狠狠愛了一把一樣…你懂的。

一堆王炸,打成散牌

Google手裡究竟有多少牌?世界模型Veo 3、原生多模態Gemini、“電腦控制工具”Gemini CLI、瀏覽器控制工具Chrome MCP、端側模型Gemma。 任何一張單拎出來都是王炸,每一個拿出來都很強。 問題是,對於一個普通用戶,你給我九把絕世神劍,我根本不知道什麼時候該用哪一把,更別提如何組合運用了。 

這就是Google的現狀:今天這個團隊放一個工具,明天那個團隊放一個,彼此之間沒有統一的節奏。 用戶的真實痛點是,我想用你的編碼能力,卻發現最好用的還是那個獨立的CLI工具,而且迭代還沒別人快,最後只能拿來做代碼審查打個輔助。 這種體驗,就像被反覆侮辱智商。 

相比之下,OpenAI總能把一些即便不是技術最領先的東西,包裝成用戶最想要的樣子,製造出aha moment。 這就是產品基因的差距。Google擁有幾乎所有的底層能力,但它沒有一個產品化的界面,把這些能力“翻譯”成普通人能理解和使用的東西。 

Gemini3預測:從底層控制全世界的模型

當然,段譽的內力是實打實的。Google最近放出的computer use能力,就完美展現了這種技術上的降維打擊。 

所有其他廠商做類似功能,都必須基於瀏覽器開放的接口去操作,相當於隔著一層。 但Google自己就是瀏覽器的擁有者,它可以從最底層、最原生的地方去控制,穩定性和準確度遠超對手。 更絕的是,它甚至不需要像人類一樣通過視覺去理解界面上的圖標和按鈕,而是直接在數據源層面進行分析和操作,效率高出無數倍。 

所以大膽預測一下,Gemini 3的核心功能將是其computer use能力的正式亮相與深度整合 (Kimi笑了)。這不會是一個簡單的功能,而是基於谷歌對Chrome瀏覽器的底層原生控制+Gemini CLI對電腦控制的經驗,實現遠超競品的穩定性和效率 。Gemini3很可能徹底整合成一個統一、多模態的超級Agent,實現從操作系統到網頁應用的全流程自動化 。

Kimi說我發早了?!

ToB才是Google的真愛?

好了,說回來,畢竟是YY,實際上大家打5折去期待就好。

Google畢竟是一家非常成功的商業公司,它要對股東和股價負責。 所以,將重心放在ToB(企業服務)是它必然且無比正確的選擇。 最近宣佈5年內向印度的AI基礎設施中心豪擲150億美金,就是最明確的信號。 在那邊,Google Cloud紮根,跑的自然是Gemini,服務的核心是企業客戶,大家也可以從最近Gemini for enterprise上的agent space上窺見一二。 

它和OpenAI的角色定位完全不同。OpenAI需要扮演創新者和領先者的角色,必須在ToC(消費者)市場掀起波瀾。 而Google則是在自己的商業帝國裡,小心翼翼地平衡著既有的搜索業務和新興的AI能力之間的衝突。  這種內部的撕裂和分裂是必然的,也註定了它無法像一個初創公司那樣,在ToC市場輕裝上陣、大殺四方。

所以,我的建議是……讓奧特曼同志先走

既然產品上沒有基因,組織上又充滿掣肘,那最聰明的策略是什麼?很簡單:你就做好技術,然後看山姆·奧特曼怎麼走,你比他晚一週發佈就好了。 

讓他先去趟雷,讓他去教育市場,讓他把產品的最佳形態定義出來。  等他驗證成功了,Google再憑藉自己深厚的內力,用更強的技術、更低的成本去實現。這雖然聽起來有些“不體面”,但對於一個龐大而笨拙的巨人來說,卻是最穩妥、最高效的生存之道。

六脈神劍,得神仙姐姐遇險才好使!

【主播小紅書】:📕叫我小蘇就好啊

【關注頻道】:

▶️Youtube|📺B站|📕小紅書|📻Podcast

【訂閱JustSayAI早晚報】

🌈新朋友!訂閱「JustSayAI早晚報」· 每日兩封 · 一鍵聽報 

🌟老朋友!加入會員獲取JustSayAI早晚報+深度研報+文字專欄

Gemini3前瞻:Google能否遙遙領先? | JustSayAI