馬斯克 狂吹的 Grok 3,終于發布了

埃隆·馬斯克旗下的人工智能初創公司xAI發布最新版Grok 3聊天機器人,同OpenAI和DeepSeek等大模型展開新一輪競爭。馬斯克曾多次將Grok 3描述為“地球上最聰明的人工智能”,在上線之前便引起了業界的廣泛關注。
馬斯克表示,Grok 3首先面向X的Premium Plus 訂閱用戶開放,他們將作為首批體驗者。此外,xAI還為忠實粉絲推出了名為Super Grok的獨立訂閱服務,提供最先進的功能和最早的新特性訪問權限。
xAI表示,Grok 3的預訓練已經完成,整個團隊一直在積極地將推理能力整合到當前的Grok 3模型中。然而,這種集成仍處于早期階段,需要更多的改進。Grok 3目前正在繼續接受訓練。
除了Grok 3推理模型外,xAI還在訓練一個該推理模型的迷你版。可以將Grok 3的推理數據與迷你推理模型進行對比,有時其后者的表現甚至會略微優于Grok 3推理模型。

01 號稱性能超越DeepSeek和ChatGPT
在發布會上,馬斯克表示,xAI 之所以將其聊天機器人命名為Grok,是因為這個詞源自美國科幻作家 羅伯特·海因萊因的小說 《異鄉異客》(Stranger in a Strange Land)。在書中,“Grok” 由一位在火星上長大的角色使用,意指對某事物全面且深刻的理解。
馬斯克和他的人工智能團隊聲稱,Grok 3測試版的推理能力超過了現有的人工智能模型。在有關推理和測試時間的基準測試中,Grok 3取得了比DeepSeek-R1、OpenAI o1、OpenAI o3 mini- high、Gemini-2 Flash Thinking更優的效果。

根據xAI的比較基準顯示,Grok 3在科學、編碼和數學方面的得分高于Gemini 2 Pro、Deepseek V3、ChatGPT 4o等。并且,在盲測方面,xAI的Grok-3(早期版本) 在 lmArena 排行榜中以1402 分的歷史最高成績登頂,成為首個突破1400分的AI模型。這一成績超越了Google、OpenAI、DeepSeek等業界主要競品。

02 122天打造AI超算中心,使其性能翻倍
在演示過程中,馬斯克和xAI的幾位高管分享了他們如何構建Grok。馬斯克透露,由于xAI希望盡快推出Grok 3,時間非常緊迫。因此,他們意識到必須在短短四個月內建成數據中心。
xAI表示,他們花了122天讓首批10萬顆GPU上線并運行,這是目前全球最大的全連接H100集群。隨后,xAI進一步加速擴建數據中心,僅用92天便完成第二階段建設,使計算能力再次翻倍(依此計算約有20萬塊GPU)。
xAI團隊還展示了Grok 3如何執行有趣的任務。例如計算從地球到火星的航天器任務。Grok 3 生成了一張太空發射的動畫 3D 軌跡圖(即從地球到火星然后再返回地球的可行軌跡)。這涉及一些復雜的物理知識,Grok 3需要理解這些內容。
Grok 3還展示了在自動化游戲開發方面的潛力。xAI團隊要求Grok 3現場創造一款融合《俄羅斯方塊》和《寶石迷陣》的新游戲。Grok 3生成的Python腳本定義了游戲的常量、顏色、方塊形狀等元素,并呈現出獨特玩法:當連接了至少三個相同顏色的方塊時,會觸發重力機制使方塊消除,這種方式類似《寶石迷陣》。

此外,Grok 3包含一個名為Big Brain的功能,這是一個推理模型模式,允許在處理查詢時進行更深入的思考。馬斯克指出,17個月前,最初的Grok模型幾乎不能解決高中問題,而現在它已經進步了很多,他幽默地比喻“Grok已經準備好上大學了”。
03 開發深度搜索功能、考慮開源Grok 2
除了推出 Grok 3 之外,xAI 還透露,該公司正在籌建一家人工智能游戲工作室,該工作室將專注于為消費者提供服務。
此外,xAI正在為Grok開發深度搜索功能(DeepSearch)。這將成為其AI智能體的核心能力之一。DeepSearch是一款推理聊天機器人,能夠闡述其理解查詢內容的過程以及規劃回復的方式。演示顯示,DeepSearch具有研究、頭腦風暴和數據分析等功能。馬斯克團隊還表示,他們打算“盡快”推出一款基于語音的聊天機器人。
對于Grok 3是否會開源,馬斯克表示,“我們通常會在新模型發布的時候,開源上一代模型,所以幾個月后,我們也會對Grok 2進行開源。”
隨著Grok-3不斷刷新紀錄,人工智能競賽正加速升溫。xAI通過強化推理能力、構建超大算力集群,并在游戲等應用領域進行實驗性探索,正快速躋身DeepSeek、ChatGPT 等頭部大模型的競爭行列。Grok-3 的持續迭代表明,AI競賽不僅未見終點,反而正在進入更激烈的階段。



