北京時間2月18日,科技界迎來了一場備受矚目的發布會,主角是埃隆·馬斯克和他的xAI公司。在這場發布會上,xAI推出了其最新的旗艦模型Grok-3系列以及配套的聊天機器人Grok。盡管xAI在這場AI競賽中屬于后來者,但憑借馬斯克的光環效應,其一舉一動都吸引了大量關注。
發布會現場氣氛熱烈,百萬觀眾在線圍觀。xAI團隊展示了Grok-3的卓越能力,從強大的數據集群到直接的評測數據對比,無一不彰顯著其“地表最強AI”的稱號。馬斯克此前對Grok-3的高度評價,在這一刻得到了直觀的印證。
在模型能力方面,Grok-3在推理、數學、代碼等多個領域都取得了顯著突破。在AIME和GPQA等基準測試中,Grok-3的表現超越了多個競品,包括o3 mini和DeepSeek-R1等。在大模型競技場LMSYS上,Grok-3的早期版本也位列第一,特別是在編碼類別中,它超越了o1和Gemini-thinking等頂級推理模型。

xAI團隊在發布會上現場演示了Grok-3的推理和創意編程能力。例如,它能夠生成一段從地球發射、著陸火星再到返回地球的3D動畫代碼,還能處理涉及推理能力的升級版俄羅斯方塊小游戲。這些演示充分展示了Grok-3的強大實力。
除了模型能力的升級,馬斯克還透露了Grok應用的新變化。Grok以Agent形式集成了DeepSearch、Think和Big Brain三種模式,針對用戶搜索場景提供編程、數學等高階能力。馬斯克還表示后續將上線語音交互、多模態交互等新功能,并成立AI游戲社區。
然而,Grok-3并不會立即向所有用戶開放。首批獲得解鎖權限的是X的Premium+訂閱用戶,而在Grok獨立的APP端也將推出會員服務“SuperGrok”,價格為每月30美元或每年300美元。

作為后發者,xAI能夠在不到一年的時間內推出Grok-3,充分展示了馬斯克“大力出奇跡”的優勢。然而,評估模型的實際能力和落地效果仍需看后續的產品功能情況。xAI能否在全球大模型競逐中脫穎而出,還有待時間的檢驗。
在發布Grok-3之前,xAI已經對Grok系列進行了多次迭代,并在推理、閱讀理解、數學、科學、寫代碼等方面展現出不錯的能力。同時,xAI也在不斷豐富其模型家族,發布多模態模型等。在商業模式上,xAI通過免費和開放API降低模型使用門檻,吸引更多用戶和企業。
盡管Grok-3表現出色,但xAI仍面臨諸多挑戰。在服務企業方面,Grok目前還沒有完備的能力;在C端市場,與X的集成度也有待提升。在外部競爭方面,隨著DeepSeek等中國模型公司的崛起以及OpenAI和Anthropic等競爭對手的快速發展,xAI需要不斷努力才能保持領先地位。






