人工智能領(lǐng)域近期迎來了一場引人矚目的較量,兩大科技巨頭OpenAI與谷歌DeepMind紛紛宣布,它們各自的AI模型在國際數(shù)學(xué)奧林匹克競賽(IMO)中取得了金牌佳績,這一成就標(biāo)志著AI系統(tǒng)在邏輯推理能力上的顯著飛躍。
IMO作為歷史悠久且難度極高的數(shù)學(xué)競賽,一直是衡量AI推理能力的標(biāo)尺。去年,谷歌的AI系統(tǒng)在IMO中榮獲銀牌,但需借助人工輔助。今年,OpenAI與谷歌分別推出了更加自主的AI系統(tǒng),這些系統(tǒng)能直接從數(shù)學(xué)問題中提取關(guān)鍵信息,并生成邏輯嚴(yán)密的解答,無需人工介入。兩家公司均表示,它們的AI模型在六道題中正確解答了五道,超越了多數(shù)高中生的水平,也超越了谷歌去年的成績。
在談及這一突破時,兩家公司的研究人員均強調(diào)了AI推理模型在復(fù)雜、非確定性問題上的進(jìn)步。傳統(tǒng)AI模型在解決答案明確的問題上表現(xiàn)出色,但在面對解決方案不確定的任務(wù)時則力不從心。此次IMO競賽中的表現(xiàn),展示了AI在推理能力上的新高度。
然而,關(guān)于金牌成績的公布,兩家公司卻產(chǎn)生了不小的分歧。OpenAI在周六率先宣布了其AI模型的金牌成績,這一舉動遭到了谷歌DeepMind的強烈質(zhì)疑。谷歌DeepMind的負(fù)責(zé)人表示,他們選擇等待官方結(jié)果的公布,以尊重參賽學(xué)生,并已與IMO組織者合作,確保測試的公正性。谷歌在周一上午才正式公布了官方結(jié)果,并獲得了IMO主席和官方評分的認(rèn)可。谷歌方面強調(diào),任何未基于官方評分標(biāo)準(zhǔn)的評估,都不能聲稱達(dá)到金牌水平。
OpenAI方面則回應(yīng)稱,他們并未得知IMO與谷歌進(jìn)行的非正式測試。OpenAI聘請了三位前IMO獎牌獲得者作為第三方評估員,對AI模型的表現(xiàn)進(jìn)行了評估。在得知金牌成績后,OpenAI曾聯(lián)系IMO,但被告知等到頒獎典禮結(jié)束后再公布結(jié)果。然而,OpenAI最終還是選擇了提前公布。
這場爭論背后,是AI領(lǐng)域技術(shù)的飛速發(fā)展。在今年的IMO競賽中,全球頂尖的高中生齊聚一堂,但僅有少數(shù)人的成績能與OpenAI和谷歌的AI模型相媲美。這表明,OpenAI在AI領(lǐng)域的領(lǐng)先地位正受到前所未有的挑戰(zhàn)。隨著OpenAI即將發(fā)布GPT-5,如何在激烈的競爭中保持領(lǐng)先,成為了其當(dāng)前面臨的關(guān)鍵問題。






