【ITBEAR科技資訊】7月17日消息,近日,一道看似簡單的數(shù)學(xué)題“9.11和9.9哪個大?”在國外社交平臺上引起了廣泛關(guān)注。這道題不僅令國外的三大旗艦大模型ChatGPT 4o、谷歌Gemini Advanced和Claude 3.5 Sonnet紛紛“翻車”,也在國內(nèi)激起了一波測試熱潮。
網(wǎng)友們紛紛好奇,如果讓國內(nèi)的大模型來解答這道題,結(jié)果會是如何呢?于是,百度文心一言、阿里通義、騰訊元寶、字節(jié)豆包、百川智能百小應(yīng)、零一萬物萬知、智譜清言以及月之暗面的Kimi,還有好未來的九章大模型等9款大模型都被拉來答題。
測試結(jié)果令人驚喜,國內(nèi)大廠的大模型產(chǎn)品如騰訊元寶、阿里通義、字節(jié)豆包、百度文心一言,以及專注于數(shù)學(xué)的大模型九章都給出了正確答案。然而,幾款創(chuàng)業(yè)公司的大模型產(chǎn)品,包括百小應(yīng)、智譜清言、Kimi和萬知,卻都認(rèn)為“9.11大于9.9”,這顯然是一個錯誤的答案。
據(jù)ITBEAR科技資訊了解,在這次測試中,國內(nèi)大廠的大模型表現(xiàn)優(yōu)異,完勝了創(chuàng)業(yè)公司的大模型,甚至也超過了國外的三大旗艦?zāi)P汀_@無疑顯示了國內(nèi)大廠在人工智能領(lǐng)域的深厚實力和出色表現(xiàn)。
具體來看,Kimi、智譜清言、百小應(yīng)和萬知在回答這道題目時都出現(xiàn)了錯誤。而九章大模型、文心一言、通義、元寶和豆包則都給出了正確的答案,并且分析過程也十分準(zhǔn)確。這一結(jié)果無疑證明了國內(nèi)大廠在AI技術(shù)方面的領(lǐng)先地位和出色實力。