【ITBEAR科技資訊】7月17日消息,近日,一道看似簡單的數學題“9.11和9.9哪個大?”在國外社交平臺上引起了廣泛關注。這道題不僅令國外的三大旗艦大模型ChatGPT 4o、谷歌Gemini Advanced和Claude 3.5 Sonnet紛紛“翻車”,也在國內激起了一波測試熱潮。
網友們紛紛好奇,如果讓國內的大模型來解答這道題,結果會是如何呢?于是,百度文心一言、阿里通義、騰訊元寶、字節豆包、百川智能百小應、零一萬物萬知、智譜清言以及月之暗面的Kimi,還有好未來的九章大模型等9款大模型都被拉來答題。
測試結果令人驚喜,國內大廠的大模型產品如騰訊元寶、阿里通義、字節豆包、百度文心一言,以及專注于數學的大模型九章都給出了正確答案。然而,幾款創業公司的大模型產品,包括百小應、智譜清言、Kimi和萬知,卻都認為“9.11大于9.9”,這顯然是一個錯誤的答案。
據ITBEAR科技資訊了解,在這次測試中,國內大廠的大模型表現優異,完勝了創業公司的大模型,甚至也超過了國外的三大旗艦模型。這無疑顯示了國內大廠在人工智能領域的深厚實力和出色表現。
具體來看,Kimi、智譜清言、百小應和萬知在回答這道題目時都出現了錯誤。而九章大模型、文心一言、通義、元寶和豆包則都給出了正確的答案,并且分析過程也十分準確。這一結果無疑證明了國內大廠在AI技術方面的領先地位和出色實力。






