【ITBEAR】在萬眾矚目的新加坡OpenAI開發者日活動中,ChatGPT再度展現了其非凡的實力。最新版本的ChatGPT-4o(簡稱4o)在備受關注的大模型競技場中一舉奪魁,將此前占據榜首的Gemini拉下了馬。
此次4o的更新重點在于“創意寫作能力”,據官方介紹,新版本能夠生成更加自然、吸引人且有針對性的文本,顯著提升了文本的相關性和可讀性。4o在處理上傳文件方面也進行了優化,能夠提供更深入的見解和更全面的回應。
o1的核心貢獻者Karina Nguyen對此次更新表示了肯定。她指出,作為Canvas功能的一部分,改進寫作是一個頂級用例,有望改變人機協作的方式,讓創作過程更具創造性。盡管她承認這一研究問題非常主觀且開放,但至少在寫作方面取得的進展對于實現AGI(通用人工智能)的創造性智能至關重要。
在大模型競技場的創意寫作分榜上,新版4o(ChatGPT-4o-1120)的得分從上一個版本的1365躍升至1402,進步顯著。同時,在代碼能力、數學能力、困難任務以及風格控制等多個方面,4o也均有所提升,成功從之前的第二名躍升至第一名。
然而,盡管4o的表現亮眼,但網友們對于OpenAI遲遲未推出o1滿血版仍表示不滿。一些網友在社交媒體上直言,希望OpenAI能夠盡快放出o1,與近期備受矚目的DeepSeek等模型進行正面較量。甚至有網友調侃稱,OpenAI的更新策略似乎就是每當有其他模型登上榜首時,便迅速推出新版本奪回第一。
盡管4o在創意寫作方面取得了顯著進步,但仍有網友對其生成的內容進行了測試,并發現系統仍能夠準確識別出這些內容為AI所寫。不過,也有網友對4o的更新進行了深入研究,并發現OpenAI在系統提示詞方面進行了優化,新增了一道護欄,以確保ChatGPT在敏感話題上不會胡說八道。
目前,新版4o已在大模型競技場中上線,感興趣的讀者可以前往體驗并分享自己的感受。對于未來OpenAI是否會推出o1滿血版,以及它將如何與其他模型進行競爭,我們拭目以待。