在人工智能領(lǐng)域的一次重大飛躍中,OpenAI于近日悄然推出了其最新的聊天模型——GPT-4.5,這一消息迅速在科技圈內(nèi)引起了轟動(dòng)。
據(jù)OpenAI官方介紹,GPT-4.5被定位為迄今為止最大且最優(yōu)秀的聊天模型。初步測試結(jié)果顯示,該模型與人類用戶的交互體驗(yàn)更加自然流暢,知識(shí)庫覆蓋面廣泛,并且具備高度的情商,能夠敏銳捕捉到用戶言語中的微妙暗示。這些特性使得GPT-4.5在寫作、設(shè)計(jì)、編程等多個(gè)方面展現(xiàn)出了前所未有的強(qiáng)大能力。
OpenAI的首席執(zhí)行官薩姆·阿爾特曼雖然因個(gè)人事務(wù)未能親自出席發(fā)布會(huì),但在社交平臺(tái)上難掩興奮之情,他贊嘆道:“這是第一個(gè)讓我感覺像是在和一個(gè)有思想的人交談的模型。”阿爾特曼還特別指出,GPT-4.5并非專注于推理的模型,也不會(huì)在基準(zhǔn)測試中占據(jù)壓倒性優(yōu)勢,但它所展現(xiàn)的智能類型卻包含著前所未有的奇妙元素。
GPT-4.5的一大亮點(diǎn)在于其能夠通過搜索訪問最新信息,并支持文件和圖像的上傳功能,用戶還可以在畫布上進(jìn)行編寫和代碼操作。然而,目前該模型尚不支持ChatGPT中的語音模式、視頻和屏幕共享等多模式功能。
值得注意的是,GPT-4.5的訓(xùn)練數(shù)據(jù)截止日期與之前的GPT-4o、o1、o3等版本相同,均為2023年10月。但在API價(jià)格方面,GPT-4.5卻出現(xiàn)了驚人的漲幅,每百萬Tokens的價(jià)格高達(dá)75美元,是GPT-4o的30倍之多。盡管價(jià)格高昂,OpenAI仍強(qiáng)調(diào)GPT-4.5并不能完全替代GPT-4o。
與DeepSeek的正常價(jià)格相比,GPT-4.5的輸入價(jià)格更是高達(dá)280倍,即便是與DeepSeek前幾天發(fā)布的API淡季折扣價(jià)相比,GPT-4.5的輸入價(jià)格(緩存命中)也高出1000多倍。這一價(jià)格策略無疑為GPT-4.5的廣泛應(yīng)用設(shè)置了一道門檻。
從用戶體驗(yàn)的角度來看,GPT-4.5展現(xiàn)出了高情商的一面。它能夠感知到用戶的沮喪情緒,并給出更具人情味的回應(yīng)。例如,當(dāng)用戶因考試不及格而沮喪時(shí),GPT-4.5會(huì)給予安慰并引導(dǎo)用戶交流,而GPT-4o則可能只會(huì)提供一堆冰冷的文字建議。
GPT-4.5在解決復(fù)雜問題時(shí)也表現(xiàn)出了更好的理解人類需求和意圖的能力。OpenAI基于新的可擴(kuò)展技術(shù),使用來自較小模型的數(shù)據(jù)來訓(xùn)練更大、更強(qiáng)大的模型,這些技術(shù)提高了GPT-4.5的可操控性,使其能夠更好地理解細(xì)微差別并展開自然對話。
在準(zhǔn)確性、幻覺測試等方面,GPT-4.5的性能表現(xiàn)也優(yōu)于GPT系列的其他版本。同時(shí),它在多語言性能方面也展現(xiàn)出了優(yōu)勢,OpenAI使用專業(yè)翻譯人員將MMLU的測試集翻譯成14種語言,GPT-4.5在這些語言上的表現(xiàn)均優(yōu)于GPT-4o。
然而,盡管GPT-4.5在多個(gè)方面表現(xiàn)出色,但它并不能完全替代其他模型。在評估AI模型解決現(xiàn)實(shí)世界軟件問題能力的基準(zhǔn)測試SWE-Bench Verified中,GPT-4.5的能力雖然超過了GPT-4o,但仍然低于o1、o3-mini和深度研究。
隨著GPT-4.5的推出,OpenAI也展示了其在人工智能領(lǐng)域的持續(xù)創(chuàng)新能力。該模型不僅提升了用戶體驗(yàn),還為人工智能與人類協(xié)作的潛力開辟了更廣闊的空間。然而,高昂的價(jià)格也成為其廣泛應(yīng)用的一大挑戰(zhàn)。






