【ITBEAR科技資訊】5月14日消息,OpenAI最新公布了其旗艦生成式AI模型GPT-4o,并計劃向所有用戶免費提供,ChatGPT Plus用戶將在未來幾周內(nèi)優(yōu)先體驗。
GPT-4o,其中的“o”蘊(yùn)含著“omni”即全面、全能的含義。這款模型被視為人機(jī)交互更自然化的重要進(jìn)步,因為它不僅能處理文本,還能接受音頻和圖像的各種組合輸入,并產(chǎn)生相應(yīng)的組合輸出。這種跨模態(tài)的交互能力,無疑將為用戶帶來更為豐富和直觀的AI體驗。

據(jù)ITBEAR科技資訊了解,GPT-4o的反應(yīng)速度令人印象深刻,它能在232毫秒內(nèi)對音頻輸入做出回應(yīng),平均反應(yīng)時間為320毫秒,這與人類在自然對話中的反應(yīng)時間非常接近。在性能上,GPT-4o在英語和代碼文本方面的表現(xiàn)與GPT-4 Turbo旗鼓相當(dāng),同時在非英語文本處理上也有顯著提升。更新模型在API調(diào)用上更為迅速,而且價格降低了50%,這無疑將極大地提升其市場競爭力。在視覺和音頻理解方面,GPT-4o展現(xiàn)出了卓越的性能,明顯優(yōu)于現(xiàn)有的其他模型。
OpenAI介紹,使用GPT-4o時,ChatGPT免費版用戶將能體驗到更多高級功能,如GPT-4級別的智能交互,從模型和網(wǎng)絡(luò)中獲取回復(fù),利用數(shù)據(jù)創(chuàng)建圖表,基于拍攝的照片進(jìn)行對話,以及上傳文件以獲取總結(jié)、撰寫或分析等。
在預(yù)熱階段,OpenAI的CEO阿爾特曼就對GPT-4o寄予了高度評價,形容它“像魔法一樣”。他甚至在一次采訪中表示,希望最終能開發(fā)出像科幻電影《她》中的那種AI助理,實現(xiàn)更為深入和自然的人機(jī)交互。

此次發(fā)布的新模型也引發(fā)了業(yè)界的高度關(guān)注。前DCCI互聯(lián)網(wǎng)數(shù)據(jù)中心創(chuàng)始人胡延平在微博上表示,“這是一次看似小幅更新,實則可能引發(fā)智能交互領(lǐng)域巨大變革的進(jìn)步。”他還暗示,這次發(fā)布可能不僅僅是GPT-4的后端能力與前端聊天機(jī)器人的結(jié)合,而是GPT-5能力的部分釋放,顯示出OpenAI在控制其技術(shù)發(fā)布的節(jié)奏上有著深思熟慮的策略。






