歡迎來到的[每周AI大事件],這里記錄了過去一周值得關(guān)注的AI領(lǐng)域熱點內(nèi)容,幫助大家更好地了解人工智能領(lǐng)域的動態(tài)和發(fā)展風(fēng)向。
圖源備注:圖片由AI生成,圖片授權(quán)服務(wù)商Midjourney
PART1 動態(tài)
[國內(nèi)要聞]
1.騰訊混元大模型官網(wǎng)上線 已通過騰訊云對外開放
騰訊自研的混元大模型在2023騰訊全球數(shù)字生態(tài)大會上正式亮相,并通過騰訊云對外開放。該模型是由騰訊全鏈路自研的通用大語言模型,擁有超千億參數(shù)規(guī)模和超2萬億 tokens 的預(yù)訓(xùn)練語料。該模型已經(jīng)應(yīng)用于騰訊云、騰訊廣告、騰訊游戲、騰訊金融科技等多個騰訊業(yè)務(wù)和產(chǎn)品中,并取得了初步效果。
2.百度網(wǎng)盤云一朵文件助手上線
百度網(wǎng)盤推出了云一朵文件助手,通過先進(jìn)的自然語言處理和機(jī)器學(xué)習(xí)技術(shù),能對文章的主題、內(nèi)容和結(jié)構(gòu)進(jìn)行準(zhǔn)確分析,并生成簡潔明了的摘要。用戶可以通過轉(zhuǎn)發(fā)文章給云一朵文件助手,即可獲得簡潔易懂的文章摘要。
3.始智 AI 開源社區(qū)平臺 wisemodel 上線 旨在打造中國版 HuggingFace
始智 AI 團(tuán)隊打造的中立開放 AI 開源社區(qū)平臺 wisemodel 正式上線,旨在打造中國版 “HuggingFace”。該社區(qū)集合了清華 / 智譜 chatglm2-6B、StableDiffusionV1.5、alphafold2、seamlessm4tlar 等模型和數(shù)據(jù)集資源。
4.阿里魔搭社區(qū)開源 LLM 開發(fā)框架 ModelScope-Agent
魔搭社區(qū)推出了適配開源大語言模型的 AI Agent 開發(fā)框架 ModelScope-Agent。該框架是一個通用的、可定制的 Agent 框架,基于開源的大語言模型作為核心,包含記憶控制、工具使用等模塊。該框架具有可定制且功能全面的特點,支持在 ModelScope 社區(qū)的多個開源 LLMs 上進(jìn)行模型訓(xùn)練,同時提供多樣化且全面的 API。開源地址為 https://github.com/modelscope/modelscope-agent/。
5.零點有數(shù)發(fā)布 “零點楷?!?大模型
零點有數(shù)發(fā)布了名為 “零點楷模” 的大模型,該模型具有智能咨詢問答、智能概要提取、智能運營助手、智慧策略助手、智慧業(yè)務(wù)分析五大功能。主要服務(wù)于政府客戶和商業(yè)客戶。該模型具備可擴(kuò)展、可升級、可移用的特點,并具備多項技術(shù)特點。
6.微信上線 “騰訊混元助手” 多模態(tài)對話小程序
微信上線了一款名為 “騰訊混元助手” 的小程序,該小程序由騰訊混元大模型提供支持。該小程序可以回答各類問題,處理多種任務(wù),如獲取知識、解決數(shù)學(xué)問題、翻譯、提供旅游攻略、工作建議等。
7.百度如流已推出智能編程助理 Baidu Comate X 以及 Comate Stack 工具套件
百度旗下智能工作平臺如流升級推出了 “超級助理” 和 Baidu Comate 系列產(chǎn)品,為企業(yè)提供高效、專業(yè)、實時的智能支持。超級助理可以通過語音喚起,實現(xiàn)復(fù)雜系統(tǒng)的一步直達(dá),并能隨時隨地通過手機(jī)設(shè)備、語音輸入指令完成相關(guān)任務(wù)。同時,百度還推出了 Baidu Comate Stack 工具套件,用于開發(fā)基于 AI 原生的各種應(yīng)用。Baidu Comate X 已支持30多種研發(fā)語言和10多種 IDE,通過 AI 大模型改造的研發(fā)工具鏈,實現(xiàn)全周期研發(fā)的輔助。
8.百川智能開源 Baichuan2均可免費商用
百川智能發(fā)布了兩款開源大模型 Baichuan2-7B 和 Baichuan2-13B,參數(shù)分別為70億和130億,能力全面超越了 Meta 研發(fā)的 Llama2-13B 模型。這些模型支持中英文等數(shù)十種語言,能夠應(yīng)用于學(xué)術(shù)研究、互聯(lián)網(wǎng)、金融等領(lǐng)域。同時,百川智能還發(fā)布了 Baichuan2-13B-Chat 與其4bit 量化版本,并且均為免費可商用。
9.文心一言全面開放 百度 “云一朵” 智能助理用戶突破600萬
百度網(wǎng)盤智能助理 “云一朵” 在文心一言全面開放后,累計用戶數(shù)已突破600萬。這表明文心一言的開放使用讓更多人體驗到了智能助理的便利,基于大模型的智能助理服務(wù)有著廣闊的應(yīng)用前景。
10.36氪與百度達(dá)成戰(zhàn)略合作 借助文心大模型提升內(nèi)容生產(chǎn)效率
36氪與百度達(dá)成戰(zhàn)略合作,共同推進(jìn) AI 技術(shù)在媒體平臺和企業(yè)服務(wù)方面的創(chuàng)新和商業(yè)化進(jìn)程。合作內(nèi)容包括借助百度文心大模型和智能云曦靈數(shù)字人平臺提升內(nèi)容生產(chǎn)效率,推動36氪數(shù)字資訊臺的智能化升級,為用戶提供更及時的資訊內(nèi)容。雙方還將引入大模型應(yīng)用入駐百度云市場,共同打造大模型應(yīng)用市場。
11.百度智能云千帆大模型平臺2.0發(fā)布 訓(xùn)練大模型時間成本大幅降低
百度智能云在百度云智大會上宣布了千帆大模型平臺2.0的正式發(fā)布。該平臺提供了最豐富最全面的工具鏈和最佳算力效能,降低了企業(yè)訓(xùn)練大模型的時間成本。升級后的平臺還擁有最多的大模型和數(shù)據(jù)集,并提供模型安全和數(shù)據(jù)安全保障能力。
12.360智腦大模型面向公眾開放 已接入360安全衛(wèi)士、360安全瀏覽器等產(chǎn)品
360智腦大模型即日起面向公眾開放,用戶可以通過下載 “360智腦” APP 或升級360安全衛(wèi)士、360安全瀏覽器等產(chǎn)品進(jìn)行體驗。360智腦是一款自研的認(rèn)知型通用大模型,具備多項核心能力,如生成創(chuàng)作、多輪對話、邏輯推理等。
13.金山辦公宣布 WPS AI 正式面向社會開放
金山辦公宣布 WPS AI 正式面向社會開放,用戶可以在 WPS 智能文檔中體驗 WPS 智能文檔的功能。WPS 智能文檔基于 WPS AI 技術(shù),提供內(nèi)容生成、表達(dá)優(yōu)化、文檔理解及處理等功能。WPS AI 已接入 WPS 文字、演示、表格、PDF 等產(chǎn)品線,解決用戶在內(nèi)容生成、內(nèi)容理解、指令操作等方面的辦公難題。
14.百度輸入法上線 AI 創(chuàng)作助手 “超會寫” 功能
百度輸入法發(fā)布了 AI 創(chuàng)作助手 “超會寫”,該功能基于文心大模型,可以在不同場合下幫助用戶進(jìn)行高效、高質(zhì)、高情商的文本創(chuàng)作。用戶只需輸入需求,AI 助手提供符合條件的文本供選擇,如高情商溝通、神評論、改寫文案、短視頻配文等。
15.作業(yè)幫發(fā)布自研銀河大模型 即將應(yīng)用于作業(yè)幫 APP 等場景
作業(yè)幫發(fā)布了自研的銀河大模型,該模型覆蓋多學(xué)科、多學(xué)段、多場景,具備高度的知識解答能力,可以協(xié)助學(xué)生進(jìn)行創(chuàng)意寫作和自主提問。該模型在智能解題、知識問答、中英文寫作和 AI 伴學(xué)等方面表現(xiàn)出色,并在權(quán)威大語言模型評測基準(zhǔn)上取得了優(yōu)秀成績。
16.麒麟合盛 APUS 發(fā)布自研千億級多模態(tài) “AiLMe 天燕大模型”
人工智能企業(yè) APUS 發(fā)布了自研千億級多模態(tài)人工智能大模型 “天燕大模型”,具備對文本、圖像、視頻、音頻的理解和生成能力,并在國際權(quán)威測評中取得了好成績。從大模型中提煉出的四個垂直領(lǐng)域精煉模型分別是文本模型 “異雀八”、圖像模型 “異雀三”、音頻模型 “異雀六” 和視頻模型 “異雀四”,并推出了多個 AI 產(chǎn)品。
[國際要聞]
1.微軟為商業(yè)客戶提供新 Copilot 版權(quán)承諾:將承擔(dān)法律風(fēng)險
微軟公司表示,如果使用其人工智能產(chǎn)品的商業(yè)客戶因生成內(nèi)容被起訴侵犯版權(quán),微軟將承擔(dān)法律責(zé)任。該公司將為客戶提供內(nèi)置的防護(hù)措施和內(nèi)容過濾器,以減少 AI 返回侵權(quán)內(nèi)容的可能性。微軟的這一舉措是對用戶對生成式 AI 技術(shù)產(chǎn)生的版權(quán)擔(dān)憂的回應(yīng)。
2.蘋果每天在對話式人工智能上花費數(shù)百萬美元
蘋果正在研究開發(fā)對話式人工智能,其中使用的 Ajax 聊天機(jī)器人比初始版本的 ChatGPT3.5更強(qiáng)大。蘋果每天花費數(shù)百萬美元進(jìn)行語言模型的訓(xùn)練,他們還在努力開發(fā)使語音助手 Siri 能夠自動執(zhí)行多步任務(wù)的功能,并且在開發(fā)生成視頻和圖像的軟件以及多模式 AI 方面也有所進(jìn)展。
3.聯(lián)合國呼吁對學(xué)校人工智能工具的使用進(jìn)行年齡限制
聯(lián)合國教育機(jī)構(gòu)呼吁各國政府對學(xué)校中的人工智能工具實施年齡限制,特別是對年齡較大的兒童。他們發(fā)表了一份新指南,強(qiáng)調(diào)教師、學(xué)習(xí)者和研究人員的參與以及政府監(jiān)管對確保人工智能工具的安全有效使用至關(guān)重要。該指南還提到了人工智能工具 ChatGPT 的年齡限制為13歲,但一些評論員認(rèn)為這一門檻可能過低,主張將其提高至16歲。
4.僅40名員工!Midjourney 年收入達(dá)2億美元,正開發(fā) V6版本
據(jù)報道,Midjourney 公司在沒有投資者的情況下,僅有40名員工成功實現(xiàn)了2億美元的年收入。該公司通過 Discord 平臺提供 AI 圖像服務(wù),用戶每月可選擇不同套餐進(jìn)行收費。公司計劃推出 V6版本,并致力于實時生成視頻和3D 資產(chǎn)。
5.谷歌 DeepMind 開始研發(fā)類似 Auto-GPT 的自主 AI 代理
谷歌 DeepMind 計劃研究自主語言代理,潛在地提升了類似 Gemini 的大型語言模型的應(yīng)用。自主語言代理的基本思想是通過即時工程、自我提示和內(nèi)存等技術(shù),使代理系統(tǒng)能夠自主實現(xiàn)給定的目標(biāo)。
6.美國50州聯(lián)名呼吁國會成立委員會調(diào)查 AI 對兒童影響
美國50個州和4個地區(qū)的總檢察長聯(lián)名致信國會,呼吁成立一個委員會,專門研究人工智能對兒童剝削的影響。委員會的任務(wù)包括擴(kuò)大現(xiàn)有法律、明確將 AI 生成的兒童色情內(nèi)容列入禁止范圍,提出新的立法措施加強(qiáng)監(jiān)管,并提高識別和過濾這類內(nèi)容的效率??倷z察長們強(qiáng)調(diào)保護(hù)兒童安全應(yīng)該成為評估 AI 風(fēng)險的重點。
7.Zoom 重塑品牌并推出新的生成式人工智能功能:AI Companion
為了在擁擠的視頻會議市場保持競爭力,Zoom 更新和重塑了其多項人工智能功能,包括推出名為「Zoom AI Companion」的生成式人工智能助手。這個工具可以幫助用戶撰寫 Zoom 聊天消息、總結(jié)會議等任務(wù),并且現(xiàn)在已經(jīng)成為標(biāo)準(zhǔn) Zoom 訂閱的一部分。
8.OpenAI 將 Canva 插件引入 ChatGPT
OpenAI 推出了 Canva 插件,為 ChatGPT 提供支持,旨在簡化用戶創(chuàng)建標(biāo)志、橫幅等視覺元素的過程。之前使用 Canva 與 ChatGPT 需要用戶手動操作,而現(xiàn)在可以通過插件輕松創(chuàng)建和編輯視覺效果,并直接下載使用。該插件目前僅適用于 ChatGPT Plus 訂戶,該訂閱服務(wù)每月收費20美元。
9.微軟將于下個月推出人工智能驅(qū)動的 OneDrive 功能
微軟計劃在10月3日發(fā)布 OneDrive 的新功能,可能是通過人工智能整合機(jī)制來幫助用戶組織文件。微軟近幾個月一直在專注于人工智能,在將其整合到 OneDrive 中是一個明顯的下一步。盡管目前尚不清楚 OneDrive 可以提供什么樣的人工智能功能,但自動創(chuàng)建文件夾等功能顯然是候選者之一。
10.GPT-5正秘密訓(xùn)練!DeepMind 聯(lián)創(chuàng)爆料,這模型比 GPT-4大100倍
DeepMind 聯(lián)合創(chuàng)始人透露 GPT-5正在秘密訓(xùn)練中,預(yù)計未來3年的時間里,GPT-5的模型將比目前的 GPT-4大1000倍。
11.阿拉伯語版 ChatGPT “Jais Chat” 問世 性能堪比英語商業(yè)模型
阿拉伯聯(lián)合酋長國的研究人員開發(fā)了阿拉伯語的大規(guī)模語言模型 Jais 和 Jais Chat。Jais 擁有130億個參數(shù),并通過使用3950億個訓(xùn)練樣本進(jìn)行訓(xùn)練。在阿拉伯語任務(wù)上,Jais 表現(xiàn)出與商業(yè)化的英語模型 ChatGPT 相當(dāng)?shù)男阅埽⒃谀承┤蝿?wù)上超過了現(xiàn)有的阿拉伯語開源模型。
12.馬斯克承認(rèn)用 X 數(shù)據(jù)訓(xùn)練 AI:微軟別想用,但我自己能用
馬斯克的社交平臺 X 最近更新了隱私條款,表示將使用社交媒體數(shù)據(jù)來訓(xùn)練機(jī)器學(xué)習(xí)或 AI 模型。馬斯克承認(rèn)只會使用公開信息,不會使用私信和任何私人數(shù)據(jù)。X 還將開始收集用戶的生物識別數(shù)據(jù)和工作教育信息,以增加賬號的安全性。
13.全球大型網(wǎng)站正在阻止 OpenAI 等人工智能爬蟲訪問其內(nèi)容
根據(jù)人工智能內(nèi)容檢測器 Originality.AI 的最新數(shù)據(jù),全球前1000個網(wǎng)站中有近20% 阻止爬蟲機(jī)器人收集網(wǎng)絡(luò)數(shù)據(jù)用于 AI 服務(wù)。這些網(wǎng)站采取措施以阻止 OpenAI 等爬蟲,避免其收集數(shù)據(jù)用于訓(xùn)練模型。對于 AI 使用版權(quán)材料缺乏明確法律或監(jiān)管規(guī)定的情況下,網(wǎng)站擁有者可以自行決定是否允許爬蟲訪問其內(nèi)容。
PART2 熱門產(chǎn)品
1.一手實測騰訊混元大模型:重邏輯降幻覺
騰訊發(fā)布了千億參數(shù)大模型混元,具備強(qiáng)大的中文創(chuàng)作能力和復(fù)雜的邏輯推理和任務(wù)執(zhí)行能力。混元大模型在微信小程序上進(jìn)行了實測,回答了腦筋急轉(zhuǎn)彎、數(shù)學(xué)題和其他實用工具等問題,并展示了降低模型幻覺、處理長難任務(wù)和邏輯推理能力等方面的優(yōu)勢。騰訊還自研了一種基于探真的方法降低模型幻覺,通過強(qiáng)化學(xué)習(xí)讓模型學(xué)會拒絕回答無法回答的問題。騰訊自家應(yīng)用如騰訊文檔、騰訊會議等已經(jīng)加持了混元大模型的能力。
2.Hugging Face 推出新服務(wù) Training Cluster 可一鍵訓(xùn)練模型
人工智能科技公司 HuggingFace 推出了一項新服務(wù) Training Cluster,用戶僅需一鍵即可對模型進(jìn)行訓(xùn)練,無需處理復(fù)雜的內(nèi)部過程。這項創(chuàng)新服務(wù)將極大地減少用戶在深度學(xué)習(xí)項目中進(jìn)行模型訓(xùn)練所需的時間和精力。用戶只需提供自定義的數(shù)據(jù)集和訓(xùn)練參數(shù),Hugging Face 會自動在數(shù)千個 GPU 上進(jìn)行訓(xùn)練并縮放。
3.世界最強(qiáng)開源大模型 Falcon180B 引爆全網(wǎng) 性能直逼商業(yè)模型
阿布扎比的全球領(lǐng)先技術(shù)研究中心 TII 發(fā)布了一款世界頂級開源大模型 ——Falcon180B。這款模型在3.5萬億 token 的訓(xùn)練下,擁有1800億參數(shù),性能超過了之前的開源模型 Llama2,甚至接近了谷歌的 GPT-4。Falcon180B 在多項自然語言處理基準(zhǔn)測試中表現(xiàn)強(qiáng)勁,擊敗了 LLaMA2,與 GPT-3.5和 PaLM2不相上下。該模型可免費商用,提供了聊天對話版本,任何人都可以試用體驗。
4.Meta 推出像素級動作追蹤模型,簡易版在線可玩 | GitHub1.4K 星
Meta 最新推出的視頻跟蹤工具 CoTracker 已經(jīng)精確到了每個像素。CoTracker 在 GitHub 上斬獲了1.4k 星標(biāo),官方發(fā)布的 DEMO 展示了其震撼的效果。CoTracker 不僅能改變物體追蹤技術(shù),還將在體育分析、野生動物追蹤和電影后期領(lǐng)域掀起一場革命。文章介紹了在線的簡易版本,并提供了部署和使用 CoTracker 的方法。
5.帶你穿越清明上河圖!DragNUWA 驚艷亮相:一拖一拽讓靜圖秒變視頻
微軟提出的視頻生成模型 DragNUWA 可以通過手繪軌跡驅(qū)動圖像動態(tài)化,實現(xiàn)復(fù)雜運動及場景控制。該模型可以根據(jù)用戶拖動的方式生成連貫的視頻,同時支持控制攝像機(jī)和多個對象的移動。DragNUWA 的軌跡控制能力超越了現(xiàn)有技術(shù),可以處理復(fù)雜曲線軌跡和多個物體的運動,并且可以根據(jù)文本、圖像和軌跡信息進(jìn)行精細(xì)控制。
6.ChatGPT 上線 “論文神器” 插件!無需關(guān)鍵字即可搜索2億文章
ChatGPT 推出了一個名為 “Consensus” 的插件,可以無需關(guān)鍵字,通過問題描述搜索并整理出來答案,從2億篇論文中提供鏈接。該插件還可以根據(jù)問題寫一篇綜述,并附上論文鏈接。與 ChatGPT 不同的是,Consensus 提供的論文鏈接是絕對可靠的(經(jīng)過同行評審),使用這個插件可以方便地搜索論文內(nèi)容。
7.MVDream: 輕松實現(xiàn)從文本到3D 渲染圖像
字節(jié)跳動研究人員推出的 MVDream 技術(shù)可以僅通過文本描述生成高質(zhì)量的3D 圖像。該技術(shù)通過使用多視角圖像訓(xùn)練,實現(xiàn)了連貫一致的3D 內(nèi)容生成,避免了常見的 “兩面人” 問題。盡管目前圖像分辨率較低且泛化能力有限,但字節(jié)跳動預(yù)計未來可以通過使用更大的擴(kuò)散模型和新數(shù)據(jù)集進(jìn)行改進(jìn)。
8.免費科研利器!Meta 祭出 Nougat,PDF 格式轉(zhuǎn)換,公式表格精準(zhǔn)識別
Meta AI 研究人員推出一款 OCR 神器 Nougat,能夠?qū)?PDF 轉(zhuǎn)換為 MultiMarkdown,提取出復(fù)雜數(shù)學(xué)公式、表格、文字和掃描版的 PDF。Nougat 基于 Vision Transformer 架構(gòu),可以處理整個頁面,并輸出格式適合學(xué)術(shù)文檔寫作。經(jīng)過實驗測試,Nougat 在提取文本、公式和表格方面準(zhǔn)確率很高。這款工具將有助于提高科學(xué)知識的獲取,使科研人員更容易獲取數(shù)百萬篇科學(xué)論文的信息。
9.騰訊自主研發(fā)智能設(shè)計平臺 AI Design:10秒免費創(chuàng)建專屬 logo
騰訊自主研發(fā)的智能設(shè)計平臺 AI Design 利用人工智能技術(shù),幫助個人用戶以高效率和低成本創(chuàng)建品牌 logo。用戶只需輸入品牌名稱、選擇關(guān)鍵詞和偏好顏色,即可獲得多種 logo 方案。AI Design 在線生成品牌 logo 僅需10秒,內(nèi)測期間免費開放全部功能,每個用戶每天可免費下載10個 logo 及其衍生品。
10.700億參數(shù) Llama2訓(xùn)練加速195%!訓(xùn)練 / 微調(diào) / 推理全流程方案開源,0代碼一站解決
全球最大的大模型開發(fā)工具與社區(qū) Colossal-AI 發(fā)布了全套 Llama2訓(xùn)練、微調(diào)、推理方案,可以為700億參數(shù)模型的訓(xùn)練加速195%。Colossal-AI 開源了針對 Llama2的全流程方案,包括訓(xùn)練、微調(diào)、推理,提供一站式云平臺解決方案,大大降低大模型開發(fā)和落地應(yīng)用成本。
PART3 觀點
1.生成式 AI 將使微軟、谷歌和亞馬遜的市值超過蘋果公司的3萬億美元
分析師強(qiáng)調(diào)生成式人工智能在重塑全球公司競爭格局方面的潛力。生成式人工智能的應(yīng)用能夠加快產(chǎn)品和內(nèi)容推出速度,降低成本,提高收入。分析師預(yù)計,三個 LLM 的領(lǐng)跑者是亞馬遜、谷歌和微軟,這三家公司的市值將增長到超過蘋果公司的3萬億美元。
2.調(diào)查:52% 組織在擔(dān)心使用生成式 AI 帶來的安全問題
根據(jù) Recognize 的 CIO 調(diào)查,52% 的受訪者在使用生成式 AI 時表示安全是最關(guān)心的問題。調(diào)查還發(fā)現(xiàn),39% 的受訪者擔(dān)心復(fù)雜性,33% 的受訪者擔(dān)心硬件資源需求。82% 的組織主要使用 ChatGPT 來部署生成式 AI。調(diào)查結(jié)果顯示,雖然生成式 AI 在企業(yè)應(yīng)用中廣泛部署,但安全性和可靠性仍然是組織關(guān)注的焦點。
3.預(yù)測到2030年,人工智能將在美國取代240萬個工作崗位
一份來自分析公司 Forrester 的報告指出,到2030年,生成 AI 將替代240萬美國工作崗位,并對其他1100萬崗位產(chǎn)生影響。白領(lǐng)工作崗位將受到最大沖擊,特別是技術(shù)寫作、社會科學(xué)研究助手、校對員、文案撰寫員和行政職位。
4.盡管需求激增,過去一年只有13% 的員工接受 AI 培訓(xùn)
根據(jù) Randstad 最新調(diào)查結(jié)果,全球范圍內(nèi)有20倍增長的 AI 技能需求,但僅有13% 的員工在過去一年中接受了雇主提供的 AI 培訓(xùn)。這一發(fā)現(xiàn)凸顯了企業(yè)在充分利用 AI 機(jī)會方面需要解決的重大不平衡問題。雖然員工對 AI 技能表現(xiàn)出高期望和準(zhǔn)備度,但企業(yè)未能給予足夠支持,導(dǎo)致技能需求與培訓(xùn)機(jī)會之間存在差距。
5.UC 伯克利團(tuán)隊用 ChatGPT 做研究 一個小時就能完成學(xué)生多年的工作
加州大學(xué)伯克利分校的研究人員使用 ChatGPT 生成大型數(shù)據(jù)集,研究金屬有機(jī)框架材料在應(yīng)對氣候變化中的應(yīng)用。他們通過為 ChatGPT 提供提示詞,讓其提取金屬有機(jī)框架的數(shù)據(jù),僅用一個小時完成了本科生數(shù)年的工作,并且準(zhǔn)確率達(dá)到95%。
6.專家:未來30年人工智能可能替代足球裁判
未來30年內(nèi),足球裁判可能會被機(jī)器人取代,人工智能已經(jīng)在足球比賽中發(fā)揮了關(guān)鍵作用,特別是在 VAR 和門線技術(shù)的應(yīng)用中。人工智能和機(jī)器學(xué)習(xí)在足球領(lǐng)域的應(yīng)用不僅局限于裁判,還包括數(shù)據(jù)分析和戰(zhàn)術(shù)決策。
7.李彥宏稱創(chuàng)業(yè)者卷大模型沒意義:卷應(yīng)用機(jī)會更大
百度創(chuàng)始人李彥宏在百度創(chuàng)業(yè)大賽頒獎致辭中表示,對于創(chuàng)業(yè)者來說,卷大模型沒有意義,卷應(yīng)用機(jī)會更大。他強(qiáng)調(diào) AI 原生應(yīng)用應(yīng)該能夠解決過去無法解決的問題,或者是解決得不好的問題,而不僅僅是對移動互聯(lián)網(wǎng) APP 或 PC 軟件的重復(fù)。他提出 AI 原生應(yīng)用應(yīng)該滿足三個基礎(chǔ)條件:能夠用自然語言進(jìn)行交互、能夠利用大語言模型的能力、每個應(yīng)用的交互不能超過兩級菜單。
8.RLHF 再也不需要人類了!谷歌團(tuán)隊研究證明,AI 標(biāo)注已達(dá)人類水平
谷歌團(tuán)隊最新研究表明,AI 標(biāo)注偏好后可以取得與人類反饋強(qiáng)化學(xué)習(xí)(RLHF)相同的效果。研究人員通過使用大模型進(jìn)行偏好標(biāo)注,取得了與 RLHF 相媲美的改進(jìn)效果,勝率達(dá)到了50%。這意味著未來的大型語言模型訓(xùn)練可以不再依賴于人類反饋,而可以通過自我循環(huán)來改進(jìn)。
PART4 深度
1.蘋果日砸百萬,豪賭2000億參數(shù) Apple GPT!
蘋果加大投資力度,每天燒掉數(shù)百萬美元,挖角谷歌工程師,旨在將 Apple GPT 集成到明年發(fā)布的 iPhone 中。蘋果的大模型團(tuán)隊由谷歌工程師領(lǐng)導(dǎo),團(tuán)隊成員來自谷歌和 Meta 等公司。他們開發(fā)的模型被稱為 Ajax GPT,預(yù)計已超越 GPT-3.5。
2.大模型的新戰(zhàn)場
隨著監(jiān)管放開備案,大模型廠商可以面向 C 端用戶開放注冊,競爭變得更加激烈。雖然短期內(nèi)出現(xiàn)爆款應(yīng)用的概率不大,但大模型廠商通過開放注冊可以獲得大量用戶數(shù)據(jù),進(jìn)一步改進(jìn)基礎(chǔ)模型。大模型廠商可以借鑒美國的 OpenAI,在 B 端市場推出 API 接口調(diào)用服務(wù),通過出售大模型 API 和提供大模型解決方案來賺錢。
3.半年多過去了,ChatGPT 的排名快 “墊底” 了
OpenAI 的 GPT-4在 C-Eval 榜單中排名最后,引發(fā)了人們對于 ChatGPT 的發(fā)展前景的疑慮。然而,國內(nèi)大模型開發(fā)者表示,他們的產(chǎn)品在某些領(lǐng)域已經(jīng)超越了 ChatGPT,并在中文能力上取得了突破。盡管這些排名結(jié)果不能完全證明大模型的實際能力,但它們顯示了國內(nèi)大模型發(fā)展的迅速勢頭。
4.中文大模型比英文更燒錢,這居然是 AI 底層原理決定的?
由于中文語言的復(fù)雜性和歧義性,中文需要處理更多的 token,導(dǎo)致模型消耗更多的內(nèi)存和計算資源,增加了中文模型的成本。同時,中文在訓(xùn)練和推理上也面臨著語言結(jié)構(gòu)和語法的挑戰(zhàn),影響了輸出效果。因此,開發(fā)中文大模型需要額外的資源和成本。而使用英文作為提示詞的結(jié)果要好于直接使用中文,這可能與英文語言的簡單性和模型的訓(xùn)練數(shù)據(jù)集主要為英文有關(guān)。
5.大模型的應(yīng)用焦慮,百度怎么解?
百度創(chuàng)始人李彥宏呼吁創(chuàng)業(yè)者聚焦大模型應(yīng)用層創(chuàng)新,因為當(dāng)前國內(nèi)大模型行業(yè)缺乏爆款應(yīng)用,競爭激烈且同質(zhì)化嚴(yán)重。雖然市場對大模型的期望值高,但由于缺乏真正實用的應(yīng)用,用戶對大模型的興趣逐漸流失。然而,對于大模型應(yīng)用來說,仍存在巨大的市場機(jī)會。一些基于大模型的創(chuàng)業(yè)公司估值飆升,而百度也積極推動大模型應(yīng)用的發(fā)展,舉辦創(chuàng)業(yè)大賽和開放 AI 原生應(yīng)用。
6.百度版大模型應(yīng)用商店來了!從數(shù)字人到企業(yè)搜索11大應(yīng)用應(yīng)有盡有
百度在最新推出的11個 AI 原生應(yīng)用中,利用大模型加持,實現(xiàn)了從數(shù)字人到企業(yè)搜索等各種功能。其中,百度智能云的曦靈數(shù)字人平臺提供了各行業(yè)、各崗位的數(shù)字人解決方案,使用新的 AI 渲染技術(shù),讓數(shù)字人的形象更真實。百度的企業(yè)搜索引擎甄知能夠通過自然語言交互整理公司文檔信
7.LLaMA 核心原作多半離職,Meta AI 內(nèi)幕曝光!算力爭奪撕破臉,大模型團(tuán)隊成員連換三輪
Meta 內(nèi)部算力短缺引發(fā)紛爭,LLaMA 核心作者超半數(shù)離職,大模型開發(fā)團(tuán)隊連續(xù)三次重組。算力競爭和內(nèi)部團(tuán)隊紛爭給 Meta AI 的發(fā)展帶來了不確定性。同時,Meta 面臨人工智能人才需求激增的挑戰(zhàn),許多公司都在挖角 Meta 的研究人員。Meta AI 的重心轉(zhuǎn)向生成式 AI,并放棄了與谷歌的 PaLM 競爭的模型開發(fā)。
8.AI 創(chuàng)業(yè)要求劇變:拿到融資前必須先掙到錢
隨著 AI 領(lǐng)域創(chuàng)業(yè)的熱度不斷上升,投資機(jī)構(gòu)對于投資的謹(jǐn)慎程度也在增加?,F(xiàn)在創(chuàng)業(yè)團(tuán)隊在融資前必須先證明自己能夠掙到錢,而不是依靠投資來生存。這意味著創(chuàng)業(yè)者需要更加關(guān)注客戶和收入,而不僅僅是技術(shù)和創(chuàng)新。投資人對試錯的容忍度也大幅下降,創(chuàng)業(yè)團(tuán)隊需要更全面的能力和實力來吸引投資。
9.躺賺的直播切片生意,或?qū)⒁?AI 降維打擊了
直播切片是一種在網(wǎng)絡(luò)上賺錢的方式,但現(xiàn)在 AI 視頻流編輯工具 Capturelab 的出現(xiàn)可能會改變這一局面。Capturelab 能夠幫助主播識別直播中的精彩片段并自動剪輯出視頻,從而節(jié)省時間和人力成本。雖然目前 Capturelab 只支持游戲直播,但其底層邏輯與直播切片相通。直播切片的競爭力在于時間差,而 AI 的加入會提高剪輯效率,可能使直播切片被 MCN 掌控,降低其他創(chuàng)作者的機(jī)會。
10.“偏科” 的國產(chǎn)大模型:長于文本、弱于數(shù)理、作畫湊合
國產(chǎn)大模型在文本創(chuàng)作方面表現(xiàn)不錯,能夠?qū)懺?、起?biāo)題、構(gòu)思文章等,但在數(shù)理計算和作畫方面還有一些欠缺。另外,這些大模型在信息檢索方面準(zhǔn)確度和更新速度還有待提升。