文心一言
盤古大模型
今年3月開始,國內的AI大模型如雨后春筍般涌現。截至2023年5月底,國內10億級參數規模以上基礎大模型至少已發布79個。在剛剛過去的第六屆世界人工智能大會上,大模型同樣成為全場的絕對主角,30余款大模型集中亮相,20多場大模型論壇應接不暇。
“百模大戰”已經正式打響,AI大模型的創業有多火?
卷數量
國內大模型賽道熱鬧非凡,涉足AI大模型賽道的“玩家”有以阿里、騰訊、百度等為代表的互聯網大廠,還有以商湯科技、科大訊飛等為代表的AI科技公司以及教育類企業孩子王、金融類企業同花順、房地產類企業我愛我家等為代表的各行業公司。
7月6日至7日,在上海2023年世界人工智能大會召開的2天時間里,據記者不完全統計,有10多款大模型新品發布或宣布即將發布。發布的公司有互聯網科技公司、創業公司,還有通信公司;而在大模型新品中,有通用大模型,也有專注細分行業的行業大模型。
已經發布的包括阿里巴巴的繪畫大模型“通義萬相”、中國電信的類ChatGPT產品“TeleChat大模型”、商湯科技聯合香港中文大學和清華大學等推出的“書生通用大模型體系”、第四范式專注企業軟件領域的“式說”大模型等。
7月7日下午,華為宣布發布盤古大模型3.0。華為云CEO張平安在PPT最顯眼位置寫著“不作詩只做事”,他說,盤古大模型聚焦價值場景,致力于深耕政務、金融、制造、煤礦、鐵路、制藥、氣象等行業。
即將發布的主要大模型產品也有不少。
在5月底舉行的中關村論壇上,有專家披露,據其統計到當時為止,中國10億級參數規模以上大模型已發布了79個。如今,隨著世界人工智能大會上批量發布的一批大模型,“百模大戰”也已經正式打響。
卷垂直
年初ChatGPT在國內爆火后,大模型的熱度持續至今。不過,隨著人們對大模型認知的增加,大模型的問題也逐漸凸顯,成為需要直面的挑戰。
圖靈獎得主、中國科學院院士、清華大學交叉信息研究院院長姚期智認為,未來大模型應用中最直接影響的就是文書工作,作為生產力工具,許多文書工作可以交由大模型來完成。
作為文書領域的重要玩家,金山辦公也發布了他們基于大模型的AI辦公產品“wps AI”,可以潤色文章,自動制作表格和PPT。用戶可以讓AI把一篇提綱制作成PPT,并能隨意更換PPT風格。
“WPS AI”搭建在MiniMax、百度文心、智譜AI等大模型之上。金山辦公CEO章慶元在大會現場表示,金山辦公將WPS AI定位為大語言模型的應用方,未來錨定AIGC(內容創作)、Copilot(智慧助手)、Insight(知識洞察)三個戰略方向發展。
同樣在7月7日當天,語言智能科技企業蜜度發布了專門針對校對垂直行業的大模型,名為“蜜度文修”。蜜度首席技術官劉益東告訴記者,今年ChatGPT火了后,他們嘗試做了一個校對領域大模型,訓練出來的效果很令人震驚,在垂直領域的效果遠遠好于通用大模型。
卷進度
新的大模型不斷涌現,之前已經發布的大模型公司也不甘示弱,在7月6日、7月7日公布了最新進展。
今年4月10日,商湯發布了通用大模型產品“日日新”。7月7日,“日日新”更新到2.0版,商湯集團聯合創始人、董事長兼CEO徐立現場展示了大模型新能力。
徐立用他自己的照片做案例,生成了“一個戴眼鏡的男人,彈吉他”的圖片,這是他沒有做過的事情,生成后發給家人朋友,很多人都信以為真。這些AI生成圖片的細節達到了照片級。他還展示了AI繪畫的功能,現在商湯大模型可以幫用戶補充提示詞,比如,一個用戶輸入了“中國龍,藍色擺件,珠寶風格”關鍵詞后,AI生成了一條龍的普通圖片,大模型可以自動把提示詞補充為“一個中國龍的3D渲染圖,具有極其精細的圖案,龍站在一個藍色瑪瑙海上,添加深度和神秘感……”,AI生成的新圖片藝術感增強了許多。
作為國內首個發布大模型的互聯網大廠,百度也在人工智能大會上公布了“文心一言”最新進展。百度首席技術官、深度學習技術及應用國家工程研究中心主任王海峰稱,文心大模型3.5效果、功能、性能全面提升,實現了基礎模型升級、精調技術創新、知識點增強、邏輯推理增強等,模型效果提升50%,訓練速度提升2倍,推理速度提升30倍。
卷算力
與三四月份人們充滿期待的科幻想象相比,當下做大模型的人,關注的話題更接近現實。他們發現,數據是難題,算力也是難題,大模型這條路,前景美好但現實艱難。
華為目前正在著手解決算力問題。7月6日,華為宣布旗下算力解決方案昇騰AI集群全面升級,集群規模從最初的4000卡集群擴展至16000卡,為業界首個萬卡AI集群。此前,騰訊云也面向大模型發布新一代高性能計算集群,算力性能較前代提升高達3倍。
不過,當前的算力仍有很大挑戰。一位大模型創業公司人士表示,大模型的研發成本非常高昂。僅算力一個領域,做訓練、推理、數據處理,就需要數千卡并行的能力,這是一套非常復雜、也非常費錢的系統工程。
算力之外,還有其他挑戰。一位做智能汽車的創始人苦惱于數據量太大,他們公司剛賣了1萬輛汽車,但產生的數據已讓他覺得很龐大了,他不敢想象賣到10萬輛車時會怎樣。硬幣的另一面,也有人因為數據不夠而感到困難,一位用大模型做生物醫藥研發的人士說,他們最缺的就是數據,這阻礙了他們研發醫藥的速度。
騰訊高級執行副總裁湯道生表示,通用大模型一般基于公開信息來訓練,在許多專業知識和行業數據積累不足。在策略上,通用大模型有點像“把大海煮沸”,不夠聚焦,可以解決80%的問題,但未必能夠滿足企業某個場景的具體需求。
除此之外,清華大學智能產業研究院院長、中國工程院院士張亞勤提到,當下大模型仍有自己的局限性。比如ChatGPT會有時效性問題,你問它是什么時候發布的,它不知道,因為它使用的是2021年9月前的數據。另外,大模型還有效率低、涉嫌侵犯隱私和知識產權保護問題等,這些問題都將影響大模型的商用。
縱深
落地之路面臨諸多阻礙
作為一項仍未完全成熟的技術,行業大模型的落地之路仍面臨諸多阻礙。
一方面是監管仍待落地。幾乎所有的大模型產品都還沒有全面開放API接口服務,如百度、阿里就只供定向邀約客戶使用。在接受記者采訪時,科大訊飛總裁吳曉如指出,目前在互聯網或者公開的開放平臺上,還需要等到監管機構發牌以后,大模型才能正式運作。“目前很多開發者只能通過預體驗的形式,將他們的應用和我們的系統進行對接。”
與此同時,有大模型銷售人員透露,目前不少前來接洽的企業都有著相似的顧慮,其中就包括大模型的不穩定問題。
在世界人工智能大會大模型展區待了大半天、刷遍所有公司推出的大模型應用產品的工程師李捷也有同感。他所在的通信公司想借助大模型實現業務端問答場景的落地,但從這半天的試用結果來看并不樂觀。
對于C端用戶而言,大模型一本正經胡說八道的“機器幻覺”也常被調侃。但如果要接入金融、醫療、工業制造等嚴肅B端場景,這一潛在風險就可能造成經濟損失或直接威脅生命安全。
“大模型最大的不足就是‘幻覺’,正式商用是不允許有‘幻覺’的。”在頭部自動駕駛廠商擔任技術經理的張啟強調。
市場的另一個關注重點是大模型的數據安全問題。高質量的數據是助力AI訓練與調優的關鍵,足夠多、足夠豐富的數據,是生成式AI大模型的根基。
據《機器之心》報道,絕大部分企業不可能把敏感的內部數據上傳,比如產品設計、技術架構、核心代碼、制造工藝、配方、客戶隱私、會議紀要、戰略文檔、業務規劃、商業邏輯等,一定要保留在內部,特別是對于國企央企、金融、能源、大型集團企業、先進制造等數據敏感性較高的行業而言。
如此一來,大模型廠商似乎只能采取定制化思路,為企業打造專屬大模型。但在張啟看來,如果行業大模型要針對企業進行個性化的開發,背后需要付出大量數據和時間去訓練,成本很高、難度很大,這筆賬很難算得清楚。
如何跨越這些難題,成為大模型是否能夠真正落地應用的關鍵。這一被認為終將改變世界的新技術,目前還走在黎明前夜。
綜合經濟觀察報、時代財經、藍鯨財經等






