亚洲视频二区_亚洲欧洲日本天天堂在线观看_日韩一区二区在线观看_中文字幕不卡一区

公告:魔扣目錄網為廣大站長提供免費收錄網站服務,提交前請做好本站友鏈:【 網站目錄:http://www.430618.com 】, 免友鏈快審服務(50元/站),

點擊這里在線咨詢客服
新站提交
  • 網站:51998
  • 待審:31
  • 小程序:12
  • 文章:1030137
  • 會員:747

是大廠的游戲,但不能只是大廠的游戲

文|《中國企業家》記者 趙東山 鄧雙琳

編輯|李薇

頭圖攝影|鄧攀

一場AI大模型追逐賽,激戰正酣。

4月11日,阿里云旗下大模型產品通義千問面世。阿里云峰會上,阿里巴巴集團董事會主席兼CEO張勇首次以阿里云智能CEO的身份亮相,介紹了通義千問的最新進展。

一向以正裝公開示人的張勇,穿了一身休閑裝,呼應其新身份——去年年底,他宣布親自掛帥阿里云,“躬身”業務四個多月后,張勇帶來了首個待檢驗的作品通義千問。他表示,阿里巴巴所有產品未來都將接入通義千問大模型,進行全面改造。

ChatGPT的問世和迭代速度,重新定義了技術變化的日新月異。在阿里之前,百度已率先“交卷”,推出基于新一代大語言模型研發的生成式AI產品文心一言,并展示了其在文學創作、商業文案創作、數理推算、中文理解、多模態生成五個使用場景中的綜合能力。

更多不甘落后的互聯網大廠和創業者正在路上。

3月底,騰訊總裁劉熾平在財報電話會上說,騰訊正在加速推進大模型混元;3月29日,360集團創始人周鴻祎在一次活動上預演示了360尚未正式發布的大模型應用產品,他稱:“GPT是場新工業革命,其意義超越了互聯網、iphone的發明。”

《中國企業家》從接近字節跳動人士獲悉,字節跳動版的ChatGPT已在內測,但內測之后,體驗效果不好,預計在9月上線,也有可能提前。不久前,原阿里達摩院大模型M6帶頭人楊紅霞加入字節AI lab,參與語言生成大模型的研發,直接向副總裁楊震原匯報。

隨著時間的推進,行業的緊迫感越來越強,節奏越來越密集,僅在4月10日這一天,就有3家公司宣布推出大模型及應用產品:搜狗創始人王小川正式官宣入場大模型創業,年底發布大模型產品,已獲得5000萬美元啟動資金;商湯宣布推出商湯日日新大模型;昆侖萬維(45.700, -0.06, -0.13%)和奇點智源合作自研的國產大語言模型將于4月17日啟動邀請測試。

這場AI大模型之爭,讓沉寂了很久的中國互聯網市場突然變得亢奮,即使在當年“百團大戰”、生鮮電商纏斗最激烈的時刻,頭部大廠也沒有拿出“All in”押注未來的架勢。對標ChatGPT的大模型,顯然被大廠當作開啟下個時代的鑰匙——誰能最先觸摸到AI生態的潛能邊界,誰就能掌握話語權。

然而,訓練大模型并非易事,大廠和創業者們互相競逐背后是一場財力、技術、算力、人才等資源的綜合較量。但在大廠內部看來,此輪關于大模型的創業,如果只是一個大廠的游戲,說明中國的創新還是沒有走出原來的怪圈,AI大模型創業應該是一個萬眾創新的游戲。

技術、算力、人才的角逐

從發布信息來看,阿里對通義千問的定位,已經不局限于簡單的AIGC概念上,而是如何讓AI的能力真正應用在更實際、更多樣的場景上。

阿里的大模型分內外部兩個路線——一方面將與集團內部產品結合,可以預見,通義千問將對天貓、淘寶、高德、釘釘等業務應用帶來直接的商業價值,據了解,釘釘、天貓精靈將率先接入測試,將在評估認證后正式發布新功能;另一方面,阿里云表示將開放通義千問的能力,幫助每家企業基于通義千問打造具備自己行業能力的專屬大模型。

來源:視覺中國(19.120, 1.70, 9.76%)

阿里大模型由阿里云智能CTO周靖人負責,周靖人畢業于中國科學技術大學,獲哥倫比亞大學計算機博士學位,曾任微軟研發合伙人,2016 年加入阿里,任阿里云首席科學家。他告訴《中國企業家》,阿里選擇在此刻公布通義千問,并非完全為了“趕時髦”。

“阿里從2019年開始,就在投入各種各樣訓練大模型的研發中。但ChatGPT以一個非常好的產品形態出現,教育了全社會,現在的確是一個很好的時間節點。如果我們在去年9月、10月講預訓練大模型,也許大家都不會感興趣。”周靖人說。

事實上,無論是阿里還是百度,能快速推出自己的大模型及應用,都源于兩家在過往的技術積累。

2019年,百度便推出了文心大模型ERNIE 1.0。目前,ERNIE 3.0每天接受數十億次用戶的搜索請求,這讓文心一言能夠基于一個龐大的、高效的數據池,快速地學習和改進;阿里則于2021年連續發布語言大模型 Plug(后更名為AliceMind)和多模態大模型M6,去年9月,兩個大模型合并為阿里通義大模型。

再看看文心一言由的團隊——由百度CTO王海峰出任總指揮,團隊核心成員還包括百度集團副總裁吳甜、百度技術委員會主席吳華等人。王海峰先后負責百度搜索、百度地圖、百度翻譯、百度智能云等業務。他同時是自然語言處理領域世界上最具影響力的國際學術組織ACL50多年歷史上首位華人主席。

除了人才外,大模型訓練也堪稱“暴力美學”,需要有大算力、大數據和大模型,每一次訓練任務都耗資巨大。

據《中國企業家》了解,文心一言大模型的訓練數據包括萬億級網頁數據、數十億的搜索數據和圖片數據、百億級的語音日均調用數據,以及5500億事實的知識圖譜等。

此外,浙商證券(10.490, 0.04, 0.38%)的一份研報指出,支撐ChatGPT算力基礎設施至少需要上萬顆英偉達GPU A100,與之相對應,AlphaGO只需要8塊GPU。

這只是最低門檻。大模型的爆發會導致訓練的應用場景越來越多,對訓練算力的需求會大幅增長,增長幅度能達到10倍甚至100倍。

大模型帶來的產業變革

ChatGPT及相關的大模型應用,除了給個人帶來工作是否會被取代的擔憂外,也給產業帶來很多變革。

在李彥宏看來,當人類進入人工智能時代,IT技術的技術棧發生了根本性變化。過去基本分為三層:芯片層、操作系統層和應用層。而現在可以分為四層:芯片層、框架層、模型層和應用層。百度目前是在這四層進行全棧布局的人工智能公司。

談及全棧布局,百度智能云云計算產品解決方案和運營部總經理宋飛告訴《中國企業家》:“AI產品對于資源的要求越來越高,只有每一層都有自主可控的東西,才有可能縱深地做持續閉環的優化。”

宋飛舉例,如果芯片不是自己的,你在優化到底下硬件的時候,就是個黑盒了,能發揮的空間絕對是有限的,你有什么需求它也不一定聽你的。如果用自己的框架,有什么需求就很快可以調整。全棧的布局和專門的優化,是百度在基礎架構的核心優勢。

AI大模型的盛行,也在衍生眾多的商業機會。

在李彥宏看來,對于大部分創業者和企業來說,真正的機會并不是從頭開始做ChatGPT和文心一言這樣的基礎大模型,這很不現實,也不經濟,重復造輪子是沒有意義的。而是基于通用大語言模型,搶先開發重要的應用服務,“就像移動互聯網時代,最成功的商業產品不見得是Android/ target=_blank class=infotextkey>安卓和IOS,而是基于安卓和iOS開發的微信、淘寶、抖音等各種超級應用。”

阿里持相同的觀點。

周靖人表示,阿里將開放通義千問的能力,幫助每家企業基于“通義千問”打造具備自己行業能力的專屬大模型。未來每一個企業在阿里云上既可以調用通義千問的全部能力,也可以結合企業自己的行業知識和應用場景,訓練自己的企業大模型。比如,每個企業都可以有自己的智能客服、智能導購、智能語音助手、文案助手、AI設計師、自動駕駛模型等。

來源:視覺中國

王海峰認為,大模型時代將產生三大產業機會:

第一類是新型云計算公司。大模型將根本性地改變云計算行業的游戲規則。之前企業選擇云廠商更多看算力、存儲等基礎云服務。未來,更多會看框架好不好、模型好不好,以及模型、框架、芯片、應用這四層之間的協同。

第二類是進行行業模型精調的公司。這是通用大模型和企業之間的中間層,他們具有行業Know-how,調用通用大模型能力,為行業客戶提供解決方案。

第三類是基于大模型底座進行應用開發的公司,即應用服務提供商。目前,基于文本生成、圖像生成、音頻生成、視頻生成、數字人(8.980, 0.06, 0.67%)、3D等場景,已經涌現出很多明星創業公司。

反思、挑戰和局限

略顯遺憾的是,目前多數中國大公司在做的大模型和基于模型的應用,均是追隨OpenAI的腳步,而且隨著ChatGPT的驚人迭代速度,差距越拉越大。

李彥宏在接受36氪采訪時表示,百度“文心一言”在研發階段時,百度技術團隊曾與ChatGPT進行對比測試,當時差距是40分的水平,一個月能追得上。可過了一個月,技術團隊再次測試后,發現差距反而拉大了。

周靖人也坦誠承認,目前通義千問與ChatGPT仍有差距,“GPT還是屬于各方面都領先的地位”。但他認為“你追我趕”是科技進步的必然階段,“今天別人的技術比較領先,我們就需要取長補短。也許下一個階段,通義千問也能貢獻自己的一系列技術創新”。

在此前的采訪中,周鴻祎也曾告訴《中國企業家》,其實國內也很早關注到GPT-1,然而當時的關注還是抱著一種實用主義的觀點,認為應該找場景,要解決自己業務中遇到的問題。所以,中國的人工智能都用來解決人臉識別、圖像濾鏡做得更漂亮。

“如果一個人工智能技術和自己的業務不能結合,可能就會認為沒太大意義,所以,沒有人想到用GPT NLP的模型解決通用知識理解和推理的問題,更沒有人想到大算力大數據做出一個大模型,能夠產生一種連OpenAI自己都想不到的智能化的結果。”周鴻祎感慨道。

當然,中國更廣闊的市場需要中國自己的大模型,中國廠商也有天然的本土優勢。只是放到中西對比這一更大維度的競爭,國內大廠也有自己的局限。

周鴻祎認為,要把ChatGPT訓練好,要用全人類的知識,一定要有開放的思路。全世界中文網頁大概是其他語言網頁的1/10,書籍的數目也不足。此外,國內移動互聯網的迅猛發展,也在制造更多的數據孤島。

“國外雖然App也取代了Web,但國外很多APP基本保留了Web版,用瀏覽器還是能在網頁之間跳來跳去,能夠自由使用。國內信息都被APP私有化了,如果這些巨頭互相把握著,誰的數據都不全,最后訓練出來的大腦肯定能力上是比不上的。”周鴻祎表達了一定程度的悲觀。

事實上,除了語料庫之外,算力也是一個巨大的挑戰。2022年8月底,美國政府宣布禁止美國公司向中國(包括中國香港地區)和俄羅斯出口高端GPU,設定的紅線是:算力超過4800 TOPS,且帶寬傳輸速率超過600 GB/秒,受限產品就包括英偉達A100和后續產品H100。

面向未來的AI大模型,中國互聯網大廠還需更大的勇氣和努力,去突破算力、語料、人才等各種限制。

分享到:
標簽:模型
用戶無頭像

網友整理

注冊時間:

網站:5 個   小程序:0 個  文章:12 篇

  • 51998

    網站

  • 12

    小程序

  • 1030137

    文章

  • 747

    會員

趕快注冊賬號,推廣您的網站吧!
最新入駐小程序

數獨大挑戰2018-06-03

數獨一種數學游戲,玩家需要根據9

答題星2018-06-03

您可以通過答題星輕松地創建試卷

全階人生考試2018-06-03

各種考試題,題庫,初中,高中,大學四六

運動步數有氧達人2018-06-03

記錄運動步數,積累氧氣值。還可偷

每日養生app2018-06-03

每日養生,天天健康

體育訓練成績評定2018-06-03

通用課目體育訓練成績評定