當(dāng)人工智能進(jìn)入千模大戰(zhàn)的白熱化狀態(tài)時(shí),有些玩家開始獨(dú)辟蹊徑,要做大模型背后的“代理人”。這種智能代理的模式又被稱為大模型調(diào)用工具。
阿里云走的就是這條路線,它推出的大模型調(diào)用工具——魔搭GPT(ModelScopeGPT),可以完成比單獨(dú)的大語(yǔ)言模型更高級(jí)和多元化的任務(wù)。
比如,用戶在魔搭GPT的對(duì)話框輸入任務(wù):“用20字描述一款新的VR眼鏡,并用女聲朗讀,隨后轉(zhuǎn)成視頻”,魔搭GPT會(huì)展示整個(gè)任務(wù)規(guī)劃過程,先由中樞模型生成一段描述VR眼鏡的文案,接著調(diào)用語(yǔ)音生成模型,生成語(yǔ)音并用女聲念出,最后調(diào)用視頻生成模型,輸出最終的視頻內(nèi)容。過程中,魔搭GPT先后調(diào)用了一大二小三個(gè)模型。
那么如何保證魔搭GPT有足夠多的模型可以調(diào)用呢?
阿里云為此建立了一個(gè)魔搭社區(qū),作為國(guó)內(nèi)最大的AI模型社區(qū),它集聚了180多萬(wàn)開發(fā)者和900多個(gè)優(yōu)質(zhì)AI模型,這些模型由20多家頂尖人工智能機(jī)構(gòu)貢獻(xiàn),累計(jì)下載量突破3600萬(wàn)。這其中,有約100個(gè)參數(shù)規(guī)模在10億以上的大模型。在魔搭平臺(tái)上,所有模型生產(chǎn)者都可上傳模型,驗(yàn)證模型的技術(shù)能力,探索模型的應(yīng)用場(chǎng)景和商業(yè)化模式。
而上述產(chǎn)品,正是阿里Maas(“模型即服務(wù)”)概念的具體體現(xiàn)。
在7月7日的世界人工智能大會(huì)上,阿里云CTO周靖人闡釋了Maas的幾層含義:
最底層的含義是要把模型作為重要的生產(chǎn)元素,圍繞模型的生命周期設(shè)計(jì)我們的產(chǎn)品,設(shè)計(jì)我們的技術(shù),從模型的開發(fā)入手,包括數(shù)據(jù)處理、特征工程、模型的訓(xùn)練和調(diào)優(yōu)、模型的服務(wù)等等,圍繞這樣模型生命周期提供各種各樣的產(chǎn)品和技術(shù)。
模型還有另外一層含義,圍繞模型的生態(tài)發(fā)展,除了底層的基礎(chǔ)模型,我們還會(huì)聚焦行業(yè),有行業(yè)的專屬模型,甚至到某一個(gè)企業(yè),根據(jù)具體的應(yīng)用場(chǎng)景,還有企業(yè)或者具體場(chǎng)景需要的專屬模型。可以看到模型正以這樣層次化的結(jié)構(gòu)不斷發(fā)展、不斷創(chuàng)新。
另外,模型不光是在云上,在端上、IOT設(shè)備里面也發(fā)揮了一系列的作用,今后,完整的模型生態(tài)不光是今天涉及到的云端,還會(huì)有手機(jī)端和隨身設(shè)備,模型在無(wú)形之中也形成了立體的服務(wù)機(jī)制,服務(wù)生活的方方面面。
在發(fā)布通義千問大模型之后,阿里云一直在豐富其AI產(chǎn)品形態(tài),6月1日,阿里云發(fā)布了通義聽悟,這是一款基于通義千問語(yǔ)言模型、音視頻AI模型能力,能為用戶帶來(lái)音頻、視頻內(nèi)容記錄和閱讀全新體驗(yàn)的AI助手,幫助隨時(shí)隨地高效完成對(duì)音視頻內(nèi)容的轉(zhuǎn)寫、檢索、摘要和整理,比如用大模型自動(dòng)做筆記、整理訪談、提取PPT等,可成為用戶工作學(xué)習(xí)中的得力AI助手。
7月7日,周靖人又推出了通義家族的一個(gè)新成員:通義萬(wàn)相。
通義萬(wàn)相是繪畫領(lǐng)域的模型。大家通過文字描述的方式,讓萬(wàn)相生成相關(guān)圖片。還可以結(jié)合一系列的模式和風(fēng)格,讓萬(wàn)相快速生成符合你描述的語(yǔ)義以及相關(guān)風(fēng)格的精美圖片。描述語(yǔ)義可以通過多種語(yǔ)言,有效地精準(zhǔn)地去描繪自己要生成圖片的內(nèi)容。
除此之外,萬(wàn)相也可以做風(fēng)格遷移。比如,比較滿意圖片中體現(xiàn)的語(yǔ)義,但是不滿意圖象風(fēng)格,就能通過通義萬(wàn)相做風(fēng)格的遷移。
如果我們比較喜歡某個(gè)圖片的風(fēng)格,希望生成更多樣性的圖片,就可以利用相似圖的生成,讓通義萬(wàn)相在保持相關(guān)風(fēng)格的情況下,生成更多樣的圖片。
【來(lái)源:市界】