【ITBEAR】9月24日消息,字節(jié)跳動(dòng)旗下火山引擎今日在深圳成功舉辦AI創(chuàng)新巡展,活動(dòng)中正式推出了兩款全新的大模型:豆包視頻生成-PixelDance與豆包視頻生成-Seaweed。
火山引擎總裁譚待在活動(dòng)現(xiàn)場(chǎng)發(fā)表講話,強(qiáng)調(diào)視頻生成領(lǐng)域仍面臨諸多挑戰(zhàn),并承諾豆包的兩款新模型將持續(xù)進(jìn)化,致力于在解決核心問(wèn)題上探索更多可能性,并加速AI視頻創(chuàng)作的應(yīng)用落地與拓展。
據(jù)ITBEAR了解,豆包視頻生成模型在鏡頭切換方面展現(xiàn)出卓越能力,能夠?qū)崿F(xiàn)自然流暢的多拍動(dòng)作與復(fù)雜的多主體交互。基于DiT架構(gòu),該模型支持變焦、環(huán)繞、平搖、縮放、目標(biāo)跟隨等多種鏡頭語(yǔ)言,同時(shí)在鏡頭切換時(shí)保持主體、風(fēng)格、氛圍的一致性。

在畫面風(fēng)格上,經(jīng)過(guò)剪映、即夢(mèng)AI等技術(shù)的持續(xù)迭代,豆包視頻生成模型已具備專業(yè)級(jí)的光影布局和色彩調(diào)和能力。其Transformer結(jié)構(gòu)經(jīng)過(guò)深度優(yōu)化,可支持3D動(dòng)畫、2D動(dòng)畫、國(guó)畫、黑白、厚涂等多種風(fēng)格,并能適配不同電子設(shè)備的屏幕比例,適用于電商營(yíng)銷、動(dòng)畫教育、城市文旅、微劇本等多種場(chǎng)景。
目前,新款豆包視頻生成模型正在即夢(mèng)AI內(nèi)測(cè)版中進(jìn)行小范圍測(cè)試,預(yù)計(jì)未來(lái)將逐步開放給所有用戶。
此次活動(dòng)還見證了豆包大模型家族的其他重要成員發(fā)布,包括豆包音樂(lè)模型和同聲傳譯模型,至此,豆包大模型已全面覆蓋語(yǔ)言、語(yǔ)音、圖像、視頻等多種模態(tài)。
火山引擎披露的數(shù)據(jù)顯示,截至9月,豆包語(yǔ)言模型的日均tokens使用量已超過(guò)1.3萬(wàn)億,與5月首次發(fā)布時(shí)相比增長(zhǎng)了十倍。同時(shí),多模態(tài)數(shù)據(jù)處理量也分別達(dá)到每天5000萬(wàn)張圖片和85萬(wàn)小時(shí)語(yǔ)音。
關(guān)鍵詞:#字節(jié)跳動(dòng)# #火山引擎# #豆包視頻生成模型# #AI創(chuàng)新# #多模態(tài)數(shù)據(jù)處理#






