亚洲视频二区_亚洲欧洲日本天天堂在线观看_日韩一区二区在线观看_中文字幕不卡一区

公告:魔扣目錄網(wǎng)為廣大站長(zhǎng)提供免費(fèi)收錄網(wǎng)站服務(wù),提交前請(qǐng)做好本站友鏈:【 網(wǎng)站目錄:http://www.430618.com 】, 免友鏈快審服務(wù)(50元/站),

點(diǎn)擊這里在線咨詢客服
新站提交
  • 網(wǎng)站:51998
  • 待審:31
  • 小程序:12
  • 文章:1030137
  • 會(huì)員:747

火遍抖音的「卡通臉」特效,是怎么做到又逼真又靈動(dòng)的?

說(shuō)到特效玩法,抖音的 “整活兒” 能力一直有目共睹。最近,風(fēng)頭正勁的是一款「卡通臉」特效。無(wú)論男女老少,用上這款特效后,都仿佛從迪士尼動(dòng)畫(huà)里走出來(lái)的人物一樣靈動(dòng)可愛(ài)。「卡通臉」一經(jīng)上線,在抖音上迅速發(fā)酵,深受用戶喜愛(ài),“一鍵變身高甜卡通臉 ”“全抖音的在逃公主都來(lái)了”“用卡通臉花式曬娃 ”“王子公主撒糖手勢(shì)舞”“捕捉童話魔法失靈瞬間” 等相關(guān)熱點(diǎn)不斷衍生,其中,“全抖音的在逃公主都來(lái)了”“捕捉童話魔法失靈瞬間” 更是登上了抖音全國(guó)熱點(diǎn)榜。目前,這一特效的使用人數(shù)已經(jīng)超過(guò) 900w。

「卡通臉」屬于 3D 風(fēng)格特效,這類(lèi)特效的研發(fā)難點(diǎn)主要集中在多樣性的 CG 訓(xùn)練數(shù)據(jù)不易獲取、靈動(dòng)的表情神態(tài)難以還原、真實(shí)貼合的立體膚質(zhì)光影難以實(shí)現(xiàn)、夸張強(qiáng)風(fēng)格的五官形變 GAN 不易學(xué)習(xí)等多個(gè)方面。對(duì)此,字節(jié)跳動(dòng)智能創(chuàng)作團(tuán)隊(duì)在 3D 風(fēng)格化方向重點(diǎn)突破優(yōu)化,不僅解決了上述所有難題,還沉淀了一套通用的技術(shù)解決方案。

「卡通臉」背后的研發(fā)流程創(chuàng)新

過(guò)去,一個(gè)完整的 3D 風(fēng)格化研發(fā)流程分為以下幾個(gè)模塊:

搜集若干原始風(fēng)格圖片 -> 訓(xùn)練 StyleGan 大模型 -> 生成成對(duì)數(shù)據(jù) -> 人工挑選可用成對(duì)數(shù)據(jù) + 設(shè)計(jì)師 P 圖優(yōu)化 -> 訓(xùn)練 p2p 小模型,然后不停反復(fù)。

傳統(tǒng)的研發(fā)流程的問(wèn)題非常明顯:迭代周期長(zhǎng),設(shè)計(jì)師可參與度弱,且不易于沉淀和復(fù)用。

在「卡通臉」這個(gè)特效的研發(fā)中,字節(jié)跳動(dòng)智能創(chuàng)作團(tuán)隊(duì)采用了創(chuàng)新的研發(fā)流程

從設(shè)計(jì)師制作目標(biāo)風(fēng)格效果開(kāi)始,設(shè)計(jì)師按照算法約定的要求提供一些3D美術(shù)素材,然后字節(jié)跳動(dòng)智能創(chuàng)作團(tuán)隊(duì)借助DCC軟件批量渲染若干多樣性的CG數(shù)據(jù),在渲染過(guò)程中技術(shù)團(tuán)隊(duì)首次引入時(shí)下最火的AIGC技術(shù)對(duì)數(shù)據(jù)做了增強(qiáng)處理,之后用GAN合成訓(xùn)練所需的成對(duì)數(shù)據(jù),最后采用自研的形變pix2pix模型訓(xùn)練就可以得到最終效果。

字節(jié)跳動(dòng)智能創(chuàng)作團(tuán)隊(duì)「卡通臉」的研發(fā)流程圖

從流程鏈路可以看出,這一方法大大縮減了迭代周期,提高了自動(dòng)化程度,也讓設(shè)計(jì)師有更高的參與度,實(shí)踐顯示,創(chuàng)新的工程鏈路將迭代周期從 6 個(gè)月縮減至 1 個(gè)月,方案也更易于沉淀和復(fù)用。

「卡通臉」特效是怎么設(shè)計(jì)出來(lái)的

如今在社交媒體上有越來(lái)越多的變身特效,人們?cè)絹?lái)越注重特效的美觀性和精確度,為了讓用戶更好地實(shí)現(xiàn)風(fēng)格化變身的效果,抖音特效的設(shè)計(jì)師們經(jīng)過(guò)精心研究,結(jié)合了熱門(mén)動(dòng)畫(huà)畫(huà)風(fēng),創(chuàng)新地設(shè)計(jì)了一套卡通臉特效,讓用戶可以體驗(yàn)到動(dòng)畫(huà)般靈動(dòng)的角色風(fēng)格,同時(shí)滿足了用戶的變美變帥需求。

抖音特效設(shè)計(jì)師針對(duì)目前市場(chǎng)上現(xiàn)有的變身特效進(jìn)行了深入研究,發(fā)現(xiàn)現(xiàn)有的特效存在風(fēng)格不夠吸引人、表情夸張度不足、燈光效果不夠真實(shí)等問(wèn)題。因此,抖音特效設(shè)計(jì)師結(jié)合國(guó)內(nèi)審美,重新設(shè)計(jì)了卡通臉的畫(huà)風(fēng),將男女面部比例特征夸張化,重構(gòu)成可愛(ài)圓臉五官靈巧的 “女孩” 和硬朗長(zhǎng)臉五官帥氣的 “男生”。在這一過(guò)程中,設(shè)計(jì)師保留了用戶本身的頭發(fā),增強(qiáng)了頭發(fā)的蓬松感及光澤度,使其與卡通臉的融合更加自然,卡通質(zhì)感的皮膚也融入了用戶本人皮膚的細(xì)節(jié),使特效更具有用戶的個(gè)性特征。

此外,抖音特效的設(shè)計(jì)師還定義了不同燈光下的光影質(zhì)感,滿足復(fù)雜場(chǎng)景下的燈光還原的需求,使卡通臉更加立體且自然,融入日常自拍無(wú)違和感。最后,設(shè)計(jì)師還制作了夸張符號(hào)化的面部表情,通過(guò)對(duì)數(shù)字人資產(chǎn)采用面部捕捉技術(shù)生成表情 CG 數(shù)據(jù),不斷完善訓(xùn)練數(shù)據(jù)和算法,產(chǎn)出了能夠更加靈動(dòng)展現(xiàn)用戶個(gè)性的表情效果。

自建 CG 合成數(shù)據(jù)流,高質(zhì)量訓(xùn)練數(shù)據(jù)可復(fù)用

3D 風(fēng)格類(lèi)特效的訓(xùn)練數(shù)據(jù)來(lái)源依賴高質(zhì)量的 CG 渲染數(shù)據(jù),且對(duì)數(shù)據(jù)分布的多樣性要求比較高,同時(shí) 3D 資產(chǎn)手動(dòng)建模也是一個(gè)非常耗費(fèi)人力的過(guò)程,可復(fù)用性也不足,往往一個(gè)項(xiàng)目花費(fèi)了昂貴的人力時(shí)間成本制作了一批 3D 資產(chǎn),在項(xiàng)目結(jié)束后就完全廢棄了。

此次,字節(jié)跳動(dòng)智能創(chuàng)作團(tuán)隊(duì)搭建了一套通用易擴(kuò)展的 CG 合成數(shù)據(jù)工作流。

字節(jié)跳動(dòng)智能創(chuàng)作團(tuán)隊(duì) CG 合成數(shù)據(jù)流的流程圖

這一合成數(shù)據(jù)流的工作流程如下:

1. 通過(guò) Houdini 程序化的生成數(shù)字資產(chǎn),程序化捏臉,綁骨,調(diào)整權(quán)重等,建立真實(shí)感數(shù)字人模型資產(chǎn)庫(kù)。

多樣性 3D 數(shù)字資產(chǎn)

2. 通過(guò) Houdini 的 Solaris 構(gòu)建 USD 模板,將頭發(fā),毛發(fā),頭模,服飾,表情系數(shù)等資產(chǎn)分別以 USD reference 導(dǎo)入。

皮膚貼圖樣本

虹膜貼圖樣本

3. 通過(guò) Houdini 的 PDG 對(duì)資產(chǎn),相機(jī)角度,燈光環(huán)境等進(jìn)行隨機(jī)組合。利用 PDG 對(duì) workitem 的控制,精準(zhǔn)的控制數(shù)據(jù)分布。

自動(dòng)化的 PDG 節(jié)點(diǎn)圖

由于研發(fā)過(guò)程需要頻繁提供大量的渲染數(shù)據(jù)用于效果迭代,這需要花費(fèi)大量算力成本以及渲染等待時(shí)間。此前,抖音的「魔法變身」特效上,團(tuán)隊(duì)曾花費(fèi)了數(shù)百萬(wàn)成本使用外部農(nóng)場(chǎng)用于數(shù)據(jù)渲染。而在「卡通臉」特效上,團(tuán)隊(duì)基于字節(jié)跳動(dòng)旗下云平臺(tái)火山引擎扎實(shí)的基礎(chǔ)設(shè)施,大大降低了算力成本。

字節(jié)跳動(dòng)智能創(chuàng)作團(tuán)隊(duì)參考影視工業(yè)的流程,搭建了一套自研的渲染農(nóng)場(chǎng)平臺(tái)。它可以將離線任務(wù)拆解到若干個(gè)渲染機(jī)器上進(jìn)行并行處理。通過(guò)火山引擎鏡像平臺(tái)進(jìn)行鏡像托管、資源池化平臺(tái)進(jìn)行資源申請(qǐng)與釋放、cpu/gpu 集群進(jìn)行容器動(dòng)態(tài)擴(kuò)縮容,再使用 nas 進(jìn)行資產(chǎn)管理,渲染農(nóng)場(chǎng)具備了一鍵擴(kuò)充數(shù)千個(gè)渲染節(jié)點(diǎn)進(jìn)行高效計(jì)算的能力。

基于此,字節(jié)跳動(dòng)智能創(chuàng)作團(tuán)隊(duì)自定義了單任務(wù)處理邏輯,包括前處理、引擎渲染、后處理等步驟。并根據(jù)需要,在任何時(shí)候動(dòng)態(tài)擴(kuò)展 / 縮小集群規(guī)模以最大化利用算力資源。

為了進(jìn)一步提高效率,讓設(shè)計(jì)師更方便參與到效果優(yōu)化中,技術(shù)團(tuán)隊(duì)還制作了飛書(shū)小程序供設(shè)計(jì)師使用,通過(guò)飛書(shū)觸發(fā)云端的自動(dòng)化流程來(lái)迭代美術(shù)效果,在云端任務(wù)完成后,會(huì)發(fā)送消息回到飛書(shū)供設(shè)計(jì)師查看,大大提高了設(shè)計(jì)師工作的效率。

同時(shí),字節(jié)跳動(dòng)智能創(chuàng)作團(tuán)隊(duì)自定義了事件驅(qū)動(dòng)(EventTrigger)和 Api 來(lái)打通農(nóng)場(chǎng)、飛書(shū)平臺(tái)以及云桌面平臺(tái),最大程度推進(jìn) All in one 理念,讓設(shè)計(jì)師和工程師都能基于飛書(shū)和云桌面更方便地完成協(xié)同研發(fā)。

自研的渲染農(nóng)場(chǎng)平臺(tái)

AIGC 新技術(shù)的應(yīng)用

隨著 DALL?E 的問(wèn)世,2021 年初字節(jié)跳動(dòng)智能創(chuàng)作團(tuán)隊(duì)就開(kāi)始了相關(guān)技術(shù)的跟進(jìn)和規(guī)劃,字節(jié)跳動(dòng)智能創(chuàng)作團(tuán)隊(duì)在 Stable Diffusion 開(kāi)源模型的基礎(chǔ)上,構(gòu)建了數(shù)據(jù)量達(dá)十億規(guī)模的數(shù)據(jù)集,訓(xùn)練出兩個(gè)模型,一個(gè)是通用型的模型 Diffusion Model,可以生成如油畫(huà)、水墨畫(huà)風(fēng)格的圖片;另外一個(gè)是動(dòng)漫風(fēng)格的 Diffusion Model 模型。

前不久,由字節(jié)跳動(dòng)智能創(chuàng)作團(tuán)隊(duì)支持的「AI 繪畫(huà)」特效在抖音上大火,采用的就是這一新技術(shù)。此次在抖音「卡通臉」上,技術(shù)團(tuán)隊(duì)進(jìn)一步挖掘 Diffusion Model 在 3D 卡通風(fēng)格上的生成能力,采用了圖片生成圖片的策略,首先對(duì)圖片進(jìn)行加噪,然后再用訓(xùn)練好的文生圖模型在文本的引導(dǎo)下去噪。基于一個(gè)預(yù)訓(xùn)練好的 Stable Diffusion 模型,輸入 GAN 生成的與真人圖相匹配的目標(biāo) 3D 風(fēng)格結(jié)果圖,通過(guò)精調(diào)過(guò)的一組文本關(guān)鍵詞,引導(dǎo)目標(biāo)風(fēng)格往期望的方向靠近,Stable Diffusion 輸出的結(jié)果即作為最終數(shù)據(jù)交給后續(xù)的 GAN 模型學(xué)習(xí)。

自研的形變 GAN 模型

由于抖音「卡通臉」的目標(biāo)風(fēng)格與原始人像相比有較大形變,直接用傳統(tǒng) p2p 框架難以訓(xùn)練出高質(zhì)量效果,字節(jié)跳動(dòng)智能創(chuàng)作團(tuán)隊(duì)自研了一套 p2p 形變 GAN 訓(xùn)練框架,對(duì)于訓(xùn)練大形變、強(qiáng)風(fēng)格的卡通目標(biāo)有很好的效果。字節(jié)跳動(dòng)智能創(chuàng)作團(tuán)隊(duì)自研的形變 GAN 訓(xùn)練框架包含兩個(gè)部分:

1、風(fēng)格化初步訓(xùn)練,提取卡通臉風(fēng)格化信息。技術(shù)團(tuán)隊(duì)構(gòu)建了一個(gè)風(fēng)格化信息交互融合的非配對(duì)訓(xùn)練框架,將真人和卡通臉數(shù)據(jù)集輸入到該框架就可以提取卡通臉風(fēng)格化信息。該框架是一個(gè)端到端的訓(xùn)練框架,包含了風(fēng)格化特征編碼、特征融合、重建訓(xùn)練和風(fēng)格化初步訓(xùn)練,訓(xùn)練完成后得到一個(gè)卡通臉風(fēng)格化信息,用于下一步精細(xì)化訓(xùn)練。

2、融合卡通臉風(fēng)格化信息,精細(xì)訓(xùn)練。由第一步得到的卡通臉風(fēng)格化信息包含了風(fēng)格和形變等信息,將這部分信息融合到真人圖進(jìn)行精細(xì)化訓(xùn)練,利用 p2p 相關(guān)的強(qiáng)監(jiān)督 loss 進(jìn)行配對(duì)訓(xùn)練,訓(xùn)練收斂后得到卡通臉模型。

基于以上創(chuàng)新的技術(shù)方案,抖音「卡通臉」不僅簡(jiǎn)化了工程鏈路、大幅提升迭代效率,還在大角度、表情豐富度、效果風(fēng)格還原、光影一致性和多膚色匹配等方面取得了明顯的優(yōu)化效果。據(jù)了解,負(fù)責(zé)「卡通臉」項(xiàng)目的字節(jié)跳動(dòng)智能創(chuàng)作團(tuán)隊(duì)自 2021 年以來(lái)就在 3D 風(fēng)格化方向重點(diǎn)突破優(yōu)化,該技術(shù)方案已支持多款 3D 風(fēng)格特效取得平臺(tái)爆款的成績(jī)。

關(guān)于字節(jié)跳動(dòng)智能創(chuàng)作團(tuán)隊(duì):

智能創(chuàng)作團(tuán)隊(duì)是字節(jié)跳動(dòng) AI & 多媒體技術(shù)中臺(tái),通過(guò)建設(shè)領(lǐng)先的計(jì)算機(jī)視覺(jué)、音視頻編輯、特效處理等技術(shù),支持抖音、剪映、頭條等公司內(nèi)眾多產(chǎn)品線;同時(shí)通過(guò)火山引擎為外部 ToB 合作伙伴提供業(yè)界前沿的智能創(chuàng)作能力與行業(yè)解決方案。

分享到:
標(biāo)簽:特效
用戶無(wú)頭像

網(wǎng)友整理

注冊(cè)時(shí)間:

網(wǎng)站:5 個(gè)   小程序:0 個(gè)  文章:12 篇

  • 51998

    網(wǎng)站

  • 12

    小程序

  • 1030137

    文章

  • 747

    會(huì)員

趕快注冊(cè)賬號(hào),推廣您的網(wǎng)站吧!
最新入駐小程序

數(shù)獨(dú)大挑戰(zhàn)2018-06-03

數(shù)獨(dú)一種數(shù)學(xué)游戲,玩家需要根據(jù)9

答題星2018-06-03

您可以通過(guò)答題星輕松地創(chuàng)建試卷

全階人生考試2018-06-03

各種考試題,題庫(kù),初中,高中,大學(xué)四六

運(yùn)動(dòng)步數(shù)有氧達(dá)人2018-06-03

記錄運(yùn)動(dòng)步數(shù),積累氧氣值。還可偷

每日養(yǎng)生app2018-06-03

每日養(yǎng)生,天天健康

體育訓(xùn)練成績(jī)?cè)u(píng)定2018-06-03

通用課目體育訓(xùn)練成績(jī)?cè)u(píng)定