去年開始,快手、火山小視頻等數(shù)十家短視頻社交平臺在數(shù)月內(nèi)相繼被網(wǎng)信辦約談,短視頻社交平臺從此迎來了一系列大刀闊斧的整改篇章。不久前,網(wǎng)信辦會同有關(guān)部門對吱呀、語玩、一說FM等26款音頻社交平臺進(jìn)行新一輪全面集中整治,新興的音頻社交平臺因此迎來不少質(zhì)疑。
在一年多的時間內(nèi),互聯(lián)網(wǎng)的UGC內(nèi)容審查方向均在走向人工強干預(yù),業(yè)界甚至有人認(rèn)為,真正靠AI審核內(nèi)容可能還需要5-10年的窗口期?,F(xiàn)實已經(jīng)表明,只有督促互聯(lián)網(wǎng)公司承擔(dān)社會責(zé)任,強調(diào)算法的價值觀,在產(chǎn)品設(shè)計上創(chuàng)新未成年人保護(hù)措施,加強內(nèi)容安全監(jiān)管,才能杜絕短視頻社交平臺中的種種亂象。
人工干預(yù)已成行業(yè)共識
得益于算法技術(shù)的發(fā)展,互聯(lián)網(wǎng)公司通過用戶畫像實現(xiàn)了相對精準(zhǔn)的信息推送。但如果不對信息的分發(fā)加以干預(yù),諸如強烈性暗示、虛假信息、軟色情等內(nèi)容就會在推薦網(wǎng)絡(luò)中蔓延,科技界、媒體界由此展開了關(guān)于“算法有沒有價值觀”的討論。
字節(jié)跳動創(chuàng)始人張一鳴曾發(fā)表公開信,表明為糾正機器與算法的缺陷,將原有6000人的運營審核隊伍,擴大到10000人。2018年4月被網(wǎng)信辦約談后,快手官方表示,將原有2000人的審核團(tuán)隊擴充至5000人。在“算法有沒有價值觀”這一命題上,快手和字節(jié)跳動最終作出了少有的共同選擇。
今年4月,探探因整改下架,在其后陌陌第1季度財報會議中,唐巖表示將加大內(nèi)容審核業(yè)務(wù)上的資源投入。最新一輪開展集中整治的26款音頻社交平臺中,社交應(yīng)用Soul也公開回應(yīng)稱將嚴(yán)格審核相關(guān)功能和內(nèi)容,其整改措施中同樣包括加強審核團(tuán)隊建設(shè),將會增招大量內(nèi)容審核及主管級人員。
如今的探探,在其朋友圈發(fā)表動態(tài)會進(jìn)入長時間的審核狀態(tài)。而在Soul,其動態(tài)內(nèi)容審核據(jù)稱已全面覆蓋除機器判定外的兩道人工審核流程,在未來新版本中當(dāng)動態(tài)內(nèi)容判斷為涉嫌違規(guī)時也會直接給予用戶提醒。
上述四款應(yīng)用的整改措施都在強化人工審核在內(nèi)容審查機制中的主導(dǎo)作用,從一個側(cè)面印證了機器分發(fā)的局限性。
機器審核只能輔助識別
得益于音視頻技術(shù)的發(fā)展,音視頻匹配通話、音視頻直播、音視頻信息流等新型媒介走進(jìn)人們的數(shù)字屏幕,給人們帶來嶄新的通訊體驗和娛樂視聽上的享受。音視頻內(nèi)容技術(shù)審核要求高,完善審查機制耗費較大人力財力,但這并不代表一籌莫展。
音頻內(nèi)容的機器審核方案中,音頻識別轉(zhuǎn)文本匹配關(guān)鍵詞是目前通用的基礎(chǔ)方案。先識別音頻中的語言語種,語音識別轉(zhuǎn)化為文本信息后索引出關(guān)鍵詞,在這一過程就可以植入現(xiàn)有文本識別中的上下語義分析,機器識別出與模型相似度最高的垃圾內(nèi)容進(jìn)行剔除。但正如機器與算法的缺陷,目前業(yè)界的音頻識別技術(shù)能力尚未到達(dá)可以完全代替人工審核的階段,特別是在處理方言、有不同音軌的雜音等場景時。
視頻內(nèi)容實則由音頻內(nèi)容、視頻畫面內(nèi)容兩個對象組成,視頻畫面內(nèi)容的機器審核,業(yè)界目前常采用截取畫面幀上傳識別,最終復(fù)用的是圖片識別通道對場景、人物、物品進(jìn)行判斷是否違規(guī)。但以常用的24幀標(biāo)準(zhǔn)為例,一個60秒的視頻就多達(dá)1440個畫面幀,要實現(xiàn)覆蓋全畫面幀的機器審核則會耗費極大的資源,故此常見的審核設(shè)計是設(shè)定視頻的截取時段選取部分畫面幀進(jìn)行機器審核。在無法覆蓋全畫面幀的審核的條件下,自然就出現(xiàn)了視頻內(nèi)容“閃現(xiàn)”色情違禁內(nèi)容的風(fēng)險,更有甚者,一些人通過畫面內(nèi)容隱晦表達(dá),圖片的機器審核難以理解表義。
其實無論什么載體的媒介,在真正的AI時代來臨之前,所有的機器審核都只會是人工的輔助。在流程設(shè)計上,機器審核可以做到的就是幫助運維者先行剔除大量確切違規(guī)的內(nèi)容,剩下的人工審核流程可不能說省就省。舉個例子,一張人像圖片,可以劃分為“色情”、“性感”、“正常”三個維度,機器審核可以根據(jù)肉體裸露的程度進(jìn)行判斷,實際上信息的表義可沒那么簡單,究竟該怎么定義“性感”?全無裸露的人體通過場景與動作的表達(dá)能不能達(dá)到人們對“色情”的認(rèn)知?
人生而愛美,如果說“性感”可以從性暗示程度、信息接收者的舒適度作為標(biāo)桿,那么定性標(biāo)尺就掌握在網(wǎng)站運維者手上,各社交平臺的編輯責(zé)任制也因此誕生。
圍繞重點開展技術(shù)創(chuàng)新
今年3月,國家網(wǎng)信辦組織抖音、快手、火山小視頻試點“青少年防沉迷系統(tǒng)”,其主要功能在于獨立分發(fā)未成年用戶的專屬內(nèi)容,以及限制其使用時長。
防沉迷系統(tǒng)最初應(yīng)用于游戲行業(yè),而短視頻新媒介具有沉浸式體驗強、占據(jù)用戶時長的特點,將防沉迷系統(tǒng)適配到短視頻里,在業(yè)界起到了理想的標(biāo)桿效應(yīng)。
今年“六一”兒童節(jié)前夕,國家網(wǎng)信辦再次指導(dǎo)西瓜視頻、好看視頻、嗶哩嗶哩、微博等14家短視頻社交平臺,以及騰訊視頻、愛奇藝、優(yōu)酷、PP視頻等4家網(wǎng)絡(luò)視頻平臺統(tǒng)一上線“青少年防沉迷系統(tǒng)”。