8月19-21日,中國圖象圖形大會(huì)(CCIG 2022)在成都舉辦,金山辦公受邀參會(huì)并發(fā)表主題演講,展示公司在CV(Computer Vision計(jì)算機(jī)視覺)領(lǐng)域取得的突破性研究成果及場景應(yīng)用。
金山辦公CV團(tuán)隊(duì)負(fù)責(zé)人熊龍飛在演講中表示,前三次工業(yè)革命將人從繁重的體力勞動(dòng)中解放出來,而以大數(shù)據(jù)、人工智能等技術(shù)為驅(qū)動(dòng)力的第四次工業(yè)革命將進(jìn)一步將人從繁復(fù)的、低價(jià)值腦力勞動(dòng)中解放出來。
他認(rèn)為,文檔文字、圖像和表格的處理是日常工作和生活中最高頻的腦力勞動(dòng)之一,其中很多工作其實(shí)可以通過CV技術(shù)來完成。
近年來,金山辦公在以CV技術(shù)為支撐的OCR文字識別領(lǐng)域已達(dá)到業(yè)界領(lǐng)先水平。除了滿足基本的文檔內(nèi)容識別,金山辦公通過加入深度學(xué)習(xí)能力,對文字屬性和段落做了一系列算法優(yōu)化,能夠更精準(zhǔn)地還原文字風(fēng)格,對諸如文字顏色、字體、加粗、斜體和下劃線等格式都能進(jìn)行高度識別,顯著提高文檔還原度,為用戶節(jié)省大量后期手動(dòng)調(diào)整的時(shí)間和精力。
例如,對于圖片中的文字,金山辦公不僅能夠識別出字體的名稱,還會(huì)推薦該字體及相似字體給用戶選擇使用。
熊龍飛還特別提到,“針對一些特定格式,例如目錄,我們不僅可以完整地識別出目錄內(nèi)容,更能支持點(diǎn)擊跳轉(zhuǎn)到相應(yīng)的頁面。”
同時(shí),金山辦公的OCR文字識別可以靈活滿足多種應(yīng)用環(huán)境下的部署需求,既支持服務(wù)端的高精度模型部署,也支持手機(jī)、PC端的小模型部署。
“未來,金山辦公會(huì)繼續(xù)在文字識別領(lǐng)域保持快速的迭代速度和強(qiáng)大競爭力,因?yàn)槲覀儞碛腥蜃铨?的數(shù)據(jù)儲備和真實(shí)?戶反饋池。”熊龍飛進(jìn)一步表示。
而對于識別難度更高的實(shí)體文件,例如帶有印章的公文、被揉皺的表格等,通過金山辦公的版式還原系統(tǒng)便能輕松實(shí)現(xiàn)高度還原,并自動(dòng)將實(shí)體文件變成可編輯的電子文檔。對于用戶來說,這將極大地節(jié)省人工輸入產(chǎn)生的時(shí)間成本。
據(jù)介紹,金山辦公的版式還原系統(tǒng)由近三十個(gè)深度學(xué)習(xí)模型、一百多個(gè)算法模塊、50多萬行代碼構(gòu)成,擁有復(fù)雜的功能模塊和調(diào)度流程,具備從文檔分類、矯正、識別、分析到重建的能力,最終可以輸出結(jié)構(gòu)化的數(shù)據(jù)表達(dá)或常見的docx等多種格式的文檔。
除此之外,金山辦公的CV能力還在智能摳圖、證件照制作、文檔質(zhì)量提升、濾鏡、水印涂抹等眾多產(chǎn)品功能上得到應(yīng)用,充分賦能各種場景下的辦公自動(dòng)化。
金山辦公在過去34年持續(xù)深耕辦公賽道,堅(jiān)持技術(shù)立業(yè),不斷打磨技術(shù)和產(chǎn)品服務(wù)。公司承擔(dān)多項(xiàng)國家級重大科研項(xiàng)目研發(fā)任務(wù),包括“核高基”科技重大專項(xiàng)、電子發(fā)展基金、“863”高技術(shù)研究發(fā)展計(jì)劃等,并先后兩次榮獲國家科技進(jìn)步二等獎(jiǎng)。
公司在近年持續(xù)加大AI領(lǐng)域的研發(fā)投入,并把OCR、版面的識別和理解列為重點(diǎn)任務(wù)。早在2018年,公司就成立了CV團(tuán)隊(duì),聚焦WPS等產(chǎn)品上圖像及視覺項(xiàng)目的研發(fā)與應(yīng)用,通過CV能力賦能各類辦公場景,目前已在OCR文字識別、文檔矯正、智能摳圖、字體識別、表格還原、版式還原、PDF編輯等二十多個(gè)功能上線相關(guān)產(chǎn)品和服務(wù)。
目前,金山辦公為來自全球220多個(gè)國家和地區(qū)的用戶提供辦公服務(wù)。截至2021年12月,公司主要產(chǎn)品月度活躍設(shè)備數(shù)為5.44億,其中WPS office PC版月度活躍設(shè)備數(shù)2.19億,移動(dòng)版月度活躍設(shè)備數(shù)3.21億。
CCIG 2022 由中國科學(xué)技術(shù)協(xié)會(huì)指導(dǎo)、中國圖象圖形學(xué)會(huì)主辦,以“圖象視界,形智未來”為主題,匯聚國內(nèi)外眾多知名學(xué)者、企業(yè)專家及科研院校師生,共同探討圖像圖形技術(shù)行業(yè)的最新進(jìn)展。