1月23日、24日,由中國計算機學會(CCF)主辦,CCF七大優(yōu)秀專委會、教育部易班發(fā)展中心、長沙市科技局、長沙高新區(qū)管委會、湖南大學、數(shù)聯(lián)眾創(chuàng)共同承的2020 CCF大數(shù)據(jù)與計算智能大賽(簡稱CCF BDCI)決賽暨中國大數(shù)據(jù)技術大會在湖南長沙圓滿落幕。
中國大數(shù)據(jù)技術大會歷經(jīng)13年,已成為大數(shù)據(jù)領域極具影響力的行業(yè)盛會。本屆大會邀請到中國科學院院士、CCF理事長梅宏,中國工程院院士桂衛(wèi)華,中國科學院院士王懷民,中國工程院院士王耀南及多位學術專家、企業(yè)負責人等齊聚一堂,圍繞大數(shù)據(jù)產(chǎn)業(yè)前沿領域進行分享與交流。開幕式上,長沙市政府副市長邱繼興,中國科學院院士、CCF理事長梅宏和湖南大學校長段獻忠分別致辭,希冀通過此次活動搭建交流平臺,為技術創(chuàng)新、資源共享凝聚更多力量。中科院計算所副所長、CCF大數(shù)據(jù)專家委員會秘書長程學旗發(fā)表大賽影響力報告,探討了大賽呈現(xiàn)出大數(shù)據(jù)與AI交叉融合的趨勢。在以《大數(shù)據(jù)新十年-數(shù)字經(jīng)濟機遇與挑戰(zhàn)》為主題的院士論壇上,梅宏、王懷民、桂衛(wèi)華和王耀南四位院士分享了各自觀點。

(圖:《大數(shù)據(jù)新十年-數(shù)字經(jīng)濟機遇與挑戰(zhàn)》院士論壇)
現(xiàn)場,來自高校、企業(yè)等行業(yè)內(nèi)專家與負責人圍繞大數(shù)據(jù)與AI,從不同角度進行了精彩的分享。百度技術委員會主席吳華受邀參與,并作《知識與語言智能》主題演講。“自然語言處理是研究人和計算機之間有效溝通的理論和方法,要使計算機擁有人類的語言溝通以及超越人類的跨語言溝通能力。”吳華詳細介紹了百度自然語言處理方向的深耕與布局,并介紹了基于飛槳的NLP開源算法庫PaddleNLP。

(圖:百度技術委員會主席吳華進行演講)
吳華表示,目前自然語言的發(fā)展已經(jīng)歷了符號邏輯階段、淺層學習階段,現(xiàn)在正經(jīng)歷深度學習階段。在這樣的背景下,百度構建了完整的語言與知識技術布局,基于產(chǎn)業(yè)級開源深度學習平臺飛槳,研發(fā)了語義表示、序列標注、文本分類等核心技術,并對大眾開源開放。
自然語言處理實現(xiàn)基本常識和推理能力離不開知識圖譜。吳華介紹道,目前已經(jīng)構建了十億級實體、千億級事實的多元異構知識圖譜,以醫(yī)療圖譜為例,已落地應用并輔助國內(nèi)130余家基層醫(yī)院的基層醫(yī)生有效降低了誤診率。此外,百度知識增強的語義理解框架文心(ERNIE)大幅提升機器理解語言的水平,并持續(xù)推出知識增強視覺-語言預訓練模型ERNIE-VIL、多語言預訓練模型ERNIE-M、結合語義與結構信息的圖神經(jīng)網(wǎng)絡模型ERNIESage等多個模型,持續(xù)有效提升視覺推斷、多語言任務、文本推斷的效果。
有了文本的基礎知識,百度還提出了基于隱式知識和顯式知識的知識對話系統(tǒng):在隱式知識方面推出PLATO對話模型取得優(yōu)異效果,在顯式知識系統(tǒng)中開發(fā)了首個基于千萬級節(jié)點的對話式推薦系統(tǒng)。通過嵌入知識的模型,人機對話、機機對話得以更加流暢。
機器翻譯一直是自然語言處理領域的熱點之一。“百度不僅提出了基于語義單元的順句翻譯,使機器翻譯效果可以說媲美人類同傳,還構建了目前最大的中英同傳語料庫進行開源。”吳華表示,為了促進同傳的發(fā)展,百度組織了國際同傳的Workshop和Tutorial,同時百度的同傳技術也在國內(nèi)國際上服務了如服貿(mào)會、全球人工智能博覽會等重要國際會議,都收到了良好反饋。
在不斷提升自身技術實力的同時,百度聯(lián)合中國計算機學會、中文信息學會共同發(fā)布的“千言”數(shù)據(jù)共建計劃也在持續(xù)進行著數(shù)據(jù)集與算力的共建共享。現(xiàn)場,吳華再次發(fā)起號召,希望更多開發(fā)者參與到千言數(shù)據(jù)共建計劃,與學界、產(chǎn)業(yè)界共同推進技術進步。
在以《長沙大數(shù)據(jù)與人工智能產(chǎn)業(yè)發(fā)展戰(zhàn)略與對策》為主題的圓桌訪談環(huán)節(jié)中,來自湖南大學的主持人李肯立與嘉賓們圍繞“長沙應該怎樣發(fā)展大數(shù)據(jù)和人工智能產(chǎn)業(yè)”等問題進行了深度交流。嘉賓長沙市科技局總工程師盛湘饒首先介紹了長沙技術實力人才儲備強,但產(chǎn)業(yè)發(fā)展方面薄弱、缺少頭部企業(yè)的情況。對此,悉尼大學教授陶大程表示,長沙有機會通過政府、企業(yè)、高校三方合作促進可信人工智能在未來產(chǎn)業(yè)的落地。吳華認為湖南不缺人才,問題是能否抓住機會推進重點扶持創(chuàng)新創(chuàng)業(yè)的相關機制,長沙立足于自身優(yōu)點孵化高尖企業(yè)的機會是非常大的。

(圖:《長沙大數(shù)據(jù)與人工智能產(chǎn)業(yè)發(fā)展戰(zhàn)略與對策》圓桌訪談合照)
除此之外,在決賽與大會主論壇開幕的第二天,九場精心策劃的線上專題技術和行業(yè)主題分論壇也相繼舉辦。百度深度學習技術平臺高級總監(jiān)馬艷軍作為“人工智能分論壇”論壇主席,與中南大學計算機學院黨委委員、副院長奎曉燕,中國開源軟件群體協(xié)同研究中心主任尹剛,湖南湘江人工智能學院執(zhí)行院長謝斌,湖南師范大學信息科學與工程學院人工智能系副教授江沸菠,天津飛騰信息技術有限公司飛騰大學執(zhí)行校長任巨,以及北京東方國信科技股份有限公司深度學習算法總監(jiān)李晶,在會上分享了關于人工智能下產(chǎn)業(yè)創(chuàng)新與人才培養(yǎng)的經(jīng)驗與成果。馬艷軍表示,人工智能時代需要復合型人才,復合型人才需要了解掌握人工智能技術,同時對業(yè)務、行業(yè)甚至是商業(yè)有很好的理解,這樣的人才能真正把人工智能帶到行業(yè),帶動整個國家實體經(jīng)濟的產(chǎn)業(yè)化升級。而飛槳也正持續(xù)為復合型人才的培養(yǎng)提供著全面支持。

(圖:百度深度學習技術平臺高級總監(jiān)馬艷軍)
大會舉辦的同時,2020 CCF大數(shù)據(jù)與計算智能大賽(簡稱CCF BDCI)也完成了總決賽的激烈角逐。本屆大賽吸引了全球3萬多支隊伍參賽,提交作品8萬余件,參賽人數(shù)與競賽成果質量再創(chuàng)新高。決賽共有64支隊伍獲得賽道一二三等獎和CCF BDCI四個特別獎項。百度作為本次比賽的唯一戰(zhàn)略級合作伙伴,在算法賽道設置“千言:多技能對話”賽題,并在大賽首次設立的自主平臺賽道首發(fā)“遙感影像地塊分割”賽題,飛槳作為該賽題的指定深度學習平臺為選手提供技術支持。該賽題的冠軍——中國科學院大學“隨緣分割”團隊摘取大賽含金量極高的CCF BDCI綜合特等獎。
作為國內(nèi)首個開源開放、自主可控、功能完備的產(chǎn)業(yè)級深度學習平臺,百度飛槳目前凝聚了超過265萬開發(fā)者,創(chuàng)造了34萬個模型,服務10萬家企業(yè);作為技術底座,飛槳通過百度智能云持續(xù)將AI能力輸出到各行各業(yè)實際應用場景中,在城市、工業(yè)、電力、通信等領域發(fā)揮了重要價值。
同時,作為國內(nèi)AI頭雁企業(yè),百度一直積極布局“人工智能+X”復合型人才培養(yǎng)生態(tài),以百度飛槳為核心,圍繞學習、就業(yè)、認證、實踐、比賽等環(huán)節(jié),將高校科研人才與企業(yè)應用人才培養(yǎng)緊密結合,綜合素質與實踐能力培養(yǎng)雙管齊下,洞悉產(chǎn)業(yè)需求的人才培養(yǎng)標準、構建產(chǎn)教融合的人才培養(yǎng)體系。面向高校,百度飛槳通過AI Studio學習與實訓社區(qū)提供教學資源、實訓項目和算力等支持,并“以賽促學”,舉辦各類多項AI競賽。百度深度學習師資培訓班已累計培訓了1800多名AI專業(yè)教師,支持200余所高校開設AI學分課提升教學師資水平。面向企業(yè),百度推出AI快車道、AI私享會、黃埔學院等進階式培訓渠道,讓前沿技術深入業(yè)務場景,為產(chǎn)業(yè)智能化賦能。截止目前,百度已經(jīng)培養(yǎng)AI人才超過100萬,未來5年百度還將培養(yǎng)500萬AI技術與產(chǎn)業(yè)人才,為中國智能經(jīng)濟和智能社會的發(fā)展提供AI人才保障。
未來,百度將持續(xù)技術創(chuàng)新,并將技術優(yōu)勢通過開源開放平臺與智能云賦能行業(yè)與個人,積極聯(lián)動政府、企業(yè)、高校等多方將“產(chǎn)學研用”有機結合,加快讓AI滲透到產(chǎn)業(yè)、社會以及生活中,提速智能經(jīng)濟發(fā)展。






