5月21日-22日,由中國(guó)電子學(xué)會(huì)主辦的"2016全國(guó)模式識(shí)別技術(shù)應(yīng)用大會(huì)"在北京召開(kāi),來(lái)自全國(guó)各地智能技術(shù)企業(yè)和科研院所的科研代表和行業(yè)開(kāi)拓者蒞臨大會(huì)并進(jìn)行技術(shù)分享和交流。會(huì)議分享內(nèi)容圍繞模式識(shí)別和人工智能應(yīng)用技術(shù)及產(chǎn)業(yè)化發(fā)展,包含了相關(guān)各個(gè)領(lǐng)域的研究與實(shí)踐,包括機(jī)器人視覺(jué)、人工智能的認(rèn)知、智能駕駛、文本理解挖掘、生物特征識(shí)別等。其中,搜狗搜索首席科學(xué)家許靜芳博士以其在國(guó)內(nèi)第二大搜索引擎公司的實(shí)際工作經(jīng)驗(yàn)為基礎(chǔ),帶來(lái)了《搜索中的文本理解與挖掘》主題分享,受到參會(huì)者好評(píng)。

(搜狗搜索許靜芳博士演講照片)
搜索產(chǎn)品作為日常生活中最常用的互聯(lián)網(wǎng)產(chǎn)品之一,包含了幾乎全網(wǎng)的信息,并積累了海量的用戶大數(shù)據(jù),而搜索產(chǎn)品需要連接人與數(shù)據(jù)的性質(zhì)也讓其成為了"讓機(jī)器讀懂文本"先驅(qū)產(chǎn)品。許靜芳博士的演講基于搜狗搜索的技術(shù)探索及5.6億用戶產(chǎn)生的大數(shù)據(jù)積累,對(duì)文本搜索核心的查詢理解、文檔理解以及查詢與文檔匹配等幾個(gè)方面進(jìn)行了講解,尤其是配合會(huì)議主題,對(duì)查詢理解和文檔理解的具體方式進(jìn)行了深度解析。
不論是用戶輸入的"查詢?cè)~理解"還是用戶想要查詢到的遍布于互聯(lián)網(wǎng)上的"文檔理解",數(shù)據(jù)挖掘+機(jī)器學(xué)習(xí)(Data Mining + Machine Learning)都是其最基本的工具。搜狗搜索通過(guò)數(shù)據(jù)挖掘+機(jī)器學(xué)習(xí)進(jìn)行同義詞(組)挖掘、查詢糾錯(cuò)、查詢分析,并進(jìn)行查詢相似度計(jì)算、查詢糾錯(cuò)和查詢擴(kuò)展以及意圖理解,讓搜索引擎對(duì)查詢文本進(jìn)行理解。

(搜狗搜索許靜芳博士演講PPT)
許靜芳博士詳細(xì)講解了基礎(chǔ)查詢分析、查詢?cè)~權(quán)重計(jì)算、緊密度計(jì)算、同義詞、查詢意圖識(shí)別的等每個(gè)小分類具體的實(shí)現(xiàn)方式。例如在進(jìn)行查詢意圖識(shí)別時(shí),有實(shí)體機(jī)類型挖掘、通用意圖識(shí)別、基于RNN-LSTM的意圖識(shí)別、詞表示學(xué)習(xí)等不同的層面,而每個(gè)具體層面背后都需要有嚴(yán)密的思考和技術(shù)實(shí)力。

(搜狗搜索許靜芳博士演講PPT)
許靜芳博士的演講既生動(dòng)又詳實(shí),不僅講解技術(shù)原理,還結(jié)合搜狗搜索的具體產(chǎn)品功能和用戶在搜索時(shí)常見(jiàn)的問(wèn)題,對(duì)問(wèn)題進(jìn)行了分析,結(jié)合問(wèn)題向參會(huì)者講解具體解決方案和思考邏輯。參會(huì)者普遍表示這次分享極為精彩,將復(fù)雜的搜索技術(shù)講得深入淺出。
除搜狗搜索的許靜芳博士外,本次參會(huì)者還包括了IBM、科大訊飛、騰訊、阿里巴巴等知名企業(yè)的領(lǐng)導(dǎo)和專家,極具業(yè)界影響力。中國(guó)電子學(xué)會(huì)作為中國(guó)科學(xué)技術(shù)協(xié)會(huì)的組成部分,是由電子信息界的科技工作者和有關(guān)企事業(yè)單位自愿結(jié)成的非營(yíng)利性法人社團(tuán),積極倡導(dǎo)"團(tuán)結(jié)、創(chuàng)新、求實(shí)、奉獻(xiàn)"的精神,促進(jìn)電子信息科學(xué)技術(shù)的繁榮和發(fā)展。在中國(guó)電子學(xué)會(huì)的積極推動(dòng)下,召集了各界最知名的專家,才保障了本次"2016全國(guó)模式識(shí)別技術(shù)應(yīng)用大會(huì)"成功舉辦。






