【ITBEAR】《思想大爆炸——對(duì)話科學(xué)家》欄目第92期,對(duì)話中國(guó)科學(xué)院院士,北京大學(xué)教授梅宏。
嘉賓簡(jiǎn)介:
梅宏,中國(guó)科學(xué)院院士,北京大學(xué)教授,計(jì)算機(jī)軟件專家。主要從事軟件工程和系統(tǒng)軟件領(lǐng)域的研究。

劃重點(diǎn):
1. 現(xiàn)在的大語(yǔ)言模型技術(shù)路徑無(wú)法通往AGI,幾年內(nèi)可能會(huì)達(dá)到天花板。
2. AI還取代不了人類,它缺乏創(chuàng)造力,只能說是輔助性工具。
3. 從科技倫理的視角來看,智能是人類的專有特征,特別是認(rèn)知能力,我們?yōu)槭裁匆ピ斐鲆粋€(gè)替代我們認(rèn)知的東西?
4. 機(jī)器沒有所謂的什么意識(shí),也沒有涌現(xiàn),它本質(zhì)上還是把已經(jīng)存在的內(nèi)容進(jìn)行基于概率統(tǒng)計(jì)的整理和組織。就這個(gè)意義而言,大語(yǔ)言模型可被視為是已有“語(yǔ)料”壓縮而成的“知識(shí)庫(kù)”。
作者|鄭松毅
編輯|楊錦
近日,第二十一屆中國(guó)計(jì)算機(jī)大會(huì)(CNCC2024)在浙江省東陽(yáng)市橫店舉辦。
大會(huì)期間,圍繞AI大模型發(fā)展現(xiàn)狀、是否存在“泡沫”現(xiàn)象、以及AI是否將對(duì)人類生活構(gòu)成威脅等話題,與中國(guó)科學(xué)院院士,北京大學(xué)教授梅宏展開了對(duì)話。
梅宏直言,“當(dāng)前的AI技術(shù)路徑缺乏創(chuàng)造力,無(wú)法通向AGI(通用人工智能),更做不到替代人類。從人文和科技倫理的視角看,追求讓AI去替代人類本身就是個(gè)錯(cuò)誤的想法?!?/p>
他提到,“除了技術(shù)問題,還有倫理道德、知識(shí)產(chǎn)權(quán)以及產(chǎn)出質(zhì)量等諸多問題尚未解決,大模型在應(yīng)用層面還面臨著不小的挑戰(zhàn)。”
這段時(shí)間,大模型戰(zhàn)場(chǎng)的炮聲變小了。外界疑惑,“大模型的路,還走得下去嗎?”
在梅宏看來,“現(xiàn)有大模型主要是靠數(shù)據(jù)驅(qū)動(dòng)實(shí)現(xiàn),但可見的是,可開放訪問的數(shù)據(jù)已經(jīng)被‘吃’得差不多了。不難預(yù)測(cè),大模型能力的天花板在未來幾年內(nèi)或?qū)⒌巾?,?dāng)然輸出內(nèi)容的質(zhì)量還會(huì)不斷改善。”
他還呼吁,中國(guó)的科研人員應(yīng)該培養(yǎng)批判性思維,為人師者也應(yīng)該抱有共同學(xué)習(xí)的心態(tài)。不怕爭(zhēng)論,思維碰撞的火花應(yīng)該再多一些,別怕走別人沒有走過的路。
在科技競(jìng)技場(chǎng),很多人把美國(guó)看作是“排頭兵”,疑惑如何才能找到“從0到1”的創(chuàng)新路徑?
梅宏說,“絕大部分“從0到1”的原始創(chuàng)新都不是規(guī)劃出來的,無(wú)前路可尋,基本都是來自基于興趣去探索未知?!?/p>
他指出,中國(guó)當(dāng)下的要緊任務(wù)是形成良性的科研文化?!爸袊?guó)在科研領(lǐng)域全面發(fā)力也就是不到30年的事,在短時(shí)間內(nèi)能有今天的成就,我認(rèn)為很了不起。”
以下為對(duì)話實(shí)錄(經(jīng)整理編輯):
:今天是“1024”,聽了您的演講,我想程序員們可以好好過節(jié)了。您說AI替代不了程序員,為什么這么肯定?
梅宏:這是現(xiàn)有AI技術(shù)路徑的底層邏輯決定的。現(xiàn)在的AI沒有我們?nèi)祟惖闹悄埽匀粺o(wú)法取代。當(dāng)然,未來是不是會(huì)出現(xiàn)別的技術(shù)路徑,有可能走向“替代”,還不好說。
但AI確實(shí)能幫助程序員提升開發(fā)效率和質(zhì)量,如推薦代碼、代碼補(bǔ)全、避免低級(jí)錯(cuò)誤等。但總的來說它還是輔助性工具,缺乏用軟件實(shí)現(xiàn)業(yè)務(wù)需求所需要的創(chuàng)造力。
另外,AI在應(yīng)用層面還有很多問題沒有解決,比如倫理道德、知識(shí)產(chǎn)權(quán)以及產(chǎn)出質(zhì)量等。
人類智能是地球上的頂端智慧,也沒有那么容易被取代。實(shí)際上,在計(jì)算機(jī)、AI發(fā)展早期的主流媒體報(bào)道中,“替代”人類的聲音一直都有。只不過,早期報(bào)道的主角是計(jì)算機(jī),也是涉及兩個(gè)方面:“盲目、過度的高估”和“脫離實(shí)際的擔(dān)憂”。
這些報(bào)道放到今天,主角換成AI,仍然可以適用。只是紙質(zhì)媒體的傳播影響有限,遠(yuǎn)趕不上今天互聯(lián)網(wǎng)、自媒體時(shí)代的喧囂。
:您也不認(rèn)同機(jī)器取代人這件事兒?
梅宏:從人文和科技倫理的視角來看,去追求替代人的認(rèn)知、替代人的智能,到底有沒有必要?
大家想一想,智能是什么?是人區(qū)別于動(dòng)物的最重要的特征。人為什么能成為地球上生物鏈的主宰,成為地球的主人?就是因?yàn)樗闹悄埽恼J(rèn)知能力,歸納演繹等邏輯能力,還有我們的語(yǔ)言。
我們?yōu)槭裁匆ピ斐鲆粋€(gè)替代我們智能的東西,進(jìn)而讓出我們地球主人的地位?
我個(gè)人是反對(duì)追求AI取代人類認(rèn)知的。我們應(yīng)該是把它視為工具,來幫助我們做好各類事情,提升做事效率和質(zhì)量。
:但是現(xiàn)在產(chǎn)業(yè)上已經(jīng)在做了,機(jī)器越來越強(qiáng)大。
梅宏:AI技術(shù)確實(shí)進(jìn)步很大,但其中炒作和泡沫也很多。
我還是想從科技倫理的視角來看這個(gè)問題,智能是屬于人的。現(xiàn)在滿社會(huì)都在炒作“智能”,似乎人類做的事已經(jīng)不是智能了。
舉一個(gè)例子,很多“設(shè)計(jì)”均屬于人類的智力創(chuàng)造性活動(dòng),當(dāng)然用計(jì)算機(jī)輔助設(shè)計(jì)無(wú)疑會(huì)大大提升效率。但現(xiàn)在很多人只提所謂“智能設(shè)計(jì)”,實(shí)際上它只是“AI設(shè)計(jì)”。AI設(shè)計(jì)是“智能”,那人的設(shè)計(jì)是什么?
:今年聽到很多質(zhì)疑的聲音,說大模型越來越“吃”算力,訓(xùn)練的數(shù)據(jù)也面臨枯竭,您判斷大模型未來的三五年會(huì)怎么發(fā)展?
梅宏:我們應(yīng)該看到,目前成功的兩個(gè)領(lǐng)域都是因?yàn)橛辛舜罅康臄?shù)據(jù):一個(gè)是自然語(yǔ)言文本,人類數(shù)千年來,通過語(yǔ)言記錄積累了海量的文本資源,在互聯(lián)網(wǎng)上能夠公開訪問的文本語(yǔ)料是大語(yǔ)言模型成功的重要因素。大語(yǔ)言模型實(shí)際上是壓縮了人類已有的可公開訪問的絕大多數(shù)知識(shí)。另一個(gè)就是文生視頻,互聯(lián)網(wǎng)上已經(jīng)存在了海量的視頻數(shù)據(jù)。
但是到別的領(lǐng)域就沒有那么多數(shù)據(jù)了,這是當(dāng)前大模型應(yīng)用落地面臨的最大問題。當(dāng)然,也還有其他障礙,如模型行為的不可解釋性導(dǎo)致缺乏可信性等。
很多人問我行業(yè)AI應(yīng)用怎么推進(jìn)?我給出的建議是,面對(duì)AI技術(shù)發(fā)展現(xiàn)狀,如果對(duì)AI的落地應(yīng)用有所疑問和彷徨,那么,積累數(shù)據(jù)——可采盡采、能存盡存。
我非常認(rèn)可當(dāng)前AI技術(shù)的進(jìn)步,但我反對(duì)過度泡沫化。當(dāng)前的AI仍處于Hype Cycle的高峰階段,喧囂埋沒理性,對(duì)成功個(gè)案不顧前提地放大、泛化,以偏概全,甚至神化AI的預(yù)期效果。我以為,我們需要一個(gè)冷靜期。
我也認(rèn)為,沿襲當(dāng)前的技術(shù)路徑,AI的能力“天花板”已隱隱可見。
:天花板在哪?
梅宏:很可能就在幾年之內(nèi)。這里我指的是大模型能力的天花板,模型產(chǎn)出內(nèi)容的質(zhì)量還是會(huì)有不斷改善。
:您提出理想的AI應(yīng)該是低熵的,這種理想它存在或者有可能實(shí)現(xiàn)嗎?
梅宏:這是個(gè)理想。我只是覺得現(xiàn)在的模式熵增太快,過于耗費(fèi)資源。以當(dāng)前可以看到的發(fā)展路徑,離這個(gè)理想還有很長(zhǎng)很長(zhǎng)的路。
:您認(rèn)為大模型能否通往AGI?
梅宏:我認(rèn)為不可能,現(xiàn)在的大模型不可能。這是其技術(shù)實(shí)現(xiàn)的底層邏輯決定的。
它覆蓋的知識(shí)量大面廣,確實(shí)是我們?nèi)祟惐炔涣说?,但要想達(dá)到所謂的通用人工智能,當(dāng)前技術(shù)路徑應(yīng)該是做不到的。
當(dāng)前的大模型嚴(yán)重依賴數(shù)據(jù)和算力,但實(shí)際上可開放訪問的數(shù)據(jù)已經(jīng)被用得差不多了。當(dāng)前大模型的競(jìng)爭(zhēng)已經(jīng)成為“數(shù)據(jù)工程”的競(jìng)爭(zhēng)。
我還想再次表達(dá)我在今年9月的《中國(guó)計(jì)算機(jī)學(xué)會(huì)通訊》發(fā)表的文章“對(duì)當(dāng)前人工智能熱潮的幾點(diǎn)冷思考”中提到的一個(gè)觀點(diǎn):大語(yǔ)言模型在未來需要像互聯(lián)網(wǎng)一樣,走向開源。全世界共同維護(hù)一個(gè)開放共享的基礎(chǔ)模型,讓全世界共同受益,共同維護(hù),避免無(wú)謂的浪費(fèi)。
在這個(gè)開放共享的基礎(chǔ)模型上,全球范圍內(nèi)的研究者和開發(fā)者可以面向各行各業(yè)的需求探討各種應(yīng)用,構(gòu)建相應(yīng)的領(lǐng)域模型。
:您相信機(jī)器會(huì)產(chǎn)生意識(shí),產(chǎn)生思想嗎?
梅宏:我不認(rèn)為現(xiàn)在的AI有什么所謂的意識(shí),我也不認(rèn)為它有知識(shí)涌現(xiàn)能力。
從基本原理來看,大模型是基于“概率統(tǒng)計(jì)”,將如圖像分類或文本生成等任務(wù)建模為概率模型,將數(shù)據(jù)的分布或生成過程表示為概率分布函數(shù)。神經(jīng)網(wǎng)絡(luò)能夠以任意的精度來逼近這些概率分布函數(shù),從而構(gòu)建這些概率模型。
就這個(gè)意義而言,大語(yǔ)言模型可被視為是已有“語(yǔ)料”壓縮而成的“知識(shí)庫(kù)”。生成結(jié)果的“語(yǔ)義”正確性高度依賴于數(shù)據(jù)的空間廣度、時(shí)間深度以及分布密度,更高度依賴于數(shù)據(jù)的質(zhì)量。
基于當(dāng)前的技術(shù)路徑,大模型不可能“無(wú)中生有”,做出超越人類預(yù)期的事情。
不過,大模型可以產(chǎn)生基于內(nèi)容“基元”的新組合,雖然它本身并不知道該“組合”的含義。這種組合有可能是某種“知識(shí)”,也有可能是“幻覺”,這就需要人類專家去驗(yàn)證審核了。
我還想再?gòu)?qiáng)調(diào)一下,這也是我前面提到的文章中的觀點(diǎn)。當(dāng)前主流的AI工作機(jī)制,與人類大腦的工作方式仍相去甚遠(yuǎn)。我們不應(yīng)該過度使用類人的術(shù)語(yǔ)來描述機(jī)器,比如“意識(shí)”、“心智”甚至“硅基生命”等,很容易在公眾中造成誤解。
我個(gè)人也特別不喜歡“硅基生命”之類的提法,說重一點(diǎn),這是對(duì)生命的不尊重。我們不要忘記,真正的生命是地球上的生物,包括動(dòng)物和植物,而我們?nèi)祟悇t是其中的主導(dǎo)者。






