在北航的校園里,有一位年輕學(xué)子以其卓越的學(xué)術(shù)成就和開源項目的巨大影響力,成為了人工智能領(lǐng)域的璀璨新星,他就是計算機學(xué)院2022級博士研究生鄭耀威。
自高中時期被谷歌AlphaGo擊敗人類世界冠軍的新聞所吸引,鄭耀威便立志投身于人工智能領(lǐng)域。考入北航后,他迅速展現(xiàn)出了對知識的渴望和科研的熱情。大一期間,他利用課余時間自學(xué)了Python、概率論、機器學(xué)習(xí)、深度學(xué)習(xí)等多門專業(yè)課程,累計課時超過800小時,為日后的科研之路打下了堅實的基礎(chǔ)。
大二時,鄭耀威主動加入張日崇教授的科研團隊,開始了自己的科研創(chuàng)新之旅。他堅持每天進步一點點,從跑實驗、讀代碼做起,逐漸深入到科研的核心領(lǐng)域。在本科二年級的暑假,他選擇留校科研,每天沉浸在實驗室的討論、建模與調(diào)試中,這段經(jīng)歷讓他收獲頗豐。
“博觀而約取,厚積而薄發(fā)”是鄭耀威的人生信條。他心無旁騖地鉆研科研問題,與導(dǎo)師和高年級同學(xué)頻繁碰撞思想,不斷激發(fā)靈感與創(chuàng)新思維。憑借在低資源場景機器學(xué)習(xí)技術(shù)領(lǐng)域的深入研究,他以第一作者身份在ACL、CVPR、AAAI、WWW等國際頂級會議上發(fā)表了多篇高水平學(xué)術(shù)論文,其中學(xué)生一作的論文就有6篇,谷歌學(xué)術(shù)引用量超過600次,第一作者論文引用量更是超過500次。
除了學(xué)術(shù)研究,鄭耀威還積極參與各類課外科技競賽。他提出的“基于語法圖上隨機游走的多方面情感分類”算法,榮獲北航馮如杯科技競賽一等獎。在全國數(shù)字健康創(chuàng)新應(yīng)用大賽中,他開發(fā)的自動檢查心腦血管疾病算法脫穎而出,榮獲算法模型一等獎。他還獲得了全國大學(xué)生冰壺人工智能挑戰(zhàn)賽總冠軍、藍橋杯信息技術(shù)大賽全國一等獎等眾多獎項,展現(xiàn)了北航學(xué)子的卓越風(fēng)采。

然而,鄭耀威的成就遠不止于此。他敏銳地察覺到大模型微調(diào)和推理資源消耗巨大的問題,阻礙了AI的落地應(yīng)用。為此,他將研究重心放在了大模型微調(diào)框架上,成功實現(xiàn)了大語言模型的量化和低秩分解技術(shù),大幅降低了模型的顯存消耗和訓(xùn)練成本。依托這一技術(shù),他構(gòu)建了大模型高效微調(diào)框架LLaMA-Factory,并開源至GitHub平臺。
LLaMA-Factory項目一經(jīng)提出就受到了廣泛關(guān)注,社區(qū)開發(fā)者的需求紛至沓來。鄭耀威不斷學(xué)習(xí)各類型號硬件平臺文檔,實現(xiàn)了硬件感知的自動優(yōu)化方案,使LLaMA-Factory在英偉達芯片和國產(chǎn)芯片上均能無痛運行。這一貢獻贏得了華為昇騰芯片部門官方的高度認可,他也因此榮獲華為昇騰生態(tài)開源卓越貢獻獎。
在鄭耀威的不懈努力下,LLaMA-Factory項目逐漸贏得了社區(qū)開發(fā)者的廣泛贊譽與熱烈歡迎。項目累計獲得超過40000星標,成為了國內(nèi)最熱門的大語言模型微調(diào)框架,并登頂Github熱門項目榜單全球第一。他還多次受邀參加行業(yè)峰會、開發(fā)者大會,與全球各地的LLaMA-Factory用戶面對面交流,共同探討技術(shù)難題。
鄭耀威積極將學(xué)術(shù)成果與社會應(yīng)用緊密結(jié)合。他介紹了LLaMA-Factory在山西文旅AI導(dǎo)游場景中的實際應(yīng)用,還與業(yè)界大咖共話DeepSeek帶來的AI應(yīng)用加速創(chuàng)新。他的開源精神和技術(shù)實力得到了業(yè)界的廣泛認可。
對于自己的成長過程,鄭耀威尤為感謝身邊老師的支持。他回憶起在項目受挫時,導(dǎo)師張日崇教授花一整天陪他一起分析代碼、逐句討論論文的經(jīng)歷,至今仍銘記在心。他也希望更多同學(xué)能夠走進創(chuàng)新,用好大模型,通過參與開源社區(qū)的形式接觸前沿技術(shù),與學(xué)者碰撞觀點。






