在2024年的中國數(shù)據(jù)科技領(lǐng)域,一項重要的成果于CCF中國數(shù)據(jù)大會上正式亮相。這份名為《生成式大模型安全測評白皮書(2024)》的報告,由中國科學(xué)院智能算法安全重點實驗室攜手公安部第三研究所及螞蟻集團的螞蟻安全實驗室共同編制,標志著我國在生成式大模型安全領(lǐng)域的深入研究與積極應(yīng)對。

白皮書深入剖析了包括GPT、LLaMA、Moss、文心一言等在內(nèi)的近20個主流生成式大模型的發(fā)展現(xiàn)狀,并著重揭示了這些模型在實際應(yīng)用中面臨的安全風(fēng)險。通過一系列實踐案例,白皮書不僅指出了當(dāng)前技術(shù)面臨的關(guān)鍵挑戰(zhàn),還提供了有效的應(yīng)對策略。報告將安全風(fēng)險分為倫理風(fēng)險、技術(shù)安全風(fēng)險及內(nèi)容安全風(fēng)險三大類,并創(chuàng)造性地提出了指標衡量與模型攻擊兩種安全評估方法,以及倫理性、隱私性、事實性、魯棒性四大安全評估維度,為相關(guān)領(lǐng)域的研究者、產(chǎn)業(yè)實踐者及政策制定者提供了寶貴的參考。
螞蟻集團自主研發(fā)的“支小寶”三重安全保障框架在白皮書中得到了特別介紹,這一框架背后是螞蟻集團的大模型安全一體化解決方案“蟻天鑒”。該解決方案包含兩大核心產(chǎn)品:“蟻鑒”大模型安全檢測平臺和“天鑒”大模型風(fēng)險防御平臺,分別專注于AI評測與安全防御,確保大模型在生產(chǎn)和應(yīng)用中的安全、可控與可靠。

自ChatGPT引領(lǐng)的生成式大模型熱潮以來,全球范圍內(nèi)對這類技術(shù)的關(guān)注日益升溫。作為人工智能技術(shù)的新一輪革命性成果,生成式大模型正深刻改變著全球AI技術(shù)的格局,并為我國數(shù)字經(jīng)濟的高質(zhì)量發(fā)展和智能化轉(zhuǎn)型注入了強勁動力。然而,隨著技術(shù)應(yīng)用的日益廣泛,其潛在的安全風(fēng)險也逐漸暴露出來,如“大模型幻覺”事件和三星公司機密資料泄露等,這些事件凸顯了生成式大模型在隱私保護、惡意濫用、技術(shù)漏洞及合規(guī)性等方面的復(fù)雜挑戰(zhàn)。
針對這些風(fēng)險,國家高度重視,并出臺了一系列政策文件,如《生成式人工智能服務(wù)管理暫行辦法》,明確了生成式大模型在安全性、風(fēng)險防控和合規(guī)性方面的基本原則和監(jiān)管要求,為技術(shù)的健康發(fā)展提供了有力的政策保障。

在白皮書的發(fā)布儀式上,來自中國科學(xué)院智能算法安全重點實驗室、公安部第三研究所、螞蟻安全實驗室及浙江大學(xué)計算機學(xué)院的專家學(xué)者齊聚一堂,共同見證了這一重要時刻。智能算法安全重點實驗室主任、中國科學(xué)院計算技術(shù)研究所副所長程學(xué)旗,公安部第三研究所副所長張巍,螞蟻安全實驗室首席科學(xué)家、螞蟻集團大安全機器智能部總經(jīng)理王維強,以及中國數(shù)據(jù)大會數(shù)據(jù)安全高端論壇召集人、浙江大學(xué)計算機學(xué)院院長任奎,中國科學(xué)院計算技術(shù)研究所網(wǎng)絡(luò)數(shù)據(jù)科學(xué)與技術(shù)重點實驗室主任郭嘉豐等重量級嘉賓出席了發(fā)布儀式。
王維強在儀式上表示:“我們希望通過這份白皮書,能夠助力生成式大模型的安全性研究與應(yīng)用推廣,為構(gòu)建安全、可靠、可控的人工智能生態(tài)體系提供堅實支撐,推動技術(shù)向著服務(wù)人類社會的方向健康發(fā)展。”






