亚洲视频二区_亚洲欧洲日本天天堂在线观看_日韩一区二区在线观看_中文字幕不卡一区

公告:魔扣目錄網為廣大站長提供免費收錄網站服務,提交前請做好本站友鏈:【 網站目錄:http://www.430618.com 】, 免友鏈快審服務(50元/站),

點擊這里在線咨詢客服
新站提交
  • 網站:51998
  • 待審:31
  • 小程序:12
  • 文章:1030137
  • 會員:747

image.png

讓答案變得更可信,圖技術將成為大語言模型(英文:Large Language Model,縮寫LLM)發展的下一個落腳點。

回溯大模型的加速發展,需要將時間線推回到去年12月,ChatGPT在全球范圍內現象級爆火。用戶側拉動市場側迅速爆發,截至目前,全球已出現近百個大語言模型。

而當國內數十個大模型出現后,ChatGPT的關注度也在被迅速瓜分。根據SimilarWeb數據,前期ChatGPT的訪問量增長率驚人,1月份的環比增長率為131.6%,后期則隨著時間的推移增長率逐漸放緩。6月份ChatGPT網站的全球桌面和移動流量比5月份下降了9.7%,而ChatGPT網站的獨立訪問量下降了5.7%。Sameweb數據顯示,訪問者在網站上花費的時間也下降了8.5%。

而ChatGPT的使用率逐漸降低,和其難以保證的準確率密不可分。許多用戶均在社交平臺中反饋到,目前AI聊天過程中有時會收到似乎正確但細讀卻十分荒謬的答案,又或者是微調提問的方式會得到完全不同的答案,更有甚者會提供混亂的信息,此類信息難以直觀發現,需要一定的行業知識才能發現。

事實上,正確性已成為所有大語言模型在發展中不可回避的問題。尤其當大模型需要應用到醫療、健康、保險、銀行、金融、工業制造等行業的業務場景中時,則對容錯率的要求近乎0。因為一旦大模型提供錯誤甚至有偏差的信息,都有可能引起巨大的法律責任或公關危機。

image.png

所以,從現實發展看,大語言模型戰場的廝殺必將進入下一階段——讓答案擺脫一本正經地胡說八道,變得100%可信。

一本正經地胡說八道,成為大模型的最大漏洞之一

筆者咨詢大模型業內人士后了解到:目前流行的大模型主要以GPT類模型為主流,此類模型大多為純解碼器結構,使用n-gram方法,基于參數為Θ的神經網絡建模,根據前k個單詞來預測第k+1個單詞。在海量語料上的預訓練過程中,模型可以學習到語料中的語言規律、有效信息等,從而可以在生成階段根據給定的提示輸出合理的相關信息。

但是,實際應用過程中,大模型的“幻覺”現象已成為阻礙其廣泛運用的關鍵原因。

“幻覺”現象指模型以很高的自信輸出錯誤或不可信結果,當模型有“幻覺”時,其使用的訓練數據并不能證明輸出的合理性。這背后,或許和大模型復雜多樣且充滿錯誤的語料庫存在關聯。國際知名分析機構Gartner在最新研報中指出:“ChatGPT的使用不能列出引用來源,其可靠性大多基于來源信息。但是這些來源可能本身是錯誤的、前后矛盾的。”同時,騰訊集團高級執行副總裁湯道生在某次公開演講中也坦言道:“目前通用大模型一般都是基于廣泛的公開文獻與網絡信息來訓練的,網上的信息可能有錯誤、有謠言、有偏見,許多專業知識與行業數據積累不足,導致模型的行業針對性與精準度不夠,數據噪音大。”

由此可見,解決“幻覺”現象成為大模型發展的關鍵門檻,尤其是對大模型的行業應用而言,只要存在1%的偏差,都將給企業埋下風險的種子,成為落地的門檻。

在此背景下,圖技術則有機會打破僵局,給出自己的正確答案。

讓關聯成為破局關鍵

如果說大模型是喚醒數據的一個重要“鬧鈴”,能夠讓企業的沉默數據通過分析釋放出業務價值,那么圖技術則是鬧鈴上的關鍵指針,利用結構化且有序的數據關聯讓沉默數據釋放價值合理化,從底層賦能大語言模型變得更高效、更精準、更智能。

文中,我們首先明確圖技術的概念。圖技術以“點-邊”為數據結構直觀簡潔地描述業務實體之間的復雜關聯關系,以復雜關聯關系的存儲、查詢、計算性能優化為第一設計原則,能夠從圖結構數據中挖掘出有價值的知識或規律來指導業務決策。

而在大模型研發和應用過程,圖技術能夠減少幻覺的發生。

上文已經提過大模型的應用原理大多圍繞著 Transformer技術,通過訓練數據來凝結成泛化的知識,進而沉淀出下一個字符。但大模型無法回憶出事實,且會生成具有錯誤事實的表述。

圖技術則基于圖論,一種用于研究圖(由頂點和邊組成的數據結構)及其性質的數學理論,通過結構化的關聯數據進行計算和分析。當圖技術與大模型深度融合后,能夠將大語言模型中的泛化知識抽象出來用于創建知識圖譜,借助數據關聯有效捕捉實體之間的關系,從而更深入推理、檢索和分析數據之間的邏輯關系,有效提升加強大模型的知識理解、精準輸出和邏輯推理能力,彌補大模型在邏輯上的漏洞,以實現大語言模型和其他生成式 AI 結果的準確性、可解釋性和透明性。

客觀來說,借助圖技術,當前白熱化的大模型競賽將邁進下一個里程碑。

圖技術將成下一輪大模型競賽的入場券

技術的比拼看似漫長,實則瞬息即變,入局者需要手握更多可能。放眼當前大模型和圖技術深度結合的國際市場,我們能夠窺見一些未來。

關注國外,我們能夠發現海外主流的大模型均已經開始使用圖技術來管理Context和 Prompt,并將圖的概念深度融合到預訓練的過程當中,使傳統的大模型具備更加優秀的推理、邏輯以及可解釋的能力。據了解,圖數據庫頭部廠商Neo4j已宣布與 Google Cloud 的大語言模型Vertex AI 達成合作,企業客戶能夠利用Google Cloud Platform中的Neo4j產品構建知識圖譜,以獲得更準確、透明和可解釋的生成式 AI 見解。學術領域,國外對于大模型與行業知識圖譜相關論文研究也處于國際前沿。

相較于國外圖技術的率先落地,國內的大模型廠商尚未在圖技術領域形成大規模的投入,但是也有圖技術廠商積極探索兩者之間的技術結合和應用落地。

圖數據庫準獨角獸創鄰科技憑借行業領先的技術理念與實踐經驗率先發力,于2023年年初首發公布“正式接入百度文心一言能力,打造圖分析人工智能全系產品,以實現圖智能分析”。并且在近期,創鄰科技再度和華為最新發布的盤古大模型達成合作,共同推進圖技術和大模型的聯合發展據了解,創鄰科技后續將深入圖技術和各類大模型的結合,充分發揮國產Galaxybase圖數據庫的高性能、易擴展、實時性等優勢,打破國內圖技術和通用大模型與行業大模型的落地瓶頸。

總結

對于大模型而言,克服“幻覺”現象已成為不得不做的事,而圖技術必將成為克服該挑戰的關鍵因子。在大模型的角斗場里,和圖技術的結合也將成為大模型廠商新的入場券。

如果你想了解更多創鄰科技Galaxybase圖技術在大模型領域的實踐和成果,歡迎關注創鄰科技Galaxybase公眾號留言咨詢,我們攜手共同尋找新的大模型增長點。

分享到:
標簽:突破口 幻覺 模型 技術 科技
用戶無頭像

網友整理

注冊時間:

網站:5 個   小程序:0 個  文章:12 篇

  • 51998

    網站

  • 12

    小程序

  • 1030137

    文章

  • 747

    會員

趕快注冊賬號,推廣您的網站吧!
最新入駐小程序

數獨大挑戰2018-06-03

數獨一種數學游戲,玩家需要根據9

答題星2018-06-03

您可以通過答題星輕松地創建試卷

全階人生考試2018-06-03

各種考試題,題庫,初中,高中,大學四六

運動步數有氧達人2018-06-03

記錄運動步數,積累氧氣值。還可偷

每日養生app2018-06-03

每日養生,天天健康

體育訓練成績評定2018-06-03

通用課目體育訓練成績評定