2023年7月,Meta發布了其首款面向市場的開源大模型Llama 2,免費提供給研究和商業開發者使用。自此,閉源與開源兩種技術路線的交鋒正式拉開序幕。

時至今日,圍繞閉源與開源在大模型未來發展路徑中哪個更占優勢的討論仍在持續,就在前不久舉辦的Create2024百度AI開發者大會上,百度創始人、董事長兼首席執行官李彥宏表示,大家以前用開源覺得開源便宜,其實在大模型場景下,開源是最貴的,所以開源模型會越來越落后。
但也有人對此持不同觀點,360集團創始人、董事長周鴻祎表示,沒有開源就沒有linux,沒有Linux就沒有今天的互聯網。他認為,開源模型為整個科技社區提供了一個共享、協作和創新的平臺,推動了技術的快速發展。
那么,開源與閉源究竟誰更勝一籌呢?接下來,本文將對兩者之間的差異進行詳細闡述。
開源和閉源大模型分別是什么?
開源大模型,顧名思義,其源代碼公開、模型架構清晰,并配備了預先訓練好的權重,確保了,從而確保了其透明度。任何感興趣的人都能方便地訪問這些基礎模型,審查訓練數據,并根據個人需求自定義代碼。
相反,閉源大模型則由特定企業或組織負責開發,并且其源代碼和訓練數據均不對外公開。這種模型的使用和修改權限僅限于開發它們的企業或組織內部。
各有哪些優劣?
需要指出的是,開源和閉源大模型因其各自的特點,在多個方面有著不同的優勢和劣勢。
首先來看開源大模型,其優勢在于可訪問性、創新力和透明度。其中,在可訪問性方面,任何人都可以自由訪問開源模型,促進更廣泛地采用。這種廣泛的可用性促進了全球研究人員和開發人員的更大參與和多樣化貢獻。在創新方面,得益于龐大的貢獻者社群,開源大模型得以迅速迭代發展,融合了廣泛的視角和專業知識,催生出更多具有創造性的解決方案和多樣化的應用。在透明度方面,開源模式允許更嚴格的審查,這可能會帶來更高的安全性和可靠性。這一級別的透明度使用戶能夠識別和解決模型中的潛在偏見或漏洞,培養對技術的信任。

然而,開源大模型也存在一些不足,相較于閉源模型,開源大模型往往缺乏專職團隊提供同等水平的支持與維護,可能導致更新滯后、維護不一致性等問題,影響模型性能與穩定性。同時,由于資源投入的局限,開源大模型在技術創新與能力提升上可能略遜于企業支持的閉源模型。另外,企業對技術支持、定制需求及知識產權問題的顧慮,可能導致開源大模型在商業領域的接納度受限。
再來看閉源大模型,依托企業巨額研發投入與專業研發團隊,閉源大模型通常在技術創新與功能表現上占據行業制高點,為用戶持續提供最前沿的模型體驗。并且,閉源大模型用戶通常享受企業級的專業支持與維護,確保模型在商業環境中的穩定運行,問題能得到及時解決,保障用戶體驗。不僅如此,閉源模式有利于企業保護自身投資與創新成果,形成競爭優勢,對于尋求技術壁壘的企業具有重要價值。
但閉源大模型也有其劣勢,例如高昂成本與嚴格的許可限制使得閉源大模型對部分研究人員、小型企業而言可望而不可及,可能抑制創新生態的多元化發展與跨領域合作。而且,閉源大模型的私有屬性導致其透明度較低,易引發對模型偏見、倫理風險及安全漏洞的關切。
由此可見,開源模型憑借其開放性、創新力與透明度,有力推動了技術普惠與社區共建;閉源模型則以卓越性能、專業服務與知識產權保護,滿足了市場對高端技術解決方案的需求。
有專家進一步指出,在大模型領域處于領先地位的企業,更適合選擇閉源策略,以確保將核心技術掌握在自己手中。并且,這種策略不僅有助于資源的持續集聚,還能有效保護企業的競爭優勢。相反,對于尚處于起步階段的后來者,開源模型則提供了一個理想的起點,可幫助他們迅速提升技術實力。
因此,對于企業而言,應該根據自身的目標和市場環境,選擇最適合自己的開發和發布模式,以實現最大的商業價值。
寫在最后
無論是閉源所代表的核心技術掌控與競爭優勢強化,還是開源所賦予的快速技術進步與創新生態共建,都將在大模型領域的未來發展進程中發揮不可或缺的作用。究竟哪種模式將在未來的較量中更勝一籌,抑或是二者將在動態平衡中共同推動行業的繁榮,有待市場的進一步檢驗。