近期,人工智能領域的一起法庭案件引發了廣泛關注,焦點集中在Anthropic公司訓練AI助手的方式上。據悉,該公司為了構建其語言模型Claude,采取了極端的措施:購買并銷毀了數百萬本實體書籍。
案件細節顯示,Anthropic購買大量書籍后,通過撕毀裝訂線和掃描書頁的方式將它們數字化。這一過程不僅導致實體書籍的徹底毀壞,而且數字化的書籍也并未公開。然而,在法庭上,這一行為被法官視為合理的轉化使用,因此Anthropic在部分問題上獲得了勝訴。法官認為,這種數字化處理符合版權法中的合理使用原則。
盡管如此,批評者依然對Anthropic的做法表示強烈質疑。他們指出,盡管Claude能夠生成獨特內容,但大型語言模型在訓練過程中仍有可能逐字復制原文。Anthropic在法律上的部分勝利意味著,該公司能夠在不通知原出版商或作者的情況下,利用受版權保護的書籍訓練AI模型。這一行為可能為生成式人工智能行業掃清了一大障礙,但也引發了關于版權保護的廣泛討論。
事實上,版權問題一直是生成式人工智能發展的痛點之一。有業內人士表示,如果AI必須嚴格遵守版權法,整個行業可能會面臨崩潰的風險。這是因為,開發大型語言模型需要龐大的數據集,而獲取這些數據往往困難重重。持續的版權糾紛更是給這一技術的發展帶來了巨大挑戰。
近期,一些知名公司也卷入了與AI相關的版權訴訟中。例如,Getty Images的首席執行官承認,公司無法承擔所有與AI相關的版權侵權費用。同時,迪士尼對圖像生成公司Midjourney的訴訟也凸顯了圖像生成器復制受版權保護內容的能力,這進一步加劇了業界對生成式人工智能未來發展的擔憂。
值得注意的是,盡管法官在部分問題上判決Anthropic勝訴,但該公司仍需在12月面臨版權審判。據稱,如果Anthropic被判侵權,每部盜版作品可能面臨高達15萬美元的賠償金。這一潛在的巨額賠償無疑為生成式人工智能的未來增添了更多不確定性。






