從法國首宗生成式AI之Meta被告著作侵權訴訟案 -- 兼談歐盟人工智慧法
科技產業資訊室(iKnow) - 陳家駿 發表於 2025年5月8日
圖、從法國首宗生成式AI之Meta被告著作侵權訴訟案 -- 兼談歐盟人工智慧法
生成式AI熱浪席捲全球以來,已經衍生了眾多著作權侵害訴訟,這其中以ChatGPT聲名大噪的OpenAI首當其衝,是所有案件被告數量的冠軍。而在幾個LLM大模型當中,Meta(前身即FB)的Lllma被波及到的官司,在美國已有幾件關於書籍文章方面,由Kadrey聯合Silverman與Golden等多位作家,於2023年7月在加州對Meta提起集體訴訟(Kadrey v. Meta Platforms, Inc.);之後其他作家跟進對Meta提告,如Chabon v. Meta、Farnsworth v. Meta等(以上三案已合併);另有紐約州的Huckabee v. Meta Platforms, Inc.。但戰火馬上轉到歐洲,在第一宗生成式AI著作侵權訴訟,即德國音樂仲團GEMA於2024年11月起訴OpenAI後沒多久,Mata在法國也首度遭到幾個出版組織提告 -- SNE, SGDL and SNAC v. Meta。茲就本案加以簡介。
一、SNE、SNAC & SGDL v. Meta案緣起
代表法國出版商和作家權益的三個組織:法國出版聯盟(SNE: Syndicat national de l’édition – French Publishers’ Association)聯合法國作家協會(SGDL: Société des Gens de Lettres – French Society of Writers)以及法國作者和作曲家聯盟(SNAC: Syndicat national des auteurs et des compositeurs – French Authors’ and Compositors’ Association)(以下稱原告),於2025年3月12日在巴黎法院第三庭(3rd chamber of the Paris Judicial Court,特別關注智財權相關爭訟),對美國的Meta起訴,指控這家AI巨頭未經作者和出版商授權,大量非法擷取數千本受著作權保護的書籍作品,來訓練其生成AI模型「Llama」。原告表示曾嘗試與Meta溝通,但未收到回應因此對其採取行動,要求Meta徹底刪除未經授權用於訓練AI的資料儲存庫。此案是法國第一起權利人針對使用其作品訓練AI模型提起的侵權訴訟。
原告指控,Meta創辦人馬克·祖克柏(Mark Zuckerberg)的團隊,於Facebook、Instagram和WhatsApp應用平台中,推出由生成式AI驅動的聊天機器人,未經授權大量剽竊原告受法律保護的法國作品,以滋養其Llama模型,使用於訓練Meta的AI工具,而其所生成者屬於仿冒之「 經濟寄生」產物,並在各平台上銷售「假書」。原告於是展開調查瓢竊著作權的事證,據《La Lettre》報導,其與一家律師事務所合作一年的時間,搜集對Llama訓練中使用原告書籍的事證,可能證據顯示,Meta模型使用的情況比OpenAI來得嚴重,因此先拿Meta開刀。SNE總幹事Renaud Lefebvre稱,這是世界上第一次出版商和作家聯手攻擊科技巨頭。
二、原告指控Meta使用備受爭議語料庫Books3
原告指責,Meta可能使用一個極為豐富的盜版語料庫Books3,其包含大量書籍(許多是法語書籍)如烹飪、旅遊、詩集、科幻小說,其中有些已進入公共領域,但有眾多仍受著作權保護,收錄在Books3語料庫中[1]。該Books3語料庫由美國人Shawn Presser於2020年末編纂。據法新社報導,其係由一群業餘檔案管理員「The Eye」管理,Books3代表惡名昭彰的「影子圖書館」(shadow library) Bibliotik網站,其包含超過196,000本盜版書籍(37 GB的電子書),這些網站匯總大量著作權的書籍和材料,在網路上快速免費傳播。(請參閱美國作家控告Meta生成式AI Llama著作侵權法院之首宗程序判決出爐) 但Presser辯稱,Presser辯稱,其構想是讓人使用高品質的語料庫,提供訓練以便完善其AI語言模型,嗣該語料庫因違反著作權法已下線。
此外,網路上另有其他影子圖書館Library Genesis(即LibGen)的資料庫亦可以存取,其係包含數百萬本非小說類書籍和科學期刊文章的網站,原告懷疑Meta也使用它來為Llama提供動力,且Meta特別依賴這些來訓練自己的Llama語言模型,而2024年1月Meta在美國被告的訴訟中,雖承認使用Books3語料集的內容,以及許多其他文件來訓練其模型Llama 1和Llama 2,但否認使用需要獲得權利人同意之受著作權保護的作品來訓練Llama。
三、歐盟之「三步驟檢驗法」
由於全球已有太多件生成式AI侵權訴訟,二造間攻防早有一定模式,本案之關鍵即涉及Meta如何抗辯,該公司在前述美國被告之案件中,堅持其對受著作權保護作品的使用合法,試圖說服法院其行為構成「合理使用」(Fair Use),此抗辯允許在某些情況下無需徵得作者同意,即可使用受保護的內容而避免著作侵權,但必須在特定框架內並出於特定目的來使用。至於在歐洲,針對複製作品著作權之限制與例外,必須通過所謂之「三步驟檢驗法」(Three-step Test,或稱「三重測試Triple Test」)才能豁免責任。
然而在歐盟著作權法中,「三步驟測試」向來是具爭議與解釋難度的規範。該測試源自國際著作權協定,如《伯恩公約》(Berne Convention)第9條第2項[2]、《TRIPS協定》第13條等[3],為全球著作權例外與限制所設立的最低保護標準,提供一項判斷合法使用的基本架構。儘管三步驟測試,自20世紀末以來已被廣泛納入各國法制,但其具體內涵與適用標準至今仍未臻一致。根據該測試,就著作複製之限制與例外,必須符合三項條件:(一)僅限於特定之特殊情況;(二)不得與著作的正常利用相牴觸;以及(三)不得對權利人之合法利益造成不合理損害。這些條件旨在平衡著作權保護與公共利益之間的界線(即經濟利益與公共使用間的衝突),但其間的界線該如何劃定,至今其在學理與實務上均存有爭議而仍在發展中。
關於該測試中「三步驟」的具體詮釋,雖然尚無明確一致之實務指引,但只要被豁免的使用方式與權利人對作品的正常利用形成經濟競爭,並「因此剝奪權利人顯著或具體的經濟利益」,即構成衝突。其不僅須考量現實中的利用方式,也應納入「在某種程度上具有可能性與可預見性的潛在商業用途」。
為避免三步驟測試導致對使用者過度限縮的結果,學界提出《著作權法中「三步驟測試」之平衡解釋宣言》(Declaration on a Balanced Interpretation of the “Three-Step Test” in Copyright Law),主張三步驟應視為一體性評估的要素,而非三個必須逐步通過的獨立關卡。此評估方式類似美國著作權法下的「合理使用」原則,強調彈性與比例原則。特別是第三步驟,普遍被認為涉及「利益衡量」(balancing of interests)或「比例原則分析」(proportionality analysis),其核心在於評估使用行為是否具有合理正當性。
因此,Meta雖可依賴上述這一著作侵權之限制規範,來維護其「 爬取 」作品的合法主張,但其要如何適用此一例外,以符合「三步驟檢驗法」要件,尤其是大規模複製原告書籍,仍將面臨比例原則之嚴峻挑戰。而在面對保障著作權人權益的目標,生成式AI工具之開發「是否以及如何」存在一可接受的利益權衡,使公共利益或使用者的利益得以合理體現之論證,更是Meta抗辯之最大挑戰。尤其是,關於歐盟法院在若干判決中雖已實質運用三步驟測試,但其詮釋方式卻引發爭議。例如在ACI Adam and Others或Stichting Brein v. Wullems (Filmspeler)與在PRCA (Public Relations Consultants Association)等案中,對三步驟的各條件展現出不同的傾向,顯示法院立場並非一貫。歐洲著作權法之三步驟測試,與美國判斷構成不侵權的四項「合理使用」因素,觀念上有其不同,故Meta的抗辯顯然需有不同之策略。
四、歐盟AI人工智慧法案
歐盟在2024年簽署《人工智慧法案》(AI Act,以下稱《AI法案》),係全球第一部關於AI的法規,由於本案是該法頒布後,歐洲監管情勢發生變化的背景下所提起,故原告也關注到《AI法案》。針對本案之生成式AI,目前Meta尚未提出關於《AI法案》之抗辯,但有鑒於法國隸屬歐盟,而且本案之管轄法院也在巴黎,因此針對歐盟指令中之「資料探勘」責任豁免,未來可能也是被告爭辯的重點,因此略加介紹。
1. 資料探勘著作複製例外 v. 權利保留與退出機制
先前在歐盟之「數位單一市場著作權指令」(EU Directive on Copyright in the Digital Single Market, 下稱DSM著作權指令)2019/790第3條中,規範為了科學研究、「文本和資料探勘」(TDM: text and data mining,係指收集資訊並對數位化作品進行自動分析,以提取、挖掘並發現新知識或模式、趨勢和識別關聯性)之目的,對其所合法取得的作品或其他內容,可進行複製和摘錄,此即對權利人複製權之限制。因此,任何基於符合一定條件的業者所進行之資料探勘,可擷取受著作權保護的內容(文字、封面、插圖、摘錄等),包括任何網站中包含的全部或部分作品。
基於上述歐盟DSM指令,《AI法案》中之立法說明(Whereas)中指出,一般用途的AI模型(general-purpose AI models)特別是大型生成式AI,文本與資料探勘技術可能被廣泛運用,以擷取並分析這些可能受到著作權保護的內容。凡使用受著作權保護的內容,除非適用相關著作權例外與限制,皆須取得相關權利人的授權,故《AI法案》立法理由(Whereas 105)援引DSM著作權指令第4條若干例外與限制,即用於訓練數據集時允許在特定條件下,為文本與資料探勘之目的,重製或擷取著作或其他標的內容,屬於責任豁免例外規定。
但以上歐盟對AI工具開發者規定之義務,尚包括尊重權利人對文本和資料探勘可能的反對。依據該指令,權利人可選擇保留其對作品或其他標的之權利,以防止其被用於文本與資料探勘(但若該探勘行為是為了科學研究目的,則不得拒絕)。亦即倘若權利人以適當方式,明確保留此等「選擇退出」(Opt-out)權利,則一般用途之AI模型的提供者,若欲對該等作品進行文字與資料探勘,便仍須取得權利人之授權。換言之,基於文本和資料探勘目的,得允許複製合法可存取作品進行探勘,符合侵權豁免之例外規定。但如經權利人以有效之使用限制聲明(以機器可讀格式進行保留),明確就其予以保留其權利時,則不適用資料探勘之例外豁免。
2. AI模型提供者應公開模型詳細摘要
再者,針對《AI法案》,還有一個令AI業者棘手之「公開」的規範。該法案第53條規定一般用途AI模型提供者之義務(Article 53: Obligations),然後再於法案之立法說明中,要求AI模型提供者,公開其用於訓練模型的作品或內容的詳細說明。依《AI法案》立法說明(Whereas 107),為提升一般用途AI模型,在預訓練與訓練過程中,所使用受著作權法保護之文字與資料,應由該模型提供者,編製並公開一份具充分細節的「訓練內容摘要」(summary of the content)。
在考量保護機構商業秘密資訊的同時,此摘要應具有廣泛涵蓋性,而非過於技術性細節導向,以便於具有正當利益的相關當事人(例如著作權人),根據歐盟法律行使與主張其權利。舉例來說,摘要中應列出訓練模型所用的主要資料搜集或數據庫(例如大型私人或公共資料庫或資料典藏),並就其他資料來源提供敘述性說明。立法說明認為,由AI辦公室(AI Office)提供一份摘要的標準格式是適當的做法,該格式應簡明、實用,並容許供應者以敘述性方式提供所需之訓練內容摘要。
五、《AI法案》可否作為指責被告違反依據
在歐洲就AI監管最新進展下,《AI法案》的立法說明要求生成AI提供者應遵守著作權法,與其用於訓練基礎模型的資料來源履行「透明度」。本案發生在歐盟《AI法案》頒布後,Meta因未經授權使用他人著作權作品,來訓練其AI模型而被訴。由於Meta拒絕透露其如何取得資料來訓練AI,原告遂對Meta採取法律行動並援引《AI法案》來反制被告所構築之抗辯防線。
該法案要求平台業者提供「使用受著作權保護的訓練資料情形做詳細摘要」,並賦予權利人「選擇退出」的權利,即拒絕Meta使用其作品來訓練AI模型。原告據此主張,Meta未遵守該法案關於防止生成「非法內容」的要求,亦未公開其訓練資料中受著作權保護內容之摘要,顯然不遵守歐盟AI法案。,原告因此主張,生成式AI的開發者必須遵守資訊透明度要求,揭露用於訓練模型的資料來源與內容。
但必須注意的是,上述關於應製作「訓練內容摘要」,實際上只是歐盟《AI法案》,就立法所做規範說明(即Whereas前言序文)之宣示性規範而已,其性質屬於政策方向與立法意旨的揭示,尚未具體化為具有法律拘束力的實體條文。由於整部《AI法案》體系龐大且結構複雜,許多具體義務與實施細節,尚待歐盟未來透過眾多鉅細靡遺之附屬立法或執行細則來加以明確。因此,目前關於訓練資料透明義務的相關說明,仍停留在政策宣示階段,尚非實質法律規定,不構成可予以執行之法律義務。
換言之,這些規定目前仍屬預告性質,其具體適用範圍與法律效果,須俟日後正式條文公布後始能明確界定。本案若原告想援引該宣示性規定作為其訴訟主張,實際上僅屬於一種法律論述上的參照,並不具法律拘束力,該類宣示性條款頂多被視為輔助,難以單獨構成法律責任或確認違法的依據。其實,如原告等待《AI法案》新的關鍵條款施行,則其起訴理由將更充分,不過現實迫使原告立即採取行動,以保護出版商和作家免受作品被Meta「掠奪」和「假書」的侵害,以及受到其「寄生」般的競爭,原告遂率先提告,至少試圖迫使Meta進行某種形式的談判和補償。
六、結論
為對抗AI工具開發者恣意擅自取用權利人的內容,2025年2月在巴黎舉行的AI行動高峰會上,代表所有創意和文化領域的38個國際組織簽署一份《國際文化與創新憲章》(culture and innovation charter),呼籲AI發展與著作權法及其他與藝術、文化和創意產業相關的權利,以捍衛著作權和智慧財產,抵禦AI開發商的侵害。
本案法國權利人團體要求法院,認定被告搭便車的「 偽造 」和「 經濟寄生 」行為違反著作權法,其對Meta開了第一槍之後,下一個對象是否會針對OpenAI等大咖,目前尚不得而知。不過,生成式AI確是觸怒眾多權利人和相關團體,如果這些重要的模型供應商繼續不告而取,後續勢必將有更多的訴訟產生。
以目前生成式AI相關侵權訴訟,在世界各國遍地開花,這讓人想起20年前P2P「點對點架構」(Peer to Peer)下所為之「上傳下載」的全球爭議一樣,但明顯的是,那一波訴訟大戰,最終是權利人取得了勝利。於今之生成式AI更為複雜,目前結果仍難預料,不過在歐盟的法律架構下,欲通過「三步驟測試」,對被告而言是極大的挑戰,因為要符合三要件有其高門檻。另外,可能讓原告振奮的是,基於好幾個AI工具提供者,例如OpenAI等都已經不斷正在和權利人簽署授權協議中,因此原告大可藉此來反證,被告本來就應按部就班取得授權再進行模型訓練。然而此論點,目前還未經二造攻防洗禮,頂多是法院將來的一個心證裁量。(5435字)
[1] 例如Amélie Nothomb、Emmanuel Carrère、Virginie Grimaldi)、Françoise Sagan或Annie Ernaux翻譯的一些英文作品 -- 大多數是Annie Ernaux。另,Book 3資料庫中也包括法國作家Français Patrick Modiano和Michel Houellebecq的書籍,並提供ChatGPT的競爭模型。
[2] Berne Convention) Article 9(2):「聯盟各國之立法機關得允許在特定特殊情況下重製該等作品,惟此種重製不得與作品之正常利用相衝突,亦不得對作者之正當權益造成不合理損害。亦即,在某些特殊情況下允許複製文學和藝術作品的權利,但這種複製不得與作品的正常使用相衝突,也不得對作者的合法利益造成不合理的損害。
[3] 歐盟本身雖非伯恩公約的簽署方,但基於其他國際承諾,特別是《與貿易有關的智慧財產權協定》(TRIPS協定)與1996年《世界智慧財產權組織著作權條約》(WIPO Copyright Treaty, WCT)的要求,仍受制於伯恩公約的實質規定。因此歐盟必須遵守伯恩公約相關義務。
作者資訊:
陳家駿律師 台灣資訊智慧財產權協會理事長
參考資料:
《AI Act》Whereas 105 & 107, EU Artificial Intelligence Act, Regulation (EU) 2024/1689 of the European Parliament and of the Council, of 13 June 2024. European Union,2024/7/12
IA: les auteurs et les éditeurs français assignent Meta en justice. Lefigaro,2025/3/12
French publishers and authors sue Meta for AI training copyright. Cryptopolitan,2025/3/12
Meta fait n'importe quoi ? Éditeurs et auteurs français saisissent la justice. Actualitte,2025/3/12
Meta attaqué en justice en France sur le droit d'auteur et l'IA. ZD NET,2025/3/13
Livres, droits d'auteur et IA : Meta poursuivi en France, CB News,2025/3/12
L'exception de copie privée face aux dispositifs techniques de protection des oeuvres. Memoire Online,2006/9
The nature and content of the three-step test in EU copyright law: a reappraisal. SSRN,2020/9/16
France creative sector brings copyright action against Meta under EU AI Act. Jurist News,2025/3/13
Meta Sued by Publishers, Writers in First French Copyright Case Amid a Scourge of 'Fake' AI Books. Law.Com,2025/3/14
Authors and Publishers Unite in Lawsuit against Meta to Protect Copyright from Infringement by Generative AI Developers. IPA,2025/3/18
French publishers to take Meta to court over 'use of copyrighted work to train AI', The Bookseller,2025/3/12
[Communiqué] La SGDL, le SNAC et le SNE assignent Meta pour imposer le respect du droit d’auteur aux développeurs d’outils d’intelligence artificielle generative. SGL,2025/3/12
--------------------------------------------------------------------------------------------------------------------------------------------
【聲明】
1.科技產業資訊室刊載此文不代表同意其說法或描述,僅為提供更多訊息,也不構成任何投資建議。
2.著作權所有,非經本網站書面授權同意不得將本文以任何形式修改、複製、儲存、傳播或轉載,本中心保留一切法律追訴權利。
|