︿
Top

生成式AI LlaMA著作侵權案簡易判決出爐 --北加州法院再下一城Kadrey v. Meta(上)

瀏覽次數:645| 歡迎推文: facebook twitter wechat Linked

科技產業資訊室(iKnow) - 陳家駿 發表於 2025年7月15日
facebook twitter wechat twitter

圖、生成式AI LlaMA著作侵權案簡易判決出爐 --北加州法院再下一城Kadrey v. Meta(上)
 
一、前言
2025年6月下旬,美國北加州的天空很AI(余光中詩《重上大度山》:星空,非常希臘)!因為,北加的聯邦地院匯集了全美最多生成式AI著作侵權的官司(其次是紐約南區地院),繼已出台的幾件都是程序判決,6月23日William Alsup法官終於開了第一槍,在Bartz, Graeber & Johnson v. Anthropic案中,做出首宗關於生成式AI合理使用的實體判決後(請參閱美國生成式AI首宗著作侵權案實體判決出爐), 才隔2天,6月25日同一法院的Vince Chhabria法官接棒,在Kadrey, et al., v. Meta Platforms, Inc.案中,再度做出全美第二宗實體的即席判決。

生成式AI為了訓練大語言模型(以下稱LLM)所進行的複製,究竟能否構成合理使用?這個問題自從ChatGPT爆紅之後,就衍生眾多訴訟而困擾全球各界。這二個判決適用合理使用的四項判斷要素後,都不約而同認為,生成式AI可構成「轉化性的使用」!但兩位法官的立論基礎和判決重點,卻呈現截然不同的風貌!本案判決結果不論是否被人接受,但理由中蘊含的法理,確實有許多值得深思之處,尤其說理上比Bartz案來得細膩深刻,為讓讀者得以一窺全豹,本文詳加介紹。


二、訴訟程序攻防 -- 二造均提出簡易判決動議
13位已出版作品的作家,撰寫並擁有小說、劇本、短篇故事、回憶錄、散文和非小說類書籍等多種作品的著作權。Meta使用影子圖書館(shadow libraries)下載Library Genesis(LibGen)資料庫,還下載Anna's Archive(是一包含LibGen、Z-Library等影子圖書館的彙編合集),為了更快地下載這些大型資料集、避免降低網路速度,Meta採用種子(Torrenting)方式下載原告享有著作權的書籍,均可在Meta下載的數據集中找到。

這些作家遂共同起訴Meta,指控其從線上「影子圖書館」下載其書籍,用於訓練Meta的生成式AI(即大型語言模型Llama)。除了「著作權直接侵害」主張之外,原告其他訴求在早期都遭到駁回(請參閱美國作家集體訴訟控告Meta生成式AI工具LlaMA著作侵權之程序判決出爐),但法院允許原告修改訴狀,原告擴大其著作權主張,包括「透過散布侵權」的理論(infringement by distribution,指控Meta上傳其種子下載的資料)。原告主張Meta的行為不能構成合理使用,而Meta則辯稱其行為依法應視為合理使用。

簡易判決亦稱即席判決(summary judgment),依美國聯邦民事訴訟規則第56(a)條,在「對任何重要事實不存在真正爭議」(no genuine issue of material fact),提動議方依法有權獲得判決」情況下,只要案件中重要事實已夠明確,無其他重大爭議時,即可申請此動議(motion)讓法官快速判其勝訴,而不需進入審判程序。在當事人進行主義之下,此種動議需自行提出,再由法院判斷而不涉及陪審團。

一般訴訟程序上,當事人會提出簡易判決動議,尤其對被告而言,此舉係權衡取捨:一方面,如能獲得有利裁決,在昂貴且繁瑣之證據開示(discovery)和審理程序之前予以結案,將有顯著好處,但被告此一有利裁決僅對指名原告才具有約束力,其他集體成員仍可基於相同主張繼續訴訟。本案在與指名原告主張之實質相關的證據開示結束後,原告提出部分簡易判決動議申請,主張其已提出表面明確(facial claim)之著作侵權主張,且Meta的合理使用抗辯不可能用來否定這項主張。而Meta反對原告的動議,也提出交叉動議(cross-motion),辯稱其複製行為法律上應被視為合理使用,請求法院直接頒發部分簡易判決(cross-motions for partial summary judgment 即決判決),企圖避開冗長訴訟程序一舉擊潰原告。


三、「合理使用」原則不適用削弱未來創作動力的複製
由於生成式AI模型的性能,取決於在訓練過程中吸收的資料量和品質,因此許多AI公司(包括Transformer五大模型:GPT、Llama、Gemini、Claude、Grok)難以抗拒「將海量受著作權保護的材料輸入模型訓練」的誘惑 -- 既未獲得著作權人的授權,也未支付任何費用即擅自使用他人作品。因此本案的核心問題是:此類行為是否違法?就此,法院首先開宗明義點出「合理使用」原則,通常不適用於「會實質削弱著作權人從其作品中獲利能力」的複製行為(從而「削弱未來的創作動力」)。因此,透過使用受著作權保護的作品訓練生成式模型,公司開發的產品往往會對這些作品的市場造成巨大衝擊,進而嚴重削弱人類以傳統方式創作的動力。

四、使用方式具有轉化性不能自動豁免侵權責任
雖有論者認為,未經授權使用帶來的影響無關緊要,因為AI公司在使用受著作權保護作品訓練生成式模型時,其使用方式本身因具有高度創造性,故對作品的使用具有「轉化性」(transformative)而不致侵權。惟法院認為,從法律角度言,如果複製行為具轉化性目的,則負擔侵權責任的可能性確實較低;但最高法院曾強調,合理使用之判斷係高度依賴個案之具體事實,幾乎沒有明確的規則(bright-line rules),因此當然不存在「只要使用受保護作品的方式具有『轉化性』,就能自動豁免侵權責任」的潛規則。本案法院認為,無論複製行為多麼具有轉化性,其結果都涉及所開發之產品,損害到該被複製作品的市場,從而嚴重削弱人類的創作力;而根據合理使用原則,對被複製作品市場的損害,比複製之目的更為重要。

關於此,本案法官提到早二天Alsup法官在Bartz v. Anthropic案之判決中,將重點關注於生成式AI的轉化性
(transformative),但卻淡化其對訓練所用之作品在市場上可能造成的損害。Alsup認為這種損害與「用這些作品訓練學童寫作」,而「導致競爭作品激增」並無不同。依其觀點,這並非著作權法所關切之競爭性或創造性之替代。本案法官則認為,就市場效應影響而言,用書籍教導孩子寫作,與用書籍開發一款產品截然不同,後者使人只需花費極少的時間和創造力,就能生成出無數相互競爭的作品,這個不恰當的類比,不能作為忽視合理使用分析中最重要的要素,其接著進入本案主題。

五、著作權法與合理使用
著作權法在保護所有權與為創新保留空間之間,取得平衡的主要方式之一,是透過合理使用原則進行積極抗辯(affirmative defense)。根據這一原則,出於批判、評論、新聞報導、教學、學術或研究等目的,對享有著作權作品的合理使用,不構成侵權。故合理使用「允許法院避免嚴格適用著作權法,因為有時這可能扼殺該法促進創造力之目的,避免僵化適用」。著作權法列舉判斷合理使用時的四個重要要素:
1. 使用之目的和性質,包括是否具有商業性質或非營利之教育目的;
2. 著作權作品的性質;
3. 使用部分的數量和實質性(substantiality),與整個著作權作品的關係;
4. 使用對著作權作品對潛在市場或價值的影響。

雖然法律列舉這四個要素,但合理使用是一個「靈活具彈性的概念」。這四個要素並非耗盡無遺,某個特定要素「在某些情況下可能比其他情況下更為重要」。這些要素的應用可能因情境而異,需要根據相關情況進行司法平衡,包括「技術的重大變化」。且各要素之間可能會重疊,以至於與某一要素相關的事實,也同時對其他要素具關聯性。總體而言,這些要素並非機械性地適用,而是共同為「整體性探究」:檢視「二次創作」(secondary work)是否可能在市場上替代原始作品,從而削弱創作動力。

本案法官最重視「實際或潛在的市場替代」,其認為第四要素無疑是「合理使用中最重要的單一要素」。如果法律允許以某種會削弱原始作品市場的方式,去複製他人的作品,那麼這將削弱未來創作更多作品的動力。因此,在幾乎所有未經許可複製他人原創作品的案件中,關鍵問題在於:如允許此類行為,是否會實質削弱原始作品的市場。合理使用因為是一種積極抗辯,舉證責任在於援引該辯護的一方,但二次使用者(secondary user,一般為被告)「在沒有關於相關市場的有利證據的情況下,將難以承擔合理使用的舉證責任」;但儘管權利人無需證明或提供市場損害的證據,但其「可能需要負擔一些識別相關市場的初步舉證責任」。此外,由於合理使用是一個整體性的探究考量,援引合理使用原則的一方需「承擔整體抗辯的責任」,而不是就各個單獨要素分别承擔。

基於合理使用是一個法律和事實混合的問題,如果不存在與合理使用相關之重要事實的真正爭議(genuine issues)時,可以在簡易判決階段,直接由法官解決合理使用法律問題。反之,若存在可能影響被告之使用是否合理,而存在「事實爭議」(factual disputes)時,則需由陪審團裁決。一旦陪審團認定事實,這些事實是否支持合理使用,才又成為「需由法官決定的法律問題」。


六、判斷要素一:使用的目的和性質
第一項要素是考量複製者使用原作品的理由及性質,對於使用之「目的及性質」,有幾項相關的考量評估,其中之一是該使用是否「具商業性質,或是為非營利之教育目的」;另一項可能的考量則是:該使用是否出於善意或惡意(good or bad faith,儘管依現行法律其是否相關尚不明確)。

第一項要素最主要應聚焦在:二次使用(secondary use,即次級使用)是否具有「轉化性」-- 也就是判斷二次創作是否以及在多大程度上,「僅僅替代原作、還是增添某些新內容,而具有進一步之目的或不同的性質」。若該使用具有「明確不同之目的」,通常就符合著作權法的目標,因其能激勵開發新的表達方式,而不會削弱創作的誘因。另一方面,若二次使用與原作具有相同之目的,則很有可能「向公眾提供原作的實質替代品」。


(一)Meta對原告書籍的使用具高度轉化性
法院認為,這第一要素對Meta有利,因為Meta對原告書籍的使用,具有「更進一步的目的」和「不同的性質」,其與原書不同 -- 具有高度轉化性(highly transformative)。因Meta複製這些書籍的目的,是為了用來訓練LLM,這是一種創新的工具,可用來生成多樣化的文本並執行各種功能。使用者可用Llama修改電郵、翻譯文字、根據假設情境編寫短劇或完成其他各種任務。相較之下,原告書籍的目的,則只是為欣賞或教育之用而供人閱讀。

原告承認LLM「最終用途」包括作為個人家教、協助創意思考,並幫助撰寫商業報告,且可用於例如尋找食譜、獲取稅務或醫療建議、翻譯文件或進行研究各種目的。法院認為,所有這些Llama的功能,均與原告書籍像小說、傳記等典型用途不同。因此,為了開發能執行這些功能的工具而複製書籍,其目的和性質皆與原書籍本身的用途,有著明顯的不同。


(二)Meta使用之目的與性質與原告書籍之間差異
原告聘請的法學教授即法庭之友(amicus)主張,Meta使用之目的與性質與書籍並無二致,因為LLM訓練書籍類似於人類閱讀書籍。人們或許可以將Meta複製書籍來訓練Llama的情況,類比為教授複製書籍給學生的情況,以便學生能使用書中知識成就學業,但法院認為,兩者之間存在重要的差異。

首先,LLM對書籍的「消化攝取」方式與人類閱讀不同:LLM分析文本,學習單詞在不同上下文語境中的「統計模式」(statistical patterns),透過從訓練資料中取出一段文本,從文本中移除單詞、預測該單詞為何並根據預測正確與否,來更新其對語言的整體理解,然後用不同的文本重複此練習數十億或數兆次,這與人類閱讀書籍的方式截然不同。

其次,Meta並非僅將原告的書籍提供給一個人,而係為了創造一種能生成各類文本的工具而複製原告的書籍。任何人都可使用該工具來完成進一步的創作表達,不論是協助創意思考還是研究寫作項目。透過創造一個任何人都可以使用的工具,Meta的複製可能以指數的方式增加表達,這是單純教導個人所無法實現的。


(三)對原作批判揶揄 & 對抗性提示無法重現顯著比例
原告再提不同的理由,認為Meta的使用並非轉化性用途,認為Llama對原告的書毫無批評性,不像合理使用中被認可的揶揄嘲諷那樣。但法院舉巡迴上訴法院Romanova v. Amilus案認為「對原作的批判或評論」,並非「構成合理使用正當化的唯一途逕」。相反的,只要某項使用能提供「任何公共利益主題上的有價值資訊」、或為公眾提供「有價值的服務」,則可能是合理的,尤其是在當「不讓公眾取得副本」的情況下提供這種利益,也可能構成合理使用。

此外,原告聲稱,Meta的使用不具轉化性,因為Llama在受到特定提示時,會輸出「模仿」原告作品或其寫作風格的內容。因此,原告認為Meta的使用「僅僅相當於對其書籍進行『重新包裝』(repackaging)而已」,並指責Meta訓練Llama模仿某些作家的風格。但法院認為,這些證據並未顯示其係為了重新包裝原告的作品;相反地,即便設計使用「對抗性提示」
"adversarial" prompts,目的是讓LLM「吐出」或「重現」(regurgitate)原來之訓練資料),Llama也不會讓任何模型從原告的書籍中,生成超過50個單詞(即tokens「標記」)的內容,亦即,Llama無法輸出或重現「任何顯著之比例」。

甚且,無任何跡象表明,它將生成更長的文本,來作為原告這些書籍的「重新包裝」。同樣的,亦無任何跡象表明,Meta開發Llama是為了使其創作與原告的書籍來互相競爭。因此,這最多只能顯示Meta希望Llama具備以某些風格生成文本的能力。但風格本身並不受著作權保護 -- 只有具體的表達內容才受保護。即便Llama的某些使用方式,可能會生成與原告書籍中不受保護部分相似的文本,因此也不能認定Meta的複製行為,具有與這些書籍相同的目的。

(四)二次使用具高度轉化性時商業性質重要性降低
法院指出,二次使用是否具有轉化性,並不決定第一要素的分析結果,Meta使用的商業性質,也同樣是一項重要考量。雖然Llama是以免費方式提供,但Meta最終開發確實是出於商業目的,其預計將在未來十年內創造4,600億至1.4兆美元的收入。此種商業用途「往往不利於認定為合理使用」,因為在其他條件相同的情況下,商業性複製的正當性低於非商業性複製。因此,Llama可能為Meta帶來數十億美元收入的這一事實,是甚具意義之相關要素,不應像Meta所主張那樣被完全忽視。

如果複製會對受保護的原作品造成市場損害,那麼複製行為係出於營利目的(而非學術目的)就至關重要。然而,商業性並非決定第一要素之唯一決定關鍵,而且當二次使用具有高度轉化性時,其重要性也會相對降低。因此,雖然Meta從原告作品訓練所開發的產品中獲利,對整體合理使用之分析具有關聯性,但並不足以使第一要素即偏向原告。


(五)被告從「影子圖書館」下載盜版書籍並不當然使原告勝訴
Meta取得原告書籍也是如此。原告主張Meta從「影子圖書館」下載書籍,而並未一開始就依法取得每本書的「授權版本」,因此理當會導致原告自動勝訴,法院認為這個觀點是錯誤的,因為原告主張Meta的下載是「盜版」行為,因而不能構成合理使用,實際上這本身就是預設結論。因為,合理使用分析的整體重點,正是為了判斷某一複製行為是否違法。

儘管巡迴上訴法院曾於Atari Games v. Nintendo of America案中提出相反的觀點,認為合理使用需以取得合法「授權副本」為起點來分析,但本案法官認為該判決過度解讀其所援引的案例,在Religious Technology Center v. Netcom On-Line Communication Services案中,即討論Atari一案的推理,認為其誤解所依據之最高法院Harper & Row v. Nation Enterprises判例的含義。但另一方面,就Meta認為「使用影子圖書館」盜版與其「複製行為是否合理使用」無關的說法,法官認為也是錯誤的。在以下幾個方面是相關的,或至少是潛在的相關。


1.使用行為 --「惡意」v.「善意」& 影子圖書館非法下載
首先,Meta使用影子圖書館的行為,與「惡意」有關,而「惡意」通常被歸入在第一要素下討論。關於惡意是否可成立合理使用,法律見解尚不一致。例如,第九巡迴上訴法院在 Perfect 10 v. Amazon.com一案中表示,「主張合理使用的一方,必須以大致符合「善意誠信與公平處理原則」(principles of good faith and fair dealing)的方式;但之後最高法院在Google v. Oracle America一案中則對「惡意是否在合理使用分析中有任何作用」持懷疑態度。但依本案法官看來,「善意」與「惡意」並非特別關鍵:合理使用的核心目的,在於允許新的表達方式而不會替代原作,而某一使用是出於善意或惡意,似乎不會影響該使用方式替代原作品的可能性。即便「惡意」被認定為相關要素,就簡易判決而言,也不會改變本案的走向而對結果產生影響。

2. 以P2P實質支持非法活動可能影響「使用之性質」
其次,如果從影子圖書館下載受著作權保護的資料,使創建這些圖書館的人受益,從而支持並延續其未經授權的複製與散布行為,則此行為就與合理使用判斷具有相關性。在絕大多數情況下,此類「點對點檔案分享」(peer-to-peer file-sharing,俗稱P2P)構成著作權侵害[1]。因此,若Meta的下載行為,實質上支持這些圖書館或使其非法活動得以延續 -- 例如,這些網站因Meta的造訪而獲得廣告收入 -- 那麼這可能會影響Meta使用行為的「性質」,但原告因尚未提出任何相關證據。無論如何,因為這類影響與合理使用第四要素更為相關,它可能助長他人透過圖書館進行侵權行為。


(六)Meta下載行為複製 v. LLM訓練過程及比對複製
關於第一要素之判斷,Meta使用行為性質的最後一個問題,是Meta下載原告書籍與其用該書籍來訓練Llama之間的關係。法院認為,如原告認為前者必須與後者完全分開考量,那就錯了。的確,Meta的下載行為與在訓練LLM訓練過程中的任何複製行為,是不同的使用方式。但該下載行為仍必須基於依其最終具有高度轉化性之目的 -- 即訓練Llama來加以考量。最高法院在Andy Warhol Foundation for the Visual Arts, Inc. v. Goldsmith案指出,不同的使用應分別考量,相同的複製行為在某種使用目的下可能是合理的,在另一種則不然;因此,既然Meta對原告書籍的使用最終具轉化性,則其對書籍的下載行為也同樣具有轉化性。

原告還主張,Meta下載包含其書籍之資料庫的多個副本,且只有其中部分被用於LLM訓練,因此那些未被用於訓練的副本,其下載行為不能構成合理使用,但原告所指出的所有下載行為,其最終目的都是用於LLM訓練。原告另指稱,Meta僅使用其首次下載的LibGen,來做為判斷該資料庫中的書籍,是否適合作為良好的訓練資料;並聲稱Meta在下載時,曾將其與出版商目錄進行交叉比對,以評估是否值得而有必要進行授權(或判斷那些可供授權的書籍已全數包含在這些資料庫中),就此,因原告承認,這些下載最終仍被用作訓練資料。沒有任何跡象顯示,將這些資料庫中的書籍與另一個資料庫中的書籍進行比對時,涉及額外的複製行為。因此,法院認為,僅進行這樣的交叉比對,並不會產生侵權責任,也無須另外討論合理使用。(6905字;圖1)
 
[1] Meta使用的一些圖書館本身已被認定構成侵權, 例如Elsevier Inc. v. Sci-Hub一案中,即作出缺席判決(default judgment),認定LibGen故意侵害著作權。一些圖書館的經營者還遭到刑事起訴,例如United States v. Napolsky案,Z-Library創辦人即被起訴刑事著作權侵害罪。
 

 
歡迎來粉絲團按讚!
--------------------------------------------------------------------------------------------------------------------------------------------
【聲明】
1.科技產業資訊室刊載此文不代表同意其說法或描述,僅為提供更多訊息,也不構成任何投資建議。
2.著作權所有,非經本網站書面授權同意不得將本文以任何形式修改、複製、儲存、傳播或轉載,本中心保留一切法律追訴權利。