︿
Top

生成式AI LlaMA著作侵權案簡易判決出爐 – 北加州法院再下一城Kadrey v. Meta(中)

瀏覽次數:308| 歡迎推文: facebook twitter wechat Linked

科技產業資訊室(iKnow) - 陳家駿 發表於 2025年7月17日
facebook twitter wechat twitter
 
圖、生成式AI LlaMA著作侵權案簡易判決出爐 – 北加州法院再下一城Kadrey v. Meta(中)
 
七、判斷要素二:著作作品的性質
第二項要素認為,「有些作品比其他作品更接近著作權擬保護的核心,結果是當這類作品被複製時,更難成立合理使用」。獲得較強著作權保護的作品,包括書籍和電影等具創意性的作品;保護程度較低的則包括電腦程式碼。法院認為此要素二有利於原告,其書籍主要為小說、回憶錄與劇本,是高度表達性的作品,屬於「著作權法所重視並欲保護的類型」。即便其中一些作品屬於事實性內容(如自傳)而非小說,這一事實也不會改變本結論,因為著作權仍保護作者「表達事實的方式」。

(一)功能性元素 v. 創造性表達
Meta則辯稱,這一要素無論如何都對Meta有利,因其使用原告書籍僅只是為了獲取其「功能性元素」(functional elements),而不是為了利用其「創造性表達」(creative expression)。Meta主要依賴第九巡迴上訴法院涉及「中介性複製」(intermediate copying)的案件,在Sega Enterprises v. AccoladeSony Computer v. Connectix這二案,電玩公司複製一家電玩主機製造商受保護的程式碼,並對其進行逆向工程,以理解該程式碼的某些功能性元素,使得該電玩公司能打造與原告產品相容的產品。在這二起案件中,巡迴法院都認定,被告的合理使用抗辯成立,因為儘管被告複製了原告程式碼中的表達性元素,但這樣做,只是為了存取程式碼中不受保護的功能性元素。

(二)詞彙順序、用詞選擇、文法與語法也是表達思想方式
本案法院認為,與上述案件中的使用情形不同,Meta對原告書籍的使用,確實依賴於書籍中的創意表達。正如Meta自己所指出,LLM的訓練方式是透過學習「詞彙與概念之間的統計關係」,並蒐集「關於詞彙順序、出現頻率(哪些詞被使用以及使用頻率)、文法與語法」的統計資料。而這些項目正是人們表達思想的方式(即使在狹義的表達定義下,「詞彙的排序與選擇」仍屬於一種表達)。因此,即使LLM所學的可能是「統計關係」,但這些關係本身也是創意表達的產物,儘管Llama所「消化」而理解的這種表達的方式與人類不同,情況仍然如此。

(三)本案不適用「中介性複製」案例
Meta為了支持其抗辯 – 即複製原告書籍是為了擷取非表達性資訊,因此主張應適用「中介性複製」的案例,並援引Google Books案,但法院認為情況與本案不同。該案中原告是一些作家,指控Google構成著作權侵害,因其將原告書籍製作數位化副本,並建置一個資料庫供使用者搜尋,以查看資料庫中哪些書籍包含搜尋字詞。然而,與本案不同的,Google案中所涉及的技術,對內容是中立的(content agnostic):即使資料庫中充滿亂碼或以未知語言編寫的書籍,資料庫也不會運作得更好或更差。如果有人搜尋這些文字,那些書籍就會出現在結果中。相較之下本案中,若Meta的LLM要生成高品質的文本,就必須仰賴具連貫性且品質合理的訓練資料。換句話說,其需要高品質的表達內容。因此,「中介性複製」的案例不適用於此。

不過,法院仍認為第二要素「在合理使用爭議的判斷中,很少扮演重要作用」。且當被複製的作品已經發表,二次使用者無法干預創作者控制其作品首次公開作品的權利時,此要素的適用力道將會「較弱」。因此,儘管第二要素對原告有利,但對整體分析的意義並不大。


八、判斷要素三:使用部分相對於整體著作中的數量和實質性
此一要素評估「所使用部分的數量與實質性,對於複製之目的而言是否屬於合理範圍」。因此,這一要素與第一要素相關,因為「可接受的複製範圍,會隨著使用目的與性質之不同而有所差異」。法院認為,本案中複製的數量似乎不是特別相關的要素。例如,在涉及音樂諷刺之最高法院Campbell v. Acuff-Rose Music案中,複製大量原曲內容,可能會增加諷刺作品「替代市場的可能性」。

但就本案而言,有鑑於Meta的LLM,不會輸出原告書籍中任何有意義數量的實質內容。因此,重點在「相關的考慮要素…不是複製者使用了多少受著作權保護的數量,而是『有多少受著作權保護的內容公開給大眾』」。法院認為,即使複製原告書籍的全部內容,有鑑於已構成轉化性之目的,複製數量是合理的,而二造都同意LLM訓練資料的品質越高,性能越好,因此,為了訓練LLM,餵進(複製)整本書比半本書更有價值。在此背景下,使用作品全部內容是「合理必要的」(reasonably necessary),故本要素對Meta有利。


九、判斷要素四:使用對著作權作品之潛在市場或價值的影響
本要素關注的是:「被指控侵權者之特定行為,對市場造成的損害程度」,以及「被告所從事此類不受限制且廣泛進行的作為,是否會對原作的潛在市場產生實質不利影響。」。與此要素相關的「唯一損害」,是「市場替代所造成的損害」。相對而言,如果二次創作透過批評或諷刺而扼殺了原作需求,則此類損害並不被著作權法所認可。而與此要素相關的,還包括「複製可能產生的公共利益」。

(一)第四項要素是合理使用分析中最重要的要素
法院認為,第四項要素「無疑是合理使用分析中最重要的單一要件」。因此,Meta所主張「因第一項要素對其極為有利,因此分析應止於此」的說法是錯誤的。相反的,基於第四項要素的重要性,可以很容易地想像一種情況:即便某項二次使用具有高度轉化性,但若允許大眾從事該使用,會對原作市場造成過大的影響時,仍可能導致合理使用抗辯失敗。同樣的,在某些第一要素明顯有利於被告的案件中,原告若欲擊敗合理使用主張,則僅有掌握第四要素來取得逆轉勝的機會。

(二)生成式AI對原告作品市場造成損害之三種方式
法院先設定,在涉及使用受著作權保護的作品,來訓練生成式AI模型的案件中,權利人即原告可能會提出至少三種方式,主張被告的複製行為對其作品市場造成損害(或者如果此類複製行為廣泛傳播,將對市場造成損害):
  1. 首先,權利人可能主張,該模型會「吐出」其作品(重現與其實質相似的輸出內容),因此讓使用者可透過模型,免費取得這些原作或其替代品。
  2. 其次,權利人可能指出,其作品授權用於AI訓練的市場,並主張未經授權的複製行為損害了該市場(或阻礙該市場的發展)。
  3. 第三,權利人可能進一步主張,即使該模型無法重現其原作或產出實質相似的內容,它仍能生成在題材或類型上足夠相近的作品,進而與原作競爭而構成「間接替代」(indirectly substitute)。

在本案中,前兩項主張皆不成立;第三種主張雖然相對較具潛力,但原告的論述過於薄弱,以致於既無法改變整體分析結果,甚至連提出足以反駁簡易判決的事實爭點都做不到,法院茲就此三點展開討論。

1. Llama不會「吐出」重現原告實質相似的內容
如果Llama能用來生成原告書籍的大量內容,或是產出與其書籍高度相似、以至於構成侵權的文本,那這將會威脅到原告書籍的市場,因為人們可能會轉而閱讀這些輸出內容。但本案中,此種損害理論並不成立,如上所述,Llama並不會讓使用者從原告書籍中,生成任何有意義的段落。雙方的專家證人都不認為,Llama能從任何一本原告書籍中,重現超過50個字的內容,即便是在使用刻意設計來試圖讓LLM「吐出」原文的「對抗性提示」情況下也是如此。

相較在Google Books案中,第二巡迴上訴法院裁定,儘管該服務讓使用者看到總計高達一本書16%的片段,但該二次使用「並未對著作權人之著作價值,造成任何實質性的損害威脅,也未削弱其從著作權中獲得的收益」。本案由於原告的專家證人也承認,Llama不會生成其中「任何顯著比例」的書籍內容。特別是Llama即使在「對抗性提示」刻意操控下,Llama也只能重現原告書中極少部分的內容,這並不足以對原告書籍的「潛在市場或價值」產生「重大或顯著的影響」。

2. Meta複製行為損害原告之授權市場
原告關於市場損害的主要理論是,Meta未經授權使用其書籍進行LLM訓練,損害了將其書籍用於該目的之授權市場。原告幾乎將其對第四項要素的全部討論,都集中在這個理論上。因此,雙方就關於「是否存在一個可供通常交易書籍之授權市場,或該市場是否有可能發展」一事,展開冗長的辯論。

但法院認為,該市場是否存在或是否可能發展,其實都不重要,因為原告法律上並無權壟斷這樣的市場。在每宗合理使用案件中,如果將潛在市場定義為,作為所涉及授權使用理論上的市場,那麼「原告都會遭受潛在市場之損害」。因此,為避免第四項要素的分析陷入循環論證,並在每個案件中都偏向權利人,針對轉化性使用目的而導致授權費損失的傷害,不應被視為可認定的損害。

3. Meta生成相近作品進而與原作競爭構成「間接替代」
使用受著作權保護的書籍來訓練LLM,對這些作品之市場可能造成損害的方式,是這種訓練可能促成大量作品的快速生成,即使這些作品本身雖不構成侵權,卻會與原作競爭。人們可能利用LLM來創作書籍並販售,與由人類作者創作的書籍在銷售和讀者注意力上競爭。因本案法院最重視此點,遂進而就此展開「市場稀釋」與「間接替代」之法律論述。


(三)「市場稀釋」與「間接替代」所造成損害
1. 「市場稀釋」之損害係「間接替代」造成
由於透過提示讓LLM生成書籍可能非常容易,人們甚至會將這些書籍免費釋出。這類競爭所造成的損害,即為「市場稀釋」(market dilution)所導致之損害。而此種損害是「間接替代」所造成,而非「直接替代」[1](後者即前述第一種損害形式)。當然,並非所有受著作權保護的作品,在面對AI生成內容競爭時,都會受到相同程度的「市場稀釋」。例如AI所生成的書籍,似乎不太可能有效地搶走知名作者的銷售量,因為讀者購買這些書主要是為了該特定作者的作品。但可輕易想見的,AI生成的書籍很可能會成功擠壓不太知名、或新銳作者的作品市場。

對於某些特定類型的作品,這種市場影響似乎更為明顯。例如,一個能隨意產生高品質圖像的AI模型,可能會極大程度地影響此類圖像的市場,從而大幅削弱人類創作這些圖像的動力;而一個能產生有關時事之準確資訊的LLM,則可能對紙本新聞市場造成嚴重打擊;某些非小說的作品(例如,關於如何照顧園藝的書籍)的市場,也可能因LLM能輕易生成該主題的書籍而大幅萎縮。至於小說作品的影響,則可能取決於作者或作者創作的體裁。

2. 應注意作品本身差異性所帶來不同之市場影響
以上這些差異,可能部分是源自於某些作品本身相對偏重「功能性」,而較不依賴「作者的創意」。例如,在選擇新聞文章時,讀者所期望的是清晰、準確、簡潔地傳達一則當前或過去事件的內容。相較之下,讀者在選擇小說時,往往更重視多層面的特質,例如主題深度、寫作風格、情節設計與角色發展等,或更偏好情節曲折、富有變化,或能細膩描繪人物發展的作品,而這些元素在很大程度上有賴於作者的創造力。

雖然新聞文章同樣體現了作者的創意(特別是在結構與措辭方面),但一般而言,普通小說比新聞文章包含更多創意,而這些創意選擇對普通小說的品質更加重要。與此相關可以想像的,人們也許更在意一部小說是否為AI生成(非人類創造力的產物),而不是新聞文章是否由AI撰寫。

3. 評估「市場稀釋」時應比較之對象
應注意的是,在評估「市場稀釋」時,應該比較的對象並非「沒有LLM的世界」,而是「未接受過以著作權保護書籍作為訓練資料的LLM世界」。根據現有證據,書籍作為訓練資料,確實能大幅提升LLM的創造力和生成長篇文本的能力,由於LLM所受訓練的文本越多,其表現通常越好。因此,若模型僅以公有領域作品訓練,其能力在一般條件相同的情況下,預料會遠落後於同時接受著作權保護書籍訓練的模型。因此,如LLM以受保護書籍進行訓練,在大多數情況下似乎更能使LLM創作更好作品,從而對其​​訓練資料中的書籍產生「市場稀釋」。

4. AI輸出相似度較低內容仍可能導致市場替代
反之,Meta則認為「市場稀釋」不應列入第四要素考量。其認為只有當LLM的輸出本身構成侵權,也就是LLM「重製著作權作品」或「產出與其實質相似的內容」時,其結果造成的這種損害才具有相關性。但法院認為這種說法並不正確,如果LLM能重現那些受保護作品,或生成實質相似的文本,複製書籍的市場將受到損害當然較為明確。但是,即使是相似度較低的輸出內容,例如同一主題或類型相近的書籍,也仍然能在市場上與訓練資料中的原著書籍競爭,透過分散搶走原書的銷售額,或是讓大量類似書籍充斥實體與線上書店,導致原書無法被人注意和購買,這些結果都會削弱創作者創作的誘因 -- 這正是著作權制度意圖防止的損害。

最高法院曾於Campbell案中指出,在合理使用的第四要素下,唯一重要的損害是「市場替代所造成的損害」。然而,「間接替代」仍然是一種替代:如有人選擇購買由LLM創作的愛情小說,而非人類作者撰寫的同類小說,那麼這本由LLM生成的小說實際上就替代了人類創作的作品。這與批判或評論所造成的損害不同,因其雖然也可能降低原作的市場需求,但並不會構成原作之替代品。

Meta另主張,來自非侵權之二次創作的「合法」競爭,不應在第四要素下被視為可認定的損害,其再度引用「中介性複製」相關案例,作為依據來支持。但法院認為,這些案例推論的關鍵在於,二次創作使用者所開發的競爭性產品,並未從其所複製的原作品中獲取創意表達而受益。相較之下,LLM因為透過受著作權保護的書籍中的創意表達進行訓練,才得以更有效地生成文本(包含具競爭性的作品)。因此,這樣的競爭並不符合上述判例所稱「合法」標準。


(四)生成式AI應特別斟酌「市場稀釋」或「間接替代
本案法官承認,在過去許多著作權案件中,「市場稀釋」或「間接替代」的概念並未顯得特別重要。這是因為典型的案件中,通常是在比對原創作品與單一的二次創作;即使該二次創作與原作略有相似,只要不至於近似到被認定構成實質近似,其仍可能對原作市場產生輕微的間接影響,但或許這是無關緊要不致構成關鍵。重點在於,第四要素評估的是被告的這類行為,是否會「對原作的潛在市場產生重大不利影響」。

1. 第一要素有利於二次使用會容忍少量市場競爭

即使存在一些來自間接替代的損害,也不足以決定第四要素或整體合理使用判斷的結論。例如,在第一要素有利於二次使用的情況下,法律可能會容忍某種程度的少量市場競爭。在涉及單一相似但又不過於相似(similar-but-not-too-similar)的二次創作的案件中,其對市場稀釋造成的損害影響往往不足以產生實質影響。即使考慮到如最高法院在Oracle案中所說的「被告從事的這類行為若普遍存在時的影響」,如只是一次產出一件具間接替代性的作品,其對原作市場的影響仍相對有限。

2. 生成式AI可能帶來原作之「規模性市場淹沒」
但本案生成式AI並非如此,其並未將原創作品與二次創作進行一一比對,也不像以往合理使用案件那樣僅涉及數位工具之建置。在過去像Google Books或Perfect 10的案件中,所涉及的工具頂多是讓使用者取得原作部分或全部內容;而本案所涉及的與上述之案例都不同,AI是一種能在極短時間內、幾乎不需任何創意投入的情況下(其時間和創造力遠不及用於創作其訓練對象的原創作品),生成數以百萬計以上的二次創作的技術。其他任何用途 -- 無論是創作單一之二次創作,還是創作其他數位工具 -- 都不具備像生成式AI所訓練LLM那樣,造成市場充斥競爭性作品,而可能帶來的「大規模淹沒市場」的潛力(potential to flood the market)。因此,「市場稀釋」這一概念在本案中便顯得格外重要。

Meta又主張,由於過去從未有類此前例而被定案,因此這種損害不應被納入考量。然而,這正是最高法院所警告應避免犯下的錯誤:「機械式地套用過往案例中的概念,而不退一步去思考背景脈絡」。合理使用是一套靈活具彈性的法律原則,應該能回應「科技發展的重大變化」。法院不能僅僅因這類問題之前未出現過,就對一項新技術可能「嚴重損害創作誘因的明顯方式」視而不見。事實上,在類似這樣的案件中,市場稀釋很可能會使原告在第四要素上占明顯優勢,進而在整體的合理使用判斷上獲勝。(6809字)

 
 

[1] 在著作權法脈絡中,最需要杜絕的即直接替代(substitution),其對原作市場造成最大傷害。
  

 
歡迎來粉絲團按讚!
--------------------------------------------------------------------------------------------------------------------------------------------
【聲明】
1.科技產業資訊室刊載此文不代表同意其說法或描述,僅為提供更多訊息,也不構成任何投資建議。
2.著作權所有,非經本網站書面授權同意不得將本文以任何形式修改、複製、儲存、傳播或轉載,本中心保留一切法律追訴權利。