︿
Top

生成式AI LlaMA著作侵權案簡易判決出爐 --北加州法院再下一城Kadrey v. Meta(下)

瀏覽次數:250| 歡迎推文: facebook twitter wechat Linked

科技產業資訊室(iKnow) - 陳家駿 發表於 2025年7月18日
facebook twitter wechat twitter
  
圖、生成式AI LlaMA著作侵權案簡易判決出爐 --北加州法院再下一城Kadrey v. Meta(下)
 
十、本案簡易判決原告敗訴緣由
依上述法官大幅闡析生成式AI史無前例地造成原作「市場稀釋」之嚴重後果,看來原告應占上風而取得勝訴。但法官話鋒一轉,認為法院不能根據其認為案件將會發生或應發生的情況做出判決,而必須依當事人提出的論點和證據來裁決。因此,法院認為問題在於,本案的13名原告是否已提供足夠的證據,來贏得這項要素的判斷!或者更準確地說,本案應該問的是:原告是否已提供足夠的證據,來支持建構「就重要事實具真正爭議」(genuine dispute of material fact),從而讓是否構成「市場稀釋」的問題交由陪審團審理,而不是經由法官基於「沒有重要事實之真正爭議」直接作出簡易判決,但答案是否定的。

(一)原告僅主張二種市場損害之缺陷
關於這些合理使用的爭論,原告起訴僅提出二種市場損害理論,來說明Meta的複製影響其作品市場:其一是Llama的使用者可能從其書籍中,複製少量的文本;其二是Meta未經授權的複製行為,削弱原告將其作品授權給他他人進行AI訓練的市場。

法院認為,這二種論點均站不住腳。其一,Llama無法從原告書籍中生成足夠的文本,因此對原作市場沒有實質直接影響。其二,原告不享有在所謂之授權市場,將其作品作為訓練資料的專屬權(即無權控制將其作品作為訓練資料之授權市場)。至於Meta複製原告書籍所開發的類似產品可能充斥市場,從而導致「市場稀釋」 -- 即Meta複製原作訓練Llama產品,將不可避免地導致原告之作品市場被類似作品充斥而遭淹沒,原告則完全未曾提及,更未提供任何證據,來證明Meta模型目前或預期輸出內容,如何稀釋原告作品的市場。

更何況,Meta在其所申請之簡易判決交叉動議中,側重於駁斥這兩項理論;且在動議中指出,原告並未提出任何證據,證明Meta使用其書籍訓練Llama的行為,對其書籍銷售造成損害。Meta更提出自家專家證言說明,在Llama發表後的時間內,並未觀察到對原告書籍銷售,有任何可辨識的不利影響。


(二)原告未證明AI書籍影響並產生競爭關係
法院認為,原告未證明AI書籍影響並產生競爭關係。首先,Llama是否具備生成這類書籍的能力?如果目前還不能,那麼它在不久的將來是否會具備這種能力?合理推測答案可能是肯定的,但這並非定論。一個LLM可能會被設計為無法產出書籍長度、或書籍風格的輸出內容。因此,某些LLM能創作書籍的事實,並不當然就代表Llama現在就能做到,或很快就會具備這種能力。

其次,這些AI生成的書籍到底是什麼?它們是否會與原告的回憶錄競爭?是否會與原告的短篇小說競爭?還是會與原告關於家庭暴力的非小說著作競爭?原告並未對其「書籍所屬市場」進行任何分析,也沒有討論這些市場,是否已經或可能受到AI生成書籍的影響,更沒有說明其專家報告中提及的AI書籍,是否實際上進入這些市場並產生競爭關係。

第三,這種競爭究竟實際上,會對原告書籍的銷售產生何種影響?它會完全壓制或淹沒那些書籍的銷售?還是僅在邊緣地帶蠶食銷售量造成些微損害?或者,看來更可能的情況是,取決於書籍本身的類型 -- 也許愛情小說的讀者樂意購買AI生成的書籍,而想閱讀知名作家回憶錄的人,仍然會願意選擇其親自撰寫的書本,而非AI的創作?無論迄今為止的影響為何,隨著越來越多AI生成書籍的問世,以及LLM在撰寫近似人類文本方面的能力日益精進,這些影響未來是否可能會進一步擴大?

第四,在LLM「開發者可以複製原告書籍的世界裡」,原告書籍市場面臨的威脅,與「開發者無法複製原告書籍的世界裡」,原告書籍市場所面臨的威脅,二相比較有何差異?原告提交的訴狀或證據中對此均未提及。

由於合理使用屬於積極抗辯,Meta就此提起簡易判決動議,因此應由Meta負舉證責任,證明其複製行為不會對原告書籍的市場造成實質損害。而Meta雖未能「完全證明」其複製在未來不會造成損害,但或許正是因為其複製行為確實能使Llama更優地創作出無數作品,從而稀釋原告書籍的市場。再加上,當被告提出目前「缺乏市場損害」的初步證據時,而原告卻未提出任何「實證」證據(empirical evidence)加以反駁,第四要素就應該有利於被告。

本案Meta提出了證據,顯示其複製行為未對市場造成損害;原告則並未能提供任何相反的實證證據 -- 既無證據顯示複製已造成市場損害,也無證據表明複製將來可能造成之損害。因此原告所有提出的指控都只是推測,而推測並不足以構成「真正具爭議的事實問題」(genuine issue of fact),而得以阻止簡易判決的成立。


(三)市場損害不能由事實推斷而需舉證
原告再主張,其不需要提出實證證據,因為市場損害可以由事實來推斷。為此,其援引Hachette Book Group, Inc. v. Internet Archive一案,第二巡迴上訴法院在該案中認定 -- 即使原告並未提供任何實證資料證明有損害,而被告提供了專家證詞證明不存在市場損害,法院仍推論市場損害的存在,因為若該二次使用行為廣泛傳播,其會造成損害是「不言而喻」的(self-evident)。在該案中,二次使用者維護一個資料庫,讓網路使用者「免費下載與原告書籍完全相同的副本」,因此,其使用行為係直接提供與原作的「競爭性之替代」(competing substitute)。

法院認為,雖然在Hachette案中推論市場損害有其道理,但在本案中則不具相同之合理性。首先,最高法院在Campbell案中曾明確表示,「市場損害的推斷……不適用於涉及超出單純為商業目的而進行複製的情形」。而Hachette案中,二次使用基本上就是「單純的複製」(mere duplication);相較之下,本案中Meta的使用行為具有高度轉化性,且其目的也遠不止於此。其次,與Hachette案不同的是,Meta的使用並不致讓使用者,接觸到原告書籍的任何重要內容,因此,Meta的使用會透過直接替換造成損害,並非「不言而喻」的。

Llama會透過讓使用者創造大量競爭書籍,來損害書籍銷售市場,這也並非「不言而喻」的。雖然Llama損害書籍市場是有可能,甚至是很有可能的;但若要得出此種結論,必須進行一些推論:Llama(而非其他LLM)能被用來創作這類書籍、而且將實際被用於創作此類書籍、消費者會購買這些書而不買人類作者所撰寫的書、特別是消費者會放棄購買原告的書而轉買這些書,並且Llama在創作此類書籍方面明顯更勝一籌,是因為其訓練資料中包含了受著作權保護的書籍。

綜上所述,原告對複製行為造成或威脅其市場重大損害的論點並不充分,且Meta已成功予以駁斥。法院坦承,這一結論也許與現實情況有明顯落差,但這是由原告自身訴訟策略所導致的結果 -- 他們選擇提出二種有瑕疵的市場損害理論,卻未提出足夠證據,來證明將他們的書用於訓練Llama的LLM,是否對該書的市場造成實質影響。而關於合理使用的第四要素,還有以下兩項議題值得注意。


十一、Meta使用盜版之影子圖書館
如前所述,Meta使用「影子圖書館」是否使這些圖書館或其他使用者受益?如果是,那麼這將與第四要素相關。這可能代表Meta的複製行為,協助他人在未付費的情況下,取得原告受著作權保護的作品,而這些行為並無任何跡象表明其他人是出於合理使用的目的。

然而,儘管原告詳細討論Meta使用影子圖書館的情形,但除了指出Meta因使用這些圖書館,得以免付費取得書籍之外,其並未主張此一行為產生之影響,或與第四要素有任何關聯。在庭訊中,原告律師確曾暗示,Meta及其他類似公司透過使用影子圖書館,可能會淡化大眾對影子圖書館的負面觀感,並可能鼓勵更多人使用。然而,這樣的現象是否對整體分析具有意義仍屬不明確;而且無論如何,律師也承認紀錄中並無證據顯示這種趨勢確實正在發生。


十二、Meta複製行為是否帶來公共利益
關於Meta複製行為是否帶來公共利益?雙方在此部分的主張,都無助於解決問題。原告主張,若法院認可Meta的行為,將會鼓勵其他LLM公司仿效,從而助長盜版,甚至「支持並庇護」那些免費提供盜版作品的影子圖書館。然而,並無證據顯示Meta(或其他LLM開發者)積極支持或鼓勵這些影子圖書館的廣泛使用。至於激勵其他LLM開發者使用影子庫,原告再提出一個問題 -- LLM開發者是否應為其用作訓練資料的書籍付費,這是本案要處理的問題之一。

Meta則多著墨於LLM的多種用途,但與第四要素最相關的公共利益,是那些與著作權所關注的「創新表達的內容」有關的利益。因此,例如Llama是否能協助用戶報稅,與本案關聯不大。然而,Meta使用受著作權保護的作品作為訓練資料,的確可能提升Llama創作新表達內容的能力,無論是透過提升其協助使用者創作文字的效果,或是透過增強其「記憶力」,從而使其對進行軟體研究與開發的研究人員更有用。因此,在公共利益的考量下,情勢略為偏向Meta,進而使Meta在第四要素上獲勝。


十三、禁止未經授權使用不會損害公共利益
與此相關的,Meta認為,若禁止AI開發者在未付費的情況下,使用受著作權保護的文本作為訓練資料,將會「嚴重損害」公共利益。Meta 似乎暗示,若法院做出此否定裁決,將會導致LLM與其他生成式AI技術的發展戛然而止,法院認為這種說法是無稽之談,因為裁定某種複製行為不構成合理使用,不代表使用者就必須停止複製,而是其需取得授權,這頂多可能讓LLM的發展稍微放緩,或獲利略有下降,但要說這會導致LLM技術的停滯,根本站不住腳。因為,即使不構成合理使用,包括Meta的開發者也無需停止訓練,只要付費取得授權即可使用受著作權保護的作品。

Meta另主張「授權市場無法形成或不會形成」的說法,也難以令人信服。如果書籍對LLM真的如Meta所言具有高度訓練價值,那麼LLM開發者顯然有誘因願付費來取得授權。即使任何單一本書作為訓練資料的價值太低,而不足以支撐書籍逐一進行授權談判的成本,LLM開發者仍有可能會對授權大量書籍的方案感興趣。

目前出版商或許尚未持有進行團體授權所需的「附屬權利」(subsidiary rights),但可以合理預期,出版商很快將會與作者談判以取得這些權利,以便於和LLM開發者進行大規模的授權談判協商。如LLM開發者唯一的選擇,是取得授權或放棄使用受著作權保護的書籍作為訓練資料,那麼這些授權市場很可能會出現。反之,若其選擇只使用公共領域的作品作為訓練資料(而不是獲得為受保護的作品取得授權),那將顯示他們其實並不像其所宣稱的那樣迫切需要這些受著作權保護的作品。

十四、法院判決總結
合理使用是一項基於具體事實進行判斷的法律原則,需分析個案並敏銳回應新科技及其可能帶來的後果。過去並無任何案例涉及像LLM訓練這樣既具高度轉化性、又有能力大規模稀釋原作市場的使用行為。因此,先前沒有任何案例,能解答Meta此種複製行為是否構成合理使用。此問題必須透過靈活應用合理使用的四項要素,並從著作權與合理使用的目的來審視Meta的複製:也就是藉防止複製者創造出市場上足以替代原作的作品,以維護創作誘因。

在過去涉及類似海量複製的案件中,在有完整證據的情況下,其使用行為已對原作市場造成損害,使原告往往勝訴。但本案,Meta無論其LLM訓練多麼具有轉化性,要主張這種利用受著作權保護的書籍開發工具,來賺取數十億甚至數兆美元收入的行為構成合理使用,法律感情上實難以想像,特別是當它促成源源不絕的競爭作品,並對原作品的市場造成重大損害時尤然。而未來也可能出現更加明確不利於合理使用的案例,例如某些作品(如新聞報導)的市場,可能比其他類型作品更容易受到AI輸出之間接競爭的衝擊。

然而另一方面,如果具體事實稍有所不同,被告也可能勝訴。例如,若使用受著作權保護的書籍,來訓練用於非營利目的的LLM(如國家安全或醫療研究),即使存在某程度的市場稀釋,仍有可能構成合理使用,如複製行為並非為營利目的,則將傾向支持合理使用。此外,若原告的作品本身,不太可能受到AI生成作品的實質競爭,也可能無法擊敗合理使用的抗辯。

本案中,因為Meta對涉案作品的使用具有高度轉化性,原告必須在合理使用的第四要素上取得決定性勝利,才能贏得整體合理使用的判決。當二次使用具有「顯著重大轉化性」(significantly transformative)。為了避免不利之簡易判決,原告必須就該要素,提出可構成「真正重要事實的爭議」(genuine issue of material fact)。鑑於「市場稀釋」議題在本案中至關重要,若原告提出任何證據足以讓陪審團支持他們的主張,則第四要素必須交由陪審團決定,而非由法官來決定。

準此,原告原本或許可能在簡易判決階段,就合理使用問題提出足夠有力的證據,來贏得合理使用之議題。但原告完全未針對「市場稀釋」提供任何具體有力的證據。在缺乏證據且考量Meta已提出證據的情況下,第四要素只能有利於Meta。因此,Meta有權就其合理使用抗辯,取得構成對其有利之簡易判決。


「使用受著作權文本訓練AI模型可合理使用」,但Alsup 對盜版圖書永久儲存行為予以否定,要求其承擔侵權責任;Chhabria則對Meta 使用盜版複製雖知悉,但聚焦於訓練目的,並保留未來市場稀釋論可能扭轉裁定的空間,指出本案原告舉證不足。


十五、筆者觀點分享
觀察北加州法院的這二個判決,相較而言,Bartz案法官著重在LLM訓練的資料是正版或盜版,然後一刀切的以二分法終結;但本案的法官,則是較深刻的剖析合理使用適用要件。二位法官都認同生成式AI可構成「轉化性」。但二個案子最大的差別是,Bartz案法官著重的是第一要素的判斷,而本案法官認為除此之外,第四要素才是最重要的決定關鍵!

至於就盜版素材可否構成合理使用,看法也頗不一致。Bartz案對盜版圖書永久儲存行為予以否定;但本案對盜版圖書館之複製未立即否定,並保留未來市場稀釋論,可能扭轉裁定的空間,並指出原告舉證不足。但是跟Bartz案一樣,本案由於原告並未指控Meta實際上生成足夠相同的內容,因此,都針對訓練的複製加以控訴,而由法官判決理由明顯可知,如有生成內容實質相似,則完全會是另一種情況!

針對第三要素,法官認為LLM訓練本來就必須要大量,而且是全部大規模的複製這點,並不認為會不利於第三要素關於數量之判斷,此比較傳統以來針對複製數量的限制,的確是非常先進的看法!而本案最具啟發的,在於法官提出一嶄新的概念。過去美國案例中,只要具有「轉化性」似乎就可構成合理使用,使其成為獨立於四項判斷因素中的「帝王條款」!但本案法官卻認為,在生成式AI的場合中,單單具有轉化性是不夠的,還必須結合最重要的第四要素,也就是針對「市場稀釋」和「間接替代」的損害來加以論定!

本案之所以判Meta獲勝,完全是訴訟策略和程序上的技術擊倒。這也是為何法官謹慎的表明,他的判決結果或許「與現實有顯著落差」!但基於簡易判決的程序要件,被告明顯採取正確戰略,法官在當事人進行主義必須謹守中間立場,嚴格檢視兩造的主張和證據,強調其別無選擇不得不核准Meta的簡易判決。原告第一回合雖中箭落馬,但可能會繼續上訴,將來鹿死誰手尚未可知。

另一方面,法院又小心翼翼地做出限制,認為本裁決的影響有限,由於本案並非集體訴訟,因此判決僅影響這13位作者的權利,而非得擴及適用於所有其他被Meta複製之無數作者作品的權利;而且本判決也不代表Meta使用受著作權保護材料,來訓練其模型的行為就是合法的,此僅表明原告提出的論點有誤,且未能提供證據來支持。


十六、尾聲
總之,本案表面上看似乎AI公司獲勝,但細繹判決理由中第四要素,法官實已明確指出生成式AI對權利人市場,可能帶來嚴重之競爭損害。因此,針對判決中多項削弱合理使用主張的關鍵論點,均對被告不利,故本案絕不能視為生成式AI廠商全面勝出。由此可見,本案原告敗訴僅屬個案,未來其他權利人若依本案所揭示的判斷基準對AI開發商起訴,可能仍有很大的空間取得勝訴契機。

AI對於著作權所產生的衝擊已無所不在!就在目前各方都認為,現行著作權法因應生成式AI科技抓襟見肘,本案法官仍能固守既有法制,本著法律原有的彈性和韌度做出中肯的詮釋。像國內最近衍生的案例,不論是中央社或是七法資料庫判決所引起的爭議,在在讓人對新興科技的發展,如何應用在現實個案時產生疑慮!但美國Meta案的判決,卻擲地有聲地提出因應之道,在目前還沒能針對著作權法修法之前,本案判決所依據的法理論述,殊值借鏡。(6148字)


作者資訊:陳家駿律師  台灣資訊智慧財產權協會理事長 


參考資料
Kadrey, et al., v. Meta Platforms, Inc., Partial Summary Judgment, Case 3:23-cv-03417-VC, Filed 2025/06/25
Bartz et al. v. Anthropic PBC, Order on Fair Use at 28, No. 24-cv-5417,Filed 2025/06/23
Comparing Judge Alsup and Judge Chhabria’s fair use decisions in Anthropic, Meta cases, Chat GPT Is Eating the World, 2025/06/26
Fair Use and AI Training: Two Recent Decisions Highlight the Complexity of This Issue, Skadden,2025/07/08


相關文章:

 
歡迎來粉絲團按讚!
--------------------------------------------------------------------------------------------------------------------------------------------
【聲明】
1.科技產業資訊室刊載此文不代表同意其說法或描述,僅為提供更多訊息,也不構成任何投資建議。
2.著作權所有,非經本網站書面授權同意不得將本文以任何形式修改、複製、儲存、傳播或轉載,本中心保留一切法律追訴權利。