歐盟首宗生成式AI侵權案例──慕尼黑地院GEMA v. OpenAI案里程碑實體判決
科技產業資訊室(iKnow) - 陳家駿 發表於 2026年2月24日

圖、歐盟首宗生成式AI侵權案例──慕尼黑地院GEMA v. OpenAI案里程碑實體判決
原告GEMA之指控
GEMA向慕尼黑第一地方法院(Munich I Regional Court,案號42 O 14139/24)對美國AI開發商OpenAI提起訴訟,控告OpenAI在訓練其用於GPT-4與GPT-4o大型語言模型(ChatGPT核心技術)過程中,未經授權使用其受著作權保護之歌曲歌詞[1]構成侵權。
GEMA主張,這些歌詞已被嵌入GPT模型參數之中,並可在使用者簡單提示下被近乎逐字重現,此種「記憶化」(memorised)行為,構成違反《德國著作權法》(Urheberrechtsgesetz, UrhG)第15、16及19a條所禁止的未經授權之複製以及向公眾傳輸行為[2]。
被告OpenAI之抗辯
OpenAI則抗辯,其模型並未儲存或複製任何特定的訓練資料,而僅是反映整體資料學習而得的統計關聯。當輸入簡單的提示時,ChatGPT會複述歌曲的歌詞,其輸出結果係基於序列分析(sequential-analytical)、反覆迭代之機率導向的合成(iterative-probabilistic synthesis)過程,屬於一種獨立且原創的(機器)生成方式[3]。而且只在模型參數中保留統計性知識。其所輸出的任何文字,皆係由使用者提示所觸發導致,並非在OpenAI所能控制之範圍,侵權行為係由使用者提示所致。
即便存在使用受保護作品之情形,OpenAI主張,亦應適用歐盟「文本與資料探勘」(Text and Data Mining, TDM)之責任豁免的例外規定,即《歐盟CDSM指令》(EU 2019/790)第3與4條,該等規定已分別納入德國法UrhG第44b與60d條,主張相關使用行為亦受該等例外規定所涵蓋[4]。
慕尼黑地院之裁判
1. 地院之裁判內容
對此一歐盟首件生成式AI侵權案例,慕尼黑地院於2025年11月11日作出判決,在這一具有里程碑意義的第一審實體判決中,地院大致支持GEMA關於禁止令、資訊揭露及損害賠償的請求。法院裁定核准禁制令與資訊揭露請求,禁止OpenAI包括但不限於下列行為[5]:
- 未經原告同意,於大型語言模型中全部或部分重製歌曲歌詞,或使第三人為此等行為,如同發生於GPT-4與GPT-4o模型中的情形;
- 未經原告同意,在生成式語言助理(聊天機器人)的輸出中,全部或部分或以改作形式向公眾提供歌曲歌詞,以及重製該等歌詞,或使第三人為上述行為。
- 此外,法院亦命OpenAI提供相關資訊並負損害賠償責任(惟賠償金額尚待確定)。然而,關於人格權、涉及錯誤標示作者的相關請求,則遭到駁回。
2. AI訓練是否為著作權法的「重製」──歐盟法下「固著」要件
二造均不爭執歌曲歌詞曾被用於訓練資料,但對此是否構成「重製」則意見相左。法院認為,AI訓練行為已構成德國著作權法上之「重製」,其法理基礎係源自《資訊社會指令》(InfoSoc Directive)第2條之重製概念,即重製得以「任何形式、任何方式」存在,並不以傳統可直接感知之複製型態為限。
法院特別強調,即便作品僅以數值化之機率參數加以固著(fixation),只要該作品內容仍可於日後透過技術手段被感知或再現,即已符合重製之構成要件,而其編碼雖係以機率權重的形式存在,亦不妨礙其被評價為著作權法上的「複製」,因為模型參數本身即體現受著作權保護之表達形式。依地院之見解,系爭歌詞已在模型中以物理方式固著,並可被間接感知[6]。
3. AI「記憶化」構成「重製」
法院採納GEMA的主張,認為訓練資料可被嵌入模型權重中,並可被重新取回(extractability),此即GEMA所稱之「記憶化」(memorisation)[7]。法院認為,僅憑使用者提示,ChatGPT即可幾乎逐字重製原始歌詞的重要部分。例如系爭歌詞可透過如「某首歌曲的歌詞是什麼?」、「誰寫了歌詞」、「某首歌曲的副歌是什麼?」、「請告訴我第一段歌詞」、「請告訴我第二段歌詞」等極為簡單的提示即被清楚辨識並重製再現。
法院認為,由於模型中存在「記憶化」現象,該等內容已於既定模型參數架構下形成具體化(embodiment),進而滿足著作權重製所要求之固著要件。換言之,系爭歌曲歌詞得以在模型中重複地被固著與再現[8]。法院並指出,可透過將原歌詞與ChatGPT的輸出進行比對,判斷存在記憶化現象,而該等歌曲之歌詞已在語言模型中被重製,因為相關歌詞已被模型記憶化(memorised)[9]。
法院亦注意到部分輸出內容存在「幻覺」(hallucinations),但認為這些偏差不影響原歌曲歌詞在其獨特性上的可辨識性,因為被記憶的內容本身仍保持一致,變化主要出現在可替換的開頭或結尾文字,而非歌詞的核心內容。鑑於文本的複雜性與長度,法院認為可排除純屬巧合的可能性。
另外,法院否定OpenAI的主張,即認為GEMA有義務在模型中具體指出可明確界定的資料。法院並以MP3檔案所使用的有損壓縮技術(lossy compression)作為類比,認為只要模型能根據訓練過程中所取得的統計資訊,生成在統計上高度可能、且可辨識地重現歌曲歌詞的詞元序列,即屬充分[10]。
4. 輸出結果之侵權&向公眾傳輸侵權
法院進一步指出,若LLM在回應簡單提示時,重現該文本中具有本質性與原創性的要素,則構成另一重製行為。此外,將該等輸出內容提供給使用者,亦構成向公眾提供(making available to the public);除認定GPT-4與GPT-4o語言模型本身構成侵權外,地院亦在輸出結果中認定存在其他侵權行為,其中包括未經授權向公眾傳輸。即便與原文存在輕微差異,亦不影響侵權之成立。
慕尼黑地院認定,OpenAI係直接實施向公眾傳輸行為之主體。其係自行將作品提供予公眾,而非僅作為第三人傳達行為之中介、或僅係提供技術基礎設施。由於OpenAI對其模型內容負責,且該等內容可透過簡單提示即被重製,被告不得類比為主機平台服務提供者、硬體供應商或軟體提供者[11]。
基於上述認定,法院除認為歌詞存在於模型參數之中即構成固著,而其於ChatGPT輸出中的重現,則構成進一步的重製行為及向公眾傳輸行為。法院援引UrhG第15、16、19a條及《資訊社會指令》(Directive 2001/29/EC,「InfoSoc指令」)第2與3條,認為ChatGPT 4與4o模型中對歌詞的記憶化,構成未經授權的重製與向公眾傳輸。
5. 本案不適用文本與資料探勘之責任豁免例外
法院認為,大型語言模型的訓練行為原則上,會落入「文本與資料探勘」(TDM)規範的適用範圍;因《德國著作權法》第44b條(TDM例外)的立法理由中,明確將「機器學習作為AI的基礎技術」納入其適用對象。然而,法院認為,爭議歌詞在模型中的重製,並不構成TDM。法院指出,TDM之目的,在於評估資訊本身並提取資訊知識,例如抽象的語法規則、常見詞彙或語意關係;然而本案中對歌詞的記憶化,已超出單純評估與資訊提取的TDM範圍,作為訓練資料使用的歌曲歌詞已整合至模型參數之中,因此,不屬於單純的TDM行為。
依《DSM指令》第4條要求,相關重製行為必須係為TDM之目的而為;然而,本案中的重製行為並非為後續資料分析。因此,TDM的著作權例外不得作為正當化依據。此一目的限制,反映《DSM指令》背後的立法考量:依其前言所述,導入TDM例外,不僅在於促進創新與新技術,同時亦在於保護作者權益。因此,地院遂認定,《德國著作權法》第44b與60d條所規定之文本與資料探勘例外,並不適用本案OpenAI所涉及之重製行為[12]。
準此,法院遂駁回OpenAI援引UrhG第44b條(TDM例外)的主張,指出該條僅允許為分析目的所必要之準備性重製。一旦LLM產出可被再現之作品,即已影響權利人之利用利益,並超出TDM例外之範圍。法院基於該條文之文義、體系與目的,拒絕任何擴張或類推適用。
與英國《Stability AI》和德國《LAION》案判決之對比
本案慕尼黑法院之裁定,OpenAI生成式AI的訓練不構成TDM,這一點都不令人意外。因為比照德國漢堡地院在2024年9月所做的Kneschke v. LAION實體判決可知,該案的被告完全是在做資料探勘的知識提取,完全不涉及任何生成式AI。反之,本案OpenAI則完全是進行TDM以外的自動生成,或許其在前一階段曾進行資料探勘的操作,但無論如何,TDM並非進行生成式AI,因此針對生成式AI的操作,則與TDM無涉,因為TDM本身並不會去生成任何受著作權保護之內容!
另一方面,吾人也可將本案與英國高等法院於2025年11月4日在Getty Images v. Stability AI案中作出的判決做對比。英國高等法院駁回Getty提出的間接著作權侵權主張,理由在於其不認為Stable Diffusion(被告Stability AI的模型)構成「侵權複製品」[13]。反之,慕尼黑法院則明確承認:若受保護作品得以被再現地界定,AI模型本身(即本案中的ChatGPT)即可能「包含」對著作權具有意義的訓練資料複製內容。此一差異,反映出對生成式AI技術事實及其著作權法意涵的根本上之不同理解[14]。
在英國案例中,法院認為模型權重不構成重製,但為何本案模型參數,卻被法院認為構成重製他人有著作權的內容?理由其實很簡單,因為兩個案子的事實不同,在英國案中因為原告沒有提出任何實質近似的侵權內容,因此模型權重內當然就不構成侵權複製品。反之,本案中,GEMA已經證明GPT吐出來的內容,就有原告的歌詞,因此其模型參數內就包括侵權複製品。
從此看得出,只要個案中AI輸出結果,有複製到原告受保護的著作內容,則不論是訓練過程中或輸出結果的複製,都可能構成侵權責任。但如果缺乏這種與原告作品近似之輸出內容時,像英國案件,訓練過程中的複製又不在英國而在美國,則對原告而言就更難處理。總之,同樣是生成式AI的案例,但事實不同,結論當然就有所異。
小結
本案還有一個特別的地方是,在美國眾多的AI著作侵權案例中,針對生成結果如構成侵害,究竟是AI工具提供者、還是使用者應該負責?美國迄今還沒有任何判決表示見解。但慕尼黑地院則認為,責任應歸屬於OpenAI這種AI工具提供者。理由在於:OpenAI作為語言模型的開發者、訓練者與營運者,負責收集與利用訓練資料、決定其技術架構、建構並營運系統,並提供模型供公眾使用;而使用者的提示僅是觸發模型內部運作的誘因,並不會產生獨立的法律責任。
總之,本判決目前尚未確定,因為OpenAI已宣布將提出上訴,未來可能由慕尼黑高等地方法院進行審查,但亦不排除聲請向歐盟法院(CJEU)進行先決問題裁定的可能性[15]。(3966字)
[1] 本案涉及九首知名德國歌曲,包括 Christina Bach 的〈Atemlos〉、Herbert Grönemeyer 的〈Männer〉,以及Reinhard Mey的〈Über den Wolken〉等作品。
[7] 法院並援引有關大型語言模型中訓練資料可被取回(extractability)的學術研究,認定本案輸出結果不可能僅屬巧合。
[13] 但英國高院並未就Getty核心主張──即Stability AI是否未經授權使用數百萬張Getty攝影作品進行訓練──作出實體判斷,因Getty無法證明訓練行為發生於英國境內,以成立直接侵權主張。因此,英國法院如何評價以第三方受著作權保護內容進行AI訓練,仍有待觀察。Borne Clarke, GEMA vs. OpenAI | AI memorisation is a reproduction relevant to copyright law, and the TDM exception does not help in LLM training, Munich I Regional Court holds.
--------------------------------------------------------------------------------------------------------------------------------------------
【聲明】
1.科技產業資訊室刊載此文不代表同意其說法或描述,僅為提供更多訊息,也不構成任何投資建議。
2.著作權所有,非經本網站書面授權同意不得將本文以任何形式修改、複製、儲存、傳播或轉載,本中心保留一切法律追訴權利。
|