歐盟首宗生成式AI侵權案例──慕尼黑地院GEMA v. OpenAI案里程碑實體判決

關鍵字：；；；()；；；；()；()；()；；；；；()；；()；；

瀏覽次數：6014｜歡迎推文：

科技產業資訊室(iKnow) - 陳家駿發表於 2026年2月24日

圖、歐盟首宗生成式AI侵權案例──慕尼黑地院GEMA v. OpenAI案里程碑實體判決

原告GEMA之指控
GEMA向慕尼黑第一地方法院（Munich I Regional Court，案號42 O 14139/24）對美國AI開發商OpenAI提起訴訟，控告OpenAI在訓練其用於GPT-4與GPT-4o大型語言模型（ChatGPT核心技術）過程中，未經授權使用其受著作權保護之歌曲歌詞[1]構成侵權。

GEMA主張，這些歌詞已被嵌入GPT模型參數之中，並可在使用者簡單提示下被近乎逐字重現，此種「記憶化」（memorised）行為，構成違反《德國著作權法》（Urheberrechtsgesetz, UrhG）第15、16及19a條所禁止的未經授權之複製以及向公眾傳輸行為[2]。

被告OpenAI之抗辯
OpenAI則抗辯，其模型並未儲存或複製任何特定的訓練資料，而僅是反映整體資料學習而得的統計關聯。當輸入簡單的提示時，ChatGPT會複述歌曲的歌詞，其輸出結果係基於序列分析(sequential-analytical)、反覆迭代之機率導向的合成(iterative-probabilistic synthesis)過程，屬於一種獨立且原創的（機器）生成方式[3]。而且只在模型參數中保留統計性知識。其所輸出的任何文字，皆係由使用者提示所觸發導致，並非在OpenAI所能控制之範圍，侵權行為係由使用者提示所致。

即便存在使用受保護作品之情形，OpenAI主張，亦應適用歐盟「文本與資料探勘」（Text and Data Mining, TDM）之責任豁免的例外規定，即《歐盟CDSM指令》（EU 2019/790）第3與4條，該等規定已分別納入德國法UrhG第44b與60d條，主張相關使用行為亦受該等例外規定所涵蓋[4]。

慕尼黑地院之裁判
1. 地院之裁判內容
對此一歐盟首件生成式AI侵權案例，慕尼黑地院於2025年11月11日作出判決，在這一具有里程碑意義的第一審實體判決中，地院大致支持GEMA關於禁止令、資訊揭露及損害賠償的請求。法院裁定核准禁制令與資訊揭露請求，禁止OpenAI包括但不限於下列行為[5]：

未經原告同意，於大型語言模型中全部或部分重製歌曲歌詞，或使第三人為此等行為，如同發生於GPT-4與GPT-4o模型中的情形；
未經原告同意，在生成式語言助理（聊天機器人）的輸出中，全部或部分或以改作形式向公眾提供歌曲歌詞，以及重製該等歌詞，或使第三人為上述行為。
此外，法院亦命OpenAI提供相關資訊並負損害賠償責任（惟賠償金額尚待確定）。然而，關於人格權、涉及錯誤標示作者的相關請求，則遭到駁回。

2. AI訓練是否為著作權法的「重製」──歐盟法下「固著」要件
二造均不爭執歌曲歌詞曾被用於訓練資料，但對此是否構成「重製」則意見相左。法院認為，AI訓練行為已構成德國著作權法上之「重製」，其法理基礎係源自《資訊社會指令》（InfoSoc Directive）第2條之重製概念，即重製得以「任何形式、任何方式」存在，並不以傳統可直接感知之複製型態為限。

法院特別強調，即便作品僅以數值化之機率參數加以固著（fixation），只要該作品內容仍可於日後透過技術手段被感知或再現，即已符合重製之構成要件，而其編碼雖係以機率權重的形式存在，亦不妨礙其被評價為著作權法上的「複製」，因為模型參數本身即體現受著作權保護之表達形式。依地院之見解，系爭歌詞已在模型中以物理方式固著，並可被間接感知[6]。

3. AI「記憶化」構成「重製」
法院採納GEMA的主張，認為訓練資料可被嵌入模型權重中，並可被重新取回（extractability），此即GEMA所稱之「記憶化」（memorisation）[7]。法院認為，僅憑使用者提示，ChatGPT即可幾乎逐字重製原始歌詞的重要部分。例如系爭歌詞可透過如「某首歌曲的歌詞是什麼？」、「誰寫了歌詞」、「某首歌曲的副歌是什麼？」、「請告訴我第一段歌詞」、「請告訴我第二段歌詞」等極為簡單的提示即被清楚辨識並重製再現。

法院認為，由於模型中存在「記憶化」現象，該等內容已於既定模型參數架構下形成具體化（embodiment），進而滿足著作權重製所要求之固著要件。換言之，系爭歌曲歌詞得以在模型中重複地被固著與再現[8]。法院並指出，可透過將原歌詞與ChatGPT的輸出進行比對，判斷存在記憶化現象，而該等歌曲之歌詞已在語言模型中被重製，因為相關歌詞已被模型記憶化（memorised）[9]。

法院亦注意到部分輸出內容存在「幻覺」（hallucinations），但認為這些偏差不影響原歌曲歌詞在其獨特性上的可辨識性，因為被記憶的內容本身仍保持一致，變化主要出現在可替換的開頭或結尾文字，而非歌詞的核心內容。鑑於文本的複雜性與長度，法院認為可排除純屬巧合的可能性。

另外，法院否定OpenAI的主張，即認為GEMA有義務在模型中具體指出可明確界定的資料。法院並以MP3檔案所使用的有損壓縮技術（lossy compression）作為類比，認為只要模型能根據訓練過程中所取得的統計資訊，生成在統計上高度可能、且可辨識地重現歌曲歌詞的詞元序列，即屬充分[10]。

4. 輸出結果之侵權&向公眾傳輸侵權
法院進一步指出，若LLM在回應簡單提示時，重現該文本中具有本質性與原創性的要素，則構成另一重製行為。此外，將該等輸出內容提供給使用者，亦構成向公眾提供（making available to the public）；除認定GPT-4與GPT-4o語言模型本身構成侵權外，地院亦在輸出結果中認定存在其他侵權行為，其中包括未經授權向公眾傳輸。即便與原文存在輕微差異，亦不影響侵權之成立。

慕尼黑地院認定，OpenAI係直接實施向公眾傳輸行為之主體。其係自行將作品提供予公眾，而非僅作為第三人傳達行為之中介、或僅係提供技術基礎設施。由於OpenAI對其模型內容負責，且該等內容可透過簡單提示即被重製，被告不得類比為主機平台服務提供者、硬體供應商或軟體提供者[11]。

基於上述認定，法院除認為歌詞存在於模型參數之中即構成固著，而其於ChatGPT輸出中的重現，則構成進一步的重製行為及向公眾傳輸行為。法院援引UrhG第15、16、19a條及《資訊社會指令》（Directive 2001/29/EC，「InfoSoc指令」）第2與3條，認為ChatGPT 4與4o模型中對歌詞的記憶化，構成未經授權的重製與向公眾傳輸。

5. 本案不適用文本與資料探勘之責任豁免例外
法院認為，大型語言模型的訓練行為原則上，會落入「文本與資料探勘」（TDM）規範的適用範圍；因《德國著作權法》第44b條（TDM例外）的立法理由中，明確將「機器學習作為AI的基礎技術」納入其適用對象。然而，法院認為，爭議歌詞在模型中的重製，並不構成TDM。法院指出，TDM之目的，在於評估資訊本身並提取資訊知識，例如抽象的語法規則、常見詞彙或語意關係；然而本案中對歌詞的記憶化，已超出單純評估與資訊提取的TDM範圍，作為訓練資料使用的歌曲歌詞已整合至模型參數之中，因此，不屬於單純的TDM行為。

依《DSM指令》第4條要求，相關重製行為必須係為TDM之目的而為；然而，本案中的重製行為並非為後續資料分析。因此，TDM的著作權例外不得作為正當化依據。此一目的限制，反映《DSM指令》背後的立法考量：依其前言所述，導入TDM例外，不僅在於促進創新與新技術，同時亦在於保護作者權益。因此，地院遂認定，《德國著作權法》第44b與60d條所規定之文本與資料探勘例外，並不適用本案OpenAI所涉及之重製行為[12]。

準此，法院遂駁回OpenAI援引UrhG第44b條（TDM例外）的主張，指出該條僅允許為分析目的所必要之準備性重製。一旦LLM產出可被再現之作品，即已影響權利人之利用利益，並超出TDM例外之範圍。法院基於該條文之文義、體系與目的，拒絕任何擴張或類推適用。

與英國《Stability AI》和德國《LAION》案判決之對比
本案慕尼黑法院之裁定，OpenAI生成式AI的訓練不構成TDM，這一點都不令人意外。因為比照德國漢堡地院在2024年9月所做的Kneschke v. LAION實體判決可知，該案的被告完全是在做資料探勘的知識提取，完全不涉及任何生成式AI。反之，本案OpenAI則完全是進行TDM以外的自動生成，或許其在前一階段曾進行資料探勘的操作，但無論如何，TDM並非進行生成式AI，因此針對生成式AI的操作，則與TDM無涉，因為TDM本身並不會去生成任何受著作權保護之內容！

另一方面，吾人也可將本案與英國高等法院於2025年11月4日在Getty Images v. Stability AI案中作出的判決做對比。英國高等法院駁回Getty提出的間接著作權侵權主張，理由在於其不認為Stable Diffusion（被告Stability AI的模型）構成「侵權複製品」[13]。反之，慕尼黑法院則明確承認：若受保護作品得以被再現地界定，AI模型本身（即本案中的ChatGPT）即可能「包含」對著作權具有意義的訓練資料複製內容。此一差異，反映出對生成式AI技術事實及其著作權法意涵的根本上之不同理解[14]。

在英國案例中，法院認為模型權重不構成重製，但為何本案模型參數，卻被法院認為構成重製他人有著作權的內容？理由其實很簡單，因為兩個案子的事實不同，在英國案中因為原告沒有提出任何實質近似的侵權內容，因此模型權重內當然就不構成侵權複製品。反之，本案中，GEMA已經證明GPT吐出來的內容，就有原告的歌詞，因此其模型參數內就包括侵權複製品。

從此看得出，只要個案中AI輸出結果，有複製到原告受保護的著作內容，則不論是訓練過程中或輸出結果的複製，都可能構成侵權責任。但如果缺乏這種與原告作品近似之輸出內容時，像英國案件，訓練過程中的複製又不在英國而在美國，則對原告而言就更難處理。總之，同樣是生成式AI的案例，但事實不同，結論當然就有所異。

小結
本案還有一個特別的地方是，在美國眾多的AI著作侵權案例中，針對生成結果如構成侵害，究竟是AI工具提供者、還是使用者應該負責？美國迄今還沒有任何判決表示見解。但慕尼黑地院則認為，責任應歸屬於OpenAI這種AI工具提供者。理由在於：OpenAI作為語言模型的開發者、訓練者與營運者，負責收集與利用訓練資料、決定其技術架構、建構並營運系統，並提供模型供公眾使用；而使用者的提示僅是觸發模型內部運作的誘因，並不會產生獨立的法律責任。

總之，本判決目前尚未確定，因為OpenAI已宣布將提出上訴，未來可能由慕尼黑高等地方法院進行審查，但亦不排除聲請向歐盟法院（CJEU）進行先決問題裁定的可能性[15]。(3966字；圖1)

[1] 本案涉及九首知名德國歌曲，包括 Christina Bach 的〈Atemlos〉、Herbert Grönemeyer 的〈Männer〉，以及Reinhard Mey的〈Über den Wolken〉等作品。

[2] Landmark ruling of the Munich Regional Court (GEMA v OpenAI) on copyright and AI training. Bird & Bird,2025/11/14

[3] Gema v. OpenAI – Decision of the Munich Regional Court. Media Laws, 202512/10

[4] Supra note 55.

[5] Supra note 56.

[6] Supra note 55 & 56.

[7] 法院並援引有關大型語言模型中訓練資料可被取回（extractability）的學術研究，認定本案輸出結果不可能僅屬巧合。

[8] Directive 2001/29/EC

[9] Supra note 56.

[10] Supra note 55.

[11] Supra note 56.

[12] Urheberrechtsgesetz – UrhG, Supra note 56.

[13] 但英國高院並未就Getty核心主張──即Stability AI是否未經授權使用數百萬張Getty攝影作品進行訓練──作出實體判斷，因Getty無法證明訓練行為發生於英國境內，以成立直接侵權主張。因此，英國法院如何評價以第三方受著作權保護內容進行AI訓練，仍有待觀察。Borne Clarke, GEMA vs. OpenAI | AI memorisation is a reproduction relevant to copyright law, and the TDM exception does not help in LLM training, Munich I Regional Court holds.

[14] Id.

[15] Id.

作者資訊：

陳家駿台灣資訊智慧財產權協會理事長

歡迎來粉絲團按讚！

--------------------------------------------------------------------------------------------------------------------------------------------