OpenAI贏下首輪媒體起訴案,但還有六起訴訟在前方等待丨AI版權戰事
21世紀經濟報道記者肖瀟 北京報道
OpenAI在與新聞媒體的版權戰事中獲得了首輪勝利,不過是暫時的。
11月7日,美國紐約南區地方法院駁回了新聞媒體 Alternet 和 Raw Story 起訴 OpenAI 的案件。兩家媒體在今年2月聯合起訴,指控OpenAI在給大模型投喂訓練數據時刪除了版權信息,而且ChatGPT可以在不說明來源的情況下,根據版權內容輸出回覆。
兩家媒體因此對每起侵權行爲索賠至少2500美元,並尋求禁令救濟,阻止OpenAI繼續使用它們的版權作品。此外,它們還要求OpenAI 從訓練數據集中刪除所有受版權保護的材料。
上週四,紐約南區地方法院駁回了Alternet 和 Raw Story 提起的訴訟。法官最終認爲,原告沒有證明它們因版權信息被刪除而遭受了哪些具體傷害,不滿足提起訴訟的條件。
需要注意的是,受訪專家告訴21記者,即使這次是OpenAI的勝利,也只是一次有限的勝利,因爲該案並沒有迴應AI領域最白熱化的爭議——公司使用版權素材訓練AI,到底需不需要獲得版權方授權?對於這一問題,中美兩國的法院目前都還沒有給出答案。
儘管訴訟被駁回,但Raw Story 和 AlterNet 並未打算放棄。原告律師在接受媒體採訪時表示,他們有信心通過重新修訂起訴書,繼續維權。判決書也透露出法官願意考慮重新提起訴訟的信號。
核心爭議:版權管理信息
與其他訴訟不同的是,原告Raw Story 和 AlterNet並沒有直接主張OpenAI侵犯了版權,而是指控其違反了版權管理信息(CMI)的相關條款。
兩家媒體在訴訟書中寫道,OpenAI 擅自抓取數千篇新聞報道,並在輸入大模型訓練時刪除了版權管理信息(CMI)——包括作者姓名、作品使用條款和條件以及作品標題。它們還指出ChatGPT在生成回答時,通常也不提供作品的作者、標題和版權信息。
根據美國《數字千年版權法》第1202(b) 條款,未經授權去除或更改版權管理信息(CMI) 的行爲被視爲版權侵犯。
另一邊的OpenAI 則辯稱,媒體出版商沒有法律資格提出訴訟:一是因爲它們沒有證據證明ChatGPT 接受了它們的作品訓練,二是沒有證明因版權管理信息被刪除,而遭受了哪些具體傷害。
法官最終認同了OpenAI的觀點,並在判決書中補充道:“當用戶向 ChatGPT 輸入問題時,ChatGPT 會將其數據庫中的相關信息合成回覆。考慮到數據庫的信息量,ChatGPT 輸出原告文章內容的可能性似乎很小。”
上海大邦律師事務所高級合夥人、知識產權律師遊雲庭向21記者分析,原告只證明了自己的作品被包含在OpenAI的訓練數據集中,但沒有證明OpenAI是不是用了這些素材訓練。他表示,在舉證環節,原告一般會向AI定向提問,根據輸出逆推輸入素材。比如《權利的遊戲》作者在起訴OpenAI時,讓ChatGPT爲《權力的遊戲》續寫大綱;有些藝術家會使用特定輸入詞,檢測AI生成的圖片是否包含自己作品的一些特徵元素。
不過,舉證始終是AI版權糾紛的一大難題。“大模型是一個黑盒,怎麼才能證明它到底有沒有拿你的素材?去做了哪些訓練?拿我國的民事訴訟法來說,也缺少證據開示等幫助弱勢當事方的制度。”此前天元律師事務所合夥人李昀鍇向21記者表示。
李昀鍇說,在技術黑盒的情況下,能讓AI公司責任更輕、更穩妥的方案其實就是“閉口不談”——只要AI公司不說,版權方就證明不了。此類困擾恐怕會一直存在。
值得一提的是,雖然本案法官認爲原告不滿足起訴條件,並且拒絕了重新起訴的請求,但判決書指出在特定情況下可以重新提起起訴。法官認爲,本案利益攸關的地方不是版權信息被刪除,而是“被告使用了原告的作品開發ChatGPT,卻沒有向原告支付賠償金” ——也就是OpenAI需不需要爲訓練數據的版權付費
這又回到了版權戰場的老敘事中。
未解之謎:合理使用問題
“即使這一次是OpenAI的勝利,也只是一次有限的勝利。本案判決並沒有迴應目前AI領域的核心爭議。” 遊雲庭說,目前業內的目光焦點,也正是AI公司在使用版權素材進行訓練的時候,到底需不需要獲得授權。
公開資料裡,OpenAI還有至少六起正在進行時態的版權官司:去年12月《紐約時報》打響了媒體版權戰場的第一槍,聲稱ChatGPT可以逐字輸出報道內容,《每日新聞》、非營利新聞機構調查報道中心、The Intercept三家媒體分別對OpenAI提起了同類訴訟;媒體之外,還有Youtube博主Millette指控OpenAI擅自轉錄了數百萬個YouTube 視頻來訓練大模型,超過100人蔘與了集體訴訟;三名小說作者分別對 OpenAI 提起侵權訴訟,現已合併爲針對OpenAI 和微軟的一項訴訟。
以上訴訟的一個共同點是,都指控OpenAI擅自利用版權作品訓練AI,侵犯了版權權利人的利益。
遊雲庭指出,對於這一爭議,目前中美兩國的法院都還沒給出答案,但日本已經把其列爲了“合理使用”行爲。
日本《著作權法》允許AI在未經授權的情況下,利用包括報刊文章在內的版權作品,作爲AI學習的材料。去年6月,日本文部科學(相當於國內教育部)大臣永岡桂子在當地會議上再次迴應,稱“在日本,無論使用何種方法,無論是出於營利或非營利目的,無論用於複製以外的行爲,還是從非法網站獲得的內容,都可以使用信息分析作品。”
廣東財經大學法學院教授姚志偉此前告訴21記者,合理使用的理論在日本著作權法和美國的司法案件中有一定體現,但在中國法中沒有立法依據,能否在司法上得到認可具有很強的不確定性。
除了版權官司,OpenAI近期負面動態頻頻,包括內部員工爆料下一代模型不及預期;人事變動頻繁,安全團隊高管接連離職。據外媒獲得的財務文件,OpenAI 8月份的月收入達到3億美元,自2023年初以來增長了1700%,預計今年的年銷售額約爲37億美元。但有金融專業人士分析,在支付運營服務等其他成本費用後,公司預計今年將虧損約50億美元。