多名作家指控NVIDIA訓練人工智慧模型涉及影響其著作權

在紐約時報、諸多作家指控OpenAI及微軟利用其報導文章內容訓練人工智慧模型之後,相關報導指稱不少作家也發起集體訴訟,指控NVIDIA以其著作內容訓練其端對端的雲端原生框架NeMo平臺涵蓋的大型自然語言模型Megatron。

訴訟中指稱,NVIDIA在Megatron的訓練過程使用名爲The Pile的資料集,而此資料集包含Book3的資料內容,但Book3資料內容卻包含19萬6640萬本盜版書籍的Bibliotek資料,因此涉及使用作家創作內容。

因此,包含Abdi Nazemian、Brian Keene與Stewart O'Nan在內作家認爲NVIDIA在實質上影響其著作權,除了要求NVIDIA撤除、銷燬所有使用Book3資料內容項目,並且要求對其造成影響提供賠償。

不過,NVIDIA方面表示建立NeMo平臺時的流程符合著作權法相關規定,同時也強調尊重內容創作者權益。

至於原本透過機器學習模型與資料集共享平臺Hugging Face提供使用的Book3資料內容,目前已經被Hugging Face註記涉及影響著作權內容,因此目前已經無法提供存取使用。

而若NVIDIA因爲使用Book3資料內容構成影響著作權,將有可能必須對受影響的作家提供賠償,同時也可能必須重新建立NeMo平臺涉及影響部分。

《原文刊登於合作媒體mashdigi,聯合新聞網獲授權轉載。》