市場動態 生活 網路 軟體

多名作家指控NVIDIA訓練人工智慧模型涉及影響其著作權
原因在於使用涉及盜版書籍資料內容

在紐約時報、諸多作家指控OpenAI及微軟利用其報導文章內容訓練人工智慧模型之後,相關報導指稱不少作家也發起集體訴訟,指控NVIDIA以其著作內容訓練其端對端的雲端原生框架NeMo平台涵蓋的大型自然語言模型Megatron。

NVIDIA, 多名作家指控NVIDIA訓練人工智慧模型涉及影響其著作權<br><span style='color:#848482;font-size:16px;'>原因在於使用涉及盜版書籍資料內容</span>, mashdigi-科技、新品、趣聞、趨勢

訴訟中指稱,NVIDIA在Megatron的訓練過程使用名為The Pile的資料集,而此資料集包含Book3的資料內容,但Book3資料內容卻包含19萬6640萬本盜版書籍的Bibliotek資料,因此涉及使用作家創作內容。

因此,包含Abdi Nazemian、Brian Keene與Stewart O’Nan在內作家認為NVIDIA在實質上影響其著作權,除了要求NVIDIA撤除、銷毀所有使用Book3資料內容項目,並且要求對其造成影響提供賠償。

不過,NVIDIA方面表示建立NeMo平台時的流程符合著作權法相關規定,同時也強調尊重內容創作者權益。

至於原本透過機器學習模型與資料集共享平台Hugging Face提供使用的Book3資料內容,目前已經被Hugging Face註記涉及影響著作權內容,因此目前已經無法提供存取使用。

而若NVIDIA因為使用Book3資料內容構成影響著作權,將有可能必須對受影響的作家提供賠償,同時也可能必須重新建立NeMo平台涉及影響部分。

楊又肇 (Mash Yang)
mashdigi.com網站創辦人兼主筆,同時也是科技新聞業流浪漢。

發表迴響