OpenAI 意外删除了《纽约时报》版权诉讼案中的潜在证据

OpenAI 可能意外删除了与其正在进行的相关的重要数据带来的纽约时报

最先报道者TechCrunch, 顾问时代及其共同原告每日新闻发送了一个向负责此案的法官详细说明了“专家和律师整整一周的工作”如何“无可挽回地损失”。 OpenAI 向原告提供了两台专用虚拟机,用于研究涉嫌侵犯版权的案例。信中称,11 月 14 日,“OpenAI 工程师删除了其中一台专用虚拟机上存储的程序和搜索结果数据。”

时代指控 OpenAI 以及微软在其 Bing AI 聊天机器人中使用 OpenAI 的模型,通过在付费和未经授权的内容上训练其模型来侵犯版权。该诉讼详细说明了“近乎逐字记录“复制 ChatGPT 的回复。OpenAI 驳斥了这一说法,称他们的模型是根据公开数据进行训练的,因此根据版权法合理使用。此案取决于时代能够证明 OpenAI 的模型在没有补偿或信用的情况下复制和使用其内容。

可混搭光速

OpenAI 能够恢复大部分被删除的数据,但作品的“文件夹结构和文件名”无法恢复,导致数据无法使用。现在,原告律师必须从头开始收集证据。在信中,律师确认“没有理由相信[删除]是故意的”,但也指出“OpenAI 处于搜索自己数据集的最佳位置”。这家人工智能公司避免分享有关其训练数据的任何细节。

其他类似已针对 OpenAI 提起诉讼。但一个来自 Raw Story 和 AlterNet 最近被解雇因为原告无法证明足够的损害来支持他们的主张。与此同时,OpenAI 已与多家媒体公司达成许可协议,利用他们的工作进行培训并提供带有引用的 ChatGPT 响应。近日,《广告周刊》报道OpenAI 每年向出版巨头 Dotdash Meredith 支付至少 1600 万美元以获取其内容许可。