OpenAI:要想训练人工智能而不免费使用受版权保护的作品是“不可能”的

2024-01-09
AGI最新资讯

OpenAI公司向英国议会提出请求,希望允许其免费使用受版权保护的作品。

OpenAI向一个委员会表示,要训练其人工智能模型而不使用这类数据是“不可能”的。

OpenAI称,因为版权如今几乎涵盖了所有类型的人类表达方式——包括博客文章、照片、论坛帖子、软件代码片段以及政府文件——不使用受版权保护的材料就不可能训练当今的领先AI模型。

OpenAI向众议院通信和数字委员会提交的证据中说:“如果训练数据仅限于公共领域的书籍和一百多年前的绘画,可能会产生一个有趣的实验,但不会提供满足现今公民需求的AI系统。”

自2022年11月推出以来,OpenAI的ChatGPT AI工具因其能够理解和生成类似人类的响应而变得流行。这款AI模型在短时间内展示了重大成就,如总结研究报告、回答逻辑问题,甚至通过商学院和医学院入学考试。

然而,自从ChatGPT推出以来,《纽约时报》等多家公司以及像Sarah Silverman、Margaret Atwood、John Grisham和George RR Martin这样的名人和作者,都因为OpenAI在未经许可的情况下使用他们的文本来训练AI系统而起诉该公司。

《纽约时报》声称,其“数百万”篇新闻文章被用于训练ChatGPT,这是对该报知识产权的“大规模版权侵犯、商业开发和非法占用”,而且AI工具现在已经成为与报纸竞争的信息来源。

OpenAI与此同时表示,它正在尝试与出版商建立新的合作关系,与美联社和媒体巨头Axel Springer达成协议,以获得他们的内容。

OpenAI上个月的一位发言人表示:“我们尊重内容创作者和所有者的权利,并致力于与他们合作,确保他们从AI技术和新的收入模式中受益。”

在新的文件中,OpenAI表示它遵守版权法,并补充说,它相信“从法律上讲,版权法不禁止训练”。