微比恩 > 信息聚合 > Meta 承认使用盗版书籍来训练 AI,并拒绝赔偿作家

Meta 承认使用盗版书籍来训练 AI,并拒绝赔偿作家

2024-01-14 18:01:25来源: IT之家

IT之家 1 月 14 日消息,大型语言模型(LLM)技术近年来取得了巨大进步,但其背后却隐藏着版权纠纷的阴云。科技巨头们利用海量文本数据训练 LLM,其中难免会涉及到受版权保护的作品,招致作者和媒体组织的强烈抗议。图源 Pexels近日,Meta(前身为 Facebook)就因使用包含大量盗版书籍的“Books3”数据集训练其 LLAM 1 和 LLAM 2 模型而面临包括喜剧演员 Sarah Silverman 和作家 Richard Kadrey 在内的一众作者的集体诉讼。Meta 虽承认使用了 Books3 数据集,却拒绝向作者支付适当的补偿。Books3 是一个包含 19.5 万本图书、总容量近 37GB 的文本数据集,由 AI 研究者 Shawn Presser 于 2020 年创建,旨在为改进机器学习算法提供更好的数据源。Meta 也将其用于训练自己的 LLAM 模型,然而 Books3 中包含大量从盗版网站 Bi

关注公众号
标签: Meta