【LEYU科技动静】近日,关在人工智能的争议再度加重,Meta被指控使用盗版网站的内容来练习其年夜型语言模子(LLM)Llama。外媒称,这起案件创始了科技公司因利用盗版内容练习AI而面对版权诉讼的先河。

2023年,Meta因涉嫌于LLM模子Llama的练习历程中利用盗版内容而受到小说家理查德·卡德雷及克里斯托弗·金登的告状。案件名为“Kadrey等人诉Meta平台案”,原告声称Meta未经授权利用了受版权掩护的内容。
Meta曾经向法院提交颠末编纂的信息文件,但加利福尼亚州北区联邦地域法院的法官文斯·查布拉要求公然原始文件。这些文件展示了Meta员工关在Meta AI及Llama的扳谈记载,此中一名工程师提到于公司条记本上下载盗版内容感应不当,这证明了Meta确凿利用了盗版内容来练习AI。此外,还有有对于话表示Meta首席履行官马克·扎克伯格(Mark Zuckerberg)默认了利用盗版质料的举动。
证据注解,Meta从LibGen这一盗版册本、杂志及学术论文的年夜型资源库中获取了内容。LibGen自2008年于俄罗斯创立以来,已经屡次卷入版权诉讼,但实在际运营者身份不明。据报导,Meta还有从其他不法资源库中获取了内容用在AI练习。
Meta则辩称,其利用大众质料的举动切合“合理利用”法令原则,该原则答应于特定环境下未经许可以使用受版权掩护的内容,但需详细环境详细阐发。Meta还有暗示,其利用文本仅是为了举行语言统计建模并天生原始表达。

值患上留意的是,这其实不是年夜型科技公司初次面对利用受版权掩护内容练习AI模子的指控。去年的一项查询拜访发明,苹果创立的OpenELM模子包罗了来自跨越17万个YouTube视频的字幕。虽然最初激发了对于苹果利用受版权掩护内容练习Apple Intelligence的担心,但该公司厥后澄清说,OpenELM是一个用在研究目的的开源模子,其数据库并未用在撑持Apple Intelligence。
苹果暗示,其于iOS及macOS上提供的AI功效是于“许可数据”上练习的,包括为加强特定功效而选择的数据以和由收集爬虫网络的公然可用数据。值患上一提的是,很多年夜型出书商,如《纽约时报》及《年夜西洋月刊》,已经选择不与Apple Intelligence练习同享其内容。
版权所有,未经许可不患上转载
-leyu.com