IT之家10月11日消息,科技媒体Appleinsider昨日(10月10日)发布博文,报道称两名学术作者已对苹果公司提起集体诉讼,指控其在训练“苹果智能”(AppleIntelligence)AI系统时,使用了包含他们盗版作品的“Books3”数据库。
苏珊娜・马丁内斯-康德(SusanaMartinez-Conde)和斯蒂芬・麦克尼克(StephenMacknik)两名来自纽约州立大学健康科学大学的学术作者已对苹果公司发起集体诉讼。
两位学者指控苹果在未获授权的情况下,利用包含其两部著作《幻觉冠军》(ChampionsofIllusion)与《思维的诡计》(SleightsofMind)盗版内容的数据库,来训练“苹果智能”AI系统,此举侵犯了他们的版权。
该诉讼的核心证据链指向一个名为“Books3”的影子图书馆。具体来说,苹果公司曾在2024年4月承认,其在训练OpenELM语言模型时使用了名为“ThePile”的数据集,而“ThePile”当时恰好就包含了“Books3”数据库。
该数据库收录了超过18万本书籍的全文,一份公开文件显示,原告的两部作品赫然在列。尽管“Books3”已于2023年10月因版权争议被移除,但原告认为苹果已经完成了对其作品的复制和训练。
然而,该案也面临多重法律挑战。首先,苹果并未公布其用于训练的详细文档列表,因此证明苹果确实处理了涉案的具体书籍存在困难。其次,美国法院系统在以往的判例中(如Midjourney案),倾向于认为要求AI开发者对海量训练数据进行逐一授权与赔偿的难度过高。
在另一起Anthropic公司的案件中,法官虽认定其使用书籍训练模型属于“合理使用”,但因其将书籍存储于中央图书馆而构成侵权,这为本案提供了复杂的参考。
原告的诉求依然明确:要求进行陪-审团审判、获得经济赔偿,并永久禁止苹果使用其受版权保护的作品。
根据美国版权法,如果故意侵权行为成立,苹果可能需要为每部侵权作品支付最高15万美元(IT之家注:现汇率约合107万元人民币)的赔偿。