AI训练数据的版权保护：公地的悲剧还是合作的繁荣？-国际在线

　　机器之心报道,　　机器之心编辑部,　　近日，普林斯顿大学、哥伦比亚大学、哈佛大学和宾夕法尼亚大学共同推出了一项关于生成式AI版权保护的新方案，题为《An Economic Solution to Copyright Challenges of Generative AI》。,　　这种能力的迅速增长引发了关于大模型训练数据作者权利的法律和道德界限的重要问题，特别是在版权侵犯方面的争议。,　　 版权保护一直以来都是各国法律中不可或缺的一部分。保护创作者的权益，可以更有利于调动创作者的积极性，使得文化事业更加繁华。版权保护为创作者不止提供了精神支持，也同时提供了物质支持（利益分配），这也是为创作者进一步提供了再创作的物质基础和精神动力。,　　因此，目前有几家AI公司因涉嫌生产侵犯版权的内容而卷入法律诉讼。比如说《纽约时报》起诉 Chatgpt的开发者 OpenAI [1]，控诉后者将数百万篇《纽约时报》的文章被用于训练智能聊天机器人（例如ChatGPT ）。这些机器人现在作为新闻消息源与《纽约时报》展开竞争。,　　起诉书中，《纽约时报》提及到一个例子 – 微软的「 以必应浏览（Browse With Bing）」中的功能，能够几乎一字不差地重现《纽约时报》旗下网站「The Wirecutter」的内容，但完全没有为提供相关的链接进行引用。这个例子充分体现了AI 非法使用版权内容。,　　目前，针对OpenAI的类似诉讼案件正在不断增加， 例如近来GPT-4o内置声音模仿「寡姐」一案 [2]。但由于对于AI 非常使用版权内容难以界定，诉讼案件尚在激烈讨论中。