一项新法案希望揭示人工智能训练数据中的真正内容

智能真的很好说2024-04-11 17:17:22 145

众议员亚当·希夫（Adam Schiff）的法案得到了几个娱乐业团体的支持。

插图：Cath Virginia / The Verge |照片：Getty Images

一项新法案将迫使科技公司披露任何用于训练其人工智能模型的受版权保护的材料。

众议员亚当·希夫（D-CA）的生成式人工智能版权披露法案将要求任何为人工智能制作训练数据集的人向版权登记处提交有关其内容的报告。报告应包括数据集中受版权保护的材料的详细摘要，以及数据集的 URL（如果是公开的）。此要求将扩展到对数据集所做的任何更改。

公司必须在使用训练数据集的人工智能模型向公众发布之前“不迟于30天”提交报告。该法案不会追溯到现有的人工智能平台，除非在成为法律后对其训练数据集进行更改。

希夫的法案触及了自生成式人工智能兴起以来艺术家、作家和其他创作者一直在抱怨的一个问题：人工智能模型经常在未经许可的情况下在受版权保护的材料上进行训练。版权和人工智能一直很难驾驭，尤其是在人工智能模型在多大程度上改变或模仿受保护内容的问题尚未解决的情况下。艺术家和作家已经通过诉讼来维护自己的权利。

人工智能模型的开发人员声称他们的模型是根据公开可用的数据进行训练的，但大量的信息意味着他们不知道哪些数据是受版权保护的。公司表示，任何受版权保护的材料都属于合理使用。与此同时，这些公司中的许多公司已经开始为一些客户提供法律保障，如果他们发现自己因侵犯版权而被起诉。

希夫的法案得到了美国作家协会（WGA）、美国唱片业协会（RIAA）、美国导演协会（DGA）、美国演员工会-美国电视和广播艺术家联合会（SAG-AFTRA）和作家协会等行业团体的支持。值得注意的是，美国电影协会（MPA）没有出现在支持者名单中，该协会通常支持保护受版权保护的作品免受盗版的举措。（披露：The Verge的编辑人员与美国东部作家协会（Writers Guild of America， East）建立了工会关系。

其他团体则试图提高训练数据集的透明度。Fair Trained 组织希望为 AI 模型添加标签，如果他们证明他们要求允许使用受版权保护的数据。

原文标题：A new bill wants to reveal what’s really inside AI training data

转载此文是出于传递更多信息目的。若来源标注错误或侵犯了您的合法权益，请与本站联系，我们将及时更正、删除、谢谢。
https://www.414w.com/read/219981.html

随机主题

两百元蓝牙降噪耳机谁更值得买？所以你人生的第一台外设应该是？不服不行! 华为的科技自立真的太绝了一国有行官宣，聘任新行长舒淇宝格丽晚宴洞洞鞋穿出高级感曝森林北爱上汪峰损失大, 活动被取消, 阳光清纯遭质疑, 但不后悔参展机构增加2419家! 几组数据看深圳文博会蓬勃生机洛杉矶这个论坛上, 上海市长向加州企业发出邀请三年内迎来第三轮研发收获期裕太微如何行稳致远内蒙古乌海：“五个结合”做细做实常态化联系退役军人工作中俄多个大动作落地，美债连续三个月缩减，美联储发现绷不住了虎牢关时期, 谁能抵挡吕布100招? 仅2人可以, 关羽张飞赵云都不行她是尼姑, 生了一个儿子, 儿子当了主席你不知道的冷知识——荷兰篇 cos 从零开始的异世界生活爱蜜莉雅卖四千的华为nova11pro是大冤种，一千多就是真香机船东首次在中国订船! 这家船厂再获2艘新订单鲁能飞翼或成夏窗离队第一人, 本赛季外租表现不俗, 曾是亚冠主力肯辛顿宫拐弯抹角更新凯特最新健康状况, 透露其已在带病工作与预售价一样 2.4T乘用炮、商用炮上市 12.58万元起售闻名全国的计划生育先进县，如今却成老人县，花甲之年还在工作

最新回复(0)