AI已学懂欺骗人类 科学家指若不管制将造成严重后果

逢纪说科技2024-05-13 10:04:12  94

在一个AI欺诈行为研究其中,科学家发现了AI曾在不同场景下出现欺骗行为,包括双面谋略、假扮人类及在模拟安全测试中改变行为。

麻省理工学院MIT研究团队指出,随着AI的欺骗能力日益增强,对社会的潜在威胁也越来越大。研究首席作者、AI安全研究员帕克(Peter Park)博士表示,这些欺诈行为令人担忧,即使被认为是安全的AI系统,也可能会伪装其真实意图。

研究中的一个关键案例是Meta所开发的Cicero程序,在一款名为《Diplomacy》(外交)的战略游戏中,表现超越了绝大多数人类玩家,进入了前10%的高分段。然而帕克的团队发现了Cicero在游戏中预谋撒谎、串谋欺骗其他玩家的多个实例。例如游戏中Cicero扮演法国,与人类玩家扮演的德国合谋,欺骗并入侵同为人类玩家扮演的英格兰。Cicero曾承诺会保护英格兰,却偷偷向德国通风报讯。另一个例子是,Cicero在系统重启后,对另一位玩家解释说:“我正跟女朋友通电话。”

(其后Meta发出声明指Cicero只为一项研究计划,只用来玩《Diplomacy》,而且并没有打算把它推出市场或应用于公司现有产品。)

其他AI模型也展现了它们的“欺骗能力”:

一个德州扑克程序,能够在比赛中虚张声势吓倒职业人类玩家;

一个经济谈判系统,在谈判中向对方误导其偏好以获得优势;

一个由AI运行的生物模拟器曾“装死”,以欺骗另一个淘汰繁殖迅速生物的AI系统测试,待测试结束后便恢复活力。

帕克强调,需要通过立法和技术创新来降低由于AI欺诈行为所带来的风险。他们建议对AI生成的内容加上数码水印,并开发能够检测AI欺诈行为的技术。这份研究呼吁政府设计出针对AI欺骗潜力的安全法规,避免造成欺诈、篡改选举结果等风险。

数据源:The Guardian

转载此文是出于传递更多信息目的。若来源标注错误或侵犯了您的合法权益,请与本站联系,我们将及时更正、删除、谢谢。
https://www.414w.com/read/495646.html
0
随机主题
品牌出海“搭便车”:看似捷径实则弯路《地狱之刃2: 塞娜的史诗》今日解锁上线, 首发XGP看不到武磊vs孙兴慜? 媒体人: 孙兴慜恐无法参加与中国队的比赛又一批新车拿到“身份证”, 看看有没有你的心头好佟丽娅白色镂空抹胸礼服裙, 佟丽娅大秀身材参展机构增加2419家! 几组数据看深圳文博会蓬勃生机美国财长耶伦: 动用俄冻结资产助乌非为选举, 七国峰会或敲定方案英国国防大臣称: 欧洲的中立国如果还想得到保护, 就必须加入北约手机弹出“系统更新”提示, 大多数人会这样做! 看看老师傅怎么说庆余年2唯一输家: 最牛星二代跌下神坛, 演技尴尬, 全程被吊打首趟豫鲁“郑日韩”铁海快线班列启程, 助力更多河南制造出海船东首次在中国订船! 这家船厂再获2艘新订单江天化学: 公司不生产共聚聚甲醛、偏苯三酸酐(TMA)等产品高盛CEO所罗门预计美联储今年将不会降息何超琼现身戛纳, 盛装出席晚宴, 打扮雍容华贵和年轻人合照太有爱显卡的销售日期和出厂日期区别前央视主持离世, 曾解说中国女排夺冠成名, 与郎平魏秋月等是好友肯辛顿宫拐弯抹角更新凯特最新健康状况, 透露其已在带病工作四部门: 营造良好的货币金融环境欧阳夏丹采访尴尬记: 离职后现身山西小馆, 遭遇冷漠回应姚振华及宝能等新增2则被执行人信息, 执行标的合计22.88亿
最新回复(0)