研究称 GPT-4 通过了图灵测试, 54% 的人将其误认为真人

IT之家2024-06-17 14:51:16 61

图源 Pexels

据IT之家了解，“图灵测试”由计算机科学家艾伦?图灵在1950年提出，又被称为“模仿游戏”。测试的标准是机器能否像人类一样进行对话，让对方误以为其是真人。

加州大学圣地亚哥分校的研究人员招募了500名参与者，让他们与四位“对话者”进行五分钟的交流，这四位“对话者”分别是真人、上世纪60年代的初代聊天机器人ELIZA、以及驱动聊天机器人ChatGPT的GPT-3.5和GPT-4。参与者在对话结束后需判断对方是人还是机器。

这项测试的结果发表于预印网站arXiv上，结果显示，有54%的参与者将GPT-4误认为真人。相比之下，预先设定好回复的ELIZA只有22%的人将其认作真人，GPT-3.5则为50%，而人类对话者被正确辨认的比例则为67%。

研究人员指出，图灵测试过于简单，对话的风格和情感因素在测试中扮演着比传统智能认知更重要的角色。

电气和电子工程师协会(IEEE)的人工智能研究员内尔?沃森(NellWatson)表示，单纯的智力并不能代表一切，真正重要的是足够智能地理解情境、他人的技能并具备同理心将这些要素结合起来。能力仅仅是AI价值的一部分，理解人类的价值观、偏好和界限也同样重要，正是这些品质才能让AI成为我们生活中忠诚可靠的管家。

沃森还提到，这项研究对未来的人机交互提出了挑战，人们将会对互动对象的真实性愈发疑虑，尤其是在涉及敏感话题时。同时，这项研究也凸显了GPT时代人工智能的巨大进步。

转载此文是出于传递更多信息目的。若来源标注错误或侵犯了您的合法权益，请与本站联系，我们将及时更正、删除、谢谢。
https://www.414w.com/read/751644.html

随机主题

6.18电视超详细选购指南快来抄作业！历史重演？海港外援不满被换下：当场与教练组发生“内讧”！2024年暑期档，《封神2》缺席，《哪吒2》来袭，成龙对决谢霆锋电脑硅脂的保质期能有多久？隐藏身份很辛苦吧? 小兰替大神担忧, 新一能明白他的想法 14岁离家出走16岁被逼当小三? 姐的逆袭简直是女性之光【豪华配置】15.98万瑶光C-DM，价值超越价格庆余年2唯一输家: 最牛星二代跌下神坛, 演技尴尬, 全程被吊打亚特兰大3-0打脸阿根廷队: 欧联冠军门神, 被阿超老将挤出国家队南川: 水墨和美乡村生态画米体: 两位独立董事将辞职, 马洛塔&安东内洛有望留在国米董事会查尔斯肖像画引起巨大争议, 其实身处地狱中的, 是凯特王妃梅西检阅防线的背后，敏锐的洞察让针对防守形同虚设。全球最大私营医械制造商, 裁员关厂都2024年了, 为何还有那么多人选择买手动挡? 我说这才是根本原因小白用户能不能买卡贴机宝马“最美”轿跑, 软顶敞篷+无边框车门+水晶挡把, 还有混动系统金辉控股(09993)上涨50.68%, 报3.3元/股 5年2.45亿, 多赚4100万! 联盟两大新星, 带队闯进分区决赛苦命的人! 叙利亚第一夫人又被确诊癌了, 老美称: 她等于一个师彻底卖不动了? iPhone在中国跌出前五, 华为成最大赢家

最新回复(1)

醉香石补多2024-06-18 08:18
引用1楼
图灵测试本身就是个伪命题。受测者的认知参差不齐。特别是美国，21%的文盲率，90%多的宗教徒，连总统宣誓就职还要手按圣经。他们连上帝存在都深信不疑，判断力很低下