图源 Pexels
据IT之家了解,“图灵测试”由计算机科学家艾伦?图灵在1950年提出,又被称为“模仿游戏”。测试的标准是机器能否像人类一样进行对话,让对方误以为其是真人。
加州大学圣地亚哥分校的研究人员招募了500名参与者,让他们与四位“对话者”进行五分钟的交流,这四位“对话者”分别是真人、上世纪60年代的初代聊天机器人ELIZA、以及驱动聊天机器人ChatGPT的GPT-3.5和GPT-4。参与者在对话结束后需判断对方是人还是机器。
这项测试的结果发表于预印网站arXiv上,结果显示,有54%的参与者将GPT-4误认为真人。相比之下,预先设定好回复的ELIZA只有22%的人将其认作真人,GPT-3.5则为50%,而人类对话者被正确辨认的比例则为67%。
研究人员指出,图灵测试过于简单,对话的风格和情感因素在测试中扮演着比传统智能认知更重要的角色。
电气和电子工程师协会(IEEE)的人工智能研究员内尔?沃森(NellWatson)表示,单纯的智力并不能代表一切,真正重要的是足够智能地理解情境、他人的技能并具备同理心将这些要素结合起来。能力仅仅是AI价值的一部分,理解人类的价值观、偏好和界限也同样重要,正是这些品质才能让AI成为我们生活中忠诚可靠的管家。
沃森还提到,这项研究对未来的人机交互提出了挑战,人们将会对互动对象的真实性愈发疑虑,尤其是在涉及敏感话题时。同时,这项研究也凸显了GPT时代人工智能的巨大进步。
转载此文是出于传递更多信息目的。若来源标注错误或侵犯了您的合法权益,请与本站联系,我们将及时更正、删除、谢谢。
https://www.414w.com/read/751644.html