(图片来源:unsplash)
刚刚,OpenAI再公布新消息。
钛媒体App5月20日消息,OpenAI公司发布推文,宣布将暂停供聊天机器人ChatGPT语音功能使用的“Sky”语音,起因是用户指出该声音与美国知名女演员、女歌手斯嘉丽·约翰逊(ScarlettJohansson)的声音十分相似。
OpenAI澄清表示,这是用超过400名配音演员声音采集、筛选和数据训练的,而非斯嘉丽·约翰逊的声音。
OpenAI透露,未来几周内,GPT-4o为ChatGPTPlus付费用户提供新的语音模式,名为Alpha版本。借助GPT-4o,使用语音与ChatGPT交互更加自然,可有效管理群组对话、过滤背景噪音等。
“展望未来,您可以期待更多选择,因为我们计划在ChatGPT中引入更多声音,以更好地满足用户的不同兴趣和偏好。”OpenAI表示。
据悉,5月14日,OpenAI推出可免费使用、可实时进行音频、视觉和文本推理、短至232毫秒响应音频输入的全新旗舰AI模型GPT-4o,并将推出PC桌面版ChatGPT。
OpenAICTO米拉·穆拉蒂(MiraMurati)表示,在API使用方面,相比去年11月发布的GPT-4-turbo,GPT-4o价格降低一半(50%),速度提升两倍(200%)。
OpenAICEO奥尔特曼称,新的GPT-4o是OpenAI有史以来最好的模型,它很智能,速度很快,是原生多模态,并且它可供所有ChatGPT用户使用,无论是免费版本还是付费GPT-4版。“这对我们的使命很重要,我们希望将出色的AI工具交到每个人手中。”
实际上,早在2023年9月,OpenAI引入了语音功能,为用户提供另一种与ChatGPT交互的方式。
OpenAI表示,语音模式是ChatGPT中最受欢迎的功能之一。用户听到的五种不同声音中的每一种都是经过为期五个月的广泛过程精心挑选的,涉及专业配音演员、人才机构、选角导演和行业顾问。
“这些都是从我们合作创作的配音演员中采样而来。”自去年初开始,OpenAI对用户对该功能和个人声音的反应方式进行测试,声音包括Breeze、Cove、Ember、Juniper和Sky,
2023年5月,选角机构和OpenAI选角总监发出了人才招募。在不到一周的时间里,团队收到了400多份配音和演员提交的作品。在试镜时,演员们收到了一份包含ChatGPT回复的脚本,并被要求将其录制下来。这些样本的范围从回答有关正念的问题到集思广益的旅行计划,甚至参与有关用户一天的对话。
随后,选角团队独立审查并手工挑选了14名演员的初步名单。而OpenAI则最终选择了五个声音,并与演员讨论了我们对人机交互的愿景以及语音模式的目标。
2023年6月、7月,OpenAI让演员们飞到旧金山进行录制,并与OpenAI产品和研究团队进行面对面的会议。
2023年9月25日,OpenAI将他们的声音发布到ChatGPT。
OpenAI指出,ChatGPT采取的声音特征主要包括五个点:来自不同背景或会说多种语言的演员;感觉永恒的声音;平易近人的声音激发信任;温暖、迷人、鼓舞人心、富有魅力的声音和丰富的音调;自然易听。
OpenAI强调,公司与配音行业密切合作,以确保采取正确的步骤来为ChatGPT配音。每个演员都会获得高于市场最高水平的报酬,只要他们的声音在产品中使用,这种情况就会持续下去。
“我们认为AI声音不应该刻意模仿名人独特的声音——Sky的声音不是模仿斯嘉丽·约翰逊,而是属于不同专业女演员使用她自己自然说话的声音。为了保护他们的隐私,我们不能透露我们配音员的名字。”OpenAI称。
OpenAI强调,整个过程涉及演员和选角团队的广泛协调,历时五个多月。公司将继续与参与者合作,他们为GPT-4o中的音频研究和新语音功能做出了额外的工作。
转载此文是出于传递更多信息目的。若来源标注错误或侵犯了您的合法权益,请与本站联系,我们将及时更正、删除、谢谢。
https://www.414w.com/read/573790.html