据报道,据外电报道,OpenAI刚刚宣布近期进行了小规模预演一个名为语音引擎的新工具的诞生。
这是一种声音克隆技术,可以通过分析15秒的音频样本来模仿任何说话者。该公司表示,它可以生成自然的语音和情感丰富且真实的声音。
该模型还可以执行语音克隆。它的工作原理是这样的:人类说话者通过手机或计算机麦克风录制15秒的语音片段,OpenAI的语音引擎会生成与原始说话者非常相似的自然语音,并且可以在以后使用,大声说出人类用户输入的任何文本。
该技术基于本公司预先存在的文本转语音API。自2022年以来,这项工作一直在进行中。OpenAI已经在使用该工具集的一个版本来支持当前文本转语音API和ReadAloud功能中可用的预设语音。该公司的官方博客上有一堆样本,它们听起来非常接近真实的东西。(鞭牛士)
转载此文是出于传递更多信息目的。若来源标注错误或侵犯了您的合法权益,请与本站联系,我们将及时更正、删除、谢谢。
https://www.414w.com/read/67308.html