据《麻省理工科技评论》报道,当地时间周五日发表的一篇论文显示,苹果公司的研究人员正在探索利用人工智能来检测用户何时在与iPhone等设备交谈的可能性,从而消除像“Siri”这样的触发短语的技术需求。在这项上传到Arxiv且未经同行评审的研究中,研究人员使用智能手机捕获的语音以及来自背景噪音的声学数据,训练了一个大型语言模型,以寻找“可能表明用户需要设备辅助”的模式。论文中称,该模型部分基于OpenAI的GPT-2构建,因为它相对轻量级,可以在智能手机等设备上运行。论文还描述了用于训练模型的超过129小时的数据、额外的文本数据,但没有说明训练集的录音来源。据领英个人资料,七位作者中有六位列出他们的隶属关系为苹果公司,其中三人在苹果Siri团队工作。论文最终得出的结论“令人鼓舞”,声称该模型能够比纯音频或纯文本模型做出更准确的预测,并且随着模型规模的扩大而进一步改进。
本文源自:金融界AI电报
转载此文是出于传递更多信息目的。若来源标注错误或侵犯了您的合法权益,请与本站联系,我们将及时更正、删除、谢谢。
https://www.414w.com/read/15149.html