4月18日,2024中国生成式AI大会上李未可科技正式发布为眼镜等未来终端定向优化等自研WAKE-AI多模态大模型,具备文本生成、语言理解、图像识别及视频生成等多模态交互能力。
该大模型围绕GPS轨迹+视觉+语音打造新一代LLM-Based的自然交互,同时多模态问答技术的加持,能实现所见即所问、所问即所得的精准服务。此外,融合了人类意图理解、长期记忆机制、情感大模型及TTS克隆,可以为用户提供超拟人的情感陪伴服务。
为保证实时交互场景的智能性及响应速度,WAKE-AI使用MOE架构,FlashAttention混合精度训练、知识蒸馏等技术大幅降低算力需求跟计算时间。该大模型针对眼镜端用户的使用方式、场景等进行了优化。在语音返回速度上能做到<500ms以内,语音唤醒的准确度>90%,ASR字错率低于2%。同时为用户提供在室外多个场景,如户外运动、文化旅行、日程管理及实时翻译的多模态AI服务。
据悉,李未可将于近期正式发布搭载WAKE-AI能力的新终端,从室外场景切入为用户提供更智能、更全面的AI+服务。
会上,李未可科技合伙人&AI负责人古鉴表示WAKE-AI将逐步开放平台能力,便于更多企业及开发者调用WAKE-AI能力,共建AI+硬件生态。
转载此文是出于传递更多信息目的。若来源标注错误或侵犯了您的合法权益,请与本站联系,我们将及时更正、删除、谢谢。
https://www.414w.com/read/269956.html