让奥黛丽·赫本唱《上春山》, 通义App推出照片唱歌功能

都市快报橙柿互动2024-04-25 19:29:21 83

把一段音频、一张照片输入AI模型，就能让图中人物开口唱歌说话，让奥黛丽·赫本唱《上春山》、陶俑仕女说英文RAP、爱因斯坦说中文段子。不久前，这款名为EMO的模型因为阿里通义实验室的一篇论文火遍海内外。今天，EMO正式上线通义App，所有用户都可以免费使用。

打开通义App，进入“全民舞台”频道，就可以来到EMO产品页面“全民唱演”。在歌曲、热梗、表情包中任选一款模板，上传肖像照片，EMO就可以合成视频。

通义App首批上线了80多个EMO模板，包括热门歌曲《上春山》《野狼disco》等，网络热梗“钵钵鸡”“回手掏”等。目前，通义App暂不开放用户自定义音频，用户只能选择App预置的音频来生成视频。

EMO是通义实验室研发的AI模型，其背后的肖像说话（TalkingHead）技术是当前大热的AIGC领域。EMO之前的TalkingHead技术都需针对人脸、人头或者身体部分做3D建模，通义实验室在业界率先提出了弱控制设计，不需建模就可以驱动肖像开口说话，不仅降低视频生成成本，还大幅提升了视频生成质量。

EMO学习并编码了人类表达情绪的能力，能将音频内容和人物的表情、嘴型匹配，还能把音频的语气特征和情绪色彩反映到人物微表情上。

2月底，通义实验室公布相关论文，EMO随之成为继SORA之后最受关注的AI模型之一。未来，EMO技术有望应用于数字人、数字教育、影视制作、虚拟陪伴、电商直播等场景。

通义App近期爆款频出，现象级应用“全民舞王”曾在社交平台掀起“兵马俑跳科目三”“金毛跳舞”的热潮，全民舞王背后的模型AnimateAnyone也出自通义实验室。近期，通义APP还陆续推出了超长文档解析、AI编码助手、AI会议助手等免费实用功能。通义大模型正在成为越来越多用户的超级AI助手。

今天朋友圈很多人在斗舞？上传一张照片，爱因斯坦都能跳“科目三”的大模型来了

转载此文是出于传递更多信息目的。若来源标注错误或侵犯了您的合法权益，请与本站联系，我们将及时更正、删除、谢谢。
https://www.414w.com/read/331648.html

随机主题

口碑公认的三款手机, 入手仅千元价位看不到武磊vs孙兴慜? 媒体人: 孙兴慜恐无法参加与中国队的比赛福特EVOS命名为蒙迪欧运动版, 官图发布, 搭载2.0T混动系统莱希坠机原因找到了？或离不开这一国，细节罕见公布，局势恐变天 6.18电视超详细选购指南快来抄作业！山东荣成: 学习海洋生物多样性知识 6位在中国发展的日本女星，很受欢迎，有人大放异彩。“俄罗斯之心”文化艺术节6月将在北京举办彭于晏自述拍戏真实经历！高铁为什么能转弯? 看完一清二楚 “取卵术”、胚胎培养……陕西新增16项辅助生殖类医疗价格项目 15年攻关实现全人工繁殖探秘“水中大熊猫”川陕哲罗鲑亚当·兰伯特的中国改造: 告别高跟鞋, 美甲, 欢迎甜心版张震岳!以案说法: 员工不服从合理调岗被辞退用人单位无需赔偿 “我来雄安了! ”全国35家80余位媒体代表走进雄安不是首钢, 郭艾伦官宣下家, 李晓旭跟腱断裂, 辽篮奖金排名曝光武则天已经打算还政李唐, 为何张柬之等人还要发动神龙政变?江天化学: 公司不生产共聚聚甲醛、偏苯三酸酐(TMA)等产品开国大将陈赓有5个子女, 他们如今过得如何? 三个儿子是少将《庆余年2》范闲的底牌上线, 原著中最强卧底!《夜族崛起》暗黑来袭——是德古拉也是伐木工

最新回复(0)