短视频AI技术再突破! 支持在线直播! 蒙娜丽莎唱饶舌太魔性了!

小布科技展2024-04-19 12:56:55 66

微软亚洲研究院最近发表了最新论文。介绍了所谓的最新VASA-1模型。只需要一张静态肖像图片就可以让图中的人物自动说话。这项技术其实已经面世了。只不过现在还不成熟。

而VASA-1模型就弥补了这项技术方面的一些缺点。首先是在表情细节方面。这款模型能模拟是非常自然的。而且情绪表情能和唇部进行同步。最重要的是通过VASA-1模型做出来的视频基本上是没有人工痕迹的。如果不是玩梗。那么很难分辨出来。

但是这样的一个顶尖模型并不是十全十美的。首先就有一个最大的缺点就是在处理头发方面。这种非必要性的因素目前这款模型还是无法妥善处理，不过比起来其他同类型的AI来说。这款模型做出来的视频显然更加优秀。

而且这款模型能做到的地步远远不止于此。甚至它还可以生成动态短视频。比如我们只需要一张张学友的照片和张学友唱歌的音频。就可以完美的呈现出来一个完整的短视频。当然，这种行为是不可取的。毕竟还是侵犯了别人的肖像权的。

但是显然微软没有这方面的顾忌，不仅使用了别人的肖像权。还使用了意大利蒙娜丽莎的画像进行了AI生成。咱这个脑子是完全想象不到蒙娜丽莎唱饶舌到底是个什么画面。而且微软实在是太大胆了。真的不怕意大利举国吐槽你们啊！

这款模型除了支持在线生成，还支持离线。在离线模式下可以生成45FPS，分辨率为512*512的短视频。如果这还不够惊艳你的话！这款模型还支持在线直播！而还能达到40FPS。延迟才仅仅170ms。而如果想要达到这种效果的话。只需要在电脑上加装一台RTX4090显卡就可以做到了。

这种事情对于整个短视频行业，甚至直播行业都有着深远的影响。不得不说这种简单的操作如果真的应用到现实上。估计国内的那些抖音用户们真的会把这款模型给玩出来花。当然，目前这款模型距离大规模投入使用还有一段时日。不过大家也不要太不当回事了。

个人观点：前有让古人说话，今有蒙娜丽莎唱绕舌。祖宗辈的人算是让你们玩明白了。小编觉得现在科技发展的太厉害了。而且有心之人也会拿这种视频去做坏事的。也希望大家警惕，不知道各位对于这种情况如何看待呢？欢迎评论区留言讨论！！

转载此文是出于传递更多信息目的。若来源标注错误或侵犯了您的合法权益，请与本站联系，我们将及时更正、删除、谢谢。
https://www.414w.com/read/282097.html

随机主题

张鹤伦被郭德纲拒绝3回, 如果不是师娘帮助, 可能还在做保安尘埃落定, 三冠王教练同意! 挤走哈维执掌10亿豪阵, 皇马嗅到不安 “离奇预言”缘何频频能够公开发布? 同花顺回应: 针对类似不当言论将更严格审核 779 元, 2024 款苹果 Apple Watch 彩虹编织表带现已上市浦江县交通运输综合行政执法队赴浦新矿业公司开展运输专项检查彩！彩！彩！荣耀magic6保时捷pk华为pura70ultra！燃烧卡路里, “八小练兵”来助力庆余年2唯一输家: 最牛星二代跌下神坛, 演技尴尬, 全程被吊打西康高铁最长桥梁建设取得新进展, 通车后关中陕南一小时内可达搞笑配音：老美对日本提供核武器，没想到竟然要收三十亿保护费交警：如果连“锯齿车道”都不认识，千万别开车，弄明白了再上路齐商银行: 以便利化支付提升金融服务水平困扰美国近百年的难题, 被中国攻克! 半年发电6.5亿度, 世界第一底盘革新之作——问界新M7 Max焕新版即将正式上市显卡的销售日期和出厂日期区别小马科斯现身军校, 连放狠话, 终于对中国籍船员出手, 国防部正告全新瑞虎7到店实拍：一口价不到7万，实力到底如何？618不知道怎么入手数码产品? 这四款产品不容错过!阿隆索颁奖典礼一个举动让人感动！优雅少帅、未来可期还记得“水哥”王昱珩吗? 曾协助警方成功破案, 如今怎样了?国足新一期大名单: 6名新人入围, 谁能担当重任?

最新回复(0)