“中国版Sora”来了! 可生成2分钟1080P视频, 来看效果……

每日经济新闻2024-06-08 11:19:03 124

据新华社，近日，快手“可灵”视频生成大模型官网正式上线。相较此前各家放出的视频大模型以展示视频为主，本次亮相的可灵大模型已在快手旗下的快影App开放邀测体验。

据官网介绍，快手在短视频视频技术方面有多年的深入积累，其视频生成大模型也有天然、广泛的应用场景。可灵大模型为快手AI团队自研，具备诸多优势：能够生成大幅度的合理运动；能够模拟物理世界特性；具备强大的概念组合能力和想象力；生成的视频分辨率高达1080p，时长高达2分钟（帧率30fps），且支持自由的宽高比。

“可灵”大模型为快手AI团队自研，基于快手在视频技术方面的多年积累，采用“Sora”相似的技术路线，结合多项自研技术创新，效果对标“Sora”。

据悉，可灵使用了与Sora一样的DiffusionTransformer架构，3D时空联合注意力机制等，该架构巧妙地融合了时间与空间的信息，对视频数据进行综合分析和处理。

可精准捕捉到视频帧内的局部空间特征以及跨帧的时间动态特征，从而更全面地理解和再现视频中的运动信息。

所以，无论是快速移动的物体、剧烈变化的场景，还是复杂的人物动作都能被精确捕捉，使得生成的视频内容动态性十足，同时具有很高的物理世界真实感。

让我们一睹官方效果，动图截取有压缩，画质逊于展示视频，效果以官网为准。

基于对文本-视频语义的深刻理解和DiffusionTransformer架构的强大能力，可灵能够将用户丰富的想象力转化为具体的画面，虚构真实世界中不会出现的的场景。

基于自研的3D人脸和人体重建技术，结合背景稳定性和重定向模块，实现表情肢体全驱动技术，仅需一张全身照片，即可体验生动的“唱跳”玩法。

公开资料显示，快手已先后发布通用大语言模型“快意”、文生图大模型产品“可图”，还推出了Direct-a-Video、Video-LaVIT、I2V-Adapter、UNIAA等视频关键技术，引发了广泛关注。据悉，伴随此次可灵大模型的发布，快手将持续加速大模型的研发与应用，带来更加多元的AI创作与互动体验。

转载此文是出于传递更多信息目的。若来源标注错误或侵犯了您的合法权益，请与本站联系，我们将及时更正、删除、谢谢。
https://www.414w.com/read/687180.html

随机主题

吴绮莉曾称家门永远向女儿敞开, 晒切蒜视频遭嘲, 被问怎么沦落了始祖鸟立大功, 萨洛蒙抄作业, 母公司亚玛芬中国业绩猛涨河南队换帅势在必行, 李金羽突然辞职, 两者的交集可能是杨晨关爱老人免费体检迪马尔科致谢: 永远不会忘记你所做的一切, 张康阳回复: 爱你企业用车合规透明新选择！第20届中国(深圳)国际文化产业博览交易会开幕加工销售象牙……团伙被控危害珍贵、濒危野生动物罪刚在火箭试训中表现突出, 今又不希望加盟火箭。北京市首次翠湖湿地公园来“新客”五款车选谁毛病少? 星瑞、思域、凌度、艾瑞泽8、朗逸故障率横比假吃演员们! 求求你们学学《庆余年2》付辛博是怎么演干饭戏的吧 cos 从零开始的异世界生活爱蜜莉雅梦幻西游：老王光环队开启牟利模式，1小时竟能刷这么多？真强！揭秘抗战时期我党如何在老蒋眼皮底下不知不觉中壮大八路军实力。96岁抗日老兵: 每月领几百元很幸福, 日本人再也不敢欺负我们《狐妖月红篇》发布会: 杨幂拘谨放不开, 胡连馨颜值出挑 3天内2度对美制裁, 中方气场很强大, 却为何只制裁卸任的美国政客越南经济崩盘! 重蹈日本80年代覆辙, 或成为亚洲第一个倒下的国家宝马“最美”轿跑, 软顶敞篷+无边框车门+水晶挡把, 还有混动系统独行侠被狼队压制! 欧文24+1东契奇6中1, 华子13+8, 李凯尔大爆发

最新回复(5)

八卦小狐狸2024-06-08 19:24
引用5楼
短于3分钟的视频根本说不明白任何一件事
木木的世界2024-06-08 18:15
引用4楼
视频生成大模型是否会对传统内容生产和营销产生巨变？
小侯看人生百态2024-06-08 17:45
引用3楼
真真假假假假真真这世界更复杂了
五宇视频2024-06-08 17:20
引用2楼
果然是采用sora相似技术路线来参考开发出来的。国内很多科技创新都跟着M国科技屁股后面跑，等着开源。有一个参照物，就有了头绪
暴龙qq2024-06-08 17:16
引用1楼
新手机先卸载快手和抖音！[得瑟]