谷歌发布文生视频模型——Veo, 可生成超过一分钟高质量1080p视频

智能也得细细瞧2024-05-16 18:51:13 91

前期我们介绍过OpenAI的文生视频大模型-Sora 模型，其模型一经发布，便得到了大家疯狂的追捧。而Google最近也发布了自己的文生视频大模型Veo，势必要与OpenAI进行一个正面交锋。

Veo 是Google迄今为止最强大的视频生成模型。它可以生成超过一分钟的高质量 1080p 分辨率视频，具有多种电影和视觉风格。它准确地捕捉提示的细微差别和基调，并提供前所未有的创意控制水平，可以理解各种电影效果的提示，例如延时或风景的空中拍摄等。Google的视频生成模型将有助于创作者创作出更加精美的作品，成为每个人都可以进行视频制作的工具。无论是经验丰富的电影制作人、有抱负的创作者，还是希望分享知识的教育家，Veo 文生视频模型都可以成为有用的工具。

支持文本输入：

输入文本，使用模型生产视频。为了产生连贯的场景，生成视频模型需要准确地解释文本提示并将这些信息与相关的视觉模型相结合。凭借对自然语言和视觉语义的深入理解，Veo 文生视频模型可以生成紧跟提示的视频。它准确地捕捉短语中的细微差别和语气，在复杂的场景中呈现精美的细节的细节。

视频剪辑+Ps功能，给出输入视频和编辑命令时，例如将皮划艇添加到海岸线的航拍照片中，Veo 文生视频模型可以将此命令应用于初始视频并创建新的编辑视频。

支持遮罩编辑与图片输入

当向视频和文本提示添加遮罩区域时，可以更改视频的特定区域。Veo 还可以生成一个视频，其中包含图像作为输入以及文本提示。通过提供参考图像与文本提示相结合，它可以使 Veo 生成遵循图像风格和用户提示说明的视频。

该模型还能够制作视频剪辑并将其延长至 60 秒甚至更长。Veo可以通过单个提示来完成此操作，也可以通过提供一系列提示来完成此操作。

视频帧之间的一致性

保持视觉一致性对于视频生成模型来说是一个挑战。角色、物体甚至整个场景可能会在帧之间闪烁、跳跃或意外变形，从而破坏观看体验。Veo 建立在多年的生成视频模型工作基础上，包括生成查询网络(GQN)、DVD-GAN、Imagen-Video、Phenaki、WALT、VideoPoet和Lumiere，以及我们的Transformer 架构和Gemini。

veo 模型

文生视频大模型的发布，让视频创作者看到了福音。无需真人出镜，仅仅编辑自己的文案，就可以生成精美的视频。若把自己的人物头像，文案都传递给文生视频大模型，是不是可以出一个短视频？

前脚OpenAI刚刚开完自己的春节发布会，发布了ChatGPT4.0o版本，GPT-4o（“o”代表“omni”）它接受文本、音频和图像的任意组合作为输入，并生成文本、音频和图像的任意组合输出。模型更加智能，且输入输出方式更加自然，符合人类的交互需求。它可以在短短 232 毫秒内响应音频输入，平均为 320 毫秒，这与人类在对话中的响应时间相似，完全可以跟模型进行实时聊天了，而不是需要等待一段时间，失去了真真聊天的意义。

后脚google就更新了自己20几个AI大模型，2家公司之间的竞争将会势不可挡。借助 GPT-4o，OpenAi在文本、视觉和音频上端到端地训练了一个新模型，这意味着所有输入和输出都由同一个神经网络处理。想象一下，若把GPT-4o模型与文生视频模型结合起来，是不是就可以自己当导演，跟模型聊着天，就可以产出视频了。

转载此文是出于传递更多信息目的。若来源标注错误或侵犯了您的合法权益，请与本站联系，我们将及时更正、删除、谢谢。
https://www.414w.com/read/527133.html

随机主题

清朝到底有多狠? 为了削弱蒙古的战争潜力, 出家、盘剥, 无所不用 iPhone带手机壳散热不好？不可能，绝对不可能！金属手机壳董华出任中超公司总经理以闪亮五星红旗驻少年信仰高地育才学校举行爱国主义教育活动技能培训、人才招聘, 延庆区人社服务助村民端稳“长城饭碗”伊朗一天内解开总统坠机谜团: 原是技术故障, 美国终于放心手机高端化趋势明显：超半数畅销机型价格600美元起王红权星近三月直播13场销售额超2500万：卖每瓶3000元的洗发水首趟豫鲁“郑日韩”铁海快线班列启程, 助力更多河南制造出海与文博同行十年, 中芬设计园持续向世界展示中国设计方案中方增兵按加速键, 美航母连夜撤退, 印度军舰抵菲, 为2件事而来齐商银行: 以便利化支付提升金融服务水平辽宁三连冠! 500万大咖怒喷: 这是中国篮球的耻辱和悲哀陪跑蔚来6年的主要股东清仓式跑路: 聪明钱正在抛弃它直播：解放军台岛周边联合演训最新情况十个回合吃双车，惊天妙手，套路杀招，新手必备吉林东北虎官宣钟诚成为新主教练〔期待老铁新风暴〕与预售价一样 2.4T乘用炮、商用炮上市 12.58万元起售四部门: 优化外商投资环境, 继续缩减外资准入负面清单《庆余年2》开始发盒饭, 范无救和赖御史接连下线, 范闲落泪!森林狼大战独行侠! 李凯尔1分钟砍7分唐斯打铁麦克丹尼尔斯爆发

最新回复(0)