升级对标Sora, 腾讯混元开源文生图大模型

市界2024-05-14 18:55:37  103

5月14日,腾讯宣布旗下的混元文生图大模型全面升级并对外开源,目前已在HuggingFace平台及Github上发布。混元文生图包含了模型权重、推理代码、模型算法等完整模型,可供企业与个人开发者免费商用。

这是业内首个中文原生的DiT架构文生图开源模型,支持中英文双语输入及理解,参数量15亿。

过去,视觉生成扩散模型主要基于的是U-Net架构,但随着参数量的提升,基于Transformer架构的扩散模型展现出了更好的扩展性,有助于进一步提升模型的生成质量及效率。

升级后的腾讯混元文生图大模型采用的是全新的DiT架构(DiT,即DiffusionWithTransformer),这也与此前OpenAI旗下的Sora和著名开源大模型平台Stability最新的文生图模型StableDiffusion3使用了同款架构和关键技术,是一种基于Transformer架构的扩散模型。

升级后的混元文生图大模型不仅可支持文生图,也可作为视频等多模态视觉生成的基础。

中文原生也是此次腾讯混元文生图大模型的一大亮点。此前,StableDiffusion等主流开源模型核心数据集以英文为主。混元文生图则具备更强的中英文双语理解及生成能力,在古诗词、俚语、传统建筑、中华美食等中国元素的生成上表现出色。

据了解,从2023年7月起,腾讯混元文生图团队便明确了基于DiT架构的模型方向,并启动了新一代模型研发。今年初,混元文生图大模型全面升级为DiT架构,并对原有模型进行了改进:新一代DiT模型具备了更长的文本理解能力,支持最长256个字符(业界主流是77个)的图片生成指令。增加了中文原生的理解能力;并增加了多轮对话的能力。

据了解,目前腾讯已开源了超170个优质项目,均来源于腾讯真实业务场景,已覆盖了微信、腾讯云、腾讯游戏、腾讯AI、腾讯安全等核心业务板块。(赵子坤/文李原/编辑)

转载此文是出于传递更多信息目的。若来源标注错误或侵犯了您的合法权益,请与本站联系,我们将及时更正、删除、谢谢。
https://www.414w.com/read/509502.html
0
随机主题
15万预算, 卡罗拉, 还是亚洲龙?中通客车“号令者”浮出水面, 暂停交易15日从辽篮夺冠看广东队的三点差距!杜锋需要反思,球迷成为受害者!曝森林北爱上汪峰损失大, 活动被取消, 阳光清纯遭质疑, 但不后悔什么时候买摩托车最划算?汉末争霸,曹操统一北方,谋略和实力很重要,逆天的运气也是关键!空军有歼20, 海军有超级航母, 解放军陆军也终于迎来新型重装备?爆笑漫画《阿U校园爆笑王》、免费奶茶、雪极星滑雪体验券, 橙柿福利爆款上新 | 橙柿福利Sensor Tower: 《Monopoly GO! 》4月蝉联全球手游畅销榜冠军, 《王者荣耀》位列第2名, 米哈游旗下两款手游表现强劲凤姐国外被偶遇:胖到不敢认了!爱如潮水! 四川大凉山孩子们的“愿望清单”, 被浙江人承包了姚明真笑了!辽宁豪取三连冠,郭艾伦和杨鸣拥抱,赵继伟表情抢镜1950年毛岸英牺牲, 9年后罗瑞卿密电任荣: 主席有一项任务交给你美国黑鲈“入侵”珠江, 成为新的霸主? 就连清道夫它们也能生吞!俄罗斯从三家欧洲银行扣押了价值超过7亿欧元的资产肯辛顿宫拐弯抹角更新凯特最新健康状况, 透露其已在带病工作Steam账号无法通过遗产继承, 赛博遗产计划破灭印度美女远嫁中国, 弟弟前来中国祝贺, 直言: 中国人真是尖酸刻薄沃尔沃两款新车售价曝光! 贴牌极星徽章, 2.0T+电机, 心动吗李彦宏吐槽AI发展速度“太慢了,AGI还要十年以上”,英语流利秒杀一大帮老对手独行侠被狼队压制! 欧文24+1东契奇6中1, 华子13+8, 李凯尔大爆发
最新回复(0)