一觉醒来 AI科技圈发生的大小事儿 05月02日

文浩Free2024-05-03 09:16:16 70

??人大卢志武：只要拿到更多算力，超过Sora也不是那么难的事｜中国AIGC产业峰会

中国人民大学团队与OpenAI进行了三次大撞车，最新一次是在Sora上；团队在视频生成领域采用了Diffusion Transformer，引入统一的时空掩码建模；VDT使用Transformer基础模型，能更好捕捉时间依赖性；模型效果与训练消耗的计算资源正相关；VDT采用时空分离的注意力机制，与Sora的时空合一有区别；通过token concat方式实现快速收敛和良好效果；团队在物理规律模拟方面取得了成功，认为只要获得更多算力，超过Sora并不难。

??余承东卸任华为终端BG CEO，何刚将接任

华为宣布余承东将卸任终端BG CEO一职，但仍保留董事长职位，何刚接任CEO。余承东自1993年加入华为，历任多个职务。何刚曾主导华为Mate及P系列手机研发。余承东与何刚合作期间，华为终端业务收入快速增长。华为2024年第一季度财报显示营业收入同比增长36.66%，归母净利润同比增长约564%。余承东在新年信中提到2024年是鸿蒙的关键一年，要加快推进原生鸿蒙应用开发。

??参数量不到10亿的OctopusV3，如何媲美GPT-4V和GPT-4？

多模态AI系统能处理自然语言、视觉、音频等数据，Octopus v3模型为边缘设备设计，参数量优化至10亿内，支持英文和中文，可在资源受限设备上高效运行。模型结合因果语言模型和图像编码器，采用functional token进行视觉信息编码，通过多阶段训练提升模型性能。实验结果显示，10亿参数的Octopus v3模型在多个功能任务上效果与GPT-4V和GPT-4组合相媲美。模型的可扩展性使其适用于医疗、金融、客户服务等领域，推动AI技术民主化。未来研究方向包括容纳音频、视频数据模态的训练框架和优化推理速度。

转载此文是出于传递更多信息目的。若来源标注错误或侵犯了您的合法权益，请与本站联系，我们将及时更正、删除、谢谢。
https://www.414w.com/read/400475.html

随机主题

业内人士点评中超：观赏性提高，但节奏很慢，没接近现代足球！美国露怯? 拜登对华加征新关税后, 耶伦却喊话希望不要受到报复十年磨一剑《上古卷轴Online》被赞3A佳作华为智选车“第四界”进入倒计时！首款百万级豪车即将诞生阿为特30.0%涨停, 总市值19.06亿元抹不去的记忆和乡愁四十余年镜头记录夏收的点点滴滴新西部、新制造、新服务第六届西洽会开幕普京访华圆满结束，临行前对华再表态，特朗普斥责拜登政府无能！美国财长耶伦: 动用俄冻结资产助乌非为选举, 七国峰会或敲定方案个人求助网络服务平台, 如何保障服务质量与可持续发展?生涯第4冠, 36岁韩德君退役? 谁注意郭艾伦喊话, 大韩举动感人美股收评: 三大指数集体下跌, 太阳能、通讯设备板块走高, 金属、采矿、油气股跌幅居前为什么很多人讨厌国漫的超前点播, 但又希望快点出, 原因有两个珠海一工厂突发火灾, 当地回应: 系仓库着火, 无人员伤亡杨金发: 5-22晚间黄金持有空和继续布局做空下跌!1950年毛岸英牺牲, 9年后罗瑞卿密电任荣: 主席有一项任务交给你底盘革新之作——问界新M7 Max焕新版即将正式上市哪款故障少? 五菱缤果、海鸥、欧拉好猫、海豚, 10万内选谁好?世界女排联赛首周最佳阵容公布, 中国女排一入选球员出乎意料 JBL万花筒6和哈曼卡顿luna人声对比，有听出哪个好嘛金辉控股(09993)上涨50.68%, 报3.3元/股

最新回复(0)