2023年,ChatGPT爆火,各大科技企业纷纷宣布研发自身的AI大模型,昆仑万维也不例外。在2023年4月,昆仑万维发布了天工大模型1.0版本。
由于性能较好,天工大模型成为国内排名靠前的通用大模型。经过1年时间发展,天工大模型也在不断迭代。2024年4月17日,昆仑万维自研四千亿级大语言模型“天工3.0”正式开启公测并同步开源。
据悉“天工3.0”是目前全球模型参数最大、性能最强的MoE模型之一,相较上一代,“天工3.0”在模型语义理解、逻辑推理等多个性能维度均有明显提升。与“天工3.0”同步公测的还有昆仑万维的音乐大模型天工SkyMusic,据悉,天工SkyMusic是中国首个音乐AIGC SOTA模型。
对于昆仑万维而言,经过多年的尝试,在原有的主营业务之下,昆仑万维终于摸索出新的方向。All in AGI与AIGC从来不是一句口号,昆仑万维正用实际行动证明,公司正在坚定的执行All in AGI与AIGC经营策略。
财报显示,昆仑万维2023年研发费用进一步提升至9.7亿元,同比增长40.2%。此外,昆仑万维原有业务发展也较为顺畅,2023年公司实现营业收入49.2亿元,海外业务收入占比达86.0%,同比提升8.4个百分点;实现归属于上市公司股东的净利润12.6亿元,同比增长9.15%,利润规模继续位居行业前列。
昆仑万维All in AGI与AIGC效果显著
在接受采访时,昆仑万维董事长兼CEO方汉表示,在AI爆火以前,公司曾经历过多次小规模的创业,直到2023年,昆仑万维下定决心要All in AGI与AIGC。
方汉表示,从1995年开始,国内互联网科技大约经历了三个周期,第一个周期是互联网,第二个周期是移动互联网,第三个是目前的AI。
在这三个周期中,企业成功的关键便是免费和C端两个模式叠加。在此背景下,2023年4月昆仑万维推出了面向C端的“天工大模型”。
经过1年时间的迭代,昆仑万维大模型已经进化到3.0版本。与“天工2.0”相比,“天工3.0”实现了全面的性能升级,采用了4000亿级参数MoE混合专家模型架构,是目前全球模型参数最大、性能最强的开源MoE模型。
在性能上,“天工3.0”已经全面超过3140亿参数的MOE大模型Grok1。该大模型也是XAI之前发布最大的MOE大模型。尤其是在逻辑推理、属性推理、关系推理、细粒度感知和粗略感知等方面均取得较大进步。
逻辑推理方面,“天工3.0”数学与推理能力均提升超过30%。语义理解则能够更好理解和处理用户自然语言Query中的复杂语义信息,包括隐喻、多义词等。
对于用户而言,“天工3.0”最大的提升便是在AI搜索场景上。例如,针对用户提出的复杂问题,“天工3.0”能够针对复杂Query进行拆解、细化、并进行追问、信息理解与补全,使其在自然语义理解方面性能更强,面对不确定性知识时表现更好,能够更精准、高效地满足用户需求。
此外,区别于其他大模型的是,“天工3.0”,仅有文本回复能力,还有图文并茂能力,例如在搜索“康乾盛世”时,“天工3.0”在文本回答的同时附带图片或视频,帮助用户加强信息理解。
与上一代大模型相比,“天工3.0”又发展出了更强的多模态性能,例如在对话中,结合文本需求实时生成图片、或实时分析内容及图表的能力,成为了集合听、说、读、写、搜、画、看、唱等能力的千亿级开源MoE大模型。
All in AGI与AIGC对于昆仑万维而言,从来不是一句口号。“天工3.0”的推出不仅为行业带来了高效智能的解决方案,格式让广大的用户真正参与到AI大浪潮之中。
天工SkyMusic 引领AI音乐创作浪潮
自OpenAI将大模型推上行业风口以来,中国已经开展了一轮轰轰烈烈的“百模大战”,各行各业都有属于自己的通用大模型。唯有音乐领域,还没有拥有自己的大模型。
与其他行业不同,AI音乐进入门槛较高,此前,AI音乐行业大量研究都集中在符号音乐生成技术路线上,并且大多只能实现无人声背景音乐(Background Music,BGM)的生成。但在音乐的质量、效果、审美都打不到专业水准,因此,AI音乐大模型迟迟未能诞生。
但音乐又是大众最易上手和感受到趣味性的AIGC场景。对于相关企业而言,推出一款音乐大模型是让相关公司推向C端市场、获得大众认知的绝佳机会。
在此背景下,昆仑万维音乐大模型天工SkyMusic应运而生。据悉,天工SkyMusic不仅是国内唯一公开可用的AI音乐生成大模型,同时也是中国首款AI音乐大模型SOTA模型。
在与海外顶尖的AI音乐大模型Suno V3的横向测评中,天工SkyMusic在人声&BGM音质、人声自然度、发音可懂度等领域显著领先对手,并以6.65分的综合得分超越Suno V3,成为全球AI音乐SOTA模型。
一般而言,AI音乐生成有两大技术路径,分别是符号音乐生成路线和大模型音乐音频生成路线。昆仑万维选择的音乐音频生成路线。相较于音乐生成路线,音频生成路线难度系数更高。
为了突破相关技术难点,昆仑万维投入了大量的人力、物力,使得该领域的生成质量终于得到提升。
例如,天工SkyMusic拥有独特的参考音乐生成与方言歌曲生成能力。能够支持成都话、北京话等众多方言,让用户能够更自由地实现音乐表达,传播方言文化。
此外,天工SkyMusic还能通过歌词控制情绪变化,还支持创作说唱、民谣、放克、古风、电子等多种音乐风格。
借此,天工SkyMusic得以大幅降低原创音乐的创作门槛,让每个爱好音乐的人能更容易创作属于自己的歌曲。由于产品性能优越,天工SkyMusic很有可能成为音乐创作领域的现象级产品。
昆仑万维已经具备成为顶级AI企业的潜力。假以时日,昆仑万维必将“凤凰涅槃”,成为引领国内AI潮流的科技企业。
转载此文是出于传递更多信息目的。若来源标注错误或侵犯了您的合法权益,请与本站联系,我们将及时更正、删除、谢谢。
https://www.414w.com/read/341301.html