被视为“AI(人工智能)风向标”的英伟达GTC2024(NVIDIAGPU技术大会2024),时隔5年后终于回归线下。
北京时间3月19日凌晨,当英伟达CEO(首席执行官)黄仁勋面对万人观众亮出首款Blackwel架构的芯片B200时,因其可以处理数万亿个参数的模型,计算的AI性能是H100的五倍,使得这一AI芯片被冠以“地表最强”。
从架构到处理器,从自研能力到应用场景,英伟达的成功也被归益于生成式人工智能的发展。
但在物联网与人工智能领域拥有20多年经验、现任万物云管理合伙人兼首席科学家的丁险峰看来,英伟达的市值从20年前以Bilion(十亿美元)计到现在以Trilion(万亿美元)计,能实现1000倍的增长,“本质并不是它的芯片与其他芯片差异化有多大,英伟达的成功,其实是它的CUDA(一套通用并行计算架构)生态的成功”。
原来,围绕自研的并行计算平台和API(应用程序编程接口),英伟达构建起了一个CUDA生态,且进入这一生态的、要与相关软件兼容的第三方GPU(一种专用处理器)公司,需要接受英伟达提出的条款要求。“生态一旦建立,之后便会势不可挡。”丁险峰说。
实际上,越来越多的中国芯片产业人意识到,生态差距才是需要打破的那道墙。于是,以阿里巴巴为代表的科技巨头们闯入半导体产业斥资造芯,在解决中国算力困境的过程中,还把目光聚焦在了RISC-V(第五代精简指令集)架构上,意在CPU(中央处理器)领域构建起一个新的生态。
一、路径选择
RISC-V是一种指令集架构,作为软件和硬件之间的关键技术,由图灵奖得主大卫·帕特森(DavidPatterson)领导团队研发,并在2010年宣布对外开源,免费提供给高校师生、开发者、创业者以及商业公司,供他们使用并进行开发。
除了开源,RISC-V还具备简洁、灵活和可拓展性,更适配智能硬件的开发需求,能降低芯片设计厂商的开发成本与时间消耗。
中国工程院院士倪光南指出,当前CPU市场主要被x86架构(一种计算机处理器架构)与ARM架构(一种计算机处理器架构)垄断,中国芯片产业要想打破局面,实现自主可控,“基于开源的RISC-V架构发展创新将是机遇”。
此前,指令集架构作为芯片成型的起始,一直以来都被英特尔的x86架构以及英国的ARM架构垄断。
英伟达曾经想收购ARM公司,但以失败告终。之后,ARM被软银集团纳入麾下。但软银集团不能维持ARM的正常经营,又将其推向资本市场。自ARM架构被带入桌面级市场后,x86架构的优势逐渐消失,市场份额急速下滑。包括高通、苹果、华为等在内的巨头企业,都高度依赖ARM公司的架构授权。
但ARM架构并非不可替代。阿里巴巴布局芯片产业之初,就把目光瞄准在了RISC-V架构上。
丁险峰过去在阿里云担任首席智联网科学家,他还曾作为芯片策略组长,深度参与了阿里巴巴在解决中国算力瓶颈方面的相关研发工作。
6年前,阿里巴巴收购杭州芯片设计企业中天微系统有限公司,将业务整合成立平头哥半导体芯片公司,先后面市“含光”“倚天”“羽阵”等系列芯片,从而落实算力普惠这件事。
上述焦点之外,阿里巴巴在CPU领域尤其是RISC-V生态方面的布局,却被忽视了。
孟建熠曾是平头哥副总裁,他还是阿里巴巴达摩院RISC-V芯片业务的负责人。据他回忆,在2018年达摩院选择RISC-V技术路线之初,内部存在不同意见,“我们做自研架构是有基础的,但要转到RISC-V架构上,没有看到未来的商业可能”。“商业化想要走得快,背后需要的投入更大。”孟建熠也知道,取代一种架构非常难。但未来一定存在一个合理趋势,即三种架构持续并存,各有自身优势的应用场景。在讨论了好几个月后,孟建熠说服了团队走下去。
2019年,达摩院第一款RISC-V处理器玄铁C910面市。至今,这一自研处理器家族已有9款产品,成为国内RISC-V领域市场占有率最大的处理器IP(知识产权)系列。
官方并未给出玄铁处理器在行业内的具体市场份额占比。但在3月14日举行的2024玄铁RISC-V生态大会上,达摩院院长张建锋给出了这样一组数据:玄铁处理器IP在全球合作授权客户超300个,授权数超过800个,量产出货超过40亿颗。
产品商业化能力展现的同时,张建锋也指出玄铁处理器的下一步演进路径:向PC端、设备端等更高端算力的方向提升。
二、产业迎考
国内一家芯片企业创始人黄文隽,一直在国产GPU架构方向展开自研。提及玄铁处理器,因其多用于控制嵌入式系统操作,普遍应用于IoT(物联网)领域,不免被他吐槽,“很简单的芯片处理器,几分钱一颗,没有技术含量”。
基于RISC-V架构开发的处理器产品,初期确实会被诟病“低性能”“应用窄”。
但软件解决方案提供商——江苏润和软件股份有限公司项目经理魏明冲,在玄铁RISC-V生态大会的展区,向记者现场演示了基于RISC-V架构和开源操作系统,团队在智慧交通领域落地的终端解决方案。在流畅的实时画面背后,魏明冲说,是玄铁的高性能处理器满足了端侧对图像、音视频处理等系列需求。
提及高性能算力芯片,市场的聚光灯往往投注在英伟达、高通等企业及相关产品身上,“它们也都经历了从低性能产品升级进化的过程”,魏明冲希望扭转外界对玄铁的认知偏见。
会上,张建锋并不否认玄铁处理器的多款产品应用于嵌入式系统,但他补充说,在这一应用变得普及后,玄铁处理器在新型算力方面也有突破。
以过去一年发布的三款处理器为例,玄铁C907作为全球首次实现针对AI拓展的处理器,其端到端的性能直接提升了7倍;升级后的玄铁C920,AI性能也提升了4至6倍;玄铁R910则专注在实时领域,代表RISC-V在要求更高的自动驾驶或机器人等领域,进行适配和普及。
因RISC-V指令集免费授权、成本低,“可以让很多芯片厂商甩掉历史包袱”,在魏明冲看来,降低开发成本,避免未来可能被限制的风险,是开源指令集的优势所在。
为研发更高性能的算力芯片,一家名为知合计算的高性能通用可扩展处理器研发商,正与达摩院展开合作,孟建熠成为背后的关键人物。
去年10月,告别平头哥副总裁一职,孟建熠独立创业,成为知合计算的CEO。“希望RISC-V走得更快点”的孟建熠,选择到阿里巴巴的下游去做事。
深度参与玄铁处理器产品从前期规划到更高性能提升的过程后,如今,孟建熠作为玄铁RISC-V生态的一员,想与达摩院一起解决行业难题,“现在缺少真正能够在RISC-V产业里面大规模量产且高性能的芯片”。
会上,达摩院宣布,除了朝AI加速、低功耗、安全等方面升级迭代玄铁的产品线,还计划于今年内推出下一代处理器C930,为RISC-V向更高性能的探索奠定基础。张建锋认为,AI爆发带来新型算力需求的激增,“RISC-V发展正迎来蝶变,产业即将进入应用爆发期”。
如今,李春强接过担子,成为带队达摩院玄铁RISC-V团队的资深技术专家。“大家认为RISC-V是为AI而生的架构。”李春强介绍,团队通过扩展指令定义的方式,把CPU和AI的算力融合起来,使得AI的算法模型可以快速、便捷地跟RISC-V高效融合。“AI原生时代具有扩展性,也需要让更多的硬件资源具备计算能力。”在孟建熠看来,RISC-V天生就应该做好这件事。
而从高性能处理器的角度分析,想要把技术能力拉出来,“边界到底在哪里?”孟建熠认为,这个问题不单单考验着达摩院的玄铁团队,包括知合计算以及更多芯片、系统、软件、终端等产业下游的整个玄铁生态,都需要有所反馈,这样RISC-V才会成为一个正向循环的体系。
三、重塑生态
如何让开源的指令集RISC-V实现产业落地,这是孟建熠、李春强以及玄铁RISC-V团队一直以来的任务。
“在指令集的标准制定或参与,以及处理器之外,还要在工具、操作系统相关的软件方面做很多研发工作和资源投入。”李春强认为,玄铁不只要“打地基”,还要在跟产业链合作的过程中,成为RISC-V生态构建的“牵引线”。
李春强介绍,玄铁已经与国产操作系统openKylin(开放麒麟)、OpenAnolis(龙蜥社区)、openEuler(欧拉系统)、OpenHarmony(开源鸿蒙)等有深度合作,还与国际上的Ubuntu(一个操作系统)、Debian(一个社区)等在RISC-V方向展开紧密的结合,“安卓系统和我们在三四年前就启动了跟RISC-V的融合”。
孟建熠在参加2024玄铁RISC-V生态大会前夕,曾登录GitHub(一个面向开源及私有软件项目的托管平台),对与三大架构(x86架构、ARM架构以及RISC-V架构)相关的项目数据展开搜索。他发现与RISC-V架构相关的项目,已经超过ARM架构相关项目的三分之一。
虽是后来者,RISC-V架构发展的后劲十足。2022年,采用RISC-V架构的处理器实现全球出货规模100亿颗。相较之下,各个架构从提出到出货规模以百亿计,英特尔x86架构历时几十年,ARM用时17年才实现。
罗马不是一日建成的。张建锋总结,“市场增长率远远高于以前的传统架构,年均复合增长率保持在40%以上”。
RISC-V的旺盛生命力还反映在开源社区中。成立于2015年的RISC-V基金会,从最初只有17名会员,发展到2024年已有4000名会员。
张建锋看到,全球超过70个国家和地区投入到RISC-V产业中,印度甚至将RISC-V定为国家的发展战略。RISC-V能否长成一个成熟生态,张建锋认为,关键在于其生态是否足够繁荣。
黄文隽的合作伙伴,也有做RISC-V的芯片企业,他的理解是,开源开放的RISC-V生态必然是“覆盖全球的大生态”。从技术到产品齐头并进的迭代,“是按照摩尔定律的节奏在演进。”但黄文隽也看到事情的另一面,“RISC-V的市场太碎片化了”。
当前,芯片领域的架构生态会切入服务器、桌面、移动端这三大类,黄文隽分析认为,玄铁主要做的是比移动端还小的嵌入式处理器,这就必然会让做元器件、系统等硬件、软件的厂商有其独立的生态。
区别于x86、ARM在企业级市场的应用,“RISC-V现在显然不能满足应用需求”,黄文隽还表示,ARM的授权方式是自身把生态做起来,让大家都好用,为每一个场景赋能,但RISC-V是开放授权,这就意味着生态里的参与者各做各的。
在玄铁RISC-V生态大会上,一位行业人士也向记者证实了这一点,尽管行业内有RISC-V基金会牵头,国内推动构建RISC-V生态的阿里巴巴和中国科学院也有交互,但“基本上是各搞各的”。谈及原因,他只留下四个字:商业利益。
与下游厂商一起推动产业软硬件的生态建设,李春强没有回避“钱”的问题,他认为其中最关键的就是“让我们的合作伙伴在RISC-V的生态圈里真正赚到钱”。
姜怀所在的公司,正在利用大模型开发企业级AI应用,他个人也对玄铁RISC-V的开源架构生态有所关注。“好不好用。”他又将看似简单的四个字展开解释,开发者看得更多的是“能不能赚到钱,有没有企业买单,竞争对手多不多,架构生态能否为我们的目标服务”。
实际上,达摩院以及玄铁团队也清楚,当RISC-V面向更多不同的应用后,就会面临标准化、碎片化等难题。
一年前,孟建熠把RISC-V比作日出,以形容新架构及生态的光芒已初步照亮了东方。当时,他也强调,“做RISC-V的人不能孤立存在”。
一年后,张建锋站在台上呼吁:“RISC-V要真正走向主流系统,需要更多的标准化,也要更多的生态参与进来。”
走在芯片自主创新之路上的黄文隽认为,“RISC-V是中国芯片产业的机遇”是没法证伪的课题。但他认为,生态是合力构建的结果,从目前行业现实看,中国RISC-V生态仍在建设过程中,任重道远。
采访的最后,丁险峰说他更相信“时间的力量”,从海外一些大厂动辄数十年去做大做强生态的例证看,“不搞十年,怎么可能有生态”。细数达摩院玄铁RISC-V团队诞生至今的历程,丁险峰觉得,“过了五年没死,就很重要”。
(文中黄文隽系化名)