性能暴降92%? 英特尔中国“特供版”AI芯片曝光

芯智讯2024-04-14 18:00:24  83

据外媒The register报道,继不久前英特尔正式发布了新一代AI加速芯片Gaudi 3 之后,正准备面向中国市场推出“特供版”Gaudi 3,包括名为HL-328的OAM兼容夹层卡(Mezzanine Card)和名为HL-388的PCle加速卡两种硬件形态。

英特尔在其Gaudi 3 白皮书中披露了上述信息,其中HL-328将于6月24日推出,HL-388将于9月24日推出。

具体硬件规格方面,中国特供版的Gaudi 3 与原版相比,具有相同的96MB SRAM片上内存, 128GB HBM2e高带宽内存,带宽为 3.7TB/s,拥有PCIe 5.0 x16 接口和解码标准。但是,由于美国对于AI芯片的出口管制规则限制,使得这类高性能AI的综合运算性能(TPP)需要低于4800才能出口到中国, 这意味中国特供版的Gaudi 3 的16bit性能不能超过150 TFLOPS。

根据英特尔公布的数据显示,Gaudi 3 在 FP16/BF16 上可以达到 1835 TFLOPS,相比英伟达H100在大模型训练方面快40%、推理能效高50%。

显然,中国特供版的Gaudi 3 需要大幅降低AI性能,才能合规出口到中国。因此,中国特供版Gaudi 3 需要大幅削减内核数量(原版拥有 8 个矩阵数学引擎和64 个张量内核)和工作频率,最终可能需要其AI性能降低约92%才能符合美国的出口管制要求。

由于中国特供版Gaudi 3 AI性能的降低,这也将使得其TDP(热设计功耗)大幅降低。根据曝光的资料显示,中国特供版Gaudi 3的OAM卡和PCIe卡的TDP均为450瓦,而原版PCIe卡(HL-338)的TDP高达600瓦,原版OAM卡(HL-325L、HL-335)的TDP更是高达900瓦。

可以预见的是,英特尔专为中国市场推出的“特供版”Gaudi 3的OAM兼容夹层卡(HL-328)和PCle加速卡(HL-388)的AI性能将会与英伟达针对中国市场推出的AI加速卡H20相当,它具有 148 TFLOPS 的 FP16/ BF16 性能,略低于 150 TFLOPS 的限制。但是,在HBM容量及带宽上,英特尔中国特供版Gaudi 3将低于英伟达H20,这也使得其在与英伟达H20的竞争当中可能将处于劣势,当然具体也要看定价是否有优势。

相关文章《超越英伟达H100!英特尔Gaudi3发布:训练快40%,推理快50%!》

转载此文是出于传递更多信息目的。若来源标注错误或侵犯了您的合法权益,请与本站联系,我们将及时更正、删除、谢谢。
https://www.414w.com/read/216559.html
0
随机主题
邻国总理底气十足, 美国算什么, 与中国的合作, 才是头等大事小米新品空气炸锅来了! 5.27发售! 大容量仅售199元!一点道理也不讲, 关于小米Civi4 Pro, 知道这几点就够了喜迎开门红! 双巨头狂轰63+11+12, 欧文关键罚球太稳, 华子没办法三大消息:马科斯对军方出手!杜特尔特也遭清算?罪魁祸首被曝光历史重演?海港外援不满被换下:当场与教练组发生“内讧”!以色列总理遭全球通缉, 布林肯害怕极了, 以后岂不要通缉美国总统!继续打压! 美国正式宣布8月起对中国电动汽车加征关税立陶宛严厉谴责俄罗斯重新划定海上边界声明: 这是在发起混合战争以案说法: 员工不服从合理调岗被辞退 用人单位无需赔偿湖人引援新动向: 天时地利人和齐聚, 2年6950万锁定17+11内线巨塔他是公安部第三任部长, 59岁自杀, 两位公安部副部长受牵连被审查京东推京八条严抓考勤鼓励举报摸鱼, 打工人哭了《狐妖月红篇》发布会: 杨幂拘谨放不开, 胡连馨颜值出挑欧文: 我时刻提醒队友失败是什么感觉 登顶夺冠又是什么感觉澳洲人懒到什么极致程度? 一张照片刷爆全球, 拿下世界之最vivo XFold 3 Pro低价版: 折叠屏旗舰的亲民体验欧阳夏丹采访尴尬记: 离职后现身山西小馆, 遭遇冷漠回应2023年质量上乘的10部网大电影, 部部有惊喜, 你看了几部?520的瓜相比汪峰杨洋, 70岁的大咖的瓜让人意外, 姜还是老的辣4年2.94亿! 亚历山大解锁超级续约资格 合同年薪突破8000万大关
最新回复(0)