光铜共进, 通讯带宽是AI重要迭代方向

南风之神说2024-04-09 12:10:20 134

AI大模型对带宽提出更高要求。算术强度（ArithemticIntensity）代表模型计算过程中，从内存中读取的每个字节进行浮点计算的次数。以TransformerDecoder为基础的模型如GPT，其算术强度显著低于CNN模型和以TransformerEncoder架构为基础的模型（如BERT），对访存带宽提出了更高要求。

英伟达新架构通讯带宽再上台阶。英伟达最新数据中心GPU架构Blackwell，相比上一代的Hopper架构，带宽在多个维度显著提升：1）HBM迭代至HBM3e（带宽8TB/s），相比H100的HBM3（带宽3TB/s）实现翻倍以上提升；2）NVLink带宽提升至1.8TB/s，相比Hopper架构翻倍；3）支持PCIe6.0，带宽提升至256GB/s，相比Hopper（PCIe5.0128GB/s）翻倍。

AI拉动光模块需求，重视技术迭代增量。数据中心GPU放量拉动光模块需求，LPO、CPO、硅光等是数据中心光模块技术重要迭代方向，包括：1）LPO/CPO不采用DSP芯片，降低系统损耗（LPO相比可插拔光模块功耗下降约50%）和成本（800GLPO总成本下降约8%）；2）CPO缩短光引擎和芯片之间距离，减小尺寸、降低功耗、提高效率；3）硅光结合CMOS工艺超大规模、超高精度和光子技术超高速率、超低功耗（CPO/LPO架构下）的优势等。

GB200拓展Scaleup边界，降低客户TCO水平，拉动铜连接需求。英伟达最新机架解决方案GB200性能大幅提升，相同GPU数量下，训练速度可达H100的4倍；GB200NVL36可实现万亿大模型推理，吞吐量达H100集群的30倍以上。相比GH200，GB200的CPU:GPU配比由1:1降低至1:2，客户TCO（TotalCostofOwnership，总拥有成本）得以进一步降低。随着GB200在下游放量，背板连接器、铜缆等核心零部件有望受益增长。

转载此文是出于传递更多信息目的。若来源标注错误或侵犯了您的合法权益，请与本站联系，我们将及时更正、删除、谢谢。
https://www.414w.com/read/186414.html

随机主题

运输利勃海尔956 三大消息：马科斯对军方出手！杜特尔特也遭清算？罪魁祸首被曝光我们的广义货币, 为什么是美国的2倍?王思聪骂汪峰被吐槽五十步笑百步, 都不长情, 婚恋失败也没损失东方财富网股吧社区将开展内容专项治理亚特兰大勇夺欧联杯冠军，并终结药厂不败神话，温格推行越位新规 779 元, 2024 款苹果 Apple Watch 彩虹编织表带现已上市国家金融监督管理总局录用1472人, 研究生667人, 财经政法为主民主党不同意也没用, 美国众议长“执意邀请”以总理: 赴国会演讲 50多万的奥迪SUV降价超22万元, 车长4米9马力313匹值不值郭虹：演技深厚获认可有了“福建舰”后，中国还需要几艘航母，才能战胜美国海军？斗罗大陆: 92%神性, 唐三成为封号斗罗, 99级以下没人能将他打败 “土包子”翻身记, 更新潮的燕京啤酒和年轻人做朋友!卷价格, 卷新老车主权益, 纯电SUV铂智4X起步价14.98万元泽连斯基乌克兰总统泽连斯基五周年之际，极力督促北约武器到位！赵云：常山龙胆，三国风云中的不朽传奇乳企一季度降速后市场开始回暖未来增长依然要靠技术内卷四部门: 营造良好的货币金融环境金辉控股(09993)上涨50.68%, 报3.3元/股衣锦还乡! 辽宁男篮今早已经启程返回沈阳

最新回复(0)