10月11日,AMD公司在“AdvancingAI”大会上推出了新的InstinctMI325X加速卡。这款加速卡基于CDNA3架构,相较于旧款MI300X带来了一系列改进。旨在应对万亿参数的AI模型,AMD着重提升了HBM3E内存和计算能力。
规格和性能方面,MI325X加速卡配备了256GB的HBM3E内存,容量是MI300(192GB)的1.8倍,带宽更是达到了6TB/s。在FP16训练和推理下达到1.3PetaFLOPS,在FP8训练和推理下达到2.6PetaFLOPS,较MI300提升了约1.3倍。所有这些功能都集于一个拥有约1530亿个晶体管的芯片中。
此外,配备八个MI325X加速器的系统可实现20TB的HBM3E内存和高达48TB/s的带宽。预计该系统的计算性能将达到FP16计算性能约10.4PetaFLOPS和FP8计算性能约20.8PetaFLOPS。据AMD描述,在内存带宽、FP16/FP8计算性能上超越NVIDIAH200HGX系统约1.3倍,内存容量上超越约1.8倍。
除此之外,AMD表示正在与开源社区合作,将PyTorch、Triton、ONNX等框架的功能整合到ROCm堆栈中,并计划将其引入每款GPU中(包括消费级GPU)。公司还透露将于下半年推出基于TSMC3纳米工艺的CDNA4InstinctMI355X加速器。
AMD正努力提高其AI加速产品的性能,并与社区紧密合作以不断优化软件开发环境。
转载此文是出于传递更多信息目的。若来源标注错误或侵犯了您的合法权益,请与本站联系,我们将及时更正、删除、谢谢。
https://www.414w.com/read/1350026.html