【技术解读】Zen5架构升级了什么? AMD技术大佬手把手给你讲明白

电脑报2024-07-17 10:40:38  104

7月9日~7月10日,AMD在美国洛杉矶举办了AMD 2024 Tech Day技术沟通会,进一步公布了Ryzen AI 300系列移动处理器、锐龙9000台式机处理器以及Zen5架构、第三代Ryzen AI引擎、RDNA3.5架构的技术细节。而大家最关心的Zen5架构部分,更是由AMD首席技术官及执行副总裁Mark Papermaster以及AMD“架构之父”首席架构师Michael Clark进行了详细的讲解,我们受邀参加了这次会议,也为大家带回来了丰富的一手技术资料。

全面升级的Zen5架构带来IPC的起飞

整体来说,Zen5架构的升级包括了四大方面。第一,每个周期可以处理更多的指令;第二,分发和执行带宽得到了提升;第三,将缓存数据带宽翻倍;第四,提供AI加速。

前端部分,在指令取/解码的升级方面,Zen5架构带来了双管道获取以及高级分支预测。分支预测拥有了更低的延迟、更高的准确度与吞吐量;指令缓存响应速度与带宽都得到了提升;提供双解码管道。

执行部分,整数执行的升级主要包括了更宽的分发与执行,提供了8个单位宽度的获取/退出,拥有6个ALU,包含3个乘法器,具备更多的统一架构ALU调度器和更大的执行窗口。

浮点/矢量计算单元的执行部分,Zen5架构提供了512位的AI数据通路,支持满血512bit数据通路的AVX-512加速,拥有6流水线/双周期延迟的浮点加法器,可以发送更大数量的浮点运算指令。

载入和存储部分,Zen5架构提升了数据带宽。它拥有48KB的12路一级数据缓存,提供4周期载入;一级缓存与浮点单元的最大带宽得到了翻倍;提升了数据预取效率。

总而言之,就算普通玩家看不明白那么多专业术语,光是从图上也能看到Zen5对于处理器架构的各个部分都进行了升级,所有这些升级都是以提升IPC和执行效率为目标,这也意味着就算频率不变,Zen5的性能也会高出上代不少。

架构升级带来IPC大幅提升

那么经过四大方面的升级之后,Zen5架构相对Zen4有多大的IPC提升呢?AMD官方给出了对比的数据。从图中可以看到,13项测试中,Zen5最低领先了10%,最高领先幅度达到35%,平均下来大约在16%左右。这13项测试包含了游戏、视频转码、网页应用、3D渲染输出和基准测试,覆盖面也比较广,比较有代表性。

而在数学计算加速单元方面,Zen5的提升更是巨大。和Zen4相比,Zen5单核机器学习性能暴增32%,单核AES-XTS计算也剧增35%之多。

当然,除了锐龙9000之外,采用Zen5架构的AMD处理器还有Ryzen AI 300系列移动处理器和第五代AMD EPYC服务器处理器(将在2024下半年上市),其中Ryzen AI 300系列移动处理器不但采用了Zen5架构,还内置了第三代Ryzen AI引擎的NPU,为用户提供了进入AI PC时代的全能解决方案。第五代AMD EYPC服务器处理器则最多可提供192核384线程,采用领先业界的4nm与3nm制程工艺打造。

RDNA 3.5架构再次拉高内置GPU性能天花板

除了Zen5架构,AMD这次也把GPU架构更新到了RDNA 3.5。大家对于Zen4架构的锐龙7040/8040/8000G处理器内置的RDNA 3集显肯定印象深刻,毕竟它在桌面平台上的性能表现已经超越了GTX 1650独显。而RDNA 3.5这次又在RDNA 3基础上进行了三大提升。第一,优化了每瓦性能,提高了执行很多常见图形着色操作的能效比;第二,优化了每位宽性能,减少了访问显存的操作,提升了能效比;第三,针对更长的续航进行了设计,升级了GPU内置的高级电源管理,节约了激活状态下的功耗。很明显,作为移动处理器内置的GPU,RDNA 3.5将升级能效摆在了第一步是最合理的,如此一来不但可以大幅提升笔记本的续航能力,也能在有限散热条件下发挥出更强大的性能。

具体到性能指标方面,RDNA 3.5相对上代提供了双倍的材质采样率,在最常见的材质采样操作部分,现在可以在常见游戏中提供双倍的采样速率。同时,RDAN 3.5相对上代还提供了双倍的插值率和比较率,因此在大多数插值率和比较率的富向量标准中,现在可以实现双倍着色操作率。此外,RDNA 3.5也优化了显存管理,减少了显存访问量,采用了更好的压缩技术,减少了工作负载,优化了LPDDR5内存访问。

从量化的数据来看,在同为15W TDP设定的情况下,代号Strix Point的Ryzen AI 300系列的3DMark TimeSpy得分高达3462,相对上代Hawk Point提升了32%之多,Night Raid得分也提升了19%。由此可见未来搭载Ryzen AI 300处理器的轻薄本不管是游戏性能还是续航都会得到极大的提升。

考虑到目前Windows掌机的处理器TDP最高可解锁到33W,其TimeSpy得分也没有达到3400分,而Ryzen AI 300处理器则可以15W TDP实现如此高的分数,这就意味着未来采用Ryzen AI 300处理器的掌机在续航和游戏性能方面也都会有长足的进步。

最后简单总结一下,首先,Zen5架构带来了巨大的性能提升,而这个架构会全面应用到桌面、移动平台和服务器上,从而开启性能大升级的Zen5时代;其次,代号Granite Ridge的锐龙9000会成为桌面平台的性能标杆,而代号Strix Point的Ryzen AI 300系列移动处理器则是高能效计算的标杆;最后,RDNA 3.5着重优化了能效比,以至于在Ryzen AI 300中可以放下更多的CU单元,这也让16个CU的Radeon 890M成为集显的新一代标杆,千元独显已经难望其项背。

写在最后

细心的玩家可以发现,AMD Zen5这一代的架构升级是CPU+GPU+NPU全面升级,得益于架构和制造工艺的升级,采用Zen5架构的锐龙9000系列、Ryzen AI 300系列甚至是下半年上市的第五代EPYC都可以得到极大的性能提升。而对于今年最重头的AI PC之星Ryzen AI 300系列来讲,Zen5/Zen5C+RDNA 3.5+XDNA2架构的配置可以说是全面升级的代表了,集中如此多的先进架构为Ryzen AI 300带来了标杆级的性能与能效比,更是为三位一体的全能AI加速提供了强大的引擎。那么,这次AMD手里有了那么多王牌,今年下半年的核心硬件平台必然会更加精彩。

转载此文是出于传递更多信息目的。若来源标注错误或侵犯了您的合法权益,请与本站联系,我们将及时更正、删除、谢谢。
https://www.414w.com/read/907971.html
0
随机主题
又一古装大剧要播了? 预计5月29日上线, 三大看点有望成爆款王力宏补位歌手2024河南队换帅势在必行, 李金羽突然辞职, 两者的交集可能是杨晨又一批新车拿到“身份证”, 看看有没有你的心头好企业用车合规透明新选择!《披哥4》曝光嘉宾名单, 李佳琦黑泽良平在列, 李克勤带队大咖少2024新鲜提案·黎里真实影像大会在苏州黎里开幕末节15分&一断一投收比赛! Skip: 东契奇打得像世界最佳球员手机弹出“系统更新”提示, 大多数人会这样做! 看看老师傅怎么说8900多买了部华为pura70ultra手机,玩游戏流畅60帧非常给力哈哈演训随时可能变实战!东部战区突然行动,毫无征兆却已包围台岛?江天化学: 公司不生产共聚聚甲醛、偏苯三酸酐(TMA)等产品澳洲人懒到什么极致程度? 一张照片刷爆全球, 拿下世界之最跌倒6.25万, 可如今却混到没人要, 最失败的小钢炮网红界要变天了? 网红王红权星炫富被封号, 网友: 真正富的不会炫Kpop 现役大型女团 Triple S!!!谁能懂!MV的概念真的很绝!!!新形势下地方招商引资的挑战与应对有人认为职业年金是私分国有资产的由头, 你认为这种说法靠谱吗?郭有才必须停播, 说他是教育界的毒瘤, 其实是名副其实苦命的人! 叙利亚第一夫人又被确诊癌了, 老美称: 她等于一个师雅阁VS凯美瑞!如果是你你选谁?
最新回复(1)