不久前,在我们三易生活在分析AMD技术日所公布的产品信息时就曾经指出,AMD在最新的GPU和NPU设计里,似乎还埋了一些“伏笔”。
当时我们所指的信息,主要有两个方面。其一是AMD大篇幅地宣传XDNA2在他们AI体系中的作用,但绝口未提如今RDNA3独显里所集成的AI单元设计。这可能是在暗示他们将在未来的消费级显卡里也全面集成XDNA单元作为AI加速器,而不再使用现有的、由显卡团队设计的AI单元。(当然这也可能意味着,对现有显卡AI单元的潜力挖掘和功能适配工作会受到影响)。
其二就是我们注意到,AMD方面在介绍RDNA3.5核显的变化时,专门讲到它提升了内存效率,降低了GPU对于内存带宽的依赖度。而这似乎便是在暗示那已传闻许久,PC史上第二款x86架构的“超大核显”设计Strix Halo APU。
16核CPU+超大NPU,还有比独显更强的核显
Stirx Halo有多强?就在前不久,多款基于这款处理器的测试平台信息被曝光。根据这些信息可以推测,一款典型的Stirx Halo拥有两个8核心Zen5 CPU模块、最高主频5.8GHz,并集成了高达64MB的三级缓存。与此同时,它还拥有算力达到70TOPs级别的NPU。
当然,Stirx Halo最引人注目的地方还是在于,它还拥有一颗堪称恐怖的40CU RDNA3.5核显。稍作计算就会发现,这意味着这颗GPU具备2560个流处理器、160个纹理单元、80个光栅单元,以及40个光追单元。换句话说,它的硬件规模甚至超过了现在的Radeon RX7700S独显。
更进一步来说,如果假设Stirx Halo的核显运行频率与它的同代次“小弟”、也就是Radeon 890M相仿,那么这颗40CU的巨大核显将会拥有恐怖的29.7TFlops单精度算力,以及232GP/s的像素填充率和348GT/s的纹理填充率。
这是什么概念呢?如果只比较单精度算力的话,Stirx Halo甚至已经可以比肩隔壁RTX4090的Max-Q版本,或者说与桌面版的RTX4070 Super差不多了。
大CPU大GPU的内存抢占问题,注定不容忽视
当然,以往的经验告诉我们,看起来很高的硬件规格并不总是意味着实际很好的性能表现。特别是对于CPU和GPU集成在一起的芯片来说,当两者的规格都很“大”的时候,相互之间的内存带宽抢占可能就会变成一个不容忽视的问题。
当然,AMD方面不可能没有想到这个问题。按照目前流传的说法,Stirx Halo将会拥有32MB、由CPU和GPU共用的四级缓存,以减轻对内存带宽的压力。
更为重要的是,Stirx Halo很可能会是x86架构移动处理器中首个使用256bit统一内存的设计。据目前已曝光的测试平台来看,它的内存容量或将从32GB起步,最高提供128GB、甚至256GB可选。
假设Strix Halo的CPU内存控制器体质与目前已经发布的锐龙AI移动平台相仿,那么这就意味着它将支持256bit的LPDDR5X内存、从而提供240GB/s的内存带宽。
乍看之下,这个内存带宽似乎已经非常大,甚至比线程撕裂者7000X系列的内存带宽还要高了近50%。但如果考虑到GPU的显存池带宽需求,那么它实际上可能只能算是“勉强够用”。因为类比就会发现,桌面端比它流处理器数量少20%的Radeon RX7600,其所标配的显存带宽都已高达288GB/s,而且这还是真正的独立显存,并不需要与CPU共享带宽。
特殊的产品定位,或是Strix Halo的破局之道
那么这是否意味着Strix Halo的“超大核显”,性能就会不尽如人意呢?其实也不见得。
高TDP的单芯片PC方案有没有觉得很眼熟?其实当年Intel也做过类似的产品
从目前的已知信息来看,Strix Halo这颗“超级APU”的产品定位会非常、非常高。据称其单芯片TDP高达120W以上,而且会标配超大内存,主打的就是“移动生成式AI工作站”。
DELL曾基于Intel KabyLake-G平台推出了翻转屏笔记本工作站
于是在这样的产品定位下,一方面只要Strix Halo的单芯片功耗低于常规的标压CPU+移动独显方案,那么它反而有望实现一些大尺寸、但非常轻薄的笔记本工作站产品形态,而且带来比潜在的独显竞品更长的续航能力。
一款出厂搭配5600MHz内存的12代酷睿轻薄本,证明高价产品的确可能会有额外的性能设计
从另一方面来说,考虑到Stirx Halo的定位,显然也不能排除AMD(或相关PC厂商)届时为其搭配更高频率内存颗粒,从而额外增加内存带宽的可能性,毕竟类似的情况我们三易生活就已经见识过。可以说只要产品定位够高、定价够贵,厂商就确实会有动机去额外“加料”,当然反之亦然。
最后、也是最重要的,就是虽然当Strix Halo真正登场时,它可能会是x86架构里唯一在售,采用“超大核显”、以及大带宽统一内存设计的PC工作站芯片方案。但纵观整个业界,无论苹果的M系芯片、还是高通的骁龙X系列,实际上都相当于已经替它开辟了道路,至少让相关开发者在面对这种“大U大显”的特殊PC芯片做优化时,并不太可能会无所适从。
况且如果Stirx Halo明确定位于“AI工作站芯片”,那么这也就意味着,它并不见得会与那些独显游戏本构成直接竞争。再考虑到AI创作任务对于GPU显存的特殊需求(容量远比带宽重要),以及届时业内可能比现在更成熟的应用优化环境,这款看起来非常梦幻的超大型APU芯片,届时确实可能会有其独特的市场竞争力。
至于说它的诞生是否会引领PC芯片更大规模地转向“集成化”,甚至于让统一内存的理念也浸染更多x86架构产品,目前可能还不太好说。
【本文图片来自网络】
转载此文是出于传递更多信息目的。若来源标注错误或侵犯了您的合法权益,请与本站联系,我们将及时更正、删除、谢谢。
https://www.414w.com/read/910681.html