Apple M1 Ultra芯片级解析

启芯硬件2024-04-27 14:10:00  132

M1 Ultra就是把两块M1 Max拼在一起,用苹果称为“UltraFusion”的技术进行数据链接与交换。

根据苹果的描述,这项技术能够提供超过2.5TB/s的带宽(单向1.25TB/s),这意味着苹果可以将两颗M1 Max上的GPU核心当成一块GPU来使用,开发者们并不需要额外的工作就可以“轻松”利用其恐怖的GPU规模来完成相应的应用。

以前多GPU系统里,都是将每块GPU看作单独的实体,比如英伟达的SLI或者AMD的CrossFire技术,都需要开发者进行额外的适配工作,才能尽可能高的利用两块GPU所带来的运算能力,但是有了UltraFusion的超大带宽,相信未来我们应该可以看到很多不一样的东西。从这一点来说,苹果的“UltraFusion”技术就非常有价值了。

详细来说,苹果将两个M1 Max芯片组合到一个芯片封装中,中间通过TSMC的bridge 桥接,从而实现1+1>2的效果,从而使两个芯片呈现为一个单一的单片GPU,这标志着成为芯片制造行业的又一个第一,在芯片制造近几年遇到瓶颈后成为了提升芯片PPA性能的热门研究方向。

下图是整理台积电从1987年到2022年的工艺节点图。

双击放大可以看细节。

2011年推出28nm制程,为客户生产更高效能、更节能及更环保的芯片产品。TSMC 28纳米制程以采用高介电层/金属闸极(High-k Metal Gate,HKMG)的后闸极(Gate-last)技术为主。相较于前闸极(Gate-first)技术,后闸极技术具备较低的漏电流以及能提供更佳的芯片效能等优势。

2018年量产7纳米鳍式场效晶体管(7nm FinFET,N7)技术,此技术是台积公司量产速度最快的技术之一,并同时针对运算应用及高效能提供优化的制程。此外,7纳米FinFET强效版(N7+)技术于2019年开始量产,是全球集成电路制造服务领域首个应用极紫外光(EUV)于商业运转的技术。N7及N7+技术已为客户量产5G及高效能运算产品多年,并于2021年开始为客户量产消费性电子与车用电子产品。2021年年底,台积公司荣获2021年IEEE企业创新奖,肯定台积公司在7纳米制程技术上的领先地位。

台积电自2022年领先业界成功大量量产3奈米鳍式场效晶体管(3nm FinFET, N3)制程技术。N3为业界最先进的半导体逻辑制程技术,具备最佳的效能、功耗及面积(PPA),是继5nm(N5)制程技术之后的另一个全世代制程。继N3制程技术之后,台积公司推出支持更佳功耗、效能与密度的强化版N3E及N3P制程。此外,台积公司将进一步提供广泛的技术组合满足客户多样化的需求,其中包括为高效能运算应用量身打造的N3X制程、以及支持车用客户及早采用业界最先进制程技术的N3AE解决方案。N3A 技术则将在2026年完成认证并开始量产。

下图是本文的研究重点,苹果M1 ULTRA的整体结构图。

Apple M1 Ultra 的核心是苹果之前的芯片基础:也就是M1 Max。Apple 将两个 M1 Max 芯片粘合到一个芯片上,其硬件将带来的所有性能优势实现翻倍。具体来说,使用两个 M1 Max 芯片将它们粘合在一起,形成 114B 晶体管的大规模合并。

通过在单个封装上放置两个 M1 Max 芯片,Apple 几乎以各种方式将可供使用的硬件数量增加了一倍。这意味着两倍的 CPU 内核、两倍的 GPU 内核、两倍的神经引擎内核、两倍的 LPDDR5 内存通道和两倍的外设 I/O。

在 CPU 方面,这意味着 Apple 现在总共提供 20 个 CPU 内核。它由 16 个以性能为重点performance-focused的 Firestorm 核心和 4 个以效率为重点efficiency-focused的 Icestorm 核心组成。鉴于 M1 Ultra 仅针对台式机(与 M1 Max 不同),效率核心在这里并没有发挥太大的作用,因为 Apple 不需要太过于关注功耗,毕竟是台式机,没有电池焦虑。

同时,ultra将芯片上的M1 Max芯片数量增加一倍意味着内存通道数量也会增加一倍,从而使它们的整体内存带宽增加一倍。M1 Max 有 16 个 LPDDR5-6400 通道,总内存带宽为 408GB/秒,而 M1 Ultra 则翻了一番,达到 32 个 LPDDR5 通道和 将近800GB/秒的内存带宽。与 M1 Max 一样,苹果将 LPDDR5 芯片直接焊接到芯片然后封装来实现的,M1 Ultra 上总共有 8 个lpddr5芯片。

双倍的内存芯片意味着内存容量也增加了一倍。具体来说,M1 Max 的最高容量为 64GB,而 M1 Ultra 的最高容量为 128GB。实际上,这比真正的高端工作站上的内存要少,但它使苹果领先于除最高端PC台式机之外的所有产品,并且这性能对于大多数内容创作者群体来说应该足够了。

这给我们带来了M1 Ultra最有趣的方面:GPU。M1 Max 拥有 32 个 GPU 内核,已经创下了单片集成 GPU 的记录。现在,苹果已经将单芯片上的GPU内核翻了一番,达到64个GPU内核。

转载此文是出于传递更多信息目的。若来源标注错误或侵犯了您的合法权益,请与本站联系,我们将及时更正、删除、谢谢。
https://www.414w.com/read/350265.html
0
最新回复(0)