快科技夏威夷现场报道——
2024年10月22日,一年一度的骁龙技术峰会上,高通如约带来了新一代旗舰级移动平台,但不叫骁龙8 Gen4,而是改名为全新的“骁龙8 Elite”,中文名“骁龙8至尊版”,代表了一个新的开端。
之所以如此命名,主要是因为它和去年发布的PC处理器骁龙X Elite一样,也用上了高通自研的全新Oryon CPU架构。
这一架构今年还会延伸到汽车端,构成手机、PC、汽车三位一体的“Elite全明星阵容”。
高通CEO安蒙
回顾高通骁龙处理器的命名变迁,尤其是旗舰平台名字的变化,是相当有趣的。
2006-2008年,高通手机处理器还不叫骁龙,只是传统的字母加数字编号,包括QSC6000系列、MSM6000/7000系列,可以说当时整个行业还处于拓荒时代,也缺乏品牌意识。
2008年末的QSD8250,是第一款冠以骁龙品牌的产品,之后骁龙S1、S2、S3、S4逐步迭代,越发成熟,逐步成为行业领导。
2013年开始,骁龙800、骁龙700、骁龙600、骁龙400、骁龙200四大系列逐渐完整覆盖了从旗舰到入门级的各个领域,这也是高通真正君临天下的阶段。
2021年的骁龙888一改传统编号序列,非常吉利,特别讨好蓬勃发展的中国手机市场。
2022年开始了全新的“骁龙x Gen x”阶段,从高到低分成骁龙8/7/6/4四大系列,大部分陆续进化了三代,但并非同步更新。
直到今天,全新的骁龙8至尊版登场了!
【CPU:史上最高频 全大核时代全面带来】
一如既往,骁龙8至尊版也不仅仅是一个单纯的SoC处理器,更是一套完整的移动平台,其中包含多达超过40个不同组件,全部来自高通,还包括射频、收发器、电源管理、超声波指纹识别、移动连接等等,是一个全面的解决方案。
它采用台积电第二代N3E 3nm工艺制造,也就是和苹果A18系列、联发科天玑9400相同的N3E,整体能效提升27%。
这套平台的核心基石就是全新打造的第二代自研Oryon CPU架构,专门面向智能手机定制,可为旗舰手机带来最佳的性能和能效,对比第三代骁龙8单核性能提升45%、多核性能提升45%、Iometer上网性能提升62%、能效提升45%。
同时,骁龙8至尊版在GPU图形、AI、图像处理等各方面也都有重大创新,综合性能、技术实现了显著提升。
骁龙8至尊版配备了两个基于Oryon架构的“超级核心”(Prime),主频高达4.32GHz,经过优化之后可以运行最为密集的应用,并保持出色能效。
这也创下了手机处理器频率的新纪录,即便放在桌面PC上也不算低。
与之搭配的是六个“性能核心”(Performance Core),主频也高达3.53GHz,已经非常接近天玑9400超大核的3.62GHz。
是的,骁龙8至尊版改成了2个超大核、6个大核的组合,几代下来逐步减少直至完全取消了能效核(小核)。
回顾历史,骁龙8 Gen1配备的是1超3大4小的CPU核心组合,骁龙8 Gen2改成了1超4大3小,骁龙8 Gen3升级为1超5大2小,每代减少1个小核心、增加1个大核心。
如今,小核终于退出了历史舞台,全大核时代真正到来。
事实上,ARM多年前就基本放弃了对小核心的更新迭代,A510、A55间隔了长达三年,A520又是一次小幅升级。
显然,大家都逐渐意识到,曾经的big.LITTLE大小核理念已经不再适应这个时代,架构、技术、工艺的进步使得小核逐渐成为拖后腿的存在,全大核无论性能还是能效都更胜一筹。
另外在延迟方面,从核心到一级缓存不超过1纳秒,从一级缓存到二级缓存为5纳秒,从二级缓存到内存为12纳秒。
Oryon CPU的缓存也得到了重大改进,上代有12MB三级缓存,所有核心共享。
骁龙8至尊版的二级缓存容量翻番为24MB,同样是行业最先进的,而且分成两部分,两个超大核独享12MB,六个性能核分享12MB。
同时,一级缓存也全面增加,每个超大核192KB,每个性能核128KB,总计1152KB,超过了1MB。
此外,考虑生成式AI极其依赖于内存,骁龙8至尊版配备了最先进的LPDDR5X内存,实际频率5333MHz,等效于10.7GHz。
按照高通的说法,骁龙8至尊版的CPU性能对比上代可提升最多达50%,同时能效提升最多达45%!
高通强调,得益于第二代Oryon CPU的微架构改善,骁龙8至尊版可以带来出色的用户体验,包括更快的应用启动、无缝的多任务处理,以及先进的生成式AI特性。
【GPU:全新切片设计】
高通骁龙一向拥有行业最强的GPU图形核心,甚至经常被调侃“买GPU送CPU”。
不过历史上,高通很少介绍GPU的具体架构设计,一般只是粗略地宣称性能、能效提升多少多少。
这次,不太一样。
骁龙8至尊版的Adreno GPU首次引入了全新的切片(Slice)设计,分为三组,频率达都高达1.1GHz,接受指令处理器的统一调度。
高通表示,这种切片式GPU设计面向现代图形负载处理而优化,提供了基于独立着色处理器的内核,以实现更好的任务分配、并发性能,可以实现性能提升40%,同时功耗降低40%。
其中,光线追踪的性能提升可达35%。
末端还有多达12MB图形缓存,可以大大减少将数据转移至内存进行处理的几率,从而显著降低延迟。
遗憾的是,切片内部结构依然未公开,猜测每个切片相对独立运行,内部又包含计算核心、采样器、几何单元、光栅单元、载入存储单元、渲染后端、缓存等不同单元模块。
这种设计理念其实和NVIDIA、AMD、Intel GPU都有些类似,比如NVIDIA一直分为GPC/TPC/SM的层级关系,AMD的计算单元(CU),Intel则是渲染切片(Render Slice)。
游戏方面,骁龙游戏工作室通过与Feral Interactive的深度持续合作,共同开发并即将推出代手游《超级房车赛:传奇》(Grid Legends)。
它可以在骁龙8至尊版上以2倍帧率运行,画面惊艳。
它还会独家搭载高通自适应性能引擎4.0,通过优化游戏线程策略,带来更高的能效,延长续航。
骁龙8至尊版还首次支持在移动端运行虚幻引擎5 Nanite解决方案,可在手游中渲染出电影级的3D环境,而且这是高通骁龙平台的独享功能。
Nanite是虚幻引擎5全新引入的虚拟几何体系统(Virtualized Geometry System),采用全新的内部网格体格式和渲染技术,可以渲染出像素级别的细节,以及海量的物体对象。
同时,它非常智能,可以只处理并渲染人眼能够观察到的细节,并采用高度压缩的数据格式,从而大大减轻渲染压力。
【AI:越来越像真人了 还不需要联网】
端侧生成式AI无疑是当下手机处理器乃至PC处理器最激烈的战场,进化迭代速度也非常快,不断延伸覆盖更多领域、更多玩法。
去年的第三代骁龙8,就带来了全球首个端侧Stable Diffusion,而且运行速度是最快的,而高通并未满足于此。
生成式AI最初包括文字、语音、图像等几个部分,更多模态不断加入其中,可以让智能助手真正听你所听、见你所见,带来更直观、更出色的体验。
为此,在骁龙8至尊版针对包含CPU、GPU、NPU等各个模块的高通AI引擎进行了大幅升级。
迄今最好的移动端CPU架构,也就是第二代Oryon,负责处理时延敏感型的AI任务,并帮助将AI任务分配到其他更合适的模块上,比如传感器中枢。
高通AI引擎中的其他核心,可以各自发挥所长,分别负责专门的AI任务。
高通Hexagon NPU也是高通AI引擎的核心所在,骁龙8至尊版进行了一系列提升。
首先,标量和向量加速器都增加了,现在向量加速器有6个核心,标量加速器则有8个核心,并且所有核心的吞吐能力都更强了。
再加上强大的Tensor张量加速器,整体运算能力大大提升,无论是超长文本支持,还是大模型加速,都可以轻松应对。
高通称,骁龙8至尊版NPU的性能、能效都提升了多达45%。
两个Micro NPU,加上两个ISP、DSP、内存,共同组成了高通传感器中枢,整体AI性能提升了多达60%,AI推理速度提升了45%。
高通还引入了并发特性,AI和计算视觉负载可以在NPU内存中共存,从而增加了灵活性,并进一步提高了性能。
另外,NPU、ISP等不同模块之间的直连通道也进行了重构,通信效率更高。
得益于如此强大的AI引擎,骁龙8至尊版可以完全在终端侧离线运行个性化、多模态的AI助手。
这种多模态AI助手更加智能,因为它背后有很多模型在运行,包括LMM(多模态)、LLM(语言)、LVM(视觉)、ASR(语音)等等。
现在通过LMM多模态模型,AI可以直接理解语音,节省了额外的步骤。
再加上NPU新增的加速器核心、升级的多模态模型,以及软件的不断优化,可以实现更快的AI处理速度。
这种技术进步带给用户最直观、最大差别的感受,就是语音交互更加灵敏,几乎感觉不到延迟,就像和真人交谈一样。
此外,骁龙8至尊版还提升了输入时可接受的token数量,可以上传更大的文档、音频和图像,从而让AI能够基于更丰富的参考资料,更深入、更贴切地了解用户想表达的问题,并进行更精准的回答。
除了文字和语音互动,AI助手首次可以完全在终端侧,通过摄像头看到用户所看到的内容。
如此一来,用户可以通过相机的实时模式,与AI助手进行互动,AI助手可以实时理解并回答用户的问题。
比如用户直接把摄像头对准收据,AI助手就能理解收据上的内容,然后通过推理来提供答案,比如帮你计算应该付多少钱、有几个朋友如何分担账单。
此外,AI助手能够量身定做,让手机更了解你的个人特殊需求,实现个性化。
手机上的传感器和摄像头也可以根据用户的喜好,在端侧本地创建属于个人的神经网络,让AI助手更理解用户的需求。
【影像:本地AI让照片更真实、视频也有魔法消除】
第三代骁龙8凭借认知三ISP,就已经支持强大的终端侧AI影像功能,比如AI扩图可以扩充照片背景,AI超级分辨率可以提升照片清晰度和细节,AI语义分割可以自动识别画面中的不同物体并进行专门增强。
骁龙8至尊版又打造了一个全新的AI ISP,从底层与Hexagon NPU协作,最显著的提升就是Hexagon与内存之间的超快直连,从而能够直接在终端侧处理AI特性。
凭借这一直连技术,NPU有史以来第一次能够直接访问ISP上的原始RAW传感器数据,通过深度集成,实现对4K60fps视频拍摄进行实时AI辅助增强。
同时,更多的处理管线转移到了RAW域,进一步提升准确性和灵活性,同时零延迟快门吞吐量提升35%,每秒可以处理多达43亿像素。
现在,骁龙8至尊版支持三个4800万像素图像传感器同时进行30fps视频拍摄。
通过在4K60fps拍摄中实时调用NPU,骁龙8至尊版将先进的AI算法直接引入图像和视频处理管线的核心,这一技术叫做“Insight AI”。
它是一系列AI算法的合集,能够提升用户的日常拍摄体验。
其中之一是无限语义分割(Limitless Segmentation),支持对图片进行超过250层的语义识别和分割,可以对照片的所有部分进行专门的调整和改善。
在完成图像语义分割后,骁龙8至尊版可以利用实时皮肤和天空算法,并借助NPU的算力,识别光线条件,并进行修图。
因此,即便是在昏暗、复杂的光线条件下,也能拍出自然的皮肤和天空色调,还原真实的人物与世界。
还有实时AI补光技术,比如在视频通话或直播时存在严重背光,就可以添加一个虚拟的可移动光源,完美映射脸部轮廓,拍出更自然、更真实的人脸。
再比如视频魔法消除。
一如照片消除功能,骁龙8至尊版在视频上也可以做到,只需大致选择需要消除的对象,就可以利用AI轻松完成。
目前,该功能支持30fps视频。
AI宠物套件,基于NPU,针对宠物快速移动造成拍摄模糊,可以快速修正,让照片更加锐利、清晰。
关键是,这些功能都是在本地端侧完成的,无需上传云端,既能提升速度,也有利于保护隐私。
【连接:5G、Wi-Fi创下多个世界第一】
骁龙8至尊版还是全球首个支持AI增强5G和Wi-Fi连接的移动平台,集成骁龙X80 5G基带及射频系统,也是第二代5G AI处理器。
骁龙80基带实现了多个行业第一:首个支持下行6载波聚合、首个支持6个Rx接收器路径、首个支持AI/5G-A融合、首个支持AI多天线管理、首个支持CPE AI增强通信、首个支持NB-NTN(非地面网络)卫星通信。
相信随着骁龙8至尊版的上市,支持卫星直连通信的手机会迎来一波爆发,说不定会成为中高端手机的标配。
FastConnect 7900移动连接系统支持AI增强的Wi-Fi 7。
它是首个单芯片集成Wi-Fi、蓝牙、UWB的方案,首个支持320MHz通道高频并发HBS多连接,峰值速度号称是竞品的2.4倍。
此外,通过高通XPAN,它可以支持更高级的24-bit、96kHz无损音频。
华硕、荣耀、iQOO、摩托罗拉、努比亚、一加、OPPO、红魔、Redmi、realme、三星、vivo、小米、中兴等终端厂商,都将陆续推出基于骁龙8至尊版的新机。
最后,一图看懂骁龙8至尊版!