骁龙8至尊版混合架构、成本揭秘: 更贵是不可避免的!

驱动之家2024-10-25 10:30:31  133

快科技10月25日消息,近日,高通发布了新一代旗舰移动平台骁龙8至尊版,首次采用专为智能手机设计的第二代自研Oryon CPU架构,同时在GPU、NPU、影像、连接等各方面都实现了飞跃,各家手机厂商的终端产品也即将纷纷登场。

发布会后,快科技采访了高通的多位技术高管,对于骁龙8至尊版的架构设计、技术特性有了更深入的了解。

CPU架构方面,骁龙8至尊版配备了两个4.32GHz的超级内核、六个3.53GHz的性能内核,各自搭配12MB二级缓存。

高通表示,骁龙8至尊版在微架构上实现了全方位的升级,主要有以下三点:

第一,每个CPU丛集都配备了迄今最大的缓存;第二,引入了全新的数据时序预取器(data-cache pre-fetcher);第三,引入了全新的性能内核设计。

说到性能内核、超级内核之间的区别,它们在微架构层面上确实有很多差异,尤其是性能内核为了降低功耗,做了大量的微架构调整。

两类核心是不同的异构计算核心,但在SoC和总线架构中是紧密相连的,以确保高速的核间通信,同时二级缓存的大小加倍,以确保紧密同步。

同时,为了能让超级内核、性能内核既保证能效,又不妥协性能,高通在设计之初就充分考虑到了芯片的各种物理限制,包括芯片架构、手机主板架构等。

不过,高通没有也不会公布骁龙8至尊版的晶体管数量,未来产品也不考虑,这和苹果、联发科的做法不同——A18系列今年没有公布大概率是因为“开倒车”而不好意思。

高通强调,晶体管的数量不能直接代表性能表现,并不是晶体管越多,芯片的性能就越好,我们要看的是如何实现最佳的性能和能效。

需要强调的是,二级缓存对能效的表现至关重要,所以骁龙8至尊版为每一个CPU丛集都配备了前所未有的12MB二级缓存,总计达24MB,这种紧密耦合的专用缓存也是移动领域迄今最大的。

总体上,高通做了巨大的投入,有效降低了骁龙8至尊版的时延,从第三代骁龙8的12ns大幅降低至5ns,这会显著提升高性能游戏、网页浏览等各种使用体验。

正是得益于高通在这些领域的深厚经验,配合出色的软件架构,才做出了这款性能和能效兼得的CPU。

说到网页浏览性能,可以通过Speedometer测试最直观地反映出来,实测骁龙8至尊版的成绩为26.0,酷睿Ultra 200V系列则只有17.0。

同时,骁龙8至尊版对比前代骁龙8 Gen3更是提升了多达62%,高通也有信心超越任何安卓平台竞品。

要知道,诸如微信、滴滴、美团等很多主流应用的底层功能,其实都是基于Web应用的,因此,提升网页浏览性能,对于增强整体用户体验至关重要,骁龙8至尊版将让用户感受到前所未有的流畅使用体验。

高通强调,之所以能在Speedometer上取得如此显著的速度提升,关键在于骁龙8至尊版采用了定制架构的CPU(Oryon CPU高达192KB的一级缓存就非常有帮助),这是公版架构无法相媲美的,而纵观全球,目前仅有两家公司拥有定制CPU。

同时,骁龙8至尊版基于用户真实需求和用例为基础,进行了专门的网页浏览性能优化。

除了CPU部分的超大缓存,GPU部分也设置了12MB的专用缓存,它可以存储部分画面帧,以此降低带宽占用,从而提高能效。

值得一提的是,骁龙8至尊版首次在移动端运行了虚幻引擎5的Nanite解决方案,可以实现虚拟纹理绘制(virtual texturing)、阴影贴图(shadow maps)等功能。

在一些大型世界游戏中,通过阴影贴图功能,可以实现高达16K甚至更高分辨率的画面,并且画面是分区渲染的,单次只渲染所在场景中的部分画面,以实现更精美的、更高分辨率的画面质感。

内存方面,骁龙8至尊版也支持到了行业最高的LPDDR5X 5.3GHz (等效于10.7GHz),与联发科天玑9400相同。

高通解释说,QRD(高通参考设计)在内存方面其实有两个版本,一个是4.8GHz(等效于9.6GHz),另一个是5.3GHz(等效于10.7GHz),基准测试在两个版本上运行的差异并不是很明显。

目前来看,高通预计5.3GHz内存在短期内的采用率会相对低,因为它相对更新,成本也更高,到了明年可能会有所不同。

AI方面,骁龙8至尊版大幅提升了NPU的性能和AI的运用,比如NPU可以在后台灵活调度大语言模型的推理。

这正是Hexagon NPU架构设计的初衷,其不仅性能卓越,而且能效显著提升,对比上代每瓦性能提升了多达45%。

同时,新的架构可以针对广泛的应用场景,提供相应的能效优化,当然包括后台待命,通过轻触屏幕或语音唤醒,迅速调用强大的AI功能。

针对AI大模型的快速进化,高通也有充分的考虑,尤其是内存占用方面。

比如Llama和百川的70亿参数大模型版,即使压缩到16位整数精度进行处理,也会占用13GB左右的内存,而通过高通的软件和相应的解决方案,将内存需求大幅降至约3.5GB。

高通预计,未来对更有效压缩技术的需求会日益增长,同时会出现越来越多的介于10亿至40亿参数之间的达模型。

五次,高通会从硬件和AI软件栈两个方面持续投入,一方面提升压缩模型的性能表现,实现更小的内存占用,另一方面进一步降低模型精度,应对内存资源争抢,并降低成本。

最后说一下成本问题,行业传闻骁龙8至尊版的价格又要贵很多,给终端厂商带来了不小的压力。

对此问题,高通解释说,任何半导体行业从业者都清楚的是,这个行业的经济模式已经出现了根本性的变化。

大约十年前,同样的设计和晶体管规模过渡到新一代制程工艺后,会变得更加便宜,因此通过制程迭代工艺,能够显著节省成本,继而用来开发新的技术特性和创新。

但是现在,晶体管和晶圆代工厂的经济模式出现了转变之后,同样的设计升级到下一代工艺制程,成本会大幅增加,这为半导体行业的各个领域都带来了根本性的变化。

高通表示,关于成本问题,一直在与客户保持着紧密的沟通,尤其是中国客户。

为此,高通开展了很多工作,其中一点是通过打造丰富的产品层级和产品组合,满足不同的市场需求。

比如面向有着最顶级旗舰定位和性能需求的产品层级,高通提供最高端的解决方案、最卓越的体验。

面向其他价格段市场和没有那么高预算的消费者,高通会跨越产品层级,将旗舰体验下放,为更多消费者提供集成众多旗舰平台核心技术、同时价格更经济实惠的解决方案。

转载此文是出于传递更多信息目的。若来源标注错误或侵犯了您的合法权益,请与本站联系,我们将及时更正、删除、谢谢。
https://www.414w.com/read/1407605.html
0
随机主题
003赛事预测: 乌德勒支VS鹿特丹斯巴达比赛看点解析美锦能源下跌5.99%, 报5.49元/股山西: 科学预防“干热风” 确保小麦丰产丰收“17筑梦·更有爱” 建德这场青年人才交友派对甜度超标!多功能跨界自动挡弯梁ADV——力腾190, 正式命名为军刀并开始盲定曝森林北爱上汪峰损失大, 活动被取消, 阳光清纯遭质疑, 但不后悔参展机构增加2419家! 几组数据看深圳文博会蓬勃生机迪马尔科致谢: 永远不会忘记你所做的一切, 张康阳回复: 爱你2024年暑期档,《封神2》缺席,《哪吒2》来袭,成龙对决谢霆锋乌军7天阵亡近1万人, 俄军杀入恰索夫亚尔城内, 所到之处全炸平吞噬星空大改, 界中界血腥混战, 罗峰抱大腿, 雾大人杀疯了1962年投资1000万美元,真实装备与军人协助拍摄,被封为二战电影封神之作!赵明、姜海荣晒荣耀200系列实拍人像, 普通用户也能拍出专业感关于跑车这方面,每个人都有不同想法,我只是个人建议,仅供参考杨金发: 5-22晚间黄金持有空和继续布局做空下跌!武则天已经打算还政李唐, 为何张柬之等人还要发动神龙政变?关于卖好纯电车, 给理想汽车几个不成熟的建议巴基斯坦经贸资讯-5月21日贾跃亭: 孤独凄凉, 想回家!《庆余年2》开始发盒饭, 范无救和赖御史接连下线, 范闲落泪!最佳阵容8大遗珠: 马克西领衔, 福克斯场均26+5, 三位状元被低估
最新回复(0)