山海人工智能信息网

补齐拼图后,高通终于猛推“三端归一”

导读 当地时间10月20日下午,记者抵达美国夏威夷茂宜岛,参加10月21日开启的高通骁龙峰会。在峰会的前两个主题日,高通在智能手机和汽车平台拿出...
当地时间10月20日下午,记者抵达美国夏威夷茂宜岛,参加10月21日开启的高通骁龙峰会。在峰会的前两个主题日,高通在智能手机和汽车平台拿出了三款骁龙Elite(至尊版)新品。其中最引人关注的,莫过于高通自研CPU架构Oryon的“开枝散叶”。在去年首次应用于高通AI PC骁龙X Elite之后,Oryon CPU走进了此次发布的一款手机平台和两款汽车平台。加上高通自研的Adreno GPU和Hexagon NPU,高通补齐了自研SoC的最后一块拼图,也统一了PC、手机、汽车三条产品线的架构。

  完成四年前的规划 第二代Oryon CPU亮相

  本次骁龙峰会上,高通公司总裁兼CEO克里斯蒂亚诺·安蒙(Cristiano Amon)没有参与三款新品的发布,但他花了相当的篇幅发布贯穿三款新品的主线:第二代Oryon CPU。

1729768982196982.png

安蒙用一张图总结一年来高通在Oryon CPU上的成果

  Oryon CPU的研发,可以追溯到2021年高通斥资14亿美元收购CPU设计企业Nuvia。虽然Nuvia当时仅仅创立两年,创始团队却拥有在苹果、谷歌等企业担任架构师的经验,在公司成立一年后就推出了自研CPU架构“Phoenix”,以更低功耗实现了显著高于竞品的峰值性能。

  在2021年3月完成收购后,安蒙就表示高通计划将下一代 CPU 集成到智能手机、PC、数字驾驶舱、ADAS系统等产品线。而这一愿景,在之后三年的骁龙峰会上,一步一步走进现实。

  在2022年骁龙峰会,高通公布了下一代名为“Oryon”的CPU核心设计,但并未展现具体细节。在2023年骁龙峰会,Oryon CPU正式亮相,采用12个3.8GHz高性能核心,单核性能跑分领先竞品的同时,达到竞品峰值性能所需的功耗减少30%~70%,率先搭载于同期发布的新款PC骁龙X Elite。

  本次骁龙峰会发布的第二代Oryon CPU,性能相比第一代提升了30%,同等性能下功耗降低了57%。在单核、多核以及达到相同峰值性能所需的功耗等参数领先竞品的同时,Oryon CPU在设备不插电的情况下,性能不会衰减。这一特点使Oryon CPU在不插电模式下,处理速度比竞品CPU快134%,也使骁龙X Elite在不插电模式下相比竞品处理器快90%。同时,由于第二代Oryon CPU将首次搭载到手机平台,因此相比竞品,Oryon CPU能够将性能和能效的提升兑现在更小的封装中。

  在生成式AI的浪潮袭来之后,围绕算力的竞争更加白热化,头部处理器厂商都不约而同地缩短了产品发布周期,从过去的2年一迭代走向1年一迭代。高通对于Oryon CPU似乎也有此打算。安蒙表示,对于下一代Oryon CPU,他已经看到了一些高通工程团队所作的工作并为此感到振奋,请关注明年骁龙峰会的发布。

  面向手机、汽车要求 进一步定制

  自研CPU架构的利好,就是能够根据不同产品线的需求,对CPU进行微架构层面的调优和定制。“我们从头开始打造IP,Oryon CPU正是我们自研SoC的最后一块拼图。这种方式让我们拥有对CPU的完全自主权,能够直接定义和定制所有处理通道的配置,不再依赖外部(第三方)。”高通技术公司产品管理总监Manju Varma表示。

  由于第二代Oryon CPU从PC平台走进手机平台,因此高通CPU设计团队首先面向移动平台进行架构调整。高通工程副总裁、Oryon CPU设计负责人Gerard Williams(曾为Nuvia创始人)在回顾团队这一年的工作时表示,他们大幅提升了Oryon CPU的时钟速度,同时降低功耗,这是推动Oryon CPU走进移动终端的核心驱动力。同时,为了适应移动设备更小型的体积和电池,团队也在降低减少面积上下了功夫。

  具体来看,骁龙8至尊版搭载的Oryon CPU采用了面向移动端设计的全新微架构。在核心设计上采用了2颗超级内核+6颗性能核心,不再采用能效核。超级内核引入全新的数据时序预取器,基于模式检测预取所有缓存行(CPU缓存存储数据的基本单位),并预测特定使用情况下哪些缓存行会被使用,以实现更高的频率(4.32GH)和性能,并提升在紧凑产品外形设计下的能效表现。6个性能核都经过调优,在保证能效的前提下运行密集型的应用程序。

  对于不再使用能效核,高通的解释是,用乱序性能内核取代能效核,能够提供更好的性能和功耗组合,并配合超级内核实现更高的处理速度。

1729768999147352.png

高通技术公司产品管理总监Manju Varma介绍骁龙8至尊版CPU设计

  内存同样是提升CPU处理速度的关键。高通为每个CPU丛集配置了24MB专用缓存。通常,增加一级缓存或二级缓存都会导致时延的增加。因此,高通在提升一级缓存容量的同时,采用缓存一致性协议,将时延保持在1纳秒内。同时,为了解决二级缓存扩容造成的时延,高通设计了与CPU内核同步的二级缓存,以降低时延和功耗。考虑到生成式AI高度依赖内存,骁龙8至尊版配备了目前最高速的LPDDR5内存。这样的微架构和内存系统升级,能够为用户带来更快的应用启动速度、更流畅的多任务处理以及生成式AI功能。

  而骁龙座舱和RIDE至尊版使用的Oryon CPU,围绕车用平台进行了三方面的提升。一是处理能力较前一代车规平台的CPU提升了三倍。二是强化了安全功能。三是面向汽车应用设计的适应性架构,能够支持先进舱驾功能和自动驾驶功能,也能够在同一块SoC上同时支持舱、驾功能,这无疑契合了当前舱驾一体的融合趋势。

  “在汽车平台,Oryon CPU的定制化聚焦安全系数,以确保汽车在智能驾驶等场景下的安全性,让GPU、NPU、DSP等IP模块在安全的基础上运行。”高通技术公司汽车、行业解决方案和云事业群总经理Nakul Duggal向记者表示。

  当然,相比平台本身,手机、PC和汽车厂商能够结合最新能力设计出哪些功能,或许是消费者更为关注的点,而这需要高通与OEM及终端、车企继续加深合作,并通过高通AI Hub等模型库,为广大应用开发者提供更加趁手的工具和平台。

  (文章转载自中国电子报 作者张心怡)