前所未有的 CPU 和 GPU 性能和效率!Arm 推出迄今速度最快的 Arm 计算平台!

2024-06-11 11:43:05 Nancy,EETOP

现在正是移动设备行业的关键时刻。越来越多的 AI 正转向在设备端,而不是在云端运行。人工智能 (AI) 技术给移动设备带来的改变令人赞叹。这不仅限于智能手机,还包括笔记本电脑、可穿戴设备和数字电视等设备。设备端 AI 再次重新定义了智能手机的“智能性”,并由此诞生了 AI 智能手机和 AI PC。

Arm 是这一切的基石。基于 Arm 架构的智能手机一直是 AI 体验的先行者。AI 时代正加速发展,复杂性随之不断提高,计算需求呈指数级增长。为提供更领先的AI体验,助力芯片开发者更轻松、快速地构建基于 Arm 架构的解决方案,并加速其产品上市进程,近日,Arm 正式推出人工智能优化的 Arm 终端计算子系统 (CSS)和新的Kleidi 软件。

据介绍, Arm 终端 CSS基于三纳米工艺,具备最新的 Armv9.2 CPU、Arm Immortalis GPU、以及最新的 CoreLink 系统互连和系统内存管理单元 (SMMU),可为旗舰系统级芯片 (SoC) 提供基础计算要素。

 微信图片_20240611114525.png

 James McNiven,Arm 终端事业部产品管理副总裁

Arm 终端事业部产品管理副总裁 James McNiven表示:“Arm 终端 CSS 的关键在于Arm目前性能最强、效率最高、功能最广泛的 CPU 集群。”

Arm Cortex-X925: 实现了 Cortex-X 系列推出以来最高的同比性能提升,该 CPU 利用了领先的三纳米工艺节点,在 3.8GHz 的时钟速率和最大缓存大小的条件下,与 2023 年旗舰智能手机的四纳米 SoC 相比,其单线程性能大幅提高 36%。而在 AI 性能方面,Cortex-X925 取得了惊人的 41% 性能提升,可显著提高如大语言模型 (LLM) 等设备端生成式 AI 的响应能力。

Arm Cortex-A725 CPU将对前沿性能的不懈追求与出色的效率相结合,该 CPU 将针对 AI 和手游用例的性能效率提高了 35%。这一改进也得益于更新后的 Arm Cortex-A520 CPU 和更新后的 DSU-120,使得采用最新 Armv9 CPU 集群的消费电子设备可提升能效和可扩展性。

Arm Immortalis-G925 GPU Arm 第三代具备光线追踪技术的 GPU,是目前Arm性能最强、效率最高的 GPU,在各款领先的手游应用中实现了 37% 的性能提升,并在多个 AI ML 网络上提升了 34% 的性能。Immortalis-G925 面向旗舰智能手机市场,而包括 Arm Mali-G725 和 Mali-G625 GPU 在内的全新高可扩展性 GPU 系列,则面向从高端手机到智能手表和 XR 可穿戴设备等广泛的消费电子设备市场。

在谈及Arm终端 CSS 如何为业界提供领先的性能时,James McNiven特别强调说:“这是我们首次在终端领域以 Arm CPUGPU 的优化设计形式提供物理实现解决方案。”

那么,物理实现具体是指什么样的产品形态呢?

 James McNiven解释说:“我们大多数的 IP 是通过 RTL 的形式进行交付,这类似于软件的形式,主要是对 IP 产品的描述。而要使 RTL 变成芯片,还需要通过 EDA 工具流,才能把这套描述转变成实际的芯片布局。所以我们指的物理实现,意即我们的设计完成了这些工具流。通过优化和工具产出物理交付。这并不是指物理的形态,它依然是近似于软件的形式。但基本上,它已显示了设计中的晶体管和线路等。RTL 形式的 IP 交付依然存在,我们只是额外提供合作伙伴物理实现形式的选项,毕竟要把 RTL 转变为物理实现需要花费一定的时间,并且需要基于对产品的全盘了解做出决策。而通过提供物理实现,我们可以帮助合作伙伴节省时间,也有助于他们实现更佳的性能和效率。”

为了让开发者能够充分利用终端 CSS 的性能优势,Arm 同步还推出 Arm Kleidi,它可以嵌入到任何软件平台中,有助于软件开发者无缝取得 Arm CPU 上的最佳性能,其包括面向 AI 工作负载的 KleidiAI 和面向计算机视觉应用的 KleidiCV。

KleidiAI 是一套面向 AI 框架开发者的计算内核,使他们能够在各种设备上轻松获得 Arm CPU 上的最佳性能,并支持 Neon、SVE2 和 SME2 等关键 Arm 架构功能。CPU 是唯一可以确保运行未来网络的计算引擎。Arm一直在将KleidiAI集成到各种 AI 框架中,包括PyTorch、Tensorflow、MediaPipe 等,旨在加速 Meta Llama 3、Phi-3 等关键模型的性能,并且还可前后兼容,致力于提供无缝的开发者体验。

KleidiCV 融入到常用的 OpenCV 库时,性能便有了显著改进。今年,Arm OpenCV.ai 合作,力求让安卓开发者可以更轻松地将 OpenCV 纳入到他们的项目中,并从 KleidiCV 带来的改进中受益。James McNiven进一步分享到: “从根本上讲,计算机视觉现在与 AI 紧密相连,但这些摄像头管线可不仅仅运行神经网络,还有很多传统的计算机视觉算法,其性能对于摄像头或社交媒体应用的顺畅运行至关重要。这就是我们构建 KleidiCV 的原因。”

智能手机一直引领着开发者进行创新并突破平台限制,驱动着对更高效性能的要求。性能出色且应用普遍的 Arm CPU 自然是在安卓设备上运行 AI 的首要目标。据介绍,目前有 70% 的第三方安卓 ML 工作负载都在 CPU 上运行。Kleidi 为开发者提供了实现 Arm CPU 最佳性能的路径,使其能够专注于下一个重大创新。

对于Arm 终端 CSS的实际市场应用表现,vivo 首席芯片规划专家夏晓菲表示:“vivo 非常注重用户体验,在 Arm CSS 的技术基础之上,我们与 Arm 的密切合作,共同推动开发者生态,使手机更流畅更好用,同时也为设备端带来了前沿的 AI 体验。我们很高兴看到 Arm 终端 CSS 所引入的新方向,以及通过 Armv9 CPU 与 Arm GPU,这套计算子系统将赋能新一代设备端生成式 AI,从而实现沉浸式的智能移动端解决方案。”

关键词: Arm 计算 快的

  • EETOP 官方微信

  • 创芯大讲堂 在线教育

  • 创芯老字号 半导体快讯

全部评论