股价大涨!英特尔发布全新数据中心及服务器处理器路线图,18A已在路上!

2023-03-30 12:56:10 EETOP
3月30日消息,英特尔举行了数据中心和人工智能投资者网络研讨会,宣布其首款专注于能效的数据中心处理器Sierra Forest 将在2024 年上半年出货,以及英特尔概述了先前有延迟状况的服务器处理器发展路线图。受此消息激励英特尔的股价在北京时间30 日清晨的大涨,收盘时股价大涨7.61%,来到每股31.52 美元的价位。

图片

英特尔透露其第一代效率XeonSierra Forest将配备令人难以置信的144个内核,从而提供比AMD竞争的128核EPYC Bergamo芯片更好的内核密度。该公司甚至在发布会上对这款芯片进行了演示。英特尔还透露了Clearwater Forest的第一个细节,这是将于2025年首次亮相的第二代效率Xeon。英特尔跳过了其20A工艺节点,为这款新芯片提供了性能更高的18A,这充分说明了它对其未来节点健康状况的信心。该公司还展示了新产品和性能演示以及路线图更新,显示该公司的Xeon正在按计划进行。

英特尔还展示了几个演示,包括针对AMD的EPYC Genea的面对面AI基准测试,该基准测试显示在两个48核芯片的正面交锋中,具有4倍的性能优势。以及显示下一代Granite Rapids Xeon在双插槽服务器中提供令人难以置信的1.5 TB / s带宽的内存吞吐量基准测试
英特尔披露的信息,包括我们将在下文中介绍的许多其他发展,是在该公司执行其大胆的目标,即在四年内交付五个新节点的过程中出现的,这一前所未有的速度将为其广泛的数据中心和人工智能组合提供动力,包括CPUGPUFPGA和高迪人工智能加速器。

英特尔在数据中心的性能领先优势已被AMD夺走,其救赎之路也因Sapphire RapidsGPU系列的延迟而受到损害。然而,该公司表示,它已经解决了其工艺节点技术的潜在问题,并修改了其芯片设计方法,以防止其下一代产品的进一步延迟。接下来让我们看看英特尔后续路线图是什么样子的。

英特尔至强 CPU 数据中心路线图
自2022年2月的最后一次更新以来,英特尔现有至强产品的路线图保持不变,并按计划进行,但它现在有一个新的加入者-- Clearwater Forest。我们将在下面进一步详细介绍该芯片
图片

图片

英特尔的数据中心路线图分为两条路线。P-Core(性能核心)型号是传统的至强数据中心处理器,其内核用于提供英特尔最快架构的全部性能。这些芯片是为顶级单核和人工智能工作负载性能而设计的。它们也会搭配加速器,就像我们在Sapphire Rapids中看到的那样。

E-Core(效率核心)阵容由仅具有较小效率核心的芯片组成,就像我们在英特尔的消费芯片上看到的那样,放弃了一些功能,如AMX和AVX-512,以提供更高的密度。这些芯片是为高能源效率、核心密度和总吞吐量而设计的,对超大规模的企业具有吸引力。英特尔的至强处理器不会有任何在同一芯片上同时具有P-内核和E-内核的型号,因此这些是具有不同使用情况的不同系列。

图片

下图是AMD之前发布的数据中心路线图:

图片


图片

我们可以看到英特尔的路线图与AMD 的数据中心路线图相比如何。

当前,AMD 去年推出的 EPYC Genoa 和今年年初推出的英特尔 Sapphire Rapids 之间的高性能大战正在激烈进行。英特尔将于今年第四季度推出其 Emerald Rapids 更新一代,该公司表示将配备更多内核和更快的时钟速率,以及注入 HBM 的 Xeon Max CPUAMD 的 5nm Genoa-X 产品定于今年晚些时候发布。明年,英特尔的下一代 Granite Rapids 将与 AMD 的 Turin 展开较量。
在效率这条路线上,AMD 的 Bergamo 通过利用 AMD 密集的 Zen 4c 内核,采用与 Sierra Forest 非常相似的core-heavy方法,但它将在今年上半年上市,而英特尔的Sierra Forrest要到2024年上半年才会上市。AMD尚未透露第二代e-core何时上市,但英特尔已经在2025年的路线图上列出了Clearwater Forest。 
英特尔 E-Core Xeon CPU:Sierra Forest 和 Clearwater Forest

图片


图片

英特尔的 e-core 路线图从 144 核 Sierra Forest 开始,它将在单个双路服务器中提供 256 个内核。第五代 Xeon Sierra Forest 的 144 个内核在内核数方面也超过了 AMD 的 128 核 EPYC Bergamo,但在线程数方面可能并不领先——英特尔面向消费市场的 e-core是单线程的,但该公司尚未透露数据中心的e-core是否支持超线程。相比之下,AMD 表示 128 核 Bergamo 是超线程的,因此每个插槽总共提供 256 个线程。

我们也不知道英特尔AMD的密集型内核(dense cores)的具体性能,所以在芯片进入市场之前,之前我们无法知道这些芯片的性能。然而,我们确实知道英特尔的e-core不支持它的p-core所支持的一些ISA;英特尔省略了AVX-512和AMX以确保最大的密度,而AMD的Bergamo Zen 4c内核支持与其标准内核相同的功能。

不过,英特尔的Sierra Forest显然将在2024年上半年步入正轨:Mountain Stream系统的图片已经在网上泄露,包括你可以在下面看到的巨大的LGA7529插座的图片。这个插座将可容纳e-core Sierra Forest和p-core Granite Rapids处理器

图片

这表明 Sierra Forest 平台已经与英特尔的合作伙伴合作,该公司还告诉我们,它已经为芯片供电,并启动了操作系统。芯片是“Intel 3”工艺节点的主要载体,因此成功至关重要。英特尔有足够的信心,它已经向客户提供了芯片样品,并在活动中演示了所有 144 个内核的运行情况。英特尔最初将 e-core Xeon 型号定位于特定类型的云优化工作负载,但预计一旦上市,它们将被用于更广泛的用例。

英特尔还首次公布了Clearwater Forest。英特尔没有透露 2025 年发布时间之外的更多细节,但确实表示它将为芯片使用 18A 工艺,而不是半年前到达的 20A 工艺节点。这将是第一款采用 18A 工艺的至强芯片
18A节点是英特尔的第二代"Angstrom "节点,类似于1.8纳米。英特尔的第一代Angstrom节点,即20A,将采用RibbonFET,一种18A节点是英特尔的第二代"Angstrom "节点,类似于1.8纳米。英特尔的第一代Angstrom节点,即20A,将采用RibbonFET,一种全门(GAA)堆叠式纳米片晶体管技术,以及英特尔的PowerVia背面供电 (BSP) 技术。英特尔将用于Clearwater Forest的18A工艺将比20A工艺的每瓦性能提高10%,同时还有其他改进,所以英特尔选择了这个节点,因为它是该公司在Clearwater推出的时间范围内所能提供的最好的工艺。
18A工艺具有该行业打算在未来采用的所有前沿技术,如GAA和BSP,因此它代表了一个令人难以置信的先进节点。英特尔声称,18A节点是其获得明显领先于其竞争对手台积电AMD的工艺的地方,该公司决定跳过20A,为Xeon转向18A,这无疑充分说明了其对该节点健康的信心。英特尔还告诉我们,我们不会看到在20A上制造的至强型号。 

Intel P-Core Xeon CPU:Emerald Rapids 和 Granite Rapids

英特尔的下一代 Emerald Rapids 计划于今年第四季度发布,鉴于 Sapphire Rapids 几个月前推出,这是一个压缩的时间框架。Emerald将与Sapphire Rapids的平台相同,这可以减少客户的验证时间,而且主要是对Sapphire Rapids的更新。然而,英特尔表示,它将提供更快的性能,更好的电源效率,更重要的是,它将提供更多的内核。英特尔表示,他们已经在内部开发Emerald Rapids芯片,而且验证工作正在按预期进行,该芯片已达到或超过其性能和功率目标。
紧随Sierra Forest,Granite Rapids将于2024年推出。英特尔将在“Intel 3”工艺上制造这款芯片,这是“Intel 4”工艺的大幅改进版本,后者缺乏至强所需的高密度库。这是intel 3上的首款p-core Xeon,比Emerald Rapids拥有更多的内核,DDR5-8800内存拥有更高的内存带宽,以及其他未指明的I/O创新。
值得注意的是,第一个配备 e-core的系列 Sierra Forest 将与 p-core的 Granite Rapids 插槽兼容;他们甚至共享相同的 BIOS 和软件。英特尔通过将这些芯片转移到基于块的设计来实现这一点,中央 I/O 块处理内存和其他连接功能,就像我们在 AMD 的 EPYC 处理器上看到的那样。这将核心和非核心功能分开,因此英特尔通过使用不同类型的计算块来创建不同的处理器类型。这提供了多种好处,例如能够使用相同的系统将更多线程重量与 e-core打包在一起,但在与 p-core模型相同的 TDP 范围内。
在其网络研讨会期间,英特尔演示了双插槽 Granite Rapids,可提供惊人的 1.5 TB/s DDR5 内存带宽;声称比现有服务器内存提高了 80% 的峰值带宽。从长远来看,Granite Rapids 提供的吞吐量高于 Nvidia 的 960 GB/s Grace CPU 超级芯片,专为内存带宽设计,也高于 AMD 的双路Genoa,其理论峰值为 920 GB/s。英特尔使用 DDR5-8800 多路复用器组合列 (MCR) DRAM 实现了这一壮举,这是一种其发明的新型带宽优化内存。英特尔已经与 SK 海力士一起推出了这款内存

图片


图片


图片

英特尔表示,Granite Rapids的开发周期比Sapphire Rapids要长得多。Granite Rapids 正在实现所有工程里程碑,并且迈出了健康的第一步。它现在已经在向客户提供样品。
英特尔的数据中心和人工智能更新的重点是Xeon,但该公司的投资组合还包括其他产品系列,如FPGAGPU和特制的加速器。英特尔在定制硅领域有很多竞争对手,比如谷歌的TPU和Argos视频编码芯片(还有很多其他公司),所以Gaudi加速器和FPGA是其产品组合的重要组成部分。英特尔表示今年将推出15款新的FPGA,这是其FPGA部门的记录。我们还没有听到Gaudi芯片的任何重大信息,但英特尔确实在继续开发其产品系列,并且在路线图上有一个下一代加速器。Gaudi 2号人工智能加速器正在发货,而Gaudi 3号已经被录入。
英特尔还表示其 Artic Sound 和 Ponte Vecchio GPU 正在出货,但我们并不知道后者在一般市场上有售——相反,第一批 Ponte Vecchio 型号似乎正用于经常延迟的 Aurora 超级计算机。
英特尔最近更新了GPU 路线图,取消了即将推出的 Rialto Bridge 系列数据中心 Max GPU,并将数据中心 GPU 的发布周期改为两年。该公司的下一个数据中心 GPU 产品将以Falcon Shores的形式出现  基于小芯片的混合芯片,但这些芯片要到 2025 年才会到货。该公司还降低了对 Falcon Shores 的期望,称它们现在将作为纯 GPU 架构出现,并且不会像最初预期的那样包括 CPU 内核选项— 那些“XPU”模型现在没有预计的发布日期。
英特尔预测,AI 工作负载将继续主要在 CPU 上运行,所有模型中的 60%,主要是中小型模型,都在 CPU 上运行。同时,大型模型将包含大约 40% 的工作负载,并在 GPU 和其他定制加速器上运行。
英特尔还致力于为 AI 构建可与 Nvidia 的 CUDA 相媲美的软件生态系统。这还包括采用端到端的方法,在堆栈的每个点都包含芯片、软件、安全性、机密性和信任机制。
其他竞争
英特尔不乏竞争对手,Arm 生态系统在数据中心的应用越来越普遍,亚马逊的Graviton 2、腾讯的倚天、微软 Azure 中的Ampere Altra、甲骨文云和谷歌云,Nvidia与Grace CPU、富士通、阿里巴巴、华为的鲲鹏,以及谷歌的Maple 和 Cypress,等等。甚至还有两台使用Arm Neoverse V1 芯片百亿亿级超级计算机部署:SiPearl“Rhea ”和 ETRI K-AB21。

这意味着英特尔AMD 一样,需要采用更注重能效和核心密度的优化芯片,以缓解向 Arm 迁移和 CSP 的压力。


关键词: 英特尔 芯片 半导体

  • EETOP 官方微信

  • 创芯大讲堂 在线教育

  • 创芯老字号 半导体快讯

全部评论