英特尔首款支持硬核PCIe Gen4 及超路径互连(UPI)FPGA量产出货!

2019-09-25 14:52:23 EETOP



近日,英特尔宣布出货全新英特尔 Stratix 10 DX FPGA (现场可编程逻辑门阵列)。这款新的FPGA 采用的是14纳米制程技术,支持英特尔超路径互连(UPI)和PCI-Express (PCIe) Gen4x16,同时还支持英特尔®傲腾™技术一个新控制器来提供灵活高性能加速,拥有三大主要能力,即高带宽、低延时和内存能力。英特尔不仅仅为客户提供硬件本身,同时还包括一系列开发工具及API。目前该产品已经可以进行量产。早在3月前,英特尔就已经出货工程级样品设备与开发套件给全球客户,VMware 是众多早期使用计划参与者之一,中国客户也参与其中。
 

 

Stratix® 10 DX FPGA采用三种激动人心的新技术来提升服务器性能, 跟随英特尔Tom Schulte,一起走进英特尔实验室观看这三种新技术的演示。 

 
为深入了解Stratix® 10 DX FPGA英特尔其它系列FPGA 产品的区别,及英特尔未来的技术发展线路图,9月19日,EETOP记者电话专访了英特尔公司网络和自定义逻辑事业部副总裁兼FPGA电源产品营销总经理Patrick Dorsey。
 

Stratix 10 FPGA系列
 

Stratix® 10 FPGA分为多个系列,最新推出的为Stratix® 10 DX FPGA,其他型号在去年已经推出,可以看到FPGA Logic部分,DX与其他系列都是相同的,DX主要增强了对Memory、PCIe Gen4、以及UPI的支持。
 

 

Stratix 10 DX FPGA英特尔首款支持硬IP PCIe Gen4的FPGA。而对于Stratix 10 其他系列仅仅支持软IP PCIe Gen4。更具体的说,这款新推出的FPGA支持两个高性能、以处理器为核心的接口,即英特尔超路径互连(UPI)和PCI-Express (PCIe) Gen4 x16,同时还支持特定的英特尔®傲腾™数据中心级持久内存双列直插式内存模块(DIMM)。
 

所有这些功能的加强是采用了英特尔的世界最先进的封装技术(参见:做大芯片要靠堆)来实现的,英特尔可以通过增加或者删减封装在整个芯片内的不同功能的小芯片制造出不同型号的FPGA,Stratix 10 DX FPGA正是利用Intel的先进封装技术,封装了更先进的Memory接口小芯片以及PCIe Gen4等小芯片打造出来的。

 
Stratix 10 DX FPGA 的三大应用市场

Stratix 10 DX FPGA英特尔首个支持PCIe Gen4的FPGA,同时它的独具特色之处还在于它是采取超路径互连UPI的。正因为这个产品支持UPI,因此它的一个关键价值就是能够扩展系统内存。有了Stratix 10 DX再加上英特尔至强处理器就可以极大的扩展系统内存。

 

这种扩展是惊人的。与之前的FPGA型号相比,英特尔认为Stratix 10 DX FPGA提供了新功能和接口特性,其中包括:
  • 与特定的英特尔至强可扩展处理器组合,UPI接口可将延迟降低37% 2,并通过一致的数据移动和28GB/秒的理论峰值传输速率而提高整个系统的性能3。我们预计将在2021年提供超高速协议(Compute Express Link),具有内存一致性的FPGA接口是英特尔路线图的一部分。

  • 符合PCI-SIG标准的Gen4 x16接口提供32GB/秒的理论峰值数据带宽。数据中心和非数据中心应用的吞吐量大约将提高1倍以上4。

  • 内存控制器支持每个FPGA最多 8个英特尔傲腾数据中心级持久内存模块(最多4TB非易失性内存)

  • Stratix 10 FPGA的其他现有功能还包括:100GB/秒的以太网,HBM2内存堆栈和带外设的四核ARM Cortex-A53处理器子系统。

 
低时延、高带宽、对基础设施与应用的加速也是该款产品向客户以及市场提供解决方案的主要领域。三个不同的领域就是三个不同的市场。Patrick Dorsey特别就“基础设施与应用的加速”进行了举例说明。
 

针对数据中心加速主要包含两个方面,一是基础设施加速,一是后备加速也叫应用加速。当运行网络和云应用的服务器系统需要更高的计算速度时,比如处理人工智能训练/推理或数据库相关的工作负载,数据中心客户越来越多地使用包括FPGA在内的硬件加速器。硬件加速器的有效性能在很大程度上取决于一个或多个服务器CPU、可用系统内存和任何附加加速器(GPUFPGA、专用标准产品等)之间的通信带宽和延迟。拥有了Stratix DX的低时延、高带宽以及内存扩展能力,可以帮助用户极大的提升应用性能。 
 
同时,在Intel至强可扩展处理器的基础上,通过应用Stratix 10 FPGA,使处理器FPGA进行非常高效的合作。Stratix 10 FPGA采纳的是UPI以及符合PCIe Gen4的协议。符合UPI一致性的好处体现在,大部分的内存,无论是DDR还是傲腾,通过这种方式在至强处理器FPGA之间共享存储,在共享过程中不用进行数据迁移或者数据拷贝。这就是一致性和UPI带来的根本性的好处,因为数据迁移和拷贝会带来高成本,同时也会降低系统的性能。 
 

此外,在边缘计算应用中,例如AI或者是神经网络的计算任务上,要求应用进行超快速的响应。Stratix 10 DX拥有UPI之后,对比仅仅使用PCIe的响应速度快37%。而在网络应用当中,拥有了PCIe Gen4之后,是前一代PCIe Gen3带宽的两倍,这使得数据处理更为快速,同时也拥有以太网功能,这也是FPGA所带来的。第三则是在数据中心,云服务提供商或是企业级数据中心方面,通过英特尔的异构计算架构,至强可扩展处理器再加上FPGA,也就是多节点的计算架构,同时拥有PCIe Gen4与UPI的互联,总带宽是过去的2.6倍。在有了新FPGA的能力之后,在这三个市场当中,基本都能够实现超两倍以上的性能表现优化。 
 

问题与机遇:架构融合发展是趋势 

 
随着5G时代的到来,一个万亿级链接的时代也即将来到,而5G的毫秒级时延、超大的带宽,都要求企业必须快速响应市场。对于集成电路而言,后摩尔时代,通用计算难以为继几乎是行业共识,新材料、新结构和新原理的器件及3D技术是IC发展的新技术热点,新型计算和应用成为IC发展的驱动力。 
 
从根本上来讲,面对指数级增长的数据,客户寻求的是如何将这些数据货币化,如何通过全新的应用以及对现有应用进行提速来实现货币化的目的。Patrick Dorsey认为:“要想充分利用这些海量的数据就需要异构的解决方案。这种异构的架构包含了CPUGPUAI芯片以及FPGA,只有综合的运用它们,针对性的去解决所面临的具体问题才能够达到一个完整的解决方案。” 

 
英特尔是业界唯一一个囊括AI芯片CPUGPUFPGA全部四种架构的厂商。不过,Patrick Dorsey介绍说,仅仅拥有四种架构是不够的,要保证客户能够充分的利用这些架构的优势,就需要实现架构的融合发展。为更好的服务客户,英特尔正通过两个方面的努力来实现应对全新的异构时代:第一是针对开发者,第二是针对端到端的硬件部署。 

 
针对开发者,英特尔会和开发者密切合作,并且提供英特尔的产品路线图。使得开发者从一开始就能够比较准确的定位方向,无论是CPUGPUAI芯片还是FPGA。如包含了OpenVINO、AI平台以及英特尔最近宣布的oneAPI统一的应用开发接口,这使得开发者群体可以有统一的标准来进行单一系统但是多种不同架构的开发。 

针对硬件的部署,英特尔和OEM厂商如联想、浪潮等进行密切合作,帮助企业进行相应规范的认证过程。如应用英特尔FPGA或者至强处理器服务器的,英特尔会帮助判断是否符合规范。同样的操作也应用于5G英特尔也在帮助客户使用vRAN对数据中心应用5G英特尔通过这些来确保OEM在使用其FPGA时,其他硬件架构都能够满足规范要求。目前,英特尔在七个不同的应用领域上都和OEM进行了关于合规的合作。 
 

英特尔未来的完整线路图 

英特尔提供了从边缘到云端加速的FPGA解决方案,独特的解决方案整合了至强SP、FPGA、UPI/CXL和傲腾技术。FPGA的核心不变,通过不同封装及小芯片的不同叠加来实现。

对于未来的完整路线图,Patrick Dorsey表示:“Stratix 10 DX FPGA只是一个开始。英特尔会推出Agilex(今年3月已发布),这是基于10纳米制程的FPGA。它将支持下一代UPI,也就是基于CXL的开放标准接口。同时还将会支持下一代PCIe标准。最重要的是,现在应用开发者、系统集成商以及各类设计人员就已经可以去使用UPI去进行应用开发。在Agilex推出之后英特尔还将帮助客户进行向CLX进行无缝转移,以及后续的迭代过程。因此客户可以持续的享受带宽提升和时延降低的好处。”

 

 

 

据了解,Agilex系列已向参与早期使用计划的客户出货,明年将正式量产。Agilex目前的产品采用的是10纳米制程技术,但是并不限于10纳米,未来可能使用多种制程技术,Agilex将是未来新的英特尔FPGA产品系列。Stratix 10 DX FPGA在现有基础架构上还有更高层次的架构,可以整合UPI以及CXL,这些能力都将纳入到英特尔下一代的产品当中。并且在封装时,会在独立的模组上提供UPI。UPI、PCIe这些接口协议实际上是单独的小芯片实现的,能够很容易的升级到CXL,这样在迁徙升级的时候非常方便,能够可以很快的达成设计目标。 

针对5G方面,FPGA可以应用于5G基带和5G无线。Patrick Dorsey介绍说:“关于5G的应用,英特尔已经在与乐天日本运营商和中国移动开展合作。”Stratix 10 DX FPGA主要是针对5G的基带,其好处主要体现在低时延,尤其是当5G走向数据中心,在vRAN方面应用的时候配合FPGA和至强处理器,采用Stratix 10 DX可以进行诸多网络功能的加速。

关键词: 英特尔 FPGA

  • EETOP 官方微信

  • 创芯大讲堂 在线教育

  • 创芯老字号 半导体快讯

全部评论