内核数量比全球第一E级超算多1.6倍！世界最大芯片打造最强AI超级计算机！

2022-11-18 12:45:10 EETOP

点击关注->创芯网公众号，后台告知EETOP论坛用户名，奖励200信元

集成2.6万亿晶体管、一张晶圆只做一颗芯片，世界上最大的芯片CS-2 Wafer Scale Engine背后的公司Cerebras 最近推出了基于CS-2 + 第三代 AMD EPYC 处理器的Andromeda （仙女座）超级计算机，

专门针对深度学习应用进行了优化。Andromeda 据称拥有比 1,953 个 NVIDIA A100 GPU 更多的内核，也拥有比世界排名第一的超算Frontier 超级计算机多 1.6倍的内核。（Frontier 全球首台真正意义上达到ExaFLOP级别（百亿亿次）的超级计算机）

该公司正试图消除通用计算平台的常见挑战，例如在分布式GPI集群上实施培训所需的额外开销。有些分布式系统的3D配置对工程师来说很复杂的。

分布式通用 GPU 中的 3D 并行性。

Cerebras 最近发布了其Andromeda超级计算机，包括一个 AI 应用特定的硬件架构，可以在多个 GPT 语言模型上提供线性扩展训练；简而言之，训练时间随着所涉及的计算核心数量的增加而线性减少。这与计算单元与训练时间之间具有亚线性关系的通用 GPU 集群不同。

Cerebras 声称，由于内存和带宽限制，类似的工作不可能在 2,000 个NVIDIA A100 GPU 的集群上进行。

Andromeda 超级计算机的主要规格

Andromeda 建立在 Cerebras 的 CS-2 系统之上，包括总共1350万个 AI 优化计算核心和18,178 个第三代 AMD EPYC 处理器。

据报道，Andromeda 可提供跨 GPT 语言模型的近线性缩放

该超级计算机还采用晶圆级集群和权重流，由 Cerebras 的 MemoryX 和 SwarmX 技术提供支持。Andromeda 产生 1 exaflop 的 AI 计算和 120 petaflops 的密集计算，具有 16 位半精度。

CS-2系统

Andromeda 拥有 16 个 CS-2 系统，每个系统都配备了 Cerebras 的Wafer-Scale Engine 2 (WSE-2) 处理器——一个 46,225 mm 2处理器和 2.6万亿个 7nm 晶体管。据报道，WSE-2 是“地球上最大的处理器”。配套的软件平台集成了 PyTorch 和TensorFlow，开箱即用。