第一生活网

AMD 的 MI250X 大胜 Nvidia 的 V100 GPU

龚融力
导读 今天,橡树岭领导力计算机构 (OLCF) 宣布,价值 6 亿美元的Frontier 超级计算机的小型迭代机 Crusher现已上线,并产生了令人印象深刻

今天,橡树岭领导力计算机构 (OLCF) 宣布,价值 6 亿美元的Frontier 超级计算机的小型迭代机 Crusher现已上线,并产生了令人印象深刻的成果。Crusher 的 192 个 HPE Cray EX 刀片被塞进 1.5 个机柜中,占用的空间是之前 4,352 平方英尺Titan 超级计算机的 1/100,但新系统提供了更快的整体性能。

Crusher 具有与 1.5 exaflop Frontier 超级计算机相同的架构组件,每个 HPE Cray EX 刀片包含一个 64 核 AMD EPYC“Trento”7A53 CPU 和四个AMD“Aldebaran”MI250X GPU,但 Frontier 将不提供给研究人员直到 2023 年 1 月 1 日。

然而,研究人员现在正在使用 Crusher 为 Frontier 准备他们的科学代码,并取得了令人印象深刻的结果。亮点包括Nvidia 和 IBM 驱动的 Summit 超级计算机的 15 倍加速使用已为 Frontier 重写的 Cholla 天体物理学代码,其中 3 倍的改进归因于硬件改进,而另外 5 倍的改进来自软件优化。同时,与 Summit 中使用的 Nvidia V100 GPU 相比,使用 MI250X GPU 的 NuCCOR 核物理代码的速度提高了 8 倍。此外,OLCF 宣布通过大规模模拟处理多达 100,000 个原子的 LSMS 材料代码也已在 Crusher 上成功运行,并将扩展到在整个 Frontier 系统上运行。OLCF 还宣称,与以前使用 Transformer 深度学习模型工作负载的未指定系统相比,增加了 80%。

Crusher 的新硬件胜过 Titan 超级计算机也就不足为奇了——那台庞大的旧超级计算机于 2013 年上线,有 200 个机柜,装有 18,688 个 AMD Opteron 6274 16 核 CPU、18,688 个 Nvidia Tesla K20X GPU 和 Gemini 互连,所有这些总共消耗了8.2兆瓦的电力。该系统分布在 4,352 平方英尺,在 Linpack 中提供了 17.6 petaFLOPS 的持续性能和 27 petaFLOPS 的理论峰值。