第一生活网

英特尔公布其 Arc A 系列移动产品阵容的全部细节

郝以雯
导读 今天是英特尔 Arc Alchemist正式进入专用显卡争夺战的日子,将这场两马竞争变成了三方霸主之战。或者至少,这就是我们想要讲述的故事。取...

今天是英特尔 Arc Alchemist正式进入专用显卡争夺战的日子,将这场两马竞争变成了三方霸主之战。或者至少,这就是我们想要讲述的故事。取而代之的是,我们将首次获得对英特尔 Arc A 系列移动 GPU 阵容的完整描述,首批搭载新 GPU 的笔记本电脑将于 4 月上市。但台式机用户不必担心:用于台式机的 Arc 显卡仍在推出,只是不是第一个。如果您不了解 Arc,我们将回顾一些细节,但我们的主要Arc Alchemist 中心包含更多低级细节。

与其 CPU 堆栈类似,英特尔的 Arc Alchemist 将具有多个性能等级:Arc 3、Arc 5 和 Arc 7。各种型号将基于两种芯片设计,一种具有多达 96 个 Xe 矢量引擎 (XVE),而其他高达 512 XVE。请注意,XVE 是以前称为 EU(执行单元)的新名称,尽管新的 XVE 进行了大量更改,并且肯定需要更改名称。

较小的芯片称为 ACM-G11,它将首先推出,预计不久将推出使用新 Arc 3 品牌 GPU 的笔记本电脑。ACM-G10 使用更大的芯片,英特尔预计使用 Arc 5 和 Arc 7 GPU 的笔记本电脑将在初夏上市。

在大多数方面,ACM-G10 的硬件是 ACM-G11 的四倍:Xe 内核、光线追踪单元和 L2 缓存的 4 倍。然而,内存子系统的宽度为 2.67 倍,最大 256 位总线与较小芯片上的最大 96 位总线相比,并且 PCIe 插槽接口在 x16 与 x8 时的宽度是 x8 的两倍。同时,两个 GPU 之间的媒体和显示功能是等效的,因此所有 Arc 图形解决方案都将具有相同的双 Xe 媒体引擎 (MFX) 和四个显示引擎。

快速回顾一下,每个 Xe 内核包含 16 个 XVE 和另外 16 个 XMX 单元。XVE 矢量引擎每个时钟可以执行 16 次 FP32、32 次 FP16 和 64 次 INT8 操作。同时,XMX 矩阵引擎每个时钟可以执行 128 次 FP16/BF16、256 次 INT8 或 512 次 INT4/INT2 操作。

我们稍后会了解时钟速度,但这些速度可能会有很大差异,尤其是在移动外形尺寸方面。我们怀疑英特尔会在台式机卡上突破 2GHz,但移动部分似乎在较小芯片上达到 1.55GHz 左右,在较大芯片上达到 1.65GHz。算一算,较小的 ACM-G11 的峰值吞吐量应该超过 3 TFLOPS FP32,并具有 25 TFLOPS 的 FP16 深度学习能力。更大的 ACM-G10 将使这些数字增加四倍以上,达到 13.5 TFLOPS FP32 和 108 TFLOPS FP16 的峰值吞吐量。