
随着英特尔的Rapids Sapphire Xeon处理器(第四代可拓展处理器)已经开始逐步向终端客户供货,英伟达CEO Jensen Huang近日宣布,该公司即将推出的DGX H100——在今年3月22日推出的一套GPU计算AI平台——以及今后推出的HPC系统,将完全过度到英特尔处理器,以此取代多年使用的AMD的Zen 3 EPYC处理器。
老黄表示,更换CPU的主要原因是第四代至强可拓展系列处理器具备卓越的单线程性能,而在第四代至强可拓展系列处理器已经向终端客户供货的当下,AMD只能提供Zen 3系列的EPYC处理器,甚至还无法对外宣布与第四代可拓展处理器规格相近的Geona Zen 4 处理器的发布日期。

我们目前还没有关于第四代至强可拓展系列处理器的全部细节,仅能零散获取一些信息。第四代至强可拓展系列处理器是英特尔的下一代服务器架构,将使用与英特尔桌面Alder Lake架构相同的Golden Cove性能核心。也就是说,这将会是Alder Lake的服务器版本。因此,第四代至强可拓展系列处理器应该有和Alder Lake架构类似的IPC提升。第四代至强可拓展系列处理器预计还将支持最新的内存和存储技术,包括DDR5、HBM2E和PCIe Gen 5,使其与最新最卓越的技术保持一致。第四代至强可拓展系列处理器理论最高可配置56个核,80 个PCIe Gen 5通道。英特尔的唯一问题是其在物理核数上低于AMD,AMD高端芯片,如EPYC 7773X所具备的64个核心——除非像当年第二代至强可拓展系列处理器那样推出将双芯片封装到一起的发展型号。

第四代至强可拓展系列处理器还将支持其他一些目前三代处理器尚未支持的新技术,包括用于深度学习应用的全新AMX AVX512_BF16指令集,以及一种特殊的数据流加速器,将CPU的所有存储调用转移到专用芯片上,以降低CPU利用率。对于英伟达来说,与AMD的Zen 3产品相比,第四代至强可拓展系列处理器将为其DGX单元提供更高的单线程性能、更高的内存带宽和PCIe带宽。DGX H100特别适合人工智能密集型应用,每个DGX单元采用8个英伟达全新Hopper H100 GPU,性能可达32 petaflops。英伟达宣称其建设中的超级计算机系统“Eos”将使用576个DGX H100型系统组成,预计建成后将提供18.4 exaflops 的 AI 计算性能,其 AI 处理速度是将是日本 Fugaku 超级计算机——在过去数年里一直是世界最快的超级计算机——的 4 倍。