AMD,这位在GPU领域一直以其卓越性能著称的科技公司,近日又放大招了。他们正式发布了新一代GPU加速器——MI300X,这无疑是对英伟达H100的一次有力挑战。据称,MI300X在AI模型训练速度上提升了惊人的60%,这无疑为AI领域带来了一股新的活力。
让我们来了解一下MI300X的核心技术。这款芯片完全基于CDNA 3架构设计,采用了5nm和6nm IP,晶体管数量达到了惊人的1530亿个。每个基于CDNA 3 GPU架构的GCD总共有40个计算单元,相当于2560个内核。八个计算芯片的总数为320个计算单元,20,480个核心单元。这样的设计,让MI300X在处理大量数据时,能够展现出强大的计算能力。
在设计方面,MI300X采用了无源芯片布局,第4代Infinity Fabric解决方案容纳了互连层。中介层总共包括28个芯片,其中包括8个HBM3封装、16个HBM封装之间的虚拟芯片和4个有源芯片。每个有源芯片都有2个计算芯片,这样的设计大大提高了芯片的效率。
MI300X还配备了8个HBM3堆栈,每个堆栈为12-Hi,集成了16 Gb IC,每个IC为2 GB容量,每个堆栈总容量为24 GB。这样的设计,使得MI300X在内存容量上有了显著的提升。
在性能方面,MI300X的表现也是相当出色的。据IT之家报道,AMD提到,在训练性能方面,MI300X与竞争对手不相上下,并提供具有竞争力的价格/性能。同时,在推理工作负载方面,MI300X的表现更为出色。
只是,性能的提升并不意味着功耗的增加。AMD Instinct MI300X的额定功率为750W,比Instinct MI250X的500W增加了50%,比NVIDIA H200增加了50W。这样的功耗控制,使得MI300X在高效能的同时,也能保持较低的能耗。
值得一提的是,技嘉的G593-ZX1/ZX2系列服务器已经支持MI300X。这些系统将配备多达8个MI300X GPU加速器和两个AMD EPYC 9004 CPU,总功率高达18000W。这样的配置,无疑为MI300X的普及提供了良好的硬件支持。
总的AMD的MI300X在性能、功耗、内存等方面都有显著的提升,无疑为AI领域带来了新的活力。虽然目前市场上已经有很多优秀的GPU产品,但MI300X的出现,无疑为这个市场带来了新的竞争格局。我们期待MI300X在未来的市场表现,也希望它能引领GPU技术的发展方向。