当地时间11月19日,AMD 公开了其最新一代的人工智能(AI)加速器Instinct MI400系列的首款产品——MI430X 的设计方向和部分规格。

据介绍,MI430X GPU 专为人工智能与高性能计算工作负载的融合而设计,基于下一代AMD CDNA™架构,拥有高达432GB的HBM4内存和19.6TB/s的内存带宽,其丰富的HBM4内存和超高带宽消除了训练大型语言模型或复杂仿真时常见的瓶颈,同时其FP4、FP8和FP64的高精度支持确保了AI和科学应用的平衡性能。可以为高性能计算和人工智能提供了卓越的计算能力,使研究人员、工程师和人工智能创新者能够突破可能性的极限。
此外,结合AMD ROCm™软件,MI430X 在数据中心和超级计算环境中可以实现全栈兼容性和可扩展性。ROCm持续与PyTorch、TensorFlow和JAX等领先框架集成,确保数千块GPU的训练和推理性能得到优化。
AMD还透露,美国橡树岭国家实验室的Discovery超级计算机、欧洲的Alice Recoque超级计算机,都将采用AMD Instinct MI430X加速器。
其中,Discovery利用AMD Instinct MI430X GPU和下一代AMD EPYC“Venice”CPU,搭载HPE Cray GX5000超级计算平台,Discovery将使美国研究人员能够训练、微调并部署大规模人工智能模型,同时推动能源研究、材料科学和生成式人工智能领域的科学计算发展。
Alice Recoque是欧洲最新发布的一款Exascale级超级计算机,集成了AMD Instinct MI430X GPU和下一代AMD EPYC“Venice”CPU,搭载Eviden最新的BullSequana XH3500平台,为双精度高性能计算和AI工作负载提供卓越性能。该系统架构利用了庞大的内存带宽和能效,加速科学突破,同时实现严格的能效目标。
此外,AMD还预告更高端的Instinct MI455X 正在开发中,将会与英伟达 Rubin 系列对标,重点在于大型模型训练性能、推理速度与能源效率。
编辑:芯智讯-浪客剑