AMD董事长兼CEO苏姿丰在美国当地时间10月10日在旧金山举行的AI盛会上带来了一整套AI“杀手锏”,给整个行业带来了新的AI震撼。
苏姿丰展示最新GPU
其中,最大的惊喜当属AMD最新的旗舰AI芯片——AMD GPU(以下简称:)。苏妈再次自信地拿出了与老对手英伟达目前最畅销产品H200的对比图。她表示,内存容量是H200的1.8倍,内存带宽、FP16和FP8峰值理论计算能力都是H200的1.3倍。
此外,苏马还发布了第五代EPYC服务器CPU,称其为“全球最好的云计算、企业和AI CPU”,可与老对手英特尔的第五代至强白金8592+处理器相媲美。与2018年相比,这款CPU的HPC(高性能计算)性能提升高达3.9倍,基于CPU的AI加速提升高达3.8倍。苏母这次可以说给英伟达和英特尔带来了不小的压力。
HBM3e显存容量是GPU提升的关键吗?
目前,无疑是数据中心GPU领域的主导者。公布的数据显示,2023年全球数据中心GPU总出货量将达到385万台。其中,以98%的市场份额排名第一,AMD虽然排名第二,但仍有巨大差距。但熟悉苏妈妈的人都知道,当她的妈妈面临AMD的危险时,她最不怕的就是打一场硬仗。她这次带来的是“硬化”的H200。
据了解,它采用了与上一代相同的CDNA 3架构。最大的改进是首次采用了业界最先进的HBM3e,总容量达到256GB。它基于16-Hi堆栈工艺,内存带宽高达6TB/s。单个芯片共有1530亿个晶体管。
GPU各项参数
专家告诉记者,HBM显存的增加可以为GPU带来数据传输速度、数据处理能力、能效比、空间和延迟节省、支持更复杂的应用场景以及系统稳定性等方面的提升。并提高了可靠性。因此,FP8性能达到2.,FP16性能也达到1.

横向比较, H200使用的HBM3e容量为141GB,带宽为4.8TB/sz,晶体管总数约为800亿个。与最新的B200所使用的HBM3e显存容量相比,肯定是不够的。只有192GB,与256GB HBM3e内存容量还有很大差距。
虽然两家公司对于GPU的设计不同,而且HBM3e的显存容量并不是判断GPU性能的唯一标准,但它显着提高了产品性能的上限。这是AMD面对的底气。苏马在发布会上自豪地强调:“MI325服务器平台在运行Llama 3.1时,可提供比 H200 HGX高出高达40%的性能。”
根据AMD官方信息,该加速器目前预计将于2024年第四季度投产,预计2025年第一季度开始出货。
AMD最新GPU技术路线图
另外,按照目前“一年迭代一次”的节奏,AMD此次更新了AI芯片路线图。预计明年将推出下一代MI350系列,采用3nm工艺,并将HBM3E内存增加至288GB。还将部署第一代CDNA 4架构,使其推理性能比基于CDNA 3架构的加速器高出35倍。 AMD计划在2025年下半年推出该系列。
其中MI350系列的代表产品是AMD为了应对3月份刚刚发布的 B200而设计的。据了解,FP8和FP16的性能提升了80%。 FP16的峰值性能达到2.,FP8的峰值性能达到4.,FP6和FP4的峰值性能达到9.。
最新CPU性能超越Intel了吗?
CPU业务是AMD涅槃重生的开始。 2018年,其EPYC(霄龙)服务器市场份额仅为2%。经过四代升级,最终在2024年第一季度达到了34%,从英特尔手中夺走了近30%的CPU服务器市场份额,成为AMD的主要收入来源。

EPYC(霄龙)服务器CPU市场份额
Suma 在发布今年第二季度财务报告时表示:“得益于破纪录的销售业绩,我们在第二季度实现了强劲的销售和收入增长。我们的 AI 业务持续加速,在该系列中,在EPYC和Ryzen处理器的市场需求推动下,AMD已为下半年营收的强劲增长做好了充分准备。”
因此,AMD此次的另一大杀手锏就是其代号“都灵”的第五代EPYC服务器CPU。
第五代EPYC(霄龙)服务器CPU各项参数

据介绍,Turin拥有1500亿个晶体管,采用台积电3/4nm工艺,全新的“Zen 5”和“Zen 5c”核心兼容广泛部署的SP5平台,最多支持192个核心和384个线程。目前,英特尔的至强6节能核心版虽然未来可以通过双核封装达到288个核心,但无法支持超线程技术,线程数仅有288个。因此,AMD在核心数和线程数方面已经赶上了Intel。
随着技术的全面升级,都灵的性能得到了显着提升。 AMD表示,与上一代英特尔至强服务器相比,Turin在SPEC CPU测试中的性能提升了2.7倍,企业级性能提升高达4.0倍,HPC(高性能计算)性能提升高达3.9倍次。
苏马打了一个生动的比喻。她表示,如果用都灵服务器取代上一代至强服务器,只需131台服务器就能达到原来1000台服务器的性能水平,节省87%的占地面积。同时,功耗可节省高达68%。
AMD还优化了Turin在AI工作流程中的关键动作,包括数据预处理、内存复制、内核启动、任务协调等。这些优化使得CPU在处理GPU协调任务时更加高效,比上一代速度提升高达28%。
除了GPU和CPU之外,苏妈此次还带来了最新的DPU、AI网卡以及ROCm 6.2生态系统,拼凑了一整套“AI全家桶”,给“双雄”带来了全面的压力。不过,当天AMD的股价并没有买进。相反,它以大幅下跌结束。盘中跌幅一度扩大至5.3%左右,最终收跌4%,创9月3日以来最大盘中和收盘跌幅。可见,AMD新品虽然来势汹汹,但只有在市场认可的情况下,才能赢得市场认可。已批量生产并经客户测试。


