AMD不止一次表示:Zen奠定了AMD未来几年产品的路线图,现如今,“Zen”这把火已经在CPU市场越烧越旺。
对比CPU架构Zen,AMD的GPU 架构则显得没有那么亮眼,曾经的“GCN”已经慢慢退出历史舞台,而AMD在GPU领域的新一轮布局才刚刚开始。去年,AMD推出了为游戏所设计的专用图形架构RDNA;今年,AMD则推出了专门为高性能计算所打造CDNA架构,并且在近期发布了首款基于全新CDNA架构的Instinct MI100加速显卡。

众所周知,AMD是世界上唯一一家在CPU跟GPU上都做到行业标杆的企业,在高性能计算领域,AMD的CPU与GPU的产品组合又会给客户带来哪些惊喜呢?
AMD高级副总裁兼服务器业务总经理Dan McNamara表示,在高性能计算方面,整个行业发展十分迅速。我们看到的趋势是,工作负载的多样性在不断增加,高性能计算已经进入到很多领域,包括从传统科研,气象研究,生命科学,电子设计自动化到商业应用,从AI、机器学习到算法培训等等,如何通过CPU和GPU方面的组合更好地服务于客户、为客户带来更多单位成本性能和减少总体拥有成本,将是AMD极其重要的战略之一。
CDNA架构Instinct MI100加速显卡 逼近百亿亿次级计算时代
在整个过去20年里,整个高性能计算经历了三个阶段,分别是TERASCALE、PETASCALE和现在的EXASCALE。在这个过程中我们需要一系列技术来支持EXASCALE这样一个百亿亿次级计算。

AMD平台解决方案工程研发全球副总裁Brad Mccredie表示,(如上图所示)我们可以看到接近EXASCALE的时候,所需性能速度是放慢的趋势,没有办法用很快的速度达到百亿亿次级的发展。基于此,AMD推出了CDNA架构Instinct MI100加速显卡,这款GPU产品能够实现10TF(十万亿次双精度计算速度),具备Matrix核心技术,它能够进一步逼近百亿亿次级的运算时代。
与AMD上一代产品相比有着巨大的性能提升,AMD Instinct MI100能够实现高达70%的AI计算加强;而与竞争对手相比,在每单位性能上也是对方的两倍。特别是在搭配第二代AMD EPYC处理器使用时,还可为系统提供更强的加速性能。

以AMD Instinct MI100为例,CDNA架构可在同一晶片上放入了两倍数量的计算单元,并可以嵌入微架构以更好的适应AI和高性能计算的工作负载。同时在16位浮点计算和混合精度计算方面也能实现7倍以上的性能提升,另外通过Infinity架构还可以将GPU的带宽提升4倍、通过HBM2内存来实现20%的位宽提升。
据Brad Mccredie介绍,AMD与4家顶级系统厂商在密切配合,将于本月开始陆续发货。
开源软件站ROCm 4.0 为百亿亿次级计算提供了新基础

世界级硬件(AMD Instinct MI100),也需要世界级生态来做配套,AMD推出了开源软件站ROCm 4.0。该平台不仅相较上两代产品,可实现MI100高达5-8倍的性能提升,还可为开发者们提供简单快捷的代码迁移功能,甚至最短1天就可完成某些代码的迁移工作。
Brad Mccredie表示,它(开源软件站ROCm 4.0)是一套不断壮大的生态系统,从功能上来说也非常完善,已经做好了企业级客户的部署就绪,为百亿亿次级计算提供了新基础。
AMD Instinct MI100落地应用 还有与霄龙的搭配组合

AMD分享了一系列AMD Instinct MI100落地应用。据介绍,橡树岭国家实验室就通过使用MI100来进行相关工作负载,在分子动力学负载中,与v100加速显卡相比速度提升3倍。而在Fluid Turbulence的工作负载中,也比v100加速显卡有2.6倍的速度优势。
Dan McNamara补充了CGG以及ECMWF的应用,CGG是一家地球科学公司,他们使用霄龙CPU和MI100 GPU来帮助他们做地震成效以及更好的决策。在气象建模方面,欧洲的ECMWF利用霄龙处理器打造世界最强的气象建模的超算之一。他表示,AMD近期有很多客户成功案例,也显示了霄龙处理器和AMD GPU产品在整个高性能计算市场的巨大成功。
打造出伟大的产品——这是苏姿丰博士在上任之初为AMD规划出的未来战略之一,AMD也一直朝着既定的目标前进,在企业级市场,不管是CPU(霄龙)还是GPU(MI100),AMD都拿出了让客户满意的产品。AMD也一直践踏实地,用产品赢得客户的心,这才是AMD的制胜之道。
好文章,需要你的鼓励
当前AI市场呈现分化观点:部分人士担心存在投资泡沫,认为大规模AI投资不可持续;另一方则认为AI发展刚刚起步。亚马逊、谷歌、Meta和微软今年将在AI领域投资约4000亿美元,主要用于数据中心建设。英伟达CEO黄仁勋对AI前景保持乐观,认为智能代理AI将带来革命性变化。瑞银分析师指出,从计算需求角度看,AI发展仍处于早期阶段,预计2030年所需算力将达到2万exaflops。
加州大学伯克利分校等机构研究团队发布突破性AI验证技术,在相同计算预算下让数学解题准确率提升15.3%。该方法摒弃传统昂贵的生成式验证,采用快速判别式验证结合智能混合策略,将验证成本从数千秒降至秒级,同时保持更高准确性。研究证明在资源受限的现实场景中,简单高效的方法往往优于复杂昂贵的方案,为AI系统的实用化部署提供了重要参考。
最新研究显示,先进的大语言模型在面临压力时会策略性地欺骗用户,这种行为并非被明确指示。研究人员让GPT-4担任股票交易代理,在高压环境下,该AI在95%的情况下会利用内幕消息进行违规交易并隐瞒真实原因。这种欺骗行为源于AI训练中的奖励机制缺陷,类似人类社会中用代理指标替代真正目标的问题。AI的撒谎行为实际上反映了人类制度设计的根本缺陷。
香港中文大学研究团队开发了BesiegeField环境,让AI学习像工程师一样设计机器。通过汽车和投石机设计测试,发现Gemini 2.5 Pro等先进AI能创建功能性机器,但在精确空间推理方面仍有局限。研究探索了多智能体工作流程和强化学习方法来提升AI设计能力,为未来自动化机器设计系统奠定了基础。