AMD发布CDNA架构Instinct MI100加速显卡加速百亿亿次级时代到来

11月16日晚10点，AMD正式发布了首款基于全新CDNA架构的Instinct MI100加速显卡，以及配套的ROCm 4.0生态系统

11月16日晚10点，AMD正式发布了首款基于全新CDNA架构的Instinct MI100加速显卡，以及配套的ROCm 4.0生态系统。

首次正式亮相的CDNA架构专门为高性能计算所打造，而基于该架构的AMD Instinct MI100加速显卡将进一步逼近百亿亿次级计算时代，同时也是AMD向前方开拓新发展路径的新旗舰产品。

AMD高级副总裁兼服务器业务总经理Dan McNamara表示，在高性能计算方面，整个行业发展十分迅速。我们看到的趋势是，工作负载的多样性在不断增加，高性能计算已经进入到很多领域，包括从传统科研，气象研究，生命科学，电子设计自动化到商业应用，从AI、机器学习到算法培训等等，如何通过CPU和GPU方面的组合更好地服务于客户、为客户带来更多单位成本性能和减少总体拥有成本，将是AMD极其重要的战略之一。

不过最令用户之间关心的，相信还是本次发布的新品加速显卡。AMD平台解决方案工程研发全球副总裁Brad Mccredie对此进行了全面解读。

在整个过去20年里，整个高性能计算经历了三个阶段，分别是TERASCALE、PETASCALE和现在的EXASCALE。在这个过程中我们需要一系列技术来支持EXASCALE这样一个百亿亿次级计算。

作为一款针对高性能计算而专门设计的行业领先GPU产品，AMD Instinct MI100旨在为推动百亿亿次级计算时代到来，能够实现10TF（十万亿次双精度计算速度），具备Matrix核心技术。与AMD上一代产品相比有着巨大的性能提升，能够实现高达70%的AI计算加强；而与竞争对手相比，在每单位性能上也是对方的两倍。特别是在搭配第二代AMD EPYC处理器使用时，还可为系统提供更强的加速性能。

20年前ASCI White超级计算机进入超算领域，并率先突破10TF关卡。20年之后，现在单个GPU仅在6兆瓦的性能上就可实现这样一个性能水平，这就是AMD Instinct MI100加速显卡，可以说这就是20年后非常巨大的成就之一。

目前市面上的大部分GPU采用的都是通用架构，这意味着这个架构既用于游戏图形处理，也用于复杂数学方面的处理，实际上很大的制约了向百亿亿次级计算的发展。而AMD选择将这两部分分离，为我们已经所熟知的针对游戏行业的RDNA架构，以及针对超算计算的CDNA架构。这样的分离可以帮助相关人员进一步针对领域内的工作负载进行优化。

以AMD Instinct MI100为例，CDNA架构可在同一晶片上放入了两倍数量的计算单元，并可以嵌入微架构以更好的适应AI和高性能计算的工作负载。同时在16位浮点计算和混合精度计算方面也能实现7倍以上的性能提升，另外通过Infinity架构还可以将GPU的带宽提升4倍、通过HBM2内存来实现20%的位宽提升。