国际资讯

国际资讯

当前位置:首页 > 财经新闻 > 国际资讯 > 正文

AMD推最强GPU

qg365 2021-11-12 21:25 2988 0


AMD 本周出人意表地公布了其 Instinct MI250 加速器与英伟达 A100 计算 GPU 比拟的详细性能数据。能够预见,AMD 的显卡在所有情况下都比 Nvidia 的主板超出跨越两到三倍。

但是,虽然硬件公司展现其优势的情况其实不少见,但很少在官方网站上公布与合作敌手的详细性能数据。当他们如许做时,凡是意味着一件事:他们对其产物十分有自信心。

性能提拔三倍

因为 AMD 的 Instinct MI200 次要针对 HPC 和 AI 工做负载(显然 AMD 为 HPC 和超等计算机而不是 AI 定造了更多的 CDNA 2),因而 AMD 在处置代数、物理学、宇宙学、分子动力学和粒子彼此感化。

(图片来源:AMD)

有许多物理和分子动力学 HPC 应用法式被普遍利用并具有行业承认的测试,例如 LAMMPS 和 OpenMM。那些能够被视为现实世界的工做负载,在那里 AMD 的 MI250X 拥有超越 Nvidia A100 1.4 到 2.4 倍的性能。

还有许多 HPC 基准测试能够模仿实在世界的代数、宇宙学和粒子交互工做负载。在那些情况下,AMD 的顶级计算加速器比 Nvidia 的旗舰加速器快 1.9 – 3.05 倍。

请记住,与 Nvidia 的 A100 比拟,AMD 的 MI250X 在高时钟下运行的 ALU 数量要多得多,新卡显著优于其合作敌手也就层见迭出了。同时,值得留意的是,AMD 没有运行任何 AI 基准测试。

新架构,更多 ALU

AMD 的 Instinct MI200 加速器由该公司最新的 CDNA 2 架构供给撑持,该架构针对高性能计算 (HPC) 停止了优化,将为即将推出的 Frontier 超等计算机供给动力,该超等计算机有望供给约 1.5 FP64 TFLOPS 的持续性能 。MI200 系列 OAM 板利用由两个图形计算芯片 (GCD) 构成的AMD  Aldebaran 计算 GPU ,每个芯片包罗 291 亿个晶体管,与 Navi 21 内部的 268 亿个晶体管比拟略多。GCD 是利用台积电的 N6 造造工艺造造的,那使 AMD 可以通过封拆或者在更多层上利用极紫外光刻手艺增加更多晶体管,并简化消费过程。

AMD 的旗舰 Instinct MI250X 加速器具有 14,080 个流处置器(220 个计算单位),并装备 128GB 的 HBM2E 内存。MI250X 计算 GPU 的额定性能为 95.7 FP32/FP64 TFLOPS(矩阵运算性能不异)以及 383 BF16/INT8/INT4 TFLOPS/TOPS 性能。

比拟之下,英伟达的 A100 GPU 由 542 亿个晶体管构成,拥有 6,912 个活动 CUDA 核心,并搭配 80GB 的 HBM2E 内存。在性能方面,加速器供给 19.5 FP32 TFLOPS、9.7 FP64 TFLOPS、19.5 FP64 Tensor TFLOPS、312 FP16/BF16 TFLOPS,以及高达 624 INT8 TOPS(或 1248 TOPS 稀少)。

即便在纸面上,AMD 的 Instinct MI200 系列在传统 HPC 和矩阵工做负载中也能供给更高的性能,但 Nvidia 在 AI 案例中具有优势。在 AMD MI200 系列的情况下,那些峰值性能数字能够用相当高的 ALU 数量来解释

为了展现其旗舰计算加速器 Instinct MI250X 128GB HBM2E 的性能,AMD 利用了基于 1P 或 2P 64 核 AMD EPYC 7742 的系统,装备了一个或四个 AMD Instinct MI250X 128GB HBM2E 计算 GPU 或一个或四个 Nvidia A100 80GB HBM2E。该公司利用了 AMD 优化和 CUDA 优化的软件。

总结

按照其本身的数据,目前,AMD 的 Instinct MI250X 是世界上性能更高的 HPC 加速器。考虑到 Aldebaran 拥有高达 14,080 个 ALU 而且额定为 95.7 FP32/FP64 TFLOPS 性能,它确实是最快的计算 GPU。

与此同时,AMD 推出了 Instinct MI250X,比 Nvidia 的 A100 晚了大约 1.5 年,比英特尔的 Ponte Vecchio 早了几个月。2021 年的计算加速器的性能超越一年多前推出的合作敌手是很天然的,但我们很猎奇的是,那款 GPU 将若何与英特尔的超等计算机绑定计算 Ponte Vecchio GPU 相抗衡。


取消回复发表评论:


提交需求或反馈

Demand feedback