AI训练性能提升2.5倍,三星采用96颗改版AMD Instinct MI100 GPU打造大规模计算系统

2022-12-15 23:49:04

元宇在线12月15日报道称,三星利用内置PIM(processing-in-memory)的显卡构建了全球首个大规模计算系统。援引 BusinessKorea 的报道,通过使用 96 颗经过 PIM 改造的 AMD Instinct MI100 GPU,AI 训练性能提升了 2.5 倍。

PIM 是一种新型计算机内存,可加速 CPU 和 GPU 等处理器的处理能力。 PIM最大的特点是每个内存模块都可以自己处理数据,从而减少了内存和处理器之间传输所需的数据量。

三星在今年 10 月公开展示了 PIM 修改的 GPU,现在该公司将 96 个 PIM 修改的 GPU 放在一个集群中。与普通显存相比,这些经过改进的 MI100 芯片不仅性能提升了 2.5 倍,功耗也降低了 2.67 倍,大大提升了 GPU 在运行 AI 算法时的效率。

三星开发 PIM 已有一段时间了。该公司在 2021 年展示了多种实施方案,涉及多种不同的内存类型,包括 DDR4、LPDDR5X、GDDR6 和 HBM2。在 LPDDR5 形式下,三星在涉及 MetaAI 工作负载的测试程序中看到性能提高了 1.8 倍,功耗降低了 42.6%,延迟降低了 70%。

小编了解到,AMD Instinct MI100 加速器经过全面重新设计,全面拥抱计算新时代。 1MI100加速器采用AMDCDNA架构,实现了计算和互联性能的巨大飞跃。与上一代AMD加速器相比,高性能计算(FP32矩阵)性能提升近3.5倍,而人工智能(FP16)性能提升近7倍。

三星并不是唯一一家开发 PIM 芯片的公司——SK 海力士今年早些时候发布了自己的 PIM 模块。据SK海力士初步测试,其GDDR6-AiM(内存加速器)应用可将AI处理速度提升16倍,功耗降低80%。这比三星修改后的 MI100s 快很多,但我们不知道 SKhynix 用什么工具测试,所以不能直接比较。