概要

AMD CDNA™ アーキテクチャは、AMD Instinct™ GPU および APU の基盤となる、専用演算アーキテクチャです。このアーキテクチャは、AMD チップレット テクノロジと高スループットの Infinity アーキテクチャ ファブリックである広帯域幅メモリ (HBM) を統合する高度なパッケージを備えており、AI および HPC データ形式の包括的なセットをサポートする高度なマトリックス コア テクノロジを提供します。このテクノロジはデータ移動のオーバーヘッドを削減し、電力効率を向上させるように設計されたものです。

世代間比較表:

 

CDNA

CDNA 2

CDNA 3

CDNA 4

プロセス テクノロジ

7 nm FinFET

6 nm FinFET

5 nm + 6 nm FinFET

3 nm + 6 nm FinFET

トランジスタ

256 億

最大 580 億

最大 1,460 億

最大 1,850 億

CU | マトリックス コア

120 | 440

最大 220 | 880

最大 304 | 1216

256 | 1024

メモリ タイプ

32 GB

HBM2

最大 128 GB

HBM2E

最大 256 GB

HBM3 | HBM3E

288 GB

HBM3E

メモリ帯域幅 (ピーク)

1.2 TB/秒

 最大 3.2 TB/秒

最大 6 TB/秒

8 TB/秒

AMD Infinity Cache™

N/A

N/A

256 MB

256 MB

GPU コヒーレンシ

N/A

キャッシュ

キャッシュおよび HBM

キャッシュおよび HBM

サポートするデータ型

INT4、INT8、BF16、FP16、FP32、FP64

INT4、INT8、BF16、FP16、FP32、FP64

INT8、FP8、BF16、FP16、TF32、FP32、FP64 (スパース性をサポート)

INT4、FP4、FP6、INT8、FP8、BF16、FP16、TF32*、FP32、FP64 (スパース性をサポート)

製品

AMD Instinct™ MI100 シリーズ

AMD Instinct™ MI200 シリーズ

AMD Instinct™ MI300 シリーズ

AMD Instinct™ MI350 シリーズ

* TF32 はソフトウェア エミュレーションを通じてサポートされます。

利点

マトリックス コア テクノロジ

AMD CDNA 4 には、前世代のアーキテクチャと比較して低精度行列データ型に対する計算性能を 2 倍に向上させたマトリックス コア テクノロジが搭載されています。AMD CDNA 4 は、命令レベルの並列化が向上し、共有 LDS リソースが拡大されて帯域幅が 2 倍になり、現時点で FP4 と FP6、さらにはスパース マトリックス データ (すなわちスパース性) を含む広範な精度をサポートしています。

AI アクセラレーションの強化

AMD CDNA 4 は、レイテンシの短縮による GEMM パフォーマンスの向上、より低精度の製品による電力効率の向上、モデルの精度、速度、電力効率の優先順位のバランスに基づく混合精度 AI プロジェクトの柔軟性の向上など、LLM 向けの新しい強化された AI アクセラレーション機能を提供します。  

AI technology concept
Alt テキストの追加

HBM メモリ、キャッシュ、コヒーレンシ

AMD Instinct MI350 シリーズ GPU は、必要なすべての帯域幅でより大規模のモデルをサポートできるように、業界をリードする 256 GB の HBM3E メモリ容量を備えているほか、共有メモリと AMD Infinity Cache™ (共有ラスト レベル キャッシュ) も備えているため、データ コピーがなくなり、レイテンシが改善されています。

ユニファイド ファブリック

次世代 AMD Infinity アーキテクチャは、AMD Infinity Fabric™ テクノロジと組み合わせることで、AMD GPU チップレット テクノロジとスタックド HBM3E メモリのコヒーレントで高スループットの統合を、単一デバイスおよびマルチデバイス プラットフォームで実現します。また、PCIe® 5 との互換性により、I/O も強化されています。

AMD CDNA™ 4 のご紹介

AMD CDNA™ 4 は、AMD Instinct™ MI350 シリーズ GPU の基盤となる、専用演算アーキテクチャです。データ移動のオーバーヘッドを削減し、電力効率を高めるように設計されたチップレット テクノロジによる、高度なパッケージングを特徴としています。

AMD Instinct MI350 Series

AMD Instinct MI350 シリーズ GPU

AMD CDNA 3

AMD CDNA 3 アーキテクチャは、AMD Instinct™ MI300 シリーズ GPU の基盤となる、専用演算アーキテクチャです。データ移動のオーバーヘッドを削減し、電力効率を高めるように設計されたチップレット テクノロジによる、高度なパッケージングを特徴としています。

AMD Instinct MI300A APU

AMD Instinct MI325X GPU

Alt テキストの追加

AMD CDNA 2

AMD CDNA 2 アーキテクチャは、最も負荷のかかる科学演算ワークロードや機械学習アプリケーションでも、高速化できるように設計されています。AMD Instinct MI200 シリーズ GPU の基盤となっています。

AMD CDNA

AMD CDNA アーキテクチャは、GPU ベースの演算専用アーキテクチャで、エクサスケール級の演算の時代を切り開くために設計されました。AMD Instinct MI100 シリーズ GPU の基盤となっています。

Alt テキストの追加

AMD Instinct アクセラレータ

AMD Instinct GPU が生成 AI、トレーニング、HPC の新しい標準をどのように確立しているかについて説明します。

AMD ROCm™ ソフトウェア

AMD CDNA アーキテクチャは、オープン ソフトウェア スタックである AMD ROCm™ ソフトウェアによってサポートされています。この AMD ROCm には、AMD Instinct GPU をターゲットとする、AI および HPC ソリューション開発のためのプログラミング モデル、ツール、コンパイラ、ライブラリ、ランタイムの幅広いセットが含まれています。