AMD HPC 및 AI 고객: ROCm™ 5.7 만나보기

AMD ROCm™ 오픈 플랫폼은 AMD와 다른 판매업체 하드웨어 모두에서 HPC 및 AI 컴퓨팅을 촉진하도록 설계된 오픈 소스 소프트웨어 플랫폼입니다. ROCm을 통해 고객은 HPC 워크로드를 실행할 때 새로운 수준의 자유와 접근성을 경험할 수 있습니다.

ROCm 업데이트 5.7에서는 고객이 다양한 응용 분야에서 AMD 하드웨어를 더 효과적으로 활용할 수 있도록 풍부한 업데이트, 기능 및 개선 사항을 제공합니다. 추가 AMD 그래픽 카드 지원, hipTensor 지원, 성능 향상 등, ROCm™ 5.7은 사용자를 위해 이러한 모든 기능과 함께 추가적인 부분까지 개선했습니다.

AMD RDNA™ 3 아키텍처를 기반으로 만들어진 AMD Radeon™ 그래픽의 머신러닝

이제 ROCm 5.7 덕분에, 고객은 AMD Radeon™ RX 7900 XTX 및 AMD Radeon™ PRO W7900 그래픽을 지원하는 Linux®에서 AMD Radeon™ RX 7900 시리즈 데스크탑 그래픽의 성능을 활용해 머신러닝 모델과 알고리듬을 실행할 수 있습니다.

AMD Radeon™ RX 7900 시리즈 그래픽은 AMD RDNA™ 3 아키텍처를 기반으로 만들어져 이전 세대 제품에 비해 컴퓨팅 유닛당 두 배 이상의 AI 성능을 갖추고 있습니다.1  또한 최대 192개 AI 가속기와 놀라운 메모리 대역폭을 제공하며, 최대 24GB 또는 48GB 그래픽 메모리를 지원하므로 고객이 대규모 머신러닝 모델을 처리할 수 있습니다.

이제 고객이 즉시 사용 가능한 하드웨어로 머신러닝 학습 등을 지원하는 로컬 전용 워크플로를 생성할 수 있어, 이전에 클라우드 기반 솔루션에 의존했던 고객에게 훌륭한 옵션이 될 수 있습니다.

hipTensor 지원

ROCm 업데이트 5.7에서는 복잡한 HPC 및 AI 워크플로에서 사용할 수 있는 빌딩 블록인 텐서 프리미티브를 가속화하는 AMD C++ 라이브러리인 hipTensor를 지원하기 시작합니다. 따라서 유연성을 높이고 개발 시간을 단축하며 엔드 투 엔드 효율성을 향상할 수 있습니다.

MIGraphX의 새로운 기능

MIGraphX는 몇 가지 그래프 수준의 변환과 최적화를 활용하여 AMD 하드웨어의 머신러닝 추론을 가속화하는 데 중점을 둔 추론 엔진으로, 속도와 정확성에 집중해 기존 모델에서 일련의 최적화를 수행합니다.

MIGraphX는 이제 동적 배치라는 새로운 기능을 지원합니다. ROCm 5.7 이전에는 배치 크기가 다르면 고객이 다른 모델을 컴파일해야 했습니다. 데이터 입력에 따라 여러 배치 크기로 모델을 실행하려는 고객은 이제 이러한 새 기능으로 컴파일된 단일 모델을 사용해 여러 배치 크기를 지원할 수 있으므로 머신러닝 워크플로를 간소화하고, 스토리지 공간 요구 사항을 낮추고, 시스템에서 사용할 모델을 결정하는 데 필요한 스크립트 논리를 줄일 수 있습니다.

이산 분포에서 rocRAND RNG 성능 향상

ROCm 오픈 소스 소프트웨어 플랫폼의 일부인 rocRAND 라이브러리는 AMD 그래픽에서 난수를 생성하는 함수를 제공하는데, 이는 시뮬레이션, 통계 모델 및 머신러닝 알고리듬 응용 분야에 적합합니다.

ROCm 업데이트 5.7에서 이뤄진 다른 업데이트와 함께, rocRAND의 난수 생성(RNG) 성능은 이산 분포에서 최대 15% 향상되어, 해당 응용 분야에 AMD 하드웨어를 적용하는 고객이 효율성을 높이고 결과 도출 시간을 단축할 수 있습니다.

AMD는 기존 기술과 신기술 모두를 지속적으로 개선하여 HPC 및 머신러닝에서 고객의 응용 방식을 강화하고 있습니다. 고객이 더 뛰어난 결과를 얻을 수 있도록 쉽게 이용 가능한 오픈 소스에 집중하고 있기에, 파트너는 앞으로 수년간 비즈니스 목표를 지원할 업계 최고 제품을 제공한다는 확신을 가지고 고객에게 AMD 제품을 굳건하게 계속 선보일 수 있습니다.

ROCm 업데이트 5.7에 대한 자세한 내용은 여기에서 AMD 블로그 게시물을 읽어보세요. HPC 분야의 AMD 제품 및 기술에 대한 자세한 내용은 AMD 담당자에게 문의하거나 여기로 문의하세요.

각주
  1. 2022년 11월, 클럭당 2X의 Bfloat16 계산을 수행하는 AMD Radeon™ RX 7900 XTX(2.5GHz의 부스트 클럭, 96개의 CU)와 클럭당 1X의 Bfloat16 계산을 수행하는 AMD Radeon™ RX 6900 XT 그래픽 카드(2.25GHz의 부스트 클럭, 80개의 CU)를 비교한 AMD 내부 측정에 기초합니다. RX-821.