AMD Ryzen AI Software banner

개요

AMD Ryzen™ AI 소프트웨어는 AMD Ryzen AI AI 기반 PC에서 AI 추론을 최적화하고 배포하기 위한 도구 및 런타임 라이브러리를 포함합니다1. Ryzen AI 소프트웨어를 사용하면 AMD XDNA™ 아키텍처에 구축된 신경 처리 장치(NPU)에서 애플리케이션을 실행할 수 있습니다. 이 아키텍처는 Windows x86 프로세서2에 탑재된 최초의 전용 AI 처리 실리콘이며 통합 GPU(iGPU)를 지원합니다.

이미지 확대
Ryzen developer flow diagram

개발 흐름

Ryzen AI를 위한 AI 애플리케이션 개발은 3가지 간단한 단계로 요약할 수 있습니다.

사전 학습된 모델로 시작
PyTorch 또는 TensorFlow에서 사전 훈련된 모델을 시작점으로 사용합니다. 그런 다음 모델을 Ryzen AI 워크플로와 호환되는 ONNX 형식으로 변환합니다.

양자화
매개 변수를 부동 소수점에서 16비트 또는 8비트 정수와 같은 낮은 정밀도 표현으로 변환하여 모델을 양자화합니다. ONNX용 Vitis™ AI 퀀타이저는 이를 위해 사용하기 쉬운 학습 후 양자화(PTQ) 흐름을 제공합니다.

모델 배포
양자화 후에는 모델을 하드웨어에 배포할 수 있습니다. C++ 또는 Python API와 함께 ONNX 런타임을 사용하여 AI 모델을 배포합니다. ONNX 런타임에 포함된 Vitis AI Execution Provider는 워크로드를 최적화하여 최적의 성능과 낮은 전력 소비를 보장합니다.

Ryzen AI 소프트웨어 사용 시작

시작하기

Ryzen AI 동영상

Ryzen AI 300 시리즈 PC가 NPU와 통합 GPU를 모두 사용하여 대규모 언어 모델 워크로드를 가속화하는 방법에 대한 비디오 자습서를 확인하세요.

새로워진 사항 

1.7 릴리스 하이라이트

  • 새로운 아키텍처: MoE(Mixture of Experts) GPT-OSS 및 VLM(Gemma-3 4B)의 첫 릴리스
  • 통합된 환경을 위해 주 Ryzen AI 설치 프로그램에 Stable Diffusion이 통합됨
  • 이제 LLM이 NPU에서 최대 16K 컨텍스트 길이를 지원함
  • RAI 1.6에 비해 약 2배 낮은 지연율을 제공하는 BF16 파이프라인

1.6 릴리스 하이라이트

  • BF16 컴파일러의 성능 향상 및 컴파일 시간 단축
  • 일반 비대칭 양자화를 지원하는 새로운 정수 컴파일러(A8W8, A16W8)
  • 성능이 최적화된 확장된 NPU 전용 모델 세트(KRK 및 GPT에서 더 높은 초당 토큰)
  • 모든 LLM에 대해 컨텍스트 길이가 4K까지 증가
  • 새로운 LLM 아키텍처 지원 추가: PHI-4 및 Qwen-3
  • SD 3.0/3.5에 대한 동적 해상도 지원, 새로운 추가 기능(SD2.1-v 768 × 768 text2image, SDXL-base 1024 × 1024 text2image)을 포함한 기타 SD 모델의 성능 향상

1.5 릴리스 하이라이트

  • 새로운 기능
    • Stable Diffusion 파이프라인(SD 1.5, 2.1, SDXL, 3.0)을 사용한 영상 생성
    • Zipformer와 Whisper 기반 모델을 지원하는 음성-텍스트 기능 통합
    • 우선 순위가 높은 작업에 컴퓨팅 리소스를 동적으로 할당하는 Pre-emption을 통해 시스템 응답 속도 최적화

1.4 릴리스 하이라이트

  • 새로운 기능
    • LLM 및 일반 모델 흐름(INT8, BF16)을 모두 갖춘 통합 설치 프로그램으로 단일 릴리스 패키지의 모든 모델 유형을 지원하는 원활한 환경 제공
    • CNN 및 NLP 워크로드에 대한 BF16 모델 컴파일 및 양자화를 위한 Windows 지원의 첫 번째 릴리스
    • LLM OGA Flow 지원을 통해 효율적으로 LLM 배포
  • 새로운 LLM 모델 지원
    • DeepSeek-R1 Distill 시리즈: Llama-8B, Qwen-1.5B, Qwen-7B 
    • Qwen2 시리즈: Qwen2-1.5B, Qwen2-7B 
    • Gemma2-2B 
    • AMD-OLMO-1B-SFT-DPO  
    • Codellama-7B, Mistral-7B 등

1.3 릴리스 하이라이트

  • 새로운 기능 
    • AMD 통합 퀀타이저 'Quark'에 대한 초기 지원
    • 혼합된 정밀도 데이터 유형 및 Copilot+ 앱 지원
    • 업데이트된 CNN 프로파일링 도구 
  • ONNX-GenAI(OGA) 흐름에 대한 새 모델 지원 
    • Llama2-7B-Chat / Meta-Llama-3.1-8B
    • Phi-3-Mini-4K-Instruct / Phi-3.5-Mini-Instruct
    • Mistral-7B-Instruct-v0.3

1.2 릴리스 하이라이트

  • 새로운 아키텍처 지원 
    • Strix(STX) 지원: AMD Ryzen™ AI 9 HX370 및 Ryzen AI 9 365 NPU 
    • Ryzen AI 소프트웨어를 통해 통합 GPU(iGPU) 및 NPU를 통합적으로 지원
  • 새로운 얼리액세스 도구, 모델 및 기능 
    • NPU(AI Analyzer)에서 실행되는 모델을 위한 새로운 모델 분석, 프로파일링 및 시각화 도구
    • 새로운 플랫폼/NPU 검사 및 관리 도구(xrt-smi)
    • PyTorch 및 ONNX 흐름 모두에서 다중을 위한 LLM 흐름 지원

1.1 릴리스 하이라이트

  • 새 모델 지원:
    • w4abf16(3비트 및 4비트) 양자화(베타)를 지원하는 Llama 2 7B
    • Whisper 기반(얼리액세스)
  • 새로운 EoU 도구 및 기능:
    • RyzenAI-SW Rep의 CNN 벤치마킹 도구
    • 플랫폼/NPU 검사 및 관리 도구

1.0 릴리스 하이라이트

  • 모델 지원
    • 1,000개 이상의 검증된 CNN 모델
    • PyTorch 및 ONNX 흐름을 사용하는 NPU의 OPT-1.3B
  • EoU 도구 및 기능
    • ONNX PTQ(학습 후 양자화), PyTorch PTQ 및 QAT(양자화 인식 학습) 지원
    • C++ 및 Python API를 모두 사용하여 ONNX 런타임 Vitis AI 실행 공급자 지원
    • NPU에서 최대 8개의 동시 추론 세션을 자동으로 예약

오픈 소스 프로젝트

개발자가 다양한 하드웨어에서 AI 모델을 효율적으로 분석, 최적화, 배포할 수 있도록 지원하는 AMD의 오픈 소스 도구에 대해 알아보십시오.

Digest AI

Digest는 머신 러닝 모델에서 귀중한 인사이트를 추출하여 최적화하고 직접 수정할 수 있도록 지원하는 강력한 모델 분석 도구입니다. 

GAIA

GAIA는 CPU, GPU, NPU 하드웨어에서 프라이빗 및 로컬 LLM을 실행하는 다중 에이전트 RAG 파이프라인을 시연하는 생성형 AI 애플리케이션입니다.

TurnkeyML 및 Lemonade

TurnkeyML은 노 코드 CLI 및 로우 코드 API를 제공하므로 ONNX 에코시스템 내에서 도구를 간편하게 사용할 수 있습니다. Turnkey를 사용하면 CNN 및 Transformer에 대한 ONNX 모델을 내보내고 최적화할 수 있습니다. Lemonade를 사용하면 CPU, GPU, NPU에서 LLM을 제공하고 벤치마킹할 수 있습니다.

등록한 후 Ryzen AI 소식 받아보기

최신 제품 출시 정보, 뉴스, 팁을 확인해 보세요.

각주
  1. Ryzen™ AI 기술은 Ryzen 5 7540U와 Ryzen™ 3 7440U를 제외한 모든 AMD Ryzen™ 7040 시리즈 프로세서와 호환됩니다. OEM 지원이 필요합니다. 구매에 앞서 PC 제조업체와 기능 사용 가능 여부를 확인하세요. GD-220.
  2. 2023년 5월 기준, AMD는 x86 Windows 프로세서에 사용 가능한 최초의 전용 AI 엔진이었으며, 여기서 '전용 AI 엔진'은 AI 추론 모델 처리 이외의 기능을 수행하지 않고 x86 프로세서 다이의 일부인 AI 엔진으로 정의됩니다. 자세한 내용은 https://www.amd.com/en/technologies/xdna.html을 참조하세요. PHX-3a
  3. 2023년 6월 5일 기준 AMD에 의한 테스트에 기초한 정보입니다. 배터리 지속시간 결과는 9명이 참가한 Microsoft Teams 화상 회의 시뮬레이션에서 Ryzen™ AI가 탑재된 Ryzen™ 7940HS 프로세서, 내장 Radeon 그래픽과 Windows Studio Effects를 사용한 경우와 AI 강화 배경 블러 및 시선 교정 기능을 위한 NVIDIA Broadcast 및 NVIDIA GeForce RTX 4070 외장 그래픽을 사용한 경우를 비교하여 평가했습니다. AMD/NVIDIA 시스템은 전력 수준 100%에서 > 5% @150니트 밝기 및 “전력 효율”로 설정된 전력 모드로 실행되었습니다. 시스템 구성: Razer Blade 14” 랩탑, Ryzen™ AI가 탑재된 AMD Ryzen™ 9 7940HS 프로세서, 내장 AMD Radeon 그래픽(22.40.03.24 드라이버), 16GB(8GBx2) LPDDR5, NVMe SSD 스토리지, Windows 11 Home 22H, NVIDIA Broadcast를 갖춘 NVIDIA GeForce RTX 4070 그래픽(528.92 드라이버).   시스템 제조업체별 구성에 따라 다른 결과가 나올 수 있습니다. 결과는 다를 수 있습니다. PHX-51