エージェント型 AI 時代の到来

画像を拡大
Digital AI system interacting with multiple tools and environments

生成 AI により、推論および応答できるシステムが登場しました。

エージェント型 AI は、タスクの計画、実行、完了のためにそれらのシステムを強化します。

エージェント型 AI では、エージェントがアクションを実行します。目標を計画に変換し、データを取得して処理し、推論をトリガーし、ソフトウェア ツールを使用して最終的に結果を検証し、タスクが正常に完了するまでこれらの段階を繰り返します。

実際に、エージェント型 AI は単なる "チャットの相手" ではありません。それはデジタル アシスタントであり、ユーザーからのリクエスト、スケジュールされたジョブ、イベント、あるいは別のエージェントによってトリガーされるタスクを、ユーザーに代わってソフトウェアを操作することで完了してくれます。タスク完了のために採用されている初期のエージェントの例には、コーディング エージェント、調査エージェント、IT 自動化エージェント、およびビジネス プロセス エージェントが含まれます。

会話からアクションへの移行により、コンピューティングのバランスが根本的に変わります。エージェントは CPU 上で実行されるため、CPU コンピューティングに対する需要が飛躍的に増加し、AI のインフラストラクチャ要件が変化します。エージェント型 AI によって CPU の使用率が増加しますが、GPU の使用率も増加する可能性があります。エージェント型 AI は通常、インテリジェンスが要求される部分に AI 推論 (GPU 負荷の高いワークロード) を、タスク実行にツール (CPU 負荷の高いワークロード) を使用します。

モデルからシステムへ: AI を "エージェント型" にするもの

従来の AI 運用では、ユーザーがプロンプトを提示し、AI モデルが応答を提供するプロンプト/応答ループが中心でした。エージェント型 AI とは、主体性を持ったシステム、つまり 定義された範囲内 で独立してアクションを実行する能力を持つシステムのことを指します。エージェントは、単一のプロンプト/応答ループではなく、そのループをシステムへと拡張します。

  • リクエストとトークン化: 入力またはプロンプトの分解、エージェント型セッションの開始

  • 計画と取得: 企業内の知識をコンテキストとして取り込み、次に何をすべきか を決定するレイヤー

  • 推論と生成: メイン モデルによる推論が、応答をエージェントに送信、またはタスクの完了に必要な追加の指示をエージェントに提供
  • ツールの実行: アクションを起こすためにソフトウェア、サービス、API を横断して機能するレイヤー

  • 検証と応答: 応答の完全性と正確性を確認し、必要に応じてユーザーに結果を送信またはプロセスを反復
Agentic AI diagram

この独自のループ パターンがビジネス プロセスを変革しています。今や AI システムは仕事のコーパスとして機能しています。1 つのリクエストから多数のエージェントが生成され、それぞれが独立して動作しながらも定義された制約内でソフトウェア、データ、サービスとやり取りし、タスクが完了すると消滅します。

エージェント型 AI によって CPU の重要性が高まる理由

エージェントは CPU 上で実行されます。各エージェントは、エージェントが作成するすべてのタスクを処理するために、複数の CPU が必要です。エージェント型 AI が拡張されると、GPU の外部で発生する作業が増加します。

  • 多数の同時実行エージェントの調整
  • システムの状態とメモリの管理
  • エンタープライズ ソフトウェアに接続して操作
  • 制御パス ロジックおよび I/O の処理
エージェント型システムでは、これらのすべてをサポートするために CPU の 3 つの基本的な役割が存在します。

AI ホスト CPU

GPU の実行による推論効率を最大化するための、データの前処理および後処理を実行します。AMD EPYC 9005 高周波数 CPU は、優れた GPU 効率を実現します。

エージェント CPU

エージェント フレームワークのホスティングを担当します。ID 制御、予算、優先順位付けなどのポリシー制御を含む、CPU と GPU 全体のすべてのタスクを調整します。AMD EPYC 9005 CPU、特にコア数の多い CPU は、エージェント ワークロードのスケール アップに必要な演算能力を提供します。

ツール CPU

データベース、ストレージ、コンピューティング、検索など、標準的なエンタープライズ プラットフォーム全体で、複数のエージェントが生成したタスクを実行します。ツール CPU は、さまざまな CPU およびサーバー構成に存在します。AMD EPYC 9005 サーバー向け CPU は、パフォーマンス、コア数、価格帯を幅広く網羅したラインナップを提供し、ほぼすべてのサイズと規模に対応します。

優れたエージェント CPU とは

同時実行エージェントを拡張し、高負荷タスクの実行を可能にする高いコア数
データセンターのエージェント容量を最大化する電力効率
エージェントを拡張して需要に対応し、TCO を最小限に抑えることができるコスト効率
エンタープライズ ツールおよびフレームワーク向けの成熟したソフトウェア エコシステム

エージェント型 AI は根本的に汎用コンピューティングのパラダイムであり、これらの要件はそれを反映しています。

AMD EPYC 9005 Series

AMD EPYC サーバー向け CPU はエージェント型 AI に最適です

AMD EPYC™ 9005 シリーズ サーバー向け CPU は、次のような特長を備えているため、あらゆる規模の AI ワークロードをサポートするための最適な選択肢となっています。

  • 多数のエージェントを並行して実行できる、業界をリードするコア密度
  • 業界をリードする TDP あたりの最大 vCPU 数で、最適な電力効率を実現
  • TCO あたりのコア数の多さにより、理想的なコスト効率を実現
  • 堅牢なエンタープライズ x86 ソフトウェア エコシステムとのネイティブな互換性

AMD EPYC サーバー向け CPU は、スループットが重視される場面ではコア数の多い CPU を、応答性が重要な場面では高性能コアを使用するなど、多様なワークロードのニーズに合わせてインフラストラクチャを調整できるため、エージェント型 AI を画一的な設計に押し込める必要がありません。

エージェント型 AI に関するよくある質問 (FAQ)

エージェント型 AI は通常、推論、計画、ツールの使用、メモリ、フィードバックを組み合わせることで機能します。AI エージェントが目標を受け取り、計画を作成し、適切なツールまたはデータ ソースを選択し、アクションを実行し、結果を確認し、必要に応じて調整します。ユース ケースによっては、ビジネス アプリケーション、データベース、API、電子メール、チャット プラットフォーム、ワークフロー システムに接続することがあります。

生成 AI は、テキスト、画像、コード、要約、推奨などのコンテンツを作成します。エージェント型 AI はそこからさらに進化し、アクションを実行します。目標をステップに分割し、次に何をするかを決定し、ソフトウェア ツールを使用して情報を取得し、タスクを完了し、進捗状況を監視できます。多くの場合、エージェント型 AI は、より大きなワークフローの一部として、生成 AI を利用してインテリジェンスを提供します。

エージェント型 AI は、多くのビジネス機能にわたって複雑なワークフローをサポートできます。一般的なユース ケースには、カスタマー サービス、販売サポート、研究、ソフトウェア開発、データ分析、IT 運用、マーケティング、人事、財務、バック オフィスの自動化などがあります。たとえば、AI エージェントは見込み客の調査、CRM の更新、フォローアップ メールの下書き、次のステップのスケジュールが可能です。

エージェント型 AI は、組織の生産性向上、反復作業の削減、意思決定の迅速化、顧客と従業員のエクスペリエンスの向上を支援します。マルチステップ プロセスを管理できるため、システム、チーム、またはデータ ソース間の調整が必要な作業に特に役立ちます。また、日常的な作業や時間のかかる作業を処理することで、従業員がより価値の高いタスクに集中できるよう支援することもできます。

エージェント型 AI は、適切な制御機能を備えた設計であれば、安全かつ効果的です。重要な安全対策には、人間による監視、明確な許可、データ セキュリティ、監査証跡、テスト、承認ワークフロー、およびエージェントが実行できるアクションの制限などがあります。

リソース

AMD EPYC サーバー向け CPU

AI 展開の規模にかかわらず、AMD EPYC サーバー向け CPU は、企業の AI ワークロードや汎用ワークロード向けの高性能で電力効率に優れた基盤となります。

AMD Instinct GPU アクセラレータ

AMD Instinct GPU アクセラレータは、AMD CDNA™ 3 アーキテクチャをベースに構築され、マトリックス コア テクノロジを提供し、幅広い精度機能をサポートします。