1. ニュースの概要:AI半導体市場に走る衝撃
2026年7月、AIインフラストラクチャの最適化を手掛けるWafer.aiは、AMDの最新AIアクセラレータ「Instinct MI355X」を用いた次世代大規模言語モデル(LLM)『GLM5.2』のベンチマーク結果を公開しました。この報告は、AI業界全体に激震を走らせる内容となっています。
最大の特徴は、AMD MI355Xが1ノードあたり2626 tokens/sという驚異的な推論速度を記録し、競合であるNVIDIAの最新アーキテクチャ「Blackwell(GB200/B200)」と比較して、コスト効率において2倍以上の優位性を示したという点です。これまで「性能のNVIDIA、コストのAMD」という構図はありましたが、今回のベンチマークは、最先端モデルの推論においてAMDが純粋なパフォーマンスと経済性の両面でNVIDIAの牙城を崩しつつあることを示唆しています。
特に、2026年3月にNVIDIAのジェンセン・フアンCEOが「AGIへの到達」を宣言し、市場がその実利を厳しく問い始めている中で、この「2倍のコスト効率」という数字は、大規模AIモデルを運用する企業にとって無視できない選択肢となっています。
2. 技術的な詳細:MI355XとGLM5.2が導き出した「2626 tok/s」の正体
今回のベンチマークの核となるのは、AMDのCDNA 4アーキテクチャを採用した「Instinct MI355X」と、Zhipu AIが開発した最新鋭モデル「GLM5.2」の組み合わせです。
AMD MI355Xのスペック的優位性
MI355Xは、前世代のMI300Xからメモリ帯域幅と容量を大幅に強化しており、288GBのHBM3eメモリを搭載しています。LLMの推論、特にGLM5.2のような巨大なパラメータを持つモデルにおいて、ボトルネックとなるのは演算性能(FLOPS)よりもメモリ帯域(Memory Bandwidth)です。AMDはこの点において、NVIDIA Blackwellよりも広大なメモリ帯域を確保することで、トークン生成速度を極限まで高めることに成功しました。
GLM5.2の最適化
GLM5.2は、Mixture-of-Experts(MoE)構造をさらに進化させたモデルであり、推論時のアクティブなパラメータ数を抑えつつ、高い知能指数を維持しています。Wafer.aiの報告によれば、AMDのソフトウェアスタックである「ROCm 7.0(2026年最新版)」がこのMoE構造の動的ルーティングを極めて効率的に処理しており、1ノード(8枚のGPU構成)で2626 tokens/sという、リアルタイム対話の限界を遥かに超えるスループットを実現しました。
Blackwellとの比較:TCO(総保有コスト)の逆転
Wafer.aiの試算によれば、NVIDIA Blackwell(GB200)システムは単体性能では依然として強力であるものの、チップの入手価格、消費電力、および冷却コストを含めた「100万トークンあたりのコスト」において、MI355XはBlackwellの半分以下(2x lower cost)に抑えられています。これは、ハイパースケーラーやAIスタートアップにとって、同じ予算で2倍のユーザーを収容できる、あるいは推論コストを半分に削減できることを意味します。
3. 考察:ポジティブな側面 vs 懸念される課題
この結果をどう捉えるべきか。市場に与えるポジティブな影響と、依然として残る懸念点を深く掘り下げます。
ポジティブ:NVIDIA一強時代の終焉と「推論の民主化」
第一に、「NVIDIA独占」に対する強力な牽制となります。2026年に入り、Amazonの独自チップ『Trainium 3』や、イーロン・マスク氏の「Terafab」構想など、主要プレイヤーによる脱NVIDIAの動きが加速しています。AMDが汎用GPU市場でこれほど明確なコスト優位性を示したことは、クラウドベンダーがNVIDIAへの依存度を下げ、マルチベンダー戦略を強化する決定的な動機となります。
第二に、推論コストの劇的な低下です。GLM5.2のような高度なモデルが安価に運用できるようになれば、これまでコスト面で断念されていた「エージェント型AI」の大規模展開が可能になります。これはAI OSの普及を後押しする要因となるでしょう。
懸念点:ソフトウェアエコシステムと実効性能の乖離
一方で、手放しで喜ぶには早いという慎重な見方もあります。
- CUDAの壁: AMDのROCmは飛躍的に改善されましたが、依然としてAIエンジニアの間ではNVIDIAのCUDAエコシステムへの習熟度が高く、特定の最適化ライブラリ(TensorRTなど)を利用した際の実効性能ではNVIDIAが巻き返す可能性があります。
- サプライチェーンの安定性: 2倍のコスト効率があったとしても、AMDがNVIDIAと同等のボリュームでチップを安定供給できるかという懸念は残ります。
- 消費電力のジレンマ: コスト効率が良いとはいえ、MI355Xノードの絶対的な消費電力は極めて高く、データセンターの電力容量や冷却設備(液冷への完全移行など)が導入の障壁となる可能性があります。
4. まとめ:2026年、AIインフラは「多様性」の時代へ
AMD MI355Xが示した「Blackwellの2倍のコスト効率」は、単なるベンチマークの数字以上の意味を持ちます。それは、AIコンピューティングの主導権が「絶対的な演算性能」から「トークンあたりの経済合理性」へと移り変わった象徴的な出来事と言えます。
2026年3月にジェンセン・フアン氏が「AGI到達」を宣言した際、市場は冷ややかな反応を見せましたが、その理由は「AGIをどうビジネスとして持続させるか」という視点が欠けていたからでした。今回のAMDの躍進は、その問いに対する一つの解——すなわち「インフラの低コスト化」——を提示しています。
今後、OpenAIによる「AI OS(スーパーアプリ)」構想や、各社のエージェントサービスが本格化する中で、AMD MI355Xのような「高効率なエンジン」の存在感はさらに増していくでしょう。NVIDIA、AMD、そして自社チップを開発するビッグテック。AI半導体市場は、真の意味での戦国時代に突入しました。