2026年6月29日、AI半導体の設計思想を根本から覆す革新的なアーキテクチャが発表されました。Phantafieldが公開したホワイトペーパー『Sophon PFG-1: a monolithic-3D AI ASIC with 330 GB of on-die DRAM and no HBM』は、現在のAIブームの最大のボトルネックである「HBM(高帯域メモリ)への依存」と、それに伴う「メモリの壁(Memory Wall)」を完全に打ち砕く可能性を提示しています。

現在、世界のAIインフラは、NvidiaのGPUに代表される「演算器とHBMをインターポーザ上で結合する」スタイルが主流です。しかし、2026年第2四半期にはDRAM価格が前年比で最大89%も高騰し、HBMの供給不足がAI開発の足かせとなる「RAMpocalypse(メモリの黙示録)」が現実のものとなっています。この閉塞感を打破する存在として、突如現れた『Sophon PFG-1』の衝撃を、テックブログ「AI Watch」が深掘りします。

1. ニュースの概要:HBMを捨てた「真の3D積層」の登場

2026年6月29日に公開されたホワイトペーパーによれば、Sophon PFG-1は、従来のHBM(High Bandwidth Memory)を一切使用しません。その代わりに、**330GBもの大容量DRAMをロジックダイ(演算回路)の真上に直接、モノリシック(一体的)に積層**するという、これまで類を見ない構成を採用しています。

Sophon PFG-1の主なスペックは以下の通りです:

  • メモリ容量:330GB(オンダイDRAM)
  • 演算性能:4,200 TFLOPS (FP8) / 2,100 TFLOPS (BF16)
  • アーキテクチャ:モノリシック3D(M3D)積層
  • ダイサイズ:750 mm²
  • 演算タイル数:131,072 tiles

このチップの最大の特徴は、メモリと演算器の距離を「ミリメートル単位」から「ミクロン単位」へと劇的に短縮した点にあります。これにより、データ転送に伴うエネルギー消費と遅延を極限まで削減し、単体でGPT-4クラスの巨大モデルをフルスピードで推論・学習させることが理論上可能になります。

2. 技術的な詳細:モノリシック3D(M3D)とCIMの融合

Sophon PFG-1が実現した「HBM不要」の背景には、2つの重要な技術的ブレイクスルーがあります。

モノリシック3D(M3D)積層技術

現在のNvidia H100や、先日発表された次世代アーキテクチャ『Vera Rubin』が採用する「2.5D/3Dパッケージング」は、個別に製造したメモリ(HBM)とロジックダイを、TSV(シリコン貫通電極)を介して接続するものです。しかし、TSVは接続密度に限界があり、製造コストも極めて高価です。

一方、Sophon PFG-1が採用する「モノリシック3D」は、ロジックダイの上に直接DRAM層を順次形成(ファブリケーション)していく手法です。これにより、従来のTSVよりも数桁高い密度で垂直配線が可能になり、メモリ帯域は実質的に無限(理論値で100 TB/s超)へと近づきます。ホワイトペーパーでは、32層に及ぶ2D-TMD(遷移金属ダイカルコゲナイド)技術を用いたDRAM層の積層が言及されており、これが330GBという大容量を一つのチップに収める鍵となっています。

デジタルCompute-In-Memory (CIM)

Sophon PFG-1は、メモリを単なるデータの置き場としてではなく、演算の一部として活用する「Compute-In-Memory」を実装しています。各DRAMサブアレイには、バイナリ・センスアンプと8レベルの加算ツリーが統合されており、データの読み出しと同時に演算処理(積和演算など)を実行します。これにより、フォン・ノイマン・ボトルネック(CPUとメモリ間のデータ移動による遅延)を完全に排除しています。

3. 考察:ポジティブな展望と克服すべき懸念点

Sophon PFG-1が市場に与えるインパクトは計り知れませんが、同時に多くの課題も孕んでいます。多角的な視点から考察します。

ポジティブ:HBM供給網からの解放と圧倒的なコスト効率

最大の利点は、**「HBMガチャ」と呼ばれる極端な供給不足と価格高騰から脱却できること**です。2026年現在、SK HynixやMicronのHBM生産枠は2028年までほぼ埋まっており、AIスタートアップにとってハードウェアの調達は死活問題です。もしSophon PFG-1が一般的なファウンドリの既存ライン(あるいは改良ライン)で量産可能になれば、AIインフラのコストは劇的に低下します。

また、エネルギー効率の向上も無視できません。データ移動による電力消費がなくなることで、データセンターの運用コストを30%〜50%削減できる可能性があります。これは、AI主導の組織再編を進めるメガテック企業にとっても、インフラ維持費を抑える強力な武器となるでしょう。

懸念点:歩留まり(イールド)と熱設計の壁

一方で、技術的なハードルは極めて高いと言わざるを得ません。

  1. 製造の難易度:ロジック層の上にDRAM層を形成する際、下層のトランジスタを熱で損傷させない「低温プロセス」が必須です。実験室レベルでは成功していますが、750 mm²という巨大なダイで高い歩留まりを実現するのは至難の業です。
  2. 熱管理:330GBのDRAMと、4,200 TFLOPSを叩き出すロジック層が密着しているため、熱密度は凄まじいものになります。従来の空冷はもちろん、水冷でも追いつかない可能性があり、液浸冷却などの特殊なソリューションが必要になるかもしれません。
  3. エコシステムの不在:Nvidiaの強みはハードウェア以上に「CUDA」という強固なソフトウェア資産にあります。Sophon独自のCIMアーキテクチャを最大限に引き出すためには、PyTorchやTensorFlowからの高度なコンパイラ最適化が必要であり、開発者コミュニティを惹きつけられるかが成否を分けます。

4. まとめ:AI半導体の「脱・Nvidia」は加速するか

Sophon PFG-1の登場は、AI半導体競争の主戦場が「いかに多くのHBMを並べるか」から、「いかにメモリを演算器に近づけるか」へとシフトし始めたことを象徴しています。特に、ジェフ・ベゾス氏が計画する「AIによる製造業の刷新」のような、物理世界でのリアルタイム処理が求められる分野では、低遅延・高効率なオンダイメモリ・チップの需要は爆発的に高まるはずです。

また、OpenAIが推進する「AI OS」構想においても、デスクトップPCやエッジデバイスで巨大なLLMをローカル動作させるためには、Sophon PFG-1のような「シングルチップで巨大なメモリを持つ」アーキテクチャが理想的です。

現時点ではホワイトペーパー段階の構想という側面が強いものの、2026年の「メモリ危機」を背景に、この「メモリの壁」への挑戦は、AIの民主化を一段階進める大きな一歩となるでしょう。Nvidiaの独走を止めるのは、ライバルのGPUではなく、こうした「全く異なる幾何学」を持つチップなのかもしれません。

参考文献