2026年5月30日、テック業界の視線は一つのスタートアップに注がれています。MIT発のスタートアップであり、「脱・トランスフォーマー(Non-Transformer)」の旗手として知られるLiquid AIが、最新の基盤モデル「LFM 2.5-8B-A1B」を公開しました。これは、単なるマイナーアップデートではありません。AIの歴史を塗り替えてきたTransformerアーキテクチャの「限界」を、数学的なアプローチで克服しようとする野心的な挑戦です。
1. ニュースの概要:エッジAIの常識を覆す「LFM 2.5」の登場
Liquid AIは、現地時間2026年5月28日、公式ブログおよびHugging Faceを通じて、新しいLiquid Foundation Model(LFM)ファミリーの最新作「LFM 2.5」を発表しました。このリリースの中でも特に注目を集めているのが、8.3B(83億)の総パラメータを持ちながら、推論時にはわずか1.5B(15億)のみを活性化させるMixture-of-Experts(MoE)モデル「LFM 2.5-8B-A1B」です。
このモデルの最大の特徴は、その学習データ量にあります。前バージョンであるLFM 2の12兆トークンから大幅にスケールアップし、38兆トークンという、MetaのLlama 3シリーズら巨大モデルに匹敵する膨大なデータセットを用いて事前学習が行われました。これにより、小型モデルでありながら、従来の巨大なTransformerモデルを凌駕する知能と、エッジデバイスでの快適な動作を両立させています。
2. 技術的な詳細:38兆トークンと「LIV」アーキテクチャの融合
LFM 2.5が示す技術的なブレイクスルーは、以下の3点に集約されます。
① 圧倒的な学習効率と「38兆トークン」の重み
通常、8Bクラスのモデルに38兆トークンもの学習をさせることは、データの過学習(Over-training)のリスクを伴うと考えられてきました。しかし、Liquid AIは独自の「Liquid Neural Networks(LNN)」から発展したアーキテクチャを採用することで、モデルの知識容量を極限まで引き出すことに成功しました。これにより、数学ベンチマーク(MATH500)で88.76、命令追従(IFEval)で91.84という、数倍の規模を持つTransformerモデルに匹敵するスコアを叩き出しています。
② LIVコンボリューションとGQAのハイブリッド
LFM 2.5は、純粋なAttentionメカニズムに依存していません。モデルの24層のうち、18層は「double-gated LIV (Linear Input Varying) convolution」ブロックで構成され、残りの6層にのみGrouped Query Attention (GQA)が採用されています。このハイブリッド構造により、Transformerの最大の弱点であった「コンテキスト長に伴う計算コストの二次関数的な増大」を回避。128,000トークンという長いコンテキストを、メモリ消費を抑えつつ高速に処理することが可能です。
③ 「Reasoning-only」モデルへの大胆なシフト
興味深いことに、LFM 2.5-8B-A1Bは、回答の前に必ず「Chain of Thought(思考の連鎖)」を明示的に生成する「推論特化型」として設計されています。これは、MoEアーキテクチャによって1トークンあたりの計算コストが極めて低い(1.5Bアクティブパラメータ)という特性を活かし、ユーザーへの最終回答の質を高めるための戦略的な選択です。
内部リンク: AIエージェント運用の理想と現実:Stripeの自動化アーキテクチャとAmazonが直面した責任の所在
3. 考察:次世代アーキテクチャの真価と懸念点
LFM 2.5の登場は、AI開発のパラダイムが「モデルの巨大化」から「アーキテクチャの効率化」へ明確にシフトしたことを象徴しています。ここで、そのポジティブな側面と潜在的な懸念点を深く掘り下げてみましょう。
ポジティブな側面:エッジAIの主権と「脱・クラウド」
LFM 2.5は、iPhoneやAndroid、あるいはM5 Max搭載のMacBookといった一般的なコンシューマーデバイス上で、1秒間に数百トークンという驚異的な速度で動作します。これは、プライバシーが重視されるパーソナルアシスタントや、リアルタイム性が求められる産業用ロボットにおいて決定的な優位性を持ちます。
特に、インターネット接続を介さずに高度な推論が可能な点は、データ主権を重視する企業にとって福音となるでしょう。これは、昨今問題となっている「AIスロップ(粗製濫造)」によるウェブ汚染への対抗策としても機能します。質の高い推論をローカルで行うことで、低品質なクラウド生成コンテンツに頼らない独自のワークフローを構築できるからです。
内部リンク: 「AIスロップ(粗製濫造)」時代の生存戦略:コンテンツの質の担保と垂直統合型サービスの重要性
懸念点:エコシステムの壁と「特化型」の限界
一方で、懸念も残ります。現在のAI開発エコシステムは、NVIDIAのCUDAやPyTorch、TensorRTなど、Transformerに最適化されたツール群によって強固に守られています。Liquid AIが提供するLEAPプラットフォームや、llama.cpp、MLXへの対応は進んでいるものの、Transformerが築き上げた巨大なライブラリやコミュニティの資産を完全に代替するにはまだ時間がかかるでしょう。
また、LFM 2.5は「物理センサーデータの処理」や「論理推論」には極めて強いものの、小説の執筆といった「情緒的な長文生成」においては、依然としてTransformerベースのモデルに一日の長があるとの指摘もあります。Liquid AIは「汎用チャットボット」ではなく、実世界でタスクを遂行する「エージェント」のためのエンジンを目指していることが伺えます。
内部リンク: AIエコシステムの覇権争い:囲い込みを強めるプラットフォーマーと、生存を賭けたスタートアップの提携戦略
4. まとめ:2026年、AIの「知能」はポケットの中に
Liquid AIによるLFM 2.5の公開は、Transformer一強時代に終止符を打つ可能性を秘めた出来事です。38兆トークンという「力押し」の学習を、洗練された「非アテンション型アーキテクチャ」で受け止める。この組み合わせこそが、私たちが待ち望んでいた「真に実用的なAI」の姿なのかもしれません。
今後、このモデルがドローンや自動運転、あるいは個人のモバイルデバイスに深く組み込まれていく中で、AIの安全性や倫理に関する議論も新たな局面を迎えるでしょう。例えば、オフラインで動作する高度なAIは、監視社会を加速させるのか、あるいはプライバシーを守る砦となるのか。カナダでの銃撃未遂事件でChatGPTの利用が問題となったように、モデルの効率化は、その悪用のリスクもまた「エッジ(現場)」に引き寄せることになります。
内部リンク: 生成AIは「監視者」になるべきか:カナダの銃撃未遂事件から問われる、OpenAIの倫理的ジレンマとプライバシーの境界線
内部リンク: AI安全思想と軍事利用の不可避な衝突:Anthropicと米国防総省の対立が露呈させた「安全指針」の限界
Liquid AIが示した「効率的な知能」のロードマップは、2026年後半のAIトレンドを決定づけるものになるはずです。AI Watchでは、今後もこの「液体のように変化する」新しいアーキテクチャの動向を追い続けていきます。