未分類

ハイパースケーラーが CapEx を緩めない 6 つの理由 — 戦略・物理・歴史/現場 の 3 層

「ハイパースケーラーはそろそろ CapEx を緩めるのではないか」という問いをよく聞く。論拠は大きく 2 つで、中国は蒸留で安くフロンティアモデルを真似でき、LLM の世代差はせいぜい数ヶ月早く良くなる程度しかない、というものだ。

だがこの 2 点だけで「投資を緩める」と結論するのは、議論として弱い。直近 1 週間で自分が書いた記事 5 本を読み直すと、緩めない理由は 戦略・物理・歴史/現場 の 3 層から 6 本柱で説明できる。3 層はフラットに並ぶのではなく、上から条件が積み重なる階層構造になっている。

  • ①② 戦略:そもそも「買い続けるか、降りるか」の意思決定を「買い続ける」に押す
  • ③ 物理:①② で「買う」と決めた以降、世代更新ペースの天井(緩めると競合に負ける下限)を HBM の積で決める
  • ④⑤⑥ 歴史/現場:①② の意思決定が現実に反転していないことを実証データで確認する
ハイパースケーラーが CapEx を緩めない 6 つの理由を、戦略・物理・歴史/現場 の 3 層に整理した俯瞰図
図 1:6 本柱の俯瞰。①② が「買う」を決め、③ が更新コストの下限を決め、④⑤⑥ がそれを実証する

① 戦略の論理 — 跳躍が来た日に席がないと本業ごと吹き飛ぶ

ビッグテックが買っているのは「数ヶ月の性能優位」ではなく、能力の跳躍が来た日に席を持っていなかった場合の本業崩壊に対する保険である。検索・クラウド・オフィスの兆円規模の利益プールは、跳躍に乗り遅れた瞬間に下流にスライドする。Yahoo が Google に飲み込まれ、Nokia が iPhone に消されたのと同じ構造だ。

跳躍が来なければ減損するのは投じた CapEx の一部にすぎないが、跳躍が来た日に席がなければ本業ごと取り崩される。期待値ではなく最悪損失の非対称性で決まる賭けなので、保険料率としては高くない。中国の蒸留があるからこそ、最初に商用化して新しい独占席を押さえる競争では、フロンティアを持っていない側に不利が残る。

詳細は AI への過剰投資はなぜ合理的か — 非対称な保険と 4 つの狙い で展開した。

② 戦略の論理 — 4 つの狙いのどれかが当たればペイする

同じ記事で整理した 4 つの狙いも、緩めない理由として独立に効く。

  • 防衛:検索 → 答えエンジン、Office → エージェント、クラウド → AI ワークロードへのアップグレード
  • 新関所:AI エージェント=意図ルーターが App Store の次の通行料を取る
  • 人件費 TAM:SaaS 年商 0.4 兆ドルではなく、世界のホワイトカラー労働市場の数十兆ドル
  • R&D 乗数:創薬・素材・半導体設計、究極的には AI が AI を設計するフライホイール

ここで桁が効く。米ビッグ 4 の 2026 年 CapEx 計画は 約 7,250 億ドル(前年比 +77%) で、すでに世界の SaaS 市場の年商 0.4 兆ドルを超えている。既存ソフトウェア市場の枠で売る限り回収できない金額なので、人件費 TAM か R&D 乗数のどちらかに届かないと辻褄が合わない。

逆に言えば、4 つのうちどれか 1 つが当たれば保険料はペイする。同時に 4 つ全部が外れる確率を見積もって投資を止めるのは、最悪損失の非対称性を受け入れる以上に難しい賭けになる。

参照: AI への過剰投資はなぜ合理的か

③ 物理の論理 — 緩めると Watt あたりトークン単価で競合に負ける

ここから論理の質が変わる。①② は「買い続けるか降りるか」の意思決定だが、③ は「買い続けると決めた以上、世代更新を緩めても競合に負ける」という競争圧力の話で、買い手の裁量の外にある下限を決める。

推論時代の GPU の最高 KPI は「トークン throughput」で、その天井は HBM size × HBM 帯域 の積で物理的に決まる。バッチサイズの天井は HBM size(KV キャッシュを HBM に載せきる必要がある)、per-user トークン速度の天井は HBM 帯域(decode のたびに重みと KV キャッシュを読みに行く)。NVIDIA は世代ごとにこの積を 2 倍にしてくる(A100 → H100 → B100 → Rubin)。

ここで効くのは、MW あたりのトークン throughput が世代ごとに数倍改善するという事実だ。同じ電力・同じデータセンター床面積で吐けるトークン数が、世代を更新するだけで桁が変わる。これがハイパースケーラーに何を強制するか。

  • 最新世代を買った CSP は、同じ料金で 2 倍のトークンを売れる
  • 古い世代に留まる CSP は、トークン単価で削られる
  • 結果、料金を維持しても利幅で負け、料金を下げても採算で負ける

つまり「物理の天井」は需要が積み上がるのではなく、世代を更新しないと負ける下限(最低更新ペース) を物理が決めている。ハイパースケーラーが意図的に減らそうとしても、競合が更新する以上、減らした分だけトークン単価で負け、結局買い戻す。囚人のジレンマ型の縛りで、ジェンスン・フアン自身が御三家(Samsung / SK hynix / Micron)に技術督促をしに行く構図は、この下限を高く維持する装置として効く。

NVIDIA が売る/HBM が進化することと、ハイパースケーラーが買い続けることは、別個のサイクルではない。①② で「降りない」と決めた瞬間に、③ の競争圧力が自動的に効き始める。これが ③ の正確な位置づけ。

詳細は AI 半導体エンドゲーム推論 2026(I):トークン経済学の第一原理は HBM の積で決まる を参照。

④ 歴史の論理 — ジェブンズのパラドックス、効率化は需要を増やす

「LLM が安く真似される=メモリ需要が減る」という等式は、過去 50 年の半導体・通信史で一度も成立していない。経済学にはこれを 1865 年の時点で観察した名前があって、ジェブンズのパラドックス(資源の効率が良くなると、資源使用量は減るのではなく、むしろ増える)と呼ぶ。

時代効率化需要の振る舞い
1990sダイヤルアップ → 光ファイバー動画ストリーミング・EC・SNS が乗ってきて爆増
2000s2G → 3G → 4G → 5G1 ユーザー月間データ消費量が 10 年で 2 桁の伸び
2010s仮想化・コンテナ化AWS 売上 2013 年 31 億ドル → 2020 年 460 億ドル(15 倍

トークン単価が下がると、これまで「AI が高すぎて諦めていた用途」が次々と入ってくる。長いコンテキスト、大きいモデル、エージェント連鎖、コード生成、画像と動画。市場のパイそのものが拡張する。

ベア視点が「効率化=需要減」を仮定するから議論として成立しているのであって、その前提自体が歴史的に成立した試しがない。詳細は ベア視点の落とし穴 — メモリ・スーパーサイクルとジェブンズのパラドックス でまとめた。

⑤ 現場の論理 — 「来年もサーバー運用費を上げます」

ここから先は抽象論ではなく現場の生のシグナルだ。

韓国の音楽関連 AI プラットフォーム業者が、企業版契約を結んでいる顧客に 「サーバー運用費(トークン使用量)が増えているので来年も値上げします」 と直接通知してきた。他産業の AI プラットフォーム業者の話も同じで、顧客企業が新しい AI モデルを次々要求し、サーバー運用費が押し上げられている。

これが何を意味するか。AI をすでにうまく使っている集団が、より深く、より広く使い始めている。 導入段階の需要増加ではなく、定着段階での使用量爆増だ。一度業務に組み込んだ会社は止まらず、長いコンテキスト・多数のユーザー・複雑なモデルへどんどん拡張する。

「導入が一段落したら需要が落ち着く」というベアの仮説の真逆が、業者の請求書側から立ち上がってきている。出典: ベア視点の落とし穴

⑥ 現場の論理 — 「2030 年まで自社株を売るな」

メモリ装置メーカー Lam Research の社長が、社員に対し 「2030 年まで自社株を売るな」 と社内で強調したと、同社 7 年目の現役社員から伝わってきた。Lam はメモリ製造のエッチング・堆積のコアサプライヤーで、HBM 生産に不可欠な装置群を握っている。

会社の社長が社員に自社株の長期保有をわざわざ強調するのは、ただの言葉ではない。装置メーカー社内で見えているメモリ資本支出サイクルの終わりが、2030 年よりずっと後だというシグナルだ。

ベアが描く「2027〜2028 年ピークアウト」のタイミングとは、明らかに話が違う。装置側はメモリ各社の発注計画から逆算してサイクルを見ているので、ハイパースケーラーがその時期に CapEx を緩めるなら、装置側にもとっくに見えているはずだ。それがない。出典: ベア視点の落とし穴

留意点 — 緩むなら需要側ではなく供給側で緩む

ここまでは「緩めない」を 6 本柱で説明した。フェアにいうと、緩まないわけではない。緩むなら 需要側ではなく供給側 で緩む。

ハイパースケーラーの CapEx が緩むとしたら、それは需要側ではなく供給側(外部資本と電力)であることを左右パネルで示す対比図
図 2:6 本柱は需要側を否定。CapEx が止まる引き金は、外部資本の調達コスト上昇と電力接続キューの 2 つに移った

すでに 4 社の 2026 年 CapEx は営業 CF の枠を超え、外部調達なしでは回せなくなっている。Alphabet は 6 月 2 日に 847.5 億ドルの株式を発行し、Amazon は 3 月に史上最大級の 500 億ドル近い社債を出し、Meta は Hyperion データセンターで Blue Owl との 270 億ドルの SPV を組成した。NVIDIA でさえキャッシュが潤沢なまま 250 億ドルの社債を発行している(投資家需要は 850 億ドル)。「自己資金時代の終わり」 という Bridgewater の表現が、6 月時点でほぼ全 4 社に当てはまる。

外部資本の蛇口が閉まれば緩む。もう 1 つの引き金は電力で、北バージニア・フェニックス・ダラスのグリッド接続キューは 4〜7 年待ち、米国インターコネクション・キューには 2,300 GW(米国全設備容量超)が滞留している。12 州でデータセンター・モラトリアム法案が提出され、2026 年計画の DC 12〜16 GW のうち半数がキャンセルか遅延している。「払う気はあるのに動かない」リスクが現実化すれば、CapEx の額そのものは緩まなくても、回収側のラグから止まる。

詳細は データセンターのコスト構造 — 部材インフレとハイパースケーラーの限界線 でまとめた。なお、メモリ供給側の中長期構造を 9 トラックで整理した 「メモリー税」9 トラック整理 も同じ時期の参照記事として並ぶ。

まとめ — 1 行で

ハイパースケーラーが CapEx を緩めない理由は 3 層に積み重なる。①② 戦略(保険・TAM)が「降りない」を決め、③ 物理(HBM の積が決める Watt あたりトークン単価の下限)が「緩めると競合に負ける」を強制し、④⑤⑥ 歴史/現場(ジェブンズ・値上げ通知・装置側の長期観)がそれを実証する。蒸留と性能差の議論は需要側の話で、3 層はそれを「だからこそ緩めない」に反転させる。緩むとしたら、それは外部資本コストと電力接続キューという供給側からの引き金で、需要が萎んだからではない。


参照した自記事

本稿は以下 5 本の自記事の論点を 6 本柱に統合し直したもの。各クレームの一次出典・ファクトチェックは個別記事側に置いてある。