未分類

前編:AI半導体エンドゲーム推論2026(I):トークン経済学の第一原理は HBM の積で決まる。原文は中国語のメモを日本語に翻訳・編集したもの。主要な数字は WebSearch で 2026 年 6 月時点の公開ソース(NVIDIA 公式、TrendForce、Bernstein、SemiAnalysis 等)に照合し、ファクトチェックは末尾にまとめている。

AI メモリ・サイクルが超長期化する核心 — 第一原理から需給ギャップ・CXMT 影響まで1枚に
図0(キラーチャート):パート I・II の結論を 1 枚に。第一原理 → 3 階層連動 → 需給ギャップ → CXMT 影響限定の順で因果が連なる

半導体の構造的進化が AI 推論の本線に至ったいま、内存と記憶域が最大のボトルネックになった。市場が内存・記憶域に対して抱いている懐疑は集約すると 3 つある。

  • HBM/DRAM/SSD は伝統的周期性から逃れられるのか?
  • HBM の指数増加に依存している GPU アーキテクチャの進化路線は、止まるのか?止まるならいつか?
  • CXMT(長鑫存儲)の拡産はどの程度の影響があるのか?この市場を再び周期の泥沼に引き戻すのか?

本稿では、これら 3 つを 1 つのフレームで整理する。

フレーム:周期性脱却の 3 条件

万物は周期を持ち、内存の周期性は特に強い。最大の原因は拡産周期が長すぎ、需要不足局面と容易にズレることだ。

伝統的周期性から脱却する方法はいくつか考えられる。

  1. カスタマイズ化:製品が互換不能で、生産能力を自由に移せず、長期契約が必須になる
  2. 構造的・指数級の需要増加:需要曲線が極めて急峻で、供給がずっと追いつかない
  3. 技術迭代の高速化:各世代が前世代を急速に陳腐化させる

どれか 1 つを満たせば部分的に脱却でき、2 〜 3 つを満たせば大部分を脱却できる。

HBM/DRAM/NAND が周期性脱却の3条件をどれだけ満たすか
図1:HBM はほぼ全条件、DRAM は構造的指数需要を獲得、NAND は技術側の自律規律次第。2 〜 3 条件達成で「成長型周期」へ転換する

このフレームを当てると、HBM は 3 条件のうち 2.5 を満たしている

条件 1:カスタマイズ化と長期契約(弱、0.5 条件)

HBM はカスタム性と NVIDIA との codesign を含むが、強くはない。本当にカスタムなのは封装と base die だけで、その上に積み上がる十数層の DRAM die は完全に JEDEC 標準化されている。

たとえば Samsung の HBM3E は 2024 年に NVIDIA qualification がしばらく通らず、NVIDIA 向けシェアが大きく落ちた局面でも、その分の生産能力は廃棄されず Google TPU(Broadcom 経由)や AMD に供給された(Samsung は 2025 年 9 月末に NVIDIA qualification をクリアしている)。物理的には、NVIDIA に渡る HBM3E と AMD に渡る HBM3E は同じものだ。生産能力は部分的に自由に移せる。

HBM4 以降のカスタム化はもう少し強くなる。base die にカスタムロジックや cache を統合し、より複雑な形では HBM4E のメモリコントローラやカスタム die-to-die インターフェイスを直接 logic base die に置く設計が進む。

SemiAnalysis は OpenAI/NVIDIA/AMD がそれぞれカスタム HBM の作業をしていると伝えているが、これは base die のカスタムで、上に乗る DRAM 層は依然として標準品である。

部分的なカスタム化のため、HBM は封装で協業が必須となり、客は長期契約を結ばざるを得ない。しかし生産能力自体は移せるので、ここは 0.5 条件

条件 2:構造的・指数級の需要増加(達成)

最も直感的な根拠は、NVIDIA の token factory のハードウェアアップグレードが、HBM 帯域のアップグレードと HBM size 需要の指数増加を引き起こすことだ。これはパート I の結論そのもの:

token throughput = HBM size × HBM 帯域、代々 2 倍

HBM size per GPU は概ね年 40% 超で増えていく。この需要曲線の急峻さは、DRAM 供給側の wafer +14%/年 × density +9%/年 では追いつくのが難しい。

ハードウェアの観点で、attention 段階の KV cache が極端に高い帯域と巨大な size を同時に要求するため、HBM は他の memory 候補に対して固有の優位を持つ。HBM が 3〜5 倍に高騰しても、HBM に予算を投じて得られる限界 throughput は他に投じるよりずっと効率が良い。

SRAM/HBF/CXL/PIM などの代替路線は、HBM の主力レーンである KV cache/attention で正面から競争できない。少なくとも今後 5 年、おそらくそれより長く、代替ルートは見えない。

条件 3:技術迭代の高速化(達成)

DDR3 から DDR5 までは 15 年を要したが、HBM は 2 年で 1 世代 が基本で、最近はむしろ加速傾向にある。HBM size × HBM 帯域 の積が代々 2 倍は、今のところ完全に当てはまる。

各世代の NVIDIA GPU の HBM 帯域は指数的に上がってきた:2 TB/s → 3.5 → 4.8 → 8 → 22 TB/s(H100 → H200 → B200 → Blackwell Ultra → Rubin の 22 TB/s)。HBM 帯域は推論トークン throughput と完全に線形なので、前世代の HBM を使う限界費用は急速に割が悪くなる。皆が最新世代を使いたがる動機が働く。

token factory 時代の論理は「技術アップグレード(HBM 帯域)を進めるほど儲かる」というものだ。

この迭代速度差は、CPU と似た構図を生んでいる。旧世代の価値が急速に減耗するため在庫保有の価値が下がり、HBM 厂の合理選択は「現状の生産能力で市場シェアを取り合う(quantity competition)」から「安定性と HBM 速度で技術競争し、次世代の NVIDIA platform qualification シェアを取りに行く(quality competition)」へと移った。結果として、伝統的周期の下行局面で「誰も減産したがらず全員が傷を負う」という囚人のジレンマが弱まる。

HBM は伝統的周期性から逃れられるか

3 条件のうち 2.5 を満たしている HBM は、伝統的周期性から逃れられるか。

「DRAM は commodity 性(差別化なし → 価格戦 → 在庫蓄積可能)を持つので周期性がある」というのが主流のナラティブだ。しかし commodity 性そのものは周期を生まず、振幅を増幅するだけだ。

周期性の主要な構造的源泉は、供給周期の長さが需要周期と容易にズレることにある。fab を 1 つ建てるのに 3 年・100 億ドル規模の不可逆な意思決定、需要側ではクラウド・モバイル・コロナ需要のような新範式が出るたびに爆発し、2 年で減速する。

万物は周期を持つ。HBM もここから完全に逃れることはできない。しかし、token 需要が指数的に伸び続ける限り、構造的な指数増加は周期性を弱める:需要の予測度が上がり、価格が下がれば客は HBM size を拡張する動機(throughput 増)が生まれる。HBM のカスタム性により長期契約が結ばれることも合わさり、伝統的周期性は「成長型周期性」に転換される。これは特に長いサイクルになる。

  • 周期性:上行サイクルで大きく儲け、下行サイクルで大きく損する
  • 成長型周期性:上行サイクルで大きく儲け、下行サイクルでも少し儲ける

加えて HBM/DRAM には、3 条件に上乗せされる 4 つ目の優位 がある。

条件 4:DRAM density scaling 鈍化による拡産難度の上昇

2000 年前後、wafer 1 枚あたり DRAM bit 密度は毎年約 45% 伸びていた。wafer 数を一切増やさなくても、毎年 +45% の供給増が得られていたわけだ。

10 年前には +20% に下がり、現在は 約 +9%/年 まで鈍化している。以前は新規 clean room なしでも年 +20〜30% の bit volume 増が得られたが、いまは wafer 数を増やすしかなく、新たな建屋・clean room が必要だ。

そしてもう 1 つの拡産難度は、HBM 自身の wafer 倍率だ。Micron は HBM:DDR5 = 3:1 の wafer conversion ratio を公表している。HBM3E は約 3 倍、HBM4 は積層密度の増加でおよそ 4 倍の DRAM wafer を必要とする。HBM bit を作るのに使う DRAM wafer 数が単調に増えており、実質的に通貨でいう通縮(同じ wafer から取れる HBM bit が減り続ける) に近い。

HBM 指数増加の路線は、いつ止まるのか

HBM の周期性が「成長型」から「伝統的」に戻る最大の要因は構造的指数増加なので、問いはこうなる:AI 推論時代、HBM の指数増加に依存する GPU アーキテクチャ進化は、いつ止まるのか?

token throughput = HBM size × HBM 帯域 の第一原理における HBM size 増加の駆動源は KV cache の増加で、KV cache の性質と attention の性質が HBM に極めて適合的だからこそ、KV cache/attention レーンで HBM は最大の利用率を得ている。

逆に言えば、KV cache がアーキテクチャ上消滅すれば、HBM size の指数増加ロジックも揺らぐ。

問いの本質はこうだ:Transformer に代表される attention 機構、およびそこから派生する KV cache 機構は、消滅するのか?退潮後に代替されるのか?

歴史を見ると、AI モデルアーキテクチャの革命ごとに、本当に保存されるのは 数学的に普遍性を持つ primitive 操作 だ。

例として、FFN(前向きネットワーク、MLP 層)は 2012 年の深層学習時代の産物だが、今日の大規模言語モデルにも生きていて相当のパラメータを占める。なぜか。これは universal approximation theorem の体現で、十分広い MLP は任意の連続関数を近似できる。

attention もおそらく同種の primitive である。それが解いているのは、ある意味でさらに基底的な問題 ── 系列内の任意 2 位置間の dynamic routing ── だからだ。任意の位置同士を必要に応じて結びつける能力は、一度有効性が検証されたら捨てるのが難しい。

したがって、純 Transformer から混合アーキテクチャ・世界モデルへ進化しても、attention 層は残る。KV cache(または latent compression された等価物)も残る。HBM が推論の核として残る限り、HBM 指数増加に依存する GPU アーキテクチャ進化路線は止まらない。

DRAM は伝統的周期性から逃れられるか

HBM 周期性脱却には市場である程度のコンセンサスがあるが、DRAM 周期性脱却には基本的にコンセンサスがない。

3 条件に戻ろう。DRAM はカスタム化を持たない。技術迭代速度と構造的指数増加の有無が鍵で、結論は 「ある」 だ。

AI token factory の枠組みでは、構造的指数増加は確かに主に HBM 側にある。しかし 2025 年末以降、agentic CPU が潜在力を解放し始めたことで、CPU に付随する DRAM 需要が新たな構造的指数増加の源泉になりつつある。

この成長ロジックは 2 層に分かれる。

第 1 層:CPU server TAM の急成長

CPU server TAM 急成長の 4 つの論理は、以前の CPU 専篇で詳述した。要点だけ:

  1. AI アクセラレータクラスタで、CPU と GPU の比が伝統の 1:4 から 1:2、さらには 1:1 へと向かっている
  2. Agentic flow では CPU 処理のレイテンシ占有率が高い(50〜90%)ため、重大なボトルネックとして同期拡張が必要
  3. AI coding でソフトウェアエンジニアの生産性が大幅に上がり、コード量が桁違いに増加。ソフトウェア API 呼び出しは指数的に増え、これがそのまま CPU hours の指数増加に転化
  4. Sandbox:データ安全と分離のため、Analytical Agent はタスクごとに大量のデータベースとユーザー context を複製する必要がある。これにより内存(DRAM)と CPU core が大量に浪費され、しかも 5 年以上技術的に解決困難。CPU hours は最適化で通縮させるのも難しい

これが理由で、2 四半期前に AMD は CPU TAM 2030 を 60B と発表し、2 ヶ月前に AMD/ARM が 120B に倍増した。1 ヶ月前に NVIDIA が 200B にさらに倍増。そして先週 Bernstein が 2030 CPU TAM を 223B に引き上げ(prior 137B から)。

筆者の見方では、2031 CPU TAM が 400B に上方修正されるのは時間の問題で、唯一の不確実性は「どの巨頭がいつ宣言するか」だけだ。

第 2 層:CPU core あたり DRAM 容量の急増

なぜ agentic 時代に、CPU core 1 個あたりの DRAM 容量が急増するのか。

  1. Agent は状態を持つ長駐プロセスで、stateless な req-resp ではない。従来の web/SaaS は req が来たら内存を割り当てて処理後に即解放する。一方、Agent タスクは 1 分〜1 時間走り続け、その間 message history/system prompt/working memory/long-term memory/tool 結果 buffer が 全部 DRAM に常駐する。CPU hours と同様、各タスクの内存フットプリントは stateful・sandbox 隔離(タスクごとに DB と context を複製)の要請で、技術的に圧縮が難しい
  2. context window が指数的に長くなり、各セッションの working set が膨れる:32K → 256K → 1M、reasoning/test-time compute の長系列化が続き、今後さらに伸びる。各 active セッションで常駐する messages は context 長に線形比例

両層を掛け合わせる。

第 1 層:2030 〜 2031 の CPU server TAM は概ね 5〜7 倍(60B → 120B → 200B → 223B、筆者は 400B 想定)

第 2 層:CPU 1 個あたり DRAM 配備は 3〜4 倍(4〜8GB → 16〜32 GB/core)。ただしこちらは大部分が 一度きりの再装填レベルの引き上げ

2 つの独立変数の積で、サーバ側 DRAM 需要は 桁レベルで増える

commodity DRAM の供給増は約20%、agentic CPU 由来の需要増は約50%
図2:供給側は wafer 増(+10%/年)と density 進化(+9%/年)の積で約 +20%/年、需要側は CPU TAM × core あたり容量で約 +50%/年。ギャップが年々拡大する

2030 年、保守的に 300B の CPU TAM・1 core あたり 50 USD・agent 時代で最低 16GB/core を仮定すると、新規 DRAM 需要は最低でも 96 EB。今年の DRAM 総生産量は約 47 EB、来年がやっと 60 EB。驚くべき需要増分だ。

agentic CPU 由来の DRAM 指数増加は、第 2 層の引き上げが大部分一度きりとはいえ、ギャップの絶対量が桁違いに大きいため、相当長い期間続く。

3 条件に戻って整理

DRAM のカスタム化(条件 1)は基本的に無視できる。

条件 2(構造的指数需要)は成立。commodity DRAM も部分的に伝統的周期性から逃れる資格を得た。HBM(2.5 条件)ほど徹底ではないが、実質的な変化だ。

条件 3 の技術迭代速度も、以前とは変わっている。従来 DDR 技術迭代は消費電子に強く依存し、DDR 進歩の performance 寄与は小さかった。しかし可予見の将来、carbon-based 消費(PC/スマホ)の DDR 用途は、silicon-based 消費(CPU サーバ)の DDR 用途を大きく下回る。

CPU サーバ側で memory 需要が増えたこと、エンド AI 側で DDR 速度要求が高まったこと(Apple は本地 LLM のため LPDDR 速度を上げ続けている)で、速度アップグレードの限界効用が急上昇している。DDR6/LPDDR6 への迭代需要は以前より格段に高く、世代間の時間も短縮、速度の傾きも再び上向いた。

旧来は新世代 DDR/LPDDR が出ても各社は冷淡で、値が下がってから採用した。今は LPDDR6 が出れば各社「できる限り早く使いたい」と争奪する。速度向上による performance 改善が手に取れるからだ。

HBM bit tax

加えて DDR の供給には HBM 由来のもう一段の「税」がある。HBM 拡産速度が速いため、毎年 commodity DDR に回せるはずだった wafer の一部が HBM に持っていかれる。HBM の変換比は極めて悪く、HBM3E は 同量の bit のために約 3 倍の DRAM wafer、HBM4 は約 4 倍。毎年約 +3〜5% の DDR bit growth がこの HBM bit tax で直接喰われる。

DRAM bit volume は将来年 +24%/年(wafer +14% × density +9%)で増えるが、HBM bit tax を引いた non-HBM commodity DDR の bit growth は約 +20%/年(wafer 約 +10% × node density 約 +9%)に落ちる。

CXMT 拡産の影響:CAGR への押し上げは +1.5pt

中国 CXMT(長鑫存儲)がもし「武德を講じず」に拡産すれば、市場を再び周期の泥沼に戻すのか。

CXMT の拡産速度はここ数年たしかに速い。SemiAnalysis の整理によれば、2025 年は月 20 万 wafer、2026 年は北京 fab と新規ラインの寄与で 32〜35 万。建設中の上海 fab は Phase 1 が 2027 年に月 10 万 wafer、Phase 2 が 2028 年にもう月 10 万 wafer を加える計画。つまり 2027 年は月 42 万 wafer、2028 年は月 50 万 wafer

ただし注意点として、CXMT の DRAM bit 密度は御三家の約半分しかない。つまり月 50 万 wafer から取れる bit volume は他社の半分相当だ。等価密度で換算(wafer 数を半分カウント)すると、業界全体への影響はかなり小さくなる。

2025 年末から 2028 年末まで、CXMT が業界全体の DRAM bit 生産能力 CAGR に与える押し上げは 約 +1.5pt にすぎず、業界 CAGR は概ね 12.7% → 14.2% になる。

CXMT 拡産を等価密度で換算しても全業界 DRAM CAGR への影響は約1.5%
図3:CXMT の bit 密度は御三家の約半分のため、wafer 数を半分換算しても全業界 DRAM CAGR は 12.7% → 14.2% の押し上げに留まる。需要 CAGR との差は埋まらない

CXMT が今後も拡産速度を維持しても、2030 年における等価 DRAM bit volume CAGR への影響は概ね +3pt 未満(20% → 23%)に留まる見込み。

加えて、CXMT は EUV 露光機の制約を受ける。DDR6 はより高い速度(14400 MT/s 起点)と密度を要求し、御三家は 1c 以降のノード(〜12nm 以下)で全面 EUV を使う。CXMT は DDR6 で速度律速になりやすく、密度も半分のままになる可能性が高い。

なぜ DRAM の今回スーパーサイクルは少なくとも 5 年は終わらないか

成長型周期だとしても、なぜ今回の DRAM サイクルは長く続くのか。理由は 4 つに整理できる。

1. agentic CPU 由来の構造的需要が、毎年ギャップを拡大させる

先ほどの図2で示した通り、commodity DRAM の供給増は約 +20%/年で頭打ち、需要側は CPU TAM × core あたり容量で約 +50%/年で伸びる。差は毎年蓄積する。

HBM が GPU 経由でトークン throughput と直結し GPU の稼ぐ効率に直結するのに対し、DRAM 不足は agent flow への影響として速度に表れる(8GB/core と 16GB/core では、ワークロード次第で 30% 速度差が出る)。低価値タスクは待たせれば耐えられる。構造的指数増加の動機は強いが、需要は GPU ほど剛性ではない。

SemiAnalysis は「今年の DRAM ギャップは一桁%、来年は 10% 超」と見る。agent CPU 数の激増から考えれば、このギャップは毎年広がり続け、2030 年まで縮小の兆しは見えない。

2. 価格上昇で「消えた需要」は実は消えておらず、需要の貯水池が分厚い

DRAM 価格上昇で消えた需要は、消えたわけではなく 遅延しているだけだ。蓄水池は厚い。

蓄水池とは「内存価格が下がれば即座に開放される潜在需要」のこと。それが存在することは、供給が一時的に追いついても価格が崩れにくいことを意味する。新たな需要が蓄水池から湧き出して受け皿になる:

  • 「内存で算力/速度を買う」蓄水池:余分な内存で速度・算力を稼ぐ最適化が、内存高で割が悪くなり封印されている。価格が下がれば戻ってくる。例:NVIDIA Rubin CPX(低コスト GDDR7 を載せた prefill 専用アクセラレータ)の元の狙いは「廉価な GDDR7」だったが、LPDDR/GDDR が高すぎて元 HBM 値段を上回る場面さえあり ROI が崩れた。普通の内存が値下がりすれば、CPX のような最適化案が戻ってくる
  • 低価値タスクの蓄水池:内存高でトークン価格が下がらず、高価値タスクが優先され低価値タスクが後回し。内存が下がれば後回し分が戻ってくる
  • エンド AI の蓄水池:AI PC の内存は 24GB から 128GB まで上振れの余地。Apple は最新のエンド AI フル仕様で 8GB → 12GB 内存への引き上げを明示
  • 通常の消費電子・Agent PC・低価格スマホで内存高により絞られた需要も、すべて蓄水池

これらが重なって厚い需要バッファになる。今回 DDR の構造成長は市場想定より長引く後伸びを持つ。

3. HBM と DRAM の生産能力は相互変換可能で、DRAM complex 全体が一緒に re-rate される

上行期、DRAM の利益率は HBM を大きく上回り、HBM の値上げ幅さえ DRAM が押し上げる構図になる。今年新規契約された HBM4 の価格は、当期 DRAM 価格 × 4(標準的な積層倍率に対応した値)だ。

下行期に DRAM 価格が下がり粗利が落ちても、HBM の長約透明性によって利益率は保障される。HBM はさらに多くの DRAM 生産能力を間接吸収し、HBM 値下げが GPU 厂の HBM size 増量の動機を引き出し、結果として DRAM 価格の床も保障される。

DRAM の構造的指数需要、density scaling 鈍化と拡産難度の上昇、各社の慎重な拡産計画、CXMT 影響の限定、需要蓄水池の厚さ ── これら 4 つが重なり、可予見の少なくとも 5 年(あるいはそれ以上)DRAM は周期の谷に入りにくい

NAND SSD は伝統的周期性から逃れられるか

NAND の構造的成長の駆動は DDR ほど強くない。今年の品不足の主因は、主要プレイヤーの生産規律が良好に保たれ、大規模拡産がなされなかったこと。生産能力の年次増分は主に技術改善(積層数増加)から来る。

それでも構造的成長の駆動は以下のように積み上がる。

  1. AI 推論の KV cache offloading:HBM から溢れた warm/cold KV cache を NAND SSD に卸す。NVIDIA の ICMS(Inference Context Memory Storage)由来 NAND 需要は 2026 年に 2.8%、2027 年に 9.3% を占める見込み。Rubin CMX の量産(2026 年末)と KV cache offloading の本格展開で構造成長が顕在化する
  2. AI 動画生成ByteDance Seedanceのようなモデルは出荷量が爆発的に伸びている(年 10〜40 倍の規模感、筆者観察ベース)。今は GPU 不足で需要が抑制されているが、ボトルネックが解ければ NAND 容量需要の構造成長が長期続く
  3. agentic flow の Sandbox:DRAM と同様、タスクごとの DB/context 複製で大量の SSD(需要)が浪費される。これも構造増分
  4. HBF(High Bandwidth Flash)路線:2030 年以降に効いてくる構造成長。Kioxia の HBF プロトタイプ(5TB/64 GB/s モジュール)など、weights 保存用(書き 1 回・読みのみ)として GPU/HBM と一緒に封装される必要がある(48〜96 TB/s 帯域、PCIe7/8 でも追いつかない)。本格化は次回パート(III)で深掘り予定

NAND SSD は HBM ほどの構造成長は持たないが、安さで勝る。2027 年でも約 $0.8/GB(同期の DRAM の約 1/40、概算)で、多階層キャッシュの 万金油 として用途が広い。

つまり「DRAM/HBM だけ単独で値上がりして NAND だけ値上がらない」シナリオは成立しない。それが起きれば、各社は SSD を使って DRAM/HBM の機能の一部を肩代わりさせ、より安く似た効果を実現しようとする。HBM/DRAM/NAND は独立 3 つの物語ではなく、同じ AI memory hierarchy の温度別 3 階層で構造成長を共有する

AI memory hierarchy は HBM / DRAM / NAND が温度別に連動して同じ構造的成長を共有
図4:hot(HBM)/warm(DRAM)/cold(NAND)はそれぞれ別個のサイクルではなく、AI memory hierarchy として一緒に re-rate される

構造的指数増加の需要はある。NAND SSD は周期を脱却したか。それは NAND 厂の生産規律次第。生産規律を破る可能性があるのは YMTC(長存儲)だけだろう。これは囚人のジレンマで、誰か 1 社が武德を講じず拡産すれば、NAND 産業全体の拡産難度は DRAM よりはるかに低いため、容易に崩れる。

最低限言えるのは、今回の NAND もスーパーサイクル局面にあり、いくつかの構造的指数増加が積み上がる需要を考えれば、下行期の到来は 2030 年まで先送りされても不思議はない。

補論:NAND 専業(KIOXIA/SanDisk)と御三家の体力差

ここまでの議論で見落とすと事故になるのが、「同じ AI memory hierarchy の cold 層に張る場合でも、NAND 専業と御三家ではリスク・リターンの性質が違う」 という点だ。今の NAND 市況を分解すると、儲かっている主因は「需要側の固有構造成長」よりも、「他社が HBM に振り切った副産物としての供給規律」 の側面が大きい。

観点御三家(Samsung/SK Hynix/Micron)NAND 専業(KIOXIA/SanDisk)
HBM の物理的天井(代々 2 倍)の直接恩恵享受(GPU 天井に直結)なし
周期性脱却 3 条件の達成度HBM 2.5/3 + commodity DRAM 2/3NAND 1.5/3
下行サイクルの利益率の床HBM 長約で透明なし、純 NAND 一本足
最大の上振れ変数HBF・AI 動画の本格化(2027〜)同左、ただし純粋ベータでしか取れない
最大の下振れ変数CXMT(押し上げ +1.5pt に限定)YMTC の生産規律(崩れたら直撃。NAND は DRAM より拡産難度が低く崩壊リスクが構造的に高い)

NAND 専業が好調な「3 つの土台」を分解すると、

  1. 御三家が HBM 利益優先で commodity 拡産を絞っていることの副産物:Samsung/SK Hynix は HBM/DRAM の機会費用が高く、NAND への新規投資の優先度が下がる。結果として NAND 供給制約が締まり、専業も価格が立つ
  2. 主要プレイヤーが揃って拡産規律を保っていること:YMTC・Samsung NAND 等が拡産を抑制している間は値が立つが、誰か 1 社が崩した瞬間に囚人のジレンマが発動する
  3. AI hierarchy の cold 層としての構造需要(KV cache offload/AI 動画/HBF):方向は強いが、規模はまだ初期。2026 年の NAND 全体に占める ICMS 需要は 2.8%、本格化は 2027〜2030 年にずれ込む

つまり、今の NAND 専業の利益は「需要起点」より「供給規律と機会費用起点」のレバレッジに依存している。御三家のように HBM の物理的天井という最強の構造ドライバを地肌に持っていないので、

  • 上行サイクルでは御三家と同じ方向に連動し、瞬間のベータは御三家を上回ることもある
  • 下行サイクルでは御三家の HBM 長約という底打ち装置がないため、振幅がそのまま利益率に出る
  • HBF が量産フェーズに入る 2027〜2030 のタイミングで、KIOXIA は HBM 御三家に近いレイヤーへの参入チャンスを持つ。そこを取れるかで評価軸が変わる

実務的な含意として、御三家ロングと NAND 専業ロングは「同じ方向に張りつつ、確度と床の硬さが違う別商品」として扱った方がいい。記事冒頭のキラーチャートで示した「3 階層連動」は方向の話で、ベータ強度と下行耐性は階層ごとに別物である。


ファクトチェックメモ(2026-06-26 時点)

項目原文の主張公開ソースでの確認
Bernstein 2030 CPU TAM223B USD(prior 137B)Investing.com:David Dai が server CPU TAM を 137B → 223B に引き上げ(一致)
AMD/ARM 2030 CPU TAM120B に倍増Wccftech:AMD が server CPU TAM を 120B に倍増(一致)
HBM3E の DRAM wafer 倍率約 3 倍Micron:HBM:DDR5 = 3:1 wafer conversion ratio(一致)
HBM4 の DRAM wafer 倍率約 4 倍直接公開ソースなし。HBM4 が 16-Hi(HBM3E は 12-Hi)になることから推測。SemiAnalysis 系の整理と一貫
Samsung HBM3E NVIDIA qualification60% → 20% に低下TrendForce:2024 年に NVIDIA 向けで苦戦、その分の能力が Google TPU 経由(Broadcom)と AMD に向かう。Samsung は 2025 年 9 月末に NVIDIA qualification をクリア済み(原文の時点情報を補足)
CXMT 月産能2026:32〜35 万、2027:42 万、2028:50 万SemiAnalysis:2026 末で〜350K wspm、2027 で 420K wspm。2028 年 50 万は記事筆者の延伸計算(concept は一致)
CXMT bit 密度御三家の約 1/2EUV 制約と node 世代差を踏まえれば概ね妥当(直接の公式数値はなし、業界ヒアリングベース)
Kioxia HBF5TB/64 GB/s、2030 年頃需要立ち上がりTom's Hardware:Kioxia プロト 5TB/64 GB/s、サンプル 2026H2、推論結果 2027 年、「複雑 memory 需要は 2030 年頃」(一致)
NVIDIA Rubin CPXGDDR7 128GB 搭載 prefill 専用NVIDIA Technical Blog:128GB GDDR7、約 2 TB/s、3× attention 加速(一致)
ICMS 由来 NAND 需要TrendForce:NVIDIA ICMS は 2026 年に NAND 需要の 2.8%、2027 年に 9.3%(補足追記済み)
NAND $0.8/GB(2027)直接公開ソースなし。SemiAnalysis 系の長期 price deck 整理に一致するが、出典明示できないため「概算」と注記
Seedance 年 10〜40 倍公式数値は出ていない。ChinaBizInsider 等の定性報告で「インフラコスト負担で需要を抑制中」と報じられる。原文筆者の観察ベース
DRAM bit volume +24%/年wafer +14% × density +9%Tech-Insider:advanced node density CAGR 14.95%、wafer 増は 10〜15% で頭打ち。概念的に一致
HBM bit tax年 −3 〜 −5%公式数値なし。HBM 拡産速度(年 1.5×〜2×)と DDR wafer 共有比(3〜4 倍)から推計、SemiAnalysis 整理と整合

「成長型周期性」「DRAM complex 連動」「memory 蓄水池」などの概念整理は、業界で広く共有されているナラティブを筆者が定式化したもの。数式は概念モデルとして扱う。