• #NVIDIA
  • #M&A
  • #AI
  • #グラフニューラルネットワーク
  • #構造化データ
  • #Kumo
  • #Sequoia
  • #投資分析
未分類

NVIDIA、構造化データ予測AIのKumo AIを買収——グラフ学習の中核人材を取り込む

NVIDIA(NVDA)が、企業向けの予測AIソフトウェアを手がける Kumo AI を買収した。The Information は関係者の話として買収額を4億ドル超と伝えているが、NVIDIA は取引条件を正式に開示しておらず、Fortune は「金額は確認できなかった」としている。買収はすでに完了とみられ、創業者3名はいずれも NVIDIA へ移籍済みで、LinkedIn のプロフィールも NVIDIA 社員に書き換えられている。

この記事では、出回っている解説の内容を一次情報・二次情報で照合しながら、「何が起きたか」「Kumo AI とは何者か」「買収の狙い」を整理する。事実関係で食い違いがある点や、推定にとどまる数字は後半の「ファクトチェック・補足」で明示する。

1. 何が起きたか

要点は次の3つに整理できる。

  • 買収の事実: NVIDIA が Kumo AI を取得した。The Information は買収額を「最低4億ドル」と報道。ただし NVIDIA は条件を非開示で、公式プレスリリースも出ていない。
  • 発覚の経緯: 公式発表ではなく、創業者本人の LinkedIn プロフィール更新から判明した。3名はいずれも「先月 NVIDIA に移籍」と記載されている。
  • 人材の移籍: 共同創業者である CEO の Vanja Josifovski、エンジニアリング責任者の Hema Raghavan、チーフサイエンティストの Jure Leskovec が NVIDIA へ移った。

つまり、これは大型の事業買収というより、特定領域の技術と中核人材を取り込む買収としての色が濃い。買収額が4億ドル規模であれば、時価総額が数兆ドル規模の NVIDIA の財務に与える直接的な影響は小さい。意味があるのは、グラフ機械学習を長年けん引してきた研究者・エンジニアをまとめて確保した点にある。

2. Kumo AI とは何者か

Kumo AI は、米カリフォルニア州 Mountain View を拠点とするスタートアップである。主要な報道(Fortune、SiliconANGLE など)は創業を 2022年 としている(出回っている一部の解説では「2021年」とされるが、今回の買収報道では2022年が主流。詳細は後述)。

資金面では、2022年の2回のラウンドで合計3,700万ドルを調達してきた。Sequoia Capital が最も目立つ投資家で、2022年9月の Series B(1,800万ドル)は Sequoia がリードし、A Capital や SV Angel なども参加している。

創業チームの出自が、この会社の性格をよく表している。チーフサイエンティストの Jure Leskovec はスタンフォード大学の教授で、グラフ機械学習の第一人者として知られる。Kumo のチームは、グラフ学習で最も広く使われているオープンソースライブラリ PyTorch Geometric(PyG) の作者でもある。学術的なグラフ学習の蓄積を、そのまま企業向けプロダクトに持ち込んだ会社だと見ればよい。

顧客には Reddit、DoorDash、英スーパー大手の J Sainsbury(Sainsbury's) が名を連ねる。製品は Snowflake や Databricks といったデータウェアハウスに接続して使う設計で、これらは「データ連携先(パートナー)」として位置づけられる。

3. 技術の中身:KumoRFM と PQL

Kumo の製品の中身は、KumoRFM(Relational Foundation Model) と呼ばれるモデルである。同社はこれを「世界初のリレーショナル基盤モデル」と説明している。

リレーショナルデータを「グラフ」として扱う

従来の機械学習は、データベースの各行を独立した存在として処理する。これに対して KumoRFM は、リレーショナルデータを 時系列を含む異種グラフ(temporal heterogeneous graph) として表現する。

  • 各エンティティ(顧客、注文、商品など)を ノード とする
  • テーブル間の主キー・外部キーのリンクを エッジ とする
  • このグラフ上でグラフニューラルネットワーク(GNN)が予測を行う

これにより、「この顧客がどの商品を買い、他のどの顧客とつながっているか」という構造そのものから、文脈を踏まえた予測を導ける。事前学習済みのモデルが、手作業の特徴量エンジニアリングを介さずに生データから直接予測を生成する点が、汎用の大規模言語モデル(LLM)との違いになる。

KumoRFM は数万の異種リレーショナルデータセットで事前学習されており、RelBench という30タスク・7ドメインのベンチマークでは、特徴量エンジニアリングの定番手法やエンドツーエンドの教師あり深層学習を 2〜8% 上回る と報告されている。後継の KumoRFM-2 では、最大5,000億行規模のデータへのスケールもうたっている。

PQL:SQLに似た「予測」のための言語

導入の手間を減らす工夫が Predictive Query Language(PQL) である。PQL は SQL に似た構文を持つが、データ操作ではなく 予測問題そのものを定義する ための言語だ。

企業が数か月かけてデータパイプラインや特徴量エンジニアリングを組む代わりに、データウェアハウスにモデルを接続し、PQL で予測を走らせられる。「この顧客は解約するか」「来四半期の需要はどの程度か」といった問いを、自社データに基づく答えに変換する。同社はデータの準備・クレンジング・結合の手間を最大95%削減できるとしている。

観点従来の機械学習KumoRFM のアプローチ
データの捉え方各行を独立に処理テーブルをまたぐノード・エッジのグラフ
特徴量エンジニアリング数週間〜数か月の手作業事前学習モデルが生データから直接予測
学習タスクごとに個別に学習事前学習+文脈内学習(追加学習なしで予測)
問い合わせパイプライン構築が前提PQL(SQL風)で予測を直接記述

4. なぜ「構造化データ」なのか

ここが、この買収を読み解くうえで重要な論点になる。

生成AIの話題の多くは、文章や画像といった 非構造化データ に向かってきた。しかし企業価値の多くは、依然としてデータウェアハウスに蓄積された取引・顧客・決済の 構造化(リレーショナル)データ にある。Leskovec はかねて「最先端の企業でさえ、データウェアハウス内の企業データには20年前の機械学習手法を使い続けている」という趣旨の指摘をしてきた。

この空白に GNN を軸に切り込めば、LLM が手薄な領域で新たな計算需要とアプリケーション市場を同時に開拓できる。NVIDIA にとっては、GPU という半導体の層から、その上で動くモデルとアプリケーションの層へ、支配領域を一段押し広げる動きと読める。Kumo のリレーショナル基盤モデルは、自社ハードウェアに最適化したモデル群を拡充し、企業が自前のデータでカスタマイズして使う裾野を広げるピースになりうる。

5. NVIDIA の M&A 攻勢の中での位置づけ

今回の買収は、NVIDIA が続ける一連のスタートアップ取り込みの一環でもある。直近の主な動きを並べると、規模感の違いがはっきりする。

買収先時期金額(報道ベース)領域形態
Mellanox2019年約70億ドル高速ネットワーク通常買収(従来の最大規模)
Run:ai2024年4月発表 / 12月完了7億ドルGPUワークロード管理(Kubernetes)通常買収(EU承認後完了)
Groq2025年12月約200億ドルAI推論チップ(LPU)ライセンス+人材獲得型(acqui-hire)
Illumex2026年2月約6,000万ドルデータセマンティクス基盤買収(イスラエル)
Kumo AI2026年5〜6月4億ドル超(推定・非開示)構造化データ予測AI人材・技術獲得型
  • Groq(2025年12月) は約200億ドル規模で、NVIDIA 史上最大の取引とされる。法的な会社は残したまま技術資産と主要人材を取り込む「acqui-hire」型で、競合になりうる推論チップ企業を実質的に取り込んだ。Groq は2025年9月に約69億ドルで評価されていた。
  • Illumex(2026年2月) は約6,000万ドルで、構造化データを「業務上の意味(セマンティクス)」に翻訳する基盤を持つイスラエル企業。AI が扱う データの文脈 を整える層を押さえる動きだ。
  • Run:ai(2024年4月発表、12月完了) は7億ドルで、GPU 上の AI ワークロードを効率配分する Kubernetes ベースのオーケストレーションソフト。EU の承認を経て完了した。

今回の Kumo 買収は、NVIDIA が COMPUTEX 2026 で PC 向けの新型チップ群を発表した直後のタイミングで明らかになった。同社は COMPUTEX で、Arm CPU と Blackwell GPU を1パッケージに統合した RTX Spark スーパーチップや、10年以上ぶりの消費者向け CPU となる N1 シリーズ を打ち出している。半導体の足元(PC 向け CPU)を固めつつ、その上のソフト・モデル層も買収で埋めにいく、という二正面の動きが重なった格好だ。

Illumex(データの意味づけ)と Kumo(構造化データの予測)を並べると、NVIDIA が 「企業の構造化データを、文脈づけて、予測に使う」 という一連の流れをスタックとして揃えにきていることが見えてくる。

6. 今後の注目点

NVIDIA が Kumo の技術を自社スタックへどう織り込むかは、まだ公式には示されていない。注目したいのは次の点だ。

  • KumoRFM が NVIDIA の GPU・ソフトウェア群(CUDA、cuGraph、RAPIDS など)とどう統合されるか
  • 企業向けに「構造化データ予測」をどの製品ラインで提供するか(単体製品か、既存プラットフォームへの組み込みか)
  • Snowflake・Databricks との連携が買収後も続くのか、競合関係に変わるのか

金額そのものより、PyG を築いたグラフ機械学習の中核人材を確保した意味が大きい買収である。その設計図が示される時が、次の節目になる。

ファクトチェック・補足

この記事を作成するにあたって照合した結果のうち、注意すべき点を透明性のために残しておく。

主張(出回っている解説)検証結果判定
買収額4億ドル超The Information の推定。NVIDIA は非開示、Fortune は「金額不明」推定値として正しい
買収は完了済み創業者の LinkedIn が NVIDIA 社員に更新済みおおむね正しい
NVIDIA 幹部の LinkedIn 投稿で最初に判明実際は 創業者本人のプロフィール更新 で発覚要訂正
創業者3名が NVIDIA へ移籍Josifovski(CEO)/ Raghavan(エンジ責任者)/ Leskovec(チーフサイエンティスト)正しい
2021年に Mountain View で創業主要報道は 2022年創業(4年前)2022年が主流
2022年に2ラウンドで3,700万ドル調達Series A + Series B(1,800万ドル、Sequoia リード)正しい
合成データと組み合わせて学習一次情報では未確認。数万の異種データセットで事前学習表現を修正
顧客に DoorDash / Reddit / Databricks / Snowflake / Sainsbury確実な顧客は Reddit / DoorDash / Sainsbury's。Snowflake・Databricks は データ連携先一部は顧客でなく連携先
Groq を200億ドルで acqui-hire(2025年12月)2025年12月24日、約200億ドル、NVIDIA 史上最大正しい
Illumex を2026年2月に買収2026年2月24日、約6,000万ドル正しい(金額を補足)
Run:ai を7億ドルで買収(2024年4月)2024年4月発表、12月に EU 承認後完了正しい(完了は12月)
COMPUTEX で PC 向け CPU を発表RTX Spark スーパーチップ/N1 シリーズ(消費者向け CPU)正しい

創業年の食い違いについて: Kumo がステルス段階から表に出た時期と、法人としての設立時期の解釈によって「2021年」「2022年」が混在している可能性がある。今回の買収報道(Fortune、SiliconANGLE)はそろって「2022年(4年前)」としているため、本記事ではこれを採用した。

出典