Sakana AI はなぜオープンモデル戦略を取るのか——日本発 AI スタートアップの技術的賭け
東京を拠点にする Sakana AI が、設立から短期間で国際的に注目される理由は、モデルを公開しているからだけではない。モデルを「作る」のではなく「組み合わせる」という技術路線そのものが議論を呼んでいる。
「進化的モデルマージ」という賭け
Sakana AI の技術的立脚点は、2024 年に arXiv で公開された「Evolutionary Optimization of Model Merging Recipes」論文にある。複数の既存オープンモデル(Mistral 系、Llama 系、日本語特化モデル)の重みを、進化的アルゴリズムで組み合わせる方法論だ。同社の公式ブログによれば、EvoLLM-JP などのモデルはこの手法で構築されている。
GPT-4 や Claude のような大規模クローズドモデルとは勝負のやり方が異なる。数千億円規模の計算資源を投じるのではなく、公開モデルの「合成」で局所最適解を探すアプローチであり、日経 xTECH の報道でも「日本発の現実的な AI 戦略」として取り上げられた。
Hugging Face 上での存在感
Hugging Face に公開されているモデルカードを見ると、EvoLLM-JP、Evo-Ukiyoe、Evo-Nishikie といった日本文化・日本語にまつわるモデルが並ぶ。研究者はダウンロードして自前のベンチマークで検証できる。日本語 LLM ベンチマークの現状で後述する llm-jp-eval のようなテストスイートでも、これらモデルの結果は公表されている。
ビジネスモデルの不確かさ
ただし、オープンモデル戦略は収益構造の設計が難しい。OpenAI のように API アクセスをマネタイズの主軸にはできず、企業向けコンサルや受託開発に重心を置くことになる。Bloomberg の報道によれば、同社は 2024 年時点で評価額 10 億ドルを超えるユニコーンとなったが、実収益は非公開で、黒字化時期も明確にされていない。
一方、ソフトバンク・ビジョンファンドの路線変更が AI 特化に傾くなか、日本国内の AI スタートアップに対する資金供給環境は 2023〜24 年に好転した。Sakana AI が選ぶオープン戦略が、将来どの時点で利益を生むモデルに転換するのか——それが判断の分かれ目になる。
何を観察すべきか
今後 12〜24 ヶ月で確認したい指標は三つある。論文引用数の推移、Hugging Face 上でのダウンロード実績、そして企業ユーザーの本格採用事例だ。公開モデルをベースに業務導入を進める企業が目に見えて増えるかどうかで、この賭けの正否が見えてくる。
参考情報 · Sources
- Evolutionary Optimization of Model Merging Recipes arXiv (Sakana AI)
- Sakana AI 公式ブログ Sakana AI
- Sakana AI モデルカード Hugging Face
- 「日本発 AI」の現在地 (Nikkei xTECH、2024) 日経 xTECH