【最新情報】Sakana AIが2026年6月22日、マルチAIオーケストレーションシステム「Fugu」と上位版「Fugu Ultra」の提供を開始しました。Fugu Ultraは特定ベンチマークでClaude Fable 5を上回る評価を受けたと報告されています。
日本のAI企業Sakana AIが開発した「複数のAIモデルを自動で組み合わせて使う」新世代のAIサービスが、
国内外で大きな注目を集めています。
単一モデルを超えるという独自の仕組みと、
輸出規制リスクを避けた日本発の設計が話題の中心です。
この記事では、Fugu・Fugu Ultraの概要・性能・料金・実際のユーザー評価をわかりやすく解説します。
- 2026年6月22日にSakana AIが「Fugu」「Fugu Ultra」を正式公開
- GPT・Claude・Geminiなど複数モデルをタスクに応じて自動で使い分けるシステム
- Fugu UltraはGPQA-D 95.1%・LCBv6 93.2%・Terminal-Bench 2.1でFable 5超えを記録
- 月額$20のStandardプランから利用可能。7月末まで2ヵ月目無料キャンペーン実施中
Sakana AIの「Fugu」とは?複数モデルを束ねる新しいAIサービス
Fuguは、GPT・Claude・Geminiなどの既存AIモデルを、タスクの内容に合わせて自動で選び組み合わせるオーケストレーション型のAIサービスです。
利用者はひとつのAPIにリクエストを送るだけで、
裏側では複数モデルの中から最適な組み合わせが自動選択されます。
モデルの管理は不要で、単一モデルを使う感覚で複数モデルの恩恵を受けられる点が特徴です。
開発したSakana AIは、元Google DeepMindの研究者が立ち上げた東京のスタートアップです。
AIモデルそのものを一から作るのではなく、
既存モデルを進化的アルゴリズムで最適に組み合わせるという独自路線を追求してきました。
Fuguはそのアプローチを実用サービスとして公開したものです。
ラインナップは標準版と高性能版の2種類です。
| モデル名 | 特徴・強み | 向いている用途 |
|---|---|---|
| Fugu(標準版) | 速度と精度のバランスを重視した設計 | 日常業務・チャット・コーディング補助 |
| Fugu Ultra(上位版) | 複雑な多段階推論に特化。Fable 5水準と評価 | セキュリティ分析・AI研究・学術タスク |
【考察】オーケストレーション型はなぜ単体モデルを超えられるのか
ここからは編集部による考察(予想)です。
「単体モデルを超えた」という発表は衝撃的に見えますが、
仕組みを知るとむしろ構造的に起こりやすい結果だと考えられます。
そう判断する根拠を3点まとめます。
根拠1:得意分野の「いいとこ取り」が可能になるから。
どんな優秀なモデルにも、得意・不得意は存在します。
コード生成が強いモデル・推論精度が高いモデル・日本語品質に優れたモデルを
タスクに応じて切り替えれば、それぞれの最高スコアだけを集めた理論上の「合成最強」が実現します。
ベンチマークはタスク単位で評価するため、
オーケストレーション型がスコアを出しやすい構造になっています。
根拠2:巨大な学習コストを回避できるから。
OpenAI・Anthropic・Googleがフロンティアモデルを開発するには、
数千億円規模の計算資源が必要です。
Sakana AIのアプローチは既存モデルのAPIをオーケストレーションする設計なので、
学習コストを大幅に抑えながら高い性能を実現できます。
「輸出規制リスクなしでフロンティアレベルを発揮する」という同社の主張は、
このビジネスモデルの合理性を示しています。
根拠3:日本のAI産業が生き残るための現実解だから。
米中主導のAI競争において、日本が独自の巨大モデルを開発するのはコスト面で困難です。
「作る」ではなく「束ねて使いこなす」という差別化戦略は、国産AIの現実的な方向性として評価できます。
Terminal-Bench 2.1でFable 5を超えた成績も、
コーディング特化モデルを重点配置した結果と考えれば自然な帰結です。
一方で、注意が必要な点もあります。
今回の「Fable 5超え」はあくまで特定ベンチマーク上での結果であり、
汎用的な対話全体での比較ではありません。
複数モデルを利用する性質上、トークン消費量が多くなる傾向があり、
用途によっては費用対効果の再計算が必要になるでしょう。
「万能の最強AI」というより「特定用途で最大効率を出せる設計」と捉えるのが適切ではないかと考えます。
これはあくまで予想であり、実際の評価は今後の利用データで変わりうる点をご了承ください。
Fugu Ultraの性能数値まとめ
Fugu Ultraは複数の主要ベンチマークで高スコアを記録したと報告されています。
ベータテストでは「既存AIが見逃したバグを20件以上発見した」という実績も確認されています。
| 評価項目 | スコア・結果 |
|---|---|
| Terminal-Bench 2.1(自律コーディング) | Fable 5超え |
| GPQA-D(科学的推論) | 95.1% |
| LCBv6(コード生成) | 93.2% |
料金プランと導入の流れ
Fuguは月額サブスクリプションとAPI従量課金の両方に対応しています。
2026年7月末までの登録で翌月分が無料になるキャンペーンが実施中とのことです。
| プラン | 料金 | 想定ユーザー |
|---|---|---|
| Standard | $20/月(約3,200円) | 個人・軽量用途 |
| Pro | $100/月(約16,000円) | チーム・ヘビーユーザー |
| Max | $200/月(約32,000円) | 大規模業務自動化 |
| API従量 | 入力$5・出力$30/100万トークン | 開発者向け |
OpenAI互換のAPIを採用しているため、既存のGPTコードをほぼそのまま流用できるケースが多いとされています。
乗り換えの技術的ハードルが低い点も、早期採用者から好評を得ている理由のひとつです。
実際に使った人の声と課題点
リリース直後からXでは454件以上のポストが確認されており、
ITビジネス関係者を中心に活発な意見が出ています。
- 「コードレビューで見落としていたバグを複数発見できた」
- 「日本語の精度が高く読みやすい」
- 「GPTからの移行がスムーズだった」
- 「国産AIとして現実的な路線を切り開いている」
- 「複数モデルを使う分トークンが増えてコストが上がりやすい」
- 「Pro・Maxプランの価格設定が高め」
- 「ベータ中にタイムアウトが起きた報告あり」
- 「外部モデルへの依存リスクが残る」
Fugu・Sakana AIに関するよくある質問
Q1. FuguはどんなAIタスクに向いていますか?
コードレビュー・セキュリティ診断・科学的推論など、精度が求められる専門的タスクでの評価が高いとされています。
ベータテストではコード系タスクで特に好成績が報告されています。
一方、軽い日常会話には標準版Fuguが向いているとされています。
Q2. 日本語は使えますか?
利用できます。
ベータ参加者から「日本語の出力が自然で読みやすい」との評価が複数寄せられています。
日本語での業務自動化にも対応可能とされています。
Q3. 「Fable 5超え」はどのベンチマークでの話ですか?
Terminal-Bench 2.1(自律的なコーディングタスク)での比較です。
すべてのタスクや用途でClaude Fable 5を超えるわけではありません。
GPQA-D 95.1%・LCBv6 93.2%という数値も、コーディング・推論系での強みを示す指標です。
Q4. 輸出規制との関係は?
Sakana AI自身が「輸出規制リスクを負うことなくフロンティアレベルを発揮できる」と説明しています。
日本国内での開発・運用が基本で、米中の半導体規制の直接的な影響を受けにくい設計とされています。
ただし利用する外部モデル(GPT・Claude等)の規約は各プロバイダーに準じます。
Q5. Sakana AIはどんな会社ですか?
2023年設立の東京拠点のAIスタートアップです。
元Google DeepMind研究者らが共同設立し、
進化的アルゴリズムを使ったAIの自動設計・最適化を専門としています。
今回のFuguはその研究成果を実用サービスとして展開したものです。
Q6. 既存のOpenAI APIからの移行は難しいですか?
OpenAI互換APIを採用しているため、既存コードをほぼそのまま移行できるケースが多いと報告されています。
移行コストが低い点は早期採用者に好評です。
ただし本番環境への切替前には動作確認のテストが推奨されます。
まとめ
Sakana AIのFuguは「複数AIを束ねて超える」という新発想で、特定ベンチマークでClaude Fable 5超えを達成したと発表されています。
日本発・輸出規制リスク回避・OpenAI互換という三拍子が、
導入障壁の低さと注目度の高さにつながっています。
月額$20のStandardプランから始められ、
7月末まで2ヵ月目無料キャンペーンも実施中です。
コーディング支援・推論タスク・業務自動化を検討中の方は試してみる価値があるでしょう。
続報が入り次第、追記します。

コメント