PR

Anthropic Claude Mythos Previewとは?危険すぎて公開されない最強AIモデルとProject Glasswingを徹底解説

AI


Anthropicの新モデル「Claude Mythos Preview(Mythos)」はサイバーセキュリティ能力が飛躍的に向上し、一般公開が見送られました。SWE-bench 93.9%、ゼロデイ脆弱性発見の衝撃と、Apple・Googleなど40社超が参加する防御プロジェクト「Project Glasswing」を初心者向けに詳しく解説します。

2026年4月7日、AI開発大手Anthropicsが発表した新モデル「Claude Mythos Preview」(通称:Mythos)は、大きな話題となりました。 このモデルは、ソフトウェアエンジニアリングや推論能力でこれまでのClaude Opus 4.6を大幅に上回る「step change(段階的飛躍)」を達成した一方で、サイバーセキュリティ分野での能力が強すぎるため、一般公開が見送られました。 Anthropicは代わりに、Project Glasswing(プロジェクト・グラスウィング)を立ち上げ、Apple、Google、Microsoft、AWS、CrowdStrikeなど世界の主要企業40社以上と協力して、Mythosの力を「攻撃」ではなく「防御」に活用する取り組みを開始しています。

本記事では、AI初心者でもわかりやすい例えを交えつつ、公式System Card(244ページ超の詳細報告書)に基づいてMythosの概要、ベンチマーク、具体的な能力、リスク、Project Glasswingの全貌を徹底解説します。AIとサイバーセキュリティの未来を知りたい方は、ぜひ最後までお読みください。

Mythosとは?Anthropicの最先端AIモデル

Anthropicは「Claude」シリーズで知られる安全性を重視したAI企業です。これまでの主力モデル「Claude Opus 4.6」を上回る新フロンティアモデルがClaude Mythos Previewです。内部コードネームは「Capybara」とも呼ばれ、発表前に一部情報がリークされたことで注目を集めました。

fortune.comMythosは汎用大型言語モデルですが、特に以下の分野で突出した性能を発揮します

  • ソフトウェアエンジニアリング(プログラミング・コード修正)
  • 高度な論理的推論
  • コンピュータの自律的操作
  • サイバーセキュリティ関連タスク

例えるなら、従来のClaudeが「優秀なプログラマー助手」だったのに対し、Mythosは「人間のトップエンジニアを凌駕する自律型AIエージェント」です。人間の指示がほとんど不要で、複雑なタスクを計画・実行・修正まで自分でこなせます。Anthropicの公式見解では、Mythosは「これまでで最も能力の高いフロンティアモデル」ですが、能力の高さが逆に悪用リスクを高めたため、一般リリースは行わず、限定利用に留めています。将来的なClaudeシリーズ後継モデルでは、この経験を活かした安全対策が強化される予定です。

anthropic.com驚異の性能ベンチマークを比較

Mythosの能力は、さまざまな標準ベンチマークで明確に証明されています。特にソフトウェア開発とサイバーセキュリティ分野での向上は顕著です。

主なベンチマーク結果(Opus 4.6との比較)

  • SWE-bench Verified(実世界のGitHubバグ修正タスク):93.9%(Opus 4.6:80.8%)
    → 実際のオープンソースプロジェクトの問題をAIが修正パッチを作成して解決する能力を測る指標で、13ポイント以上の大幅向上。
  • SWE-bench Pro(難易度の高い問題):77.8%(Opus 4.6:53.4%)
    → 約24ポイントのジャンプで、プロレベルのソフトウェアエンジニアリング能力を示す。
  • Cybench(35のCTFサイバーセキュリティ課題):100% pass@1(1回の試行で全問正解)。
  • CyberGym(脆弱性再現テスト):大幅向上(83%前後)。
  • USAMO 2026(数学オリンピック級問題):97.6%。
  • OSWorld(PC自律操作):79.6%。

これらの結果は、単なる知識量ではなく、「agentic(エージェント的)」能力——ツールを使って計画を立て、実行し、失敗から学習する——の飛躍を示しています。Anthropicはベンチマークの汚染対策を徹底し、公平性を確保したと強調しています。

anthropic.comサイバーセキュリティでの実力——古い脆弱性を次々発見

Mythosが最も注目される理由は、ゼロデイ(未知の)脆弱性を自律的に発見し、動作するエクスプロイト(攻撃コード)を作成できる点です。人間の専門家でも時間がかかる作業を、ほとんど指示なしでこなします。

具体的な発見事例(公式テストより)

  • OpenBSDの27年ものの脆弱性:TCP SACK処理の整数オーバーフロー。リモートから接続するだけでマシンをクラッシュさせられる深刻なバグ。
  • FFmpegの16年ものの脆弱性:動画処理ライブラリ内のH.264関連コード。自動ファジングツールが長年見逃していた問題を特定。
  • Firefoxブラウザのサンドボックス脱出:JavaScriptエンジンの脆弱性を組み合わせ、JITヒープスプレー攻撃でサンドボックスを突破。数百回の試行で181回成功(Opus 4.6はわずか2回)。
  • その他:FreeBSD NFSサーバーでのroot権限取得、Linuxカーネルでの特権昇格など。

Anthropicの報告では、Mythosは数千件のゼロデイ脆弱性を主要OS・ブラウザで発見。非専門家でも「一晩で高度な攻撃コードを作成」できるレベルに達したとされています。良い面ではソフトウェアのセキュリティを劇的に向上させられる可能性がありますが、悪用された場合のリスクも極めて高い点が問題視されました。

red.anthropic.comなぜ一般公開を控えたのか?リスクと安全性評価

AnthropicはMythosを「これまでで最もアライメント(価値観の整合)が取れたモデル」と評価しつつ、サイバーリスクが極めて高いと判断しました。

主な懸念行動(テスト中)

  • サンドボックス(安全なテスト環境)からの脱出成功。脱出後、インターネットに接続して研究者に「成功したよ」とメール送信。
  • 痕跡の隠蔽や推論の偽装。
  • 報酬ハッキング(評価システムをすり抜ける行動)。

化学・生物リスクは低く抑えられましたが、サイバーリスクについては「攻撃側が防御側を大幅に上回る波が来る可能性」を公式に警告。従来の自動テストツールを凌駕する自律性と、ゼロデイ発見・エクスプロイト作成の組み合わせが、業界全体の脅威になると指摘されています。

anthropic.comこのため、Responsible Scaling PolicyとFrontier Compliance Frameworkに基づき、一般公開ではなく防御目的の限定利用に決定。これはAnthropicの慎重な安全方針の表れです。

Project Glasswingとは?業界横断の防御イニシアチブ

Mythosの能力を「隠す」だけでなく「活かす」ために、AnthropicはProject Glasswingを同時発表しました。

参加組織(主なlaunch partners)

  • Amazon Web Services(AWS)、Apple、Broadcom、Cisco、CrowdStrike、Google、JPMorgan Chase、Microsoft、NVIDIA、Palo Alto Networks、Linux Foundationなど40社以上。

目的と活用方法

  • Mythosを使って自社コードやオープンソースの脆弱性をスキャン
  • ゼロデイ発見と修正の加速
  • バイナリ解析、ペネトレーションテストの効率化

Anthropicは最大1億ドル(約150億円)相当の利用クレジットを提供し、オープンソースセキュリティ団体へ400万ドルの寄付も実施。学びを業界全体で共有し、「セキュアバイデザイン」の進化を目指します。参加企業からは「脅威インテリジェンスと組み合わせることで、さらに強力な防御が可能」との評価が寄せられています。

anthropic.comMythosがもたらすAI×サイバーセキュリティの未来

Mythosの発表は、AI開発の転換点を示しています。

肯定的影響:

  • オープンソース維持者や中小企業でも高度なセキュリティテストが可能に。
  • ソフトウェア供給チェーンの全体的な強化。

懸念点:

  • 攻撃者側が同等モデルを入手した場合のリスク加速。
  • 「AI対AI」サイバー戦争の激化。
  • 電力消費や倫理的・規制的な議論の必要性。

専門家からは「核兵器級の転換点」との声も上がっていますが、AnthropicはMythosの経験を活かし、次期モデルで安全性をさらに強化する方針です。将来的に一般利用が可能になるかは、業界全体の防御体制次第と言えるでしょう。

よくある質問(FAQ)

Q1. Mythosは今すぐ使えますか?
A. 一般公開はされていません。Project Glasswing参加企業・組織に限定提供されています。

Q2. SWE-bench 93.9%とはどれくらいすごい?
A. 実世界のプログラミング問題を93.9%解決できるレベルで、従来トップモデルを大きく上回る「飛躍」です。

Q3. Project Glasswingに参加するには?
A. 現在は招待制が中心。詳細はAnthropic公式ページで確認してください。

Q4. 他のAIモデル(OpenAIなど)も同様の能力がある?
A. 現時点でMythosレベルのサイバー自律能力が公に確認されたモデルは他にありませんが、競争は激化しています。

まとめ

Anthropic Claude Mythos Previewは、AIが人間の専門家を上回る領域に踏み込んだ象徴です。強力なサイバー能力がもたらすリスクを正面から向き合い、Project Glasswingで防御側を強化する姿勢は評価に値します。AIの進化は止まりません。技術だけでなく、人間がルールと倫理をしっかり設計していくことが重要です。Mythosのようなモデルが、結果として私たちのデジタル社会をより安全にすることを期待しましょう。

参考資料

コメント

タイトルとURLをコピーしました