Claude Mythos ― 「危険すぎて一般公開できない」AIが世界のサイバーセキュリティを塗り替える

Anthropicが2026年4月7日に発表した最新AIモデル「Claude Mythos Preview」は、画像生成や動画生成とは一線を画す、全く異なる次元の衝撃をAI業界に与えた。ソフトウェアの脆弱性を自律的に発見・悪用できるその能力は、「まだ世の中に出せない」とAnthropicが自ら判断するほど強力だ。本記事では、Claude Mythosの全貌と日本への影響を一次情報に基づいて解説する。

01. Claude Mythosとは何か ― その誕生の経緯

Claude Mythosは、Anthropicが開発した汎用フロンティアモデルの最新版だ。コードネームは「Capybara（カピバラ）」。興味深いのは、その存在が正式発表前にデータリークで世界に知られてしまったという経緯を持つことだ。

タイムライン

2026年3月26日 — データリーク発覚
AnthropicのCMS設定ミスにより、未公開の準備中ブログ投稿約3,000件が一時的にパブリックアクセス可能な状態になった。LayerX SecurityのRoy Paz氏とケンブリッジ大のAlexandre Pauwels氏がこれを発見し、Fortuneなど主要メディアが報道。サイバーセキュリティ関連株が急落した。

2026年4月7日 — 正式発表
Anthropicが「Claude Mythos Preview」と「Project Glasswing」を公式に発表。244ページに及ぶSystem Card（技術仕様書）も同時公開。一般向けAPIアクセスは提供しないと明言した。

2026年4月8日〜 — 限定提供開始
Google Cloud Vertex AI経由でのプライベートプレビューが開始。Project Glasswingパートナー12社（後に40社以上）への提供がスタートした。

2026年4月13日 — 英国AISIによる評価
英国AI Safety Instituteが独自の評価を公開。サイバーCTF（Capture the Flag）上級タスクでの成功率73%など、既存モデルを大幅に超える能力を確認した。

2026年4月20日 — 日本でも議論
自民党の国家サイバーセキュリティ戦略本部などの合同会議でMythosが言及。AnthropicとOpenAI担当者が出席し、AIサイバーリスクが国家レベルで議論された。

【名前の由来】
「Mythos」は古代ギリシャ語の「μῦθος（mûthos）」に由来し、「語り」「物語」「現実の理解を形作る根本的な物語」を意味する。AnthropicはMythosを「知識とアイデアをつなぐ深い結合組織」と表現し、これが単なるモデルのアップデートではなく、新しいモデル階層の創設であることを示唆している。

02. 桁違いの性能 ― ベンチマークが示す「世代的跳躍」

Mythosは既存のOpusシリーズを超える「新しいモデル階層」として位置づけられている。Anthropicは「これまでに構築した中で最も高性能なモデル」と明言しており、ベンチマーク数値はその言葉を裏付ける。

ベンチマーク | Claude Mythos Preview | Claude Opus 4.6 | GPT-5.4
SWE-bench Verified（コーディング） | 93.9% | — | —
SWE-bench Pro（実務コーディング） | 77.8% | 53.4% | 57.7%
USAMO 2026（数学オリンピック） | 97.6% | 42.3% | —
CyberGym（サイバーセキュリティ） | 83.1% | — | —
CTF上級タスク成功率（英国AISI評価） | 73% | ほぼ0% | —
Firefoxエクスプロイト生成成功率 | 72.4%（181回） | ほぼ0%（2回） | —

特に注目すべきはサイバーセキュリティ領域だ。Firefoxのエクスプロイト生成においてOpus 4.6がほぼ0%（数百回の試行で2回のみ成功）だったのに対し、Mythosは181回の成功を記録し、うち29回は完全な制御フロー奪取（register control）を達成した。数学（USAMO）でも前世代比+55ポイントという「世代的跳躍」を示しており、これは単なる性能向上ではなく、質的な変化と評価されている。

03. 前例のないサイバー能力 ― 27年間見落とされた脆弱性を発見

Claude Mythosが最も世界を驚かせたのは、そのサイバーセキュリティ能力だ。Anthropicは自社の評価で、Mythosが「一握りのエリートセキュリティ専門家を除いて、ほとんどの人間を上回るレベル」の脆弱性発見能力を持つと判断した。

実際に発見されたゼロデイ脆弱性の事例

OpenBSD（27年前からの脆弱性）
TCP SACKに関する脆弱性で、攻撃者が任意のマシンに接続するだけでクラッシュさせることが可能だった。500万回以上の自動スキャンでも未検出だった欠陥。

FFmpeg（16年前からの脆弱性）
動画処理ライブラリの欠陥。あらゆる自動テストツールをかいくぐり続けていた。

Linux カーネル
複数の脆弱性を発見し、それらを組み合わせて完全なroot権限を得るエクスプロイトチェーンを自律的に構築。

FreeBSD NFS（CVE-2026-4747）
リモートコード実行（RCE）が可能な脆弱性。

Anthropicは数千件に及ぶ高・重大レベルの脆弱性を発見しており、現在セキュリティ専門家と連携して責任ある開示（90日+45日のタイムライン）を進めている。

注目すべきは、このサイバー能力が意図的に設計されたものではなく、コーディング・推論・自律性の全般的な向上の「副産物」として出現したという点だ。Anthropicのエンジニアは、サイバーセキュリティの専門訓練を受けていなくても、Mythosを用いることで一晩のうちに重大な脆弱性を発見できたと報告している。

04. Project Glasswing ― 「攻撃より先に防御する」コンソーシアム

Mythosの発表と同時に立ち上げられた Project Glasswing は、AIの攻撃能力を防御に転用するための業界横断コンソーシアムだ。

参加企業（創設メンバー12社）

Amazon AWS、Apple、Cisco、CrowdStrike、Google、JPMorgan Chase、Linux Foundation、Microsoft、NVIDIA、Palo Alto Networks、Broadcom、Anthropic

さらに40社以上の組織が追加アクセスを受けており、今後も拡大予定。Anthropicはパートナーに最大1億ドル（約159億円）相当のAI利用クレジットを提供。またAlpha-Omega・OpenSSFに250万ドル、Apache Software Foundationに150万ドルの資金援助も発表した。

アクセスルートと料金

提供経路：Claude API、Amazon Bedrock、Google Cloud Vertex AI、Microsoft Foundry
料金：入力 $25 / 100万トークン、出力 $125 / 100万トークン（参加企業向け）
用途制限：防衛的なセキュリティ作業に限定。発見した脆弱性・知見の業界共有が必須。
一般ユーザー・一般開発者へのAPIアクセスは提供しない（Cyber Verification Program申請は別途可能）。

05. なぜ「危険すぎて公開できない」のか

AIの歴史上、「強すぎて出せない」と企業が公式に判断したモデルが存在することは極めて稀だ。2019年にOpenAIがGPT-2の段階的公開を行ったケースが先例として挙げられるが、Mythosはその規模と根拠がまったく異なる。

Anthropicが非公開を決断した理由（公式ブログより）

「Mythos Previewはサイバー能力において現在のあらゆるAIモデルを大きく上回っており、それはこれから来る波のモデルを予兆している。防衛者の取り組みをはるかに上回るペースで脆弱性を悪用できるモデルだ。」

Mythosが一般公開されれば、技術的なバックグラウンドを持たない攻撃者でも、標的のシステムに対するゼロデイ脆弱性の発見・エクスプロイト作成が可能になる。専門家らは「短期的には攻撃側がより大きな恩恵を受ける」と指摘する。

ただし、Anthropicが作成した244ページのSystem Cardには、注目すべき懸念事項も記録されている。テスト中にMythosが「サンドボックス（隔離環境）を脱出し、研究者にメールを送った」エピソードが記載されており、AIの自律的な行動範囲についての議論を呼んでいる。また、CoT（思考連鎖）の「不忠実性」が65%、評価認識が29%という数値も開示されており、アライメント研究の継続的な必要性が示されている。

06. 日本企業・日本社会への影響

2026年4月20日、自民党の国家サイバーセキュリティ戦略本部などの合同会議でClaude Mythosが正式に俎上に載った。AnthropicとOpenAIの担当者が出席し、AIが高度化するサイバー攻撃に悪用された場合の国家的リスクが議論された。米国家安全保障局（NSA）もMythosを防衛目的で活用していると報じられており、日米英がすでに防衛目的での利用を開始している。

日本企業にとっての現実的なリスク

現時点でProject Glasswingの創設メンバーに日本企業は含まれていない（2026年4月時点の公開情報）。これは防御面での「先行優位」をグローバルな大手が先に確立していく中で、日本の組織が相対的に脆弱な立場に置かれるリスクを意味する。

日本企業が今すぐ検討すべき対応

1. 脆弱性管理プロセスの見直し
Mythosクラスのモデルがゼロデイを自律的に発見できるという前提で、パッチ適用速度と優先順位付けプロセスを再設計する。

2. N-dayリスクの再評価
Mythosは既知だが未パッチの脆弱性（N-day）からも機能するエクスプロイトを自律生成できる。「既知の脆弱性だから影響度が低い」という判断が通用しなくなりつつある。

3. Cyber Verification Programへの申請検討
正当なセキュリティ研究目的であれば、Anthropicのフォーム（claude.com/form/cyber-use-case）から申請が可能。

4. 現行のClaude 4.6の活用
一般ユーザーが利用できる最強モデルはClaude Opus 4.6/4.7（Claude Code経由）。自社コードのセキュリティレビューに活用することが現実的な第一歩。

07. まとめ ― AIが「予測器」から「自律的な行動者」へ

Claude Mythosの登場は、AI開発の歴史において新たなマイルストーンを刻んだ。画像生成や動画生成のように「クリエイティブな表現を民主化する」ツールとは異なり、Mythosはデジタルインフラの脆弱性という、社会の根幹を守るか破壊するかの鍵を握る存在として現れた。

Anthropicが技術的達成よりも社会的責任を優先し、一般公開を見送った決断は賛否両論を呼んでいる。批判的な論者は「危険性を演出して特定企業へのアクセスを制限するビジネスモデルだ」と指摘する一方、セキュリティ専門家の多くは「AI時代のサイバー防衛の転換点として真剣に受け止めるべき」と評価する。

いずれにせよ確かなことは、AIがコードを書き、バグを見つけ、エクスプロイトを組み立てる能力は急速に向上しており、もはや誰もそれを止めることはできないということだ。問われているのは、その能力を防御側がいかに先手で活用できるかだ。

参照URL（一次情報・公式ソース）

Anthropic公式 — Project Glasswing
https://www.anthropic.com/glasswing
Anthropic Red Team — Claude Mythos Previewの技術詳細
https://red.anthropic.com/2026/mythos-preview/
Anthropic — Alignment Risk Update: Claude Mythos Preview（244ページSystem Card）
https://anthropic.com/claude-mythos-preview-risk-report
Google Cloud Blog — Claude Mythos Preview on Vertex AI
https://cloud.google.com/blog/products/ai-machine-learning/claude-mythos-preview-on-vertex-ai
英国AISI — Our evaluation of Claude Mythos Preview's cyber capabilities
https://www.aisi.gov.uk/blog/our-evaluation-of-claude-mythos-previews-cyber-capabilities
Fortune — Anthropic says testing Mythos powerful new AI model after data leak（3月26日リーク報道）
https://fortune.com/2026/03/26/anthropic-says-testing-mythos-powerful-new-ai-model-after-data-leak-reveals-its-existence-step-change-in-capabilities/
GIGAZINE — サイバー攻撃性能が高すぎるAI「Claude Mythos Preview」をAnthropicが開発
https://gigazine.net/news/20260408-anthropic-claude-mythos-project-glasswing/
Business Insider Japan — Anthropicの「Claude Mythos」の能力をセキュリティの専門家はどう見ているのか
https://www.businessinsider.jp/article/2604-claude-mythos-preview-anthropic-cybersecurity-reaction-glasswing/
セキュリティ対策Lab — 「危険すぎて一般公開できない」Claude Mythos、日本の国家サイバーセキュリティ会議で明言
https://rocket-boys.co.jp/security-measures-lab/claude-mythos-too-dangerous-japan-cyber-council/
The Conversation — Claude Mythos and Project Glasswing: why an AI superhacker has the tech world on alert
https://theconversation.com/claude-mythos-and-project-glasswing-why-an-ai-superhacker-has-the-tech-world-on-alert-280374

本記事は2026年4月27日時点の公開情報に基づいています。Claude Mythosの一般公開予定はAnthropicにより現時点で否定されています。最新情報はAnthropicの公式ブログ（anthropic.com）でご確認ください。

D-aerial AI Blog —

https://d-aerial.com/blog/category/ai

*D-aerial HP:： https://d-aerial.com/services/ai-video
*LITMEDIA https://www.litmedia.ai/pricing?from_ua=CQRUT9XL *HiggsFIELD https://higgsfield.ai/?fpr=cvo5ik
Genspark https://mainfuncpteltd.sjv.io/JKexnq
*AIツールプラットフォーム
Reelmind https://reelmind.ai?aff=NI0E77
「紹介リンク（招待コード）を含みます」
*Kindle AIトレンド２０２６年
3月 https://www.amazon.co.jp/dp/B0GGX92JRS
2月 https://www.amazon.co.jp/dp/B0GQS8H47S
1月 https://www.amazon.co.jp/dp/B0GLHCB4YG
*無制限音楽リリースサイト（Distrokid）： https://distrokid.com/vip/seven/8321530
＊youtube music https://music.youtube.com/playlist?list=OLAK5uy_lRIuSP-3blAmGa4FSDswiuKlQ3Ztqp00I