「危険すぎて公開できない」はずのAIが数週間で全公開へ——AnthropicのMythos方針転換が問う本質的矛盾

公開日: 2026年5月30日

Anthropicが「サイバーセキュリティ上の懸念から一般公開不可」と判断していたAI「Claude Mythos」を、数週間以内に全顧客へ展開すると発表しました。Claude Opus 4.8のリリースと同時に明らかになったこの計画。当初の「危険すぎる」という判断と何が変わったのか、その矛盾と背景を徹底解説します。

「危険すぎて公開できない」はずのAIが数週間で全公開へ——AnthropicのMythos方針転換が問う本質的矛盾

2026年4月、Anthropicは自社の最先端AIモデル「Claude Mythos」について、「サイバーセキュリティ上のリスクが大きすぎるため一般公開しない」と発表しました。ところが約2ヶ月後の5月28日、同社は「数週間以内にMythosクラスのモデルを全顧客に提供する」と方針を大転換。この決定は、技術コミュニティや規制当局の間で大きな波紋を呼んでいます。

いったい何が変わったのか、そして「安全策を強化した」という説明は本当に矛盾を解消できているのか——本記事では、最新情報をもとに整理します。


Mythosとは何か——なぜ「危険すぎる」とされたのか

前例のない脆弱性発見能力

Claude Mythosは、2026年4月7日に限定プレビューとして発表されたAnthropicの最上位AIモデルです。その能力は、従来のAIモデルとは一線を画すものでした。

Anthropicの公式レポートによると、Mythosは主要なすべてのOSおよびすべての主要ブラウザの脆弱性を自律的に発見・エクスプロイトできるとされています。具体的には、FreeBSDのNFSサーバーに潜む17年間発見されなかったリモートコード実行の脆弱性(CVE-2026-4747)を完全に自律で特定・悪用する実証まで行われました。

さらに驚くべきことは、そのスピードと規模です。

  • わずか7週間で2,000件以上のゼロデイ脆弱性を発見(これは人類が1年間に発見する脆弱性総数の約30%に相当するとされます)
  • 発見された脆弱性の99%以上が未パッチ状態で公開時点では残存
  • Project Glasswingを通じた1ヶ月の運用で、高・重大レベルの脆弱性を10,000件以上検出

これらの数字が示すのは、単なる「高性能なセキュリティツール」ではなく、攻撃者の手に渡れば壊滅的な被害をもたらしうる兵器級の能力です。

Project Glasswingという「制御された実験」

こうした危険性から、Anthropicは一般公開を見送り、代わりに「Project Glasswing」という限定アクセスプログラムを立ち上げました。

参加組織にはAmazon Web Services、Apple、Microsoft、Google、NVIDIA、CrowdStrike、JPMorgan Chaseなど約40社の大手テクノロジー・金融企業が名を連ねています。目的はあくまで防御的なサイバーセキュリティ作業に限定されており、Mythosが発見した脆弱性を修正することに使われてきました。

この判断は世界の規制当局も注目するほどのものでした。FRB議長のジェローム・パウエル氏と財務長官のスコット・ベセント氏が主要銀行CEOを召集してMythosのリスクを協議し、イングランド銀行のアンドリュー・ベイリー総裁はAnthropicとの直接会合を要求。IMFも「AIを活用したサイバーリスクは金融安定上の問題として扱うべき」と警告を発しました。


方針転換——「数週間以内に全顧客へ」

Claude Opus 4.8と同時発表された「爆弾」

2026年5月28日、Anthropicは新モデル「Claude Opus 4.8」を発表しました。前バージョンから41日という異例の短期間でのリリースです。ただし、本記事の焦点はOpus 4.8そのものではありません

同日の発表の中で、別途注目すべき一文が業界に衝撃を走らせました。それは、4月に「危険すぎる」と判断され一般公開を見送ったMythosクラスのモデルを、いつ・どのように全顧客へ展開するかという方針転換に関するものです。

「安全策の開発を急速に進めており、数週間以内にMythosクラスのモデルを全顧客に提供できると見込んでいる

4月に「危険すぎる」と判断したモデルと同等の能力を、わずか数週間後に全世界のユーザーへ。この転換の速さは、多くの専門家を驚かせました。

本記事の対象は「これから展開されるMythosクラス」

ここで整理しておく必要があります。Opus 4.8とMythosは別のモデルであり、同日に発表されただけです。Opus 4.8は通常のフラッグシップモデルのアップデートであり、本記事が問いかける矛盾の主体ではありません。

本記事が扱うのは、上記の一文で示されたこれから数週間以内に全顧客へ提供される予定のMythosクラスのモデルです。4月に限定プレビューとして公開されたClaude Mythosと同等の脆弱性発見能力を持つモデルが、Project Glasswingの限定枠を超えて一般展開される——その判断こそが、本記事の論点です。


矛盾の核心——「安全策」は本当にリスクを解消するのか

能力の同等性とリスクの非対称性

ここで根本的な問いが生じます。「安全策を強化した」という説明は、能力そのものが持つリスクを解消できるのか、という問題です。

Anthropicの主張は「より強力な安全策を開発した」というものですが、問題の本質はモデルの能力そのものにあります。

当初の判断(4月) 現在の計画(5月末) 矛盾点
「脆弱性発見能力が危険すぎる」 Mythosクラスを全顧客に提供 能力が同等なら危険性も同等
「悪用リスクが受け入れられない」 一般公開を予定 悪用リスクは根本的に変わらない
「用途をサイバー防御に限定」 全顧客への展開 用途制限が実質的に機能しない

安全策が「モデルが持つ能力そのもの」を変えるわけではありません。アクセス制御や利用規約で悪用を防ごうとしても、それは「使う人を選ぶ」ことであって、「能力の危険性を低下させる」ことではないのです。

「安全策がまだ存在しない」という自己矛盾

さらに注目すべきは、Anthropic自身が認めていた事実です。Project Glasswingの初期アップデートで、同社は次のように述べていました。

「現時点では、Anthropicを含むどの企業も、こうしたモデルの悪用を防ぎ深刻な被害を食い止めるのに十分な安全策を開発していない」

この文言は5月22日時点のものです。そして5月28日には「数週間以内に全顧客へ」と発表しています。わずか6日間で、誰も達成できていなかった安全策の開発が完了する見通しが立ったことになります。この急転換の説明は、現時点ではAnthropicから十分に提示されていません。

競争圧力という「見えない要因」

方針転換を考える上で無視できないのが、競合他社との競争です。

5月28日の発表全体——Opus 4.8のリリースとMythos展開方針の転換——が前バージョンから41日という短期間で行われた背景には、OpenAIのCodexやGoogleのGemini Flashといった競合モデルの相次ぐリリースがあります。Opus 4.7に対してユーザーの一部から「期待外れ」との声もあり、Anthropicにはリリースサイクルを加速する強い動機がありました。

「安全性の問題が解決されたから公開する」のか、それとも「競争上の理由で公開する必要があるから、安全策が整ったという形にする」のか——外部からはこの区別がつきにくい状況です。


専門家の見解——「脅威はすでにここにある」

既存モデルでもゼロデイ発見は可能

一方で、サイバーセキュリティの専門家からは異なる視点も示されています。

セキュリティ企業Vidocのクラウディア・クロック CEOはCNBCに対し、「私たちが今持っているモデルは、すでに大規模なゼロデイ発見ができるほど強力であり、それ自体がすでに恐ろしいことだ」と述べ、この状況は「数ヶ月、あるいは1年前から続いている」と指摘しています。

この視点に立てば、Mythosの公開判断は「新たなリスクを生むかどうか」だけでなく、「すでに存在するリスクに対してどう対処するか」という問いに変わります。

6〜12ヶ月という「防御の窓」

Anthropicのダリオ・アモデイCEOは、敵対勢力がMythosと同等の能力を持つモデルを開発するまでに6〜12ヶ月の窓があると述べています。この期間に脆弱性を修正しておくことが、Mythosを防御目的で使う最大の理由です。

Project Glasswingを通じて2026年5月時点で530件の高・重大脆弱性が報告され、うち75件がパッチ済みとなっています。また、wolfSSL(数十億のデバイスで使用される暗号化ライブラリ)の重大な脆弱性(CVE-2026-5194)も発見・修正されました。

防御側が先手を打てるうちに動く、という論理は理解できます。しかしそれは、限定的な管理下での使用を正当化するものであって、全顧客への一般公開を正当化するものとは必ずしも言えません。


今後の注目点

Mythosの一般公開が実現した場合、以下の点が重要になります。

技術的な観点

  • 「安全策」の具体的な内容が明示されるかどうか
  • 悪用検知・遮断の仕組みがどこまで機能するか
  • オープンソースプロジェクトのメンテナーへの過負荷問題(すでに「開示ペースを落としてほしい」との要請が出ています)

規制・政策的な観点

  • G20各国の金融規制当局がどのような対応を取るか
  • 米国・同盟国政府へのProject Glasswing拡大の進捗
  • EUのAI法や各国のサイバーセキュリティ規制との整合性

競争的な観点

  • 中国のQihoo 360など競合する脆弱性発見AIの開発状況
  • 「防御側の先行」という前提が崩れた場合のリスクシナリオ

まとめ

AnthropicのMythos方針転換は、AI安全性をめぐる議論の核心を突いています。

「安全策を強化したから公開できる」という説明は一見合理的に見えます。しかし、能力そのものは変わっていないという事実、「現時点では誰も十分な安全策を持っていない」という自社の声明、そして競争圧力という現実的な背景を合わせて考えると、「安全性が確保されたから」という説明だけでは不十分です。

Mythosの問題は、単にAnthropicという一企業の意思決定の問題ではありません。これは「AIの能力が人間社会のインフラに直接影響を与えるレベルに達したとき、誰がどのように公開の可否を判断するのか」という、AI時代の本質的なガバナンス問題です。

数週間後に迫る一般公開。その「安全策」の中身に、世界が注目しています。


本記事は2026年5月30日時点の公開情報をもとに作成しています。