Anthropic 與白宮就 Claude Fable 5 越獄疑慮持續角力

據三位知情人士透露，川普政府官員週一結束了與 Anthropic 的會談，但並未解除上週因越獄（jailbreaking）疑慮而對該公司最先進 AI 模型實施的出口管制。政府仍認為有辦法禁用 Anthropic 的 Claude Fable 5 上的一些安全防護（guardrails），從而讓使用者能夠存取該公司 Mythos 模型更強大的網路安全功能。

Anthropic 多日來一直表示，政府的擔憂被誇大了。據一位知情人士稱，該公司在商務部與來自 AI 標準與創新中心以及國家網路總監辦公室的政府研究人員舉行的工作小組會議中，再次重申了這一立場。商務部長 Howard Lutnick 也透過電話會議從法國埃維昂的 G7 峰會參與了會議。該人士表示，國家網路總監 Sean Cairncross 本人並未出席。

在 Anthropic 方面，共同創辦人兼首席運算長 Tom Brown 和對外事務主管 Sarah Heck 一直主導著這些討論。Anthropic 的前沿紅隊（red-teaming）負責人 Logan Graham 和資深安全研究員 Nicholas Carlini 也飛往華盛頓特區參與會談。

Anthropic 發言人在給 WIRED 的聲明中表示：「雙方正迅速努力解決此事。」白宮發言人則拒絕置評。

目前尚不清楚接下來的步驟將如何發展。商務部表示願意尋找方法讓 Fable 5 重新上線供消費者使用，但知情人士稱，這可能取決於 Anthropic 能否完全解決越獄疑慮。這些緊急會談發生在 Anthropic 的一個政治敏感時刻，該公司此前已與五角大廈就其 AI 模型是否可用於某些軍事應用展開了長期爭論。

川普政府上週首次接到越獄疑慮的警報。據知情人士透露，Amazon 執行長 Andy Jassy 直接致電財政部長 Scott Bessent，討論了這些所謂的漏洞，這在一定程度上嚇到了政府。Jassy 與川普政府的對話最初由 The Information 報導。

警覺的白宮官員隨後指派國家安全局（NSA）協助審查這些漏洞。NSA 回應稱，他們認為確實有可能移除 Fable 5 的安全防護，促使政府對該模型實施限制。

隨後，在商務部起草對 Fable 5 實施出口管制的信函時，Lutnick 週五與 Anthropic 執行長 Dario Amodei 進行了交談。據一位知情人士透露，週末期間，在 Anthropic 切斷所有使用者對該模型的存取後，Lutnick 與 Brown 和 Heck 進行了多次通話。

目前尚不清楚為何 Amazon，作為 Anthropic 最大的投資者之一，會對 Fable 5 發出警報。Amazon 發言人告訴 WIRED：「作為服務大量私人和公共部門客戶的領先雲端供應商，政府就潛在安全風險尋求我們的建議並不罕見。當這種情況發生時，我們不會分享這些討論的細節。」

**安全認知分歧**

Anthropic 與政府之間對話的核心，是關於 Claude Fable 5 越獄疑慮嚴重程度的分歧。Anthropic 在週五的一篇部落格文章中暗示，政府對潛在風險的描述被誇大了。一些網路安全研究人員週一向官員重申了這一立場，並發送了一封公開信，認為對 Anthropic 採取的出口管制行動是不合理的。

公開信中寫道：「Anthropic 的 Mythos 級模型在發現漏洞和利用漏洞方面表現出色。然而，它們並非在這些任務上獨一無二，許多簽署者每天都會使用其他基礎模型和開源模型進行安全審計和紅隊測試。因此，這項行動剝奪了防禦者使用最佳模型的機會，造成了市場不確定性，並在沒有真正風險足以證明其合理性的情況下，危及了美國在 AI 領域的領導地位。」

越獄是透過以特定方式提示 AI 模型來規避其安全防護。由於 Fable 5 是 Mythos 的一個版本，並設有特定的網路安全、生物學和化學安全防護，繞過這些保護將有效地讓使用者獲得 Mythos 的版本。Anthropic 本身曾對允許 Mythos 供大眾使用表示嚴重擔憂；然而，它週五表示 Fable 5 的安全防護足夠強大，可以公開發布。

評估 Amazon 調查結果的研究人員表示，所發現的問題並未完全抵銷 Fable 5 的安全防護。Luta Security 創辦人兼執行長 Katie Moussouris 在閱讀 Amazon 的報告後發表分析稱：「這本身並非越獄。」Moussouris 強調，無論美國政府是否有 Fable 5 完全越獄的證據，限制模型存取某些主題充其量只是一種權宜之計。

Moussouris 說：「我們（安全研究人員）大多數人認為安全防護只是減速帶，不應被視為熟練對手的安全邊界。它們只會減慢技能較差的人。」

另一位接近該公司的人士表示，Anthropic 的投資者也在週末期間努力評估該公司與白宮的最新爭執如何影響其企業未來。該人士稱，一些投資者認為美國政府正在針對 Anthropic，如果競爭對手發布類似 Mythos 的模型，可能不會面臨同樣的反應。

白宮的出口管制指令也對其他旨在發布 Mythos 級 AI 模型的 AI 實驗室提出了更廣泛的問題，以及他們如何遵守美國政府的規定。據與 WIRED 交談的 AI 實驗室領導人稱，現在預計 AI 實驗室將提前讓白宮存取先進的 AI 模型，並在模型發布時極其主動地向美國政府通報。

「週末發生的事件……對所有人來說都具有啟發性，表明（美國）政府願意採取這些措施，」加拿大 AI 實驗室 Cohere 的執行長 Aidan Gomez 說，該公司提供企業工具。「沒有人可以對這個現實天真。」