AI危險性誰說了算？Anthropic模型下架事件引爆監管爭議

在本集 Decoder 節目中，我的來賓是 The Verge 的資深 AI 記者 Hayden Field。通常 Hayden 上節目時，都是因為 AI 領域出了問題。上週末，這個問題涉及 Anthropic、Trump administration 以及 Anthropic 的新 AI 模型 Fable 5，情勢相當緊張。

週五，在 Anthropic 向大眾發布 Fable 不到一週後，美國政府宣布對這個新模型及其底層的 Mythos 模型實施出口管制。這些管制措施限制了外國公民，即使是在美國為 Anthropic 工作的外國公民，也無法存取這些模型。隨後，Anthropic 將 Fable 和 Mythos 對所有人下架，因為該公司表示擔心無法限制存取並合理遵守這項命令。

可想而知，這一切都亂成一團。Hayden 實際上剛在 The Verge 上發表了一篇精彩的報導，詳細描述了上週五事件的始末，以及雙方在週末期間如何努力釐清發生了什麼事以及如何解決。因此，我邀請她來節目中，帶我們了解整個時間線及其意義。

The Verge 訂閱者請注意，您可以在任何收聽 podcast 的平台，獨家享受無廣告的 Decoder 節目。點擊此處前往。還不是訂閱者嗎？您可以在這裡註冊。

情況仍在持續發展。截至我們錄製本集節目的週二，Fable 仍處於離線狀態——事實上，如果您啟動 Claude，聊天視窗上方會顯示「Fable 5 目前無法使用」。然而，正如您將聽到 Hayden 解釋的，無論 Fable 本週是否重新上線，政府與 Anthropic 之間的爭執所帶來的連鎖反應，都將對科技產業和美國的 AI 監管體系產生深遠影響。

這裡還有一個巨大的諷刺，您也會聽到 Hayden 和我討論這一點：Anthropic 多年來一直主張 AI 可能很快就會強大到足以構成危險，並且政府需要盡早認真對待 AI 監管。嗯……現在我們身處其中，Anthropic 卻不喜歡事情的發展方式。

現在，所有人——尤其是中國政府——都在關注美國的 AI 監管方式，究竟會形成一個嚴謹的安全框架，還是僅僅成為 White House 用來對付不服從 Trump admin 的公司和個人的另一種武器。就像我說的，這真是一團混亂。

好的：The Verge 資深 AI 記者 Hayden Field 將談論 Claude Fable 禁令以及新的 AI 監管格局。我們開始吧。

本訪談稿已為長度和清晰度進行了輕微編輯。Hayden Field，您是 The Verge 的資深 AI 記者。歡迎回到 Decoder。

謝謝。很高興來到這裡。

Hayden，您來的時候總是混亂不斷。這是我發現的。

確實如此。我的規律仍然有效，那就是事情總是在週五爆發。麻煩事總是在週五發生，這次也不例外。

尤其當政府監管 AI 時，總會出現「如果週五一切都失控了，我們就得在週末思考如何解決」的情況。我認為這在 Trump administration 期間基本上都是如此。週一要將一切恢復原狀的努力是立即性的。

是的，沒錯。這太瘋狂了。而且所有這些討論在整個週末都在進行，到了週一卻仍然沒有解決方案。我很驚訝事情還沒有解決，但確實充滿了戲劇性。

嗯，這個 podcast 將在週四發布。我們在週二錄製。我們將看看接下來兩天會發生什麼。但我認為，關於美國政府應如何監管 AI 以及這對美國 AI 公司在全球舞台上的意義，這個大問題仍然懸而未決。我不認為 Fable 事件的結果就能解決一切。

讓我們試著了解整個故事，然後從中提煉出這些主題，因為我認為隨著每個新模型的發布，這些問題將會一再出現。那麼，讓我們從頭開始。什麼是 Claude Mythos？什麼是 Fable？它們之間有何關係？

好問題。大約一週前 Anthropic 推出這些模型時，我也問了他們同樣的問題。因為 AI 公司在命名方面真的很糟糕，總是令人非常困惑。但情況是，Mythos 是驅動 Mythos 5 和 Fable 5 的底層模型。Fable 是一個新模型。

他們沒有 Fable 1、2、3 或 4，而是直接從 Fable 5 開始，這非常令人困惑。但 Fable 是 Mythos 5 的「淡化」或「受保護」版本。當他們在四月推出 Mythos Preview 時，Anthropic 一直大力宣傳。

他們說這是一個潛在的網路武器，絕不能向公眾發布，至少在安全防護措施到位之前不行。他們只會將其發布給企業和政府，或者他們稱之為「網路防禦者」——那些需要在惡意行為者利用漏洞之前修補所有框架的地方。

現在，快轉到上週，Anthropic 不僅發布了 Mythos 5（這是第一個官方的 Mythos 模型，之前是 Mythos Preview，所以我們直接跳到 5），他們還在同一天發布了 Fable 5，這是 Mythos 級模型的首個公開版本。因此，雖然底層框架相同，但現在增加了大量的安全防護措施，希望能阻止公眾存取這個——根據 Anthropic 自己承認——可能搞砸一切的超級危險模型。

所以，這就是他們發布的模型。他們花了很長時間大肆宣傳其危險性，結果後來這反而困擾了他們。

Fable 是帶有安全防護欄的 Mythos 模型。它剛推出時，引發了一波爭議，對吧？AI 和安全研究人員發現，這些防護欄實際上阻礙了他們進行研究，並了解 Fable 的能力，因為如果他們試圖突破界限，模型就會降級到 Anthropic 之前的版本。

是的。這有點像一個迷因。人們當時都在嘲笑這些防護欄有多麼嚴格。

所以，這就是讓我困惑的地方：一方面，防護欄太嚴格引發了爭議；另一方面，又發生了什麼事讓政府認為 Fable 如此危險，以至於需要將其下架？到底發生了什麼？

我就此事諮詢了一些獨立的紅隊成員。在 Amazon 白皮書流傳之前，在這次「越獄」指控公開之前，我曾與一些紅隊成員討論 Fable 5 的安全性。他們都對防護欄的表現印象深刻。我原本預期它會更容易被「越獄」。他們說他們嘗試了很多方法，但都沒有奏效。

這與我通常和獨立紅隊成員交流的經驗不同，他們通常會說：「是的，我在這裡讓它崩潰了，在那裡也讓它崩潰了。」但在這次事件中，他們說 Fable 表現得相當不錯。

現在，根據我昨天採訪的一位熟悉談判且直接參與其中的消息人士透露，上週的時間線大致如下。上週中旬，Anthropic 得知了 Amazon 研究人員進行的一些研究。他們發現了一個潛在的「越獄」漏洞，對此感到相當擔憂。

他們將研究結果發送給 Anthropic。Anthropic 與 Amazon 研究人員就此來回討論，爭論這是否真的是一個「越獄」漏洞，或者本質上並非什麼大問題。據報導，Amazon 執行長 Andy Jassy 隨後對此感到擔憂，並在週五致電給可能是 [財政部長] Scott Bessent 或 Trump administration 的某位成員，表達了他的擔憂。

Trump administration 嚇壞了。他們立即致電 Anthropic。實際上，他們發送了一條訊息，說：「聽著，你們需要在 90 分鐘內將其關閉。」

90 分鐘？是的，90 分鐘的最後通牒。他們說：「我們需要找出如何修復這個已曝光的『越獄』漏洞。」Anthropic 在第一次通話後的 15 分鐘內就與 Trump administration 通話，並要求更多細節。他們問：「好的，我們來談談這個。

您說的是我們已經知道的研究嗎？還是不同的東西？您說的『越獄』是什麼？」他們試圖獲取更多細節並與政府溝通。我認為政府也對 Anthropic 執行長 Dario Amodei 在第一次通話後一小時十五分鐘才回電感到不滿。Anthropic 在 15 分鐘內回電，但 Dario 花了一小時十五分鐘才回電。

所以，當時情況非常混亂。但在他們通話時，90 分鐘的期限已過，Trump administration 說：「好的，就這樣了。沒錯。我們要對你們實施出口管制。」

就在那時，他們告知 Anthropic，任何外國公民都不能使用這兩個模型，而 Anthropic 必須確保這一點。無論他們是否在 Anthropic 工作，任何外國公民都不能使用。舉例來說，如果您是 Bank of America 的員工，有權存取 Mythos 5 並用它來修補系統漏洞，但您不是美國公民，那麼您就不能使用。

對於使用 Fable 5 的普通個人也是如此。對於不是美國公民的 Anthropic 研究人員也是如此。

因此，Anthropic 在這種情況下只能採取唯一的行動，他們說：「好的，我們必須讓這兩個模型都暫停服務。我們不可能在一分鐘內想出辦法確保沒有非美國公民正在使用這些模型。」所以，這就是發生的事情。

總之，那是瘋狂的幾個小時。Anthropic 當晚稍後發表聲明，表示他們正努力與 Trump administration 合作解決此事。他們整個週末都在與政府官員進行線上會議，然後派出了三名員工——我在我們剛發表的文章中詳細介紹了他們——飛往 D.C. 進行面對面會談。

值得注意的是，Dario 並未親自到場。他以線上方式參與所有這些會議。我可以證實他沒有在養生中心，儘管有些報導這麼說，但他們不願透露他在哪裡。不過，他確實不在養生中心。這就是我所知道的一切。

Anthropic 的立場是「絕對不在養生中心」。好的。

[笑] 是的，所以情況很複雜，充滿戲劇性。過去幾天我採訪的所有消息來源都說，整個科技產業，尤其是網路安全社群，都在議論紛紛。一位消息人士告訴我：「北京現在正在嘲笑我們。」

這很有趣，因為一些網路安全領域的領導者齊聚一堂，寫了一封公開信，他們說：「聽著，我們並非所有人都相信監管，但如果你要監管，這絕不是正確的方式。」我認為這正好說明了整個情況。

也許你相信積極的政府監管，也許你不相信。但監管工作應該以嚴謹、周到、謹慎且可預測的方式進行。這次事件的任何環節似乎都稱不上嚴謹、周到或可預測。

我其實想從頭開始。Andy Jassy 和 Scott Bessent 可能都是聰明人。他們顯然在我們的社會中擔任非常重要的職位。但他們並不是 AI 專家。我們是如何走到這一步的：Amazon 執行長 Andy Jassy 將對 AI 安全研究的擔憂轉達給 Scott Bessent（他實際上並沒有以任何有意義的方式監督 AI 政策），結果導致一家執行長缺席的公司收到 90 分鐘的最後通牒？

我認為政治立場不應該影響判斷。這要嘛是史上最嚴重的安全漏洞，嚴重到 Amazon 執行長必須致電財政部長；要嘛就是一群人想刷存在感。我實在搞不清楚是哪一種情況。

這是多種因素的結合。其中之一是，就像你提到的，這些人很多都不是 AI 專家。