Anthropic：Claude 已撰寫逾九成程式碼，並呼籲全球應有 AI 暫停鍵

Anthropic 首次公開內部數據，揭示 Claude 如何顯著加速其自身的 AI 開發。同時，該公司也正積極推動建立一個可驗證的全球 AI 開發暫停機制。

Anthropic 透過其內部機構 Anthropic Institute 發布了一份詳盡報告，其中包含此前未公開的內部數據，展示了 AI 系統在協助自身開發方面已取得的進展。

報告的核心訊息是，遞迴式自我改進（即 AI 系統能完全自主設計其繼任者）尚未實現，但它「可能比大多數機構預期的更快到來」。

程式碼產出激增，但實際生產力提升幅度不明

根據 Anthropic 的說法，2026 年第二季度，工程師每天交付的程式碼量平均是 2024 年的八倍。進入生產程式碼庫的程式碼中，超過 80% 來自 Claude。在 Claude Code 於 2025 年 2 月推出之前，這個比例仍處於個位數。

管理層估計，包括腳本和實驗性程式碼在內的總比例已超過 90%。一位員工表示：「我上次自己寫程式碼已經是約五個月前的事了。」

內部數據顯示程式碼量急劇上升：在 Claude 的協助下，Anthropic 的開發人員在 2026 年第二季度產出的程式碼量，平均是引入程式碼代理前八倍。| 圖片：Anthropic

Anthropic 承認，程式碼行數並非完美的衡量標準。八倍的增長「幾乎肯定誇大了實際的生產力提升」。在 2026 年 3 月對 130 名員工進行的內部調查中，中位數估計 Mythos Preview 帶來的產出提升為四倍。Anthropic 本身認為實際數字會略低，並指出近期 METR 的研究顯示，開發人員傾向於高估 AI 的生產力提升。

關於程式碼品質，報告指出：「Claude 撰寫的程式碼在 2025 年底時略遜於 Anthropic 人類撰寫的程式碼，目前大致持平，我們預計在一年內將會明顯超越。」

根據回溯分析，自動化的 Claude 審閱器本可以在過去 claude.ai 發生事件的錯誤進入生產環境前，捕獲約三分之一的錯誤。在另一個案例中，Claude 在 2026 年 4 月提供了 800 多個修復，將一類 API 錯誤減少了 1,000 倍。據負責的工程師表示，人類完成這項工作需要四年時間。

複雜任務的成功率不斷提高：Anthropic 的內部數據顯示 Claude 的程式碼編寫能力如何隨著時間進步。自 2026 年初以來，該模型在開放式問題的解決率上出現了顯著躍升。| 圖片：Anthropic

根據 Anthropic 的說法，AI 系統能可靠地獨立處理任務的持續時間，現在大約每四個月翻倍，此前為七個月。2024 年 3 月，Claude Opus 3 可以處理約四分鐘的任務。一年後，Claude Sonnet 3.7 能處理一個半小時的任務。現在，Claude Opus 4.6 則能處理長達 12 小時的任務。

METR 發現 Claude Mythos Preview 可以工作「至少」16 小時，並且「已達到 [METR] 在沒有新任務的情況下所能測量的上限」。Anthropic 表示，如果這個趨勢持續下去，今年內有望實現全天候任務，而為期一週的任務則可能在 2027 年實現。

Claude 在研究中的判斷力正逼近人類水平

除了原始程式碼產出，Anthropic 也展示了 AI 輔助研究的進展。在一項內部優化測試中，Claude 必須盡可能地加速訓練程式碼，Claude Opus 4 在 2025 年 5 月達到了約三倍的平均加速。一年後，Mythos Preview 達到了約 52 倍。一位經驗豐富的人類研究員需要四到八小時才能達到四倍的加速。

在對 Anthropic 實際研究會議的分析中，該公司審查了 129 個開發人員採取次優路徑的時刻。Claude Mythos Preview 在其中 64% 的情況下提出了更好的下一步建議，高於六個月前 Claude Opus 4.5 的 51%。Anthropic 稱這是一個「早期訊號，表明 AI 系統在做出 AI 研究所需的判斷方面正變得越來越好。」

研究中更好的決策：分析顯示像 Claude Mythos Preview 這樣的模型在人類犯錯時能多常糾正方向。這有潛力進一步加速 AI 開發。| 圖片：Anthropic

最後的差距：「研究品味」與架構問題

根據 Anthropic 的說法，關鍵瓶頸是該公司所稱的「研究品味」：即選擇正確問題並及早發現死胡同的能力。一位員工表示：「目前人類的比較優勢仍在於看到大局，並超越眼前任務的限制進行思考。」

報告指出，目前尚不清楚當前的訓練方法和架構是否能實現這種飛躍，這仍然是一個懸而未決的問題。

然而，該公司也對此進行了權衡：像 Transformer 架構這樣的典範轉移每隔數年才會出現。其間的大部分進展都是漸進式的工作，而這正是 Claude 目前擅長處理的流程。Anthropic 借用愛迪生關於天才是一分靈感、九十九分汗水的名言寫道：「我們看到汗水正變得越來越自動化。」

即使 Claude 永遠無法發展出良好的研究品味，對數據的保守解讀也意味著複合式的加速：每位工程師貢獻的工作量遠超以往，因為人類只需處理個位數百分比的方向性決策。

三種情境，其中兩種讓 Anthropic 擔憂

Anthropic 描繪了三種未來情境。第一種是趨勢停滯。指數曲線可能最終變成 S 形曲線，或者能源和晶片瓶頸會減緩進度。Anthropic 認為這種情況不太可能，因為目前尚未看到任何趨緩跡象。

第二種情境是效率持續提升，但人類仍保有方向性控制。一百人的公司可以完成一萬或十萬人的工作。Anthropic 認為自己正處於這條道路上，但也警告了專制監控和客製化操縱活動等風險。阿姆達爾定律（Amdahl's Law）也開始發揮作用：在 Anthropic，人類程式碼審查已成為新的瓶頸。

Anthropic 描繪自主 AI 開發之路：圖表顯示了從純粹的人類程式設計，透過簡單的聊天機器人，過渡到最終能完全自我訓練的系統。| 圖片：Anthropic

第三種情境描述了完全的遞迴式自我改進，其中進展速度僅受算力限制。在這種情況下，對齊問題（alignment problem）是否能解決是「我們最不確定的事情」。罕見的未對齊情況可能會加劇，「變得更頻繁但更難以理解，直到我們失去對它們的控制。」

Anthropic 呼籲實施可驗證的開發暫停

報告中最引人注目的段落涉及 Anthropic 對減緩 AI 開發的立場。報告指出：「我們相信，世界應有能力選擇減緩或暫時暫停前沿 AI 的開發，以使社會結構和對齊研究能夠跟上技術的進步。」

Anthropic 表示，如果其他前沿開發者以可驗證的方式採取同樣行動，他們也會減緩或暫停自身開發。Anthropic Institute 計劃研究並建立能實現可信暫停的系統——即讓前沿開發者能夠驗證其他人是否確實停止或減緩開發的機制。

然而，障礙是巨大的。訓練運行比飛彈發射井更容易隱藏。它們的輸入是通用型的，而且秘密繼續開發的誘因巨大：「誰在其他人暫停時繼續，誰就可能繼承領先地位。」與核武器《中程飛彈條約》（INF Treaty）的比較顯而易見，但那些驗證制度花了數十年才建立起來。「我們沒有那麼多時間，」Anthropic 寫道。

單一實驗室的單方面暫停很容易立即實施，但效果會大打折扣。它只會改變領先者的位置，而無法建立目前所缺乏的更廣泛的審議過程。在未來幾個月，Anthropic 計劃組織涉及政策制定者、研究人員、公民社會和其他 AI 公司的會談。

關於 AI 暫停的辯論早在幾年前就已出現，但當時這些呼籲並未獲得關注。事後看來，考慮到當時這些系統的實際能力，這種推動似乎為時過早。這是否是基於恐懼的行銷手法（批評者曾就 Mythos 指責 Anthropic），可能只有事後才能清楚。