Anthropic 首次公開內部數據,揭示 Claude 如何顯著加速其自身的 AI 開發。同時,該公司也正積極推動建立一個可驗證的全球 AI 開發暫停機制。
Anthropic 透過其內部機構 Anthropic Institute 發布了一份詳盡報告,其中包含此前未公開的內部數據,展示了 AI 系統在協助自身開發方面已取得的進展。
報告的核心訊息是,遞迴式自我改進(即 AI 系統能完全自主設計其繼任者)尚未實現,但它「可能比大多數機構預期的更快到來」。
程式碼產出激增,但實際生產力提升幅度不明
根據 Anthropic 的說法,2026 年第二季度,工程師每天交付的程式碼量平均是 2024 年的八倍。進入生產程式碼庫的程式碼中,超過 80% 來自 Claude。在 Claude Code 於 2025 年 2 月推出之前,這個比例仍處於個位數。
管理層估計,包括腳本和實驗性程式碼在內的總比例已超過 90%。一位員工表示:「我上次自己寫程式碼已經是約五個月前的事了。」
內部數據顯示程式碼量急劇上升:在 Claude 的協助下,Anthropic 的開發人員在 2026 年第二季度產出的程式碼量,平均是引入程式碼代理前八倍。| 圖片:Anthropic
Anthropic 承認,程式碼行數並非完美的衡量標準。八倍的增長「幾乎肯定誇大了實際的生產力提升」。在 2026 年 3 月對 130 名員工進行的內部調查中,中位數估計 Mythos Preview 帶來的產出提升為四倍。Anthropic 本身認為實際數字會略低,並指出近期 METR 的研究顯示,開發人員傾向於高估 AI 的生產力提升。
關於程式碼品質,報告指出:「Claude 撰寫的程式碼在 2025 年底時略遜於 Anthropic 人類撰寫的程式碼,目前大致持平,我們預計在一年內將會明顯超越。」
根據回溯分析,自動化的 Claude 審閱器本可以在過去 claude.ai 發生事件的錯誤進入生產環境前,捕獲約三分之一的錯誤。在另一個案例中,Claude 在 2026 年 4 月提供了 800 多個修復,將一類 API 錯誤減少了 1,000 倍。據負責的工程師表示,人類完成這項工作需要四年時間。
複雜任務的成功率不斷提高:Anthropic 的內部數據顯示 Claude 的程式碼編寫能力如何隨著時間進步。自 2026 年初以來,該模型在開放式問題的解決率上出現了顯著躍升。| 圖片:Anthropic
根據 Anthropic 的說法,AI 系統能可靠地獨立處理任務的持續時間,現在大約每四個月翻倍,此前為七個月。2024 年 3 月,Claude Opus 3 可以處理約四分鐘的任務。一年後,Claude Sonnet 3.7 能處理一個半小時的任務。現在,Claude Opus 4.6 則能處理長達 12 小時的任務。
METR 發現 Claude Mythos Preview 可以工作「至少」16 小時,並且「已達到 [METR] 在沒有新任務的情況下所能測量的上限」。Anthropic 表示,如果這個趨勢持續下去,今年內有望實現全天候任務,而為期一週的任務則可能在 2027 年實現。
Claude 在研究中的判斷力正逼近人類水平
除了原始程式碼產出,Anthropic 也展示了 AI 輔助研究的進展。在一項內部優化測試中,Claude 必須盡可能地加速訓練程式碼,Claude Opus 4 在 2025 年 5 月達到了約三倍的平均加速。一年後,Mythos Preview 達到了約 52 倍。一位經驗豐富的人類研究員需要四到八小時才能達到四倍的加速。
在對 Anthropic 實際研究會議的分析中,該公司審查了 129 個開發人員採取次優路徑的時刻。Claude Mythos Preview 在其中 64% 的情況下提出了更好的下一步建議,高於六個月前 Claude Opus 4.5 的 51%。Anthropic 稱這是一個「早期訊號,表明 AI 系統在做出 AI 研究所需的判斷方面正變得越來越好。」
研究中更好的決策:分析顯示像 Claude Mythos Preview 這樣的模型在人類犯錯時能多常糾正方向。這有潛力進一步加速 AI 開發。| 圖片:Anthropic
最後的差距:「研究品味」與架構問題
根據 Anthropic 的說法,關鍵瓶頸是該公司所稱的「研究品味」:即選擇正確問題並及早發現死胡同的能力。一位員工表示:「目前人類的比較優勢仍在於看到大局,並超越眼前任務的限制進行思考。」
報告指出,目前尚不清楚當前的訓練方法和架構是否能實現這種飛躍,這仍然是一個懸而未決的問題。
然而,該公司也對此進行了權衡:像 Transformer 架構這樣的典範轉移每隔數年才會出現。其間的大部分進展都是漸進式的工作,而這正是 Claude 目前擅長處理的流程。Anthropic 借用愛迪生關於天才是一分靈感、九十九分汗水的名言寫道:「我們看到汗水正變得越來越自動化。」
即使 Claude 永遠無法發展出良好的研究品味,對數據的保守解讀也意味著複合式的加速:每位工程師貢獻的工作量遠超以往,因為人類只需處理個位數百分比的方向性決策。
三種情境,其中兩種讓 Anthropic 擔憂
Anthropic 描繪了三種未來情境。第一種是趨勢停滯。指數曲線可能最終變成 S 形曲線,或者能源和晶片瓶頸會減緩進度。Anthropic 認為這種情況不太可能,因為目前尚未看到任何趨緩跡象。
第二種情境是效率持續提升,但人類仍保有方向性控制。一百人的公司可以完成一萬或十萬人的工作。Anthropic 認為自己正處於這條道路上,但也警告了專制監控和客製化操縱活動等風險。阿姆達爾定律(Amdahl's Law)也開始發揮作用:在 Anthropic,人類程式碼審查已成為新的瓶頸。
Anthropic 描繪自主 AI 開發之路:圖表顯示了從純粹的人類程式設計,透過簡單的聊天機器人,過渡到最終能完全自我訓練的系統。| 圖片:Anthropic
第三種情境描述了完全的遞迴式自我改進,其中進展速度僅受算力限制。在這種情況下,對齊問題(alignment problem)是否能解決是「我們最不確定的事情」。罕見的未對齊情況可能會加劇,「變得更頻繁但更難以理解,直到我們失去對它們的控制。」
Anthropic 呼籲實施可驗證的開發暫停
報告中最引人注目的段落涉及 Anthropic 對減緩 AI 開發的立場。報告指出:「我們相信,世界應有能力選擇減緩或暫時暫停前沿 AI 的開發,以使社會結構和對齊研究能夠跟上技術的進步。」
Anthropic 表示,如果其他前沿開發者以可驗證的方式採取同樣行動,他們也會減緩或暫停自身開發。Anthropic Institute 計劃研究並建立能實現可信暫停的系統——即讓前沿開發者能夠驗證其他人是否確實停止或減緩開發的機制。
然而,障礙是巨大的。訓練運行比飛彈發射井更容易隱藏。它們的輸入是通用型的,而且秘密繼續開發的誘因巨大:「誰在其他人暫停時繼續,誰就可能繼承領先地位。」與核武器《中程飛彈條約》(INF Treaty)的比較顯而易見,但那些驗證制度花了數十年才建立起來。「我們沒有那麼多時間,」Anthropic 寫道。
單一實驗室的單方面暫停很容易立即實施,但效果會大打折扣。它只會改變領先者的位置,而無法建立目前所缺乏的更廣泛的審議過程。在未來幾個月,Anthropic 計劃組織涉及政策制定者、研究人員、公民社會和其他 AI 公司的會談。
關於 AI 暫停的辯論早在幾年前就已出現,但當時這些呼籲並未獲得關注。事後看來,考慮到當時這些系統的實際能力,這種推動似乎為時過早。這是否是基於恐懼的行銷手法(批評者曾就 Mythos 指責 Anthropic),可能只有事後才能清楚。
