AI 邁向自我提升：智慧系統的進化之路

人工智慧領域的建立，是基於機器有朝一日能夠自我改進的設想。1966 年，英國數學家 I. J. Good 曾寫道：「一個超智慧機器可以設計出更優異的機器；屆時無疑將會發生『智慧爆炸』，人類的智慧將會遠遠落後。」長期以來，AI 研究人員對遞迴式自我改進（recursive self-improvement, RSI）抱持著既渴望又恐懼的態度。

如今，AI 的進步正引發一個問題：這個過程的某些部分是否已經開始發生了？遞迴式自我改進對不同的人有不同的意義。有些人將這個概念視為嚇唬人以推動監管的藉口，而另一些人則在行銷中大肆宣揚。對某些人來說，它意味著一個完全自主的循環，而對另一些人來說，它幾乎是指任何利用科技來打造科技的行為。

最保險的說法是，它是一個光譜。從最嚴格的定義來看，研究人員用這個詞來描述那些不僅能改進其輸出，還能改進其改進過程的系統——即在沒有任何人類指導的情況下，產生想法、評估結果並修改自身方法。按照這個標準，現今許多系統都未能達到。它們可以幫助建立更好的 AI，但仍然依賴人類來設定目標、定義成功並決定保留哪些改變。

問題不在於自我改進是否以某種形式存在於今日，而在於這個循環實際上已經封閉了多少。研究人員數十年來一直在為遞迴式自我改進奠定基礎。機器學習（ML）演算法能自動調整可玩遊戲甚至創建新程式的參數。稱為演化演算法的機器學習方法，則能使設計解決方案（包括其他演算法）多樣化並迭代。

在過去十年中，「自動機器學習」（AutoML）已自動化了機器學習模型（例如神經網路）的建構、訓練和評估流程中的某些環節。如今，大型語言模型（LLMs），例如 GPT、Gemini、Claude 和 Grok，延續了這一趨勢。它們最大的應用案例之一是編寫程式碼，包括用於生成未來版本自身的程式碼。

今年二月，OpenAI 報告指出 GPT-5.3-Codex 在創建自身方面發揮了關鍵作用，協助訓練除錯、管理部署並分析評估結果。Anthropic 聲稱其大部分程式碼現在都是由 Claude Code 編寫的。這些系統仍然依賴人類來指導和驗證工作。

去年，Google DeepMind 公布了一套名為 AlphaEvolve 的系統，稱其為「用於科學和演算法發現的程式碼代理人」。它利用大型語言模型來引導解決方案的演化，例如最佳化神經網路架構、資料中心排程和晶片設計。這並非一個完全遞迴的循環，因為人們仍然需要決定 AlphaEvolve 應該解決哪些問題以及如何評估其性能。

但每一次突破都增強了科學家們在 AI 領域取得進一步突破的能力。Google DeepMind 的電腦科學家 Matej Balog 曾參與 AlphaEvolve 的開發，他表示：「這也是人類與機器之間一個非常協作的過程。」「通常你會觀察系統發現了什麼，然後你實際上會從中學習。」

該系統已經讓團隊感到驚訝。Balog 說：「我們的使命是利用 AI 來發現人類直覺所未能察覺的新演算法。」「我認為我們已經首次證明這並非遙不可及的夢想。」同時，Google DeepMind 早期晶片設計系統 AlphaChip 的共同負責人，已創立了一家名為 Ricursive Intelligence 的新創公司，旨在利用 AI 設計 AI 晶片。

共同創辦人 Azalia Mirhoseini 表示：「我們預計可以將設計週期從一到兩年大幅縮短至數天。」第一階段是協助人類設計師。第二階段是為沒有內部設計師的公司自動化該流程。共同創辦人 Anna Goldie 表示，在第三階段，該公司將遞迴地利用 AI 設計更好的晶片來訓練更好的 AI——儘管仍需人類監督。

其他專案則專注於 AI 代理人修改自身行為。去年，不列顛哥倫比亞大學和 Sakana AI 的科學家們公布了達爾文哥德爾機器（Darwin Gödel Machines, DGMs），該機器利用演化演算法來改進基於大型語言模型的程式碼代理人。

關鍵在於，這些代理人可以修改自己的程式碼（儘管不能修改底層的大型語言模型），並在這樣做的過程中變得更擅長。一個更新的版本甚至可以修改其自我改進的元機制。該團隊成員還開發了「AI 科學家」（AI Scientist），並於三月在《自然》雜誌上發表，旨在自動化更廣泛的研究循環。

它能夠產生研究想法、在軟體中執行實驗、將結果撰寫成論文，然後審查這些論文。這個專案暗示了 AI 開發過程中更多環節——不僅是程式碼編寫，還包括實驗和評估——如何能被整合到自動化循環中。不列顛哥倫比亞大學的電腦科學家 Jeff Clune 曾參與 DGMs 和 AI 科學家的研究，他表示，利用 AI 來改進 AI 是「矽谷最熱門的話題之一」。

他相信「我們距離遞迴式自我改進系統的出現已近在咫尺」，並認為遞迴式自我改進將迅速「改變科學技術以及社會和文化的各個層面」。然而，許多障礙依然存在。Clune 表示，AI 在產生、實施和判斷想法方面僅僅是「還不錯」。他說：「所有關鍵環節都運作良好，但稱不上卓越。」

美國創新基金會的高級研究員 Dean Ball 則表示，AI 科學家目前仍無法與最頂尖的人類科學家匹敵。他說：「或許最終他們會自動化天才的工作，但不是明年。明年他們會自動化那些在演算法效率遊戲中苦幹的基層工作。」即使這些能力有所提升，這個過程也可能不會順利地複合增長。

艾倫人工智慧研究所的電腦科學家 Nathan Lambert 最近撰文指出，我們不應期待遞迴式自我改進，而應預期「有損自我改進」（lossy self-improvement, LSI），其中不斷增加的摩擦會減緩進程。這部分是因為大型 AI 系統正變得越來越複雜，AI 研究人員的工作將是管理這種複雜性，而不是精煉系統的各個部分。

此外，頂級系統的開發成本高達數十億美元，沒有人願意讓 AI 在擁有如此龐大資金的情況下失控。還有更廣泛的限制。Ball 曾撰寫關於遞迴式自我改進的文章，並解釋了他為何不是一個「末日論者」——即相信這種現象會失控並摧毀文明的人。他認為，接管世界需要許多實際步驟，從進行實驗室實驗到應對政治。

此外，知識是分散的且通常是隱性的，因此無法輕易地整合到一個 AI 大腦中。例如，晶片製造商台積電（TSMC）的能力源於其 90,000 名相互協作的員工的集體智慧。全面的遞迴式自我改進可能不僅需要設計軟體和晶片，還需要建造資料中心、營運發電廠和開採金屬，所有這些都需透過自我複製的機器人來完成。

基於這些及其他原因，一些研究人員認為人類將在整個過程中保持核心地位。Meta 的研究人員 Jason Weston 和 Jakob Foerster 最近撰文指出，與其追求自我改進，「對人類而言，一個更可行且更好的目標是最大化協同改進」。他們寫道，讓人類參與其中將帶來更快、更安全的進展，因為人類會提供見解，並引導 AI 走向造福人類的解決方案。

儘管如此，許多科學家仍未排除失控的遞迴式自我改進，有時稱之為「奇點」。去年，研究人員採訪了 25 位 AI 專家關於自動化 AI 研發的議題。除了兩人之外，所有人都認同這可能導致智慧爆炸。受訪者也更傾向於認為 AI 公司會將其自我改進模型保留在內部，而非公開部署。

蒙特婁大學的電腦科學家 David Scott Krueger 是該論文的共同作者，他說：「這是一個相當令人擔憂的組合，對吧？」他擔心如此高風險的研究發生在「公眾視線之外」。Krueger 創立了一個名為 Evitable 的 AI 安全非營利組織，他主張全球暫停 AI 開發。

他說：「這是在拿所有人的生命賭博。」他建議觸發暫停的一條紅線是當 99% 的程式碼由 AI 編寫時。「我認為我們現在可能正要跨越這條線。」儘管 Ball 稱奇點為「完全幼稚的科幻胡扯」，但他認為從事遞迴式自我改進研究的前沿 AI 實驗室應受到嚴密監控，以防止其模型落入不法分子手中，例如可能利用它們加速網路攻擊或生物武器開發的惡意行為者。

他說，遞迴式自我改進存在風險，但這些風險是可以管理的。當人們想像遞迴式自我改進時，他們可能會設想一個擁有巨大腦袋的 AI 變得越來越聰明。但它可能更像演化，許多多樣化的代理人共同出現並協同運作。Krueger 表示，可能會出現「類似人工生命形式的寒武紀大爆發」。

它們將擁有生態系統、文化和經濟。Clune 認為，演化演算法和開放式流程（即在沒有強烈目標的情況下進行探索）將是遞迴式自我改進的關鍵。代理人之間的協作也將有所幫助。像「AI 科學家」這樣將研究成果打包成正式論文的系統，為代理人分享結果並在彼此工作基礎上發展提供了一種方式。

Clune 說：「這是系統與其他代理人溝通的一個很好的方式。」人類科學家可能會慢慢地被擠出 AI 研究領域。Clune 說，首先，他們將花更少時間在低階任務上，變得更像教授或團隊領導，負責選擇研究方向。然後，人們將更像專案主管或執行長，設定更廣泛的研究議程。

最後，他們將進行監督，他希望人類永遠不要放棄這個角色。Clune 說，如果機器取代他成為 AI 科學家，他可能會感到難過，因為他覺得這個角色「令人振奮」。但其回報可能值得。「我會放棄我的愛好來治癒癌症。」