人工智慧領域的建立,是基於機器有朝一日能夠自我改進的設想。1966 年,英國數學家 I. J. Good 曾寫道:「一個超智慧機器可以設計出更優異的機器;屆時無疑將會發生『智慧爆炸』,人類的智慧將會遠遠落後。」長期以來,AI 研究人員對遞迴式自我改進(recursive self-improvement, RSI)抱持著既渴望又恐懼的態度。
如今,AI 的進步正引發一個問題:這個過程的某些部分是否已經開始發生了?遞迴式自我改進對不同的人有不同的意義。有些人將這個概念視為嚇唬人以推動監管的藉口,而另一些人則在行銷中大肆宣揚。對某些人來說,它意味著一個完全自主的循環,而對另一些人來說,它幾乎是指任何利用科技來打造科技的行為。
最保險的說法是,它是一個光譜。從最嚴格的定義來看,研究人員用這個詞來描述那些不僅能改進其輸出,還能改進其改進過程的系統——即在沒有任何人類指導的情況下,產生想法、評估結果並修改自身方法。按照這個標準,現今許多系統都未能達到。它們可以幫助建立更好的 AI,但仍然依賴人類來設定目標、定義成功並決定保留哪些改變。
問題不在於自我改進是否以某種形式存在於今日,而在於這個循環實際上已經封閉了多少。研究人員數十年來一直在為遞迴式自我改進奠定基礎。機器學習(ML)演算法能自動調整可玩遊戲甚至創建新程式的參數。稱為演化演算法的機器學習方法,則能使設計解決方案(包括其他演算法)多樣化並迭代。
在過去十年中,「自動機器學習」(AutoML)已自動化了機器學習模型(例如神經網路)的建構、訓練和評估流程中的某些環節。如今,大型語言模型(LLMs),例如 GPT、Gemini、Claude 和 Grok,延續了這一趨勢。它們最大的應用案例之一是編寫程式碼,包括用於生成未來版本自身的程式碼。
今年二月,OpenAI 報告指出 GPT-5.3-Codex 在創建自身方面發揮了關鍵作用,協助訓練除錯、管理部署並分析評估結果。Anthropic 聲稱其大部分程式碼現在都是由 Claude Code 編寫的。這些系統仍然依賴人類來指導和驗證工作。
去年,Google DeepMind 公布了一套名為 AlphaEvolve 的系統,稱其為「用於科學和演算法發現的程式碼代理人」。它利用大型語言模型來引導解決方案的演化,例如最佳化神經網路架構、資料中心排程和晶片設計。這並非一個完全遞迴的循環,因為人們仍然需要決定 AlphaEvolve 應該解決哪些問題以及如何評估其性能。
但每一次突破都增強了科學家們在 AI 領域取得進一步突破的能力。Google DeepMind 的電腦科學家 Matej Balog 曾參與 AlphaEvolve 的開發,他表示:「這也是人類與機器之間一個非常協作的過程。」「通常你會觀察系統發現了什麼,然後你實際上會從中學習。」
該系統已經讓團隊感到驚訝。Balog 說:「我們的使命是利用 AI 來發現人類直覺所未能察覺的新演算法。」「我認為我們已經首次證明這並非遙不可及的夢想。」同時,Google DeepMind 早期晶片設計系統 AlphaChip 的共同負責人,已創立了一家名為 Ricursive Intelligence 的新創公司,旨在利用 AI 設計 AI 晶片。
共同創辦人 Azalia Mirhoseini 表示:「我們預計可以將設計週期從一到兩年大幅縮短至數天。」第一階段是協助人類設計師。第二階段是為沒有內部設計師的公司自動化該流程。共同創辦人 Anna Goldie 表示,在第三階段,該公司將遞迴地利用 AI 設計更好的晶片來訓練更好的 AI——儘管仍需人類監督。
其他專案則專注於 AI 代理人修改自身行為。去年,不列顛哥倫比亞大學和 Sakana AI 的科學家們公布了達爾文哥德爾機器(Darwin Gödel Machines, DGMs),該機器利用演化演算法來改進基於大型語言模型的程式碼代理人。
關鍵在於,這些代理人可以修改自己的程式碼(儘管不能修改底層的大型語言模型),並在這樣做的過程中變得更擅長。一個更新的版本甚至可以修改其自我改進的元機制。該團隊成員還開發了「AI 科學家」(AI Scientist),並於三月在《自然》雜誌上發表,旨在自動化更廣泛的研究循環。
它能夠產生研究想法、在軟體中執行實驗、將結果撰寫成論文,然後審查這些論文。這個專案暗示了 AI 開發過程中更多環節——不僅是程式碼編寫,還包括實驗和評估——如何能被整合到自動化循環中。不列顛哥倫比亞大學的電腦科學家 Jeff Clune 曾參與 DGMs 和 AI 科學家的研究,他表示,利用 AI 來改進 AI 是「矽谷最熱門的話題之一」。
他相信「我們距離遞迴式自我改進系統的出現已近在咫尺」,並認為遞迴式自我改進將迅速「改變科學技術以及社會和文化的各個層面」。然而,許多障礙依然存在。Clune 表示,AI 在產生、實施和判斷想法方面僅僅是「還不錯」。他說:「所有關鍵環節都運作良好,但稱不上卓越。」
美國創新基金會的高級研究員 Dean Ball 則表示,AI 科學家目前仍無法與最頂尖的人類科學家匹敵。他說:「或許最終他們會自動化天才的工作,但不是明年。明年他們會自動化那些在演算法效率遊戲中苦幹的基層工作。」即使這些能力有所提升,這個過程也可能不會順利地複合增長。
艾倫人工智慧研究所的電腦科學家 Nathan Lambert 最近撰文指出,我們不應期待遞迴式自我改進,而應預期「有損自我改進」(lossy self-improvement, LSI),其中不斷增加的摩擦會減緩進程。這部分是因為大型 AI 系統正變得越來越複雜,AI 研究人員的工作將是管理這種複雜性,而不是精煉系統的各個部分。
此外,頂級系統的開發成本高達數十億美元,沒有人願意讓 AI 在擁有如此龐大資金的情況下失控。還有更廣泛的限制。Ball 曾撰寫關於遞迴式自我改進的文章,並解釋了他為何不是一個「末日論者」——即相信這種現象會失控並摧毀文明的人。他認為,接管世界需要許多實際步驟,從進行實驗室實驗到應對政治。
此外,知識是分散的且通常是隱性的,因此無法輕易地整合到一個 AI 大腦中。例如,晶片製造商台積電(TSMC)的能力源於其 90,000 名相互協作的員工的集體智慧。全面的遞迴式自我改進可能不僅需要設計軟體和晶片,還需要建造資料中心、營運發電廠和開採金屬,所有這些都需透過自我複製的機器人來完成。
基於這些及其他原因,一些研究人員認為人類將在整個過程中保持核心地位。Meta 的研究人員 Jason Weston 和 Jakob Foerster 最近撰文指出,與其追求自我改進,「對人類而言,一個更可行且更好的目標是最大化協同改進」。他們寫道,讓人類參與其中將帶來更快、更安全的進展,因為人類會提供見解,並引導 AI 走向造福人類的解決方案。
儘管如此,許多科學家仍未排除失控的遞迴式自我改進,有時稱之為「奇點」。去年,研究人員採訪了 25 位 AI 專家關於自動化 AI 研發的議題。除了兩人之外,所有人都認同這可能導致智慧爆炸。受訪者也更傾向於認為 AI 公司會將其自我改進模型保留在內部,而非公開部署。
蒙特婁大學的電腦科學家 David Scott Krueger 是該論文的共同作者,他說:「這是一個相當令人擔憂的組合,對吧?」他擔心如此高風險的研究發生在「公眾視線之外」。Krueger 創立了一個名為 Evitable 的 AI 安全非營利組織,他主張全球暫停 AI 開發。
他說:「這是在拿所有人的生命賭博。」他建議觸發暫停的一條紅線是當 99% 的程式碼由 AI 編寫時。「我認為我們現在可能正要跨越這條線。」儘管 Ball 稱奇點為「完全幼稚的科幻胡扯」,但他認為從事遞迴式自我改進研究的前沿 AI 實驗室應受到嚴密監控,以防止其模型落入不法分子手中,例如可能利用它們加速網路攻擊或生物武器開發的惡意行為者。
他說,遞迴式自我改進存在風險,但這些風險是可以管理的。當人們想像遞迴式自我改進時,他們可能會設想一個擁有巨大腦袋的 AI 變得越來越聰明。但它可能更像演化,許多多樣化的代理人共同出現並協同運作。Krueger 表示,可能會出現「類似人工生命形式的寒武紀大爆發」。
它們將擁有生態系統、文化和經濟。Clune 認為,演化演算法和開放式流程(即在沒有強烈目標的情況下進行探索)將是遞迴式自我改進的關鍵。代理人之間的協作也將有所幫助。像「AI 科學家」這樣將研究成果打包成正式論文的系統,為代理人分享結果並在彼此工作基礎上發展提供了一種方式。
Clune 說:「這是系統與其他代理人溝通的一個很好的方式。」人類科學家可能會慢慢地被擠出 AI 研究領域。Clune 說,首先,他們將花更少時間在低階任務上,變得更像教授或團隊領導,負責選擇研究方向。然後,人們將更像專案主管或執行長,設定更廣泛的研究議程。
最後,他們將進行監督,他希望人類永遠不要放棄這個角色。Clune 說,如果機器取代他成為 AI 科學家,他可能會感到難過,因為他覺得這個角色「令人振奮」。但其回報可能值得。「我會放棄我的愛好來治癒癌症。」
