要理解我為何如此頻繁思考成功,讓我們看看一張試圖呈現所有AI進展的圖表:Epoch 能力指數(ECI)。ECI顯示了不同模型在超過40個獨立基準測試中隨時間變化的分數。當你查看這張圖表時,會看到許多線條持續上升。而當我看到這張圖表時,我感到一陣暈眩,因為我對這張圖表背後的意義略知一二。
所以,讓我們換個方式來看這張圖表:透過觀察各種AI系統隨時間推移所達成的成就。接著,我概述了過去幾年AI進展的一些亮點,從2023年3月AI通過律師資格考試開始,到基於大型語言模型(LLM)的系統在國際數學奧林匹亞競賽中先後獲得銀牌(2024年7月)和金牌(2025年7月),再到AI共同撰寫新的數學證明(2025年),以及像Claude Mythos這樣的系統問世並發現軟體中的新穎缺陷。
這讓你能感受到AI進展的速度,但我更希望你感受它所預示的未來。這些成就本身都意義非凡,但它們都源於一種共同的底層技術,而這種共同的底層技術正不斷被推向前進。我們剛才談論的是AI成功的個別「樹木」,但這些樹木都是一片森林的一部分,而這片森林正每時每刻都在擴大其規模和廣度:事實上,整片森林的成長速度正隨著時間不斷加快。
成功及其意義這次討論的基礎是,我們剛才看到的這類進展將會持續下去。為什麼不會呢?它基於一種共同的技術,其效能與投入的資源(即運算資源和資料)成正比,並以某種可預測的方式持續增長。我們知道,各公司現在正投入數千億美元於運算設施,以訓練未來的AI系統,因此未來的某些進展已經是板上釘釘的事。
這意味著我們必須對這項技術的持續成功所代表的意義保持高度警覺,所以讓我明確指出:AI是一項極其強大的技術——而且它正不斷變得更強大。它比我們大多數個體都更聰明、更有能力,並且正朝著超越我們所有人總和能力的軌跡發展。這是一項我們尚未完全理解的技術,因為它更多是「生長」而非「製造」出來的,而且人們可以構想出一些看似合理的場景,讓AI可能殺死地球上的每一個人。
認為開發這項技術沒有風險,將是一種傲慢或瘋狂的行為。然而,開發這項技術卻是我們人類物種提升自身、拓展科學與技術疆界最好的方式之一,它為我們提供了一個工具,幫助我們思考人類所面臨的最大挑戰。但這還不是全部。我們努力的持續成功,增加了這個工具本身變得獨立並能做更多事情的可能性。
我們可能很快就能建立一個AI系統,它足夠聰明,能夠開發自己的繼任者,從而啟動一個遞迴式自我改進的過程,這將徹底改變經濟和整個世界。打個比方,就像一家3D列印機公司,製造出一台無需任何外部技術就能列印出更高解析度列印頭的3D列印機。這類技術以前從未存在過,但我相信這可能在未來兩年內發生,甚至更早。
這將產生更多我們剛才討論過的進展,進一步拓寬我們作為個人和社會的能力,並更深入地影響AI在我及他人的生活中呈現的方式。伴隨而來的將是巨大的變革,其規模之大,我相信我們任何人在有生之年都未曾經歷過。這項技術如此強大,我必須明確指出,如果能夠優雅地減緩其發展速度,為我們人類爭取更多時間來應對其巨大影響,那很可能是一件好事。
但在缺乏協調一致的全球減速情況下,我們面臨的現狀是:強大的技術正由各國的各種參與者以驚人的速度開發,彼此陷入競爭,商業和地緣政治的競爭正淹沒了這項技術對物種生存的更大根本影響。這並非理想情況,但卻是我們身處的現實。我現在正在努力思考的問題是:「我該如何調整心態,以面對奇點時代的來臨?」
我認為最好的起點是更詳細地談談AI如何已經改變了我的生活和我的世界,並從中學習。第二部分:與AI一同探索未來AI已經實質性地改變了我的生活,無論是正面還是負面。它也開始在Anthropic這家我共同創辦的AI公司中引起巨大的變化。讓我們回到之前看過的那張圖表,但這次從我個人使用這項技術的角度來探討這些變化。
這張圖表對我的感受看待這張圖表的另一種方式,是它在我個人與這項技術互動的主觀體驗中帶給我的感受。2023年夏天,我使用AI系統檢查我的工作是否有錯字。到了11月,我開始用AI幫我找出該餵寶寶吃什麼食物。2024年1月,我用AI幫助我理解我的婚姻在有了孩子之後的變化。
到了6月,AI幫助我爬取我的電子報內容。8月,AI為我寫了一個導航通用人工智慧(AGI)的文字冒險遊戲。11月,我嘗試用AI重新構想我的工作。2025年1月,我詢問AI如何為超級智慧做準備。2月,我用AI為我小說中的AI專案生成代號。3月,在我向AI傾訴我有些沮喪和反社會後,AI說服我去參加一個藝術展。
5月,我與AI談論我對AI發展利害關係的壓力和不安。8月,AI說服我回去接受心理治療。11月,我用它研究太陽能、半導體和太空的「S曲線」資料集。2026年1月,AI建議我如何鼓勵我的幼兒閱讀。3月,我追蹤AI在數十篇不同論文中用於核心設計的表現。
5月,我讓AI為我小說中的AI角色生成對白。當我思考自己對AI的個人體驗時,我發現隨著AI系統變得越來越聰明,它們也更深入地滲透到我的生活中。如今,AI系統在我的生活中扮演著多重角色:它們是與我共同發想的深度智能夥伴,是我可以傾訴並討論個人生活的系統,也是為我完成我一直想做卻沒時間做的工作的虛擬員工,例如生成各種技術價格隨時間變化的報告。
但最重要的是,我現在可以將AI系統本身當作一種望遠鏡,來完成對我而言最重要的工作——透過觀察AI的整體進展輪廓,試圖理解AI的未來。其中最令人驚訝的部分是,如果硬要比喻,我這裡使用的望遠鏡鏡片來自於我自己——具體來說,來自於我過去十年來的一個嗜好。
透過個人興趣的種子探索AI這個嗜好叫做Import AI。這份電子報現在已經邁入第十年,是我工作之餘的主要嗜好。在這份電子報中,我閱讀關於AI的研究論文,並努力理解它們。一旦我覺得自己理解了,我就會寫一份摘要和一份關於它們重要性的說明。每期都包含許多這樣的內容,再加上一個簡短的虛構故事,我在其中探討我正在學習的技術所帶來的影響。
最近,我經歷了一次啟示性的體驗。我當時正在為我關於AI研發的文章整理資料,我只是簡單地將一個AI系統指向我的電子報檔案,並要求它提取所有我曾報導過與AI研發相關的內容,並附上參考資料。它做得非常出色,大大加快了我進行一些對我關於RSI的文章至關重要的分析能力。
但更有趣的是接下來發生的事:我要求它為我製作圖表,方法是閱讀電子報中的參考資料(主要是arXiv論文),然後提取資料並編譯,最後在一個美觀的儀表板中繪製圖表,供我探索。然後我意識到,我可以將我要求它做的事情轉化為一個可重複的流程,一項技能。
透過給予它一些獨屬於我的東西——我的電子報、我的直覺、我的品味,我給了它一個核心,從中我可以發展出更宏大的事物。於是我創造了一項技能。接著發生了一件奇怪的事:我對它說:「去再製作20張這樣的圖表。」它離開後閱讀了數百篇論文,然後帶著另外20張圖表回來。
當我審視這些圖表時,我產生了一種令人興奮的發現感——儘管我認識其中一些圖表,並且可以要求它為我製作,但其中也有一些全新的圖表,它們與我從未見過的論文或基準測試相關。透過這個過程,我學到了一些新的原始資料可以閱讀,而我也確實去閱讀了。我深刻理解製作一張圖表需要付出什麼。
你需要閱讀大量的論文。你需要在其中尋找共同的測量指標。你還要閱讀每篇論文中許多不同的注意事項,並判斷哪些指標是無稽之談,哪些是有意義的。這所需的時間遠超你的想像。將近十年前,我共同創辦了史丹佛大學的一個名為「AI指數」的專案,其目標是每年發布一份關於AI進展的報告。
我之所以成為該專案的共同創辦人,是因為我遇到了一些正在從事這項工作的學者,並意識到我已經製作了他們正在思考的圖表:我的電腦裡有一個試算表,我一直在勤奮地整理一張關於各種AI系統在Atari遊戲上的進展圖表,以及ImageNet圖表和一些機器翻譯圖表。
這些圖表是一種「工作證明」,其他人會將其視為我熱情和勤奮的表現。他們知道我製作了這些圖表,就意味著我花費了大量的時間閱讀這些論文。我需要你深刻感受這需要投入多少時間,然後驚嘆於一個AI系統能夠做到這一切——而且不僅僅是做到,還能以可重複且通用的方式,比我快上數千倍地完成。
現在我擁有了這項「封裝」起來的技能,我可以利用這些AI系統的驚人力量為我做一些我知道需要花費數週時間的工作。而它可以在幾分鐘內為我完成。而且它能應用於任何事物。我現在正利用它來探索生物學領域,讓它為我生成圖表,然後我挑選出我感興趣的圖表並閱讀相關論文。
但對我來說,這項技能也是我。這是一項源於我個人執著和獨特之處的技能,看著它運作,對我來說感覺就像一個奇蹟,因為它就是我——但卻是一個運行速度快數千倍、聰明得多、可靠得多的我。這其中蘊含著深刻的賦能與驚奇。我將我高度獨特的熱情轉化為可以提煉並交給機器的東西,然後機器就能代表我去做事。
而它之所以能做到這一點,僅僅是因為我有幸培養了這個豐富而獨特的嗜好,這個嗜好在過去十年中依賴於重複的實踐和創造。這
