AI 延伸人類智慧：理解其本質與建構可信賴系統

一覽

現代 AI 系統之所以強大，並非因為它們複製了人類智慧，而是透過延伸人類認知與語言中已存在的結構來預設（presuppose）它。

這種觀點有助於解釋 AI 卓越的能力及其反覆出現的局限性，包括幻覺和推理中斷。

這項研究認為，AI 安全是一個系統層級的挑戰，將焦點從「失控 AI」的敘事轉向利用工程和治理。

將 AI 理解為人類智慧的延伸而非替代品，為建構可信賴的 AI 系統提供了一條更為務實的途徑。

如今的 AI 系統能流暢地撰寫文章、生成程式碼、總結複雜概念並進行對話。然而，這些系統在人類覺得直觀的任務上仍面臨挑戰：例如在變化中可靠地追蹤物體、在不熟悉情境中進行組合式推理，或區分真相與看似合理卻虛構的內容。這些矛盾引發了關於 AI 的兩極化辯論。有些人將目前的系統視為人類智慧的早期形式；另一些人則將其視為複雜的自動完成工具。

在近期跨領域的研究中——包括 Adam Frank、Marcelo Gleiser 和 Evan Thompson 的《The Blind Spot》以及 DeepMind 研究員 Alexander Lerchner 的《The Abstraction Fallacy》——一種不同的觀點正在浮現。

這些方法不再探討 AI 系統是否正變得像人類一樣智能，而是提出一個更基本的問題：如果 AI 系統之所以有效，是因為它們依賴於根植於人類認知的結構，那會如何？這種視角轉變，借鑒了 Edmund Husserl 的現象學，有助於理解現代 AI 的能力與局限。

在我們最近的論文《The Origins of Artificial Intelligence in Natural Intelligence》中，我們主張現代 AI 系統既不應被理解為人類心智，也不是微不足道的統計技巧。相反地，它們延伸了源自人類認知本身的結構。

論文進一步借鑒 Husserl 的現象學，提出語言本身已蘊含了人類理解的沉澱結構——AI 系統學習對這些結構進行建模和延伸。這種觀點有助於解釋當代 AI 的能力與局限。

人類感知並非僅僅是被動地接收感官數據。我們將世界體驗為在變化中展開的穩定事物：當我們繞著杯子移動時，它仍然是同一個杯子；即使個別音符消逝，旋律依然可辨識。語言的出現是透過概念形式來表達這些穩定結構。諸如「紅色」、「圓形」或「大於」等詞彙，闡明了源於生活經驗的關係。

大型語言模型（LLM）在這個語言世界中學習統計關係。它們捕捉了概念在龐大的人類寫作文本中如何相互關聯。這解釋了為何 AI 系統能在許多領域產生連貫的回應。但這也解釋了它們為何會產生幻覺。人類始終對世界負責：經驗不斷修正我們的期望和信念。相比之下，AI 系統僅延伸文本內部的模式。它們能以驚人的流暢度延續推理，但缺乏與世界的實際互動，而這種互動才是意義與真相的基礎。

AI 延伸人類認知

這個框架有助於解釋 AI 研究中幾個反覆出現的挑戰。其中之一是「組合性差距」（compositionality gap）——語言模型在熟悉的推理模式上表現良好，但在被要求以真正新穎的方式組合概念時卻會失敗。研究日益顯示，更大的模型在流暢性和事實回憶方面的提升速度，遠快於其在真正組合式推理方面的提升。

從我們的角度來看，這不僅僅是工程上的限制，更是一種結構性邊界：AI 系統可以延伸語言中已沉澱的模式，但它們不具備人類那種指向世界的理解能力，無法產生真正新的概念關係。

類似的模式也出現在結合語言和視覺的多模態系統中。這些系統通常能正確標記圖像，但在對物體及其部分進行穩健推理時仍會失敗。它們學習的是視覺模式與語言之間的關聯，而非像人類那樣感知在時間中展開的穩定物體。結果是，這些系統在熟悉模式下可能表現出令人印象深刻的流暢性，但在這些模式之外卻出奇地脆弱。

這種觀點也重新定義了關於 AI 安全的辯論。公眾討論經常在對「失控超級智慧」的恐懼與聲稱 AI 幾乎沒有實質風險之間擺盪。我們的研究表明，這兩種極端都誤解了當前系統的本質。最直接的風險並非來自 AI 擁有類人意圖，而是因為它可以在沒有對世界進行反思性責任的情況下延伸推理模式。系統可能產生具有說服力但缺乏根據的輸出，大規模自動化錯誤決策，或在治理不善的環境中執行有害行動。

這有助於解釋為何 AI 安全正日益從模型安全轉向系統安全。實際上，組織已經依賴分層的安全措施——業界越來越稱之為「約束機制」（harnesses）——來限制、驗證和監控 AI 行為。我們的論文認為，這些機制並非臨時補丁，而是反映了 AI 架構本身的根本特徵：可信賴的行為源於 AI 系統建構者的工作，他們對其行為負責，這種責任不能委託或分享給模型。

這種解釋與企業日益部署可信賴 AI 的方式密切相關。組織需要能夠延伸人類智慧，同時保持可治理、可審計並與人類監督保持一致的系統。將 AI 理解為一種衍生形式的智慧，闡明了為何分層治理、評估和操作控制如此重要。

展望未來，我們相信現象學不僅提供了對 AI 的批判，更提供了一個理解其潛力的框架。AI 系統揭示了人類認知本身的深刻之處：意義可以透過強大的新方式被形式化、延伸和規模化。因此，AI 的核心社會風險在於拋棄其源於人類經驗和認知的根基——將 AI 誤解為一種削弱我們人性的競爭智慧，進而也削弱了 AI 本身的真正潛力。

因此，問題不在於 AI 是否會取代人類智慧。而是我們如何能負責任地建構系統，使其在延伸人類理解的同時，仍能紮根於產生這種理解的世界。如果我們將 AI 系統誤認為自主心智，我們就有過度信任它們的風險。如果我們將其視為微不足道的技巧，我們就有可能忽略這個時代最重要的技術發展之一。一個更務實的解釋同時承認這兩個事實：AI 是人類智慧的真正延伸——正因為如此，人類仍然對其如何被理解、治理和使用負有責任。