AI 發展獨漏關鍵：人類影響評估何在？

隨著 AI 系統能力日益強大，大量資源與精力被投入衡量其技術表現。研究人員檢視技術評估指標、對 AI 進行推理測試、追蹤其處理量等等。然而，一個關鍵指標卻常被忽視，它可說是所有指標中最重要的一項：AI 對人類究竟造成了什麼影響？Imran Khan 在非營利組織「人道科技中心」（Center for Humane Technology）負責 AI 的心理社會評估。

Khan 在該組織 Substack 上發表的一篇文章中指出，我們正在部署能夠重塑人類認知、關係和行為的 AI 工具，卻鮮少系統性地衡量這些工具對我們造成的後續影響。深入探討 AI 心理社會影響的呼聲，類似於過去圍繞社群媒體及其危害所引發的辯論，但 Khan 認為 AI 可能會產生更廣泛、更深層的影響。

過度關注 AI 性能和進步的衡量，反而忽略了這項技術最終是否能幫助人類蓬勃發展，抑或正在侵蝕我們最基本的能力。IEEE Spectrum 與 Khan 進行了對談，探討為何 AI 評估的焦點如此狹隘，有意義的人類影響衡量應如何進行，以及 AI 產業是否有動力提出這些問題。

AI 模型性能評估中被遺漏的問題在您的文章中，您主張我們已非常擅長衡量 AI 系統能做什麼，卻不擅長衡量它們對人類做了什麼。是什麼讓您意識到這是被遺漏的問題？Khan：如果你在 AI 開發領域待過一段時間，你會看到模型能力方面驚人的進步，例如不同模型在 SWE-bench、人類最終考試（humanity’s last exam）或 LLM arena 等測試中的表現圖表。

AI 公司之間存在一種競爭動態，都希望其模型能被譽為最佳。你看到這些令人印象深刻的數據，但同時也看到現實世界中發生的一些可怕且危險的事情，例如青少年自殺以及人們陷入 AI 精神病。因此，一方面，我們投入了大量的精力去衡量 AI 在這些有時相當深奧、與大多數人日常生活相關性有限的事物上的表現。

另一方面，AI 正在影響人類的福祉，而我們對此的衡量卻少得多。這似乎是一個奇怪的悖論：我們最應該關心的事物，卻衡量得最少。您的文章指出，社群媒體的危害在有足夠證據採取行動時，早已根深蒂固。您認為 AI 是否已大規模產生可衡量的危害，或者我們仍處於早期預警階段？

AI 危害的演變速度可能有哪些差異？Khan：我認為一些備受矚目的案例只是冰山一角——青少年自殺、AI 精神病，以及人們花費大量時間或金錢與那些被設計成極度諂媚的 AI 聊天機器人互動。我認為這些危害已經存在。然而，我們仍有很多可以做。由於公眾壓力，OpenAI 曾因公眾對諂媚行為的擔憂而不得不調整其一個 ChatGPT 模型。

這是一個備受矚目的例子，說明了實驗室會如何關注並回應審查。因此，我們仍有潛力改變技術方向，使其在保持實用性的同時減少危害。如果我們能衡量其中一些危害，那將是我們用來提供資訊的部分彈藥。更棘手的問題是社會層面的危害。人們日復一日、年復一年地使用 AI，會對戀愛關係、家庭、青少年身份認同產生什麼影響？

我擔心如果我們不盡快開始衡量這些現象，屆時將為時已晚，無法做出改變。AI 公司可能會辯稱，其用戶最重視便利性和生產力。您會如何回應這種說法？Khan：如果你現在在我面前放一個甜甜圈，我可能沒有意志力不吃它。然而，我也想控制糖分攝取並健康飲食。

但技術設計往往被簡化為「我們只是想給用戶他們想要的，而用戶想要的則由他們在個別時刻做出的選擇來定義。」這就是身為人類和消費者所面臨的複雜性：我們想要相互矛盾的事物。我們需要了解的，不僅僅是使用者在忙碌或高壓時刻可能做出的選擇，而是他們希望與這項技術建立何種健康的關係。

當下我們通常追求低摩擦（low friction）。但我認為沒有人會相信低摩擦的生活是最充實的，或能帶給我們最多的學習和自主性。所以我認為這是在問一個微妙不同的問題，不是人們當下選擇了什麼，而是我們長遠來看希望自己擁有什麼。您認為在哪些特定領域——教育、治療、陪伴、職場協作工具（workplace copilots）——心理社會衡量特別關鍵？

Khan：對我來說，最突出的領域是陪伴和情感支持。這些用途最可能的目標消費群體，也可能最容易受到潛在影響。當人們感到孤獨並渴望聊天機器人提供的情感支持時，他們真正需要的應該是另一個人類，一個真正關心他們的人。AI 無法關心你，因為它沒有感情或同理心。

它可能會將人們從努力培養和參與人際關係的艱難任務中拉開。兒童和青少年的使用是另一個關鍵，因為那是人們生命中一個形成期和神經可塑性極強的時期。如果降低認知任務或情感參與的摩擦，我們不知道對發育中的大腦會產生什麼長期影響。我的老師或家長朋友都對教育有這些疑問。

AI 對我們學習、參與新材料和保持好奇心的能力，可能既有好處也有壞處。最後是危機應對。特別是關於自殺意念，以及 AI 是否以適當方式回應，有很多新聞報導。如何評估 AI 的社會影響您的文章指出，AI 的基準測試大多是短期且基於任務的，但大多數人類影響會經過數月或數年才會顯現。

我們該如何設計針對這些長期影響的評估？Khan：這觸及了評估問題的核心。評估 AI 在編碼任務、入侵系統或回答複雜科學問題方面的表現，都圍繞著給予 AI 一項任務並觀察它能否完成。但當涉及到評估心理社會影響時，你試圖衡量的是對個人心智、關係、社群或社會的影響。

這需要長期研究。一個類比是藥品。當美國食品藥物管理局（U.S. Food and Drug Administration, FDA）批准一種新藥時，會經歷不同階段的試驗，但在藥物上市後，FDA 仍強制要求公司進行上市後監測，觀察可能在五年或十年內出現的問題。

同樣地，我們需要關注出現的新現象，例如透過查看聊天紀錄，了解人們與 AI 的關係在一年或兩年內如何變化。目前這些公司擁有這些數據，但外部研究人員卻沒有。以一種仍能保護用戶隱私的方式開放更多數據存取，是我們需要做的關鍵事情之一。公司是否可能分享這些數據？

您提到他們幾乎沒有動力去研究後續危害。什麼會改變這種激勵結構？Khan：我認為對於整個產業來說，共享數據是有動力的。產業希望有安全且人們信任的產品。對於個別公司而言，存在先發劣勢；如果其他公司不這樣做，你不會想率先開放自己。但如果多家公司站出來說「我們支持希望讓這項技術更安全的研究人員」，那麼就有潛力。

我們也確實看到一些公司這樣做了。雖然不如我們所希望的那麼廣泛，但研究人員已與 Anthropic 和 OpenAI 合作發表了深入探討其中一些問題的數據。另一個槓桿是責任歸屬。我們已經看到危害達到自殺的極端案例，AI 公司也因此被起訴。他們希望擺脫這種威脅，而這可以透過讓產品更安全來實現。

理想情況下，我們會有將這種責任嵌入其中的法規。如果有人因已知有缺陷的產品而受害，公司應負責，不能僅聲稱這是言論自由；這不僅僅是言論，它是一個產品。然而，我們不希望依賴法規，因為它具有不確定性。沒有人能預測未來的政治環境會是什麼樣子。五年後，您所倡導的運動成功會是什麼樣子？

哪些具體的制度變革會讓您認為這個領域已經成熟？Khan：目前我們看到許多 AI 使用造成的危害都基於聊天機器人，但我們已經開始看到一些用戶轉而長時間使用代理（agents）。不可避免地，我們將會與這些代理進行即時、持續的語音對話。現在已經有服務可以製作你的 AI 視訊替身。

我認為我們將不只是與基於文字的聊天機器人互動，而是會與聽起來越來越像人類的東西進行交談和聆聽。如果我們不至少開始嘗試理解這些技術對人類的影響，我擔心我們會遠遠落後於趨勢，以至於無法評估未來的這些事物。成功將是匯集來自 AI 實驗室、政府、監管機構、大學和新創公司等各方專家的知識，他們都關心「人類與 AI 之間良好關係應如何」這個問題。

並且他們能夠創造出讓我們有信心與 AI 建立更人道關係的技術。我認為我們正在取得進展。但技術的進步是否比我們所取得的進展更快？我擔心目前答案是肯定的。