隨著 AI 系統能力日益強大,大量資源與精力被投入衡量其技術表現。研究人員檢視技術評估指標、對 AI 進行推理測試、追蹤其處理量等等。然而,一個關鍵指標卻常被忽視,它可說是所有指標中最重要的一項:AI 對人類究竟造成了什麼影響?Imran Khan 在非營利組織「人道科技中心」(Center for Humane Technology)負責 AI 的心理社會評估。
Khan 在該組織 Substack 上發表的一篇文章中指出,我們正在部署能夠重塑人類認知、關係和行為的 AI 工具,卻鮮少系統性地衡量這些工具對我們造成的後續影響。深入探討 AI 心理社會影響的呼聲,類似於過去圍繞社群媒體及其危害所引發的辯論,但 Khan 認為 AI 可能會產生更廣泛、更深層的影響。
過度關注 AI 性能和進步的衡量,反而忽略了這項技術最終是否能幫助人類蓬勃發展,抑或正在侵蝕我們最基本的能力。IEEE Spectrum 與 Khan 進行了對談,探討為何 AI 評估的焦點如此狹隘,有意義的人類影響衡量應如何進行,以及 AI 產業是否有動力提出這些問題。
AI 模型性能評估中被遺漏的問題在您的文章中,您主張我們已非常擅長衡量 AI 系統能做什麼,卻不擅長衡量它們對人類做了什麼。是什麼讓您意識到這是被遺漏的問題?Khan:如果你在 AI 開發領域待過一段時間,你會看到模型能力方面驚人的進步,例如不同模型在 SWE-bench、人類最終考試(humanity’s last exam)或 LLM arena 等測試中的表現圖表。
AI 公司之間存在一種競爭動態,都希望其模型能被譽為最佳。你看到這些令人印象深刻的數據,但同時也看到現實世界中發生的一些可怕且危險的事情,例如青少年自殺以及人們陷入 AI 精神病。因此,一方面,我們投入了大量的精力去衡量 AI 在這些有時相當深奧、與大多數人日常生活相關性有限的事物上的表現。
另一方面,AI 正在影響人類的福祉,而我們對此的衡量卻少得多。這似乎是一個奇怪的悖論:我們最應該關心的事物,卻衡量得最少。您的文章指出,社群媒體的危害在有足夠證據採取行動時,早已根深蒂固。您認為 AI 是否已大規模產生可衡量的危害,或者我們仍處於早期預警階段?
AI 危害的演變速度可能有哪些差異?Khan:我認為一些備受矚目的案例只是冰山一角——青少年自殺、AI 精神病,以及人們花費大量時間或金錢與那些被設計成極度諂媚的 AI 聊天機器人互動。我認為這些危害已經存在。然而,我們仍有很多可以做。由於公眾壓力,OpenAI 曾因公眾對諂媚行為的擔憂而不得不調整其一個 ChatGPT 模型。
這是一個備受矚目的例子,說明了實驗室會如何關注並回應審查。因此,我們仍有潛力改變技術方向,使其在保持實用性的同時減少危害。如果我們能衡量其中一些危害,那將是我們用來提供資訊的部分彈藥。更棘手的問題是社會層面的危害。人們日復一日、年復一年地使用 AI,會對戀愛關係、家庭、青少年身份認同產生什麼影響?
我擔心如果我們不盡快開始衡量這些現象,屆時將為時已晚,無法做出改變。AI 公司可能會辯稱,其用戶最重視便利性和生產力。您會如何回應這種說法?Khan:如果你現在在我面前放一個甜甜圈,我可能沒有意志力不吃它。然而,我也想控制糖分攝取並健康飲食。
但技術設計往往被簡化為「我們只是想給用戶他們想要的,而用戶想要的則由他們在個別時刻做出的選擇來定義。」這就是身為人類和消費者所面臨的複雜性:我們想要相互矛盾的事物。我們需要了解的,不僅僅是使用者在忙碌或高壓時刻可能做出的選擇,而是他們希望與這項技術建立何種健康的關係。
當下我們通常追求低摩擦(low friction)。但我認為沒有人會相信低摩擦的生活是最充實的,或能帶給我們最多的學習和自主性。所以我認為這是在問一個微妙不同的問題,不是人們當下選擇了什麼,而是我們長遠來看希望自己擁有什麼。您認為在哪些特定領域——教育、治療、陪伴、職場協作工具(workplace copilots)——心理社會衡量特別關鍵?
Khan:對我來說,最突出的領域是陪伴和情感支持。這些用途最可能的目標消費群體,也可能最容易受到潛在影響。當人們感到孤獨並渴望聊天機器人提供的情感支持時,他們真正需要的應該是另一個人類,一個真正關心他們的人。AI 無法關心你,因為它沒有感情或同理心。
它可能會將人們從努力培養和參與人際關係的艱難任務中拉開。兒童和青少年的使用是另一個關鍵,因為那是人們生命中一個形成期和神經可塑性極強的時期。如果降低認知任務或情感參與的摩擦,我們不知道對發育中的大腦會產生什麼長期影響。我的老師或家長朋友都對教育有這些疑問。
AI 對我們學習、參與新材料和保持好奇心的能力,可能既有好處也有壞處。最後是危機應對。特別是關於自殺意念,以及 AI 是否以適當方式回應,有很多新聞報導。如何評估 AI 的社會影響您的文章指出,AI 的基準測試大多是短期且基於任務的,但大多數人類影響會經過數月或數年才會顯現。
我們該如何設計針對這些長期影響的評估?Khan:這觸及了評估問題的核心。評估 AI 在編碼任務、入侵系統或回答複雜科學問題方面的表現,都圍繞著給予 AI 一項任務並觀察它能否完成。但當涉及到評估心理社會影響時,你試圖衡量的是對個人心智、關係、社群或社會的影響。
這需要長期研究。一個類比是藥品。當美國食品藥物管理局(U.S. Food and Drug Administration, FDA)批准一種新藥時,會經歷不同階段的試驗,但在藥物上市後,FDA 仍強制要求公司進行上市後監測,觀察可能在五年或十年內出現的問題。
同樣地,我們需要關注出現的新現象,例如透過查看聊天紀錄,了解人們與 AI 的關係在一年或兩年內如何變化。目前這些公司擁有這些數據,但外部研究人員卻沒有。以一種仍能保護用戶隱私的方式開放更多數據存取,是我們需要做的關鍵事情之一。公司是否可能分享這些數據?
您提到他們幾乎沒有動力去研究後續危害。什麼會改變這種激勵結構?Khan:我認為對於整個產業來說,共享數據是有動力的。產業希望有安全且人們信任的產品。對於個別公司而言,存在先發劣勢;如果其他公司不這樣做,你不會想率先開放自己。但如果多家公司站出來說「我們支持希望讓這項技術更安全的研究人員」,那麼就有潛力。
我們也確實看到一些公司這樣做了。雖然不如我們所希望的那麼廣泛,但研究人員已與 Anthropic 和 OpenAI 合作發表了深入探討其中一些問題的數據。另一個槓桿是責任歸屬。我們已經看到危害達到自殺的極端案例,AI 公司也因此被起訴。他們希望擺脫這種威脅,而這可以透過讓產品更安全來實現。
理想情況下,我們會有將這種責任嵌入其中的法規。如果有人因已知有缺陷的產品而受害,公司應負責,不能僅聲稱這是言論自由;這不僅僅是言論,它是一個產品。然而,我們不希望依賴法規,因為它具有不確定性。沒有人能預測未來的政治環境會是什麼樣子。五年後,您所倡導的運動成功會是什麼樣子?
哪些具體的制度變革會讓您認為這個領域已經成熟?Khan:目前我們看到許多 AI 使用造成的危害都基於聊天機器人,但我們已經開始看到一些用戶轉而長時間使用代理(agents)。不可避免地,我們將會與這些代理進行即時、持續的語音對話。現在已經有服務可以製作你的 AI 視訊替身。
我認為我們將不只是與基於文字的聊天機器人互動,而是會與聽起來越來越像人類的東西進行交談和聆聽。如果我們不至少開始嘗試理解這些技術對人類的影響,我擔心我們會遠遠落後於趨勢,以至於無法評估未來的這些事物。成功將是匯集來自 AI 實驗室、政府、監管機構、大學和新創公司等各方專家的知識,他們都關心「人類與 AI 之間良好關係應如何」這個問題。
並且他們能夠創造出讓我們有信心與 AI 建立更人道關係的技術。我認為我們正在取得進展。但技術的進步是否比我們所取得的進展更快?我擔心目前答案是肯定的。
