如果你瀏覽你最喜歡的社群媒體網站,你會發現許多貼文開始看起來驚人地相似:這些貼文的許多評論也都是由AI生成的。越來越多的學術論文、紐約時報的評論文章,甚至據稱還有獲獎短篇小說,也都是如此。如果你經常使用AI,你可能已經注意到身邊有多少AI寫作(頻繁使用AI的人過去在辨識AI寫作方面表現相當不錯),如果沒有,我向你保證,這比你想像的還要多。

這不只是AI寫作的千篇一律,儘管最終會變得乏味到讓我的「AI偵測器」一響,即使是關於有趣主題的文章我也會跳過。更糟糕的是,提示詞不佳的AI寫作,每個字詞所產生的意義極少,反而會讓你陷入思想的迴圈。我們習慣將精心撰寫、聽起來有深度的文字視為人類努力的成果,因此當我們看到這些AI撰寫的評論時會給予關注。

但其中往往沒有人類的意義,這些貼文只是空有意義外表的「注意力吸血鬼」,需要耗費心力去解讀,卻無法給你對等的理解回報。然而,使用AI寫作的代價不僅是讓讀者卻步,它還可能破壞一項重要人類任務的發展。我很幸運能寫作數十年,並發展出自己的風格,無論是寫書、發推文或部落格文章,我認為我的風格都能展現出來。

這種風格的養成需要大量令人極度惱人的努力:好的老師、不斷重寫以及網路上的刻薄評論都功不可沒。如果AI能完成精美的寫作,我或許可以跳過這一切,但這樣做的代價是放棄對我的職涯和幸福都非常重要的東西。這絕非譴責任何使用AI輔助寫作的方式。我認為AI對優秀的寫作者來說是一個絕佳的工具(我會讓AI檢查我所有的寫作,並扮演不同讀者的視角,看看我是否遺漏了重要內容)。

對於那些在溝通上遇到困難的人,AI可以幫助他們更好地表達想法,而且寫作對每個人來說可能不等於思考。此外,只要稍加努力,就能讓AI寫作不那麼陳腔濫調、更具個人風格,也更值得使用(適度即可)。因此,這篇文章反而是譴責將AI作為預設選項,或者更糟的是,完全不加思考地使用AI。

平衡使用AI與我們自身的思考能力,將是未來幾年的關鍵挑戰。最能清楚看到這一點的領域是教育,有兩篇研究論文(研究團隊成員包含華頓商學院的同儕)很好地闡釋了使用AI來「抄捷徑思考」與「輔助思考」之間的差異。第一篇論文是在土耳其一所高中進行的實驗,約有一千名學生學習數學。

其中一組使用純粹的ChatGPT,另一組則沒有AI存取權限。使用ChatGPT的學生作業表現較好,也認為自己學到更多,但在考試時,他們的表現卻不如沒有使用ChatGPT的同學。這是因為AI被設計為一個有用的助理,但它實際上只是給予答案,而真正的學習需要心力投入。

透過縮短努力的過程,你也就縮短了學習的過程。這就是為什麼AI在課堂學習上的初步結果會如此令人擔憂。然而,在許多相同作者的第二篇論文中,我們看到了不同的結果。他們在台北的十所高中開設了一個為期五個月的Python課程,近千名學生參與。由AI導師提供個人化問題序列的學生,在沒有AI輔助下進行的期末考中,成績高出0.15個標準差。

根據一些估計,這相當於額外六到九個月的學習時間,而且沒有增加任何教學時間或教師工作量。相反地,AI幫助學生量身打造學習內容。這與其他關於AI輔導的研究相符,表明客製化的導師若使用得當,可以顯著提升學習成效。這是AI使用方式上相對微小的差異,卻導致了巨大的結果差異。

更糟的是,人性會引導我們做出錯誤的選擇。學習需要我們面對自己的無知並進行艱難的智力工作,而這些事情確實令人不舒服。這就是為什麼學生會認為有趣的講座比在課堂上解決難題更有教育意義,儘管他們實際上從艱苦的工作中學到更多。為了從AI學習中獲益,你需要從讓AI解決問題,轉變為讓AI推動你自己解決問題。

幸運的是,三大AI公司都提供了至少能讓AI更像導師般輔助學習的工具。不幸的是,這些工具並不容易直觀地存取。Gemini最簡單,點擊加號並選擇「引導式學習」(Guided Learning)。對於ChatGPT,你需要輸入「/learn」到聊天框中。

對於Claude,你需要點擊加號,選擇「使用風格」(use style),然後選擇「學習」(learning)(Anthropic已宣布此方法正在改變,但尚未記錄變更)。在所有情況下,如果可能,你都應該使用思考型或進階模型,特別是對於STEM科目。

而且這些模式只會幫助那些想要學習的人,如果你想作弊,它們也無法阻止你。AI不必然會損害你的思考能力,但如果使用不當,它確實會造成這種情況,而「使用不當」往往是預設模式。我在華頓商學院的同事稱之為「認知繳械」(cognitive surrender),他們記錄了人們如何停止思考問題,直接讓AI完成工作,即使AI的答案是錯誤的。

我認為部分問題出在這些工具的設計方式。我沒有為這篇文章這樣做…當AI系統需要複雜的來回對話且頻繁出錯時,人類必須在每個步驟都參與其中。代理型(Agentic)系統的設計宗旨是讓你的生活更輕鬆,因為它們會直接完成任務。這對於「完成任務」來說很棒,但對於「學習任何東西」、「保持真實性」或「避免認知繳械」來說卻很糟糕。

如果你提出一個困難的要求並得到答案,很容易就會直接採納AI的回應。在我們最近與Fabrizio Dell’Acqua以及我在哈佛、麻省理工學院、華威大學、BCG等地的同事共同發表的一篇論文中(我三年前曾在此撰文提及,但學術論文發表需要時間!)

,我們對波士頓顧問集團(Boston Consulting Group)的758名顧問進行了一項實驗,其中一半人可以使用GPT-4。使用AI的顧問表現遠超沒有使用AI的顧問。但我們也要求顧問解決一個我們知道AI會失敗的問題。在該任務中,使用AI的顧問獲得正確答案的可能性顯著低於沒有使用AI的顧問。

AI給出了看似權威但實際上不正確的答案,而他們中的大多數人,那些在其他方面表現優異的頂尖顧問,都沒有發現錯誤。當然,現在AI已經能解決那個問題了,所以現在的問題不再是錯誤率,而是因為屈服於同樣的「繳械」衝動,而未能學會如何成為一名優秀的顧問。

同樣地,這不一定是預設情況。在Anthropic進行的一項小型研究中,程式設計師使用AI來幫助他們完成一項新任務。那些完全讓AI完成工作的人無法回答關於他們所做的事情的問題,這就是「繳械」的跡象。但那些要求AI解釋其運作方式,或只讓AI輔助部分工作的人,似乎避免了這種命運。

部分解決方案可能存在於工具本身,但這是有限的。一個在每個答案前都問你「你希望我推動你思考這個問題,還是直接給你答案?」或者告訴你「如果你自己寫,這會更真實」的ChatGPT版本,在大多數時候都會令人難以忍受。但在某些情況下,我們確實需要這些提醒。

台北的實驗結果暗示了一個方向,即系統層面的限制而非使用者層面的意志力,但我們在消費性產品中很少看到這種情況,商業壓力大多推向相反的方向。很多問題最終還是要歸結到我們自己。說清楚一點,我對許多「認知繳械」是樂見其成的。我不再記電話號碼,因為我的手機會幫我做這件事。

我很高興我的孩子不需要學習草書。我樂於讓計算機處理我的日常數學,讓電腦安排我的課程。這些曾經是有用的技能,但我們放棄它們可能是對的。AI則不同,因為這項技術足夠通用,幾乎任何認知任務都可以在某種程度上卸載給它。我不想對寫作過於珍視:沒有任何原則規定一封潤飾過的電子郵件草稿必須出自人類之手,就像一列算術不必如此一樣。

但我們不希望放棄所有東西,而且對於任何特定任務,我們大多還不知道什麼是重要的,什麼不是。決定這一點將是一個真正的挑戰。重點不在於避免使用AI,而是要刻意為之,有意識地選擇如何運用AI,而非反射性的依賴或反射性的迴避。更廣泛地說,我們正處於為AI設定預設工作類型的階段:由AI公司設計無摩擦的使用體驗、由雇主決定什麼才算「善用AI」,以及由人們教授不斷變化的「AI素養」概念。

諷刺的是,這一切大多是在沒有任何實際規劃或考量的情況下發生的。我懷疑一旦一代工作者和學生圍繞這些預設模式養成習慣,將很難逆轉。我們能做的最重要的事情是持續詢問什麼可以交給AI,什麼應該保留給我們自己…而且不要期望任何人,包括AI,能為我們回答這個問題。

這在小說寫作中尤其如此,AI在小說寫作中看似強大,實則臭名昭著地薄弱。ChatGPT尤其喜歡使用無意義的明喻和隱喻(「街道像一張缺牙的笑臉」、「他坐著的姿勢會讓樹木嫉妒」),乍看之下可能覺得深刻,但這只是因為我們假設艱難的寫作是有目的的,並努力賦予其意義。如果我們足夠努力,人類非常擅長將意義賦予無意義的材料。