AI 的能力早已遠超乎大多數人的想像。這種所謂的「能力過剩」很大一部分並非源於 AI 本身的限制(儘管它們當然仍有許多限制),而是來自人們與其互動的方式。絕大多數人透過聊天機器人使用 AI,而且通常是能力較弱的免費版本。聊天機器人適合快速提問,但對於完成實際工作而言,它並不是一個好方法。事實上,近期研究指出,當我們使用聊天機器人介面工作時,會付出額外的認知成本。一篇新論文讓一小群金融專業人士使用 GPT-4o 執行複雜的估價任務,並逐輪測量他們在對話記錄中的認知負荷。人們確實從使用 AI 中看到了生產力提升,但其中一部分似乎被抵消了,因為 AI 呈現資訊的方式完全讓使用者感到不知所措:大量的文字牆、提供探索新主題的建議,以及冗長的討論。聊天機器人介面似乎成了障礙,而非工作本身。一旦對話變得混亂,它就會一直混亂下去。AI 雖然被優化為提供幫助,卻只是反映使用者提供的雜亂結構,而使用者在不知所措的情況下也未能重新整理。雙方不斷加劇這個問題。受影響最嚴重的是經驗較少的員工,而這群人恰恰是如果能掌握 AI 用途,就能從中受益最多的人。如果你曾使用聊天機器人完成工作,這應該不令人意外。你提出一個具體問題,卻得到五段文字,其中某處包含答案,同時 AI 還提供了三個你沒問過的新事物。介面本身產生了認知成本,抵消了 AI 智慧帶來的益處。那麼,更好的介面會是什麼樣子呢?一種選擇是為特定工作或任務建立專用介面。在所有專用 AI 介面中,唯一真正完善的是用於程式設計的介面。這正是意料之中,AI 實驗室由程式設計師組成,模型經過大量程式碼訓練,而開發這些工具的人通常是為自己而建。我之前曾撰文介紹 Anthropic 的編碼代理 Claude Code,它能自主工作數小時。OpenAI 的 Codex 和 Google 的 Antigravity 也做著類似的事情。我曾使用 Claude Code 處理各種事務,從賺取(少量)金錢到製作遊戲,完全無需接觸任何程式碼。我也發現 Codex 非常有用,具有相似的能力水平。這些工具很棒,但它們確實是為程式設計師打造的。它們假設你了解 Python 和 Git。它們的介面看起來就像 1980 年代的電腦實驗室。對於 99% 非開發者的知識工作者而言,這些強大的 AI 工具並未針對他們進行優化。在所有 AI 實驗室中,Google 似乎在為其他專業領域建立專用介面方面進行了最多的實驗。儘管這些產品都還有些粗糙,但它們展示了當 AI 工具為其他類型的知識專業人士打造時,未來可能會是什麼樣子。Google 的 Stitch 預示了 AI 原生設計的樣貌——一個無限畫布,你可以在其中用自然語言描述一個應用程式,並獲得多個具有一致設計系統的相互連接的螢幕。同樣地,Pomelli 讓你貼上網站 URL,自動生成符合品牌形象的社群媒體行銷活動,它使用行銷語言而非提示詞,讓操作感覺不那麼技術性。而最廣為人知的 NotebookLM 則提供了一種研究、展示和處理多樣資訊來源的方式。這些都顯示了未來的發展方向,但它們尚未達到 Claude Code 對於程式設計師那樣的變革性工具水準。但還有一種介面經歷了爆炸性成長,那就是個人代理。如果你沒聽過,OpenClaw 是一個開源 AI 代理,其標誌是一隻紅龍蝦,它是一個資安夢魘,並且已成為史上成長最快的開源專案。OpenClaw 如此成功,因為它是一個真正的個人代理。該系統的設計宗旨是讓你能夠透過 WhatsApp、Telegram 或 Slack 等你用來傳訊息給人們的應用程式與你的 AI 代理對話。你告訴它檢查你的電子郵件、預訂餐桌、尋找檔案,它就會在你的電腦上執行這些任務。它以一種事後看來顯而易見的方式解決了介面問題:它不是聊天機器人或命令列,而是讓你像與人交談一樣與 AI 對話,使用 WhatsApp 等已經非常熟悉的介面。然而,OpenClaw 難以使用且存在許多資安風險。Anthropic 的解決方案是結合 Dispatch 的 Claude Cowork。Cowork 於一月推出,是專為知識工作者設計的 Claude Code 版本。它讓 Claude 透過桌面工作區存取你的本地檔案和應用程式。它還透過連接器連接數十個應用程式,當沒有連接器時,它會直接控制你的滑鼠和鍵盤。Dispatch 在過去幾週推出,增加了關鍵功能:你可以在手機上向 Claude 發送訊息,而它則在你的桌上型電腦上工作。你掃描一個 QR code,你的手機就成了你電腦上 AI 代理的遠端遙控器。結合 Dispatch 和 Claude Code 創造了一個感覺就像與一位能幹的助理對話的介面。例如,我從手機上要求 Claude 準備一份晨間簡報,它會從我的行事曆、電子郵件和線上頻道讀取資訊,然後給我一份關於我接下來需要做什麼的報告。但 Cowork 也能處理更複雜的工作。我從手機上要求它查看我最近製作的一份簡報,看看投影片 3 中的圖表是否為最新,如果不是,就更新它。你可以看到它在某處稍微卡住了(一個網站阻止它下載檔案),但除此之外,結果非常令人印象深刻。它打開並「查看」了 PowerPoint,並檢查了我整個電腦以尋找最新的數據。當我給它一個指向更新線上論文的連結時,它下載了 PDF,找到了新的圖表,剪輯出圖表圖像,並為我更新了 PowerPoint。這是一項複雜且精細的工作,即使不總是無縫銜接,通常也足夠節省大量時間。這有 OpenClaw 那麼靈活嗎?沒有。Cowork 採用沙盒化設計,更安全但也更受限(但這不代表沒有資安風險)。連接器生態系正在成長,但尚未完善。而 Cowork 可以使用你的電腦這個概念令人印象深刻,但在實踐中容易出錯。但核心洞察與 OpenClaw 無意中發現的相同。人們不想要聊天機器人。他們想要一個能夠處理他們實際檔案、使用他們實際工具,並以他們與人交談的方式存取的代理。所有這些都假設我們需要預先決定介面。但最新的 AI 系統實際上可以為你建立介面。例如,在過去幾週,Claude 獲得了直接在對話中生成視覺化圖表的能力。這些不是靜態圖片。它們是互動式、可調整的,而且 Claude 可以根據你的後續問題進行修改。這是解決介面問題的另一種方法。AI 不再讓公司為每種工作建立專用介面,而是即時生成合適的介面。我猜想未來不會是「一個介面統治一切」。而是 AI 能為當下生成合適的介面,可能是你桌面上的代理、對話中的圖表,或解決問題的客製化應用程式。我們正在從適應 AI 的介面轉變為 AI 適應你的介面。AI 能力一直超前於 AI 的易用性。模型早已足夠聰明,能夠完成非凡的事情,但我們一直讓使用者透過聊天機器人來存取這些智慧。正如認知負荷研究所示,聊天機器人格式實際上正在阻礙使用者。隨著介面改進,我們將看到當更多人能夠真正運用 AI 的能力時會發生什麼。每個彌補部分差距的新介面都將感覺像是 AI 能力的一次飛躍,即使模型本身沒有改變(儘管它們仍在變化)。我猜測,人們有時表達的許多「對 AI 的失望」並非來自 AI 不好,而是來自介面不對。我們創造了近代史上最強大的技術之一,然後卻讓使用者透過在聊天視窗中打字來存取它。這很快就會改變。