AI 新聞繁中

AI 的能力早已遠超乎大多數人的想像。這種所謂的「能力過剩」很大一部分並非源於 AI 本身的限制（儘管它們當然仍有許多限制），而是來自人們與其互動的方式。絕大多數人透過聊天機器人使用 AI，而且通常是能力較弱的免費版本。聊天機器人適合快速提問，但對於完成實際工作而言，它並不是一個好方法。事實上，近期研究指出，當我們使用聊天機器人介面工作時，會付出額外的認知成本。一篇新論文讓一小群金融專業人士使用 GPT-4o 執行複雜的估價任務，並逐輪測量他們在對話記錄中的認知負荷。人們確實從使用 AI 中看到了生產力提升，但其中一部分似乎被抵消了，因為 AI 呈現資訊的方式完全讓使用者感到不知所措：大量的文字牆、提供探索新主題的建議，以及冗長的討論。聊天機器人介面似乎成了障礙，而非工作本身。一旦對話變得混亂，它就會一直混亂下去。AI 雖然被優化為提供幫助，卻只是反映使用者提供的雜亂結構，而使用者在不知所措的情況下也未能重新整理。雙方不斷加劇這個問題。受影響最嚴重的是經驗較少的員工，而這群人恰恰是如果能掌握 AI 用途，就能從中受益最多的人。如果你曾使用聊天機器人完成工作，這應該不令人意外。你提出一個具體問題，卻得到五段文字，其中某處包含答案，同時 AI 還提供了三個你沒問過的新事物。介面本身產生了認知成本，抵消了 AI 智慧帶來的益處。那麼，更好的介面會是什麼樣子呢？一種選擇是為特定工作或任務建立專用介面。在所有專用 AI 介面中，唯一真正完善的是用於程式設計的介面。這正是意料之中，AI 實驗室由程式設計師組成，模型經過大量程式碼訓練，而開發這些工具的人通常是為自己而建。我之前曾撰文介紹 Anthropic 的編碼代理 Claude Code，它能自主工作數小時。OpenAI 的 Codex 和 Google 的 Antigravity 也做著類似的事情。我曾使用 Claude Code 處理各種事務，從賺取（少量）金錢到製作遊戲，完全無需接觸任何程式碼。我也發現 Codex 非常有用，具有相似的能力水平。這些工具很棒，但它們確實是為程式設計師打造的。它們假設你了解 Python 和 Git。它們的介面看起來就像 1980 年代的電腦實驗室。對於 99% 非開發者的知識工作者而言，這些強大的 AI 工具並未針對他們進行優化。在所有 AI 實驗室中，Google 似乎在為其他專業領域建立專用介面方面進行了最多的實驗。儘管這些產品都還有些粗糙，但它們展示了當 AI 工具為其他類型的知識專業人士打造時，未來可能會是什麼樣子。Google 的 Stitch 預示了 AI 原生設計的樣貌——一個無限畫布，你可以在其中用自然語言描述一個應用程式，並獲得多個具有一致設計系統的相互連接的螢幕。同樣地，Pomelli 讓你貼上網站 URL，自動生成符合品牌形象的社群媒體行銷活動，它使用行銷語言而非提示詞，讓操作感覺不那麼技術性。而最廣為人知的 NotebookLM 則提供了一種研究、展示和處理多樣資訊來源的方式。這些都顯示了未來的發展方向，但它們尚未達到 Claude Code 對於程式設計師那樣的變革性工具水準。但還有一種介面經歷了爆炸性成長，那就是個人代理。如果你沒聽過，OpenClaw 是一個開源 AI 代理，其標誌是一隻紅龍蝦，它是一個資安夢魘，並且已成為史上成長最快的開源專案。OpenClaw 如此成功，因為它是一個真正的個人代理。該系統的設計宗旨是讓你能夠透過 WhatsApp、Telegram 或 Slack 等你用來傳訊息給人們的應用程式與你的 AI 代理對話。你告訴它檢查你的電子郵件、預訂餐桌、尋找檔案，它就會在你的電腦上執行這些任務。它以一種事後看來顯而易見的方式解決了介面問題：它不是聊天機器人或命令列，而是讓你像與人交談一樣與 AI 對話，使用 WhatsApp 等已經非常熟悉的介面。然而，OpenClaw 難以使用且存在許多資安風險。Anthropic 的解決方案是結合 Dispatch 的 Claude Cowork。Cowork 於一月推出，是專為知識工作者設計的 Claude Code 版本。它讓 Claude 透過桌面工作區存取你的本地檔案和應用程式。它還透過連接器連接數十個應用程式，當沒有連接器時，它會直接控制你的滑鼠和鍵盤。Dispatch 在過去幾週推出，增加了關鍵功能：你可以在手機上向 Claude 發送訊息，而它則在你的桌上型電腦上工作。你掃描一個 QR code，你的手機就成了你電腦上 AI 代理的遠端遙控器。結合 Dispatch 和 Claude Code 創造了一個感覺就像與一位能幹的助理對話的介面。例如，我從手機上要求 Claude 準備一份晨間簡報，它會從我的行事曆、電子郵件和線上頻道讀取資訊，然後給我一份關於我接下來需要做什麼的報告。但 Cowork 也能處理更複雜的工作。我從手機上要求它查看我最近製作的一份簡報，看看投影片 3 中的圖表是否為最新，如果不是，就更新它。你可以看到它在某處稍微卡住了（一個網站阻止它下載檔案），但除此之外，結果非常令人印象深刻。它打開並「查看」了 PowerPoint，並檢查了我整個電腦以尋找最新的數據。當我給它一個指向更新線上論文的連結時，它下載了 PDF，找到了新的圖表，剪輯出圖表圖像，並為我更新了 PowerPoint。這是一項複雜且精細的工作，即使不總是無縫銜接，通常也足夠節省大量時間。這有 OpenClaw 那麼靈活嗎？沒有。Cowork 採用沙盒化設計，更安全但也更受限（但這不代表沒有資安風險）。連接器生態系正在成長，但尚未完善。而 Cowork 可以使用你的電腦這個概念令人印象深刻，但在實踐中容易出錯。但核心洞察與 OpenClaw 無意中發現的相同。人們不想要聊天機器人。他們想要一個能夠處理他們實際檔案、使用他們實際工具，並以他們與人交談的方式存取的代理。所有這些都假設我們需要預先決定介面。但最新的 AI 系統實際上可以為你建立介面。例如，在過去幾週，Claude 獲得了直接在對話中生成視覺化圖表的能力。這些不是靜態圖片。它們是互動式、可調整的，而且 Claude 可以根據你的後續問題進行修改。這是解決介面問題的另一種方法。AI 不再讓公司為每種工作建立專用介面，而是即時生成合適的介面。我猜想未來不會是「一個介面統治一切」。而是 AI 能為當下生成合適的介面，可能是你桌面上的代理、對話中的圖表，或解決問題的客製化應用程式。我們正在從適應 AI 的介面轉變為 AI 適應你的介面。AI 能力一直超前於 AI 的易用性。模型早已足夠聰明，能夠完成非凡的事情，但我們一直讓使用者透過聊天機器人來存取這些智慧。正如認知負荷研究所示，聊天機器人格式實際上正在阻礙使用者。隨著介面改進，我們將看到當更多人能夠真正運用 AI 的能力時會發生什麼。每個彌補部分差距的新介面都將感覺像是 AI 能力的一次飛躍，即使模型本身沒有改變（儘管它們仍在變化）。我猜測，人們有時表達的許多「對 AI 的失望」並非來自 AI 不好，而是來自介面不對。我們創造了近代史上最強大的技術之一，然後卻讓使用者透過在聊天視窗中打字來存取它。這很快就會改變。

AI 介面進化論：Claude Dispatch 如何釋放 AI 潛力