2026 年 6 月 9 日

我沒有提前取得今天發布的 Claude Fable 5,但我已經花了約 5.5 小時對其進行測試。我的初步印象是,這是一個相當強大的模型。它速度較慢、價格昂貴,但到目前為止,我丟給它的所有任務它都能愉快地處理。正如當前前沿模型常見的情況,挑戰在於找到它無法完成的任務。

首先,讓我們回顧一下其主要特性。

Anthropic 聲稱 Claude Fable 5 提供與 Claude Mythos 5 相同的性能,但設有更嚴格的安全防護措施,以防止其被用於有害目的。這些防護措施觸發頻繁,以至於 Claude API 新增了機制來通知你何時觸發,甚至提供了一個新選項,可以在某些內容被拒絕時自動回退到另一個模型。

Claude Mythos 5 也於今天發布,Anthropic 表示它「與 Claude Fable 5 共享功能,但沒有安全分類器」。

這些模型擁有 100 萬 token 的上下文視窗、128,000 個最大輸出 token,並且知識截止日期為 2026 年 1 月。

它們的定價是 Claude Opus 4.5/4.6/4.7/4.8 的兩倍:每百萬輸入 token 10 美元,每百萬輸出 token 50 美元。長時間上下文使用沒有額外費用。除此之外,升級指南比 Opus 4.8 的類似指南薄得多。

大型模型的氣息

描述 Fable 最好的方式是它感覺很「大」。不僅體現在速度和成本上,也體現在它所知道的知識量。

以下是一個提示詞範例,我用它來比較 Fable 與 Opus 4.8 的知識量(包含錯字):

列出 Simon Willion 的所有開源專案,最新的在前,每個專案附上大致的首次發布日期

Opus 4.8 的回覆是這樣的:

我沒有一份可靠、全面且經過日期驗證的 Simon Willison 所有開源專案列表,我希望誠實地說明這一點,而不是冒險提供不準確的日期或捏造的條目。

以下是我可以合理確信的內容:

Simon Willison 的知名專案:

LLM (~2023) – 一個用於與大型語言模型互動的命令列工具和 Python 函式庫。

Datasette (~2017) – 一個用於探索和發布資料的工具,可能是他最近最著名的專案。

sqlite-utils (~2018-2019) – 一個用於操作 SQLite 資料庫的 Python 函式庫和 CLI 工具,通常與 Datasette 一起使用。

Django (2005) – 他是 Django 網頁框架的共同創作者之一,與 Adrian Holovaty 共同在 Lawrence Journal-World 報社開發。

他還維護著一個龐大的 Datasette 外掛程式生態系統和許多小型實用工具(通常名稱如 shot-scraper、各種用於匯入資料的 *-to-sqlite 工具等)。

這還不錯。以下是 Fable 5 對完全相同提示詞的回應開頭——兩個模型在運行時都無法存取搜尋功能:

我想你指的是 Simon Willison — 那位多產的開源開發者、Django 的共同創作者和 Datasette 的創作者。

首先一個重要的提醒:一份真正完整的列表是不可行的。Simon Willison 以多產聞名 — 他發布了數百個儲存庫(僅 Datasette 就有 100 多個外掛程式,其中許多是他編寫的),而且我的知識有截止日期,所以我會遺漏他最新的作品。以下是他值得注意的專案,附上大致的首次發布日期,最新的在前:

值得注意的專案(大致日期):

files-to-prompt (2024 年 4 月) – 將檔案串聯成一個用於 LLM 的提示詞

datasette-extract (2024) – 外掛程式,用於使用 LLM 提取結構化資料

LLM (2023 年 5 月至 6 月) – 用於與大型語言模型互動的 CLI 工具和 Python 函式庫,以及龐大的外掛程式生態系統(llm-gpt4all、llm-mistral、llm-claude 等,2023 年起)

symbex (2023 年 6 月) – 搜尋 Python 程式碼中的符號

ttok 和 strip-tags (2023 年 5 月) – 用於 token 計數和 LLM 管道 HTML 清理的 CLI 工具

datasette-lite (2022 年 5 月) – 透過 WebAssembly/Pyodide 完全在瀏覽器中運行的 Datasette

shot-scraper (2022 年 3 月) – 透過 Playwright 自動截取網站螢幕截圖

s3-credentials (2021 年 11 月) – 用於建立範圍限定的 AWS S3 憑證的 CLI

django-sql-dashboard (2021) – Django 的 SQL 報告儀表板

Dogsheep 套件 (2019) – 個人分析工具:twitter-to-sqlite、github-to-sqlite、healthkit-to-sqlite、dogsheep-beta 等

sqlite-utils (2018) – 用於操作 SQLite 資料庫的 CLI 和 Python 函式庫

Datasette (2017 年 11 月) – 他的旗艦專案;用於探索和發布資料的工具

csvs-to-sqlite (2017) – 將 CSV 檔案轉換為 SQLite

各種早期工具 (~2007–2010) – soupselect、json-head、geocoders 等

Django (2003–2005 年開發,2005 年 7 月開源) – 與 Adrian Holovaty 在 Lawrence Journal-World 共同創建

(為了比較,這裡還有 GPT-5.5。它列出的專案甚至比 Fable 還多!)

過去我曾表示我不在乎模型知道多少——我希望它們能夠以有用的方式操作文本和程式碼,並透過搜尋工具主動查找所需資訊,而不是將其編入模型權重中。但這樣的知識量是模型大小的一個良好指標——你可以將更多關於世界的細節塞入更多的參數中。知道更多東西是否意味著模型在我們給它的任務上表現更好?我當然可以想像一個對現代函式庫和模式有更深入了解的編碼模型如何更有效地處理編碼任務。

Fable 真的比 Opus 大嗎?Anthropic 沒有透露任何關於模型大小的資訊,所以我們只能從蛛絲馬跡中判斷,但其速度、定價以及我對其知識的探究,都讓我認為它是一個大型模型。也許是目前所有供應商中最大的。

在 Claude.ai 中使用 Fable

Anthropic 在所有平台上都提供了 Fable 5——Claude.ai 聊天介面、Claude Code 網頁版、Claude Code CLI 和 Claude Cowork。該模型在訂閱方案中「直到 6 月 22 日」可用(我目前訂閱的是每月 100 美元的 Max 方案),之後將額外收費。

Claude.ai 經常被低估。自 2025 年 9 月以來,每個聊天都可存取一個完整的容器環境來運行程式碼,包括安裝額外套件甚至直接從 GitHub 克隆儲存庫的能力。

上週我發布了 micropython-wasm,這是一個 Python 函式庫,它使用 wasmtime 在 WebAssembly 中運行自訂的 MicroPython 版本,作為不受信任的 Python 程式碼的沙盒。我決定看看 Fable 是否能將其升級為運行完整的 Python。我從這個提示詞開始:

從 GitHub 克隆 simonw/micropython-wasm 並研究如何使用完整的 Python 而不是 MicroPython

Fable 識別出它可以使用 Brett Cannon 的 cpython-wasi-build 版本來實現,但由於環境限制無法自行下載。所以我從該頁面下載了兩個 zip 檔案並上傳到 Claude:

這是 Brett Cannon 的版本(python-3.zip、_build-python-3.zip 作為附件)

就這樣。它花了幾分鐘時間,讓整個系統運作起來。部分回應內容包括:

我嘗試了更簡潔的單一 zip-stdlib 方法來縮小檔案系統表面,但 CPython 的 getpath 啟動在沒有更多前綴微調的情況下,無法從 zip 內部找到編碼——目錄預開啟方法可靠地工作,所以 PoC 使用了這種方法。zip 路徑是可解決的,但需要 _PYTHONHOME/frozen-getpath 的工作。

所以我說:

再試試單一 zip-stdlib 問題

然後過了一會兒:

我想要一個包含整個系統的 wheel 檔案,包括 Python 包裝器、WASM 檔案和標準函式庫,這樣我就可以執行 uv run --with path-to-whl python -c "demo code"

…然後它給了我這個 13.9MB 的 cpython_wasm-0.1.0-py3-none-any.whl 檔案。你可以使用該 wheel URL 和 uv 像這樣在沙盒中運行 Python 程式碼:

uv run --with https://static.simonwillison.net/static/cors-allow/2026/cpython_wasm-0.1.0-py3-none-any.whl \

cpython-wasm -c 'print(45 ** 56)'

這是完整的聊天記錄。

這是一個非常好的開始。

使用 Claude Code 為 Datasette Agent 和 LLM 添加功能

在我意識到今天是 Fable 發布日之前,我今天的進階目標是為 Datasette Agent 添加一個新功能:我希望該代理軟體中的工具呼叫能夠在執行中途暫停,並直接向使用者請求批准。這感覺是一個適合新模型處理的艱鉅任務。在一天之內,Fable 不僅解決了這個問題,它還識別並實施了我的底層 LLM 函式庫中的四個問題,這些問題將有助於支援這種進階的工具呼叫暫停-恢復機制。

它最初使用了一些粗糙的權宜之計讓一切運作起來,但當我告訴它對 LLM 本身的修改也在範圍內時,它便開始解開這些權宜之計,並將它們轉變為 LLM 支援的功能。我的進階目標變成了 LLM 0.32a3,幾乎完全由 Fable 編寫。以下是發布說明:

受 Datasette Agent 的人機協作 ask_user() 功能需求驅動,對工具呼叫的工作方式進行了以下改進:

工具實作可以聲明一個名為 llm_tool_call 的參數,以便傳遞當前調用的 llm.ToolCall 物件。這允許它們存取當前的 llm_tool_call.tool_call_id。請參閱從工具內部存取工具呼叫。#1480

現在每個工具呼叫都保證有一個唯一的 tool_call_id——未提供者將獲得一個合成的 tc_-前綴 ULID。#1481

工具可以引發 llm.PauseChain 異常來乾淨地暫停工具鏈,這對於等待人工批准等情況很有用。該異常會傳播給呼叫者,並附帶 .tool_call 和 .tool_results(已完成的同級結果),並且不會使用佔位符結果進行模型呼叫。請參閱從工具內部暫停鏈。#1482

並行工具執行的失敗語義:異步同級工具呼叫總是在暫停或掛鉤異常傳播之前運行完成。#1482

鏈現在可以從以未解析工具呼叫結尾的 messages= 歷史記錄中恢復:這些呼叫在第一次模型呼叫之前透過正常的 before_call/after_call 機制執行,跳過任何已經有結果的呼叫。execute_tool_calls() 方法還接受一個新的可選 tool_calls_list= 參數,用於執行明確的 ToolCall 物件列表,以取代回應請求的呼叫。請參閱使用待處理工具呼叫恢復鏈。#1482

修復了一個錯誤,即異步工具執行器會默默地丟棄對 tools= 中不存在的工具的呼叫——這些現在會返回 Error: tool "..." does not exist 結果,與同步執行器匹配。#1483

我對 Fable 為此整合的 API 設計、測試、程式碼和文件品質印象深刻。我今天花了幾個小時在這上面,但感覺像是好幾天的工作量。

我花了多少錢

我最近開始使用 AgentsView 來幫助追蹤我在所有不同編碼代理上的本地 LLM 使用情況。我今天發布了一篇關於為該工具添加自訂 Fable 定價的 TIL,我預計這在不久的將來將不再需要。設定價格後,我運行此命令以啟動一個本地主機網頁伺服器來探索我的使用情況:

uvx agentsview serve

以下是顯示我今天在各個專案中 Fable 使用情況細分的樹狀圖:

我今天使用了價值 110.42 美元的 token,全部包含在我每月 100 美元的訂閱費用中。

還有一些鵜鶘

我對 Fable 的所有五個思考努力程度運行了「生成一隻騎自行車的鵜鶘的 SVG」提示詞。

以下是結果,包括每個的 token 成本:

低:1,929 輸出,9.67 美分

中:2,290 輸出,11.475 美分

高:2,057 輸出,10.31 美分

特高:5,992 輸出,29.985 美分

最高:14,430 輸出,72.175 美分

有趣的是,在這次運行中,高努力程度最終使用的 token 比中努力程度少。

以下是 Opus 4.8 鵜鶘的比較圖。