歡迎來到 Import AI,一份關於 AI 研究的電子報。Import AI 的運作仰賴 arXiv、咖啡和讀者的回饋。如果您想支持我們,請訂閱。

**美國 AI 經濟每年成長 2,000%:**_…你越直接衡量 AI 經濟,它就顯得越奇特、越前所未有…_ 維吉尼亞大學*、Anthropic 和加拿大銀行的經濟學家共同撰寫了一篇論文,闡述了美國新興「AI 經濟」的巨大成長,並探討為何這種成長難以在總體 GDP 統計中顯現。

他們寫道:「美國的 AI 經濟正以史無前例的速度成長,但這種非凡的成長在傳統 GDP 統計中幾乎是隱形的。」「將 AI 產業視為一個連貫的經濟實體,初步估計 2025 年名目 AI GDP 約為 2,500 億美元,以品質調整後的實質價值計算,每年約成長 2,600%。」

**為何難以察覺:**這有幾個因素——其一是儘管資料中心建設熱潮規模龐大,但仍不足以顯著提升 GDP。相比之下,AI 經濟影響的大部分發生在 AI 推論(即 AI 系統的使用)方面,但這與 GDP 衡量有關的混淆因素:他們寫道:「名目 AI 收入僅適度成長,因為在任何給定 AI 能力水準下,單位價格的下降速度幾乎與品質調整後產出的上升速度一樣快。」

**如果無法衡量,我們可能會面臨難以挽回的意外:**他們寫道:「AI 是一系列快速發展技術中最新一個引發衡量疑慮的;半導體和網際網路在當時也引發了類似的爭論。」但一個關鍵區別是,AI 作為一項技術,對勞動力的影響可能遠大於這些其他技術。他們寫道:「在之前的案例中,快速改進的技術在總體層面上是人類勞動力的_補充_。」

「AI 是第一個可能導致大規模技術衡量錯誤的候選者,其中快速發展的產業可能成為人類勞動力的_替代品_。」

**衡量 AI 經濟的三種方式:**

* **名目運算支出:**美國的運算支出從 2023 年的 370 億美元增至 2024 年的 900 億美元,再到 2025 年的 2,190 億美元。

* **原始運算能力:**由於新晶片的效率提升,實際運算能力的成長速度甚至快於支出:「美國 AI 運算能力每年成長超過 200%。」

* **品質調整後的 AI 產出:**如果將透過固定基準性能的推論價格所實現的演算法進步,以及訓練模型成本降低的假設納入考量,情況會變得更加戲劇化:「這些效率提升意味著品質調整後的 AI 產出在 2024 年約成長 2,290%,2025 年約成長 2,271%。」

**AI 經濟遠比傳統衡量方式所顯示的要龐大得多:**「傳統統計數據顯示一個名目上緩慢成長的產業;而我們的衡量方式則顯示其潛在能力每年成長超過一倍。財政部若根據傳統數據進行十年收入預測,將會嚴重低估勞動稅基衝擊的可能性——並因此無法準備好設計應對措施,例如稅制改革、主權財富基金或其他此類衝擊可能需要的利益共享計畫。看不見的意外之財無法共享。」

**三項建議:**作者提出了三種解決此衡量挑戰並更好地掌握 AI 經濟真實面貌的方法。

* **AI 衛星帳戶:**統計機構應開發「AI 衛星帳戶」,制定衡量標準(例如名目運算支出),以協助整體 GDP 計算。

* **產生更好的數據:**統計機構、企業和學術界應合作產生更好的原始數據,例如訓練和推論運算之間的分配。

* **納入預測:**政策制定者應將 AI 生產能力衡量納入其中期經濟預測。

**為何這很重要——閉嘴,播放《大白鯊》主題曲:**在經典電影《大白鯊》中,有一個場景是鯊魚在水中,伴隨著緊張的音樂預示著鯊魚正在靠近。作為觀眾的你,會發現自己幾乎要從座位上跳起來,想大喊「水裡有條該死的鯊魚,你們在幹什麼?」這就是現在從事 AI 工作並審視大多數經濟數據的感受:絕大多數經濟數據顯示當今經濟沒有什麼特別不尋常之處(事實上,美國的情況看起來相當不錯——低失業率、不錯的成長等)。

但包括我在內,所有在 AI 領域工作的人的直覺是,這項技術的能力及其使用方式與經濟保持正常狀態是無法調和的。在這個牽強的比喻中,鯊魚是「AI 經濟的真實面貌」,而電影中的其他人則是普遍共識的經濟學家和政策界。這裡的 Anton 可能就是那位觀眾,撰寫了一篇描述水面下可能存在鯊魚的論文。大家小心了!

**延伸閱讀:**[AI 在 GDP 統計中何去何從?(PIIE)](https://www.piie.com/publications/policy-briefs/2026/where-ai-gdp-statistics)。

*免責聲明:儘管其中一位作者 Anton Korinek 與 Anthropic 有關聯,但這項研究主要是在他加入該公司之前完成的,且與他在該公司的工作無關。

***

**為何透過 AI 監管來確保 AI 安全比你想像的更困難:**_…自動化對齊研究並非萬靈丹…_ 許多 AI 安全研究人員認為,安全地建立比人類更聰明的機器,最佳方式是讓 AI 系統監督部分訓練過程。英國 AI 安全研究所的研究人員撰寫了一篇論文,闡述了為何儘管這是一個誘人的想法,但它比人們想像的更困難。

**為何自動化對齊研究很困難?**他們寫道:「自動化對齊研究中的錯誤可能比人類基準更難以識別。」這有幾個原因,包括:

* **最佳化壓力:**AI 研究是為了獲得人類認可而最佳化的。

* **異類錯誤:**當代理犯錯時,對人類來說是不直觀的。

* **更多相關研究:**與人類生成的研究相比,自動化研究共享的內容更多。

* **研究量:**自動化系統所做的安全判斷可能使用遠多於人類生成研究的證據集和互動。

* **人類無法評估的論證:**對齊解決方案可能依賴於人類無法理解的論證。

**我們能做什麼?**他們提出了一些可以改善現狀的干預措施:

* **衡量:**

* **重現已完成的研究專案:**從成功的專案中任意截取日誌,並評估代理在繼續研究專案方面的表現。

* **測試代理在相關事件資料集上的預測性能:**評估代理正確組合相關子任務的能力。

* **人類與代理最佳團隊結構的實證研究:**評估非專業人類團隊在代理協助下解決已完成專案的表現。

* **泛化:**

* **模擬泛化實驗:**使用代理在知識截止點之外的已完成研究問題上的表現,測試不同的訓練代理。

* **泛化的機制理解:**使用白箱方法,例如機制可解釋性。

* **可擴展的監管:**

* **研究論文語料庫的壓縮:**嘗試產生少量基於更大潛在研究語料庫的研究成果。

* **開發和測試新的可擴展監管協議:**研究處理相關不確定性的可擴展監管技術。

* **測試不同的人類支架:**用於提升非專業人士在模糊任務上的表現。

* **紅隊自動化對齊計畫:**「紅隊提示代理在研究論文語料庫中隱藏錯誤,藍隊則嘗試在代理協助下找出這些錯誤。」

**為何這很重要——誰來掌控未來?**我們是否能夠監督比人類更聰明的系統,本質上是關於誰來掌控未來的問題。如果我們無法建立有效的技術,那麼人類將退居次要地位,這可能是由於這些系統的未對齊,或是隨著它們超越我們的思考能力而逐漸被剝奪權力。如果我們能夠建立比人類更聰明的監管技術,那麼我們就有更好的機會能夠對未來存在的本質做出選擇。

**延伸閱讀:**[自動化對齊比你想像的更困難 (arXiv)](https://arxiv.org/abs/2605.06390)。

***

**一億張開放授權圖像:**_…對學術界和新創公司來說是個不錯的資源…_ 史丹佛大學、Radical Numerics、密西根大學和 Salesforce Research 的研究人員發布了 Giant Permissive Image Corpus (GPIC),這是一個包含 1 億張圖像及相關說明文字的資料集。

GPIC 的關鍵在於「所有 GPIC 圖像都獲得了研究和商業使用的開放授權」,他們寫道。「GPIC 經過安全過濾、去重複化,並集中託管在 HuggingFace 上。」

**資料集更多細節:**GPIC 包含 1 億張訓練圖像、20 萬張驗證圖像和 100 萬張測試範例。每張圖像都使用 Qwen3-VL-4B 進行了說明文字生成。他們寫道:「GPIC 以 8,000 個分片的形式集中託管在 Hugging Face 上,為大規模訓練提供了穩定且易於存取的基礎設施。」

「我們從 Flickr 和 Wikimedia 獲取圖像,將來源限制在 CC BY、CC0、公共領域和無已知限制的類別。此授權標準確保 GPIC 可供學術和工業研究人員使用,而不會限制衍生作品的發布或下游使用。」

**為何這很重要——研究的燃料:**像 GPIC 這樣的資料集對學術界和新創公司都非常有用,基本上等同於免費、乾淨的蔬菜。如果有人提供你免費、乾淨的蔬菜,你應該接受並說聲謝謝。

**閱讀研究論文:**[GPIC:用於視覺生成的大型開放圖像語料庫 (arXiv)](https://arxiv.org/abs/2605.30341)。

**在網站上了解更多:**[GPIC:用於視覺生成的大型開放圖像語料庫 (官方專案網站)。](https://gpic.stanford.edu/)

**在此獲取資料集:**[GPIC (Hugging Face)](https://huggingface.co/datasets/stanford-vision-lab/gpic)。

***

**透過蛋白質預測模型改進癌症研究:**_…Biohub 是 AI 開發者之間正和競爭的一個例子…_ 由 Priscilla Chan 和 Mark Zuckerberg 創立的研究機構 Biohub,發布了一個與 DeepMind 的 AlphaFold 競爭的模型,加劇了兩個科技集團之間的正和競爭,旨在開發更好的 AI 系統,以擴展全球生物學家的能力。

該模型 ESMFold2 是一個「蛋白質生物學的世界模型:一個用於預測、設計和發現的科學引擎,能夠繪製生命之樹上的蛋白質、預測其結構,並設計在實驗室實驗中發揮作用的新型蛋白質結合劑。」

**其組成:**這次發布包含三個部分:

* **ESMC:**一個「代表蛋白質的語言模型,在來自所有生命約 28 億個序列上進行訓練。」

* **ESMFold2:**一個「旨在轉換 ESMC 序列的設計引擎」