縮短你跟全球 AI 動態的資訊差
全天候自動抓取數十個英文 AI 新聞媒體與 AI 實驗室官方部落格,AI 翻譯成繁體中文。 產品發布、研究突破、商業動態、技術觀點,附原文出處與配圖。
AI Utopia — 一群認真在用 AI 賺錢的人
- · 哪些 AI 工具真的能用、哪些只是炒作(實測筆記)
- · 用 AI 把行銷/業務跑得更有效率的真實案例
- · 不在主流媒體的內部討論與一手資訊
- · 直接跟同樣在做的人聊,少走很多冤枉路
@maxstudio.biz
- · 每週精選 AI 工具實測 + 評分
- · 行銷自動化 / IG 經營 AI 工作流
- · 短影音實作教學 + 模板下載
- · 一手新工具搶先試用心得

Siri AI 實測:Apple 智慧助理的蛻變與進化
Apple 全新 Siri AI 語音助理在 iOS 27 中迎來重大革新,變得更具對話性、個人化且能與應用程式深度整合。作者在舊金山實測發現,Siri AI 透過 Google Gemini 和 Apple Intelligence 的加持,提供更精準的回覆與自動化功能,大幅提升實用性。儘管仍處於測試階段,新版 Siri 展現出 Apple 對於智慧助理的全新願景。
CNBC Tech產品·高通執行長預見 AI 代理人新時代:智慧裝置將圍繞 AI 代理人運作
高通執行長 Cristiano Amon 描繪了 AI 代理人將如何改變我們與科技互動的方式,預計未來的智慧裝置將以 AI 代理人為核心。他認為傳統應用程式將轉變,由 AI 代理人協調多個服務,並預期智慧眼鏡等穿戴式 AI 裝置將成為主流。
MIT Technology Review AI產品·新創公司Subquadratic聲稱突破大型語言模型瓶頸
AI 新創公司 Subquadratic 宣布其新型大型語言模型 SubQ,透過解決困擾產業近十年的數學瓶頸,實現了更快的速度、更低的成本和更高的能源效率。儘管初期受到質疑,但獨立機構 Appen 的評估結果支持了 SubQ 在處理大量文本和程式碼方面的卓越性能。該公司預期這項技術將徹底改變大型語言模型的架構,擺脫對 Transformer 的依賴。
OpenAI Blog產品·企業版 ChatGPT 推出全新用量分析與支出控管功能
OpenAI 為 ChatGPT Enterprise 推出新的信用額度用量分析與更新的支出控管功能。這些工具旨在幫助企業更有效地追蹤 AI 使用情況、了解採用模式,並做出更明智的部署決策。透過更清晰的能見度與彈性控制,企業能主動管理成本,確保 AI 投資聚焦於關鍵業務。
NVIDIA Blog產品·輝達夥伴於坎城國際創意節展示AI如何重塑廣告與行銷產業
數位時代為廣告行銷業帶來速度,而AI時代則賦予其自主營運能力。在坎城國際創意節上,輝達的合作夥伴展示了如何利用輝達技術,在企業規模下釋放更大的創意並實現更快速、自主的營運。這些應用涵蓋了因果AI、智慧競價、代理式AI及內容理解等領域,全面革新廣告行銷工作流程。
The Verge AI產品·Adobe Creative Cloud 導入 AI 助理,Photoshop、Premiere 等應用全面升級
Adobe 正全面將 AI 助理整合至 Creative Cloud 套件,Photoshop、Premiere、Illustrator、InDesign 和 Frame.io 等核心應用程式現已推出公開測試版。這些由 Adobe「對話式創意代理」驅動的 AI 助理,能透過自然語言提示詞,協助用戶整理專案並自動執行應用程式內的特定任務,大幅提升工作效率。
The Verge AI產品·Adobe Firefly AI 工作室全新改版,智慧記憶創作資產提升設計一致性
Adobe 為其 Firefly AI 助理推出多項新功能,並同步發表「重新構想」的 AI 工作室,讓使用者能在單一介面中編輯與生成新設計。新版 Firefly 體驗強調「持續性上下文、可重複使用資產與有組織的工作流程」,旨在提升設計一致性並簡化專案管理。透過「元素」與「專案」功能,使用者可儲存並重複利用創作資產,並將所有相關內容集中管理,大幅提高工作效率。
OpenAI Blog產品·ChatGPT 健康資訊處理能力再升級
ChatGPT 每週吸引超過 2.3 億用戶尋求健康相關協助。OpenAI 透過 GPT-5.5 Instant 大幅提升了其健康資訊處理能力,使其在辨識緊急情況、解釋不確定性及簡化複雜資訊方面表現卓越。這些進步是模型能力提升與全球醫師團隊協作評估的成果,確保回應的準確性、可理解性與判斷力。
Latent Space產品·Midjourney 進軍醫療影像:發表全身超音波斷層掃描器與健康水療中心
Midjourney 宣布推出一項雄心勃勃的醫療影像計畫,包含全身超音波斷層掃描器(Midjourney Scanner)和健康水療中心(Midjourney Spa)。該掃描器被譽為 50 年來首個全新的全身醫學影像模式,旨在提供快速、便宜且非侵入性的身體掃描。儘管目前原型機尚未直接使用 AI,但其長期目標是整合 AI 進行分析,並將全身影像檢查普及化,作為未來 AI 醫療的基礎設施。
The Verge AI產品·Midjourney 轉型:從 AI 圖像生成到全身超音波掃描儀
Midjourney 執行長 David Holz 近日展示了公司首款硬體產品「Midjourney 掃描儀」,這是一款全身超音波掃描儀。該掃描儀旨在提供媲美 MRI 的影像品質,並計畫在舊金山開設結合掃描服務的健康水療中心。此舉標誌著 Midjourney 從 AI 圖像生成領域,拓展至預防性健康掃描服務。
TechCrunch AI產品·Pinterest 推出實驗性 AI 購物應用程式「Ask Pinterest」並強化廣告工具
Pinterest 發表實驗性 AI 購物應用程式「Ask Pinterest」,旨在透過對話式介面提供更個人化的購物推薦與靈感。此應用程式利用其「Taste Graph」數據,讓使用者能以自然語言提問,並能整合個人儲存的 Pin 圖與看板。同時,Pinterest 也推出多項針對廣告商的 AI 創新,包括新的 AI 廣告模型和工具,以提升廣告成效與管理效率。
Hugging Face Blog產品·GLM-5.2 模型登場:百萬級上下文,專為長任務打造
我們隆重推出 GLM-5.2,這是我們專為長任務設計的最新旗艦模型。它首次實現了穩定可靠的百萬級(1M)上下文處理能力,並在多個長任務程式碼基準測試中展現出領先的開源模型表現。GLM-5.2 採用 MIT 開源許可證,提供更強大的程式碼生成能力和創新的架構改進。
OpenAI Blog產品·OpenAI 推出 LifeSciBench:提升 AI 在生命科學研究的評估標準
代理式 AI 系統在執行科學任務方面的能力日益增強,但現有基準未能充分捕捉真實研究的複雜性。為彌補這一差距,OpenAI 推出 LifeSciBench,這是一個由博士級生命科學家設計的基準測試,旨在評估 AI 系統在實際研究情境中的表現。LifeSciBench 包含 750 個專家編寫的任務,涵蓋七種工作流程和七個生物學領域,確保 AI 能在更廣泛的研究級工作中發揮作用。
Hugging Face Blog產品·代理資源探索 (ARD):賦予 AI 代理自主搜尋能力
代理資源探索 (ARD) 是一項開放規範,旨在解決 AI 代理在尋找工具、技能和其他代理時的挑戰。它允許代理在運行時動態發現所需功能,而非依賴預先安裝或手動配置。Hugging Face 已透過其 Discover Tool 實作 ARD,提供一個可搜尋數千種 AI 應用和服務的參考平台。
NVIDIA Blog產品·NVIDIA XR AI 公測登場,為 AR 眼鏡帶來免手持 AI 代理
NVIDIA XR AI 現已推出公開測試版,為開發者提供了一個框架,用於為 AR 眼鏡和 XR 裝置建構多模態 AI 代理。這些代理能感知、理解環境並即時行動,將 AI 從聊天機器人帶入實體世界。它簡化了空間感知、多模態 AI 代理的開發,為製造、醫療、科學等領域提供低延遲、情境感知的智慧輔助。
Google DeepMind產品·Google DeepMind 攜手英國政府,運用 AI 加速規劃審批,助房屋建設提速
Google DeepMind 正與英國政府合作,開發一款由 Gemini 驅動的 AI 規劃工具原型,旨在將住戶規劃申請的審批時間縮短一半。這項創新將協助規劃人員處理繁瑣的行政工作,加速英國的房屋建設目標,同時確保人類決策者仍保有最終控制權。
TechCrunch AI產品·Android 17 正式登場,Google 強化 Gemini AI 體驗與多項新功能
Google 正式推出 Android 17 作業系統與 Wear OS 7,並透過 Pixel Drop 為其 Pixel 裝置帶來一系列新功能。其中包含對 Lyria 3 音樂生成模型、Gemini Omni 多模態模型以及 AudioLM 語音翻譯工具的支援,展現 Google 將 AI 深度整合至其裝置的策略。新版系統也加入了多工處理、安全防護及摺疊裝置優化等多項非 AI 功能。
Google Research產品·Google Earth AI 深度學習框架:從像素到自然復育規劃
Google Research 開發了一個高解析度深度學習框架,能夠識別傳統衛星偵測通常無法看見的細微生態特徵,例如樹籬和小型林地。這項技術將像素資料轉化為精確的向量資料集,為土地所有者和保育人士提供實用工具,以應對氣候變遷和生物多樣性危機,同時不影響糧食安全。透過公開這些數據,Google 旨在賦能各界,共同保護對地球至關重要的微小生態特徵。
The Verge AI產品·蘋果 2027 年硬體傳聞:AI 攝影 AirPods 與第二代摺疊 iPhone
彭博記者 Mark Gurman 揭露蘋果 2027 年的硬體傳聞,包括搭載攝影鏡頭的 AirPods,預計將為 Siri 提供視覺情境,並為未來的智慧眼鏡鋪路。此外,蘋果也計劃推出第二代摺疊 iPhone,顯示其對此產品類別的投入,同時也將持續優化晶片技術以應對 AI 普及的趨勢。
The Verge AI產品·高通新晶片預示更強大智慧眼鏡即將問世
高通發表了專為 XR 裝置設計的 Snapdragon Reality Elite 晶片,大幅提升了 GPU、CPU 和 NPU 效能,並改善了電池續航與散熱。這款新晶片將為未來的智慧眼鏡帶來更沉浸的視覺體驗、更強大的 AI 功能(支援大型 LLM),並解決目前裝置面臨的設計與續航挑戰。此舉預示著裝置製造商正積極將更多 AI 整合到穿戴裝置中。
NVIDIA Blog產品·HPE AI Factory 攜手 NVIDIA 擴展,迎接代理式 AI 時代
HPE 與 NVIDIA 共同擴展 HPE AI Factory,推出專為代理式 AI 設計的 NVIDIA Vera CPU 與 NVIDIA Agent Toolkit。此次升級還包括將 NVIDIA Confidential Computing 整合至全系列產品,並強化了 NVIDIA 加速運算、AI 軟體和網路的全面整合。這些新功能旨在協助企業將代理式 AI 從概念驗證階段推向實際生產,並確保資料安全與高效運作。
NVIDIA Blog產品·NVIDIA Blackwell 平台橫掃 MLPerf Training 6.0:最快、最大、最強
NVIDIA Blackwell 平台在最新的 MLPerf Training 6.0 基準測試中,於所有類別中均取得領先。它展現了最快的訓練時間、最大的訓練規模(使用 8,192 個 GPU),並且是唯一提交所有七項基準測試結果的平台。這證明了 Blackwell 在加速 AI 模型開發、降低訓練成本和提升可靠性方面的卓越能力。
Ars Technica AI產品·Microsoft Copilot 驚傳嚴重漏洞,駭客可竊取雙重驗證碼與敏感資料
研究人員發現 Microsoft Copilot 存在一項關鍵漏洞,駭客可利用「參數轉提示詞注入」手法,誘騙 Copilot 洩露使用者的敏感資訊。此攻擊被命名為「SearchLeak」,能竊取雙重驗證碼、電子郵件及企業文件等資料。儘管 Microsoft 已修復此漏洞,但這類提示詞注入攻擊的根本問題仍難以徹底解決。
TechCrunch AI產品·Meta 為 Facebook 導入 AI 模式,強化搜尋與內容創作體驗
Meta 正於 Facebook 推出一系列新的 AI 功能,旨在革新用戶尋找資訊、創作內容及平台互動方式。核心更新為「AI 模式」,利用 Meta AI 整合 Facebook 公開貼文提供綜合性搜尋答案。此外,平台也新增 AI 編輯工具、動畫個人檔案圖片及創作者 AI 助理,以提升用戶體驗並增加平台黏著度。
TechCrunch AI產品·衛星學會自主尋找目標:AI 賦能太空觀測新時代
史上首次,地球觀測衛星在軌道上成功自主辨識目標,無需地面分析師介入。這項里程碑是視覺語言模型(VLM)首次應用於太空,預示著 AI 將徹底改變太空感測器的能力與價值。未來有望大幅減輕地面數據處理負擔,並為大規模太空 AI 基礎設施鋪路。
The Verge AI產品·Apple iOS 27 AI 照片編輯新功能:實用性與潛在爭議
Apple 在 iOS 27 開發者測試版中推出了多項 AI 照片編輯功能,包括升級版的「清除」、可擴展照片邊緣的「延伸」以及模擬相機移動的「空間重構」。其中「清除」和「延伸」表現良好且謹慎,但「空間重構」則因可能產生不真實的內容,引發對照片真實性的疑慮。這些功能雖為 iPhone 帶來強大的編輯能力,但也凸顯了 AI 編輯工具在便利性與真實性之間取捨的挑戰。
NVIDIA Blog產品·NVIDIA Blackwell 平台在首個代理式 AI 基礎設施基準測試中表現卓越
AgentPerf 是業界首個代理式 AI 基準測試,旨在為開發者、企業和基礎設施供應商提供比較系統效能的清晰方法。在首輪公布的結果中,NVIDIA Blackwell Ultra NVL72 平台在測試的代理式 AI 工作負載中展現領先效能,每百萬瓦可運行比 NVIDIA Hopper 多 20 倍的代理。這項突破對於大規模部署代理式 AI 的企業至關重要,能有效評估基礎設施的生產力。
Hugging Face Blog產品·olmo-eval:大型語言模型開發的整合式評估工作台
olmo-eval 是一個專為大型語言模型(LLM)開發週期設計的評估工作台,它擴展了 OLMES 標準,旨在解決模型迭代過程中的評估挑戰。該平台提供更靈活的評估定義、簡化新評估的實作,並支援代理式和多輪評估。olmo-eval 透過詳細的分析工具,幫助開發者有效追蹤模型效能變化,並確保評估結果的可重現性。
OpenAI Blog產品·OpenAI Academy 推出新課程,助企業掌握 AI 時代工作技能
OpenAI Academy 推出三門新課程:AI Foundations、Applied AI Foundations 和 Agents and Workflows,旨在幫助組織建立 AI 流暢度。這些課程涵蓋從 AI 基礎知識到應用於可重複工作流程及代理程式輔助任務的實用技能。課程內容由 OpenAI 專家開發,並將隨著產品演進而更新,為企業提供與時俱進的 AI 學習標準。
TechCrunch AI產品·印度Avataar AI推Varya視訊模型:低成本、高效率,深耕在地文化
Avataar AI推出Varya視訊模型,專為印度市場設計,能理解在地文化脈絡。該模型基於阿里巴巴的Wan 2.2,經蒸餾優化後,運算速度提升10倍,成本大幅降低20倍,使其更適合印度大規模應用。Varya將作為開源模型發布,並提供企業客戶使用,以推動印度AI普及。
OpenAI Blog產品·Preply 如何結合 AI 與真人教師,打造個人化語言學習體驗
Preply 透過整合 OpenAI 的 AI 技術,推出「課程洞察」功能,強化其線上語言學習平台。這項功能分析課程內容,為學生提供個人化的文法、詞彙和發音回饋,同時大幅減少教師的行政工作。AI 不僅提升了學習成效與學生參與度,也優化了 Preply 內部的營運效率,實現以人為主導、AI 賦能的教學模式。
NVIDIA Blog產品·NVIDIA GeForce NOW 夏季特賣:會員方案超值優惠,暢玩遊戲無極限
NVIDIA GeForce NOW 推出夏季特賣,限時提供會員方案最高達 70 美元的折扣,讓玩家能以更優惠的價格升級,享受頂級雲端遊戲體驗。GeForce NOW 讓玩家無需昂貴硬體,即可立即暢玩遊戲,並持續新增遊戲內容,包括即將推出的《激戰3》。
IEEE Spectrum AI產品·DeepMind 衍生公司 Isomorphic Labs:AI 藥物設計引擎鎖定隱藏靶點
Google DeepMind 衍生公司 Isomorphic Labs 正透過人工智慧加速藥物開發,已與 Novartis 和 Eli Lilly 建立合作夥伴關係,並成功募資 21 億美元。該公司近期發布了 Isomorphic Drug Design Engine (IsoDDE) 技術報告,旨在精準識別蛋白質上的藥物結合位點,並預測蛋白質與藥物分子的交互作用。
The Verge AI產品·Anthropic 為 Claude Fable 隱藏式安全措施致歉
Anthropic 為其新 AI 模型 Claude Fable 5 設置隱藏式安全措施而道歉,這些措施在用戶不知情的情況下限制模型回應,特別是針對模型蒸餾技術。此舉引發 AI 研究社群的強烈反彈,批評其損害研究人員和競爭對手。Anthropic 現已承諾將改變做法,未來會更透明地揭露這些限制,並將相關查詢導向舊版模型 Claude Opus 4.8。
OpenAI Blog產品·OpenAI 收購 Ona,強化 Codex 雲端執行與代理能力
OpenAI 宣布收購 Ona,旨在將其安全的雲端執行與協調技術整合至快速擴展的 Codex 生態系統中。此次收購將使 Codex 能夠提供持久的 AI 代理工作環境,讓 AI 代理在雲端安全地執行複雜任務,即使使用者離線也能持續運作,進而擴展企業級應用。
NVIDIA Blog產品·NVIDIA Halos OS 強化自駕計程車安全:從設計源頭確保可靠性
NVIDIA推出Halos OS,為AI驅動的自駕計程車提供統一且生產就緒的安全基礎,旨在解決自駕車規模化部署時面臨的四大安全挑戰。該系統建立在NVIDIA DRIVE Hyperion平台上,並已獲得汽車安全標準認證。同時,NVIDIA也宣布與Uber、Foxconn、VinFast等多家公司合作,在全球推動自駕計程車服務。
The Verge AI產品·Claude Fable 5 設嚴格生物學防護,連基礎問題都拒答
Anthropic 推出其最強大的 AI 模型 Claude Fable 5,卻因嚴格的安全防護,拒絕回答連高中生都能處理的基礎生物學問題。這項限制是 Anthropic 為了防範生物武器等潛在風險而刻意為之,導致模型將許多無害的查詢轉交給舊版 Claude Opus 4.8 處理。公司表示這是為了讓客戶能更快受益於模型能力,同時正努力減少誤判並計畫未來為科學界提供更開放的版本。
Google DeepMind產品·Google DeepMind 推出 DiffusionGemma:文字生成速度飆升四倍
Google DeepMind 推出實驗性開源模型 DiffusionGemma,採用文字擴散技術,能同時生成整段文字,而非傳統的逐字處理。這項創新使其在專用 GPU 上的文字生成速度提升高達四倍,特別適用於需要即時互動的本地工作流程。DiffusionGemma 是一個 26B 的 MoE 模型,但在推論時僅啟用 3.8B 參數,使其能輕鬆運行於高階消費級 GPU。
NVIDIA Blog產品·NVIDIA 加速 Google DeepMind 的 DiffusionGemma,強化本地 AI 效能
Google DeepMind 發表了實驗性的開源模型 DiffusionGemma,專為極速文字生成而設計。NVIDIA 已最佳化 DiffusionGemma,使其能在 NVIDIA GeForce RTX GPU、RTX PRO 平台及 DGX Spark 系統上運行得更快,從個人電腦到雲端皆適用。此模型採用獨特的平行生成方式,能一次輸出多個詞彙區塊,大幅降低延遲,特別適合開發者、研究人員和 AI 愛好者的單用戶工作負載。
TechCrunch AI產品·資安研究員對 Anthropic Fable 的安全防護措施感到不滿
Anthropic 推出了其網路安全模型 Mythos 的公開限制版 Fable,但資安研究人員對其嚴格的安全防護措施感到不滿。這些護欄過於敏感,即使是無害的網路安全相關請求也會被阻擋,導致使用者體驗不佳。研究人員呼籲 Anthropic 應隨著時間逐步放寬這些限制。
Latent Space產品·Anthropic 推出 Claude Fable 5:性能卓越,但資料政策與開發限制引發爭議
Anthropic 正式發布其新一代大型語言模型 Claude Fable 5,宣稱其在多項基準測試中表現卓越,尤其在程式編碼和複雜任務處理方面領先業界。然而,Fable 5 的發布伴隨著兩項具爭議的政策:取消零資料保留(ZDR)並實施針對前沿 LLM 開發的「靜默」限制,引發了 AI 社群的廣泛不滿。儘管其 API 定價具競爭力且已迅速整合至多個生態系統,這些政策仍對其在開放 AI 領域的聲譽構成挑戰。
Simon Willison產品·Claude Fable 5 初探:功能強大但成本高昂的新一代模型
Simon Willison 分享了對 Anthropic 最新模型 Claude Fable 5 的初步印象,該模型與 Claude Mythos 5 同步推出,擁有 100 萬 token 的上下文視窗和嚴格的安全防護。儘管其速度較慢且價格昂貴,Fable 5 展現出驚人的知識量和處理複雜編碼任務的能力,甚至協助作者大幅改進了其開源專案 LLM。
The Verge AI產品·Apple 全新 Siri AI 實測:終於能處理日常任務了
Apple 全新升級的 Siri AI 終於能有效處理多項日常任務,例如從電子郵件中新增行事曆事件、診斷植物問題及建立購物清單。儘管功能相較 Google Gemini 仍屬基礎,但其可靠的運作能力,對於 Apple 而言是一大進步,有助於重建用戶對 Siri 的信任。
NVIDIA Blog產品·NVIDIA 機密運算技術擴展 Apple 私有雲運算,強化 AI 隱私與安全
NVIDIA 的機密運算技術現已應用於 Apple 的 Private Cloud Compute (PCC),並將擴展至 Google Cloud。此技術利用 NVIDIA GPU 支援 Apple Foundation Models 的伺服器端推論,為下一代 Apple Intelligence 功能提供強大的隱私與安全保障。這確保了用戶數據在 AI 處理過程中受到保護,即使是系統建構者也無法存取。
Ars Technica AI產品·Anthropic 發表 Claude Fable 5 模型,為防惡意使用限制討論網路安全、生物化學等敏感議題
Anthropic 近日發布了其首個「Mythos 等級」模型 Claude Fable 5,其整體能力超越了先前的 Opus 模型。為防止惡意行為者濫用,Fable 5 內建嚴格的安全防護,限制其回答有關網路安全、生物學和化學等敏感主題的查詢。儘管這些防護措施可能偶爾拒絕無害請求,但 Anthropic 認為這對於避免模型協助造成嚴重危害是必要的。
The Verge AI產品·Anthropic 發表首款 Mythos 級 AI 模型 Claude Fable 5,強調卓越性能與安全防護
Anthropic 剛宣布推出 Claude Fable 5,這是一款全新的 AI 模型,據稱是該公司迄今為止最為強大且廣泛可用的模型。該模型是 Anthropic Mythos 系列的首個公開版本,在軟體工程、知識工作和視覺方面表現出色,並內建安全防護措施以應對高風險領域。同時也推出了 Claude Mythos 5,其底層模型與 Fable 5 相同,但部分安全防護已解除,目前僅限特定合作夥伴使用。
Hugging Face Blog產品·Cohere 發表 North Mini Code:首款專為開發者設計的 AI 模型
Cohere 發表了 North Mini Code,這是一款擁有 300 億參數的專家混合模型,其中 30 億參數為活躍狀態,專為代理式軟體工程任務設計。該模型在複雜的程式碼工作流程和高品質程式碼生成方面表現出色,並且在同級別的開源模型中名列前茅。North Mini Code 已在 Hugging Face 上以 Apache 2.0 授權發布。
Google DeepMind產品·Google 推出 Gemini 3.5 Live Translate:即時語音翻譯更自然流暢
Google DeepMind 正式推出 Gemini 3.5 Live Translate,這是一款最新的音訊模型,能提供超過 70 種語言的近乎即時語音對語音翻譯。它能自動偵測語言,生成流暢自然的翻譯語音,並保留說話者的語氣和語速,避免尷尬停頓。此模型將陸續開放給開發者、企業用戶,並整合至 Google Translate 應用程式,大幅提升跨語言溝通的效率與體驗。
Google DeepMind產品·Google DeepMind 推出 Gemma 4 12B:筆電專用、無編碼器多模態模型
Google DeepMind 發布了 Gemma 4 12B,這是一款專為筆記型電腦設計的最新多模態模型,具備代理式智慧和高效能。其獨特的無編碼器架構能將視覺和音訊輸入直接整合至 LLM 主幹,大幅減少記憶體佔用並提升處理速度。這使得使用者能在本地端執行強大的 AI 應用,並支援多步驟推理和代理工作流程。
OpenAI Blog產品·Nextdoor 工程師運用 Codex:加速開發,專注產品成果
Nextdoor 工程師透過 OpenAI 的 Codex,將開發重心從繁瑣的實作細節轉移至產品成果,大幅提升生產力。這使得單一工程師能端到端地負責產品功能,加速新功能推出,並讓工程團隊能更專注於策略性產品決策。Codex 不僅改變了 Nextdoor 的工程思維,更成為其不可或缺的開發工具。
OpenAI Blog產品·Notion 導入 Codex:工程師工作模式大翻轉,開發效率飆升
Notion 工程師團隊透過導入 OpenAI 的 Codex,大幅改變了他們的軟體開發流程與效率。Codex 讓工程師能將任務交由 AI 執行,顯著縮短開發時間,例如 Notion 的語音輸入功能僅用數小時就完成。這不僅讓工程師能專注於更重要的工作,也讓主管能重新投入程式碼開發,徹底翻轉了傳統的工程工作模式。
The Verge AI產品·蘋果發表全新 Siri AI 與 Apple Intelligence,全面升級智慧體驗
蘋果在 WWDC 大會上發表了全新一代的 Siri AI 與 Apple Intelligence,承諾提供更智慧、更個人化的使用者體驗。新的 Siri AI 具備更自然的對話能力,並能深度整合系統與應用程式,同時強調隱私保護。這些新功能將陸續推廣至 iPhone、iPad、Mac 等蘋果生態系裝置。
- Google DeepMind產品·
獅子山AI教育試驗:Google DeepMind證實AI能有效提升學習成效與教師能力
Google DeepMind在獅子山進行的一項預先註冊試驗顯示,AI工具Gemini能作為強大的教學夥伴,顯著提升學生的數學成績,並促進深度學習。該研究發現,學生主要利用AI建立概念理解而非直接尋求答案,教師也透過AI工具提升了備課效率與教學方式。這項成功案例證明AI能擴大教師影響力,而非取代他們。
Hugging Face Blog產品·OpenEnv 專案走向開放治理,獲開源社群與業界巨頭力挺
OpenEnv 是一個用於建立代理執行環境的工具,旨在加速開源代理的訓練與發展。Hugging Face 宣布 OpenEnv 將由包含 Meta-PyTorch、Nvidia 等主要 AI 組織組成的委員會共同協調,並採用更開放的治理模式。此舉目標是為代理式強化學習提供一個標準化的互通層,讓開源模型能更有效地利用各種執行環境。
NVIDIA Blog產品·輝達RTX Spark超級晶片登陸韓國網咖,攜手KRAFTON、NC與電競冠軍T1共襄盛舉
輝達(NVIDIA)在Computex發表RTX Spark超級晶片後,執行長黃仁勳隨即前往韓國,向當地熱情的遊戲社群介紹這款專為個人AI助理、創作與遊戲設計的晶片。RTX Spark結合輝達30年創新技術,能讓輕薄筆電擁有全天續航,並支援多項AI與遊戲技術,包括基於Transformer模型的DLSS 4.5。輝達與KRAFTON、NC及電競隊伍T1合作,在韓國網咖展示RTX Spark的強大效能,並推出由AI驅動的遊戲角色「PUBG Ally」。
IEEE Spectrum AI產品·Nvidia RTX Spark 晶片進駐 Windows PC,全面提升 AI 運算
Nvidia 在 2026 年台北國際電腦展上發表了 RTX Spark,這是其 Blackwell GB10 超級晶片的 Windows PC 版本,獲得 Microsoft 及眾多 PC 製造商支援。RTX Spark 整合了強大的 GPU 和 NPU,旨在為 Windows 電腦帶來領先的 AI 運算能力,特別是大型語言模型和影像生成。儘管面臨 Windows on Arm 的挑戰,Nvidia 憑藉其在 GPU 和軟體生態系的優勢,有望推動 AI PC 市場的發展。
Engadget產品·NVIDIA 發表 AI 超級晶片,預期革新個人電腦體驗
NVIDIA 在 Computex 和 Microsoft Build 上發表了其 RTX Spark 超級晶片,這款整合 CPU/GPU/RAM 的晶片專為筆記型電腦和桌上型電腦設計,旨在提供前所未有的低功耗 AI 運算能力。此外,Meta 的 AI 應用程式中被發現潛藏臉部辨識功能程式碼,引發隱私疑慮。
Google Research產品·Google Gemini Enterprise Agent Platform 推出代理式 RAG,確保回應可靠性
現有的單步驟檢索增強生成(RAG)系統難以處理複雜的企業多源查詢。Google 推出 Gemini Enterprise Agent Platform 上的代理式 RAG,透過多個代理協同合作,規劃、推理並迭代與資料來源互動,以處理複雜查詢。其核心創新是「足夠上下文代理」(Sufficient Context Agent),能確保在生成回應前收集所有必要資訊,顯著提升準確性和可靠性。
Engadget產品·Google 測試 Chrome 搜尋直通 AI 模式
據報導,Google 正在其實驗性瀏覽器 Chrome Canary 中測試一項隱藏功能,該功能將搜尋查詢直接導向 AI 模式,而非傳統搜尋結果頁面。這項測試顯示 Google 可能考慮讓用戶預設使用類似聊天機器人的 AI 搜尋體驗,儘管目前尚無明確的推出計畫。
Wired AI產品·蘋果AirPods傳將搭載鏡頭:強化Siri視覺AI,但隱私與實用性仍是挑戰
蘋果據傳正在測試配備鏡頭的AirPods,作為其「AI裝置推動計畫」的一部分,旨在讓Siri能「看見」使用者周遭環境。這些鏡頭的目的是強化Siri的視覺智慧,應用於導航、購物等功能,並為AI模型訓練收集視覺數據。然而,該計畫因隱私疑慮、Siri視覺智慧尚未成熟以及電池續航等實際問題而面臨延遲。