研究

DSO：直接引導優化，緩解生成模型偏誤

Apple Machine Learning Research·2026/04/29·約 1 分鐘

摘要

生成模型在決策時可能因輸入的人口統計屬性而產生偏誤，例如視覺語言模型未能正確識別女性醫生。傳統的偏誤緩解方法常導致模型性能下降，且用戶對偏誤與性能的權衡需求各異。DSO（直接引導優化）提出一種可控的偏誤消除方法，旨在讓用戶能彈性平衡模型的公平性與整體能力。

生成模型常被部署來替用戶做出決策，例如視覺語言模型 (VLM) 協助視障人士識別房間中哪個人是醫生。然而，VLM 的決策會受到輸入中人物感知到的人口統計屬性影響，這可能導致偏頗結果，例如未能將女性識別為醫生。此外，當減少偏誤導致性能損失時，用戶對於平衡偏誤緩解與整體模型能力的需求可能各不相同，這突顯了對能實現可控偏誤減少方法的需求。

標籤

生成模型偏誤緩解機器學習人工智慧倫理視覺語言模型公平性

以上為 AI 自動翻譯導讀。原文版權歸 Apple Machine Learning Research 所有。建議透過上方「閱讀原文」前往原始網站，以取得最完整資訊與支持原作者。

← 回首頁閱讀原文 ↗