研究
DSO:直接引導優化,緩解生成模型偏誤

摘要
生成模型在決策時可能因輸入的人口統計屬性而產生偏誤,例如視覺語言模型未能正確識別女性醫生。傳統的偏誤緩解方法常導致模型性能下降,且用戶對偏誤與性能的權衡需求各異。DSO(直接引導優化)提出一種可控的偏誤消除方法,旨在讓用戶能彈性平衡模型的公平性與整體能力。
生成模型常被部署來替用戶做出決策,例如視覺語言模型 (VLM) 協助視障人士識別房間中哪個人是醫生。然而,VLM 的決策會受到輸入中人物感知到的人口統計屬性影響,這可能導致偏頗結果,例如未能將女性識別為醫生。此外,當減少偏誤導致性能損失時,用戶對於平衡偏誤緩解與整體模型能力的需求可能各不相同,這突顯了對能實現可控偏誤減少方法的需求。
標籤
生成模型偏誤緩解機器學習人工智慧倫理視覺語言模型公平性
以上為 AI 自動翻譯導讀。原文版權歸 Apple Machine Learning Research 所有。 建議透過上方「閱讀原文」前往原始網站,以取得最完整資訊與支持原作者。