研究
條件式擴散模型組合泛化的局部機制

摘要
條件式擴散模型在處理訓練資料以外的組合時,展現出組合泛化能力,但其背後機制仍不明確。本研究透過探討長度泛化(生成比訓練時更多物件的影像),證明了特定組合結構與局部條件分數之間的精確等價性。實驗結果顯示,具備局部條件分數的模型能成功實現長度泛化,並在 SDXL 的特徵空間中發現了相關證據。
作者:Arwen Bradley條件式擴散模型似乎具備組合泛化能力,即能為訓練資料以外的條件組合生成令人信服的樣本,但其背後的機制仍不明確。為具體探討此能力,我們研究了長度泛化,亦即生成比訓練時更多物件影像的能力。在受控的 CLEVR 設定(Johnson et al., 2017)中,我們發現長度泛化在某些情況下可實現,但在其他情況下則否,這表明模型有時才能學習到底層的組合結構。隨後,我們將局部性作為組合泛化的一種結構機制進行探討。先前的研究提出了分數局部性作為無條件擴散模型中創造力的機制(Kamb & Ganguli, 2024; Niedoba et al., 2024),但並未處理彈性條件或組合泛化。在本論文中,我們證明了特定組合結構(條件式投影組合)(Bradley et al., 2025)與對像素和條件器都具有稀疏依賴性的分數(局部條件分數)之間存在精確的等價關係。此理論也延伸至特徵空間中概念的組合(例如風格與內容)。我們透過實驗驗證了我們的理論:在長度泛化方面成功的 CLEVR 模型展現出局部條件分數,而失敗的模型則否。此外,我們證明了明確強制執行局部條件分數的因果干預,能使先前失敗的模型實現長度泛化。最後,我們研究了 SDXL,發現在像素空間中,空間局部性存在但條件局部性大多不存在;然而,我們在網路學習到的特徵空間中發現了局部條件分數的量化證據。
## 相關閱讀與更新
條件式擴散模型似乎具備組合泛化能力,即能為訓練資料以外的條件組合生成令人信服的樣本,但其背後的機制仍不明確。為具體探討此能力,我們研究了長度泛化,亦即生成比訓練時更多物件影像的能力。在受控的 CLEVR 設定(Johnson et al., 2017)中,我們發現長度泛化是… [閱讀更多](https://machinelearning.apple.com/research/local-mechanisms)
我們研究了擴散模型中組合的理論基礎,特別關注分佈外推和長度泛化。先前的研究表明,透過線性分數組合來構成分佈可以取得有前景的結果,包括在某些情況下的長度泛化(Du et al., 2023; Liu et al., 2022)。然而,我們對此類組合如何以及為何奏效的理論理解仍不完整… [閱讀更多](https://machinelearning.apple.com/research/mechanisms-of-projective-composition)
標籤
條件式擴散模型組合泛化長度泛化局部機制機器學習AI研究
以上為 AI 自動翻譯導讀。原文版權歸 Apple Machine Learning Research 所有。 建議透過上方「閱讀原文」前往原始網站,以取得最完整資訊與支持原作者。