音樂人習慣於每次作品被使用時獲得報酬。無論是黑膠/CD 銷售、串流、廣播、翻唱,還是卡拉 OK 等眾多利基市場,都有關於「使用」定義的協議。這背後是一個簡單的經濟原則:作品被使用得越多,賺取的錢就越多。
然而,生成式 AI 使「使用」的定義變得複雜。一方面,你可以爭辯說音樂訓練數據的使用只發生一次,即在訓練時。另一方面,創作者有理由抱怨他們作品的創意精髓存活在模型的結構中,每次模型產生輸出時都會被使用。
現在,Sureel 和 SoundVerse 等公司正努力在 AI 時代重新建立激勵創造力的基本經濟原則。這些倡議旨在將生成式 AI 產業從一個被指控「史上最大規模版權竊盜」的產業,轉變為一個能與勤奮藝術家和諧共存的產業。
華納音樂集團剛收購的新創公司 Sureel,已與瑞典版權機構 STIM 合作,探索音樂創作者在其音樂被用於訓練生成式 AI 工具時獲得報酬的可能性。Sureel 的軟體會為音樂檔案等線上媒體標記由所有者確定的指令。這些指令會指定 AI 公司是否可以自由使用該媒體進行訓練、限制其在任何給定訓練集中的影響力,或者完全避免使用。然後,該軟體會追蹤 AI 公司如何在訓練中使用該媒體,並據此設定授權費用。
同時,AI 音樂公司 SoundVerse 的創辦人在一份 2025 年的白皮書中寫道,他們「拒絕一次性版稅買斷,認為其不足夠,並倡導藝術家持續參與 AI 生命週期」。他們認為,每次生成式 AI 系統產生輸出時,某些訓練數據比其他數據扮演更重要的角色。如果系統輸出類似爵士樂的音樂,那麼訓練集中的爵士樂顯然比,比如說,民謠音樂貢獻更多。因此,你可以針對每個輸出,差異化地獎勵每份訓練數據。
Sureel 的共同總裁 Benji Rogers 告訴我:「歸因並不是要重建舊有的經濟模式。它是要首次衡量舊有經濟模式只能近似估計的事物。」Sureel 執行長 Tamay Aykut 表示,這種影響力歸因不僅需要表面上衡量訓練數據點與 AI 輸出有多相似。
挑戰在於歸因因果關係,即訓練數據與訓練後的 AI 之間的關係。然而,即使 AI 產業實現了這一點,也可能鼓勵人們創造旨在最大化訓練數據版稅的音樂。儘管所有創意市場都會產生新的激勵機制(例如音樂串流推動歌曲前奏縮短),但這個產業可能不需要另一個容易被操縱的經濟結構,讓某人的逆向工程拼貼作品將版稅從原創的創意表達作品中轉移出去。
推斷特定音樂作品對生成音樂的影響,如果這是一個明確定義的問題,可能涉及更進階的資訊理論原則,或對個別作品的實際歷史角色和影響進行建模。Aykut 提出,在精心設計的歸因系統中,更不尋常和未經修飾的音樂作品甚至可能比廣播標準歌曲具有更高的內在價值。STIM 的業務發展主管 Simon Gozzi 表示,該公司正在研究 Sureel 的歸因報告如何能成為音樂人與 AI 公司之間授權協議的基礎。
生成式 AI 歸因策略能否不僅維持「受歡迎度帶來報酬」的經濟邏輯,還能激勵音樂實驗和多樣性?這是一個引人入勝的概念,尤其當公眾普遍擔憂生成式 AI 對文化活力的威脅,將權力推向科技公司、降低創意工作者的技能、縮減創意產業的收入,並讓網路充斥著劣質內容時。
Rogers 說:「歸因是我們少數幾個可靠的工具之一。」現在有一個機會之窗,可以討論並建立為 AI 訓練數據付費的方法,以服務一個充滿活力且永續的創意產業。
訓練數據歸因的技術問題既複雜又不明確。正如基於相似度測量的簡化歸因策略可能激勵人們逆向工程某個流派的經典作品以獲取版稅一樣,基於某種原創性資訊理論的更複雜歸因策略也可能容易被操縱,或未能獎勵人類的文化生產。對於創意工作者來說,有充分理由擔心,即使懷抱最好的意圖,AI 歸因也只會加劇他們已經厭倦應對的繁瑣且不透明的軍備競賽。
音樂 AI 產業內部也有一些懷疑的聲音。SourceAudio 總裁 Drew Silverstein 表示:「歸因似乎是顯而易見的答案,但在 AI 中它有缺陷,所以我們必須尋找其他模式。」他主張在訓練時,透過簡單的協商協議,以約定或每年重複的價格進行。
同時,主導生成式 AI 革命的版權訴訟正開始讓位給越來越多的私人協商協議,例如環球音樂、華納音樂與主要 AI 公司之間,就版權同意下合作訓練模型的協議。
儘管目前仍有許多不確定性,但這些協議可能對未來產業規範產生相當大的影響。現在,有一個機會之窗可以討論並建立為 AI 訓練數據付費的方法,同時維持一個充滿活力的創意產業。精密的工程解決方案將發揮作用,但它們需要考慮到挑戰的文化複雜性,並透過良好的設計實現公平和透明。
像 Suno 這樣的巨型生成模型是否真如最初宣傳的那樣具有可信度,仍有待觀察。在許多 AI 的創意應用中,人們重新關注為特定人類創意表達需求量身定制的較小型客製化模型,例如 IRCAM 的 RAVE 模型或 Jen 的 Style Filters。
同時,更主流的「終端使用者」創意應用可能正轉向關注粉絲參與。OpenAI 突然放棄 Sora,儘管正在與 Disney 進行談判,以及 Suno 在與環球音樂達成協議後,近期強調建立直接利用藝術家作品的粉絲參與體驗,都表明創意 AI 產業正經歷初期問題。
轉向更小、更有針對性的模型和應用,將為創作者聯盟提供更多空間。例如,音樂家團體可以聯合起來為較小的客製化模型提供訓練數據,其收入分配可能基於平等或其他公平原則。混合模型架構和結構化訓練機制,即在訓練過程的不同階段使用不同的數據源,以及檢索增強生成(RAG),將特定情境資訊與訓練數據混合以改善結果,可能也是如此。
一種可能產生較差結果但能實現更公平或更透明歸因路徑的方法,如果能為創作者帶來更豐厚的版稅收入甚至明確的歸屬,可能會更成功。此外,無論歸因演算法多麼複雜,它始終會根植於人類的決策,從明智和公平到武斷和腐敗。如果你請一位音樂產業內部人士解釋錄音和歌曲創作版稅的百分比分配是如何確定的,你將會得到一個冗長的答案。
最好的情況下,訓練數據歸因的機制將促成關於如何使我們的創意和文化產業公平且充滿活力的公開和知情討論。最壞的情況下,它將把已經不透明的私人協議隱藏在複雜的黑盒子中。這就是國家政策至關重要的地方。Rogers 表示,歸因必須是「多層次且可審計的,對專家和監管審查開放」。制定此類政策需要電腦科學、音樂學、法律和經濟學的專業知識。
具有 AI 競爭力的政府將能夠透過支持履行此目的的機構來提升其文化和創意產業。即使是最自由主義的經濟體也會超越市場來維持文化表達,無論是透過公共藝術資助還是像廣播電台的本地音樂配額等措施。隨著生成式 AI 在創意產業中的經濟影響逐漸成形,稅收、再分配和對文化基礎設施的積極支持,可能仍然是支持積極社會成果最有效的方式。
畢竟,對大型 AI 公司徵稅並將該收入重新分配給為該產業財富做出貢獻的創意工作者,是另一種「AI 歸因策略」。
