AI 新殖民主義：數據掠奪與文化偏見

隨著人工智慧改變了世界獲取資訊的方式，一些批評者指出，它正在延續刻板印象，並抹殺原住民和有色人種的文化細微差異。重要性：大多數主流模型都是以西方作家（尤其是白人男性）的作品進行訓練，並經常模仿其價值觀、寫作風格、觀點和偏見。一些批評者認為，這種數據掠奪是一種「新殖民主義」，資訊採集取代了帝國時代的土地掠奪，而人工智慧公司（而非征服國家）則從邊緣群體中獲取利潤。

從這些群體收集數據通常未經他們同意，也未經任何資訊準確性的驗證。他們怎麼說：「殖民主義總是描繪成過去發生的事情……許多國家獲得獨立後，教科書就說『殖民主義結束了』。」研究人類勞動與數據生產關係的耶魯大學教授 Julian Posada 告訴 Axios。

Posada 表示，現代殖民主義仍然存在，但人們往往未能意識到。背景：大多數大型語言模型（LLM）是由「WEIRD」（西方、受教育、工業化、富裕、民主）社會所開發，並從主要源自北美和歐洲的社群媒體、網站、新聞檔案和數位化資料中提取數據。這些訓練材料導致 LLM 根據西方對文化傳統或價值觀的假設編造細節，儘管大型科技公司努力用更多元化的觀點和數據來訓練它們，這些錯誤依然存在。

舉例來說：康乃爾大學教授 Aditya Vashistha 告訴 Axios，AI 模型經常會說所有印度食物都是「濃郁、芳香且辛辣的」，但有些並非如此，這抹平了印度菜餚的多樣性。「你會發現不同的地方菜系，它們所使用的香料或用量都有所不同。」

宏觀來看：獲取數據本身就是一種「深度殖民行為」，《數據掠奪：大型科技公司的新殖民主義以及如何反擊》一書的合著者 Nick Couldry 告訴 Axios。「說『嗯，它就在那裡。我們可以拿走它。』這就是殖民主義的本質，只是拿走一切。」「我們不僅可以拿走它，而且應該拿走它，我們有權拿走它並從中獲取我們想要的一切，榨取盡可能多的利潤。」

微觀來看：大型科技公司追求快速發展和創造利潤的推動，加劇了這個問題，Pikwàkanagàn 第一民族的亞岡昆人、皇后大學研究員 Michael Sherbert 告訴 Axios。「許多美國 AI 公司都試圖超越中國公司，對吧？花時間與原住民社區討論問題和知識成本很高。

這需要大量時間，可能會讓他們落後。」kama.ai 創辦人、安大略省 Chapleau Cree 第一民族成員 Brian Ritchie 告訴 Axios，他曾多次參加原住民領袖峰會，但個人從未「看到原住民參與」AI 訓練的歷史。值得注意的是：許多原住民傳統未被 AI 納入考量，因為它們是透過口述歷史而非 LLM 可以獲取的書面文字傳承下來的。

Sherbert 表示，其他知識則是有意地被保密。總結：「問題不僅僅是錯誤資訊，」Sherbert 說。「這些系統，即 LLM 提供的答案，正日益塑造人們如何理解自己、文化、歷史、身份，甚至什麼是真實和合法的。」深入探討：AI 偏見的持續問題。