隨著人工智慧改變了世界獲取資訊的方式,一些批評者指出,它正在延續刻板印象,並抹殺原住民和有色人種的文化細微差異。重要性:大多數主流模型都是以西方作家(尤其是白人男性)的作品進行訓練,並經常模仿其價值觀、寫作風格、觀點和偏見。一些批評者認為,這種數據掠奪是一種「新殖民主義」,資訊採集取代了帝國時代的土地掠奪,而人工智慧公司(而非征服國家)則從邊緣群體中獲取利潤。

從這些群體收集數據通常未經他們同意,也未經任何資訊準確性的驗證。他們怎麼說:「殖民主義總是描繪成過去發生的事情……許多國家獲得獨立後,教科書就說『殖民主義結束了』。」研究人類勞動與數據生產關係的耶魯大學教授 Julian Posada 告訴 Axios。

Posada 表示,現代殖民主義仍然存在,但人們往往未能意識到。背景:大多數大型語言模型(LLM)是由「WEIRD」(西方、受教育、工業化、富裕、民主)社會所開發,並從主要源自北美和歐洲的社群媒體、網站、新聞檔案和數位化資料中提取數據。這些訓練材料導致 LLM 根據西方對文化傳統或價值觀的假設編造細節,儘管大型科技公司努力用更多元化的觀點和數據來訓練它們,這些錯誤依然存在。

舉例來說:康乃爾大學教授 Aditya Vashistha 告訴 Axios,AI 模型經常會說所有印度食物都是「濃郁、芳香且辛辣的」,但有些並非如此,這抹平了印度菜餚的多樣性。「你會發現不同的地方菜系,它們所使用的香料或用量都有所不同。」

宏觀來看:獲取數據本身就是一種「深度殖民行為」,《數據掠奪:大型科技公司的新殖民主義以及如何反擊》一書的合著者 Nick Couldry 告訴 Axios。「說『嗯,它就在那裡。我們可以拿走它。』這就是殖民主義的本質,只是拿走一切。」「我們不僅可以拿走它,而且應該拿走它,我們有權拿走它並從中獲取我們想要的一切,榨取盡可能多的利潤。」

微觀來看:大型科技公司追求快速發展和創造利潤的推動,加劇了這個問題,Pikwàkanagàn 第一民族的亞岡昆人、皇后大學研究員 Michael Sherbert 告訴 Axios。「許多美國 AI 公司都試圖超越中國公司,對吧?花時間與原住民社區討論問題和知識成本很高。

這需要大量時間,可能會讓他們落後。」kama.ai 創辦人、安大略省 Chapleau Cree 第一民族成員 Brian Ritchie 告訴 Axios,他曾多次參加原住民領袖峰會,但個人從未「看到原住民參與」AI 訓練的歷史。值得注意的是:許多原住民傳統未被 AI 納入考量,因為它們是透過口述歷史而非 LLM 可以獲取的書面文字傳承下來的。

Sherbert 表示,其他知識則是有意地被保密。總結:「問題不僅僅是錯誤資訊,」Sherbert 說。「這些系統,即 LLM 提供的答案,正日益塑造人們如何理解自己、文化、歷史、身份,甚至什麼是真實和合法的。」深入探討:AI 偏見的持續問題。