AI 新聞繁中

如果生物學不再只是我們研究的對象，而是我們開始設計的東西呢？這正是 Adrian Woolfson 新書《物種的未來：透過人工生物智慧編寫生命》（On the Future of Species: Authoring Life by Means of Artificial Biological Intelligence）的核心前提，該書於 4 月 28 日由 MIT Press 出版。他認為，AI 和 DNA 合成技術的進步正將生物學推向一個工程學範式——科學家可以在其中生成新的基因序列，並最終依需求建構生物體。他將這種新興能力稱為「人工生物智慧」（artificial biological intelligence, ABI），這是一個涵蓋能夠設計、建構並最終「啟動」生命系統的總稱。然而，這個願景面臨一個基本問題：演化並未產生清晰、模組化的系統。它產生的是經過數十億年漸進式變化塑造的基因組，其功能重疊，且缺乏工程師所依賴的整齊結構。一些合成生物學研究人員試圖透過重組基因組來「重構」（refactor）基因程式碼（就像工程師重構電腦程式碼一樣），使其更容易理解和操作。但這種方法能走多遠？要讓生物學變得足夠可預測以進行工程設計，需要什麼條件？在與 IEEE Spectrum 的對話中，Woolfson 闡述了設計生命的潛力與局限。您將基因組描述為演化產生的「義大利麵條程式碼」。是什麼讓生物學本質上如此不適用於傳統工程原則？ Adrian Woolfson：在人造機器中，組件通常是正交的。每個組件都有預定的功能。如果組件損壞了，你猜怎麼著？你可以直接更換它，或者在某些情況下修復它。但遺憾的是，生物學並非如此運作。在生物學中，我們談論的是一個具有湧現行為的複雜網路，它建立在許多組件的微小貢獻之上。生物學要求具備韌性，並能有效處理損害。它也總是必須建立在既有架構之上，無法從頭發明。生物機器是歷史與當前設計的複雜糾葛，我們擁有的設計組件會讓工程師覺得荒謬可笑。如果你從工程學的角度來看人類基因組，你會說：「天哪，這真是一團糟。」因為它是以機會主義、漸進式的方式構建的，沒有任何預見性或意圖。合成生物學家如何試圖改進這種程式碼？您能解釋研究人員如何重構基因組嗎？ Woolfson：Drew Endy 是一位先驅。他取了一個噬菌體，然後說：「如果我們將其視為一段義大利麵條程式碼，並實際清理、重構並將其重新組織成更友善的配置，會怎麼樣？」遺憾的是，他的想法遠早於能讓這件事變得特別容易的技術出現。但他開創了將基因組視為電腦程式碼的方法，以及可以重構它們的理念。基因組大約有四十億年沒有被重構過——想像一下，如果有一段電腦程式碼四十億年沒有被重構過會是怎樣。研究人員在這項努力上取得了多大進展？ Woolfson：最好的例子可能是由紐約市 Jef Boeke 開創的合成酵母基因組計畫，稱為 Sc2.0。他花了大約 15 年的時間，慢慢地將所有這些合成染色體組裝成一個單一的生物體。他所做的超越了重構；它實際上是重新設計。例如，酵母有 16 條染色體，他建造了一條全新的第 17 條合成染色體。在另一項獨立研究中，他展示了可以將 16 條染色體連接成兩條巨大的染色體。這是對遺傳物質儲存方式的巨大重新配置。但當你開始修改這些基因組並重新配置它們時，不可避免地會引入程式碼中的「錯誤」（bugs）。這些錯誤通常會損害功能和生長。這並非說你無法在不造成生長障礙的情況下完全重新設計，只是你需要投入時間來找出最佳方法。當然，Boeke 開始時還沒有 AI，而 AI 讓這一切變得容易許多。AI 將對我們將 DNA 轉化為可預測工程材料的能力產生巨大影響。 AI 驅動的人工生物智慧談到 AI，您提出了人工生物智慧（ABI）的概念。AI 將賦予我們哪些目前不具備的特定能力？ Woolfson：在 AI 出現之前，我們無法大規模設計 DNA。我們無法發明在生物實體層面執行功能的全新 DNA 序列。現在我們有了這些所謂的「基因組語言模型」（genome language models），它們有點像我們用來處理文字的聊天機器人。但它們不是操作英文的 26 個字母，而是操作 DNA 語言的四個字母。當我們操作 DNA 語言時，我們需要一個非常寬廣的「上下文視窗」（context window），因為與文字不同，文字的大部分意義在於句子或段落，而在 DNA 中，遙遠的區域可以相互作用。因此，我們需要 AI 能夠辨識這些遠距離作用的關係。以一個特定的基因組語言模型 Evo 2 為例，它使用一種具有一百萬個鹼基對上下文視窗的架構。這意味著它可以看到相距一百萬個鹼基對的鹼基如何相互作用。設計程式碼只是成功的一半。研究人員如何解決大規模實體製造 DNA 的瓶頸？ Woolfson：過去不存在的另一個關鍵是能夠快速、高效、低成本且任意複雜度地大規模「寫入」（write）DNA 的能力。當你將設計和建構這兩種能力結合起來時，你就成為一名工程師。我們透過一項名為 Sidewinder 的技術實現了成本降低，該技術使我們能夠以大規模平行的方式建構 DNA，從而大幅降低了 DNA 建構的成本並提高了可擴展性。僅此一點就使得將 DNA 作為工程材料的提議變得更具可行性。一旦你設計並合成了 DNA，要「啟動」一個活體生物需要什麼？ Woolfson：這可能是最困難的部分。因為目前我們還不知道如何建造一個人工細胞。Craig Venter 展示了你可以摧毀細菌中的基因組並植入一個新的。換句話說，細胞的行為就像一台奈米電腦，而基因組的行為就像軟體。但將基因組植入細胞並非易事。「ABI」這個術語涵蓋了設計能力和建構能力，但也包括將其「啟動」成活體生物的能力。如果你擁有所有這些能力，你就完全掌握了生物學作為一項技術。突然之間，DNA 成為一種可程式化的材料，你可以以可預測的方式操作它。生物學作為下一個工程材料如果研究人員獲得了這種掌握，將會實現什麼？ Woolfson：我的預測是，在 50 年內，生物學將成為首選的工程材料，而許多閱讀這篇文章的人將成為生物工程師。生物學可以提供材料所提供的大部分功能；例如，蜘蛛絲具有鋼的抗拉強度。當我們使用 AI 重新設計它時，它可能會達到鋼的五倍抗拉強度。當然，生物學還有一個額外優勢，就是它可以產生智慧材料。所以想像一下，如果你能擁有一種智慧形式的鋼材。工程師將如何利用它來建造建築物？從零開始設計一個功能性多細胞生物，最困難的單一技術問題是什麼？ Woolfson：我認為是我們對生命語法知識的不足。AI 被證明是解開這些語法規則的絕佳工具。它查看龐大的資料庫，並能辨識這些資料庫中的模式。在我們能更流利地說 DNA 語言之前，我們將無法設計複雜的多細胞生物，而要做到這一點，我們需要理解語法，要理解語法，我們需要審視更複雜、更細緻的資料庫。我們需要成為語法獵人。每當我們摧毀一個物種，我們就毀掉了一本語法書的一頁。我們需要將所有資訊匯集到一本語法書中。最後，當您開始這段生命工程之旅時，現實的「失效模式」（failure modes）有哪些？ Woolfson：我可以用兩種方式解釋「失效模式」。一種是機械故障：當你剝離所有這些非正交性時，系統會變得脆弱，因為生物機器被設計成不會失效，它們擁有很多重疊的故障安全機制。另一種可能導致這些事物失效的方式是變得危險。我們不了解生態系統。它們非常難以計算。因此，如果我們將工程改造的生物體釋放到複雜的生態系統中，它們可能會造成浩劫。顯然，這些技術本身在錯誤的人手中也具有內在危險性。因此，我們需要學習如何安全、負責任、合乎道德、透明且公平地使用它們，以造福社會。

AI 改造基因組：生物學的工程化未來