如果生物學不再只是我們研究的對象,而是我們開始設計的東西呢?這正是 Adrian Woolfson 新書《物種的未來:透過人工生物智慧編寫生命》(On the Future of Species: Authoring Life by Means of Artificial Biological Intelligence)的核心前提,該書於 4 月 28 日由 MIT Press 出版。他認為,AI 和 DNA 合成技術的進步正將生物學推向一個工程學範式——科學家可以在其中生成新的基因序列,並最終依需求建構生物體。他將這種新興能力稱為「人工生物智慧」(artificial biological intelligence, ABI),這是一個涵蓋能夠設計、建構並最終「啟動」生命系統的總稱。然而,這個願景面臨一個基本問題:演化並未產生清晰、模組化的系統。它產生的是經過數十億年漸進式變化塑造的基因組,其功能重疊,且缺乏工程師所依賴的整齊結構。一些合成生物學研究人員試圖透過重組基因組來「重構」(refactor)基因程式碼(就像工程師重構電腦程式碼一樣),使其更容易理解和操作。但這種方法能走多遠?要讓生物學變得足夠可預測以進行工程設計,需要什麼條件?在與 IEEE Spectrum 的對話中,Woolfson 闡述了設計生命的潛力與局限。 您將基因組描述為演化產生的「義大利麵條程式碼」。是什麼讓生物學本質上如此不適用於傳統工程原則? Adrian Woolfson:在人造機器中,組件通常是正交的。每個組件都有預定的功能。如果組件損壞了,你猜怎麼著?你可以直接更換它,或者在某些情況下修復它。但遺憾的是,生物學並非如此運作。在生物學中,我們談論的是一個具有湧現行為的複雜網路,它建立在許多組件的微小貢獻之上。生物學要求具備韌性,並能有效處理損害。它也總是必須建立在既有架構之上,無法從頭發明。生物機器是歷史與當前設計的複雜糾葛,我們擁有的設計組件會讓工程師覺得荒謬可笑。如果你從工程學的角度來看人類基因組,你會說:「天哪,這真是一團糟。」因為它是以機會主義、漸進式的方式構建的,沒有任何預見性或意圖。 合成生物學家如何試圖改進這種程式碼?您能解釋研究人員如何重構基因組嗎? Woolfson:Drew Endy 是一位先驅。他取了一個噬菌體,然後說:「如果我們將其視為一段義大利麵條程式碼,並實際清理、重構並將其重新組織成更友善的配置,會怎麼樣?」遺憾的是,他的想法遠早於能讓這件事變得特別容易的技術出現。但他開創了將基因組視為電腦程式碼的方法,以及可以重構它們的理念。基因組大約有四十億年沒有被重構過——想像一下,如果有一段電腦程式碼四十億年沒有被重構過會是怎樣。 研究人員在這項努力上取得了多大進展? Woolfson:最好的例子可能是由紐約市 Jef Boeke 開創的合成酵母基因組計畫,稱為 Sc2.0。他花了大約 15 年的時間,慢慢地將所有這些合成染色體組裝成一個單一的生物體。他所做的超越了重構;它實際上是重新設計。例如,酵母有 16 條染色體,他建造了一條全新的第 17 條合成染色體。在另一項獨立研究中,他展示了可以將 16 條染色體連接成兩條巨大的染色體。這是對遺傳物質儲存方式的巨大重新配置。但當你開始修改這些基因組並重新配置它們時,不可避免地會引入程式碼中的「錯誤」(bugs)。這些錯誤通常會損害功能和生長。這並非說你無法在不造成生長障礙的情況下完全重新設計,只是你需要投入時間來找出最佳方法。當然,Boeke 開始時還沒有 AI,而 AI 讓這一切變得容易許多。AI 將對我們將 DNA 轉化為可預測工程材料的能力產生巨大影響。 AI 驅動的人工生物智慧 談到 AI,您提出了人工生物智慧(ABI)的概念。AI 將賦予我們哪些目前不具備的特定能力? Woolfson:在 AI 出現之前,我們無法大規模設計 DNA。我們無法發明在生物實體層面執行功能的全新 DNA 序列。現在我們有了這些所謂的「基因組語言模型」(genome language models),它們有點像我們用來處理文字的聊天機器人。但它們不是操作英文的 26 個字母,而是操作 DNA 語言的四個字母。當我們操作 DNA 語言時,我們需要一個非常寬廣的「上下文視窗」(context window),因為與文字不同,文字的大部分意義在於句子或段落,而在 DNA 中,遙遠的區域可以相互作用。因此,我們需要 AI 能夠辨識這些遠距離作用的關係。以一個特定的基因組語言模型 Evo 2 為例,它使用一種具有一百萬個鹼基對上下文視窗的架構。這意味著它可以看到相距一百萬個鹼基對的鹼基如何相互作用。 設計程式碼只是成功的一半。研究人員如何解決大規模實體製造 DNA 的瓶頸? Woolfson:過去不存在的另一個關鍵是能夠快速、高效、低成本且任意複雜度地大規模「寫入」(write)DNA 的能力。當你將設計和建構這兩種能力結合起來時,你就成為一名工程師。我們透過一項名為 Sidewinder 的技術實現了成本降低,該技術使我們能夠以大規模平行的方式建構 DNA,從而大幅降低了 DNA 建構的成本並提高了可擴展性。僅此一點就使得將 DNA 作為工程材料的提議變得更具可行性。 一旦你設計並合成了 DNA,要「啟動」一個活體生物需要什麼? Woolfson:這可能是最困難的部分。因為目前我們還不知道如何建造一個人工細胞。Craig Venter 展示了你可以摧毀細菌中的基因組並植入一個新的。換句話說,細胞的行為就像一台奈米電腦,而基因組的行為就像軟體。但將基因組植入細胞並非易事。「ABI」這個術語涵蓋了設計能力和建構能力,但也包括將其「啟動」成活體生物的能力。如果你擁有所有這些能力,你就完全掌握了生物學作為一項技術。突然之間,DNA 成為一種可程式化的材料,你可以以可預測的方式操作它。 生物學作為下一個工程材料 如果研究人員獲得了這種掌握,將會實現什麼? Woolfson:我的預測是,在 50 年內,生物學將成為首選的工程材料,而許多閱讀這篇文章的人將成為生物工程師。生物學可以提供材料所提供的大部分功能;例如,蜘蛛絲具有鋼的抗拉強度。當我們使用 AI 重新設計它時,它可能會達到鋼的五倍抗拉強度。當然,生物學還有一個額外優勢,就是它可以產生智慧材料。所以想像一下,如果你能擁有一種智慧形式的鋼材。工程師將如何利用它來建造建築物? 從零開始設計一個功能性多細胞生物,最困難的單一技術問題是什麼? Woolfson:我認為是我們對生命語法知識的不足。AI 被證明是解開這些語法規則的絕佳工具。它查看龐大的資料庫,並能辨識這些資料庫中的模式。在我們能更流利地說 DNA 語言之前,我們將無法設計複雜的多細胞生物,而要做到這一點,我們需要理解語法,要理解語法,我們需要審視更複雜、更細緻的資料庫。我們需要成為語法獵人。每當我們摧毀一個物種,我們就毀掉了一本語法書的一頁。我們需要將所有資訊匯集到一本語法書中。 最後,當您開始這段生命工程之旅時,現實的「失效模式」(failure modes)有哪些? Woolfson:我可以用兩種方式解釋「失效模式」。一種是機械故障:當你剝離所有這些非正交性時,系統會變得脆弱,因為生物機器被設計成不會失效,它們擁有很多重疊的故障安全機制。另一種可能導致這些事物失效的方式是變得危險。我們不了解生態系統。它們非常難以計算。因此,如果我們將工程改造的生物體釋放到複雜的生態系統中,它們可能會造成浩劫。顯然,這些技術本身在錯誤的人手中也具有內在危險性。因此,我們需要學習如何安全、負責任、合乎道德、透明且公平地使用它們,以造福社會。