本文原創(chuàng):克里斯 本文來源:細胞基因研究圈
近日,美國斯坦福大學計算機科學系Charlotte Bunne教授團隊在國際知名期刊《Cell》發(fā)表了題為:How to build the virtual cell with artificial intelligence: Priorities and opportunities的研究文章。
文章開篇闡述了細胞作為生命基本單位的復雜性,指出其復雜性給物理和計算建模帶來了巨大挑戰(zhàn)。隨后,文章探討了當前細胞模型的不足之處,并引入了AIVC(人工智能虛擬細胞)的概念。文章深入描述了AIVC的設計愿景,涵蓋其在不同生物尺度上的功能、評估體系、自洽性、可解釋性與生物學效用之間的平衡,以及推動合作建模和確保倫理責任的框架。最后,文章強調(diào)了AIVC在生物工程、癌癥治療和精準醫(yī)學中的潛在應用價值,并倡導開展跨學科合作。
1、前言
研究背景
傳統(tǒng)細胞模型在模擬和預測細胞功能及行為時表現(xiàn)出明顯的局限性,難以全面捕捉細胞在時間和空間維度上的多尺度動態(tài)變化以及復雜的生物分子相互作用。然而,隨著人工智能(AI)和組學技術的飛速發(fā)展,如今已具備了構建能夠直接從數(shù)據(jù)中學習的新型細胞模型的條件。這些技術的突破為開發(fā)人工智能虛擬細胞(AIVC)帶來了前所未有的機遇。
研究設計
文章闡述了AIVC(人工智能虛擬細胞)實驗設計的思路,旨在構建一個綜合性的AI框架。該框架涵蓋多個相互連接的基礎模型,這些模型分別代表從分子到細胞、組織乃至更高級別的動態(tài)生物系統(tǒng)。實驗設計的核心包括開發(fā)一個通用的多模態(tài)、多尺度生物狀態(tài)表征,以及一系列虛擬儀器(VIs)。這些虛擬儀器本質(zhì)上是用于操作或解碼上述表征的神經(jīng)網(wǎng)絡。文章還探討了如何從分子層面入手,逐步構建每個物理尺度的AIVC,并著重強調(diào)了數(shù)據(jù)生成、模型評估與解釋以及開放合作的關鍵性。
2、AVICs(人工智能虛擬細胞)
人工智能虛擬細胞(AIVC)是一個多尺度、多模態(tài)的大型神經(jīng)網(wǎng)絡模型,能夠模擬分子、細胞和組織在不同狀態(tài)下的動態(tài)行為。AIVC的目標是整合廣泛的細胞生物學知識,以預測細胞功能、行為及其動態(tài)變化,并能夠開展虛擬實驗來生成和驗證新的科學假設。該模型致力于構建一個通用的生物狀態(tài)表征,涵蓋不同物種、數(shù)據(jù)模態(tài)、數(shù)據(jù)集和環(huán)境條件,包括多種細胞類型、發(fā)育階段以及外部條件。借助這種通用表征,AIVC有助于揭示細胞狀態(tài)的共性特征,并作為一個全面的參考框架,助力研究人員利用現(xiàn)有的生物學知識來關聯(lián)不同數(shù)據(jù)之間的聯(lián)系。
3、建立 AVIC
AIVC被設計為一個全面的人工智能框架,由多個相互連接的基礎模型構成,這些模型能夠描述從分子層面到細胞、組織乃至更高級別的復雜生物系統(tǒng)中的動態(tài)變化。該框架的核心要素是一個通用的多模態(tài)、多尺度生物狀態(tài)表征,以及一套虛擬儀器(VIs),這些儀器實際上是能夠操作或解碼這些表征的神經(jīng)網(wǎng)絡。
文章強調(diào)了從分子層面開始,逐步構建每個物理尺度的AIVC的重要性,并探討了構建每個物理尺度AIVC的設計原則及可用數(shù)據(jù)類型。這涵蓋了從單個分子到整個組織的模型,每個尺度都通過獨特的表征相互連接,從而在不同生物尺度之間實現(xiàn)一致性。通過這種多層次的表征方式,AIVC能夠無縫整合新數(shù)據(jù),并適應新的生物學知識,從而為生物醫(yī)學研究提供一個強大的工具。
4、模型升級
評估人工智能虛擬細胞(AIVC)模型需要一個全面且靈活的基準框架。AIVC必須證明其在多種生物學環(huán)境和下游任務中的泛化能力,同時考慮由環(huán)境變化、感染、遺傳變異等因素引起的動態(tài)分布變化。評估不僅要衡量模型在未見過的情境中的表現(xiàn),例如新的細胞類型和遺傳背景,還要評估其發(fā)現(xiàn)新生物學現(xiàn)象的能力。
AIVC模型的評估應優(yōu)先考慮其生物學相關性的表現(xiàn),包括生成有價值的可測試假設,以及是否能夠通過模型性能的統(tǒng)計度量或需要解釋性和生物學因果關系來充分評估。最終,AIVC模型的評價將基于其擴展我們對生物學理解的能力,無論是提供新的生物學見解還是加速科學進程。
5、可解釋性與交互性
在開發(fā)人工智能虛擬細胞(AIVC)的過程中,如何平衡模型的可解釋性與生物學效用是一個關鍵問題。隨著深度學習在生物學領域的廣泛應用,模型性能的提升常常伴隨著可解釋性的降低,即所謂的“黑箱”現(xiàn)象。然而,提升AIVC模型的可解釋性仍然是一個重要的目標,因為這有助于科學家理解模型預測背后的生物學機制,從而更有效地信任和應用這些模型。構建直觀的用戶界面至關重要,以便不同專業(yè)水平的研究人員能夠高效地理解和利用AIVC的預測結果。
此外,研究指出,利用大型語言模型(LLMs)作為虛擬研究助理,為非專家提供直觀的交互界面,幫助他們深入理解AIVC的預測結果,并進一步探索其生物學意義。這種方法不僅能夠促進跨學科合作,還能使更多研究人員受益于AIVC的強大功能。
6、開放協(xié)作方法
開發(fā)人工智能虛擬細胞(AIVC)需要采用開放且協(xié)作的方式。鑒于創(chuàng)建AIVC需要大量的資源投入、跨學科的專業(yè)知識以及多次迭代優(yōu)化,因此需要整個科學界的共同參與。文章倡導開放數(shù)據(jù)資源、統(tǒng)一數(shù)據(jù)標準、搭建協(xié)作平臺,以及共享基準數(shù)據(jù)集和驗證策略,以確保AIVC模型的生物學保真度和實際應用價值。這種協(xié)作模式有助于加快個體研究的進展,并將全球范圍內(nèi)的科學研究整合起來。
作者呼吁來自不同領域的利益相關者,包括學術界、生物制藥行業(yè)以及人工智能領域,開展預競爭性合作,以加速AIVC的開發(fā)進程。同時,建議與監(jiān)管機構和生物倫理專家合作,制定新的規(guī)范,以促進AIVC的部署,確保其符合法律要求,并為虛擬細胞的負責任使用設定倫理標準。
7、未來前景
AIVC有潛力徹底變革生物醫(yī)學研究的模式,推動我們在個性化醫(yī)療、藥物發(fā)現(xiàn)、細胞工程和可編程生物學等領域?qū)崿F(xiàn)重大突破。作為虛擬實驗室,AIVC能夠促進計算機系統(tǒng)、現(xiàn)代生成性人工智能與生物學之間的無縫銜接,使科學家能夠?qū)⒓毎暈樾畔⑻幚硐到y(tǒng),并構建生命的虛擬表征。
隨著AIVC對細胞和分子系統(tǒng)的理解不斷深化,科學家將能夠更高效地對這些系統(tǒng)進行編程,并設計新的合成系統(tǒng)。AI模型已被用于設計新的CRISPR酶、功能性蛋白,甚至整個原核生物基因組。所有領域的利益相關者都應積極參與這一宏偉的科學事業(yè)。我們堅信,通過大規(guī)模的科學合作、共享目標、開放的洞察力分享,以及安全、倫理和可靠的AI技術的應用,我們正邁向一個科學探索和理解的新紀元。AI與生物學的融合,尤其是通過AIVC,標志著生物學領域的一次范式轉變,并為解開細胞的多重謎團帶來了樂觀的希望。
參考文獻
Bunne C, Roohani Y, Rosen Y, Gupta A, Zhang X, Roed M, Alexandrov T, AlQuraishi M, Brennan P, Burkhardt DB, Califano A, Cool J, Dernburg AF, Ewing K, Fox EB, Haury M, Herr AE, Horvitz E, Hsu PD, Jain V, Johnson GR, Kalil T, Kelley DR, Kelley SO, Kreshuk A, Mitchison T, Otte S, Shendure J, Sofroniew NJ, Theis F, Theodoris CV, Upadhyayula S, Valer M, Wang B, Xing E, Yeung-Levy S, Zitnik M, Karaletsos T, Regev A, Lundberg E, Leskovec J, Quake SR. How to build the virtual cell with artificial intelligence: Priorities and opportunities. Cell. 2024 Dec 12;187(25):7045-7063. doi: 10.1016/j.cell.2024.11.015. PMID: 39672099.