English | 中文版 | 手機版 企業(yè)登錄 | 個人登錄 | 郵件訂閱
當前位置 > 首頁 > 技術文章 > Nature文獻解讀:WGBS揭示最全正常人類細胞類型的綜合DNA甲基化圖譜

Nature文獻解讀:WGBS揭示最全正常人類細胞類型的綜合DNA甲基化圖譜

瀏覽次數(shù):578 發(fā)布日期:2024-11-12  來源:本站 僅供參考,謝絕轉載,否則責任自負
DNA甲基化是一種基本的表觀遺傳標記,可以調控基因表達和染色質組裝,從而為研究細胞身份和發(fā)育過程提供了重要視角。當前已有的數(shù)據(jù)集通常只包括部分甲基化位點,并且常;谠谂囵B(yǎng)過程中經(jīng)歷了巨大變化的細胞系,或者是基于包含未指定混合細胞的組織。
 
2023年,以色列耶路撒冷希伯來大學Tommy Kaplan等人基于深度全基因組亞硫酸鹽測序(WGBS)對來自205個健康組織樣本中分選的39種細胞類型的數(shù)千個獨特標記進行片段級分析,構建了人類DNA甲基化圖譜。研究發(fā)現(xiàn),相同細胞類型的重復樣本之間的相似性超過99.5%,顯示出細胞身份程序對環(huán)境動態(tài)變化的穩(wěn)健性(robustness)。相關研究成果以“A DNA methylation atlas of normal human cell types”為題發(fā)表在《自然》(Nature)期刊上。

 

題目:A DNA methylation atlas of normal human cell types
期刊:Nature
影響因子:50.5
技術平臺:WGBS
 
本研究通過WGBS對不同細胞類型的DNA甲基化圖譜進行無監(jiān)督聚類分析,追溯到組織發(fā)育的關鍵因子,并鑒定出自胚胎發(fā)育起始的保守甲基化模式。研究揭示特定細胞類型中特異性未甲基化位點通常位于轉錄增強子中,并包含組織特異性轉錄調控因子的DNA結合位點。特異性高甲基化位點則較為罕見,且富含CpG島、Polycomb靶點和CTCF結合位點,表明其在塑造細胞類型特異性染色質回路中可能發(fā)揮新作用。該圖譜為研究基因調控和與疾病相關的遺傳變異提供一個基本資源,并為液體活檢中使用的潛在組織特異性生物標志物提供了大量可能性。
 
人類細胞類型的DNA甲基化圖譜
為了繪制不同細胞類型中的全基因組DNA甲基化圖譜,研究人員對205個樣本(包括77種主要細胞類型)進行WGBS(平均深度至少為30×的150bp的配對末端測序)。所選樣本經(jīng)過仔細分選并比對到人類參考基因組(hg19,hg38),通過流式細胞術、基因表達和DNA甲基化分析鑒定平均樣本純度(所需細胞類型材料比例)超過90%。所分析的細胞類型(圖1)代表了大多數(shù)主要的人類細胞類型,可以對生理系統(tǒng)(如胃腸道、造血細胞和胰腺)進行綜合觀察,以及比較不同環(huán)境中的類似細胞類型(如組織駐留的巨噬細胞)。

 

圖1:成人人體的甲基化圖譜。

 
在18kb區(qū)域中顯示了344個CpG位點(列)上205個甲基化體(行)的DNA甲基化模式。突出顯示的是B細胞(藍色)、神經(jīng)元(綠色)、甲狀腺上皮(黃色)和神經(jīng)元/少突膠質細胞(少突膠質)(粉紅色)中未甲基化的區(qū)域。
 
205個甲基化圖譜在重復樣本中相似,而在不同細胞類型之間則以區(qū)塊方式顯著變化。研究人員在特定細胞類型中鑒定差異甲基化區(qū)域,以揭示細胞類型特異性的生物過程,定義細胞身份,并促進甲基化生物標志物的發(fā)展,以鑒定循環(huán)cfDNA片段的細胞起源。

研究人員開發(fā)了一個名為wgbstools的計算機器學習套件,用于分析WGBS數(shù)據(jù),通過鑒定多個條件下DNA甲基化模式的變化點,將基因組切割成7104162個不重疊連續(xù)區(qū)塊。每個區(qū)塊跨越高度相關的CpG位點,在每個樣本中甲基化程度相似,保留至少包含三個CpG位點的2783421個甲基化塊(平均長度為544 bp),以及8個CpG位點。對這些緊湊的基因組進行穩(wěn)健分析比單獨CpG位點更為直接,并且由于甲基化的區(qū)域性質,可以被視為人類DNA甲基化的生物學“原子”。
 
甲基化記錄發(fā)展歷程
DNA甲基化模式不僅可以反映細胞的功能身份,還可以追溯其發(fā)展歷程。為了鑒定早期祖先后代共有模式,研究人員計算了至少包含四個CpG位點的區(qū)塊平均甲基化水平,并選擇樣本中的最高變異性區(qū)塊(21000個區(qū)塊,前1%)。使用無監(jiān)督聚類分析對所有205個甲基化圖譜進行聚類,系統(tǒng)地將相同細胞類型的生物學樣本分組(圖2),類似于純化的人血細胞基于陣列的聚類。支持了細胞分離的可重復性,并表明每個正常細胞類型的三~四個重復足以檢測其甲基化模式,可用于生物標志物鑒定等實際應用中。

 

圖2:無監(jiān)督聚類揭示健康細胞類型的人類發(fā)育譜系。
 
細胞類型特異性甲基化標志物
接下來研究以細胞類型特異性方式差異甲基化的基因組區(qū)域,作者將205個樣本分為39種特定細胞類型,每種細胞類型的前25個差異性未甲基化區(qū)域構成了一個包含1246個標記的人類細胞類型特異性甲基化圖譜(圖3)。這些區(qū)域在特定細胞類型中表現(xiàn)出特異性未甲基化(平均甲基化水平為13%),而在所有其他樣本甲基化(平均甲基化水平為91%),可以作為敏感的生物標志物,用于定量混合物中特定細胞類型。這些標記包括953個細胞類型特異性未甲基化位點,以及另外293個在少數(shù)相關細胞類型中未甲基化的位點。

 

圖3:39種細胞類型共205個樣本的人類甲基化圖譜。

 
a. 總共有953個基因組區(qū)域以細胞類型特異性方式未甲基化。圖中的每個單元格標記了39個細胞類型(行)中每個基因組區(qū)域(列)的平均甲基化水平。每個細胞類型顯示多達25個區(qū)域,每個區(qū)域的平均長度為356 bp(9個CpG位點)。
b. 心肌細胞的前25個區(qū)域。每個區(qū)域繪制了圖譜中所有29種細胞類型205個樣本中每個CpG位點(列)的平均甲基化水平。
c. 心肌細胞特異性未甲基化位點。淺藍色高亮標記為120 bp(6個CpG位點),位于MYL4基因的第一個內含子中,MYL4是一個心臟特異性基因(心房附屬物TPM表達量為2518);蚪M快照顯示六個心肌細胞樣本、四個心臟成纖維細胞樣本和三個主動脈樣本(兩個內皮細胞和一個平滑肌細胞)的平均甲基化水平(紫色軌跡)。
d. 三個心肌細胞樣本、一個心臟成纖維細胞樣本和兩個主動脈樣本(內皮細胞和平滑肌細胞)的亞硫酸鹽轉化片段可視化。黃色和藍色點分別表示甲基化和未甲基化的CpG位點。
 
人類細胞類型特異性調控圖
接下來,研究人員表征這些細胞類型特異性差異未甲基化區(qū)域。分別利用轉座酶可及染色質測序(ATAC-seq)、DNase I超敏位點測序(DNaseI-seq)分析細胞類型特異性標記的DNA可及性和染色質狀態(tài)。分析結果表明,單核細胞和巨噬細胞中前250個未甲基化標記高度可及,并且以單核細胞中的H3K27ac和H3K4me1為特征,而其他細胞類型標記在單核細胞中沒有富集,同時還揭示了細胞類型特異性標記chromHMM增強子注釋的強烈協(xié)調富集(圖4a)。這些發(fā)現(xiàn)與之前將組織特異性去甲基化與基因增強子聯(lián)系起來的研究一致。

為進一步評估細胞類型特異性未甲基化區(qū)域的生物學重要性,作者研究了它們與轉錄因子(TFs)的關聯(lián)。使用每種細胞類型前1000個未甲基化標記進行motif分析,計算這些標記所富集的TF結合motif,研究結果表明對于大多數(shù)細胞類型,Top motifs包括主調控因子和關鍵TFs(圖4b)。例如,B細胞富含Ebf2/HEB/E2A,粒細胞富含CEBP/AP1/ETS,T細胞富含ETS/RUNX。細胞類型特異性未甲基化區(qū)域與TF結合motif之間的關聯(lián)可以鑒定新的基因調控回路,并暴露在特定細胞類型中活躍的遠端增強子。

 
圖4:作為潛在增強子的細胞類型特異性標記。
 
a. 單核細胞/巨噬細胞的前250個細胞類型特異性未甲基化標記,顯示了活性調控標記H3K27ac、增強子標記H3K4me1、DNA可及性和chromHMM增強子注釋的平均ChIP-seq信號。作為比較,其他血細胞類型(粒細胞和B、T及NK細胞)的前250個標記的平均信號以灰色線條顯示。
b. 細胞類型特異性標記調控motif的富集。顯示每個細胞類型中前1000個差異性未甲基化區(qū)域富集的top轉錄因子結合位點motif。
 
細胞類型特異性高甲基化位點
作者研究了在一種細胞類型中甲基化而在人體其他部位未甲基化的基因組區(qū)域(即特異性高甲基化區(qū)域),這些區(qū)域富含CpG島且在其他細胞類型中被H3K27me3和Polycomb標記(圖5a-c)。
 
在綜合分析所有細胞類型特異性高甲基化區(qū)域后,結果揭示特異性高甲基化區(qū)域對染色質調節(jié)因子CTCF的靶向序列強富集(圖5d),表明CTCF結合位點的DNA甲基化可能作為組織特異性調控開關來調控其結合,可能影響組織特異性的三維基因組。為了驗證這一假設,作者比較了CTCF位點的DNA甲基化模式與特定組織中全基因組CTCF蛋白結合模式(圖5e),結果顯示在結腸和腸道特異性甲基化位點的甲基化模式和已發(fā)表的體內CTCF占有情況。與DNA甲基化抑制CTCF結合一致,ChIP數(shù)據(jù)顯示結腸中這個位點CTCF結合的選擇性丟失。此外,在特定細胞類型中甲基化位點富集了神經(jīng)基因的轉錄抑制因子RE1-沉默TF/神經(jīng)元限制性沉默因子(REST/NRSF)的靶標,且在胰島細胞的甲基組中最突出(圖5f)。

 
圖5:細胞類型特異性高甲基化區(qū)域富集于CpG島、Polycomb靶點以及CTCF和REST/NRSF。
 
a. Top細胞類型特異性高甲基化標記中有38%(3,613個中的1363個)與CpG島重疊。
b. 這些區(qū)域通常在其他細胞類型中富含H3K27me3。
c. 單核細胞和巨噬細胞中的Polycomb注釋(chromHMM),包括所有或單核細胞/巨噬細胞特異性標記。
d. 細胞類型中前100個細胞類型特異性高甲基化區(qū)域的motif分析鑒定出已知CTCF和REST/NRSF motif。
e. 對hg19位點(chr. 1: 209364093–209364250)的ChIP-seq數(shù)據(jù)分析,該位點在小腸和結腸上皮中特異甲基化(紅框1),在其他地方未甲基化。
f. 在內分泌胰腺中,前100個細胞類型特異性高甲基化區(qū)域中有14%存在REST/NRSF motif,頂級delta細胞標記中有7%,頂級alpha細胞標記中有2%,與背景序列中大約0.1%相比,這與內分泌胰腺中REST靶標表達一致。
 
片段級甲基化組反卷積

 

圖6:使用細胞類型特異性生物標志物的片段級反卷積。
 
易小結:
本研究通過WGBS繪制了人類原代細胞類型的全面DNA甲基化圖譜,篩選出一套廣泛的細胞類型特異性標記,并開發(fā)出一套用于混合細胞類型樣本片段級分析的計算工具。這些工具的開發(fā)補充了現(xiàn)有的大量基于芯片陣列甲基化圖譜和去卷積工具,也可用于分析陣列數(shù)據(jù)。這些數(shù)據(jù)共同揭示了DNA甲基化在細胞生物學和基因調控中的作用,并促進了在每種細胞類型中活躍的增強子的鑒定。本研究的圖譜最有前景的用途可能是混合細胞類型樣本的片段級去卷積,允許在癌癥和其他疾病患者的血漿中高靈敏度的鑒定cfDNA的起源組織。

參考文獻:
Loyfer N, et al. A DNA methylation atlas of normal human cell types. Nature. 2023 Jan;613(7943):355-364. pii: 10.1038/s41586-022-05580-6. doi: 10.1038/s41586-022-05580-6. PubMed PMID: 36599988.
來源:深圳市易基因科技有限公司
聯(lián)系電話:0755-28317900
E-mail:wuhuanhuan@e-gene.cn

標簽: DNA甲基化
用戶名: 密碼: 匿名 快速注冊 忘記密碼
評論只代表網(wǎng)友觀點,不代表本站觀點。 請輸入驗證碼: 8795
Copyright(C) 1998-2025 生物器材網(wǎng) 電話:021-64166852;13621656896 E-mail:info@bio-equip.com