2. 單個(gè)細(xì)胞系的轉(zhuǎn)錄組異質(zhì)性
根據(jù)轉(zhuǎn)錄組異質(zhì)性的模式。在UMAP中,42個(gè)細(xì)胞系大致可以分為離散型和連續(xù)型兩種類型(圖2a)。由于這些細(xì)胞系中存在亞克隆,不同的亞簇在空間上被觀察到是離散的,而連續(xù)的亞簇在亞簇之間沒有明確的邊界?偣灿25個(gè)細(xì)胞系(57%)和17個(gè)細(xì)胞系(43%)分別屬于離散組和連續(xù)組(圖2b)。總體而言,離散/連續(xù)分類與多樣性得分相關(guān)性較好,其中多樣性得分最高的前25%的細(xì)胞系大多數(shù)是離散模式(圖2b),并且離散組的多樣性評分明顯高于連續(xù)組,這表明具有高度異質(zhì)性的細(xì)胞系通常派生出不同的亞類。然而,也有一些離散細(xì)胞系的多樣性評分較低,如SW620,而連續(xù)模式細(xì)胞系的多樣性評分較高,如SK-BR-3(圖2b)。對于前者,簇內(nèi)距離明顯小于簇間距離。因此,盡管在集體距離不是很大的情況下,該細(xì)胞系的多樣性得分較低,但根據(jù)分類,該細(xì)胞系呈現(xiàn)出離散的模式。對于后者,集體距離可以很大,而簇內(nèi)距離與簇間距離沒有顯著差異。綜上所述,兩個(gè)指標(biāo)顯示的細(xì)胞系內(nèi)異質(zhì)性表明,轉(zhuǎn)錄組多樣性可能受到不同亞克隆的存在以及細(xì)胞系內(nèi)在可塑性的影響,這兩個(gè)因素對細(xì)胞系內(nèi)異質(zhì)性的貢獻(xiàn)在單個(gè)細(xì)胞系中有所不同。
3. 轉(zhuǎn)錄組異質(zhì)性形成的分子特征
接下來,將相似的NMF合并到NMF集群中,以確定40個(gè)癌細(xì)胞系中的復(fù)發(fā)性NMF程序。在3個(gè)以上的細(xì)胞系中鑒定出了12個(gè)異質(zhì)性激活的簇(圖2c)。隨后,基于同一簇內(nèi)單個(gè)程序之間的共有基因,其中出現(xiàn)在超過25%的程序中的基因被用作標(biāo)志基因。大多數(shù)細(xì)胞系共有的兩個(gè)最突出的簇與細(xì)胞周期有關(guān),包括G1/S和G2/M程序(圖2c、d),這表明細(xì)胞周期變化是大多數(shù)細(xì)胞系中觀察到的轉(zhuǎn)錄組異質(zhì)性的主要原因。除了細(xì)胞周期相關(guān)的程序外,另外10個(gè)簇代表了各種關(guān)鍵的生物過程(圖2d)。
4. 人細(xì)胞系的泛癌scATAC-seq
進(jìn)一步使用scATAC-seq在單細(xì)胞分辨率下研究單個(gè)細(xì)胞系內(nèi)的表觀基因組異質(zhì)性。為了提高通量和降低scATACseq實(shí)驗(yàn)的成本,每次運(yùn)行scATACseq時(shí),最多合并6個(gè)具有不同表達(dá)譜的細(xì)胞系,然后根據(jù)差異表達(dá)基因的可及性特征計(jì)算分配給相應(yīng)的細(xì)胞系(圖3a)。經(jīng)過質(zhì)量過濾,獲得54,597個(gè)高質(zhì)量的單核,每個(gè)細(xì)胞系的中位數(shù)為1170個(gè)核(范圍從203到4391個(gè)核),每個(gè)細(xì)胞核的中位數(shù)片段為11,702個(gè)。然后,我們匯總scATAC-seq譜來計(jì)算開放染色質(zhì)區(qū)域的基因組分布,結(jié)果顯示35.5%的ATAC峰定位在啟動子-近端區(qū)域(<±1.5 kb TSS)。使用UMAP將39個(gè)細(xì)胞系一起繪制,以呈現(xiàn)染色質(zhì)水平上的細(xì)胞系間距離,每個(gè)細(xì)胞系形成一個(gè)不同的簇(圖3b)。為了在表觀基因組水平上評估細(xì)胞系內(nèi)的異質(zhì)性,我們將細(xì)胞劃分為細(xì)胞系內(nèi)的初步集群。結(jié)果,62%的細(xì)胞系表現(xiàn)為無差別模式,38%的細(xì)胞系表現(xiàn)為差異模式(圖3c)?傮w而言,不加區(qū)分差異分類與多樣性評分相關(guān)性良好,屬于差異組的細(xì)胞系的多樣性評分明顯高于不加區(qū)分組的細(xì)胞系(圖3d、e),這表明具有高度異質(zhì)性的細(xì)胞系通常派生出不同的亞簇。
5. 與CNVs相關(guān)的轉(zhuǎn)錄組異質(zhì)性
為明確觀察到轉(zhuǎn)錄異質(zhì)性的起源,我們首先轉(zhuǎn)向惡性腫瘤常見的遺傳變異。使用scRNA-seq數(shù)據(jù)分析大規(guī)?截悢(shù)變異(CNV),計(jì)算了與正常細(xì)胞相比,每個(gè)位點(diǎn)周圍400個(gè)基因平均表達(dá)水平。該分析在40個(gè)(62.5%)癌細(xì)胞系中鑒定出25個(gè)CNV亞克。▓D4a、b),表明CNV誘導(dǎo)的拷貝數(shù)變異在很大程度上有助于轉(zhuǎn)錄變異;17個(gè)(42.5%)細(xì)胞系未顯示相關(guān)性(圖4b)。在這25個(gè)細(xì)胞系中,分別有18個(gè)和7個(gè)細(xì)胞系表現(xiàn)為離散型和連續(xù)型,其余15個(gè)細(xì)胞系中分別有6個(gè)和9個(gè)細(xì)胞系表現(xiàn)為離散型和連續(xù)型。這表明,當(dāng)遺傳變異導(dǎo)致細(xì)胞系內(nèi)部異質(zhì)性時(shí),細(xì)胞系傾向于以更離散的方式呈現(xiàn)異質(zhì)性轉(zhuǎn)錄組活性。然后,研究了位于CNV區(qū)域的基因是否有助于這些匹配細(xì)胞系的轉(zhuǎn)錄組變異性。結(jié)果顯示,差異表達(dá)的基因確實(shí)在CNV區(qū)域顯著富集(圖4c),表明遺傳變異是決定離散型細(xì)胞系細(xì)胞系內(nèi)異質(zhì)性的重要因素。這一事實(shí)也表明,即使對于那些具有不同模式的細(xì)胞系,也存在其他因素影響轉(zhuǎn)錄組異質(zhì)性。
6. 染色質(zhì)可及性調(diào)控轉(zhuǎn)錄組異質(zhì)性
為了探索表觀基因組異質(zhì)性的機(jī)制,我們采用了包括ArchR28和ChromVAR30在內(nèi)的兩種方法,試圖推斷驅(qū)動細(xì)胞亞簇之間差異染色質(zhì)可及性的潛在轉(zhuǎn)錄因子,并重點(diǎn)研究了至少三種細(xì)胞系中出現(xiàn)的常見TF(圖5a)。參與調(diào)節(jié)IFN應(yīng)答的IRF1、IRF2、IRF9和STAT2,在LS 174T和hnscum - 02t細(xì)胞系中被異質(zhì)激活。然后,我們將重點(diǎn)放在分別在scRNA-seq和scATAC-seq數(shù)據(jù)中表現(xiàn)出離散和差異模式的7個(gè)細(xì)胞系上,試圖在兩個(gè)數(shù)據(jù)集之間匹配子簇。根據(jù)scATAC-seq數(shù)據(jù)計(jì)算基因評分矩陣,然后根據(jù)基因評分與基因表達(dá)的相似性進(jìn)行比對。結(jié)果,在7個(gè)細(xì)胞系中的3個(gè),包括MDA-MB-231、RPMI 8226和SNB75,細(xì)胞亞簇可以在兩個(gè)數(shù)據(jù)集之間自如匹配(圖5b、c、d)。根據(jù)scATAC-seq和scRNA-seq數(shù)據(jù),MDA-MB-231細(xì)胞分別聚為4個(gè)和3個(gè)亞組,其中scATAC-seq數(shù)據(jù)集的亞組2與scRNA-seq數(shù)據(jù)集的亞組1和2的混合匹配。對于SNB75,,scATAC-seq數(shù)據(jù)的3亞組與scRNA-seq數(shù)據(jù)的0和1亞組的混合匹配,其余scATAC-seq數(shù)據(jù)的亞組與scRNA-seq亞組呈一對一的相關(guān)性(圖5b、c、d)。這表明染色質(zhì)可及性和CNV的異質(zhì)性可以獨(dú)立促成轉(zhuǎn)錄組異質(zhì)性,對于這三種細(xì)胞系,染色質(zhì)可及性對轉(zhuǎn)錄組異質(zhì)性有很大貢獻(xiàn)。
為了進(jìn)一步探索驅(qū)動異質(zhì)染色質(zhì)可及性和RNA表達(dá)的分子機(jī)制,我們試圖推斷結(jié)合差異可及性染色質(zhì)區(qū)域的潛在TF。通過測量基因組特征集內(nèi)染色質(zhì)可及性的增益或損失來推斷TF活性,同時(shí)控制技術(shù)偏差,揭示潛在的TF在亞群之間表現(xiàn)出可變性(圖5e)。在MDA-MB-231中,發(fā)現(xiàn)FOXA2的活性在0亞組中特異性上調(diào)(圖5f),F(xiàn)OXA2的啟動子可及性在0亞組中也有所增加(圖5g)。我們隨后分析了FOXA2的下游靶標(biāo),發(fā)現(xiàn)它們與“Kras_signaling_up”相關(guān)的基因更多相關(guān)(圖5h),這些基因在0亞組中表達(dá)上調(diào)(圖5i)。FOXA2可以在腫瘤發(fā)育過程中協(xié)同KrasG12D的激活。我們的結(jié)果表明FOXA2可能在控制異質(zhì)性中起重要作用。
圖 5
7. ecDNA分布誘導(dǎo)的轉(zhuǎn)錄組異質(zhì)性
最近的研究表明,癌基因擴(kuò)增既存在于染色體上,也存在于染色體外環(huán)狀dna (ecDNAs)上。由于在ecDNA中沒有著絲粒,與染色體擴(kuò)增子相比,它們不太穩(wěn)定,并且隨機(jī)地分離到子細(xì)胞,這可能是細(xì)胞異質(zhì)性的潛在驅(qū)動力。為了研究ecDNA對轉(zhuǎn)錄組異質(zhì)性的貢獻(xiàn),我們首先建立了一種分析方法,該方法能夠利用scATAC-seq數(shù)據(jù)檢測高潛力的ecDNA區(qū)域,基于以下假設(shè):(1)ecDNA高度擴(kuò)增;(2) ecDNA具有更高的可及性。根據(jù)scATAC-seq數(shù)據(jù),在每個(gè)單細(xì)胞中讀取覆蓋率呈現(xiàn)多個(gè)峰,其中第一個(gè)峰被認(rèn)為是兩個(gè)拷貝基因組區(qū)域的讀取覆蓋率,因此在這里定義為參考覆蓋率。為了尋找潛在的ecDNA片段,我們首先將整個(gè)基因組分成100,000 bp的bin,在歸一化測序深度后量化每個(gè)細(xì)胞中每個(gè)bin的讀取覆蓋率。然后,我們計(jì)算相對讀取覆蓋率,作為每個(gè)bin的覆蓋率與單元的參考覆蓋率的比率。由于ecDNA具有更高的可及性,相對覆蓋率至少為6的區(qū)域被定義為潛在的ecDNA片段,并通過TSS富集評分和細(xì)胞數(shù)量進(jìn)一步過濾。此外,考慮到scATAC-seq數(shù)據(jù)的稀疏性,如果由于實(shí)驗(yàn)和作圖偏差,該區(qū)域沒有被scATAC-seq讀取均勻和充分覆蓋,即使來自連續(xù)基因組區(qū)域的ecDNA也可以基于scATAC-seq數(shù)據(jù)檢測到多個(gè)ecDNA片段。因此,我們已經(jīng)鑒定的ecDNA片段的數(shù)量應(yīng)該高于在細(xì)胞中發(fā)現(xiàn)的不同ecDNA物種的數(shù)量。
為了解決這個(gè)問題,研究了它們在單個(gè)細(xì)胞系中不同潛在ecDNA片段之間的讀取覆蓋率的相關(guān)性,并將附近和高度相關(guān)的片段合并為潛在的ecDNA區(qū)域。然后,我們將合并的區(qū)域定義為潛在的ecDNA區(qū)域。如圖6a所示,在31個(gè)細(xì)胞系中,每個(gè)細(xì)胞系中檢測到229個(gè)潛在的ecDNA區(qū)域。我們的方法成功地發(fā)現(xiàn)了實(shí)驗(yàn)證實(shí)的ecDNA,如K562中的chr9:130700000-131400000,其中ABL1和NUP214位于11中。致癌基因在潛在的ecDNA區(qū)域顯著富集(圖6a)。與沒有致癌基因的ecDNA相比,在單個(gè)細(xì)胞系中,含有致癌基因的ecDNA出現(xiàn)在更高比例的細(xì)胞中(圖6b),這表明含有致癌基因的ecDNA為細(xì)胞提供了生長優(yōu)勢,因此具有異質(zhì)性。考慮到ecDNA可以通過增加DNA拷貝數(shù)來增加轉(zhuǎn)錄RNA的數(shù)量,我們進(jìn)一步計(jì)算了ecDNA上的基因表達(dá)與ecDNA在每個(gè)細(xì)胞中的相對覆蓋數(shù)之間的相關(guān)性,發(fā)現(xiàn)它們是部分相關(guān)的(圖6c)。例如,位于SCC-4細(xì)胞系不同ecDNA中的基因KRT14和KRT17、LGALS2、SERPINE1和PCOLCE在SCC-4細(xì)胞系中以不同的三個(gè)亞簇特異性表達(dá)(圖6d)。鑒定這些基因高表達(dá)的細(xì)胞比例與含有這些基因的ecDNA的細(xì)胞比例高度相關(guān)(圖6e)。這一結(jié)果表明,ecDNA的高拷貝數(shù)有助于ecDNA中基因的高表達(dá)。為了進(jìn)一步評估ecDNA對轉(zhuǎn)錄異質(zhì)性的影響,我們選擇了MDA-MB231,其scATAC-seq和scRNA-seq數(shù)據(jù)可以整合(圖5b-d),以反映scRNA-seq數(shù)據(jù)分析的UMAP中ecDNA的拷貝數(shù)。如圖6f所示,Chr12: 5900000_7200000 ecDNA在亞簇0中特別富集。同時(shí),位于該ecDNA上的CD9、LTBR、PTMS、TPI1、ENO2、C12orf57等基因在亞簇0中也有高表達(dá)(圖6g), CD9是亞簇0的頂級標(biāo)記基因之一。這些結(jié)果表明,ecDNAs可以影響基因表達(dá),從而影響細(xì)胞聚集。
8. 低氧處理重塑細(xì)胞系內(nèi)異質(zhì)性
腫瘤的發(fā)生和發(fā)展是一個(gè)動態(tài)的過程,伴隨著微環(huán)境的劇烈變化。微環(huán)境在腫瘤進(jìn)展、治療抵抗和轉(zhuǎn)移形成中發(fā)揮重要作用,并增加了另一層調(diào)控,可驅(qū)動腫瘤內(nèi)異質(zhì)性。在這里,我們試圖評估這些轉(zhuǎn)錄組異質(zhì)性在不同條件下是靜態(tài)的還是可塑性的。鑒于在實(shí)體瘤中,腫瘤細(xì)胞經(jīng)常處于不同程度的缺氧狀態(tài),我們選擇缺氧處理作為環(huán)境應(yīng)激進(jìn)行擾動,結(jié)果顯示,缺氧處理后,低氧相關(guān)基因發(fā)生了顯著變化。為了匹配缺氧治療前后的細(xì)胞亞群,我們觀察到兩種類型的相關(guān)模式:(1)細(xì)胞簇在缺氧處理前后是一對一匹配的,這表明缺氧處理沒有改變細(xì)胞簇之間的差異,如ZR-75-1(圖7a);(2)一些細(xì)胞簇從一個(gè)分裂到多個(gè),這表明一個(gè)細(xì)胞簇內(nèi)的細(xì)胞可能對缺氧有不同的反應(yīng),如DLD-1和SW620(圖7c、e)。為了確定在一個(gè)亞群中引起對缺氧應(yīng)激差異反應(yīng)的潛在機(jī)制,我們重點(diǎn)研究了在缺氧下分裂的亞群。例如,在缺氧條件下,DLD-1的子簇0分為2個(gè)簇(圖7c)。我們檢查了集群0和0-1/0-2之間的差異表達(dá)基因(DEGs):集群0和0-1之間變化最大的基因是缺氧相關(guān)基因,如BNIP3L、SLC2A1和ERO1A,而集群0和0-2之間的缺氧相關(guān)DEGs有限(圖7d)。這表明原簇0中存在兩組細(xì)胞對缺氧的反應(yīng)不同,但在缺氧處理前的轉(zhuǎn)錄水平差異不明顯。同樣,在SW620細(xì)胞中,簇0被分為簇0-1和簇0-2(圖7e);盡管所有細(xì)胞都對缺氧有反應(yīng),但簇0-1中的細(xì)胞顯示了與EMT相關(guān)的其他基因的變化(圖7f)。