長鏈非編碼RNA(lncRNAs)在腫瘤發(fā)生和免疫應答中起著重要作用。迄今為止,大多數(shù)lncRNA研究嚴重依賴于Bulk RNA測序數(shù)據(jù),即各種不同細胞類型的平均信號,這限制了細胞特異性lncRNA功能的發(fā)現(xiàn)。盡管缺乏低豐度細胞特異性lncRNA的注釋,單細胞RNA測序(scRNA-seq)仍是一個潛在的解決方案。因此,進一步分析lncRNA的不同細胞特征表達和注釋在研究lncRNA參與腫瘤免疫微環(huán)境中是必要的。
1.總結(jié)大量腫瘤研究中與癌癥發(fā)展、進展和腫瘤抑制有關(guān)的功能性lncRNAs的信息。
2.概述當前癌癥和免疫相關(guān)的lncRNAs在細胞水平上的真實表達以及l(fā)ncRNAs在TIME中可能具有的細胞功能的知識。
3.討論單細胞分析在研究TIME lncRNAs的細胞功能方面的前景和挑戰(zhàn)。本文著重對單細胞技術(shù)在研究TIME lncRNAs的細胞功能方面進行導讀。
TIME lncRNAs的單細胞分析 單細胞轉(zhuǎn)錄組測序允許在單細胞水平上檢測新的lncRNAs標記或其功能。Kim等人分析來自體細胞不同重編程階段的單細胞數(shù)據(jù),發(fā)現(xiàn)幾個lncRNAs集顯示重編程過程中表達的動態(tài)變化。Bocchi等人從發(fā)育中的人類紋狀體產(chǎn)生Bulk和單細胞測序數(shù)據(jù)發(fā)現(xiàn)新的lncRNAs調(diào)控網(wǎng)絡。
當前,有研究使用單細胞分析深入研究了腫瘤細胞和非腫瘤細胞之間的交互。然而,大多數(shù)研究都集中在蛋白質(zhì)編碼基因(PCGs)上。只有少數(shù)人對lncRNAs進行了分析。Lee等人使用單細胞測序數(shù)據(jù)觀察到lncRNAs在轉(zhuǎn)移性透明細胞腎細胞癌(ccRCC)中的特定作用。作者發(fā)現(xiàn)共有173個lncRNAs與ccRCC轉(zhuǎn)移相關(guān),并將它們命名為ccRCC轉(zhuǎn)移相關(guān)lncRNAs(CMALs)。基于CMALs和PCGs之間的共表達網(wǎng)絡分析,CMALs似乎有助于細胞粘附、免疫反應和細胞增殖,其中12種通過特異性調(diào)節(jié)TNF和HIF1信號通路來促進癌癥轉(zhuǎn)移。盡管全球?qū)用娴膯渭毎鹟ncRNAs研究很少見,但Lnc2Cancer 3.0或LnCeCell等數(shù)據(jù)庫提供了全面的概述,尤其是針對細胞特異性lncRNA相關(guān)的ceRNA網(wǎng)絡和RNA-RNA相互作用。lncRNA的單細胞研究數(shù)量如此有限的原因包括細胞類型特異性lncRNAs的注釋不完整以及它們在TIME中的表達相對較低。因此,TIME lncRNAs的綜合圖譜將是鑒定TIME中功能性lncRNAs的重要資源。
scRNA-seq的一般程序通過比較bulk和單細胞水平的標記分析可知:bulk RNA-seq主要捕獲在大量腫瘤樣本中差異表達的lncRNAs標記,而與細胞類型組成無關(guān)。scRNA-seq捕獲特定于某些細胞類型的lncRNAs標記物以及特定于腫瘤特定細胞類型的標記物。用于lncRNAs研究的單細胞平臺基于液滴的方法(例如10x或Dropseq)在帶有poly-A尾的RNA的3'-末端或在5'-末端產(chǎn)生單細胞讀數(shù)RNAs,因此需要使用高置信度的基因末端位置來正確量化lncRNAs。由于lncRNAs的豐度低,一些lncRNAs序列僅部分組裝,所以目前基因注釋中沒有全長序列;诎宓姆椒ǎɡ鏢MART-seq2)按細胞對全長轉(zhuǎn)錄本進行測序。與3'-end scRNA-seq相比,全長scRNA-seq通常從更少的細胞中捕獲信息,所以讀取覆蓋率和每個細胞的基因數(shù)量通常遠高于3'-end scRNA-seq,可以說全長scRNA-seq為識別TIME中的細胞類型特異性lncRNAs提供了一種更靈敏的方法。
利用公開的肺癌scRNA-seq數(shù)據(jù)集對兩個有代表性的單細胞平臺:10x Chromium 3’-seq(10x)和SMARTseq2(SS2)在lncRNAs檢測的敏感性方面進行了比較。大約37.6%和65.4%的lncRNAs(以bulk RNA-seq數(shù)據(jù)表示)也分別在10x和SS2平臺中以相似的水平[≥1個轉(zhuǎn)錄本(TPM)]檢測到。
單細胞RNA-seq數(shù)據(jù)集中基因的TPM分布,這些基因在每個scRNA-seq平臺中的TCGA(肺腺癌和鱗狀細胞癌,10X,肺腺癌,SS2)中以≥1 TPM檢測到。在10x和SS2平臺中分別可檢測到約74.9%和98.2%(≥0.1 TPM)。正如預期的那樣,盡管敏感性取決于測序深度,SS2似乎對lncRNAs的檢測更敏感。單細胞水平的腫瘤和非腫瘤樣本之間的差異表達基因(single cell DEGs)可能與整體水平的差異表達基因(DEGs)不同,主要是因為單細胞DEGs存在于細胞水平。事實上,超過一半的細胞類型特異性腫瘤/非腫瘤標志物(10x為63.64%,SS2為66.67%)僅在scRNA-seq數(shù)據(jù)中發(fā)現(xiàn),表明對于TIME中的主要和次要細胞類型,scRNA-seq對標志物的檢測將更具特異性。
腫瘤和非腫瘤樣本中單細胞DEG lncRNAs的比例與來自大量RNA-seq數(shù)據(jù)或偽大量RNA-seq數(shù)據(jù)的比例重疊。通過比較來自每種細胞類型的腫瘤和非腫瘤樣品的單細胞之間的基因表達,獲得單細胞DEGs。通過比較來自成對腫瘤和非腫瘤樣本的大量RNA-seq數(shù)據(jù)之間的基因表達以及分別從來自腫瘤和非腫瘤組織的scRNA-seq數(shù)據(jù)轉(zhuǎn)換而來的偽大量數(shù)據(jù)之間的基因表達,獲得大量和偽大量DEGs。Bulk DEGs分析僅概括了15.2%和30.9%的單細胞DEGs,表明SS2對DEGs的檢測也更敏感。然而,SS2在反義轉(zhuǎn)錄本的準確定量方面存在局限性,因為SS2產(chǎn)生的讀數(shù)沒有鏈特異性信息。SS2的更新版本SMART seq3現(xiàn)在提供鏈特異性信息并且可以更準確地量化反義轉(zhuǎn)錄本。因此,先前在大量腫瘤樣本中研究的許多l(xiāng)ncRNAs的細胞類型特異性表達和功能可以使用各種可用的scRNA seq數(shù)據(jù)集進行驗證(見下表)。這一過程可以提供關(guān)于TIME特定細胞類型中已知和新的lncRNAs功能和調(diào)節(jié)作用的新見解。
結(jié)論 lncRNAs通過多種調(diào)控機制在癌癥和免疫系統(tǒng)中發(fā)揮著至關(guān)重要的作用。然而,在TIME中l(wèi)ncRNAs的表達和功能表征幾乎沒有在單細胞水平上進行研究,主要是由于lncRNAs的細胞類型特異性高以及缺乏細胞類型特異性lncRNAs注釋。單細胞技術(shù)和相關(guān)生物信息學工具的更新以及不斷改進lncRNAs的細胞類型特異性注釋將有助于克服目前對此類RNA進行scRNA-seq分析的局限性。這一成就將開啟一個新的篇章,揭示TIME在惡性細胞和浸潤性免疫細胞中表達的臨床相關(guān)lncRNAs,并彌合先前研究的空白。