腎細胞癌(RCC)是最常見的腎癌亞型,每年超400萬例新發(fā)病例,是泌尿系統(tǒng)惡性腫瘤導致的第二大死因。2%-70%的RCC為透明細胞RCC(Clear cell renal cell carcinoma,ccRCC)。DNA甲基化(DNA methylation,DNAm)是主要的表觀遺傳修飾之一,在維持基因轉錄和基因組穩(wěn)定性方面具有至關重要的作用。DNAm在ccRCC的發(fā)病機制中起著重要作用,許多研究集中于DNAm異常變化與ccRCC預后之間的相關性,但基于DNAm驅動基因的ccRCC預后模型鮮有報道。
2023年6月7日,南方醫(yī)科大學附屬龍華人民醫(yī)院泌尿外科鄧瓊研究員等在《BMC Genomics》發(fā)表題為“Identification and validation of a DNA methylation-driven gene-based prognostic model for clear cell renal cell carcinoma“的研究論文,該研究以ccRCC患者的DNA為對象,通過簡化基因組重亞硫酸鹽測序(RRBS)等技術方法,鑒定出ccRCC患者的ccRCC早期診斷和預后的DNA甲基化生物標志物。
標題:Identification and validation of a DNA methylation-driven gene-based prognostic model for clear cell renal cell carcinoma(基于DNA甲基化驅動基因的腎透明細胞癌預后模型的鑒定和驗證)
時間:2023-06-07
期刊:BMC Genomics
影響因子:IF 4.4
技術平臺:RRBS等
摘要:
腎透明細胞癌(ccRCC)是一種形態(tài)異質且預后不良的惡性腫瘤。本研究旨在建立DNA甲基化(DNAm)驅動的ccRCC基因預后模型。本研究對ccRCC患者的DNA提取物進行了RRBS測序分析。對10對患者樣本的RRBS數據進行分析以篩選候選CpG位點,然后訓練并驗證18個CpG位點模型,并結合臨床特征建立了用于ccRCC預后或風險評估的列線圖(Nomogram model)模型。研究在啟動子區(qū)域鑒定出2261個DMR。經DMR篩選后,共篩選出578個候選基因,與450K芯片中的408個CpG二核苷酸相對應。從TCGA數據集中收集了478個ccRCC樣本的DNAm圖譜。通過單因素Cox回歸、LASSO回歸和多因素Cox比例風險回歸分析對319個樣本的training集進行分析,共鑒定出18個CpG的預后組。結合臨床特征構建了預后模型,在測試集(test set,159個樣本)和整組(whole set,478個樣本)中,Kaplan-Meier曲線差異顯著;ROC曲線和生存分析顯示AUC>0.7。結合臨床病理特征和甲基化風險評分的列線圖表現較好,決策曲線分析也顯示出有益的效果。
本研究深入了解了高甲基化在ccRCC中的作用。鑒定出的靶標可作為ccRCC早期診斷和預后判斷的生物標志物。本研究對更好的風險分層和個性化治療具有重要意義。
研究結果
(1)RRBS質控結果
表3:C和CpG位點甲基化和比對
表4:CG、CHG、CHH平均甲基化水平(>1X深度)
圖1:樣本間全基因組甲基化差異。
- 樣本中CpG甲基化水平相關性。較大的圓形區(qū)域和較深的顏色表示高相關性。
- 聚類樹狀圖。根據歐幾里得距離,使用R.Ward.d2的hclust函數對樣本進行聚類。選擇最小方差方法作為聚類方法
(2)DMR鑒定
圖2:DMR分析
- 平均甲基化差異。X軸代表甲基化差異。負值表示低甲基化。正值表示高甲基化。Y軸表示相應橫坐標的DMR數量。
- DMR甲基化分布密度。X軸代表Ca組中的DMR甲基化水平;Y軸代表對照組中的DMR甲基化水平。DMR密度從低到高(白色到紅色)。
- DMR在基因元件上的分布
(3)ccRCC預后模型構建
圖3:差異甲基化CpG(differentially methylated CpG,dmCpG)位點鑒定。
A、 使用調諧參數(lambda)對CpG位點進行LASSO回歸分析。
B、 蛋白質-蛋白質互作。
C、 18個dmCpG位點的DisGeNet疾病富集分析。
D、 18個dmCpG位點的GO富集分析
表5:預后模型中18個CpG位點的注釋
(4)預后模型的Training
圖4:training集中的風險評分
- 高風險組和低風險組患者的KM生存曲線。數據顯示為四分位間距的中位數。使用Log-rank檢驗評估統(tǒng)計學顯著性。虛線顯示50%生存概率的顯著性。
- 計算高風險和低風險患者的風險評分和生存狀態(tài)等級。虛線顯示區(qū)分ccRCC高風險和低風險患者的臨界值。
- C.18個CpG位點甲基化水平熱圖。
- 風險評分的1年、3年、5年和10年ROC曲線。以臨界值決定該模型的敏感性和特異性
圖5:test集中的風險評分
(5)預后模型的驗證
圖6:基于預后模型和臨床特征的列線圖
預后模型和臨床特征的單因素(A)和多因素(B)回歸分析。(C)預測ccRCC患者1年、3年、5年和10年生存時間概率列線圖
圖7:模型校準和ROC評估
- 高風險組和低風險組患者的KM生存曲線。
- 預測ccRCC患者1年、3年、5年和10年總生存期(OS)的列線圖。
C-F. 1年(C)、3年(D)、5年(E)、10年(F)的臨床病理特征(綠色,與腫瘤分期診斷、年齡和腫瘤組織學分級相結合),RiskScore(紅色)和NomoScore(黑色)的ROC曲線
結論
本研究分析了患者樣本中的RRBS數據以篩選原始候選CpG位點,然后利用TCGA-KIRC數據訓練和驗證了18個CpG位點模型,并結合臨床特征建立了用于ccRCC預后或風險評估的列線圖模型。
基于該結果,研究開發(fā)并驗證了這種新型預后模型是一種實用、可靠的ccRCC患者預后工具。本研究結果支持異常DNAm變化與腫瘤發(fā)生密切相關的觀點,并為ccRCC提供了潛在的新型預后生物標志物,對更好的風險分層和個性化治療具有重要意義。
參考文獻:
Deng Q, Du Y, Wang Z, Chen Y, Wang J, Liang H, Zhang D. Identification and validation of a DNA methylation-driven gene-based prognostic model for clear cell renal cell carcinoma. BMC Genomics. 2023 Jun 7;24(1):307.