English | 中文版 | 手機(jī)版 企業(yè)登錄 | 個(gè)人登錄 | 郵件訂閱
當(dāng)前位置 > 首頁(yè) > 技術(shù)文章 > 深度神經(jīng)網(wǎng)絡(luò)助力對(duì)腫瘤細(xì)胞鑒定及空間惡性區(qū)域的識(shí)別

深度神經(jīng)網(wǎng)絡(luò)助力對(duì)腫瘤細(xì)胞鑒定及空間惡性區(qū)域的識(shí)別

瀏覽次數(shù):826 發(fā)布日期:2024-7-29  來(lái)源:本站 僅供參考,謝絕轉(zhuǎn)載,否則責(zé)任自負(fù)

在腫瘤相關(guān)單細(xì)胞轉(zhuǎn)錄組測(cè)序中,腫瘤細(xì)胞的甄別一直是一個(gè)讓人頭疼的問(wèn)題。CNV可以用于區(qū)分腫瘤細(xì)胞和正常細(xì)胞,常用的inferCNV方法往往需要一個(gè)清晰的非腫瘤細(xì)胞注釋做為參考去佐證腫瘤細(xì)胞,CopyKAT對(duì)于細(xì)胞數(shù)量多的分析項(xiàng)目是極不友好的,時(shí)間成本消耗也是極高的。下面介紹一種新的腫瘤細(xì)胞預(yù)測(cè)的方法:Cancer-Finder,其可以應(yīng)用于腫瘤細(xì)胞的鑒定和空間惡性區(qū)域的識(shí)別。

Cancer-Finder是一種基于深度學(xué)習(xí)算法,用于單細(xì)胞轉(zhuǎn)錄組數(shù)據(jù)腫瘤細(xì)胞預(yù)測(cè)和空間轉(zhuǎn)錄組數(shù)據(jù)惡性區(qū)域的識(shí)別的軟件,其平均預(yù)測(cè)精準(zhǔn)度可以高達(dá)95.16%。Cancer-Finder收集13種不同腫瘤相關(guān)組織的單細(xì)胞數(shù)據(jù)集做為訓(xùn)練數(shù)據(jù)集對(duì)腫瘤細(xì)胞進(jìn)行預(yù)測(cè)。

img1

與當(dāng)前一些腫瘤細(xì)胞預(yù)測(cè)手段,諸如:CaSee、CopyKAT、SCEVAN、ikarus等比較,Cancer-Finder分析時(shí)間花費(fèi)的更少,效果更佳。Cancer-Finder使用Python語(yǔ)言編寫(xiě),也有著對(duì)計(jì)算機(jī)資源消耗相對(duì)較少的優(yōu)點(diǎn)。

img2

如何安裝?

基于Linux的軟件安裝:

1. 首先,下載Cancer-Finder到本地,并解壓,進(jìn)入該目錄,你可看到如下文件結(jié)構(gòu),infer.py為預(yù)測(cè)腫瘤細(xì)胞程序。

img3

2. 然后,使用Conda安裝 Cancer-Finder。

a) 首先創(chuàng)建一個(gè)名字叫csf的虛擬環(huán)境并安裝3.9.16版本的python軟件:

conda create -n scf python==3.9.16

b) 然后激活scf虛擬環(huán)境:conda activate scf

c) 最后使用pip安裝Cancer-Finder所需模塊:

pip install -r requirements.txt -i 

pip install matplotlib==3.8 -i 

d) 注意事項(xiàng):這里推薦使用Python的清華鏡像(-i 參數(shù)),安裝速度較快,matplotlib建議使用3.8版本。以上安裝步驟親測(cè)可用。

 

如何運(yùn)行預(yù)測(cè)程序?

執(zhí)行下面一行代碼即可開(kāi)啟分析。

python -u infer.py --ckp=../sc_pretrain_article.pkl --matrix=sample_data/sample_data_matrix.tsv --out=out.csv

--ckp參數(shù):用于預(yù)測(cè)腫瘤細(xì)胞或者區(qū)域的預(yù)訓(xùn)練好的模型數(shù)據(jù),存儲(chǔ)為.pkl格式文件。Cancer-Finder提供了預(yù)訓(xùn)練完成的單細(xì)胞模型數(shù)據(jù) sc_pretrain_article.pkl 和空間轉(zhuǎn)錄組模型數(shù)據(jù) st_pretrain_article.pkl。

--matrix參數(shù):待注釋的表達(dá)矩陣文件,支持tsv、csv、h5ad格式的文件。

--out 參數(shù):結(jié)果輸出。

輸出結(jié)果一共兩列,如下圖,第一列為細(xì)胞信息,第二列為細(xì)胞對(duì)應(yīng)預(yù)測(cè)結(jié)果信息,1.0代表被預(yù)測(cè)為腫瘤細(xì)胞,0.0代表被預(yù)測(cè)為非腫瘤細(xì)胞。從結(jié)果上看這里的目標(biāo)是只需區(qū)分腫瘤細(xì)胞和非腫瘤細(xì)胞即可,其本質(zhì)是機(jī)器學(xué)習(xí)中的深度神經(jīng)網(wǎng)絡(luò)解決二元分類問(wèn)題。

img4

 

如何訓(xùn)練自己的模型數(shù)據(jù)?

Cancer-Finder提供的預(yù)訓(xùn)練模型數(shù)據(jù)(單細(xì)胞和空間轉(zhuǎn)錄組模型數(shù)據(jù))可能并不適用于某些領(lǐng)域的研究,所以提供了訓(xùn)練私有模型的程序 train.py 。

python -u train.py  \

    --train_dir=\     

    --val_dir=\         

    --batch_size=\   

    --lr=\        

    --max_epoch=\    

    --output=\       

    --gpu_id=                

數(shù)據(jù)結(jié)構(gòu)詳細(xì)請(qǐng)參考下載到本地的Cancer-Finder軟件包 data目錄。

 

實(shí)際效果如何?

使用GEO數(shù)據(jù)(GSE155446)比較預(yù)測(cè)結(jié)果。

python -u infer.py --ckp=sc_pretrain_article.pkl --matrix=GSE155446_human_raw_counts.csv --out=GSE155446_human.rs.tsv

img5

上圖中Pred標(biāo)簽UMAP圖為使用Cancer-Finder對(duì)腫瘤細(xì)胞的預(yù)測(cè)結(jié)果的展示,1代表腫瘤細(xì)胞,0代表非腫瘤細(xì)胞;CellType標(biāo)簽的UMAP圖為數(shù)據(jù)集提供的注釋結(jié)果展示。從UMAP圖上可以清晰看出Cancer-Finder預(yù)測(cè)的腫瘤細(xì)胞與注釋高度一致。接下來(lái)看下注釋結(jié)果與預(yù)測(cè)結(jié)果的比例情況,如下圖。

img6

從上圖可以看出Cancer-Finder識(shí)別出了極高比例的腫瘤細(xì)胞,從這個(gè)案例可以看出Cancer-Finder的效果是很好的,此數(shù)據(jù)接近4w的細(xì)胞數(shù)量,在幾分鐘內(nèi)可以完成腫瘤細(xì)胞的識(shí)別,有著相當(dāng)不俗的表現(xiàn)。在已知背景數(shù)據(jù)集中Cancer-Finder的預(yù)測(cè)能力是極好的,對(duì)于未知領(lǐng)域的數(shù)據(jù)可以綜合不同的算法交叉比較,大概率應(yīng)該對(duì)個(gè)性化研究也會(huì)有著不錯(cuò)的結(jié)果。

對(duì)于空間轉(zhuǎn)錄的數(shù)據(jù),大家可以小試牛刀。

 

參考文獻(xiàn):

Zhong, Z., Hou, J., Yao, Z. et al. Domain generalization enables general cancer cell annotation in single-cell and spatial transcriptomics. Nat Commun 15, 1929 (2024).

來(lái)源:上海生物芯片有限公司
聯(lián)系電話:400-100-2131
E-mail:marketing@shbiochip.com

用戶名: 密碼: 匿名 快速注冊(cè) 忘記密碼
評(píng)論只代表網(wǎng)友觀點(diǎn),不代表本站觀點(diǎn)。 請(qǐng)輸入驗(yàn)證碼: 8795
Copyright(C) 1998-2025 生物器材網(wǎng) 電話:021-64166852;13621656896 E-mail:info@bio-equip.com