SBC ToolBox VIP專區(qū)再添新模塊—GSEA,GSEA(基因集富集分析),基因在差異比較中表達的上下調(diào)與富集分析的碰撞,尋找出與差異上調(diào)或者下調(diào)密切相關(guān)的基因條目(GO、Pathway等)。與經(jīng)常使用的GO、KEGG富集分析不同,GO、KEGG富集分析不考慮基因表達變化程度,GSEA把基因表達值作為考慮因素,也可以把全部表達的基因進行富集分析。一般情況下可以使用GSEA官網(wǎng)提供的客戶端進行基因集富集分析,詳細的操作步驟也可以在官網(wǎng)找到。SBC ToolBox使用R包進行GSEA數(shù)據(jù)分析,其具有輸入數(shù)據(jù)更簡潔,分析速度更快的特點。
GSEA官網(wǎng)鏈接:
https://www.gsea-msigdb.org/gsea/downloads.jsp
登錄GSEA模塊
a) 可以在SBC ToolBox導(dǎo)航頁面的VIP專區(qū)找到GSEA模塊。
b) 也可以直接登錄站點:
https://www4.shbiochip.com/V2023/svip/gsea/
c) 與單細胞和空間轉(zhuǎn)錄分析一樣,此分析模塊為VIP模塊,請老師登錄注冊,審核通過后會以郵件和短信的的方式發(fā)放登錄信息。
登錄地址:
https://www1.shbiochip.com/sbc/regvip.jsp
SBC ToolBox GSEA都有什么?
a) 內(nèi)嵌MSigDB九大經(jīng)典數(shù)據(jù)集
i. H: hallmark gene sets:結(jié)合手動篩選和自動化計算方法生成的50個hallmark基因集,包含了細胞組分、發(fā)育、DNA損傷、免疫、代謝、通路、增值、信號相關(guān)的基因集。
ii. C1: positional gene sets:基因位置信息基因集。
iii. C2:curated gene sets:精選數(shù)據(jù)集包含了經(jīng)典通路和化學(xué)及遺傳擾動相關(guān)基因集。
iv. C3:motif gene sets:轉(zhuǎn)錄因子,miRNA靶基因調(diào)節(jié)相關(guān)的基因集。
v. C4:computational gene sets:對癌癥相關(guān)的基因芯片數(shù)據(jù)進行數(shù)據(jù)挖掘的癌癥相關(guān)基因集。
vi. C5:GO gene sets:GO基因集。
vii.C6:oncogenic signatures:致癌相關(guān)特征基因集。
viii.C7:immunologic signatures:免疫相關(guān)特征基因集。
ix. C8:cell type signature gene sets:細胞類型相關(guān)特征基因集。
b) 自定義數(shù)據(jù)庫
i. 感興趣的基因集不在內(nèi)嵌數(shù)據(jù)庫中,可以將自有數(shù)據(jù)庫上傳GSEA模塊進行基因集富集分析。
ii. 手搓數(shù)據(jù)集,老師自己收集組成的數(shù)據(jù)集也是支持的,但是比附符合以下格式。
iii. SBC ToolBox GSEA模塊自定義數(shù)據(jù)集格式:
一共兩列:第一列為基因集條目名字,第二列為數(shù)據(jù)集條目名字對應(yīng)的基因集GeneSymbol名字,這里的自定義數(shù)據(jù)集僅支持.xlsx格式的文件。
注意:一個基因集條目對應(yīng)多個基因,多個基因集條目組成GSEA分析參考基因集。
c) 可視化
i. 對GSEA結(jié)果進行基因集條目展示。
SBC ToolBox GSEA怎么使用
a) 數(shù)據(jù)準(zhǔn)備及上傳
i.數(shù)據(jù)準(zhǔn)備:.xlsx格式包含兩列,第一列為GeneSymbol(該列與基因集中的GeneSymbol一致),第二列為差異倍數(shù)的log2變換。
ii.數(shù)據(jù)上傳:側(cè)邊欄點擊MSigDb GSEA組件,直接將數(shù)據(jù)點擊上傳或者拖拽下面紅框中,此接口為MSigDb和自定義數(shù)據(jù)集的統(tǒng)一數(shù)據(jù)上傳接口。
b)MSigDB GSEA參數(shù)調(diào)整
i.物種選擇:下拉菜單欄,可供選擇的為Human、Mouse及Rat三種物種。
ii.數(shù)據(jù)庫選擇:MSigDb數(shù)據(jù)庫的九個基因集,詳細內(nèi)容見MSigDB九大經(jīng)典數(shù)據(jù)集詳解。
c)MSigDB GSEA分析及結(jié)果展示保存
i.點擊提交分析按鈕,程序運行,下圖黑色區(qū)域小花花轉(zhuǎn)圈圈,表示正在分析。
ii.完成分析,會彈出完成對話框,默認(rèn)會展示兩個條目的GSEA展示,及GSEA富集分析結(jié)果表格。
iii.結(jié)果保存,一共可保存三項,1,GSEA富集表格。2,GSEA Top2富集條目展示,3,GSEA 結(jié)果.RDS文件,可用于可視化結(jié)果。
d)自定義數(shù)據(jù)庫分析
i.在下圖紅框中上傳自定義數(shù)據(jù)集,這里不用選擇物種,需要注釋差異基因的GeneSymbol與基因集的GeneSymbol需要一致。
ii.點擊提交分析,分析過程及結(jié)果展示與MSigDb GSEA一致,可以保存自定義數(shù)據(jù)庫的GSEA結(jié)果。
e)可視化,GSEA保存的.rds文件做為上傳數(shù)據(jù)進行結(jié)果可視化。
i.默認(rèn)結(jié)果展示:
ii.展示單個條目,并調(diào)整顏色,這里的條目序號與表格:
iii.調(diào)整展示類型及取消顯著性
iv.可視化結(jié)果詳解
v.與上調(diào)相關(guān)的條目展示
vi.與上調(diào)相關(guān)的條目展示
完成以上步驟,您的GSEA數(shù)據(jù)分析就妥妥完成了。各位老師同學(xué)趕緊開啟您的SBC ToolBox云分析之旅吧!SBC ToolBox 是您科研路上的好搭檔,好幫手,助您在科研道路上披荊斬棘。