使用SBC ToolBox云平臺時間序列分析模塊探索基因集在不同時間點(diǎn)的表達(dá)趨勢,使用c-means算法對基因集進(jìn)行聚類分群,尋找出表達(dá)趨勢一致的基因集。SBC ToolBox云平臺超快響應(yīng),分分鐘獲取分析結(jié)果。
如何使用SBC ToolBox云平臺進(jìn)行時間序列分析?
進(jìn)入時間序列模
a) 登錄SBC ToolBox官方網(wǎng)址:
https://www4.shbiochip.com/SBCToolBox/
進(jìn)入VIP專區(qū),點(diǎn)擊時間序列分析模塊即可進(jìn)入App。
b) 也可以直接登錄站點(diǎn):
https://www4.shbiochip.com/V2023/svip/TSA/
c) 此模塊僅提供給VIP用戶,已有賬戶直接登錄,沒有賬戶這里可以點(diǎn)擊注冊申請,申請審核通過后會郵件和短信通知VIP注冊用戶。
實戰(zhàn)
a) 數(shù)據(jù)準(zhǔn)備(數(shù)據(jù)分析思維->充分認(rèn)識數(shù)據(jù)):
i.定量數(shù)據(jù):無論你的數(shù)據(jù)是RNA定量數(shù)據(jù)、蛋白定量數(shù)據(jù)、代謝定量數(shù)據(jù)、還是其他類型的多特征集多樣本量數(shù)據(jù),時間序列分析模塊都能完美駕馭。時間序列模塊所需的定量數(shù)據(jù)一般長這個樣子;第一列為基因集(特征集),剩余列為樣本(觀測值)對應(yīng)基因集的定量數(shù)據(jù)。
ii. 分組數(shù)據(jù):無論你的時間點(diǎn)組內(nèi)數(shù)據(jù)有重復(fù)樣本,還是沒有這里都需要提供,主要用于重復(fù)數(shù)據(jù)在組內(nèi)的集中趨勢評估,分組數(shù)據(jù)示例如下圖。
1.第一列為樣本信息,樣本信息與定量的樣本信息必須一致。
2.第二列為樣本對應(yīng)的分組信息,這里的分組一般是時間點(diǎn),時間點(diǎn)的順序決定了展示在時間序列趨勢上的排列順序。
3.示例數(shù)據(jù)詳見應(yīng)用操作指南:
b) 數(shù)據(jù)準(zhǔn)備完成,提交分析:
i. 將定量數(shù)據(jù)和對應(yīng)分組上傳或者拖拽至App數(shù)據(jù)上傳接口(下圖紅框),上傳完成顯示Upload complete,提交分析,看到主頁面上的小花花開始轉(zhuǎn)動表示已啟動分析。
ii.眨眼的功夫,時間序列分析結(jié)果就展示在你的面前,沒辦法,SBC ToolBox響應(yīng)就是這么迅速。
iii.分析結(jié)果,默認(rèn)情況下基因集(特征集)在不同時間點(diǎn)上的表達(dá)趨勢將會被分成16個Cluster,此處對Cluster數(shù)量不滿意可以隨時進(jìn)行調(diào)整。橫坐標(biāo)表示時間點(diǎn)順序,縱坐標(biāo)表示基因集在時間點(diǎn)上的表達(dá)強(qiáng)度(這里做過中心化(scale)處理)。
iv.放大Cluster1觀察細(xì)節(jié),Cluster1基因集整體表達(dá)隨時間變化呈現(xiàn)先上升后輕微下降的趨勢。圖中橫坐標(biāo)展示每個時間點(diǎn),一條線代表一個基因的在時間點(diǎn)表達(dá)趨勢,黑色的先表示整體的集中表達(dá)趨勢。
c) 參數(shù)調(diào)整:
i. 注意事項。
時間序列模塊默認(rèn)會對定量數(shù)據(jù)進(jìn)行l(wèi)og2(x+1)變換,你的數(shù)據(jù)做過標(biāo)準(zhǔn)化預(yù)處理,這里可以下拉菜單選擇“否”取消log2(x+1)變換處理。
ii. Cluster數(shù)量太多或者太少,這里可以調(diào)整Cluster數(shù)量進(jìn)行設(shè)定重新分析。
這里重新設(shè)定總共Cluster為9,重新提交分析,將原來的16個Cluster調(diào)整為9個Cluster,結(jié)果如上圖所示。
iii. 結(jié)果展示行列排列不滿意,這里同樣可以調(diào)整。
d) 沒有重復(fù)數(shù)據(jù)同樣也可以進(jìn)行時間序列分析,示例如下:
i.定量數(shù)據(jù)(六個樣本)示例:
ii.分組數(shù)據(jù)(將六個樣本設(shè)置為6組,六個時間點(diǎn))示例:
iii.上傳數(shù)據(jù)提交分析,秒出結(jié)果:
不同基因集在六個時間點(diǎn)上的表達(dá)趨勢。
結(jié)果保存
a) 保存圖片,默認(rèn)保存pdf格式:
b) 保存基因集數(shù)據(jù),第一列為基因,第二列為基因集對應(yīng)Cluster,剩余列為基因中心化后的數(shù)據(jù),此文件可用于ggplot展示。
教你使用SBC ToolBox
一鍵完成趨勢線圖展示美化
a) 登錄平行坐標(biāo)圖模塊
官方網(wǎng)址:
https://www4.shbiochip.com/SBCToolBox/
b) 準(zhǔn)備數(shù)據(jù)
i. 將時間序列數(shù)據(jù)分成兩個文件:
1.基因?qū)?yīng)時間點(diǎn)表達(dá)強(qiáng)度文件,這里只需要刪除時間序列結(jié)果中的cluster列即可。
2.基因集對應(yīng)Cluster文件,這里只需要保存時間序列結(jié)果中基因和基因?qū)?yīng)Cluster列即可。
c) 上傳時間序列分析數(shù)據(jù)并提交分析,你就可以得到基于ggplot包的可視化結(jié)果,基于sci的顏色搭配,讓你的數(shù)據(jù)展示更上一層樓。數(shù)據(jù)結(jié)果嗖的一下就能完成,立等可取。
d) 這里可以調(diào)整時下熱門暗黑主題。
手里有數(shù)據(jù)不要慌,使用SBC ToolBox開啟你的數(shù)據(jù)分析之旅,讓數(shù)據(jù)分析so easy。