蛋白質(zhì)組(Proteome)指由一個(gè)基因組或一個(gè)細(xì)胞、組織表達(dá)的所有蛋白質(zhì)。蛋白質(zhì)全譜分析目的在于鑒定樣本中盡可能多的肽和蛋白質(zhì)混合物的組分。基于質(zhì)譜技術(shù)的全譜鑒定,可為蛋白高通量的定量和修飾分析提供參考信息。傳統(tǒng)的方法如蛋白質(zhì)微量測(cè)序、氨基酸組成分析(如Edman降解法)費(fèi)時(shí)費(fèi)力、通量低,存在不容易實(shí)現(xiàn)規(guī);妥詣(dòng)化,結(jié)果靈敏度差等問題。當(dāng)前主流的基于軟電離技術(shù)的液相色譜-質(zhì)譜系統(tǒng)(LC-MS/MS)是實(shí)現(xiàn)高通量蛋白鑒定的主要方法。
其基本原理是:首先將純化后的蛋白質(zhì)用消化酶(如胰酶)水解成肽段,肽段混合物經(jīng)過除鹽后首先進(jìn)入液相色譜,實(shí)現(xiàn)初步分離,以降低樣品復(fù)雜度。經(jīng)液相色譜分離后的肽段先經(jīng)過質(zhì)譜的第一級(jí)--離子源(ESI,MALDI)使肽段離子化并形成分散的離子。接著選擇部分強(qiáng)度較高的肽段母離子進(jìn)入質(zhì)譜的第二級(jí)系統(tǒng)(碎裂源)做進(jìn)一步碎裂,使肽段離子被打碎成更小的、有規(guī)律的碎片離子。理論上蛋白質(zhì)序列經(jīng)過酶解后形成肽段,肽段再經(jīng)過理論二級(jí)碎裂形成理論的二級(jí)碎片離子譜圖。然后用實(shí)驗(yàn)產(chǎn)生的MS/MS譜圖信息(主要包括質(zhì)荷比、離子強(qiáng)度)與理論產(chǎn)生的MS/MS譜圖信息比對(duì),通過比較兩者的相似度來確定譜圖對(duì)應(yīng)哪個(gè)肽段/蛋白(如圖1)。其中理論蛋白質(zhì)數(shù)據(jù)庫來自基因組預(yù)測(cè)或前期實(shí)驗(yàn)驗(yàn)證等數(shù)據(jù)。
目前,常用的數(shù)據(jù)庫有NCBI-nr( http://www.ncbi.nlm.nih.gov/) 、Uniprot( http://www.uniprot.org/)等。常用的搜索引擎有Mascot( http://www.matrixscience.com/) 、Proteinpilot
(http://www.absciex.com/products/software/proteinpilot-software)。Mascot一度被業(yè)界奉為鑒定軟件的金標(biāo)準(zhǔn),但其算法更偏向于鑒定長(zhǎng)度較短的肽段序列。而Proteinpilot由于采用自動(dòng)容錯(cuò)匹配、對(duì)所有可能的蛋白修飾采用了盲搜的策略,無肽段長(zhǎng)度偏向性,鑒定效果更好。
圖1 蛋白質(zhì)組鑒定流程圖
1、通量大:一次實(shí)驗(yàn)可鑒定6000多種蛋白質(zhì)(以人HepG2為例);
2、結(jié)果準(zhǔn)確可靠:質(zhì)譜儀的質(zhì)量精度可達(dá)到1ppm以下,分辨率能達(dá)到4x104以上,可提供高質(zhì)量的數(shù)據(jù)。
3、適用范圍廣泛:對(duì)物種要求無限制,理論上適用于任何物種。
經(jīng)典案例:
題目:A draft map of the human proteome(人類蛋白質(zhì)組草圖繪制)
期刊:Nature
主要技術(shù):LC-MS/MS
文章摘要:采用LC-MS/MS技術(shù),對(duì)30個(gè)來自正常人類的不同組織、器官(17個(gè)成年人組織、7個(gè)胎兒組織、6個(gè)初級(jí)純化造血細(xì)胞)樣品進(jìn)行了深度蛋白質(zhì)組解析,共鑒定到17294個(gè)蛋白,占人類全部有注釋編碼蛋白基因的84%。本文同時(shí)采用蛋白質(zhì)組和基因組學(xué)(Proteogenomic)的方法發(fā)現(xiàn)了一些新的編碼區(qū)(這些區(qū)域過去被認(rèn)為是非編碼區(qū))。這一海量蛋白質(zhì)組數(shù)據(jù)將會(huì)補(bǔ)充現(xiàn)有的基因組和轉(zhuǎn)錄組數(shù)據(jù),從而加速健康、疾病方面的生物醫(yī)學(xué)研究。
圖2 人體中不同樣品來源
圖3 鑒定結(jié)果與數(shù)據(jù)庫PeptideAtlas 和GPMDB收錄的結(jié)果比較