在DNA測序儀制造中實現(xiàn)高保真性
在Ion Torrent™產(chǎn)品的開發(fā)過程中,賽默飛以建立可量化的核酸下一代測序試驗為傲,目標很簡單,就是準確測序每個堿基。我們每天的工作旨在制造可以對每個堿基進行測序并正確識別變異的工具。.我們利用質(zhì)控品——即序列已知的樣品——來達成這個目標。最佳的質(zhì)控品通常都經(jīng)過了多種技術的測量。這種做法的原理是:在排除每種單獨試驗的系統(tǒng)誤差后,幾種不同測序試驗對共有序列測序的結果將共同生成一個“正確答案”。簡而言之,如果共有序列經(jīng)過多種不同方法的測量,那么其綜合結果便是可信的。
圍繞“瓶中基因組”計劃,美國國家標準技術研究所 (NIST) 制造了一批工具并以此提供至關重要的公共服務。如果將來確定測序結果與臨床相關,那么DNA測序儀能夠產(chǎn)生正確結果這一認知將增進研究人員對此結果的信任。
準確性取決于單次讀取還是多次讀取?
那么我們應該如何選擇測量的切入點以確定是否獲得了正確結果呢?測序儀準確度測量的常見做法是將儀器單次讀取的結果與已知序列進行比對以獲得其準確度。這可以實現(xiàn)每個堿基與“真值”的比較。然而在實際檢測中所采用的做法是從海量的正常序列中找出基因序列變異。下一代測序儀并不只讀取序列一次,而是很可能要讀取上千次。每次讀取的結果都需要對比參考序列來進行匹配或定位,而后不同于參考序列的位點(即變異)將被識別。在定位和變異識別過程中,非系統(tǒng)誤差得以從數(shù)據(jù)中排除,從而產(chǎn)生最準確的變異檢測結果。得益于NIST“瓶中基因組”真值集,賽默飛了解到一旦使用了匹配不當?shù)淖儺愖R別參數(shù),測序儀生成的數(shù)據(jù)可能比系統(tǒng)實際可生成的要差。這使我們進一步知道了整個過程所面臨的重大挑戰(zhàn)——將定位和突變識別過程與每臺測序儀的特定誤差模式進行匹配。在NIST進行的最初研究中,Ion Proton™測序儀數(shù)據(jù)通過基因組分析工具箱 (GATK) 變體識別通道生成的單核苷酸多態(tài)性 (SNP) 靈敏度只有42%。然而,當使用了升級版的數(shù)據(jù)集以及針對Ion Torrent™數(shù)據(jù)進行過優(yōu)化的變異識別參數(shù),SNP靈敏度直接激增至92%以上。
變異識別算法很重要
賽默飛投入了大量資源,專門為Ion Torrent™數(shù)據(jù)創(chuàng)建和優(yōu)化變體識別通道。我們發(fā)現(xiàn),在變異識別過程中,充分利用堿基流空間信息有助于清除許多假陽性結果,進而提供更準確的變異識別。賽默飛認為這是目前最好的算法。為讓更多研究人員了解這一算法,賽默飛已經(jīng)在GitHub的GPLv2開源許可協(xié)議下發(fā)布了該變異識別器的源代碼。伴隨Torrent Suite™ v4.2的新近發(fā)布,賽默飛對Torrent Variant Caller™ (TVC)進行了設計優(yōu)化,使其在Torrent Suite™軟件以外的平臺上同樣可以工作:現(xiàn)在它可以在最常見的Linux®環(huán)境中的命令行模式下運行,以支持采用了集群配置的系統(tǒng)。
對于Ion Torrent™數(shù)據(jù),TVC是最好的變體識別器嗎?
賽默飛認為Torrent Variant Caller™ (TVC) 是針對Ion Torrent™數(shù)據(jù)整體表現(xiàn)最好的變異識別器。同時我們也明白,科學的進步有賴于各自的同行對彼此工作的批判性審查。賽默飛歡迎同時運行TVC算法和GATK以及其他算法的相關團體給予各種反饋。
進一步了解Torrent Suite軟件內(nèi)置的TVC,請訪問Ion Community。
參考文獻
Zook JM, Chapman B, Wang J, Mittelman D, Hofmann O, Hide W, Salit M. Nat. Biotechol. 2014 Mar 32(3):246-51. “Integrating human sequence data sets provides a resource of benchmark SNP and indel genotype calls” doi: 10.1038/nbt.2835
Zook JM, Chapman B, Wang J, Mittelman D, Hofmann O, Hide W, Salit M. Nat. Biotechol. 2014 Mar 32(3):246-51. “Integrating human sequence data sets provides a resource of benchmark SNP and indel genotype calls” doi: 10.1038/nbt.2835
關于賽默飛世爾科技
賽默飛世爾科技(紐約證交所代碼:TMO)是科學服務領域的世界領導者。公司年銷售額170億美元,在50個國家擁有員工約50,000人。我們的使命是幫助客戶使世界更健康、更清潔、更安全。我們的產(chǎn)品和服務幫助客戶加速生命科學領域的研究、解決在分析領域所遇到的復雜問題與挑戰(zhàn),促進醫(yī)療診斷發(fā)展、提高實驗室生產(chǎn)力。借助于Thermo Scientific、Life Technologies、 Fisher Scientific和Unity™ Lab Services四個首要品牌,我們將創(chuàng)新技術、便捷采購方案和實驗室運營管理的整體解決方案相結合,為客戶、股東和員工創(chuàng)造價值。欲了解更多信息,請瀏覽公司網(wǎng)站:www.thermofisher.com 。
賽默飛世爾科技中國
賽默飛世爾科技進入中國已超過30年,在中國的總部設于上海,并在北京、廣州、香港、臺灣、成都、沈陽、西安、南京、武漢等地設立了分公司,員工人數(shù)超過3800名。為了滿足中國市場的需求,現(xiàn)有8家工廠分別在上海、北京、廣州和蘇州運營。我們在全國共設立了6個應用開發(fā)中心,將世界級的前沿技術和產(chǎn)品帶給國內(nèi)客戶,并提供應用開發(fā)與培訓等多項服務;位于上海的中國創(chuàng)新中心結合國內(nèi)市場的需求和國外先進技術,研發(fā)適合中國的技術和產(chǎn)品;我們擁有遍布全國的維修服務網(wǎng)點和特別成立的中國技術培訓團隊,在全國有超過2000名專業(yè)人員直接為客戶提供服務。我們致力于幫助客戶使世界更健康、更清潔、更安全。欲了解更多信息,請登錄www.thermofisher.cn 。