我們提出了一種多光譜種子表型分析方法,作為管理種質(zhì)庫(kù)種質(zhì)的快速而強(qiáng)大的工具。使用多光譜視覺(jué)系統(tǒng)拍攝 20 種不同水稻品種(每個(gè)品種約 30 粒種子)的種子圖像。 然后從圖像中提取特征信息。 特征數(shù)據(jù)的多變量分析用于根據(jù)種質(zhì)對(duì)種子表型進(jìn)行分類(lèi)。 正確分類(lèi)的水稻種子比例為93%。 我們得出結(jié)論,多光譜圖像分析可以在比較傳入種子與現(xiàn)有種質(zhì)、識(shí)別種子樣本中的不同種子類(lèi)型和/或檢查再生種子是否與原始種子匹配方面發(fā)揮作用。
圖1.Blob檢測(cè)
使用VideometerLab 3.0版軟件,將圖像(即包含種子圖像的培養(yǎng)皿)標(biāo)記為具有背景(培養(yǎng)皿)和前景(種子)的區(qū)域(圖 1(a))。然后使用典型判別分析 (CDA) 計(jì)算屬于兩個(gè)不同類(lèi)別的像素光譜的協(xié)方差矩陣之間和內(nèi)部,創(chuàng)建用于分割(識(shí)別圖像中的種子)的評(píng)分圖像(圖 1(b)) ;圖 1(c))。在分割之后,我們最終得到了 20 個(gè)種質(zhì)的總共 598 個(gè)二元標(biāo)記對(duì)象(BLOB),每個(gè)都包含一個(gè)單獨(dú)的水稻種子(BLOB)(圖 1(d))。
第一個(gè)規(guī)范函數(shù)
真正的IRGC登錄號(hào)
圖2.(a)前兩個(gè) CDA 函數(shù)的散點(diǎn)圖,覆蓋了種質(zhì)的示例大米圖像。框中顯示的數(shù)字是國(guó)際水稻基因庫(kù)收藏(IRGC)登錄號(hào)。 (b)應(yīng)用優(yōu)化模型后得到的誤差矩陣。沿對(duì)角線的陰影數(shù)字表示 BLOB(水稻種子)的數(shù)量被正確分配(預(yù)測(cè)類(lèi)別 ¼ 真實(shí)類(lèi)別)。其他數(shù)字顯示 BLOB 的數(shù)量分配不正確。正確分類(lèi)種子的總比例為93%。
從每個(gè)BLOB中提取的177個(gè)特征集合被放入一個(gè)矩陣 X∈R598x177:其中一些特征與水稻種子在不同波長(zhǎng)下的反射值有關(guān),一些是(線性)CDA 投影,用于區(qū)分和增強(qiáng)整個(gè)種子和形態(tài)的顏色差異。每個(gè)特征都通過(guò)對(duì)所有種質(zhì)的成對(duì)測(cè)試進(jìn)行測(cè)試,并且沒(méi)有顯示出分離能力的特征被移除。這將特征數(shù)量減少到 90。由于與其他特征的高度相關(guān)性,另外50個(gè)特征被移除(r>0.99;P <0.05),產(chǎn)生一個(gè)矩陣 X∈R598x40。
Matlabw Release 2014a (MathWorks, Natick, MA, USA) 用于建模,使用 k-最近鄰 (k-NN) 分類(lèi)器結(jié)合多類(lèi) CDA。使用交叉驗(yàn)證方案來(lái)驗(yàn)證模型,其中將數(shù)據(jù)分成 N 個(gè)相等的部分,并使用比例 (N 2 1)/N 的數(shù)據(jù)迭代地創(chuàng)建模型。該模型使用剩余的 1/N 數(shù)據(jù)進(jìn)行驗(yàn)證。在迭代過(guò)程中,累積了所有 N 個(gè)測(cè)試部分的分類(lèi)率的預(yù)測(cè)性能。對(duì) k ∈[1, 30] 和 N∈[2, 50] 的每個(gè)組合進(jìn)行分析。分類(lèi)錯(cuò)誤最少的k和N的最佳值分別為6和13,分類(lèi)錯(cuò)誤為 7%(圖 2)。
北京博普特科技有限公司是丹麥Videometer系列產(chǎn)品中國(guó)區(qū)總代理,全面負(fù)責(zé)其系列產(chǎn)品在中國(guó)市場(chǎng)的推廣、銷(xiāo)售和售后服務(wù)。
相關(guān)閱讀
Videometer種子表型組學(xué):種子活力研究-熒光成像
植物病害表型組學(xué):多光譜病害指紋圖譜
Videometer種子表型組學(xué):多光譜成像作為菠菜種子健康檢測(cè)的潛在工具