摘要:雙單倍體(DH)技術(shù)在玉米育種中得到了有效的應(yīng)用。該技術(shù)在時間和純合度方面均優(yōu)于傳統(tǒng)玉米育種。 DH技術(shù)的重要過程之一是單倍體種子的選擇。選擇單倍體的最常用方法是 R1-nj(納瓦霍)顏色標(biāo)記。這種顏色標(biāo)記出現(xiàn)在種子胚乳和胚胎中。僅選擇胚乳有色種子并持續(xù)到發(fā)芽階段。這種選擇通常是手動完成的。單倍體種子選擇的自動化將增加成功率并減少勞動力和時間。在這項研究中,我們使用了 87 個單倍體和 326 個二倍體玉米種子作為數(shù)據(jù)集。使用了玉米種子胚的質(zhì)地特征。這些特征是從灰度共生矩陣中獲得的。特征向量使用決策樹、k-最近鄰和人工神經(jīng)網(wǎng)絡(luò)進(jìn)行分類。機(jī)器學(xué)習(xí)技術(shù)的分類性能通過使用 10 折交叉驗證方法進(jìn)行測試。測試結(jié)果表明,決策樹的性能最好,分類成功率為84.48%。
關(guān)鍵詞:玉米;單倍體識別;紋理特征;GLCM;決策樹;kNN;ANN
在這項研究中,使用了為之前的工作創(chuàng)建的數(shù)據(jù)集。該數(shù)據(jù)集包括 413 粒玉米種子,共 87 個單倍體和 326 個二倍體。 所有樣品均作為玉米研究所2016年“國家玉米育種研究”項目的一部分收獲。所有樣品均來自RWS、RWK-76和“RWSxRWK-76”母源單倍體誘導(dǎo)劑150個基因型的雜交結(jié)果。樣品的選擇在胚胎和胚乳中具有不同的R1-nj表達(dá)(淺深色,無密色)。 根據(jù) R1-nj 顏色標(biāo)記手動完成樣本的類別標(biāo)簽分配。 圖 1 給出了數(shù)據(jù)集中單倍體和二倍體玉米種子的樣本圖像。
圖1.(I)單倍體和(II)二倍體玉米種子的樣本圖像
確定在對數(shù)據(jù)集中隨機(jī)選擇的80粒玉米種子進(jìn)行的測量中,統(tǒng)計學(xué)上的35像素半徑代表胚孔。圖2顯示了二倍體玉米種子樣本的種子質(zhì)心和特征提取區(qū)域。
圖2.樣品種子、種子的質(zhì)心和分割的胚區(qū)
單倍體和二倍體玉米種子在結(jié)構(gòu)上彼此不同。紋理特征經(jīng)常用于解決許多不同的模式識別問題。在這項研究中,紋理特征用于分離單倍體和二倍體玉米種子。從數(shù)據(jù)集中,樣品單倍體和二倍體玉米種子胚的圖像已在圖3中給出。
圖3.(I)單倍體和(II)二倍體玉米種子的胚胎圖像
總共使用了48個紋理特征來表示數(shù)據(jù)集中的每個圖像。帶有邊緣直方圖的數(shù)據(jù)集中樣本的分布如圖4所示。單倍體樣本用藍(lán)色強(qiáng)調(diào),而二倍體樣本用橙色突出顯示?梢钥闯觯瑔伪扼w和二倍體標(biāo)本是交織在一起的。這意味著將解決具有挑戰(zhàn)性的分類任務(wù)。
圖4.考慮總共48個紋理特征的記錄分布