出品;科普中國
作者:汪六三(中國科學(xué)院合肥物質(zhì)科學(xué)研究院智能機(jī)械研究所)
監(jiān)制:中國科普博覽
編者按:為展現(xiàn)智能科技動(dòng)態(tài),科普中國前沿科技項(xiàng)目推出“人工智能”系列文章,一窺人工智能前沿進(jìn)展,回應(yīng)種種關(guān)切與好奇。讓我們共同探究,迎接智能時(shí)代。
AI助農(nóng)小助手名片
小助手:近紅外光譜無損檢測水稻種子內(nèi)部裂紋
兩大法寶:無損檢測、人工智能
兩大關(guān)鍵技術(shù):近紅外光譜透射技術(shù)、機(jī)器學(xué)習(xí)算法
能量值:5顆星
證件照:
FT-NIR光譜儀
(圖片來源:作者提供)
智能秋收小助手自我介紹
很高興認(rèn)識你,我是近紅外光譜種子內(nèi)部裂紋檢測技術(shù),是中國科學(xué)院合肥物質(zhì)科學(xué)研究院智能機(jī)械研究所這個(gè)大家庭的成員之一。近紅外光譜種子內(nèi)部裂紋檢測技術(shù)可以在不破壞水稻種子的情況下快速、準(zhǔn)確檢測出種子內(nèi)部裂紋。
區(qū)分水稻種子
水稻是世界上重要的作物,2017年的收獲面積為1.67億公頃,總產(chǎn)量為7.69億噸,為全球近一半的人口提供了基本的食物。為了滿足日益增長的水稻產(chǎn)量需求,人們需要高質(zhì)量的種子。
水稻
(圖片來源:veer圖庫)
然而,水稻種子在人工干燥或收獲前曬干的過程中容易出現(xiàn)內(nèi)部裂紋,在收獲、運(yùn)輸、儲(chǔ)存和搬運(yùn)過程中也容易受到機(jī)械損傷。水稻種子內(nèi)部裂紋影響種子發(fā)芽質(zhì)量和出苗率,同時(shí)人眼很難發(fā)現(xiàn)內(nèi)部裂紋。因此,迫切需要一種能夠在播種前將內(nèi)部開裂的水稻種子與正常種子區(qū)分開來的方法。
傳統(tǒng)的內(nèi)部裂紋水稻種子鑒別方法是目視檢查法。它具有破壞性、主觀性和耗時(shí)性,不適合對大量樣本進(jìn)行測試。因此,有必要提出一種非破壞性和快速的方法來鑒別內(nèi)部開裂的水稻種子。最近,X射線成像已被用于檢測水稻籽粒和菜豆種子的內(nèi)部裂紋。然而,X射線具有輻射性和高成本,不易普及。相比之下,我的誕生提供了一種快速、無損且廉價(jià)的分析方法。
裂紋種子
(圖片來源:作者提供)
近紅外光譜
我所發(fā)射的近紅外光譜是介于可見光和中紅外之間的電磁波,美國材料檢測協(xié)會(huì)將近紅外光譜區(qū)定義為780-2526 nm的區(qū)域。
近紅外光譜區(qū)與有機(jī)分子中含氫基團(tuán)(O-H、N-H、C-H)振動(dòng)的合頻和各級倍頻的吸收區(qū)一致,通過掃描樣品的近紅外光譜,可以得到樣品中有機(jī)分子含氫基團(tuán)的特征信息,而且利用我分析樣品具有方便、快速、高效、準(zhǔn)確和成本較低,不破壞樣品,不消耗化學(xué)試劑,不污染環(huán)境等優(yōu)點(diǎn),已在工業(yè)、農(nóng)業(yè)、醫(yī)藥、食品等領(lǐng)域得到廣泛應(yīng)用。
如何檢測?
研究人員們從當(dāng)?shù)胤N子市場購買的兩種雜交水稻種子(兩優(yōu)566和Y兩優(yōu)1982,兩者均為秈型兩系雜交水稻品種)。99粒(兩優(yōu)566)和40粒(Y兩優(yōu)1982)內(nèi)裂水稻種子是由專業(yè)技術(shù)人員使用自制燈箱測量儀器選出的。此外,還篩選出100個(gè)正常(兩優(yōu)566)和40個(gè)(Y兩優(yōu)1982)水稻種子,組成279個(gè)水稻種子樣本。
第二步,研究人員們使用我來獲得水稻種子的透射光譜,將水稻種子放在樣品臺上,用帶有收集探測器的蓋子蓋住,并用鹵素?zé)粽丈洹9馔干溥^水稻種子傳輸?shù)教綔y器,收集每個(gè)水稻種子的透射光譜。在測量光譜之前,水稻種子被蓋子蓋住,以避免種子周圍的環(huán)境光干擾。
鹵素?zé)襞?/p>
(圖片來源:veer圖庫)
水稻種子的測量狀態(tài)和光譜儀工作狀態(tài)的變化可能會(huì)導(dǎo)致隨機(jī)噪聲、基線漂移和多次散射。為了減少這些影響對模型魯棒性的影響,提高模型預(yù)測精度,需要對光譜數(shù)據(jù)進(jìn)行預(yù)處理。
研究中比較了幾種光譜預(yù)處理方法,包括無預(yù)處理(原始光譜)、標(biāo)準(zhǔn)正態(tài)變量變換(Standard normal variate, SNV)、多元散射校正(Multiple scatter correction , MSC)、Savitzky-Golay平滑的一階和二階導(dǎo)數(shù)。
標(biāo)準(zhǔn)正態(tài)變量變換是將每個(gè)樣品的原始光譜減去理想光譜,再除以標(biāo)準(zhǔn)差,理想光譜通常為每個(gè)樣品的平均光譜。多元散射校正是將測量的光譜加征到一個(gè)基準(zhǔn)光譜上,從而減少這些不相關(guān)的變化?;鶞?zhǔn)光譜通常是所有測量光譜的平均光譜。這兩種方法均可用來消除散射誤差。Savitzky-Golay平滑的一階和二階導(dǎo)數(shù)主要是用來降低噪聲、消除基線漂移和提高光譜分辨率。
主成分分析(PCA)是一種經(jīng)典的數(shù)據(jù)分析方法,通過降低數(shù)據(jù)維度,揭示數(shù)據(jù)模式和內(nèi)部結(jié)構(gòu)。通常,前幾個(gè)主成分(PC)可以最大化數(shù)據(jù)集的光譜變化,并解釋樣本分組和相似性。我們通過PCA對生米種子光譜進(jìn)行了探索性分析。
將原始和處理過的光譜數(shù)據(jù),通過人工智能中常用的四種機(jī)器學(xué)習(xí)算法(PLS-DA,SVM,KNN和RF)建立水稻種子內(nèi)部裂紋識別模型。所有樣品的75%(210粒水稻種子)被用作構(gòu)建模型,其余樣品則用來測試模型。
研究結(jié)果表明,PLS-DA結(jié)合原始光譜數(shù)據(jù)模型性能最佳。SVM 的性能較差,但優(yōu)于RF和KNN。除了PLS-DA,四種不同的預(yù)處理方法均改進(jìn)了所開發(fā)模型的性能。
通過波長重要性分析顯示,鑒別水稻種子內(nèi)部裂紋的重要變量與直鏈淀粉含量有關(guān)。因此,可以得出結(jié)論,我可以作為一種快速、無損的方法來鑒別水稻種子中的內(nèi)部裂紋。
PLS-DA分析中預(yù)測(VIP)分?jǐn)?shù)的變量重要性
(圖片來源:作者提供)
小助手寄語
隨著機(jī)器學(xué)習(xí)算法的發(fā)展,我能夠結(jié)合機(jī)器學(xué)習(xí)算法進(jìn)行更廣闊的應(yīng)用。研究人員們?yōu)榱双@得更加穩(wěn)健的近紅外光譜模型,需要更多不同品種的水稻樣品,促進(jìn)我在水稻內(nèi)部裂紋檢測中的實(shí)際應(yīng)用。我的應(yīng)用不僅提高了水稻種子質(zhì)量評價(jià)的效率和準(zhǔn)確性,也為農(nóng)業(yè)生產(chǎn)中的種子質(zhì)量控制提供了新的技術(shù)手段。