基于THz-TDS反射成像技术的玉米种子活力无损检测研究
吴静珠1, 李晓琪1, 刘翠玲1, 余乐1, 孙晓荣1, 孙丽娟2
1. 北京工商大学食品安全大数据技术北京市重点实验室, 北京 100048
2. 中国农业科学院作物科学研究所, 北京 100081

作者简介: 吴静珠, 女, 1979年生, 北京工商大学食品安全大数据技术北京市重点实验室副教授 e-mail: pubwu@163.com

摘要

应用太赫兹时域光谱反射成像技术结合广义二维相关光谱法探索玉米种子活力敏感太赫兹波段, 并结合支持向量机建立快速无损判别种子活力的分析模型。 实验以中地77玉米种子为例, 采用人工老化方式(40 ℃, 100%相对湿度)将种子样本分批老化0, 1, 2, 3, 4天制备不同活力的种子样本, 并按照GB/T 3543.4—1995进行种子发芽实验; 同时采用Terapluse 4000太赫兹时域光谱仪及反射成像附件采集上述不同老化程度种子样本的太赫兹光谱图像。 由于玉米种子的胚乳和种胚的成分差异显著, 为探究种子不同组织在老化过程中与活力的相关性, 本实验首先采用双高斯滤波器对THz图像中的像素点光谱消噪、 峰峰值差分重构图像增强以及阈值分割等预处理无损提取玉米种子不同组织太赫兹吸光度谱。 然后以老化天数为扰动量, 针对上述提取的样本胚乳和种胚光谱分别作广义二维相关分析, 根据实验中同步谱和异步谱中自动峰与交叉峰位置初步解析, 可得到与种子活力关系密切的THz波段主要集中在75和36 cm-1区域, 同时75和36 cm-1处的光谱信息存在强烈的协同变化且变化方向一致。 种子活力与老化天数密切相关, 因此根据老化天数分别建立了基于胚乳和种胚吸光度谱的五分类支持向量机模型用于种子活力定性判别, 但是其判别准确率仅为59.34%和71.28%, 表明该模型无法精细划分种子五个活力等级; 实验进一步根据GB4401.1—2008以玉米种子发芽率85%为阈值划分活力高低等级, 建立二分类种子活力判别模型, 可得胚乳和种胚测试集识别准确率分别可达88.61%和91.73%, 模型性能显著提升, 增强了THz技术用于种子活力无损粗筛的可行性。 实验结果表明: 太赫兹反射成像技术以其丰富的指纹谱、 低能安全以及图谱合一等特性, 有望成为单粒种子活力快速无损测定领域一项崭新、 有力的补充技术。

关键词: 玉米种子; 种子活力; 太赫兹时域光谱反射成像; 二维相关光谱; 支持向量机
中图分类号:O433.4 文献标志码:A
Research on Nondestructive Testing of Corn Seed Vigor Based on THz-TDS Reflection Imaging
WU Jing-zhu1, LI Xiao-qi1, LIU Cui-ling1, YU Le1, SUN Xiao-rong1, SUN Li-juan2
1. Beijing Key Laboratory of Big Data Technology for Food Safety, Beijing Technology and Business University, Beijing 100048, China
2. Institute of Crop Science, Chinese Academy of Agricultural Sciences, Beijing 100081, China
Abstract

Sensitive terahertz bands related corn seed vigor were explored using terahertz time domain spectral reflection imaging technique combined with generalized two-dimensional correlation spectroscopy, and simultaneously the qualitative model to judge seed vigor nondestructively was established based on support vector machine and terahertz absorbance spectra. Take Zhongdi 77 (Corn variety) for example in this experiment. Firstly, there are 5 batches of different vigor seeds made by artificial aging (40 ℃, 100% relative humidity) for 0, 1, 2, 3, 4 days. 5 batches of seeds were conducted germination experiments according to GB/T 3543.4—1995 to obtain germination rate. Terahertz spectral images of seed samples were collected by Terapluse 4 000 terahertz time domain system with reflection imaging module. Because the composition of endosperm and embryo of corn seed is significantly different, it is meaningful to explore the correlation between the different tissues (endosperm and embryo) and the vigor in the aging process separately. A series of pretreatments was done to extract the terahertz absorbance spectra of different tissue of corn seed, such as denoising using double Gaussian filtering, image enhancement based on the peak-to-peak differential reconstruction and threshold segmentation. Take the aging days as the disturbance amount, and the generalized two-dimensional correlation spectrum analysis was carried out to the above-mentioned extracted spectra of endosperm and embryo. According to the preliminary analysis of the automatic peak and the cross peak in the synchronous and asynchronous spectra, the terahertz band closely related to seed vigor was mainly concentrated in the 75 and 36 cm-1 regions, and the spectral information at 75 and 36 cm-1 had great synergistic change and the change was consistent. Different aging days correspond to different vitality according to the germination experiment. Therefore, five-class support vector machines were built respectively based on endosperm and embryo absorbance spectra to identify seed vigor, and the recognition rate was only 59.34% and 71.28%. The results indicated that the model cannot precisely divide seed vigor to five levels. According to GB4401.1—2008, 85% germination rate was set as the threshold to divide seed vigor to two levels, then binary classifier based on support vector machines were built to distinguish seed vigor. The recognition accuracy of the endosperm and embryo test sets was 88.61% and 91.73% respectively. The recognition rate had improved significantly and the model can basically be used for rapid coarse screening of seed vigor. The experiment result showed terahertz reflection imaging with its rich fingerprint spectrum characteristics and lower energy is expected to be a new and powerful complementary technology to identify seed vigor rapidly and nondestructively.

Keyword: Corn seed; Seed vigor; Terahertz time-domain spectral reflection imaging; Generalized two-dimensional correlation spectroscopy; Support vector machine
引言

种子活力是表征种子品质的重要指标[1]。 高活力种子具备显著的生长优势和高产潜力, 是现代化农业高效高产的首要条件。 在欧美等国, 种子活力已成为检验种子质量的常规检测项[2]。 我国现行的农作物种子质量标准(GB4404.1—2008)尚未将种子活力纳入标准, 更无相关的活力检测国标。 加速老化测定和电导率测定[3, 4]是国际种子检验协会与北美官方种子分析家协会推荐的两种最具代表性和最为常用的种子活力测定方法, 上述检测方法均存在耗时性、 试样破坏性等弊端, 无法满足种子商业流通、 育种、 单粒播种等领域提出的快速、 无损、 单粒检测的新需求, 因此探索和研究适应现代种子产业高速发展的种子活力测定新方法和新技术已成为种子质量检测领域的热点和趋势。

近年来, 作为重要交叉前沿领域的太赫兹(Terahertz, THz)技术以其特有的波谱分辨能力、 透视性和低能性等技术优势在农业领域崭露头角[5, 6], 极有潜力成为红外光谱技术和X射线技术的有力补充。 尤其是THz时域光谱(Terahertz-time domain spectroscopy, THz-TDS)与成像技术结合可获取信息极为丰富的三维时空数据集, 不但能用于物体的形态辨别, 而且还能够实现对物体的物理、 化学性质分析和物体组成成分的鉴别。 Liu等[7]从水稻种子的THz时域光谱图像中提取THz光谱信息, 分别采用最小二乘支持向量机, 主成分分析-后向反馈神经网络, 随机森林等方法建立转基因水稻种子判别模型, 其中最优模型的识别准确率可达96.67%。 有研究利用THz-TDS结合图像处理、 化学计量学和信息融合技术对储存小麦的芽变、 霉变、 异物进行无损探测, 研究表明该技术是一种潜在的储粮品质无损精准检测手段。 综上研究可以发现THz-TDS光谱成像技术以其无损探测、 信息丰富以及安全性等技术优势在种子质量检测领域成为新兴研究热点, 但是目前研究尚在起步阶段, 尤其是THz技术在种子活力方面的应用研究尚有待探索。

玉米是粮食、 饲料和工业原料兼用农作物, 现已成为我国第一大农作物, 在《国家中长期科学和技术发展规划纲要(2006—2020年)》中被列为重点领域和优先主题。 因此以玉米种子为研究对象, 重点探索采用THz-TDS反射成像技术结合化学计量学方法无损检测种子活力水平的可行性, 以期为进一步采用太赫兹时域光谱技术快速无损检测种子活力水平提供理论基础和技术支撑。

1 实验部分
1.1 样品制备

实验选取中地77品种的玉米种子为样本。 采用种子老化箱, 在温度为40 ℃、 100%相对湿度条件下将种子样本分批老化0, 1, 2, 3和4 d。 按照国家标准(GB/T3543.4—1995)采用ZLC-250智能种子发芽箱进行发芽试验, 每组样本进行4次重复实验, 取其平均值作为该样本的最终发芽率。 不同老化程度种子发芽率如表1所示。 从表1可以得出随着老化天数增加, 发芽率不断下降, 表明种子活力随之不断下降, 因此不同的老化天数对应了不同的活力等级。

表1 不同老化程度种子的发芽率 Table 1 Germination rate of seeds with different degrees of aging
1.2 THz-TDS反射成像数据采集

采用英国Teraview公司的TeraPulse 4000太赫兹时域光谱仪以及反射成像附件, 采集上述老化天数为0, 1, 2, 3和4 d的玉米种子样本的光谱反射成像数据。 光谱仪参数设定: 成像区域为40 mm×40 mm, 横/纵向步长为200 nm。 图1所示为玉米种子反射成像采集实验。

图1 玉米种子THz光谱反射成像实验Fig.1 THz spectral reflection imaging experiment of corn seeds

1.3 数据处理

1.3.1 广义二维相关光谱技术

广义二维相关光谱技术[8]主要用于探究在外界微扰(时间、 温度、 浓度)作用下, 样本光谱信号强度的动态变化。 通过观察动态光谱的吸收峰的位置、 强度的变化以及方向的一致性和互异性来分析样品的相关理化信息。 本实验以老化时间即老化天数为扰动量, 采用广义二维相关光谱技术初步解析与种子活力相关的THz敏感谱区。

1.3.2 支持向量机

支持向量机算法[9, 10]与多层感知网络器类似, 基于统计学理论, 有很好的泛化能力, 被广泛应用于模式识别和回归分析。 该算法适合于小样本, 维度高且非线性的样本分类问题。 本实验采用台湾大学林智仁教授等开发的LIBSVM工具包, 在MATLAB2014a环境下运行, 探索建立判别种子活力等级的分析模型。

2 结果与讨论
2.1 THz-TDS光谱反射图像预处理

玉米种子胚乳和种胚所含成分存在显著差异, 为探究种子不同组织在老化过程中与活力的相关性, 实验首先通过太赫兹光谱图像预处理无损提取玉米种子不同组织太赫兹吸光度谱。

为准确提取光谱信息, 实验首先针对任一像素点光谱采用双高斯滤波消噪法去除系统和环境噪声; 然后采用峰峰值差分重构对样本图像进行重构增强, 以获取表征不同组织区域的清晰轮廓(其中胚乳15.5~17 ps, 胚19~23 ps); 最后采用最大值法及迭代法分别进行图像灰度化和阈值分割提取胚乳和种胚的位置信息。 具体处理流程如图2和图3所示。

图2 胚乳重构、 灰度化及阈值分割处理Fig.2 Endosperm reconstruction, grayscale and threshold segmentation

图3 种胚重构、 灰度化及阈值分割处理Fig.3 Embryo reconstruction, grayscale and threshold segmentation

从图2和图3中可以看出经过预处理后图像轮廓信息更为明显。 根据上述预处理得到的胚乳和种胚的目标区域可以提取出各像素点THz光谱, 计算其平均值得到胚乳和种胚的平均光谱。 图4所示即为经过上述提取步骤得到老化1 d后的种子样本的种胚和胚乳平均光谱, 从图中可以看出吸光度谱在< 10 cm-1以及> 65 cm-1处存在较为明显的差异。

图4 老化1 d胚乳和种胚THz平均光谱Fig.4 Aging for 1 day THz mean spectra of endosperm and embryo

2.2 种子活力特征波段解析

种子活力水平与其老化程度密切相关, 老化时间越长, 发芽率越低, 种子活力也随之明显下降。 实验以老化天数为扰动量, 采用广义二维相关法探索种胚和胚乳中与种子活力相关的特征太赫兹波段。

采用2Dshige软件(Shigeaki Morita, Kwansei-Gakuin University, 2004—2005)针对2.1中提取的不同老化天数(0, 1, 2, 3, 4 d)的胚乳和种胚吸光度谱(0~77 cm-1)进行二维相关分析。 图5所示为5个老化天数下种子胚乳吸光度谱的二维同步相关谱及二维异步相关谱(红色代表正相关, 蓝色代表负相关, 颜色深浅代表相关程度大小)

图5 胚乳广义二维相关光谱图
(a): 二维同步相关光谱图; (b): 二维异步相关光谱图
Fig.5 Generalized two-dimensional correlation spectra of endosperm
(a): Two-dimensional synchronization correlation spectra; (b): Two-dimensional asynchronous correlation spectra

图5(a)中同步谱对角线上的自相关峰(V1, V2)出现在(75和75 cm-1)和(36和36 cm-1)(绿色圆圈标注), 自动峰的强度为正值, 说明两个波段在外界微扰(即老化天数)的作用下引起的变化程度较大, 因此该波段属于种子活力THz敏感谱段; (75和75 cm-1)处较(36和36 cm-1)处颜色更深, 表明75 cm-1处较36 cm-1处与种子活力的相关性更强。 非对角线处的交叉峰出现在(36和75 cm-1)和(75和36 cm-1)(橘色圆圈标注), 且为正值, 表明样本光谱在36与75 cm-1处存在强烈协同作用且变化方向一致。

图5(b)异步谱中位于(36和75 cm-1)的交叉峰(紫色圆圈标注)处为负值, 而同步谱中(36和75 cm-1)处为正值, 表明36 cm-1信号强度变化小于75 cm-1; 异步谱中(75和36 cm-1)的交叉峰与同步谱中该位置处均为正值, 再次表明外界微扰作用下在75 cm-1处信号强度变化大于36 cm-1处。

类似地, 通过5个批次老化天数下的种胚广义二维相关光谱分析同样可得75 cm-1, 36 cm-1处为与种子活力相关的THz敏感谱区。

综上以老化天数为扰动量解析种子THz吸收谱可得, 无论是胚乳还是种胚, 与种子活力明显相关的太赫兹波段主要集中在75和36 cm-1附近, 这两个波长处吸光度存在强烈协同变化且变化方向一致, 75 cm-1处信号强度变化大于36 cm-1处。 36 cm-1附近是典型的THz水峰特征吸收, 实验结果表明种子活力受水分影响明显, 但是水分源于种子内部水分还是环境水分的干扰还有待研究; 75 cm-1处THz光谱信息对应的作用机理还有待进一步解析。

2.3 玉米种子活力水平无损判别

种子老化天数和种子活力密切相关。 根据发芽率数据, 老化天数0, 1, 2, 3和4 d对应了种子五个活力等级, 因此本实验探索采用支持向量机建立判别种子活力等级的五分类模型。 由于玉米种子胚乳和种胚成分及相应THz谱差异显著, 为精细化研究种子不同组织与种子活力的相关性, 分别基于种胚和胚乳THz谱建立种子活力分析模型。

实验以5个老化批次的种子样本THz反射图像中种胚和胚乳区域的像素点为原始样本集(胚乳样本数6 004; 种胚样本数798), 按照5:1的比例随机划分训练集和测试集, 输入样本均归一化处理。 支持向量机选用RBF为核函数, 采用网格搜索法对惩罚参数c和核参数g进行参数寻优, 采用5折交叉验证进行SVM网络训练。 根据表2中的实验结果可以得出, 基于胚乳的判别模型识别准确率仅为59.34%, 基于种胚的模型识别准确也仅有72.18%, 两者活力判别模型都无法精细划分五个类别的活力等级。 分析其原因, 可能是活力等级划分过细导致。

表2 不同老化程度识别模型参数及结果 Table 2 Identification of model parameters and results with different degrees of aging

因此实验尝试减少活力等级分类数再进行建模分析。 根据农作物种子质量标准(GB4401.1—2008), 实验以玉米种子发芽率85%为阈值建立种子高低活力的二分类模型。 按照上述类似步骤训练种子活力判别模型, 结果如表3所示, 不管是基于种胚还是胚乳建立的判别种子高低活力的二分类模型识别率均有了显著提升。 就本实验的结果而言, 基于种胚光谱信息建立的模型识别准确率高于胚乳模型。

表3 种子活力水平判别模型参数及测试结果 Table 3 Seed vigor level discrimination model parameters and test results
3 结论

采用THz-TDS反射成像技术结合广义二维相关光谱分析方法初步解析得到与玉米种子活力相关的敏感太赫兹波段主要集中在36和75 cm-1区域, 但是36和75 cm-1处THz光谱信息对应的作用机理还有待解析。 实验分别基于胚乳和种胚的THz吸光度谱建立了五分类和二分类活力判别模型, 其中五分类模型由于活力等级划分过细导致预测效果较差, 二分类模型中胚乳模型识别率可达88.61%, 种胚模型识别率可达91.73%, 模型性能得到显著改善。 实验结果表明THz-TDS反射成像技术以其丰富的指纹谱、 低能安全和图谱合一的特性, 结合机器学习方法在单粒种子活力快速、 无损、 粗筛领域有着光明的应用前景。

参考文献
[1] LI Zhen-hua, WANG Jian-hua(李振华, 王建华). Sciences Agricultura Sinica(中国农业科学), 2015, 48(4): 646. [本文引用:1]
[2] YU Bo, DU Shang-guang, LUO Li-ping(余波, 杜尚广, 罗丽萍). SCIENCE CHINA: Life Sciences(中国科学: 生命科学), 2015, 45: 709. [本文引用:1]
[3] Julio Marcos-Filho. Scientia Agricola, 2015, 72(4): 363. [本文引用:1]
[4] Moreira J, Cardoso R R, Bragab R A. Opt. Laser Eng. , 2014, 61: 8. [本文引用:1]
[5] ZHANG Cun-lin, MU Kai-jun(张存林, 牧凯军). Progress in Laser and Optoelectronics(激光与光电子学进展), 2010, 47(2): 1. [本文引用:1]
[6] LIU Cui-ling, XING Rui-xin, WU Jing-zhu, et al(刘翠玲, 邢瑞芯, 吴静珠, ). Transactions of the Chinese Society for Agricultural Machinery(农业机械学报), 2018, 49(3): 361. [本文引用:1]
[7] Liu Wei, Liu Changhong, Hu Xiaohua, et al. Food Chemistry, 2016, 210: 415. [本文引用:1]
[8] YANG Cheng-hu, LIU Yang-zhi, SUN Xiu-mei, et al(杨承虎, 刘洋之, 孙秀梅, ). Spectroscopy and Spectral Analysis(光谱学与光谱分析), 2018, 38(11): 3334. [本文引用:1]
[9] GUO Li-na, FAN Gui-sheng(郭李娜, 樊贵盛). Soil Notification(土壤通报), 2018, 49(3): 512. [本文引用:1]
[10] DAI Bin(代斌). Journal of Hexi University(河西学院学报), 2018, 34(5): 19. [本文引用:1]