不同生长时期玉米茎秆强度的无损检测研究
张天亮1,2,3,4, 张东兴1,2, 崔涛1,2, 杨丽1,2,*, 解春季1,2, 杜兆辉1,2, 肖天璞1,2
1. 中国农业大学工学院, 北京 100083
2. 农业部土壤-机器-植物系统技术重点实验室, 北京 100083
3. 河北省科学院应用数学研究所, 河北 石家庄 050081
4. 河北省信息安全认证技术创新中心, 河北 石家庄 050081
*通讯作者 e-mail: yl_hb68@126.com

作者简介: 张天亮, 1993年生, 中国农业大学工学院博士研究生 e-mail: tianliangzh@163.com

摘要

针对传统玉米茎秆强度破坏式检测方法费时费力的问题, 采用高光谱成像数据结合统计学习方法对灌浆期和蜡熟期的19个玉米品种的茎秆穿刺强度和折断力进行检测, 给出适于进行玉米茎秆强度检测的特征提取和建模方法。 试验在5 000株·亩-1种植密度下种植了19个玉米品种, 采集灌浆期和蜡熟期茎秆基部的高光谱图像, 使用目标区域分割的方式自动进行光谱图像反射率校正和目标光谱曲线提取。 对采集的样本数据使用主成分分析法(PCA)和包裹式特征提取法提取光谱特征, 并分别建立了主成分回归(PCR)和偏最小二乘回归(PLSR)的茎秆强度预测模型。 通过对各特征提取方法和各模型交叉验证预测结果的对比, 找到适于进行玉米茎秆强度检测的特征提取和建模方法。 试验结果表明: PCA方法提取光谱特征具有明显的降维效果, 但用PCA方法提取特征建立的PCR模型对玉米茎秆强度的预测效果一般, 用包裹式特征提取方法建立的PLSR模型在灌浆期和蜡熟期的模型预测效果均优于PCR模型, 模型的剩余预测残差(RPD)在2.90~3.93之间, 可以用于定量分析预测茎秆强度。

关键词: 穿刺强度; 折断力; 高光谱成像; 主成分回归; 偏最小二乘回归
中图分类号:S126 文献标志码:A
Study on Nondestructive Testing of Corn Stalk Strength in Different Periods
ZHANG Tian-liang1,2,3,4, ZHANG Dong-xing1,2, CUI Tao1,2, YANG Li1,2,*, XIE Chun-ji1,2, DU Zhao-hui1,2, XIAO Tian-pu1,2
1. College of Engineering, China Agricultural University, Beijing 100083, China
2. Key Laboratory of Soil-Machine-Plant System Technology of Ministry of Agriculture, Beijing 100083, China
3. Institute of Applied Mathematics, Hebei Academy of Sciences, Shijiazhuang 050081, China
4. Hebei Information Security Certification Technology Innovation Center, Shijiazhuang 050081, China
*Corresponding author
Abstract

Given the time-consuming and labor-consuming problem of traditional maize stalk strength destructive detection methods, this study used hyperspectral imaging data combined with statistical learning methods to detect the puncture strength and breaking force of the stalks of 19 maize varieties in the filling stage and wax maturity stage. Moreover, the feature extraction and modeling methods suitable for detecting corn stalk strength are given. In the experiment, 19 corn varieties were planted at a planting density of 5 000 plants·mu-1. The hyperspectral images of the base of the stalks at the filling stage and wax maturity stage were collected, and the target area segmentation method was used to automatically perform spectral image reflectance correction and target spectral curve extraction. Principal Component Analysis (PCA) and wrapped feature extraction were used to extract spectral features from the collected sample data, and principal component regression (PCR) and partial least squares regression (PLSR) were developed for the prediction of stalk strength. By comparing each feature extraction method and the cross-validation prediction results of each model, we found suitable feature extraction and modeling methods for maize stalk strength detection. The experimental results showed that the PCA method extracted spectral features had obvious dimensionality reduction effect. However, the PCR model built with PCA method extracted features had average prediction effect on maize stalk strength, and the PLSR model built with wrapped feature extraction method had better prediction effect than the PCR model at both the filling and waxing stages. The residual predictive deviation (RPD) of the PLSR model was higher than that of the PCR model. The RPD of the PLSR model ranged from 2.90 to 3.93, which could be used for quantitative analysis to predict stalk strength.

Keyword: Puncture strength; Breaking force; Hyperspectral imaging; PCR; PLSR
引言

玉米倒伏严重影响田间机械化收获和玉米的产量, 因此选育抗倒能力强的玉米品种具有十分重要的意义, 而准确评价玉米品种的抗倒伏能力是其中关键的一环。 研究表明茎秆力学特性与玉米品种抗倒伏能力具有显著正相关关系, 相关的茎秆力学指标经常被用来评价玉米品种的抗倒伏能力[1]。 例如吴琼等[2]通过对4个种植密度下15份玉米品种在灌浆期的株高、 穗位高、 茎秆基部穿刺强度、 折断力等10项指标来评价不同玉米品种的密植抗倒性, 并将10项单个指标转换成了4个可以鉴定玉米密植抗倒伏能力的互相独立的综合指标。 玉米茎秆的化学物质组成可以直接影响茎秆的力学特性, Xue等[3]研究了种植密度对茎秆基部节间发育和强度形成的影响, 分析了茎秆强度与茎秆中纤维素和木质素积累的相关关系。 同时光谱反演技术应用于检测植物的组分含量、 生理信息等已经有广泛的研究, 刘世伟等[4]研究建立了定玉米茎秆中木质素、 纤维素和半纤维素含量的近红外光谱反演模型, 并给出了相应的特征光谱区间。 徐博等[5]研究了水稻灌浆期至成熟期茎秆基部纤维素含量的近红外光谱反演模型, 优选出6个光谱特征变量建立了纤维素含量的支持向量机和极限学习机预测模型。 经研究, 玉米茎秆强度与茎秆物质组成密切相关, 同时茎秆光谱特征可以反映其成分信息。 本研究将通过高光谱成像特征直观反映茎秆的力学特性, 通过对灌浆期和蜡熟期的玉米茎秆进行高光谱成像与特征分析, 与传统方式测得的茎秆强度数据进行相关分析和反演, 实现对茎秆穿刺强度和折断强度的非接触快速测量。

1 实验部分
1.1 材料

试验样品为河北省沧州市吴桥县中国农业大学吴桥试验站种植的19个玉米品种: 中单909、 蠡玉31、 沃玉964、 纪元1号、 隆平208、 冀丰223、 登海618、 农大108、 浚单20、 洰丰339、 纪元101、 登海605、 掖单13、 先玉335、 京单28、 隆平206、 蠡玉37、 郑单958、 圣瑞999。 试验品种在同一地块内分不同的小区种植, 种植密度为5 000株· 亩-1, 每个小区种植9行, 行长5 m, 行距0.66 m, 株距22.2 cm。 玉米生长过程中的田间管理措施按照当地的大田管理方式实行。

1.2 数据采集

在玉米生长至灌浆期和蜡熟期, 分别到田间采集玉米的茎秆带回实验室测量。 在每个小区内随机挑选玉米茎秆长势均匀的6株植株, 每个茎秆样品截取基部的一节茎节, 先进行高光谱图像拍摄, 再用茎秆强度测定仪测试茎秆的穿侧强度和折断力。 高光谱成像采用美国SOC(Surface Optics Corporation)公司的SOC710VP型号高光谱成像光谱仪, 在光学暗箱内进行成像拍摄。 仪器的光谱波长范围374~1 038 nm, 光谱分辨率为4.68 nm, 共128个波段, 成像的图像分辨率为696× 520。 拍摄时使用光源为4个100 W的卤素钕灯, 光谱相机布置在茎秆的正上方, 镜头到拍摄样本的距离为75 cm, 茎秆样本和灰度标准板一同拍摄, 便于后期进行光谱图像反射率校正。 在完成光谱图像拍摄后, 对茎秆目标区域进行图像分割并提取平均光谱曲线用于后续分析。 使用YYD-1型茎秆强度测定仪测量茎秆的穿刺强度和折断力, 测量时设定茎秆的悬空间距为8 cm, 力量的加载位置为茎秆中间位置。

1.3 异常样本剔除和数据预处理

首先通过观察剔除掉因试验误差造成的明显偏离数据中心的样本曲线以及茎秆强度数据缺失的样本, 然后对每一个光谱数据集使用偏最小二乘法和蒙特卡洛交叉验证法进行循环验证, 计算各样本预测误差的均值和方差, 将预测误差均值或方差偏离数据中心较远的样本作为异常值剔除。 然后对每条光谱样本曲线使用多元散射校正(multiplicative scatter correction, MSC)方法进行预处理, 目的是在保留光谱中与化学成分有关信息的同时消除不同样本间因散射影响所导致的基线平移和偏移现象[6]。 最后对数据集的各波段变量进行标准化处理, 以突出光谱间的特征差异。

1.4 特征提取与建模方法

选择使用主成分回归(principle component regression, PCR)和偏最小二乘回归(partial least squares regression, PLSR)的方法, 建立不同时期茎秆光谱数据与穿刺强度、 折断力的回归模型。 主成分分析是通过线性变换的方式, 将样本矩阵沿着协方差最大的方向由高维空间向低维空间投影, 得到的各主成分之间相互正交, 可以有效解决光谱数据的多重共线性问题[7, 8]。 主成分回归首先对光谱数据进行主成分分析, 所得到的前f个主成分向量代替原光谱变量, 再进行多元线性回归即得到主成分回归模型。 主成分回归的特点是适合处理共线性特征, 只用几个主成分就能包含原始数据的主要信息[9, 10]。 偏最小二乘回归是光谱数据分析中常用的一种多元统计分析方法, 它在建模时需要同时考虑光谱特征和响应变量的信息, 探究两者之间的线性关系。 PLSR模型通过将光谱特征和响应变量分别投影到相应的低维空间得到相互正交的特征向量, 再在各自的特征向量之间进行线性回归, 并通过包裹式特征选择方法选择合适的特征投影个数, 使模型效果最优, 因此由偏最小二乘回归选择出的特征强调了光谱特征对响应变量的解释和预测作用[11, 12, 13]

为了保证模型有良好的泛化性能, 使用10折交叉验证法对模型效果进行验证。 使用决定系数(coefficient of determination, R2), 均方根误差(root mean square error, RMSE)和剩余预测残差(residual predictive deviation, RPD)作为模型评价标准, 决定系数和剩余预测残差越高、 均方根误差越小, 说明模型效果越好[14, 15, 16]

2 结果与讨论
2.1 茎秆强度数据分析

灌浆期和蜡熟期测得的茎秆基部穿刺强度和折断力数据如表1所示。 茎秆在灌浆期和蜡熟期的穿刺强度平均值、 中位数和标准差都比较接近, 说明不同时期的茎秆穿刺强度没有明显变化, 数据内的变异程度也接近。 而蜡熟期的茎秆折断力数据的各项指标均明显高于灌浆期数据, 这主要是后期茎秆脱水、 内部加速纤维化的结果。 数据结果说明茎秆纤维化对折断力指标的影响比较显著, 对穿刺强度影响较小。

表1 不同时期茎秆强度数据变化 Table 1 Changes in stalk strength data in different periods
2.2 原始光谱数据分析

首先对光谱图像进行反射率校正。 从图1(a)光谱图像中提取出标准板、 茎秆、 背景区域的光谱反射强度曲线, 如图1(b)所示。 可以看出各区域的光谱反射强度有明显的差别, 选择752.98 nm处的波段图像, 设置反射强度阈值范围[300~1 000]分割出标准板区域, 而反射强度高于2 000的区域为茎秆, 各目标区域具体分割效果如图1(c)所示。 然后在各波段上提取出标准板坐标区域的平均反射强度Istd, 用Istd除以标准板的反射率Rstd计算出总入射光的强度I, 再用光谱图像各波段的反射强度除以I完成图像的反射率校正, 其中标准板Rstd的数值是已知的。 最后提取出茎秆区域的反射率光谱曲线, 用于对茎秆强度进行建模预测。

图1 目标区域提取方法
(a): 原始图像; (b): 各区域光谱曲线; (c): 阈值分割结果
Fig.1 Target area extraction method
(a): The original image; (b): Spectral curve of each region; (c): Threshold segmentation result

经过图像分割提取, 试验在灌浆期和蜡熟期分别采集了114个样本。 人工剔除异常样本后再对每一个光谱数据集使用偏最小二乘法和蒙特卡洛交叉验证法将预测误差均值或方差偏离数据中心较远的样本作为异常值剔除。 如图2(a— d)所示, 大部分样本预测误差的均值和方差都比较集中, 有少数样本偏离的数据中心, 则该样本预测误差的波动比较大。 将灌浆期穿刺强度(CcGjq)的第1、 10、 16、 33号样本, 灌浆期折断力(ZdGjq)第1、 30号样本, 蜡熟期穿刺强度(CcLsq)的第2、 3、 7号样本, 和蜡熟期折断力(ZdLsq)的第3、 10、 11、 28号样本剔除。

图2 异常样本剔除Fig.2 Abnormal sample removal

经过异常样本剔除后, 绘制两个时期茎秆的平均光谱曲线, 如图3(a)所示。 可以看出不同时期的茎秆光谱曲线变化趋势基本一致, 在679.5 nm附近都存在一个明显的波谷, 在560.9~632.8和731.9~918.6 nm范围内是波峰。 对每条样本曲线进行标准正态变换处理, 然后分析不同时期各波段反射率与茎秆穿刺强度和折断力之间的相关性, 绘制如图3(b)所示的相关系数图。 由图可知在374~479和763~994 nm范围内, 波段反射率与茎秆强度之间是正相关关系, 在499~721 nm范围内则主要是负相关关系。 图3(b)中实线是穿刺强度与波段反射率的相关系数, 在灌浆期560.9 nm处的相关性系数最高为0.48, 蜡熟期时在962 nm处的相关系数最高为0.37。 虚线显示折断力与波段反射率之间的相关关系, 在灌浆期806 nm处的相关性系数最高为0.41, 蜡熟期时在854 nm处的相关系数最高为0.55。 可以看出茎秆穿刺强度的相关系数绝对值在大多数波段上是灌浆期高于蜡熟期, 而折断力的相关系数则是蜡熟期高于灌浆期, 这应该是与玉米茎秆在蜡熟期时开始脱水和茎秆的纤维化相关。

图3 光谱曲线特征分析
(a): 两个时期的平均光谱曲线; (b): 两个时期各波段的相关系数曲线
Fig.3 Characteristic analysis of spectral curve
(a): Average spectral curve of two periods; (b): Correlation coefficient curve of each band in the two periods

2.3 光谱数据特征提取

2.3.1 主成分分析法

主成分分析法(principal component analysis, PCA)只需要使用方差贡献率最大的前几个主成分, 就可以包含原始数据中的主要信息。 以累计方差贡献率达到99.9%为限, 决定待选主成分数量, 选择灌浆期主成分数为16, 蜡熟期主成分数为15。 各生长期的主成分贡献率如表2所示, 由表2看出各生长期均是前2个主成分的贡献率最大, 前3个主成分的累计贡献率都已经超过90%, 说明主成分分析法对光谱特征的降维效果显著。

表2 各时期光谱数据主成分的贡献率 Table 2 Contribution rate of principal components of spectral data in each period

2.3.2 包裹式特征选择方法

使用包裹式特征选择方法选择PLSR模型的最佳建模特征。 对各生长期的光谱数据, 以5为增量分别设置特征投影个数为5~60个, 训练偏最小二乘回归模型, 并使用10折交叉验证法检验模型, 用RMSE和R2评价模型预测性能, 各数据集的训练效果如图4(a, b)所示。 从图4可以看出随着特征投影数量的增加, 各训练模型的性能逐渐变强。 灌浆期穿刺强度和折断力数据训练模型的均方根误差RMSE普遍低于蜡熟期数据模型, 决定系数R2也高于蜡熟期, 说明模型对灌浆期的数据更敏感。 看到当投影个数为30时, 各训练模型的R2均在0.9以上, RMSE也较低, 因此选择30个投影特征为建模的最少特征个数。

图4 投影特征个数对PLSR模型性能的影响
(a): 各穿刺强度训练模型的性能; (b): 各折断力训练模型的性能
Fig.4 The influence of the number of projection features on the performance of the PLSR model
(a): The performance of each puncture intensity training model; (b): The performance of each breaking force training model

2.4 模型结果与分析

将灌浆期和蜡熟期时PCR模型和PLSR模型的最佳参数分别带入相应的光谱数据集建立预测模型, 各模型的预测效果如图5(a— d)所示, 各模型评价指标见表3。 偏最小二乘模型在不同生长期对穿刺强度和折断力的模型预测指标均优于主成分回归模型。 PCR模型对各茎秆强度指标预测模型的决定系数R2在0.36~0.64之间, 模型的预测值与真实值相关度一般, 剩余预测残差RPD在1.25~1.67之间, 说明模型的预测效果较差。 PLSR模型对各茎秆强度指标预测模型的决定系数R2在0.88~0.94之间, 模型的预测值与真实值密切相关, 剩余预测残差RPD在2.90~3.93之间, 说明模型有很好的预测效果, 可以用于定量分析预测。 通过对比发现, PCR模型和PLSR模型在不同生长期对茎秆折断力的预测效果均优于对茎秆穿刺强度的预测效果, 说明光谱数据对茎秆折断力的特征反映比对穿刺强度的反映更加敏感; 且两类模型对蜡熟期穿刺强度的预测效果均为各自模型中最低, 说明玉米在不同生长期光谱数据的茎秆穿刺强度特征在减弱。

图5 训练集模型预测效果
(a): 灌浆期-穿刺强度; (b): 灌浆期-折断力; (c): 蜡熟期-穿刺强度; (d): 蜡熟期-折断力
Fig.5 The prediction effect of the training set model
(a): Puncture strengthduring grouting period; (b): Breaking force during grouting period; (c): Puncture strength during wax maturity period; (d): Breaking force during wax maturity period

表3 各模型性能评价 Table 3 Performance evaluation of each model
3 结论

采用高光谱成像技术对19个玉米品种在灌浆期和蜡熟期的茎秆穿刺强度和折断力进行非接触测量, 实现了对茎秆光谱图像的自动校正和反射率提取, 对比了主成分分析法和包裹式特征选择方法的特征提取效果以及对主成分回归和偏最小二乘回归模型性能的影响, 提出了非接触无损检测茎秆强度指标的方法。

主要结论: 用主成分分析法提取光谱特征可以有效避免光谱数据的共线性问题, 特征降维效果显著, 只用前几个主成分就能代表光谱数据的主要信息, 但用PCA方法提取特征建立的PCR模型对玉米茎秆强度的预测效果一般。 使用包裹式特征选择方法建立的PLSR模型对茎秆强度指标的预测均优于PCR模型, 可以用于对茎秆强度的定量分析预测。 茎秆折断力的光谱特征比茎秆穿刺强度更敏感, 模型预测效果更好, 而茎秆穿刺强度的光谱特征随玉米生长期延长而减弱, 模型预测效果变差。

参考文献
[1] YANG De-guang, MA De-zhi, YU Qiao-qiao, et al(杨德光, 马德志, 于乔乔, ). Journal of China Agricultural University(中国农业大学学报), 2020, 25(7): 28. [本文引用:1]
[2] WU Qiong, YANG Ke-jun, ZHANG Yi-fei, et al(吴琼, 杨克军, 张翼飞, ). Journal of Maize Sciences(玉米科学), 2017, 25(4): 40. [本文引用:1]
[3] Xue J, Zhao Y, Gou L, et al. Crop Science, 2016, 56(6): 3295. [本文引用:1]
[4] LIU Shi-wei, XU Ying-ying, ZHU Kai-li, et al(刘世伟, 许莹莹, 朱凯丽, ). Journal of Maize Sciences(玉米科学), 2020, 28(4): 109. [本文引用:1]
[5] XU Bo, XU Tong-yu, YU Feng-hua, et al(徐博, 许童羽, 于丰华, ). Spectroscopy and Spectral Analysis(光谱学与光谱分析), 2021, 41(6): 1775. [本文引用:1]
[6] Zhang X, Sun J, Li P, et al. LWT-Food Science and Technology, 2021, 152: 112295. [本文引用:1]
[7] Li Xiaobin, Wang Yushun, Fu Lihong. Transactions of the Chinese Society of Agricultural Engineering, 2016, 32(12): 179. [本文引用:1]
[8] Wu J, Ouyang Q, Park B, et al. Food Chemistry, 2022, 371: 131100. [本文引用:1]
[9] Wang J, Tian T, Wang H, et al. Computers and Electronics in Agriculture, 2021, 189: 106390. [本文引用:1]
[10] Žibrat U, Gerič Stare B, Knapič M, et al. Remote Sensing, 2021, 13(10): 1996. [本文引用:1]
[11] Qiao M, Xu Y, Xia G, et al. Food Chemistry, 2022, 366: 130559. [本文引用:1]
[12] Helsen K, Bassi L, Feilhauer H, et al. Ecological Indicators, 2021, 130: 108111. [本文引用:1]
[13] Liu Y, Zhan Z, Ren L, et al. Forest Ecology and Management, 2021, 497: 119505. [本文引用:1]
[14] Tahmasbian I, Morgan N K, Hosseini Bai S, et al. Remote Sensing, 2021, 13(6): 1128. [本文引用:1]
[15] Sonobe R, Yamashita H, Mihara H, et al. Remote Sensing, 2020, 12(19): 3265. [本文引用:1]
[16] Liu C, Zhang F, Ge X, et al. Water, 2020, 12(7): 1842. [本文引用:1]