基于分窗Gram-Schmidt变换和PSO-SVR算法的水稻纹枯病病情指数检测
肖文1, 曹英丽1,2,*, 冯帅1, 刘亚帝1, 江凯伦1, 于正鑫1, 闫丽1
1.沈阳农业大学信息与电气工程学院, 辽宁 沈阳 110161
2.沈阳农业大学辽宁省农业信息化工程技术中心, 辽宁 沈阳 110161
*通讯作者 e-mail: caoyingli@163.com

作者简介: 肖 文, 1995年生, 沈阳农业大学信息与电气工程学院硕士研究生 e-mail: 994758748@qq.com

摘要

纹枯病是水稻的主要病害之一, 其防治对于保证水稻产量、 质量具有重要意义, 以高光谱检测水稻病害得到了广泛应用, 并且高光谱降维是光谱分析的重要环节。 该研究在2019年沈农水稻试验基地获取水稻低空遥感冠层与地面冠层高光谱, 并对其进行以窗口宽度为15和阶数为3的Savitzky-Golay平滑处理和光谱变换(得到原始光谱、 一阶微分光谱和倒数之对数光谱), 分窗口对这3种光谱分别进行Gram-Schmidt变换, 找到投影空间并映射出主基底, 实现高光谱数据降维, 绘制具有显著性概率的主基底, 其极大极小值为特征波段。 此外3种光谱还采用了主成分分析和连续投影法降维。 以降维后的数据与水稻纹枯病病情指数进行支持向量机回归建模, 其中支持向量机回归进行粒子群优化, 并以径向基为核函数, 对比分析了3种降维方式的降维效果。 结果表明: 水稻地面冠层尺度建模效果高于低空遥感尺度建模; 在光谱处理方面, 低空冠层高光谱进行倒数之对数变换效果较好, 地面冠层所得高光谱数据进行一阶微分变换效果较好; 分窗Gram-Schmidt变换算法优于主成分分析和连续投影法; 粒子群算法可以优化支持向量机中的惩罚系数和核函数参数, 提高其反演精度; 无人机低空遥感尺度中, 高光谱进行倒数之对数处理, 以分窗Gram-Schmidt变换降维, 敏感波段为427.3, 539.6, 749.5和825.4 nm, PSO-SVR建模决定系数 R2为0.731, 均方根误差RMSE为0.151; 地面冠层尺度中, 高光谱进行一阶微分处理, 以分窗Gram-Schmidt变换降维, 敏感波段为552, 607, 702和730 nm, PSO-SVR模型决定系数 R2为0.778, 均方根误差RMSE为0.147。 因此, 高光谱技术可以有效地检测水稻纹枯病, 并且其病情指数可用冠层高光谱进行反演, 分窗Gram-Schmidt变换对于高光谱数据降维有较好的效果, PSO-SVR建模对于水稻纹枯病病情指数的反演有明显提高, 结果可为冠层尺度检测水稻纹枯病与病害发生情况提供一定的理论基础和技术支撑。

关键词: 水稻纹枯病; 病害检测; 高光谱降维; Gram-Schmidt变换; 粒子群优化; 支持向量机回归
中图分类号:TP79 文献标志码:A
Detection of Rice Sheath Blight Disease Index Based on Split-Window Gram-Schmidt Transformation and PSO-SVR Algorithm
XIAO Wen1, CAO Ying-li1,2,*, FENG Shuai1, LIU Ya-di1, JIANG Kai-lun1, YU Zheng-xin1, YAN Li1
1. College of Information and Electrical Engineering, Shenyang Agricultural University, Shenyang 110161, China
2. Liaoning Agricultural Information Engineering Technology Center, Shenyang Agricultural University, Shenyang 110161, China
*Corresponding author
Abstract

Sheath blight is one of the main diseases of rice, whose control is of great significance to ensure rice yield and quality. Hyperspectral detection of rice diseases has been widely adopted in recent years, and hyperspectral dimensionality reduction is an important part of spectral analysis. In this study, the hyperspectral data of low altitude remote sensing canopy and rice ground canopy were obtained in Shenyang Agricultural University rice proving ground in 2019, and were smoothed by Savitzky-Golay with a window width of 15 and order of 3, as well as spectral transformations (original reflection spectrum, first-order differential reflection spectrum and inverse-log reflection spectrum), were carried out. To reduce the dimension of hyperspectral data in these 3 spectra, the split-window Gram-Schmidt transform method was used to find the projection space and map the main substrate, in which the main base with significant probability was drawn, and its maximum and minimum value was the characteristic band. The principal component analysis and successive projections algorithm were also used for dimensionality reduction of three spectra. Dimension-reduced data and rice sheath blight disease index were modeled by support vector machine regression, which was used for particle swarm optimization and radial basis function as the kernel function. The effect of three-dimensionality reduction methods was compared and analyzed. The results showed that the modeling effect of the rice ground canopy scale was better than that of the low-altitude remote sensing scale; in the aspect of hyperspectral data processing, the inverse logarithm transformation effect of low-altitude canopy hyperspectral data was better, and the first-order differential transformation effect of ground canopy hyperspectral data was better; the split-window Gram-Schmidt transformation algorithm was better than principal component analysis and successive projections algorithm; particle swarm optimization could optimize the penalty coefficient and kernel function parameters in SVR, and improve the inversion accuracy; in the low-altitude remote sensing canopy scale, the hyperspectral spectrum was processed by using the inverse logarithm processing and the split-window Gram-Schmidt transform, whose sensitive bands were 427.3, 539.6, 749.5 and 825.4 nm respectively. The determination coefficient R2 was 0.731 and RMSE was 0.151 by using the PSO-SVR model; in the ground canopy scale, the hyperspectral spectrum was processed by using the first order differential processing and the split-window Gram-Schmidt transform, whose sensitive bands were 552, 607, 702 and 730 nm respectively. The determination coefficient R2 was 0.778 and RMSE was 0.147 by using the PSO-SVR model. In conclusion, rice sheath blight can be effectively detected by hyperspectral technology, and its disease index can be retrieved by canopy hyperspectral analysis. The split-window Gram-Schmidt transform has a good effect on the dimensionality reduction of hyperspectral data. PSO-SVR modeling can significantly improve the inversion of rice sheath blight disease index. The results can provide a theoretical basis and technical support for the detection of rice sheath blight and disease occurrence on the canopy scale.

Keyword: Rice sheath blight; Disease detection; Hyperspectral dimensionality reduction; Gram-Schmidt transform; Particle swarm optimization; Support vector machine regression
引言

纹枯病是水稻受立枯丝核菌的侵染而造成的一种病害, 主要为害叶鞘, 叶片次之, 感染纹枯病会使水稻的谷粒不饱满, 严重的会造成谷粒空壳和植株倒伏枯死, 继而导致水稻的质量与品质的下降。 及时并准确的对水稻纹枯病进行检测和程度分级, 对于水稻的田间管理、 水稻病害防治和保证产量质量具有重要意义。 目前检测植物病害依靠有经验人员人为目测和室内基因分子生物学检测这两种方法, 常会造成人为误判、 检测效率低和成本昂贵, 因此采用光谱分析的方法可以解决传统方法的不足之处, 其检测速度较快, 并适用于大范围样本, 是检测植物病害的有效方法[1]。 Azadbakht等[2]研究了不同LAI水平下, 实现在冠层尺度上基于高光谱的小麦叶锈病严重程度的检测, Pourreza等[3]利用587~589 nm波长作为识别波段, 训练支持向量机分类器, 研制了一种用于柑桔黑斑病诊断的单色视觉传感器, 检测准确率在93.3%~94.6%之间。 以上研究证明了光谱分析在植物病害方面有较好的检测结果。

近年来, 针对水稻纹枯病检测越来越多, Faranak等[4]使用卫星SPOT-5图像检测水稻纹枯病, 植被指数RVI14, SDI14和SDI24可以很好的从患病植物中检测出健康植物, 但卫星遥感的分辨率低, 只能实现有无病害感染的区分。 除上述研究之外, 无人机遥感技术更加适合水稻纹枯病的检测, Zhang等[5]验证了无人机多光谱图像提取的NDVI与地面测量的NDVI之间具有很强的相关性R2为0.907, 并且多光谱图像提取的NDVI可以量化纹枯病感染程度, 准确度为63%。 赵晓阳等[6]证明了基于可见光与多光谱传感器的低空无人机遥感平台进行水稻纹枯病病害等级评估是可行的, 并且得出结论窄波段传感器在病害监测方面较宽波段消费级传感器更有优势, 因此本研究采用比多光谱波段更窄的高光谱进行研究。

本研究利用光谱技术进行水稻纹枯病的病情指数估测, 探讨地面冠层和低空冠层所采集的高光谱, 采用不同的光谱变换和3种降维算法建立最优的检测模型, 为精准农业的水稻管理与防治提供一定的理论基础和技术支撑。

1 实验部分
1.1 研究区概况

试验于2019年在沈阳农业大学北方粳型超级稻成果转化基地进行(123°33'E, 41°48'N), 水稻是当地的主要粮食作物之一。 试验时间是2019年8月1日、 8月19日和9月1日正午12时至16时晴天无风日。 由于氮素含量和品种对水稻光谱有很大的影响, 本试验设计4个施氮水平N0—N3: N0对照(0 kg·ha-1)、 N1(150 kg·ha-1)、 N2(240 kg·ha-1)、 N3(330 kg·ha-1); 5个辽宁地区主栽品种V1—V5: V1(399)、 V2(盐丰47)、 V3(桥润粳)、 V4(美丰稻)、 V5(盐粳糯66), 共20个小区, 各小区之间采取隔离措施, 粳稻生长过程中其他试验措施保持一致。

图1 20个小区分布Fig.1 Distribution of 20 rice plots

1.2 试验数据采集

低空遥感冠层尺度选用无人机Matrice 600作为遥感平台, 遥感平台搭载GaiaSky-mini高光谱成像仪, 光谱范围为400~1 000 nm, 光谱分辨率为(4±0.5) nm, 无人机飞行高度为100 m, 悬停采集数据, 将获取的高光谱影像在SpectralView软件中进行反射率校正、 区域校正、 辐射度校正等预处理。 预处理后得到的高光谱影像在ENVI5.3软件中进行进一步的高光谱数据提取, 20个小区中每个小区平分左中右三部分分别建立感兴趣区(region of interest, ROI), 把每个ROI的光谱值均化处理作为试验样本。

地面冠层尺度的试验采用ASD FieldSpec HandHeld 2手持式地物光谱仪, 采集数据时使光谱仪探头与水稻冠层相距1 m, 每次拍摄一穴水稻的数据, 其分辨率为1 nm, 波长范围为325~1 075 nm。 每个小区平均采集3穴水稻, 为避免太阳光照角度变化, 在采集完一个小区的数据, 进行一次白板校正。

地面调查水稻纹枯病病情指数。 每个小区进行3次病情指数的地面调查, 每次调查一穴。 根据GBT 15791—2011稻纹枯病测报技术规范, 病情指数是全面考虑发病率与严重度的综合指标, 如式(1)。

病情指数=(各分蘖病害级别×病级株数)调查总株数×病害最高等级(1)

其中, 各分蘖病害级别依据常见的水稻纹枯病分级标准, 全株健康为零级, 第4叶以下(包括第4叶)发病为一级, 第3叶以下(包括第3叶)发病为三级, 第2叶以下(包括第2叶)发病为五级, 剑叶以下(包括剑叶)发病为七级, 全株发病为九级, 试验小区水稻纹枯病病害等级大多数为三, 五, 七3个等级。

1.3 主要数据分析方法

1.3.1 数据降维方法

分窗Gram-Schmidt变换法以Xn×p代表水稻冠层高光谱数据(其中n为样本量, p为光谱维度), 将其分为i个窗口。 每个窗口分别进行Gram-Schmidt正交变换, 随机选取第一个窗口中的一行数据H1= X1×pi( X1×pi为第1行中第i个窗口的数据), 其初始能量为H1 H1T, 初始能量归一化为Z1= H1H1H1T, Z1为投影空间的第一个投影向量, 然后在此窗口剩下的数据里依次选择每行向量, 将其与Z1进行Gram-Schmidt正交变换 H2=X2×pi-XT2×piZ1ZT1Z1Z1, 若H2 的能量大于设定的阈值ε , 则 Z2=H2H2HT2作为投影空间的第二个投影向量, 若小于阈值则舍弃。得到的第q个向量为 Hq=Hq-K=1q-1HTqZKZTKZKZK, 第q个投影空间为 Zq=HqHqHTq。最后获得了基函数投影空间 ZT=(Z1, Z2, , Zq)pi×qi, 一般 qp。将此窗口的原始数据投影到基函数空间 ZT到投影系数 Cn×qi即为此窗口降维后的数据, 其他窗口重复上述步骤, 则分窗Gram-Schmidt正交化算法所得的降维后的数据为 Cn×q

1.3.2 数据建模方法

在检测植物病害方面支持向量机被广泛使用[7, 8], 支持向量回归(support vector regression, SVR)是使所有的样本离超平而的距离总和最小。 本研究选择高斯径向基核函数。 K(x, xi)=exp(-gx-xi)2其中, K(x, xi)为核函数, g为核函数参数。 在支持向量机回归模型中, 惩罚系数c和核函数参数g会影响它的建模效果, 因此利用粒子群算法进行两个参数的寻优。 粒子群优化算法(particle swarm optimization, PSO)是一种随机搜索算法, 它能以较大的概率收敛并得到全局范围的最优解。 在动态的、 多目标的优化问题中, 相比传统优化算法, PSO算法具有更快的搜索速度以及避免陷入局部最优的能力。

主要算法内容: 对于由n个粒子组成的粒子群, 每个粒子都需要完成搜寻惩罚因子和核函数系数最优位置的取值任务, 并将每一次迭代所求的最优解带入SVR中进行均方误差(mean square error, MSE)分析, 直至模型的MSE达到全局最优, 将对应的搜索解输出为全局最优解, 得出SVR模型参数寻优结果。

2 结果与讨论
2.1 水稻高光谱与纹枯病病情指数分析

将地面冠层和无人机低空冠层的高光谱数据, 通过样本光谱曲线与所有样本的平均曲线的距离大小剔除异常光谱样本, 去除光谱仪设备内部对光谱边界的噪声影响, 保留水稻敏感波段, 将两个尺度获取的高光谱波段统一定为400~1 000 nm, 在此波段下进行数据分析。 进行Savitzky-Golay平滑处理, 通过选用不同的多项式阶数和窗口宽度进行对比, 得到多项式阶数为3和窗口宽度为15是最佳的平滑处理, 能够较好的保留原始光谱信息, 将平滑后的光谱作为检测建模所使用的原始光谱(original reflection spectrum, ORS)。

为了更明显的看出, 在纹枯病的干扰下水稻光谱的变化规律, 将纹枯病病情指数分为三个程度, Light(病情指数< 0.4), Moderate(0.4< 病情指数< 0.6), Serious(病情指数> 0.6), 图2为3种病害程度在低空冠层和地面冠层尺度下的平均光谱反射率。 两个尺度的光谱反射率曲线满足一般规律, 400~750 nm是植物叶片可见光范围, 其光合作用强, 是强吸收波段, 反射和透射较低, 由于叶绿素的强吸收, 550 nm形成了一个反射峰, 680 nm处形成了吸收谷, 700~760 nm波段为红边区域, 光谱曲线急剧上升, 并在760 nm左右产生峰值, 760 nm以上为不可见光波段。 由图2可见, 光谱反射率随病情严重程度发生变化, 病情越严重在可见光波段反射率越高, “ 绿峰” 附近表现最为明显, 而病情越严重在不可见光波段光谱反射率越低。 造成这个现象的主要原因是因为随着水稻的生长和纹枯病病情的加重导致水稻内部结构发生变化, 叶绿素含量减少、 水分吸收衰退等影响。

图2 3种病情程度下水稻原始光谱反射率曲线
(a): 低空遥感冠层; (b): 地面冠层
Fig.2 The original spectral reflectance curves of rice under the condition of three degrees of rice sheath blight
(a): Low altitude remote sensing canopy; (b): Ground canopy

将原始光谱进行一阶微分变换(first-order differential reflection spectrum, FDRS), 得到的光谱对地物目标的特征光谱更加明显。 由图3可知, 两个尺度在蓝波段、 红波段、 近红外波段的差异在4%以内, 绿波段和红边波段处区别明显。 其中地面冠层尺度中, 病害程度严重的波峰发生了蓝移现象并低于轻度水稻。

图3 3种病情程度下水稻一阶微分光谱反射率曲线
(a): 低空遥感冠层; (b): 地面冠层
Fig.3 First-order derivative spectral reflectance curves of rice under the condition of three degrees of rice sheath blight
(a): Low altitude remote sensing canopy; (b): Ground canopy

将原始光谱进行倒数之对数变换(inverse-log reflection spectrum, IRS), 得到的光谱区分度更大。 由图4可知, 低空冠层尺度中, 在可见光波段范围光谱区分度大, 染病程度越严重反射率越低, 在近红外波段内重叠率97%以上。 地面冠层尺度中, 染病程度高的水稻光谱在可见光波段中反射率低, 近红外波段中反射率高, 其中, 中度染病IRS光谱在675 nm处稍高于轻度染病IRS光谱。

图4 3种病情程度下水稻倒数之对数光谱反射率曲线
(a): 低空遥感冠层; (b): 地面冠层
Fig.4 Inverse-log spectral reflectance curves of rice under the condition of three degrees of rice sheath blight
(a): Low altitude remote sensing canopy; (b): Ground canopy

2.2 基于分窗Gram-Schmidt变换的水稻纹枯病光谱降维

本研究采用分段方法进行Gram-Schmidt变换降维, 通过控制分段窗口值的大小来筛选产生最优降维模型, 经过大量试验测试设定的阈值ε 取0.01时效果最佳。 将降维后的数据与水稻纹枯病病情指数建立多元回归模型, 通过决定系数R2值选取最优的分段窗口值。 其中, 低空遥感冠层尺度, ORS, FDRS和IRS最优窗口值分别为30, 45和45 nm, 对应的决定系数R2分别为0.576, 0575和0.590, 倒数之对数光谱处理效果较好; 地面冠层尺度, ORS, FDRS和IRS最优窗口值分别为220, 220和150 nm, 对应的决定系数R2分别为0.631, 0.654和0.622, 一阶微分光谱效果较好。 总体来说, 水稻纹枯病病情指数反演, 地面冠层尺度优于低空冠层尺度。

分窗Gram-Schmidt正交化变换降维能够寻找敏感波段。 由Gram-Schmidt正交化算法处理水稻叶片光谱反射率后, 可以得到基向量的统计学参数显著性概率值(p-value)。 p-value是判断假设检验结果的参数, 当p-value< 0.05时, 说明结果显著。 低空冠层尺度倒数之对数变换的决定系数较高, 地面冠层尺度一阶光谱变换的决定系数较高, 分别绘制这两个数据的基向量光谱信息情况(图5), 水稻纹枯病敏感波段为同一分窗波段所有效果显著基向量的极值位置, 低空冠层高光谱敏感波段为427.3, 539.6, 749.5和825.4 nm, 地面冠层高光谱的敏感波段为552, 607, 702和730 nm, Gram-Schmidt正交化方法在降维的同时也能兼顾到敏感波段的提取。

图5 基于分窗Gram-Schmidt变换所得主基底与特征波长
(a): 低空遥感冠层倒数之对数光谱; (b): 地面冠层一阶变换光谱
Fig.5 Main base and characteristic wavelength based on window dividing Gram-Schmidt transform
(a): IRS of the low altitude remote sensing canopy; (b): FDRS of the ground canopy

2.3 基于其他算法的水稻纹枯病光谱降维

基于主成分分析算法的水稻纹枯病光谱降维。 将6类光谱数据进行主成分分析降维, 结果显示, 前6个主成分分别包含6类光谱原数据的75.68%, 99.86%, 99.86%, 91.55%, 99.91%和99.94%, 其中, 地面和低空冠层尺度的原始光谱前6个主成分累积贡献较低, 分别使用前15个和前10个主成分进行后续的建模处理, 能够包含95%以上的原数据。

基于连续投影算法的水稻纹枯病光谱降维。 6类光谱数据分别进行连续投影法降维, 计算SPA选择不同变量数的均方根误差RMSE, 随着选取变量数的增加, RMSE逐渐减小, 当RMSE不再显著减小时的变量数作为特征变量数, 将所选择的波段作为建模输入值。

2.4 建立水稻纹枯病病情指数检测模型

首先应用PSO算法进行SVR中参数的优化, 其中, PSO中设置局部搜索能力为1.5, 全局搜索能力为1.7, 最大进化数量为200, 种群最大数量为20。 用SVR模型5折交叉验证所求得的平均MSE值作为目标适应度函数, 对惩罚系数c和核参数g进行参数寻优, 并对粒子设置了自适应的变异因子以防止陷入局部最优化的求解循环, 从而确保寻优结果的可靠性, 群体最优适应度经过迭代次数的增加得到了全局最优解。

以PSO寻优的结果为SVR中惩罚系数c和核参数g的已知量, 建立水稻高光谱与水稻纹枯病病情指数的反演模型, 表1为各光谱数据采用PSO算法前后SVR建模效果比较。 可以看出, 原始光谱数据经过一阶微分变换和倒数之对数变换后精确度都有所提升, 并且低空冠层尺度, 倒数之对数变换优于一阶微分变换, 而地面冠层尺度的光谱一阶微分变换优于倒数之对数变换。 3种降维方式中, Gram-Schmidt变换算法优于主成分分析和连续投影法, 具有良好的降低光谱数据维度的能力, 对于水稻纹枯病病情指数的反演有较好的精确度。 本研究应用粒子群算法优化支持向量机回归模型中的参数, 得到较好的建模效果。 并且无人机低空遥感尺度建立的模型要普遍低于地面冠层尺度模型, 这是由于无人机低空遥感所采集的数据与地面冠层采集的数据相比, 会受到空间分辨率低和地物分布复杂的影响, 使水稻光谱数据更不纯净。

表1 经过支持向量机回归建模所得结果 Table 1 The result of regression modeling with support vector machine
3 结论

对水稻进行无人机低空遥感、 地面冠层两个尺度的光谱数据采集, 建立水稻纹枯病病情指数检测模型。 将所采集的光谱数据进行平滑处理和光谱变换, 分别进行分窗Gram-Schmidt变换算法、 主成分分析和连续投影法降维, 基于粒子群算法的支持向量机回归建立水稻纹枯病病情指数检测模型并对比分析。 主要结论如下:

(1)高光谱数据经过合适的光谱变换可以提高建模精度。 其中, 低空遥感冠层高光谱, 经倒数之对数处理效果较好; 地面冠层高光谱数据, 经一阶微分处理较好。

(2)本文提出的分窗Gram-Schmidt变换算法可以有效降低高光谱维度, 并能找到敏感波段, 此方法优于主成分分析法和连续投影法。

(3)基于无人机低空遥感和地面冠层两个尺度进行水稻纹枯病病情指数检测是可行的。 通过光谱变化与分窗Gram-Schmidt降维算法, 以PSO-SVR模型可以有效地反演出水稻纹枯病病情指数。

参考文献
[1] ZHANG Jing-cheng, YUAN Lin, WANG Ji-hua, et al(张竞成, 袁琳, 王纪华, ). Transactions of the Chinese Society of Agricultural Engineering(农业工程学报), 2012, 28(20): 1. [本文引用:1]
[2] Mohsen Azadbakht, Davoud Ashourloo, Hossein Aghighi, et al. Computers and Electronics in Agriculture, 2019, 156: 119. [本文引用:1]
[3] Alireza Pourreza, Won S Lee, Mark A Ritenour, et al. Horttechnology, 2016, 26(3): 254. [本文引用:1]
[4] Faranak Ghobadifar, Aimrun Wayayok, Shattri Mansor, et al. Geomatics Natural Hazards & Risk, 2016, 7(1): 237. [本文引用:1]
[5] Zhang Dongyan, Zhou Xingen, Zhang Jian, et al. PLOS ONE, 2018, 13(5): 0187470. [本文引用:1]
[6] ZHAO Xiao-yang, ZHANG Jian, ZHANG Dong-yan, et al(赵晓阳, 张建, 张东彦, ). Spectroscopy and Spectral Analysis(光谱学与光谱分析), 2019, 39(4): 1192. [本文引用:1]
[7] Deng Xiaoling, Lan Yubin, Hong Tiansheng, et al. Computers and Electronics in Agriculture, 2016, 130: 177. [本文引用:1]
[8] LAN Yu-bin, ZHU Zi-hao, DENG Xiao-ling, et al(兰玉彬, 朱梓豪, 邓小玲, ). Transactions of the Chinese Society of Agricultural Engineering(农业工程学报), 2019, 35(3): 92. [本文引用:1]