高光谱成像的水稻稻瘟病早期分级检测
康丽1,2, 袁建清3, 高睿1, 孔庆明1, 贾银江1, 苏中滨1,*
1.东北农业大学电气与信息学院, 黑龙江 哈尔滨 150030
2.大连工业大学信息科学与工程学院, 辽宁 大连 116034
3.哈尔滨金融学院计算机系, 黑龙江 哈尔滨 150030
*通讯作者 e-mail: suzb001@163.com

作者简介: 康 丽, 1981年生, 大连工业大学信息科学与工程学院讲师 e-mail: kally_05@163.com

摘要

稻瘟病是世界公认的水稻重大病害之一。 实现稻瘟病害的早期分级检测, 对水稻病害早期防治及精准用药具有重要意义。 以大田自然发病水稻为研究对象, 采集稻瘟病发病早期染病叶片和健康叶片, 获取所有叶片样本在400~1 000 nm波段内的高光谱图像并提取光谱数据。 水稻在染病之初不会立刻出现病斑, 无法识别采集到的无斑叶片是否染病。 为实现对自然染病叶片早期无病斑状态的识别, 提出取染病叶片贴近病斑的非病斑区域高光谱数据作为染病等级中的1级样本进行检测分析。 按照病斑面积将样本划分为4个等级: 健康叶片为0级(109片)、 染病无病斑为1级(116片)、 病斑面积小于10%为2级(107片)、 病斑面积小于25%为3级(101片)。 运用主成分分析(PCA)和竞争性自适应重加权(CARS)算法进行特征变量选取, CARS提取的特征波段较多, 利用PCA算法对其进一步降维。 分别以全谱数据、 PCA提取的4个、 8个、 CARS选择的21个、 CARS-PCA提取的6个特征变量为输入, 建立水稻稻瘟病早期高光谱支持向量机(SVM)、 PCA4-SVM、 PCA8-SVM、 CARS-SVM和CARS-PCA-SVM检测模型。 结果显示, 所有模型对各级样本的检测准确率均较高, 其中, 对1级样本的检测准确率与其他级别相当, 识别效果较好; 所有模型的样本总体准确率均大于94.6%, CARS-SVM模型的总体准确率最高为97.29%, CARS-PCA-SVM模型为96.61%略低于CARS-SVM模型, 但其输入变量仅为6个, 较CARS-SVM的21个减少71.43%, 模型更为简洁、 更利于提高检测速度。 因此, 综合评价CARS-PCA-SVM模型最优, 各级准确率分别为97.30%, 94.87%, 94.29%和100.00%。 结果表明, 所建模型检测准确度较高, 可以实现对大田自然发病的稻瘟病早期分级检测, 为稻瘟病染病之初无病斑叶片的检测提供新思路, 为水稻稻瘟病早期防治、 精准施药及检测仪器开发提供理论依据。

关键词: 高光谱; 稻瘟病; 早期检测; 主成分分析; 竞争性自适应重加权
中图分类号:TP391 文献标志码:A
Early Detection and Identification of Rice Blast Based on Hyperspectral Image
KANG Li1,2, YUAN Jian-qing3, GAO Rui1, KONG Qing-ming1, JIA Yin-jiang1, SU Zhong-bin1,*
1. Academy of Electric and Information, Northeast Agricultural University, Harbin 150030, China
2. School of Information Science and Engineering, Dalian Polytechnic University, Dalian 116034, China
3. Harbin Finance University, Harbin 150030, China
*Corresponding author
Abstract

Rice blast is a worldwide destructive rice disease. It is of great significance for rice disease control and precision spraying to detect rice blast early and identify the severity of the disease. Based on field experiment and natural infection of rice blast, infected leaves and healthy leaves were collected in the early stage of leaf blast. Hyperspectral images in the spectral range of 400~1 000 nm were captured and the spectral data were extracted. Rice leaves will not immediately show lesions at the beginning of the disease, so it is impossible to identify and collect samples of infected leaves without lesions. In order to realize the early detection of infected leaves without visible lesion, this study proposed to take hyperspectral data of lesion-free areas adjacent to the lesioned areas on the infected leaves as level 1 samples. According to the area of the lesion, the samples were divided into four levels: level 0 (109 pieces) for healthy leaves, level 1 (116 pieces) for infected leaves without visible lesion, level 2 (107 pieces) for leaves with lesion area <10%, and level 3 (101 pieces) for leaves with lesion area <25%. Principal component analysis (PCA) and competitive adaptive reweighting sampling (CARS) were used to extract feature variables; PCA algorithm was used to reduce further the dimension of the bands extracted by CARS. The support vector machine (SVM), PCA4-SVM, PCA8-SVM, CARS-SVM and CARS-PCA-SVM models for early detection of rice blast were build based on the full spectral variables and extracted feature variables, respectively. In this study, all models had high detection accuracy for all levels of samples. Level 1 had good detection accuracy, similar to other levels. All models had an overall accuracy rate above 94.6%. The highest was the CARS-SVM model at 97.29%, and the CARS-PCA-SVM model at 96.61% was slightly lower, but its number of input variables was only 6, which was 71.43% less than that of 21 in the CARS-SVM model. It further reduced the complexity of CARS-SVM model and improved the operation speed. So, the comprehensive evaluation of CARS-PCA-SVM model was optimal, with the identification accuracy of 97.30%, 94.87%, 94.29% and 100.00% for each level, respectively. Therefore, it is feasible to use hyperspectral imaging technology to detect the early stage of rice blast. The results presented in this paper can provide new ideas for the detection of infected leaves without lesions at the beginning of rice blast, and provide a theoretical basis for the early control of rice blast, precision spraying of pesticide and the development of detection instruments.

Keyword: Hyperspectral; Rice blast; Early detection; Principal component analysis; Competitive adaptive reweighting sampling
引言

稻瘟病是世界公认的水稻三大病害之一, 极大地危害水稻的品质和产量, 因而对稻瘟病的监测与防治一直是水稻种植领域的重要课题。 目前主要采取阶段性提前喷洒农药防治稻瘟病, 虽然在一定程度上起到防治作用, 但由于不区分发病与否, 易造成施药过量、 危害食品安全、 污染环境、 抬升成本等问题。 实现稻瘟病的分级监测, 尤其发病早期叶片的检测识别, 对早期防治、 精准科学施药等具有指导意义。

目前农田生产中稻瘟病识别和分级方式主要以传统的人工观察为主, 效率低、 误差大, 尤其对于症状不明显的发病早期叶片, 非专业人员不易识别, 对于发病之初的无病斑叶片, 人工更是完全无法识别。 近年来, 高光谱技术以其无损、 绿色、 高效等优点逐步引起农业领域研究人员的关注, 已在作物识别[1]、 叶绿素估算[2, 3]、 生物量检测[4]、 病虫害检测[5, 6, 7, 8]等方面得到广泛研究。 水稻病害方面, 李志伟等[9]应用高光谱技术对水稻纹枯病进行识别; 朱梦远等[10]研究了基于高光谱数据和叶绿素含量的纹枯病早期识别; Kobayashi等[11]利用航空高光谱图像对水稻稻瘟病区域识别进行了研究; 袁建清等[12]针对寒地水稻研究了稻瘟病与缺氮叶片高光谱识别; 黄双萍等[13]对穗瘟病的高光谱检测方法进行了研究。 目前利用高光谱技术对水稻稻瘟病叶片检测的研究主要集中在染病叶片和健康叶片的区分识别, 及轻重程度差异较大的分级检测。 对于早期分级检测研究较少, 基于自然发病的早期检测, 尤其对非人工接种方式染病无病斑叶片的检测研究未见报道。

以大田自然发病水稻为研究对象, 应用高光谱成像技术, 对水稻稻瘟病早期分级检测进行研究, 并提出染病无病斑级别进行检测。 采用多种特征变量提取方式, 构建多个稻瘟病早期高光谱分级检测模型, 对比分析确定最优模型, 以实现为水稻病害早期防治、 精准用药以及监测仪器的开发提供理论支持。

1 实验部分
1.1 样本

样本全部采集于黑龙江省哈尔滨市方正县水稻研究院大田。 选择在稻瘟病发病明显的水稻拔节期进行样本采集, 根据病斑区域大小选取染病程度较轻叶片和健康叶片放入保温箱内, 并立即带入研究院内实验室采集高光谱图像。 最终获得有效样本共计433片, 其中, 健康叶片109片、 染病叶片324片。

水稻感染稻瘟病之初, 并不会立刻出现可见病斑, 无病斑导致在田间无法识别、 无法直接采集到此类叶片样本。 有病斑叶片的病斑附近虽未呈现病斑, 但叶片组织也已受到病害侵袭、 遭到破坏, 因此, 为实现对自然发病状态下最早期的染病叶片无病斑状态的检测, 提取染病叶片样本靠近病斑的非病斑区域高光谱数据进行研究。 在采集的染病叶片中随机选取116片作为此类样本, 定义为染病等级中的1级(染病无病斑)样本。

根据病斑面积将所有叶片样本划分为4个等级: 健康叶片为0级(109片)、 染病无病斑为1级(116片)、 病斑面积< 10%为2级(107片)、 病斑面积< 25%为3级(101片)。 将4个级别的样本各自随机排列, 按照2:1的比例随机划分建模集和验证集, 具体样本数量描述如表1所示。

表1 样本数量统计表 Table 1 Quantitative statistic of samples
1.2 高光谱数据获取

使用美国HeadWall公司生产的高光谱成像系统进行水稻叶片样本高光谱图像采集。 该系统主要由高光谱相机、 采集器、 卤素灯光源、 可移动载物台、 计算机以及光源箱等部件组成, 光谱范围为400~1 000 nm、 采样间隔3 nm。 将待测叶片正面朝上平铺在移动平台上, 调整并设置载物台移动速度3.0 mm· s-1、 曝光时间30 ms, 镜头垂直向下高度45 cm, 进行高光谱图像采集。 为消除采集图像中由环境、 设备等因素引起的测量偏差, 对其进行反射率标定: 扫描标准白板获得标准图像Rw, 关闭快门、 盖上镜头盖获得暗场图像Rd, 对待校正的高光谱图像Rr进行式(1)运算, 获得校正后高光谱图像R

R=Rr-RdRw-Rd(1)

利用ENVI5.3软件, 避开叶脉和叶片边缘, 在叶片中段位置随机分散选取4个矩形区域为感兴趣区域, 2和3级样本需包含病斑, 1级样本选择贴近病斑的无病斑区域。 计算区域内所有像素点的光谱反射率平均值作为该叶片样本的高光谱数据, 全部样本光谱曲线如图1所示。

图1 全部水稻叶片光谱曲线Fig.1 Reflectance spectra of all rice leaves

为降低环境、 仪器、 测量方法等因素引起的干扰和影响, 对高光谱数据进行Savitzky-Golay卷积平滑和归一化处理。

1.3 特征变量选取

为解决由于高光谱数据波段多、 数据量大而带来的数据相关、 冗余、 共线性等问题, 降低模型的复杂度、 提高建模精度和运算速度, 运用主成分分析(principle component analysis, PCA)和竞争性自适应重加权(competitive adaptive reweighted sampling, CARS)算法对高光谱数据进行染病级别的特征变量选取。

PCA是将多个变量通过线性变换转换为相互正交、 信息不重叠的新变量[14]。 PCA概念简单、 运算简洁, 能够在保留有效信息的同时解决变量之间的多重共线性问题, 在高光谱数据降维、 特征提取、 消除噪声、 去相关性等方面得到广泛应用。

CARS是基于蒙特卡罗采样与偏最小二乘法(partial least squares, PLS)模型回归系数的特征变量选择方法。 采用自适应重加权采样技术选取PLS模型中回归系数绝对值权重较大的变量, 剔除权重较小的变量, 建立PLS模型, 经多次运算, 通过交互验证选取均方根误差最低的子集中的变量作为特征波长。

1.4 分类模型

支持向量机(support vector machine, SVM)是一种有监督机器学习方法, 它是在线性分类器的基础上, 引入结构风险最小化原理、 最优化理论和核方法演化而成[15]。 适用于处理样本少、 特征多、 非线性等复杂问题, 具有运算速度快、 抗噪声、 泛化能力强等优点, 目前在很多研究领域得到广泛应用。 因此, 选用SVM进行水稻稻瘟病早期分级检测建模。

2 结果与讨论
2.1 PCA降维

采用PCA算法对全部样本的高光谱数据进行降维, 前10个主成分(principle component, PC)特征值和累积贡献率如表2所示。 PC1的贡献率最大, 为45.59%, PC2的贡献率为30.78%, 前3个PC的累积贡献率为83.86%, 前4个PC的累积贡献率为90.14%, 之后各PC的累积贡献率继续提高, 幅度逐步变小。

表2 前10个主成分特征值和累积贡献率 Table 2 The eigenvalues and the cumulative contributions of the first 10 PCs

选择主成分的常用标准主要有两种: (1)累积贡献率大于等于85%; (2)特征值大于等于1。 在此, 前4个PC累积贡献率为90.14, 符合标准(1); 前8个PC特征值符合标准(2)。 因此, 分别以前4个PC和前8个PC作为特征变量建模。

2.2 CARS特征波长选择

采用CARS对全部叶片高光谱数据进行染病级别特征波长选择, 蒙特卡罗采样次数设置为50, 选择过程如图2。

图2 CARS特征波长选择过程Fig.2 Variable selection based on CARS

图2(a)表明变量个数随采样次数增加逐步减少, 下降速度由快变慢, 体现了变量选取由“ 粗” 到“ 精” 的选择过程。 图2(b)显示了PLS模型的交叉验证RMSECV值随采样次数增加先降后升。 由图2(c)中“ * ” 的位置可知, 当采样次数为25时, RMSECV值最小, 表明与稻瘟病检测不相关或共线性信息已被剔除, 第25次采样之后, RMSECV值逐步升高, 表明与稻瘟病检测相关的变量被剔除, 尤其37次以后, 模型性能明显变差。 因此, 选择第25次采样获得的变量为特征波长, 共计21个, 分布如图3。

图3 CARS特征波长选择结果Fig.3 Results of variable selection based on CARS

2.3 CARS-PCA特征波长降维

通过CARS选取的稻瘟病检测特征波长数为21, 数量依然较多。 为了进一步减少变量之间可能存在的相关性或共线性、 获取更少的关键特征变量, 利用PCA对CARS选取的特征波长变量进一步降维, 结果如表3。 前6个PC的累积贡献率已达到99.27%, 所以取前6个主成分变量为特征变量建模。

表3 前6个主成分特征值和累积贡献率 Table 3 The eigenvalues and the cumulative contributions of the first 6 PCs
2.4 分类建模

运用SVM算法, 分别以全波段变量、 PCA提取的4个、8个特征变量、 CARS和CARS-PCA获取的特征变量为输入, 建立稻瘟病检测SVM、 PCA4-SVM、 PCA8-SVM、 CARS-SVM和CARS-PCA-SVM模型, 核函数选用径向基函数, 每个模型均通过网格搜索法对惩罚因子C和核参数g寻取最优值, 建模结果见表4

表4 各分类模型预测准确率 Table 4 Prediction results of identification models

所有模型的样本总体检测准确率全部大于94.6%, 精度较高。 各模型对3级样本的检测准确率最高; 对1级样本的检测准确率最高值为97.44%, 最低值为89.74%, 平均值为94.87%, 与0级和2级相当, 识别效果较好。 基于全波段所建SVM模型各级别的准确率分别是91.89%, 97.44%, 91.43%和100.00%, 总体准确率是95.19%, 能够较为准确地检测各级别稻瘟病。 PCA8-SVM的准确率与全谱SVM模型相当, 但输入变量由203减为8。 CARS-SVM模型的总体准确率最高, 与SVM模型比较, 1级、 3级准确率相同, 0级、 2级和总体准确率分别提高了2.94%, 6.25%和2.21%; 输入变量数为21, 较SVM减少了89.66%。 CARS-PCA-SVM模型的各级准确率均大于94%, 总体准确率为96.61%, 比CARS-SVM略低0.68%, 但其输入变量数为6, 较CARS-SVM减少71.43%, 进一步降低模型的复杂度、 提高模型的运算速度, 因此, 综合评价CARS-PCA-SVM模型为最优模型, 其各级准确率分别为97.30%, 94.87%, 94.29%和100.00%。

3 结论

以大田自然发病症状较轻的稻瘟病叶片和健康叶片为研究对象, 采用不同特征变量选取算法, 构建并对比分析多种水稻稻瘟病早期分级检测模型, 主要结论如下:

1级样本即染病无病斑样本的检测效果较好; PCA, CARS和CARS-PCA均实现对高光谱数据的降维, 大幅降低数据的冗余度, 且较好地保留了表征叶片稻瘟病染病状况信息; 结果表明CARS-SVM模型的准确率最高, 结合模型复杂度、 运算速度综合评价CARS-PCA-SVM模型最优, 其各级和总体准确率分别为97.30%, 94.87%, 94.29%, 100.00%和96.61%, 建模输入变量数为6, 模型变量少、 检测精度较高、 运算速度较快。

基于大田自然发病, 实现了对水稻稻瘟病的早期分级检测, 为稻瘟病染病早期无病斑叶片的检测提供新思路, 为水稻稻瘟病监测、 早期防治、 精准施药提供科学依据, 也为开发实时、 便携病害检测仪器提供理论支持。

参考文献
[1] De Morsier F, Borgeaud M, Gass V, et al. IEEE Transactions on Geoscience & Remote Sensing, 2016, 54(6): 3410. [本文引用:1]
[2] Nijat Kasim, Shi Qingdong, Wang Jingzhe, et al. Transactions of the Chinese Society of Agricultural Engineering, 2017, 33(22): 208. [本文引用:1]
[3] Wang J, Wu W, Wang T, et al. Spectroscopy Letters, 2018, 51(9): 485. [本文引用:1]
[4] Wang Y, Jiang F, Gupta B B, et al. IEEE Access, 2018, 6: 5290. [本文引用:1]
[5] GUO Wei, ZHU Yao-hui, WANG Hui-fang, et al(郭伟, 朱耀辉, 王慧芳, ). Transactions of the Chinese Society for Agricultural Machinery(农业机械学报), 2019, 50(9): 162. [本文引用:1]
[6] Lu J, Zhou M, Gao Y, et al. Precision Agriculture, 2018, 19(3): 379. [本文引用:1]
[7] Ashourloo D, Aghighi H, Matkan A A, et al. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2016, 9(9): 4344. [本文引用:1]
[8] LEI Yu, HAN De-jun, ZENG Qing-dong, et al(雷雨, 韩德俊, 曾庆东, ). Transactions of the Chinese Society for Agricultural Machinery(农业机械学报), 2018, 49(5): 226. [本文引用:1]
[9] LI Zhi-wei, YUAN Jing, DING Wei-min, et al(李志伟, 袁婧, 丁为民, ). Journal of South China Agricultural University(华南农业大学学报), 2018, 39(6): 103. [本文引用:1]
[10] ZHU MENG-yuan, YANG Hong-bing, LI Zhi-wei, et al(朱梦远, 杨红兵, 李志伟, ). Spectroscopy and Spectral Analysis(光谱学与光谱分析), 2019, 39(6): 1898. [本文引用:1]
[11] Kobayashi T, Sasahara M, Kand a E, et al. Open Ggriculture Journal, 2016, 10(1): 28. [本文引用:1]
[12] YUAN Jian-qing, SU Zhong-bin, JIA Yin-jiang, et al(袁建清, 苏中滨, 贾银江, ). Transactions of the Chinese Society of Agricultural Engineering(农业工程学报), 2016, 32(13): 155. [本文引用:1]
[13] HUANG Shuang-ping, SUN Chao, QI Long, et al(黄双萍, 孙超, 齐龙, ). Transactions of the Chinese Society of Agricultural Engineering(农业工程学报), 2017, 33(20): 177. [本文引用:1]
[14] HE Yong, LIU Fei, LI Xiao-li, et al(何勇, 刘飞, 李晓丽, ). Spectroscopy and Imaging Technology in Agriculture(光谱及成像技术在农业中的应用). Beijing: Science Press(北京: 科学出版社), 2016. 125. [本文引用:1]
[15] ZHANG Bing, GAO Lian-ru(张兵, 高连如). Hyperspectral Image Classification and Target Detection(高光谱图像分类与目标探测). Beijing: Science Press(北京: 科学出版社), 2011. 192. [本文引用:1]