基于高光谱的番茄叶片斑潜蝇虫害检测
李翠玲1,2, 姜凯1,2, 马伟1,2, 王秀1,2,*, 孟志军1,2, 赵学观1,2, 宋健1,2
1. 北京农业智能装备技术研究中心, 北京 100097
2. 国家农业智能装备工程技术研究中心, 北京 100097
*通讯联系人 e-mail: wangx@nercita.org.cn

作者简介: 李翠玲, 女, 1985年生, 北京农业智能装备技术研究中心博士后 e-mail: licl@nercita.org.cn

摘要

番茄植株在生长过程中受病虫害的侵染, 将导致番茄减产和种植户的经济效益降低, 该研究用高光谱技术结合化学计量学方法, 实现了番茄叶片斑潜蝇虫害的快速识别。 搭建了简易的高光谱成像系统, 包括光源单元、 高光谱图像采集单元和数据处理单元, 用该系统获取番茄叶片的高光谱图像, 对高光谱图像进行校准, 并从每一幅图像中提取光谱信息。 分别采用了光谱角匹配(SAM)分析方法和光谱红边参数判别分析(DA)方法识别番茄叶片斑潜蝇虫害。 在SAM分析中, 对高光谱数据进行了归一化预处理, 以消除多余信息, 增加样品之间的差异。 比较了以不同番茄叶片样品的反射光谱作为测试光谱时, 虫害识别效果的差异, 当以受到斑潜蝇侵染的番茄叶片的平均反射光谱作为测试光谱时, 虫害识别的正确率较高, 达到96.5%。 在光谱红边参数判别分析中, 从光谱数据中提取了红边位置、 红边振幅、 最小振幅、 红边面积、 红谷位置和红边振幅/最小振幅6组红边信息, 利用判别分析方法建立番茄叶片斑潜蝇虫害的判别模型, 比较了距离判别、 Fisher判别、 Bayes判别分析方法的判别效果, 使用距离判别分析建模的判别正确率最低, 判别正确率为88.0%, 使用Fisher判别分析建模的效果最佳, 判别正确率为96.0%。 研究结果表明, 采用高光谱技术识别番茄叶片斑潜蝇虫害具有可行性。

关键词: 高光谱技术; 番茄; 虫害; SAM; 红边参数; DA
中图分类号:O657.3 文献标志码:A
Tomato Leaf Liriomyza Sativae Blanchard Pest Detection Based on Hyperspectral Technology
LI Cui-ling1,2, JIANG Kai1,2, MA Wei1,2, WANG Xiu1,2,*, MENG Zhi-jun1,2, ZHAO Xue-guan1,2, SONG Jian1,2
1. Beijing Research Center of Intelligent Equipment for Agriculture, Beijing 100097, China
2. National Engineering Research Center for Information Technology in Agriculture, Beijing 100097, China
*Corresponding author
Abstract

Tomato yield and farmers’ economic benefits will decrease when insect pest occurs in the growth of tomato plants. This study used hyperspectral technology combined with chemometrics methods to realize fast identification of tomato leaf LiriomyzaSativae Blanchard pest. A simple hyperspectral imaging system was developed, including a light source unit, and hyperspectral image acquisition unit and a data processing unit, and hyperspectral images of tomato leaves were collected through this system. Hyperspectral images were calibrated and spectral information was extracted from each image. Spectral angle mapping (SAM) analysis method and spectrum red edge parameters discriminant analysis (DA) method were adopted to identify tomato leaf Liriomyza Sativae Blanchard pest respectively. In the SAM analysis, normalization algorithm was utilized to preprocess hyperspectral data so as to eliminate redundant information in hyperspectral data and increase the differences between samples. Discriminant effects of tomato leaf pest were compared when different reflective spectrums of tomato leaf samples were used as test spectrums. It was found that when regarding the average reflectance spectrum of 100 tomato leaves infected by Liriomyzasativae Blanchard pest as the test spectrum, the overall recognition accuracy was higher, reaching to 96.5%. In spectrum red edge parameters discriminant analysis, 6 kinds of red edge information that red edge position, red edge amplitude, minimum amplitude, red edge area, location of minimum chlorophyll absorption, and the ratio of red edge amplitude to minimum amplitude were extracted from tomato leaves’ spectral data. Discriminant analysis method was used to develop discriminant model of tomato leaf LiriomyzaSativae Blanchard pest, discriminant effects of distance discriminant analysis, Fisher discriminant analysis, and Bayes discriminant analysis were compared. Comparison results indicated that Fisher discriminant analysis generated the best discriminant effect. The discriminant accuracy was 96.0% for validation set, while distance discriminant analysis produced the worst discriminant effect, with 88.0% discriminant accuracy. Research results showed that using hyperspectral technology to identify Liriomyza sativae Blanchard pest was feasible.

Keyword: Hyperspectral technology; Tomato; Pest; SAM; Red edge parameter; DA
引 言

农作物病虫害检测已经成为国内外研究的热点, 斑潜蝇(Liriomyzasativae Blanchard)是一种多食性有害昆虫[1] , 该虫的寄主范围广、 繁殖力强、 发育周期短、 是危害蔬菜和菊科等观赏植物、 饲料作物的一种毁灭性害虫。 斑潜蝇虫害发生后, 严重影响蔬菜的产量和品质, 甚至造成某些蔬菜绝收, 给种植户造成很大的经济损失[2]。 在斑潜蝇虫害研究方面, 国内外研究学者主要对斑潜蝇的生长与发育规律、 生物学和生态学特征等方面进行了探索, 但是对其快速、 无损检测技术方面的研究较少。

植物叶片的光谱特征是反映植物生长状态的重要信息, 与叶片的厚度、 颜色、 形态、 水分和叶绿素等有关[3]。 各种环境胁迫如缺氮、 干旱、 病虫害等都会使植物叶片的光谱特征发生变化。 植物病虫害光谱检测技术具有检测速度快、 分析效率高和非破坏等优点。 国内外相关研究[4, 5]表明, 采用光谱技术检测植物病虫害具有很大潜力。 本研究采用高光谱技术识别番茄叶片斑潜蝇虫害, 探究一种番茄叶片斑潜蝇虫害的快速、 无损检测方法。

1 实验部分
1.1 高光谱成像系统

构建的实验用高光谱成像系统主要由光源单元、 高光谱图像采集单元和数据处理单元组成。 光源单元包含2个235 W的卤素灯和2个稳压电源; 高光谱图像采集单元主要包含1个高光谱相机(SOC710 Enhanced, 美国), 其敏感波长范围为400~1 000 nm, 光谱分辨率为2.34 nm, 内置扫描装置, 无旋转光学组件, 扫描速度与积分时间自动匹配。 数据处理单元主要包含1台计算机。 此外, 该系统还包含1个光学支架和1个暗箱, 光学支架用于固定相机和光源, 以及放置样品。 暗箱的作用是隔离外界光线的干扰。

1.2 样品制备

实验样本来自国家农业信息化工程技术研究中心示范基地温室, 通过穴盘育苗方式培育番茄秧苗, 部分秧苗在自然状态下感染斑潜蝇虫害。 从健康番茄植株上采集100片未受斑潜蝇侵染的叶片, 从非健康番茄植株上采集100片受斑潜蝇侵染的叶片, 共计200片叶片作为试验样品, 样品在室温25 ℃保存, 并快速采集其高光谱图像。 图1为10片番茄叶片样品, 其中③, ⑧, ⑨和⑩叶片未受斑潜蝇侵染, ①, ②, ④, ⑤, ⑥和⑦叶片受到斑潜蝇侵染。

图1 番茄叶片样品Fig.1 Tomato leaf samples

1.3 高光谱图像采集及信息提取

使用构建的高光谱成像系统采集每片叶片的高光谱图像, 并对高光谱数据进行校准, 将高光谱图像中光谱数据的像元亮度值(digital number, DN)转化为反射率值, 获得原始反射光谱数据。 利用ENVI软件从叶片的高光谱图像中选取感兴趣区域, 感兴趣区域的平均反射光谱作为该叶片的反射光谱。 200片番茄叶片的反射光谱如图2(a)和(b)所示。 如图2(a)为100片未受斑潜蝇侵染的叶片的反射光谱曲线, 如图2(b)为100片受到斑潜蝇侵染的叶片的反射光谱曲线。

图2 番茄叶片样品的反射光谱曲线
(a): 未受斑潜蝇侵染的100片番茄叶片样品的反射光谱曲线; (b): 受到斑潜蝇侵染的100片番茄叶片样品的反射光谱曲线
Fig.2 Reflectance spectrums of tomato leaf samples
(a): Reflectance spectrums of 100 tomato leaf samples not infected by Liriomyzasativae Blanchard pest; (b): Reflectance spectrums of 100 infected tomato leaf samples

1.4 光谱角匹配

光谱角匹配法(spectral angle mapping, SAM)是根据目标光谱和测试光谱之间的夹角数值大小来判断两条光谱曲线的相似性。 如果两个光谱间的夹角数值越小, 则它们的匹配程度越高[6]。 光谱角的计算公式如式(1)

SA(x, y)=arcosi=1Nxiyii=1Nxi2i=1Nyi2

式(1)中: i是波段序号, i=1, 2, 3, …, N, xy分别表示测量光谱和目标光谱, SA(x, y)是SAM光谱匹配模型, 计算测试光谱和目标光谱的光谱夹角, 光谱夹角越小, 两条光谱的相似程度越高。

1.5 红边参数

红边是由于植被叶绿素在红光波段强烈的吸收与在近红外波段多次散射而形成强反射造成的, 其波长范围一般在680~760 nm, 红边区域包含丰富的植被生长状态信息, 与植被生理生化参数密切相关。 通过计算680~760 nm之间的光谱反射率的一阶微分来计算红边参数值。

首先利用ENVI软件获取叶片感兴趣区域的反射光谱, 再利用Matlab软件对反射光谱数据进行一阶微分处理, 获得一阶微分光谱, 其计算方法如式(2)

ρ'(λi)=[ρ(λi+1)-ρ(λi-1)](λi+1)-(λi+1)(2)

式(2)中, λ i为波段i的波长值; ρ (λ i)为波长λ i处的光谱反射率; ρ '(λ i)为波长λ i处的一阶微分值。

从一阶微分光谱提取红边特征参数, 包括:

红边位置(λ red)是在680~760 nm波长范围内一阶微分光谱最大值所对应的波长。

红边振幅( Dλred)是与红边位置相对应的一阶微分值。

最小振幅( Dλmin)是在680~760 nm 波长范围内的最小一阶微分值。

红边面积(Sred)是在680~760 nm波长范围内一阶微分光谱所包围的面积。

红谷位置(λ min)为在680~760 nm波长范围内一阶微分光谱最小值所对应的波长。

红边振幅与最小振幅的比值为 Dλred/ Dλmin

从番茄叶片的一阶微分光谱中提取红边位置、 红边振幅、 最小振幅、 红边面积、 红谷位置和红边振幅/最小振幅6组红边信息, 基于这6组信息判别番茄叶片斑潜蝇虫害。

2 结果与讨论
2.1 光谱角匹配分析

在进行光谱角匹配分析前, 采用归一化算法来消除高光谱数据中的多余信息, 增加样品之间的差异, 从而提高模型的稳定性。 以未受斑潜蝇侵染的100片番茄叶片的反射光谱的平均值作为测试光谱, 以200片番茄叶片的反射光谱为目标光谱, 计算测试光谱与目标光谱的光谱角, 光谱角的分布如图3所示, “ Group 1” 表示测试光谱与100片未受斑潜蝇侵染的番茄叶片的反射光谱(目标光谱)的光谱角, “ Group 2” 表示测试光谱与100片受到斑潜蝇侵染的番茄叶片的反射光谱(目标光谱)的光谱角, 当以光谱角0.124作为未受斑潜蝇侵染叶片和受斑潜蝇侵染叶片的分界点时, 未受斑潜蝇侵染叶片的判别正确率为99.0%, 受斑潜蝇侵染叶片的判别正确率为85.0%, 总体判别正确率为92.0%。

图3 以未受斑潜蝇侵染的100片番茄叶片的反射光谱的平均值作为测试光谱时的光谱角分布Fig.3 Distribution of spectrum angles in condition of regarding the average reflectance spectrum of 100 not infected tomato leaves as the test spectrum

为了研究不同测试光谱对光谱角匹配分析效果的影响, 以受斑潜蝇侵染的100片番茄叶片的反射光谱的平均值作为测试光谱, 以200个番茄叶片的反射光谱为目标光谱, 计算测试光谱与目标光谱的光谱角, 光谱角的分布如图4所示, “ Group 1” 表示测试光谱与100片未受斑潜蝇侵染的番茄叶片的反射光谱(目标光谱)的光谱角, “ Group 2” 表示测试光谱与100片受到斑潜蝇侵染的番茄叶片的反射光谱(目标光谱)的光谱角, 当以光谱角0.138作为未受斑潜蝇侵染的叶片和受斑潜蝇侵染叶片的分界点时, 未受斑潜蝇侵染叶片的判别正确率为97.0%, 则受斑潜蝇侵染叶片的判别正确率为96.0%, 总体判别正确率为96.5%。

图4 以受到斑潜蝇侵染的100片番茄叶片的反射光谱的平均值作为测试光谱时的光谱角分布
经过上述SAM分析可知, 测试光谱的选择对光谱角匹配分析效果有一定的影响, 当以受到斑潜蝇侵染的番茄叶片的反射光谱的平均值作为测试光谱时, 番茄叶片发生虫害的判别正确率较高, 达到了96.5%。
Fig.4 Distribution of spectral angles in condition of regarding the average reflectance spectrum of 100 infected tomato leaves as the test spectrum

2.2 光谱红边参数判别分析

判别分析(discriminant analysis, DA)是一种重要的统计分析方法, 该方法是根据所属类别已知的样本信息, 总结出分类的规律, 建立分类的判别准则和判别函数, 判别新的未知样本所属的类别。

线性判别分析[7]作为一种便捷、 有效的特征提取与数据分析方法, 它以样本的可分性为出发点寻找一组线性变换, 使样本的类内离散度最小而类间离散度最大, 因而在模式识别领域得到了广泛的应用。 根据判别函数的建立准则, 线性判别分析分为距离判别分析[8]、 Fisher判别分析[9]和Bayes判别分析[10]等。 本研究分别采用了距离判别分析、 Fisher判别分析和Bayes判别分析建立基于红边参数的番茄叶片斑潜蝇虫害的判别模型。

2.2.1 训练集与验证集

将200个番茄叶片样品按照3: 1的比例随机分成训练集和验证集, 即训练集包含150个番茄叶片样品, 其中75片番茄叶片受到斑潜蝇的侵染, 另外75片番茄叶片未受到斑潜蝇的侵染。 验证集包含50个番茄叶片样品, 其中25片番茄叶片受到斑潜蝇的侵染, 另外25片番茄叶片未受到斑潜蝇的侵染。

2.2.2 距离判别分析

在距离判别分析中, 由于马氏距离具有统计意义, 在距离判别分析时马氏距离比欧氏距离应用的更多, 因此, 选取的判别函数为马氏距离。 首先, 根据训练集类别已知的样品光谱数据, 计算出每个类别的几何重心, 即每个类别的均值, 其次, 对验证集所给的被分类样品, 计算其与每个类别几何重心的马氏距离, 最后依据最小距离进行判别, 即取马氏距离最小的那个类别为被分类样品的分类结果。

在本研究中, 番茄叶片样本的两个样品的6维红边参数向量分别为x=(x1, x2, …, x6)T, y=(y1, y2, …, y6)T, 称

d(x, y)=(x-y)Σ-1(x-y)T(3)

为样品xy之间的马氏距离。 其中, Σ 为番茄叶片样本的红边参数矩阵的协方差矩阵, Σ -1Σ 的逆矩阵。

2.2.3 Fisher判别分析

Fisher判别分析是将高维模式样本投影到最佳的鉴别矢量空间, 以实现提取分类信息和降低特征空间维数的效果, 投影后保证模式样本在新的矢量空间有最小的类内距离和最大的类间距离。 在本研究中, 某个番茄叶片样品的6维红边参数向量为x=(x1, x2, …, x6)T, 其投影公式如式(4)

f(x)=i=1Ncixi(4)

式(4)中, f(x)为投影函数, i=1, 2, 3, …, N, N表示维数, xi为一维变量, cixi的投影系数。

2.2.4 Bayes判别分析

Bayes判别分析是一种基于Bayes统计思想的多元统计分析法。 Bayes统计思想是假定已经对所研究的对象有初步的认知, 通常用先验概率分布来描述这种初步认知, 然后抽取一个样本, 用该样本修正初步认知, 即先验概率分布, 获得新的认知, 即后验概率分布, 各种统计推断都由后验概率分布决定。 在本研究中, 某个番茄叶片样品用x表示, 用贝叶斯判别法计算样品x属于每个类别的条件概率, 比较这些条件概率的大小, 将样品x判定为出现条件概率最大的类别。

2.2.5 判别分析结果

将200个番茄叶片样品分为两类, 第一类为未受到斑潜蝇侵染的样品, 编号为“ 1” , 第二类为受到斑潜蝇侵染的样品, 编号为“ 2” 。 距离判别分析、 Fisher判别分析和Bayes判别分析的判别结果如表1所示。 Fisher判别分析的判别效果最佳, 验证集样品的判别正确率达到96.0%, 第“ 1” 类和第“ 2” 类样品分别有1个判别错误; 距离判别分判别效果最差, 验证集样品的判别正确率为88.0%。

表1 验证集番茄叶片样品的判别结果 Table 1 Discriminant results of tomato leaf samples in validation set
3 结 论

采用高光谱技术识别番茄叶片斑潜蝇虫害, 进行了SAM分析和光谱红边参数判别分析。

(1)在光谱角匹配分析中, 探究了以不同样品的光谱数据为测试光谱时, 识别番茄叶片斑潜蝇虫害的效果差异, 得出结论: 以受斑潜蝇侵染的番茄叶片的反射光谱的平均值作为测试光谱时, 番茄叶片斑潜蝇虫害的判别正确率较高, 虫害识别正确率为96.5%。

(2)在光谱红边参数判别分析中, 分别比较了距离判别分析、 Fisher判别分析和Bayes判别分析的判别效果, Fisher判别分析的判别效果最佳, 验证集样品的判别正确率达到96.0%, 距离判别分析的判别效果最差, 验证集样品的判别正确率为88.0%。

(3)研究结果表明, 采用高光谱技术结合化学计量学方法识别番茄叶片斑潜蝇虫害具有可行性。

The authors have declared that no competing interests exist.

参考文献
[1] CHANG Ya-wen, SHEN Yuan, DONG Chang-sheng, et al(常亚文, 沈媛, 董长生, ). Chinese Journal of Applied Entomology(应用昆虫学报), 2016, 53(4): 884. [本文引用:1]
[2] ZHANG Jin-yu, GE Jin, WEI Jia-ning(张金钰, 葛瑨, 魏佳宁). Chinese Journal of Applied Entomology(应用昆虫学报), 2015, 52(1): 184. [本文引用:1]
[3] Lausch A, Salbach C, Schmidt A, et al. Ecological Modelling, 2015, 295(8): 123. [本文引用:1]
[4] Castro A I D, Ehsani R, Ploetz R, et al. Remote Sensing of Environment, 2015, 171(2): 33. [本文引用:1]
[5] Xie Chuanqi, Yang Ce, He Yong. Computers and Electronics in Agriculture, 2017, 135: 154. [本文引用:1]
[6] LIU Wan-jun, YANG Xiu-hong, QU Hai-cheng, et al(刘万军, 杨秀红, 曲海成, ). Journal of Computer Applications(计算机应用), 2015, 35(3): 844. [本文引用:1]
[7] CHEN Hua, ZHAO Xin-min, TAN Qiao-lai, et al(陈华, 赵新民, 谭乔来, ). Chinese Journal of Medical Imaging Technology(中国医学影像技术), 2016, 32(11): 1757. [本文引用:1]
[8] XIANG Shi-yao, XING Hui-min, XU Dong-jing(相诗尧, 邢会敏, 徐东晶). Science of Surveying and Mapping(测绘科学), 2016, (6): 1. [本文引用:1]
[9] TAN Chao, DAI Bo, LIU Hua-rong, et al(谭超, 戴波, 刘华戎, ). Food Science(食品科学), 2016, 37(7): 62. [本文引用:1]
[10] WEN Chang-ping, BAI Yin-yong, ZENG Juan-juan, et al(文畅平, 白银涌, 曾娟娟, ). Chinese Journal of Grassland (中国草地学报), 2016, 38(3): 50. [本文引用:1]