基于近红外光谱特征提取的花椰菜灰霉病早期检测
穆炳宇1, 张淑娟1, 李泽珍2, 王凯1, 李紫辉1, 薛建新1,*
1.山西农业大学农业工程学院, 山西 晋中 030801
2.山西农业大学食品科学与工程学院, 山西 晋中 030801
*通讯作者 e-mail: vickyxjx@126.com

作者简介: 穆炳宇, 1997年生, 山西农业大学农业工程学院硕士研究生 e-mail: 13633544838@163.com

摘要

花椰菜在生长过程中容易感染灰霉病而导致产量减少, 现有的分选方法难以在早期检测到感染灰霉病的花椰菜。 应用近红外光谱技术实现花椰菜灰霉病的早期判别检测, 对花椰菜病害防治意义重大。 以接种灰霉菌孢的花椰菜为研究对象, 首先, 采集对照组和处理组花椰菜的近红外光谱曲线并进行去噪处理, 获取4个批次共608个样本(接菌0.5, 1, 2和3 d每日的健康和染病花椰菜各76朵)在500~2 400 nm波段范围内的光谱曲线。 同时测量花椰菜样本的多酚氧化酶(polyphenol oxidase, PPO)、 过氧化物酶(peroxidase, POD)与丙二醛(malondialdehyde, MDA)的活性值, 采用单因素方差分析(analysis of variance, ANOVA)对单一批次的健康和染病花椰菜品质指标进行统计分析。 然后, 采用K-S算法(Kennard-Stone)将单天的样本划分为校正集(114个样本)与预测集(38个样本), 使用竞争性自适应重加权算法(competitive adaptive reweighted sampling, CARS)进行4个批次的花椰菜样本的光谱数据特征波段提取, 并基于偏最小二乘回归(partial least square regression, PLSR)算法建立单一批次判别模型和组合批次判别模型。 结果表明: 在接菌早期, 用肉眼无法实现染病花椰菜样本的识别, 仅在染病第3 d后部分染病样本病害特征明显时可实现判别。 测定对照组和处理组花椰菜品质指标后发现: 染病2 d后, 对照组和染病组样本的所有品质指标均存在显著性差异( p<0.05), 但在第0.5 d时各项指标均无显著性差异, 仅在第1 d时MDA值出现显著性差异, 说明从品质指标上无法判别早期染病花椰菜。 建立单一批次下的PLSR判别模型后表明: 第一批次样本(0.5 d)所建模型的判别准确率达到了94.74%, 预测集均方根误差为0.835, 第二至第四批次(接菌1~3 d)所建判别模型准确率达到100%, 表明PLSR模型可以实现单一批次下早期染病花椰菜样本的检测; PLSR组合判别模型在第0.5 d和第1 d判别准确率分别达到了92.11%与97.37%, 可以判别出大部分的患病花椰菜, 但是PLSR组合批次建模效果低于PLSR单一批次建模。 结果表明, 基于近红外光谱技术, 通过CARS算法提取特征波段结合PLSR模型的建立, 可以在早期检测出感染灰霉病的花椰菜, 为花椰菜灰霉病的早期检测提供参考, 具有一定的实际应用价值。

关键词: 花椰菜; 灰霉病; 早期检测; 近红外光谱; 特征波段
中图分类号:TP391 文献标志码:A
Early Detection of Cauliflower Gray Mold Based on Near-Infrared Spectrum Feature Extraction
MU Bing-yu1, ZHANG Shu-juan1, LI Ze-zhen2, WANG Kai1, LI Zi-hui1, XUE Jian-xin1,*
1. College of Agricultural Engineering, Shanxi Agricultural University, Jinzhong 030801, China
2. College of Food Science and Engineering, Shanxi Agricultural University, Jinzhong 030801, China
*Corresponding author
Abstract

Gray mold easily occurs during cauliflower growth, thereby leading to reduced output. Cauliflower infected with gray mold at an early stage is difficult to detect with existing methods. In this study, near-infrared spectroscopy was used to distinguish and detect cauliflower with gray mold, which is highly significant for the disease control of cauliflower. Taking cauliflower with Botrytis cinema spore inoculation as the research object, this study obtained the near-infrared spectra of cauliflower in control and treatment groups and performed de-noising. The spectra of 608 samples in four batches (76 healthy and infected cauliflowers at 0.5, 1, 2 and 3 d old each) were acquired within the waveband range of 500~2 400 nm. After measuring the activity of polyphenol oxidase, peroxidase and malondialdehyde in the cauliflower samples, and one-way ANOVA was used to statistically analyze the quality indices of a single batch of healthy and infected cauliflowers. The Kennard-Stone algorithm was used to divide each day’s samples into a calibration (114 samples) and a prediction (38 samples)set. Competitive adaptive reweighted sampling (CARS) was then used to extract the feature waveband of the spectroscopic data of the four batches of cauliflower samples, and the discrimination models of single and combination batches were established based on of partial least square regression (PLSR). Results indicated that the naked eye could not identify infected cauliflower samples at the early stage of inoculation and could identify them only 3 d after infection when some infected samples showed evident disease characteristics. The measurement of quality indices of the cauliflower in the control and treatment groups showed significant differences in all quality indices between these groups 2 d after infection ( p<0.05); however no significant differences existed in all quality indices at 0.5 d, and a significant difference in MDA value existed only at 1d. These findings suggested that the quality indices of infected cauliflower cannot be discriminated at an early stage. The PLSR discrimination model of a single batch was established, and it showed the following: the discrimination accuracy of the model established for the first batch (0.5 d) reached 94.74%, the root-mean-square error of the prediction set was 0.835, and the discrimination accuracy of the models established for the second to fourth batch (1~3 d) reached 100%. These findings indicated that the PLSR model could detect infected cauliflower samples under a single batch at an early stage. The discrimination accuracy of the PLSR combination discrimination model reached 92.11% and 97.37% at 0.5 and 1 d, respectively, to discriminate a large proportion of infected cauliflower. However, the effect of PLSR combination-batch modeling was inferior to that of PLSR single-batch modeling. Therefore, using near-infrared spectroscopy, extracting the feature waveband through CARS, and establishing a PLSR model can detect cauliflower infected with gray mold at an early stage, thereby providing a reference for the early detection cauliflower with gray mold and has some practical value.

Keyword: Cauliflower; Gray mold; Early detection; Near-infrared spectroscopy; Feature band
引言

十字花科农作物已成为全球种植最多的作物之一, 其中花椰菜(Brassica oleracea L.botrytis)因其高产量和经济效益脱颖而出, 其需求旺盛的主要原因是存在多种促进健康的生物活性物质, 如芥子油苷, 多酚或维生素C, 为其可食部分增添了巨大的营养价值[1]。 并且已发现花椰菜可有效预防慢性疾病, 例如某些癌症和心血管疾病[2]。 然而, 随着种植面积和产量的不断增加, 花椰菜病害(灰霉病等)发生情况逐渐加重, 使得花椰菜品质受到影响。 花椰菜灰霉病是由灰葡萄孢(Botrytis Cinerea Pers)引起的真菌性病害[3]。 植物感染灰霉病之后, 其组织表面会产生大量灰色霉层, 造成大量减产[4]。 因此实现对花椰菜灰霉病的早期检测非常重要。

近红外光谱技术作为无损检测技术, 检测速度快、 效率高, 在研究植物病害方面有很大的作用[5]。 Anna等[6]使用高光谱成像技术检测出感染灰霉病的草莓, 所建模型的R2达到了0.85。 有研究建立CARS-PCA-SVM模型, 可实现对水稻感染稻瘟病早期和无病斑叶片的检测。 Bin等[7]使用光谱技术鉴别了真菌性病原体, 为农作物疾病的快速诊断和预警提供了技术参考。 He等[8]使用近红外光谱和计算机视觉在线无损检测了受到脱氧性苯酚污染的小麦谷物。 秦立峰等[9]对温室黄瓜早期霜霉病光谱图像田间采集存在的问题, 提出融合病害差异信息的特征波段提取方法, 建立了黄瓜霜霉病早期检测模型。 Shen等[10]使用NIR光谱技术鉴定受到不同浓度曲霉菌株污染的花生, 实现了92.11%的正确分类率。 Sun等[12]使用光谱技术检测了接种灰霉菌的桃子, 在36 h时对测试数据集的分类准确率达到了97.5%。 应用近红外光谱技术对花椰菜灰霉病早期无病斑阶段的检测未见报道。

本工作以健康和感染灰霉病的花椰菜为研究对象, 应用近红外光谱技术, 对花椰菜灰霉病早期分级检测进行研究, 主要对染病但无病斑阶段进行检测。 先从外观和品质指标上对早期染病花椰菜阶段进行判定, 之后使用CARS算法对光谱数据进行特征波段的提取, 构建花椰菜灰霉病的早期PLSR单一判别模型以及组合判别模型, 目的是确定对花椰菜快速、 准确的早期分类检测模型, 为花椰菜灰霉病的早期诊断提供科学依据。

1 实验部分
1.1 样本制备

实验所用花椰菜品种为“ 松花” , 于2020年10月采摘于大田地, 当天运至实验室并对花椰菜进行筛选, 以保证实验前花椰菜样本的初始状态相对一致, 降低个体差异对实验结果的影响[12]。 灰葡萄孢(Botrytis Cinerea Pers)由山西农业大学植物保护研究中心提供, 在马铃薯葡萄糖琼脂(Potato Dextrose Agar)培养基上继代培养后[13], 配置成孢子浓度为1× 106 mL的孢子悬浮液。

将菜花用小刀(0.1%的次氯酸钠溶液消毒)切成大小基本一致, 约为3 cm的花球浸泡在1%的次氯酸钠溶液中2 min, 进行消毒灭菌, 取出后用无菌水清洗三次。 用无菌的接种针在菜花上刺孔, 深度3 mm, 向孔中注入10 μ L孢子菌悬液, 自然晾干, 放入垫有无菌纱布的灭菌密封托盘中, 转入温度为21 ℃, 相对湿度为90%的恒温恒湿培养箱中贮藏。 另有相等数量的花椰菜样本经消毒灭菌后转入温度为21 ℃, 相对湿度为90%的同等环境下贮藏。 分别在接种后0.5, 1, 2和3 d后取出对照和接菌样本各76个, 共608个样本分批次进行近红外光谱和图片信息的采集, 随机选取对照和接种样本各9个用于测定品质指标。

1.2 仪器

采用美国ASD(Analytical Spectral Device)公司的Field Spec 3型光谱仪对花椰菜样本光谱数据进行采集。 光谱数据间隔为1 nm, 光谱范围为350~2 500 nm, 采样方式为漫反射。 在使用前仪器至少预热30 min, 并置于暗箱中进行黑白板校正。

1.3 光谱数据获取与品质指标测量

使用Field Spec 3型光谱仪分别采集对照组花椰菜上表面中心点、 处理组花椰菜接种点位置的光谱数据。 每个点位扫描3次, 并取3次反射光谱平均值作为该样本的光谱数据。 之后每天对照组和处理组各取9个样本进行理化指标的测定。 多酚氧化酶(PPO)测定采用邻苯二酚法, 过氧化物酶(POD)活性测定采用愈创木酚法, 具体操作参考文献[14]; 丙二醛(MDA)测定参照张承等[15]的方法。 为了减少仪器与外界环境等因素对光谱曲线的影响, 去除两端噪声后, 用500~2 400 nm波段的光谱数据进行分析[16]

1.4 光谱数据处理方法

采用K-S算法(Kennard-Stone)划分校正集和预测集。 为了提高建模速度、 缩短建模时间, 采用竞争性自适应加权采样法(competitive adaptive reweighted sampling, CARS)对光谱数据进行特征波长的选择。 采用偏最小二乘回归(partial least squares regression, PLSR)方法建模。 选择决定系数(determination coefficient, R2)和均方根误差(root mean square error, RMSE)作为模型评价的指标。 数据处理软件包括SPSS19.0(Version20.0, Inc., Chicago, IL, USA)、 Matlab 2014 a (The MathWorks, USA)、 The Unscramber X10.1(CAMO ASA, Norway), 利用Origin2019b绘图。

2 结果与讨论
2.1 外观变化分析

花椰菜4个不同贮藏期(0.5, 1, 2和3 d)对照和接菌样本如表1所示。 随着贮藏时间的延长, 花椰菜样本颜色逐渐变暗。 第0.5 d与1 d的对照和处理组花椰菜样本从外观上看并无明显差异, 无法判别是否感染灰霉菌。 而在第2 d, 约有30%的接种花椰菜在接种点周围出现黑斑, 而到了第3 d时, 已进入花椰菜灰霉病高发期, 约有80%的接种花椰菜已出现明显的黑斑, 可以用肉眼观察出花椰菜是否染病。 但是在2 d之前从外观上不能直接观察出花椰菜是否感染灰霉病。

表1 贮藏期花椰菜样本图 Table 1 Sample of cauliflower during storage
2.2 品质指标分析

花椰菜样本在贮藏期间品质指标(PPO, POD, MDA)平均值、 均方根误差以及显著性分析如表2所示。 POD在0.5~1 d一直处于升高的状态, 在1 d到达最高值后开始下降, 处理组的POD上升速率和下降速率均高于对照组, 并在第3 d达到最低。 PPO在贮藏初期呈现上升趋势, 在2 d时达到最高峰后开始下降, 处理组花椰菜在第2 d与3 d时的PPO值远大于对照组。 从0.5 d到3 d, 对照组和处理组的MDA值均在一直上升。

表2 贮藏期花椰菜品质指标的变化 Table2 Changes of cauliflower quality indexes during storage

PPO活性的变化即为组织褐变发生的进程, POD活性的提高则有效抑制灰霉菌的侵染, 切分时的机械操作对细胞造成伤害并提高了酶的活性, 而后期伴随着花椰菜的衰老与抵御病害的失败以及病害的进一步发展, PPO和POD酶的活性逐渐降低。 在整个贮藏期间, MDA值的含量一直在增加, 这是因为细胞膜透性增大, 花椰菜处于不断衰老的进程中。

表2可知, 在0.5 d时, 接种花椰菜和对照花椰菜样本的理化指标并无显著性差异, 测量值差距较小; 而到了第1 d时, 仅有MDA在处理组和对照组之间出现了显著性差异, 无法从第1 d的样本来区分花椰菜是否感染灰霉病; 在第2 d时, POD, PPO和MDA三个指标均出现了显著性差异, 且处理组均值都高于对照组; 第3d时, 对照组的POD均值高于处理组, 而POD和MDA均值低于处理组, 表明接菌的花椰菜样本衰老速度高于对照组, 从第2 d, 品质指标就可以检测出花椰菜是否感染灰霉病, 但是仍无法有效判别第0.5 d和1 d的患病花椰菜。

2.3 花椰菜样本近红外反射光谱特征分析

图1是每个贮藏天数(0.5, 1, 2和3 d), 所有健康和染病“ 松花” 花椰菜样本在500~2 400 nm波段的平均光谱反射曲线。 从图1可知: 随着贮藏期的延长, 对照组和处理组花椰菜样本平均光谱反射率逐渐升高, 光谱反射曲线趋势大致相同, 但不同样本的吸收峰强度不同。 从图中可知, 不同天数的花椰菜光谱图在980, 1 180, 1 260, 1 450, 1 660, 2 250 nm都出现了吸收峰, 其中980和1 180 nm为O— H键的二级倍频峰, 1 450 nm为O— H键的一级倍频峰, 1 660和2 250 nm处的吸收峰则与C— H键和C— O键有关。

图1 花椰菜样本平均反射光谱图Fig.1 Average reflection spectrum of cauliflower sample

2.4 花椰菜灰霉病早期检测模型建立与分析

2.4.1 花椰菜样本集数据划分

将每一天的花椰菜样本(健康76个、 染病76个)光谱信息使用K-S算法按照3:1划分为校正集(114个样本)和预测集(38个样本)。

2.4.2 基于CARS算法的花椰菜样本特征波长选择

CARS算法是效仿达尔文进化理论中“ 适者生存” 的原理提出的变量选择理论[17], 既可以去除无信息变量, 也可以减少共线性变量对模型的影响。 在实际特征波长选择过程中, 保留PLSR模型中回归系数绝对值大的波长变量, 去除绝对值小的变量, 多次筛选后可以获得一系列变量子集, 之后采用交叉验证的方法建模, 获得模型交叉验证均方根误差最小的变量子集, 即为最优波长变量子集。

采用CARS算法对每天的花椰菜样本数据提取特征波长, 由表3可知, 0.5~3 d的4个批次特征波长个数依次为11, 10, 10和9个, 每个贮藏时间内大多数特征波段并不相同, 分析认为随着贮藏时间的延长, 花椰菜内所含酶活性变化, MDA含量上升, 而这些物质内部含有的O— H, C— O和C— H键时刻处在动态变化中。 仅有少数波长重复。 其中0.5和2 d重复的波长为1 874 nm, 0.5和3 d重复的波长为2 354和2 383 nm。

表3 CARS算法提取的特征波长 Table 3 Characteristic wavelength table extracted by CARS algorithm

2.4.3 CARS特征波长PLSR单一批次建模

将4个单一批次特征波段数据为自变量, 以花椰菜的好坏类别为因变量, 建立基于近红外光谱的PLSR判别模型。 目的是验证使用近红外光谱能否实现对早期感染灰霉病花椰菜的判别, 以此建立的PLSR模型预测结果如表4所示。

表4 CARS特征波长PLSR单一批次建模 Table 4 CARS characteristic wavelength PLSR single batch modeling

表4可知, 预测集的 Rp2从0.5 d的0.835上升到3 d的0.977, 说明模型精度在不断升高; RMSEC由0.5 d的0.206下降至0.057, 说明模型稳定性越来越好。 随着花椰菜病害特征逐渐明显, 模型的判别准确率也在不断提高, 预测集的误判个数由0.5 d的2个下降至1 d的0个, 并且第三和第四批次均已达到了100%的判别准确率。 结果表明使用近红外光谱曲线建模可识别出花椰菜是否患有灰霉病, 在接种1 d后就可达到100%的准确率。

2.4.4 CARS特征波长PLSR组合批次建模

将花椰菜样本4个批次(0.5~3 d)通过CARS算法提取的特征波段(共37个)组合起来作为自变量, 以花椰菜的好坏类别为因变量, 进行基于PLSR算法的组合批次建模, 提高模型的泛化能力和检测效率, 并以此来判别单一批次花椰菜是否患病。

表5 CARS特征波长PLSR组合批次建模 Table 5 CARS characteristic wavelength PLSR combined batch modeling

表5可知, 预测集的 Rp2从0.5 d的0.817上升到3 d的0.959, 说明模型精度整体趋势是在升高; RMSEC由0.5 d的0.242下降至0.098, 说明模型稳定性越来越好。 但是0.5 d误判个数达到了3个, 1 d误判个数为1个, 表明组合批次特征波段建模并不能有效判别2 d之前的花椰菜是否患病; 而到了第2 d和3 d时, 判别准确率达到了100%。 在花椰菜外观有严重变化时, CARS特征波段组合批次使用PLSR算法所建模型判别结果较好。

使用0.5 d单一批次特征波段所建模型判别准确率达到了94.74%, 而组合批次特征波段PLSR算法所建模型在0.5 d时判别准确率仅为92.11%, 差距达到2.63%, 1 d单一批次特征波段建模已达100%识别率, 而1 d组合批次特征波段所建模型验证时仍有1个误判; 同样使用组合批次特征波段建立基于PLSR算法的模型预测第2 d和第3 d时, 预测均方根误差低于单一批次特征波段建模, 表明PLSR组合批次模型效果劣于PLSR单一批次模型。

利用可见/近红外光谱技术对花椰菜灰霉病进行早期检测。 通过CARS算法进行特征波段的提取, 既可以提取病害的特征信息, 又可以对冗余数据进行剔除; 通过PLSR建立相应的病害判别模型, 对单一批次的花椰菜样本进行检测; 将CARS单一批次提取的特征波段组合进行总体PLSR建模, 实验结果表明, 所有模型的样本判别准确率全部大于92.11%, 精度较高。 CARS-PLSR单一批次模型可有效判别花椰菜是否感染灰霉病, 对染病仅0.5 d的花椰菜检测精度达到94.74%, 比使用组合批次波段的整体模型高2.63%, 输入变量仅仅有11个; 对染病1 d之后的花椰菜检测精度均达到100%。 组合批次波段的整体建模在染病1 d时判别准确率达到了97.37%, 处于较高水平, 但输入变量达到了37个, 且效果差于单一批次模型, 该模型在染病2d之后对花椰菜检测精度也可达到100%。 因此, 综合评价CARS-PLSR单一批次模型为最优模型, 其各天准确率分别为94.74%, 100%, 100%和100%。

3 结论

基于花椰菜感染灰霉病, 在肉眼无法观察以及品质指标没有显著性差异时, 使用近红外光谱对花椰菜是否患病进行了早期判别检测, 取得较好的效果。 结果表明近红外光谱可有效判别健康与感染灰霉病的花椰菜。 为已经感染灰霉病但是仍处于早期无病斑阶段的花椰菜检测提供了新思路, 为花椰菜灰霉病检测、 早期防治与科学用药提供了参考, 也为开发实时、 便携病害检测仪器提供理论支持。

参考文献
[1] Paula G I, Juan N E, Micaela C. BMC Plant Biol. , 2021, 21: 30. [本文引用:1]
[2] Kapusta-Duch J, Szelᶏg-Sikora A, Sikora J, et al. Sustainability, 2019, 11(15): 4008. [本文引用:1]
[3] Abbey J, Percival D, Abbey L, et al. Biocontrol Science and Technology, 2019, 29(3): 207. [本文引用:1]
[4] ZHANG Zheng-wei, CHEN Xiu, SHI Xiao-yuan, et al(张正炜, 陈秀, 石小媛, ). China Vegetables(中国蔬菜), 2021, 2: 41. [本文引用:1]
[5] WU Bin, ZHOU Shu-bin, WU Xiao-hong, et al(武斌, 周树斌, 武小红, ). Spectroscopy and Spectral Analysis(光谱学与光谱分析), 2021, 41(3): 932. [本文引用:1]
[6] Siedliska A, Baranowski P, Zubik M, et al. Postharvest Biology and Technology, 2018, 139(5): 115. [本文引用:1]
[7] Li B, Zhang D P, Shen Y. Spectrochimica Acta Part A: Molecular and Biomolecular Spectroscopy, 2020, 243(5): 118820. [本文引用:1]
[8] He X M, Zhao T X, Shen F, et al. Biosystems Engineering, 2021, 201(1): 1. [本文引用:1]
[9] QIN Li-feng, ZHANG Xi, ZHANG Xiao-xi(秦立峰, 张熹, 张晓茜). Transactions of The Chinese Society of Agricultural Machinery(农业机械学报), 2020, 51(11): 212. [本文引用:1]
[10] Shen F, Wu Q F, Liu P, et al. Food Control, 2018, 93(11): 1. [本文引用:1]
[11] Sun Y, Gu X Z, Wang Z J, et al. PLOS ONE, 2015, 10(12): e0143400. [本文引用:1]
[12] XUE Jian-xin, ZHANG Shu-juan, SUN Hai-xia, et al(薛建新, 张淑娟, 孙海霞, ). Transactions of The Chinese Society of Agricultural Machinery(农业机械学报), 2013, 44(8): 169. [本文引用:2]
[13] YUAN Zhong-yu, ZHOU Hui-ling, TIAN Rong, et al(袁仲玉, 周会玲, 田蓉, ). Transactions of the Chinese Society of Agricultural Engineering(农业工程学报), 2014, 30(4): 255. [本文引用:1]
[14] ZHOU Xiao-wan, TANG Yong-ping, SHI Ya-li, et al(周晓婉, 唐永萍, 石亚莉, ). Food Science(食品科学), 2016, 37(12): 254. [本文引用:1]
[15] ZHANG Cheng, LI Ming, LONG You-hua, et al(张承, 李明, 龙友华, ). Food Science(食品科学), 2016, 37(22): 274. [本文引用:1]
[16] ZHAO Chuan-yuan, HE Dong-jian, LEE Won Suk(赵川源, 何东健, LEE Won Suk). Transactions of The Chinese Society of Agricultural Machinery(农业机械学报), 2017, 48(5): 356. [本文引用:1]
[17] YU Lie, ZHU Ya-xing, HONG Yong-sheng, et al(于雷, 朱亚星, 洪永胜, ). Transactions of the Chinese Society of Agricultural Engineering(农业工程学报), 2016, 32(22): 138. [本文引用:1]