高光谱成像用于定量判断茶树叶片受冻程度
毛艺霖1, 李赫1, 王玉1, 范凯1, 孙立涛2, 王会3, 宋大鹏3, 申加枝2,*, 丁兆堂1,2,*
1.青岛农业大学茶叶研究所, 山东 青岛 266109
2.山东省农业科学院茶叶研究所, 山东 济南 250100
3.日照市农业科学研究院茶叶研究所, 山东 日照 276800
*通讯作者 e-mail: dzttea@163.com; shenjiazhitea@163.com

作者简介: 毛艺霖,女, 1998年生,青岛农业大学茶叶研究所硕士研究生 e-mail: maoyilintea@163.com

摘要

低温冻害是茶园中最常见的自然灾害之一。 茶树叶片低温胁迫的定量监测对于评估茶园冻害程度和及时采取措施具有重要意义。 茶树低温胁迫的传统检测方法, 主要是通过人工观察和理化指标的测定, 存在精度低、 效率低和主观性强等问题, 严重影响了灾害后期的茶树管理。 该研究提出了一种基于高光谱成像的茶树冻害程度定量判断方法。 首先, 利用高光谱成像设备采集自然环境中茶树叶片在无冻害发生、 冻害初期和冻害后期三个阶段的光谱数据, 提取叶片的平均反射率; 测定相应叶片中的相对电导率(REC)、 叶绿素(SPAD)和丙二醛(MDA)等生理生化指标。 其次, 利用多元散射校正(MSC)、 一阶导数(1-D)和平滑滤波(S-G)算法对采集的原始高光谱数据进行预处理, 并利用无信息变量消除(UVE)和竞争性自适应重加权(SPA)算法筛选预处理后高光谱数据的特征波段。 最后, 利用卷积神经网络(CNN)、 支持向量机(SVM)和偏最小二乘法(PLS)建立REC、 SPAD和MDA含量的定量预测模型。 结果表明: (1)经MSC+1-D+S-G算法预处理的光谱曲线比原始光谱曲线的波峰和波谷更加突出, 提高了光谱的分辨率和灵敏度, 有利于提高后期回归模型的精度; (2)UVE算法筛选的特征波段数量最多, 后期建模效果更优; SPA算法筛选的特征波段数量最少, 更适合用传统的机器学习方法建立回归模型; (3)SPAD、 REC和MDA的最佳预测模型分别为SPAD-UVE-CNN(RP2=0.730, RMSEP=3.923)、 REC-UVE-SVM(RP2=0.802, RMSEP=0.037)和MDA-UVE-CNN(RP2=0.812, RMSEP=0.008)。 利用高光谱成像技术与多种算法相结合, 可以实现对茶树叶片低温胁迫程度的无损、 准确和定量监测, 对快速预测茶园冻害发生和采取必要措施具有重要意义。

关键词: 茶树; 冻害; 高光谱成像; 深度学习
中图分类号:TP391.4 文献标志码:A
Quantitative Judgment of Freezing Injury of Tea Leaves Based on Hyperspectral Imaging
MAO Yi-lin1, LI He1, WANG Yu1, FAN Kai1, SUN Li-tao2, WANG Hui3, SONG Da-peng3, SHEN Jia-zhi2,*, DING Zhao-tang1,2,*
1. Tea Research Institute of Qingdao Agricultural University, Qingdao 266109, China
2. Tea Research Institute of Shandong Academy of Agricultural Sciences, Jinan 250100, China
3. Tea Research Institute of Rizhao Academy of Agricultural Sciences, Rizhao 276800, China
*Corresponding authors
Abstract

Low-temperature freezing injury is one of the most serious natural disasters in tea plantations. Quantitatively detecting tea leaves under low-temperature stress is of great significance for evaluating the degree of freezing injury in tea plantations and taking timely measures. The traditional detection of tea plants under low-temperature stress is mainly through observing gardeners and determining physicochemical parameters. However, this method has some problems, such as low accuracy, low efficiency and strong subjectivity, which seriously affects the management of tea plants in the later stage of disasters. A method for quantitatively judging the freezing degree of tea plants based on hyperspectral imaging was proposed. First, the hyperspectral imaging equipment was used to collect spectral data on tea leaves in the early and later stages of the non-freezing periods. Moreover,the average reflectance of tea leaves was extracted. The physicochemical parameters such as relative electrical conductivity (REC), chlorophyll (SPAD) and malondialdehyde (MDA) in the corresponding leaves were determined. Secondly, the collected original hyperspectral data were preprocessed by using multivariate scattering correction (MSC), first derivative (1-D) and Savitzky-Golay (S-G) algorithms, and the characteristic bands of the preprocessed hyperspectral data were screened by using the uninformative variable elimination (UVE) and successive projections algorithm (SPA) algorithms. Finally, the quantitative prediction models of SPAD, REC and MDA content were established by using a convolutional neural network (CNN), support vector machine (SVM) and partial least squares (PLS).The results showed that: (1) The spectral curve preprocessed by the MSC+1-D+S-G algorithm had more prominent peaks and troughs than the original spectral curve, which improved the resolution and sensitivity of the spectrum and helped to improve the accuracy of the regression model established later. (2) The number of feature bands screened by the UVE algorithm was the largest, and the later modeling effect was good. The number of feature bands screened by the SPA algorithm was the least, and it was more suitable for building regression models with traditional machine learning methods. (3) The best prediction models of SPAD, REC and MDA were SPAD-UVE-CNN (RP2=0.730, RMSEP=3.923), REC-UVE-SVM (RP2=0.802, RMSEP=0.037) and MDA-UVE-CNN (RP2=0.812, RMSEP=0.008). In this study, the combination of hyperspectral imaging technology and a variety of algorithms can non-destructively, accurately and quantitatively monitor the degree of low temperature stress in tea leaves, which is of great significance for quickly predicting the occurrence of freezing damage in tea plantations and taking necessary measures.

Keyword: Tea plant; Freezing injury; Hyperspectral imaging; Deep learning
引言

茶树(Camellia sinensis (L.) O. Kuntze.)是重要的经济作物, 栽培历史悠久, 分布广泛[1]。 茶树的起源中心位于气候温暖湿润的中国西南部[2], 最适宜生长温度为20~25 ℃。 低温已经成为影响茶树越冬和春茶生长的重要环境因素之一, 严重影响茶叶生产的经济效益。 因此, 如何快速预测冻害的发生并采取必要措施, 是茶叶生产中减轻冻害影响的重要问题。

然而, 传统的低温胁迫检测主要是通过茶树生理生化指标的测定和灾后实地表观的调查[3], 存在耗时费力、 准确性低和预防滞后等问题。 因此, 迫切需要提出一种无损、 快速和准确的低温诱导成分监测方法。

高光谱成像(HSI)是一种新兴的光学技术, 已成为取代传统破坏性取样和实验室测试的经济型方法。 目前, 高光谱技术已经应用于检测小麦[4]、 甜菜[5]等作物的内含成分。 此外, 该技术也应用于茶叶的理化成分分析。 例如, Mao等利用高光谱成像技术监测红茶加工过程中茶多酚、 游离氨基酸和咖啡碱的含量, 从而定量判断萎凋和发酵的程度[6]; Chen等利用高光谱监测茶树叶片中干旱诱导成分, 从而快速评价茶树的干旱程度[7]。 这些研究表明了高光谱成像技术在估算茶树内含成分方面的潜力。 然而, 基于高光谱成像监测茶树低温诱导成分和冻害状况的研究仍然缺乏。

在高光谱数据的实际应用中, 通常将其与波段选择算法和机器学习算法相结合, 以提高模型的运算速度和鲁棒性。 高光谱图像中存在着与研究目标无关的冗余信息, 因此确定哪些信息对研究目标贡献更大尤为重要[8]。 因此, 许多研究人员将无信息变量消除(UVE)和竞争性自适应重加权(SPA)等波段选择方法应用于光谱数据, 以降低维度并去除冗余光谱[9]。 目前, 机器学习方法已经广泛应用于将高通量数据与作物性状相关联。 然而, 与传统的机器学习方法相比, 深度学习方法在分类和回归问题上具有更好的效果[10]。 例如, Li等提出了一种基于Mask R-CNN、 小波变换和四通道残差网络(F-RNet)的茶树叶病虫害识别框架, 结果表明F-RNet模型的精度要优于支持向量机(SVM)模型[11]。 Liu等利用深度神经网络(DNN)、 偏最小二乘法(PLS)和SVM网络建立了玉米叶面积预测模型, 结果表明DNN模型的精度优于其他传统的机器学习方法[10]。 目前, 深度学习模型在茶树低温胁迫表型方面的预测结果尚不清楚。

基于上述分析, 提出了一种基于高光谱成像定量判断茶树叶片受冻程度的方法。 首先, 利用高光谱成像设备采集不同冻害程度茶树叶片的光谱数据, 利用多元散射校正(MSC)、 一阶导数(1-D)和平滑滤波(S-G)算法对高光谱数据进行预处理, 通过UVE和SPA算法对预处理后光谱数据进行特征波段的筛选。 然后, 测定叶片中的相对电导率(REC)、 叶绿素(SPAD)和丙二醛(MDA)含量。 最后, 利用卷积神经网络(CNN)的深度学习方法、 SVM和PLS两种机器学习方法建立茶树叶片理化参数的预测模型。

1 实验部分
1.1 试验设计

试验地点位于中国山东省日照市茶叶研究所(北纬35°40', 东经119°33', 海拔23 m)。 试验茶园分为40个小区(1 m×3 m), 每个小区取10片成熟叶片。 根据园内气象站的测量, 该地块2021年11月至2022年2月的空气温度(地上2 m处)和土壤温度(地下0.2 m处)变化如图1所示。 分别于2021年12月[无冻害发生期(FIN)]、 2022年1月[冻害发生初期(FIE)]和2022年2月[冻害发生后期(FIL)]采集样品。 共采集120个样本。

图1 试验期间研究区域的气温和地温变化Fig.1 The changes of air and soil temperature during the experiment

1.2 数据采集

1.2.1 高光谱数据采集

高光谱数据的采集过程如图2所示。 高光谱成像采集系统包括1台成像光谱相机(Gaia field pro-v10, 无锡双利合谱科技有限公司)、 4台对称分布的卤素灯线光源(Hsia-ls-t-200w, 中国)、 计算机和其他部件。 采集系统的外部由黑色暗箱封闭。 采集的高光谱图像的空间分辨率为960×1 101(空间×光谱), 光谱通道数为360, 光谱范围为391~1 010 nm。 为了减少暗电流噪声和外部环境的影响, 采集的光谱数据需要进行黑白校正, 如式(1)。

R=O-BW-B(1)

式(1)中, R是校正图像, O是原始图像, B是通过用反射率约为0%的镜头盖覆盖而获得的黑色参考图像, W是使用反射率约为100%的纯白色标准白板获得的白色参考图像。

图2 高光谱数据的采集过程Fig.2 The acquisition process of hyperspectral data

1.2.2 理化指标的测定

测定了叶片的三个生理生化指标: SPAD、 REC和MDA。 其中, 叶片SPAD值是由便携式叶绿素仪(SPAD-502, 日本)测定。 叶片REC是由电导率仪(DDSJ-308A, 中国)测定, 如式(2)。 叶片MDA含量是根据苏州格锐思生物科技有限公司的试剂盒测定, 如式(3)。 MDA含量试剂盒的方法为微板法, 产品编号为G0109W。

REC=L1L2×100%(2)

MDA(nmol·g)-1=32.3×A532-A600W(3)

式(2)中, L1为叶片煮沸前外渗液的电导值, L2为叶片煮沸后外渗液的电导值。 式(3)中, A532A600分别是样液在532和600 nm处读取的吸光光度值, W是样本质量。

1.3 光谱数据的标准化和特征提取

在Spec View(Dualix Spectral Imaging, 中国)软件中打开黑白校正后的高光谱图像, 并使用镜头、 反射率校准等工具进一步校正图像, 以获得标准化的高光谱图像。 在ENVI5.3(Research System Inc, 美国)软件中打开标准化后的高光谱图像, 将整个茶树叶片区域定义为感兴趣区域(ROI), 并提取所有样本的ROI。 然后计算每个样本ROI的平均反射率。

1.4 数据分析

1.4.1 光谱数据的预处理

由于高光谱设备和环境因素的影响, 茶树叶片光谱受散射效应和噪声的影响, 削弱了茶叶内部理化指标的光谱信号, 影响回归模型的精度。 因此, 我们利用MSC、 S-G和1-D对高光谱数据进行预处理[12]

1.4.2 特征波段的筛选

高光谱数据虽然有助于我们更加细致的对物品分类和识别, 但是随着波段的增多, 必然会导致信息的冗余和数据处理的复杂性。 因此, 我们利用UVE和SPA算法来选择全波段光谱数据中的代表性波段作为“特征波段”[13]

1.4.3 模型的建立与评价

为找到茶树冻害评估的最优预测模型, 我们利用PLS、 SVM[14]和CNN[15]建立了茶树叶片光谱数据与其理化参数之间的回归模型, 并比较了模型的效果。

为进一步保证算法的准确性, 采用十折交叉验证, 即将数据集分成10份, 轮流将其中9份作为训练数据, 1份作为测试数据, 重复三次, 取结果的平均值。 为了更精确的评价回归模型的性能, 我们采用决定系数(R2)和均方根误差(RMSE)来评估模型的性能。 R2越大, RMSE越小, 表明模型的性能越好。 R2和RMSE的公式如式(4)和式(5)

R2=1-i=1n(ŷi-yi)2i=1n(yi-y¯)2(4)

RMSE=i=1n(ŷi-yi)2n(5)

其中, n为对应数据集中的样本个数,ŷiyi分别为茶叶样本的预测值和测量值,y¯为样本的平均实测值。

2 结果与讨论
2.1 理化指标的分析

SPAD、 REC和MDA的含量可以作为反映茶树冻害状况的良好指标。 它们的测定结果如图3所示。 结果表明, 随着冻害的发生, SPAD值逐渐降低, 而REC和MDA趋于增加。 有趣的是, 在FIN至FIE时期, 每个指标变化相对缓慢, 但在FIL时期变化显著(p<0.05)。 这可能是因为茶树在低温伤害初期具有抵御逆境的自我保护功能[13]。 然而, 当低温胁迫超过茶树的抵御能力时, 叶绿素会大幅度降解、 电解液泄漏率和渗透调节物质会显著增加, 导致茶叶受到低温伤害。 因此, SPAD、 REC和MDA含量的变化可以用来量化茶树冻害状况。 即SPAD值越低, REC和MDA越高, 则表明茶树冻害越严重。

图3 三个时期的理化指标数据分布
(a): SPAD值; (b): REC; (c): MDA含量
Fig.3 Data distribution of physicochemical parameters in the three periods
(a): SPAD value; (b): REC; (c): MDA content

2.2 光谱数据的预处理

为了去除原始光谱数据的基线漂移、 噪声等信息, 建立稳定、 可靠的定量分析模型, 我们结合S-G、 MSC和1-D对光谱数据进行预处理。 原始平均反射率光谱图和预处理后光谱曲线如图4所示。 预处理后, 可以清晰地观察到光谱的吸收峰和反射谷更加突出, 提高了光谱的灵敏度。

图4 原始光谱与预处理后的光谱Fig.4 Original and preprocessed spectra

2.3 特征波段的选择和分析

为了消除无关波段对模型精度的影响, 我们使用UVE和SPA算法选择特征波段, 如表1和图5所示。 结果表明, 在SPAD的筛选算法中, UVE算法筛选出的特征波段最多, 为137; SPA算法筛选的特征波段最少, 为12。 在REC的筛选算法中, UVE算法筛选的特征波段最多, 为65; SPA算法筛选的特征波段最少, 为12。 在MDA的筛选算法中, UVE算法筛选的特征波段最多, 为152; SPA算法筛选的特征波段最少, 为11。

表1 特征波段筛选的结果 Table 1 Results of feature band screening

图5 UVE和SPA算法筛选的特征波段
(a): SPAD-UVE; (b): REC-UVE; (c): MDA-UVE; (d): SPAD-SPA; (e): REC-SPA; (f): MDA-SPA
Fig.5 Feature bands screened by UVE and SPA algorithms
(a): SPAD-UVE; (b): REC-UVE; (c): MDA-UVE; (d): SPAD-SPA; (e): REC-SPA; (f): MDA-SPA

2.4 不同模型的比较分析

我们通过模型的R2和RMSE衡量预测模型的性能(表2和图6), 筛选最佳模型。 结果表明, 在SPAD的预测模型中, UVE-CNN模型的精度最高(RP2=0.730, RMSEP=3.923), 而SPA-CNN的精度最低(RP2=0.544, RMSEP=6.782); 在REC的预测模型中, UVE-SVM模型的精度最高(RP2=0.802, RMSEP=0.037), SPA-CNN模型的精度最低(RP2=0.745, RMSEP=0.044); 在MDA的预测模型中, UVE-CNN模型的精度最高(RP2=0.812, RMSEP=0.008), SPA-CNN模型的精度最低(RP2=0.754, RMSEP=0.125)。 类似的, 基于高光谱的CNN模型在玉米幼苗的冷害诊断中也取得了较好的效果[16]

表2 不同模型的评价结果 Table 2 Evaluations of different models

图6 实际值和预测值的散点图
(a): SPAD-UVE-CNN; (b): REC-UVE-SVM; (c): MDA-UVE-CNN
Fig.6 Scatter plots of real and predicted values
(a): SPAD-UVE-CNN; (b): REC-UVE-SVM; (c): MDA-UVE-CNN

总的来说, CNN算法和UVE算法相结合的模型具有较高的精度, 而与SPA算法相结合的模型精度最低。 这可能是因为深度学习可以直接从数据中获取高级特征, 其性能将随着数据规模的增加而不断增长[17]。 因而包含更多信息的UVE-CNN模型的预测精度更高。 SPA算法筛选到的信息量较少, 并且可能缺少一些关键信息, 导致模型精度降低。 另一方面, 深度学习非常适合大量的数据集, 本工作只有120个样本, 这在一定程度上限制了深度学习的实际应用。

3 结论

提出一种基于高光谱成像茶树受冻程度定量判断的方法。 首先, 采集冻害未发生、 初期和后期的茶树叶片样本, 利用高光谱成像获取叶片的光谱数据, 并测定相应叶片的SPAD值、 REC和MDA含量。 其次, 利用MSC、 1-D和S-G算法对采集的原始高光谱数据进行预处理, 并通过UVE和SPA算法对预处理后高光谱数据进行特征波段的筛选。 最后, 利用CNN、 SVM和 PLS算法建立茶树叶片SPAD、 REC和MDA含量的预测模型。 结果表明: (1)MSC+1-D+S-G算法预处理后的光谱曲线比原始光谱曲线波峰和波谷更加突出, 提高了光谱的分辨率和灵敏度, 有利于提高后期建立回归模型的精度; (2)UVE算法筛选的特征波段数量最多, 后期建模效果更优, 而SPA算法筛选的特征波段数量最少, 更适合与传统机器学习的方法建立回归模型; (3)UVE-CNN模型在预测叶片SPAD值(RP2=0.730, RMSEP=3.923)和MDA含量(RP2=0.812, RMSEP=0.008)方面具有最高的精度, UVE-SVM模型在预测叶片REC(RP2=0.802, RMSEP=0.037)方面具有最高的精度。 高光谱成像技术和多种算法相结合建立的模型具有准确的预测结果, 可用于测定SPAD、 REC和MDA含量。 本研究为茶树叶片低温胁迫程度的快速、 准确和定量地监测奠定了基础, 对快速预测茶园冻害发生并采取必要措施具有重要意义。

参考文献
[1] Li Shiyu, Wu Xu, Xue Hui, et al. Agriculture Ecosystems and Environmental, 2011, 141(3): 390. [本文引用:1]
[2] Zhao Zhifei, Song Qinfei, Bai Dingchen, et al. BMC Plant Biology, 2022, 22: 55. [本文引用:1]
[3] Wang Ying, Li Yan, Wang Jihong, et al. DNA and Cell Biology, 2021, 40(7): 906. [本文引用:1]
[4] Duan Dand an, Zhao Chunjiang, Li Zhenhai, et al. Journal of Integrative Agriculture, 2019, 18(7): 1562. [本文引用:1]
[5] Pan Leiqing, Lu Renfu, Zhu Qibing, et al. Food and Bioprocess Technology, 2016, 9(7): 1177. [本文引用:1]
[6] Mao Yilin, Li He, Wang Yu, et al. Foods, 2022, 11(16): 2537. [本文引用:1]
[7] Chen Sizhou, Gao Yuan, Fan Kai, et al. Frontiers in Plant Science, 2021, 12: 695102. [本文引用:1]
[8] Su Zhenzhu, Zhang Chu, Yan Tianying, et al. Frontiers in Plant Science, 2021, 12: 736334. [本文引用:1]
[9] Liu Yunhong, Wang Qingqing, Gao Xiuwei, et al. Journal of Food Process Engineering, 2019, 42(6): e13224. [本文引用:1]
[10] Liu Shuaibing, Jin Xiuliang, Nie Chenwei, et al. Plant Physiology, 2021, 187(3): 1551. [本文引用:2]
[11] Li He, Shi Hongtao, Du Anghong, et al. Frontiers in Plant Science, 2022, 13: 922797. [本文引用:1]
[12] REN Dong, SHEN Jun, REN Shun, et al(任东, 沈俊, 任顺, ). Spectroscopy and Spectral Analysis(光谱学与光谱分析), 2018, 38(12): 3934. [本文引用:1]
[13] Li Zongpeng, Wang Jian, Xiong Yating, et al. Vibrational Spectroscopy, 2016, 84: 24. [本文引用:2]
[14] Li He, Wang Yu, Fan Kai, et al. Frontiers in Plant Science, 2022, 13: 898962. [本文引用:1]
[15] LI Yan-dong, HAO Zong-bo, LEI Hang(李彦东, 郝宗波, 雷航). Journal of Computer Applications(计算机应用), 2016, 36(9): 2508. [本文引用:1]
[16] Yang Wei, Yang Ce, Hao Ziyuan, et al. IEEE Access, 2019, 7: 118239. [本文引用:1]
[17] Hsieh T-H, Kiang J-F. Sensors, 2020, 20(6): 1734. [本文引用:1]