基于分光测色反演哈密瓜叶片叶绿素与含水率研究
李龙杰1, 史勇1,2, 郭俊先1,2,*
1.新疆农业大学机电工程学院, 新疆 乌鲁木齐 830052
2.新疆智能农业装备重点实验室, 新疆 乌鲁木齐 830052
*通讯作者 e-mail: junxianguo@163.com

作者简介: 李龙杰, 1996年生, 新疆农业大学机电工程学院硕士研究生 e-mail: 1018793176@qq.com

摘要

为了快速、 精准地预测哈密瓜叶片含水率和叶绿素含量, 提高对哈密瓜作物精准管理水平, 采用分光测色技术, 选用生长期、 开花期和结果期三种不同生长阶段的哈密瓜叶片作为实验对象, 分别研究9:00—10:00、 14:00—15:00和20:00—21:00三个不同采集时间段的叶片温度、 叶片含水率和叶绿素含量与色彩空间CIELAB特征值的相关性变化。 采用最小二乘法(LS)对不同样本叶片的温度、 含水率和叶绿素含量与颜色特征值存在的变化规律进行数据预处理, 选用拟合度最优的特征值进行回归分析和预测模型验证。 结果表明: ①叶片温度、 叶片含水率和叶绿素含量在不同参数情况下, 都会使叶片存在不同的颜色特征值变化。 ②含水率为84%~93%的叶片, 其温度和叶绿素含量都与叶片含水率呈负相关性。 ③叶绿素含量和叶片含水率与色彩空间CIELAB存在一定的线性相关, 随着叶片含水率的上升, L呈上升趋势, 表现为叶片颜色逐渐变浅呈淡绿色, 随着叶绿素的增加, L呈下降趋势, 表现为叶片颜色逐渐加深呈黑绿色, 所有的样本数据均存在L、 B为正值。 ④通过模型预测与评估, 选用随机森林(RF)、 偏最小二乘法(PLS)、 支持向量机(SVM)和LASSO都能很好地对叶绿素含量进行有效的预测。 在叶绿素预测模型中, RF预测性能最好,Rc2=0.939、 RMSEC=0.868和MAE=0.686,Rp2=0.915、 RMSEP=1.194和MAE=0.942。 ⑤通过模型预测与评估, 选用随机森林(RF)、 偏最小二乘(PLS)、 自适应增强与套路回归(ADABOOST)和多项式回归(POLYNOMIAL)都能很好地对叶片含水率进行有效的预测。 在叶片含水率预测模型中, POLYNOMIAL预测性能最好,Rc2=0.884、 RMSEC=0.005 9和MAE=0.005 2,Rp2=0.920和RMSEP=0.006 2和MAE=0.005 7。 采用分光测色的方法, 能够有效、 快速地测定叶片含水率与叶绿素含量, 有望为无损、 快速和精准地测定叶片含水率与叶绿素含量提供一种可选的可行测定方案。

关键词: 哈密瓜; 叶绿素; 含水率; CIELAB彩色空间; 模型回归
中图分类号:S126 文献标志码:A
Inversion of Chlorophyll and Water Content of Hami Melon Leaves Based on Spectrophotometry on Study
LI Long-jie1, SHI Yong1,2, GUO Jun-xian1,2,*
1. College of Electrical and Mechanical Engineering, Xinjiang Agricultural University, Urumqi 830052, China
2. Xinjiang Key Laboratory of Intelligent Agricultural Equipment, Urumqi 830052, China
*Corresponding author
Abstract

In order to predict the water content and chlorophyll content of cantaloupe leaves quickly and accurately and improve the accurate management level of Cantaloupe crops, the leaves of cantaloupe in three different growth stages, namely the growing stage, the flowering stage, and the fruiting stage, were selected as experimental research objects by using the spectrophotometry technology. The correlation changes of leaf temperature, leaf water content, and chlorophyll content with LAB eigenvalues of color space were studied in three different collection periods: 9:00—10:00, 14:00—15:00, and 20:00—21:00, respectively. The least square method (LS) was used to preprocess the changes in temperature, water content, chlorophyll content, and color eigenvalues of different samples, and the eigenvalues with the best fit were selected for regression analysis and prediction model verification. The results showed that① Leaf temperature, leaf water content, and chlorophyll content had different color eigenvalues under different parameters. ② For leaves with 84%~93% moisture content, leaf temperature, and chlorophyll content were negatively correlated with leaf moisture content. ③ the chlorophyll content and leaf water content and color space LAB, there is a linear correlation. As the leaf water content -rises, L is on the rise, and the color becomes shallow gradually with light green leaves; with the increase of chlorophyll, L has a downward trend, showing the leaf color gradually deepens with black-green, exists in all types of sample data, L B positive. ④ Through model prediction and evaluation, random forest (RF), partial least squares (PLS), support vector machine (SVM), and LASSO can be used to predict chlorophyll content effectively. Among the chlorophyll prediction models, RF had the best prediction performance,Rc2=0.939, RMSEC=0.868 and MAE=0.686,Rp2=0.915, RMSEP=1.194 and MAE=0.942. ⑤ Through model prediction and evaluation, RF, PLS, AdaBoost, and polynomial regression (POLYNOMIAL) can effectivelypredict leaf water contents. In the prediction model of leaf moisture content, the POLYNOMIAL prediction performance is the best,Rc2=0.884, RMSEC=0.005 9 and MAE=0.005 2,Rp2=0.920 and RMSEP=0.006 2 and MAE=0.005 7. The spectrophotometry method can effectively and rapidly determine leaf water and chlorophyll content, which is expected to provide an optional feasible method for nondestructive, rapid, and accurate determination of leaf water and chlorophyll content.

Keyword: Hami melon; Chlorophyll; Water content; LAB; Model regression
引言

水是万物之本, 万物之源, 是哈密瓜生长发育的必要条件, 植物的能量获取主要来源于叶绿素, 叶绿素与水是植物生长发育的重要因素。 哈密瓜作物生长过程中, 如果该两种重要因素缺乏将导致偏离正常的生长状况, 影响哈密瓜的产量与品质。 快速、 精准获取哈密瓜叶片叶绿素与含水率, 对提前预防哈密瓜作物生长中出现的病症、 精准管理和提高产量与品质具有重要研究意义。

目前在采用光谱分析和色彩空间上预测叶片含水率和叶绿素的研究中积累了一定的成果和经验[1, 2, 3, 4]。 高升等研究表明, 采用可见/近红外透射光谱, 通过光谱数据预处理建立PLSR模型, 利用降维方法对光谱进行特征变量提取, 建立含水率的偏最小二乘回归算法和最小二乘支持向量机含量检测模型并对比分析模型的优劣, 得出该方法对无损检测红提含水率具有可行性[5]。 孙旭东等研究表明, 采用近红外光谱, 通过反向偏最小二乘法优选输入向量, 发现最小二乘支持向量机模型预测结果最优, 近红外光谱分析对脐橙叶片含水率无损检测方法具有可行性[6]。 冀荣华等研究表明, 采用反射光谱的敏感波段建立多种叶片叶绿素和含水率预测模型, 发现以神经元网络所建立预测模型效果最好[7]。 张俊逸等研究表明, 通过多种降维算法提取敏感特征值, 发现基于连续投影算法筛选特征波长进行PROSPECT构建的叶绿素含量模型效果最佳[8]。 马春艳等研究表明通过光谱数据与叶绿素实测数据建立相关性, 通过多种机器学习算法能够建立估算精度较高的预测模型[9]。 何桂芳等研究表明, 通过对光谱数据降维选用特征值波段, 采用多种回归算法计算对比得出, 以逐步线性回归的预测模型效果最好[10]。 张慧春等研究表明, 基于YOLOv5目标检测模型识别出植物主枝冠层区域色彩因子, 运用多种模型回归方法进行反演得出最佳回归模型, 可实现植物苗期生长的监测与植物长势的快速评判[11]。 程立真等研究表明, 通过运算RGB通道组合特征参数, 建立苹果叶片叶绿素含量估算模型对其精度进行评价和验证, 可快速估测苹果叶片叶绿素含量[12]

本研究以CM-700d分光测色计作为叶片色彩空间特征值采集设备, 选用托普云农TYS-B B10手持叶绿素仪进行叶绿素和叶片温度的数据采集, 对不同时期、 不同采集时间段的哈密瓜植株开展叶片含水率和叶绿素预测的实验研究。 通过叶片温度、 叶片含水率、 叶绿素和色彩空间特征值存在的特征关系建立多种回归预测模型, 通过对预测模型的评估, 选用性能最佳的预测模型对哈密瓜叶片含水率和叶绿素含量提供快速、 精准的反演预测。 为农业面向精细化、 智能化和准确预防作物病害提供科学依据。

1 实验部分
1.1 叶绿素和叶片温度数据采集

选用不同生长时期和早中晚三个时间段的叶片作为采集对象, 以随机选择无明显病虫害样本的方式, 分别采集叶片温度和叶绿素SPAD值数据。 设备选用托普云农TYS-B B10手持叶绿素营养测定仪进行叶片叶绿素和叶片温度测定。 采集时避开粗大的茎脉, 在同一点采集三次, 取三次的平均值作为采集数据, 测得SPAD和温度数据结果见表1

表1 叶片数据实测值 Table 1 Measured value of blade data
1.2 LAB特征值采集

检测使用Konica Minolta公司生产的CM-700d分光测色计, 测量波长范围400~700 nm, 测量波长间隔10 nm, 反射率测量范围0~175%, 分辨率: 0.01%, 照明光源脉冲氙灯(含UV滤镜)。 实验选用测量/照明口径MAV: ϕ 8 mm/ϕ 11 mm, 如图1处理方法所示, 对测得叶绿素和叶片温度的样本进行LAB色彩空间特征值测量, 测得LAB色彩空间数据结果如表1所示。

图1 叶绿素与含水率预测模型处理流程Fig.1 Processing flow of chlorophyll and water content prediction model

1.3 含水率数据采集

样本重量使用Meilen电子天平MTB500g, 精度为0.01 g。 如图1处理方法所示, 对测得LAB色彩空间的样本进行称重, 此时重量为鲜重FW, 将该叶片放入105 ℃烤箱中杀青处理30 min, 然后在80 ℃条件下将叶片进行烘干处理, 经3次测量发现重量不再发生变化时, 记录该重量为干重DW。 叶片含水率RWC计算公式如式(1)所示, 测得LAB色彩空间数据结果如表1所示。

RWC=FW-DWFW(1)

2 结果与讨论
2.1 叶片温度和SPAD与含水率相关性分析

分别对不同生长时期和早中晚三个时间段的叶片进行数据采集, 采集内容包括叶片温度、 叶绿素含量和叶片含水率, 将采集后的数据进行相关性拟合分析, 如图2(a, b)所示。 研究表明, 叶片SPAD与含水率存在负相关性, 线性拟合相关决定系数为0.568 7, 二阶多项式拟合相关决定系数为0.680 2。 叶片温度与含水率存在负相关性, 线性拟合相关决定系数为0.482 1, 二阶多项式拟合相关决定系数为0.583。

图2 叶片温度和叶绿素与含水率相关性分析
(a): SPAD和含水率; (b): 含水率和叶片温度
Fig.2 Correlation analysis of leaf temperature, chlorophyll and moisture content
(a): SPAD and Moisture content; (b): Moisture content and Blade temperature

2.2 模型数据预处理分析

通过对样本叶片LAB色彩空间的特征值读取, 发现所有样本的数据存在L、 B均为正值, 随着叶片含水率的上升L呈上升趋势, 表现为叶片颜色逐渐变浅, 随着叶片叶绿素的增加L呈下降趋势, 表现为叶片颜色逐渐加深。

由最小二乘法(LS)分别对叶片含水率和叶绿素进行数据预处理, 如图3所示, 含水率和叶绿素与LAB色彩空间三通道存在相关性。 含水率实测值与L和B特征值呈正相关, 与A特征值成负相关, L、 A、 B三通道与含水率相关决定系数分别为0.501、 0.824、 0.629。 比较可知A特征值与叶片含水率相关度最佳, 故选为模型预测的基础参数。 叶绿素实测值与L和B特征值相关性为负相关, 与A特征值呈正相关, L、 A、 B三通道与含水率相关决定系数分别为0.679、 0.821、 0.906。 可知B特征值与叶绿素相关度最好, 故选为模型预测的基础参数。

图3 特征值与实测值相关性分析
(a): 含水率与L通道; (b): 含水率与A通道; (c): 含水率与B通道; (d): SPAD与L通道; (e): SPAD与A通道; (f): SPAD与B通道
Fig.3 Correlation analysis of eigenvalue and measured value
(a): Moisture content and channel L; (b): Moisture content and channel A; (c): Moisture content and channel B; (d): SPAD and channel L; (e): SPAD and channel A; (f): SPAD and channel B

2.3 模型的验证

选用随机森林(RF)、 偏最小二乘法(PLS)、 支持向量机(SVM)和LASSO四种模型框架对叶绿素进行预测分析, 选用RF、 PLS、 ADABOOST和多项式回归(POLYNOMIAL)四种模型框架对含水率进行预测分析。 不同的模型框架处理实测数据所呈现的数据模型可能会达到不同的效果。 为了获得最佳的预测模型, 选用多种不同的模型框架进行对比处理分析, 对数据进行随机划分, 校正集占比7, 预测集占比3。 最后通过决定系数和均方根误差确定效果最好的模型作为最终的预测模型。

2.3.1 叶绿素模型的验证

通过不同的模型处理方法对叶片叶绿素进行对比研究。 如表2所示, RF预测相关决定系数和预测均方根误差分别为 Rp2=0.915和RMSEP=1.194, PLS预测相关决定系数和预测均方根误差分别为 Rp2=0.891和RMSEP=1.355, SVM预测相关决定系数和预测均方根误差分别为 Rp2=0.852和RMSEP=1.579, LASSO预测相关决定系数和预测均方根误差分别为 Rp2=0.891和RMSEP=1.354。 对比发现, RF预测相关决定系数最接近于1, 预测均方根误差最小, 因此通过RF框架对叶绿素预测建模效果最好, 稳定性最佳, 各模型拟合效果如图4(a— d)所示。

表2 叶绿素预测建模效果 Table 2 Modeling effect of chlorophyll prediction

图4 叶片叶绿素含量预测值与实测值比较
(a): 随机森林预测模型; (b): 偏最小二乘法预测模型; (c): 支持向量机预测模型; (d): 套索回归预测模型
Fig.4 Comparison of predicted and measured chlorophyll content in leaves
(a): RF prediction model; (b): PLS prediction model; (c): SVM prediction model; (d): LASSO regression prediction model

2.3.2 含水率模型的验证

通过不同的模型处理方法对叶片含水率进行对比研究。 如表3所示, RF预测相关决定系数和预测均方根误差分别为 Rp2=0.872和RMSEP=0.007 8, PLS预测相关决定系数和预测均方根误差分别为 Rp2=0.823和RMSEP=0.008 9, ADABOOST预测相关决定系数和预测均方根误差分别为 Rp2=0.911和RMSEP=0.006 5, POLYNOMIAL预测相关决定系数和预测均方根误差分别为 Rp2=0.920和RMSEP=0.006 2。 研究对比发现, POLYNOMIAL预测相关决定系数最接近于1, 预测均方根误差最小, 因此通过POLYNOMIAL框架对叶片含水率预测建模效果最好, 稳定性最佳, 各模型拟合效果如图5所示。

表3 含水率预测建模效果 Table 3 Modeling effect of moisture content prediction

图5 叶片含水率预测值与实测值比较
(a): 随机森林预测模型; (b): 偏最小二乘法预测模型; (c): 自适应增强预测模型; (d): 多项式回归预测模型
Fig.5 Comparison of predicted and measured moisture content of leaves
(a): RF prediction model; (b): PLS prediction model; (c): ADABOOST prediction model; (d): POLYNOMIAL regression prediction model

3 结论

以不同生长时期和早中晚三个时间段的叶片为研究对象, 分别获取叶片温度、 叶片含水率、 叶绿素含量和色彩空间LAB特征值的样本数据, 采用LS对数据进行预处理, 筛选出具有相关性的变量组合用于建立预测模型。

(1)叶片温度、 叶片含水率和叶绿素含量在不同参数的情况下, 通过分光测色仪测得的色彩空间LAB特征值都会出现相应的趋势变化。

(2)通过一阶、 二阶多项式对叶片温度和叶绿素与叶片含水率进行线性拟合分析, 发现随着叶片含水率的逐渐减小, 叶绿素和叶片温度以抛物线的形式增加。

(3)叶片色彩空间LAB特征值与叶绿素和含水率之间存在一定的线性相关, 研究表明随着叶片含水率的上升L特征值呈上升趋势, 叶片的现象表现为颜色逐渐变浅呈浅绿色, 随着叶片叶绿素的增加L特征值呈下降趋势, 叶片表现为颜色逐渐加深呈黑绿色, 所有样本的数据存在L、 B特征值均为正值, A特征值为负值。

(4)叶绿素预测模型中, 对多个预测模型进行性能评估, 得出随机森林(RF)回归模型预测性能最好, 校正相关决定系数 Rc2=0.939、 校正集均方根误差RMSEC=0.868和校正集平均绝对误差MAE=0.686, 预测相关决定系数 Rp2=0.915、 预测集均方根误差RMSEP=1.194和预测集平均绝对误差MAE=0.942。

(5)叶片含水率预测模型中, 通过对模型的评估, 判断为多项式(POLYNOMIAL)回归模型预测性能最好, 校正相关决定系数 Rc2=0.884、 校正集均方根误差RMSEC=0.005 9和校正集平均绝对误差MAE=0.005 2, 预测相关决定系数 Rp2=0.920和预测集均方根误差RMSEP=0.006 2和预测集平均绝对误差MAE=0.005 7。

参考文献
[1] WANG Dong, SHEN Kai-cheng, FAN Ye-man, et al(王东, 沈楷程, 范叶满, ). Transactions of the Chinese Society for Agricultural Machinery(农业机械学报), 2022, 53(4): 192. [本文引用:1]
[2] GAN Hai-ming, YUE Xue-jun, HONG Tian-sheng, et al(甘海明, 岳学军, 洪添胜, ). Journal of South China Agricultural University(华南农业大学学报), 2018, 39(3): 102. [本文引用:1]
[3] LI Yong-mei, WANG Hao, ZHAO Yong, et al(李永梅, 王浩, 赵勇, ). Acta Agriculturae Zhejiangensis(浙江农业学报), 2022, 34(4): 781. [本文引用:1]
[4] LI Hong, ZHANG Kai, CHEN Chao, et al(李红, 张凯, 陈超, ). Transactions of the Chinese Society for Agricultural Machinery(农业机械学报), 2021, 52(2): 211. [本文引用:1]
[5] GAO Sheng, WANG Qiao-hua(高升, 王巧华). Chinese Optics(中国光学), 2021, 14(3): 566. [本文引用:1]
[6] SUN Xu-dong, HAO Yong, ZHANG Guang-wei(孙旭东, 郝勇, 张光伟). Journal of Chinese Agricultural Mechanization(中国农机化学报), 2015, 36(2): 150. [本文引用:1]
[7] JI Rong-hua, ZHENG Li-hua, DENG Xiao-lei, et al(冀荣华, 郑立华, 邓小蕾, ). Transactions of the Chinese Society for Agricultural Machinery(农业机械学报), 2014, 45(8): 269. [本文引用:1]
[8] ZHANG Jun-yi, GAO De-hua, SONG Di, et al(张俊逸, 高德华, 宋迪, ). Spectroscopy and Spectral Analysis(光谱学与光谱分析), 2022, 42(5): 1514. [本文引用:1]
[9] MA Chun-yan, WANG Yi-lin, ZHAI Li-ting, et al(马春艳, 王艺琳, 翟丽婷, ). Transactions of the Chinese Society for Agricultural Machinery(农业机械学报), 2022, 53(6): 217. [本文引用:1]
[10] HE Gui-fang, WU Jian, PENG Jian, et al(何桂芳, 吴见, 彭建, ). Journal of Northwest Forestry University(西北林学院学报), 2022, 37(1): 25. [本文引用:1]
[11] ZHANG Hui-chun, ZHANG Meng, BIAN Li-ming, et al(张慧春, 张萌, 边黎明, ). Transactions of the Chinese Society for Agricultural Machinery(农业机械学报): 2022, 53(4): 313. [本文引用:1]
[12] CHENG Li-zhen, ZHU Xi-cun, GAO Lu-lu, et al(程立真, 朱西存, 高璐璐, ). Acta Horticulturae Sinica(园艺学报), 2017, 44(2): 381. [本文引用:1]