基于高光谱数据研究应用近红外相机加装滤光片实现玉米叶片水分测量的关键参数
李朋成1,2, 刘含1,2, 赵龙莲1,2, 李军会1,2,*
1.中国农业大学信息与电气工程学院, 北京 100083
2.中国农业大学, 教育部现代精细农业系统集成研究重点实验, 北京 100083
*通讯作者 e-mail: caunir@cau.edu.cn

作者简介: 李朋成, 1995年生, 中国农业大学信息与电气工程学院硕士研究生 e-mail: 673021803@qq.com

摘要

实现玉米等活体作物叶片不同区域以及近地冠层的水分含量检测, 可为研究作物生长中的水分胁迫响应机制, 以及旱情监测、 精准灌溉等提供有效技术手段。 大体积、 大重量、 低光通量的高光谱仪难以在田间实现活体检测, 将小体积、 小重量、 高光通量近红外相机加装滤光片使其具有波长分辨能力, 有望实现田间活体叶片水分含量成像检测。 基于玉米叶片的近红外高光谱数据, 对实现水分测量的特征波长位置及个数, 以及特征波长带宽和偏移限度等关键参数进行研究; 其中, 不同带宽的仿真数据依据滤光片透光分布函数得到; 固定带宽条件下的中心波长偏移仿真数据依据插值方法得到。 研究结果表明: 特征波长分别为1 150和1 400 nm, 带宽小于100 nm时可满足要求, 能够找到符合参数条件的滤光片产品; 在带宽为25 nm下所建水分含量模型, 其建模集的决定系数( R2)和均方根误差(RMSE)分别达到0.968, 1.245%, 预测集分别达到0.960, 1.298%, 可实现玉米叶片水分的准确检测。 为推测加装滤光片所建模型受环境温度的影响, 应用固定中心波长下的模型预测不同偏移量的仿真数据, 当偏移量为0.05 nm时, 模型预测误差为不漂移条件下3%左右, 可忽略, 由干涉滤光片中心波长漂移与温度的关系, 相当于环境温度在50 ℃的范围对检测结果影响不大。 该研究对近红外相机加装滤光片形成多光谱成像检测装置提供了重要技术参数支撑和环境工作范围建议, 装置的搭建工作已开始, 装置的实现可为现代农业作物生理、 生产研究提供新型、 有效手段。

关键词: 近红外高光谱; 近红外相机; 滤光片; 活体叶片; 含水量
中图分类号:O657.3 文献标志码:A
Key Parameters for Maize Leaf Moisture Measurement Using NIR Camera With Filters Based on Hyperspectral Data
LI Peng-cheng1,2, LIU Han1,2, ZHAO Long-lian1,2, LI Jun-hui1,2,*
1. College of Information and Electrical Engineering, China Agricultural University, Beijing 100083, China
2. Key Laboratory of Modern Precision Agriculture System Integration Research, Ministry of Education, China Agricultural University, Beijing 100083, China
*Corresponding author
Abstract

To provide effective technical means for the study of the crop growth in water stress response mechanism, drought monitoring, and precision irrigation, moisture content detection in different regions of maize live crop leaves and near the canopy is achieved.The large volume, large weight, low luminous flux hyperspectrometer is difficult to achieve live detection in the field. The small volume, small weight, high luminous flux NIR camera with filters to make it wavelength-resolved is expected to achieve live leaf moisture content imaging detection in the field. Based on the near-infrared hyperspectral data of live maize leaves, this study is to investigate the key parameters, including the characteristic wavelength position and number, bandwidth and offset limit. Among them, the simulation data of different bandwidths are based on the filter light transmission distribution function; the simulation data of the center wavelength shift under fixed bandwidths are based on the interpolation method. The research results showed that the feature wavelengths are 1 150 and 1 400 nm respectively, and the bandwidth is less than 100 nm, which can meet the requirements and find the filter products that meet the parameter conditions. When the bandwidth was 25 nm, the model set’s determination coefficient ( R2) and root mean square error (RMSE) were 0.968 and 1.245%, respectively, and the prediction set was 0.960 and 1.298%, respectively. To infer that the model built with the filters is affected by the ambient temperature, the model within a fixed center wavelength is used to predict the simulation data of different offsets. When the drift was 0.05 nm, the model prediction errorunder non-drift conditions was about 3%, which could be neglected. The relationship between the center wavelength drift of the filter and the temperature is equivalent to that the ambient temperature in the range of 50 ℃ has little effect on the detection results. Thisresearch provides important technical parameter support and working range for the NIR camera with filters to form a multispectral imaging system detection device. The device’s construction has been started, and the realization of the device can provide new and effective means for modern agricultural crop physiology and production research.

Keyword: NIR hyperspectroscopy; NIR camera; Optical filter; Live leaf; Moisture content
引言

植物叶片是光合作用的重要器官, 叶片含水量的变化会影响到叶绿素活体的改变, 水分亏缺会直接影响作物的生长[1]。 实现活体作物叶片不同区域以及近地冠层的水分含量检测, 可为研究作物生长中的水分胁迫响应机制, 以及旱情监测、 精准灌溉等提供有效技术手段[2]。 当前, 植物叶片水分多采用烘干法等化学测量方法, 这些方法费时费力且不可重复, 而光谱技术具有精确、 无损、 快速等特点[3]。 近红外高光谱成像技术是新一代光电检测技术, 同时结合了近红外和高光谱成像的优点, 既包含了样品的丰富化学特征信息, 又可得到像素级图谱信息[4], 但仪器具有大体积、 大重量、 低光通量的特性, 需要外部光源, 难以在田间实现活体叶片检测。

目前, 近红外相机具有小体积、 小重量, 可调节的光圈和大口径的镜头使得不需要辅助光源也能实现在线测量[5]。 由于近红外相机不具有波长分辨能力, 一般多应用于影像分析[6], 在近红外相机镜头前加装不同中心波长的带通滤光片, 使选择的波段与待测物质成分具有强相关性, 便可设计出有波长分辨能力的多光谱仪器[7, 8]; 如高建树[9]等基于水和冰在近红外光谱下的不同反射率, 选择1 160和1 260 nm两个波段的滤光片定量识别机翼积冰厚度; Ishii[10]等观测脂肪对近红外光的吸收强度, 发现在1 200 nm波段量化动脉粥样硬化的潜力, 开发出血管的光谱成像系统; 在植物叶片水分、 氮素等成分检测方面的研究鲜有文献报道。

本研究基于活体玉米叶片的近红外高光谱数据, 依据滤光片透光分布函数得到不同带宽的仿真数据, 应用插值方法得到固定带宽下的中心波长偏移仿真数据, 对近红外相机加装滤光片实现活体玉米叶片水分测量的关键参数进行研究, 为多光谱成像系统检测装置提供技术参数支撑和环境工作范围建议。 具体研究内容包括: (1)特征波长位置及个数筛选; (2)不同带宽数据对建模结果的影响; (3)中心波长偏移对模型预测性能的影响。

1 实验部分
1.1 仪器

Gaia Sorter近红外高光谱仪器(四川双利合谱科技有限公司)。 其系统配置为: 4个溴钨灯组成的均匀光源; 56 mm定焦近红外相机镜头; N17E光谱仪, 其光谱范围为900~1 700 nm; AVT(320× 256)探测头; 计算机箱等。 其CCD相机工作电压: DC12V; 采集软件: Spec View(SpecView Ltd., Uckfield, UK)。 采集模式为线扫描, 高光谱仪器工作机制: 实验样品放置在电子控制移动平台上, 通过推扫法获得待测样品的高光谱立方体信息。 电子天平, 精度0.000 1 g。 电热恒温干燥箱, 精度0.1 ℃。

1.2 样品

实验样品为不同生育期(苗期、 拔节期、 抽穗期、 灌浆期、 成熟期)的鲜活玉米叶片共60个, 采集于中国农业大学上庄实验站。 运行SpecVIEW软件, 系统预热30 min后进行聚焦等一系列操作, 最终确定电动平台移动速度为0.54 cm· s-1, 曝光时间为0.09 s。 采集时将样品放置在推扫式传送带上, 每次放置一个叶片, 共采集得到60幅原始高光谱图像。

采用烘干法测量样品含水量。 将样品扫描后测其鲜重, 然后在105 ℃恒温箱中烘干4 h。 为避免过热快速吸收水蒸气, 造成测量精度的误差, 干燥冷却至室温平衡3 h后测量干重。 鲜活玉米叶片含水量在60%~90%之间。

1.3 方法

1.3.1 高光谱数据校正与预处理

为消除CCD相机的暗电流以及不同波长下光源强度分布不均匀造成的噪声干扰, 对采集到的原始高光谱图像进行校正。 相机镜头完全被相机镜头盖盖住采集的图像为暗背景数据, 高光谱仪的相机对准标准白板采集的图像为标准白板数据。 校正公式如(1)所示

Ai=-lgS-BW-B(1)

式(1)中, Ai为校正后的光谱吸光度数据; B为暗背景数据, 理论0%反射率; W为标准白板数据: 理论99%反射率。

使用ENVI5.1采集不同叶肉的ROI(region of interest)并计算求得近红外高光谱样品数(60)× 波长数(256)平均吸光度的光谱数据矩阵。

为消除光谱的基线漂移、 噪声、 样本大小以及环境因素引起的谱线漂移, 常常在特征分析前采用预处理来滤除干扰信号[11]。 采用标准正态变换(standard normal variate, SNV)对高光谱数据矩阵进行预处理, SNV使用平均值和标准偏差作为校正参数, 可在很大程度上消除样品表面散射影响。

1.3.2 特征波长筛选

选择出与水分信息相关性高且个数少的特征波长, 是应用近红外相机加装滤光片实现水分测量的关键, 可在满足检测准确度基础上简化装置结构。 本文基于高分辨率的近红外高光谱数据结合逐步回归方法进行水分检测所需特征波长的筛选。 逐步回归是一种较优的选元方法可用来消除相关性低和共线性度高的波长, 每引入一个波长, 逐个对已选入的波长进行偏F检验, 直到新引入的波长不再显著[12]。 利用SPSS 24软件的逐步回归方法实现特征波长筛选。

1.3.3 不同带宽数据的仿真获取

选定特征波长即滤光片中心波长后, 波长带宽宽度是另一个实现水分测量的关键参数, 带宽过宽虽然可以提高光通量但分辨率会降低, 在近红外波段体现出不同基团信息的耦合重叠, 直接影响建模效果; 目前市场上的滤光片带宽参数一般为10~300 nm。 本研究结合不同型号滤光片实际带宽参数, 基于鲜活玉米叶片的近红外高光谱数据, 仿真得到不同带宽的数据, 通过建模效果对比得出合适的带宽范围, 为滤光片选型提供依据。

依据滤光片的透光近似分布函数, 代入中心波长和带宽参数, 可得到相应波长和带宽下的透光分布曲线, 然后, 将对应波长下的高光谱数据与分布曲线作卷积运算, 即可得到不同中心波长和带宽下符合滤光片实际透光特性的仿真数据。 其中, 带通滤光片透光近似分布函数见式(2)[13]; 卷积计算见式(3)。

T(λ)=Tpexp-(λ-λc)22σ2(2)

式(2)中, Tp为滤光片的峰值透过率, 理想情况Tp=1; λ c为峰值透过率的中心波长; σ为波形的方差, 与带宽(full width at half maximum, FWHM)呈线性关系σ=FWHM/ 2ln2

Si=T(λ)=01AiT(λ)(3)

式(3)中, Si为透过滤光片的吸光度仿真数据; Ai为滤光片带宽范围内对应波长下的高光谱吸光度数据。

1.3.4 中心波长偏移数据的仿真获取

加装的带通滤光片采用技术成熟的薄膜干涉滤光片产品, 该滤光片膜层材料的热膨胀系数(coefficient of thermal expansion, CTE)和折射率(refractive index)会随着工作环境温度变化, 导致中心波长发生偏移[14], 一般情况下, 温度影响造成的中心波长偏移小于10-3 nm· ℃-1 [15]。 工作环境温度变化过大, 会导致中心波长偏移过大, 使固定中心波长下所建模型的预测性能大大降低。 为推测加装滤光片所建模型受环境温度的影响, 应用固定中心波长和带宽所建模型, 预测分析不同偏移量数据的误差情况, 得出多光谱成像检测装置的环境工作温度范围。

符合滤光片实际偏移特性的仿真数据获取过程如下:

(1)基于鲜活玉米叶片高波长分辨率的近红外高光谱数据, 通过线性插值计算得到更高波长分辨数据, 插值方法见式(4)。

(2)固定带宽下, 将中心波长偏移后的波长代入式(2), 得到相应波长和带宽下的透光分布曲线。

(3)将相应波长对应的高光谱数据与分布曲线应用式(3)作卷积运算, 得到符合滤光片实际偏移特性的仿真数据。

y=yi+x-xixi+1-xi(yi+1-yi)(4)

对于(xi, xi+1)范围内任意波长x, 吸光度y可由式(4)计算得到。 其中, (xi, yi)表示波长和吸光度, (xi+1, yi+1)为后一个波长所对应的波长和吸光度。 利用MATLAB 2018a中“ spline” 函数实现插值计算。

1.3.5 模型的评价指标

使用决定系数(determination coefficient, R2)和均方根误差(root mean squared error, RMSE)[16]对模型性能进行评价, RMSE单位为百分点。

2 结果与讨论
2.1 特征波长筛选

应用1.3.2中介绍的逐步回归方法对玉米鲜活叶片近红外高光谱数据进行特征波长筛选, 对p≤ 0.05的F值引入相关波长, F值(p≥ 0.1)时剔除该波长。 筛选出的特征波长及其对应回归模型的R2和RMSE结果的情况见表1

表1 逐步回归模型结果 Table 1 Result of stepwise regression model

表1可以看出, 当选择2个或3个特征波长时所建模型已能较好实现水分测量。 考虑到多光谱检测装置的结构和成本, 选择1 151和1 403 nm作为与水分密切相关的2个特征波长。

选用市场上现有滤光片其中心波长为1 150和1 400 nm, 为验证是否合适, 将60份不同生育期的样品以2:1比例随机划分为建模集和预测集, 两个模型的R2和RMSE情况见表2

表2 基于特征波长的建模和预测结果 Table 2 Results of modeling and prediction based on feature wavelengths

表2结果表明两组相邻波长建模和验证结果的R2和RMSE没有明显差异。 由近红外基团吸收特征可知[16], 1 150 nm附近主要包含CH基团倍频吸收, 而1 400 nm附近主要包含OH和CH基团的倍频及合频吸收。 选择这两个特征波长建立回归模型时, CH基团的吸收信息可实现相互抵消, 主要显现水分的特征吸收, 应用数学方法选择的特征波长具有基团吸收特征的物理解释。 因此, 本文所选择特征波长合理可行。

2.2 不同带宽数据对建模结果的影响

将2.1中筛选的特征波长(λ c=1 150和1 400 nm)和不同带宽(FWHM=10, 25, …, 300 nm)参数代入式(2)(透光近似分布函数), 得到相应波长和带宽下的透光率的分布曲线; 并由式(3), 将对应波长下的高光谱数据与分布曲线作卷积运算, 得到不同中心波长和带宽下符合滤光片实际透光特性的仿真数据。 应用不同参数下的仿真数据, 建立多元线性回归模型(multivarate linear regression, MLR), 不同模型结果情况见表3

表3 不同带宽建模结果 Table 3 Modeling results for different bandwidths

表3结果可以看出, 带宽小于100 nm的四个模型, 其R2和RMSE没有明显差异, 带宽大于100 nm模型的决定系数和准确度都有明显降低。 带宽小于100 nm时, 所建模型预测水分含量的均方根误差可在1.5个百分点以内, 满足一般农业分析要求。 为进一步验证模型预测水分的可靠性, 以及所选特征波长和带宽范围可行, 将25 nm带宽的仿真数据集划分为建模集与预测集, 划分方式同2.1节一致, 其中, 建模集的R2和RMSE分别为0.968和1.186; 预测集的R2和RMSE分别为0.960和1.298, 图1为建模集和预测集的水分参考值与预测值散点图。 图1结果表明, 选择1 150和1 400 nm作为特征波长, 在带宽为25 nm下所建水分含量模型, 可实现玉米叶片水分的准确检测。

图1 25 nm带宽下建模集(a)和预测集(b)的水分参考值与预测值散点图Fig.1 Scatter plots of moisture reference and predicted values for calibration set (a) and prediction set (b) with 25 nm bandwidth filter

2.3 中心波长偏移对模型预测性能的影响

应用式(4), 得到波长分辨率为0.01~0.5 nm的数据; 将偏移后的中心波长和带宽(25 nm)代入式(2), 其中, 偏移量依次设置为(0.01, 0.02, …, 0.5 nm), 得到中心波长偏移后的透光分布曲线; 将相应波长的高光谱插值数据应用式(3)作卷积运算, 得到符合滤光片实际偏移特性的仿真数据。 应用表3中, 中心波长(λ c=1 150和1 400 nm)和带宽(25 nm)的模型, 预测不同偏移量数据的结果情况见表4

表4 中心波长(1 150和1 400 nm)和带宽(25 nm)模型预测不同偏移量数据的结果 Table 4 The effects of central wavelength drift on model prediction errors for 25 nm bandwidth filter centered at 1 150 and 1 400 nm

表4中数据可以看出, 随着中心波长偏移逐渐增大, 模型预测误差也随之增大, 表明波长准确性对近红外分析非常关键, 波长偏移过大时模型预测能力显著下降。 但滤光片中心波长偏移受温度影响较小, 而且玉米一般是夏季室外作物, 通常在室外环境使用干涉滤光片的温度在0和+50 ℃之间, 由1.3.4节中介绍的干涉滤光片中心波长偏移与温度的定量关系可得, 外界环境温度在50 ℃范围内变化, 等价于中心波长漂移量为0.05 nm, 而在此漂移量下的预测误差仅高出不漂移下预测误差3%左右, 可忽略, 详细结果情况见表4

3 结论

将小体积、 小重量、 高光通量近红外相机加装滤光片, 形成多光谱成像检测装置提供技术参数支撑和环境工作范围, 从而实现田间活体叶片水分含量成像检测; 通过应用鲜活玉米叶片的近红外高光谱数据进行仿真研究, 结果表明: 滤光片特征波长分别为1 150和1 400 nm, 带宽小于100 nm时, 可实现准确检测, 环境温度在50 ℃范围内对检测结果影响不大。 基于本文研究结果, 实际装置的搭建工作已开展, 装置的实现可为现代农业作物生理、 生产研究提供新型、 有效手段。

参考文献
[1] Boyer J S. Science, 1982, 218(4571): 443. [本文引用:1]
[2] DU Ling-tong, TIAN Qing-jiu, WANG Lei, et al(杜灵通, 田庆久, 王磊, ). Transactions of the Chinese Society of Agricultural Engineering(农业工程学报), 2014, 30(9): 126. [本文引用:1]
[3] Jia B, Wang W, Ni X, et al. Chemometrics and Intelligent Laboratory Systems, 2020, 198(3): 103936. [本文引用:1]
[4] ZHU Yuan-yuan, GAO Jiao-bo, GAO Ze-dong, et al(朱院院, 高教波, 高泽东, ). Optical Technique(光学技术), 2016, 42(2): 97. [本文引用:1]
[5] Ge Y, Bai G, Stoerger V, et al. Computers and Electronics in Agriculture, 2016, 127(10): 625. [本文引用:1]
[6] Angelino K, Edlund D A, Shah P. IEEE Journal of Translational Engineering in Health and Medicine, 2017, 5(5): 2168. [本文引用:1]
[7] Zhang M, Gong M, Chan Y. Applied Soft Computing, 2018, 70(1): 604. [本文引用:1]
[8] He H, Sun D. Trends in Food Science & Technology, 2015, 46(1): 99. [本文引用:1]
[9] GAO Jian-shu, ZHENG Da-chuan, YU Zhi-jing(高建树, 郑大川, 于之靖). Laser and Infrared(激光与红外), 2014, 44(4): 391. [本文引用:1]
[10] Ishii K, Nagao R, Matsui D, et al. Advanced Biomedical Engineering, 2015. 4(9): 158. [本文引用:1]
[11] Yan L, Pang L, Wang H, et al. Journal of Food Process Engineering, 2020, 43(4): 13416. [本文引用:1]
[12] YANG Xiu, WANG Jin-feng, LEI Yan-hui, et al(杨秀, 王劲峰, 类延辉, ). Urban Studies(城市发展研究), 2019, 7(26): 81. [本文引用:1]
[13] LIU Qing, ZHOU Jin-song, NIE Yun-feng, et al(柳青, 周锦松, 聂云峰, ). Spectroscopy and Spectral Analysis(光谱学与光谱分析), 2015, 35(4): 1142. [本文引用:1]
[14] FAN Bin, LI Gang-zheng, CHENG Xin-bin, et al(范滨, 李刚正, 程鑫彬, ). Opt. Instr(光学仪器), 2006, (4): 95. [本文引用:1]
[15] Takashashi H. Appl. Opt. , 1995, 34(4): 667. [本文引用:1]
[16] YAN Yan-lu(严衍禄). Principle, Technology and Application of NIR Spectra Analysis(近红外光谱分析的原理、 技术与应用). Beijing: China Light Industry Press(北京: 中国轻工业出版社), 2013. [本文引用:2]