考虑水分光谱吸收特征的水稻叶片SPAD预测模型
于滋洋1, 王翔1, 孟祥添1, 张新乐1,*, 武丹茜1, 刘焕军1,2, 张忠臣3,*
1. 东北农业大学资源与环境学院, 黑龙江 哈尔滨 150030
2. 中国科学院东北地理与农业生态研究所, 吉林 长春 130012
3. 东北农业大学农学院, 黑龙江 哈尔滨 150030
*通讯联系人 e-mail: xinlezhang@yeah.net; zzcneau@neau.edu.cn

作者简介: 于滋洋, 1995年生, 东北农业大学资源与环境学院硕士研究生 e-mail: ziyangyu@yeah.net

摘要

叶绿素是植被光合作用的重要色素, 传统实验室方法测定叶绿素含量需破坏性取样且操作复杂。 通过构建高精度SPAD光谱估算模型, 可以实现对水稻叶片叶绿素含量的实时无损监测。 以黑龙江省不同施氮水平下水稻为研究对象, 采用SVC HR768i型光谱辐射仪共获取移栽后、分蘖期、拔节期、孕穗期、抽穗期共五个关键时期水稻叶片反射光谱数据。 光谱探测范围3502 500 nm。 利用自带光源型手持叶片光谱探测器直接测定叶片光谱, 光源为内置卤素灯。 采用SPAD-502型手持式叶绿素仪同步测定水稻叶片的SPAD值。 叶片水分是植物光合作用的基本原料, 也间接影响着叶绿素含量。 叶片含水量降低则会影响植物正常的光合作用, 导致其叶绿素含量随之降低。 因此将叶绿素敏感波段与水分吸收范围结合作为SPAD估算的输入量。 随机森林模型是一个基于多个分类树的算法。 算法在采样的过程中包括两个完全随机的过程, 一是有放回抽样, 可能会得到重复的样本, 二是选取自变量是随机的。 因此本文对叶片光谱反射率进行去包络线(CR)处理, 综合考虑可见光近红外波段提取水稻叶片反射光谱特征参数和植被指数, 综合分析光谱指标与SPAD相关关系, 采用随机森林算法构建不同输入量的SPAD高光谱估算模型。 结果表明: (1)水稻叶片SPAD与光谱反射率的相关系数在叶绿素敏感波段红波段范围(600~690 nm)、红边范围(720760 nm)、水分吸收波段范围(1 4001 490和1 9001 980 nm)均为0.75以上; (2)在光谱参数与SPAD 的相关分析中, NDVI, DP2与水稻叶片SPAD值相关性最好, 相关系数为0.811和0.808; (3)以结合水分光谱信息后的CR(V1, V2, V3, V4)为自变量所建立的随机森林模型精度最高, R2为0.715, RMSE为2.646, 可作为水稻叶片叶绿素预测模型。 研究结果揭示了不同品种水稻的光谱响应机制, 提供了水稻叶片SPAD值高精度反演的技术方法, 为监测与调控东北地区水稻正常生育进程提供技术支持。

关键词: 高光谱; 随机森林; 叶绿素相对含量; 去包络线; 水稻
中图分类号:S511 文献标志码:A
SPAD Prediction Model of Rice Leaves Considering the Characteristics of Water Spectral Absorption
YU Zi-yang1, WANG Xiang1, MENG Xiang-tian1, ZHANG Xin-le1,*, WU Dan-qian1, LIU Huan-jun1,2, ZHANG Zhong-chen3,*
1. College of Resources and Environment, Northeast Agricultural University, Harbin 150030, China
2. Northeast Institute of Geography and Agroecology, Chinese Academy of Sciences, Changchun 130012, China
3. College of Agriculture, Northeast Agricultural University, Harbin 150030, China
*Corresponding authors
Abstract

Chlorophyll is an important pigment in vegetation photosynthesis, and the traditional laboratory method needs destructive sampling and complex operation. By constructing a high-precision SPAD spectral estimation model, the real-time non-destructive monitoring of chlorophyll content in rice leaves can be realized. In this paper, the data of five key stages of transplanting, tillering stage, jointing stage, booting stage and heading stage were obtained from rice under different nitrogen levels in Heilongjiang Province. The reflectance spectrum data of rice leaves were measured by SVC HR768i spectral radiometer with a spectral detection range of 3502 500 nm. The spectrum of the blade was measured directly by the handheld blade spectrum detector with its own light source, which was built-in halogen lamp. The SPAD value of rice leaves was measured synchronously by SPAD-502 hand-held chlorophyll meter. Leaf water is the basic raw material of plant photosynthesis, and the decrease of leaf water content will affect the normal photosynthesis of plant, resulting in the decrease of chlorophyll content and the indirect effect of water content on chlorophyll content. Therefore, the chlorophyll sensitive band and the range of water absorption are combined as the input of SPAD. The Random Forest model is an algorithm based on multiple classification trees. In the process of sampling, the algorithm includes two completely random processes, of which one is that the sampling process is carried out with a return sampling, and the other is that the sample may be repeated, and the other is random when we select the independent variables. In this paper, the spectral reflectance of rice leaves is extracted by continuum removal (CR), and the characteristic parameters of reflectance spectrum and vegetation index of rice leaves are extracted by taking into account the visible and near infrared bands. The correlation between spectral indices and SPAD was analyzed and the SPAD hyperspectral estimation model with different inputs was constructed by the Random Forests. Results are: (1) The correlation coefficient between SPAD and spectral reflectance of rice leaves was above 0.75 in the range of chlorophyll sensitive band (600~690 nm), red edge region (720760 nm) and water absorption band (1 4001 490, 1 900~1 980 nm). (2) In the correlation analysis between spectral parameters and SPAD, the correlation between, NDVI, DP2 and SPAD value of rice leaves was the best, and the correlation coefficients were 0.811 and 0.808; (3) The Random Forests model with CR(V1, V2, V3, V4) combined with water spectral information had the highest accuracy and R2 was 0.715, RMSE was 2.646, which could be used as a chlorophyll prediction model for rice leaves. The results revealed the spectral response mechanism of different varieties of rice, provided a high precision inversion method of SPAD values of rice leaves, and provided technical support for monitoring and regulating the normal growth process of rice in Northeast China.

Keyword: Hyperspectral; Random Forests; Relative chlorophyll content; Continuum removal; Rice
引 言

叶绿素含量是作物生长的重要指标, 是评价作物光合作用能力的重要依据, 因此可以通过监测作物叶绿素含量间接对作物生长条件进行调控。 分光分度计法, 荧光分析法, 活体叶绿素仪法等被用于监测叶绿素含量[1], 但这些方法操作复杂繁琐, 且具有一定的破坏性。

遥感可以为作物生理指标的定量化监测提供简单快捷, 非破坏性的方法。 国内外许多学者在在监测植被生理指标方面做了大量研究。 针对叶绿素反演的研究也有很多, 有学者提出一种估算作物叶片叶绿素含量和冠层叶绿素含量反演方法并建立混合反演模型[2]; 以红边参数为自变量同样可以对SPAD进行良好的估测, 并且相对于红边位置以红边峰度为自变量可以提高估算精度[3]。 Gitelson等提出CIRE和MTCI指数在叶片尺度的叶绿素监测精度较高[4]。 以上研究均局限在可见光波段范围结合红边参数计算植被指数或者光谱参数作为自变量建立估算模型。 植被指数是通过光谱反射率间接计算得到, 包络线去除处理可以增强吸收特征, 直接表征植被的光谱反射率信息[5]。 水分是植物光合作用的基本原料, 叶片含水量降低则会影响植物正常的光合作用, 导致其叶绿素含量随之降低, 水分含量也间接影响着叶绿素含量[6, 7]。 因此, 尝试将叶绿素敏感波段与水分吸收波段结合估算SPAD含量。

随着人工智能时代的发展, 一些机器学习算法逐渐在各个研究领域广泛应用。 随机森林模型是一个基于多个分类树的算法。 通过对大量分类树的汇总提高了模型的预测精度, 并且便于计算变量的非线性作用[8], 拟合能力强且不会出现过度拟合问题。 有学者选择最优光谱指数和确定最佳自变量个数的基础上结合随机森林算法可以构建高精度LAI反演模型[9]。 但利用随机森林回归算法结合去包络线构建叶片SPAD估算模型的研究尚不多见。

以水稻为研究对象, 综合分析水稻不同生育期光谱参数与SPAD相关关系, 利用可见光近红外叶绿素敏感波段与短波红外水分吸收波段光谱指数共同作为输入量, 采用随机森林算法构建水稻叶片SPAD的遥感估算模型。 旨在为提升水稻长势监测精度提供理论依据与技术支持。

1 实验部分
1.1 样品采集

2017年6月— 9月在黑龙江省哈尔滨市呼兰区试验田(N45.9° , E126.8° ), 选取晚熟品种188和早熟品种龙稻11号两种, 共获取移栽后、 分蘖期、 拔节期、 孕穗期、 抽穗期共五个关键时期数据。 施肥处理采用移栽施一次基肥, 分蘖期和抽穗期之前进行两次追肥的施肥方式。 基肥, 分蘖肥和穗肥施肥比例为5: 2: 3, 氮磷钾比例为2: 1: 2。 总共设置6个小区, 氮肥处理设置0, 90, 112.5, 135, 157.5和180 kg· hm-2等6个肥力水平, 分别用N1, N2, N3, N4, N5和N6表示。 施肥品种分别为二铵、 尿素和硫酸钾, 二铵的含磷量为46%, 含氮量为17%, 尿素的含氮量为46%, 硫酸钾的含钾量为50%。 每个施肥水平设置4次重复, 随机区组排列, 小区面积为72 m2。 5月24日播种, 田间管理按照大田种植方式进行。

1.2 数据采集与处理

水稻叶片反射光谱数据获取采用美国SVC HR768i型光谱辐射仪, 光谱探测范围3502 500 nm, 光谱分辨率为3.5, 8.5和6.5 nm。 利用自带光源型手持叶片光谱探测器直接测定叶片光谱, 光源为内置卤素灯。 采用SPAD-502型手持式叶绿素仪同步测定水稻叶片的SPAD值, 具体步骤见文献[10]。

1.3 特征参数选择

表1为不同特征参数的计算方法。 提取的参数共分为两类, 分别为基于原始反射率计算的植被指数和基于包络线去除提取的去包络线参数。

表1 光谱指数计算公式 Table 1 Calculation formula of spectral index

图1为去包络线后的反射光谱曲线, 可提取的吸收特征主要包括: 4个吸收谷(V1, V2, V3, V4)的吸收深度(DP)和吸收谷面积(A)。 依据上述吸收特征参数提取指标包括V1(440550 nm), V2(550760 nm), V3(1 3001 700 nm), V4(1 8502 250 nm), 这4个吸收谷的深度(DP1DP4)和吸收谷面积(A1A4)。

图1 水稻叶片去包络线反射光谱Fig.1 Rice leaf reflectance continuum-removed spectra

1.4 模型构建与精度验证

随机森林是由多个决策树模型组成的预测模型。 在采样的过程中包括两个完全随机的过程: (1)有放回抽样, 可能会得到重复的样本; (2)选取自变量是随机的。 然后对采样之后的数据使用完全分裂的方式建立决策树, 再根据投票的形式, 选取最优的模型进行预测。 随机森林模型在R软件中实现。

将不同方法计算的参数作为自变量建立随机森林回归模型。 将参数提取范围分为两类, 分别是4401 000和4402 500 nm。 以4401 000 nm反射率、 去包络线、 去包络线前两个吸收谷参数作为自变量记为R(4401 000 nm), CR(4401 000 nm), CR(V1, V2)。 以4402 500 nm反射率、 去包络线、 去包络线四个吸收谷参数作为自变量记为R(4402 500 nm), CR(4402 500 nm), CR(V1, V2, V3, V4)。 将120个样本中的72个作为训练样本, 48个作为验证样本, 以决定系数(R2)、 均方根误差(RMSE)作为指标评价指标。 R2越大, RMSE越小, 模型越稳定。

2 结果与讨论
2.1 不同生长期水稻叶片光谱特征分析

图2为品种188水稻N3施肥处理的不同生育期叶片反射率曲线与去包络线。 叶片反射率主要受叶片内色素、 细胞结构及叶片含水量三方面影响。 在可见光波段(350720 nm)叶片反射率受叶绿素影响最大。 随水稻植株生长, 叶片对红光、 蓝光吸收增强, 使绿波段反射率逐渐突出。 在近红外波段(7201 300 nm), 由于水稻叶片的细胞壁和细胞空隙间折射率影响, 导致反射率较高。 在短波红外内(1 4002 500 nm), 水稻反射率主要受叶片含水量影响。 经过去包络线处理后, 光谱吸收特征更加明显。 不同品种水稻, 在不同生育时期, 去包络线曲线特征大致相似。 在440~2 500 nm范围内都有4个吸收谷, 随着生育进程的发展吸收谷的深度和面积不断变大, 基于以上特征提取吸收特征参数。

图2 水稻不同生育期叶片光谱反射率曲线与去包络线Fig.2 Spectral reflectance curve and continuum removal line of rice leaves at different growth stages

2.2 相关性分析

2.2.1 SPAD与不同数学变换光谱数据的相关分析

光谱反射率与水稻叶片SPAD值在在整个波长范围内均存在正相关关系, 在440~680 nm范围内相关系数逐渐减小, 至红边处(690760 nm)逐渐变大, 在近红外(7601 800 nm)内相关系数稳定在0.65以上。 1 9001 930 nm范围的水分吸收带处相关系数最小。

去包络线与SPAD值相关关系在整个波长范围内基本呈负相关关系。 在红光范围(620680 nm), 水分吸收带(1 4001 450, 1 9001 930 nm)等强吸收范围内的相关系数在0.75以上, 在波长660 nm处相关系数最大为0.81。

2.2.2 SPAD与不同光谱指数相关分析

将不同时期测量的水稻叶片SPAD值与不同方法计算的光谱指数分别进行相关分析, 结果如表2所示。 选取与SPAD极显著相关的4种植被指数。 NDVI、 RVI与SPAD相关性最好, 相关系数在0.78以上, 而CIRE, MTCI与SPAD相关系数在0.6以上, 且相关性依次递减。

表2 光谱指数与水稻叶片SPAD相关系数(样本数n=120) Table 2 Correlation coefficient between spectral index and SPAD in rice leaves

在去包络线参数与SPAD相关分析中发现, 可见光处吸收谷深度与吸收谷面积与SPAD均呈极显著正相关且相关系数较大, DP2与SPAD相关系数最大为0.808。 水分吸收处深度与吸收谷面积与SPAD同样呈极显著相关, 相关系数小于可见光波段光谱指数。 综合来看, 吸收谷深度与SPAD相关性高于对应的吸收谷面积。 对不同方法计算的参数与SPAD相关性进行比较可以发现, 所有去包络线参数相关性接近NDVI且好于其余植被指数。

图3 光谱反射率、 去包络线与SPAD相关系数Fig.3 Spectral reflectivity, continuum removal and SPAD correlation coefficient

2.3 基于随机森林回归模型的SPAD估算

表3可知, 在4401 000 nm范惜内, 以CR(4401 000 nm)作为自变量建立模型估算精度最高, 精度明显优于光谱反射率。 当参数波段范围为4402 500 nm内, 模型精度显著提高。 与CR(4401 000 nm), CR(V1, V2)相比, 以结合水分吸收特征后的CR(4402 500 nm), CR(V1, V2, V3, V4)作为自变量建立的模型, R2分别提高6%和39%。 经对比分析可以得出, CR(V1, V2, V3, V4)提取特征参数简便, 估算精度高, 可作为估算SPAD值得最优输入量。

表3 水稻叶片SPAD估算验证样本精度 Table 3 Accuracy of SPAD estimation for rice leaves

对原始反射率进行包络线去除处理, 可以增强水稻叶片吸收特征, 使得不同叶绿素含量的光谱曲线差异显著。 在植被生长过程中叶绿素在不同阶段变化速率不同, 导致在生长末期叶绿素含量本身存在饱和现象。 研究发现以去包络线参数为自变量时估算精度最高。 说明去包络线参数与随机森林回归结合能较好地解决饱和现象及噪声问题, 并且由于其自身的效率高及不易过度拟合等优点适合解决水稻叶片叶绿素估算问题。

相关性分析发现, 经过去包络线处理后的光谱, 在整个波长范围内(3502 500 nm)与SPAD相关性较高的波段范围在红光范围(620680 nm)、 红边(720760 nm)、 水分吸收范围(1 4001 490, 1 9001 980 nm)。 水分吸收范围与SPAD相关性高是因为植物叶片含水量与叶绿素含量本身显著相关, 二者存在相互依存的关系, 二者缺一导致植物不能健康生长, 光合作用受到影响使叶片枯黄, 另一方含量随即减少。 之前的研究大多集中在可见光范围提取参数对叶绿素含量进行估算。 本工作将蓝光、 红光与水分吸收范围结合作为SPAD估算的输入量建立随机森林模型。 结果表明, 考虑水分吸收特征后的模型精度显著提高。

本研究区位于东北地区缺乏不同地区模型适宜性的比较并且在模型构建的方法是否可适用不同作物不同参数有待于进一步探究与验证, 以提升随机森林算法在农业遥感中的适用性。

3 结 论

以东北地区不同品种五个时期水稻叶片为研究对象, 构建了去包络线-光谱参数-随机森林SPAD值预测模型, 得出以下结论:

(1)水稻叶片光谱反射率与SPAD值在7601 800 nm范围内呈极显著相关, 相关系数稳定在0.65以上; 去包络线参数与SPAD值在620680, 1 4001 450和1 9001 930 nm范围内呈极显著负相关, 在660 nm处具有最大相关系数0.81。

(2)在光谱参数中, NDVI, DP2与水稻叶片SPAD值相关性最好, 相关系数为0.811和0.808。 去包络线参数与SPAD值相关性好于除NDVI外其余植被指数。

(3)以引入水分敏感波段后的去包络线光谱指数为自变量, 建立的CR(V1, V2, V3, V4)随机森林模型精度最高, R2为0.715, RMSE为2.646。 研究结果表明考虑水分信息能提高SPAD估算精度, 可作为水稻叶片叶绿素监测的重要方法。

参考文献
[1] HUANG Chi-du, HU Xiao-song, LIAO Xiao-jun, et al(黄持都, 胡小松, 廖小军, ). China Food Additives(中国食品添加剂), 2007, (3): 114. [本文引用:1]
[2] Liang L, Qin Z, Zhao S, et al. International Journal of Remote Sensing, 2016, 37(13): 2923. [本文引用:1]
[3] YAO Fu-qi, CAI Huan-jie, LI Ya-long, et al(姚付启, 蔡焕杰, 李亚龙, ). China Rural Water and Hydropower(中国农村水利水电), 2015, (3): 84. [本文引用:1]
[4] Gitelson A, Solovchenko A. Geophysical Research Letters, 2017, 44(18): 9293. [本文引用:1]
[5] GUO Chao-fan, GUO Xiao-yu(郭超凡, 郭逍宇). Acta Ecologica Sinica(生态学报), 2016, 36(20): 6538. [本文引用:1]
[6] HU Song-ping, MEI Han-wei, ZOU Gui-hua, et al(胡颂平, 梅捍卫, 邹桂花, ). Chinese Journal of Plant Ecology(植物生态学报), 2006, 30(3): 120. [本文引用:1]
[7] Sanchez R A, Hall A J, Trapani N, et al. Photosynthesis Research, 1983, 4(1): 35. [本文引用:1]
[8] LI Xin-hai(李欣海). Chinese Journal of Applied Entomology(应用昆虫学报), 2013, 50(4): 1190. [本文引用:1]
[9] Liang L, Di L, Zhang L, et al. Remote Sensing of Environment, 2015, 165: 123. [本文引用:1]
[10] LI Yuan-yuan, CHANG Qing-rui, LIU Xiu-ying, et al(李媛媛, 常庆瑞, 刘秀英, ). Transactions of the Chinese Society of Agricultural Engineering(农业工程学报), 2016, 32(16): 135. [本文引用:1]
[11] Sims D A, Gamon J A . Remote Sensing of Environment, 2002, 81(2-3): 337. [本文引用:1]
[12] Daughtry C S T, Walthall C L, Kim M S, et al. Remote Sensing of Environment, 2000, 74(2): 229. [本文引用:1]
[13] LIU Huan-jun, ZHANG Xiao-kang, ZHANG Xin-le, et al(刘焕军, 张小康, 张新乐, ). Journal of Remote Sensing(遥感学报), 2017, 21(1): 105. [本文引用:1]