基于灰色关联法的春小麦叶片含水量高光谱估测模型研究
吾木提·艾山江1,2, 买买提·沙吾提1,2,3,*, 尼加提·卡斯木1,2, 尼格拉·塔西甫拉提1,3, 王敬哲1,2, 依尔夏提·阿不来提1,2
1. 新疆大学资源与环境科学学院, 新疆 乌鲁木齐 830046
2. 新疆绿洲生态教育部重点实验室, 新疆 乌鲁木齐 830046
3. 新疆智慧城市与环境建模普通高校重点实验室, 新疆 乌鲁木齐 830046
*通讯联系人 e-mail: korxat@xju.edu.cn

作者简介: 吾木提·艾山江, 1992年生, 新疆大学资源与环境科学学院硕士研究生 e-mail: MasterWu516@163.com

摘要

利用高光谱植被指数反演植被水分含量时, 快速、 准确的找到实测光谱数据与植被水分相关性最高的植被指数是研究的重点。 在农田尺度上, 以春小麦野外光谱数据与叶片含水量的定量关系为基础, 通过灰色关联度分析, 筛选出与叶片含水量灰色关联度较高的5种典型的水分植被指数, 并建立了估算春小麦叶片含水量(LWC)的偏最小二乘回归(PLSR)模型和BP神经网络(back propagation artificial neural networks, BP ANN)模型。 结果表明: (1)光谱一阶导数可以有效去除噪声影响并突出光谱特征信息, 尤其是在750~830, 1 000~1 060和2 056~2 155 nm等区间明显提高了与LWC的相关性。 (2)灰色关联法能够较好的表征各水分植被指数与叶片含水量间的关联性, 其中基于原始光谱建立的前5个水分植被指数都是两波段比值植被指数, 基于光谱一阶导数建立的水分植被指数基本上都是两波段归一化差值植被指数。 (3)所建立的两种模型中, 基于光谱一阶导数建立的PLSR和BP神经网络模型 R2分别为0.80和0.81, 稳定性基本相同且都较好; 两种模型RMSE都是0.55, RPD分别为2.01和1.41, 说明PLSR模型的预测精度比BP神经网络模型高。 从模型的验证效果来看, PLSR模型在估算春小麦叶片含水量方面有一定的优势, 为高光谱定量反演春小麦叶片含水量提供一定的参考。

关键词: 叶片含水量; 春小麦; 高光谱估算; 灰色关联法; 反演模型
中图分类号:TP79 文献标识码:A
Hyperspectral Estimation Model of Leaf Water Content in Spring Wheat Based on Grey Relational Analysis
Umut Hasan1,2, Mamat Sawut1,2,3,*, Nijat Kasim1,2, Nigela Taxipulati1,3, WANG Jing-zhe1,2, Irxat Ablat1,2
1. College of Resources and Environmental Science, Xinjiang University, Urumqi 830046, China
2. Key Laboratory of Oasis Ecology of Ministry of Education, Urumqi 830046, China
3. Key Laboratory for Wisdom City and Environmental Modeling, Xinjiang University, Urumqi 830046, China
Abstract

When vegetation index is used to retrieve water content, it is important to find the vegetation index which has the highest correlation between measured spectral data and vegetation water content. In this paper, Fukang science experimental base of Xinjiang University was selected as the study area. Based on spring wheat field spectral data and leaf water content data, this paper selected 5 typical water vegetation indices that have higher grey correlation degree with leaf water content through grey correlation analysis. And used 2 kinds of methods including the partial least squares regression (PLSR) and back propagation artificial neural network (BP ANN) to establish the quantitative inversion models of soil water content. The results showed that: (1) The first derivative of spectrum can effectively remove the noise influence and highlight the spectral characteristic information, especially in the range of 750~830, 1 000~1 060, 2 056~2 155 nm, which significantly improves the correlation with LWC. (2) The grey correlation method can better characterize the relationship between water vegetation indices and leaf water content, and the first 5 water vegetation indices based on original spectrum were two band ratio vegetation index, and the water vegetation indices based on the first derivative spectra were basically two band normalized difference vegetation index. (3) Among the two established models, R2 of PLSR and BP neural network model established by the first derivative reflectance were 0.80 and 0.81 respectively, which showed that the two models have good stability in inversion of leaf water content; the RMSE of the two models were 0.55 and RPD were 2.01 and 1.41 respectively, which indicated that the prediction accuracy of PLSR model was higher than that of BP neural network model. From the validation of the model, the PLSR model has some advantages in estimating leaf water content of spring wheat, which provides a reference for hyperspectral quantitative inversion of it.

Key words: Leaf water content; Spring wheat; Hyperspectral estimation; Grey correlation method; Inversion model
引 言

叶片含水量(leaf water content, LWC)是涉及到许多植被生理过程和生态系统模式的关键变量, 也是植被蒸腾和固碳的主要限制因素, 在作物生长过程中起到重要作用[1, 2]。 快速、 准确的获取作物叶片含水量信息在进行作物长势监测、 干旱状况监测以及灌溉管理等方面有着重要的意义。

与叶片含水量传统的地面实测方法相比, 高光谱遥感具有信息量大、 快速、 经济等优点, 成为精确估算植被含水量强有力的工具, 为制作不同时空尺度上植被含水量分布图提供了唯一的可能性[3, 4]。 国内外学者基于目前常用高光谱估算植被含水量的方法, 如基于高光谱波段选择及光谱变换的植被含水量估算、 基于光谱指数的植被含水量估算、 基于辐射传输模型的植被含水量估算等[5]做了大量的科学研究。 Cheng Tao等[6]利用小波分析法提取与叶片含水量强相关的小波系数等特征, 并对热带森林叶片含水量进行估算; 刘小军等[7]通过对地面高光谱数据进行系统的分析, 提取出了对水稻叶片含水量估算能力较强的新光谱指数RSI(R1 402, R2 272)和NDSI(R1 402, R2 272); 朱西存等[8] 通过分析不同含水量的苹果叶片高光谱数据, 根据2个不同生育期苹果叶片水分含量与光谱指数之间的相关性, 利用主成分回归法建立了估算苹果叶片水分含量的回归模型; 程晓娟等[9]利用Landsat TM5数据, 将地面高光谱窄波段数据模拟成TM宽波段数据, 用模拟数据建立水分指数, 实现了遥感影像上反演小麦冠层叶片含水量; 邓兵等[5]对近红外角度指数ANIR进行改进, 提出了近红外角度归一化指数NANI与近红外角度斜率指数NASI, 并建立NANI和NASI与植被含水量之间的线性回归模型, 结果发现模型的决定系数R2提高到了0.853, RMSE降低至0.039, 使该模型在植被含水量反演中有了更高的精度; 郑兴明等用Landsat OLI影像数据计算的植被水分指数与玉米的实测含水量数据比较12种植被水分指数与植被含水量之间的相关性, 发现水分胁迫指数MSI2与植被含水量的相关性最好; 吴伶等[10]用微粒群算法和PROSPECT+SAIL模型, 选择3个植被指数作为优化比较对象反演叶片含水量, 得到了较高的反演精度。

在上述研究中, 大部分直接利用原始光谱数据建立估算叶片含水量的指数, 忽略了土壤背景等噪声的干扰。 另外, 利用水分植被指数反演春小麦水分含量时, 指数的选择单一, 忽略了每个水分植被指数与LWC间不清楚的关系。 灰色关联法可以使这种关系定量化, 提高预测能力。 因此, 在农田尺度上, 对春小麦实测光谱数据和变换数据, 采用灰色关联度分析, 筛选出适合用来表征水分的指数, 以此为基础, 建立了估算春小麦含水量的偏最小二乘回归(partial least squares regression, PLSR)模型和BP神经网络模型, 并对两种模型精度进行评价。

1 实验部分
1.1 研究区概况

实验于2017年6月在新疆大学阜康科学实验基地东北角2公顷的农田里进行。 该科学实验基地位于新疆阜康市上户沟乡滋泥泉子镇北部(88° 22'— 88° 29'E, 44° 23'— 44° 22'N), 占地面积为7 200亩, 实验基地周围均为主要播种小麦、 玉米等农作物的大型农场, 该地区是典型的干旱区耕作区, 也是新疆主要的粮食基地; 该区域气候为典型的中温带大陆性干旱气候, 其特点是四季分明, 冬天冷、 夏天热, 春秋气温变化较剧烈, 降水量少且季节分配不均匀, 主要集中在春夏季, 光热条件充足。 每隔12 m做一个60 cm× 60 cm的采样区供测量春小麦冠层叶片光谱反射率和小麦样本采集, 研究区位置和采样区分布情况如图1所示。

图1 研究区位置和采样区分布图Fig.1 Location of study area and distribution of sampling plots

1.2 光谱数据的采集与处理

在春小麦抽穗期利用美国ASD FieldSpec3光谱仪(波段范围为350~2 500 nm)采集光谱反射率数据, 在350~1 000和1 000~2 500 nm范围内采样间隔为1.4和2 nm, 重采样后可达到1 nm。 数据采集是在无云晴朗的天气下进行, 采集时间为北京时间10:00— 14:00, 每隔3~5 min进行一次白板校正。 每个样本重复采集10次光谱曲线, 设测量间隔0.1 s, 取其平均值作为样本的光谱数据。

测得的光谱数据中, 首先把噪声较大的边缘波段350~399和2 401~2 500 nm与红外波段1 355~1 444和1 777~1 949 nm去除, 对剩下的光谱曲线用数学形态滤波方法进行平滑处理。 在原始土壤光谱数据的基础上, 对平滑后的光谱反射率数据求一阶导数, 处理后的光谱数据作为下一步计算水分植被指数的依据。

1.3 叶片含水量的测定

采集光谱数据的同时, 在每个小采样区内采摘植株样本放在密封塑料袋内, 保证植株水分不受到损失。 在实验室中, 将春小麦的叶片和茎分开用感量0.000 1 g的电子天平称取每个样本叶片重量, 记为鲜重。 然后将所有样本放入烘干箱(80 ℃)烘干36 h, 再称重量记为干重。 将55个样本随机分为两组, 一组为建模样本(28个, 占总数的51%), 用于春小麦叶片含水量预测模型的建立; 另一组为验证样本(27个, 占总数的49%), 用于验证建立的估算模型。 叶片含水量LWC按式(1)进行计算。 公式中, FW和DW分别为春小麦叶片的鲜重和干重(g)。

LWC=FW-DWFW×100%(1)

1.4 水分植被指数(WVIs)的选择

根据以往的研究成果和植被含水量与水分植被指数之间的相关性, 利用文献统计的方法统计选取12种对叶片含水量较敏感的两波段水分植被指数(表1)。

表1 12种不同水分植被指数 Table 1 12 different water vegetation indices(WVIs)
1.5 灰色关联度分析

灰色关联分析是通过一定的方法理清系统中各因素间的主要关系, 找出影响最大的因素, 把握矛盾主要方面的一种方法。 本文春小麦叶片含水量作为参考数列, 12种常用水分植被指数作为比较数列进行灰色关联度分析, 具体步骤如下:

(1)春小麦叶片含水量数据进行无量纲化处理。

(2)关联系数的计算

利用春小麦叶片含水量和12种常用水分植被指数, 根据式(2)计算二者的灰色关联系数。

γ0i(k)=Δmin+ρΔmaxΔ0i(k)+ρΔmax(2)

式(2)中, γ 0i(k)为参考数列与比较数列k之间的关联系数; Δ minΔ max分别为最小绝对差和最大绝对差; ρ 为分辨系数, 取值范围[0, 1], 本文中ρ =0.5。

(3)灰色关联度计算

根据式(3)计算灰色关联度。

γi=1ni=1nγ0i(k)(3)

(4)关联度排序

按照关联度γ i的大小, 对12种水分植被指数进行排序。

1.6 建立模型与验证

采用偏最小二乘回归(PLSR)方法和BP神经网络方法建立估算春小麦叶片含水量的模型。 PLSR方法是一种多变量回归分析方法, 与普通最小二乘回归方法相比, 它的优势在于可对数据进行降维、 信息的综合处理并筛选出最能解释系统的新综合成分。 常用的BP神经网络模型由输入层节点、 输出层节点, 一个或多个的隐含层节点组成, 其中心思想是通过修改各层神经元的权值使误差信号最小, 通过把学习的结果向前传播到中间的隐含层, 对他们的权系数矩阵进行改正, 从而达到学习的预期目的。

用决定系数(R2)、 均方根误差(RMSE)、 相对分析误差(RPD)对模型的稳定性和预测能力进行检验。 决定系数(R2)越大, 即越接近1, 表明该模型的拟合效果越高, 并且模型越稳定; RMSE越小, 预测能力越好、 模型精度越高。 一般RPD小于1.4, 表示该模型不能对样本进行预测; RPD大于等于1.4且小于2, 表示该模型具有一般的预测能力, 可以对样本进行粗略的预测; RPD大于等于2, 表示该模型具有极好的预测能力。

2 结果与讨论
2.1 春小麦冠层光谱与叶片含水量的关系

图2为不同含水量春小麦冠层光谱曲线图。 由图可知, 叶片含水量的差异导致反射率的变化, 随着叶片含水量的增加, 光谱反射率呈现降低的趋势, 光谱曲线变化趋势基本一致。 可见光波段范围(VIS, 400~750 nm)内, 冠层反射率主要受叶绿素含量等的影响, 水分吸收率非常低; 在近红外(NIR , 750~1 300 nm)和短波红外(SWIR, 1 300~2 500 nm)范围内出现了4个明显的水分吸收谷, 波谷大概位于970, 1 200, 1 450和1 950 nm附近。 随着叶片含水量的增加, 930~970和1 100~1 200 nm处的斜率增大, 其中970和1 200 nm附近由于没有大气的干扰, 可作为估算叶片含水量的较佳选择, 同时可以与高光谱图像结合快速的反演春小麦叶片含水量。

图2 不同含水量的春小麦冠层光谱曲线Fig.2 Canopy spectral curve of spring wheat with different water contents

在以上分析的基础上, 将春小麦叶片含水量和反射率逐波段做Pearson相关分析, 得出相关系数在各波长上的分布图(图3)。 (a)和(b)分别为原始光谱和光谱一阶导数与春小麦叶片含水量间的相关系数图。 由图可知, 春小麦冠层原始光谱和一阶导数处理后的光谱反射率都与LWC存在着极显著相关, 但通过0.05和0.01两个显著性水平的波段有所区别。 对原始光谱来说, 所有波段与LWC呈负相关, 400~740, 930~1 000和1 330~2 400 nm区间内都通过了0.05显著性检验, 说明这些区间内原始光谱与LWC相关性较好, 最高相关系数出现在400 nm处, 由于此波段主要受叶绿素含量的影响, 其与LWC强相关说明LWC与叶绿素间可能有较密切的关系。 另外, 740~930和1 000~1 330 nm区间, 各波段与LWC相关性很低, 这与图2中光谱曲线特征基本吻合; 对光谱一阶导数来说, LWC与各波段反射率呈正负相关, 呈负相关的波段个数明显多于正相关波段数, 相关性显著的波段主要分布在760~1 065 nm区间内, 最高值出现在791 nm处。 与原始光谱相比, 在750~830, 1 000~1 060和2 056~2 155 nm等区间各波段与LWC相关性有所提高, 说明这些波段的光谱反射率与春小麦叶片含水量相关性较好, 适合用于水分植被指数的建立。 以上结果说明, 春小麦冠层光谱做一阶导数处理后的反射率与LWC的相关性有较显著的提高。

图3 叶片含水量与光谱反射率之间的相关系数(r)
(a): 原始光谱与LWC之间的相关性; (b): 光谱一阶导数与LWC之间的相关性
Fig.3 Correlation coefficients (r) between LWC and reflectance spectra
(a): Correlation between Raw reflectance and LWC; (b): Correlation between FD reflectance and LWC

2.2 确定水分植被指数

灰色关联度分析结果及其排序如表2所示。 由表2发现: 基于一阶导数建立的水分植被指数与LWC间的灰色关联度普遍大于基于原始光谱建立的灰色关联度, 排列顺序分别为: NDVI> NDWI> NDII> FWBI> NDMI> WI> MSI1> MSI> SRWI1> SRWI2> NDWI-Hyp> WBI; FWBI> WI> WBI> SRWI1> SRWI2> NDVI> NDWI> MSI1> NDMI> MSI> NDII> NDWI-Hyp。 根据灰色关联度排序情况, 从12种水分植被指数中选取与LWC灰色关联度较稳定的前5个水分植被指数, 发现基于原始光谱建立的水分植被指数(FWBI, WI, WBI, SRWI1, SRWI2)都是两波段比值植被指数, 基于光谱一阶导数算得的水分植被指数(NDVI, NDWI, NDII, FWBI, NDMI)基本上都是两波段归一化差值植被指数。 除此之外, 还发现与LWC灰色关联度较稳定的两组水分植被指数中都含有FWBI, 说明900~980 nm区间的光谱在反演LWC方面有着较重要的作用, 同时为以后水分植被指数的选择提供一定的依据。

表2 常用水分植被指数与春小麦叶片含水量间的灰色关联度及排序 Table 2 Grey correlation degree and ranking between common WVIs and LWC of Spring Wheat
2.3 建立模型与验证

通过灰色关联度分析得出的前5个水分植被指数和建模样本实测LWC数据分别建立PLSR模型和BP神经网络模型。 PLSR模型中, 五种水分植被指数作为自变量, 春小麦LWC作为因变量; BP神经网络模型选用5-8-1的3层结构建立, 输入层包括两种光谱反射率数据(原始和FD)算得的水分植被指数, 输出层为小麦LWC, 隐含层神经元确定为8个。 建模及验证结果如表3所示。 从建模效果看, 基于原始光谱建立的两种模型中R2都低于0.7, RMSE相差不大, 说明两种模型的稳定性较低, 预测效果接近; 基于光谱一阶导数建立的两种模型R2都大于0.7, RMSE分别降低至0.58和0.52, 说明经过数据变换后模型的稳定性和预测精度有了一定的提高, 其中PLSR模型的R2提高幅度和RMSE降低幅度都大于BP神经网络模型。 从预测值与实测值之间的拟合分析(图4)可以看出, 基于一阶导数的数据点与原始光谱相比较为均匀的分布在1∶ 1直线的两侧, 表明利用光谱一阶导数建立的两种模型拟合效果都较好。

为了进一步验证模型的估测精度, 利用验证样本对两种模型进行精度验证(表3), 从验证效果看, 基于原始光谱建立的两种模型中R2分别为0.11和0.32均小于0.7, 与建模效果保持一致, RPD分别为0.57和0.66都小于1.4, 说明这两种模型稳定性和预测能力都较低, 不能对春小麦LWC进行估算, 这可能是由于测光谱时受外界因素, 如风、 土壤背景等的干扰引起的; 基于光谱一阶导数建立的PLSR和BP神经网络模型R2分别为0.80和0.81, 说明两种模型的稳定性都较好, 而且稳定性基本相同; 两种模型RMSE都是0.55, RPD分别为2.01和1.41, 说明PLSR模型的预测精度比BP神经网络模型高。 从模型的验证效果来看, PLSR模型效果相比BP神经网络好。 因此, 可以利用PLSR模型对春小麦LWC进行估算。 图4可以看出, 基于原始光谱的数据点与一阶导数相比分布较为离散, 且大部分在1∶ 1直线上方, 说明预测值大于实测值, 对春小麦叶片含水量出现高估。

表3 建模结果比较 Table 3 Comparison of modeling results

图4 PLSR和BP神经网络模型对实测值与预测值间的拟合分析结果
(a): 基于原始光谱建立的PLSR模型; (b): 基于原始光谱建立的BP神经网络模型; (c): 基于光谱一阶导数建立的PLSR模型; (d): 基于光谱一阶导数建立的BP神经网络模型
Fig.4 Fitting analysis results between measured values and predicted values by PLSR and BP neural network models
(a): PLSR model based on original spectral reflectnace; (b): BP neural network model based on original spectral reflectance; (c): PLSR model based on FD spectral reflectance; (d): BP neural network model based on FD spectral reflectnace

3 结 论

以春小麦为研究对象, 利用野外原始光谱数据、 光谱一阶导数据以及55个样本春小麦叶片含水量数据, 建立估算春小麦叶片含水量的PLSR和BP神经网络模型, 得出结论如下:

(1)光谱一阶导数起到了对原始光谱数据的去噪、 突出光谱信息的作用, 尤其是在750~830, 1 000~1 060, 2 056~2 155 nm等区间明显提高了与LWC的相关性。

(2)根据灰色关联度分析发现: 基于原始光谱建立的与LWC灰色关联度较稳定的前5个水分植被指数有FWBI, WI, WBI, SRWI1和SRWI2, 都是两波段比值植被指数, 基于光谱一阶导数建立的水分植被指数有NDVI, NDWI, NDII, FWBI和NDMI, 基本上都是两波段归一化差值植被指数。

(3)基于光谱一阶导数建立的PLSR和BP神经网络模型R2分别为0.80和0.81, 说明两种模型的稳定性都较好, 而且稳定性基本相同; 两种模型RMSE都是0.55, RPD分别为2.01和1.41, 说明PLSR模型的预测精度比BP神经网络模型高。 从模型的验证效果来看, PLSR模型效果相比BP神经网络好。

(4)春小麦由于存在地域性差异, 受到气候、 叶片大小、 形状、 生长期等因素的影响, 在不同地区表现出不同的高光谱特征。 因此, 在春小麦叶片含水量敏感指数参数的选择需要考虑多方面的因素。 本研究由于数据采集的局限性, 只对春小麦抽穗期进行研究, 今后有待进一步进行对春小麦不同生长阶段叶片含水量的研究。

The authors have declared that no competing interests exist.

参考文献
[1] Rodríguez-Pérez J R, Ord ez C, Gonz lez-Fem ndez A B, et al. Biosystems Engineering, 2018, 165: 36. [本文引用:1]
[2] Fang M, Ju W, Zhan W, et al. Remote Sensing of Environment, 2017, 196: 13. [本文引用:1]
[3] LIN Yi, LI Qian, WANG Hong-bo, et al(林毅, 李倩, 王宏博, ). Chinese Agricultural Science Bulletin(中国农学通报), 2015, 31(3): 167. [本文引用:1]
[4] LIANG Liang, ZHANG Lian-peng, LIN Hui, et al(梁亮, 张连蓬, 林卉, ). Scientia Agricultura Sinica(中国农业科学), 2013, 46(1): 18. [本文引用:1]
[5] DENG Bing, YANG Wu-nian, MU Nan, et al(邓兵, 杨武年, 慕楠, ). Spectroscopy and Spectral Analysis(光谱学与光谱分析), 2016, 36(8): 2546. [本文引用:2]
[6] Cheng Tao, Rivard B, Sánchez-Azofeifa A. Remote Sensing of Environment, 2011, 115(2): 659. [本文引用:1]
[7] LIU Xiao-jun, TIAN Yong-chao, YAO Xia, et al(刘小军, 田永超, 姚霞, ). Scientia Agricultura Sinica(中国农业科学), 2012, 45(3): 435. [本文引用:1]
[8] ZHU Xi-cun, JIANG Yuan-mao, ZHAO Geng-xing, et al(朱西存, 姜远茂, 赵庚星, ). Chinese Agricultural Science Bulletin(中国农学通报), 2014, 30(4): 120. [本文引用:1]
[9] CHENG Xiao-juan, YANG Gui-jun, XU Xin-gang, et al(程晓娟, 杨贵军, 徐新刚, ). Journal of Triticeae Crops(麦类作物学报), 2014, 34(2): 227. [本文引用:1]
[10] WU Ling, LIU Xiang-nan, ZHOU Bo-tian, et al(吴伶, 刘湘南, 周博天, ). Chinese Journal of Applied Ecology(应用生态学报), 2012, 23(12): 3250. [本文引用:1]
[11] HU Zhen-zhu, PAN Cun-de, PAN Xin, et al(胡珍珠, 潘存德, 潘鑫, ). Scientia Silvae Sinicae(林业科学), 2016, 52(12): 39. [本文引用:1]
[12] Yi Q X, WANG F M, Bao A M, et al. Int. J. Appl. Earth Obs Geoinformations, 2014, 33: 67. [本文引用:1]
[13] Vstin S L, Roberts D A, Gardner M, et al. Proc IEEE Conference on Gioscience and Remote Sensing Symposium, 2002, 2: 796. [本文引用:1]
[14] Wang L L, Hunt Jr E R, Qu J J, et al. Romote Sensing of Environment, 2011, 115(3): 836. [本文引用:1]