基于高斯回归分析的水稻氮素敏感波段筛选及含量估算
王娇娇1,2, 宋晓宇1,*, 梅新2, 杨贵军1,*, 李振海1, 李贺丽1, 孟炀1
1.农业部农业遥感机理与定量遥感重点实验室, 北京农业信息技术研究中心, 北京 100097
2.湖北大学资源环境学院, 湖北 武汉 430062
*通讯作者 e-mail: songxy@nercita.org.cn; yanggj@nercita.org.cn

作者简介: 王娇娇, 1997年生, 湖北大学资源环境学院硕士研究生 e-mail: wangjj@stu.hubu.edu.cn

摘要

水稻氮素含量的准确监测是稻田精准施肥的重要环节, 水稻叶片氮素含量发生变化会引起叶片、 冠层的光谱发射率发生变化, 高光谱遥感是目前作物氮素无损监测的关键技术之一。 以2018年—2019年湖北监利两年水稻氮肥试验为基础, 分别获取水稻分蘖期、 拔节期、 孕穗期、 扬花期、 灌浆期五个生育期水稻叶片和冠层两个尺度的高光谱反射率数据及对应的叶片氮素含量数据, 利用单波段原始光谱和一阶导数光谱的相关性分析、 高斯过程回归(GPR)等方法筛选水稻全生育期叶片及冠层尺度氮素敏感波段。 针对敏感波段, 利用单波段回归分析、 随机森林(RF)、 支持向量回归(SVR)、 高斯过程回归-随机森林(GPR-RF)、 高斯过程回归-支持向量回归(GPR-SVR)和GPR构建水稻氮素监测模型, 并进行精度对比, 以确定水稻叶片在各生育期的氮素估算最佳模型。 结果表明: GPR筛选的敏感波段符合水稻氮素含量及光谱变化的规律。 相同条件下, 叶片模型精度整体高于冠层模型。 相关性分析模型中, 叶片尺度原始光谱模型更好, 冠层尺度刚好相反, 冠层一阶导数光谱可以减弱稻田背景噪声的影响。 其中, 叶片最佳模型建模集 R2为0.79, 验证集 R2为0.84; 冠层最佳模型建模集 R2为0.80, 验证集 R2为0.77。 与相关性回归分析模型相比, 机器学习模型受生育期影响小( R2>0.80, NRMSE<10%)。 其中, RF比SVR更适合对GPR敏感波段建模, GPR-RF模型可以用1.5%左右的波段达到RF模型使用全部波段的精度。 五种方法中, GPR模型对生育期敏感度最低、 叶片及冠层尺度效果都很好( R2>0.94, NRMSE<6%)。 且与其他四种机器学习方法相比, GPR模型可有效提高冠层氮素含量估算的精度和稳定性( R2增加0.02, NRMSE降低1.2%)。 GPR方法可为筛选作物氮素高光谱敏感波段、 反演各生育期叶片及冠层氮素含量提供方法参考。

关键词: 敏感波段; 氮素; 高斯过程回归; 随机森林; 支持向量回归; 高光谱
中图分类号:TP79 文献标志码:A
Sensitive Bands Selection and Nitrogen Content Monitoring of Rice Based on Gaussian Regression Analysis
WANG Jiao-jiao1,2, SONG Xiao-yu1,*, MEI Xin2, YANG Gui-jun1,*, LI Zhen-hai1, LI He-li1, MENG Yang1
1. Key Laboratory of Quantitative Remote Sensing in Agriculture of Ministry of Agriculture, Beijing Research Center for Information Technology in Agriculture, Beijing 100097, China
2. Faculty of Resources and Environmental Sciences, Hubei University, Wuhan 430062, China
*Corresponding authors
Abstract

Accurate detection of rice nitrogen content is an important aspect of precision fertilization in rice fields. Nitrogen content variation of rice leaves will cause changes in emissivity of leaves and canopy. Hyperspectral remote sensing is one of the key technologies for non-destructive monitoring of crop nitrogen. This study focuses on the study of nitrogen content monitoring and the sensitive band’s selection through machine learning methods based on 2-year rice nitrogen fertilization experiments carried out in Jianli Hubei during 2018—2019. Hyperspectral reflectance spectral data at the leaf and canopy level and the corresponding leaf nitrogen content data were collected at rice tillering, jointing, booting, flowering and filling stage, respectively. Correlation analysis and Gaussian process regression (GPR) were used to select nitrogen sensitive bands for raw spectra and first-order derivative reflectance (FDR) spectra in rice leaves and canopy level. The nitrogen content estimation models were then constructed through single-band regression analysis, Random Forest (RF) and Support Vector Regression (SVR) method for rice raw spectra data. The Gaussian Process Regression-Random Forest (GPR-RF), Gaussian Process Regression- Support Vector Regression (GPR-SVR), and GPR method were also used to construct the nitrogen estimation model for the nitrogen-sensitive selection bands. The results showed that the GPR method’s sensitive bands were consistent with variation rule of the nitrogen content and spectral changes in rice. The leaf-level model’s over all accuracy was higher than that of the canopy-level model under the same conditions while using FDR spectra was more accurate at canopy level for it could attenuate the effect of background noise in the rice field. R2 of calibration datasets and validation sets are 0.79 and 0.84 at the leaf level, while 0.80 and 0.77 at canopy level. Compared with the correlation regression model, the machine learning methods were less affected by rice growth stages ( R2>0.80, NRMSE<10%). RF was more suitable than SVR for modeling GPR-selection nitrogen sensitive bands, and the GPR-RF model can use about 1.5% of the bands to reach the accuracy of the RF model using all the bands. The GPR model works well on nitrogen estimation through nitrogen -sensitive bands at leaf and canopy level, not only for the full-growth stage but also for the single-growth stage( R2>0.94, NRMSE<6%). Besides, compared with the other four machine learning methods, the GPR model can improve the accuracy and stability of the estimation of nitrogen content at the canopy level that R2 increased by 0.02 and NRMSE decreased by 1.2%. GPR method provides a methodological reference for selecting crop nitrogen hyper-spectrally sensitive bands and inversion of the nitrogen content of leaves and canopy level during rice different growth period.

Keyword: Sensitive band; Nitrogen; Gaussian progresses regression (GPR); Random forest (RF); Support vector regression (SVR); Hyperspectral
引言

氮素是水稻生长发育过程中的关键元素, 快速、 准确的氮素含量监测是水稻调优栽培的重要基础[1]。 高光谱遥感因其大量的连续窄波段, 使得分辨地物的细微差异成为可能[2], 是无损监测作物生物理化参量的关键技术之一[3], 在监测作物氮含量方面已有广泛应用[4]

叶片光谱在光源稳定情况下, 噪声少且稳定, 已有许多研究表明利用叶片光谱可有效估测作物氮素营养状况。 王人潮等[5, 6]提出诊断水稻氮素营养水平的叶片光谱敏感波段为760~900, 630~660和530~560 nm。 冯帅[7]等利用UVE和CARS法筛选东北粳稻不同时期的敏感波段, 并选择DSI, RSI, NDSI三种指数输入SaDE-ELM, RBF-NN和PSO-BPNN三种机器学习模型, 最终SaDE-ELM模型预测冠层叶片氮素含量的R2高于0.81, NRMSE小于0.4。 相比叶片尺度的作物氮素监测, 冠层可以反映作物群体的氮素状况, 但是影响植株冠层的因素较多, 研究表明冠层尺度氮素反演波段集中分布在400~900 nm波段范围内, 只有少部分波段零散分布于950~1 200和2 100 nm附近。 Feng等[8]比较发现REIPle和mND705是监测小麦冠层叶片氮含量的最佳植被指数。

上述利用高光谱技术分析作物氮素含量的方法大多通过统计回归建立叶片氮素与不同波段、 不同指数及特征参数之间的相关关系。 近年来, 机器学习日益成为各研究领域备受关注的焦点, 其中, 随机森林(random forest, RF)[9]和支持向量回归[10](support vector regression, SVR)在作物参量估算方面的研究日益增多。 高斯过程回归(Gaussian process regression, GPR)因其结构简单、 参数少、 能较好地处理非线性问题等优点[11, 12], 近年来成为处理作物养分含量估算最高效的机器学习算法之一[13]

本研究通过设计氮胁迫试验, 并在水稻分蘖期至灌浆期获取叶片氮素数据及冠层、 叶片两种尺度的高光谱数据。 对光谱数据分生育期和观测尺度进行分析, 以原始光谱和一阶光谱导数相关性分析方法作为对比和参考, 使用GPR筛选敏感波段, 并用RF, SVR和GPR做更精确的分析与建模, 确定对水稻叶片氮素最敏感的波段及更加精确的氮素反演模型, 为高光谱遥感在高效、 准确地监测水稻叶片氮素含量提供方法依据。

1 实验部分
1.1 试验设计

试验地点位于湖北监利, 于2018年7月— 10月、 2019年5月— 2019年8月进行试验, 2018年水稻品种为泰优398, 2019年为泰两优华占。 本工作主要研究氮素营养水平对水稻叶片及冠层光谱反射特征变异机理, 探索水稻叶片及冠层光谱的氮素敏感性响应特征, 故设计了四个氮素施用水平试验。 其中2018年的氮素水平分别为0(N0)、 25 kg· hm-2(N1), 49.5 kg· hm-2(N2), 75 kg· hm-2(N3), 2019年为0(N0), 50 kg· hm-2(N1), 99 kg· hm-2(N2), 150 kg· hm-2(N3)。 N3水平为常规施氮水平, 由于2018年为虾稻田、 底肥多, 因此均设置为2019年氮素水平的一半。 试验采用随机区分设计, 每种处理重复三次, 共12个小区, 每个小区面积约为300 m2。 田间光谱采样在水稻分蘖期、 拔节期、 孕穗期、 扬花期、 灌浆期五个生育期进行, 具体采样日期如表1所示。

表1 田间采集日期及水稻对应的生育期 Table 1 Field collection date and growth stage of rice
1.2 光谱测定与预处理

冠层高光谱使用美国ASD FiledSpec Pro2500背挂式野外光谱仪进行采集。 此仪器采集的光谱范围为350~2 500 nm, 其中, 350~1 000 nm范围内采样间隔为1.4 nm, 重采样后间隔为1 nm; 1 000~2 500 nm范围内采样间隔为2 nm。 测量选择晴朗无云无风天气, 时间为当日10:00— 14:00, 每一重复测量前进行光谱标准白板校正。 光谱测量过程中, 探头垂直向下, 距离冠层高度约1 m, 探头角度为25° , 每个数据点重复测量10条数据。

叶片高光谱使用ASD FieldSpec 3光谱仪测量展叶的活体叶片光谱。 测量时, 传感器固定在支架上、 探头垂直向下, 与叶片距离约0.1 m。 不同小区的水稻植株选择两个主茎自上而下三张完全展开的叶片, 将叶片平铺在盖有黑垫的平台上, 分别测定光谱。

使用View Spec Pro软件将光谱仪测定的数据转换为原始光谱反射率数据, 并Excel 2019将重复测量的数据取均值作为测量点的反射光谱值。 由于冠层光谱在大于1 350 nm的波段会受到水汽影响出现异常值, 因此只选择高光谱的前1 000个波段(350~1 349 nm)分析处理。

1.3 氮素测定

冠层光谱测试完毕后, 采集测试范围内植株样本10株, 茎叶分离, 放入105 ℃烘箱杀青30 min, 并在80 ℃下干燥至恒重, 粉碎, 使用用凯氏定氮仪测量叶片的氮含量。 计算式见式(1)

N=(V×0.05×14×1000)/(1000×M)(1)

式(1)中, N为叶片氮含量(%), V为盐酸体积(mL), M为样品质量(g)。

1.4 数据分析方法

GPR是Rasmussen和Williams[12]在2005年提出, 作为一种概率方法, 训练GPR模型以通过拟合均值和协方差函数来找到所有训练数据的单独函数, 与其他机器学习方法相比, 最大的优势是适合训练小样本模型。 RF是一种集成的分类器, RF预测性能好、 鲁棒性强且在处理大量输入变量问题中优势明显[14]。 SVR是由支持向量机[15](support vector machine, SVM)演化而来, 其基本原理是通过建立一个最优决策超平面, 使其距样本之间距离最小化, 从而拟合样本数据。

表1中获取的全部数据合并为全生育期光谱数据及氮素数据, 通过相关性分析和GPR筛选水稻叶冠尺度全生育期敏感波段, 其中相关性分析法筛选原始光谱与一阶导数光谱的最敏感波段, GPR只针对原始光谱进行筛选, 以其相关系数(correlation coefficient, r)进行比较。 对相关性分析筛选的敏感波段建立单波段线性回归模型, 利用RF, SVR, GPR对GPR筛选敏感波段建模, 并与RF, SVR建立的全波段模型进行精度对比, 并选择氮素估算最优模型。

在构建氮素线性回归估算模型时, 随机选取136个建模样本, 剩余的68个样本设置为验证集样本。 在RF, SVR和GPR三种方法建模时, 选择k-fold交叉验证法分组建模, 即给定一组数据和k值, 该数据集将会被随机分为k组数据量相等的子数据集, 设置k-fold为10。 对交叉验证法所建立的模型, 使用决定系数(R2)和归一化均方根差(normalized root mean square error, NRMSE)两个指标检验模型的精度。 其中, R2用于评价模型拟合度, R2大于0.85时模型拟合度较好; NRMSE用于评价模型稳定性, NRMSE小于10%稳定性很好, 10%~20%之间稳定性好, 20%~30%稳定性一般, 大于30%稳定性差。

2 结果与讨论
2.1 氮素敏感波段筛选

2.1.1 原始光谱与一阶导数光谱与氮素相关性分析

图1为水稻叶冠尺度全生育期原始光谱、 一阶导数光谱与氮素含量及单生育期原始光谱与氮素含量相关性。

图1 水稻叶片氮素含量与原始光谱及一阶导数 光谱反射率的相关性Fig.1 The correlation between nitrogen content and reflectance of original spectra and first derivative spectra

图1(a)和(b)为全生育期原始光谱(R)、 一阶光谱(FDR)与氮素相关性对比, 结果显示, 在叶片尺度上: 氮素与叶片原始光谱在350~1 350 nm范围内始终呈负相关, 且当波长大于426 nm时, 相关性显著(|R|> 0.6), 最大相关系数波长为720 nm(r=-0.89); 一阶光谱在489~513和532~556 nm附近呈现显著负相关, 最大相关系数波长为681 nm(r=-0.85)。 在冠层尺度上, 氮素与冠层原始光谱在350~519 nm范围呈正相关, 在520~1 349 nm范围呈负相关, 且在350~405和722~1 350 nm附近相关性显著, 最大相关系数波长为733 nm(r=-0.78); 一阶光谱在778~887, 1 144~1 194和1 307~1 342 nm附近相关性显著, 最大相关系数波长为851 nm(r=-0.88)。 结果表明: 在叶片尺度, 原始光谱的氮素敏感波段位于可见光和近红外区域, 一阶导数光谱的氮素敏感波段主要位于可见光和红边区域; 在冠层尺度, 原始光谱的氮素敏感波段位于红边和近红外区域, 而一阶导数光谱的氮素敏感波段主要位于近红外区域。

图1(c)和(d)为单生育期氮素含量与原始光谱的相关性, 结果显示, 在叶片尺度上, 分蘖期在所研究的光谱范围相关性整体高于拔节期的相关性。 可见光范围内, 从拔节期开始相关性系数随生育期的推进依次增加; 近红外范围内, 以孕穗期为节点, 相关性系数整体先增后降。 在冠层尺度上, 分蘖期与可见光范围的后四个生育期的相关性变化规律与叶片尺度相同; 近红外范围, 孕穗期相对拔节期相关性系数有所增加, 扬花期与灌浆期的相关性系数增加, 但是相关性曲线出现两个高峰和两个低谷, 与绿色植被在对应波段的反射率曲线相似。 结果表明, 拔节期在可见光和近红外范围内的相关性系数均为最小。 拔节期后随水稻生长, 可见光范围, 叶片和氮素两尺度相关性逐渐降低; 近红外范围内, 叶片光谱相关性先增后减, 在孕穗期达到最高, 冠层光谱相关性持续增加, 且在扬花期和灌浆期的水汽吸收波段出现波动。

基于以上分析, 筛选了水稻叶片及冠层尺度各生育期及全生育相关性最强的波段, 结果如表2所示。

表2 全生育期相关性系数最大波段及对应 相关性系数r(n=204) Table 2 The maximum correlation coefficients of the whole growth period and the corresponding bands (n=204)

2.1.2 基于高斯回归分析的氮素敏感波段筛选

将全生育期的光谱数据按照蓝(350~499 nm)、 绿(500~599 nm)、 红(600~679 nm)、 红边(680~759 nm)和近红外(760~1 349 nm)分为五个组, 使用GPR筛选每组光谱中的氮素敏感波段, 采用GPR-BAT(Gaussian processes regression-band analysis tool)[16]进行敏感波段分析, 通过迭代法依次去除对模型贡献最小的波段, 直到输入数据集中只剩下最后一个波段。 研究选取相关系数最高的波段组合作为水稻叶片及冠层尺度氮素最优敏感波段组合, 所得敏感波段及r表3

表3 GPR方法筛选的敏感波段(n=204) Table 3 Sensitive bands selected by GPR (n=204)

表3可知, 蓝光、 绿光、 705 nm附近的红边和小于1 200 nm的近红外部分, 冠层与叶片尺度筛选的敏感波段基本一致。 可见光部分的敏感波段与叶绿素吸收红蓝光、 反射绿光有关; 随氮素水平的提高, 水稻反射率在红边与近红外部分反射率增加, 主要是由于地上生物量和叶绿素含量的增加。 在650, 750和1 200~1 300 nm附近叶冠尺度的敏感波段不同, 冠层光谱变化会受到叶苗积指数、 冠层整体叶绿素含量影响, 并且室外冠层光谱会受到水汽影响, 在水稻生育前期还有土壤、 水体等背景噪声。 但是无论是叶片还是冠层, 两种方法所得氮素敏感波段与红边、 近红外波段均有较大的相关性, 与前人研究结果一致[6]

2.2 氮素含量模型构建与分析

2.2.1 基于相关性回归方法的氮素监测模型

表2中所得水稻全生育期叶片及冠层敏感波段与对应氮素含量数据进行建模分析, 分别利用线性、 对数、 二次曲线、 幂函数、 指数函数五种回归方法建模。 模型结果及精度见表4, 其中y为模拟的氮素含量(下同)、 x为对应敏感波段的光谱反射率。

表4 单波段氮素反演模型及精度 Table 4 Nitrogen inversion model built by correlation analysis and model accuracy

表4可以看出, 针对叶片模型, 原始光谱模型精度整体高于一阶导数光谱模型, 由红边波段720 nm构建的二次曲线模型精度最高, 其建模精度R2达到0.79, 验证模型精度R2达到0.84; 冠层的最优模型则由一阶导数参数构建, 由于数据范围问题, 一阶导数模型中没有对数函数和幂函数, 线性模型和二次模型精度最高, 建模R2达到0.80, 验证模型精度R2达到0.77。

表4中的模型对剩余68个验证样本进行估算, 结果如图2、 图3所示。 图2中, 幂函数和指数函数对分蘖期的氮素估算, 部分点存在较大误差, 整体而言, 原始光谱模型的预测效果更好, 散点均匀大多均匀分布在0误差线附近。 图3中, 原始光谱模型对于分蘖期、 扬花期、 灌浆期的预测效果较差, 一阶导数模型有效改善了这三个生育期的精度, 尤其是分蘖期。 冠层光谱为田间实测数据, 会受到外界环境以及土壤、 水体等背景噪声的影响, 而一阶光谱可以减弱部分影响, 从而提高模型预测精度。

图2 叶片尺度相关性分析模型氮素预测值与实际值对比(n=68)
原始光谱模型: (a): 线性; (b): 对数; (c): 二次; (d): 幂函数; (e): 指数函数一阶导数光谱模型: (f): 线性; (g): 对数; (h): 二次; (i): 幂函数; (j): 指数函数
Fig.2 Comparison of nitrogen content between predicted by correlation analysis model at leaf level and measured values
R: (a): Linear; (b): Logarithm; (c): Polynomial; (d): Power; (e): Exponential FDR: (f): Linear; (g): Logarithm; (h): Polynomial; (i): Power; (j): Exponential

图3 冠层尺度相关性分析模型氮素预测值与实际值对比(n=68)
原始光谱模型: (a): 线性; (b): 对数; (c): 二次; (d): 幂函数; (e): 指数函数一阶导数光谱模型: (f): 线性; (g): 二次; (h): 指数函数
Fig.3 Comparison of nitrogen content between predicted by correlation analysis model at canopy level and measured values
R: (a): Linear; (b): Logarithm; (c): Polynomial; (d): Power; (e): Exponential FDR: (f): Linear; (g): Polynomial; (h): Exponential

对比图1(c)、 (d)和表2, 单生育期与全生育期相关性最大波长相差大, 全生育期最敏感波段不能代表各单生育期, 直接导致部分生育期存在较大预测误差。

2.2.2 基于机器学习方法的氮素监测模型

使用RF和SVR建立全波段氮素回归模型, 并用RF, SVR和GPR建立关于表3中敏感波段的氮素回归模型, 后三种模型方法用GPR-RF, GPR-SVR和GPR表示, 五种方法的建模精度见表5。 其中, GPR的最佳模型选用了表3中的部分波段, 叶片模型使用到的波段包括354, 563, 710和1 157 nm, 冠层模型用到的波段包括354, 456, 706, 733, 759, 850和1 112 nm。

表5 RF, SVR, GPR-RF和GPR-SVR四种方法全生育期建模精度对比 Table 5 Model accuracy comparison of different methods

表5可知, 五种方法建立的氮素估算模型在冠层和叶片尺度的精度很高, 且叶片精度整体高于冠层精度。 相同数据集的情况下, RF模型精度优于SVR。 利用GPR筛选的敏感波段模型与全波段模型相比, GPR-RF与GPR-SVR精度变化不大(R2降低0.1以内, NRMSE增加2%以内)。 相比于上述四种方法, GPR方法建模使用了更少的波段, 成为五种模型中精度最高、 最稳定的模型。

图3、 图4为RF, SVR, GPR-RF, GPR-SVR和GPR五种机器学习模型预测所有数据的精度对比图。

图4 叶片尺度各种方法精度对比(n=204)Fig.4 Model accuracies at leaf level(n=204)

由图4可知, 对比图4(a)与(b)、 (d)与(e), 与RF, GPR-RF模型相比, SVR, GPR-SVR模型各生育期的点分布都更离散, 且NRMSE更大。 对比图4(a)与(d), RF与GPR-RF整体精度差异不大, 且在分蘖期和拔节期部分氮素含量被低估。 对比图4(b)与(e), SVR与GPR-SVR在分蘖期和灌浆期的氮素估算效果较差, 其他生育期散点分布都较为均匀, 相比于SVR模型, GPR-SVR模型的稳定性有所下降, 在分蘖期有所体现。 图4(c)中GPR模型估算与RF模型基本相同, 但在孕穗期的估算效果更好。

由图5可知, 冠层尺度的模型与叶片尺度模型相同, RF与GPR-RF模型精度基本相同, GPR-SVR模型精度、 稳定性低于SVR模型, 并且RF, SVR, GPR-RF和GPR-SVR四种方法在各生育期均有少量离群点, RF和GPR-RF模型在灌浆期有少量离散点, 而SVR和GPR-SVR模型在拔节期部分点离散更明显。 GPR模型相比前四种模型, 孕穗期、 灌浆期的散点大多分布在0误差线上, 全生育期的R2与RF模型相比提高了0.02, NRMSE降低了1.2%, 模型精度和稳定性都有所提高。

图5 冠层尺度各种方法精度对比(n=204)Fig.5 Model accuracies at canopy level(n=204)

对GPR筛选后的敏感波段建模, RF方法精度变化不明显、 SVR方法精度、 稳定性略有下降。 在叶片尺度, RF, GPR-RF和GPR模型的效果都很好, 而在冠层尺度, GPR模型明显优于其他模型, 且受生育期影响很小。 对比图4和图5, 无论是叶片尺度还是冠层尺度, SVR和GPR-SVR模型监测效果最差, RF, GPR-RF与GPR监测效果都很好。 相比于RF, GPR-RF和GPR仅使用了1%~2%的光谱波段, 就可以达到很好的监测效果, 说明GPR所筛选的敏感波段与氮素含量有很高的相关性, 并且GPR模型对冠层尺度氮素估算的效果提升明显。

3 结论

通过设计不同氮肥水平, 并在不同生育期获取水稻叶冠层光谱及叶片氮含量数据, 较为全面地分析使用GPR筛选的氮素敏感波段、 建立氮素估算模型的可行性, 结合RF和SVR选择最佳氮素估算模型, 并与相关性分析最佳波段的单变量模型进行对比。 实验结果表明无论是叶片尺度还是冠层尺度, 单波段相关性分析模型的精度均低于机器学习模型, 这说明单变量模型无法满足水稻氮素监测的要求, 机器学习模型更适合氮素估算。 五种机器学习模型相比, RF, GPR-RF, SVR和GPR-SVR四种模型在分蘖期和拔节期的稳定性都较低, 这与水稻迅速生长、 光谱及氮素不稳定有密切关系。 相比之下, GPR模型所用波段量少、 精度高, 且基本不受到生育期的影响。 由于水稻氮素含量变化在各生育期均符合高斯分布, 高斯过程的边缘化和条件化使得模型所得结果依然符合高斯分布[12], 靠近均值的点概率更高, 而受噪声或快速生长影响的数据所得概率更小, 减弱了模型的不稳定性, 模型在各生育期均能达到很好的氮素监测精度。

研究结果表明:

(1)相关性分析模型中, 叶片氮素监测模型精度高于冠层氮素监测模型, 叶片模型使用原始光谱精度更高, 而冠层模型使用一阶导数光谱可有效降低背景噪声的影响, 提高氮素监测精度。

(2)对比相关性分析模型和五种机器学习模型, 基于GPR方法构建的氮素监测模型在水稻叶片及冠层两个尺度上的监测效果最好(R2> 0.94, NRMSE< 6%)。

(3)相比于SVR, RF更适合对GPR方法所筛选的敏感波段建模; 五种机器学习模型中, GPR模型精度最高、 受生育期影响最小、 冠层模型精度提高, 且所用波段最少, 模型更稳定。

参考文献
[1] YANG Fu-qin, DAI Hua-yang, FENG Hai-kuan, et al(杨福芹, 戴华阳, 冯海宽, ). Transactions of the Chinese Society of Agricultural Engineering(农业工程学报), 2016, 32(23): 161. [本文引用:1]
[2] TONG Qing-xi, ZHANG Bing, ZHENG Lan-fen(童庆禧, 张兵, 郑兰芬). Hyperspectral Remote Sensing: Principles, Techniques, and Applications(高光谱遥感: 原理技术与应用), Beijing: Higher Education Press(北京: 高等教育出版社), 2006. 38. [本文引用:1]
[3] Berger K, Verrelst J, Jean-Baptiste Féret, et al. Remote Sensing of Environment, 2020, 242(1): 111758. [本文引用:1]
[4] LI Lan-tao, WANG Shan-qin, REN Tao, et al(李岚涛, 汪善勤, 任涛, ). Transactions of the Chinese Society of Agricultural Engineering(农业工程学报), 2016, 32(14): 209. [本文引用:1]
[5] WANG Ren-chao, CHEN Ming-zhen, JIANG Heng-xian(王人潮, 陈铭臻, 蒋亨显). Journal of Zhejiang University·Agriculture and Life Sciences(浙江农业大学学报), 1993, 19(Supp-1): 7. [本文引用:1]
[6] ZHOU Qi-fa, WANG Ren-chao(周启发, 王人潮). Journal of Zhejiang University·Agriculture and Life Sciences(浙江农业大学学报), 1993, 19(Supp-1): 40. [本文引用:2]
[7] FENG Shuai, XU Tong-yu, YU Feng-hua, et al(冯帅, 许童羽, 于丰华, ). Spectroscopy and Spectral Analysis(光谱学与光谱分析), 2019, 39(10): 3281. [本文引用:1]
[8] Feng W, Yao X, Zhu Y, Tian Y C, Cao W X. European Journal of Agronomy, 2008, 28(3): 394. [本文引用:1]
[9] YUE Ji-bo, YANG Gui-jun, FENG Hai-kuan(岳继博, 杨贵军, 冯海宽). Transactions of the Chinese Society of Agricultural Engineering(农业工程学报), 2016, 32(18): 175. [本文引用:1]
[10] Smola A J, Schlkopf B. Statistics and Computing, 2004, 14(3): 199. [本文引用:1]
[11] Jochem V, Malenovsky Zbyněk, Christiaan V D T, et al. Surveys in Geophysics, 2018. 1. [本文引用:1]
[12] Rasmussen C E, Williams C K I. Gaussian Processes for Machine Learning. The MIT Press. New York, 2006. 7. [本文引用:3]
[13] Camps-Valls G, Verrelst J, Munoz-Mari J, et al. IEEE Geoence and Remote Sensing Magazine, 2016, 4(2): 58. [本文引用:1]
[14] Breiman L. Machine Learning, 2001 45: 5. [本文引用:1]
[15] Vapnik N. Statistical Learning Theory. New York, NY: Wiley, 1998. 401. [本文引用:1]
[16] Verrelst J, Rivera J P, Gitelson A, et al. International Journal of Applied Earth Observation and Geoinformation, 2016, 52: 554. [本文引用:1]