高光谱成像的土壤剖面水分含量反演及制图
吴士文1,2, 王昌昆1, 刘娅3, 李燕丽4, 刘杰1,2, 徐爱爱1,2, 潘恺1,2, 李怡春1,2, 张芳芳1,2, 潘贤章1,*
1. 土壤与农业可持续发展国家重点实验室, 中国科学院南京土壤研究所, 江苏 南京 210008
2. 中国科学院大学, 北京 100049;x3. 金陵科技学院, 江苏 南京 211169
4. 长江大学农学院, 湖北 荆州 434025
*通讯联系人 e-mail: panxz@issas.ac.cn

作者简介: 吴士文, 1987年生, 中国科学院大学博士研究生 e-mail: 1987wushiwen@163.com

摘要

传统土壤水分的获取方法仅可获得离散的土壤水分点位数据, 难以获得剖面上精细且连续的水分含量分布图。 研究了野外条件下利用近红外高光谱(882~1 709 nm)成像反演剖面土壤水分含量(SMC), 并实现精细制图的可行性。 研究剖面位于江苏省东台市, 我们利用近红外高光谱成像仪对剖面进行了5天原位连续观测, 共采集了280个土样用于烘干法测定SMC。 原始高光谱图像经数字量化值(DN)校正、 黑白校正、 拼接、 几何校正、 剪切和掩膜等一系列预处理后, 提取各采样点的平均光谱反射率。 提取光谱(Raw)经吸光度[LOG10(1/ R)], Savitzky-Golay平滑(SG)、 一阶微分(FD)、 二阶微分(SD)、 多元散射校正(MSC)和标准正态变量(SNV)转换后, 采用偏最小二乘回归(PLSR)和最小二乘支持向量机(LS-SVM)方法建立SMC预测模型, 并对比分析不同光谱预处理方法与建模方法组合条件下SMC的预测精度。 结果表明, 光谱反射率随SMC增加逐渐降低, 不同光谱预处理方法的预测精度有所差异, 除MSC方法外, 同一光谱预处理方法的LS-SVM模型预测精度均高于PLSR模型, 并且基于LOG10(1/ R)光谱的LS-SVM模型对SMC预测精度最高, 其建模集的决定系数(Rc2)和均方根误差(RMSEc)分别为0.96和0.65%, 预测集的决定系数(Rp2)、 均方根误差(RMSEp)和相对分析误差(RPDp)分别为0.88, 1.05%和2.88。 利用最优模型进行剖面SMC的高空间分辨率精细制图, 通过比较SMC反演图中提取的预测值与实测值关系发现预测精度较高( R2: 0.85~0.95, RMSE: 0.94%~1.02%), 且两者在剖面中的变化趋势基本一致, 说明SMC反演图不仅能很好地反映出土壤水分在整个剖面中毫米级的含量分布信息, 也可反映出同一位置处不同天数间的含量差异。 因此, 利用近红外高光谱成像结合优化的预测模型, 能够实现土壤剖面SMC的定量预测及精细制图, 有助于快速、 有效监测田间剖面土壤水分状况。

关键词: 剖面; 土壤含水量; 高光谱成像; 偏最小二乘回归; 最小二乘支持向量机; 制图
中图分类号:TP79
Inversion and Mapping of the Moisture Content in Soil Profiles Based on Hyperspectral Imaging Technology
WU Shi-wen1,2, WANG Chang-kun1, LIU Ya3, LI Yan-li4, LIU Jie1,2, XU Ai-ai1,2, PAN Kai1,2, LI Yi-chun1,2, ZHANG Fang-fang1,2, PAN Xian-zhang1,*
1. State Key Laboratory of Soil and Sustainable Agriculture, Institute of Soil Science, Chinese Academy of Sciences, Nanjing 210008, China
2. University of Chinese Academy of Sciences, Beijing 100049, China
3. Jinling Institute of Technology, Nanjing 211169, China
4. Agricultural College, Yangtze University, Jingzhou 434025, China
*Corresponding author
Abstract

Traditional methods for acquiring soil moisture can only provide discrete point data, which arenot so appropriate for finely and continuously mapping soil moisture distribution in soil profile. In this paper, the feasibility of predicting and mapping ofsoil moisture content (SMC) in soil profile was studied using near-infrared hyperspectral imaging in the spectral range of 882~1 709 nm. Two soil profiles, located in Dongtai City of Jiangsu Province, were continuously observed in situ for 5 days by the near-infrared hyperspectral imaging system. A total of 280 soil samples were obtained for later SMC measurement by oven-drying method. After a series of preproces on the acquired raw hyperspectral images, including digital number(DN) correction, reflectance correction, mosaicking, geometric correction, image clipping and masking, the average spectral reflectance of each sampling point in the corrected hyperspectral images was extracted for further analysis. Then the extracted spectra (Raw) were preprocessed by LOG10(1/ R), Savitzky-Golay (SG), first derivative (FD), second derivative (SD), multiplicative scatter correction (MSC) and standard normal variate (SNV), and partial least squares regression (PLSR) and least squares support vector machine (LS-SVM) models were developed and comparedfor a selection of optimum prediction model. Results showed that the soil spectral reflectance gradually decreased with the increase of SMC, and different spectral preprocessing methods had different prediction accuracy. Except for the MSC preprocessing method, the prediction accuracy of the LS-SVM model was higher than the PLSR model with the same spectral preprocessing method. The prediction accuracy of the LS-SVM model with LOG10(1/ R) preprocessed spectra was highest withRc2 of 0.96 and RMSEc of 0.65% for calibration, andRp2 of 0.88, RMSEp of 1.05% and RPDp of 2.88 for prediction. The optimum model was then applied to produce high spatial resolution maps of SMC in profiles. The prediction accuracy was high ( R2: 0.85~0.95, RMSE: 0.94%~1.02%) by comparing the extracted SMC values from prediction maps with the measured values, and both SMC had the samedistribution tendency in profiles, demonstrating that the SMC prediction mapscould well displaynot only the SMC distribution in profiles in the millimeter scale, but also the changes of SMC at different locations in the profile between different days. Thus, the near-infrared hyperspectral imaging technology combined with optimized prediction model could provide a new approach to quantitatively predict and map high spatial resolution images of SMC in soil profiles in situ, which could help to rapidlyand effectively monitorsoil moisture in profiles in the field.

Keyword: Profile; Soil moisture content; Hyperspectral imaging; Partial least squares regression; Least squares support vector machine; Mapping
引 言

土壤水分是土壤的重要组成部分, 是土壤盐分及其他化学组分迁移的媒介; 同时, 土壤水分也是作物生长所需水分的最直接来源, 对土壤-植物生态系统的水分及养分循环具有重要作用[1]。 监测剖面土壤水分含量(soil moisture content, SMC)动态变化, 对研究土壤剖面水分分布特征、 入渗蒸发过程、 养分元素的迁移积累和田间水肥管理等均具有重要意义。 传统的剖面水分监测方法主要有烘干法、 中子仪法、 γ 射线法、 时域反射法(TDR)和频域反射法(FDR)等。 烘干法测定结果准确, 一般作为其他测量结果的对照参考, 但需要对剖面进行破坏性取样, 比较耗时、 费力; 中子法能长期监测田间水分动态, 但需要田间校正, 受容重、 质地等影响较大, 垂直分辨率较差, 没有特殊措施时不能测定表层SMC, 且存在潜在的辐射危害; γ 射线法比中子仪的垂直分辨率更高, 能够测定表层SMC, 但也对人体健康和环境有较大辐射危害; TDR和FDR主要利用土壤介电特性快速测量土壤体积含水量, 可连续记录数据, 垂直分辨率高, 但土壤盐分过高时测定结果会出现较大误差[2]

高光谱技术具有光谱分辨率高、 无损等特点, 能快速获取土壤的连续光谱信息, 探测SMC变化的细微差异, 为剖面土壤水分的定量反演提供了可能。 前人研究发现, 在SMC不超过田间持水量时, 土壤光谱反射率随着SMC的增加而降低; 且在1 440, 1 900和2 200 nm处存在水分的主要吸收峰, 在1 200和1 770 nm处有水分的弱吸收峰[3, 4]; Hummel等[5]利用多元线性逐步回归方法结合表层光谱构建了亚表层的SMC预测模型; Ben-Dor等[6]在野外基于一种地下光谱采集装置, 结合偏最小二乘回归(partial least squares regression, PLSR)方法反演了土壤剖面中的SMC以及有机质等土壤属性; Viscarra Rossel等[7]在野外利用ASD高光谱仪反演了所采集的1 m深土壤剖面不同层次的体积含水量、 有机质和阳离子交换量等。 但土壤水分运移比较复杂, 在剖面中可能同时存在垂直方向和水平方向的运移[8, 9], 这些传统的水分监测方法和基于点位的高光谱技术只能获取剖面中离散的点位数据, 不能获取到土壤水分运移的完整信息。

新兴的高光谱成像技术是传统二维成像和高光谱技术的有机结合, 既能获取目标物每一个像素点的连续光谱信息, 也可以获取图像信息, 实现了图谱合一, 为土壤剖面水分信息研究提供了一个新的途径和方法。 近年来, 已有不少研究者尝试利用野外采集的剖面样本, 在室内利用高光谱成像技术实现土壤剖面属性的预测制图, Steffens等[10]基于可见光近红外高光谱成像结合PLSR和支持向量机算法实现了剖面中有机质、 氮、 铝、 铁等的精细制图; Burud等[11]基于近红外高光谱成像结合PLSR和光谱角算法反演了生物炭在土壤剖面中的分布; 李硕等[12]利用可见光近红外高光谱成像估算了全氮在土壤剖面中的垂直分布。 但这些基于高光谱成像技术对土壤剖面属性的研究均在室内进行, 而未有在野外条件下的尝试。

利用近红外高光谱成像技术对剖面土壤水分的准确反演, 尤其在野外复杂条件下对剖面土壤水分分布的精细制图还有待研究。 本研究目的是探究在野外复杂条件下利用近红外高光谱成像技术在土壤剖面水分精细反演中应用的可行性, 进而探索其在剖面土壤水分运移研究中的应用潜力, 为剖面土壤水分精细制图及野外监测提供新的技术手段。

1 实验部分
1.1 研究区概括及剖面信息

研究区位于江苏省东台市弶港镇黄海原种场内。 该区位于北亚热带北缘, 海洋性季风气候显著, 四季分明, 日照充分, 年平均气温14.7 ℃, 年均降水量1 042 mm, 主要集中在6— 9月, 年均蒸发量1 417 mm。 土壤类型为淤积盐土类, 潮盐土亚类, 母质为江淮冲积-海相沉积物, 质地为粉壤土, 是苏北盐渍化土壤的典型代表。

为保证所获取数据的可靠性和稳定性, 选择两个剖面进行研究, 分别命名为剖面A(32° 38'40.52″N, 120° 54'5.14″E)和剖面B(32° 38'40.13″N, 120° 54'4.89″E), 剖面的长、 宽、 深分别为2.2, 0.8和1.2 m。 两个剖面0~20 cm土壤的基础理化性质见表1

表1 0~20 cm土壤基本理化性质 Table 1 The physicochemical properties of 0~20 cm top soil in two profiles
1.2 近红外高光谱成像系统及图像的获取

该系统(图1)主要由高光谱成像仪(Imspector N17E, Specim, Finland)、 镜头(S31, Specim, Finland), InGaAs制冷型相机(Xeva-1.7-320, Xenicsnv, Belgium)、 水平旋转云台(Isuzu Optics Corp, China)、 笔记本电脑、 数据采集软件(Isuzu Optics Corp, China)、 三脚架和汽油发电机等组成。 波长范围为882~1 710 nm, 光谱分辨率5 nm, 光谱采样平均间隔3.2 nm, 每帧空间× 光谱分辨率为320像素× 256像素。

图1 近红外高光谱成像系统的组成Fig.1 Schematic diagram of near-infrared hyperspectral imaging system

于2015年5月21日开始连续观测5天, 期间天气晴朗, 在每天10:00— 14:00之间获取剖面的近红外高光谱图像。 近红外高光谱成像仪置于土壤剖面的正前方大约1.6 m处, 为避免采集的图像变形失真, 每天依据当前太阳光强度调整曝光时间和旋转云台的转速。 扫描前, 用剖面刀削去约1.5cm厚土层, 露出新鲜表层, 并使剖面尽量平整, 之后将一个黑色矩形标尺(30 cm× 100 cm)固定在要观测的剖面上。 使用反射率为99%的聚四氟乙烯白板(60 cm× 5 cm× 1 cm, Labsphere Inc., USA)进行白板校正, 盖上镜头盖进行黑暗环境校正后。 侧面放置聚四氟乙烯白板与土壤剖面同时成像, 以校正成像过程中太阳光强改变对图像数字量化值(digital number, DN)造成的影响。 受白板长度的限制, 剖面分上半部和下半部分别扫描获取图像。

1.3 剖面样品的获取和水分测定

扫描后, 于剖面两侧分层采集28个土壤样品(两侧取样区长、 宽、 深为2.5, 2.5和1.5 cm, 0~40 cm范围内以2.5 cm间隔采集一个样品, 40~100 cm范围内以5.0 cm间隔采集一个样品), 之后将样品装入密闭的塑料自封袋中, 避光保存, 两个剖面5 d共获取280个样品, 带回室内通过烘干法获取土壤样品含水量。 每天采样后尽快用泡沫板将整个剖面覆盖固定, 至第二天扫描前再打开, 避免土壤水分从剖面蒸发损失。

1.4 高光谱图像校正和光谱信息提取

为校正剖面成像过程中太阳光强变化对图像DN值造成的影响, 需对上半部和下半部的原始高光谱图像(Ra)分别进行DN校正, 计算公式如式(1)

R0i=Rwmi×RaiRlmi(1)

式(1)中, R0DN校正后的高光谱图像; Rwm是每次成像前利用聚四氟乙烯白板得到的白校正图像的每个波段平均DN值; Rlm是垂直放置白板的逐个深度图像的每个波段平均DN值; Ra为原始高光谱图像的每个波段原始DN值; i为882~1 709 nm的每个波段。

之后, 通过黑白校正转换为相对反射率图像(R), 同时消除成像过程中仪器中的暗电流噪声, 计算公式如式(2)

R=(R0-Rd)/(Rw-Rd)(2)

式(2)中, Rd为盖上镜头盖获得的黑校正图像, Rw为白校正图像。

DN校正和黑白校正后, 在ENVI4.8(ITT Visual Information Solutions, USA)中进行高光谱图像的拼接、 几何校正、 剪切和掩膜等, 最终获得要研究的剖面图像(30 cm× 100 cm)。 提取采样位置处所有像素点光谱的平均值作为对应土样的光谱(Raw), 两个剖面共得到280个光谱曲线。 去除1 117~1 159和1 334~1 493 nm受空气中水汽影响较大的波段[13]及两端边缘噪声较大波段后, 仅保留950~1 117, 1 159~1 334和1 493~1 630 nm范围的光谱数据用于后续建模分析。

1.5 光谱预处理方法及建模方法选取

为了消除野外成像过程中仪器各部件工作时产生的随机噪声信号, 其他如测试环境、 杂散光等干扰信号对建模精度的影响, 主要采用了吸光度(LOG10(1/R)), Savitzky-Golay15点平滑(savitzky-golay smoothing with 15 points, SG)、 一阶微分(first derivative, FD)、 二阶微分(second derivative, SD)、 多元散射校正(multiplicative scatter correction, MSC)和标准正态变量(standard normal variate, SNV)6种常用光谱预处理方法对Raw进行转换[14]

建模方法选用线性偏最小二乘回归(partial least squares regression, PLSR)和非线性最小二乘支持向量机(least squares support vector machine, LS-SVM)两种模型来构建。 PLSR是一种常用的线性多元变量回归分析方法, 吸收了主成分分析中降维的思想, 简化了数据结构, 解决了自变量之间多重相关的问题, 同时克服了主成分分析对因变量解释能力不足的缺点, 回归模型中的最佳因子数根据leave-one-out交叉验证法来确定[15]。 LS-SVM是Suykens等在2002年提出的基于SVM的一种优化算法, 能很好的处理光谱的非线性问题。 LS-SVM用RBF核函数作为LS-SVM的核函数, 用二次损失函数代替了不敏感损失函数, 使其求解精度更高, 收敛速度更快。 另外, 基于网格搜索法和leave-one-out交叉验证法来选择最优的参数γ (regularization parameter)和RBF核函数参数δ 2, 对每一组(γ , δ 2)组合计算其交叉验证集均方根误差(root mean square error of cross validation, RMSEcv), RMSEcv最小时的参数组合为最优参数组合[16]

1.6 精度评价

模型的精度评价主要选用以下参数: 建模集决定系数(coefficient of determinationof calibration, Rc2)、 建模集均方根误差(root mean square error of calibration, RMSEc)、 预测集决定系数(coefficient of determination of prediction, Rp2)、 预测集均方根误差(root mean square error of prediction, RMSEp)和标准偏差与均方根误差的比值(ratio of prediction to deviation=SD/RMSEP, RPDp)。 Rc2, Rp2和RPDp越大, RMSEc和RMSEp越小, 表示模型的预测效果越好[17]

1.7 剖面SMC制图及数据分析软件

通过对比不同光谱预处理方法与建模方法组合的预测精度, 选择出最优的SMC预测模型, 并以此最优模型来反演高光谱图像上每个像素点的水分含量, 生成剖面水分含量可视化分布图。

高光谱图像的几何校正、 剪切、 拼接、 掩膜、 ROI提取等在ENVI4.8软件中进行, 高光谱图像的DN校正、 光谱不同预处理、 LS-SVM建模和剖面SMC制图等在Matlab R2015(The MathWorks, Inc., USA)中完成, PLSR建模在Unscrambler 9.7(CAMO, Norway)软件中完成, 图形绘制在OriginPro 9.0(OriginLab, USA)中完成。

2 结果与讨论
2.1 土壤水分样本集的划分及统计特征

表2为所有土壤样品水分含量的统计特征, SMC范围为19.24%~33.47%, 平均含量为27.15%, 属于中等变异, 数据接近于正态分布。 为了使样本集具有独立性和代表性, 将所有样品按含水量从低到高排序, 以2:1的比例选取建模集和预测集, 最终得到187个建模集样本和93个预测集样本。 校正集水分含量区间范围为19.24%~33.47%, 包含了所有土壤样品的含水量范围, 而预测集水分含量范围为20.61%~32.86%, 位于校正集水分含量范围内。

表2 SMC的统计特征 Table 2 Statistical characteristics of SMC
2.2 不同SMC下的光谱反射率特征

将所有土样按含水量从低到高排序, 统计含水量在19%~22%, 22%~25%, 25%~28%, 28%~31%和31%~34%五个区间的光谱反射率, 计算其平均光谱。 结果如图2所示, 不同含水量等级下提取的土壤平均光谱曲线形态相似, 但因含水量的不同, 在不同波段处的光谱反射率高低不同, 总体随SMC的升高, 光谱反射率呈下降趋势; 且不同含水量之间的光谱反射率差异也随SMC升高逐渐变小, 这可能与土壤光谱反射率随SMC增加呈指数衰减有关[18]。 同时, 在980和1 170 nm附近处光谱有比较明显的水分吸收峰, 该结论与Tian等[19]基于室内点状光谱发现的水分吸收峰的位置相近。

图2 不同水分含量下的土壤光谱反射率Fig.2 Spectral reflectance of soil samples with different levels of SMC

2.3 不同光谱预处理方法的建模结果与分析

分别应用PLSR和LS-SVM方法建立Raw及不同预处理光谱(LOG10(1/R), SG, FD, SD, MSC, SNV)对SMC的预测模型, 比较不同光谱预处理方法与建模方法组合对SMC预测精度的影响, 建模集和预测集的结果如表3所示。 在PLSR模型中, 建模集的 Rc2介于0.81和0.87之间, RMSEc介于1.09%和1.34%之间; 预测集的 Rp2介于0.82和0.84之间, RMSEp介于1.20%和1.31%之间, RPDp均大于2.31, 表明Raw和不同预处理方法转换后的光谱与SMC建立的PLSR模型均具有很高的预测精度, 能很好的预测SMC。 与基于Raw所建立的SMC预测模型相比, 仅SD方法改善了PLSR模型的预测精度, 其余光谱预处理方法均降低了PLSR模型对SMC的预测精度, 基于SD光谱对SMC的预测精度最优, Rp2为0.84, RMSEp为1.20%, RPDp为2.52。

表3 不同光谱预处理方法的PLSR和 LS-SVM模型建模与预测结果 Table 3 Calibration and prediction results of PLSR and LS-SVM models with different spectral pretreatments

在LS-SVM模型中, 除MSC方法外, Raw及不同预处理方法转换后的光谱与SMC建立的模型都具有很好的预测精度, 其建模集的 Rc2介于0.91和0.96之间, RMSEc介于0.64%和0.90%之间, 预测集的 Rp2介于0.85和0.88之间, RMSEp介于1.05%和1.20%之间, RPDp均大于2.53。 与基于Raw所建立的SMC预测模型相比, 仅LOG10(1/R)方法提高了LS-SVM模型的预测精度, SG, FD, SD, MSC和SNV方法均降低了模型的预测精度, 且以MSC方法对SMC的预测精度最低, RPD仅1.97。 综合比较, 以LOG10(1/R)方法在所有预处理方法中表现最优, 其 Rp2为0.88, RMSEp为1.05%, RPDp为2.88。

综上所述, PLSR和LS-SVM方法均能很好的预测剖面土壤中水分含量, 且在所有光谱预处理方法与建模方法组合中, 基于LOG10(1/R)预处理光谱的LS-SVM模型对SMC的预测精度最优, 其建模集的 Rc2为0.96, RMSEc为0.65%; 预测集的 Rp2为0.88, RMSEp为1.05%, RPDp为2.88, 模型有很好的预测精度。 基于LOG10(1/R)预处理光谱的LS-SVM模型的SMC建模集和预测集散点图见图3。

图3 基于最优模型的SMC建模集(a)和预测集(b)散点图Fig.3 Scatter plots of the measured and predicted SMC for calibration (a) and prediction (b) sets based on the best model

2.4 剖面SMC的反演制图

利用最优LOG10(1/R)-LS-SVM模型对高光谱图像中每一个像素点对应的光谱反射率进行运算分析, 计算每个像素点对应的SMC预测值, 结合像素点的空间位置生成空间分辨率为1.01 mm的SMC反演图。 为便于对比, 选择水分含量差异最大的第一天和第五天的高光谱图像对两个剖面进行分析, 见图4(黑色为掩膜的土壤空隙和阴影)。 图例颜色从黄色到深蓝, 表示水分含量从低到高。 从图4可以看出, SMC预测图能很好地展现土壤水分在两个剖面中的总体趋势, 不仅可以反映出土壤水分在整个剖面中毫米级的含量分布信息, 也可反映出同一位置处不同天数间的含量差异。 土壤水分在两个剖面的水平方向上没有明显差异, 但在纵向上呈现出相同的分布规律, 整体从底层到表层递减的趋势, 即随着剖面深度变浅, SMC逐渐降低。 由于地表的强烈蒸发, 在第五天时底层到表层水分降低的趋势更为明显, 颜色差异也更大。 且不同天数间SMC变化主要集中在剖面0~30 cm层次, 在50 cm以下层次水分含量差异很小, 说明短期蒸发只影响到耕层附近SMC的变化, 对深层次的SMC影响较小。

图4 两个剖面第一天和第五天的SMC反演图Fig.4 Prediction maps of SMC of two profileson the first and fifth days

2.5 剖面SMC反演图的精度评价

为检验最终生成的SMC反演图精度, 将SMC反演图采样位置处提取的预测值平均值与实测值对比, 结果如图5所示。 SMC反演图中提取的预测值与实测值在剖面中的变化趋势基本一致, 对剖面B第一天的水分含量预测精度最高, R2为0.95, RMSE为0.94%, 可以精确反映剖面中SMC变化; 对剖面A第五天的水分含量预测精度相对较低(RMSE=1.02%), 可能是对60 cm以下层次高含水量部位的预测误差较大引起的, 但仍能够很好的反映剖面中SMC变化。 从总体来看, 对两个剖面SMC的预测精度较高, 其R2介于0.85~0.95, RMSE介于0.94%~1.02%, 说明SMC反演图可以很好地反映土壤水分在剖面中的毫米级空间分布, 利用近红外高光谱成像技术可以在野外条件下实现剖面SMC的精细制图。

图5 第一天和第五天SMC反演图中提取的预测值与实测值对比图Fig.5 Comparison between measured values and predicted values extracted from prediction maps of SMC on the first and fifth days

野外获取土壤剖面的高光谱图像容易受到多种因素的影响, 如光强变化、 粗糙度、 水汽、 尘埃、 仪器噪声等。 对土壤Raw进行预处理是提高建模精度的有效途径, 选取合适的预处理方法和建模方法至关重要。 在本研究中, 两种建模方法对比发现, 除MSC预处理光谱外, 同一种光谱预处理方法的LS-SVM模型对SMC的预测精度均比PLSR模型高, 这是由于PLSR模型属于线性校正方法, 而土壤光谱反射率与含水量呈非线性关系[20], 野外测试环境(如光照、 温度等)、 土壤属性(盐分、 粗糙度等)和仪器状态的改变也可能造成光谱的非线性变化[14], LS-SVM模型作为一种非线性的机器学习方法, 在小样本情况下具有良好的非线性建模和泛化能力, 可能更适用于野外SMC的预测。 同时, 不同光谱预处理方法对同一种建模方法的精度影响不同, 在PLSR模型中, 与基于Raw所建立的SMC模型相比, 仅SD方法提升了模型的预测精度; 在LS-SVM模型中, 只有LOG10(1/R)方法提高了模型的预测精度, 且以LOG10(1/R)预处理光谱的LS-SVM模型在所有组合中对SMC的预测精度最高, 表明光谱预处理方法和建模方法的选择是提高SMC预测精度的关键。 姚艳敏[21]等采用光谱反射率对数一阶微分所建立的黑土SMC预测方程的预测精度最好; 张俊华等[22]基于光谱反射率一阶微分的幂函数模型对宁夏龟裂碱土SMC的预测精度最高。 不同研究者得出的最优光谱预处理方法不同, 其原因可能是不同研究区土壤有高度异质性, 光谱受土壤质地、 机械组成、 粗糙度等因素影响不同, 其最优光谱预处理方法也有所不同。 近年来, 已有研究者尝试利用任意波段组合构建不同光谱指数, 并与机器学习方法相结合进行土壤属性建模预测, 且已取得很好的效果[23, 24], 后期将尝试该方法在野外进行土壤剖面水分含量反演及精细制图的可行性。

在SMC反演图(图4)中, 以所有样本SMC的平均值± 3倍标准差作为SMC含量范围的最大值和最小值, 并作为去除异常值的标准。 经计算, 异常值像素数仅占到了所有像素数的1.19%; 同时, 提取了SMC反演图中采样位置处的平均SMC, 并与实测SMC对比发现, 其R2介于0.85~0.95, RMSE介于0.94%~1.02%。 说明基于高光谱图像平均光谱建立的最优模型可以反演高光谱图像中单个像素的SMC, 模型有很好的传递性, 且SMC反演图可以很好反映土壤水分在剖面中的毫米级空间分布。 李晨等[25]利用室内测定光谱构建了比值光谱指数的指数函数模型, 对同一研究区内SMC估测的R2和RMSE分别为0.86和0.97%, 与本研究所得结果接近。

本研究采用的直接开挖剖面, 主要是为原位动态获取土壤剖面水分含量的连续变化, 验证近红外高光谱技术在土壤剖面水分含量精细制图中的可行性。 在区域研究中可以采用土钻钻取整段剖面样品[7], 田间直接扫描的方法获取剖面土壤水分的连续分布信息, 并估算不同土层贮水量, 为田间实时水分管理提供参考。 同时, 本研究中水分估测模型的构建是基于一种土壤类型剖面的连续观测, 水分含量范围在19.24%~33.47%之间, 是否能应用于其他土壤类型及更大土壤水分范围内还需进一步验证。 今后需扩大研究区域, 增加不同土壤类型的剖面数据增强模型的普适性和稳定性。

3 结 论

利用近红外高光谱成像技术研究了在野外对剖面SMC进行预测制图的可行性。 通过比较不同光谱预处理方法与PLSR和LS-SVM建模方法组合条件下SMC的预测精度, 选取最优模型对剖面SMC进行了高空间分辨率制图, 剖面中SMC的差异和变化通过不同颜色详细直观的反映在反演图中。 对SMC反演图的精度评价发现, SMC反演图中提取的预测值与实测值在剖面中的变化趋势基本一致, 预测精度较高(R2: 0.85~0.95, RMSE: 0.94%~1.02%)。 结果表明, 在野外复杂条件利用近红外高光谱成像技术预测剖面土壤水分是可行的, 能够实现剖面SMC的定量预测与精细制图。 该方法为在野外条件下快速、 有效监测剖面土壤水分状况提供新的理论和技术支持, 也为研究土壤剖面水分运移规律提供了一种新的思路和方法。

致谢: 感谢国家科技基础条件平台-国家地球系统科学数据共享平台-土壤科学数据中心(http://soil.geodata.cn)及中国土壤数据库(http://vdb3.soil.csdb.cn/)提供数据支撑。

参考文献
[1] LIU Ya, PAN Xian-zhang, WANG Chang-kun, et al(刘娅, 潘贤章, 王昌昆, ). Soils(土壤), 2016, 48(2): 381. [本文引用:1]
[2] Yin Z, Lei T W, Yan Q H, et al. Computers and Electronics in Agriculture, 2013, 99: 101. [本文引用:1]
[3] Bowers S A, Hanks R J. Soil Science, 1965, 100(2): 130. [本文引用:1]
[4] Stoner E R, Baumgardner M F. Soil Science Society of America Journal, 1981, 45: 1161. [本文引用:1]
[5] Hummel J W, Sudduth K A, Hollinger S E. Computers and Electronics in Agriculture, 2001, 32(2): 149. [本文引用:1]
[6] Ben-Dor E, Heller D, Chudnovsky A. Soil Science Society of America Journal, 2008, 72(4): 1113. [本文引用:1]
[7] ViscarraRossel R A, Lobsey C R, Sharman C, et al. Environmental Science & Technology, 2017, 51(10): 5630. [本文引用:2]
[8] LIU Xian, FEI Liang-jun, WANG Bo, et al(刘显, 费良军, 王博, ). Journal of Irrigation and Drainage(灌溉排水学报), 2016, 35(9): 20. [本文引用:1]
[9] WANG Xing-peng, DUAN Ai-wang, LI Shuang(王兴鹏, 段爱旺, 李双). Transactions of the Chinese Society for Agricultural Machinery(农业机械学报), 2016, 47(6): 100. [本文引用:1]
[10] Steffens M, Buddenbaum H. Geoderma, 2013, 195: 122. [本文引用:1]
[11] Burud I, Moni C, Flo A, et al. Soil and Tillage Research, 2016, 155: 523. [本文引用:1]
[12] LI Shuo, WANG Shan-qin, SHI Zhou(李硕, 汪善勤, 史舟). Acta Pedologica Sinica(土壤学报), 2015, 52(5): 1014. [本文引用:1]
[13] YAN Fu-li, WANG Shi-xin, ZHOU Yi, et al(阎福礼, 王世新, 周艺, ). Journal of Infrared and Millimeter Waves(红外与毫米波学报), 2006, 25(6): 460. [本文引用:1]
[14] Shi T Z, Chen Y Y, Liu Y L, et al. Journal of Hazardous Materials, 2014, 265: 166. [本文引用:2]
[15] Wold S, Sjostrom M, Eriksson L. Chemometrics and Intelligent Laboratory Systems, 2001, 58(2): 109. [本文引用:1]
[16] Suykens J A K, Van Gestel T, De Brabanter J, et al. Least Square Vector Machines. Singapore: World Scientific, 2002. [本文引用:1]
[17] Wang C K, Pan X Z. Soil Science Society of American Journal, 2016, 80(5): 1393. [本文引用:1]
[18] Lobell D B, Asner G P. Soil Science Society of American Journal, 2002, 66: 722. [本文引用:1]
[19] Tian J, Philpot W D. Remote Sensing of Environment, 2015, 169: 280. [本文引用:1]
[20] ZHANG Jun-hua, JIA Ke-li(张俊华, 贾科利). Chinese Journal of Applied Ecology(应用生态学报), 2015, 3: 884. [本文引用:1]
[21] YAO Yan-min, WEI Na, TANG Peng-qin, et al(姚艳敏, 魏娜, 唐鹏钦, ). Transactions of the Chinese Society of Agricultural Engineering(农业工程学报), 2011, 27(8): 95. [本文引用:1]
[22] ZHANG Jun-hua, JIA Ke-li(张俊华, 贾科利). Chinese Journal of Applied Ecology(应用生态学报), 2015, 26(3): 884. [本文引用:1]
[23] Jin X L, Du J, Liu H J, et al. Agricultural and Forest Meteorology, 2016, 218-219: 250. [本文引用:1]
[24] Jin X L, Song K S, Du J, et al. Agricultural and Forest Meteorology, 2017, 244-245: 57. [本文引用:1]
[25] LI Chen, ZHANG Guo-wei, ZHOU Zhi-guo, et al(李晨, 张国伟, 周治国, ). Chinese Journal of Applied Ecology(应用生态学报), 2016, 27(2): 525. [本文引用:1]