Vis-NIR光谱快速估测土壤可侵蚀性因子可行性分析
喻武1, 贾晓琳2, 陈颂超2, 周炼清1,2,*, 史舟2
1. 西藏农牧学院资源与环境学院, 西藏 林芝 860114
2. 浙江大学环境与资源学院农业遥感与信息技术应用研究所, 浙江 杭州 310005;
*通讯联系人 e-mail: lianqing@zju.edu.cn

作者简介: 喻武, 1981年生, 西藏大学农牧学院资源与环境学院副教授 e-mail: yuwu4270@126.com

摘要

土壤侵蚀降低土地生产力, 导致土壤环境恶化, 其中水力侵蚀是土壤侵蚀中最主要的一种形式。 土壤可侵蚀性 K值是评价土壤被降雨侵蚀难易程度的一项重要指标。 使用河南、 福建和浙江三省研磨干样可见-近红外(Vis-NIR)漫反射光谱数据, 将其转换为吸收率后进行Savitzky-Golay(SG)平滑去噪; 对土壤有机质(SOM)和机械组成进行精准预测后, 分别采用EPIC和RUSLE2模型估算 K值, 并对预测精度进行比较分析, 所得结论如下: (1)建立土壤有机质和机械组成高光谱最佳预测模型, 土壤质地(砂粒、 粉粒和黏粒)预测采用支持向量机(SVM)模型, SOM预测采用局部加权回归(LWR)模型, 模型四分位相对预测误差(RPIQ)为2.27, 3.17, 2.18和3.44; (2)通过土壤质地估算的土壤渗透性等级分类效果较好, Kappa系数为0.62, 同时估测的土壤质地类型与实测土壤质地类型分布特征相近, 质地主要类型均是粉黏土、 砂黏壤土、 壤土、 壤砂土和砂壤土; (3)EPIC和RUSLE2两种模型均具有较为精确的估测能力, EPIC模型预测精度更高, 均方根误差(RMSEP)为0.006 6 (t·ha·h)/(ha·MJ·mm), RPIQ达1.58, 而RUSLE2模型精度相对较低(其中RPIQ为1.43), 因此推荐使用EPIC模型结合Vis-NIR光谱技术估测土壤可侵蚀性 K值。 本研究为今后快速准确预测K值提供思路, 并为大面积监测土壤侵蚀提供辅助手段。

关键词: 土壤可侵蚀性K值; EPIC; RUSLE2
中图分类号:TP79 文献标志码:A
Feasibility Analysis of Rapid Estimation of Soil Erosion Factor Using Vis-NIR Spectroscopy
YU Wu1, JIA Xiao-lin2, CHEN Song-chao2, ZHOU Lian-qing1,2,*, SHI Zhou2
1. Department of Resources and Environment, Tibet Agricultural and Animal Husbandry College, Linzhi 860114, China
2. Institute of Agricultural Remote Sensing & Information Technology Application, Environmental and Resource Sciences College, Zhejiang University, Hangzhou 310005, China;;
Abstract

Soil erosion reduces the productivity of the soil, leading to the deterioration of soil environment. Water erosion is one of the most important forms of soil erosion. Soil erodibility K value is an important indicator to evaluate soil susceptibility to erosion, the aim of this paper is to evaluate whether Vis-NIR can be used in predicting K value as a rapid method. Soil samples were sampled from Henan, Fujian and Zhejiang provinces, after air-drying and grinding, visible-near infrared (Vis-NIR) diffuse reflectance spectra were measured. Then, soil reflectance spectra were transformed to absorbance spectra and Savitzky-Golay (SG) algorithm was used to eliminate noise. Data mining methods were used to predict soil organic matter (SOM) and soil texture with Vis-NIR spectra, then K values were estimated with EPIC and RUSLE2 models based on predicted SOM and soil texture. The results were as follows: (1) The prediction models with the highest performance were obtained about the SOM and soil texture (sand, silt and clay), the best model for soil texture prediction gained from support vector machine (SVM) model and the best SOM result was performed using locally weighted regression (LWR) model, of which the ratio of performance to inter-quartile distance (RPIQ) was 2.27, 3.17, 2.18 and 3.44 for sand. Silt, clay and SOM. (2) Based on predicted soil texture, the classification accuracy for grade of soil permeability was good (Kappa coefficient was 0.62), and the spatial distribution between predicted values and measured values was similar in soil texture triangle, of which the main types were silty clay, sandy clay loam, loam, loamy sand and sandy loam. (3) The EPIC and RUSLE2 models both had the accurate prediction ability. EPIC model performed better than RUSLE2 model, of which root mean square error of prediction (RMSEP) was 0.006 6 (t·ha·h)/(ha·MJ·mm) and RPIQ reached 1.58, while the accuracy of RUSLE2 model was lower (RPIQ is 1.43). Therefore EPIC model was recommended to estimate K values in combination with Vis-NIR spectroscopic technique. This study presents the potential for estimating soil erodibility K values using Vis-NIR spectroscopy, which provides supplementary method for monitoring soil erosion in large area.

Keyword: Soil erodibility K value; EPIC; RUSLE2

引 言

中国是土壤侵蚀最严重的国家之一, 侵蚀成因复杂, 危害严重。 土壤侵蚀不仅破坏土壤资源, 降低土壤肥力, 影响生态平衡, 而且破坏河道设施, 加剧洪涝灾害, 对人类生命财产造成极大威胁。 土壤可侵蚀性K值是评价土壤被降雨侵蚀难易程度的一项重要指标, K值研究对于预防和治理土壤侵蚀具有重要意义。

目前对K值的估算主要采用侵蚀-生产力影响(EPIC)、 通用土壤流失方程(USLE)和修正土壤流失方程(RUSLE2)三种模型[1], 其核心是建立K值与土壤有机质、 机械组成等属性的关系函数。 但是常规的土壤机械组成比重计测试方法和有机质的化学测试方法相对费时费力, 在大面积K值调查与估算时需要引入新的技术手段和方法。 Vis-NIR遥感技术应用于SOM快速测试已相当成熟, 主要采用偏最小二乘回归法(PLSR)、 人工神经网络(ANN)等不同建模方法, 对Vis-NIR光谱预处理后进行土壤有机质预测[2]。 最新研究成果是对全球近1万8千个土壤样品采用Vis-NIR手段和数据挖掘算法进行土壤有机碳预测, 其预测结果与化学测试进行对比, 决定系数(R2)可达0.89[3]。 同时, 研究表明Vis-NIR光谱技术可以成功估测土壤机械组成, Wang等[4]利用Vis-NIR光谱, 通过建立PLSR等模型, 进行土壤质地预测; 砂粒、 粉粒、 黏粒含量的预测值和实测值的均方根误差分别为8.67%, 6.90%和3.51%, 显示了较高的预测精度。 随着光谱技术在测试土壤有机质和机械组成等属性的成熟, 利用Vis-NIR光谱数据快速估算K值存在巨大潜力。

利用福建、 浙江和河南三省的土壤光谱数据, 建立土壤有机质、 砂粒、 粉粒和黏粒含量的光谱预测模型, 并结合EPIC模型和RUSLE2模型, 估算土壤可侵蚀性K值。 对Vis-NIR光谱技术应用于土壤K值快速估算的潜力进行了分析, 以期为今后大面积快速监测土壤侵蚀提供辅助手段。

1 土壤理化性质

251个土壤样本采集自河南、 福建和浙江三省, 三省样本数分别为48, 93和110个, 主要土壤类型包括潮土、 水稻土和红壤等。 河南省采样点主要分布在平顶山市, 福建省分布在漳州市和龙海市, 浙江省主要分布在上虞、 杭州和衢州。 将土壤样本风干研磨后过2 mm孔筛。 土壤样本的SOM含量采用重铬酸钾加热法测定, 土壤机械组成用吸管法测定, 三省土壤样本的理化性质见表1

表1 土壤样本属性统计表 Table 1 Statistics of soil samples

由图1可知, 土样的质地类型(美国农部制)主要有粉黏土、 砂黏壤土、 黏壤土、 壤土、 壤砂土、 砂壤土和砂土, 有少部分黏壤土、 黏土和粉壤土。 土壤中砂粒含量普遍偏高, 含量在47.80%~69.08%, 粉粒次之, 含量在32.40~40.60%, 黏粒含量较低, 在14.90%~28.93%。 采集的土壤样本覆盖了较广的土壤质地类型(见图1)。

图1 采样点实测土壤质地三角图(美国农部制)Fig.1 Soil texture triangle of soil samples measured at the laboratory (USDA)

2 光谱数据与方法
2.1 光谱测试与数据预处理

使用ASD公司生产的FieldSpec 3便携式光谱仪及高密度反射接触式探头测定土壤样本的Vis-NIR光谱, 光谱仪波长范围350~2 500 nm, 其中350~1 000 nm的分辨率是3 nm, 采样间隔是1.4 nm, 1 000~2 500 nm的分辨率是10 nm, 采样间隔是2 nm。 每次测量前对仪器进行白板校正, 校正过程中保持白板水平放置; 将土样放置于直径5 cm高1 cm的培养皿中, 装满后将土壤表面刮平, 采用接触式探头测定土样Vis-NIR光谱数据, 每个样本采集十次光谱曲线, 取平均值作为该样本光谱曲线。

去除土壤光谱中噪声较大的边缘波段350~399及2 451~2 500 nm后将光谱数据由反射率通过lg(1/R)公式转换为吸收率, 其中R为反射率。 最后对数据进行SG平滑(二阶11窗口)处理, 从而降低土壤信息中噪声对建模造成的影响。

2.2 光谱预测模型构建与评价

依据Kennard-Stone(KS)算法将土壤样本划分为建模集和验证集, 其中KS算法是依据欧氏距离挑选在光谱空间中具有代表性的样本, 将光谱差异大的样本选入建模集合, 其余样本归入验证集合[5]。 使用PLSR, SVM和LWR方法建立光谱预测模型。 PLSR方法可同时实现数据结构简化、 变量相关性分析和回归建模的功能[6]。 SVM方法基于内核统计学理论, 使得原样本空间非线性可分问题转化为特征空间线性可分问题[7]。 LWR通过从光谱库中选取光谱特征相近的样本建立局部模型[8], 因光谱库中包含有机质的样本数据较为全面, 可对有机质预测模型进行优化。 采用浙江大学牵头建立的中国土壤光谱数据库一期共14个省1 581个样品进行LWR方法的计算[2]

估测模型的估测精度采用R2, RMSE, RPIQ, 预测偏差值(Bias)来衡量, 主要针对预测参数的方差进行评价。 相较于测定值标准偏差与标准预测误差的比值(RPD), RPIQ对非正态分布土壤数据的光谱预测模型评价更为客观, 根据表1统计特征, RPIQ更适合评价模型精度。 模型评价参数中, RMSE越小, Bias绝对值越接近于0, RPIQ越大, 说明预测效果越好, 反之效果越差。

R2=i=1n(y'i-y̅i)2i=1n(yi-y̅i)2RMSE=1ni=1n(y'i-yi)2RPIQ=IQRMSE

其中yiy'i分别为检验样本的观测值和预测值, y̅i为样本观测值的平均值, n为预测样本数。 IQ为样本观测值第三四位分位数(Q3)和第一四位分位数(Q1)的差。

2.3 土壤可侵蚀性K值的计算方法

选择EPIC和RUSLE2这两种较为常用的模型估算土壤可侵性K值, 模型均使用国际制单位, (t· ha· h)/(ha· MJ· mm), 模型中土壤机械组成均采用美国农部粒级制, 数据为百分制, 公式如下:

KEPIC=0.1317×(0.2+0.3×e[-0.0256×A×(1-B100)])×BC+B0.3×1-0.25×SOCSOC+e(3.72-2.95×SOC)×1-0.7×SNSN+e(22.9×SN-5.51)KRUSLE2=0.1317×[2.1×M1.14(10-4)×(12-OM/10)+3.25×(2-S)+2.5×(P-3)]/100

式中: A, BC分别为砂粒、 粉粒和黏粒的质量分数, SOC为土壤有机碳质量分数(%), SN=(1-A)/100。 M=(B+D)× (100-C), D= 74-0.62×A100× A, OM为土壤有机质质量分数(g· kg-1); 全球使用统一的结构系数值S为3, 渗透性等级P值的分类依据参照表2

表2 土壤渗透性(P)等级 Table 2 Grade of soil permeability (P)
3 结果与讨论
3.1 土壤光谱特征分析

有机质和不同粒径土壤颗粒的光谱吸收特性不尽相同。 不同有机质含量的土壤光谱吸收曲线变化趋势相同, 随着土壤有机质含量的增加, 光谱吸收率随之增加。 在波长580 nm左右位置, 砂粒光谱曲线前后特征相反, 在580 nm之前, 随着砂粒含量的增加光谱吸收率降低, 在580 nm之后, 随着砂粒含量的增加光谱吸收率升高。 黏粒光谱吸收特征与有机质相近, 随着黏粒含量的增加光谱吸收率升高。 粉粒没有明显的光谱吸收特征。 在四种土壤属性中, 1 400, 1 900和2 200 nm附近是土壤较为显著的特征吸收波段。 砂粒、 粉粒和黏粒光谱吸收率特征不同, 主要是不同粒径的土壤颗粒的矿物组成不一; 粒径粗的矿物质土粒主要由原生矿物组成, 石英占的份量最多; 粒径细的矿物质土粒主要由次生矿物组成, 石英所占的份量逐步减少, 铁铝氧化物的水合物逐渐变多。

图2 有机质(a)、 砂粒(b)、 粉粒(c)和黏粒(d)的最高、 最低与所有样品平均含量的可见近红外光谱曲线Fig.2 Vis-NIR spectra of the minimum, the maximum and average contents of SOM (a), sand (b), silt (c) and clay (d)

3.2 土壤有机质及机械组成含量估算

3.2.1 土壤因子估算模型的建立

将251个土壤样本依据KS算法以2∶ 1的比例划分为建模集和验证集, 其中建模集168个样本, 验证集83个样本。 依次以土壤不同属性为因变量, 全波段(400~2 450 nm)为自变量, 运用PLSR, SVM和LWR方法建立高光谱预测模型。 其中PLSR模型最佳因子数(LVs)采用留一法交叉验证(LOOCV)确定, SVM模型采用ε -support vector regression和径向基核函数进行运算, LWR模型主成分数、 近似样本数和加权PLSR算法中的LVs分别优化为5, 50和10。 三种模型均由PLS_Toolbox8.0.2 (Eigenvector Research Inc., Wenatchee, WA, USA)实现。 模型预测结果如表3所示。

表3 土壤属性预测精度 Table 3 Prediction accuracy of soil properties

对PLSR和SVM模型进行比较, RMSEP结果相近, SVM模型RMSECV相对较大; PLSR模型中四种土壤属性LVs均在10左右, 模型较为稳定。 PLSR和SVM关于土壤质地RPIQ值均大于等于2, SVM预测结果更为精确。 模型Bias均接近于0, PLSR模型的Bias绝对值相对更小。 PLSR和SVM关于SOM的RPIQ在1.40左右, 采用LWR对SOM预测模型进行优化, RPIQ可达2.27。

3.2.2 土壤因子估算结果分析

分别依据实测与SVM模型预测土壤质地进行土壤渗透性等级分类, 并进行混淆矩阵分析[5], 结果见表4。 土壤渗透率预测等级中没有表现为一级和五级的点, 但其偏差在允许范围内, 仅有一个样点在灰色区域外; 实测在四级和六级土壤渗透率的样点数较少, 但偏差样点数较多, 共有6个样点在灰色区域外; 土壤渗透率分级主要集中在二级和三级, 预测结果较为准确, 部分样点预测结果有一定偏差, 所有样点均在灰色区域内。 总体而言, Kappa系数为0.62, 预测精度较高, 有机质、 砂砾、 粉粒和黏粒含量预测结果可用于土壤可侵蚀性K值估算。

表4 土壤渗透性(P)等级的实测与预测值混合矩阵分析表 Table 4 Crosstab of measured and predicted grades of soil permeability (P)

对图3实测(a)及预测(b)土壤质地结果进行分析, 发现预测与实测土壤质地近似, 质地主要类型均是粉黏土、 砂黏壤土、 壤土、 壤砂土、 砂壤土, 并有少部分黏土和砂黏土, 且预测与实测土壤质地样点分布走势相同。 由于粉粒预测结果有低值高估、 高值低估的现象, 造成土壤质地实测结果比预测多砂土、 黏壤土和粉壤土三种质地类型。

图3 美国农部制土壤质地三角图实测与PLSR模型验证集预测结果比较
3.3 土壤可侵蚀性K值估算
Fig.3 Measured (a) versus predicted (b) soil texture triangle of USDA in validation dataset

如图4所示, 采用EPIC(a)和RUSLE2(b)模型, 结合精度最高的土壤属性预测模型(土壤质地预测采用SVM模型, SOM预测采用LWR模型), 使用验证集数据, 对土壤可侵蚀性K值进行估算。 结果显示实测三省K值变化范围依次在0.007~0.050和0.003~0.066 (t· ha· h)/(ha· MJ· mm)之间, 均值分别为0.033和0.033(t· ha· h)/(ha· MJ· mm); 预测三省K值变化范围依次在0.014~0.057和0.012~0.054(t· ha· h)/(ha· MJ· mm)之间, 均值分别为0.034和0.039(t· ha· h)/(ha· MJ· mm)。 不同土壤可侵蚀性K值计算方法在光谱快速估测土壤可蚀性因子可行性分析中存在较大差异, KEPIC实测值变化范围比KRUSLE2小, 两者均值相同; KEPIC估测变化区间值比KRUSLE2大, 但两种模型估测所得K值EPIC模型均值较小。

图4 EPIC(a)和RUSLE(b)模型K值实测与预测值比较Fig.4 Predicted versus measured K values using EPIC (a) and RUSLE2 models (b)

EPIC模型RMSEP为0.006 6(t· ha· h)/(ha· MJ· mm), 约为RUSLE2模型的五分之三; Bias为0.001 4, 约为RUSLE2模型的六分之一, 更趋近于0; EPIC模型RPIQ为1.58, RUSLE2模型精度相对较低, RPIQ为1.43。 综合比较, EPIC模型具有相对较好的预测精度。 根据前人研究[9], 将国外的K值计算模型直接套用于中国土壤数据, 因地域差异性, 中国土壤K值在一定程度上被高估。 通过比较EPIC和RUSLE2模型的R2, 在黑土、 红土和黄土土壤类型中, EPIC模型相关性更大, 且EPIC模型不确定性小于RUSLE2模型。 因此本研究推荐使用EPIC模型结合光谱技术估测K值。

4 结 论

通过河南、 福建和浙江三省的光谱数据对东南部地区土壤有机质含量和土壤机械组成含量进行预测, 通过建立的高光谱预测模型结合EPIC和RUSLE2模型来估测K值, 所得结论如下:

(1)对土壤有机质含量和土壤质地(砂粒、 粉粒和黏粒)建立高光谱预测模型, PLSR模型RPIQ分别为1.41, 3.07, 2.00和3.23, SVM模型RPIQ分别为1.40, 3.17, 2.18和3.44, 使用LWR模型对SOM含量预测RPIQ达2.27。

(2)通过土壤质地估算的土壤渗透性等级分类效果较好, Kappa系数为0.62; 预测与实测土壤质地结果近似, 质地类型分布特征相近, 预测结果比实测缺少砂土、 黏壤土和粉壤土三种质地类型。

(3)EPIC模型取得较好的预测精度, RMSEP为0.006 6(t· ha· h)/(ha· MJ· mm), RPIQ达1.58; 而RUSLE2模型精度相对较低, RMSEP为0.011 0(t· ha· h)/(ha· MJ· mm), RPIQ为1.43; 因此推荐使用EPIC模型结合光谱技术估测K值。

由于条件限制, 土壤样本数较少, 研究区域具有局限性, 需要通过大量样本来验证模型的普适性, 通过比较不同数据挖掘手段来建立更稳健的预测模型, 这将为土壤质量危险性评价和生态环境保护提供更为可靠的信息。

The authors have declared that no competing interests exist.

参考文献
[1] WANG Bin, ZHENG Fen-li, WANG Yu-xi(王彬, 郑粉莉, 王玉玺). Transactions of the Chinese Society of Agricultural Engineering(农业工程学报), 2012, 6: 126. [本文引用:1]
[2] Shi Z, Wang QL, Peng J, et al. Science China-Earth Sciences, 2014, 57(7): 1671. [本文引用:2]
[3] Viscarra Rossel RA, Behrens T, Ben-Dor E, et al. Earth Science Reviews, 2016, 155: 198. [本文引用:1]
[4] WANG De-cai, WU Deng-wei, ZHAO Ming-song, et al(王德彩, 邬登巍, 赵明松, ). Chinese Journal of Soil Science(土壤通报), 2012, 2: 257. [本文引用:1]
[5] Li S, Ji W J, Chen S C, et al. Remote Sensing, 2015, 7(6): 7029. [本文引用:2]
[6] Shi Z, Ji W, Rossel RAV, et al. European Journal of Soil Science, 2015, 66(4): 679. [本文引用:1]
[7] Li S, Shi Z, Chen S C, et al. Environmental Science & Technology, 2015, 49: 4980. [本文引用:1]
[8] CHEN Song-chao, FENG Lai-lei, LI Shuo, et al(陈颂超, 冯来磊, 李硕, ). Acta Pedologica Sinica(土壤学报), 2015, 2: 312. [本文引用:1]
[9] Wang B, Zheng F L, Romkens M J M. Acta Agriculturae Scand inavica Section B-Soil and Plant Science, 2013, 63(1): 69. [本文引用:1]