可见-近红外光谱原位估测土壤有机质含量中测试点和采样位置导致的误差分析

引用本文

张昊丹, 孙孝林, 王晓晴, 王会利. 可见-近红外光谱原位估测土壤有机质含量中测试点和采样位置导致的误差分析[J]. 光谱学与光谱分析, 2020,40(11): 3499-3507.
ZHANG Hao-dan, SUN Xiao-lin, WANG Xiao-qing, WANG Hui-li. Analyzing Errors due to Measurement Positions and Sampling Locations for In Situ Measurements of Soil Organic Matter Using Vis-NIR Spectroscopy[J]. Spectroscopy and Spectral Analysis, 2020,40(11): 3499-3507.
Doi:10.3964/j.issn.1000-0593(2020)11-3499-09 复制到剪切板

Permissions

《光谱学与光谱分析》期刊社所有

可见-近红外光谱原位估测土壤有机质含量中测试点和采样位置导致的误差分析

张昊丹¹, 孙孝林^1,^2,^*, 王晓晴¹, 王会利³

1.中山大学地理科学与规划学院, 广东省城市化与地理环境空间模拟重点实验室, 广东广州 510275

2.土壤与农业可持续发展国家重点实验室(中国科学院南京土壤研究所), 江苏南京 210008

3.广西壮族自治区林业科学研究院, 广西南宁 530002

*通讯联系人 e-mail: sun_xiaolin@yahoo.com

作者简介: 张昊丹, 1993年生, 中山大学地理科学与规划学院硕士研究生 e-mail: zhanghd25@mail2.sysu.edu.cn

收稿日期: 2019-11-13

基金: 国家自然科学基金项目(41771246), 土壤与农业可持续发展国家重点实验室基金项目(Y20160004)资助

摘要

由于土壤的非均质性, 同一样品的多个光谱测试点位置之间以及同一土壤发生层的多个样品之间, 均存在着不同程度的光谱差异, 进而导致光谱估测的土壤属性具有误差。截至目前, 还没有揭示这种误差的研究报道。在我国南方典型丘陵区林地的小区内, 用环刀重复2次采集了80个土壤剖面发生层和38个土壤表层的样品, 再分别用原位光谱法和传统实验室方法测定土壤有机质含量, 从而分析因光谱测试点和样品采集位置不同导致的土壤有机质含量估测误差。结果表明: 每个样品在共计18个测试点位置上的光谱差异为0.12°~8.13°, 均值为1.55°; 在共计2个重复采样位置之间的光谱差异为0.18°~3.65°, 均值为0.88°。因测试点和采样位置不同导致的土壤有机质估测误差用标准偏差表示, 分别为0.92~14.66和0.005 7~11.46 g·kg^-1, 占实测有机质的3.8%~428%和0.017%~92%。同时, 这两种误差会随着实测有机质值含量的增大而增加。并且, 测试点位置不同导致的误差比偏最小二乘回归模型所导致的误差还要大。研究认为, 今后的研究中需注意测试点和采样位置不同引起的误差, 尤其是有机质含量较高的土壤。

关键词: 可见-近红外光谱; 土壤有机质; 偏最小二乘回归; 光谱差异分析; 误差分析

中图分类号:O433.4 文献标志码:A

Analyzing Errors due to Measurement Positions and Sampling Locations for In Situ Measurements of Soil Organic Matter Using Vis-NIR Spectroscopy

ZHANG Hao-dan¹, SUN Xiao-lin^1,^2,^*, WANG Xiao-qing¹, WANG Hui-li³

1. Guangdong Provincial Key Laboratory of Urbanization and Geo-simulation, School of Geography and Planning, Sun Yat-sen University, Guangzhou 510275, China

2. State Key Laboratory of Soil and Sustainable Agriculture, Institute of Soil Science, Chinese Academy of Sciences, Nanjing 210008, China

3. Guangxi Zhuang Autonomous Region Forestry Research lnstitute, Nanning 530002, China

*Corresponding author

Abstract

Due to the heterogeneity of soil, there are spectral differences between different measurement positions of a soil sample and among different samples of a soil genetic layer. As a result, an estimated value of a soil property using in situ spectra of soil inevitably has errors. However, these errors have not been revealed so far. In this paper, 80 soil profiles and 38 soil surface samples were collected twice with cutting ring from a small area of woodland in typical hilly areas in southern China. Then, the soil organic matter content was measured by in-situ spectrometry and traditional laboratory method, so as to analyze the estimation error of soil organic matter content caused by different spectral test points and sampling locations. The results show that, the spectral difference of each sample at a total of 18 test points ranges from 0.12° to 8.13°, with an average value of 1.55°. The spectral difference between two repeated sampling locations of each sample is 0.18°~3.65°, with an average value of 0.88°. The estimated error of soil organic matter due to the different positions of test points was 0.92~14.66 g·kg^-1, accounting for 3.8%~428% of the measured organic matter content. The estimation error of soil organic matter caused by different sampling locations is 0.005 7~11.46 g·kg^-1, accounting for 0.017%~92% of the measured organic matter. Moreover, the error caused by the former is larger than that caused by the partial least squares regression model used in this paper, while the error caused by the latter is slightly smaller than that caused by this model. In addition, it is found that these two errors increase with the increase of measured organic matter content. Hence, this paper argues that the errors caused by different test points and sampling locations should be paid attention to in future studies, especially in soils with higher organic matter content, and calls for research on more effective methods to reduce these errors.

Keyword: Visible-near infrared spectrum; Soil organic matter; Partial least squares regression; Spectral difference analysis; The error analysis

文章图片

引言

土壤是一种复杂综合体, 其反射光谱是由其组成成分及结构等多种内在性质共同决定的结果^{[1, 2, 3]}。因此, 土壤光谱作为土壤理化性状的综合指标, 在研究中常用于估测土壤属性, 特别是可见-近红外(visible-near infrared, Vis-NIR)光谱。与传统化学分析土壤属性相比, 室内测定土壤光谱虽已大大提高了效率, 但仍需对样品进行预处理(如风干、研磨、过筛等)。相较之下, 原位测定土壤光谱的效率更高, 还具有快速、无损、可多次重复等优点。因此, 越来越多的研究致力于发展原位土壤光谱估测土壤属性的技术, 并取得了一定进展。例如, Viscarra Rossel等^[4]、 Li等^[5]使用原位土壤Vis-NIR光谱估测土壤颜色、矿物组成、粘粒含量和有机碳。

这些研究也指出, 利用原位土壤光谱估测土壤属性的准确性受诸多因素影响, 包括两方面。一是土壤方面, 主要是土壤非均质性所导致的水分条件、粒径差异、质地条件等; 二是光谱测定方面, 主要有光谱分辨率、测量时的外部环境、几何条件、土样表面处理方法、光谱处理技术等。前一方面的影响因素与室内测定土壤光谱影响因素的研究结果都较一致。史舟等^[1]已对此做了比较全面、系统的总结。后一方面的因素在很多光谱估测土壤属性的研究中得到了深入分析。例如, 刘焕军等研究了光谱分辨率对黑土有机质预测模型的影响, 结果表明: 黑土有机质含量高, 土壤有机质的光谱范围宽(445~1 380 nm), 且光谱预测模型精度随光谱分辨率降低呈先增后减的趋势, 最优模型的光谱分辨率为50 nm; 侯燕平等^[7]研究了土样表面处理方法对光谱测定的影响, 具体表现为表面刮平处理方式优于压平与摇平处理方式; Stenberg^[8]研究了实验室内土壤样品预处理和标准化复湿对Vis-NIR光谱预测粘粒和土壤有机碳的影响, 发现将土壤样品重新润湿到体积标准化水平可显著提高土壤有机碳的估测效果, 粘粒含量估测效果也有改进但不如前者明显。

为了削弱土壤的非均质性对原位土壤光谱估测土壤属性的准确性的影响, 原位土壤光谱的测定一般是多点测定后取平均值, 再用于土壤属性估测。如Morgan等^[9]在土芯上每隔2.5 cm各测定4个位置的光谱, 并取平均值用于估测有机碳和无机碳; Lobsey和Viscarra Rossel^[10]测定了每个环刀土样两面各5个位置的光谱并取平均值用于土壤水分估测; Li等^[5]测定了环刀样品上5个随机位置的光谱后取平均值, 用于土壤有机碳分析。此外, 广泛的土壤学研究中, 一般对同一层的土壤, 如土壤发生层或同一深度层, 选取多个位置的样品充分混合。因此, 同一层的不同采样位置也会影响原位土壤光谱估测土壤属性的准确性。然而, 迄今的大量研究主要集中在数据预处理与预测模型方面^[11], 鲜有研究分析原位土壤光谱测试点位置以及同一土层不同采样位置对土壤属性估测的影响。因此, 这两个因素导致的光谱差异及土壤属性估测误差还不清楚。

为此, 以我国南方典型丘陵区林地上的土壤样品为例, 首先分析同一原状土样品不同测试点位置上以及同一土层不同采样位置上的光谱差异, 再按照原位土壤光谱估测土壤属性的一般模式, 用偏最小二乘回归(partial least square regression, PLSR)方法建立样品的平均光谱与有机质含量之间的模型, 接着使用该模型估测不同光谱测试点位置和采样位置上的有机质含量, 从而评价测试点和采样点位置不同导致的有机质含量估测误差。研究目的在于定量揭示光谱测试点位置、土壤采样点位置的不同导致的土壤属性估测误差, 为后续进一步研究如何降低这些误差指明方向, 有助于未来更好地开展原位土壤光谱估测土壤属性的研究和应用。

1 实验部分

1.1 研究区概况

研究区选在广西壮族自治区南宁市北郊丘陵地带的高峰林场(108° 20'57″— 108° 21'54″E , 22° 57'8″N— 22° 58'41″N), 面积约3.03 km², 高程约120~300 m。该研究区位于南亚热带湿润季风气候区, 年均温为21.6 ℃, 年降雨量1 304.2 mm; 土壤母质主要为泥岩、泥质页岩、砂质页岩等沉积岩系, 均风化发育为赤红壤; 植被以人工桉树林为主, 林下灌草植物以木姜(Litsea pungens)、毛桐(Mallotus barbatus)、盐肤木(Rhus chinenesis)、半边旗(Pteris semipinnata)、五节芒(Miscanthus floridulus)、铁芒箕(Dicranopteris dichotoma)等为优势树种。该研究区历史上一直为林地, 21世纪初开始种植桉树^[12]。

1.2 土壤采样

从研究区的数字高程模型中提取出高程、坡向、坡度、剖面曲率、平面曲率和地形湿度指数, 并在这些地形参数的基础上, 采用条件拉丁超立方方法选取了20个不同地形特征的采样点。在这些采样点位置上, 挖掘土壤剖面, 深至母质层, 当母质层深度超过140 cm时深至140 cm。每个剖面划分发生层后, 用环刀在每层的不同位置重复采样2个, 共采集160个环刀样品。另外, 在该研究区内用网格法选取38个样点, 每个样点重复采集表层不同位置上的环刀样2个, 共采集76个环刀样品。因此, 共采集236个环刀样品。

	Figure Option View Download New Window
	图1 研究区内采样点分布Fig.1 Distribution of sampling points in the study area

1.3 土壤测试

原状土壤光谱由美国ASD公司生产的FieldSpec4型便携式高分辨率地物光谱仪在室内测得, 测量光源为杯状光源, 内置12° 天顶角的卤素灯, 配有接触式光纤探头。该仪器波长范围是350~2 500 nm, 350~1 000 nm内采样间隔为1.4 nm, 1 001~2 500 nm内采样间隔为1.1 nm, 光谱分辨率为3 nm@700 nm, 6 nm@1 400/2 100nm, 输出总波段数是2 151。测量时, 将杯状光源置于环刀土壤样品上方, 光纤探头直接接触样品。每个样品的上、下两面分别均匀选取9个点进行测量, 每个点测得10条光谱。由于光谱在起始波段(350~400 nm)和长波近红外波段(2 451~2 500 nm)受杂散光、样品背景、测量仪器系统等因素的影响而混有噪声, 故本文用401~2 450 nm波段范围的光谱数据进行下一步分析^[5]。同时, 为避免因数据冗余出现过度拟合现象, 参考Shepherd^[13]和Stenberg^[8]的研究, 分别以5和10 nm采样间隔对401~1 000和1 001~2 450 nm两个波段进行重采样, 共输出265个波段。

光谱测定后的环刀样品经过风干、研磨等一系列处理后, 用重铬酸钾容量法测得有机质含量。

1.4 土壤光谱曲线之间的差异计算

不同的光谱曲线具有不同的形状和幅度。本文用光谱角度θ ^[1]来评价它们之间的差异性, 计算公式如式(1)

$θ = \arccos (\frac{\overset{n}{\sum_{i = 1}} x_{i} y_{i}}{\sqrt[]{\overset{n}{\sum_{i = 1}} x_{i}^{2}} \sqrt[]{\overset{n}{\sum_{i = 1}} y_{i}^{2}}}) \frac{180}{π}, θ \in [0, 90]$ (1)

式(1)中, x_i和y_i分别为两个光谱曲线x和y在波段i处对应的反射率值, n表示波段数。 θ 值越小, 表明曲线x和y之间的差异越小, 反之则差异越大。

为消除仪器因素引起的误差, 以每个测试点10条光谱的平均作为该测试点的光谱, 并称为测试点光谱(共4 248条), 以便区分其他光谱。进一步地, 计算每个环刀样品上、下两面共18个测试点光谱的平均值, 称为环刀样光谱(共236条); 计算每个土层两个环刀样品共36个测试点光谱的平均值, 称为土层光谱(共118条)。然后, 计算每个环刀样品18个测试点光谱与对应环刀样光谱之间的光谱角度, 以评价光谱测试点位置不同引起的光谱测定差异。相似地, 计算每个土层2个环刀样光谱与对应土层光谱之间的光谱角度, 以评价采样位置不同引起的光谱测定差异。

1.5 土壤光谱估测土壤属性的模型建立与验证

使用PLSR建立土壤光谱与土壤属性之间的模型。 PLSR在土壤近地传感研究中应用最广泛, 应用效果良好^{[3, 4, 5]}。为避免过度拟合PLSR模型, 使用留一交叉验证法(leave-one-out cross validation, LOOCV)选择最合适的潜变量(latent variable, LV)个数来建立PLSR模型。然后, 再采用随机独立样本对模型进行验证: 全部样本(236个)被随机分为建模集和验证集。为避免样本数不同给验证结果带来的影响, 验证集的样本数取值为1~40, 取剩后的样本全部用于建模。同时, 为了降低随机采样的不均匀性对验证结果的影响, 对每个验证集样本数重复进行了100次, 并取100次的平均结果为该模型的验证结果。验证指标包括: 平均偏差(mean error, ME)、均方根误差(root mean square error, RMSE)、决定系数R2和相对分析误差(residual prediction deviation, RPD), 计算公式如式(2)— 式(5)

$ME = \frac{1}{n} \overset{n}{\sum_{i = 1}} (ob s_{i} - pre d_{i})$ (2)

$RMSE = \frac{1}{\sqrt[]{n}} \sqrt[]{\overset{n}{\sum_{i = 1}} (ob s_{i} - pre d_{i})^{2}}$ (3)

$R^{2} = r^{2}, r = \frac{1}{(n - 1)} \frac{\overset{n}{\sum_{i = 1}} (pre d_{i} - pred) (ob s_{i} - \bar{obs})}{\sqrt[]{σ_{pred}^{2}} \sqrt[]{σ_{obs}^{2}}}$ (4)

$RPD = \frac{S D_{y}}{RMSE}$ (5)

式中, obs_i为采样点i上的实测值, pred_i是该点上的估测值, $σ_{pred}^{2}$ 和 $\bar{pred}$ 分别表示估测值的方差和均值, $σ_{obs}^{2}$ 和 $\bar{obs}$ 分别表示观测值的方差和均值, SD_y为样本观测值的标准差。 ME指示估测值的总体误差; RMSE受误差的影响较大, 因而能反应估测值的精密度; R²指示估测值与实际值的拟合优度; RPD是样本标准差与均方根误差RMSE的比值。 ME和RMSE越小而R²越大, 则模型的误差越小, 准确度越高。此外, 当RPD> 2时, 模型的预测能力极佳; 当1.4< RPD< 2时, 模型的预测能力较为一般, 可做粗略估计; 当RPD< 1.4时, 模型的预测能力较差, 无法对样本进行有效预测^[14]。

1.6 误差分析

将每个环刀样品的18条测试点光谱输入到PLSR模型中, 得到18个有机质含量估测值。在此基础上, 计算这些估测值的平均值、标准偏差和变异系数。用其中的标准偏差表示因测试点位置不同导致的光谱估测土壤有机质的误差。

同样的, 将每个土层的2条环刀样光谱输入到PLSR模型中, 得到2个有机质含量估测值, 接着计算这些估测值的平均值、标准偏差和变异系数, 并用其中的标准偏差表示因采样位置不同而导致的光谱估测土壤有机质的误差。

2 结果与讨论

2.1 采样土壤的有机质含量统计特征

表1列出了采样获得的土壤有机质含量的统计特征。所有236个环刀样的土壤有机质含量的变异性较大, 变异系数达61%, 属中等变异。偏度与峰度值说明样品有机质含量呈向右偏离正态分布, 且峰态平缓。

表1 土壤有机质含量(g· kg^-1)的统计特征 Table 1 Statistics of soil organic matter content(g· kg^-1)

表1同时还列出了每个土层2个重复样的土壤有机质含量统计特征; 图2展示了它们之间的对比。表1中的结果表明, 重复样本之间的统计特征差别很小, 且都接近所有环刀样的统计特征。例如, 两次重复的均值分别为20.68和19.81 g· kg^-1, 标准偏差分别为12.23和12.51 g· kg^-1, 与所有环刀样本的均值20.25 g· kg^-1和标准差12.36 g· kg^-1都很接近。由图2可见, 当有机质含量低于25 g· kg^-1时, 每个土层的两次重复实测有机质含量接近1:1线, 而当有机质含量高于25 g· kg^-1时, 两次重复与1:1线有一定程度的偏离。这种偏离说明, 高有机质含量的土层中, 土壤有机质在层内分布不均匀, 例如有机质含量丰富的土壤表层过渡到有机质含量较低的下层时, 有机质含量并不均匀, 而是快速或慢速降低。这一结果说明研究土壤采样位置不同导致的误差具有重要意义。

	Figure Option View Download New Window
	图2 两次重复环刀样的土壤有机质含量测量值对比Fig.2 Comparison of soil organic matter contents of two duplicate sets of samples

此外, 表1还列出了每个土层的有机质含量, 即该土层2个重复样的平均值的统计特征。可见, 土层的有机质含量统计特征与上述所有环刀样及2个重复样中有机质含量的统计特征基本一致。

2.2 光谱曲线之间的差异分析

本文以所有样品中有机质含量最低(1.20 g· kg^-1)、最高(48.64 g· kg^-1)和最接近平均值(20.57 g· kg^-1)所对应土层的样品为例, 展示本研究测得的光谱, 如图3所示。由于有机质含量的较大差异, 图3(a), (b)和(c)中的光谱反射率差异较大, 表现为有机质含量越高的土壤, 其反射率低^[6]。不同环刀样品的光谱在700~1 000 nm范围内有明显的波形差异, 尤其是图3(a)中900 nm附近可见明显吸收谷。因690~930 nm波段为铁的氧化矿物对光谱的主要吸收区^[16], 故该波段反射光谱主要受土壤有机质和氧化铁的共同影响。本研究采集的土壤类型为赤红壤, 含丰富的氧化铁, 尤其是有机质含量少的下层土壤中。因此, 在图3(a)中表现出了900 nm附近的明显吸收谷。

Figure Option
View Download New Window

图3 不同有机质含量的土层的光谱
(a): 有机质含量最低; (b): 有机质含量最接近均值; (c): 有机质含量最高Fig.3 Soil spectral curves of soil horizons with different organic matter contents
(a): Horizon with the lowest soil organic matter content; (b): Horizon with the organic matter content close to average value; (c): Horizon with the highasu soil organic matter content

在图3中, 灰色和浅绿色分别表示同一土层2个环刀样品各18条测试点光谱(共36条); 蓝色表示2个环刀样光谱; 红色表示土层光谱。可以看到, 同一环刀样品上不同测试点位置处的测试点光谱(图3中灰色和浅绿色曲线)在形态上大体一致, 但在不同的波段上, 反射率值存在着不同程度的差异。较大的差异发生在600~1 350, 1 400~1 850和1 900~2 500 nm三个波段范围内。在1 400, 1 900和2 200 nm三个波段附近光谱曲线差异较小, 分别对应于水分吸收特征明显的波段^{[3, 15]} 。

图3还反映出同一土层不同取样位置之间, 即环刀样光谱(图3中蓝色曲线)之间, 也存在着一定程度的光谱差异, 并与土层光谱(图3中红色曲线)有一定差异。这些差异与上述测试点光谱之间的差异相比非常小。

表2列出了测试点光谱与环刀样光谱之间、环刀样光谱与土层光谱之间角度的统计特征。偏度值和峰度值说明两组角度的分布比较相近, 均向右偏离正态分布, 峰态陡峭。前者的均值、最大值、中值都大于后者, 说明测试点光谱与环刀样光谱之间的差异大于后者。这一结果表明, 土壤光谱测试点不同导致的光谱差异远远大于采样位置不同导致的光谱差异。前者比后者大约76%。这可能是因为每一个土壤样品的18个光谱测试点分布在环刀样品的上、下两面(每个面各9个点, 而环刀深度为5 cm, 即上下两面相距5 cm), 因而测试点位置实际上已包含了采样位置不同引起的差异。同时, 环刀样光谱是测试点光谱的平均值, 因而已消除了部分差异, 使得环刀样光谱之间差异缩小。另外, 环刀样光谱之间的差异较小也可能与样本数有关, 本文中每个土层仅有2个环刀样光谱。

表2 光谱曲线与参考谱线之间的角度差异统计特征(单位: 度) Table 2 Statistics of differences in degree between the sample spectrum and reference spectrum

图4列出了土壤光谱之间的角度与环刀样有机质含量之间的对比关系。该图反映出, 光谱之间的角度与有机质含量无明显的相关关系。进一步的相关性分析表明, 测试点光谱与环刀样光谱之间的角度与有机质含量的最大负相关和正相关分别为-0.061和0.079, 最小负相关和最小正相关分别为-0.028和0.008。环刀样光谱与土层光谱之间的角度与有机质含量之间的相关性系数为-0.02。可见, 这些相关性并未达到统计学上的显著性水平, 说明它们之间的相关性不明显。

	Figure Option View Download New Window
	图4 土壤有机质含量与土壤光谱差异 (a): 测试点光谱与环刀样光谱间的角度; (b): 环刀样光谱与土层光谱间的角度Fig.4 Soil organic matter content and the differences between soil spectra (a): The angle between spectrum of each test point and spectrum of each sample; (b): The angle between spectrum of each sample and spectrum of each horizon

2.3 土壤原位光谱估测有机质含量的PLSR模型与验证

用所有(236个)环刀样光谱和有机质含量建立PLSR模型。图5显示了这些光谱与有机质含量之间的相关性。可见, 在大部分波段上, 光谱反射率与土壤有机质含量之间呈现负相关, 最大负相关系数为-0.918, 对应波长为1 215.5 nm; 只在极小波段范围内(2 196~2 226, 2 326~2 406 nm)呈正相关, 最大正相关系数为0.163, 对应波长为2 205.5 nm。这一结果与Shepherd^[13]的研究结果相似, 说明可以合理地利用光谱建立估测有机质含量的PLSR模型。

使用一系列不同潜变量个数的PLSR建模和LOOCV验证的结果(图6)表明: 当潜变量个数小于23时, 估测值的误差平方和呈现总体下降趋势, 仅在个别潜变量个数上略有微小增加的趋势; 当潜变量个数为23时, 估测值的误差平方和达到最低; 当潜变量个数大于23时, 估测值的误差平方和有微小增加, 但并没有太大改变, 趋于平稳。因此, 使用潜变量个数为23来建立PLSR模型。 LOOCV的结果表明, 该模型的ME是-0.002 6 g· kg^-1, RMSE是3.57 g· kg^-1, 分别占表1中所有样本有机质含量平均值的-0.013%和18%。其中, RMSE的结果说明该模型具有一定误差。该模型的决定系数R²是0.92, RPD是3.46, 与其他研究中的R²和RPD接近^{[3, 5]}。尤其是RPD的结果, 说明该模型的预测能力极佳。

	Figure Option View Download New Window
	图5 土壤有机质含量与环刀样光谱反射率的相关性分析Fig.5 Correlogram of soil organic matter content to spectral reflectance of each sample

	Figure Option View Download New Window
	图6 PLSR模拟结果 (a): 验证: 预测集均方根误差(使用236个样本进行留一交叉验证); (b): 训练: %累积贡献率Fig.6 Modeling results of PLSR (a): Validation: RMSEP (Cross-validated using 236 leave-one-out segments); (b): Training: % variance explained

接着用随机抽取的1~40个样本对该模型进行了验证, 每个随机抽取样本数重复100次并取其平均值作为验证结果。如图7所示, 当随机抽取的样本数大于3时, 验证指标值趋于稳定。而且, 由于样本数较小时很可能出现较大偏差而使得评价结果失真, 例如图7(c)中R²值在样本数为1时其值为1, 显然是因为样本数仅为1造成的。因此, 以随机抽取的样本数大于3时的结果来评价模型的准确性。 ME在-0.52~0.34 g· kg^-1之间, 占表1中所有样本平均值的-2.57%~1.68%, 可见总体误差非常小。然而, 这可能是因为正、负误差相互抵消的原因。相对应地, 图7(b)中的RMSE相对较高, 在3.15~3.70 g· kg^-1之间, 占表1中所有样本平均值的16%~18%。这一结果说明该模型具有一定的误差。图7(c)中的决定系数R²在0.91~0.93之间, 高于Li等统计文献中曾报道的0.68~0.92之间。同时, RPD在3.38~4.38之间。这些结果说明, 该模型具有较高的准确性。

	Figure Option View Download New Window
	图7 PLSR预测模型的独立随机样本验证结果统计分析红色虚线表示LOOCV的评价结果Fig.7 Statistics of the independent random validation in PLSR prediction model The red dotted line represents the evaluation result of LOOCV

2.4 测试点和采样位置导致的误差分析

图8展示了光谱估测的有机质含量及其平均值、标准偏差与实测有机质含量的对比关系。从图8(a)中可以看到, 不同的测试点位置, 估测值有较大的变异, 说明测试点位置不同导致的误差比较大。用标准偏差表示该误差的结果也展示在图8(a)中, 即蓝色点。进一步分析表明, 该标准偏差与有机质含量实测值的相关系数为0.23, 达到了0.01水平上的显著性。这说明, 实测值越大, 标准偏差越大。同时, 表4列出了该标准偏差的统计数据。可以看到, 该标准偏差的平均值、最小值和最大值分别占表1中所有样品有机质含量平均值的17.98%, 4.54%和72.40%。可见, 测试点位置不同导致的误差并不小。鉴于前述标准偏差与实测有机质含量有显著的相关性, 进一步分析了标准偏差占对应有机质含量实测值的百分数, 统计结果也列于表4中。可以看到, 测试点位置不同导致的标准偏差占实测值的百分数平均可达31%, 最小值为3.8%, 而最大值可达428%。可见, 该标准偏差比2.3节中模型的误差还要大(在2.3节中, 模型的RMSE占样品有机质含量平均值的16~18%)。

Figure Option
View Download New Window

图8 测试点光谱(a)和环刀样光谱(b)估测的有机质含量(黑色)、平均值(绿色)及标准偏差(蓝色)与实测有机质含量的对比; 在(b)中, 光谱估测值与实测有机质含量进行对比, 而其他值都与每个土层的两个环刀样的平均值进行对比Fig.8 Estimated soil organic matter content (black) by the spectrum of each test point (a) and sample (b), and their mean value (green), standard deviation (blue) against the measured. In (b), the estimated are compared with the measured soil organic matter contents, while the other values are compared with the average soil organic matter content of two samples in each horizon

在分析采样位置导致的误差中, 取每个土层两个环刀样实测有机质含量的平均值作为该土层有机质含量的实测值。图8(b)表明, 同一土层上环刀采样位置的不同也会导致明显不同的估测值, 说明采样位置不同导致的误差比较明显[图8(b)中的蓝色点]。进一步的相关性分析表明, 用标准偏差表示的该误差与土层有机质实测值的相关系数为0.30, 达到了0.01水平上的显著性。因此, 采样位置不同产生的标准偏差也会随着实测值的增大而增加。表4列出了该标准偏差的统计特征。可见, 该标准偏差的平均值、最小值和最大值分别占表1中所有土层实测有机质含量平均值的11%, 0.03%和57%。因此, 由于采样位置不同导致的估测标准偏差也较大。进一步分析了该标准偏差占对应实测值的百分数, 并将结果列于表4中。该结果表明, 该标准偏差占实测值的百分数平均值为15%。可见, 该标准偏差比2.3节中模型的误差要小(在2.3节中, 模型的RMSE占样品有机质含量平均值的16%~18%)。

图8和表4的结果都表明, 因测试点位置不同导致的标准偏差明显大于因采样位置不同导致的标准偏差。以表4中两者的平均值来看, 前者比后者大约60%。这与前述土壤光谱差异有关。如前所述, 测试点不同导致的光谱差异比采样位置不同导致的光谱差异大约76%。因此, 在原位光谱估测土壤属性的研究中, 更应该注意测试点位置不同导致的误差。迄今为止的文献大多采用多点测定和多样本采样取平均值来应对这两种误差, 并未定量分析它们的大小。然而, 尽管本文指明了这两种误差的大小, 但仍然未能提出有效地降低它们的方法。未来, 除了研究利用不同的模型来降低误差外, 还需要研究更有效的方法来降低这些误差。

表4 原位土壤光谱估测有机质含量的误差(用标准偏差表示)的统计特征 Table 4 Statistics of the error of soil organic matter content estimated by in situ soil spectra (by standard deviation)

3 结论

以我国南方典型丘陵区林地中的土壤样品为例, 定量分析了光谱测试点和采样位置不同导致原位土壤光谱估测有机质含量中的误差。结果表明, 光谱测试点不同导致的土壤光谱差异平均为1.55° , 而采样位置不同导致的土壤光谱差异则相对较小, 平均为0.88° 。两种差异导致光谱估测土壤有机质的误差平均值分别为3.64和2.27 g· kg^-1, 分别占对应实测值的31%和15%。并且, 前者大于 PLSR模型导致的误差。结果表明, 测试点和采样位置不同导致原位光谱估测土壤属性的误差较大, 在今后的研究中应当注意它们的影响。未来研究还需要探讨如何降低这些误差, 提高原位光谱估测土壤属性的准确性。

参考文献

文献列表

[1]	SHI Zhou(史舟). Principle and Method of of Soil Surface Hyperspectral Remote Sensing(土壤地面高光谱遥感原理与方法). Beijing: Science Press(北京: 科学出版社), 2014. [本文引用:3]
[2]	XIONG Jing-ling, ZHU Xi-cun, GAO Hua-guang, et al(熊静玲, 朱西存, 高华光, 等). Acta Pedologica Sinica(土壤学报), 2018, 55(6): 1. [本文引用:1]
[3]	Viscarra Rossel R A, Walvoort D J J, Mcbratney A B, et al. Geoderma, 2006, 131(1-2): 59. [本文引用:4]
[4]	Viscarra Rossel R A, Cattle S R, Ortega A, et al. Geoderma, 2009, 150(3-4): 253. [本文引用:2]
[5]	Li S, Shi Z, Chen S, et al. Environmental Science & Technology, 2015, 49(8): 4980. [本文引用:5]
[6]	JI Wen-jun, SHI Zhou, ZHOU Qing, et al(纪文君, 史舟, 周清, 等). Journal of Infrared and Millimeter Waves(红外与毫米波学报), 2012, 31(3): 277. [本文引用:1]
[7]	HOU Yan-ping, LÜ Cheng-wen, XIANG Hong-liang, et al(侯燕平, 吕成文, 项宏亮, 等). Chinese Journal of Soil Science, 2015, 46(2): 287. [本文引用:1]
[8]	Stenberg B. Geoderma, 2010, 158(1-2): 15. [本文引用:2]
[9]	Morgan C L S, Waiser T H, Brown D J, et al. Geoderma, 2009, 151(3-4): 249. [本文引用:1]
[10]	Lobsey C R, Viscarra Rossel R A. European Journal of Soil Science, 2016, 67(4): 504. [本文引用:1]
[11]	ZHANG Gan-lin, ZHU A-xing, SHI Zhou, et al(张甘霖, 朱阿兴, 史舟, 等). Progress in Geography(地理科学进展), 2018, 37(1): 57. [本文引用:1]
[12]	WANG Xiao-qing, SUN Xiao-lin, WANG Hui-li(王晓晴, 孙孝林, 王会利). Acta Pedologica Sinica(土壤学报), 2019, 56(4): doi: DOI:10.117661trxb201808310246. [本文引用:1]
[13]	Shepherd K D, Walsh M G. Soil Science Society of America Journal, 2002, 66(3): 988. [本文引用:2]
[14]	Chang C W, Laird D A, Mausbach M J, et al. Soil Science Society of America Journal, 2001, 65(2): 480. [本文引用:1]
[15]	JI Geng-shan, XU Bin-bin(季耿善, 徐彬彬). Acta Pedologica Sinica(土壤学报), 1987, 24(1): 67. [本文引用:1]
[16]	SHA Jin-ming, CHEN Peng-cheng, CHEN Song-lin(沙晋明, 陈鹏程, 陈松林). Research of Soil and Water Conservation(水土保持研究), 2003, 10(2): 21. [本文引用:1]

0.0

... 引言土壤是一种复杂综合体, 其反射光谱是由其组成成分及结构等多种内在性质共同决定的结果^[1,2,3] ...

... 史舟等^[1]已对此做了比较全面、系统的总结 ...

... ^[1]来评价它们之间的差异性, 计算公式如式(1) ...

2018

0.0

... 引言土壤是一种复杂综合体, 其反射光谱是由其组成成分及结构等多种内在性质共同决定的结果^[1,2,3] ...

2006

0.0

... 引言土壤是一种复杂综合体, 其反射光谱是由其组成成分及结构等多种内在性质共同决定的结果^[1,2,3] ...

... PLSR在土壤近地传感研究中应用最广泛, 应用效果良好^[3,4,5] ...

... 在1 400, 1 900和2 200 nm三个波段附近光谱曲线差异较小, 分别对应于水分吸收特征明显的波段^{[3, 15]} ...

... 46, 与其他研究中的R²和RPD接近^{[3, 5]} ...

2009

0.0

... 例如, Viscarra Rossel等^[4]、 Li等^[5]使用原位土壤Vis-NIR光谱估测土壤颜色、矿物组成、粘粒含量和有机碳 ...

... PLSR在土壤近地传感研究中应用最广泛, 应用效果良好^[3,4,5] ...

2015

0.0

... 例如, Viscarra Rossel等^[4]、 Li等^[5]使用原位土壤Vis-NIR光谱估测土壤颜色、矿物组成、粘粒含量和有机碳 ...

... Li等^[5]测定了环刀样品上5个随机位置的光谱后取平均值, 用于土壤有机碳分析 ...

... 由于光谱在起始波段(350~400 nm)和长波近红外波段(2 451~2 500 nm)受杂散光、样品背景、测量仪器系统等因素的影响而混有噪声, 故本文用401~2 450 nm波段范围的光谱数据进行下一步分析^[5] ...

... PLSR在土壤近地传感研究中应用最广泛, 应用效果良好^[3,4,5] ...

... 46, 与其他研究中的R²和RPD接近^{[3, 5]} ...

2012

0.0

... 由于有机质含量的较大差异, 图3(a), (b)和(c)中的光谱反射率差异较大, 表现为有机质含量越高的土壤, 其反射率低^[6] ...

2015

0.0

... 侯燕平等^[7]研究了土样表面处理方法对光谱测定的影响, 具体表现为表面刮平处理方式优于压平与摇平处理方式 ...

2010

0.0

... Stenberg^[8]研究了实验室内土壤样品预处理和标准化复湿对Vis-NIR光谱预测粘粒和土壤有机碳的影响, 发现将土壤样品重新润湿到体积标准化水平可显著提高土壤有机碳的估测效果, 粘粒含量估测效果也有改进但不如前者明显 ...

... 同时, 为避免因数据冗余出现过度拟合现象, 参考Shepherd^[13]和Stenberg^[8]的研究, 分别以5和10 nm采样间隔对401~1 000和1 001~2 450 nm两个波段进行重采样, 共输出265个波段 ...

2009

0.0

... 如Morgan等^[9]在土芯上每隔2 ...

2016

0.0

... Lobsey和Viscarra Rossel^[10]测定了每个环刀土样两面各5个位置的光谱并取平均值用于土壤水分估测 ...

2018

0.0

ZHANG

Gan-lin

, ZHU

A-xing

, SHI

Zhou

, et al(张甘霖, 朱阿兴, 史舟, 等). Progress in Geography(地理科学进展), 2018, 37(1): 57.

Soil geography is the sub-discipline of soil science and geography dealing with the spatiotemporal changes of soil, and is a part of the earth surface system science. The research topic of soil geography is gradually changing from soil body to critical zone from the perspective of the earth surface system, meanwhile the research methodology develops toward "digital". Based on an introduction of the theoretical and technical backgrounds, this article reviewed the recent progress of soil geography including on soil genesis, soil morphology, soil classification, soil survey, and digital soil mapping. Future development of soil geography needs to expand the theoretical research, innovate the investigation technology, and simulate the spatiotemporal variations of soil. Furthermore, the main opportunities, trends, and challenges in the future were discussed.

1. State Key Laboratory of Soil and Sustainable Agriculture, Institute of Soil Science, CAS, Nanjing 210008, China 2. University of Chinese Academy of Sciences, Beijing 100049, China 3. School of Geographical Science, Nanjing Normal University, Nanjing 210023, China 4. Department of Geography, University of Wisconsin-Madison, Madison, WI 53706, USA 5. College of Environmental and Resource Sciences, Zhejiang University, Hangzhou 310058, China 6. College of Land and Environment, Shenyang Agricultural University, Shenyang 110161, China 7. School of Geography, Beijing Normal University, Beijing 100875, China 8. Institute of Soil and Water Conservation, Northwest Sci-tech University of Agriculture and Forestry, Yangling 712100, Shaanxi, China 9. College of Resources and Environment, Huazhong Agricultural University, Wuhan 430070, China

作为土壤学和地理学学科的分支,土壤地理学是地球表层系统科学的重要组成部分,其核心研究内容是土壤的时空变化。土壤地理学研究对象从传统的土体向地球表层系统视角下的关键带转变,研究方法上全面走向数字化。本文综述了近20年来土壤地理学分支学科包括土壤发生、土壤形态、土壤分类、土壤调查与数字土壤制图等领域的研究进展,指出其发展趋势为：基础理论研究不断拓展、调查技术正经历变革、时空演变从过程观测走向模拟,同时探讨了土壤地理学的未来发展契机与面临的挑战。

... 然而, 迄今的大量研究主要集中在数据预处理与预测模型方面^[11], 鲜有研究分析原位土壤光谱测试点位置以及同一土层不同采样位置对土壤属性估测的影响 ...

2019

0.0

... 该研究区历史上一直为林地, 21世纪初开始种植桉树^[12] ...

2002

0.0

... 这一结果与Shepherd^[13]的研究结果相似, 说明可以合理地利用光谱建立估测有机质含量的PLSR模型 ...

2001

0.0

... 4时, 模型的预测能力较差, 无法对样本进行有效预测^[14] ...

1987

0.0

... 在1 400, 1 900和2 200 nm三个波段附近光谱曲线差异较小, 分别对应于水分吸收特征明显的波段^{[3, 15]} ...

2003

0.0

SHA

Jin-ming

, CHEN

Peng-cheng

, CHEN

Song-lin

(沙晋明, 陈鹏程, 陈松林). Research of Soil and Water Conservation(水土保持研究), 2003, 10(2): 21.

土壤有机质光谱响应特性研究是光学遥感定量化的基础性研究.研究利用VF991地物光谱测量仪对八个不同环境条件下形成的土壤样本剖面上的各个土层进行光谱测量,得到各个土层的反射率光谱曲线,并测出各个土层的有机质含量.通过研究土壤的有机质含量与土壤反射光谱间的相关性分析,发现有机质含量与土壤光谱在紫外区的376.795 nm波段、可见光区的616.506 nm波段和近红外区的724.0975 nm波段附近有较好的负相关性.

... 因690~930 nm波段为铁的氧化矿物对光谱的主要吸收区^[16], 故该波段反射光谱主要受土壤有机质和氧化铁的共同影响 ...