基于野外可见近红外光谱和水分影响校正算法的土壤剖面有机碳预测
李硕1, 李春莲1, 陈颂超3,4, 徐冬云2, 史舟2,*
1.华中师范大学地理过程分析与模拟湖北省重点实验室, 湖北 武汉 430079
2.浙江大学农业遥感与信息技术应用研究所, 浙江 杭州 310058
3.INRAE, Unité InfoSol, 45075 Orléans, France
4.UMR SAS, INRAE, Agrocampus Ouest, 35042 Rennes, France
*通讯作者 e-mail: shizhou@zju.edu.cn

作者简介: 李 硕, 1983年生, 华中师范大学城市与环境科学学院副教授 e-mail: shuoguoguo@ccnu.edu.cn

摘要

土壤是陆地碳循环的中枢, 充分发挥土壤固碳潜力有助于减缓全球气候变化。 土壤有机碳 (SOC) 的高度分异性同时体现在空间和垂直分布上, 但是许多前期研究往往只考虑了空间分异, 而忽略了垂直分异。 尤其在青藏高原这种高寒山区, 土壤样品采集难度较大且费用昂贵。 可见近红外 (Vis-NIR) 光谱作为传统土壤实验室化学分析的辅助手段, 能够较为快速和精准地估测SOC含量。 但是土壤水分等环境因素会掩盖或改变SOC的Vis-NIR光谱吸收特征进而削弱模型预测精度。 外部参数正交化 (EPO) 和分段直接标准化 (PDS) 算法可以有效校正水分对光谱的影响, 但其在野外新鲜土柱上的表现还不得而知。 本研究旨在探索不同水分影响校正算法对野外剖面土壤光谱的校正能力, 对采自中国青藏高原海拔2 900~4 500 m色季拉山的共26个1 m深土柱。 沿深度以5 cm×5 cm为测量单元, 从各单元中心采集共计386个野外原状湿样Vis-NIR光谱, 并在实验室内测得相应386个研磨干样的Vis-NIR光谱以及SOC含量。 经EPO和PDS算法校正土壤水分对光谱的影响后, 通过随机森林建立土壤光谱和SOC含量的定量预测模型, 并使用靴襻法评估不同校正处理下预测模型的不确定。 土柱整体及垂直分布的精度结果表明, 经PDS法转换的农田和草地土柱湿样光谱均表现出良好的水分校正效果, 而EPO法仅对农田土柱有效。 水分影响校正算法在不同土壤深度上也存在显著差异, EPO和PDS对农田和草地表层样本的水分校正均效果明显。 两种校正方法的效果显示出地类和土层深度的依赖性。 本研究为利用Vis-NIR光谱技术在高寒山区野外快速准确估算土壤碳含量的垂直分异提供了必要参考。

关键词: 土壤有机碳; 外部参数正交化; 分段直接标准化; 随机森林; 青藏高原
中图分类号:TP79 文献标志码:A
Removing the Effects of Water From Visible-Near Infrared Spectra in Soil Profiles for the Estimation of Organic Carbon
LI Shuo1, LI Chun-lian1, CHEN Song-chao3,4, XU Dong-yun2, SHI Zhou2,*
1. Key Laboratory for Geographical Process Analysis & Simulation of Hubei Province, Central China Normal University, Wuhan 430079, China
2. Institute of Remote Sensing and Information Technology, Zhejiang University, Hangzhou 310058, China
3. INRAE, Unité InfoSol, 45075 Orléans, France
4. UMR SAS, INRAE, Agrocampus Ouest, 35042 Rennes, France
*Corresponding author
Abstract

The terrestrial carbon cycle is the most important constitution and plays a prominent role in global carbon cycle, and soil carbon sequestration makes an important contribution to the global climate change. The full soil profile is a highly dynamic component of the ecosystem, with pronounced depth-dependent processing of soil organic carbon (SOC), such that accumulations and losses of carbon above ground are on different temporal trajectories than changes below ground. But many studies do not consider the spatial variability of soil properties in the vertical direction, especially in the Qinghai-Tibet Plateau, mainly because of the difficulties and expense of collecting soil material in that kind of terrain and transporting it to the laboratory. Visible near-infrared reflectance spectroscopy (Vis-NIR) is an increasingly popular measurement method that is enabling the rapid, real-time and accurate proximal sensing of soil properties, including SOC. However, thesoil moisture content has been shown to affect soil spectra, might mask or alter the absorption features of SOC. EPO and PDS are two effective methods to correct soil spectra effects, but we still unknow the feasibility of those two methods on fresh profile samples. In this study, we compared EPO and PDS on a set of 26 soil cores (1 m depths and 5 cm diameter) in the Sygera Mountains on the Qinghai-Tibet Plateau, China. Spectra were acquired from fresh, vertical faces 5 cm×5 cm in the area from the centers of the cores to give 386 spectra in all. We also got the spectra and SOC contents from the 386 dry samples. The statistical models were built to predict of the SOC in the samples from the spectra by Random Forest. The bootstrap was used to assess the uncertainty of the predictions by the EPO and PDS. Our results show that PDS is an effective strategy to mitigate the effects of soil water content on vis-NIR spectra for the fresh soil core samples from arable and grassland. While EPO neither shown significantly out performed those wet core samples from grassland. There were somewhat differences along with the profile on prediction accuracy of SOC between EPO and PDS. Both EPO and PDS show significantly available on surface layers of samples from arable and grassland. The EPO and PDS illustrated the dependence of land use type and soil depth. Our work would be a benefit to therapid and accurate estimation of the vertical partitioning of SOC content in the field in alpine mountains using Vis-NIR spectroscopy.

Keyword: Soil organic carbon (SOC); External parameter orthogonalisation (EPO); Piecewise direct standardization (PDS); Random forest (RF); Qinghai-Tibet Plateau
引言

青藏高原由于地处偏远, 采集土壤样本并带回实验室的过程耗时费力, 因此该地区土壤数据匮乏, 局限了其土壤有机碳空间分布的认知, 进而导致有机碳储量的估测具有极大的不确定性[1]。 近期研究表明, 青藏高原深层土壤有机碳可能更容易受到气候变化的影响, 因此对青藏高原土壤碳循环的深入理解亟需采集更多具有代表性的土壤剖面数据[2]。 这一发展趋势凸显了常规实验室理化分析的局限性, 推进了适用于大尺度快速精准的有机碳测定方法的开发。

可见近红外(visible near-infrared, Vis-NIR) 光谱可以快速、 准确和低成本地估算土壤碳含量[3, 4]。 在野外原位测量土壤Vis-NIR光谱, 虽然可避免繁琐的实验室样本制备过程, 但土壤光谱会受到水分等环境因子干扰和多参数耦合交互的严重影响。 已有从土壤湿样光谱中消除水的影响, 主要方法包括直接标准化法(direct standardization, DS)、 分段直接标准化(piecewise direct standardization, PDS)和外部参数正交化(external parameter orthogonalization, EPO) 等。 如Minasny等首次引入EPO对土壤湿样光谱进行水分影响校正[5]。 于雷等使用EPO对表土湿样光谱处理后, SOC预测模型的预测精度显著提高。 Ji等通过SOC的预测精度得出PDS优于DS及EPO的结果[7]。 Roudier等对采自新西兰农田0~20 cm分层土样进行了DS和EPO的对比, 发现两者对水分影响的校正均有效, 而EPO较DS更佳[7]

虽然以上方法都对校正光谱的水分影响有效, 但都应用于表土, 其在野外新鲜土柱上的表现还不得而知。 土壤的理化属性的空间异质性支撑土壤功能的多样性, SOC的垂直分布主要受到气候、 化学、 机械和生物共同耦合作用影响。 由于现有土壤数据的局限性和收集土壤形成过程的技术缺失, 土壤纵向的不均一性常常被忽视[8]。 然而土壤属性的纵向分析有助于提高分析的完整性并确保得出更加全面的结论。 本研究主要目的是考察基于Vis-NIR光谱技术在野外原位估算土壤剖面SOC含量的精度, 并比较EPO和PDS两种校正方法消除野外Vis-NIR光谱水分影响的效果。

1 实验部分
1.1 研究区概况及碳测定

研究区位于青藏高原东南部林芝市色季拉山, 海拔2 200~5 300 m, 年平均气温为15.8 ℃, 年平均降水量为676 mm。 2013年和2014年的8月底至9月初, 使用AMS分离式土壤柱状采样器采集圆柱形土柱(直径5 cm, 最深达1 m), 其中草地15个, 农田11个。 采集前先清除表层未分解的枯枝落叶和秸秆等明显覆盖物, 采集时记录土地利用类型等辅助信息。 每个土柱现场垂直切分成两半, 一份进行光谱采集和理化分析, 另一份带回作备份。

SOC含量使用Jena-multi NC-3100和Jena HT1300仪基于1 100 ℃的干烧法测定。 表1显示SOC总体含量范围为0.39~164.16 g· kg-1, 平均值为18.35 g· kg-1。 其中, 农田的SOC平均值与标准差小于草地, 变异系数则大于草地。

表1 土样SOC含量的统计结果 Table 1 Statistics of SOC concentrations
1.2 光谱测定及预处理

使用ASD FieldSpec Pro FR便携式光谱仪在野外测量新鲜土柱的Vis-NIR (350~2 500 nm)反射光谱。 该仪器在350~700 nm分辨率为3 nm, 1 400~2 100 nm分辨率为10 nm, 配备内置4 W卤素灯的手持接触式探头, 使用具有99%反射率的Spectralon白板进行校正。 在每个测量点位, 仪器进行10次内部扫描以获得较佳信噪比。 土柱按每5 cm深度即在5 cm× 5 cm的样本切面进行光谱测量, 每个深度随机记录两到三个点位的光谱, 将平均值作为该深度的光谱。 总计获得386条野外新鲜土样的光谱数据。

野外光谱测试结束后, 土柱样本用塑料薄膜密封并做好标记带回实验室。 土柱被切割成与野外测试相匹配的多个5 cm× 5 cm子样本。 所有土样经风干、 研磨并通过2 mm尼龙筛。 将每个粉状样品均匀铺满于直径10 cm, 深1.5 cm的培养皿中, 样本表面用玻璃片做轻压推平处理, 并使用与野外光谱测试相同的光谱仪和参数进行测量。 总计获得386条室内风干研磨土样的光谱数据。

对光谱数据进行预处理可增强光谱信号并消除由光学环境差异带来的误差。 所有光谱统一重采样至1 nm分辨率后, 每条光谱共计2 151个波段反射率值。 去除光谱首尾两端有明显噪声的波段后, 保留400~2 450 nm范围内的数据。 为进一步降低噪声和增强信号, 使用Savitzky-Golay平滑(21窗口, 二阶多项式) 和一阶微分对光谱数据预处理。 为降低光谱的多重共线性并提高计算效率, 光谱重采样至10 nm分辨率。 使用主成分分析对光谱数据进行压缩, 将包含大量信息的样本压缩为包含信息量多的几个主成分来展示光谱特征结构。

1.3 水分校正

1.3.1 EPO法

EPO由Roger等于2003年提出, 用于去除光谱中外部因素的影响[5]。 该算法通过查找受水分影响的光谱区域, 并将所有光谱投影到前者的正交空间中, 从而达到去除水分影响的目的

X=XP+XQ+R(1)

其中, P是未受土壤水分影响即包含土壤光谱信息的投影矩阵, Q是受土壤水分影响的投影矩阵, R是残差项。

原始光谱通过EPO法得到正交化的矩阵X* , 从而达到去除水分影响因子的目的。 通过前期预实验, 选用4作为投影矩阵P中EPO的组分数。

1.3.2 PDS法

PDS是一种最初应用于不同Vis-NIR光谱仪之间模型传递的校正方法[6]。 该方法是基于这样一种假设, 即可以通过测量野外光谱(湿样)和实验室光谱(干样)之间的变化来表征环境影响, 然后从野外光谱中去除该变化。 干样的光谱X被定义为湿样光谱的线性组合

XLi=XFiBi+λdTs(2)

其中, XLi是波长i处的室内干样光谱组成的列向量, XFi是波段i附近一个窗口为2j+1大小的野外湿样光谱段组成的矩阵, Bi是对应波长i处的转换系数, $\lambda d_{s}^{T}$是残差项。

PDS与EPO不同之处在于, 湿样光谱不必投影到新的维度空间。 而DS则是PDS窗口数为1时的特例。 通过前期预实验, 最终设定窗口数为21。

1.4 建模方法及评价指标

随机森林(random forest, RF) 是一种机器学习方法, 它由数百个独立的树组合而成, 最终的预测值是来自森林中所有树木预测值的平均值[9]。 为避免相邻或相近的土柱位置以及土地利用类型的强相关性造成预测过优, 从26个土柱中随机挑选出农田3个土柱、 草地5个土柱, 共计115个5 cm× 5 cm子样本组成独立验证集, 其余土柱组成建模集。 使用靴襻法对建模集以土柱为单位进行50次放回的抽样, 并通过计算每个深度预测值距实测值的95%置信区间来考察模型的不确定性。 使用决定系数(R2), 均方根误差(RMSE)和四分位距偏差比(RPIQ)来评估模型的准确性。 优良的模型通常具有较大的R2和RPIQ值以及较小的RMSE值。 所有的数据处理和建模都是在软件R中实现。

2 结果与讨论
2.1 有机碳含量特征

如图1所示, 总体而言SOC含量随着土壤深度的增加而逐渐降低。 农田SOC在0~40 cm深度的平均含量明显低于草地。 尽管林芝地区农田常通过堆肥等方式来增加土壤肥力, 但是常年的轮作和翻耕导致碳的输出和分解往往高于碳的输入, 因此农田的SOC含量低于草地。 草地受人类活动影响较小, 其SOC含量相对较高。 主要原因是SOC与植被生产力, 以及有机质的矿化程度密切相关。 在10 cm以下随着深度的增加, 草地SOC平均含量的减少并不明显。

图1 两种土地利用下SOC含量在剖面上分布情况Fig.1 Vertical distribution of SOC content in soil profiles under two land uses

2.2 光谱分析

图2(a)是所有386个土样的实验室干样和野外湿样的平均反射率及标准差。 新鲜土壤中的水分导致湿样光谱反射率较干样整体下降, 这是由于水占据了土壤孔隙内的空气位置, 增加了光的前向散射, 且提高了所有波长的吸收率。 在400~800 nm范围内, 土壤光谱反射率随着波长的增加而平稳上升, 干样光谱较湿样光谱增长迅速。 在1 400, 1 900和2 200 nm处的吸收峰主要由土壤水分的O— H官能基团的伸缩振动或转角振动所致。 土壤中的水分在800~2 450 nm近红外波段范围有强烈的吸收, 令湿样光谱较干样变化更加明显。 两者状态在光谱上的差异也体现在其光谱主成分空间分布特征上。 如图2(b)所示, 前两个主成分共同解释了60%以上的总体变异, 但湿样与干样光谱之间存在极少重叠的区域。 这说明受水分的影响, 来自同一土样的干湿两种光谱差异显著, 将进一步影响SOC预测模型的精度。

图2 土壤干样和湿样光谱反射率平均值及标准差(a), 主成分空间散点图(b), 以及两种土地利用的土壤干样(c), 湿样(d)光谱主成分空间散点图Fig.2 Average spectra of dry and wet soils with standard deviation (a) and their PCA scores plot (b) and PCA scores of dry soil (c) and wet soil (d) individually under two types of land use

干、 湿光谱主成分分析显示[图2(c, d)], 前两个主成分都共同解释了90%以上的总体变异。 但湿样的第一主成分(PC1)占了90.5%, 明显高于干样的PC1(79.3%)。 这可能是由于受水分的影响, 令光谱的个性减弱共性增强。 此外, 两种地类不论干样还是湿样都呈现了聚集的特征, 且两者之间存在一定的重叠。 与草地相比, 农田的主成分空间分布更散, 可能是因为SOC含量较草地偏低影响所致, 其主成分空间分布较散。

2.3 预测精度及去水效果对比

表2显示, 使用干样光谱预测SOC的精度均优于湿样光谱。 这是由于在室内能够保证实验条件的标准化, 而野外现场测量必须应对不同湿度以及土壤结构等环境因素变化。 结合图2(b)说明水分不仅影响了光谱的表征, 还降低了预测模型的精度。 鉴于野外环境的复杂变化, 农田湿样和草地湿样的SOC预测精度结果是可以接受的, 也与我们前期的研究结果相符[10]。 这是由于土柱样本是SOC含量跨度大的集合, 较含量跨度小的样本集会显示出更好的拟合效果。 但考虑到直接湿样测定未利用前期积累的大量历史土壤数据(干样), 如国家和省级等尺度的土壤数据库等, 只用新采集的湿样光谱建模去预测湿样土壤属性的策略限制了光谱技术野外应用的推广。

表2 农田和草地剖面干样、 湿样、 EPO、 PDS的SOC含量RF预测模型结果 Table 2 Results of RF model performance using dry, wet spectra and with EPO and PDS for arable and grassland soil for predicting the SOC content in profile

表2农田样本的精度显示, 其EPO的R2(0.77)虽略大于PDS(0.76), 但前者的RMSE(3.43 g· kg-1) 也略大于后者(3.30 g· kg-1), 因此EPO与PDS对农田样本SOC的预测精度相近。 但草地样本的精度指标显示PDS较EPO更优。 通常, 光谱水分影响校正后的模型精度逊于干样并优于湿样, 但表2中EPO处理下的草地样本精度不如其湿样, 未起到去水的效果, 可能个别深度的精度较差从而影响了整体。

2.4 垂直分布的表现

在0~20 cm的农田耕层, 虽然EPO的预测值均值(蓝线)与观测值均值(红线)最贴合, 但其95%置信区间范围(阴影)也较宽且与湿样相当; 而该深度下PDS的阴影面积更窄。 从20 cm随着深度增加, 四种数据SOC含量的预测值均呈高估现象。 在中部45~50 cm处的预测高估情况, PDS的表现较EPO、 湿样更接近于干样。 在底层70~100 cm, EPO的红蓝两线贴合程度较PDS更佳。 因此, 深度上的局部精度差异令EPO和PDS的整体精度(表2)不相上下。

对于草地样本, EPO和PDS在表层0~35 cm的红蓝曲线都较湿样更贴合, 但三者的阴影面积相近且较干样更宽。 PDS在30~35 cm的低估情况优于EPO。 在40~85 cm的深度, 不论是红蓝曲线的贴合还是阴影面积, 湿样的表现反而更好, 甚至优于干样, 因此1 m整体精度 (表2) 弥补了其表层不佳的表现。 而该深度的EPO与PDS表现相近。 干样在该深度的预测值均值不如湿样好, 可能是受此处各层样本数过少 (每层1~3个), 而极个别预测值较差所致。 虽然表2中EPO的精度不及湿样, 但图3显示EPO和PDS对于表层草地样本的水分校正都有显著效果, 而PDS更优。

图3 两种土地利用下土壤光谱预测有机碳含量在剖面上的结果Fig.3 Prediction results of profile distribution of organic carbon content under two types of land uses

受重力影响, 土柱表层土的平均含水量通常较其深层略低。 尽管土壤光谱与土壤含水量特定波段存在潜在的关系。 但是随着孔隙度和颗粒的改变, 不易找到土壤光谱与水分之间的一般关系[11]。 因此很多研究都对水分进行了先验细分, 以提高水分校正效果。 本研究考虑到野外的快速应用, 未对水分进行先期测定, 而是将其模糊为干与湿两种差异, 类似的做法如Ji等[12], Viscarra Rossel等[13]。 但也有研究表明[14], 水分细分的做法对去水效果的改善并不明显。 不论是农田还是草地, 值得注意的是EPO在表土范围, 其红蓝两曲线较湿样更贴合且可与干样相比, 表明EPO可能更适用于校正表土湿样光谱的水分影响, 这与前言中所列研究大多集中于表土相符。 我们也将在今后的工作中做进一步论证。

3 结论

以青藏高原的色季拉山为研究区, 以26个1 m深原位采集的新鲜土柱为样本, 比较了两种不同的水分影响校正方法分别应用于农田和草地土壤Vis-NIR光谱的效果。 通过机器学习算法RF建立了基于干样光谱、 湿样光谱及土壤水分经EPO和PDS校正后的光谱对剖面SOC含量预测模型。 研究结果表明: 两种校正算法对土地利用类型和土层深度存在依赖性。 对于农田土柱, EPO和PDS法都呈现出良好的水分校正效果, 但在深度上两者存在局部差异; 对于草地土柱, EPO未如PDS展现出去水的效果, 水分对土壤光谱造成的非线性影响无法通过线性变换完全消除。 不论是农田还是草地, EPO和PDS对表层样本的水分校正均显著有效。

参考文献
[1] Zhou Y, Webster R, ViscarraRossel R A, et al. Geoderma, 2019, 334: 124. [本文引用:1]
[2] Jia J, Cao Z, Liu C, et al. Global Change Biology, 2019, 25: 4383. [本文引用:1]
[3] SHI Zhou, XU Dong-yun, TENG Hong-fen, et al(史舟, 徐冬云, 滕洪芬, ). Progress in Geography(地理科学进展), 2018, 37: 79. [本文引用:1]
[4] Li S, Ji W, Chen S, et al. Remote Sensing, 2015, 7: 7029. [本文引用:1]
[5] Minasny B, McBratney A B, BellonMaurel V, et al. Geoderma, 2011, 167-168: 118. [本文引用:2]
[6] Ji W, ViscarraRossel R A, Shi Z. European Journal of Soil Science, 2015, 66(4): 670. [本文引用:1]
[7] Roudier P, Hedley C B, Lobsey C R, et al. Geoderma, 2017, 296: 98. [本文引用:2]
[8] LI Shuo, WANG Shan-qin, SHI Zhou(李硕, 汪善勤, 史舟). Acta Pedologica Sinica(土壤学报), 2015, 52: 1014. [本文引用:1]
[9] Chen S, Xu D, Li S, et al. Land Degradation & Development, 2020, 31: 1026. [本文引用:1]
[10] Li S, Shi Z, Chen S, et al. Environmental Science & Technology, 2015, 49: 4980. [本文引用:1]
[11] Stenberg B, Viscarra Rossel R A, Mouazen A M, et al. Advances in Agronomy (Chapter Five). Academic Press, 2010, 107: 163. [本文引用:1]
[12] Ji W, Li S, Chen S, et al. Soil and Tillage Research, 2016, 155: 492. [本文引用:1]
[13] Viscarra Rossel R A, Lobsey C R, Sharman C, et al. Environmental Science & Technology, 2017, 51: 5630. [本文引用:1]
[14] Wijewardane N K, Ge Y, Morgan C L S. Geoderma, 2016, 267: 92. [本文引用:1]