地表枯枝落叶层影响下的土壤混合光谱特征及解混方法研究
赵伟1, 包妮沙1,2,*, 刘善军1,2, 毛亚纯1,2, 肖冬2,3
1. 东北大学资源与土木工程学院, 辽宁 沈阳 110819
2. 东北大学智慧矿山研究中心, 辽宁 沈阳 110819
3. 东北大学信息学院, 辽宁 沈阳 110819
*通讯联系人 e-mail: baonisha@hotmail.com

作者简介: 赵 伟, 1994年生, 东北大学资源与土木工程学院硕士研究生 e-mail: 740876586@qq.com

摘要

针对草原土壤属性高光谱监测过程中地表枯落物对土壤光谱建模精度的影响。 以呼伦贝尔典型草原土壤光谱为研究对象, 通过室内模拟光谱实验及野外光谱实测验证, 分析混合光谱特征, 揭示枯枝落叶层对土壤光谱影响的规律, 提出了基于光谱相似值约束下的盲源分离ICA算法, 对混合光谱进行解混, 削减枯枝落叶层对土壤光谱的影响。 结果表明, (1)随枯枝落叶盖度增加, 光谱纤维素吸收指数(CAI)增加, 呈二次回归递增趋势, 可有效检验混合光谱中枯枝落叶的覆盖程度; (2)混合光谱在700 nm跃迁波段有明显的斜率陡增现象, 并在1 680及1 754 nm处存在微弱的木质素吸收特征, 在2 100 nm附近处出现强吸收特征; (3)优化后的BSS-ICA算法可有效分离枯枝落叶同土壤的混合光谱, 进而提升野外光谱估测有机碳含量的精度, 分别利用偏最小二乘回归(PLSR)、 支持向量机(SVM)及随机森林(RF)对解混前后光谱建立预测有机碳预测模型; 其中SVM模型预测精度最高, 预测集的 R2从0.71提高到0.75, RMSE从4.82 g·kg-1降低到4.50 g·kg-1。 通过实验研究对定向去除外部环境参数中的地表枯枝落叶层对土壤高光谱影响进行了实证, 并通过野外实测数据验证解混算法的有效性, 为完善野外原位光谱数据反演及监测土壤理化属性提供理论依据。

关键词: 土壤; 地表枯枝落叶; 盲源分离; 混合光谱
中图分类号:TP79 文献标志码:A
Plant Litter Effect of the Soil Organic Carbon Estimation and Unmixing Method Based on the Visible-Near Infrared Spectra
ZHAO Wei1, BAO Ni-sha1,2,*, LIU Shan-jun1,2, MAO Ya-chun1,2, XIAO Dong2,3
1. College of Resources and Civil Engineering, Northeastern University, Shenyang 110819, China
2. Smart Mine Research Center, Northeastern University, Shenyang 110819, China
3. College of Information Science and Engineering, Northeastern University, Shenyang 110819, China
*Corresponding author
Abstract

In terms of the application of spectroscopy in-situ for soil quality monitoring from grassland, this paper takes the soil spectrum of Hulunbeier’s typical grassland as the research object. Verification by indoor simulated spectroscopy experiment and field spectrum measurement, and reveal the influence of plant litter on soil spectrum by analyzing the characteristics of mixed spectra. The blind source separation (BSS) independent component analysis (ICA) algorithm is used to separate the mixed spectra. Furthermore, spectral similarity value (SSV) is calculated to optimize BSS- ICA for unmixing soil spectra. The accuracy of the SOC prediction model before and after unmixing is compared to valid applicability of BSS-ICA algorithm. The results show that, (1) the cellulose absorption index (CAI) based on the characteristics of mixed spectra could effectively detect the extent of plant litter cover in the mixed spectra. CAI index would increase with the increasing of plant litter cover in quadratic regression; (2) It is found that a steep slope occurs at the transition band of 700 nm and weak lignin absorption characteristics in 1 680 and 1 754 nm, strong cellulose absorption occurs at 2 100 nm from mixed spectra; The SOC would be overestimated by about 11.94% using SVM prediction model once soil surface covered by only 5% plant litter. (3) The unmixing method of BSS-ICA can reduce the spectral characteristic from plant litter effect, and using partial least squares (PLSR), support vector machine (SVM) and random forest (RF) to model the prediction of organic carbon before and after unmixing. SVM has the highest accuracy among the three methods. The accuracy of SOC prediction was improved from R2 of 0.71 before unmixing to 0.75 after unmixing, RMSE of 4.82 g·kg-1 before unmixing to 4.50 g·kg-1 after unmixing. The optimized BSS-ICA algorithm can effectively separate soil from mixed spectra with litter and might improve the accuracy of SOC estimation by field spectra. This experimental study of reducing the external factors on soil spectra provides a theoretical basis for SOC prediction based on in-situ measurement of soil spectra.

Keyword: Soil; Plant litter; Blind source separation; Mixed spectrum
引言

近地土壤高光谱分析技术因其方便快捷, 可大范围获取土壤信息的特点得到了广泛应用, 已逐渐成为土壤肥力关键指数动态监测的重要手段[1, 2]。 野外光谱测量过程中易受到环境光线, 土壤水分, 土壤质地, 植物残体等因素的影响[3, 4], 其中地表枯枝落叶和土壤颜色相近, 混合光谱形态特征与土壤相似, 导致在观测过程中, 容易忽略其对土壤光谱的影响, 降低了土壤光谱估测模型的精度[5]。 因此, 如何消除混合光谱中枯枝落叶对土壤光谱的影响, 获取纯土壤光谱, 是野外实测光谱数据能够直接用于土壤属性估测及遥感反演的关键。

在可见光-近红外(350~2 500 nm)光谱区间土壤同植被信息在空间布局上是宏观范围内的离散片混合, 即不考虑端元间相互散射, 混合光谱可由不同端元纯光谱与其相应的丰度分布近似线性表示[6, 7]。 因此, 通过线性解混能够在一定程度上消除枯枝落叶层对土壤光谱的影响。 基于盲源分离(blind source separation, BSS)的独立分量分析(independent component analysis, ICA)算法基于源信号间的统计独立性, 将混合信号表示为不同源信号的线性组合, 并将各成分间统计依赖性降至最小, 可实现对混合光谱的分离, 并在解混绿色植被与土壤的混合光谱中广泛应用[8, 9]。 由于枯枝落叶层光谱与土壤光谱相似, 其对土壤的影响规律以及解混效果还缺乏系统的机理解释和实验证据。

本研究针对内蒙古东北部典型草原土壤(栗钙土), 基于室内模拟实验及野外验证, 提出地表草本枯枝落叶层对草原土壤光谱的影响规律及特征, 优化ICA解混算法, 消减草本枯枝落叶层光谱对土壤光谱的影响, 通过对比解混前后光谱估测土壤有机碳(soil organic carbon, SOC)的精度验证解混效果。

1 实验部分
1.1 研究区及土壤样品制备

研究区位于内蒙古呼伦贝尔草原中部, 地处海拉尔盆地与大兴安岭之间, 伊敏河中下游西侧(图1), 样区植被覆盖度在0%~15%左右。 实验土壤为栗钙土, 属均质型, 土种质地沙粘适中, 表层为暗棕色粘壤土为该地区主要土类。 样区土壤平均有机碳含量为21.13 g· kg-1、 有效氮36.85 mg· kg-1、 有效磷6.51 mg· kg-1、 有效钾221.8 mg· kg-1

图1 研究区域位置及样方点分布Fig.1 Geographical location of study area and distribution of sampling points

采样时间为2016年8月5日— 10日, 采集土壤期间无降雨, 在布设好的10 m× 10 m的大样方内部随机选取三个1 m× 1 m的小样方, 使用土钻钻取表层(0~20 cm)土, 并把三个小样方获取的土壤混合, 除去砾石、 植物残体等杂物, 对样方内牧草进行刈割, 所收集地表凋落物主要为往年半分解物。

土壤和草样自然风干后, 利用研钵研磨土壤, 并用18目筛做二次过筛处理。 预处理后的土样分为两份, 一份用于测量室内土壤光谱, 另一份采用重铬酸钾容量法测定土壤的有机碳含量。 SOC含量数据统计分析如表1所示, 其中偏度为0.23, 峰度为-0.64, 均小于1; K-S检测中p值为0.72, 土样SOC含量接近正态分布。

表1 SOC含量数据分析 Table 1 Statistical analysis of SOC content
1.2 枯枝落叶-土壤混合光谱实验

室内模拟实验, 枯枝落叶层采用样方内披碱草(elymus dahuricus)枯落物。 为更好的分析枯枝落叶层光谱特征及影响机理, 模拟单一变量对光谱的影响, 因此对土壤、 披碱草样品进行烘干处理, 消除水分对土壤光谱的影响。 土样草样烘干前室温下的相对含水量分别为0.31%和5.13%。 所用草样平均有机碳含量为584.51 g· kg-1, 如图2(a)所示, 实验共设计8个覆盖度(0%, 2.5%, 5%, 7.5%, 10%, 15%, 20%, 30%)。

图2 室内(a)及原位土壤vis-NIR光谱测量(b)Fig.2 Indoor (a) and in situ (b) vis-NIR spectra of soil

土样光谱采集使用美国SVC HR-1024地物光谱仪测量, 光谱波长范围343~2 500 nm。 室内测量在夜间暗室内进行。 传感器镜头14° , 设置50 W卤素灯为唯一光源, 每个土样共测6次, 每间隔两次对土样旋转微动, 以此获取更详尽的光谱信息。 所测同一土样光谱数据两两取均值融合后得到该样本的实际光谱反射率。

1.3 野外原位土壤光谱测量

野外原位光谱实验如图2(b)所示, 样地土壤, 往年半分解枯落物相对含水量分别为6%~8%和3%~5%, 野外光谱测量方法与室内实验相同。 测量光谱前对样方均进行同一高度的拍照。 之后经过对图像进行灰度处理后获取草杆像素个数, 并与视场像素个数比较, 近似获取实际覆盖度数据。 所得原位实测光谱去除1 400及1 900 nm强水汽吸收带, 消除水分对土壤光谱的干扰。

1.4 光谱数据预处理及枯枝落叶光谱检测

利用Savizky-Golay滤波对光谱数据做平滑去噪处理, 并在后续混合光谱特征分析和处理中剔除340~450和2 400~2 500 nm这两个信噪比较低的波段。

引入纤维素吸收指数(cellulose absorption index, CAI)表征枯枝落叶的覆盖, 检测混合光谱的有效性。 CAI是由Nagler(2000)提出, 描述了在2 000~2 240 nm波段处纤维素的吸收特征。 CAI值计算公式如[式(1)]所示, 式中R2.0, R2.1, R2.2分别为2 020, 2 100以及2 220 nm处的反射率。

CAI=0.5(R2.0+R2.2)-R2.1(1)

1.5 独立分量分析

盲源分离(BSS)指在未知源信号及相应组分的情况下, 仅由观测的混合信号, 提取源信号的过程[8]。 针对线性混合, 混合信号可以被表示为式(2)

X(t)=AS(t)+α(t)(2)

式(2)中, X(t)=[X1(t), …, Xm(t)]T为混合信号, S(t)=[S1(t), …, Sn(t)]T为源信号, 混合矩阵Am× n维矩阵。 α (t)为m维噪声分量矩阵。 一般使用该方程的简化模型, 即不考虑噪声的影响。 以式(3)来确定源信号s(t)的估计信号Y(t)=[Y1(t), …, Yn(t)]T

Y(t)=WX(t)(3)

其中Wn× m维度的解混矩阵, 理论上来说WA的逆矩阵, 即W=A#, 若WA=I(In× n单位矩阵), 则Y(t)=S(t), 达到恢复源信号的目的。 算法具体流程如图3所示, 其中SSV值在0~ 2内则输出Y, 否则返回迭代步骤重新计算解混矩阵。 且SSV具有可同时度量两相似光谱的大小和形状来判别光谱相似性的优势, 传统的光谱相似度量方法(如: 欧氏距离、 相关系数、 光谱角等)只计算两个光谱间的大小(亮度)或形状[11]

图3 ICA算法流程图Fig.3 ICA algorithm flow chart

SSV计算公式如式(4)所示: 其中de为广义欧式距离, 由式(5)计算。 r^由1减去相关系数的平方的差[式(6)], 相关系数r由式(7)得到。

SSV=de2+r^2(4)

de=1Ni=1N(Xi-Yi)2(5)

其中N为光谱波段数, X, YN维光谱矢量。

r^=1-r2(6)

r=i=1N(Xi-μX)(Yi-μY)(N-1)σXσY(7)

其中, μ Xμ Y分别为两光谱的均值; σ Xσ Y分别为两光谱向量的标准偏差。 SSV的大小范围在0~ 2, SSV越小表明光谱相似程度越高, SSV为0时, 表明两条光谱共线。

1.6 估算模型建立与验证

通过土壤光谱建模估测有机碳的精度验证解混精度, 分别采用偏最小二乘(PLSR)、 支持向量机(SVM)和随机森林算法(RF)建立估算模型。 其中, PLSR可提取光谱数据中导致土壤理化性质变化最大的成分, 且所建模型的鲁棒性较好。 SVM在处理小样本、 高维模式识别及非线性分析具有其特有的优势, 且可以基于样本全谱信息建模, 已在高光谱特征建模广泛应用。 RF在使用高维数据进行预测时运行速度较快、 分类精度高且稳定性较好[10]

建模预测集数据包含115条光谱数据(23× 5, 2.5%, 5%, 7.5%, 10%, 15%), 建模集包含250条光谱曲线(50× 5)。 建模数据采用完全交叉验证(full cross validation)方法对模型进行验证, 并用独立验证集对模型进行验证。 选取建模集和预测集R2和RMSE作为模型精度评价指标。

2 结果与讨论
2.1 土壤-枯枝落叶混合场景光谱特征分析

2.1.1 枯枝落叶光谱表征

土样表面存在枯枝落叶时, CAI值会显著增大。 当CAI值变为正值时, 可检验出约20%左右的土壤表面已经被枯枝落叶覆盖[12]

如图4所示, 将CAI值同覆盖度做二次多项式回归可看出, 随覆盖度的不断增加, CAI值趋于正值方向增长。 裸土CAI值均值为-1.74, 在盖度约为15%时, 已有部分CAI值显示为正值, 30%盖度时, 绝大多数土样的CAI值为正值。 依此表明室内模拟实验测量所得混合光谱可有效反映枯枝落叶光谱特征。

图4 纤维素吸收指数(CAI)Fig4. Cellulose absorption index (CAI)

2.1.2 混合光谱波谱特征分析

如图5所示, 将室内获取的各盖度样本的光谱数据取均值, 发现光谱反射率随枯枝落叶盖度的增加而增大, 但其光谱的波形并未发生太大的变化。

图5 不同覆盖度下混合光谱反射率均值Fig.5 Mixed mean spectral reflectance of soil under different coverages

Vis-NIR跃迁波段处(680~780 nm)存在枯枝落叶土样的光谱斜率值明显大于裸土光谱的斜率值[13]。 如图5所示, 当土壤表面存在枯枝落叶时, Vis-NIR过渡处的光谱斜率值会有一个陡增的现象。 此处出现斜率陡增的现象主要由于枯枝落叶要比土壤更亮。 SWIR(1 100~2 500 nm)波段, 随盖度增加在1 680及1 754 nm处存在微弱的木质素吸收特征, 在2 100 nm附近处出现强吸收特征。 该特征主要由于醇羟基— OH官能团化合物所致[14], 例如糖, 淀粉和纤维素。 在植物凋落物中, 此波段的吸收特征是由于凋落物中存在纤维素, 半纤维素, 木质素和其他结构化合物, 而纯土壤光谱在该波段处无吸收特征。

2.2 盲源分离结果验证

2.2.1 盲源分离后光亲特征

如图6所示, 在15%覆盖度以下, 裸土同分离结果的光谱相似值基本在0至 2之内, 分离结果同裸土光谱相似程度高。 盖度高于15%时, 已有大部分相似值超限, 分离结果较差。 因此, 枯枝落叶盖度在15%以下, ICA算法能够很好的分离混合光谱。

图6 不同盖度下分离结果同裸土光谱SSV值Fig.6 Spectral similarity values calculated from extracted spectra and the spectrum of bare soil

解混后土壤光谱在700 nm处斜率[图7(a)]及2 100 nm附近波峰面积[图7(b)]有明显降低和缩小。 在15%覆盖度以下, 纤维素吸收峰面积低于土壤, 2 100 nm处纤维素吸收特征减弱。 表明ICA算法可有效除去低枯枝落叶覆盖时对土壤光谱观测的影响。

图7 700 nm处斜率解混前后对比(a)及2 100 nm附近波峰面积(b)Fig.7 Slope contrast at 700 nm between original and ICA (a), and peak area near 2 100 nm (b)

2.2.2 不同回归模型建模估测SOC

采用解混前后光谱数据建立SOC估算模型(表2), PLSR精度为三种方法中最低, RF预测集精度偏低, 只有SVM方法在建模集和预测集都有较好估算效果, 故采用SVM作为SOC估算模型方法。

表2 解混前后基于PLSR, SVM, RF估算SOC模型精度 Table 2 Estimation accuracy of SOC spectral models by using PLSR, SVM and RF before and after unmixing

利用混合光谱对SOC含量进行估测, SOC含量明显存在高估现象(图8), 即使土样表面仅有5%的枯枝落叶覆盖, SOC预测均值也高于裸土实测土壤有机碳含量2.57 g· kg-1, 高估约为11.94%。 枯叶覆盖度高于30%时, 高估量在11.91 g· kg-1左右, 预测误差55.34%。 因此在覆盖度较低的情况下, SOC含量的预测要考虑枯枝落叶层的干扰。

图8 混合光谱估测SOC含量高估量Fig.8 Overestimation of SOC content of mixed spectra with different coverages of plant litter

ICA算法解混所得土壤光谱SVM估算模型精度照解混前光谱所建模型有一定的提升。 其中, 建模集精度提高至 Rcv2=0.91, RMSEcv=2.98 g· kg-1; 验证集提高至 Rp2=0.75, RMSEp=4.50 g· kg-1。 表明基于ICA算法可以有效去除枯枝落叶对土壤光谱的影响, 经解混后的土壤光谱数据可提高估算模型精度。

2.3 野外光谱验证

如图9所示, 不同枯枝落叶盖度下野外实测光谱数据, 为消除测量过程中水分的影响, 去除了1 450和1 900 nm水分吸收带, 混合光谱特征及规律与室内实验模拟下混合光谱特征一致。

图9 野外实测光谱Fig.9 In situ mixed spectra

如图10所示, 利用优化后的ICA算法解混后土壤光谱与野外裸土光谱计算光谱相似值, 其SSV值基本分布在0~ 2内, 表明该算法针对覆盖度低于15%的野外实测光谱同样具有良好的解混效果。

图10 解混后土壤光谱SSVFig.10 SSV of soil spectra after unmixing

3 结论

针对典型草原土壤光谱测量及建模中, 地表草本枯枝落叶对土壤光谱的影响, 通过室内模拟实验揭示混合光谱特征, 优化ICA解混算法, 进一步采用野外实测光谱对该解混方法的有效性进行验证。

结果表明: (1)随着地表枯枝落叶盖度增加, 光谱纤维素指数逐渐增大, 并与地表枯枝落叶盖度呈现二次递增关系; (2)混合光谱在可见光波段斜率高于纯土壤光谱, 并在1 680及1 754 nm波段存在微弱的木质素吸收特征, 在2 100 nm附近处出现强吸收特征。 (3)经过室内模拟实验及野外光谱数据验证, 利用SSV对ICA算法进行优化后, 解混后土壤与纯裸土光谱角在0~ 2范围内, 基于SVM模型的土壤有机碳预测集的R2从0.71提高到0.75, RMSE从4.82 g· kg-1降低为4.50 g· kg-1, 提高了土壤有机碳光谱模型的精度, 为野外原位光谱数据处理及土壤属性反演提供技术支持。

参考文献
[1] HONG Yong-sheng, ZHU Ya-xing, SU Xue-ping, et al(洪永胜, 朱亚星, 苏学平, ). Spectroscopy and Spectral Analysis(光谱学与光谱分析), 2017, 37(11). [本文引用:1]
[2] Yin Z, Hartemink A E, Zhou S, et al. Science of The Total Environment, 2019, 647: 1230. [本文引用:1]
[3] Bao N, Wu L, Ye B, et al. Geoderma, 2017, 288: 47. [本文引用:1]
[4] SHI Zhou, XU Dong-yun, TENG Hong-fen, et al(史舟, 徐冬云, 滕洪芬, ). Progress in Geography(地理科学进展), 2018, 37(1): 79. [本文引用:1]
[5] Rodionov A, Patzold S, Welp G, et al. Soil and Tillage Research, 2016, 163: 89. [本文引用:1]
[6] LIU Shan-jun, ZHUO Jian-ying, WU Li-xin, et al(刘善军, 卓建英, 吴立新, ). Science & Technology Review, 2011, 29(35): 24. [本文引用:1]
[7] TONG Qing-xi, ZHANG Bing, ZHENG Lan-fen(童庆禧, 张兵, 郑兰芬). Hyperspectral Remote Sensing: Technology and Application(高光谱遥感: 原理, 技术与应用). Beijing: Higher Education Press(北京: 高等教育出版社), 2006. [本文引用:1]
[8] Ouerghemmi W, Gomez C, Naceur S, et al. Geoderma, 2011, 163(3/4): 227. [本文引用:2]
[9] LIU Ya, PAN Xian-zhang, SHI Rong-jie, et al(刘娅, 潘贤章, 石荣杰, ). Acta Pedologica Sinica(土壤学报), 2016, 53(2): 322. [本文引用:1]
[10] SHI Zhou(史舟). Principle and Method of Soil Surface Hyperspectral Remote Sensing(土壤地面高光谱遥感原理与方法). Beijing: China Science Publishing & Media Ltd. (北京: 中国科技出版传媒股份有限公司), 2014. [本文引用:1]
[11] ZHAO Chun-hui, TIAN Ming-hua, LI Jia-wei, et al(赵春晖, 田明华, 李佳伟, ). Journal of Harbin Engineering University(哈尔滨工程大学学报), 2017, 38(8): 1179. [本文引用:1]
[12] Nagler P L, Daughtry C S T, Goward S N. Remote Sensing of Environment, 2000, 71(2): 207. [本文引用:1]
[13] Rodionov A, Welp G, Damerow L, et al. Soil and Tillage Research, 2015, 145: 93. [本文引用:1]
[14] WANG He-xin, LI Gen-zhu, YU Dong-mei, et al(王贺新, 李根柱, 于冬梅, ). Chinese Journal of Ecology(生态学杂志), 2008, 27(1): 83. [本文引用:1]