作者简介: 赵 伟, 1994年生, 东北大学资源与土木工程学院硕士研究生 e-mail: 740876586@qq.com
针对草原土壤属性高光谱监测过程中地表枯落物对土壤光谱建模精度的影响。 以呼伦贝尔典型草原土壤光谱为研究对象, 通过室内模拟光谱实验及野外光谱实测验证, 分析混合光谱特征, 揭示枯枝落叶层对土壤光谱影响的规律, 提出了基于光谱相似值约束下的盲源分离ICA算法, 对混合光谱进行解混, 削减枯枝落叶层对土壤光谱的影响。 结果表明, (1)随枯枝落叶盖度增加, 光谱纤维素吸收指数(CAI)增加, 呈二次回归递增趋势, 可有效检验混合光谱中枯枝落叶的覆盖程度; (2)混合光谱在700 nm跃迁波段有明显的斜率陡增现象, 并在1 680及1 754 nm处存在微弱的木质素吸收特征, 在2 100 nm附近处出现强吸收特征; (3)优化后的BSS-ICA算法可有效分离枯枝落叶同土壤的混合光谱, 进而提升野外光谱估测有机碳含量的精度, 分别利用偏最小二乘回归(PLSR)、 支持向量机(SVM)及随机森林(RF)对解混前后光谱建立预测有机碳预测模型; 其中SVM模型预测精度最高, 预测集的 R2从0.71提高到0.75, RMSE从4.82 g·kg-1降低到4.50 g·kg-1。 通过实验研究对定向去除外部环境参数中的地表枯枝落叶层对土壤高光谱影响进行了实证, 并通过野外实测数据验证解混算法的有效性, 为完善野外原位光谱数据反演及监测土壤理化属性提供理论依据。
In terms of the application of spectroscopy in-situ for soil quality monitoring from grassland, this paper takes the soil spectrum of Hulunbeier’s typical grassland as the research object. Verification by indoor simulated spectroscopy experiment and field spectrum measurement, and reveal the influence of plant litter on soil spectrum by analyzing the characteristics of mixed spectra. The blind source separation (BSS) independent component analysis (ICA) algorithm is used to separate the mixed spectra. Furthermore, spectral similarity value (SSV) is calculated to optimize BSS- ICA for unmixing soil spectra. The accuracy of the SOC prediction model before and after unmixing is compared to valid applicability of BSS-ICA algorithm. The results show that, (1) the cellulose absorption index (CAI) based on the characteristics of mixed spectra could effectively detect the extent of plant litter cover in the mixed spectra. CAI index would increase with the increasing of plant litter cover in quadratic regression; (2) It is found that a steep slope occurs at the transition band of 700 nm and weak lignin absorption characteristics in 1 680 and 1 754 nm, strong cellulose absorption occurs at 2 100 nm from mixed spectra; The SOC would be overestimated by about 11.94% using SVM prediction model once soil surface covered by only 5% plant litter. (3) The unmixing method of BSS-ICA can reduce the spectral characteristic from plant litter effect, and using partial least squares (PLSR), support vector machine (SVM) and random forest (RF) to model the prediction of organic carbon before and after unmixing. SVM has the highest accuracy among the three methods. The accuracy of SOC prediction was improved from R2 of 0.71 before unmixing to 0.75 after unmixing, RMSE of 4.82 g·kg-1 before unmixing to 4.50 g·kg-1 after unmixing. The optimized BSS-ICA algorithm can effectively separate soil from mixed spectra with litter and might improve the accuracy of SOC estimation by field spectra. This experimental study of reducing the external factors on soil spectra provides a theoretical basis for SOC prediction based on in-situ measurement of soil spectra.
近地土壤高光谱分析技术因其方便快捷, 可大范围获取土壤信息的特点得到了广泛应用, 已逐渐成为土壤肥力关键指数动态监测的重要手段[1, 2]。 野外光谱测量过程中易受到环境光线, 土壤水分, 土壤质地, 植物残体等因素的影响[3, 4], 其中地表枯枝落叶和土壤颜色相近, 混合光谱形态特征与土壤相似, 导致在观测过程中, 容易忽略其对土壤光谱的影响, 降低了土壤光谱估测模型的精度[5]。 因此, 如何消除混合光谱中枯枝落叶对土壤光谱的影响, 获取纯土壤光谱, 是野外实测光谱数据能够直接用于土壤属性估测及遥感反演的关键。
在可见光-近红外(350~2 500 nm)光谱区间土壤同植被信息在空间布局上是宏观范围内的离散片混合, 即不考虑端元间相互散射, 混合光谱可由不同端元纯光谱与其相应的丰度分布近似线性表示[6, 7]。 因此, 通过线性解混能够在一定程度上消除枯枝落叶层对土壤光谱的影响。 基于盲源分离(blind source separation, BSS)的独立分量分析(independent component analysis, ICA)算法基于源信号间的统计独立性, 将混合信号表示为不同源信号的线性组合, 并将各成分间统计依赖性降至最小, 可实现对混合光谱的分离, 并在解混绿色植被与土壤的混合光谱中广泛应用[8, 9]。 由于枯枝落叶层光谱与土壤光谱相似, 其对土壤的影响规律以及解混效果还缺乏系统的机理解释和实验证据。
本研究针对内蒙古东北部典型草原土壤(栗钙土), 基于室内模拟实验及野外验证, 提出地表草本枯枝落叶层对草原土壤光谱的影响规律及特征, 优化ICA解混算法, 消减草本枯枝落叶层光谱对土壤光谱的影响, 通过对比解混前后光谱估测土壤有机碳(soil organic carbon, SOC)的精度验证解混效果。
研究区位于内蒙古呼伦贝尔草原中部, 地处海拉尔盆地与大兴安岭之间, 伊敏河中下游西侧(图1), 样区植被覆盖度在0%~15%左右。 实验土壤为栗钙土, 属均质型, 土种质地沙粘适中, 表层为暗棕色粘壤土为该地区主要土类。 样区土壤平均有机碳含量为21.13 g· kg-1、 有效氮36.85 mg· kg-1、 有效磷6.51 mg· kg-1、 有效钾221.8 mg· kg-1。
采样时间为2016年8月5日— 10日, 采集土壤期间无降雨, 在布设好的10 m× 10 m的大样方内部随机选取三个1 m× 1 m的小样方, 使用土钻钻取表层(0~20 cm)土, 并把三个小样方获取的土壤混合, 除去砾石、 植物残体等杂物, 对样方内牧草进行刈割, 所收集地表凋落物主要为往年半分解物。
土壤和草样自然风干后, 利用研钵研磨土壤, 并用18目筛做二次过筛处理。 预处理后的土样分为两份, 一份用于测量室内土壤光谱, 另一份采用重铬酸钾容量法测定土壤的有机碳含量。 SOC含量数据统计分析如表1所示, 其中偏度为0.23, 峰度为-0.64, 均小于1; K-S检测中p值为0.72, 土样SOC含量接近正态分布。
![]() | 表1 SOC含量数据分析 Table 1 Statistical analysis of SOC content |
室内模拟实验, 枯枝落叶层采用样方内披碱草(elymus dahuricus)枯落物。 为更好的分析枯枝落叶层光谱特征及影响机理, 模拟单一变量对光谱的影响, 因此对土壤、 披碱草样品进行烘干处理, 消除水分对土壤光谱的影响。 土样草样烘干前室温下的相对含水量分别为0.31%和5.13%。 所用草样平均有机碳含量为584.51 g· kg-1, 如图2(a)所示, 实验共设计8个覆盖度(0%, 2.5%, 5%, 7.5%, 10%, 15%, 20%, 30%)。
土样光谱采集使用美国SVC HR-1024地物光谱仪测量, 光谱波长范围343~2 500 nm。 室内测量在夜间暗室内进行。 传感器镜头14° , 设置50 W卤素灯为唯一光源, 每个土样共测6次, 每间隔两次对土样旋转微动, 以此获取更详尽的光谱信息。 所测同一土样光谱数据两两取均值融合后得到该样本的实际光谱反射率。
野外原位光谱实验如图2(b)所示, 样地土壤, 往年半分解枯落物相对含水量分别为6%~8%和3%~5%, 野外光谱测量方法与室内实验相同。 测量光谱前对样方均进行同一高度的拍照。 之后经过对图像进行灰度处理后获取草杆像素个数, 并与视场像素个数比较, 近似获取实际覆盖度数据。 所得原位实测光谱去除1 400及1 900 nm强水汽吸收带, 消除水分对土壤光谱的干扰。
利用Savizky-Golay滤波对光谱数据做平滑去噪处理, 并在后续混合光谱特征分析和处理中剔除340~450和2 400~2 500 nm这两个信噪比较低的波段。
引入纤维素吸收指数(cellulose absorption index, CAI)表征枯枝落叶的覆盖, 检测混合光谱的有效性。 CAI是由Nagler(2000)提出, 描述了在2 000~2 240 nm波段处纤维素的吸收特征。 CAI值计算公式如[式(1)]所示, 式中R2.0, R2.1, R2.2分别为2 020, 2 100以及2 220 nm处的反射率。
盲源分离(BSS)指在未知源信号及相应组分的情况下, 仅由观测的混合信号, 提取源信号的过程[8]。 针对线性混合, 混合信号可以被表示为式(2)
式(2)中, X(t)=[X1(t), …, Xm(t)]T为混合信号, S(t)=[S1(t), …, Sn(t)]T为源信号, 混合矩阵A为m× n维矩阵。 α (t)为m维噪声分量矩阵。 一般使用该方程的简化模型, 即不考虑噪声的影响。 以式(3)来确定源信号s(t)的估计信号Y(t)=[Y1(t), …, Yn(t)]T。
其中W为n× m维度的解混矩阵, 理论上来说W为A的逆矩阵, 即W=A#, 若WA=I(I为n× n单位矩阵), 则Y(t)=S(t), 达到恢复源信号的目的。 算法具体流程如图3所示, 其中SSV值在0~
SSV计算公式如式(4)所示: 其中de为广义欧式距离, 由式(5)计算。
其中N为光谱波段数, X, Y为N维光谱矢量。
其中, μ X和μ Y分别为两光谱的均值; σ X和σ Y分别为两光谱向量的标准偏差。 SSV的大小范围在0~
通过土壤光谱建模估测有机碳的精度验证解混精度, 分别采用偏最小二乘(PLSR)、 支持向量机(SVM)和随机森林算法(RF)建立估算模型。 其中, PLSR可提取光谱数据中导致土壤理化性质变化最大的成分, 且所建模型的鲁棒性较好。 SVM在处理小样本、 高维模式识别及非线性分析具有其特有的优势, 且可以基于样本全谱信息建模, 已在高光谱特征建模广泛应用。 RF在使用高维数据进行预测时运行速度较快、 分类精度高且稳定性较好[10]。
建模预测集数据包含115条光谱数据(23× 5, 2.5%, 5%, 7.5%, 10%, 15%), 建模集包含250条光谱曲线(50× 5)。 建模数据采用完全交叉验证(full cross validation)方法对模型进行验证, 并用独立验证集对模型进行验证。 选取建模集和预测集R2和RMSE作为模型精度评价指标。
2.1.1 枯枝落叶光谱表征
土样表面存在枯枝落叶时, CAI值会显著增大。 当CAI值变为正值时, 可检验出约20%左右的土壤表面已经被枯枝落叶覆盖[12]。
如图4所示, 将CAI值同覆盖度做二次多项式回归可看出, 随覆盖度的不断增加, CAI值趋于正值方向增长。 裸土CAI值均值为-1.74, 在盖度约为15%时, 已有部分CAI值显示为正值, 30%盖度时, 绝大多数土样的CAI值为正值。 依此表明室内模拟实验测量所得混合光谱可有效反映枯枝落叶光谱特征。
2.1.2 混合光谱波谱特征分析
如图5所示, 将室内获取的各盖度样本的光谱数据取均值, 发现光谱反射率随枯枝落叶盖度的增加而增大, 但其光谱的波形并未发生太大的变化。
Vis-NIR跃迁波段处(680~780 nm)存在枯枝落叶土样的光谱斜率值明显大于裸土光谱的斜率值[13]。 如图5所示, 当土壤表面存在枯枝落叶时, Vis-NIR过渡处的光谱斜率值会有一个陡增的现象。 此处出现斜率陡增的现象主要由于枯枝落叶要比土壤更亮。 SWIR(1 100~2 500 nm)波段, 随盖度增加在1 680及1 754 nm处存在微弱的木质素吸收特征, 在2 100 nm附近处出现强吸收特征。 该特征主要由于醇羟基— OH官能团化合物所致[14], 例如糖, 淀粉和纤维素。 在植物凋落物中, 此波段的吸收特征是由于凋落物中存在纤维素, 半纤维素, 木质素和其他结构化合物, 而纯土壤光谱在该波段处无吸收特征。
2.2.1 盲源分离后光亲特征
如图6所示, 在15%覆盖度以下, 裸土同分离结果的光谱相似值基本在0至
![]() | 图6 不同盖度下分离结果同裸土光谱SSV值Fig.6 Spectral similarity values calculated from extracted spectra and the spectrum of bare soil |
解混后土壤光谱在700 nm处斜率[图7(a)]及2 100 nm附近波峰面积[图7(b)]有明显降低和缩小。 在15%覆盖度以下, 纤维素吸收峰面积低于土壤, 2 100 nm处纤维素吸收特征减弱。 表明ICA算法可有效除去低枯枝落叶覆盖时对土壤光谱观测的影响。
![]() | 图7 700 nm处斜率解混前后对比(a)及2 100 nm附近波峰面积(b)Fig.7 Slope contrast at 700 nm between original and ICA (a), and peak area near 2 100 nm (b) |
2.2.2 不同回归模型建模估测SOC
采用解混前后光谱数据建立SOC估算模型(表2), PLSR精度为三种方法中最低, RF预测集精度偏低, 只有SVM方法在建模集和预测集都有较好估算效果, 故采用SVM作为SOC估算模型方法。
![]() | 表2 解混前后基于PLSR, SVM, RF估算SOC模型精度 Table 2 Estimation accuracy of SOC spectral models by using PLSR, SVM and RF before and after unmixing |
利用混合光谱对SOC含量进行估测, SOC含量明显存在高估现象(图8), 即使土样表面仅有5%的枯枝落叶覆盖, SOC预测均值也高于裸土实测土壤有机碳含量2.57 g· kg-1, 高估约为11.94%。 枯叶覆盖度高于30%时, 高估量在11.91 g· kg-1左右, 预测误差55.34%。 因此在覆盖度较低的情况下, SOC含量的预测要考虑枯枝落叶层的干扰。
![]() | 图8 混合光谱估测SOC含量高估量Fig.8 Overestimation of SOC content of mixed spectra with different coverages of plant litter |
ICA算法解混所得土壤光谱SVM估算模型精度照解混前光谱所建模型有一定的提升。 其中, 建模集精度提高至
针对典型草原土壤光谱测量及建模中, 地表草本枯枝落叶对土壤光谱的影响, 通过室内模拟实验揭示混合光谱特征, 优化ICA解混算法, 进一步采用野外实测光谱对该解混方法的有效性进行验证。
结果表明: (1)随着地表枯枝落叶盖度增加, 光谱纤维素指数逐渐增大, 并与地表枯枝落叶盖度呈现二次递增关系; (2)混合光谱在可见光波段斜率高于纯土壤光谱, 并在1 680及1 754 nm波段存在微弱的木质素吸收特征, 在2 100 nm附近处出现强吸收特征。 (3)经过室内模拟实验及野外光谱数据验证, 利用SSV对ICA算法进行优化后, 解混后土壤与纯裸土光谱角在0~
[1] |
|
[2] |
|
[3] |
|
[4] |
|
[5] |
|
[6] |
|
[7] |
|
[8] |
|
[9] |
|
[10] |
|
[11] |
|
[12] |
|
[13] |
|
[14] |
|