作者简介: 王惠敏,女, 1994年生,西安煤航遥感信息有限公司助理工程师 e-mail: wanghm9423@126.com
目前星载高光谱传感器较少, 基于高光谱影像的土壤盐分含量估算研究仍处于探索之中。 高分五号(GF-5)是目前国内光谱分辨率最高的卫星。 目的是研究高分五号高光谱影像大面积估算干旱区盐渍化土壤盐分含量的可行性。 选择新疆焉耆为研究区域, 采集了198个土壤样本。 首先, 检测土壤样本中的全盐量、 Na+、 Ca2+、
There are few spaceborne hyperspectral sensors, and the estimation of soil salt content based on hyperspectral images is still under exploration. GF-5 is the satellite with the highest spectral resolution in China. This paper aims to study the feasibility of estimating salt content of saline soil in arid areas on a large area using GF-5 hyperspectral image. In this paper, 198 soil samples were collected from the experimental field at Yanqi, Xinjiang. Firstly, the soil salt contents (total salt content, Na+, Ca2+,
高分五号卫星是我国高分家族中的重要一员, 其高光谱分辨率在环境监测方面起着重要作用。 目前, 高分五号高光谱数据已应用在地物分类[1]、 矿物识别[2]、 云检测[3]、 水资源监测[4]、 植被信息提取[5]、 悬浮泥沙浓度反演[6]、 土壤有机质反演[7]等方面, 在土壤盐分含量估算方面研究较少。
土壤盐分是影响农业发展的重要因素, 土壤盐分含量过高会导致土壤肥力下降, 进而引起土地退化, 无法进行正常的农业活动。 因此, 对干旱区新疆焉耆农田土壤盐分的研究显得尤为重要。 随着大量遥感卫星的发射升空, 遥感数据获取方式更加便捷, 雷达遥感、 多光谱遥感成为土壤盐分含量反演的重要手段。 张智韬[8]以Sentinel-1雷达影像作为数据源, 通过组合两组雷达后向散射系数构建多种指数, 建立了不同深度的土壤含盐量反演模型。 Tripathi等[9]使用Sentinel-1 SAR合成孔径雷达数据生成后向散射系数, Sentinel-2A多光谱数据生成NDSI归一化差异盐度指数, 并使用地面设备直接收集土壤电导率, 对印度旁遮普地区的土壤盐分进行估算; 吴亚坤等[10]利用Landsat TM影像数据, 通过建立土壤盐分多元线性回归解译模型和反距离权重插值相结合的方法分析了研究区土壤盐分空间分布的三维特征。
高光谱有更多的波段, 能较好地获取与土壤盐分相关的光谱信息。 Wang等[11]基于野外近地面实测高光谱估算了土壤中的盐分含量, 将连续投影算法应用于特征波段分析中, 估算模型精度有所提高。 而使用高光谱卫星数据进行土壤盐分含量大面积估算的研究还处于探索阶段。 安德玉等[12]以黄河三角洲滨海盐渍土为例, 使用HICO高光谱影像结合现场实测高光谱数据反演了表层土壤全盐含量。 厉彦玲等[13]将环境一号HSI高光谱影像与Landsat8多光谱影像进行融合, 对山东省垦利县土壤盐分进行反演, 结果表明融合后影像反演模型精度明显高于单一影像。 Bai等[14]使用环境一号高光谱数据绘制了松嫩平原北部地区土壤的盐度和碱度分布图, 但环境一号高光谱数据的空间分辨率为100 m, 高质量的卫星数据才能得到更好的估算效果。 Wang等[15]对比分析了实验室高光谱与高分五号高光谱反演土壤盐分含量的能力, 发现当土壤中盐分含量低时, 两种土壤高光谱曲线较为相近, 随着土壤盐分含量的增加, 实验室光谱特征有微小的变化, 而高分五号光谱对土壤盐分含量的变化有更强烈的响应, 因此, 高分五号光谱在土壤盐分含量反演中比实验室光谱具有更大的优势。
综上所述, 高分五号作为全球首个用于大气和陆地观测的综合高光谱卫星, 在土壤盐分含量估算方面的能力是值得进一步探究的。 因此, 首先基于实验室采集的光谱建立了土壤盐分含量估算的高精度模型, 然后应用相同的反演方法, 建立了高光谱影像光谱估算土壤盐分含量的模型, 模型精度达到大面积制图的标准。 最后, 使用最优估算模型, 基于整幅高光谱影像估算了研究区域的土壤盐分含量。 估算结果与实测值的插值图对比后表明, 高分五号高光谱影像大面积估算干旱区盐渍化土壤的盐分含量是十分可靠的。
研究区域位于新疆维吾尔自治区焉耆回族自治县(41°54'—41°58'N, 86°20'—86°24'E)。 焉耆是干旱大陆性气候, 日照充足, 降水较少, 蒸发量大。 焉耆年平均气温为7.9 ℃, 年均降水量为72.3 mm, 年均蒸发量为1 887 mm。
土壤样本采集工作于2019年9月份开展。 选取土壤盐渍化较为严重的区域及周边农田裸土区域, 采用梅花点法进行土壤采样, 采样深度为表层0~20 cm, 并同步记录采样点位置, 共采集198个土壤样本。 每个土壤样本均在实验室采集光谱, 并测定土壤盐分的含量。 采样点如图1所示, 底图为高分五号影像。
测量土壤光谱前, 将土壤样本风干、 研磨, 过100目筛。 严格按照光谱测量规范, 在实验室使用FieldSpec3地物光谱仪测定土壤样本的光谱反射率, 测得的光谱范围为350~2 500 nm, 光谱分辨率为1 nm。 实验室测定的土壤样本光谱见图2。
实验室光谱在350~650 nm上升较快, 650~1 800 nm上升缓慢, 940、 1 400和1 900 nm是水汽吸收带, 自2 100 nm后曲线开始下降。 由于测量过程中会有噪声影响, 需要对光谱进行SG平滑预处理, 平滑处理中窗口宽度选择3, 多项式选择2次, 导数选择一阶。
主要研究土壤全盐量及Na+、 Ca2+、
![]() | 表1 土壤盐分含量统计 Table 1 Statistical results of the soil salt content |
利用最大值、 最小值、 平均值及标准差反映土壤盐分含量数据的总体特征, 变异系数用于衡量土壤盐分的空间变异性。 Na+、 Cl-变异系数分别为1.14、 1.09, 具有强空间变异性。 为了更好地探究各盐分之间的关系, 求取了它们的相关系数, 相关性分析表格见表2。
![]() | 表2 土壤盐分相关性分析 Table 2 Correlation analysis of the soil salt |
从表2中可以看出, 五种盐分均为正相关, 且相关系数较高, 说明它们之间有较强的空间相关性。 全盐量与Na+的相关性最高, 相关系数为0.99。 Na+与Cl-、
依据《土地复垦技术标准(试行)》中的土壤盐渍化分级标准, 采用土壤含盐总量, 对198个土壤样本点进行盐渍化分级, 标准及分级结果见表3。 研究区域盐渍化非常严重, 盐土占比61.62%, 强盐渍土占比17.68%, 非盐渍土、 弱盐渍土与中盐渍土较少, 总占比20.7%。
![]() | 表3 土壤盐渍化分级与统计 Table 3 Grading standards and statistics of soil salinization |
根据星地协同观测实验设计思路, 获取2019年9月20日的高分五号高光谱影像数据, 并进行几何校正、 辐射校正、 大气校正、 裁剪等预处理。 研究区域的高分五号影像为492行, 371列, 309个波段, 光谱范围为390~2 513 nm, 光谱分辨率为5~10 nm, 空间分辨率为30 m。 在高分五号影像的对应位置提取出198个土壤样本的光谱, 并将940、 1 400和1 900 nm附近水汽吸收波段剔除掉, 如图3所示。 为了去除噪声, 光谱曲线做SG平滑预处理, 参数设置与实验室光谱一致。
采用竞争自适应重加权采样(competitive adaptive reweighted sampling, CARS)筛选土壤盐分含量回归建模的特征波段。 在CARS的单次循环中, 使用自适应加权采样选择出偏最小二乘回归系数绝对值比较大的波段变量, 同时剔除回归系数很小的波段变量, 以得到若干波段变量子集。 然后将每个波段变量子集通过偏最小二乘方法以蒙特卡洛交叉验证手段进行建模, 并利用交叉验证中模型的均方根误差选择最优的光谱波段变量子集。
1.6.1 校正集预测集划分
每种土壤盐分建模时, 先按照含量从低到高排序, 每三个样本选择两个划分到校正集, 另外一个划分到预测集。 每种土壤盐分建模时校正集的样本有132个, 预测集的样本有66个。
1.6.2 模型建立
使用三种回归方法建立土壤盐分含量的反演模型, 分别是偏最小二乘法(partial least square, PLS)、 岭回归法(ridge regression, RR)和支持向量机(support vector machine, SVM)。
偏最小二乘是一种经典的统计方法, 其建模能力一般强于其他多元线性回归方法。 偏最小二乘将主成分分析(PCA)的主成分提取技术引入典型相关分析(CCA)中, 既可以保留数据的主成分信息, 又可以解决典型相关分析中X和Y直接映射的问题。 偏最小二乘被广泛地应用在高光谱反演模型的建立之中。
岭回归法是一种针对共线性数据分析的有偏估计方法, 它使用L2范数惩罚并取得稀疏解。 当X之间存在多重共线性时, 会出现X'X行列式较小的问题, 这样得到的计算数据缺乏稳定性。 岭回归算法可以在原来的数据矩阵上增加一个正常数矩阵, 以实现更好的回归建模效果。
支持向量机是基于统计学习理论的VC维理论和结构风险最小原理建立起来的一种优秀的机器算法。 它在处理高维度、 小样本数据中表现优异, 常用的核函数有线性核函数、 多项式核函数、 径向基核函数等, 本工作使用径向基核函数支持向量机。
1.6.3 模型验证
模型的准确性和稳定性使用决定系数(determination coefficient, R2)、 均方根误差(root mean square error, RMSE)、 平均绝对误差(mean absolute error, MAE)、 相对分析误差(residual prediction deviation, RPD)、 四分位相对预测误差(ratio of prediction performance to interquartile range, RPIQ)评定。 角标C代表校正集精度, 角标P代表预测集精度。 R2越大, RMSE、 MAE越小, 模型的精度越高; RPD和RPIQ越大, 模型的预测能力越好。
使用实验室测得的198个土壤样本的光谱, 经过SG预处理, CARS选择出各盐分的特征波段用于后续建模(分别选择出167个波段、 95个波段、 145个波段、 126个波段、 145个波段作为全盐量、 Na+、 Ca2+、
![]() | 表4 土壤盐分的实验室光谱反演结果 Table 4 Regression results of soil salt spectral data collected at laboratory |
从表4中可以看出, 全盐量、 Na+、 Ca2+、
使用高分五号影像提取的土壤样本光谱, 基于实验室光谱相同的方法来建立五种盐分的反演模型。 CARS选择出全盐量的特征波段有53个, Na+、 Ca2+、
![]() | 表5 土壤盐分的高分五号影像光谱反演结果 Table 5 Regression results of soil salt using GF-5 image spectra |
从表5中可以看出, Cl-的支持向量机反演模型精度最高,
图5中校正集的数据比预测集的数据更接近于1∶1线, Ca2+的含量值在中部附近分布较集中, 其他四种土壤盐分在数值小处集中, 数值大处较分散。 这与1.2中土壤盐分含量统计的结果一致, Ca2+的变异系数最小, 其他四种土壤盐分的变异系数较大。
根据高分五号影像光谱对土壤盐分的反演结果, 选择精度最高的特征波段组合和建模方法, 用于整幅影像的土壤盐分含量估算。
图6(a)是基于高分五号影像估算的研究区域土壤全盐量含量, 根据表3划分了盐渍化等级, 其中盐土分布面积最大, 占研究区面积的76%, 非盐渍土分布面积次之, 占研究区面积的16%, 弱盐渍土、 中盐渍土和强盐渍土分布面积较小, 共占8%。 图6(b)是根据采样点的全盐量化验值进行反距离加权法插值生成。 土壤全盐量估算图的空间分布与插值图一致, 中部盐渍化程度重, 周边农田区域盐渍化较轻。
与图1影像图对照分析, 发现非盐渍土、 弱盐渍土为耕地区域, 采样时发现该区域种植的作物有玉米、 棉花、 西红柿、 西瓜、 甜菜、 萝卜、 向日葵等。 盐土区域多为裸地, 地表已形成结块, 由于盐渍化严重已无法耕作, 只有零星耐盐植被覆盖。
图7为土壤中Na+、 Ca2+、
建立了土壤样本的实验室光谱、 高分五号影像光谱与干旱区盐渍化土壤中全盐量、 Na+、 Ca2+、
目前使用卫星高光谱数据估算土壤盐分仍是一个极大的挑战, 高分五号的空间分辨率为30 m, 势必存在较多的混合像元, 对于土壤中含量非常少且没有明显光谱特征的盐分来说, 寻找其与光谱之间的关系是十分困难的。 本工作所建立的土壤盐分估算模型精度较高, 但也存在改进之处, 针对高光谱影像的混合像元问题, 可引入混合像元解混算法, 在建模前对影像做解混处理。 本工作为使用高分五号数据反演土壤盐分提供了参考依据, 有助于高分五号数据的应用推广。
[1] |
|
[2] |
|
[3] |
|
[4] |
|
[5] |
|
[6] |
|
[7] |
|
[8] |
|
[9] |
|
[10] |
|
[11] |
|
[12] |
|
[13] |
|
[14] |
|
[15] |
|