基于高分五号高光谱影像的干旱区盐渍化土壤盐分含量估算
王惠敏1,2, 于磊1, 徐凯磊1,2, 江晓光1,2, 万余庆1,2,*
1.中煤航测遥感集团有限公司, 陕西 西安 710199
2.西安煤航遥感信息有限公司, 陕西 西安 710199
*通讯作者 e-mail: Wanyuqing@163.com

作者简介: 王惠敏,女, 1994年生,西安煤航遥感信息有限公司助理工程师 e-mail: wanghm9423@126.com

摘要

目前星载高光谱传感器较少, 基于高光谱影像的土壤盐分含量估算研究仍处于探索之中。 高分五号(GF-5)是目前国内光谱分辨率最高的卫星。 目的是研究高分五号高光谱影像大面积估算干旱区盐渍化土壤盐分含量的可行性。 选择新疆焉耆为研究区域, 采集了198个土壤样本。 首先, 检测土壤样本中的全盐量、 Na+、 Ca2+SO42-、 Cl-的含量, 利用ASD FieldSpec3地物光谱仪在实验室测定土壤样本的光谱反射率。 然后, 对实验室土壤光谱进行SG(Savitzky-Golay)平滑预处理, 采用竞争自适应重加权采样法选择土壤盐分的特征波段, 再利用偏最小二乘、 岭回归和支持向量机建立土壤盐分含量的回归模型, 发现实验室光谱反演土壤盐分的模型精度较高, 五种土壤盐分反演模型的校正集决定系数均大于0.97, 预测集决定系数均大于0.90。 接着, 获取土壤采样同期的高分五号高光谱影像数据并进行预处理, 根据采样点位置在影像上提取了198个土壤样本的光谱曲线, 使用与实验室光谱相同的反演方法, 建立了高分五号影像光谱与土壤盐分的反演模型, 五种土壤盐分(全盐量、 Na+、 Ca2+SO42-、 Cl-)反演效果最好的模型预测集决定系数分别是0.76、 0.66、 0.76、 0.63、 0.77。 最后, 根据高分五号影像光谱对土壤盐分的反演结果, 选择精度最高的特征波段组合和建模方法, 用于整个研究区域的土壤盐分含量估算。 估算结果按盐渍化等级划分, 研究区盐土占比76%, 土地已无法耕作, 非盐渍土占比16%, 可种植农作物, 弱盐渍土、 中盐渍土和强盐渍土分布面积较小, 共占8%。 五种土壤盐分的估算图与全盐量插值图的空间分布趋势一致。 结果表明, 高分五号高光谱影像估算本研究区域的土壤盐分含量结果可信度较高。

关键词: 高分五号; 高光谱遥感; 土壤盐分含量; 大面积估算
中图分类号:TP79 文献标志码:A
Estimation of Salt Content of Saline Soil in Arid Areas Based on GF-5 Hyperspectral Image
WANG Hui-min1,2, YU Lei1, XU Kai-lei1,2, JIANG Xiao-guang1,2, WAN Yu-qing1,2,*
1. Aerial Photogrammetry and Remote Sensing Group Co., Ltd. of China National Administration of Coal Geology, Xi'an 710199, China
2. Xi'an Meihang Remote Sensing Information Co., Ltd., Xi'an 710199, China
*Corresponding author
Abstract

There are few spaceborne hyperspectral sensors, and the estimation of soil salt content based on hyperspectral images is still under exploration. GF-5 is the satellite with the highest spectral resolution in China. This paper aims to study the feasibility of estimating salt content of saline soil in arid areas on a large area using GF-5 hyperspectral image. In this paper, 198 soil samples were collected from the experimental field at Yanqi, Xinjiang. Firstly, the soil salt contents (total salt content, Na+, Ca2+,SO42- and Cl-) were determined, and the spectra of the soil samples were measured with an ASD Fieldspec3 field spectrometer in the laboratory. Then, the laboratory soil spectra were subjected to SG (Savitzky-Golay) smoothing pretreatment, and the competitive adaptive reweighted sampling method was used to select the characteristic bands of soil salt. Partial least squares, ridge regression and support vector machine established the regression model of soil salt content. It is found that the soil salt retrieval model established by laboratory spectra has high accuracy. The determination coefficients of the correction set and prediction set of the five soil salt retrieval models are greater than 0.97 and 0.90 respectively. Next, the GF-5 hyperspectral image data at the same time as soil sampling are obtained and preprocessed. The spectra of 198 soil samples were extracted from the image based on the location of the sampling points. Soil salt retrieval models based on GF-5 hyperspectral image spectra were established using the same retrieval method of laboratory spectra. The best prediction set determination coefficients of the five soil salt (total salt content, Na+, Ca2+,SO42- and Cl-) retrieval models were 0.76, 0.66, 0.76, 0.63 and 0.77 respectively. Finally, according to the retrieval results of soil salt based on the GF-5 image spectra, the characteristic band combination and modeling method with the best accuracy were selected estimate soil salt content in the whole study area. The estimation results have been divided according to the salinization grade. The saline soil in the study area accounts for 76%, and the land can not be cultivated. Non saline soil accounts for 16%, and crops can be planted. The distribution area of weak, medium and strong saline soil is small, accounting for 8% in total. The spatial distribution trend of the five soil salt estimation maps is consistent with the total salt content interpolation map. This paper shows that the results of estimating soil salt content in this study are based on GF-5 hyperspectral image are highly reliable.

Keyword: GF-5; Hyperspectral remote sensing; Soil salt content; Large area estimation
引言

高分五号卫星是我国高分家族中的重要一员, 其高光谱分辨率在环境监测方面起着重要作用。 目前, 高分五号高光谱数据已应用在地物分类[1]、 矿物识别[2]、 云检测[3]、 水资源监测[4]、 植被信息提取[5]、 悬浮泥沙浓度反演[6]、 土壤有机质反演[7]等方面, 在土壤盐分含量估算方面研究较少。

土壤盐分是影响农业发展的重要因素, 土壤盐分含量过高会导致土壤肥力下降, 进而引起土地退化, 无法进行正常的农业活动。 因此, 对干旱区新疆焉耆农田土壤盐分的研究显得尤为重要。 随着大量遥感卫星的发射升空, 遥感数据获取方式更加便捷, 雷达遥感、 多光谱遥感成为土壤盐分含量反演的重要手段。 张智韬[8]以Sentinel-1雷达影像作为数据源, 通过组合两组雷达后向散射系数构建多种指数, 建立了不同深度的土壤含盐量反演模型。 Tripathi等[9]使用Sentinel-1 SAR合成孔径雷达数据生成后向散射系数, Sentinel-2A多光谱数据生成NDSI归一化差异盐度指数, 并使用地面设备直接收集土壤电导率, 对印度旁遮普地区的土壤盐分进行估算; 吴亚坤等[10]利用Landsat TM影像数据, 通过建立土壤盐分多元线性回归解译模型和反距离权重插值相结合的方法分析了研究区土壤盐分空间分布的三维特征。

高光谱有更多的波段, 能较好地获取与土壤盐分相关的光谱信息。 Wang等[11]基于野外近地面实测高光谱估算了土壤中的盐分含量, 将连续投影算法应用于特征波段分析中, 估算模型精度有所提高。 而使用高光谱卫星数据进行土壤盐分含量大面积估算的研究还处于探索阶段。 安德玉等[12]以黄河三角洲滨海盐渍土为例, 使用HICO高光谱影像结合现场实测高光谱数据反演了表层土壤全盐含量。 厉彦玲等[13]将环境一号HSI高光谱影像与Landsat8多光谱影像进行融合, 对山东省垦利县土壤盐分进行反演, 结果表明融合后影像反演模型精度明显高于单一影像。 Bai等[14]使用环境一号高光谱数据绘制了松嫩平原北部地区土壤的盐度和碱度分布图, 但环境一号高光谱数据的空间分辨率为100 m, 高质量的卫星数据才能得到更好的估算效果。 Wang等[15]对比分析了实验室高光谱与高分五号高光谱反演土壤盐分含量的能力, 发现当土壤中盐分含量低时, 两种土壤高光谱曲线较为相近, 随着土壤盐分含量的增加, 实验室光谱特征有微小的变化, 而高分五号光谱对土壤盐分含量的变化有更强烈的响应, 因此, 高分五号光谱在土壤盐分含量反演中比实验室光谱具有更大的优势。

综上所述, 高分五号作为全球首个用于大气和陆地观测的综合高光谱卫星, 在土壤盐分含量估算方面的能力是值得进一步探究的。 因此, 首先基于实验室采集的光谱建立了土壤盐分含量估算的高精度模型, 然后应用相同的反演方法, 建立了高光谱影像光谱估算土壤盐分含量的模型, 模型精度达到大面积制图的标准。 最后, 使用最优估算模型, 基于整幅高光谱影像估算了研究区域的土壤盐分含量。 估算结果与实测值的插值图对比后表明, 高分五号高光谱影像大面积估算干旱区盐渍化土壤的盐分含量是十分可靠的。

1 实验部分
1.1 研究区概况与土壤样本采集

研究区域位于新疆维吾尔自治区焉耆回族自治县(41°54'—41°58'N, 86°20'—86°24'E)。 焉耆是干旱大陆性气候, 日照充足, 降水较少, 蒸发量大。 焉耆年平均气温为7.9 ℃, 年均降水量为72.3 mm, 年均蒸发量为1 887 mm。

土壤样本采集工作于2019年9月份开展。 选取土壤盐渍化较为严重的区域及周边农田裸土区域, 采用梅花点法进行土壤采样, 采样深度为表层0~20 cm, 并同步记录采样点位置, 共采集198个土壤样本。 每个土壤样本均在实验室采集光谱, 并测定土壤盐分的含量。 采样点如图1所示, 底图为高分五号影像。

图1 研究区的采样点示意图Fig.1 Schematic diagram of sampling points in the study area

1.2 实验室光谱分析

测量土壤光谱前, 将土壤样本风干、 研磨, 过100目筛。 严格按照光谱测量规范, 在实验室使用FieldSpec3地物光谱仪测定土壤样本的光谱反射率, 测得的光谱范围为350~2 500 nm, 光谱分辨率为1 nm。 实验室测定的土壤样本光谱见图2。

图2 198个土样的实验室光谱Fig.2 Spectra of the 198 samples collected at laboratory

实验室光谱在350~650 nm上升较快, 650~1 800 nm上升缓慢, 940、 1 400和1 900 nm是水汽吸收带, 自2 100 nm后曲线开始下降。 由于测量过程中会有噪声影响, 需要对光谱进行SG平滑预处理, 平滑处理中窗口宽度选择3, 多项式选择2次, 导数选择一阶。

1.3 土壤盐分含量分析

主要研究土壤全盐量及Na+、 Ca2+SO42-、 Cl-四种盐分离子。 对土壤样本中的五种盐分含量做统计分析, 统计结果见表1

表1 土壤盐分含量统计 Table 1 Statistical results of the soil salt content

利用最大值、 最小值、 平均值及标准差反映土壤盐分含量数据的总体特征, 变异系数用于衡量土壤盐分的空间变异性。 Na+、 Cl-变异系数分别为1.14、 1.09, 具有强空间变异性。 为了更好地探究各盐分之间的关系, 求取了它们的相关系数, 相关性分析表格见表2

表2 土壤盐分相关性分析 Table 2 Correlation analysis of the soil salt

表2中可以看出, 五种盐分均为正相关, 且相关系数较高, 说明它们之间有较强的空间相关性。 全盐量与Na+的相关性最高, 相关系数为0.99。 Na+与Cl-SO42-具有空间聚集特征。

依据《土地复垦技术标准(试行)》中的土壤盐渍化分级标准, 采用土壤含盐总量, 对198个土壤样本点进行盐渍化分级, 标准及分级结果见表3。 研究区域盐渍化非常严重, 盐土占比61.62%, 强盐渍土占比17.68%, 非盐渍土、 弱盐渍土与中盐渍土较少, 总占比20.7%。

表3 土壤盐渍化分级与统计 Table 3 Grading standards and statistics of soil salinization
1.4 高分五号光谱获取

根据星地协同观测实验设计思路, 获取2019年9月20日的高分五号高光谱影像数据, 并进行几何校正、 辐射校正、 大气校正、 裁剪等预处理。 研究区域的高分五号影像为492行, 371列, 309个波段, 光谱范围为390~2 513 nm, 光谱分辨率为5~10 nm, 空间分辨率为30 m。 在高分五号影像的对应位置提取出198个土壤样本的光谱, 并将940、 1 400和1 900 nm附近水汽吸收波段剔除掉, 如图3所示。 为了去除噪声, 光谱曲线做SG平滑预处理, 参数设置与实验室光谱一致。

图3 198个土样的高分五号影像光谱Fig.3 GF-5 image spectra of 198 samples

1.5 波段选择

采用竞争自适应重加权采样(competitive adaptive reweighted sampling, CARS)筛选土壤盐分含量回归建模的特征波段。 在CARS的单次循环中, 使用自适应加权采样选择出偏最小二乘回归系数绝对值比较大的波段变量, 同时剔除回归系数很小的波段变量, 以得到若干波段变量子集。 然后将每个波段变量子集通过偏最小二乘方法以蒙特卡洛交叉验证手段进行建模, 并利用交叉验证中模型的均方根误差选择最优的光谱波段变量子集。

1.6 建模方法

1.6.1 校正集预测集划分

每种土壤盐分建模时, 先按照含量从低到高排序, 每三个样本选择两个划分到校正集, 另外一个划分到预测集。 每种土壤盐分建模时校正集的样本有132个, 预测集的样本有66个。

1.6.2 模型建立

使用三种回归方法建立土壤盐分含量的反演模型, 分别是偏最小二乘法(partial least square, PLS)、 岭回归法(ridge regression, RR)和支持向量机(support vector machine, SVM)。

偏最小二乘是一种经典的统计方法, 其建模能力一般强于其他多元线性回归方法。 偏最小二乘将主成分分析(PCA)的主成分提取技术引入典型相关分析(CCA)中, 既可以保留数据的主成分信息, 又可以解决典型相关分析中XY直接映射的问题。 偏最小二乘被广泛地应用在高光谱反演模型的建立之中。

岭回归法是一种针对共线性数据分析的有偏估计方法, 它使用L2范数惩罚并取得稀疏解。 当X之间存在多重共线性时, 会出现X'X行列式较小的问题, 这样得到的计算数据缺乏稳定性。 岭回归算法可以在原来的数据矩阵上增加一个正常数矩阵, 以实现更好的回归建模效果。

支持向量机是基于统计学习理论的VC维理论和结构风险最小原理建立起来的一种优秀的机器算法。 它在处理高维度、 小样本数据中表现优异, 常用的核函数有线性核函数、 多项式核函数、 径向基核函数等, 本工作使用径向基核函数支持向量机。

1.6.3 模型验证

模型的准确性和稳定性使用决定系数(determination coefficient, R2)、 均方根误差(root mean square error, RMSE)、 平均绝对误差(mean absolute error, MAE)、 相对分析误差(residual prediction deviation, RPD)、 四分位相对预测误差(ratio of prediction performance to interquartile range, RPIQ)评定。 角标C代表校正集精度, 角标P代表预测集精度。 R2越大, RMSE、 MAE越小, 模型的精度越高; RPD和RPIQ越大, 模型的预测能力越好。

2 结果与讨论
2.1 实验室光谱反演土壤盐分

使用实验室测得的198个土壤样本的光谱, 经过SG预处理, CARS选择出各盐分的特征波段用于后续建模(分别选择出167个波段、 95个波段、 145个波段、 126个波段、 145个波段作为全盐量、 Na+、 Ca2+SO42-、 Cl-的特征波段)。 最后使用偏最小二乘、 岭回归、 支持向量机方法建立土壤盐分含量的反演模型。 反演结果如表4所示。

表4 土壤盐分的实验室光谱反演结果 Table 4 Regression results of soil salt spectral data collected at laboratory

表4中可以看出, 全盐量、 Na+、 Ca2+SO42-、 Cl-的实验室光谱反演结果较好, 所有模型的RC2均大于0.97,RP2均大于0.90, RPD均在3以上, 说明模型的预测能力很好。 其中全盐量反演岭回归法建立的模型精度最高,RC2为0.99, RMSEC为0.57,RP2为0.95, RMSEP为10.41。 全盐量、 Na+、 Ca2+、 Cl-反演模型中, 岭回归建立的模型精度最高,SO42-反演模型中支持向量机表现最好。 五种盐分最优反演模型的散点图见图4。 图4中五种盐分的实测值与预测值均在1∶1线附近, 说明模型精度较高。

图4 实验室光谱反演土壤盐分的散点图Fig.4 The scatter plot of soil salt estimation using spectral data collected at laboratory

2.2 高分五号光谱反演土壤盐分

使用高分五号影像提取的土壤样本光谱, 基于实验室光谱相同的方法来建立五种盐分的反演模型。 CARS选择出全盐量的特征波段有53个, Na+、 Ca2+SO42-、 Cl-的特征波段分别有43个、 42个、 43个、 48个。 五种土壤盐分的反演结果见表5

表5 土壤盐分的高分五号影像光谱反演结果 Table 5 Regression results of soil salt using GF-5 image spectra

表5中可以看出, Cl-的支持向量机反演模型精度最高,RC2为0.87, RMSEC为5.65,RP2为0.77, RMSEP为8.24。 其次是全盐量、 Ca2+, 模型RP2均为0.76。 Na+的模型精度稍差, 岭回归法所建立的模型RP2为0.66。SO42-的反演模型精度最差,RP2为0.63。 总体来看, 在这组数据中, 偏最小二乘方法与岭回归法建立的模型精度十分相近, 支持向量机在全盐量、 Na+、 Ca2+SO42-建模中表现欠佳。 五种土壤盐分反演模型精度均达到大面积制图要求。 选择每种土壤盐分的最佳模型绘制散点图, 见图5。

图5 高分五号影像光谱反演土壤盐分的散点图Fig.5 The scatter plot of soil salt estimation using GF-5 image spectra

图5中校正集的数据比预测集的数据更接近于1∶1线, Ca2+的含量值在中部附近分布较集中, 其他四种土壤盐分在数值小处集中, 数值大处较分散。 这与1.2中土壤盐分含量统计的结果一致, Ca2+的变异系数最小, 其他四种土壤盐分的变异系数较大。

2.3 土壤盐分含量大面积制图

根据高分五号影像光谱对土壤盐分的反演结果, 选择精度最高的特征波段组合和建模方法, 用于整幅影像的土壤盐分含量估算。

图6(a)是基于高分五号影像估算的研究区域土壤全盐量含量, 根据表3划分了盐渍化等级, 其中盐土分布面积最大, 占研究区面积的76%, 非盐渍土分布面积次之, 占研究区面积的16%, 弱盐渍土、 中盐渍土和强盐渍土分布面积较小, 共占8%。 图6(b)是根据采样点的全盐量化验值进行反距离加权法插值生成。 土壤全盐量估算图的空间分布与插值图一致, 中部盐渍化程度重, 周边农田区域盐渍化较轻。

图6 土壤全盐量估算图与插值图Fig.6 Estimation results and interpolation map of soil total salt

与图1影像图对照分析, 发现非盐渍土、 弱盐渍土为耕地区域, 采样时发现该区域种植的作物有玉米、 棉花、 西红柿、 西瓜、 甜菜、 萝卜、 向日葵等。 盐土区域多为裸地, 地表已形成结块, 由于盐渍化严重已无法耕作, 只有零星耐盐植被覆盖。

图7为土壤中Na+、 Ca2+SO42-、 Cl-含量的估算图。 由于研究区域大部分区域都是盐土, 采用拉伸的渲染效果来表现值之间的差异, 更好地反映空间聚集性。 总体来讲, 四种盐分离子与全盐量的空间分布特征相似, 估算结果与实际情况较为吻合。

图7 四种土壤盐分的估算图Fig.7 Estimation results of four soil salt ions

3 结论

建立了土壤样本的实验室光谱、 高分五号影像光谱与干旱区盐渍化土壤中全盐量、 Na+、 Ca2+SO42-、 Cl-五种盐分含量之间的反演模型, 并使用高分五号影像估算了研究区域土壤中五种盐分的含量。 研究发现, 本方法组合(SG平滑预处理、 CARS波段选择、 PLS/RR/SVM回归分析)在实验室光谱反演土壤盐分时效果较好。 五种土壤盐分的模型精度RC2均大于0.97,RP2均大于0.90, 全盐量反演模型精度最高,RC2为0.99,RP2为0.95。 同时, 实验室的反演方法也适用于高分五号影像光谱。 高分五号影像光谱反演五种土壤盐分时, Cl-的反演模型精度最高,RC2为0.87,RP2为0.77, 全盐量、 Ca2+的反演模型均RP2为0.76, Na+SO42-的反演模型精度稍差,RP2分别为0.66、 0.63。 使用五种土壤盐分的最佳波段组合和模型对整个研究区域的土壤盐分含量进行估算, 发现研究区域盐土面积占76%, 为盐渍化非常严重的裸地, 地表结块已无法耕作。 非盐渍土面积占16%, 多为耕地。 五种土壤盐分含量空间分布特征相似, 与土壤样本实测值的插值图分布趋势一致, 结果可信度较高。

目前使用卫星高光谱数据估算土壤盐分仍是一个极大的挑战, 高分五号的空间分辨率为30 m, 势必存在较多的混合像元, 对于土壤中含量非常少且没有明显光谱特征的盐分来说, 寻找其与光谱之间的关系是十分困难的。 本工作所建立的土壤盐分估算模型精度较高, 但也存在改进之处, 针对高光谱影像的混合像元问题, 可引入混合像元解混算法, 在建模前对影像做解混处理。 本工作为使用高分五号数据反演土壤盐分提供了参考依据, 有助于高分五号数据的应用推广。

参考文献
[1] Su H J, Yao W J, Wu Z Y, et al. ISPRS Journal of Photogrammetry and Remote Sensing, 2021, 171: 238. [本文引用:1]
[2] DONG Xin-feng, GAN Fu-ping, LI Na, et al(董新丰, 甘甫平, 李娜, ). National Remote Sensing Bulletin(遥感学报), 2020, 24(4): 454. [本文引用:1]
[3] Xie W Y, Yang J, Li Y S, et al. Remote Sensing, 2020, 12(3): 456. [本文引用:1]
[4] Liu J T, Liu C T, Feng Q L, et al. Journal of Applied Remote Sensing, 2020, 14(3): 4515. [本文引用:1]
[5] Chen Z L, Jia K, Xiao C C, et al. Remote Sensing, 2020, 12(13): 2110. [本文引用:1]
[6] LIU Yi-ming, ZHANG Lei, ZHOU Mei, et al(刘一鸣, 张磊, 周梅, ). Journal of Infrared and Millimeter Waves(红外与毫米波学报), 2022, 41(1): 323. [本文引用:1]
[7] Meng X T, Bao Y L, Liu J G, et al. International Journal of Applied Earth Observation and Geoinformation, 2020, 89: 102111. [本文引用:1]
[8] ZHANG Zhi-tao, DU Yu-yan, LAO Cong-cong, et al(张智韬, 杜瑜燕, 劳聪聪, ). Transactions of the Chinese Society for Agricultural Machinery(农业机械学报), 2020, 51(10): 243. [本文引用:1]
[9] Tripathi A, Tiwari R K. Land Degradation & Development, 2021, 32: 3905. [本文引用:1]
[10] WU Ya-kun, LIU Guang-ming, SU Li-tan, et al(吴亚坤, 刘广明, 苏里坦, ). Spectroscopy and Spectral Analysis(光谱学与光谱分析), 2018, 38(11): 3528. [本文引用:1]
[11] Wang, S J, Chen Y H, Zhao M G, et al. Remote Sensing, 2019, 11(8): 967. [本文引用:1]
[12] AN De-yu, XING Qian-guo, ZHAO Geng-xing(安德玉, 邢前国, 赵庚星). Acta Oceanologica Sinica(海洋学报), 2018, 40(6): 51. [本文引用:1]
[13] LI Yan-ling, ZHAO Geng-xing, CHANG Chun-yan, et al(厉彦玲, 赵庚星, 常春艳, ). Transactions of the Chinese Society of Agricultural Engineering(农业工程学报), 2017, 33(21): 173. [本文引用:1]
[14] Bai L, Wang C Z, Zang S Y, et al. Sensors, 2018, 18(11): 3855. [本文引用:1]
[15] Wang L B, Zhang B, Shen Q, et al. Water, 2021, 13(4): 559. [本文引用:1]