关联类标准化样品特征波段的矿区土壤重金属Pb高光谱反演
周茉1,2, 邹滨1,2,*, 涂宇龙1,2, 夏吉品1,2
1. 中南大学有色金属成矿预测与地质环境监测教育部重点实验室, 地球科学与信息物理学院, 湖南 长沙 410083
2. 中南大学地球科学与信息物理学院, 湖南 长沙 410083
*通讯联系人 e-mail: 210010@csu.edu.cn

作者简介: 周 茉, 1997年生, 中南大学地球科学与信息物理学院硕士研究生 e-mail: zhoumo@csu.edu.cn

摘要

目前土壤重金属Pb的高光谱反演实验样本多源于研究区采样, 忽略了自然样本中复杂组分的光谱混杂问题, 所建立的模型精度偏低, 重金属光谱响应机理解释仍不明确。 基于此, 选取湖南省某铅锌矿区采集相对清洁背景土壤, 运用控制变量方法, 制作Pb类标准化样品40个, 同时采集矿区86个自然污染样本。 首先利用类标准化样品建立偏最小二乘回归(PLSR)定量反演模型, 提取Pb光谱反射特征波段, 然后基于特征波段进行矿区自然污染样本土壤Pb定量回归建模, 对比全波段建模结果, 验证特征波段的有效性。 实验结果表明: (1)在背景土壤性质稳定的前提下, 制作的类标准化样品具有总体一致的光谱形态, 同时Pb含量作为引起反射率变化的唯一驱动因子证实了土壤中重金属Pb光谱响应信号的存在; (2)相较于自然样本光谱反演结果, 类标准化样品能显著提升土壤Pb含量模型估算能力, 决定系数($R^{2}_{p}$)为0.85, 相对分析误差(RPD)2.30, 有效排除其他组分对于光谱建模的干扰, 模型性能良好; 使用变量重要性投影指标(VIP)与PLSR系数提取的类标准化样品特征波段集中在970~1 000, 1 700~2 080和2 220~2 400 nm区间; (3)与全波段建模对比, 基于特征波段的矿区自然污染样本的PLSR建模结果, $R^{2}_{p}$由0.32提升至0.55, RPD由1.20提升至1.44, 表明特征波段能够较好表征Pb的响应信号, 波段提取有助于过滤噪声, 减少数据冗余同时提高模型反演精度。 提出的基于类标准化样品特征波段反演自然土壤样本Pb含量, 有效解决自然样本成分复杂, 重金属光谱信号微弱的问题, 丰富了土壤重金属遥感监测理论与应用实例。

关键词: 类标准化样品; 土壤重金属; Pb; 特征波段; VIP; 偏最小二乘回归
中图分类号:O657.3 文献标志码:A
Hyperspectral Modeling of Pb Content in Mining Area Based on Spectral Feature Band Extracted from Near Standard Soil Samples
ZHOU Mo1,2, ZOU Bin1,2,*, TU Yu-long1,2, XIA Ji-pin1,2
1. The Key Laboratory of Metallogenic Prediction of Nonferrous Metals and Geological Environment Monitoring (Central South University), Ministry of Education, School of Geoscience and Info-Physics, Changsha 410083, China
2. School of Geosciences and Info-Physics, Central South University, Changsha 410083, China
*Corresponding author
Abstract

Natural soil samples are the primary data source of heavy metal hyperspectral predicting models. However, their spectra are often confounded by complex components, resulting in poor performance model and unclear explanation for heavy metal spectral response mechanism. Near standard soil samples provide a promising method for the mechanism research. In this paper, 86 natural soils samples and relatively clean background soil were collected in a lead-zinc mine in Hunan province, and 40 near standard samples were made by artificially adding heavy metals in background soil using control variable method. Feature bands for soil Pb spectra were first selected based on near standard soil samples using partial least squares regressions(PLSR). The feature bands were used to calibrate the prediction model with PLSR for natural soil samples. The existence of Pb absorption features was confirmed by the overall consistent and change trend of near standard samples reflectance spectra. Near standard samples provided acceptable estimation accuracies of Pb concentrations, with the determination coefficient ($R^{2}_{p}$), and the ratio of prediction to deviation (RPD) values of 0.85 and 2.30. When compared with the entire-band PLSR model, feature-band model for natural soil samples increased the $R^{2}_{p}$ and the RPD from 0.32 and 0.20 to 1.55 and 1.44 by removing uninformative spectral variables. The mechanism investigation strategy we proposed could effectively solve the problem of complex sample composition and weak heavy metal spectral signal in previous research, and be applied in further soil heavy metal remote sensing monitoring.

Keyword: Near standard samples; Soil heavy metal; Pb; Feature band; VIP; PLSR
引言

矿产资源开发引起的土壤重金属污染问题, 正严重威胁着矿区周边自然生态环境的可持续发展和人体健康[1]。 铅是重金属污染的主要元素之一, 易蓄积在土壤中通过食物链进入人体对神经系统和造血系统产生危害, 也是我国“ 十三五” 规划中重金属防治的重点关注染物之一[2]。 开展污染防控治理工作的首要前提是查明我国的土壤重金属污染状况。 传统基于野外取样的实验室化学分析方法虽精度较高, 但耗时费力、 成本高昂, 无法实现污染的宏观时空动态和周期性监测。 而高光谱遥感作为一种高效、 环境友好的探测手段, 能够动态、 实时地获取具有连续波段和高光谱分辨率的地物反射光谱曲线, 为实现连续时空、 大范围的土壤重金属污染监测提供了可靠的技术手段[3]

目前利用高光谱技术对土壤重金属含量展开研究已取得了一定成果, 国内外学者通过筛选出土壤重金属的特征光谱波段, 建立经验统计意义上的定量反演模型, 证实了矿区土壤中多种重金属含量与土壤光谱的响应关系: 如Liu等[4]使用不同预处理方法反演土壤Pb含量, 证实基于室内外高光谱反演重金属的可行性; 江振蓝等[5]考虑土壤空间异质性, 基于GWR建立Cr, Cu, Zn和Pb四种金属光谱预测模型; Cheng等[6]探究了可见光-近红外波段反演郊区土壤中Cd和Pb等6种金属的可行性, 提出了一种联合主成分分析双标图和偏相关系数的重金属反演机制探究方案。

然而, 尽管目前已有的研究一定程度上证实了重金属含量与实测光谱的相关性, 但由于自然样本成分复杂、 光谱信噪比低, 仍存在以下问题阻碍土壤重金属遥感监测应用发展: 首先, 难以得到稳定的高精度反演模型; 其次, 模型多基于间接反演, 而不同重金属与有机质、 铁氧化物的响应规律存在差异, 土壤重金属光谱响应机制仍有待探究; 同时, 土壤结构、 组分的空间分异也会导致同种重金属在不同地区的光谱响应差异[7, 8], 不同研究得到的重金属光谱特征波段各异, 如Cheng等[7]得出Pb特征波段在580~660和2 020~2 400 nm, 而Liu等[4]认为Pb光谱特征在300~500和1 900~2 000 nm波段。 已有学者尝试引入控制变量实验[9], 利用皮尔逊相关系数分析重金属溶液浓度与光谱的相关关系, 但缺少对于变量间非线性相关性的探讨。 在此背景下, 本研究尝试引入类标准化样品探究土壤重金属光谱响应规律, 在相对清洁背景中人为添加不同剂量Pb标准溶液, 控制变量得到其余物化成分一致的自制类标准化样品, 识别特征波段并应用于自然污染样本反演建模。

1 实验部分
1.1 研究区与土壤取样分析

研究区位于湖南省某铅锌矿区, 该矿区矿冶历史悠久并因有色金属闻名世界, 地处湖南境内湘江上游, 地形以山地为主, 土壤主要为红壤; 历史采矿活动产生的矿渣废液通过大气沉降、 管道运输、 河流扩散进入土壤环境, 破坏生态环境并严重损害人类健康。

土壤采集包括类标准化样品背景土壤采样和矿区污染土壤采样。 考虑矿区地形地势及污染源分布, 选取矿区南面高处同一地点相对清洁的土壤, 采集表层范围(0~20 cm)内土壤约50 kg, 混匀装入专用密封塑料袋带回作为类标准化样品背景土壤; 考虑矿区作业运输路线、 土地利用类型及污染扩散因素布设采样点。 采用五点取样法采集样点10 m2范围内矿区污染表层土样86个, 装入专用密封塑料袋带回, 使用手持式GPS按顺序记录WGS84框架下采样点经纬度坐标, 位置如图1所示。 所有土样均在室内阴凉通风处风干, 剔除石块、 植物碎片, 研磨, 过100目尼龙筛, 按编号分装。 对于矿区污染土壤, 使用HNO3-HF-HCIO4混合酸分解, 电感耦合等离子发射光谱法(USEPA 6010C: 2007)测定土壤重金属Pb含量。

图1 研究区及采样点位置Fig.1 Location of study area and soil sampling points

1.2 类标准化Pb污染土壤样品制作及测定

为保证土壤类标准化样品稳定性, 采用小单元包装, 将采回的背景土壤分装于专用塑料袋, 每份样品100 g。 考虑自然土壤Pb含量, 设置40个浓度等级, 范围为50~8 000 mg· kg-1, 非等间距分布的浓度设置符合实际情况且满足0.05显著水平下的正态分布。 类标准化样品背景土壤试剂添加方案如表1所示。 使用浓度为1 000 μ g· mL-1的铅标准溶液(GSBG62071— 90(8201)), 根据方案设定, 量取相应剂量的标准溶液, 稀释。 最后将稀释溶液添加至100 g背景土壤中, 静置, 等待样品中的溶液渗透背景土壤, 待自然风干后再次研磨、 混匀, 类标准化样品Pb含量测定与自然污染样本所述步骤相同。

表1 类标准化样品背景土壤Pb含量设计方案(mg· kg-1) Table 1 Designed scheme of Pb content in the background soil of near standard samples
1.3 光谱测定与预处理

使用PSR-3500便携式地物光谱仪测定86个矿区样本和40个类标准化样品室内全波段(350~2 500 nm)范围反射率, 光谱分辨率为1.5 nm(350~1 000 nm), 3.8 nm(1 000~1 900 nm), 2.5 nm(1 900~2 500 nm); 光源使用1 000 W卤素灯, 5° 视场角, 光源照射方向与垂直方向呈15° 夹角; 光源距离30 cm, 探头距离5 cm。 开始测量前及每间隔5个样本进行白板辐射定标, 每个样本重复测定10次, 取平均反射率为实际光谱反射数据。

为放大光谱与土壤组分相关的细节特征, 消除数据无关信息, 进行光谱去噪、 平滑及光谱增强。 首先, 去除可见-近红外区域边缘低信噪比区间: 350~399和2 400~2 500 nm, 降低噪声同时提高计算效率; 选择Savitzky-Golay卷积平滑光谱, 设置三阶多项式, 移动窗口宽度11进行多项式最小二乘拟合; 使用多元散射校正(multiplicative scatter correction, MSC)消除样品间散射带来的基线漂移效应, 增强光谱特征。

1.4 特征波段选择与模型建立

偏最小二乘回归(partial least squares regression, PLSR)作为一种经典多元统计分析模型能够有效地规避变量共线性问题, 在自变量存在多重相关性的情况下进行建模, 是土壤重金属Pb高光谱反演的可靠方式[10]。 实验基于Matlab R2018a, 使用简单交叉验证方法检验模型性能, 利用决定系数(R2)、 均方根误差(RMSE)及相对分析误差(RPD)评价模型精度, R2越大, RMSE越小, 表明模型精度越高, 拟合验证效果越好。 当1.4< RPD< 2时, 模型可对样本作出粗略预估, 当RPD> 2时, 模型对于样本有极好的预测能力。

变量重要性投影指标(variable importance in projection, VIP)是PLSR模型的一种滤波型变量选择方法, 研究表明结合VIP和PLSR系数(即b-coefficient)的变量筛选方法能够有效识别重金属光谱特征波段, 揭示光谱响应机制[6]。 VIP的思想是累积计算逐个变量j被成分w影响的重要性, 即变量重要性的投影, 如式(1)所示。

VIPj=pk=1h(SS(bktk)(wjk/wk)2)/k=1hSS(bktk)(1)

其中, SS(bktk)= bk2tkttk, 表示第k个成分的解释平方和, w是权值矩阵, h是最优PLSR模型中的潜在变量个数。 VIP得分的阈值通常设置为1, b-coefficient的阈值是其总体的统计标准差, 满足VIP> 1且b-coefficient大于总体标准差的波段为特征波段。

2 结果与讨论
2.1 土壤Pb含量描述性统计分析

类标准化样品背景土壤、 矿区86个自然污染样本Pb含量统计结果如表2表3所示。 在混匀的背景土壤中随机抽取五组样品送检, 五组样品结果均显示Pb, As和Cd重金属含量低于国家《土壤环境质量农用地土壤污染风险管控标准》(试行)(GB15618— 2018)[11]风险管制值, Pb平均值36.8 mg· kg-1, 土壤pH值, 有机质、 全铁及重金属含量稳定。 因此, 基于背景土壤制备的类标准化样品能够减轻土壤多变量引起的光谱变化对重金属光谱反演的干扰, 为控制变量探究单一重金属Pb响应机制提供了良好的条件。 矿区土壤重金属Pb平均含量超过风险管制值一倍以上, 最大值10 054.00 mg· kg-1, 达风险管制值的25倍, 样点超标率达37.2%, 重金属含量严重超标; 同时, 由于矿区不同位置尾矿堆积、 矿渣排放相异, 土壤Pb标准差和变异系数较大, 矿区内重金属浓度分异度较高, 不服从正态分布, 数据离散化程度高。

表2 类标准化样品背景土壤组分实测值 Table 2 Measured values of background soil components
表3 矿区土壤Pb含量描述性统计数据 Table 3 Statistic of soil Pb content in Chenzhou mining area
2.2 类标准化样品与矿区土壤样品光谱特征分析

图2是类标准化样品、 自然污染土样的原始和预处理后的光谱曲线图。 由原始光谱图[图2(a)和(b)]可知, 不同地区土壤光谱曲线总体形态相似, 在< 400 nm和> 2 400 nm波段区间光谱变化剧烈, 噪声较大; 土壤光谱在< 1 000 nm波段间随波长增加反射率迅速上升, 在1 400, 1 900和2 200 nm波段附近有明显的水吸收谷, 反射率降低。 光谱预处理结果[图2(c)和(d)]表明, SG滤波能有效消除光谱数据噪声, 预处理后光谱更为平滑, 同时多元散射校正一定程度上修正了光谱基线漂移现象。 两组数据的相似性为基于类标准化样品提取的光谱响应特征波段, 建立自然样本土壤Pb反演模型提供支撑。

图2 土壤光谱曲线图
(a), (c): 类标准化样品Pb污染土壤原始和预处理后光谱; (b), (d): 矿区自然土壤样本原始光谱和预处理后光谱
Fig.2 Spectra of soil samples
(a), (c): The original and pretreatment spectra of near standard soil samples; (b), (d): The original and pretreatment spectra of mining area soil samples

另一方面, 比较两类样品光谱, 相较于类标准化样品[图2(a)和(c)]光谱的统一趋势, 自然样本原始光谱稳定性较差, 存在许多毛刺噪声。 由于土壤光谱特性与土壤组分中多种物质含量有关, 多成分的非线性同步变化导致自然样品光谱缺乏统一特征, 噪声杂乱; 而制备的类标准化样品, Pb含量变化作为光谱反射率变化的唯一驱动因子, 不同样本的反射率差异初步验证了Pb光谱响应的存在, 同时预处理后光谱具有较为一致的光谱吸收峰谷, 为基于类标准化样品探究光谱响应特征波段提供了可行性。

2.3 类标准化样品Pb含量PLSR建模及特征波段提取

图3显示了类标准化样品Pb含量的PLSR建模和特征波段提取结果。 由图3(a)可知, PLSR模型 Rc2=0.98, Rp2=0.85, RMSEp=843.87, RPD=2.30, 模型精度较高, 对于高值和低值的预测稳定, 表现良好, 可用于土壤Pb的定量预测。 相较于以往研究中自然土壤样本反演结果[6, 8], 类标准化样品建模精度显著提升, 说明解混复杂光谱曲线是提升反演精度的途径之一。 而自然样本由于组分混杂, Pb光谱信号特征被掩盖, 难以提取有效的光谱波段建立可靠的反演模型。 建模结果证实了土壤Pb存在一定光谱响应信号, 类标准化样品能够排除其他组分对于光谱的干扰, 提升重金属含量反演模型精度。

图3 类标准化样品Pb含量PLSR建模结果图
(a): 建模结果茎叶图; (b): VIP评分结果
Fig.3 PLSR modeling results for near standard soil samples Pb contents
(a): Stem plots of modeling; (b): VIP scores

图3(b)表明了在对类标准化样品建模过程中, 结合VIP和b-coefficient得到的Pb在400~2 400 nm的光谱特征波段, VIP阈值为1, b-coefficient标准差为338.581 6。 由图可知, 光谱对土壤Pb含量的变化均产生了不同程度的响应; VIP与b-coefficient响应曲线基本成轴对称状态, 在400~940和1 000~1 880 nm区间曲线变化平稳, 前者较低呈现弱信号状态; 1 900~2 400 nm内VIP值与b-coefficient增幅明显, 尤其后者响应剧烈, 信号显著增强; VIP和b-coefficient的峰值分别出现在989和2 320 nm附近, 通过两者筛选出的特征波段集中在970~1 000, 1 700~2 080以及2 220~2 400 nm。 筛选结果图直观地反映了特征波段的光谱位置分布和对模型的贡献率, 特征波段提取结果再次证实土壤Pb光谱响应信号的存在, 并且控制变量的类标准化样品能够有力佐证Pb含量是驱动光谱信号变化的唯一因子。

2.4 基于特征波段的矿区土壤含量高光谱反演

矿区自然污染土样Pb的PLSR光谱建模结果如图4所示。 图4(a)是全波段光谱建模结果, Rc2=0.24, Rp2=0.32, RMSEp=1 376.83。 相比类标准化样本建模结果, 自然样本建模精度偏低, 误差较大, 光谱低信噪比是影响模型效果的主要原因。 图4(b)是特征波段建模结果, 结合表4的对照分析可知, 去除非特征波段后建模精度有显著的提升, Rp2由0.32提高至0.55, RPD由1.20提高至1.44, RMSEp由1 376.83降低至1 207.70。 结果说明基于类标准化样品提取的土壤Pb光谱特征波段能够较好表征重金属Pb的响应信号, 同时为从自然样本混合光谱中识别重金属指示性信号提供依据, 减少冗余的光谱数据对建模的干扰, 提高反演模型性能。

图4 矿区土壤Pb偏最小二乘回归模型散点图
(a): 全波段建模散点图; (b): 特征波段建模散点图
Fig.4 Scatter plots of PLSR modeling for Pb content in mining area
(a): Entire spectra band; (b): Characteristic spectra band

表4 矿区土壤Pb全波段与特征波段建模结果对比 Table 4 Comparison of Pb content estimation model based on entire spectra band and characteristic spectra band
3 结论

选取湖南省某铅锌矿区为研究区, 制作土壤重金属Pb类标准化样品, 基于类标准化样品进行Pb光谱特征波段提取, 探讨Pb光谱响应机制; 并对比基于全波段和特征波段的自然样本偏最小二乘定量回归模型精度和性能, 结果表明:

(1)在背景土壤组分含量稳定情况下, 控制土壤Pb含量为单一变量得到的40个类标准化样品, 光谱总体形态趋势一致, 反射率曲线随Pb含量变化总体上移或下降, 证实了土壤中Pb光谱响应信号的存在; (2)相较于自然样本, 类标准化样品光谱反演精度更高, 控制背景成分变化的类标准化样品能够有效排除其他组分对于光谱建模的干扰, 改善模型性能; 通过VIP和PLSR回归系数筛选的Pb特征指示波段集中在970~1 000, 1 700~2 080和2 220~2 400 nm区间, 提出的基于类标准化样品的土壤重金属特征波段识别为不同类别重金属的光谱响应机理探究提供了新的思路; (3)相比矿区样本全波段PLSR建模结果, 引入类标准化样品特征波段的建模模型表现更佳, 说明本研究得到的特征波段能够较好表征Pb的响应信号, 波段提取有助于过滤噪声光谱信息, 减少数据冗余同时提高模型反演精度, 有效解决自然样本成分复杂, 重金属光谱信号微弱的问题, 为发展基于高光谱遥感的土壤重金属监测评估提供了理论和技术支撑。

参考文献
[1] LIU Chang, SONG Bo, ZHANG Yun-xia, et al(刘畅, 宋波, 张云霞, ). Environmental Science(环境科学), 2018, 39(2): 899. [本文引用:1]
[2] SONG Bo, TIAN Mei-ling, CHEN Tong-bin, et al(宋波, 田美玲, 陈同斌, ). Acta Pedologica Sinica(土壤学报), 2017, 51(1): 92. [本文引用:1]
[3] Shi T Z, Chen Y Y, Liu Y L, et al. Journal of Hazardous Materials, 2013, 265C(2): 166. [本文引用:1]
[4] Liu K, Zhao D, Fang J Y, et al. Journal of the Indian Society of Remote Sensing, 2016, 45(5): 805. [本文引用:2]
[5] JIANG Zhen-lan, YANG Yu-sheng, SHA Jin-ming, et al(江振蓝, 杨玉盛, 沙晋明, ). Acta Geographica Sinica(地理学报), 2017, 72(3): 533. [本文引用:1]
[6] Cheng H, Shen R L, Chen Y Y, et al. Geoderma, 2019, 336: 59. [本文引用:3]
[7] Wang J J, Cui L J, Gao W X, et al. Geoderma, 2014, 216: 1. [本文引用:2]
[8] Zhang X, Sun W C, Cen Y, et al. Science of The Total Environment, 2019, 650: 321. [本文引用:2]
[9] CHENG Hang, WAN Yuan, CHEN Yi-yun, et al(程航, 万远, 陈奕云, ). Spectroscopy and Spectral Analysis(光谱学与光谱分析), 2018, 38(3): 771. [本文引用:1]
[10] Rossel R A V, Walvoort D J J, Mcbratney A B, et al. Geoderma, 2006, 131(1-2): 75. [本文引用:1]
[11] Ministry of Ecology and Environment of the People’s Republic of China(中华人民共和国生态环境部). GB15618—2018. Soil Environmental Quality Risk Control Stand ard for Soil Contamination of Agricultural Land (GB15618—2018. 土壤环境质量农用地土壤污染风险管控标准(试行)), 2018. [本文引用:1]