类标准化土壤样品Cd含量高光谱定量反演
姜晓璐1, 邹滨1,2,*, 涂宇龙1, 冯徽徽1, 陈旭1
1. 中南大学有色金属成矿预测与地质环境监测教育部重点实验室, 地球科学与信息物理学院, 湖南 长沙 410083
2. 国家重金属污染防治工程技术研究中心, 湖南 长沙 410083
*通讯联系人 e-mail: 210010@csu.edu.cn

作者简介: 姜晓璐, 1992年生, 中南大学地球科学与信息物理学院硕士研究生 e-mail: kwyjl19@126.com

摘要

针对土壤Cd高光谱遥感反演精度低、 特征波段难以有效识别的问题, 以湖南省某典型重金属污染矿区为例, 开展类标准化Cd污染土壤样品和自然污染土壤样品Cd含量高光谱定量反演对比研究。 创新之处主要在于以相对清洁的背景土壤作为内控样本, 通过实验室定量添加Cd标准溶液制备符合自然污染规律的类标准化Cd污染土壤样品方案的提出与对比实验的开展, 研究实验过程还包括自然污染土壤样品野外采集, 类标准化样品与自然样品土壤重金属、 有机质含量及350~2 500 nm光谱反射率等的测定, 光谱全要素主成分逐步回归土壤Cd含量反演建模。 研究发现, 类标准化土壤样品Cd含量高光谱反演模型精度(adj R2=0.87)明显高于野外自然污染土壤样品Cd含量高光谱反演建模结果(adj R2=0.39)。 土壤Cd含量与土壤光谱反射率间确实存在一定的响应关系, 但各光谱波段对土壤Cd含量及其变化产生响应的程度存在差异, 其中1 000, 2 000以及2 300 nm波段光谱响应信号较强。 该研究创新引入的类标准化Cd污染土壤样品制备方法有助于深入探索重金属Cd污染土壤光谱特征响应规律并发现重金属Cd含量及其变化的真正指示性特征波段, 可为多要素混淆污染模式下模拟反演土壤重金属含量提供先验知识。

关键词: 土壤; Cd; 类标准化样品; 高光谱; 定量反演
中图分类号:X87 文献标志码:A
Quantitative Estimation of Cd Concentrations of Type Standard Soil Samples Using Hyperspectral Data
JIANG Xiao-lu1, ZOU Bin1,2,*, TU Yu-long1, FENG Hui-hui1, CHEN Xu1
1. The Key Laboratory of Metallogenic Prediction of Nonferrous Metals and Geological Environment Monitoring (Center South University), Ministry of Education, School of Geosciences and Info-physics, Changsha 410083, China
2. Chinese National Engineering Research Center for Control & Treatment of Heavy Metal Pollution, Changsha 410083, China;;
*Corresponding author
Abstract

Due to the low accuracy of soil Cd concentrations estimation and the great difficulty of characteristic spectral wavelength identification using hyperspectraldata, a comparative study on quantitative estimation of soil Cd concentrations was carried out in this paper by using the type standard soil samples and naturally contaminated soil samples from one mine in Hunan province, China. The main innovation includes the schemeproposition of type standard soil samples production and the development of comparative experiments. This study produced the type standard soil samples by adding quantitative standard solution of Cd into relatively clean background soil. The experimental process also includes the field collection of naturally contaminated soil samples, the determination of soil composition, such as heavy metals, organic matter, the measurement of 350~2 500 nm soil spectral reflectance, and the total factor principal component stepwise regression modeling of soil Cd concentrations using spectral reflectance. The results showed that accuracy of the model based on type standard soil samples was higher (adj R2=0.87) than traditional modeling results based on naturally contaminated soil samples (adj R2=0.39). In addition, this study defined the existence of the spectral response between soil Cd concentrations and spectral reflectance. However, the effect of Cd concentrations on the soil spectral reflectance acted on all the wavelengths in various degrees among which, the spectral response signals in the wavelength of 1 000, 2 000 and 2 300 nm were relatively stronger. In this study, the innovatory scheme of type standard soil samples production is helpful to deeply explore spectral response characteristics of soil Cd and find out the real indicative characteristic bands of soil heavy metal concentrations. Furthermore, it will provide priori knowledge for quantitative estimation of soil heavy metal concentrations in the mode of multi-factor confounding pollution.

Keyword: Soil; Cd; Type standard sample; Hyperspectral; Quantitative estimation
引 言

土壤中重金属Cd的大量累积可污染农作物、 通过食物链危害人体健康, 引发致癌风险[1]。 准确、 高效测定土壤Cd含量进而有效开展Cd污染土壤综合防治是全球范围关注的热点[2]。 目前, 土壤Cd含量调查多借助实地采样和原子吸收分光光度法实验室化学分析测定。 该方法虽精度高、 可靠性强, 但成本高, 且耗时耗力[3]。 不仅如此, 实地有限稀疏采样往往也难以满足国家当前在连续广域地理空间快速、 高效查清土壤Cd污染时空变化格局的需求。

新兴的高光谱技术以其波段数多, 分辨率高, 光谱连续性强的优势, 已被广泛应用于复杂土壤组分的定量化反演研究[4]。 土壤高光谱遥感反演在土壤黏土矿物、 铁氧化物、 有机质、 水分以及氮等组分的含量预测等方面得到了成功应用[5]。 高光谱在土壤重金属污染监测研究中发现, 重金属污染土壤的光谱曲线与不受重金属污染的土壤光谱曲线存在显著差异[6]。 国内外均已有基于土壤反射光谱实现土壤Cd, Pb和Zn等重金属含量的定量预测研究, 初步证实了土壤高光谱定量反演Cd含量的可行性[7]。 然而, 目前明确解释土壤Cd含量高光谱定量反演机理的报道较少, 反演精度难以提升和特征波段难以准确识别等问题。 甚至因土壤中Cd含量甚微, 光谱信号弱, 对于土壤中Cd的含量与土壤光谱变化间是否存在响应关系也存有疑义。 鉴于此, 明确土壤各波段光谱对土壤中Cd含量变化的响应规律是实现土壤Cd含量高光谱反演的首要前提。

但不可忽视的是, 源自土壤类别、 粒径大小、 水分、 有机质及各种重金属等土壤组分的差异[8], 野外实地采集的土壤样品光谱常因干扰因素复杂而不易分离解混的难题。 类标准化样品制备法, 是一种通过内控样设置, 有效排除组分复杂多样且规律不明物质因组织机构和化学组成不一致导致光谱分析结果偏差的方法。 在光谱分析领域, 类标准化样品已被广泛认可为一种常用便捷的实验分析方法[9]。 引入类标准化样品(即内控样品)制备法从验证土壤Cd含量存在特定光谱响应规律的假设。 以湖南省某典型重金属污染矿区相对清洁背景土壤为内控样, 参照矿区自然污染土壤Cd含量变化范围, 设计并制备除Cd含量值变化外其余土壤组分要素基本一致的类标准化Cd污染土壤样品; 测定类标准化Cd污染样品与自然污染样品土壤中的重金属、 有机质含量与光谱反射率等。 对比建立高光谱全要素主成分逐步回归土壤Cd含量反演模型, 识别土壤各波段光谱对Cd含量变化响应较强的特征波段。

1 实验部分
1.1 研究区与土壤取样分析

湖南省某典型重金属污染矿区(图1)位于湘江流域上游。 历史上长期大规模矿产开采及冶炼活动, 造成了该矿区多种重金属污染物沿管道、 地面运输路线及河流扩散, 并在沿线居民区地表土壤及水稻土中不断累积, 正潜在危害当地居地健康与生态环境。 其中, 重金属Cd单因子污染指数相比其他指数偏高[10]

图1 研究区采样点位置图Fig.1 Locations of sampling sites in study region

土壤样品采集包括背景土壤取样和自然污染土壤取样。 综合考虑研究区地形地势概况及污染源分布, 选择矿山背面山顶高处同一地点相对清洁的红壤土作为内控样制作背景土壤样品。 同时, 顾及研究区矿渣与尾砂运输线路, 道路、 河流、 工厂、 居民点与农用地分布、 以及红壤土、 水稻土不同土壤类型等多种污染扩散相关因素布设带状采样路线。 采样过程中, 采用格网取样法采集自然污染土壤表层(0~20 cm)样品46个, 借助手持式全球定位系统设备逐一记录各采样点WGS84坐标系下的经纬度值, 并作为采样点编号。

上述样品采集时间为2016年11月。 样土用塑料袋密封取回。 所有土壤样品在阴凉通风处风干、 研磨、 混合均匀后过100目尼龙筛。 采用原子吸收分光光度法测定土壤Cd含量。 实验室化学分析测定背景土壤样品pH值, 有机质、 全铁以及Pb, Cu, As等其他重金属含量。 与此同时, 借助PSR-3500便携式地物光谱仪实验室内测定46个自然污染土壤样品全波段范围(350~2 500 nm)1 024个波段的光谱反射率。 光谱采样带宽为1.5 nm(350~1 000 nm), 3.8 nm(1 000~1 900 nm), 2.5 nm(1 900~2 500 nm)。 土壤样品光谱测试前首先通过白板定标获取绝对反射率。 1 000 W卤素灯作为测试光源, 控制5° 视场角, 光源照射方向与垂直方向夹角15° ; 设置光源距离30 cm, 探头距离5 cm。 探头与土壤样品平面夹角保持为45° , 每个土壤样品重复10次测量反射光谱曲线, 最终取算术平均值作为该样品的光谱反射率。

1.2 类标准化Cd污染土壤样品制作与测定

参照研究区自然污染土壤样品中Cd含量的实际值, 同时考虑土壤样品稳定性技术要求[11], 设计如表1所示Cd含量值分级标准下的类标准化Cd污染土壤样品制备方案。

表1 类标准化Cd污染土壤样品Cd含量 分级设计值(mg· kg-1) Table 1 Designed Cd concentrations of type standard soil samples (mg· kg-1)

按式(1)计算达到设定的土壤Cd污染含量值需向100 g土壤内控样中添加的Cd标准溶液(GSB G 62040— 90(4801), 浓度1 000 μ g· L-1, 介质10% HCl)量

c=10-3×(A-S)/ρ×D(1)

式(1)中, c为加入100 g背景土壤中的Cd标准溶液量(单位: mL), D为背景土壤(单位: g), A表1中设计的类标准化土壤样品的重金属Cd含量(单位: mg· kg-1), S为土壤取样分析过程中测得的背景土壤样本的重金属Cd含量(单位: mg· kg-1), ρ 为Cd标准溶液的浓度(单位: μ g· L-1)。

按计算所得, 将相应浓度的Cd标准溶液逐一添加到66份各重100 g的内控背景土壤样品中, 制得土壤类标准化样本。 因类标准化Cd污染土壤样品制备过程每100 g土壤中Cd含量最高不超过0.1 mg, 为底样总重量的10-4数量级, 故计算过程中假定类标准化Cd污染土壤样品总质量保持不变。 66份类标准化Cd污染土壤样品的Cd含量、 pH值、 有机质、 铁氧化物、 Pb、 Cu、 As等其他重金属含量、 以及光谱反射率测定方法与上述自然污染土壤样品相同。

1.3 全要素主成分逐步回归建模

为保证光谱测量过程中数据的有效性与增强光谱特征差异, 采用光谱去噪方法, 去除首尾信噪比较低的波段350~380和2 460~2 500 nm; 对去噪后的光谱进行10 nm间隔重采样以消除数据冗余和平滑波谱; 通过一阶微分光谱预处理方法去除部分线性或接近线性的背景值干扰[13]。 以预处理后的光谱数据为输入自变量, 土壤Cd含量为因变量, 构建主成分逐步回归模型。 主成分逐步回归建模是一种能够在建模过程中依次引入自变量、 规避哑变量, 有效消除高光谱数据各波段间多重共线性的土壤重金属含量高光谱反演手段[14]。 计算式(2)

cj=v1jX1+v2jX2++v1jXi++vmjXmY=a0+a1c1+a2c2++ancn(2)

式(2)中, cj为主成分变换后的第j个新成分, Xi为第i个波段的光谱反射率; m为主成分变换前的光谱变量数, vijm个原始变量的相关系数矩阵中第i个特征值对应的特征向量, Y为土壤Cd含量估算值, an为第n个主成分变量对应的Cd含量反演模型系数。

针对传统主成分数据降维方法常剔除了部分光谱主成分中含有的有效弱信号的缺陷, 将全部主成分cj作为自变量构建全要素主成分多元逐步回归模型, 同时结合模型解释变量系数值判别土壤Cd含量的光谱响应特征波段。 建模过程中, 随机选取10%总量样品作为检验样品, 采用判定系数R2、 调整后R2(adjR2)、 建模样本均方根误差(RMSE)和验证样本均方根误差(RMSEp)评价模型精度, 评判模型预测能力。

2 结果与讨论
2.1 土壤样品Cd含量相关特征描述性统计分析

表2为研究区66个类标准化Cd污染土壤样品Cd含量实测值及土壤有机质等其他组分含量测定结果。 结果表明, 研究区相对清洁的背景土壤样品Cd含量值为0.38 mg· kg-1; 在此基础上制备的类标准化Cd污染土壤样品Cd含量实测值与表1中的理论设计值总体分布与变化趋势高度一致, 仅存在细微偏差。 同时除土壤Cd含量外, 各类标准化Cd污染土壤样品间其他土壤组分条件均保持相对稳定, 所有样品Pb, As和Cu等重金属含量均低于国家土壤环境质量标准(GB15618— 1995)二级标准中的自然背景值。 综上可知, 本研究制备的类标准化Cd污染土壤样品巧妙规避了野外实地采集的土壤样品因混淆因素复杂干扰存在光谱不易分离解混的难题, 能有效排除类别、 粒径大小、 水分、 有机质及各种重金属等土壤组分差异等导致的样品光谱分析结果偏差, 可满足探索土壤高光谱随Cd含量单一要素变化响应规律改变的要求。

表2(a) 实测类标准化Cd污染土壤样品Cd含量实测值(mg· kg-1) Table 2(a) Measured values of Cd concentrations (mg· kg-1)
表2(b) 其他组分含量实测值 Table 2(b) Other components of type standard soil samples

表3为66个类标准化Cd污染土壤样品与46个自然污染土壤样品Cd含量的描述性统计结果。 x2检验表明类标准化Cd污染土壤样品Cd含量实测值符合0.1显著水平下的正态分布, 野外实地采样自然污染土壤样品Cd含量明显存在5个特异值(分别为121.52, 137.91, 120.50, 211.56和215.83 mg· kg-1)。 经特异值剔除处理后, 两类土壤样品Cd含量数据总体分布一致, 进一步证实了本研究实验室制备的类标准化Cd污染土壤样品与自然污染土壤样品中的Cd含量分布特征具有可比性。

表3 土壤样品Cd含量描述性统计值 Table 3 Descriptive statistics of Cd concentrations in soil samples
2.2 Cd污染土壤样品光谱特征分析

图2展示了类标准化Cd污染土壤样品与自然污染土壤样品原始光谱曲线与预处理后的光谱曲线。 分析类标准化Cd污染土壤样品原始光谱曲线[图2(a)]可知, 不同Cd含量类标准化土壤样品光谱形态大致相近, 但各特征吸收带的吸收深度差异显著; 同时光谱反射率及其随Cd含量改变而发生的相对变化在可见光波段总体小于近红外波段。 该结果表明, 相对自然污染土壤样品原始光谱反射率[图2(b)]随Cd含量变化缺乏统一趋势性特征而言, 类标准化Cd污染土壤样品原始光谱反射率稳定性高、 规律性强, 能在特定波段产生相对稳定的响应特征。 究其原因, 自然污染土壤样品因样品间土壤有机质、 黏土矿物、 铁氧化物含量以及Pb, As和Cu等其他重金属含量多不尽相同, 其土壤光谱反射率往往是上述各混淆因素共同作用下的产物、 难以甄别随土壤中Cd含量单一要素变化而呈现的光谱改变。 相比, 类标准化Cd污染土壤样品通过内控样设置有效排除了其他混淆要素干扰, 理论上确保了Cd含量变化是驱动各类标准化土壤样品光谱反射率曲线变化的唯一因子。

图2 土壤光谱曲线图
(a), (c)分别为类标准化Cd污染土壤样品原始光谱与预处理后光谱;
(b), (d)分别为自然污染土壤样品原始光谱和预处理后光谱
Fig.2 Spectral characteristic curves of soils
(a), (c) Original and pretreatment spectra of type standard samples, respectively; (b), (d) Original and pretreatment spectra of natural soil samples, respectively

图2(c)与(d)进一步分析表明, 相对原始反射率光谱, 预处理后的土壤样品反射率更有利于光谱特征响应波段的识别。 对比图2(c)不同自然污染土壤样品光谱特征波段响应方向杂乱、 响应程度变化剧烈, 图2(d)中各类标准化Cd污染土壤样品光谱特征波段响应方向较为一致、 响应程度较为稳定, 与Cd含量变化相对应的特征波段响应范围主要集中在600, 1 000, 1 400, 2 000及2 300 nm附近。 该结果实际上一方面可初步证实土壤Cd含量变化或许存在一定的高光谱响应特征波段; 同时也再次证明了类标准样品方法在探索土壤重金属高光谱响应规律中的可行性。

2.3 土壤Cd含量高光谱反演模型精度与特征波段

土壤Cd含量全要素主成分逐步回归建模散点图结果如图3所示。 图3(a)表明, 类标准化Cd污染土壤样品Cd含量光谱反演模型精度为R2=0.91, adjR2=0.87, 模型构建与检验均方根误差RMSE分别为5.64和6.94; 且随着土壤Cd含量升高, 模型Cd含量预测值更接近于实际观测值, 预测精度逐步提升。 相比基于类标准化Cd污染土壤建模样品及检验样品散点紧密集中在1:1线附近, 自然污染土壤样品Cd含量反演模型[图3(b)]精度偏低(R2=0.46, adjR2=0.39), 误差偏大(RMSE=9.74, RMSEp=25.17)。 分析原因, 自然污染土壤样品因多种组分含量差异化混淆效应, 其光谱特征与本身含量低、 光谱响应信号不强的Cd含量的相关性往往容易被掩盖, 这也或许正是当前传统研究始终难以建立高精度土壤Cd含量高光谱反演模型的关键所在。

图3 土壤Cd含量全要素主成分逐步回归模型散点图
(a): 类标准化Cd污染土壤样品; (b): 自然污染土壤样品
Fig.3 Scatter plots of total factor principal component stepwise regression models for soil Cd concentrations
(a): Type standard samples; (b): Natural soil samples

图4为土壤Cd含量全要素主成分逐步回归高光谱反演模型各波段回归系数。 分析图4(a)中类标准化土壤样品回归系数可知, 研究区土壤全波段光谱包括弱信号对土壤Cd含量变化均产生了不同程度的响应, 其中1 000, 2 000以及2 300 nm波段处光谱响应信号相对较强。 但就土壤Cd含量的光谱响应指示性特征波段提取而言, 并未发现相关系数显著高于其他波段的传统意义上的指示性波段。 这一结果说明对于土壤Cd含量的预测, 在指示性波段难以提取的前提下, 依赖全波段光谱共同响应特征或许是实现土壤Cd含量高光谱反演的一种择中手段。 与此同时, 基于自然污染样品的土壤Cd含量高光谱反演模型回归系数[图4(b)]表明, 与现有已报道的包括405与480 nm, 735与905 nm[15]等在内的特征波段相比, 本研究同样发现了被通常认为与铁锰氧化物或黏土矿物等有关的特征波段480和730 nm等[14]。 对照分析这一结果与上述图4(a)结果实际上可进一步间接揭示传统试图基于野外自然污染土壤样品建立土壤重金属含量高光谱反演模型的方法存在一定的理论缺陷, 并且在此过程中识别的特征波段存在较大的不确定性, 很可能对某一重金属含量的变化并无明确指示性作用。

图4 土壤Cd含量全要素主成分逐步回归模型回归系数结果
(a): 类标准化Cd污染土壤样品; (b): 自然污染土壤样品
Fig.4 Coefficients of total factor principal component stepwise regression models for soil Cd concentrations
(a): Type standard soil samples; (b): Natural soil samples

3 结 论

以湖南省某典型重金属污染矿区为例, 本研究通过实验室制备类标准化Cd污染土壤样品, 开展了土壤Cd含量高光谱全要素主成分逐步回归建模研究, 尝试探讨了随Cd含量变化的土壤光谱响应特征变化规律; 并通过对比传统基于野外采集的自然污染土壤样品土壤Cd含量高光谱反演模型实证了类标准化样品制备方法在土壤Cd含量高光谱反演建模中的重要价值。 研究发现, 相对于自然污染土壤样品, 类标准化Cd污染土壤样品可显著提升土壤Cd含量高光谱反演模型的精度; 土壤Cd含量与土壤光谱反射率间确实存在一定的响应关系, 但各光谱波段对土壤Cd含量及其变化产生响应的程度存在差异, 其中在1 000, 2 000以及2 300 nm波段处光谱响应信号较强。 更为重要的是, 本研究或许一定程度上可以表明以往已报道的重金属高光谱反演研究中所发现的光谱特征波段或许存在较大的不确定性, 仅为重金属相关伴生金属或其他土壤组分的指标性特征波段, 真正对某一重金属含量的变化并无明确指示性作用; 而本研究中创新提出的类标准化土壤样本制备方法则可为不同土壤类型下各类重金属含量基于土壤高光谱的定量反演研究提供可行的借鉴, 具有极强的推广价值。

The authors have declared that no competing interests exist.

参考文献
[1] LIU Yan-shu, PAN Yong(刘彦姝, 潘勇). Ecology and Environmental Sciences(生态环境学报), 2012, 21(7): 1361. [本文引用:1]
[2] Wang F, Li C, Wang J, et al. Environmental Science and Pollution Research, 2017, 24(20): 16883. [本文引用:1]
[3] GONG Shao-qi, WANG Xin, SHEN Run-ping, et al(龚绍琦, 王鑫, 沈润平, ). Remote Sensing Technology and Application(遥感技术与应用), 2010, 25(2): 169. [本文引用:1]
[4] WANG Run-sheng(王润生). Journal of Geo-Information Science(地球信息科学学报), 2012, 11(3): 261. [本文引用:1]
[5] Nawar S, Buddenbaum H, Hill J, et al. Soil and Tillage Research, 2016, 155: 510. [本文引用:1]
[6] Çolak M. Environmental Earth Sciences, 2012, 67(3): 695. [本文引用:1]
[7] HE Jun-liang, ZHANG Shu-yuan, ZHA Yong, et al(贺军亮, 张淑媛, 查勇, ). Remote Sensing Technology and Application(遥感技术与应用), 2015, 30(3): 407. [本文引用:1]
[8] FU Xin, ZHAO Yan-ling, LI Jian-hua, et al(付馨, 赵艳玲, 李建华, ). China Mining Magazine(中国矿业), 2013, 22(1): 65. [本文引用:1]
[9] ZHANG Bin, YIN Yan-qing, LI Lin(张彬, 尹艳清, 李琳). Checking and Estimating the Equality of the Type Stndard Used in Spectral Analysis(浅议光谱仪分析用内控样品制作的均匀性判断和检验). The Fifteenth Annual Report on Metallurgical and Material Analysis and Testing CCATM’ 2010(第十五届冶金及材料分析测试学术报告会), 2010. [本文引用:1]
[10] SUN Rui, SHU Fan, HAO Wei, et al(孙锐, 舒帆, 郝伟, ). Environmental Science(环境科学), 2011, 32(4): 1146. [本文引用:1]
[11] TIAN Yan, ZHOU Yu-min, XING Shu-cai, et al(田衍, 周裕敏, 邢书才, 等). Physical Testing and Chemical Analysis: Part B: Chemical Analysis(理化检验: 化学分册), 2017, 53(2): 201. [本文引用:1]
[12] Zou B, Jiang X, Duan X, et al. Scientific Reports, 2017, 7(1): 341. [本文引用:1]
[13] Shepherd K D, Walsh M G. Soil Science Society of America Journal, 2013, 66(3): 988. [本文引用:1]
[14] XU Ming-xing, WU Shao-hua, ZHOU Sheng-lu, et al(徐明星, 吴绍华, 周生路, ). Journal of Infrared and Millimeter Waves(红外与毫米波学报), 2011, 30(2): 109. [本文引用:2]
[15] LI Shu-min, LI Hong, SUN Dan-feng, et al(李淑敏, 李红, 孙丹峰, ). Soil Bulletin(土壤通报), 2011, 42(3): 730. [本文引用:1]