作者简介: 亚森江·喀哈尔, 1993年生, 新疆大学资源与环境科学学院硕士研究生 e-mail: ysj_0801@163.com
光谱学提供了对土壤中许多元素进行定量分析和快速无损检测的方法。 可见光和近红外反射光谱(Vis-NIR)为研究土壤重金属污染提供了一个有用的工具。 于新疆准东露天煤矿区采集51个0~10 cm深度的土壤样品, 在实验室中分别测定样品的有机质(SOM)含量、 重金属砷(As)含量与高光谱; 使用基于JAVA语言自主开发的两波段组合软件V1.0(No: 2018R11S177501)计算不同高光谱数据变换形式(原始反射率( R), 倒数(1/ R), 对数(lg R)和平方根(
Spectroscopy is regarded as a quick and nondestructive method to classify and analyze quantitatively many of elements of the soil. Visible and near-infrared re?ectance spectroscopy offers a conductive tool for investigating soil heavymetal pollution. In this work, 51 soil samples with depths of 0~10 cm were collected, which were in the Eastern Junggar coal-field mining area, Xinjiang. The soil organic matter (SOM) content, Arsenic (As) content and indoor hyperspectra were measured in the laboratory. The significant relationship between As content and hyperspectral data was conductive analysis of NPDIs, which were calculated from Vis-NIR region. For calculating the indices, on the basis of the raw spectral reflectance ( R), its three mathematical transformations were calculated, i. e., the reciprocal (1/ R), logarithm (lg R) and root mean square method (sqrt- R/
随着中国工业化和城市化的快速发展, 一系列环境问题和健康风险逐渐增加[1]。 对土壤污染进行的相关研究表明, 当污染物量超过标准量时, 土壤污染成为最具危害的问题[2]。 在污染物中, 重金属是主要的污染源。 重金属不容易被土壤微生物分解, 导致重金属在土壤中不断积累, 当重金属含量超过一定的阈值时就可能会转化成更有毒的化合物[3]。 在中国, 农田和矿区的土壤正受到人为活动(如采矿, 施肥和农药施用)引起的重金属污染[4]。 土壤中过量的重金属严重影响作物的生长和质量并通过食物链积累在动物和人体内。 例如, As通过饮用水和其他来源进入人体从而引起的慢性病是世界范围内影响数亿人的重要公共卫生问题[5]。 目前的研究表明, 重金属在整个矿区的分布和扩散是一个重要的问题, 废弃的尾矿可能是环境污染的主要来源[6]。 因此, 土壤重金属污染问题已引起世界各国的广泛关注。
在重视环境问题和生态保护的同时, 矿区的实时监测已成为迫切需要解决的问题[7]。 传统的主要采用系统抽样和化学分析重金属空间分布调查方法比较复杂。 虽然该方法的准确性很高, 但它耗时且结果高度依赖于样品数量和质量。 因此, 这种方法需要物质资源和人力资本的重大投资。 遥感为估算土壤重金属含量提供了廉价、 快速和环保的替代方法, 许多研究已经证明了土壤反射光谱估算土壤重金属含量的可能性[8]。
目前, 使用高光谱技术在各种尺度上识别和绘制环境因子的应用越来越多[9]。 高光谱技术的优势在于光谱信息的丰富性和连续性, 使得土壤和植物的一些非光谱活性特性如重金属的估算成为可能。 近红外光谱(NIRS)反射率覆盖可见光和近红外波段(4002 400 nm)是另一种定量和定性技术, 它是对初步研究有用的快速非破坏性方法[10]。 NIRS对于检测土壤物理、 化学性质如水分, 总碳、 氮和磷含量, 矿物氮、 有机质质量以及土壤的生物参数(如呼吸和微生物)表现出良好的效果。 NIRS提供了对土壤进行快速分析而无需化学预处理的方法, 通过使用合适的预测模型方法估算土壤中的重金属是可行的。
尽管As在Vis-NIR中是光谱中性的, 但是与As结合的矿物的光谱特征可以用于利用光谱数据间接检测土壤中的金属离散[11]。 高光谱估算SOM含量的经验模型主要基于Vis-NIR区域(450, 500, 550, 600, 700, 900, 1 000, 1 400, 1 900, 2 050, 2 200, 2 250, 2 400和2 470 nm)[12], 估算SOM的波段理论上也可以估算As含量, 因为SOM和As之间存在显著的负相关关系。 Shi[13]发现, 几种重要波长(480, 600, 670, 810, 1 980, 2 050和2 290 nm)是As的敏感波长, 其中大部分对应于SOM预测的特征波长, 因此得出结论: 利用土壤光谱预测As含量的机制可能是基于光谱与农田光谱活性有机物的关系。 Chakraborty[14]探讨了漫反射光谱(DRS)的能力, 利用Vis-NIR检测As污染, 并建议As的预测取决于As与光谱活性SOM和铁/铝氧化物之间的密切关联。 Zheng利用高光谱数据对As和SOM进行了研究, 结果表明SOM丰富的预测模型精度低于SOM含量较低的预测模型。 Singh[16]在低SOM条件下研究了As含量的敏感波段, 并提出450, 500, 600, 650, 700, 750, 800, 900, 1 000, 1 200, 1 400, 1 900, 2 050, 2 200, 2 250, 2 350, 2 400和2 470 nm是估算As含量的重要波长。 然而, 一些研究也证实, 仅仅选择与土壤中As相关的波段对于应用来说是不够的, 需要尽更多的努力来提高解释能力, 并减少使用反射光谱法估算As含量的计算成本。 使用多种敏感波段估算重金属含量可能在一定程度上受到限制, 或许多种高光谱指数的组合可以提高土壤重金属的估算精度。
因此, 旨在利用Vis-NIR区域构建优化光谱指数, 并挑选出通过原始反射率和变换反射率计算出的敏感优化光谱指数, 基于最敏感的指数构建估算模型, 用于预测研究区土壤As含量, 探讨通过优化光谱指数提高土壤As估算精度的可行性。 研究结果有望帮助改进遥感方法对土壤重金属污染的评估。
准东煤田位于天山北侧, 吉木萨尔县, 奇台县, 木垒县境内。 位于北纬44° 30'— 45° 00', 东经88° 40'— 91° 20'之间, 海拔300600 m, 煤炭总储量达3 900亿t。 研究区位于欧亚大陆腹地, 地势北高南低, 远离海洋, 属于典型的极端干旱大陆性气候, 夏季适度温暖, 冬季寒冷干燥, 年平均气温7 ℃, 年平均降雨量和蒸发量分别为183.5和2 042.3 mm[16]。 土质差, 主要为灰棕色和棕色碳质土, 石膏土(含石膏)和粗砾土, 属于碱性土壤。 表层土壤有机质含量在2%以下, 自然植被类型少, 结构单一, 植被稀疏, 多为沙漠植被。 本工作主要讨论五彩湾准东煤田矿区及其周边区域。
2015年7月在准东露天煤矿区进行了详细的土壤采样调查。 共采集51个010 cm深度的土壤样品。 用GPS记录所有采样点的确切位置。 为了减少含水量的影响, 所有样品充分风干(2024 ℃)后, 粉碎并通过2 mm筛网筛分以除去结石, 植物残渣和其他杂质。 重铬酸钾法用于测定SOM。 每个样品被分为两个子样品, 一个用于光谱测量, 另一个用于重金属含量的物理和化学分析。
通过以下步骤制备用于重金属化学分析的土壤样品: 加入混酸(氢氟酸和氯酸组合物), 将样品置于电热板上加热, 然后干燥并溶于10%稀硝酸中直至土壤溶液变成灰白色, 随后将土壤溶液澄清并在20 mL蒸馏水中冷却。 As含量用日立Z-2000原子分光光度计测定。 为确保准确性, 每个样品进行了三组平行实验, 其平均值用作样品As含量的最终结果。 GSS-8用于质量控制, 各种金属的回收率均在国家标准参考物质设定的检测结果质量控制要求的允许范围内。 考虑到环境背景, 与当地地质和采矿活动的关系, 光谱吸收属性以及数据的完整性和可变性, As的存在被认为是环境污染的指示。 为了尽量减少实验误差, 国家标准土壤样品被用于重金属含量的化学分析。
光谱测量在暗室中进行, 以减少杂散光的影响。 所有土壤样品分别放入直径为20 cm, 深度为2 cm的宽圆形容器中并进行表面平滑处理。 为了降低测量误差, 这些容器被涂成黑色。 使用ASDFieldSpec® 3便携式光谱仪(Analytical Spectral Device, Boulder, CO, USA)测量所有土壤样品的反射光谱, 该光谱仪覆盖的光谱范围为3502 500 nm并提供每秒10次扫描的数据采集, 采样间隔为1.4 nm(3501 000 nm)和2 nm(1 0002 500 nm), 而重采样间隔为1 nm。 一个50 W的卤素灯作为实验室反射率测量的光源, 垂直放置在距离每个土壤样品表面50 cm处。 探头安装的天顶角为30° 并且距离每个土壤样本15 cm。 每个反射率测量都通过100%反射率的标准化平板进行校准以确保准确性。 每个土壤样品, 采集20条光谱曲线, 并将20个光谱反射率的平均值作为最终反射率, 使用ViewSpecProV6.0软件计算平均光谱反射率。 由于仪器噪声的存在, 从土壤样品的初始反射光谱中去除了光谱带(350399和2 4512 500 nm), 以改善信噪比。 然后对光谱进行Savitzky-Golay平滑法处理, 这种方法可以减少随机噪声对校准模型鲁棒性的影响[17]。 然后, 分别用1/R, lgR和
2.3.1 优化光谱指数的计算
NPDI是在全光谱区域(4002 400 nm)使用可用波段(i nm和j nm)的所有可能组合来计算。 使用两波段组合软件V1.0(No: 2018R11S177501, 基于JAVA开发)计算NPDI和As含量之间的相关性, 并在Matlab 2012a软件中绘制二维等势图, 其允许评估不同波段组合并选择敏感光谱指数区域。 使用0.01水平的显著性检验确定As的最有效和最敏感指数。 光谱指数定义为
其中R是光谱反射率值, 下标(i nm和j nm)是以纳米(nm)为单位的波长。
2.3.2 建模方法
GWR4是用于校准GWR模型的基于Microsoft Windows的应用软件的新版本, 可用于探索因变量与自变量之间不同地理上的关系。 GWR模型可以被认为是一种具有不同地理参数的回归模型, 常规的GWR由方程描述[18]。
2.3.3 统计分析
Wold等首次发明了VIP选择方法。 VIP分数总结了个体变量对PLS模型的影响, VIP分数为选择贡献最大的自变量提供了一个有效的办法。 对于给定的模型和数据集, 总是只有一个VIP分数向量总结所有分量和因变量[19]。
2.3.4 模型验证
为了评估土壤重金属含量预测模型的性能, 使用了4个交叉验证度量标准: RPD, R2, RMSE和ACI。 通常, 一个稳健的模型具有高R2, RPD和低RMSE。 R2和RPD通常用于评估预测精度, 因为RMSE取决于测量值的范围。 Chong将RPD分为三类, 如果RPD< 1.4或R2< 0.50表示模型不可用; 1.4≤ RPD< 2.0或0.50≤ R2< 0.80显示中等质量的模型, 可以进行近似定量预测; 2.0≤ RPD或0.8≤ R2表明优秀的定量模型[20]。 在地理加权回归建模的统计预测方面, ACI最为合适, ACI越小, 预测模型精度就越高。
采用描述性统计, 单因素方差分析(表1)对重金属As和SOM的空间分布状况进行了总结。 As含量平均值为31.5 μ g· g-1, 是新疆土壤背景值的3倍, 在土壤中有显著的积累趋势, 变异系数为39%, 属强变异性。 根据国家土壤质量标准(GB15618— 1995), 51个样品中有11个土样(22%)超标(40 μ g· g-1)。 As含量与SOM含量在0.01的显著性水平上无显著相关性(|r|=0.113), SOM含量平均值为6.35 g· kg-1, 所有样品中SOM含量均小于2%, 变异系数(CV)值为160%, 属于高度可变。 As与SOM含量没有很强的相关性, 因此, SOM对As含量的预测没有明显影响。
![]() | 表1 研究区土壤As含量统计特征 Table 1 Statistical characteristics of As concentration in soil of sampling area |
建模时, 根据As的含量将样本从高到低排序, 并且基于等距离方法选择建模集和验证集。 从描述性统计特征(表1)可以看出, 建模集和验证集的As含量最大值分别为55.4和49.4 μ g· g-1, 最小值分别为1.5和2.2 μ g· g-1, 平均值分别为30.4和31.4 μ g· g-1, CV分别为37%和40%。 CV反映了重金属含量的变异性, 表明人类活动对重金属含量的影响程度, 更大的系数值表示土壤受人类活动影响更大[21], 变异系数范围: CV< 15%为轻微变化, 15%< CV< 36%是中等变化, CV> 36%是高度可变的。 在该研究中, As具有大于36%的变异系数, 这表明, 研究区土壤As含量离散度较高, 且煤矿区周边土壤受到的影响最大。
As含量与单波段光谱反射率的相关性如图1所示, 可以看出, 51个土壤样品反射率的原始反射率和3个数学变换反射率与As含量呈低度相关, 低于0.228。 相关顺序为: R>
正如先前的研究所示, Vis-NIR区域(450, 480, 500, 550, 600, 670, 700, 810, 900, 1 000, 1 400, 1 900, 1 980, 2 050, 2 200, 2 250, 2 290, 2 400和2 470 nm)是估算土壤中As含量的重要波长, 并且当土壤中富含有机质时预测模型精度会低于SOM含量较少时的模型。 为了验证这一结果, 分析了研究区As和SOM之间的相关性(|r|=-0.143), 并且SOM含量低于2%。 因此, 在忽略SOM干扰的条件下, 基于Vis-NIR区域光谱的原始反射率和转换反射率计算优化光谱指数对土壤As的敏感性(图2)。
![]() | 图2 As含量与NPDIs之间的相关系数二维等势图Fig.2 The two dimensional maps of correlation coefficient between As contents and NPDIs |
表2表示使用4002 400 nm计算的相关系数(r), 在7801 100和1 1001 935 nm发现最高的r值和最低的p值(|r|≥ 0.73和p=0.001)。 通过原始和变换反射率(
![]() | 表2 高光谱指数与As含量之间的相关性 Table 2 Correlation between hyperspectral indices and As contents |
挑选的优化指数再经VIP过滤。 如果VIP≥ 1, 则该指数将更适合作为自变量使用; 如果不是, 则指数不会被选作模型自变量。 从图3中可以看出, 在通过R计算的优化指数NPDIs中, VIP(NPDI1 417/1 246)的值大于1。 1/R中NPDI799/953与NPDI825/947的VIP值均≥ 1, 因此选择这两个NPDIs为自变量。 根据VIP结果可知, 尽管在
26个采样点VIP值较高的NPDIs用作重金属含量的预测因子, 25个样品用于验证。 表3是GWR预测模型的模型精度指标, 图4是模型预测和实测重金属含量的散点图。 如表3和图4所示, 4个模型的RMSE值范围为12.781~4.912 μ g· g-1, RPD值为0.543~2.321, R2为0.210~0.831。 a模型(NPDIR(1 417/1 246))表现优于b模型(NPDI1/R(799/953, 825/947))和d模型(NPDIlgR(801/953, 811/953, 817/951, 825/947, 828/945)), 它具有最高验证系数(R2=0.831, RMSE=4.912 μ g· g-1, RPD=2.321)和最低AIC值(AIC=179.96)。 c模型(NPDIsqrt-R(1 023/1 257, 1 008/1 249, 1 021/1 250, 1 020/1 247))显示出较高的验证系数(R2=0.649, RMSE=7.141 μ g· g-1, RPD=1.774)和较低的AIC值(AIC=197.16)。 d模型(lgR)和b模型(1/R)产生的验证系数较低(R2=0.210, RPD=0.811, RMSE=12.781 μ g· g-1; R2=0.371, RPD=1.051, RMSE=9.95 μ g· g-1)并且AIC的值较高(AIC=236.17, AIC=218.26)。 根据模型的预测结果, 从室内原始光谱数据得到的优化指数(NPDI1 417/1 246)证明了光谱指数定量方法检测土壤中重金属As含量的可行性。 尽管1 400 nm附近的吸水特征可能会影响土壤反射率, 但Singh认为1 200和1 400 nm是预测土壤As含量的重要波长。
![]() | 表3 GWR预测模型验证系数 Table 3 Description of validation factors for every GWR prediction model |
由于土壤光谱是土壤中有机质, 氧化铁, 粘土矿物质和其他物质的全反射率, 很难用普通的光谱方法估算土壤中的重金属含量。 为了估算重金属含量, 以前的研究通常是通过原始反射率或转换反射率(一阶微分, 二阶微分, 数学变换等)获得的敏感波段作为模型参数用于预测重金属含量。 偏最小二乘回归(PLSR), 逐步多元线性回归(MLR)和人工神经网络(ANN)模型被广泛应用于估算各种环境中的重金属含量。 Nawar等[22]使用ASTER图像与PLSR模型估算重金属含量, 得出结论: 该方法能够很好地预测Cr, Zn, Pb, Ni, Mn等重金属含量, R2分别为0.70, 0.89, 0.89, 0.72和0.74, 但对Fe, Cu和Cd的预测效果欠佳。 Stazi[23]采用控制实验的方式, 使用高光谱仪检测土壤中重金属的含量, 并比较两种多元统计回归分析模型— — 偏最小二乘和支持向量机。 通过VIP方法筛选出反射光谱的580, 660, 715和780 nm波段为最敏感的模型自变量。 Shi等分析了高光谱植被指数在估算稻田土壤As含量方面的表现, 并建议将三波段植被指数(R716-R568)/(R552-R568)作为估算认为土壤As含量的指标。 Sun等[24]使用2 200 nm附近的组合波段估算土壤中重金属Zn的含量, 达到较高的预测精度, R2达到0.640。 江振蓝等证明使用GWR预测模型能提供更强大的重金属含量(Cr, Cu, Zn)预测能力, 其R2值分别为0.64, 0.79和0.77。 由于GWR预测模型是一种非线性的建模方法, 因此它能在重金属含量预测时表现得更好。 GWR模型对土壤重金属的预测准确性取决于重金属与自变量之间相关性的空间非平稳程度。
在本工作中, 计算优化光谱指数并讨论光谱指数在研究土壤重金属As含量时的可行性。 利用各种光谱反射率计算指数, 并用于预测土壤重金属As的含量。 新构建的NPDIs(表2)与As含量显著相关, 基于R, 1/R, lgR,
![]() | 图5 实测值和预测值的As分布等值线图 (a): 实测值; (b): Model-a的预测值Fig.5 Arsenic distribution contour map of field measured value and predicted value (a): Field measured value; (b): Predicted value by model-a |
研究结果表明, 双波段优化指数(NPDIR(1 417/1 246))具有估算土壤中As含量的潜力。 根据前人的研究, As在430 nm附近波段会因为土壤中的铁氧化物(主要是赤铁矿和针铁矿)而出现反射特征, 而在1 2901 310 nm之间的反射特征可以归因于SOM或含铝氧化物粘土矿物中的O— H和C— H键, 特别是2 250和2 450 nm之间的反射峰很可能与SOM中的C— H键有关。 值得注意的是, 这些光谱特征在As含量和优化光谱指数进行相关分析过程中被消除了。 Singh提出1 200和1 400 nm是预测土壤As含量的重要波长。 这些结果表明, 新构建的双波段优化指数可以被推荐为评估研究区其他土壤重金属含量的指标。
探讨了优化光谱指数在土壤As含量估算中的潜力。 基于GWR模型用原始反射率及其三种变换反射率计算的NPDIs估算重金属含量, 得出以下结论:
(1)用R, 1/R, lgR,
(2)根据VIP值选择NPDIs, 在通过R, 1/R,
(3)从4个预测模型的性能可以看出, Model-a(R)相对于Model-b(1/R)和Model-d(lgR)表现出优越的性能, 它具有最高的验证系数(R2=0.831, RMSE=4.912 μ g· g-1, RPD=2.321)和最低AIC值(AIC=179.96)。 Model-c(
优化光谱指数NPDIR(1 417/1 246)可用于初步估算土壤重金属As的含量。 优化光谱指数方法可以显著减少采样和分析过程中的时间和费用, 光谱方法的潜在用途也表明需要根据金属结合反应理论进一步研究遥感光谱指数。 由于数据采集的局限性, 只涉及SOM和一种重金属, 未考虑其他土壤性质的功能。 其实, 其他土壤特性(粘土和铁)也与重金属有密切的相互作用, 因此需要进一步的研究。
[1] |
|
[2] |
|
[3] |
|
[4] |
|
[5] |
|
[6] |
|
[7] |
|
[8] |
|
[9] |
|
[10] |
|
[11] |
|
[12] |
|
[13] |
|
[14] |
|
[15] |
|
[16] |
|
[17] |
|
[18] |
|
[19] |
|
[20] |
|
[21] |
|
[22] |
|
[23] |
|
[24] |
|