作者简介: 虞茉莉, 女, 1984年生, 东北大学资源与土木工程学院博士研究生 e-mail: yumoli0502@126.com
我国尾矿库数量众多, 分布广泛, 在低含水量条件下, 风力作用引起的尾砂扬尘会对周边环境造成污染。 而尾矿库表面积大, 含水量变化快, 传统的含水量监测方法效率低、 安全性差、 成本高, 难以实现尾矿库含水量的大面积、 实时、 快速的监测。 目前, 基于光谱特征的遥感模型虽可以较为准确地预测土壤含水量, 但矿区尾砂与常规土壤在成分上存在差异性, 使得土壤含水量的光谱预测遥感模型可能无法适用于尾矿库含水量的预测。 为此, 选择辽宁省风水沟尾矿库作为研究区, 采集尾砂配置成不同含水量的样品, 测试其可见光-近红外光谱, 分析不同含水量样品的光谱特征以及含水量与光谱特征之间的关系, 建立针对尾砂的含水量遥感预测模型, 并应用于辽宁省风水沟尾矿库表面含水量的预测。 结果表明: (1)含水量对尾砂的光谱特征有显著影响, 二者存在高度的相关性, 光谱反射率随含水量增加而下降, 且波长越长, 含水量对光谱的影响越显著; (2)构建了基于尾砂光谱特征的含水量遥感预测模型, 选择Landsat8-OLI传感器的B6和B7波段, 定义了比值指数(RTI)、 归一化差异指数(NDTI)和差值指数(DTI)3种尾砂光谱指数, 并将这3种指数作为输入自变量, 使用随机森林方法进行训练以及含水量的建模预测, 并与B7波段建立的对数反射率预测模型进行比较。 结果表明, 光谱指数+随机森林的预测模型效果优于基于B7波段建立的对数反射率模型。 (3)使用光谱指数+随机森林的预测模型, 通过Landsat8-OLI数据对实地尾矿库提取了含水量的空间分布图, 结果表明模型预测的含水量与实测结果之间的决定系数 R2达0.798, 均方根误差RMSE为0.077, 相对分析误差RPD为1.970, 平均相对精度ARE为20.1%, 在现有技术条件下, 达到了较好的预测效果。 该研究为变质型铁矿尾矿库含水量的预测提供一种大面积、 实时、 快速的实用方法。
The tailing ponds are widely distributed in China. Once the surface tailings are under low moisture content, the tailing dust would cause severely environmental pollution driven by the wind action. Because of the large area and rapidly variation of moisture content of tailing ponds, the traditional method with the limitation on low efficiency, safety and high cost cannot meet the requirement of quick and dynamic moisture content monitoring. Currently, although the remote sensing technology based on spectral model can provide accurate prediction of soil moisture content, this model is not fit to tailing moisture content prediction because of the different characteristics and components between soil and tails. Therefore, the Fengshuigou tailing pond in Liaoning Province was selected as the study area. First, the samples of tailings at different moisture content were collected and configured. Then, the visible-near infrared spectra of the samples were measured and analyzed. Furthermore, the relationship between moisture contents and spectral characteristics was established. Finally, the remote sensing inversion model for moisture contents prediction was built and applied for mapping the moisture content in this study area. This study yielded the following results: (1) The moisture content has a significant effect on the spectral characteristics of tailings,and the reflectance decreased obviously as the moisture content increased. The longer the wavelength is, the more significant the effect of water content on the spectrum is. (2) The remote sensing model based on the spectral characteristic for tailings moisture content prediction was established. In terms of the band 6 and band 7 from Landsat8-OLI imagery, the ratio index (RTI), normalized difference index (NDTI) and difference index (DTI) of tailings were proposed and selected as the input data for the random forest model. By comparing the random forest model and Log reflectance model, the random forest model can generate more accurate predicting results. (3) The tailings moisture content map was generated by applying the random forest predicting model with spectral index based on the Landsat-OLI imagery. From the field verification, the coefficie of determination ( R2), RMSE, RPD, and ARE is 0.798, 0.077, 1.970 and 20.1% respectively between the predicted and field measured moisture content. The results could provide an effective and real-time method for large scale moisture content predicting of the tailing ponds from the metamorphic iron ore area.
尾矿是原矿石经选矿流程后有用组分含量低而无法用于生产的部分, 目前全国有尾矿库11 000多座, 存储各类尾砂约70亿吨, 主要集中于华北、 东北、 华中地区。 在低含水量条件下, 风力作用引起尾砂的扬尘会对周边环境造成污染[1], 所以尾矿库又被称为“ 城市沙漠” 。 传统的尾砂含水量监测方法有烘干法、 中子法、 TDR法等[2], 这些方法均需从地面点状采样, 其效率低下且成本高。 尾矿库面积大、 含水量变化快、 表面稳定性差, 传统方法难以满足尾矿库的大面积、 实时、 快速监测需求。 国务院《关于生态环境监测网络建设方案的通知》中提出, 需要对矿区特殊地物类型的遥感模型与方法进行进一步研究。 因此, 利用遥感手段对尾矿库表面含水量进行预测, 对矿区环境监测与保护具有非常重要的意义。
目前, 利用热红外和微波遥感对土壤的含水量进行监测已经取得了大量研究成果[3, 4, 5, 6], 但热红外和微波遥感的空间分辨率较低, 不适用于小尺度的地物目标[3]。
利用可见光-近红外波段, 通过反射光谱直接建立与含水量的关系, 具有较高的空间分辨率, 卫星数据易获取, 适用于裸地表层部位的含水量预测[7, 8, 9]。 Haubrock[10, 11]等构建了归一化土壤水分指数(NSMI), 预测多种类型的土壤的含水量。 Zeng[12]等利用改进的反高斯模型+人工神经网络的方法, 成功预测了内蒙古河套地区盐渍土的含水量。 Zhu[13]利用偏最小二乘模型很好的预测了人造石英砂和路易斯安那州地区土壤的含水量。 Leila[14]用高光谱影像发现土壤质地对含水量模型的预测精度有很大的影响。
可见, 土壤成分对含水量的预测有重要影响, 进而影响模型的适用性。 尾砂在成分和结构上均与土壤有较大区别, 而目前针对尾砂含水量的遥感预测模型还未见报道。 为此, 本文通过实验方法测试和分析了不同含水量尾砂的光谱特征, 并建立了基于光谱特征的尾砂含水量反演模型, 取得了较好的效果。
研究区选择辽宁省风水沟尾矿库(图1), 其东西长4.5 km, 南北宽2.5 km, 总汇水面积7.828 km2。 尾砂主要由磁铁矿、 赤铁矿、 假象赤铁矿、 石英、 角闪石等矿物组成。 尾矿库排尾管道位于尾矿库西部边缘, 各路管道均匀分布于排尾口, 尾矿浆从排尾口排出后向东流入过滤塔。
为了使样品具有代表性, 在排尾口附近均匀采集样点90个, 分布见图1。 尾矿浆由3个不同的选矿厂排出, 选择在3个排尾口以及两排尾口中间的5个样点采样进行化学成分化验, 结果见表1所示。 从表中看出, 尾砂主要成分为SiO2, 含量约占80%; 其次为TFe(全铁), 含量约占10%, 其他为MgO+CaO+MnO, 含量小于10%。
![]() | 表1 尾砂化学成分测试结果 Table 1 The testing results of the chemical composition of the tailings |
样品的制备: (1)将采集到的90个样品经风干, 烘干后, 分别放入直径7 cm, 高2 cm的小盒中称重。 (2)沿小盒边缘缓慢注水至样品过饱和, 待自由水消失后, 作为饱水样品。
(3)随着样品水分的自然蒸发, 含水量逐渐下降, 选择每蒸发6 h称重, 每个样品以两次称重结果计算其含水量, 直到部分样品含水量达到风干状态停止。
采用美国SVC-HR-1024地物光谱仪对样品进行光谱测试, 光谱仪波段范围为350~2 500 nm, 通道数1 024, 光谱分辨率≤ 8.5 nm, 测试在密闭黑暗环境中进行; 将装有样品的黑色容器放在载物台上, 用功率为1 000 W的卤素灯对样本进行照射, 卤素灯距样本表面47 cm, 照射方向与观察平面的夹角为45° , 光谱仪垂直距离样本47 cm, 镜头视场角为4° , 每个样品旋转测试3次光谱后取平均值。
对上述配置好的不同含水量样品进行光谱测试, 90个样品共循环测量4次, 共得到不同含水量的光谱曲线360条, 其中240条作为训练集样本, 120条作为验证集样本。
为了便于显示不同含水量光谱的差异性, 将含水量按照梯度等间隔划分为7个等级, 并将训练集的光谱曲线, 按照含水量梯度同样划分为7个等级, 将每个等级含水量所对应的光谱曲线取均值。 选取中间的5条以及最大值、 最小值共计7条光谱曲线绘制, 如图2所示。
![]() | 图2 不同含水量尾砂的可见光-近红外光谱曲线Fig.2 The visible and near infrared spectra of tailings with different moisture contents |
(1)不同含水量的光谱曲线的基本形态相似, 即在350~1 200 nm呈上升趋势, 在1 200~2 500 nm变化相对平稳。 在912, 1 455和1 930 nm处有3个较大的吸收谷, 其中912 nm处为Fe3+的宽吸收带, 1 455和1 930 nm为O— H吸收带。
(2)反射率随着含水量的增加整体呈下降趋势, 且越向近红外波段发展, 下降的速度越快。 当含水量趋于饱和(接近22.0%), 反射率下降速度开始变慢, 并逐渐达到最低值。 当含水量小于14.65%, 2 100~2 500 nm波段的反射率比1 100~1 850 nm波段反射率高, 含水量大于14.65%, 2 100~2 500 nm波段的反射率比1 100~1 850 nm波段的反射率低。
分析原因如下: (1)当含水量比较低时, 水分以一种薄膜状液体包裹尾砂颗粒表面, 随着水分的增多薄膜增厚, 吸收的入射光增多, 反射光减少, 所以光谱曲线随含水量升高而下降; (2)随着水分的增多, 水分开始填充颗粒间的空隙并趋于饱和, 尾砂颗粒间的水分对光的吸收达到极限, 光谱曲线不再下降并趋于定值; (3)水分对光的吸收因波长的增加而变强, 因此红外波段要比可见光波段强烈, 所以当样品含水量偏低时, 2 100~2 500 nm波段处的反射率高于1 100~1 850 nm波段, 但随着含水量的增加, 2 100~2 500 nm波段处的反射率逐渐低于1 100~1 850 nm波段。
2.1.1 尾砂含水量遥感模型的建立与实验验证
由图2看出, 当尾砂含水量变化时, 光谱形态随之变化, 二者呈现密切的关系。 为建立尾砂含水量遥感模型, 并考虑到测试环境可能对模型的影响, 尝试利用比值指数(RTI)、 归一化差异指数(NDTI)和差值指数(DTI)来反映不同含水量光谱变化特征, 进而建立光谱指数与含水量之间的关系。 由于Landsat数据是目前中等分辨率用途最为广泛的数据, 所以使用Landsat-8卫星的OLI传感器数据建立光谱指数。 图2显示了OLI的1~9波段在光谱中的位置, 式(1)— 式(3)是基于这9个波段建立的3种光谱指数。
式中: Ri与Rj分别表示OLI的第i波段和第j波段的反射率。
图3是3种指数与尾砂样品含水量之间的线性相关系数计算结果图, 表2列出了最大的光谱指数以及所对应的波段(也称为敏感波段)。
![]() | 图3 3种指数与样品含水量相关系数示意图(a): RTI; (b): NDTI; (c): DTIFig.3 The correlation distribution between three indexes and sample moisture content at different wavebands(a): RTI; (b): NDTI; (c): DTI |
![]() | 表2 不同光谱指数的敏感波段及相关系数绝对值 Table 2 The sensitive wavebands and absolute value of correlation coefficient of different spectral indexes |
由图3和表2可知, RTI=R6/R7, NDTI=(R6-R7)/(R6+R7)与含水量的相关系数最高为0.85, DTI=R6-R7与含水量的相关系数次之为0.81。
为提高遥感模型的预测精度, 尝试将上述3种光谱指数, 与性能良好的机器学习方法— — 随机森林相结合, 即将3种光谱指数作为输入自变量, 利用随机森林算法对尾砂的含水量进行建模预测。 由于随机森林回归适用于高维大样本数据, 在预测非线性关系方面具有很高的预测准确率[11]。 随机森林算法的分类精度取决于决策树的个数和特征变量的个数, 将决策树的个数设为200, 特征变量的个数设为2。
为验证所建模型的准确性和稳定性, 使用验证集样本数据进行模型验证, 用决定系数R2, 均方根误差RMSE和相对分析误差RPD为模型评价参数。 R2越接近1, 均方根误差RMSE值越小, 说明模型稳定性越好, 精度越高; 相对分析误差RPD用来评价模型的稳定性和合理性, 当RPD< 1.4时, 模型不能应用; 当1.4< PRD< 2, 模型可对样本进行粗略估计; 当RPD> 2时, 模型的预测能力极好[15, 16, 17]。
图4显示了随机森林预测的含水量与实际含水量对比结果。 从图中看出, 反演含水量值与实测含水量值的决定系数R2为0.884, 均方根误差RMSE为0.064, 相对分析误差RPD为2.606, 预测结果比较理想。
![]() | 图4 随机森林预测的含水量与实际含水量对比图Fig.4 The comparison between the predicted result based on RF and measured moisture contents |
2.1.2 与线性预测模型结果对比
从图2看出, 随着含水量的增加光谱曲线逐渐下降, 含水量与反射率呈负相关关系。 因此可以基于此关系建立含水量的预测模型。 为消除背景噪声影响和寻找最优建模波段, 首先对原始反射率光谱数据进行取对数处理, 然后与含水量进行相关性分析, 结果见图5。
![]() | 图5 不同波长的对数反射率与含水量相关关系图Fig.5 The correlation coefficients between the tailings moisture contents and natural logarithm of reflectance at different wavebands |
从图5看出, 对数反射率与含水量的相关系数在-0.55和-0.83之间。 相关性最强的波段为1 895~2 031.9 nm, 但OLI传感器在此波长处无设置。 B7波段处的相关系数均值为0.80, 相对较高, 所以选择B7波段建立线性模型, 如式(4)所示。
式中: Y为尾砂的含水量, Rb7为B7波段的对数反射率值。 通过该线性模型预测尾砂的含水量(见图6)。
![]() | 图6 线性模型预测含水量与真实含水量对比图Fig.6 The comparison between the prediction result based on linear model and measured moisture contents |
结果表明, 反演的含水量值与实测含水量值的决定系数R2为0.627, 预测误差RMES为0.179, 相对分析误差RPD为1.546, 与上述的光谱指数+随机森林预测模型相比, 预测能力较差。
2.2.1 尾矿库表面含水量预测
为了进一步验证模型的实用性, 使用2017年6月28日风水沟地区landsat8-OLI影像。 由于尾矿库东部含有尾矿浆沉淀后的水体, 因此首先将预处理后的影像用归一化植被指数(NDVI)并以0为阈值裁掉水体部分。 然后计算B6和B7波段的3种光谱指数并运行随机森林算法预测含水量, 结果如图7所示。
![]() | 图7 风水沟尾矿库预测含水量与二次采样点分布图Fig.7 The spatial distribution of predicted moisture content and the location of the secondary sampling points in Fengshuigou tailing pond |
由图7看出, 利用光谱指数+随机森林模型预测的尾矿库含水量大部分在12%以上, 其中西部和南部在18%以上, 从东部到西部含水量由4%逐渐升高至20%, 而北部含水量相对较低。
2.2.2 实地精度验证
为验证模型的实用性, 对研究区进行第二次采样, 采样集中在landsat8卫星过境时刻的前后0.5 h内完成。 依照OLI传感器的空间分辨率, 布置长宽为30 m的正方形样方, 在样方的4角和中心位置各布置1个采样点, 再将这5个点的尾砂均匀混合成1个验证样本, 共采集16个验证样本。 每个样本密封后称重, 带回实验室烘干计算其含水量。 预测的含水量与真实的含水量如图8和表4所示。
![]() | 图8 实地真实含水量与预测含水量对比图Fig.8 The comparison between the prediction results and measured moisture contents |
![]() | 表4 实测含水量与预测含水量对比详表 Table 4 The statistical comparison of the predicted and measured moisture contents |
从图8和表4看出, 预测的含水量与实测含水量之间的决定系数R2为0.798, 均方根误差RMSE为0.077, 相对分析误差RPD为1.970, 平均相对误差ARE为20.1%, 预测效果较好。
从表4看出, 基于光谱指数+随机森林遥感模型虽然预测了尾矿库表面的含水量, 但一些样本还存在较大误差, 原因如下:
(1)样品中除了水分, 其他成分同样影响光谱反射率, 从而影响含水量的预测精度。 土壤中的铁含量直接影响土壤整体反射率[18, 19], 尾砂的含铁量比土壤中含铁量高, 推测会对含水量的预测产生影响。
(2)尾砂粒径的大小同样影响着尾砂的反射率, 粒径对透明矿物、 不透明矿物、 半透明矿物反射率的影响有着不同的规律[20], 而尾砂样品中含磁铁矿, 石英和赤铁矿三种不同透明度矿物, 推测同样会影响含水量的预测精度。
(3)OLI影像的空间分辨率为30 m, 在该空间分辨率下, 单个像元中存在干摊、 水流等混合像元问题, 也会影响模型的预测精度。
在实测不同含水量尾砂光谱特征的基础上, 构建了基于光谱指数+随机森林的含水量预测模型, 并将此模型应用于实地进行了验证, 得到如下结论:
(1)尾砂光谱反射率随含水量增加而整体下降, 且越向近红外波段发展, 反射率下降越显著, 且存在含水量的敏感波段。
(2)光谱指数+随机森林的联合预测模型反演的实验室样品的含水量值与实测含水量值的R2为0.884, 预测误差RMES为0.064, 相对分析误差RPD为2.606, 远高于单独基于B7波段建立的对数反射率模型。
(3)选择光谱指数+随机森林模型对风水沟尾矿库表面含水量进行了实地预测, 经过表明预测含水量与真实的含水量之间的决定系数R2达0.798, 均方根误差RMSE为0.077, 相对分析误差RPD为1.970, 平均相对精度ARE为20.1%。 需要指出, 所建的遥感模型仅针对变质型铁矿, 并仅在本研究区进行了验证, 是否适用于其他地区的变质型铁矿, 尚需进一步验证。 但研究思路, 即“ 通过实测尾矿库典型样品光谱、 从而获取光谱特征、 然后建立遥感反演模型、 再利用卫星数据实际反演尾矿库含水量” 的技术路线应该具有普适性, 可供同行借鉴。
[1] |
|
[2] |
|
[3] |
|
[4] |
|
[5] |
|
[6] |
|
[7] |
|
[8] |
|
[9] |
|
[10] |
|
[11] |
|
[12] |
|
[13] |
|
[14] |
|
[15] |
|
[16] |
|
[17] |
|
[18] |
|
[19] |
|
[20] |
|