工矿业城市区域水质参数高光谱定量反演
彭令1, 梅军军1, 王娜1, 徐素宁1,*, 刘文波1, 邢顾莲1, 陈启浩2
1. 中国地质环境监测院, 北京 100081
2. 中国地质大学信息工程学院, 湖北 武汉 430074
*通讯联系人 e-mail: xusn@mail.cigem.gov.cn

作者简介: 彭 令, 1984年生, 中国地质环境监测院高级工程师 e-mail: penglmail@126.com

摘要

工矿业城市区域易受工业活动、 矿产开采影响, 使其水环境遭受不同程度的破坏, 以至于水体污染问题突出。 当前常规水质监测主要采用“以点代面”的工作方式进行野外采样及其室内化验分析, 然而环境复杂多变, 空间差异大, 导致调查点代表性受限, 整体精度不高, 效率低下, 更难以实现区域性动态监测。 以因矿兴市的矿业重镇湖北黄石大冶市为研究区, 同步开展无人机高光谱航飞、 地面光谱测量和水体样品采集测试, 分别获得具有49个波段的高光谱影像数据和光谱分辨率为1 nm的水体光谱曲线, 其中影像数据波谱范围为505~890 nm, 光谱分辨率为7.78 nm, 空间分辨率为30 cm。 对获取的高光谱影像和光谱数据剔除异常值、 光谱定标、 辐射校正等预处理后, 对比分析研究区内水体的不同光谱吸收、 反射及光谱曲线形态特征信息, 从而提取出高光谱影像和测量光谱的反射光谱曲线形态特征、 去包络线后光谱曲线形态特征、 三阶求导后光谱曲线形态特征和光谱四值编码共四大类25个光谱特征。 采用皮尔森相关系数分析样品水质参数与光谱特征之间的相关性, 以此筛选出存在显著相关的水质参数与光谱特征。 在此基础上, 采用逐步回归分析方法筛选出最大反射率及其波长位置、 对称度、 光谱编码Ⅲ、 三阶导最大及最小值等光谱特征作为模型变量, 构建出水质参数的多元线性反演模型, 并对模型进行 F检验和 t检验。 将检验后的反演模型推广运用于研究区内高光谱影像, 获得尾矿库、 河流、 湖泊等典型区域的水质参数反演结果, 从而实现“由点到面”水质参数信息的快速获取。 结果显示水质参数pH、 硬度(Ca2++Mg2+)、 钾与氯离子比值(K+/Cl-)、 镁与碱度比值[Mg2+/(HCO3-+CO32-)]的反演精度较高, 其pH的判定系数 R2最小为0.669, 镁与碱度比值的判定系数 R2最大为0.895, 相对均方根误差均小于28%; 而总溶解固体(TDS)反演精度较低, 其判定系数 R2仅为0.463, 相对均方根误差达36.762%。 提出了一种基于光谱曲线形态特征的高光谱遥感水质参数定量反演模型方法, 实现了pH值、 硬度、 镁离子与碱度之比等水质参数的高光谱定量反演, 为区域水环境动态监测提供了新方法。

关键词: 高光谱; 水质参数; 定量反演; 工矿业城市
中图分类号:P641 文献标志码:A
Quantitative Inversion of Water Quality Parameters in Industrial and Mining Cities from Hyperspectral Remote Sensing
PENG Ling1, MEI Jun-jun1, WANG Na1, XU Su-ning1,*, LIU Wen-bo1, XING Gu-lian1, CHEN Qi-hao2
1. China Institute of Geo-Environment Monitoring, Beijing 100081, China
2. Faculty of Information Engineering, China University of Geosciences, Wuhan 430074, China
*Corresponding author
Abstract

Industrial and mining cities are affected by activities of these industries that damage the water environment to various degrees and make water pollution a particular problem. At present, field sampling with a grid pattern and indoor laboratory analysis are mainly used for routine water quality monitoring. However, the environment is complex and variable, and spatial differences are considerable. Therefore, the survey sites render limited representativeness, low overall accuracy, and poor efficiency, making it difficult to realize dynamic monitoring regionally. In this study, we took Daye City under Huangshi City, Hubei Province, as the research area. Daye is an important mining city that thrives on mining. Unmanned aerial vehicle (UAV) hyperspectral imaging, ground spectral measurements, and water body sampling were carried out simultaneously. As a result, 49-band hyperspectral imaging data and water body spectra with a spectral resolution of 1 nm were obtained. The imaging data have a wavelength range of 505~890 nm, a spectral resolution of 7.78 nm, and a spatial resolution of 30 cm. After outlier removal, spectral calibration and radiometric correction were performed on the hyperspectral imaging data and spectral measurements and a comparative analysis was carried out between the spectral data of various water bodies located in the study area in terms of their absorption/reflectance spectra and the morphological features of their spectral curves. We subsequently extracted 25 spectral features from these hyperspectral images and measurement spectra, and these were classified under the following categories: morphological features of reflectance spectra, morphological features of continuum-removed spectra, morphological features of third-derivative spectra, and 4-value spectral encoding. The Pearson’s correlation coefficient was used to analyze the correlation between the water quality parameters and the spectral features of the water specimens and to select the water quality parameters and spectral features that were significantly correlated with each other. On this basis, a multivariate linear inversion model was constructed for the water quality parameters using the following model variables, which were selected via stepwise regression analysis: the maximum reflectance and its corresponding wavelength, symmetry, and spectral code Ⅲ, and the maximum and minimum third derivative values. F-tests and t-tests were then performed on this model. After the tests, our inversion model was used to obtain the water quality parameters of typical water bodies, such as tailings ponds, rivers, and lakes, from the hyperspectral imaging data from the study area. We have thus succeeded in achieving the rapid acquisition of water quality information in a “point-to-surface” manner. The results of this study indicate that our model has high inversion accuracies for water quality parameters such as pH, hardness (Ca2++Mg2+), potassium-to-chloride ratio (K+/Cl-), and magnesium-to-alkalinity ratio [Mg2+/(HCO3-+CO32-)]. Between these parameters, pH has the lowest coefficient of determination ( R2) of 0.669, whereas the magnesium-to-alkalinity ratio has the highest R2 of 0.895. The relative root mean square errors (RRMSE) were generally lower than 28%. In contrast, the inversion accuracy of our model for total dissolved solids (TDS) was relatively low, and its R2 and RRMSE were 0.463 and 36.762%, respectively. This study proposes a hyperspectral remote-sensing quantitative inversion method of water quality parameters based on spectral curve patterns. The method achieves hyperspectral quantitative inversion of water quality parameters such as pH, hardness and magnesium-to-alkalinity ratio, and it provides a new technique for dynamic monitoring of the regional water environment.

Keyword: Hyperspectral; Water quality parameters; Quantitative inversion; Industrial and mining cities
引 言

工矿业城市区域易受工业活动、 矿产开采影响, 使其水环境遭受不同程度的破坏, 以至于水体污染问题突出。 水环境监测的基础是水质监测, 当前常规水质监测主要采用实地测量或者采集水样对其进行室内化验分析, 其优点是可精确测定某一位置水体的各项水质指标, 但由于环境复杂多变, 空间差异大, 导致这种“ 以点代面” 的工作方法面对区域性分析时, 整体精度不高、 费时费力, 更难以实现区域性水体的动态监测[1]

自20世纪70年代以来, 遥感在水环境的研究应用从最初单纯的水体识别发展到对水质参数的反演, 所使用的数据源从多光谱遥感数据、 非成像高光谱数据到高光谱成像光谱数据, 而反演方法逐渐发展出物理方法、 经验方法和半经验方法[2, 3]。 当前, 相对成熟的是对水体中叶绿素、 悬浮物、 可溶有机物等光学活性物质浓度进行遥感反演, 针对这些指标参数已建立诸多反演模型[4, 5, 6, 7, 8, 9, 10]。 而pH、 硬度、 各种阳阴离子等一般化学性水质参数的遥感反演研究则相对较少, Zabcic等[11]较早开展矿区地物端元光谱研究, 在此基础上进行了水体pH高光谱反演; Rostom等[12]发现Cu, Pb和Cr等重金属元素在704, 989和997 nm等处存在诊断性特征, 并以此构建出定量反演模型。 国内, 刘圣伟等[13]通过Hyperion数据开展了矿区水体pH值污染指标的定性提取, 然而定量反演研究却相对少见。

近年来随着无人机高光谱遥感的出现, 将地面非成像光谱与成像高光谱数据相融合, 可望研究出具有一定适用性的一般化学性水质参数反演方法。 本工作综合应用地面测量光谱和无人机高光谱数据, 在深入研究水体光谱吸收、 反射及其光谱曲线形态特征的基础上, 采用半经验方法建立pH值、 硬度等多种水质参数的定量反演模型, 并将其运用于高光谱影像, 实现区域性水质参数信息的快速获取。

1 研究区及实验数据
1.1 研究区与水样采集

研究区位于我国典型因矿兴市的矿业重镇湖北大冶市, 其中铜绿山矿山已有三千多年的开采历史, 该区也是湖北省以冶金、 建材为主的鄂东工业走廊, 集中了本区域主要污染负荷。 同时, 该区域位于长江中下游, 湖泊、 河流等水系众多, 矿产开发和人类工业活动等对地表及地下水造成不同程度污染。

根据研究区环境条件、 矿山、 城市及水系分布状况, 设计水样采集与数据航飞地点分布如图1所示。 采集10组水样对其进行水质全分析, 发现研究区内水样均成碱性, 硫酸根、 碳酸根、 钙离子、 钠离子浓度变化大, 水体以S O42-· Cl--Ca2+· Mg2+为主, 属于淡水至微咸水, 主要受环境背景、 采矿活动、 工业废水排放、 城市生活污染等影响。

图1 研究区地理位置及采样点分布Fig.1 Geographical location and sampling point distribution of the study area

1.2 地面光谱测量

采用ASD FieldSpec® Pro FR便携式分光辐射光谱仪, 其光谱范围为350~2 500 nm, 光谱分辨率为1 nm。 对研究区内矿山废水、 河流水、 湖泊水等水体进行现场光谱测量。 在光谱测量过程中, 仪器观测平面与太阳入射光线的夹角保持在135° 左右, 与水平法线的夹角在40° 左右。 每次测量采集10条光谱, 每个采集点采集3~5次。 在测得水体反射太阳光DN值的基础上, 经过异常值剔除、 光谱平均和定标处理后, 获得水样点的光谱反射率曲线(图2)。

图2 水体地面测量光谱曲线Fig.2 Ground-measured spectral curves of water

1.3 高光谱无人机航飞

采用大疆M600六旋翼专业级无人机搭载框幅式高光谱成像仪Rikola, 对矿山尾矿库、 主要河流、 重要湖泊开展无人机航飞, 获得研究区高光谱原始影像, 对其进行辐射定标、 白板校正处理后得到高光谱影像数据, 其波谱范围为505~890 nm, 光谱分辨率为7.78 nm, 共有49个波段, 空间分辨率为30 cm。

2 结果与讨论
2.1 光谱分析

由测量光谱曲线(图2)可见, 水体对电磁波的反射率明显低于其他地物, 近红外波段之后反射能量很小, 其有效光谱信息主要集中在350~930 nm, 反射峰和吸收谷主要分布于波长600和740 nm左右, 光谱曲线形态呈不对称型。 对比分析同步获取的高光谱影像和地面测量光谱数据, 发现同一处水体采样点的光谱反射率大小存在一定差别, 但光谱反射率曲线形态却一样(图3)。 为了能将基于地面实测光谱数据建立的高精度反演模型推广应用于高光谱遥感影像, 同时避免因水体反射率观测值之间的偏差而导致模型误差, 提出以光谱曲线形态特征作为模型变量, 并与水质参数测量值进行回归分析, 从而建立反演模型。

图3 铜绿山尾矿库水体光谱曲线对比Fig.3 Comparison of spectral curves of Tonglushan tailing pond

2.2 光谱特征提取

提取的光谱形态特征包括: 原始光谱曲线形态特征、 去包络线后光谱曲线形态特征、 光谱曲线三阶求导后形态特征和光谱四值编码信息(图4)。 水体光谱曲线的反射率普遍较低, 其最大反射峰的光谱反射率代表着原始光谱数据中最显著的形态特征, 因而提取原始光谱曲线上与最大反射峰相关的形态特征参量, 包括: 最大反射率及其波长位置、 反射峰右斜率(即光谱反射峰与光谱值最小点连线的斜率)、 反射峰右面积(即光谱反射峰与光谱值最小点所围面积)、 反射峰右第一斜率(即光谱反射峰与右侧邻近吸收谷连线的斜率)、 反射峰右第一面积(即光谱反射峰与右侧邻近吸收谷所围面积)、 反射峰数比波段总数和吸收谷数比波段总数。

图4 光谱曲线形态特征示意Fig.4 Spectral curve morphological features

去包络线处理能够有效凸显光谱吸收特征, 并将光谱吸收特征进行归一化处理, 更有利于同其他光谱曲线进行特征对比, 从而提取更具有识别性的特征量[14]。 采用的光谱吸收特征有吸收谷深度及其波长位置、 吸收宽度、 吸收对称度、

吸收面积、 吸收斜率和光谱吸收指数。

三阶导数提取出来的特征参数对地物识别与分类效果通常优于一阶导数和二阶导数[15], 结合水体光谱曲线自身反射率小的特点, 采用三阶光谱导数提取特征参量。 提取出的三阶导数光谱曲线形态特征包括三阶导最大(小)值及其波长位置、 三阶导最大最小斜率(即三阶导数光谱的最大值与最小值连线的斜率), 三阶导数的极值个数比总波段数。

为了减少高光谱数据的冗余信息, 更充分有效利用光谱数据的有效信息, 采用四值光谱编码方法提取光谱数据的形态特征。 通过上述光谱曲线形态特征定义及其计算方法, 提取出地面测量光谱和高光谱数据的四大类25个光谱形态特征。

2.3 模型变量筛选

采用皮尔森(Pearson)相关系数分析两个变量之间的相关性, 通过计算分析水质参数与地面实测光谱形态特征之间的皮尔森相关系数, 发现pH、 总溶解固体(TDS)、 硬度(Ca2++Mg2+)、 钾与氯离子比值(K+/Cl-)、 镁与碱度比值[Mg2+/(HC O3-+ C O32-)]5种水质组分与17个光谱特征在0.05水平上存在显著相关, 其中相关系数均达到0.647以上, 并且每种水质参数均与多个光谱特征存在显著相关。 因此, 选取各水质参数的显著性光谱特征作为建模变量。

2.4 反演模型构建

采用逐步回归(Stepwise)分析方法, 建立各水质参数的多元一次函数反演模型, 该方法可以对诸多自变量进行有效筛选, 按对因变量的影响大小, 将自变量由大到小逐个引入方程, 最后选择重要自变量进行方程建模。 各水质参数的反演模型信息如表1所示。 可见K+/Cl-反演模型的决定系数最小为0.637, 而Mg2+/(HC O3-+ C O32-)反演模型的决定系数最大为0.9。 通过回归分析, 发现回归模型均通过回归方程的显著性检验(F检验)和回归系数的显著性检验(t检验), 表明所建水质参数的反演模型可靠。

表1 水质参数反演模型信息 Table 1 Information of water quality parameters inversion model
2.5 高光谱反演结果分析

将上述所建反演模型推广应用到高光谱数据, 以基于地面测量光谱建立的反演模型所选取的光谱特征为自变量, 采用进入回归(Enter)分析方法, 建立水质参数的高光谱反演模型。 即在保持反演模型的函数类型、 特征变量不变的条件下, 通过回归分析调整反演模型的变量系数, 从而获得各水质参数的高光谱反演模型(表1), 可见除了TDS的反演模型没有通过显著性检验外, 其他水质参数的反演模型均通过检验。

将高光谱反演模型应用于高光谱影像数据, 获得研究区内尾矿库、 河流、 湖泊等典型区域的水质参数反演结果(图5), 从而实现区域性水质参数定量反演。 采用判定系数R2和相对均方根误差RRMSE对反演结果进行精度分析, 其中相对均方根误差的计算公式为

RRMSE=1ε̅1ni=1n(yi-fi)2×100%

图5 水质参数高光谱反演结果Fig.5 Hyperspectral inversion results of water quality parameters

式中yi为实测值, fi为反演值, ε̅为实测平均值, n为样本数。 判定系数R2越大, RRMSE越小, 表明反演模型的稳定性和精度就越高。

通过将各水质参数的实测值与对应反演结果进行对比, 并绘制成水质参数的散点分布图(图6)。 可见水质参数pH, Ca2++Mg2+, K+/Cl-, Mg2+/(HCO3-+C O32-)的反演精度较高, 其R2最小为0.669, 最大为0.895, RRMSE均小于28%; 而TDS反演值与实测值差异较大, 反演精度较低。

图6 水质参数实测值与高光谱反演值对比散点图Fig.6 Scatter plot of measured values of water quality parameters and hyperspectral inversion values

3 结 论

(1)综合应用地面测量光谱和高光谱遥感数据, 构建出工矿业城市区域水质参数的多元线性反演模型, 实现了pH值、 硬度等多种水质参数的高光谱定量反演, 结果显示水质参数pH、 硬度、 钾与氯离子比值、 镁与碱度比值的反演精度较高, 相对均方根误差均小于28%。

(2)提出一种基于光谱曲线形态特征的高光谱遥感水质参数定量反演方法, 实现了“ 由点到面” 水质参数信息快速获取, 有望为水环境动态监测提供新技术方法。 但是, 存在水体采样点偏少, 水质参数的光谱响应机理尚不明晰, 有待进一步研究, 以提高反演结果的精度和可靠性。

参考文献
[1] DUAN Rui-qi, DONG Yan-hui, ZHOU Peng-peng, et al(段瑞琪, 董艳辉, 周鹏鹏, ). Hydrogeology & Engineering Geology(水文地质工程地质), 2017, 44(4): 23. [本文引用:1]
[2] ZHOU Yi, ZHOU Wei-qi, WANG Shi-xin, et al(周艺, 周伟奇, 王世新, ). Advances in Water Science(水科学进展), 2004, 15(3): 312. [本文引用:1]
[3] Palmer S C J, Kutser T, Hunter P D. Remote Sensing of Environment, 2015, 157: 1. [本文引用:1]
[4] ZHANG Bing, SHEN Qian, LI Jun-sheng, et al(张兵, 申茜, 李俊生, ). Journal of Lake Sciences(湖泊科学), 2009, 21(2): 182. [本文引用:1]
[5] YANG Ting, ZHANG Hui, WANG Qiao, et al(杨婷, 张慧, 王桥, ). Environmental Science(环境科学), 2011, 32(11): 3207. [本文引用:1]
[6] PAN Bang-long, WANG Xian-hua, ZHU Jin, et al(潘邦龙, 王先华, 朱进, ). Spectroscopy and Spectral Analysis(光谱学与光谱分析), 2013, 33(6): 1665. [本文引用:1]
[7] Olmanson L G, Brezonik P L, Bauer M E. Remote Sensing of Environment, 2013, 130: 254. [本文引用:1]
[8] Brezonik P L, Olmanson L G, Finlay J C, et al. Remote Sensing of Environment, 2015, 157: 199. [本文引用:1]
[9] Kutser T, Paavel B, Verpoorter C, et al. Remote Sensing, 2016, 8(6): 497. [本文引用:1]
[10] SONG Ting, ZHOU Wen-lin, LIU Jun-zhi, et al(宋挺, 周文鳞, 刘军志, ). Acta Scientiae Circumstantiae(环境科学学报), 2017, 37(3): 888. [本文引用:1]
[11] Zabcic N, Rivard B, Ong C, et al. International Journal of Applied Earth Observation and Geoinformation, 2014, 32: 152. [本文引用:1]
[12] Rostom N G, Shalaby A A, Issa Y M, et al. The Egyptian Journal of Remote Sensing and Space Science, 2017, 20: S39. [本文引用:1]
[13] LIU Sheng-wei, GAN Fu-ping, WANG Run-sheng(刘圣伟, 甘甫平, 王润生). Geological Bulletin of China(地质通报), 2003, 22(11-12): 1013. [本文引用:1]
[14] Van Der Meer F. International Journal of Applied Earth Observation and Geoinformation, 2004, 5(1): 55. [本文引用:1]
[15] SU Hong-jun, DU Pei-jun, SHENG Ye-hua(苏红军, 杜培军, 盛业华). Application Research of Computers(计算机应用研究), 2008, 25(2): 390. [本文引用:1]