水体参数高光谱反演模型对比研究
邹宇博1,2, 马振予1, 焦庆斌1, 许亮1, 裴健1,2, 李宇航1,2, 许玉兴1,2, 张嘉航1,2, 李徽1,2, 杨琳1,2, 刘思琪1,2, 张薇1,2, 谭鑫1,*
1.中国科学院长春光学精密机械与物理研究所, 吉林 长春 130033
2.中国科学院大学, 北京 100049
*通讯作者 e-mail: xintan_grating@163.com

作者简介: 邹宇博, 女, 1996年生, 中国科学院长春光学精密机械与物理研究所研究生 e-mail: z_ouyubo@163.com

摘要

水是维系生命与健康的基本需求, 人类的生产、 生活都离不开水。 水体中氮磷的超标导致水中营养元素过剩从而水体富营养化, 进而水质恶化甚至造成大范围的影响。 高光谱遥感在内陆水质监测领域的应用越来越广泛, 研究以此为基础, 为减少室外水体特异性因素影响, 通过实验室模拟外界条件搭建实验室实验系统, 并根据国家排放标准分别配制浓度范围在0~2.5 mg·L-1 的40个不同浓度梯度的磷酸钠标准溶液和浓度范围在0~20 mg·L-1 的40个不同浓度梯度氯化铵标准溶液。 获取所有标准溶液的高光谱图像, 对水质参数总磷、 总氮的光谱响应进行了分析, 找出其对应的敏感波段分别在420、 720 nm附近和410 nm附近。 利用主成分分析(PCA)建立高光谱水质反演数据集, 对高光谱图像作辐射定标、 Savitzky-Golay滤波(SG滤波)预处理并利用BP人工神经网络分别构建实验室高光谱总磷、 总氮反演模型, 构建的实验室高光谱总磷反演模型的决定系数为0.980 2, 实验室高光谱总氮反演模型的决定系数为0.860 2。 以江苏宜兴市内某河道为研究对象, 将该模型应用到室外无人机搭载高光谱成像系统获取到的室外高光谱图像数据, 分散选取五个点分别计算结果, 得到总磷、 总氮浓度均值的反演精度分别为95.00%和93.52%。 利用传统方法直接在待测河道观测点取水构建的室外高光谱水质反演模型反演相同五个点得到的总磷、 总氮浓度均值的反演精度分别为86.87%和86.48%。 两组反演结果对比, 发现本研究构建的实验室高光谱水质反演模型得到的光谱反演结果中90%的反演精度略高于室外水质反演模型的反演精度, 证实该研究可对待测河道内总磷、 总氮的含量进行有效预测, 也可为水体总磷、 总氮高光谱遥感反演提供一定技术支持。

关键词: 高光谱; 总磷; 总氮; 水质反演
中图分类号:TP79 文献标志码:A
Comparative Study on Hyperspectral Inversion Models of Water Quality Parameters
ZOU Yu-bo1,2, MA Zhen-yu1, JIAO Qing-bin1, XU Liang1, PEI Jian1,2, LI Yu-hang1,2, XU Yu-xing1,2, ZHANG Jia-hang1,2, LI Hui1,2, YANG Lin1,2, LIU Si-qi1,2, ZHANG Wei1,2, TAN Xin1,*
1. Changchun Institute of Optics, Fine Mechanics and Physics, Chinese Academy of Sciences, Changchun 130033, China
2. University of Chinese Academy of Sciences, Beijing 100049, China
*Corresponding author
Abstract

Water is a basic need for life and health. Human production and life are inseparable from water. Excessive nitrogen and phosphorus in the water body lead to excess nutrients, resulting in eutrophication of the water body, and then the deterioration of water quality has a wide-ranging impact. The application of hyperspectral remote sensing in the inland water quality monitoring field is becoming more and more extensive. Based on this research, to reduce the influence of outdoor water body-specific factors, this study builds an experimental laboratory system by simulating external conditions in the laboratory. According to national emission standards, this study prepares 40 sodium phosphate standard solutions with different concentration gradients in the concentration range of 0~2.5 mg·L-1 and 40 different concentration gradient ammonium chloride standard solutions in the concentration range of 0~20 mg·L-1. After obtaining hyperspectral images of all standard solutions, The spectral responses of water quality parameters total phosphorus and total nitrogen were analyzed. This study finds the sensitive bands corresponding to total phosphorus and total nitrogen at around 420, 720 nm and around 410 nm. Building a hyperspectral water quality inversion dataset using Principal Component Analysis (PCA). By preprocessing hyperspectral image radiometric calibration, Savitzky-Golay filtering (SG filtering), and using the BP artificial neural network method to construct a laboratory hyperspectral water quality inversion model. The coefficient of determination of the constructed laboratory hyperspectral total phosphorus inversion model is 0.980 2, and the determination coefficient of the laboratory hyperspectral total nitrogen inversion model is 0.860 2. Taking an indoor river in Yixing, Jiangsu as the research object. The model is applied to the outdoor hyperspectral image data obtained by the outdoor UAV equipped with the hyperspectral imaging system. The inversion accuracies of the mean concentrations of total phosphorus and total nitrogen are 95.00% and 93.52%, respectively. The outdoor hyperspectral water quality inversion model constructed by using the traditional method to directly draw water from the observation points of the river to be tested the average values of total phosphorus and total nitrogen concentrations obtained at the same five points with an inversion accuracy of 86.87% and 86.48%. This study compares the inversion results of the two groups. It is found that the inversion accuracy of 90% of the spectral inversion results obtained by the laboratory hyperspectral water quality inversion model constructed in this study is slightly higher than that of the outdoor water quality inversion model. It is confirmed that this study can effectively predict the content of total phosphorus and total nitrogen in the river to be measured, and can also provide certain technical support for the hyperspectral remote sensing inversion of total phosphorus and total nitrogen in the water.

Keyword: Hyperspectral; Total phosphorus; Total nitrogen; Water quality inversion
引言

经济的发展提升了人们的生活水平, 但有时会对环境造成严重而不可逆的影响, 其中水污染尤其严重。 对水体而言, 最严重的问题就是氮磷的超标导致水体富营养化, 导致水中营养元素过剩, 引起水质恶化[1]。 因此, 对河流中氮磷污染物进行实时监测是控制河流的氮磷污染的关键环节。

传统的河流、 湖泊水质监测主要采用实地采样和实验室分析等方法, 这种监测方法精确度较高, 但涵盖的区域有限, 无法实时监测。 遥感技术可以弥补传统水质监测方法的不足, 进而可以实现实时监测。 其中高光谱遥感数据波段维度多, 波长范围广, 可以精确地采集到由于水体组分变化导致水体反射光线发生的差异, 实现对水质精确监测。 目前, 国内外学者利用高光谱遥感技术, 构建了针对特定水域的总磷、 总氮的模型, 并取得了一定的成果。 杨振等[2]利用无人机高光谱建立最优水质参数反演模型, 以500、 670 nm和540、 625 nm波长计算的归一化差值指数与水质参数构建线性水质参数反演模型, 实现水质参数可视化, 为小型地表水污染防治提供技术支撑。 黄宇等[3]以云南星云湖和深圳茅洲河为研究区域, 利用无人机高光谱成像仪获取研究区高光谱影像的同时对地面水质参数进行采样, 构建水质参数的最佳双波段监测模型, 结果得到总氮(R2=0.88, RPD=2.04)和总磷(R2=0.86, RPD=1.93), 证实该方法可行可靠。 Liu等[4]利用Ebinur湖流域地表水的高光谱数据, 通过基于敏感波段构建的粒子群优化支持向量机模型定量估计地表水中总氮浓度, 模型的R2=0.604, 均方根误差(RMSE)=1.61 mg· L-1, 残差预测偏差(RPD)=2.002, 这种耦合方法有助于改进干旱地区河流水质指标的定量估计。 Cao等[5]以海河为研究对象, 使用高光谱遥感设备和BP神经网络反演包括总磷总氮等八个水质参数, 训练模型的决定系数在80%以上, 验证了将高光谱遥感技术应用于海河水质检测是一种可行的方法。

基于以上研究发现, 水质参数反演精度会根据测试水样不同而改变。 为避免因待测水体特异性而引起的差异, 本工作通过实验室配置氮磷标准溶液, 建立氮磷高光谱水质反演数据集, 构建实验室高光谱氮磷反演模型, 并将该模型应用于江苏宜兴城市内河道加以验证, 与传统高光谱水质反演方法建立数据集构建的室外水质反演模型反演得到的结果进行比较, 以期为不同水体的水质监测提供更具有适用性的技术手段。

1 实验部分
1.1 水体样品

1.1.1 实验室水样配置

根据GB8978— 1996国家污水综合排放标准中总磷、 总氮的含量标准, 分别配制0~2.5 mg· L-1共40个不同浓度梯度的磷酸钠溶液和0~20 mg· L-1共40个不同浓度梯度的氯化铵溶液模拟室外水体中的总磷(TP)和总氮(TN), 配制溶液选择的浓度范围参考了已有文献的研究。 具体溶液配制方法以20 mg· L-1的氯化铵标准溶液为例, 使用分析天平称取10 mg的氯化铵粉末溶于蒸馏水中, 稀释至500 mL并摇晃均匀, 得到20 mg· L-1的氯化铵标准溶液。 以同样的方式配置其余的0~20 mg· L-1的氯化铵溶液和0~2.5 mg· L-1的磷酸钠溶液。

1.1.2 室外实测水样

江苏宜兴市地处太湖上游、 长江流域下游, 境内水网纵横交错[6], 由于宜兴市有着特殊的地理条件和自然环境, 因此对该市内河道的水质进行实时监测有着重要意义。 在待测河道内上游至下游分散选取五个观测点采集水样并保存, 水样的采集和保存应符合GB17378.3, HJ493和HJ494的要求, 并及时送往水质检测中心测得水样中总磷、 总氮的平均浓度分别为0.16和3.3 mg· L-1; 同时利用高光谱设备采集该五个观测点水样的光谱曲线。

1.2 数据采集

1.2.1 数据采集

实验室模拟环境中分别采集不同浓度的磷酸钠标准溶液和氯化铵标准溶液的高光谱数据, 高光谱数据采集设备如图1所示。 光谱采集设备是课题组自主研发的高光谱相机, 波段范围为400~1 100 nm, 光谱分辨率为2.3 nm, 波段数为540, 镜头焦距为35 nm, 选用积分时间为 14 ms, 扫描方式为推扫式。 为了可以更好地模拟室外太阳光照的均匀性, 光源选用四个卤素灯, 灯的位置和高度可以自由调节。 标准溶液透明澄清, 为避免拍摄背景的影响, 且不发生化学反应, 选取300 mL烧杯作为拍摄容器, 分别加入100 mL氯化铵标准溶液和100 mL磷酸钠标准溶液, 并分别在氯化铵标准溶液中加入200 mL浓度为26.7 g· L-1的硫酸铜溶液, 在磷酸钠标准溶液中加入200 mL成分已知的橙汁溶液(橙汁溶液中含量排在前位的主要成分基本为碳水化合物), 将烧杯放置于传送带上, 烧杯传送到高光谱相机正下方, 水面与相机镜头的距离约为40 cm。 选用反射率为98%的标准反射率板进行定标, 并在测量前对仪器进行暗电流校正去除暗噪声。

图1 实验室高光谱图像采集设备Fig.1 Laboratory hyperspectral image acquisition equipment

1.2.2 室外数据采集

室外高光谱图像采集设备选择大疆六旋翼无人机搭载课题组自主研发高光谱相机, 如图2所示。 河道水体光谱采集符合《水体可见光-短波红外光谱反射率测量GB/T 36540— 2018》, 该高光谱相机参数与实验室实验的高光谱相机参数相同。 室外实验选择天气晴朗、 测量时间为10:00— 15:00进行高光谱图像采集, 在地面铺设反射率为30%的标准反射率板, 图像采集区域如图3所示。

图2 室外实验高光谱采集设备Fig.2 Outdoor experimental hyperspectral acquisition equipment

图3 图像采集区域Fig.3 Image acquisition area

2 结果与讨论
2.1 实验室水质反演模型构建

2.1.1 高光谱图像预处理

实验室获取的氯化铵标准溶液与磷酸钠标准溶液分别如图4和图5所示, 其光谱反射率可根据式(1)计算得到

Ref(n)=Rboard×DN(n)DN(board)(1)

式(1)中, Ref(n)为不同浓度标准溶液的水体反射率, DN(n)表示不同浓度标准溶液的像元亮度值, Rboard为反射率为98%的标准反射率板的反射率, DN(board)表示标准反射率板的像元亮度值。

图4 氯化铵硫酸铜混合溶液Fig.4 Ammonium chloride mixed with copper sulfate

图5 磷酸钠橙汁混合溶液Fig.5 Sodium phosphate mxied with orange juice

对得到的图像进行Savitzky-Golay(SG)滤波, 基于最小二乘原理的SG滤波算法是一种多项式平滑算法[7], 设置窗口宽度为5, 多项式次数为3, 根据多项式(2)对窗口内数据进行拟合。

p(n)=k=0Naknk(2)

经过如上预处理后, 以浓度为0.2 mg· L-1的磷酸钠标准溶液的高光谱图像和浓度为20 mg· L-1的氯化铵标准溶液的高光谱图像为例, 其光谱反射率曲线分别如图6和图7所示, 由图可明显看出, 总磷、 总氮分别在420, 720和410 nm附近具有明显反射峰。

图6 总磷光谱反射率曲线图Fig.6 TP spectral reflectance curve

图7 总氮光谱反射率曲线图Fig.7 TN spectral reflectance curves

2.1.2 水质反演模型构建及反演结果

利用主成分分析法[9]保留包含信息量最多的前八个主成分, 对获取的高光谱数据进行降维处理并建立总磷、 总氮标准溶液数据集, 并利用BP神经网络训练拟合得到总磷的决定系数(R2)为0.980 2, 总氮的决定系数(R2)为0.860 2, 根据拟合结果可以看出, 总磷、 总氮的决定系数大小均大于0.85且与1接近, 整体上总磷的拟合效果要优于总氮, 见图8和图9。

图8 总磷模型拟合结果Fig.8 TP model fitting results

图9 总氮模型拟合结果Fig.9 TN model fitting results

2.2 室外实验水质反演

为了验证实验室构建的水质反演模型的反演精度和适用性, 以江苏宜兴市内某河道为验证对象, 由无人机高光谱相机获取的河道高光谱图像如图10所示。

图10 室外水体高光谱图像Fig.10 Hyperspectral images of outdoor water body

与文献[5, 8]选用的水质反演思路、 方法相同, 对该高光谱图像预处理后, 利用NDWI(归一化水体指数)的方法提取水体部分, 根据河道内五个观测点水样的光谱曲线和水质参数浓度建立数据集, 利用BP神经网络对该数据集进行模型训练并构建室外水质反演模型, 得到总磷、 总氮的光谱数据反演结果如表1所示。

表1 室外水质反演模型反演结果 Table 1 Inversion results of outdoor water quality

利用上述实验室实验构建的总磷、 总氮标准溶液数据集和水质反演模型对获得的江苏宜兴城市河道高光谱图像进行水质反演, 得到光谱数据反演结果和反演误差如表2所示。

表2 实验室水质反演模型反演结果 Table 2 Water quality inversion based on the data of lab made standard solution

根据表1结果显示, 根据待测水体得到的光谱数据建立数据集, 五个观测点整体反演效果最好的点为第四点, 其总磷、 总氮的预测浓度分别为0.147和3.63 mg· L-1。 五个点计算均值得到总磷、 总氮反演误差分别为86.87%和86.48%, 两种水质参数的反演精度均在85%以上。

根据表2结果显示, 利用实验室配置标准溶液建立数据集反演得到五个观测点中第二点的整体反演效果最好, 总磷、 总氮的光谱反演结果分别为0.171和3.54 mg· L-1, 反演精度达到93.13%和92.72%, 五个观测点的反演结果分别取平均值, 得到总磷、 总氮光谱反演数据结果的平均值分别为0.168和3.514 mg· L-1, 反演精度为95.00%和93.52%, 且总磷的反演效果略优于总氮, 与实验室模型训练结果吻合。 通过表1表2每个点的每个水质参数一一对比可以得出, 实验室水质反演模型得到的光谱反演结果中90%的反演精度高于室外水质反演模型的反演精度。

从实验结果来看, 由于待测河道内水体情况复杂, 并非只存在单一水质参数, 尤其总磷在700 nm左右有一特征峰, 造成浊度的悬浮颗粒物会对此波长的光强有一定程度的吸收, 且吸收会随着浊度的增大而增大, 进而对监测结果产生较大的影响[9]。 本研究中配置透明的标准溶液可以避免浊度的影响, 同时将总磷、 总氮分开获得光谱曲线, 可以更直接地得到总磷、 总氮的特征波段, 从而使数据集训练结果更好、 预测结果的精度更高。

3 结论

采用高光谱技术, 在实验室环境下测量了不同浓度梯度磷酸钠标准溶液和氯化铵标准溶液的光谱响应, 并利用人工神经网络的方法构建高光谱氮磷水质反演模型, 将该模型应用到室外实验进行验证并与传统的在待测河道内取水建立数据集反演的结果比较, 可以得到如下结论:

(1)从配制的标准溶液实验得到总磷、 总氮分别在420、 720和410 nm附近有明显反射峰, 利用BP神经网络训练拟合得到总磷的决定系数(R2)为0.980 2, 总氮的决定系数(R2)为0.860 2, 两个水质参数的拟合效果好, 反演精度高, 且总磷的反演效果优于总氮的反演效果。

(2)根据传统方法对待测河道特定观测点的光谱数据集反演得到总磷平均浓度的反演精度为86.87%, 总氮平均浓度的反演精度为86.48%, 而据于实验室配置标准溶液的数据集对河道观测点样品数据反演得到的总磷、 总氮平均浓度的反演精度分别为95.00%, 93.52%, 本反演模型得到的反演精度90%以上的值优于传统反演模型得到的反演精度, 在一定程度上减小了因待测水体差异性带来的影响。

(3)本研究可为长度长、 面积大的室外水体中总磷、 总氮含量的反演提供技术支撑。 由于室外天气的不确定性、 水体的复杂性, 因此在今后的研究中可以多加考虑天气因素的影响, 以实现更高精度更快速度的实时室外水体水质反演。

参考文献
[1] LIU Chang, LIN Shen-hui, JIAO Xue-yao, et al(刘畅, 林绅辉, 焦学尧, ). Acta Scientiarum Naturalium Universitatis Pekinensis(北京大学学报自然科学版), 2019, 55(6): 1085. [本文引用:1]
[2] YANG Zhen, LU Xiao-ping, WU Yong-bin, et al(杨振, 卢小平, 武永斌, ). Science of Surveying and Mapping(测绘科学), 2020, (9): 60. [本文引用:1]
[3] HUANG Yu, CHEN Xing-hai, LIU Ye-lin, et al(黄宇, 陈兴海, 刘业林, ). Yangtze River(人民长江), 2020, (3): 205. [本文引用:1]
[4] Liu C, Zhang F, Ge X, et al. Water, 2020, 12(7): 1842. [本文引用:1]
[5] Cao Q, Yu G, Sun S, et al. Water, 2022, 14(1): 22. [本文引用:1]
[6] YIN Qiang-hua, WANG Liang-jie, LIU Xia, et al(尹强华, 王良杰, 刘霞, ). Soil and Water Conservation in China(中国水土保持), 2019, (9): 15. [本文引用:1]
[7] NING Hong-zhang, TAN Xin, LI Yu-hang, et al(宁鸿章, 谭鑫, 李宇航, ). Spectroscopy and Spectral Analysis(光谱学与光谱分析), 2020, 40(12): 3699. [本文引用:1]
[8] LIN Jian-yuan, ZHANG Chang-xing(林剑远, 张长兴). Remote Sensing Information(遥感信息), 2019, 34(2): 23. [本文引用:1]
[9] CHEN Jie, ZHANG Li-fu, ZHANG Lin-shan, et al(陈洁, 张立福, 张琳珊, ). Remote Sensing for Natural Resources(自然资源遥感), 2021, 33(4): 1. [本文引用:2]