卷积神经网络模型的遥感反演水质参数COD

引用本文

李爱民, 范猛, 秦光铎, 王海隆, 许有成. 卷积神经网络模型的遥感反演水质参数COD[J]. 光谱学与光谱分析, 2023,43(2): 651-656.
LI Ai-min, FAN Meng, QIN Guang-duo, WANG Hai-long, XU You-cheng. Water Quality Parameter COD Retrieved From Remote Sensing Based on Convolutional Neural Network Model[J]. Spectroscopy and Spectral Analysis, 2023,43(2): 651-656.
Doi:10.3964/j.issn.1000-0593(2023)02-0651-06 复制到剪切板

Permissions

《光谱学与光谱分析》期刊社所有

卷积神经网络模型的遥感反演水质参数COD

李爱民¹, 范猛^2,^*, 秦光铎², 王海隆², 许有成²

1.郑州大学地球科学与技术学院, 河南郑州 450001

2.郑州大学水利科学与工程学院, 河南郑州 450001

*通讯作者 e-mail: 2594809931@qq.com

作者简介: 李爱民, 1972年生,郑州大学地球科学与技术学院副教授 e-mail: aiminli@zzu.edu.cn

收稿日期: 2021-06-25 修回日期: 2022-05-27

基金: 国家自然科学基金项目(U1704125)资助

摘要

化学需氧量(COD)是水体污染监测的常用水质指标之一, 传统采集手段耗时耗力; 利用遥感反演COD浓度能够快速获取整个水域的COD浓度空间分布状况, 对于水污染治理和水环境保护具有重要意义。目前利用多光谱遥感数据反演COD浓度精度较低, 主要原因是目前的反演模型多是以皮尔逊相关系数大小为指标选取建模波段的经验方法, 对于多光谱遥感数据而言, 其光谱波段范围较宽, 波段的组合数量有限, 难以找到有效的变量作为建模变量。针对这一问题, 以郑州市天德湖为例, 基于Planet多光谱高分辨率遥感影像, 对遥感影像进行预处理和分析水样的高光谱数据, 利用卷积神经网络对天德湖COD浓度进行反演; 同时选取单变量回归模型、多变量回归模型进行精度对比。主要研究结论有: (1)相比于以皮尔逊相关系数为衡量标准选择不同波段组合的反演方式, 卷积神经网络反演具有更高的空间反演精度, 其决定系数为0.89, RMSE为2.22 mg·L^-1, 这是因为卷积神经网络不仅充分利用了遥感影像的光谱特征, 而且能够提取目标像元周围的领域空间信息, 学习到图像深层的抽象特征以及水质参数浓度和遥感数据之间的“内在规律”, 可以在一定程度上避免传统方法建模带来的不稳定性; (2)选取最优的卷积神经网络模型制作天德湖水质COD浓度空间分布专题图; 天德湖具有典型的内陆水体光谱特征, 其COD浓度空间分布整体呈现西部高、东部较低、东南方向的进水口浓度较低、东北方向的出水口浓度较高的特征, 卷积神经网络反演的天德湖区域浓度平均值为23.96 mg·L^-1, 标准差为7.11 mg·L^-1, 变异系数为0.29, 更加接近实际采样点的统计值。基于卷积神经网络模型结合多光谱影像反演COD的结果表明卷积神经网络在水质参数COD遥感反演中具有较好的应用潜力。

关键词: 多光谱遥感; COD; 卷积神经网络; Planet影像

中图分类号:X87 文献标志码:A

Water Quality Parameter COD Retrieved From Remote Sensing Based on Convolutional Neural Network Model

LI Ai-min¹, FAN Meng^2,^*, QIN Guang-duo², WANG Hai-long², XU You-cheng²

1. School of Geo-Science and Technology, Zhengzhou University, Zhengzhou 450001, China

2. School of Water Conservancy Engineering, Zhengzhou University, Zhengzhou 450001, China

*Corresponding author

Abstract

Chemical Oxygen Demand (COD) is a commonly used water quality indicator in water pollution monitoring. Traditional collection methods are time-consuming and labor-consuming, but the inversion of COD concentration by remote sensing method can quickly obtain the spatial distribution of COD concentration in the whole water area, which is of great significance for water pollution control and water environment protection.Using multi-spectral remote sensing data inversion of COD concentration is low precision. Because at present, a lot of the inversion models based on the Pearson correlation coefficient index selection experience method, modeling band for multi-spectral remote sensing data, its wide spectral bands, and band combination of quantity is limited, hard to find effective variables as modeling.In order to solve this problem, this study in Zhengzhou city, lake as an example, based on the Planet multi-spectral high-resolution remote sensing image and the remote sensing image preprocessing and hyperspectral data for analysis of water samples, using convolution neural network method to inversion of days lake COD concentration. At the same time, choose the single variable regression model, a multivariate regression model accuracy comparison test. The main conclusions are as follows:(1) Compared with the inversion method using Pearson correlation coefficient as the measurement standard to select different band combinations, convolutional neural network inversion has higher spatial inversion accuracy, with the determination coefficient of 0.89 and RMSE of 2.22 mg·L^-1. This is because a convolutional neural network not only makes full use of the spectral characteristics of its remote sensing images. Moreover, the spatial information of the domain around the target pixel can be extracted. The abstract features of the deep layer of the image, as well as the"internal law" between the water quality parameter concentration and remote sensing data, can be learned, which can avoid the instability caused by the traditional modeling method to a certain extent. (2) Select the optimal convolutional neural network model to make the thematic map of the spatial distribution of COD concentration in Tiande Lake water quality. Tiande Lake has typical spectral characteristics of inland water, and its spatial distribution of COD concentration is generally characterized by high in the west, low in the east, low in the southeast inlet and high in the northeast outlet.The average value of concentration in the Tiande Lake region retrieved by the convolutional neural network is 23.96 mg·L^-1, the standard deviation is 7.11 mg·L^-1, and the coefficient of variation is 0.29, which is closer to the statistical value of actual sampling points.The results of COD retrieval based on a convolutional neural network model and multi-spectral image show that the convolutional neural network has good application potential in remote sensing COD retrieval of water quality parameters.

Keyword: Multispectral remote sensing; COD; Convolutional neural network; Planet image

文章图片

引言

随着社会经济的高速发展, 一些地表水体(湖泊、水库和河流)受到了严重的污染。全面准确的水质监测是水污染治理和水环境保护的前提。传统水质监测方法主要是现场采集水样, 实验室测量各种水质参数, 难以反映污染物的空间分布特征及水质参数浓度的大面积范围的动态变化^{[1, 2]}。

随着国内外卫星遥感数据源的不断丰富, 遥感被广泛应用于水质动态监测。目前利用遥感数据反演的水质参数多集中于叶绿素a^{[3, 4, 5]}、悬浮物^[6]以及CDOM^[7]等; 随着对水质光谱特征研究的深入, 机器学习算法的引用、以及遥感技术的不断革新, 利用遥感手段反演的水质参数种类不断增加, 其中化学需氧量(chemical oxygen demand, COD)的反演近年来得到广泛关注; COD是反映水中有机污染程度的重要指标, 准确评估和掌握水体COD浓度分布对污染治理和环境保护有重要作用。目前在COD参数遥感反演方法中应用最多也最广泛的是经验分析方法^[8], 即以遥感影像“面”值与实际水样采集的“点位”值建立函数关系, 如赵起超等^[9]基于Landsat8影像, 使用BP神经网络方法反演白洋淀水体的COD浓度, 平均相对误差为16.5%。目前利用多光谱遥感数据反演COD浓度精度较低, 一是因为经验方法是以皮尔逊相关系数大小为衡量指标选取建模波段, 对于多光谱遥感数据而言, 其光谱波段范围较宽, 波段的组合数量有限, 难以找到相关系数高的变量作为自变量; 二是由于遥感影像的“面”和实测数据“点”之间存在空间尺度上的差异, 以及遥感图像处理中几何校正、大气校正等因素的影响, 均导致对模型的建立以及模型的迁移应用产生较大影响。

近年来深度学习技术快速发展, 在遥感领域得到了广泛的应用, 不同结构的卷积神经网络在遥感影像语义分割^{[10, 11]}、目标检测^[12]、以及遥感影像去噪^[13]等方面取得了巨大的进展。深度卷积神经网络是将卷积理论与人工神经网络相结合, 通过数据特征提取及参数共享等机制实现输入和输出数据之间的非线性关系映射^[14]。将深度卷积神经网络用于水质参数定量遥感反演中, 有望为遥感水质参数反演提供一种新的解决方案。

基于多光谱高分辨率Planet卫星影像, 采用卷积神经网络对郑州市天德湖COD水质参数进行遥感反演, 并利用若干反演模型进行精度对比分析, 以期对卷积神经网络在定量遥感反演中的应用做一些探讨。

1 实验部分

1.1 研究区与数据源

选择河南省郑州市天德湖(34°48'—34°49'N, 113°29'—113°30'E)作为研究区, 湖区面积约为0.306 km², 水深2~10 m。实地水样采集时间为2020/12/05日上午。采用Planet卫星数据; 遥感影像数据通过北京国测星绘信息技术有限公司购买(http://www.satimage.cn/)。卫星在研究区成像时间与水样采集时间同步, 遥感影像有4个光谱波段, 分别是蓝波段(455~515 nm); 绿波段(500~590 nm); 红波段(590~670 nm); 红外波段(780~860 nm)。影像级别为L1B, 分辨率为4 m, L1B级数据为基础产品, 获取的数据经过了几何校正和辐射校正等处理。

1.2 水样采集检测与实测光谱分析

在研究水域内共采集38个样本, 采样时乘坐皮划艇小船, 由若干名人员协作采集, 在湖面无波动时利用3L的有机玻璃采样器采集深度为0~50 cm的表层水样。将采集的水样放置在阴冷处, 并当天带回实验室进行指标测试。 COD浓度的测定采用密闭催化消解法, 利用5B-6C快速测定仪测定水样的COD浓度, 测得的COD浓度范围为6.53~39.13 mg·L^-1, 平均值为24.22 mg·L^-1, 标准差为6.78 mg·L^-1。研究区及采样点如图1所示。

	Figure Option View Download New Window
	图1 研究区及采样点位置Fig.1 Study area and location of sampling points

同步开展水面高光谱数据测量。采用美国ASD公司生产的FiledSpecHH2手持式光谱仪, 在采集水样之前对仪器进行校正, 采用水面以上测量法进行水面光谱测量, 并对每个采样点采集10次取平均值作为此采样点的光谱反射率数据。实测光谱曲线如图2所示, 为和Planet影像数据光谱范围保持一致, 选取400~900 nm范围内的光谱曲线进行分析。由图2可看出, 由于水体对太阳辐射具有强烈的吸收作用, 使遥感反射率值大多较低。天德湖水体具有典型的内陆水体特征, 其水体光谱变化带有较为明显的叶绿素a的光谱特征和悬浮物的光谱特征, 即在675 nm附近处有叶绿素a的吸收峰以及在700 nm附近处有叶绿素a和悬浮物叠加作用形成的反射峰, 而由于悬浮物的影响使440和550 nm附近处的叶绿素a的吸收峰和绿色反射峰不明显, 整体表现为中间高两端低。

	Figure Option View Download New Window
	图2 实测光谱曲线Fig.2 Measured spectra

遥感数据值和实测的水质参数之间具有非常复杂的非线性关系, 深度学习方法能够学习到更深层次的像元之间的抽象关系, 这对于水质参数的反演有着新的启发, 因而探索将卷积神经网络用于水质参数反演意义重大, 在内陆水体水质参数反演精度方面具有巨大的潜力。实验采用卷积神经网络方法针对Planet卫星数据进行COD反演, 同时建立单变量回归(一元线性回归、幂函数回归)、多变量回归(主成分回归、多元线性回归)以及多隐含层神经网络回归模型进行对比, 采用均方根误差(root mean square error, RMSE)、决定系数(coefficient of determination, R²)进行精度评价。

1.3 建模波段选择

以经验分析为主的水质参数反演多以皮尔逊相关系数大小为衡量标准, 从遥感影像波段的不同组合形式中选取其最优波段进行反演建模, 对不同波段组合的形式进行相关系数计算, 不同波段组合的最高相关系数记录如表1所示, 根据单变量建模和多变量建模, 分别选择合适的建模波段进行回归建模。分析得出, 在不同波段组合后的变量之间也存在较高的相关性, 故在筛选波段中选取了5个波段组合方式参与多变量建模(表1)。

表1 相关系数计算 Table 1 Calculation of correlation coefficient

1.4 卷积神经网络构建

卷积神经网络(convolutional neural networks, CNN)是一类包含卷积计算且具有深度结构的前馈神经网络(feedfor-ward neural networks), 是深度学习(deep learning)的代表算法之一。卷积神经网络具有表征学习(representation learning)能力, 能够按其阶层结构对输入信息在更高层次进行抽象, 获取深层次的图像信息。本研究建立“卷积-池化-全连接”的卷积神经网络结构, 探讨卷积神经网络在水质参数反演中的应用。考虑到训练集样本有限, 对原始获取的遥感影像进行正射校正处理, 将正射校正前的影像用38个采集点坐标裁剪出38个Patch图像(7×7)加入到训练集中, 以此对训练集进行增强处理, 按8∶ 2比例将数据划分为训练集和测试集。

为尽量避免过拟合现象, 在卷积神经网络训练中加入dropout和early stop策略, 选择Adam算法对学习率进行优化, 激活函数选择ReLu, 输出层的损失函数选择均方误差(means qured error, MSE), 在模型训练中将训练集按7: 3的比例划分为新训练集和验证集。模型的结构如图3所示。

	Figure Option View Download New Window
	图3 卷积神经网络的结构Fig.3 Structure of convolutional neural networks

卷积层的工作原理是利用卷积核进行深层次抽象特征的提取, 核大小为5×5, Padding为“Same”, 池化层是对来自卷积层的数据进行不同方式的采样处理, 核大小为2×2, Padding方式为“Same”, Flatten层是将所有特征拉伸成一维的形式。

卷积神经网络反演COD水质参数的工作流程如图4所示。

	Figure Option View Download New Window
	图4 卷积神经网络反演COD工作流程Fig.4 Workflow of COD retrieval by convolutional neural network

2 结果与讨论

2.1 模型训练与精度评估

单变量回归选择一元线性回归、乘幂函数模型、指数模型; 多变量回归选择主成分回归、多元线性回归以及多隐含层神经网络回归模型。多隐含层神经网络训练中采用网格搜索确定隐含层个数和每层的神经元个数, 最终确定隐含层为两层, 每层的神经元个数分别是6个和8个。在卷积神经网络结构确定中采用多次实验调节卷积层、池化层以及全连接层中的核大小, 步长, 神经元个数等超参数, 并结合early stop和dropout等策略来尽量避免过拟合, 其模型最终确定的网络结构如图3所示。

将建立的多个模型进行汇总, 如表2, 无论是单变量回归还是多变量回归模型, 其精度都较低, 其根本原因是遥感影像数据和水质参数浓度之间的关系是非线性关系, 用皮尔逊相关系数难以准确衡量之间的相关性, 且在建立多变量回归模型中的建模波段之间也存在较高的相关性, 故以常规方法建立的模型精度普遍较低, 其中卷积神经网络精度最高, 其决定系数为0.89, RMSE为2.22 mg·L^-1, 其次为多隐含层神经网络, 其决定系数为0.76, RMSE为3.45 mg·L^-1, 而其他的单变量回归和多变量回归模型的精度均较差。

表2 几种COD反演模型及精度 Table 2 Several retrieval models for COD and their accuracy

模型类型		公式	R²	RMSE
	一元线性回归	y=-0.03X₁+84.93	0.31	5.56
单变量回归	乘幂模型	y=4×10⁸ $X_{1}^{- 2.24}$	0.18	6.44
	指数回归	y=235.2exp(-0.001X₁)	0.18	15.83
	主成分回归	y=1.88PCA₁-0.73PCA₂+24.21	0.33	5.47
多变量回归	多元线性回归	y=-6.93X₁-16.19X₂-2.90X₃-1.24X₄+10.32X₅+24.22	0.36	5.35
	多隐含层神经网络回归	/	0.76	3.45
卷积神经网络	CNN	/	0.892.22

注: X₁为B2-B4, X₂为B4/B2, X₃为B2/(B3+B4), X₄为(B1-B4)/(B1-B2), X₅为B4, PCA₁, PCA₂分别为第一主成分, 第二主成分

Note: X₁, X₂, X₃, X₄ and X₅ represent B2-B4, B4/B2, B2/(B3+B4), (B1-B4)/(B1-B2) and B4, respectively. PCA₁ and PCA₂ are the 1st and 2nd principal components

表2 几种COD反演模型及精度 Table 2 Several retrieval models for COD and their accuracy

2.2 水质参数反演

将精度最高的卷积神经网络和精度最低的一元线性反演专题图进行对比, 如图5(a)和(b), 天德湖的COD浓度分布都呈现西部高、东部低、东南方向的进水口浓度较低、东北方向的出水口浓度较高的特征, 但卷积神经网络反演的专题图与实际情况更为符合, 反演的天德湖区域COD浓度平均值为23.96 mg·L^-1, 标准差为7.11 mg·L^-1, 变异系数为0.29; 一元线性反演的天德湖区域COD浓度平均值为26.92 mg·L^-1, 标准差为8.71 mg·L^-1, 变异系数为0.32, 可知卷积神经网络反演结果更接近实际采样点的统计值, 其实际采样点浓度平均值为24.22 mg·L^-1, 标准差为6.78 mg·L^-1, 变异系数为0.28。由图6(a)知, 一元线性模型反演结果在实测浓度高于25 mg·L^-1时会存在严重的高估, 低于25 mg·L^-1时存在低估现象, 由图6(b)知, 一元线性模型的浓度值分布较为集中, 卷积神经网络反演结果的直方图浓度变化较为平缓, 过渡更加自然。

	Figure Option View Download New Window
	图5 两种模型反演专题图对比 (a): 卷积神经网络反演专题图; (b): 一元线性反演专题图Fig.5 Contrast of two retrieval thematic maps (a): Convolutional neural networks thematic map; (b): Unary linear inversion thematic map

	Figure Option View Download New Window
	图6 两种反演模型对比分析 (a): COD实测值和预测值; (b): 反演结果的直方图Fig.6 Contrastive analysis of two retrieval models (a): Actual and predicted values of COD; (b): Histogram of retrieval results

3 结论

基于Planet多光谱高分辨率遥感影像, 利用卷积神经网络和传统模型对天德湖COD水质参数进行反演, 分析模型精度, 反演得到天德湖水质参数COD浓度分布专题图。其主要研究结论如下。

(1)相比于常规以皮尔逊相关系数为衡量标准选择不同波段组合的反演方式, 卷积神经网络反演具有更高的空间反演精度, 其决定系数为0.89, RMSE为2.22 mg·L^-1, 这是因为卷积神经网络能够提取以目标像元为中心的领域空间信息, 自动学习遥感数据的“内在规律”, 在一定程度上避免传统方法建模带来的不稳定性。

(2)天德湖的COD浓度空间分布呈现西部高、东部较低、东南方向的进水口浓度较低、东北方向的出水口浓度较高的特征。卷积神经网络反演的天德湖区域浓度平均值为23.96 mg·L^-1, 标准差为7.11 mg·L^-1, 变异系数为0.29, 更加接近实际采样点的统计值。

建立的卷积神经网络仍存在改进的空间, 如将遥感影像进行旋转、反转等方式对样本进行增强, 增加卷积神经网络的深度以及讨论不同核大小对模型的影响等, 将在以后对模型进行改进, 以期取得更好的反演效果。现阶段的反演结果中的每个像元的水质参数浓度值比较精确, 但依然处在从反演结果的专题图中获取水质参数浓度的空间分布范围和变化趋势的阶段。随着近年来反演技术的进步, 反演的要求将逐渐从全局浓度变化趋势分析向局部反演的准确性方面转变, 在此背景下以卷积神经网络模型为代表的机器学习模型在水质参数反演中具有较高的应用潜力。

致谢: 此次野外实验的数据获取得到了研究生赵刘义、李亭亭、王革林的帮助, 在此表示衷心的感谢!

参考文献

文献列表

[1]	Gholizadeh M, Melesse A, Reddi L. Sensors, 2016, 16(8): 1298. [本文引用:1]
[2]	DUAN Rui-qi, DONG Yan-hui, ZHOU Peng-peng, et al(段瑞棋, 董艳辉, 周鹏鹏, 等). Hydrogeology & Engineering Geology(水文地质工程地质), 2017, 44(4): 23. [本文引用:1]
[3]	LIU Wen-ya, DENG Ru-ru, LIANG Ye-heng, et al(刘文雅, 邓孺孺, 梁业恒, 等). Remote Sensing for Land and Resources(国土资源遥感), 2019, 31(2): 102. [本文引用:1]
[4]	XU Peng-fei, MAO Feng, JIN Ping-bin, et al(徐鹏飞, 毛峰, 金平斌, 等). China Environmental Science(中国环境科学), 2020, 40(10): 4580. [本文引用:1]
[5]	Giannini F, Hunt B P V, Jacoby D, et al. Remote Sensing of Environment, 2021, 256: 112317. [本文引用:1]
[6]	LIN Jian-yuan, ZHANG Chang-xing, YOU Hong-jian(林剑远, 张长兴, 尤红建). Spectroscopy and Spectral Analysis(光谱学与光谱分析), 2019, 39(12): 3761. [本文引用:1]
[7]	Shang Y, Liu G, Wen Z, et al. Journal of Environmental Management, 2021, 286: 112275. [本文引用:1]
[8]	Kuan H F, Li J, Zhang X J, et al. Water, 2020, 12(11): 3124. [本文引用:1]
[9]	ZHAO Qi-chao, ZHAO Shu-ya, LIU Ke, et al(赵起超, 赵姝雅, 刘剋, 等). Modern Electronics Technique(现代电子技术), 2019, 42(3): 56. [本文引用:1]
[10]	JIANG Teng-ping, YANG Bi-sheng, ZHOU Yu-zhou, et al(蒋腾平, 杨必胜, 周雨舟, 等). Geomatics and Information Science of Wuhan University(武汉大学学报·信息科学版), 2020, 45(12): 1942. [本文引用:1]
[11]	XIE Meng, LIU Wei, LI Er-zhu, et al(谢梦, 刘伟, 李二珠, 等). Bulletin of Surveying and Mapping(测绘通报), 2020, (5): 36. [本文引用:1]
[12]	JIANG Bo, QU Ruo-kun, LI Yan-dong, et al(江波, 屈若锟, 李彦冬, 等). Acta Aeronauticaet Astronautica Sinica(航空学报), 2021, 42(4): 524519. [本文引用:1]
[13]	WU Cong-zhong, CHEN Xi, ZHAN Shu(吴从中, 陈曦, 詹曙). Journal of Remote Sensing(遥感学报), 2020, 24(1): 27. [本文引用:1]
[14]	NENG Chang-xin, SUN Xiao-chen, XU Ya, et al(能昌信, 孙晓晨, 徐亚, 等). China Environmental Science(中国环境科学), 2019, 39(12): 5162. [本文引用:1]

2016

0.0

... 传统水质监测方法主要是现场采集水样, 实验室测量各种水质参数, 难以反映污染物的空间分布特征及水质参数浓度的大面积范围的动态变化^[1,2] ...

2017

0.0

... 传统水质监测方法主要是现场采集水样, 实验室测量各种水质参数, 难以反映污染物的空间分布特征及水质参数浓度的大面积范围的动态变化^[1,2] ...

2019

0.0