无人机高光谱遥感和集成深度置信神经网络算法用于密云水库水质参数反演
乔智1, 姜群鸥1,2,*, 律可心1, 高峰1
1.北京林业大学水土保持学院, 北京 100038
2.北京林业大学水土保持与荒漠化防治教育部重点实验室, 北京 100038
*通讯作者 e-mail: jiangqo.dls@163.com

作者简介: 乔 智, 1996年生,北京林业大学水土保持学院硕士研究生 e-mail: qiaozhi@bjfu.edu.cn

摘要

随工业化及社会经济迅速发展, 水源地面临的水体污染、 恶化不断加剧, 开展有效的水质监测是水源保护的重要前提。 密云水库是北京重要的地表水源地, 在保护首都水源安全方面发挥着重要作用。 为更精准的监测密云水库水质参数及污染程度, 采用4期无人机高光谱遥感数据, 基于随机子空间的集成深度置信神经网络算法(EDBN), 构建密云水库水质参数反演模型, 对密云水库总氮(TN)、 总磷(TP)两项水质参数进行反演。 首先, 采用基于递归特征消除法对高光谱影像降维处理, 将光谱数据与地面水质监测数据进行叠加, 通过最小化训练过程中误差来确定隐藏层数、 神经节点数等网络结构参数; 然后采用由知识源域向网络迁移方式逐步拓展网络, 对密云水库总氮和总磷两个水质参数进行训练并对结果进行验证; 最后, 反演密云水库潮河大坝和白河大坝区域水质参数, 揭示其主要水质参数时空演变规律。 研究结果显示: ①构建总氮、 总磷反演模型 R2分别为0.835 5、 0.770 3, MSE分别为0.015 3、 0.000 8, 这表明基于随机子空间的集成深度置信神经网络算法模型对密云水库水质参数反演效果较好; ②密云水库总氮浓度变化随季节发生一定波动, 在夏季浓度较低, 秋季相对较高。 总磷浓度变化相对平稳, 表明密云水库周边区域对磷污染控制效果良好; ③白河大坝区域水质优于潮河大坝区域, 总氮浓度相对偏高, 整体处于Ⅲ类水平。 而总磷浓度较低, 整体处于Ⅱ类水平, 较好时可以达到Ⅰ类水平。 整体水质可以满足饮用水源的标准, 但仍需加强对氮、 磷污染物有效监管。 研究结果将为密云水库水质高效监测与水源保护提供重要科学依据。

关键词: 无人机高光谱; 深度神经网络算法; 水质反演; 密云水库
中图分类号:TP79 文献标志码:A
Retrieval Model for Water Quality Parameters of Miyun Reservoir Based on UAV Hyperspectral Remote Sensing Data and Deep Neural Network Algorithm
QIAO Zhi1, JIANG Qun-ou1,2,*, LÜ Ke-xin1, GAO Feng1
1. School of Soil and Water Conservation, Beijing Forestry University, Beijing 100038, China
2. Key Laboratory of Soil and Water Conservation and Desertification Prevention, Beijing Forestry University, Beijing 100083, China
*Corresponding author
Abstract

With the rapid development of industrialization and social economy, water pollution and deterioration of water sources are increasingly aggravated, and effective water quality monitoring is an important prerequisite for water source protection. Miyun Reservoir is an important surface water source in Beijing, which plays an important role in protecting water safety in the capital. In order to monitor the water quality parameters and pollution degree of Miyun Reservoir more accurately, this study used four phases of UAV hyperspectral remote sensing data to construct a water quality parameter retrieval model based on a deep neural network algorithm. Total nitrogen (TN) and total phosphorus (TP) water quality parameters in Miyun Reservoir were retrieved. Firstly, the hyperspectral image dimensionality reduction processing based on the recursive feature elimination method was used, and the spectral data and groundwater quality monitoring data were superimposed. The network structure parameters, such as the number of hidden layers and the number of ganglion points, were determined by minimizing the error in the training process. Then, the migration method gradually expanded the network from knowledge source domain to network, and the water quality parameters of TN and TP concentration in Miyun reservoir were trained and verified. Finally, the water quality parameters of Chaohe Dam and Baihe Dam in Miyun Reservoir were retrieved to reveal the spatio-temporal evolution of the main water quality parameters. The results show that ① the R2 of the TN and TP concentration retrieval models constructed in this study are 0.835 5 and 0.770 3, and the MSE is 0.015 3 and 0.000 8. The Ensemble Deep Belief Network (EDBN) model based on random subspace has a better retrieval effect on water quality parameters. ②TN concentration in Miyun Reservoir fluctuates with seasons, with a low concentration in summer and a relatively high concentration in autumn. The change in TP concentration is relatively stable, indicating that the control effect of phosphorus pollution in the surrounding area of Miyun Reservoir is good.③The water quality of the Baihe Dam was better than that of the Chaohe Dam. The seasons obviously affected the changes of the former, while the latter was significantly affected by human activities. The TN concentration of Miyun reservoir was in Class III, and the TP was generally in Class II. The water quality can meet the standards of drinking water sources, but it is still necessary to strengthen the supervision of nitrogen and phosphorus pollution. These results will provide an important scientific basis for efficiently monitoring water quality and water resources protection in the Miyun reservoir.

Keyword: UAV hyperspectral; Deep neural network algorithm; Water quality retrieval; Miyun Reservoir
引言

水资源是人类生存、 社会发展的重要资源; 水库是人类饮用水的主要来源。 随着经济快速发展, 工业和生活用水不断增加, 缺水与水质恶化对社会经济发展造成巨大威胁, 严重影响了水资源分布和质量, 也影响人类基本的水资源需求, 威胁世界数亿人口的用水安全[1]。 有效地开展水质实时监测与反演成为解决这一问题的重要突破口之一。 改进水质监测技术, 提高水质参数反演精度, 将对保护水资源、 防控水源污染、 加强水资源有效管理起到至关重要作用[2]

传统水质监测主要是实地取样检测, 需要耗费大量时间和成本, 且水质评价结果在时间和空间上均不够连续。 遥感技术凭借其快速、 高效、 大面积观测等优点被广泛应用于水质动态监测中[3]。 吴欢欢等利用Landsat8遥感数据与实测数据反演了海河流域总氮、 总磷等浓度[3]。 Kim等通过COCI卫星数据反演出沿海区域氮磷等水质参数[4]。 然而, 遥感技术适用于较粗分辨率大面积水域监测, 并且监测周期较长, 而对于监测小范围水域水质参数演变特征, 则需要采用新方法予以解决[3, 5]。 近年来无人机(unmanned aerial vehicle, UAV)遥感技术应用领域不断拓展。 孟苗苗等利用无人机数据提取绿藻, 实现了大型绿藻覆盖的精细监测[5]。 Castro等利用无人机数据对小型饮用水源富营养化程度进行评估[6]。 现有文献已证明无人机高光谱影像应用于水质参数反演具有一定优越性, 但目前基于无人机高光谱数据进行水质参数反演与评价研究相对较少。

随着人工智能迅速发展, 机器学习(machine learning, ML)、 深度学习(deep learning, DL)等算法被用于水质参数反演, 神经网络等方法凭借其良好精确度和稳定性, 为水质参数监测与预测进一步发展提供了新机遇[7]。 姚俊杨等采用深度置信网络反演藻类生长状况, 精准反演了湖库藻类水华情况, 相较其他方法凸显出明显优势[8]。 马丰魁等采用BP神经网络模型实现了对密云水库主要水质参数的非线性拟合[9]。 Jiang等分析了Landsat8光谱反射率信息, 通过多种神经网络算法评价了总氮浓度[10]。 深度置信网络在水质参数反演方面凭借强大的特征处理能力和非线性关系建模能力, 成为解决水库水质监测复杂问题的有效方法。 然而, 目前基于深度置信网络算法对水库水质进行反演研究还相对较少, 对其数据标准、 模型参数等没有深入研究[11]

以北京市密云水库为研究区, 采用无人机搭载高光谱传感器获取多期遥感影像反射率数据, 结合地面水样监测结果, 采用由知识源域向网络迁移方式逐步拓展神经网络, 构建密云水库总磷(TP)、 总氮(TN)两个主要水质参数的集成深度置信神经网络反演模型, 经过超参数检验与选取, 实现密云水库中小尺度精细化水质参数反演与评价。 在此基础上, 进一步分析密云水库白河大坝、 潮河大坝两个入库敏感区域水质参数空间分布特征, 探讨其时空分布演化规律。 这些研究将为密云水库重点区域水质环境监管提供科学、 精准、 高效技术方法。

1 实验部分
1.1 研究区概况

密云水库位于北京市密云区北部, 面积约180 km2, 地处燕山群山丘陵之中, 是北京唯一饮水源供应地, 为华北地区最大水库, 也是亚洲最大人工湖, 被称为“燕山明珠”。 密云水库有两大入库河流, 分别是白河和潮河, 两支流入库总氮含量年平均值分别为2.05和5.09 mg·L-1, 总磷年平均值分别为0.013和0.012 mg·L-1[11]。 南水北调通过京密引水渠进入水库, 成为第三大入库水源。 2014年底南水进京, 密云水库的水源供给减小, 但涵养城市水源、 水源战略储备意义不容忽视。 近年来, 随北京市迅速城市化及北部经济发展, 水库及周边自然环境逐渐恶化, 尽管政府已开展一系列保护水库行动, 但水库污染情况依然存在。 因此, 开展对密云水库水质参数反演研究十分迫切。

1.2 数据来源与处理

1.2.1 无人机高光谱遥感数据

研究采用DJI M600Pro无人机搭载Headwall Nano-Hyperspec超微型机载高光谱成像光谱仪, 其光谱范围为400~1 000 nm, 共640个空间通道, 270个光谱通道, 光谱分辨率(FWHM)为6 nm。 GPS/IMU模块记录成像仪的姿态信息, 在Headwall提供的后处理软件中载入姿态信息后, 可对采集的条带进行几何校正、 辐射校正操作。 无人机采集镜头焦距为8 mm, 视场角为33°, 飞行高度为290 m。 选取密云水库两座主坝为研究区, 分别位于水库西部溪翁庄村的白河大坝及水库南部南碱厂村的潮河大坝。 数据采集时间为2018年10月、 2019年4月、 6月及8月, 如图1所示。 这两个区域分别为潮河、 白河入库口, 是密云水库水质变化敏感区。 首先对高光谱数据进行传感器辐射定标、 场地辐射校正、 波段降维、 去噪等处理。

图1 密云水库区位及采样点分布图Fig.1 Location and sampling point distribution of Miyun Reservoir

采用低空飞行方案, 大气环境单一且飞行时间较短, 因此不考虑大气影响。 依次进行传感器辐射定标、 场地辐射校正。 传感器辐射定标采用无人机设备供应方提供的配置校正文档, 在输出信号和辐射强度值之间提供模型和转换参数。 场地辐射校正采用实验室定标的参考板进行, 在提取无人机高光谱影像上定标板相应位置的辐射值后, 将定标板标准辐射反射率值(R)与高光谱遥感影像上的辐射亮度值(L)进行线性回归即可得出每个波段定标系数。 各波段遥感反射率与辐射亮度值之间的关系为

Ri=aiLi+bi(1)

式(1)中, aibi为各波段定标系数。

1.2.1.1 基于递归特征消除法的高光谱波段降维

对无人机高光谱数据进行辐射亮度校正及几何校正后, 进行波段降维处理。 因高光谱影像270个波段数据量较大, 数据冗余, 运算速度较慢, 且深度神经网络算法复杂度较高, 需要对270个波段进行降维处理。 递归特征消除法基于模型后向搜索, 在每次迭代删除特征的过程中, 将模型内部特征重要性评价指标作为度量标准, 评估当前特征子集与当前剩余特征子集之间的关系, 得到波段间的递归特征指数[12]。 本研究将所有波段反射率递归特征指数与总氮、 总磷两个水质参数进行相关分析, 得到水质参数与各波段的相关系数热点图(图2)。 因密云水库水体较为清洁, 大于900 nm波段光谱反射率较低, 故不考虑大于900 nm波段。 结果表明, 高光谱遥感数据的550~650和750~880 nm处为对总氮浓度敏感波段, 730~900 nm为对总磷浓度敏感波段, 以此筛选出10个主要波段, 涵盖主要高光谱信息特征, 使其既能满足数据建模要求, 也能满足运行计算的硬件环境。

图2 水质参数与高光谱波段反射率相关系数热点图Fig.2 Correlation heatmap of hyperspectral band and water quality parameters

1.2.1.2 基于压缩感知方法的高光谱影像去噪

采用压缩感知去噪方法对无人机高光谱数据去噪。 根据压缩感知理论, 若信号是可压缩的或在某个变换域是稀疏的, 那么可以用一个与变换基不相关的观测矩阵将高维信号 X投影到低维空间Y, 而后通过重构算法利用最优化方法将原始信号X精确或者高概率重构[13]。 获得信号测量值的数学模型如式(2)

y=ΦΨ=ΦΨs=Θs(2)

式(2)中, Φ RM×N为测量矩阵, Ψ 为稀疏表示基, yX的测量值, s为稀疏向量。

压缩感知的信号重构过程是一个求解线性方程过程。 式(1)未知数的个数远大于方程的个数, 是一个不定方程, 有无穷多解。 但由于向量s是稀疏的, 如果矩阵Θ 中任意2k列线性无关, 理论证明, 同时满足上面两个要求时, 可通过求解如下问题来精确重构信号

minθθ0s.t. y=φX=Θθ(3)

式(3)中, ‖ θ0表示向量的范数, 即向量非零元素个数。 通过求θ的唯一解来得到信号X

经过去噪处理获得高光谱反射率结果(图3)显示, 压缩感知算法有效剔除了异常噪声, 其光谱曲线更平滑连续, 避免了模型训练中由噪声带来的误差干扰。

图3 高光谱影像去噪前后反射率曲线图Fig.3 Reflectance curves of hyperspectral images before and after denoising

1.2.2 地面监测数据

在密云水库水域共计采集有效水样80个, 采样时间与无人机遥感数据采集时间相同步, 对每个样点记录其位置信息, 四期样点的分布情况如图1所示, 采样深度为表层0~50 cm水面。 监测水质指标为总磷、 总氮, 其中, 总磷是指溶解的、 悬浮的、 有机的和无机磷。 总氮是指水中各种氮化合物的总和, 不包含氮气, 检测结果如表1所示。

表1 地面采样水质参数检测结果 Table 1 Measured values of water quality parameter of ground sampling

1.2.3 模型构建数据集

经过以上预处理, 根据采样点的经纬度坐标, 将80个地面有效监测数据与无人机高光谱降维后获取的10个波段光谱反射率空间信息对应匹配, 得到80行10列模型构建数据集, 以高光谱反射率信息为输入数据, 总氮、 总磷两组实测水质参数为目标输出数据, 引入基于样本的10折交叉验证, 将训练数据划分为10个子集, 其中8个用来训练, 2个用来验证。 建立深度神经网络模型进行训练, 反演得到密云水库2个敏感区域空间分布特征。

1.3 研究方法

1.3.1 深度置信神经网络

深度置信神经网络(deep belief network, DBN)是深度学习的一种重要算法, 由输入层、 隐含层和输出层组成。 2006年, Hinton提出了受限玻尔兹曼机(restricted Boltzmann machine, RBM)逐层贪婪预训练方法[14]。 DBN网络结构为本研究基础模型, 其输入数据、 输出数据分别为网络输入层及输出层, 分别对应高光谱数据10个波段光谱反射率信息及水质参数值。 其训练过程可以分为自下而上无监督学习和自上而下有监督调优两部分。

如图4所示, 首先对一个只含有一层隐含层DBN进行预训练, 作为知识源域; 随后增加目标域, 即增加固定规模隐含层, 通过预训练重构误差, 确定网络停止增长的标准。

图4 DBN网络结构Fig.4 The structure of DBN network

在训练过程中, 每一个RBM隐含层对上一层输入的向量进行吉布斯采样, 得到隐含层神经元激活概率, 获取得到本层RBM隐含层神经元激活概率, 从而可得到全部RBM隐含层神经元激活概率。 上述吉布斯采样及参数更新方法可以表示为

P(hj=1v, θ)=σbj+iΔWijvi(4)

P(vi=1h, θ)=σaj+jΔWijhi(5)

Δθij=Δθij+αs-Lθ(6)

式(4)—式(6)中, v为输入向量, θ为网络参数的集合, 其中Wij为可视层与隐含层之间的权值矩阵, ai为可视层与隐含层之间的权值矩阵, bj为可视层神经元的偏置, h为隐含层n维状态变量。

1.3.2 基于随机子空间的深度置信神经网络算法

DBN算法虽然具有较高的计算性能, 但在处理高光谱等大规模数据时, 存在训练时间过长的问题, 且随着隐层数增加容易导致过拟合。 针对这些问题, 采用多个DBN学习器进行集成, 优化为基于随机子空间的集成深度置信神经网络算法(ensemble deep belief network, EDBN)。 该算法从原始特征空间随机选择子空间构建多个基学习器, 最后结合所有基学习器输出。 如图5所示, EDBN模型对数据样本进行划分, 即将特征空间T划分为K个子空间, 每个基学习器在样本子空间上独立并行训练, 从而形成K个DBN模型。

图5 EDBN模型结构Fig.5 The structure of EDBN model

对于随机子空间, 每个随机选择的特征向量都可以生成原始样本视图, 因此, 对于多个随机采样特征会生成多个视图, 即从不同视图对样本进行分析和描述。 根据原始样本在不同子空间投影视图, 设计多个结构相同的基学习器, 对每个基学习器进行独立并行训练。

1.3.3 EDBN水质反演模型的构建与参数优化

EDBN水质反演模型构建主要包括网络结构初始化及超参数优化调整两方面。 以无人机高光谱降维后10个波段为样本数据, 初始化网络结构为3隐层5节点, 使每一层提取到水质数据基本特征, 向前传播输送进网络下一层, 随后逐步增加隐层数和节点数, 观察并记录损失值变化。 损失函数选取平均值误差函数, 如式(7)所示。

MSE=1ni=1n(xi+yi)2(7)

在深度神经网络中, EDBN网络结果训练后会捕捉一组初始权重, 反向传播计算损失值来优化网络各层权重比。 通过调节隐层数和节点数使网络训练精度明显提高, 节点数梯度设置为5、 10、 15, 隐层数梯度为3、 4、 5、 6、 7, 其对应损失值如图6所示, 当损失值较小, 且继续增大隐层数和节点数精度提高不再明显时, 认为当前参数为最佳参数。

图6 不同隐层数和节点数对应的损失值Fig.6 Loss values corresponding to different numbers of hidden layers and nodes

样本训练批次是影响模型训练效率、 收敛速度及整体精度的重要参数; 选取3个经验值分批次讨论(图7), 较大训练批次训练精度较低, 中等训练批次效率较低, 综合考虑收敛速度、 损失值大小及训练时间, 对总氮、 总磷设置训练批次为9。 此外, 可以发现在迭代次数达到一定数量时, 损失值减小趋势趋于稳定, 依此可选取最大迭代次数。

图7 不同训练批次下的损失值收敛情况Fig.7 Convergence of loss values under different training batches

网络其他相关参数设置如下: 激活函数选用稀疏性较强的Relu函数, 以增强网络非线性变换特征。 初始学习率选取为0.001, 观察测试集误差变化, 当误差持续一段时间不变, 则随着迭代次数增加, 通过乘以数值为0.5的乘数因子渐渐衰减学习速率。 另外, 采用Adam优化函数防止模型训练中产生的过拟合现象。 得到EDBN水质反演模型参数表(表2)。

表2 模型参数表 Table 2 Paramters of EDBN model
2 结果与讨论
2.1 水质参数总氮和总磷反演模型验证

基于构建的深度神经网络模型, 对2018年10月、 2019年4月、 6月、 8月四期密云水库无人机高光谱数据进行反演, 得到总氮和总磷水质参数空间分布数据。 两种水质参数反演模型精度验证如图8所示, 可以直观看出样本真实值与预测值间的离散程度。 总体而言, EDBN模型对水质参数反演取得较好拟合效果。 其中, 总氮反演模型R2达到0.835 5, 异常点较少, 离散程度较小, 总磷反演模型R2达到0.770 3, 能满足较高精度的水质监测要求。

图8 EDBN水质参数反演模型精度验证Fig.8 Accuracy verification of EDBN model

EDBN水质参数模型误差值如表3所示, 总磷反演模型模拟误差相对较小, MSE、 MAE分别为0.000 8、 0.001 4, 其次为总氮反演模型, 其MSE、 MAE分别为0.015 3、 0.051 4; 综合来看, EDBN模型对水质参数反演效果良好, 适宜于密云水库总氮、 总磷水质参数反演。

表3 EDBN水质参数反演模型误差表 Table 3 Errors of EBDN model
2.2 密云水库水质参数总氮和总磷时空特征分析

2.2.1 水质参数总氮时空演变特征

密云水库水质参数总氮浓度估算范围为2.71~2.9 mg·L-1(图9), 相对偏高, 大部分时间为Ⅲ 类水。 其中, 潮河大坝区域10月浓度为2.778 mg·L-1, 水质整体较差; 次年4月起总氮浓度稍有所降低, 平均值为2.764 mg·L-1; 而到6月总氮浓度降为2.752 mg·L-1。 随夏季到来, 在8月降到最小值, 为2.733 mg·L-1。 从时间上来看, 潮河大坝总氮浓度季节差异显著, 具有较强的规律性, 两次较大波动出现在4月和8月, 水库水质先受到汛期降雨略有好转, 而后在水库自净调节作用下恢复至较低水平; 从空间上来看, 总氮浓度整体分布均匀, 春季北部略低于南部, 这可能是由于南部地区村庄聚集, 总氮浓度偏高与该区域的人类活动有关。

图9 潮河大坝和白河大坝水域总氮浓度空间分布图Fig.9 Spatial distributions of TN concentrations in the water areas of Chao river dam and Bai river dam

白河大坝区域10月总氮浓度为2.754 mg·L-1, 处于常规水平; 而8月总氮浓度较低, 平均值为2.748 mg·L-1; 而次年4月和6月总氮浓度较高, 分别为2.765和2.776 mg·L-1。 从时间上来看, 夏季、 秋季总氮浓度较低, 春季浓度较高, 可能与夏季降水补充水源有关。 从空间分布来看, 总氮浓度有西北至东南波动趋向, 这可能是由于入库口水源注入带来一定程度的污染。

两区域对比可发现, 潮河大坝整体总氮浓度略高于白河大坝, 且潮河大坝季节差异更为明显, 产生这种现象可能与潮河大坝南部连片分布的村庄、 果园、 耕地有关, 长期施肥或粪便、 垃圾堆放引起土壤表层总氮变化, 造成总氮浓度显著差异。 从变化范围来看, 两区域范围内水质分布较为均匀, 白河大坝浓度分布波动区间更小, 没有较大梯度差异与总氮聚集现象, 这表明在实施严格水源保护政策下, 该区域农业生产和农村生活对总氮的影响有限, 工业污染等其他来源的氮污染治理难度较大, 需采取长期的保护措施, 逐步治理流域水质。

2.2.2 水质参数总磷时空演变特征

密云水库总磷浓度估算范围为0.007 6~0.012 mg·L-1(图10), 相对浓度偏低, 大部分时间为Ⅱ类水, 夏季可达到Ⅰ类水标准。 其中, 白河大坝区域10月总磷浓度为0.008 9 mg·L-1, 随后逐渐升高, 次年4月平均值为0.009 1 mg·L-1, 而到6月份总磷浓度达到最高, 为0.009 5 mg·L-1, 到8月回落至最低值0.008 1 mg·L-1, 水质达到最佳水平。 从空间分布来看, 密云水库总磷浓度与总氮浓度相似, 略有西北至东南波动的趋向。

图10 潮河大坝和白河大坝水域总磷浓度空间分布图Fig.10 Spatial distributions of TP concentrations in the water areas of Chao river dam and Bai river dam

潮河大坝水域总磷浓度10月浓度均值为0.009 2 mg·L-1, 次年4月稳定在为0.009 3 mg·L-1, 而到6月总磷浓度略有升高, 均值为0.009 5 mg·L-1, 到8月回落至最低值0.008 8 mg·L-1。 从时间上来看, 潮河大坝区域总磷浓度随季节变化不明显, 夏季总磷浓度相对较低; 从空间上来看, 潮河大坝北部出现波动, 略高于南部, 总体浓度相近, 分布均匀。

总体来看, 密云水库总磷浓度分布较为稳定, 两个区域均在6月达到最高, 8月回落至最低, 夏季整体水质较好, 其污染物迁移规律较为相似。 主要考虑随季节变化, 夏季降雨增多, 南水北调来水入库量增加, 使库区水源得到了有效补充, 降低了水体总磷浓度。 从变化趋势来看, 库区总磷浓度变化幅度较小。 随水库上游水资源补给增多, 白河、 潮河两个主坝附近水域水动力条件愈发强烈, 考虑白河大坝流量高于潮河, 使得白河大坝附近总磷浓度总体略低于潮河大坝区域。

2.3 讨论

研究结果表明, 集成深度置信神经网络算法模型可以实现密云水库总氮、 总磷浓度高精度反演。 与人工神经网络、 支持向量机等其他水质反演模型相比, 本模型误差更小[10]。 集成深度置信网络综合所有基学习器训练特征后输出, 有效避免了同类模型过拟合问题, 使得检索模型更加准确, 结果具有更好的泛化能力[15]。 同时, 基于无人机高光谱数据的反演模型实现了密云水库小尺度水质监测, 结果显示, 与采用Landsat8、 GF-1等卫星遥感数据反演密云水库水质参数结果基本一致, 是对基于卫星遥感数据宏观水质监测的有效补充[9, 17]

分析结果表明, 密云水库潮河大坝和白河大坝水域总氮、 总磷浓度在时空分布上均有一定波动规律, 同一水质参数对应的不同区域也存在一定差异。 总氮浓度变化波动相对较大, 在秋季潮河大坝出现污染聚集, 主要考虑库区缓冲区内存在连片耕地和建设用地, 农业面源污染和生活污水在一定程度上加剧了总氮污染。 而夏季总氮浓度降低, 这主要是由于夏季降水充沛, 南水北调入库水量增加, 水源相对充足, 水库水体得以更新补给, 使污染物聚集难度大。 总磷浓度波动较为平稳, 磷污染风险较小, 这表明密云水库周边区域对磷污染控制效果良好。

密云水库水质参数浓度反演结果显示, 水体总氮浓度偏高, 主要为Ⅲ 类水。 而总磷浓度总体处于Ⅱ类水, 在夏季部分区域可达Ⅰ类水标准。 这与张雨航、 秦丽欢等人的研究结论具有相似性[18, 19]。 因此, 密云水库总体水质较好, 可以满足饮用水源的标准, 但仍存在富营养化风险, 仍需加强对氮、 磷实时监测, 加强水质防控工作。 对于总氮和总磷等污染物, 建议整体优化密云水库周边区域山水林田湖草空间格局, 增加林草等生态用地对污染物层层过滤拦截作用。 此外, 还需严格监管密云水库上游地区人类季节性活动, 减少上游面源污染、 畜禽养殖等污染物入河量。

基于无人机高光谱数据, 采用深度神经网络模型, 获得密云水库敏感区域高精度水质参数反演结果, 但也存在一些不足之处。 对于EDBN网络中隐层数和节点数调节步幅基于经验设定初始值, 对反演模型构建带来一定影响。 随深度神经网络算法研究不断进步, 训练过程将更加高效、 简洁。

3 结论

基于无人机高光谱数据和地面采样数据, 采用深度神经网络算法, 构建EDBN水质参数反演模型, 实现了密云水库四个时期潮河大坝和白河大坝总氮和总磷两个水质参数高精度反演, 并以此为基础, 对密云水库水质参数时空分布差异及规律进行分析, 主要得到以下结论:

(1)无人机高光谱数据经过有效的降维、 去噪处理后, 可以较好的与深度神经网络算法结合, 解决水质反演中复杂非线性问题。 构建的EDBN水质参数反演模型, 大幅度提升了模型训练时间成本, 模型R2均在0.75以上, MSE分别为0.015 3、 0.000 8, 反演精度较高, 为小尺度下高效、 快速、 精准的水库水质异常监测提供了参考依据。

(2)密云水库总氮浓度变化具有一定波动性, 在夏季浓度较低, 秋季相对较高。 总磷浓度变化波动较小, 夏季浓度也相对较低, 秋季略有升高。 从区域分析, 白河大坝总氮、 总磷浓度整体低于潮河大坝, 这可能与白河大坝采样区处于水库管理处封闭区有关。

(3)密云水库总体水质较好, 总氮浓度相对偏高, 整体处于Ⅲ 类水平。 总磷整体处于Ⅱ类水, 有时候可以达到Ⅰ类水。 目前, 国内外大规模水体普遍也存在总氮偏高问题, 这也表明密云水库仍存在一定富营养化风险。

参考文献
[1] XU Er-qi, ZHANG Hong-qi(许尔琪, 张红旗). Chinese Journal of Applied Ecology(应用生态学报), 2018, 29(9): 2869. [本文引用:1]
[2] GAO Yang, WANG Xiao-yue, ZHANG Bai-lin, et al(高阳, 王晓玥, 张佰林, ). Acta Ecologica Sinica(生态学报) , 2018, 38(5): 1668. [本文引用:1]
[3] WU Huan-huan, GUO Qiao-zhen, ZANG Jin-long, et al(吴欢欢, 国巧真, 臧金龙, ). Remote Sensing Technology and Application(遥感技术与应用), 2021, 36(4): 898. [本文引用:3]
[4] Kim Y H, Im J, Ha H K. GIScience & Remote Sensing, 2014, 51(2): 158. [本文引用:1]
[5] MENG Miao-miao, ZHENG Xiang-yang, XING Qian-guo, et al(孟苗苗, 郑向阳, 邢前国, ). Journal of Tropical Oceanography(热带海洋学报), 2022, 41(3): 46. [本文引用:2]
[6] Castro C C, Gomez J A D, Martin J D, et al. Remote Sensing, 2020, 12(9): 1514. [本文引用:1]
[7] Van Donkelaar A, Martin R V, Brauer M, et al. Environmental Science & Technology, 2016, 50(7): 3762. [本文引用:1]
[8] YAO Jun-yang, XU Ji-ping, WANG Xiao-yi, et al(姚俊杨, 许继平, 王小艺, ). Computers and Applied Chemistry(计算机与应用化学), 2015, 32(10): 1265. [本文引用:1]
[9] MA Feng-kui, JIANG Qun-ou, XU Li-dan, et al(马丰魁, 姜群鸥, 徐藜丹, ). Ecology and Environmental Sciences(生态环境学报), 2020, 29(3): 569. [本文引用:2]
[10] Jiang Q, Xu L, Sun S, et al. Ecological Indicators, 2021, 124(18): 107356. [本文引用:2]
[11] ZHANG Xin, ZHAO Long, LI Ya-nan, et al(张新, 赵龙, 李亚楠, ). Beijing Water(北京水务), 2021, (2): 21. [本文引用:2]
[12] Demarchi L, Kania A, Cikowski W et al. Remote Sensing, 2020, 12(11): 1842. [本文引用:1]
[13] JI Zhen-xing, KONG Fan-qiang(计振兴, 孔繁锵). Acta Photonica Sinica(光子学报), 2012, 41(1): 82. [本文引用:1]
[14] JIANG Hui, ZHOU Wen-bin, LIU Xiao-zhen(江辉, 周文斌, 刘小真). Ecology and Environmental Science(生态环境学报), 2010, (12): 2948. [本文引用:1]
[15] Niu G, Yi X, Chen C, et al. Journal of Cleaner Production, 2020, 265: 121787. [本文引用:1]
[16] Zhang T, Fell F, Liu Z, et al. Journal of Geophysical Research, 2003, 108: 3286. [本文引用:1]
[17] WANG Meng-qi, ZHANG Wen, MENG Ling-kui(王梦琦, 张文, 孟令奎). Journal of Geomatics(测绘地理信息), 2022, 47(4): 100. [本文引用:1]
[18] ZHANG Yu-hang, SUN Chang-hong, FAN Qing, et al(张雨航, 孙长虹, 范清, ). Journal of Arid Land Resources and Environment(干旱区资源与环境), 2021, 35(8): 10. [本文引用:1]
[19] QIN Li-huan, ZENG Qing-hui, LI Xu-yong, et al(秦丽欢, 曾庆慧, 李叙勇, ). Chinese Journal of Ecology(生态学杂志), 2017, 36(3): 8. [本文引用:1]