作者简介: 梁星辉, 1999年生, 中国科学院烟台海岸带研究所, 中国科学院海岸带环境过程与生态修复重点实验室, 山东省海岸带环境过程重点实验室, 中国科学院大学硕士研究生 e-mail: xhliang@yic.ac.cn
硝酸盐氮与亚硝酸盐氮是海洋水质监测的重点参数, 也是研究海洋氮循环的重要参考。紫外吸收光谱法操作简单, 响应快速, 适用于多种水质参数监测, 但测量中硝酸盐氮与亚硝酸盐氮存在混叠干扰以及海水离子干扰。提出了一种硝酸盐氮与亚硝酸盐氮快速测量方法, 对光谱进行一阶差分等预处理, 使用相关系数搜索进行波段优化, 使用BP神经网络进行浓度反演, 模型的预测值与真实值线性相关系数为0.998。与国外同类设备进行了比对测试, 两者线性相关系数为0.982。参加了烟台市海洋环境监测预报中心2023年夏季航次, 进行了应用测试, 与实验室方法进行了比对分析, 两者线性相关系数为0.902, 说明本方法能够实现海水硝酸盐氮与亚硝酸盐氮的快速测量, 为后续原位监测仪器的研制提供参考。
As the key parameters of marine water quality monitoring, nitrate and nitrite are important references for studying the marine nitrogen cycle. The ultraviolet (UV) absorption spectrum is simple to operate and fast in response, and it is suitable for monitoring various water quality parameters. However, the measurement has aliasing interference between nitrate and nitrite and seawater ion interference. This paper proposes a rapid measurement method for nitrate and nitrite. First, the spectrum is preprocessed by first-order difference. Then, the correlation coefficient search is used to obtain the optimal modeling band. Finally, the BP neural network is used for concentration inversion. The linear correlation coefficient between the predicted value and the real value of the model is 0.998. The comparison test was conducted with similar equipment, and the linear correlation coefficient was 0.982. The application test was carried out in the 2023 summer voyage of Yantai Marine Environment Monitoring and Forecasting Center, and the linear correlation coefficient between the two methods was 0.902. The results show that this method can realize the rapid measurement of nitrate and nitrite in seawater and provide a reference for developing subsequent in-situ monitoring instruments.
硝酸盐氮与亚硝酸盐氮是海洋水质监测的重点参数, 同时也是研究海洋氮循环的重要指标[1]。传统测量方法多为化学方法, 需进行水样预处理, 步骤繁琐, 测量周期长。紫外吸收光谱采用待测物质在紫外光区域有特定吸收峰的特性, 通过测量水样的紫外波段吸光度确定其浓度, 具有操作简单、 无需添加试剂、 响应快速、 成本低廉等优点[2], 适用于海水中多种生态要素的快速检测和连续监测。得益于紫外吸收光谱法的快速发展, 以Sea Bird公司的SUNA系列、 TriOS公司的OPUS系列、 s::can公司的spectro::lyser系列为代表的光学传感器广泛应用于海洋和地下水水质监测。
海岸带水体同时受陆地和海洋的影响, 水体成分相较于大洋水体与地下水更为复杂, 盐度干扰成为紫外吸收光谱法测定硝酸盐氮和亚硝酸盐氮浓度的一大难点[3]。硝酸盐氮与亚硝酸盐氮的紫外吸收特征峰存在重叠, 严重影响了浓度反演算法的精度。为了解决这些问题, 研究者们采用了不同的策略, 如选择合适的波长范围、 使用多元回归分析、 进行光谱预处理、 建立非线性模型[4]等。Wang等利用紫外分光光度计结合偏最小二乘回归法[5], 成功对长江口水样中的硝酸盐氮和亚硝酸盐氮进行了同时测定, 实验结果与传统的化学方法相一致。Zhang等提出了一种基于紫外吸收光谱的混合机器学习方法[6], 根据硝酸盐和亚硝酸盐的浓度比用联合分类器对样本进行分类后用相应的子模型进行处理, 然后预测样本中硝酸盐和亚硝酸盐的浓度, 该方法提高了光谱直接检测的性能。已有同时测定硝酸盐氮与亚硝酸盐氮方法多用于淡水水域, 对盐度影响并未重点考虑。本工作提出的方法通过一阶差分处理解决盐度干扰, 使用神经网络建模, 综合考虑了硝酸盐氮与亚硝酸盐氮之间的相互影响, 具有较高的反演精度, 为后续原位海水监测仪器研制提供参考。
如图1为以紫外吸收光谱法原理, 搭建了硝酸盐氮与亚硝酸盐氮快速测量实验系统, 采用氘灯与钨灯作为光源, 光谱分辨率为0.8 nm, 光谱采集范围为210~1 083 nm, 测量光程为50 mm。使用自行研制的配套软件平台, 实现光谱数据自动采集与实时绘制。
海水中主要阴离子包括Br-、 Cl-、
参考现行标准[9], 将0.722 g硝酸钾和0.308 g亚硝酸钠分别溶解在250 mL去离子水中, 得到硝酸盐氮(
盐度与氯离子浓度的换算公式为S‰ =1.806 55Cl‰ , 同时大洋水体的溴氯值约为0.003 5[7]。配制硝酸盐氮和亚硝酸氮在不同盐度下的溶液, 硝酸盐氮与亚硝酸盐氮为80~50、 120~75、 160~100、 200~125、 300~150、 400~200、 500~250和600~300 μ g· L-1共8个梯度, 盐度为0‰ 、 10‰ 、 20‰ 、 30‰ 共4个梯度, 两者组合共32组溶液。
选取决定系数(R2)、 均方根误差(MSE)、 平均绝对误差(MAE)作为浓度反演模型性能的评价指标[10]。
R2是衡量真实值与拟合回归线近似程度的指标, 范围为0~1, 越接近1说明模型对数据方差解释得越多, 模型拟合得越好, 如式(1)
式(1)中, n为样本数量, yi为第i个样本的真实值,
MSE为反映估计量与被估计量之间差异程度的一种度量, 越接近0说明预测值越接近真实值, 模型越精确, 如式(2)
式(2)中, MAE是反映实际预测误差大小的指标, 与MSE类似见式(3), 越接近0说明模型拟合效果越好。
基于一阶差分紫外吸收光谱的硝酸盐氮与亚硝酸氮快速测量方法流程如图2所示。先通过标准溶液建立起硝酸盐氮与亚硝酸盐氮浓度反演模型, 再采集待测海水样品的紫外吸收光谱, 通过一阶差分与波段优化去除盐度干扰, 将预处理后的数据作为输入, 由浓度反演模型输出硝酸盐氮与亚硝酸盐氮的浓度。
![]() | 图2 一阶差分紫外吸收光谱法的硝酸盐氮与亚硝酸氮快速测量方法流程图Fig.2 Flowchart of the rapid measurement method for nitrate and nitrite using first-order differential UV absorption spectrum |
1.4.1 光谱预处理
在将光谱数据输入模型前, 需对其进行预处理, 包括计算吸光度, 平滑滤波去噪, 一阶差分处理。
实验系统采集到的光谱数据为原始光强, 需根据朗伯比尔定律转换为吸光度后使用, 计算公式为
式(4)中, Aλ 为波长λ 处的吸光度, I0λ 为波长λ 处的入射光强, Iλ 为波长λ 处的出射光强, kλ 为波长λ 处的摩尔吸收系数, b为光程, c为物质浓度。
对紫外吸收光谱进行平滑预处理以去除随机噪声, 使用Savitzky-Golay卷积平滑算法, 对滤波窗口内的数据进行拟合, 窗口宽度为5, 多项式阶数为2, 移动步长为1。
紫外吸收光谱中, 硝酸盐氮与亚硝酸盐氮的吸收峰存在重叠, 给同时测定两种参数带来挑战。对其进行一阶差分处理, 可有效分离硝酸盐氮与亚硝酸盐氮的特征区间。
对朗伯比尔定律公式两边同时差分, 可得
式(5)中, A'λ 为波长λ 处的一阶差分吸光度, k'λ 为波长λ 处的一阶差分摩尔吸收系数, b为光程, c为物质浓度。
由式(5)可知, 满足朗伯比尔定律时, 紫外吸收光谱的一阶差分吸光度与物质浓度成正比。
1.4.2 离子干扰去除
为研究不同盐度对紫外吸收光谱的影响, 配制了1‰ ~34‰ 共12个梯度的盐度溶液。对盐度溶液的紫外吸收光谱进行一阶差分处理后, 如图3所示, Br-和Cl-干扰主要集中在210~235 nm处, 235~260 nm区间影响最小, 考虑采用235 nm后的波段进行建模以去除Br-和Cl-干扰。
1.4.3 最优特征波段提取
使用紫外吸收光谱进行硝酸盐氮和亚硝酸盐氮浓度反演多采用220~240 nm波段[3, 11]。由于经过一阶差分处理, 硝酸盐氮与亚硝酸盐氮的特征波段有所变化, 需要重新提取最优特征波段。
使用相关系数搜索算法在235~260 nm区间搜索相关性强的波长, 计算每个波长一阶差分吸光度和硝酸盐氮与亚硝
酸盐氮浓度的皮尔逊相关系数, 提取出32个相关系数最高的波长。
式(6)中, A为波长λ 处的吸光度向量, C为浓度向量, p为相关系数, 绝对值> 0.8时可视为相关性强[12]。
1.4.4 模型架构及参数设置
实验中硝酸盐氮与亚硝酸盐氮浓度反演模型基于BP神经网络(back propagation neural network, BPNN), 输入层为32节点, 输出层为2节点, 采用Adam算法作为梯度下降的优化算法, 采用LeakyReLU函数作为激活函数。神经网络的隐藏层越多, 拟合能力越强, 同时模型复杂度也越大, 对运行设备的算力要求越高。考虑到后续原位仪器研制, 权衡拟合能力与模型复杂度后, 选取了4层隐藏层的神经网络作为最终模型。
神经网络的超参数主要是学习率与迭代次数, 两者影响到训练时的收敛速度并最终决定网络模型的拟合能力。本实验设置的初始学习率为0.000 5, 迭代次数为12 000。Adam算法具备自动调整学习率的功能, 可以有效避免梯度爆炸与梯度消失导致的训练中止。训练时通过观察误差随迭代次数变化的曲线来确定模型是否收敛。
标定实验配制了32组硝酸盐氮和亚硝酸盐氮在不同盐度下的混合溶液, 获取紫外吸收光谱, 并对其进行预处理后得到一阶差分吸收光谱, 如图4所示。
![]() | 图4 不同盐度下硝酸盐氮和亚硝酸盐氮混合溶液的一阶差分吸收光谱Fig.4 First-order differential absorption spectrum of nitrate-nitrite mixed solution at different salinity |
盐度对硝酸盐氮和亚硝酸盐氮的干扰主要集中在210~235 nm区间, 且随着盐度的上升而增大。在235~260 nm区间, 盐度的干扰较小, 随着硝酸盐氮和亚硝酸盐氮浓度增大影响越来越小, 硝酸盐氮和亚硝酸盐氮的光谱特征逐渐占据主要地位, 采用235~260 nm区间作为硝酸盐氮和亚硝酸盐氮浓度反演的建模波段。
使用BP神经网络模型对上述一阶差分吸收光谱进行建模, 经过12 000次迭代训练后, 误差曲线趋于平滑, 说明模型基本收敛。对测试样本进行预测, 硝酸盐氮和亚硝酸盐氮的实际值与预测值如表1所示, 两种参数的预测值均与实际值相接近, 说明浓度反演模型可以在有盐度干扰情况下同时测量这两种参数。
![]() | 表1 模型预测结果 Table 1 Model predicted results |
如图5(a, b)所示, 硝酸盐氮的反演线性相关性为0.999, 亚硝酸盐氮的反演线性相关性为0.998, 说明模型能有效消除硝酸盐氮与亚硝酸盐氮吸收峰混叠与盐度梯度带来的干扰。
![]() | 图5 模型预测值和实际值的线性相关性 (a): 硝酸盐氮; (b): 亚硝酸盐氮Fig.5 Linear correlation between model predicted values and actual values (a): Nitrate; (b): Nitrite |
为验证一阶差分及特征波段提取的效果, 使用4层隐藏层的BP神经网络对原始紫外吸收光谱建模作对比, 输入波段为215~240 nm。各项参数评价如表2所示, 与直接使用紫外吸收光谱进行浓度反演相比, 一阶差分光谱模型能够明显降低盐度干扰的影响, 有效提升预测精度。
![]() | 表2 模型指标评价 Table 2 Model performance evaluation |
在烟台近海码头、 景区、 入海口等7个典型站位取样, 采样点如图6所示, 使用本方法进行硝酸盐氮与亚硝酸盐氮浓度反演, 并与国外同类设备TriOSOPUS仪器所测硝酸盐氮浓度对比, 结果如图7所示, 线性相关系数为0.983, 测量结果与国外同类设备测量结果之间具有良好的一致性。
2023年8月参加烟台市海洋环境监测预报中心夏季航次, 采样站点如图8所示。测量结果与实验室方法进行比对(如图9所示), 硝酸盐氮线性相关系数为0.947, 亚硝酸盐氮线性相关系数为0.858, 测量结果与实验室湿化学方法[9]相比均具有良好的一致性, 该方法可以为后续海水水质原位监测仪器集成与应用提供技术参考。
使用一阶差分方法对紫外吸收光谱进行预处理, 选取Br-和Cl-干扰最小的波段建模, 可同时测量盐度环境中的硝酸盐氮与亚硝酸盐氮浓度。实验结果表明, 该模型的平均决定系数R2=0.994, 说明模型的预测精度相对较高, 可以有效区分海水中的硝酸盐氮与亚硝酸盐氮。针对烟台近海7个典型站位, 本方法与国外同类设备进行了比对测试, 两者线性相关系数为0.982。参加了烟台市海洋环境监测预报中心2023年夏季航次, 与实验室方法进行比对测试, 趋势基本一致, 本方法可以为后续海水水质原位监测仪器研制与应用提供技术参考。在海水硝酸盐氮与亚硝酸盐氮含量较低时, 该测量系统可能会受到一定限制, 后续工程应用时可以通过加大光程方式降低检出限。目前现场测试水域水质状况较为稳定, 在浊度变化较大时还需要进一步考虑浊度影响, 模型还需要进一步优化设计, 将在后续工作中不断完善。
致谢: 感谢烟台市海洋环境监测预报中心姜炜老师在样品采集与测试中提供的帮助与支持!
[1] |
|
[2] |
|
[3] |
|
[4] |
|
[5] |
|
[6] |
|
[7] |
|
[8] |
|
[9] |
|
[10] |
|
[11] |
|
[12] |
|