基于荧光发射光谱的水质化学需氧量的检测
周昆鹏1, 刘双硕1, 崔健1, 张红娜1, 毕卫红2,*, 唐维2
1. 内蒙古民族大学工学院, 内蒙古 通辽 028000
2. 燕山大学信息科学与工程学院, 河北省特种光纤与光纤传感重点实验室, 河北 秦皇岛 066004
*通讯联系人 e-mail: bwhong@ysu.edu.cn

作者简介: 周昆鹏, 1983年生, 内蒙古民族大学工学院讲师 e-mail: kunpeng032@imun.edu.cn

摘要

采用光谱技术检测水质参数是当前的一个研究热点, 提出了一种基于荧光发射光谱的水质化学需氧量(COD)的检测方法。 实验样本分为两组, 第一组为20份COD标准溶液, 第二组为63份实际水样。 实验样本的化学需氧量检测采用快速消解分光光度法, 利用三维荧光分光光度计采集水样在EX=275 nm激发波长下的荧光发射光谱(荧光发射光谱范围为EM=325450 nm), 并对两类水样的荧光发射光谱数据进行了处理和建模。 分别采用主成分回归(PCR)和偏最小二乘回归(PLSR)对两类水样的荧光发射光谱数据进行了预测模型的建立, 并对模型效果进行了对比。 为验证该方法的可行性和模型的预测能力, 将所建PLSR模型预测结果与标准方法的检测结果进行了对比。 结果表明, 对于COD标准液来说, PLSR和PCR的主成分数分别取5和8时所得的模型的交叉检验效果最优, 校正模型的决定系数分别为RPLS2=0.999 9和RPCR2=0.989 7, 校正模型对检验集数据的预测误差不超过10%, 且PLSR所建模型优于PCR模型。 对于实际水样而言, PLSR和PCR的主成分数分别为6和7时, 校正模型的交叉验证效果最优。 PLSR法和PCR法的校正集的交叉检验均方差RMSECVPLS和RMSECVPCR分别为0.932 2和0.976 4 mg·L-1。 对于实际水样的检验集来说, PLSR法和PCR法的预测决定系数RPLS2RPCR2分别为0.940 2和0.919 0, 说明PLSR法的预测效果更优, 基于荧光发射光谱数据的PLSR模型具有较高的预测能力和较强的适应性, 可以快速、 准确的检测出水质COD。 通过和传统检测方法的效果对比可知, 该方法可用于检测有机污染物浓度较低的水体, 有机物浓度较高时采用该方法时检测误差会变大。 该研究为水质检测光学传感器的研发提供了一种新的设计思路。

关键词: 水质检测; 化学需氧量; 荧光; 发射光谱; 预测模型
中图分类号:O657.3 文献标志码:A
Detection of Chemical Oxygen Demand (COD) of Water Quality Based on Fluorescence Emission Spectra
ZHOU Kun-peng1, LIU Shuang-shuo1, CUI Jian1, ZHANG Hong-na1, BI Wei-hong2,*, TANG Wei2
1. College of Engineering, Inner Mongolia University for Nationalities, Tongliao 028000, China
2. School of Information Science and Engineering, The Key Laboratory for Special Fiber and Fiber Sensor of Hebei Province, Yanshan University, Qinhuangdao 066004, China
*Corresponding author
Abstract

The detection of parameters for water quality with spectral technique is a research hotspot at present. This paper proposes a method for the determination of chemical oxygen demand (COD) based on the fluorescence emission spectrum. Two groups of experimental samples are provided in the experiment, among which the fundamental group is 20 COD standard solutions, and the remaining 63 are actual water samples as the other group. Rapid digestion spectrophotometry is utilized to detect the COD of experimental samples. Three dimensional fluorescence spectrophotometer is used to collect the fluorescence emission spectra of the water samples at EX=275 nm (all the range of fluorescence emission spectra are EM=325450 nm), then the data of fluorescence emission spectra of two kinds of water samples are processed and modeled. Principal component regression (PCR) and partial least squares regression (PLSR) are utilized to establish the prediction models based on fluorescence emission data respectively, and the effects of the models are compared. In order to verify the feasibility of the proposed method and the prediction ability of the model, the results of the PLSR mode are compared with the standard method. The comparison results show that, for the COD standard solution, when the number of principal component of PLSR and PCR is 5 and 8 respectively, the optimal results are obtained for both models, of which the determination coefficients of the correction model areRPLS2=0.999 9 andRPCR2=0.989 7, respectively. The prediction error of validation set data in the calibration model is less than 10%, and the PLSR model is better than the PCR model. While for the actual water samples, when the number of principal component of PLSR and PCR is 6 and 7 respectively, the cross-validation effect of the correction model is the best. Among them, root mean square error of cross-validation of the PLSR method is RMSECVPLS=0.932 2 mg·L-1, while for the PCR algorithm, RMSECVPCR=0.976 4 mg·L-1. For the validation set, the determination coefficient of PLSR is 0.940 2, while for PCR method, it is 0.919 0. It shows that PLSR method has better prediction effect. Consequently, the PLSR model based on fluorescence emission spectrum data has high prediction ability and strong adaptability, which can detect water COD quickly and accurately. Through the comparison of the method proposed in this paper and the traditional detection, we can see that proposed method can be used to detect the water with low concentration of organic pollutants, however, the detection error will increase if the concentration of organic pollutants in the detected water is high. This paper providesa new design idea for the research and development of water quality detection optical sensor.

Keyword: Water quality detection; Chemical oxygen demand(COD); Fluorescence spectrum; Emission spectra; Prediction model
引 言

光谱分析方法因其具有快速、 绿色、 无损等诸多优点, 已在多领域得到广泛的应用, 如食品[1]、 医药卫生[2]、 生命安全[3]、 环境监测[4]等, 基于光谱法的水质参数检测技术[5, 6]也是其典型应用, 如紫外-可见(UV-Vis)吸收光谱法[7]、 近红外(NIR)光谱法[8]和荧光(fluorescence)光谱法[9]等。 其中, UV-Vis方法最为常见, 采用NIR法检测水质还处于实验室研究阶段, 而荧光法目前主要用于检测水体中的溶解有机物(DOM)。

通过采集水样的荧光发射光谱, 结合相关的化学计量学算法对水样的COD浓度值进行分析, 最终得出了基于荧光发射光谱对水质COD检测的方法, 该方法检测速度快、 绿色环保、 无二次污染, 具有较强的应用价值。

1 实验部分
1.1 样本

实验样本分为COD标准溶液和实际水样两类。 其中, 不同浓度的COD标准溶液20份, 其最低浓度为2.5 mg· L-1, 最高浓度为100 mg· L-1; 另在不同的区域采集实际水样63份, 实际水样均取自湖泊、 河流等地表水源, 采集实际水样后在室温下静置30分钟, 取上层液体进行实验。

1.2 仪器

荧光光谱采集设备采用日本Hitachi公司的F-7000型荧光分光光度计, 其分辨率可达1 nm, 波长准确度为± 1 nm, 狭缝(光谱通带)为120 nm, 其采用的色散单元为光栅, 光源为150 W的氙灯。 实际水样的化学需氧量采用DRB200消解器和DR6000分光光度计(HACH公司, 美国)进行标准化测量。

1.3 方法

1.3.1 荧光光谱的采集与处理

将F-7000荧光光谱仪的光电倍增管电压设置为700 V, 以5 nm为采样间隔在200400 nm的激发波长(EX)范围内采集荧光发射光谱, 发射光谱范围为EM=220600 nm, 间隔为2 nm。

由于三维荧光采集过程中存在比较强的散射峰(主要为瑞利散射和拉曼散射), 对特征峰会造成干扰, 必须去除以提高检测精度、 减小误差[10]。 某实际水样去除散射峰后的三维荧光光谱图如图1所示。

图1 某实际水样去散射后的三维荧光光谱图Fig.1 EEMs of a real water sample after removal of scattering

去除干扰峰后发现, 在EX=275 nm激发波长处的荧光发射光谱变化最为明显, 275/350 nm的激发/发射波长对所对应的特征峰的荧光强度最强。 因此将每组实验样本的三维光谱数据在EX=275 nm处进行荧光发射光谱的提取, 得到一组基于发射荧光(发射波长-荧光强度)光谱数据。 为了保证光谱数据的准确性, 在光谱采集过程中将每一份实验样本采集三次光谱求均值后得到最终光谱数据进行数学模型的建立。

1.3.2 实际水样COD的理化值测量

为提高实际水样化学需氧量检测的准确性, 减小检测误差, 采用快速消解分光光度法测量时将包括参比试剂在内的各水样进行平行双样测量。 测量完成后, 将各测量结果求均值后作为最终检测值。 经测定, 在实验室环境下得到63份实验水样的COD理化值的范围为0.6444.5 mg· L-1

1.4 数学模型的建立和验证

对于COD标准液样本和实际水样的荧光发射光谱数据进行建模时, 均采用基于PCR算法和PLS算法对水质COD浓度进行定量建模, 为了验证建模方法的有效性和准确性, 对实验样本进行如下处理:

(1)在20组COD标准液的荧光光谱数据中随机抽取15组作为校正集数据建立模型, 其余5组数据作为检验集数据对校正模型的准确性进行验证。

(2)在63组水样的荧光光谱数据中随机抽取48组作为校正集数据, 剩余15组作为检验集数据。

(3)两类实验样本的荧光发射光谱范围均为325450 nm。

2 结果与讨论
2.1 COD标准液光谱的模型建立

分别对COD标准液的荧光发射光谱的校正集数据基于PCR算法和PLSR算法建立模型。 经比较, PCR算法和PLSR算法的主成分数分别取8和5时, 两类模型的效果最优。 建模结果如图2所示, 图中R2为决定系数(又称拟合优度), 其决定了相关的密切程度。

图2 COD标准液数据的PCR和PLSR建模结果Fig.2 Modeling results of PCR and PLSR for COD standard solution data

由图2可看出, COD标准液校正集数据的PCR与PLSR模型的R2分别为: RPCR2=0.989 7和 RPLS2=0.999 9。 将检验集数据代入校正模型进行检验, 得到的预测结果如表1所示。

表1 COD标准液的预测值对比 Table 1 Comparison of prediction results of COD standard solution

表1可知, 检验集样本COD值的取值范围为7.590 mg· L-1, 且基于PCR和PLSR方法处理的数据结果误差都不超过10%, 因此两种建模方法均能较好的对COD标准液的荧光发射光谱数据进行模型的建立, 且PLS法处理的数据所建立的模型更加精确。 经过重复性实验验证, 个别预测结果误差较大的原因是由于配制标准溶液过程中引入了误差, 或在采集样品光谱时比色皿表面洁净程度不同而引入了误差。

2.2 实际水样光谱的模型建立

由于实际水样的组分较为复杂, 因此得到的光谱数据也存在不少干扰。 先采用S-G平滑处理算法将提取出的实际水样的荧光发射光谱数据进行平滑处理, 处理后的谱线变得平滑但不改变谱线的整体变化趋势。 平滑处理后, 将校正集数据进行PCR和PLSR建模, 确定主成分数的方法采用的是目前在诸多方法中最常用的预测残差平方和(PRESS)的方法, PRESS越小, 所得的模型的预测能力越好。 PCR和PLSR算法的主成分数/隐含变量和PRESS的关系如图3所示。

图3 PRESS与主成分数/隐含变量的关系Fig.3 The relationship between PRESS and principal component/latent variable

由图3可知, 两种算法的主成分(PC)数目均设为110, 对于PLSR方法而言, PRESS在达到最低后又开始上升, 且在主成分数为6时达到了最小值。 表明了此后加入的主成分是与样品无关的噪声主成分, 使得模型产生了过拟合, 从而使模型的预测能力变弱。

通过比较确定PLS与PCR的主成分数分别为6和7。 在此基础上所得校正模型的效果如图4所示, 采用交叉验证方法对校正模型进行预测效果的检验。

图4 实际水样光谱数据的PCR和PLSR模型效果对比Fig.4 Comparison of PCR and PLSR modeling results of actual water samples spectral data

由图4可以看出, 两种方法预测的结果与真实值均有着很好的相关性。 对于校正集数据而言, 在交叉验证过程中, PCR法和PLSR法的校正集决定系数分别为 RPCR2=0.933 2和 RPLS2=0.976 4。 因此PLSR方法得到的预测值更加集中, 更接近于真实值。 显然, PLSR法要比PCR法更加精确。

有一小部分预测值远离真实值, 说明荧光光谱的采集过程中引入了一定的误差。 此外, 实际水样COD理化值检测过程中也可能引入误差, 从而造成化学测量值与实际值之间出现较大的偏差。

为了验证模型效果, 将检验集的15组荧光发射光谱数据分别代入两模型中进行预测检验, 得到的基于PCR和PLSR模型的实际水样COD的预测值如表2所示。

表2 实际水样的检验集COD预测结果 Table 2 Results of predicted COD values of actual water samples

PCR模型的预测均方根误差为RMSEPPCR=3.520 4 mg· L-1, PLSR预测均方根误差为RMSEPPLS=2.092 2 mg· L-1。 对比两算法所得RMSEP的值可看出PLS法得到的模型要优于PCR法得到的模型。 其中, PCR法的决定系数 RPCR2=0.919 0, 而PLSR算法的决定系数 RPLS2=0.940 2。 预测结果如图5所示。

图5 实际水样检验集的预测结果Fig.5 Prediction results of validationdata of actual water samples

2.3 本方法与传统方法的检测效果对比

为了检验本研究所建模型的预测效果, 重新配制COD标准溶液和采集地表水样本, 实验室环境下分别采用标准方法和实际水样的PLSR模型对实验水样的COD进行检测, 进而得到水质COD标准化验值和荧光发射光谱数据的PLSR模型预测分析值的比较结果, 如表3所示。

表3 本方法与传统方法的检测效果对比 Table 3 Comparison between the presented method and the traditional method

表3可知, 基于荧光发射光谱预测模型所得的水质COD预测值与标准方法所得化验值相比能较好的反映出各水样COD的变化情况。 对于COD标准溶液样本, 预测值的相对误差稍大, 原因为预测模型选用的是基于实际水样的荧光发射光谱数据的PLSR模型, 而相对于实际水样, 标准液水样所含物质单一, 采集到的谱线变化规律可能不同于实际水样的谱线变化规律, 因此在预测过程中可能出现预测误差稍大的现象。

此外, 对于COD浓度为400 mg· L-1的标准溶液而言, 预测值出现了较大的偏差, 这是由于标准溶液的浓度效应导致了荧光强度降低, 使得荧光强度值与实验水样的COD浓度值不再呈现线性关系。 对于实际水样来说, 预测值可以较好的反映出水质COD的变化情况, 且与标准理化值相比具有相对误差较小, 这说明基于荧光发射光谱数据所建PLSR模型具有较好的预测能力。

基于荧光发射光谱数据的PLSR模型具有较高的预测能力和较强的适应性, 可以快速、 准确的检测出水质COD。

3 结 论

分别以COD标准溶液和实际水样为研究对象, 分别建立和验证了基于单激发波长下荧光发射光谱数据的PCR和PLSR模型, 针对特定水样, 将不同模型的预测效果进行了对比。 得到如下结论:

(1)通过实验证明了PCR和PLSR方法用于建立水质COD的荧光发射光谱数据模型的可行性; 表明两类模型均可以合理表征荧光强度与水质COD浓度之间的关系, 且PLSR模型的预测效果更优。

(2)本方法可用于检测有机污染物浓度较低的水体, 有机物浓度较高时采用本文方法时检测误差会变大。

(3)本方法利用特定激发波长下的荧光发射光谱进行COD分析, 较三维荧光光谱(EEM)更加简单易行, 可为水质COD的光学分析方法提供一种新的思路。

(4)实际水体组分和所处环境复杂, 对建模型的适应性、 水体含有荧光敏感物质时及荧光光谱受水体环境影响对预测模型干扰有待进一步探讨。

参考文献
[1] ZHU Yi-ning, YANG Ping, YANG Xin-yan, et al(朱毅宁, 杨平, 杨新艳, ). Chinese Journal of Analytical Chemistry(分析化学), 2017, 45(3): 336. [本文引用:1]
[2] Kumar A, Jain S K. Analytical Chemistry Letters, 2016, 6(6): 894. [本文引用:1]
[3] Liu Rongxia, Chen Liangliang, Zhang Hongyan, et al. Optoelectronics Letters, 2013, 9(3): 225. [本文引用:1]
[4] Dong Ming, Sui Yue, Li Guolin, et al. Optoelectronics Letters, 2015, 11(6): 469. [本文引用:1]
[5] CHEN Ying, DI Yuan-jian, TANG Xin-liang, et al(陈颖, 邸远见, 唐心亮, ). Spectroscopy and Spectral Analysis(光谱学与光谱分析), 2019, 39(7): 2176. [本文引用:1]
[6] ZHAO Xian-de, CHEN Xiao, DONG Da-ming(赵贤德, 陈肖, 董大明). Spectroscopy and Spectral Analysis(光谱学与光谱分析), 2019, 39(9): 2907. [本文引用:1]
[7] WU De-cao, WEI Biao, TANG Ge, et al(吴德操, 魏彪, 汤戈, ). Acta Optica Sinica(光学学报), 2017, 37(2): 0230007. [本文引用:1]
[8] Dahlbacka J, Nyström J, Mossing T, et al. Spectral Analysis Reviews, 2014, 2(4): 19. [本文引用:1]
[9] Zheng Hao, Yan Zhishen, Chen Jianfang, et al. Sustainability, 2018, 10(5): 1444. [本文引用:1]
[10] Zepp R G, Sheldon W M, Moran M A. Marine Chemistry, 2004, 89(1): 15. [本文引用:1]