作者简介: 周昆鹏, 1983年生, 内蒙古民族大学物理与电子信息学院讲师 e-mail: kunpeng032@126.com
为了对水中的有机污染物进行绿色、 快速、 准确的检测, 提出了一种基于荧光多光谱融合的水质化学需氧量(Chemical Oxygen Demand, COD)的检测方法。 实验样本为包含近岸海水和地表水在内的实际水样53份, 采用标准化学方法获取样本的化学需氧量的理化值, 利用荧光分光光度计采集样本的三维荧光光谱并对光谱数据进行处理和建模。 在200~300 nm(间隔5 nm)的激发波长范围内将三维光谱展开成二维的发射光谱(发射波长范围250~500 nm, 间隔2 nm)。 采用ACO-iPLS(蚁群-区间偏最小二乘)算法提取发射光谱特征, PSO-LSSVM(粒子群优化的最小二乘支持向量机)算法建立预测模型, 分别建立了单激发波长下的荧光发射光谱数据预测模型、 多激发波长下发射光谱的数据级融合(LLDF)预测模型以及多激发波长下发射光谱的特征级融合(MLDF)预测模型, 通过对预测效果的对比, 得出结论。 实验结果表明, 对于不同激发波长下荧光发射光谱数据而言, 265 nm激发光作用下的发射谱数据的预测模型最优, 其检验集决定系数
To conduct green, rapid and accurate detection of organic pollutants in water, the current paper proposes a detection method of Chemical Oxygen Demand (COD) based on fluorescence multi-spectral fusion. The experimental samples consist of 53 actual water samples including inshore seawater and surface water. The physicochemical valuesof COD of the samples are obtained by standard chemical methods. A fluorescence spectrophotometer is used to collect the three-dimensional fluorescence spectra of the samples, and the spectral data are processed and modeled. The three-dimensional fluorescence spectrum is spread at the excitation wavelength in the excitation wavelength range of 200~330 nm and the emission wavelength range of 250~500 nm, with excitation wavelength interval being 5 nm, and the emission wavelength interval 2 nm. With the ant colony optimization-interval partial least squares (ACO-iPLS) as the feature extraction algorithm and the least squares support vector machine algorithm optimized by particle swarm optimization (PSO-LSSVM) as the modeling method, the prediction model of fluorescence emission spectral data at a single excitation wavelength, the fluorescence multi-spectral data-level fusion (Low-Level Data Fusion, LLDF) model and the fluorescence multi-spectral feature-level fusion (Mid-Level Data Fusion, MLDF) model are built respectively, and the prediction effects of various models are compared. The results show that there exist some differences in the prediction effect of the models for the fluorescence emission spectrum data at different excitation wavelengths. The prediction model of the fluorescence emission spectrum data at the excitation wavelength of 265 nm is optimal, with determinant coefficient (
光谱分析技术具有快速、 灵敏等优点[1, 2], 随着科技的进步, 该技术在很多领域均得到广泛的应用[3, 4, 5]。 将光谱技术用于检测水质化学需氧量(chemical oxygen demand, COD)具有检测快速、 绿色无污染和重现性好的特点, 在水质参数检测应用方面具有很强的发展潜力。 紫外-可见光谱(UV-Vis)法是目前分析水质参数时最常用的一种光谱学分析方法[6]。 此外, 基于近红外光谱(NIR)和荧光光谱(Fluorescence)分析水质参数的方法也有报道[7, 8, 9]。 也有研究者采用两种不同类别光谱融合的方法对不同水质的有机污染物指标进行检测[10, 11], 但检测结果均不理想。
本文利用实际水样的荧光光谱对其水质化学需氧量进行分析, 建立了基于荧光发射光谱的单光谱数据模型和多光谱信息融合模型, 并对各方法所得到的水质COD预测模型进行了模型效果对比, 进一步得到了基于荧光多光谱信息融合技术检测水质COD的新方法。
所用实验样本分为地表水和近岸海水2类, 共53份。 其中, 地表水样本31份, 分批采集于河北省秦皇岛市的天然河流和人工湖等地; 海水样本22分, 采集地为秦皇岛市的渤海近岸海域和入海口。 对水样检测前需先静置30 min后提取静置后的水样上层液体, 取出的水样上层液体分为两部分, 一部分进行三维荧光光谱的采集, 另一部分对其COD的理化值进行测量。 三维荧光光谱利用日本Hitachi公司的F-7000型荧光分光光度计采集得到, 地表水的COD理化值测量采用美国HACH公司的相关设备(消解器型号: DRB-200型, 分光光度计型号: DR-6000)检测得到, 海水COD理化值的测量采用碱式高锰酸钾滴定法得到。
1.2.1 荧光光谱的采集与处理
荧光光谱采集时, 激发光的波长在200~400 nm范围内, 间隔为5 nm, 发射光设置在220~600 nm范围内采集, 采样间隔设置为2 nm。 三维荧光光谱的采集过程中会出现瑞利散射和拉曼散射, 这会影响数据的可靠性, 本文采用Delaunay三角内插值法[12]对原始的三维荧光光谱数据进行处理, 以去除相关的散射峰。 散射峰去除前后的效果如图1所示。
![]() | 图1 Delaunay插值法去除荧光散射峰前后的效果 (a): 去除散射前的效果图; (b): 去除散射后的效果图Fig.1 The effect of removing the fluorescence scattering peaks before (a) and after (b) by Delaunay interpolation |
由三维荧光光谱图确定有效的激发光波长在200~330 nm(间隔5 nm)范围内, 发射波长范围为250~500 nm(间隔2 nm), 将每组三维荧光光谱数据在有效的激发波长范围内展开, 得到一个3 402维的二维向量, 截取有效激发波长下的发射光谱数据用于光谱特征的提取和预测模型的建立。
1.2.2 水样COD的理化值测量
海水样品的水质COD测量采用碱式高锰酸钾滴定法(GB17378.4— 2007)在实验室内进行; 地表水样品的水质COD测量采用快速消解分光光度法, 消解水样时, 消解器温度设置为150 ℃, 消解时间设置为120 min。 两种方法均为标准方法, 为了减小测量误差, 采用这两种方法检测水样的COD值时, 均须取平行双样同时进行检测, 且与空白(参比)试液进行对比检测, 取两个检测值的平均值作为最终结果。
经标准方法测定, 在实验室环境下得到53份实验水样的COD理化值的范围为0.64~44.5 mg· L-1。
对实际水样的荧光光谱数据进行建模时, 采用ACO-iPLS算法进行特征光谱提取, 采用PSO-LSSVM算法进行建模。 ACO-iPLS算法是基于蚁群算法的波长优选方法, 能有效地防止算法在收敛时出现局部最优解的情况发生; PSO-LSSVM算法具有全局搜索能力和小样本学习能力强的特点, 而且计算过程简单, 收敛速度快。 ACO-iPLS算法和PSO-LSSVM算法的联合使用, 可以提高所建模型的泛化能力。
对于采集的53份水样的荧光光谱数据, 随机分为2组, 一组作为校正集数据, 另一组作为检验集数据。 校正集数据的作用是建立准确的训练模型, 为了提高校正模型的准确性, 选择37份水样作为校正集样本; 其余的16份水样(海水、 地表水样本各8份)作为检验集样本, 其数据对校正集数据所建模型的预测性能进行实际检验。
本文所用实验水样的荧光发射光谱数据建模后共得到23组结果, 限于篇幅, 这里只给出部分结果, 如表1所示。 表1中,
![]() | 表1 实验水样的部分建模结果 Table 1 Partial modeling results of water samples |
由表1可知, 对于校正集而言, Ex=230 nm时的模型最优, 其决定系数
信息融合的方式有数据级融合、 特征级融合和决策级融合三个层次, 其融合级别由低到高, 本文采用前两种融合方式, 即数据级融合(LLDF)和特征级融合(MLDF)方式对实验水样的荧光发射光谱进行分析。
2.2.1 多激发波长下的发射光谱LLDF建模
对照表1中实验水样荧光光谱数据的建模结果, 综合分析, 选择出10个不同波长的激发光作用下的荧光发射光谱进行LLDF建模, 荧光多光谱数据级融合模型(简写为LLDF-PSO-LSSVM)的部分建模结果如表2所示, 表2中评价指标的定义同表1。
![]() | 表2 水样荧光的LLDF建模结果(部分) Table 2 LLDF modeling results of water samples (Partial) |
表2显示, 激发光波长分别在Ex=235, 265和290 nm处发射光谱的LLDF-PSO-LSSVM模型检验集的预测效果最优, 其
2.2.2 多激发波长下的发射光谱MLDF建模
为了与LLDF-PSO-LSSVM的结果进行对比, 选择与2.2.1节中相同激发/发射光谱数据, 且激发波长Ex的组合方式也相同, 在此基础上, 对所选数据进行MLDF建模, 部分建模结果如表3所示。
![]() | 表3 水样荧光的MLDF建模结果(部分) Table 3 MLDF modeling results of water samples (Partial) |
表3显示, 激发光波长分别在Ex=265, 290和305 nm处的荧光多光谱特征级融合模型(简写为MLDF-PSO-LSSVM)检验集的预测效果最优, 其
为比较各模型的预测效果, 将各方法所得最优模型的评价指标进行对比, 不同方法所得最优模型的评价指标如表4所示。
![]() | 表4 各建模方法所得最优模型的建模效果 Table 4 Modeling results of optimal models built by different modeling methods |
对比三种不同建模方法的效果可知: 本文所采用的基于荧光多光谱融合的MLDF-PSO-LSSVM模型具有最优的预测效果, 其校正集和检验集的模型效果如图2所示。
为了检验本研究的最优模型的预测效果, 重新采集近岸海水和地表水样本, 在实验室环境下分别采用标准方法和最优荧光多光谱融合法对新采集水样的COD进行检测, 进而得到水质COD标准化验值和荧光多光谱特征级融合预测分析值的比较结果, 如表5所示。
![]() | 表5 本文方法与传统方法的检测效果对比 Table 5 Comparison between the presented method and the traditional method |
由表5可知, 基于荧光多光谱特征级融合预测所得的水质COD分析值与标准法的化验值相比能很好的反映出各水样COD的变化情况, 且能够很好的逼近标准方法检测所得的化验值, 相对误差较小, 反映出本文方法的准确性。 海水的检测相对误差较大的原因可能是由于海水的复杂组分对荧光光谱造成了干扰。
总之, 基于荧光多光谱融合模型具有较高的预测能力和较强的通用性, 可以快速、 准确的检测出各类水样的水质COD。
以实际水样的水质COD为对象, 通过建立基于荧光发射光谱数据的单激发波长下的荧光光谱的PSO-LSSVM模型、 多激发波长下荧光光谱的LLDF-PSO-LSSVM模型和多激发波长下荧光光谱的MLDF-PSO-LSSVM模型, 通过各类模型预测效果的对比可知, 采用多种激发光作用下的荧光发射光谱的MLDF模型的效果最优, 表明对于水质COD的检测来说, 多激发波长下的荧光发射谱数据的特征级融合模型预测水质COD更加准确。 同时, 采用荧光数据进行建模, 分析方法可行性强, 最优模型的预测效果优秀, 可作为一种新型的检测水质化学需氧量的有效解决方法。 由于实验过程中的采集水样类型较少, 水样采集地点所处地域距离较近, 因此本方法所得最优模型的适应能力有待进一步提高, 后续工作拟针对不同地区不同种类的水样进行荧光光谱数据建模, 以提高模型检测不同类型水体的适应性; 本研究是在实验室环境下完成的, 而实际水体中所含的物质及水体所处的环境较为复杂, 水样本身含有荧光敏感物质时及荧光光谱受水体环境影响所带来的干扰有待进一步探讨。
The authors have declared that no competing interests exist.
[1] |
|
[2] |
|
[3] |
|
[4] |
|
[5] |
|
[6] |
|
[7] |
|
[8] |
|
[9] |
|
[10] |
|
[11] |
|
[12] |
|