基于群智能优化多分类器的DOM组分检测研究
付丽辉1, 戴峻峰2,*, 王晓燕2
1. 淮阴工学院自动化学院, 江苏 淮安 223003
2. 淮阴工学院电子信息工程学院, 江苏 淮安 223003
*通讯作者 e-mail: djf0495_cn@163.com

作者简介: 付丽辉, 女, 1975年生, 淮阴工学院自动化学院副教授 e-mail: flh3650326@163.com

摘要

可溶解有机物(DOM)是影响生态环境和居民生活安全的重要因素之一。 当DOM总量达到一定水平时, 将通过水体富营养化引致藻类爆发式生长, 使得DOM成分更为复杂、 影响更为严峻。 常见的DOM检测方法虽然可以对DOM进行定性分析, 但对于DOM组分的测定一直存在瓶颈, 单传感器难以完成对水体DOM总量与组分的复杂性测试。 提出基于等离子共振传感器(SPR)的交叉敏感性的DOM测试方案。 利用群智能算法(PSO)训练的BP神经网络(BP), 构建三个分类器。 利用多模光纤, 镀以55~85 nm的7种不同厚度的金膜, 构成具有不同最佳折射率测量值的SPR传感探头, 使各传感探头的最佳折射率测量值有效分布在1.33~1.43 RIU范围内, 保证每个传感头在最佳测量区间内具有较好的灵敏度、 线性度, 在其他传感头对应的测量区间内, 通过波长、 谱宽和光强的变化, 有着尽可能敏感的交叉响应。 结合基于PSO-BP的三分类器的智能算法, 通过对DOM的水样制备、 DOM成分的测定、 折射率的测量、 SPR效应的测量、 人工智能网络的训练、 验证等实验步骤, 实现对被测样本的SPR效应的共振波长、 谱宽和光强的综合训练, 从而完成对里运河(A)、 洪泽湖(B)、 公园景观湖(C)、 校园景观湖(D)四种被测水体的五种DOM组分(酪氨酸类蛋白质、 色氨酸类蛋白质、 富里酸、 溶解性微生物代谢产物、 腐殖酸)浓度的有效预测。 对四种不同被测水体(A、 B、 C、 D)DOM组分浓度的最高预测率分别为81.2%(酪氨酸)、 85%(色氨酸)、 82%(色氨酸)、 82.6%(色氨酸)。 考察了响应参数及分类器个数对预测效果的影响, 结果表明, 与双分类器和单分类器相比较, 三分类器的预测效果最好, 对综合水样的五种不同DOM组分浓度的预测正确率分别为81.5%、 84%、 81%、 82%、 68.3%, 验证了PSO-BP的多分类器及光纤SPR传感器在DOM组分预测中的正确性及可行性。

关键词: 多分类器; 光纤等离子共振传感器; 可溶性有机物组分检测; BP神经网络; PSO算法
中图分类号:TP212 文献标志码:A
Research on DOM Component Detection Based on Multiple Classifiers Optimized by Swarm Intelligence Algorithm
FU Li-hui1, DAI Jun-feng2,*, WANG Xiao-yan2
1. Faculty of Automation, Huaiyin Institute of Technology, Huai'an 223003, China
2. Faculty of Electronic Information Engineering, Huaiyin Institute of Technology, Huai'an 223003, China
*Corresponding author
Abstract

Dissolved organic matter (DOM) is one of the important factors affecting the ecological environment and the safety of residents' lives. When the total amount of DOM reaches a certain level, it will lead to the explosive growth of algae through water eutrophication, which makes the DOM composition more complex and the impact more severe. Although the standard detection methods can qualitatively analyze DOM, there are always bottlenecks in determining DOM components, and it is difficult for a single sensor to complete the complicated test of the total amount and components of DOM in water. Therefore, a DOM test scheme is proposed based on the cross-sensitivity between SPR (Surface Plasmon Resonance, SPR) sensors. Three classifiers are constructed using the BP (Back Propagation, BP) neural network trained by the swarm intelligence algorithm (Particle Swarm Optimization, PSO). The multi-mode fibers are coated with seven kinds of gold films with different thicknesses of 55~85 nm to form the SPR sensing probes with different optimal refractive index measurements to ensure the best refractive index measurement value of each sensing probe is effectively distributed in the range of 1.33~1.43 RIU, and each sensing probe has good sensitivity and linearity in the best measurement range. In the measurement range corresponding to other sensing probes, there are cross-responses as sensitive as possible through the change of wavelength, spectral width and light intensity. Finally, combined with the intelligent algorithm based on three classifiers of PSO-BP, through the experimental steps of water sample preparation of DOM, determination of DOM composition, measurement of refractive index and SPR effect, training and verification of artificial intelligence network, to realize the comprehensive training of the resonance wavelength, spectral width and light intensity of SPR effect on the measured samples. Thus, five DOM components (tyrosine proteins, tryptophan proteins, fulvic acid, soluble microbial metabolites, humic acids) of the inner canal(A), Hongze Lake (B), Park Landscape Lake (C) and campus landscape Lake (D) and their concentrations are effectively tested. Among them, the highest prediction rate for the concentration of DOM components in four different water bodies (A, B, C, D) is 81.2% (tyrosine), 85% (Tryptophan), 82% (Tryptophan), and 82.6% (Tryptophan), respectively. At the same time, the influence of the response parameters and the number of classifiers on the prediction effect is investigated, and the results show that the three classifiers have the best prediction effect compared with the two classifiers and the single classifier. The prediction accuracy of five different DOM component concentrations in mixed water sample can reach 81.5%, 84%, 81%, 82%, and 68.3%, respectively, to verify the correctness and feasibility of the multi-classifiers based on PSO-BP and fiber SPR sensor in DOM components prediction.

Keyword: Multiple classifiers; Fiber SPR sensor; DOM component detection; BP network; PSO algorithm
引言

可溶解有机物(dissolved organic matter, DOM)[1, 2]是一类具有复杂组成、 结构和环境行为的有机混合物, 包括一切溶解于水的有机化合物, 通常指能通过0.45 μ m滤膜的溶解于水、 酸或碱溶液中的异质碳氢混合物。 在不同的水污染物中, DOM的不良影响尤为突出。 过高浓度的DOM是造成的水体富营养化的重要因素之一[1, 2], 不仅通过水藻的爆发式生长、 死亡、 降解等过程释放毒素, 还通过对水体生物、 化学需氧量等参数的影响, 再经一系列复杂且多变的生化过程影响水体的自洁能力, 加速水质的劣化[3]。 对于DOM组份的划分[4], 若按照成分, 可分为亲水性和疏水性组分; 若按照分子量大小来划分, 又可分为脂肪酸、 氨基酸等分子量较小成分以及富里酸、 胡敏酸等分子量较大组分; 若按照荧光特性, 还可以分为腐殖酸、 色氨酸、 酪氨酸等组分。

目前, 水体DOM检测方法主要包括电化学法[5], 吸收光谱法、 荧光光谱法[6, 7]和生物检测法[8]等。 其中, 电化学方法[5]是目前最常见的DOM测定方法, 其优点是测量结果较为准确, 主要弊端是较难反映DOM的组分和相对含量, 且会在测试过程中引入化学物质, 从而导致测量精度下降。 吸收光谱法、 荧光光谱法[6, 7]均属于基于光学技术的物理测量方法。 该方法摒弃了电化学法中的化学预处理, 测量速度快且有较好的测量效果, 缺点是除了需要大型的试验仪器外, 还存在基于荧光的强度掩蔽效应, 导致无法区分DOM的相似组分的荧光信号。 生物检测法[8]一般需要较长时间的生物种类与敏感性状筛选, 测量周期较长、 过程复杂, 一般用于定性分析较多, 在DOM组分分析中的作用明显不足。 以上这些常见方法虽然可以对DOM进行定性分析, 完成DOM总量的测定, 但对DOM组分的测定一直都存在瓶颈。 相关研究表明[4], DOM的影响不仅与其总量有关, 还与其组分有关, 在表征水体质量的指标体系中, DOM总量与成分的辨识具有突出地位。 但是, 影响DOM组分分布的来源众多, 利用单一响应的传感器无法测定各种DOM组分所占的比例。 工作中将适合于辨识不同成分信息的电子舌(electronic tongue, ET)方法[9]应用于DOM组分的测试过程中, 通过将光纤等离子共振传感器(surface plasmon resonance, SPR)镀以55~85 nm的7种不同厚度的金膜来构建传感阵列, 使其对不同的DOM组分产生类似味蕾的交叉敏感性响应, 再利用群智能算法(particle swarm optimization, PSO)训练BP神经网络(back propagation, BP), 构建多分类器, 提取待测量变化的响应信息, 实现对DOM组分的有效预测, 从而为群智能优化的多分类器在DOM组分检测中的应用提供依据及新的思路。

1 实验部分
1.1 样品采集

与商品化人工合成有机物不同, DOM组份没有标准化工业产品, 为了保证所提出的检测方法具有普适性, 选择四种不同的自然环境水体作为被测对象, 具体为淮安市里运河水、 洪泽湖水、 淮安市区景观湖水和校园人工湖水, 这四种水可以作为不同污染程度的水体代表。 洪泽湖水和运河水体最具有代表性, 另两种用于对比的被测水体分别采集于淮安市钵池山公园湖和淮阴工学院校园湖。

(1)洪泽湖(北纬33° 06'— 33° 40', 东经118° 10'— 118° 52'), 位于江苏省北部的淮安市和宿迁市。 洪泽湖位于淮河和沂河的中下游, 是中国的第四大淡水湖, 长60 km, 最宽为58 km, 最深水位为4.75 m;

(2)京杭大运河是世界上最长的古运河, 全长1 794 km, 南起杭州, 北至北京。 淮安市杨庄至扬州市长江六尾口段称里运河, 全长18.94 km。

1.2 样品制备

对所采集的各类水样, 用预先灼烧过的0.22 μ m滤膜进行过滤。 将所得滤液分为两部分: 一部分直接存放于棕色玻璃瓶中, 在4 ℃下保存备用, 另一部分置于敞口棕色玻璃瓶, 在洁净避光的房间及室温下通过自然蒸发浓缩。 避光、 室温旨在避免浓缩过程中发生化学反应, 而破坏各样品DOM组分的相对含量。 针对浓缩后的样品, 再次用灼烧后的0.22 μ m滤膜进行过滤, 所得滤液存放于棕色玻璃瓶中, 并于4 ℃下保存备用。 浓缩后的四种水样, 以A、 B、 C、 D标识分组, 对各组水样, 视各浓缩液为“ 纯净” 溶液, 以去离子水为溶剂, 以2%的浓度步长, 配制成50种不同浓度的水样, 编号为A-50、 B-50、 C-50、 D-50, 作为训练组样品, 相应测量数据用于多分类器的训练。 以3%的浓度步长, 配制34种不同浓度水样, 编号为a-34、 b-34、 c-34、 d-34, 作为验证样品, 用以验证多分类器训练结果。

1.3 DOM成分测定

通过三维荧光谱测量确定水样中DOM组分和相对含量。 应用日立F-7000型荧光分光光度计进行样品的三维荧光光谱测量。 分光光度计参数: 发射波长(Em)为280~550 nm, 狭缝宽度为5 nm, 激发波长(Ex)为200~550 nm, 狭缝宽度为5 nm, 扫描速度为2 400 nm· min-1。 按连续激发波长/发射波长对应关系, 将荧光光谱分为五个区域[10], 如表1

表1 DOM三维荧光光谱与常见物质的对应关系 Table 1 Correspondence between DOM three-dimensional fluorescence spectrum and common substances

在获得任意样品水的三维荧光光谱数据后, 根据三维荧光谱图中的激发波长、 发射波长, 对照三维荧光谱区域积分法的区域划分[10], 计算样品中的DOM组分。 首先, 按照式(1)和式(2)求取样品三维荧光光谱的特定区域标准体积和整体标准体积参数(即Φ i, nΦ T, n)

Φi, n=MFiexemI(λex, λem)ΔλexΔλem(1)

${{\Phi }_{T, n}}=\overset{5}{\mathop{\underset{i=1}{\mathop \sum }\,}}\,{{\Phi }_{i, n}}$(2)

则各组分Pi, n表示为

Pi, n=Φi, n/ΦT, n×100%(3)

式(1)— 式(3)中, Δ λ ex, Δ λ em分别为激发光和对应荧光的波长间隔; I(λ ex, λ em)为不同激发波长对应的荧光的强度; Pi, n为不同种类荧光物质的相对含量; MFi为倍乘系数(区域Ⅰ 为20.4, 区域Ⅱ 为16.4, 区域Ⅲ 为4.81, 区域Ⅳ 为8.76, 区域Ⅴ 为1.76)。 最后获得四种水样品DOM组分的相对含量, 如表2

表2 基于区域积分法的四种样品DOM组分的相对含量 Table 2 Relative content of DOM in four samples based on region integration method
1.4 光纤SPR传感阵列的实现

首先, 选择七个传感器构成传感阵列。 通过控制所镀金膜的厚度, 使得每个传感器的最佳折射率测量值有效地分布在待测折射率1.33~1.43 RIU范围内。 其次, 选择多模光纤实现SPR传感器, 虽然多模光纤在点测量中的性能相对较差, 但在偏离最佳测量点区域的交叉灵敏度信息更丰富[11]。 根据水质测量对象的折射率变化范围, 以DOM组分测量为目的光纤SPR传感阵列需要在1.33~1.43 RIU(refractive index unit, RIU)范围内具有较好的测量灵敏度和线性度。 选择多模光纤镀以不同厚度的金膜, 构成具有不同最佳折射率测量值的SPR传感探头。 设计中, 主要考虑各传感探头所对应的最佳折射率测量点, 通过所镀金薄膜厚度的控制, 使得各传感探头的最佳测量折射率尽可能均匀地分布于被测折射率区间内(1.33~1.43 RIU), 同时, 每个传感探头在自己的最佳测量区间具有较好的灵敏度、 线性度, 在其他传感探头对应的测量区间内, 通过波长、 谱宽和光强的变化有尽可能敏感的交叉响应。 最终确定7个不同膜厚的多模光纤SPR传感探头, 如表3

表3 各传感探头的膜厚与谐振特性指标 Table 3 Film thickness and resonance characteristic index of each sensing probe

在光纤SPR探头制备过程中, 选用芯区直径为600 nm, 数值孔径为0.3, 纤芯折射率为1.468 RIU的多模石英光纤为实验对象。 光纤包层通过氢氟酸腐蚀剥离, 利用真空磁溅射仪(JSD560-V)制备金膜, 传感区长度取15 mm, 金薄膜厚度取55~85 nm, 如表3, 每个光纤探头均设计为终端反射型。

1.5 水样SPR效应的测量

由于探头较多且测试数据较大, 为了简化实验过程, 采用开环结构完成对被测水样SPR效应的测量, 具体实验平台如图1。 实验中, 七个SPR传感探头共享耦合器、 光源、 频谱分析仪和计算机分析软件, 通过手动切换控制各传感探头连接到测量电路, 获得被测样本的光谱数据。 测试中, 光源产生的入射光在穿过P-偏振器后从Y耦合器的一端进入, 经Y耦合器的另一端作用于SPR传感器探头。 入射光与被测液体相互作用后, 传感器端部将产生SPR效应, 即由端部全反射镜形成反射光, 反射光通过Y耦合器的另一端送入光谱仪。 最后, 由计算机获取来自光谱仪的被测信息, 并利用多分类器算法对其进行处理。 在每次测试采集后, 需要将SPR传感器与被测介质分离, 并在空气中放置约5 min, 直到共振峰消失, 再进行下一次测量。

图1 检测DOM组分的实验平台Fig.1 Experimental platform for detecting DOM components

在测量水样的SPR效应时, 利用七个传感头获取相对浓度步长为2%的被测水样的共振波长、 谱宽和光强, 作为多分类器的训练数据。 另外, 将浓度为3%的对应样品的测试结果作为验证数据。

1.6 数据分析

1.6.1 PSO-BP网络的构建及训练

人工神经网络(artificial neural networks, ANN)是一种模拟人脑的算法[12], 由大量神经元互连实现, 很适合具有较多测试数据的SPR传感阵列的分析。 但是, ANN所采用的传统BP学习算法易陷入局部极小点, 为提高BP神经网络的泛化能力, 首先, 将全局最优的粒子群算法(particle swarm optimization, PSO)与BP网络结合, 构建PSO-BP网络, 为实现多分类器打下基础。

传统PSO算法中的更新方程为[13]

vt+1=ωvt+c1r1(pit-xt)+c2r2(pgt-xt)

xt+1=xt+vt+1(4)

式(4)中, vt+1为第t+1次迭代中第i个粒子的第m维速度; xt+1为其对应位置; xtvt分别为第t次迭代的速度及位置; pit为第i个粒子第t次迭代的自身最优值; pgt为其全局最优值; r1, r2是[0, 1]间随机数; c1, c2是加速系数; ω 是惯性因子。

在构建PSO-BP网络过程中, 利用PSO完成对BP网络的权值及阈值的优化处理, 其训练过程主要包括: (1)构建并初始化三层BP神经网络, 完成网络初始参数的设计, 如层数、 输入层节点数、 隐层节点数、 输出层节点数、 适应度函数等; (2)初始化粒子群, 完成粒子群初始参数的设计, 如加速系数c1, c2、 惯性因子ω 、 粒子的数量、 迭代次数、 r1, r2等; (3)利用适应度函数计算个体最优值pit、 全局最优值pgt; (4)更新粒子当前速度与位置; (5)更新最优值; (6)检查结束条件, 若叠带次数或评价误差大于给定值, 则程序停止并转(7), 否则, 程序转新一轮粒子状态更新; (7)保存该组全局最优值; (8)根据适应度函数, 将粒子的全局最优位置映射为神经网络的权值及阈值, 并检测网络的泛化能力。

1.6.2 多分类器的实现

利用PSO-BP构建三个分类器: PSO-BP(wave length)、 PSO-BP(spectral width)、 PSO-BP(light intensity)。 每个分类器的网络结构相同: 输入层为7个节点, 代表7个光纤SPR传感探头的检测数据; 输出为5个节点, 代表DOM组分(酪氨酸类蛋白质、 色氨酸类蛋白质、 富里酸、 溶解性微生物代谢产物、 腐殖酸); 根据多次实验结果反馈, 确定隐层节点数为15个。 具体实现原理如图2。

图2 基于PSO-BP多分类器的DOM测试平台示意图Fig.2 Diagram of DOM test platform based on PSO-BP multiple classifiers

多分类器的DOM测试过程包括训练和预测两个阶段。 在训练阶段, 首先完成真值测定, 由三维荧光光谱获得DOM的组分数据, 并将其作为多分类器的输出, 利用7个SPR传感头测得各水样的SPR响应数据(波长、 谱宽和光强),

并将其作为多分类器的输入, 利用输入输出数据构成训练样品集, 完成对神经网络的训练, 当训练结束且网络收敛, 则多分类器模型创建成功。 在测试阶段, 将测试数据输入到训练成功的多分类器模型, 获得各DOM组分的输出值, 再根据三个分类器的输出结果, 最终利用平均法确定DOM的组分。 实验证明, 该模型可以挖掘SPR传感头感测的DOM组分的各种交叉敏感信息, 从而有效完成基于多分类器及SPR效应的DOM组分的分类。

2 结果与讨论
2.1 总体测试

为验证不同传感头所感测的交叉敏感性信息对预测效果的影响, 将7个传感探头分为三种情形, F1={S1, S3, S5, S7}、 F2={S2, S4, S6}、 F3={S1, S2, S3, S4, S5, S6, S7}。 分类器数设定为3个, 分别对应三个SPR响应参数(共振波长、 谱宽和光强), 最终通过平均法完成对DOM组分的分类。

PSO参数设置: 适应度函数为均方误差, 加速系数为c1=c2=2.05, 惯性因子为ω =0.9, 粒子数取N=160, 初始迭代次数k1=100, r1, r2为介于[0, 1]之间的随机数。 BP网络的结构参数为: 三个分类器的输入节点分别取3个、 4个、 7个, 隐层神经元均为15个, 输出神经元均为5个。 所涉及到多分类器算法的实现均利用Matlab 6.0平台完成。 另外, 为了便于描述预测效果, 定义预测正确率参数如式(5)

预测正确率=正确预测样本数总样本数(5)

式(5)中, 正确预测样本数为相对预测误差小于1%情形下的样本个数。 最后, 获得三种不同情形下的预测效果, 如图3(a— d)。

图3 不同被测样品的DOM组分的预测结果
(a): 里运河(A); (b): 洪泽湖(B); (c): 公园景观湖(C); (d): 校园景观湖(D)
Fig.3 Prediction results of DOM components of different measured samples
(a): Inner canal(A); (b): Hongze Lake(B); (c): Park landscape lake(C); (d): Campus landscape lake(D)

由图3可见, (1)三种传感探头阵列(F1F2F3)对四种水样的DOM组分浓度的预测效果均有差别。 总体, F3组合的预测效果最好, 其最高正确率为85%, 出现在洪泽湖(B)的P2.n的测试中, 最低正确率为62%, 出现在里运河(A)的P5.n测试中, 由三维荧光光谱区域积分法计算得到的DOM组分相对含量数据可知, 两种被测水样的P2.n及P5.n组分含量分别为48.32%和5.22%, 这种含量是五种成分在不同水体中的最高浓度和最低浓度, 即组分浓度越高, 检出率越高, 但对于F1, F2组合, 其预测正确率的最高和最低却并没有这样的表现, 两者的正确率都远远小于F3组合。 其中, F1的最大正确率为76.5%, 出现在洪泽湖(B)的P4.n测试点, 最小正确率为56%, 出现在里运河(A)与洪泽湖(B)的P5.n测试点。 F2的最大正确率为73%, 出现在公园景观湖(C)的P2.n, 相应DOM组分为36.99, 最小正确率为40%, 出现在里运河(A)与洪泽湖(B)的P5.n。 三种不同传感头组合均表现出P5.n组分的测试效果最差, 这与过低的组分浓度有很大关系, 即当组分过少时, 对传感探头结构的优化也难于感测其细微变化。 F1F2对于不同浓度的DOM组分区别能力偏于模糊, 即当各种成分的种类和含量差别较小时, 与传感器反应后的结果差别也比较接近, F1, F2的阵列对其较难于区分。 总之, 在F3情形下, 7个传感头完全覆盖在四种样品对应的变化范围内, 基础数据全面且网络结构与算法适当, 因此, 有着较好的识别效果。 对于F2情形, 3个传感探头集中在被测范围中间, 较大和较小区间的信息无法被有效获取, 因此, 基础数据缺乏全面性, 预测结果不能令人满意。 在F1情形下, 传感阵列虽然对应被测样品折射率的全部范围, 但是, 其密度不够, 传感头间的交叉敏感性信息不足, 导致分类器的预测效果较差。 因此, 无论何种预测分类系统, 传感阵列的设计是系统有效性的前提, 训练模型的欠缺可能使得预测结果不理想, 而传感阵列设计的缺陷将直接导致预测系统的失效。 因此, 在传感阵列设计与选择时, 既要保证各传感头的测量范围尽可能完整地覆盖在待测对象变化区间内, 也要保证不同传感头间有尽可能强的“ 交叉敏感性” 。

2.2 分类器个数的影响分析

在利用光纤SPR传感阵列对DOM组分的分类过程中, 分类器个数的设置也是影响测试结果的重要方面。 设计以下实验来考察分类器个数对预测效果的影响, 主要包括三种模式: 单分类器模式J1{{波长}, {谱宽}, {光强}}; 双分类器模式J2{{波长, 谱宽}, {波长, 光强}, {光强, 谱宽}}; 三分类器模式J3{{波长, 谱宽, 光强}}, 其他参数选取及实验方式同前所述。

2.2.1 单分类器模式J1

选择以共振波长、 光强、 谱宽分别作为一个输入参数, 分类器由一个PSO-BP构成, 采用7个传感头, 对A、 B、 C、 D四种水样中的五种组分(P1.n, P2.n, P3.n, P4.n, P5.n)浓度进行预测。 另外, 由于数据量较大, 影响因数较多, 故在测试阶段, 平均选取各水样中的测试数据(后面实验均按此规则完成), 获得如图4的测试结果。

图4 单分类器的测试效果Fig.4 Test effect of single classifier

由图4可见, 单分类器情况下, 三种不同参数作为输入的预测效果差别较大。 其中, 以共振波长作为输入所建立的PSO-BP分类器的预测效果最好, 其次是以共振光强作为输入的情况, 最差是以谱宽作为输入的情况。 即在SPR传感器的测试参数中, 以共振波长表征的被测信号的特征性更强。 但是, 图4的测试效果也表明, 无论考虑任何某单一参数, 都难以达到良好的分类效果, 即单分类器的特征参数个数太少, 所提供的信息不够充分, 导致预测错误率较高。

2.2.2 双分类器模式J2

分别选择共振波长与光强、 共振光强与谱宽、 共振波长与谱宽作为分类器的两个输入参数, 同时, 分类器选择两个PSO-BP, 其他测试过程及参数设置如前, 最后获得如图5的测试结果。

图5 双分类器测试效果Fig.5 Test effect of two classifiers

图5可见, 三种情况的预测能力较为接近, 但从正确率看, 以共振波长与光强为输入的组合效果最好, 其次是以共振波长与谱宽作为输入的情况, 最差是以共振光强与谱宽作为输入的情况。 总之, 与单分类器形式相比, 双分类器的预测效果都有一定程度的改善, 由此说明预测过程需要尽可能全面的参考信息, 信息越全面, 越具有代表性, 才可以更好地解决SPR传感器的“ 黑箱问题” , 保证预测效果更为良好。

2.2.3 三分类器模式J3

以共振波长、 光强与谱宽作为三个输入参数, 同时, 分类器选择三个PSO-BP, 其他测试过程及参数设置如前, 最后获得如图6的测试结果。

图6 三分类器测试效果Fig.6 Test effect of three classifiers

与上述两种情况比较, 三分类器的预测效果最好, 其原因在于三分类器可以更全面地借鉴传感器的参考信息, 使其具有更好的非线性映射及逼近能力, 从而更好地消除SPR结构对测试性能的影响, 保证分类器的预测效果更为优良。

在上述各种情况下, 不同方法对DOM不同组分浓度的预测效果均不同。 总之, 最高预测正确率出现在三分类器结构中, P2.n组分的预测正确率为84%, 最低正确率则出现在单分类器的P5.n测试中, 正确率仅有40.8%。 纵观各分类效果图, 不同分类器的测试效果规律均类似, 即测试P2.n组分的效果较好, P5.n组分则最差, 结合三维荧光光谱的区域积分法计算所得的DOM组分的相对含量, 获得不同水体的DOM组分浓度的平均值, 如表4。 组分浓度越高, 检出率越高, 检测精度与DOM组分浓度具有一定关系。

表4 不同样本(A、 B、 C、 D)的DOM组分浓度平均值 Table 4 Average concentration of DOM components in different samples (A, B, C, D)

为了更直观地考察不同参数及分类器的测试效果, 又获得各次测量值及误差, 基于测试参数较多, 只给出不同分类器对P1.n组分的测试结果, 具体如表5

表5 不同分类器的输出及误差 Table 5 Output and error of different classifiers

以上实验结果进一步说明了三分类器的测试效果最优。 即参数形式及分类器个数对预测影响较大, 当特征参数及分类器个数过少, 信息不充分, 将导致分类器的错误率较高, 随着参数特征及分类器个数的增加, 预测正确率也会增加。

3 结论

基于单个传感器的低选择交叉敏感性, 结合DOM组分检测的特点, 提出基于多分类器及光纤SPR传感器的DOM组分检测方法。 主要创新点包括: (1)利用多模光纤, 镀以55~85 nm的7种不同厚度的金膜, 构成7个具有不同最佳折射率测量点的SPR传感探头, 并且, 保证每个传感头在最佳测量区间内具有较好的灵敏度、 线性度, 在其他测量区间, 通过共振波长、 谱宽和光强的变化, 有尽可能敏感的交叉响应; (2)利用全局搜索算法PSO训练BP神经网络, 建立基于PSO-BP的三个分类器: PSO-BP(wave length)、 PSO-BP(spectral width)、 PSO-BP(light intensity), 用以挖掘多个传感器获得的交叉敏感性信息所反映的DOM组分的内部关系; (3)利用基于多分类器及光纤SPR传感器完成对四种水体的五种DOM组分浓度的有效预测。 考察了响应参数及分类器个数对预测效果的影响, 从而为多分类器及光纤SPR传感器在DOM组分预测应用中提供有效依据。

参考文献
[1] Wang Y F, Li J N, Xu L, et al. Journal of Environmental Chemical Engineering, 2023, 11(5): 111115. [本文引用:2]
[2] Liang E H, Li J R, Li B, et al. Journal of Hazardous Materials, 2023, 460(15): 132410. [本文引用:2]
[3] Chen Q, F, Zhang H, et al. Water Research, 2023, 244(1): 120536. [本文引用:1]
[4] Zha Y, Li X, Nan J. Environmental Research, 2023, 236(2): 116855. [本文引用:2]
[5] FAN Chun-hui, XIN Yi-bei, YUAN Wen-jing(范春辉, 辛意贝, 文静). Spectroscopy and Spectral Analysis(光谱学与光谱分析), 2022, 42(8): 2432. [本文引用:2]
[6] SUN Jing, ZHAO Ge-ge, ZHANG Yun-bo, et al(孙婧, 赵阁阁, 张运波, ). China Water & Wastewater(中国给水排水), 2021, 37(23): 21. [本文引用:2]
[7] He J, Zhi G Q, Yang Y, et al. Ecological Indicators, 2022, 142: 109088. [本文引用:2]
[8] Qiu J J, Li T Q, F, et al. Journal of Environmental Sciences, 2023, 126: 174. [本文引用:2]
[9] Min J Y, Lee J W, Bae G S, et al. Food Chemistry: X, 2023, 20: 100889. [本文引用:1]
[10] Xu J, Xu J J, Tong Z Y, et al. Spectrochimica Acta Part A: Molecular and Biomolecular Spectroscopy, 2023, 296(5): 122646. [本文引用:2]
[11] Mishra S K, Tripathi D C, Mishra A K. Plasmonics, 2022, (2): 17. [本文引用:1]
[12] JIA Mei-hui, LI Li-juan, REN Jiao-jiao, et al(贾美慧, 李丽娟, 任姣姣, ). Acta Photonica Sinica(光子学报), 2021, 50(9): 193. [本文引用:1]
[13] Yu Y S, Zhang H Y. Measurement, 2023, 218(15): 113197. [本文引用:1]