基于3D荧光光谱分析和多维偏最小二乘的PAHs浓度优化检测
王小鹏, 麻文刚, 蔡祥云, 吴旭, 朱天亮
兰州交通大学电子与信息工程学院, 甘肃 兰州 730070

作者简介: 王小鹏, 1969年生, 兰州交通大学电子与信息工程学院教授 e-mail: wangxp1969@sina.com

摘要

多环芳烃(PAHs)具有强致癌性, 威胁人类身体健康。 在复杂水质检测环境中, 利用荧光光谱检测PAHs浓度时, 由于测量光谱中存在瑞利散射影响, 使得PAHs光谱信号包含明显的非平稳噪声, 常用的多次采样求均值法容易使PAHs光谱存在明显的测量误差, 导致PAHs检测精度下降。 为此, 提出了一种基于3D荧光光谱分析和多维偏最小二乘(N-PLS)的PAHs浓度优化检测方法, 首先分析了菲、 芴、 苊与荧蒽4种PAHs溶液的光谱特性, 通过拟合散射带数据点值消除光谱中的瑞利散射噪声, 同时尽可能地保留原光谱信息。 提取4种PAHs光谱的均值、 方差和一维边际分布等特征参数, 利用聚类分析方法对其光谱数据做样本分类, 将相似光谱数据样本进行合并; 然后根据校正集的光谱信号与不同PAHs浓度之间的关系, 建立N-PLS模型, 对各类PAHs的浓度进行预测分析, 并且验证PAHs浓度与光谱数据荧光强度的关系; 最后利用双线性分解对浓度残差进行修正, 对含有各类PAHs的水溶液与实际水样进行浓度残差验证, 分析了不同参数下PAHs的预测误差。 实验结果表明, 溶剂菲有2个明显的荧光峰值, 激发与发射波长分别为285/245和315/345 nm; 芴与荧蒽均存在6个明显的荧光特征峰值, 分别为265/255, 325/345, 335/325, 365/355, 385/395和405/415 nm, 且与其他PAHs的荧光峰值相距较远; 溶液苊在发射波长300~485 nm的范围内存在连续波峰, 且对应激发波长在255~360 nm范围内; N-PLS方法对不同水质环境下的PAHs预测误差较小, 其中菲与芴均方根误差均小于0.4 μg·L-1, 相对误差小于6%, 苊与荧蒽均方根误差均小于1.0 μg·L-1, 相对误差均小于9%。 对4种不同的PAHs在河流中的扩散趋势进行了仿真分析, 确定出了其扩散程度, 其中芴与菲扩散速率约为51 mg·L-1, 苊与荧蒽扩散速率为21 mg·L-1, 且扩散速率在一定范围内呈线性增长趋势, PAHs与其浓度之间符合朗伯比尔定律的线性关系; 通过不同迭代次数下N-PLS方法的均方根误差分析, 得到了均方根误差精度最高时的迭代次数; 对比了不同主因子数时N-PLS方法对PAHs预测的适应度与相关系数, 结果表明当主因子数为3时, 适应度可达96.5%, 此时N-PLS预测模型效果最佳。 相比其他检测方法, 本文方法检测精度较高, 回收率较好, 具有较强的鲁棒性。

关键词: 多环芳烃检测; 3D荧光光谱; 校正集; 多维偏最小二乘; 双线性分解
中图分类号:O433.1 文献标志码:A
Optimal Detection of PAHs Concentration Based on 3D Fluorescence Spectral Analysis and N-Way Partial Least Square
WANG Xiao-peng, MA Wen-gang, CAI Xiang-yun, WU Xu, ZHU Tian-liang
School of Electronic and Information Engineering, Lanzhou Jiaotong University, Lanzhou 730070, China
Abstract

Polycyclic aromatic hydrocarbons (PAHs) have strong carcinogenicity and threaten human health. In the complex water quality detection environment, when the concentrations of PAHs are detected by fluorescence spectrum, the spectral signal may contain obvious non-stationary noise due to the influence of Rayleigh scattering in the measured spectrum. The common multiple sampling and averaging method tend to generate obvious measurement error in the PAHs spectrum, thereby leading to low detection accuracy of PAHs. In this paper, an optimal detection method for PAHs concentration based on three-dimensional (3D) fluorescence spectral analysis and N-way partial least square (N-PLS) is proposed. First, the spectral features of the four PAHs solutions of phenanthrene, fluorene, acenaphthene and fluoranthene were analyzed. The Rayleigh scattering noise in the spectrum was eliminated by fitting the scattering band data point values while the original spectrum information was preserved as much as possible. The features such as the mean, variance, and one-dimensional marginal distribution of the four PAHs spectrum were extracted,and the similar spectral data samples were merged according to samples classification of four spectral data by feature clustering analysis. Secondly, the N-PLS model was established based on the relationship between the spectral signal of the correction set and the different PAHs concentration. Subsequently the N-PLS model was used to predict and analyze the concentration of various PAHs, and verify the relationship between the PAHs concentration and the fluorescence intensity of the spectral data. Finally, the concentration residuals were modified by bilinear decomposition, the concentration residuals between aqueous solutions containing various PAHs and real water samples were verified, and the prediction errors of PAHs under different parameters were also analyzed. The experimental results showed that the phenanthrene solvent exists two obvious fluorescence peaks, and their excitation and emission wavelengths are 285/245 and 315/345 nm respectively. Both fluorene and fluoranthene have six obvious fluorescence feature peaks. Their excitation and emission wavelengths are 265/255, 325/345, 335/325, 365/355 nm, 385/395 and 405/415 nm respectively. Moreover, the fluorescence peaks are far away from the other PAHs. There appear continuous peaks in the acenaphthene solution where the emission wavelength is in the range of 300~485 nm, and the corresponding excitation wavelength is 255~360 nm. The PAHs prediction error of N-PLS method for different water quality is small, where the RMS error of phenanthrene and fluorene are less than 0.4 μg·L-1, the relative error is less than 6%, and the RMS error of acenaphthene and fluoranthene are less than 1.0 μg·L-1, their relative error are less than 9%. The diffusion degree of PAHs is determined by the simulation and analysis of the diffusion tendency of four different kinds of PAHs in river, where the diffusion rate of fluorene and phenanthrene is about 51 mg·L-1, and acenaphthene and fluoranthene is 21 mg·L-1. Their diffusion rate is linear in a certain range and there is a linear relationship between PAHs and its concentration in accordance with Lambert-Beer law. The iteration times with the highest RMS error accuracy are obtained through the RMS error analysis of N-PLS method with different iteration times. The fit and correlation coefficient of the N-PLS method for PAHs prediction with different main factor numbers are compared The results showed that when the number of main factors is 3, the fitness could be up to 96.5, and the effect of N-PLS prediction model is optimal. Overall, the proposed method has higher detection accuracy, better recovery rate and stronger robustness compared with other detection methods.

Keyword: Polycyclic aromatic hydrocarbon detection; Three-dimensional fluorescence spectrum; Rayleigh scattering; N-way partial least square; Bilinear decomposition
引言

工农业环境中的多环芳烃(polycyclic aromatic hydrocarbons, PAHs)具有强致癌性, 目前针对水体PAHs的检测大致有以下三类: 第一类利用不同PAHs的特征及其化学反应现象, 如传统的化学电离源质谱法[1], 利用电子轰击离子源, 将化学电离源用于测定PAHs的某些同分异构体; 第二类色质谱联用技术[2, 3]。 这两类方法虽能很好地检测出PAHs的含量与种类, 但处理较为复杂、 难以进行现场实时检测。 第三类为光谱学检测方法[4, 5, 6], 利用3D荧光技术提取PAHs光谱数据进行PAHs检测, 文献[4]分析了混合溶液的荧光光谱特性, 针对光谱图不能直接反映混合物各组分浓度的特点, 将人工蜂群算法优化的径向基函数神经网络应用于浓度检测; 文献[5]采用3D荧光光谱结合小波压缩与交替惩罚三线性分解对水中PAHs进行了定性和定量分析; 文献[6]采用非负矩阵分解的投影梯度和交替最小二乘两种算法结合K均值初始化方法提取PAHs的3D荧光光谱, 进而进行成份识别。

一般水体样本PAHs含量较为微弱, 在复杂水体环境下, 光谱存在散射, 且水体样本浓度、 酸度与其他杂质影响其检测结果, 因而PAHs检测时, 不能采用单一的3D荧光技术检测PAHs浓度。 为提高水体PAHs浓度的检测精度, 提出了基于3D光谱定量分析的方法对水体4种PAHs进行检测, 首先分别提取各类PAHs3D光谱数据, 分析PAHs浓度与其光谱之间的关系, 根据校正集光谱信号与PAHs浓度之间的关系, 建立多维偏最小二乘(N-way partial least square, N-PLS)模型[7, 8, 9]预测PAHs浓度, 对于各类含有PAHs的水溶液与实际水样建立样本实验, 分析其均方误差、 峰值误差及相对误差。

1 PAHs光谱数据提取

在某一激发波长下, 单一PAHs溶液对应的荧光强度[10, 11]E满足如下关系

E=φαI0(1-e-klc)(1)

其中φ a为荧光量子产率, I0为入射光强度, k为摩尔吸光系数, l为光程, c为浓度。 当c较小时, 将式(1)进行高阶泰勒展开, 忽略小的高阶项, 此时klc较小, 当klc≤ 0.05时, cE成线性关系, 即

E=2.3φαI0klc(2)

当被测溶液液位层厚度固定且浓度较小时, 利用等强度与等频率的激光照射溶液, 则荧光强度正比于溶液的浓度, 此时, 可计算物质的浓度。 本文利用光谱瑞利散射[12]带与拉曼散射带两侧的点拟合散射带数据点值进行瑞利散射去除, 根据散射带相邻的点进行插值得到数据点近似值, 利用散射带两侧值对散射带的数据点进行计算, 没有发生散射区域的光谱强度无变化, 因此能够在去除散射的同时保留原光谱的信息。

2 N-PLS与残差双线性分解优化检测PAHs流程

依据校正集光谱与PAHs浓度之间的关系, 建立N-PLS优化预测模型, 具体过程为: 利用校正数据集Xcal(Ical× J× K)与相应的浓度ccal(Ical× 1), 将数据阵Xcal分解为一个溶液矩阵T(I× A)与两个权重荷载QJ(J× A)和QK(K× A), 同时将得到大小为A× 1的回归因子ν , 其中Ical, J, KA分别为样本数、 发射波长、 激发波长与潜变因子。 假设样本Wu中无未知干扰, 则测试样本中目标物的浓度Ru

Ru=tTuν(3)

其中tu为样本得分值, 可根据测试样本Wu投影到校正荷载矩阵得到。

当样本存在未知干扰时, 不能直接利用样本tu进行浓度预测, 因为此时N-PLS模型预测的残差Gp噪声较大。

Gp=PnIJK-A=Wu-reshape{tu[(QJ||QK)]}IJK-A(4)

其中Pn为残差矩阵, ‖ ‖ 表示欧式距离, reshape表示将大小为JK× 1的矢量矩阵转换为J× K矩阵, |⊗|表示Kathri-Rao积。 利用残差双线性分解(RBL)[13]拟合测试样本, 达到最小化残差目的, 即

Wu=reshape{tu[(QJ||QK)]}+HDBT+Vu(5)

其中Vu表示残差矢量, H, DB可通过对残差矩阵Pn进行矩阵分解得到

HDBT=SVD(Pn)(6)

此时tu变化直到RBL的残差Wu达到最小值。

Wu=VuIJK(7)

Wu代入式(2), 可得到分析物浓度, 具体过程如图1所示。

图1 多环芳烃检测流程Fig.1 Flow chart of PAHs detection

3 实验与结果讨论
3.1 PAHs三维光谱仿真与特征定量分析

仪器测量参数设置: 检测仪器选用F-4500型光谱仪, 设定激发波长为200~400 nm, 发射波长为280~700 nm, 采样波长间隔为5 nm, 扫描速度为2 600 nm· min-1, 实验水质样本来自某农村生活排污水与农业灌溉地表水, 共30个水样。 其中每份水样取100 mL匀速注入100 mL去离子水中, 得到不同的水溶液, 读取光谱数据, 经插值、 滤波和校正处理后生成菲(图2)、 芴(图3)、 荧蒽(图4)及苊(图5)四种PAHs的3D荧光谱数据矩阵。 由图2可知, 溶剂菲有2个明显的荧光峰值, 激发和发射波长分别为285/245和315/345 nm, 且其他PAHs的荧光峰值相距菲较远, 可忽略其影响。 图3与4中芴与荧蒽都存在6个明显的荧光特征峰值, 分别为265/255, 325/345, 335/325, 365/355, 385/395和405/415 nm。 而从图5发现苊在发射波长300~485 nm范围内存在连续波峰, 且对应激发波长在255~360 nm范围内。 经过对不同浓度PAHs的光谱进行分析, 可以得知四类PAHs的荧光特征峰值较为集中, 且与水质中其他物质混合之后, 光谱具有明显的特征, 因此利用3D荧光光谱仪处理后的光谱与其他污染较易区分。

图2 菲光谱与等高线Fig.2 Spectral and contour of phenanthrene

图3 芴光谱与等高线Fig.3 Spectral and contour of fluorene

图4 荧蒽光谱与等高线Fig.4 Spectral and contour of fluoranthene

图5 苊光谱与等高线图Fig.5 Spectral and contour of acenaphthene

为了分析PAHs光谱参数, 实验中提取部分样本均值、 方差及一维边际分布等特征参数, 利用聚类分析法做了样本分类。 分类结果如图6所示, 特征3和4, 6和7以及1和2可分别进行合并, 所以在特征选择时可将相似特征舍掉, 对应的相似特征可以代表荧光谱的表观特征。

图6 光谱特征参数聚类分析Fig.6 Clustering analysis of spectral feature parameters

3.2 N-PLS对不同水样PAHs浓度检测对比

选择4种不同水质, 分别为居民、 工厂排污、 市场饮用水及农业灌溉水处理入口水样, 并标注为水样1, 2, 3及4, 其中水样1取300 mL匀速注入100 mL去离子水中, 水样2取200 mL匀速注入100 mL去离子水中, 其中水样3和4分别取100 mL匀速注入50与80 mL去离子水中。

表1给出了不同水样的均方根误差与相对误差对比, 其中芴与荧蒽的检测精度较低, 原因在于芴与荧蒽的光谱特性较为相似, 造成误判; 芴的预测均方根误差最小为0.50 μ g· L-1, 相对误差为5.3%; 荧蒽的均方根误差最大为0.9 μ g· L-1, 相对误差最大为8.4%。 在检测水样2, 3及4时, 芴与荧蒽的平均检测精度有所提高, 为94%。 样本2中杂质含量较水样1少, 较易区分其PAHs的光谱特性, 其中芴的均方根误差最小为0.40 μ g· L-1, 相对误差为5.2%; 荧蒽的均方根误差最大为0.74 μ g· L-1, 相对误差为9.4%。 总体而言, 提出的方法对4种水样中各类PAHs检测精度能够达到95.5%, 可满足工业检测精度。

表1 不同水样的PAHs检测参数指标对比 Table 1 Comparison of PAHs detection parameters for different water samples
3.3 残差双线性分解优化检测PAHs验证

图7给出了RBL程序矫正后黄河水各类PAHs浓度预测误差的对比结果, 可以看出, N-PLS结合RBL程序对黄河水质PAHs浓度预测有一定优势, 尤其是对较低浓度的溶液预测结果最佳, 其中菲与芴的均方根误差小于或等于0.4 μ g· L-1; 苊与荧蒽的的预测均方根误差分别小于或等于0.1与0.2 μ g· L-1

图7 RBL结合N-PLS修正后的PAHs浓度预测误差Fig.7 Prediction error of PAHs concentration after the correction of RBL combing N-PLS

3.4 N-PLS定量分析水体PAHs扩散趋势

从河流同一地点同时采集水样, 利用去离子水稀释为不同浓度的芴、 苊、 菲及荧蒽溶液, 用重铬酸钾滴定法分别测量浓度值, 分别为50, 20, 52和22 mg· L-1, 对4种PAHs溶液进行20 s扩散程度仿真, 检测各类PAHs在复杂河流环境下的扩散程度。 由图8可以看出, 四种PAHs与单位时间内排放量基本相等, 说明PAHs污染范围比PAHs污染点源要大, 其中水样含芴与菲和含苊与荧蒽扩散程度分别为51和21 mg· L-1, 水样经过一定时间, 四种PAHs水样沿竖直方向与XOY面(其他切面类似)变化不大, 呈线性增长趋势, PAHs与其浓度之间符合朗伯比尔定律的线性关系。

图8 水体PAHs扩散趋势Fig.8 Diffusion trend of PAHs in Water

3.5 N-PLS检测PAHs浓度误差及主因子数分析

为了验证N-PLS方法对PAHs浓度检测优化的精确性, 配置相同浓度的四种PAHs溶液进行检测。 图9分别给出了四种PAHs检测最小均方误差, 由图9(a)和(b)可知, 在检测菲与芴溶液浓度时, 随着N-PLS迭代次数增加, 菲溶液检测的最小均方误差逐渐减小, 迭代400次后为0.03左右, 迭代2 000次后变为0.01左右且保持稳定, 有效降低了均方误差。 芴溶液随着迭代次数增加, 均方误差不变, 大概维持在0.04左右, 这是由于芴溶液光谱与水体其他成分相似, 可能将其他成分漏检。 从图9(c)和(d)可知, 检测苊与荧蒽溶液时, 随着迭代次数增加, 苊溶液检测的最小均方误差逐渐减小, 500次后为0.02左右, 迭代2 000次后为0.015左右, 均方误差降低, 精度较高。 荧蒽与芴溶液检测结果相似, 均方误差不变, 维持在0.04左右。

图9 溶液浓度均方误差对比
(a): 菲; (b): 芴; (c): 苊; (d): 荧蒽
Fig.9 Comparison of mean square error of solution concentration
(a): Phenanthrene; (b): Fluorene; (c): Acenaphthene; (d): Fluoranthene

表2给出了不同主因子数下4种PAHs溶液相关系数与适应度的对比, 可以看出, 对于不同的主因子数, N-PLS方法建立的模型精度有较大差异, 4种PAHs溶液浓度随着主因子数的增加, 对应的相关系数与适应度也在增加, 适应度平均最高可达96.5%, 当主因子数为3时, N-PLS预测模型效果最佳。

表2 不同主因子数下4种PAHs溶液相关系数与适应度对比 Table 2 Comparison of correlation coefficient and fitness of four PAHs solutions under different principal factor numbers
3.6 参数对比分析

在水体含有不同浓度的各类PAHs溶液时, 将提出方法与基于非负矩阵分解的检测方法以及文献[14]方法进行了浓度回收率、 精度及峰值误差的比较。 从表3可以看出, 提出方法峰值误差均低于其他两种方法, 精度高于非负矩阵分解检测方法, 略低于文献[14], 但回收率较高, 且本文方法可以对复杂环境下的各类PAHs溶液进行检测区分, 具有较好的鲁棒性。

表3 不同检测方法性能对比 Table 3 Performance comparison of different detection methods
4 结论

针对水溶液中菲、 芴、 苊和荧蒽等多种PAHs的3D光谱特性, 利用朗伯比尔定律定量分析了各类PAHs浓度与其光谱数据的关系, 根据插值法去除3D荧光光谱中的瑞利散射, 利用N-PLS优化方法对各类PAHs的浓度进行检测, 结合RBL程序对浓度进行修正, 提出了3D荧光光谱定量分析的N-PLS水体PAHs检测方法。 通过提取各类PAHs的光谱数据, 利用其光谱数据与等高线图, 分析荧光最佳的激发波长与发射波长, 分别对含有菲、 芴、 苊和荧蒽4种PAHs混合物的水溶液与实际水样做了样本浓度预测实验, 分析了提出方法的均方根误差、 相对误差与检测限, 同时对比分析了N-PLS方法在不同主因子数下4种PAHs的相关系数及其适应度。 实验结果表明, 相比其他检测方法, 提出方法均方根误差较小, 检测精度较高, 具有较强的鲁棒性。 该方法可对普通的水溶液以及复杂农业环境中的PAHs进行定量检测。

The authors have declared that no competing interests exist.

参考文献
[1] YAN Rui, SHAO Ming-yuan, SUN Chang-hua, et al(闫蕊, 邵明媛, 孙长华, ). Chinese Journal of Analytical Chemistry(分析化学), 2014, (6): 897. [本文引用:1]
[2] LI Zhi-gang(李志刚). Journal of Textile Research(纺织学报), 2015, 36(5): 69. [本文引用:1]
[3] SHI Long-kai, LIU Yu-lan(石龙凯, 刘玉兰). Journal of the Chinese Cereals and Oils Association(中国粮油学报), 2015, 30(12): 114. [本文引用:1]
[4] WANG Shu-tao, ZHENG Ya-nan, WANG Zhi-fang, et al(王书涛, 郑亚南, 王志芳, ). Chinese Journal of Luminescence(发光学报), 2017, 38(6): 807. [本文引用:2]
[5] WANG Yu-tian, LIU Ting-ting, LIU Ling-fei, et al(王玉田, 刘婷婷, 刘凌妃, ). Spectroscopy and Spectral Analysis(光谱学与光谱分析), 2018, 38(4): 1171. [本文引用:2]
[6] YANG Rui-fang, ZHAO Nan-jing, XIAO Xue, et al(杨瑞芳, 赵南京, 肖雪, ). Journal of Atmosphere and Environmental Optics(大气与环境光学学报), 2015, 10(5): 386. [本文引用:2]
[7] DU Shu-xin, SHEN Jin-chang, YUAN Zhi-bao(杜树新, 沈进昌, 袁之报). Laser Journal(激光杂志), 2012, 33(1): 36. [本文引用:1]
[8] Sara Mostafapour, Hadi Parastar. Analytical and Bioanalytical Chemistry, 2015, 407(1): 285. [本文引用:1]
[9] LI Ai-min, LIAN Zeng-yan, YANG Ren-jie, et al(李爱民, 连增艳, 杨仁杰, ). Environmental Chemistry(环境化学), 2018, 37(4): 910. [本文引用:1]
[10] LIU Tie, LIU De-long, WEI Yong-ju(刘铁, 刘德龙, 魏永巨). Journal of Instrumental Analysis(分析测试学报), 2018, 37(3): 313. [本文引用:1]
[11] YANG Ren-jie, DONG Gui-mei, YANG Yan-rong, et al(杨仁杰, 董桂梅, 杨延荣, ). Optics and Precision Engineering(光学精密工程), 2016, 24(11): 2665. [本文引用:1]
[12] TAO Chun-xian, RUAN Jun, SHU Shun-peng, et al(淘春先, 阮俊, 舒顺朋, ). Chinese Journal of Lasers(中国激光), 2016, 43(1): 0115001. [本文引用:1]
[13] Lozano V A, Ibañez G A, Olivieri A C. Analytica Chimica Acta, 2008, 610(2): 186. [本文引用:1]
[14] Mouazen A M, Kuang B, deBaerdemaeker J, et al. Geoderma, 2010, 158(1): 23. [本文引用:2]