基于三维荧光光谱结合小波压缩与APTLD对水中多环芳烃测定
王玉田, 刘婷婷*, 刘凌妃, 杨哲, 崔耀耀
燕山大学河北省测试计量技术及仪器重点实验室, 河北 秦皇岛 066004
*通讯联系人 e-mail: 2413950643@qq.com

作者简介: 王玉田, 1952年生, 燕山大学电气工程学院教授 e-mail: y.t.wang@163.com

摘要

基于三维荧光光谱结合小波压缩与交替惩罚三线性分解(APTLD)对水中多环芳烃(PAHs)进行定性和定量分析, 实验以萘(NAP)、 芴(FLU)、 苊(ANA)为测量样品。 首先用FS920荧光光谱仪测量获得样品的三维荧光光谱数据, 对数据进行激发和发射校正且去散射, 得到真实光谱。 为了解决三维荧光光谱数据的冗余信息, 通过小波变换对实验光谱数据进行压缩, 其压缩分数和数据恢复分数分别大于92%和95%。 用APTLD对压缩后的光谱数据进行分析, 体现了二阶优势, 实验结果表明, 在PAHs的荧光光谱严重重叠和有干扰物共存下, 该方法仍能准确地测定, 其回收率为94%~98%、 预测均方根误差小于0.29 μg·L-1

关键词: 多环芳烃; 交替惩罚三线性分解; 三维荧光光谱; 小波压缩; 二阶优势
中图分类号:O657.3 文献标志码:A
Determination of Polycyclic Aromatic Hydrocarbons in Water Based on Three Dimensional Fluorescence Spectroscopy Combined with Wavelet Compression and APTLD
WANG Yu-tian, LIU Ting-ting*, LIU Ling-fei, YANG Zhe, CUI Yao-yao
Measurement Technology and Instrument Key Lab of Hebei Provice, Yanshan University, Qinhuangdao 066004, China
Abstract

Based on the three-dimensional fluorescence spectroscopy combined with wavelet compression and APTLD for the detection of polycyclic aromatic hydrocarbons (PAHs) in water,the rapid determination of PAHs in water was achieved. The samples were prepared by using three kinds of PAHs,naphthalene (NAP),fluorene (FLU) and acenaphthene (ANA). First,the three-dimensional fluorescence spectra of the samples were measured with FLS920 steady-state fluorescence spectrometer. The data were excited and emitted by calibration and de-scattering to obtain the real spectrum. In order to solve the redundant information problem of three- dimensional fluorescence spectral data,the experimental spectral data is compressed by wavelet transform,and the compression score and data recovery fraction can reach 92% and 95% respectively. APTLD was applied to analyze the compressed data and reflect the second-order advantage. The experimental results show that the method can still be used for rapid determination,and the recovery rate is more than 94% and the predicted root mean square error is less than 0.29 with seriously overlapped and intermittent fluorescence spectra of PAHs.

Keyword: Three-dimensional fluorescence spectroscopy; Wavelet compression; Alternate penalty trilinear decomposition; Second-orderdominance; Polycyclic aromatic hydrocarbons

引 言

多环芳烃(polycyclic aromatic hydrocarbons, PAHs)是指两个或者两个苯环以稠环形式组成的碳氢化合物, 具有惰性较强和致癌等性质, 是一类痕量有机污染物[1, 2, 3]。 1990年我国提出的68种水体优先控制污染中有7种属于多环芳烃[4], 目前对于水中PAHs的检测方法主要有色谱法和荧光法。 国外Kenneth Ogan等利用反相高效液相色谱法分析了16种多环芳烃, Martinez等[5]对水体中16种多环芳烃用8种不同的固相萃取剂进行萃取; 国内杨蕾等[6]采用固相微萃取技术和气相色谱质谱联用分析滇池水中的16种多环芳烃。 但是由于色谱法可能存在腐蚀和挥发性、 溶剂需要严格纯化等缺点, 所以近年来在检测水中有机污染时, 荧光法越来越受到欢迎, 尤其是三维荧光光谱法。 三维荧光光谱信息含量丰富, 特征显著, 具有很好的选择性, 可用于多组分混合物的分析[7], 在国内基于三维荧光光谱来检测水中有机污染时, 关于PAHs的研究较少, 因此研究一种基于三维荧光光谱来测定水中PAHs的方法具有重要意义。

为了解决三维荧光光谱数据中环境噪声等增加的数据冗余信息问题, 选用小波变换对实验数据进行压缩。 小波变换的局部分辨能力较强、 压缩率较大, 在保证物质光谱强度信息不丢失前提下, 有效剔除冗余信息[8, 9]。 交替惩罚三线性分解(alternating penalty trilinear decomposition, APTLD)对主分数估计不敏感, 具有二阶优势, 在未知干扰或背景下, 以“ 数学分离” 代替“ 化学分离” [10]。 PAHs化学结构相似, 荧光光谱严重重叠, 无法用传统荧光法进行直接测定, 用APTLD能实现对水中痕量PAHs的测定, 取得较好的回收率。

1 实验部分
1.1 仪器设备

实验所测量样品的三维荧光光谱是由Edinburgh Instruments公司生产的FS920稳态荧光光谱仪扫描所得, 光谱波长响应范围200~900 nm, 液氮制冷范围77~320 K, 激发光源使用功率450 W, 信噪比是6 000∶ 1。 PAHs的化学结构相似, 实验以芴(FLU)、 萘(NAP)、 苊(ANA)为测量样品。 测量前参数设置如下: 三种PAHs激发波长为200∶ 10∶ 370 nm, 发射波长为240∶ 2∶ 390 nm。 实验激发起始波长总是超前发射起始波长40 nm, 以避免一级瑞利散射的干扰。

1.2 材料与样品

实验采用的萘(NAP)、 芴(FLU)、 苊(ANA)都来自于上海阿拉丁生化科技公司, 标准样品, 纯度大于99.5%。 标准液的配制: (1)用精密电子秤(型号: FA1004, 实际分度值: 0.1 mg)取这三种PAHs样品各0.01 g, 用甲醇(光谱级)溶解并分别定容于3个10 mL的容量瓶中, 得到浓度为1 g· L-1的一级储备液并在4 ℃条件下避光保存。 (2)分别取0.1 mL的一级储备液, 用超纯水稀释并定容于3个10 mL的容量瓶中, 震荡5 min, 得到10 mg· L-1的二级储备液。 (3)分别取0.1 mL的二级储备液, 用超纯水稀释并定容于3个10 mL的容量瓶中, 震荡5 min, 配制成100 μ g· L-1的标准溶液。 (4)分别取不一样体积的各测试样品标准溶液, 用超纯水稀释且通过混合配制, 形成不同比例和不同浓度的溶液。 另外, 实际水体中的PAHs会受到浓度较高的腐殖酸影响, 所以实验中有模拟加入了腐殖酸干扰的样本。 如表1所示。

表1 预测样品配制浓度(μ g· L-1) Table 1 Predict samples preparation concentration(μ g· L-1)

表1中, 校正样本为F1— F7, 待测样本为L1— L2, T1— T3是加入了较高浓度的腐殖酸作为干扰因子的待测样本。

1.3 数据预处理

实验扫描得到的三维荧光光谱不是分析样品的真实光谱, 样品荧光测量受到溶剂和其他荧光发光体的干扰从而产生散射, 实验采用Delaunay插值法对散射带数据点进行计算, 没发生散射区域不做改变, 因此即除去了散射, 同时最大程度的保留原光谱信息。 由于激发光谱受到光源光谱输出和激发单色仪的影响, 发射光谱受到发射单色仪和探测器光谱响应的影响[11], 所以需要激发和发射校正从而去除仪器误差, 得到真实的光谱。 以表1中F1即萘(NAP)为例, 如图1和图2所示。

图1 仪器激发(a)和发射(b)校正曲线Fig.1 Instrument (a) excitation and (b) emission calibration curves

图2 萘(NAP)消除散射和校正前后对比
(a): 原始等高线; (b): 消除散射和校正后等高线; (c): 原始三维图; (d): 消除散射和校正后的三维图
Fig.2 NAP eliminates scattering and correction before and after
(a): Original contour map; (b): Eliminate scattering and calibrated contour map; (c): The original three-dimensional plot; (d): Eliminate scattering and cabrated of three-dimensional plot

图2(a)和(b)分别为消除散射和校正前后的等高线图, 图2(c)和(d)分别为消除散射和校正前后的三维图。 从图2的(b)和(d)中看出, 经过去除散射和校正后, 萘(NAP)的形状和强度发生了变化, 波峰强度明显增强, 由此可见校正后可以使光谱信息凸显出来。

2 小波压缩三维荧光光谱数据

目前光谱数据的压缩方法主要有傅里叶变换法、 主成分分析法、 小波变换法等。 傅里叶变换法具有窗口大小不随频率变化、 缺乏离散正交基等缺点; 经过主成分变化后会丢失一些细节信息而且缺乏分解灵活性; 而小波变换具有失真率低、 局部分辨能力较强的特点, 能在不同分解层次对小波系数进行量化处理, 消除冗余和噪声。

2.1 小波变换原理

(1)用小波分解信号; (2)对于高频系数, 在阈值量化处

理时, 从第1到第N层均可用不同的阈值, 且通过硬阈值将高频系数进行量化。 (3)在系数量化后, 用小波进行重构。

f(t)=ncj, n2-j/2ϕ(2-jt-n)+ndj, n2-j/2Ψ(2-jt-n)(1)

式(1)的右边第一项为f(t)的低频分量, 即f(t)的轮廓部分, 第二项为f(t)的高频分量, 即f(t)的细节部分, cj, ndj, nj尺度上的展开系数。 ϕ (t)和Ψ (t)为正交基。

cj-1, m=ncj, nh0(m-2n)+ndj, nh1(m-2n)(2)

式(2)为小波变换系数的重构公式, 也是小波逆变换公式。 其中h0h1是滤波器系数, 在实际中是有限长。

由小波数据压缩原理, 幅值较小的小波系数可通过阈值的设置来舍弃, 而对幅值较大的小波系数进行保留; 小波系数经过平滑和阈值处理后, 用小波逆变换对系数进行重构。

d˙k(j)=dk(j)|dk(j)|Tj0|dk(j)|< Tj=1, 2, , l-1, l(3)

式(3)中T为阈值, d˙k(j)为小波变换系数, l为实际分解的层数。

由于db3小波函数具有很多优点, 例如小波滤波器系数少和很好的紧支性、 正交性, 所以对实验光谱数据压缩时, 选取db3小波函数。 以表1中F3为例, 如图3和图4所示。

图3 苊(ANA)压缩前后对比
(a): 压缩前发射图; (b): 压缩后发射图; (c): 压缩前等高线图; (d): 压缩后等高线图
Fig.3 Before and after compression of ANA
(a): Compression before the emission wavelength diagram; (b): Compression after the emission wavelength diagram; (c): Compression before the contoure map; (d): Compression after the contoure map

图4 苊(ANA)的局部压缩前后对比
(a1): 压缩前, 强度40; (b1): 压缩后, 强度40; (a2): 压缩前, 强度150; (b1): 压缩后, 强度150; (a3): 压缩前, 强度3 000; (b3): 压缩后, 强度3 000; (a4): 压缩前, 强度8 000; (b4): 压缩后, 强度8 000
Fig.4 ANA local compression before and after
(a1): Compression before, the intensity is 40; (b1): Compression after, the intensity is 40; (a2): Compression before, the intensity is 150; (b2): Compression after, the intensity is 150; (a3): Compression before, the intensity is 3 000; (b2): Compression after, the intensity is 3 000; (a4): Compression before, the intensity is 8 000; (b4): Compression after, the intensity is 8 000

从图3中可看出压缩前后的主要谱线形状、 峰值位置及荧光强度基本未发生变化。

从图4的(a1)— (a4)中可看出, 在对苊(ANA)分解压缩和重构过程中, 各荧光强度值的光谱数据在压缩时删掉了一些冗余信息, 保留了有用数据。

2.2 评价指标

1. 压缩分数

CS=(100N1)/N2(4)

式(4)中, N1为处理后零系数的个数, N2为原小波系数的个数, CS表征数据压缩程度, CS越大, 数据压缩效果越好。

2. 数据恢复分数

RS=(100×CXC2)/C2(5)

式(5)中, CXC为处理后的小波系数, C为原小波系数, RS越大, 重构数据的误差越小。

表2中可看出压缩分数(CS)都大于92%, 数据恢复分数(RS)都大于95%。

表2 几种分析样品的压缩结果 Table 2 Compression results of several analytical samples
3 数据处理与分析
3.1 三线性模型

选用I个激发波长、 J个发射波长下对K个混合样品进行扫描, 获得一系列的三维光谱矩阵, 用这些光谱矩阵构成一个大小为I× J× K的三维数据阵X

Xijk=n=1Nainbjnckn+eijki=1, 2, , I; j=1, 2, , J; k=1, 2, , K(6)

式(6)中xijkX的一个元素, N为总组分数(实际对荧光有贡献的主分数和背景干扰), ainckn相对激发光谱阵A(I× N)中的元素(i, n) , bjn是相对发射光谱阵B(J× N)中的元素(j, n), C(K× N)是相对浓度阵中的元素(k, n)[12], eijkX的三维残差数据阵。

3.2 APTLD算法

APTLD是由湖南大学实验室提出, 实际采用的是组合PARAFAC(parallel factor analysis)与SWATLD(self-weighted alternating trilinear decomposition)的优化策略[13], 三线性模型所得到的目标函数是各元素残差的平方和, 如式(7)所示

σ1(A)=i=1IXi..-Bdiag(ai)CT2Fσ2(B)=j=1JX.j.-Cdiag(bj)AT2F(7)σ3(C)=k=1KX..k-Adiag(ck)BT2F

APTLD算法是根据交替最小二乘原理, 由式(8)可同时获得三维数据阵XA(相对激发光谱矩阵)和B(相对发射光谱矩阵)以及C(相对浓度矩阵)

A=[k=1K(X..k(B+α(BT)+WC2)diag(c(k)))+αj=1JXT.j.(C+)TWB2diag(b(j))]×k=1K(diag(c(k))BTBdiag(c(k)))+2αI+B=[i=1I(Xi..(C+β(CT)+WA2)diag(a(k)))+βk=1KXT..k(A+)TWC2diag(c(k))]×i=1I(diag(a(k))CTCdiag(a(i)))+2βI+C=[j=1J(X.j.(A+β(AT)+WB2)diag(b(j)))+γi=1IXTi..(B+)TWA2diag(a(i))]×j=1J(diag(b(j))ATAdiag(b(j)))+2γI+(8)

式(8)中, Xi.., X.j., X..k分别是三维数据阵X的第i个水平矩阵(J× K), 第j个侧面矩阵(K× I)和第k个正面阵I× J; A+, B+, C+分别表示A, B, C的Moore-penrose 广义逆。 α , β , γ 控制着PARAFAC与SWATLD的权重, 这三个参数的数值越大, APTLD越靠近SWATLD, 这样就可避免像PARAFAC对预估计组分数的敏感, 同时可在背景干扰下对待测样品进行定性和定量分析。

3.3 APTLD算法分析实验样品

3.3.1 未加腐殖酸干扰的预测样本分析

由于萘(NAP)、 芴(FLU)、 苊(ANA)三种荧光光谱严重重叠, PARAFAC等常规的方法无法同时进行定性和定量分析。 首先用F1— F7(校正样本)和L1— L2(测试样本)组成三维数据阵X(9× 76× 18), 然后用APTLD算法进行分析; 本文组分估计的方法采用核一致, 如图5所示, 由于光谱数据经过小波压缩, 避免了核一致由于数据多而陷入“ 沼泽” 的缺点; 防止求解结果出现不稳定, 对数据进行归一化处理。

图5 核一致判别组分数Fig.5 Discriminant the number of components by the core consistency diagnostic

从图5中可以看出当组分数超过3时, 核一致程度急剧下降, 而一般认为核一致值大于或等于60%时所对应的组分数就为应选取的組分数, 因此在定性分析时, 选择组分数为3。

图6中的(a)为荧光发射波长, (b)为荧光激发波长, 从(a)和(b)中可以看出, 芴(FLU)的荧光主峰波长位置为λ em=300~320 nm/λ ex=260~280 nm; 萘(NAP)的荧光主峰波长位置为λ em=310~330 nm/λ ex=260~290 nm; 苊(ANA)的荧光主峰波长位置为λ em=320~340 nm/λ ex=280~320 nm; 其中萘(NAP)和苊(ANA)的荧光波长主要在λ em=320~340 nm/λ ex=270~290 nm严重重叠, 萘(NAP)和芴(FLU)的荧光波长主要在λ em=310~320 nm/λ ex=270~280 nm严重重叠; 在各成分的荧光峰位置与其他成分重叠部分都有体现, 通过APTLD算法分辨的混合物各荧光光谱和实际的各单组分标准溶液荧光光谱用各种符号及色线标在相应的图中。 图6(c)为数据错误方差, 从图中可以看出, 当组分数越接近3时, 错误方差越小, 从另一方面说明了在定性分析时, 选择组分数为3(与核一致分析组分数的结果相同); 图6(d)为样本的散点图。

图6 用APTLD对混合物定性分析
(a): 发射波长分解; (b): 激发波长分解; (c): 错误方差; (d): 样本散点图
Fig.6 Classify the mixture with APTLD
(a): Classfication of emission wavelengths; (b): Classfication of excitation wavelengths; (c): Error variance graph; (d): samples map scatter plot

从图6中可以看出用APTLD算法对三种混合物严重重叠的复杂光谱体系中, 所得的这三种PAHs的发射和激发光谱与真实的光谱极为相似, 说明APTLD算法能对PAHs进行准确分辨。

3.3.2 加入腐殖酸干扰的预测样本分析

首先用F1— F7及L1— L2(校正样本)和T1— T3(测试样本)组成加入干扰时的三维数据阵X(12× 76× 18), 其中组分数选择4, 然后用APTLD算法进行分析。

在加入浓度较高的腐殖酸后(见表1), 从图7中可以看出腐殖酸的荧光光谱范围基本覆盖了三种PAHs的荧光光谱范围, 用APTLD算法对加入腐殖酸后的三种PAHs混合物进行分辨, 其主峰位置都未发生变化, 但是发射波长的归一化荧光强度减弱, 可能是受到了腐殖酸的影响。 从另一方面也说明了APTLD算法还是能在干扰物(腐殖酸)共存下实现这三种PAHs的准确分离。

图7 用APTLD对加了腐殖酸干扰的混合物定性分析
(a): 发射波长分解; (b): 激发波长分解
Fig.7 Classification of mixtures of humic acids by APTLD
(a): Classification of emission wavelength; (b): Classification of excitation wavelenth

3.4 萘(NAP)、 芴(FLU)、 苊(ANA)的定量分析

3.4.1 未加腐殖酸干扰

用APTLD算法对未加腐殖酸干扰的三种混合PAHs定性分析后得到浓度矩阵, 对分辨得到的归一化相对荧光强度和组分浓度进行回归分析, 分别得到回归方程: y=0.195c-0.026(NAP), 相关系数r=0.999; y=0.150c+0.012(FLU), 相关系数r=0.999; y=0.278c+0.063(ANA), 相关系数r=0.999, 结果如表3所示。

表3 三种PAHs的浓度预测和回收率 Table 3 Concentration prediction and recovery of three PAHs

3.4.2 加入腐殖酸干扰

同3.4.1方法, 用APTLD算法分别得到回归方程: y=0.194c-0.031(NAP), 相关系数r=0.997; y=0.150c+0.010(FLU), 相关系数r=0.998; y=0.270c+0.075(ANA), 相关系数r=0.998, 结果如表3所示。

评价一种方法的好坏, 通常在于对待测样品和有干扰物(腐殖酸)共存的实际样品的分析。 APTLD算法具有区别于其他方法的二阶优势, 即能在干扰物存在的情况下更准确的预测复杂分析物的特定成分。 分别用 SWATLD和APTLD两种二阶校正方法对三种PAHs(未加干扰时和模拟有腐殖酸干扰时)混合分辨。

表3中看出APTLD算法总体的预测结果比SWATLD算法好, 但这种差异较小, 总之两种算法总的预测能力都较好; 说明了即使在干扰物和混合物严重重叠的复杂光谱体系中, 两种三阶校正方法都可以用于PAHs的定量分析。

4 结 论

利用小波变换对实验光谱数据进行压缩, 其压缩分数和数据恢复分数分别大于92%和95%, 实验表明小波压缩能有效解决光谱数据中冗余信息问题。

实验利用三维荧光光谱法与APTLD算法相结合, 体现了二阶优势, 以“ 数学分离” 代替“ 化学分离” , 其回收率为94%~98%、 预测均方根误差(RMSEP)小于0.29 μ g· L-1, 实验表明该方法能在干扰物共存下对水中痕量PAHs准确快速的测定。

The authors have declared that no competing interests exist.

参考文献
[1] Vertika S D, Patel D K, Upreti M Y. Environmental Chemistry Letters, 2012, 10(2): 25. [本文引用:1]
[2] CHENG Peng-fei, WANG Yu-tian, CHEN Zhi-kun, et al(程鹏飞, 王玉田, 陈至坤, ). Spectroscopy and Spectral Analysis(光谱学与光谱分析), 2016, 36(7): 2062. [本文引用:1]
[3] Peiris R H, Jaklewicz M, Budman H, et al. Water Research, 2013, 47(10): 3364. [本文引用:1]
[4] Delhomme O. Environmental Science and Pollution Research, 2012, 19(5): 60. [本文引用:1]
[5] WANG Tong-yan, DENG Xiao-yan(王统艳, 邓晓燕). Analytical Instruments(分析仪器), 2012, 1(7): 6. [本文引用:1]
[6] AN Na, ZHANG Lin-ling, YU Zhao-qi(安 娜, 张琳羚, 余朝琦). Chemical Engineering and Equipment(化学工程与装备), 2015, (9): 160. [本文引用:1]
[7] Cohen M A. Encyclopedia of Energy, Natural Resource, and Environmental Economics, 2013, (3): 121. [本文引用:1]
[8] GE Zhe-xue, Javert(葛哲学, 沙威). Wevelet Analysis Theory and MATLAB R2007 Implementation(小波分解理论与MATLAB R2007实现). Beijing: Electronic Industry Press(北京: 电子工业出版社), 2007. 333. [本文引用:1]
[9] LI Guo-bin, GUAN De-lin, LI Ting-ju(李国宾, 关德林, 李廷举). Vibration and Shock(振动与冲击), 2011, 30(8): 149. [本文引用:1]
[10] Xia A L, Wu H L, Fang D M, et al. Chemometric S, 2005, 2(19): 65. [本文引用:1]
[11] YANG Li-li, WANG Yu-tian, LU Xin-qiong(杨丽丽, 王玉田, 鲁信琼). Chinese Journal of Lasers(中国激光), 2013, 40(6): 303. [本文引用:1]
[12] JIANG Jun-duo, WU Hai-long(江军朵, 吴海龙). Fine Chemical Intermediates(精细化工中间体), 2007, 37(1): 69. [本文引用:1]
[13] WU Hai-long, FANG Dong-mei, DING Yu-jie(吴海龙, 方冬梅, 丁玉洁). Hunan University Journal·Natural Science Edition(湖南大学学报·自然科学版), 2005, 32(3): 6. [本文引用:1]