三维荧光光谱结合小波压缩与交替惩罚四线性分解算法测定多环芳烃
王书涛, 刘婷婷*, 高凤凯, 崔耀耀, 杨哲, 王玉田
燕山大学河北省测试计量技术及仪器重点实验室, 河北 秦皇岛 066004
*通讯联系人 e-mail: 2413950643@qq.com; 15076006137@163.com

作者简介: 王书涛, 1978年生, 燕山大学电气工程学院教授 e-mail: y.t.wang@163.com

摘要

基于三维荧光光谱结合交替惩罚四线性分解(APQLD)对痕量多环芳烃(PAHs)进行检测, 实验以苊(ANA)和萘(NAP)为研究对象。 首先利用小波变换对得到的三维荧光光谱数据进行压缩, 以消除数据的冗余信息。 分别在乙醇溶剂、 甲醇溶剂以及超纯水条件下测定不同浓度的PAHs的激发-发射荧光光谱, 并将其组合构建四维数据, 利用APQLD对构建的四维光谱数据进行分析, 并对比了PAHs在三种溶剂条件下各自的回收率。 实验结果表明, 用不同溶剂构建的四维数据能更准确地测定PAHs的浓度, 其回收率更高; 对比二阶校正以及其他四维校正算法, APQLD更能体现四维算法所具有的优越性; 当因子数 N=3时, ANA的回收率为96.5%~103.3%, 预测均方根误差为0.04 μg·L-1; NAP的回收率为93.3%~110.0%, 预测均方根误差为0.08 μg·L-1

关键词: 四维光谱数据; 交替惩罚四线性分解; 三维荧光光谱; 小波压缩; 多环芳烃
中图分类号:O657.3 文献标识码:A
Three-Dimensional Fluorescence Spectroscopy Combined with Wavelet Compression and Alternate Penalty Quad Linear Decomposition for Environmental Analysis: Determination of Polycyclic Aromatic Hydrocarbons
WANG Shu-tao, LIU Ting-ting*, SHANG Feng-kai, CUI Yao-yao, YANG Zhe, WANG Yu-tian
Measurement Technology and Instrument Key Lab of Hebei Provice, Yanshan University, Qinhuangdao 066004, China
Abstract

The quantitative and quantitative analysis of trace polycyclic aromatic hydrocarbons (PAHs) was carried out based on three-dimensional fluorescence spectroscopy combined with alternating penalty four linear decomposition (APQLD). The experiment was carried out with acenaphthene (ANP) and naphthalene (ANA). First, in order to solve the redundant information of the three-dimensional fluorescence spectral data, the experimental spectral data was compressed by wavelet transform. The four-dimensional data were constructed by using the combination of excitation and emission spectra of PAHs in ethanol solvent and methanol solvent and ultrapure water respectively. The four-dimensional spectral data were analyzed by APQLD and compared with PAHs under three solvent conditions The respective recovery rate. The experimental results showed that the higher order data can be used to determine the concentration of PAHs more accurately under the three solvent conditions, and the recovery rate was higher. Compared with the second-order correction and other four-dimensional correction algorithms, APQLD can better reflect the superiority of the four-dimensional algorithm The recovery rate of ANA was 96.5%~103.3% and the predicted root mean square error was 0.04 μg·L-1. The recovery rate of NAP was 93.3%~110.0%, and the predicted root mean square error was 0.08 μg·L-1.

Key words: Four-dimensional spectral data; Alternating penalty four linear decomposition; Three-dimensional fluorescence spectra; Wavelet compression; Polycyclic aromatic hydrocarbons
引言

多环芳烃(polycyclic aromatic Hydrocarbons, PAHs)是指两个或者两个苯环以稠环形式组成的碳氢化合物, 具有惰性较强和致癌等性质, 是一类痕量有机污染物[1, 2, 3], 1990年我国提出的68种水体优先控制污染中有七种属于多环芳烃[4]。 三维荧光光谱信息含量丰富, 特征显著, 具有很好的选择性, 可用于多组分混合物的分析, 国内水中有机污染[5]的检测领域中关于PAHs的研究较少, 因此对痕量PAHs测定方法的研究具有重要意义。

二阶校正类算法在处理理想情况下的光谱数据时能获得基本一致的结果, 但实际的光谱数据往往存在重叠峰、 噪声和散射等干扰问题, 处理此类数据时会出现不理想的效果。 三阶校正类算法不仅具有像交替惩罚三线性分解(alternating penalty trilinear decomposition, APTLD)、 平行因子(parallel factor analysis, PARAFAC)等二阶校正类算法的分解唯一性及“ 二阶优势” [6], 而且还会包含更多的优势。 Kim等[7]比较了三线性平行因子分析和四线性平行因子分析的结果, 认为后者比前者具有更高的选择性[8], 李淑芳等利用四维化学计量学算法测定人血浆样中的盐酸普鲁卡因, 结果表明三阶校正算法更具有优势[9]

目前, 四维数据校准(即三阶校正)类算法不断被国内外专家学者[10]研发和完善, 如四线性平行因子分析(quadrilinear parallel factor analysis, 4-PARAFAC), 交替惩罚四线性分解(alternating penalty quadrilinear decomposition, APQLD), 展开最小二乘法和多维最小二乘法线性化(U-PLS/RTL, N-PLS/RTL)等[11], 其中APQLD[9]不但具有“ 三阶优势” , 能在未知干扰或背景下以“ 数学分离” 代替“ 物理和化学分离” 且分解结果较为稳定, 还能避免如4-PARAFAC对组分数敏感和收敛速度慢的缺点。

为了消除三维荧光光谱数据中存在的环境噪声等冗余信息, 在数据预处理时选用小波变换对数据进行压缩。 小波变换能在保证光谱强度信息不丢失前提下, 有效剔除冗余信息[12, 13]。 本文中利用三种算法解析构建的四维数据矩阵, 并将结果与PAHs在三维数据下测得的回收率对比; 实验结果表明所构建的PAHs的四维光谱数据能够获得比三维光谱数据更加准确的定性和定量分析结果。

1 理论部分
1.1 四线性模型

对四线性成分模型, 按标量表述, 可从多线性成分模型中类推四维数据阵 X¯q的每个元素xijkl表达如等式(1)所示

xijkl=n=1Nainbjnckndln+eijkli=1, 2, , I, j=1, 2, , J, k=1, 2, , K, l=1, 2, , L(1)

其中, xijkl是四维数据阵 X¯q中的组成元素; ain, bjn, ckn, dln分别是矩阵中A(I× N), B(J× N), C(K× N), D(L× N)的一个元素; eijkl为对应于四维残差阵Eq的组成元素; N为四线性模型的总组分数(实际对荧光有贡献的主分数和背景干扰)[10]

1.2 交替惩罚四线性分解(APQLD)算法[10]

APQLD算法是APTLD算法在四维数据阵分析中的扩展, 既能兼顾4-PARAFAC分析对组分解析平滑的优点, 又具有对组分数不敏感和收敛速度快的优点; 四线性模型所得到的目标函数是各元素残差的平方和, 四个目标函数如等式(2)所示

σ1(A)=i=1IXi...-Bdiag(ai)DT2Fσ2(B)=j=1JX.j..-Cdiag(bj)AT2Fσ3(C)=k=1KX..k.-Ddiag(ck)BT2Fσ4(D)=l=1LX...l-Adiag(dl)CT2F(2)

APQLD算法基于交替最小二乘原理, 最小化四个目标函数可获得式(3)— 式(6)四个等式

A=(k=1Kl=1LX..kl(B+q(B+)TWB)diag(c(k))diag(d(l)))+qj=1Jk=1KXT.jk.(D+)TWDdiag(b(j)diag(c(k)))(k=1Kl=1Ldiag(c(k))diag(d(l))(BTB+qWB)diag(c(k))diag(d(l)))+qj=1Jk=1KWD(diag(b(j)diag(c(k)))2)+(3)

B=(l=1Li=1IXi..l(C+r(C+)TWC)diag(d(l))diag(a(i)))+rk=1Kl=1LXT..kl(A+)TWAdiag(c(k)diag(d(l)))(l=1Li=1Idiag(d(l))diag(a(i))(CTC+rWC)diag(d(l))diag(a(i)))+rk=1Kl=1LWA(diag(c(k)diag(d(l)))2)+(4)

C=(i=1Ij=1JXij..(D+s(D+)TWD)diag(a(i))diag(b(j)))+sl=1Li=1IXTi..l(B+)TWBdiag(d(l)diag(a(i)))(i=1Ij=1Jdiag(a(i))diag(b(j))(DTD+sWD)diag(a(i))diag(b(j)))+sl=1Li=1IWB(diag(d(l)diag(a(i)))2)+(5)

D=(j=1Jk=1KX.jk.(A+p(A+)TWA)diag(b(j))diag(c(k)))+pi=1Ij=1JXTij..(C+)TWCdiag(a(i)diag(b(j)))(j=1Jk=1Kdiag(b(j))diag(c(k))(ATA+pWA)diag(b(j))diag(c(k)))+pi=1Ij=1JWC(diag(a(i)diag(b(j)))2)+(6)

p=q=r=s=0时, APQLD算法将等同于4-PARAFAC算法。

1.3 小波变换原理

小波变换的步骤: (1) 用小波分解信号。 (2) 对于高频系数, 在阈值量化处理时, 从第1到第N层均可用不同的阈值, 且通过硬阈值将高频系数进行量化。 (3) 在系数量化后, 用小波进行重构。

f(t)=ncj, n2-j/2ϕ(2-jt-n)+ndj, n2-j/2Ψ(2-jt-n)(7)

式(7)的右边第一项为f(t)的低频分量, 即f(t)的轮廓部分, 第二项为f(t)的高频分量, 即f(t)的细节部分, cj, ndk, nj尺度上的展开系数。 ϕ (t)和Ψ (t)为正交基。

cj-1, m=ncj, nh0(m-2n)+ndj, nh1(m-2n)(8)

式(8)为小波变换系数的重构公式, 也是小波逆变换公式, 其中h0h1是滤波器系数, 在实际中是有限长。

由小波数据压缩原理, 幅值较小的小波系数可通过阈值的设置来舍弃, 而对幅值较大的小波系数进行保留; 小波系数经过平滑和阈值处理后, 用小波逆变换对系数进行重构。

d˙k(j)=dk(j)|dk(j)|Tj0|dk(j)|< Tj=1, 2, , l-1, l(9)

式(9)中T为阈值, d˙k(j)为小波变换系数, l为实际分解的层数。 由于db3小波函数具有很多优点, 例如小波滤波器系数少和很好的紧支性、 正交性, 所以对实验光谱数据压缩时, 选取db3小波函数。

2 实验部分
2.1 仪器、 试剂和样品

样本的三维荧光光谱数据由Edinburgh Instruments 公司生产的FS920稳态荧光光谱仪(光谱波长响应范围为200~900 nm, 液氮制冷范围为77~320 K, 激发光源使用功率是450 W, 信噪比是6 000:1)获得。 为了避免一级瑞利散射的干扰, 设置激发起始波长超前发射起始波长。 参数设置如下: 两种PAHs的激发波长200:10:370 nm, 发射波长240:2:390 nm, 激发和发射端狭缝宽度为1.11 mm, 对应光谱分辨率为2 nm。 萘(Naphthalene, NAP)和苊(Acenaphthylene, ANA)的标准品(纯度≥ 99.5%)购于上海阿拉丁生化科技公司。

2.2 方法

样品制备过程如下: (1)用精密电子秤取两种PAHs样品各0.01 g, 用甲醇(光谱级)溶解并分别定容于两个10 mL的容量瓶中, 得到浓度为1 g· L-1的一级储备液并在4 ℃条件下避光保存。 (2)分别取0.1 mL的一级储备液, 用甲醇溶剂稀释两次并定容于10 mL容量瓶中, 配制成100 μ g· L-1的标准溶液。 (3)取不同体积的各标准溶液, 用甲醇溶剂稀释且通过混合配制, 形成不同浓度的9个校正样本和7个待测样本。 (4)分别用乙醇溶剂(光谱级)和用超纯水重复按照步骤(1)— 步骤(3)配制成不同浓度的9个校正样本和7个待测样本(各样本与在甲醇溶剂条件下的浓度相同)。 具体浓度见表1

表1 预测样品配制浓度(μ g· L-1) Table 1 Predict samples preparation concentration(μ g· L-1)
3 光谱数据处理与分析
3.1 实验数据预处理

小波变换具有失真率低、 局部分辨能力较强的特点, 能在不同分解层次对小波系数量化处理, 消除冗余和噪声。 以表1中C2m为例, 如图1和图2所示。

从图1中可看出压缩前后的主要谱线形状、 峰值位置及荧光强度基本未发生变化。

图1 萘(NAP)压缩前后对比Fig.1 Before and after compression of NAP

从图2的(b1)— (b4)中可看出, 在对萘(NAP)分解压缩和重构过程中, 各光谱数据的荧光强度值在压缩时去除了冗余信息, 保留了有用数据。

3.2 构建四维光谱数据

两种PAHs分别在甲醇溶剂、 乙醇溶剂、 超纯水中具有不同的荧光强度以及光谱形状(以表1中T7为例, 如图3所示), 将不同溶剂作为新的一维信息引入, 是构建四维数据并进一步采用四线性化学计量学算法进行定性和定量分析的依据。 分别以甲醇、 乙醇和超纯水作为溶剂并配制3组相同浓度共27个校正样本和21个待测样本, 可获得四维数据阵 X¯q=76× 18× 16× 3, 其中76代表发射波长数, 18代表激发波长数; 16代表9个校正样本和7个待测样本; 3代表溶解次数, 即对于9个校正样和7个待测样本是指在三种不同溶剂中溶解的组合。 X¯q还可以展开为三维数据阵X=76× 18× 48, 76和18仍为发射和激发波长数; 48代表27个校正样本和21个待测样本。

图2 萘(NAP)的局部压缩前后对比Fig.2 NAP local compression before and after

图3 T7(T7U, T7m, T7e)分别在三种溶剂中溶解的光谱图Fig.3 Spectra of T7 dissolved in three solvents

3.3 光谱数据算法的优劣比较

ANA和NAP(见表1中C1和C2)在三种不同溶剂中的标准激发波长和发射波长校准线如图4所示, 从图中可看出ANA的荧光峰的峰位置为λ em=320~340 nm/λ ex=280~310 nm, NAP的荧光峰的峰位置为λ em=310~340 nm/λ ex=260~300 nm, 其中线条“ 黑色” 在乙醇溶剂中, 线条“ 红色” 表示在甲醇溶剂中, 线条“ 蓝色” 表示超纯水。

图4 两种PAHs在三种不同的溶剂中标准激发波长和发射波长校准线Fig.4 The standard excitation wavelengths and emission wavelength calibration lines of two PAHs in three different solvents

3.3.1 定性分析

用APQLD进行实验数据分析时, 采用核一致方法估计组分数, 如图5所示。

图5 核一致判别组分数Fig.5 Discriminant the number of components by the core consistency diagnostic

从图5中可以看出当组分数超过3时, 核一致程度急剧下降, 鉴于APQLD算法具有对组分数不敏感的特点, 因此在定性分析时, 考虑背景的影响, 分别先选择组分数N=2, N=3, N=4做比较, 然后选择最佳因子数进行定性和定量分析。

图6为APQLD对两种PAHs混合物的定性分析: (a1)— (a4)分别为N=2(N代表因子数)时的样本图、 发射波长图、 激发波长图以及样本(T1— T7)在三种不同溶剂中溶解图; 同上述一样, (b1)— (b4)分别是N=3时定性分析的四种图; (c1)— (c4)分别是N=4时定性分析的四种图; 其中“ 蓝色” 代表NAP, “ 红色” 代表ANA, “ 草绿色” 和“ 紫色” 代表背景(溶剂或其他)。 从图6中可看出, 当N=3时APQLD算法对两种PAHs混合物定性分析的总体实验结果最好。

图6 用APQLD对混合物定性分析Fig.6 Classify the mixture with APQLD

3.3.2 4-PARAFAC算法的对比

图7为4-PARAFAC对两种PAHs混合物的定性分析: 图中每种线条的颜色代表的物质及意义与本文的“ 3.1.1” 小节描述相同, 从图中可看出N=3时4-PARAFAC定性分析的结果较好, N=4时4-PARAFAC未能有效地分辨出混合物, 说明该算法对组分数敏感。

图7 用4-PARAFAC对混合物定性分析Fig.7 Classify the mixture with 4-PARAFAC

3.3.3 定量分析的比较

采用APQLD算法(N=3)对两种混合PAHs定性分析后得到浓度矩阵, 对分辨得到的相对荧光强度和组分浓度进行回归分析, 如图8所示, 定量分析后的结果见表2表4

图8 APQLD分解的浓度回归曲线Fig.8 Decomposition of the concentration regression curve by APQLD

表2 两种PAHs通过不同算法分析的浓度预测和回收率对比 Table 2 Concentration prediction and recovery of two PAHs by different algorithms

表2中可看出: 因子数为3时两种算法的预测结果相比其他因子数更好, 其中APQLD算法综合的预测能力相比4-PARAFAC算法更精准。

3.4 二阶校正算法的对比

利用表1中C1m— C9m(校正样本)和T1m— T7m(待测样本)组成三维数据阵X1(16× 76× 18); C1e— C9e(校正样本)和T1e— T7e(待测样本)组成三维数据阵X2(16× 76× 18); C1U— C9U(校正样本)和T1U— T7U(待测样本)组成三维数据阵X3(16× 76× 18); 其中16代表的是样本数(校正样本和待测样本), 76代表发射波长数, 18代表激发波长数; 采用APTLD算法分别对X1, X2, X3进行分析, 结果如图9以及表3表4所示。

图9为APTLD对两种PAHs混合物的定性分析: (a1)— (a3), (b1)— (b3), (c1)— (c3)分别为N=3(N代表因子数)时样本图、 发射波长以及激发波长图; 其中“ 蓝色” 代表NAP, “ 红” 代表ANA, “ 草绿” 代表背景。

从图9以及表3表4可看出在用二阶校正算法(APTLD)对两种PAHs进行分析时, 两种PAHs相比与本文所构建的四维光谱数据, 综合预测效果较差, 而两种PAHs在超纯水中的溶解度较低, 实验采用的乙醇溶剂的主峰光谱(λ em=300~330 nm, λ ex=260~300 nm)与两种PAHs的主峰光谱较为相近, 甲醇溶剂的主峰光谱(λ em=400~430 nm, λ ex=350~380 nm)与两种PAHs的主峰光谱间隔较远, 所以在甲醇溶剂中的效果总体比乙醇溶剂和超纯水中的效果好。

图9 用APTLD对混合物定性分析Fig.9 Classify the mixture with APTLD

表3 两种PAHs在三种溶剂中的浓度预测和回收率(N=3) Table 3 Concentration prediction and recovery of two PAHs in three solvents (N=3)
4 结果与讨论

表2表3以及表4中可看出APQLD算法综合的预测能力较好, 4-PARAFAC算法综合预测结果次之, 而APTLD算法算法综合预测结果较差, 但这种差异较小。 实验结果表明: 对比三维校正以及其他四维校正算法, APQLD更能体现四维算法所具有的优越性。 从图7和图8以及图9可看出, NAP的荧光峰位置略有左移, 可能受仪器或环境的影响。 总之三种算法总的预测能力都较好; 说明了即使在干扰物和混合物严重重叠的复杂光谱体系中, 两种四维校正方法和一种三维校正方法都可以用于PAHs的定量分析。

表4 不同算法分析两种PAHs的对比 Table 4 Comparison of two PAHs identification methods
4 结 论

(1)在光谱数据预处理中, 小波变换(db3小波函数)用于压缩实验光谱数据, 可有效解决三维荧光光谱数据的冗余信息问题。

(2)实验结果表明两种PAHs分别在三种溶剂中的单独预测结果较差, 而本文提出的在三种溶剂条件下组合构建的四维光谱数据综合预测结果更好, 更具有优势。

(3)提出三维荧光光谱法与APQLD算法相结合, 相比4-PARAFAC和APTLD两种算法所获得的实验结果, APQLD给出了更好的实验结果, 不仅保持了“ 三阶优势” , 又探索了“ 高阶优势” , 以“ 数学分离” 代替了“ 物理和化学分离” 。 实验表明该方法能在混合物严重重叠的复杂光谱体系中对痕量PAHs准确地测定。

致谢: 燕山大学河北省测试计量技术及仪器重点实验室提供做实验的相关仪器。

The authors have declared that no competing interests exist.

参考文献
[1] Vertika S D, Patel D K, Upreti M Y. Environmental Chemistry Letters, 2012, 10: 159. [本文引用:1]
[2] CHENG Peng-fei, WANG Yu-tian, CHEN Zhi-kun, et al(程鹏飞, 王玉田, 陈至坤, ). Spectroscopy and Spectral Analysis(光谱学与光谱分析), 2016, 36(7): 2162. [本文引用:1]
[3] Peiris R H, Jaklewicz M, Budman H, et al. Water Research, 2013, 47(10): 3364. [本文引用:1]
[4] Delhomme O, Millet M. Environmental Science and Pollution Research, 2012, 19(5): 1791. [本文引用:1]
[5] Cohen M A. Encyclopedia of Energy, Natural Resource, and Environmenta Economics, 2013, (3): 121. [本文引用:1]
[6] Wang Li, Wu Hailong, Yin Xiaoli. Spectrochimica Acta Part A: Molecular and and Biomolecular, 2017, 170: 104. [本文引用:1]
[7] Kim Y C, Jordan J A, Nahorniak M L, et al. Analytical Chemistry, 2005, 77(23): 7679. [本文引用:1]
[8] FU Hai-yan(付海燕). Chemical Pattern Recognition and Multidimensional Calibration and Its Application in Complex System Analysis( 化学模式识别和多维校正方法及其在复杂体系分析中的应用研究). Hunan University(湖南大学), 2010: 74. [本文引用:1]
[9] LI Shu-fang(李淑芳). Structural Analysis and Multidimensional Calibration of Second Order Correction Algorithm for Quantitative Analysis of Complex Dynamic System Drugs( 二阶校正算法结构剖析和多维校正用于复杂动态体系药物定量分析研究 ), Hunan University(湖南大学), 2010: 62. [本文引用:2]
[10] Qing Xiangdong, Wu Hailong. Chemometrics and Intelligent Laboratory Systems, 2014, 132: 8. [本文引用:3]
[11] Olivieri A C, Wu H L, Yu R Q. Chemom. Intell. Lab. Syst. , 2012, 116: 9. [本文引用:1]
[12] GE Zhe-xue, Javert(葛哲学, 沙威). Beijing: Electronic Industry Press(北京: 电子工业出版社), 2007. 333. [本文引用:1]
[13] LI Guo-bin, GUAN De-lin, LI Ting-ju(李国宾, 关德林, 李廷举). Journal of Vibration and Shock(振动与冲击), 2011, 30(8): 149. [本文引用:1]