三维荧光结合三阶校正算法快速检测水中酚类化合物
商凤凯1, 王玉田1, 王君竹1, 孙洋洋1,*, 程朋飞2, 张令1,3, 王书涛1
1. 燕山大学河北省测试计量技术及仪器重点实验室, 河北 秦皇岛 066004
2. 华北理工大学电气工程学院, 河北 唐山 063210 3. 河北工程大学机械与装备工程学院, 河北 邯郸 056038
*通讯联系人 e-mail: shang_f_k@163.com

作者简介: 王玉田, 1952年生, 燕山大学电气工程学院教授 e-mail: y.t.wang@163.com

摘要

苯酚和麝香草酚等酚类化合物对人体和动植物有着严重危害, 且这些酚类化合物往往同时存在于水体。 由于苯酚和麝香草酚的激发和发射光谱重叠严重, 常规荧光方法不能实现直接快速测定。 基于三维荧光光谱结合四维平行因子(4-PARAFAC)算法, 对存在未知干扰物的湖水中苯酚和麝香草酚进行定性和定量分析。 利用三维平行因子和四维平行因子算法分解光谱数据, 探索三阶校正算法的“三阶优势”。 通过引入温度维来构建四维数据阵, 将不同温度下扫描得到的激发发射矩阵沿样本维叠加得到四维数据阵, 结合基于四维平行因子的三阶校正算法对目标分析物进行定性定量分析。 为避免溶剂散射和仪器的影响, 需要对扫描得到的激发发射矩阵信号进行预处理。 通过空白扣除法和Delaunay三角内插值法去除激发发射矩阵中散射信号, 再进一步进行激发发射校正, 得到真实光谱。 然后分别使用基于平行因子的二阶校正算法和基于四维平行因子的三阶校正算法对光谱数据进行分析, 对比两种算法的分析结果。 结果表明, 四维数据阵并不是三维激发发射矩阵简单的叠加, 得到的四维数据可能含有丰富的高维信息, 有助于改善对分析物的测量结果。 四维平行因子算法解析得到的湖水中苯酚和麝香草酚的平均回收率分别为97.7%±9.2%和96.5%±8.8%, 预测均方根误差为0.047和0.057 μg·mL-1, 预测相对误差低于10%, 分析结果优于三维平行因子(平均回收率分别为105.7%±15.3%和111.0%±3.6%, 预测均方根误差为0.090和0.056 μg·mL-1, 预测相对误差高于10%)。 实验表明, 样本中存在复杂干扰背景和数据共线性严重时, 三阶校正算法能够得到比二阶校正算法更满意的结果, 为复杂体系中苯酚和麝香草酚的检测提供了可靠方法。

关键词: 三维荧光光谱; 三阶校正; 温度; 苯酚; 麝香草酚
中图分类号:O657.3 文献标志码:A
Determination of Phenolic Compounds in Water Using Three-Way Fluorescence Spectroscopy Coupled with Third-Order Calibration Algorithm
SHANG Feng-kai1, WANG Yu-tian1, WANG Jun-zhu1, SUN Yang-yang1,*, CHENG Peng-fei2, ZHANG Ling1,3, WANG Shu-tao1
1. Measurement Technology and Instrument Key Lab of Hebei Provice, Yanshan University, Qinhuangdao 066004, China
2. North China University of Science and Technology, Tangshan 063210, China 3. Hebei University of Engineering, Handan 056038, China
*Corresponding author
Abstract

Phenol, thymol and other phenolic compounds seriously harm the human body, animals and plants. They often exist in water at the same time. Because the excitation emission spectra of phenol and thymol are overlapped severely, and the conventional fluorescence method cannot achieve direct and rapid determination. identification and quantification of two phenolic compounds (phenol and thymol) in lake water with unknown interferences using the three-dimensional fluorescence spectroscopy combined with four- dimensional parallel factor (4-PARAFAC) algorithm. The spectral data were analyzed and processed by the three-way parallel factor and the four-way parallel factor algorithm to explore the “high-order advantage” of the third-order correction algorithm. In this paper, the method of introducing an extra solvent mode to construct four-way data set was firstly used. The four-dimensional data array was obtained by superimposing the excitation emission matrixs obtained by scanning at different temperatures along the temperature dimension. identification and quantification of two analytes using third-order calibration method based on four-way PARAFAC coupled with four-dimensional data. In order to avoid the influence of the instrument and scattering of solvent, firstly, the data obtained by scanning was preprocessed. The scattering signal in the excitation emission matrixs was removed by subtracting the blank sample and Delaunay trigonometric interpolation, and further excitation emission correction was performed to obtain true spectra. Then the data were analyzed using the second-order calibration algorithm based on the parallel factor and the third-order calibration algorithm based on the four-dimensional parallel factor, and the analysis results of two algorithms were compared. The results showed that the four-dimensional data array does not stimulate the simple superposition of emission matrices, and the four-dimensional data have rich high-dimensional information, which helps to improve the measurement results of the analytes. The average recoveries were obtained by the four-way parallel factor analysis algorithm, being the results: 97.7%±9.2% for phenol and 96.5%±8.8% for thymol. And the root-mean-square error of prediction values, for phenol and thymol, were 0.047 and 0.057 μg·mL-1, and the values of prediction relative error were less than 10%. Which were better than the results of three-way parallel factor analysis (105.7%±15.3% for phenol and 111.0%±3.6% for thymol, and the root-mean-square error of prediction values, for phenol and thymol, were 0.090 and 0.056 μg·mL-1, and the values of prediction relative error were larger than 10%). In short, the third-order calibration algorithm was superior to the second-order calibration algorithm in the sample with high background interference and severe collinearity. It provides a reliable method for the determination of phenol and thymol in the complex system.

Keyword: Three-dimensional fluorescence spectrum; Third-order calibration; Temperature; Phenol; Thymol
引言

苯酚(Phenol)和麝香草酚(Thymol)等酚类化合物具有防腐、 消毒等特性被广泛应用于工业、 农业和生活中。 这些酚类物质随着废水的排放, 对环境造成严重污染, 危害人类和动植物的生命健康。 苯酚是一种高毒性有机化合物, 摄入人体后危害呼吸中枢, 也会对肝脏和肾脏等器官造成损伤, 麝香草酚虽然毒性小, 但长期摄入体内同样会对身体造成严重伤害, 这些化合物被美国和欧盟等国家列为优先关注污染物[1]

国内外对酚类化合物的测定方法主要为高效液相色谱法[2, 3, 4]等, 这些方法需要复杂的预先提取和纯化, 消耗大量的有机试剂, 对环境造成二次污染, 且色谱法局限于实验室, 检测周期长, 不利于小型化以满足现场检测。 三维荧光光谱技术, 具有灵敏度高, 检测限低和操作简单等优点[5], 结合化学计量学的二阶校正算法可实现复杂体系中目标分析物的测定。 实现“ 数学分离” 代替“ 化学分离” 。 但当测得的光谱数据存在严重共线性或背景干扰时, 二阶校正算法无法得到满意的解析结果。 而三阶校正算法不仅继承了二阶校正算法的“ 二阶优势” , 还具有丰富的“ 三阶优势” [6, 7, 8]。 Zhang等[9]利用二阶和三阶校正算法同时检测人体体液培养基中的五味子醇甲和五味子乙素含量, 结果表明前者测定结果出现较大偏差, 三阶校正算法优势明显。 Rubio等[10]利用三阶校正算法完成了莴苣菜中三种农药含量的检测, 研究了算法的“ 三阶优势” 。

目前, 一些三阶校正算法, 如4-PARAFAC[11], 展开(多维)偏最小二乘结合残差三线性(U-PLS/RTL[12], N-PLS/RTL[13]), 交替四线性分解(AQLD)[14]等可以用来分析四维数据。 实现复杂体系中严重共线性数据的解析。 其中4-PARAFAC算法抗噪性强, 拟合效果好。

文章通过引入温度维, 来探索构建四维数据, 结合基于4-PARAFAC的三阶校正方法, 在目标分析物间和目标分析物与背景干扰物光谱重叠严重情况下, 实现了湖水样中苯酚和麝香草酚的同时测定。 同时利用三维平行因子算法分析单一温度下的光谱数据, 对比两种算法的结果, 构建的四维光谱数据能够得到比三维数据更满意的结果。 研究结果为水环境中有机污染物的检测提供了新的理论依据。

1 实验部分
1.1 仪器与试剂

光谱仪采用FS920荧光光谱仪(英国Edinburgh Instruments公司, 光谱波长响应范围200~900 nm, 液氮制冷范围77~320 k, 激发光源为功率450 W的脉冲氙灯, 信噪比6 000∶ 1。 ), 扫描样品时, 设置激发波长230~320 nm, 发射波长240~360 nm, 步长均为2 nm, 狭缝宽度3 nm。 样品室温度分别为15, 20和25 ℃。

实验所采用的试剂, 麝香草酚(GC, > 99%), 苯酚(GC, > 99.5%), 间甲酚(GC, > 99%), 甲醇(色谱纯), 均购买于上海阿拉丁试剂公司; 湖水取自燕鸣湖(秦皇岛市); 去离子水为实验室自制(华南高科HKD-400-T); 0.45 μ m滤膜。

1.2 样本配制

称取苯酚(Phenol), 麝香草酚(Thymol)和间甲酚(M-cresol)适量, 用甲醇溶解后定容于100 mL棕色容量瓶, 得到1 g· L-1一级储备液; 取0.1 mL一级储备液用去离子水定容至10 mL棕色容量瓶, 得到10 mg· L-1工作液, 放于冰箱中保存(4 ℃)。 分别取适量的工作液(浓度见表1)于13个10 mL容量瓶, 校正样本用去离子水定容, 5个预测样本用湖水(使用前用0.45 μ m滤膜进行过滤)定容。 为了更好的体现三阶校正算法的优越性, 在配制湖水样本时, 根据水环境的复杂性加入适量间甲酚作为干扰物, 其含量高于两种目标分析物中一种或所有。 间甲酚的激发发射光谱与目标分析物的光谱重叠十分严重, 荧光强度高。 再加上湖水中未校正干扰物, 从定性和定量分析角度达到严重的干扰效果。

表1 校正样本和预测样本浓度(μ g· mL-1) Table 1 Distribution of concentrations for the samples (μ g· mL-1)
2 理论部分
2.1 四线性模型

四线性模型用来分析处理实验扫描得到的四维数据, 能够更好的解决数据共线性问题。 将同一样本在不同温度下扫描得到的激发发射矩阵(EEM)构成三维数据阵, 再将三维数阵沿样本维叠加, 可得到四维数据阵Xq。 四维数据阵Xq中的每个元素xijkl按标量可表示为

xijkl=n=1Nainbjnckndln+eijkl (i=1, , I; j=1, , J; k=1, , K; l=1, , L)(1)

其中ain, bjn, ckndln分别是矩阵A(I× N), B(J× N), C(K× N), D(L× N)的元素; eijkl为四维残差数据阵Eq的元素; N为四线性模型的总组分数(实际对荧光有贡献的主成分数和背景干扰)。

2.2 四维平行因子算法

四维平行因子(four-way PARAFAC)算法是三维平行因子模型的延伸, 是分析三阶数据比较理想的方法[15]。 其分解得到的光谱比较平滑, 抗噪性能强, 拟合效果好, 具有“ 三阶优势” [16, 17]。 通过交替残差平方和最小化来求解, 其目标函数可表示为

σ(A)=XI×JKL-A(D☉C☉B)TF2(2)σ(B)=XJ×KLI-B(A☉D☉C)TF2(3)σ(C)=XK×LIJ-C(B☉A☉D)TF2(4)σ(D)=XL×IJK-D(C☉B☉A)TF2(5)

其中☉为Khatri-Rao积; 基于最小二乘原理, 最小化4-PARAFAC的目标函数可得解

A=XI×JKL[(D☉C☉B)T]+(6)B=XJ×KLI[(A☉D☉C)T]+(7)C=XK×LIJ[(B☉A☉D)T]+(8)D=XL×IJK[(C☉B☉A)T]+(9)

3 结果与讨论
3.1 光谱分析及预处理

温度对溶液的荧光强度有着显著影响。 通常, 随着温度的降低, 溶液的荧光量子产率和荧光强度将增大。 这是由于随着溶液温度的上升, 溶剂的驰豫作用减小, 荧光分子和溶剂分子的碰撞猝灭几率加大。 溶液的荧光强度与温度的关系可表示为,

(F0-F)/F=ke-E/RT(10)

式中, F0为溶液温度上升之前的荧光强度, F为溶液温度上升之后的荧光强度; R为气体常量; E为激发态分子转移至基态曲线时所需的额外热能, 亦即激发热; T为热力学温度。

麝香草酚和苯酚溶液在不同温度下的激发发射光谱如图1所示。 从图1可看出, 两种分析物的光谱在温度变化时其光谱形状几乎没有影响。 这一现象为温度维的引入和四维数据阵的构建奠定了理论基础, 进而使用性能更优越的三阶校正算法。 麝香草酚的荧光峰位置为276 nm/304 nm, 苯酚的荧光峰位置为270 nm/298 nm。

图1 苯酚和麝香草酚在不同温度时的激发-发射光谱图
蓝色为15 ℃, 绿色为20 ℃, 红色为25 ℃
Fig.1 The normalized profiles of thymol and phenol at different temperatures
15 ℃ in blue, 20 ℃ in green, 25 ℃ in red

对样本进行扫描时, 受溶剂和其他因素的影响, 获得的激发发射数据阵中存在散射信号。 其强度大于分析物荧光强度, 影响分析物的测定[见图2(a)]。 为了最大程度的减小光谱失真, 采用空白扣除和Delaunay插值法消除散射, 选定发射波长等于激发波长处及其临近区域(± 10~15 nm)为散射区域。 同时, 因为受到仪器自身的影响, 需要对获取的光谱进行激发/发射校正才能得到真实光谱。 光谱预处理后如图2(b)所示(以预测样本T2为例), 处理后的光谱位置发生变化, 荧光强度增强, 光谱信息更加准确。

图2 光谱预处理结果
(a): 原始光谱图; (b): 去散射和校正后光谱图
Fig.2 The result of spectral pretreatment
(a): Original spectrogram; (b): After pretreatment

3.2 湖水中苯酚和麝香草酚的测定

由图2不难看出, 苯酚、 麝香草酚和湖水中间甲酚等背景干扰物的光谱重叠严重, 只有一个荧光峰, 常规荧光方法不能直接分辨。 利用三维荧光数据阵构建四维数据, 结合三阶校正算法可实现目标分析物的同时测定。 经检测, 所取湖水中不含有苯酚和麝香草酚或其浓度低于仪器的检测限。 在对数据进行分析前, 首先要对其进行响应组分数估计。 本文采用核一致诊断法(CORCONDIA)对样本的响应组分数(N)进行估计。 如图3所示, 当N大于3时, 核一致值减小到33.4%(< 60%), 因此, 最佳组分数是3, 其中一个因子是苯酚, 一个是麝香草酚, 最后一个因子是将间甲酚和水中其他未校正干扰物视为一个组分。

图3 利用核一致诊断法的组分数进行估计的示意图Fig.3 The number of factors was established by the core consistency diagnostic

3.2.1 三维平行因子对预测样本进行分析

目前二阶校正算法已经比较成熟, 常与色谱法或荧光分析法结合用于食品、 医学和环境等领域的检测。 这一部分利用三维平行因子算法对两种分析物进行测定。 以样品室20 ℃温度时扫描得到的数据阵进行分析, 由扫描校正样本和预测样本获取的数据阵构成三维数据阵X1(46× 61× 13)。 其中46为激发波长数, 61为发射波长数, 13为样本个数。

分解得到的激发发射光谱如图4所示, 由于目标分析物间及分析物与背景干扰物间光谱重叠严重, 物质间光谱相互影响较大, 也就是存在复杂干扰背景和数据共线性比较严重时, 三维平行因子解析得到的激发发射光谱并不理想。 苯酚和麝香草酚的光谱失真比较严重, 其中苯酚和麝香草酚的激发光谱轮廓和荧光峰位置出现了一定偏差, 影响目标分析物的快速定性分析。 两种目标分析物的浓度预测结果见表2, 苯酚回收率为72.8%~121.5%, 麝香草酚回收率为106.0%~116.9%, 浓度预测相对误差大于10%。 同样由于复杂的干扰背景和光谱数据信号存在严重共线性, 导致两种目标分析物的定性分析结果差强人意, 预测均方根误差值和浓度预测相对误差值较大。

表2 三维平行因子对苯酚和麝香草酚的浓度预测结果 Table 2 Analytical results for thymol and phenol by using three-way PARAFAC

图4 利用三维PARAFAC算法分解得到的激发-发射光谱(虚线)和真实光谱(实线)
(a): 发射光谱; (b): 激发光谱(N=3)
Fig.4 The true (solid line) and resolved (dashed line) profiles using three-way PARAFAC
(a): Emission spectral profiles; (b): Excitation spectral profiles

3.2.2 四维平行因子对预测样本进行分析

通过引入温度维来构建四维数据阵, 将光谱仪扫描每个样本(校正样本和预测样本)得到的激发-发射矩阵沿温度维构成三维数据阵, 然后将三维数据阵沿样本维叠加得到四维数据X1(46× 61× 3× 13)。 其中46表示激发波长数, 61为发射波长数, 3为温度变化次数, 13为样本个数。

采用三阶校正算法4-PARAFAC解析光谱数据, 光谱分解如图5所示, 显然4-PARAFAC算法解析得到的光谱更加接近真实光谱, 能够实现两种目标分析物的快速识别。 由第四维温度轮廓图, 可得到不同温度下的荧光量子产率, 可对目前主流的二阶校正算法解析结果进行校正, 补偿温度变化对定量分析结果带来的影响, 实现单一温度下的校正样本预测不同温度下的样本。 浓度预测结果如表3所示, 苯酚和麝香草酚的回收率分别为87.7%~109.5%, 85.1%~107.6%, 浓度预测误差小于10%。 对两种分析物的相对荧光强度与浓度进行回归分析, 结果如图6所示, 苯酚的相关系数为0.993, 麝香草酚的相关系数为0.985。

表3 四维平行因子对苯酚和麝香草酚的浓度预测结果 Table 3 Analytical results for thymol and phenol by using three-way PARAFAC

图5 采用4-PARAFAC算法分解得到的激发发射光谱(虚线)和真实光谱图(实线)
(a): 发射光谱; (b); 激发光谱; (c): 温度轮廓图(1: 15℃; 2: 20 ℃; 3: 25℃)
Fig.5 The true (solid line) and resolved (dashed line) profiles using 4-PARAFAC
(a): Emission spectral profiles; (b): Excitation spectral profiles; (c): Temperature mode profiles (1: 15 ℃; 2: 20 ℃; 3: 25 ℃)

图6 4-PARAFAC分解的浓度回归曲线Fig.6 Decomposition of the concentration regression curve by 4-PARAFAC

对比四维平行因子和三维平行因子的分析结果, 从定性分析角度看, 显然前者分解得到的激发-发射光谱(见图5)优于后者分解得到的(见图4), 分解光谱与真实光谱重合度高, 失真程度较低, 尤其是激发光谱, 优势明显。 定量分析方面, 四维平行因子算法对苯酚和麝香草酚浓度预测结果的预测均方根误差(0.047和0.057 μ g· mL-1)和浓度预测相对误差(9.7%, 9.0%)均小于三维平行因子的(0.090和0.056 μ g· mL-1, 16.6%和11.1%), 预测结果更稳定, 准确度更高。 四维平行因子算法性能优于三维平行因子, 可能是高阶数据包含更丰富的高维信息。

虽然平行因子等二阶校正算法具有“ 二阶优势” , 能实现含有未校正物质的样本中感兴趣组分的检测, 但对于复杂体系中共线性严重目标分析物的检测, 结果差强人意, 有时甚至给出错误的答案。

4 结论

通过引入温度维来构建四维数据阵, 结合三阶校正算法4-PARAFAC实现水环境中光谱重叠严重的苯酚和麝香草酚的快速定性和定量分析。 其解析结果优于三维平行因子分析结果, 体现了三阶校正算法解决光谱数据信号共线性严重或存在复杂干扰背景问题的优越性能, 探索了三阶校正算法的“ 三阶优势” 。 三维荧光光谱结合三阶校正方法为复杂水环境中有机物的检测提供了新的理论依据。

The authors have declared that no competing interests exist.

参考文献
[1] Kulkarni S J, Kaware D J P. International Journal of Scientifc and Research Publications, 2013, 3(10): 1. [本文引用:1]
[2] Pantelic M M, Dabic-Zagorac D, Davidovic S M, et al. Food Chem. , 2016, 211: 243. [本文引用:1]
[3] Farhadi K, Esmaeilzadeh F, Hatami M, et al. Food Chem. , 2016, 199: 847. [本文引用:1]
[4] Belguidoum K, Amira-Guebailia H, Boulmokh Y, et al. [J]. Taiwan Inst. Chem. Eng. , 2014, 45(4): 1314. [本文引用:1]
[5] ZHOU Yan-lei, ZHOU fei-fei, JIANG Cong-cong, et al(周艳蕾, 周飞飞, 姜聪聪, ). Spectroscopy and Spectral Analysis(光谱学与光谱分析), 2018, 38(2): 475. [本文引用:1]
[6] Carabajal M D, Arancibia J A, Escand ar GM. J. Chromatogr. A, 2017, 1527: 61. [本文引用:1]
[7] Yang R F, Zhao N J, Xiao X, et al. Spectrochim. Acta, Part A, 2016, 152: 384. [本文引用:1]
[8] Xie L X, Wu H L, Fang Y, et al. Chemom. Intell. Lab. Syst. , 2015, 148: 9. [本文引用:1]
[9] Zhang X H, Wu H L, Yin X L, et al. Chemom. Intell. Lab. Syst. , 2016, 155: 46. [本文引用:1]
[10] Rubio L, Sarabia L A, Ortiz M C. Talanta, 2015, 138: 86. [本文引用:1]
[11] Pagani A P, Ibañez G A. Microchem. J, 2017, 132: 211. [本文引用:1]
[12] Alcaráz M R, Siano G G, Culzoni M J, et al. Anal. Chim. Acta, 2014, 809: 37. [本文引用:1]
[13] Lozano V A, Peña A M D L, Durán-Merás I, et al. Chemom. Intell. Lab. Syst. , 2013, 125: 121. [本文引用:1]
[14] Qing X D, Wu H L, Yan X F, et al. Chemom. Intell. Lab. Syst. , 2014, 132: 8. [本文引用:1]
[15] Bro R. Chemom. Intell. Lab. Syst. , 1997, 38(2): 149. [本文引用:1]
[16] Montemurro M, Siano G G, Alcaráz M R, et al. Trends Anal. Chem. , 2017, 93: 119. [本文引用:1]
[17] Yin X L, Gu H W, Liu X L, et al. Spectrochim. Acta, Part A, 2018, 192: 437. [本文引用:1]