基于温度变量的四维荧光光谱的石油类污染物测定
杨哲1,2, 王玉田1, 陈至坤2, 刘婷婷1,3, 商凤凯1, 王书涛1, 程朋飞2, 王君竹1, 潘钊1
1. 燕山大学河北省测试计量技术及仪器重点实验室, 河北 秦皇岛 066004
2. 华北理工大学电气工程学院, 河北 唐山 063210
3. 柳州职业技术学院, 广西 柳州 545000

作者简介: 杨哲, 女, 1989年生, 燕山大学电气工程学院博士研究生 e-mail: zheyang_her@163.com

摘要

三维荧光光谱结合多元校正分析对石油类污染物复杂多组分体系测定方法多谱图混叠, 且易受到空白荧光和干扰物荧光影响降低了测定准确性。 提出在三维荧光光谱中增加一维温度信息构造激发波长-发射波长-温度-样品(EEM-temperature data array)的四维荧光光谱数据阵列, 应用四线性成分模型建立高维荧光光谱定性定量分析的方法。 实验证明在15~25 ℃温度范围内, 矿物油荧光光谱轮廓形状不随温度变化, 而其强度随温度线性变化, 满足四线性要求, 这为构建四维荧光光谱发展高维数据的三阶校正提取更丰富的有效信息提供了可能。 三阶校正不仅可以在干扰物共存的情况下对感兴趣组份进行定量测定, 即具有“二阶优势”, 还具有更高的选择性和灵敏性, 可以对高共线性和背景干扰的重叠光谱表现更好的解析能力, 即“三阶优势”。 对0#柴油、 97#汽油和机油为混合油待测组分, 腐殖酸为水体干扰组分组成的复杂体系污染油样品为进行实验, 得到的三维荧光光谱利用平行因子(PARAFAC)算法和交替惩罚三线性分解(APTLD)算法进行二阶校正分析, 将三维荧光光谱在温度方向上堆叠构成增加温度维度的四维荧光光谱数阵, 并将其利用四维平行因子算法(4-PARAFAC)和交替惩罚四线性分解(APQLD)算法进行三阶校正分析, 比较, 0#柴油、 97#汽油和机油的预测结果表明增加了影响荧光光谱的温度因素构造的四维荧光光谱提高了有效信息提取能力, 四维荧光光谱结合高阶校正算法能提高油种光谱识别和浓度精确检测, 较传统的三维荧光光谱分析提高了回收率(recovery rate)和预测均方根误差(root mean square error of prediction, RMSEP), 有利于石油类污染物的有效, 准确, 实时, 绿色环保检测。 同时指出了4-PARAFAC和APQLD算法各自的特点及其不同适用环境, 为油类污染物检测具体情况提供算法选择依据。 引入温度参量的四维荧光光谱结合三阶校正算法的检测技术较三维荧光光谱技术, 在组分光谱定性分辨和浓度定量检测方面能对复杂体系油类污染物实现快速有效, 绿色无污染地检测, 实现“数学分离”更有效代替“化学分离”。

关键词: 四维荧光光谱; 石油类污染物; 三阶校正; 高阶优势
中图分类号:O657.3 文献标志码:A
Determination of Petroleum Pollutants by Four Dimensional Fluorescence Spectra Based on Temperature Variable
YANG Zhe1,2, WANG Yu-tian1, CHEN Zhi-kun2, LIU Ting-ting1,3, SHANG Feng-kai1, WANG Shu-tao1, CHENG Peng-fei2, WANG Jun-zhu1, PAN Zhao1
1. Measurement Technology and Instruments Key Laboratory of Hebei Province, Yanshan University, Qinhuangdao 066004, China
2. College of Electrical Engineering, North China University of Science and Technology, Tangshan 063210, China
3. Vocational and Technical College of Liuzhou, Liuzhou 545000, China
Abstract

Three dimensional fluorescence spectroscopy combined with multivariate calibration analysis for petroleum pollutants multicomponent determination method has problems of complex spectra aliasing, and is susceptible to blank fluorescence and interference fluorescence reducing the accuracy of result. Temperature information as one dimension added to the traditional three dimensional fluorescence spectrum to construct excitation wavelength-emission wavelength-temperature-samples four dimensional fluorescence spectrum data array (excitation-emission-temperature-sample data array, EEM-temperature data array) was proposed, and four linearity component model combined with high dimensional fluorescence spectrum qualitative and quantitative analysis was applied. Experiments demonstrate that fluorescence spectral shape of mineral oil does not change with the change of temperature in 15 to 25 ℃ range, but the intensity changes linearily, satisfying the requirement of four linearity, providing possibility for developing four dimensional fluorescence spectra with third-order correction to extract more useful information from the high dimensional data. The third order correction not only has “second order advantage”, namely to quantitatively determine interesting constituents in the presence of interferences, but also has higher selectivity and sensitivity, higher resolution ability for colinearity and background interference of the overlapping spectra, namely, “third order advantage”. The complex petroleum pollution system composed of 0# diesel, 97# gasoline and engine oil as components to be determined and humic acid as water interference component are experimental samples. The parallel factor (PARAFAC) algorithm and the alternating penalty trilinear decomposition (the alternating penalty trilinear decomposition, APTLD) algorithm are applied to the three dimensional fluorescence spectra for the second-order calibration analysis; the four dimensional fluorescence spectra data array containing temperature information is constructed by stacking three dimensional fluorescence spectra along temperature direction dimension, and is analyzed by four dimensional parallel factor algorithm (4-PARAFAC) and alternating penalty quadrilinear decomposition (alternating penalty quadrilinear decomposition, APQLD) for third-order correction analysis. The prediction results of 0# diesel, 97# gasoline and engine oil are compared and show that the four way fluorescence spectrum with adding the affecting factor of temperature increases the extraction ability for effective information and the four dimensional fluorescence spectroscopy combined with high-order correction algorithm can improve the oil spectrum recognition and concentration detection precision and improve the recovery rate and the root mean square prediction error (root mean square error of prediction, RMSEP) compared with the traditional three dimensional fluorescence spectrum analysis, advantageous to the effective, accurate, real-time, green environmental detection for petroleum pollutants. At the same time, the characteristics of 4-parafac and APQLD algorithms and their different applicable environments are pointed out, which can provide a basis for the algorithm selection for the detection of oil pollutants. The four-dimensional fluorescence spectra with introduction of the temperature parameters combined with third-order correction algorithm detection technology, no matter in qualitative resolution of constituent spectra or quantitative concentration determination of the complex system of oil pollution compared with three-dimensional fluorescence spectrum technology, is capable of realizing fast, effective, green and pollution-free detection, thus “mathematical separation” can replace “chemical separation” more effectively.

Keyword: Four dimensional fluorescence spectra; Petroleum pollutants; Third order correction; Higher-order advantage
引 言

随着全球重大溢油事故频发, 石油类污染物检测已成为全球环境保护的重要内容。 荧光光谱技术由于其对多环芳烃的高灵敏度具有快速简便经济的技术特点[1], 广泛应用于石油类污染物分析检测, 是国际海事组织(IMO)推荐的主要标准的化学分析技术之一[2]。 由于石油类污染物具有十分复杂的化学组成, 导致荧光光谱重叠严重, 且易受到空白荧光和干扰物荧光影响, 导致以往的研究对柴油、 汽油、 机油等多组分体系进行定性定量检测效果不理想。 随着高阶仪器或者联用仪器的发展使得检测到高维信号数据成为可能, 包含有更为丰富有效信息的高维数据结合高阶校正方法为有效准确, 快捷绿色油类污染物检测提供了可能。

三维激发-发射荧光光谱(three dimensional excitation-emission matrix fluorescence, 3D EEM)满足三线性条件-分解具有唯一性, 结合二阶校正方法可以实现在干扰物共存的情况下对感兴趣组份进行定量测定, 即具有“ 二阶优势” , 这在矿物油多组分复杂体系的快速有效分析中具有重要实际应用价值。 常用于三维数据的二阶校正算法有平行因子分析(PARAFAC)[3, 4], 多变量曲线分辨(MCR)[5, 6], 交替三线性分解(ATLD)[7], 交替惩罚三线性分解(alternating penalty trilinear decomposition, APTLD)[8]和自加权交替三线性分解(SWATLD)[9]。 每种方法都有各自不同特点, 适于处理不同情况下的分析环境。 但面对多数种类混合的油类污染物, 其光谱混叠严重, 且受空白荧光和干扰物荧光影响, 定性定量测定结果有时不够准确稳定。 理论上, 更高维的信号包含更丰富的有用信息, 定性定量结果也应更准确, 所以构建四维矿物油污染物荧光光谱测量方法可以实现更有效的检测。 实验证明矿物油荧光光谱在15~25 ℃温度范围内光谱轮廓形状不随温度变化, 而其强度随温度线性变化, 满足四线性要求, 这为构建四维荧光光谱发展更高维数据的三阶校正提取更为丰富的有效信息提供可能。

提出构造激发波长-发射波长-温度-样品(excitation-emission-temperature-sample data array, EET data array)的四维荧光数据, 基于四线性成分模型利用三阶校正算法四维平行因子算法4-PARAFAC和交替惩罚四线性分解(alternating penalty quadrilinear decomposition, APQLD)算法进行定量预测, 提取更多的有效信息处理重叠光谱的高共线性和背景干扰, 提高灵敏度和选择性, 即具有“ 三阶优势” 。 提出的方法为有效定性定量检测柴油、 汽油、 煤油等多组分体系提供了一种方便快速绿色的方法。

1 方法原理
1.1 四线性成分模型

在三维荧光光谱测量中, 测量一个样本就产生一个I× J(I为激发波长数, J为发射波长数)大小的二维响应矩阵, 在不同温度下对同一样品进行测量就得到一个I× J× K(K为不同的温度点数)大小的三维数据阵列, 将L个样本响应矩阵堆叠起来就形成了一个 X̅q的四位数据阵列, 其每个元素用xijkl表示。 对于一个四线性成分模型, 可以从多线性成分模型中推导出四维数据阵列 X̅q的每个元素xijkl的表达式, 如式(1)所示

xijkl=n=1Nainbjnckndln+eijkl(1)

其中, i=1, 2, …, I, j=1, 2, …, J, k=1, 2, …, K, l=1, 2, …, LN为所有对荧光光谱有实际贡献的组分数(包

括感兴趣成分和干扰成分); xijkl为在第i激发波长, 第j发射波长, 第k温度下第l样本的荧光强度值; ain为组分n在激发波长i的规范化强度, 即相对激发矩阵A(I× N)中元素(i, n); bjn表示组分n在发射波长j的规范化强度, 即相对发射矩阵B(J× N)中元素(j, n); ckn表示组分n在温度k下的规范化强度, 即相对温度矩阵C(K× N)中元素(k, n); dln表示组分n在样本l的规范化强度, 即相对浓度矩阵D(L× N)中元素(l, n); eijkl表示四线性模型拟合后的残差值, 即四维残差阵列Eq中的元素。 四线性模型如图1所示。

图1 四线性模型Fig.1 Four linearity model

2 实验部分
2.1 试剂仪器与样品

2.1.1 试剂

0#柴油和97#汽油从秦皇岛(河北, 中国)中石化加油站购买, 机油是壳牌5w-40全合成机油。 腐殖酸分析纯大于99.5%, 购自上海阿拉丁生化科技公司。 十二烷基硫酸钠(SDS)为分析纯度级, 从Klamar有限公司(中国上海)购得。 采用二次蒸馏水配置的SDS胶束溶液得到相应浓度矿物油溶液。

2.1.2 仪器

采用英国Edinburgh Instruments公司生产的FS920稳态荧光光谱仪进行光谱测量。 精密电子天平由天津天马衡基仪器有限公司生产, 精度值为1 mg。

2.1.3 溶液制备

(1) SDS胶束溶液制备: 由文献[10]可知, SDS胶束溶液在0.1 mol· L-1时, 矿物油荧光强度最大, 所以实验使用0.1 mol· L-1 SDS胶束溶液备用。 精确称量分析纯SDS (M=288.38 g· mol-1) 样品14.419 g, 用少量二次蒸馏水溶解后, 置入500 mL容量瓶中, 再加入二次蒸馏水定容, 制成0.1 mol· L-1SDS溶液备用。

(2) 标准溶液的制备: ①使用精密电子天平称取0#柴油, 97#汽油和机油各0.01 g, 溶解于上述制备的SDS胶束溶液中, 然后分别固定在3个10 mL的容量瓶中, 得到1 g· L-1浓度的一级储备液, 在避光条件下保存; ②分别取每0.1 mL一级储备液, SDS胶束溶液稀释, 于3个10 mL容积瓶中, 震荡5 min, 得到10 mg· L-1的二级储备液; ③分别取0.1 mL的二级储备液, 并SDS胶束溶液稀释, 然后在3个10 mL容量瓶中, 震荡5 min, 得到100 μ g· L-1标准溶液; ④分别取不同体积不同油类样品标准溶液, 由SDS胶束溶液稀释, 混合配制成不同比例、 不同浓度的10个校准样品和包含不同含量腐殖酸的5个预测样品, 0#柴油浓度范围10500 μ g· L-1; 97#汽油浓度范围10600 μ g· L-1; 机油浓度范围200900 μ g· L-1。 并同时制备3个SDS胶束溶液作为空白样本。 表1为各个样品具体制备浓度。

表1 实验样品配置表(μ g· mL-1) Table 1 Sample configuration table (μ g· mL-1)

2.1.4 实验条件

激发波长和发射波长扫描范围分别为250400和270450 nm, 激发和发射步长均为5 nm, 狭缝宽度2.78 mm, 积分时间0.2 s。 测得光谱经过激发与发射波长校正后将SDS溶液的光谱作为背景从测得光谱中扣除以消除拉曼散射等干扰。

3 结果与讨论
3.1 光谱预处理

实验荧光光谱仪测得原始三维荧光光谱均需通过光谱仪自带文件的激发发射文件进行校正处理。 0#柴油, 97#汽油和机油的三维荧光光谱包含较强的瑞利散射和拉曼散射, 其不满足线性成分模型, 会导致多元校正中光谱分辨和浓度预测结果存在较大偏差, 所以在进行多元校正之前要进行去散射处理。 选择发射扫描波长滞后激发扫描波长25nm来消除瑞利散射, 并将此右三角区域插值为0。 拉曼散射通过扣除3个SDS胶束溶液空白样本平均值来消除。 两种消除散射方法均简便有效。

3.2 矿物油与温度关系

矿物油荧光光谱随着温度升高光谱强度会逐渐降低, 以0#柴油为例如图2所示。 由图2可已看出, 随着温度升高光谱轮廓形状是几乎没有变化的, 而荧光强度随温度升高出现不同幅度降低, 而且满足线性变化。 这为引入温度作为变量在温度维度上堆叠传统三维荧光光谱增加温度维度信息构造激发波长-发射波长-温度-样品(excitation-emission-temperature-sample data array, EEM-temperature data array)的四维荧光光谱数据阵列, 基于四线性成分模型建立高维荧光光谱定性定量分析提供了理论依据。

图2 0#柴油随温度变化荧光光谱图Fig.2 Fluorescence spectra of 0# diesel with the change of temperature

3.3 混合油组分二阶校正和三阶校正比较分析

3.3.1 二阶校正和三阶校正定性分析

组分数选取使用核一致方法[11], 组分数为3或4为合理值。 选取组分数为3时, 0#柴油、 97#汽油和机油三维PARAFAC发射和激发分辨光谱和真实光谱如图3(a, b)所示。 由图可以看出0#柴油、 97#汽油和机油在PARAFAC分辨发射荧光光谱和真实光谱中基本一致, 偏差较小, 但分辨激发荧光光谱和真实光谱部分区域偏差较大, 不甚理想。 0#柴油、 97#汽油和机油由二阶校正算法APTLD分辨得到的激发、 发射光谱和真实光谱的比较如图4(a, b)所示, 仍然发射光谱比激发光谱分辨的较幻。 与图3发射荧光光谱比较可以看出, 对0#柴油和机油APTLD分辨光谱和PARAFAC比较大致相似, 但对于97#汽油APTLD分辨发射光谱不如PARAFAC光滑, 是因为PARAFAC是严格执行数学最小二乘拟合, 而且组分数正好等于已知组分情况下, 所得光谱较平滑。

图3 0#柴油、 97#汽油和机油三维PARAFAC分辨光谱(a)和真实光谱(b)(组分数N=3)Fig.3 The PARAFAC resolved spectra (a) and true spectra of 0# diesel (b), 97# gasoline and engine oil (component score N=3)

图4 0#柴油、 97#汽油和机油APTLD分辨光谱(a)和真实光谱(b)(组分数N=3)Fig.4 The APTLD resolved spectra and true spectra of 0# diesel, 97# gasoline and engine oil (component score N=3)

选取组分数为4时, 0#柴油、 97#汽油和机油三维PARAFAC发射和激发分辨光谱和真实光谱如图5(a, b)所示。 由图可以看出多出的干扰成分对机油光谱分辨并没有造成明显影响, 对0#柴油影响也相对较小, 但对于97#汽油由PARAFAC分辨得出的发射和激发光谱和真实光谱中均出现较大偏差, 这是因为PARAFAC算法对组分数估计很敏感, 错误的组分数估计会严重影响光谱图分辨, 所以在实际选用PARAFAC算法时应在能确定待测样品组分数的情况下才会得到较满意结果。 0#柴油、 97#汽油和机油由二阶校正算法APTLD分辨得到的激发、 发射光谱和真实光谱的比较如图6(a, b)所示。 由图可以看出APTLD算法中多出的干扰成分对0#柴油和机油分辨光谱影响仍然很小, 值得注意的是, 对于97#汽油较PARAFAC算法干扰组分对其光谱分辨的影响大大减小了, 这是因为APTLD算法对组分数估计较PARAFAC算法不敏感, 在组分数估计超过实际感兴趣组分数时较PASAFAC算法仍能得到较好结果。 因此在不能确定待测样品组分数的情况下, 选取较大估计组分数APTLD算法较PARAFAC算法会得到较满意结果。

图5 0#柴油、 97#汽油和机油三维PARAFAC分辨光谱(a)和真实光谱(b)(组分数N=4)Fig.5 The PARAFAC resolved spectra and true spectra of 0# diesel, 97# gasoline and engine oil (component score N=4)

图6 0#柴油、 97#汽油和机油APTLD分辨光谱(a)和真实光谱(b)(组分数N=4)Fig.6 The APTLD resolved spectra (a) and true spectra of (b) 0# diesel, 97# gasoline and engine oil (component score N=4)

选取组分数为3时, 0#柴油、 97#汽油和机油四维PARAFAC分辨光谱和真实光谱如图7(a, b)所示。 由图可以看出0#柴油、 97#汽油和机油PARAFAC分辨光谱和真实光谱基本重合, 尤其对97#汽油和机油相较三维PARAFAC分辨光谱重合度更好。 0#柴油、 97#汽油和机油由三阶校正算法APQLD分辨得到的激发、 发射光谱和真实光谱的比较如图8(a, b)所示。 可以看到3种油激发、 发射分辨光谱(a)和真实光谱(b)整体和四维PARAFAC效果差不多, 但分辨光谱不如四维PARAFAC光滑, 也是因为四维PARAFAC迭代步骤也严格执行数学最小二乘拟合光谱仍然较平滑。

图7 0#柴油、 97#汽油和机油四维PARAFAC分辨光谱(a)和真实光谱(b)(组分数N=3)Fig.7 The four way PARAFAC resolved spectra (a) and true spectra (b) of 0# diesel, 97# gasoline and engine oil (component score N=3)

图8 0#柴油、 97#汽油和机油APQLD分辨光谱(a)和真实光谱(b)(组分数N=3)Fig.8 The APQLD resolved spectra (a) and true spectra of (b) 0# diesel, 97# gasoline and engine oil (component score N=3)

选取组分数为4时, 0#柴油、 97#汽油和机油四维PARAFAC分辨光谱和真实光谱如图9(a, b)所示。 由图可以看出3种油在四维PARAFAC分辨光谱明显受干扰成分光谱干扰, 分辨光谱和真实光谱重合度远不如组分数为3时理想, 尤其对机油激发、 发射分辨光谱部分区域影响较大。 所以四维PARAFAC仍然有对组分数敏感的特点。 三阶校正算法APQLD得到的0#柴油、 97#汽油和机油激发、 发射分辨光谱和真实光谱图如图10(a, b)所示。 由图可以看出, 取组分数为4时相较图9四维PARAFAC对机油激发、 发射分辨光谱与真实光谱重合度明显改善很多, 说明APQLD算法也有和APTLD一样对组分数不敏感, 更能够在选取组分数大于实际组分数的情况下仍能得到较好分辨光谱。

图9 0#柴油、 97#汽油和机油四维PARAFAC分辨光谱(a)和真实光谱(b)(组分数N=4)Fig.9 The four way PARAFAC resolved spectra (a) and true spectra (b) of 0# diesel, 97# gasoline and engine oil (component score N=4)

图10 0#柴油、 97#汽油和机油APQLD分辨光谱(a)和真实光谱(b)(组分数N=4)Fig.10 The APQLD resolved spectra (a) and true spectra (b) of 0# diesel, 97# gasoline and engine oil (component score N=4)

3.3.2 二阶校正和三阶校正定量分析

二阶校正和三阶校正算法对混合油中0#柴油、 97#汽油和机油各组分的测定结果如表2所示。 从表中可以看出, 二阶校正和三阶校正算法均可对混合体系中的3种被测油进行定量测定。 但引入温度变量的四维光谱数据结合三阶校正四维PARAFAC和APQLD算法对0#柴油、 97#汽油的预测均方根误差均为2左右, 明显低于二阶校正算法, 相关系数也均大于0.99, 优于二阶算法。 可以看出对汽油和柴油的测定结果整体好于机油, 这是因为干扰物腐殖酸激发、 发射光谱与机油重合较严重, 从而影响了机油有效分辨识别, 但三阶校正在处理这种感兴趣组份与干扰光谱重叠严重情况时回收率和预测均方根误差均表现出了优于二阶校正的优势。

表2 二阶校正和三阶校正算法对混合油中0#柴油、 97#汽油和机油的测定结果(n=3) Table 2 Second order and third order correction algorithms for the determination of 0# diesel oil, 97# gasoline and engine oil in the mixed oil (n=3)

4 结 论

油类污染物组成成分复杂, 分析鉴别困难大, 利用多元校正分析对感兴趣组分在与干扰物共存的情况下进行检测, 即“ 二阶优势” , 实现混合污染物种类鉴别和浓度定量是快速有效又绿色的方法。 针对二阶校正中对高共线性和背景干扰情况存在分辨能力不强, 准确性不高的缺点, 提出的构造激发波长-发射波长-温度-样品的四维荧光检测方法, 基于四线性成分模型利用四阶校正算法4-PARAFAC和交替惩罚四线性分解APQLD进行定量预测, 得到了较传统的三维荧光光谱分析更好的回收率和预测均方根误差, 更有效地处理了重叠光谱的高共线性和背景干扰, 表现出了更优于“ 二阶优势的“ 三阶优势” 。

参考文献
[1] Kang Chao, Wu Hailong, Yu Y J, et al. Analytica Chimica Acta, 2013, 758(1): 45. [本文引用:1]
[2] Wang C, Li W, Luan X, et al. Talanta, 2010, 81(1): 684. [本文引用:1]
[3] Harshman R A. UCLA Working Papers Phonetics, 1970, 1. [本文引用:1]
[4] Carroll J D, Chang J J. Psychometrika, 1970, 35: 283. [本文引用:1]
[5] Saurina J, Hemand ez-Cassou S, Tauler R. Anal. Chem. , 1997, 69: 2329. [本文引用:1]
[6] Juan A, Rutan S C, Tauler R, et al. Chemometr. Intell. Lab. Syst. , 1998, 40: 19. [本文引用:1]
[7] Wu H L, Shibukawa M, Oguma K. J. Chemometr. , 1998, 12(1): 1. [本文引用:1]
[8] Chen Z P, Wu H L, Yu R Q. J. Chemometr. , 2001, 15: 439. [本文引用:1]
[9] Xia A L, Wu H L, Fang D M, et al. J. Chemometr. , 2005, 19: 65. [本文引用:1]
[10] PAN Zhao, WANG Yu-tian, WU Xi-jun, et al(潘钊, 王玉田, 吴希军, ). Chinese Journal of Scientific Instrument, 2013, 34(12): 2839. [本文引用:1]
[11] Bro R, Klers Hal. J. Chemometr. , 2003, 17: 274. [本文引用:1]