三维荧光偏导数光谱结合平行因子算法对石油类混合油液的检测
陈晓玉1, 张坤1, 孔德明2,*
1.燕山大学信息科学与工程学院, 河北 秦皇岛 066004
2.燕山大学电气工程学院, 河北 秦皇岛 066004
*通讯作者 e-mail: demingkong@ysu.edu.cn

作者简介: 陈晓玉, 1983年生, 燕山大学信息科学与工程学院副教授 e-mail: chenxiaoyu@ysu.edu.cn

摘要

石油类混合油液的组分检测是三维荧光光谱领域重要的研究内容, 由于实际获得的混合油液三维荧光光谱数据存在不同组分光谱重叠严重、 数据三线性较差等问题, 通过平行因子算法解析时, 会出现解析谱与标准谱差异过大或者不能正确判断油种的情况。 在验证三维荧光偏导数光谱应用平行因子算法具有可行性的基础上, 将三维荧光偏导数光谱与平行因子算法结合, 能够提高平行因子算法得到的混合油解析谱与标准谱的拟合程度, 实现石油类混合油液组分的准确检测。 首先, 以十二烷基硫酸钠(SDS)溶液作为溶剂, 配制航空煤油、 润滑油不同浓度的纯油溶液各15份, 将航空煤油、 润滑油按照不同浓度比配制9份混合油溶液; 并利用FS920荧光光谱仪得到39份三维荧光光谱数据。 然后, 对三维荧光光谱数据进行预处理: 通过扣除空白法去除拉曼散射, 并将瑞利散射区域扣除, 再利用分段三次hermite插值方法对扣除区域进行插值; 利用小波变换阈值去噪法去除光谱数据中的高频噪声, 得到预处理完成后的三维荧光光谱数据。 最后, 利用Savitzky-Golay拟合求导方法求三维荧光光谱的一阶偏导数光谱, 并利用平行因子算法对三维荧光光谱和三维荧光偏导数光谱进行解析。 将解析谱与纯油标准谱进行比较, 实验结果表明: 利用平行因子算法对混合油液的三维荧光光谱进行解析时, 得到的润滑油解析结果较好, 但航空煤油的解析结果存在较大问题。 而三维荧光偏导数光谱经平行因子算法解析后, 在保证润滑油解析结果的同时, 显著提高了航空煤油的解析结果: 航空煤油解析谱与标准谱之间的相关系数提升了12.0%(发射光谱)、 6.7%(激发光谱), 均方根误差减少了70.4%(发射光谱)、 20.6%(激发光谱)。 在三维荧光光谱数据三线性较差的情况下, 三维荧光偏导数光谱结合平行因子分析方法优于三维荧光光谱结合平行因子分析方法, 实现了对混合油液组分准确检测的目的。

关键词: 三维荧光光谱; 油种检测; 偏导数光谱; 平行因子算法
中图分类号:O433.4 文献标志码:A
Three-Dimensional Fluorescence Partial Derivative Spectroscopy Combined With Parallel Factor Algorithm for Detection of Mixed Oil
CHEN Xiao-yu1, ZHANG kun1, KONG De-ming2,*
1. School of Information Science and Engineering, Yanshan University, Qinhuangdao 066004, China
2. School of Electrical Engineering, Yanshan University, Qinhuangdao 066004, China
*Corresponding author
Abstract

The component detection of petroleum mixed oil is an important research content in the field of three-dimensional fluorescence spectroscopy. The actual obtained three-dimensional fluorescence spectrum data of mixed oil has problems such as the serious overlap of different component spectra and poor trilinearity of the data. When analyzing the three-dimensional fluorescence spectrum by the parallel factor algorithm (parafac), the difference between the analytical spectrum and the standard spectrum is too large, or the type of oil cannot be judged correctly. The paper verifies that the parallel factor algorithm can be applied to three-dimensional fluorescence partial derivative spectroscopy. This paper combines the three-dimensional fluorescence partial derivative spectroscopy with the parafac, improving the degree of fitting between the analytical spectrum and the standard spectrum. Therefore, this paper realizes the accurate detection of the components of petroleum mixed oil. First, the paper use sodium dodecyl sulfate solution (SDS) as the solvent to prepare 15 parts of pure oil solutions of different concentrations of jet fuel and lubricating oil. 9 parts of mixed oil solution are prepared by jet fuel and lubricating oil according to different concentration ratios. The FS920 fluorescence spectrometer obtains the three-dimensional fluorescence spectrum data of 39 samples. They were using the following methods to preprocess the three-dimensional fluorescence spectrum data. Raman scattering is removed by the subtraction standard method. The Rayleigh scattering area is subtracted, and then the subtracted area is interpolated by the segmented cubic Hermite interpolation method to perfect the data. The wavelet transform threshold denoising method is used to remove the high-frequency noise in the spectrum data. Finally, the Savitzky-Golay fitting derivative method is used to obtain the first-order partial derivative spectrum of the three-dimensional fluorescence spectrum. The parafac is used to analyze the three-dimensional fluorescence spectrum and the three-dimensional fluorescence partial derivative spectrum. The experimental results show that when the parafac is used to analyze the three-dimensional fluorescence spectrum of the mixed oil, the lubricating oil analytical results are better, but the analytical results of jet fuel have big problems. When the parafac used to analyze the three-dimensional fluorescence partial derivative spectrum of the mixed oil, the analysis results of jet fuel are significantly improved while ensuring the analysis results of lubricating oil. The correlation coefficient between the analytical spectrum and the standard spectrum of jet fuel has increased by 12.0% (emission spectrum) and 6.7% (excitation spectrum), and the root means square error has reduced by 70.4% (emission spectrum) and 20.6% (excitation spectrum). In view of the poor trilinearity of three-dimensional fluorescence spectrum data, three-dimensional fluorescence partial derivative spectroscopy combined with parafac analysis method is better than three-dimensional fluorescence spectroscopy combined with the pafarac analysis method, which achieves accurate detection of mixed oil components.

Keyword: Three-dimensional fluorescence spectroscopy; Mixed oil detection; Partial derivative spectroscopy; Parallel factor algorithm
引言

石油在极大提高人类社会生产力的同时, 也造成了严重的环境污染, 其中海面溢油对海洋生态环境造成了严重破坏[1]。 海面溢油通常是多种油类的混合油液, 对混合油液组分进行准确有效的检测对于保护海洋生态环境具有重要意义[2]。 石油类混合油液主要由烷烃、 环烷烃以及芳香烃组成, 由于芳香烃类物质具有荧光特性, 不同油类中芳香烃的种类和含量不同, 因此可以通过荧光检测的方法对混合油液的组分进行检测[3]。 目前常用的检测方法有: 气相色谱法、 紫外光谱法、 三维荧光光谱法等[4], 其中三维荧光光谱检测方法具有简便、 快捷、 灵敏性高等特点, 成为鉴别混合油液不同组分的重要手段[5]

平行因子算法是将混合油液的三维荧光光谱矩阵分解为浓度矩阵A、 发射光谱矩阵B和激发光谱矩阵C, 用数学分离代替实际的化学分离, 当数据噪声较小、 三线性较好时, 平行因子解析效果好[6]。 但实际获得的混合油液三维荧光光谱由于数据信噪比较低、 不同组分光谱重叠严重、 数据三线性较差等问题, 会造成平行因子算法解析效果不佳[5, 7, 8]。 导数光谱具有消除背景干扰、 提高分辨率、 分离重叠光谱等优点, 在二维光谱中得到了广泛应用[9]。 目前在三维荧光导数光谱的研究中, 杜树新等利用三维荧光导数光谱分析了纯组分有机物的种类和含量[10], 但并未对混合溶液多组分进行检测; 陈国庆等将三维荧光导数光谱和神经网络结合探讨了纯组分三维荧光光谱的分类问题[11]

在分析三维荧光偏导数光谱应用平行因子算法的可行性基础上, 将三维荧光光谱的一阶偏导数光谱与平行因子算法结合, 提出了一种石油类混合油液组分检测的方法。 实验结果表明, 在相关系数和均方根误差评价标准上, 三维荧光偏导数光谱结合平行因子算法在三维荧光光谱三线性较差的情况下更具优势。

1 基本原理
1.1 小波变换阈值去噪原理

在检测过程中, 为了避免荧光猝灭造成的影响, 一般将油类溶液稀释到较小浓度, 由于小浓度油类溶液的荧光强度较小, 容易受溶剂和仪器的干扰, 三维荧光光谱会出现噪声干扰严重的问题。 小波变换与傅里叶变换类似, 可以在频域角度对信号进行处理, 小波去噪方法一般应用于图像、 信号处理领域。 三维荧光光谱和图片具有相同的数据形式, 本文利用图像处理中小波变换去噪方法, 对三维荧光光谱数据进行去噪处理, 在去除光谱高频噪声的同时, 也实现了对光谱的平滑处理。

小波变换阈值去噪法的基本思想是: 将原始三维荧光光谱数据通过小波变换后, 噪声的小波系数要小于光谱信号的小波系数, 通过选取一个合适的阈值, 大于阈值的小波系数被认为是由三维荧光光谱产生的, 给予保留, 小于阈值的则被认为是噪声产生的, 置为零, 从而达到去噪的目的。 小波变换阈值去噪算法基本步骤如图1所示。

图1 小波变换阈值去噪算法Fig.1 Wavelet threshold denoising algorithm

1.2 平行因子算法原理

一个三维荧光光谱矩阵的范围是I个激发波长、 J个发射波长, 共K个样本, 因此形成了I×J×K的三维矩阵X。 平行因子算法基于交替最小二乘原理, 将三维矩阵X分解为3个载荷矩阵A, B, C, 且三个载荷矩阵具有清晰的物理意义。 混合油液的三维矩阵X具有三线性, 即可以唯一分解为三线性模型

XIJK=A(C||B)T+EIJK(1)

xijk=f=1Fbjfcifakf+eijk(2)

其中, XIJK为三维荧光光谱矩阵X; A为浓度矩阵; B为发射光谱矩阵; C为激发光谱矩阵; EIJK为误差矩阵; xijk为三维矩阵X中第(i, j, k)个元素; i=1, 2, …, I; j=1, 2, …, J; k=1, 2, …, K; F为混合油液中的组分个数。

1.3 三维荧光光谱求导原理

Savitzky-Golay拟合求导方法是一种针对曲线的求导方法, 其基本原理是: 选用奇数长宽度的窗口, 对窗口内的曲线进行多项式拟合, 然后对得到的拟合方程求导进而求得窗口内中心数据的导数, 窗口遍历整个曲线, 得到曲线上每一个点的导数, Savitzky-Golay拟合求导方法需要确定窗口宽度和多项式的阶数。 对于一个样本的三维荧光光谱矩阵(EEM), 其荧光强度是关于激发波长和发射波长的函数, 即: X=f(i, j), 其中i是激发波长, j是发射波长。 X有关于ij的偏导数: Xi, Xj。 由于三维荧光光谱的每一条发射光谱和激发光谱是独立的, 因此可以采用Savitzky-Golay拟合求导方法求EEM的偏导数光谱 XiXj

1.4 三维荧光偏导数光谱三线性原理

当不考虑噪声和其他干扰时, 一个具有F个组分样本数K为1的混合油液三维荧光光谱矩阵X可以分解为式(3)。

X=A(C||B)=f=1FafCfBf=a1C1B1++aFCFBF(3)

其中af为常数代表每一个组分在样本中的相对浓度, Bf为1×J的行向量代表每一个组分的发射光谱, CfI×1的列向量代表每一个组分的激发光谱, f=1, 2, …, F。 式(3)对X关于激发波长i求一阶偏导有

Xi=Xij=1Xij=2Xij=J=f=1Fafb1fCfib2fCfibJfCfi=a1B1C1i++aFBFCFi(4)

由式(4)可知, 当不考虑噪声和其他干扰时, EEM的一阶偏导数光谱满足三线性要求, 可以应用平行因子算法。 EEM的激发(发射)方向的偏导数光谱经过平行因子解析后具有如下特点: 求导前后的发射(激发)光谱不发生变化, 偏导数矩阵的激发(发射)光谱矩阵是原激发(发射)光谱的导数。

2 实验过程及分析
2.1 样本与配制

实验仪器为英国EI公司生产的稳态荧光光谱仪FS920, 该仪器的光谱波长测量范围为200~900 nm, 分辨率能够达到0.1 nm。 FS920配备450 W的氙灯作为激发光源, 信噪比为6 000:1。 在常温下进行实验, 激发波长范围为260~500 nm, 步长为10 nm, 发射波长为280~500 nm, 步长为5 nm。

实验配制航空煤油15组样本、 润滑油15组样本、 航空煤油和润滑油的混合油9组样本。 其中航空煤油、 润滑油浓度为0.2~3 mg· mL-1, 浓度梯度为0.2 mg· mL-1。 混合油液中航空煤油浓度0.1~0.9 mg· mL-1, 浓度梯度为0.1 mg· mL-1; 润滑油浓度0.9~0.1 mg· mL-1, 浓度梯度为-0.1 mg· mL-1。 首先, 用精密电子秤称取1 g油类试剂。 然后, 用0.1 mol· L-1的SDS溶剂进行溶解并于100 mL的容量瓶中进行定容, 得到10 mg· mL-1的油类溶液的母液。 最后, 用移液枪分别移取不同体积的溶液于10 mL的容量瓶中, 并用SDS溶剂进行定容, 使用FS920光谱仪对配制好的油类溶液进行荧光测定。

2.2 数据预处理

对于拉曼散射, 采用原始数据减去背景溶剂三维荧光光谱的方法进行去除。 对于瑞利散射, 先扣除三维荧光光谱瑞利散射区域的数据, 然后利用分段三次hermite插值方法补全被扣除的区域。 图2(a)—(d)为混合油液样本5去除散射前后的三维荧光光谱图和等高线图, 分段三次hermite插值法可以将瑞利散射去除干净, 且对光谱峰的整体形状没有影响。

图2 样本5去除散射前后的三维荧光光谱图和等高线图
(a): 带有散射的三维荧光光谱图; (b): 带有散射的等高线图; (c): 去除散射后的三维荧光光谱图; (d): 去除散射后的等高线图; (e): 小波去噪后的三维荧光光谱图; (f): 小波去噪后的等高线图
Fig.2 The three-dimensional fluorescence spectrum and contour map of sample 5 before and after removing the scattering
(a): Three-dimensional fluorescence spectrum with scattering; (b): Contour map with scattering; (c): Three-dimensional fluorescence spectrum after removing the scattering; (d) Contour map after removing scattering; (e): Three-dimensional fluorescence spectrum after wavelet denoising; (f): Contour map after wavelet denoising

利用小波变换阈值去噪法对三维荧光光谱数据进行去噪处理, 选用sym5小波对三维荧光光谱矩阵进行尺度为2的分解。 三维荧光光谱矩阵被分解为: 尺度为1和2的低频分量、 尺度为1和2的高频分量。 其中尺度为1和2的高频分量均是一些无规律的高频率噪声, 尺度为2的低频信号强度较低, 对整体信号影响不大, 因此选用尺度为1的低频信号来重构三维荧光光谱。 图2(e)—(f)是尺度为1的低频分量重构的三维荧光光谱图和等高线图, 小波变换阈值去噪法在保证荧光峰特征的同时, 去除了光谱中的高频噪声。

2.3 数据分析

平行因子算法对于组分数十分敏感, 首先需要确定混合油液的组分数。 本文选用核一致诊断法结合残差平方和的方法来确定混合油液的组分数: 核一致值等于或者接近100%并且残差平方和较小时候, 组分数选择相对正确。 图3为混合油的核一致值和残差平方和随组分数增长的变化曲线。 当组分数为1和2时, 核一致值为100%, 组分数大于2时, 核一致值开始下降; 组分数为2时的残差平方和显著低于组分数为1的残差平方和, 且与组分数为3和4时的残差平方和差距不大, 因此选择组分数2作为混合油液的组分数。

图3 (a)核一致值; (b)残差平方和Fig.3 (a) Core consistency value; (b) Residual sum of squares

Savitzky-Golay拟合求导算法的参数设置为窗口长度为7、 阶数为3。 对混合油液的三维荧光光谱矩阵求导, 得到混合油液三维荧光光谱矩阵关于激发波长和发射波长的偏导数矩阵, 然后利用平行因子算法对混合油液三维荧光光谱矩阵和三维荧光偏导数矩阵进行解析, 解析谱和标准谱对比如图4(a)—(f)所示。 将解析谱和标准谱之间的相关系数和均方根误差(RMSE)作为解析结果的评价标准, 表1为求导前后平行因子算法得到的解析谱和标准谱之间的相关系数和均方根误差(RMSE)。

图4 (a)—(f)混合油液解析谱与标准谱对比图; (g)—(l)航空煤油解析谱与标准谱对比图
(a): 原光谱的发射光谱; (b): 原光谱的激发光谱; (c): 发射波长偏导数光谱的发射光谱; (d): 发射波长偏导数光谱的激发光谱; (e): 激发波长偏导数光谱的发射光谱; (f): 激发波长偏导数光谱的激发光谱; (g): 原光谱的发射光谱; (h): 原光谱的激发光谱; (i): 发射波长偏导数光谱的发射光谱; (j): 发射波长偏导数光谱的激发光谱; (k): 激发波长偏导数光谱的发射光谱; (l): 激发波长偏导数光谱的激发光谱
Fig.4 (a)—(f)Comparison chart of analytical spectrum and standard spectrum of mixed oil; (g)—(l)Comparison of analytical spectrum and standard spectrum of jet fuel
(a): The emission spectrum of the original spectrum; (b): The excitation spectrum of the original spectrum; (c): The emission spectrum of the emission wavelength partial derivative spectrum; (d): The excitation spectrum of the emission wavelength partial derivative spectrum; (e): The emission spectrum of the excitation wavelength partial derivative spectrum; (f): The excitation spectrum of the excitation wavelength partial derivative spectrum; (g): The emission spectrum of the original spectrum; (h): The excitation spectrum of the original spectrum; (i): The emission spectrum of the emission wavelength partial derivative spectrum; (j): The excitation spectrum of the emission wavelength partial derivative spectrum; (k): The emission spectrum of the excitation wavelength partial derivative spectrum; (l): The excitation spectrum of the excitation wavelength partial derivative spectrum

表1 解析谱与标准谱之间的相关系数和均方根误差 Table 1 Correlation coefficient and root mean square error between analytical spectrum and standard spectrum

由图4(a)—(b)可知, 混合油液三维荧光光谱经过平行因子算法解析后得到的解析谱与标准谱存在较大差异, 主要是因为航空煤油主峰和副峰的荧光强度随浓度变化的相对值不一致, 即数据不满足严格意义上的三线性要求。 发射波长方向的一阶偏导数光谱在经过平行因子解析后, 得到的解析谱和标准谱的拟合结果优于求导前的拟合结果, 但是对润滑油的发射光谱拟合结果较差。 激发波长方向的一阶偏导数光谱经过平行因子解析后, 在保证润滑油解析效果的同时, 对航空煤油的解析效果明显增强, 解析谱与标准谱曲线的拟合结果优于未经求导前的拟合结果: 润滑油解析谱与标准谱之间的相关系数提升了2.7%(发射光谱)、 0.6%(激发光谱), 均方根误差降低了24%(发射光谱)、 -6.3%(激发光谱); 航空煤油解析谱与标准谱之间的相关系数提升了12.0%(发射光谱)、 6.7%(激发光谱), 均方根误差降低了70.4%(发射光谱)、 20.6%(激发光谱)。 实验结果表明, 在混合油液三维荧光光谱三线性较差情况下, 对混合油液偏导数光谱经过平行因子解析后, 能够提高解析谱与标准谱的拟合结果。

为了进一步验证在三维荧光光谱三线性较差的情况下, 一阶偏导数光谱结合平行因子算法的解析效果, 对航空煤油三维荧光光谱和三维荧光偏导数光谱利用平行因子算法分别进行解析, 得到的解析谱与标准谱对比如图4(g)—(l)所示, 解析谱和标准谱的相关系数和均方根误差如表2所示。

表2 航空煤油解析谱与标准谱的相关系数和均方根误差 Table 2 Correlation coefficient and root mean square error between analytical spectrum and standard spectrum

实验结果显示: 航空煤油发射波长偏导数光谱经平行因子解析后得到的结果优于原三维荧光光谱经平行因子解析的结果。 航空煤油激发波长偏导数光谱经平行因子解析后得到的结果比原三维荧光光谱经平行因子解析的结果有明显提升: 航空煤油发射光谱(激发光谱)解析谱与标准谱之间的相关系数提高了12.1%(10.4%)、 均方根误差降低了74.7%(79.3%)。 实验结果验证了三维荧光偏导数光谱结合平行因子算法在数据三线性较差的情况下, 有更好的解析效果。

3 结论

针对三维荧光光谱数据三线性较差、 光谱重叠严重导致平行因子算法解析效果不佳的问题, 提出了将三维荧光偏导数光谱与平行因子算法相结合的分析方法。 理论证明了三维荧光偏导数光谱应用平行因子算法的可行性, 实验结果显示三维荧光偏导数光谱经过平行因子算法解析后可以有效解决数据三线性较差导致解析效果不理想的问题。 并且小波变换阈值去噪算法的引入, 在去除了三维荧光光谱中的高频噪声的同时, 也有利于偏导数光谱的计算。 本文为实际中纯油和混合油液组分的定性检测提供了新的分析方法。

参考文献
[1] GONG Yun-fei, ZHAO Peng-fei, LAN Dong-dong, et al(宫云飞, 赵鹏飞, 兰冬东, ). Ocean Development and Management(海洋开发与管理), 2018, 35(11): 42. [本文引用:1]
[2] Guo Weijun, Zhang Shuo, Wu Guoxiang. Science of the Total Environment, 2019, 688: 494. [本文引用:1]
[3] WANG Hai-tao, REN Yi-guang, GE Zhong-fen, et al(王海涛, 任义广, 葛中粉, ). Chemical Analysis and Meterage(化学分析计量), 2018, 27(5): 127. [本文引用:1]
[4] SHEN Hai-dong, BAI Yu-hong, ZHENG Hua(沈海东, 白玉洪, 郑华). Offshore Oil(海洋石油), 2017, 37(2): 61. [本文引用:1]
[5] KONG De-ming, LI Yu-meng, CUI Yao-yao, et al(孔德明, 李雨蒙, 崔耀耀, ). Acta Optica Sinica(光学学报), 2019, 39(3): 0330004. [本文引用:2]
[6] MENG Yong-xia, CHENG Yan, LI Lin, et al(孟永霞, 程艳, 李琳, ). Environmental Science & Technology(环境科学与技术), 2019, 42(9): 134. [本文引用:1]
[7] FAN Feng-jie, XUAN Feng-lai, BAI Yang, et al(樊凤杰, 轩凤来, 白洋, ). Chinese High Technology Letters(高技术通讯), 2019, 29(1): 78. [本文引用:1]
[8] WANG Yu-tian, SHANG Feng-kai, WANG Jun-zhu, et al(王玉田, 商凤凯, 王君竹, ). Spectroscopy and Spectral Analysis(光谱学与光谱分析), 2018, 38(11): 3439. [本文引用:1]
[9] LI Zhi-gang, PENG Si-long, YANG Ni, et al(李志刚, 彭思龙, 杨妮, ). Chinese Journal of Analytical Chemistry(分析化学), 2016, 44(3): 437. [本文引用:1]
[10] DU Shu-xin, JIANG Dan-hong(杜树新, 蒋丹红). Journal of Optoelectronics·Laser(光电子·激光), 2014, 25(3): 545. [本文引用:1]
[11] CHEN Guo-qing, WU Ya-min, WEI Bai-lin, et al(陈国庆, 吴亚敏, 魏柏林, ). Acta Physica Sinica(物理学报), 2010, 59(7): 5100. [本文引用:1]