基于三维荧光光谱-平行因子分析的海上溢油识别技术研究
周艳蕾1, 周飞飞1, 姜聪聪1, 石晓勇1,2,*, 苏荣国1
1. 中国海洋大学化学化工学院, 山东 青岛 266100
2. 国家海洋局海洋减灾中心, 北京 100194
*通讯联系人 e-mail: shixy@ouc.edu.cn

作者简介: 周艳蕾, 女, 1993年生, 中国海洋大学化学化工学院硕士研究生 e-mail: zhouyanlei21@163.com

摘要

在世界范围内溢油事件频繁发生, 溢油的组成成分会影响人类身体健康和生态系统。 因此, 迫切地需要一种可以快速识别溢油种类的方法。 针对溢油污染物现场快速鉴别的需求, 利用平行因子分析技术建立了基于三维荧光光谱的原油、 燃料油识别方法。 首先, 利用Delannay三角形内插值法对实验选的6种原油(Roncador原油、 巴士拉原油、 俄罗斯原油、 沙特原油(重质)、 上扎库姆原油、 海二站原油)和三种燃料油(380CST燃料油、 5-7号燃料油、 岚山燃料油)的三维荧光光谱去散射, 去散射后的三维光谱数据进行归一化处理; 之后, 对三维荧光光谱进行平行因子解析, 确定七个荧光组分为最佳荧光组分, 进而得到由7个荧光成分组成的样品荧光特征谱, 将风化第3, 15和45天的样品及未风化样品的第一平行样的荧光特征谱进行贝叶斯方法(Bayes)判别分析和聚类分析, 确定油品荧光特征谱的分析能力和18条荧光标准谱库(12条原油标准谱和6条燃料油标准谱); 最后, 利用非负最小二乘多元线性回归建立溢油荧光识别方法, 对第0, 7和30天风化的样品和未风化样品的另一平行样进行识别。 实验结果表明, 除对风化及未风化的俄罗斯原油识别外, 该方法对其余风化和未风化的五种原油和三种燃料油识别正确率均为100.0%, 整体识别原油正确率为87.5%, 燃料油正确率为100.0%。

关键词: 溢油; 三维荧光光谱; 平行因子分析; 非负最小二乘法
中图分类号:O657.3 文献标志码:A
Research of Identification Method for the Oil Spills Species Based on Fluorescence Excitation-Emission Matrix and Parallel Factor Analysis
ZHOU Yan-lei1, ZHOU Fei-fei1, JIANG Cong-cong1, SHI Xiao-yong1,2,*, SU Rong-guo1
1. College of Chemistry and Chemical Engineering, Ocean University of China, Qingdao 266100, China
2. National Marine Hazard Mitigation Service, Beijing 100194, China
Abstract

Accidental oil spills occur frequently around the world and they can have serious influence on the human health and the ecosystem due to the compounds in oil. Thus, there is an urgent need for an accurate method for determining the source of spills. In order to meet the rapidly demand identifying methods of oil spills, this paper utilized parallel factor analysis to develop an identification method for the crude oils and fuel oils based on their fluorescence excitation-emission matrixes. Firstly, the fluorescence excitation-emission matrixes of six kinds of crude oils (Roncador crude oil, Basra crude oil, Russian crude oil, Saudi crude oil (heavy crude oil), Upper Zakum crude oil, sea two station crude oil) and three kinds of fuel oils (380 CST fuel oil, Fuel oils No.5—No.7, LanShan fuel oil) were normalized after removing scatter by Blannany triangulation with linear interpolation. Afterwards, the parallel factor analysis was used for the fluorescence excitation-emission matrixes. Seven factors can be reliably extracted from the data set, and then seven fluorescence components were obtained, which made up the characteristic spectrum. By clustering analysis and Bayesian Discrimination of the characteristic spectrum from the samples that had experienced weathered for 3, 15 and 45 days and not experienced weathered, the capacity of the oil fluorescence spectrum analysis was determined and the fluorescence feature spectra library consisted of 12 standard fluorescence spectra of crude oils and 6 standard fluorescence spectra of fuel oils was established. In the end, multiple linear regression was used to recognize the samples that had experienced weathered for 0, 7 and 30 days by the oil standard fluorescence spectra. The results showed that, except for Russian crude oil, the method could clearly classify 5 kinds of crude oils and 3 kinds of fuel oils which had experienced weathered and had not experienced. Furthermore, the accuracy of the identification for crude oils and fuel oils were 100.0%, and the overall accuracy of the identification for crude oils and fuel oils were 87.5% and 100%, respectively.

Keyword: Oil spills; Fluorescence excitation-emission matrix; Parallel factor analysis; Non-negative least squares

引 言

海上溢油污染已成为全球海洋污染的重要问题之一, 溢油会造成其发生海域的植物、 浮游生物、 贝类、 鱼类等生物的毒素积累[1, 2]甚至致死, 导致污染区域的经济损失、 水文变化以及人体健康损伤等危害。 在溢油事故发生后, 快速、 准确的鉴别溢油的种类能够为有关部门进行应急处理提供重要的依据。

目前, 海面溢油鉴别方法有气相色谱法(常用火焰氢离子检测气相色谱GC-FID)、 红外光谱法、 紫外分光光度法、 高温液相色谱法、 重量法和荧光光谱法。 其中, 三维荧光光谱法(excitation-emission matrix, EEM)对多环芳烃化合物有良好的“ 指纹” 鉴别功能, 如溢油中的萘、 菲、 芴和二苯并噻吩等[3, 4], 且具有分析速度快, 灵敏度高等优点, 成为溢油鉴别方法的热点研究内容之一。 平行因子(parallel factor analysis, PARAFAC)算法是基于三线性分解理论采用交替最小二乘算法实现的一种数学模型[5], 能够将荧光性混合物EEM数据分解为单个荧光物质的EEM, 有“ 数学色谱” 之称。 近年来, EEM-PARAFAC技术在荧光成分解析中得到广泛应用[6, 7]。 Christensen等[8]将EEM-PARAFAC结合GC-FID研究丹麦Baltic Carrier 溢油种类识别, 发现其对轻质燃料油、 润滑油和未知油品有较好的分类识别, 而对原油和重质燃料油的识别效果较差。

基于此, 本文选择六种原油、 三种燃料油, 分别测其未风化和进行六个不同时间室外自然风化下的三维荧光光谱, 运用平行因子解析三维荧光光谱, 获得油品荧光成分组成(荧光特征光谱), 通过聚类分析构建荧光标准谱库, 采用非负偏最小二乘(non-negative least squares, NNLS)确定识别油品种类及其相对含量, 从而建立针对溢油污染物中的原油及燃料油的EEM-PARAFAC-NNLS识别技术。

1 实验部分
1.1 油品及油品制备

海二站原油来自胜利油田海洋采油厂, 从黄岛进出口检验检疫局获得其他实验油品, 油品名称见表1

表1 所用实验油品名称 Table 1 The name of the samples

未风化油品制备: 取适量油品在Sigma离心机3 000 r· min-1离心10 min, 取上层油样。 每种油品各取0.002g用正己烷溶解并定容于10 mL比色管中, 加入适量无水硫酸钠, 最后将其稀释至2 mg· L-1。 以上述方法, 每种油品平行制备两份。

风化油品制备: 在室外自然条件下风化10 g油品和400 mL海水混合液(风化时间从2014年9月26日— 2014年11月10日)。 分别在第0, 3, 7, 15, 30和45天取适量风化油品, 按未风化油品制备方法制备。

1.2 三维荧光光谱数据采集

将制备的油品测三维荧光光谱, 利用origin7.5将测得的三维荧光光谱数据(SPC格式)转换成TXT格式, 得到的数据均使用Matlab R2012a软件处理。

表2 实验样品数量 Table 2 The number of the samples
1.3 光谱数据预处理

Rayleigh散射的存在严重影响油品荧光强度信号, 若不去散射会建立具有偏差的三线性模型。 因此在模型分析数据前, 必须将散射去除。 使用Delaunay三角形内插值法去除散射(图1)。 此方法是在去除散射带数据后用散射带两侧数据拟合散射区域数据, 可有效消除散射峰的影响并保留原有散射区域的荧光信号。 将去除散射后的三维光谱数据进行归一化处理(图2)。

图1 三维荧光光谱去散射前(a)和去散射后(b)Fig.1 The original 3D spectrum with scattering (a) and without scattering (b)

图2 归一化后的三维荧光光谱图Fig.2 The 3D spectrum after normalization

1.4 油品三维荧光光谱的平行因子分析

平行因子算法(PARAFAC)是基于交替最小二乘原理的迭代三维数阵分解算法。 该算法可以对油品三维荧光数据(数阵I× J× K)分解为三个二维载荷矩阵A(I× F), B(J× F)和C(K× F)的乘积, 从而提供一种较为客观的溢油指纹信息[9]。 表示为式(1)

Xijk=f=1Faifbjfckf+eijki=1, , I; j=1, , J, k=1, , K(1)

式(1)中, F表示荧光因子数; Xijk是三维矩阵X(I× J× K)中的元素, 表示在发射波长j、 激发波长k下第i个样品的荧光强度值; aif是相对激发矩阵A(I× F)中的元素, 表示第i个样本中第f个因子数相对浓度值; bif是相对发射矩阵B(J× F)中的元素, 表示第f个因子数在波长j处的荧光强度; ckf是浓度阵C(K× F)中的元素, 第f个因子数在波长k处的荧光强度; eijk是三维残差矩阵E(I× J× K), 无法用模型解释的部分。

1.5 建立油品、 燃料油荧光标准谱图库

油品的三维荧光光谱谱形取决于其多环芳烃化合物的组成, 而多环芳烃化合物的组成可能会受到其所处环境的影响。 因此, 不仅需要获得不同风化时期的油品三维荧光光谱, 而且需要对不同风化时期的油品荧光特征谱数据进行处理, 以获得能够完全表达实验油品荧光特征的信息。 在本研究中, 将第3, 15和45天的所有第一平行实验油样作为训练集, 剩余为验证集, 利用Bayes判别分析确定油品荧光特征谱(由平行因子分析得到的荧光成分组成)分类能力, 得出其判别准确率及误判情况。

为提高分析速度, 避免计算冗余, 通过系统聚类法对每种油品的所有荧光特征谱进行聚类, 以欧氏距离作为标准谱图之间相似程度的衡量, 对聚为一类的特征谱取平均值, 得到一条油品荧光标准谱, 共得到18条荧光标准谱(原油12条和燃料油6条), 组成荧光标准谱库。

1.6 基于非负最小二乘法的荧光识别技术建立

采用非负最小二乘(non-negative least squares, NNLS)解析的多元线性回归法建立溢油污染物荧光识别测定技术。 将构建的荧光标准谱与未风化及第1, 3和5次风化时期的单种油品的荧光特征谱进行线性拟合, 从而识别油品种类及其相对含量。 回归方程如式(2)

y=a0+a1x1+a2x2++aixi+εi=1, 2, , n(2)

式(2)中, 未知样品荧光光谱作为因变量y; xi是谱库中所有油品的荧光标准谱; a0是非负约束条件; ai是回归系数; ε 是残差。

2 结果与讨论
2.1 平行因子分析法提取三维荧光光谱特征

样品受环境和人为因素的影响会出现异常, 对分析结果产生不良影响, 因此在进行平行因子分析前要先鉴别并去掉异常样品值。 本实验方法是比较不同油品的所有Leverage数值, Leverage数值越大则其为异常值的可能性就越大。 由图3可见, 油样第13, 22, 58和278的Leverage数值大于其他油样, 因此确定第13, 22, 58和278油样为异常样品。

图3 异常样品的选取Fig.3 The identification of abnormal samples

将异常样品去除后, 利用残差分析来确定因子数。 由图4可见, 因子数F=6的残差明显大于F=7, 且升幅较大; 当F=8时, 有部分残差与F=7时差距不大, 但仍有大部分残差有明显增大的现象, 因此确定F=7为最佳荧光组分数。

图4 组分残差图Fig.4 Residual figure of components

由图5可见, 由平行因子分析得到的7个组分油品三维荧光光谱与原始三维荧光光谱能够很好地吻合, 残差分布图显示荧光信号得到了充分的提取。 因此, 7组分平行因子模型能够较好的提取油品三维荧光光谱的荧光特征。 平行因子分析后得到的7种荧光组分如图6所示。

图5 油品三维荧光谱、 重构三维荧光光谱和残差分布图Fig.5 3Dfluorescence spectrum, reconstruct 3D fluorescence spectra and residual distribution of samples

图6 平行因子法得到的七个荧光组分Fig.6 Seven fluorescent components identity by PARAFAC model

2.7 荧光特征谱Bayes判别分析

对油品荧光特征谱进行Bayes判别分析(图7), Roncador原油、 巴士拉原油、 俄罗斯原油、 上扎库姆原油、 380CST燃料油和5-7号燃料油能够被完全正确判别。 沙特原油(重质)、 海二站原油和岚山燃料油有1个散点, 说明这三种油品中有1个样品被误判。

图7 油品荧光特征谱的Bayes判别分析结果Fig.7 The Bayesian discriminate result of oil samples undissolved in water

2.3 油品识别结果

对原油、 燃料油的识别结果如表3。 六种原油中, 除俄罗斯原油外, 均能正确识别, 整体识别正确率为87.5%。 三种燃料油的识别正确率为100.0%。 有研究利用小波分析及三维荧光光谱对溢油进行识别, 原油的识别正确率为66.7%, 燃料油大类识别正确率为94.4%, 相对而言, 本方法具有更强的识别能力。 从识别结果可知, 本方法能够将原油和燃料油两类油品完全区分开, 可能由于原油在加工成燃料油的复杂过程中, 性质较为稳定的多环芳烃化合物含量相对增加, 两类油品之间会产生较大差异, 而此类物质的挥发性很小, 受自然风化影响比较慢, 使得同种油品在风化程度不同时, 其多环芳烃化合物的指纹信息相对稳定。

表3 油品在原油、 燃料油分类上的识别结果 Table 3 Discrimination results of oil samples at crude, fuel oil level
3 结 论

海上溢油识别技术是溢油污染治理研究的基本需要。 通过测量六种原油和三种燃料油的三维荧光光谱, 采用平行因子分析和聚类分析确定了实验油品最佳荧光组分数、 提取各种实验油品荧光特征并建立荧光标准光谱库。 在此基础上, 利用非负最小二乘方法建立了快速、 低成本的油品识别技术, 识别正确率分别为87.5%和100.0%, 可为溢油污染物的现场、 快速鉴别提供技术支持。

The authors have declared that no competing interests exist.

参考文献
[1] Darcy A Chase, Donn S Edwards, Qin Guangqiu, et al. Science of the Total Environment, 2013, (444): 121. [本文引用:1]
[2] Chen H, Liu S, Xu X R, et al. Marine Pollution Bulletin, 2015, 90(1-2): 181. [本文引用:1]
[3] LIU Xiao-jing, WU Xiao-yan, QI Cai-ya, et al(刘小静, 吴晓燕, 齐彩亚, ). Hebei Journal of Industrial Science and Technology(河北工业科技), 2012, 29(6): 422. [本文引用:1]
[4] YIN Xiao-nan, ZHANG Hai-jiang, ZHOU Hong-yang, et al(尹晓楠, 张海江, 周洪洋, ). Journal of Hunan University·Natural Sciences(湖南大学学报·自然科学版), 2012, 39(8): 57. [本文引用:1]
[5] GAN Su-chai, WU Ying, BAO Hong-yan, et al(甘肃钗, 吴莹, 鲍红艳, ). China Environmental Science(中国环境科学), 2013, 33(6): 1045. [本文引用:1]
[6] Guo Weidong, Xu Jing, Wang Jiangjing, et al. Journal of Environmental Sciences, 2010, 22(11): 1728. [本文引用:1]
[7] Mendoza W G, Riemer D D, Zika R G. Environmental Sciences Processes & Impacts, 2013, 15(5): 1017. [本文引用:1]
[8] Christensen J H, Hansen A B, Mortensen J, et al. Analytical Chemistry, 2005, 77(7): 2210. [本文引用:1]
[9] Omrani H, Barnes J A, DudelzakA E, et al. Analyst, 2012, 137(12): 2782. [本文引用:1]