一种基于石墨化炭黑过滤吸附处理荧光抑制和改进系统聚类分析的轻质燃油种类拉曼光谱快速识别方法
喻星辰1,2, 管亮1,*, 李子存1, 龚应忠1, 马骏1, 许贤3
1. 陆军勤务学院, 重庆 401311
2. 桂林联勤保障中心76174部队, 广西 桂林 512200
3. 军委后勤保障部军需能源技术服务中心, 北京 100036
*通讯联系人 e-mail: gl_200122@163.com

作者简介:喻星辰: 1992年生, 陆军勤务学院硕士研究生 e-mail: 1092342434@qq.com

摘要

提出了一种石墨化炭黑过滤吸附前处理抑制轻质燃油拉曼光谱荧光背景干扰的方法和一种改进的系统聚类分析算法, 实现了39个样品的种类快速识别, 即能自动将样品识别为0#车用柴油、 0#普通柴油、 97#车用汽油、 93#车用汽油、 90#车用汽油和3#喷气燃料等6种类型。 过滤吸附处理方法是用定制的50 mg石墨化炭黑过滤吸附0.75 mL油样, 然后对其进行拉曼光谱数据采集。 试验结果证明: 石墨化炭黑过滤吸附处理对无荧光背景干扰的3#喷气燃料和车用汽油样品拉曼光谱特征无明显影响, 且能够有效抑制车用汽油和车用柴油样品的拉曼弱荧光背景干扰, 以及车用汽油和普通柴油的强荧光背景干扰。 改进的有监督系统聚类分析算法将普鲁克距离作为系统聚类分析中样本间相似度的评价方法; 并将经典的系统聚类分析视为标准校正样品集的“建模”过程, 通过计算未知样品与各类属中心向量之间的普鲁克距离, 依据距离最小原则判断未知样品的类属。 通过对39个具有不同拉曼荧光背景干扰特征油样的石墨化炭黑前处理和“留一法”交互验证分类识别, 分析结果证明: 石墨化炭黑过滤吸附前处理抑制拉曼光谱荧光背景的方法能够有效提取轻质燃油的拉曼光谱特征并应用于定性种类识别。

关键词: 拉曼光谱; 荧光抑制; 石墨化炭黑; 系统聚类分析; 种类识别; 轻质燃油
中图分类号:TE622 文献标志码:A
A Fast Raman Spectroscopy Classification Method for Fuels Combining the Fluorescence Background Correction Based on GCB Preprocess and Modified Hierarchical Clustering
YU Xing-chen1,2, GUAN Liang1,*, LI Zi-cun1, GONG Ying-zhong1, MA Jun1, XU Xian3
1. Oil Department, Army Logistical University of PLA, Chongqing 401311, China
2. 76174 Army, Guilin Logistical Support Center, Guilin 512200, China
3. Military Energy and Supply Technical Service Center, Logistics Support Department of PLA, Beijing 100036, China
Abstract

In this article, a Raman spectroscopy classification method combining the fluorescence background rejection based on graphitized carbon black (GCB) preprocessing and modified hierarchical clustering analysis (HCA) has been put forward, by which 39 fuel samples have been classified correctly and automatically into six types of 0# automobile diesel fuel, 0# general diesel fuel, 97# gasoline, 93# gasoline and 3# jet fuel. GCB preprocessing, during which 50mg GCB is used to filter 0.75 mL fuel sample once, has no influence on those samples which have no fluorescence background such as 3# jet fuels and gasolines and can reject effectively the weak fluorescence background of gasoline and automobile diesel fuel samples and strong fluorescence background of gasoline and general diesel fuel samples. Firstly, the Procrustes distance in the Procrustes analysis (PA) was adopted to measure the similarity between the samples for the classical HCA which was regarded as the modeling stage in the modified HCA algorithm. And the centroid vectors belonging to the different clusters were calculated according to the results of the HCA. Secondly, the types of the unknown test samples could be determined by calculating and comparing the Procrustes distances between the test samples and the centroid vectors of the clusters. The “leave-one-out” cross validation results based on the 39 samples belonging to 6 classes have shown that the GCB preprocessing is an effective fluorescence rejection method for Raman spectra of light fuels which can be applied to qualitative and quantitative analysis.

Keyword: Raman spectroscopy; Fluorescence rejection; Graphitized carbon black (GCB); Hierarchical clustering analysis (HCA); Classification; Light fuel
引 言

拉曼光谱是一种散射光谱, 其优点主要在于: (1)光谱特征性较强。 拉曼光谱峰形尖锐, 相较于对分子倍频和合频吸收的近红外光谱, 光谱特征性更明显。 (2)拉曼光谱分析精度较高。 随着拉曼光谱分析仪器硬件系统的不断升级[2], 仪器稳定性和检测重复性有了较大提高; 相关化学计量学数据处理算法得到了开发应用, 相关拉曼谱图数据库也不断完善; 这些改进和发展使得拉曼检测技术的定量分析和定性分析精准度大大提高。 (3)拉曼检测能够实现无损便携式快速分析。 拉曼检测对象无需特殊的样品前处理; 拉曼光谱仪器能够实现小型化和手持式; 检测时间为秒级, 具有检测速度快、 分析效率高的特点。 拉曼激光器波长规格多样, 可依据需要进行选用, 检测范围广, 甚至能实现活体中的生物物质检测。 拉曼分析所需样品量少, 微克(毫升)数量级的样品就可完成检测。 (4)拉曼光谱分析仪器环境适应性强。 相对于中红外光谱仪, 属于散射光谱的拉曼光谱仪对样品池要求低, 可以是玻璃容器; 仪器部件耐水、 防潮要求低; 水对拉曼光谱信号基本无影响。 拉曼光谱仪的环境适应性与近红外光谱仪相当, 优于中红外光谱仪, 这也是拉曼光谱仪能够向便携式、 手持式现场快速检测的重要原因之一。 拉曼光谱能够较好地应用于石油产品特别是轻质燃油的定性和定量分析[2, 3]。 例如, 田高友[4]认为拉曼光谱技术具有结果准确、 分析速度快、 操作简单、 不破坏样品、 多参数、 便携以及可现场分析等优点, 将在石油化工领域得到进一步推广应用。 娄婷婷等利用拉曼指纹图谱对石油产品进行了特性测试与分析, 通过选定指纹峰与峰值比例计算, 实现了不同种类及型号石油产品的鉴别, 并有效检测了不同汽油产品的质量。

荧光背景干扰是影响拉曼光谱质量的主要因素之一。 这种干扰现象在石油产品分析中尤为突出, 使得拉曼光谱容易被荧光背景所掩盖。 例如, 多数储存时间较长的汽油都存在拉曼荧光干扰现象, 这使得拉曼光谱基线抬高, 掩盖了部分拉曼特征信号; 大多数普通柴油的荧光背景干扰使得拉曼信号完全被淹没。

目前, 拉曼光谱荧光背景干扰的抑制方法主要是利用拉曼散射光与荧光的特性差异, 这些方法可以分为三种类型: 一是改进拉曼光谱仪器硬件结构设计。 例如, 选择合适入射光波长或激发光光子能量、 时间分辨拉曼光谱法、 门控法、 偏振调制法等。 特别是采用1 064 nm近红外长波激光光源的荧光抑制效果较为理想, 但1 064 nm长波激光光源需要较高的激光器能量且对深色样品具有较大的热效应, 导致光谱信号弱、 光谱质量变差且价格昂贵。 这一类型方法需要增加一定的硬件设备, 使整个拉曼光谱检测系统变得更复杂, 成本也相应增加。 二是通过对待测样品的处理来抑制荧光干扰。 主要包括荧光猝灭剂法、 光漂白法等。 三是拉曼数据的软件校正方法。 例如频域滤波法、 小波变换法和曲线拟合法等。 但软件校正方法只能处理一些拉曼信号本身比较强的光谱, 对于噪声较大的光谱或者荧光光谱形状比较复杂的情况, 产生的误差较大。

另一方面, 定性种类鉴别也是石油产品的拉曼定量分析的基础。 由此, 本文提出了一种基于石墨化炭黑前处理拉曼光谱荧光抑制及改进系统聚类分析的轻质燃油种类鉴别方法。 采用石墨化炭黑对样品进行前处理的原理为将轻质燃油中导致强荧光干扰的物质从油样中分离出来, 这些物质主要为三环及以上的芳烃类和含硫、 氮杂原子环类物质, 且这些物质含量极小, 一般不超过1% [1]

1 实验部分
1.1 轻质燃油拉曼荧光背景抑制方法

采用石墨化炭黑过滤吸附材料对油样进行前处理, 以达到消除拉曼荧光背景的目的。 石墨化炭黑(graphitized carbon black, GCB)是在密闭惰性气体环境中, 将碳黑加热至约2 700 ℃, 生成的一种碳材料, 其表面具有部分极性位点, 并具有六边形的微观结构, 使得其对平面分子尤其是具有平面芳香环的分子具有强烈的吸附作用[1]

操作方法: 采用定制的50 mg一次性针式石墨化炭黑过滤吸附柱, 对油样进行处理, 每次过滤吸附油样为0.75 mL。

1.2 改进的系统聚类算法

经典的系统聚类法亦称谱系聚类法, 其是一门多元统计分类法, 属于无监督模式识别方法的一种[5]。 系统聚类一般分为两步: 首先, 计算样本两两之间的相似度矩阵; 然后根据相似度进行聚类操作, 把相似度大的样本进行聚合形成新类, 并将之视为新的样本, 循环操作, 直到所有的样本都聚合完毕, 逐步画成一张完整的分类系统图, 又称谱系图。 样本间相似程度由距离或者相似系数定义。 进行类别合并的准则是使得类间差异最大, 而类内差异最小。 系统聚类的最大优点在于能够根据样本之间的相似度进行自动分类。 笔者认为, 系统聚类分析的不足主要在于对分类结果的后续利用上。 由于分类处理的主要目的在于对未知样本的分类处理, 因此笔者将经典的系统聚类算法进行了改进: 在对标准校正集样本进行系统聚类分析后, 针对聚类结果, 求得各类的中心; 当对未知样品进行分类处理时, 求得未知样品与各类中心之间的距离或相似度, 以此判断未知样品的类属情况。

改进算法的核心思路为:

(1)将经典的系统聚类分析视为标准校正样品集的“ 建模” 过程, 改进的是增加了后续的“ 预测” 分析过程, 由此建立了基于无监督系统聚类分析的有管理分类处理算法。

(2)将普鲁克距离作为系统聚类分析中样本间相似度的评价。 其原因在于: 普鲁克分析(Procrustes analysis, PA)是统计学中用于多元变量分析的一种工具。 普鲁克分析在物体统计形态的分析中应用较为广泛, 其通过旋转、 平移、 缩放等线性相似变换来比对形状和物体界标点集之间的相似性, 并以此评价物体形状特征。 笔者提出了一种基于普鲁克分析的润滑油红外光谱指纹区相似度评价方法, 对于降低测试条件对润滑油红外光谱指纹区图谱的影响[6]效果较好。

具体算法流程如图1所示。

图1 改进的系统聚类算法流程图Fig.1 The flowchart of modified hierarchical clustering analysis

值得指出的是, 当未知样品经过类别分析后, 其能够自动加入校正集作为标准样品, 并更新相应类的中心。 系统聚类分析中, 样本之间相似度采用普鲁克距离, 类与类之间连接计算方式为single方式。 图1中, “ 各类的中心向量” 即为各类全部样品的中心或者质心向量, 是本类样品拉曼光谱特征的平均特征的表征向量。 程序在Matlab2015a环境下编写并调试通过。

根据轻质燃油拉曼光谱特征, 选取1802 000 cm-1范围的频率段数据作为光谱数据。 由于样品数量的限制, 为了验证算法的有效性, 采用“ 留一法” 进行算法交互验证。

1.3 样品

从有关油库搜集了39个轻质燃油样品, 其中3#喷气燃料12个, 90#车用汽油6个, 93#车用汽油8个, 97#车用汽油3个, 0#普通柴油6个, 0#车用柴油4个。 样品及拉曼荧光干扰情况如表1所示。

表1 样品及荧光情况列表 Table 1 The light fuel samples list
1.4 方法

(1)过滤吸附材料: 定制的一次性50 mg针管式石墨化炭黑过滤吸附柱。

(2)拉曼仪器及参数: 测定仪器为美国必达泰克I-Raman-Plus高灵敏度便携式拉曼光谱仪。 光源为785 nm激光器。 光谱分辨率: 3 cm-1, 积分时间: 30 s, 激光功率: 100%(495 mW), 平均检测次数: 2次, 实验环境温度: 室温。

(3)试验方法: 首先, 使用定量微量取样器取0.75 mL油样, 注入到一次性活性炭过滤柱中进行过滤吸附处理, 将处理后的油样保存于2 mL色谱分析玻璃瓶中, 并迅速加盖密封。 然后, 将保存了过滤油样的玻璃瓶进行拉曼光谱数据采集。 每次实验前, 摇晃存放油样的玻璃瓶, 再放入暗箱中静置30 s, 待油样内部液流稳定后, 再进行拉曼光谱数据采集。

2 结果与讨论
2.1 荧光背景处理结果

通过对每个油样过滤吸附处理前后拉曼光谱图的对比分析, 得出的主要结论为:

①对于无荧光干扰的3#喷气燃料油样, 过滤吸附处理对拉曼光谱造成的差异极小, 对拉曼光谱特征无影响。 以3号3#喷气燃料油样为例, 其过滤吸附处理前后的拉曼光谱对比如图2所示。

图2 3号3#喷气燃料样品过滤吸附前后的 拉曼光谱对比图Fig.2 Raman spectra before and after adsorption filtration of 3# jet fuel sample No.3

②对于具有弱荧光背景的油样, 采用该种材料过滤吸附处理可使油样拉曼光谱基线由倾斜状变得水平, 并且不改变拉曼光谱特征峰位置, 同时能够获取部分被强荧光覆盖的特征峰。 图3和图4分别为16号90#车用汽油样品和37号0#车用柴油样品过滤吸附前后的拉曼光谱对比图。 由图可知, 经过滤吸附处理后, 在拉曼位移为176~2 850 cm-1之间, 严重抬高的倾斜基线变得水平, 在谱图前段, 被荧光覆盖的特征峰显现出来。

图3 16号90#车用汽油样品过滤吸附前后的拉曼光谱对比图Fig.3 Raman spectra before and after adsorption filtration of 90# gasoline sample No.16

图4 37号0#车用柴油样品过滤吸附前后的拉曼光谱对比Fig.4 Raman spectra before and after adsorption filtration of 0# Automobile diesel fuel sample No.37

③对于具有强荧光背景干扰的油样, 过滤吸附处理能够消除荧光干扰, 使油样的拉曼光谱特征展现出来。 以32号0#轻柴油样品为例, 其过滤吸附前后的拉曼光谱对比如图5所示。

图5 32号0#普通柴油样品过滤吸附前后的拉曼光谱对比图Fig.5 Raman spectrum before and after adsorption filtration of 0# diese fuel sample No.32

2.2 改进系统聚类分析结果

根据所提出的改进系统聚类分析, 首先对所有样品进行系统聚类分析, 聚类结果如图6所示。

图6 系统聚类谱系图Fig.6 Hierarchical clustering results

从图6可以看出, 采用普鲁克距离作为样品间相似度评价方法能够对6类轻质燃油进行正确的分类。 依据改进的系统聚类分析算法的第二步, 计算并绘制各类轻质燃油的中心向量, 如图7所示。 各类燃油的中心向量代表的是此类油品的公共特征, 能够作为这一类油品的代表。 从图7可以看出, 自上而下的0#车用柴油、 0#普通柴油、 97#车用汽油、 93#车用汽油、 90#车用汽油和3#喷气燃料的中心向量特征有着较大的差异, 其中0#车用柴油和0#普通柴油的中心向量相似度较高, 97#车用汽油、 93#车用汽油和90#车用汽油的中心向量相似度较高, 这种相似度特征也证明了拉曼光谱对于不同类型轻质燃油的特征提取能力。

图7 各类轻质燃油中心向量Fig.7 Centroid vectors of samples during modified hierarchical clustering process

采用“ 留一法” 交互验证方法, 计算每个样品到各类轻质燃油中心向量之间普鲁克距离, 如表2所示。

表2 “ 留一法” 各样品种类识别结果 Table 2 Clustering results based on leave one out cross validation

根据最短距离原则可知, 样品识别结果全部正确。

3 结 论

将轻质燃油拉曼光谱荧光抑制方法和种类识别算法相结合, 实现了轻质燃油种类的快速识别, 奠定了轻质燃油拉曼定量分析的基础。 提出了石墨化炭黑过滤吸附前处理抑制轻质燃油拉曼光谱荧光背景的方法, 并在此基础上, 提出一种改进的有监督的系统聚类分析算法, 实现了6类39个具有不同拉曼荧光背景特征的油样的定性种类快速自动识别。

The authors have declared that no competing interests exist.

参考文献
[1] YU Xing-chen, GUAN Liang, YE Fei, et al(喻星辰, 管亮, 叶飞, ). Journal of Logistical Engineering University(后勤工程学院学报), 2017, (1): 28. [本文引用:2]
[2] ZHOU Dian-feng(周殿凤). Optical Instruments(光学仪器), 2008, (6): 42. [本文引用:2]
[3] JIANG Shu-bo, LIN Jin-guo, CHENG Ming-xiao, et al(蒋书波, 林锦国, 程明霄, ). CIESC Journal(化工学报), 2011, (8): 2188. [本文引用:1]
[4] TIAN Gao-You(田高友). Modern Scientific Instruments(现代科学仪器), 2009, (2): 130. [本文引用:1]
[5] LIANG Yi-zeng, WU Hai-long, YU Ru-qin(梁逸曾, 吴海龙, 俞汝勤). Chemometrics(化学计量学), 2016, (10): 553. [本文引用:1]
[6] MA Lan-zhi, GUAN Liang, FENG Xin-lu, et al(马兰芝, 管亮, 冯新泸, ). Acta. Petrol. Sin. (Petrol. Process. Sec. )(石油学报·石油加工), 2013, (5): 891. [本文引用:1]