作者简介: 李茂刚, 1995年生, 西安石油大学化学化工学院硕士研究生 e-mail: lmglmg1995@163.com
甲醇汽油是一种用以替代传统汽油的新型燃料, 其品质受到甲醇含量的严重影响。 因此, 甲醇汽油中甲醇含量的快速分析对其品质把控具有深远意义。 基于拉曼光谱(Raman)结合偏最小二乘(PLS)建立了一种甲醇汽油中甲醇含量快速定量分析方法。 采用激光拉曼光谱仪对49组甲醇汽油样品的Raman光谱进行采集, 并进行光谱解析。 比较了五种光谱预处理方法对甲醇汽油原始Raman光谱的预处理效果, 并采用变量重要性投影(VIP)对小波变换(WT)预处理后的甲醇汽油Raman光谱数据进行了特征变量提取。 其次, 采用五折交叉验证(5-flod cross-validation (CV))对PLS校正模型的潜变量数目(LVs)及VIP阈值进行优化。 在最优输入变量和模型参数下, 分别构建了基于不同输入变量的PLS模型。 研究表明, 相较于原始光谱-偏最小二乘模型(RAW-PLS)和小波变换-偏最小二乘模型(WT-PLS), 变量重要性投影-偏最小二乘模型(VIP-PLS)可以获得更好的分析性能, 其预测集决定系数(Rp2)为0.960 4, 均方根误差(RMSEP)为0.0341。 因此, Raman光谱结合PLS是一种快速准确的甲醇汽油中甲醇含量分析方法。
Methanol gasoline is a new fuel to replace traditional gasoline, and its quality is greatly affected by methanol content. Therefore, the rapid analysis and detection of methanol content in methanol gasoline will have far-reaching significance for its quality control. A rapid quantitative analysis method of methanol content in methanol gasoline based on Raman spectroscopy and partial least squares (PLS) was established in this work. Raman spectra of 49 methanol gasoline samples were collected by laser Raman spectrometer, and spectral analysis was carried out. The effects of five spectral pretreatment methods on the raw Raman spectra of methanol gasoline were compared. In addition, variable importance in projection (VIP) was used to extract the Raman spectra's feature variables preprocessed by wavelet transform (WT). The number of latent variables (LVs) and VIP threshold of the PLS calibration model was optimized by 5-flod cross-validation (CV). Under the optimal input variables and model parameters, PLS models based on different input variables were constructed. The results show that compared with RAW-PLS and WT-PLS, VIP-PLS can achieve better analysis performance, with the determination of the prediction set (Rp2) of 0.960 4 and root mean square error of prediction set (RMSEP) of 0.034 1. Therefore, Raman spectroscopy combined with PLS is a fast and accurate method for analysing methanol content in methanol gasoline.
甲醇汽油是一种新型清洁燃料, 相较于传统汽油, 有着价格低廉、 尾气排放量低、 高辛烷值等优势[1, 2]。 然而其理化性质受到其甲醇含量的影响, 例如, 含量过高会导致汽化现象加剧, 增加机动车部件的磨损; 含量过低无法体现出甲醇汽油的优良特性[3]。 因此, 甲醇汽油中甲醇含量的快速定量分析对于甲醇汽油品质把控显得尤为重要。 传统检测方法包括色谱、 质谱等虽然可以实现对甲醇汽油品质的分析, 但受限于技术特点, 其检测分析时间长、 样品处理复杂等均不利于甲醇汽油生产过程中在线及现场分析的应用[4, 5]。 近年来, 分子光谱技术在油品分析中被广泛报道, 尤以红外光谱(infrared spectroscopy, IR)最为突出[6, 7, 8]。 Raman光谱技术也是一种分子光谱分析技术, 不同于IR技术, 其可用于样品分子中C=C, N—O, S—O, N—H, Si—O等化学键振动及转动等信息的检测, 从而实现对分子结构及含量等的表征[9]。 相较于传统色谱、 质谱等分析方法而言, Raman光谱技术用于样品分析时具有分析速度快, 无需复杂样品前处理、 可实时在线及现场分析等技术特点。 现如今, Raman光谱技术应用于油品品质分析主要包括品质鉴别及定量分析两方面。 张冰等[10]采用Raman光谱结合多输出最小二乘支持向量回归机(multioutput least squares support vector regression, MLS-SVR)算法对汽油中不同组分含量进行检测, 结果表明, MLS-SVR法相较于偏最小二乘(partial least squares, PLS)法对于汽油中烯烃、 芳烃、 苯、 乙醇、 甲醇等具有更好的检测精度, 其均方根误差(root mean square error of prediction set, RMSEP)分别为0.30%, 0.27%, 0.16%, 0.12%, 0.17%。 Ardila等[11]采用Raman光谱技术结合化学计量学方法对汽油分类问题进行研究, 结果表明, 对于不同厂家的汽油样品, 所构建模型的交叉验证误差均小于5%。 采用Raman光谱进行样品分析时, 会获得大量的光谱信息, 如果直接采用全谱进行模型构建, 会造成模型分析时间变长、 性能变差。 因此, 需先进行光谱预处理及特征提取, 再构建恰当的预测模型。 目前, 光谱预处理方法有多元散射校正(multiple scattering calibration, MSC)、 标准正态变换(standard normal variate, SNV)及小波变换(wavelet transform, WT)等, 特征变量提取方法包括无信息变量消除(uninformative variable elimination, UVE)、 连续投影算法(successive projection algorithm, SPA)、 变量重要性投影(variable importance in projection, VIP)等[12, 13, 14]。
本文基于Raman光谱结合PLS法对甲醇汽油中甲醇含量快速定量分析方法进行研究。 利用激光拉曼光谱仪对不同含量的甲醇汽油样品进行Raman光谱采集, 探究不同光谱预处理方法对PLS校正模型预测性能产生的影响。 采用Kennard-Stone(KS)算法以2:1的比例将甲醇汽油样品划分为校正集和预测集, 基于此构建初始PLS校正模型, 采用5-flod CV对模型的潜变量数目(latent variables, LVs)进行优化, 采用VIP法对甲醇汽油样品的Raman光谱数据进行特征变量提取并对VIP阈值进行优化。 最终, 基于优化的输入变量及LVs构建基于Raman光谱的甲醇汽油中甲醇含量快速定量分析的PLS校正模型, 并采用该PLS模型对预测集样品中甲醇含量进行预测。
制备了不同甲醇含量的甲醇汽油样品49组。 样品制备时, 将甲醇(分析纯, > 99.7%, 天津市富宇精细化工有限公司)与汽油(陕西西安某加油站, 牌号为98#)以不同的比例进行掺混, 从而获得了含有不同甲醇含量的49组甲醇汽油样品。 样品制备均在实验室通风橱环境进行, 室温为20 ℃。 由于甲醇与汽油可以很好的互溶, 无需加入其他助溶剂来促进其溶解。 将制备好的49组甲醇汽油样品置于4 ℃环境下保存待测。 表1所示为甲醇汽油样品制备时不同甲醇汽油样品中甲醇含量信息。
![]() | 表1 甲醇汽油样品中甲醇体积分数 Table 1 Methanol volume fraction in methanol gasoline samples |
使用一台激光拉曼光谱系统(QEpro6500型, 美国Ocean Optics公司)对甲醇汽油样品的Raman光谱进行采集。 该系统由半导体激光器(785 nm)、 光纤(RPB-Y)、 光谱仪(QEpro6500)及光谱处理软件(OceanView)等部件组成。 样品的Raman光谱采集范围选择为0~2 000 cm-1, 光谱仪分辨率设置为4 cm-1, 激光器功率设置成300 mW, 将甲醇汽油样品置于5 mm的比色皿中进行Raman光谱采集, 检测环境温度为18 ℃, 以空气为背景检测并将其扣除。 为了减少实验误差, 光谱采集时, 同一样品重复检测25次获得25条光谱, 每5条光谱平均, 同一样品获得5条Raman光谱, 总计获得245条光谱数据。
为了消除原始光谱数据中实验误差、 仪器误差、 环境因素等对模型性能造成的影响, 本文探究了五种光谱预处理方法(MSC, SNV, Derivative, Normalization和WT)对甲醇汽油Raman光谱的预处理效果; 采用VIP对Raman光谱进行特征变量提取; 采用5-flod CV对PLS校正模型的LVs和VIP阈值进行了优化。 最终, 基于优化的输入变量及LVs构建了甲醇汽油中甲醇含量快速定量分析的PLS校正模型, 用于预测集样品中甲醇含量分析。 以决定系数(coefficient of determination, R2)和均方根误差(root mean square error, RMSE)作为模型性能评价指标[12]。 VIP法应用于甲醇汽油Raman光谱特征变量筛选过程如下:
(1) 对甲醇汽油Raman光谱全谱的VIP重要性值进行计算;
(2) 采用不同的VIP阈值进行光谱特征变量提取, 以筛选的特征变量作为输入变量构建PLS校正模型;
(3) 采用5-flod CV对PLS校正模型的预测性能进行计算;
(4) 改变阈值, 重复步骤(2)至(3), 直至PLS校正模型获得较为理想的预测性能。
图1所示为甲醇、 98#汽油、 49组不同体积分数甲醇含量的甲醇汽油的Raman光谱图。 甲醇的Raman光谱特征峰主要包括1 031和1 448 cm-1, 98#汽油的Raman光谱特征峰主要包括723, 784, 1 001, 1 029和1 448 cm-1等。 甲醇汽油的Raman光谱特征峰包括了甲醇(1 031和1 448 cm-1)和汽油(723, 784和1 029 cm-1)的特征峰, 其中, 1 031 cm-1是由C—O键的旋转和振动引起, 1 448 cm-1是由甲基中C—H键的旋转和振动引起, 723 cm-1是由汽油中甲基叔丁基醚中含有的叔碳基团的旋转和振动引起, 784 cm-1是由汽油中环烷的旋转和振动引起的, 1 001 cm-1是由汽油中甲苯的旋转和振动引起的, 1 029 cm-1是由C—O键的旋转和振动引起的。 此外, 从图1中可以看出, 随着甲醇汽油样品中甲醇含量的不断增加, 甲醇汽油样品的Raman光谱呈现出一定的变化趋势, 例如, 1 031和1 448 cm-1的特征峰强度逐渐增大。 由此可得, 对甲醇汽油样品的Raman光谱进行分析, 可以获得甲醇汽油中甲醇含量的相关信息。
从图1中可以看出, 甲醇汽油的Raman光谱存在较为严重的基线漂移及杂散光等因素引起的光谱不平滑现象。 因此, 在校正模型构建前需对原始Raman光谱进行预处理。 本文共比较了五种光谱预处理方法(MSC, SNV, Derivative, Normalization以及WT)对甲醇汽油Raman光谱的预处理效果。 其中, 使用Derivative法对甲醇汽油的Raman光谱进行预处理时, 使用的是一阶导数法(D1st), 探究了不同的平滑点数(3, 5, 7和9)对甲醇汽油的Raman光谱的预处理效果。 结果表明, 平滑点数为7时, 模型预测性能最佳。 使用Normalization法进行预处理时, 具体用到的Normalization法为基于Raman光谱强度最大值的Normalization法。 使用WT法进行预处理时, 分别比较了基于不同小波分解层数(1, 2, 3, 4, 5, 6和7)与不同小波基函数(db1, db2, db3, db4和db5)的不同组合方式对甲醇汽油的Raman光谱的处理效果, 结果表明, 以小波基函数为db5, 小波分解层数为6的WT对甲醇汽油Raman光谱进行预处理, 模型预测性能最佳。
表2所示为基于不同光谱预处理方法的PLS校正模型的预测性能。 从表2中可以看出, 使用原始光谱进行模型构建时, 获得的校正集决定系数(coefficient of determination of cross-validation,
![]() | 表2 基于不同光谱预处理方法的PLS校正模型预测性能比较 Table 2 Comparison of prediction performance of PLS calibration models based on different spectral pretreatment methods |
LVs是PLS校正模型的关键参数, 设置不合适则会引起模型产生“ 过拟合” 或“ 欠拟合” , 这两种现象均对模型的预测性能具有负面影响。 本文采用5-flod CV对PLS校正模型的LVs进行优化。 图2所示为基于5-flod CV的PLS校正模型LVs优化。 从图2可以看出, 当LVs设置为2时, 该模型可以获得最好的校正集预测性能, 其
甲醇汽油原始Raman光谱中不仅存在噪声信息, 而且存在大量的冗余信息, 它们会对预测模型的性能带来负面影响。 因此, 建模时不仅需对原始光谱进行预处理, 也要对其进行特征变量提取, 以确保模型的性能。 本文采用VIP法对甲醇汽油Raman光谱数据特征变量进行提取, 并用5-flod CV对VIP阈值进行优化。
图3所示为采用5-flod CV进行VIP阈值优化的过程。 从图3中可以看出, 随着VIP阈值的不断增大, 校正集的
以经过VIP特征变量筛选后的甲醇汽油Raman光谱数据作为输入变量构建PLS校正模型, 并对该模型进行LVs优化, 最终优化出的LVs为2。 基于优化后的LVs及甲醇汽油Raman光谱数据构建了用于甲醇汽油中甲醇含量快速定量分析的PLS校正模型, 该模型具有较好的预测性能, 其校正集的
为了进一步验证基于甲醇汽油Raman光谱数据的PLS校正模型的预测性能, 分别构建了RAW-PLS校正模型、 小波变换-偏最小二乘(wavelet transform-PLS, WT-PLS)校正模型以及变量重要性投影-偏最小二乘(variable importance in projection-PLS, VIP-PLS)校正模型。 图4和表3所示为上述三种PLS校正模型预测性能的比较。 结合图4和表3中可以看出相较于RAW-PLS校正模型, WT-PLS校正模型和VIP-PLS校正模型的预测性能都得到了一定的提升。 比较WT-PLS校正模型和VIP-PLS校正模型可以发现, 经过特征变量提取后, VIP-PLS校正模型的预测性能产生了略微的下降, 在实际应用中基本可以忽略。 在建模时间方面, VIP-PLS校正模型的建模时间得到了很大的缩减, 因此, VIP-PLS校正模型更适用于实际甲醇汽油中甲醇含量实时在线检测。 相较于RAW-PLS校正模型, VIP-PLS校正模型的建模时间从1.36 s缩短至0.28 s, 变量个数从1 044个减少为22个, 校正集
![]() | 图4 基于Raman光谱的三种PLS校正模型预测性能 (a): RAW-PLS; (b): WT-PLS; (c): VIP-PLSFig.4 Prediction performance of three PLS calibration models based on Raman spectrum (a): RAW-PLS; (b): WT-PLS; (c): VIP-PLS |
![]() | 表3 基于不同输入变量的PLS校正模型预测性能的比较 Table 3 Comparison of prediction performance of the PLS calibration models based on different input variables |
建立了一种基于Raman光谱技术结合PLS法的甲醇汽油中甲醇含量快速定量分析方法。 制备了49组不同甲醇含量的甲醇汽油样品并在优化的光谱采集条件下对其进行光谱采集及解析。 比较了五种光谱预处理方法对原始Raman光谱预处理的效果, 并采用VIP对WT法预处理后的甲醇汽油Raman光谱数据进行了特征变量提取。 采用5-flod CV对PLS校正模型的LVs和VIP阈值进行优化。 在优化的输入变量和模型参数下, 分别构建了RAW-PLS, WT-PLS和VIP-PLS模型。 研究表明, 相较于RAW-PLS和WT-PLS模型, VIP-PLS模型可以获得更好的定量分析性能, 其建模时间为0.28 s, 校正集
[1] |
|
[2] |
|
[3] |
|
[4] |
|
[5] |
|
[6] |
|
[7] |
|
[8] |
|
[9] |
|
[10] |
|
[11] |
|
[12] |
|
[13] |
|
[14] |
|