作者简介: 刘燕德, 女, 1967年生, 华东交通大学机电与车辆工程学院教授 E-mail: jxliuyd@163.com
甲醇汽油是一种清洁能源, 甲醇汽油中甲醇的含量决定了汽油的性能。 通过中红外光谱对甲醇汽油中甲醇含量进行定量检测和分析。 首先, 对采集的甲醇汽油原始中红外光谱进行平滑处理(
Methanol gasoline is a new type of environmentally friendly diesel fuel, and the performance and quality of methanol-gasoline are based on the diesel methanol content. In this work, mid-infrared spectroscopy was successfully used to evaluate the methanol contents in methanol-gasoline samples with the aid of chemometric approaches. First, the mid-infrared spectral data obtained were pre-processed by smoothing standard normal, multiple scatter correction (MSC), baseline correction and normalization, and the partial least-square (PLS) quantitative calibration models were established, and the best pre-processed method was found. It was found that the PLS model pre-processed by MSC was much better than others, and the r and RMSEP evaluated were 0.918 and 2.107, respectively. In order to simplify the model and improve the prediction accuracy, uninformative variable elimination (
随着汽车工业的发展、 石油消耗量越来越大, 其储量减少并伴随着汽油燃烧对环境的污染, 汽油和柴油等传统燃料的使用面临着巨大挑战。 由于甲醇具有清洁可再生的优点, 使得甲醇汽油成为了一种可替代的能源, 受到了越来越多的重视[1, 2, 3]。
甲醇汽油的使用可以提高汽油中的含氧量, 使汽油更充分燃烧, 此外能够有效降低一氧化碳和有毒气体排放。 目前市场上低浓度的甲醇汽油可以直接替代汽油使用, 例如M15汽油中甲醇含量约为15%; 当比例达到85%以上, 则称为高浓度甲醇汽油[4], 若需要使用高浓度甲醇汽油, 则需要添加助溶剂或者改变发动机结构, 针对目前市场而言, 使用更多的还是低浓度甲醇汽油[5, 6, 7]。
甲醇汽油作为燃料也存在一些不足, 比如甲醇汽油的热值较低, 当掺入过量时会导致发动机动力不足。 此外, 过量的甲醇燃烧容易产生气阻, 影响系统供油, 从而对发动机的气密性产生不良影响, 所以甲醇含量是甲醇汽油品质的一个重要衡量指标。 寻找一种高效的准确的方法来快速检测甲醇汽油中甲醇的含量显得尤为重要[8, 9, 10]。
在过去的二十年里, 国内外学者做了大量关于汽油的光谱分析研究, 光谱检测方法分析石油炼制和石油化工产品比一般技术(ASTM)更快, 呈现良好的准确度和精密度, 无需破坏样品, 可用于远程质量监控, 在食品、 医药、 石化、 农业等多个行业领域的定性定量检测分析中被广泛应用[11]。 中红外光谱(mid infrared spectroscopy, MIR)的波数范围在4 000~400 cm-1之间, 反映的是分子中原子的伸缩和变形振动运动。 张瑞华[12]利用近红外和中红外对汽油的调和比进行测定, 相关系数大于0.9。 毛佳伟等[13]利用中红外快速测定汽油中的甲苯含量, 得到了较好的效果。 欧阳爱国[14]等采用了近红外和拉曼光谱仪两种光谱仪器, 建立了甲醇含量的PLS模型。 实验结果表明, 同样是PLS模型, 应用近红外光谱获得的结果更好。 姚捷[15]等采用拉曼光谱检测甲醇汽油, 针对拉曼特征峰建立甲醇含量的一元线性回归模型, 实验结果表明, 使用拉曼特征峰所需样本数更少且模型具有良好的精度和稳健性。
应用中红外光谱技术对甲醇汽油含量的检测, 目前还鲜有报道。 本工作采用中红外光谱, 建立对甲醇汽油不同预处理后的甲醇汽油甲醇含量的PLS模型, 为进一步优化模型, 结合UVE波段筛选算法, 建立了UVE-PLS, UVE-PCR和UVE-LSSVM三种模型, 并对三种建模效果进行评价, 最终确定最优甲醇汽油中甲醇含量定量检测模型。
实验所用的汽油从学校附近某加油站购买, 汽油型号为93#, 实验用的无水甲醇的分析纯度大于或等于99.7%。 样品在配制时, 按照0.6%的浓度梯度进行配制, 配比浓度范围从0.6%~18.6%。 先按照相应梯度, 计算不同比例下甲醇的体积, 然后将对应体积的甲醇加入到容量瓶, 再用汽油进行滴定至50 mL, 振荡均匀, 直至液体不分层为止。 按照相同方法, 配制30组不同浓度的甲醇汽油溶液。 每个浓度配制4个样品, 共得到120个甲醇汽油样品, 建模集和预测集数量比为3: 1, 即建模集样本90个, 预测集样本30个。 利用建模集建立模型, 利用预测集对模型进行验证, 所配制的30组甲醇汽油浓度表如表1所示。 表为建模集和预测集的甲醇汽油中甲醇含量真实值分布统计结果。
采用WQF-510A傅里叶变换红外光谱仪, 与OPUS光谱采集软件配套使用, 获得甲醇汽油中红外光谱。 实验的环境温度控制恒温20 ℃左右, 湿度控制在35%以下, 设置光谱仪参数, 测量范围为: 4 000~600 cm-1, 分辨率优于0.85 cm-1, 扫描时间32 s, 开机后预热30 min待仪器稳定后方可使用。 样品测定采用水平衰减全反射(
偏最小二乘法是光谱技术检测分析中最成熟的一种算法, 首先对中外光谱进行预处理, 建立PLS模型评价预处理方法的优劣。 然后利用无信息消除算法(UVE)对其进行波段筛选, 再分别采用偏最小二乘(PLS)、 主成分回归(PCR)和偏最小二乘支持向量机(LS-LVM)建立光谱定量检测模型。 建模集和预测集数量比约为3: 1, 建模集样品用于建立模型, 验证集样品用于对模型的验证, 预测相关系数(correlation coefficient, r)和预测均方根误差(root mean square error of prediction, RMSEP)作为本模型的评价指标。 采用Matlab软件处理数据和建立模型。 甲醇汽油甲醇含量的PLS模型建模效果好坏由预测集的r和RMSEP共同决定, PLS模型的相关系数越高且预测均方根误差越小则模型的精度就越高, 并且RMSEC与RMSEP两者差值越小, 模型的稳健性越好。 如图1为甲醇汽油中甲醇含量检测模型建立的流程图。
图2(a)为未添加甲醇的汽油原始中红外光谱图, 图2(b)为无水甲醇样品的原始中红外光谱图, 图3为不同浓度甲醇汽油的中红外光谱图, 如图3所示, 在1 500~2 750和3 050~3 500 cm-1范围内, 谱强与甲醇含量有较好的线性关系。 而在1 000~1 250以及3 500~4 000 cm-1范围内光谱数据与甲醇含量的线性相关性较差, 这是由于汽油中烃类物质的官能团吸收峰重叠导致的。 为方便数据处理, 选择中红外光谱1 250~3 500 cm-1波段进行建模。
实验仪器的振动、 噪声以及温度的变化都会使测得的原始中红外光谱产生噪音、 基线上下漂移、 光散射等影响。 为减小外界条件干扰, 对采集的中红外光谱进行适当预处理非常有必要, 通过合适的预处理方法可以获得较好的建模效果。 主要采用了以下预处理手段, 如平滑(smoothing)、 多元散射校正(MSC)、 基线校正(baseline)、 归一化(normalization)等, 利用预处理后的甲醇汽油光谱数据分别建立偏最小二乘模型, 并评价不同预处理后数据的建模效果。
将采集到的甲醇汽油中红外光谱经预处理(
波段筛选是一种非常有效的光谱处理方法, 能够大大优化模型。 中红外光谱数据量较大, 以全波段中红外光谱作为输入变量, 数据处理耗时长。 选择一种适当的波长筛选方法, 不仅可以缩短建模时间, 还能提高建模的预测精度和稳定性。 为避免光谱仪噪声的影响以及一些波长对外界环境因素变化敏感的干扰, 去掉冗余信息, 从而提高数据的处理速度。
本工作采用无信息变量消除(UVE)方法, 其原理是基于PLS回归系数建立的波段筛选方法, 将回归系数作为重要衡量指标, 首先将一定数目的随机变量矩阵加入光谱矩阵中, 再通过交互验证建立PLS模型, 通过计算PLS与回归系数的平均值与标准偏差比值来选取有效光谱信息, 该方法将噪声信号和浓度信息集于一体, 方便和直观。
在全谱范围内采用UVE方法对不同浓度甲醇汽油的中红外光谱进行变量优选, 图5为UVE变量稳定性的分析结果, 垂直竖直实线为波长变量和随机噪声变量的分割线, 左边为波长变量, 右边为噪声变量。 T value1和T value2分别代表阈值筛选的上下限, 在T value1和T value2外部对应的变量被保留, 变量稳定性值位于两阈值之间的波长变量为无用信息变量, 被剔除, 在最后的模型中, 虚线内部对应的变量不用于建模。 通过UVE波段筛选变量后, 共有103个波长变量被选择。 以筛选的波长点所含信息作为输入变量建立更加简化的甲醇汽油甲醇含量定量检测模型。
2.4.1 UVE-PLS模型的建立
偏最小二乘是近年来提出的统计方法, 它可充分利用甲醇汽油光谱数据与甲醇含量之间的线性关系, 建立最优检测模型。 图6为甲醇含量建模和预测集均方根误差随主成分因子数变化曲线图, 建模时所选主成分因子数(PC)过低, 可能忽略部分有效光谱信息, 导致模型精度降低, 出现“ 欠拟合” 现象; 而当所选PC过高时, 易出现“ 过拟合” 现象, 例如建模PC为8, RMSEC值更低, 但RMSEP值较PC=7时略高。 因此, 本实验建立甲醇汽油中甲醇含量的PLS模型中, 最佳主成分因子数为7。 图7 为PLS模型预测甲醇含量的散点图, UVE-PLS模型的预测效果为: 预测集r和RMSEP分别为0.923和2.075。
2.4.2 UVE-PCR模型的建立
主成分回归(PCR)法是采用多元统计中的主成分分析(PCA)法, UVE筛选的波长变量作为模型输入变量X, 甲醇汽油中甲醇浓度作为输出变量Y。 首先对甲醇汽油甲醇含量光谱矩阵进行分解, 然后选取主成分得分来进行线性回归运算, 从而得到定量模型。 图8为PCR预测甲醇含量的散点图UVE-PCR模型的r和RMSEP分别为0.916和2.159。
2.4.3 UVE-LSSVM模型的建立
在UVE-LSSVM建模中, 采用Lin核函数和RBF核函数分别建立支持向量机模型, 比较两种核函数分别的建模效果, 结果表明: 采用Lin核函数时, γ =4.559, 其预测集r和RMSEP分别为0.873和2.624, 采用RBF核函数时, 该模型有两个重要参数: γ 和σ 2, 这两个未知参数在一定意义上影响模型泛化能力和建模效果。 通过多次尝试, 确定了模型的两个参数, 此时UVE-LSSVM模型参数的最佳组合为: γ =1.207 1× 103, σ =392.379。 模型的预测结果如表4所示, 其预测集R和RMSEP分别为0.913和2.252。 通过对比, 发现选用RBF核函数更加有利于模型的建立。 图9为LS-SVM预测甲醇含量的散点图。
2.4.4 UVE-PLS, UVE-PCR和UVE-LSSVM模型对比
表4可以得出, 在三种不同建模方法中, UVE-PLS取得最好的结果。 通过对比, UVE-PLS模型的预测集r和RMSEP分别为0.923和2.075, UVE-PCR模型的预测集r和RMSEP分别为0.916和2.159, UVE-LSSVM模型的预测集r和RMSEP分别为0.913和2.252。 表明: 在甲醇汽油甲醇含量检测方面, 应用中红外光谱结合UVE-PLS组合模型可以快速准确的预测甲醇含量, 为进一步研究甲醇汽油其他指标奠定了基础。
甲醇汽油是汽油替代燃料的一种, 在汽油中添加甲醇能有效减少发动机污染物的排放, 甲醇含量是衡量甲醇汽油品质的一个重要指标, 所以对甲醇汽油中甲醇含量的检测显得尤为重要。 应用中红外光谱建立甲醇汽油甲醇含量检测的PLS模型, 不仅实现了对甲醇汽油中甲醇含量的快速无损检测, 而且有较好的预测效果。 在此基础上, 利用无信息变量消除算法筛选得到的有效波长分别建立了UVE-PLS, UVE-PCR和UVE-LSSVM三种模型, 最终获得甲醇汽油甲醇含量的最优模型为UVE-PLS模型。 研究结果表明UVE是一种行之有效的波长筛选方法。 中红外光谱在甲醇汽油甲醇含量快速无损检测是有效的, 且模型的预测效果较好。 该方法能够为甲醇汽油生产厂家提供一种新的检测方法, 具有较强的现实意义。
The authors have declared that no competing interests exist.