拉曼光谱结合偏最小二乘法在柴油正丁醇快速定量分析中的应用
麻仲凯1, 李茂刚2, 闫春华1, 刘浩森1, 陶树豪1, 汤宏胜2, 张天龙2,*, 李华1,2,*
1.西安石油大学化学化工学院, 陕西 西安 710065
2.西北大学化学与材料科学学院, 陕西 西安 710127
*通讯作者 e-mail: tlzhang@nwu.edu.cn; Huali@nwu.edu.cn

作者简介: 麻仲凯, 1994年生,西安石油大学化学化工学院硕士研究生 e-mail: 470776637@qq.com

摘要

正丁醇具有互溶性好、 挥发性低、 价格低廉以及腐蚀性低等优势, 被认为是理想的柴油添加物。 柴油中正丁醇的精准定量分析对其品质快速评价与市场监督具有重要科学意义与实用价值。 提出了一种基于拉曼(Raman)光谱结合偏最小二乘(PLS)的柴油中正丁醇快速定量分析方法。 首先, 采集了40个柴油样品的Raman光谱, 并考察了不同预处理方法[一阶导数、 二阶导数、 多元散射校正、 标准正态变换、 归一化(Normalization)和小波变换]对PLS校正模型预测性能的影响; 其次, 采用变量重要性投影(VIP)对Normalization方法预处理后的光谱数据进行特征变量提取, 并采用五折交叉验证优化VIP的阈值; 最后, 基于最优的光谱预处理方法、 输入变量和模型参数, 构建PLS校正模型对柴油中正丁醇含量进行快速定量分析, 结果与基于原始光谱(RAW)和Normalization光谱的PLS校正模型的预测性能进行对比。 结果表明: Normalization-VIP-PLS校正模型展现出优异的预测能力(RCV2和RMSECV为0.998 4和0.236 2%:RP2和RMSEP为0.998 7和0.208 4%; RSD为0.035 5)。 成功建立了一种Raman光谱结合PLS算法的柴油中正丁醇快速定量分析方法, 该方法具有快速、 准确、 便捷等优势, 可为柴油以及其他燃料中添加物检测及其品质分析提供新思路与新方法。

关键词: 拉曼光谱; 偏最小二乘; 柴油; 添加剂
中图分类号:O657.37 文献标志码:A
Application of Raman Spectroscopy Combined With Partial Least Squares Method in Rapid Quantitative Analysis of Diesel n-Butanol
MA Zhong-kai1, LI Mao-gang2, YAN Chun-hua1, LIU Hao-sen1, TAO Shu-hao1, TANG Hong-sheng2, ZHANG Tian-long2,*, LI Hua1,2,*
1. College of Chemistry and Chemical Engineering, Xi'an Shiyou University, Xi'an 710065, China
2. College of Chemistry & Materials Science, Northwest University, Xi'an 710127, China
*Corresponding authors
Abstract

N-butanol is considered an ideal diesel additive because of its good solubility, low volatility, low price and corrosiveness. The accurate quantitative analysis of n-butanol in diesel has important scientific significance and practical value for its quality evaluation and market supervision. This paper proposes a rapid quantitative analysis method for n-butanol in diesel based on Raman spectroscopy combined with partial least squares (PLS). Firstly, Raman spectra of 40 diesel samples were collected, and the effects of different pretreatment methods (first derivative, second derivative, multivariate scattering correction, standard normal transform, Normalization and wavelet transform) on the prediction performance of the PLS calibration model were investigated. Secondly, variable importance in projection (VIP) is used to extract characteristic variables from the spectral data preprocessed by the Normalization method, and the threshold of VIP is optimized by five-fold cross-validation. Finally, based on the optimal spectral pretreatment method, input variables and model parameters, a PLS calibration model was built to analyze the content of n-butanol in diesel quantitatively. The prediction performance was compared with the RAW-PLS and Normalization-PLS models. The results show that the Normalization-VIP-PLS calibration model has excellent predictive performance (RCV2 and RMSECV are 0.998 4 and 0.236 2%,RP2 and RMSEP are 0.998 7 and 0.208 4%; RSD 0.035 5). Therefore, this paper successfully established a rapid quantitative analysis method of n-butanol in a diesel by Raman spectroscopy combined with the PLS algorithm. This method has the advantages of being fast, accurate and convenient and it can provide new ideas and methods for the detection and quality analysis of diesel and other fuel additives.

Keyword: Raman spectroscopy; Partial least squares; Diesel; Additive
引言

随着汽车产业蓬勃发展以及对石油的需求和消耗与日俱增, 导致石油资源匮乏和环境污染问题愈演愈烈。 为解决此类难题, 各国已经把目光投入到石油燃料的替代品新型能源, 如: 醇类[1, 2]、 生物柴油[3]等。 生物柴油具有可再生、 原料来源广、 燃烧排放污染小等优点, 在物流运输、 农业和工业生产等领域被广泛应用。 生物柴油存在粘度和十六烷值偏高等缺陷, 需与一定比例的石化柴油混合使用。 为了改善柴油中因添加生物柴油而引起的粘度和十六烷值偏高等问题, 通常添加醇类燃料来加以解决。 正丁醇作为理想的醇类添加剂, 具有互溶性好、 产量大、 挥发性和腐蚀性小等优点[4, 5], 可使燃料在燃烧时碳烟排放降低、 燃烧速率加快和热效率提高[6]。 但正丁醇的过量添加会使得车辆出现动力不足、 油耗增大等问题。 因此, 探索一种柴油中正丁醇含量快速分析检测方法尤为重要。

拉曼(Raman)光谱[7, 8]检测技术因其检测速度快、 环保、 易操作和实时在线监测等优点, 已广泛应用于化石燃料中醇类物质检测[9, 10]。 Raman光谱是散射光谱, 结果易受到环境等因素的干扰, 导致光谱信息冗杂。 因此, Raman光谱通常会结合偏最小二乘(partial least squares, PLS)和支持向量机等化学计量算法来提高检测精度[11]。 其中PLS[12]作为经典的多元统计数据分析方法, 兼具多元线性回归分析、 典型相关分析和主成分分析的基本功能, 是一种计算误差小、 耗时短、 准确度较高的算法。 欧阳爱国[14]等采用Raman光谱结合PLS对甲醇柴油中的甲醇含量进行了检测分析, 其预测集RP2和RMSEP分别为0.952 9和2.209 0, 表明PLS算法作为燃料中醇类检测方法效果良好。

本研究以柴油中添加剂正丁醇为研究对象, 提出了一种基于Raman结合PLS算法的柴油中正丁醇快速定量分析方法。 首先采集了40个柴油样品的Raman光谱, 并考察了不同光谱预处理方法对PLS校正模型性能的影响; 其次在光谱预处理基础上采用变量重要性投影(variable importance in projection, VIP)对输入变量进行优化, 并探究了不同VIP阈值对PLS校正模型性能的影响; 最后比较了基于不同输入变量所构建的PLS校正模型的预测性能, 并寻求最优柴油中正丁醇定量分析预测模型。

1 实验部分
1.1 样品制备

实验所用柴油样品为石化柴油(0#柴油, 西安市某加油站)和生物柴油(广州富飞化工有限公司, 纯度≥99.0%)以体积比为95∶5比例配置。 然后向分别配置的柴油样品中添加不同体积分数的正丁醇(天津市瑞金特化学品有限公司, 分析纯度≥99.0%), 并振荡使其混合均匀, 存放于室温下准备待测。 共配置40个包含不同体积分数正丁醇的柴油样品, 不同样品中正丁醇的体积分数如表1所示。 由于正丁醇、 生物柴油和柴油之间具有较好的互溶性, 无需添加互溶剂。

表1 柴油样品中正丁醇体积分数 Table 1 N-butanol volume fraction in diesel samples
1.2 光谱采集

柴油样品Raman光谱采集所用仪器为激光拉曼光谱仪(QEpro6500型, 美国Ocean Optics公司), 该仪器由半导体激光器(785 nm)、 光纤(RPB-Y)、 光谱仪(QEpro6500)及光谱处理软件(Ocean View)等部件组成。 具体参数: 光谱仪采集范围为0~2 000 cm-1, 分辨率设置为4 cm-1, 激光器功率设置为300 mW, 检测环境温度为室温。 测量时先进行背景干扰扣除(以空气为参照), 然后样品置于5 mm石英比色皿中进行光谱测量。 测量时, 每个样品采集15条光谱, 每3条平均为1条光谱, 40个混合样品共获得200条光谱。

2 结果与讨论
2.1 光谱分析

图1(a)和(b)分别为正丁醇和含不同正丁醇的柴油样品的Raman光谱图。 如图1所示, 在800~900 cm-1范围内的波峰由C1—C2, C—O拉伸和CH3摇摆引起[14]; 1 050~1 150 cm-1光谱对应C—C键的伸缩振动; 在1 290~1 320 cm-1峰对应CH2的弯曲(扭曲)振动; 1 400~1 500 cm-1谱峰则对应CH2和CH3的弯曲(剪切)振动[7]。 正丁醇Raman光谱特征峰: 825 cm-1为C—O键的伸缩振动, 1 297 cm-1为CH2的弯曲(扭曲)振动, 1 448 cm-1为CH2和CH3的弯曲(剪切)振动。 图1(b)中的1 061 cm-1处峰对应的是C—C键的伸缩振动。 随着正丁醇含量的增加, 正丁醇柴油Raman光谱在825, 1 297和1 448 cm-1处, 光谱强度呈现逐步增强的趋势, 此现象反映出柴油中正丁醇的含量信息。 从图1中可知光谱存在较为严重的基线漂移和不平滑现象, 建模前对原始光谱进行光谱预处理是非常有必要的。

图1 不同样品的Raman光谱图
(a): 正丁醇; (b): 不同正丁醇含量的正丁醇柴油
Fig.1 Raman spectra of different samples
(a): N-butanol; (b): N-butanoldiesel with differentn-butanol content

2.2 预处理方法和潜变量选择与优化

从图1可以看出, 光谱存在基线漂移、 背景以及不平滑等干扰, 影响模型预测结果的准确性。 因此在构建模型前, 首先使用不同预处理方法[一阶导数(First derivative, D1st)、 二阶导数(Second derivative, D2st)、 多元散射校正(multivariate scattering calibration, MSC)、 标准正态变换(standard normal variation, SNV)、 最大归一化(Normalization)、 小波变换(wavelet transform, WT)]对原始光谱进行分析, 并基于五折交叉验证选出最优的预处理方法, 以决定系数(RCV2)和均方根误差(RMSECV)作为评估指标。 表2为不同预处理方法对PLS校正模型预测性能的影响。 从表2中可以看出, Normalization对应最大RCV2和最小RMSECV值; D1st(平滑点数n=2)和D2st(平滑点数n=5)表现出相对较差的性能, 其RCV2和RMSECV差于原始光谱; SNV, MSC和WT(小波基函数为db3, 小波分解层数为4)对应的RCV2和RMSECV与原始光谱相比虽然有提升, 但提升幅度没有Normalization大。 因此, 选取Normalization作为柴油样品分析的最佳预处理方法。

表2 不同光谱预处理对PLS校正模型预测性能的影响 Table 2 Results of PLS calibration model with different spectral pretreatment methods
2.3 基于VIP法的输入变量优化

为减少光谱中噪声和大量的冗余信息对模型预测精度的影响, 采用VIP法对经过Normalization处理后的原始光谱做特征变量提取, 并通过五折交叉验证对VIP阈值进行优化。 不同VIP阈值对应的结果如表3所示。 从表3可以看出, 当阈值大于0.6时,RCV2呈现出逐渐减小, RMSECV逐渐增大;RP2逐渐减小, RMSEP增大, 在阈值为0.6时, PLS校正模型的预测性能表现最佳。

表3 基于PLS校正模型VIP变量重要性的阈值优化 Table 3 Threshold optimization of VIP variable importance based on PLS calibration model

基于最优潜变量和输入变量构建PLS校正模型对柴油中正丁醇进行定量分析, 其预测性能与Normalization-PLS校正模型相比有较大提升, 校正集RCV2和RMSECV分别0.998 4和0.236 2%; 预测集RP2和RMSEP分别为0.998 7和0.208 4%。

2.4 基于不同输入变量PLS校正模型预测性能比较

为了进一步对基于Raman光谱构建的PLS校正模型预测性能进行验证, 对构建的三个PLS校正模型(RAW-PLS校正模型、 Normalization-PLS校正模型和Normalization-VIP-PLS校正模型)预测性能进行了对比。 表4为三个校正模型的预测性能, 图2展示了Normalization-VIP-PLS模型获得的预测结果。

表4 基于三种不同输入变量的PLS校正模型预测性能 Table 4 The prediction performance of the PLS calibration model based on three different input variables

图2 Normalization-VIP-PLS校正模型的预测结果Fig.2 The prediction performance of the Normalization-VIP-PLS calibration model

表4和图2可知, 相比于RAW-PLS和Normalization-PLS校正模型, Normalization-VIP-PLS校正模型预测性能提升幅度最大, 其校正集 RCV2从0.990 4上升至0.998 4, RMSECV由0.570 0%降至0.236 2%;RP2从0.985 4上升为0.998 7, RMSEP从0.901 6%降至0.208 4%, RSD从0.062 3降至0.035 5。 同时输入变量个数和建模时间大幅缩减, 变量从1 044降至682, 建模时间从25.38 s降至15.13 s。 因此, 选取Normalization-VIP-PLS校正模型作为柴油中正丁醇含量在线实时监测手段则更为实用。

3 结论

基于Raman光谱构建了PLS校正模型对柴油中正丁醇的含量进行了定量分析。 首先, 采集了40个柴油样品的Raman光谱, 并对其进行了解析。 其次, 比较了不同预处理方法对PLS校正模型预测性能的影响。 结果表明最优预处理方法为Normalization。 然后, 采用VIP对预处理过的光谱进行特征变量提取, 并利用五折交叉验证对VIP阈值进行优化, 当阈值为0.6时, PLS校正模型预测性能最佳。 最后, 在最优化的光谱预处理方法、 输入变量和模型参数下, 构建了Normalization-VIP-PLS校正模型对柴油中正丁醇的含量进行了分析, 结果与RAW-PLS和Normalization-PLS模型进行对比。 结果表明: Normalization-VIP-PLS校正模型表现出优异的预测能力, 其交叉验证RCV2和RMSECV分别为0.998 4和0.236 2%; 测试集RP2和RMSEP分别为0.998 7和0.208 4%; RSD为0.033 5; 建模时间为15.13 s。 该方法作为一种柴油中正丁醇快速定量检测手段是可行的。 该方法还为促进绿色能源快速发展和柴油中其他添加剂检测提供了新思路与新方法。

参考文献
[1] Cherednichenko O, Havrysh V, Shebanin V, et al. Energies, 2020, 13(9): 2156. [本文引用:1]
[2] LI Mao-gang, YAN Chun-hua, XUE Jia, et al(李茂刚, 闫春华, 薛佳, ). Chinese Journal of Analytical Chemistry(分析化学), 2019, 47(12): 1995. [本文引用:1]
[3] Ishak S, Kamari A. Environmental Chemistry Letters, 2019, 17(2): 1143. [本文引用:1]
[4] Valles A, Capilla M. Biomass and Bioenergy, 2021, 150: 106131. [本文引用:1]
[5] Yan J H, Gao S Y, Zhao W H, et al. Energy Conversion and Management, 2021, 243: 114273. [本文引用:1]
[6] Duan X B, Xu Z X, Sun X Y, et al. Energy, 2021, 231: 121069. [本文引用:1]
[7] Liu Z, Luo N, Shi J, et al. Journal of Raman Spectroscopy, 2019, 50(7): 1008. [本文引用:2]
[8] Li X, Liu Y D, Jiang X, et al. Journal of Molecular Structure, 2020, 1210: 127760. [本文引用:1]
[9] LI Guang-mao, QIAO Sheng-ya, ZHU Chen, et al(李光茂, 乔胜亚, 朱晨, ). High Voltage Engineering(高电压技术), 2021, 47(6): 2007. [本文引用:1]
[10] Li M, Xue J, Du Y, et al. Energy & Fuels, 2019, 33(12): 12286. [本文引用:1]
[11] Xie Y, You Q, Dai P, et al. Spectrochimica Acta Part A: Molecular and Biomolecular Spectroscopy, 2019, 222: 117086. [本文引用:1]
[12] Tao L Y, Via B, Wu Y, et al. Vibrational Spectroscopy, 2019, 102: 31. [本文引用:1]
[13] OUYANG Ai-guo, TANG Tian-yi, HUANG Zhi-hong, et al(欧阳爱国, 唐天义, 黄志鸿, ). Laser & Optoelectronics Progress(激光与光电子学进展), 2016, 53(11): 306. [本文引用:1]
[14] Mirand a A M, Castilho-Almeida E W, Ferreira E H M, et al. Fuel, 2014, 115: 118. [本文引用:2]