近红外光谱的甲醇汽油定量检测与分析方法
刘玉娟1,2,3, 刘颜达1,2,3, 宋莹1,2,3,*, 朱杨1,2,3, 孟钊令1,2,3
1.吉林大学地球信息探测仪器教育部重点实验室, 吉林 长春 130061
2.吉林大学国家地球物理探测仪器工程技术研究中心, 吉林 长春 130061
3.吉林大学仪器科学与电气工程学院, 吉林 长春 130061
*通讯作者 e-mail: 50367444@qq.com

作者简介: 刘玉娟, 女, 1984年生, 吉林大学仪器科学与电气工程学院副教授 e-mail: liuyujuan@jlu.edu.cn

摘要

甲醇汽油因其辛烷值高、 成本低等优势成为新型化石燃料替代物, 其甲醇含量的精确检测是决定其品质的重要环节, 甲醇汽油组分的精确定量检测与分析对于缓解我国传统石油资源短缺但需求量增多的现状具有重大的现实意义。 甲醇汽油中甲醇检测的常规方法如酒醇仪测定法、 速测盒测定法等, 操作复杂, 准确定性低。 近红外光谱分析具有测量速度快、 灵敏度高、 可连续测量等诸多优点, 在石油化工领域定性、 定量分析中具有巨大应用潜力。 为研究甲醇汽油近红外光谱无损定量检测方法, 配制了0.5%~30%组分的甲醇汽油标准样品, 设计了甲醇汽油近红外光谱数据采集系统并采集60个组分的甲醇汽油近红外光谱数据; 利用移动平均平滑法、 S-G卷积平滑法(Savitzky-Golay)和多元散射校正(MSC)对甲醇汽油近红外光谱数据进行预处理分析, 研究了BP人工神经网络(ANN)和主成分回归(PCR)模型的决定系数和均方根误差, 对两种算法的结果和预测效果进行对比。 结果显示: 各模型的均方根误差均小于1%, SG平滑-主成分回归预测模型拟合度最好, 其决定系数为0.998 98; 基于SG卷积平滑算法和神经网络算法建立的模型预测值与真值偏差最小, 其均方根误差RMSEP为0.322 84%。 研究表明近红外光谱检测分析技术检测甲醇汽油中的甲醇含量应用中SG平滑-神经网络预测模型性能较好, 满足应用需求, 因而为甲醇汽油组份实际检测应用提供了科学依据, 为有效开发与利用甲醇汽油提供了技术支持。

关键词: 光谱预处理; 甲醇汽油; 近红外光谱; 主成分分析
中图分类号:O657.6 文献标志码:A
Near Infrared Spectroscopic Quantitative Detection and Analysis Method of Methanol Gasoline
LIU Yu-juan1,2,3, LIU Yan-da1,2,3, SONG Ying1,2,3,*, ZHU Yang1,2,3, MENG Zhao-ling1,2,3
1. Key Laboratory of Geophysical Exploration Equipment, Ministry of Education, Jilin University, Changchun 130061, China
2. National Geophysical Exploration Equipment Research Center, Jilin University, Changchun 130061, China
3. College of Instrumentation & Electrical Engineering, Jilin University, Changchun 130061, China
*Corresponding author
Abstract

Methanol gasoline because of its high octane number, low cost advantage to become the new fossil fuel alternatives, the methanol content of accurate detection is an important link in determine its quality, the quantitative analysis of methanol gasoline components is of great practical significance for alleviating the shortage of traditional petroleum resources but increasing demand in China. The conventional methods of methanol detection in methanol gasoline, such as alcohol analyzer determination, quick test box determination, etc., are complicated in operation and low in accuracy and quality , the conventional methods of methanol detection in methanol gasoline, such as alcohol analyzer determination, quick test box determination, etc., are complicated in operation and low in accuracy and quality. Near infrared analysis method is widely used in qualitative or quantitative analysis of components in many industries due to its detection speed and accuracy, Methanol gasoline near infrared spectrum are studied non-destructive detecting method, made up of 0.5%~30% methanol gasoline, nearinfrared spectrum acquisition system is designed and detect 60 components of methanol gasoline spectral data, Moving average smoothing method, S-G convolution smoothing and multiple scattering correction(MSC) were used to establish a prediction model after comparative analysis of spectral data, BP Artificial Neural Network(ANN) and Principal Component regression (PCR) were used to predict the determination coefficient and root mean square error of the mode, comparing the results and prediction effects of the two algorithms. The results show that the root mean square error of each model is less than 1%, and the fitting degree of SG smooth-principal component regression prediction model is the best, and the determination coefficient is 0.998 98, the model based on SG convolution smoothing algorithm and neural network algorithm has the smallest deviation between the predicted value and the true value, and its root mean square error (RMSEP) is 0.322 84%. This study shows that the performance of SG smooth-neural network prediction model in the application of near infrared spectroscopy detection and analysis technology to detect methanol content in methanol gasoline is good, and meets the application requirements, this study provides a theoretical basis for the practical detection and application of methanol gasoline components, and provides technical support for the effective development and utilization of methanol gasoline.

Keyword: Spectra pretreatment; Methanol gasoline; Near infrared spectrum; Principal component analysis
引言

我国对化石能源的需求量较大, 对外依存度较高[1], 并且传统的燃料燃烧不充分产生的有毒有害气体危害人类身体健康, 因此发展新型清洁能源迫在眉睫。 甲醇汽油是将传统汽油与甲醇混合形成的一种新型燃料。 我国甲醇的生产原料为不能燃烧的劣质煤, 将其生产成甲醇后不但可以使劣质煤得到合理应用, 而且将甲醇生产成甲醇汽油可以缓解甲醇产能过剩的问题。 甲醇汽油中甲醇的含量是决定其品质的关键指标, 对甲醇含量进行准确、 高效的检测, 意义重大[2]

甲醇汽油中甲醇检测的常规方法如质谱法对是其蒸汽痕量进行分析, 测试过程会产生一定的误差; 甲醇含量-水向快速检测法操作过程中的环境温度、 湿度以及待测样品中的含水量会对结果产生一定影响; 比色法、 变色酸法等, 操作复杂, 准确定性低。 近红外光谱分析技术具有测量速度快、 灵敏度高、 可连续测量等诸多优点, 目前已经被广泛应用于许多领域中的定性或定量分析[3, 4], 如食品分析、 药品分析[5, 6]、 油品调和[7], 测定汽油辛烷值[8], 醇类汽油检测分析等。 鉴于此, 将近红外光谱技术应用于甲醇汽油的定量分析, 对测定甲醇含量建模过程中的优化算法进行研究, 即利用BP人工神经网络(artificial neural network, ANN)和主成分回归(principal component regression, PCR)两种算法结合移动平均平滑法、 Savitzky-Golay卷积平滑法以及多元散射校正三种数据预处理, 建模结果说明, 采用SG卷积平滑算法的模型拟合效果最好, 模型的稳健性和预测能力有很大改善。

1 实验部分

近红外光谱透射法基本原理为光源发出一定波长的光, 入射到准直镜后平行出射, 进入比色皿照射被测样品, 经样品吸收后入射到光谱仪分光系统。 从光谱仪采集的光谱数据根据Lambert-Beer定律得样品浓度, 如式(2)

A=-lgT=lgI0I(1)

式(1)中, A为吸光度, T为透射率, I0为入射光强度, I为透射光强度。

如式(2)

A=lg1T=kbc(2)

式(2)中, b为样品吸收层厚度, k为摩尔吸收系数, c为吸光样品浓度[9]

1.1 检测系统设计

根据不同化学键在近红外光谱区的特征吸收峰不同, 近红外光谱可实现甲醇汽油化学组分定量分析。 甲醇汽油中醇类C— H键的二阶倍频在1 200 nm附近, C— H+C— C键和C— H+C— H键的一阶倍频组合频的特征峰在1 350~1 550 nm之间, 1 400~1 670 nm之间的吸收峰对应的是醇类中O— H键的一阶倍频[10]。 因此, 甲醇汽油的近红外光谱在1 200 nm左右、 1 350~1 550 nm之间和1 400~1 670 nm之间存在吸收。

1.2 光源选择与标准化

选用台湾超微光学LS-HA型号卤素灯作为光源, 具体参数如表1所示。 光谱仪的波长范围为950~1 700 nm, LS-HA型号卤素灯可以满足系统要求。

表1 灯源参数表 Table 1 Parameters of lamp
1.3 近红外光谱仪

选用SW2520型号光谱仪。 该光谱仪用高灵敏度的InGaAs线型传感器, 使用32位的RISC微控制器进行操作; 采用Czerny-Turner光学设计, 能够避免衍射带来的杂光等问题[11, 12], 其具体参数如表2所示。

表2 SW2520型号光谱仪参数表 Table 2 Parameters of SW2520 spectrometer
1.4 样品的配制及光谱测量

按照体积比(无水甲醇/汽油)用93号汽油和甲醇配制各种浓度的甲醇汽油标准样品, 浓度设计为0.5%~30%之间共60个浓度, 具体见表3所示。

表3 60个样品组分含量(无水甲醇/汽油) Table 3 60 samples with different mixing ratios of anhydrous methanol-gasoline

光谱数据采集实验如图1所示, 选用厚度为10 mm石英比色皿。 9%浓度的甲醇汽油溶液的10次测量得到的原始光谱数据如图2(a)所示, 平均后光谱数据如图2(b)所示。 由图可知, 在求取平均值后剔除了粗大误差, 减小了噪声干扰。 将60个浓度的甲醇汽油溶液分别测量10次并平均, 计算吸光度得到平均后的所有浓度光谱曲线如图2(c)所示。

图1 光谱数据采集实图Fig.1 Real picture of spectral data acquisition

图2 被测甲醇汽油样品光谱曲线
(a): 9%浓度10次测量原始光谱曲线; (b): 9%浓度平均后光谱数据曲线; (c): 平均后的所有浓度光谱曲线
Fig.2 Spectral curves of methanol-gasoline samples
(a): Original spectral of sample with 9% methanol concentration measured for 10 times; (b): Mean spectra of sample with 9% methanol concentration over 10 measurments; (c): Mean spectra of all samples

由图2分析, 所有甲醇汽油组分的光谱曲线在1 120~1 270、 1 350~1 550和1 400~1 670 nm之间都有特征峰, 它们分别是甲醇汽油中醇类C— H键的二阶倍频的吸收峰、 C— H+C— C键和C— H+C— H键的一阶倍频组合频的吸收峰和醇类中O— H键的一阶倍频的吸收峰。 可以利用这几个吸收峰来判断出甲醇汽油中甲醇的含量。

2 结果与讨论
2.1 数据预处理

实验采用移动平均平滑法、 Savitzky-Golay卷积平滑法[13]和多元散射校正3种方法进行预处理。

(1) 移动平均平滑法

移动平均平滑法的原理是设定一个窗口大小为奇数的窗口, 对窗口内的点求取平均值作为窗口中心点的值, 移动窗口使窗口中心点经过全部光谱, 完成移动平均平滑。 则有

xk=12w+1i=-w+wxk+i(3)

式(3)中, 2w+1为所设窗口大小, xk为窗口中心点。

窗口大小的设定会对预处理产生较大的影响, 窗口太小会导致平滑效果不理想, 窗口太大又会丢失有用信息。 利用测得的甲醇汽油光谱数据, 经过多次不同窗口大小预处理后对比, 选择窗口大小为7。 若在预处理过程中直接对光谱曲线进行移动平均平滑, 平滑后的光谱曲线比原始光谱曲线短, 因此需要先对原始光谱曲线进行延展, 对延展后的光谱曲线拟合, 拟合后的光谱曲线进行平滑后大小与原始光谱曲线相同。 经过平滑处理后的光谱曲线如图3所示, 对60个组分的甲醇汽油样品进行预处理后, 光谱曲线较原始光谱曲线变光滑, 杂散光等噪声明显减小。

图3 移动平均平滑法处理后光谱曲线图Fig.3 Pretreated spectra by moving average smoothing method

(2) Savitzky-Golay卷积平滑法

Savitzky-Golay卷积平滑(S-G平滑)是一种基于移动平均平滑改进的光谱预处理方法, 其本质是加权平均法。 Savitzky-Golay卷积平滑法基本原理是设定一个大小为奇数的窗口, 对窗口内的点进行多项式拟合得到多项式组合进一步使用最小二乘拟合求得平滑系数, 之后不断移动窗口完成光谱的平滑处理, 见式(4)

xk, smooth=x̅k=1Hii=-w+wxk+ihi(4)

式(4)中, H为归一化因子, H=i=-w+whi

由式(4)可以看出Savitzky-Golay卷积平滑和移动平均平滑一样都是在窗口内取平均值, 不过Savitzky-Golay卷积平滑是加权平均。 如图4所示光谱曲线经过Savitzky-Golay卷积平滑处理后甲醇汽油光谱信号中的杂散光等噪音信号被消除, 且强调了光谱信号的峰值, 这对后续预测模型的建立有益。

图4 S-G平滑法处理后光谱图Fig.4 Pretreated spectra by S-G smoothing method

(3) 多元散射校正

多元散射校正的原理是通过与理想光谱对比来修正光谱的基线漂移等误差, 多元散射校正后的光谱曲线如图5所示。 相比平滑法, 多元散射校正主要消除了散射光对光谱的影响, 修正了光谱数据的偏移和基线平移现象, 处理效果较为理想。

图5 多元散射校正光谱曲线图Fig.5 Corrected spectra by multiple scattering

2.2 光谱定量模型的建立

分别选用BP人工神经网络和主成分回归分析两种方法构建甲醇汽油预测模型。

(1) BP人工神经网络

BP神经网络的非线性映射能力较强, 良好的自学习和自适应能力能够通过学习自动提取输出数据间的“ 合理规则” , 泛化和容错能力较好。 其在输入层输入训练样本, 计算网络的输出和误差, 当误差小于设定目标时训练结束, 当误差大于设定目标时则进行误差的反向传递, 获得各单元的误差信号并以此作为修正各单元权值的依据[14]

(2) 主成分回归

主成分回归是基于主成分分析的一种化学计量方法。 通过主成分分析算法将多个变量通过线性变换生成几个重要变量, 即通过降维使原本具有一定相关性的变量变成相互独立的变量, 从而达到在保有有用信息的同时消除变量间共线性, 以防止因变量之间的依赖关系导致的错误。 在综合评价函数中, 各主成分的权数为其贡献率, 它反映了该主成分包含原始数据的信息量占全部信息量的比重, 克服了某些评价方法中认为确定权数的缺陷。

所有浓度的甲醇汽油光谱数据预处理完成后, 随机选取浓度为3%、 5%、 6%、 8%、 9.5%、 12%、 13%、 16%、 18%、 20%、 22.5%、 24.5%、 26.5%、 28%、 30%的15个组分作为预测集, 将剩余的45个组分作为训练集, 利用训练集建立预测模型。 不同预处理方法结合BP神经网络和主成分回归分析建立的预测模型拟合直线如图6所示。

图6 各预测模型性能对比
(a): SG平滑-神经网络预测模型; (b): SG平滑-主成分回归预测模型; (c): 多元散射校正-神经网络预测模型; (d): SG平滑-主成分回归预测模型; (e): 移动平均平滑-主成分回归预测模型; (f): 多元散射校正-主成分回归预测模型
Fig.6 Performance comparison of each prediction model
(a): SG smooth-neural network prediction model; (b): SG smooth-principal component regression prediction mode; (c): Multiple scattering correction-neural network prediction model; (d): SG smooth-principal component regression prediction model; (e): Moving average smoothing-principal component regression prediction mode; (f): Multivariate scattering correction-principal component regression prediction mode

为了进行对比, 建立了各预测模型的性能对比表, 如表4所示多种方法的决定系数都大于0.99, 由此可以看出各预测模型的拟合度都较好, 其中拟合度最好的是SG平滑-主成分回归预测模型, 各模型的均方根误差均小于1%, 符合精度要求, 其中SG平滑-神经网络预测模型的均方根误差最小。 由此可见SG平滑-神经网络预测模型性能最好, 而多元散射校正-主成分回归预测模型的决定系数和均方根误差比较其他模型存在一定差距, 其性能最差。

表4 各预测模型性能对比 Table 4 Performance comparison between different prediction models
3 结论

以甲醇汽油作为研究对象, 采用近红外光谱分析研究了甲醇汽油组分检测方法。 根据测试需求设计了甲醇汽油组分近红外光谱检测系统, 利用波长校准光源对检测系统进行了标准化后对全部60个组分的甲醇汽油样品进行检测, 采用移动窗口平滑法、 Savitzky-Golay卷积平滑法和多元散射校正分别进行了光谱预处理, 对Savitzky-Golay卷积平滑法预处理后的甲醇汽油样品近红外光谱进行建模, 研究结果表明神经网络方法建立的模型效果更好。 近红外光谱技术对配制的不同比例的甲醇汽油样品进行测试建模和分析, 为甲醇汽油组份检测提供了新的思路, 为开发与利用甲醇汽油提供了技术支持。

参考文献
[1] CHEN Zhi-li, YIN Wen-qi, LIU Hong-tao, et al(陈志莉, 尹文琦, 刘洪涛, ). Spectroscopy and Spectral Analysis(光谱学与光谱分析), 2017, 37(6): 1723. [本文引用:1]
[2] LI Mao-gang, YAN Chun-hua, XUE Jia(李茂刚, 闫春华, 薛佳). Chinese Journal of Analytical Chemistry(分析化学), 2019, 47(12): 1995. [本文引用:1]
[3] FENG Fang(冯放). Life Science Instruments(生命科学仪器), 2007, 5(10): 9. [本文引用:1]
[4] CHU Xiao-li, LU Wan-zhen(褚小立, 陆婉珍). Electronic Instrumentation Customer(仪器仪表用户), 2013, 20(2): 11. [本文引用:1]
[5] GAO Rong-qiang, FAN Shi-fu(高荣强, 范世福). Analytical lnstrumentation(分析仪器), 2002, (3): 9. [本文引用:1]
[6] XU Qiong, MA Guo-xin(许琼, 马国欣). China High-Tech Enterprises(中国高新技术企业), 2007, (3): 123. [本文引用:1]
[7] LIU Yan-dong(刘延东). Science and Technology Innovation Herald(科技创新导报), 2018, 15(1): 88. [本文引用:1]
[8] YANG Xiao-hui, ZHANG Zheng-hua(杨晓辉, 张正华). Technology & Economicsin Petrochemicals(石油化工技术与经济), 2016, 32(6): 14. [本文引用:1]
[9] LI Na(李娜). The Modern Industrial Economy and Informationization(现代工业经济和信息化), 2016, 6(19): 40. [本文引用:1]
[10] OUYANG Ai-guo, LIU Jun(欧阳爱国, 刘军). Journal of Southwest China Normal University (Natural Science Edition)[西南师范大学学报(自然科学版)], 2012, 37(9): 98. [本文引用:1]
[11] MA Yan(马艳). Physics Experimentation(物理实验), 2020, 40(11): 48. [本文引用:1]
[12] Rosa Elvira Correa Pabón, Carlos Roberto de Souza Filho. Fuel, 2019, 237: 1119. [本文引用:1]
[13] Dalton M L Jr. Applied Optics, 1966, 5(7): 1121. [本文引用:1]
[14] YUAN Yu-liang, SHENG Wen-yi(员玉良, 盛文溢). Transactions of the Chinese Society for Agricultural Machinery(农业机械学报), 2015, 46(1): 306. [本文引用:1]