量子遗传-神经网络算法的润滑油动力粘度值可见近红外光谱分析
刘晨阳1,2, 唐兴佳3, 于涛3, 王泰升1, 卢振武1, 鱼卫星3,*
1. 中国科学院长春光学精密机械与物理研究所精密仪器与装备研发中心, 吉林 长春 130033
2. 中国科学院大学, 北京 100049
3. 中国科学院西安光学精密机械研究所, 中国科学院光谱成像技术重点实验室, 陕西 西安 710119
*通讯联系人 e-mail: yuwx@opt.ac.cn

作者简介: 刘晨阳, 1990年生, 中国科学院长春光学精密机械与物理研究所博士研究生 e-mail: chenyang9015@163.com

摘要

润滑油动力粘度是划分润滑油品质的重要依据之一, 高铁变速箱润滑油需要进行实时、 快速、 无损的检测, 因此提出一种基于可见近红外光谱微型模块结合量子遗传-神经网络算法对润滑油粘度值进行定量分析的新方法。 不仅实现了高铁变速箱润滑油动力粘度的无损快速实时检测, 还进一步提高了对润滑油动力粘度预测的精度。 微型光谱仪具有性能优良、 体积小巧等优势, 在便携式光谱无损检测方面用途越来越多。 在这里, 选用可见短波近红外和近红外波导光栅两种微型光谱模块进行光纤耦合, 实现了330~1 700 nm可见-近红外波段光谱拼接。 首先我们采用该组合微型光谱仪对13种不同粘度的润滑油共78个样本进行光谱扫描得到原始光谱数据。 原始光谱经过Savitzky-Golay卷积平滑后, 再一阶求导, 可以有效地消除基线漂移和背景噪声。 然后采用主成分分析和马氏距离相结合的方法来识别浓度界外样本, 剔除界外样本3个。 最后采用BP(back propagation)神经网络和量子遗传神经网络两种回归算法分别建立定量分析模型, 并对比分析了两种算法的性能。 量子遗传算法是量子计算和遗传算法相结合地一种概率进化算法, 采用量子染色体的形式, 利用量子逻辑门进行全局搜索, 从而可以利用量子遗传算法优化神经网络地权重和阈值, 提高建模效率和精度。 分别用BP神经网络算法和量子遗传-神经网络算法进行建模仿真, 从75个样本随机抽取10个样本作为预测集, 其余65个为建模集。 在量子遗传寻优算法中, 其种群数目设置为40, 终止代数为200, 寻优结果表明该算法在训练81代后可快速得到最优解。 比较两种建模算法的预测结果, 采用量子遗传-神经网络算法相比BP神经网络算法得到的粘度预测结果均方根误差从0.345 5降低至0.029 4, 决定系数从0.850 4升至0.979 9, 可知量子遗传-神经网络算法的预测能力明显强于BP神经网络。 为进一步提高润滑油粘度的定量分析准确度和微型光谱模块应用于高铁齿轮箱润滑油在线、 实时、 快速检测提供了参考方法。

关键词: 可见-近红外光谱微型模块; 润滑油; 动力粘度; 量子遗传算法; 神经网络算法
中图分类号:O433.4 文献标志码:A
Visible and Near Infrared Spectral Analysis of the Lubricating Oil Dynamic Viscosity Based on Quantum Genetic-Neural Network Algorithm
LIU Chen-yang1,2, TANG Xing-jia3, YU Tao3, WANG Tai-sheng1, LU Zhen-wu1, YU Wei-xing3,*
1. R&D Center of Precision Instruments and Equipment, Changchun Institute of Optics, Fine Mechanics & Physics, Chinese Academy of Sciences, Changchun 130033, China
2. University of Chinese Academy of Sciences, Beijing 100049, China
3. Key Laboratory of Spectral Imaging Technology, Xi’an Institute of Optics and Precision Mechanics, Chinese Academy of Sciences, Xi’an 710119, China
*Corresponding author
Abstract

Dynamic viscosity is one of the most important quality factors of lubricating oil. For the safety of high-speed railway, it is necessary to develop a real-time, fast and non-destructive method to monitor the status of the gearbox. Here we propose a new method that utilizes the quantum genetic-neural network algorithm to quantitatively analyze the visible and near-infrared spectra of lubricant acquired by a micro-spectrometer module. The method not only realizes non-destructive rapid real-time detection of the dynamic viscosity of high-speed railway transmission lubricating oil, but also further improves the prediction accuracy of the lubricating oil dynamic viscosity. Thanks to its excellent performance and small size, the miniature spectrometer has been widely used as a portable and nondestructive device. Here, two kinds of micro-spectral modules with visible/short-wave-infrared and near-infrared waveguide gratings are coupled with optical fibers and obtain a wide spectral range from 330 to 1 700 nm. Here the integrated waveguide and propagating makes the spectrometer compact and small. In experiment, a total of 78 lubricant samples with 13 different viscosity lubricants were prepared for spectral measurement by the micro-spectrometer. The raw spectral data was pre-processed using the Savitzky-Golay convolution smoothing and the first-order differentiation to eliminate the baseline drift and background noise. Next, principal component analysis and Mahalanobis distance algorithm were used to identify the samples outside the concentration boundary, and three out-of-bound samples were excluded. Finally, the BP neural network and the quantum genetic neural network methods were employed for quantitative analyses and the results are compared, respectively. The quantum genetic algorithm is a probabilistic evolutionary algorithm that combines the advantages of quantum computing and genetic algorithm. It uses the form of quantum chromosomes and quantum logic gates for global searching. Therefore, the quantum genetic algorithm can be used to optimize the weight and the threshold of neural network, and the modeling efficiency and accuracy can be improved significantly. In this paper, BP neural network algorithm and quantum genetic neural network algorithm were modeled and simulated respectively. Ten samples were randomly selected from 75 samples as prediction sets, and the remaining 65 were as modeling sets. In the quantum genetic algorithm, the population number was set to 40 and the termination algebra was 200. The optimization results showed that the algorithm could obtain the optimal solution quickly after training of only 81 generations. A comparison of the predicted results showed that the quantum genetic algorithm was much better than the BP neural network, the root mean square error of the prediction was significantly reduced from 0.345 5 to 0.029 4, and the coefficient of determination was increased from 0.850 4 to 0.979 9. This work has developed an effective method for compact, non-destructive, rapid and real-time detection of the dynamic viscosity of the lubricant and would find potential uses for the safety monitoring of high-speed trains.

Keyword: Visible-near-infrared spectroscopy micro-module; Lubricating oil; Dynamic viscosity; Quantum genetic algorithm; Neural network algorithm
引 言

润滑油之于高铁变速箱如同血液之于人体, 具有冷却、 密封、 防腐、 防锈、 清洗杂质等作用。 润滑油动力粘度[1, 2, 3]是衡量润滑油在一定温度下抵抗流动的能力, 其检测是对液体在流动时内部摩擦力进行具体的测量, 采用毛细血管粘度计测定润滑油的粘度。 动力粘度对于润滑油不仅是最重要的报警依据, 也是对润滑油品质的重要划分依据之一。 目前, 高铁变速箱润滑油仍需要在实验室的条件下进行检测, 用于测量润滑油粘度的标准测试方法是ASTM D445, 费时、 费力而且需要专业人员操作。 微型光谱仪[4]由于具有性能优良、 体积小巧、 价格便宜等优势, 使其拥有越来越多的优势。 1990年, Goldman等研制出基于平面波导和光栅的集成分光器件的波导光谱仪, 此后可见-近红外光谱分析已广泛的应用于农业、 化工、 食品、 医药等领域[3, 5, 6, 7, 8, 9, 10], 在润滑油粘度, 含水量, 污染度等方面的检测中都有所应用。 Ricardo[2]等报道了基于近红外化学计量预测模型建立光谱法定量测定齿轮电机润滑油的运动粘度(37.1~93.1 cSt), 其预测均方误差和相对平均误差分别为1.86%和2.97%(遗传算法), 2.36%和2.97% (间隔偏最小二乘)。 Jez Willian[1]介绍了一种基于红外光谱的多变量分析针对润滑剂粘度指数测定方法的研制和验证, 适用于81个不同生产商/品牌的润滑油。 赵芸等采用美国ASD公司生产的可见近红外光谱波段的Handheld Field Spec快速测定发动机润滑油动力粘度值方法, 其中预测均方误差和决定系数分别为0.006 6和0.988 1(支持向量机)。 虽然前人做了很多相关研究, 但是应用微型光谱仪定量分析润滑油动力粘度方面的应用还少有报道, 因此为微型光谱模块作为便携式甚至在线监测光谱仪器仍具有巨大的发展机会。

同时随着计算机技术的快速发展, 可见-近红外光谱分析着重通过化学计量学的方法来进行定量或定性分析。 迄今为止, 提取有效信息变量, 剔除无用变量仍然具有一定的物理意义。 BP神经网络算法[11]是Rumelhart等在1986提出的, 它是向前网络的核心, 也是神经网络中的精华部分。 BP神经网络具有优异的非线性拟合性能但也存在一些缺点, 例如网络结构的确定、 初始权值以及阈值的随机设定将导致其收敛速度慢并且容易陷入局部最小值。 在BP神经网络的预测模型中, 初始权值以及阈值的选择都对预测精度和性能起到关键作用。 量子遗传算法[12, 13]是采用量子染色体的形式, 其有两个优点: 一是单个量子染色体携带了多个状态信息, 故比遗传算法的进化操作带来更丰富的种群; 二是量子遗传算法中的变异和交叉是等效的, 因此在该算法中只需对量子染色体采用变异操作。 本文基于BP神经网络的局部精确搜索以及量子遗传算法的全局搜索特性, 用量子遗传算法来优化神经网络的阈值和权重, 从而提高建模效率和精度, 以期为开发微型光谱仪的无损检测装置, 实施油品检测过程中动力粘度的在线检测提供依据。 因此, 我们提出了利用微型可见-近红外光谱仪进行实时光谱数据采集, 结合量子遗传-神经网络算法进行润滑油粘度定量分析, 实现实时在线润滑油粘度检测。

1 实验部分
1.1 仪器

实验所用光谱仪为可见-近红外两种微型光谱仪模块拼接而成。 微型光谱仪是INSION公司生产的INSION波导型光谱仪, 可见短波近红外模块的工作波段为330~1 100 nm, 光谱分辨率为10 nm, 光学模块尺寸为54 mm× 31 mm× 9.1 mm; 近红外微型光谱模块工作波段为900~1 700 nm, 光谱分辨率为16 nm, 光学模块尺寸为67 mm× 36 mm× 22 mm。 两个光谱仪模块采用一分二的光纤进行拼接, 光源采用5 W的卤钨灯, 实验装置示意图如图1所示。 数据处理在MatlabR2014a中进行。

图1 用于测量不同粘度值润滑油的光谱实验系统图Fig.1 Experimental system for the spectral measurement of the oils with different viscosity values

1.2 润滑油样本的制备与动力粘度测定

润滑油样本是购买的VHG labs十三种不同粘度值的标样润滑油, 每瓶标样都是来自符合ISO 9001及ISO Guide 34规定的工厂, 而且通过了ISO/IEC 17025实验室的认证。 其粘度值如表1所示。 光谱数据采集时, 将样本倒入宽10 mm, 长10 mm的石英比色皿中, 每种样本制作6个, 共78个样本, 采用透射测试模式对每个样本光谱扫描采样4次, 求其平均值, 从而减少随机误差。 采集过程中每个样本均在恒温电热板上保证采集样本为40 ℃。

表1 实验样本的动力粘度值 Table 1 Dynamic viscosity values of experimental samples
1.3 数据预处理

原始光谱数据中除了包含有用的化学信息之外, 还包含大量的无关信息。 因此, 在建立模型之前需要进行光谱预处理。 图2(a)显示了不同动力粘度值润滑油的可见-近红外吸收光谱, 可以看出在近红外部分, 光谱曲线基线偏移严重, 所以我们采用Savitzky-Golay卷积平滑进行数据预处理, 平滑窗口大小为5, 并对其进行一阶求导。 图2(b)为吸光度光谱的一阶导数光谱, 从中可以看出一阶求导可以有效地消除基线漂移和背景噪声。 由于样本采集量较多, 因此在采集过程中很容易出现界外样本, 会对建模和预测结果产生很大的影响。 我们采用主成分分析(PCA)和马氏距离(MD)相结合的方法来识别浓度界外样本, 剔除了3个界外样本, 主成分分析法对数据作降维处理。

图2 不同动力粘度润滑油的(a)可见近红外光谱的吸光度和(b)其一阶导数Fig.2 Vis-NIR absorbance spectra (a) and first derivation spectra (b) of lubricant with different Kinematic Viscosity values

1.4 BP神经网络模型

BP神经网络是一种基于误差反向传播的多层前馈网络, 主要包括三个部分: 输入层、 隐含层以及输出层。 它需要对输入和输出变量、 隐含层网络数、 隐含层节点数、 初始权值、 传输函数、 学习算法、 学习速率和终止条件等网络参数进行选择和设置。 基本过程大致是数据由输入层输入, 并施以权重传输到隐含层, 隐含层经过权值、 阈值和激励函数运算后, 传输至输出层, 输出层给出神经网络的预测值, 若与期望值的误差不符合终止条件, 则从输出开始进行反向误差传播, 进行权值、 阈值的调整, 如此循环, 直到满足设置的终止条件。

1.5 量子遗传-神经网络模型

量子遗传算法(quantum genetic algorithm, QGA) 把量子态矢量的表达引入遗传编码中, 并利用量子逻辑门来实现染色体的演化, 是量子计算和遗传算法相结合的一种概率进化算法。 在量子计算中, 信息单位用量子位表示, 一个量子位的状态可能是1状态, 0状态, 或者是两个状态的叠加, 因为量子位的状态可以表示为[13, 14]

Ψ> =α|0> +β|1> (1)

其中α β 是复数, 表示对应状态的概率振幅。

α2+β2=1(2)

采用多量子位编码m个参数的基因如式(3)所示

qjt=α11tβ11tα12tβ12tα1ktβ1ktα21tβ21tα22tβ22tα2ktβ2ktαm1tβm1tαm2tβm2tαmktβmkt(3)

其中, qjt为第t代, 第j个个体的染色体; k表示编码每一个基因的量子位数; m是染色体的基因个数。

量子旋转门是量子遗传算法的演化操作执行机构, 旋转门在这里使用通用的、 与问题无关的调整策略, 量子旋转门的调整操作为

U(θi)=cos(θi)-sin(θi)sin(θi)cos(θi)(4)

其更新过程为

α'iβ'i=U(θi)αiβi=cos(θi)-sin(θi)sin(θi)cos(θi)αiβi(5)

其中, θ i为旋转角, (α 'i, β 'i)T是染色体第i个量子旋转门更新后得概率幅。

本文基于量子遗传算法的全局搜索特性, 采用量子遗传算法来优化神经网络的权重及阈值, 量子遗传-神经网络算法流程图如图3所示, 具体流程如下:

(1) 神经网络创建, 设置一个输入层, 两个隐含层, 一个输出层, 训练次数为1 000, 训练目标为1× 10-10, 学习速率为0.1。

(2) 对神经网络权值和阈值进行编码, 设置种群数目为40, 采用随机初始化的方式, 得到初始化种群Q(t0), 随机生成n个以量子比特位编码的染色体。

(3) 为使BP网络在预测时得到最小的残差, 因此选择预测样本的预测值与实际值的误差矩阵的范数作为量子遗传的目标函数的输出,

err=i=1n|y˙i-yi|2(6)

其中err为误差矩阵, y˙iyi分别为预测样本的预测值和实际值。

(4) 记录最优个体及其对应的适应度。

(5) 判断计算结果是否满足条件, 如果满足可以结束, 将权值和阈值赋予新的BPNN得出相应的样本粘度预测值, 否则继续计算。

(6) 对种群Q(t)中的每个个体进行测量, 得到相应的确定解。 对各确定解进行适应度评估;

(7) 利用量子旋转门U(t)对个体实施调整, 得到新的种群U(t+1);

(8) 记录最优个体和对应的适应度然后迭代次数t+1, 设定终止代数为200, 返回步骤(5)。

图3 量子遗传神经网络算法流程图Fig.3 Flow chart of QGA and BPNN algorithm

2 结果与讨论
2.1 BPNN模型的建立

通过对润滑油动力粘度的全波段分析, 建立光谱数据与动力粘度的相关关系, 将光谱数据经过平滑和一阶导数光谱处理之后作为BPNN模型的输入变量, 润滑油的动力粘度作为预测值, 建立BPNN预测模型。 从75个样本随机抽取10个样本作为预测集, 其余65个作为建模集。 该模型对润滑油粘度指数的分析结果如表2所示。 从表2可见, 预测集的决定系数(R2)为0.850 4, 预测标准误差(RMSEC)为0.345 5, 取得了较好的结果。

表2 不同模型的预测参数 Table 2 Prediction parameters by different models

为了进一步提高模型的预测精度, 接下来探讨采用QGA-BPNN方法进行建模。

2.2 QGA-BPNN模型的建立

为提高预测润滑油动力粘度的精度, 将量子遗传算法优化出的最优权值和阈值作为BPNN模型的参数, 建立量子遗传-神经网络模型。 每一代中所有种群的均方残差的最小值随着遗传代数的变化情况如图4所示。 在训练22代后就得到较好的最优解, 又进行了60代的进化, 在81代得到最优解。 预测集的决定系数(R2)为0.979 9, 预测标准误差(RMSEC)为0.029 4。 其决定系数接近于1, 而且预测标准误差较小, 取得了很好的结果。

图4 量子遗传算法的进化过程Fig.4 Evolutionary process of quantum genetic algorithm

两种建模方法的结果如表2所示, BP神经网络预测集的决定系数为0.850 4, 预测误差均方根为0.345 5, QGA-BPNN预测集的决定系数为0.979 9, 预测误差均方根为0.029 4。 可以发现, QGA-BPNN模型的预测集的决定系数比BP神经网络的更接近于1, 其预测误差均方根比BP神经网络的更接近于0, 结果明显优于BPNN模型。 可能原因是经过量子遗传算法优化BP神经网络得到的权值和阈值, 并将优化后的参数用于初始化BP神经网络, 可以使进化过程中的隐含信息得到全面的利用, 从而得到很好的训练和预测结果。

3 结 论

应用可见-近红外微型光谱模块结合QGA-BPNN实现了润滑油粘度的快速无损检测。 量子遗传算法有效地利用量子比特编码和量子旋转门操作, 能有效地获得BP神经网络可变参数的全局最优解。 虽然权值和阈值的优化需要较长时间的运行, 但实际运用中可以直接使用优化好的参数, 从而可以提高效率。 最优的模型预测决定系数(R2)为0.979 9, 预测标准误差(RMSEC)为0.029 4。 说明应用可见-近红外微型模块快速无损检测润滑油粘度能获得满意的预测精度, 为进一步开发实时在线检测润滑油粘度奠定了基础。

参考文献
[1] Braga J W B, Dos Santos A A, Martins I S. Fuel, 2014, 120: 171. [本文引用:2]
[2] De Paula Pedroza R H, Nic Cio J T N, Dos Santos B S, et al. Analytical Letters, 2013, 46(7): 1145. [本文引用:2]
[3] JIANG Lu-lu, ZHANG Yu, LIU Fei, et al(蒋璐璐, 张瑜, 刘飞, ). Acta Petrolei Sinica(石油学报), 2011, 27(1): 112. [本文引用:2]
[4] WANG Han, LI Shui-feng, LIU Xiu-ying(王晗, 李水峰, 刘秀英). Journal of Applied Optics(应用光学), 2008, 29(2): 230. [本文引用:1]
[5] Camps C, Christen D. LWT-Food Science and Technology, 2009, 42(6): 1125. [本文引用:1]
[6] Ferreiro-Gonzalez M, Espada-Bellido E, Guillen-Cueto L, et al. Talanta, 2018, 188: 288. [本文引用:1]
[7] He C, Chen L, Yang Z, et al. Bioresource Technology, 2012, 110: 314. [本文引用:1]
[8] CHEN Bin, LIU Ge, ZHANG Xian-ming(陈彬, 刘阁, 张贤明). Infrared and Laser Engineering(红外与激光工程), 2013, 42(12): 3168. [本文引用:1]
[9] Liu J, Han J, Zhang Y, et al. Spectrochimica Acta Part A, Molecular and Biomolecular Spectroscopy, 2018, 204: 33. [本文引用:1]
[10] Sacko B D, Sanogo S, Konare H, et al. Optics and Photonics Journal, 2018, 8(5): 123. [本文引用:1]
[11] Ni Y Q, Li M. Measurement, 2016, 88: 468. [本文引用:1]
[12] GONG Rui-kun, ZHOU Guo-qing(龚瑞昆, 周国庆). Modern Electronics Technique(现代电子技术), 2018, 41(15): 1004. [本文引用:1]
[13] ZHANG Li-fang, ZHANG Xi-ping(张立仿, 张喜平). Computer Engineering & Science(计算机工程与科学), 2016, 38(1): 1007. [本文引用:2]