润滑油冷却液污染的拉曼光谱检测方法研究
李婧1, 明廷锋1,*, 孙云岭1, 田洪祥1, 盛晨兴2,3
1.海军工程大学动力工程学院, 湖北 武汉 430033
2.武汉理工大学船舶动力工程技术交通行业重点实验室, 湖北 武汉 430063
3.国家水运安全工程技术研究中心可靠性工程研究所, 湖北 武汉 430063
*通讯作者 e-mail: hxtianwuhan@aliyun.com

作者简介: 李 婧, 1983年生, 海军工程大学动力工程学院博士研究生 e-mail: leej0820@163.com

摘要

对船舶柴油机而言, 润滑油常受到冷却液的污染, 引起润滑油劣化变质, 从而导致其功能失效。 冷却液的主要成分是水、 乙二醇及少量的防腐蚀、 抗穴蚀、 消泡沫等添加剂。 将拉曼光谱用于检测润滑油被冷却液污染的浓度, 是一种针对复杂混合物的拉曼光谱检测问题, 单个拉曼峰强度的定量分析方法无法满足浓度的定量检测。 为此, 将拉曼光谱分析和LSTM神经网络数据挖掘方法应用于检测润滑油冷却液污染的浓度。 在实验室条件下, 配制了冷却液污染浓度为2%, 1.5%, 1%, 0.5%, 0.25%和0%的柴油机润滑油油样, 对每个油样取样50次, 并进行拉曼光谱分析, 共获得300个拉曼光谱数据, 随机抽取其中80%的数据作为神经网络训练样本, 剩余20%的数据作为测试样本, 拉曼光谱样本数据的光谱范围为300~2 000 cm-1; 对数据进行预处理, 包括采样、 拟合、 离散点平均梯度估计等; 构建训练样本集, 将LSTM神经网络和多层全连接层(FC)结合, 建立4种不同的神经网络模型结构; 得到其在训练集和测试集上的平均误差曲线、 测试集上的检测准确率曲线。 分析结果表明, FCs, LSTM-FCs-1, LSTM-FCs-2和LSTM-FCs-3等4种神经网络模型, 检测准确率分别为96.7%, 93.3%, 98.3%和83.3%。 选取任意1%的波数点, 加入幅值随机正负变化1%的噪声之后, 4种神经网络模型的检测准确率分别为88.3%, 90.0%, 96.7%和78.3%。 可见, 相比于其他3种神经网络结构模型, LSTM-FCs-2模型更适用于进行润滑油冷却液污染的定量估计, 加噪后最高准确率仍可以达到96.7%, 鲁棒性优于其他三种模型。 拉曼光谱结合LSTM网络中的LSTM-FCs-2模型, 应用于冷却液污染浓度分别为0.2%和0.4%的实际油样检测, 相对误差分别为5.0%和7.5%, 结果表明该方法可用于在用润滑油冷却液污染浓度的检测。

关键词: 拉曼光谱; 柴油机润滑油; 神经网络; 定量估计; 冷却液污染
中图分类号:O657.3 文献标志码:A
Research on Raman Spectroscopy Detection Method for Lubricating Oil Contaminated by Coolant
LI Jing1, MING Ting-feng1,*, SUN Yun-ling1, TIAN Hong-xiang1, SHENG Chen-xing2,3
1. College of Power Engineering, Naval University of Engineering, Wuhan 430033, China
2. Key Laboratory of Marine Power Engineering & Technology (Ministry of Transport), Wuhan University of Technology, Wuhan 430063, China
3. Reliability Engineering Institute, National Engineering Research Center for Water Transportation Safety, Wuhan 430063, China
*Corresponding author
Abstract

For marine diesel engines, lubricating oil is often contaminated by the coolant, resulting in the deterioration of lubricating oil, further leading to its functional failure. The main components of the coolant are water, ethylene glycol, and a small number of additives such as anti-corrosion, anti-cavitation, and defoaming. The application of Raman spectrum to detect the concentration of coolant contaminating lubricating oil is a kind of Raman spectrum detection problem for complex mixtures. The quantitative analysis method of single Raman peak strength cannot meet the quantitative detection of concentration. Therefore, Raman spectral analysis and LSTM neural network data mining are applied to lubricant coolant contamination. Under laboratory conditions, diesel oil samples with coolant contamination concentrations of 2%, 1.5%, 1%, 0.5%, 0.25% and 0% were prepared. Each oil sample was analyzed by Raman spectroscopy for 50 times, and a total of 300 Raman spectral data were obtained. 80% of the data were randomly selected as neural network training samples, and the remaining data were taken as test samples. The wavenumber of Raman spectral sample data was 300~2 000 cm-1. Data preprocessing, including sampling, fitting, discrete point average gradient estimation. The training sample set was constructed, and the LSTM neural network was combined with multi-layer full connection layer (FC) to establish four different neural network model structures, including FCs, LSTM-FCs-1, LSTM-FCs-2, andLSTM-FCs-3. The average error curves and detection accuracy curves of the four networks on the training set and test set are obtained. The results showed that the accuracy of FCs, LSTM-FCs-1, LSTM-FCs-2, and LSTM-FCs-3 neural network models was 96.7%, 93.3%, 98.3% and 83.3%, respectively. In order to study the robustness of the four models, the detection accuracy of the four neural network models was analyzed by selecting any wavenumber of 1% and adding noise whose amplitude changed by 1% randomly. The results were 88.3%, 90.0%, 96.7% and 78.3%, respectively. It can be seen that compared with the other three neural network structural models, LSTM-FCs-2 model is more suitable for quantitative estimation of lubricant coolant contamination, and its highest accuracy can still reach 96.7% after adding noise, and its robustness is better than the other three models. Raman spectroscopy combined with the LSTM-FCs-2 model in the LSTM network was applied to the sample of lubricating oil in use with 0.2% and 0.4% coolant contamination concentrations, respectively, with relative errors of 5.0% and 7.5%. It shows that this method can be used to detect the concentration of used lubricating oil contaminated by the coolant.

Keyword: Raman spectroscopy; Diesel engine lubricating oil; Neural network; Quantitative estimates; Coolant contamination
引言

船舶柴油机润滑油易受到冷却液的污染, 从而引起润滑油老化、 变质及功能失效[1]。 因此, 在润滑油使用过程中, 针对润滑油中冷却液的污染问题, 必须加以监测, 防止二次故障损失。 冷却液主要包含水、 乙二醇及有机羧酸。 目前可以用蒸馏法[2]和卡尔菲休滴定法[3]测量水分, 间接反映冷却液的污染。 该方法一方面受到水分来源的影响, 一般来说, 常见的船舶柴油机润滑油进水来源是冷却液, 也存在进海水或淡水的可能性。 另一方面, 柴油机工作时, 由于润滑油温度高, 会挥发掉一部分水分。 仅通过测量水分来表征冷却液的污染是很不全面的。 通过利用气相色谱法[4]测量发动机机油中的乙二醇。 但由于测量时间长, 体积大, 操作比较复杂, 不适合现场测量使用。 傅里叶红外(FT-IR)光谱法[5]可测量水和乙二醇浓度, 但由于冷却液中含一定量的水, 如果测试污染油样中水的含量过高, 会使傅里叶红外光谱仪中的分束器受潮而损伤。 拉曼光谱在测试过程中, 具有无需触及试样、 仪器维护费用低等特点[6], 一条光谱数据隐藏了大量可分析的试样信息, 在定量分析和定性分析试样浓度的领域获得了广泛应用。

目前, 人工神经网络和偏最小二乘法可以用于拉曼光谱分析[7]。 阮华等[8]利用拉曼光谱, 结合支持向量机的方法, 建立汽油辛烷值的多元校正模型。 徐荟迪等[9] 利用马氏距离判别方法和随机森林判别的模式识别方法可以对具有相同拉曼峰的不同产地的软玉进行鉴别。 本文使用长短期记忆神经网络(long short-term memory, LSTM), 分析柴油机冷却液污染润滑油的拉曼光谱数据, 并进行冷却液污染比例的定量检测研究。

1 理论部分

LSTM是一种特殊的递归神经网络(recurrent neural network, RNN), 其中一个关键性扩展是使自循环的权重视上下文而定, 而不是固定的[10]。 本文给出一种基于LSTM神经网络的润滑油冷却液污染定量估计方法。 算法分为3个部分, 数据预处理、 神经网络训练、 冷却液浓度定量估计, 如图1所示。 光谱数据预处理包括数据采样、 拟合、 离散点平均梯度估计; 神经网络训练, 包括模型结构的选定、 构建训练样本集、 对神经网络模型训练和测试; 冷却液污染浓度定量估计包括原始光谱数据预处理及神经网络估计污染物浓度的检测。

图1 整体算法流程图Fig.1 Overall algorithm flow chart

2 实验部分
2.1 仪器

实验使用的拉曼光谱仪, 型号为RamTracer, 最大功率为330 mW。 所检测的光谱范围为2 000~250 cm-1。 光学分辨率小于6 cm-1

2.2 材料

实验柴油机润滑油为壳牌喜力HX2, 15W-40润滑油, 防冻冷却液为Prestone 50/50。

2.3 样本

油样的配置方案为通过空白油样, 配制混入冷却液质量百分比浓度为2%, 1.5%, 1%, 0.5%和0.25%的油样, 作为A组, 编号分别为A1, A2, A3, A4和A5。 空白油样编号为A6。

选择某型柴油机润滑油的在用润滑油, 不含冷却液的油样, 加入已知冷却液, 分别得到含0.2%和0.4%冷却液污染的在用润滑油, 作为B组, 编号分别为B1和B2。

拉曼光谱仪开机预热30分钟以后, 进行预先测试。 将功率调节器调到合适位置以确保每次测量时, 在功率调节器固定不变的情况下能得到有效谱图。 功率调节器固定以后, 进行A组样本的拉曼光谱测试, 每组油样测得拉曼光谱数据50个, 6组共300个数据。 数据范围为300~2 000 cm-1的拉曼光谱图叠加如图2所示。 从拉曼光谱图中难以看出冷却液污染浓度与图形之间的关系, 因此必须建立污染度浓度与图形之间的定量分析方法。

图2 300个样本的拉曼光谱数据Fig.2 Raman spectral data of 300 samples

3 结果与讨论
3.1 光谱数据预处理

以污染物为乙二醇作为研究对象, 选取300~2 000 cm-1的数据作为原始的数据, 数据预处理算法流程:

(1) 在波段中进行数据采样, 采样间隔为1个波数单位, 每组数据采样得到n1个采样点Wori, i=[woi, 1, woi, 2, …, woi, n1];

(2) 对wori, i进行三次插值拟合, 并对拟合后的曲线进行采样, 采样间隔为0.1, 每组数据采样得到n2个采样点Wcub, i=[wci, 1, wci, 2, …, wci, n2];

(3) 求取各组数据wori, i中原始采样点处的平均梯度Gradi=[gi, 1, gi, 2, …, gi, n3], 每组数据得到n3个平均梯度点, 各点平均梯度计算公式为

gi, k=j=k×10(k+1)×10(woi, k+1-wci, j)/10(1)

3.2 神经网络模型选定、 训练、 测试

选取拉曼光谱中300~2 000 cm-1段作为原始数据, 数据采样间隔为1, 进行数据预处理后的梯度数据维度与原始数据一致。 数据集样本归一化处理后, 见表1所示。

表1 数据集样本 Table 1 Sample distribution of the dataset

共设计了4种神经网络模型用于污染物浓度的估计, 如图3所示。

图3 神经网络模型图Fig.3 Neural network model diagram

图3(a)中模型为6层全连接层结构, 该结构用FCs(fully connected layers)表示。 图3(b)中模型在图3(a)中模型的基础上增加单层结构的LSTM层, 该结构用LSTM-FCs-1表示。 图3(c)中模型含有两个分支, LSTM分支和全连接分支构成分支结构。 该结构用LSTM-FCs-2表示。 图3(d)中模型在两个分支结构中的末端分别增加1个全连接层。 该结构用LSTM-FCs-3表示。

从数据集中每个类别抽取其中80%的数据作为神经网络训练集中样本, 剩余20%作为测试集样本。 在模型的训练过程中, 选用L1损失函数; 训练策略选用随机梯度下降法, batchsize取值为8, 学习率更新策略选用step, 初始学习率选择为0.01, 学习率更新间隔为每10次完全迭代, 学习率衰减比例为0.1。

3.3 冷却液污染定量估计

四个模型在数据集上最终测试结果对比见表2, 前两项平均误差指标分别为标签值下的平均误差和浓度值下的平均误差, 标签值下的平均误差度量为模型的输出与样本真实标签之间的差值, 浓度值下的平均误差度量为模型估计值换算至污染物实际浓度后与样本实际浓度之间的差值, 平均误差越小表示污染物浓度估计预期准确; 准确率的统计依据为模型估计的单个样本浓度值误差小于0.05%, 则判定为定量估计准确。

表2 四个模型在数据集上测试结果对比 Table 2 The test results of each model were compared on the data set

四个模型在数据集上的损失曲线如图4所示。 图4(a)和(b)中分别为各模型在训练集、 测试集上的损失与迭代次数的关系, 随着模型训练迭代次数的增加, 各模型在数据集上的损失逐渐降低, 最终均趋于稳定, 误差越低, 代表网络模型的输出结果越接近真实的标签值。 根据损失曲线进行对比不难发现, LSTM-FCs-3模型在训练过程中的收敛速度最慢, 且最终的平均损失最大。

图4 损失曲线
(a): 训练集上的损失曲线; (b): 测试集上的损失曲线
Fig.4 Loss curve
(a): Loss curve on training set; (b): Loss curve on the test set

四个模型在测试集上的准确度如图5所示。 四个模型在测试集上的鲁棒性测试如图6所示。 鲁棒性测试会对测试集中每组样本随机抽取1%的波数数据上随机添加不大于1%的噪声, 测试模型的抗扰动能力。

图5 测试集上的准确率曲线Fig.5 The accuracy curve on the test set

图6 测试集上的鲁棒性测试Fig.6 Robustness testing on test sets

结合图5、 图6和表2分析, LSTM-FCs-2模型的估计最高准确率达到98.3%, 且该模型在训练集上的表现明显优于其他模型; 且在鲁棒性测试中对测试集添加1%的随机噪声后进行测试, LSTM-FCs-2模型最高准确率仍能达到96.7%, 鲁棒性明显优于其他模型。

将B组的两个已知冷却液污染含量分别为0.2%和0.4%的在用油的拉曼光谱, 输入LSTM-FCs-2神经网络模型中检测, 分别得到冷却液含量的估计值分别为0.19%和0.43%, 相对误差分别为5.0%和7.5%。

4 结论

(1)拉曼光谱是一种检测柴油机润滑油冷却液污染的有效技术, 但是无法直接获得拉曼光谱数据信息与润滑油污染物浓度含量之间的对应关系。

(2)通过对FCs, LSTM-FCs-1, LSTM-FCs-2和LSTM-FCs-3四种神经网络模型的实验计算结果对比, LSTM-FCs-2网络模型对冷却液污染浓度估计准确率达到96.7%, 鲁棒性优。 因此, 相对于其他三种网络模型, LSTM-FCs-2网络模型更适用于润滑油冷却液污染的拉曼光谱数据分析处理。 通过对某在用润滑油进行冷却液污染浓度检测试验, 表明该方法鲁棒性好, 可适用于在用油冷却液污染浓度的检测。

参考文献
[1] Nikolai K Myshkin, Liubou V Markova. On-Line Condition Monitoring in Industrial Lubrication and Tribology. Springer International Publishing, 2018. [本文引用:1]
[2] General Administration of Quality Supervision Inspection and Quarantine of the People’s Republic of China(中华人民共和国国家质量监督检验检疫总局). GB/T 260—2016. Test Method for Water in Petroleum Products— Distillation Method, 2016. [本文引用:1]
[3] American Society of Testing Materials. ASTM D1533—12 Stand ard Test Method for Water in Insulating Liquids by Coulometric Karl Fischer Titration, 2012. [本文引用:1]
[4] American Society of Testing Materials. ASTMD7922—2014. Stand ard Test Method for Determination of Glycol for In-Service Engine Oils by Gas Chromatography, 2014. [本文引用:1]
[5] Condition Monitoring of In-Service Lubricants by Trend Analysis Using Fourier Transform Infrared (FTIR) Spectrometry: ASTM E2412— 10. 2018. [本文引用:1]
[6] YANG Xun-gang, WU Qi-lin(杨序纲, 吴琪琳). Raman Spectroscopy Analysis and Application(拉曼光谱的分析与应用). Beijing: National Defense Industry Press(北京: 国防工业出版社), 2008. 9. [本文引用:1]
[7] Barmpalexis P, Karagianni A, Nikolakakis I, et al. Journal of Pharmaceutical and Biomedical Analysis, 2018, 158: 214. [本文引用:1]
[8] RUAN Hua, DAI Lian-kui(阮华, 戴连奎). Chinese Journal of Scientific Instrument(仪器仪表学报), 2010, 31(11): 2440. [本文引用:1]
[9] XU Hui-di, LIN Lu-lu, LI Zheng, et al(徐荟迪, 林露璐, 李征, ). Acta Optica Sinica(光学学报), 2019, (3): 0330001. [本文引用:1]
[10] Lan Goodfellow, Yoshua Bengio, Aaron Courville. Deep Learning. Beijing: Posts & Telecom Press, 2017. 248. [本文引用:1]