发动机油中水分的近红外光谱分析
刘阁1, 陈彬2,*, 商芷萱2, 全宇轩2
1.河北省危险化学品安全与控制技术重点实验室, 华北科技学院化学与环境工程学院, 河北 燕郊 065201
2.华北科技学院机电工程学院, 河北省矿山设备安全监测重点实验室, 河北 燕郊 065201
*通讯作者 e-mail: hustchb@163.com

作者简介: 刘 阁,女, 1973年生,华北科技学院化学与环境工程学院副教授 e-mail: lycy9945@163.com

摘要

发动机油是发动机的核心部件, 发动机油中极易混入水分, 水分容易加速发动机油的劣化和变质, 进而危害发动机的安全运行。 对发动机油中水分进行检测是保障发动机油质量的重要指标。 因而采用近红外光谱结合偏最小二乘法(PLS)回归方法对不同含水量的发动机油进行了检测。 首先根据含水发动机油的近红外光谱的特征, 分析了931, 1 195~1 212和1 391~1 430 nm波长的较强吸收峰的机制; 采用正交信号校正(OSC)和几种其他的光谱预处理方法构建了PLS回归模型, 根据回归系数进行了特征波长的选择。 结果表明, OSC预处理后的PLS模型具有较好的预测能力, 而多元散射校正(MSC)和标准正态变量变换(SNV)预处理降低了模型的校正性能。 选择了166个特征波长, 占全谱的32.42%。 采用所建的近红外全谱PLS模型和特征波长选择的PLS模型分别对预测集14个油样进行预测, 两个模型都能实现较好地预测, 预测标准差分别为0.000 7和0.000 6; 而特征波长选择对含水发动机油的预测最稳健, 性能指标最好($R^{2}_{P}$为0.993 0, $R^{2}_{CV}$为0.988 7, 且RMSECV和RMSEP值分别为3.140 1×10-4和2.419 0×10-4, RPD值为11.988 4), 特征波长选择的PLS模型与全光谱模型相比, 经过特征波长选择消除了全光谱中大量无用信息, 对发动机油中含水量预测最稳健, 性能指标最好, 使模型的性能得到了显著提高。 根据所建的OSC预处理后的全谱PLS模型以及特征波长选择的PLS模型, 对油样的预测集进行验证, 特征波长选择后的PLS模型对预测集的预测效果较优, 每个油样的预测值更接近实测值。 说明经过特征波长选择后建立的PLS模型不仅没有降低模型的精度和预测能力, 反而由于消除了不相关变量的信息, 使所建模型更具有泛化性能。 因而近红外光谱技术对发动机油中水分的检测具有较好的精确性、 可靠性, 为发动机的状态监测提供一种可行的解决方案。

关键词: 发动机油; 水分; 近红外光谱; 特征波长
中图分类号:O657.3 文献标志码:A
Near Infrared Spectroscopy Analysis of Moisture in Engine Oil
LIU Ge1, CHEN Bin2,*, SHANG Zhi-xuan2, QUAN Yu-xuan2
1. Hebei Key Laboratory of Hazardous Chemicals Safety and Control Technology, School of Chemical and Environmental Engineering, North China Institute of Science and Technology, Yanjiao 065201, China
2. School of Environmental Engineering, Hebei Key Laboratory of Safety Monitoring of Mining Equipment, North China Institute of Science and Technology, Yanjiao 065201, China
*Corresponding author
Abstract

Engine oil is the core component of the engine. It is easy to mix with water in the engine oil, which can easily accelerate the deterioration and deterioration of the engine oil, and then harms the safe operation of the engine. Detecting water in the engine oil is an important indicator to ensure the quality of the engine oil. Moisture is easy to accelerate the deterioration and degradation of engine oil, and it is harmful to the safe operation of the engine, and its detection is an important index to ensure the quality of engine oil. Therefore, near-infrared (NIR) spectroscopy combined with partial least squares (PLS) regression method was used to detect engine oil with different water content. Firstly, the mechanism of 931, 1 195~1 212 and 1 391~1 430 nm wavelengths with strong absorption peaks were analyzed according to the NIR characteristics of water-containing engine oil. Orthogonal signal correction (OSC) and several other spectral pretreatment methods were used to construct the PLS regression model, and the characteristic wavelength was selected according to the regression coefficient. The results showed that the PLS model pretreated by OSC had the better predictive ability, while the pretreated by MSC and SNV reduced the correction ability of the model. The 166 feature wavelengths were selected, accounting for 32.42% of the spectrum. The fourteen oil samples in the prediction set were predicted using the established near-infrared full spectrum PLS model and the characteristic wavelength selected PLS model. Both models can achieve good prediction, and the standard deviation of prediction is 0.000 7 and 0.000 6, respectively. The PLS model selected by characteristic wavelength had the most robust prediction and the best performance index ($R^{2}_{P}$ was 0.993 0, $R^{2}_{CV}$ was 0.988 7, RMSECV and RMSEP were 3.140 1×10-4 and 2.419 0×10-4, RPD was 11.988 4). Compared with the full-spectrum model, the PLS model with characteristic wavelength selection can eliminate much useless information in the full spectrum, predict the water content of engine oil most robustly and have the best performance index so that the performance of the model has been significantly improved. The prediction set of oil samples was verified according to the established full-spectrum PLS model after OSC pretreatment and the PLS model for characteristic wavelength selection. The prediction effect of the PLS model after characteristic wavelength selection was good, and the predicted value of each oil sample was closer to the measured value. It indicates that the PLS model established after characteristic wavelength selection does not reduce the accuracy and prediction ability of the model, but eliminates the information of unrelated variables, making the model more generalized. Therefore, the near-infrared spectroscopy technology has good accuracy and reliability in detecting moisture in engine oil, which provides a feasible solution for engine condition monitoring.

Keyword: Engine oil; Moisture; Near infrared spectroscopy; Characteristic wavelength
引言

发动机润滑油用于减少移动部件的摩擦, 并保持不同部件的清洁, 可以用作清洁剂和分散剂。 发动机在正常工作中极易在机油中产生污垢、 盐、 水、 燃烧的不完全产物等污染物, 不但影响发动机油理化性能, 而且加速了添加剂、 基础油的化学反应, 产生腐蚀性酸和水分等其他有害物质[1]。 机油在发动机中的搅动、 热和压力会随着时间的推移使水污染乳化。 因而发动机油中的水分主要以溶解或乳化状态存在, 会导致腐蚀、 添加剂消耗、 氢致开裂和微点蚀等问题[2], 因此对发动机油中的水分进行监测和量化是至关重要的。

国内外采用不同的技术对发动机油的水污染进行了大量的研究[3]。 开发了多种测定油中水分含量的方法。 由于添加剂会干扰卡尔-费歇尔法对这类油中水分的测定, 会导致高估水分含量。 核磁共振波谱用于发动机油的降解, 检测水中的油污染[4]等各种研究, 对发动机油中区分相对较低的水浓度(0%, 1%, 2%V/V)之间有显著的统计学差异[5]

由于在红外光的作用下水的偶极矩发生变化, 氢原子具有最大的振动, 红外光谱测试油中水分可能是传统测水的有效替代方法, 得到了极大的关注。 虽然O—H健的光谱信号可能与其他功能基团的信号重叠, 但使用化学计量信号处理技术可以获得准确的结果。 特别是自布格-兰伯特-比尔提出光谱吸收定量评价的数学规律以来, 光谱分析已应用于润滑油性能检测方面[6, 7], 得到了迅速的发展。 Liu等[8]开发了一种基于可见-近红外光谱的小型含水率监测系统, 采用反射光学探头, 具有实现润滑油状态实时监测的潜力。 采用偏最小二乘法(partial least squares, PLS)和反向传播神经网络(back-propagation neural network, BPNN)算法建立处理模型。 采用马尔滕斯不确定性检验、 区间偏最小二乘(iPLS)和遗传算法(genetic algorithm, GA)变量选择技术选择最显著的预测变量。 Holland等[9]采用傅里叶变换红外光谱(Fourier transform infrared spectroscopy, FTIR)研究了SAE 15W-40柴油机润滑油在不同污染水平的水分含量, 用方差分析建模和检测极限计来预测区分污染水平随时间变化的能力。 近红外光谱的信息源是分子内部原子间振动的倍频与合频, 不同物质在近红外区域有丰富的吸收光谱, 每种成分都有特定的吸收特征, 采用近红外光谱对含水润滑油光谱特征的分析也取得了一些进展[10], Holzki等[11]研发了一种用于润滑油含水率原位测定的光纤倏变场吸收传感器, 测量无包层光纤周围消光场在约2 950 nm光谱范围内的吸光度。 并采用了介质电泳技术来提高消失场区域内水滴的浓度, 检测灵敏度平均提高了1.7倍。 陈彬等[12]分析了含水汽轮机油的近红外光谱, 在1 200, 1 400和1 700 nm波长附近有明显的吸收峰存在, 其中1 400 nm附近是对应O—H键的1倍频; 结合连续投影算法(successive projections algorithm, SPA), 建立油中含水量预测的全波段偏最小二乘法(PLS)模型, 实现了油中含水量的定量分析。 并采用无信息变量消除法提取了光谱的有效波长, 选择的波长主要集中在O—H键的合频附近1 600~1 700 nm、 1倍频1 400~1 600 nm和2倍频900~1 000 nm处, 具有含水油液光谱的物理特征意义。

因而拟采用近红外光谱结合偏最小二乘回归的方法检测发动机油中水分, 在水分分析建模过程中, 基于油液近红外光谱复杂、 非线性和难以用明确数学模型表达的特点, 采用正交信号校正和几种传统的光谱预处理方法去除光谱的基线偏移、 仪器误差和测试噪声。 为了保障所建模型的鲁棒性和普适性, 根据回归系数的重要程度, 进行了关键光谱波长的选择。 将决定系数R2、 相对预测性能(relative prediction performance, RPP)、 均方根误差(root mean squared error, RMSEP)作为模型优劣评判的性能指标。 根据这些指标对所建模型进行比较分析, 获取发动机油中水分的近红外检测的可靠有效的方法, 为发动机的安全高效运行提供理论研究和技术支撑。

1 实验部分
1.1 仪器与油样

实验采用海洋光学NIRQUEST近红外光谱仪(型号512-1.9, 波长范围900~1 700 nm, InGaAs检测器), 选用SAE10W-30型发动机油(适用于外部环境温度范围为-25~30 ℃, 壳牌(中国)有限公司生产)作为原始油样, 用移液管将10 mL原始油样放入70个直径15 mm、 高度150 mm的玻璃试管中, 配置不同的含水比例(0~2.5% V/V)污染油样。 配置方法是通过使用移液管用等量的蒸馏水代替适当体积的油, 如除去10 μL的机油, 添加10 μL的蒸馏水, 从而得到0.1%的水污染样品。 分别用10~250 μL的蒸馏水得到0.1%~2.5%共34个污染级别的油样, 每个污染级别油样配置2个样品和2个0%污染的原始油样共70个样品。 每个油样采用超声震荡器进行充分搅拌2 h(50 Hz, 25 ℃), 以保证油水有效的混合。 混合均匀后的油样采用831型库仑水分仪(瑞士万通)进行水分的精确检测, 作为油样的最终含水量, 并将它们储存在一个封闭的试管中, 并直立放置在一个封闭的盒子中, 以防止光降解。

1.2 光谱测试方法

近红外光谱仪是基于比尔-朗伯定律获取油样的光谱, 光谱的波长范围为900~1 700 nm, 光学分辨率(FWHM)为3.1 nm, 波长重复性为0.1 nm。 采用光源为50 W石英卤素灯, 使用的检测器类型为InGaAs, 色散原件为25 μm光栅, 所有样品均在室温下(25 ℃)加入1 cm比色皿中进行测试。 光谱采集软件为OCEANVIEW, 扫描次数为20次。 化学计量学分析中使用的光谱为每个样品的三次重复的平均值。

然后将光谱仪采集的各个油样光谱数据采用UnscramblerX化学计量学软件进行光谱预处理和化学计量学分析, 采用MATLAB软件对光谱数据根据波长回归系数进行重要性分析和选择。 光谱的预处理采用Savitzky-Golay(15点平滑窗, 二阶多项式)、 标准正态变量变换(standard normal variable transformation, SNV)、 多元散射校正(multiplicative scatter correction, MSC)、 正交信号校正(orthogonal signal correction, OSC)以及使用(Savitzky-Golay, SG)算法的一阶或二阶导数等方法, 采用非线性迭代偏最小二乘(non-iterative PLS, NIPALS)算法构建不同油样和光谱的非线性关系, 以消除近红外光谱中不相关或正交变量。 再进行主成分分析(principal component analysis, PCA)选择并消除对回归模型产生干扰的离群油样。 并将70个油样划分为训练集和验证集, 训练模型采用完整交叉验证(留一法)进行构建。 将不同含水量的油样与相应的光谱数据作为回归模型的输入输出量, 同样采用交叉验证的最小均方根(RMSECV)确定回归模型的最佳因子数。 采用预测决定系数(R2)、 预测均方根误差(RMSEP)和RMSECV对所建立的PLS回归模型进行评价。 采用残差预测比(RPD)表示拟合优度。 RPD是一种用于确定模型预测精度的无量纲统计量, 为数据集的标准偏差与RMSECV的比率。 一般地, RPD小于1.5表示校正模型不适合预测, 1.5~2表示有可能区分高低水平, 2.0~2.5表示有可能进行近似定量预测, 在2.5~3以及3以上表示预测效果是好的和较优的模型[13]

最后为了降低回归模型的运算量, 以及获取光谱数据中的重要波长变量, 根据所建模型的回归系数选择不相关的波长, 降低模型的维数, 重新建立重要波长变量的回归模型, 并与全波长的回归模型进行比较。

2 结果与讨论
2.1 油样光谱的特征以及异常值的处理

配置的油样经过超声震荡器充分混合处理后, 油中的水分会发生微小变化, 因而采用库仑水分仪进行精确测定含水量, 有助于在获取分析发动机油中近红外光谱数据后, 采用化学计量分析中回归模型的响应具有稳健型和可靠性。 配置了经过水分仪检测后的含水量的油样70个, 所配置的油样可分为35个级别。 其中34个0.1%~2.5%水污染级别的油样中, 每个污染级别有2个相同含水量级别的油样, 共68个油样。

2.1.1 油样光谱的特征

所有油样的原始光谱如图1(a)所示, 在波长931, 1 195~1 212和1 391~1 430 nm处出现了较强的吸收峰, 对应于O—H键伸缩振动频率引起的2倍频、 伸缩振动和扭转振动的合频、 伸缩振动1倍频光谱[8]。 在1 391, 1 413和1 430 nm处观察到三个峰值, 在1 195和1 212 nm处有两个峰值, 在931 nm处有一个小峰。 这些峰值的强度随含水量的增加而有明显的增加。

图1 不同含水量油样的原始光谱和预处理后光谱
(a): 原始光谱; (b): SG一阶导数处理后的光谱
Fig.1 Original and pretreated spectra of oil samples with different water contents
(a): Original spectrum; (b): Spectra after SG first derivative processing

采用SG卷积求取光谱的一阶导数如图1(b)所示, 消除了原始光谱的基线漂移以及背景干扰的影响后, O—H键的伸缩振动和扭转振动的合频、 伸缩振动1倍频光谱引起峰值的导数幅值非常明显, 可见采用近红外光谱分析发动机油中水分具有较强的分辨能力。 由图1的原始光谱和预处理后光谱可见, 有两条光谱曲线的变化明显与其他光谱曲线存在差异, 可能是异常油样, 在建立回归模型前需要进行油样异常值的剔除。

2.1.2 异常值的剔除

由于油样在近红外测试过程中会存在漏光、 光源强度发生变化以及异常油样干扰等因素, 影响光谱数据的异常, 将对发动机油的含水量回归模型的预测性能、 鲁棒性与适用性产生较大地影响。 因而在建立回归模型前需要对异常光谱进行检测和剔除。

首先对所有油样进行PCA分析, 得到图2(a)所示的两个主成分分数图, 可以看到随着油中水分的增加, 油样从左到右分布在主成分PC1的两侧, 即含水量相近的油样对两个主成分的相关性相似, 低含水量的油样(< 0.30%)和高含水量(>0.80%)在两个主成分的相关性方面具有较大的差异。 表明配置的油样用于预测具有有效性。 然后用置信度为97%的Hotelling's T2统计椭圆检测油样, 发现有1.00%和2.50%两个污染级别的4个油样位于椭圆外, Hotelling's T2统计量是通过测量在主成分方向上的变化到模型中心的距离来反应油样在主成分子空间中偏离模型的程度, 说明这两个污染级别的油样是异常值(图中以圆圈表示)。

图2 原始光谱PCA分析的分数图(a)和影响图(b)Fig.2 Fraction diagram (a) and influence Diagram (b) of PCA analysis of original spectrum

在PCA分析的影响图[图2(b)]中, 表示的是油样的F残差和Hotelling's T2统计量的控制限情况, 其中F残差(置信度为97%)表示油样在残差子空间中偏离主成分模型的程度。 可见1.00%和2.50%两个污染级别的4个油样位于两个控制限的右上方, 表示这4个油样的F残差较大、 且Hotelling's T2统计量也较大, 是需要剔除的异常值。 另外在图2(b)F残差控制限的左上方出现了0.80%, 0.90%和0.33%三个污染级别的6个油样, 表明这三个级别的油样F残差较大, 在主成分方向上的变化到模型中心的距离较小。 在实验中基于发动机油中水分含量一般情况下较小, 因而为了所建模型的鲁棒性以及预测的准确性, 将这三个污染级别的油样不作为异常值剔除(图中以圆圈表示)。

剔除1.00%和2.50%两个污染等级的油样异常值后, 剩余的66个油样中52个油样用于构建回归模型的训练集, 剩余的14个油样作为回归模型的验证集。

2.2 构建回归模型

偏最小二乘回归(partial least squares regression, PLSR)结合了多元线性回归、 典型相关分析和主成分分析的特点, 是最常用的化学计量学方法, 在光谱建模分析中得到广泛应用。 将剔除异常值后不同含水量的油样近红外光谱数据与含水量构建 PLSR进行光谱分析。 PLSR数据矩阵X(n, m)由光谱仪器采集的油样的近红外光谱组成, 响应变量y(n, 1)是水分含量的值, 其中n为训练数据集中的样本数52个; m为近红外光谱的波长数为512个。

在PLSR算法中, 光谱数据矩阵分解和回归是在同一个步骤中实现的, 通过最小RMSECV值选择模型的最优因子(MVs)数为1, 原始光谱的预测值和实测值的相关图如图3所示。 得到预测模型具有较低的预测值(RP2=0.746 3,RCV2=0.691 0)和很差的拟合优度(RPD=1.979 5), 且有较大的RMSE值(RMSECV=1.648 7×10-3, RMSEP=1.465 3×10-3), 可以看到含水量较低和较高的油样偏离回归线较大, 特别是2.00%的油样偏离最大, 影响了回归模型的准确度, 也表明该模型缺乏良好的精度和稳定性。 这是由于一定程度上在PLS回归模型中引入了全谱中的不相关信息。 因此, 适当的光谱预处理和有效的变量选择方法是发展和改进回归模型的必要方法。

图3 原始光谱的预测值和实测值的相关图Fig.3 Correlation between predicted and measured values for the original spectrum

2.2.1 光谱的预处理

原始光谱的光散射、 噪声和基线漂移等影响因素对原始近红外光谱的叠加或相乘效应, 致使一些不相关的信息添加到构建的预测模型中, 减弱了由于样品的物理特性造成的一些差异, 因而在构建回归模型前需要采用不同的光谱预处理方法对光谱的数据进行处理, 以消除干扰信息, 提高模型的稳定性。

由于不同的预处理方法对原始近红外光谱的处理效果存在较大的差异, 为了获得含水发动机油的光谱较好的回归模型, 对常见的SG、 1、 2阶导数、 MSC、 SNV、 OSC等预处理方法对发动机油近红外光谱进行了处理。 根据Savitzky-Golay(15点平滑窗, 2阶多项式)卷积平滑预处理方法使用加权平均法, 通过多项式最小二乘法对移动窗口内的数据进行拟合, 强调中心点的中心作用, 能够提高光谱的平滑度, 从而抑制声干扰。 同时, 采用导数谱法可以有效地消除了基线和其他背景的干扰, 使得重叠峰的区分更加明显, 从而提高了光谱分辨率。 MSC和SNV两种方法是有无假定“理想光谱”而采用的一种对油样中颗粒分布不均匀及其产生的散射等影响进行消除的方法。 通过预处理后构建回归模型的RP2, RMSECV和RMSEP等参数比较了各种预处理方法对油样较好的处理结果, 如表1所示。

表1 光谱数据不同预处理后的PLS结果 Table 1 PLS modeling results of spectral data after different pretreatments

可以看出, 一些光谱预处理方法可以产生较好的预测效果, 而另一些则会使预测结果变差。 例如与原始回归模型相比, 经过SNV预处理后的光谱模型校正和预测性能下降。 相反, MSC和导数法预处理增强了PLS模型的预测能力, 但降低了模型的校正性能。 SG预处理后与原始模型变化不大。 而以OSC预处理方法的PLS模型对含水发动机油模型的校正和预测的鲁棒性最强, 性能指标最好, OSC预处理明显提高了PLS预测模型的质量, OSC预处理后全光谱的预测值和实测值的相关图如图4所示。RP2为0.985 5,RCV2为0.984 9, RMSECV为0.002 010, RMSEP为0.000 350, RPD为8.276 3。 这是由于OSC与传统预处理方法相比, OSC预处理方法处理光谱矩阵, 考虑了响应变量与光谱信息之间的相关性, 排除与含水量相关的光谱变化, 消除了无关信息, 因而回归模型具有较好的鲁棒性。 从而也表明PLS可以从原始的全近红外光谱中提取相关变量建立校正模型, 能够有效地对发动机油中水分含量进行较好的预测。

图4 OSC预处理后全光谱的预测值和实测值的相关图Fig.4 Correlation between predicted and measured values for full spectrum after OSC pretreatment

2.2.2 光谱特征波长的选择

虽然全近红外光谱经过OSC预处理后的模型预测效果较好, 但是模型中包含了大量的不相关信息, 这会增加模型变量的数量和复杂性, 同时降低PLS模型的泛化性能。 因此, 很有必要对建模中的近红外光谱波长变量进行选择, 提取特征波长, 代表原始光谱信息中有用的部分, 有效地消除冗余变量, 进一步简化模型, 从而提高PLS模型的稳健性。

根据PLS模型回归系数是回归模型光谱波长变量的权重系数, 表征了所建模型的x变量和给定y响应之间的关系。 通过将归一化的回归系数与回归模型的预测值进行复杂的数学处理, 所得的系数矩阵中大于等于1的系数对应的波长为模型影响较大的变量, 以此就可以对OSC预处理光谱进行特征波长的选择。

最终在OSC预处理PLS模型中选择了166个变量, 占全谱的32.42%。 然后这些选择的变量作为新的输入重新获得PLS模型的预测。 所选变量所建立的模型均得到RP2为0.993 0,RCV2为0.988 7, 且RMSECV和RMSEP值分别为3.140 1×10-4和2.419 0×10-4, RPD值为11.988 4, 表明该模型对发动机油中含水量预测最稳健, 性能指标最好。 结果表明与全光谱模型相比, 经过特征波长选择消除了全光谱中大量无用信息, 使模型的性能得到了提高。

2.3 油样的预测

根据所建的OSC预处理后的全谱PLS模型以及特征波长选择的PLS模型, 对油样的预测集进行验证, 得到如图5所示的特征波长选择前后的预测结果比较。 可见基于近红外全谱的PLS模型以及特征波长选择后的PLS模型都能较好地对训练集以外的油样预测。 其中全谱PLS模型的预测集中14个油样的预测的最大标准差为0.000 7, 主要是0.9%和2%两个油样偏离引起的; 通过特征波长选择后的PLS模型对14个油样的预测的最大标准差为0.000 6, 也是0.9%和2%两个油样引起; 这主要是由于两个PLS模型的训练集中的油样含水量主要分布在较低水平上, 含水量较大的油样训练样本较少, 从而造成PLS模型对较高含水量的预测能力下降。 另外由图5可见, 特征波长选择后的PLS模型对预测集的预测效果较优, 每个油样的预测值更接近实测值。 说明经过特征波长选择后建立的PLS模型不仅没有降低模型的精度和预测能力, 反而由于消除了不相关变量的信息, 更具有泛化性能。

图5 特征波长选择前后的预测比较Fig.5 Comparison of predicted values before and after characteristic wavelength selection

3 结论

检测不同水分的发动机油近红外光谱, 分析了近红外光谱的特征; 并根据这些光谱特征应用化学计量分析, 结果表明应用预处理的近红外光谱PLS回归模型对发动机油中水分进行检测是可行的。 原始光谱的PLS模型的预测效果不够理想。 经过不同的预处理方法比较发现, OSC预处理后的光谱PLS模型表现出较好的效果。 此外, 基于降低PLS模型维度和复杂性的目的, 采用OSC预处理后的PLS模型回归系数对特征波长进行了选择, 得到了166个特征波长。 采用选择的特征波长变量重新构建PLS模型, 模型的RP2为0.993 0,RCV2为0.988 7, 且RMSECV和RMSEP值分别为3.140 1×10-4和2.419 0×10-4, RPD值为11.988 4, 具有更优的预测能力。 最后采用近红外全谱和特征波长选择的OSC预处理后PLS模型对预测集油样进行了预测, 表明两个PLS模型都能够得到较好的预测效果; 其中特征波长选择的PLS模型的预测能力更优, 具有更大的泛化能力。 本方法将有助于进一步尝试预测发动机油的其他化学成分, 以对发动机工作状态进行实时监测, 保障发动机的安全高效运行。

参考文献
[1] Al Sheikh Omar A, Motamen Salehi F, Farooq U, et al. Tribology International, 2021, 160(13): 107050. [本文引用:1]
[2] Kr Singh D, Kurien J, Villayamore A. Materials Today: Proceedings, 2021, 44: 3976. [本文引用:1]
[3] Zhou F, Yang K. IOP Conference Series. Materials Science and Engineering, 2021, 1043(5): 52054. [本文引用:1]
[4] Johns M L, Lisabeth K W. Measurement Science & Technology, 2016, 27(10): 105501. [本文引用:1]
[5] Abdulmunaim A M, Reuter M, Abdulmunem O M, et al. Transactions of the Asabe, 2016, 59: 795. [本文引用:1]
[6] Liu J, Han J, Zhang Y, et al. Spectrochimica Acta Part A: Molecular and Biomolecular Spectroscopy, 2018, 204: 33. [本文引用:1]
[7] Basati Z, Jamshidi B, Rasekh M, et al. Spectrochimica Acta Part A: Molecular and Biomolecular Spectroscopy, 2018, 203: 308. [本文引用:1]
[8] Liu C, Tang X, Yu T, et al. Optik, 2020, 224: 165694. [本文引用:2]
[9] Holland T, Abdul-Munaim A, Watson D, et al. Lubricants, 2019, 6(2): 35. [本文引用:1]
[10] CHEN Bin, LIU Ge(陈彬, 刘阁). High Voltage Engineering(高电压技术), 2020, 46(4): 1405. [本文引用:1]
[11] Holzki M, Fouckhardt H, Klotzbücher T. Sensors and Actuators A: Physical, 2012, 184: 93. [本文引用:1]
[12] CHEN Bin, LIU Ge(陈彬, 刘阁). Acta Photonica Sinica(光子学报), 2014, 43(2): 0230001-1. [本文引用:1]
[13] Rudnitskaya A, Rocha S M, Legin A, et al. Analytica Chimica Acta, 2010, 662(1): 82. [本文引用:1]