中红外光谱的HFC水分含量和粘度测量
余良武1,2, 刘东风1,2,*, 陈聪3, 房友龙1,2
1. 海军工程大学青岛油液检测分析中心, 山东 青岛 266012
2. 海军工程大学动力工程学院, 湖北 武汉 430033
3. 海军工程大学理学院, 湖北 武汉 430033
*通讯联系人 e-mail: Zhikongshi@163.com

作者简介: 余良武, 1988年生, 海军工程大学博士研究生 e-mail: yuliangwu7215@163.com

摘要

针对水-乙二醇抗燃液压液(HFC)目前常用的水分含量和粘度测量方法存在操作复杂, 耗时长, 测量成本较高等问题, 研究了将中红外光谱分析法应用于HFC水分含量和粘度测量。 以85个实际在用油样为样本集, 采用传统的电量法和毛细管法分别测量水分含量和运动粘度; 使用衰减全反射液体池(ATR)采集各样本的中红外光谱并进行光谱校正、 背景扣除、 Savitzky-Golay(SG)平滑处理和基线校正等预处理。 水分含量测量模型构建过程中, 利用学生化残差-杠杆值法寻找强影响点, 判定为异常样本并加以剔除; 利用马氏距离SPXY法划分建模样本集和验证样本集。 根据Beer-Lambert定律, 水分含量和红外光谱吸光度成正比, 采用线性方法来构建水分含量和吸光度红外光谱之间的关系模型。 同时为提高模型的鲁棒性和泛化能力需要消除光谱中的无用信息、 冗余信息和噪声, 因此采用后向间隔偏最小二乘法(BiPLS)进行水分含量测量特征谱区优选, 并建立线性校正分析模型。 结果表明剩余3 526~3 354, 1 790~1 618, 3 005~2 660和1 096~924 cm-1波段时获得最小的交叉验证均方根误差(RMSECV)。 特征波段优选结果可以理解为, 根据3 526~3 354 cm-1波段预测HFC体系中所有OH的量, 减去根据3 005~2 660和1 096~924 cm-1波段换算得到的乙二醇中的OH, 进而计算得到水分含量, 为进一步提高精度, 将水中OH变角振动吸收峰对应的1 790~1 618 cm-1波段作为水分含量测量的辅助波段。 利用独立验证样本进行模型检验, 结果表明所建立的线性模型相关系数( r)为0.989 5, 预测均方根误差(RMSEP)为0.405 2, 满足HFC中水分含量测量精度需求。 粘度测量模型构建过程中, 利用马氏距离法寻找离群样本, 判定为异常样本并加以剔除, 利用马氏距离SPXY法进行建模样本集和验证样本集划分。 粘度是一个与多重因素有复杂关系的理化指标, 和红外光谱之间表现为非线性关系。 基于主成分分析结合BP神经网络法(PCA-BPNN)构建非线性粘度校正分析模型, 提取累积贡献率为95.12%的前10个主成分作为输入, 测得的粘度值为输出, 创建单隐层BP神经网络并进行训练, 训练结果相关系数 r为0.996 8。 利用独立验证样本进行模型检验, 结果表明所建立的非线性模型 r为0.984 3, RMSEP为0.615 1, 满足HFC粘度测量精度需求, 且优于采用BiPLS线性模型获得的结果。 确定了可用于HFC中水分含量测量的四个中红外波段, 可为窄带红外光谱分析法或其他类似研究提供依据。 研究结果表明中红外光谱分析法结合BiPLS和PCA-BPNN分析法可分别应用于HFC水分含量和粘度测量, 精度符合监测需求, 为HFC中分含量和粘度测量提供了一种新的测试方法, 相比于传统测量方法具有快速、 无损、 低成本的特点。

关键词: 水-乙二醇抗燃液压液; 中红外光谱; 水分含量; 粘度; 后向间隔偏最小二乘; 神经网络
中图分类号:TE626.3 文献标志码:A
Measurement of Moisture Content and Viscosity of HFC Based on Mid Infrared Spectroscopy
YU Liang-wu1,2, LIU Dong-feng1,2,*, CHEN Cong3, FANG You-long1,2
1. Qingdao Oil Detection & Analysis Center, Naval University of Engineering, Qingdao 266012, China;
2. Power Engineering College, Naval University of Engineering, Wuhan 430033, China
3. College of Science, Naval University of Engineering, Wuhan 430033, China
Abstract

For water glycol fire-resistant hydraulic fluids (HFC), the commonly used methods for measuring the moisture content and viscosity present problems such as complicated operation, long time-consuming, high measurement cost, etc. The application of mid-infrared spectroscopy to HFC moisture content and viscosity measurement was studied. The sample set consisted of 85 actual in-use oil samples. The moisture content and kinematic viscosity were measured by traditional coulometric method and capillary method. The mid-infrared spectra of samples was collected using an ATR liquid pool. Spectra pretreatments such as spectra correction, background subtraction, Savitzky-Golay (SG) smoothing and baseline correction were performed. During the process of constructing the moisture content measurement model, strong influence points were searched by student residuals-leverage method, which were determined as abnormal samples and removed. Mahalanobis distance SPXY method was used to divide the sample set into modeled samples and verification samples. According to the Beer-Lambert law, the moisture content was directly proportional to the infrared absorbance. So a linear method should be used to construct the relationship between the moisture content and the infrared absorbance. At the same time, the no information variables, redundant information and noise in the spectrum need to be eliminated to improve the model robustness and generalization ability. By the backward interval partial least squares method (BiPLS), the moisture content measurement feature bands were optimized, and a linear calibration analysis model was established. The results showed that the minimum root mean square error of cross validation (RMSECV) was obtained when the bands of 3 526~3 354, 1 790~1 618, 3 005~2 660 and 1 096~924 cm-1 remained. The preferred feature bands can be explained as that, and the OH amount in moisture was calculated by subtracting the OH amount in ethylene glycol converted by the 3 005~2 660 and 1 096~924 cm-1 bands from the all OH amount in the HFC system converted by the 3 526~3 354 cm-1 band, and then the moisture content was calculated. In order to improve the accuracy, the 1 790~1 618 cm-1 band, corresponding to the moisture OH swing vibration absorption peak, was used as an auxiliary wave for measuring the moisture content. The independent verification samples were used to test the model. The results showed that the correlation coefficient ( r) of the established linear model was 0.989 5 and the root mean square error of prediction (RMSEP) was 0.405 2, which met the accuracy requirement for moisture content measurement in HFC. During the process of constructing the viscosity measurement model, the outlier samples were searched by Mahalanobis distance method, which were determined as abnormal samples and removed. Mahalanobis distance SPXY method was used to divide the sample set into modeled samples and verification samples. Viscosity was a physicochemical index that had complex relationships with multiple factors, and was nonlinear to the infrared spectrum. Based on principal component analysis combined with BP neural network method (PCA-BPNN), a nonlinear viscosity correction analysis model was established. The first 10 principal components with a cumulative contribution rate of 95.12% were extracted as input, and the measured viscosity values were treated as output. A single hidden layer BP neural network was created and trained. The training result correlation coefficient r was 0.996 8. The independent verification samples were used to test the model. The results showed that the r of the established nonlinear model was 0.984 3 and the RMSEP was 0.615 1, which met the accuracy requirement for HFC viscosity measurement and were superior to the ones obtained by the BiPLS linear model. Four mid-infrared bands were identified and can be used for moisture content measurement in HFC, which could provide basis for narrowband infrared spectroscopy or other similar studies. The research results showed that the mid-infrared spectroscopy combined with BiPLS and PCA-BPNN analysis method can be applied to the measurement of moisture content and viscosity of HFC, and the accuracy meets the monitoring requirements. Compared with the traditional measurement methods, a new test method is provided with the features of being fast, non-destructive and low-cost.

Keyword: Water glycol fire-resistant hydraulic fluids; Mid-infrared spectroscopy; Moisture content; Viscosity; Backward interval partial least squares; Neural network
引 言

水-乙二醇抗燃液压液(fire-resistant hydraulic fluid class C, HFC)具有良好的润滑性、 稳定性和抗燃性, 凭借优异的综合性能占据着国际抗燃液压液市场的主体地位, 广泛应用于冶金、 电力、 航空、 军事等领域。 水分含量和粘度是HFC最重要的两个指标, 直接影响其抗燃和润滑密封性能, 必须控制在合适范围之内, 是日常使用管理中的监测重点[1]。 目前, 行业内大多采用ISO12922: 2012(E)标准推荐的电量法和毛细管法测量HFC的水分含量和粘度[2], 操作复杂, 耗时长, 且需要消耗大量的实验试剂, 测量成本较高。 中红外光谱分析法利用基团的特征峰进行定性和定量分析, 具有快速、 无损、 成本低廉等特点[3], 是油基润滑油和液压油成分和性能分析的重要手段, 常用于油液酸碱值、 添加剂消耗、 燃油及水分污染的监测[4, 5], 也有部分专家将其应用于油液粘度和酸值等理化指标的监测, 取得了良好效果[6, 7]。 HFC属于水基液压油, 体系中存在大量氢键, 对各成分的特征峰有强烈干扰和覆盖。 关于中红外光谱分析法在HFC监测中应用的报道较少, 本研究将中红外光谱分析法应用于HFC的水分含量和粘度测量。

在中红外光谱分析中, 一般使用3 400 cm-1左右波段的吸收谱进行水分的定量分析, 该波段为OH的伸缩振动吸收峰, 是水分子最强烈的特征吸收峰[8]。 但是, 由于HFC中的另一个主要成分乙二醇及其同系物中同样存在大量OH, 会严重干扰分析结果。 为此, 利用后向间隔偏最小二乘法(backward interval partial least squares, BiPLS)进行波段优选, 寻找适合用于HFC中水分定量分析的波段, 建立校正模型, 并对模型精度进行检验。 不同于水分含量, 粘度是一个与多重因素有复杂关系的理化指标, 包括水分、 乙二醇、 增粘剂的含量、 油液氧化程度以及分子间的作用方式等, 因此粘度和红外光谱之间表现为非线性关系, 本研究采用主成分分析结合BP神经网络(principal component analysis-BP neural network, PCA-BPNN)的方法构建非线性校正模型, 并对模型精度进行检验。

1 实验部分
1.1 HFC样本水分含量和粘度测量

HFC样本来源于本单位日常检测分析工作中收集到的实际在用油样, 来自于多个不同类型的设备, 具有较强的代表性, 共计85个。 水分含量采用电量法, 利用卡尔费休仪测得[9]。 40 ℃运动粘度采用毛细管法, 利用全自动运动粘度测定仪测量[10]。 水分含量和粘度的测量结果统计数据如表1所示。

表1 水分含量和粘度的测量结果统计 Table 1 Statistics of measured moisture content and viscosity
1.2 HFC样本中红外光谱采集及预处理

HFC样本中红外光谱采集使用的是德国BRUKER公司的TENSOR27型红外光谱仪, 采用配套的OPUS软件完成。 光谱扫描范围为4 000~550 cm-1, 分辨率为4 cm-1, 扫描次数为16次, 液体池选用衰减全反射(atten-uated total refraction, ATR)液体池。

红外光在ATR中的穿透深度和波长有关, 在高频端和低频端相差近一个数量级, 因此, 要利用ATR做定量分析必须进行光谱校正[11]。 OPUS软件中设计有专门的ATR校正选项, 利用ATR校正命令自动完成校正。 为了去除空气中二氧化碳和水汽干扰, 进行了二氧化碳和水分背景扣除。 另外, 为了降低仪器噪声和基线漂移带来的误差, 进行了Savitzky-Golay(SG)平滑处理和基线校正。 经预处理后, 85个样本的中红外光谱图如图1所示。

图1 样本中红外光谱图Fig.1 Mid infrared spectra of samples

2 水分含量校正模型构建和检验

根据Beer-Lambert定律, 物质的浓度和吸光度成正比[12], 因此采用线性方法来构建水分含量和吸光度红外光谱之间的关系模型。 采集到的光谱中包含大量的无用信息变量、 冗余信息和噪声, 不但会增加模型运算的复杂性, 还会破坏模型鲁棒性和泛化能力, 因此有必要进行特征光谱优选。 利用BiPLS进行特征光谱优选并建立线性模型, 另外还研究了异常样本剔除和样本集划分问题。

2.1 基于学生化残差-杠杆值的异常样本剔除

光谱采集和指标测量过程中, 由于仪器、 环境或者人为因素的影响, 很可能会产生数据异常样本, 异常样本对模型的精度有严重干扰, 必须将其剔除。 以所有采集到的HFC水分含量和光谱数据为校正集, 建立全光谱偏最小二乘(partial least squares, PLS)模型, 计算各样本的预测残差和杠杆值, 绘制杠杆值-残差图如图2所示。 从图中可以看出, 编号为10, 40和85的三个样本同时具有较高的杠杆值和残差, 为强影响点, 判断这三点为异常样本点, 并将其剔除。

图2 杠杆值-学生化残差图Fig.2 Leverage-student residuals rendering

2.2 基于马氏距离SPXY法的水分含量建模样本和验证样本划分

马氏距离SPXY样本点选取方法的基本原理与经典Kennard-Stone(KS)法大致相同, 采用“ 近中求远” 的思想, 确保所选择的样本在样本空间中尽量均匀分布。 不同的是SPXY法在计算pq两个样本之间马氏距离dxy(p, q)过程中同时考虑了光谱主成分和测量指标的影响, 更加符合样本空间的实际特点。 经计算, 选出62个样本作为建模样本, 剩余20个样本作为验证样本。 以前两个主成分PC1和PC2和水分含量为三维坐标, 样本分布如图3所示, 从图中可以看出, 选出的建模样本和验证样本分布均匀。

图3 水分含量建模样本和验证样本分布Fig.3 Distribution of moisture content modeling and validation samples

2.3 基于BiPLS的水分含量校正模型构建和检验

PLS是多元线性回归分析、 典型相关分析和主成分分析的有机综合, 通过潜变量提取能够有效解决变量间的多重相关问题[13]。 BiPLS是在PLS的基础上发展而来的变量优选方法, 应用于红外光谱分析中时, 首先将全光谱等分为N个区间, 依次剔除其中1个区间, 建立N个PLS模型, 比较各模型的交叉验证均方根误差(root mean square error of cross validation, RMSECV), 选择最小RMSECV对应的谱区, 重复进行上述步骤, 直到剩下最后一个区间[14]。 本研究中N取20, 代入所选出的62个建模样本进行计算, 区间剔除情况如表2所示, 从表中可以看出, 当剩余区间为18, 7, 4, 8, 14时获得最小的RMSECV为0.013 0。

表2 BiPLS光谱区间剔除情况 Table 2 Rejection results of spectral waveband interval by BiPLS

所选出的红外特征波段如图4所示, 区间4对应的3 526~3 354 cm-1波段为水和乙二醇及其同系物中OH的伸缩振动吸收峰; 区间14对应的1 790~1 618 cm-1波段为水中OH的变角振动吸收峰; 区间7和区间8对应的3 005~2 660 cm-1波段为乙二醇中CH2的对称和反对称伸缩振动吸收峰; 区间18对应的1 096~924 cm-1波段为乙二醇中COH的伸缩振动吸收峰。 特征波段优选结果可以理解为, 根据区间4预测HFC体系中所有OH的量, 减去根据区间7, 8和18换算得到的乙二醇中的OH, 进而计算得到水分含量。 为进一步提高精度, 将吸收强度较弱的区间14作为水分含量测量的辅助波段。 利用剩余20个独立验证样本进行模型检验, 检验结果如图5所示, 相关系数r为0.989 5, 预测均方根误差(root mean square error of prediction, RMSEP)为0.405 2, 满足HFC水分日常监测精度需求。

图4 水分含量测量红外特征波段优选结果Fig.4 Infrared characteristic band selected for moisture content measurement

图5 水分含量校正模型检验结果Fig.5 Test results of moisture content correction model

3 粘度校正模型构建和检验

粘度和红外光谱之间表现为非线性关系, 因此采用主成分分析结合BP神经网络(PCA-BPNN)的方法构建非线性校正模型, 并对模型精度进行检验。 同样也研究了粘度异常样本剔除和样本集划分问题。

3.1 粘度光谱数据主成分提取和基于马氏距离法的异常样本剔除

为降低信息冗余去除数据噪声, 简化模型运算, 利用主成分分析法提取线性无关的光谱主成分。 将全体85个粘度光谱数据代入计算, 提取了累积贡献率大于95%的前10个主成分。 由于杠杆值是在线性模型前提下定义的统计量, 无法应用于非线性模型, 本研究中以提取的主成分和粘度测量值为坐标, 采用马氏距离法剔除粘度数据中的异常样本。 马氏距离为相关性距离, 相比于欧式距离具有不受指标变异和量纲影响的特点[15]。 样本与平均样本的马氏距离分布如图6所示, 从图中可以看出序号为39和85的样本明显离群, 判定为异常样本。 剔除异常样本后重新进行主成分分析, 所提取的主成分贡献率和累积贡献率如图7所示, 前10个主成分的累积贡献率为95.12%, 能够反映光谱的绝大部分信息。

图6 样本与平均样本的马氏距离分布情况Fig.6 Mahalanobis distance distribution between samples and average sample

图7 提取主成分贡献率和累积贡献率Fig.7 Contribution rates and cumulative contribution rates of extracted principal components

3.2 基于马氏距离SPXY法的粘度建模样本和验证样本划分

同样采用马氏距离SPXY法对粘度建模样本和验证样本进行划分, 选出63个样本作为建模样本, 剩余20个样本作为验证样本。 以前两个主成分PC1和PC2和粘度值为三维坐标, 样本分布如图8所示, 从图中可以看出, 选出的建模样本和验证样本分布均匀。

图8 粘度建模样本和验证样本分布Fig.8 Distribution of viscosity modeling and validation samples

3.3 基于PCA-BPNN的粘度校正模型构建和检验

将选出的63个建模样本作为训练样本, 以提取的10个光谱主成分为输入, 测得粘度值为输出, 创建单隐层BPNN, 反复调整参数设置, 以提高网络预测精度, 最终网络各主要参数设置如表3所示。

表3 BPNN主要参数设置 Table 3 Main parameters of BPNN

BPNN训练结果相关系数r为0.996 8。 利用剩余20个独立验证样本进行模型检验, 检验结果如图9(a)所示, r为0.984 3, RMSEP为0.615 1, 满足HFC粘度日常监测精度需求。 还尝试了使用BiPLS法构建粘度校正模型, 模型检验结果如图9(b)所示, r为0.894 7, RMSEP为1.530 8, 精度明显低于PCA-BPNN模型。

图9 粘度校正模型检验结果
(a): 粘度PCA-BPNN模型; (b): 粘度BiPLS模型
Fig.9 Test results of viscosity correction model
(a): PCA-BPNN; (b): BiPLS

4 结 论

利用中红外光谱法测量HFC的水分含量和粘度。 利用BiPLS法进行水分含量测量特征波段优选和模型构建, 结果表明利用3 526~3 354, 1 790~1 618, 3 005~2 660和1 096~924 cm-1波段建立HFC中水分含量校正模型可有效排除乙二醇及其同系物的干扰, 所建立的线性模型相关系数(r)为0.989 5, 预测均方根误差(RMSEP)为0.405 2, 满足HFC中水分含量测量精度需求。 基于PCA-BPNN法构建HFC粘度校正模型, 结果表明所建立非线性模型的r为0.984 3, RMSEP为0.615 1, 满足HFC粘度测量精度需求, 且优于采用BiPLS法构建的线性模型。 利用中红外光谱法结合BiPLS和PCA-BPNN分析法测量HFC的水分含量和粘度具有可行性, 且测量精度满足监测需求。

The authors have declared that no competing interests exist.

参考文献
[1] Siddhartha A. Die Casting Engineer, 2012, 6(2): 38. [本文引用:1]
[2] International Organization for Stand ardization. ISO 12922: 2012(E), Lubricants, industrial oils and related products (class L)—Family H (Hydraulic systems)—Specifications for hydraulic fluids in categories HFAE, HFAS, HFB, HFC, HFDR and HFDU, 2012. [本文引用:1]
[3] Haas J, Mizaikoff B. Annual Review of Chemistry, 2016, 9(1): 45. [本文引用:1]
[4] YANG Kun, WU Tong, ZOU Mao, et al(杨琨, 吴桐, 邹毛, ). Spectroscopy and Spectral Analysis(光谱学与光谱分析), 2017, 37(2): 452. [本文引用:1]
[5] International Organization for Stand ardization. ASTM E2412: 2010Stand ard Practice for Condition Monitoring of In-Service Lubricants by Trend Analysis Using Fourier Transform Infrared (FT-IR) Spectrometry, 2010. [本文引用:1]
[6] ZENG Jin, QIU Zhen-hui, JIANG Xu-feng, et al(曾金, 邱贞慧, 姜旭峰, ). Lubrication Engineering(润滑与密封), 2014, 39(9): 100. [本文引用:1]
[7] MA Lan-zhi, GUAN Liang, TIAN Song-bai, et al(马兰芝, 管亮, 田松柏, ). Lubrication Engineering(润滑与密封), 2012, 37(5): 95. [本文引用:1]
[8] YE Yu-tang, LIU Shuang(叶玉堂, 刘爽). Infrared and Low Light Level Technology(红外与微光技术). Beijing: National Defend Industry Press(北京: 国防工业出版社), 2010. [本文引用:1]
[9] International Organization for Stand ardization. BS ISO 6296: 2003, Methods of Test for Petroleum and Its Products-Petroleum Product-Determination of Water-Potentiometric Karl Fischer Titration Method, 2003. [本文引用:1]
[10] International Organization for Stand ardization. NEN ISO 3105: 2007, Glass Capillary Kinematic Viscometers-Specifications and Operating Instructions, 2007. [本文引用:1]
[11] Millan-Oropeza A, Rebois R, David M, et al. Applied Spectroscopy, 2017, 71(10): 2344. [本文引用:1]
[12] Aksoy C, Severcan F. Spectroscopy, 2012, 27(27): 167. [本文引用:1]
[13] Haghi R K, Yang J, Tohidi B. Energy & Fuels, 2017, 25(7): 113. [本文引用:1]
[14] Ruschel C, Huang C, Samios D, et al. Journal of the American Oil Chemists Society, 2015, 92(3): 309. [本文引用:1]
[15] Brereton R G. Journal of Chemometrics, 2015, 29(3): 143. [本文引用:1]