作者简介: 陈新岗, 1968年生, 重庆理工大学电气与电子工程学院教授 e-mail: chenxingang@cqut.edu.cn
油中特征气体(H2, CO, CO2, CH4, C2H4, C2H6, C2H2)的快速准确检测是变压器在线监测的重要环节。 激光拉曼光谱技术适用于特征气体的检测, 能克服传统在线监测的诸多不足。 在拉曼光谱
The rapid and accurate detection of characteristic gases(H2, CO, CO2, CH4, C2H4, C2H6, C2H2) in oil is an important part of transformer on-line monitoring. Laser Raman spectroscopy is suitable for the detection of characteristic gases and can overcome many shortcomings of traditional on-line monitoring. When the characteristic gas in transformer oil is detected, the characteristic peaks of methane (CH4) and ethane (C2H6) gather in the Raman spectrum from 2 900 to 3 300 cm-1. It is of great significance to study the mixed gases samples with different content ratios in this spectrum for the quantitative analysis of mixed gases in transformer oil. Based on the research of Raman spectroscopy detection of single characteristic gas, the spectral peak height, full-width at half-maximum and spectral peak area parameters of the characteristic peaks in the pretreated spectrum are selected as the characteristic factors to quantitatively analyze the mixed gas in the transformer oil. According to the second-order perturbation theory, there are four characteristic peaks in the methane Raman spectrum, and the selected spectrum contains two peaks with 3 111 and 3 284 cm-1 as the Raman shift center. Six characteristic peaks exist in the Raman spectra of ethane, and there are two peaks of 3 111 and 3 187 cm-1 in the selected spectral bands. In theory, the amount of both gases can be calculated by the information of the characteristic peak carried in the spectrum bands. Through the detection of Raman spectroscopy platform, the characteristic peaks of the mixed gas spectrum will produce translation and polymerization. In practice, four peaks with shifts center of 1 902, 2 918, 2 956 and 3 022 cm-1 were found in the spectrum. A Gaussian function model was established for the four mixed peaks, and the spectral peak height, full-width at half-maximum and spectral peak area of the characteristic peak was obtained. A partial least squares regression model (PLS) was established. The spectral peak height, full-width at half-maximum and spectral peak area were taken as independent variables, and the two gas contents were taken as dependent variables for calculation and analysis. When the potential factor of the model is taken to t6, the adjusted R-square is 0.993, indicating that the independent variable has a definite relationship with the dependent variable, and the regression model is reliable. The analysis of regression equation parameters shows that the full-width at half-maximum of spectral peaks contribute significantly to the area and height of spectral peaks, which is in line with the expected target. Four characteristic spectral peaks in the spectrum of mixed gases have an effect on both gases. It can be concluded from the experiments that for the methane-ethane mixed gas, at room temperature 25 ℃, integration time 15 s, integral number 2, slit 100 μm, by obtaining the peak height, peak area and full-width at half-maximum three parameters, the gas content can be accurately measured, which lays a foundation for the simultaneous detection of various characteristic gases in transformer oil.
电力变压器作为电能传输和电压转换的枢纽设备, 在电力系统网络中扮演着极其重要的角色, 因此对其进行故障监测具有重大意义。 其中, 油浸式电力变压器由其良好的散热、 绝缘性能和较大的传输容量在电力行业运用十分广泛。 当油浸式变压器内部出现过热或局部放电等故障时, 油中会分解产生以七种气体(H2, CO, CO2, CH4, C2H2, C2H4和C2H6)为主的特征气体[1], 通过对气体组分和含量的分析, 可以对变压器进行运行状态诊断以实现故障前缺陷修复和配合保护动作, 保障变压器的安全运行。
气相色谱法(gas chromatography, GC)是一种较为典型的油中特征气体检测方法, 能同时实现油中多种特征气体浓度的检测。 但是需要对样本进行较为复杂的预处理且色谱柱性能会随着时间的增长而下降, 使得其在变压器状态在线监测的应用上受到了限制[2]。 相比于气相色谱法, 拉曼光谱技术可以在无需预处理的情况下通过对少量样本的检测获取到可用的光谱数据, 对样本的无损检测使其在变压器运行状态在线诊断中具有极大的优势。 近年来, 已有学者对油中气体拉曼信息进行了研究, 确定了各种特征气体的谱峰归属[3], 但在多种气体混合频谱的分析上依旧存在许多困难。
本文基于变压器油中特征气体拉曼光谱检测实验平台, 完成了七种混合特征气体样本的光谱数据采集。 以全谱段中CH4和C2H6所在的部分谱段作为研究对象, 提出定点寻峰[4]的方法, 并结合多原子特征气体分子拉曼理论, 进行了光谱数据特征量提取研究。 考虑变压器油中特征气体含量小, 使用偏最小二乘法(partial least squares, PLS), 建立了以混合特征气体多种拉曼光谱特征量为基础的气体定量分析模型[5], 并验证了小测试样本数量下该模型气体定量分析的准确性和有效性。
变压器油中特征气体拉曼光谱检测实验平台如图1, 主要包括气路系统、 光路系统和数据存储系统。 气路系统中气体样品检测池由钢材料制成, 设有进行抽气、 排气和充气的三个口, 用于气体样本的有效载入; 光路系统主要由各透镜、 反射镜和滤波片组成, 用于形成检测光和散射光传递的通路; 数据存储系统中采用英国Andor公司Solis光谱分析软件实现光谱数据的简单存储和分析。 低噪声DPSS激光器(CoboltSambaTM100, 100 mW)产生波长为532 nm的单色激光通过载有气体样本的检测池, 在该处发生拉曼散射。 散射光信号进入光路系统通过背照式深耗尽型CCD探测器(Andor, DU416-LDC-DD)转换成电信号并在计算机中完成光谱数据的实时采集与存储。
为了避免高温引起过高的暗电流和阅读噪声以提高CCD探测器的灵敏度, 检测前将其内部工作温度降至零下60 ℃[6], 设计光路并在实验台上固定各器件位置。 恒定激光功率为30 mW, 实验室环境温度为25 ℃; 设置数据采集积分时间为15 s, 积分次数为2, 选择100 μm狭缝[7]; 每次检测前先进行洗气操作, 再将检测池通过真空泵抽成真空状态, 然后通过充气口充入配比好的气体样本, 最后再通过洗气操作完成检测池的上一次气体样本清理。
在同一环境和实验条件下, 记录每次充入样本后检测池的压强并完成样本的拉曼光谱实验数据测量。 样本检测池体积固定, 实验外部环境温度保持恒定, 根据理想气体状态方程
可知, 当理想气体体积V, 热力学温度T保持不变, R为理想气体常数, 气体的压强P与气体物质的量n成正比关系, 即实验过程中记录的检测池的压强与样本气体含量成正比关系, 关系式为
按照一定比例制备七种特征气体混合样本并充入真空状态下的检测池, 完成检测并获取得到混合气体拉曼光谱。 如图2所示, 七种混合特征气体拉曼光谱1 200~3 030 cm-1谱段范围内CO2, CH4, C2H4和C2H6都检测到两个可识别拉曼谱峰。 其中CH4和C2H6在2 900 cm-1频移附近位置出现谱峰重叠现象, 因此选取CH4和C2H6混合气体样本作为研究对象, 研究多种混合特征气体拉曼频移数据处理方法, 在混合特征气体拉曼频移测定中具有代表性。
基于二阶微扰理论(second-order moller-plesset perturbation theory, MP2)对七种特征气体分子进行结构建模优化和拉曼频率计算, 分析可知多原子特征气体分子具有多个不同的拉曼振动模式[8], 且不同模式对应不同拉曼频移并携带不同的物理信息。 CH4和C2H6基于MP2在6-31G(d)基组下的分子优化构型如图3。
CH4一共具有9种拉曼振动模式, 且其中4种振动模式具有拉曼活性[9]; C2H6具有18种振动模式, 6种振动模式具有拉曼活性, 其拉曼频率计算结果如表1。 结果为研究两种混合气体的拉曼振动特性特征谱峰的选取提供了理论依据。
选择纯度均为99.99%的CH4和C2H6气体, 在同一环境和实验条件下, 按不同含量比例制备混合气体样本并进行测量, 制备17组不同浓度的混合气体。 配制气体含量如表2。
![]() | 表1 CH4和C2H6的仿真计算结果 Table 1 Raman simulation results of CH4 and C2H6 |
![]() | 表2 甲烷乙烷配置表 Table 2 Configuration table of methane and ethane |
控制一种气体量不变, 另一种气体逐渐增加。 建模计算需选取四个特征谱峰中谱峰高度、 半高宽和谱峰面积多参量作为自变量, 为了避免气体含量计算模型发生局部最优解, 影响检测准确性, 至少12组气体作为训练样本; 设计两组单一气体, 既方便拉曼光谱预处理中基线的提取, 亦便于单一气体与混合气体光谱图的差异比较。 配置17组气体, 先以12组混合气体作为训练样本, 对建立的模型参数进行分析, 若模型评估不通过, 依次增加训练样本, 直至得到准确模型。
实际检测得到的两种单一气体的光谱图如图4, 两种单一气体的特征峰拉曼频移与仿真计算结果相差不大, 在建模计算时应以实际光谱图数据为准。
实验拉曼光谱中存在激光发射噪声和暗电流噪声等信号, 拉曼信号容易被噪声信号所淹没, 因此需要对所获得的拉曼光谱进行去噪处理, 以提高光谱的信噪比。 为了减小拉曼光谱数据在处理过程中小峰丢失和峰位位移的数据失真, 本文基于式(3)采用移动平滑的方法[10]进行去噪处理。
式(3)中, S为原始光谱, S'为平滑后的光谱, 2m+1为移动数据窗口(此处数据窗口设置为5); 采用宽度为2m+1的窗口沿着光谱数据方向移动, 每个窗口具有基数个数据点[11], 通过计算每个窗口中2m+1个点的数据平均值代替原中心点n位置处的数据值以实现去噪运算。
由于光谱中还存在荧光背景, 且拉曼检测装置在多次检测过程中, 光谱图的基线也会发生一定起伏[12], 因此还需要进行基线扣除。 根据文献[13]研究, 拉曼光谱数据图信息的提取主要集中在特征谱峰信息[14], 对光谱数据进行基线扣除操作过程中, 考虑的重点是将不同光谱图同一频移位置的谱峰位于同一基准。 不同混合比的气体光谱图中基线存在差异, 若对每张光谱图采用多项式取基线, 工作量大, 耗时多, 特征谱峰处基线差异明显。 本文分别将CH4和C2H6单一气体的拉曼光谱图基线作为基础, 对两基线求平均数, 得到混合气体的“中位线基线”。 混合气体光谱图中特征谱峰不是简单的两种气体光图谱叠加, 但使用“中位线基线”能有效地降低四个特征谱峰处的总体误差; 对于荧光背景的消除效果良好; 测试仪器问题而产生的基线漂移得到良好消除。 得到两种单一气体基线以及取平均数得到的最终基线如图5。
预处理后混合气体实验拉曼光谱如图6, 一种颜色代表一组混合气体, 经过预处理后的光谱图差异集中在四个特征谱峰上, 达到预期效果。
针对拉曼光谱图特性, 本文以测量数据为依据, 基于Matlab设计了定位寻峰程序。 针对研究气体样本提取参考频移±100 cm-1范围内光谱数据进行强度比较[15], 选取与气体样本理论拉曼频移数目相同的多个拉曼频移与文献中的参考频移进行比较, 通过相对位置和偏差率判断出CH4和C2H6混合拉曼光谱中2 902, 2 918, 2 956和3 022 cm-1四个谱峰归属。
光谱图中每个谱峰都具有明确的物理意义且携带不同的物理信息, 且考虑量子力学修正可知拉曼散射强度与样品单位体积内的散射分子数(样品浓度)成正比。 采用式(4)中高斯函数[16]作为基本形式对定位的四个谱峰进行分峰拟合, 并用高斯参量表达各不同频移位置处谱峰的面积、 半高宽和峰高等参数。
式(4)中, y为拉曼散射强度; x为拉曼频移; A为拉曼谱峰高度; xc为谱峰中心偏移量; FWHM为谱峰半高宽。 拟合相关系数R2为0.9851, 表明得到了较好的拟合结果。 得到全部特征量参数如表3。
![]() | 表3 混合谱图高斯分峰拟合特征参数 Table 3 Gauss peak separation fitting characteristic parameters of mixed spectrum |
由此, 针对每组CH4和C2H6混合气体, 选取四个特征峰, 每个峰选取中心频移、 谱峰面积、 半高宽、 峰高四个参量, 作为下一步定量分析的基础。
考虑选取的自变量为谱峰高度、 半高宽及谱峰面积, 以要得到的两种气体含量为因变量。 在单一气体定量分析的研究中, 已经确定谱峰高度、 半高宽及谱峰面积与气体含量相关性较强, 目的是求出回归方程各参数, 因此归纳为建立一个多参量二输出的回归数学模型。
考虑到实验选取谱段中每组预测样本自变量个数以及对应两个因变量, 电气在线监测要求快速准确, 且传统回归建模分析计算比较复杂, 不适用于多种特征气体混合频谱数据的分析, 因此本文采用偏最小二乘法(PLS)建立预测模型。 PLS是一种简单的多元校正建模方法, 建模分析过程中融合了主成分分析、 典型相关分析和线性回归分析等方法, 具有更好的鲁棒性和预测稳定性。
针对拉曼光谱数据特点, 建立偏最小二乘法回归模型的步骤如下:
(1)数据标准化。
(2)求第一对主成分。 自变量X与因变量Y的主成分分别为t1和u1, 要求主成分包含原数据含尽量多的信息, 同时t1对u1具有最大解释能力, 即: ①t1与u1方差最大; ②t1与u1相关程度最大。 由
可知, 当协方差(Cov(X, Y))最大时, 即可满足两个条件。 式中Cov(X, Y)表示X与Y的相关系数, Var(X)表示X的方差。
(3)建立X0, Y0对t1和u1的三个回归方程, 如式(6)
式(6)中回归系数向量是
式(7)中, X1, Y'1, Y1分别是三个回归方程的残差矩阵。
(4)继续求主成分, 直到满足设定条件
将残差矩阵X1和Y1替代X0和Y0, 求更多主成分ti以及ui, 如式(8)
(5)推导回归表达式
若X0的秩为A, 可以得出
即
式(10), YAK为残差矩阵YA的第k列。 回归方程得以求出。
(6)检验有效性
从17组气体样本中选取12组作为预测样本, 其余5组作为检验样本, 建立计算气体含量的偏最小二乘法模型。 实验发现, 如表4所示, 取到6个潜在因子时调整后的拟合优度R2已经达到0.993, 即使再增加潜在因子对拟合效果影响微小, 同时会让模型更加复杂, 因此t=6时较为适合。
![]() | 表4 潜在因子解释的方差比例 Table 4 Explained variance ratio of potential factors |
取拉曼光谱图中谱峰高度、 半高宽和谱峰面积作为自变量, 建立偏最小二乘数学回归模型, 得到的回归方程参数如表5。
![]() | 表5 回归方程参数 Table 5 Regression equation parameters |
由表5分析可知, 在此算法中, 谱峰半高宽参数在回归方程中是其他参数的104~106倍, 表明半高宽对两种气体的含量预测结果有明显影响, 谱峰面积以及谱峰高度对气体含量的预测有影响, 精确度不及谱峰半高宽。 混合气体实验中, 激光拉曼光谱图的基线去除会影响谱峰面积以及谱峰高度, 难以得到理论上正确的谱峰高度以及谱峰面积, 所以使用理论公式计算气体含量误差较大, 偏最小二乘法刚好回避这一问题。
回归方程参数中四个谱峰的半高宽均贡献明显, 表明甲烷含量预测取决于四个谱峰信息, 这与纯甲烷拉曼测量时表现出了不同的特性, 说明混合气体测量时不是简单的重叠相加, 也侧面论证了混合气体定量计算时需要算法的需求; 乙烷的主要影响因素是峰1、 峰2和峰4的半高宽, 同样说明对乙烷预测含量时不再是仅仅考虑理论上两个谱峰。
得到预测结果如表6。 表6的测试结果及误差显示, 误差大体上随气体含量增大而减小, 平均相对误差(average relative error, ARE)为2.25%。 两种气体的真实值和实测值拟合如图7所示, 模型对不同气体量的实测值没有交叉及重叠, 实测值与真实值的误差均保持在3%以内, 表明基于偏最小二乘法(PLS)回归分析对变压器油中此两种特征气体量的定量分析模型具有极高的准确率。
![]() | 表6 测试结果对比 Table 6 Comparison of test results |
![]() | 图7 甲烷和乙烷含量真实值与实测值对比 (a): 甲烷; (b): 乙烷Fig.7 Comparison of real and measured methane and ethane contents (a): Methane; (b): Ethane |
该方法仅采用12组混合气体数据作为训练量, 能够得到误差在3%的测试结果, 表明了选取拉曼光谱图中谱峰高度、 半高宽以及谱峰面积为参量, 建立偏最小二乘回归模型对拉曼光谱中变压器油中特征气体的定量分析检测具有明显优势。 取样数据少, 模型计算不复杂, 检测精度高, 效果良好。
(1)对变压器油中特征气体拉曼光谱图预处理时, 采用“移动平滑去噪和中位线去基线”效果良好, 得到的拉曼光谱图特征谱峰明显, 便于气体定量计算。
(2)通过高斯拟合对拉曼光谱特征峰的谱峰高度、 半高宽以及谱峰面积进行提取, 建立偏最小二乘法回归模型, 分析气体含量, 调整后的拟合优度R2为0.993, 拟合效果良好, 方法可行。
(3)在室温25 ℃, 积分时间15 s, 积分次数2, 狭缝100 μm条件下, 选取半高宽、 谱峰面积和谱峰高度, 使用偏最小二乘法对变压器特征气体甲烷乙烷进行定量, 平均相对误差为2.25%。
基于半高宽、 谱峰面积和谱峰高度的多参量激光拉曼光谱研究, 为变压器油中特征气体的快速在线检测提供了思路。
[1] |
|
[2] |
|
[3] |
|
[4] |
|
[5] |
|
[6] |
|
[7] |
|
[8] |
|
[9] |
|
[10] |
|
[11] |
|
[12] |
|
[13] |
|
[14] |
|
[15] |
|
[16] |
|