作者简介: 俞沁怡, 2000年生,中国科学技术大学与中国科学院合肥物质科学研究院联合培养博士研究生 e-mail: qyyu@aiofm.ac.cn
基于朗伯-比尔定律的气体吸收光谱技术被广泛运用于各类污染气体的排放检测研究中, 然而在进行高浓度气体测量时, 由于设备局限性、 气体饱和吸收等因素影响, 光谱吸光度与浓度间出现的非线性偏移将使待测气体浓度的测量结果出现严重偏差。 利用待测光谱与标准光谱间的线性信号相关性反映两者浓度间的关系, 提出对差分光密度谱间线性相关系数K值进行极大似然估计(K-MLE)来实现宽浓度范围内的气体浓度反演。 基于移动区间法计算了气体吸收波段内不同波长处、 不同区间大小内的线性相关系数, 对相关系数集合进行区间估计后分段构建似然函数并求解最佳系数估计值, 能够有效避免因信号扰动等问题引起的测量结果波动, 最终结合浓度阈值与补偿方程实现宽范围内浓度反演。 以对二氧化硫(SO2)气体的浓度检测为例, 对不同浓度气体样品获得的30组光谱信号数据进行处理, 用30组浓度均值的相对误差表征反演方法的准确性, 用浓度测量值的标准差衡量反演方法的稳定性。 在相同的低浓度条件下, 宽带法、 窄带法和K-MLE法计算得出的反演浓度均值误差分别为6.14%、 22.13%和0.11%, 在保证结果较好稳定性的前提下, K-MLE法实现了最佳测量精度; 在0~508 μL·L-1的宽浓度范围内, K-MLE法浓度反演结果最大均值误差为0.98%, 最大标准差为1.25, 反演效果明显优于其他两种经典方法。 结果表明, K-MLE法提供了一种有效的非线性偏移补偿方法, 能够准确且稳定地实现宽浓度范围内的气体浓度反演。
The gas absorption spectroscopy technique, based on the Lambert-Beer Law, is extensively employed for the detection of various pollutant gases. However, challenges arise due to the limitations of devices, the saturation absorption of gases, and other interfering factors. When measuring gases at high concentrations, these issues create a nonlinear relationship between absorbance and concentration, resulting in significant deviations in gas detection across a wide concentration range.In this paper, we leverage the linear signal correlation between the measured spectra and reference spectra to reflect the relationship between the concentrations of the two. We propose employing Maximum Likelihood Estimation (MLE) to determine the linear correlation coefficient K between spectra signals, facilitating the inversion of gas concentrationsover a wide concentration range.To determine the linear correlation coefficients across variable spectral intervals in the gas absorption band, we implement a moving internal algorithm with adjustable parameters. The interval-wise statistical inference is carried out on the set of correlation coefficients, and optimal parameter estimators, K-values, are derived by constructing a piecewise likelihood function. This approach effectively mitigates fluctuations in measurement results caused by signal perturbation.Ultimately, gas concentration inversion across a wide concentration range is achieved through a combination of concentration threshold and compensation equation. Using sulfur dioxide (SO2) gas concentration detection as a case study, we process thirty sets of spectral datasets acquired under each predetermined concentration condition. The accuracy of the concentration inversion methodologywas quantified through the relative error of the mean concentrations calculated from thirty replicate measurements. At the same time,its stability wasevaluatedusing the standard deviation of the concentration values. Under identical low-concentration conditions, the broadband method, narrowband method, and K-MLE algorithm demonstrated mean retrieved concentration errors of 6.14%, 22.13%, and 0.11% respectively. Under the premise of ensuring the stability of the results, the K-MLE algorithm achieved superior measurement accuracy. Furthermore, across a wide concentration range of 0~508 μL·L-1, the maximum mean error for concentration inversion of the K-MLE method is only 0.98%, with a maximum standard deviation of 1.25, outperforming the other two conventional methods. The results demonstrate that the K-MLE method offers an effective approach for nonlinear offset compensation, enabling accurate and stable gas concentration inversion across a wide range of concentrations.
污染气体的排放与泄漏问题与人类身体健康和自然环境质量息息相关[1, 2]。 近年来, 各类光学气体检测技术研究得到了大力发展[3], 其中, 紫外差分吸收光谱技术(ultraviolet differential absorption spectrum, UV-DOAS)因其可靠性高、 精度高、 选择性强、 抗干扰性强等优点, 成为检测SO2、 NO2、 NO、 NH3等污染气体最常用的技术之一, 具有广泛的应用前景[4, 5, 6]。
朗伯-比尔(Lambert-Beer)定律是各光学气体浓度检测技术的基本原理[7], 然而实际应用场景并不理想: 光谱仪所配置的滤光片无法完全去除因衍射效应产生的高阶次光[8]; 气池内可能发生光散射和光化学现象[9], 或因密度梯度、 气流状态不稳定出现待测气体分布不均匀现象; 高浓度气体条件下会发生吸收饱和现象, 杂散光在透射光中占比过高, 造成光谱吸光度与浓度间出现非线性偏移, 导致测量结果难以校准、 测量灵敏度和精度降低、 浓度测量范围受限等一系列问题[10]。 为避免浓度反演中发生非线性偏移, Zhu等提出可以通过缩短样品池长度或采用稀释法降低光路中的样品浓度[11]; Tolbin等为确定待测物质的稀释度, 将实际情况中吸光度与浓度的依赖关系近似为分段连续函数, 通过多次求导计算不连续点处的阈值浓度[12, 13]; Abitan等认为朗伯-比尔定律失效的原因是忽略了高光子通量下受激辐射和自发辐射的过程, 提出使用Lambert-W函数描述复杂能级结构的光学介质吸收现象[14]; Peng等使用多项式拟合法构建反演浓度与标准浓度之间的修正模型, NO气体与SO2气体的满量程误差分别为2.31%与1.89%[15]。
光谱信号中携带有物质浓度信息, 对不同浓度条件下测得的光谱信号进行相关分析, 可间接确定浓度值间的关系, 实现气体浓度反演。 信号相关分析方法常实践于通信系统、 雷达系统中, 用于衡量信号间的相似或相依性[16, 17]。 本工作将统计学中的参数估计方法应用于计算最佳线性相关系数Kbest。 参数估计主要指点估计和区间估计[18], 其中, 利用区间估计可以在置信区间范围内考虑未知参数的分布和不确定性[19], 点估计中的极大似然方法是一种概率模型参数估计算法, 指利用已知的样本结果来计算最大概率导致这样结果的参数值[20]。
为应对基于UV-DOAS技术进行气体浓度检测过程中的非线性偏移, 本工作提出了一种对光谱间线性相关系数进行极大似然估计(maximum likelihood estimation of K, K-MLE)后补偿以实现浓度反演的方法。 基于移动区间法计算了光谱信号在不同波段处、 不同区间长度内与标准光谱间的线性相关系数K值, 利用统计学中的区间估计及点估计方法, 研究了通过求解似然函数极值点得到最佳估计K值的方法, 最终实现了宽浓度范围内的高精度反演。 以浓度范围为0~508 μ L· L-1的SO2气体在200~226 nm波段范围内的光谱信号作为研究对象, 在各浓度条件下, K-MLE法与宽带法、 窄带法相比, 其反演结果具有良好的精确度和稳定性。
当一束波长为λ的单色激光穿过有吸收特性的待测气体时, 其透射光强变化可以使用朗伯-比尔定律来确定, 如式(1)所示。 其中, I(λ)是光谱仪所测得的光强, I0(λ)是光源出射光照射到被测气体的光强, σ(λ)为待测气体在波长λ处的吸收截面, 单位为cm2· molecule-1, c是待测气体浓度, 单位为molecule· cm-3, L(cm)是测量光通过的光程。
在DOAS系统中, 常需要考虑如瑞利(Rayleigh)散射和米氏(Mie)散射等对光强造成额外衰减的因素, 因此在式的基础上增加散射衰减因子ε(λ), 如式(2)所示
基于此定义光密度OD(λ), 如式(3)
在散射衰减因子ε(λ)存在时, 气体吸收光谱的峰值和基线会因散射背景的叠加而发生显著变化, 因此在进行浓度反演前使用多项式拟合法将ε(λ)去除, 得到差分光密度DOD(λ), 将式(3)修正为式(4)
若某气体的吸收波段为[λs, λe], 在此区间内差分光密度的积分值
相同测量条件下, 若有一对应浓度为cstd的标准光谱Istd(λ), 另有一未知浓度cu的光谱Iu(λ), 那么这两个光谱之间有如式(6)的线性对应关系, 根据此线性关系可进行浓度反演(比例系数为Kex)
在实际测量中, 造成非线性偏移的原因非常复杂, 难以基于产生原理对Beer-Lambert定律进行修正[21]。
假设已知某气体的低浓度cstd对应的差分光密度标准谱DODstd(λ), 吸收波段范围为[λs, λe], 在相同环境条件下, 测得未知浓度cu同一气体的差分光密度谱为DODu(λ), 在吸收波段可用DODstd(λ)近似求得待测浓度的DODu(λ), 如式(7)所示
式(7)中, e(λ)为误差函数。 若在波段[λ x, λ y](∈ [λs, λe])内, 误差信号能量E取得极小值时, 可近似认为标准谱DODstd(λ)与未知谱DODu(λ)之间存在线性相关关系, 线性系数为K
实际测量中, 由于设备稳定性、 准确性限制以及各种噪声干扰, 待测浓度cu差分吸收光谱的不同吸收波段将计算得出不同的K值。 本文利用移动区间法遍历待测气体吸收波段内的光谱数据, 区间参数设置与长度、 位置计算如式(11)所示, 在总宽度为λall的[λs, λe]吸收波段范围内, 首先设置区间初始长度m0, 区间长度的增量为Δ m, 第j个区间长度为m, md为区间长度可增加次数, 设定区间移动步距为s, wd为全吸收波段内存在的区间数量, [ws, we]为其中第i个区间的左右边界波长值, 计算不同位置、 不同区间长度内相关系数K。 式(12)为第i个区间内Ki值计算公式
移动区间法的原理如图1所示。
为提高利用K值数据进行线性浓度反演的准确性, 同时扩大该方法适用的浓度范围, 本文提出对不同区间大小内的Ki值数据集合进行处理修正, 最终获得待测浓度反演所需Kex值的方法, 流程如图2所示, 分为四步: (1)筛选出待测谱中各不同区间长度下的K值集合[K1], [K2], …, [Kj], …, [Kmd]中95%置信区间内的所有元素Kn(n=1, 2, …, new), 组成新集合[Knew]; (2)基于极大似然估计法针对集合[Knew]中的元素构建似然函数L(Kn, Kb), 如式(13)所示, 该函数反映区间[
在进行待测浓度反演前, 需利用标准谱与标定谱确定线性相关系数阈值Kth与修正方程D(Kbest)。 其中, Kth与阈值浓度cth相关, 定义为Kth=cth/cstd; 修正方程D(Kbest)表示初步计算得出的线性系数最佳估计值Kbest与准确系数值Kex之间的偏差程度, 基于前文提到的K值计算与处理方法计算不同浓度条件的标定谱对应的Kbest, 当Kbest> Kth时, 拟合Kbest与Kex-Kbest间的关系, 定义为D(Kbest)。
综上, 提出的K-MLE法流程如图3所示: 首先对采集到的背景光谱、 标准光谱、 标定光谱以及待测光谱数据进行小波去噪以提高信噪比, 并进行去除背景谱、 去除ε(λ)等预处理, 基于移动区间法计算待测谱吸收波段内不同区间及位置处的线性相关系数K, 对K值进行多级处理并补偿后实现待测气体浓度反演。
基于差分吸收光谱的SO2气体浓度检测系统如图4所示, 该装置主要由光学系统、 电学系统和气路系统组成。 工作波段范围为185~2 000 nm的氙灯(Hamamatsu, L9456-01)发出的光束经焦距为2 cm的透镜准直为平行光, 通过光程长约20 cm、 体积为约90 mL的样品池, 样品池的两端有进气口和出气口, 以保证待测气体快速流通。 穿过样品池的透射光通过透镜聚光到光纤中, 耦合到分辨率为1.5 nm 的紫外光谱仪(Ocean Optics USB4000), 再连接到MCU (FriendlyARM, Smart210)中进行数据处理和存储。 系统使用基于质量流量计(Sevenstar Electronics, CS100)的气体配比模块, 相对偏差为1%。 实验中不同浓度的SO2气体由南京特气有限公司出售的SO2(508 μ L· L-1)和N2(99.9%)标准气瓶提供, 不确定度2%, 气体流量控制在1 L· min-1。
整个实验在室温(25 ℃)和一个大气压(101.3 kPa)条件下进行。 光源预热5 min后开始实验, 向气池内充入氮气, 吹扫气池并采集信号作为背景谱, 随后向气池内通入多种体积占比不同的SO2气体, 每种浓度的光谱信号采集30次, 相邻两次采集间隔1 min, 每次保存光谱数据时通气状态保持10 min以上, 以保证气体已完全充满气池且形成稳定状态。
基于气体检测系统采集不同浓度气体的原始光谱信号, 如图5(a)所示。 对所有原始光谱进行相同参数(heursure阈值法、 软阈值函数、 3层分解层数、 sym8小波基)的小波滤噪(Wavelet domain denoising, WDD)后光谱信号如图5(b)所示, 其中508 μ L· L-1浓度条件下的光谱信噪比(SNR)在滤波后提高了14.96%; 基于前文所提到的差分吸收光谱原理, 得到SO2在200~226 nm 波段相应浓度下的差分光密度DOD(λ), 如图5(c)所示; 计算DOD(λ)在整个吸收波段内的积分值, 结果与对应的标准气体浓度的关系如图5(d)所示: 当气体浓度低于90 μ L· L-1时, DOD(λ)积分值与浓度呈良好的线性关系(线性斜率=0.170, R2=0.996), 符合线性测量需求, 将90 μ L· L-1确认为线性阈值浓度cth; 随着气体浓度升高, 吸光度增长速率减缓, 出现吸收饱和现象, DOD(λ)积分结果与浓度之间的线性关系逐渐偏离。
为确定待测气体的光谱数据在不同波段区间中的线性偏离程度, 将采集的30组浓度为40.64 μ L· L-1的光谱信号滤波后进行平均作为标准光谱, 即cstd=40.64 μ L· L-1, 线性相关系数阈值Kth=2.2, 对3种浓度条件下(50.8、 203.2和508 μ L· L-1)的差分吸收光谱数据进行线性相关系数计算分析。 基于前文提出的移动区间法计算K值, 在200~226 nm 的吸收波段中选取大小分别为1、 2、 5、 10 nm的区间, 区间移动步距s均设置为0.5 nm, 在区间移动过程中计算每个区间的Ki值。 图6为不同浓度的SO2吸收光谱数据在不同波长处、 不同大小区间中Ki值与准确值Kex(Kex=cu/cstd)之间的相对误差, 横坐标代表区间中心波长, 图中标注了Ki值在± 5%误差范围及95%置信区间内的分布情况。
![]() | 图6 不同浓度梯度下的K值分布 (a): c=50.8 μ L· L-1; (b): c=203.2 μ L· L-1; (c): c=508 μ L· L-1Fig.6 K-values at different concentrations (a): c=50.8 μ L· L-1; (b): c=203.2 μ L· L-1; (c): c=508 μ L· L-1 |
由图6可知, 相同浓度下Ki值的相对误差在不同波段范围内区别较大, 这表明气体在不同波段内的吸收特性与浓度间存在非线性关系。 50.8 μ L· L-1的浓度条件下, 64.5%的Ki值分布在± 5%的误差区间内, 区间长度较短时Ki值波动较大, 在所选吸收波段内, 1 nm区间对应的Ki值标准差(standard deviation, SD)为0.183, 均值误差为6.4%, 而10 nm区间内Ki值分布更集中, SD为0.019, 均值误差为1.6%, 结果表明当气体浓度处于线性吸收范围内时, 宽区间能够更精确且稳定地进行低浓度反演。 气体浓度升高后, Ki值分布逐渐呈现整体远离Kex的趋势, 分布在± 5%的误差区间内的Ki逐渐减少: 508 μ L· L-1浓度条件下, 1 nm区间Ki值SD为3.47, 均值误差为-39.15%, 10 nm区间的Ki值SD为0.93, 均值误差为-33.25%, 宽区间浓度反演结果虽然波动较小, 但均值误差大, 无法满足浓度反演需求。
对不同浓度下四种区间长度计算得出的Ki值集合进行95%置信区间计算, 结果如表1所示。 浓度升高后出现非线性偏移现象, 区间中点值与准确值Kex间的误差增大, 区间宽度增大代表数据不确定性增加, 因此需对置信区间内的Ki值进行进一步计算筛选, 并对结果进行非线性修正, 最终实现浓度反演。
![]() | 表1 K值的95%置信区间 Table 1 95% confidence interval of K-value |
将实验收集的8种不同浓度条件下30组光谱数据进行预处理后, 根据阈值浓度cth将其分类为低浓度与饱和吸收浓度。 利用宽波段(200~226 nm)、 窄波段(218~220 nm)的差分吸收谱与标准谱之间的线性相关系数、 以及K-MLE法对低浓度(25.4和50.8 μ L· L-1)下的光谱数据进行浓度反演, 取每个浓度下获得的30组浓度均值(Mean)作为当前测量浓度值, 以浓度均值的相对误差(mean relative error)表征该反演方法的准确性, 利用SD衡量30组浓度测量值离散程度, 来评价该反演方法的稳定性。 选取最小区间长度为1 nm, 区间长度增量为0.5 nm, 移动步距为0.5 nm。
此三种反演方法对低浓度待测气体的浓度反演结果如图7所示: 气体浓度为25.4 μ L· L-1时, 气体对光强吸收较弱且光谱信号不稳定, 宽带法、 窄带法和K-MLE法计算得出的反演浓度均值误差分别为6.14%、 22.13%和0.11%, SD值分别为0.75、 5.76和2.93, 宽带法的测量精度优于窄带法, 窄带法测量结果误差最大且波动最大, K-MLE法的测量精度和稳定性表现良好。 当气体浓度增加到50.8 μ L· L-1时, 宽带法的测量结果均值误差和SD值最低, 分别为0.67%和0.98, 这表明宽带法可以稳定地进行低浓度反演, K-MLE法的结果均差为0.79%, SD为1.11, 表现稍差于宽带法。 当气体浓度在线性吸收范围内时, 宽带法和K-MLE法能够相当准确、 稳定地进行浓度反演; 而窄带法由于选取的波段短, 参与计算的光谱信号较少, 极易受到信号波动的影响, 稳定性非常差, 不能有效地进行浓度反演。
![]() | 图7 低浓度条件下三种方法反演结果 (a): c=25.4 μ L· L-1; (b): c=50.8 μ L· L-1Fig.7 Inversion results of three methods at low concentration (a): c=25.4 μ L· L-1; (b): c=50.8 μ L· L-1 |
待测气体浓度升高至饱和吸收范围内, 必须对宽带法和K-MLE法进行补偿, 宽带法的二次多项式补偿方程为c2=0.005 8×
![]() | 表2 非线性补偿的浓度反演方法对比 Table 2 Comparison of concentration inversion methods with nonlinearly compensated |
基于朗伯-比尔定律的气体浓度反演方法由于实际测量中无法避免的限制因素, 在进行宽范围、 高浓度的气体测量过程中, 待测气体吸光度积分与浓度间出现非线性偏移现象, 导致测量结果严重偏离实际浓度值。 基于UV-DOAS的气体浓度检测系统, 本文提出了一种应用在宽浓度范围内的非线性吸收光谱反演方法, 利用待测气体差分光密度谱与标准谱之间的线性相关系数K值来反映待测浓度与已知标准浓度之间的关系, 对移动区间法得到吸收波段不同波长处、 不同区间大小内K值进行分析, 基于置信区间估计提高K-MLE方法的抗干扰性, 构建线性关系系数的似然方程并求解极大值点, 研究了一种有效的针对最佳估计值Kbest的计算补偿方法。 相较于宽带法、 窄带法, K-MLE法精确且稳定地实现了0~508 μ L· L-1范围内SO2气体浓度反演, 最大均值误差为0.98%, 最大标准差为1.25。 结果表明, K-MLE法实现了低浓度气体测量中0.11%的测量精度, 同时提出了高浓度情况下一种有效的非线性补偿方法, 为宽浓度范围的气体提供了一种普遍适用的浓度反演方法。
[1] |
|
[2] |
|
[3] |
|
[4] |
|
[5] |
|
[6] |
|
[7] |
|
[8] |
|
[9] |
|
[10] |
|
[11] |
|
[12] |
|
[13] |
|
[14] |
|
[15] |
|
[16] |
|
[17] |
|
[18] |
|
[19] |
|
[20] |
|
[21] |
|