作者简介: 黄文彪, 1996年生,中国科学技术大学研究生院科学岛分院及安徽光学精密机械研究所光子器件与材料安徽省重点实验室博士研究生 e-mail: hwenbiao@mail.ustc.edu.cn
碳13(13C)尿素呼气试验在国内外作为检测幽门螺旋杆菌的“金标准”已被广泛采用, 精准测量CO2中碳(C)和氧(O)同位素特征对疾病诊断具有重大意义。 可调谐半导体激光吸收光谱技术(TDLAS)具有结构简单、 响应速度快、 灵敏度高等众多优点, 在多个领域得到广泛应用, 同时完全适用于气体同位素的测量研究。 该研究面向人体呼出气体中的CO2气体检测需求, 基于直接吸收光谱技术, 采用中心波长为4.32 μm的量子级联激光器(QCL)结合光程为14 cm/44 mL的小容积气体吸收腔体, 完成了同时测量16O12C16O、18O12C16O和16O13C16O的多组分同位素气体浓度的实验系统。 基于反向传播(BP)神经网络模型, 降低直接吸收光谱系统中光源稳定性和测量样品气体波动带来的噪声干扰。 结果表明: 基于BP神经网络模型的同位素丰度测量精度与稳定性均优于吸光度峰值比法,16O13C16O与18O12C16O的浓度测量精度分别提高约1.27与1.58倍。 Allan方差分析表明, 当积分时间为106 s时, 采用BP神经网络模型的13C与18O同位素丰度测量精度分别为0.97‰和1.47‰, 相比吸光度峰值比法测量精度提高了约2.1倍与1.2倍。 充分证明了基于BP神经网络模型的同位素丰度测量方法的可行性, 为研制高精度同位素丰度传感器奠定基础。
The13C urea breath test is widely used as the “gold standard” for detecting Helicobacter pylori domestically and internationally. Accurate measurements of carbon and oxygen isotope characteristics in CO2 are significant for disease diagnosis. Tunable diode laser absorption spectroscopy (TDLAS) has been widely used in multiple fields due to its simple structure, fast response speed, and high sensitivity. It is also fully suitable for the measurement and research of gas isotopes. In this study, a quantum cascade laser with a central wavelength of 4.32 μm and a small volume gas absorption cellwith an optical path of 14 cm and volume of 44 mL was used to simultaneously measure the volume concentrations of16O12C16O,18O12C16O and16O13C16O in CO2 based on direct absorption spectroscopy. In addition, the noise interference caused by the stability of the light source in the direct absorption spectrum system and gas sample fluctuations were reduced using the Back Propagation (BP) neural network model. The results showed that the measurement accuracy and stability of isotope abundance based on the BP neural network model were better than those of the absorbance peak ratio method. The concentration measurement accuracy of16O13C16O and18O12C16O increased by about 1.27 and 1.58 times, respectively. Meanwhile, the Allan variance analysis also showed that when the integration time was 106 s, the accuracy of13C and18O isotope abundance using the BP neural network model was 0.97‰ and 1.47‰, respectively, which improved about 2.1 times and 1.2 times compared to the absorbance peak ratio method. This fully proves the feasibility of the isotope abundance measurement method based on the BP neural network model, laying the foundation for developing high-precision isotope abundance sensors.
呼吸气体分析具有无创伤、 实时性、 低成本等优点, 在重大疾病的早期诊断、 代谢监测、 疾病疗效监测及新药测试等方面具有广阔的应用前景[1, 2, 3]。 在分析技术不断进步的背景下, 特别是激光技术与电子技术为依托的检测手段的发展与完善, 使现代分析技术手段越来越丰富, 实现“ 呼口气, 知健康” , 得到了越来越多的认可。 典型的应用是通过测定呼气中二氧化碳(CO2)的13C诊断是否感染幽门螺旋杆菌, 幽门螺旋杆菌是引起胃炎和胃溃疡的主要细菌[4, 5]。 呼气中的一氧化氮(NO)含量与哮喘疾病相关, 丙酮含量与糖尿病有关[6]。 近年来, 一些研究报告认为, 呼气CO2中的18O同位素也是与幽门螺杆菌有关的生物标志物[7, 8, 9], 由于16O12C16O中的16O和
常用的同位素丰度测量主要有同位素比率质谱(isotope ratio mass spectrometers, IRMS)、 傅里叶变换红外光谱(Fourier transform infrared spectrometer, FTIR)、 非分散红外吸收光谱 (non-dispersive infrared, NDIR)、 光声光谱(photoacoustic spectroscopy, PAS)、 腔增强吸收光谱(cavity-enhanced absorption spectroscopy, CEAS)、 腔衰荡光谱(cavity ring down spectroscopy, CRDS)与可调谐半导体激光吸收光谱(tunable diode laser absorption spectroscopy, TDLAS)技术等。 IRMS具有很高的测量精确度与灵敏度, 通常被作为标准方法, 但其价格昂贵、 样品需预处理、 仪器操作复杂, 难以实时在线检测[11], 对于同分异构体分子难以区分; FTIR是一种成熟的检测技术, 但其仪器昂贵、 检测时间较长[12]; NDIR结构简单, 但易受温度变化影响; PAS体积小, 灵敏度高, 易受环境因素干扰; CEAS与CRDS技术灵敏度高, 但需要复杂的系统设计与高精细的光路设计; TDLAS具有响应速度快、 特异性好、 系统体积小、 光谱分辨率高、 实时在线检测等优点, 被广泛应用于同位素丰度测量研究[13]。 呼吸气体的测量气量较小, 所用样气袋容量一般约50 mL, 因此要求测量设备具有需求气样小、 换气迅速、 响应灵敏、 精确度高等特点。 本研究选择气体吸收强度高的中红外量子级联激光器(QCL)为系统光源, 基于TDLAS技术对呼气中的CO2气体13C和18O同位素进行实时在线测量。
采用TDLAS技术实现同位素丰度测量的方法通常采用吸光度峰值比法, 此方法采用光谱的峰值点数据, 结合线性回归模型, 计算同位素丰度[14]。 由于激光器输出波长和系统光机结构的稳定性等因素影响引起测量稳定性差等不足。 反向传播(BP)神经网络模型是一种高效的机器学习方法, 具有容错性好、 泛化性能强, 逐渐被应用于光谱分析领域。 王志芳等基于BP神经网络构建了甲烷气体预测模型[15]; Zhou等采用BP神经网络模型优化滤波参数, 实现痕量气体高灵敏度检测[16]; Li等采用深度BP神经网络构建了CO2气体的浓度反演模型[17]; 王彪等采用BP神经网络对CO检测系统进行气体温度压强补偿计算[18]。 目前BP神经网络大多应用在气体光谱中的定量、 分类与参数补偿研究中, 而用于反演同位素丰度的研究较少。 为了进一步提高本系统同位素丰度测量的精度, 基于BP神经网络模型, 以吸收光谱作为输入数据集, 组建训练模型, 并对其性能进行测试, 最后将该模型的测量结果与吸光度峰值比法测量结果进行了详细的对比。
根据Beer-Lambert定律, 待测气体与对应波段的激光产生相互作用, 激光光束经过待测气体吸收以后, 透射光强可表示为
式(1)中, ν (cm-1)为激光发射频率, It(ν )为经过气体吸收后的光强, I0(ν )为未经过气体吸收的原始光强, α (ν )(cm-1)为中心吸收截面, P(atm)为气体压强, S(T)(cm-2· atm-1)为在温度T时的谱线吸收线强, ϕ (ν )为吸收线型函数, 描述了气体吸收谱线的形状, 与气体压力和温度有关; L(cm)为光路的总光程, c为待测气体浓度。 吸光度A可表示为
式(2)中, n为同位素自然丰度(参考HITRAN数据库), 待测气体同位素分子比率为
式(3)中, x表示重同位素成分(如16O13C16O、 18O12C16O), a表示轻同位素成分(如16O13C16O)。 本研究采用VPDB标准表示同位素的δ 值, 其中
BP神经网络是基于误差逆向传播算法的神经网络模型, 具有泛化能力强、 映射精确等特点, 是当前广泛应用的神经网络模型之一。 模型含有输入层、 输出层及隐含层, 采用反馈机制调整神经网络模型中各层的权重以最小化损失函数, 通过前馈步骤从输入层传播数据到输出层, 再逆向计算梯度, 评估损失函数, 调整网络模型各层之间的权值和阈值, 使模型预测输出逐步逼近期望输出。 BP神经网络模型结构如图1所示, X=[X1, X2, …, Xm]为输入层, B=[B1, B2, …, Bq]为隐含层, Y=[Y1, Y2, …, Yn]为输出层, Wi为输入层与隐含层连接权值, Wj为隐含层与输出层连接权值。 本研究以光谱吸收峰数据作为输入层, 分别选取16O12C16O、 18O12C16O和16O13C16O的吸收峰处200个采样点数据创建BP神经网络模型。 以16O13C16O光谱吸收峰数据为例, 采集的总光谱数据集S=[S1, S2, S3, …, S4 000]T, 浓度数据集C=[C1, C2, C3, …, C4 000]T, 其中Si矩阵的维度为200× 1, 表示第i次测量的光谱中16O13C16O吸收峰数据; Ci矩阵的维度为1× 1, 表示第i次测量的16O13C16O浓度。 在创建16O13C16O的BP神经网络模型时, 其输入层X=[X1, X2, …, Xm]=[S1, S2, S3, …, S4 000]T, 其矩阵维度为4 000× 200, 输出层Y=[Y1, Y2, …, Yn]=[C1, C2, C3, …, C4 000]T, 其矩阵维度为4 000× 1, 调整隐含层节点数, 获得最优映射关系。
CO2气体同位素吸收谱线通常集中于1.6、 2.0、 2.7与4.3 μ m附近, 考虑到近红外波段处CO2分子的吸收线强度相对较弱, 需要配合长光程气体池实现较高的测量精度, 不仅增加了气样需求量, 也增加了系统的光机不稳定性。 中红外波段处CO2分子的吸收线强度比近红外高出近两个数量级, 相比之下该波段具有明显优势。 因此, 为了同时测量CO2及其稳定同位素气体, 依据谱线选取无干扰、 无重叠等原则[19], 选择中心波长为4.32 μ m具有单色性好、 发射线宽窄、 准直度高与功率密度高等优点的QCL激光器作为系统光源。 同位素气体的吸收谱线示意如图2所示, 参数如表1所述。 值得注意的是: 虽然16O12C16O在2 310.002 4 cm-1处的吸收强度为4.868× 10-21 cm· molecule-1, 但在2 309.982 4 cm-1处, 17O12C16O的吸收强度为4.301× 10-22 cm· molecule-1, 两条线存在吸收重叠, 因此未选择此吸收线。 此波段范围内H2O的最大吸收强度为4.368× 10-25 cm· molecule-1, 比CO2同位素分子的吸收强度低4个数量级, 通过水汽干燥过滤等处理方式后水汽对CO2同位素气体测量的影响可忽略不计。
![]() | 图2 CO2同位素和H2O在2 309.75~2 310.50 cm-1波段的吸收线(296 K)Fig.2 Absorption line of carbon dioxide isotopes and water within the range of 2 309.75~2 310.50 cm-1(296 K) |
![]() | 表1 所选吸收线对详细指标 Table 1 Detailedindicatorsof the selected absorption line pair |
同位素气体检测系统如图3所示, 采用Atmospheric Optics公司生产的HHL-15-28型量子级联激光器, 其中心波长为4.32 μ m, 由激光器温度电流驱动模块分别设置温度和电流值为27 ℃和321 mA, 信号发生电路产生频率为10 Hz, 扫描幅值为0.96~1.11 V的三角调制信号, 使QCL激光器输出波长同时覆盖16O12C16O、 18O12C16O和16O13C16O三种同位素气体的吸收线。 气体腔体由长度14 cm、 内径2 cm、 气体容积约44 mL的直腔构成。 激光器出射的光通过平凸透镜聚焦到腔体内部, 与待测气体相互作用后, 再次通过平凸透镜聚焦到碲镉汞(HgCdTe, MCT)光电探测器, 经过数据采集和数据处理后, 获得气体的吸收光谱信息。 为了保证谱线的分离效果, 采用真空泵和压力控制器将气体腔体内的压力控制在30 mbar。
由式(1)和式(2)可知, 测量腔体内部的压力直接影响吸收线型, 低压条件下吸收线展宽较小, 可避免光谱重叠现象[20, 21], 并且稳定的低压条件可以减小光谱信号的误差, 同时降低待测气体样品的用量。 研究中将气体池中压力设置为30 mbar, 压控性能测试如图4所示。 在稳定状态下连续检测200 min, 压力平均值为29.999 8 mbar, 1σ 标准差为0.012 6 mbar, 体现了良好的稳定压力控制性能, 为同位素丰度的稳定测量提供了可靠条件。
由于系统处于开放式环境, 激光在自由空间中传播, 中红外波段CO2的吸收很强, 且常压条件下的光谱展宽, 会导致系统采集的光谱产生如图5所示的非线性畸变, 导致常规的多项式拟合处理方法的基线背景难以契合。 在处理过程中除了尽量缩短了光路中元器件之间的距离, 还需采用更准确的处理方法加以校正。 图5中红色曲线为实测CO2气体的透射光谱, 蓝色曲线为氮气的背景光谱。
考虑到TDLAS最常用的背景扣除方法, 在测量CO2气体前, 先向气体腔体中通入高纯氮气, 获得背景光谱, 后续测量不同浓度的CO2气体时, 均以此光谱作为背景基线。 同时为了增加系统测量重复性和准确度, 采用交替采集背景基线和信号谱线的情况加以实时扣除。 在HITRAN数据库中压力设置为30 mbar、 温度设置为296 K、 光程长度为14 cm的条件下, 模拟了浓度为4.9%的CO2气体在2 309.75~2 310.50 cm-1范围内的吸收光谱。 在上述条件下, 充入4.9%的CO2标准气体, 采集信号经上述两种背景基线校正处理后, 获得的吸收光谱如图6所示。 经过比对可以看出采用氮气作为背景基线校正后的吸收光谱与HITRAN数据库仿真光谱更吻合, 效果更佳。
实验中以4.99%的CO2气体作为标气, 高纯氮气作为稀释气, 采用配气仪获得0.5%、 1%、 1.5%、 2%、 2.5%、 3%、 3.5%、 4%、 4.5%、 4.99%等一系列浓度梯度的CO2气体, 其同位素δ 值保持不变, 通入检测系统, 每个浓度约采集400组吸收光谱信号, 采集频率为1Hz。 根据CO2气体同位素分子的自然丰度, 将三种同位素分子不同浓度的吸收光谱作为训练集, 构建线性回归模型与BP神经网络模型, 同位素分子浓度如表2所示。
![]() | 表2 训练集的三种同位素分子浓度 Table 2 Three isotopes concentrations in the training set |
传统的吸光度峰值比法是将实测的同位素分子吸收光谱峰值与浓度数据构建线性回归模型, 但其只采用峰值点数据反演浓度, 易受噪声干扰。 本工作基于Matlab2021a平台, 采用Levenberg-Marquardt算法构建BP神经网络模型, 对模型中隐藏层神经元数目进行参数优化, 将16O12C16O、 18O12C16O和16O13C16O同位素分子实测吸收光谱与对应浓度进行训练。 以训练集第八组16O13C16O的吸收光谱数据为例, 两种方法获得的模型性能对比如图7(a, b)所示。 可见BP神经网络模型获得的结果分布更均匀, 其高斯拟合的半高半宽(HWHM)为8.8× 10-6, 线性回归模型的HWHM为9.7× 10-6, 因此基于BP神经网络训练的模型其测量精度更高。
![]() | 图7 两种模型性能对比 (a): BP神经网络; (b): 线性回归Fig.7 Performance comparison of two models (a): BP neural network; (b): Linear regression |
为验证基于BP神经网络的同位素丰度测量精度, 配置浓度为2.25%、 2.75%、 3.75%和4.25%的CO2气体, 通入实验系统中, 各采集约450组光谱信号, 采集频率为1 Hz, 作为测试数据集, 对应的同位素分子浓度如表3所示。
![]() | 表3 测试集的三种同位素分子浓度 Table 3 Three isotopes concentrations in the test set |
测试集中4种浓度的CO2实测吸收光谱分别使用线性回归模型与BP神经网络模型进行浓度反演, 获得的反演结果如图8所示。 可以看出, 不同浓度条件下, 三种CO2同位素分子采用BP神经网络模型的反演精度均优于线性回归模型。 以第三组测试数据为例, 16O12C16O浓度的BP神经网络模型与线性回归模型1σ 标准差分别为250.52× 10-6和319.32× 10-6, 精度提高1.27倍; 16O13C16O的浓度测量精度提高1.28倍; 18O12C16O的浓度测量精度提高1.58倍。 采用BP神经网络模型反演同位素分子浓度更加准确。
根据各同位素分子的浓度值可计算其相应的同位素丰度δ 值, 通过式(3)和式(4)计算确定, 采用两种模型计算δ 13C, BP神经网络模型与线性回归模型计算的1σ 标准差分别为14.111 6‰ 与17.593 8‰ ; 对于δ 18O, BP神经网络模型与线性回归模型计算的1σ 标准差分别为14.120 3‰ 与18.845‰ 。 Allan方差是分析系统检测极限与稳定性的重要评价指标, 将上述δ 值采用Allan方差分析, 以确定最佳积分时间和测量精度, 如图9所示。 当积分时间为10 s时, 采用BP神经网络模型与线性回归模型计算的13C同位素丰度测量精度分别为4.79‰ 和5.65‰ , 18O同位素丰度测量精度分别为4.99‰ 和6.27‰ 。 当积分时间增加到106 s时, 采用BP神经网络模型与线性回归模型的13C同位素丰度测量精度分别为0.97‰ 和2.04‰ , 性能提高了约2.1倍; 18O同位素丰度测量精度分别为1.47‰ 和1.76‰ , 性能提高了约1.2倍。
使用中心波长为4.32 μ m的量子级联激光器, 搭建了一套基于BP神经网络的CO2气体同位素丰度测量系统, 对位于2 309.806 1、 2 310.205 5和2 310.347 2 cm-1处的16O12C16O、 18O12C16O、 16O13C16O吸收线, 在14 cm光程条件下, 实现了同位素丰度的在线测量, 该系统具有体积小、 响应时间快、 灵敏度高等优点。 通过将BP神经网络模型与吸光度峰值比方法的结果进行对比, 验证了BP神经网络模型应用于同位素丰度测量的可行性, 并且具有更好的稳定性与测量精度。 当积分时间为106 s时, 采用BP神经网络模型的13C与18O同位素丰度测量精度分别为0.97‰ 和1.47‰ , 相比吸光度峰值比法测量精度提高了约2.1倍与1.2倍。 本研究基于QCL光源的TDLAS系统为实现高精度呼气同位素丰度传感器的实现提供了可靠的技术路线, 将持续进行优化和改进为实现更高精度、 多领域、 高鲁棒性的传感器研制奠定基础。
[1] |
|
[2] |
|
[3] |
|
[4] |
|
[5] |
|
[6] |
|
[7] |
|
[8] |
|
[9] |
|
[10] |
|
[11] |
|
[12] |
|
[13] |
|
[14] |
|
[15] |
|
[16] |
|
[17] |
|
[18] |
|
[19] |
|
[20] |
|
[21] |
|