基于凸优化的激光诱导击穿光谱基线校正方法
柯轲1,2, 吕勇1,2, 易灿灿1,2,3,*
1. 武汉科技大学, 冶金装备及其控制教育部重点实验室, 湖北 武汉 430081
2. 武汉科技大学, 机械传动与制造工程湖北省重点实验室, 湖北 武汉 430081
3. 武汉科技大学, 省部共建耐火材料与冶金国家重点实验室, 湖北 武汉 430081
*通讯联系人  e-mail: meyicancan@wust.edu.cn

作者简介: 柯 轲, 1992年生, 武汉科技大学机械自动化学院硕士研究生 e-mail: m15072485065_3@163.com

摘要

在激光诱导击穿光谱定量分析中, 基线是LIBS光谱信号的重要组成部分, 由于受到实验参数设置及实验环境变化等影响, 导致等离子体的发射谱线呈现不同程度的基线漂移现象, 因此基线校正是光谱分析的重要环节。 现有算法如多项式拟合通常需要设定关键参数, 不具备自适应性。 由于激光诱导产生的等离子体光谱信号的特征峰具有明显的独立性和稀疏性, 以及基线具有低通特性, 因此在凸优化约束框架下, 提出了非参数化基线校正模型。 同时, 利用高效率的迭代算法来保证结果的收敛性。 首先对23个高合金钢样本的光谱信号进行基线校正, 然后以合金钢样本中的铬(Cr)元素为分析对象, 并选取11条分析线进行定量分析。 分别采用PLS和SVM定量模型进行训练和预测, 并且与传统方法相比较, 证明了所提出方法可以提高定量分析精度。

关键词: 激光诱导击穿光谱; 基线校正; 凸优化; 定量分析
中图分类号:O433.4 文献标志码:A
Improvement of Convex Optimization Baseline Correction in Laser-Induced Breakdown Spectral Quantitative Analysis
KE Ke1,2, LÜ Yong1,2, YI Can-can1,2,3,*
1. The State Key Laboratory of Refractories and Metallurgy, Wuhan University of Science and Technology, Wuhan 430081, China
2. School of Mechanical Engineering, Wuhan University of Science and Technology, Wuhan 430081, China
3. State Key Laboratory of Refractory Materials and Metallurgy, Wuhan University of Science and Technology, Wuhan 430081, China
*Corresponding author
Abstract

In the laser-induced breakdown spectroscopy (LIBS) quantitative analysis technique, the baseline is an important part of the LIBS signal. Due to the fluctuation of laser energy and inhomogeneity of sample surfaces, the phenomenon of plasma emission line drift is obvious. Thus, baseline correction is an essential part during the spectrum data preprocessing. However, the existing algorithms do not have adaptability, thus there usually needs to set some key parameters, such as the suitable fitting function and order. In this paper, baseline correction and spectral signal denoising method are proposed on the basis of the data characteristics, such as the independence and sparsity of the spectral peak as well as the low-pass signal feature of baseline, which forme non-parametric baseline correction model under convex optimization framework. Meanwhile,efficient iterative algorithm is used to ensure the convergence of the results. In this paper, the spectral signal of 23 high alloy steel samples was firstly calibrated, and then the Cr element in the samples of alloy steel was analyzed. Subsequently, 11 analytical lines were selected for quantitative analysis. To verify the effectiveness of the proposed method, we utilized partial least squares (PLS) and support vector machine (SVM) quantitative model for training and prediction respectively. Compared with the traditional methods, the proposed method has a better performance in improving the quantitative analysis accuracy.

Keyword: Laser-induced breakdown spectroscopy; Baseline correction; Convex optimization; Quantitative analysis
引 言

激光诱导击穿光谱(laser-induced breakdown spectroscopy, LIBS)[1, 2, 3]是原子发射光谱的一种, 它是一种全新的用于物质成分快速检测和元素分析的技术。 通过高能量的激光脉冲对样品表面进行烧蚀, 形成局部高温, 导致烧蚀部位的粒子处于激发状态, 从而形成等离子体。 等离子体中处于激发态的粒子在跃迁过程中部分能量以光谱的形式表现出来, 等离子体光谱往往含有元素的特征信息。 通过采集激光烧蚀样品表面产生的等离子激发体谱线, 可以实现对样品中所含有的元素进行定性分析以及确定所含元素的浓度, 即定量分析。

LIBS定量分析的关键是建立样品中各元素含量和对应光谱强度之间的函数关系。 根据分析回归模型, 通过待测样品选择分析线的光谱强度, 计算出样品中各元素的含量。 传统的LIBS定量分析一般选用待测元素的多条特征谱线作为分析线, 为了提高定量分析的准确性, 需要对分析线进行预处理, 从而降低其他干扰因素的影响。 偏最小二乘(PLS)[4]、 神经网络(ANN)[5]、 标准支持向量机(SVM)[6, 7]等化学计量算法具有多变量分析能力。 利用多条谱线或者全谱作为输入可以获得更多的光谱有用信息, 但是光谱中除了与待测元素相关的特征谱线外, 还存在光谱背景、 仪器噪声等干扰信息。 由于受到激光能量、 测量环境、 样品表面的基质、 以及仪器电子噪声等影响, LIBS信号强度的波动会非常大, 一般表现为随机噪声和基线漂移等, 它极大影响了光谱信息的正确解读, 并且直接影响着后续定量分析模型结果的好坏。 因此, 为了消除干扰信息, 增强光谱中有效信号, 需要对采集到的原始光谱进行数据预处理, 即基线校正。

目前, 常用的基线校正处理的方法包括傅里叶变换[8]、 小波变换[9]、 多项式拟合[10]等方法。 傅里叶变换作为一种背景估计方法, 它处理结果的好坏取决于人工选择指定频率的上限和下限, 需要在不同的情况下进行限制, 这要消耗大量的计算时间。 小波分析虽然所具备如多分辨率分析等许多优良特性, 但是其分解尺度来自先验知识, 面向不同对象难以正确选择, 容易导致校正不充分或失真。 同样, 多项式拟合中数据的选取以及拟合基数、 函数的设定没有规律, 依靠人工经验, 而关键参数的选择对基线提取影响很大, 并且容易出现过拟合和欠拟合的现象。 孙兰香[11]提出了一种识别连续背景的极小点筛选方法(MPS), 并用该方法对高合金钢样品的LIBS光谱进行了背景扣除, 但是其中拟合次数及背景因子的选择需要人工参与, 算法的计算复杂度较高。

一般情况下, LIBS光谱信号由代表光谱主要特征信息的特征峰、 背景和噪声三部分组成, 其中特征峰具有稀疏性的特点, 背景或者基线部分具有低频的特点, 噪声具有高频和随机性的特点。 根据LIBS光谱信号的特点: 基线被视为低通信号, 光谱的特征峰的二阶导数具有明显稀疏性的特点, 剩余的部分或者残差即为噪声, 因此, 提出了一种基于凸优化[12, 13]的基线校正方法[14]。 提出的方法具有自适应地特点, 能够自适应的扣除连续背景和噪声, 避免了参数选择对结果的影响。 同时利用提出的对称惩罚函数, 保证了结果的可靠性。 为了验证提出方法的有效性, 本文对23个高合金钢样品中Cr元素的含量进行了定量分析, 研究结果表明提出的方法有更高的定量分析精度。

1 理论部分

在实际测量得到的光谱中, 不可避免地存在噪声的成分, 因此LIBS光谱通常可以定义为特征峰, 基线和噪声的线性叠加

y=x+f+wyRN(1)

其中, x为一系列光谱特征峰, 其具有稀疏和独立的特点; f为基线, w是方差为σ 2的高斯白噪声, y是通过实验测得实际光谱信号。 假设, 如果波峰都不存在的情况下, 基线可以近似地由低通滤波从含有噪声的LIBS信号中分离出来, 即fL(f+w), 其中L是合适的低通滤波器。 因此, 如果 x^为估计得到的最优化峰值, 则基线的最优估计 f^可以通过表达式(1) 得到

f^=L(y-x^)(2)

在稀疏信号处理领域, 为了得到优化问题的准确解, 往往添加正则项。 因此最优化峰值 x^的估计可以用式(3)来表示

x^=argminxF(x)=12H(y-x)22+i=0MλiRi(Dix)(3)

其中, H为高通滤波器, Di为差分算子, i=0, …, M, 惩罚函数Ri(v)可以用式(4)表示

Ri(v)=nϕ(νn)(4)

其中ϕ 的作用是作为一个惩罚函数, 目的在于提升稀疏, 由上述式(3)可得

x^=argminx{F(x)=12H(y-x)22+i=0Mλin=0Ni-1ϕ([Dix]n)}(5)

其中NiDix的长度, 常量λ i≥ 0是正则化常数, λ i的值越大使得Dix变得更加的稀疏。 从幅值的角度来讲, LIBS光谱

信号主要由一系列孤立的特征峰组成, 其相对于噪声信号和平坦的基线成分, 特征峰具有更大的幅值。 因此从理论上可以认为LIBS光谱信号是稀疏的, 其光谱信号以线性对称形式存在。 在这种情况下, 文献[14]采用对数惩罚函数(logarithmic penalty function), 使得LIBS光谱信号更加稀疏, 如式(6)

ϕ(x)=|x|-εlog(|x|+ε)(6)

但是, 基于式(6)的定量分析的效果有一定的欠缺, 本文提出另一种指数惩罚函数(exponential penalty function), 如式(7)所示

ϕ(x)=1-e-|x|(7)

由于H=A-1B, 我们可以写成:

x=AQ-1BTBA-1y(8)

本文提出算法的具体流程如下:

输入: y, A, B, λ i, i=0, …, M

(1) b=BTBA-1y

(2) x=y(初始化)

(3) [Λ i]n, n= ϕ'([Dix]n)[Dix]n, i=0, …, M

(4) M=i=1MλiDTiΛiDi

(5) Q=BTB+ATMA

(6) x=AQ-1b

直到收敛

(7) f=y-x-BA-1(y-x)

输出: x, f

其中AB是带状卷积矩阵, λ 是正则化参数。 利用上面的关系式, 以及最小化优化算法进行迭代求解, 可以得到经过基线校正后的最优解x, 其迭代过程如式(9)— 式(11)所示

M(k)=i=1MλiDTi[Λ(Dix(k))]Di(9)Q(k)=BTB+ATM(k)A(10)x(k+1)=A[Q(k)]-1BTBA-1y(11)

2 实验部分

研究中使用的LIBS实验装置的示意图如图1所示。 实验装置使用激光器为Quantel公司的Nd:YAG激光器, 波长为1 064 nm, 脉冲能量高达200 mJ, 脉冲持续时间为6 ns, 聚焦前激光的直径为6 mm, 使用美国海洋光学(Ocean Optics)公司的7通道光谱仪收集和聚焦等离子体的光辐射。 光谱探测范围为200~980 nm, 分辨率为0.1 nm, 积分时间为1 ms。 激光器发出的脉冲激光经焦距250 mm透镜聚焦后, 作用于样品表面, 选择最佳延迟时间为1.3 μ s, 激光能量为110 mJ。

图1 LIBS实验装置图Fig.1 Schematic experimental setup of LIBS measurement

研究的样品为23种标准认证的高合金钢样品。 样品中所含的主要元素是Cr, Ni, Mn和Fe等。 在实验中将Cr元素作为主要分析目标, 样品的元素组成如表1所示。

表1 样品中各元素的组成成分 Table 1 Composition of sample elements

在收集数据之前需要对样品的表面进行抛光、 打磨处理。 考虑到样品表面的不均匀性, 在每一个样品表面的20个不同位置上收集光谱数据。 此外, 为了减少由仪器参数波动引起的影响, 对于每个位置, 通过脉冲激光束连续聚焦40次在样品表面上, 并且每次重复收集数据。 图2是一种高合金钢样品测量的典型LIBS光谱。 由图2可以得到, 原始谱图受到背景噪声的严重干扰, 基线漂移现象比较明显。

图2 高合金样品LIBS光谱图Fig.2 LIBS spectrum of high-alloy steel samples

样品进行定量分析之前最重要的是选择元素的分析线, 目前的分析线选择方法主要依靠人为经验。 考虑到分析线在训练样本和测试样本中的稳定性, 我们根据分析线自适应选择的方法[15], 通过自适应的方法优先选择较少自吸性的分析线, 通过对谱线的筛选, 剔除自吸收和干扰严重的谱线。 在本文中, 选择表2所示的11条Cr元素分析线, 并将它们的光谱强度作为回归模型的输入向量, 将样品的相应Cr元素浓度作为输出。

表2 Cr元素分析线 Table 2 Analytical lines of Cr
3 结果与讨论

为了说明本文提出的方法在提高LIBS定量分析精度方面的优势, 本文首先对未经过基线校正的光谱数据进行统计建模和定量分析, 分析模型分别采用线性的PLS方法和小样本情况下的非线性支持向量机SVM的回归建模方法, 其定量分析结果如图3所示。

图3 原始光谱信号进行定量分析的结果
(a): 原始数据PLS预测结果; (b): 原始数据SVM预测结果
Fig.3 The quantitative analysis result of the original spectral signal
(a): Original spectral prediction result based on PLS model; (b): Original spectral prediction result based on SVM model

采用PLS模型, 取奇数项样本做训练, 得到确定系数R=0.971 3, 均方根误差RMSE=1.253 7, 然后将训练的结果代入偶数项样本做预测, 最终得到确定系数R=0.955 3, 均方根误差RMSE=1.561, 预测结果如图3(a)所示。

采用SVM模型, 取奇数项样本做训练, 得到确定系数R=0.979 9, 均方根误差RMSE=1.104, 然后将训练的结果代入偶数项样本做预测, 最终得到确定系数R=0.949 7, 均方根误差RMSE=1.596, 预测结果如图3(b)所示。

从图3可以看出, 未进行基线校正时, LIBS定量分析精度较差, 将提出的方法作用于LIBS实际测量得到的光谱, 结果如图4所示。 可以得到如下结论: 本文提出的方法具有明显的基线校正效果。

图4 利用本文提出的方法去除背景后的光谱Fig.4 The spectrum computed by the proposed method in thispaper for baseline correction

文献[14]的凸优化算法采用对数(log)对称惩罚函数, 首先用该方法对原始光谱数据进行基线校正。 采用PLS模型, 取奇数项样本做训练, 将训练的结果代入偶数项样本做预测, 最终得到确定系数R=0.9804, 均方根误差RMSE=1.029, 预测结如图5(a)所示。

图5 对数惩罚函数用于基线校正预测结果
(a): 采用对数惩罚函数基线校正后PLS预测结果; (b): 采用对数惩罚函数基线校正后SVM预测
Fig.5 Logarithmic penalty function baseline correction of prediction results
(a): The modeling and predicted results of the PLS model by usinglogarithmic penalty function; (b): The modeling and predicted results of the SVM model by using logarithmic penalty function

采用SVM模型, 取奇数项样本做训练, 将训练的结果代入偶数项样本做预测, 最终得到确定系数R=0.983 9, 均方根误差RMSE=0.941 2, 预测结果如图5(b)所示。

然后, 采用指数函数(exp)替换原来凸优化方法中的对数(log)惩罚函数, 对原始光谱进行基线校正。 采用PLS模型, 取奇数项样本做训练, 得到确定系数R=0.989 6, 均方根误差RMSE=0.823, 然后将训练的结果代入偶数项样本做预测, 最终得到确定系数R=0.985 8, 均方根误差RMSE=0.857 1, 预测结果如图6(a)所示。

图6 本文提出方法用于基线校正的结果
(a): 采用指数惩罚函数基线校正后PLS预测结果; (b): 采用指数惩罚函数基线校正后SVM预测
Fig.6 The method proposed in this paper for baseline correction
(a): The modeling and predicted results of the PLS model by using exponential penalty function; (b): The modeling and predicted results of the SVM model by using exponential penalty function

采用SVM模型, 同样以偶数项样本做预测, 最终得到确定系数R=0.9852, 均方根误差RMSE=0.880 6, 预测结果如图6(b)所示。

表3详细描述了不同基线校正方法(原始数据, 原始文献提出的方法, 本文提出的方法)对Cr元素进行定量分析训练和预测的结果, 可以看出, 提出的指数对称惩罚函数进行基线校正也能取得很好的效果。 值得指出的是, 在偶数作为训练样本和奇数样本作为预测集的情况下, 所提出的方法也具有良好的性能。

表3 不同数据预处理的Cr定量分析结果 Table 3 Cr quantitative analysis results for different data pretreatments
4 结 论

通过实验分析, 表明提出的凸优化理论对LIBS光谱进行基线校正的方法是可行的。 利用LIBS光谱信号三个组成部分的特点, 即特征峰具有明显稀疏性的特点、 噪声具有高频随机性的特点、 基线具有低通和平稳的特点, 提出了基于凸优化理论的基线校正方法。 通过指数对称惩罚函数和迭代算法保证了结果的准确性与收敛性; 同时对23个高合金钢样品的Cr元素进行了定量分析, 研究结果表明提出的方法具有良好的定量分析精度。

The authors have declared that no competing interests exist.

参考文献
[1] YANG Chun, JIA Yun-hai, CHEN Ji-wen, et al(杨春, 贾云海, 陈吉文, ). Chinese Journal of Analytical Chemistry (分析化学), 2014(11). [本文引用:1]
[2] CHEN Xing-long, DONG Feng-zhong, TAO Guo-qiang, et al(陈兴龙, 董凤忠, 陶国强, ). Chinese Journal of Lasers(中国激光), 2013(12). [本文引用:1]
[3] Sturm V, Fleige R, de Kanter M, et al. Analytical Chemistry, 2014, 86(19): 9687. [本文引用:1]
[4] Feng J, Wang Z, Li L, et al. Applied Spectroscopy, 2013, 67(3): 291. [本文引用:1]
[5] HU Yang, LI Zi-han, Tao(胡杨, 李子涵, 吕涛). Laser & Optoelectronics Progress(激光与光电子学进展), 2017, (5): 1. [本文引用:1]
[6] Yi C, Lv Y, Xiao H, et al. Journal of Analytical Atomic Spectrometry, 2017. [本文引用:1]
[7] Liang L, Zhang T, Wang K, et al. Applied Optics, 2014, 53(4): 544. [本文引用:1]
[8] Shi F, Ross P N, Zhao H, et al. Journal of the American Chemical Society, 2015, 137(9): 3181. [本文引用:1]
[9] LIU Li, XIAO Ping-ping(刘莉, 肖平平). Spectroscopy and Spectral Analysis(光谱学与光谱分析), 2016, 36(2): 545. [本文引用:1]
[10] Myakalwar A K, Dingari N C, Dasari R R, et al. PloS One, 2014, 9(8): e103546. [本文引用:1]
[11] Sun L, Yu H. Spectrochimica Acta Part B: Atomic Spectroscopy, 2009, 64(3): 278. [本文引用:1]
[12] Yi C, Lv Y, Dang Z, et al. Applied Sciences, 2016, 6(12): 403. [本文引用:1]
[13] Yi C, Lv Y, Dang Z, et al. Measurement, 2017, 103: 321. [本文引用:1]
[14] Ning X, Selesnick I W, Duval L. Chemometrics and Intelligent Laboratory Systems, 2014, 139: 156. [本文引用:3]
[15] Yang J, Yi C, Xu J, et al. Spectrochimica Acta Part B: Atomic Spectroscopy, 2015, 107: 45. [本文引用:1]