多元线性回归提高激光诱导荧光辅助激光诱导击穿光谱技术的准确度
吴杰1, 李创锴1, 陈文骏1, 黄妍鑫1, 赵楠1, 李嘉铭1,2,*, 杨焕3, 李祥友4, 吕启涛3,5, 张庆茂1,2,5
1.华南师范大学, 广东省微纳光子功能材料与器件重点实验室, 广东 广州 510006
2.华南师范大学, 省部共建光信息物理与技术国家重点实验室, 广东 广州 510006
3.深圳技术大学, 中德智能制造学院, 广东 深圳 518118
4.华中科技大学, 武汉光电国家研究中心, 湖北 武汉 430074
5.广东省工业超短脉冲激光技术企业重点实验室, 广东 深圳 518055
*通讯作者 e-mail: jmli@m.scnu.edu.cn

作者简介: 吴 杰, 2000年生, 华南师范大学信息光电子科技学院本科生 e-mail: 1328819225@qq.com

摘要

冶金、 核工业、 污染检测和环境监测等领域对元素分析的需求是必不可少。 激光诱导击穿光谱技术作为一种新型的原子光谱分析技术, 具有实时快速、 对样品几乎无损、 可多元素同时分析等特点, 因此一直受到广泛的关注。 但其分析灵敏度较差的缺点一直限制着该技术的发展。 激光诱导荧光辅助激光诱导激光光谱技术能够通过激光共振激发提高分析灵敏度并高效检测样本元素种类, 通过光谱仪收集光谱信息并建立模型可对未知样本进行浓度预测。 但当基体原子与目标原子的特征谱线十分接近时, 基体谱线会受到影响, 此时一元定标准确度下降。 通过一元线性拟合和多元线性拟合两种方式对钢铁中的Ni和Cr元素分别建立线性模型。 首先, 选取样品光谱中的峰值谱线, 核实其是否为待测元素或基体元素所对应的特征谱线, 选定合适的特征谱线后, 将多个谱线的光谱强度以及对应该样品的待测元素浓度作多元线性拟合模型, 将各个谱线所对应的拟合系数由高到低进行排序, 并以多元线性拟合模型中各个特征谱线对应的光谱强度对浓度预测的贡献度为标准不断减少拟合维度, 使Ni和Cr拟合模型的决定系数分别由0.960 1提高至0.992 9和0.992 0提高至0.998 7, Ni和Cr元素含量的回归模型平均相对误差分别由38%降低至10%左右和55%降低至25%以内, Ni和Cr元素的线性回归模型的交叉验证均方根误差随着维度的增加分别由3.4%降低至2%左右和2.5%降低至1.5%左右。 选取多个谱线建立多元线性回归模型的方法较为有效的降低了激发干扰的影响, 以较小的工作量提高了对待测样品的待测元素浓度预测的准确度, 为推进激光诱导荧光辅助激光诱导激光光谱技术在元素分析的实际应用提出了一种可行的方案。

关键词: 激光诱导激光光谱; 激光诱导荧光; 多元线性回归
中图分类号:O657.3 文献标志码:A
Multiple Liner Regression for Improving the Accuracy of Laser-Induced Breakdown Spectroscopy Assisted With Laser-Induced Fluorescence (LIBS-LIF)
WU Jie1, LI Chuang-kai1, CHEN Wen-jun1, HUANG Yan-xin1, ZHAO Nan1, LI Jia-ming1,2,*, YANG Huan3, LI Xiang-you4, LÜ Qi-tao3,5, ZHANG Qing-mao1,2,5
1. Guangdong Provinical Key Laboratory of Nanophotonic Functional Materials and Devices, School of Information and Optoelectronic Science and Engineering, South China Normal University, Guangzhou 510006, China
2. Province-Ministry Co-construction State Key Laboratory of Optic Information Physics and Technologies, South China Normal University, Guangzhou 510006, China
3. Sino-German College of Intelligent Manufacturing, Shenzhen Technology University, Shenzhen 518118, China
4. Wuhan National Laboratory for Optoelectronics (WNLO), Huazhong University of Science and Technology, Wuhan 430074, China
5. Guangdong Provincial Key Laboratory of Industrial Ultrashort Pulse Laser Technology, Shenzhen 518055, China
*Corresponding author
Abstract

Elemental analysis is an essential requirement in the metallurgical industry, nuclear industry, pollution detection and environmental monitoring. As a new type of atomic spectrum analysis technology, LIBS has been widely concerned because of its real-time, fast, almost non-destructive and multi-element simultaneous analysis. However, its poor analytical sensitivity has restricted the development of this technology. LIBS-LIF can improve the sensitivity of analysis and efficiently detect the element types of samples through laser resonance excitation. The spectrometer can collect spectral information and a model can be established to predict the concentration of unknown samples. However, when the characteristic spectral lines of the matrix atom and the target atom are very close, the matrix spectral lines will be affected, and the unary calibration accuracy will decrease. In this paper, linear models of Ni and Cr elements in steel were established using linear fitting with one variable and linear fitting with multiple variables. Firstly, the peak spectral line in the sample spectral map is selected to find whether it is the characteristic spectral line corresponding to the element to be measured or the collective element. After selecting suitable characteristic spectral lines, the spectral intensities of multiple spectral lines and the concentrations of the elements to be measured in the sample were used as a multivariate linear fitting model, and the fitting coefficients corresponding to each spectral line were ranked from highest to lowest, and the contribution of the spectral intensities corresponding to each characteristic spectral line in the multivariate linear fitting model to the concentration prediction was taken as the criterion from highest to lowest, and the fitting dimension was increased continuously. The mean relative errors of the regression models for Ni and Cr elemental content were reduced from 38% to about 10% and 55% to within 25%, respectively, and the root mean square error values of the cross-validation of the linear regression models for Ni and Cr elemental content were reduced from 3.4% to 2% and 2.5%, respectively, with the increase of dimensionality. and 2.5% to 1.5% for Ni and Cr, respectively. In this paper, the method of selecting multiple spectral lines to establish a multiple linear regression model is relatively effective in reducing the influence of excitation interference, and it puts forward a feasible scheme for promoting the practical application of laser-induced fluorescence assisted laser-induced laser spectroscopy technology in element analysis.

Keyword: Laser-induced breakdown spectroscopy; Laser-induced Fluorescence; Multiple linear regression
引言

分析材料的元素成分以及含量可以帮助判断材料的性能好坏, 空气、 水质的好坏也都可以通过元素的成分和含量进行判断。 除此之外还能通过元素成分和含量判断设备的腐蚀情况、 安全性和寿命。 因此元素成分分析广泛应用在冶金[1]、 核工业[2, 3]、 污染检测和环境检测[4]等领域, 是一种必不可少的需求。 目前常用的元素成分分析方法, 有原子吸收光谱法(AAS)[5, 6]、 X射线荧光光谱法(XRF)[7, 8]、 质谱法(MS)[9, 10, 11]等。 虽然这些技术有较高的灵敏度和精度, 但需要进行复杂的预处理, 效率往往较低并且容易受到环境以及各种元素的限制。 激光诱导击穿光谱(laser-induced breakdown spectroscopy, LIBS)技术是一种原子发射光谱分析技术, 可以在不做预处理的情况下, 同时对物质的多种元素成分进行分析, 具有快速检测的能力。 但LIBS的检测灵敏度仍然不足, 在实际应用中存在着较多限制。 因此, 光谱增强方法一直以来都是LIBS研究领域的热点。

常用的LIBS光谱增强方法有激光诱导荧光辅助激光诱导激光光谱(laser-induced breakdown spectroscopy-laser-induced fluorescence, LIBS-LIF)技术、 共振增强激光诱导击穿光谱(resonance-enhanced laser-induced breakdown spectroscopy, RELIBS)技术和共振激光诱导击穿光谱(resonance laser-induced breakdown spectroscopy, RLIBS)中, LIBS-LIF是其中增强倍数最高的, 可以有效的提高灵敏度和准确度。 LIBS-LIF是由加拿大多伦多大学的Kwong[12]在1979年首次提出并初步验证, 其原理是一束激光在待测样品表面烧蚀出等离子体, 再用另一束特定波长的激光辐照等离子体, 当该激光的单光子能量等于等离子体中待测元素原子上下能级之差时, 处于下能级的原子发生受激吸收跃迁至上能级, 上能级的原子再向下跃迁发射特征荧光信号, 从而增强分析元素的谱线。 近年来, LIBS-LIF已被应用于多个领域, Loudyi[13]等采用LIBS-LIF技术对水溶液中Pb和Fe进行检测, 检测极限分别为39和65 ppb, 比LIBS的检测极限分别低了490倍和570倍; Shen[14]等使用了LIBS-LIF技术在空气环境下对钢铁样品中的P进行了元素分析, 在最佳条件下P的检测极限达到了0.7 ppm; Shen[15]等用LIBS-LIF技术检测了核废料玻璃中残留的铀元素, 提出了等离子共振激发法。 上述研究在实验方法的选择以及实验参数上进行了优化, 但并没有考虑当基体原子与目标原子的特征谱线十分接近时, 基体谱线会受到影响, 将会导致一元定标准确度下降的问题。 而一种元素往往有多个特征谱线。

利用待测元素和基体元素的多条特征谱线结合其他强度较高的谱线通过多元线性回归的方法解决以上出现的激发干扰问题。 以钢铁中的Ni和Cr元素为例, 对比了一元定标(Ni Ⅰ 301.26 nm和Cr Ⅰ 428.99 nm)和多元定标拟合模型的决定系数(adjusted R-Square, R2)、 平均相对误差(average relative error, ARE)、 交叉验证均方根误差(root mean square error of cross validation, RMSECV)的变化情况, 深入研究了维度对拟合模型拟合效果的影响。

1 实验部分
1.1 仪器及参数

实验装置如图1所示。 由Nd:YAG脉冲激光器(Quantel Bigsky Ultual 100, 波长532 nm, 脉冲宽度6 ns, 重复频率10 Hz, 平顶高斯光斑分布)发出的激光束经过反射镜反射与透镜聚焦后投射到钢铁样品表面, OPO激光器(OPOTEK Inc., Vibrant HE 355 LD, 波长范围225~2 400 nm, 脉冲宽度10 ns, 平顶高斯光斑分布, 线宽20 cm-1, 重复频率10 Hz)激光束通过透镜聚焦后照射在样品并激发等离子。 激光激发的等离子光信息经多芯光纤收集后进入光谱仪(Andor Technology, Shamrock 500i, 光栅2 400线· mm-1), ICCD(Andor Technology, iStart 320T)将光谱仪收集到的光信号转换为电信号, ICCD门宽设置为10 ns。 两个激光器与ICCD通过数字延迟发生器(Stanford Research Systems, DG535)进行同步。 每一幅光谱图收集100采样点信息, 每个样品重复进行10次实验。 为了便于描述, 我们将OPO激光器发出的光称为“ LIF激光” , 采集含Ni样品光谱时, 将LIF激光设置为234.56 nm, 采集含Cr样品光谱时, 将LIF激光设置为357.87 nm。

图1 LIBS-LIF 实验装置图Fig.1 Schematic diagram of LIBS-LIF experimental setup

1.2 样品

实验用22个微合金钢样品, 其中7个购于中国钢铁研究总院、 8个购于美国国家技术研究所、 7个购于攀枝花钢铁研究院。 22个微合金钢样品的铬和镍含量如表1所示。

表1 微合金钢样品中Ni与Cr元素含量对照表(Wt%) Table 1 Concentrations of Cr and Ni in micro alloyed steel samples(Wt%)
1.3 多元线性回归法

多元线性回归最终的表达式为y=w0x0+w1x1+…+wnxn, 可简写成矩阵的形式Y=XW。 其中Y为因变量, X为自变量(X的第一列全为1, 作为偏置列), W为自变量的系数, 自变量维度为N

多元线性回归的目的是求出的W是最接近线性方程的解, 或者是使得残差平方和最小。

残差公式

ei=yi-y^i(1)

残差平方和

Q=i=1n(yi-y^i)2=eTiei=(y-Xw)T(y-xw)(2)

推导如式(3)— 式(7)

ei~N(0, σ2)(3)

L=i=1M12πσe-(yi-y^i)22σ2(4)

lnL=lni=1M12πσe-(yi-y^i)22σ2=i=1mlni=1M12πσe-(yi-y^i)22σ2(5)

=i=1mln12πσ-(yi-y^i)22σ2=m2πσ-i=1m(yi-y^i)22σ2(6)

maxlnLmini=1m(yi-y^i)2(7)

得出

QW=12(Y-XW)T(Y-XW)W=XT(XW-XTY)(8)

QW=0W=(XTX)-1XTY(9)

由式(8)和式(9)即可求得W, 从而得出多元线性拟合表达式。

多元线性拟合在已知多种类型的多组自变量和所对应的单组因变量时, 可以对他们之间的关系进行很好的拟合和预测, 并降低了一元线性拟合出现过拟合的可能性。

2 结果与讨论
2.1 多元线性拟合提高元素含量拟合准确度

利用Ni Ⅰ 301.26 nm与Cr Ⅰ 428.99 nm两条特征谱线数据建立Ni元素与Cr元素光谱强度与元素浓度的关系, 预测浓度和实际浓度的拟合结果如图2(a)和(b)所示, 可见, 在使用单一谱线进行拟合时, Ni元素与Cr元素一元线性拟合系数分别为0.960 1与0.992 0, 拟合效果较好, 但依旧具有提升空间。

图2 Ni元素(a)和Cr元素(b)的预测-真实一元线性拟合
为了进一步提高元素含量拟合准确度, 我们将22个样品进行LIBS-LIF实验并在300~311 nm范围内分别收集8条Ni和Fe原子谱线对Ni进行多元线性拟合, 在420~433 nm范围内选择10条Cr和Fe原子谱线对Cr元素进行多元线性拟合, 其光谱如图3(a)和(b)所示。
Fig.2 Results of Cr concentrations (a) and Ni concentrations (b) predicted by simple linear regression

图3 含Ni元素样品(a)含Cr元素样品(b)的 LIBS光谱强度Fig.3 LIBS spectral intensities of Ni containing samples (a) and Cr containing samples (b)

其多元线性拟合系数如表2所示。

表2 Ni和Cr元素多元线性拟合系数 Table 2 Regression coefficients of multiple linear regression

通过上述18条谱线数据建立Ni元素与Cr元素含量拟合模型, 拟合结果如图4(a)和(b)所示。

图4 Ni元素(a)和Cr元素(b)的预测-真实多元线性拟合
2.2 定标曲线准确度与拟合维度数关系分析
Fig.4 Results of Ni concentrations (a) and Cr concentrations (b) predicted by multiple linear regression

由图4可见, 在利用多元线性拟合处理后Ni元素拟合系数由0.960 1提高至0.992 9, Cr元素拟合系数由0.992 0提高至0.998 7, 拟合系数都有进一步的提高。

为探究多元线性拟合模型中拟合维度数变化对准确度的影响, 对不同拟合维度的平均相对误差ARE、 交叉验证均方根误差RMSECV、 决定系数R2随维度的变化情况进行分析, 同时为了避免干扰, 探究过程中不计入含量最低的两个样本数据。

2.2.1 拟合模型决定系数R2随维度数的变化

将拟合系数按从小到大的顺序逐渐去除对应的谱线, 并计算去除后的模型决定系数, 以此建立拟合维度数与实验决定系数R2的关系图, 结果如图5(a)和(b)。

图5 Ni元素(a)与Cr元素(b)决定系数-维度变化曲线Fig.5 The fitting coefficients of Ni(a) and Cr(b) with different dimensions

由图5可见, 决定系数R2随着回归模型的维度增加而增大。 通过多元线性拟合, Ni元素的线性回归模型决定系数由0.992 0增加至0.998 2, Cr元素的线性回归模型决定系数由0.960 1增加至0.992 9, 说明随着变量个数的增加回归模型的预测效果变得更加准确。

2.2.2 拟合模型相对误差ARE随维度数量的变化

将拟合系数按小到大的顺序逐渐去除对应的谱线, 并计算去除后的模型相对误差, 以此建立拟合维度数与实验相对误差ARE的关系, 结果如图6(a)和(b)。

图6 Ni元素(a)与Cr元素(b)平均相对误差-维度变化曲线Fig.6 ARE of Ni(a) and Cr(b) with different dimensions

从图6可见, 随着拟合维度数的增加, Ni和Cr元素含量拟合模型的平均相对误差都有所降低; Ni元素含量的回归模型平均相对误差整体都能控制在15%以内, 随着拟合维度的增加, 平均相对误差不断减小。 Cr元素回归模型的平均相对误差由50%降低至25%以内。 当拟合维度在6个和8个以上时, 线性回归模型的平均相对误差开始有一定的增大, 初步判断可能是多个维度的加入减少了过拟合的影响, 即降低单个维度独有的特征对拟合函数的影响。

从图6中可以看出Ni和Cr元素的多元线性拟合平均相对误差整体上随变量个数的增加而下降, 维度数越多, 就越能正确的估计元素含量。

2.2.3 拟合模型交叉验证均方根误差RMSECV随维度数的变化

交叉验证是一种统计学上将数据样本切割成较小子集的实用方法。 在给定的建模样本中, 拿出大部分样本进行建模, 留小部分样本用刚建立的模型进行预报, 并求这小部分样本的预报误差, 记录它们的平方加和。 这个过程一直进行, 直到所有的样本都被预报了一次而且仅被预报一次。 本实验采用的则是去一交叉验证法, 具体步骤为将20个样本中的19个样本作为训练集, 剩下的1个样本作为测试集。 每一个维度进行20次的交叉验证使之得出的结果与训练整个测试集的期望值最接近。 通过式(10)

RMSECV=i=1n(Yi-yi)2n(10)

式(10)中, Yi为样品值, yi为预测值, n为样品数, 计算结果如图7(a)和(b)所示。

图7 Ni元素(a)与Cr元素(b)交叉验证均方根 误差-维度变化曲线Fig.7 RESECV of Ni (a) and Cr (b) with different dimensions

由图7可见Ni元素的线性回归模型的RMSECV值在维度增加到两个后就已经趋近于一个较为稳定的数值, 约2%左右; 而Cr元素的线性回归模型的RMSECV值随着维度的增加, 分别在第四个和第六个维度有着较为明显的降低, 之后稳定在1.6%左右, 保持在较好的水平。 维度由小到大逐渐提升时, RMSECV的数值呈阶梯式下降, 待测元素和集体元素的多条特征谱线的引入降低了过拟合的程度, 不再会把某一个维度的特征当作趋势, 可以一定程度的降低过拟合带来的误差。 而两者拟合效果的变化差异主要在于各谱线的加入对拟合结果的影响不同, 但由图7可以看出, 两个元素的拟合模型效果基本在增加到六条谱线后能保持一个较好水平。

Ni和Cr元素在维度变化时它们各项参数的变化趋势存在一定差距, 其原因可以在多元线性拟合的系数中找到。 Cr元素不论是误差还是R2普遍都在谱线增加到3~4条时才有较为明显的变好, 可以看到Cr元素的多元线性拟合系数的前四项均十分接近。 初步推断是由于这四条谱线的权重在拟合方程中十分接近, 每增加一条谱线, 拟合模型都要增加其相应谱线的特征, 所以误差和决定系数不能很好的体现出模型的优化。 而Ni元素其第一条谱线占比的权重最大, 第二条谱线的加入对其影响会降低, 推断其第二条谱线的特征与第一条的特征较为接近, 所以在第二条谱线加入后RMSECV值降低较快, 产生了一定的过拟合现象, 也是ARE值变化不大原因。

由决定系数、 评价相对误差、 交叉验证均方根误差这三项指标可以看出, 随着维度的增加, 拟合模型越来越准确, 误差也逐渐降低。 引入了待测元素和集体元素的多条特征谱线后, 降低了过拟合的程度。

3 结论

通过待测元素和基体元素的多个特征谱线对Ni和Cr元素含量进行多元线性拟合分析, 随着特征谱线的增加, Ni和Cr元素的线性拟合模型决定系数R2、 平均相对误差ARE、 交叉验证均方根误差RMSECV都随拟合维度的增加不断改善, 最终实现LIBS-LIF分析准确度的提高: ①Ni元素线性拟合系数提升至0.998 2, Cr元素拟合系数提升至0.992 9; ②Ni元素线性拟合相对误差降低至15%以内, Cr元素线性拟合相对误差降低至25%以内; ③Ni和Cr元素线性拟合交叉验证均方根误差控制在2%左右。

通过引入待测元素和基体元素的多个特征谱线对Ni和Cr元素含量进行多元线性拟合分析, 提高了拟合模型的准确度。 不再依赖待测元素的单条谱线, 是解决激发干扰问题的可行方案。

参考文献
[1] Wu J J, Ma W H, Yang B, et al. Transactions of Nonferrous Metals Society of China, 2009, 19(2): 463. [本文引用:1]
[2] Caruso A N, Dowben P A, Balkir S, et al. Materials Science and Engineering: B-Advanced Functional Solid-State Materials, 2006, 135(2): 129. [本文引用:1]
[3] Robertson B W, Adenwalla S, Harken A, et al. Applied Physics Letters, 2002, 80(19): 3644. [本文引用:1]
[4] Dudragne L, Adam P, Amouroux J. Applied Spectroscopy, 1998, 52(10): 1321. [本文引用:1]
[5] Edelson M C, Fassel V A. Analytical Chemistry, 1981, 53(14): 2345. [本文引用:1]
[6] Liu H, Quentmeier A, Niemax K. Spectrochimica Acta Part B: Atomic Spectroscopy, 2002, 57(10): 1611. [本文引用:1]
[7] Mantler M, Schreiner M. X-Ray Spectrometry: An International Journal, 2000, 29(1): 3. [本文引用:1]
[8] Yang L, Mcrae R, Henary M M, et al. Proceedings of the National Academy of Sciences, 2005, 102(32): 11179. [本文引用:1]
[9] Belu A M, Graham D J, Castner D G. Biomaterials, 2003, 24(21): 3635. [本文引用:1]
[10] Lhoest J B, Wagner M S, Tidwell C D, et al. Journal of Biomedical Materials Research: An Official Journal of the Society for Biomaterials, The Japanese Society for Biomaterials, and the Astralian Society for Biomaterials and the Korean Society for Biomaterials, 2001, 57(3): 432. [本文引用:1]
[11] Platzner I T, Habfast K, Walder A J, et al. Modern Isotope Ratio Mass Spectrometry, Wiley Chichester, 1997. [本文引用:1]
[12] Kwong H S, Measures R M. Analytical Chemistry, 1979, 51(3): 428. [本文引用:1]
[13] Loudyi H, Rifai K, Laville S, et al. Journal of Analytical Atomic Spectrometry, 2009, 24(10): 1421. [本文引用:1]
[14] Shen X K, Wang H, Xie Z Q, et al. Applied Optics, 2009, 48(13): 2551. [本文引用:1]
[15] Shen X K, Lu Y F. Applied Optics, 2008, 47(11): 1810. [本文引用:1]