激光诱导击穿光谱定量分析锂矿石中锂元素
付洪波1, 吴边1, 王华东1, 张梦阳1,2, 张志荣1,2,*
1.中国科学院合肥物质科学研究院, 安徽光学精密机械研究所, 光子器件与材料安徽省重点实验室, 安徽 合肥 230031
2.中国科学技术大学, 安徽 合肥 230026
*通讯作者 e-mail: zhangzr@aiofm.ac.cn

作者简介: 付洪波, 1985年生, 中国科学院合肥物质科学研究院副研究员 e-mail: fuhongbo@aiofm.ac.cn

摘要

锂元素具有优良的物理和化学性能, 因而在军事、 电池、 特种合金、 受控热核反应等领域具有重要作用。 现有的锂矿石分析主要是基于酸分解的原子吸收光谱、 电感耦合等离子体质谱或原子发射光谱等离线方法。 激光诱导击穿光谱(LIBS)是一种无需样品制备、 适用于低原子序数元素(包括锂)的原子发射光谱方法。 采用LIBS技术, 实验采集了11种锂矿石成分分析标准物质的等离子体发射光谱, 分别在610.35和670.78 nm附近观测到了Li的特征峰, 但由于谱线的重叠, 无法应用单变量线性回归进行建模。 在全谱积分强度标准化基础上, 分别使用偏最小二乘回归(PLSR)和基于主成份分析的支持向量回归(PCA+SVR)对锂矿石标准物质中的锂含量进行建模。 校准模型的相关参数通过留一组交叉验证均方根误差(RMSECV)来确定。 结果表明, 相较于PCA+SVR校准模型, PLSR的决定系数( R2)更大, 校准均方根误差(RMSEC)更小, 但预测均方根误差(RMSEP)远大于RMSEC, 存在过拟合现象。 另一方面, PCA+SVR计算得到的RMSEP和平均相对误差(MRE)相对于PLSR更小, 因此认为PCA+SVR模型拥有更好适应度。 从而证明, LIBS技术可以实现锂矿石中Li含量的分析, 有望应用于位于传送带上锂矿石的原位在线定量分析。

关键词: LIBS; 锂矿石; PLSR; PCA; SVR
中图分类号:O433.4 文献标志码:A
Quantitative Analysis of Li in Lithium Ores Based on Laser-Induced Breakdown Spectroscopy
FU Hong-bo1, WU Bian1, WANG Hua-dong1, ZHANG Meng-yang1,2, ZHANG Zhi-rong1,2,*
1. Anhui Provincial Key Laboratory of Photonics Devices and Materials, Anhui Institute of Optics and Fine Mechanics, Hefei Institutes of Physical Sciences, Chinese Academy of Sciences, Hefei 230031, China
2. University of Science and Technology of China, Hefei 230026, China
*Corresponding author
Abstract

Lithium has excellent physical and chemical properties, so it plays an important role in military, battery, special alloy, controlled thermonuclear reactions and other fields. The existing lithium ore analysis methods are mainly off-line methods such as atomic absorption spectrophotometry, inductively coupled plasma mass spectrometry or atomic emission spectrometry based on acid decomposition. Laser-induced breakdown spectroscopy (LIBS) is an atomic emission spectroscopy method without sample preparation and is suitable for low atomic number elements (including lithium). The plasma emission spectra of 11 lithium ore composition analysis reference materials were collected experimentally using LIBS technology. The characteristic peaks of Li were observed near 610.35 and 670.78nm respectively. However, due to the overlap of spectral lines, univariate linear regression cannot be used for modeling. Based on the standardization of full-spectrum integral intensity, partial least squares regression (PLSR) and support vector regression based on principal component analysis (PCA + SVR) are used to model the lithium content in lithium ore reference materials. The relevant parameters of the calibration model are determined by the root to mean square error of the cross-validator (RMSECV). The results show that compared with PCA + SVR calibration model, the determination coefficient ( R2) of PLSR is larger, and the calibration root mean square error (RMSEC) is small, but the prediction root mean square error (RMSEP) is much larger than RMSEC, and there is an overfitting phenomenon. On the other hand, the RMSEP and mean relative error (MRE) calculated by PCA + SVR are smaller than PLSR, so we think that PCA + SVR model has good adaptability. This work proves that LIBS technology can analyse Li content in lithium ore and is expected to be applied to the in-situ online quantitative analysis of lithium ore on a conveyor belt.

Keyword: LIBS; Lithium ore; PLSR; PCA; SVR
引言

锂(Li)是自然界中原子序数最低的金属元素, 具有优良的物理和化学性能。 在高能锂电池、 受控热核反应的应用中, 锂成为解决人类长期能源供给的重要原料。 20世纪50年代, 由于研制氢弹的需要, 锂工业得到迅速发展, 锂成为生产氢弹、 中子弹、 质子弹的重要原料。 此外, 锂的化合物还广泛用于玻璃、 陶瓷、 炼铝、 锂基润滑脂以及空调、 医药、 有机合成等众多工业领域。 现有的锂矿石分析方法主要包括ICP-AES[1, 2]、 ICP-MS[3]等, 其具有精密度高, 准确度可靠的优点, 但都需要复杂的样品前处理过程, 无法在开采、 传输过程中实现实时在线检测。

激光诱导击穿光谱(LIBS)是通过汇聚高能脉冲激光到样品表面产生等离子体, 进而对等离子体发射光谱进行分析以确定样品的元素种类及含量的一种发射光谱分析技术。 由于采用脉冲激光作为激发源, 因此该技术无需繁琐的样品预处理过程, 可在恶劣环境条件或是远程遥测下进行成分分析。 正是由于LIBS的众多优点其被广泛应用于地质矿物的分析[4], 例如磷矿石[5]、 铁矿石[6, 7, 8]、 铜矿石[9]等。 LIBS技术在锂矿石分析方面的研究相对较少, Romppanen等[10]基于顶点成分分析(VCA)、 K均值和DBSCAN等统计方法识别了伟晶岩型锂矿中的锂辉石。

本研究通过LIBS技术对锂矿石标准物质中的锂含量进行分析, 解析了其光谱特性, 并分别建立和评估了偏最小二乘回归(PLSR)和基于主成分分析的支持向量回归(PCA+SVR)校准模型, 为应用LIBS原位在线分析锂矿石奠定理论和实验基础。

1 实验部分

LIBS实验装置示意图如图1所示。 激发源为调Q Nd∶ YAG激光器(Laser), 波长为1064 nm、 单脉冲能量约50 mJ和重复频率为5 Hz。 激光束(laser beam)经扩束器(beam expander)扩束和二向色镜1(dichroic mirror 1)反射后, 通过焦距为100 mm的会聚透镜1(Lens 1)聚焦到放置于三维电动平移台上的样品(sample)表面。 等离子体(plasma)发出的光经过会聚透镜和二向色镜1后, 由二向色镜2(dichroic mirror 2)反射, 经会聚透镜2(Lens 2)汇聚到光纤端面, 并传输到光谱仪记录。 光谱仪为4通道光纤光谱仪(spectrometer), 波长覆盖范围为230~750 nm, 积分时间为1.05 ms, 延迟时间为1.28 μ s。 实验装置完全由软件控制, 光谱数据由计算机存储和分析。 二向色镜2的反射和透射比约为9∶ 1, 少部分光经过透镜3(Lens 3)成像于相机, 以便于观察激光激发位置, 并实现自动聚焦[11]。 为了获得用于激光烧蚀的均匀表面, 将11个锂矿石成分分析标准物质样品以25 MPa的压力压成薄饼, 并保持压力1分钟。 每个实验样品随机选择5个点进行激发, 为了减少意外的测量波动, 每幅光谱通过30个脉冲进行平均。 实验样品中的Li含量(Wt%)如表1所示, 其中样品S06所测量光谱数据作为测试集, 其余样品作为训练集和验证集。

图1 实验装置示意图Fig.1 Schematic diagram of the experimental setup

表1 样品中Li的含量(Wt%) Table 1 Contents of Li in the samples (Wt%)

分别使用PLSR和PCA+SVR方法, 对锂矿石标准物质中的锂含量进行回归分析。 模型的构建和优化均在Anaconda3环境下使用Python 3.8进行编码, 并以Scikit-learn库[12]作为实现上述化学计量方法的基础。

采用留一组交叉验证均方根误差(RMSECV)确定校准模型相关参数, 应用决定系数R2、 平均相对误差(MRE)、 校准均方根误差(RMSEC)和预测均方根误差(RMSEP)综合评估校准模型的适应度, 它们分别定义为

${{R}^{2}}\left( \text{y},\hat{y} \right)=1-\frac{\overset{n}{\mathop{\mathop{\sum }_{i=1}}}\,{{({{y}_{i}}-{{{\hat{y}}}_{i}})}^{2}}}{\overset{n}{\mathop{\mathop{\sum }_{i=1}}}\,{{({{y}_{i}}-{{{\bar{y}}}_{i}})}^{2}}}$(1)

$\text{RMSE}\left( y,\hat{y} \right)=\sqrt{\frac{\overset{n}{\mathop{\mathop{\sum }_{i=1}}}\,{{({{y}_{i}}-{{{\hat{y}}}_{i}})}^{2}}}{n}}$(2)

$\text{MRE}\left( y,\hat{y} \right)=\frac{1}{n}\overset{n}{\mathop{\underset{i=1}{\mathop \sum }\,}}\,\frac{\left| {{y}_{i}}-{{{\hat{y}}}_{i}} \right|}{{{y}_{i}}}\times 100\text{ }\!\!%\!\!\text{ }$(3)

其中n为训练集或验证集中的样本数, yi表示样本i的标准值, $\bar{y}=\frac{1}{n}\overset{n}{\mathop{\underset{i=1}{\mathop \sum }\,{{y}_{i}}}}\,$为训练集中所有含量的平均值,$ \hat{y}$为预测值。

2 结果与讨论
2.1 定性分析

锂矿石成分分析标准物质的典型LIBS光谱如图2所示。 对比NIST数据库可以发现样品中同时存在Al, Ca, Si, Na和Li等元素的特征谱线。 Li Ⅰ 的强线670.776和670.791 nm相互重叠无法分解, 而Li Ⅰ 的610.354和610.365 nm谱线还与Ca Ⅰ 610.272 nm相互叠加。 因此, 直接采用单变量线性回归计算得到的回归系数难以获得理想的定量分析结果。

图2 锂矿石的典型光谱Fig.2 Typical spectra of Lithium ore

2.2 PLSR

PLSR是一种基于因子分析的多元统计分析方法, 可以有效消除多重相关性。 主成分(PC)的数量是影响PLSR模型的关键参数, 采用留一组交叉验证均方根误差(RMSECV)的大小来确定最佳PC数。 图3显示了校准模型的RMSECV与PC数量之间的关系。 当RMSECV处于最小值或恒定值时, 确定最佳PC数为6, 并用于构建PLSR校准模型。

图3 PLSR校准模型的RMSECV随PC数量的变化Fig.3 The RMSECV of the PLSR calibration model varying with the number of PCs

锂矿石中Li元素含量的PLSR预测模型如图4所示。 校准模型的训练集R2=0.999 83, RMSEC=0.007 95, 测试样品S06的RMSEP=0.230 42, MRE=13.98%。 虽然PLSR校准模型的R2和RMSEC非常好, 但是RMSEP约是RMSEC的30倍, 因此我们认为PLSR模型非常可能存在过拟合。

图4 PLSR预测模型Fig.4 PLSR prediction model

2.3 PCA+SVR

主成分分析(PCA)也称主分量分析, 旨在利用降维的思想, 把多指标转化为少数几个综合指标。 采用PCA降低LIBS数据维度, 以可解释方差比率大于95%作为选取主成分数的阈值, 最终选择前4个主成分作为SVR的输入。 可解释方差比率随PCA主成分数的变化如图5所示。 PCA前两个成份的负载如图6所示, 对比锂矿石的典型光谱图2可以看出, PCA不仅成功解析了Li的670.776和670.791 nm谱线, 而且有效识别除了Li Ⅰ 在610.35 nm附近的光谱, 并包含锂矿石中的主要成分Ca和Al谱线等。

图5 可解释方差比率随PCA主成分数的变化Fig.5 The explained variance ratio changes with PCA principal component number

图6 前两个主成分的负载图Fig.6 Loadings plots of the first two principal components

SVR是一种基于结构风险最小化思想的回归方法, 具有良好的泛化性能。 通过使用非线性核函数, SVR可以将光谱数据映射到更高维空间。 在本实验中采用RBF内核, 以RMSECV作为目标函数, 并使用留一组交叉验证方法优化正则化参数C。 RMSECV随C的变化如图7所示, 最终确定C=7。

图7 RMSECV随SVR正则化参数C的变化Fig.7 Variation of RMSECV with regularization parameter C of SVR

锂矿石中Li元素含量的PCA+SVR预测模型如图8所示。 校准模型的训练集R2=0.981 25, RMSEC=0.081 15, 测试样品S06的RMSEP=0.061 09, MRE=3.81%。 相较于PLSR校准模型, PCA+SVR的R2更小, RMSEC更大, 表面上看来其校准效果不如PLSR, 但是其RMSEP与RMSEC相差并不大, 基本可排除过拟合的存在, 而且PCA+SVR计算得到的测试集的MRE相对于PLSR模型更小, 因此我们认为PCA+SVR模型相对于PLSR模型的适用度更好。

图8 PCA+SVR预测模型Fig.8 PCA+SVR prediction model

3 结论

由于Li特征谱线之间, 以及与其他元素谱线的相互重叠, 难以采用单变量线性回归模型对锂矿石中的锂含量进行定量分析, 因此尝试基于机器学习的PLSR和PCA+SVR算法对锂含量建模。 PLSR获得了更好的校准效果, 但测试集精确度较差, 且存在过拟合风险。 相对而言PCA+SVR校准模型获得了更好地测试集定量分析精确度。 证明了LIBS技术可以实现锂矿石中Li含量的分析, 有望应用于传送带上锂矿石的原位在线定量分析应用。

参考文献
[1] XU Hong-liu(徐洪柳). Chinese Journal of Inorganic Analytical Chemistry(中国无机分析化学), 2020, 10(3): 33. [本文引用:1]
[2] SHI Hua, LIU Dao, ZHAO Yu-qing(石华, 刘氘, 赵玉卿). Chemical Engineer(化学工程师), 2017, 31(9): 24. [本文引用:1]
[3] LI Shi-rong(李诗瑢). China Petroleum and Chemical Stand ard and Quality(中国石油和化工标准与质量), 2016, 36(10): 97. [本文引用:1]
[4] Harmon R S, Lawley C J M, Watts J, et al. Minerals, 2019, 9(12): 718. [本文引用:1]
[5] Asimellis G, Giannoudakos A, Kompitsas M. Spectrochimica Acta Part B: Atomic Spectroscopy, 2006, 61(12): 1253. [本文引用:1]
[6] Yang Y, Li C, Liu S, et al. Anal. Methods, 2020, 12(10): 1316. [本文引用:1]
[7] YANG Ya-wen, YAN Cheng-lin, XU Ding, et al(杨雅雯, 严承琳, 徐鼎, ). Metallurgical Analysis(冶金分析), 2020, 40(12): 14. [本文引用:1]
[8] CHEN Qi-meng, DU Min, HAO Zhong-qi, et al(陈启蒙, 杜敏, 郝中骐, ). Spectroscopy and Spectral Analysis(光谱学与光谱分析), 2016, 36(5): 1473. [本文引用:1]
[9] Ahmad N, Ahmed R, Umar Z A, et al. Appl. Phys. B, 2018, 124(8): 160. [本文引用:1]
[10] Romppanen S, Polonen I, Hakkanen H, et al. Appl. Spectrosc. Rev. , 2021, doi: DOI:10.1080/05704928.2021.1963977. [本文引用:1]
[11] WANG Hua-dong, FU Hong-bo, JIA Jun-wei, et al(王华东, 付洪波, 贾军伟, ). Acta Photonica Sinica(光子学报), 2019, 48(6): 630001. [本文引用:1]
[12] Pedregosa F, Varoquaux G, Gramfort A, et al. Journal of Machine Learning Research, 2011, 12: 2825. [本文引用:1]