最优化算法在EDXRF谱线拟合中的应用
刘明博1,2,3, 廖学亮3, 胡学强3, 韩冰3, 沈学静1,2,3, 陈吉文4, 王国华5, 王海舟1,2,3,*
1. 钢铁研究总院, 北京 100081
2. 金属材料表征北京重点实验室, 北京 100081
3. 钢研纳克检测技术股份有限公司, 北京 100081
4. 北方工业大学电气与控制工程学院, 北京 100144
5. 北京大学附属中学, 北京 100080
*通讯联系人 e-mail: wanghaizhou@ncschina.com

作者简介: 刘明博, 1981年生, 钢铁研究总院博士研究生 e-mail: liumingbo@ncschina.com

摘要

在X射线荧光光谱(EDXRF)测试中, 由于探测器分辨率的影响, 谱线会有不同程度的展宽, 多元素存在时谱线还会有一定的重叠。 获得纯净的谱线强度, 并保证准确测试结果的过程, 通常被称为EDXRF解谱。 传统的解谱方法包括感兴趣区加和、 纯元素谱线剥离以及干扰系数法等, 但这些方法在解决EDXRF解谱问题时都有不同程度的局限性。 最优化算法本质上是一种多自变量求极值的方法, 首先列出具有多个自变量参数并能够描述真实物理学过程的目标方程, 然后设定参数初值和边界条件, 通过数学(如共轭梯度法)的运算, 得到最优化的目标方程解。 将最优化计算的思想应用于EDXRF解谱过程中, 假设EDXRF谱图是一系列理想高斯峰的叠加, 可以列出其与原始谱图残差的目标方程, 根据物理学现象对这些高斯峰的高度、 位置和宽度三个参数分别进行估计, 此时目标方程的值通常较大, 通过设定所有参数各自的边界条件, 用共轭梯度法不断调整, 做最优化计算, 直至该值达到极小, 此时多峰叠加的结果与实测谱最为贴合, 解谱精度大大提高。 利用这种方法研究开发了能用于商业化EDXRF仪器的软件程序。 对最优化计算用于EDXRF解谱的方法进行了介绍, 并以Pr和Nd混合液的L系EDXRF谱图的解析举例, 这段谱线由11个谱峰组成, 通过设定33个高斯峰参数的初始值, 用共轭梯度法执行33个自变量的最优化计算, 运行于普通计算机, 经过580 ms的计算, 拟合谱与实测谱的残差从37.645减小为1.699 4, 二者在对比谱图上也极为吻合, 从而说明这是一种比较有效的谱线拟合方法。 通过对结果的分析还发现, 部分谱线的宽度发生了变化, 真实地反映了该条谱线是由多条相邻谱线构成的事实。 研究创新性在于, 将数学中的最优化计算原理应用于EDXRF谱图解析过程中, 获得了较好的效果, 并以较为复杂的Pr和Nd双稀土元素的L系谱线解析为例进行了说明。

关键词: X射线荧光光谱; 能谱; 解谱; 最优化计算
中图分类号:O582 文献标志码:A
Application of Optimize Method in EDXRF Spectrum Unfolding
LIU Ming-bo1,2,3, LIAO Xue-liang3, HU Xue-qiang3, HAN Bing3, SHEN Xue-jing1,2,3, CHEN Ji-wen4, WANG Guo-hua5, WANG Hai-zhou1,2,3,*
1. Central Iron and Steel Research Institute, Beijing 100081, China
2. Beijing Key Laboratory of Metal Materials Characterization, Beijing 100081, China
3. NCS Testing Technology Co., LTD., Beijing 100081, China
4. School of Electrical and Control Engineering, North China University of Technology, Beijing 100144, China
5. The Affiliated High School of Peking University, Beijing 100080, China
*Corresponding author
Abstract

With the restriction of detector resolution in EDXRF, the peaks will be widened, and the overlapping of several peaks cannot be neglected especially in multi elements sample. The process of achieving the intensity of pure peaks, named spectrum unfolding is difficult. There are three unfolding methods traditionally, ROI integration, pure element peeling, and the coefficient method. Both of the methods cannot unfold the complex EDXRF spectrum perfect. In this work, we introduce an optimized algorithm to EDXRF spectrum unfolding process. Pure peaks, processed by applying the smooth and debackground operation to raw spectrum, can be considered as the sum of several Gaussian peaks, which can be formulated by Gaussian functions with 3 parameters each, height, width and position. By alternating the values of the 3N parameters within certain boundary conditions, the error between theory function and raw spectrum can be smaller and smaller. In mathematics, this alternating process can be finished by Optimize algorithm. When we developed the algorithm by 3N parameters Conjugate Gradient Method and coding the program, an EDXRF spectrum of Pr/Nd solution was studied. Sum of 11 Gaussian peaks with 33 parameters was very well closed to the raw spectrum composed of 11 L-series peaks of Pr and Nd, and the error calculated changed from 37.645 to 1.699 4. The innovative of this paper is the application of optimized method in complex EDXRF spectrum unfolding process.

Keyword: Energy dispersive X-ray fluorescence; Energy spectroscopy; Spectrum unfolding; Optimization calculation
引 言

在能量色散X射线荧光光谱(EDXRF)分析中, 当多种元素共存时, 由于探测器分辨率的影响, 谱线重叠不可避免, 要得到准确的谱峰强度(或峰面积), 即解谱就变得十分困难, 而要在后续的标定或测试时得到准确的结果, 却又必须有待测谱线的准确强度。 因此解谱就成了EDXRF的关键技术。 普遍采用的解谱方法包括感兴趣区积分(ROI)法、 纯元素谱扣除法、 干扰系数法[1, 2]等, 以图1所示的Pr和Nd混合液样品谱图的解析为例分别介绍三种方法。

图1 某Pr和Nd混合液样品的EDXRF谱图局部Fig.1 A part of Pr/Nd solution EDXRF spectrum

感兴趣区积分法是划定谱线左右边界直接对区域内的信号进行累加, 这种方法仅适用于谱线比较简单的情况, 当有一定的重叠时就会有很大偏差, 如图1中Pr∶ La和Nd∶ La由于重叠而被互相抬高, 划定区域积分会导致2个峰的强度都偏大。

纯元素谱扣除方法需要先在相同的测试条件下采集所有待测元素对应纯物质的谱图, 在测试混合样品时依一定的次序将纯物质谱剥离, 但当谱线有重叠时, 先扣除的谱强度偏大, 后扣除的则偏小, 另外由于吸收增强效应的存在, 在混合样品中单元素的谱峰分布会与纯物质中的不同, 也会引起解谱误差。 如图1中, 用纯元素谱扣除方法进行解谱时, 无论用哪个峰对齐进行扣除都会导致偏差的产生, 此外由于高浓度的Pr和Nd共存, 两种物质的谱分量形状跟纯物质有很大不同, 更会引起解谱误差。 如果结合基本参数法和最优化方法的计算对纯元素扣除方法进行矫正, 是一种比较精确的方法。

干扰系数法则是根据谱峰位置, 计算谱峰重叠干扰程度, 确定相邻峰在叠加峰中的比例, 但这种方法仅适用于两个峰的情形, 当多峰共存时, 由于干扰系数过于复杂, 误差将无法预料, 图1中11个峰共存, 每个峰都会受到相邻峰的干扰, 用这种方法的解谱误差会很大。

简单的感兴趣区积分法、 纯元素谱扣除法和干扰系数法都无法很好地对图1的谱图完成精确的解析。 本文介绍了一种基于最优化算法(optimize method)的多高斯函数拟合算法, 用于EDXRF谱线的解析。

1 最优化算法

最优化算法本质上是一种多元函数求极值的数值计算方法, 通过对一系列自变量设定初值, 代入约束函数并计算与目标值的偏差, 以一定的规则改变自变量分布, 迭代计算偏差, 直到计算的偏差结果达到极小值, 即认为得到了最优的自变量分布。 最优化计算方法在工程设计、 理化分析甚至人文和社会科学等领域都有广泛应用。 但在EDXRF的解谱方面, 却少有应用的先例。

最优化计算过程通常是寻找多自变量非线性方程的极值, 往往需要大量的数值计算来完成, 在过去计算能力不足时, 往往通过减少参量、 精确设定初值来减少运算量, 但随着现代计算机技术的发展, CPU采用多核主频达数GHZ, 计算机就可以在一秒时间内完成数十自变量的最优化计算, 因此更精确的优化计算变得非常容易。 在此条件下, 研究中将复杂的最优化计算引入看似简单实则极其复杂的EDXRF解谱过程中。

2 最优化算法的谱线拟合

EDXRF谱图可以看成一系列符合高斯分布的谱峰叠加在连续背景上的结果, 在执行了有效的背景扣除算法之后, 谱图就可以看成是一系列不同高度、 位置和宽度的高斯函数的加和。

一个独立的高斯函数由高度A、 位置c、 代表宽度的ω 三个参数确定

y=Aexp-(x-c)22ω2(1)

n个高斯函数组成的XRF谱图可以如式(2)表示

yi=j=1nAjexp-(i-cj)22ωj2(i=1, 2, 3, , 2048为谱图道址)(2)

其与原始谱图Yi的残差

σ=i=12048(Yi-yi)2=i=12048Yi-j=1nAjexp-(i-cj)22ωj22(3)

式(3)中, 道址i和原始谱Yi为已知量; Aj, cj, ω j(j=1, 2, 3, …, n)为自变量, 分别表示n个高斯函数的高度、 位置和宽度参数。

上述自变量还需要满足下列边界条件:

(1) Aj> 0, 高斯函数高度不能为负;

(2) |cj-cj0|< 3, 探测器在开机经过峰位微调后, 峰位cj与其假设的初始值偏差不会过大;

(3) 0.8< |ω jj0|< 1.25, 谱线宽度与其初始假设值不能偏差过大, 即谱线分辨率不会与理论值有较大偏差, 但考虑到部分谱线可能由多条谱线叠加而成, 因此宽度范围适度放大。

利用最优化算法对有3n个自变量的式(3)求极值, 即可得到一列自变量分布, 此时, 在数值上σ 最小, 表现为拟合得到的n个高斯峰叠加结果与原始谱图最为接近。

3 实际应用

以图1所示Pr和Nd混合溶液的EDXRF谱图解析为例, 在4.77.0 keV能量范围内, 执行了背景扣除和峰位识别后, 可以认为该谱图由Pr和Nd的各6条较为明显的L系谱线高斯峰构成, 根据谱峰能量确定高斯峰的位置初始值cj0, 根据该位置处的谱峰高度确定高度初始值Aj0, 根据探测器分辨率和能量的关系确定宽度初始值ω j0

表1中12条谱线11个谱峰(Nd: Lg1和Pr: Lg2, 3能量过于接近, 合并为1个峰)所对应高斯函数的33个参数, 代入式(3)中, 此时11个高斯峰叠加结果与原始谱图的对比关系如图2(a)所示, 两者差异明显, 残差高达37.645。

表1 谱峰参数初始估计值 Table 1 Initial guess of gaussian peak parameters

图2 (a)初始估计参数构成的11个高斯峰叠加结果与原始谱图的对比; (b)最优化计算后的高斯峰叠加与原始谱图的对比Fig.2 (a) Composition of 11 Gaussian peaks with initial guess parameters and the raw spectrum; (b) Composition of 11 Gaussian peaks with parameters optimized and the raw spectrum

表1的33个参数为残差方程的初始值, 用共轭梯度算法进行最优化计算之后, 11个高斯函数的参数如表2所列, 叠加结果与原始谱图对比如图2(b)所示, 吻合度较好, 残差也减小为1.699 4。

表2 谱峰参数优化结果 Table 2 Parameters of Gaussian peaks optimized

表1表2的对比可以发现, 宽度偏差较大, 这是由于部分峰(如Lb1等)实际是由一系列位置比较接近的谱峰叠加而成的, 这会导致实际峰型宽度变大, 初始估计时忽略这一现象, 但最优化计算会对其进行弥补; 高度偏差较大, 说明初始的粗略估计有偏差; 峰位差异不明显。

用EDXRF仪器测试, 最优化算法解谱, 经过标定之后, 对某一稀土湿法生产线上Pr/Nd混合液样品中的Pr和Nd含量配分进行多次连续测试, 并与ICP方法测得结果进行比对, 结果如表3。 该方法稳定性较好, RSD< 0.2%, 准确性与ICP标准方法相差0.08, 相对较小。

表3 实际测试及与ICP方法比对 Table 3 Comparation of EDXRF and ICP test
4 结 论

借助于现代计算机和软件技术, 在普通PC上大计算量的数值模拟计算变得可能, 本研究将最优化计算方法应用于看似简单的EDXRF谱图解析过程中, 通过对Pr和Nd混合液EDXRF谱图的解析举例可见, 拟合的谱图与实测谱图的残差较少, 吻合也较好, 可以大幅度提高解谱精度, 且计算的理论结果与实测结果自动匹配, 需要的人工干预较小, 该方法可以在EDXRF解谱过程中推广应用。

参考文献
[1] JI Ang, TAO Guang-yi, ZHUO Shang-jun, et al(吉昂, 陶光仪, 卓尚军, ). X-Ray Fluorescence Spectrum Analysis(X射线荧光光谱分析). Beijing: Science Press(北京: 科学出版社), 2003. 99 [本文引用:1]
[2] GUO Cheng, LAI Wan-chang, YI Xin, et al(郭成, 赖万昌, 易欣, ). Science and Technology of West China(中国西部科技), 2013, (4): 46. [本文引用:1]