小波变换导数法X射线荧光光谱自适应寻峰研究
汪雪元1,2,3, 何剑锋1,2,3,*, 刘琳1,2,3, 聂逢君2
1.东华理工大学江西省放射性地学大数据技术工程实验室, 江西 南昌 330013
2.东华理工大学江西省核地学数据科学与系统工程技术研究中心, 江西 南昌 330013
3.东华理工大学软件学院, 江西 南昌 330013
*通讯联系人 e-mail: hjf_10@yeah.net

作者简介: 汪雪元, 1977年生, 东华理工大学软件学院讲师 e-mail: wangxueyuan@ecit.cn

摘要

重峰分辨能力和弱峰识别能力是衡量X射线荧光光谱寻峰的关键性指标, 常见寻峰方法难以同时满足较高的重峰分辨能力和弱峰识别能力。 应用单个常见寻峰方法对复杂地质样品的X射线荧光光谱寻峰, 往往难以识别出光谱中所有的特征峰。 通过对导数法、 小波变换法等经典寻峰方法的分析, 可知: 导数法具有较强的弱峰识别能力, 但光谱的光滑效果影响光谱寻峰结果; 小波变换法具有较强的重峰分辨能力, 但小波分解尺度的选择影响光谱寻峰结果。 提出了一种基于导数法和小波变换法的X射线荧光光谱自适应寻峰算法。 该算法先对原始光谱进行连续小波变换, 得到不同分解尺度的小波变换系数谱; 然后对不同分解尺度的小波变换系数谱进行一阶导数寻峰并合并寻峰结果; 最后根据X荧光分析仪的能量刻度和元素特征X射线参数表确定原始光谱中元素特征峰。 该算法在寻峰过程中, 无需对原始光谱进行光滑, 也无需确定光谱的小波变换分解尺度。 应用一阶导数法、 连续小波变换法和该算法对一标准样品的X射线荧光光谱进行寻峰。 实验结果表明: 该算法具有较高的重峰分辨能力和弱峰识别能力, 优于导数法和小波变换法在寻峰中的表现, 并在实际应用生产中取得了优良效果。

关键词: X射线荧光光谱; 寻峰; 导数法; 小波变换
中图分类号:O433.4 文献标志码:A
Research on Adaptive Peak Detection of X-Ray Fluorescence Spectrum With Wavelet Transform and Derivative Method
WANG Xue-yuan1,2,3, HE Jian-feng1,2,3,*, LIU Lin1,2,3, NIE Feng-jun2
1. Jiangxi Engineering Laboratory on Radioactive Geoscience and Big Data Technology, East China University of Technology, Nanchang 330013, China
2. Jiangxi Engineering Technology Research Center of Nuclear Geoscience Data Science and System, East China University of Technology, Nanchang 330013, China
3. Software College, East China University of Technology, Nanchang 330013, China
*Corresponding author
Abstract

The ability to resolve overlapping and weak peaks is the key index to measure the peak-finding ability of X-ray fluorescence spectroscopy. It is difficult for common peak-finding methods to simultaneously satisfy higher peak resolution ability and weak peak recognition ability. It is difficult to identify all characteristic peaks in X-ray fluorescence spectra of complex geological samples by a single common peak-finding method. Through the analysis of the derivative method, wavelet transform method and other classical peak-finding methods, we can see that derivative method has a strong ability to identify weak peaks, but the smoothness of the spectrum affects the results of peak-finding; wavelet transform method has a strong ability to distinguish overlapping peaks, but the choice of wavelet decomposition scale affects the results of peak-finding. In this paper, an adaptive peak-finding algorithm of X-ray fluorescence spectrum based on the derivative method and wavelet transform method is proposed. In the algorithm, continuous wavelet transform is applied to the original spectrum to obtain the wavelet transform coefficient spectra of different decomposition scales; then the first derivative peak-finding is performed on the wavelet transform coefficient spectra, and the results are combined; finally, the elements in the original spectrum are determined according to the energy scale of the X-ray fluorescence analyzer and the X-ray parameter table of element characteristics. In the process of peak finding, the algorithm does not need to smooth the original spectrum, nor does it need to determine the wavelet transform decomposition scale of the spectrum. The first derivative method, continuous wavelet transforms method, and the adaptive peak-finding algorithm was used to find peaks of the X-ray fluorescence spectrum of a standard sample. The experimental results show that the adaptive peak-finding algorithm has a high resolution of overlapping peaks and high recognition of weak peaks, which is better than the derivative method and the wavelet transform method in peak finding. The algorithm performs well in practical application.

Keyword: X-ray fluorescence spectrum; Peak finding; Derivative method; Wavelet transform
引言

X射线荧光光谱(XRF)分析中, 找到光谱的所有特征峰和准确地确定光谱中各个峰的峰位是XRF定性分析的关键问题。 常用的寻峰方法有简单比较法、 导数法[1, 2]、 协方差法、 高斯乘积函数法、 对称零面积变换法、 高斯拟合法、 线性拟合法和傅里叶自去卷积法等, 以及新引入的连续小波变换法[3, 4, 5, 6]、 Boosted-Gold反卷积法[7, 8]、 模拟退火法、 蚁群算法、 遗传算法和人工神经网络法等新的寻峰方法[9]。 这些算法各有优缺点, 光谱分析过程中寻峰方法的选择需要根据光谱的具体情况和具体分析要求而定。

导数法寻峰原理简单, 算法速度快。 一阶导数对孤立的弱峰灵敏度高, 但无法分辨重峰[10], 且导数法对XRF信号的信噪比有较高要求。 连续小波变换法寻峰, 基本不受信号中噪声的影响, 并且有较强的重峰分辨能力[3, 5]。 但和一阶导数法相比, 连续小波变换法的弱峰识别能力不够。 针对导数法和连续小波变换法寻峰的优缺点, 本文提出了一种综合利用连续小波变换和一阶导数联合进行寻峰的自适应算法, 该算法具备一阶导数法的弱峰识别能力和连续小波变换法的重峰分辨能力。

1 导数法寻峰
1.1 导数法简介

导数法是一种常用的光谱寻峰方法。 将谱线看成一条连续的曲线, 利用导数求得曲线的极值点、 拐点, 进而可以确定光谱特征峰的峰址、 峰宽。 XRF中元素的特征峰峰型是一个类似高斯分布的函数。 极大值点的一阶导数为向下的过零点。 一阶导数法对孤立的峰具有较高的灵敏度, 并且峰址定位精确[10]。 但其不能分辨重峰, 且对噪声敏感。

1.2 导数法寻峰分析

表1为某石油录井岩性分析标准样品1中元素含量, 为各元素的质量分数。 标准样品1的EDXRF光谱数据由Si-PIN探测器测得, 实测谱线如图1所示。

表1 标准样品1中元素含量 Table 1 The content of elements in standard sample 1

图1 标准样品1实测谱线Fig.1 Measured spectrum of standard sample 1

对标准样品1实测谱线在未平滑的情况下用一阶导数法寻峰, 识别出139个峰, 如图2(a)所示。 对标准样品1实测谱线用均值平滑算法进行平滑并扣除本底后寻峰, 当均值平滑窗口大小为5时, 识别出43个峰, 如图2(b)所示。 但从图2(b)可以观察到, 峰9和峰10包含的重叠峰并没有识别出来。 可知: 一阶导数法具有较强的弱峰识别能力, 但重叠峰分辨能力较差。

图2 一阶导数法寻峰效果
(a): 未平滑的寻峰结果; (b):均值平滑后寻峰结果-窗口大小为5
Fig.2 Peak-finding results of first-order derivative method
(a): Peak-finding results without smoothing; (b): Peak-finding results after mean smoothing-window size is 5

当均值平滑窗口大小为3, 7, 9, 11, 13, 15, 17和19时, 识别出的峰个数分别为70, 28, 20, 19, 18, 17, 15和15。 可知, 当均值平滑窗口逐渐增大时, 识别出的峰逐渐减少。 且可看出, 当均值平滑窗口较小时, 平滑窗口大小变动对谱峰识别能力影响较大; 当均值平滑窗口较大时, 平滑窗口大小变动对谱峰识别能力影响接近最大。

2 小波变换法寻峰
2.1 连续小波变换法简介

由小波变换的性质可以将f的小波变换Wf(u, s)写成式(1)的形式。

Wf(u, s)=f* Ψ¯s(u)=f* sndnθ¯s(t)dtn=sndndun(f* θ¯s)(u)(1)

式(1)中, Ψ 为小波函数; θ 为一使小波函数Ψ 具有n阶消失矩的快速衰减函数。 从式(1)可以看出, 信号光滑后的n阶导数可以通过小波变换来实现。 可见, 小波变换具有自动去噪功能。 由于XRF的特征峰近似于高斯函数, 高斯系列小波gausn常用于XRF的寻峰。 其中, gaus2, gaus4, gaus6和gaus8的作用类似于导数法寻峰中的偶数阶导数, 常用于重峰分解, 函数如图3。

图3 偶数阶高斯小波函数Fig.3 Even-order Gauss wavelet functions

由图3可知, 随阶数的增加, 高斯小波的形状变得更窄, 即重峰分解能力更强。 但小波函数两侧的波瓣也变大, 导致变换后的光谱中会出现干扰峰, 不利于光谱中的弱峰识别。 小波函数gaus2两侧没有值大于0的波瓣, 选用gaus2对光谱进行处理, 不会增加直接正向的干扰峰。

2.2 连续小波变换法寻峰过程

连续小波变换寻峰过程: (1)对XRF进行连续小波变换, 得到不同分解尺度的小波变换系数; (2)选择合适分解尺度的小波变换系数[11], 例如可以选择峰幅值最接近原始谱线峰幅值的小波变换系数谱; (3)从选定小波变换系数谱中寻峰。 用gaus2对标准样品1实测谱线进行连续小波变换, 得到不同分解尺度的小波变换系数。 图4显示了分解尺度1~8的小波变换系数。

图4 分解尺度1~8时的小波变换系数Fig.4 Wavelet transform coefficients when the decomposition scale changes from 1 to 8

通过对不同分解尺度小波变换系数的分析, 可知: (1)分解尺度较小时, 小波变换系数含有大量噪声, 但对重峰分解能力最强; (2)随着分解尺度的增加, 系数逐渐变得光滑, 分辨率逐渐变大, 弱峰识别能力增强, 但重峰识别能力变弱; (3)当分解尺度变得更大时, 部分弱峰被平滑掉, 逐渐变得不可识别。 从峰高可以看出图4中标准样品1实测谱线的小波变换系数d6最接近原始谱线。 对小波变换系数d6进行寻峰, 结果如图5所示。 寻到的峰个数为33个。 对这些峰进行识别, 识别出20种元素: Mg, Al, Si, P, S, Cl, K, Sn, Ca, Ti, V, Cr, Fe, Co, Ni, Cu, W, Zn, Ga和Th。 而其余9种元素并未被识别出来。

图5 连续小波变换法寻峰Fig.5 Peak-finding results by continuous wavelet transform method

从上述分析可知, 选择最优分解尺度小波变换系数的常规小波变换寻峰法无法同时满足较强的重叠峰分辨能力和弱峰识别能力。

3 连续小波变换与导数法联合寻峰
3.1 连续小波变换与导数法联合寻峰过程

本文提出的连续小波变换与导数法联合寻峰的自适应算法步骤如下: (1)对原始光谱用小波变换迭代法扣除本底[6]; (2)对扣除本底后光谱用高斯小波gaus2进行变换, 得到不同分解尺度的小波变换系数CFi(1≤ i≤ Scale, Scale为一最大分解尺度, 例如32); (3)对不同分解尺度的小波变换系数谱用一阶导数法寻峰, 得到峰集合PKi(1≤ i≤ Scale); (4)合并集合PKi(1≤ i≤ Scale), 得到UPK。 在合并过程中, 以PK1为UPK初始值, 然后依次将PK2, PK3, …, PKScale中的首次出现的峰加入UPK。 (5)由能量E与道址N之间的关系表达式计算出X荧光分析仪测量元素范围内轻元素的K系和重元素的L系特征X射线对应的道址; (6)根据集合UPK和元素特征X射线对应的道址, 确定原始光谱所含元素并确定道址。

3.2 连续小波变换与导数法联合寻峰实例分析

按照上述算法步骤对标准样品1的实测谱线扣除本底, 连续小波变换后得到不同分解尺度的小波变换系数CFi(1≤ i≤ Scale, Scale=32)。 然后对小波变换系数谱寻峰, 步骤如下:

(1)小波变换系数谱寻峰。 对小波变换系数谱CFi寻峰, 得到不同分解尺度峰集合PKi(1≤ i≤ Scale), 寻峰结果如表2所示。 分解尺度为1的小波变换系数谱寻峰结果如图6(a)所示, 识别的峰个数为22。 从图6(a)可以看出, 原始光谱中能够直观辨别的重叠峰均已被识别出。

表2 不同分解尺度的小波变换系数谱的寻峰结果 Table 2 Peak-finding results for wavelet transform coefficient spectrum with different decomposition scale

图6 自适应小波变换导数法寻峰
(a): 分解尺度为1的寻峰结果; (b): 合并寻峰结果
Fig.6 Peak-finding by adaptive method based on derivative and wavelet transform
(a): Peak-finding results for scale 1; (b): Union of peak-finding results

(2)合并峰集合。 合并不同分解尺度峰集合PKi(1≤ i≤ Scale), 得到的UPK含有107个峰, 如图6(b)所示。 有些元素的特征X射线在UPK中有多条, 它们是不同分解尺度下寻峰的结果, 在后续步骤中会确定哪条该保留。

(3)确定X荧光分析仪的能量刻度。 由不同的标准样品得到能量E和道址N的关系式如式(2)所示。 计算出轻元素(原子序数11≤ Z≤ 45的元素)的K系和重元素(原子序数45< Z≤ 92的元素)的L系特征X射线对应的道址。

E=0.007599N+0.134714(keV)(2)

(4)确定原始光谱所含元素。 根据集合UPK和元素特征X射线标准刻度, 进行元素识别, 得到结果如表3所示。 表中Scale值表示对应元素是在相应小波分解尺度下被识别的。

表3 寻峰结果 Table 3 Results of peak-finding

(5)寻峰结果分析。 由表1表3比较后可知: 除元素Na, Zr和Nb外的26种元素都被确定。 X荧光分析仪在低能端的探测效率较低, 原子序数靠前的Na元素无法被探测到。 当道址N为2 048时, 由式(2)可以计算出该道址对应的能量为15.697 5(keV), 而Zr和Nb的特征X射线的Ka1值分别为15.774(keV)和16.614(keV), 超出了X荧光分析仪元素分析范围。 可以看出, 含量比例高的元素在小波分解尺度为1和2时即可识别。 而含量比例低的元素, 有些在小波分解尺度取较大值时才能识别, 例如Ga, As和Pb元素。 因为一阶导数法对孤立的峰具有较高的灵敏度, 含量比例极低的元素W在小波分解尺度为3时就被识别。

4 结论

分析比较了导数法和连续小波变换法的XRF寻峰效果, 总结了导数法和连续小波变换法在对XRF进行寻峰时的优缺点, 并提出了一个综合利用高斯小波gaus2和一阶导数对XRF进行寻峰的自适应算法。 该算法对不同分解尺度的小波变换系数谱进行一阶导数寻峰, 然后合并寻峰结果, 最后进行元素识别。 本文提出的自适应寻峰算法具备一阶导数法的弱峰识别能力, 小波变换寻峰法的重叠峰分辨能力和自动去噪能力。 新方法对所有分解尺度的小波变换系数谱进行寻峰并合并寻峰结果, 优于只对某一分解尺度小波变换系数谱进行寻峰的常规小波变换寻峰法。 按照新算法得到的特征峰集合可以作为后续精确寻峰、 峰面积计算工作的初始值。

参考文献
[1] ZHANG Xin-jun, WANG Shi-lian, JIA Huai-mao, et al(张新军, 王世联, 贾怀茂, ). Nuclear Techniques(核技术), 2019, 42(7): 19. [本文引用:1]
[2] YIN Yan-shan, YIN Jie, ZHANG Wei, et al(尹艳山, 尹杰, 张巍, ). Spectroscopy and Spectral Analysis(光谱学与光谱分析), 2018, 38(3): 789. [本文引用:1]
[3] LIU Ming-hui, DONG Zuo-ren, XIN Guo-feng, et al(刘铭晖, 董作人, 辛国锋, ). Chinese Journal of Lasers(中国激光), 2017, 44(5): 255. [本文引用:2]
[4] LI Zhi-bin, HUANG Qi-tao, LIU Chang, et al(李志斌, 黄启韬, 刘畅, ). Laser & Optoelectronics Progress(激光与光电子学进展), 2017, 54(10): 120. [本文引用:1]
[5] FENG Fei, WANG Fu-bei, XIE Fei, et al(冯飞, 王府北, 谢非, ). Acta Photonica Sinica(光子学报), 2015, 44(6): 630001. [本文引用:2]
[6] ZHAO Feng-kui, WANG Ai-min(赵奉奎, 王爱民). Metallurgical Analysis(冶金分析), 2015, 35(7): 10. [本文引用:2]
[7] He Jianfeng, Yang Yaozong, Qu Jinhui, et al. Nuclear Science and Techniques, 2016, 27(3): 111. [本文引用:1]
[8] He Jianfeng, Wu Qifan, Cheng Jianping, et al. Nuclear Science and Techniques, 2016, 27(4): 101. [本文引用:1]
[9] DUAN Xin-wen, LIU Yuan, SUN Hao(段新文, 刘远, 孙浩). Journal of Inner Mongolia University·Natural Science Edition(内蒙古大学学报·自然科学版), 2015, 57(1): 48. [本文引用:1]
[10] YI Xiang-xin, LUO Qiu-feng, YANG Xian-ming, et al(伊相心, 罗秋凤, 杨先明, ). Computer Measurement & Control(计算机测量与控制), 2018, 26(3): 280. [本文引用:2]
[11] ZENG Chen-hao, FENG Xiao-jie, DUANG Zhong-shan, et al(曾晨浩, 冯孝杰, 段中山, ). Atomic Energy Science and Technology(原子能科学技术), 2017, 51(7): 1305. [本文引用:1]