小波变换的EDXRF光谱金属组分特征峰位置识别
章炜1, 徐华1, 段连飞3, 马明俊2, 甘婷婷2, 刘晶4, 王刘军1, 张玉钧2, 赵南京2, 刘文清2
1. 中国人民解放军陆军军官学院, 安徽 合肥 230031
2. 中国科学院环境光学与技术重点实验室, 中国科学院安徽光学精密机械研究所, 安徽 合肥 230031
3. 安徽科力信息产业有限责任公司, 安徽 合肥 230088
4. 中国科学院离子束生物工程重点实验室, 中国科学院技术生物与农业工程研究所, 安徽 合肥 230031

作者简介: 章 炜, 1979年生, 中国人民解放军陆军军官学院副教授 e-mail: 287984187@qq.com

摘要

主要研究X射线荧光光谱金属组分特征谱位置的确定。 依据不同金属组分的特征谱特性, 分析了特征谱的选取规律, 在奇异值分析理论和模极大值理论的基础上, 分析了基于特征谱小波分解系数的模极大值提取方法, 在不同分解尺度下的特点及其传播特性, 提出了基于模极大值传播的区间特征峰筛选方法, 并对实际测量光谱进行了实验分析。 结果表明: 利用bior4.4小波作为基函数对实验测量的全能谱数据进行4层小波变换, 利用模极大值传播特性, 可以消除全能谱上叠加的部分噪声对光谱分析造成的阶跃影响; 为提高特征峰的位置识别概率, 对小波变换中小于给定阈值的分解系数进行压缩, 将实验获取的X射线荧光全能谱第4层小波分解系数直接进行特征峰识别, 得到的677个峰值位置, 压缩到186个; 在此基础上, 再采用模极大值传播的区间特征峰筛选方法, 筛选区间初始值设置为600 eV, 经识别得到的特征峰峰值位置仅为27个, 识别准确率得到有效提高。

关键词: X射线荧光; 小波变换; 模极大值; 特征峰
中图分类号:O657.3 文献标志码:A
Identification of Metal Components Characteristic Peak Position of Energy Dispersive X-Ray Fluorescence Spectra Based on the Wavelet Transformation
ZHANG Wei1, XU Hua1, DUAN Lian-fei3, MA Ming-jun2, GAN Ting-ting2, LIU Jing4, WANG Liu-jun1, ZHANG Yu-jun2, ZHAO Nan-jing2, LIU Wen-qing2
1. Army Officer Academy of PLA, Hefei 230031, China
2. Key Laboratory of Environment Optics and Technology, Anhui Institute of Optics and Fine Mechanics, Chinese Academy of Sciences, Hefei 230031, China
3. Anhui KeLi Information Industry Co., Ltd., Hefei 230088, China
4. Key Laboratory of Ion Beam Bioengineering, Institute of Technical Biology and Agriculture Engineering, Chinese Academy of Sciences, Hefei 230031, China
Abstract

In this paper, the accurate identification problem of energy dispersive X-ray fluorescence (EDXRF) characteristic peak position was studied. Based on the characteristic spectra character of the different metal components, the choosing rule of the characteristic spectra was analyzed. According to the theories of singular value analysis and modulus maxima, the extraction method of modulus maxima was analyzed which based on the wavelet decomposition coefficients of characteristic spectra. Moreover, the feature of the characteristic spectra wavelet decomposition coefficients and their propagation were analyzed in detail. The method of the interval characteristic peak selection was put forward based on the propagation of modulus maxima. And this method was applied to the actual measurement spectra. The result showed that the wavelet transform of four levels was applied to full energy spectra data using the basis function of bior4.4 wavelet. For the full energy spectra, the phase step influence of the some superimposed noise could be eliminated using the propagation of modulus maxima. In order to increase the identification probability of characteristic spectra, the decomposition coefficients were compressed which were less than the threshold value. In addition, 667 peak positions were identified for the fourth level wavelet decomposition coefficients of EDXRF spectra which were not processed. 186 peak positions were identified when they were compressed. Then the method of interval characteristic peak selection using modulus maxima propagation feature was applied and the initial value of the screening interval was set 600 eV. The identified result of the characteristic peak position was 27. The experimental result showed that the accurate rate of peak location identification was enhanced effectively.

Keyword: X-ray fluorescence; Wavelet transformation; Modulus maxima; Characteristic peak
引 言

能量色散X射线荧光(EDXRF)光谱定性分析的关键在于准确定位EDXRF光谱的特征峰位置, 它是判断试样是否存在某种金属组分的前提和基础[1, 2, 3]

然而, 受能谱探测器分辨率影响, 金属组分的EDXRF特征峰均具有一定展宽, 部分组分特征峰之间还存在一定程度的叠加, 为特征峰位置解析增加了难度。

目前, 对金属组分特征峰进行识别的方法较多, 如直接比较法、 导数法、 高斯拟合法和对称零面积法等[4]。 直接比较法方法简单, 但对强度非常弱的特征峰识别效果较差; 导数法会增大光谱信号中的噪声, 对EDXRF光谱信号的信噪比有一定要求; 高斯法适用于多种峰型; 对称零面积法对叠加在高基底轫致辐射谱上的弱峰识别能力较好, 但这两种方法均需预先估计边界道址、 全能峰半宽等参数。

利用经典的傅立叶变换方法检测函数的奇异性也可以对特征峰进行辨识, 但该方法无法确定函数在特定点处奇异性是否更大, 无法根据空间变量进行局部信息定位, 不适合检测函数的局部奇异性[5]

Grossmann[6]采用Hardy函数小波对奇异值进行探测, 认为在点x0邻域的独立奇异性, 在尺度s趋于0时, 位于相位ϕ (s, x)连续的尺度空间(s, x)上的线收敛于x0。 但是相位ϕ (s, x)并不是有效测量奇异性的手段, 且ϕ (s, x)的值在系数ρ (s, x)接近于0时变得非常不稳定。

本工作采用小波变换方法对EDXRF特征光谱进行奇异值分析, 并结合特征光谱在多尺度变换中的细节分解系数模极大值传播的特点, 对EDXRF特征光谱进行解析。

1 实验部分
1.1 装置

实验系统原理框图如图1所示, 其中微型X射线管采用Ag作为靶材, 选用Al质滤片, 工作电压/电流设为40 kV/150 μ A, 激发时长设为120s; 探测器(SDD探测器)的能量探测范围为1.5~25 keV, 分辨率为145~260 eV(5.90 keV)。

图1 实验系统原理框图Fig.1 Experimental setup

1.2 样品

用电子天平称取Ni(NO3)2· 6H2O, Cu(NO3)2· 3H2O和ZnCl2三种化学试剂一定量, 混合后加入到30 mL的纯净水中制成一定浓度的混合溶液; 用微型移液管量取Pb标液一定量与该混合溶液混合, 再用微型移液管量取一定体积的混合药液富集在玻璃纤维滤膜上, 经电加热快速烘干, 制备成具有一定富集浓度的混合滤膜试样, 供实验测量。

1.3 理论分析

EDXRF特征光谱可通过函数奇异性进行解析, 而小波变换恰好可以用来描述函数的局部奇异性。 假设Wf(s, x)为EDXRF光谱信号函数f(x)在尺度s下的小波变换结果, 对于紧支撑小波函数来说, Wf(s, x0)取决于f(x)在x0的邻域内的特性及小波变换所选取的尺度s, 在最优的尺度上, 它能够提供f(x)的局部化信息[7, 8]

EDXRF特征光谱经小波变换后局部化信息的奇异性可与其小波变换后的模局部极大值关联, 因此利用不同尺度小波变换的模极大值衰减速度可以对其特征光谱信号的局部奇异性进行判断。 对于EDXRF特征光谱信号函数f(x)的小波变换结果Wf(s, x)来说, 满足下列三个条件, 都可以称之为模极大值:

(1)对于任意点(s0, x0), 当x变化时, Wf(s0, x)xx=x0处有零交叉点, 则称Wf(s, x)有局部极大值。

(2)对于任意点(s0, x0), 当x属于x0点的左邻域(或右邻域)时, Wf(s0, x)< Wf(s0, x0); 且当x属于x0点的右邻域(或左邻域)时 Wf(s0, x)Wf(s0, x0), 则称Wf(s, x)有模极大值。

(3)在尺度空间(s, x), 沿着模最大值点所连接的曲线称为模极大值线。

对于∀ xδ x0, 有 Wf(s, x)Wf(s, x0), 则称x0为小波变换在尺度s下的局部极值点, 此时 Wf(s, x)Ksa成立。 因此, EDXRF特征光谱信号函数f(x)的奇异性(突变点)可以通过检测小波变换系数的模极大值而得到。

2 结果与讨论
2.1 特征谱线的选取

相同的激发与探测条件下, 分析不同金属组分时, 其特征谱线的选取较为关键。 受激发条件限制, 对Ni, Cu, Zn, Cd和As等常见的金属组分EDXRF光谱的分析线主要选择其K系谱线; 而Pb的K系谱线超出了该实验装置所选取的X射线管的激发范围, 故选择其L系特征谱线作为分析线。

由于玻璃纤维滤膜中含有少量的金属组分Cd和As, 故在测量时会得到Cd和As的测量光谱。 对于金属组分Cd来说, 其K系和L系特征谱线虽然都处于X射线管的激发范围之内, 但是, 由图2的实际测量谱线可以看出, Cd的系特征谱线的强度远高于其他三条特征谱线, 且其L系特征谱线基本被淹没在散射背景中。 因此, 分析Cd时, 选其特征谱线作为分析线较为适宜。

图2 Cd元素的EDXRF特征谱Fig.2 EDXRF characteristic spectra of Cd

当两个特征谱线紧邻, 且探测器无法对其分辨时, 辅助分析线的选择就显得尤为重要。 图3为Pb和As的特征谱线, 从能谱的角度来看, As的特征谱线和Pb的特征谱线能谱相差仅20 eV, 而实验装置选用的SDD探测器的能量分辨率最高时也仅达到135 eV, 若两种元素共存时, 选择它们的特征谱线将无法实现对两者的有效区分。 此时, 应选择As 或Pb 辅助分析线作为主分析线。

图3 Pb和As的EDXRF特征光谱Fig.3 EDXRF characteristic spectra of As and Pb

2.2 EDXRF光谱特征峰定位依据

经光谱预处理之后的光谱不可避免的还含有部分噪声, 而这种噪声主要源于其散射背景。 图4所示为Ni和Cd的特征峰经小波包变换去噪后的光谱, Ni的特征峰位于散射背景影响较小的能谱区间, 经预处理后的光谱较为平滑, 在其特征峰展宽上仅产生1处阶跃; 与之相反, Cd的特征峰位于散射背景影响较大的能谱区间, 故经预处理后仍存有多处阶跃。 为了消除阶跃信号的影响, 将光谱特征峰奇异性与模极大值进行关联, 从而实现准确定位。

图4 Ni, Cd的特征峰Fig.4 The characteristic peaks of Ni and Cd

由描述函数奇异性的Lipschitz指数[9]定义可知, 若将s用2j(jZ)来表示, 即采用二进离散小波变换, 则 Wx(s, t)Ksα 可写为

W2jx(t)K·2(1)

由此看出, 当α > 0时, 小波变换的模极大值点幅值随尺度参数j增大而增大; 当α < 0时, 小波变换的模极大值点幅值随尺度参数j增大而减小; 当α =0时, 小波变换的模极大值点幅值不随尺度变化而改变。

由于EDXRF光谱特征峰的小波分解系数在其能谱位置具有Lipschitz指数α , 且具有一定强度的金属组分特征光谱的Lipschitz指数α > 0, 因此可将光谱信号小波变换的模极大值与特征光谱的奇异性联系起来, 即EDXRF光谱特征峰的小波变换模极大值点的幅值会随着尺度的增大而增大。

虽然, 经预处理之后的阶跃信号也满足上述规律, 但是两者在变化幅度上存在明显差异。 图5为选用bior4.4基函数对EDXRF光谱进行三层离散平稳小波变换后的谱图, d1, d2和d3分别表示第一、 第二和第三层的小波分解系数, 横坐标刻度标识为能谱对应的测量通道。 可以看出, 对应特征光谱位置的小波分解系数随着分解尺度的增大在迅速增大; 而不同尺度下, 分解系数中存在的部分幅值较小的模极大值点, 则是由上一级尺度阶跃噪声的模极大值点传播而来, 其幅值变化远小于特征谱分解系数变化。 因此, 利用特征峰小波分解系数的模极大值随着分解尺度的增大而快速增大的特点, 可消除阶跃信号对光谱定位的干扰, 实现EDXRF光谱特征峰位置的提取。

图5 测量光谱及其在不同尺度下的小波分解系数Fig.5 Measured spectra and their wavelet decomposition coefficient under different scales

2.3 小波分解系数模极大值提取

根据模极大值传播特点, 确定EDXRF光谱小波分解系数的模极大值位置:

(1)对每层的分解系数进行阈值设置, 并去除小于一定阈值的分解系数

将每层分解系数的噪声方差引入mini和maxi阈值中, 确定阈值

(0.3936+0.1829lnn/ln2)×σ˙n, j(2)

其中, σ˙n, j=k=1Ndj(k)0.6745n, n为分解信号的长度; dj(k)为相应层的分解系数。

将EDXRF光谱信号小波变换中小于给定阈值的分解系数去除, 从而实现对小波分解系数的压缩, 减少干扰。 图6所示为EDXRF光谱信号经四层小波分解后的细节系数, 其中图6 (a)为未进行阈值压缩的系数谱图, 而图6(b)为采用上述阈值压缩的系数谱图, 对比可知, 细节系数中部分系数通过阈值处理被移除, 经阈值处理压缩后的光谱有利于提高模极值搜索的速度和精度。

图6 EDXRF测量光谱第四层的小波分解系数
(a): 未压缩; (b): 压缩
Fig.6 The fourth level wavelet decomposition coefficient of measured EDXRF spectra
(a): Uncompression; (b): Compression

(2)确定每一层的模极大值及其位置

① 将每一层中正、 负不同的分解系数提取出来, 分别定义为向量Pj和向量Nj, 其中j为对应分解层;

② 依次序比较向量Pj和向量Nj中的相邻元素, 以向量Pj为例:

如果Pj(i)< Pj(i+1), 则P'j(i)=1, 否则P'j(i)=0;

如果P'j(i)> P'j(i+1), 则P″j(i+1)=1, 否则P″j(i+1)=0;

由此得到向量P″jN″j, 向量P″jN″j中元素为1时所对应的位置即为相应层分解系数模极值所在位置。

利用上述方法, 对EDXRF光谱小波分解的细节系数第四层的模极值位置进行定位, 其结果如图7所示, 共识别出峰值点位置186个(包含了因阶跃信号产生的误识别位置)。 图8所示为未经阈值处理所确定的峰值点位置, 识别出EDXRF测量光谱的峰值位置677个(包含了因阶跃信号产生的误识别位置), 较压缩后多了491个虚假峰值位置, 说明经过阈值处理后的特征峰识别准确率有一定提高。

图7 压缩光谱模极值对应的光谱位置Fig.7 Spectra location corresponding module maxima of compression spectra

图8 未压缩光谱模极值对应的光谱位置Fig.8 Spectra location corresponding module maxima of uncompression spectra

2.4基于模极大值传播的区间特征峰筛选

图7所示的EDXRF特征峰位置是通过在一个分解层的小波细节分解系数中寻找其模极值位置确定的。 此时, EDXRF特征峰上的阶跃变化会造成局部位置的小波分解系数偏大, 进而影响定位精度。

为进一步准确提取特征峰位置, 将多个尺度下的EDXRF光谱小波分解的细节系数进行关联分析。 图9所示为对EDYRF光谱进行1~60层分解之后, 利用各层对应位置的小波分解系数绘制的灰度分布图, 横坐标为通道位置, 纵坐标为小波分解层数, 由该坐标系确定的点表示小波分解系数模值对应的灰度值大小, 灰度值越大表示该点的小波分解系数模值越大, 反之亦然。 可以看出, 随着分解尺度的增大, EDXRF特征峰位置对应的分解系数也逐渐增大, 即特征峰经变换后的模极大值具有传播特性。 我们即基于模极大值传播的区间峰值位置定位方法应用于EDXRF特征峰定位。

图9 1~60层小波变换系数Fig.9 Wavelet transform coefficient of 1 to 60 level

对于分析对象Ni, Cu, Zn, Pb和Cd等金属组分来说, 其特征谱线主分析线的能谱间隔最小相差约200 eV。 虽然金属组分特征峰展宽会造成能谱间隔较小的谱峰发生部分重叠, 但是对主分析线影响较小。 因此, 可以在特征提取的基础上, 利用模极大值传播特性, 按照分解系数由大到小的顺序依次对峰值进行剥离, 实现对由模极大值所确定峰值位置的筛选。 其算法流程如图10所示。

图10 基于模极大值传播的区间特征峰筛选流程Fig.10 Flow of the interval selection of characteristic peak based on the module maxima propagation

在该算法中, 光谱区间的调整是依据实际测量光谱的强度变化实现的。 针对实际分析金属组分的分析线能谱间隔, 初始光谱区间宽度设置为100个通道(约600 eV), 这样能保证分析对象的全能峰左右边界能谱均能被涵盖进分析区间。

图11即为利用模极大值传播的特征峰筛选识别方法确定的特征峰位置, 可以看出, 经筛选之后的特征峰位置受阶跃点的影响较小, 对于上述光谱共识别出27个特征峰峰值位置, 与实际金属组分的特征峰位置基本一致。

图11 筛选的特征峰Fig.11 Selected characteristic peaks

3 结 论

在分析EDXRF特征光谱特性的基础上, 深入分析了EDXRF特征光谱小波分解系数的传播特性, 在奇异值分析理论和模极大值理论的基础上, 针对特征光谱信号及其阶跃信号的分解系数特点, 提出了基于模极大值传播的区间特征筛选方法, 并对实际的EDXRF光谱进行了具体分析。 实验结果表明, 对该光谱的第四层小波分解系数直接进行特征峰识别得到了677个峰值位置(含大量误识别位置), 而采用本方法识别的特征峰峰值位置仅为27个, 识别准确率得到有效提高, 且与实际金属组分特征峰峰值位置基本一致。

The authors have declared that no competing interests exist.

参考文献
[1] Ying L B, Dai L K, Guo X M. Auto Instrument Impurities, 2011, 32(10): 1. [本文引用:1]
[2] Ji A, Tao G Y, Zhuo S J, et al. Energy Dispersive X-ray Fluorescence Spectra, 2003, 143. [本文引用:1]
[3] Zhuo S J, Tao G Y, Han X Y. Fundamental Parameter method of X-ray Fluorescence Spectra, 2010, 30. [本文引用:1]
[4] Zhang J Q, Gonzalez E, William H, et al. Genomics, 2009, 10(6): 388. [本文引用:1]
[5] Mallat S. IEEE Trans. on Acoustics, Speech and Sigal Processing, 1998, 37(12): 2091. [本文引用:1]
[6] Grossmann A. Dodrecht: Reidel, 1986. [本文引用:1]
[7] Arneodo A, Bacry E, Muzy J F. PRL, 1991, 67: 3515. [本文引用:1]
[8] Jaffard S C. R. Acad. Sci. Paris Sér, 1989, 308(): 79. [本文引用:1]
[9] Arneodo A, Bacry E, Muzy J F. Phys. A, 1995, 213: 232. [本文引用:1]