基于能量色散X射线荧光光谱的鱼粉产地溯源方法研究
李庆波1, 毕智棋1, 石冬冬2
1.北京航空航天大学仪器科学与光电工程学院, 精密光机电一体化技术教育部重点实验室, 北京 100191
2.中国农业科学院饲料研究所, 北京 100081

作者简介: 李庆波, 女, 1975年生, 北京航空航天大学仪器科学与光电工程学院副教授 e-mail: qbleebuaa@buaa.edu.cn

摘要

鱼粉是一种在养殖业中占有重要地位的高蛋白饲料原料。 我国对鱼粉的市场需求很大, 但不同产地的鱼粉存在品质差异的问题。 为保证鱼粉品质安全, 建立鱼粉产地溯源系统具有非常重要的意义。 能量色散X射线荧光光谱根据元素辐射X射线荧光光子能量不同, 能够检测样品矿物质元素种类和含量。 鱼粉所含矿物质元素种类和含量会因鱼粉产地不同而存在差异, 因此提出采用能量色散X射线荧光光谱(EDXRF)法对鱼粉进行扫描检测来获得鱼粉的元素信息, 将原始光谱进行预处理后, 采用鲸鱼算法改进的自适应净信号权重局部超平面方法识别鱼粉样品的光谱向量, 从而对其产地进行溯源判别。 首先对产地来自辽宁和浙江的51份鱼粉样品进行压片, 并在EDXRF谱仪的检测程序中设置不同的滤光片, 得到51组(每组6条光谱)光谱。 然后对光谱进行预处理, 采用基于自适应迭代重加权惩罚最小二乘法算法(airPLS)进行基线校正, 从而消除基线漂移的影响, 提高精度。 采用小波变换对光谱进行平滑, 去除光谱曲线的高频噪声。 选取每个鱼粉样品6条光谱的有效区段, 计算谱峰面积, 获得代表样品矿物质元素含量的16维向量。 最后采取鲸鱼算法对自适应净信号权重局部超平面(ANWKH)方法的关键参数(近邻数、 主成分数、 调节参数)进行最优选择, 再利用寻找到的最优参数建立自适应净信号权重局部超平面模型, 随机选取每个产地鱼粉样品的70%作为训练集, 30%作为测试集进行鱼粉产地判别。 鱼粉样品分别来自辽宁和浙江两个产地, 经预测模型识别正确率分别为94.3%和100%, 总正确率为97.3%, 均高于人工寻找参数的自适应净信号权重局部超平面分类准确率。 结果表明, 基于能量色散X射线荧光光谱的鱼粉溯源方法能够准确地实现鱼粉产地溯源, 经鲸鱼算法改进后的自适应净信号权重局部超平面方法能够寻找到最优参数, 建立分类准确度更高的模型, 为以后进行更加详细的国内外鱼粉产地溯源提供了参考。

关键词: 能量色散X射线荧光光谱; 光谱预处理; 鲸鱼算法; 自适应净信号权重局部超平面; 鱼粉产地溯源
中图分类号:O657.34 文献标志码:A
The Method of Fishmeal Origin Tracing Based on EDXRF Spectrometry Analysis
LI Qing-bo1, BI Zhi-qi1, SHI Dong-dong2
1. Key Laboratory of Precision Opto-Mechatronics Technology, Ministry of Education, School of Instrumentation and Optoelectronic Engineering, Beihang University, Beijing 100191, China
2. Feed Research Institute, Chinese Academy of Agricultural Sciences, Beijing 100081, China
Abstract

Fishmeal is a kind of high protein feed material which plays an important role in aquaculture. There is a great market demand for fishmeal in China, but the quality of fishmeal from different places is different. In order to ensure the quality and safety of fishmeal, it is very important to establish a traceability system of fishmeal origin. The energy dispersion X-ray fluorescence spectrum is able to detect the type and content of mineral elements in the sample depending on the energy of the element’s radiation X-ray fluorescent photons. The types and contents of mineral elements contained in fishmeal may vary depending on the origin of fishmeal, so this paper proposes for the first time to use the energy dispersion X-ray fluorescence spectroscopy (EDXRF) method to scan the fishmeal to obtain the element information of fishmeal elements. After preprocessing the original spectrum, whale optimization algorithm is used to improve the adaptive net analyte signal weight K_lacal hyperplane method can identify the spectrum vector of fishmeal samples, and then identify the origin of fishmeal samples. Firstly, 51 fishmeal samples from Liaoning and Zhejiang were pressed, and different filters were set in the detection program of EDXRF spectrometer, 51 groups (6 spectra in each group) of spectra were obtained. Then the spectrum is preprocessed, and the baseline is corrected based on the adaptive iterative reweighted penalty least squares algorithm (airPLS), so as to eliminate the impact of baseline drift and improve the accuracy. Wavelet transform is used to smooth the spectrum and remove the high-frequency noise of the spectrum curve. The 16-dimensional vector representing the element content of each fishmeal sample was obtained by calculating the peak area of six effective spectral regions. Finally, whale optimization algorithm is used to select the key parameters (neighbor number, principal component fraction, adjustment parameter) of the adaptive net analyte signal weight K_local hyperplane (ANWKH) method, and then the adaptive net analyte signal weight K_local hyperplane model is established by using the found optimal parameters. 70% of the fishmeal samples from each place of origin are selected as the training set, 30% as the test set to identify the fishmeal place of origin. Fishmeal samples are from Liaoning and Zhejiang provinces. The accuracy of the prediction model is 94.3% and 100% respectively. The total accuracy is 97.3%, which is higher than the accuracy of the adaptive net analyte signal weight K_local hyperplane classification. The results show that the method based on energy dispersive X-ray fluorescence spectrum can accurately realize the origin traceability of fishmeal, and the adaptive net analyte signal weight K_local hyperplane method improved by whale optimization algorithm can find the optimal parameters and establish a model with higher classification accuracy. This paper provides a reference for more detailed origin traceability of fishmeal at home and abroad in the future.

Keyword: Energy Dispersion X-ray fluorescence spectrum; Spectral pretreatment; Whale optimization algorithm; Adaptive net analyte signal weight K_local hyperplane; Fishmeal origin traceability
引言

随着我国经济和科技水平不断提高, 人们的生活水平和物质需求日渐增长, 养殖业也应需求进行产业改革, 通过科学养殖、 宏观调配进行优化。 鱼粉作为饲料中最重要的蛋白质来源, 对鱼粉的品质要求也随之提高。 鱼粉的品质好坏决定了饲料质量的高低, 从而影响畜禽健康发育。 我国是全世界最大的鱼粉需求国, 建立完善的鱼粉市场秩序, 有效鉴别鱼粉掺假, 以次充好是不可或缺的。 由于不同产地鱼粉的品质差别巨大, 会有不法商家用劣质鱼粉冒充高品质鱼粉, 因此为打击此类不法行为, 维护市场秩序, 我们需要对鱼粉产地溯源进行研究。

能量色散X射线荧光光谱根据元素辐射X射线荧光光子能量不同, 能够检测样品矿物质元素种类和含量。 该方法具有光谱谱峰尖锐, 重叠少, 信息丰富, 测量更加精准, 对样品无破坏, 可重复使用的优点。 由于不同产地所处海域不同, 制作鱼粉的鱼类差异导致鱼粉的化学矿物质元素组成和含量存在区别, 因此本文首次提出采用能量色散X射线荧光光谱法对鱼粉产地进行溯源。 2015年宋涛[1]等基于近红外光谱技术对淡水鱼粉、 进口鱼粉和国产鱼粉建立主成分分析模型进行分类。 近红外光谱技术具有方便、 快速的优点, 但近红外光谱缺点是谱峰重叠, 反映的是有机化合物分子结构的信息。 2018年, 韦紫玉[2]等基于能量色散型X射线荧光光谱技术对小麦产地识别进行研究, 通过主成分分析, Fisher判别分析与二次识别分析建立小麦产地识别模型样本识别率达94.12%。 证明以产生的荧光光谱为研究对象结合化学计量学方法可以实现产品的产地溯源。 2019年, Herreros-Chavez[3]等采用能量色散X射线荧光法研究豆类和水果的矿物分布, 通过偏最小二乘法(PLS)建模。 建立了铝、 钙、 铜、 铁、 钾、 镁、 磷、 锶、 锌的浓度预测模型。 对豆类和水果元素含量进行定量分析取得很好的效果, 表明能量色散X射线荧光法不仅可以对矿石[4]、 土壤[5]等中的矿物质元素进行定量检测, 也可以对食品中的矿物元素进行检测。 2019年, 邓玉福[6]等采用EDXRF法对含磷饲料中磷元素含量进行测定, 采用曲线拟合方法对饲料中磷成分进行定量分析, 表明EDXRF法能够对饲料所含矿物元素进行分析检测。 本研究通过能量色散X射线荧光光谱获取鱼粉矿物质元素信息, 建立鲸鱼算法改进后的自适应净信号权重局部超平面方法分类模型对鱼粉产地进行溯源, 对维护鱼粉市场秩序及畜禽业健康发展具有重要意义。

1 实验部分
1.1 样本

实验制作了51个鱼粉样品压片, 其中产地为辽宁24份, 浙江27份, 每个压片分别使用不同滤光片获取了6条EDXRF光谱曲线, 总共是306条光谱数据。 随机选取各产地样品的70%为训练集, 30%为测试集(表1)。

表1 鱼粉样品测试训练分组情况 Table 1 Grouping of fishmeal sample testing and training
1.2 仪器

实验所用的EDXRF谱仪是Epsilon1型号(帕纳科品牌的台式XRF能谱仪一体机), 采用众合ZHY-401B荧光光谱仪用粉末压片机制成鱼粉样品压片, 实验采用不放置滤光片和放置五种不同初级滤光片获得光谱曲线。 其中五种滤光片材质、 厚度以及适用元素如(表2)所示。

表2 初级滤光片的参数属性 Table 2 Parametric properties of primary filters
1.3 光谱预处理

X射线能量色散荧光光谱在采集过程中会受到样品压片质量、 环境温度、 射线散射等因素影响。 因此本实验采用自适应迭代重加权惩罚最小二乘法对光谱的基线进行校正, 消除基线漂移。 采用小波变换的方法对光谱曲线进行平滑去噪, 消除高频噪声的干扰。 将每个样品的6条光谱有效区段拼接, 选取16个明显谱峰波形, 计算谱峰面积得到16维代表样品元素的向量。

1.4 建模方法

1.4.1 自适应净信号权重局部超平面

自适应净信号权重局部超平面(adaptive Net analyte signal weight K_local hyperplane, ANWKH)方法[7]是基于K近邻算法的改进, ANWKH算法首先将原始光谱利用前f个主成分进行光谱重构投影到子空间X-k, 通过公式计算出净光谱x

x=X[I-(X-k+)TX-k]X-k=X(I-βX+yX̅)β=1X̅X+y(1)

然后计算训练样本的特征权重w和预测样q到训练样本的权重欧氏距离D

rj=icI(yi=c)(x̅cj-x̅j)2icI(yi=c)(xij-x̅cj)2wj=exp(rj)j=1dexp(rj) j=1, , d(2)

D(xi, q)=j=1dwj(xij-qj)2(3)

根据D, 得到c类样本中与q最近的nc个训练样本pc=(pc1, …, pcnc), 并构造超平面

LHc(q)=s|s=i=1ncαiVi+mcmc=1nci=1ncpciVi=pci-mcα=(α1, , αnc)T(4)

最后计算预测样本qc类超平面的最小距离并根据距离判断类别

Jc(q)=minαj=1dwj(Vjα+mcj-qj)2+λαTα=minα(s-q)TW(s-q)+λαTαW=diag(w1, , wd)(5)

label(q)=argmincJc(q)(6)

其中λ 是一个调节参数用于防止α 值过大。 令 Jc(q)α=0, 计算得α 值使得待测样本与超平面距离最小: α =(UTV+λ Inc)/(UT(q-mc)), 其中UT=VTW

1.4.2 鲸鱼算法

自适应净信号权重局部超平面法需要对最近邻数、 主成分数、 调节参数进行设定, 为达到最佳分类效果, 本文采取鲸鱼算法[8]寻找最优参数。 鲸鱼算法是模仿座头鲸捕食过程的仿生算法, 通过预测猎物位置并按螺旋型运动将其包围, 从而寻找到最优参数。

首先鲸鱼算法设定最优候选解为目标猎物, 并设立一定数量搜索代理协助搜索最优解, 进行迭代更新位置。

D=|CXP(t)-X(t)|(7)

X(t+1)=XP(t)-AD(8)

式中, D为鲸鱼向猎物移动距离, t为当前迭代次数, AC为系数向量, XP是当前最佳解, X是位置向量, 其中AC向量计算式如式(9)和式(10)

A=2ar1-a(9)

C=2r2(10)

式中, a是在迭代过程中由2到0的线性衰减向量, r1r2为0到1之间的随机向量。 鲸鱼算法采取收缩环绕机制和螺旋型机制进行位置更新。

X(t+1)=Xp(t)-AD(p< 0.5)|XP(t)-X(t)|ebl· cos(2πl)+Xp(t)(p0.5)(11)

式(11)中, b是定义对数螺线形状常数, l为-1到1之间随机数, p为0到1之间随机数。 当|A|< 1时鲸鱼结束游走, 根据模型的适应度对目标猎物进行捕获获得最佳参数。

2 结果与讨论
2.1 光谱特征曲线

图1为鱼粉样品在无滤光片和五种初级滤光片条件下获得的6条能量色散X射线荧光光谱, 图2为采用airPLS方法[9, 10]对能量色散X射线荧光光谱进行基线校正。 图3为基线校正前后对比图, 明显看出经校正后基线漂移消除。

图1 原始光谱曲线Fig.1 Raw spectral curve

图2 基线校正后的光谱曲线Fig.2 Spectrum curves corrected by baseline

图3 原始曲线与基线校正后的曲线的对比Fig.3 Comparison of the original curve with the baseline-corrected curve

图4为原始光谱和小波变换去噪后光谱局部放大对比图, 可见, 在一定程度上去除了光谱的高频噪声, 得到一条相对平滑的曲线, 对波形和谱峰高度影响很小。

2.2 鱼粉产地溯源预测模型

通过对鱼粉6条光谱曲线有效区段进行选择, 计算谱峰面积得到用于模式识别的特征向量。 对辽宁产地和浙江产地的鱼粉样品随机抽取70%作为训练集进行建模, 30%作为测试集进行验证。 分别采用人工选择参数和鲸鱼算法选择最优参数, 然后使用自适应净信号权重局部超平面预测模型对鱼粉产地进行预测。

表3中可以看出鲸鱼算法改进后的自适应净信号权重局部超平面算法对辽宁和浙江鱼粉产地识别正确率为94.3%和100%, 总正确率为97.3%。 均比人工寻参的正确率高, 说明鲸鱼算法起到对自适应净信号权重局部超平面算法的最优参数寻找作用, 提高了识别率。 实验结果证明WOA-ANWKH算法能够准确对鱼粉产地溯源。

图4 小波去噪前后光谱局部放大对比图
(a): 原始光谱曲线; (b): 小波去噪后光谱曲线
Fig.4 Partial amplification comparison of the spectrum before and after wavelet de-noising
(a): Original spectral curve; (b): Spectrum curve after wavelet de-noising

表3 鱼粉产地识别结果 Table 3 Identification results of fishmeal origin
3 结论

采用能量色散X射线荧光光谱进行鱼粉产地溯源, 通过光谱反映不同产地鱼粉所含矿物质元素差异, 从而进行精准产地判别。 采用airPLS和小波变换方法对光谱分别进行了基线校正和平滑去噪, 并采用鲸鱼算法自动确定自适应净信号权重局部超平面算法的最优参数, 与人工主观选择参数相比, 该方法具有快速和精确的优点。 实验结果表明, 本文提出的基于鲸鱼算法改进的自适应净信号权重局部超平面算法能够准确区分辽宁产地与浙江产地的鱼粉。 本研究能为更广泛的鱼粉产地溯源提供参考。

参考文献
[1] SONG Tao, SONG Jun, LIU Yao-min, et al(宋涛, 宋军, 刘耀敏, ). Food Science(食品科学), 2015, 36(24): 260. [本文引用:1]
[2] WEI Zi-yu, XIONG Ying, CHEN Tong(韦紫玉, 熊颖, 陈通). Cereals & Oils(粮食与油脂), 2019, 32(6): 66. [本文引用:1]
[3] Herreros-Chavez L, Oueghlani F, Morales-Rubio A, et al. Journal of Food Composition and Analysis, 2019, 82: 103240. [本文引用:1]
[4] DENG Sai-wen, WANG Yi-min, SUN Xiao-fei, et al(邓赛文, 王毅民, 孙晓飞, ). Metallurgical Analysis(冶金分析), 2019, 39(11): 30. [本文引用:1]
[5] Büchele Dominique, Chao Madlen, Ostermann Markus, et al. Scientific Reports, 2019, 9(1): 17588. [本文引用:1]
[6] DENG Yu-fu, LIU Yi-chu, ZHAO Wei, et al(邓玉福, 刘伊初, 赵婷伟, ). Transactions of the Chinese Society for Agricultural Machinery(农业机械学报), 2020, 51(3): 358. [本文引用:1]
[7] Li Q, Hao C, Xu Z. Sensors, 2017, 17(3): 627. [本文引用:1]
[8] Seyedali Mirjalili, Andrew Lewis. Advances in Engineering Software, 2016, 95: 51. [本文引用:1]
[9] Zhang Zhimin, Chen Shan, Liang Yizeng. The Analyst, 2010, 135(5): 1138. [本文引用:1]
[10] XUE Xiao-kang, LI Xiao-yu, DING Mao, et al(薛晓康, 李晓宇, 丁卯, ). Chinese Journal of Inorganic Analytical Chemistry(中国无机分析化学), 2018, 8(2): 66. [本文引用:1]