基于ICSO-SVM和三维荧光光谱的山梨酸钾浓度检测
王书涛, 刘诗瑜*, 王志芳, 张靖昆, 孔德明, 王玉田
燕山大学电气工程学院河北省测试计量技术及仪器重点实验室, 河北 秦皇岛 066004
*通讯联系人 e-mail: 2576954766@qq.com

作者简介: 王书涛, 1978年生, 燕山大学电气工程学院教授 e-mail: wangshutao@ysu.edu.cn

摘要

山梨酸钾是日常生活中一种典型的食品防腐剂。 过量食用防腐剂山梨酸钾, 会严重危害人身体健康。 以橙汁作为背景溶液, 配制山梨酸钾含量在0.007 0~0.100 0 g·L-1之间的山梨酸钾橙汁溶液样本共22组。 应用FS920荧光光谱仪对防腐剂山梨酸钾的水溶液以及橙汁溶液的荧光特性进行了研究。 由于山梨酸钾和橙汁的荧光特性相互干扰, 山梨酸钾橙汁溶液的浓度与荧光强度不再满足线性关系, 所以物质浓度的预测比较复杂。 通过构建改进鸡群算法优化支持向量机(ICSO-SVM)的模型对荧光光谱数据进行处理。 模型选取18个样本作为训练集, 4个样本作为预测集。 提取各样本在最佳激发波长 λex=375 nm下, 发射波长在450~520 nm范围内的荧光强度值作为输入, 以山梨酸钾橙汁溶液的浓度值作为输出。 首先对改进鸡群算法(ICSO)的各个参数进行初始化, 然后经过训练输出支持向量机(SVM)的惩罚因子 C和核参数 g的最佳值, 再将得到的最佳值输入SVM模型, 得到4组预测浓度值分别为0.011 5, 0.026 0, 0.077 0和0.092 0 g·L-1。 ICSO-SVM模型的均方误差为1.02×10-5 g·L-1, 平均回收率为101.88%。 相同条件下与鸡群算法优化支持向量机(CSO-SVM)、 遗传算法优化支持向量机(GA-SVM)和粒子群算法优化支持向量机(PSO-SVM)进行对比。 结果表明ICSO-SVM模型的预测精度高于CSO-SVM, GA-SVM和PSO-SVM, 而且改进鸡群算法在训练过程中更容易找到全局最优值, 迭代速度更快。 该研究为物质浓度预测提供了一种新方法。

关键词: 荧光光谱; 改进鸡群算法; 支持向量机; 山梨酸钾
中图分类号:O433.4 文献标志码:A
The Determination of Potassium Sorbate Concentration Based on ICSO-SVM Combining Three-Dimensional Fluorescence Spectra
WANG Shu-tao, LIU Shi-yu*, WANG Zhi-fang, ZHANG Jing-kun, KONG De-ming, WANG Yu-tian
Hebei Province Key Laboratory of Test/Measurement Technology and Instruments, School of Electrical Engineering, Yanshan University, Qinhuangdao 066004, China
*Corresponding author
Abstract

Potassium sorbate is a typical food preservative in daily life. Excessive consumption of the preservative potassium sorbate shall do harm to people’s health seriously. Using orange juice as background solution, 22 sets of samples of potassium sorbate orange juice solution with potassium sorbate content ranging from 0.007 0~0.100 0 g·L-1 were prepared. In this paper, the fluorescence characteristics of potassium sorbate in aqueous solution and in orange juice solution are studied by using FS920 fluorescence spectrometer. Due to the interference of orange juice, the concentration of potassium sorbate no longer satisfies the linear relationship with fluorescence intensity, and the prediction of the concentration of the substance is complicated. In this paper, an improved chicken swarm optimization support vector machine (ICSO-SVM) model is constructed to process the fluorescence spectrum data. Eighteen samples are selected as training set and four samples as prediction set. Under the optimum excitation wavelength λex=375 nm, the fluorescence intensity of each samples in the range of 450~520 nm are taken as input, and the concentrations of potassium sorbate orange juice are taken as output. Firstly, the parameters of the improved chicken swarm algorithm (ICSO) are initialized, then the optimal values of penalty factor C and kernel parameter g of the support vector machine (SVM) are found by training, and the optimal values are input into the ICSO-SVM model. The predicted concentration values of four groups are 0.011 5, 0.026 0, 0.077 0 and 0.092 0 g·L-1, respectively. The mean square error of ICSO-SVM model is 1.01×10-5 g·L-1, and the average recovery is 101.73%. Compared with chicken swarm optimization support vector machine (CSO-SVM), genetic algorithm optimization support vector machine (GA-SVM) and particle swarm optimization support vector machine (PSO-SVM) under the same conditions. The results show that the prediction accuracy of ICSO-SVM model is higher than that of CSO-SVM, GA-SVM and PSO-SVM. Moreover, the improved chicken swarm algorithm is easier to find the global optimal value in the training process and has faster iteration speed. This paper provides a new method for predicting the concentration of substances.

Keyword: Fluorescence spectra; Improved chicken swarm algorithm; Support vector machine; Potassium sorbate
引 言

防腐剂的使用屡见不鲜。 山梨酸钾作为防腐剂的一种, 在生活的各类产品中更是被广泛使用。 经常食用添加过量山梨酸钾的食品会对人造成伤害, 轻则引起食物中毒, 严重的还可能影响身体器官的健康[1, 2]。 目前检测山梨酸钾含量的方法有很多, 常用方式有层析法、 超高效液相色谱法、 气相色谱-质谱法和液相色谱质谱法等[3, 4, 5], 但是这些方法相对而言都操作比较繁琐, 而且成本又高成效又较低。 三维荧光光谱法[6, 7]的检测精度高, 操作更方便, 还能够实现痕量级别的检测。 本文利用三维荧光光谱实现在水溶液以及橙汁混合溶液中山梨酸钾浓度的检测, 实现超低检出限0.007 g· L-1, 远低于国标规定0.5 g· L-1。 并在橙汁背景的干扰下建立数学模型, 准确的检测出山梨酸钾的浓度。

SVM既可以通过构造一个最优超平面使所有的训练集样本距离该最优面最小的距离越大越好, 来解决分类识别的问题, 又可以通过构造最优分类面使得所有训练样本距离该面的误差越小越好, 来解决回归分析的问题。 它是一种比神经网络更简化高效的算法, 将其与现代智能优化算法结合起来能够使预测更加精准, 所以近年来一直被广泛应用[8]。 用CSO优化SVM的惩罚因子C和核参数g, 算法容易实现, 而且收敛精度比较高。 杨旌等[9]证明CSO优化回归型支持向量机在煤炭成本预测上比GA和PSO算法更有效精准, 张莹杰等[10]证明ICSO算法优化神经网络的分类识别模型比鸡群算法准确率更好, 收敛速度更快, 全局搜索能力更强。 用鸡群算法和改进鸡群算法寻优支持向量机的参数, 并训练和预测山梨酸钾浓度, 在物质浓度定量分析上建立了新的方法。

1 原理分析
1.1 支持向量机

SVM两个重要的参数分别为核参数g和惩罚因子C。 在线性支持向量机中引入核函数, 就可以将非线性不可分的低维空间映射到高维空间, 实现线性可分, 提高了预测的准确性; 在高维空间的内积计算又相当复杂, 转换到低维空间做计算, 在高维空间输出计算结果, 能够简化计算, 提高运行速度[11]。 常用的核函数包括线性核函数、 多项式核函数、 拉普拉斯核函数、 径向基函数等。 由于径向基核函数可以解决不可分割的问题, 可以处理小特征和一般样本数量的情况[12], 所以本文选择径向基核函数, 公式为

K(xi, xj)=exp(-γxi-xj2)γ=1g=12σ2(1)

其中, XiXj为两个特征向量, σ 是径向基的宽度, γ 是一种等价但简单的定义, g称为内核参数。

支持向量机的惩罚因子C的主要作用是控制可信度的容忍限度, 即C越大, 对异常样本的重视程度越高, 精度越高; 反之, C越小, 越容易忽略异常样本, 对经验误差的惩罚越小。 参数Cg的大小影响着支持向量机回归预测的准确性, 找到最佳的Cg可以使最终山梨酸钾浓度回归精度最佳。

由于不同的山梨酸钾浓度所对应的荧光强度值差别大, 在训练网络之前, 首先应将相对荧光强度数据进行归一化处理, 再输入SVM中, 将数据映射到[0, 1]区间内, 具体公式为

y=x-min(x)max(x)-min(x)(2)

其中x为实验所测得的数据, y为归一化后的有效数据。

使用回收率r和均方误差mse作为评价的指标, 两个公式分别为

r=y'iyi×100%(3)

mse=iN(y'i-yi)2N(4)

其中yi是样本的真实浓度, y'i是样本预测的浓度。 N是样本的个数。

1.2 改进鸡群算法

鸡群算法是模拟鸡群等级制度和社会行为的一种仿生群优化算法[13], 首先把大群体划分为若干个子群, 每个子群体分别包含一只公鸡、 若干母鸡和若干小鸡[14]。 下面分别是公鸡、 母鸡以及小鸡的位置更新公式[15]

子群体中公鸡粒子的适应度函数值最佳, 它们搜索食物的位置更新公式为

xi, j(t+1)=xi, j(t)[1+Randn(0, σ2)](5)

σ2=1, firfkrexpfkr-fir|fir|+ε,  else(6)

其中Randn(0, σ 2)为均值是0, 标准差是σ 2且满足高斯分布的随机数; firfkr分别是第ik只公鸡的适应度值, ik不相等; ε 是常数, 数值很小; xi, j(t+1)和xi, j(t)分别代表第t+1和第t时刻第i只鸡在第j维空间的位置;

群体的母鸡会随公鸡粒子进行搜索, 位置更新公式为

xi, j(t+1)=xi, j(t)+C1rand[xr1, j(t)-xi, j(t)]+C2rand[xr2, j(t)-xi, j(t)](7)

C1=exp{(fih-f)/[abs(fi+ε)]}(8)

C2=exp[(fr2-fi)](9)

其中, C1C2分别是母鸡位于所处的搜索群以及其他的搜索群体中所占的比例; xr1, j(t)和 xr2, j(t)分别代表母鸡粒子所处群体的公鸡与其他群体的公鸡的位置。

小鸡粒子只跟着所处子群中的母亲母鸡粒子来搜索, 其位置更新公式为

xi, j(t+1)=xi, j(t)+F[xm, j(t)-xi, j(t)](10)

式中, F为小鸡跟随母鸡来搜索食物的跟随系数, 它取[0, 2]区间的一个随机整值; xm, j(t)代表小鸡粒子所跟随的母亲母鸡粒子的位置。

改进的鸡群算法[16]针对于小鸡粒子只跟随子群中母亲母鸡寻找食物而造成搜索能力差的特点对CSO进行改进, 引入学习因子C3C4, 让小鸡除了跟随母亲母鸡外, 还能跟随所处群中公鸡和其他群中公鸡来搜索食物, 所以当发生母亲母鸡粒子陷入局部最优的情况时, 可以避免小鸡仅仅因母亲母鸡陷入局部最优造成同样陷入局部最优的情况, 而且也可以提高小鸡的学习效率, 让算法的收敛速度也得以提高。 改进后小鸡粒子的位置按如式(11)进行更新

xi, j(t+1)=xi, j(t)+F[xm, j(t)-xi, j(t)]+C3[xr3, j(t)-xi, j(t)]+C4[xr4, j(t)-xi, j(t)](11)

式中, C3C4分别代表小鸡向所处子群的公鸡粒子和其他群的公鸡粒子学习的学习因子; xr3, jxr4, j分别代表小鸡所处子群体公鸡的位置和其他群公鸡的位置。

1.3 ICSO-SVM模型的建立

(1)设置鸡群种群的大小pop, 迭代次数M, 种群的更新频率G, 设定公鸡粒子、 母鸡粒子、 母亲母鸡粒子以及小鸡粒子各占的百分比, 设置学习因子C3C4的值; 设置SVM的惩罚参数C核参数g的范围, 设定交叉验证折数值。

(2)把式(6)中mse当作适应度函数, 确定每个鸡群个体的适应度值及最佳的位置。

(3)当迭代次数t/G=1时, 对适应度值进行排序, 确定个体之间的等级制度, 分别建立母鸡粒子与小鸡粒子和与公鸡粒子之间的关系。

(4)按照式(5), 式(7)和式(11)对群体中各粒子所处位置进行更新, 并计算更新之后相应粒子适应度函数值。

(5)找到当前所处的个体最佳位置、 全局最佳位置以及个体最佳适应度值、 全局最佳适应度值。 再进行约束条件判断, 达到条件则输出最佳参数, 未达到条件则返回(3)继续执行。

2 实验部分

选用FS920荧光光谱仪, 检测波长范围为200~900 nm, 设置它的激发波长在250~550 nm, 隔5 nm扫描一次; 发射波长在300~610 nm, 隔2 nm扫描一次, 狭缝设置在2.5 mm。

2.1 样品制备

从市场采购相同品种的橙子, 剥皮, 榨取橙汁, 取上层液体作为本次实验所用的背景溶液。 山梨酸钾则采用从某生物公司购买的分析纯固体。 首先用实验室的JPT-1型架盘天平准确称量定量的山梨酸钾固体粉末, 将其充分溶解于纯净水中, 配置好一定浓度的山梨酸钾的水溶液。 然后将配制好的山梨酸钾单体溶液和定量的橙汁溶液充分混合, 配得山梨酸钾橙汁溶液。 重复以上操作, 共配制22个混合样本, 山梨酸钾的含量在0.007 0~0.100 0 g· L-1之间, 其中0.007 0~0.010 0 g· L-1的样本间隔为0.001 0和0.010 0~0.100 0 g· L-1的样本间隔为0.0050 g· L-1

2.2 光谱分析

图1是山梨酸钾水溶液三维荧光光谱图和等高线图, 可以看出, 在λ ex/λ em=375/480 nm存在一个荧光峰, 所以山梨酸钾水溶液的最佳激发波长在375 nm, 最佳发射波长在480 nm。

图1 山梨酸钾在水溶液中的荧光光谱
(a): 三维荧光光谱; (b): 等高线光谱图
Fig.1 The fluorescence spectra of potassium sorbate in aqueous solution
(a): The three dimensional fluorescence spectra; (b): The contour map of fluorescence spectra

图2是山梨酸钾在橙汁溶液中荧光光谱图和等高线图。 可以看出, 混合溶液中的山梨酸钾的图与其水溶液相比有一个明显的荧光侧峰出现, 它位于激发波长460~480 nm, 发射波长510~560 nm的区域, 荧光强度也增强了, 说明可能是橙汁溶液带来了干扰, 这干扰很有可能影响最终的预测结果。

图2 山梨酸钾在橙汁中的荧光光谱
(a): 三维荧光光谱; (b): 等高线光谱图
Fig.2 The fluorescence spectra of potassium sorbate in orange juice
(a): The three dimensional fluorescence spectra; (b): The contour map of fluorescence spectra

进一步分析, 提取对背景橙汁样品扫描的光谱数据, 并从测得的数据中选取浓度分别为0.009 0, 0.025 0, 0.055 0, 0.075 0和0.090 0 g· L-1的5组山梨酸钾的混合溶液的数据, 在最佳激发波长处于375 nm前提下, 分别绘制每组溶液的发射光谱图, 并绘制最大荧光强度随山梨酸钾橙汁溶液浓度变化的曲线如图3和图4所示。 结合两图可以确定混合溶液的浓度与荧光强度之间并不是简单的线性关系, 混合溶液的浓度增大, 荧光峰的位置随之变化, 即有红移的趋势。

图3 不同浓度山梨酸钾溶液发射光谱Fig.3 Emission spectra of potassium sorbate solutions with different concentrations

图4 不同浓度山梨酸钾溶液最大荧光强度Fig.4 Maximum fluorescence intensity of potassium sorbate solutions with different concentrations

且橙汁溶液在发射波长460~560 nm有显著的荧光出现。 从相关文献[17]上看, 橙汁的激发波长位于470 nm时, 会有发射波长530 nm左右的荧光峰, 会对山梨酸钾的荧光光谱有一定的干扰, 所以准确检测山梨酸钾浓度是比较复杂的。

3 结果与讨论

首先取不同浓度的山梨酸钾橙汁样本22个, 取各个样本在激发波长375 nm, 发射波长450~520 nm的相对荧光强度数据组成22× 36的矩阵作为输入, 22个样本的浓度作为数据输出。 选取其中浓度为0.009 0, 0.030 0, 0.080 0和0.095 0 g· L-1的4个样本作为测试集, 其余18个样本作为训练集。 设置鸡群大小pop=100, 迭代次数M=100, 种群更新频率G=10, 公鸡、 母鸡、 小鸡粒子所占比例分别为15%, 70%和15%, 其中母亲母鸡粒子为50%, 设置学习因子C3=C4=0.1; SVM的惩罚参数C∈ [0.1, 100], 核参数g∈ [0.01, 1 000], 交叉验证折数设置为v=3, 然后迭代寻优这些数据, 寻找最佳适应度值以及最佳参数Cg

CSO, ICSO, PSO和GA四种优化方法的适应度曲线变化情况如图5所示。 CSO的最佳适应度值在第8代附近达到最小值, 其平均适应度曲线在12代左右以后保持最小值。 ICSO的最佳适应度曲线在第1代即收敛到最小值并且以后保持不变, 其平均适应度曲线12代左右后保持最小值, 并且ICSO最佳适应度与平均适应度曲线间的距离比CSO的更小, 说明ICSO适应度曲线的拟合度比CSO的更好, 并且ICSO的收敛速度也优于CSO。 PSO虽然最佳适应度一直保持稳定, 但平均适应度与最佳适应度之间的差值过大。 GA的最佳适应度值在67代以后才能达到稳定。 综合四幅图, ICSO在收敛速度和拟合效果上, 都是最优的。

图5 ICSO, CSO, PSO和GA适应度变化曲线Fig.5 Fitness curve of ICSO, CSO, PSO and GA

将最佳参数输入SVM, 对训练集进行预测, 得到山梨酸钾的预测值。 表1是四种算法回收率与均方误差对比, ICSO-SVM模型得到的4组预测浓度值分别为0.011 5, 0.026 0, 0.077 0和0.092 0 g· L-1, 预测结果最接近真值, 均方误差为1.02× 10-5, 平均回收率为101.88%, 预测精度比CSO-SVM, GA-SVM和PSO-SVM模型都高, ICSO-SVM在检测山梨酸钾浓度上是四种方法中最佳的。

表1 四种优化算法的回收率及均方误差比较 Table 1 Comparison of the recovery rate and mean square error of four optimal algorithms
4 结 论

分析了山梨酸钾橙汁溶液的荧光特性, 在橙汁背景的干扰下, 分别利用ICSO, CSO, PSO, GA四种寻优方法优化SVM的参数来进行山梨酸钾浓度的预测, 结果表明ICSO-SVM最容易找到全局最优值, 均方误差和平均回收率最好, 收敛速度更快, 所以ICSO-SVM是四种方法中最佳的一种检测山梨酸钾橙汁溶液浓度的方法。 实验下一步任务将该方法用于其它浓度范围乃至其他物质上, 并且寻找更加优化的鸡群算法的改进算法。

参考文献
[1] XIAN Zhi-feng(冼志锋). Enterprise Science and Technology and Development(企业科技与发展), 2014, 14(18): 21. [本文引用:1]
[2] Cao Yu, Li Jia-yu, Liu Jun, et al. Journal of Applied Polymer Science, 2018, 135(48): 46885. [本文引用:1]
[3] Xie Shengming, Yuan Liming. Journal of Separation Science, 2017, 40(1): 124. [本文引用:1]
[4] JI Jie, LI Xiu-qin, MAO Ting, et al(纪洁, 李秀琴, 毛婷, ). Acta Metrologica Sinica(计量学报), 2017, 38(4): 507. [本文引用:1]
[5] Tighrine Abderrahmane, Amir Youcef, Alfaro Pilar, et al. Food Chemistry, 2019, 277: 586. [本文引用:1]
[6] WANG Shu-tao, CHEN Dong-ying, WEI Meng, et al(王书涛, 陈东营, 魏蒙, ). Chinese Journal of Laser(中国激光), 2015, 42(5): 0515004. [本文引用:1]
[7] SHEN Hai-dong, BAI Yu-hong, ZHENG Hua, et al(沈海东, 白玉洪, 郑华, ). Offshore Oil(海洋石油), 2017, 37(2): 61. [本文引用:1]
[8] MA Yan, ZHAO Han-dong, HUANG Xin(马焱, 赵捍东, 黄鑫). Journal of Detection and Control(探测与控制学报), 2017, 39(2): 124. [本文引用:1]
[9] YANG Jing, LI Jun-fu, ZHANG Gao-qing(杨旌, 李俊付, 张高青). Journal of Guangxi University·Natural Science Edition(广西大学学报·自然科学版), 2017, 42(4): 1623. [本文引用:1]
[10] ZHANG Ying-jie, ZHANG Shu-qun(张莹杰, 张树群). Computer Engineering and Science(计算机工程与科学), 2018, 40(12): 2252. [本文引用:1]
[11] WANG Dong-feng, MENG Li(王东风, 孟丽). Acta Automatica Sinica(自动化学报), 2016, 42(10): 1552. [本文引用:1]
[12] Baqheri Majid, Rezaei Hadi. Carbonates and Evaporites, 2019, 34: 699. [本文引用:1]
[13] Torabi Shadi, Safi-Esfahani Faramarz. Soft Computing, 2019, 23(20): 10129. [本文引用:1]
[14] KONG Fei, WU Ding-hui(孔飞, 吴定会). Journal of Jiangnan University·Natural Science Edition(江南大学学报·自然科学版), 2015, 14(6): 681. [本文引用:1]
[15] LI Zhen-bi, WANG Kang, JIANG Yuan-yuan(李振璧, 王康, 姜媛媛). Microellectronics and Computer(微电子学与计算机), 2017, 34(2): 30. [本文引用:1]
[16] XU Yi-xun, LI Wang, LI Dong-dong, et al(许仪勋, 李旺, 李东东, ). Power System Protection and Control(电力系统保护与控制), 2016, 44(13): 27. [本文引用:1]
[17] MA Wang-qiong, CHEN Hua-cai, CHEN Xiao-zhen, et al(麻望琼, 陈华才, 陈小珍)). Journal of China University of Metrology(中国计量学院学报), 2015, (2): 182. [本文引用:1]