基于可见光谱结合神经网络算法快速鉴别特级初榨橄榄油
袁媛1,*, 张晋2
1. 四川建筑职业技术学院, 四川 德阳 618000
2. 山西农业大学信息科学与工程学院, 山西 太谷 030801
*通讯作者

作者简介: 袁 媛, 女, 1981年生, 四川建筑职业技术学院副教授 e-mail: dypmyy02@163.com

摘要

随着中国经济的不断繁荣, 人民对物质生活水平提出了更高的要求, 预防疾病、 改善身体功能的食品成为当前消费市场的“热点”。 油脂能提供人体所必需的能量, 食用油是人类获取油脂的主要途径之一, 而高品质植物油含有对人体健康更有益的物质, 例如单不饱和脂肪酸、 多酚、 角鲨烯、 维生素E等营养物质。 由于采用物理冷榨工艺, 特级初榨橄榄油几乎保留了其橄榄果中所有的营养物质, 油酸含量高达70%。 因此, 虽然作为一种“舶来品”, 特级初榨橄榄油进入中国市场后一直是植物油市场中的“宠儿”, 其价格也明显高于市场上的普通植物油。 在利益的驱动下, 特级初榨橄榄油的制假贩假现象屡禁不止, 制假贩假的手段也不断更新迭代, 从而造成国内橄榄油市场假冒伪劣产品屡禁不止, 掺假的油品不仅会对消费者的生命财产造成伤害, 而且也会影响合法经营者的生产和销售, 扰乱销售市场, 破坏市场秩序, 影响民众对特级初榨橄榄油的认可度。 为实现特级初榨橄榄油掺伪量的快速、 准确、 低成本地检测, 提出一种基于广义回归神经网络结合紫外可见光谱实现植物油定性定量分析方法。 广义回归神经网络在学习速度和非线性映射能力上表现出色, 且扩散因子是其网络的唯一优化参数, 不需要反向传播和反复迭代。 与其他检测技术相比, 紫外可见光谱技术在检测周期、 稳定性、 低维护成本等方面具有压倒性优势。 通过两种方法的联用在植物油定性鉴别中实现了100%的判别, 在特级初榨橄榄油掺伪定量检测中实现了判定系数 R2优于0.988 75, 均方根误差RMSE优于0.038 33的结果。 研究结果表明, 该模型在植物油种类鉴别及特级初榨橄榄油掺伪定量检测中表现出优秀的预测能力。

关键词: 定性定量; 植物油; 特级初榨橄榄油; 紫外可见光谱; 广义回归神经网络
中图分类号:TS225.1 文献标志码:A
Application of Generalized Regression Neural Network With Ultraviolet-Visible Spectrometry Methods for Detection of Extra Virgin Olive Oil
YUAN Yuan1,*, ZHANG Jin2
1. Department of Engineering Management, Sichuan College of Architectural Technology, Deyang 618000, China
2. College of Information Science and Engineering, Shanxi Agricultural University, Taigu 030801, China
*Corresponding author
Abstract

With the continuous prosperity of China's economy, people have put forward higher requirements for material living standards. Food that prevents diseases and improves physical function has become a “hot spot” in the consumer market. Oil can provide energy for the human body. Edible oil is one of the major ways for human beings to get oil, and high-quality vegetable oil contains substances that are more beneficial to human health, such as monounsaturated fatty acids, polyphenols, squalene, vitamin E, and other nutrients. Because of the physical cold pressing process, extra virgin olive oil keeps almost all the nutrients in its olive fruit, and the oleic acid content is as high as 70%. Therefore, although an “imported product”, extra virgin olive oil has been a “favorite” in the vegetable oil market since it entered the Chinese market, and its price is also significantly higher than ordinary vegetable oil on the market. Driven by interests, the phenomenon of making and selling fake super virgin olive oil has been repeatedly banned, and the means of making and selling fake olive oil have been constantly updated and iterated, resulting in the repeated prohibition of fake and inferior products in the domestic olive oil market. Adulterated oil products will not only harm the lives and property of consumers but also affect the production and sales of legitimate operators, disrupt the sales market, destroy the market order, and affect the public's recognition of super virgin olive oil. The adulteration of vegetable oil is one of the urgent problems facing food safety at present. To realize the rapid, accurate, and low-cost identification and detection of the adulteration of vegetable oil and extra virgin olive oil, a method for qualitative and quantitative analysis of vegetable oil based on a generalized regression neural network and UV-Vis spectrum is proposed. Because the generalized regression neural network performs well in learning speed and nonlinear mapping ability, and the diffusion factor is the only optimization parameter of the network, it does not need backpropagation and repeated iteration. Compared with other detection technologies, UV-Vis technology has overwhelming advantages in terms of the detection cycle, stability, and low maintenance cost. This method has achieved 100% discrimination in the qualitative identification of vegetable oil and achieved the results that the determination coefficient ( R2) is better than 0.988 75 and the root mean square error (RMSE) is better than 0.038 33 in the quantitative detection of extra virgin olive oil adulteration. The results showed that the model showed excellent predictive ability in identifying vegetable oils and in the quantitative detection of adulteration in extra virgin olive oil. Therefore, the method based on a generalized regression neural network algorithm and UV-Vis spectrum has important potential for application in vegetable oil's qualitative and quantitative detection.

Keyword: Qualitative and quantitative; Vegetable oil; Extra virgin olive oil; Ultraviolet-Visible Spectroscopy; Generalized regression neural network
引言

植物油是人类饮食中最主要的原材料之一, 是一类从植物中提取的天然油脂。 目前常见的植物油包括菜籽油, 大豆油, 花生油, 玉米油, 葵花油, 稻米油等。 随着国内经济增长及人民物质生活水平的提高, 越来越多的人群选择并逐渐接受具有更高营养价值的特级初榨橄榄油作为主要摄入油脂。 然而, 国内橄榄油市场极度依赖进口且国内民众对特级初榨橄榄油的认知不足并常带有一定盲目跟风性。 国内橄榄油市场特级初榨橄榄油掺假造假现象屡禁不止。 为规范橄榄油市场并加快橄榄油检测技术的研发进度, 研究人员开展了大量关于特级初榨橄榄油定性定量检测方法的研究, 其中光谱检测技术是最重要的检测手段之一。 光谱检测技术包括拉曼光谱技术[1, 2, 3, 4, 5]、 荧光光谱技术[6, 7, 8, 9, 10]、 红外光谱技术[11, 12, 13, 14]及吸收光谱技术[15, 16, 17, 18]等。

2014年, Gonalves等[16]采用紫外-可见光谱结合化学计量学对食用油品质开展了评估, 表明紫外可见光谱在食用油品质检测方面具有潜在的应用价值; 2016年, Wang等[16]开发了一种利用紫外光谱法测量食用油过氧化值的新颖方法, 改进的紫外光谱法不受油类种类的影响, 可替代定性定量检测过氧化值的传统方法; 2018年, 王泓鹏等[18]提出一种基于植物油可见吸收光谱的相关系数鉴别特级初榨橄榄油的方法, 该方法可实现对特级初榨橄榄油快速精准的判别。 此外, 2020年, 该团队还提出一种基于可见超连续光谱快速检测特级初榨橄榄油的技术手段[18], 相关算法的关键判定系数需要人为设定阈值。 2021年, 邓雅文等[19]基于广义回归神经网络算法实现了京津冀地区土壤湿度的预测评估, 体现了广义回归神经网络算法在解决非线性回归类问题的优势。

综合广义回归神经网络的算法优势并结合紫外可见光谱的技术特征, 采用不同种类纯植物油及不同掺伪量的特级初榨橄榄油为研究对象, 应用紫外可见吸收、 透射光谱技术, 利用优化后的广义回归神经网络分析植物油种类或定量分析特级初榨橄榄油的掺伪量, 为植物油的定性定量分析提供可靠的技术支撑, 为市场上流通的植物油提供品质保障, 特别是为特级初榨橄榄油的市场监管提供参考。

1 实验部分
1.1 材料与试剂

菜籽油和花生油: 鲁花牌, 稻米油和玉米油: 金龙鱼牌, 葵花油: 多力牌, 大豆油: 福临门牌, 茶油: 千岛源牌, 特级初榨橄榄油: 品利牌(西班牙), 其中每种油品各采购10份, 所有植物油均采购自当地大型购物中心并经过相关部门的质量检验。

1.2 仪器与设备

日本岛津公司SolidSpec-3700DUV分光光度计, 光谱范围185~3 300 nm, 探测器为光电倍增管, 采样间隔2 nm, 波长重复优于0.08 nm, 光学最高分辨率达0.1 nm。 实验采用紫外石英比色皿。

1.3 试验条件

1.3.1 样品制备工艺

在纯植物油的定性分析中, 每种植物油各10份油品直接取样并依次编号, 待后续直接实验测量。 在特级初榨橄榄油的掺伪定量分析中, 按照不同体积比的掺伪方式, 配比不同浓度的特级初榨橄榄油和大豆油的混合油品并将其充分混合后, 静置24 h, 其中混合油品特级初榨橄榄油的浓度体积比依次为0.000, 0.050, 0.058, 0.06, 0.062, 0.068, 0.072, 0.078, 0.082, 0.090, 0.100, 0.12, 0.125, 0.15, 0.18, 0.200, 0.250, 0.333, 0.500, 0.68, 0.750, 0.800, 0.82, 0.85, 0.88, 0.890, 0.900, 0.920, 0.93和1.000, 每个浓度比各单独制备10个样本。

1.3.2 实验过程及数据处理软件

实验采用紫外石英比色皿降低容器对紫外谱段的吸收, 以180° 透射式进行紫外可见谱段的扫描(光谱范围设定250~1 300 nm)。 仪器经过15 min预热后, 取3 mL样本滴入紫外石英比色皿并放入仪器中分别采集其透射光谱和吸收光谱, 其中每次实验各扫描2次, 空比色皿作为对比参照。 数据处理、 定性定量模型及部分图片绘制均通过Matlab R2020a完成, 其他图由Origin 2021绘制。 所有的实验样本均扫描2次并取平均值, 为进一步降低光谱数据的噪声, 原始数据经过小波降噪和平滑处理; 透射光谱和吸收光谱在输入广义回归神经网络模型前经过了归一化处理。

2 结果与讨论
2.1 植物油紫外可见光谱

所有的实验样本均采集了紫外可见吸收、 透射光谱, 其中纯植物油的光谱数据用于定性模型的构建, 混合油品的光谱数据用于掺伪定量模型的构建。 图1(a)是8种纯植物油的吸收光谱图, 图1(b)是8种纯植物油的透射光谱图。 图1(a, b)可以发现每种植物油具有其典型的特征光谱, 这种差异是实现纯植物油定性判别的依据, 特级初榨橄榄油在350~800 nm之间具有典型的特征光谱, 这种特征极其明显。 物理冷榨工艺使特级初榨橄榄油含有较高的叶绿素和β 胡萝卜素, 是产生这些特征光谱的主要因素。 因此, 在特级初榨橄榄油的定性定量研究中, 必须充分考虑生物色素的特征光谱[17, 18]

图1 8种植物油样品紫外可见吸收透射光谱Fig.1 The UV-VIS-NIR absorption and transmission spectra of 8 kinds of vegetable oil samples

为实现特级初榨橄榄油的掺伪定量分析, 进行特级初榨橄榄油与大豆油混合油品的紫外可见吸收、 透射光谱的实验, 如图2所示。 图2(a)是不同浓度特级初榨橄榄油吸收光谱的曲面图, 图2(b)是不同浓度特级初榨橄榄油透射光谱的曲面图。 曲面图的x坐标为波长, y坐标为特级初榨橄榄油的浓度体积比, z坐标为光谱的吸光度或透射率, 坐标xy面还绘制了等高线图。 不管是吸收光谱曲面图还是透射光谱曲面图, 都可以发现特级初榨橄榄油的浓度体积比和光谱特征峰呈某种良好的非线性相关性, 这种非线性映射关系是可以通过神经网络算法拟合的。

图2 特级初榨橄榄油掺伪样品的紫外可见吸收透射光谱Fig.2 The UV-VIS-NIR absorption and transmission spectra of adulterated samples of extra virgin olive oil

2.2 广义回归神经网络

广义回归神经网络(generalized regression neural network, GRNN)是一种基于径向基函数神经网络的改进算法, 是一种基于非参数核回归统计方法, 是非常适用于函数拟合和解决回归问题的典型的机器学习算法, 其具有非常强的学习速度且非线性映射能力也很优秀。 由于其隐藏层中使用高斯激活函数的单向传播特性, GRNN不需要后向传播和反复迭代过程, 其唯一需要优化的参数只有一个, 即扩散因子。 GRNN善于解决样本量少的非线性问题, 算法的稳健性和容错性极佳。

GRNN的结构包含输入层、 隐藏层、 求和层和输出层, 如图3所示。 本研究中分别构建吸收光谱植物油种类判定的GRNN模型、 透射光谱植物油种类判定的GRNN模型、 吸收光谱特级初榨橄榄油定量掺伪鉴别的GRNN模型以及透射光谱特级初榨橄榄油定量掺伪鉴别的GRNN模型。 考虑到GRNN高效的学习速度以及光谱特性, 将整条光谱作为x1xn的输入变量, 即每条光谱的元素个数与输入层神经元素相同。 在定性判别的模型中, 将菜籽油编号为1, 特级初榨橄榄油编号为2, 稻米油编号为3, 玉米油编号为4, 花生油编号为5, 葵花油编号为6, 大豆油编号为7, 茶油编号为8, 此时GRNN模型的输出层分别对应于这些编号。 在定量掺伪的模型中, 将混合油品中特级初榨橄榄油的体积比作为GRNN模型的输出层。

图3 广义回归神经网络拓扑结构图Fig.3 Topological structure diagram of generalized regression neural network

由于扩散因子是影响GRNN模型的唯一因素, 如何选扩散因子成为训练该模型的主要调控参数。 已对样本制备过程和光谱数据采集过程进行了详细说明, 将获取的光谱数据按比例4∶ 1随机分配并用于模型训练及测试。 如图4所示, 不同扩散因子对4种GRNN模型(吸收光谱植物油种类定性模型, 透射光谱植物油种类定性模型, 吸收光谱植物油掺伪定量模型以及透射光谱植物油掺伪定量模型)判定系数的影响。 训练结果表明当扩散因子趋于0.01时, 4种模型均达到最优。

图4 扩散因子对模型判定系数的影响Fig.4 Influence of diffusion factor on the judgment coefficient of model

2.3 训练集交叉验证及测试集验证

根据对扩散因子最优化, 对比了4种GRNN模型的训练集交叉验证及测试集验证结果。 在植物油种类的定性判别中, 吸收、 透射光谱的GRNN模型取得了一致的预测性能, 即训练集交叉验证结果和测试集验证结果均未出现错误判别, 全谱段的光谱输入并未带来冗余的运算量, GRNN表现出优秀的模型训练速度, 如图5所示。 图5(a)为吸收光谱GRNN的纯植物油训练集交叉验证判别结果, 图5(b)为透射光谱GRNN的纯植物油训练集交叉验证判别结果, 图5(c)为吸收光谱GRNN的纯植物油测试集验证判别结果, 图5(d)为透射光谱GRNN的纯植物油测试集验证判别结果。

图5 植物油种类判别的GRNN模型的训练集交叉验证及测试集验证结果(a, b, c, d)Fig.5 Validation results of training set and test set of GRNN model for vegetable oil classification (a, b, c, d)

在特级初榨橄榄油掺伪定量分析中, 为更为全面评估GRNN模型的稳健性和容错性, 随机生成了2组训练集和测试集(训练集和测试集的样本量依然保持4∶ 1), 其中训练集起到了交叉验证的作用, 即训练集中随机挑出一个光谱, 剩余光谱用于训练模型, 挑选的那条光谱用于测试该模型结果, 然后将挑出的光谱放入数据集中, 再从中随机挑选另一条光谱, 这样依次反复, 把训练集所有的光谱数据都进行了交叉验证, 最后通过测试集验证模型的可靠性。 通过判定系数(the coefficient of determination, R2)和均方根误差(root mean square error, RMSE)评价模型的预测性能。 当判定系数R2越趋于1时, GRNN模型预测精度越高; 当均方根误差RMSE越趋于0时, GRNN模型预测结果越稳健。 图6和图7展示了GRNN模型在混合油品中特级初榨橄榄油浓度的预测效果。 图6(a)和图7(a)为吸收光谱GRNN定量掺伪模型训练集交叉验证结果的散点图, 图6(b)和图7(b)透射光谱GRNN定量掺伪模型训练集交叉验证结果的散点图, 图6(c)和图7(c)为吸收光谱GRNN定量掺伪模型测试集验证结果的散点图, 图6(d)图7(d)为透射光谱GRNN定量掺伪模型测试集验证结果的散点图。 两次GRNN模型的训练结果表明: 训练集交叉验证结果的判定系数R2优于0.995 44, 均方根误差RMSE优于0.024 784; 测试集验证结果的判定系数R2优于0.988 75, 均方根误差RMSE优于0.038 33。 通过两次模型的训练及训练集和测试集评价参数的比较, 可以判定GRNN在特级初榨橄榄油掺伪定量检测中性能出色且算法的稳健性得到了很好的表现, 不存在过拟合、 欠拟合的问题。

图6 第一组数据GRNN模型预测特级初榨橄榄油浓度与实际浓度散点图 (a, b, c, d)Fig.6 Scatter plot of predicted extra virgin olive oil concentration and actual concentration by GRNN model of the first set of data (a, b, c, d)

图7 第二组数据GRNN模型预测特级初榨橄榄油浓度与实际浓度散点图Fig.7 Scatter plot of predicted extra virgin olive oil concentration and actual concentration by GRNN model of the second set of data

在GRNN定性分析模型中, 吸收、 透射光谱的判别效果均实现100%的训练集交叉验证和测试集验证, 说明两种光谱在纯植物油种类判别方面具有相同的优势; 在GRNN定量掺伪鉴别模型中, 第一组数据吸收光谱GRNN的模型评价参数(R2=0.989 22, RMSE=0.038 33)优于透射光谱(R2=0.988 75, RMSE=0.037 994), 第二组数据透射光谱GRNN的模型评价参数(R2=0.992 12, RMSE=0.032 762)优于吸收光谱(R2=0.989 39, RMSE=0.037 619), 这种优势不具有压倒性优势, 即两种技术的GRNN模型效果几乎一致。

图8(a— d)和图9(a— d)为两次模型预测误差的散点图。 通过预测误差散点图的判定系数和均方根误差发现GRNN定量分析模型在解决该类非线性回归类问题时表现优异。

图8 第一组数据GRNN预测误差散点图Fig.8 Scatter plot of predicted value error by GRNN model of the first set of data

图9 第二组数据GRNN预测值误差散点图Fig.9 Scatter plot of predicted value error by GRNN model of the second set of data

通过绝对误差散点图发现, 吸收光谱和透射光谱在评估橄榄油掺伪方面均表现较好的性能。

3 结论

提出一种基于紫外可见光谱结合GRNN的植物油定性定量检测方法, 该方法不仅适用于纯植物油种类的判别, 而且在特级初榨橄榄油掺伪定量检测方面表现优异, 吸收光谱和透射光谱建立的GRNN模型效果无显著差异。 经过2次定量模型预测效果的比较, 进一步验证了GRNN模型的准确性、 高效性及稳定性。 因此, 基于紫外可见光谱结合GRNN的定性定量分析模型可快速实现纯植物油种类判别及特级初榨橄榄油掺伪定量检测, 为植物油市场规范和特级初榨橄榄油掺伪鉴别提供了技术参考和理论实验依据。

参考文献
[1] Johnson G L, Machado R M, Freidl K G, et al. Organic Process Research & Development, 2002, 6(5). doi: DOI:10.1021/op0202080. [本文引用:1]
[2] HUANG Shuai, WANG Qiang, YING Rui-feng, et al(黄帅, 王强, 应瑞峰, ). Science and Technology of Food Industry(食品工业科技), 2019, 40(11): 334. [本文引用:1]
[3] Zou Mingqiang, Zhang Xiaofang, Qi Xiaohua, et al. Journal of Agricultural and Food Chemistry, 2009, 57(14): 6001. [本文引用:1]
[4] Dong Wei, Zhang Yingqiang, Zhang Bing, et al. Journal of Raman Spectroscopy, 2014, 44(12): 1739. [本文引用:1]
[5] Huang Furong, Li Yuanpeng, Guo Huixian, et al. Journal of Raman Spectroscopy, 2016, 47(7): 860. [本文引用:1]
[6] Jing X, Liu X F, Wang Y T. Food Chemistry, 2016, 212(1): 72. [本文引用:1]
[7] HUANG Xiu-li, HUANG Fei, CHEN Jia-cong, et al(黄秀丽, 黄飞, 陈嘉聪, ). Science and Technology of Food Industry(食品工业科技), 2014, (14): 64. [本文引用:1]
[8] Hadi N M, Mohammed A Z, Rasheed F F, et al. American Journal of Physics and Applications, 2016, (3). doi: DOI:10.11648/J.AJPA.20160403.12. [本文引用:1]
[9] Hina A, Muhammad S, Muhammad R A, et al. Applied Spectroscopy, 2018, 72(9): 1371. [本文引用:1]
[10] Xu Jing, Liu Xiaofei, Wang Yutian. Food Chemistry, 2016, 212(1): 72. [本文引用:1]
[11] Hourant P, Baeten V, Morales M T, et al. Applied Spectroscopy, 2000, 54(8): 1168. [本文引用:1]
[12] HU Ming-ming, ZHANG Quan, NING Shu-xian, et al(胡明明, 张权, 宁舒娴, ). Science and Technology of Food Industry(食品工业科技), 2022, 43(11): 1. [本文引用:1]
[13] ZHAO Jing(赵静). China Oils and Fats(中国油脂), 2021, 46(9): 71. [本文引用:1]
[14] Vieira L S, Assis C, Melrd Q, et al. Food Chemistry, 2021, 345(2): 128866. [本文引用:1]
[15] Rhayanna P G, Paulo H M, Valderrama P. Food Chemistry, 2014, 163(15): 83. [本文引用:1]
[16] Wang Ning, Ma Tian, Yu Xiuzhu, et al. Food Analytical Methods, 2016, 9: 1412. [本文引用:3]
[17] Shi J, Yuan D, Hao S, et al. Spectrochimica Acta Part A: Molecular & Biomolecular Spectroscopy, 2019, 206: 320. [本文引用:2]
[18] Zhang Q, Cheng L, Sun Z, et al. Food Chemistry, 2012, 132(3): 1607. [本文引用:4]
[19] DENG Ya-wen, LING Zi-yan, SUN Na, et al(邓雅文, 凌子燕, 孙娜, ). Journal of Geo-information Science(地球信息科学学报), 2021, 23(4): 749. [本文引用:1]