基于太赫兹时域光谱的食用油过氧化值定量分析研究
刘翠玲1, 杨雨菲1,*, 田芳2, 吴静珠1, 孙晓荣1
1.北京工商大学食品安全大数据技术北京市重点实验室, 北京 100048
2.北京工商大学外国语学院, 北京 100048
*通讯作者 e-mail: yangyf0919@163.com

作者简介: 刘翠玲, 女, 1963年生, 北京工商大学食品安全大数据技术北京市重点实验室教授 e-mail: liucl@btbu.edu.cn

摘要

针对目前太赫兹光谱技术在食用油品质检测方面存在定性多、 定量难的问题, 提出一种基于衰减全反射(ATR)式太赫兹时域光谱(THz-TDS)技术的食用油过氧化值定量分析方法。 首先采集不同种类、 不同氧化程度食用油样本的太赫兹时域光谱图, 筛选有效信号波段并提取得到光学常数, 经预处理算法校正后的光学常数, 结合多种化学计量学方法建立定量分析模型, 实现快速、 无损预测食用油的过氧化值。 70个实验样本包括大豆油、 菜籽油和玉米, 过氧化值覆盖范围0.41~10.23 mmol·kg-1, 且样本的过氧化值均匀分布。 采用TeraView公司生产配有ATR检测模块的TeraPulse 4000太赫兹脉冲光谱系统采集样本THz-TDS信号, 根据THz-TDS谱图信号特征筛选有效波段10~86.78 cm-1用于建模分析。 通过快速傅里叶变换得到频域信号并从中提取光学常数: 折射率和吸收系数, 采用Savitzky-Golay7点卷积平滑分别对折射率和吸收系数进行预处理, 去除干扰信号。 运用SPXY算法按照3:1比例划分校正集和预测集样本, 结合主成分回归法、 偏最小二乘法两种化学计量学分析方法, 分别建立基于折射率和基于吸收系数的过氧化值分析模型。 对模型评价指标均方根误差和相关系数进行分析, 基于折射率的过氧化值分析模型采用偏最小二乘算法建模预测精度最理想, 选取最优主成分数为6时, 其校正集均方根误差RMSEC为0.168%、 决定系数 R2为0.981, 预测集均方根误差RMSEP为0.231%、 决定系数 r2为0.977; 基于吸收系数的过氧化值分析模型则采用主成分回归算法建模预测模型稳健度最好, 选取最优主成分数为10时, 其校正均方根误差RMSEC为0.192%、 校正集决定系数 R2为0.979, 预测均方根误差RMSEP为0.262%、 预测集决定系数 r2为0.97。 该研究结果的得出, 验证了THz-TDS技术用于食用油过氧化值定量分析的可行性, 为食用油的品质评价找到一种高精度、 性能稳定、 快速无损的检测方法。

关键词: 食用油; 太赫兹时域光谱技术; 主成分回归; 偏最小二乘; 定量分析
中图分类号:O657.3 文献标志码:A
Study on Quantitative Analysis of Edible Oil Peroxide Value by Terahertz Time Domain Spectroscopy
LIU Cui-ling1, YANG Yu-fei1,*, TIAN Fang2, WU Jing-zhu1, SUN Xiao-rong1
1. Beijing Key Laboratory of Big Data Technology for Food Safety, Beijing Technology and Business University, Beijing 100048, China
2. School of Foreign Languages, Beijing Technology and Business University, Beijing 100048, China
*Corresponding author
Abstract

At present, Terahertz (THz) spectroscopy techniques are mainly used for qualitative analysis, but the application of THz technology can hardly be found in quantitative analysis in the detection of edible oil’s quality. This paper presents an approach to analyze edible oil quality based on Attenuated Total Reflection (ATR) and Terahertz Time Domain Spectroscopy(THz-TDS). Firstly, the THz-TDS of edible oil samples with different types and degrees of oxidation were collected, the effective signal band was filtered and the optical constants were extracted, the preprocessing algorithm corrected the optical constants, a variety of chemometrics methods were used to establish quantitative analysis models, in order to quickly and accurately predicted the peroxide value of edible oils. 70 experimental samples were used, including soybean oils, rapeseed oils and corn oils, the peroxide value ranged from 0.41 to 10.23 mmol·kg-1, and the peroxide value distribution of the samples was evenly distributed. A TeraPulse 4000 terahertz pulse spectroscopy system equipped with an ATR detection module belonging to TeraView was used to collect samples’ THz-TDS signals. According to THz-TDS characteristics, the effective band 10 to 86.78 cm-1 was selected for modeling analysis. The frequency domain signals were obtained by fast Fourier transform, and the optical constants were extracted: refractive index and absorption coefficient. Refractive index and absorption coefficient were preprocessed separately through Savitzky-Golay 7-points convolution smoothing, which had achieved the purpose of removing interference signals. The SPXY algorithm was used to divide the calibration set, and prediction set samples in a 3:1 ratio. The peroxide value analysis models based on refractive index and absorption coefficient were established by the principal component regression algorithm and partial least square algorithm. The root mean square error and correlation coefficient of the model evaluation indexes were analyzed, the peroxide value analysis model based on the refractive index was modeled by partial least squares algorithm had ideal prediction accuracy. When the optimal principal component number was selected to be 6, RMSEC is 0.168%, R2 is 0.981, RMSEP is 0.231%, r2 is 0.977. The principal component regression algorithm modeled the peroxide value analysis model based on the absorption coefficlent, and the prediction model had the best robustness. When the optimal principal component number was selected to be 10, RMSEC is 0.192%, R2 is 0.979, RMSEP is 0.262%, r2 is 0.97. This study verifies it is feasible to detect the peroxide value of edible oil by THz technology, and the more important innovation is a high-precision, stable performance, fast and non-destructive detection method for the evaluation of edible oil quality has been found. Furthermore, this research has important guiding significance for improving the safety of edible oil quality and building edible risk assessment systems.

Keyword: Edible oil; Terahertz time domain spectroscopy technology; Principal component regression; Partial least squares; Quantitative analysis
引言

食用油作为人体的三大营养源之一, 其品质的优劣直接影响到消费者身体健康。 而油脂在加工和贮存过程中十分容易受到光照、 温度、 氧气等环境条件影响, 而产生氢过氧化物, 该物质进一步受环境影响氧化分解成小分子的醛、 酮、 酸(即酸败现象), 致使过氧化值发生改变[1, 2]

近年来, 太赫兹时域光谱(Terahertz time domain spectroscopy, THz-TDS)技术因其具有辐射波长长、 穿透性好、 可反映分子集体振动模式和分子间相互作用等方面的特点而得到了迅速的发展[3]。 文献[4]通过采用THz-TDS技术采集未加热与加热后的花生油光谱特性, 由于加热后的花生油氧化分解程度更显著, 通过比较两者谱图信息, 发现谱图吸收峰在1~1.6 THz之间两者差别最显著, 加热后表现为吸收性更强, 该研究结果表明THz光谱技术可准确反映食用油组分的变化, 并论证了食用油的氧化情况可通过THz光谱技术得到。 文献[5]通过采集得到黑芝麻油、 芝麻油、 小磨香油和花生油四种食用油的THz-TDS, 选择波段在0.2~1.6 THz之间的延迟特性和折射率特性作为建模输入, 将其结合多种模式识别方法鉴别出食用油的种类。

文献[6]应用衰减全反射式THz-TDS技术, 发现由于食用油中脂肪酸分子的低频振动和转动, 从而影响光谱图的吸收峰, 表明食用油的吸收峰与所含脂肪酸分子种类与含量有关。

虽然已有少数研究者在应用THz-TDS探索油脂品质和油料作物的检测方面取得了一些进展, 但多用于食用油品的分子结构和组分的定性分析, 鲜有关注某一指标的定量研究, 因此定性多、 定量难的现象使得THz技术的发展还有很大的探索空间。

本文旨在实现衰减全反射式THz-TDS光谱技术用于食用油品质定量分析研究。 将衰减全反射式THz-TDS光谱技术与化学计量学方法相结合, 建立定量分析模型, 以期验证THz-TDS光谱技术检测食用油过氧化值的可行性, 并为食用油品质评价找到新方法。

1 实验部分
1.1 材料与仪器

由北京粮食科学研究院提供不同生产日期、 不同批次的大豆油、 菜籽油和玉米油, 共70个, 过氧化值覆盖范围0.41~8.547 mmol· kg-1。 其中, 23个样本的过氧化值小于1.2 mmol· kg-1; 21个样本的过氧化值在1.2~2.4 mmol· kg-1; 26个样本的过氧化值大于2.4 mmol· kg-1

实验设备由来自英国剑桥TeraView公司生产的型号为TeraPulse 4000的太赫兹脉冲光谱仪。 工作时仪器参数设置为: Terahertz光源: 激光门控光电导体半导体发射器, 激光器: 超短脉冲光纤激光器; 光谱测量范围在2~133 cm-1之间, 信噪比最高达到70 dB; 扫描范围: 2 400 ps; 快速扫描: 30次· s-1, 1.2 cm-1光谱分辨率。

光谱采集由太赫兹脉冲光谱仪配备的衰减全反射(attenuated total reflection, ATR)模块完成。 ATR能够测量固体和液体样本, 具备采样面积小、 样本量小等优点, 并且样本制备和采集方式简单。 它的工作范围在10~120 cm-1左右的电磁频谱区域, 入射角35° 。

1.2 过氧化值的测定

依照2016年颁布的GB5009.227— 2016《食品安全国家标准 食品中过氧化值的测定》中规定的滴定法测定食用油的过氧化值[7]

1.3 光谱采集

由于太赫兹波易受温度和湿度变化的影响, 本实验环境为温度和光线恒定的超净间实验室, 恒定温度为22 ℃、 恒定湿度25%。 实验过程中还需要不间断地使用空气压缩机对TeraPulse 4000光谱仪腔体进行吹扫, 以去除空气中水蒸气对实验数据的影响。

在逐个测定样本时, 均要保证在ATR晶体干净无污染的条件下完成。 检测样本前, 需检测实验环境的太赫兹信号, 作为参考信息。 检测样本的过程中, 采用移液枪逐一取样(取样量统一为600 μ L), 每采集完一份样本均需用酒精反复擦拭ATR晶体, 并确保无任何液体残留后, 再进行下一次样本采集工作。 图1(a)所示为3个不同氧化程度食用油样本的太赫兹时域光谱图, 图中横坐标代表时延, 单位ps, 纵坐标代表太赫兹信号强度。 图1(b)为局部放大图。

图1 不同氧化程度食用油样本的太赫兹时域光谱图
(a): 全局图; (b): 局部放大图
Fig.1 THz-TDS spectra of edible oil samples with different oxidation degrees
(a): Global picture; (b): Partial enlarged picture

如图1所示, 不同氧化程度食用油的脉冲幅度在相同波数下存在差异, 分析原因: 虽然食用油内部所含化学元素种类和数量是相同的, 但由于不同程度的氧化反应已引起样本组分微观化学结构发生变化。

1.4 分析模型评价指标

评价光谱模型的优劣, 需要判断的指标有校正集决定系数R2、 预测集决定系数r2(决定系数取值范围0~1), 校正均方根误差(root mean square error of calibration, RMSEC), 预测均方根误差(root mean square error of prediction, RMSEP), 各指标计算公式如式(1)— 式(3)所示。 通常认为一个理想的分析模型, 其决定系数越大且接近1, 回归性越好; 同时还需满足, RMSEC和RMSEP的值越小且RMSEC值小于RMSEP, 建模结果和模型实用性越理想[8]

RMSEC=i=1n(yi, a-yi, p)2n-1(1)

RMSEP=i=1m(yi, a-yi, p)2m-1(2)

R2(r2)=1-i=1N(yi, a-yi, p)2i=1N(yi, a-y̅a)2(3)

式中, yi, a为第i个样本的过氧化值真实值; yi, p为第i个样本的模型计算值; y̅为过氧化值真实值的均值; n为校正集的样本数; m为预测集的样本数; 当求RN=n、 求rN=m

2 结果与讨论
2.1 光谱预处理

2.1.1 光学常数的提取

光学常数是表征物质宏观光学性质的物理量。 光学常数的提取, 首先利用快速傅里叶变换对参考信息和样本的时域光谱进行转换, 得到对应的频域信号; 进而利用频域信号中的幅值和相位值, 计算得到光学常数, 即折射率和吸光系数。 折射率定义为光在真空中的传播速度与传播速度之比, 也可通过不同样本在时域信号上的延迟反映; 吸收系数定义为该样本单位厚度的吸光度。 折射率n(ω )和吸收系数α (ω )的计算公式如式(4)和式(5)所示。

n(ω)=1+φ(ω)cωd(4)

α(ω)=2dln4n(ω)ρ(ω)[n(ω)+1]2(5)

式中, ω 为角频率, d为样本厚度, c为太赫兹波在空气中的传播系数, φ (ω )和ρ (ω )由样本的频域信号与参考频域信号的比值函数所得, φ (ω )为比值函数的相位, ρ (ω )为比值函数的幅值[9]

计算得到不同氧化程度菜籽油、 玉米油和大豆油的光学常数谱图, 如图2所示。

图2 不同氧化程度菜籽油、 玉米油和大豆油的光学常数谱图
(a): 折射率谱图; (b): 吸收系数谱图
Fig.2 Optical constant spectrograms of rapeseed oil, corn oil and soybean oil with different oxidation degree
(a): Refractive index spectrums; (b): Absorption coefficient spectrums

图2(a)中, 不同种类的食用油, 在10~55 cm-1波数范围分别分布于不同的折射率区间, 根据折射率谱分布情况可判别食用油的种类, 因此食用油的营养组分和官能团对折射率谱的分布影响较大。 图2(b)中, 菜籽油和玉米油吸收系数谱波动情况相似, 而大豆油吸收系数谱波动较大, 明显区别于其他两类食用油。 但两类谱图的波动情况对过氧化值研究无明显规律, 需进一步结合化学计量学方法进行分析。

2.1.2 光谱噪声的处理

由于原始光学常数谱数据含有来自高频随机噪音、 基线漂移、 光散射等不利因素的影响, 因此在建模时需对其进行预处理, 从而达到去除信号干扰、 校正样本有效特征信息的目的。 Savitzky-Golay卷积平滑法通过移动窗口内的数据进行多项式最小二乘拟合, 可降低随机噪音、 改善模型的鲁棒性[10]。 针对光学常数谱图基线不稳、 噪声干扰强的特点, 采用Savitzky-Golay 7点卷积平滑对谱图数据进行预处理。

2.2 数据建模

2.2.1 建模分析方法

偏最小二乘(partial least square, PLS)法能够在自变量存在严重多重相关性的条件下进行回归建模, 并且可高效辨识系统信息与噪声(甚至一些非随机性的噪声), PLS模型的建立同时兼顾样本光谱矩阵X和过氧化值真实值矩阵Y, 使得X的主成分与Y的主成分直接关联起来[11, 12]

主成分回归 (principle component regression, PCR)法是一种用于解决样本变量间共线性问题的分析方法。 该算法既可用于剔除干扰噪声, 对有效光谱信息进行挑选, 又可分离多重共线性的重叠信息, 提高模型的预测能力和准确性。

2.2.2 基于折射率的过氧化值定量分析

采用SPXY法以3:1的比例划分样本集, 校正集48个, 预测集16个, 剔除异样本6个。 主成分数均取6。 建立基于折射率的食用油过氧化值分析模型, 预测结果如图3所示。

图3 基于折射率的食用油过氧化值分析模型预测结果图
(a): PLS法; (b): PCR法
Fig.3 Prediction results of edible oil peroxide value analysis model based on refractive index
(a): PLS method; (b): PCR method

PLS过氧化值分析模型, RMSEC为0.168%、 R2为0.981, RMSEP为0.231%、 r2为0.977; PCR过氧化值分析模型, RMSEC为0.329%、 R2为0.922, RMSEP为0.375%、 r2为0.892。

2.2.3 基于吸收系数的过氧化值定量分析

采用SPXY法以3:1的比例划分样本集, 校正集48个, 预测集16个, 剔除异样本6个。 主成分数均取10。 建立基于吸收系数的食用油过氧化值分析模型, 预测结果如图4所示。

图4 基于吸收系数的食用油过氧化值分析模型预测结果图
(a): PLS法; (b): PCR法
Fig.4 Prediction results of edible oil peroxide value analysis model based on absorption coefficient
(a): PLS method; (b): PCR method

PLS过氧化值分析模型, RMSEC为0.317%、 R2为0.927, RMSEP为0.333%、 r2为0.912; PCR过氧化值分析模型, RMSEC为0.192%、 R2为0.979, RMSEP为0.262%、 r2为0.97。

2.2.4 建模结果对比与分析

食用油过氧化值分析模型建模结果, 如表1所示。

表1 食用油过氧化值定量分析结果表 Table 1 Quantitative analytical results of peroxide value

对比表1中模型性能评价指标可知, 对于分析食用油THz折射率时, 采用SG卷积7点平滑预处理算法结合PLS算法建立的过氧化值分析模型性能稳健、 预测精度高, 建模集与预测集决定系数均大于0.97, 模型回归性好。 而分析食用油THz吸收系数时, 由于样本间的吸收系数共线性显著, 通过SG卷积7点平滑预处理原始吸收系数数据后, 采用PCR算法较PLS算法更为合适。

3 结论

选用不同种类、 不同生产批次的大豆油、 菜籽油和玉米油样本共70个, 采集其衰减全反射式THz-TDS光谱图, 通过快速傅里叶变换提取光学常数折射率和吸收系数。 经Savitzky-Golay 7点卷积平滑预处理后, 分别建立PCR模型和PLS模型。 基于折射率的PLS模型预测精度高、 模型稳健性良好, 选择6维主成分, 其RMSEC为0.168%、 R2为0.981, RMSEP为0.231%、 r2为0.977; 基于吸收系数的PCR模型预测误差小, 选择10维主成分, RMSEC为0.192%、 R2为0.979, RMSEP为0.262%、 r2为0.97。 该研究结果的得出论证了THz-TDS应用于食用油过氧化值分析的可行性, 并通过对比模型性能评价指标寻找出了切实可行的食用油过氧化值分析方法, 实现了食用油品质的精确、 快速无损检测。

参考文献
[1] Gong Weichao, Shi Ruyi, Chen Min, et al. Journal of Food Measurement and Characterization, 2019, 13(3): 2203. [本文引用:1]
[2] JI Min, LIU Zhong-yi, ZHANG Jian, et al(季敏, 刘忠义, 张剑, ). China Oils and Fats(中国油脂), 2018, 43(5): 92. [本文引用:1]
[3] Liang Jie, Guo Qijia, Chang Tianying, et al. Optik, 2018, 174: 7. [本文引用:1]
[4] Benjamin S Y Ung, Brian W H Ng, Derek Abbott. 35th International Conference on Infrared, Millimeter, and Terahertz Waves, IEEE, 2010. [本文引用:1]
[5] LIAN Fei-yu, FU Mai-xia, GE Hong-yi, et al(廉飞宇, 付麦霞, 葛宏义, ). China Oils and Fats(中国油脂), 2017, 42(7): 69. [本文引用:1]
[6] NIE Mei-tong, XU De-gang, WANG Yu-ye, et al(聂美彤, 徐德刚, 王与烨, ). Spectroscopy and Spectral Analysis(光谱学与光谱分析), 2018, 38(7): 2016. [本文引用:1]
[7] GB 5009. 227—2016 National Stand ard of the People’s Republic of China(中华人民共和国国家标准). National Food Safety Stand ard-Determination of Peroxide Value in Foods(食品安全国家标准食品中过氧化值的测定). [本文引用:1]
[8] CHU Xiao-li(褚小立). Molecular Spectroscopy Analytical Technology Combined with Chemometrics and Its Applications(化学计量学方法与分子光谱分析技术). Beijing: Chemical Industry Press(北京: 化学工业出版社), 2011. 124. [本文引用:1]
[9] Nakajima Shusaku, Shiraga Keiichiro, Suzuki Tetsuhito, et al. Food Chemistry, 2019, 294(5): 203. [本文引用:1]
[10] Hu Keqing, Huyan Zongyao, Sherazi Syed Tufail Hussain, et al. Journal of Oleo Science, 2019, 68(11): 1073. [本文引用:1]
[11] LIU Jun-xiu, DU Bin, DENG Yu-qiang, et al(刘俊秀, 杜彬, 邓玉强, ). Chinese Journal of Lasers(中国激光), 2019, 46(6): 614039. [本文引用:1]
[12] Zhan Honglei, Xi Jianfeng, Zhao Kun, et al. Food Control, 2016, 67: 114. [本文引用:1]