基于拉曼光谱技术的蜂王浆品质定量模型研究
陈繁1, 刘翠玲1,*, 陈兰珍2,3,4,*, 孙晓荣1, 李熠2,3,4, 金玥2,3,4
1. 北京工商大学计算机与信息工程学院, 食品安全大数据技术北京市重点实验室, 北京 100048
2. 中国农业科学院蜜蜂研究所, 北京 100093
3. 农业农村部蜂产品质量安全控制重点实验室, 北京 100093
4. 农业农村部蜂产品质量安全风险评估实验室(北京), 北京 100093;
*通讯联系人 E-mail: liucl@btbu.edu.cn; chenlanzhen2005@126.com

作者简介: 陈 繁, 1996年生, 北京工商大学计算机与信息工程学院硕士研究生 E-mail: chen_cfbtbu@163.com

摘要

蜂王浆是一种具有抗氧化、 抗衰老、 调节心血管系统和免疫功能的纯天然营养保健食品, 近年来在食品、 生物医学等领域广泛应用。 由于蜂王浆的采集过程费时费力且没有快捷简便的方法检测其品质, 使得市场上的蜂王浆产品质量参差不齐, 因此实现蜂王浆品质的快速鉴别就显得至关重要。 该研究以蜂王浆的水分和蛋白质为研究对象, 利用拉曼光谱技术结合主成分回归算法(PCR)和偏最小二乘法对蜂王浆进行了快速定量检测,建立了水分、 蛋白质的定量模型,探究对其定量分析的可行性,并进行光谱预处理以提升模型的预测能力, 使其预测准确性更高。 蜂王浆中水分和蛋白质化学值的测定分别采纳蜂王浆国家标准规定的减压干燥法和凯氏定氮法。 蜂王浆光谱的采集则是由DXR激光共焦显微拉曼光谱仪测得。 应用TQ Analyst分析软件对蜂王浆光谱进行预处理及建立定量分析模型。 其中光谱预处理包括导数、 标准正态变换、 多元散射校正、 Savitsky-Golay卷积这四种光谱预处理法, 并按一定关系排列组合成多种不同的预处理方法, 对蜂王浆样品光谱进行数据处理, 寻找出最优的模型与处理方法。 结果表明, 利用主成分回归法建立蜂王浆水分和蛋白质的定量模型效果不理想, 水分的定量模型结果表明, Savitsky-Golay平滑(7)处理校正集决定系数最高但也仅为0.741 3, 预测集决定系数为0.661 6, RMSEC为0.656, RMSEP为1.34, 建模效果差。 蛋白质的PCR定量模型结果表明, Savitsky-Golay平滑(7)处理相较之下最优,校正集决定系数0.675 0,预测集决定系数为0.566 8,RMSEC为0.548, RMSEP为0.957, 建模效果较差。 因此, 基于PCR所建模型对蜂王浆水分、 蛋白质的含量有一定的预测可能性, 但建模效果较差, 预测准确度低, 稳健性差。 而结合偏最小二乘法并进行S-G(7)+二阶导数+SNV处理对蜂王浆水分建模效果最好, 水分含量校正集和预测集的决定系数分别为0.992 7和0.948 8, RMSEC和RMSEP分别为0.162和0.442。 蛋白质的PLS定量模型, 通过对多种预处理组合处理结果进行对比, S-G(7)+一阶导数+SNV处理对蜂王浆蛋白质建模效果最佳, 蛋白质含量校正集和预测集的决定系数分别为0.991 6和0.879 5, RMSEC和RMSEP分别为0.143和0.497, 建模效果好。 因此, 利用拉曼光谱结合偏最小二乘法快速检测蜂王浆中水分和蛋白质的含量是可行的, 且所建定量模型稳健性良好, 预测准确度高。 通过上述实验可总结得出, 在一些不可避免的外界因素影响下, 将多种预处理方法组合起来可以提高模型的准确性和稳健性, 比用单一的光谱预处理方法修正光谱更加有效, 优化效果更加明显, 且有效提升了模型的各参数, 更好的提高了模型预测的准确性。 同时表明了, 拉曼光谱技术应用于蜂王浆品质的快速检测是可行的, 且检测准确度高, 速度快, 在蜂王浆品质的快速检测方面展现了很好地应用前景。

关键词: 蜂王浆; 拉曼光谱; 偏最小二乘法; 主成分回归法; 定量分析
中图分类号:O657.3 文献标志码:A
Research on Quantitative Model of Royal Jelly Quality by Raman Spectroscopy
CHEN Fan1, LIU Cui-ling1,*, CHEN Lan-zhen2,3,4,*, SUN Xiao-rong1, LI Yi2,3,4, JIN Yue2,3,4
1. Beijing Key Laboratory of Big Data Technology for Food Safety, School of Computer and Information Engineering, Beijing Technology and Business University, Beijing 100048, China
2. Institute of Apicultural Research, Chinese Academy of Agricultural Sciences, Beijing 100093, China
3. Key Laboratory of Bee Products for Quality and Safety Control, Ministry of Agriculture and Rural Affairs, Beijing 100093, China
4. Laboratory of Risk Assessment for Quality and Safety of Bee Products, Ministry of Agriculture and Rural Affairs, Beijing 100093, China
Abstract

Royal jelly is a natural nutrient health food that has antioxidant, anti-aging, regulate cardiovascular system and immune function. In recent years, royal jelly has been widely applied in food, biomedicine and other fields. Because the collection process of royal jelly is time-consuming and the quality of the royal jelly is difficult to detect and the quality of royal jelly is uneven in the market. It is very important to realize the rapid identification of the quality of royal jelly. Therefore, the content of two components of moisture and protein on the quality of royal jelly is explored in this paper, and the quantitative analysis model of principal component regression (PCR) and partial least squares (PLS) method is established for the moisture and proteir of royal jelly by Raman spectroscopy,and the feasibility of the quantitative analysis of royal jelly is explored. In the experiment,the determination of the moisture and protein chemical vollues in royal jelly adopts the vacuum drying method and kjeldahl method as specified in the national standard of royal jelly. The royal jelly spectrum is collected by the DXR laser confocal microscopy Raman spectrometer. The TQ Analyst analysis software is used to pretreat the full spectrum of royal jelly and establish a quantitative analysis model. Among them,four spectral preprocessing methods includes first derivative, second derivative, Standant Normal Variate Transformation, Multipicative Scatter Correction and Savitsky-Golay, convolution these four spectral preprocessing methods are combined into a variety of different pretreatment methods. A lot of experiments have been carried out on royal jelly samples to find out the best models and treatment methods. The results show that the effect of the quantitative model by using the principal regression method to establish moisture and protein of royal jelly is not ideal. The results of the quantitative model of moisture show that the best spectral processing method of PCR is Savitsky-Golay smoothing (7), but it is only 0.741 3. The coefficient of prediction set is 0.661 6, RMSEC is 0.656, RMSEP is 1.34, and the modeling effect is not ideal. The quantitative model of protein show that the best spectral processing method of PCR is Savitsky-Golay smoothing (7),the coefficient of correction set is 0.675 0,the coefficient of prediction set is 0.566 8,RMSEC is 0.548, RMSEP is 0.957, and the modeling effect is bad. Therefore, the model based on PCR have a certain prediction possibility for the content of moisture and protein in royal jelly, but the modeling effect is poor, the prediction accuracy is low, and the robustness is poor. The PLS method is used to establish quantitative model of moisture and protein, and S-G(7)+second derivative +SNV is the best spectral processing method for moisture of royal jelly, the coefficient of correction set and prediction set are 0.992 7 and 0.948 8, RMSEC and RMSEP are 0.162 and 0.442 respectively. And S-G (7)+first derivative +SNV is the best spectral processing method for protein of royal jelly, and the coefficients of correction set and prediction set are 0.991 6 and 0.879 5, respectively, RMSEC and RMSEP are 0.143 and 0.497, respectively. The modeling effect is ideal. The results show that it is feasible to detect moisture and protein content in royal jelly by Raman spectroscopy combined with partial least squares, and the established quantitative model has good robustness and high prediction accuracy. Through the above experiments, we can conclude that under the influence of unavoidable external factors, the combination of various pretreatment methods can improve the accuracy and robustness of the model. It is more effective than single spectral pretreatment method to correct spectra, and the optimization effect is more obvious. It effectively improves the parameters of the model, and improves the accuracy of model prediction. It is also shown that Raman spectroscopy is feasible for rapid detection of royal jelly quality, and it has high accuracy and speed and has great prospects in the rapid detection of royal jelly quality.

Keyword: Royal jelly; Raman spectroscopy; Partial least square method; Principal component regression; Quantitative analysis
引 言

众所周知, 蜂王浆是一种具有抗氧化、 抗衰老和调节心血管系统等功能的纯天然营养保健食品[1], 但采集蜂王浆的过程却十分复杂费力, 需要经过割蜡、 夹出王浆虫、 挖浆再移虫等步骤且这些流程都需要人工操作, 产量十分有限。 而近年来, 蜂王浆已被科研、 食品、 生物医学等领域广泛应用。 据统计, 我国的蜂王浆大约3 000多吨的年产量且占世界蜂王浆总产量的90%以上。 日趋成熟的产浆技术促进了我国蜂王浆产业的不断发展和养蜂业的不断壮大[2]。 由于没有一个快速检测蜂王浆品质的方法, 造成了其品质的参差不齐, 因此实现蜂王浆品质的快速鉴别就显得尤为重要。

贮藏温度和时间是影响蜂王浆品质的主要因素, 温度过高或贮藏时间过长都会导致其物理性状和化学成分发生变化。 当长时间在室温下贮藏时, 蜂王浆将失去活性[3]。 蛋白质含量的高低是评价蜂王浆品质的重要指标之一, 贮藏过程中温度的升高会导致蜂王浆蛋白质发生不同程度的降解, 从而引起褐变导致其生理活性功能降低[4]。 吴黎明等利用傅里叶变换红外光谱对蜂王浆的新鲜度、 品质和功效进行了检测, 并且探究了利用FTIR(Fourier transform infrared spectroscopy)光谱法分析王浆红外谱图的相关性, 研究结果表明王浆组分发生的变化, 蛋白质可能占据了主导地位, 由此可以快速分析出蜂王浆的品质[5]。 故蜂王浆的品质在某种程度上能由水分、 蛋白质等指标体现出来并对其质量进行规范监控。

近年来, 拉曼光谱在食品工业领域的应用越来越广泛, Abbas等利用拉曼光谱并结合主成分分析法(principal component analysis, PCA)和偏最小二乘判别分析法(partial least squares discrimination analysis, PLS-DA)来鉴别不同种类的动物油脂, 鉴别效果理想[6]。 Bruno等建立了大豆油中共轭亚油酸的定量分析模型, 相关系数R2达到了0.97, 实验结果理想[7]。 Stefanov等利用拉曼光谱结合偏最小二乘法(partial least squares method, PLS)测定牛奶中支链脂肪酸, 相关系数大于0.65[8]。 说明利用拉曼光谱建立食品的定量模型来检测其组分含量是可行的。 我国对各类食品中所含蛋白质、 脂质、 水分、 碳水化合物和其他微量元素有一定的定量检测研究, 但在蜂王浆品质检测方面的研究还很欠缺。

为解决国标法检测蜂王浆中水分、 蛋白质等组分含量费时费力等问题, 本文就水分、 蛋白质两种组分含量对蜂王浆的品质进行探究, 基于拉曼光谱分析技术建立其快速检测定量人分析模型[9, 10, 11, 12], 旨在寻找鉴别蜂王浆品质的最优定量模型。 本实验证明了采用拉曼光谱技术结合主成分回归法(principle component regression, PCR)和PLS建立蜂王浆水分和蛋白质的定量模型, 用于蜂王浆样品水分、 蛋白质含量的快速无损检测是可行的。

1 实验部分
1.1 样品

40份来自四川、 青海、 湖北的油菜浆样品。

1.2 仪器

DXR激光共焦显微拉曼光谱仪, 美国Thermo Fisher公司; 自动定氮仪, 瑞士BUCHI公司; 数显真空干燥箱, 上海浦东荣丰公司。

1.3 化学值测定

水分含量参照GB 9697— 2008《蜂王浆》国家标准规定的检验方法进行测定, 采用7 5℃减压干燥法。

蛋白质含量的测定同样按照GB 9697— 2008国家标准采用凯氏定氮法, 将40份样品逐一取样, 然后放入消化炉进行消化, 将消化后的样品利用全自动定氮仪定氮即得样品蛋白质的含量。

1.4 光谱采集

取蜂王浆样品约0.05 g, 均匀涂抹在玻璃载物片上, 用DXR激光共焦显微拉曼光谱仪采集样品光谱信号。 共焦显微拉曼光谱仪检测时激光波长780 nm; 激光功率20 mW; 检测精度1 cm-1; 谱图宽度65~3 350 cm-1; 扫描次数16次; 采集曝光时间3 s, 样品温度为室温。 在建立蜂王浆组分定量模型时, 其水分含量可通过测量O— H基团的谱带强度来测得, 谱带3 200~3 400 cm-1为O— H基团的拉曼特征谱带。 蜂王浆蛋白质含量则通过测量酰胺Ⅰ 谱带中C=O基团和酰胺Ⅲ 谱带中N— H基团的拉曼光谱强度获得, 酰胺Ⅰ 和酰胺Ⅲ 谱带为拉曼光谱中的强谱带, 其谱带范围分别为1 640~1 670和1 240~1 300 cm-1[13]。 图1所示为经过基线校正后的蜂王浆样品的拉曼光谱图。

图1 40个蜂王浆样本的拉曼光谱图Fig.1 Raman spectra of 40 royal jelly samples

1.5 光谱预处理及模型评价

应用TQ Analyst分析软件进行光谱预处理及定量模型的建立。 其中光谱预处理方法包括导数、 标准正态变换(standant normal variate transformation, SNV)、 多元散射校正(multipicative scatter correction, MSC)、 卷积平滑(savitsky-golay, SG)四种常用的光谱预处理法, 按一定关系排列组合成多种不同的预处理方法, 提升校正模型的预测能力, 寻找出最优模型。 模型性能采用决定系数R2, 校正均方根误差(root mean square error of calibration, RMSEC), 预测均方根误差(root mean square error of prediction, RMSEP)进行评价。 决定系数可以体现模型真实值与预测值之间的相关程度, 越接近1准确性越高。 RMSEC和RMSEP可以表明模型的预测能力, 两值越小, 预测结果越准确。

2 结果与讨论
2.1 定量分析模型的建立

主成分回归法是一种在主成分分析法基础上发展起来的多元校正分析方法, 由主成分分析法将矩阵分解降维, 再对降维的矩阵进行线性回归分析来对样品进行预测[14, 15]。 利用PCA可以解决共线的问题, 还可消弱误差所产生的影响。 TQ analyst软件中Standards窗口包含有验证(Validation)样品, 进行校正时软件会自动计算出RMSEP。 本实验用于建立校正模型的样品集包含样品30份; 用于检验模型预测能力的验证集包含样品10份。 基于PCR的蜂王浆水分、 蛋白质含量在导数、 SNV、 MSC、 SG卷积平滑四种不同组合的预处理法下的校正集决定系数R2及均方根误差RMSEC、 预测集相关系数r2及均方根误差RMSEP如表1所示。

表1 不同组合预处理方法的定量模型结果对比(水分) Table 1 Comparison of quantitative model results for different combination pretreatment methods (Moisture)

表1的水分PCR定量分析模型的结果可以看出, 各预处理组合的数据均不理想, 相较之下PCR最优光谱处理方法是Savitsky-Golay平滑(7)处理, 校正集决定系数最高但也仅为0.741 3, 预测集决定系数为0.661 6, RMSEC为0.656, RMSEP为1.34, 建模效果较差。 采用主成分回归的方法进行Savitsky-Golay平滑(7)处理, 得到的校正集和预测集的蜂王浆样品水分的真实值与预测值间的关系如图2所示。

图2 水分PCR定量模型的建模效果图Fig.2 Effect diagram of moisture quantitative model based on PCR

建立蛋白质的PCR定量模型, 将多种预处理组合处理结果进行对比, Savitsky-Golay平滑(7)处理相较之下最优, 校正集决定系数0.675 0, 预测集决定系数为0.566 8, RMSEC为0.548, RMSEP为0.957, 建模效果差。 图3为蛋白质PCR定量模型的建模效果图。

图3 蛋白质PCR定量模型的建模效果图Fig.3 Effect diagram of protein quantitative model based on PCR

PLS是光谱多元定量校正的一种经典建模方法, 同时分解光谱矩阵和浓度矩阵, 考虑两者的相互关系再建立线性回归方程, 从而保证构建精度较高的模型[16, 17]。 模型性能采用校正集决定系数R2及校正均方根误差RMSEC和预测集决定系数r2及预测集均方根误差RMSEP, 结果如表2所示。 本实验用于建立校正模型的样品集包含样品30份; 用于检验模型预测能力的验证集包含样品10份。

表2 不同组合预处理方法的定量模型结果对比(水分) Table 2 Comparison of quantitative model results for different combination pretreatment methods (Moisture)

通过对表2中数据进行对比分析, 可以得出, 蜂王浆样品中水分含量的基于PLS的最优光谱预处理方法是S-G(7)+二阶导数+SNV处理。 校正集决定系数0.992 7, 预测集决定系数为0.948 8, RMSEC为0.162, RMSEP为0.442, 建模效果好, 预测效果良好。

采用偏最小二乘法进行S-G(7)+二阶导数+SNV处理, 得到的各验证集水分含量的真实值与预测值之间的关系如图4所示。

图4 水分PLS定量模型的建模效果图Fig.4 Effect diagram of moisture quantitative model based on PLS

建立蛋白质的PLS定量模型, 通过对多种预处理组合处理结果进行对比, S-G(7)+一阶导数+SNV处理可得到最优光谱, 校正集决定系数0.991 6, 预测集决定系数为0.879 5, RMSEC为0.143, RMSEP为0.497, 建模效果好。 图5为蛋白质PLS定量模型的建模效果图。

图5 蛋白质PLS定量模型的建模效果图Fig.5 Effect diagram of protein quantitative model based on PLS

2.2 PCR, PLS定量模型对比分析

将图2和图4、 图3和图5分别进行对比分析可以明显看出, 基于PCR建立的水分、 蛋白质定量模型效果较基于PLS建立的定量模型效果差, 且基于PCR建立的水分、 蛋白质的各验证集真实值与预测值之间线性相关性差, 预测结果不好。 而相较之下, 采用PLS得到的水分、 蛋白质各验证集真实值和预测值线性相关性高, 预测准确度好。 由此可见, 采用PLS法建立蜂王浆水分、 蛋白质的定量模型是可行的, 水分定量模型进行S-G(7)+二阶导数+SNV处理, 蛋白质建模进行S-G(7)+一阶导数+SNV处理, 得到的模型准确度高, 稳健性好。

3 结 论

描述了基于拉曼光谱的蜂王浆水分、 蛋白质定量模型的建立, 且通过光谱的预处理研究了最适合拉曼光谱PLS和PCR定量模型的优化方式, 旨在提高模型的准确性和稳健性, 保证模型在某些不可避免的外界因素影响下具有一定的抗干扰能力。 采用PCR建立蜂王浆水分、 蛋白质的定量模型, 其建模效果差, 预测准确度低, 不适合用于蜂王浆的组分检测。 采用PLS法对蜂王浆水分、 蛋白质进行建模是可行的, 水分含量校正集和预测集的决定系数分别为0.992 7和0.948 8, RMSEC和RMSEP分别为0.162和0.442。 蛋白质含量校正集和预测集的决定系数分别为0.991 6和0.879 5, RMSEC和RMSEP分别为0.143和0.497。

结果表明, 将多种预处理方法组合起来比单一方法修正光谱更加有效, 优化效果更加明显, 有效提升了模型性能, 提高了模型预测的准确性。 也表明了, 拉曼光谱应用于蜂王浆品质的快速检测是可行的, 且检测准确度高速度快, 在蜂王浆品质的快速检测方面展现了很好地应用前景。

The authors have declared that no competing interests exist.

参考文献
[1] CHEN Ya-Ling, ZHANG Jing(陈亚玲, 张晶). Food Research and Development(食品研究与开发), 2015, (2): 148. [本文引用:1]
[2] HE Teng-fei, LIN De-xiang, WANG Fen-qin, et al(何腾飞, 林德祥, 王粉琴, ). Apiculture of China(中国蜂业), 2009, (5): 36. [本文引用:1]
[3] WANG Lu-lu, DONG Rui, FAN Chao, et al(王露露, , 董蕊, 范超, ). Food Science(食品科学), 2016, (2): 271. [本文引用:1]
[4] ZHANG Hong-cheng, SUN Li-ping, DONG Jie, et al(张红城, 孙丽萍, 董捷, ). Food Science(食品科学), 2007, (11): 159. [本文引用:1]
[5] WU Li-ming, ZHOU Qun, ZHAO Jing, et al(吴黎明, 周群, 赵静, ). Spectroscopy and Spectral Analysis(光谱学与光谱分析), 2009, 29(12): 3236. [本文引用:1]
[6] Abbas O, Pierna J A F, Codony R, et al. Journal of Molecular Structure, 2009, s924-926(1): 294. [本文引用:1]
[7] Bruno B, Marc M, Eric M, et al. Journal of Agricultural & Food Chemistry, 2009, 57(15): 6524. [本文引用:1]
[8] Stefanov I, Baeten V, Abbas O. Journal of Agricultural & Food Chemistry, 2010, 58(20): 10804. [本文引用:1]
[9] Gouvinhas I, Machado N, Carvalho T, et al. Talanta, 2015, 132(15): 829. [本文引用:1]
[10] Nunes C A. Food Research International, 2014, 60: 255. [本文引用:1]
[11] Zhang X, Qi X, Zou M, et al. Analytical Letters, 2011, 44(12): 2209. [本文引用:1]
[12] LI Shui-fang, ZHANG Xin, LI Jiao-juan, et al(李水芳, 张欣, 李娇娟, ). Transactions of the Chinese Society of Agricultural Engineering(农业工程学报), 2014, 30(6): 249. [本文引用:1]
[13] CHEN Jian, XIAO Kai-jun, LIN Fu-lan(陈健, 肖凯军, 林福兰). Food Science(食品科学), 2007, 28(12): 554. [本文引用:1]
[14] XU Lu, SHAO Xue-guang(许禄, 邵学广). Methods of Chemometrics(化学计量学方法). Beijing: Science Press(北京: 科学出版社), 2004. 165. [本文引用:1]
[15] CHU Xiao-li(褚小立). Molecular Spectroscopy Analytical Technology Combined with Chemometrics and its Applications(化学计量学方法与分子光谱分析技术). Beijing: Chemical Industry Press(北京: 化学工业出版社), 2011. 311. [本文引用:1]
[16] DONG Hai-sheng, ZANG Peng, LI Yun-peng, et al(董海胜, 藏鹏, 李云鹏, ). Journal of Optoelectronics·Laser(光电子·激光), 2013, 24(7): 1370. [本文引用:1]
[17] LIU Yan-de, JIN Tan-tan, WANG Hai-yang(刘燕德, 靳昙昙, 王海阳). Optics and Precision Engineering(光学精密工程), 2015, 23(9): 2490. [本文引用:1]