基于拉曼光谱技术的不同贮藏条件下明虾品质变化预测模型的研究
眭亚南1,2, 张雷蕾1,2, 卢诗扬1,2, 杨德红1,2, 朱诚1,2,*
1. 中国计量大学生命科学学院, 浙江 杭州 310018
2. 浙江省海洋食品品质及危害物控制技术重点实验室, 浙江 杭州 310018
*通讯联系人 e-mail: pzhch@cjlu.edu.cn

作者简介: 眭亚南, 1994年生, 中国计量大学生命科学学院硕士研究生 e-mail: 1291649912@qq.com

摘要

针对明虾品质劣变过程中的鲜度特征, 该研究以颜色(L*, a*, b*)、 挥发性盐基氮(TVB-N)、 pH等品质指标为研究对象, 利用拉曼无损检测技术采集4 ℃和-20 ℃下生鲜明虾光谱信息, 运用岭回归、 偏最小二乘法和前向逐步回归对明虾进行了快速定量检测, 建立了品质指标定量模型。 其中光谱数据预处理包括SG平滑、 背景扣除、 二阶微分、 标准正态变量变换, 按一定方式组合4种预处理和PCA降维技术进行数据处理, 筛选出最优模型。 结果表明: 利用岭回归建立颜色(a*, b*)定量模型时, 在组合预处理方式下建模集中 R分别为0.983和0.973, RMSE分别为0.114和0.179, 预测集中 R分别为0.513和0.564; RMSE分别为0.615和0.918, 建模集精度远超预测集表明出现过拟合, 经PCA降维后过拟合降低、 但预测集预测效果不理想; 偏最小二乘法在各指标建模集上精度和岭回归差不多, 在预测集上预测精度偏低, PCA降维后部分指标建模集相关系数下降、 均方根误差上升, 预测精度降低。 最终结果显示: 经过4种预处理后的前向逐步回归模型最优, 建模集中L*, a*, b*, pH和TVB-N指标 R分别为0.904, 0.885, 0.864, 0.934和0.940, RMSE分别为1.141, 0.280, 0.535, 0.131和2.345; 预测集中 R分别为0.863, 0.850, 0.859, 0.900和0.916, RMSE分别为1.394, 0.406, 0.605, 0.194和2.734, 建模效果好。 因此, 利用拉曼光谱技术结合前向逐步回归模型快速检测明虾中L*, a*, b*, pH和挥发性盐基氮含量可行, 对拉曼技术应用明虾品质检测具有一定指导意义。

关键词: 拉曼光谱技术; 明虾; 贮藏条件; 品质指标; 预测模型
中图分类号:O657.3 文献标志码:A
Research on the Shrimp Quality of Different Storage Conditions Based on Raman Spectroscopy and Prediction Model
SUI Ya-nan1,2, ZHANG Lei-lei1,2, LU Shi-yang1,2, YANG De-hong1,2, ZHU Cheng1,2,*
1. College of Life Sciences, China Jiliang University, Hangzhou 310018, China
2. Key Laboratory of Marine Food Quality and Hazard Controlling Technology of Zhejiang Province, Hangzhou 310018, China
*Corresponding author
Abstract

About the prawn’s freshness characteristics of quality deterioration, the research takes color (L*, a*, b*), volatile base nitrogen(TVB-N), ph, and other quality indexes as the object of the study, and uses Raman nondestructive testing technology to select the spectral information of fresh prawn on the temperature of 4 ℃ and under -20 ℃, also makes the quick quantitative test by combining with ridge regression, partial least squares method and forward stepwise regression, establishes the quantitative mode of the quality index. And the spectral data preprocessing includes SG smoothing, background deduction, second order differential and standard normal variable transform, combines 4 types of preprocessing in a certain way and deals with the data by PCA dimension reduction technology, in order to select the best mode. The result shows that, when using ridge regression to establish the quantitative mode of color (a*, b*), under the combined pretreatment mode, the modeling centralization R are 0.983 and 0.973 respectively, RMSE are 0.114 and 0.179 respectively; the forecast concentration R are 0.513 and 0.564 respectively, RMSE are 0.615 and 0.918 respectively, the accuracy of the modeling set is much higher than that of the prediction set, which indicates that there exists over-fitting, and the over-fitting decreases after dimension reduction by PCA, but the prediction effect of prediction sets is not satisfactory; partial least squares method and the ridge regression are about the same on the accuracy of indicator modeling sets, the accuracy of partial least squares method is lower on the prediction sets. After PCA dimension reduction, the related coefficient of partial index modeling sets decrease, the root mean square error increases, and the prediction accuracy decreases. The final result shows that, after 4 types of preprocessing, the mode of forward stepwise regression is the best, the modeling centralization L*, a*, b*, pH, TVB-N index R are 0.904, 0.885, 0.864, 0.934, 0.940 respectively, RMSE are 1.141, 0.280, 0.535, 0.131, 2.345 respectively; the forecast concentration R are 0.863, 0.850, 0.859, 0.900, 0.916 respectively, RMSE are 1.394, 0.406, 0.605, 0.194, 2.734 respectively, the modeling effect is good. Therefore, it is practicable to use the Raman spectroscopy technology, combining with forwarding stepwise regression to quick test the prawn’s L*, a*, b*, pH and volatile base nitrogen content, which provide meaningful guidance for the application of Raman technology in prawn quality detection.

Keyword: Raman spectroscopy technology; Prawn; Storage condition; Quality index; Prediction model
引 言

中国是虾需求量大国, 大量虾产品顺利进入市场依赖于冷冻保藏技术的发展。 明虾营养丰富、 肉质鲜美, 含人体所需氨基酸。 由于其高水分、 脂肪和蛋白质, 虾被归类为高度易腐烂的食品。 虾的质量取决于储藏条件[11], 冷藏是明虾贮藏和加工主要途径, 而在冷冻冷藏过程中出现多种恶化机制, 如脂肪氧化、 风味物质消失、 酶或微生物腐败[12]。 随着贮藏时间的增加, 颜色发生改变、 产生挥发性物质, 营养品质下降, 甚至危害食用者身体健康。 目前, 水产品检测方式有电子鼻法、 化学方法、 微生物方法、 感官评定方法, 但这些方法存在检测时间长, 样品受损等缺点。 为确保水产品食用性、 安全性, 实现虾品质的快速检测方式具有深远意义。

除了现有的方法, 新技术如拉曼光谱, 由于其无损、 快速、 现场可用性和精度高等优点, 近年来应用广泛[3, 7, 8]。 拉曼检测方法方便、 快捷, 只需将检测探头对准样品, 根据吸收的拉曼散射光能量便可绘制出样品光谱图, 只需少量样品拉曼光谱提供详细结构信息, 根据拉曼强度和拉曼位移可对物质进行定性和定量分析[6, 7]。 陈繁等运用拉曼光谱结合主成分回归(PCR)和偏最小二乘对预测蜂王浆蛋白质和水分含量, 预测集决定系数分别为0.948和0.879[4, 8]。 翟晨等运用拉曼光谱结合偏最小二乘测定苹果中溴氰菊酯和啶虫脒含, 相关系数分别为0.94和0.85[9]。 窦颖等利用拉曼光谱结合偏最小二乘实现面粉品质的快速检测, 建立的水分、 灰分、 湿面筋等模型相关系数分别为0.945, 0.993和0.981[9, 13], 说明运用拉曼光谱通过建立模型可获取定量信息[1, 4, 5]。 目前拉曼技术有应用于肉类制品的分类、 分级, 但将其应用在虾品质的快速鉴定方面缺少相关指导方法和实验验证, 有待于进一步的研究和探索。

研究中使用拉曼光谱分析虾, 针对虾品质问题, 基于自行设计的拉曼光谱检测系统实现对虾在4 ℃和-20 ℃不同贮藏条件下品质变化快速评定。 本文就色差(L* , a* , b* )、 pH、 挥发性盐基氮(total valatile basic nitrogen, TVB-N)品质指标进行研究, 将光谱学和前向逐步回归、 岭回归和偏最小二乘(partial least squares, PLS)3种模型相结合, 预测不同指标的含量信息。 结合SG平滑+背景扣除+二阶微分+标准正态变量变换4种预处理方法和结合PCA降维技术提高模型鲁棒性、 筛选最佳模型, 从而完成对虾新鲜度快速实时评定。

1 实验部分
1.1 设备

基于QE-Pro光谱仪(Ocean Opticis公司)、 Laser-785 nm激光器、 传输光纤、 拉曼检测探头、 置物台自行搭建实验室激光拉曼检测系统, 785 nm激光束通过传输光纤经拉曼检测探头聚焦明虾表面并激发拉曼散射光, 检测探头捕获拉曼信号汇集到光纤送入光谱仪, 经分光聚焦于CCD阵列, 实现对探测样品拉曼散射光的高效收集。

1.2 方法

1.2.1 样本制备

采集明虾品种为中国对虾, 由杭州萧山养殖场养殖, 饲料采用天马EP高端虾料, 不会导致水中的亚硝酸和氨氮指数偏高, 有利于虾苗的生长及水质健康。 明虾购于杭州高沙农贸市场和下沙物美超市, 人工运输到实验室自然致死, 分批装入食品级密封袋并贴上标签。 样品总数65份, 分别在4 ℃和-20 ℃下贮藏, 其中51份在4 ℃下贮藏6 d, 每天取样品测定各指标值, 14份在-20 ℃下贮藏30 d, 取样测量天数分别为2, 4, 6, 9, 11, 12, 13, 14, 16, 17和30, 每份取9个样测定各指标值。

1.2.2 理化值测定

色差测定采用CS-10色差计, 取虾腹不同测定点测量5次取平均。

pH测定: 称取绞碎虾肉2 g, 加20 mL氯化钾(KCl)溶液, 搅拌30 s后离心, 用pH计测定上层清液, 设定3个平行, 结果取平均值。

TVB-N测定参照GB 5009.228— 2016中自动凯氏定氮仪法, 试样搅拌静置30 min后均质, 取上层液离心, 将离心液和氧化镁全部放入消化管消化, 测定3次结果取平均。

1.2.3 光谱采集

基于实验室自行搭建光谱检测系统, 解冻试样置于检测台, 设定光谱仪参数为: 采集时间4 500 ms, 积分次数2次, 激光功率320 mW, 采样间距3~5 mm。 光谱采集环境为暗光, 可避免荧光干扰。 试样光谱采集取不同测定点3次后平均。

1.3 数据处理和模型构建

选取光谱范围500~2 000 cm-1, 采用光谱分析软件Uspectral-Pro数据预处理及定量模型建立。 为优化光谱信号和提高模型预测能力, 将SG平滑(savitzky-golay, SG)、 背景扣除(background deduction, BD)、 二阶微分(second order differential, SOD)、 标准正态变量变换(standard normal variable transformation, SNV)等常规方法组合。 由于光谱特征参数较多(包含1500个光谱特征变量), 因而在对原始光谱数据组合预处理后采用PCA技术降维, PCA可以解决共线问题, 削弱误差产生的影响[8]。 定量模型建模集和预测集划分为45份和20份, 模型评价指标为相关系数(R)和均方根误差(RMSE), R越大, RMSE值越小, 预测准确率越高。

2 结果与讨论
2.1 不同贮藏条件下对虾鲜度指标化学变化分析

明虾贮藏中的品质指标包含颜色(L* , a* , b* )、 pH和TVB-N等, TVB-N是反映水产品鲜度的重要指标, TVB-N≤ 25 mg/100 g为一级鲜度, TVB-N≤ 30 mg/100 g为二级鲜度。 随着储藏时间的增加, 所有明虾样品的TVB-N值呈上升趋势, 由表1表2理化数据分析得出, 明虾在4 ℃下TVB-N最大值为32.889, 已超过二级鲜度标准, -20 ℃下TVB-N最大值为20.218为一级鲜度标准, 结果发现-20 ℃明虾的TVB-N值均低于4 ℃, 说明冷藏易于保鲜。 4 ℃下pH从6.780上升到8.560, 而-20 ℃下pH值从6.920上升到7.480, 原因是虾体内蛋白质会分解产生碱性物质[2], 随储藏时间增加, -20 ℃明虾pH变化不明显, 说明冷藏易于保鲜。 明虾的色泽变化也是反应鲜度的指标之一, 明虾颜色 (L* , a* , b* )测定如表所示, L* 代表虾体亮度, a* 代表虾体红绿值, b* 代表虾体蓝黄值, 表中a* 多为负值表示明虾在a* 分量上的颜色变化在偏绿范围内, 随储藏时间增加, L* 由31.929上升到43.764, 此时4 ℃下虾体表面逐渐变黑, 明虾腐败严重; 而-20 ℃下L* 最小值为33.933、 最大值为37.922, 虾体腐败程度低, 以上品质指标含量的变化反映了明虾品质随储藏时间的变化。

表1 明虾在4 ℃贮藏过程中鲜度指标的 化学分析统计结果 Table 1 Statistical analysis of chemical analysis of freshness index of prawns during storage at 4 ℃
表2 明虾在-20 ℃贮藏过程中鲜度指标的化学分析统计结果 Table 2 Statistical analysis of chemical analysis of freshness index of prawns during storage at -20 ℃
2.2 明虾拉曼原始光谱分析

图1(a)为明虾原始光谱, 图1(b)为不同预处理方式的光谱曲线, Origin表示原始光谱, SG+SOD表示平滑和二阶微分, BD+SOD表示背景扣除和二阶微分, SG+SOD+BD+SNV表示平滑、 二阶微分、 背景扣除和标准化。 如图1(c)和(d)所示, 4 ℃微冻1周和-20 ℃冻藏4周的明虾拉曼特征峰在1 006, 1 153, 1 316和1 493 cm-1谱带突出, 其中1 006 cm-1峰强度很大, 代表虾青素或者脂类的CH3水平振动模式[10], 1 153 cm-1峰代表蛋白质的C— C键拉伸[10], 1 316 cm-1峰归属酰胺Ⅲ 区, 代表核酸[10], 1 493 cm-1表示C=C键伸展, 它们反映了明虾在贮藏过程中生物分子的动态变化。 不同贮藏条件以及不同贮藏时间下, 1 006, 1 153, 1 316和1 493 cm-1拉曼特征峰强度不同, 这与虾品质变化有关, 因此这些特征峰可用以实现虾品质指标的定量分析。

图1 拉曼光谱
(a): 原始光谱; (b): 不同预处理光谱; (c): 4 ℃明虾光谱; (d): -20 ℃明虾光谱
Fig.1 Raman spectra
(a): Original spectrum; (b): Spectra of different pretreatment; (c): 4 ℃ shrimp spectrum; (d): -20 ℃ shrimp spectrum

2.3 岭回归模型建立

表3为光谱数据经过2种处理方式(SG+BD+SOD+SNV和SG+BD+SOD+SNV+PCA)不同指标(L* , a* , b* , pH和TVB-N)的岭回归模型建模结果和预测结果, 分析表中数据可知, 2种处理方式在建模集上都取得较好效果。 只采用组合预处理后的a* 和b* 指标建模集R分别为0.983和0.986, RMSE分别为0.144和0.179, 预测准确度高, 而在预测集中a* 和b* 指标R分别为0.513和0.564, 预测效果较差; 采取PCA技术降低数据维度后, a* 和b* 指标建模集R降低, 同时预测集R上升, 过拟合有明显改善。 主要原因: 原始数据维度较高, 模型过于复杂, 导致在建模集上准确度高而预测集预测效果很差的过拟合现象, 通过降低维度提高了预测准确率。 表中可知PCA降维后建模集除L* 指标外其他指标R明显下降, RMSE变大, 可能维度降低后模型过于简单, 导致不能很好拟合建模集数据, 模型精度下降。 比较可知, 经SG+BD+SOD+SVN处理后的模型过拟合现象比较严重, 在预测集上预测准确率很低, 在PCA处理后L* 指标建模集和预测集R均有上升, 表明PCA可以有效提高预测精度。

表3 不同组合预处理岭回归模型的结果对比 Table 3 Comparison of results of different combined preconditioned ridge regression models
2.4 PLS模型建立

表4为不同指标在不同处理方式下PLS模型建模和预测结果, 表中显示, SG+BD+SOD+SNV组合处理下L* , a* 和b* 三者指标建模集预测精度比较高, R分别为0.942, 0.913和0.922, 均方根误差分别为0.936, 0.242和0.417; 预测集R分别为0.630, 0.539和0.648, RMSE为1.938, 0.650和0.880, 预测精度偏低, 产生过拟合现象; pH和TVB-N建模集和预测集准确度相差不大, 预测效果良好。 经PCA降维处理后的建模集均方根误差普遍较高, 模型精度低于第一种处理方式, L* , a* 和b* 建模集相关系数分别为0.652, 0.616和0.703, 预测效果很差。 比较可知, 在最佳处理方式SG+BD+SOD+SNV下的L* , a* 和b* 等指标预测集预测准确率偏低。

表4 不同处理方式的PLS模型的结果对比 Table 4 Comparison of results of different combined pre-processed PLSR models
2.5 前向逐步回归模型建立

分析表5各品质指标前向逐步回归定量模型结果可以看出, 最优处理方式为SG+BD+SOD+SNV, 各指标建模集R最高为0.94, 预测集各指标R均高于0.85, RMSE最低, 建模效果好。 相较于岭回归、 PLS, 采用前向逐步回归结合SG+BD+SOD+SNV处理得到各指标预测值和真实值线性相关性高, 预测准确率高, 图2为前向逐步回归建模效果图。

表5 不同处理方式的SMLR模型结果对比 Table 5 Comparison of SMLR model results with different combinations of pretreatment

图2 品质指标前向逐步回归定量模型建模效果图
(a): L* 指标; (b): a* 指标; (c): b* 指标; (d): pH指标; (e): TVB-N指标
Fig.2 Effect diagram of quality indicator quantitative model based on Forward stepwise regression
(a): L* indicator; (b): a* indicator; (c): b* indicator; (d): pH indicator; (e): TVB-N indicator

3 结 论

以生鲜明虾为研究对象, 发现拉曼光谱不仅可以观测虾品质的变化, 还能实时检测虾中挥发性盐基氮、 pH、 颜色(L* , a* , b* )等品质指标含量, 通过利用拉曼光谱技术结合化学计量学方法如岭回归、 偏最小二乘回归和前向逐步回归建立虾品质指标参数颜色(L* , a* , b* )、 pH、 挥发性盐基氮(TVB-N)的定量分析模型。 光谱预处理过程包括两部分: 一是SG+BD+BOD+SNV, 二是SG+BD+BOD+SNV+PCA。 结果表明: 岭回归和偏最小二乘均有过拟合的现象发生, 过拟合指在训练数据集上模型预测得分较高, 在测试数据集上预测精度较差, 可能原因为光谱数据维度(1 500个特征变量)太大远远超过样品总量, 导致模型过于复杂, 不能准确拟合预测数据。 在光谱数据经过SG+BD+BOD+SNV去除无关信息和噪声后, 选取PCA对原数据空间降维, 结果表明: 岭回归在PCA降维后a* , b* , pH, TVB-N建模集精度降低, 各指标预测集准确率有所提升, L* 预测集相关系数提升0.2, 均方根误差降低, 说明PCA可以有效提升模型精度; 偏最小二乘在PCA处理后各指标建模集准确率较低, 预测集无明显提升, 可能原因为偏最小二乘本来就集成了主成分分析, 预测集效果不明显。 前向逐步回归模型在建模集和预测集上准确率高, 泛化能力强, 其评价指标相关系数R均高达85%以上, 均方根误差RMSE普遍很低, 在SG+BD+BOD+SNV等预处理下取得最好结果, 说明前向逐步回归模型稳健, 结合拉曼光谱技术可以实现明虾品质的快速检测。

参考文献
[1] Chu Bingquan, Lin Lei, He Yong. International Journal of Agricultural and Biological Engineering, 2017, 10(4): 252. [本文引用:1]
[2] Neto A I, Meredith H J, Jenkins C L, Wilker J J, et al. RSC Advances, 2013, 3(24): 9352. [本文引用:1]
[3] Killeen Daniel P, Marshall Susan N, Burgess Elaine, et al. Journal of Agricultural and Food Chemistry, 2017, 65(17): 3551. [本文引用:1]
[4] Husan Murat Velioğlu, Havva Tümay Temiz, Ismail Hakki Boyaci. Food Chemistry, 2015, 172: 283. [本文引用:2]
[5] Zhang Dongjie, You Hongjun, Yuan Lei, et al. Analytical Chemistry, 2019, 91(7): 4697. [本文引用:1]
[6] Hassoun Abdo, Sahar Amna, Lakhal Lyes, et al. LWT-Food Science and Technology, 2019, 103: 279. [本文引用:1]
[7] Hikima Jun-ichi, Ando Masahiro, Hamaguchi Hiro-o, Marine Biotechnology, 2017, 19: 157. [本文引用:2]
[8] Zhang Yuanyuan, Yu Wansong, Pei Lu, Food Chemistry, 2015, 169: 80. [本文引用:3]
[9] Cheng Junhu, Sun Dawen, Comprehensive Reviews in Food Science and Food Safety, 2015, 14(4): 478. [本文引用:2]
[10] WANG Xue, SUN Mei-juan, LIU Jun-xian, et al(王雪, 孙美娟, 刘军贤, ). Spectroscopy and Spectral Analysis(光谱学与光谱分析), 2012, 32(9): 2433. [本文引用:3]
[11] YUAN Li, JI Xiu, SHI Tong, et al(袁丽, 纪秀, 石彤, ). Food Science(食品科学), 2016, 37(18): 202. [本文引用:1]
[12] GAO Wen-hong, YE Rui-sen, PAN Ting-tiao, et al(高文宏, 叶瑞森, 潘廷跳, ). Food Science(食品科学), 2018, 39(24): 71. [本文引用:1]
[13] DOU Ying, SUN Xiao-rong, LIU Cui-ling(窦颖, 孙晓荣, 刘翠玲). Food Science(食品科学), 2014, 35(22): 185. [本文引用:1]