基于高光谱开发滩羊肉中高铁肌红蛋白含量的定量函数
程丽娟1, 刘贵珊1,*, 何建国1, 万国玲1, 马超2, 班晶晶1, 马丽敏1, 杨国华1, 袁瑞瑞1
1. 宁夏大学农学院食品系, 宁夏 银川 750021
2. 宁夏大学物理与电子电气工程学院, 宁夏 银川 750021
*通讯联系人 e-mail: liugs@nxu.edu.cn

作者简介: 程丽娟, 女, 1995年生, 宁夏大学农学院食品系硕士研究生 e-mail: 1349854712@qq.com

摘要

高铁肌红蛋白(metmyoglobin, MetMb)在肉中所占的比例直接影响肉的色泽。 利用可见近红外光谱(ViS-NIR)采集到的滩羊肉数据与化学计量学方法相结合, 探讨高光谱成像快速无损检测滩羊肉中MetMb含量的可行性以及开发滩羊肉中MetMb含量的定量函数。 采用分光光度计测量滩羊样本的MetMb含量, 使用ENVI4.8软件提取贮藏期间200个样本光谱图像的感兴趣区域, 将获取的光谱数据与化学值相结合, 定量解释两者的相关性; 利用光谱理化值共生距离法, 按照3∶1的比例划分样本, 对校准模型进行独立(外部)验证; 采用乘法散射校正(multiple scattering correction, MSC)、 一阶导数 (first derivative, 1st derivative)和去趋势(De-trending)等3种不同的方法对原始光谱数据进行预处理, 以消除噪音对原始光谱的干扰; 竞争性自适应加权算法(competitive adaptive reweighted sampling, CARS)、 区间变量迭代空间收缩方法(interval variable iterative space shrinkage approach, iVISSA)、 间隔随机蛙跳算法(interval random frog, IRF)、 变量组合集群分析法(variables combination population analysis, VCPA)、 连续投影算法(successie projection algorithm, SPA)以及IRF+SPA、 iVISSA+SPA组合方法被用于光谱的变量选择和优化; 使用典型的线性建模方法: 偏最小二乘回归(partial least square regression, PLSR)建立全波段和特征波段的预测模型, 确定最佳模型; 通过最佳模型建立滩羊肉中MetMb含量的定量函数。 结果表明: 原始光谱模型性能较好于3种预处理光谱的模型性能, 其RC2=0.852,RP2=0.788, RMSEC=4.604, RMSEP=5.729; 原始光谱经过CARS, VCPA, IRF, SPA, iVISSA, IRF+SPA, iVISSA+SPA等方法分别选出16, 13, 48, 14, 45, 10和11个特征波长, 占总波长的12.8%, 10.4%, 38.4%, 11.2%, 36%, 8%和8.8%。 通过对比PLSR模型, IRF+SPA-PLSR模型性能最佳,RC2=0.808,RP2=0.826, RMSEC=5.253, RMSEP=5.149, IRF+SPA算法不仅减少了计算时间, 而且生成了更准确, 更稳健的预测模型; 最后, 基于IRF+SPA算法建立的MetMb含量的定量函数为:y˙(MetMb)=3.249 7+1.900 2 λ468-4.791 2 λ482+5.913 5 λ512-1.856 2 λ530-5.879 3 λ545+2.246 3 λ560+5.066 1 λ580-2.320 1 λ588+1.214 9 λ790-1.348 8 λ814。 表明ViS-NIR光谱对滩羊肉中MetMb含量的快速无损检测是可行的, 开发的定量函数为快速测定滩羊肉中MetMb的含量提供参考。

关键词: 滩羊; 高铁肌红蛋白; 可见/近红外; 偏最小二乘回归; 特征波长选择
中图分类号:TS255 文献标志码:A
Rapid and Non-Destructive Detection of Tan Sheep Meat MetMb Contents Using Hyperspectral Imaging
CHENG Li-juan1, LIU Gui-shan1,*, HE Jian-guo1, WAN Guo-ling1, MA Chao2, BAN Jing-jing1, MA Li-min1, YANG Guo-hua1, YUAN Rui-rui1
1. School of Agriculture Department of Food, Ningxia University, Yinchuan 750021, China
2. School of Physics and Electrical and Electronic Engineering, Ningxia University, Yinchuan 750021, China
*Corresponding author
Abstract

The proportion of Metmyoglobin (MetMb) in meat directly affects the color of the meat. This paper combined the visible near-infrared spectroscopy (ViS-NIR) data of Tan sheep meat with the chemometric method to explore the feasibility of rapid non-destructive detection of MetMb content in Tan sheep by hyperspectral imaging technology and develop a quantitative function of MetMb content. The MetMb content of the sample was measured by a spectrophotometer, and the interest region of 200 sample spectral images during storage were extracted by ENVI4.8 software. The relationships between MetMb content and spectral date of samples were established to quantitatively analyze. In this study, according to the ratio of 3∶1, the whole dataset ( n=200) was divided into a calibration set ( n=50) for performing independent validation (external validation) of the developed calibration models using the sample set partitioning based on joint x-y distance method. Several spectral preprocessing techniques such as multiplicative scatter correction (MSC), first derivative (1st derivative) and De-trending were applied to eliminate noise. Competitive Adaptive Reweighted Sampling (CARS), Interval variable iterative space shrinkage approach (iVISSA), Interval Random Frog (IRF), Variables combination population analysis (VCPA) and Successie Projection Algorithm (SPA) were used to select and optimize variables. Partial least squares regression (PLSR), which was one classical linear calibration method, were used for developing prediction models based on full-band and feature bands. The results showed that the original spectral model was best, and itsRC2=0.852,RP2=0.788, RMSEC=4.604, RMSEP=5.729. The CARS, IRF, SPA, iVISSA, VCPA, IRF+SPA and iVISSA+SPA methods were applied to select 16, 13, 48, 14, 45, 13, 10 and 11 feature wavelengths from the original spectra, accounting for 38.4%, 10.4%, 11.2%, 36%, 10.4%, 8%, 8.8% and 12.8% of the full wavelength, respectively. The IRF+SPA-PLSR model was the best among the models developed, and itsRC2,RP2, RMSEC and RMSEP values were 0.808, 0.826, 5.253 and 5.149, respectively. The IRF+SPA algorithm greatly reduced calculating time and generated more accurate and more robust prediction model compared with full band. Finally, the quantitative linear relationship between spectral data and MetMb parameters was established based on the IRF+SPA algorithm, and the quantitative function was:y˙(MetMb)=3.249 7+1.9002 λ468-4.791 2 λ482+5.913 5 λ512-1.856 2 λ530-5.879 3 λ545+2.246 3 λ560+5.066 1 λ580-2.320 1 λ588+1.214 9 λ790-1.348 8 λ814. It is shows that Vis-NIR is feasible for the rapid non-destructive detection of MetMb content in Tan sheep. Simultaneously, the quantitative function developed provides a reference for the rapid determination of MetMb content in Tan sheep.

Keyword: Tan sheep; MetMb content; Hyperspectral imaging; PLSR; Wavelengths selection
引 言

滩羊为宁夏优势特色畜种, 其肉质一直是研究热点。 色泽是羊肉品质最重要的属性之一, MetMb在肉中所占比例直接影响色泽, MetMb含量的增加将导致肉色变暗。 目前, 肌红蛋白传统检测方法包括质谱法、 色谱法、 电化学法和X射线等[1, 2, 3, 4]。 这些方法需要高度专业化的设备以及存在耗时费力、 破坏性大等问题[5]。 高光谱成像具有突出的特征识别能力, 可以同时获得待测物品的光谱信息和二维空间信息, 形成三维数据立方体, 实现对物品特性的探测与识别。 近几年, 高光谱对肉类的研究主要集中在: 内部成分、 表面特性以及掺假等方面[6, 7, 8, 9, 10, 11, 12]。 但是尚未有文献报道此技术对肉中MetMb的研究。

以宁夏滩羊肉为研究对象, 探究高光谱成像快速无损检测滩羊肉中MetMb含量的可行性以及开发滩羊肉中MetMb含量的定量函数, 为快速测定滩羊肉中MetMb的含量提供参考。

1 实验部分
1.1 材料与试剂

样品来自宁夏盐池鑫海牧场, 选取滩羊背最长肌作为测试部位, 将屠宰后的滩羊在24 h内运输到实验室, 密封袋包装, 4 ℃贮藏。 每3 d测试一次(贮藏期1, 4, 7, 10, 13, 16, 19, 22, 25和28 d各测一测, 共计10次)。 图像采集之前, 用纸巾擦拭待测样本表面的水分。

1.2 仪器

VIS/NIR高光谱成像系统由CCD摄像机(配备距离样品表面385 mm的镜头)、 成像光谱仪、 线性电控位移平台、 计算机、 光源系统构成。 具体介绍参阅文献[13]。

获取图像时将样本放置在黑色背景上使样品和背景之间有良好的对比度。 暗电流的存在使相机记录了一些无用信息。 因此, 在捕获图像之前须进行校正, 校正公式如式(1)所示

R(%)=R0-DW-D×100(1)

式(1)中, R是校准后的高光谱图像, R0是滩羊原始高光谱图像, D是几乎没有反射的暗参考图像(反射率约0%), W是几乎全反射的白色参考图像(反射率约100%)。

光谱扫描的最佳参数通过预实验确定。 CCD相机曝光时间: 20 ms; 物镜高度: 385 mm; 线扫描长度: 70 mm; 电控位移平台速度: 200 μ m· s-1

1.3 分光光度计测定MetMb含量

首先, 制备磷酸盐缓冲液(0.04 mol· L-1, pH 6.8)和待测肉样(5 g), 样品加入到25 mL缓冲液中, 混合均匀; 其次, 在室内使用均化器(10 000 r· min-1)均质25 s后得到的溶液在冰箱中储存1 h, 随后离心15 min(4 ℃, 6 000 g), 过滤上清液; 最后, 在525, 545, 565和572 nm处读取滤液的吸光度, 磷酸盐缓冲液作空白。 MetMb所占的比例通过式(2)计算

[MetMb](%)=(-2.514R1+0.777R2+0.800R3+1.098)×100(2)

式(2)中: R1, R2R3分别是A572 nm/A525 nm, A565 nm/A525 nmA545 nm/A525 nm的吸光度比。

2 结果与讨论
2.1 MetMb化学值

滩羊肉样本按照3∶ 1的比例划分, 滩羊肉中MetMb相对含量(%)的参考值如表1所示, MetMb具有宽范围(12.325~56.087), 可以建立相对稳健的预测模型。

表1 高铁肌红蛋白含量的化学参考值 Table 1 Reference values of MetMb content
2.2 光谱曲线的提取

选取整个滩羊肉样本光谱图像作为感兴趣区域。 图1(a)为原始反射光谱图, 明显看出, 430, 560, 595, 780和970 nm为主要吸收带。 430 nm附近称为Soret吸收带, 因为存在呼吸性色素血红蛋白[14]; 540和595 nm处的吸收带主要是脱氧肌红蛋白或氧合肌红蛋白[15]; 980和780 nm有两个微小的吸收带, 分别对应于水产生的O— H键的第二和第三泛音[16]

图1 反射光谱
(a): 原始; (b): MSC预处理; (c): De-trending预处理; (d): 1st derivative预处理
Fig.1 Reflectance spectra
(a): Original; (b): MSC treatment; (c): De-trending treatment; (d): 1st derivative treatment

2.3 光谱曲线预处理

3种预处理光谱及原始光谱的PLSR建模结果如表2所示, 原始光谱的 RC2=0.852, RCV2=0.791, 均大于预处理光谱所建模型的数值; RMSEC=4.604, RMSECV=5.486, 均比预处理光谱的数据小。 而且, 图1可以看出, 原始光谱图曲线更加光滑。 说明原始光谱模型较稳健, 交互验证效果较优。

表2 不同预处理方法下高铁肌红蛋白含量的PLSR模型 Table 2 PLSR mothod of MetMb content based on different pretreatment
2.4 特征波长的选择

2.4.1 iVISSA算法选取特征波长

iVISSA利用变量的全局和局部搜索程序, 以准确地区分特征波长的最佳位置、 宽度和组合。 使用iVISSA算法选取特征波长时, 设置5折交互验证, 采样次数为1 000, 共选择了45个特征波长, 占到总波长的36%。

2.4.2 SPA算法选取特征波长

SPA算法选取特征波长时, 变量范围设置为10~35, 如图2所示, 共选出14个特征变量, 特征变量数占到总波长数的11.2%。

图2 SPA算法选择的特征波长
(a): RMSECV的变化情况; (b): 选择的特征波长
Fig.2 Feature wavelengths extracted by SPA
(a): RMSECV; (b): Selected characteristic wavelengths

2.4.3 IRF选取特征波长

运行IRF程序, 前10个区间选出的波点范围是17~42, 82~100, 然而组合间隔数的RMSECV值(图3)最低时, 组合间隔数为11, 因此, 排名前11间隔的波长被选作为特征波长, 这些波长依次是14~42, 82~100号, 总共48个波长, 占总波长的38.4%。

图3 组合间隔的RMSECV值Fig.3 The RMSECV value of the combined interval for MetMb

2.4.4 VCPA算法选取特征波长

VCPA可以有效地消除无信息变量, 并同时根据单个光谱预测一些属性。 使用VCPA算法选取特征波长时, 共选择了13个特征波长, 占到总波长的10.4%。

2.4.5 CARS算法选取特征波长

使用CARS算法筛选特征变量数的过程如图4所示。 图4(a)为变量数随采样次数的变化过程, 采样变量的变化分为两部分, 即第一阶段快速减少(粗选)而第二阶段非常缓慢(精选); 图4(b)为5折交互验证的RMSECV值随采样次数的变化趋势, 起初, 采样数缓慢下降, 说明无信息变量被消除, 然后, RMSECV增加, 应该归因于损失了一些关键变量。 图4(c)为回归系数的变化过程, 最佳变量子集对应于最小的RMSECV值, 其位置由垂直星号线标记。 由线(标记为L1, L2, L3, L4, L5)表示的RMSECV值上升得更高时, 变量(标记为P1, P2, P3, P4, P5)被消除为零, 因为一些关键波长被移除。 用此方法共选取了16个特征变量, 占总波长的12.8%。

图4 CARS算法选取波长变量过程Fig.4 Running process of selecting wavelength variables by CARS algorithm

2.5 建立模型

表3为8种PLSR模型。 使用SPA算法, RP2最大, 但是 RC2< 0.8; iVISSA算法相反, RC2最大, 但是 RP2< 0.8; CARS算法的 RC2较优, 但是 RP2< 0.8; IRF算法的模型性能较好, 但是提取的特征波长数较多; VCPA算法的模型效果最差; iVISSA+SPA算法的模型性能较优; 使用IRF+SPA算法所建模型的性能最优, RC2RP2分别为0.808和0.826。 MetMb含量的实测值与预测值的线性关系如图5所示, 用于预测MetMb含量的IRF+SPA-PLSR模型是有效的, 因为实测值与预测值的数据点大多位于45° 参考线上。

表3 不同波长提取方法建立的的PLSR模型的结果 Table 3 The results of PLSR models based on different wavelength extraction methods

图5 测量的MetMb含量与预测含量的关系
(a): FS-PLSR; (b): SPA-PLSR; (c): CARS-PLSR; (d): VCPA-PLSR; (e): IRF-PLSR; (f): iVISSA-PLSR; (g): IRF+SPA-PLSR; (h): iVISSA+SPA-PLSR
Fig.5 Relationship between the measured content vs. predicted content of MetMb
(a): FS-PLSR; (b): SPA-PLSR; (c): CARS-PLSR; (d): VCPA-PLSR; (e): IRF-PLSR; (f): iVISSA-PLSR; (g): IRF+SPA-PLSR; (h): iVISSA+SPA-PLSR

2.6 定量函数的开发

基于10个关键性特征波长建立了光谱数据与MetMb参数之间的定量线性关系, 得到PLSR定量函数, 即: y˙(MetMb)=3.249 7+1.900 2λ 468-4.791 2λ 482+5.913 5λ 512-1.856 2λ 530-5.879 3λ 545+2.246 3λ 560+5.066 1λ 580-2.320 1λ 588+1.214 9λ 790-1.348 8λ 814(λ 表示特征波长), 可用于预测在线系统中滩羊肉MetMb含量的相对比例。

3 结 论

以宁夏滩羊肉为研究对象, 采集样本光谱图像, 利用分光光度计测量样本的MetMb含量, 建立PLSR模型, 高光谱成像可以实现滩羊中MetMb含量的预测。 结论如下:

(1)对原始光谱采用4种方法进行预处理, 通过对比分析模型性能和光谱曲线, 确定原始光谱最佳, RC2=0.852, RP2=0.788, RMSEC=4.604, RMSEP=5.729;

(2)基于原始光谱数据, 使用了CARS, VCPA, IRF, SPA, iVISSA, IRF+SPA, iVISSA+SPA等降维方法, 确定IRF+SPA-PLSR模型性能最佳, 其 RC2=0.808, R2P=0.826, RMSEC=5.253, RMSEP=5.149, 相比于全波段, 提高了模型的鲁棒性, 很大程度上减少了计算时间;

(3)基于IRF+SPA算法提取出的10个关键性特征波长建立了光谱数据与MetMb参数之间的定量线性关系, 得到定量函数为: y˙(MetMb)=3.249 7+1.900 2λ 468-4.791 2λ 482+5.913 5λ 512-1.856 2λ 530-5.879 3λ 545+2.246 3λ 560+5.066 1λ 580-2.320 1λ 588+1.214 9λ 790-1.348 8λ 814

参考文献
[1] Cammarata M B, Brodbelt J S. Chem. Sci. , 2015, 6: 1324. [本文引用:1]
[2] Wright T J, Davis R W. Protein Expression and Purification, 2015, 107: 50. [本文引用:1]
[3] Taghdisi S M, Danesh N M, Ramezani M, et al. Biosensors and Bioelectronics, 2016, 80: 532. [本文引用:1]
[4] Osman B, Uzun L, Besirli N, et al. Mater. Sci. Eng. C, 2013, 33: 3609. [本文引用:1]
[5] Velásquez L, Cruz-Tirado J P, Siche Raúl, et al. Meat Science, 2017, 133: 43. [本文引用:1]
[6] Kamruzzaman M, Makino Y, Oshita S. Meat Science, 2016, 116: 110. [本文引用:1]
[7] Qiao L, Tang X, Dong J. Food Chemistry, 2017, 237: 1179. [本文引用:1]
[8] Ma J, Pu H, Sun D W. LWT, 2018, 94: 119. [本文引用:1]
[9] Yang D, He D, Lu A, et al. Infrared Physics & Technology, 2017, 83: 206. [本文引用:1]
[10] Nubiato K E Z, Mazon M R, Antonelo D S, et al. Infrared Physics & Technology, 2018, 89: 247. [本文引用:1]
[11] Kamruzzaman M, Makino Y, Oshita S. Meat Science, 2016, 116: 110. [本文引用:1]
[12] Kamruzzaman M, Makino Y, Oshita S. Journal of Food Engineering, 2016, 170(7): 8. [本文引用:1]
[13] YANG Xiao-yu, LIU Gui-shan, DING Jia-xing, et al(杨晓玉, 刘贵珊, 丁佳兴, ). Spectroscopy and Spectral Analysis(光谱学与光谱分析), 2019, 39(1): 230. [本文引用:1]
[14] Cozzolino D, Murray I. LWT-Food Science and Technology, 2004, 37(4): 447. [本文引用:1]
[15] Mamani-Linares L W, Gallo C, Alomar D. Meat Science, 2011, 90(2): 378. [本文引用:1]
[16] Cheng J H, Sun D W. LWT-Food Science and Technology, 2015, 62(2): 1060. [本文引用:1]