二维相关光谱的猪肉TVB-N特征变量优选研究
王文秀, 彭彦昆*, 房晓倩, 卜晓朴
中国农业大学工学院, 国家农产品加工技术装备研发分中心, 北京 100083
*通讯联系人  e-mail: ypeng@cau.edu.cn

作者简介: 王文秀, 1989年生, 中国农业大学工学院博士研究生 e-mail: Godlovexiu@163.com

摘要

为了探讨利用二维相关可见/近红外光谱法优选猪肉挥发性盐基氮(TVB-N)特征变量的可行性, 以贮藏时间为外扰, 研究了不同新鲜程度猪肉样本的二维相关光谱特性。 首先, 获取56个猪肉样本在贮藏1~14 d的400~1 000 nm范围的可见/近红外反射光谱, 经过标准正态变量变换(SNV)处理后, 基于全波段光谱建立TVB-N的偏最小二乘回归(PLSR)模型。 然后, 依据TVB-N实测值, 从中挑选出10个具有一定浓度梯度的样本(贮藏时间分别为0, 36, 72, 108, 144, 180, 216, 252, 288和324 h), 利用一阶导数对光谱进行预处理后, 根据不同样本之间的光谱差异, 选取7个波段用于二维相关光谱解析。 分析各个波段的二维相关同步谱和自相关谱, 从7个波段范围内共选取23个变量作为不同贮藏时间下与TVB-N相关的敏感波长, 并建立简化的PLSR模型。 相较于全波段光谱数据所建模型, 模型效果有所改善, 预测集决定系数Rp2由0.792 1上升至0.865 8, 误差从3.658 2 mg·(100 g)-1下降至3.246 0 mg·(100 g)-1。 表明基于二维相关光谱对猪肉TVB-N特征变量进行优选的思路是可行的, 该方法能够从全光谱数据中筛选出与目标物质相关的敏感变量, 这也为近红外光谱特征波长选择提供了一个新的方法。

关键词: 二维相关光谱; 可见/近红外光谱; 挥发性盐基氮; 特征变量
中图分类号:O433 文献标志码:A
Characteristic Variables Optimization for TVB-N in Pork Based on Two-Dimensional Correlation Spectroscopy
WANG Wen-xiu, PENG Yan-kun*, FANG Xiao-qian, BU Xiao-pu
National Research and Development Center for Agro⁃processing Equipment, College of Engineering, China Agricultural University, Beijing 100083, China
*Corresponding author
Abstract

In order to investigate the feasibility of two-dimensional (2D) visible/near-infrared (Vis/NIR) spectroscopy method to optimize the characteristic variables of total volatile basic nitrogen (TVB-N) in pork, storage time was employed as external disturbance and 2D correlation spectral characteristics of pork samples with different freshness degrees were studied in this paper. First, Vis/NIR reflectance spectra in the spectral region of 400~1 000 nm of 56 pork samples stored for 1~14 days were collected. Partial least squares regression (PLSR) model was established to relate full-band spectra after pre-processed with standard normalized variate (SNV) and TVB-N values with determination coefficient in the prediction set (Rp2) of 0.792 1 and standard error in the prediction set (SEP) of 3.658 2 mg·(100 g)-1. Then ten samples which had a certain concentration gradient were selected for 2D correlation spectrum analysis (with storage time of 0, 36, 72, 108, 144, 180, 216, 252, 288 and 324 h) according to the reference values of TVB-N determined by the standard methods. To eliminate the influence of noise and environmental temperature, the original spectra were pre-treated with first derivative and seven bands were selected for 2D correlation spectrum analysis according to the spectral differences between different samples. The wavelength ranges were 400~420, 450~465, 500~550, 555~580, 586~717, 726~787 and 860~960 nm, respectively. By analyzing synchronization spectrum and autocorrelation spectrum of each band, 23 variables were selected as the sensitive wavelengths to TVB-N. Then simplified PLSR model was built based on the selected feature variables. Compared with the model based on full band spectral data, the model performance was improved withRp2 increased to 0.865 8 and the SEP dropped to 3.246 0 mg·(100 g)-1. The results showed that it was feasible to optimize the characteristic variables of TVB-N based on 2D correlation spectrum and this method was capable of selecting feature variables which were related to target attribute. The study also provided a new method to select the characteristic wavelengths from NIR spectra.

Keyword: Two-dimensional correlation spectrum; Visible/near-infrared spectroscopy; Total volatile basic nitrogen; Feature variables
引 言

猪肉营养丰富, 但在贮藏及流通过程中, 由于微生物及内外源酶的作用, 猪肉中的脂肪和蛋白质被氧化降解成小分子代谢物, 产生不良气味, 同时颜色发生变化, 失去食用价值[1]。 其中, 挥发性盐基氮(Total volatile basic nitrogen, TVB-N)是尤为重要的新鲜度评价指标, GB 2707— 2016《鲜(冻)畜、 禽产品食品安全国家标准》以15 mg· (100 g)-1为阈值, 对肉品是否新鲜进行划分。 因此, 快速测定TVB-N对保障肉品安全可食具有非常重要的意义。

可见/近红外(Visible and near-infrared, Vis/NIR)光谱技术是一种绿色、 快速、 无损的检测技术手段, 它根据含氢基团在近红外谱区的光学特性, 对目标待测物的化学成分和品质特性进行预测[2]。 近年来, 该技术用于预测生鲜肉颜色、 pH、 脂肪、 蛋白质、 TVB-N、 水分等品质安全参数的能力已经得到了充分证实[3, 4, 5]。 然而, 由于近红外光谱数据庞大, 光谱信息复杂且存在严重的多重共线性, 为了增强模型的解释性, 同时提高模型的预测能力和普适性, 对特征变量进行筛选是目前亟待解决的重要问题。

二维相关光谱最早起源于核磁共振领域, 1993年由Noda将其推广应用到近红外光谱、 中红外光谱、 拉曼光谱、 荧光光谱等领域。 在研究体系中添加一定的外扰(温度、 浓度、 光照、 时间等), 会诱发光谱信号发生动态变化, 二维相关光谱反映的则是原体系中的组成成分对应于外扰的变化情况[6]。 相较于传统一维光谱, 它具有提高光谱分辨率、 解析峰的归属问题和广泛的适用性等优点。 目前, 该技术用于乳品掺假[7]、 食用油成分鉴别[8]、 药物成分鉴别[9]等, 且以温度为变量的研究最为广泛。 在肉品方面的研究较少, Liu等[10]通过解析二维可见/近红外相关光谱, 对冷冻鸡肉在融化过程中的变化进行分析, 同时利用二维可见/近红外相关谱, 对鸡胸肉在不同贮藏时间和温度处理下光谱强度变化与嫩度的关系进行解析[11]。 Chao等[12]通过二维相关可见谱解析, 对辐照鸡肉和未辐照鸡肉的品质进行分析。 然而, 将二维相关光谱技术应用于特征波长筛选的研究目前尚未见报道。

基于可见/近红外光谱, 利用二维相关光谱的方法, 以贮藏时间为外部扰动, 通过解析不同TVB-N含量的猪肉样本光谱, 开展基于二维相关光谱的猪肉TVB-N特征变量筛选的可行性研究, 并进行试验验证。

1 实验部分
1.1 材料

试验材料选择屠宰后经过24 h冷却排酸的猪肉背最长肌部分, 购买于北京顺鑫农业股份有限公司鹏程食品分公司, 品种为大白猪。 一次性购买样本后, 用蓄冷装置运送至无损检测实验室, 并用无菌刀将样本分割为大小约8 cm× 5 cm× 2.5 cm的肉块, 无积压的放置于4 ℃冰箱中。 每12 h从冰箱中随机取出2个样本用于光谱采集和理化值测定, 试验持续14 d, 共获得有效样本56个。

1.2 光谱采集

利用实验室自行搭建的生鲜肉光谱采集系统, 获取样本在可见/短波近红外区域(350~1 100 nm)的反射光谱。 该系统主要包括50 W镀金卤钨灯光源、 可见/短波近红外光谱仪(AvaSpec-2048, 荷兰AVANTES公司)、 环形光导、 石英光纤、 透镜、 计算机等。 卤钨灯固定在光源支架上, 通过光导传输至末端形成环形光圈, 照射在样本上形成光照均匀的光斑。 光谱采集前, 打开仪器预热约30 min, 保证光源和光谱仪在较稳定的状态下工作。 依次采集参比光谱、 背景光谱后, 每个样本随机选取5个位置采集光谱信号, 取其平均值后作为该样本的反射光谱信息。

1.3 TVB-N含量测定

光谱采集后, 利用半自动凯氏定氮仪(KDY9820, 北京瑞邦兴业科技有限公司)对样本的TVB-N含量进行测定。 测定方法参照《GB 5009.228— 2016 食品安全国家标准 食品中挥发性盐基氮的测定》。 将样本绞碎后, 称取10.0 g置于锥形瓶中, 加入100 mL水并不时振摇, 30 min后进行过滤, 滤液备用。 准确量取滤液10 mL于消化管中, 同时加入10 mL 10 g· L-1的氧化镁混悬液, 蒸馏5 min, 并用硼酸吸收, 吸收液用0.01 mol· L-1的盐酸进行滴定, 同时做空白实验。 挥发性盐基氮的计算公式为

X=(V1-V2)×c×14m×10/100×100(1)

式中, X为样本中TVB-N的含量, mg· (100 g)-1; V1为测定样本消耗的盐酸体积, mL; V2为空白消耗的盐酸体积, mL; c为盐酸标准溶液的实际浓度, mol· L-1; m为样本质量, g。

1.4 分析方法

首先对全波段光谱数据进行建模分析。 原始光谱采集中受到杂散光、 样本状态等影响, 需进行预处理。 采用标准正态变量变换(standard normalized variate, SNV)的方法来校正样本间因散射引起的光谱误差。 将56个样本按照3:1的比例分为校正集和验证集, 校正集样本用来建立模型, 验证集样本用来验证模型的性能。 建模方法选择偏最小二乘回归(partial least square regression, PLSR), 并利用决定系数(R2)、 校正集标准分析误差(standard error in calibration set, SEC)和验证集标准分析误差(standard error in prediction set, SEP)对模型进行评价。

然后, 进行二维相关光谱解析。 因最终是寻找与TVB-N相关的敏感波长, 因此要选取一组TVB-N具有一定浓度梯度的样本用于二维光谱分析。 结合56个样本的TVB-N实测值, 在贮藏时间分别为0, 36, 72, 108, 144, 180, 216, 252, 288和324 h下各选取1个样本的光谱用于二维相关分析, 共计10条光谱。 对10条光谱进行一阶导数预处理后, 解析其二维同步光谱。

最后, 通过分析二维相关同步光谱, 获取自相关峰的位置, 依据该位置对应波长的光谱数据, 建立简化的PLSR模型, 并与全光谱数据建模结果比较, 验证所选特征变量的可靠性。 上述预处理和建模过程在Matlab 2012a中进行, 二维相关光谱分析在2D shige软件中进行。

2 结果与讨论
2.1 样本理化值统计分析

校正集和验证集中样本TVB-N含量的统计分析结果(最大值、 最小值、 平均值、 标准偏差)如表1所示。 从表中数据可以看出, 随着贮藏时间的延长, 猪肉中TVB-N含量从9.75 mg· (100 g)-1上升至44.17 mg· (100 g)-1, 表明猪肉中的蛋白质在酶和微生物作用下, 被分解为氨和胺类等碱性物质, 并与有机酸进行了结合。 校正集中TVB-N含量范围大于验证集范围, 这有利于构建稳定性好、 鲁棒性强的预测模型。 此外, 本研究中测定的TVB-N值与前人研究数据相近[13], 表明理化数据真实可靠。

表1 校正集和验证集样本TVB-N值统计结果 Table 1 Statistic values of TVB-N content in calibration and prediction sets
2.2 基于全光谱数据TVB-N建模分析

56个样本的原始光谱曲线如图1(a)所示, 由于两端信噪比较差, 因此只保留400~1 000 nm范围的光谱用作后续分析。 从图中可以看出, 在435, 550和580 nm处有明显的吸收峰, 该区域与肉中肌红蛋白和血红蛋白的浓度、 状态和相对比例有关; 在980 nm处明显的吸收峰此处与O— H键振动的二级倍频有关, 为水的吸收峰[14]。 不同TVB-N含量的样本对应的光谱曲线形状和趋势比较相似, 从原始一维近红外光谱上并无明显差异。 经过SNV预处理后光谱如图1(b)所示, 与图1(a)比较可以看出, SNV可以有效的消除样本内部结构组织大小、 表面散射等对近红外反射光谱的影响, 使原始的光谱数据标准正态化。

图1 56个样本的可见/近红外光谱曲线
(a): 原始光谱; (b): 经过SNV预处理后光谱
Fig.1 Vis/NIR spectra of 56 samples
(a): Original spectra; (b): Spectra after SNV pre-treatment

以经过SNV预处理后的全光谱数据作为X矩阵, 以国标方法测定的TVB-N值为y向量, 建立PLSR方程。 当选择主因子数位6时, 预测效果最佳, 此时校正集预测决定系数 Rc2为0.873 7, SEC为2.789 7 mg· (100 g)-1, 验证集预测决定系数 Rp2为0.792 1, SEP为3.658 2 mg· (100 g)-1, 其测定值和预测值的散点分布图如图2所示。 然而, 由于全波段光谱数据量较大(本研究中共有1 059个波长变量), 光谱信息复杂且包含与建模无关的变量, 将会影响模型的预测能力和计算速度, 因此接下来借助二维相关光谱分析, 筛选出以时间为外扰时对TVB-N比较敏感的波长变量。

图2 利用全光谱数据建模时校正集和验证集样本测定值和预测值散点分布图
(a): 校正集; (b): 验证集
Fig.2 Relationship between measured TVB-N value and predicted TVB-N value in the calibration and prediction sets based on full-band spectra
(a): Calibration set; (b): Prediction set

2.3 基于二维相关光谱的TVB-N特征变量优选

对选入的10个样本进行二维相关同步光谱分析。 首先, 观察10个样本的原始光谱曲线和TVB-N含量分布情况, 如图3(a)和(b)所示所示, 从图中可以看出, 不同贮藏时间下的样本光谱曲线在形状上趋势一致, 所选取的样本TVB-N值具有一定的浓度梯度, 然而反射率的大小与贮藏时间并无直接关系。 这说明以贮藏时间为外部扰动, 所引起的光谱变化很难从一维近红外光谱直接识别, 因此, 引入二维相关同步光谱作进一步分析。 由于原始光谱在采集过程中会受到外界条件(如光线、 环境温度等)的影响, 这些干扰和噪音会导致在二维相关分析时产生一些虚假的相关峰, 所以要对原始光谱进行预处理。 采用一阶导数对这10条光谱进行预处理, 以去除同波长无关的漂移, 并强化谱带特征, 如图3(c)所示。 此时, 若直接对400~1 000 nm之间的Vis/NIR光谱作二维相关光谱分析, 会导致谱峰难以辨别, 因而根据一阶导数预处理后的光谱曲线, 选择了7个光谱值具有明显差异的区域作为TVB-N特征信息波段。 其波长范围分别是400~420, 450~465, 500~550, 555~580, 586~717, 726~787, 860~960 nm。

图3 不同贮藏时间的10个样本的原始光谱(a)、 TVB-N含量分布图(b)及一阶导数光谱(c)Fig.3 Original spectra (a), distribution diagram of TVB-N (b) and first derivative spectrum (c) of ten samples with different storage times

对上述7个波段的光谱作二维相关光谱特性解析, 图4(a)— (n)分别为上述波段各自的同步二维相关谱及其对应的自相关谱, 可以看出在常规光谱中重叠的峰变得更加清晰。 根据Noda的二维光谱理论, 同步二维相关光谱关于主对角线对称, 其相关峰可能出现在对角线或非对角线上。 在对角线上的峰称之为自动峰, 总是正值, 它的强度反映了待测体系随外扰的变化强度, 可以以圆圈的个数来反映其自动峰的强弱, 圆圈数越多, 自动峰越强, 反之, 则越弱。 对角线之外的峰为交叉峰, 圈内填充灰色的为正峰, 未填充灰色的为负峰, 正峰代表以贮藏时间为外扰的Vis/NIR光谱中两个独立波数处的动态信号同时增大或减小, 负峰则代表取向变化相反的行为[15]。 图中各个波段下同步谱和自相关谱的对比符合这一理论, 同时从出现的多处自动峰也表明随着贮藏时间的延长, TVB-N含量不断增加, 某些波长处振动峰对应的基团变化比较明显, 该波长可以理解为与TVB-N有关的特征波长。

图4 不同TVB-N含量样本在不同波段下的二维同步谱与自相关谱
(a), (b): 400~420 nm; (c), (d): 450~465 nm; (e), (f): 500~550 nm; (g), (h): 555~580 nm; (i), (j): 586~717 nm; (k), (l): 726~787 nm; (m), (n): 860~960 nm
Fig.4 Two-dimension synchronous map and autocorrelation spectra of samples with different TVB-N values at different wavelengths
(a), (b): 400~420 nm; (c), (d): 450~465 nm; (e), (f): 500~550 nm; (g), (h): 555~580 nm; (i), (j): 586~717 nm; (k), (l): 726~787 nm; (m), (n): 860~960 nm

观察图4(a)和(b), 在对角线上出现了两个弱的自相关峰, 所对应的基团振动峰的位置在407和415 nm处, 这两处与贮藏期间猪肉颜色的变化有关, 且407nm处的峰在常规光谱中并未出现, 表明二维光谱能将重叠峰分辨出来。 第二波段下的同步谱和自相关谱如图4(c)和(d)所示, 在453 nm处出现较强的自相关峰, 该波长与肌红蛋白的吸收有关。 第三波段下的二维谱如图4(e)和(f)所示, 出现3个自动峰, 最强自动峰出现在545 nm处, 次强自动峰分别出现在511和533 nm处。 同时, 在(509, 545)处出现正的交叉峰, 说明这两处的基团对外部扰动具有协同效应, 在(524, 545)处出现负的交叉峰, 说明其响应相反。 第四波段下的二维谱如图4(g)和(h)所示, 在566 nm处出现了较强的自动峰, 原始光谱曲线[图3(a)]在该波长处也有波峰出现, 此波长与猪肉在贮藏期间由最初的鲜红色转变为黄绿色有密切关系。 第五波段下的二维谱如图4(i)和(j)所示, 该波段范围内出现多处自动峰, 较强的出现在600, 618和654 nm处, 次之的出现在587, 609, 640和647 nm处, 较弱的出现在671和694 nm处。 同样, 在第六波段范围内也出现多个自动峰[图4(k)和(l)], 较强的峰出现在731 nm处, 次之的出现在742, 747, 754和773 nm处。 在(745, 772)处出现正的交叉峰, 其中772 nm与N— H键振动的三级倍频有关, 745 nm处对应的基团吸收峰强度变化与之相同, 表明该处也与N— H键有关。 同时, 在(730, 760)处也有一个负交叉峰出现。 第7波段的二维谱如图4(m)和(n)所示, 在935和947 nm处出现两处自相关峰, 935 nm处与N— H键振动的三级倍频有关, 947 nm与C— H键振动的三级倍频有关。 分析上述的自相关峰对应的波长, 多与颜色、 C— H和N— H键有关, 这与猪肉在放置过程中颜色发生变化, 脂肪和蛋白质被氧化降解等的化学变化相一致, 表明通过对不同TVB-N含量的光谱进行二维同步光谱特性解析, 可以辨析出与之相关的特征波长。

2.4 基于特征变量的TVB-N建模结果分析与比较

在上述研究不同贮藏期猪肉二维相关光谱特性的基础上, 选择23个自相关峰的位置为特征波长, 分别是: 407, 415, 453, 511, 545, 533, 566, 587, 600, 609, 618, 640, 647, 654, 671, 694, 731, 742, 747, 754, 773, 935和947 nm。 以该波长下经SNV预处理后的光谱为自变量, 以TVB-N测定值为因变量, 再次建立简化的PLSR模型。 其校正集决定系数 Rc2和误差SEC分别为0.898 9和2.473 4 mg· (100 g)-1, 验证集决定系数 Rp2和误差SEP分别为0.865 8和3.246 0 mg· (100 g)-1, 实测值和预测值的散点分布图如图5所示。 与利用全波段光谱数据建立的模型相比, 校正集和预测集的效果均有所提高, 其中, 校正集决定系数从0.873 7上升至0.898 9, 验证集决定系数从0.792 1上升至0.865 8, 预测集误差从3.658 2 mg· (100 g)-1下降至3.246 0 mg· (100 g)-1, 表明利用该方法筛选出的与外扰变化相关的变量, 与目标待测物质TVB-N有密切联系, 同时模型性能的提高也说明通过剔除无关变量, 可以有效的简化模型并提高模型的预测能力。

图5 基于特征变量建模的校正集和验证集样本测定值和预测值散点分布图
(a): 校正集; (b): 验证集
Fig.5 Relationship between measured and predicted TVB-N values in the calibration and prediction sets based on feature variables
(a): Calibration set; (b): Prediction set

3 结 论

基于二维相关光谱方法, 对不同贮藏时间下TVB-N特征变量优选展开研究。 在对原始Vis/NIR光谱进行一阶导数预处理的基础上, 根据不同TVB-N含量样本在光谱曲线上的差异, 选取7个波段用于二维相关光谱解析, 依次获得7个波段下的同步谱和自相关谱。 在同步谱对角线上共获得23个自相关峰, 对TVB-N含量的变化比较敏感, 作为TVB-N的特征波长。 利用23个波长下的光谱数据, 建立简化的TVB-N预测模型, 较全波段光谱建模效果有所提升, 表明结合二维相关光谱技术可以对TVB-N的特征波长进行有效筛选。 这不仅为预测TVB-N提供了理论依据, 也为近红外光谱分析中筛选特征变量提供了新的思路和方法。 后续研究可进一步考察二维相关异步光谱对特征波长筛选的作用, 同时也可将该方法和思路应用到猪肉其他参数的预测研究。

The authors have declared that no competing interests exist.

参考文献
[1] ZHANG Kai-hua, ZANG Ming-wu, WANG Shou-wei, et al(张凯华, 臧明伍, 王守伟, ). Meat Research(肉类研究), 2016, 30(1): 30. [本文引用:1]
[2] Peng Y K, Dhakal S. Transaction of the ASABE, 2015, 58(5): 1371. [本文引用:1]
[3] Reis M M, Rosenvold K. Encyclopedia of Meat Sciences, 2014, 3: 70. [本文引用:1]
[4] Balage J M, da Luz E Silva S, Gomide C A, et al. Meat Science, 2015, 108: 37. [本文引用:1]
[5] WANG Wen-xiu, PENG Yan-kun, SUN Hong-wei, et al(王文秀, 彭彦昆, 孙宏伟, ). Transactions of the Chinese Society of Agricultural Engineering(农业工程学报), 2016, 32(23): 290. [本文引用:1]
[6] YANG Ren-jie, YANG Yan-rong, LIU Hai-xue, et al(杨仁杰, 杨延荣, 刘海学, ). Spectroscopy and Spectral Analysis(光谱学与光谱分析), 2015, 35(8): 2124. [本文引用:1]
[7] YANG Ren-jie, LIU Rong, XU Ke-xin(杨仁杰, 刘蓉, 徐可欣). Transactions of the Chinese Society of Agricultural Engineering(农业工程学报), 2012, 28(6): 259. [本文引用:1]
[8] CHEN Bin, ZHANG Yu-ying, LU Dao-li, et al(陈斌, 张玉莹, 陆道礼, ). Journal of The Chinese Cereals and Oils Association(中国粮油学报), 2016, 31(6): 153. [本文引用:1]
[9] Qu L, Chen J B, Zhou Q, et al. Journal of Molecular Structure, 2016, 1124: 216. [本文引用:1]
[10] Liu Y, Chen Y R. Meat Science, 2000, 57(3): 299. [本文引用:1]
[11] Liu Y, Barton F E, Lyon B G, et al. Journal of Agricultural and Food Chemistry, 2004, 52(3): 505. [本文引用:1]
[12] Chao K, Chen Y R, Thayer D W, et al. Applied Engineering in Agriculture, 2002, 18(6): 745. [本文引用:1]
[13] Li H H, Chen Q S, Zhao J W, et al. LWT-Food Science and Technology, 2015, 63(1): 268. [本文引用:1]
[14] Xie A G, Sun D W, Xu Z Y, et al. Talanta, 2015, 139: 208. [本文引用:1]
[15] Park Y, Jin S, Noda I, et al. Journal of Molecular Structure, 2018, 1168: 1. [本文引用:1]