高光谱技术融合纹理信息的羊肉总酚浓度快速检测
孙有瑞1, 郭美1, 刘贵珊1,*, 樊奈昀1,*, 张浩楠2, 李月1, 蒲芳宁2, 杨世虎1, 王昊2
1.宁夏大学食品与葡萄酒学院, 宁夏 银川 750021
2.宁夏大学物理与电子电气工程学院, 宁夏 银川 750021
*通讯作者 e-mail: liugs@nxu.edu.cn; fny0606@163.com

作者简介: 孙有瑞, 1996年生, 宁夏大学食品与葡萄酒学院硕士研究生 e-mail: youruisun@163.com;郭 美, 1995年生, 宁夏大学食品与葡萄酒学院硕士研究生 e-mail: 13120270799@163.com;孙有瑞, 郭 美: 并列第一作者

摘要

为了研究可见-近红外(Vis-NIR)高光谱成像对滩羊肉中总酚浓度(TPC)快速检测的可行性, 基于光谱信息融合图像纹理特征建立TPC含量的预测模型, 实现滩羊肉中TPC含量的可视化表达。 将样本集根据3∶1的比例划分成校正集和预测集, 采用多元散射校正(MSC)、 基线校准(Baseline)、 去趋势(De-trending)、 卷积平滑(S-G)、 标准正态变量变换(SNV)、 归一化(Normalize)等校正方法去除原始光谱中不良散射等干扰信息。 通过竞争性自适应加权抽样(CARS)、 引导软收缩(BOSS)、 区间变量迭代空间收缩法(iVISSA)和变量组成集群分析-迭代保留信息变量(VCPA-IRIV)提取TPC浓度的代表性特征光谱。 采用灰度共生矩阵(GLCM)算法依次提取肉样第1主成分图像中纹理特征。 基于特征光谱及图谱融合信息建立滩羊肉中TPC含量的偏最小二乘回归(PLSR)与最小二乘支持向量机(LSSVM)预测模型并进行对比分析。 结果表明, (1)利用De-trending+SNV预处理后的光谱数据建立的PLSR预测模型性能较好, 其RC2=0.874 9, RP2=0.793 2; (2)采用CARS, BOSS, iVISSA和VCPA-IRIV分别提取出了23, 35, 57和43个特征波长, 占全光谱的18.4%, 28%, 45.6%和16.8%; (3)采用BOSS法提取的关键性波长建立的LSSVM模型性能较好, 其RC2=0.851 3, RP2=0.745 9, RMSEC=0.116 8和RMSEP=0.155 0; (4)与基于特征波长建立的预测模型相比, BOSS-ASM-ENT-CON-LSSVM模型为滩羊肉中TPC浓度的最佳图谱融合预测模型(RC2=0.850 0, RP2=0.770 9, RMSEC=0.116 0, RMSEP=0.144 7); (5)利用BOSS-PLSR简化模型将TPC浓度反演到样本的高光谱图像上, 通过色彩直观化形式展现出来, 实现TPC含量的可视化表达。

关键词: 滩羊肉; 高光谱; 总酚浓度; 图谱融合; 可视化
中图分类号:TS251 文献标志码:A
Fusion of Visible Near-Infrared (VNIR) Hyperspectral Imaging and Texture Feature for Prediction of Total Phenolics Content in Tan Mutton
SUN You-rui1, GUO Mei1, LIU Gui-shan1,*, FAN Nai-yun1,*, ZHANG Hao-nan2, LI Yue1, PU Fang-ning2, YANG Shi-hu1, WANG Hao2
1. College of Food and Wine, Ningxia University, Yinchuan 750021, China
2. School of Physics and Electronic-Electrical Engineering, Ningxia University, Yinchuan 750021, China
*Corresponding authors

SUN You-rui and GUO Mei: joint first authors

Abstract

The visible near-infrared (Vis-NIR) hyperspectral imaging technology was used to rapidly detect Tan mutton's total phenol concentration (TPC) content. The prediction mode and visualization of TPC content in Tan mutton were built and realized based on spectral information in combination with texture features. Firstly, the calibration set and prediction set were divided by 3∶1, and then multiplicative scatter correction (MSC), Baseline, De-trending, savitzky-golay (S-G), and Standard normal variate transformation (SNV), and Normalize were used for model optimization. Secondly, feature bands were obtained by competitive adaptive reweighted sampling (CARS), bootstrapping soft shrinkage (BOSS), interval variable iterative space shrinkage approach (iVISSA) and variable combination population analysis coupled with iteratively retained informative variables (VCPA-IRIV), respectively. Then textural feature variables for the first principal component image were extracted by gray-level co-occurrence matrix (GLCM), respectively. Finally, partial least squares regression (PLSR) and least-squares support vector machines (LSSVM) models were built and optimized to predict TPC content. The results showed that: (1) The PLSR model yielded promising results after De-trending-SNV preprocessing, and RC2 and RP2 were 0.793 2 and 0.874 9; (2) The 23, 35, 57 and 43 characteristic bands based on the original spectral were extracted by CARS, BOSS, iVISSA and VCPA-IRIV methods, respectively, accounting for 18.4%, 28%, 45.6% and 16.8% of the total bands; (3) The simplified BOSS-LSSVM model yielded good results in assessing TPC content (RC2 vs. RP2=0.851 3 vs. 0.745 9, RMSEC vs. RMSEP=0.116 8 vs. 0.155 0); (4) Compared with predictive models based on characteristic wavelengths, the simply model BOSS-ASM-ENT-CON-LSSVM despited good results (RC2=0.850 0, RP2=0.770 9, RMSEC=0.116 0, RMSEP=0.144 7); (5) The simplified BOSS-PLSR model was displayed on the sample image in the form of pseudo-color to realize the visualization expression of TPC content.

Keyword: Tan mutton; Hyperspectral imaging; Total phenol concentration; Fusion of spectra and texture feature; Visualization
引言

滩羊是宁夏优势特色畜种, 其肉质鲜香细嫩、 不膻不腥、 肌肉纹理清晰, 备受消费者喜爱[1]。 氧化是导致宰后肉品劣变的重要原因之一, 总酚浓度(total phenolic content, TPC)是肌肉内源抗氧化指标之一, 能反映宰后肉质氧化还原程度, 从而判别肉品的新鲜度。 传统检测方法因费时费力, 破坏性大不能满足现代快速无损检测的需求。 近年来, 高光谱成像技术因其可同时实现光谱信息分析和图像处理, 广泛应用于肉品新鲜度[2, 3, 4]、 嫩度[5]、 脂肪酸含量[6]、 食源性病原体[7]、 脂质氧化[8]等方面, 然而, 基于高光谱成像技术结合纹理特征法检测肉品中TPC的研究鲜有报道。

以滩羊肉为研究对象, 采用高光谱成像结合图像纹理信息对羊肉中TPC进行无损检测, 通过将TPC反演到样本的高光谱图像以色彩直观化形式展现出来, 实现TPC含量的可视化表达。

1 实验部分
1.1 样本

滩羊肉样本采集于宁夏盐池鑫海牧场。 宰后将背最长肌、 前腿肉及后腿肉放入保温箱运至实验室, 用无菌刀剔除肉样表面多余脂肪和筋膜, 分割为3.0 cm× 2.0 cm× 1.0 cm的羊肉样本180个(背最长肌∶ 前腿肉∶ 后腿=1∶ 1∶ 1), 真空包装后标记, 4 ℃冰箱排酸24 h。

1.2 图像采集

可见/近红外高光谱成像系统(400~1 000 nm), 由高光谱成像光谱仪、 CCD相机、 光纤卤素灯(150 W)、 电控位移平台、 数据采集软件五部分组成。 启动高光谱系统预热30 min, 进行黑白校正和参数设定[6]

1.3 总酚浓度测定

参考Luciano[9]等的方法并略作修改[10]

1.4 数据分析

1.4.1 预处理方法

采用多元散射校正(multiplicative scatter correction, MSC)、 基线校准(baseline)、 去趋势(De-trending)、 卷积平滑(Savitzky-Golay, S-G)、 标准正态变量变换(standard normal variate transformation, SNV)、 归一化(normalize)和De-trending-SNV预处理算法减少原始光谱中噪音和背景信息的干扰, 增强光谱数据的有用信号, 提高模型预测性能。

1.4.2 特征波长选择方法

引导软收缩(bootstrapping soft shrinkage, BOSS)算法引入自助抽样和加权自助抽样来生成随机变量组合并构建子模型[11]。 竞争性自适应加权抽样(competitive adaptive reweighted sampling, CARS)算法遵循每组波长变量通过各自的权重相互竞争, 大的权重集保留, 较小的权重集去除的原理。 变量组成集群分析-迭代保留信息变量(variable combination population analysis-iteratively retains informative variables, VCPA-IRIV)算法采用变量选择混合策略, 通过改进的VCPA缩小变量空间, 再使用IRIV进一步优化。 区间变量迭代空间收缩法(interval variable iterative space shrinkage approach, iVISSA)算法是从整体和个体对波段进行搜索。 其中整体和个体分析采用波段的权重优化, 以准确区分各个波段的位置、 宽度和组合[5]

1.4.3 图像纹理信息的提取

灰度共生矩阵(gray-level co-occurrence matrix, GLCM)用于计算相邻像素之间不同灰度值的组合数目, 以此反映在指定方向上的梯度信息[12], 在灰度梯度信息基础上从不同角度(θ =0° , 45° , 90° , 135° )提取能量(ASM)、 对比度(CON)、 相关性(COR)和熵(ENT)作为图像纹理特征参数的典型性。 提取的四个纹理参数根据式(1)— 式(8)进行计算

$\text{ASM}=\overset{X}{\mathop{\underset{i=0}{\mathop \sum }\,}}\,\overset{Y}{\mathop{\underset{j=0}{\mathop \sum }\,}}\,p{{\left( i,\text{ }\!\!~\!\!\text{ }j \right)}^{2}}$(1)

$\text{ENT}=-\overset{X}{\mathop{\underset{i=0}{\mathop \sum }\,}}\,\overset{Y}{\mathop{\underset{j=0}{\mathop \sum }\,}}\,p\left( i,\text{ }\!\!~\!\!\text{ }j \right)\text{log}p\left( i,\text{ }\!\!~\!\!\text{ }j \right)$(2)

$\text{CON}=\overset{X}{\mathop{\underset{i=0}{\mathop \sum }\,}}\,\overset{Y}{\mathop{\underset{j=0}{\mathop \sum }\,}}\,|i-j|_{P}^{2}\left( i,\text{ }\!\!~\!\!\text{ }j \right)$(3)

$\text{COR}=\overset{X}{\mathop{\underset{i=0}{\mathop \sum }\,}}\,\overset{Y}{\mathop{\underset{j=0}{\mathop \sum }\,}}\,\frac{\left( i-{{\mu }_{i}}i \right)\left( j-{{\mu }_{j}}j \right)p\left( i,\text{ }\!\!~\!\!\text{ }j \right)}{{{\sigma }_{i}}{{\sigma }_{j}}}$(4)

${{\mu }_{i}}=\overset{X}{\mathop{\underset{i=0}{\mathop \sum }\,}}\,i\overset{Y}{\mathop{\underset{j=0}{\mathop \sum }\,}}\,p\left( i,\text{ }\!\!~\!\!\text{ }j \right)$(5)

${{\mu }_{j}}=\overset{X}{\mathop{\underset{i=0}{\mathop \sum }\,}}\,j\overset{Y}{\mathop{\underset{j=0}{\mathop \sum }\,}}\,p\left( i,\text{ }\!\!~\!\!\text{ }j \right)$(6)

${{\sigma }_{i}}=\sqrt{\overset{X}{\mathop{\underset{i=0}{\mathop \sum }\,}}\,{{(i-{{\mu }_{i}})}^{2}}\overset{Y}{\mathop{\underset{j=o}{\mathop \sum }\,}}\,p\left( i,\text{ }\!\!~\!\!\text{ }j \right)}$(7)

${{\sigma }_{j}}=\sqrt{\overset{Y}{\mathop{\underset{j=0}{\mathop \sum }\,}}\,{{(j-{{\mu }_{j}})}^{2}}\overset{Y}{\mathop{\underset{j=o}{\mathop \sum }\,}}\,p\left( i,\text{ }\!\!~\!\!\text{ }j \right)}$(8)

式中, X为GLCM的列数, Y为GLCM的行号, p(i, j)为灰度共生矩阵。

1.4.4 模型建立

基于单一光谱信息和图谱融合信息建立羊肉中总酚浓度的偏最小二乘回归(partial least squares regression, PLSR)和最小二乘支持向量机(least-squares support vector machines, LSSVM)预测模型, 经对比分析确定最佳定量分析模型。 模型性能主要由以下统计参数进行评估: 校正集及预测集相关系数( RC2, RP2); 校正集及预测集均方根误差(RMSEC, RMSEP)。

2 结果与讨论
2.1 光谱曲线分析

光谱反射率是肉样化学成分、 颜色、 质地、 温度等性质的综合反映, Vis-NIR区域的光谱吸收峰与C— H, O— H和N— H分子键组成的有机化合物的基本振动组合有关[13]。 如图1所示, 430, 580, 760和970 nm为肉样的主要吸收带, 430和580 nm左右的吸收带与肉样中色素蛋白有关[14]; 760和970 nm左右的吸收峰由O— H基团的第二泛音和第三泛音引起[15], 对应于肉样中的水分。

图1 滩羊肉样本的光谱曲线Fig.1 Spectral curves of Tan mutton samples

2.2 光谱预处理

不同预处理方法下TPC含量的全波长模型性能如图2所示, 与原始光谱模型效果相比, Normalize和S-G处理后的光谱模型性能较低, 其模型性能变差可能是因为预处理消除掉了与TPC含量相关的光谱信息。 经De-trending+SNV处理后的光谱模型效果较原始光谱模型性能明显提高, 其 RP2=0.793 2, RC2=0.874 9, RMSEC=0.106 9, RMSEP=0.137 3, 表明De-trending+SNV预处理方法降低了原始光谱信息中仪器漂移散射和信号噪声等干扰信息。 因此, 后续数据分析采用De-trending+SNV预处理后的光谱数据。

图2 不同预处理方法下TPC含量的全波段模型的性能Fig.2 Performances of full wavelength models based on different pre-processing methods

2.3 特征波长提取

采用CARS, BOSS, iVISSA和VCPA-IRIV对全波段光谱进行降维处理, 结果分析如图3所示。 BOSS和CARS算法提取特征波长时, 对于不太重要的特征, 分配较小的权重, 而不是直接消除, 如图3(a)和(b)所示。 CARS算法最终选取了23个有效波长, 占全光谱的18.4%。 BOSS算法最终选取了35个有效波长, 占全光谱的28%。 VCPA-IRIV算法采样过程中RMSECV分布如图3(c)所示, 当采样次数为43时, RMSECV下降到0.162 4, 共选取出21个有效波长, 占全光谱的16.8%。 如图3(d)所示, iVISSA方法选择的是一些位置、 组合和宽度都经过优化的波长区间, 最终获得了57个光谱变量, 占全光谱的45.6%。

图3 特征波长的选择
(a): BOSS算法权重值变化和提取特征波长分布图; (b): CARS算法平均权重值变化曲线; (c): VCPA-IRIV算法的RMSECV变化图; (d): VCPA-IRIV和iVISSA提取特征波分布图
Fig.3 Selection of the characteristic wavelengths
(a): Change curve of mean weight value and the distribution map based on BOSS algorithm; (b): Change curve of mean weight value by CARS algorithm; (c): Changes map of RMSECV by VCPA-IRIV algorithm; (d): Distribution maps based on the characteristic wavelengths extracted by VCPA-IRIV and iVISSA

2.4 纹理信息提取

对肉样光谱图像进行主成分分析, 前3个主成分图(累计贡献率> 99%)如图4所示。 对表达最多的PC1从θ =0° , 45° , 90° 和135° 角度下进行对比度、 能量、 熵和相关性纹理信息提取。 对肉样ROI图像的纹理变量进行计算, 得到了一个包含180× 4(样本× 变量)的纹理矩阵。

图4 羊肉样本的前3个主成分图像Fig.4 The images of first three PCs of mutton samples

2.5 模型建立

2.5.1 特征光谱模型建立

分别采用PLSR及LSSVM方法对特征波长的降维能力进行评估, 建模效果如表1所示。 由表1可知, CARS和VCPA-IRIV方法提取的特征波长建立的预测模型性能较差。 基于BOSS算法优选的特征波长建立的LSSVM模型性能较好, 具有较高的相关系数和较低的均方根误差, 其 RC2=0.851 3, RP2=0.745 9, RMSEC=0.116 8和RMSEP=0.155 0。

表1 特征波长建模效果 Table 1 Model performances based on different feature-wavelength methods

2.5.2 图谱融合模型建立

根据2.5.1 的建模结果, 将BOSS方法提取的特征波长与肉样纹理特征进行融合建立TPC含量的预测模型如表2所示, PLSR和LSSVM模型采用四种数据融合建立, 包括一个纹理变量(COR)、 两个纹理变量(ASM和CON)、 三个纹理变量(ASM, ENT和CON)和四个纹理变量(COR, ASM, ENT和CON)与BOSS算法融合。 BOSS-ASM-ENT-CON-LSSVM图谱融合模型稳健性较好, 其 RC2=0.850 0, RP2=0.770 9, RMSEC=0.116 0, RMSEP=0.144 7, 是滩羊肉中TPC浓度的最佳定量分析模型, 图谱融合模型较单一光谱模型产生了令人满意的预测效果, 说明提取的纹理特征里携带了部分与肉样中TPC含量相关的有效信息。

表2 图谱融合建模效果 Table 2 Model performance based on image and spectroscopy fusion
2.6 TPC含量可视化分析

PLSR算法结构简单, 运算效率快, 适用范围较广。 因此, 选用特征变量下的最佳PLSR预测模型对肉样中TPC含量进行预测。 由2.5.1中建模效果可知, BOSS-PLSR预测模型为肉样中TPC含量的最佳简化模型。 基于BOSS-PLSR模型将TPC含量定量反演到样本的掩膜图像上, 从而实现TPC含量在样本图像上的动态可视化表达(图5)。 图中黄色区域代表较高的TPC含量, 蓝色区域代表TPC含量较低。 从可视化图中颜色的分布可以看出肉样中TPC含量的分布较均匀, 肉样的边缘部分呈现较低的浓度值可能是由于肉样厚度不均匀导致。 可视化分布图能够提供一种直观的方式去表征TPC值的动态变化过程。

图5 TPC含量可视化分布图Fig.5 Visualizaion maps of TPC content distributions

3 结论

利用可见-近红外高光谱技术结合图像纹理信息对滩羊肉总酚浓度含量进行预测, 主要结论如下:

(1)利用De-trending-SNV预处理后的光谱建立PLSR模型, 其 RP2=0.793 2, RC2=0.8749, 较原始光谱分别提高了0.081 4和0.029 4。

(2)CARS, BOSS, iVISSA和VCPA-IRIV分别提取出了23, 35, 57和43个特征波长, 占全光谱的18.4%, 28%, 45.6%和16.8%。

(3)特征波长模型中, BOSS-LSSVM模型预测性能最佳, 其 RC2=0.851 3, RP2=0.745 9, RMSEC=0.116 8和RMSEP=0.155 0。

(4)与基于特征波长建立的模型相比, 图谱融合模型中, PLSR和LSSVM模型的 RP2值分别提高了0.017 2和0.025 0。 BOSS-ASM-ENT-CON-LSSVM模型为最佳预测模型( RC2=0.850 0, RP2=0.770 9, RMSEC=0.116 0, RMSEP=0.144 7)。

(5)利用简化模型将TPC浓度反演到样本的高光谱图像上, 通过色彩直观化形式展现出来, 实现TPC含量的可视化表达。

参考文献
[1] YUAN Yu-dong, YOU Li-qin, LUO Rui-ming, et al(苑昱东, 尤丽琴, 罗瑞明, ). Food Science(食品科学), 2019, 40(18): 195. [本文引用:1]
[2] Zhao Zhifang, Yu Hanyue, Zhang Siyu, et al. Optik, 2020, 212: 164737. [本文引用:1]
[3] REN Ying-chun, LIU Gui-shan, ZHANG Jing-jing, et al(任迎春, 刘贵珊, 张晶晶, ). Chinese Journal of Luminescence(发光学报), 2019, 40(3): 396. [本文引用:1]
[4] Baek Insuck, Lee Hoonsoo, Cho Byoung-kwan, et al. Food Control, 2021, 124: 107854. [本文引用:1]
[5] YU Yang, ZHANG Yu, TIAN Hai-qing, et al(于洋, 张珏, 田海清, ). Journal of Agricultural Science and Technology(中国农业科技导报), 2021, 23(12): 101. [本文引用:2]
[6] YANG Xiao-yu, DING Jia-xing, FANG Meng-meng, et al(杨晓玉, 丁佳兴, 房盟盟, ). Food and Machinery(食品与机械), 2017, 33(11): 131. [本文引用:2]
[7] Bonah E, Huang X Y, Aheto J H, et al. Infrared Physics & Technology, 2020, 107: 103327. [本文引用:1]
[8] Cheng Weiwei, Klavs Martin Sørensend, Søren Balling Engelsen, et al. Journal of Food Engineering, 2019, 263: 311. [本文引用:1]
[9] Peter C Wootton-Beard, Aisling Moran, Lisa Ryan. Food Research International, 2011, 44(1): 217. [本文引用:1]
[10] Chen C, Han L, Yu Q L, et al. Canadian Journal of Animal Science, 2015, 95(2): 1. [本文引用:1]
[11] Deng B C, Yun Y H, Cao D S, et al. Analytica Chimica Acta, 2016, 908: 63. [本文引用:1]
[12] LU Bing, SUN Jun, YANG Ning, et al(芦兵, 孙俊, 杨宁, ). Spectroscopy and Spectral Analysis(光谱学与光谱分析), 2019, 39(8): 2515. [本文引用:1]
[13] Pan L Q, Zhu Q B, Lu R F, et al. Food Chemistry, 2015, 167: 264. [本文引用:1]
[14] Zheng X C, Li Y Y, Wei W S, et al. Meat Science, 2019, 149: 55. [本文引用:1]
[15] Douglas B, Gamal E, Sun D W, et al. Meat Science, 2012, 90: 259. [本文引用:1]