作者简介: 孙有瑞, 1996年生, 宁夏大学食品与葡萄酒学院硕士研究生 e-mail: youruisun@163.com;郭 美, 1995年生, 宁夏大学食品与葡萄酒学院硕士研究生 e-mail: 13120270799@163.com;孙有瑞, 郭 美: 并列第一作者
为了研究可见-近红外(Vis-NIR)高光谱成像对滩羊肉中总酚浓度(TPC)快速检测的可行性, 基于光谱信息融合图像纹理特征建立TPC含量的预测模型, 实现滩羊肉中TPC含量的可视化表达。 将样本集根据3∶1的比例划分成校正集和预测集, 采用多元散射校正(MSC)、 基线校准(Baseline)、 去趋势(De-trending)、 卷积平滑(S-G)、 标准正态变量变换(SNV)、 归一化(Normalize)等校正方法去除原始光谱中不良散射等干扰信息。 通过竞争性自适应加权抽样(CARS)、 引导软收缩(BOSS)、 区间变量迭代空间收缩法(iVISSA)和变量组成集群分析-迭代保留信息变量(VCPA-IRIV)提取TPC浓度的代表性特征光谱。 采用灰度共生矩阵(GLCM)算法依次提取肉样第1主成分图像中纹理特征。 基于特征光谱及图谱融合信息建立滩羊肉中TPC含量的偏最小二乘回归(PLSR)与最小二乘支持向量机(LSSVM)预测模型并进行对比分析。 结果表明, (1)利用De-trending+SNV预处理后的光谱数据建立的PLSR预测模型性能较好, 其RC2=0.874 9, RP2=0.793 2; (2)采用CARS, BOSS, iVISSA和VCPA-IRIV分别提取出了23, 35, 57和43个特征波长, 占全光谱的18.4%, 28%, 45.6%和16.8%; (3)采用BOSS法提取的关键性波长建立的LSSVM模型性能较好, 其RC2=0.851 3, RP2=0.745 9, RMSEC=0.116 8和RMSEP=0.155 0; (4)与基于特征波长建立的预测模型相比, BOSS-ASM-ENT-CON-LSSVM模型为滩羊肉中TPC浓度的最佳图谱融合预测模型(RC2=0.850 0, RP2=0.770 9, RMSEC=0.116 0, RMSEP=0.144 7); (5)利用BOSS-PLSR简化模型将TPC浓度反演到样本的高光谱图像上, 通过色彩直观化形式展现出来, 实现TPC含量的可视化表达。
SUN You-rui and GUO Mei: joint first authors
The visible near-infrared (Vis-NIR) hyperspectral imaging technology was used to rapidly detect Tan mutton's total phenol concentration (TPC) content. The prediction mode and visualization of TPC content in Tan mutton were built and realized based on spectral information in combination with texture features. Firstly, the calibration set and prediction set were divided by 3∶1, and then multiplicative scatter correction (MSC), Baseline, De-trending, savitzky-golay (S-G), and Standard normal variate transformation (SNV), and Normalize were used for model optimization. Secondly, feature bands were obtained by competitive adaptive reweighted sampling (CARS), bootstrapping soft shrinkage (BOSS), interval variable iterative space shrinkage approach (iVISSA) and variable combination population analysis coupled with iteratively retained informative variables (VCPA-IRIV), respectively. Then textural feature variables for the first principal component image were extracted by gray-level co-occurrence matrix (GLCM), respectively. Finally, partial least squares regression (PLSR) and least-squares support vector machines (LSSVM) models were built and optimized to predict TPC content. The results showed that: (1) The PLSR model yielded promising results after De-trending-SNV preprocessing, and RC2 and RP2 were 0.793 2 and 0.874 9; (2) The 23, 35, 57 and 43 characteristic bands based on the original spectral were extracted by CARS, BOSS, iVISSA and VCPA-IRIV methods, respectively, accounting for 18.4%, 28%, 45.6% and 16.8% of the total bands; (3) The simplified BOSS-LSSVM model yielded good results in assessing TPC content (RC2 vs. RP2=0.851 3 vs. 0.745 9, RMSEC vs. RMSEP=0.116 8 vs. 0.155 0); (4) Compared with predictive models based on characteristic wavelengths, the simply model BOSS-ASM-ENT-CON-LSSVM despited good results (RC2=0.850 0, RP2=0.770 9, RMSEC=0.116 0, RMSEP=0.144 7); (5) The simplified BOSS-PLSR model was displayed on the sample image in the form of pseudo-color to realize the visualization expression of TPC content.
滩羊是宁夏优势特色畜种, 其肉质鲜香细嫩、 不膻不腥、 肌肉纹理清晰, 备受消费者喜爱[1]。 氧化是导致宰后肉品劣变的重要原因之一, 总酚浓度(total phenolic content, TPC)是肌肉内源抗氧化指标之一, 能反映宰后肉质氧化还原程度, 从而判别肉品的新鲜度。 传统检测方法因费时费力, 破坏性大不能满足现代快速无损检测的需求。 近年来, 高光谱成像技术因其可同时实现光谱信息分析和图像处理, 广泛应用于肉品新鲜度[2, 3, 4]、 嫩度[5]、 脂肪酸含量[6]、 食源性病原体[7]、 脂质氧化[8]等方面, 然而, 基于高光谱成像技术结合纹理特征法检测肉品中TPC的研究鲜有报道。
以滩羊肉为研究对象, 采用高光谱成像结合图像纹理信息对羊肉中TPC进行无损检测, 通过将TPC反演到样本的高光谱图像以色彩直观化形式展现出来, 实现TPC含量的可视化表达。
滩羊肉样本采集于宁夏盐池鑫海牧场。 宰后将背最长肌、 前腿肉及后腿肉放入保温箱运至实验室, 用无菌刀剔除肉样表面多余脂肪和筋膜, 分割为3.0 cm× 2.0 cm× 1.0 cm的羊肉样本180个(背最长肌∶ 前腿肉∶ 后腿=1∶ 1∶ 1), 真空包装后标记, 4 ℃冰箱排酸24 h。
可见/近红外高光谱成像系统(400~1 000 nm), 由高光谱成像光谱仪、 CCD相机、 光纤卤素灯(150 W)、 电控位移平台、 数据采集软件五部分组成。 启动高光谱系统预热30 min, 进行黑白校正和参数设定[6]。
1.4.1 预处理方法
采用多元散射校正(multiplicative scatter correction, MSC)、 基线校准(baseline)、 去趋势(De-trending)、 卷积平滑(Savitzky-Golay, S-G)、 标准正态变量变换(standard normal variate transformation, SNV)、 归一化(normalize)和De-trending-SNV预处理算法减少原始光谱中噪音和背景信息的干扰, 增强光谱数据的有用信号, 提高模型预测性能。
1.4.2 特征波长选择方法
引导软收缩(bootstrapping soft shrinkage, BOSS)算法引入自助抽样和加权自助抽样来生成随机变量组合并构建子模型[11]。 竞争性自适应加权抽样(competitive adaptive reweighted sampling, CARS)算法遵循每组波长变量通过各自的权重相互竞争, 大的权重集保留, 较小的权重集去除的原理。 变量组成集群分析-迭代保留信息变量(variable combination population analysis-iteratively retains informative variables, VCPA-IRIV)算法采用变量选择混合策略, 通过改进的VCPA缩小变量空间, 再使用IRIV进一步优化。 区间变量迭代空间收缩法(interval variable iterative space shrinkage approach, iVISSA)算法是从整体和个体对波段进行搜索。 其中整体和个体分析采用波段的权重优化, 以准确区分各个波段的位置、 宽度和组合[5]。
1.4.3 图像纹理信息的提取
灰度共生矩阵(gray-level co-occurrence matrix, GLCM)用于计算相邻像素之间不同灰度值的组合数目, 以此反映在指定方向上的梯度信息[12], 在灰度梯度信息基础上从不同角度(θ =0° , 45° , 90° , 135° )提取能量(ASM)、 对比度(CON)、 相关性(COR)和熵(ENT)作为图像纹理特征参数的典型性。 提取的四个纹理参数根据式(1)— 式(8)进行计算
$\text{ASM}=\overset{X}{\mathop{\underset{i=0}{\mathop \sum }\,}}\,\overset{Y}{\mathop{\underset{j=0}{\mathop \sum }\,}}\,p{{\left( i,\text{ }\!\!~\!\!\text{ }j \right)}^{2}}$(1)
$\text{ENT}=-\overset{X}{\mathop{\underset{i=0}{\mathop \sum }\,}}\,\overset{Y}{\mathop{\underset{j=0}{\mathop \sum }\,}}\,p\left( i,\text{ }\!\!~\!\!\text{ }j \right)\text{log}p\left( i,\text{ }\!\!~\!\!\text{ }j \right)$(2)
$\text{CON}=\overset{X}{\mathop{\underset{i=0}{\mathop \sum }\,}}\,\overset{Y}{\mathop{\underset{j=0}{\mathop \sum }\,}}\,|i-j|_{P}^{2}\left( i,\text{ }\!\!~\!\!\text{ }j \right)$(3)
$\text{COR}=\overset{X}{\mathop{\underset{i=0}{\mathop \sum }\,}}\,\overset{Y}{\mathop{\underset{j=0}{\mathop \sum }\,}}\,\frac{\left( i-{{\mu }_{i}}i \right)\left( j-{{\mu }_{j}}j \right)p\left( i,\text{ }\!\!~\!\!\text{ }j \right)}{{{\sigma }_{i}}{{\sigma }_{j}}}$(4)
${{\mu }_{i}}=\overset{X}{\mathop{\underset{i=0}{\mathop \sum }\,}}\,i\overset{Y}{\mathop{\underset{j=0}{\mathop \sum }\,}}\,p\left( i,\text{ }\!\!~\!\!\text{ }j \right)$(5)
${{\mu }_{j}}=\overset{X}{\mathop{\underset{i=0}{\mathop \sum }\,}}\,j\overset{Y}{\mathop{\underset{j=0}{\mathop \sum }\,}}\,p\left( i,\text{ }\!\!~\!\!\text{ }j \right)$(6)
${{\sigma }_{i}}=\sqrt{\overset{X}{\mathop{\underset{i=0}{\mathop \sum }\,}}\,{{(i-{{\mu }_{i}})}^{2}}\overset{Y}{\mathop{\underset{j=o}{\mathop \sum }\,}}\,p\left( i,\text{ }\!\!~\!\!\text{ }j \right)}$(7)
${{\sigma }_{j}}=\sqrt{\overset{Y}{\mathop{\underset{j=0}{\mathop \sum }\,}}\,{{(j-{{\mu }_{j}})}^{2}}\overset{Y}{\mathop{\underset{j=o}{\mathop \sum }\,}}\,p\left( i,\text{ }\!\!~\!\!\text{ }j \right)}$(8)
式中, X为GLCM的列数, Y为GLCM的行号, p(i, j)为灰度共生矩阵。
1.4.4 模型建立
基于单一光谱信息和图谱融合信息建立羊肉中总酚浓度的偏最小二乘回归(partial least squares regression, PLSR)和最小二乘支持向量机(least-squares support vector machines, LSSVM)预测模型, 经对比分析确定最佳定量分析模型。 模型性能主要由以下统计参数进行评估: 校正集及预测集相关系数(
光谱反射率是肉样化学成分、 颜色、 质地、 温度等性质的综合反映, Vis-NIR区域的光谱吸收峰与C— H, O— H和N— H分子键组成的有机化合物的基本振动组合有关[13]。 如图1所示, 430, 580, 760和970 nm为肉样的主要吸收带, 430和580 nm左右的吸收带与肉样中色素蛋白有关[14]; 760和970 nm左右的吸收峰由O— H基团的第二泛音和第三泛音引起[15], 对应于肉样中的水分。
不同预处理方法下TPC含量的全波长模型性能如图2所示, 与原始光谱模型效果相比, Normalize和S-G处理后的光谱模型性能较低, 其模型性能变差可能是因为预处理消除掉了与TPC含量相关的光谱信息。 经De-trending+SNV处理后的光谱模型效果较原始光谱模型性能明显提高, 其
采用CARS, BOSS, iVISSA和VCPA-IRIV对全波段光谱进行降维处理, 结果分析如图3所示。 BOSS和CARS算法提取特征波长时, 对于不太重要的特征, 分配较小的权重, 而不是直接消除, 如图3(a)和(b)所示。 CARS算法最终选取了23个有效波长, 占全光谱的18.4%。 BOSS算法最终选取了35个有效波长, 占全光谱的28%。 VCPA-IRIV算法采样过程中RMSECV分布如图3(c)所示, 当采样次数为43时, RMSECV下降到0.162 4, 共选取出21个有效波长, 占全光谱的16.8%。 如图3(d)所示, iVISSA方法选择的是一些位置、 组合和宽度都经过优化的波长区间, 最终获得了57个光谱变量, 占全光谱的45.6%。
对肉样光谱图像进行主成分分析, 前3个主成分图(累计贡献率> 99%)如图4所示。 对表达最多的PC1从θ =0° , 45° , 90° 和135° 角度下进行对比度、 能量、 熵和相关性纹理信息提取。 对肉样ROI图像的纹理变量进行计算, 得到了一个包含180× 4(样本× 变量)的纹理矩阵。
2.5.1 特征光谱模型建立
分别采用PLSR及LSSVM方法对特征波长的降维能力进行评估, 建模效果如表1所示。 由表1可知, CARS和VCPA-IRIV方法提取的特征波长建立的预测模型性能较差。 基于BOSS算法优选的特征波长建立的LSSVM模型性能较好, 具有较高的相关系数和较低的均方根误差, 其
![]() | 表1 特征波长建模效果 Table 1 Model performances based on different feature-wavelength methods |
2.5.2 图谱融合模型建立
根据2.5.1 的建模结果, 将BOSS方法提取的特征波长与肉样纹理特征进行融合建立TPC含量的预测模型如表2所示, PLSR和LSSVM模型采用四种数据融合建立, 包括一个纹理变量(COR)、 两个纹理变量(ASM和CON)、 三个纹理变量(ASM, ENT和CON)和四个纹理变量(COR, ASM, ENT和CON)与BOSS算法融合。 BOSS-ASM-ENT-CON-LSSVM图谱融合模型稳健性较好, 其
![]() | 表2 图谱融合建模效果 Table 2 Model performance based on image and spectroscopy fusion |
PLSR算法结构简单, 运算效率快, 适用范围较广。 因此, 选用特征变量下的最佳PLSR预测模型对肉样中TPC含量进行预测。 由2.5.1中建模效果可知, BOSS-PLSR预测模型为肉样中TPC含量的最佳简化模型。 基于BOSS-PLSR模型将TPC含量定量反演到样本的掩膜图像上, 从而实现TPC含量在样本图像上的动态可视化表达(图5)。 图中黄色区域代表较高的TPC含量, 蓝色区域代表TPC含量较低。 从可视化图中颜色的分布可以看出肉样中TPC含量的分布较均匀, 肉样的边缘部分呈现较低的浓度值可能是由于肉样厚度不均匀导致。 可视化分布图能够提供一种直观的方式去表征TPC值的动态变化过程。
利用可见-近红外高光谱技术结合图像纹理信息对滩羊肉总酚浓度含量进行预测, 主要结论如下:
(1)利用De-trending-SNV预处理后的光谱建立PLSR模型, 其
(2)CARS, BOSS, iVISSA和VCPA-IRIV分别提取出了23, 35, 57和43个特征波长, 占全光谱的18.4%, 28%, 45.6%和16.8%。
(3)特征波长模型中, BOSS-LSSVM模型预测性能最佳, 其
(4)与基于特征波长建立的模型相比, 图谱融合模型中, PLSR和LSSVM模型的
(5)利用简化模型将TPC浓度反演到样本的高光谱图像上, 通过色彩直观化形式展现出来, 实现TPC含量的可视化表达。
[1] |
|
[2] |
|
[3] |
|
[4] |
|
[5] |
|
[6] |
|
[7] |
|
[8] |
|
[9] |
|
[10] |
|
[11] |
|
[12] |
|
[13] |
|
[14] |
|
[15] |
|