高光谱图像与稀疏核典型相关分析冷鲜羊肉新鲜度无损检测
姜新华1, 薛河儒1,*, 郜晓晶1, 张丽娜2, 周艳青1, 杜雅娟1,3
1. 内蒙古农业大学计算机与信息工程学院, 内蒙古 呼和浩特 010018
2. 内蒙古师范大学物理与电子信息学院, 内蒙古 呼和浩特 010022
3. 内蒙古工业大学理学院, 内蒙古 呼和浩特 010051
*通讯联系人 e-mail: xuehr@126.com

作者简介: 姜新华, 1977年生, 内蒙古农业大学计算机与信息工程学院副教授 e-mail: jiang-xh@163.com

摘要

羊肉新鲜度受多种因素影响, 通常由多个指标来综合评价, 常规试验操作复杂不适合在线检测。 高光谱成像数据能够反映羊肉新鲜度变化过程中多种成分的变化信息, 但是光谱特征提取与评价模型的建立对最终结果影响较大。 为了研究高光谱成像与多指标的快速检测羊肉新鲜度的可行性, 提出一种稀疏核典型相关分析方法, 借助实验室测定的多个标准值, 研究多指标的羊肉新鲜度无损检测。 采集了70个代表各级新鲜程度的羊肉样本400~1 000 nm高光谱图像, 采用实验室方法测定了挥发性盐基氮(TVB-N)和菌落总数(TAC)标准值, 选择感兴趣区域(ROIs)提取代表性光谱图像, 利用所提出的特征提取方法提取光谱特征信息, 并按照3:1划分校正集和预测集, 利用三层神经网络进行分类识别试验。 结果表明, 新鲜度等级分类总体精度(OA)为0.939 3, Kappa系数为0.906 0, 均方根误差(RMSEC)为0.297。 研究表明, 所提出的多指标光谱特征提取方法可用于快速无损检测羊肉新鲜程度, 为采用高光谱成像综合多个新鲜度检测指标, 改善由于单一检测指标造成评价模型的适用性和鲁棒性提供了基础。

关键词: 高光谱成像; 冷鲜羊肉; 新鲜度; 无损检测; 核典型相关分析; 稀疏
中图分类号:TS207.7 文献标识码:A
Study on Detection of Chilled Mutton Freshness Based on Hyperspectral Imaging Technique and Sparse Kernel Canonical Correlation Analysis
JIANG Xin-hua1, XUE He-ru1,*, GAO Xiao-jing1, ZHANG Li-na2, ZHOU Yan-qing1, DU Ya-juan1,3
1. College of Computer and Information Engineering, Inner Mongolia Agricultural University, Huhhot 010018, China
2. College of Physics and Electronic Information Science, Inner Mongolia Normal University, Huhhot 010022, China
3. College of Science, Inner Mongolia Polytechnic University, Huhhot 010051, China
Abstract

The mutton freshness is affected by many factors, which is usually evaluated by a number of indicators, and its routine detection is complicated and not suitable for online detection. Hyperspectral imaging data can reflect the changes of components in the process of mutton freshness changing, but the establishment of spectral feature extraction and evaluation model has a great influence on the final result. In order to study the feasibility of rapid detection of mutton freshness with hyperspectral imaging technique and multi-parameter indicators, this paper proposed a sparse kernel canonical correlation analysis method, and researches comprehensive evaluation of mutton freshness on multi-parameter using laboratory standard values. In this study, 400~1 000 nm hyperspectral images were collected from 70 mutton samples, and the standard values of total volatile basic nitrogen (TVB-N) and total aerobic plate count (TAC) were determined with laboratory methods. The representative spectra of mutton samples were extracted and obtained after selection of the region of interests (ROIs). The spectral feature information is extracted by using the feature extraction method proposed in this paper. The samples of calibration set and the prediction set are divided at the ratio of 3:1. The experiment of classification and recognition using three layer neural network shows that the overall accuracy (OA) is 0.939 3, the Kappa coefficient is 0.906 0, and the root mean square error (RMSEC) is 0.297. The research shows that the multi-parameter spectral feature extraction method proposed in this paper can be used to detect the freshness of mutton quickly and nondestructively. This paper provides a basis for improving the applicability and robustness of the evaluation model due to the single detection indicator by using the hyperspectral imaging technique to synthesize the spectral information of several freshness indexes.

Key words: Hyperspectral imaging; Chilled mutton; Freshness; Nondestructive detection; Kernel Canonical correlation analysis; Sparse
引言

羊肉含有丰富的蛋白质、 脂肪和矿物质等, 可提供给人体丰富的营养物质, 是北方地区居民膳食结构的重要组成部分。 羊肉从生产到消费要经历多个环节, 其间内部组织成分会受到自身成分、 贮藏环境和微生物的相互作用发生腐败变质[1]。 新鲜度是体现羊肉腐败变化的综合指标, 直接影响消费者的购买意向。 及时按新鲜度对羊肉产品进行评价, 既能保护消费者的利益, 又有利于食品安全科学管理。 因此, 研究羊肉新鲜度无损检测和评价具有重要意义。

近年来, 国内外学者研究采用高光谱成像进行生鲜羊肉的快速无损检测[2, 3]。 高光谱成像具有连续波段、 分辨率高和图谱合一的优点, 符合无损检测向多源信息融合研究方向发展的趋势, 被广泛应用到农畜产品无损检测研究中[4, 5, 6]。 目前基于高光谱成像的肉品新鲜度检测研究围主要是决高光谱图像数据维数灾难、 非线性结构数据获取、 新鲜度评价模型准确性等, 包括光谱图像特征挖掘方法, 复杂非线性数据结构的核变化方法及新型分类器等等的研究[7]。 羊肉的腐败变质受多种因素影响, 是一个复杂的变化过程, 其新鲜度检测一般要从感官性状、 分解的理化产物特性和数量, 以及微生物污染繁殖程度等方面来综合分析, 采用单一某个指标很难综合反映羊肉的新鲜状况, 使得其评价模型适用性和鲁棒性差。

典型相关分析(canonical correlation analysis, CCA)[8]是一种挖掘相同或不同模式下多种来源数据线性关系的有效方法, 属于多视图学习方法。 该方法利用互补原理, 最大化多种数据之间的相关性, 将数据投影到低维空间, 达到减少数据之间的不确定性和增强识别能力的目的。 CCA与主成分分析(principle component analysis, PCA)[9]、 偏最小二乘法(partial least squares, PLS)[10, 11]类似属于全变量线性组合方法, 不适合挖掘非线性数据之间的相关性。 研究者将核方法引入典型相关分析, 提出核典型相关分析(kernel canonical correlation analysis, KCCA)[12, 13, 14], 在一定程度上取得了较为满意的分类精度, 但是CCA方法缺乏稀疏性使得对提取到的特征信息的解释较为困难, KCCA方法由于需要利用核函数对所有训练数据进行核空间投影, 对于高光谱成像数据需要花费大量的计算时间。

借助新鲜度多个指标的实验室测定和多视图数据融合理论, 提出一种基于稀疏表示的KCCA(sparse KCCA)方法用于羊肉高光谱成像数据的特征提取, 探讨羊肉新鲜度高光谱成像与多指标融合的无损检测方法。 通过对光谱训练数据核函数评估, 寻找KCCA方法的稀疏解, 建立光谱数据特征提取方法, 缩短构建羊肉高光谱成像数据特征空间的计算时间, 避免KCCA特征提取方法的过拟合, 提高羊肉高光谱数据分类识别的泛化能力和分类识别精度, 提高新鲜度无损检测的适用性和鲁棒性。

1 稀疏核典型相关分析特征提取方法
1.1 典型相关分析及其核化扩展

假定 {xi}i=1nRd, {yi}j=1nRdy分别为 xRdxyRdy原始空间中的n个0均值样本数据, 表示为 X=[x1, x2, , xn]Rdx×nY=[y1, y2, , yn]Rdy×n。CCA的目标是分别为数据集XY寻找两组基向量WxWy, 使得 WxTX和 WyTY之间的相关性达到最大, 即求相关系数 =WTxCxyWyWTxCxxWx·WTyCyyWy, 其中 Cxx=E[XXT]=XXTRdx×dx, Cyy=E[YYT]=YYTRdy×dy分别为X和Y的协方差矩阵, Cxy=E[XYT]=XYTRdx×dy为X与Y之间的协方差矩阵, 且有 Cxy=CTyx

通常, CCA可通过公式(1)的优化问题求解获得

maxWx, WyTrace(WTxXYTWy)s.t.WTxXXTWx=I,  WxRdx×lWTyYYTWy=I,  WyRdy×l(1)

其中, Wx=[wx1, wx2, , wxl], Wy=[wy1, wy2, , wyl]为权重向量矩阵, l为选取的典型变量数。

KCCA首先通过映射ϕ xϕ y将数据XY分别映射到高维特征空间ћ xћ y中, 数据XY变换为

Φx=[ϕx(x1), ϕx(x2), , ϕx(xn)]RNx×n(2)

Φy=[ϕy(x1), ϕy(x2), , ϕy(yn)]RNy×n(3)

其中, NxNy为数据XY在特征空间ћ xћ y的维数, 映射ϕ xϕ y通过正定核函数κ xκ y获得, 且满足

κx(x1, x2)=< ϕx(x1), ϕx(x2)> (4)

κy(y1, y2)=< ϕy(y1), ϕy(y2)> (5)

则原始数据经过非线性映射后得到的数据为

Kx=< Φx, Φx> =[κx(xi, xj)]i, j=1nRn×n(6)

Ky=< Φy, Φy> =[κy(yi, yj)]i, j=1nRn×n(7)

KxKy称为核矩阵或Gram矩阵, 则KCCA可通过式(8)的优化问题求解获得

maxWx, WyTrace(ΩTxKxKyΩy)s.t.ΩTxKx2Ωx=I,  ΩxRn×lΩTyKy2Ωy=I,  ΩyRn×l(8)

其中, Ω x=α 1, α 2, …, α l, Ω y=β 1, β 2, …, β l, α β 为数据在核空间ћ xћ y下的投影方向向量, 且满足

wx=Φxα=i=1nαiϕx(xi)(9)

wy=Φyβ=i=1nβiϕy(yi)(10)

1.2 核典型相关分析稀疏表示

r˙=rank(Kx), s˙=rank(Ky), m˙=rank(KxKy)KxKy的特征值分解结果为

Kx=UΠ1000UT=[U1 U2]Π1000[U1 U2]T=U1Π1UT1(11)

Ky=VΠǎ000VT=[V1 V2]Π2000[V1 V2]T=V1Π1VT1(12)

其中, URn×n, U1Rn×r˙, U2Rn×(n-r˙), Π1Rr˙×r˙, VRn×n, V1Rn×s˙, V2Rn×(n-s˙), Π2Rs˙×s˙. U和V为正交矩阵, Π 1 和Π 2为非奇异对角矩阵。 假定 U1TV1奇异值分解为

UT1V1=I1ΠIT2(13)

其中, I1Rr˙×r˙, I2Rs˙×s˙为正交矩阵, Π Rr˙×s˙为对角矩阵。 可证明对于1≤ l≤ min{ r˙, s˙}, 有

Ωx=U1Π1-1I1(:, 1:l)+U2εΩy=U1Π2-1I2(:, 1:l)+V2ε(14)

其中, εR(n-r˙)×lσR(n-s˙)×l

式(14)构成了式(8)的解子集, 可利用最小二乘法求解获得。

Γx=U1I1(:, 1:l), Γy=V1I2(:, 1:l), 1lm˙, 则式(8)解为

Ωx=arg min{KxΩx-ΓxF2:ΩxRn×l}(15)

Ωy=arg min{KyΩy-ΓyF2:ΩyRn×l}(16)

由文献[13]可知, 在式(15)和式(16)加入惩罚l1-范数, 获得Ω xΩ y的稀疏解, 同时利用惩罚项缓解KCCA算法求解过程中的过拟合问题。 式(15)和式(16)变换为

min12KxΩx-ΓxF2+i=1lλx, iΩx, i1s.t.ΩxRn×l(17)

min12KyΩy-ΓyF2+i=1lλy, iΩy, i1s.t.ΩyRn×l(18)

其中, λ x, iλ y, i为正则化参数, Ω x, iΩ y, i分别为第iΩ xΩ y

1.3 核典型相关分析稀疏表示求解

式(17)和式(18)的优化求解问题退化为基追踪降噪(basis pursuit de-noising, BPDN)问题。 有学者提出了多种求解方法, 其中定点延续法(fixed-point continuation, FPC)具有很好的收敛性, 因此采用FPC法求解式(17)和式(18)。 FPC法是一种迭代求解方法, 式(17)的迭代求解为

Ωx, ik+1=svx, i(Ωx, ik-ΓxKTx(KxΩx, ik-Γx, i))(19)

其中, svx, i为软阈值操作符, i=1, …, l, vx, i=Γ xλ x, i, 且Γ x> 0为迭代步长。 同理式(18)的迭代求解为

Ωy, ik+1=svy, i(Ωy, ik-ΓyKTy(KxΩy, ik-Γy, i))(20)

其中, vy, i=Γyλy, i, Γy> 0为迭代步长。

稀疏核典型相关分析(SKCCA)算法的伪代码如表1所示。

表1 稀疏核典型相关分析算法 Table 1 Sparse kernel canonical correlation analysis algorithm
2 冷鲜羊肉新鲜度评价试验
2.1 试验材料

试验所用羊肉样本取自锡林郭勒盟苏尼特右旗农贸市场, 当天屠宰的5只苏尼特羊外里脊部位新鲜样本, 使用冷藏箱保存运回实验室冰箱中。 在无菌操作台上去除脂肪和结缔组织后, 均匀分割成长× 宽× 高约为6 cm× 6 cm× 1 cm的肉片, 分3组采用保鲜袋密封包装、 编号, 冷藏于4 ℃环境中, 保存14 d。 其中, 2组用于新鲜度指标实验室检测试验, 1组用于高光谱数据采集。 每隔24 h取一次样本进行试验, 共采集70个能代表羊肉存放过程中的试验肉样新鲜度由新鲜、 次新鲜到不新鲜的样本。

每次试验时, 从冰箱中取出肉样, 在室内放置25分钟, 挥发掉肉样表面的水分, 分别用于挥发性盐基氮(total volatile basic nitrogen, TVB-N)、 菌落总数(total aerobic plate count, Tac)测定和光谱反射率采集。

2.2 新鲜度指标实验室测定

试验中羊肉样本的TVB-N指标采用半微量凯氏定氮法[15], 按照GB/T5009.44— 2003《肉与肉制品卫生标准的分析方法》进行测定。 每个样本的TVB-N测量3次, 最终以3次测量结果的平均值作为该样本的TVB-N测定值。 TAC指标按照GB4789.2— 2010《食品安全国家标准 食品微生物学检验 菌落总数测定》中的单位质量菌落总数标准值进行检测试验[16], 每个样本的菌落总数计数3次, 最后取平均值作为该次试验结果。

按照国家食品卫生检测标准与前人研究成果, 当TVB-N< 15 mg/100 g为新鲜肉, 15 mg/100 g< TVB-N< 25 mg/100 g为次新鲜肉, TVB-N> 25 mg/100 g为腐败肉[17, 18]。 目前, 我国食品卫生检测标准中尚未制定冷鲜羊肉的菌落总数指标, 需要在试验中探讨研究。 因此, 本文以TVB-N指标作为主要指标, 同时对照TAC指标测定值, 共同确定试验样本的新鲜度等级。

2.3 样本反射光谱采集与预处理

高光谱采集系统包括高光谱成像仪(Hyperspec VNIR N-Series、 400~1 000 nm、 750通道、 分辨率为2.8 nm, America)、 机械扫描平台、 光谱数据采集软件、 反射参考版和石英卤钨灯照明光源。 高光谱采集平台如图1所示。

图1 高光谱采集平台Fig.1 The hyperspectral acquisition platform

试验过程中摄像机和检测样本之间的距离调节在40 cm左右, 像元混合次数为6次。 为保证采集样品反射光谱率的最强吸收峰不饱和, 将高光谱相机的曝光时间设置约为3 ms, 调节光谱像元亮度(DN)值小于8 500。

由于照明光强分布不均匀和光谱摄像机暗电流的影响, 采集的光谱数据包含有噪声。 因此每次采集样本光谱数据前, 首先合上相机盖采集黑校正图像B, 然后取下相机盖, 用标准白板采集白校正图像W, 利用公式G=(I-B)/(W-B)获取校正光谱数据, I为采集的样本图像信号。

利用Matlab8.6软件从BIL文件中读取光谱数据, 并计算获得校正光谱。 为了避免检测样本脂肪、 结缔和筋腱组织, 以及残余水分发亮区域对采集数据的影响, 利用640, 549和458 nm三个波段校正后光谱数据构成样本RGB伪彩色图像, 通过观察图像, 选择无脂肪、 结缔和筋腱组织, 并且图像清晰, 亮度比较均匀的100× 100像素感兴趣区域(range of interest, ROI)作为特征提取和校正模型建立试验数据。 图2为部分感兴趣区域原始校正光谱反射DN值。

然后利用公式ρ =(IDN/WDNρ w计算ROI区域光谱反射率, 作为羊肉样本的光谱反射率。 其中, IDN为样本光谱DN值, WDN为白板DN值, ρ w为白板反射率, 白板反射率由实验室定标获得。

校正后的光谱反射率仍存在噪声, 需要对其进行预处理。 由图2中的光谱曲线可以看出校正后的光谱存在部分噪声, 且光谱强度有差异, 因此实验过程中先采用15点2次卷积平滑法(SavitZky-Golay)进行平滑滤波, 得到噪声小, 信噪比高的光谱曲线, 再采用多元散射校正对平滑滤波处理后的光谱数据进行处理, 消除光谱中的基线平移或偏移现象, 提高光谱信噪比, 并用于后期的特征提取和分类识别。

图2 部分感兴趣区域原始光谱反射DN值Fig.2 The part region of interest of original spectral reflection DN value

2.4 基于稀疏核典型相关分析的高光谱特征提取试验

试验中采用高斯核函数 K(x, y)=exp-12δ2x-y2对样本的光谱数据进行非线性变换, 参数δ 用来控制核的灵活性, 同时避免过度拟合问题。 具体试验中设置δ 为不同波段光谱信息之间的最短距离。

利用本文中提出的SKCCA方法提取羊肉样本光谱特征信息, 首先需要设置SKCCA优化问题求解的正则化参数{λ x, i}和{λ y, i}。 由上述分析可知SKCCA优化问题求解属于BPDN问题求解, 为了避免0解结果, 试验中选择

λx, i=γxKTxΓx, i, λy, i=γyKTyΓy, i

其中, i=1, …, l, 0< λ x, λ y< 1。

试验中采用Matlab开源软件FPC_BB[19]求解SKCCA中固定点连续(FPC)的BPDN优化问题, 并设置迭代精度为xtol=10-5, 最大迭代数为mxitr=104, 其他参数为缺省值。

2.5 羊肉新鲜度分类识别试验

为了提高光谱特征信息识别的准确率, 引入人工神经网络分析法对羊肉光谱特征信息进行分类识别。 多层感知器的误差反向传播神经网络(back propagation, BP)算法, 能够很好的实现非线性光谱特征的分类识别。

BP算法的输入层、 隐含层节点数和隐含层数对算法的性能影响较大。 输入层节点数少, 训练网络获取的信息就会少, 算法存在缺陷; 输入层节点数过多, 运算量就会增大。 隐含层层数多, 学习的精度会高, 但是会增加算法的复杂度, 造成网络权值的学习时间增加。 三层感知器能够判别任意复杂区域, 同时能够以任意精度逼近给定的任意函数。 因此, 试验中选用三层感知器BP神经网络进行高光谱特征信息的分类识别, 如图3所示。

试验中, 将SKCCA特征提取算法与BP神经网络算法相结合, 以SKCCA特征变量个数作为BP网络输入层节点数, 通过反复测试来确定最佳的隐含层节点数和隐含层数, 输出层节点数为3。

图3 羊肉光谱特征信息分类识别BP网络模型Fig.3 The BP network model for mutton spectral characteristics information

3 结果与讨论

通过实验室检测方法测定样本的TVB-N与TAC数据按照3:1比例分为校正集和预测集, 校正集和预测集的样本个数分别为53和17。 表2为TVB-N与TAC测定值的统计结果, 主要包括最大值、 最小值、 平均值和标准偏差。

表2 肉样TVB-N与TAC数据统计分析 Table 2 Statistical analysis of mutton TVB-N and TAC values

按照利用高光谱成像数据检测羊肉新鲜度的特定任务目标, 采用特征值曲线对SKCCA特征提取方法进行分析评价, 并与其他特征提取方法进行比较。

图4为冷鲜羊肉试验样本高光谱成像数据采用不同特征提取方法得到的特征值曲线。 对比这几种方法可得, 基于CCA的特征提取方法得到的特征值曲线下降速度比PCA特征提取方法获得的特征值曲线明显要快, 说明基于CCA的特征提取方法可有效地将高光谱成像数据包含的新鲜度指标信息映射到低维特征空间中。 KCCA特征值曲线起初下降速度快于CCA和PCA特征值曲线, 但到后期下降速度变慢, 并且出现波动现象。 说明采用KCCA方法特征提取时, 在特征空间维数较少的情况下, 能够有效的捕捉光谱图像的全局结构, 而在特征空间维数较多情况下, 能够捕捉多个不连续光谱图像数据的局部细节。 与其他方法相比较, 本工作提出的SKCCA特征提取方法的特征值曲线下降速度最快, 对冷鲜羊肉高光谱成像数据特征提取效果很明显, 对原始光谱成像数据表达能力强, 能够有效表达连续光谱特征数据。

为了加快BP网络训练速度, 提高模型的分类能力, 采用Broyden-Fletcher-Goldfarb-Shanno(BFGS)算法[20], 激发函数为Sigmod函数。 对与实验室新鲜度检测试验的70个样本对应的140个光谱数据经过预处理、 选择ROI区域, 提取光谱特征信息后, 同样选择53个实验室试验样本对应的106个特征光谱数据作为训练集, 输入BP神经网络分类模型, 对模型进行训练, 34个特征光谱数据作为测试样本进行预测。 根据特征信息提取结果设置网络输入层节点数, 同时设置隐含层节点数为输入层节点数的1~2倍, 输出层节点数为3, 初始学习速率取值范围为[0.5 0.9], 初始动量因子取值范围为[0 0.5], 动量因子自适应步长为0.001, 学习速率为0.01, 收敛误差为0.000 01。图5为SKCCA特征空间下对BP神经网络模型进行训练, 获得最佳网络模型, 并应用到测试数据集上的分类结果与实际值的对比图和误差变化图。

图4 不同特征提取方法的特征值曲线Fig.4 Eigenvalue curves of different feature extraction methods

图5(a)用“ 1” , “ 2” , “ 3” 分别代表新鲜、 次新鲜和不新鲜三个新鲜度等级, “ o” 表示样本的实际新鲜等级, “ +” 表示分类结果。 由图可以看出, 在本工作提出的SKCCA方法提取的特征光谱空间下, 大量“ +” 分布在“ o” 附近, 且“ +” 以簇形式分布的不明显, 说明SKCCA方法较CCA方法减少了平凡解, 能够获取光谱的全局结构信息。 图5(b)为分类结果误差变化图, 误差曲线在[-2 1]区间变化, 经过计算得到测试样本的分类结果均方根误差(RMSEC)为0.297。

为了进一步分析本工作提出的特征提取方法与神经网络构建的多个指标综合的新鲜度评价模型分类精度, 通过与常用特征提取方法, 包括PCA, CCA及其改进方法做实验对比, 表3为实验获得的不同特征空间下, 采用BP神经网络分类法得到的具体分类结果精度。

表3可知, 在原始特征空间下, 采用BP神经网络分类结果总体精度OA为0.503 6, Kappa系数为0.199 8, 实际值与分类值一致性较差, 分类结果精度较差。 在PCA特征空间下, 采用BP神经网络分类结果总体精度OA为0.786 9, Kappa系数为0.675 4, 实际值与分类值一致性一般, 分类结果精度一般。 在CCA和KCCA特征空间下, 采用BP神经网络分类结果总体精度OA分别为0.866 7和0.907 1, Kappa系数为0.791 8和0.885 8, 实际值与分类值一致性较好, 分类结果精度较好。 在SKCCA特征空间下, 采用BP神经网络分类结果总体精度OA为0.939 3, Kappa系数为0.906 0, 与其他几种方法相比较, 实际值与分类值一致性最好, 分类结果精度最好。

图5 SKCCA特征空间BP网络分类结果图Fig.5 The BP network prediction results graph of SKCCA feature space

表3 不同特征空间下采用自适应BP神经网络分类结果精度 Table 3 Accuracy of BP neural network classification results in different feature spaces

表4为冷鲜羊肉新鲜等级分类测试样本在SKCCA特征空间下, 采用自适应BP神经网络模型分类获得的混淆矩阵。

表4可知, 840冷鲜羊肉样本高光谱样本数据点中, 实际为新鲜的样本点数为180个, 次新鲜度的样本点数为360个, 不新鲜度样本点数为300个。 采用SKCCA方法进行特征提取, 在SKCCA特征空间下, 利用BP神经网络进行分类, 新鲜等级分类结果为190个, 次新鲜等级分类结果347个, 不新鲜等级分类结果为303个。 新鲜等级分类结果增加了10个, 次新鲜等级分类结果减少了13个, 不新鲜等级分类结果增加了3个。 说明新鲜等级和不新鲜等级样本检出结果提高了, 次新鲜等级样本检出结果降低了。

表4 SKCCA特征空间下冷鲜羊肉样本新鲜度分类混淆矩阵 Table 4 Chilled mutton sample freshness classification confusion matrix with SKCCA feature space

进一步分析混淆矩阵, 原本属于新鲜等级的样本通过分类后有4个样本点分类为次新鲜等级, 2个样本点分类为不新鲜等级。 原本属于次新鲜等级样本通过分类后有16个样本点分类为新鲜等级, 有15个样本点分类为不新鲜等级。 原本属于不新鲜等级样本通过分类后有14个样本点分类为次新鲜等级。

从冷鲜羊肉新鲜度变化来看, 冷鲜羊肉的腐败和新鲜度变化过程是一个渐进的过程, 冷鲜羊肉从新鲜等级变化到次新鲜等级和由次新鲜等级变化到不新鲜等级时, 光谱信息和两个新鲜度指标值比较接近, 采集到的光谱成像数据包含相似信息, 造成最终分类结果有误差。

从利用高光谱成像仪采集冷鲜羊肉样本光谱成像数据过程来看, 由于采集样本、 实验室环境不完全一致, 使得采集到的光谱对描述冷鲜羊肉样本的新鲜程度信息有误差, 最终导致分类结果有误差。

从本研究中提出的光谱特征提取算法分析, 通过一系列的处理和变换, 校正模型建立都有可能存在误差, 导致最终的分类结果有误差。

从本研究中提出的BP神经网络新鲜度等级评价模型分析, 通过多次训练建立特征光谱和标签之间的对应关系, 这是一种近似逼近的关系, 因此最终的评价结果精确存在误差。 同时采集到的冷鲜羊肉高光谱样本数据有限, 且三个新鲜度等级样本数量存在不平衡性现象, 对分类结果精度也会造成一定影响。

总的来说, 本研究中提出的光谱特征提取算法和BP神经网络新鲜度等级评价模型计算结果精度高, 具有一定的应用价值。

4 结 论

通过提取羊肉样本高光谱图像的感兴趣区域, 采用MSC和SG平滑法相结合的光谱预处理方法进行预处理。 在典型相关分析法的基础上, 对采集的羊肉高光谱成像数据进行核变换, 利用l1-范数获得稀疏特征解, 综合提取表征多个新鲜度指标信息的光谱特征信息, 同时缓解了求解过程中的过拟合问题。 利用提出的SKCCA特征提取方法结合BP神经网络算法建立高光谱成像数据的羊肉新鲜度无损检测模型, 实现多参数指标的羊肉新鲜度综合评价, 识别准确率达到93.93%。

该研究为进一步采用多指标分析评价羊肉新鲜度的建模提供了基础。 目前, 所训练获得的BP网络预测模型还有一定的误判率。 通过改进特征提取方法和分类识别模型的稳定性, 并通过优化参数, 有望建立更好的羊肉新鲜度等级评价模型。

The authors have declared that no competing interests exist.

参考文献
[1] ZHOU Yan-bing, AI Qi-jun, ZHANG De-quan(周琰冰, 艾启俊, 张德权). Food Science(食品科学), 2015, 36(6): 242. [本文引用:1]
[2] WANG Li, MA Tian-lan, HE Xiao-guang, et al(王莉, 马天兰, 贺晓光, 等). Science and Technology of Food Industry(食品工业科技), 2017, 22: 235. [本文引用:1]
[3] WANG Wan-jiao, WANG Song-lei, HE Xiao-guang, et al(王婉娇, 王松磊, 贺晓光, 等). Science and Technology of Food Industry(食品工业科技), 2015, 36(20): 77. [本文引用:1]
[4] XUE Jian-xin, ZHANG Shu-juan, ZHANG Jing-jing(薛建新, 张淑娟, 张晶晶). Transactions of the Chinese Society of Agricultural Engineering(农业工程学报), 2015, 31(11): 300. [本文引用:1]
[5] ZHAO Ming-fu, LIU Zi-di, ZHOU Xue, et al(赵明富, 刘自迪, 邹雪, 等). Laser Journal(激光杂志), 2016, 37(3): 20. [本文引用:1]
[6] ZHAO Juan, PENG Yan-kun(赵娟, 彭彦昆). Transactions of the Chinese Society of Agricultural Engineering(农业工程学报), 2015, 31(7): 279 [本文引用:1]
[7] WANG Yue-ming, JIA Jian-xin, HE Zhi-ping, et al(王跃明, 贾建鑫, 何志平, 等). Journal of Remote Sensing(遥感学报), 2016, 20(5): 850 [本文引用:1]
[8] Hotelling H. Biometrika, 1936, 28(3/4): 321. [本文引用:1]
[9] SUN Kang, GENG Xiu-rui, TANG Hai-rong, et al(孙康, 耿修瑞, 唐海蓉, ). Bulletin of Surveying and Mapping(测绘通报), 2015, (1): 105. [本文引用:1]
[10] YANG Xiao-yu, DING Jia-xing, FANG Meng-meng, et al(杨晓玉, 丁佳兴, 房盟盟, ). Food & Machinery(食品与机械), 2017, 33(11): 131. [本文引用:1]
[11] ZHAO Mao-cheng, YANG Jun-rong, LU Dan-dan, et al(赵茂程, 杨君荣, 陆丹丹, ). Transactions of the Chinese Society for Agricultural Machinery(农业机械学报), 2017, 48(9): 318. [本文引用:1]
[12] Aronszajn N. Transactions of the American Mathematical Society, 1950, 68(3): 337. [本文引用:1]
[13] Bach F R, Jordan M I. Journal of Machine Learning Research, 2002, 3: 1. [本文引用:2]
[14] Tibshirani R. Journal of the Royal Statistical Society, 1996, 58(3): 267. [本文引用:1]
[15] Stand ardization Administration of the People’s Republic of China(中国国家标准化管理委员会). GB/T5009. 44—2003 Method for Analysis of Hygienic Stand ard of Meat and Meat Products(GB/T5009. 44—2003 肉和肉制品卫生标准的分析方法), 2003. [本文引用:1]
[16] Ministry of Health, the People’s Republic of China(中华人民共和国卫生部)GB 4789. 2—2010 National Food Safety Stand ard Food Microbiological Examination: Aerobic Plate Count(GB 4789. 2—2010 食品安全国家标准 食品微生物学检验 菌落总数测定), 2010. [本文引用:1]
[17] Stand ardization Administration of the People’s Republic of China(中国国家标准化管理委员会)GB 2707—2005 Hygienic Stand ard for Fresh (frozen) Meat of Livestock(GB 2707—2005 鲜(冻)畜肉卫生标准). 2005. [本文引用:1]
[18] ZHANG Lei-lei, PENG Yan-kun, TAO Fei-fei, et al(张雷蕾, 彭彦昆, 陶斐斐, ). Journal of Food Safety & Quality(食品安全质量检测学报), 2012, 3(6): 575. [本文引用:1]
[19] Hale E T, Yin, W, Zhang Y. A Fixed-Point Continuation Method for l-Regularized Minimization with Applications to Compressed Sensing. 2007, CAAM Technical Report TR07-07. [本文引用:1]
[20] Kou C X, Dai Y H. Journal of Optimization Theory and Applications, 2015, 165(1): 209 [本文引用:1]