作者简介: 徐子洋, 1998年生, 内蒙古农业大学计算机与信息工程学院博士研究生 e-mail: imauxzy@163.com
冷鲜羊肉新鲜度受多种因素影响, 可通过多个理化和微生物指标综合评价。传统检测方法操作复杂、 效率低。高光谱成像作为一种快速且非破坏性的检测技术, 可以有效地检测冷鲜羊肉新鲜度改变过程中不同成分的变化。为了研究采用高光谱成像技术实现冷鲜羊肉新鲜度多指标评价的可行性, 提出一种改进人工神经网络算法, 通过重新定义损失函数加强标记之间的相关性, 充分采用多个新鲜度指标对冷鲜羊肉新鲜度分类。试验收集了0~14 d冷鲜羊肉样本在400~1 000 nm范围的高光谱图像, 采用实验室方法测定挥发性盐基氮(TVB-N)、 pH值、 菌落总数(TAC)和大肠菌群近似数(ANC)指标值。通过S-G平滑滤波法和多元散射校正对冷鲜羊肉样本原始光谱数据进行预处理, 采用连续投影法(SPA)选择光谱数据的18个特征波长作为输入数据, 采用所提出的改进人工神经网络算法建立多指标冷鲜羊肉新鲜度等级模型。结果表明, 改进人工神经网络对测试集的分类准确率达96%, 三个新鲜度等级样本的识别率分别为100%、 89.28%和98.68%, 采用汉明损失(hamming loss)、 1-错误率(one-error)、 排序损失(ranking loss)和覆盖率(coverage)四种多标记模型指标进行评价, 评价指标分别为0.008、 0.002、 0.0025和4.048。改进人工神经网络分类模型的准确率和各项模型评价指标均优于传统ANN, 证明改进人工神经网络用于多指标冷鲜羊肉新鲜度的无损检测具有可行性。
The freshness of chilled mutton is influenced by various factors and can be comprehensively evaluated through multiple physical, chemical, and microbiological indicators. Traditional testing methods are complex and inefficient. Hyperspectral imaging technology, as a rapid and non-destructive detection technique, can effectively detect the changes in different components during the freshness variation of chilled mutton. To study the feasibility of using hyperspectral imaging technology for the multi-indicator evaluation of chilled mutton freshness, this paper proposes an improved artificial neural network (ANN) algorithm that enhances the correlation between labels by redefining the loss function and fully utilizes multiple freshness indicators to classify the freshness of chilled mutton. Experimental high-spectral images were collected for chilled mutton samples from 0 to 14 days in the 400 to 1 000 nm range. Laboratory methods were used to determine the values of total volatile basic nitrogen (TVB-N), pH value, total aerobic count (TAC), and an approximate number of coliforms (ANC) indicators. The original spectral data of chilled mutton samples were preprocessed using the S-G smoothing filter and multivariate scatter correction. The continuous projection algorithm (SPA) was used to select 18 feature bands of the spectral data as input data, and the proposed improved ANN algorithm was employed to establish a multi-indicator chilled mutton freshness grading model. The results showed that the improved ANN achieved a classification accuracy of 96% on the test set. The recognition rates for the three freshness levels of the samples were 100%, 89.28%, and 98.68%, respectively. The model was evaluated using four multi-label model evaluation metrics: Hamming loss, one-error, ranking loss, and coverage. The corresponding evaluation scores were 0.008, 0.002, 0.002 5, and 4.048, respectively. The accuracy and various model evaluation metrics of the improved ANN classification model were superior to those of traditional ANN, demonstrating the feasibility of using the improved ANN for non-destructive detection of multi-indicator chilled mutton freshness.
冷鲜羊肉作为肉类食品中重要的组成部分, 含有丰富的蛋白质、 脂肪和微量元素, 营养、 口感和色泽优于冷冻肉, 近几年越来越受到消费者的欢迎。羊肉营养物质丰富, 在加工、 贮藏、 运输和销售等流通过程中很容易腐败, 发生食品安全问题。新鲜度是对肉品的感官特征、 理化分解产物的数量和特性, 以及微生物污染繁殖程度的反映, 可用于综合评价冷鲜羊肉的营养性、 安全性和嗜好性等食用品质和安全品质。很多专家学者研究无损检测方法实现肉品新鲜度定性[1]、 定量分析[2], 如机器视觉[3]、 可见光/近红外光谱技术[4]等, 取得了丰硕的成果[5]。
高光谱成像(hyperspectral imaging, HSI)是融合了传统光谱学和计算机视觉的新型无损检测技术[6]。具有波长连续、 分辨率高和图谱合一等优点, 符合无损检测向多源信息融合研究方向发展, 被广泛应用于农畜产品品质检测研究中[7, 8]。图1(a, b, c)分别表示使用高光谱成像技术采集的冷鲜羊肉样本在图像空间和波谱空间的对应关系, 红色曲线表示羊肉脂肪的像元亮度值(digital number, DN), 白色曲线表示羊肉瘦肉的DN值, 在不同的波长下脂肪的DN值始终高于瘦肉的DN值, 方便进行后续的数据分析, 故采用该技术可以有效区分出羊肉的内部成分。
![]() | 图1 冷鲜羊肉高光谱图像 (a): 图像空间; (b): ROI光谱空间; (c): 波谱空间Fig.1 Hyperspectral image of chilled mutton (a): Image space; (b): ROI spectral space; (c): Spectrum space |
高光谱成像技术逐渐应用到食品检测领域, 高光谱的高分辨率特性使其能够在连续波长下快速、 准确地区分出冷鲜肉的物理化学性质[9]。高光谱可以从多方面特征对冷鲜肉进行分析和检测, 如冷鲜肉表面的纹理、 色泽等; 内部成分如挥发性盐基氮(total volatile basic nitrogen, TVB-N)、 pH和含水量等; 微生物生长繁殖情况, 如菌落总数(total aerobic count, TAC)、 大肠菌群近似数(approximate number of coliforms, ANC)等信息。张钰等[10]通过高光谱成像系统测定羊肉TVB-N含量并划分样本新鲜度类别。使用分类回归决策树(classification and regression tree, CART)模型和基于反向传播的人工神经网络(back-propagation artificial neural network, BPANN)模型作为分类器, 结果表明CART对预测集的平均分类准确率为91.67%, BPANN对预测集的平均分类准确率为83.33%, 证明高光谱成像技术结合CART算法可有效提高判别精度。高光谱成像技术也可以与其他无损检测技术结合, 构建多模态数据, 增加数据特征, 提高模型性能。Wan等[11]将高光谱图像与羊肉纹理数据融合构建腌制羊肉中肌红蛋白含量的预测模型。结果表明, 结合光谱和纹理参数的最小二乘支持向量机模型性能优于其他模型, 为后续的研究提供了一种数据融合方法。由于高光谱图像数据维度大, 冗余高等特点, 使得特征提取、 模型建立等成为HSI的难点。因此, HSI结合深度学习模型可以更有效地分析羊肉品质。Liu等[12]将电子鼻与高光谱图像结合, 通过构建卷积神经网络对羊肉TVB-N含量进行预测, 预测集的均方根误差和相关系数分别为3.039和0.92。结果表明, 神经网络中的非线性特征提取方法能够增强对羊肉中TVB-N含量的预测效果。
冷鲜肉的腐败变质受理化分解产物和微生物生长繁殖的影响, 而且腐败变质是一个渐进过程, 在发生复杂变化的同时还会受到环境或其他外界因素的影响。研究人员以往的策略大部分是针对某一指标进行检测或分别对多个指标建立多个新鲜度评价模型。缺乏全面性, 某些评价指标的适用范围也存在局限性。使用多个检测指标并通过分析其相关关系来综合评价冷鲜羊肉新鲜度具有重要意义。
针对上述问题, 提出了一种改进的人工神经网络算法, 构造多标记特征学习误差函数, 改进神经网络学习过程, 挖掘标记之间、 标记与光谱之间的相关关系, 建立多指标分类分析模型, 用于冷鲜羊肉新鲜度无损检测中。改进后的算法能够充分提取样本数据中包含的多个指标的新鲜度评价信息, 同时特征信息具有较好的类内紧性和类间可分性。该算法提高了羊肉新鲜度无损检测的适用性和鲁棒性, 为多指标肉类无损检测提供了新思路。
多标记学习[13]是多语义学习建模方法, 用一组特征描述每个实体对象, 具有多个类别标记, 如生物学中某一种基因可以决定多种生物性状, 一条新闻可以被归纳到多个主题中, 一张城市照片上可以有多个物体等。多标记学习的目的是学习一个映射函数C: X→ {0, 1}l, 其中l为标记数。该函数可以将所属的类别标记赋予待分类对象, 综合反映对象的本质属性[14]。假设l=3, C可能的输出为{0, 1, 0}, 其中1表示属于该对象的标记, 0表示不属于该对象的标记。计算过程如下。
用X={x1, x2, …, xn}表示样本空间, Y={y1, y2, …, ym}表示标记集合, 假设给定训练集T={(x1, Y1), (x2, Y2), …, (xn, Yn)}(xi∈ X, Yi⊆Y), Yi为xi的相关标记集合,
分类模型首先会学习一个实值函数f: X→ [0, 1]l, 该实值函数可以看作标记在样本上的置信度, 对实值函数f进行划分, 即C(xi)={y | f(xi, y)> t(xi), y∈ Y}, t(xi)为阈值函数, 可设置为0.5常量, 大于0.5的输出为1, 小于等于0.5的输出为0。阈值函数也可以从训练数据中进行推算。经过以上步骤, 可以得到一个分类器C(x)={C(x1), C(x2), …, C(xn)}, 预测值C(xi)是Y的子集, 也是样本xi的相关标记集。
人工神经网络(artificial neural network, ANN)是一种模仿生物神经网络结构和功能的非线性数据建模方法。可以用以建立输入和输出之间的复杂关系模型, 也可以探索数据之间的关系模式[16]。ANN有很多种, 如多层前馈神经网络[17]、 径向基函数网络[18]和自组织特征映射网络等。
采用传统的多层前馈神经网络研究多标记学习问题。前馈神经网络的学习是一个不断优化的过程, 其目的是找到合适的参数以最小化误差函数。误差函数通常是网络输出值和目标值之间的均方根误差函数。目前最流行的最小化误差函数方法是反向传播算法, 是前馈网络学习和存储输入-输出模式映射关系的核心。该算法使用梯度下降规则将输出层误差依次传播回输入层, 不断调整网络中各神经元的权重, 使网络的输出值与目标值之间的误差达到最小值[19]。
若使用传统的前馈神经网络解决多标记分类问题, 需要考虑标记之间的相关性, 不能使用简单的均方根误差函数来捕捉多标记学习的特征, 因此有必要设计一个误差函数加强模型对不同标记的识别能力。在设计误差函数的同时, 需要改进最小化误差方法以适应新的误差函数。
设Y为标记集合, Yi为某一样本的标记,
对于第i个样本, k是该样本的相关标记, l是该样本的不相关标记,
式(1)可得神经网络学习总误差为式(2)
图3为改进后的神经网络学习过程, 包括正向传播和反向传播。
在正向传播学习过程中, 神经网络会根据给定的输入和当前权重计算最终输出结果。假设输出层中第j个神经元的输出为cj, 则
式(3)中, θ j为输出层的偏置, 激活函数f为双曲正切函数
netcj为输出层第j各神经元的输入数据, 即对隐藏层各神经元的输出进行加权求和如式(5)所示, 其中M为隐藏层神经元的数量, wsj为隐藏层到输出层之间的权重矩阵
bs为隐藏层第s个神经元的输出
式(6)中, γ s为隐藏层的偏置, netbs为隐藏层第s个神经元的输入数据。netbs由输入层各神经元的输出通过加权求和得到如式(7), 其中d为输入层神经元的数量, vhs为输入层到隐藏层之间的权重矩阵。
式(7)中, ah为输入层第h个神经元的输出, 同时也是一条输入数据的第h个特征值。
在误差反向传播学习阶段, 误差从输出层逐层反向传播, 通过梯度下降法更新各层之间的权重, 即用每一次输入样本的输出误差对权重求偏导数, 输出层和隐藏层的权重更新公式为
式(8)中, α 为学习率, 取值范围为0~1。wsj为隐藏层到输出层的权重, vhs为输入层到隐藏层的权重, 每输入一个样本便更新一次权重。将输出层第j个神经元的误差定义为dj, 见式(9)
由式(3)可得式(10)
由于
由于输出层神经元数量对应样本的标记数量, 第j个神经元存在两种情况, 一种是属于样本的相关标记集合, 另一种是属于样本的不相关标记集合。同理, 将隐藏层中第s个神经元的误差定义为式(12)
将式(5)和式(9)代入式(12), 得式(13)
对式(8)中Δ wsj进行分解, 与式(5)和式(9)联立, 解得式(14)
对式(8)中Δ vhs进行分解, 与式(12)和式(7)联立, 解得到式(15)
将隐藏层和输出层的偏置分别定义为θ j和γ s, 设置偏置的更新值为式(16)
在每一次迭代中, 所有训练样本都将逐一反馈给网络, 对于每个样本(xi, Yi), 根据式(14)—式(16)更新权重和偏置, 再将(xi+1, Yi+1)反馈给网络。在反馈所有样本后, 将获得全局误差E。如果迭代次数为n, 则存在一个长度为n的数组, 在每次迭代后, 最新的E被添加到数组中, 数组中的最小值被记录为E_best。如果全局误差连续三次大于E_best, 则停止迭代, 保留E_best和当前的迭代次数, 删除数组中E_best之后的元素。这种方法可以有效地减少过拟合的风险。
多标记学习模型的性能评价指标不同于单标记学习模型中的准确率、 精确率和召回率等指标, 多标记模型的评价指标注重标记等级的排序, 常用的多标记学习模型评价指标有汉明损失(Hamming loss)、 1-错误率(One-error)、 排序损失(Ranking loss)和覆盖率(Coverage)等[20]。将采用以上四种评价指标对用于冷鲜肉新鲜度评价的改进后的ANN算法进行评价。
hamming loss用于计算样本被错误分类的次数, 值越小, 证明模型性能越好, 计算公式如式(17)
式(17)中, N为样本数, Q为标记总数, h(xi)⊗Yi为实际输出的标记集与期望输出的标记集的异或运算。
one-error用于计算高等级标记不在样本真实标记集中的次数, 值越小, 模型性能越好, 计算公式如式(18)
式(18)中, arg maxf(xi, y)为神经网络输出的最大概率值。
Ranking loss用于统计相关标记的预测可能性比不相关标记的可能性要小的次数, 该值越小, 模型性能越好, 当该值等于0时, 模型性能最理想, 计算公式如式(19)
式(19)中, Di={(y1, y2)|f(xi, y1)< f(xi, y2), (y1, y2)∈ Yi×
Coverage表示为了覆盖所有相关标记所要搜索的深度, 该值越接近4, 说明模型性能越好, 计算公式如式(20)
式(20)中, rankf(xi, y)为f(xi, y)在标记集上的映射, f(xi, y)的值越大, 位置越靠前。
试验所用冷鲜羊肉样本取自内蒙古锡林郭勒盟苏尼特右旗农贸市场, 选择屠宰后经过排酸的5只羊酮体里脊部位, 去除脂肪和结缔组织, 均匀分割成6 cm× 6 cm× 1 cm的肉片, 用保鲜袋分3组密封包装、 并编号, 无挤压放置在温度为4 ℃的冰箱中, 存放14 d。每隔24 h取一次样本, 在室内放置25 min, 挥发掉样本表面的水份, 用于挥发性盐基氮(TVB-N)、 酸碱度(pH值)、 菌落总数(TAC)、 大肠菌群近似数(ANC)测定和光谱数据采集。
试验中样本的TVB-N含量依据GB/5009.228—2016《食品安全国家标准食品中挥发性盐基氮的测定》中的半微量凯氏定氮法测定[21], pH值依据GB/5009.237—2016《食品安全国家标准食品pH值的测定》中的非均值化试样法测定[22], TAC含量依据GB/4789.2—2022《食品安全国家标准食品微生物学检验菌落总数测定》中的单位质量TAC标准值进行测定[23]。ANC含量依据GB/4789.3—2016《食品安全国家标准 食品微生物学检验 大肠菌群计数》中的单位质量ANC标准值进行测定[24]。
根据国家食品卫生监测标准和已有研究成果, 当TVB-N≤ 15 mg· (100 g)-1时, 为新鲜肉; 当15 mg· (100 g)-1< TVB-N≤ 25 mg· (100 g)-1时, 为次新鲜肉; 当TVB-N> 25 mg· (100 g)-1时, 为不新鲜肉。图4为冷鲜羊肉样本在14 d内四项指标的变化趋势, 由图4(a), 1~3 d为贮藏初期, 羊肉的TVB-N值小于15 mg· (100 g)-1, 表明羊肉处于新鲜状态; 4~9 d为贮藏中期, 羊肉的TVB-N值处于15和25 mg· (100 g)-1之间, 表明羊肉为次新鲜状态; 10~14 d为贮藏后期, TVB-N值大于25 mg· (100 g)-1, 表明羊肉已经腐败。
由图4(b)可知, 贮藏初期, 羊肉pH值持续降低, 由于贮藏初期羊肉肌肉中的糖原会酵解产生乳酸, 三磷酸腺苷分解成磷酸, 乳酸和磷酸的积累会使pH值降低。贮藏中期, 随着羊肉自溶现象的发生, 蛋白质会分解产生碱性物质, 促使pH值上升。贮藏后期, 微生物的繁殖速度越来越快, 羊肉本身的糖原酵解等作用, 使羊肉组织被破坏, pH上升速率变缓。pH的变化从侧面反映了羊肉内部理化变化情况和微生物活跃程度。
如图4(c)和(d), TAC和ANC含量随贮藏时间的增加均呈现上升趋势, 与TVB-N和pH值的变化趋势一致。根据GB/T9961—2008《鲜、 冻胴体羊肉》中规定鲜羊肉的TAC含量应小于5× 105 CFU· g-1 [25], 本研究中的样品在前4天均符合该标准。考虑到不同指标划分的新鲜度区间存在1~2 d的差异, 以TVB-N为主, 同时对照pH值、 TAC和ANC指标测定值共同确定样本的新鲜度等级。
高光谱采集系统主要包括高光谱成像仪(Hyperspec VNIR N-series)、 照明光源、 扫描平台、 反射参考板, 以及采集软件。光谱仪波长范围为400~1 000 nm, 共有750个通道, 分辨率为2.8 nm。采集平台如图5所示。
每次采集时, 提前30 min打开光谱仪预热, 设置像元混合次数为6, 调节光谱仪曝光时间使得光谱像元亮度(DN)值曲线的峰值保持约8 500。
将黑白条纹调焦板放置在距离光谱仪镜头30 cm处, 观察计算机上的高光谱图像采集界面, 通过调节光谱仪镜头焦距, 将模糊的黑白调焦板光谱图像调整为黑白分明清晰的光谱图像。
焦距调节后, 将光谱仪镜头盖盖上, 点击采集软件中的“ 暗电流” 按钮, 暗电流测量完毕后取下镜头盖, 采集软件生成黑校正光谱图像文件。将光谱仪镜头对准白板, 保证光线可以均匀照射白板, 点击采集软件中的“ 参比” 按钮, 待参比测量后生成白校正光谱图像文件。
将待测样本放到采集台上, 设置光谱仪扫描方向、 次数和移动速度等参数, 即可开始采集。考虑到照明设备的耐久度和羊肉样本中水分的流失, 每次采集一组光谱数据后, 可以将照明设备关闭一段时间再开始另一组的光谱数据采集, 并重复上述流程, 两组中选取采集效果较好的一组作为后续处理的光谱图像文件。图6为实验样本原始光谱DN值曲线图。
由图6可以看出原始光谱曲线存在部分噪声, 且光谱强度有差异。S-G平滑滤波方法可以去除光谱数据的噪声并保持光谱信息的形状和宽度不变。在波谱图像上, 处理后的光谱曲线明显更平滑。该方法的窗口大小与平滑效果直接相关, 窗口取值过大会导致丢失光谱信息; 取值过小容易产生新的噪声, 反向优化光谱数据。设置导数阶数为2, 窗口大小为15。由于羊肉表面颗粒分布不均匀, 会产生散射效应, 使用S-G平滑滤波法处理后的光谱数据仍然存在光谱基线漂移的现象, 因此使用多元散射校正法对光谱数据进行校正。经过平滑滤波和散射校正后的光谱曲线如图7所示。
两种预处理方法的侧重点不同, S-G平滑滤波法侧重于纵向处理光谱噪声, 多元散射校正法侧重于横向消除光谱强度差异, 两种方法结合可以有效提高光谱信噪比, 提高冷鲜羊肉光谱数据的质量, 用于后期的特征选择和模型建立。
由于采集的冷鲜羊肉样本光谱数据波长数为125, 若将全部波长作为训练的特征波长会增大模型的计算复杂度, 同时与新鲜度指标相关性较低的波长也会影响模型的分类结果。因此, 需要对高光谱图像进行降维, 减少样本数据中的冗余信息。降维方法可分为基于特征提取的方法和基于特征选择的方法。特征选择是指从一组原始特征中选择出与模型指标相关的特征子集, 去掉无关特征[26]。常用的特征选择方法包括连续投影法、 Pearson相关系数和遗传算法等。特征提取是将原始数据从高维空间映射到低维空间中, 将原始特征重新构建为新的特征表示。常用的特征提取方法包括主成分分析、 线性判别分析等。但特征提取方法改变了原本的特征空间, 在高光谱数据中提取的特征无法表示对应的波段。因此, 试验采用连续投影法对125个波长进行特征波长选择, 设置特征波长个数范围为5~30个, 以四种新鲜度评价指标作为标记, 分别提取了13、 10、 11、 10个波长, 分别如图8(a—d)所示。
![]() | 图8 各新鲜度评价指标选择的特征波长数量Fig.8 Number of characteristic bands selected for each freshness evaluation indicator |
将选择出的四类波长组合起来, 删除其中的重复波长。如图9所示。图中蓝色曲线代表冷鲜羊肉平均光谱值, 经过归一化其范围在-1到1之间; 红色方块代表选择的特征波长, 其范围在0到125之间, 共18个特征波长。
参考相关文献及前人研究成果, 490 nm附近的波长与肌红蛋白吸收相关, 545 nm附近的波长与血红蛋白吸收相关, 933和976 nm两处波长可能与C—H键振动的第三泛音和O—H键振动的第二泛音相关[27]。后续实验将SPA选择的18个特征波长作为输入数据特征进行新鲜度分类模型的建立。
使用改进的ANN建立多指标冷鲜羊肉新鲜度分类模型, 共采集700个光谱样本, 其中新鲜、 次新鲜和不新鲜的样本个数分别为150、 300和250个。使用分层采样的方法, 将数据集按2.5∶ 1的比例划分为训练集和测试集, 分别含有500个和200个不同新鲜度样本, 如表1所示。
![]() | 表1 冷鲜羊肉不同新鲜度样本数统计 Table 1 Sample number statistics of different freshness of chilled mutton |
将实验测得的TVB-N、 pH、 TAC和AVC四项新鲜度评价指标按照国家食品卫生检测标准和前人的研究成果, 分别划分出新鲜、 次新鲜和不新鲜区间, 并组成标记, 图10为建立新鲜度分类模型所用的冷鲜羊肉样本标记。
其中三种不同的颜色对应三个新鲜度等级, 绿色表示新鲜区间, 黄色表示次新鲜区间, 红色表示不新鲜区间。新鲜度分类模型中的所有标记均按照此规则产生, 若将其视为一个长度为12的数组Z。当样本新鲜度为新鲜时, 绿色单元格所在的标记为属于该样本的标记, 其数组为[1, 0, 0, 1, 0, 0, 1, 0, 0, 1, 0, 0]; 当样本新鲜度为次新鲜时, 橙色单元格所在的标记为属于该样本的标记, 其数组为[0, 1, 0, 0, 1, 0, 0, 1, 0, 0, 1, 0]; 当样本新鲜度为不新鲜时, 红色单元格所在的标记为属于该样本的标记, 其数组为[0, 0, 1, 0, 0, 1, 0, 0, 1, 0, 0, 1]。
在新鲜度等级分类过程中, 若四项新鲜度评价指标含量都处于新鲜区间, 则表明样本为新鲜; 若其中一项或多项处于次新鲜区间, 则表明样本为次新鲜; 若其中一项或多项处于不新鲜区间, 则表明样本为不新鲜。
构建的用于多指标新鲜度评价模型的神经网络结构如下图11所示。根据SPA特征波长选择方法得到的18个特征波长, 将神经网络输入层神经元数量设置为18。按照图10中的标记个数, 将神经网络输出层神经元数量设置为12; 设置隐藏层数为1, 隐藏层神经元数量需要通过实验进一步确定。
使用汉明损失、 1-错误率、 排序损失和覆盖率四个评价指标对提出的多指标冷鲜羊肉新鲜度分类模型进行评价。实验过程中分别设置隐藏层神经元个数为输入层神经元个数的20%、 40%、 60%、 80%和100%, 得到模型的四项评价指标值, 如表2所示。
![]() | 表2 不同隐藏层神经元的改进ANN模型性能 Table 2 The improved ANN performance with different number of hidden layer neurons |
由表2可知, 当隐藏层神经元个数为输入特征个数的20%时, One-error与其他不同隐藏层神经元数的实验结果值基本一致, Hamming Loss、 Ranking Loss和Coverage实验结果值均为最小, 说明模型性能最好, 故将隐藏层神经元数确定为18× 0.2≈ 4。进一步比较改进ANN算法和传统ANN算法的分类效果。
试验设置测试集中新鲜样本数为40个, 次新鲜样本数为84个, 不新鲜样本数为76个。模型分类结果统计如表3所示, 改进ANN算法建立的冷鲜羊肉多指标新鲜度分类模型的三个新鲜度等级样本分类结果分别为40、 75和75个, 分类准确率分别为100%、 89.3%和98.7%, 平均分类准确率为96%。传统ANN模型的三个新鲜度等级的样本分类结果为40、 70和74个, 准确率分别为100%、 83.3%和97.4%, 平均准确率为93.56%。相比传统ANN算法, 改进ANN算法建立的分类模型平均准确率提高了2.44%。
![]() | 表3 两种ANN模型分类结果统计 Table 3 Statistics of two ANN models classification results |
图12和图13分别为改进ANN和传统ANN在隐藏层神经元数为3, 学习率为0.1时的测试集分类结果混淆矩阵。图12中模型在分类过程中产生了一定的误差, 有9个实际新鲜度等级为次新鲜的样本点被分类为不新鲜, 有1个实际新鲜度等级为不新鲜的样本点被分类为次新鲜。由图13可知, 有14个实际新鲜度等级为次新鲜的样本被分类为不新鲜, 有2个实际新鲜度等级为不新鲜的样本被分类为次新鲜。
改进ANN模型和传统ANN模型对于次新鲜样本的召回率分别为0.892 9和0.833 3, 精确度为0.986 8和0.972 2, F1-Score为0.937 5和0.897 4; 对于不新鲜样本的召回率分别为0.986 8和0.973 7, 精确度为0.892 9和0.840 9, F1-Score为0.937 5和0.902 4。所提出的改进ANN模型的分类性能在各评价指标上均优于传统ANN模型。
以冷鲜羊肉为研究对象, 通过高光谱成像系统采集冷鲜羊肉的光谱图像, 结合多种实验室方法测定冷鲜羊肉新鲜度下降过程中TVB-N、 pH、 TAC和ANC含量, 采用S-G平滑滤波法和多元散射校正法对原始光谱图像进行预处理, 使用连续投影法选择特征波长, 最后通过改进人工神经网络建立冷鲜羊肉新鲜度分类模型, 模型取得了较好的分类结果。为解决传统ANN模型收敛速度慢且在多标记分类问题上预测准确率低的问题, 本研究将指数函数嵌入到ANN算法中, 改进了传统的均方误差函数, 充分考虑了多标记学习特征。引入自适应迭代次数, 有效控制模型复杂度, 最终构建出适用于多标记分类问题的ANN模型。研究结果表明, 改进ANN模型在测试集上的分类准确率为96%, 比传统ANN模型提高了2.44%。Hamming loss、 One-error、 Ranking loss和Coverage四项多标记评价指标分别达到了0.008 0、 0.002 0、 0.002 5和4.048 0, 改进ANN模型在训练时的收敛速度有明显提高。本研究从多个指标综合评价了冷鲜羊肉新鲜度, 改善了单一新鲜度检测指标模型的局限性, 为后续高光谱成像技术的多指标无损检测提供了研究方法。
[1] |
|
[2] |
|
[3] |
|
[4] |
|
[5] |
|
[6] |
|
[7] |
|
[8] |
|
[9] |
|
[10] |
|
[11] |
|
[12] |
|
[13] |
|
[14] |
|
[15] |
|
[16] |
|
[17] |
|
[18] |
|
[19] |
|
[20] |
|
[21] |
|
[22] |
|
[23] |
|
[24] |
|
[25] |
|
[26] |
|
[27] |
|