苹果早期瘀伤的近红外光谱和多波段相机成像检测
杨增荣1,2, 王怀彬1,2, 田密密1,2, 李军会1,2, 赵龙莲1,2,*
1.中国农业大学信息与电气工程学院, 北京 100083
2.现代精细农业系统集成研究教育部重点实验室, 北京 100083
*通讯作者 e-mail: zhaolonglian@aliyun.com

作者简介: 杨增荣, 1997年生, 中国农业大学信息与电气工程学院硕士研究生 e-mail: yangsi202102@163.com

摘要

苹果早期轻微瘀伤是影响苹果品质的重要因素。 早期轻微瘀伤在可见光下肉眼无法识别, 为寻找一种高效的苹果早期轻微瘀伤识别方法, 以红富士苹果为研究对象, 通过倒立摆装置人为制造不同程度的苹果瘀伤。 首先采用傅里叶变换近红外光谱仪采集80个无损样品、 60个轻度损伤样品以及60个重度损伤样品各自在损伤后0、 10、 20和30 min的近红外漫反射光谱; 采用SNV作为光谱数据预处理方法, 谱区范围选择4 000~9 000 cm-1; 主成分个数为9, 采用偏最小二乘法-判别分析(PLS-DA)和支持向量机(SVM)两种方法建立“无损-有损”二分类模型, 预测集的平均识别率分别为85.00%和89.80%, 模型识别效果有待提高。 在以上实验结果的基础上, 使用波段范围为1 000~2 350 nm的近红外相机采集无损、 轻度瘀伤、 中度瘀伤和重度瘀伤的100个苹果样品的近红外图像, 相机加装1 150和1 400 nm的滤光片后分别再次采集这些苹果样品的近红外图像, 所有图像均在瘀伤产生后立即采集。 共采集3个波段、 4种瘀伤程度的苹果样本图像共1 200张。 提取图像吸光度信息并分别建立KNN、 SVM和DT分类模型, DT法“无损-损伤”二分类模型和“无损-轻度-重度”三分类模型的识别率最高, 分别为99.00%和94.67%。 相比基于近红外光谱的苹果早期外部瘀伤识别方法, 近红外相机多波段成像法在苹果表面早期瘀伤和瘀伤程度分类的应用中都有更高的识别准确率。 与此同时近红外相机成像方法方便确定瘀伤的位置, 这为苹果表面瘀伤的实时在线检测与分类提供了一种快速高效的新思路。

关键词: 近红外光谱; 近红外相机成像; 苹果; 早期瘀伤
中图分类号:O657.39 文献标志码:A
Early Apple Bruise Detection Based on Near Infrared Spectroscopy and Near Infrared Camera Multi-Band Imaging
YANG Zeng-rong1,2, WANG Huai-bin1,2, TIAN Mi-mi1,2, LI Jun-hui1,2, ZHAO Long-lian1,2,*
1. College of Information and Electrical Engineering, China Agricultural University, Beijing 100083, China
2. Key Laboratory of Modern Precision Agriculture System Integration Research Ministry of Education, Beijing 100083, China
*Corresponding author
Abstract

Early light bruising in apples is an important factor affecting apple quality. Since early minor bruises cannot be identified by the naked eye in visible light, and in order to control the time of bruise production, a red Fuji apple was selected as the research object, and different degrees of apple bruises were artificially created through an inverted pendulum device. To find an efficient method to identify early minor apple bruises, Fourier transforms near-infrared spectrometer was first used to collect near-infrared diffuse reflectance spectra of 80 undamaged samples, 60 lightly damaged samples, and 60 heavily damaged samples at 0, 10, 20 and 30 min post-damage, respectively. SNV is used as the spectral data preprocessing method. The spectral range is 4 000~9 000 cm-1, and the number of principal components is 9. The “Nondestructive-damage” classification model is established by partial least squares -discriminant analysis (PLS-DA) and support vector machine (SVM) respectively. The average recognition rate of the prediction set was 85.00% and 89.80%, respectively, and the model recognition effect needs to be improved. Based on the above experimental results, the NIR images of apples with no damage, light bruise, moderate bruise, and severe bruise of 100 apples were acquired by using NIR cameras with a wavelength range of 1 000 to 2 350 nm. The NIR images of these apples were acquired again with the addition of 1 150 and 1 400 nm filters, respectively. 1 200 images of apples in 3 bands and 4 bruise levels were acquired. The image absorbance information was extracted, and KNN, SVM, and DT classification models were built respectively. The highest recognition rates of 99.00% and 94.67% were achieved by the “nondestructive-damage” classification model and the “nondestructive-mild damage-severe damage” classification model using the DT method, respectively. Compared with the NIR spectroscopy method, the NIR camera multi-band imaging method has higher recognition accuracy in applying both early bruises and bruise degree classification on apple surfaces. At the same time, the NIR camera imaging method is convenient for determining the location of the bruise, which provides a fast and efficient new idea for real-time online detection and classification of bruises on apple surfaces.

Keyword: Near infrared spectroscopy; Near-infrared camera imaging; Apple; Early bruise
引言

在苹果采摘、 包装和运输等过程中, 由于苹果表面之间的相互碰撞和挤压, 苹果表面瘀伤的产生不可避免[1]。 受损的苹果果肉水分流失并且出现生理代谢的紊乱, 这些果肉组织的乙烯释放量提高, 呼吸强度显著提升, 可溶性固形物的含量迅速降低, 受损的苹果果肉的硬度降低[2]。 随着时间积累, 这些果肉还会出现氧化褐变, 最终, 苹果果实的营养成分发生变化, 苹果品质下降, 影响苹果的储存和销售。 而且, 受损的苹果组织更加容易出现霉变, 对周围的无损苹果产生污染[3]

传统的鉴别苹果表面瘀伤的方法包括人工肉眼鉴别和机器视觉技术等, 然而, 由于苹果表面颜色差异较大, 这些方法只能鉴别明显受损的苹果[4]。 苹果的早期瘀伤, 特别是半个小时以内产生的瘀伤, 可见光下传统的机器视觉技术或者肉眼无法识别, 因为此时苹果受损组织和健康组织无明显差异。 尽可能早的识别出受损苹果并对苹果进行分级, 有利于苹果的储存、 运输和销售。 因此, 寻找一种快速、 准确、 便捷、 无损的苹果表面瘀伤, 特别是表面的早期瘀伤检测技术非常必要。

近年来, 基于近红外光谱分析技术和高光谱成像技术的苹果品质无损检测发展迅速。 Cen等[5]通过苹果的近红外光谱得到了苹果果肉组织的吸收系数和散射系数, 发现在675 nm波段下苹果果肉组织的吸收系数和散射系数随苹果储存时间发生变化, 证明了苹果果肉的光学特性参数和苹果组织理化特性之间的相关性。 Xing等[6]利用高光谱技术结合图像处理方法检测“ 乔纳金” 苹果的表面损伤, 并提出了损伤检测和果梗/花萼识别算法, 无损苹果的分类准确率为84.6%, 1天内的损伤识别准确率为77.5%, 果梗/花萼的识别准确率为98.3%。 Huang等[7]基于高光谱成像系统, 结合主成分分析, 在不同波段下对不同瘀伤程度的苹果进行识别, 对一个小时内的瘀伤最高识别率为96.2%。 张保华等[8]结合光谱特征波段和最低噪声分离变换开发损伤苹果识别算法, 对80个苹果样品进行试验, 总体识别率达到97.1%。 Che等[9]利用高光谱成像系统, 分别在苹果受损后的0、 12、 18 h内采集了60个苹果的高光谱图像, 建立基于像素的随机森林模型, 模型的识别率达到了99.9%。 Khatiwada等[10]采用可见-近红外光谱结合偏最小二乘-判别分析算法检测苹果果肉内部的褐变缺陷, 分类准确率达到了95%。

近年来, 利用近红外相机拍摄近红外波段图像的多光谱成像技术快速发展。 近红外相机成像与可见光成像相比, 近红外成像的环境适应性更好, 得到的图像能够携带更多与样品品质相关的信息; 与红外热辐射成像相比, 近红外成像对样本的分辨能力更强, 成像的对比度更好; 与高光谱成像相比, 近红外相机没有采用光栅元件进行分光, 因此它的光通量更高, 积分时间更短, 图像细节表达更清晰。 与此同时, 近红外相机结合滤光片构成多光谱成像系统, 在保持空间分辨能力的同时具有了光谱分辨能力, 相比高光谱成像系统, 具有更少冗余波段信息的多光谱成像系统能够显著提升数据的处理速度[11]。 近红外相机体积小且质量较轻便于携带, 为水果的实时在线无损检测提供了便利。 在所阅读文献范围内, 很少有对苹果表面的早期轻微外部瘀伤, 特别是半个小时以内的瘀伤进行检测的研究, 也缺少利用近红外相机进行快速、 方便的早期瘀伤检测的研究。

基于此, 首先采用水果品质分类中广泛使用的近红外光谱技术, 基于不同的光谱预处理方法和建模方法建立苹果瘀伤分类模型, 验证近红外相机成像方法对苹果早期外部瘀伤检测的可行性。 然后基于光谱分析结果, 采用近红外相机采集三个波段的近红外图像, 并将图像信息转换为吸光度光谱信息, 进一步研究近红外相机成像法对苹果早期外部瘀伤检测的可行性。

1 实验部分
1.1 样本的制备

红富士苹果表面颜色较深且变化复杂, 因此对其表面的瘀伤进行检测相比其他表皮颜色单一的苹果更加困难也更具代表性。 故以烟台栖霞红富士苹果为研究对象, 苹果样本大小基本一致且来自同一批次。 近红外光谱实验选取80个样品, 近红外相机成像选取100个样品。 实验之前, 用75%的酒精对苹果表面进行消毒去污, 并将苹果在室温下放置12 h。

由于苹果表面的早期轻微瘀伤在可见光下无法用肉眼识别, 且需要确认瘀伤产生于半个小时以内, 因此, 苹果样本表面的瘀伤通过倒立摆装置人为制造。 制造苹果瘀伤的装置如图1所示, 摆杆长0.5 m, 摆锤重85 g, 摆锤直径1.8 cm。 实验时, 将摆杆提升到与水平方向夹角为45° , 随后释放摆杆使之作近似单摆运动。 由冲量定理可以计算得出摆锤对苹果表面的冲量约为0.23 N· s, 瘀伤面积大小约为0.8 cm2, 瘀伤处表皮无破损仅有轻微凹陷, 可见光下肉眼很难察觉瘀伤。 瘀伤出现后立即采集光谱数据和图像数据。

图1 苹果瘀伤制造装置示意图Fig.1 Schematic diagram of apple bruises manufacturing device

苹果瘀伤根据受撞击次数分为四类, 分别为无损、 轻度瘀伤、 中度瘀伤和重度瘀伤, 其中轻度瘀伤的苹果是指受损部位仅被撞击一次, 中度瘀伤的苹果是指受损部位被撞击两次, 重度瘀伤指受损部位被撞击三次。 图2为不同瘀伤程度苹果的可见光图像。

图2 不同瘀伤程度苹果的可见光图像
(a): 无瘀伤; (b): 轻度瘀伤; (c): 中度瘀伤; (d): 重度瘀伤
Fig.2 Visible light images of apples with different bruises
(a): No bruises; (b): Mild bruises; (c): Moderate bruises; (d): Severe bruises

1.2 近红外光谱数据的采集

苹果样品近红外光谱的采集采用德国布鲁克公司的MPA傅里叶变换型近红外光谱仪。 将苹果待测区域放置于通光孔上方, 用吸光海绵遮挡四周以排除外界环境干扰的影响, 进行样本近红外光谱数据的采集, 光谱扫描范围为4 000~10 000 cm-1。 首先采集80个无损样本的光谱数据, 随后采用瘀伤制造装置对其中60个样本制造轻度瘀伤样本并采集光谱数据, 然后制备重度瘀伤样本60个并采集光谱数据。 每个样本受损后, 分别在0 min(记为t0)、 10 min(记为t1)、 20 min(记为t2)、 30 min(记为t3)采集光谱数据, 因此每个时间点采集80(无损)+60(轻度瘀伤)+60(重度瘀伤)=200条光谱, 在0 min采集到的光谱图如图3所示。

图3 不同瘀伤程度苹果样本在0 min时的近红外光谱图Fig.3 Near infrared spectra of apple samples with different bruises at 0 min

1.3 光谱预处理以及分类模型的建立方法

光谱预处理方法可以有效去除光谱中的噪声并削弱背景信息, 从而得到高信噪比的光谱数据, 便于建模分析[12, 13]。 采用5种光谱预处理方法并比较不同的预处理方法对模型准确率的影响; 预处理方法包括: 标准正态变换(SNV)、 多元散射校正(MSC)、 一阶导数、 一阶导数+SNV、 一阶导数+MSC。 预处理完成后分别采用偏最小二乘-判别分析(PLS-DA)和支持向量机(SVM)两种方法建立模型并进行对比分析, 建模数据为在0 min采集的光谱数据, 包括无损苹果样本光谱数据80个、 轻度瘀伤苹果样本光谱数据60个以及重度瘀伤苹果样本光谱数据60个, 其中, 将轻度瘀伤苹果和重度瘀伤苹果归为有损苹果共120个。 数据按3∶ 1随机划分为训练集和预测集。

为了探究瘀伤时间对分类模型检测精度的影响, 对四个时间点采集到的数据进行建模并检验识别效果, 每个时间点的数据也分别按3∶ 1随机划分为训练集和预测集。 采用SNV预处理方法对数据进行预处理, 采用SVM法建立二分类模型。

1.4 近红外图像的采集

使用近红外相机(Xeva-2.35-320, Xenics, Leuven, Belgium)采集苹果样本的近红外图像。 相机采用第三代近红外焦平面阵列, 使用InAs/GaSb Ⅱ 型超晶格(T2SL)材料作为探测器制作材料, 可在热电冷却达到200 K的温度下运行。 相机的波段范围为1 000~2 350 nm, 分辨率320× 256, 像元尺寸30 μ m× 30 μ m, 帧频100 Hz/344 Hz。 近红外图像拍摄系统如图4所示。 相机用三脚架固定, 镜头垂直向下指向苹果, 使苹果样本图像位于画面中心, 镜头距离苹果15 cm。 因为相机自身没有光源, 实验时用两个功率为100 W的钨丝灯作为补充光源, 灯源照射角度与垂直方向成45° , 灯源与样本距离约40 cm。 采用柔光布作为灯罩使光线更加柔和。

图4 近红外图像采集装置Fig.4 Near infrared image acquisition device

由近红外光谱数据分析可知, 在光谱波段的1 150和1 400 nm苹果瘀伤部位处有较明显的吸收, 因而在这两个波段采集的图像可以更好的表现苹果的瘀伤特征。 结合经济型和实用性, 选择美国Edmund公司的传统镀膜带通滤光片, 滤光片中心波长分别为1 150和1 400 nm, 带宽25 nm, 直径50 nm, 光密度大于4.0。

采集图像数据之前, 首先对相机和光源进行调整。 调整光源位置以及照射角度, 从而使苹果表面光照分布均匀; 调整相机软件的矫正包和相机光圈, 使图像显示清晰。 依次采集100个苹果样本的近红外图像, 样品采集顺序依次为无损苹果样本、 轻度瘀伤苹果样本、 中度瘀伤苹果样本以及重度瘀伤苹果样本。 在无损苹果样本的图像采集完成后, 使用瘀伤制造装置人为制造瘀伤并立即使用相机采集轻度瘀伤样本的图像; 在轻度瘀伤样本的图像采集完成后再次使用瘀伤制造装置对样本的瘀伤部位进行撞击以获得中度瘀伤苹果样本, 并立即进行样本图像的采集; 最后采集重度瘀伤苹果样本的近红外图像。 无论瘀伤程度如何, 每个苹果样本采集三个波段的图像共三张, 三个波段分别为1 150和1 400 nm以及全波段(1 000~2 350 nm), 同一个苹果在三种波段下得到的苹果图像如图5。 综上, 实验共采集3种波段、 4种瘀伤程度的苹果样本图像共1 200张。

图5 不同波段苹果的近红外图像
(a): 全波段图像; (b): 波段1 150 nm图像; (c): 波段1 400 nm
Fig.5 Near infrared images of apple at different wavebands
(a): Image of full-band; (b): Image of 1 150 nm; (c): Image of 1 400 nm

1.5 近红外图像的信息提取

苹果的瘀伤部位和无损部位在近红外波段的吸收有明显差异, 而在可见光波段, 苹果各个部位的光吸收并无明显差异, 因此, 近红外图像可以更好的显示苹果的早期瘀伤特征。 图6为带有早期瘀伤的同一苹果样本的可见光图像[图6(a)]和近红外图像[图6(b)]。 通过对比, 可以发现近红外图像有明显的瘀伤特征, 而可见光图像肉眼看不出瘀伤的存在。 因此, 近红外相机在苹果早期瘀伤检测方面有着优越的性能, 我们课题组的研究也证实了这一点[14]

图6 带有瘀伤的苹果样品的可见光(a)和近红外(b)图像Fig.6 Visible (a) and near-infrared (b) images of apple samples with bruises

由于近红外相机采集到的原始图像存在噪声, 在进行信息提取之前, 首先对近红外图像进行中值滤波。 为后续计算, 首先选定苹果图像的瘀伤区域为感兴趣区域(region of interest, ROI), 提取ROI内所有像素并求像素灰度平均值I

在图像中漫反射白板区域选定一处ROI, 同样提取ROI内所有像素并求取像素平均值I0。 计算苹果瘀伤区域吸光度A , 如式(1)所示

A=-lg(I/I0)(1)

式(1)中, A为苹果样本瘀伤区域的吸光度; I为苹果瘀伤区域平均灰度值; I0为标准漫反射白板的平均灰度值; I/I0为苹果样本瘀伤区域的漫反射率。 将每个苹果样品三个波段(1 150 nm、 1 400 nm、 全波段)的吸光度数据组合成该样品的多光谱数据进行后续苹果瘀伤识别。

分别使用KNN、 SVM以及DT法对近红外相机得到的多光谱数据进行分类建模并引入混淆矩阵和kappa系数作为分类模型的评价指标, 其中kappa系数计算如式(2)。 混淆矩阵为一个n× n矩阵, 是评价模型精度的常用方法。 混淆矩阵的每一行表示样品的实际类别, 每一列表示样品的预测类别[15]

kappa=P0+Pe1-Pe(2)

假设每一类的实际样本个数为a1a2、 …、 an, 预测样本个数为b1b1、 …、 bn, 总样本个数为N, 则

Pe=a1b1+a2b2++anbnN2(3)

假设预测正确的样本个数为R(混淆矩阵对角线元素之和), 则

P0=RN(4)

kappa计算结果通常在0到1之间, 可分为五个等级代表不同级别的一致性, 即模型预测结果与实际分类结果的一致性: 0.00~0.20极低的一致性、 0.21~0.40一般的一致性、 0.41~0.60中等的一致性、 0.61~0.80高度的一致性、 0.81~1.00几乎完全一致。

2 结果与讨论
2.1 光谱预处理

共采集得到200条t0(0 min)时刻三类不同瘀伤程度苹果样品的近红外光谱, 其中无损样本80条, 轻度瘀伤样本60条, 重度瘀伤样本60条。 采用5种不同的预处理方法进行光谱预处理, 见1.3节。 随机抽取三类样本的3/4作为训练集, 剩余样本作为预测集, 用PLS-DA建立分类识别模型对苹果进行三分类(无损、 轻度瘀伤、 重度瘀伤), 不同预处理方法下各个分类模型的训练集和预测集识别结果如表1。 由表1可以看出, 采用SNV和MSC预处理方法的分类模型建模集和测试集的识别准确率较高, 预测集识别准确率为80.00%。 因为一般SNV的校正能力比MSC要强, 尤其是样品组份变化较大的时候, 因此采用SNV作为光谱数据预处理的方法。

表1 基于不同预处理方法的苹果分类模型 Table 1 Apple classification model based on different preprocessing methods
2.2 基于近红外光谱的苹果“ 无损-有损” 二分类模型

首先采用PLS-DA法建立“ 无损-有损” 二分类模型, 以t0时刻(0 min)的近红外光谱为建模对象, 包括80条无损样品光谱以及120条有损样品光谱, 每类样本随机抽出其中的3/4作为训练集, 其余样本作为预测集。 建模的谱区范围为4 000~9 000 cm-1, 共包含1 296个光谱点。 模型的最大主成分数设为15, 主成分推荐方法为内部交叉法。 建立模型时选取的主成分数太低会使模型的分类准确率降低, 太高则可能造成过拟合。 根据内部交叉验证的推荐选择主成分数为9。

为检验PLS-DA模型的稳定性, 将200个光谱数据以同样的方法随机抽取10次训练集并建模, 10个模型的训练集和预测集识别准确率如表2所示。 训练集平均识别准确率为89.13%, 预测集的平均识别准确率为85.00%, 模型准确率不高, 说明苹果受外部碰撞后要即刻(0 min)判断出其是否受损确实有难度。 但模型的准确率浮动较小, 模型相对比较稳定。

表2 基于近红外光谱的苹果“ 无损-有损” 二分类识别模型结果 Table 2 Results of apple “ nondestructive-destructive” binary classification recognition model based on near-infrared spectrum

类似的, 采用SVM方法建立的10个模型的训练集和预测集识别结果也见表2。 训练集的平均识别准确率为90.67%, 预测集的平均识别准确率为89.80%。 相比PLS-DA分类模型, SVM分类模型预测集的识别效果较好, 且模型的准确率浮动更小, 因此后续采用SVM法进行建模。

也测试了“ 无损-轻度-重度” 三分类模型的建立, 但训练集和预测集的识别准确率只有80.00%, 准确率比较低, 说明使用近红外光谱法进行苹果表面瘀伤程度的精确分类有一定的困难。

2.3 瘀伤时间对苹果表面瘀伤检测的影响

为了研究瘀伤后不同时间对苹果表面瘀伤检测效果的影响, 采集了四个时间点(即瘀伤后0、 10、 20和30 min)的光谱共800条, 每个时间点有200条光谱。 用SVM法建立“ 无损-有损” 二分类模型, 每个时间点的数据以3∶ 1的比例划分训练集和预测集, 得到不同时间点的模型识别准确率如表3所示。

表3 不同瘀伤时间SVM模型的识别准确率 Table 3 Recognition accuracy of the SVM model based on the spectral data at different times after bruises caused

表3中数据可以发现, 随着瘀伤后时间的增加, 模型的分类准确率逐渐增加。 与此同时, 实验观察发现, 苹果的瘀伤随着时间的增加显示越来越清晰, 在30 min时已经肉眼可见。 因此, 近红外光谱法随着瘀伤时间的增加检测的难度越来越小, 分类准确率增加。 但对特别早期的瘀伤的检测, 还需要寻找更加有效的检测方法。

2.4 基于近红外多光谱相机成像的苹果表面早期瘀伤检测

使用近红外相机在全波段条件下拍摄苹果样品的图像, 加装1 150和1 450 nm滤光片后分别再次拍摄这些苹果样品的图像, 所有瘀伤样品的图像都是在瘀伤产生后t0(0 min)时刻立即采集的。 这些图像经信息处理后得到无损样本数据、 轻度瘀伤样本数据、 中度瘀伤样本数据以及重度瘀伤样本数据各100组。

为了建立“ 无损-有损” 的二分类模型, 将所有瘀伤样本数据归为一类共300组, 随机抽取其中3/4作为训练集, 其余1/4作为预测集。 无损样本数据100组, 同样随机抽取其中3/4作为训练集, 其余1/4作为预测集。

2.4.1 基于近红外多光谱相机成像的苹果“ 无损-瘀伤” 二分类

分别使用K近邻法(KNN)、 支持向量机(SVM)、 决策树(DT)对训练集300组数据进行分类建模, 调整模型参数增强模型分类精度, 建立“ 无损-有损” 二分类苹果瘀伤检测模型, 代入预测集的100组数据进行验证, 三种模型的预测集混淆矩阵如图7。

图7 预测集二分类模型混淆矩阵
(a): KNN; (b): SVM; (c): DT
Fig.7 Confusion matrix of the binary model of the prediction set
(a): KNN; (b): SVM; (c): DT

图7中标签1为无损, 标签2为有损。 可以看出在KNN模型中1个无损苹果样本被误分类为有瘀伤, 1个有损苹果样本被误分类为无瘀伤。 在SVM模型中5个无损苹果样本被误分类为有瘀伤, 1个有损苹果样本被误分类为无瘀伤。 在DT模型中1个无损苹果样本被误分类为有瘀伤, 有损苹果样本没有出现误分类。 通过对比可以看出DT模型误分类最少, KNN模型次之, SVM模型误分类最多。 三种模型识别准确率及kappa系数如表4所示。 通过识别准确率和kappa系数的对比, 选择DT模型作为苹果“ 无损-有损” 二分类模型的建模方法, 可以使苹果表面早期瘀伤检测效果达到最佳。

表4 “ 无损-有损” 二分类模型识别准确率及精度 Table 4 Recognition accuracy and precision of “ Nondestructive-destructive” bi-classification model

2.4.2 基于近红外多光谱相机成像的苹果“ 无损-轻度-重度” 三分类

进一步研究用近红外多光谱相机成像对瘀伤程度进行分类的可行性。 对得到的无损数据100组、 轻度瘀伤数据100组和重度瘀伤数据100组按照“ 无损-轻度-重度” 进行三分类。 将数据以3∶ 1的比例随机划分为训练集和预测集, 其中3/4(225组)划分为训练集, 1/4(75组)划分为预测集。 分别使用KNN、 SVM以及DT方法建立模型, 对训练集225组数据进行分类建模, 调整模型参数增强模型分类精度, 建立“ 无损-轻度-重度” 苹果瘀伤程度分类模型, 代入预测集的75组数据进行验证, 三种模型的预测集混淆矩阵如图8所示。 图中标签1为无损, 标签2为轻度瘀伤, 标签3为重度瘀伤。由图可以看出KNN模型和SVM模型误分类相对较多, DT模型误分类最少, 75个预测集样品仅4个样品识别错误。

图8 三分类模型混淆矩阵
(a): KNN; (b): SVM; (c): DT
Fig.8 Tri-classification model confusion matrix
(a): KNN; (b): SVM; (c): DT

三种模型识别准确率及kappa系数如表5所示。 可以发现, SVM模型和KNN模型的分类准确率相对较低, 预测集识别准确率都低于90.00%, 两种模型的kappa系数不到0.9。 DT模型的分类效果最好, 训练集和预测集识别准确率都达到了94.67%, kappa系数为0.92。 该结果说明使用近红外多波段成像对苹果表面无损、 早期轻度瘀伤、 早期重度瘀伤等瘀伤程度进行分类是可行的。

表5 “ 无损-轻度-重度” 三分类模型识别准确率及精度 Table 5 Recognition accuracy and precision of “ Non-Mild-Severe destructive” tri-classification model
3 结论

快速、 准确、 便捷、 无损地对苹果表面的瘀伤, 特别是表面的早期轻微外部瘀伤进行检测, 有利于苹果的早期分级和分类管理, 对提高苹果的商品竞争力, 扩大我国苹果出口市场具有重要意义。 首先采用近红外光谱法对红富士苹果的表面早期瘀伤进行了检测, SVM法的建模结果验证了该方法的可行性, 但仍需进一步提高识别效果。 实验结果也表明随着瘀伤产生时间的延长(0、 10、 20和30 min)所建模型的识别准确率逐渐提高, 验证了越早期的瘀伤检测越困难。 在此基础上, 利用近红外相机在1 150 nm、 1 400 nm和全波段三种条件下, 拍摄t0时刻不同瘀伤程度苹果的近红外图像, 图像经处理后得到多波段吸光度数据, 然后用DT法基于此数据建立识别模型。 其中“ 无损-有损” 二分类模型预测集的识别准确率达到99.00%, “ 无损-轻度-重度” 三分类模型的识别准确率为94.67%, 模型均具有良好的识别效果。 相比基于近红外光谱的苹果早期外部瘀伤识别方法, 近红外相机多波段成像在苹果表面早期瘀伤和瘀伤程度分类的应用中都有更高的识别准确率, 说明利用该方法对苹果早期瘀伤进行检测是可行的, 这为苹果表面瘀伤的实时在线检测与分类提供了一种快速高效的新方法。

本研究先将近红外相机图像转化为多波段吸光度的光谱信息, 然后利用机器学习的方法建立识别模型, 如何直接基于近红外图像进行苹果外部瘀伤的检测是本工作今后努力的方向。

参考文献
[1] Studman C J, Brown G K, Timm E J, et al. Transactions of the ASABE, 1997, 40(6): 1655. [本文引用:1]
[2] Celik H K, Ustun H, Erkan M, et al. Postharvest Biology and Technology, 2021, 179(9): 111561. [本文引用:1]
[3] Zhu X, Li G. Journal of Food Properties, 2019, 22(1): 1709. [本文引用:1]
[4] Pan X, Sun L, Li Y, et al. Journal of the Science of Food and Agriculture, 2019, 99(4): 1709. [本文引用:1]
[5] Cen H, Lu R, Mendoza F, et al. Postharvest Biology and Technology, 2013, 85(11): 30. [本文引用:1]
[6] Xing J, De Baerdemaeker J. Postharvest Biology and Technology, 2005, 37(2): 152. [本文引用:1]
[7] Huang Wenqian, Li Jiangbo, Wang Qingyan, et al. Journal of Food Engineering, 2015, 146(2): 62. [本文引用:1]
[8] ZHANG Bao-hua, HUANG Wen-qian, LI Jiang-bo, et al(张保华, 黄文倩, 李江波, ). Spectroscopy and Spectral Analysis(光谱学与光谱分析), 2014, 34(5): 1367. [本文引用:1]
[9] Che W, Sun L, Zhang Q, et al. Computers and Electronics in Agriculture, 2018, 146(3): 12. [本文引用:1]
[10] Khatiwada B P, Subedi P P, Hayes C, et al. Postharvest Biology and Technology, 2016, 120(10): 103. [本文引用:1]
[11] Zhang N, Li P, Liu H, et al. Plant Methods, 2021, 17(1): 117. [本文引用:1]
[12] Junaedi E C, Lestari K, Muchtaridi M. Journal of Advanced Pharmaceutical Technology & Research, 2021, 12(1): 1. [本文引用:1]
[13] Zhuang X G, Wang L L, Fang J X, et al. Comparison of Different Spectral Preprocessing Methods Onidentification of Green Tea Origins by Near Infrared Spectroscopy, International Conference on Computer Science and Environmental Engineering, 2015. [本文引用:1]
[14] Yuan Y, Yang Z, Liu H, et al. Infrared Physics & Technology, 2022, 127(12): 104442. [本文引用:1]
[15] Ganjali M, Moradzadeh N, Baghfalaki T. Journal of the Korean Statistical Society, 2017, 46(1): 78. [本文引用:1]