基于高光谱图像技术与迁移学习的水晶梨早期损伤检测
王广来, 王恩凤, 王聪聪, 刘大洋*
东北林业大学机电工程学院, 黑龙江 哈尔滨 150000
*通讯作者 e-mail: ldy333ldy@163.com

作者简介: 王广来, 1996年生, 东北林业大学机电工程学院硕士研究生 e-mail: gellerwang@163.com

摘要

梨在储藏、 包装和运输等过程中均可能发生不同程度的机械损伤, 若不及时剔除损伤梨, 损伤可能会逐渐严重而演变成腐烂, 造成严重的经济损失。 为建立一种梨早期损伤检测及损伤时间评估的快速、 无损检测方法, 采用高光谱图像结合迁移学习模型对损伤早期水晶梨进行识别。 以无损伤、 挤压损伤24 h和挤压损伤48 h的水晶梨为研究对象, 应用高光谱成像系统采集样品的高光谱图像, 共获取无损伤、 挤压损伤24 h和挤压损伤48 h的水晶梨高光谱图像各80帧。 对高光谱图像进行主成分分析, 选择主成分图像4, 5, 6(PC4, PC5, PC6)作为检测水晶梨损伤的特征图像, 将3个主成分图像拼接后进行数据扩充共得到无损伤、 挤压损伤24 h和挤压损伤48 h的特征图像各160帧。 按照9∶1比例划分样本训练集和测试集后, 分别建立了支持向量机(SVM)、 k-近邻(k-NN)和基于ResNet50网络的迁移学习损伤识别模型。 SVM、 k-NN和基于ResNet50网络的迁移学习模型对测试集样本总体识别准确率分别为83.33%, 85.42%和93.75%, 基于ResNet50网络的迁移学习模型识别效果最佳, 其对测试集中无损伤、 挤压损伤24 h和挤压损伤48 h的样本正确识别率分别达到100%, 83%和95%。 该研究结果表明, 高光谱图像技术结合基于ResNet50网络的迁移学习模型可实现水晶梨早期损伤检测, 并对损伤时间有较好的预测效果, 且损伤时间越长, 识别准确率越高。

关键词: 高光谱图像; 迁移学习; 水晶梨; 损伤检测
中图分类号:TP751 文献标志码:A
Early Bruise Detection of Crystal Pear Based on Hyperspectral Imaging Technology and Transfer Learning
WANG Guang-lai, WANG En-feng, WANG Cong-cong, LIU Da-yang*
College of Mechanical and Electrical Engineering, Northeast Forestry University, Harbin 150000, China
*Corresponding author
Abstract

Pear in storage, packaging and transportation processes may occur in different degrees of mechanical damage. If not removed in time, the damage may gradually become serious and rot, resulting in serious economic losses. In order to establish a rapid and non-destructive detection method for early bruise detection and bruise time assessment of pears, hyperspectral imaging technology combined with a transfer learning model was used to identify crystal pears with an early bruise. The hyperspectral images of crystal pears with no bruise, crush bruise at 24 h and crush bruise at 48 h were acquired by the hyperspectral imaging system, and 80 hyperspectral images of crystal pears with no bruise, crush bruise at 24 h and crush bruise at 48 h were obtained. Principal component analysis was performed on the hyperspectral images, and principal component images 4, 5 and 6 (PC4, PC5 and PC6) were selected as the feature images for detecting crystal pear bruises. After the data expansion of the stitched images with three principal components, 160 images of crystal pears with no bruise, crush bruise at 24 h and crush bruise at 48 h were obtained. The training sample set and test sample set were divided according to the ratio of 9∶1, Support Vector Machine (SVM), k-Nearest Neighbor (k-NN), and transfer learning bruise recognition models based on the ResNet50 network were established, respectively. The results showed that the overall recognition accuracy of SVM, k-NN and ResNet50 network-based transfer learning models for the test set was 83.33%, 85.42% and 93.75%, respectively. The transfer learning model based on the ResNet50 network had the best recognition results, and its correct recognition rates for the test set of crystal pears with no bruise, crush bruise at 24 h and crush bruise at 48 h reached 100%, 83% and 95%, respectively. The results of this study indicate that hyperspectral imaging technology combined with the transfer learning method based on the ResNet50 network can achieve early bruise detection of crystal pears and have a great prediction performance for bruise time, and the longer the bruise time, the higher the recognition accuracy.

Keyword: Hyperspectral imaging; Transfer leaning; Crystal pear; Bruise detection
引言

梨在储藏、 包装和运输等过程中均可能发生不同程度的机械损伤, 若不及时剔除损伤梨, 随着时间的推移, 损伤会逐渐加重而演变成腐烂, 造成巨大的经济损失[1]。 由于梨的果皮颜色较暗, 轻度皮下损伤依靠肉眼难以识别, 实现梨损伤的自动化识别可以有效减小经济损失。 此外, 对梨损伤时间的评估有助于采用不同手段对梨进行加工处理, 同时可以根据损伤时间对梨在储藏、 包装和运输等易损伤环节进行监控及改善, 从而减少不必要的浪费和经济损失[2]。 因此, 建立一种梨早期损伤检测及损伤时间评估的快速、 无损检测方法对梨产业的健康发展具有重要意义。

高光谱图像融合了图像与光谱信息, 可以同时采集果品的内外部品质信息, 已经广泛地应用于苹果[2]、 蓝莓[3]、 枣[4]和梨[5, 6]等果品的机械损伤检测中。 近年来, 深度学习在大数据处理方面获得了快速发展, 通过对模型的预训练, 特征的自动提取与优化, 可以快速批量处理数据, 目前已越来越多地应用于果品检测领域[7]。 其中, Zhang等结合全卷积网络与光谱透射图像, 对机械损伤后30 min的蓝莓及其花萼部分进行分割, 测试集准确率达到81.2%[8]。 Wang等将高光谱图像与深度学习相结合, 使用AlexNet和ResNet两种模型对蓝莓机械损伤进行识别, 两个模型的精度分别为88.44%和89.52%[9]。 Azizah等结合RGB图像和卷积神经网络, 使用卷积神经网络模型和4-折交叉验证实现二值分类, 对山竹表面缺陷识别准确率达到97.5%[10]。 Bai等将光谱指纹特征与深度学习和多元回归分析相结合, 建立多产地苹果的糖度预测模型, 测试集的相关系数和均方根误差分别为0.990和0.274, 均优于单产地模型[11]。 以上研究说明, 深度学习算法在高光谱图像等大数据处理方面有较大的应用前景。

在对梨损伤检测的研究中, 针对损伤时间进行检测的研究较少; 另外, 现有的关于果品损伤识别研究大多使用传统的机器学习方法, 这些方法在处理高光谱图像数据时存在计算耗时长、 准确率低等问题, 基于深度学习的迁移学习模型可以对小数据集实现精确的迁移学习, 同时保证识别准确率和识别效率, 目前尚未有将基于深度学习的迁移学习模型应用到高光谱技术检测果品损伤的研究中。

水晶梨的抗旱、 抗寒能力强, 果树易种植, 果实耐储存, 且价格相对实惠, 受众面广, 因此选用水晶梨作为研究对象。 本研究的主要目的是应用高光谱图像结合基于深度学习的迁移学习模型无损检测不同损伤时间的水晶梨, 具体过程如下: (1)使用主成分分析法对高光谱图像降维, 提取检测损伤的主成分图像; (2)将提取的主成分图像拼接后进行数据扩充, 分别采用传统机器学习算法和基于ResNet50网络的迁移学习模型检测不同损伤时间的水晶梨; (3)综合比较各模型的识别准确率, 得到水晶梨损伤时间检测的最优模型。

1 实验部分
1.1 仪器

高光谱采集系统如图1所示, 主要包括芬兰Specim公司FX10系列的图像光谱仪(SPECIM, Spectral Imaging Ltd, Finland)、 电动控制移动平台、 6盏50 W卤素灯和计算机等, 在波长范围400~1 000 nm内每隔2.62 nm采集一次图像, 共224幅图像, 一次采集六个样本的高光谱图像信息, 像素大小为1 198× 512, 通过软件ENVI 5.1(The Environment for Visualizing Images)对原图像进行裁剪, 一幅图像保留一个样本的高光谱信息, 图片的尺寸和光谱波段数为340× 220× 224。 程序处理使用集成开发工具Pycharm 2019.3.3专业版, Python 3.7.1, 开源深度学习框架Pytorch, 版本1.6.0。

图1 高光谱图像采集系统示意图Fig.1 Schematic diagram of hyperspectral image acquisition system

1.2 材料与样本

于黑龙江省哈尔滨市的家乐福超市购买水晶梨样本160个, 从中挑选形状规整、 大小均匀、 表面无明显划痕、 无腐烂的样本80个。 买回后置于实验室(22~25 ℃)中24 h, 使样本温度达到室温, 用毛巾擦去梨表面的污渍与灰尘, 排除温度、 水等其他因素的干扰。 用万能试验机以5 mm· min-1的速度缓慢挤压使每个样本发生5 mm形变, 损伤形成前后的样本如图2所示。 采集高光谱图像时先采集无损伤样本的高光谱图像, 在形成损伤后24和48 h各采集一次高光谱图像。

图2 水晶梨挤压前(a)和挤压损伤后(b)图像Fig.2 Images of crystal pear before (a) and after (b) crushing

1.3 高光谱图像校正

为获取清晰且不失真的高光谱图像, 设定平台移动速度5.5 mm· s-1, 移动平台与镜头之间的距离为40 cm。 通过橡胶圈将样本固定在移动平台上, 使标记损伤部位与镜头垂直。

高光谱图像系统获取的是未经黑白校正的原始高光谱图像, 为排除光线以及暗电流等因素的干扰, 需要对原始高光谱图像进行黑白校正, 校正公式如式(1)

I=Iraw-IdarkIwhite-Idark×100%(1)

式(1)中, I是校正后的图像, Iraw是原始图像, Iwhite是标准白板的校正图像, Idark是反射率接近0的暗光谱校正图像。

1.4 数据处理

1.4.1 主成分分析

原始光谱提供了丰富的信息, 但各波长之间存在一定的相关性, 可能会有重叠冗余的信息, 常使用主成分分析(principal component analysis, PCA)减少各波长之间的线性相关影响, 保留下来的特征信息之间没有重复或冗余。

1.4.2 支持向量机

支持向量机(support vector machine, SVM)是基于统计学习方法提出的一种机器学习方法, 其核心思想是通过核函数将输入向量映射到一个更高维的空间, 在这个空间中寻找一个超平面, 使得超平面与各数据点之间的距离最大。 SVM适用于高维度、 小样本、 非线性等问题, 本研究中数据量少, 样本分布不明确, 所以使用SVM识别梨的早期损伤及损伤时间[12]

1.4.3 k-近邻算法

k近邻(k-nearest neighbor, k-NN)算法是一种简单、 有效的算法, 主要思想是在确定已知类别的样本后, 计算特征空间中未知样本与最近k个已知类别样本的距离来确定未知样本的属类[4]

1.4.4 ResNet50网络与迁移学习

深度学习在应用过程中, 大多使用RGB图像, 而果实的内部缺陷等信息并不能直观的由RGB图像显示, 需要通过高光谱图像反映, 但高光谱图像所包含的数据信息较大, 大数据集的建立较难, 处理相比于RGB图像更加复杂, 导致训练出来的模型精度不够。 迁移学习是一种新的学习范式, 可以大大缩短训练时间, 并且对小数据集也能实现较高的精度[13]

RestNet50网络由16个残差块堆叠而成, 网络深度达到50层, 有较强的特征提取能力, 并且能够解决网络深度带来的网络退化和梯度消失等问题, 使得网络的性能不会因为网络深度增加而下降, 而且残差块中的跳跃连接没有引入新参数, 也没有增加模型计算量[14, 15]。 使用ImageNet数据集预训练ResNet50网络, 把预训练好的权重作为初始化权值迁移到水晶梨损伤数据集上进行训练与微调, 最终得到基于ResNet50网络迁移学习的水晶梨损伤时间检测模型。

2 结果与讨论
2.1 高光谱图像预处理及主成分分析

为了选择合适的特征图像, 保留更多损伤信息, 对原始图像先使用PCA降维, 前8个主成分包含了原图像99%的信息, 如图3所示。 由图3可见, PC4、 PC5和PC6中均清晰地显示了梨的损伤区域, 将这3个主成分作为检测水晶梨压伤的特征图像, 然后用掩模图像与特征图像相乘, 减少计算量并消除背景的影响, 得到去除背景后的光谱图像。

图3 基于轻微损伤样本全波段PCA的前8个主成分图像Fig.3 The first 8 PC images based on full-band PCA of slightly bruised samples

2.2 图像扩充及样本划分

为了增加样本数量, 对拼接后的水晶梨特征图像随机进行上下翻转、 左右翻转, 最终得到无损伤、 挤压损伤24 h和挤压损伤48 h的特征图像各160张, 然后按照9∶ 1比例随机划分样本的训练集和测试集。 为使输入的图像数据符合基于ResNet50网络迁移学习的要求, 把图像尺寸缩放成224× 224× 3; 对于k-NN和SVM, 因为计算时参数过多需要花费的时间过长, 将图像缩放为64× 64× 3后输入2种模型。

2.3 判别模型建立

SVM模型采用径向基核函数(RBF), 通过网格搜索确定惩罚因子C=4, 回归误差权重γ 设置为样本特征数的倒数。 k-NN模型的性能与k值、 权重值(weights)以及距离计算公式紧密相关。 权重有两个取值, 一个是uniform, 每个相邻点与观测点距离的权重都是相同的, 另一个取值为distance, 权重值为邻近点到该点距离的倒数, 距查询点近的近邻比远处的近邻具有更大的影响力。 通过网格搜索确定模型参数k=8, 权重选用distance, 距离计算公式为曼哈顿距离。 相比于原来的ResNet50网络, 基于ResNet50网络的迁移学习模型更改了全连接层模块结构, 在分类器中添加dropout操作。 加入一个线性函数, 把最后一个全连接层的输入连接到有256个输出单元的线性层, 接着连接Relu层和dropout层, 设置dropout=0.4, 训练时随机舍弃全连接层40%的神经元个数用于防止过拟合, 最后是256× 3的线性层, 输出为3通道的softmax层。 各模型对梨损伤的识别结果如表1所示。

表1 SVM, k-NN和ResNet50网络迁移学习判别模型识别结果 Table 1 Recognition results using discriminant models using SVM, k-NN and ResNet50 for network transfer learning

表1可见, 基于ResNet50网络的迁移学习模型预测识别率为93.75%, 优于SVM的83.33%和k-NN的85.42%。 另外, SVM和k-NN模型的训练集精度远高于测试集, 出现了过拟合现象。 总体上, 基于ResNet50网络的迁移学习模型预测效果最好, SVM模型的预测效果最差。

各模型对挤压损伤识别的混淆矩阵如图4所示, 从图中可见, 对于无损伤样本3个模型均能正确识别, SVM将31%损伤24 h的样本误判为损伤48 h, 将16%损伤48 h的样本误判为无损伤样本, 将5%损伤48 h的样本误判为损伤24 h; k-NN分别将7%损伤24 h和7%损伤48 h的样本误判为无损伤样本, 7%损伤24 h的样本误判为损伤48 h, 27%损伤48 h的样本误判为损伤24 h; ResNet50网络迁移学习模型将17%损伤24 h的样本误判为损伤48 h, 将5%损伤48 h的样本误判为损伤24 h。 结果表明, ResNet50网络迁移学习模型对挤压损伤24 h和挤压损伤48 h样本均具有较高的识别准确率。

图4 各模型对挤压损伤时间预测识别的混淆矩阵Fig.4 Confusion matrix of each model for the identification of crush bruise time

与本研究相似的还有陈欣欣等[5]2017年利用高光谱成像技术对库尔勒梨早期损伤进行快速识别检测, 采集了无损伤样本和损伤后1~7 d样本的高光谱图像, 建立支持向量机判别模型, 识别准确率达到93.75%; 林思寒等[16]2018年以翠冠梨表面机械碰压损伤为研究对象, 分别采集了无损伤样本、 损伤后1~7, 11和14 d的翠冠梨高光谱图像数据, 建立偏最小二乘线性判别分析模型, 整体识别率为84%, 去除第一天的损伤数据识别准确率达到92.22%- 损伤24 h内的样本识别难度较大。

3 结论

采用高光谱图像技术建立了无损伤、 挤压损伤24 h和挤压损伤48 h的水晶梨样品识别模型, 对高光谱图像进行主成分分析及数据扩充后, 分别建立了SVM、 k-NN和基于ResNet50网络的迁移学习识别模型, 并综合比较了各模型的识别效果。 结果表明, 主成分分析能够快速、 有效地提取特征图像、 减少模型输入变量; 基于ResNet50网络的迁移学习模型识别效果最佳, 其对测试集无损伤、 挤压损伤24 h和挤压损伤48 h的水晶梨正确识别率分别达到100%, 83%和95%; 表明, 高光谱图像技术结合基于ResNet50网络的迁移学习方法可以快速、 无损地预测水晶梨的损伤时间。

参考文献
[1] GUO Wen-chuan, WANG Ming-hai, YUE Rong(郭文川, 王铭海, 岳绒). Transactions of the Chinese Society for Agricultural Machinery(农业机械学报), 2013, 44(2): 142. [本文引用:1]
[2] Zhang M, Li C, Takeda F, et al. Transactions of the ASABE, 2017, 60(5): 1489. [本文引用:2]
[3] Pan X Y, Sun L J, Li Y S, et al. Journal of the Science of Food and Agriculture, 2019, 99(4): 1709. [本文引用:1]
[4] SUN Shi-peng, PENG Jun, LI Rui, et al(孙世鹏, 彭俊, 李瑞, ). Food Science(食品科学), 2017, 38(2): 301. [本文引用:2]
[5] CHEN Xin-xin, GUO Chen-tong, ZHANG Chu, et al(陈欣欣, 郭辰彤, 张初, ). Spectroscopy and Spectral Analysis(光谱学与光谱分析), 2017, 37(1): 150. [本文引用:2]
[6] Jiang H, Zhang C, He Y, et al. Applied Sciences-Basel, 2016, 6(12): 450. [本文引用:1]
[7] TIAN You-wen, WU Wei, LU Shi-qian, et al(田有文, 吴伟, 卢时铅, ). Food Science(食品科学), 2021, 42(19): 260. [本文引用:1]
[8] Zhang M Y, Jiang Y, Li C Y, et al. Biosystems Engineering, 2020, 192: 159. [本文引用:1]
[9] Wang Z D, Hu M H, Zhai G T. Sensors, 2018, 18(4): 1126. [本文引用:1]
[10] Azizah L M, Umayah S F, Riyadi S, et al. Deep Learning Implementation Using Convolutional Nerual Network in Mangosteen Surface Defect Detection. 2017 7th IEEE International Conference on Control System, Computing and Engineering (ICCSCE), 2017. 242. doi: DOI:10.1109/ICCSCE.2017.8284412. [本文引用:1]
[11] Bai Yuhao, Xiong Yingjun, Huang Jichao, et al. Postharvest Biology and Technology, 2019, 156: 110943. [本文引用:1]
[12] WEI Chen-jie, WANG Ji-fen, ZENG Xiao-hu(卫辰洁, 王继芬, 曾啸虎). Journal of Instrumental Analysis(分析测试学报), 2021, 40(7): 1043. [本文引用:1]
[13] YU Xiao-na, HUANG Liang, CHEN Peng-di(余晓娜, 黄亮, 陈朋弟). Journal of Chongqing University(重庆大学学报), 2022, https://kns.cnki.net/kcms/detail/50.1044.N.20210615.1554.005.html. [本文引用:1]
[14] He K, Zhang X, Ren S, et al. Deep Residual Learning for Image Recognition, 2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2016. 770. doi: DOI:10.1109/CVPR.2016.90. [本文引用:1]
[15] WANG Chun-shan, ZHOU Ji, WU Hua-rui, et al(王春山, 周冀, 吴华瑞, ). Transactions of the Chinese Society of Agricultural Engineering(农业工程学报), 2020, 36(20): 209. [本文引用:1]
[16] LIN Si-han, LI Jing, XUE Long, et al(林思寒, 黎静, 薛龙, ). Acta Agriculturae Universitatis Jiangxiensis(江西农业大学学报), 2018, 40(4): 835. [本文引用:1]