基于电磁振动上料的茶梗和昆虫异物近红外光谱和荧光图像在线检测研究
孙旭东1,2, 廖琪城1, 韩熹3, HasanAydin4, 谢冬福1, 龚志远1, 付伟1, 王欣鹏1
1. 华东交通大学机电与车辆工程学院, 江西 南昌 330013
2. 载运工具与装备教育部重点实验室(华东交通大学), 江西 南昌 330013
3. 北京伟创英图科技有限公司, 北京 100070
4. International Agricultural Research and Training Center (IARTC) , Menemen-ⅰzmir 35660, Turkey

作者简介: 孙旭东, 1978年生,华东交通大学机电与车辆工程学院副教授 e-mail: 874916937@qq.com

摘要

茶叶是大众青睐的健康饮品之一, 但茶叶在机器采收和加工过程中, 容易混入茶梗和昆虫异物, 污染茶叶、 影响其质量安全, 是未来应防范和检测的重点。 X射线成像技术, 根据食品基质和异物的密度差实施检测, 广泛适用于金属异物并延伸至高密度塑料, 但对于茶梗、 昆虫这类低密度有机异物尚不适用, 所以迫切需要研发新型无损检测技术和方法。 针对片状茶叶重叠、 遮掩异物的问题, 提出了电磁振动上料辅助近红外光谱和荧光图像的检测方案, 进行绿茶中的内源性异物茶梗和外源性异物昆虫的在线检测研究。 通过电磁振动上料辅助近红外光谱和荧光成像系统, 采集了600~1 050 nm范围的近红外光谱600条和RGB-N四通道图像各65幅。 采用451条光谱进行建模, 其余149条光谱作为预测集, 评估模型的性能, 比较了去趋势(Detrending)、 多元散射校正(MSC)、 标准正态变换(SNV)、 变权重正态变换(VSN)、 迭代自适应加权惩罚最小二乘法(airPLS)、 不对称最小二乘法(ALS)、 光程估计与校正(OPLEC)等不同光谱预处理方法的处理效果, 其中OPLEC能较好地消除散射效应, 偏最小二乘判别分析(PLS-DA)模型的正确识别率由78%提高到85%。 结果表明, 近红外光谱结合OPLEC能够更加准确地检出茶叶中的茶梗和昆虫异物。 与近红外光谱的精确点测量相比, 图像提供了较大范围的检测手段。 对65幅蓝色(B通道)图像进行分析, 采用最大类间方差法进行阈值分割后, 对图像进行取反运算、 中值滤波、 连通区域标记和特征提取, 提取出长轴长、 短轴长、 长短轴比、 离心率四个特征变量, 采用267个感兴趣目标, 建立了线性判别分析(LDA)模型, 用未参与建模的88个感兴趣目标来评价模型的预测能力, 正确识别率达到了64%。 实验结果表明, 电磁振动上料辅助近红外光谱和荧光图像在线检测茶梗和昆虫异物具备可行性, 为食品中有机异物在线检测提供了低成本的解决方案。

关键词: 近红外光谱; 荧光; 食品异物; 茶叶; 电磁振动
中图分类号:O439 文献标识码:A
Research on Online Detection of Tea Stalks and Insect Foreign Bodies by Near-Infrared Spectroscopy and Fluorescence Image Combined With Electromagnetic Vibration Feeding
SUN Xu-dong1,2, LIAO Qi-cheng1, HAN Xi3, Hasan Aydin4, XIE Dong-fu1, GONG Zhi-yuan1, FU Wei1, WANG Xin-peng1
1. School of Mechatronics & Vehicle Engineering, East China Jiaotong University, Nanchang 330013, China
2. Key Laboratory of Conveyance Equipment (East China Jiaotong University), Ministry of Education, Nanchang 330013, China
3. Beijing Weichuang Yingtu Technology Co., Ltd., Beijing 100070, China
4. International Agricultural Research and Training Center (IARTC), Menemen-ⅰzmir 35660, Turkey
Abstract

Tea is one of the health drinks favored by the consumer, but during the process of tea machine harvesting and processing, it is easy to be mixed with tea stalks and foreign insect bodies. It resulted in pollution and influenced the quality and safety of tea products. In the future, we should focus on preventing and detecting of foreign bodies. X-ray imaging technology, based on the density difference between food substrate and foreign bodies, is widely applied to detect metal foreign bodies and extended to high-density plastic. However, it is not suitable for low-density organic foreign bodies such as tea stem insects, so it is urgent to develop a new and non-destructive detection technology and method. In order to solve the problem of overlapping and covering foreign bodies in tea leaves, a scheme of electromagnetic vibration feeding assisted near-infrared spectroscopy(NIRS), and fluorescence image was proposed to online detect endogenous foreign bodies of tea stalks and insects.A total of 600 NIRSranging from 600 to 1 050 nm, and 65 channel images including R, G, B and N were collected by electromagnetic vibration-assisted NIRS and fluorescence imaging system. Among them, 451 spectra were used to develop the model, and the remaining 149 spectra were used to evaluate model performance. The effects of different correction methods such as detrending, multiplicative scatter correction (MSC), standard normal variate transformation (SNV), variable sorting for normalization(VSN), adaptive iteratively reweighted penalized least squares(airPLS), alternative least squares(ALS),optical path length estimation and correction (OPLEC) were compared. OPLEC could eliminate the scattering effect better, and the correct recognition rate of the partial least squares discriminant analysis (PLS-DA) model of NIRS increased from 78% to 85%. The results showed that the calibration method of OPLEC combined with the PLS-DA model could- detect foreign bodies in tea more accurately.Compared with the accurate measurement of NIRS, imaging technologyprovided a wider range of detection means. Sixty-five clear blue (B) channel images were analyzed. Using threshold segmentation by maximum interclass variance method, inversing operation, median filtering, connected component labeling and feature extraction, we extracted four feature variables of long axis length, short axis length, short axis ratio and eccentricity, a total of 355 objects of interest.The linear discriminant analysis (LDA) model was established with 267 interesting targets, and 88 interested targets not involved in modeling were used to evaluate the model's prediction ability. The correct recognition rate reached 64%.The experimental results show that electromagnetic vibration feeding assisted NIRS and fluorescence image is feasible for online detection of tea stalk and foreign insect bodies, providing a low-cost solution for online detection of organic foreign bodies in food.

Key words: Near-infrared spectroscopy (NIRS); Fluorescence; Food foreign body; Tea; Electromagnetic vibration
引言

茶叶是受消费者青睐的健康饮品。 但茶叶在机器采摘过程中, 茶虫和茶梗极易被机器误割, 形成外源性昆虫异物和内源性茶梗异物, 污染茶叶原材料。 在食品异物投诉事件中, 昆虫异物投诉比例高达25%[1]。 昆虫和茶梗属于低密度有机异物, 主流的X射线成像检测技术很难适用[1, 2, 3, 4]。 迫切需要研发在线检测技术, 在茶叶加工过程中实施在线检测。

基于硅基探测器的短波近红外光谱, 波长范围位于500~1 000 nm之间, 具有低成本、 稳定、 快速、 无损等优点[5], 适于集成在食品生产线上, 实施在线检测, 满足食品行业的低成本检测需求。 研究人员开展了食品异物近红外光谱检测研究, Biancolillo等[6]采用近红外光谱判别虫蚀大米, 正确识别率为97.5%。 Moscetti等[7, 8]应用近红外光谱检测橄榄和板栗中的害虫, 利用遗传算法筛选出6个特征变量建模, 模型的错误判别率分别为6.25%和8.41%。 Wang等[9]应用近红外光谱的透射、 反射和混合三种模式检测虫蚀红枣, 正确识别率分别为97.0%, 90.0%和100%。 Jamshidi等[10]应用近红外光谱检测石榴螟和角豆蛾, 模型的正确识别率为90.6%。

近红外光谱和图像融合, 能同时提供被测物料的光谱和图像信息, 为农业食品物料检测提供了新手段。 例如, Tashima等[11]开发了一套基于SLD阵列和CMOS传感器的近红外在线检测设备, 将3 mm宽的昆虫和0.1 mm直径的毛发分别嵌入到5 mm厚的火腿和巧克力中, 昆虫和毛发均被成功检出。 Phetchalern等[12]开发了一套近红外透射设备, 由激光二极管和CMOS相机组成, 利用透射图像能观察到2mm厚火腿片下的木棒(直径为0.3 mm)、 30 mm厚鱼肉和20 mm厚鸡翅中的骨头。 Yin等[13]应用近红外光谱结合图像, 检测面包片上黏附的金属、 聚丙烯塑料和毛发异物, 近红外光谱能进行精确的点测量, 模型的正确识别率分别为98%, 94%和91%; 而图像提供了大范围的检测手段, 改进U-net模型的正确识别率分别为95%, 93%和92%。

食品异物检测的关键在于充分利用食品基质和异物的差异性。 近红外光谱和RGB图像主要应用食品基质和异物的分光反射特性实施检测, 而荧光图像利用紫外诱导物料产生荧光的特性进行检测。 Lohumi等[14]开发了一种基于LCTF的荧光多光谱成像设备, 选取特定的荧光波长对鲜切蔬菜进行检测, 结果表明, 荧光图像与RGB图像结合, 可以检出透明的彩色塑料片、 残皮、 不同种类的昆虫、 小金属片和不同种类的木片, 包括原木(深色)和加工过的木材, 如牙签和耳塞等异物, 正确识别率达到了95%。 但LCTF荧光成像设备昂贵, 很难满足农业和食品行业低成本的检测需求。 紫外光诱导荧光是低成本、 易实现的荧光成像技术, 适合农业和食品物料的低成本检测需求。 Everard等[15]搭建了一套推扫式高光谱成像系统, 当菠菜表面的粪便浓度处于1:1到1:10范围时, 荧光图像对粪便污染的检出率均为100%; 而紫外图像对1:20和1:30稀释程度粪便的检出率分别为99%和87%。 Mustafic等[16]研制了一种以蓝光和紫外光为激发光源、 单反相机采集荧光图像的设备, 对棉花中的8种植物性异物(树皮、 苞片、 棕叶、 绿叶、 外壳、 种皮、 种子、 茎)和4种非植物性异物(纸、 麻绳、 塑料包装、 塑料袋)进行检测, 结果表明所有异物均可激发荧光, 并且蓝色LED为树皮、 棕叶、 苞片、 绿叶、 壳和茎的最佳激发光, 而紫外LED为纸张、 塑料袋、 塑料包装、 种子、 种皮和麻绳的最佳激发光。 但图像检测过程中, 由于物料的堆叠或者异物被掩盖, 容易形成误判。 电磁振动能较好地实现食品基质和异物的分离, 提高检测精度, 是图像检测的有效辅助手段。

综上, 近红外光谱主要反映食品基质和异物的分光反射特性, 荧光图像反映食品基质和异物的形状和色素含量差异。 本论文主要研究(1)基于近红外光谱的昆虫和茶梗异物在线检测方法。 (2)电磁振动上料辅助荧光图像的昆虫和茶梗异物在线检测方法。

1 实验部分
1.1 样品

茶叶在机器采摘过程中, 茶梗和昆虫极易被机器误割, 混入原叶中形成内源性和外源性异物。 绿茶占茶叶总产量的70%, 是我国的主要茶叶饮品, 故选用龙井绿茶作为实验样品, 由南昌某茶叶公司提供。 昆虫异物选择面包虫, 长度和直径分别为10~20和1~1.5 mm; 茶梗异物的长度和直径分别为12~35和1~2 mm。 将所用的茶叶、 茶梗以及面包虫清洗干净后, 置于烘干箱中。 烘干箱温度控制在48 ℃左右, 烘干时间为12 h。 烘干后, 取出样品分别装载在自封袋内备用。

1.2 光谱和图像系统

近红外光谱和荧光成像系统如图1所示, 由北京伟创英图科技有限公司提供, 主要包括: 调速移动平台、 步进电机、 卤钨灯(12 V、 50 W)、 紫外灯(1 W、 波长395~400 nm)、 环形光纤探头、 光路切换器(具有参比自动测量及系统自检)、 光电限位开关、 OtO近红外光谱仪(430~1 100 nm)、 SeeCAM_CU40相机、 台式电脑。 环形光纤探头和相机镜头到调速移动平台的距离分别为14.5和16 cm。 环形光纤探头的环形光纤槽直径2 cm、 槽宽3 mm, 卤钨灯通过光纤将光传输至环形光纤槽; 环形光纤槽发出的光, 经物料漫反射由探头接收, 经光纤传输至近红外光谱仪。 轻型电磁给料机的最大振幅为1.2 mm, 频率50 Hz。 实验中设置振幅为0.8 mm, 能较好地将异物和茶叶分离, 避免重叠形成误判。 轻型电磁给料机将茶叶和异物直接振动至样品槽内。 样品槽镶嵌在移动平台上, 为敞开的长方体结构。 样品槽四周为铝合金材料、 底部为白色聚四氟乙烯(PTFE)(厚5 mm), 尺寸为59 cm× 3.7 cm× 1 cm。 近红外光谱仪和相机均通过USB数据线连接到台式机上, 采用多光谱成像与近红外光谱检测软件系统, 采集近红外光谱和图像数据。

图1 近红外光谱和荧光图像系统示意图Fig.1 Schematic diagram of near infrared spectroscopy and fluorescence imaging system

1.3 光谱采集

光谱采集前系统预热30 min, 同时设置系统参数, 开启卤钨灯电源, 积分时间设为1 000 μ s, 平均次数为10次, 移动平台速度为5 cm· s-1。 光谱仪设置为连续触发模式, 触发动作的启动和停止由光电限位开关控制, 样品槽头端进入采集工位启动触发, 样品槽尾端离开采集工位停止触发, 样品槽运动过程中连续记录100条近红外光谱; 光谱记录过程中, 同步触发相机采集图像, 每条光谱均对应保存一帧图像。 采用人工肉眼复检, 通过图像标记每条光谱{1, 2, 3}, 分别对应绿茶、 茶梗和面包虫。 首先, 采集参比光谱; 控制移动平台和空白样品槽平移, 连续记录100条参比光谱。 接着, 采集样品光谱; 将面包虫和茶梗与绿茶混合均匀后, 缓慢倒入轻型电磁给料机上, 由轻型电磁给料机振动上料, 平移台同步移动, 同样记录100条光谱, 由软件自动转换成吸光度光谱, 取信噪比较好的600~1 050 nm波段进行建模和模型预测。 重复上述实验, 共收集绿茶、 面包虫和茶梗光谱各200条。

1.4 图像采集

SeeCAM_CU40相机为四通道多光谱相机(R, G, B和850 nm)。 茶叶和昆虫、 茶梗异物的色素含量存在显著差异, 紫外光源(395~400 nm)照射样品后, 在460 nm附近的光谱强弱差异最明显, SeeCAM_CU40相机的B通道图像较为清晰, 故采用B通道图像进行分析计算。 系统预热30 min, 开启紫外灯电源, 手动调节相机镜头至图像清晰为止, 相机曝光时间设为62.5 ms, 图幅设为1 344× 760 pixels2。 轻型电磁给料机振幅设为0.8 mm, 移动平台的速度设为5 cm· s-1。 将面包虫、 茶梗和绿茶混合均匀, 缓慢倒入轻型电磁给料机上, 经电磁振动分离异物和茶叶, 落入样品槽内。 相机采用连续触发模式, 也由光电限位开关控制触发的启动和停止。 采集到昆虫异物的R, G, B和850 nm通道图像如图2所示。

图2 昆虫异物的R(a), G(b), B(c)和850 nm(d)通道图像Fig.2 R (a), G (b), B (c) and 850 nm (d) channel images of insect foreign bodies

1.5 数据处理

绿茶属于片状物料, 在近红外光谱采集过程中, 容易产生散射。 光程估计与校正方法(optical path-length estimation and correction, OPLEC)由陈增萍教授团队提出, 是一种将光谱校正与回归结合的算法, 能较好地校正光的散射效应[17, 18]

OPLEC采用建模集光谱数据与对应的浓度向量, 估计因物理性质差异引起的光散射乘子效应参数; 然后, 由建立的双校正模型预测值比值消除预测集样本的乘子效应, 具体步骤如下:

首先, 将光谱数据S(n× m, n为样本数, m为波长数)进行奇异值(SVD)分解[U, S, V]=svd(S); 然后, 设置主成分数值v(v代表光谱抽象的活性化学成分数), 取前v个的Uv, 乘子效应矢量p通过下列约束最小化获得

minpf(p)=12pT((I-UvUTv)+diag(c/w)(I-UvUTv)diag(c/w))p(1)

式(1)中, -p≤ -1, diag(c/w)是c/w的对角矩阵, w是权重。

最后, 建立双模型

diag(p)c=α1l+Sβ1p=α2l+Sβ2(2)

式(2)中, l是元素为1的矢量, diag(p)为对角元素为p对应元素的对角矩阵; α 1, β 1, α 2, β 2由偏最小二乘法求得。 预测集Spre的浓度值cpre

cpre=α1l+Sβ1α2l+Sβ2(3)

同时, 去趋势(Detrending)、 多元散射校正(MSC)、 标准正态变换(SNV)、 变权重正态变换(VSN)、 迭代自适应加权惩罚最小二乘法(airPLS)、 不对称最小二乘法(ALS)等光谱预处理方法也被尝试了。 以光谱变量作为输入变量X, 以食品和异物类别作为输出变量Y{1, 2, 3}, 应用偏最小二乘判别分析法建模(PLS-DA), 其中1, 2, 3分别代表绿茶、 茶梗、 昆虫。

图像处理包含图像分割, 取反运算, 中值滤波, 连通区域标记, 特征提取。 提取长轴长、 短轴长、 长短轴比、 离心率共4个特征变量, 作为输入变量X, 输出变量Y同上。 因为输入变量X维数较低, 故采用线性判别分析建模。 上述算法均在MATLAB R2017a中实现。 模型均采用正确判别率、 召回率、 精确率和F得分, 评价模型的性能。 在预测模型中, 将污染物的数据定义为真阳性(TP)类, 将纯绿茶数据定义为真阴性(TN)类。 因此, 假阳性(FP)和假阴性(FN)分别表示将纯茶叶误判为污染物和将污染物误判为茶叶, 如式(4)— 式(7)所示。

R=TPTP+FN×100%(4)

P=TPTP+FP×100%(5)

F=2P×RP+R×100%(6)

Accuraccy=TP+TNTP+TN+FP+FN×100%(7)

2 结果与讨论
2.1 茶叶异物近红外光谱识别

2.1.1 近红外光谱特征分析

图3(a)为聚四氟乙烯(PTFE)、 绿茶、 茶梗和面包虫的近红外平均光谱响应曲线。 由图3(a)可知, PTFE为样品槽底部材料, 其近红外光谱在600~1 050 nm范围无明显的吸收。 如果采集的是空白区域(PTFE)的光谱, 在光谱分析和异物识别过程中予以忽略。 纯绿茶在670和760 nm附近有明显的吸收, 而茶梗在670 nm附近也有吸收峰。 670 nm附近的吸收峰主要是由色素引起的, 绿茶茶叶中的儿茶素比茶梗中的儿茶素含量高, 而茶色素是由儿茶素聚合而成, 因此茶叶的茶色素含量较茶梗高些, 吸收峰值也较大[19]。 760 nm主要由水分子四倍频振动引起[20]。 从光谱整体形状上来讲, 越过740 nm吸光度突然降低, 750 nm之后区域较为平缓, 主要是由于该区域处于可见光(380~780 nm)和近红外光(780~2 500 nm)的过渡区域。 图3(b)为纯茶叶、 含有茶梗或面包虫异物茶叶的主成分得分图, 仅依靠第一和第二主成分很难区分茶叶和异物, 需要在更高维空间进行分析。

图3 茶叶和异物的近红外光谱(a)及主成分得分图(b)Fig.3 Near infrared spectra of tea and foreign bodies (a) and score of principal component analysis (b)

2.1.2 OPLEC光谱预处理

OPLEC采用双模型策略, 估算乘子效应参数, 实施光程校正。 参数v代表被测目标的活性化学成分数, 是OPLEC算法的关键参数, 通过求约束最小化问题minf(p)求解。 绘制minf(p)与v的关系曲线, 通过观察, 最小minf(p)对应的v即为最佳v值。 随着v的增加, minf(p)值逐渐降低, 当v值增加到11以后, minf(p)值无明显变化, 所以最佳v值确定为11。 这意味着有效光谱信息与乘子效应矢量p主要包含在Uv的前11个变量中。 同时, 最小预测均方根误差(RMSEP)变化曲线也被绘制了, 当v值为11时, RMSEP达到最小, 综合此时的RMSEP和v取值, 效果达到最佳。 采用OPLEC预处理后, 异物正确识别率由78%提高至85%。

图4 minf(p)与v的关系曲线(a)以及OPLEC模型的RMSEP值变化曲线(b)Fig.4 The relationship between minf(p) and v (a) and variation of RMSEP values for OPLEC model (b)

2.1.3 近红外光谱建模及预测

采用Kennard-Stone(K-S)算法将600条光谱划分成建模集和预测集, 其中451条光谱建模, 其余的149条光谱作为独立样品集, 用于评价模型的性能。 偏最小二乘判别分析算法(PLS-DA)是较为广泛应用的判别分析方法。 采用原始光谱建立的PLS-DA, 预测新样品, 正确识别率为78%, 模型预测决定系数 Rp2为0.77。 为了与OPLEC算法进行比较, 也尝试了Detrending, MSC, SNV, VSN, airPLS和ALS等光谱预处理方法, 原始吸光度光谱经各种光谱预处理后, 建立PLS-DA模型, 并进行预测, 结果如表1所示。 这些光谱预处理方法, 并未提高PLS-DA模型的预测能力。 相反地, 模型的预测精度反而降低了。 这主要是由于光谱的基线漂移, 也反映了茶叶和异物的光谱差异性, 进行基线校正, 相当于削弱了茶叶和异物之间的光谱差异。 其中, SNV和MSC都可进行基线校正, 但MSC需要输入外部参数, 而SNV不需要任何参数, 它们的处理结果是相同的[21]。 茶叶属于片状分散性物料, 不同的样品分布容易引起光程的变化, 而且实验结果也说明OPLEC能较好地抑制光程变化, 预处理后建模效果也较好, 正确识别率提高到85%。

表1 各种预处理结合PLS-DA模型预测结果 Table 1 Results of prediction using PLS-DA and different pretreatment methods

近红外光谱在线检测时, 需要对样品槽的载物状态进行预判, 以决定进一步的操作。 由图3(a)可知, 在750~850 nm范围聚四氟乙烯(PTFE)的近红外光谱明显上升, 而其他物料的近红外光谱则平稳且略微下降, 选取850和750 nm两波长的比值预判样品槽是否有物料。 若比值大于1, 则样品槽空载, OPLEC-PLS-DA模型不预测(用0表示); 若比值小于等于1, 则表示载有物料, 将采集到的光谱代入OPLEC-PLS-DA模型, 判别是属于茶叶还是异物。 若为异物, 则将信号传递给后端执行器, 剔除异物。

OPLEC⁃PLS⁃DA, λ850nmλ750nm10, λ850nmλ750nm> 1(8)

2.2 茶叶异物荧光图像识别

2.2.1 荧光图像分割

与近红外光谱技术相比, 图像能扫描的范围更大, 可以在较大范围内进行异物检测。 采集了65张含有异物的荧光图像, 其中, 33张为混有茶梗的绿茶图像, 32张为混有面包虫的绿茶图像。 样品槽底为白色的PTFE材料, 反射较强, 因此在原始图像上灰度值较大, 接近于1; 而茶叶和异物区域, 反射较弱, 图像灰度值更趋向于0。 利用目标与背景在灰度值上的差异, 通过阈值分割, 提取目标。 采用最大类间方差法(OTSU)获取自动阈值T, 按照式(9)对原始图像f(x, y)实现分割后得g(x, y)二值图像。

g(x, y)=1, f(x, y)T0, f(x, y)< T(9)

由图5(c)和(d)可知, 目标区域(茶叶和异物)和背景区域得到了较好的分割, 供后续连通区域标记和特征提取使用。

图5 茶梗和昆虫异物的B通道原始图像及处理结果
(a), (b): B通道的原始图像; (c), (d): 二值化图像; (e), (f): 取反运算的图像; (g), (h): 中值滤波后的图像
Fig.5 Original and processed images of tea stalk and insect foreign bodies obtained by channel B
(a), (b) were the original images of channel B; (c) and (d) were the binarization image after threshold segmentation; (e) and (f) were the inverse images; (g) and (h) were the images with median filter

2.2.2 特征提取

图像分割后, 采用取反运算, 因为阈值分割时目标被赋值为0, 而图像连通区域标记是以1为目标进行标记的, 故需要进行取反运算[图5(e, f)]; 然后进行中值滤波, 去除细小噪声点[图5(g, h)], 对中值滤波后的图像进行连通区域标记, 最后运用MATLAB R2017a的图像处理工具箱中的特征提取函数(regionprops)提取特征。 实验中, 主要提取了离心率(E)、 长轴长度(L)、 短轴长度(W), 计算了长短轴比(L/W)。 从茶叶和异物的几何形状特征来看, 绿茶呈片状、 长短轴比要略小于异物, 边缘曲线变化较为平缓, 离心率要小于茶梗和昆虫异物; 茶梗和面包虫异物多呈直线型, 长短轴比要大于茶叶基质, 端点尖角处曲线变化幅度较大, 离心率要大于茶叶基质(表2)。 故实验中, 通过B通道图像, 提取离心率、 长轴长、 短轴长三个特征变量, 计算长短轴比, 共四个变量和355个感兴趣目标(35个茶梗、 35个面包虫和285个绿茶目标)用于后续的建模和模型预测。

表2 提取的绿茶和异物几何形状特征 Table 2 Geometry features of green tea and foreign bodies extracted from images

2.2.3 LDA建模和预测

运用K-S方法将采集到的355个感兴趣目标进行划分, 将267个感兴趣目标划入建模集, 剩余的88个感兴趣目标划入预测集, 用于评价模型的预测性能。 每幅图均按照上述方法提取变量, 从B通道图像中, 提取了四个特征变量。 考虑到变量数量较少, 故采用线性判别分析算法(LDA)进行建模和模型预测。 LDA建模的正确识别率为69%, 采用预测集评价LDA模型的预测能力, 正确识别率为64%。 本实验的正确识别率, 低于Lohumi等[14]的鲜切蔬菜中异物识别率。 主要是由于他们采用高精度的LCTF荧光成像设备, 采集的图像对比度优于本实验图像。 但考虑到, 农业食品对象对低成本的需求, 本实验的紫外诱导荧光成像技术, 更适合食品异物的低成本检测需求。 由表3可知, 预测集中茶梗、 绿茶、 面包虫召回率为50%, 63%和88%, 精确率为22%, 98%和29%, F得分为31%, 76%和44%, 说明茶梗的召回率要低于面包虫。 由于茶梗和面包虫的形状接近, 离心率和长短轴比较为相近, 因此有4个茶梗异物被误判为面包虫, 但是没有被误判为绿茶。 由表3的预测结果可知, 16个异物被成功检出11个, 存在4个茶梗被误判为昆虫, 1个昆虫异物被误判为绿茶。 而分别有13和14个绿茶样本被误判为昆虫和茶梗异物, 导致正确识别率下降, F得分较低。 通过人工复检图像发现, 主要是由于绿茶的叶柄导致了误判。 综上, 运用电磁振动上料辅助荧光图像进行茶梗和昆虫异物的在线检测具备可行性。 对于误判问题, 后续可以从颜色、 几何形状等多种特征角度实施检测, 降低误判率。

表3 LDA建模和模型预测结果 Table 3 Results of LDA calibration and prediction

在无电磁振动上料时, 茶叶基质和异物容易混堆在一起, 异物无法暴露出来, 增加了异物检测的难度。 而采用电磁振动上料, 能较好地分离茶叶与异物, 再结合荧光成像, 能够实现对茶叶中异物的检测, 降低了异物混入茶叶的风险。 电磁振动上料的效率影响在线检测效果, 本文采用上料速度(5 cm· s-1)、 图像宽度(3.3 cm)、 单位时间内落料的重量(3.251 g· cm-2)的乘积估算上料效率, 约为53.64(g· s-1)。 在实际应用中, 可以通过提高图像视域宽度(例如线阵相机)和提高图像采集速率等方式, 提高在线检测的效率。

3 结论

进行了电磁振动上料辅助近红外光谱和荧光图像在线检测茶梗和昆虫异物的可行性研究。 近红外光谱能实现较为精确的点测量, OPLEC结合近红外光谱能较好地消除散射效应, 正确识别率从78%提高到85%。 与近红外光谱相比, 紫外诱导荧光成像技术提供了较大范围的食品异物检测手段, 利用B通道图像获取的四个特征变量, 建立的LDA定性判别模型, 正确识别率达到了64%。 虽然检测精度较低, 但仍有提升空间, 为食品异物低成本在线检测提供了解决方案。

参考文献
[1] Sun X, Li J, Shen Y, et al. Frontiers in Nutrition, 2021, 8: 757491. [本文引用:2]
[2] Ok G, Park K, Lim M C, et al. Journal of Food Engineering, 2018, 221: 124. [本文引用:1]
[3] SUN Xu-dong, LIU Jun-bin(孙旭东, 刘俊彬). Spectroscopy and Spectral Analysis(光谱学与光谱分析), 2021, 41(9): 2723. [本文引用:1]
[4] Sun X, Cui D, Shen Y, et al. Infrared Physics & Technology, 2022, 121: 104018. [本文引用:1]
[5] SUN Xu-dong(孙旭东). Journal of East China Jiaotong University(华东交通大学学报), 2020, 37(S1): 1. [本文引用:1]
[6] Biancolillo A, Firmani P, Bucci R, et al. Microchemical Journal, 2019, 145: 252. [本文引用:1]
[7] Moscetti R, Haff R P, Stella E, et al. Postharvest Biology and Technology, 2015, 99: 58. [本文引用:1]
[8] Moscetti R, Haff R P, Saranwong S, et al. Postharvest Biology and Technology, 2014, 87: 88. [本文引用:1]
[9] Wang J, Nakano K, Ohashi S, et al. Journal of Food Engineering, 2010, 101(1): 78. [本文引用:1]
[10] Jamshidi B, Mohajerani E, Farazmand H, et al. Spectrochimica Acta Part A: Molecular and Biomolecular Spectroscopy, 2019, 206: 552. [本文引用:1]
[11] Tashima H, Genta T, Ishii Y, et al. Proceedings of SPIE, 2013, 8841: 884117. [本文引用:1]
[12] Phetchalern S, Tashima H, Ishii Y, et al. Proceedings of SPIE, 2014, 9192: 91921A. [本文引用:1]
[13] Yin J, Hameed S, Xie L, et al. Journal of Food Measurement and Characterization, 2021, 15: 189. [本文引用:1]
[14] Lohumi S, Cho B, Hong S. Computers and Electronics in Agriculture, 2021, 180: 105912. [本文引用:2]
[15] Everard C D, Kim M S, Lee H. Journal of Food Engineering, 2014, 143: 139. [本文引用:1]
[16] Mustafic A, Li C, Haidekker M. Journal of Biological Engineering, 2014, 8(1): 29. [本文引用:1]
[17] Chen Z P, Morris J, Martin E. Analytical Chemistry, 2006, 78(22): 7674. [本文引用:1]
[18] Jin J W, Chen Z P, Li L M, et al. Analytical Chemistry, 2012, 84(1): 320. [本文引用:1]
[19] Sasaki T, Koshi E, Take H, et al. Food Chemistry, 2017, 220: 177. [本文引用:1]
[20] LIU Hui-jun, Jin, LIN Min, et al(刘辉军, 吕进, 林敏, 等). Journal of China Jiliang University(中国计量学院学报), 2005, 16(3): 188. [本文引用:1]
[21] Tamburini E, Vincenzi F, Costa S, et al. Sensors, 2017, 17(10): 2366. [本文引用:1]