基于空间可分辨光谱的番茄成熟度判别方法研究
黄玉萍1,3, 2, 戚超1, 陈坤杰1,*
1. 南京农业大学工学院, 江苏 南京 210031
2. United States Department of Agriculture Agricultural Research Service (USDA/ARS), Michigan State University, East Lansing, MI 48824, USA
3. Department of Biosystems and Agricultural Engineering, Michigan State University, East Lansing, MI 48824, USA;
*通讯联系人  e-mail: kunjiechen@njau.edu.cn

作者简介: 黄玉萍, 女, 1988年生, 南京农业大学工学院博士研究生 e-mail: H.Y.P_2010@163.com

摘要

对基于空间可分辨光谱的番茄成熟度分类判别方法进行了试验研究。 首先根据番茄的内部颜色, 将600个番茄分为6个不同成熟度 (green, breaker, turning, pink, light red and red) , 然后用自行开发的多通道高光谱成像探头采集番茄的空间可分辨(SR)光谱, 建立基于空间可分辨光谱的番茄成熟度偏最小二乘判别(PLSDA) 模型和支持向量机判别(SVMDA)模型。 结果显示, 对于PLSDA模型, SR光谱15为最佳分类光谱, 分类正确率达到81.3%; 对于SVMDA模型, SR光谱10为最佳预测分类光谱, 分类正确率为86.3%。 对六个成熟度等级番茄的判别分类, SVMDA模型要明显优于PLSDA模型。 此外, 相对于较小的光源-检测器距离SR光谱, 较大的光源-检测器距离SR光谱可以获得更好的判别效果, 显示出空间可分辨光谱在果蔬品质检测方面的应用潜力。

关键词: 空间可分辨; 成熟度; 番茄; 多通道高光谱成像
中图分类号:O657.3 文献标志码:A
Tomato Maturity Classification Based on Spatially Resolved Spectra
HUANG Yu-ping1,3, Renfu Lu2, QI Chao1, CHEN Kun-jie1,*
1. College of Engineering, Nanjing Agricultural University, Nanjing 210031, China
2. United States Department of Agriculture Agricultural Research Service (USDA/ARS), Michigan State University, East Lansing, MI 48824, USA
3. Department of Biosystems and Agricultural Engineering, Michigan State University, East Lansing, MI 48824, USA;
*Corresponding author
Abstract

A multichannel hyperspectral imaging probe with 30 optic fibers covering the wavelength range of 550~1 650 nm and the light source-detector distances of 1.5~36 mm was recently developed for property and quality assessment of food products. Spatially resolved spectra were acquired using the new developed multichannel probe for 600 “Sun Bright” tomato fruit, which were grouped into six maturity grades (i.e., green, breaker, turning, pink, light red, red), based on their internal color distributions. Partial least squares discriminant analysis (PLSDA) and support vector machine discriminant analysis (SVMDA) models for the 15 spatially resolved spectra were developed and compared to determine the optimal models for classification of tomato maturity. The results showed that for PLSDA models, SR spectra 15 gave the best classification results with the accuracy of 81.3%, while for SVMDA models, SR spectra 10 had the best accuracy of 86.3%. Overall, SVMDA models will provide better performance than PLSDA models for tomato maturity classification. Moreover, spatially resolved spectra with larger source-detector distances could offer better classification results, which suggests that spatially resolved spectra has potential for measuring fruit and vegetables quality.

Keyword: Spatially resolved spectra; Maturity; Tomato; Multichannel hyperspectral imaging probe
引 言

番茄富含多种营养成分, 如糖, 有机酸, 维他命C等[1, 2], 已成为世界第二大消费果蔬产品[3]。 番茄成熟度能确定果实采摘时间及评估收获后质量, 是番茄质量属性的重要指标之一。 番茄颜色特征与成熟度有着密切的联系, 随着番茄的成熟, 叶绿素和花青素以及其他色素的变化使得番茄表面和内部颜色由绿色转变为红色, 番茄内部纹理特征和化学成分也会随之变化[4]。 因此, 颜色是评价番茄成熟度的一个重要参数。 此外, 当番茄生长成熟时, 番茄由内而外开始转变颜色, 因而, 番茄内部颜色更能表征番茄的成熟度。

近年来, 许多无损检测技术被用于评估番茄成熟度, 包括机器视觉[5], 可见/近红外光谱技术[6, 7, 8], 电子鼻技术[9, 10], 核磁共振成像技术[11], 空间偏移拉曼光谱技术[12], 以及光谱成像技术[13]。 其中机器视觉技术被广泛用于番茄的表面颜色分级, 但对于番茄内部颜色的评估却存在困难。 由于可见/近红外光谱技术所测光量与样品的组成和结构有关, 可以提供样品的特性和品质的定量信息, 因而被广泛用来检测番茄的化学成分、 品质并评估番茄的成熟度[14, 15, 16]。 然而, 对于番茄这种多层结构的样品(果皮, 果肉, 种子等), 常规的可见/近红外光谱技术无法提供空间可分辨信息, 因此, 常规的可见/近红外光谱技术在精确评估番茄成熟度时将存在一定的问题。

空间可分辨(SR)光谱测量, 通过恒定强度点光源产生不同光源-检测器距离的反射率, 可获得多个包含有样品不同深度信息的光谱。 远的光源-检测器距离SR光谱可提供样品更深层信息, 而近的光源-检测器距离SR光谱可以提供样品的表层信息。 因此, SR光谱测量技术能更准确的评估样品的内部和外部特征。 但是, 目前现有的SR光谱技术的光源-检测器距离通常限制在10 mm以内, 且检测探头一般为刚性的, 仅适合检测平面样品, 不适合检测表面弧形及不规则形状蔬菜水果, 而且检测深度也很有限。

本文运用所开发的多通道高光谱成像探头, 在550~1 650 nm波长区间覆盖1.5~36 mm光源-检测距离, 同时采集番茄的30个SR反射光谱, 探索最优番茄成熟度分类光谱, 研究利用SR光谱技术进行番茄成熟度分类的方法。

1 实验部分
1.1 材料

实验所用的600个不同成熟度的番茄均手工采自美国密歇根州立大学的园艺研究与教学中心(Holt, Michigan, USA)。 番茄洗净擦拭, 光谱采集后, 将番茄切开, 根据美国农业部制定的不同番茄成熟期颜色标准[17], 通过视觉观察将番茄分为六类(green, breaker, turning, pink, light red and red), 如图1所示。 其中Green阶段88个样本, Breaker阶段84个样本, Turning阶段123个样本, Pink阶段102 个样本, Light Red 阶段94个样本, Red阶段109个样本。

图1 根据内部颜色确定的番茄不同成熟度Fig.1 Different maturity stages for tomatoes according to their internalcolor

1.2 空间可分辨光谱采集

将多通道高光谱成像探头(简称多通道探头)按照文献[18]所述方法校正后, 安装在多通道高光谱成像系统(Model 1003B-10152, Headwall Photonics, Inc., Fitchburg, MA, USA) 上, 如图2(a)所示。 高光谱成像系统由成像光谱仪, InGaAs相机, 35根检测光纤(又叫通道)和相关硬件组成。 与传统的高光谱成像系统不同, 多通道高光谱成像系统用35根检测光纤代替了物镜放置在狭缝上采集接收的光量。 多通道探头由一根直径为910 μ m 的光源光纤和30根3组不同尺寸的接收光纤组成, 如图2(b)所示。 30根接收光纤在空间光源-检测器距离为1.5~36 mm, 对称布置在光源光纤两侧, 从而使每次测量均可获得两次重复。 接收光纤另一端通过SMA连接器与多通道高光谱成像系统其中的30根检测光纤连接。 而光源光纤另一端连接到石英卤钨灯光源控制系统(Model #69931, Thermo Oriel Instruments, Stratford, CT, USA) 。

图2 空间分辨光谱系统(a)多通道高光谱成像探头(b)Fig.2 Schematic of the multichannel hyperspectral imaging (MHI) probe for acquisition of 30 spatially-resolved reflectance spectra from a sample at distances between 1.5 and 36 mm (a), and the arrangement of 30 fibers of three sizes (50, 105, and 200 μ m) on the flexible probe (b)

光谱采集时, 多通道高光谱成像系统曝光时间设置为60 ms, 光源功率240 W, 多通道探头直接接触番茄样品和参比样本, 同时获得30个SR光谱, 参比样本为直径80 mm的白色圆柱特氟龙(Teflon), 对番茄赤道的两个对立面进行光谱采集, 取其平均值作为下一步的数据分析。 此外, 由于30根接收光纤是对称布置, 其平均值后的15个SR光谱用于番茄的成熟度分类数据分析。

1.3 光谱处理与建模方法

为了减少仪器本身带来的误差, 相对光谱强度I用来分析和建模, I根据式(1)得出

I=S-DR-D(1)

其中S为样品原始光谱, R为参比光谱, D为暗场光谱。

600个不同成熟度的番茄被随机分成含有360个样本的训练集和含有240个样本的预测集。 采用软件MATLAB R2016b (The MathWorks, Inc., Natick, MA, USA) 和PLS Toolbox 8.2 (Eigenvector Research, Inc., Wenatchee, WA, USA) 建立番茄成熟度的偏最小二乘判别分析(PLSDA)模型和支持向量机判别分析(SVMDA)模型。 运用威尼斯百叶窗交叉验证法, 并结合最小交叉验证的分类误差平均值或随着因子数增加分类结果没有提高来确定最佳潜在变量数量。

2 结果与讨论
2.1 不同成熟度番茄的空间可分辨光谱

图3显示了在550~1 650 nm光谱区域, 分别从三组不同尺寸光纤(50, 105和200 μ m)获得的六个不同成熟度番茄的平均相对光谱。 由图可知, 在560和675 nm, 不同成熟度番茄的平均光谱有明显差异, 这可能是由于不同成熟阶段番茄花青素和叶绿素的变化产生[4]。 由于番茄中水分含量较高, 光谱在近红外区域受O— H键影响较大, 因此, 在970, 1 180以及1 340 nm波段出现明显的水分吸收带, 而且水分对光源-检测器距离较远的SR光谱影响更为明显[如图3(b)和(c)所示]。 而源-检测器距离较近的光谱影响较小, 如图3(a)所示。 另外, 进一步分析图3还可以发现, 不同光源-检测器距离的SR光谱形状有较大的差异, 这从另一方面说明, SR光谱能提供样品不同深度的有用信息, 为不同成熟度番茄的分类提供了可能。

图3 50, 105和200 μ m光纤分别覆盖光源-检测器距离(a)3 mm, (b) 9 mm和(c) 16 mm获得的番茄六个不同成熟度的平均相对光谱Fig.3 Mean relative reflectance spectra for six tomatoes of different maturity stages acquired by the multichannel hyperspectral imaging probe for channel 2 of 50 μ m with the light source-detector distance of 3 mm (a), channel 6 of 105 μ m with the source-detector distance of 9 mm (b) and channel 10 of 200 μ m with the source-detector distance of 16 mm

2.2 基于空间可分辨光谱的番茄成熟度分类

根据1.3节所述方法, 利用训练集样本建立15个SR光谱的番茄成熟度分类PLSDA和SVMDA模型, 然后再利用验证集对模型进行验证。 两个模型对训练集和验证集样本的分类正确率如表1所示。 从表1可以看出, 不同的光源-检测器距离的SR光谱对番茄成熟度分类判别正确率有明显不同, 基于光源-检测器距离最近的SR光谱建立的PLSDA模型和SVMDA模型的分类效果明显较差, 这可能由于光源-检测器距离过近使获得的光谱稳定性较差或样品中光的散射不均匀性影响。 光源-检测器距离在9.6~20或24 mm区间的SR光谱分类正确率较好, PLSDA模型分类准确率在80%左右, 而SVMDA模型分类率在85%左右。 光源-检测器距离较近的SR光谱有助于分析样品的散射信息, 而光源-检测器距离较远的光谱能有效评估样品的吸收信息, 而散射信息与样品的结构或物理特征有关, 吸收信息与样品的化学成分相关。 上述结果说明, 番茄成熟度的准确识别需选择恰当的光源-检测器距离, 通过光在样品中的吸收和散射, 从而准确识别番茄的不同成熟度, 这也从另一方面说明, 番茄不同成熟度的化学成分和纹理特征会有所差异, 且内部颜色特征与其内部成分及纹理特征具有一定相关性。 除了靠近光源的两个SR光谱, SVMDA模型分类准确率均高于80%, 同时, 绝大部分空间可分辨光谱所建SVMDA模型分类率高于相对应的PLSDA模型, 平均高1.5%~11.1%。

表1 基于15个空间可分辨光谱建立的番茄成熟度PLSDA和SVMD分类模型分类正确率(%) Table 1 Overall classification accuracies (in percent) of tomatoes based on each of 15 spatially resolved spectra (channels) by using PLSDA and SVMDA models(%)

表1显示, 对于每一个SR光谱, SVMDA模型的番茄成熟度分类正确率都高于PLSDA模型。 这表明, 在利用SR光谱进行番茄成熟度分类时, SVMDA模型较PLSDA模型更具有潜力和优势。

进一步分析表1可知, 对于PLSDA模型, 基于SR光谱15得出的番茄成熟度分类正确率最高, 因此, 可以确定光谱15为最佳SR光谱通道。 如果进一步对基于最佳空间可分辨光谱通道建立的PLSDA模型对番茄六个成熟度分类结果进行分析, 发现SR光谱15的PLSDA模型对番茄六个成熟度的分类正确率均可达到80%以上(见表2), 其中Green和Red阶段分类准确率较好, 分别为100%和95.7%, 其对应的预测集分类效果也相应较好, 分别为94.4%和89.7%。 而对于其余四阶段的成熟度, 判错样本大部分集中在其相邻的两个成熟度阶段, 说明在番茄的成熟过程中, 相邻成熟阶段的差异性不是太显著。

表2 基于PLSDA模型最佳空间可分辨光谱15对番茄六个成熟度的分类结果 Table 2 Classification results for the six maturity stages of tomatoes in the test set by using PLSDA model for the optimal channel spatially resolved spectra 15

对于SVMDA模型, 基于SR光谱10建立的SVMDA模型, 总的番茄成熟度分类正确率最高, 因此, 可以确定, 光谱10是最佳SR光谱通道。 同样, 进一步给出基于最佳SR光谱通道建立的SVMDA模型对番茄六个成熟度的分类结果, 如表3所示, 对于训练集样本, 除去Breaker和Turning两成熟度样本的分类正确率较低外, 其余样本的分类正确率均在90%以上, 其中Green阶段分类率达到100%。 类似的, 预测集中Breaker和Turning两个成熟度样本的分类正确率也明显较低。 但与表2中PLSDA模型的分类结果相比, 其分类正确率还是有一定的提高, 尤其是Pink和Light Red成熟度样本分类正确率提高的十分显著, 分别提高了11.1%和12.1%。 这进一步说明在番茄成熟度分类识别中, SVMDA模型比PLSDA模型具有更高的分类正确率。

进一步的分析研究发现, 15个单一SR光谱番茄成熟度的分类结果(如表1, 表2表3所示)均显示, 随着光源-检测器距离的增大, 模型对番茄成熟度的判别正确率呈上升趋势, SVMDA模型表现的尤其明显。 另外, PLSDA模型最佳SR光谱15(即光源-检测器距离为最大的36 mm)和SVMDA模型的最佳SR光谱10(即光源-检测器距离为16mm)也显示, 对番茄成熟度分类而言, 较大的光源-检测器距离SR光谱可以获得比较小的光源-检测器距离相对更好的结果。 这可能是因为不同的光源-检测器距离(即通道)获得的光谱反映不同光子路径与不同深度的组织结构, 较大的光源-检测器距离SR光谱可以获得番茄内部更深层、 更多的有关成熟度方面的信息, 因而对番茄成熟度的分类判别正确率更高。 该结果说明, SR光谱具有更好预测番茄成熟度的能力, 是一种具有很大潜力的农产品品质检测方法。

表3 基于SVMDA模型最佳空间可分辨光谱10对番茄六个成熟度分类结果 Table 3 Classification results for the six maturity stages of tomatoes in the test set by using SVMDA model for the optimal spatially resolved spectra 10
3 结 论

对于基于SR光谱建立的番茄成熟度PLSDA和SVMDA判别分类模型, 光谱15和10分别为PLSDA和SVMDA分类模型的最优SR光谱, 番茄成熟度总体分类正确率分别为81.3%和86.3%, SVMDA模型比PLSDA模型具有更高的分类正确率。 随着光源-检测器距离的增大, 两个模型对番茄成熟度的判别正确率均呈上升趋势。 较大的光源-检测器距离可以获得番茄内部更深层、 更多的内部信息, 因此, SR光谱是一种具有较大潜力的农产品品质检测方法。

The authors have declared that no competing interests exist.

参考文献
[1] Zhu Q, He C, Lu R, et al. Postharvest Biology and Technology, 2015, 103: 27. [本文引用:1]
[2] Xie L, Ying Y, Ying T, et al. Analytica Chimica Acta, 2017, 584(2): 379. [本文引用:1]
[3] Dorais M, Ehret D L, Papadopoulos A P. Phytochemistry Reviews, 2008, 7(2): 231. [本文引用:1]
[4] Qin J, Lu R. Postharvest Biology and Technology, 2008, 49(3): 355. [本文引用:2]
[5] Arefi A, Motlagh A M, Mollazade K, et al. Australian Journal of Crop Science, 2011, 5(10): 1144. [本文引用:1]
[6] Tiwari G, Slaughter D C, Cantwell M. Postharvest Biology and Technology, 2013, 86: 221. [本文引用:1]
[7] Sirisomboon P, Tanaka M, Kojima T, et al. Journal of Food Engineering, 2012, 112(3): 218. [本文引用:1]
[8] Clément A, Dorais M, Vernon M. Journal of Agricultural and Food Chemistry, 2018, 56(5): 1538. [本文引用:1]
[9] Gómez A H, Hu G, Wang J, et al. Computers and Electronics in Agriculture, 2006, 54(1): 44. [本文引用:1]
[10] Yibin Z, Jun W. Transactions of The Chinese Society of Agricultural Engineering, 2015, 4: 25. [本文引用:1]
[11] Zhang L, McCarthy M J. Postharvest Biology and Technology, 2012, 67: 37. [本文引用:1]
[12] Qin J, Chao K, Kim M S. Postharvest Biology and Technology, 2012, 71: 21. [本文引用:1]
[13] Polder G, van der Heijden G W, Young I. Transactions of the ASAE, 2002, 45(4): 1155. [本文引用:1]
[14] Clément A, Dorais M, Vernon M. Journal of Agricultural and Food Chemistry, 2008, 56(21): 9813. [本文引用:1]
[15] Peiris K, Dull G, Leffler R, et al. Journal of the American Society for Horticultural Science, 1998, 123(6): 1089. [本文引用:1]
[16] Saad A G, Jaiswal P, Jha S N. International Journal of Advanced Research, 2014, 2(12): 632. [本文引用:1]
[17] USDA. U. S. Stand ards for Grades of Fresh Tomatoes. United States Department of Agriculture, Agricultural Marketing Service, Washington DC, 1991. [本文引用:1]
[18] Huang Y, Lu R, Chen K. Postharvest Biology and Technology, 2017, 133: 88. [本文引用:1]