高光谱成像融合特征波长筛选监测番茄贮藏中品质变化的方法
贾梦梦, 殷勇*, 于慧春, 袁云霞, 王志豪
河南科技大学食品与生物工程学院, 河南 洛阳 471023
*通讯作者 e-mail: yinyong@haust.edu.cn

作者简介: 贾梦梦, 1993年生, 河南科技大学食品与生物工程学院研究生 e-mail: 18437916277@139.com

摘要

利用高光谱成像技术(HSI)采集了300个不同贮藏时间的番茄高光谱图像, 在所界定的有效波段中提取特征波长的基础上, 构建了番茄贮藏过程中品质变化的马氏距离监测模型, 实现了番茄贮藏过程中的品质变化监测。 首先, 采用多元散射校正(MSC)结合Savizky-Golay卷积平滑(SG)方法对高光谱原始数据进行了预处理, 以消除基线漂移及噪声信号等影响。 其次, 基于光谱曲线在不同波段范围的变化趋势, 并结合全波段下Wilks Λ最小值对应主成分在各个波长下的权重系数定义了可凸显番茄贮藏过程中品质变化的有效波段。 随后, 分别在全波段和有效波段采用连续投影算法(SPA)、 竞争性自适应加权算法(CARS)和Wilks Λ统计量融合主成分分析3种筛选特征波长的方法进行特征波长的提取, 通过对比分析3种方法提取的特征波长数量, 指出了基于 Wilks Λ统计量融合主成分分析可以有效降低数据维度, 简化运算过程。 接着对基于 Wilks Λ统计量融合主成分分析在全波段和有效波段筛选出的主成分进行分析, 指出了在有效波段基于Wilks Λ统计量融合主成分分析进行特征波长的提取可以很好地避免冗余信息对有效信息的掩盖作用, 还可以进一步降低数据维度。 最后, 对分别以贮藏第1日和番茄腐败临界日为监测基准日构建番茄贮藏过程中品质变化的马氏距离监测模型的优缺点进行了分析, 指出以贮藏第1日为监测基准日构建的模型更具有有效性和可靠性。 研究结果表明: 基于Wilks Λ统计量融合主成分分析提取的特征波长个数为最少(5个), 且筛选出的主成分能够有效地表征番茄贮藏过程中品质变化的差异性。 为利用高光谱成像技术监测番茄贮藏过程中的品质变化提供了一种有效的特征波长提取方法。

关键词: 高光谱成像技术; 特征波长提取; Wilks Λ统计量; 贮藏; 番茄; 马氏距离
中图分类号:TS205.9 文献标志码:A
Hyperspectral Imaging Combined With Feature Wavelength Screening for Monitoring the Quality Change of Tomato During Storage
JIA Meng-meng, YIN Yong*, YU Hui-chun, YUAN Yun-xia, WANG Zhi-hao
College of Food and Bioengineering, Henan University of Science and Technology, Luoyang 471023, China
*Corresponding author
Abstract

In order to realize the rapid monitoring of quality change during tomato storage, 300 tomato hyperspectral images with different storage data were collected by hyperspectral imaging technology (HSI), and a Mahalanobis distance monitoring model for quality change during tomato storage was constructed based on extracting feature wavelengths from the defined effective wavelength bands. Then the quality change monitoring during tomato storage was realized. Firstly, the hyperspectral raw data is preprocessed using multiplicative scatter correction (MSC) combined with Savizky-Golay convolutional smoothing (SG) to eliminate the effects of baseline drift and noisy signals and so on. Secondly, based on the variation trend of the spectral curve in different bands and combined with the weight coefficient of principal components corresponding to the minimum value of Wilks Λ statistic in the whole band, the effective band that can highlight the quality change in the tomato storage process is defined. Thirdly, three feature wavelength screening methods, namely, successive projections algorithm (SPA), competitive adaptive reweighted sampling (CARS) and principal component analysis based on Wilks Λ statistics, are used to extract feature wavelengths in the full band and effective band, respectively; By comparing and analyzing the number of feature wavelengths extracted by the three methods, it is pointed out that the fusion principal component analysis based on Wilks Λ statistics can effectively reduce the data dimension and simplify the operation process. Then, the principal components screened in the full band, and effective band based on Wilks Λ statistics coupled with principal component analysis are analyzed. It is pointed out that the extraction of feature wavelength based on Wilks Λ statistics fusion principal component analysis in the effective band can avoid the masking effect of redundant information on effective information effectively and further reduce the data dimension. Finally, the advantages and disadvantages of the Mahalanobis distance monitoring model for quality change during tomato storage constructed based on the first storage day and the critical day of tomato spoilage are analyzed, and it is pointed out that the model constructed by the first storage day as the monitoring benchmark has higher effectiveness and reliability. The results show that the number of feature wavelengths extracted based on Wilks Λ statistic combined with principal component analysis under the effective band is the least (5 feature wavelengths), and the selected principal components can effectively represent the difference between the quality change during tomato storage. At the same time, it also provides an effective feature wavelength extraction method for monitoring the quality changes during tomato storage by hyperspectral imaging technology.

Keyword: Hyperspectral imaging technology; Feature wavelength extraction; Wilks Λ statistic; Storage; Tomato; Mahalanobis distance
引言

番茄富含维生素、 番茄红素等对人体有益的营养要素, 因此深受大众喜爱[1]。 据统计, 2020年中国番茄产量约达6 515万吨, 番茄出口数量达到21.8万吨[2]。 番茄是一种呼吸跃变型的水果蔬菜, 存在后熟现象; 从其生长发育停滞到开始衰老的阶段, 其呼吸速率会骤然升高, 出现一个呼吸高峰, 这往往会导致其在贮藏过程中出现快速腐败而造成巨大的浪费[3]。 因此, 实现番茄在贮藏过程中快速、 可靠、 准确的品质变化监测, 对降低番茄在贮藏过程中的浪费十分必要。

通过测量可滴定酸、 硬度、 可溶性固形物等传统的物理化学指标来表征番茄的品质不仅耗时耗力, 还有使用化学试剂等污染缺陷。 另外, 检测少量的理化指标仅能反映番茄的局部品质变化, 且作者发现不同品种的番茄可表征腐败的理化指标差异较大。 故检测这些理化指标能否有效、 充分地表征不同品种的番茄在贮藏过程中的品质变化目前尚难以定论。

能够代表农产品品质变化的一些属性主要反映在可见光范围内。 高光谱成像(hyperspectral imaging, HSI)技术覆盖了可见光和近红外光谱。 HIS技术不仅可以获得反映被测农产品内部组成和结构的光谱信息, 还可以获得被测农产品外部形状和表面缺陷的图像信息。 许丽佳等[4]采用HIS技术实现了猕猴桃糖度的快速检测, 为农产品检测快速化、 精准化、 智慧化发展提供了一定的理论依据和技术支撑。 Yu等[5]利用HIS技术建立了罗非鱼鱼片平均光谱与其TVB-N含量之间的校正模型, 证明了HIS技术结合数据融合分析在农产品新鲜度无损评价中具有很大的可行性。 Reddy等[6]使用HIS技术和多变量数据分析对樱桃的内部品质参数进行了研究, 表明HIS技术有潜力应用于在线分级系统。 综上所述, HIS技术可有效弥补理化实验复杂、 耗时的缺点, 且能够较充分地反映农产品的整体属性, 并实现农产品品质及成分的快速绿色检测。 但目前有关番茄贮藏过程中品质监测的高光谱技术研究尚未见报道。

以番茄贮藏中通过监测光谱信息的变化来表征番茄品质的变化为切入点。 首先, 利用HIS技术对番茄样本进行了光谱数据的采集。 其次, 在使用多元散射校正(multiplicative scatter correction, MSC)结合卷积平滑算法(SG)对黑白校正后的高光谱数据进行了预处理之后, 分别在全波段和有效波段采用3种特征波长筛选方法提取特征波长。 随后, 通过对比分析在不同波段使用不同特征波长筛选方法的优缺点及获得的特征波长数量, 以期获得最优特征波长筛选方法。 最后, 基于最优特征波长筛选方法提取的特征波长构建番茄贮藏过程中品质变化的马氏距离监测模型, 希望能为实现番茄贮藏过程中品质变化的快速绿色检测提供一种新尝试。

1 实验部分
1.1 样品制备

试验所用番茄购买于河南省洛阳市大张超市。 2020年9月10日采摘自山西长治, 品种为左粉, 开始贮藏日期为2020年9月13日。 为能够在较短时间内获得评估番茄品质的必要信息, 将番茄常温置于贮藏库中, 温度变化范围为24.5~27.1 ℃, 相对湿度变化范围为 64.9%~66.1%。 每天在固定时间内随机取出18~19个番茄进行光谱信息的采集, 每个番茄可制成2~3片番茄样本, 共50个采集样本。 同时, 每天从贮藏库中随机取出3个番茄用于理化指标的测定, 即: 采用折光仪测定总可溶性固形物含量, 采用碱式滴定法测定可滴定酸, 采用pH计测定pH。

贮藏第5日, 贮藏库中发现一个由于磕碰而腐败的番茄, 并及时将其清理出贮藏库, 但由于其腐败所产生的某些挥发性的致腐因子可能残留在贮藏库, 从而加速其他番茄样本品质的腐败。 在贮藏6日后, 番茄品质已发生明显变化, 部分番茄样本出现大量组织液渗出, 表皮长有菌毛、 黑斑, 这说明此时的番茄已不具备研究价值, 故共采集了6 d的高光谱信息及理化数据。

1.2 HSI系统与图像采集

试验所用HSI系统主要由光谱仪(型号为IST50-3810, 德国, 光谱分辨率为2.8 nm, 光谱采集范围为371.05~1 023.82 nm)、 4只由德国 ESYLUX 公司生产的RK90000420108 型号的500 W的可调节光纤卤素灯、 高精度电机控制的传送系统(自制)以及计算器构成。

每次试验前先将仪器开启预热0.5 h, 使光源和采集系统在采集番茄高光谱数据前均达到稳定状态。 每次试验, 将1个番茄样本置于传送平台上干净的培养皿中, 并使用SICap-STVR软件采集番茄样本的高光谱数据, 每天采集50个番茄样本, 采集6 d, 共300个番茄样本。 经调试, 进行番茄高光谱数据采集时, 相机与样本间的距离设置为260 mm, 传送装置的移动速度设置为1.75 mm· s-1, CCD相机曝光时间设置为90 ms。

利用ENVI 5.31软件从采集的番茄高光谱图像中选择样本赤道附近200 P× 200 P范围为感兴趣区域(ROI), 并以该范围的光谱平均反射值作为番茄原始高光谱数据。 使用式(1)对番茄原始平均高光谱数据进行校正, 以减少暗电流和不均匀光照对数据产生的影响。

R=I-DW-D(1)

式(1)中: R为经黑白板校正的番茄平均高光谱数据; I为番茄原始平均高光谱数据; D为通过CCD相机扫描标准黑板获得的平均高光谱数据; W为通过CCD相机扫描标准白板获得的平均高光谱数据。

1.3 理化指标的测定

影响番茄品质的理化指标包括可滴定酸、 可溶性固形物等, 因此结合测定各个理化指标的耗时程度, 选择可滴定酸、 可溶性固形物、 pH和糖酸比作为待测理化指标。

1.3.1 可滴定酸

参照国家标准GB/T 12293— 90《水果、 蔬菜制品— — 可滴定酸的测定》中的指示剂滴定法进行可滴定酸的测定。 均匀称取10.0 g番茄的可食部分, 放入研钵中研磨至匀浆, 加入适量蒸馏水并移至250 mL锥形瓶, 置76 ℃水浴加热30 min, 冷却至室温, 摇匀过滤, 随后定容于100 mL的定容瓶。 用移液管将20 mL样品溶液移入洁净的锥形瓶, 并加入3~5滴酚酞, 最后使用0.05 mol· L-1的NaOH溶液进行滴定。 取3个平行样本, 每个样本滴定3次, 滴定结果取均值。 可滴定酸含量的计算公式如式(2)所示。

W(%)=0.67×100×c×V1×V0m×V3(2)

式(2)中: W(%)为待测样本含酸量; c为滴定液NaOH的浓度, 单位为mol· L-1; V1为标准滴定液NaOH的消耗体积, 单位为mL; V0为待测样本滤液的总体积, 单位为mL; m为待测样本的质量, 单位为g; V3为待滴定滤液的体积, 单位为mL。

1.3.2 可溶性固形物(SSC)

可溶性固形物(SSC)的测定按照国家标准GB/T 12295-90《水果、 蔬菜制品— — 可溶性固形物含量的测定— — 折射仪法》进行。 取3个平行样本, 每个样本测量3次, 以平均值作为测量结果。

1.3.3 pH测定

番茄样品pH的测量按照国家标准GB 10468-89《水果和蔬菜产品pH值的测定方法》中的测定方法进行。

1.3.4 糖酸比

糖酸比的总糖度以可溶性固形物含量为准, 总酸度以可滴定酸为准, 其计算过程见式(3)。

M=m1m2(3)

式(3)中: M为糖酸比; m1为总糖度; m2为总酸度。

1.4 数据预处理

为了减少采集光谱数据时基线漂移、 光散射、 随机噪声等对原始高光谱数据产生的影响[7], 采用MSC结合Savizky-Golay卷积平滑(SG)的预处理方法。 MSC可以通过平均光谱来校正光谱数据的基线平移和偏移, 还可以有效提高数据与光谱的相关性。 SG平滑可以快速高效地消除噪声信号对数据的影响, 且最大程度保留番茄的原始数据信息。

1.5 特征波长筛选

为解决原始高光谱数据量大、 噪声和冗余信息较多等问题, 拟对光谱数据进行降维处理。 采用连续投影算法(successive projections algorithm, SPA)、 竞争性自适应加权算法(competitive adaptive reweighted sampling, CARS)和基于 Wilks Λ 统计量融合主成分分析3种算法分别在全波段和有效波段(有效波段的界定详见下文2.4部分)筛选出能够表征番茄贮藏过程中品质变化的特征波长。

SPA是利用向量的投影分析选择出具有最小共线性和冗余性的光谱特征变量的集合。 CARS算法, 首先需要通过自适应加权的方法进行采样, 然后将PLSR模型回归系数中较大绝对值对应的波长变量作为1个新子集, 并去除绝对值较小的波长变量, 然后构建新子集的PLS模型并对其进行交互验证, 最小均方根误差(RMSE)对应的新子集中的波长即为选定的特征波长[8]

基于Wilks Λ 统计量融合主成分分析的方法筛选特征波长, 需要先通过主成分分析法(principal component analysis, PCA)获得主成分变量, 并对主成分变量构建Wilks Λ 统计量, 随后计算并按升序排列各主成分变量对应的Wilks Λ 值, 最后提取出Wilks Λ 最小值对应的主成分并计算其在各个波长下的权重系数, 权重系数的波峰和波谷对应的波长即为筛选出的特征波长[9]

1.6 监测基准日确定

Xue[10]等的研究表明高光谱信息具有全面性; 而适宜的特征波长又能够表征番茄贮藏过程中的品质变化。 故可通过特征波长分析不同贮藏时间的番茄的光谱平均反射值的折线图来初步确定监测基准日。

1.7 贮藏中品质变化监测模型构建

马氏距离(Mahalanobis distance, MD)不仅是一种不受量纲影响的距离度量, 还可以消除变量之间相关性的干扰。 因此拟采用马氏距离构建能够反映番茄贮藏过程中品质变化的监测模型。 距离值越小说明番茄品质越接近监测基准日的品质, 距离值越大说明番茄的品质与监测基准日的品质相差越远。 马氏距离计算公式如式(4)所示。

di2=(Xi-y)S-1(Xi-y)T(4)

式(4)中: di2为贮藏第i日的番茄品质与监测基准日的番茄品质间的马氏距离值的平方; Xi为贮藏第i日的番茄的特征光谱信息的表征向量; y为监测基准日的特征光谱信息的表征向量; S为监测基准日的特征光谱信息的协方差矩阵。

2 结果与讨论
2.1 理化指标分析

在番茄的贮藏过程中, 其可溶性固形物含量(SSC)、 可滴定酸(TA)、 糖酸比(RTT)以及pH的测量结果如表1所示。 由表1可以发现, SSC的含量呈现出递减趋势, 但在贮藏第3日略有升高, 这可能是因为当天随机选取的番茄样本在贮藏初期由于生理作用导致其含有的淀粉、 果胶等物质转化为可溶性固形物的结果。 而TA, RTT和pH的含量变化均无明显的规律性。 这些理化指标的测量结果说明了通过部分理化指标来表征番茄贮藏过程中的品质变化是非常困难的, 可靠性与准确性也难以保障。 为了运用SPA和CARS来提取特征波长, 以期和基于Wilks Λ 统计量融合主成分分析筛选出的特征波长结果进行对比, 这里只能选取有一定变化规律的SSC指标作为SPA和CARS这两种方法的计算用指标。

表1 番茄贮藏过程中的4种指标测量值 Table 1 Four quality index values of tomato during storage
2.2 番茄的光谱曲线

番茄样本高光谱图像的采集范围是371.05~1 023.82 nm。 由于371.05~446.74和1 005.58~1 023.82 nm范围的光谱受噪声影响明显, 且信噪比较低, 故选用447.26~1 005.08 nm(共1 101个分析波长)范围的光谱作为全波段分析光谱。 图1分别为在贮藏第1, 3和5日随机选取的一条光谱曲线, 可看出, 3条光谱曲线呈现出了相似的变化趋势。 表明不同贮藏时间的番茄内部成分基本一致, 但内部成分含量随贮藏时间的变化导致了番茄样本光谱平均反射值存在差异。 由图1还可看出, 光谱曲线在580.47~634.22 nm范围内有强烈的反射, 这表明番茄的一些品质属性在这一波段内可以得到突出体现。 在900~970 nm范围内, 光谱曲线急剧下降主要是由番茄内部水分的O— H基团倍频吸收引起, 970 nm附近是水分的特征峰[11]

图1 番茄贮藏中的光谱图
(a): MSC-SG处理前的光谱; (b): MSC-SG处理后的光谱
Fig.1 The spectra of Tomato during storage
(a): Before MSC-SG treatment; (b): After MSC-SG treatment

2.3 光谱预处理

使用MSC结合SG算法对全波段光谱数据进行预处理, 结果如图1(b)所示, 光谱曲线的毛刺明显减少, 且平滑了许多, 有效消除了噪声等因素对光谱数据的干扰。

2.4 有效波段确定

高光谱图像信息冗余和数据维度高导致了监测模型稳健性较差[12]。 因此, 为了实现番茄贮藏过程中品质变化的快速、 稳健监测, 基于数据量较小的有效波段进行特征波长的提取是一种优先选项。 番茄品质直接反映于图1的光谱信息中, 由图1可以发现, 光谱平均反射值在580.47~634.22 nm范围急剧上升, 这表明该波段包含了丰富的番茄信息, 番茄贮藏过程中的品质属性在该波段也得以凸显。

另外, 考虑到Wilks Λ 值是表征类别间差异性的统计量, 其值越小说明类别间的差异性越显著, 故在全波段采用Wilks Λ 统计量融合主成分分析的方法, 先提取出Wilks Λ 最小值对应的主成分变量, 并计算其在各波长下的权重系数, 结果如图2所示。 波长表征样品类别间差异性的能力与权重系数的绝对值呈正相关。 由图2可以发现, 580.47~634.22 nm波段范围的权重系数大于0.5, 这充分说明了该波段存在反映不同贮藏时间番茄品质间差异性的重要信息。

图2 全波段下第2主成分的权重系数Fig.2 Weight coefficient of the 2nd PC in full band

综上, 可将580.47~~634.22 nm波段定义为能够表征番茄贮藏过程中品质变化的“ 有效波段” 。

2.5 特征波长筛选

2.5.1 基于理化指标的波长筛选

SPA和CARS 2种方法分别在全波段和有效波段提取的特征波长个数如表2所示。 由表2可以发现, 利用这2种方法从全波段提取的特征波长数量是从有效波段提取的特征波长数量的数倍, 这表明在有效波段进行特征波长的提取可以有效降低数据维度。 然而基于SSC通过SPA和CARS这2种方法获得的特征波长能否表征番茄贮藏过程中的品质变化在于SSC能否表征番茄贮藏过程中的品质变化, 这还需进一步的研究。 另外, 不同品种的番茄理化指标(含量)也有一定的差异性, 故不同品种的番茄能够表征番茄品质变化的理化指标可能也存在一定的差异性, 这在一定程度上增大了寻找合适的理化指标来表征番茄贮藏过程中的品质变化的难度, 因此基于SPA和CARS这2种方法提取的特征波长构建的监测模型不具有广泛适用性。

表2 基于SPA和CARS提取的特征波长个数 Table 2 Number of feature wavelengths extracted by SPA and CARS methods

2.5.2 基于Wilks Λ 统计量融合主成分分析的波长筛选

运用Wilks Λ 统计量融合主成分分析的方法提取特征波长不需要依据理化指标, 因此采用此方法提取的特征波长更具有稳健性。 分别在全波段和有效波段采用 Wilks Λ 统计量融合主成分分析得到的最小Wilks Λ 值对应的主成分在各个波长下的权重系数分别如图2、 图3所示。 波长表征样品类别间差异性的能力与权重系数的绝对值呈正相关, 故权重系数图中的波峰、 波谷所对应的波长可选为特征波长。 利用该方法筛选出的特征波长个数如表3所示。

图3 有效波段下第6主成分的权重系数Fig.3 Weight coefficient of the 6th PC in the effective band

表3 基于 Wilks Λ 统计量融合PCA提取的特征波长个数 Table 3 Number of feature variable extracted based on Wilks Λ statistic coupled with PC

由图2可知, 全波段提取的主成分为第2主成分, 这表明在全波段第2主成分可以反映不同贮藏时间番茄间的品质差异。 由图3可知, 有效波段提取的主成分为第6主成分, 这表明在有效波段第6主成分可以反映不同贮藏时间番茄间的品质差异。 对比图2、 图3还可以发现, 全波段下第2主成分的权重系数变化曲线只存在1个明显波峰, 其他波峰、 波谷不明显, 而有效波段的第6主成分的权重系数变化曲线的波峰、 波谷明显, 这说明基于有效波段提取的第6主成分在各个波长下的权重系数变化曲线可以更好地进行特征波长的筛选。 为确定第2主成分和第6主成分哪个能更有效、 更简单地表征不同贮藏时间番茄品质的差异, 在全波段、 有效波段分别绘制第6主成分、 第2主成分的权重系数图, 分别如图4、 图5所示。 由图4发现, 全波段下第6主成分的权重系数变化曲线波动较大, 存在较多的波峰、 波谷, 需要14个特征波长才能表征不同贮藏时间番茄间的品质差异。 这是因为全波段包含的冗余信息较多, 冗余信息的存在会掩盖反映不同贮藏时间番茄品质差异的主要成分, 这就需要较多的特征波长来表征不同贮藏时间番茄品质的差异。 结合图3可以发现, 在全波段和有效波段第6主成分的权重系数变化曲线的波峰、 波谷都很清晰明了, 因此第6主成分能够有效表征番茄贮藏过程中的品质变化。 而由图5发现, 有效波段的第2主成分的权重系数变化曲线不存在波峰、 波谷, 无法提取特征波长, 这表明有效波段的第2主成分无法用于表征不同贮藏时间番茄间的品质差异。 而图2表明, 全波段的第2主成分的Wilks Λ 值却最小, 分析认为全波段包含的冗余信息较多, 这些冗余信息掩盖了第6主成分所能体现的差异性。

图4 全波段下第6主成分的权重系数Fig.4 Weight coefficient of the 6th PC in full band

图5 有效波段下第2主成分的权重系数Fig.5 Weight coefficient of the 2nd PC in the effective band

表3可以发现, 第6主成分从全波段提取的特征波长个数约是从有效波段提取的特征波长个数的3倍, 这表明从有效波段提取的特征波长可以更好地降低数据维度, 简化运算过程。

综上所述, 采用Wilks Λ 统计量融合主成分分析在有效波段进行特征波长的提取为最佳特征波长筛选方法。 该方法可以有效避免冗余信息的干扰, 降低数据维度, 简化运算过程, 有利于获取有效且数量少的特征波长。

2.6 监测基准的确定

从最优特征波长筛选方法提取的特征波长中随机选取3条特征波长, 分别为617.34、 626.04和632.69 nm, 图6为这3条随机特征波长下番茄的光谱平均反射值折线图。 从图6可以发现, 这3个特征波长下的光谱平均反射值变化趋势基本一致, 且均在贮藏第5日达到最小值, 在贮藏第6日出现上升趋势, 这说明贮藏第5日可能是番茄品质发生腐败的临界日。 故可初步确定贮藏第5日为监测基准日。 另外, 按照农产品的品质变化规律, 贮藏第1日的番茄品质是整个试验过程中品质最优的, 且从图6可以发现其他贮藏日的光谱平均反射值相对于贮藏第1日都是递减的。 故也可以将贮藏第1日确定为监测基准日。 因此, 可分别基于这2个监测基准日的光谱数据构建番茄贮藏过程中品质变化的马氏距离监测模型。

图6 3条特征波长下番茄的光谱平均反射值折线图Fig.6 Broken line diagram of spectral mean reflectance of tomato at 3 feature wavelengths

2.7 监测模型构建

番茄在贮藏过程中, 呼吸作用等生理活动导致其成分含量一直发生变化, 但从外观上不易察觉。 而马氏距离是一种可以排除变量之间相关性的干扰, 用于计算两个样本间相似度的一种距离度量。 因此, 以基于 Wilks Λ 统计量融合主成分分析在有效波段提取的特征波长对应的光谱值为输入变量, 计算输入变量与监测基准间的距离, 以构建马氏距离监测模型。

以贮藏第5日为监测基准日构建的番茄贮藏过程中品质变化的马氏距离监测模型如图7所示。 贮藏第5日是番茄的腐败临界日, 故在该模型中距离值越小番茄品质越差, 距离值越大番茄品质越好。 在贮藏第2日, 马氏距离值急剧下降, 这表明该日的番茄品质也急剧下滑, 但在实际的贮藏过程中贮藏第2日的番茄并没有发生明显的品质变化。 另外, 按照农产品的品质变化规律, 贮藏第6日的番茄品质劣于贮藏第5日的番茄品质, 但在该模型的实际监测过程中贮藏第6日的马氏距离值大于贮藏第5日的马氏距离值, 不符合实际变化规律, 但这也说明了第5贮藏日是拐点日, 确定为基准日是合理的。 图8为以贮藏第1日为监测基准日的番茄贮藏过程中品质变化的马氏距离监测模型。 贮藏第1日的番茄品质最佳, 故在该模型中距离值越小番茄品质越好, 距离值越大番茄品质越差。 通过该模型发现, 番茄在贮藏过程中的品质变化是循序渐进的, 符合实际观察结果。 因此, 以贮藏第1日作为基准日构建的监测模型效果较好。

图7 贮藏第5日为监测基准的马氏距离折线图Fig.7 Mahalanobis distance line chart based on the 5th storage day as the monitoring benchmark

图8 贮藏第1日为监测基准的马氏距离折线图Fig.8 Mahalanobis distance line chart based on the 1st storage day as the monitoring benchmark

综上所述, 以贮藏第1日为监测基准日构建马氏距离监测模型更为简单、 方便, 也不需要进行监测基准日的确定分析, 且能够更好地对番茄贮藏过程中的品质变化进行监测。

3 结论

对不同贮藏时间番茄的光谱曲线进行分析的前提下定义了有效波段, 然后采用3种特征波长筛选方法分别在全波段和有效波段进行了特征波长提取, 并在给出最优特征波长的基础上构建了番茄贮藏过程中品质变化的马氏距离监测模型。 主要结论如下:

(1)探讨了基于连续投影算法(SPA), 竞争性自适应加权算法(CARS )以及 Wilks Λ 统计量融合主成分分析这3种特征波长筛选方法的优缺点, 发现基于 Wilks Λ 统计量融合主成分分析的方法不受理化信息的影响, 可以有效筛选出不同贮藏时间样本间的差异信息, 简化运算并提高监测模型的鲁棒性。

(2)对比分析了在全波段和有效波段基于Wilks Λ 统计量融合主成分分析筛选出的能够表征番茄贮藏过程中品质变化的主成分在各个波长下的权重系数图, 发现基于有效波段进行特征波长的提取不仅可以避免冗余信息对有效信息的遮掩, 还可以有效降低数据的维度, 简化运算。

(3)对比分析了以贮藏第1日和番茄腐败临界日为监测基准日构建的番茄贮藏过程中品质变化的马氏距离监测模型, 发现以贮藏第1日为监测基准日构建监测模型时更为简单、 方便, 且监测能力更优。

参考文献
[1] MA Yong-qiang, XIU Wei-ye, LI Chen-chen, et al(马永强, 修伟业, 黎晨晨, ). Food Science(食品科学), 2021, 42(3): 121. [本文引用:1]
[2] LI Jian-xin, WANG Wen-ping, HU Zhang-jian, et al(李建鑫, 王文平, 胡璋健, ). Chinese Agricultural Science(中国农业科学), 2021, 54(8): 1728. [本文引用:1]
[3] DENG Li-li, SHEN Lin, SHENG Ji-ping(邓丽莉, 申琳, 生吉萍). Food Science(食品科学), 2013, 34(19): 351. [本文引用:1]
[4] XU Li-jia, CHEN Ming, WANG Yu-chao, et al(许丽佳, 陈铭, 王玉超, ). Spectroscopy and Spectral Analysis(光谱学与光谱分析), 2021, 41(7): 2188. [本文引用:1]
[5] Yu Haidong, Qing Liwei, Yan Danting, et al. Food Chemistry, 2021, 348(6): 129129. [本文引用:1]
[6] Pullanagari R R, Li Mo. Journal of Food Engineering, 2021, 289(2): 110177. [本文引用:1]
[7] Mohammadi-Moghaddam T, Razavi S M A, Taghizadeh M, et al. Journal of Food Measurement and Characterization, 2018, 12(3): 1493. [本文引用:1]
[8] Zhu H Y, Chu B Q, Zhang C, et al. Scientific Reports, 2017, 7(1): 4125. [本文引用:1]
[9] Jiang J L, Cen H Y, Zhang C, et al. Postharvest Biology and Technology, 2018, 146: 147. [本文引用:1]
[10] Xue Shuning, Yin Yong, Wang Zhihao, et al. Journal of Food Measurement and Characterization, 2021, (6): 4061. [本文引用:1]
[11] SUN Shi-peng, PENG Jun, LI Rui, et al(孙世鹏, 彭俊, 李瑞, ). Food Science(食品科学), 2017, 38(2): 301. [本文引用:1]
[12] Ariana Diwan P, Lu Renfu. Computers and Electronics in Agriculture, 2010, 74(1): 137. [本文引用:1]