不同贮藏期水蜜桃硬度及糖度的检测研究
刘燕德, 张雨, 姜小刚, 孙旭东, 徐海, 刘昊辰
华东交通大学机电与车辆工程学院, 水果智能光电检测技术与 装备国家地方联合工程研究中心, 江西 南昌 330013

作者简介: 刘燕德, 1967年生, 华东交通大学机电与车辆工程学院教授 e-mail: jxliuyd@163.com

摘要

糖度和硬度作为水蜜桃的两个重要指标, 决定其内部品质。 在运输或售卖期间, 水蜜桃果内水分流失, 表面开始松软进而腐烂, 内部品质发生变化。 研究旨在探讨可见/近红外光谱预测水蜜桃不同贮藏期糖度和硬度的可行性, 进一步预测水蜜桃的最佳贮藏期。 采用漫透射和漫反射方式采集4个贮藏阶段的水蜜桃光谱, 并测量糖度和硬度。 分析了4个阶段水蜜桃的平均光谱, 光谱强度随着贮藏天数增加而不断提高, 且在650~680 nm区域内受果皮颜色及色素的变化产生波峰偏移。 同时, 分析了糖度和硬度的变化, 糖度在贮藏期间逐渐提高, 硬度在贮藏期间快速下降, 最终糖度增加了3.31%, 硬度下降了58.8%。 采用多元散射校正、 S-G卷积平滑、 归一化处理及基线校正等预处理方法来减少噪声和误差对光谱的影响, 并使用无信息变量消除(UVE)和连续投影算法(SPA)筛选特征波长, 最后利用偏最小二乘回归(PLS)分别建立糖度和硬度的预测模型。 分析糖度、 硬度的PLS回归系数与平均光谱的波形发现, 糖度的高回归系数分布在光谱多处, 而硬度的该系数均在波峰波谷附近。 SPA和UVE筛选的特征波长建立的糖度模型效果不佳, 而硬度模型效果良好。 结果表明, 漫透射和漫反射检测方式下, 糖度的最佳预测相关系数( Rp)及预测均方根误差(RMSEP)分别为0. 886, 0.727和0.820, 1.003, 预处理方法分别是多元散射校正、 平滑窗口宽度为3的S-G卷积平滑。 此外, 漫透射建立的硬度SPA-PLS模型, 选用15个光谱变量, 得到的 Rp和RMSEP为0.798和0.976; 而漫反射建立的UVE-PLS模型, 选用113个光谱变量, 得到的 Rp和RMSEP为0.841和0.829。 可以看出, 漫透射方式预测水蜜桃贮藏期间的糖度更佳, 而漫反射预测硬度更佳。 利用可见/近红外光谱所建立的糖度和硬度预测模型, 能够可靠地预测水蜜桃贮藏期内糖度和硬度的变化, 对指导采摘、 售卖时间和减少腐烂具有一定的参考价值。

关键词: 可见/近红外光谱; 水蜜桃贮藏; 糖度和硬度; 偏最小二乘回归
中图分类号:O657.3 文献标志码:A
Detection on Firmness and Soluble Solid Content of Peach During Different Storage Days
LIU Yan-de, ZHANG Yu, JIANG Xiao-gang, SUN Xu-dong, XU Hai, LIU Hao-chen
School of Mechatronics & Vehicle Engineering, East China Jiaotong University, National and Local Joint Engineering Research Center of Fruit Intelligent Photoelectric Detection Technology and Equipment, Nanchang 330013, China
Abstract

Soluble solid content (SSC) and firmness are two important indexes of peach, which determine its internal quality. However, the water in the peach fruit is lost, the surface begins to soften and rot, and the internal quality changes during transportation or sale. This paper aims to investigate the feasibility of visible/near-infrared spectroscopy(VIS-NIR)in predicting SSC and firmness of peach during different storage days and to predict the optimal storage period of peaches further. The spectrum of peach in 4 storage stages was collected by diffuse transmittance and reflectance, and the sugar and hardness were measured. The mean spectrum of peach in four stages was analyzed. The spectral intensity increased with the storage days, and the peak shift was caused by the changes in the color and pigment of the peel in the region of 650~680 nm. Meanwhile, the changes in SSC and firmness were analyzed. The SSC gradually increased during storage, while the firmness rapidly decreased during storage. Finally, the SSC increased by 3.31% and the firmness decreased by 58.8%. Pretreatment methods such as multivariate scattering correction(MSC), S-G smoothing, normalization and baseline are used to reduce the impact of noise and errors in the spectrum, and uninformative variable elimination (UVE) and successive projections algorithm (SPA) is used to select characteristic wavelengths, then the partial least squares regression(PLS) is used to establish prediction models for SSC and firmness. Analyzing the PLS regression coefficient of SSC and firmness with the mean spectrum, it is found that SSC has many high regression coefficient bands, and the high regression coefficient of firmness is near the peaks and troughs. Therefore, the SSC model established by the characteristic wavelength obtained by SPA and UVE is not good, while the firmness model is good. The results show that the best prediction correlation coefficient ( Rp) and root mean square error of prediction (RMSEP) of SSC under the diffuse transmittance and reflectance detection methods are 0.886, 0.727, 0.820, 1.003, respectively. The pretreatment methods are MSC and S-G smoothing with 3 smoothing window width, respectively. In addition, the SPA-PLS model of firmness established by diffuse transmittance uses 15 spectral variables to obtain Rp and RMSEP of 0.798 and 0.976. The UVE-PLS model established by the diffuse reflectance uses 113 spectral variables to obtain Rp and RMSEP of 0.841 and 0.829. It can be seen that the diffuse transmittance method predicts SSC better, and the diffuse reflectance predicts the firmness better during peach storage. The SSC and firmness prediction models established by VIS-NIR can reliably predict the changes of SSC and firmness during the storage of peaches and have certain reference value to guide picking and selling time and reduce decay.

Keyword: Visible/Near infrared spectroscopy; Storage of peach; Soluble solid content and firmness; Partial least squares regression
引言

糖度(SSC)和硬度是水蜜桃的重要品质属性, 决定了水蜜桃品质的高低, 也是消费者购买时关心的问题。 水蜜桃大多成熟于夏季, 高温天气下, 成熟的水蜜桃采摘后迅速软化, 内部品质变化明显。 在运输及售卖期间, 水蜜桃处于常温下保存, 果内水分流失, 风味有所提高, 表面开始松软, 糖度和硬度变化明显。 因此, 检测水蜜桃常温下贮藏期间的糖度和硬度变化, 对指导采摘期及货架期具有重要意义。

可见/近红外光谱技术是水果品质评价中最常用的无损检测技术之一, 能够快速、 无损的检测水果的内部品质[1, 2]。 近红外光谱技术已在多种水果检测中成功应用, 主要用于检测水果内部的糖酸度等[3, 4]。 潘磊庆等[5]使用近红外光谱对货架期内水蜜桃糖度进行检测; Huang等[6]使用两种便携式近红外光谱仪对六种成熟度番茄的多种硬度参数进行预测分析; Uwadaira Y等[7]使用可见/近红外光谱检测桃的果肉硬度, 用以评价桃的成熟度。 可见/近红外光谱技术研究水蜜桃的现有报道中, 水蜜桃贮藏期的研究不少, 但几乎都是研究单一指标, 较少综合分析糖度和硬度, 且研究效果并不理想。 目前对水蜜桃的研究多为静态单一检测方式, 多方式及动态检测较少; 且常用的测定果实硬度的方法是穿刺试验[6, 7], 检测过程损坏样品。 使用多种检测方式研究水蜜桃贮藏期糖度和硬度的无损检测技术具有重要意义。 本研究在使用可见/近红外光谱技术, 建立不同贮藏期水蜜桃糖度及硬度的无损检测模型。 具体目标是: (1)使用两种检测方式采集不同贮藏阶段水蜜桃的光谱, 测量水蜜桃的糖度和硬度(2)采用合适的预处理方法来减小噪声和误差对光谱的影响, 并使用两种波长选择算法及特征波长, 建立糖度和硬度模型, 并选择最佳的预测模型。

1 实验部分
1.1 样品

实验样品为果园新鲜采摘的“ 大土山” 水蜜桃, 其表面光滑无损伤, 样品总数为90个。 实验前, 所有样品均置于保鲜袋中, 并在常温(22~25 ℃)下保存以模拟水蜜桃售卖期间的条件。 样品分为4批, 其中第一批30个, 余下三批各20个。 从初次测量起, 每隔两天测量一批样品的光谱、 糖度、 硬度和重量, 实验周期共计6 d。 图1为实验时每个贮藏阶段的样品, 前期贮藏样品表面良好, 4 d之后样品表面开始松软腐烂。

图1 不同贮藏期的水蜜桃样品Fig.1 Peach samples of different storage periods

1.2 光谱采集

使用实验室自行研制的水果动态检测装备采集样品光谱, 装备搭载QE65Pro光谱仪(Ocean Optics, USA), 所采集的光谱为可见/近红外光谱, 波长范围为350~1 150 nm。 设备光路及光源分布如图2, 光源为10个12 V/100 W的卤钨灯, 位于样品两侧。 光纤接收样品的光源信息并传输到光谱仪及计算机中。 使用漫透射和漫反射两种采集方式采集样品光谱, 两种方式采集方法基本相同, 光纤分别在下方和上方接收光谱信号, 且漫反射为静态采集。 每个样品按90° 间隔标记赤道位置4个表面, 采集光谱时, 提前预热装备20~30 min, 待装置稳定之后, 人为按标号进行光谱动态采集, 以保证光谱数据的可靠性。 积分时间均设为100 ms, 所得到的光谱均已去除暗光谱。 为了减少果核的影响, 将样品按果柄与运动方向一致, 缝合线平行于果杯的方式放置, 且出口均有海绵垫用以防护。

图2 近红外动态在线检测装置Fig.2 Near-infrared dynamic online detection device

1.3 样品硬度及糖度测量

光谱采集完成后, 对水蜜桃样品进行穿刺试验。 为了保证信息的一致性, 在采集光谱的相同位置进行穿刺试验以获得相应的样品硬度。 使用配备3 mm圆柱形探针的美国FTC质构仪(Food Technology Corporation, USA)及配套软件进行穿刺试验, 力量元量程为100 N, 加载速度5 mm· min-1, 触发力设为0.1 N, 最大穿刺深度为10 mm。 记录每次测量时得到的硬度数据, 单位为N。 测量完成后, 同样取光谱测量相同4个位置处的果肉, 榨汁后将果汁倒入折射式数字糖度计PAL-1(ATAGO, Japan)中进行糖度测量。 每次测量重复三次, 取两次相同的值作为该位置的糖度真值。

1.4 样本集划分

在建立判别模型之前, 首先将样本分为校正集、 预测集。 利用校正集数据对模型进行训练, 之后利用预测集数据对模型进行性能测试[8]。 实验中对样本进行异常值测试, 剔除异常点后使用K-S算法将样本划分为校正集和预测集。 表1分别给出了两种检测方式下糖度和硬度的校正集和预测集的样品个数, 样本集覆盖了足够大的数据范围, 且校正集的数据范围均大于预测集, 说明这些数据具有代表性且能够建立良好的近红外模型。

表1 样本集划分 Table 1 Sample set division
1.5 数据处理及分析方法

偏最小二乘回归(PLS)是最常用的多元线性校正技术, 广泛应用于可见/近红外光谱分析中, 用以定量预测水果内部品质[9]。 PLS可以同时分解光谱矩阵X和浓度矩阵Y, 消除无用的噪声信息, 使PLS在实际应用中具有更强的鲁棒性[10, 11]。 PLS的回归模型如式(1)

Y=bX+e(1)

式(1)中, b为回归系数的向量, e为模型残差。

PLS将光谱数据投射到一组称为潜在变量(LVs)的正交因子上, 并使用简单交叉验证及其他方法来避免由于使用太小或太大的LVs而导致的欠拟合或过拟合。 使用Unscrambler软件对数据进行PLS分析, 将校正模型应用于预测集或验证集中桃子糖度和硬度参数的预测, 并通过预测均方根误差(RMSEP)和校正均方根误差(RMSEC)、 预测相关系数(Rp)和校正相关系数(Rc)等统计参数进行评价。

无信息变量消除(UVE)基于PLS回归系数挑选波长, 将一定数目的随机变量加入光谱矩阵之中, 通过交叉验证建立PLS模型, 计算回归系数与标准偏差的比值, 从而选取有效光谱信息。 连续投影算法(SPA)是一种前向选择算法, 利用向量空间中的一个简单投影操作来选择共线性最小的变量子集, 并使用均方根误差(RMSE)进行评估[12]

2 结果与讨论
2.1 光谱特性分析

水蜜桃4个贮藏阶段的平均光谱如图3所示, 对于漫透射方式[图3(a)], 由于光谱前端(350~515 nm)和光谱后端(975~1 150 nm)信号较弱, 无有效信息, 故直接选择波长范围为515~975 nm (600个变量)。 同样, 将漫反射方式测得光谱的有效波长范围定为465~950 nm (640个变量)[图3(b)]。 从图3 中可以看出, 在650~680 nm范围内, 不同贮藏期的水蜜桃光谱差异较大, 主要是因为贮藏过程中色素的变化导致波峰的偏移及强度变化。 另外, 在716 nm附近的波峰主要与C— H和O— H键的倍频伸缩振动有关[13]; 随着贮藏天数的增加, 桃内水分流失减少了O— H键的吸收且果内透光性增强, 波峰强度不断增大。 而在805 nm附近的波峰主要与C— H及N— H键有关。 总体来看, 贮藏天数的增加对漫透射方式采集的光谱影响较大, 因为漫透射方式主要采集水果的内部信息, 而漫反射方式采集的更多是样品表面的信息。

图3 不同贮藏期水蜜桃的平均光谱
(a): 漫透射; (b): 漫反射
Fig.3 Average spectrum of peach in different storage days
(a): Diffuse transmittance; (b): Diffuse reflectance

2.2 硬度和糖度真值分析

表2显示了不同贮藏天数水蜜桃糖度和硬度的测量值。 可以看出, 随着水蜜桃贮藏天数的增加, 硬度的平均值呈下降趋势, 而糖度则相反, 总体呈上升趋势。 水蜜桃糖度在初期贮藏时先下降, 贮藏时间延长, 水蜜桃开始松软, 糖度增加, 风味慢慢提高, 与前人研究一致[7]。 糖度在贮藏期间增加了0.4%~3.31%, 硬度则下降了28.1%~58.8%。 变异系数(CV)衡量的是测量值在样本间的相对变化。 糖度的CV值基本变化不大, 和平均值的变化基本相符; 硬度的CV值则在28.81%~42.51%之间变化, 且在最后一批达到最大, 说明随着贮藏时间的延长, 样品的硬度在同一阶段变得更不稳定[4]

表2 不同贮藏天数下水蜜桃的参数变化 Table 2 Parameter changes of peach in different storage days

在贮藏过程中, 水蜜桃的重量由147.22 g逐步降低至107.46 g, 果实重量的下降主要是水分减少引起的。 重量、 硬度与贮藏天数呈高度负相关(R1=-0.967, R2=-0.983), 糖度与贮藏天数呈正相关(R3=0.54)。 可以看出, 水蜜桃的糖度、 硬度及重量与贮藏天数均有较好的相关度。

2.3 水蜜桃糖度和硬度的预测模型

2.3.1 预处理

使用偏最小二乘回归建立水蜜桃的糖度及硬度预测模型。 为防止过拟合或欠拟合, LVs的数量设定为1~20。 根据划分好的校正集和预测集建立水蜜桃的PLS模型, 并使用多种预处理方法(S-G平滑、 归一化Normalization、 多元散射校正MSC、 基线校正Baseline)对光谱进行处理, 结果见表3。 对于糖度预测, 漫透射采集的光谱数据建立的PLS模型能够更好地预测不同贮藏阶段的糖度变化, 采用MSC预处理后, 得到的LVs小, 两个相关系数接近, Rp为0.886, RMSEP为0.727; 漫反射下, 最佳模型的Rp为0.820, RMSEP为1.003, 预处理方法为S-G平滑+3。 在硬度模型中, 效果最好的是漫反射, 使用Normalization预处理后, 最佳Rp为0.835, RMSEP为0.833。 漫透射下, 使用MSC预处理后, 模型LVs最小, Rp为0.797, RMSEP最小为0.975。 图4(a, b)分别为两种检测方式水蜜桃糖度和硬度的最佳PLS模型。

表3 不同预处理方法下糖度和硬度模型对比 Table 3 Comparison of sugar and firmness models under different pretreatment methods

图4 两种检测方式下桃子糖度(SSC)和硬度(Firmness)的PLS模型
(a): 漫透射; (b): 漫反射
Fig.4 PLS models of SSC and Firmness of peach under two detection methods
(a): Diffuse transmittance; (b): Diffuse reflectance

2.3.2 特征波长选择

为了消除无用变量, 进一步优化预测模型的性能, 提高检测速度。 采用UVE和SPA两种波长选择算法对光谱变量进行筛选, 选取有效变量建立PLS模型。

使用UVE进行波长选择时, 设定随机变量数为200, 分别对两种检测方式下的糖度和硬度光谱进行波长选择, 选择有效的波长点用作后续建模。 UVE处理结果如图5, 上下虚线为阈值, 阈值内的光谱变量剔除, 阈值外的光谱变量保留作为选中的有效变量。 最终通过UVE选取的变量数及模型效果如表4所示。

图5 两种波长选择算法
(a): UVE处理结果; (b): SPA挑选的波长点
Fig.5 The results of two wavelength selection algorithms
(a): The selected result of UVE; (b): The selected result of SPA

表4 两种波长选择算法的PLS模型 Table 4 PLS models of two wavelength selection algorithms

同样, 使用SPA从直接法筛选波长后的光谱变量中挑选特征波长, 用于糖度和硬度的评价。 SPA筛选变量之前, 分别设定最小、 最大变量数为10和100, 通过SPA程序计算的均方根误差(RMSE)值来确定所选变量的最优数量。 SPA挑选的波长点如图5(b)所示, 这些波长点覆盖了大部分有效信息, 在UVE的基础上进一步简化模型。 波长选择后, 将挑选的波长用于建立PLS模型, 最终挑选的变量数及模型效果见表4

表4为光谱变量进行特征波长选择后建立的PLS模型。 可以看到, 使用波长选择算法后, 建立的糖度模型效果不如预处理后的糖度模型。 可能是因为糖度在光谱上有多重表征, 且处理前已经将无信息的波长剔除, 留下的均为有效波长, 进行波长选择后反而去除了有用的信息, 从而导致模型效果变差。 而硬度的变化主要受水分影响[6, 7], 只跟光谱的特定波段有关。 因此, SPA和UVE均能在一定程度提高硬度模型效果。 漫透射、 漫反射方式下硬度的最好模型分别是SPA-PLS和UVE-PLS, 其中SPA-PLS的Rp为0.798, RMSEP为0.976, UVE-PLS的Rp为0.841, RMSEP为0.829, 两个模型均比预处理后建立的模型效果好, 且简化了模型, 如图6(a, b)所示。

图6 特征波长选择后的最优模型
(a): 漫反射; (b): 漫透射
Fig.6 Optimal model after characteristic wavelength selection
(a): Diffuse reflectance; (b): Diffuse transmittance

2.4 光谱相关性分析

图7为水蜜桃糖度和硬度与光谱的回归系数图, 系数越大代表该波长所占权重越大, 重要程度越高。 可以看出, 糖度有较多高回归系数的波段, 规律性不强; 而硬度的高回归系数多是在波峰波谷处。 这同样解释了波长选择算法得到的硬度模型效果好, 糖度模型效果不佳的原因, 也说明挑选几个波长用于预测硬度变化是可行的。

此外, 实验所建立的模型能够较准确地预测各贮藏阶段水蜜桃的糖度及硬度, 再结合糖度、 硬度与贮藏天数的关系, 可以得到水蜜桃的贮藏天数。 本实验得出, 最佳贮藏天数为2~4 d, 这个阶段的水蜜桃糖度有所提高, 硬度下降但还未腐烂, 宜于食用。

图7 水蜜桃糖度和硬度的回归系数
(a): 糖度; (b): 硬度
Fig.7 Regression coefficients of SSC and Firmness of peach
(a): SSC; (b): Firmness

3 结论

采用动态在线检测设备, 采集四个贮藏阶段水蜜桃的两种光谱。 根据有效信息直接选择波长, 并结合多种预处理方法, 建立水蜜桃糖度和硬度的PLS回归模型。 结果表明: 漫透射光谱建立的模型中, MSC为糖度和硬度的最佳预处理方法, Rp分别为0. 886和0.797; S-G平滑+3、 标准化预处理方法则分别优化了漫反射下水蜜桃的糖度、 硬度模型, Rp分别为0. 820和0.835。 可以看出, 漫透射方式预测水蜜桃的糖度更佳, 而漫反射预测硬度更佳。 主要原因是随着贮藏天数增加, 果肉松软, 漫透射方式下光源透光性增强, 能够获取更多水果内部的信息; 而硬度主要受果皮变化影响, 漫反射方式能够更多地获取水蜜桃表皮的信息。 模型均能够较好地预测不同贮藏阶段水蜜桃的糖度和硬度, 结合贮藏天数与硬度和糖度的变化, 能够预测出水蜜桃的最佳贮藏天数。 本实验桃子的最佳贮藏期为2~4 d。

另外, 使用SPA和UVE算法进行波长选择, 结果发现两种波长选择算法可以优化硬度模型, 但不能优化糖度模型。 分析了糖度和硬度与光谱的相关性, 糖度在光谱多处波长处具有高回归系数, 硬度的相关参数均在波峰波谷附近, 充分解释了两种算法只能优化硬度模型的原因。 根据光谱范围和测量的硬度参数得知, 硬度参数与单个波长之间的相关性变化很大, 说明使用几个波段用来预测硬度是可行的, 需要进一步研究。 本研究可以指导售卖期间水蜜桃的贮藏, 也能为水蜜桃采摘期提供参考。

参考文献
[1] Pan L, Lu R, Zhu Q, et al. Postharvest Biology and Technology, 2015, 102: 42. [本文引用:1]
[2] Wang A, Xie L. Journal of Food Engineering, 2014, 143(12): 17. [本文引用:1]
[3] Moscetti R, Raponi F, Ferri S, et al. Journal of Food Engineering, 2018, 222: 139. [本文引用:1]
[4] Zhu G, Tian C. Journal of Food Process Engineering, 2018, 41(6): e12810. [本文引用:2]
[5] PAN Lei-qing, LIU Ming, HANG Dong-hai, et al(潘磊庆, 刘明, 韩东海, ). Journal of Nanjing Agricultural University(南京农业大学学报), 2013, 36(4): 116. [本文引用:1]
[6] Huang Y, Lu R, Chen K. Journal of Food Engineering, 2018, 222: 185. [本文引用:3]
[7] Uwadaira Y, Sekiyama Y, Ikehata A. Heliyon, 2018, 4(2): e00531. [本文引用:4]
[8] GUO Wen-chuan, WANG Ming-hai, GU Jing-si, et al(郭文川, 王铭海, 谷静思, ). Optics and Precision Engineering(光学精密工程), 2013, 21(10): 2721. [本文引用:1]
[9] Wang H, Peng J, Xie C, et al. Sensors, 2015, 15(5): 11889. [本文引用:1]
[10] Mahesh S, Jayas D S, Paliwal J, et al. Food and Bioprocess Technology, 2015, 8(1): 31. [本文引用:1]
[11] Li J, Wang Q, Xu L, et al. Food Analytical Methods, 2019, 12(1): 12. [本文引用:1]
[12] Tian X, Fan S, Li J, et al. Infrared Physics & Technology, 2019, 102: 102979. [本文引用:1]
[13] Maeda H, Ozaki Y, Tanaka M, et al. Journal of Near Infrared Spectroscopy, 1995, 3(4): 191. [本文引用:1]