可见-近红外反射光谱检测小米糊化特性
吴建虎1, 李桂峰1, 彭彦昆1,2,*, 杜俊杰1, 徐建国1, 郜刚1
1.山西师范大学食品科学学院, 山西 临汾 041000
2.中国农业大学工学院, 北京 100083
*通讯联系人 e-mail: ypeng@cau.edu.cn

作者简介: 吴建虎, 1978年生, 山西师范大学食品科学学院副教授 e-mail: 287718596@qq.com

摘要

糊化特性是小米的最重要加工特性之一, 对小米的加工性能及产品质量有重要的影响。 基于可见-近红外光谱特征信息, 在不粉碎小米颗粒的状态下, 提出了一种快速无损检测小米的糊化特性的方法。 首先, 获取小米在370~1 020 nm范围内漫反射光谱后, 将小米粉碎成小米粉, 使用RAV快速粘度分析仪测定小米粉的峰值粘度(PV)、 最低粘度(TV)、 衰减值(BD)、 最终粘度(FV)、 和回升值(SB)、 糊化温度(GT)以及峰值时间(PT)等7个糊化特性指标。 然后, 对原始光谱进行Savitzkye-Golay(SG)平滑、 多元散射校正(MSC)和一阶导数法(1-D)预处理。 最后, 结合三种处理光谱和小米糊化特性指标值, 通过Sample set partitioning based on joint x-y distances(SPXY)方法确定样本的校正集和验证集; 基于连续投影算法(SPA)选择了特征波长, 利用特征波长反射光谱信号建立了小米糊化特性指标的多元线性回归(MLR)预测模型, 并使用验证集样本验证MLR模型的预测准确性。 糊化指标预测结果: 对于粘度指标中的PV、 TV和SB参数值, 经过MSC预处理后光谱, 分别选择了9, 17和18个特征波长建立的MLR模型的预测结果最好, 预测相关系数( Rp)分别为0.934 7, 0.825 5和0.874 6, 预测误差(SEP)分别为174.039 7, 67.220 3和74.281 8; 对于BD值, 经过S-G预处理后选择了14个特征波长的MLR模型预测结果最好, Rp为 0.924 4, SEP为178.020 1; 此外, 对于FV参数值, 经过1-D处理后选择了16个特征波长所建立MLR模型的预测相关系数 Rp为0.853 1, SEP为132.166 7。 研究结果表明, 利用可见-近红外光谱结合SPXY和SPA算法在不粉碎小米的状态下对其糊化特性进行检测是可行的。 本研究为小米产品相关企业在生产前期, 通过快速测定小米原料糊化特性, 进而评估产品加工品质提供一种新的技术手段, 具有较强的实际应用潜力。

关键词: 小米; 糊化特性; 可见-近红外反射光谱; SPXY算法; SPA算法
中图分类号:O657.33 文献标志码:A
Detection of Gelatinization Properties of Millet Using Visible/Near Infrared Reflectance Spectroscopy
WU Jian-hu1, LI Gui-feng1, PENG Yan-kun1,2,*, DU Jun-jie1, XU Jian-guo1, GAO Gang1
1. College of Food Science, Shanxi Normal University, Linfen 041000, China
2. College of Engineering, China Agricultural University, Beijing 100083, China
*Corresponding author
Abstract

Gelatinization is one of the most important processing properties of millet, which has an important influence on the processing performance and product quality of millet. In this study, a rapid non-destructive detection method for the gelatinization characteristics of millet was proposed based on visible/near infrared spectroscopy technology which was used to detect the gelatinization properties of millet without crushing millet granules. Firstly, the VIS/NIR diffuse reflectance spectrum of millet in the range of 370~1 020 nm was collected, and crushed the millet into millet flour subsequently, then seven gelatinization characteristics such as the peak viscosity (PV), trough viscosity (TV), breakdown(BD), final viscosity (FV), setback (SB), pasting temperature (GT) and peak time (PT) were determined by RAV rapid viscosity analyzer. After that, the reflectance spectrum was preprocessed by Savitzkye-Golay smoothing (SG), multivariate scattering correction (MSC) and first derivative method (1-D). Finally, combined different preprocessed spectra and millet gelatinization characteristics, the calibration sets and validations set of the samples were determined by Sample set partitioning based on joint x distances (SPXY), and then based on the Successive projections algorithm(SPA) the optimal wavelengths were selected, the multivariate linear regression (MLR) prediction models of millet gelatinization characteristic were established using optimal wavelength reflection spectral signal, and the validation set samples were used to verify the prediction accuracy of the MLR model. MLR models prediction results: for the parameters of PV, TV and SB, after MSC pretreatment, the MLR model established by 9, 17 and 18 optimal wavelengths was the best, the predicted correlation coefficients ( Rp) were 0.934 7, 0.825 5 and 0.874 6 respectively, and the standard error of predicted residual (SEP) were 174.039 7, 67.220 3 and 74.281 8 respectively; for BD value, the MLR model with 14 optimal wavelengths after S-G pretreatment was the best with the Rp was 0.924 4, and the SEP was 178.020 1; in addition, for the FV parameters, after 1-D pretreatment, the prediction Rp and SEP of MLR model based on 16 optimal wavelengths were 0.853 1 and 132.166 7 respectively. The results show that it is feasible to detect the gelatinization properties of millet without crushing millet by using VIS/NIR diffuse reflectance spectroscopy combined with SPXY and SPA algorithm. This study provides a new technical means for millet products enterprises to determine the gelatinization characteristics of millet raw materials in the early stage of production rapidly and evaluate the processing quality of millet products, which has a high practical application potential.

Keyword: Millet; Gelatinization; VIS/NIR reflectance spectroscopy; SPXY algorithm; SPA algorithm
引言

小米我国主要的杂粮作物, 由于营养成分种类和含量丰富, 易于吸收, 具有很好的保健功能, 近年来, 以小米和小米为基料的食品受到消费者的青睐。 已有大量关于小米品质特性及制品的研究。 小米主要成分是淀粉, 其糊化特性对小米及其食品的加工、 贮藏以及感官品质有显著的影响[1]。 不同品种、 产地及批次的小米, 其淀粉的组成、 结构、 形态特征不同, 相应的理化加工特性也不相同[2], 在加工前评价原料糊化特性, 对于原料满足产品加工工艺、 保证最终品质要求具有重要意义。 目前小米粉的糊化特性测定主要是使用RAV粘度测定仪。 RAV粘度测定仪可快速测定淀粉的糊化特性, 得到糊化特性各特征参数, 用于评价淀粉的综合特性, 在小米淀粉品质的评价中的到了广泛的应用。 但是, 目前粘度测定仪价格较高, 且测定前需要对小米磨粉、 测定水分含量, 进行湿基校正; 在测定过程中, 由于承载试样的测量筒损耗较高, 在试样批量分析时存在测定速度慢、 综合成本较高的问题。

可见-近红外反射光谱技术具有简便、 快捷、 无污染、 低成本和多品质信息同时测定的优点, 已广泛应用于肉类、 果蔬等农产品品质检测中。 近红外技术在粮食检测中也有较多的应用, 有关小麦[3]、 大米[4]及玉米[5]等主要粮食品质分析的报道较多, 研究大多集中于蛋白质、 淀粉、 水分等组分含量、 掺杂及品种鉴别检测[6]等方面, 在粉质特性方面也有相关研究报道[7]。 在小米品质品质检测方面, 目前关于营养组分和产地的研究[8]较多, 鲜见小米加工特性的研究。

利用近红外光谱实现对小米糊化特性的快速无损检测具有重要意义。 以小米为研究对象, 采集小米的可见-近红外反射光谱, 进行预处理, 测定磨粉后小米粉的RVA糊化特性参数, 通过(sample set partitioning based on joint x-y distances, SPXY)方法选择样品集, 基于连续投影(successive projections algorithm, SPA)算法确定糊化特性参数的特征波长, 建立MLR模型, 快速准确预测小米的糊化特性, 旨在为小米的加工品质分析提供便捷有效的方法。

1 实验部分
1.1 材料

实验样本购买于当地小米加工厂, 共收集不同厂家、 山西地区代表性的晋谷21号新鲜脱壳小米60份, 样品购买后, 自封袋包装, 运回实验室, 置于冷藏环境下保存备用。

1.2 可见-近红外反射光谱采集

使用便携式光谱仪测定样本漫反射光谱。 光谱仪型号USB4000(美国海洋公司), 波长范围345~1 040 nm, 光谱分辨率0.21 nm。 采集反射光谱时, 将样品装满内径90 mm、 深度25 mm圆形样品池内, 用刮板刮平表面, 置于光纤探头下10 mm处位置, 样品表面与光线探头垂直, 此时, 光源投射至样品表面形成一直径20 mm左右圆形光斑。 光谱采集曝光时间为75 ms, 平滑度为2 nm (10点平滑), 每个样本在3个不同部位分别采集3次, 取均值为该样品的反射光谱。

1.3 糊化特性的测定

1.3.1 测定过程

采集完小米的反射光谱后, 将样本粉碎, 过80目筛, 获得小米粉, 先测定小米粉的含水量, 用于糊化特性测定时的湿基校正, 测定方法按照GB/T5009.3— 2016[9]规定进行。 试样糊化特性的测定使用瑞典波通公司的RVA-TecMaster型快速粘度分析仪。 测定时, 首先准确量取25 mL蒸馏水, 移入干燥洁净的铝制测量筒, 然后准确称量3.00 g(12%湿基校正)的小米粉, 倒入测量筒。 将测量筒移至仪器基座搅拌器下方, 基座上升, 搅拌器插入样品筒, 由搅拌电机驱动, 搅拌小米粉悬浮液。 在测试过程中小米淀粉悬浮液经历加热、 保温和冷却的一个过程。 在此过程中, 小米淀粉悬浮液由于糊化产生粘度, 粘度由与搅拌器相连的扭力传感器检测, 同时温度传感器测量测量筒的温度。 测定过程中记录悬浮液粘度和温度数据随测量时间的变化数据, 得到2条随时间变化的曲线, 就是试样糊化特性曲线。 测量过程根据GB/T24852— 2010方法[10]进行, 由粘度仪配套软件(thermal cline for windows, TCW)按照设定控制程序进行。 测试结束后, TCW软件自动分析出样品的糊化特征参数。

1.3.2 糊化特性主要特征参数

使用RVA-TecMaster型快速粘度分析仪可以获得小米典型糊化特性曲线, 如图1所示。 图中红色线2表示测定过程中温度随时间变化, 蓝色线1表示粘度值随时间变化曲线。 试样的糊化特性主要由粘度曲线上特征点数值表示。 从曲线1中可直接得到4个特征参数点: A点是峰值粘度(peak viscosity, PV), 指的是测试期间样本的最大粘度值; B点是最低粘度(trough viscosity, TV), 指的是试样冷却前达到的最小粘度值; C点是最终粘度(final viscosity, FV), 指的是样本测试结束时粘度; D点是峰值时间(peak time, PT), 指的是测试时试样达到峰值粘度的时间; E点是糊化温度(pasting temperature, GT), 该型仪器糊化温度定义为粘度初次上升时, 样品粘度值达到峰值粘度1/2时所对应的温度值; 此外, 其余2个特征参数由TCW软件根据粘度变化曲线计算得到: 衰减值(breakdown, BD)是峰值粘度与最低粘度的差值; 回升值(setback, SB)是最终粘度与最低粘度的差值。 因此, 每个样本的糊化特性由PV, TV, FV, PT, GT, BD以及SB等7个参数表示, 这些参数单位, GT是℃、 PT是min, 其余5个参数单位都是粘度cp(高斯单位制)。

图1 典型小米糊化特性曲线及主要特征参数
1: 随着温度变化, 粘度值的变化曲线; 2: 仪器设定温度控制曲线
Fig.1 Gelatinization characteristic curve and main characteristic parameters of typical millet
1: Variation curve of viscosity value with temperature; 2: Instrumentation temperature control curve

1.4 光谱数据预处理

分别使用Savitzkye-Golay(SD)平滑、 多元散射校正(multiple scattering correction, MSC)和一阶导数法(first derivative, 1-D)对原始光谱进行预处理, 以消除光谱采集过程中的背景噪声、 基线漂移和杂散光等干扰信号。 每个样本得到三条预处理光谱, 分别是SD, MSC和1-D光谱。

1.5 预测模型的校正和验证

1.5.1 校正集和验证集选择

SPXY算法[11]对样本进行校正集和验证集分组时, 将自变量(光谱信息)和因变量(待测参量)同时考虑在内, 能够有效用于近红外定量模型建立, 在改善所建模型预测能力方面优于随机算法、 双向算法和duplex等分组算法。 本研究使用SPXY方法划分样品的校正集和验证集, 其算法的实现过程参照文献[12]的描述。

1.5.2 特征波长变量的选择

为了有效选择小米各糊化参数特征波长, SPA算法[13]是一种使矢量空间共线性最小化的前向变量选择算法, 它的优势在于从严重重叠光谱信息中提取有效信息, 能够消除原始光谱矩阵中冗余的信息, 可用于光谱特征波长筛选。 本研究针对各预处理光谱结合SPXY方法确定的校正集, 使用SPA算法进行光谱特征波长选择, SPA算法的原理及实现详细描述参照文献[14]。

1.6 检测模型的校正和验证

利用SPA选择的特征波长变量, 建立多元线性回归(MLR)预测模型, 使用验证集评价模型的效果。 模型校正和验证结果使用校正相关系数R、 校正均方根误差SEC、 预测相关系数Rp以及预测均方根误差SEP等参数评价。 本研究中数据处理是用Matlab R2014a (Math work, USA) 数据分析软件完成的。 图2所示为研究技术路线。

图2 技术路线图Fig.2 Technology roadmap

2 结果与讨论
2.1 小米粉糊化特性参数测定结果

表1所示为60个样本糊化特性参数测定结果, 可以看出, 除GT和PT之外, PV, TV, BD, FV以及SB等5个参数的变化范围和均方差都较大, 说明样品的糊化特性差异较大, 建立的模型有较好的适用性。

表1 样本糊化特性参数测定结果 Table 1 Statistics of pasting viscosity properties value of millet flour samples
2.2 样本反射及预处理光谱

本研究使用光谱仪可获取样本345~1 040 nm波段反射光谱, 在370~1 020 nm范围外信号强度低, 信噪比低, 因此选择370~1 020 nm范围内反射光谱进一步分析。 图3为经过21点S-G平滑(带宽4 nm)光谱、 MSC处理光谱和1-D处理光谱。 图3(a)和(b)所示分别为原始光谱经过S-G平滑处理和MSC处理后光谱。 相比仅经过S-G平滑处理光谱, MSC处理可有效消除散射和偏移的影响, 使光谱反射特征变得更加明显。 从图3(a)和(b)可看出, 在460, 500, 920及980 nm附近有较明显的吸收峰, 此外在640 nm附近存在1个较弱的吸收峰。 图3(c)为1-D处理后光谱, 消除了基线漂移, 在520~565 nm范围内光谱斜率变化最大, 945和1 010 nm附近斜率次之, 此外在450, 470及630 nm附近斜率变化也较明显, 而在630~900 nm范围内斜率变化最小。

图3 样本的反射光谱
(a): S-G光谱; (b): MSC处理光谱; (c): 一阶导数光谱
Fig.3 Reflectance spectra of millet samples
(a): S-G spectra; (b): MSC spectra; (c): 1-D spectra

2.3 样本集的选择

SPXY算法采用x变量(S-G, MSC和1-D光谱)和y(7个糊化特性参数)变量分别计算样品间距离, 将样本划分为校正集和验证集。 本研究对60个样本进行SPXY分集, 其中校正集占总数3/4, 包含45个样本, 验证集占总数1/4, 包含15个样本。 样本集的划分后其均值, 范围及标准偏差如表2所示。 以PV值为例, 从表2可以看出, 经过S-G, MSC和1-D处理光谱, 使用SPXY算法选择校正集样本的PV值范围均为717~2 305 cp, 标准差分别是440.44, 424.10和420.82 cp, 而验证集样本PV值分别是843~2 069, 726~2 069和795~2 069, 标准差分别是408.54, 449.57和402.50 cp。 3种不同处理条件下SPXY分组的校正集的参数值范围及标准偏差均大于验证集, 说明SPXY分组的趋势相同。 此外, 更要注意的是, 3组校正集和验证集的均值、 标准偏差均不相同, 这说明具体样本集选择结果有所不同。 主要原因是, SPXY方法选择样本集时, 采用光谱变量和理化参数变量同时计算样品间距离。 光谱经过不同预处理, 其形式及光谱特征发生了变化, 而SPXY方法充分利用了不同处理光谱的信息结合理化参数针对性进行样本集选择。 这也是SPXY方法相比较于随机算法、 双向算法和duplex等分组算法的优势所在[12]。 总之, 7个糊化特性参数结合不同预处理光谱经过SPXY分组后, 校正集的参数值范围均涵盖了预测集样本的参数范围, 且标准偏差大于验证集。 样品集划分合理, 有助于建立稳定可靠的预测模型。

表2 不同光谱处理下各糊化特性参数SPXY分组情况 Table 2 The partition of sample sets based on different spectral preprocessing and SPXY
2.4 特征波长的SPA选择

使用SPA方法对各个特征参数的校正集模型进行光谱波长选择, 本研究指定波长数的选择范围为2~20, 波长数选择时, 依据均方根误差RMSE确定最终的特征波长个数。 以峰值粘度为例, MSC处理光谱, 经过SPXY选择校正集, 使用SPA选择特征波长结果如图4所示。

图4 峰值粘度S-G处理光谱SPA特征波长选择结果
(a): 最佳波长变量数; (b): 相应的波长点
Fig.4 Key wavelength variables of peak viscosity selection by SPA
(a): Optimal number of wavelength variables; (b): Optimal wavelengths

图4(a)为最佳波长变量数选择结果, 图4(b)为特征波长点选择结果。 使用SPA算法, 当RMSE为170.5234时, 从MSC处理光谱3387个波数中选择出9个特征波长变量, 分别是385, 417, 424, 432, 510, 527, 778, 912和950 nm。

表3所示为基于校正集的S-G, MSC和1-D预处理光谱使用SPA算法所选峰值粘度、 最低粘度、 衰减值、 最终粘度、 回升值、 糊化温度以及峰值时间等7个糊化特性指标SPA所选择特征波长数量及波长。 以PV值为例, 从表中可以看出, 经过S-G处理光谱, SPA选择了5个特征波长, 分别是380, 389, 420, 440和600 nm; 经过MSC处理光谱, SPA分别选择了385, 417, 424, 432, 510, 527, 778, 912和950 nm等9个波长; 而经过1-D处理光谱, 选择了480, 603, 659, 859, 869和874 nm等6个波长。 利用SPA对光谱变量进行优选, 有效降低了校正模型的复杂程度, 同时也表明, 对于相同的参数, 使用不同光谱预处理方法后, SPA所选择特征波长组合也有较大差异, 预处理对特征波长的选择具有较大影响。 需要注意的是, 使用逐步回归同样可以进行波长优选, 但是其往往存在过拟合的现象。 而SPA算法基于矢量空间共线性最小化的前向变量选择算法, 从严重重叠的光谱信息中提取有效信息同时, 能够消除光谱矩阵中冗余的信息, 在用于光谱特征波长的筛选时, 能够有效的消除过拟合现象, 提高模型稳定性。

表3 不同预处理方法下SPXY-SPA特征波长选择结果 Table 3 Key wavelength variables selection by SPA based on different spectral preprocessing and SPXY
2.4 基于SPA特征波长的MLR模型

对不同处理光谱后各个参数使用SPA选择的特征波长, 建立MLR校正模型, 并使用验证集进行验证, 表4所示为不同处理方法各个特性参数SPA所选择特征波长建立模型的校正和验证结果。 从表中可看出: (1)对于PV值, S-G光谱和MSC光谱通过SPA分别选择5个和9个特征波长所建立MLR模型的预测相关系数Rp分别为0.902 0和0.934 7, SEP分别为201.934 2和147.039 7, 优于1-D光谱所使用6个特征波长模型的预测相关系数0.860 5和预测残差227.680 5; (2)BD值使用S-G光谱特征波长建立模型的预测结果最好, 预测相关系数达到0.924 4, 使用MSC光谱和1-D建立模型预测相关系数较为接近, 在0.89左右。 (3)对于TV值, 由MSC光谱选择的17个波长的预测相关系数最高为0.825 5; (4)FV值使用1-D数选择16个波长的模型预测结果最好, 相关系数为0.853 1; (5)SB值, MSC和1-D光谱所选特征波长所建立模型预测结果较为接近在0.86左右。 (6)对于GT和峰值时间PT, 模型校正和验证结果较低, 结果不具有实际价值。 原因可能是, 样本实际测定这两个参数差异较小, 而其余参数具有较大的差异。 总体而言, PV和BD的模型校正和验证结果最好, 预测最高相关系数均在0.92以上, TV, FV和SB值的结果次之, GT和PT值的结果最差。

表4 糊化特性的MLR校正和验证结果 Table 4 Calibration and validation results of MLR models
3 结论

获取未粉碎小米可见-近红外反射光谱, 使用S-G平滑法、 MSC和1-D处理, 得到小米S-G, MSC和1-D光谱。 使用RAV快速粘度仪测定小米粉的PV, BD, TV, FV, CB, GT以及PT等7个糊化特性指标。 使用SPXY方法, 结合不同预处理光谱和糊化特性参数值选择校正集和验证集, 使用SPA方法在验证集选择糊化参数的特征波长, 建立MLR预测模型。 结果表明, 模型对PV和BD值的预测结果最好, Rp最高为0.934 7和0.924 4, SEP分别为174.039 7和178.020 1, 同时, 模型可以较好的预测最TV, FV和CB值, 最高Rp分别为0.825 5, 0.853 1和0.874 6, SEP分别为67.220 3, 132.166 7和74.251 8。 本研究可为小米产品加工产业从原料阶段快速判断其糊化特性, 评价产品加工品质提供一定技术支持。 目前, 试验样本均为山西当地产晋谷21号单一品种, 在今后的研究中, 要增加试验样本的品种以及产地的广泛性, 以建立广泛的有适应性的模型。

参考文献
[1] YAN Sha, YAN Hong, GAO Ya, et al(延莎, 闫虹, 高雅, ). The Food Industry(食品工业), 2017, 42(10): 159. [本文引用:1]
[2] WU Li-gen, QU Ling-bo(吴立根, 屈凌波). Food Research and Development(食品研究与开发), 2018, 39(15): 191. [本文引用:1]
[3] CHEN Xiang-dong, WU Xiao-jun, JIANG Xiao-ling, et al(陈向东, 吴晓军, 姜小苓, ). Food Research and Development(食品研究与开发), 2018, 40(1): 163. [本文引用:1]
[4] LIU Ya-chao, LI Yong-yu, PENG Yan-kun, et al(刘亚超, 李永玉, 彭彦昆, ). Chinese Journal of Analytical Chemistry(分析化学), 2019, 47(5): 785. [本文引用:1]
[5] Chen H Z, Song Q Q, Tang G Q, et al. Journal of Cereal Science, 2014, 60: 595. [本文引用:1]
[6] XU Yi-ru, LIU Cui-ling, SUN Xiao-rong, et al(徐一茹, 刘翠玲, 孙晓荣, ). Food Science(食品科学), 2014, 35(12): 128. [本文引用:1]
[7] ZOU Xiao-bo, CUI Xue-ping, SHI Ji-yong, et al(邹小波, 崔雪平, 石吉勇, ). Transactions of The Chinese Society of Agricultural Machinery(农业机械学报), 2018, 49(3): 341. [本文引用:1]
[8] Wiedemair V, Mair D, Held C, et al. Talanta, 2019, 205: 120115. [本文引用:1]
[9] GB/T5009. 3—2016 National Food Safety Stand ard-Determination of Moisture in Food(食品安全国家标准食品中水分的测定). [本文引用:1]
[10] GB24852—2010 National Food Safety Stand ard-Determination of Pasting Properties of Rice-Rapid Visco Analyzer Method(食品安全国家标准大米及米粉糊化特性测定快速粘度仪法). [本文引用:1]
[11] Tian H, Zhang L N, Li M, et al. Infrared Physics & Technology, 2018, 95: 88. [本文引用:1]
[12] ZHAN Xiao-ri, ZHU Xiang-rong, SHI Xin-yuan, et al(展晓日, 朱向荣, 史新元, ). Spectroscopy and Spectral Analysis(光谱学与光谱分析), 2009, 29(4): 964. [本文引用:2]
[13] Soares S F C, Galvao R K H, Araujo M C U, et al. Analytica Chimica Acta, 2011, 689(1): 22. [本文引用:1]
[14] Liu F, He Y. Food Chemistry, 2009, 115(4): 1430. [本文引用:1]