近红外光谱检测鲜食玉米可溶性固形物含量
杨光辉1,3, 张永立1,2,3,*, 王美蟠1,3, 刘燕德4, 姜小刚4, 孙静2,3, 周新群2,3, 韩太林1,*
1.长春理工大学电子信息工程学院, 吉林 长春 130013
2.农业农村部规划设计研究院, 北京 100125
3.农业农村部农产品产地初加工重点实验室, 北京 100125
4.华东交通大学智能机电装备创新研究院, 江西 南昌 330013
*通讯作者 e-mail: hantl@cust.edu.cn; Lalizhang@163.com

作者简介: 杨光辉, 2001年生,长春理工大学电子信息工程学院硕士研究生 e-mail: y0119gh@163.com

摘要

我国是世界上鲜食玉米生产和消费大国。 可溶性固形物含量(SSC)是衡量鲜食玉米品质的关键指标, 目前迫切需要有效的快速无损检测方法以应对市场的检测需求。 为实现鲜食玉米SSC的快速无损检测, 本研究建立基于近红外光谱特征结合化学计量学方法的鲜食玉米SSC预测模型。 以甜玉米为研究对象, 利用实验室自主搭建的近红外检测装置, 探索基于鲜食玉米物料的多点采集方法; 获取果穗中部的近红外漫反射光谱, 经马氏距离法剔除异常光谱后, 选取103个样品进行建模。 数据集按照4: 1的比例划分成训练集和测试集, 应用Savitzky-Golay平滑(SGS)、 标准正态变换(SNV)、 多元散射校正(MSC)、 一阶导数(FD)以及去趋势(DT)等五种算法对光谱数据进行预处理, 建立SSC全波段预测模型。 采用竞争性自适应重加权算法(CARS)、 连续投影算法(SPA)以及随机蛙跳算法(RF)进行特征波段选择, 建立基于偏最小二乘回归算法(PLSR)和支持向量机回归算法(SVR)的SSC特征波段模型。 结果表明: SNV、 MSC以及FD取得了较好的预处理效果, 与全波段建模相比, 特征波段模型预测精度显著提升。 SNV预处理结合CARS特征提取所建立的“SNV-CARS-PLSR”模型表现最优, 训练集决定系数($R_{C}^{2}$)、 训练集均方根误差(RMSEC)、 测试集决定系数($R_{P}^{2}$)、 测试集均方根误差(RMSEP)、 剩余预测偏差(RPD)分别为0.869、 0.219、 0.858、 0.191、 2.715。 相较于SNV预处理的全波段模型, “SNV-CARS-PLSR”模型在测试集的$R_{P}^{2}$提高了12.3%。 对比不同特征波段模型建模方法, 基于SVR建立的“SNV-CARS-SVR”模型稍优于基于PLSR建立的“SNV-CARS-PLSR”模型, “SNV-CARS-SVR”模型的$R_{C}^{2}$为0.881, RMSEC为0.207, $R_{P}^{2}$为0.869, RMSEP为0.185, RPD为2.843。 该研究可为基于近红外光谱技术实现鲜食玉米果穗SSC的快速检测提供技术支撑。

关键词: 鲜食玉米; 近红外光谱; 可溶性固形物; 化学计量学; 特征波长
中图分类号:O657.33 文献标志码:A
Determination of Soluble Solids Content in Fresh Corn by Near Infrared Spectroscopy
YANG Guang-hui1,3, ZHANG Yong-li1,2,3,*, WANG Mei-pan1,3, LIU Yan-de4, JIANG Xiao-gang4, SUN Jing2,3, ZHOU Xin-qun2,3, HAN Tai-lin1,*
1. School of Electronic and Information Engineering, Changchun University of Science and Technology, Changchun 130013, China
2. Academy of Agricultural Planning and Engineering, Ministry of Agriculture and Rural Affairs, Beijing 100125, China
3. Key Laboratory of Agro-Products Primary Processing, Ministry of Agriculture and Rural Affairs, Beijing 100125, China
4. School of Intelligent Electromechanical Equipment Innovation Research Institute, East China Jiaotong University, Nanchang 330013, China
*Corresponding authors
Abstract

China is the world's largest producer and consumer of fresh corn. Soluble solids content (SSC) is a key indicator of the quality of fresh corn, and there is an urgent need for effective and rapid non-destructive testing methods to respond to the market demand for the test. In order to realize the rapid and nondestructive detection of fresh corn SSC, a prediction model of fresh corn SSC based on near-infrared spectral features combined with a chemometrics method is proposed. Taking sweet corn as the research object, using the near-infrared (NIR) detection device built independently by the laboratory, we explored the multi-point acquisition method based on fresh corn materials to obtain the NIR diffuse reflectance spectra in the middle of the cob, and after the anomalous spectra were excluded by the Mahalanobis distance method, 103 samples were selected for modeling. The dataset is divided into training and test sets according to the ratio of 4∶1, and five algorithms, including Savitzky-Golay smoothing (SGS), Standard Normal Transform (SNV), Multivariate Scattering Correction (MSC), First-Order Derivative (FD), and De-Trending (DT), are applied to preprocess the spectral data and build the SSC full-band prediction model. The competitive adaptive reweighting algorithm (CARS), successive projection algorithm (SPA), and random frog hopping algorithm (RF) are used for feature band selection, and the SSC feature band model based on the partial least squares regression algorithm (PLSR) and support vector machine regression algorithm (SVR) is established. The results show that: SNV, MSC, and FD achieved better preprocessing results, and the prediction accuracy of the eigen-band model was significantly improved compared with the full-band modeling. The “SNV-CARS-PLSR” model built by SNV preprocessing combined with CARS feature extraction performs optimally, The training set coefficient of determination ($R_{C}^{2}$), training set root mean square error (RMSEC), test set coefficient of determination ($R_{P}^{2}$), test set root mean square error (RMSEP), and residual prediction deviation (RPD) were 0.869, 0.219, 0.858, 0.191, and 2.715, respectively. Compared to the SNV-preprocessed full-band model, the “SNV-CARS-PLSR” model improves the $R_{P}^{2}$ of the test set by 12.3%. Comparing the different feature band modeling methods, the “SNV-CARS-SVR” model based on SVR is slightly better than the “SNV-CARS-PLSR” model based on PLSR. The “SNV-CARS-SVR” model has an $R_{C}^{2}$ of 0.881, an RMSEC of 0.207, an $R_{P}^{2}$ of 0.869, an RMSEP of 0.185 and an RPD of 2.843. This study can provide technical support for rapidly detecting SSC in fresh corn cobs based on near-infrared spectroscopy.

Keyword: Fresh corn; Near-infrared spectroscopy; Soluble solids; Chemometrics methods; Characteristic wavelength
引言

鲜食玉米是指在乳熟期采收并供食用的特用玉米, 具有较高的营养价值和市场需求。 可溶性固形物含量(soluble solid content, SSC)反映了鲜食玉米籽粒的糖分情况, 可作为品质分级的重要指标[1, 2]。 研究表明, 鲜食玉米从采收到商品化处理时间控制在6 h以内时, 其商品性表现最佳[3]。 现有的SSC检测方法主要包括折光法和化学分析法, 前者破坏样品, 后者检测过程耗时, 难以适应鲜食玉米快速、 大规模的检测需求[4, 5]。 因此, 迫切需要一种能够快速且无损评估鲜食玉米SSC的检测方法。

近年来, 近红外光谱技术凭借其快速、 无损、 准确及绿色的优势, 广泛应用于农业和食品领域[6, 7, 8]。 针对果蔬SSC的近红外检测, 国内外学者在光谱采集和数据处理方面进行了大量研究。 物料物理属性不同, 采取的光谱采集方法不同, 研究者分别对西瓜[9]、 苹果[10, 11]和圣女果[12]等果蔬采用了透射、 漫透射和漫反射的光谱采集方法, 建立了各自匹配的SSC预测模型。 物料姿态、 采集部分和预处理方法都会影响预测模型精度, 严忠伟等[13]针对西瓜开展了不同采集姿态与采集部位对比验证试验, 结果发现不同姿态的光谱数据, 需要匹配不同预处理方法才能得到较好的预测效果。 另外, 物料品种与尺度大小也会影响预测模型精度, 吴虹璋等[14]研究了3个葡萄品种的可见/近红外光谱与SSC的关系, 发现SNV预处理对不同葡萄品种的模型效果存在差异。 以上研究表明, 果蔬SSC近红外光谱采集方式取决于物料物理属性, 尺寸大小、 采集部位及预处理方法均会影响建模精度。 鲜食玉米果穗形态特殊, 主要由玉米芯和大小不一的玉米籽粒组成, 且玉米籽粒排列不均。 张永立等[20]对鲜食玉米近红外光谱采集影响因素进行了基础探究, 得出了漫反射是最佳采集方式结论, 并建立了鲜食玉米含水率预测模型。 但基于近红外光谱的鲜食玉米SSC预测模型报道较少。

特征波长提取方面, 相较于全波段建模, 特征波段建模能够降低模型的复杂度, 减少非相关因素的干扰。 Fan等[15]使用竞争性自适应重加权采样(CARS)和连续投影算法(SPA)选择出15个有效波长, 建立了快速检测苹果SSC的模型, 显著减少了特征波长数量。 Mishra等[16]通过变量选择方法优化了近红外光谱技术在梨果品质参数预测中的模型精度。 研究表明, 波长范围为709~759和789~999 nm的光谱区间在构建稳健的SSC预测模型中具有关键作用。

鲜食玉米SSC预测模型不同于其他果蔬SSC检测[17, 18, 19], 采用近红外光谱技术检测鲜食玉米SSC具有一定的可行性。 但鲜食玉米物理属性较为复杂, 果穗粗细、 籽粒大小不一和间隙均对光谱信号产生影响[20], 增加了光谱解析的难度。 另外, 鲜食玉米的高水分含量导致其近红外光谱主要受水吸收特征的影响[21], 水分的强吸收特征可能干扰SSC的光谱特征, 进而降低SSC检测的精度。 因此, 开展鲜食玉米SSC无损检测是既有意义又有挑战的研究。 综上所述, 基于近红外光谱技术, 以籽粒排列整齐的玉米中部为采集区域, 多点采集鲜食玉米光谱信息, 建立SSC的无损检测模型。 选择合适的光谱预处理方法和特征波长提取算法, 对所建立的SSC预测模型进行优化。 旨在探究鲜食玉米光谱特征与SSC含量的关系, 建立最佳鲜食玉米SSC近红外检测模型, 为实现鲜食玉米SSC的快速、 无损检测提供重要参考和技术支持。

1 实验部分
1.1 试验材料

选用甜玉米作为研究对象, 于2024年8月3日下午在河北省清河县田间采摘, 采摘后立即运送至实验室。 在带苞叶的状态下置于4 ℃冰箱中进行冷藏储存, 以保持其新鲜度。 于次日早晨将样品从冰箱取出, 在室温25 ℃下静置2 h, 人工剥去苞叶并去除玉米须, 挑选大小一致且籽粒饱满的鲜食玉米进行编号, 最终选取140个样品用于试验。

1.2 光谱数据采集

实验采用自行搭建的漫反射式近红外光谱无损检测装置测量鲜食玉米样品光谱, 装置详情见参考文献[20]。 选取果穗粗细一致, 籽粒排列整齐的鲜食玉米中部作为取样区域。 实验前将设备预热30 min, 减少因温度变化导致的测量偏差。 每次测量时, 玉米样品沿着果穗中轴线进行圆周旋转, 每根样品旋转360° , 共采集6次光谱, 并将6次测量的平均值作为该样品的原始光谱。 此次实验共测量了140个样品, 采集了840次光谱, 获得140条原始平均光谱数据, 经异常值判别后选取103条数据构成数据集。 光谱数据的采集流程图1所示。

图1 鲜食玉米多区域采集光谱示意图
(a): 检测系统结构示意图; (b): 光谱采集区域示意图; (c): 多区域采集鲜食玉米原始光谱
Fig.1 Schematic of a multi-region collection spectral system for fresh corn
(a): Schematic of the detection system structure; (b): Schematic of the spectral acquisition regions; (c): Original spectra of fresh corn acquired from multiple regions

1.3 SSC指标测定

SSC的测定选用BM-06S型数字式折射计(测量范围0~55%Brix, 精度0.1%Brix)。 在完成光谱采集后, 参照NY/T2637— 2014《水果、 蔬菜制品可溶性固形物含量的测定— — 折射装置法》, 逐个测定每个样品的SSC值。 使用脱粒器从对应光谱采集区域获取150 g完整籽粒, 放入捣碎机中进行捣碎。 将碎样通过两层300目纱布榨汁, 装入对应标号的试管后, 置于离心机中以8 000 r· min-1的速度离心10 min, 随后, 取离心管中上层清液滴入BM-06S型数字折光仪的样液池中, 进行SSC的测定。 首次测定前, 将数字式折射计按要求开机预热, 使用蒸馏水进行调零校准, 每次滴入溶液前, 需用蒸馏水将镜面清洗干净。 每个样品进行3次测量, 计算其平均值以确定该鲜食玉米的SSC最终测定值。

1.4 光谱预处理及波段选择

鲜食玉米果穗粗细不一, 籽粒之间有一定间隙, 光谱采集过程中受基线漂移与杂散光影响大。 采用多种预处理方法对光谱数据进行优化, 包括: Savitzky-Golay平滑(Savitzky-Golay smoothing, SGS)、 标准正态变换(standard normal variate, SNV)、 多元散射校正(multiplicative scatter correction, MSC)、 一阶导数(first derivative, FD)以及去趋势预处理(detrending, DT)。 这些预处理方法用于减少光谱数据中的噪声干扰和散射效应[22], 为后续建模提供更加可靠的光谱信息。

鲜食玉米含有多种有机化合物和大量水分, 其全波段光谱数据维度较高且包含大量与SSC检测无关的信息。 通过特征波长提取, 可以有效降低数据维度, 减少无关信息的干扰, 增强模型的鲁棒性。 利用竞争性自适应重加权算法(competitive adaptive reweighted sampling, CARS)[23]、 连续投影算法(successive projections algorithm, SPA)[24]以及随机蛙跳算法(random frog, RF)[25]提取特征波长, 分别建立特征波段光谱信息与鲜食玉米SSC含量的预测模型。

1.5 模型建立方法与评价指标

将处理完的数据利用偏最小二乘回归(PLSR)和支持向量机回归(SVR)两种方法分别建立模型并进行对比分析。 光谱数据利用马氏距离法对异常的光谱曲线进行剔除, 最终从140个鲜食玉米光谱数据中挑选出103个样品用于建模, 建模数据使用基于联合X-Y距离的样本集划分方法(sample set partitioning based on joint X-Y distances, SPXY)方法按4∶ 1划分为训练集和测试集。 通过决定系数R2、 均方根误差(root mean square error, RMSE)、 剩余预测偏差(residual predictive deviation, RPD)来评价所建模型性能[26], 计算公式如式(1)— 式(3)

R2=1-(yi-ŷi)2(yi-y-)2(1)

RMSE=i=1n(yi-ŷi)2n-1(2)

RPD=SDRMSE(3)

式(1)— 式(3)中: yi为第i个样品的实际SSC值, ŷi为该样品的预测值, y-为实际值的平均值, n为样本个数, SD表示测试集样本含量的标准差。

2 结果与讨论
2.1 SSC测定结果分析

建模数据包含103个鲜食玉米样品, 通过SPXY方法分别划分为82个训练集和21个测试集, SSC分析结果如表1所示。 根据表中数据, 训练集样品的SSC浓度范围涵盖了测试集样品的浓度范围, 数据主要集中在中间浓度区间, 两边浓度区间数据较少, 训练集和测试集中位于均值附近一个标准差范围内的样本比例分别为70.7%和71.4%, 接近正态分布要求约68%的比例, 表明所选择的样本分布接近正态分布, 具有良好的代表性。

表1 鲜食玉米样品SSC分析结果 Table 1 Results of SSC analysis of fresh corn samples
2.2 鲜食玉米近红外光谱分析

由于光谱仪器在900和1 700 nm波长范围附近的反射强度较低且伴有较多噪声, 因此选择了1 000~1 650 nm的光谱数据进行进一步分析。 图2展示了鲜食玉米样品的原始光谱曲线。 从图形中可以看出, 不同样品之间光谱曲线特征基本一致, 主要表现为吸收强度差异。 在波长1 200和1 450 nm附近均观察到明显的吸收峰, 这些吸收峰在不同样品间的差异较为明显。 已有的文献表明1 200 nm附近的吸收峰主要与C— H键的二级倍频和合频吸收相关, 而1 450 nm附近的吸收峰则与水分中游离O— H键的一级倍频吸收有密切联系[27, 28]

图2 鲜食玉米原始光谱曲线Fig.2 Raw spectral curves of fresh corn

2.3 SSC全波段预测模型建立

采用SGS、 SNV、 MSC、 FD以及DT等算法对光谱数据进行预处理。 在全波段数据的基础上, 利用PLSR建立鲜食玉米SSC的预测模型, 通过十折交叉验证, 以交叉验证均方根误差(RMSECV)最小值确定最佳潜在变量数量(LVs)。 结合模型评价指标, 筛选合适的预处理算法, SSC全波段建模结果如表2所示。 根据表2的数据分析可知, 未预处理时, 全波段模型的测试集 RP2, RMSEP, RPD分别为0.654, 0.268, 1.693, 显著低于经预处理后的结果。 这表明适当的光谱预处理方法能够有效提升模型的预测精度。 对比不同预处理方法, MSC、 SNV以及FD均显著改善了模型性能。 其中, SNV预处理效果最佳, 测试集 RP2提升至0.764, RMSEP降至0.231, RPD增至2.131。 MSC、 SNV和FD预处理后的光谱如图3所示, MSC和SNV预处理有效消除了由于籽粒大小、 表面沟壑等物理特性导致的散射效应, 而FD预处理则去除了光谱中的基线漂移。

表2 SSC全波段建模结果 Table 2 SSC full-band modeling results

图3 预处理后光谱
(a): SNV预处理后的光谱; (b): MSC预处理后的光谱; (c): FD预处理后的光谱
Fig.3 Spectra after pretreatment
(a): Spectra after SNV pretreatment; (b): Spectra after MSC pretreatment; (c): Spectra after FD pretreatment

2.4 SSC特征波段预测模型建立

为降低非目标成分对SSC预测的干扰, 对预处理后的光谱数据进行特征波长提取, 降低模型的复杂度, 削弱无关信息与噪声的影响, 增强模型的泛化能力。 选取表2中预处理效果较好的SNV、 MSC以及FD等3种预处理方法, 结合CARS、 SPA以及RF等特征提取算法所提取的特征波长, 分别建立基于特征波段光谱信息的SSC预测模型。 采用变量数、 决定系数R2和均方根误差(RMSE)评估CARS、 SPA以及RF等特征提取算法对模型性能的影响, 计算结果总结于表3中。

表3 SSC特征波段建模结果 Table 3 SSC modeling results based on characteristic band

通过对比表3中鲜食玉米SSC特征波段建模结果可以发现, CARS、 SPA以及RF变量选择算法显著减少了建模所需的波长数量。 与未进行特征提取的SNV预处理全波段建模相比, CARS、 SPA以及RF算法在测试集上的 RP2分别达到了0.858、 0.808、 0.831, 较全波段建模分别提高了12.3%、 5.7%和8.7%。 这一结果表明, 特征波段建模在减少模型复杂度的同时, 还提高了模型的预测精度。

根据不同提取算法提取的特征波长数据分析可知, RF、 CARS、 SPA三种算法提取的特征波长数量逐步减少。 其中, CARS和RF算法提取的特征波段覆盖了1 149~1 242和1 426~1 483 nm两个区域, 这两个区域包含了1 200和1 450 nm附近的重要吸收峰。 相比之下, SPA算法所提取的特征波长主要集中在1 173~1 263 nm区间。

2.4.1 CARS算法选择特征波段

以SNV预处理后的数据为例, 使用CARS算法对鲜食玉米光谱数据进行特征提取。 设定迭代次数为50, 重采样率0.8, CARS提取特征参数过程如图4所示。 由图4(a)可知, 随着迭代次数的提升, 筛选变量数量“ 由多到少” , 有效提升了算法效率, 大量剔除无用光谱信息。 由图4(b)中可知, 在前18次迭代过程中与鲜食玉米SSC无关的信息被大量剔除, RMSECV在第19次迭代时达到最低值, 之后的迭代过程中, 有效光谱信息被剔除, RMSECV值开始上升。 图4(c)中, 每条曲线表示每个特征波长在不同迭代次数时的回归系数, 图中直线标示了最小RMSECV值所对应的采样次数, 对应最佳特征波长集合。

图4 (a)特征波长选择数; (b)RMSECV变化轨迹; (c)波长回归系数走势Fig.4 (a) Selection number of characteristic wavelengths; (b) RMSECV change trajectory; (c) Trend of wavelength regression coefficient

2.4.2 SPA算法选择特征波段

波长之间相关性较强时, 采用SPA算法能够有效减少冗余特征, SPA算法筛选特征波长过程如图5(a)所示。 当特征波长个数选择为24时, 对应的均方根误差(RMSE)最低, 为0.253, 此时大量共线性信息被剔除。 由图5(b)可知, SPA算法所选取的特征波长主要集中分布在1 173~1 263 nm 区间, 该吸收峰主要与C— H键的二级倍频与合频吸收有关, 在1 450 nm吸收峰附近选取的特征波长较少。

图5 (a)SPA算法筛选特征波长过程; (b)SPA算法选取特征波长Fig.5 (a) Process of screening feature wavelength by SPA algorithm process; (b) Distribution of characteristic wavelengths selected by SPA algorithm

2.4.3 RF算法选择特征波段

以SNV预处理后的数据为例, 设定RF算法的选择阈值为0.2。 RF变量选择的概率如图6所示。 从图中可以看出, 36~52、 55~67、 79~94、 108~138这几个区间的特征变量被选择的概率较高, 对应的近红外光谱区域为1 140~1 210、 1 222~1 271、 1 320~1 381和1 438~1 561 nm。 该模型选择的特征波长仅包含原始光谱变量的34.3%, 减少波长数量的同时降低了冗余信息, 提高了计算效率。

图6 RF变量选择概率Fig.6 RF variable selection probability

在鲜食玉米SSC全波段建模及特征波段建模过程中, SNV预处理方法表现出最佳的模型预测效果。 具体而言, 采用SNV预处理的最佳模型的训练集 RC2为0.869, RMSEC为0.219, 测试集 RP2为0.858, RMSEP为0.191, RPD为2.715。 表明SNV预处理在处理鲜食玉米的近红外光谱数据时具有显著优势。

通过比较不同预处理方法的特征波段模型的准确性, 发现采用CARS算法进行特征提取后, 模型的预测精度高于SPA和RF算法。 实验结果表明, 结合适当的光谱预处理方法与特征波长提取算法, 可实现对鲜食玉米果穗SSC值的准确预测。 本研究进一步验证了利用近红外光谱技术对鲜食玉米果穗SSC进行定量分析的可行性和有效性。

2.5 特征波段预测模型对比分析

为探究所提取的特征波段在不同预测模型中的效果, 对比了PLSR和SVR这两种建模方法在特征波段建模中的效果。 将经过光谱预处理和CARS特征波段提取的数据输入到SVR模型中, 与PLSR模型的预测结果对比。 SVR采用径向基核函数, 使用粒子群优化算法对SVR的惩罚因子C和核参数g进行优化, 设置算法参数: 种群数量为30, 迭代次数为50, 待优化超参数的取值范围[0.01, 100]。 预测结果见表4。 对比表3表4的数据可以看出, 对于MSC以及SNV预处理, SVR特征波段模型效果略优于PLSR特征波段模型。 其中, “ SNV-CARS-SVR” 模型的效果最优, 训练集 RC2为0.881, RMSEC为0.207, 测试集 RP2为0.869, RMSEP为0.185, RPD为2.843。 特征波段预测模型的预测散点图如图7所示。

表4 SVR算法建模结果 Table 4 SVR algorithm modeling results

图7 预测散点图
(a): SNV-CARS-PLSR模型; (b): SNV-CARS-SVR模型
Fig.7 Scatter plots between actual and predicted values
(a): SNV-CARS-PLSR model; (b): SNV-CARS-SVR model

3 结论

通过多点采集鲜食玉米光谱信息, 对光谱数据进行不同预处理, 建立了SSC全波段预测模型, 在此基础上结合特征波长提取算法对模型进行优化, 最后对比分析了基于PLSR和SVR的特征波段模型效果。 得出如下结论:

(1)比较了SGS、 SNV、 MSC、 FD和DT等五种预处理方法对鲜食玉米光谱数据的预处理效果。 结果发现SNV、 MSC和FD等预处理方法对采集的鲜食玉米光谱数据具有较好的预处理效果, 其中, SNV预处理效果最佳, 表明SNV预处理能够有效的去除鲜食玉米物理特性导致的散射效应, 提高模型的预测精度。

(2)采用CARS、 SPA以及RF等特征提取算法提取特征波长建立特征波段模型, 相较于全波段建模, 采用特征波段建模有效降低了数据维度, 减弱了无关信息的干扰, 提高了模型性能。 对比不同预处理和特征提取算法, SNV预处理结合CARS特征提取所建立的“ SNV-CARS-PLSR” 模型表现最佳, 测试集预测结果为: RP2为0.858, RMSEP为0.191, RPD为2.715。

(3)在CARS提取特征波长的基础上, 比较了不同预处理下PLSR以及SVR回归模型的预测精度, 结果表明, 基于SVR建立的“ SNV-CARS-SVR” 模型稍优于基于PLSR建立的“ SNV-CARS-PLSR” 模型, 其测试集 RP2为0.869, RMSEP为0.185, RPD为2.843。

研究表明, 多点采集鲜食玉米的近红外漫反射光谱, 结合相应的光谱预处理和特征波长提取算法, 可显著提高鲜食玉米SSC预测模型的精度, 为基于近红外光谱技术实现鲜食玉米果穗SSC的快速检测提供技术支撑。 然而, 模型在不同实验条件下的稳定性和泛化能力仍需进一步验证, 以评估其实际应用的潜力。

参考文献
[1] LI Zi-qi, GU Yan-ting, GUO Yan-zhi, et al(李紫琪, 古艳婷, 郭燕枝, ). Journal of Food Safety & Quality(食品安全质量检测学报), 2022, 13(18): 5964. [本文引用:1]
[2] XU Li, ZHAO Jiu-ran, LU Bai-shan, et al(徐丽, 赵久然, 卢柏山, ). China Seed Industry(中国种业), 2020, (10): 14. [本文引用:1]
[3] ZHAO Lin, CHEN Yu, LUO Le-tan, et al(赵琳, 陈玉, 骆乐谈, ). Journal of Food Safety & Quality(食品安全质量检测学报), 2024, 15(8): 22. [本文引用:1]
[4] SUN Li-juan, ZHAO Zhi-hong, HE Juan, et al(孙丽娟, 赵志宏, 贺娟, ). Crops(作物杂志), 2019, (2): 46. [本文引用:1]
[5] Guo Z, Wang M M, Agyekum A A, et al. Journal of Food Engineering, 2020, 279: 109955. [本文引用:1]
[6] Tsuchikawa S, Ma T, Inagaki T. Analytical Sciences, 2022, 38(4): 635. [本文引用:1]
[7] Bec K B, Grabska J, Huck C W. Foods, 2022, 11(10): 1465. [本文引用:1]
[8] CHEN Pu, YANG Jian, CHU Xiao-li, et al(陈瀑, 杨健, 褚小立, ). Chinese Journal of Analytical Chemistry(分析化学), 2024, 52(9): 1213. [本文引用:1]
[9] Jie D, Xie L, Fu X, et al. Journal of Food Engineering, 2013, 118(4): 387. [本文引用:1]
[10] Xia Y, Fan S, Li J, et al. Chemometrics and Intelligent Laboratory Systems, 2020, 201: 104017. [本文引用:1]
[11] Grabska J, Bec K B, Ueno N, et al. Foods, 2023, 12(10): 1946. [本文引用:1]
[12] Tan B, You W, Huang C, et al. Electronics, 2022, 11(21): 3504. [本文引用:1]
[13] YAN Zhong-wei, TIAN Xi, ZHANG Yi-fei, et al(严忠伟, 田喜, 张艺飞, ). Spectroscopy and Spectral Analysis(光谱学与光谱分析), 2023, 43(6): 1800. [本文引用:1]
[14] WU Hong-zhang, CAI Hong-xing, REN Yu, et al(吴虹璋, 蔡红星, 任玉, ). The Journal of Light Scattering(光散射学报), 2024, 36(1): 44. [本文引用:1]
[15] Fan S, Li J, Xia Y, et al. Postharvest Biology and Technology, 2019, 151: 79. [本文引用:1]
[16] Mishra P, Woltering E, Brouwer B, et al. Postharvest Biology and Technology, 2021, 171: 111348. [本文引用:1]
[17] Ma T, Xia Y, Inagaki T, et al. Postharvest Biology and Technology, 2021, 173: 111417. [本文引用:1]
[18] Tian S, Liu W, Xu H. Food Research International, 2023, 170: 112988. [本文引用:1]
[19] Garrsi S, Jolayemi O S, Giovenzana V, et al. Foods, 2021, 10(5): 1042. [本文引用:1]
[20] ZHANG Yong-li, YANG Guang-hui, WANG Mei-pan, et al(张永立, 杨光辉, 王美蟠, ). Transactions of the Chinese Society of Agricultural Engineering(农业工程学报), 2024, 40(15): 262. [本文引用:3]
[21] Büning-Pfaue H. Food Chemistry, 2003, 82(1): 107. [本文引用:1]
[22] CHEN Pu, DAI Jia-wei, LI Jing-yan, et al(陈瀑, 戴嘉伟, 李敬岩, ). Chemical Reagents(化学试剂), 2023, 45(6): 105. [本文引用:1]
[23] Yuan L M, Mao F, Huang G, et al. Postharvest Biology and Technology, 2020, 169: 111308. [本文引用:1]
[24] Tang R, Chen X, Li C. Applied Spectroscopy, 2018, 72(5): 740. [本文引用:1]
[25] SA Ji-ming, JIANG He, XIE Kai-wen, et al(撒继铭, 江河, 谢凯文, ). Acta Optica Sinica(光学学报), 2021, 41(15): 235. [本文引用:1]
[26] Liu W, Han Y, Wang N, et al. Journal of Physics: Conference Series, 2022, 2221(1): 012012. [本文引用:1]
[27] Yang Q, Yang X, Zhang Q, et al. Optik, 2020, 220: 165128. [本文引用:1]
[28] FAN Meng-li, ZHAO Yue, LIU Yan, et al(樊梦丽, 赵越, 刘言, ). Progress in Chemistry(化学进展), 2015, 27(Z1): 242. [本文引用:1]