高光谱结合离散二进制粒子群算法对久保桃可溶性固形物含量的检测
张立秀, 张淑娟*, 孙海霞, 薛建新, 景建平, 崔添俞
山西农业大学农业工程学院, 山西 晋中 030801
*通讯作者 e-mail: zsujuan1@163.com

作者简介: 张立秀, 女, 1995年生, 山西农业大学农业工程学院硕士研究生 e-mail: Z18503483861@163.com

摘要

可溶性固形物(SSC)是评价久保桃内部品质的重要指标。 传统的SSC检测有损、 费时、 费力; 快速、 无损检测久保桃的SSC含量对于其品质分级有着重要意义。 离散二进制粒子群算法(BPSO)是在标准粒子群算法(PSO)的基础上, 更新速度公式得到的, 具有精度高, 收敛快的特点, 多用于离散空间的优化问题。 基于高光谱技术结合BPSO算法及BPSO的组合特征波长选择算法对久保桃的SSC含量预测进行研究。 首先采集198个久保桃样本的高光谱信息, 获取久保桃900~1 700 nm范围内的光谱信息, 计算感兴趣区域的平均光谱作为有效光谱数据, 同时测量久保桃的SSC值。 采用K-S(Kennard-Stone)算法将样本划分为校正集(147个)和预测集(51个)。 使用BPSO特征波长选择算法对久保桃的原始光谱数据进行特征波长提取, 并与竞争性自适应重加权算法(CARS)、 连续投影法(SPA)、 无信息变量选择法(UVE)等特征波长选择算法比较。 同时为了避免单一算法建模中的不稳定问题, 提出了基于BPSO的一次组合(BPS0+CARS、 BPSO+SPA、 BPSO+UVE)和二次组合[(BPSO+CARS)-SPA]、 [(BPSO+SPA)-SPA]、 [(BPSO+UVE)-SPA]特征波长提取方法。 基于上述10种特征波长提取方法分别建立支持向量机(LS-SVM)模型和遗传算法(GA)优化的支持向量机模型(GA-SVM)模型。 结果表明, 基于BPSO算法提取特征波长建立的模型预测性能均高于其他单一特征波长方法, 建立的两种模型预测集决定系数Rp2均达到0.97以上; 基于BPSO的组合算法中, 二次组合(BPSO+SPA)-SPA算法建立的LS-SVM在特征波长数量较少的情况下对久保桃SSC含量预测性能最高, 校正集和预测集决定系数Rc2为0.982,Rp2为0.955, 均方根误差RMSEC为0.108, RMSEP为0.139。 该模型预测性能略低于BPSO算法, 但其仅用了22个特征波长进行建模, 极大地简化了模型。 说明(BPSO+SPA)-SPA是一种有效的特征波长提取方法, 为水果SSC含量的无损检测提供了新的检测方法。

关键词: 高光谱; 离散二进制算法; 特征光谱变量; 久保桃; 可溶性固形物
中图分类号:O433.4 文献标志码:A
Determination of Soluble Solid Content in Peach Based on Hyperspectral Combination With BPSO
ZHANG Li-xiu, ZHANG Shu-juan*, SUN Hai-xia, XUE Jian-xin, JING Jian-ping, CUI Tian-yu
College of Agricultural Engineering, Shanxi Agricultural University, Jinzhong 030801, China
*Corresponding author
Abstract

Soluble solids (SSC) are an important index to evaluate the internal quality of Kubo peach. Traditional SSC content detection is destructive, time-consuming and laborious. Rapid and nondestructive detection of the SSC content of Kubo peach is of great importance for its quality classification. Binary particle swarm optimization (BPSO) is obtained by updating the speed formula based on standard particle swarm optimization (PSO). BPSO has the characteristics of high accuracy and fast convergence and is mostly used in optimization problems in separate spaces. Taking Kubo peach as the research object. Basedon hyperspectral technology combined with BPSO and based on BPSO combined characteristic wavelength selection algorithm to study the SSC content of Kubo peach. Firstly,hyperspectral information of 198 Kubo peaches was collected to obtain the spectral curve of Kubo peaches in the range of 900~1 700 nm. Meanwhile, theSSC value of Kubo peaches was. Used (Kennard-stone) algorithm to divide samples into a correction set (147) and a prediction set (51). The BPSO feature wavelength selection algorithm is used to extract the feature wavelength from Kubo's original spectral data. It is compared with the Competitive Adaptive Reweighting algorithm (CARS), Successive projections algorithm (SPA), and Uninformative variable selection algorithm (UVE). A method of extracting characteristic wavelength based on BPSO is proposed for primary combination (BPS0+CARS, BPSO+SPA, BPSO+UVE) and secondary combination ((BPSO+ CARS)-SPA), (BPSO+SPA)-SPA), (BPSO+UVE)-SPA). Based on the10 characteristic wavelength extraction methods above. Established support vector machine (LS-SVM) model and the genetic algorithm (GA) optimized support vector machine (GA-SVM) model of Kubo peach SSC content. The results show that the prediction performance of the model based on the BPSO algorithm is higher than that of other single characteristic wavelength algorithm, and the coefficient of determinationRp2 of the prediction set of the two models is above 0.97. Among the combination algorithms based on BPSO, the LS-SVM based on the quadratic combination (BPSO+SPA)-SPA algorithm has the highest prediction performance for Kubo peach SSC content when the number of characteristic wavelengths is small. The coefficient of determination between the correction set and the prediction set are 0.982 and 0.955, respectively. The root mean square errors RMSEC and RMSEP were 0.108 and 0.139, respectively. The prediction performance of the proposed model is slightly lower than that of the BPSO algorithm, but only 22 characteristic wavelengths are used for modeling, which greatly simplifies the model. These results show that (BPSO+SPA)-SPA is an effective method for extracting characteristic wavelength, which provides a new method for nondestructive detection of fruit SSC content.

Keyword: Hyperspectral; Binary particle swarm optimization; Characteristic wavelength; Kubo peach; Soluble solids
引言

“ 久保桃” 是水蜜桃的一种早熟品种, 果型大, 汁液多, 深受消费者喜爱[1]。 可溶性固形物(SSC)是评判鲜桃内部品质的主要指标[2]。 无损、 快速检测鲜桃可溶性固形物含量(SSC)有利于实现水果品质分级。

高光谱成像技术具有分辨率清晰, 波段数多的特点, 被广泛用于果蔬品质的无损检测[3]。 近年来, 高光谱技术结合相应的化学计量学方法评价新鲜水果的品质, 尤其是与口感相关的内部品质如可溶性固形物含量(SSC)、 成熟程度、 软硬程度、 含水量[4]等方面已经取得了重大进展。 Li[5]等利用近红外光谱技术结合连续投影法(SPA)建立了能够预测梨硬度和可溶性固形物含量的偏最小二乘(PLS)模型。 Fan[6]等将高光谱成像技术结合竞争性自适应重加权算法(CARS)建立能够预测苹果的可溶性固形物含量的模型。 Wang[7]等采用高光谱图像技术结合群采样裕度影响分析(GSMIA)预测了库尔勒香梨的可溶性固形物(SSC)含量。 目前采用高光谱技术结合离散二进制粒子群算法(BPSO)及基于BPSO组合算法提取光谱的特征波长, 建立最小二乘支持向量机模型, 研究久保桃的可溶性固形物含量(SSC)含量还未见报道。

离散二进制粒子群算法(BPSO)具有精度高, 收敛快的特点, 能够快速筛选重要光谱特征[8]。 本工作选取久保桃为研究对象, 将光谱技术与基于BPSO算法形成的不同特征变量组合方法相结合, 建立久保桃的SSC含量检测模型。 先利用高光谱仪采集久保桃的高光谱数据, 之后采用BPSO算法、 竞争性自适应重加权算法(CARS)、 连续投影算法(SPA)、 无信息变量消除法(UVE)对久保桃的光谱数据进行特征波长筛选, 并进行建模分析, 同时依据算法之间优势互补的特点, 提出基于BPSO的一次组合与二次组合特征波长筛选方法, 建立遗传算法优化的支持向量机模型(GA-SVM)和最小二乘支持向量机模型(LS-SVM), 确定预测久保桃SSC含量的最优模型。 在久保桃SSC检测方面, 此(BPSO+SPA)-SPA-LS-SVM方法尚未见报道, 为久保桃SSC含量的无损检测提供了新的检测方法。

1 离散二进制粒子群算法(BPSO)原理
1.1 BPSO位置更新原理

标准粒子群算法(PSO)是一种优化全局搜索能力, 解决组合优化存在问题的算法, 主要适用于处理优化连续空间内的问题。 在求解优化问题时, 搜索寻找空间中的任何一个最优的“ 粒子” 即可找到连续空间内问题的最优解, 任一粒子都有着决定其将要飞行方向的初始位置和决定其飞行距离的初始速度以及由优化函数决定的适应值。 在每一次找寻问题最合适的答案的迭代循环过程中, 每个粒子通过追踪单个极值和群体极值来更新自身的位置和速度[9]。 其速度和位置更新公式如式(1)和式(2)所示。

设: 粒子的目标搜寻空间为D维, N个粒子组成的种群X={x1, x2, …, xN}T, 则每个粒子可用R维向量表示: xi=(xi1, xi2, …, xiR)T。 粒子飞行速度vi=(vi1, vi2, …, viR)T该粒子当前最优解为pi=(pi1, pi2, …, piR)T, 该种群当前最优解gt=(gt1, gt2, …, giR)T。 其更新过程为

-vid(t+1)=w(t)vid(t)+c1r1(pid(t))+c2r2(gid(t)-xid(t))(1)

xid(t+1)=xid(t)+vid(t+1)(2)

其中, i=1, 2, …, N为种群范围; d=1, 2, …, R为粒子群算法解的找寻空间; t为进化迭代数; r1, r2为均匀分布在[0, 1]之间的随机数; c1, c2为学习因子; w为惯性权重, 主要是描述每一个粒子上一代的速度对当前代速度的影响大小; pid为第i个粒子在D维空间搜索的最优位置点; pgd为整个种群在D维搜索到的最优位置点[10]

标准粒子群(PSO)算法主要用来优化连续的空间最优解问题, 由于光谱数据是离散空间的优化问题, 而离散二进制粒子群算法(BPSO)是在标准粒子群算法(PSO)的基础上通过更新位置公式得到的, 主要用来优化离散空间约束问题, 因此采用BPSO算法来优化光谱数据问题。 BPSO算法采用了二进制编码, 其中的每个粒子均由二进制变量0与1表示, 每个粒子对应光谱的一种组合, 位置状态的改变用速度表示, 飞行速度 vidt值越大, 粒子位置 xidt为1时, 粒子对应的光谱为特征光谱; 反之, 飞行速度 vidt值越小, 粒子位置则为0时, 粒子对应的光谱为冗余信息[11]。 其速度更新公式见式(1)位置更新公式见式(3)和式(4)。

xid(t+1)=1S(vid(t+1))> pid(t+1)0S(vid(t+1)< pid(t+1)(3)

其中sigmoid型函数为

S(vid(t+1))=11+e-vid(t+1)(4)

式(4)中, pid(t+1)是随机向量, 其取值为区间(0, 1)中的随机数[12]

1.2 BPSO特征筛选原理

将BPSO算法应用于筛选久保桃的光谱数据时, 每个粒子均对应着久保桃光谱数据的适应度值, pidpgd是由粒子的适应度值来决定, 适应度值由适应度函数计算得到[13], 适应度函数与筛选出的光谱特征波长有相关性。 根据适应度函数将适应度值高的粒子优选出来。 每个粒子对应一种光谱的特征组合, 粒子的每一维对应一个波长, 根据式(3), 粒子的某一维取值为1时表示选择这一维光谱, 取值为0时表示不选择这一维光谱, 依次选出粒子对应的光谱数据特征组合, 即为筛选出的特征波长。

1.3 基于BPSO的降维组合方法

BPSO算法有效解决了离散空间的优化问题, 但由于BPSO算法中采用的粒子是二进制数, c2r2( gid(t)- xid(t))在相减过程中出现0的概率很大, 这样会使粒子搜寻最优解时失去个体最优和全局最优, 从而选出的特征光谱仅为局部最佳光谱[14]。 为了弥补这种不足, 将BPSO算法与常用特征波长提取方法-竞争性自适应重加权算法(CARS)、 连续投影算法(SPA)、 无信息变量消除法(UVE)选出的特征波长进行组合, 形成BPSO+CARS、 BPSO+SPA、 BPSO+UVE一维组合方法, 这些方法筛选出的特征波长最大程度地包含了有用的特征光谱信息, 但仍存在一些冗余信息, 因此采用SPA法对这些一维组合方法进行二次降维筛选, 形成(BPSO+CARS)-SPA、 (BPSO+SPA)-SPA、 (BPSO+UVE)-SPA二维组合方法, 挑选出具有最少冗余信息, 又最具代表性的特征变量组合, 进而有效解决原始全波段信息重叠的问题。

2 实验部分
2.1 样本

实验样本采自山西省晋中市太谷区西山底村桃园, 品种为“ 早熟大久保” 。 为保证研究结果的可靠性, 采摘时选择大小均匀, 外形类似的久保桃, 共选取了198个久保桃样本。 利用Kennard-Stone算法按照3:1的比例随机分为147个校正集和51个预测集。

2.2 仪器设备与SSC测量

采用的光谱仪是“ 盖亚” 高光谱分选仪(北京卓立汉光仪器有限公司), 选用光谱波长范围为900~1 700 nm, 分辨率为5 nm。 实验样本曝光时间为20 ms, 样本到镜头的高度为22 cm, 电控移动平台前进的速度为2 cm· s-1, 黑白校正方式见参考文献[15]。 采集光谱所用软件为: SpecView图像采集软件, 处理数据软件为: ENVI4.7(ITT Visual in formagtion Solutions, Boudler, 美国), Matlab2016b(The MathsWorks, Natick, 美国)、 The Unscrambler X10.1(CAMO AS, Oslo, 挪威)、 Origin8.5(Origin Lab, 美国)。 SSC含量测量采用PAL-106糖度计(杭州齐威仪器设备有限公司)。

参照GB/T10788-89《水果、 蔬菜制品中可溶性固形物含量的测定》。 对每个久保桃实验样本的可溶性固形物含量(SSC)进行测定。 SSC值如表1所示。

表1 久保桃SSC的实测值(%) Table 1 Measured SSC values of Kubo peach (%)
2.3 原始光谱曲线

使用ENVI4.7软件提取久保桃样本中心位置80像素× 80像素的感兴趣区域, 经处理分析后得到久保桃样本的原始光谱曲线。 在原始光谱曲线的基础上, 计算了均值, 绘制了原始光谱曲线的均值曲线图, 并在均值曲线图上对特征吸收峰进行了相应的标注。 如图1所示。

图1 样品光谱
(a): 原始光谱; (b): 平均光谱
Fig.1 Spectra of samples
(a): Original spectra; (b): Mean spectrum

由图1知, 久保桃样本的光谱数据在1 216.56和1 467.86 nm处出现较为明显的吸收峰, 在939.21、 987.08和1 652.04 nm处出现小的吸收峰, 其中900~1 216.56 nm波段之间的吸收峰, 与久保桃表皮及桃果实细胞中叶绿素和类胡萝卜素的吸收有关, 1 216.56~1 700 nm之间的吸收峰, 与久保桃果实内部所含水分的多少与糖分含量有关, 分别属于O-H三级和二级倍频特征吸收峰[16]

2.4 特征光谱变量的提取与组合

特征光谱变量的提取是为了提取原始全波段光谱中有用的波长信息, 以提高预测模型的精准性, 提取特征光谱变量时, 既要尽可能减少总的波长个数, 又要确保不遗漏重要光谱信息。

2.4.1 基于BPSO的特征光谱变量提取

利用BPSO算法提取特征光谱变量时, 设置循环次数T为10次, 最大迭代次数150, 惯性因子初始值c1=c2=2, 最大速度vmax为6, 最大惯性wmax为0.9, 最小惯性wmin为0.4。 BPSO挑选特征波长过程中, 最优粒子适应值的变化曲线如图2所示。 横坐标表示迭代次数, 纵坐标表示适应度曲线。

图2 BPSO提取特征波长过程Fig.2 Characteristic wavelength extraction process of BPSO

光谱数据的适应度曲线变化和筛选误差成正比, 随着迭代次数的增加, 适应度曲线呈下降趋势, 模型误差也在减小, 当误差下降到最低值时, 筛选出的特征波长变量即为最优特征波长, 最终基于离散二进制算法提取了114个特征波长。 分别为: 899、 905、 911、 918、 924、 927、 931、 940、 943、 950、 953、 959、 962、 982、 985、 988、 994、 998、 1 004、 1 010、 1 023、 1 036、 1 052、 1 055、 1 058、 1 061、 1 064、 1 071、 1 074、 1 084、 1 093、 1 103、 1 128、 1 131、 1 135、 1 141、 1 144、 1 151、 1 154、 1 163、 1 170、 1 189、 1 192、 1 208、 1 227、 1 230、 1 233、 1 243、 1 249、 1 265、 1 287、 1 297、 1 303、 1 310、 1 319、 1 322、 1 326、 1 329、 1 335、 1 348、 1 351、 1 357、 1 364、 1 367、 1 386、 1 396、 1 402、 1 412、 1 418、 1 427、 1 437、 1 446、 1 453、 1 456、 1 459、 1 475、 1 485、 1 488、 1 491、 1 500、 1 507、 1 513、 1 520、 1 526、 1 539、 1 554、 1 561、 1 570、 1 574、 1 586、 1 589、 1 593、 1 596、 1 612、 1 615、 1 618、 1 621、 1 624、 1 628、 1 631、 1 634、 1 637、 1 640、 1 643、 1 647、 1 656、 1 659、 1 662、 1 666、 1 669、 1 672、 1 681、 1 688和1 700 nm。

2.4.2 基于CARS、 SPA、 UVE的特征光谱变量提取

对久保桃样本的原始全波段光谱数据分别采用竞争性自适应重加权算法(CARS)[17]、 连续投影算法(SPA)[18]、 无信息变量消除算法(UVE)[19]从原始光谱数据中提取特征波长, 最终采用CARS算法挑选了43个特征波长, SPA算法挑选了12个特征波长, UVE算法挑选了79个特征波长, 结果如表2所示。

表2 不同选择方法筛选出的特征波长 Table 2 Characteristic wavelengths screened by different selection methods

表2可知, CARS算法筛选出的波长存在着信息冗余的问题, SPA算法提取的变量数过少, UVE算法存在着间断性连续的筛选, 导致筛选的波长不具有代表性。 因此为了弥补单一特征波长提取算法存在的不足, 后续采用基于BPSO的特征变量组合算法对久保桃的特征光谱数据作进一步筛选。

2.4.3 特征变量的组合

由前四种单一算法筛选出的特征波长可知, BPSO算法筛选出特征光谱仅为局部最佳特征波长, 且变量数目过多。 CARS、 SPA、 UVE算法存在着不稳定, 变量数过少和连续筛选的问题。 因此文章提出基于BPSO的组合算法, 建立LS-SVM模型和GA-SVM模型。 各个方法提取的有效波长变量个数如表3所示。 提取的有效波长如表4所示。

表3 不同特征提取方法提取到的特征变量数 Table 3 Number of feature variables extracted by different feature extraction methods
表4 组合降维特征提取方法提取到的特征波长 Table 4 Feature wavelengths extracted by combined dimension reduction feature extraction method
2.5 建模与分析

2.5.1 GA-SVM模型

遗传算法(GA)是一种模拟自然进化的自适应优化搜索方法, 具有高适应度, 高效率, 快速搜索的特点[20]。 引入GA优化SVM模型的超参数, 可以将GA算法的优势应用于SVM模型中, 获得时间短, 效率高的优化模型, 从而获得更准确的预测。 设置遗传算法(GA)的最大遗传迭代数为100, 种群规模数量为20, 采用5折交叉验证方式, 得出最优惩罚因子(Cost)记为c和核心参数(gamma)记为r。 利用GA-SVM算法建立判别模型优化参数BestC和Bestg和预测结果如表5所示。

表5 不同变量优选方法建立的GA-SVM模型参数优化及预测结果 Table 5 Parameter optimization and prediction results of GA-SVM model established by different variable optimization methods

表5可知, 四种单一特征波长提取方法建立的GA-SVM模型中, BPSO提取的114个特征波长所建模型精度最高, 校正集的决定系数 Rc2为0.982, 预测集的决定系数 Rp2为0.988。 一维组合提取特征波长方法中, BPSO+CARS提取的132个特征波长所建模型精度最高, 校正集的决定系数 Rc2为0.981, 预测集的决定系数 Rp2为0.992。 二维组合提取特征波长方法中, (BPSO+CARS)-SPA提取的15个特征波长所建模型精度最高, 校正集的决定系数 Rc2为0.963, 预测集的决定系数 Rp2为0.947。 (BPSO+CARS)-SPA的模型精度略低于BPSO和BPSO+CARS, 但是其特征波长数量只有15个, 极大地简化了模型, 因此选(BPSO+CARS)-SPA为建立GA-SVM模型的最终特征波长提取方法。

2.5.2 LS-SVM模型

最小二乘支持向量机模型(LS-SVM)建模方法, 主要针对SVM的目标参数rσ 2进行全局寻优, 使得均方根误差RMSEC取得最小值的原理[21]。 不同特征光谱变量优选方法建立的LS-SVM预测结果见表6

表6 不同变量优选方法建立的糖度LS-SVM模型预测结果 Table 6 Prediction results of sugar LS-SVM model established by different variable optimization methods

表6可知, 单一特征波长提取方法建立的LS-SVM模型中, BPSO提取的114个特征波长所建模型精度最高, 校正集的决定系数 Rc2为0.989, 预测集的决定系数 Rp2为0.972。 一维组合提取特征波长方法中, BPSO+UVE提取的152个特征波长所建模型精度最高, 校正集的决定系数 Rc2为0.995, 预测集的决定系数 Rp2为0.989。 这是由于一维组合特征波长方法是将单一方法提取的有效波长组合起来, 有效波长数量变多了, 建模精度有所提高。 二维组合提取特征波长方法中, (BPSO+SPA)-SPA提取的22个特征波长所建模精度最高, 校正集的决定系数 Rc2为0.982, 预测集的决定系数 Rp2为0.955。 (BPSO+SPA)-SPA的模型精度略低于BPSO和BPSO+SPA, 但是其特征波长数量只有22个, 极大地简化了模型, 因此选(BPSO+SPA)-SPA为建立LS-SVM模型的最终特征波长提取方法。

2.5.3 模型对比分析

综合表5, 表6可知, 基于BPSO组合方法建立的两种模型都取得了较好的预测结果, (BPSO+CARS)-SPA-GA-SVM模型的校正集的决定系数 Rc2为0.963, 预测集的决定系数 Rp2为0.947, RMSEP为0.159。 (BPSO+SPA)-SPA-LS-SVM模型的校正集的决定系数 Rc2为0.982, 预测集的决定系数为 Rp2为0.955, RMSEP为0.139。 相比较而言, LS-SVM模型预测性能优于GA-SVM模型且均方根误差较小, 模型较稳定。 因此最终选择(BPSO+SPA)-SPA-LS-SVM为检测久保桃SSC的最优模型。 图3是两种模型的预测结果对比图。

图3 两种模型的预测结果图Fig.3 Prediction results of the two models

3 结论

基于高光谱技术结合离散二进制粒子群算法(BPSO)及基于BPSO的组合特征波长选择方法建立模型, 以实现久保桃可溶性固形物含量(SSC)的快速, 无损检测, 研究结果如下:

(1)与常规特征波长提取算法CARS、 SPA、 UVE比较, 基于BPSO算法建立的两种模型预测性能均比较好, 预测集决定系数均达到了0.97以上。

(2)基于BPSO的组合特征波长提取算法中(BPSO+SPA)-SPA算法在波长数量较少的情况下建立的LS-SVM模型最好, 其校正集的决定系数 Rc2为0.982, 预测集的决定系数 Rp2为0.955, 均方根误差RMSEC为0.108, RMSEP为0.139。 因此最终选择(BPSO+SPA)-SPA-LS-SVM为检测久保桃SSC的最优模型, 为实现桃SSC的快速, 无损检测提供了理论依据。

王铭海[22]使用近红外漫反射光谱技术无损测定多品种桃的可溶性固形物含量时, 采用移动窗口偏最小二乘法(MWPLS)提取了105个特征波长, 建立多种桃样本的可溶性固形物含量模型, 其模型校正集与预测集的决定系数 Rc2为0.991、 Rp2为0.983。 孟庆龙[23]通过采用反射式光谱采集系统获取不同成熟期“ 贵长” 猕猴桃的可溶性固形物含量时, 采用主成分分析法(PCA)对全波段光谱数据进行降维, 最终选择了16个主成分变量作为特征变量, 基于这16个特征变量建立多元线性回归模型, 其校正集和预测集的决定系数 Rc2为0.84, Rp2为0.88。 剩余预测偏差RPD为2.94。 与上述研究相比, 本文提出二次组合降维算法(BPSO+SPA)-SPA提取的22个特征波长建立久保桃的LS-SVM模型, 其决定系数 Rc2为0.982, Rp2为0.955。 在仅有22个特征波长情况下, 其模型的预测效果比较好。 因此该方法为实现鲜桃可溶性固形物含量的快速, 无损检测提供了新的思路。

参考文献
[1] WANG You-sheng, WANG Sheng-jie, CHEN Xiao-yan, et al(王友升, 王胜杰, 陈小燕, ). Journal of Chinese Institute of Food Science and Technology(中国食品学报), 2016, 16(10): 214. [本文引用:1]
[2] Li X L, Wei Y Z, Xu J, et al. Postharvest Biology and Technology, 2018, 143: 112. [本文引用:1]
[3] Li B, Yin Ha, Liu Y D, et al. Journal of Molecular Structure, 2022, 1265: 133407. [本文引用:1]
[4] Li Y J, Ma B X, Li C, et al. Computers and Electronics in Agriculture, 2022, 193: 106655. [本文引用:1]
[5] Li B C, Hou B L, Zhang D W, et al. Optik, 2016, 127(5): 2624. [本文引用:1]
[6] Fan S X, Zhang B H, Li J B, et al. Postharvest Biology and Technology, 2016, 121: 51. [本文引用:1]
[7] Wang T T, Li G H, Dai C L. Infrared Physics & Technology, 2022, 123: 104119. [本文引用:1]
[8] CAO Yin, YE Yun-tao, ZHAO Hong-li, et al(曹引, 冶运涛, 赵红莉, ). Transactions of the Chinese Society for Agricultural Machinery(农业机械学报), 2018, 49(1): 173. [本文引用:1]
[9] ZHANG Jue, TIAN Hai-qing, ZHAO Zhi-yu, et al(张珏, 田海清, 赵志宇, ). Transactions of the Chinese Society of Agricultural Engineering(农业工程学报), 2019, 35(1): 285. [本文引用:1]
[10] GUO Lu-bin, ZHAO Xiong-wen, GENG Sui-yan, et al(郭鲁斌, 赵雄文, 耿绥燕, ). Electric Power Information and Communication Technology(电力信息与通信技术), 2021, 19(9): 8. [本文引用:1]
[11] LIU Jian-hua, YANG Rong-hua, SUN Shui-hua, et al(刘建华, 杨荣华, 孙水华, ). Journal of Nanjing University (Natural Sciences Edition)[南京大学学报(自然科学版)], 2011, 47(5): 504. [本文引用:1]
[12] TANG Fei, HE Yong-yi(汤飞, 何永义). Industrial Control Computer(工业控制计算机), 2021, 34(5): 83. [本文引用:1]
[13] SHEN Jia-jie, JIANG Hong, WANG Su(沈佳杰, 江红, 王肃). Computer Science(计算机科学), 2013, 40(S2): 125. [本文引用:1]
[14] XU Bao-ding, QIN Yu-hua, YANG Ning, et al(徐宝鼎, 秦玉华, 杨宁, ). Spectroscopy and Spectral Analysis(光谱学与光谱分析), 2019, 39(3): 717. [本文引用:1]
[15] Zhang X, Sun J L, Li P P, et al. LWT, 2021, 152: 112295. [本文引用:1]
[16] HUANG Feng-hua, ZHANG Shu-juan, YANG Yi, et al(黄锋华, 张淑娟, 杨一, ). Transactions of the Chinese Society for Agricultural Machinery(农业机械学报), 2015, 46(11): 252. [本文引用:1]
[17] Bonah E, Huang X Y, Yi R, et al. Infrared Physics & Technology, 2020, 105: 103220. [本文引用:1]
[18] YU Feng-hua, XING Si-min, GUO Zhong-hui, et al(于丰华, 邢思敏, 郭忠辉, ). Transactions of the Chinese Society of Agricultural Engineering(农业工程学报), 2022, 38(2): 175. [本文引用:1]
[19] Wang Z L, Chen J X, Fan Y F, et al. Computers and Electronics in Agriculture, 2020, 169: 105160. [本文引用:1]
[20] Chen X W, Dong Z Y, Liu J B et al. Spectrochimica Acta Part A: Molecular and Biomolecular Spectroscopy, 2020, 243: 118786. [本文引用:1]
[21] Zhao H T, Feng Y Z, Chen W et al. Meat Science, 2019, 151: 75. [本文引用:1]
[22] WANG Ming-hai, GUO Wen-chuan, SHANG Liang, et al(王铭海, 郭文川, 商亮, ). Journal of Northwest A&F University (Natural Science Edition)[西北农林科技大学学报(自然科学版)], 2014, 42(2): 142. [本文引用:1]
[23] MENG Qing-long, SHANG Jing, HUANG Ren-shuai, et al(孟庆龙, 尚静, 黄人帅, ). Packaging Engineering(包装工程), 2021, 42(3): 19. [本文引用:1]