马铃薯近红外光谱无损检测影响因素研究
韩岷杰, 王相友, 许英超*, 崔英俊, 吕丹阳
山东理工大学农业工程与食品科学学院, 山东 淄博 255022
*通讯作者 e-mail: xuyingchao2005@163.com

作者简介: 韩岷杰, 1997年生,山东理工大学农业工程与食品科学学院硕士研究生 e-mail: hanminjie123@126.com

摘要

为提高马铃薯近红外光谱快速无损检测的准确性和稳定性, 对比了光纤光源、 卤素灯杯光源和环形光源三种光源条件下的光谱, 结果显示环形光源的光谱噪声最小, 辐照强度与均匀度最好。 该工作对光源功率、 光源距马铃薯表面距离以及光纤距马铃薯表面检测点距离进行研究, 通过三因素三水平响应面试验, 评价不同因素水平条件下对马铃薯可溶性固形物含量的光谱模型预测效果, 得到最优参数组合为光源功率238.33 W, 光纤探头距样品表面距离8.17 mm, 光源距样品表面距离370 mm, 并建立可溶性固形物定量预测模型。 在最优参数条件下, 预测偏最小二乘回归模型(PLSR)的相关系数优化到0.867, 均方根误差0.149°Brix。 为进一步消除设备及环境噪声, 通过不同预处理算法降低噪声的干扰, 结果显示标准变量排序法去噪效果最好, PLSR预测相关系数可达0.914, 预测均方根误差降低到0.132°Brix, 既能有效去噪又有较好的预测效果。 试验结果表明, 响应面试验优化检测环境和条件能有效提高马铃薯品质检测的预测精度, 为近红外光谱马铃薯无损检测环境搭建和设备选型提供技术参考。

关键词: 马铃薯; 可溶性固形物; 影响因素; 光源; 检测距离
中图分类号:O433.1 文献标识码:A
Research on the Factors Influencing the Non-Destructive Detection of Potatoes by Near-Infrared Spectroscopy
HAN Min-jie, WANG Xiang-you, XU Ying-chao*, CUI Ying-jun, LÜ Dan-yang
School of Agricultural Engineering and Food Science, Shandong University of Technology, Zibo 255022, China
*Corresponding author
Abstract

To enhance the stability as well as accuracy of near-infrared rapid nondestructive testing, this paper compares the spectral effects of three different types of light sources in the conditions of fiber optic light source, halogen cup light source and ring light source, and the results show that the ring light source has the lowest spectral noise, moderate irradiation intensity and the best uniformity. Based on these studies, the power of the light source, the distance from the optical source to the potato surface, and the distance from the optical fiber to the detection point on the potato surface are investigated in this study. The spectral model's prediction effect on potatoes' soluble solids content under different factors was evaluated by a three-factor, three-level response surface test. The optimal parameters were light source power 238.33 W, distance from fiber optic probe to sample surface 8.17 mm, distance from the light source to sample surface 370 mm, RP=0.867, and RMSEP=0.149°Brix of the PLSR model for soluble solids prediction. To further eliminate equipment and environmental noise, interference of noise was reduced by different preprocessing algorithms. The outcome showed that the algorithm with the standard variable ranking approach had the best noise removal effect, with RP=0.914 and RMSEP=0.132°Brix, which obtained a better prediction result while effectively removing noise. The test results show that optimizing the testing environment and conditions through response surface testing can effectively improve the prediction accuracy of potato quality testing and provide technical guidance for the construction and device selection of near-infrared online the nondestructive detection environment for potatoes.

Key words: Potato; Soluble solids; Impact factors; Light source; Detection distance
引言

马铃薯是重要的粮食作物, 为保证其质量, 通常在加工、 运输、 储藏过程中对其进行质量检测及产品分级, 从而满足市场要求。 目前研究学者们采用近红外光谱对马铃薯内部品质进行评价做了广泛而深入的探索, 研究结果显示近红外光谱技术可用于马铃薯等农产品质量检测中[1, 2, 3], 光谱与马铃薯等农产品的营养成分、 内部伤病[4]等具有很好地相关性。 预测模型的预测精准度会受多种因素影响, 如湿度、 温度[5]等检测环境因素; 产地、 品种、 收获季节、 储存时间等[6]样品本身物化特性; 设备工艺、 光源类型、 检测参数等[7, 8, 9]仪器设备本身因素; 这些影响会直接或间接降低模型的鲁棒性, 从而影响预测结果。

目前有学者采用光谱校正[10]、 光谱预处理[11]、 变量筛选[12]等方法降低误差因素对预测模型的影响。 大多研究停留在单因素试验上, 对多影响因素组合试验的研究较少。 本研究通过优化马铃薯近红外光谱分选设备的检测条件, 研究不同光源类型、 光纤探头与检测点距离、 光源与检测点的距离及光源功率对光谱质量的影响, 建立三因素三水平响应面试验得到最优检测参数。 同时预处理算法进一步优化光谱信号的设备噪声和检测精度。 本研究为近红外光谱在线分选设备的选型及安装提供理论基础和技术参考。

1 实验部分
1.1 试验材料

样品选用60个大小均匀, 重量适中的希森6号马铃薯。 试验前用清水将马铃薯表面泥土等杂质清洗干净, 置于温度(23± 1) ℃, 相对湿度40%~50%的环境下24 h, 以降低温度、 表面杂质、 湿度等因素对试验带来的误差干扰。

1.2 试验系统

试验硬件系统主要包括光谱采集系统、 光源和位移平台(见图1), 其中光谱采集系统由光谱仪(型号: FiedSpec4型光谱仪, 美国ASD)、 光纤、 安装光谱采集软件(RS3)的计算机、 暗箱和散热设备组成; 光源系统由卤素灯杯光源(功率范围0~400 W, 上海五铃光学)、 环形光源(功率范围0~600 W, 上海五铃光学)和“ Y” 型光纤光源(功率范围0~150 W, 上海五铃光学)以及配套的稳压电源组成。

图1 可见/近红外光谱采集系统Fig.1 Visible/NIR spectral acquisition systems

1.3 光谱采集

1.3.1 光源类型试验

在相同的暗箱环境、 光纤探头和检测点位置、 光源与检测点距离、 光源功率的条件下, 分别用光纤光源、 卤素灯杯光源和环形光源三种光源对60个马铃薯样品赤道位置进行三次光谱采集并取平均值。

1.3.2 响应面试验

在最优光源的条件下, 固定光纤探头的位置不动, 参考其他研究结果[13], 初始设置光源功率140 W, 光纤距样本检测点5 mm, 光源距离样本检测点300 mm, 根据响应面试验条件(表2)设置水平大小, 对60个马铃薯样品赤道位置依次进行三次光谱采集并取平均值, 建立不同因素水平试验条件下马铃薯可溶性固形物含量的预测模型。 由于光谱首末两端噪声过大, 截取500~2 000 nm波段进行分析。

1.4 光谱预处理

为进一步提高预测模型的鲁棒性, 对比S-G平滑法、 一阶求导法、 标准正态变换法(standard normal variate transformation, SNV)、 多元散射校正法(multiple-scatter correction, MSC)和标准变量排序法(standard normal variate transformation, VSN)等不同预处理方法对光谱的去噪效果。 其中VSN通过生成加权函数, 用于估计变量权重, 有效弥补SNV平等对所有变量的缺陷, 用自适应的方法来改善光谱信号形状和模型解释[14]

1.5 预测模型建立方法和评价指标

采用偏最小二乘回归(partial least squares regression, PLSR)作为预测模型。 采用表征变量相关程度的预测相关系数(the correlation coefficient of the prediction set, RP)和表征预测值和真值偏差的预测均方根误差(the root-mean-square error of the prediction set, RMSEP)来评估马铃薯可溶性固形物预测模型。

2 结果与讨论
2.1 不同类型光源下光谱质量分析

三种光源分别为光纤光源、 环形光源以及卤素灯杯光源[图2(a)]。 由图2(b)可知, 在相同的检测环境下, 在1 000~1 100 nm范围以及大于1 500 nm范围, 光纤光源有明显的锯齿状, 表明其噪声最大。 通过LightTools 8.4软件对三种类型光源进行建模分析, 结果由图3可知, 光纤光源具有较大的辐照强度, 穿透性好, 但均匀性最差。 而环形光源与卤素灯杯光源相比, 环形光源光谱最为光滑, 辐照强度及均匀性最好, 这与其均匀分布的灯杯有关, 在这种分布下, 光的均匀性较强, 能有效去除阴影影响, 降低表面炫光, 增加光谱信噪比。 因此选用环形均布光源作为响应面影响因素试验的光源。

图2 150 W功率下三种光源的光谱曲线(b)及光源展示(a)Fig.2 The spectral curve (b) of three light sources under 150 W power and light source (a) display

图3 150 W功率下三种光源的辐照强度和均匀度
(a): 光纤光源; (b): 卤素灯杯; (c): 环形光源
Fig.3 Irradiation intensity and uniformity of three light sources under 150 W power
(a): Fiber light source; (b): Halogen lamp cup light source; (c): Ring light source

2.2 响应面影响因素试验

单因素试验[图4(a, b)]表明, 光源功率过大, 距离过近, 检测温度会急剧升高, 对样品表面产生灼烧; 功率过小, 距离过远, 则导致光的反射率下降, 信噪比降低, 从而降低光谱预测的准确性。 在线检测过程中, 样品厚度和检测装置震动等原因会使检测点到光纤探头的距离发生变化[13], 进而致使漫反射的光谱数据产生较大差异。 综上所述, 采用三因素三水平响应面进行试验, 试验影响因素和水平编码如表1所示, 试验方案和PLSR模型结果如表2所示。

图4 单因素条件下的光谱曲线
(a): 光源功率; (b): 光源与马铃薯表面距离; (c): 光纤距检测点距离单因素条件
Fig.4 Single-factor spectral curves
(a): Power of light source; (b): Distance of light source from patato surface; (c): Distance of fiber from detection point under single-factor experimental condictions

表1 试验因素水平及编码 Table 1 Experimental factors codes
表2 试验方案和PLSR模型结果 Table 2 Experimental scheme and results of PLSR model

对试验数据二次回归, 通过拟合获得预测相关系数Y1和预测均方根误差Y2的回归方程, 并进行显著性检验。

经过试验数据拟合和回归分析后的显著性检验结果得到Y1Y2的方差分析(见表3, 表4)。 由分析结果可知, x2, x3, x22, x32影响极为显著(p< 0.01); x1影响显著(0.01< p< 0.05); x12影响较显著(0.05< p< 0.1)。 在此结果基础上把显著性差的x1x2, x1x3回归平方和以及自由度参数重新代入残差中, 第二次对预测相关系数的方差进行回归分析(见表3), 由此获得各影响因素以及其组合交互对Y1影响的回归方程[见式(1)]。 同理分析可得Y2回归方程[见式(2)]。 (试验数据均在Design-Expert 8.0.6软件分析)

Y1=-0.3+0.01x1+2.694×10-3x2+3.832×10-3x3+9.5×10-7x2x3-4.383×10-4x12-3.74×10-4x22-6.583×10-6x32(1)

Y2=0.19-6.75×10-3x1+8.5×10-3x2-2.9×10-2x3+3.5×10-3x1x3+6.917×10-3x12+2.2×10-2x22-3.583×10-3x32(2)

表3 预测相关系数Y1方差分析 Table 3 Variance analysis for grading rate Y1
表4 预测均方根误差Y2方差分析 Table 4 Variance analysis for accuracy rate Y2

使用Desing-Expert 8.0.6软件分析, 得到x1, x2, x3之间较显著和显著作用对Y1Y2两个评价参数响应面分析。 由图5(a)和(b)可知, 当光源功率一定时, RP随着光源距样品距离的增加呈现先增加后减小的趋势, 同时也随着光纤与样品检测点的距离增加而呈现先增加后降低的趋势, 但是趋势趋于平缓。 当光纤距样品距离一定时, RP随着光源功率的增加而增加, 但是光源功率过大会对样品表面产生灼烧, 因此应保证在避免样品表面灼烧的前提下尽可能提高光源功率。 同理分析, 由图5(c)和(d)可知, RMSEP呈现与RP相反的趋势, 这种趋势也验证了试验结果的正确性。

图5 预测相关系数和均方根误差的双因素响应曲面
(a), (c): 光源功率190 W; (b), (d): 光纤距样品表面10 mm
Fig.5 Two-factor response surfaces for predicting correlation coefficients and root-mean-square errors
(a), (c): Light source power of 190 W; (b), (d): Optical fiber distance from the sample surface of 10 mm

采用软件的优化模块结合实际的工作情况分析得到最优试验参数为光源功率238.33 W, 光纤探头距样品表面距离8.17 mm, 光源距样品表面距离370 mm, 在最优参数下进行验证试验得到PLSR预测模型(表5), RP为0.867, RMSEP为0.149° Brix。 与其他因素水平下的预测模型相比, 效果最好。

表5 不同预处理方法的PLSR模型对比效果 Table 5 Comparative effects of partial least squares regression models with different pre-processing methods
2.3 光谱预处理

由于设备本身制造工艺, 使用年限以及其他环境因素的多方面影响, 即使在响应面试验最优参数组合下采集到的光谱中仍含有部分噪声干扰, 利用预处理算法的优势对这部分设备因素产生的噪声进行再次优化, 如表5所示。

除SNV外, 运用不同预处理方法优化后的预测结果优于未处理光谱, 其中VSN预处理算法的PLSR模型RP达到0.914, RMSEP降低到0.132° Brix, 表明预处理能有效优化设备因素噪声干扰, 增强模型鲁棒性和准确性。 过度提高信噪比(如SNV)可导致预测精度降低, 原因是过度预处理将原始有用峰认作噪声信号处理, 从而降低预测精度。

3 结论

通过对比试验选取均匀性良好, 光谱噪声小的环形卤素光源作为影响因素响应面试验的光源, 设计光源功率、 光源距样品表面距离、 光纤距检测点的距离的三因素三水平响应面, 结果表明在最优参数组合下采用VSN预处理算法能有效降低设备及环境噪声干扰, 提高预测模型的准确度, 增强模型的鲁棒性。 本研究为马铃薯近红外在线检测环境搭建和设备选型提供理论和技术支持。

本研究只讨论了设备工艺、 光源类型、 检测参数等仪器设备本身因素的影响, 对产地、 品种、 收获季节、 储存时间等样品本身物化特性的影响需要进一步研究。

参考文献
[1] Guan X, Liu J, Huang K, et al. Infrared Physics and Technology, 2019, 98: 305. [本文引用:1]
[2] ZHANG Pei, WANG Yin-hong, LI Gao-yang, et al(张珮, 王银红, 李高阳, 等). Journal of Chinese Institute of Food Science and Technology(中国食品学报), 2021, 21(5): 355. [本文引用:1]
[3] Hu R, Zhang L, Yu Z, et al. Infrared Physics & Technology, 2019, 102: 102999. [本文引用:1]
[4] DING Ji-gang, HAN Dong-hai, LI Yong-yu, et al(丁继刚, 韩东海, 李永玉, 等). Spectroscopy and Spectral Analysis(光谱学与光谱分析), 2020, 40(6): 1909. [本文引用:1]
[5] Xiao X U, Xie L, Ying Y. Frontiers of Agricultural Science and Engineering, 2019, 6(2): 105. [本文引用:1]
[6] QIAN Li-li, SONG Xue-jian, LEI Yan-bo, et al(钱丽丽, 宋雪健, 类彦波, 等). The Food Industry(食品工业), 2018, 39(6): 257. [本文引用:1]
[7] GUO Qing-hui, PENG Yan-kun, LI Yong-yu, et al(郭庆辉, 彭彦昆, 李永玉, 等). Transactions of the Chinese Society for Agricultural Machinery(农业机械学报), 2020, 51(S2): 484. [本文引用:1]
[8] Sawyer T W, Luthman A S, Bohndiek S E. Journal of Optics, 2017, 19(4): 045301. [本文引用:1]
[9] Liang C, Yuan H, Zhao Z, et al. Chemometrics & Intelligent Laboratory Systems, 2016, 153, 51. [本文引用:1]
[10] LI Ling(李玲). Laser Journal(激光杂志), 2019, 40(2): 153. [本文引用:1]
[11] Ye D, Sun L, Tan W, et al. Chemometrics & Intelligent Laboratory Systems, 2018, 177: 129. [本文引用:1]
[12] Jiang H, Xu W, Chen Q. Spectrochimica Acta Part A: Molecular and Biomolecular Spectroscopy, 2019, 214: 366. [本文引用:1]
[13] LIU Yuan-yuan, PENG Yan-kun, ZHANG Lei-lei(刘媛媛, 彭彦昆, 张雷蕾). Transactions of the Chinese Society for Agricultural Machinery(农业机械学报), 2014, 45(12): 271. [本文引用:2]
[14] Rabatel G, Marini F, Walczak B, et al. Journal of Chemometrics, 2020, 34(2): e3164. [本文引用:1]