作者简介: 马殿旭, 1991年生,昭通学院物理与信息工程学院讲师 e-mail: 465615292@qq.com
应用傅里叶红外光谱(FTIR)和二维相关红外光谱(2D-IR)对8种不同种类的昭通苹果进行分析, 并运用卷积神经网络(CNN)和径向基函数(RBF)神经网络对其进行了鉴别。 在8种昭通苹果的傅里叶红外光谱中, 均在3 500~2 850、 1 650~1 400和1 250~800 cm-1等范围表现出了较强吸收峰, 可以看出苹果含有丰富的糖类、 维生素、 氨基酸、 脂质、 有机酸、 酚类和黄酮类等物质, 且8种昭通苹果光谱非常相似, 只在吸收峰的强弱和峰位置上有非常小的差异, 依据光谱来区分鉴别8种昭通苹果, 显然是不可能的。 以温度为微扰, 采集8种苹果的动态光谱, 并对动态光谱800~1 800 cm-1进行2D-IR分析, 在2D-IR的同步光谱中, 可以清晰看出: 随着温度的升高, 2D-IR在1 010和1 642 cm-1附近出现了相对较强的自动峰, 说明苹果中的酯类、 酸类和蛋白质出现一定的分解, 而且酯类和酸类分解较强, 蛋白质相对较弱; 另外在8种样品的2D-IR中, 红富士片红中的二维相关红外光谱中出现的自动峰1 642 cm-1相对其他样品来说是最强的自动峰, 出现的负交叉峰(1 006, 1 642 cm-1)最弱; 在阿克苏苹果中只出现了1 010 cm-1一个强自动峰; 在秦冠苹果中出现了三个自动峰; 另外在2001苹果和新世纪苹果中, 最强自动峰出现在1 020 cm-1, 对比其他苹果有10个波数的移动, 依据2D-IR, 可以区分部分苹果样品。 进一步对8种苹果216个苹果光谱进行卷积神经网络(CNN)和径向基函数(RBF)神经网络分析, 随机选择152个样品光谱数据进行模型训练, 通过一定迭代和训练, 使得两种模型在训练集上的分类准确率达到100%的最优状态, 再对64个样品光谱进行预测, 在CNN分析中准确率为89.06%, 而在RBF神经网络分析中准确率达到90.6%, 两种神经网络模型都表现出了非常好的分类准确率。 因此FTIR、 2D-IR、 CNN和RBF神经网络分析方法在苹果分析鉴别研究中相互补充, 可以对昭通苹果进行准确分类, 并且该方法可以运用到其他物质分类鉴别分析。
The article presents an analysis of eight different varieties of Zhaotong apples using Fourier Transform Infrared Spectroscopy (FTIR) and Two-Dimensional Correlation Infrared Spectroscopy (2D-IR). Additionally, Convolutional Neural Networks (CNN) and Radial Basis Function (RBF) neural networks were utilized for their identification. The Fourier Transform Infrared Spectroscopy (FTIR) analysis of eight Zhaotong apple varieties revealed prominent absorption peaks within the spectral ranges of 3 500~2 850, 1 650~1 400, and 1 250~800 cm-1, signifying their abundance in sugars, vitamins, amino acids, lipids, organic acids, phenols, flavonoids, and various other compounds. However, a notable similarity was observed across the spectra of these apples, with only subtle variations in peak intensities and positions. Consequently, relying solely on spectral characteristics to differentiate between these eight varieties is impractical. Using temperature as a perturbation, we collected dynamic spectra of eight distinct apple varieties and subjected them to 2D-IR analysis within the spectral range of 800~1 800 cm-1. The synchronous spectrum derived from this analysis underscores that as temperature escalates, distinct autopeaks emerge in proximity to 1 010 and 1 642 cm-1. These peaks serve as indicators of varying degrees of decomposition occurring within esters, acids, and proteins present in apples, with esters and acids undergoing more pronounced decomposition compared to proteins. Notably, among these eight samples, Red Fuji Apples exhibit the strongest autopeak at 1 642 cm-1, accompanied by the weakest negative cross peak at 1 006, 1 642 cm-1, while Aksoo Apples display only one prominent autopeak at 1 010 cm-1. Qin Guan Apples exhibit three autopeaks, whereas both 2001 Apples and New Century Apples have their strongest autopeak shifted to 1 020 cm-1, differing by 10 wavenumbers from those of other varieties. This 2D-IR analysis enables differentiation between certain apple samples based on their unique spectral signatures. An optimized approach to analyzing the spectra of 216 apples from eight varieties utilizing Convolutional Neural Network (CNN) and Radial Basis Function (RBF) neural networks. By randomly selecting 152 sample spectra for model training and through iterative refinement and rigorous training, both models achieved an optimal state, attaining a classification accuracy of 100% on the training set. Following this, predictions were conducted on the spectra of an additional 64 samples, yielding remarkable results: an accuracy rate of 89.06% in CNN analysis and an even higher 90.6% in RBF neural network analysis. Both neural network models have demonstrated outstanding performance in terms of classification accuracy. Hence, the integration of FTIR, 2D-IR, CNN, and RBF neural network analysis methods forms a complementary approach in the study of apple analysis and identification, facilitating precise classification of Zhaotong apples. Additionally, this comprehensive methodology holds significant potential for application in the classification and identification of diverse substances beyond apples.
苹果(Malus pumila), 隶属于蔷薇科中的苹果属, 它是一种落叶乔木植物的果实。 苹果富含糖类、 蛋白质、 脂肪以及多种维生素和矿物质, 此外, 它还含有胡萝卜素、 烟酸、 纤维素等多种对人体有益的成分[1]。 苹果中的铁、 镁、 维C及维E等, 不仅有助于补血美容, 还能促进消化、 宁神安眠; 其膳食纤维与有机酸有助于胃肠蠕动[2]。 苹果口感甘甜, 食用愉悦身心, 香气也能舒缓情绪, 苹果以其独特而丰富的营养价值广受消费者喜爱, 同时也被称为水果中的“ 全科医生” 和“ 水果之王” 的美誉[1, 2, 3]。
苹果的种类繁多, 全球范围内大约有15 000种不同的苹果品种。 中国是世界上最大的苹果生产国之一, 在市场上, 消费者可以见到多种多样的苹果品种, 其中, 富士系、 元帅系、 嘎拉系和金冠系是四大主要的苹果系列。 每个系列下又包含多个具体品种, 如红富士、 阿克苏苹果属于富士系; 黄元帅、 黄金帅属于元帅系等。 此外, 还有蛇果、 红星、 国光等其他品种的苹果在中国也有广泛的种植和销售。 昭通地处云贵高原北部, 昭鲁坝子平均海拔1 900多米, 年均日照时数超过1 900 h。 这里高海拔、 温差大、 紫外线强、 日照充足等得天独厚的自然条件为苹果的生长提供了优越的环境。 此外, 昭通土壤富含硒元素, 使得昭通苹果成为天然富硒水果, 具有更高的营养价值[4]。 昭通苹果的种类相当丰富, 其品种数量达到了一百多个, 主要品种包括红富士、 黄元帅、 华硕和红露等, 其品质卓越, 是中国高原地区的一颗璀璨明珠[4]。
目前对苹果的研究主要集中在苹果的营养与健康、 苹果的种植与生产、 苹果的储存与加工和苹果的遗传改良生物技术等。 如Feng[5]等对目前苹果中酚类物质的组成、 分布、 吸收、 代谢和加工过程中的稳定性研究进展进行了综述, 并对苹果酚类物质的研究提出了展望。 Srednicka-Tober[6]等分析比较了波兰普通种植苹果和有机果园种植的苹果中促进健康的抗氧化剂、 酚酸、 黄酮醇、 维生素C的浓度, 结果表明有机生产的苹果在酚酸类和黄酮醇类抗氧化剂的含量上显著高于传统生产的苹果, 但也提醒我们其他可能影响营养成分的因素, 如品种选择和生长条件等。 Uselis[7]等研究了不同的种植距离对苹果树生长、 果实产量及品质影响, 最终给出最佳生产力和果实品质是在全果期以3× 1.25 m的间距种植的情况下获得。 Zhang[8]等研究者综述了近年来气体熏蒸技术在果实采后品质管理中的应用及相关生化机制, 研究表明不同的保鲜剂可以有效地改善果实品质, 并且一些保鲜剂不仅直接对病害有抑制作用, 还能激活防御系统以增强果实的抗性, 但是在使用多种保鲜剂时可能会产生不合理的副作用, 因此需要找到抵消这些副作用的方法。 Lempe[9]等研究者总结了气候变化对苹果物候时间的影响, 强调了表观遗传变异如何支持新的育种策略, 并指出了表观遗传变异在育种计划中的应用所需的重要特征。 Sestras[10]等研究者深入探讨了苹果育种中数量性状的遗传机制及其对选择策略的影响, 为未来的苹果育种工作提供了重要的参考和指导。
在以上苹果各方面的研究中均需要对苹果的准确分类, 而苹果种类繁多, 不同的苹果口感风味、 营养价值各不相同, 因此对苹果准确的分类鉴别不管是对消费者的选择、 果农的苹果种植选择还是在苹果的研究中都具有深远的实际意义。 目前苹果种类鉴别的方法主要以苹果的外部特征、 口感和产地等一些特征信息来进行区分鉴别, 但由于苹果的品种繁多, 很多不同种类的苹果在生长过程中经过果农套袋处理后, 苹果的特征将变得极为相似, 因此通过苹果特征、 口感和地理特性来进行判断将存在很大的不确定性; 另外由于部分不良商贩为了让苹果色泽鲜艳, 可能进行染色或者色素处理, 这将进一步难以区分不同种类苹果, 同时也极大危害消费者的健康。 因此对苹果的准确鉴别和对其品质的把控将对苹果产业的发展具有深远影响。 本文将运用FTIR、 2D-IR、 CNN和RBF神经网络来进行苹果的分析鉴别研究。
FTIR技术可以获得样品中化学键的振动信息, 进而推断出样品的化学组成和结构。 也可以根据光谱的吸收分析鉴别不同物质, 这种技术在化学、 生物、 医药、 环境等领域都有广泛的应用[11]; 2D-IR能够提高光谱的分辨率、 灵敏度, 能够实时无损地区分物质内部的差异。 CNN是一种强大而有效的深度学习模型, 能够自动从大量数据中学习到有效的特征表示, 并实现对输入数据的准确分类或回归。 RBF神经网络是运用径向基函数来进行非线性分类, 它通过将输入数据映射到高维空间, 从而能够处理复杂的分类问题。 目前光谱分析和深度学习的大模型已应用到不同样品的品质检测, 如Ribeiro[12]等应用傅里叶变换红外光谱和卷积神经网络测定低乳糖牛奶中的乳糖含量; Li[13]等应用近红外光谱和深度学习对榛子的品质进行检测; Christabel[14]等运用ATR-FTIR结合机器学习对油和人造黄油进行分类。 本文也将应用FTIR、 2D-IR、 CNN和RBF神经网络来分析研究不同种类的昭通苹果。
8种实验样品均收集于昭通苹果市场, 分别是a-红富士条红; b-红富士片红; c-2001; d-阿克苏; e-红露; f-金帅; g-秦冠; h-新世纪。 对所有样品进行清洗, 实验中选择样品果肉进行烘干研磨待测。
傅里叶红外光谱仪为港东FTIR-850型, 配备DTGS探测器, 分辨率为2 cm-1; 变温ATR, 控温范围为0~300 ℃, 实验中选择合适大小的样品通过变温ATR测得动态光谱, 测试温度变化为20~120 ℃, 每20 ℃测得一个动态光谱。 实验用到的溴化钾为光谱纯溴化钾, 配备有压片机和烤箱。
选择适量样品, 在玛瑙研钵中研磨成细粉, 取适量溴化钾与样品充分混合研磨压片, 测试光谱, 样品光谱均扣除溴化钾背景; 直接选择样品应用变温ATR进行动态光谱测量。 使用OMNIC8.5进行光谱预处理, IBM SPSS Statistics 24和MATLAB 2021 进行数据分析, Origin 2024和2D shine等软件进行二维相关红外光谱分析作图。
图1为8种昭通苹果的FTIR光谱图, 从图中可以看出: 8种昭通苹果的FTIR光谱吸收峰非常相似, 其典型特征吸收峰如表1所示。
![]() | 表1 8种昭通苹果光谱的特征吸收峰及峰的归属[12, 14, 15] Table 1 Characteristic absorption and assignments of peaks for the spectra of eight kinds of Apples from Zhaotong Region[12, 14, 15] |
从光谱的特征及归属可以看出, 苹果含有丰富的糖类、 维生素、 氨基酸、 脂质、 有机酸、 酚类和黄酮类等物质; 对8种样品的光谱进行比较, 在吸收峰1 738 cm-1处, 秦冠苹果g与其他种类苹果相比表现出较强吸收, 并且在吸收峰1 614 cm-1处与其他苹果光谱相比, 有18个波数的移动, 其他种类苹果则出现在1 632 cm-1处, 在该波数下的吸收峰红富士条红a、 红富士片红b及金帅苹果f表现最强。 在1 000~700 cm-1范围, 2001苹果c、 阿克苏苹果d、 红露苹果e、 金帅苹果f和新世纪苹果g都出现了强度相近的923、 867、 818和778 cm-1四个吸收峰, 而红富士条红a和红富士片红b吸收峰强度较弱。 依据以上差异, 可以简单区分秦冠苹果g和红富士苹果, 但红富士条红苹果a和红富士片红苹果b的红外光谱依然非常相似。 整体从8种昭通苹果红外光谱来看, 都很相似, 只在吸收峰的强弱和峰位置上有非常小的差异, 简单依据光谱来清晰准确区分鉴别8种昭通苹果, 显然是不可能的。
2D-IR由Noda等学者开创性提出, 专注于深入探究物质在特定条件下官能团振动特性的动态演变。 该技术巧妙运用傅里叶变换红外光谱分析手段, 针对不同微扰条件下的样品光谱进行深入探索, 进而精准地揭示出物质结构在这些特殊微扰下的动态变化以及分子间相互作用的机制[16]。 文章以不同温度为微扰, 测得不同温度下的昭通苹果FTIR光谱, 对这些动态光谱进行2D-IR分析, 得到8种昭通苹果的2D-IR同步光谱图, 如图2所示: 从图中可以看出, 红富士条红苹果(a)中出现了1 010 cm-1强自动峰和1 641 cm-1的弱自动峰; 红富士片红苹果(b)中出现1006 cm-1的强自动峰和1 642 cm-1的弱自动峰; 2001苹果(c)中自动峰出现在1 020和1 640 cm-1, 其中1 020 cm-1最强, 1 640 cm-1很弱; 阿克苏苹果(d)中只出现1 010 cm-1的强自动峰; 红露苹果(e)中自动峰出现在1 010和1 638 cm-1, 其中1 010 cm-1最强; 金帅苹果(f)中最强自动峰为1 010、 1 640 cm-1相对较弱; 秦冠苹果(g)中出现了3个自动峰, 分别是1 010、 1 640和1 746 cm-1, 其中最强自动峰仍为1 010 cm-1, 而1 746 cm-1最弱; 新世纪苹果(h)中出现了1 022和1 640 cm-1两个自动峰, 其中1 022 cm-1最强。
从8种苹果的2D-IR光谱中, 红富士片红(b)样品中的二维相关红外光谱中出现的自动峰1 642 cm-1相对其他样品来说是最强的自动峰, 出现的负交叉峰(1 006; 1 642 cm-1)最弱。 在(a)、 (b)的2D-IR中, 自动峰和交叉峰形状非常相似, 这与两种样品有关, 同为红富士。 在阿克苏苹果(d)中只出现了一个强自动峰; 在秦冠苹果(g)中出现了三个自动峰, 这些都与其他苹果2D-IR相异。 另外在2001苹果和新世纪苹果中, 最强自动峰出现在1 020 cm-1左右, 与其他苹果有10个波数的移动。 8种昭通苹果均在1 010 cm-1附近形成了最强的自动峰, 表明苹果在热微扰下C— O— C的不对称伸缩 振动变化是一致的。 依据以上的二维相关红外光谱分析, 可以看到部分样品表现出了很大的差异, 可以区分一些苹果样品, 但完全依据二维相关红外光谱图的观察及对比, 仍然不能很好地辨别苹果的种类。 进一步对苹果的光谱进行神经网络模型分析。
2.3.1 卷积神经网络(CNN)分析
卷积神经网络(CNN)是一种深度前馈人工神经网络, 特别适用于处理具有网格结构的数据, 自动从输入数据中提取特征并进行学习, 它模仿人脑神经网络的工作原理, 通过构建多层次的神经网络模型, 来学习并解释数据的特征, 从而进行分类, 在识别分类中取得了显著的成果[14], 对8种苹果样品, 每种样品27个光谱数据, 共计216个苹果光谱数据进行CNN分析, 随机选取各样品光谱的70%作为训练集, 30%作为预测集, 其分析结果如图3所示, 在本次CNN分类分析中, 充分利用了训练集中的152个光谱数据, 通过一定的迭代, 使得模型在训练集上的分类准确率达到100%的最优状态。 在预测图中, 共64个预测光谱样本有7个错分, 分别是红富士条红苹果1个样品错分到红富士片红苹果中; 2001苹果中1个样品错分到秦冠苹果中; 阿克苏苹果中1个样品错分到红露苹果中; 在红露苹果中错分2个样品分别到红富士条红苹果和2001苹果中; 金帅苹果中有1个样品错分到秦冠苹果中, 新世纪苹果中有1个样品错分到2001苹果中。 而红富士片红苹果和秦冠苹果完全准确区分。 64个预测光谱样品准确率达到89.06%。 因此通过对昭通苹果的CNN分类分析能够很好的完成苹果的分类, 能够很好预测各样品。
2.3.2 径向基函数(RBF)神经网络分析
径向基函数(RBF)分类作为一种基于神经网络的分类方法, 结合了径向基函数的强大非线性映射能力和神经网络的灵活性, 适用于多种复杂分类任务, 通过合理的训练和参数调整, RBF网络能够在多种应用场景中表现出色, 其被广泛运用到图像分类、 语音识别、 红外光谱分析和药物筛选等领域[17]。 对昭通苹果相同的216个样品光谱进行RBF神经网络分析, 随机选取各样品光谱的70%作为训练集, 30%作为预测集, 其分析结果如图4所示, 在本次RBF神经网络分析中, 充分利用了训练集中的152个光谱数据, 使得模型在训练集上的分类准确率达到100%的最优状态。 在预测图中, 共64个预测光谱样本中只有6个错分, 准确率为90.6%。 错分情况如下: 红富士片红样品中有2个样品错分到红富士条红和2001苹果中, 2001苹果样品有1个错分到红露苹果中; 金帅苹果中有2个错分到红富士片红和阿克苏苹果中; 秦冠苹果样品中有1个错分到红富士条红样品中; 其他红富士条红苹果、 阿克苏苹果、 红露苹果和新世纪苹果分类完全正确。 因此通过对昭通苹果光谱的RBF神经网络分析能够很好地完成苹果的分类, 并且准确率较高。
虽然卷积神经网络(CNN)分析和径向基函数(RBF)神经网络分析两种模型在苹果预测样本中分类都有错分, 但两种模型分类准确率都比较高, 径向基函数(RBF)神经网络分析准确率达到了90.6%, 而且两种模型分类效果互补, 在卷积神经网络(CNN)分析中红露苹果错分了两个样本, 但在径向基函数(RBF)神经网络分析中红露完全区分正确。 因此在FTIR和2D-IR的分析下可以结合两种模型较为准确地完成苹果的分类。
该研究方法对于图像识别技术和化学分析方法具有简单、 快捷、 无损、 准确的特点。 图像识别分类技术需采集大量图片, 对大量预处理的图片中提取特征信息, 对特征信息使用机器学习算法进行训练分类, 整个过程涉及一系列精细且相互衔接的步骤。 这一技术特点表现为高度自动化和快速处理能力, 能够在复杂多变的环境中保持较高的识别准确率, 同时具有适应不同应用需求的灵活性[18]。 但在苹果分析中, 很多果农会对苹果进行套袋或者增色处理, 在处理后的苹果特征将发生很大变化, 采集的图像将不再准确, 因此应用图像识别技术将不能准确反应和识别苹果的种类。 化学分析分类方法在农产品分析中扮演着关键角色, 其特点体现在高灵敏度、 高选择性, 以及能够提供物质组成的定量信息。 该方法通过色谱、 光谱、 质谱等分析技术, 精准识别物质内部结构及成分含量, 确保了分类结果的可靠性和科学性。 对于苹果的分类分析, 将不依赖于外部特征, 让分类更准确。 然而, 化学分析分类方法在样本处理中操作复杂、 耗时、 分析成本高昂、 存在样本破坏性, 并且需要专业知识和技能来操作和维护分析仪器[18]。 因此该研究利用FTIR得到苹果内部化学特征, 再以其准确的内部特征为数据基础, 结合机器学习的特点进行了准确分类, 该方法是化学分析和图像识别技术的优势结合。
运用了FTIR、 2D-IR和两种神经网络分析的方法对8种昭通苹果进行了鉴别分析, 在FTIR分析中, 苹果含有丰富的糖类、 维生素、 氨基酸、 脂质、 有机酸、 酚类和黄酮类等物质, 且8种昭通苹果光谱非常相似, 只在吸收峰的强弱和峰位置上有非常小的差异, 依据光谱来区分鉴别8种苹果, 显然是不可能的; 在2D-IR的同步光谱分析中可以看出, 部分样品的自动峰的位置强度和交叉峰的位置强度表现出了很大的差异, 可以区分一些苹果样品, 但完全依据二维相关红外光谱图的观察及对比, 仍然不能很好地辨别苹果的种类; 对所有样品光谱进行CNN和RBF分析, 最终在预测样本中, 64个预测光谱样本分别只有7个和6个错分, 准确率分别达到89.06%和90.6%; 而且两种模型分类效果互补。 因此通过运用FTIR、 2D-IR、 CNN和RBF可以对不同苹果进行分析和分类, 而且各种方法互补, 分类可以达到极高的准确性, 该方法可以推广到其他的物质鉴别分析中。
[1] |
|
[2] |
|
[3] |
|
[4] |
|
[5] |
|
[6] |
|
[7] |
|
[8] |
|
[9] |
|
[10] |
|
[11] |
|
[12] |
|
[13] |
|
[14] |
|
[15] |
|
[16] |
|
[17] |
|
[18] |
|