基于卷积神经网络的烟叶近红外光谱分类建模方法研究
鲁梦瑶1,4, 杨凯2, 宋鹏飞3, 束茹欣2, 王萝萍3, 杨玉清1,4, 刘慧1,4, 李军会1,4,*, 赵龙莲1,4, 张晔晖1,4
1. 中国农业大学信息与电气工程学院, 北京 100083
2. 上海烟草集团有限责任公司, 上海 200082
3. 云南中烟技术中心, 云南 昆明 650202
4. 中国农业大学, 教育部现代精细农业系统集成研究重点实验, 北京 100083
*通讯联系人 e-mail: caunir@cau.edu.cn

作者简介: 鲁梦瑶, 女, 1993年生, 中国农业大学信息与电气工程学院硕士研究生 e-mail: 498408325@qq.com

摘要

卷积神经网络(CNN)在图像分类识别领域应用广泛, 但其在近红外光谱分类中的研究还未见报道, 对基于CNN的近红外光谱分类建模方法进行了研究。 针对近红外光谱数据的特点, 提出了一种改进的卷积神经网络建模方法, 对CNN经典模型LeNet-5所做改进: ①将方形矩阵卷积核改为适用于一维近红外光谱的向量卷积核; ②简化网络结构, 将LeNet-5结构中C5, F6及输出层改为单层感知机。 同时, 采用隔点采样的方法对近红外光谱降维, 加快收敛速度; 并对卷积核尺寸对建模结果的影响进行了研究。 以我国东北、 黄淮、 西南三大烤烟产区的600个中部烟叶样本的近红外光谱为实验对象, 建立烟叶产区分类NIR-CNN模型。 该模型对训练集和测试集的判别准确率为98.2%和95%。 实验结果表明, 应用卷积神经网络可对近红外光谱数据准确、 可靠地判别分类; 烟叶产区NIR-CNN建模方法可为卷烟企业烟叶原料科学合理利用提供指导, 为维护卷烟产品的质量稳定有重要意义; 基于卷积神经网络的近红外光谱判别方法也可推广到其他农产品的分类应用中。

关键词: 卷积神经网络; 近红外光谱; 判别分类; 烟叶产区
中图分类号:O657.3 文献标识码:A
The Study of Classification Modeling Method for Near Infrared Spectroscopy of Tobacco Leaves Based on Convolution Neural Network
LU Meng-yao1,4, YANG Kai2, SONG Peng-fei3, SHU Ru-xin2, WANG Luo-ping3, YANG Yu-qing1,4, LIU Hui1,4, LI Jun-hui1,4,*, ZHAO Long-lian1,4, ZHANG Ye-hui1,4
1. College of Information and Electrical Engineering, China Agricultural University, Beijing 100083, China
2. Technology Center of Shanghai Tobacco(Group) Gorporation, Shanghai 200082, China
3. Yunnan Tobacco Technology Center, Kunming 650202, China
4. Key Laboratory of Modern Precision Agriculture System Integration Research, Ministry of Education, China Agricultural University, Beijing 100083, China
Abstract

Convolutional neural network (CNN) was widely used in image classification and recognition but its application in near infrared spectroscopy has not been reported. Therefore, the near-infrared spectroscopy classification modeling method based on CNN was studied in this paper. Taking into account the characteristics of near-infrared spectral data, an improved CNN modeling method was presented in this paper, which improves the CNN classical model Lenet-5: ①The square matrix convolution kernel was transformed into a vector convolution kernel for one-dimensional near-infrared spectroscopy. ②The C5, F6 and output layers of the lenet-5 structure were changed to single-layer sensing machines in order to simplify the network structure. At the same time, the method of sampling points was used to reduce the dimensionality of near infrared spectrum and speed up the convergence rate. The influence of convolution kernel size on modeling results was also studied in this paper. NIR-CNN model was established by the near-infrared spectroscopy of 600 central tobacco samples from northeast, Huanghuai and southwest China. The accuracy of the model was 98.2% and 95% for the training set and test set. The experimental results showed that the application of CNN could accurately and reliably identify the near infrared spectrum data. This method provided guidance for the scientific and rational utilization of raw materials of tobacco enterprises, and it was important to maintain the quality stability of cigarette products. The method of near infrared spectroscopy based on CNN could also be applied in the classification of other agricultural products.

Key words: Convolution neural network; Near-Infrared spectroscopy; Classification discrimination; Tobacco-producing areas
引 言

烟叶产区是决定烤烟香味特征的关键因素[1], 也是烤烟烟叶收购与分级、 卷烟配方设计中需要考虑的重要依据。 同一产区内烟叶具有相对固定的倾向性特征[2, 3], 但在卷烟原料实际收购过程中来自同一产区的烟叶质量也参差不齐, 有些不一定具备该产区的固有特征, 很难满足卷烟工业生产中对原料特有属性的要求。 在卷烟配方加工中若能筛选出不属于或不符合该产区特征的烟叶, 对原料的科学合理利用、 维护卷烟产品质量的稳定具有重要意义。

近红外技术具备简单、 快速、 无损等优点, 其光谱主要是由含氢基团X— H(X=C, N, O)振动的合频和倍频组成, 所含信息量丰富, 被广泛应用于烟叶工业分级、 配方加工等方面[4]。 不同类别烟叶的内在化学成分含量存在明显差异, 在近红外光谱中表现为吸收峰的强度和位置差异。 利用近红外技术结合支持向量机(SVM), 判别分析(DA), 定性偏最小二乘(DPLS)等化学计量学算法建立的识别模型, 可实现对烟叶的智能分类分级[5, 6]。 近年来, 深度学习受到业内各界广泛关注, 通过深度学习分析建立能够模拟人脑的神经网络来理解数据, 在计算机视觉[7, 8]、 自然语言理解[9, 10]、 语音模式识别[11, 12]等领域都取得了很好的成绩。 卷积神经网络(convolutional neural network, CNN)作为深度学习的代表, 其网络结构对图像的平移、 比例缩放、 倾斜或其他形式的变形具有高度不变性[13], 在图像分类方面表现出色。 当前, 基于卷积神经网络的近红外光谱分类方法研究还未见报道。

鉴于此, 本研究提出了基于近红外技术结合卷积神经网络的烟叶产区判别方法, 充分利用二者优势, 构建了烟叶产区快速判别模型。 以我国三大烤烟产区10个主要烤烟产地省份的600个烟叶样本的近红外光谱为实验对象, 建立烟叶产区的NIR-CNN识别模型。 通过该方法可以筛选出不符合产区风格特征的烟叶, 对品牌特色卷烟产品的烤烟原料科学合理利用提供指导, 辅助配方设计, 对维护卷烟产品的质量稳定性有重要意义。

1 实验部分
1.1 材料

试验共选取600个烟叶样本, 分别来自于黑龙江、 吉林、 辽宁、 河南、 山东、 贵州、 湖南、 四川、 云南、 重庆全国10个主要烤烟省份产地, 其中东北, 黄淮, 西南三大产区各200个, 见表1所示。

表1 三大产区烟叶分布情况 Table 1 Distribution of tobacco leaves in three major areas
1.2 仪器设备与采集方法

采用美国热电尼高力公司Nexus型傅里叶变换近红外光谱仪。 扫描参数: 光谱谱区采集范围为10 000~4 000 cm-1, 分辨率为8 cm-1, 扫描次数为64。 将烤烟烟叶磨成粉末, 在45 ℃以下烘烤0.5 h, 将含水量控制在10%以下。 过0.25 mm孔径筛, 取15 g烟末放入实验样品杯中, 用重量自然压实后进行近红外光谱扫描。

图1 烤烟烟叶样本的近红外光谱图Fig.1 Near-infrared spectra of tobacco leaf samples

按照1.2中方法采集到的光谱数据点数为1 609。 得到烤烟烟叶样本的近红外光谱, 如图1所示。

1.3 分析方法

1.3.1 卷积神经网络

卷积神经网络是一个多层非全连接的神经网络, 在正向传播过程中利用卷积层和池化层相互交替学习, 提取原始数据的特征; 反向传播过程中利用梯度下降算法最小化误差函数来调整参数, 完成权值更新[13]

卷积层中, 输入数据与可训练的卷积核做卷积运算, 通过“ 滑动平移, 加权求和” 的方式提取不同位置的特征, 计算过程可表示为:

xβγ=fαMβxαγ-1kαβγ+bβγ(1)

式(1)中: xαγ-1xβγ分别是第γ -1层、 第γ 层输出特征上相应的值; kαβγ为卷积核的权重值; bβγ为特征的偏置; f是卷积层神经元的激活函数。

池化即为降采样, 假定池化窗口大小为n× n, 取该窗口区域内n× n个特征值的最大(或平均)作为新的特征值, 将这些新的特征值按序排列后得到的新向量即为降维后池化层的输出。 池化层特征向量的大小为上一层卷积层的1/n。 池化层的计算过程可表示为

xβγ=pool(xβγ-1)(2)

式(2)中: xβγ-1xβγ分别是第γ -1层、 第γ 层输出特征上相应的值; pool为所选择的池化方式, 包括最大值池化函数和平均池化函数两种。

1.3.2 改进的卷积神经网络

LeNet-5[13]是Yan LeCun于1998年提出的一种卷积神经网络模型, 最初用来识别手写数字体, 网络模型如图2所示。 本文对传统的LeNet-5进行改进, 将改进后的网络用于烤烟烟叶的近红外光谱判别中:

(1)LeNet-5是以图像为分类对象提出的卷积神经网络结构。 该网络的输入是像素为32× 32的二维手写数字体图像, 所使用的卷积核及池化尺寸均为n* n的方形矩阵。 对传统的卷积神经网络模型进行改进, 将LeNet-5中方形矩阵卷积核改为一维向量卷积核, 使之适用于近红外光谱数据。

(2)为简化网络结构、 降低网络参数、 提高运算速率, 将C5和F6层及输出层改为一个单层感知器: 将原S4层所有特征值展开排列为F5层, 计算F5层特征向量和权重向量之间的点积, 再加上一个偏置, 然后将其传递给激活函数产生 一个状态, 即为输出层的每个神经元。

图2 LeNet-5网络模型结构Fig.2 LeNet-5 network model structure

将LeNet-5结构进行以上改进, 设计了一个7层的卷积神经网络用于烤烟近红外光谱的判别分类, 包括1个输入层, 2个卷积层, 2个池化层, 1个全连接层和1个输出层, 可表示为: INPUT-C1-S2-C3-S4-F5-OUTPUT。

1.4 模型评价方法

通过“ 训练集判别准确率” 和“ 测试集判别准确率” 这两个指标对所设计的模型进行性能评估。 判别准确率PA可表示为

PA=NcNr100%(3)

式(3)中: Nc为判别正确的样本数, Nr为样品总数。

2 结果与讨论
2.1 采样间隔对NIR-CNN模型判别结果的影响

实验采集的近红外光谱有1 609个数据点, 若直接作为神经网络的输入, 数据量过大, 网络训练时间过长。 采用不同采样间隔对输入的近红外光谱数据进行降维, 降维后的近红外光谱图如图3所示。 从600个烟叶样品中随机选出200个, 以5∶ 1的比例划分为训练集和测试集, 对输入光谱按图3中的四种方式采样, 建立NIR-CNN模型, 模型判别结果如表2所示。

图3 不同采样间隔的近红外光谱图
(a): 原始近红外光谱; (b): 隔5点采样后的近红外光谱; (c): 隔10点采样后的近红外光谱; (d): 隔50点采样后的近红外光谱
Fig.3 Near infrared spectra of different sampling intervals
(a): The original NIR spectra; (b): NIR spectra after 5 points sampling; (c): NIR spectra after 10 points sampling; (d): NIR spectra after 50 points sampling

表2 不同采样间隔的NIR-CNN模型实验结果 Table 2 Experimental results of NIR-CNN model with different sampling intervals

图3为采样后的近红外光谱, 隔5点采样后光谱基本不变; 隔10点采样后光谱细节丢失; 隔50点采样后光谱信息损失严重。 由表2可知: 随着采样间隔增大, 测试集判别准确率下降; 随着采样间隔减小, 网络参数增多, 每次迭代所用时间变长。 综上考虑, 对数据采用隔5点采样的方式, 网络模型表现出更好的性能。

2.2 卷积核尺寸对NIR-CNN模型判别结果的影响

为检验卷积核尺寸对模型性能的影响, 从600个烟叶样品中随机选出200个, 以5∶ 1的比例重新划分训练集和测试集, 建立NIR-CNN模型。 模型分类正确率随卷积核尺寸变化的曲线如图4所示, 当训练集与测试集的分类正确率达到最大时, 对应的卷积核尺寸分别是1× 35和1× 5。 卷积核尺寸对NIR-CNN模型的判别结果影响不大, 研究中选择的卷积核尺寸为1× 5。

图4 不同卷积核尺寸的NIR-CNN模型判别结果Fig.4 NIR-CNN model discrimination results of different convolution kernel size

设定卷积核尺寸为1× 5, 改变网络训练迭代次数, NIR-CNN模型判别结果如表3所示, 迭代次数很少时, 模型训练不充分, 分类效果较差; 随着迭代次数的增加, 分类率随之上升; 当迭代次数足够多时, 模型判别结果不会有太大变化, 模型达到收敛状态。 本文选择迭代次数为1 000。

表3 不同迭代次数的NIR-CNN模型判别结果 Table 3 NIR-CNN model discrimination results of different number of iteration
2.3 基于NIR-CNN模型的烟叶产区判别分析结果

结合2.1节和2.2节实验分析结果, 设置迭代次数为1 000, 建立烤烟烟叶产区NIR-CNN模型, 网络模型参数如表4所示。 以5∶ 1的比例将全部600个烟叶近红外样本随机划分为训练集、 测试集, 产区分布详细情况如表5所示。 NIR-CNN模型对烟叶产区判别结果如表6所示, 判别结果具体分布如表7所示。

表4 NIR-CNN网络模型各层参数设置 Table 4 NIR-CNN network model parameter setting for each layer
表5 烟叶样本训练集、 测试集划分情况 Table 5 Thetraining set, test set distribution of tobacco leaf samples
表6 烟叶产区NIR-CNN模型判别准确率 Table 6 NIR-CNN model discrimination accuracy in tobacco leaves producing areas
表7 烟叶产区NIR-CNN模型详细判别结果 Table 7 NIR-CNN model detailed discrimination results in tobacco leaves producing areas
表8 各产区烟叶NIR-CNN模型分类详细准确率 Table 8 NIR-CNN Model for classification of tobacco leaves in different producing areas

表6表8 NIR-CNN烟叶产区判别结果可知: ①本文提出的NIR-CNN模型在训练集和测试集上的准确率分别为98.6%和95.0%, 该模型可以较全面地描述烤烟烟叶产区的特征, CNN对于NIR光谱数据有较强的学习和判别能力。 ②NIR-CNN模型不仅对东北、 黄淮、 西南三大产区烤烟的平均判别准确率为95.0%, 且对三大产区中的每一个产区都有很高的识别能力, 其中对黄淮产区烟叶的识别准确率为100%。

3 结 论

就基于CNN的近红外光谱分类建模方法进行了研究, 提出了一种基于卷积神经网络结合近红外技术的烟叶产区分类方法, 建立了烟叶产区判别NIR-CNN模型, 分析结果表明:

(1)基于近红外光谱分析技术结合卷积神经网络的模式识别原理可准确、 可靠地鉴别烟叶产区; 卷积神经网络可从光谱上直接提取特征信息。 (2)通过本方法可以筛选出不符合产区风格特征的烟叶, 对品牌特色卷烟产品的烟叶原料科学合理利用可提供指导, 对维护卷烟产品的质量稳定有重要意义。 (3)基于CNN的近红外光谱分类建模方法可推广到其他类型产品的应用中。

The authors have declared that no competing interests exist.

参考文献
[1] QIAO Xue-yi, WANG Bing, WU Dian-xin, et al(乔学义, 王兵, 吴殿信, ). Tobacco Science & Technology(烟草科技), 2016, 49(9): 70. [本文引用:1]
[2] YIN Qi-sheng, ZHANG Yan-ling, XUE Chao-qun, et al(尹启生, 张艳玲, 薛超群, ). Acta Tabacaria Sinica(中国烟草学报), 2009, 15(4): 33. [本文引用:1]
[3] PENG Xin-hui, YI Jian-hua, ZHOU Qing-ming(彭新辉, 易建华, 周清明). Chinese Tobacco Science(中国烟草科学), 2009, 30(1): 68. [本文引用:1]
[4] SHU Ru-xin, SUN Ping, YANG Kai, et al(束茹欣, 孙平, 杨凯, ). Tobacco Science & Technology(烟草科技), 2011, (11): 50. [本文引用:1]
[5] ZHANG Ying, HE Li-yuan(章英, 贺立源). Transactions of the Chinese Society of Agricultural Engineering(农业工程学报), 2011, 27(4): 350. [本文引用:1]
[6] TANG Guo, TIAN Kuang-da, LI Zu-hong(唐果, 田旷达, 李祖红, 等). Tobacco Science & Technology(烟草科技), 2013, (4): 60. [本文引用:1]
[7] Lecun Y, Kavukcuoglu K, Farabet C. IEEE International Symposium on Circuits & Systems, 2010, 14(5): 253. [本文引用:1]
[8] Ji S, Xu W, Yang M, et al. IEEE Transactions on Pattern Analysis & Machine Intelligence, 2013, 35(1): 221. [本文引用:1]
[9] Su B, Lu S. Pattern Recognition, 2007, 63: 397. [本文引用:1]
[10] Sarikaya R, Hinton G E, Deoras A. IEEE/ACM Transactions on Audio Speech & Language Processing, 2014, 23(4): 778. [本文引用:1]
[11] Mohamed A R, Dahl G E, Hinton G. IEEE Transactions on Audio Speech & Language Processing, 2012, 20(1): 14. [本文引用:1]
[12] Abdel-Hamid O, Mohamed A R, Jiang H, et al. IEEE International Conference on Acoustics, 2012, 22(10): 77. [本文引用:1]
[13] Lecun Y, Bottou L, Bengio Y, et al. Proceedingsof the IEEE, 1998, 86(11): 2278. [本文引用:3]