近红外光谱的古筝面板用木材等级识别研究
黄英来, 孟诗语, 赵鹏, 岳梦乔
东北林业大学信息与计算机工程学院, 黑龙江 哈尔滨 150040

作者简介: 黄英来, 1978年生, 东北林业大学信息与计算机工程学院副教授 e-mail: nefuhyl@nefu.edu.cn

摘要

目前民族乐器古筝面板用板材的等级主要依靠乐器技师凭借个人经验进行判断, 此方法受限于有丰富经验的技师且容易受其主观判断影响。 针对此现状, 以用于制作古筝面板的泡桐木材为实验样本, 提出了一种利用近红外光谱结合改进的BP神经网络方法, 实现快速识别古筝面板用板材的不同等级。 近红外光谱可以表征丰富的物质结构与组成信息, 并且测量仪器成本较低, 附件形式多样化, 所以针对泡桐板材的近红外光谱实验分析有实用意义首先进行光谱去噪, 消除系统误差等以提高光谱分辨率, 根据均方根误差与信号平方和作为多种预处理方法评价指标, 选取一阶导数为本实验最终预处理方式, 15为合适的滤波去噪窗口大小, 然后通过主成分分析法压缩数据以及马氏距离法剔除建模集异常样本, 从而建立更具代表性的建模集。 然后通过聚类分析无监督学习方法进行板材等级分析, 证明板材分级的可行性。 由于H2O在近红外光谱区域具有较大吸收, 根据实验光谱分析结果, 不考虑其基频振动波段5 396.0~4 978.0 cm-1区域和第一泛音振动波段6 800~7 000 cm-1区域, 仅考虑剩余近红外光谱波段信息, 将不同光谱信息波段组合, 共七种组合波段区域作为神经网络模型的输入, 进行面板板材等级识别模型实验。 对传统的BP神经网络模型作改进。 BP神经网络中学习率的设置采用自适应学习率优化策略, 弥补传统神经网络训练速率慢等劣势。 同时采用交叉熵函数作为代价函数, 从而加快权重的更新速度。 选取Relu函数作为输入层与隐藏层之间的传递函数, 提高了模型训练速度, 有效防止过拟合的发生。 选取Softmax函数作为最后一层的传递函数, 以此减少复杂计算, 构成该研究最终BP神经网络模型。 选取不同数量的主成分变量所能提取的光谱信息量不同, 通过不断增加主成分个数和调整参与模型的光谱波段区间, 调整BP神经网络模型的输入, 当主成分个数为11和光谱区间为10 000~7 000和4 976~4 000 cm-1时, 未知样本识别率达到99.7%, 所选光谱区间涵盖C—H等基团全部特征信息。 研究结果表明, 近红外光谱结合神经网络可以对不同等级的泡桐木材进行有效的识别, 降低人工检测误差, 缩短板材分级时间, 更好地满足乐器市场需求。

关键词: 近红外光谱; 古筝面板; 神经网络; 泡桐木
中图分类号:TP391 文献标志码:A
A Method for Identifying Wood Grades of Chinese Zither Panel Based on Near Infrared Spectroscopy
HUANG Ying-lai, MENG Shi-yu, ZHAO Peng, YUE Meng-qiao
College of Information and Computer Engineering, Northeast Forestry University, Harbin 150040, China
Abstract

At present,the wood grades of the national musical instrument Chinese zither panel mainly rely on the personal experience of the musical instrument technician.This method relies on experienced technicians and is susceptible to subjective judgment. In view of this situation, we use the Paulownia wood used to make the Chinese zither panel as an experimental sample. We propose a method of using near-infrared spectroscopy and the improved BP neural network to rapidly identify different grades of Chinese zither panels .Because Near-infrared spectroscopy can characterize a number of material structure and composition information, with the low cost of measuring instruments and many measuring accessories,we conduct an experimental analysis of the near-infrared spectral data of Paulownia panel. In the experiment, spectral denoising is first performed to eliminate system errors and improve spectral resolution, regarding the root mean square error and the square sum of signals as the evaluation criterions of various pretreatment methods.Therefore ,the first derivative is selected as the final pretreatment method, and 15 is the appropriate filter denoising window size.The principal component analysis is then used to compress the data and the Mahalanobis distance is used to eliminate the modeling set’s abnormal samples to create a more representative modeling set. Then, an unsupervised clustering is used to analyze the Paulownia panel grades , which proves the feasibility of grade classification.Since H2O has a large absorption in the near-infrared spectral region, according to experimental spectral analysis results,we do not consider the fundamental frequency vibration band (5 396 to 4 978 cm-1) and the first overtone vibration band (6 800 to 7 000 cm-1),but consider only the remaining near-infrared spectral band. Different spectral bands are combined, and seven bands are used as input to the neural network to carry out the panel grade recognition.We also improve the traditional BP neural network model. The learning rate of BP neural network is set by an adaptive optimization strategy to speed up the traditional neural network’s training rate.At the same time, the cross entropy function is used as the cost function to speed up the updating of the weight.The Relu function is selected as the transfer function between the input layer and the hidden layer, which improves the training speed of the model and effectively prevents over-fitting.The Softmax function is chosen as the transfer function of the last layer to reduce complex calculations. By this way, the final BP neural network is constructed.The amount of spectral information that can be extracted by different principal component variables is different.We adjust the input of the BP neural network model by increasing the number of principal components and adjusting the spectral band interval.When the number of principal components is 11 and the spectral intervals are 10 000 to 7 000 cm-1 and 4 976 to 4 000 cm-1, the unknown sample’s recognition rate reaches 99.7% , and the selected spectral range covers all the characteristis of C—H bond and other bond information.The results show that near-infrared spectroscopy combined with BP neural network can effectively identify different grades of Paulownia panel, thereby reducing manual detection errors, shortening the processing time, and better meeting the needs of the instrument market.

Keyword: Near-infrared spectroscopy; Chinese zither panel; Neural network; Paulownia
引 言

古筝属于面板拨弦振动乐器, 其面板是振动主体, 为产生古筝音质的关键部位。 根据北京乐器研究所考察全国很多乐器木材的结论可知, 泡桐木是制作古筝面板最好的材料, 而不同等级的泡桐木材所制作出的古筝发出的声音具有不同音质, 很大程度上决定了古筝音质的好坏。 古筝面板的规格较长, 在挑选板材过程中, 需要判断疤结是活结还是死结、 纹理是否顺直和纹理间距[1, 2]等细节。 目前板材的优劣判断方法主要是依靠技师根据标准QB/T 1207.3— 2011《筝》[3]判定木材的活疤结尺寸和个数、 高音是否明亮、 余音长短等因素; 这种方法需要具有丰富经验或专业技能的人员, 并且进行大量的分析工作, 但结果受主观判断影响。 面对广阔且快速发展的乐器市场, 难以满足市场的需要。 因此, 建立一套科学的、 客观的、 快速的选材方法显得尤为重要, 有助于提高木材利用率和进一步完善民族乐器的科学理论。

近红外光谱是一种非破坏性、 数据分析快、 重复性好, 效率高的分析方法[4, 5]。 木材是复杂的天然聚合物质, 其主要组成为纤维素、 半纤维素和木质素等天然有机高分子, 这些成分在近红外区都有较强的吸收[6], 所以近红外光谱应用于木材领域具有可行性。 近年来, 杨忠等将八类红木清楚地区分成八个相应的类别[7], Sung-Wook Hwang[8]等使用近红外光谱对韩国的建筑树木松树进行了分类识别; 王学顺等结合神经网络和近红外光谱进行了不同树种的分类[9, 10]; 黄安民等[11]将小波阈值去噪方法和近红外光谱应用于不同木材树种的识别。 但在古筝面板常用木材泡桐木的等级判断方面的研究报道较少。 基于近红外光谱较中红外等其他区域光谱具有大量丰富的木材结构与组成信息[12, 13]等优势和相应测量仪器成本低, 附件形式多, 测量方便[14]等优点, 所以本文对泡桐木的近红外光谱数据进行一系列分析。

研究中, 通过马氏距离法剔除建模集异常样本, 使用多种去噪方式达到减少噪声目的, 主成分分析进行数据降维, 结合改进的BP神经网络建立了基于近红外光谱的古筝面板用木材等级鉴别模型。

1 实验部分
1.1 材料

所采用的泡桐实验样品全部来自古筝乐器厂, 进行相应的干燥和陈化处理, 含水率低于16%, 根据乐器技师按经验选出的高级品、 中级品以及普及品三个等级的木材各250块, 共750块板材用于近红外光谱谱线的筛选、 建模以及验证, 将样本标号为0— 749, 每块样品大小设置为10 cm× 10 cm× 1 cm。

1.2 光谱采集及设备

采集光谱用的设备为PerkinElmer Spectrum 100 N系统(PerkinElmer Co, USA), 通过NIR积分球漫反射附件从每个样品的木块获得近红外光谱。 光谱分辨率为16 cm-1, 收集10 000~4 000 cm-1的光谱, 2 cm-1为间隔, 即每个样本具有3 000点数据。 采集木材样品的两个面, 每个面上采集10个点, 共20个点最后取其平均值作为实验样本。 所使用的软件为Python3.6和TensorFlow系统, 根据Tensorboard可视化工具观察实验过程中参数的变化。

1.3 光谱数据预处理

由于样品的颗粒程度不同, 光的散射等影响, 近红外光谱中往往包含一些与待测样品性质无关的信息, 因此对光谱数据进行预处理是非常必要的。 常用的预处理方法有Savitzky-Golay卷积平滑、 微分方法和标准正态变量变换(SNV)方法等。 其中微分方法可以降低或消除系统误差。 导数光谱提供比原始光谱更高的分辨率。 一阶导数可以清除不依赖于波长的基线漂移, 二阶导数可将线性漂移背景完全消除。 SNV方法用于校准基线漂移和光通行长度中存在的差异。 本文采用S-G微分方法和SNV。 方根误差反映了使用数据偏离真实值的程度, 信号平方和能够很好地反映出预处理手段提取信息的精密度, 所以光谱预处理手段选取依赖于均方根误差(RMSE)与信号平方和(SUMSQ)两个指标, 计算公式如式(1)和式(2), 其中Si(n)为原始光谱信号, S˙i(n)为预处理后光谱信号, n为光谱数据长度。

RMSE=1ni=1n(Si(n)-S˙i(n))2(1)SUMSQ=i=1nS˙i2(n)(2)

将光谱数据进行可视化, 实验样本的原始光谱及经过预处理后的光谱信息如图1— 图4所示。

图1 原始光谱数据图Fig.1 Raw spectral image

图2 一阶导数预处理图Fig.2 First derivative image

图3 二阶导数预处理图Fig.3 Second derivative image

图4 标准正态变量变换预处理图Fig.4 Standard normal variable transformation data image

1.4 主成分分析

近红外光谱定性分析中, 大量光谱数据的计算是非常复杂的, 通常进行数据压缩。 常用的数据压缩变换方法有傅里叶变换、 主成分分析和小波变换等, 本文采用主成分分析。

主成分分析是把多个特征映射为几个综合特征的一种统计分析方法, 计算出的主成分向量是各个原变量的线性组合, 主成分向量之间是正交的, 以此将数据降维, 排除化学信息中相互重叠的信息。 选择特征值较大的几个主成分作为实验数据参与分析。 主成分个数的选取很重要, 主成分个数过少不足以代表整个光谱信息, 过多则会引入噪声信息, 使模型的预测能力下降。 一般认为累计解释度达到85%以上即可代表整个光谱信息。 不同预处理方法基于实验数据进行主成分分析的累积解释度如图5所示。 可以看出3组光谱信息经过数据压缩后, 原始光谱经过4个主成分变量分析, 主成分累积解释度就已经接近99%, 一阶导数光谱取7个主成分时主成分累积解释度达到85%, 而二阶导数光谱主成分个数取56时主成分累积解释度才可以达到85%。

图5 主成分累积解释程度图Fig.5 Principal component cumulative interpretation image

1.5 剔除异常样本

光谱数据时常会出现异常样品的情况。 造成样品光谱数据异常的主要原因有测量环境的变化、 光谱扫描过程中的误操作和样品前处理不当等。 异常样品对于实验模型的影响是不能忽视的, 应该将其从建模集剔除。 异常样本的正确判别和剔除对于提高泡桐木材等级判别模型准确率具有十分重要的意义。

本实验所使用的剔除异常样本的方法为马氏距离方法, 它是一种有效的计算两个未知样本集的相似度的方法。 由于光谱数据计算量过大, 在进行剔除判别之前, 先对原始光谱数据进行主成分分析, 选取前两个主成分用于马氏距离计算。 马氏距离的计算公式如式(3), 其中x为待求样本点向量, μ 为实验样本均值向量, 协方差矩阵为S

DM(x)=(x-μ)TS-1(x-μ)(3)

设置合适的距离阈值, 筛选实验建模集样本。 采用随机数种子机制和建模集与验证集的比例为4∶ 1原则随机选取实验样本, 构成建模集和验证集。 共剔除9个异常样本, 其中高级品6个, 中级品2个, 普及品1个, 异常样本进行显著放大标记, 具体的标记情况如图6所示, 其中横坐标为第一个主成分得分值, 纵坐标为第二主成分得分值。

图6 马氏距离异常建模集样本筛选图Fig.6 Mahalanobis distance method culling model set abnormal sample image

剔除异常样本后剩余的样本用于实验训练建模, 建模集与验证集具体分组情况如表1所示。

表1 数据集划分 Table 1 Data set partition
1.6 Kmeans聚类

Kmeans方法是典型的基于距离的分层次聚类方法, 在最小化误差函数的基础上将数据划分为预定的类数K, 采用距离作为相似性的评价指标, 即认为两个对象的距离越小, 其相似度就越大, 常用的距离度量方法包括欧几里得距离和余弦相似度等, 本文选取的度量方法为欧式距离。

1.7 改进的BP神经网络模型

建立一个三层的BP神经网络模型, 由于传统的BP网络学习率通常指定为一个固定的数值, 具有损失函数定义过于简单以及所使用的梯度下降法具有容易陷入局部最优解和训练速度慢等缺陷, 所以针对此劣势进行改进。

学习率对于模型有着显著的影响, 采用自适应学习率优化策略Adam优化方法进行实验, Adam算法集合了AdaGrad和RMSProp两个算法的优点, 能较好的处理噪声样本, 并且天然具有退火效果, 利用梯度的一阶矩估计和二阶矩估计动态调整每个参数的学习率, 对超参数的选择具有很强的鲁棒性。 交叉熵函数克服了方差代价函数更新权重过慢的问题。 本实验为多分类问题, 采用One-hot的编码方式设置样本类别, 最后一层的传递函数设置为Softmax函数。 相比于Sigmoid函数和tanh函数, Relu函数只需要一个阈值就可以得到激活值, 避免一系列复杂计算, 所以本模型输入层与隐藏层之间的传递函数选取Relu函数。

经过多次试验, 最终网络隐含层结点个数设置为15, 输出层节点数为3, 初始学习率设置为0.01, 训练迭代次数为100。

2 结果与讨论
2.1 光谱分析

从图1可以看出, 原始光谱曲线谱峰重叠, 并且包含高频噪声信号; 在5 500~4 800和7 000 cm-1附近不同质量的泡桐木材光谱波形具有微小的差异, 这使得区分差异品种成为可能, 同种等级质量的泡桐板材的样本光谱具有一定的聚集趋势, 但凭肉眼难以准确区分。

可以发现, 泡桐木材在波数10 000~7 100 cm-1区吸收最少, 在6 806~5 192 cm-1区吸收稍高, 在波数4 400~4 016 cm-1区最高。 在8 248, 6 806, 5 804, 5 602, 5 192, 4 760, 4 400, 4 286和4 016 cm-1处附近有明显的吸收峰; 在9 040, 8 280, 7 668, 6 084, 5 396, 4 978, 4 526, 4 354和4 166 cm-1处有明显的肩峰。 纤维素、 半纤维素和木质素等为木材主要组成, 且所占比例为90%以上, 主要由O— H, C— H, CH2和C— O等基团组成; 有机物在近红外谱区的吸收主要是含氢基团的倍频与合频的吸收; 5 192 cm-1处附近由水中O— H键反对称的伸缩振动和变形振动引起, 6 806 cm-1处附近由水中O— H键伸缩振动的第一泛音引起, 4 400 cm-1附近由C— H键伸缩振动和变形振动引起, 8 248 cm-1处附近为CH2键伸缩振动的二级倍频, 8 280~7 668 cm-1区间为C— H键伸缩振动第一泛音谱带。 根据特征峰以及吸光度大小可以发现, 与普及品相比高级品板材和中级品板材中C— H和O— H基团具有较低的吸收。

一般来说, 古筝面板木材要求含水率低于16%。 根据光谱吸收峰和肩峰发现, 水分子影响仍然较大, 具有较强的吸收。 泡桐木材水分子吸收带在5 396~4 978 cm-1和6 800~7 000 cm-1区域附近, 分别对应于水中O— H键伸缩振动、 变形振动的混合带和水中O— H键伸缩振动的第一泛音带。 为了避开水的吸收带, 选择10 000~7 000, 6 800~5 398, 4 976~4 000 cm-1三个波段数据, 在此近红外光谱区域具有大量的有机物信息, 为探究最佳的实验波段, 将三个波段区间进行组合, 共7种实验光谱数据区间。

2.2 聚类分析

图7为使用原始光谱数据前两个主成分进行Kmeans方法聚类的分析图, K的值为3, 可见不同等级的泡桐板材均具有的一定的聚类趋势, 为进一步分类不同等级的泡桐木材等级提供了可能性, 但每一类中仍存在分错现象, 对于高级品和普及品分类效果稍好, 中级品分类效果最差, 要取得精准的定性分析结果, 还需要运用有监督的模式识别分析方法。

图7 聚类分析图Fig.7 Cluster analysis image

2.3 预处理方法选取

由图2和图3可知, 在一阶导数光谱中, 原光谱的峰值变成了零点, 而在原峰值两侧的拐点处分别出现了正的和负的峰值。 在二阶导数光谱中, 尽管符号出现了反转, 但原峰值的波长处仍然是二阶导数光谱的峰值, 因此导数光谱可以很方便地把握原光谱的变化趋势。 对于卷积微分预处理过程涉及到窗口的考量, Savitzky-Golay卷积滤波的效果随着选取窗宽不同而不同, 过小的窗口不足以提取全部的信息, 过大的窗口会过滤掉有用信息, 随着窗口大小的不同, 均方根误差(RMSE)与信号平方和(SUMSQ)的相应变化具体如图8和图9所示, 横坐标为窗口大小。

图8 二阶导数预处理评价指标图Fig.8 Second derivative preprocessing evaluation index image

图9 一阶导数预处理评价指标图Fig.9 First derivative preprocessing evaluation index image

光谱数据去噪的衡量标准就是既能够过滤掉过多的噪声又可以保留尽量多的有效信息, 即去噪能力越强并且去噪后信号更接近于原始光谱信息时效果最佳, 所以均方根误差值与信号平方和数值应该尽量小。 综合对比均方根误差与信号平方和随滤波窗口数值大小变化的结果, 并且根据计算量和所提取的有用信息程度, 最终选取卷积平滑与一阶导数为本实验的预处理方式, 窗口大小为15。

2.4 模型分类结果

本实验类别为高级品, 中级品和普及品三类, 通过One-hot编码, 其中[1 0 0]表示高级品, [0 1 0]表示中级品和[0 0 1]表示普及品, 以模型对验证集的识别率作为衡量指标, 不同主成分个数和不同组合实验光谱波段数据对于模型识别率的影响如表2所示, 可以看出随着主成分个数的增加, 模型识别率递增。 在主成分个数为11和实验光谱区间为10 000~7 000和4 976~4 000 cm-1时验证集的准确率平均值达到99.7%, 并且参与实验计算的光谱数据最少和所选光谱区间涵盖了构成古筝板材化学成分的O— H和C— H等基团特征峰的全部特征信息。 为了减少篇幅和叙述重复, 将A表示为10 000~7 000 cm-1波段, 将B表示为6 800~5 398 cm-1波段, 将C表示为4 976~4 000 cm-1波段。

表2 模型分类结果 Table 2 Model classification result

在模型训练过程中, 使用了自适应学习率机制, 神经网络收敛速率较快, 在主成分个数为11和参与实验计算的光谱波段组合为10 000~7 000和4 976~4 000 cm-1时, 使用Tensorboard可视化工具来观察参数的变化, 相应的准确率和损失值变化具体如图10和图11所示, 横坐标均为迭代次数。

图10 损失值变化图Fig.10 Loss value change image

图11 准确率变化图Fig.11 Accuracy rate change image

3 结 论

应用近红外光谱和马氏距离法、 主成分分析结合改进的BP神经网络对古筝面板用木材等级优劣进行了判别分析, 通过选取最能代表光谱信息的特征波段作为神经网络的输入数据, 所建模型的识别率达到99.7%, 表明将近红外光谱应用于古筝面板用木材的质量等级判断是可行的, 为民族乐器制造领域快速鉴别板材等级提供了一种更加实用的方法, 有助于完善民族乐器的科学理论。

The authors have declared that no competing interests exist.

参考文献
[1] ZHOU Li, DENG Xiao-wei, YU Zheng-yu(周力, 邓小伟, 余征跃). Musical Instrument(乐器), 2017, (9): 20. [本文引用:1]
[2] FU Ming-jian(傅明鉴). Entertainment Technology(演艺科技), 2016, (5): 11. [本文引用:1]
[3] Stand ards for Light Industry of the People’s Republic of China(中华人民共和国轻工业行业标准)QB/T. 1207. 3—2011 Zheng(), 2011. [本文引用:1]
[4] ZHANG En-yang, XIA Wei-gao, YAN Xiao-jian(张恩阳, 夏维高, 闫晓剑). Information Recording Materials(信息记录材料), 2017, 18(6): 26. [本文引用:1]
[5] Tsuchikawa S, Kobori H. Journal of Wood Science, 2015, 61(3): 213. [本文引用:1]
[6] Horikawa Y, Mizuno-Tazuru S, Sugiyama J. Wood Sci. , 2015, 61: 251. [本文引用:1]
[7] PANG Xiao-yu, YANG Zhong, Bin, et al(庞晓宇, 杨忠, 吕斌, ). Spectroscopy and Spectral Analysis(光谱学与光谱分析), 2016, 36(11): 3552. [本文引用:1]
[8] Hwang S W, Horikawa Y, Lee W H, et al. Journal of Wood Science, 2016, 62(2), 156. [本文引用:1]
[9] WANG Xue-shun, SUN Yi-dan, HUANG An-min(王学顺, 孙一丹, 黄安民, ). Journal of Northeast Forestry University(东北林业大学学报), 2015, 43(12): 82. [本文引用:1]
[10] WANG Xue-shun, SUN Yi-dan, HUANG An-min(王学顺, 孙一丹, 黄安民). Forest Engineering(森林工程), 2015, 31(6): 65. [本文引用:1]
[11] YANG Zhong, HUANG An-min, JIANG Ze-hui(杨忠, 黄安民, 江泽慧). Scientia Silvae Sinicae(林业科学), 2012, 48(10): 120. [本文引用:1]
[12] Alves A, Simoes R, Stackpole D J, et al. Near Infrared Spectrosc. , 2011, 19: 343. [本文引用:1]
[13] Brigitte Loblon, Oluantosin Adedipe, Guillaume Hans, et al. The Forestry Chronicle, 2013, 89(5): 595. [本文引用:1]
[14] XU Xiu-qin, CHEN Guo, ZHANG Hao, et al(许秀琴, 陈国, 章豪, ). Anhui Chemical Industry(安徽化工), 2017, 43(4): 7. [本文引用:1]