作者简介: 梁 龙, 1989年生, 中国林业科学院林产化学工业研究所助理研究员 e-mail: lianglong@icifp.cn
基本密度是评估木材制浆造纸性能的重要指标。 采用近红外光谱技术检测造纸木片基本密度, 实时掌握原料材性变化, 能够为制定和优化制浆生产工艺提供基础理论数据。 但在实际生产中, 原料来源的复杂性造成木片水分含量波动较大, 光谱中的水分干扰信息严重影响模型预测效果, 成为制约近红外技术实际应用的主要因素。 以杨木片为研究对象, 通过对木片失水过程的近红外光谱动态监测, 结合主成分分析明确光谱中水分吸收信息的特征响应, 揭示了木片水分中结合水和自由水的变化规律。 分别采用不同水分条件下的木片光谱建立偏最小二乘回归(PLS)模型预测木片基本密度, 通过对比分析模型预测性能, 探究木片水分变化对近红外预测木片密度的影响, 并采用外部参数正交化算法(EPO)消除光谱中水分的干扰, 提高模型对水分变化的抗干扰能力。 研究结果表明, 基于饱水木片光谱的模型具有最好的预测精度, 模型的建立主要依靠近红外光谱对木片纤维结构特征信息的获取。 而光谱中大量的水分吸收信息对建模是冗余无用的, 并且会导致模型对样品水分高度敏感, 当测试集水分含量变化时, 模型预测出现严重偏差。 通过EPO算法对木片失水过程动态光谱的解析, 提取水分校正因子, 能够有效消除水分变化引起的光谱差异。 基于水分校正的基本密度预测模型对不同水分条件下的测试集均表现出稳定的预测性能, 均方根误差、 决定系数和预测相对标准偏差分别为12.23 kg·m-3、 0.883 4和2.93。 该研究将EPO算法引入对木材材性的近红外光谱分析, 构建了抗水分干扰的稳健型基本密度预测模型, 较好地解决了水分含量波动对原料材性快速检测的影响, 为近红外光谱技术在制浆造纸领域的推广应用提供了依据。
Wood basic density is an important indicator for assessing the pulping properties of raw wood materials. Rapidly determining the basic density of wood chips using near-infrared spectroscopy (NIRS) can provide basic theoretical data for developing and optimising pulp production processes. However, the source complicacy of raw material leads to high variability within the moisture content of wood chips. These fluctuations in the raw material make it difficult for the NIRS model to give a stable prediction performance. In this paper, the moisture desorption process of poplar chips was dynamically monitored by near-infrared spectroscopy. Principal component analysis (PCA) was applied to distinguish the spectral features due to moisture content to explore the change of free water and bound water in wood fiber. In order to investigate the effect of moisture content on the NIRS prediction of wood density, the partial least square calibration (PLS) models were built using wood chips with different moisture content conditions, respectively. And then external parameter orthogonalization algorithm (EPO) was used to improve the robustness of predictive models by eliminating the influence of chip moisture. The results showed that the best prediction accuracy was obtained from water-saturated chips spectra due to full access to information about fiber structures. However, much water absorption information in the spectra was redundant and useless for modeling, and the variations in moisture content also led to unstable prediction performance. The spectral moisture correction based on EPO was an effective method for desensitizing the calibration model to the influence of moisture content, enabling robust and accurate prediction of basic density. The EPO-PLS model provided a performance with a root mean square error (RMSE) of 12.23 kg·m-3, determination coefficients ( R2) of 0.883 4, and residual prediction deviation (RPD) of 2.93 under different moisture content. This study built a robust NIR calibration model which was robustified against the influence of the variations in moisture content on the wood density prediction. This technology may facilitate the expansion of potential applications of NIR spectroscopy in the paper and pulp industry.
木材基本密度是造纸原料木片的一项重要材性指标[1]。 在制浆生产中实时监控木片基本密度, 根据原料材性变化合理调整工艺参数, 有助于保证生产线稳定运行。 传统木材密度检测方法对实验条件要求严格、 测试周期长, 无法满足生产线快速批量检测的实际需求。 近红外光谱具有分析速度快、 非破坏性、 测样方式简单灵活等优势, 在木材材性无损检测领域应用前景广阔[2]。 Santos采用近红外技术实现对黑木相思木材基本密度的快速检测[3]。 Alves结合偏最小二乘回归算法建立了预测松木密度的近红外模型, 模型精度能够满足林木育种的应用要求[4]。 Li等通过小波变换优化光谱信号, 提升了近红外模型对榆木密度的预测性能[5]。 还有采用光谱预处理、 特征变量提取和信号采集方式等方面开展模型优化研究, 以提高近红外光谱预测木材密度的精准度和稳定性[6, 7, 8]。
尽管近红外技术检测木材密度的可行性和有效性已被广泛证实, 但这些研究通常是在木材样品水分条件一致的情况下建立密度预测模型。 在制浆造纸行业, 由于原料来源复杂, 采伐、 运输、 存储条件的不同会导致木片水分存在较大差异, 而近红外光谱对样品水分非常敏感, 水分变化引起的光谱差异会严重影响对木材密度的预测。 Fujimoto通过采集样品在不同水分条件下的光谱共同用于建立全局模型, 提高模型的稳健性[9]。 还可在不同水分区间分级独立建模, 调用与待测样品水分一致的模型进行密度预测, 避免水分差异对模型的干扰[10]。 但无论是全局建模还是分级建模, 都需要足够多的建模样品, 增加了模型使用和维护的难度。
外部参数正交化算法(external parameter orthogonalization, EPO)是一种基于正交投影变换的预处理方法, 通过将原始光谱投影到与干扰信息正交的空间中, 消除外部干扰因素的影响[11, 12]。 EPO算法已成功用于消除土壤水分变化对近红外预测有机碳含量的影响, 但在针对木材材性的近红外分析中尚未得到有效应用[13, 14]。 本工作以杨木为研究对象, 探究了水分条件差异对近红外预测木片基本密度的影响。 采用近红外光谱结合主成分分析对木片失水全过程进行解析, 并结合EPO算法计算水分校正因子, 去除光谱中的水分干扰因素, 最终建立抗水分干扰的稳健型基本密度预测模型。
107速生杨木采自山东省济南市(东经116° 68', 北纬36° 58'), 树龄9年, 平均胸径35 cm。 将杨木试材剥皮后加工成2 cm(纵向)× 2 cm(弦向)× 0.5 cm(径向)木片样品, 共计77个。 首先将所有样品在105 ℃下完全干燥, 记录木片绝干质量W0(kg), 然后将样品在水中浸泡至饱和, 采用排水法测定木片饱水体积V(m3), 木片基本密度B(kg· m-3)为木片绝干质量和饱水体积的比值。
所有样品按照基本密度从小到大排列, 通过间隔取样共挑选17个样品作为EPO水分校正集。 采用Kennard-Stone算法从剩余样品中挑选45个作为训练集, 其余作为测试集。 各样品集统计信息见表1。
![]() | 表1 样品集基本密度统计信息 Table 1 Statistics of basic density of sample sets |
水分校正集: 将饱水木片放入烘箱, 在40 ℃下缓慢烘干并监测水分变化, 当木片水分每降低5%时采集一次近红外光谱组成动态光谱集xm。 当木片水分不再变化, 将烘箱温度升至105 ℃彻底烘干木片并采集绝干木片光谱x0, 最后共采集238条光谱(17个样× 14次)。 木片水分变化情况如图1所示。
训练集和测试集: 将饱水木片在恒温恒湿条件下(23 ℃, 50%RH)自然风干, 风干过程中每间隔一定时间采集一次木片近红外光谱并记录水分含量, 共采集360条光谱(60个样× 6次)。 木片风干时间和水分信息见表2。
![]() | 表2 不同水分条件木片样品制备 Table 2 Preparing process of wood chips with different moisture contents |
使用配备卤素灯光源和光纤探头的光栅光谱仪(NIR2500, 上海复享光学股份有限公司)采集木片近红外光谱, 光谱仪波长范围900~2 500 nm, 波长分辨率为6.3 nm。 采集光谱时, 调整探头距木片表面4 mm, 设置积分时间80 ms, 扫描次数16次, 在木片样品表面随机选择10个测量点采集漫反射信号, 然后取平均值作为该样品原始近红外光谱。
由于原始光谱两端存在严重的噪音和杂散光干扰, 截取1 100~2 300 nm波段用于数据分析。 对光谱进行Savitzky-Golay 卷积平滑、 标准正态变换和一阶导数处理, 以消除基线漂移和表面散射影响。 计算水分校正集的动态差异光谱集D={
采用EPO算法校正光谱中水分变化信息, 建立EPO-PLS模型, 消除木片水分变化对预测木片密度的影响。 根据EPO算法理论, 原始光谱矩阵X(m× n)可以表示为
式(1)中, P(n× n)代表有用信息投影矩阵, 即水分校正因子, Q(n× n)代表干扰信息投影矩阵, R(m× n)为残差矩阵, m是样本数, n是波长点数。
本研究采用水分校正集的失水全过程动态差异光谱集D计算水分校正因子P。
(1)对D的协方差矩阵进行奇异值分解
式(2)中, U(n× n)是左奇异矩阵, S(n× m)是奇异值对角矩阵, V(m× m)是右奇异矩阵。
(2)确定EPO因子数g, 获取V的前g列子矩阵V(m× g), 计算干扰信息投影矩阵Q=Vg
(3)计算水分校正因子P=I-Q, I是单位矩阵[12]。
(4)对不同水分条件下采集的训练集光谱C和测试集光谱T进行水分校正, C* =CP, T* =TP。 采用校正光谱建立EPO-PLS基本密度预测模型, EPO因子数g和PLS潜变量数Lvs通过留一交叉验证法进行优化。
木材水分包括自由水和结合水, 其中自由水以液态形式存在于细胞腔中, 而结合水则存在于细胞壁中, 并与细胞壁无定形区中的羟基形成“ 氢键结合” 。 图2(a)是水分校正集样品失水过程原始动态光谱, 随着木片中水分的离去, 所有波长的吸收率呈整体减弱趋势。 对光谱进行预处理后, 基线漂移和谱峰重叠现象得到有效改善, 水分子的OH倍频特征吸收波段(1 850~2 150 nm)发生规律性变化。 随着木片水分降低, 2 100 nm处的特征峰逐渐增强。 由图2(b)可知, 水分变化引起的光谱差异主要集中在1 850~2 150 nm波段, 提取该波段数据进行主成分分析, 结果如图3(a, b, c)所示。 第一主成分得分与水分呈线性相关, 载荷特征峰出现在1 920、 1 980和2 050 nm, 分别对应自由水、 弱氢键结合水和强氢键结合水, 表明第一主成分主要代表木片水分含量的整体变化[15][见图3(a)]。 第二主成分得分随木片失水过程呈现先减小后增大趋势[见图3(b)], 其载荷图[见图3(c)]与结合水相关的特征峰明显强于自由水的峰, 表明第二主成分包含了木材与水的相互作用信息。 根据图3可将木片失水过程分为两个阶段, 第一阶段以自由水离去为主, 第二阶段随着氢键结合被破坏, 束缚在细胞壁中的结合水开始离去, 而失水过程的拐点(30%左右)可用于表征纤维饱和点。 当木材水分高于纤维饱和点时, 水分变化对木材材性影响不大, 低于纤维饱和点时, 木材随水分含量的减少而收缩, 并引起物理力学性能的变化[16]。
不同水分条件下建立的基本密度预测模型性能如表3所示。 由于饱水木片最接近木片基本密度实测时的状态, 在此条件下建立的模型M1表现出最好的预测精度, 对测试集的预测均方根误差(RMSEP) 为11.49 kg· m-3, 决定系数
![]() | 表3 不同水分条件下基本密度预测模型的性能 Table 3 Performances of predictive models for wood density under different moisture content conditions |
采用水分校正集的动态差异光谱D计算EPO水分校正因子P, 对饱水木片光谱进行水分校正, 建立EPO-PLS模型, 此外还采用不同水分条件的木片光谱共同建立全局模型作为对照。 图5展示了EPO因子数g和潜变量数Lvs的优化过程。 当g< 3时, 预测精度没有显著变化, 表明此时光谱中的水分干扰信息被扣除并未影响模型预测性能, 最终确定模型g=2, Lvs=3为最优建模参数。
![]() | 图5 不同g和Lvs组合下的模型交叉验证均方根误差图Fig.5 The root mean square error of cross validation from digferent combinations of g and Lvs |
图6(a, b)为EPO水分校正的效果图。 与校正前相比, 1 900~2 100 nm波段水分变化引起的光谱差异被有效消除, 同时在1 500~1 800 nm波段显现出更多特征吸收信息。 EPO-PLS模型的预测性能在表4中列出, 模型表现出与校正水分前相似的交叉验证均方根误差和决定系数, 这表明虽然木片饱水光谱更有利于建模, 但光谱中大量水分特征吸收对预测木片密度是冗余无用的, 有用信息主要来自近红外光与木片纤维结构相互作用所加载的信息。 如图7所示, 不同水分条件下的测试集样品光谱在经水分校正后, 均能够被EPO-PLS模型准确预测, 没有出现显著偏差, RMSEP为12.23 kg· m-3, 决定系数
![]() | 表4 水分校正后基本密度预测模型的性能 Table 4 Performances of predictive models for wood density after moisture content correction |
随机抽取不同数量样品计算水分校正因子, 并建立EPO-PLS模型, 每次取样重复10次, 统计模型RMSEP和
通过对造纸木片失水过程近红外光谱动态监测, 揭示了木片水分中自由水和结合水的变化规律。 通过对不同木片水分条件下建立的基本密度预测模型的性能对比, 发现饱水木
片光谱建立的模型具有最好的预测性能, 但过高的水分含量会导致光谱中无用信息冗余, 对样品水分变化的高敏感度严重影响模型稳定性。 采用EPO算法进行光谱水分校正, 能够在保留光谱中木片密度相关信息的同时, 有效消除水分干扰信息, 建立稳健型的EPO-PLS预测模型。 该模型对样品水分变化具有较强抗干扰能力, 对不同水分含量的样品均表现出较好的预测精度和稳定性, 适用于制浆生产过程中在复杂环境下对原料基本密度的快速检测。
[1] |
|
[2] |
|
[3] |
|
[4] |
|
[5] |
|
[6] |
|
[7] |
|
[8] |
|
[9] |
|
[10] |
|
[11] |
|
[12] |
|
[13] |
|
[14] |
|
[15] |
|
[16] |
|