基于波长选择的纸页厚度太赫兹时域光谱检测新方法
曹丙花1, 王伟1,*, 范孟豹2, 韦忠亮3
1. 中国矿业大学信息与控制工程学院, 江苏 徐州 221116
2. 中国矿业大学机电工程学院, 江苏 徐州 221116
3. 安徽理工大学计算机科学与工程学院, 安徽 淮南 230001
*通讯联系人 e-mail: wangweihao@cumt.edu.cn

作者简介: 曹丙花, 1981年生, 中国矿业大学信息与控制工程学院副教授 e-mail: caobinghua@cumt.edu.cn

摘要

光谱数据的波长选择是太赫兹光谱定量分析的关键。 以纸页厚度检测为例, 提出了一种基于波长选择的纸页厚度太赫兹相位谱检测新方法。 首先采用离散离子群算法进行太赫兹相位信号优选, 并应用偏最小二乘法建立纸页厚度定量模型, 以模型的预测均方根误差作为太赫兹相位信号优选的评价标准, 选择出预测效果最优的太赫兹相位信号, 进行纸页厚度预测。 最后将本文方法的预测结果与采用全谱和单频相位信号的预测结果进行比较, 结果表明, 提出的方法预测结果最好。

关键词: 太赫兹时域光谱; 波长选择; 纸页厚度; 粒子群算法; 偏最小二乘
中图分类号:O433;TS77 文献标识码:A
Wavelength Selective Terahertz Time-Domain Spectroscopy for Paper Thickness Measurement
CAO Bing-hua1, WANG Wei1,*, FAN Meng-bao2, WEI Zhong-liang3
1. School of Information and Control Engineering, China University of Mining and Technology, Xuzhou 221116, China
2. School of Mechatronic Engineering, China University of Mining and Technology, Xuzhou 221116, China
3. School of Computer Science and Engineering, Anhui University of Science and Technology, Huaian 230001, China
Abstract

Wavelength selection of spectra plays an important role in the quantitative analysis of terahertz spectroscopy. In this paper, a new method for quantitative measurement of paper sheet thickness is presented based on wavelength selection of terahertz phase spectra. Besides, binary particle swarm optimization (BPSO) algorithm is applied in wavelength selection of terahertz phase spectra and partial least square (PLS) algorithm is employed to establish the quantitative analysis model of paper sheet thickness. In addition, the root mean square error of prediction (RMSEP) is analyzed to show the performance of the method. Finally, the prediction error of the method is compared with both the methods using the raw spectra and the method using a single wavelength of the spectra. The results show that the method of this paper gives the most satisfactory quantitative accuracy.

Key words: Terahertz time-domain spectroscopy; Wavelength selection; Paper thickness; Binary particle swarm optimization; Partial least squares
引 言

纸页厚度是表征纸产品质量的重要指标[1]。 目前, β 射线计是一种广泛应用于造纸工业中测量纸页厚度的方法, 其工作原理是根据β 射线照射在纸页上的衰减情况测量纸页厚度值。 X射线传感器是另一种测量方法, 它广泛应用于纸页的涂层定量检测[2]。 然而X射线和β 射线存在电离辐射, 对人体安全造成影响。 空气耦合超声传感器[3]是一种非接触、 安全的解决方案, 但它需要很强大的脉冲激励, 这限制了该传感器的普及应用。 因此非接触、 快速、 安全可靠的纸页厚度定量检测仍然是一个需要解决的问题。

太赫兹(1 THz=1012 Hz)波是指位于微波和红外线之间的电磁波, 在电磁波频谱中占有特殊的位置。 太赫兹波没有电离效应, 对人体不造成影响, 且太赫兹波可以透过很多非导电材料。 太赫兹时域光谱(THz-TDS)技术是近年来发展起来的一种新型光谱检测技术。 THz-TDS技术采用电光采样方法, 可以同时获取THz波的幅值和相位信息; THz-TDS技术还具有信噪比高、 检测快速等特点, 目前已在很多领域得到了广泛应用[4, 5]。 在参数检测方面, Stoik等[6]应用时域峰值和峰值时间进行航空复合材料的缺陷检测。 我们研究组[7]应用时域峰值和延迟时间做纸页定量检测。 文献[8, 9]则应用太赫兹波形的延迟时间进行材料厚度检测。 然而时域特征易受噪声影响, 而频域相位谱则具有较好的抗噪声性能[10], 预测效果优于时域特征, 尤其对于弱吸收物质的参数确定[11, 12]

在文献[7]和文献[10]中, 我们研究了应用太赫兹波进行纸页定量检测的可行性以及特征选择的重要性。 文献[7]应用时域的信号峰值和峰值延迟时间进行纸页定量检测, 结果表明基于延迟时间的测量精度远高于信号峰值的方法, 然而时域特征易受噪声影响。 因此文献[10]又提出了采用频域相移作为数据特征进行纸页定量检测的方法, 选择最优频率并利用线性回归建立纸页定量检测模型, 结果表明基于相移谱方法的测量精度和稳健性均优于基于时域特征的方法。 然而选择单个频率将丢失大量有用信息, 而采用全谱的太赫兹相位数据进行建模则数据量较大、 计算时间长, 且将噪声、 测量误差和环境误差等因素引入到定量分析模型, 因此对太赫兹相位谱进行波长选择, 选取性能好的相位谱信息, 将进一步提高定量分析的准确性。

波长选择, 也称作频率选择。 常用的方法有以偏最小二乘为核心的方法, 如常规区间偏最小二乘(iPLS)、 联合区间偏最小二乘(siPLS)、 向后区间偏最小二乘(biPLS)等, 基于多元线性回归校正进行频率选择[13, 14], 然而实际测量中, 光谱数据与物质参数之间往往存在非线性。 基于智能优化算法的波长选择方法, 通过构建目标函数进行频率选择, 目的在于寻找频率变量的最佳组合。 离散粒子群算法(BPSO)具有计算效率高、 收敛快且能避免陷入局部最优值的特点[15], 因此, 本文将采用离散粒子群算法(BPSO)和偏最小二乘法(PLS)相结合的方法, 分析纸页的太赫兹相位谱, 准确预测纸页的厚度。

1 实验部分
1.1 原理

利用由美国Coherent公司的Vitess-800-5型钛蓝宝石飞秒激光器和美国Zomega公司的ModelZ-1型THz-TDS系统[10] , 分别测量无纸页和有纸页的THz信号, 并分别作为参考信号和样品信号, 经傅里叶变换(FFT)后得到THz相位谱, 再将参考信号和样品信号的THz相位谱作差得到纸页的THz相移谱, 然后采用粒子群算法分析纸页的THz相移谱, 选出最优的频率组合, 最后利用最优频率的THz相移谱建立关于纸页厚度的PLS预测模型以预测纸页厚度。

图1 纸页相移数据处理分析流程图Fig.1 Phase shift of paper data processing flow chart analysis

1.2 样品制备

实验样品选择160 g· m-2的办公打印纸。 选用8组不同厚度的纸页作为样品, 并标号1, 2, 3, 4, 5, 6, 7, 8。 每组纸页样品的厚度都用螺旋测微器测量5次, 将5次测得的厚度取平均值, 则该值作为每组纸页样品的厚度真实值, 则8组纸页样品的厚度值如表1所示。 在测量之前, 将纸页样品置于干燥箱中6~8小时, 以确保样品中的水分蒸发, 以消除水分分布不均匀的影响。

表1 纸页厚度 Table 1 Paper thickness
1.3 BPSO-PLS模型

1.3.1 基于BPSO的THz光谱频率筛选

离散粒子群算法为二进制粒子群, 假设搜索空间为d维、 粒子总数为h个, 种群X=(x1, x2, …, xh), 其中第i个粒子的位置为xi=(xi1, xi2, …, xid); 第i个粒子的速度表示为vi=(vi1, vi2, …, vid); 第i个粒子迄今为止搜索到的最优位置即个体最优位置为Pi=(pi1, pi2, …, pid); Pg=(pg1, pg2, …, pgd)表示整个粒子群的全局最优值, 将每一维的xik, pik, pgk限制为0或者1, 其中k=1, …, d, i=1, …, h。 速度vik定义了粒子的每个位置赋值为1的概率, 粒子的速度通过Sigmoid函数约束到区间[0, 1]上。 位置xik的更新为

xikt+1=1 rand()< Sigmoid(xikt+1)xikt+1=0 rand()Sigmoid(xikt+1)(1)

式中: t是迭代次数, rand()是每次迭代中随机产生的均匀分布在区间[0, 1]里的随机数, Sigmoid函数定义为

Sigmoid(vikt)=0.98vikt> Vmax11+e-viktVmax< vikt< Vmax-0.98vikt< Vmax(2)

基于粒子群算法的频率选择采用二进制编码方式。 每个粒子长度等于全部的频率点数, 每个粒子对应一个二进制码, 其中数值1表示所对应的频率被选中, 而数值0表示对应的频率未被选中。 本次实验全部光谱为115个, 即粒子的长度是115个的0和1的字符串组合而成的。 经BPSO筛选出的相位信息建立关于纸页厚度的PLS[13]的定量模型, THz光谱定量模型的优劣由模型的预测均方根误差(root mean error prediction, RMSEP)评价, 其定义如下

RMSEP=j=1n(yjp-yjr)2n(3)

其中, n为样本数, yjp为第j个样本的预测值, yjr为第j个样本的真实值。 粒子群算法中的优化目标为适应度函数最小化, 因此适应度函数fitness即为RMSEP。

1.3.2 BPSO-PLS算法流程

在BPSO寻优过程中, 每个粒子的位置不断改变, 所得到对应的频率子集随之变化。 初始化粒子群, 设置相关参数如下: 粒子数目为40, 粒子群维数为115, 惯性权重因子为1, 学习因子c1=c2=2.1, 最大迭代次数为40次。 则产生40× 115随机的二进制数组, 进行THz光谱频率筛选, 用筛选出的频率所对应的THz相移光谱数据作为自变量U, 纸页样品厚度作为因变量V建立PLS模型, 并更新粒子的适应度值fitness、 个体极值和群体极值, 循环迭代直到达到最大迭代次数或达到实验精度循环结束。 选择群体极值, 构建纸页厚度的最佳偏最小二乘模型, 并输出纸页的预测厚度。 BPSO-PLS算法的整体流程如图2所示。

图2 BPSO-PLS算法流程图Fig.2 BPSO-PLS flow chart

2 结果与讨论

将上述8组制备的样品置于THz-TDS系统中, 测得的THz时域信号进行相移处理, 处理后的相位差信号如图3所示。 在0~0.5 THz范围内, 相邻两个纸页样品的相位差间距很小; 在0.5~1.6 THz范围内, 纸页样品的相位差间距随频率增加而逐渐增大, 则样品信号在该频率范围内特征明显。

图3 太赫兹相位差光谱图Fig.3 THz phase shift spectrum

在PLS建模过程中, 不同的主成分数影响着模型的稳定性。 主成分数过多, 容易将其他噪声信号和有用信号一起被拟合, 导致过拟合; 相反, 主成分数过少, 提取的有用信号较少, 不能完全表征信息的完整性, 导致欠拟合。 所以需要选取恰当的主成分数, 既能删除无用的噪声信号, 同时也能有效利用THz光谱信息[16]。 通过BPSO算法筛选频率, 将选出的频率作为已知量, 主成分个数作为未知量, 根据fitness的值来选取建模的最佳主成分数。 选取1~12个主成分数, 依次计算其fitness值, 如图4所示。 当主成分数为6时, fitness值最小, 故选主成分数为6。

图4 适应度值fitness和主成分个数关系图Fig.4 The relationship between the fitness value and the number of principal components

经过BPSO优化, 粒子的适应度值在第14次迭代后趋于稳定, 其适应度值为0.003 6。 此时粒子收敛, 找到全局最优值, 共筛选出0.581, 0.856, 0.929, 1.161, 1.248, 1.456, 1.485和1.569 THz共8个最优频率。 以样品重量为160 g, 厚度为0.618 mm为例, 通过BPSO筛选出的频率如图3中的蓝点所示。 依次对8个频率所对应的相移信号进行线性回归, 建立8个单频的纸页厚度预测模型, 第j组纸页样品的预测误差yjerro

yjerro=yjp-yjryjr(4)

其中yp为第j组纸页样品的预测厚度, yr为第j组纸页样品的真实厚度, j=1, …, 8。

对于不同的纸页样品而言, 每个频率所对应的预测误差如图5所示。 从图中可以看出, 8个单频预测纸页厚度的预测误差波动较大, 尤其是纸页样品1和2的预测误差最大。 对于同一纸页样品, 经BPSO算法筛选出的各个频率的预测误差值正负相互抵消, 降低了单频预测纸页厚度时的不确定性, 同时充分利用THz光谱中的有用信号, 有效的提高对纸页样品的预测能力。 对于纸页样品1和2而言, 其纸页厚度yr较小, 则纸页的预测误差大。

图5 8组选择频率的预测误差Fig.5 8 each group choose frequency prediction error

经BPSO-PLS算法输出的纸页预测厚度与纸页的真实厚度如表2所示。

表2 8组纸页的预测厚度值和真实厚度值对比 Table 2 Comparison of the predicted and real thickness value of 8 groups of paper

纸张真实厚度和预测厚度基本一致, 绝对误差在0.9%以内。 将通过BPSO-PLS算法进行频率选择得到的纸页预测误差, 与未进行频率选择的全谱数据得到的纸页预测误差进行比较, 频率选择得到的预测精度更小, 得到的预测值更加准确, 将进行频率选择的预测值与文献[10]中的最优单频0.087 THz预测的纸页厚度进行比较, 得到同样的结论。 且进行频率选择的BPSO-PLS算法得到的纸页预测误差最小, 单频的预测误差最大, 全谱的预测结果介于两者之间。

图6 三种测量纸页厚度的方法对比Fig.6 Comparison of three methods of measuring the thickness of the paper

3 结 论

采用THz-TDS技术获取纸页的相位谱信号, 并应用BPSO-PLS算法建立纸页厚度的定量检测模型, 预测误差在0.9%以内, RMSEP为0.003 6。 最后将预测结果与全光谱条件下PLS算法以及单个频率的线性拟合的预测结果进行比较, 结果表明, BPSO-PLS算法能有效的筛选出光谱频率, 且能更精确地测定纸页厚度, 为纸页厚度的测量提供了一种新的思路。

The authors have declared that no competing interests exist.

参考文献
[1] Sharma C, Jain A. Bulletin of Electrical Engineering and Informatics, 2016, 5(1): 62. [本文引用:1]
[2] Belotserkovsky E, Dahlquist J A, Alto P. United States Patent, 6074483, 2000. [本文引用:1]
[3] Stor-Pellinen J, Hæggström E, Karppinen T, et al. Measurement Science and Technology, 2001, 12: 1336. [本文引用:1]
[4] PAN Zhao, ZHENG Xiao-kang, WANG Yu-tian, et al(潘钊, 郑晓康, 王玉田). Acta Optica Sinica(光学学报), 2015, 35(a01): 145. [本文引用:1]
[5] SHEN Xiao-chen, LI Bin, LI Xia, et al(沈晓晨, 李斌, 李霞, ). Transactions of the Chinese Society of Agricultural Engineering(农业工程学报), 2017, 33(s1): 288. [本文引用:1]
[6] Stoik C D, Bohn M J, Blackshire J L. Optics Express, 2008, 16(21): 17039. [本文引用:1]
[7] CAO Bing-hua, ZHANG Guang-xin, ZHOU Ze-kui(曹丙花, 张光新, 周泽魁). Journal of Infrared & Millimeter Waves(红外与毫米波学报), 2009, 28(4): 241. [本文引用:3]
[8] Yasui T, Yasuda T, Sawanaka K I, et al. Applied. Optics, 2005, 44(32): 6849. [本文引用:1]
[9] Palka N, Panowicz R, Chalimoniuk M, et al. Composites Part B-Engineering, 2016, 92: 315. [本文引用:1]
[10] Cao B H, Fan M B, Tian G Y, et al. Journal of Sensors, 2017, 3520967: 1. [本文引用:5]
[11] Pohl A, Deßmann N, Dutzi K, et al. Journal of Infrared Millimeter and Terahertz Waves, 2016, 37: 175. [本文引用:1]
[12] Wang Y X, Zhao Z R, Chen Z Q, et al. Applied Optics, 2011, 50(35): 6452. [本文引用:1]
[13] CHEN Tao, LI Zhi, MO Wei, et al(陈涛, 李智, 莫玮, ). Spectroscopy and Spectral Analysis(光谱学与光谱分析), 2014, 34(12): 3241. [本文引用:2]
[14] SHI Ji-yong, ZOU Xiao-bo, ZHAO Jie-wen, et al(石吉勇, 邹小波, 赵杰文, ). Journal of Infrared & Millimeter Waves(红外与毫米波学报), 2011, 30(5): 458. [本文引用:1]
[15] Kesharaju M, Nagarajah R. Journal of Ultrasonics, 2016, 75: 124. [本文引用:1]
[16] Xie J, Pan T, Chen J M, et al. Chinese Journal of Analytical Chemistry, 2010, 38(3): 342. [本文引用:1]