作者简介: 曾 心, 2000年生,西安交通大学电气工程学院硕士研究生 e-mail: Zengxin@stu.xjtu.edu.cn
针对光学游标传感器输出解调难的问题, 提出基于双向长短时记忆(Bi-LSTM)网络的光谱数据预测技术。 利用Bi-LSTM网络对数据序列的预测能力, 实现了宽光谱范围的光谱数据预测, 从而解决了游标传感器由于工作光谱范围有限的光源或光谱扫描技术, 而导致游标传感器难以实现输出解调的技术难题。 采用该方法, 只要采集有限波长范围的传感器输出光谱, 利用训练好的Bi-LSTM模型就能够在较宽的波长范围内准确预测传感器输出光谱的包络曲线, 从而极大降低了对游标传感器工作光谱范围的技术要求。 介绍了Bi-LSTM网络用于游标传感器输出解调的基本原理和实现过程, 实验证明了该方法对游标传感器输出光谱数据预测的准确性, 其预测曲线与实际光谱包络在波峰处的波长最大误差~0.02 nm, 幅值最大误差仅为0.058%。 验证了Bi-LSTM网络对具有不同包络周期的游标传感器输出解调的泛化性, 针对不同包络周期的游标传感器输出光谱, 其最大预测误差为0.02 nm, 最大均方根误差(RMSE)为9.72×10-5, 证明了所训练的Bi-LSTM网络对不同包络周期的游标传感器输出光谱都具有准确的“预测性”和“跟踪度”。 研究表明, 实际工作中只要光源的波长范围能够覆盖游标传感器的1/2个光谱包络周期(绝大多数情况下可以满足), 利用Bi-LSTM网络能够在宽光谱范围内, 实现对传感器输出光谱的准确预测, 从而极大降低了对游标传感器的工作光源(或其他光谱扫描技术)的光谱范围的要求。 本研究解决了游标传感器的输出解调光谱范围过宽的难题, 具有理论及实际应用意义。
To solve the problem of output demodulation of optical vernier sensors, this paper proposes a spectral data prediction technology based on a bidirectional long short-term memory (Bi-LSTM) network. By utilizing the predictive ability of the Bi-LSTM network for data sequences, a wide spectral range of spectral data prediction has been achieved, thus solving the technical problem of cursor sensors having difficulty achieving output demodulation due to the limited working spectral range of light sources or spectral scanning techniques.By using this method, as long as a limited wavelength range of sensor output spectra is collected, the trained Bi-LSTM model can accurately predict the envelope curve of the sensor output spectra over a wide wavelength range, greatly reducing the technical requirements for the working spectral range of the vernier sensor.The paper introduces the basic principle and implementation process of the Bi-LSTM network for output demodulation of vernier sensors. The experiment proves the accuracy of this method in predicting the spectral data output of vernier sensors. The maximum wavelength error between the predicted curve and the actual spectral envelope at the peak is about 0.02 nm, and the maximum amplitude error is only 0.058%. In addition, the paper also verified the generalization of the Bi-LSTM network for demodulating the output spectra of cursor sensors with different envelope periods. For the output spectra of cursor sensors with different envelope periods, the maximum prediction error was 0.02 nm, and the maximum root mean square error (RMSE) was 9.72×10-5, proving that the trained Bi-LSTM network has accurate “predictability” and “tracking” for the output spectra of cursor sensors with different envelope periods. Comprehensive research papers have shown that in practice, as long as the wavelength range of the working light source can cover half of the spectral envelope period of the vernier sensor (which can be met in most cases), the Bi-LSTM network can accurately predict the output spectrum of the sensor over a wide spectral range, greatly reducing the requirement for the spectral range of the working light source (or other spectral scanning techniques) of the vernier sensor. The paper has solved the problem of the output demodulation spectrum range of the cursor sensor being too wide and has theoretical and practical significance for application.
借鉴传统游标卡尺的工作原理, 研究人员将游标效应的高精度测量原理应用到光纤传感领域, 以达到增敏的效果[1][2]。 其原理为: 将两个自由光谱范围(free spectral range, FSR)相近而不同的干涉型传感器进行级联或者并联, 产生的叠加光谱为带有低频包络的周期性光谱。 当被测量变化引起其中一个传感器输出光谱产生微小移动时, 叠加光谱中的“ 游标包络” 会发生几倍甚至几十倍的移动变化[3, 4, 5, 6], 通过追踪游标包络移动可以实现对目标的高灵敏度、 高精度、 高分辨率测量。 因此, 近年来游标效应传感器的设计受到研究人员的广泛关注[7]。
目前, 国内外关于游标效应传感器的设计方法已有大量的文献报道, 但是关于游标效应传感器输出解调方法依旧是难点问题, 相关的研究报道很少[8]。 一般而言, 具有游标效应的双传感器输出叠加光谱包络的周期相对于单个传感器的FSR比值越大, 传感器的增敏效果越显著[9]。 但过大的光谱包络周期, 会超出系统中光源、 光谱仪或其他光谱扫描技术的工作光谱范围, 无法观测到一个完整的光谱包络, 难以通过跟踪包络的方法对目标进行测量[10, 11]。 目前人们常用的方法是采用超宽带连续光源及超宽光谱范围的光谱仪或超宽光谱扫描技术, 以获取至少一个周期的完整光谱包络, 但这会显著增加系统设计复杂性和硬件成本[12, 13], 除此以外, 并未见更有效解调方法的研究报道。 因此, 光学游标传感器输出解调问题极大限制了光学游标传感器的实际应用。
长短期记忆网络(long short-term memory networks, LSTM)是循环神经网络(recurrent neural networks, RNN)的一种改进模型[14]。 它通过引入遗忘门、 输入门和输出门等三个门控机制, 有效克服了在长时段大样本情况下RNN易产生的长期依赖性问题, 在长序列数据处理方面展现出更强的模型表达能力和对下一时刻信息的预测精度[15, 16]。 目前, 已有文献报道将LSTM网络应用于各种数据预测的应用中。 Yu等利用LSTM技术实现了双向宽范围的光纤传感器曲率测量, 摆脱了自由光谱范围的约束, 减少对硬件设备的要求[17]。 Gustavo Rossi Martins等利用双向长短时记忆(bidirectional long short-term memory, Bi-LSTM)预测了通过13米非线性光纤的短光脉冲的时间和光谱演变, 在时域和谱域的RMSE分别达到了0.004和0.012[18]; Li将序列-序列算法与LSTM结合, 提出一种有效的大气光学湍流预报方法, 能有效消除时间延迟并充分利用长期信息的预测模型进行最终预测[19]。
针对光学游标传感器输出解调问题, 本文提出一种基于双向长短时记忆(Bi-LSTM)网络的光学游标传感器输出解调方法: 将观测到的传感器有限长光谱数据输入到Bi-LSTM网络中, 利用Bi-LSTM网络对数据序列的预测、 跟踪能力, 实现光谱数据在更宽光谱范围的“ 数据预测” , 进而实现游标传感器的输出解调。 本文介绍了基于Bi-LSTM网络的游标传感器输出解调原理, 实验证明了Bi-LSTM网络对游标传感器输出光谱数据预测的准确性和有效性, 基于Bi-LSTM网络的光谱数据预测法为游标传感器提供了一种稳定、 便捷而新颖的输出解调方法。
假设组成游标的传感和参考干涉仪的自由光谱范围FSR分别为Fs和Fr, 可以推导出两个干涉仪并联后产生的叠加光谱包络的自由光谱范围Fo为
当传感干涉仪的光谱随着被测量变化产生移动时, 包络也会产生偏移, 且移动量是传感干涉仪光谱移动的M倍
由式(1)、 式(2)可知, 传感和参考干涉仪的FSR越接近, 叠加光谱的包络的FSR就越大, 包络的移动量相对于传感干涉仪的光谱移动量的放大倍数也越高, 游标效应就越显著。
将两个FSR分别为4.08和3.78 nm的传感、 参考光纤干涉仪并联, 仿真获得并联结构的输出光谱如图1所示。
图1中, 光谱包括“ 精细光谱” 和“ 包络光谱” 两部分的叠加。 其中包络的周期为~45.19 nm。 当其中传感干涉仪发生~2.0 nm的移动时, 光谱的包络移动范围为~27.2 nm, 包络移动幅度相比于传感干涉仪的光谱移动幅度放大了~13.6倍。 但当包络周期较长时, 由于受限于光源、 光谱仪有限的工作光谱范围, 利用传统的光谱测量法很难准确跟踪光谱包络完整的移动变化。 因此, 如何利用有限的光谱数据获得光谱包络移动信息的准确跟踪与观测, 显得尤为重要。
(1)LSTM网络
LSTM的核心是通过引入遗忘门、 输入门和输出门来控制细胞状态, 从而有效捕捉长时间序列特征之间的相关性, 通过将光谱包络波长上一波段特征信息传递给下一波段, 可有效掌握不同波段光谱包络序列特征[20]。 其工作过程简述如下:
假设训练集时间序列数据为Xt(t=1, 2, …, N), LSTM网络模型则将会产生N个Cell单元, Cell结构运行过程如图2所示。 t时刻的输入样本Xt与上一时刻(t-1)的预测结果ht-1作为t时刻输入值, 进入遗忘门, 其输出ft为
式(3)中: Wf为遗忘门的输出权重矩阵, bf为偏置项。
Xt同时输入输入门和输出门, Wi、 Wo分别为输入门和输出门的权重矩阵。 输入门it、 输出门ot分别为
式中, bi、 bo为偏置项。
最终, t时刻Cell单元的输出ht由输出门ot与Cell单元状态ci共同决定, 即
综上, 每个时刻Cell模型的输出ht不仅作为当前时刻的预测值, 同时还对当前时刻Cell的状态Ct进行了记录, 并连同下一时刻(t+1)数据Xt+1作为下一个Cell的输入, 并对其进行训练。 如此持续下去, 直至N个时间序列数据训练并建立N个Cell, 这样就完成了一次训练过程。
目前常用的训练效果评估指标有: 决定系数(R2)、 均方根误差(RMSE)、 平均相对误差(MRE)以及平均绝对误差(MAE)等。 RMSE作为神经网络的典型损失函数, 不仅能定义网络性能, 还能间接表征LSTM预测数据的离散程度和稳定性, 因此采用RMSE作为评估指标, 其值越小说明预测越准确、 误差越小, RMSE的计算方法为
$E_{\mathrm{RMSE}}=\sqrt{\frac{1}{N} \sum_{i=1}^{N}\left(P_{i}-T_{i}\right)^{2}}$(7)
式(7)中, Ti表示真实数据(即采集数据), Pi表示预测数据, N为光谱采样点, i为第i时刻光谱数据。
当RMSE指标达到预期值时停止训练, 否则适当增大训练次数直至RMSE达到预期值则训练结束。
(2)Bi-LSTM网络
Bi-LSTM网络是LSTM网络的改进, 它由分别以正序和逆序输入的两个LSTM网络组合而成, 其输出向量为两个LSTM输出的拼接。 Bi-LSTM的结构模型如图3所示。
Bi-LSTM联合输出ht公式如式(8)— 式(10)
式(8)— 式(10)中,
相较于LSTM, Bi-LSTM可以同时正向和逆向地提取时间序列信息, 因此获得的特征数据同时拥有过去和将来的信息, 从而会对时间序列数据获得更准确的预测结果。
利用Bi-LSTM网络实现游标传感器输出光谱数据预测的过程如下:
(1) 网络构建: 设置Bi-LSTM层数, 每两层Bi-LSTM细胞单元数量等网络模型参数;
(2) 网络训练: 仿真生成不同特征的游标传感器光谱数据作为训练样本, 对Bi-LSTM网络进行训练。 设置初始训练次数, 当RMSE满足预期值时停止训练, 反之则适当增加训练次数直至满足需求。 若结果出现欠拟合或过拟合的情况, 则适当对Bi-LSTM层数及各层细胞单元数量进行相应增减;
(3) 光谱预测: 实际工作中, 采集传感器输出的光谱信号。 输入训练好的网络模型中, 利用训练获得的网络模型对其有限波长范围的输出光谱进行预测, 以获取更宽波长范围的光谱。
按1.3节所述过程, 首先构建网络模型: 本实验设置Bi-LSTM层数为六层, 每两层Bi-LSTM细胞单元数量分别为512、 256和128; 设置初始训练次数为8 000次; 初始学习率设置为0.005, 梯度下降算法为Adam算法。 模拟游标传感器光谱包络信号, 在MatLab软件上仿真生成具有不同包络周期的光谱数据训练, 包络周期的变化范围为10~40 nm、 周期变化的步长0.01 nm, 共生成3 000组数据。 为了提高模型的准确性和鲁棒性, 将这些数据打乱并作为训练集对Bi-LSTM网络进行训练, 以均方根误差RMSE作为网络训练的评估指标。 当RMSE< 0.001时可判断网络达到预期训练效果, 对网络停止训练, 否则调整训练次数, 继续训练网络。
(1)Bi-LSTM模型预测准确度的测试
网络训练完成后, 就可利用网络进行实际光谱数据的预测。 为了验证Bi-LSTM网络在光学游标效应传感及解调技术的有效性, 制备了两个FSR值近似相等的F-P腔, 其中一个对氢气敏感, 另一个则对氢气不敏感, 其自由光谱范围Fs和Fr分别为2.34和2.64 nm, 两个F-P腔级联形成一组具有游标效应的传感器, 其输出光谱图如图4所示。 由式(2)及图4所示实测数据可知: 两个F-P腔氢气传感器形成游标传感器后, 光谱的包络周期近似为单个F-P腔FSR的8倍, 即在同样浓度氢气作用下, 游标光谱包络的波长移动范围相比单个F-P腔氢气传感器的波长移动范围放大了~8倍, 即实现了传感器8倍的增敏。
将传感器置于1%氢气浓度中, 采用超连续谱光源(光谱范围1 450~1 550 nm, 武汉安扬激光技术股份有限公司生产, 型号: SC-5)激励传感器, 获得传感器在注入氢气前后, 输出光谱的变化如图5(a)所示。 图中可见, 注入氢气后, 光谱发生了蓝移。 为验证Bi-LSTM网络的有效性, 从图5(a)中截取1 450~1 460 nm窄波长范围内氢气注入后的光谱数据, 对其低通滤波获得光谱包络后, 进行去除基线漂移和数据归一化预处理并送入训练好的Bi-LSTM网络中, 对1 460~1 550 nm波长范围的包络光谱数据进行预测, 预测结果进行反归一化、 中心线补偿等处理。 处理结果与原始光谱包络曲线对比显示在图6中。 从该图中可以看到, 预测的光谱包络曲线与原始光谱包络曲线具有很好的吻合性。
![]() | 图6 Bi-LSTM网络对传感器光谱包络数据的预测Fig.6 Prediction of the spectral envelope data of the sensor by the Bi-LSTM network |
进一步地, 提取图6中Bi-LSTM网络预测的光谱包络波峰值与实际光谱包络的波峰值并计算误差, 结果列于表1中。 由图6及表1可以看出:
![]() | 表1 包络光谱波峰值的预测误差 Table 1 Prediction error of envelope spectral wave peaks |
① 在波长方面, 由Bi-LSTM网络预测的包络峰值波长与实际值误差极小, 只是随着预测数据序列的增长, 在第5个波峰(1 544.74 nm)处出现0.02 nm的误差; 在幅值方面, 随着预测数据序列的增长, 波峰处的幅值误差逐渐增大, 最大误差也同样出现在第5个波峰处, 但误差仅为0.058%。 实际中, 只要能够预测出大于1个包络周期的光谱数据, 就能够满足游标传感器的解调要求, 即解调过程中只关注峰值波长的预测误差, 幅值误差并不影响解调结果, 可以忽略;
② 由于游标传感器输出光谱中包络的变化幅度要远大于组成游标的单个传感器的光谱的变化幅度[见式(1)], 因此微小的光谱包络数据的预测误差所导致对被测目标的误差很小。 本实验中游标传感器放大倍数M为~8, 根据式(1)可以计算出, 当预测数据加长后, 在第5个预测包络峰值处, 产生0.02 nm的预测误差, 此时对应单个F-P腔光谱误差也仅为~0.002 5 nm。 实际中如对单个F-P腔传感器采用光谱解调法解调, 欲达到如此小的测量误差也是很困难, 需要光谱的分析精度极高才能实现。 综上说明Bi-LSTM网络预测数据的准确度是较理想的, 本算法是一种非常有效的游标传感器的输出解调方法。
(2)不同浓度被测气体情况下, Bi-LSTM模型预测准确度的测试
将传感器置于氢气浓度分别为1%、 2%、 3%、 4%的环境中, 采用1 450~1 550 nm工作范围的超连续光源获取传感器在不同浓度下的完整光谱数据, 结果如图7所示。 同样, 截取1 450~1 460 nm范围内传感器输出光谱数据, 经过预处理后将其输入至Bi-LSTM网络中进行光谱数据预测, 预测波长范围为1 460~1 550 nm, 实测及预测的光谱数据如图7所示, 并提取预测和实测光谱数据中的峰值波长对比误差, 结果列于表2中。 从图7及表2可以看出, 不同被测气体浓度下, Bi-LSTM网络预测的光谱包络数据依旧和原始实测包络数据具有很好的吻合度, 在各个波峰处预测的波长误差很小(最大误差仅为0.02 nm), 满足实际需求。
![]() | 图7 不同被测浓度下, 传感器原始光谱及预测光谱图Fig.7 original and predicted spectra of sensor for samples with different concentrations |
![]() | 表2 不同被测浓度下原始光谱及预测光谱结果比较 Table 2 Comparison of raw spectra and predicted spectra of samples with different concentrations |
(3)Bi-LSTM网络泛化能力的测试
进一步验证Bi-LSTM模型对具有不同的包络光谱周期的游标传感器解调的泛化性和有效性, 制备四组具有不同自由光谱范围的F-P腔级联游标效应传感器, 分别为14.78、 24.88、 30.92和35.64 nm。 同样采用超连续光源获取每个传感器原始光谱数据, 截取其中的1 450~1 460 nm范围的光谱数据, 经过数据预处理后, 输入至Bi-LSTM网络中进行数据预测, 预测光谱范围为1 460~1 550 nm。 预测结果经过反归一化、 中心线补偿等处理后, 与实测光谱数据对比, 结果如图8所示, 并从图8提取原始及预测光谱的波峰值, 计算误差, 结果如表3所示。 从图8及表3可以看出, 在各个波峰处, 波长预测误差很小, 最大误差都同样仅为0.02 nm。 说明本文预测模型对不同包络周期的游标传感器光谱数据的预测具有很好的泛化性, 适用于不同包络周期的游标传感器的光谱数据预测。
![]() | 表3 不同包络周期数据FSR预测结果比较 Table 3 Comparison of FSR prediction results with different envelope period data |
过宽的游标光谱包络周期会超出系统中光源、 光谱仪或相关光谱扫描技术的工作光谱范围, 这就极大限制了光谱解调法在游标效应传感器输出解调中的应用。 提出一种基于Bi-LSTM网络的游标传感器输出解调技术, 并详细介绍了技术原理及实现过程。 通过实验验证了方法的有效性和准确性。 得出以下结论:
(1)采集在被测量变化情况下游标传感器的输出光谱, 实验结果证明了输入至Bi-LSTM网络得到的预测光谱包络曲线, 大约在4~5个包络周期内, 都与实际传感器输出光谱的包络曲线具有很好的吻合度, 能够准确跟踪传感器输出光谱包络随被测量的变化。 此外随着预测光谱数据的加长, 误差开始增大, 波峰处的最大波长误差~0.02 nm, 最大幅值误差为0.058%, 满足实际解调精度要求。
(2)实际采集多个不同包络周期的游标传感器输出光谱, 实验结果证明了所训练的Bi-LSTM网络对不同包络周期的游标传感器输出光谱都具有准确的“ 预测性” 和“ 跟踪度” , 从而证明了所训练Bi-LSTM网络的泛化性。
研究表明, 只要工作光源的波长范围能够覆盖游标传感器的1/2个光谱包络周期(绝大多数情况下可以满足), 利用Bi-LSTM网络能够在宽光谱范围内, 实现对传感器输出光谱的准确预测, 从而极大降低了对游标传感器的工作光源(或光谱扫描技术)的光谱范围的要求。 本方法解决了游标传感器的输出解调光谱范围过宽的难题, 具有理论及实际应用意义。
[1] |
|
[2] |
|
[3] |
|
[4] |
|
[5] |
|
[6] |
|
[7] |
|
[8] |
|
[9] |
|
[10] |
|
[11] |
|
[12] |
|
[13] |
|
[14] |
|
[15] |
|
[16] |
|
[17] |
|
[18] |
|
[19] |
|
[20] |
|