作者简介: 唐庆菊,女, 1981年生,黑龙江科技大学教授 e-mail: 429169375@qq.com
蜂窝夹层结构是复合材料领域的重要结构形式之一, 由于其制备工艺复杂服役环境恶劣, 极易产生分层、 脱粘等缺陷, 严重影响材料使用寿命。 为确保相关构件的使用性能以及质量安全, 有必要通过合适的无损检测技术对蜂窝夹层结构进行定期的质量监测以及探伤。 因此, 实现缺陷的量化检测是预防以及解决此类问题发生的根本。 基于红外热成像技术以含预制分层及脱粘缺陷的GFRP/NOMEX蜂窝夹层结构试件为研究对象进行脉冲红外热波无损检测试验研究, 采集若干帧试件表面温度信号分布热图, 取若干缺陷区域及健康区域内像素点的温度信号构建样本数据集, 并将其随机划分为训练集及验证集, 取第四行缺陷中心水平线区域作为测试集数据。 结合卷积神经网络技术实现GFRP/NOMEX蜂窝夹层结构缺陷检测识别以及深度预测。 分析一维卷积神经网络结构, 引入多尺度空洞卷积、 残差模块、 注意力机制, 搭建一维卷积神经网络预测模型, 使用构建的温度信号数据集训练搭建的网络模型。 训练结果表明, 验证集和训练集的Loss及RMSE趋势一致, 验证集最终Loss为1.67×10-5, RMSE为0.005 8, 并未出现过拟合现象。 将测试集数据输入至训练完成的网络中。 结果表明, 所搭建的网络可以有效识别出缺陷, 对于缺陷中心处的深度预测误差控制在2%以内。 将卷积神经网络与红外热成像检测技术相结合, 能够实现GFRP/NOMEX蜂窝夹层结构缺陷的可靠性检测及缺陷埋深的稳定预测, 同时为其他复合材料缺陷识别以及量化检测提供参考。
Honeycomb sandwich structure is one of the important structural forms in the field of composite materials. Due to its complex preparation process and harsh service environment, it is easy to produce delamination, debonding, and other defects, which seriously affect the service life of materials. To ensure the performance and quality safety of related components, it is necessary to carry out regular quality monitoring and flaw detection of the honeycomb sandwich structure through appropriate non-destructive testing technology. Therefore, quantitatively detecting defects is the fundamental way to prevent and solve such problems. Based on infrared thermal imaging technology to GFRP/NOMEX honeycomb sandwich structure specimens containing prefabricated delamination and debonding defects as the object of study for pulsed infrared thermal wave nondestructive testing experimental research, the acquisition of several frames of the specimen surface temperature distribution thermograms, take several defective areas and the healthy region of the pixel temperature signals to construct a sample dataset, and randomly divided into a training set and a validation set, take the fourth row of defective The center horizontal line area is taken as the test set data. Combined with convolutional neural network technology, GFRP/NOMEX honeycomb sandwich structure defect detection and depth prediction is completed. Analyze the -one-dimensional convolutional neural network structure, introduce multi-scale dilated convolution, residual module, and attention mechanism to build a one-dimensional convolutional neural network prediction model, and use the constructed temperature signal data set to train the network model. The training results show that the Loss and RMSE trends of the validation and training sets are consistent. The final Loss of the validation set is 1.67×10-5, the RMSE is 0.005 8, and there is no over-fitting problem. The test set data is input into the trained network. The results show that the constructed network can effectively identify the defects and the depth prediction error at the defect center is controlled within 2%. It can be seen that the combination of convolutional neural network and infrared thermal imaging detection technology can realize the reliable detection of GFRP/NOMEX honeycomb sandwich structure defects and the stable prediction of defect burial depth and also provide a reference for the identification and quantitative detection of defects in other composite materials.
蜂窝夹层结构是复合材料领域的重要结构形式之一, 因其具有质量轻、 导热系数低、 减震、 耐冲击、 耐疲劳老化等特性[1], 目前被广泛应用于航空航天、 医用器械、 汽车等领域, 是航空航天飞行器的主、 次承力结构件, 也是最理想、 结构效率最高的形式之一, 被大量应用于军用以及民用飞机的机身、 机翼、 雷达罩等结构。 由于蜂窝夹层结构复合材料(honeycomb sandwich composites, HSCs)的结构复杂, 因此其易在制备过程中以及恶劣的服役环境中产生分层、 脱粘等缺陷, 这些缺陷普遍面积小、 位置隐蔽, 当出现外部冲击或内应力作用时易发生破坏, 使HSCs发生失效, 造成不必要的人员伤亡以及经济损失, 严重影响相关构件的正常使用。 因此高效且准确地对HSCs进行缺陷量化检测非常有必要。
常规的无损检测方法有其各自的特点和局限性, 促使新兴无损检测如红外热波无损检测技术快速发展。 红外热波无损检测技术[2, 3, 4, 5](infrared thermal wave nondestructive testing technology, IR TWNDT)是一种基于热辐射原理, 借助红外热像仪同步监测试件表面温度分布随时间的变化, 分析试件表面的热辐射信号, 从而实现试件表面及内部结构异常的检测技术。 红外无损检测技术可分为主动式与被动式, 其区别在于是否对试件施加外部的激励。 主动式红外热波检测技术是采用可调节的热源, 使其热波作用在试件表面, 若试件内部存在缺陷, 则缺陷区域与非缺陷区域材料热物性参数即存在差异, 施加的热流向内部传递的过程中会遇到阻碍或加速, 最终反应在试件表面为缺陷处与非缺陷处出现温差, 借助红外热像仪将试件表面温度场进行可视化, 即可大致观测出缺陷位置以及形状。
若想进一步实现缺陷的量化检测, 需对数据进行进一步处理以及分析, 其中缺陷深度的定量反演一直是各国研究人员的研究热点。 王永茂[6]等根据脉冲红外热波检测技术对于试件的最佳检测时间, 实现了CFRP层板缺陷的深度定量评估; Tang[7]等针对热障涂层中脱粘缺陷量化检测进行了研究, 采用脉冲红外热成像技术结合Markov-PCA-BPNN预测模型实现了缺陷深度的准确预测; Saeed[8]等将脉冲热成像技术与ANN相结合实现了CFRP层板缺陷深度的定量检测; Wang[9]等通过建立二维热传导模型, 对CPRP层板缺陷深度实现了较为准确的预测。 以上研究成果均为工程材料缺陷深度检测研究提供了参考, 为实现误差更低且更稳定的缺陷深度检测, 卷积神经网络可以为其提供新途径。
卷积神经网络[10, 11, 12](convolutional neural networks, CNN)仿造生物的视觉机制, 通过对数据进行局部感知和权值共享, 相比于传统的全连接, 其有效地减少了网络需要训练的参数数目, 同时降低网络的复杂度, 计算速度快, 结果优异, 易于训练和优化, 对平移、 扭曲、 缩放具有一定程度的不变性, 并具有强鲁棒性和容错能力, 因此在处理各种信号以及信息任务中性能优于标准的全连接神经网络。 CNN的应用范围非常广泛, 近年来在处理二维图像中取得了优异的成果。 同时, 卷积神经网络还可以处理三维数据如视频、 体积图片, 一维数据如信号等。 卷积神经网络具有强大的特征提取能力以及泛化能力, 将大量的样本进行卷积运算, 不断反向传播更新各层的权值, 直至网络将样本拟合, 最终实现目标任务。
本工作将脉冲红外热波无损检测技术与一维卷积神经网络相结合, 引入多尺度空洞卷积[13, 14, 15]、 残差模块[16, 17]、 注意力机制[18], 搭建基于1D-CNN的预测模型, 将红外热序列中的部分像素点对应的温度信号作为模型输入, 以缺陷深度作为输出进行模型训练, 以此实现更加稳定、 准确的缺陷识别以及缺陷深度的定量反演, 为蜂窝夹层结构工艺流程的改进提供依据, 以及实现服役结构定期探伤时对于缺陷的准确定位, 同时也为其余材料的缺陷定位及埋深情况的检测提供新方法及参考。
图1为GFRP/NOMEX蜂窝夹层结构缺陷深度预测红外热成像无损检测系统, 试验过程为计算机产生的脉冲信号经数据采集卡传输至调光器, 调光器接收信号控制卤素灯对试件施加热激励, 卤素灯将热量施加至试件表面并不断向试件内部传递, 若试件内部存在缺陷, 则试件表面温度场分布表现为缺陷区域与非缺陷区域出现温差, 采用FLIR A655SC非制冷红外热像仪实时记录激励及散热过程试件表面的温度场分布变化, 得到若干帧分辨率为640× 480的热图。
采用的GFRP/NOMEX蜂窝夹层结构是由0.7 mm的GFRP蒙皮与4mm的芳纶纸蜂窝通过0.1 mm的环氧树脂粘结而成, 整板总厚度为5.6 mm。 采用对试件底部打平底盲孔的方式模拟直径为10 mm的脱粘及分层缺陷, 图2为试件缺陷位置示意图, 表1为试件缺陷埋深参数。
![]() | 表1 试件缺陷埋深参数 Table 1 Specimen defect depth parameter |
试验设置卤素灯功率为2 000 W, 脉冲激励为7 s, 采样频率为10 Hz, 采样时间为100 s, 共计1 000帧红外热图, 将热像仪采集的试件表面热图进行时间空间对齐等操作, 得到640× 480× 1 000的热序列, 图3为热序列示意图。
由图3可知, 试件在受到热激励后缺陷处和非缺陷处会产生明显的温度差异, 同时不同类型、 平面尺寸、 埋深的缺陷均会由于传热情况不同导致缺陷对应试件表面的温度存在不同。 图4为不同埋深缺陷中心对应试件表面温度变化归一化曲线。 图4表明, 相同平面尺寸不同埋深缺陷中心处对应的试件表面对于外部热源激励会有不同程度的温度响应。 根据表1试件预制的缺陷埋深情况, 依次设置缺陷深度标签为0.3、 0.4、 0.5、 0.7和0.8 mm, 无缺陷处深度标签设置为5.6 mm。 图5为样本数据选取区域示意图, 在样本选择区域取缺陷点及无缺陷点共计9 848个样本数据, 并将数据集随机划分为训练集及验证集。
![]() | 图4 不同埋深缺陷中心对应试件表面温度变化归一化曲线Fig.4 Normalized curve of surface temperature change of specimen corresponding to the center of defects with different burial depths |
(1)卷积层
卷积层(convolutional layer, Conv)是CNN的核心, 是一定尺寸的卷积核窗口以一定的步长在输入样本上滑动进行卷积运算, 实现对输入样本的特征提取, 其特点是全局共享权值, 网络计算速度快、 训练参数少及内存占用少。 在卷积过程中为了不遗漏边缘信息以及使输出特征大小与输入相同, 通常会进行补0操作, 在输入样本的起始和终止补充0数据, 使边缘数据也进行多次卷积, 常用的补0方式之一为“ same” 。 卷积的具体计算公式为
式(1)中, xi为输入数据; xi+1为卷积操作后的数据; ⊗为卷积运算符号; Wi为卷积核权重; bi为偏置。
(2)BN层
批量标准化(batch normalization, BN)层通常置于激活层前, 对数据进行归一化处理, 使数据服从正态分布, 减少数据分布的差异性, 规避了由于网络加深时数据差异性逐渐增大导致的梯度爆炸或梯度消失, 引入BN层可有效提高模型收敛速度和网络训练速度, 同时引入可学习参数γ 和β , 其具体向前传播的公式为式(2)— 式(5)所示
式(2)中, x(i)为输入的样本数据。
(3)激活层
单纯的卷积操作只能表达线性映射, 不能实现对复杂特征的提取与表达, 无法解决非线性问题, 因此通常在卷积计算后引入激活操作, 对卷积的结果进行非线性变换, 将特征映射到高维非线性区间, 使网络可以逼近任意非线性函数, 使其具备非线性映射的能力, 解决复杂任务。 目前常用的激活函数为Sigmoid、 Tanh、 ReLU等。 图6为Sigmoid、 Tanh、 ReLU函数示意图, 其表达式分别为式(6)— 式(8), 网络激活函数表达式如式(9)所示。
其中Sigmoid函数输出限制在0到1之间, 曲线平滑且易于求导。 Tanh函数是Sigmoid函数的变体, 实际是Sigmoid函数的平移和收缩, 相比于Sigmoid函数有更快的收敛速度。 ReLU是目前最常用的激活函数, 其具有强大的非线性拟合能力, ReLU会使部分神经元的输出为0, 使网络存在稀疏性, 减少了参数相互依存的关系, 减缓了过拟合问题, 收敛速度快, 没有梯度弥散。
(4)池化层
最大池化和平均池化是目前最常用的两种池化方式, 卷积神经网络中池化层的引入是仿照人的视觉系统对视觉输入对象进行特征降维和特征抽象提取, 其计算原理是一定尺寸的池化窗口以一定的步长在输入数据上滑动进行相应的池化计算, 具有特征不变性, 对数据进行有效降维, 减少计算量和参数个数, 一定程度上防止过拟合, 同时也实现了非线性映射, 有效扩大了感受野。 近年来全局池化也逐渐被大量应用, 其中全局平均池化和全局最大池化是特殊的平均池化和最大池化, 其不同是池化窗口即为特征输入中单个通道的特征图大小, 全局池化可以有效提取全局信息, 常用来代替全连接层, 减少计算量。 图7(a— d)为池化过程示意图。 最大池化和平均池化的数学公式如式(10)和式(11)所示。 图8为全局池化示意图。
![]() | 图7 池化过程示意图 (a): 最大池化; (b): 平均池化; (c): 全局最大池化; (d): 全局平均池化Fig.7 Pooling process diagram (a): Max pooling; (b): Average pooling; (c): Global max pooling; (d): Global average pooling |
式(10)和式(11)中, a为池化窗口, p为池化输出, k为输入特征尺寸。
(5)全连接层
全连接层(fully connected layers, FC)一般位于网络的最后, 与上层输出的展平结果相连接进行线性映射。 网络中全连接层添加过多会引入过多的学习参数, 从而增加运算的困难和时间, 且易产生过拟合现象。 全连接层的数学公式如式(12)所示。
式(12)中, Zl+1(j)为全连接层l+1的第j个神经元的输出,
(6)传播过程
采用一维卷积神经网络回归预测, 其训练机制的第一阶段是将信号输入到网络中, 网络经过特征提取、 特征整合及预测结果实现正向传播, 得到预测值
$\text { Loss }=\frac{1}{2} \sum_{i=1}^{R}(y-\hat{y})^{2} $(13)
$R M S E=\sqrt{\frac{1}{R} \sum_{i=1}^{R}(y-\hat{y})^{2}}$(14)
式(13)和式(14)中, R为一个Batch的样本个数。
1.5.1 多尺度空洞卷积
在传统网络的卷积层中, 卷积核尺寸过大易导致无法捕捉数据的细节信息, 过小则无法顾及数据的全局信息。 而空洞卷积(dilated convolutions)则是在普通卷积的基础上引入扩张率参数, 其具体机制为在过滤器像素之间引入固定大小的空洞或跳跃来扩展过滤器的感受野, 使提取的网络信息更加细致, 从而提高模型的能力。 图9为卷积扩张原理图。
图10为常规卷积和空洞卷积计算过程对比。 原卷积核大小均为1× 3。
空洞卷积的扩张率大有利于捕捉全局信息, 但过大的扩张率也会导致采样稀疏, 使部分信息丢失, 造成连续性破坏, 不利于细节的学习, 因此使用多个扩张率不同的卷积核进行卷积操作, 使其在多尺度上获得不同感受野的特征, 经过Concat操作将不同分支提取的特征信息进行融合, 通过融合不同卷积核提取的特征, 全面捕获样本中的信息特征, 增强网络的表达能力, 提高模型的鲁棒性和准确性。
1.5.2 残差
通常情况下较深较复杂的网络对于非线性拟合的能力要强于较浅的网络, 适度的增大网络规模可以提高网络的能力, 但无限的堆叠时通常会导致网络性能饱和, 甚至网络出现衰退的现象, 能力反不如浅层网络, 原因是在网络的学习过程中, 梯度经过过多的网络层传递后可能会变的非常大或非常小, 即出现了梯度消失或梯度爆炸, 梯度消失会使得底层网络的权重几乎不变, 网络无法学习, 梯度爆炸即会导致学习过程极不稳定, 波动性较大, 最终导致训练失败。
图11(a, b, c)为常规卷积与残差模块对比, 常规的卷积过程可能会导致信息的丢失, 网络层数越多, 丢失的信息则越多, 将会严重影响网络的学习, 残差模块的思想是将网络若干层的输入与结果融合, 即图11(b)中的跨层连接, 保留输入数据的信息, 输出结果为F(x)+x, 最差效果为F(x)=0, 即没有增益, 但也没有信息的损失, 网络引入恒等映射, 实现数据跨层流动, 使网络层数增加也可以保证梯度的稳定。
![]() | 图11 残差模块 (a): 传统卷积; (b): 残差网络模型; (c): 本文残差模型Fig.11 Residual module (a): Conventional convolutional network; (b): Residual network module; (c): Residual moduleof this article |
当输入和输出的维度一致时, 可直接相加, 若不一致则需要额外的卷积或池化调整大小, 完成跨层连接, 图11(c)为使用的残差模块结构。 残差网络除解决深层网络的梯度爆炸和梯度消失问题外, 还可以提高网络的泛化能力, 减少计算量。
1.5.3 注意力机制
注意力机制为模仿人类视觉研究衍生而来, 其作用是对重要事物进行聚焦, 其原理是通过给不同的通道分配不同的权重, 让网络捕捉且学习到重要的特征信息。 SE-Net(squeeze-and-excitation networks, SE-Net)是最早的注意力机制网络之一, 其机制是利用通道的独特性调整通道维度的特征, 使特征提取的效果更好, 图12(a)为SE模块, 其过程为压缩、 激励以及特征重映射。 SE模块使用全局平均池化进行特征压缩, 全连接层以及ReLU进行激励, 通过Sigmoid将权重归一化, 最后通过Multiplication将归一化后的特征权重系数与模块输入逐层相乘, 完成特征重映射。
![]() | 图12 注意力机制 (a): SE模块; (b): 本文注意力模块Fig.12 Attention mechanism (a): SE module; (b): Attention module of this article |
其中SE模块使用全局平均池化操作进行特征压缩, 并不能充分的将特征提取, 且使用参数较多的全连接, 导致训练速度慢。 图12(b)为本文注意力模块, 其首先采用全局平均池化和全局最大池化将特征分别压缩, 进行充分的特征提取, 再对压缩后的一维信号使用1× 1的卷积操作进行降维, 将两者的特征图进行拼接再进行1× 1的卷积操作实现升维, 恢复原始通道数, 最后将Sigmoid激活函数归一化后的权重系数与模块输入相乘, 得到加权后的特征图。
1.5.4 构建缺陷深度预测模型
为实现缺陷深度的稳定预测, 引入多尺度空洞卷积、 残差结构、 注意力机制搭建一维卷积神经网络模型, 图13为所搭建的网络结构示意图, 表2为网络结构参数。 其中k为窗口尺寸, s为步长, DR为扩展率, t为卷积核个数。
![]() | 表2 网络结构参数 Table 2 Network structure parameters |
模型首先通过四个并行的空洞卷积分别进行浅层的特征提取, 将卷积结果分别进行BN及ReLU后使用Concat在深度方向进行叠加。 将输出结果送入图11(c)所示结构的残差模块1中, 其中Conv1参数为k=9× 1、 s=2× 1、 t=64, Conv2参数为k=5× 1、 s=1× 1、 t=64, Conv3参数为k=1× 1、 s=2× 1、 t=64。 残差模块1的输出结果经池化操作后
送入图11(c)所示的残差模块2中, 其中Conv1参数为k=5× 1、 s=2× 1、 t=128, Conv2参数为k=3× 1、 s=1× 1、 t=128, Conv3参数为k=1× 1、 s=2× 1、 t=128。 残差模块2的输出结果经池化操作后送入参数与残差模块2相同的残差模块3中, 将结果进行池化操作后送入图12(b)所示的注意力机制模块中, 其中Conv1及Conv2参数为k=1× 1、 s=1× 1、 t=16, Conv3参数为k=1× 1、 s=1× 1、 t=128。 将注意力模块的输出结果使用Flatten操作进行扁平化后与全连接层连接, 最后使用Regression作为深度预测模型的输出层。
将构建的数据集输入到所搭建的一维卷积神经网络中进行训练, 训练的批次大小过大会导致迭代速度慢, 训练速度低, 过小则会导致丧失全局信息, 最终根据数据集规模, 本研究选取批次大小为200, 每轮迭代38次, 每隔2次迭代验证一次, 共迭代100轮次, 设置学习率为0.000 1, 每30轮次衰减50%。
图14(a— d)为训练集与验证集的Loss及RMSE曲线, 其中训练集Loss曲线从起始的0.888 2经5轮次迭代后达到0.000 782 7, 后逐渐趋于稳定, 最终经100轮次后达到8.15× 10-6, RMSE曲线从起始的1.332 8经40轮次迭代后达到0.007 4, 最终经100轮次后达到0.004。 由数据及曲线可知, 模型整体收敛速度较快, 且验证集和训练集的Loss及RMSE趋势一致, 即并未出现过拟合问题, 验证集最终Loss为1.67× 10-5, RMSE为0.005 8, 验证集训练曲线略低或略高于训练曲线均可视为正常情况。
将图5所示预测区域温度信号输入至训练完成的网络模型中进行预测, 图15为预测结果, 其中发现本文所搭建的网络模型可以有效识别出缺陷, 且缺陷深度预测效果良好, 同时计算四个缺陷中心处深度预测误差, 具体数值如表3所示, 缺陷中心处深度预测误差控制在2%以内, 预测效果稳定。 由此可知, 通过搭建一维卷积神经网络模型进行回归分析对于蜂窝夹层结构的缺陷深度预测是完全可行的。
![]() | 表3 缺陷深度预测误差 Table 3 Defect depth prediction error |
采用脉冲红外热波检测技术针对GFRP/Nomex蜂窝夹层结构缺陷进行检测, 由热像仪采集热图, 取若干像素点的温度信号构建样本数据集, 引入多尺度空洞卷积、 残差模块、 注意力机制, 搭建一维卷积神经网络预测模型, 使用随机划分的训练集及验证集数据训练网络, 取预测区域数据测试网络模型预测效果, 结果表明: 该模型预测效果良好, 可以有效识别出四个缺陷, 且缺陷中心处误差控制在2%以内, 缺陷深度检测效果稳定, 证明该网络可实现蜂窝夹层结构缺陷埋深的可靠检测。 同时也有望应用于其他复合材料缺陷的深度检测, 具有较好的应用前景。
[1] |
|
[2] |
|
[3] |
|
[4] |
|
[5] |
|
[6] |
|
[7] |
|
[8] |
|
[9] |
|
[10] |
|
[11] |
|
[12] |
|
[13] |
|
[14] |
|
[15] |
|
[16] |
|
[17] |
|
[18] |
|