作者简介: 汪 明, 1999年生,中国科学院工程热物理研究所新技术实验室硕士研究生 e-mail: wangming22@mails.ucas.ac.cn
燃烧特性的准确预测可以为燃烧技术的优化提供重要依据。 利用甲烷火焰高光谱数据同时预测多种燃烧特性, 以解决工程中监测燃烧特性需要多种采集设备及现场取样的难题, 提出了一种基于三维卷积神经网络(3-dimensional Convolutional Neural Network)方法的火焰特性预测模型。 首先在层流火焰高光谱数据上验证了该方法并进一步将模型应用于湍流火焰高光谱数据, 接着建立了一种通用模型和训练方法, 最后使用Gradient-weighted Class Activation Mapping(Grad-CAM)方法对模型进行可解释性研究。 在层流模型中研究了不同参数对火焰特性预测模型准确性的影响; 在湍流模型中探究了使用迁移学习的可行性以及添加小波去噪处理方法和改变卷积层数对模型结果的影响; 在通用模型中解决数据不一致的问题, 使得层流和湍流火焰作为训练数据对模型进行混合训练成为可能, 实现了从实验室小火焰到实际工程火焰的燃烧特性参数预测模型的建立; 在模型的可解释性研究中使用Grad-CAM方法对神经网络模型的工作原理和决策过程进行研究。 结果显示层流预测模型中针对不同预测参数平均准确率均能达到96%以上, 使用Mish+Mae的参数组合平均准确率最高为98%且拥有较高的模型稳定性; 湍流预测模型的平均准确率均能达到95%以上, 迁移学习、 小波去噪处理和改变卷积层数均能在一定程度上提升模型性能, 但需要进行合适的调整; 通用模型在层流和湍流不同参数预测的平均准确率分别达到了97%和94%, 在两种不同火焰的工况下均达到较高的准确率, 说明模型的适用性较强; 可解释性研究中Grad-CAM热力图上的信息表明该方法能够通过定位火焰敏感区域, 并从光谱中提取到关键组分信息, 从而完成对火焰特性的预测。 该研究可以为燃烧学实验测试技术的智能化发展提供支持, 对燃烧特性的研究具有重要意义。
Accurately measuring combustion characteristics can provide important references for optimizing combustion technology. This study predicts multiple combustion properties simultaneously using high spectral images of methane flames, addressing the challenge of monitoring combustion characteristics in engineering, which typically requires various collection devices and on-site sampling. A flame characteristic prediction model based on the 3D-CNN method is proposed. Initially, this method is validated on laminar flame high spectral images and further applied to turbulent flame high spectral images. Subsequently, a universal model and training method are established. Finally, the Grad-CAM method is used to conduct interpretability studies of the model. In the laminar flow model, we investigated the influence of different parameters on the accuracy of flame characteristic prediction models. In the turbulent flow model, we explored the feasibility of using transfer learning and the impact of adding wavelet denoising techniques and altering the number of convolutional layers on the model results. Within the general model, we addressed the issue of inconsistent labels in different datasets, enabling the blending of laminar and turbulent flame data for mixed training of the model. This facilitated the establishment of a combustion characteristic prediction model, ranging from laboratory-scale flames to real-world engineering flames. In the study of model interpretability, the Grad-CAM method was employed to investigate the operational principles and decision-making processes of neural network models. The results indicate that the average accuracy of the laminar flow prediction model for different predictive parameters exceeds 96%, with the Mish+Mae parameter combination achieving the highest average accuracy of 98% and demonstrating enhanced model stability. The average accuracy in the turbulent flow prediction model is consistently above 95%. Transfer learning, wavelet denoising, and altering the number of convolutional layers all contribute to improving model performance to some extent, contingent upon appropriate adjustments. The general model achieves an average of 97% and 94% accuracy for laminar and turbulent parameter predictions, respectively, while exhibiting higher robustness. In the interpretability study, information from Grad-CAM heatmaps suggests that this method can effectively identify flame-sensitive regions, extract crucial component information from spectra, and accomplish flame characteristic predictions. This study supports the intelligent development of experimental testing techniques in combustion science, holding significant implications for investigating combustion characteristics.
燃烧是国民经济能源领域和动力机械应用的基础, 通过对燃烧特性的准确测量能够帮助我们了解和控制燃烧过程, 对提升能源及动力装置的效率以及降低污染排放等具有重要意义[1]。 目前, 研究火焰特性的光学方法有很多, 比如干涉法、 纹影法、 PIV和激光/吸收光谱等方式[2, 3, 4], 如Ju等[5]使用飞秒紫外吸收光谱的方法同时测量温度和OH浓度, Rubiella等[6]使用具有连续脉动的激光诱导等离子体的方法实现了燃烧不稳定性诊断。 而使用自发光光谱技术相对较少, 该技术具有无需外加光源, 对火焰干扰小的优点, 高光谱成像技术作为典型的自发光光谱技术受到越来越多的关注。
高光谱成像技术是成像技术和光谱技术的结合, 能够获取观测目标区域内每个像素点对应的光谱, 获得的数据中同时包含了目标的空间信息和光谱信息, 这也是相对于其他测量方法的优势, 该技术被广泛应用于地质、 农业以及军事等领域[7]。 火焰中包含自由基在内的多种组分, 使用高光谱技术能够获取这些组分丰富的光谱信息, 作为燃烧特性的“ 指纹” , 从而用于间接测量火焰的燃烧特性。 Si[8]获取煤粉颗粒燃烧的高光谱数据, 得到不同燃烧阶段炭烟温度和浓度的分布规律, Wang[9]借助该技术研究了甲烷层流预混火焰中自由基辐射特性随着不同当量比和流量变化的趋势, Qiu等[10]提出了一种基于火焰自由基发射光谱的新型火灾识别算法, 能定性的对火焰进行识别, 对火灾的发生进行监测。 这些工作均展示了高光谱成像技术在火焰信息提取方面的巨大潜力, 目前高光谱数据分析按发展的进程主要分为三类: 统计分析方法, 传统机器学习方法以及深度学习方法[11, 12, 13]。 统计分析方法通常是基于数学和统计方法进行分析, 主要提取的特征如: 平均值、 方差和主成分等。 传统机器学习方法依赖于具体的算法特征提取, 提取的特征如: 边缘检测和纹理特征、 波段比率等。 这些特征不容易满足高光谱数据的分析要求, 提取的特征不够全面且精度难以有较大的提升。
在光谱分析中, 阿贝尔变换是一种常用的数学工具, 用于将投影数据转换为真实分布; 通过该变换可以从一维投影数据中还原出实际的光谱分布, 特别是在等离子体光谱、 火焰和径向对称分布的场景中, 该方法具有很强的实用性。
随着人工智能技术的发展, 使得通过数据驱动的深度学习方法研究高光谱特性成为可能, 这种深度学习的隐式方法能够在不使用阿贝尔变换的情况下也能将光谱特征与所预测的燃烧特性取得关联, 简化数据处理流程。 She[14]采用三维卷积神经网络(3-dimensional convolutional neural network, 3D-CNN)方法分析高光谱数据实现对地物目标的分类, 相对于传统分类方法精度显著提高, 展示了神经网络方法在处理高光谱数据的巨大优势。 Wang[15]提出了一种使用火焰高光谱数据和3D-CNN技术定量测量火焰特性的方法, 在实验室小火焰上验证了这种方法对出口雷诺数及燃烧当量比测量的可行性。 但实际燃烧过程都是湍流火焰且包含多种燃烧特性, 其工程适用方法和模型的可解释性尚待研究。
因此, 为进一步解决燃烧特性预测的难题, 定量的研究燃烧特性提高预测结果的准确率和模型的适用性, 由此建立针对不同数据集的火焰特性预测模型, 同时为了扩展模型的适用性, 实现单个模型对不同场景下多种燃烧特性的同时预测, 提出通用燃烧特性预测模型, 并对神经网络的“ 黑箱” 特点, 借助梯度加权类激活映射(gradient-weighted class activation mapping, Grad-CAM)[16]方法研究模型的可解释性, 理解其推理与决策过程提升模型在实际应用中的可接受度。
该实验平台主要由燃烧单元、 数据收集单元以及数据分析单元组成, 燃烧单元即层流火焰的本生灯和湍流火焰的燃烧室。
本工作使用的高光谱相机扫描方式为多帧线扫描, 观测对象包括层流火焰和湍流火焰, 获得的光谱数据大小为1 040× 960× 176, 其中176表示光谱波段数, 1 040× 960为空间像素大小。 在湍流火焰数据的收集过程中, 同时使用Testo烟气分析仪来获取一部分燃烧特性如: CO、 NOx等作为训练过程中的标签值, 标签值的主要作用是指导模型进行学习和优化, 是与输入数据相关联的真实输出或期望输出, 它在监督学习任务中扮演着关键的角色。 为了增强数据分析的可靠性, 我们对数据收集过程中的不确定度进行了详细分析。 这包括从仪器的校准误差、 环境变化对仪器性能的影响, 到采样方法的不确定性。 我们采取了多种措施来评估和减少这些不确定因素, 例如使用重复测量来评估数据的重复性, 采用高级校准技术来调整仪器的精确度, 以及使用统计方法来分析数据收集的一致性和可靠性。
共获得36个湍流火焰工况以及28个层流火焰工况。
火焰高光谱数据中包含的光谱信息对应了火焰在燃烧过程中产生的物质分布情况, 如图2所示的3维数据立方体通常由空间维度和光谱维度组成, X、 Y轴分别为光谱数据的空间维度, Z轴代表光谱维度。 从图中可以发现层流火焰在431.4、 468.2和516.5 nm分别检测到了CH、
将湍流火焰中的30个工况作为训练集, 6个工况作为测试集; 层流火焰中将20个工况作为训练集, 8个工况作为测试集。 训练集用于拟合和训练模型, 测试集用于最后评估模型的性能。 在实际的训练过程中使用交叉验证的方法, 并对所有数据集标签做最大最小归一化处理。
![]() | 表1 湍流训练数据 Table 1 Turbulent training data |
![]() | 表2 层流训练数据 Table 2 Laminar training data |
![]() | 表3 湍流测试数据 Table 3 Turbulent test data |
在火焰高光谱数据中存在非火焰区域, 且由于火焰高光谱数据的实验工况较少, 需要对原始数据进行裁剪和数据增强, 提升模型的鲁棒性避免模型发生过拟合。 具体流程如图3所示。
首先对数据进行裁切去除非火焰区域对训练过程的干扰, 接着对高光谱数据旋转、 水平翻转和垂直翻转操作, 最后对处理后的数据在空间维度和光谱维度上进行等间隔抽取, 使输入模型的数据大小为75× 55× 88个, 以扩大数据集实现数据增强。 虚线框部分为可选操作即小波去噪[17], 主要是为去除在光谱维度上噪声的干扰, 小波去噪前后的结果对比如图4所示, 表明小波去噪处理后能够在不影响峰值信号的同时, 对基底的明显噪声完成了较好的清除。
![]() | 表4 层流测试数据 Table 4 Laminar test data |
三维卷积神经网络(3D-CNN)主要包含三个阶段。 在阶段1中输入数据经过3D卷积层、 随机失活层、 批量归一化层以及3D最大池化层, 阶段2和阶段3经过类似于阶段1的重复操作, 在3D卷积过程中卷积核大小为(3× 3× 5)主要用于提取高光谱数据在空间维度以及光谱维度上的特征。 具体的网络结构如图5所示。
1.3.1 层流、 湍流燃烧特性预测模型
高光谱数据经3D-CNN网络处理后提取到特征图, 后将其全部整形为一维向量, 后添加多层感知机且该多层感知机的输出层的神经元个数与所需预测的燃烧特性参数的种类数一致, 如图6所示。
为了解优化模型探讨参数对整个模型的影响, 本工作对层流预测模型参数[18, 19]的选择进行了探讨。 如表5所示。
![]() | 表5 层流模型 Table 5 Laminar models |
针对湍流模型, 进一步对模型的卷积层数, 是否迁移学习就是将层流模型结果直接用于湍流模型中继续训练以及是否进行小波去噪做了进一步讨论。 如表6所示。
![]() | 表6 湍流模型 Table 6 Turbulent models |
1.3.2 通用燃烧特性预测模型
为使燃烧特性预测模型能够同时兼容实验室小火焰和实际工程火焰, 我们建立了适用于层流和湍流预测的通用燃烧特性预测模型。 针对层流和湍流数据集中标签种类不一致的情况, 使用自定义的损失函数
式(1)中: neq(yt[i], mask_val)表示掩码, 其元素i为True表示对应位置的yt[i]不等于mask_val, 为False表示等于mask_val; MAE(yt[i], yp[i])是第i个元素的平均绝对误差; where(mask, loss, 0.0)利用掩码计算带有遮罩的损失, 其中mask是前述掩码; cast(mask, float32)Z将布尔型掩码转换为浮点数。
该损失函数使用掩码来计算平均绝对误差, 在模型训练过程掩码的主要作用是代替缺失的标签值, 以忽略某些无法获取的标签值, 该方法从数据来看实现了不同数据源的高效融合, 提高了数据的综合利用效率, 促进了数据的广泛共享; 从模型来看神经网络在训练过程中不受标签值缺失的影响, 确保模型能够直接应用于不同来源的数据而无需重新训练扩展模型的适用性。 由此, 将层流数据集与湍流数据集融合训练, 同时该通用模型增加二分类任务, 将输入模型中的层流或湍流火焰进行分类。 如图7所示。
在通用模型中数据进入主干网络, 通过卷积等操作, 输出特征图后将其全部整形为一维向量, 后添加两个全连接层, 最后添加两个并列的输出层, 第一个输出层有7个神经元, 分别代表5种湍流特性和2种层流特性, 使用Mish激活函数输出火焰特性, 第二个输出层有2个神经元, 使用sigmoid激活函数输出火焰的类别。
为了实现定量和定性的评价, 使用层流和湍流测试数据集, 计算模型每训练100次输出的平均准确率。
式(2)和式(3)中: TMij为第i个工况下第j种特性的火焰特性参数的预测准确率; Tti, j为第i个工况下第j种特性的火焰特性参数的测量值; Tpi, j为第i个工况下第j种特性的火焰特性参数的预测值;
在整个实验中借助交叉验证的方式, 建立训练集和验证集, 并预留出一部分工况作为测试集。 提出的神经网络模型基于公开可用的tensorflow平台实现, 在一块NVIDIA GeForce RTX 4090上训练, 内存为24G。
2.1.1 不同参数下层流火焰预测实验结果对比
为了验证3D-CNN技术对燃烧特性参数预测的可行性, 本文使用层流火焰数据进行模型的训练, 同时对比不同激活函数和损失函数的实验结果, 讨论模型的最佳参数组合。
在固定损失函数(Mse)不变的情况下, 激活函数分别使用Mish以及LeakyRelu, 发现相对于Mish而言LeakyRelu在训练前期很难找到一个较好的结果, 训练后期平均准确率有较大提升但存在波动, 训练结果不稳定; 在使用相同激活函数的情况下, v1、 v3、 v4和v5分别采用Mse、 Huber、 Logcosh和Mae作为损失函数, 发现使用Mae平均准确率最高且波动较小。 通过层流火焰的数据集, 验证了3D-CNN技术对燃烧特性参数预测的可行性, 并确定了使用Mish+Mae的参数组合。
2.1.2 不同网络结构下湍流火焰预测实验结果对比
为了完成对实际工程火焰特性的预测, 使用经过层流数据验证过的3D-CNN网络, 并针对迁移学习、 小波去噪和卷积层数进行讨论。 最终的训练结果如图9所示。
![]() | 图8 使用不同激活函数结果图(a); 使用不同损失函数结果图(b)Fig.8 Using different activation functions (a); Using different loss functions (b) |
![]() | 图9 v1和v4结果对比图(a); v1、 v3和v4结果对比图(b)Fig.9 Comparison between v1 and v4 (a); Comparison among v1, v3, and v4 (b) |
针对小波去噪和卷积层数的结果分析。 v1与v4从损失值的对比情况来看, v4的下降速度更快且有更小的损失值, 从湍流测试工况的平均准确率来看, 随着训练次数的增加v1的平均准确率更加稳定; v3与v4从损失值情况来看, 可以发现v3的损失值相对于v4下降得更慢且收敛值也更高, 从平均准确率来看, 最终v3的平均准确率位于v1和v4之间。 说明小波去噪能够减少噪声信号提升模型学习速度, 同时也可作为一层卷积层, 经训练后能够达到相同卷积层的预测效果, 但同时去噪的过程中丢失了一部分光谱信息容易使模型陷入过拟合。
针对迁移学习的结果分析。 图10可以发现, 在引入迁移学习后, 训练初期的损失值相对于不使用迁移学习有更快的下降速度, 且在训练后期使用迁移学习的模型表现出更高且更加稳定的平均准确率, 说明迁移学习在训练过程中能够降低过拟合的风险。
![]() | 图10 v1和v2结果对比图(a); v4和v5结果对比图(b)Fig.10 Comparison between v1 and v2 (a); Comparison between v4 and v5 (b) |
在上述结果中, 湍流火焰特性预测模型的平均准确率均超过94%, 成功的实现了对湍流火焰特性的有效预测。 并验证了: 小波去噪能够在一定程度上提升模型的性能, 但是容易造成过拟合的风险。 使用卷积层可替代小波去噪的效果; 增加卷积层数能够加快模型提取特征的速度但在准确率方面收益不明显; 使用迁移学习能够提升学习速度的同时也能降低模型过拟合的风险。
2.1.3 通用模型预测实验结果对比
将层流和湍流火焰数据输入通用燃烧特性预测模型中训练, 得到模型平均准确率图11所示。
![]() | 图11 通用模型与层流、 湍流平均准确率对比Fig.11 Comparison of the average accuracy between the general model and laminar, turbulent flows |
为了与层流和湍流的模型结果对比, 在训练过程中选择与层流模型v5和湍流模型v1同样的参数设置。 随着训练次数的增加, 通用模型的准确率呈上升趋势, 特别是在训练后期, 通用模型的结果表现更加稳定且未出现较大的波动, 通用模型预测层流时平均准确率达98%, 预测湍流时平均准确率为94%。
从上述的结果中分析可以发现随着混合训练的数据量变大和迭代次数的增加, 通用模型结果更加稳定而单独训练的模型更容易过拟合, 证明了尽管层流和湍流火焰属于不同的流动状态, 但在燃烧过程中许多物理现象是一致的, 因此通过层流和湍流的混合训练可以提升模型的鲁棒性, 并做到对层流火焰和湍流火焰的多流态燃烧特性参数预测。
采用Grad-CAM[16]可视化工具对通用模型的工作原理和决策过程进行深入探讨, 分别选择湍流和层流测试工况对第三层卷积结果从空间维度和光谱维度上进行分析。
![]() | 图12 层流沿X轴方向积分图(a); 沿X轴方向火焰Grad-CAM积分图(b)Fig.12 Laminar flow integral diagram along the X-axis (a); Flame Grad-CAM integral diagram along the X-axis (b) |
在层流火焰当量比的预测中, 光谱峰值附近存在着较强的响应, 特别是在水蒸气(930 nm)辐射光谱附近响应最为强烈, 在其他的光谱区段响应的分布较为均匀。
![]() | 图13 层流沿Z轴积分图(a); 层流沿Z轴火焰Grad-CAM积分图(b)Fig.13 Laminar flow integral diagram along the Z-axis (a), Laminar flame Grad-CAM integral diagram along the Z-axis (b) |
根据甲烷燃烧的化学反应方程式可知水是燃烧反应的主要产物, 当量比发生变化时水的生成量也会发生较大变化并且在水蒸气波段的光谱信号较强, 所包含的信息相对更多, 因此从Grad-CAM图中可以发现神经网络对水蒸气波段响应更为敏感。
在层流火焰中针对当量比的标签, 提取Grad-CAM图观察峰值附近谱段的响应情况如图14所示, 从中可以发现该热力图对火焰边缘响应较高。 这是由于当量比发生变化时火焰的结构形状会发生较大的变化, 因此神经网络在预测当量比时会更加关注火焰的轮廓结构。 针对对称的层流火焰, 热力图存在不对称性且只有一侧存在响应, 该现象的发生主要存在两方面的原因: 从卷积核来看, 由于卷积核分布的不对称性, 导致输入的对称数据在输出时发生了变化; 从火焰光谱的分布来看, 在火焰面附近存在着较大的梯度变化, 并且对称轴两侧梯度方向不同, 经过卷积核的操作后最终导致了热力图的不对称分布。
沿Z轴方向的Grad-CAM热力图可以发现在光谱辐射较强的波段范围内特别是在900 nm以后的波段响应相对更高, 囊括的火焰区域也更大, 该波段中主要为H2O的辐射波段, 而H2O是甲烷燃烧重要产物, 表明通过H2O的辐射信息能够完成对火焰当量比的预测。
研究湍流测试工况6, 对该工况输入模型的高光谱数据进行积分, 得到如图16所示的光谱积分数据以及预测CO时沿X轴的Grad-CAM积分图。 在进行火焰特性的预测过程中, 931~997.7 nm附近的光谱响应最高其他的波段响应较低。
![]() | 图16 湍流沿X轴方向光谱积分图(a); 湍流沿X轴火焰Grad-CAM积分图(b)Fig.16 Turbulent flow spectral integral diagram along the X-axis (a), Turbulent flame Grad-CAM integral diagram along the X-axis (b) |
根据已知的甲烷燃烧过程中, CO的氧化路径[17], 见图17。
在甲烷燃烧过程中CO的主要来源为反应路径1, 生成主要产物包括H2O, 反应路径2对CO的产率影响较小, 主要的消耗在路径3生成产物为CO2。
在水蒸气波段附近的Grad-CAM图可以明显看到响应出现在整个火焰区域, 并且响应明显高于其他波段, 表明水蒸气波段的信息在神经网络中更受到关注。 与层流预测当量比的Grad-CAM图相比不同之处在于层流预测当量比更关注火焰外轮廓结构, 而湍流预测CO时更关注火焰内部的整体信息, 这是由于CO的生成是在火焰内部发生的化学反应, 而当量比的变化更能够影响火焰的形状结构。 因此通过高光谱数据借助卷积神经网络能够实现对火焰特性的预测。
从实验和理论上验证了神经网络方法在燃烧特性预测领域的可行性:
(1)针对目前在燃烧领域特性测量较为复杂的问题, 本文实现了从层流、 湍流到通用燃烧特性预测模型的建立。 首先在实验室小火焰上验证卷积神经网络对燃烧特性参数预测的可行性, 并对模型的参数进行了优选; 后将该模型运用到实际工程火焰特性的预测, 探索不同网络结构对模型结果的影响包括不同卷积层数、 小波去噪处理和迁移学习; 最后建立通用燃烧特性预测模型分别在层流和湍流火焰特性的预测结果中达到了98%和94%的平均准确率。
(2)在通用模型中为了解决不同数据集中标签种类不一致的问题, 本文提出一种自定义损失函数。 该函数的使用实现了不同数据的高效融合, 从而允许数据在统一的网络架构下共同训练, 在增强了模型学习能力的同时, 还提高了数据的综合利用效率, 也扩展了模型多场景的适用性。
(3)使用Grad-CAM方法探究神经网络的决策过程。 在通用模型中分别针对层流预测当量比以及湍流预测CO进行研究, 参考相应的燃烧反应过程进行分析。 发现在空间维度上当量比的预测更加关注火焰轮廓, 而在CO的预测中更加关注火焰的整体; 在光谱维度上均对水蒸气的波段非常敏感, 说明在燃烧反应中水蒸气的辐射中存在大量信息, 能够对神经网络的火焰特性参数预测起到重要的作用。
本工作解决了在工程中监测燃烧特性需要多种采集设备及现场取样的难题, 且能够预测不同类型的燃烧特性, 相比于传统方式更加快捷与方便, 将其应用于实际工业生产中拥有广阔的前景。
[1] |
|
[2] |
|
[3] |
|
[4] |
|
[5] |
|
[6] |
|
[7] |
|
[8] |
|
[9] |
|
[10] |
|
[11] |
|
[12] |
|
[13] |
|
[14] |
|
[15] |
|
[16] |
|
[17] |
|
[18] |
|
[19] |
|