基于K-CV参数优化支持向量机的LIBS燃煤热值定量分析
董美蓉1,2,3, 韦丽萍1,2,3, 陆继东1,2,3,*, 黎文兵1,2,3, 陆盛资1,2,3, 黄健伟1,2,3, 李诗诗1,2,3, 骆发胜1,2,3, 聂嘉朗1
1. 华南理工大学电力学院, 广东 广州 510640
2. 广东省能源高效低污染转化工程技术研究中心, 广州 广东 510640
3. 广东省能源高效清洁利用重点实验室, 广东 广州 510640
*通讯联系人 e-mail: jdlu@scut.edu.cn

作者简介: 董美蓉, 女, 1985年生, 华南理工大学电力学院副教授 e-mail: epdongmr@scut.edu.cn

摘要

热值是煤质特性的重要参数之一, 很大程度上影响着燃煤锅炉的运行。 为了克服传统检测方法所存在的问题, 将激光诱导击穿光谱(LIBS)应用于燃煤热值的定量分析。 煤的结构复杂, 所含的元素种类众多, 包括了主量元素、 次量元素和痕量元素, 致使煤的LIBS光谱信息复杂。 如何有效提取LIBS光谱信息, 实现准确的定量化测量是LIBS在煤特性检测中发挥作用的前提和基础。 近年来, 随着人工智能技术的发展, 相关的分析技术也开始应用于煤的工业指标分析和热值预测中。 为实现煤样品中LIBS光谱信息的有效提取, 同时为克服常规的分析方法易出现的过渡拟合、 收敛性不好等问题, 提出采用结合K-fold Cross Validation(K-CV)参数优化的支持向量机(SVM)回归方法, 实现LIBS定量分析煤中的热值。 SVM方法是结构风险最小化的近似实现, 可用于模式分类和非线性回归。 为了得到有效的LIBS分析模型, 实验选用44种电厂常用的热值含量不同的煤样作为实验对象, 选择其中33个作为训练集, 剩余11个为测试集。 利用搭建的LIBS实验系统获取所选煤样品的等离子体发射光谱数据, 首先分析了SVM热值回归模型的参数-惩罚因子 C、 核函数参数 g与模型精度的关联, 确定 C g最佳取值范围, 然后分别建立了基于LIBS全谱和某些元素(非金属元素和金属元素)特征光谱的SVM回归模型。 利用训练集光谱数据, 结合K-CV法得到热值SVM回归模型的最优参数 C g的值, 建立基于SVM最优参数的煤热值定量分析模型。 然后将测试集的光谱数据作为输入量用于测试所建立模型的可靠性, 得到分别采用全谱、 非金属元素特征光谱、 非金属与金属元素特征谱相结合的热值定量分析模型, 其决定系数 R2均达到0.99以上, 均方误差分别为0.12, 0.17和0.06 (MJ·kg-1)2, 预测平均相对偏差分别为1.2%, 1.23%和0.69%。 结果表明: 基于K-CV参数优化SVM回归方法可用于LIBS技术实现燃煤热值的定量分析, 且可得到较高的分析精确度和准确度; 同时通过对比选用不同的光谱特征的定量分析模型可知, 采用非金属与金属元素的特征光谱所建立的基于K-CV参数优化SVM的热值定量模型, 能够有效提高LIBS应用于快速检测煤热值的精度和准确度, 实现煤热值的准确预测。

关键词: ; 热值; 激光诱导击穿光谱; 支持向量机; 定量; K-CV
中图分类号:O433.1 文献标志码:A
Quantitative Analysis of LIBS Coal Heat Value Based on K-CV Parameter Optimization Support Vector Machine
DONG Mei-rong1,2,3, WEI Li-ping1,2,3, LU Ji-dong1,2,3,*, LI Wen-bing1,2,3, LU Sheng-zi1,2,3, HUANG Jian-wei1,2,3, LI Shi-shi1,2,3, LUO Fa-sheng1,2,3, NIE Jia-lang1
1. School of Electric Power, South China University of Technology, Guangzhou 510640, China
2. Guangdong Province Engineering Research Center of High Efficient and Low Pollution, Guangzhou 510640, China
3. Guangdong Province Key Laboratory of Efficient and Clean Energy Utilization, Guangzhou 510640, China
Abstract

Heat value is one of the important parameters of coal quality, and it greatly affects the operation of coal-fired boilers. In order to overcome the shortcomings of traditional detection methods, laser induced breakdown spectroscopy (LIBS) was applied to quantitative analysis of heat value in coal. The structure of coal is complex. It contains many types of elements, including major, minor and trace elements, which would result the complexity of LIBS spectral information from coal. It is premise and foundation to effectively extract LIBS spectral information and achieve accurate quantitative measurement by using LIBS. In recent years, as the development of artificial intelligence technology, relevant analytical techniques have also been applied to the proximate analysis and heat value prediction of coal. In order to realize the effective extraction of LIBS spectral information in coal samples and overcome the problems such as transient fitting and poor convergence that are easily caused by conventional analytical methods, the K-fold cross validation (K-CV) parameter-optimized combined with Support Vector Machine (SVM) regression was proposed to quantitatively analyze the heat value in coal. The SVM method is an approximate realization of structural risk minimization, which can be used for pattern classification and nonlinear regression. 44 coal samples with different heat values commonly used in the power plant were selected as experimental objects, 33 of which were selected as training sets, and the remaining 11 were test sets. The correlation between the parameters of the SVM regression model-penalty factor C, the kernel function parameter g and the model accuracy were firstly analyzed based on the laser-induced coal spectrum and the best search scope for C and g were determined. Then the SVM regression model was established based on the LIBS full-spectrum and some typical elements (non-metallic elements and metal elements) feature spectra, respectively. The optimal parameters C, g of the heat value SVM regression model is obtained by using the training set spectral data, combined with the K-CV method. The spectral features of the prediction set as input are to test the reliability of the model. The calibration model established by the full spectrum, non-metallic element characteristic spectrum, as well as non-metal and metal element characteristic spectrum, respectively, could all reached 0.99, with the mean square error of 0.12 , 0.17 and 0.06 (MJ·kg-1)2, the forecasted average relative deviations were 1.2%, 1.23% and 0.69%. The results showed that the SVM regression method based on K-CV parameter-optimized could be used for quantitative analysis of coal heat value using LIBS technology, and could obtain higher analysis accuracy. At the same time, by comparing the quantitative analysis models using different spectral features, the quantification model of heat value by using the characteristic spectrum of non-metal plus metal elements, can effectively improve the accuracy of LIBS in the rapid detection of heat value in coal. This method can achieve accurate prediction of heat value in coal.

Keyword: Coal; Heat value; Laser-induced breakdown spectroscopy; Support vector machine; Quantitative K-CV
引 言

煤的热值是计算煤耗、 热效率、 燃烧设备热平衡、 确定不同煤混和配比等的关键参数, 也是评价煤品质的重要指标。 目前, 煤热值的离线分析方法主要是通过弹筒量热仪测量反应物与生成物的焓差计算得到[1]。 这种方法操作简单、 结果比较精确, 但是整个分析周期一般需要几个小时, 难以满足工业生产过程的要求。

市场上相对较成熟的可实现包括热值分析的煤工业分析指标快速分析装置主要是基于γ 射线和中子活化分析(PGNAA)的煤质分析仪[2]。 但该技术中γ 射线对人体存在很大的安全隐患, 且该类设备复杂, 投资大, 不利于市场推广。 因此, 应用新的理论和方法实现燃煤热值的快速测定具有重要意义。 激光诱导击穿光谱(laser-induced breakdown spectroscopy, LIBS)是近年来发展起来的一种可实现样品中多组分同步快速分析技术, 已被尝试应用于各种工业过程的质量控制和过程监测[3]

姚顺春等[4]运用LIBS分析燃煤灰成分组成元素, 结合内标法实现灰分主要成分(SiO2, Al2O3, Fe2O3, CaO, MgO和TiO2)的定量分析。 张雷等[5]运用LIBS实现了煤中各元素(C, Ca, Mg, Ti, Si, H, Al, Fe)的定量分析, 并由元素分析得到了工业分析, 该团队[6]还利用LIBS分析了飞灰中的未燃碳含量。 Haider等[7]运用LIBS检测了煤中的C和Si以及一些大都存在于灰分中的金属元素(Fe, Ti, Al, Ca, Na, Cu, Zr, Nd, Yb, Ce, Sm和Dy等)。 董美蓉等[8]运用LIBS结合多元定标法定量分析了煤粉碳元素, 得到预测值的相对误差在5%以内。

LIBS作为一项点测量技术, 基体效应明显, 探测到的光谱信息可以一定程度上反应基体特征。 因此LIBS不仅可实现煤中各元素分析, 还可实现煤的工业指标分析。 而如何有效提取LIBS光谱信息, 实现准确的定量化测量是LIBS技术在煤特性检测中发挥作用的前提和基础, 也是目前国内外研究者所关注的热点问题。 近年来, 随着人工智能技术的发展, 相关的分析技术也开始应用于煤的工业指标分析和热值预测中。 Haider等[9]采用LIBS结合线性回归方法实现煤中灰分分析, 其相关系数达到0.99。 Yao等[10]采用LIBS结合偏最小二乘法定量分析煤中灰分, 其预测值的平均相对标准偏差为8.50%。 同时还采用LIBS结合人工神经网络、 遗传算法定量分析煤中的灰分、 挥发分、 固定碳和热值, 取得了不错的结果[11, 12]。 黎文兵等[13]结合LIBS光谱平滑预处理和偏最小二乘法, 实现煤中热值的定量分析, 提升了煤中热值的预测可靠性。 Wang等[14, 15]以煤样品的LIBS光谱数据为基础, 用偏最小二乘法对煤的灰分、 挥发分及热值进行定量分析, 提高了模型预测精度。 王帝等[16]提出了LIBS对煤中热值检测的一种新型校正模型, 对LIBS光谱数据进行自吸收效应、 元素间相互干扰、 基体效应修正后再进行多元线性回归建模, 提高了煤中热值检测的可靠程度、 预测能力。

常规的神经网络方法存在局部极小化、 过学习、 收敛速度慢等缺陷, 而偏最小二乘法存在主成分选取非最优化和过渡拟合、 收敛性不佳以及收敛速度慢等问题, 减弱了其模型的预测能力。 谭鹏等[17]引入支持向量机(SVM)方法应用在基于工业分析基础上的煤热值预测, 克服了以上方法中存在的问题, 提高了煤热值的预测精度。 另外, 极少数作者涉及到了支持向量机模型的参数优化问题, 如江文豪等[18]提出了一种基于遗传算法优化参数支持向量机(GA-SVM)的燃煤热值预测方法, 提高了模型的逼近能力, 在学习能力和泛化能力之间取得了平衡。 但GA算法存在不成熟的过早收敛或者收敛缓慢甚至不收敛等问题, 其搜索效果不稳定。 而基于K-fold Cross Validation(K-CV)参数优化方法可以有效避免上述问题, 且K-CV还可有效地避免过学习以及欠学习状态的发生, 最后得出的结果具有较强的说服力。

本工作采用基于K-CV参数优化支持向量机算法对煤的热值进行定量分析。 首先分析了核函数的参数和惩罚因子对SVM热值预测模型的影响, 然后分别建立了基于全谱和特征元素光谱特征(金属元素和非金属元素)的SVM定量分析模型, 并比较了基于不同光谱特征所建立模型的准确度和精确度。

1 实验部分
1.1 样品

实验选取了44种电厂常用煤样品, 经过磨煤、 过筛(30个· cm-2孔), 最后烘制成干燥基, 测到的样品在干燥基下的高位热值如表1中所示(数据由广州市特种承压设备检测研究院提供), 并将44个煤样本分为训练集和测试集两组。 为了使测试集的热值等梯度地分布于训练集中, 选取#3, #7, #11, #15, #19, #23, #27, #31, #35, #39和#43这11个样品作为测试集样品, 剩下的33个煤样品为训练集样品。 为了提高LIBS分析系统信号采集的稳定性, 实验前将各煤样称取3.5 g, 使用压片机在压力为6.5 t下将粉末状煤样品压成直径3 mm、 表面平整的圆柱状样品。

表1 44种煤样品的高位热值(干燥基) Table 1 Heat value of 44 coal samples (dry basis)
1.2 仪器及参数

采用的LIBS实验系统, 详见参考文献[13], 该系统中的激光光源是波长为1 064 nm的Nd:YAG调Q固体脉冲激光器(Brilliant EaZy, 法国Quantel公司), 激光的最大能量是300 mJ, 脉宽是6 ns。 实验过程中设定激光器的脉冲频率为1 Hz、 激光能量为50.75 mJ(标准偏差0.61%)。 激光从激光器输出, 经45° 反射镜、 焦距为100 mm的透镜垂直聚焦在煤样品上(焦点位置在样品表面以下1 mm)。 集光系统是内部集成了2 048 pixels线阵CCD作为探测器件的光纤光谱仪(AvaSpec-2048FT, 荷兰Avantes公司), 其由两个探测通道组成, 波长覆盖范围为230~400和580~790 nm, 分辨率为0.3~0.4 nm。 激光与样品作用后产生的等离子体由与样品表面成45° 的准直透镜收集, 经光谱仪、 CCD, 实现分光、 光电转换、 数据的采集和储存。 为获得较好的信噪比, 激光器触发与光谱仪开始采集之间的延时通过DG535脉冲信号发生器设置为1.664 μ s, CCD的积分时间设置为1.1 ms(最小积分时间)。 每个煤样品选取6个位置, 每个位置采集50幅光谱, 取平均后作为一个样品的LIBS数据。

1.3 SVR理论

支持向量机(SVM)是结构风险最小化的近似实现, 其能够根据有限的样本信息, 在学习能力和泛化能力之间取得平衡。 SVM可用于模式分类和非线性回归, 当将其用于回归时被称为支持向量机回归(SVR)。 常用的支持向量回归机有ε -SVR支持向量回归机和ν -SVR支持向量回归机, 使用ε -SVR需要先确定不敏感损失函数中的参数, 而在煤的热值预测中却是很难确定该参数。 本文运用到的SVM回归机类型是ν -SVR支持向量回归机, 该方法可以通过选择参数ν 自动确定ε 的值, 使得算法更加适用于煤中热值的定量分析。 该方法的基本思想是: 获得煤样品的训练集样本(xi, zi)(其中i=1, 2, …, l; xiRm, 输入量即煤样品光谱强度矩阵; ziR, 为对应的输出值即煤的热值, 利用核函数将x映射到一个高维空特征空间, 在该特征空间用以下回归函数进行回归

f(X)=(x)+b(1)

其中, wb分别是权向量、 偏差; 为核函数。 φ (x)支持向量机通过对以下目标函数极小化求回归函数

minw, b, ξ, ξ* , ε12wTw+Cνε+1li=1l(ξi+ξi* )(2)

其中, ν 是控制支持向量机数量的参数, ν ∈ (0, 1]。 式(2)约束条件为

(wTϕ(xi)+b)-ziε+ξizi-(wTϕ(xi)+b)ε+ξi* ξi, ξi* 0, i=1, , l, ε0(3)

其中, C为惩罚因子, C> 0; ξ i, ξi* ≥ 0为松弛因子; ε 为不敏感损失函数。 上述最优化问题的对偶问题是

minα, α* 12(α-α* )TQ(α-α* )+zT(α-α* )(4)

约束条件是

eT(α-α* )=0,  eT(α+α* )0αi,  αi* Cl,  i=1, , l(5)

求解以上对偶问题后可以得到

f(x)=i=1l(-αi+αi* )K(xi, x)+b(6)

式(6)中, K(xi, x)为核函数。 由于煤样品的LIBS光谱数据包含信息众多, 光谱数据与煤中热值存在非线性的对应关系; 同时所探测到的光谱数据不仅包含了各主要元素的特征谱线, 还包含了噪声、 背景等信息。 致使所采用的核函数需适用于非线性回归且对数据中存在的噪声有较好的抗干扰能力, 因此选择高斯径向基核函数(RBF)

K(x, xi)=exp(-gx-xi2),  g> 0(7)

其中, g为核函数参数, g= 12σ2, σ 为核函数宽度参数, 控制核函数的径向作用范围。

影响ν -SVR模型的参数有惩罚因子C, 核函数参数g, 控制支持向量数量的参数ν 。 建立的ν -SVR模型采用的核函数是RBF核函数, 在利用该模型对煤中热值进行回归预测时, 较大程度上影响该模型预测准确度和精度的参数是CgC的大小表示当超出经验误差后对样本的惩罚程度, 该值越大, 则惩罚程度越高, 但是该值过大, 会导致出现过拟合状态。 而当C值过小, 则说明对超出经验误差的样本惩罚过小, 会导致欠拟合状态。 g的大小决定核函数的特征空间, 可用于表征样本数据子空间分布的复杂程度, 如果该值过小, 模型会相对比较复杂, 推广能力得不到保证。 而g过大, 模型又难以达到足够的精度。

1.4 K-CV参数优化理论

K-CV参数优化方法是基于交叉验证(cross validation, CV)思想下的一种网格寻优方法。 K-CV参数优化方法的原理是将样本分成K组, 将每组子集的样本分别作一次测试集, 而同时, 将其余的K-1组子集的样本作为训练集, 共可获得K个模型, 将K个模型对应测试集的回归均方误差的均值作为回归性能判断指标。 对33个训练集样品的全谱, 结合K-CV法对模型参数进行优化, 得到的最低均方误差(CVmse)随K值的变化如表2所示, 从中可以看出在K=5时最低均方误差最小, 因此选取K=5。

表2 参数优化过程的最低均方误差随K值的变化结果 Table 2 The lowest mean square error (CVmse) varied with the K value in the parameter optimization process
1.5 模型评价指标

基于K-CV参数优化SVM回归模型的评价指标包括: 首先从模型整体评价其预测能力, 参数优化CV过程中最低均方误差(best cross validation MSE, CVmse)、 均方误差 (mean square error, MSE)、 决定系数(R2); 其次从单次测量上评价模型的预测能力, 预测平均相对偏差(average relative deviation, ARD)、 预测最大相对偏差(maximum relative deviation, MRD), 这里的相对偏差指煤样品测试集热值预测值与真值的相对偏差的绝对值, 其表达式为

相对偏差=单次预测值-真值真值×100%(8)

均方误差的表达式为

MSE=1ki=1k(yi-y~i)2(9)

其中, yiy~i为第i个煤样品热值的真实值、 预测值, k为样本数。

R2的表达式为

R2=i=1n(yi-y̅)(y~i-y~¯)i=1n(yi-y̅)2i=1n(y~i-y~¯)2(10)

其中, yi, y~i, y̅y~¯为第i个煤样品热值的真实值、 预测值、 样品热值真实值的平均值、 样品热值预测值的平均值。

2 结果与讨论

在对煤样品热值进行回归建模前, 无论是利用全谱还是特征谱(非金属谱、 非金属加金属谱)建立SVM回归模型, 都对光谱数据进行平滑预处理[13]。 图1是#1煤样品经过平滑处理后的LIBS光谱图。

图1 #1煤样品平滑处理后的LIBS光谱图Fig.1 LIBS spectra of 1# coal sample after smoothing

煤的基体成分复杂, 在受激发形成等离子体后冷却过程中, 不同元素发出的原子光谱频率和强度不同, 则每一个样品不同波长点(即不同维度)的光谱强度数值量纲差别较大。 为了防止归一化过程中量纲数量级低的属性变为零, 从而使得样本某些原始信息丢失, 对平滑处理后的光谱矩阵每一维度进行归一化(即按列归一化)。 具体步骤为: 从m个热值不同的煤样品中获取m组光谱数据; 将m组光谱数据都运用式(11)对每一维度归一化处理, 得到[ymin, ymax], 则归一化处理后每一维度里的y可表示为

y=(ymax-ymin)(x-xmin)(xmax-xmin)+ymin(11)

式中, x为原始数据, y为归一化后的数据, ymax为归一化范围的上限值, ymin为归一化范围的下限值, xmax为每一维度里最大的原始值, xmin为每一维度里最小的原始值。

2.1 基于全谱的SVR热值预测分析

为了研究支持向量机回归模型参数-惩罚因子C、 核函数参数g对热值回归模型的影响, 首先将探测到的全谱数据作为输入变量, 取搜索步长为2n, n∈ [-12, 12]分析参数Cg在取不同数值(即C的取值是2-12, 2-11, …, 212, g的取值是2-12, 2-11, …, 212)的情况下, 对训练模型的影响。 如图2中的(a)所示为Cg的变化对训练模型均方误差(MSE)的影响, 从中可以看出, 在g值小于2-1时, C值越大训练模型的MSE越小。 而在C值大于25后, g值得变化对模型结果的影响不大。

图2 Cg的变化对训练模型均方误差(MSE)(a)与模型预测精度(b)的影响Fig.2 Effect of changes in C and g on (a) MSE of training model and (b) model prediction accuracy

如图2的(b)所示为Cg的变化对测试集均方误差(MSE)的影响, 旨在进一步分析参数Cg不同时对模型预测热值精度的影响。 从中可以看出, 当C值超过1 024(即210)时, 即使在g值很小的情况下, 测试集的MSE也会随着C值的增大而增大, 即会产生过拟合现象(拟合的模型完美匹配训练集数据, 但对新数据的预测结果较差)。 而在C值大于25小于210g值小于2-10时, 再减小g值取值(比如从2-10到2-12这段), 对模型的影响比较微小。 因此, 在对煤热值进行支持向量机回归模型参数优化时, 惩罚因子C的寻优范围可选择小于210, g值得寻优范围可考虑大于2-12。 即在基于全谱或特征谱建立热值定量模型过程中, C值的优化区间为: [2-10, 210], g值的优化区间为[2-12, 212]。

利用实验采集到的全部光谱来建立热值预测模型。 运用该方法建立预测模型的参数优化结果如图3的(a)所示。 得出的最佳参数C为512, g为0.000 244 14, 交叉验证过程中CVmse为0.21 (MJ· kg-1)2

图3 基于全谱的参数优化结果(a)与热值预测模型(b)Fig.3 Full-spectrum-based parameter optimization results (a) and heat value predicted model (b)

运用该最优模型预测测试集煤样品的热值, 预测结果如图3的(b)所示。 训练集的R2为0.997, 测试集的R2为0.991, 且MSE为0.12 (MJ· kg-1)2 。 预测值与真值的对比分析如表3所示, 最大相对偏差为2.81%, 最小相对偏差为0.10%, 平均相对偏差ARD为1.20%。

表3 分别利用全谱、 特征谱预测热值的结果对比 Table 3 Comparison of predict heat values between full spectrum and characteristic spectrum
2.2 基于特征谱线的SVR热值分析

C和H元素对燃煤热值有直接影响, O和N是有机物中的不可燃成分, 它们的含量对煤的热值也有间接影响。 因此可考虑利用所探测到的与这些非金属元素相关的特征光谱C, H, CN, O和N作为SVM模型的输入变量, 用以建立热值分析模型, 以进一步分析LIBS光谱与预测煤中热值精度的关联性。 采用的非金属元素相关的特征谱线如表4所示。

表4 主要非金属与金属元素的特征谱线 Table 4 Spectral emission lines of the major non-metal and metal elements

运用该方法建立预测模型, 得出的最佳参数C为128, g为0.5, 交叉验证过程中CVmse为0.52 (MJ· kg-1)2。 运用该最优模型预测测试集煤样品的热值, 预测结果如图4(a)所示。 训练集的R2为0.997, 测试集的R2为0.993, 且MSE为0.17 (MJ· kg-1)2。 预测值与真值的对比分析如表3所示, 最大相对偏差为2.7%, 最小相对偏差为0.07%, 平均相对偏差ARD为1.23%。

图4 基于非金属特征光谱(a)和非金属与金属结合特征光谱(b)的热值模型Fig.4 Heat value models based on Based onnon-metal spectra (a) and non-metal plus metal spectra (b)

除了C, H, O, N几种非金属元素对燃煤热值有影响外, 煤中灰分的主要成份Si, Al, Fe和Ca以及少量Mg等对热值也会产生影响。 因此考虑将所采集到的各主要非金属元素和金属元素(C, H, CN, O, N, Ca, Mg, Al, Fe, Si)的特征光谱强度同时作为输入变量, 所选择的特征峰的谱线如表4所示。

基于所述非金属与金属元素的特征谱线所建立的定量分析模型, 得出的最佳参数C为1 024, g为0.015 625, 交叉验证过程中CVmse为0.46 (MJ· kg-1)2。 运用该最优模型预测测试集煤样品的热值, 预测结果如图4中(b)所示。 训练集的R2为0.995, 测试集的R2为0.995, 且MSE为0.06 (MJ· kg-1)2。 预测值与真值的对比分析如表3所示, 最大相对偏差为2.49%, 最小相对偏差为0.09%, 平均相对偏差ARD为0.69%。

图5为基于全谱和特征元素光谱所建立的热值定量分析模型对训练集样本的模型评价指标的对比。 从中可以看出, 利用非金属元素光谱强度建立的热值SVM回归模型可以达到较高的分析精度, 主要是因为热值主要与煤中有机质有关, 但是相对利用其他两种输入变量的定量分析方法而言, 其均方误差MSE、 平均相对偏差ARD较大, 主要是因为非金属元素的激发能级较高, 同时易受环境的影响, 因此谱线的波动会较大。

图5 分别利用三种光谱信息预测热值评价指标对比Fig.5 Comparison of the evaluation index of predicting heat values using three spectral information

在燃烧过程中, 煤中的矿物质也会发生分解反应, 即吸收热量, 因此灰分的主要成份Si, Al, Fe和Ca以及少量Mg等对热值也会产生影响, 同时相对C和H等非金属元素, 这些元素易电离, 不可避免会对整个等离子体特性产生一定的影响。 因此, 在利用非金属加金属光谱强度建立的SVM回归模型预测热值时, 由于充分利用了以上对燃煤热值有影响的多种元素的光谱数据, 结果优于仅利用几种非金属元素谱线强度建立的模型。 而利用全谱强度建立的SVM回归模型, 虽然充分纳入了以上对热值有影响的多种元素谱线强度, 但其包含的噪声、 背景等谱线增加了对热值回归模型的干扰, 使得模型预测可靠度有所下降, 但优于只利用非金属谱线强度建模的结果。

4 结 论

将激光诱导击穿光谱应用于煤热值的定量分析, 选择44种电厂常见的热值不同的煤样作为实验对象, 提出了基于K-CV参数优化支持向量机算法。 首先分析了燃煤热值SVM回归模型参数-惩罚因子C、 核函数参数g对模型的影响, 进而确定了Cg的最优取值空间分别为[-10, 10], [-12, 12]。 针对燃煤LIBS光谱的复杂性, 提出了分别将LIBS系统采集到的全谱强度、 特征谱线(非金属谱、 非金属加金属谱)强度归一化后的数据作为输入变量, 用以建立SVM回归热值定量模型。 结果表明, 利用非金属加金属谱线强度建立的回归模型可以得到最佳的分析效果, 其测试集R2达到0.995, MSE为0.06 (MJ· kg-1)2, ARD为0.69%。 实验证明了基于K-CV参数优化支持向量机算法在预测煤热值的可适性, 而该预测方法结合了K-CV参数优化和SVR算法, 使得定标模型具有较好的推广力, 为煤质在线定量分析提供更加快速、 精确的分析方法。

参考文献
[1] ASTM D5865—10 Stand ard Test Method for Gross Calorific Value of Coal and Coke. ASTM International, 2011. [本文引用:1]
[2] ZHAO Zhong-hui, FANG Quan-guo(赵忠辉, 方全国). Coal Quality Technology(煤质技术), 2017, (4): 18. [本文引用:1]
[3] Wang Z, Yuan T B, Hou Z Y, et al. Frontiers of Physics, 2014, 9(4): 419. [本文引用:1]
[4] Yao S C, Xu J L, Bai K J, et al. Plasma Science and Technology, 2015, 17(11): 938. [本文引用:1]
[5] Zhang L, Ma W, Dong L, et al. Applied Spectroscopy, 2011, 65(7): 790. [本文引用:1]
[6] Zhang L, Hu Z Y, Yin W B, et al. Frontiers of Physics, 2012, 7(6): 690. [本文引用:1]
[7] Haider A, Rony M A, Lubna R S, et al. Optics & Laser Technology, 2011, 43(8): 1405. [本文引用:1]
[8] DONG Mei-rong, LU Ji-dong, YAO Shun-chun, et al(董美蓉, 陆继东, 姚顺春, ). Journal of Engineering Thermophysics(工程热物理学报), 2012, 33(1): 175. [本文引用:1]
[9] Haider A, Rony M A, Abedin K M. Energy & Fuels, 2013, 27(7): 3725. [本文引用:1]
[10] Yao S, Lu J, Dong M, et al. Applied Spectroscopy, 2011, 65(10): 1197. [本文引用:1]
[11] Yao S, Mo J, Zhao J, et al. Applied Spectroscopy, 2018, 72(8): 1225. [本文引用:1]
[12] Lu Z, Mo J, Yao S, et al. Energy & Fuels, 2017, 31(4): 3849. [本文引用:1]
[13] Li W, Lu J, Dong M, et al. Energy & Fuels, 2017, 32(1): 24. [本文引用:3]
[14] Yuan T, Wang Z, Lui S L, et al. Journal of Analytical Atomic Spectrometry, 2013, 28(7): 1045. [本文引用:1]
[15] LI Xiong-hui, WANG Zhe, LIU Han-qiang, et al(李雄威, 王哲, 刘汉强, ). Infrared and Laser Engineering(红外与激光工程), 2017, 46(7): 734001. [本文引用:1]
[16] WANG Di, LU Ji-dong, DONG Mei-rong, et al(王帝, 陆继东, 董美蓉, ). Spectroscopy and Spectral Analysis(光谱学与光谱分析), 2016, 36(8): 2607. [本文引用:1]
[17] TAN Peng, LI Xin, ZHANG Xiao-pei, et al(谭鹏, 李鑫, 张小培, ). Journal of China Coal Society(煤炭学报), 2015, 40(11): 2641. [本文引用:1]
[18] JIANG Wen-hao, WEI Hong-qi, QU Tian-zhang, et al(江文豪, 韦红旗, 屈天章, ). Thermal Power Generation(热力发电), 2011, 40(3): 14. [本文引用:1]