基于可见光-近红外光谱的煤岩识别方法实验研究
徐良骥1,2, 孟雪莹2, 韦任2, 张坤2
1.深部煤矿采动响应与灾害防控国家重点实验室, 安徽 淮南 232001
2.安徽理工大学空间信息与测绘工程学院, 安徽 淮南 232001

作者简介: 徐良骥, 1978年生, 安徽理工大学空间信息与测绘工程学院教授 e-mail: ljxu@aust.edu.cn

摘要

以淮南矿区谢桥矿和潘二矿的煤和岩石样本为研究对象, 通过地物光谱仪采集样本反射率光谱曲线, 同时检测样本氧化物含量、 水分、 灰分及挥发分含量, 将样本的反射率光谱曲线和样本成分含量分别作为自变量, 样本类别“煤”和“岩石”两种矿物类型作为因变量, 建立煤和岩石识别模型对煤和岩石进行二分类。 该研究主要采用三种模型, 分别为主成分分析结合支持向量机(PCA-SVM)、 主成分分析结合BP神经网络(PCA-BP)模型和核主成分分析结合支持向量机(KPCA-SVM)模型。 结果表明, 基于可见光近红外光谱的三个模型中, 核主成分分析结合支持向量机模型的识别精度最高, 建模平均精度为95.5%, 验证平均精度约为90.56%; 基于样本成分的三个模型中, 核主成分分析结合支持向量机模型的识别精度最高, 建模平均精度为98.5%, 验证平均精度约为95%。

关键词: 可见光-近红外光谱; 主成分分析; 核主成分分析; 支持向量机; BP神经网络
中图分类号:TP79 文献标志码:A
Experimental Research on Coal-Rock Identification Method Based on
XU Liang-ji1,2, MENG Xue-ying2, WEI Ren2, ZHANG Kun2
1. National Key Experiment of Mining Response and Disaster Prevention and Control in Deep Coal Mine, Huainan 232001, China
2. School of Spatial Information and Geomatics Engineering, Anhui University of Science and Technology, Huainan 232001, China
Abstract

Taking the coal and rock samples retrieved from the Huainan Xieqiao Mine and the Paner II Mine as the research object, the sample reflectance spectrum curve was collected by a ground spectrometer, and the sample’s oxide content, moisture, ash and volatile content were simultaneously detected to reflect the sample’s reflection. The rate spectral curve and the sample component content are used as independent variables, and the sample type is used as the dependent variable to establish a coal and rock identification model to classify coal and rock. This paper mainly adopts three models, which are principal component analysis combined with support vector machine (PCA-SVM), principal component analysis combined with BP neural network (PCA-BP) model and kernel principal component analysis combined with support vector machine (KPCA-SVM) model. The results show that among the three models based on visible light near-infrared spectroscopy, nuclear principal component analysis combined with support vector machine model has the highest recognition accuracy, the average accuracy of modeling is 95.5%, and the average accuracy of verification is about 90.56%; three based on sample components. In the model, the kernel principal component analysis combined with the support vector machine model has the highest recognition accuracy, the average accuracy of modeling is 98.5%, and the average accuracy of verification is about 95%.

Keyword: Visible-near infrared spectroscopy; Principal component analysis; Nuclear principal component analysis; Support vector machine; BP neural network
引言

煤岩识别是实现智能化选煤和综采工作面无人化的前提。 近年来随着计算机技术的迅速发展, 煤矿生产自动化水平显著提高, 也使得综合开采工作面的无人化操作和选煤厂智能化选煤的实现成为可能[1]。 智能化技术的实现在很大程度上提高煤炭生产的安全性[2]。 煤岩识别技术的实现对煤炭绿色开采、 精准开采具有重大的实际意义[3]

近年来, 遥感技术在矿区煤炭勘探开采、 煤和岩石的性质测定、 土壤和水体的污染监测等方面得到广泛应用[4, 5]。 在煤炭资源勘探开发各阶段遥感技术主要应用于资源调查评价、 矿区卫星测图、 矿产资源开发及矿区环境监测等领域[6], 在煤炭开采过程中, 可以利用遥感图像对矿区地层分布特征进行提取。 对于土壤与水体污染监测方面, 遥感技术更是可以直接利用地物光谱反射率进行地物提取与监测。 近年来, 井下无人开采成为国内外研究的热点, 而煤岩识别正是井下无人开采的关键, 在传统煤岩识别过程中, 人工识别效率低下, 因此如何准确的实现煤岩识别成为该研究领域亟待解决的问题。 宋亮等[7]研究了基于可见光-近红外和热红外联合分析煤和岩石分类方法; 王卫东等[8]研究了基于激光三维扫描与动态称重的煤岩石光电分选系统; Yang等[9]利用可见光和近红外(VIS-NIR)反射光谱进行煤岩石识别; Wang等[10]使用太赫兹时域光谱法对煤和岩石进行表征和分类。 本文基于可见光-近红外光谱和样本成分含量研究煤岩的识别方法。

1 实验部分
1.1 研究区概况

实验样本共29份, 其中煤样15份, 岩石样本14份, 样本来源如下:

从谢桥矿采集煤和岩石样本共11份, 其中煤样7份, 岩石样本4份, 7份煤样按顺序命名为XQM1, …, XQM7, 岩石样本按顺序命名为XQG1, …, XQG4。 煤的类型主要为烟煤, 岩石类型主要为砂岩、 和泥岩。

从潘二矿采集煤和岩石样本共18份, 其中煤样8份, 岩石样本10份, 8份煤样按顺序命名为P2M1, …, P2M8, 10份岩石样本按顺序命名为P2G1, …, P2G10。

谢桥矿位于安徽省颍上县东北部, 距颍上县城约20 km, 现生产能力超过800万吨/年、 配套800万吨选煤厂的特大型现代化矿井。 潘二煤是淮南矿业集团所属的一座年设计生产能力为300万吨的大型现代化矿井。 该矿位于安徽省淮南市西北部约30 km的潘集区境内。 矿井地处淮河以北属江淮平原, 西南部与潘一矿井接壤, 西北部与潘北矿井毗邻。

图1 部分煤和岩石样本Fig.1 Some coal and rock samples

1.2 煤岩光谱差异机理分析

图2所示为煤和岩石样本的反射光谱, 由图可知, 煤的整体反射率较低, 上升平缓, 而岩石的反射率偏高, 且有吸收谷。 在1 450 nm附近, 由于水分子O— H官能基伸缩振动的第一倍频, 岩石在此处有较强吸收谷。 在1 900 nm附近, 由于岩石中的二价Fe离子和煤样中的Al2O3, 岩石存在更强的吸收谷。 在2 130~2 250 nm波段内煤与岩石存在较大差异, 这是由于Al元素在煤中主要以Al2O3的形式存在, 而在岩石中则主要以Al(OH)3形式存在, Al(OH)3的Al— OH晶格振动使得其在2 210 nm附近具有强吸收峰[11]

图2 原始光谱反射率曲线Fig.2 Original reflectance spectra

近红外光谱的主要吸收带是含氢基团C— H, O— H, N— H等的一级倍频和C— O, C— N, C— C等的多级倍频。 煤中的有机物主要包括碳(C)、 氢(H)、 氧(O)、 氮(N)等, 主要指工业分析指标的挥发分和固定碳; 无机物包括水和碳物质, 主要指工业指标的水分和灰分。 根据中国国家标准GB/T 5751《中国煤炭分类》和国际标准ISO 11760 Classification of coals对煤炭的定义标准, 煤炭是主要由植物遗体经煤化作用转化而成的富含碳的固体可燃有机沉积岩, 含有一定量的矿物质, 其灰分产率小于或等于50%[12]。 据此, 灰分和挥发分的含量差异可用于进行煤岩识别分析。

1.3 光谱数据的采集

美国ASD公司生产的地物光谱仪FieldSpec 4的光谱范围是350~2 500 nm, 有两种采样间隔分别为1.4 nm(350~1 000 nm)和2 nm(1 000~2 500 nm); 该实验的重采样间隔为1 nm。 数据采集在暗室中进行, 选择50 W的卤素灯为光源、 25° 裸光纤镜头接收反射波段。 测量时将样本放入直径为100 mm, 高2 mm的透明玻璃培养皿中, 光源距离样品40 cm, 光线与样品成45° 角, 探头距样本10 cm位于光源对面, 探头光纤末端位于煤、 岩石样本正上方。 在对样本进行光谱测量前需要进行白板校正, 每个样本采集30条曲线, 对获取的煤和岩石样本反射光谱曲线采用ViewSpecPro软件进行预处理(剔除异样数据、 断点修复, 光滑处理等), 最后将各组曲线的算术平均值作为样本的原始光谱反射率值, 如图2所示。

1.4 样品成分含量检测

采用GB212— 2008煤的工业分析方法对煤和岩石样本的水分、 灰分、 挥发分进行测定。 测定结果如表1所示, 具体测定步骤如下:

表1 两矿煤样工业指标测试结果 Table 1 Test results of industrial indicators of coal samples from two mines

(1)样本水分的质量分数(Mad)采用空气干燥法[13]

称取粒度粒径为0.15 mm煤样、 岩石样本(1± 0.1) g, 称准至0.000 2 g, 平摊在称量瓶中。 每个样本设置三个对比样, 将样品置于105~110 ℃鼓风干燥箱内, 于空气流中干燥到质量恒定。 根据煤样的质量损失计算出水分的质量分数(Mad)。

(2)样本的灰分(Aad)采用快速灰化法[13]

①在预先灼烧至质量恒定的灰皿中, 称取粒度小于0.2 mm的一般分析实验煤样(1± 0.1) g, 称准至0.000 2 g, 均匀地摊平在灰皿中, 使其每平方厘米的质量不超过0.15 g。 将盛有煤样的灰皿预先分排放在耐热瓷板或石棉板上。

②将马弗炉加热到850 ℃, 打开炉门, 将放有灰皿的耐热瓷板缓慢地推入马弗炉中, 待5~10 min后煤样不再冒烟时, 以每分钟不大于2 cm的速度把其余各排灰皿顺序推入炉内炽热部分(若煤样着火爆燃, 停止该实验、 作废)。

③关上炉门并使炉门留有15 mm左右的缝隙, 在(815± 10) ℃温度下灼烧40 min。

④将灰皿从炉中取出, 放在空气中冷却5 min, 然后移入干燥器中冷却至室温(约20 min)后, 称量。

⑤进行检查性灼烧, 温度为(815± 10) ℃, 每次20 min, 直到连续两次灼烧后的质量变化不超过0.001 0 g为止。 以最后一次灼烧后的质量为计算依据。

(3)样本的挥发分(Vad)测定[13]:

①在预先于900 ℃温度下灼烧至质量恒定的带盖瓷坩埚中, 称取粒度小于0.2 mm的一般分析实验煤样(1± 0.1) g, 称准至0.000 2 g, 然后轻轻振动坩埚, 使样品摊平, 盖上盖, 放在坩埚架上。

②将马弗炉预先加热至920 ℃左右, 打开炉门, 迅速将放有坩埚的坩埚架送入恒温区, 立即关上炉门并计时, 准确加热7 min; 坩埚及坩埚架放入后, 要求炉温在3 min内恢复至(900± 10) ℃, 此后保持在(900± 10) ℃, 否则此次实验作废, 加热时间包括温度恢复时间。

图3 煤和岩石样本灰分实验图Fig.3 Experimental chart of ash content of coal and rock samples

图4 煤和岩石样本挥发分实验炉Fig.4 Set up for determining the volatile matter in coal and gangue

③从炉中取出坩埚, 放在空气中冷却5 min左右, 然后移入干燥器中冷却至室温(约20 min)后称量。

煤和岩石氧化物含量采用XRF检测, 检测结果如表2所示。

表2 两矿煤和岩石样本氧化物百分比含量 Table 2 Oxygen percentage contents of coal and rock samples from two mines
1.5 建模方法及参数选择分析

主成分分析是目前较常用的一种光谱特征信息提取方法, 在处理线性问题时能够取得很好的效果。 核成分分析则将数据映射到高维特征空间, 利用主成分分析实现非线性的特征提取, 改善主成分分析在非线性数据分布情况下分析结果不理想的状况。 与其他机器学习算法相比, 支持向量机(SVM)算法更适合于本实验的小训练样本、 多维度成分因素、 非线性关系问题[14]。 因此选择PCA-SVM、 PCA-BP和KPCA-SVM共三种方法进行煤岩识别的建模。 其中, 惩罚因子由网格搜索法获得, 经过多次建模试验确定最优迭代率和学习率。 模型复杂度低, 未出现过拟合现象。

2 结果与讨论
2.1 基于可见光-近红外光谱的煤和岩石识别模型

(1)主成分分析结合支持向量机(PCA-SVM)模型

煤岩识别的本质是一个二分类的问题, 并不需要区分煤或岩石具体的矿物类型。 将煤作为识别向量标签“ 0” , 岩石作为识别向量标签“ 1” , 对煤岩的特征值进行训练, 将煤岩的特征值作为自变量, 煤岩的识别标签“ 0” 和“ 1” 作为因变量, 最后利用训练的模型对验证集进行识别。 其中, 煤岩对应的特征值分别为它们在可见光-近红外波段的反射率和工业分析与XRF仪器测量出的成分含量。 随机建立训练集20个样本和验证集9个样本, 对样本反射率进行主成分分析, 确定主成分得分值利用5倍交叉验证确定最优惩罚参数和最优方差参数, 进行支持向量机模型建立, 并将验证集代入模型验证。 随机建立的20组主成分分析结合支持向量机识别模型的最优参数、 建模精度、 验证结果如表3所示。

表3 基于可见光-近红外光谱的PCA-SVM模型的模型精度 Table 3 Model accuracy of PCA-SVM model based on visible-near infrared spectra

表3可知, 主成分分析结合支持向量机模型中, 建模精度最高为100%, 最低精度为55%, 平均精度为83.75%。 验证集模型识别精度最高为66.67%, 最低为22.22% , 平均识别精度约为45.97%。

(2)主成分分析结合BP神经网络(PCA-BP)模型

对样本光谱反射率数据进行主成分分析, 得到28个主成分。 首先对BP神经网络中的初始参数进行设置, 构造神经网络结构, 参数如下: 迭代次数(epochs)=10 000, 学习率(Ir)=0.05, 训练目标误差(goal)=0.001。 整个神经网络匹配系统分为四个部分: 输入端、 一个隐含层、 一个输出层、 输出端。 神经网络结构如图5所示。

图5 基于可见光-近红外光谱的PCA-BP神经网络模型结构Fig.5 Model structure of PCA-BP neural network based on visible-near infrared spectra

将主成分数据代入BP神经网络模型中进行煤和岩石识别分类, 20组数据的PCA-BP神经网络模型的预测精度如图6所示。

图6 PCA-BP神经网络模型识别率Fig.6 PCA-BP neural network model recognition rate

基于样本反射率光谱数据的PCA-BP神经网络模型识别率最高为54.55%, 最低为26.25%, 平均识别率为43.33%。

(3)核主成分分析结合主成分分析(KPCA-SVM)模型

对样本反射率进行核主成分分析, 确定主成分得分值利用5倍交叉验证确定最优惩罚参数和最优方差参数, 进行支持向量机模型建立, 并将验证集代入模型验证。 20组KPCA-SVM模型最优参数、 训练集、 验证精度如表4所示。

表4 KPCA-SVM模型的模型精度 Table 4 Accuracy of KPCA-SVM model

表4可知, 核主成分分析结合支持向量机模型中, 建模精度最高为100%, 最低精度为85%, 平均精度为95.5%。 验证集模型识别精度最高为100%, 最低为66.67%, 平均识别精度约为90.56%。

2.2 基于样本成分含量的煤和岩石识别模型

(1)主成分分析结合支持向量机(PCA-SVM)模型

对样本的14个成分含量进行主成分分析, 确定主成分得分值利用5倍交叉验证确定最优惩罚参数和最优方差参数, 进行支持向量机模型建立, 并将验证集带入模型验证。 基于样本成分的PCA-SVM模型最优参数、 训练集、 验证精度如表5所示。

表5 基于样本成分的PCA-SVM模型的模型精度 Table 5 Accuracy of principal component analysis combined with support vector machine model

表5可知, 主成分分析结合支持向量机模型中, 建模精度最高为100%, 最低精度为70%, 平均精度为83.75%。 验证集模型识别精度最高为100%, 最低为22.22%, 平均识别精度约为50.56%。

(2)主成分分析结合BP神经网络(PCA-BP)模型

对样本光谱反射率数据进行主成分分析, 得到12个主成分。 首先对BP神经网络中的初始参数进行设置, 构造神经网络结构, 参数如下: 迭代次数(epochs)=10 000, 学习率(Ir)=0.05, 训练目标误差(goal)=0.001。 整个神经网络匹配系统分为四个部分: 输入端、 一个隐含层、 一个输出层、 输出端。 神经网络结构如图7所示。

图7 基于样本成分的PCA-BP神经网络结构Fig.7 Structure of PCA-BP neural network based on sample components

将主成分数据代入BP神经网络模型中进行煤和岩石识别分类, 20组数据的PCA-BP神经网络模型的预测精度如图8所示。

图8 基于样本成分的PCA-BP神经网络模型识别率Fig.8 Recognition rate of PCA-BP neural network model based on sample components

基于样本成分的PCA-BP神经网络模型识别率最高为77.78%, 最低为22.22%, 平均识别率为46.11%。

(3)核主成分分析结合主成分分析(KPCA-SVM)模型

对样本成分进行核主成分分析, 确定主成分得分值利用5倍交叉验证确定最优惩罚参数和最优方差参数, 进行支持向量机模型建立, 并将验证集带入模型验证。 20组KPCA-SVM模型最优参数、 训练集、 验证精度如表6所示。

表6 基于样本成分的KPCA-SVM模型的模型精度 Table 6 Model accuracy of KPCA-SVM model based on sample components

表6可知, 核主成分分析结合支持向量机模型中, 建模精度最高为100%, 最低精度为95%, 平均精度为98.5%。 验证集模型识别精度最高为100%, 最低为77.78%, 平均识别精度约为95%。

3 结论

针对可见光-近红外光谱法煤岩石识别时易发生煤与岩石误分类的问题, 综合采用主成分分析结合支持向量机模型(PCA-SVM)、 主成分分析结合BP神经网络模型、 核主成分分析结合支持向量机模型(KPCA-SVM)进行了研究, 并将最终的识别率、 精度列在表7中。

表7 算法模型精度/识别率比较 Table 7 Algorithm model accuracy/recognition rate comparison

(1)基于可见光-近红外光谱的KPCA-SVM模型建模精度最高为100%, 最低精度为85%, 验证模型精度最高为100%。 基于样本成分含量的KPCA-SVM模型建模精度最高为100%, 最低精度为95%。 验证模型精度最高为100%。 可见, 基于可见光-近红外光谱和煤岩成分含量进行煤岩识别是可行的, 在建模方法中KPCA-SVM表现较佳, 优于PCA-SVM和PCA-BP两种方法。

(2) 基于样本成分含量对煤、 岩石的分类过程中, KPCA-SVM的建模精度高于PCA-SVM, 平均建模精度为98.5%; 同时KPCA-SVM的验证精度高于PCA-SVM和PCA-BP两种方法的验证精度, 平均精度为95%。

(3) 提取了煤岩的光谱数据和成分含量两种特征, 结合PCA-SVM, PCA-BP和KPCA-SVM三种算法模型, 建立了六种煤岩识别的方法。 由表7可知, 基于煤岩成分含量的KPCA-SVM的模型方法识别率达到了95%, 高于其他五种方法的识别率, 故该模型最优。

参考文献
[1] QIAN Ming-gao, XU Jia-lin, WANG Jia-chen(钱鸣高, 许家林, 王家臣). Journal of China Coal Society(煤炭学报), 2018, 43(1): 1. [本文引用:1]
[2] DONG Chang-shuang, YAO Ping-xi, LIU Zhi-he(董长双, 姚平喜, 刘志河). Coal Science and Technology(煤炭科学技术), 2007, 35(3): 54. [本文引用:1]
[3] YUAN Liang(袁亮). Journal of China Coal Society(煤炭学报), 2017, 42(1): 1. [本文引用:1]
[4] Le B T, Xiao D, Okello D, et al. Spectroscopy Letters, 2017, 50(8): 440. [本文引用:1]
[5] Shen Qiang, Xia Ke, Zhang Shiwen, et al. Spectrochimica Acta Part A: Molecular and Biomolecular Spectroscopy, 2019, 222: 1. [本文引用:1]
[6] XU Liang-ji, LIU Shu-guang, MENG Xue-ying, et al(徐良骥, 刘曙光, 孟雪莹, ). Journal of China Coal Society(煤炭学报), 2019, 44(11): 3539. [本文引用:1]
[7] SONG Liang, LIU Shan-jun, YU Mo-li, et al(宋亮, 刘善军, 虞茉莉, ). Spectroscopy and Spectral Analysis(光谱学与光谱分析), 2017, 37(2): 416. [本文引用:1]
[8] WANG Wei-dong, ZHANG Chen, MA Zhong-liang, et al(王卫东, 张晨, 马中良, ). Industry and Mine Automation(工矿自动化), 2013, 39(12): 5. [本文引用:1]
[9] Yang En, Ge Shirong, Wang Shibo. Journal of Spectroscopy, 2018, 2018(2): 1. [本文引用:1]
[10] Wang X, Hu K, Zhang L, et al. Journal of Infrared Millimeter and Terahertz Waves, 2017, 38(2): 1. [本文引用:1]
[11] YANG En, WANG Shi-bo, GE Shi-rong, et al(杨恩, 王世博, 葛世荣, ). Journal of China Coal Society(煤炭学报), 2018, 43(S2): 646. [本文引用:1]
[12] YANG En, WANG Shi-bo, GE Shi-rong, et al(杨恩, 王世博, 葛世荣, ). Journal of China Coal Society(煤炭学报), 2019, 44(12): 3912. [本文引用:1]
[13] General Administration of Quality Supervision, Inspection and Quarantine of the People’s Republic of China(中华人民共和国国家质量监督检验检疫总局). GB/T 212—2008 Proximate Analysis of Coal(GB/T 212—2008 煤的工业分析法), 2008. [本文引用:3]
[14] LIANG Shun-lin, CHENG Jie, JIA Kun, et al(梁顺林, 程洁, 贾坤, ). National Remote Sensing Bulletin(遥感学报), 2016, 20(5): 875. [本文引用:1]