基于高光谱特征吸收峰的煤岩识别方法
韦任1, 徐良骥2,*, 孟雪莹1, 吴剑飞1, 张坤1
1.安徽理工大学空间信息与测绘工程学院, 安徽 淮南 232001
2.深部煤矿采动响应与灾害防控国家重点实验室, 安徽 淮南 232001
*通讯作者 e-mail: ljxu@aust.edu.cn

作者简介: 韦 任, 1996年生, 安徽理工大学空间信息与测绘工程学院硕士研究生 e-mail: 542890215@qq.com

摘要

煤炭是我国重要的自然资源, 在工业和国民经济发展上起到重要的作用。 在井下开采过程中, 传统的人工识别煤岩界面采煤机切割煤岩效率较为低下, 识别准确度较差, 存在较多不确定因素。 “无人化”逐渐成为未来井下开采的技术发展趋势。 实现无人开采首先需要准确高效的确定煤岩界面, 煤岩识别的算法将成为无人化设备的“大脑”。 高光谱是近年来发展迅速的一种新兴的技术, 在物质识别、 分类中具有广泛的应用之处。 以高光谱作为煤岩识别的技术手段, 采集煤岩高光谱数据, 通过对高光谱特征波段的提取来设计算法实现煤岩的识别。 煤岩识别是基于煤岩组分的不同, 建立在对煤岩的物质构成属性特征上的。 煤与岩石元素组分中Al元素的存在形式不同, 煤样中的Al元素的存在形式为Al2O3, 而岩样中Al元素的存在形式为Al(OH)3。 Al—OH的晶格的振动使得其在2 130~2 250 nm波段产生强吸收峰, Al2O3在此波段间不具有强吸收峰, 因此以2 130~2 250 nm作为光谱波段设计算法。 以淮南地区矿区为研究区, 在多个矿区进行采样, 获取焦煤、 气煤、 瘦煤等煤样23组; 获取底板泥岩、 砂岩、 页岩等岩样25组。 对样品进行研磨处理后使用美国ASD公司生产的FieldSpec4光谱仪, 采集煤与岩石样本350~2 500 nm间的反射光谱, 通过预处理之后使用连续统去除法、 一阶微分法、 二阶微分法和SCA-SID模型法对煤岩特征波段2 130~2 250 nm进行特征提取, 将提取到的特征向量用随机森林和SVM算法进行训练并将模型应用在测试集上进行分类。 最终, 测试集上的表现良好, 整体识别率较高, 一阶微分和连续统去除法的识别为83.3%, Kappa系数分别为0.66和0.68。 二阶微分法和SCA-SID模型法的识别率都在90%以上, Kappa系数均为0.83。 从模型的时间复杂度和空间复杂上来说, 二阶微分法较SCA-SID模型法更具有高效性和可靠性。 这些识别的方法为实际工程中井下自动化煤岩识别技术提供了应用参考。

关键词: 煤岩识别; 特征向量; 强吸收峰; 混淆矩阵
中图分类号:TP79 文献标志码:A
Coal and Rock Identification Method Based on Hyper Spectral Feature Absorption Peak
WEI Ren1, XU Liang-ji2,*, MENG Xue-ying1, WU Jian-fei1, ZHANG Kun1
1. School of Spatial Information and Surveying Engineering, Anhui University of Science & Technology, Huainan 232001, China
2. State Key Laboratory of Deep Coal Mining Response and Disaster Prevention and Control, Huainan 232001, China
*Corresponding author
Abstract

Coal is an important natural resource in our country and plays an important role in the development of industry and the national economy. In the process of underground mining, the traditional manual identification of coal-rock interface to cut coal and rock by the shearer is relatively inefficient, the recognition accuracy is poor, and there are many uncertain factors. In the future underground mining, “unmanned” has gradually become the technological development trend of underground mining. The realization of unmanned mining first needs to accurately and efficiently determine the coal-rock interface, and the coal-rock recognition algorithm will become the “brain” of unmanned equipment. Hyperspectral is an emerging technology that has developed rapidly in recent years and has a wide range of substance identification and classification applications. In this paper, hyperspectral is used as the technical means of coal and rock identification, collecting coal and rock hyperspectral data, and designing algorithms to realize coal and rock identification by extracting the characteristic bands of hyperspectral. Coal and rock identification are based on the difference between coal and rock composition. Coal and rock have different forms of aluminum in elemental components. The aluminum in coal samples is alumina, while the aluminum in rock samples is aluminum hydroxide. The vibration of the crystal lattice of AL-OH causes it to produce a strong absorption peak in the 2 130~2 250 nm band. Alumina does not have a strong absorption peak in this band, so 2 130~2 250 nm is used as the characteristic band design algorithm. Taking the mining area of Huainan area as the research area, sampling was conducted in multiple mining areas to obtain 23 sets of coal samples such as coking coal, gas coal, and lean coal; and 25 sets of rock samples such as floor mudstone, sandstone, and shale were obtained. After grinding the sample, use the FieldSpec4 spectrometer produced by the American ASD company to collect the reflectance spectra of coal and rock samples between 350 and 2 500 nm. After pretreatment, use continuum removal method, first-order differential method, second-order differential method and SCA- The SID model method extracts features from the 2 130~2 250 nm band of coal and rock, trains the extracted feature vectors with random forest and SVM algorithms, and applies the model to the test set for classification. In the end, the performance on the test set is good, the overall recognition rate is high, the recognition of the first-order differential and continuum removal methods is 83.3%, and the Kappa coefficients are 0.66 and 0.68, respectively. The recognition rates of the second-order differential method and SCA-SID model method are both above 90%, and the Kappa coefficient is 0.83. From the model’s time complexity and space complexity, the second-order differentiation method is more efficient and reliable than the SCA-SID model method. These identification methods provide an application reference for the automatic coal and rock identification technology underground in actual engineering.

Keyword: Coal and rock identification; Feature vector; Strong absorption peak; Confusion matrix
引言

用采煤机切割煤层, 当切割到岩层时, 应用煤岩识别方法可及时调整采煤机滚筒高度来避免造成欠/过切割[1]。 采煤机滚筒调高是通过人工判断采煤机滚筒截割物料成份实现的[2]。 由于人工识别的效率较为低下, 存在较多不确定因素, 且井下环境复杂, 所以逐步实现自动化无人开采是全世界未来煤炭开采的趋势。 煤岩识别是实现无人开采的关键技术。 如何实现高效准确的煤岩识别一直是国内外的研究热点。 早在20世纪60年代以来, 美国、 英国这些世界主要产煤国就对煤岩识别技术进行了大量研究[3]。 近些年来, 国内学者在国外学者的理论基础上提出了很多新的观点。 李亮等利用探地雷达技术进行煤岩界面探测, 并以郭庄煤矿为试验地进行试验, 实现了气煤与砂岩的区分, 且误差较小[4]。 孙继平等提出了基于可见光图像、 红外图像识别、 γ 射线、 雷达、 红外、 有功功率、 震动、 声音等多参数信息融合煤岩界面识别方法[5]

纵观现有的主要的煤岩界面识别方法, 主要是依据煤与岩石的一些物理性质进行区分。 而我国的地下矿井种类较多, 情况复杂, 很难将这些方法普遍用于各地矿井。 高光谱遥感具有波段多而窄、 信息丰富的特点。 HUNT等学者验证了矿物和有机物在400~2 500 nm间由化学成分和分子结构引起的识别性高光谱吸收带, 这些吸收带被广泛应用于识别矿物和岩石[6]。 以此为基础, 通过对煤岩的构成成分的差异造成的光谱响应的差别, 结合高光谱每个波段信息含量丰富的特点, 笔者提出了基于光谱的煤岩识别手段。

1 实验部分
1.1 煤岩样品的采集

淮南矿区煤种较为丰富, 煤质优良。 煤的品种包括1/3焦煤、 气煤、 焦煤、 瘦煤等; 岩石种类包括砂岩、 页岩、 灰质砂岩等。 试验样品采集于淮南潘二、 潘四、 谢桥等矿区, 煤样与岩石均来源于矿区井下, 保持了样品最初的特征。 为保证煤样与岩样的随机性, 采取均匀采样的方法, 获取了总共48组样本数据。 其中煤样本23组, 岩样25组。 ASTER光谱库的附属文件指出沉积岩的粗糙表面漫反射光谱反射率等效于其500~1 500 μ m粒度粉末试样的漫反射光谱[7]。 而煤岩均属于沉积岩。 为了增加模型的泛化能力, 使模型适用于更多场景, 将新鲜的煤样与岩石碾成块状, 而后使用打磨机将其研磨为粉末状, 采用1 mm筛子对粉末状的煤与岩石进行筛选, 制成实验用样品。

图1 典型的煤岩样本Fig.1 Typical coal and rock samples

1.2 煤岩光谱曲线的测定与预处理

本实验所用的是美国ASD公司生产的ASD FieldSpec4高光谱仪, 光谱范围为350~2 500 nm。 测量时间选在晚上, 保证了暗室的环境。 背景为黑色绒布, 保证视场内仅有白板, 背景反射率为0。 测试光源为1 000 W卤素灯, 光源照射方向与垂直方向夹角为45° ; 光源距离设置为30 cm, 探头距离5 cm, 探头与垂直方向保持15° 夹角。 测试前进行暗电流校正和白板校正, 测试过程中每隔三十分钟进行一次白板校正。 每个样品采集30条光谱曲线, 共取得1 440组数据。

将采集得到的数据进行剔除异常值处理, 而后取算术平均值作为样品的实际反射率。 因为高光谱数据冗余量大, 煤的整体反射率偏低, 所以煤的光谱曲线部分波段会出现很多“ 毛刺” , 因此对取得平均值后的数据使用origin软件进行平滑处理, 达到去除噪声的效果, 并且能最大程度的保存原始光谱曲线的信息。 部分典型的处理后的煤岩反射图如图2所示。

图2 典型的煤岩光谱曲线图Fig.2 Typical coal and rock spectra

1.3 煤岩光谱差异机理分析

由图2可知, 煤的整体反射率较低, 而岩石反射率偏高。 在1 450 nm附近处岩石有个较强的吸收谷, 部分煤样如1/3焦煤、 气煤存在一个较弱的吸收谷。 这是因为1 450 nm附近的波段主要是水分子的O— H官能基伸缩振动的第一倍频, 由水分子引起的一个吸收带[8]。 在1 900 nm附近, 由于岩石中含有的二价铁离子和煤炭中含有的Al2O3, 岩石与少部分煤样产生了第二个较强的吸收谷[9]。 在2 130~2 250 nm波段范围内由于Al元素存在形式的不同, 导致了煤与岩石的光谱产生了较大的差别。 煤的组分中Al元素的存在形式主要是Al2O3, 而岩石中Al元素的存在形式则为Al(OH)3。 Al(OH)3的Al— OH晶格振动使得其在2 209 nm附近具有强吸收峰, 而Al2O3在2 209 nm附近不具有强吸收峰[10]。 根据物质的组分特性的不同进行特征波段选取, 相当于对冗余量较大的高光谱信息进行了“ 降维” 。 提取2 130~2 250 nm的波段作为特征向量进行煤岩识别, 使用随机森林算法进行分类, 并计算分类精度与Kappa系数, 与其他方法进行比较。

1.4 基于煤岩差异机理的煤岩识别算法构建

基于煤岩在2 130~2 250 nm间的差异性, 采取了连续统去除法、 一阶微分法、 二阶微分法和SCA-SID四种算法来进行煤岩的识别, 具体的识别流程图如图3所示。

图3 煤岩识别流程图Fig.3 Coal and rock identification flow chart

1.4.1 连续统去除法

连续统去除法是一种有效增强感兴趣吸收特征的光谱分析方法, 它可以有效突出光谱曲线的吸收和反射特征[11]。 连续统去除法选取光谱曲线上的峰值, 用一条相对平滑的曲线将各个峰值连接起来, 这条曲线称之为包络线[12]。 连续统去除法的作用是将光谱数值归一化值0— 1之间, 扩大了特征波段的区别, 便于提取差异化特征。 经过连续统去除法后的光谱曲线如图4所示。

图4 连续统去除后的典型光谱曲线值Fig.4 Typical spectral curve after continuum removal

经过包络线去除后, 利用python编程, 提取几个典型的吸收特征参数:光谱吸收谷处的位置(P)、 吸收深度(H)、 光谱吸收指数(SAI)、 吸收谷面积之比(S)以及基线的斜率K为特征向量区分煤与岩石。 主要的光谱吸收特征参数如下:

吸收位置P: 连续统去除后的吸收谷中, 反射率值最小的点对应的波长值λ min

吸收深度H: 吸收位置P点到1的距离, 计算公式为

H=1-Rλmm(1)

式(1)中, Rλmin表示P点的反射率。

光谱吸收指数SAI计算公式为

SAI=dRl+(1-d)RrRλmin(2)

式(2)中, d为对称度, 计算公式为

d=λmin-λlλr-λl(3)

式(3)中, λ l为吸收谷左肩对应的波长, λ r为吸收谷右肩对应的波长。 RlRr分别为λ lλ r对应的反射率的值。

吸收谷面积之比S的计算公式为

S=AlA(4)

式(4)中, Al为吸收谷P点左侧的面积, A为吸收谷的整体面积。

基线的斜率K: 基线为连接吸收谷左肩和右肩的直线, K的计算公式为

K=Rr-Rlλr-λl(5)

提取的五个特征组成了一个五维向量集合{P, H, SAI, S, K}, 将这个五维特征向量输入到随机森林算法分类器中, 分类器最大深度为5, 最终得到分类结果混淆矩阵如图5和表1所示, 0为煤样本, 1为岩石样本(后面的混淆矩阵中0均为煤样, 1均为岩样), 有一个煤样和一个岩样被误分, 最终正确率达到83.3%。

图5 连续统去除法混淆矩阵Fig.5 Continuum removal confusion matrix

表1 煤岩识别算法的结果比较 Table 1 Comparison of results obtained by using different coal and rock recognition algorithms

1.4.2 一阶微分变换& 二阶微分变换

微分是一种被广泛应用的光谱分析方法, 使用微分变换方法可以去除部分线性或接近线性的噪声对目标光谱的影响, 从而使得光谱中含有的丰富信息更加真实可靠。 在微分变换中, 一阶微分与二阶微分是较为常用的方法。 煤与岩石的一阶和二阶微分如图6(a, b)所示。

图6 光谱微分变换
(a): 一阶微分变换; (b): 二阶微分变换
Fig.6 Spectral derivative transformation
(a): 1st derivative transformation; (b): 2nd derivative transformation

光谱一阶微分变换的计算公式为

R(λi)'=dRdλ=Rλi+1-RλiΔλ(6)

光谱二阶微分变换的计算公式为

R(λi)=d2Rdλ2=Rλi+2-2Rλi+1+Rλi(Δλ)2(7)

式(6)和式(7)中, i表示波段号, λ i表示第i波段的波长值, Rλi表示第i波段波长λ i吩应的反射率的值。 表示λ i处光谱的一阶微分值, 表示λ i处光谱的二阶微分值。

图6(a)是煤岩的一阶微分曲线图, 可以看出图中存在9个差异较明显的波段, 其中差异较大的有4个波段, 分别为1 416~1 440, 1 860~1 914, 2 122~2 176和2 209~2 240 nm。 而根据煤岩的物性组分中Al的存在形式的差别, 选取2 122~2 176和2 209~2 240 nm作为煤岩识别的波段, 使得识别精度达到最高。 将得到的特征波段分别采取平均值操作, 构成特征向量, 结果可视化如图7所示, 煤与大部分岩石的一阶微分值差异较大, 比较容易识别。 针对这两个特征波段, 使用高斯径向基作为核函数, 采用SVM算法进行分类, 对煤与岩石这两个类别进行识别, 识别结果如表1和图8(a)所示。

图7 微分变换特征分布
(a): 一阶微分特征分布; (b): 二阶微分特征分布
Fig.7 Spectral derivative transformation feature distribution
(a): 1st derivative transformation feature distribution; (b): 2nd derivative transformation feature distribution

图8 微分变换法混淆矩阵
(a): 一阶微分混淆矩阵; (b): 二阶微分混淆矩阵
Fig.8 Spectral derivative transformation confusion matrix
(a): 1st derivative confusion matrix; (b): 2nd derivative confusion matrix

图6(b)是煤岩的二阶微分曲线图, 在2 203~2 217 nm处煤岩二阶微分值差异明显, 选取此波段为二阶微分识别波段, 做平均值处理, 结果可视化如图7(b)所示。 采用以高斯径向基为核函数的SVM算法进行分类识别, 最终得到的结果如表1和图8(b)所示。

数据集中包括36个训练集样本和12个测试集样本, 其中含有5个煤样和7个岩石样本。 其中, 一阶微分算法中有两个岩石样本被误分, 煤样均被识别, 识别率达到了83.3%。 二阶微分算法中仅有一个岩石样本被误分, 识别率达到了91.7%。

1.4.3 基于光谱相关角与光谱信息散度模型融合的方法

光谱角匹配算法是一种通过计算光谱间的矢量夹角来比较物质相似性的方法, 常被用来进行矿物之间的识别[13]。 但由于夹角的大小只与光谱矢量方向有关, 与其辐射亮度无关, 因此当两种矿物的光谱矢量方向相似而辐射亮度大小有差别时, 区分效果较差, 并且光谱角只考虑夹角的绝对值, 而不能识别待匹配光谱的正负相关性[14]。 光谱相关角则可以避免以上问题, 可以反映出光谱相对于其均值的变化。 光谱信息散度则是以信息论为出发点来比较两光谱的相似性。 它们的计算方法如下:

光谱相关角(SCA)的计算公式为

SCC(x, y)=< x-μx, y-μy> x-μx2y-μy2(8)

式(8)中, μ xμ y为两光谱曲线的均值。

对于光谱曲线上的xy, SCA的计算公式为

SCC(x, y)=i=1n(xi-μx)(yi-μy)i=1n(xi-μx)2i=1n(yi-μy)2(9)

SCA(x, y)=cos-1SCC(x, y)+12(10)

光谱信息散度(SID)的计算公式为

ΨSID(x, y)=D(xy)+D(yx)(11)

根据信息论, 光谱xy的自信息为

I(xi)=-logp(xi)(12)

I(yi)=-logq(yi)(13)

其中, 式中的p(x)和q(y)分别为

p(xi)=xi/i=1nxi(14)

q(yi)=yi/i=1nyi(15)

信息论中两光谱曲线的相关熵为

D(xy)=i=1np(xi)Di(xy)=i=1np(xi)(I(yi)-I(xi))=i=1np(xi)logp(xi)q(yi)(16)

D(yx)=i=1nq(yi)logq(yi)p(xi)(17)

光谱信息散度的计算公式则为

ΨSID(x, y)=i=1n(p(xi)-q(yi))logp(xi)q(yi)(18)

使用单一的SCA模型或者SID模型只能从单一的角度去反映光谱间的相似性。 采用模型融合的方法, 将光谱的形态信息与信息论中的“ 信息” 相融合, 可以显著提高矿物的识别能力。

SCA模型与SID模型融合后的SCASID(x, y)tan模型计算公式为

SCASID(x, y)tan=ΨSID(x, y)tan(SCA(x, y))(19)

计算得出的结果如图9所示。

图9 SCA-SID特征分布Fig.9 SCA-SID feature distribution

采用以高斯径向基为核函数SVM算法对得到的特征数据进行分类, 最终得到的混淆矩阵如图10所示, 仅有一个岩石样本被误分, 正确率达到91.7%。

图10 SCA-SID法混淆矩阵Fig.10 SCA-SID confusion matrix

2 结果与讨论

(1)从表1和混淆矩阵可以看出分类效果最佳的是二阶微分算法和SCA-SID算法。 连续统去除法各有一个岩石样本和煤样被误分, 识别率达到了83.3%, Kappa系数为0.66; 一阶微分法有两个岩石样本被误分成了煤样, 识别率为83.3%, Kappa系数为0.68; 二阶微分法和SCA-SID模型法均仅有一个岩石样本被误分成了煤样, 分类的精度均达到了91.7%, Kappa系数均为0.83。

(2)从分类的精度的角度来说一阶微分法和连续统去除法分类精度较低, 二阶微分法和SCA-SID模型法的精度与Kappa更高。 从模型的复杂度的角度出发, 二阶微分法得到特征向量的计算过程和所花费的时间更少, 时间和空间复杂度更低, 所以在实际工程应用中, 二阶微分法比SCA-SID模型法更具有高效性和可靠性。

3 结论

(1)提出了四种基于吸收特征波段的煤岩识别方法, 结合煤岩构成成分Al元素的存在形式的不同产生的特征吸收峰(2 130~2 250 nm)进行了特征向量提取, 并根据实际情况选用了随机森林算法和SVM算法作为识别的算法。 结果表明, 连续统去除法、 一阶微分法、 二阶微分法、 SCA-SID模型法的识别准确率达到了83.3%, 83.3%, 91.7%, 91.7%, Kappa系数分别为0.66, 0.68, 0.83, 0.83。 其中二阶微分法的模型复杂度较SCA-SID的更低, 更有利于煤岩的识别。

(2)相比于传统的煤岩识别方法, 使用高光谱技术是建立在对煤岩光谱差异的机理上进行的。 目前, 基于高光谱技术的煤岩识别算法设计相关研究较少, 本工作提出的四种煤岩识别算法较传统方法更具有可靠性和高效性, 为实际工况下的煤岩识别提供了方法参考。

参考文献
[1] WANG Xin, ZHAO Duan, DING En-jie(王昕, 赵端, 丁恩杰). Coal Mining Techology(煤炭开采), 2018, 23(1): 13. [本文引用:1]
[2] ZHANG Qiang, WANG Hai-jian, JING Wang, et al(张强, 王海舰, 井旺, ). China Mechanical Engineering(中国机械工程), 2016, 27(2): 201. [本文引用:1]
[3] ZHANG Xin, WANG Zheng-xiang, WU Chen-guang, et al(张新, 王正祥, 武晨光, ). Coal Mine Machinery(煤矿机械), 2015, 36(2): 3. [本文引用:1]
[4] LI Liang, WANG Xin, HU Ke-xiang, et al(李亮, 王昕, 胡克想, ). Industry and Mine Automation(工矿自动化), 2015, (9): 8. [本文引用:1]
[5] SUN Ji-ping(孙继平). Coal Science and Technology(煤炭科学技术), 2011, 39(2): 77. [本文引用:1]
[6] Hunt G R, Evarts R C. Geophysics, 1981, 46(3): 316. [本文引用:1]
[7] Baldridge A M, Hook S J, Grove C I, et al. Remote Sensing of Environment, 2009, 113(4): 711. [本文引用:1]
[8] HAN Yang, ZHAO Yun-sheng, WANG Ye-qiao, et al(韩阳, 赵云升, 王野乔, ). Spectroscopy and Spectral Analysis(光谱学与光谱分析), 2013, 33(8): 2071. [本文引用:1]
[9] Hunt G R. Hand book of Physical Properties of Rocks, 1982, 1: 295. [本文引用:1]
[10] YANG En, WANG Shi-bo, GE Shi-rong, et al(杨恩, 王世博, 葛世荣, ). Journal of China Coal Society(煤炭学报), 2018, 43(S2): 646. [本文引用:1]
[11] CHEN Xuan, LING Wen-peng, WANG Yao, et al(陈璇, 林文鹏, 王瑶, ). Marine Environmental Science(海洋环境科学), 2017, 36(5): 688. [本文引用:1]
[12] Kokaly R F, Couvillion B R, Holloway J M, et al. Remote Sensing of Environment, 2013, 129(2): 210. [本文引用:1]
[13] YAN Ji-ning, ZHOU Ke-fa, WANG Jin-lin, et al(阎继宁, 周可法, 王金林, ). Computer Engineering and Applications(计算机工程与应用), 2013, 49(19): 141. [本文引用:1]
[14] WU Hao, XU Yuan-jin, GAO Ran(吴浩, 徐元进, 高冉). Geography and Geo-Information Science(地理与地理信息科学), 2016, 32(1): 44. [本文引用:1]