基于岩石光谱吸收特征的白云母含量反演
赵健铭, 杨长保, 韩立国*, 朱梦瑶
吉林大学地球探测科学与技术学院, 吉林 长春 130026
*通讯作者 e-mail: 68854058@qq.com

作者简介: 赵健铭, 1996年生,吉林大学地球探测科学与技术学院研究生 e-mail: jmzhao20@mails.jlu.edu.cn

摘要

岩石是由多种矿物组成, 其反射率光谱吸收特征与矿物含量之间存在紧密联系, 矿物光谱在特定波段处的光谱吸收特征是定量估算含量的重要指标之一。 为提升岩石光谱吸收特征定量反演矿物含量的准确度与精度, 以白云母为研究对象, 分析岩石光谱在2.2 μm附近的光谱吸收特征及其白云母含量, 采用Savitzky-Golay平滑滤波和连续统去除法对岩石光谱反射率进行处理, 进而提取光谱吸收特征参数(吸收深度、 吸收宽度、 吸收面积), 分析岩石光谱在2.2 μm附近吸收特征与白云母含量之间的相关性。 研究中采用单一吸收特征建立统计模型、 多维吸收特征建立偏最小二乘法(PLS)和多层感知器(MLP)模型, 对岩石中白云母含量与光谱吸收特征参数进行分析, 进而提出一种非线性预测岩石中矿物含量的方法。 研究结果表明, 岩石光谱在2.2 μm附近的光谱吸收特征中, 吸收深度与白云母含量之间的相关性最高。 基于单一吸收特征的统计模型中, 二次曲线模型对吸收深度拟合的效果最佳, R2为0.935 0, RMSE为0.063 0, 岩石光谱的吸收深度随白云母丰度满足二次曲线变化, 岩石中白云母的含量越高, 岩石光谱吸收深度值越大; 基于多维光谱吸收特征的PLS模型相较于MLP模型拟合的效果更佳, 其 R2为0.947 7高于MLP的0.901 2, RMSE为0.002 7低于MLP的0.005 1; 整体上, 多维模型优于单一维度模型, PLS模型反演能力最佳, 该模型在预测白云母含量上具有运算量小、 精度高的特点。 通过分析岩石在诊断特征处的光谱吸收特征, 为其矿物组分的含量等进行定量反演提供理论参考, 为矿产资源监测与评估提供快速高效便捷的方法。

关键词: 岩石光谱; 矿物含量; 光谱吸收特征; 统计分析; 偏最小二乘法
中图分类号:P5 文献标识码:A
The Inversion of Muscovite Content Based on Spectral Absorption Characteristics of Rocks
ZHAO Jian-ming, YANG Chang-bao, HAN Li-guo*, ZHU Meng-yao
College of Geoexploration Science and Technology, Jilin University, Changchun 130026, China
*Corresponding author
Abstract

Rock is composed of various minerals, and there is a close relationship between the reflectance spectral absorption characteristics and mineral content. The spectral absorption characteristics of mineral spectra at specific bands are one of the important indicators for the quantitative estimation of content. This paper takes muscovite as the research object, analysing the rock spectrum's spectral absorption characteristics near 2.2 μm and muscovite content. Moreover, uses Savitzky-Golay smoothing filter and Continuum Removal method to process the spectral reflectance of rock, and then extracts the spectral absorption characteristic parameters (absorption depth D, absorption width W, absorption area A ), and analyzes the correlation between the absorption characteristics of rock spectrum near 2.2 μm and muscovite content. In this paper, the statistical model was established by a single absorption feature, and the Partial Least Squares (PLS) and Multilayer Perceptron (MLP) models were established by multi-dimensional absorption feature. The muscovite content and spectral absorption characteristic parameters in rocks were analyzed, and a non-linear representation method for predicting mineral content in rocks was proposed. The results show that the spectral absorption characteristics of rock spectrum near 2.2 μm, the correlation between absorption depth and muscovite content among the highest. In the statistical model based on single absorption characteristics, the quadratic curve model has the best fitting effect on the absorption depth. R2 is 0.935 0, RMSE is 0.063 0. The absorption depth of the rock spectrum changes with the abundance of muscovite. The higher the muscovite content in rock, the greater the value of rock spectral absorption depth. The PLS model based on multidimensional spectral absorption characteristics was more effective than the MLP model. The R2 was 0.947 7 higher than 0.901 2 for MLP, and the RMSE was 0.002 7 lower than 0.005 1 for MLP. On the whole, the multidimensional model is better than the single-dimension model, and the PLS model has the best inversion ability. The model has the characteristics of a small amount of calculation and high precision in predicting muscovite content. Analyzing the spectral absorption characteristics of rocks at the diagnostic characteristics provides a theoretical reference for the quantitative inversion of the content of mineral components. It provides a fast, efficient, and convenient method for the monitoring and evaluating mineral resources.

Key words: Rock spectrum; Mineral content; Spectral absorption characteristic; Statistic analysis; PLS
引言

矿物和岩石的光谱学是当今高光谱遥感发展的基础, 岩石是物质在一定的成因作用下形成的, 具有一定结构和构造的矿物体集合, 岩石中矿物的多样性决定了岩石光谱的多样性[1]。 岩石的光谱特征主要由岩石矿物组成成分、 物质内部晶体结构、 物化特征所决定, 其中岩石矿物组成成分对岩石光谱影响最为主要[2]。 矿物通常具有一系列诊断吸收带, 这些吸收带由金属离子的电子转移或分子基团的振动产生, 例如Al— OH, Mg— OH和 CO32-, 通过提取矿物诊断吸收带的吸收特征来识别矿物十分有效。 研究吸收带的吸收特征对研究矿物识别和定量分析方法具有重要作用。

吸收特征的差异主要取决于矿物晶体物化属性的不同, 即阴阳离子的化合价、 阳离子的配位数目、 主要阳离子的质量、 键的共价程度、 阴阳离子间的距离、 晶体对称性的差异。 VNIR和SWIR反射光谱中记录的吸收特征主要是由分子键的亚分子振动引起, 以响应特定波长的吸收特征。 矿物种类产生特征吸收, 并对应于特定的分子键[3]。 白云母化学式为KAl2(AlSi3O10)(OH)2是云母族矿物中分布最广泛的矿物之一, 对研究地质过程中温压环境变化、 中低温热液蚀变及成矿流体的运移等具有重要的指示意义, 由于Al— OH的影响, 白云母矿物在2.2 μ m附近具有明显的光谱吸收特征, 使其成为白云母矿物遥感识别及其丰度定量反演的重要指标[4]。 光谱吸收特征参数常被用于线性或非线性反演矿物丰度信息[5]。 分析岩石光谱特征波段吸收特征与白云母含量之间的变化规律, 为地物光谱特征分析提供理论基础, 为建立具有普适性的地物定量反演模型提供理论依据。

Christian用二阶多项式拟合绘制了2.1和2.4 μ m之间最深吸收特征的波长位置, 为表面矿物探索性分析提供了一种新方法[6]。 Choe提出了一种简单的二次方法(SQM)来估计短波红外(SWIR)光谱区域中吸收特征的波长, 结果表明由光谱吸收特征导出的参数在筛选和绘制重金属分布具有适用性。 Jing认为最小Al— OH吸收特征波长位置2.209 μ m, 可作为矿体矢量化工具来识别蚀变矿物和定位矽卡岩矿床的热液中心[7]。 Ruitenbeek计算最大吸收深度的波长位置, 对火星表面进行矿物填图, 为高光谱OMEFA影像探索性分析提供了适当的方法[8]。 Hecker和Ruitenbeek等开发了一种实用工具, 可以绘制最深吸收特征的波长位置, 结合了最深吸收特征的位置和深度信息, 给出了占主导地位的矿物的每像素概览图, 被用于区分可见光至近红外区域具有电子吸收特征的矿物[9]。 有报道研究了蒙皂石含量与膨胀土2.2, 1.9及1.4 μ m处吸收深度之间的关系, 吸收深度与岩石中矿物成分的含量具有定量关系。

1 实验部分
1.1 数据

为分析吸收特征与岩石光谱之间的关系, 选用美国喷气推进实验室提供的8个岩石样本, 光谱反射率由ASD Labspec5100光谱仪获得。 光谱仪以3~6 nm的分辨率, 采集范围为350~2 500 nm的反射光谱, 实验数据可从喷气推进实验室下载(https://speclib.jpl.nasa.gov/)。

1.1.1 Savitzky-Golay滤波

将原始岩石反射率光谱数据重采样的光谱分辨率为5 nm, 并进行基于局域多项式最小二乘法拟合的Smavitzky-Golay滤波处理, 该滤波器的特点是在滤除噪声的同时可以确保信号的形状、 宽度不变[10]。 本研究对滤波后的反射率数据进行一阶微分处理, 得到岩石一阶导数光谱数据。

1.1.2 连续统去除

连续统去除最早由Clark等提出对光谱数据进行归一化处理, 以增强光谱在特定波长位置处的吸收特征[11]。 其定义为逐点直线连接随波长变化的吸收或反射凸出的峰点, 并使折线在峰值点上的外角大于180° 。 该方法使得经变换后的反射率值在0~1之间, 峰值点上的相对反射率均为1, 其他点相对反射率均小于1, 这一变换可以突出显示光谱的吸收和反射。 见式(1)

Scr=R/Rc(1)

式(1)中, Scr为连续统去除光谱反射率, R为原始光谱反射率, Rc为连续统线反射率。 通过滤波处理后, 连续统去除法进行光谱归一化, 利用Python语言编程计算岩石样本的光谱吸收特征参数。

主要的光谱吸收特征参数为: (1)吸收深度(D), 即在某一波段吸收范围内, 反射率最低点到归一化包络线的距离。 见式(2)

D=1-Scr(2)

式(2)中, D为吸收深度, Scr为连续统去除光谱反射率; 吸收谷左右肩对应的波长为L1L2; (2)吸收宽度(W), 即最大吸收深度宽度一半处的光谱带宽; (3)吸收面积(A=A1+A2, 其中A1A2分别是吸收谷左/右部分的面积)。 连续统去除法提取光谱吸收特征参数可有效降低背景的影响[12](如图1)。

图1 连续统去除白云母光谱图Fig.1 Continental removal of muscovite spectral

1.2 方法

1.2.1 统计模型

统计模型是根据因变量与自变量的实际观测值, 建立因变量与自变量的线性或非线性回归方程, 检验、 分析自变量对因变量影响的显著性, 用所求的关系式进行预测。 统计模型对事件的规律做推断, 具有探寻客观事物内部规律复杂性的优点。 本研究所采用的统计模型为一元线性、 对数曲线、 逆函数、 二次曲线、 三次曲线、 复合函数、 指数函数、 幂函数、 S函数、 增长函数、 Logistic模型。

1.2.2 偏最小二乘模型

偏最小二乘回归(partial least squares regression, PLSR)是一种新型的多变量回归分析方法, 可以实现回归建模、 简化数据结构和分析两组变量间的相关性, 给多元数据统计分析带来极大便利。 建立PLSR模型分析光谱吸收特征参数来反演白云母含量。 该方法具有良好的鲁棒性。 采用Python语言调用scikit-learn1.0.2对数据进行处理。 见式(3)

X=TPT+EY=UQT+F(3)

式(3)中, X是一个n× m的预测矩阵, Y是一个n× p的相应矩阵; TUn× l的矩阵, 分别为XY的投影; PQ分别m× lp× l的正交载荷矩阵, 矩阵TF是误差项, 假设是独立同分布的随机正态变量, 对XY分解来最大化TU之间的协方差。

1.2.3 多层感知器模型

多层感知器(multilayer perceptron, MLP)是一种前馈人工神经网络模型, 其将输入的多个数据集映射到单一的输出数据集上。 感知器是一个简单的神经元模型, 是大型神经网络的前身, 多层感知的基本结构由三层组成: 输入层, 中间隐藏层和最后输出层, 输入元素和权重的乘积被馈给具有神经元偏差的求和结点, 主要优势在于其快速解决复杂问题的能力。 本研究采用scikit-learn1.0.2对数据进行处理, 参数设置均为默认值。

2 结果与讨论
2.1 数据与参数提取

研究所用样本数据包括其各类矿物的百分含量、 及其岩石光谱。 从光谱库中选取8个含有白云母矿物的岩石光谱相关数据(如表1所示), 为提高研究的准确性与降低冗余误差, 选用岩石光谱范围为2.1~2.5 μ m进行分析, 并提取样本的光谱特征参数(吸收深度、 吸收宽度、 吸收面积)。

表1 在2.2 μ m附近吸收深度与白云母矿物含量 Table 1 Absorption depth and Muscovite mineral content near 2.2 μ m
2.2 模型建立

模型以吸收深度、 吸收宽度、 吸收面积为因变量, 白云母含量为自变量, 多元逐步回归分析各参量之间的相关关系。 首先分析白云母含量与光谱吸收参数的相关性, 如表2所示, 吸收深度与白云母含量关系最为密切。 采用统计模型对吸收深度进行回归分析反演白云母含量。 此外, 根据偏最小二乘法和多层感知器对多个光谱吸收特征进行建模分析, 通过多维数据综合信息探究矿物含量与岩石光谱的关系。

表2 白云母含量与光谱吸收参数的相关性 Table 2 Correlation between Muscovite content and spectral parameters
2.3 光谱吸收特征参数模型分析

采用决定系数(determination coefficients, R2)和均方根误差(root mean squared error, RMSE)对模型进行评价。 R2表示回归方程各样本拟合的程度, R2越大说明拟合的相关程度越高, 越接近于1, 说明模型的稳定性越好; RMSE衡量模型预测结果, 数值越小模型预测能力越好。

结果表明, 基于单一吸收特征的统计模型中二次曲线模型对吸收深度拟合的效果最佳, R2为0.935 0, RMSE为0.063 0, 岩石光谱的吸收深度随白云母丰度满足二次曲线变化(如图2所示), 说明白云母含量与岩石光谱吸收深度有着紧密的相关关系, 岩石中白云母的含量越高, 岩石光谱吸收深度值越大。 在多维光谱吸收特征中, 通过分析PLS模型和MLP模型真实值与预测值的分布, PLS中数值分布在参考线两侧, 没有明显的偏差, 而MLP有些许偏差[如图3(a, b)所示], PLS模型相较于MLP模型拟合的效果更佳, 其R2为0.947 7高于MLP的0.901 2, RMSE为0.002 7低于MLP的0.005 1, 说明PLS模型的稳定性与预测能力优于MLP模型。

表3 统计模型和精度 Table 3 Statistical model and Accuracy

图2 统计模型拟合图Fig.2 Statistical fitting model

图3 PLS (a)和MLP (b)回归预测图Fig.3 Relationship between stimulated and true in PLS (a) and MLP (b)

3 结论

岩石的矿物组成对岩石光谱有很大的影响, 特别是具有特征吸收谱带的矿物。 以白云母矿物为研究对象, 分析岩石在2.2 μ m附近光谱吸收特征及其白云母含量, 以Savitzky-Golay平滑滤波和连续统去除法处理, 基于单一与多维度吸收特征建立模型, 分析不同模型的稳定性与含量预测能力。 通过分析得出结论:

(1)在光谱特征提取前, Savitzky-Golay平滑滤波和连续统去除法, 既有效地保留样本的准确性与形态特征, 又有效地消除噪声影响, 提高光谱特征的提取精度。 经相关性分析, 光谱吸收特征中吸收深度(D)相较于吸收宽度(W)、 吸收面积(A)与岩石中白云母含量相关性最高;

(2)单一光谱特征进行统计分析, 以吸收深度为自变量, 二次曲线模型稳定性与预测能力最高, 白云母含量与吸收深度呈二次曲线增长;

(3)多个光谱特征参数(吸收深度、 吸收宽度、 吸收面积)为自变量, 分别建立偏最小二乘模型和多层感知器模型, PLS模型的稳定性与预测能力优于MLP模型; 整体比较, 多维模型优于单一变量模型, PLS模型反演能力最佳, 反演精度最高, 体现了多维数据的优势。 矿物光谱遥感识别依赖光谱吸收特征, 若从遥感图像上获得光谱吸收特征信息, 则大大加速对遥感矿物识别与填图。

参考文献
[1] Notesco G, Ogen Y, Ben-Dor E. Remote Sensing, 2016, 8: 318. [本文引用:1]
[2] Deng K, Zhao H, Li N, et al. Remote Sensing Letters, 2021, 12(5): 449. [本文引用:1]
[3] Fox N, Parbhakar-Fox A, Moltzen J, et al. Minerals Engineering, 2017, 107: 63. [本文引用:1]
[4] Kumar H, Rajawat A S. International Journalof Applied Earth Observation and Geoinformation, 2020, 88: 102084. [本文引用:1]
[5] Kopačková Veronika, Koucká Lucie. Remote Sensing, 2017, 9(10): 1006. [本文引用:1]
[6] Christian M, Christian R, Nina B, et al. Remote Sensing, 2016, 8(2): 127. [本文引用:1]
[7] Jing T, Yu Z C, Jmca B, et al. Ore Geology Reviews, 2019, 106: 134. [本文引用:1]
[8] Ruitenbeek F JAV, Bakker W H, Werff H, et al. Planetary & Space Science, 2014, 101(10): 108. [本文引用:1]
[9] Hecker C, Ruitenbeek F, Werff H, et al. IEEE Geoscience and Remote Sensing Magazine, 2019, 7(2): 51. [本文引用:1]
[10] Radim, Va?át, Radka, et al. Geoderma, 2017, 298: 46. [本文引用:1]
[11] Sebai, Abdelaziz, Mezned, et al. Journal of Applied Remote Sensing, 2017, 11(1): 016021. [本文引用:1]
[12] Zhang M, Zhang Q, Wang L, et al. Remote Sensing Technology and Application, 2019, 34(2): 313. [本文引用:1]