高光谱成像砖红壤中石油烃含量的可视化研究
陈志莉1, 刘强2, 尹文琦2, 刘洪涛2, 杨毅1
1. 陆军勤务学院军事设施系, 重庆 401311
2. 陆军勤务学院油料系, 重庆 401311

作者简介: 陈志莉, 女, 1971年生, 陆军勤务学院军事设施系教授 e-mail: 1012262034@qq.com

摘要

高光谱成像具有快速无损和图谱合一的特点, 每个波段都会呈现一幅图像, 每个像素点都显示一条光谱曲线, 不仅可以获取样本的光谱信息, 还可以表征物体的空间信息, 目前在诸多领域展现出极大的应用价值。 采用高光谱成像实现土壤中石油烃含量分布的可视化。 制备不同石油烃含量的砖红壤样本, 分为建模样本和预测样本。 采集高光谱图像, 为避免图像背景的干扰, 采用掩膜的方法进行背景剔除。 之后提取建模样本中感兴趣区域的平均光谱, 采用连续投影算法筛选特征变量, 基于提取的特征变量, 一方面建立MLR预测模型, 另一方面从预测样本中提取特征波段的高光谱图像。 最后, 将特征图像上像素点的数据代入模型, 得到石油烃的含量分布情况。 通过图像处理的方法, 不同的含量赋予不同的颜色, 实现砖红壤中石油烃含量分布的可视化。 研究结果表明, 采用高光谱成像与图像处理方法能够初步实现砖红壤中石油烃含量分布的可视化, 为以后大范围地识别和反演土壤中石油烃含量提供了基础。

关键词: 高光谱成像; 砖红壤; 石油烃含量; 连续投影算法; 可视化
中图分类号:TP79 文献标识码:A
Visualization of Petroleum Hydrocarbon Content in Latosol Based on Hyperspectral Imaging Technology
CHEN Zhi-li1, LIU Qiang2, YIN Wen-qi2, LIU Hong-tao2, YANG Yi1
1. Department of Military Facilities, Army of Logistical University, Chongqing 401311, China
2. Department of Oil Engineering, Army of Logistical University, Chongqing 401311, China
Abstract

Hyperspectral imaging technology is a rapid and nondestructive technique, which has the characteristic of combining the image and spectra, each band will represent an image, each pixel displays a spectra. Hyperpectral image can not only obtain spectral information of the samples, but also spatial information of objects representation, having great value in many field at present. In this paper, hyperspectral imaging technology is used to visualize the distribution of petroleum hydrocarbons in soil. A sample of latosol samples with different petroleum hydrocarbons content was prepared and divided into modeling samples and prediction samples. Hyperspectral images were collected. In order to avoid the interference of image background, the mask was used to eliminate the background. After extracting the average spectral region of interest modeling in the sample, the successive projection algorithm select characteristics variables. Based on the extracted feature variables, on one hand, a MLR prediction modelis established, On the other hand, the characteristics of hyperspectral image are extracted from the prediction sample. Finally, the data of the pixel on the characteristic image is substituted into the model to obtain the content distribution of the petroleum hydrocarbon. Through the method of image processing, the different contents are given different colors to realize the visualization of the distribution of petroleum hydrocarbon content in latosol. The research results show that using hyperspectral imaging technique and image processing method can realize the visualization of the distribution of petroleum hydrocarbon content in latosol, providing the basis for petroleum hydrocarbon content ide.pngication and inversion of soil in large scale.

Key words: Hyperspectral imaging; Latosol; Petroleum-hydrocarbon content; Successive projection algorithm; Visualization
引 言

目前石油烃污染的化学检测方法已经趋于成熟, 结果精确但检测时间较长, 需要大量的仪器, 繁琐的程序, 难以实现迅速、 大范围地识别和测定土壤中石油烃泄漏污染[1, 2, 3]。 借助高分辨率地物光谱仪, 能够观测到石油烃污染土壤的光谱存在显著的吸收特征, 并且与其他地物特征有明显差异[4], 但仅光谱信息难以从空间上快速识别石油烃并描述其空间分布情况; 而高光谱成像技术则弥补了这一缺陷, 高光谱图像是集光谱信息和空间信息的数据立方体, 不仅光谱分辨率高, 可以展现地物的光谱特征, 还能够从空间上还原物体的空间特征[5], 直观而形象, 已经成功应用于多个领域[6, 7], 可满足大范围地识别和反演土壤中石油烃污染的要求。

对石油烃污染砖红壤的高光谱图像选取感兴趣区域, 提取光谱数据, 通过连续投影算法筛选特征变量, 并建模预测, 结合图像处理方法, 实现土壤中石油烃含量的可视化分布。

1 实验部分
1.1 材料

土壤样本采自海南大学资源环境学院, 土壤类型为砖红壤。 取深度为0~20 cm表层土壤, 充分混合均匀后装入密封袋带回实验室, 置于阴凉且通风处风干, 除去土壤中的石块、 植物残茬等, 研磨和过2 mm筛, 土壤的基本理化性质见表1。 实验中所用油料为柴油、 汽油、 航空煤油、 机油, 其中柴油、 汽油和机油购于加油站, 航空煤油购于某机场。

制备两组不同石油烃含量污染土壤的样本, 第一组取50 g土壤置于直径10 cm, 深1.5 cm的玻璃皿内, 用注射器逐次抽取一定含量的油料注入土壤样本中。 反复实验后确定出最佳的油料注入方法: 起初加入1 mL, 之后逐次加入0.5 mL直至6 mL后, 每次加入1 mL直至10 mL, 再逐次加入2 mL直到样本饱和。 每次注入油料后迅速用塑料勺搅拌均匀并抹平, 使得油料在土壤中分布均匀; 第二组取50 g土壤置于直径10 cm, 深1.5 cm的玻璃皿内, 取一定量的柴油不均匀地加入土壤中, 能在表面明显地看出含量多少的差异, 航空煤油、 汽油和机油按照同理加入土壤中, 制备出四份石油烃含量分布不均匀的土壤样本。

表1 砖红壤理化性质 Table 1 Basic physical-chemical properties of the latosol
1.2 高光谱数据的采集与图像校正

采用美国HeadWall Photonics公司生产的机载地面两用近红外高光谱成像光谱仪, 型号为HyperspecTM SWIR(1.0~2.5 μ nm) Imaging Spectrometer, 如图1所示, 光谱波段范围1 000~2 500 nm, 共202个波段, 光谱分辨率为12 nm。 图2为高光谱图像采集软件, 选择“ 地面测量” 选项, 即可进入数据采集界面。

图1 HyperspecTM SWIR近红外高光谱成像光谱仪Fig.1 HyperspecTM SWIR Near infrared hyperspectral imaging spectrometer

图2 高光谱成像系统数据采集软件Fig.2 Hyperspectral imaging system data acquisition software

采集高光谱图像之前要先调试仪器, 高光谱成像系统主要通过调节光源强度、 镜头与物体之间的距离、 光圈以及曝光时间, 得到互相匹配的参数, 进而获取清晰且不失真的图像。 经过多次调试, 将样本与镜头之间的距离设定为30 cm, 曝光时间为4 ms, 光圈为2.0, 扫描长度为16° , 起始角度为-8° 。

为了减小相机暗电流和光强的变化对图像的影响, 需要在光谱图像采集前进行黑白板校正。 扫描标准白色校正板得到白色标定图像Iw(反射率接近100%)。 关闭所有光源并旋上相机镜头盖采集到反射率接近0%的黑色标定图像Id。 然后采集样本的高光谱图像Ir, 对其进行校正即可得出校正后的图像I, 公式如下

I=Ir-IdIw-Id

式中, I为校正过的光谱图像, Ir为原始的光谱图像。

1.3 图像数据的处理

1.3.1 图像的降噪与平均光谱的提取

首先采用最小噪声分离(minimum noise fraction, MNF)对校正后的高光谱图像进行降噪处理, 可得到更光滑的曲线, 有利于之后图像的处理和光谱特征变量的提取。 然后在降噪后的光谱图像上选取不包含背景信息的感兴趣区域(region of interest, ROI), 像素大小为80× 80, 取平均值即为样本的光谱数据。 依次提取每个样本的平均光谱, 之后对光谱数据再进行Savitzky-Golay平滑处理。

1.3.2 图像背景的剔除

为了利于图像的后续分析处理, 避免背景对图像信息的干扰, 采用ENVI软件中掩膜处理的方法, 使得样品的背景为全黑。 具体方法如下: 首先从众多波段的图像中选取石油烃吸收波段的灰度图像, 如图3(a)所示; 其次选取合适感兴趣区域作为样品分割区域, 然后对图像进行二值化处理, 得到mask图像, 如图3(b)所示, 黑色背景像素为0, 白色部分像素为1; 再将掩膜图像应用到整个高光谱图像上, 即为去除背景的高光谱图像, 如图3(c)所示; 之后重复该流程, 对所有的样本图像进行背景剔除。

1.4 特征变量选择算法

为了降低变量间的共线性, 提高模型预测效率, 采用连续投影算法(successive projection algorithm, SPA)进行特征变量的选择。 SPA算法的主要原理如下: 设样本数m和波长数n组成光谱矩阵Xm× n, N(N< M-1)为待提取的变量个数, xk(0)为初始迭代向量:

(1)迭代开始前, 在光谱矩阵任选一列xj, 记为xk(0), k(0)=j, j∈ 1, …, m;

(2)将未被选入的列向量位置的集合即为s,

s={j, 1jm, j{k(0), , k(n-1)}}

(3)计算剩余列向量xj(js)的投影

Pxj=xj-(xTjxk(n-1))xk(n-1)(xTk(n-1)xk(n-1))-1, js

(4)提取投影向量最大波长的变量序号

k(n)=arg[max(Pxj)], js

(5)令xj=Pxj, js;

(6)令n=n+1, 如果n< N返回(2)循环计算, 最后提取的波长为{xk(n)=0, …, N-1}。 对于每个初始k(0), 循环一次后进行多元线性回归进行交互验证, 最小均方根误差对应的k(n)即为最终筛选结果[8]

图3 采用掩膜剔除背景的灰度图像Fig.3 Background removal of gray image using masking method

1.5 土壤中石油烃含量的可视化

利用高光谱成像实现土壤中石油烃含量分布的可视化研究主要有两个重要的环节, 第一, 建立一个快速、 有效的石油烃含量的预测模型; 第二, 将高光谱图像中的每个像素点中的光谱数据依次代入已建立的模型中进行含量预测, 并通过假彩色图像来表示含量的分布情况。 技术路线见图4。

图4 高光谱成像检测土壤中石油烃含量分布主要步骤Fig.4 The main steps of detecting the distribution of petroleum hydrocarbon in soil by hyperspectral imaging

2 结果与讨论
2.1 光谱数据分析

从采集第一组实验样本的高光谱图像上选取感兴趣区域, 利用ENVI软件提取光谱信息, 并取平均值作为样本的光谱数据。 分别选取砖红壤、 柴油污染砖红壤、 航空煤油污染砖红壤、 汽油污染砖红壤和机油污染砖红壤的光谱曲线进行比较, 如图5所示。 由图中可知, 石油烃污染土壤的光谱曲线与未被污染土壤的光谱曲线差异体现在1 600~1 800和2 200~2 400 nm波长之间; 柴油、 航空煤油和机油污染土壤的光谱吸收特征均在1 725, 1 760, 2 310和2 345 nm附近, 彼此差异较小; 汽油污染土壤的光谱曲线在1 600~1 800 nm之间的特征与其他三者不同, 在1 700 nm附近, 而2 200~2 400 nm之间的特征与其相似。

图5 高光谱样本ROI光谱曲线Fig.5 The reflectance spectra of ROI of hyperspectral images

2.2 特征变量的选择

针对提取的光谱数据, 采用SPA算法选择特征变量, 通过matlab软件运行程序得到结果, 如图6— 图9所示。 4组图中(a)是SPA选择不同变量数RMSE值的变化图; (b)为SPA选择的特征变量分布图。 从图中可以看出, RMSE值基本都呈现出先下降后稳定的趋势, 最小值所对应的变量个数即为最终选择结果。 因此, 柴油污染土壤的光谱特征变量数为5, 提取的特征变量为4, 55, 97, 137和202, 对应的波长为1 033, 1 413, 1 726, 2 024和2 508 nm; 航空煤油污染土壤的光谱特征变量数为6, 提取的特征变量为1, 40, 97, 163, 175和183, 对应的波长为1 010, 1 301, 1 726, 2 218, 2 307和2 367 nm; 汽油污染土壤的光谱特征变量数为4, 提取的特征变量为5, 94, 132和181, 对应的波长为1 040, 1 703, 1 986和2 352 nm; 机油污染土壤的光谱特征变量数为6, 提取的特征变量为89, 151, 172, 187, 199和201, 对应的波长为1 666, 2 128, 2 285, 2 396, 2 486和2 501 nm。 采用SPA算法后, 建模变量大幅减少, 降低了运算量。

图6 柴油污染土壤的高光谱数据特征变量选择结果Fig.6 Selection of characteristic variables for hyperspectral data of diesel contaminated soil

图7 航空煤油污染土壤的高光谱数据特征变量选择结果Fig.7 Selection of characteristic variables for hyperspectral data of aviation kerosene contaminated soil

图8 汽油污染土壤的高光谱数据特征变量选择结果Fig.8 Selection of characteristic variables for hyperspectral data of gasoline contaminated soil

图9 机油污染土壤的高光谱数据特征变量选择结果Fig.9 Selection of characteristic variables for hyperspectral data of motor oil contaminated soil

2.3 可视化模型的建立

常用的预测模型主要有MLR, PLSR和SVM三种, 虽然SVM预测性能较优, 但模型结构复杂, 会花费较多时间。 MLR是较为简便的模型, 其预测能力与PLSR相差较小。 因此, 土壤中石油烃含量可视化分布的研究采用连续投影算法筛选的特征变量建立MLR预测模型, 得到最佳的多元线性方程, 然后将图像中像素点的数据代入方程中, 最终生成石油烃含量在土壤中分布的伪彩色图像, 实现含量空间分布的可视化。

利用SPA筛选出的特征波长光谱数据作为输入, 建立土壤中石油烃含量MLR预测模型, 结果如下:

土壤中柴油含量的预测表达式

Y柴油=14.62-89.31X4+213.34X55-40.49X97-119.98X137+33.32X202

土壤中航空煤油含量的预测表达式

Y航空煤油=13.14-38.31X1-6.84X40-44.74X97-44.41X163+41.98X175-3.14X183

土壤中汽油含量的预测表达式

Y汽油=13.33+40X5+48.8X94-110.38X132+3.73X181

土壤中机油含量的预测表达式:

Y机油=17.89-71.16X89+39.48X151-66.36X172+70.59X187+40.37X199-42.66X201

式中, Y为含量的预测值, X为各特征波长下的光谱数据。

2.4 土壤中石油烃含量的可视化

根据筛选的特征波长, 从第二组不同石油烃含量污染土壤样本的高光谱图像(x× y× λ 202)中提取特征波长下的图像, 然后提取特征图像中每个像素点的光谱数据, 代入已经建立好的MLR模型, 可以得知每个像素点的石油烃含量, 从而得到土壤中石油烃含量的分布图。 图10— 图13为不同石油烃含量污染土壤的高光谱图像和分布可视化图。 从高光谱图像中只能根据颜色深浅定性地判断出哪些区域含量高, 哪些区域含量低, 并且人的视觉对灰度图像不敏感, 含量相近时, 在原始图像上难以辨别差异。 而在石油烃含量的分布可视化图中, 深蓝紫色表示含量较高, 红色表示含量较低, 颜色随着含量的增加由红色渐变为绿色最终变为蓝紫色。 通过观察颜色渐变情况, 不仅可以直观地了解各区域含量的高低, 还可以获取含量的数值, 定量地获取石油烃含量的分布情况。

图10 柴油污染土壤的高光谱图像和含量分布可视化图Fig.10 Hyperspectral image and content distribution visualization of diesel contaminated soil

图11 航空煤油污染土壤的高光谱图像和含量分布可视化图Fig.11 Hyperspectral image and content distribution visualization of aviation kerosene contaminated soil

图12 汽油污染土壤的高光谱图像和含量分布可视化图Fig.12 Hyperspectral image and content distribution visualization of gasoline contaminated soil

图13 机油污染土壤的高光谱图像和含量分布可视化图Fig.13 Hyperspectral image and content distribution visualization of motor oil contaminated soil

3 结 论

基于高光谱成像对石油烃污染砖红壤的含量分布可视化进行了研究。 针对不同含量石油烃污染土壤的高光谱图像, 采用连续投影算法对建模样本中提取出的光谱数据进行了特征变量的筛选, 并建立了MLR预测模型; 提取预测样本在特征变量下的图像, 将每个像素点的数据代入预测模型, 得到了土壤中石油烃含量的可视化分布图, 为以后利用高光谱遥感识别和反演土壤中石油烃含量提供了基础。

综上, 利用高光谱成像实现土壤中石油烃含量的分布可视化是可行的。

The authors have declared that no competing interests exist.

参考文献
[1] Dent D, Young A. Journal of Ecology, 1982, 70(3). [本文引用:1]
[2] Hauser A, Ali F, Al-Dosari B, et al. International Journal of Sustainable Development & Planning, 2013, 8(3): 413. [本文引用:1]
[3] Chakraborty S, Weindorf D C, Li B, et al. Science of the Total Environment, 2015, 514: 399. [本文引用:1]
[4] CHEN Zhi-li, YIN Wen-qi, LIU Hong-tao, et al(陈志莉, 尹文琦, 刘洪涛, ). Spectroscopy and Spectral Analysis(光谱学与光谱分析), 2017, 37(6): 1723. [本文引用:1]
[5] ZHANG Liang-pei, DU Bo, ZHANG Le-fei(张良培, 杜博, 张乐飞). Hyperspectral Remote Sensing Images Processing(高光谱遥感影像处理). Beijing: Science Press(北京: 科学出版社), 5. [本文引用:1]
[6] ZHU Feng-le, PENG Ji-yu, GAO Jun-feng, et al(朱逢乐, 彭继宇, 高峻峰, ). Transactions of the Chinese Society of Agricultural Engineering(农业工程学报), 2014, 30(23): 314. [本文引用:1]
[7] ZHANG Bing(张兵). Journal of Remote Sensing(遥感学报), 2016, 20(5): 1062. [本文引用:1]
[8] YU Lei, HONG Yong-sheng, ZHOU Yong, et al(于雷, 洪永胜, 周勇, ). Transactions of the Chinese Society of Agricultural Engineering(农业工程学报), 2016, 32(13): 95. [本文引用:1]