基于子空间划分和视觉可识别度的波段选择方法研究
金椿柏1, 杨桄1,*, 卢珊2,*, 陈强1,3, 郑南1
1.空军航空大学, 吉林 长春 130022
2.东北师范大学地理科学学院, 吉林 长春 130024
3.中国人民解放军93116部队, 辽宁 沈阳 110000
*通讯作者 e-mail: yg2599@126.com; lus123@nenu.edu.cn

作者简介: 金椿柏, 1997年生, 空军航空大学硕士研究生 e-mail: 1262147682@qq.com

摘要

面对日益丰富的机载、 星载高光谱传感器, 及其相伴增多的高光谱数据, 产生的数据量过大、 波段冗余等问题一直是高光谱图像处理、 解译的重难点。 同时, 利用高光谱遥感技术揭露伪装目标, 也一直是现代遥感应用技术研究要点。 在探测得到海量的地物光谱数据、 具有冗余的光谱信息, 设计恰当的数据降维技术具有至关重要的作用。 降维处理的主要方法中的波段选择方法, 其不但可以使图像数据的光谱信息在不失真的条件下实现数据降维, 还能在其基础上对伪装目标及其背景实现精确区分, 是当今利用高光谱技术进行军事应用的重要技术手段, 同时也是国内外众多学者的研究热点。 利用各类指标计算波段间的不同表现, 并依据其参数选取代表性强的波段用于地物识别或分类来检验方法的优劣是目前比较常用的研究方式, 但是面向特殊地物, 如植被伪装目标的特定波段选择方法方面的实验研究现仍较少。 研究选取绿色钢板、 绿色伪装网、 绿色假草皮, 置于含有绿色健康植被、 湿润裸地、 干燥裸地的背景环境中, 通过模拟真实环境中的伪装目标和背景地物进行波段选择及分类实验验证。 首先通过分析光谱曲线, 选取显著特征波段; 其次结合根据波段间相关系数划分的子空间进行波段筛选; 然后依据地物目标的图像亮度建立视觉模型, 最终得到具有相对独立性和最佳可识别度的波段选择集合。 并在支持向量机分类器和马氏距离分类器中同两种常用算法选择波段结果与全波段组合进行分类实验对比, 实验发现所提出方法的波段选择结果相对于常用算法和全波段组合, 分类精度和速度均有所提高。 其中, 相较于应用全波段进行分类, 在两类分类器的分类结果, 总体分类精度分别提高4.559 2%和2.364 8%, Kappa系数分别提高0.059 4和0.031 2, 分类时间减少6.83 s。 实验证明该方法能有效在植被伪装目标和背景地物之间做出高效分类, 具有较大实际应用价值。

关键词: 植被伪装; 相关系数; 子空间划分; 可识别度; 分类精度
中图分类号:TP751.1 文献标志码:A
Research on Band Selection Method Based on Subspace Division and Visual Recognition
JIN Chun-bai1, YANG Guang1,*, LU Shan2,*, CHEN Qiang1,3, ZHENG Nan1
1. Aviation University Air Force, Changchun 130022, China
2. School of Geographical Science, Northeast Normal University, Changchun 130024, China
3. Unit 93116 of PLA, Shenyang 110000, China
*Corresponding authors
Abstract

In the face of the increasingly abundant airborne and spaceborne hyperspectral sensors and the accompanying increase in hyperspectral data, the problems of excessive data volume and band redundancy have always been the major difficulties in hyperspectral image processing and interpretation. At the same time, the use of hyperspectral remote sensing technology to reveal camouflaged targets has always been the key point of modern remote sensing application technology research. In detecting massive spectral data of ground objects and redundant spectral information, the design of appropriate data dimensionality reduction technology plays a vital role. The band selection method among the main methods of dimensionality reduction processing can not only reduce the spectral information of the image data without distortion but also accurately distinguish the camouflaged target and its background based on it. Today, hyperspectral technology is an important technical means for military applications, and it is also a research hotspot for many scholars at home and abroad.It is a commonly used research method to use various indicators to calculate the different performances between the bands and to select the most representative bands according to their parameters for feature identification or classification to test the pros and cons of the method. However, few experimental studies still exist on specific band selection methods for special features, such as vegetation camouflage targets. In the study, green steel plates, green camouflage nets, and green fake turf were selected and placed in a background environment containing healthy green vegetation, wet bare ground, and dry, bare ground. Band selection and classification experiments were carried out by simulating camouflage targets and background objects in the real environment. First, analyze the spectral curve, and select a significant feature band. Secondly, the band screening is performed based on the sub-space divided according to the phase relationship between the band. The visual model is then established according to the image brightness of the property target. Finally obtains a band selection collection with relative in dependence and optimal recognition. Next, using support vector machine classifier and Mahalanobis distance classifier, the proposed algorithm is compared with two common algorithms in band selection results and full band combination for classification experiments. The experiment shows that the band selection results of the proposed method are better than those of the common algorithms in band selection results and full band, and the classification accuracy and speed are improved. Among them, compared to using full band classification, the overall classification accuracy of the two types of classifiers has been improved by 4.559 2% and 2.364 8%, respectively. The Kappa coefficient has been improved by 0.059 4 and 0.031 2, and the classification time has been reduced by 6.83 seconds. Experiments show that this method can effectively classify vegetation camouflage targets and background objects and has great practical application value.

Keyword: Vegetation camouflage; Correlation coefficient; Subspace partition; Recognition degree; Classification accuracy
引言

随着成像光谱技术的不断发展, 光谱分辨率不断提高, 获取的高光谱数据量正在不断增多, 如我国于2018年成功发射升空的高分五号对地观测卫星[1], 搭载的可见短波红外高光谱相机共包含330个波段, 幅宽60 km, 光谱分辨率达5 nm, 以及珠海一号高光谱星[2], 分辨率优于10 nm, 幅宽优于150 km, 4颗卫星家族5天即可将全球扫描一遍, 海量数据为遥感应用带来了丰富的支撑数据的同时也为处理数据带来了困难。 目前常用的处理技术难以适应对全范围较窄波段的快速、 高效处理, 巨大的数据量极易引发波段冗余等问题, 为地物分类、 目标识别工作形成阻碍。 所以需要对海量数据进行降维处理, 并且要尽量减少光谱信息的损失[3]

波段选择方法作为数据降维的主要方式之一, 不仅可以有效地减少所涉及的大量数据带来的负面影响, 克服了维度的“ 诅咒” [4], 还能从原始波段中去除冗余和不相关的波段, 同时相比于特征提取方法在一定程度上避免光谱特征信息失真[5], 可以适用于某些特定应用, 是缓解高光谱数据维度灾难的有效手段。 利用高光谱数据, 采用有效的波段选择方法执行特定领域的应用研究, 已经成为一个非常热门的话题, 如农作物健康状况监测[6]、 水体污染查证[7]、 目标检测[8]等。 然而, 许多波段方法习惯于选择一个紧凑且低冗余的波段子集, 对于某些特定应用尤其是目标分类是不够的, 因为它可能会降低某些地物的分类性能[9]。 在实际应用层面, 波段选择方法应更加重视选择具有代表性的波段用于某些特定地物识别与分类的应用[10, 11], 针对特定精细地物提取光谱特征, 继而选取适合分类的精细光谱波段。 Chen[12]等采用光谱信息发散度作为判别异常目标差异描述参数, 测量全部光谱区域和几个特定范围的光谱信息散度, 定量地评估了波段选择对伪装检测的影像, 是一种低成本且有效的伪装目标检测工具, 并且可以在可见波段光谱成像技术之外进一步发展。 曹鹏飞[13]等提出利用图像亮度信息选取待测目标的光谱波段, 并应用在多光谱数据中, 取得了较好实验效果。 本文面向地面植被伪装目标, 通过分析地物光谱特征信息确定显著特征波段、 通过波段间相关性划分子空间降低数据维度, 再根据关于目标解译的数理统计信息进行排序确定最终波段组合。 其中, 目标解译数理统计信息是依据各波段灰度图像的地物目标亮度信息差异得到, 并依此确定最终的波段选择子集。 研究力图对真实环境侦察得到的高光谱数据降维处理, 选定用于地物分类的有效特征波段; 同时, 与一般波段选择方法进行地物分类的性能对比, 比较所提出方法的分类精度和分类速度, 使其能够满足实际需求, 提高侦察分析任务完成质量和效率, 但是本研究受限于所研究数据为低空侦察模拟实验采集得到, 时间、 风力、 光照条件等客观因素较为理想, 未能引入真实战场环境下数据采集的不利客观条件进行分析。

1 实验部分
1.1 实验数据与方案设计

实验以我国东北地区某湿地公园部分自然区域为研究区进行临空数据采集, 采集时间为上午11:00至下午14:00, 满足接下来的影像预处理需求。 使用AirlineDivision软件进行影像数据的预分割, Spectronon Pro将高光谱成像DN值转化为辐射亮度, 再以提前设置在靶标布区域的参考白板将数据转化为反射率, 并在correct-georectify Airborne Datacube对其进行几何校正。 经过数据预处理再选取具有三种伪装目标、 三种背景地物区域进行面向地物分类波段选择方法的研究, 研究区目标地物如图1标注所示, 分别为: A: 绿色钢板, B: 绿色伪装网(民用), C: 绿色假草皮, D: 绿色健康植被, E: 干燥裸地, F: 湿润裸地共6类。

图1 采集研究区域地物目标Fig.1 Ground targets in the acquisition and research area

为了更科学地研究和显示图像数据由采集到逐步处理获得最终分类结果的情况, 本研究的实验方案设计流程如图2。

图2 实验流程图Fig.2 Experimental flow chart

1.2 波段选择方法

研究面向伪装目标分类识别研究的波段选择算法, 利用高光谱多维数据的谱段相关性, 将众多波段数据划分成几个内部相似的子空间, 并在各个子空间中, 创新地提出基于图像亮度信息对逐波段图像的地物目标亮度信息差异进行评价, 挑选出地物亮度信息差异较大的波段, 组合成最终波段子集。

1.2.1 基于波段相关性的子空间划分

为了避免波段冗余, 同时防止选择波段数过少, 造成光谱特征差异包含不全导致分类精度降低, 采取数理统计的方法, 即以波段相关系数为依据, 将全波段划分多个互斥波段子空间, 在每个子空间等距选取不同波段。 WiWj两波段的相关系数ri, j计算原理如式(1)

ri, j=k=1n(Wik-W̅i)(Wjk-W̅j)k=1n(Wik-W̅i)2k=1n(Wjk-W̅j)2(1)

式(1)中, WikWjk分别为所在波段的第k个像素值, W̅iW̅j分别为所在波段的均值, n为图像中像素总数。 相关系数ri, j越接近1, 表示相关性越强, 反之越弱。

1.2.2 基于图像亮度信息的地物可识别度

由于人眼对于高光谱每个波段的灰度图像识别主要取决于灰度图像的亮度大小和灰度分布, 本研究基于以上特点, 利用平均灰度值Iave表示第i个波段灰度图像的亮度, 用标准差σ i来评价灰度图像的离散程度[13], 灰度图像的亮度和标准差计算公式如式(2)和式(3)

Iave=y=1Mx=1NIi(x, y)MN(2)

σi=y=1Mx=1N[Ii(x, y)-Iave]2MN(3)

式(2)和式(3)中, Ii(x, y)是图像每个像素的灰度值, MN分别表示灰度图像的行数和列数标。 σ i越大, 表明第i波段的信息量越丰富。

通常情况下, 人眼视觉识别图像的最佳亮度为最大亮度值(255)的一半, 即越接近128越好, 其接近程度用式(4)模型来衡量

C=Iave128(Iave,  128)2-Iave128(else)(4)

利用图像亮度信息法所选择的波段的参考背景值Ib越小, 所在波段的灰度图像方差越大, 视觉效果就较好。 综合以上因素, 可以计算得出各波段图像的可识别度Di如式(5)

Di=CσiIb(5)

Ib=1Nx=iNImax(x)(6)

式中, Imax(x)是图像纵向上y=1, 2, …, M亮度最大的像素值。 Di值越大表明第i波段具有越好的视觉解译效果。

2 结果与讨论
2.1 伪装目标光谱特征波段分析

各类地物光谱曲线如图3所示, 可以发现绿色钢板的光谱曲线第一个波峰出现在530 nm处, 高于具有相同视觉颜色的绿色假草皮、 伪装网和健康植被, 是众多地物中反射率最大的, 在690~890 nm反射值不断上升, 790 nm后斜率较大至850 nm后逐渐趋于平缓, 于900 nm出现第二个波峰后逐渐小幅下降; 绿色健康植被具有活性植物的独有特征, 在550 nm出现第一个波峰后逐渐下降, 于700~730 nm范围反射值陡升, 体现绿色植物独有的“ 红边特性” , 在760~1 000 nm近红外波段具有众多地物中最高的反射值; 在近红外波段, 反射率仅次于绿色健康植被的湿润裸地在水含量的作用下, 具有了较高的反射率, 并且在600~700 nm具有反射值高于其他地物的特性; 干燥裸地光谱曲线类似于湿润土地, 但在680 nm处存在细微“ 波谷” ; 绿色伪装网在780~1 000 nm反射值居于所有地物最低, 在840 nm后绿色假草皮反射值仅高于绿色伪装网。

图3 各类地物光谱曲线Fig.3 Spectral curves of various ground objects

综上, 经对各类地物的光谱曲线的特征分析, 初步挑选出具有各类地物显著性差异、 区分度较大的个别波段, 并以其为依据在进行下一步聚类划分选择。 挑选出的显著差异波段序号为: 34, 58, 68, 84, 120, 140。

图4 显著特征波段选取位置Fig.4 Select position of significant feature bands

2.2 波段子空间划分初选

由式(1)计算得到全波段间相关系数矩阵, 并将其可视化得到全波段相关系数矩阵热力图, 如图5所示。 据此可以将150波段划分为五个互斥波段子空间: 1~27、 28~32、 33~42、 43~73、 74~150。 并在各个子空间内, 以上一节光谱差异分析得到的特征波段(表中加粗显示)为中心取等差间距波段, 如表1, 实现波段筛选, 来为下一步工作提供冗余较少的数据选集。

图5 全波段相关系数矩阵热力图Fig.5 Thermodynamic chart of full-band correlation coefficient matrix

表1 子空间划分波段选择结果 Table 1 Band selection results of subspace division
2.3 基于地物目标可识别度的波段再选择

各类地物在每一波段的图像可识别度如图6所示。

图6 地物目标可识别度Fig.6 Ground targets identification degree

本节利用结合地物特征与子空间划分选择的众多波段, 针对各类地物目标采取图像亮度信息法得到各波段的可识别度, 将子空间内所有波段由大到小排序, 列出每种地物可解译度最大值波段如表2所示。

表2 各子空间内可解译度最大波段 Table 2 Maximum bands of decipherability in each subspace

下一步, 基于各类地物可解译度逐个波段求和, 排序得到各子空间内最优可解译度波段, 实行波段组合, 得到最终波段选择结果为: 27, 32, 37, 62, 125。

2.4 分类实验及结果分析

本节将得到的波段选择结果进行分类实验, 验证其用于分类的可行性, 研究中选取有监督的支持向量机(support vector machine, SVM)分类器和马氏距离(Mahanlanobis distance, MD)分类器对高光谱图像实行图像分类, 做监督分类时选取每类地物小于像素总数量的15%的像素点作为采样区域。

同时, 将本文波段选择结果与全波段分类结果以及两种常用波段选择算法, 即基于信息量排序(information sorting, IS)[14]选择算法和基于自动子空间划分(auto subspace partition, ASP)[15]选择算法, 选择5个波段组成波段子集进行分类实验, 分类结果如图7所示。

图7 基于各算法在MD和SVM分类器上分类结果
(A): Mahanlanobis distance classification; (B): Support vector machine classification
Fig.7 The results are classified by SVM and MD classifier based on each algorithm
(A): Mahanlanobis distance classification; (B): Support vector machine classification

通过对比各类方法的总体分类精度(overall accuracy, OA)和Kappa系数如表3所示, 选取绿色钢板作为代表伪装目标地物, 表4显示其分类结果的用户精度和生产者精度, 检验本文所提出方法的分类性能和实际可应用性。

表3 实验区分类结果精度和速度统计 Table 3 The accuracy and speed statistics of the classification results in experiment area
表4 实验区绿色钢板分类结果生产者精度和用户精度 Table 4 Producer’ s Accuracy and User’ s Accuracy of green steel plate classification results in experimental area

从实验结果可以看出, 本文所提出面向目标解译的波段选择方法, 减少了波段冗余, 相对于全波段数据, 显著提高了地物目标分类速度, 分类时间由全波段的9.06 s降至2.23 s, 相比于另外两种波段选择方法, 同样具有时间较短的优势。 基于光谱分析结合波段相关性划分子空间很大程度上保留了众多波段的高价值光谱信息, 再根据目标地物的可识别度, 定量地评价了不同波段对不同地物的识别效能。 得到的波段选择集合的分类结果, 在SVM分类器和MD分类器中, 本文研究取得的波段选择集合分类精度达92.690 1%和85.955 4%, 高于应用全部波段执行分类的精度88.130 9%和83.590 6%, 提高了4.559 2%和2.364 8%, Kappa系数同样高于全波段分类结果分别提高了0.059 4和0.031 2, 相比于另两种波段选择方法的分类结果, 仅在MD分类器低于ASP方法, 相差精度小于2%。 另外绿色钢板在MD分类器的分类结果中的生产者精度和用户精度均高于全波段分类结果, 在SVM分类器生产者精度大幅高于全波段的执行分类结果达12.93%。 由于本文采取的基于图像亮度信息差异的方法, 结合了对地物的光谱特征分析, 选取不同地物亮度信息差异较大的波段, 是一种基于监督排序的波段选择方法, 所以在地物分类中的表现, 较另两种方法处于优势地位。

3 结论

对三类植被伪装目标和三类实地背景目标, 组成的六类地物的光谱曲线进行分析, 选定具有显著差异的特征波段, 结合光谱数据波段相关系数进行划分的子空间, 以显著特征波段为依据进行全波段筛选。 随后依据图像亮度信息, 计算得到各类地物在所选择范围内各波段的可识别度, 确定了选择波段的集合。 其中, 引入的图像亮度信息结合了地物目标的光谱特征与人眼的识别特点, 所选波段在可靠性上更接近于视觉解译, 本文所采用的波段选择模型更贴近于解译人员的肉眼识别能力, 具有更好的解释性。

分类实验的结果表明, 本研究所提出的方法一定程度上减少了波段冗余, 提高了分类速度, 相比于采取全波段执行分类, 所需时间更少, 分类精度分别提高了4.559 2%和2.364 8%。 也同常用的两种波段选择方法进行分类性能对比, 无论在分类精度还是分类速度上, 本文提出的方法模型均具有明显优势。 研究探索了目视解译难以应对识别植被类伪装目标这一难题的新解决方法与新应用思路, 也为面对更多自然环境、 人工环境等场景中伪装目标的揭露提供了新的借鉴方式。

参考文献
[1] WANG Chong-chang, XUE Rong-rong, ZHAO Shi-hu, et al(王崇倡, 薛荣荣, 赵世湖, ). Geography and Geo-information Science(地理与地理信息科学), 2021, 37(1): 33. [本文引用:1]
[2] LI Ai-min, XIA Guang-ping, QI Xin, et al(李爱民, 夏光平, 齐鑫, ). Journal of Geomatics Science and Technology(测绘科学技术学报), 2020, 37(4): 388. [本文引用:1]
[3] FANG Shuai, ZHANG Kun, ZHANG Jing, et al(方帅, 张坤, 张晶, ). Journal of Image and Graphics(中国图象图形学报), 2021, 26(8): 1940. [本文引用:1]
[4] Plaza A, Martinez P, Plaza J, et al. IEEE Transactions on Geoscience & Remote Sensing, 2005, 43(3): 466. [本文引用:1]
[5] Feng J, Li D, Gu J, et al. IEEE Transactions on Geoscience and Remote Sensing, 2022, 60: 5501719. [本文引用:1]
[6] LIU Yan-jun, ZHANG Gui, WANG Xiao, et al(刘彦君, 张贵, 王潇, ). Bulletin of Surveying and Mapping(测绘通报), 2020, (4): 34. [本文引用:1]
[7] HUANG Hui, ZHANG De-jun, WANG Chao, et al(黄慧, 张德钧, 王超, ). Spectroscopy and Spectral Analysis(光谱学与光谱分析), 2019, 39(8): 2377. [本文引用:1]
[8] Zhao D, Liu S, Yang X, et al. Journal of Spectroscopy, 2021, 2021: 6629661. [本文引用:1]
[9] Xie L, Li G, Peng L, et al. Journal of Applied Remote Sensing, 2017, 11(2): 026018. [本文引用:1]
[10] Shang X, Song M, Wang Y, et al. IGARSS 2020-2020 IEEE International Geoscience and Remote Sensing Symposium. IEEE, 2020. [本文引用:1]
[11] Manoharan P, Boggavarapu P. Infrared Physics & Technology, 2021, 119: 103948. [本文引用:1]
[12] Chen Y, Zhou J, Chen X, et al. DEStech Transactions on Computer Science and Engineering, 2017, 190: 753. [本文引用:1]
[13] CAO Peng-fei, LI Hong-ning, LUO Yan-lin, et al(曹鹏飞, 李宏宁, 罗艳琳, ). Laser & Optoelectronics Progress(激光与光电子学进展), 2014, (1): 011101. [本文引用:2]
[14] YAN Yang, HUA Wen-shen, LIU Xun, et al(严阳, 华文深, 刘恂, ). Optical Technique(光学技术), 2018, 44(5): 634. [本文引用:1]
[15] WANG Xiao-ning, SONG Wei-dong(王小宁, 宋伟东). Remote Sensing Information(遥感信息), 2020, 35(6): 122. [本文引用:1]