基于近似后验信息的高光谱异常检测
王强辉1, 华文深1,*, 黄富瑜1, 张炎1, 严阳2
1. 陆军工程大学石家庄校区电子与光学工程系, 河北 石家庄 050003
2. 中国人民解放军31681部队, 甘肃 天水 741000
*通讯联系人 e-mail: huawensh@126.com

作者简介: 王强辉, 1996年生, 陆军工程大学石家庄校区电子与光学工程系硕士研究生 e-mail: 13455602863@163.com

摘要

高光谱遥感技术通过成像光谱仪记录带有地物光谱信息的辐射信号, 获得包含光谱信息和空间信息的三维高光谱图像, 在光谱解混、 图像分类、 目标检测等方面取得了广泛的应用。 近年来, 随着遥感技术的发展及人们对获取目标准确位置的需求逐渐加大, 目标检测取得了较快的发展。 根据是否提前掌握目标光谱作为先验信息, 目标检测分为光谱匹配检测和异常检测。 光谱匹配检测需要目标光谱作为先验信息, 通常检测精度较高、 效果较好。 而异常检测不需要先验信息, 应用范围更广, 但是检测精度通常低于光谱匹配检测。 由于实际应用中缺少完备且实用的光谱库, 先验信息的获取较为困难, 不需要先验信息的异常检测成为研究的热点。 针对异常检测与光谱匹配检测相比精度较低的问题, 提出一种基于近似后验信息的高光谱异常检测算法。 首先利用矩阵分解算法对原始高光谱图像数据进行矩阵分解, 得到纯净的背景矩阵与包含噪声的异常矩阵。 舍弃异常矩阵, 将得到的背景矩阵作为近似背景信息。 然后计算图像所有像元光谱向量与背景矩阵中均值向量的马氏距离对图像进行初始异常检测, 得到初始异常像元, 将初始异常像元光谱取均值作为近似目标信息。 最后将近似背景信息与近似目标信息作为先验信息, 进行正交子空间投影得到最终的异常检测算法。 将本算法作用于图像中所有像元, 得到对整幅图像的异常检测结果。 为证明本算法的优良效果, 采用一组仿真数据和一组AVIRIS真实高光谱数据进行实验, 并与RX, LRX和LSMAD算法进行对比。 实验表明, 无论是从定性的角度还是定量的角度来看, 该算法能够有效抑制噪声, 在信噪比较低的情况下仍然可以有效地检测出图像中的异常目标, 检测精度较高并且对检测效率的影响不大, 取得了较好的检测效果。

关键词: 高光谱遥感; 异常检测; 矩阵分解; 先验信息; 正交子空间投影
中图分类号:TP751.1 文献标志码:A
Hyperspectral Anomaly Detection Based on Approximate Posterior Information
WANG Qiang-hui1, HUA Wen-shen1,*, HUANG Fu-yu1, ZHANG Yan1, YAN Yang2
1. Electronic and Optical Engineering Department, Shijiazhuang Campus, Army Engineering University, Shijiazhuang 050003, China
2. Unit 31681 of the People’s Liberation Army, Tianshui 741000, China
*Corresponding author
Abstract

Hyperspectral Remote Sensing technology records radiation signals with spectral information of objects through imaging spectrometers to obtain three-dimensional hyperspectral images containing spectral information and spatial information. It has been widely used in spectral unmixing, image classification, and target detection. In recent years, with the development of remote sensing technology and the increasing demand for accurate location of targets, target detection has achieved rapid development. According to whether the target spectrum is grasped in advance as a priori information, target detection is divided into spectrum matching detection and anomaly detection. Spectrum matching detection requires the target spectrum as a priori information, and usually has higher detection accuracy and better results. The anomaly detection does not require prior information and has a wider application range, but the detection accuracy is usually lower than that of spectral matching detection. Due to the lack of a complete and practical spectral library in practical applications, it is difficult to obtain prior information, and anomaly detection that does not require prior information has become a research hotspot. This paper proposes an Approximate Posterior Information-based Hyperspectral Anomaly Detection Algorithm. First, the matrix decomposition algorithm is used to decompose the original hyperspectral image data to obtain a pure background matrix and an anomaly matrix containing noise. The anomaly matrix is discarded, and the obtained background matrix is used as approximate background information. Then calculate the Mahalanobis distance between the spectral vector of all the pixels in the image and the mean vector in the background matrix to perform initial anomaly detection on the image to obtain the initial anomaly. Finally, the approximate background information and approximate target information are used as prior information, and orthogonal subspace projection is performed to obtain the final anomaly detection algorithm. Applying this algorithm to all the pixels in the image, we get the anomaly detection result for the whole image. In order to prove the excellent effect of this algorithm, a group of simulation data and a group of AVIRIS real hyperspectral data were used for experiments, and compared with RX, LRX, LSMAD algorithms. Experiments show that the algorithm can effectively suppress noise, both from a qualitative perspective and a quantitative perspective, and can still effectively detect anomalous targets in the image when the signal-to-noise ratio is relatively low. The effect of detection efficiency is small, and good detection results have been achieved.

Keyword: Hyperspectral remote sensing; Anomaly detection; Matrix decomposition; Priori information; Orthogonal subspace projection
引 言

高光谱图像(hyperspectral image, HSI)是一种包含空间和光谱信息的三维图像, 其光谱分辨率极高, 包含了从可见光到中红外甚至长波红外数百个连续波段的光谱信息, 像元光谱曲线近似连续, 利用光谱信息进行目标检测具有广泛的应用。 根据是否提前掌握目标光谱作为先验信息, 目标检测分为需要先验信息的光谱匹配检测和不需要先验信息的异常检测。 由于目前缺少完备且实用的光谱库, 先验信息的获取极为困难, 不需要先验信息的异常检测成为研究的热点[1]

异常检测是指通过挖掘图像中的光谱和空间信息将图像中存在的异常像元检测出来。 经典的异常检测算法源自多光谱图像的RX算法[2], 是由Reed和Yu提出的基于广义似然比检验(generalized likelihood ratio test, GLRT)的恒虚警率(constant false alarm rate, CFAR)方法。 其假设背景服从多元高斯分布, 而异常目标偏离这种分布, 通过计算待测像元与背景的马氏距离实现异常检测。 由于该算法背景的获取源于整幅图像, 不可避免地将异常成分混入背景中, 造成检测精度较低、 虚警率较高。 为了更为准确地获取背景数据、 提高检测效果, Taitano等提出了局部RX(local RX, LRX)算法[3]。 该算法通过建立滑动双窗口模型, 使背景的提取更为准确, 提高了检测精度[4]。 近年来, 基于低秩稀疏矩阵分解(low rank and sparse matrix decomposition anomaly detection, LSMAD)的异常检测算法[5]有了较大的发展, 该算法将高光谱数据矩阵分解为低秩背景矩阵、 稀疏异常矩阵和噪声矩阵[6, 7], 然后利用低秩背景的协方差矩阵和均值向量构造RX算子, 提取异常点实现异常检测。

传统的正交子空间投影(orthogonal subspace projection, OSP)算法[8]是由Harsanyi和Chang提出的一种光谱匹配检测算法, 通过抑制背景并且最大化信噪比实现目标检测。 与无异常检测算法相比, 其检测精度更高、 效果更好[9]。 考虑到从光谱库中获取目标与背景的先验信息较为困难, 本文提出了一种基于近似后验信息的异常检测(approximate posterior information-based anomaly detection, APIAD)算法, 利用矩阵分解算法得到的背景矩阵构造近似背景信息与近似目标信息, 然后将其作为传统OSP算法的先验信息实现异常检测。 充分利用了异常检测算法不需要先验信息和光谱匹配检测算法精度高的优点, 提高了对异常目标的检测性能。

1 矩阵分解算法

矩阵分解算法将高光谱数据矩阵分解为低秩背景矩阵、 稀疏异常矩阵和噪声矩阵。 在高光谱图像中, 异常目标出现概率较低, 所以异常部分是稀疏的。 背景部分具有很大的相关性, 所以是低秩的。 矩阵分解模型如式(1)

XM×H=BM×H+SM×H+NM×H(1)

式(1)中: M为波段总数, H为像元个数。 X为高光谱数据矩阵, B为低秩背景矩阵, S为稀疏异常矩阵, N为噪声矩阵。

矩阵分解可以通过去分解(Go Decompose, GoDec)算法实现: 通过对B的秩和S的稀疏度进行约束, 限制矩阵分解模型的复杂度, 最终得到低秩背景矩阵和稀疏异常矩阵(包含噪声矩阵)。 GoDec算法通过最小化分解误差来求解低秩矩阵B和稀疏矩阵S

argminB, SX-B-SF2, rank(B)R, card(S)kH(2)

式中: ‖ · ‖ F代表F范数, R为低秩矩阵秩的最大值, k为稀疏矩阵的稀疏度, 反映了图像的稀疏分量, 可以将其定义为矩阵Sl0范数, 随着迭代次数的增加, 分解误差逐渐减小, 可以转换为交替求解以下两个参数

Bt=argminrank(B)RX-B-St-1F2(3)

St=argmincard(S)kHX-Bt-SF2(4)

式中: BtSt是第t次迭代的最优结果。 在运算之前, 首先对矩阵进行初始化: 迭代次数t设置为0, Bt设置为X, St设置为零矩阵。 在迭代过程中, 不断更新BtSt

Bt=i=1rλiUiVTi, SVD(X-St-1)=VT, St=PΩ(X-Bt), Ω:(X-Bt)i, jΩ0, and(X-Bt)i, jΩ̅, Ωk, Ω̅=supp(St-1)(5)

式中: SVD是奇异值分解, λ iX-St-1的第i个最大奇异值, Ω 是‖ X-St‖ 前k个最大元素的非零子集; PΩ ()是将矩阵投影到Ω , Ω̅是矩阵St-1的支持。 当‖ XX-Bt-St F2达到局部最小时, 得到最优的低秩背景矩阵B和稀疏异常矩阵S, B=[b1b2bH], S=[s1s2sH]。

2 基于近似后验信息的异常检测算法
2.1 传统OSP算法

传统OSP算法是一种基于线性混合模型的光谱匹配检测算法[10, 11], 需要同时具备目标与背景的先验信息, 它能减少背景光谱对检测效果的影响, 而且能抑制各种噪声。 对于任意一个光谱向量r, 可以认为其由目标、 背景和噪声三部分组成

r=dαd+UαTU+n(6)

式中: d为目标向量, U为背景矩阵, α d和α U分别表示向量r对应的目标和背景含量, n表示噪声向量。 利用投影算子 PU=I-UU+, 将rU方向投影, 则抑制了背景信息, 保留了目标信息

PUr=PU(dαd+UαTU+n)=PUdαd+PUn(7)

将投影后的信号最大化信噪比, 得到传统OSP算法

POSP=dTPU(8)

2.2 基于近似后验信息的异常检测算法

在实际应用中, 我们很难获取目标与背景的先验信息, 造成检测精度更高的OSP算法的应用受到很大限制[12]。 为了充分利用传统OSP算法精度高的优点, 将矩阵分解算法得到的低秩背景矩阵B作为传统OSP算法的近似背景信息, 近似目标信息则通过计算图像像元与低秩背景矩阵B的马氏距离得到

μb=i=1HbiH(9)

Γb=(B-μb)T(B-μb)H(10)

δ(r)=(r-μb)TΓb-1(r-μb)(11)

式中: r为待测像元光谱向量, μ bΓ b分别为低秩背景矩阵B的均值向量和协方差矩阵。 设置阈值η , 若检测器输出δ (r)> η , 则待测像元r视为目标像元, 反之视为背景。 计算图像中所有像元, 得到图像的所有初始异常目标像元。 取初始异常目标像元的光谱均值作为近似目标信息

d'=1li=1lri(12)

式中: ril表示初始异常目标向量与向量个数。

将得到的近似背景信息与近似目标信息作为传统OSP算法的先验信息, 得到基于近似后验信息的异常检测算法

PAPIAD=d'TPB(13)

其中: PB=I-BB+

2.3 算法的步骤与实现

步骤1 矩阵分解与提取近似背景信息

采用去分解算法将高光谱数据矩阵分解为低秩背景矩阵、 稀疏异常矩阵和噪声矩阵, 低秩背景矩阵作为近似背景信息。

步骤2 提取近似目标信息

计算图像中所有像元与低秩背景矩阵的马氏距离得到初始异常目标像元, 取初始异常目标像元的光谱均值得到近似目标信息。

步骤3 正交子空间投影

将得到的近似背景信息与近似目标信息作为传统OSP算法的先验信息, 得到基于近似后验信息的异常检测算法, 实现对整幅图像异常检测。 算法流程图如图1所示。

图1 算法流程图Fig.1 Algorithm flow chart

3 结果与讨论

为验证算法的有效性和可靠性, 采用一组仿真数据和一组AVIRIS真实高光谱数据进行仿真实验。 仿真环境: CPU处理器为IntelCore i7-7700HQ, 主频为2.80 GHz, 安装内存为8.00 GB, 软件为Matlab R2017a。

3.1 仿真数据

3.1.1 实验过程

首先, 利用ENVI软件从数据库中提取三种不同物质进行实验, 分别为矿物(minerals2151/PortlanditeGDS525)、 干植被(CDE004)、 湿植被(BlueOak)。 将矿物作为异常目标, 两种植被作为背景。 三组物质光谱曲线如图2所示, 光谱范围为0.4~2.5 μ m, 光谱分辨率为4 nm, 包含526个波段。

图2 三组物质光谱曲线Fig.2 Spectral curves of three types of material

利用线性混合模型构造仿真实验数据, 大小为100× 100像元, 将图像分为上下两部分来构造背景, 上部分B1中干植被和湿植被以0.7:0.3比例混合, 下部分B2中干植被与湿植被以0.3:0.7比例混合。 构造完背景后, 在背景中放置20个目标, 分别为T1-T10T'1-T'10, 大小为5× 5像元, T2-T10T'2-T'10为目标与所处背景依次以0.9:0.1, 0.8:0.2, 0.7:0.3, 0.6:0.4, 0.5:0.5, 0.4:0.6, 0.3:0.7, 0.2:0.8, 0.1:0.9的比例混合, T1T'1为纯目标像元, 分别加入信噪比为20, 15和10 dB的高斯白噪声, 20 dB下第10波段的灰度图如图3所示, 真实目标分布如图4所示。

图3 20 dB下第10波段灰度图Fig.3 10th gray-scale map at 20 dB

图4 真实目标分布图Fig.4 Real target distribution map

3.1.2 结果分析

对不同信噪比下的仿真数据分别运用RX算法、 LRX算法、 LSMAD算法和本算法进行异常检测, 得到的检测结果灰度图像如图5— 图7所示。

图5 20 dB下4种算法检测结果Fig.5 Test results of 4 algorithms under 20 dB

图6 15 dB下4种算法检测结果Fig.6 Test results of 4 algorithms under 15 dB

图7 10 dB下4种算法检测结果Fig.7 Test results of 4 algorithms under 10 dB

通过对图5— 图7三组不同信噪比下的检测结果分析可知: RX算法的检测结果较差, 几乎难以检测出目标, 只有在信噪比较高的情况下检测出几个混合比例较高的目标, 受噪声影响较大。 这主要是因为RX算子是基于马氏距离的能量检测算子, 背景的构造过程中混入了大量异常目标, 对于与背景差异不大、 混合比例较低的目标很难进行检测。 LRX算法与RX算法相比背景的构造更加合理, 混入的异常目标较少, 但仍然受信噪比影响较大, 在信噪比较低的情况下同样难以检测出异常目标。 LSMAD算法与前两种算法相比检测效果有明显的提高, 在较低信噪比情况下仍然可以检测出混合比例较高的异常目标, 但受信噪比的影响仍然较大。 这是因为LSMAD算法进行异常目标检测时虽然利用GoDec算法得到的低秩背景矩阵构造背景, 但最后的检测结果仍然是通过RX算子得到, 目标混合比例较低时仍然难以检测。 本文提出的算法利用矩阵分解算法得到的背景矩阵和异常目标向量均值作为先验信息, 然后通过OSP算法实现检测。 与其他算法相比, 该算法在信噪比较低的情况下仍然可以将混合比例较低的异常目标检测出来, 受信噪比影响较小, 这是因为该算法得到的背景矩阵非常纯净, 且利用的异常目标向量均值和最大信噪比构造的检测器更进一步抑制了噪声的影响, 提高了异常目标检测精度, 达到了较好的检测效果。

接收机工作特性(receiver operating characteristics, ROC)曲线反映了算法的检测效果, 它表示检测率Pd与虚警率Pfa之间的变化关系, 虚警率越低、 检测率越高, 即ROC曲线向左上方弯曲越大, 检测效果越好。 利用ROC曲线线下面积(AUC值)定量描述检测效果, 三种信噪比下ROC曲线如图8所示, AUC值和运行时间如表1所示。

图8 三种信噪比下的ROC曲线Fig.8 ROC curves for three signal-to-noise ratios

表1 三种信噪比下AUC值和运行时间 Table 1 AUC values and running time under three signal to noise ratios

通过分析ROC曲线、 AUC值及运行时间可得: 本算法优势较为明显, 在虚警率较低情况下仍然具有较高的检测率, 并且受噪声影响相对较小, AUC值更大, 其运行时间比LSMAD算法仅增加了1.6 s左右, 对时间消耗并不算太大。

3.2 真实高光谱数据

3.2.1 实验过程

该数据选取的是AVIRIS传感器拍摄的洛杉矶机场的部分数据, 波长范围是0.37~2.51 μ m, 去除信噪比较低和水汽吸收较明显的波段, 选择剩余205个波段作为研究对象。 截取的图像区域大小为50× 50像元, 存在2个异常目标, 其第10波段灰度图及真实目标分布图分别如图9、 图10所示。

图9 第10波段灰度图Fig.9 10th band gray-scale

图10 真实目标分布图Fig.10 Real target distribution map

3.2.2 结果分析

对该实验数据分别运用RX算法、 LRX算法、 LSMAD算法和本文提出的算法进行检测, 设检测到的目标像元数为50, 得到的检测结果图像及其三维概率图像如图11所示。

图11 四种算法检测结果Fig.11 Detection results obtained by four algorithms

分析以上四种算法检测结果: RX算法存在较大的虚警, 而LRX算法虚警率较低, 这与LRX算法选取局部而不是全局信息作为背景有关, 检测效果较好, 但其对异常目标的轮廓识别较差。 LSMAD算法在轮廓识别上有了较大的改善, 但也存在虚警率较高的现象。 本算法虚警率较低, 并且可以近乎准确地识别出异常目标的轮廓, 检测效果相对较好。

图11从定性的角度表示了检测结果, 下面从定量的角度进行分析。 算法检测到的异常目标数、 目标像元数和虚警数是衡量算法性能的三个重要指标, 检测到的总的像元数为50。 RX算法检测到2个异常目标, 目标像元数为33个, 虚警数为17个。 LRX算法检测到2个异常目标, 目标像元数为45个, 虚警数为5个。 LSMAD算法检测到3个异常目标, 目标像元数为27个, 虚警数为23个。 本算法检测到2个异常目标, 目标像元数为48个, 虚警数为2个。 ROC曲线及四种算法的定量检测结果分别如图12、 表2所示。

图12 真实数据ROC曲线Fig.12 Real data ROC curves

表2 四种算法的定量检测结果 Table 2 Quantitative test results of four algorithms

通过对比分析, 我们发现本算法具有极大的优势, 其漏检率最低, 虚警率最低, AUC值最大, 明显优于其他三种算法。 与LSMAD算法相比优势更加明显, 仅牺牲了极少的运行时间, 克服了LSMAD算法误将部分背景检测为异常目标的问题, 极大程度上提高了检测效果。

4 结 论

异常检测算法不需要任何先验信息, 应用范围较广, 但其检测精度与需要先验信息的光谱匹配检测算法相比仍有一定的差距。 针对这一问题, 提出了一种基于近似后验信息的异常检测算法。 首先利用矩阵分解算法得到低秩背景矩阵, 利用低秩背景矩阵得到近似背景信息与近似目标信息, 然后利用正交子空间投影算法得到最终的检测算法, 最后将本算法作用于整幅图像完成异常检测。 充分发挥了光谱匹配检测算法精度高和异常检测算法不需要先验信息的优势, 与RX算法、 LRX算法、 LSMAD算法相比, 本算法极大地改善了检测性能, 提高了检测精度, 降低了虚警率, 并且对噪声的抑制效果更好, 取得了很好的检测效果。 这表明了将异常检测算法与光谱匹配检测算法相结合在目标检测领域可以充分发挥两组算法的优点, 具有较大的发展空间。

参考文献
[1] SUN Lin, BAO Jin-he, LIU Yi-chao(孙林, 鲍金河, 刘一超). Surveying and Mapping Science(测绘科学), 2012, 37(1): 131. [本文引用:1]
[2] Reed I S, Yu Xiaoli. IEEE Transactions on Acoustics Speech and Signal Processing, 1990, 38(10): 1760. [本文引用:1]
[3] Taitano Y P, Geier B A, Bauer Jr K W. EURASIP Journal on Advances in Signal Processing, 2010, 2010. [本文引用:1]
[4] Liu Weimin, Chang Chein-I. Multiple-Window Anomaly Detection for Hyperspectral Imagery. Igarss: IEEE International Geoscience and Remote Sensing Symposium, 2008. IEEE Journal of Selected Topics in Applied Earth Observation and Remote Sensing, 2013, 6(2): 644. [本文引用:1]
[5] Sun Weiweei, Liu Chun, Li Jialin. Journal of Applied Remote Sensing, 2014, 8(1): 083641. [本文引用:1]
[6] Zhang Yuxiang, Du Bo, Zhang Liangpei, et al. IEEE Transactions on Geoscience and Remote Sensing, 2016, 54(3): 1376. [本文引用:1]
[7] Xu Yang, Wu Zebin, Li Jun, et al. IEEE Transactions on Geoscience and Remote Sensing, 2016, 54(4): 1990. [本文引用:1]
[8] Harsanyi Joseph C, Chang Chein-I. IEEE Transactions on Geoscience and Remote Sensing, 1994, 32(4): 779. [本文引用:1]
[9] ZHAO Chun-hui, WANG Xin-peng, YAO Xi-feng(赵春晖, 王鑫鹏, 姚淅峰). Journal of Shenyang University(沈阳大学学报), 2016, 28(3): 212. [本文引用:1]
[10] YUAN Jing, ZHANG Yu-jing, GAO Fang-ping(袁静, 章毓晋, 高方平). Journal of Infrared and Millimeter Waves(红外与毫米波学报), 2018, 37(5): 553. [本文引用:1]
[11] LIU Ming, DU Xiao-ping, SUN Jie(刘明, 杜小平, 孙洁). Journal of the Academy of Equipment(装备学院学报), 2012, 23(4): 92. [本文引用:1]
[12] ZHAO Chun-hui, LI Xiao-hui, WANG Yu-lei(赵春晖, 李晓慧, 王玉磊). Journal of Electronic Measurement and Instrument(电子测量与仪器学报), 2014, 28(8): 803. [本文引用:1]