空-谱维联合Savitzky-Golay高光谱滤波算法及其应用
宁鸿章1,2, 谭鑫1,*, 李宇航1,2, 焦庆斌1, 李文昊1
1.中国科学院长春光学精密机械与物理研究所, 吉林 长春 130033
2.中国科学院大学, 北京 100049
*通讯联系人 e-mail: xintan_grating@163.com

作者简介: 宁鸿章, 1994年生, 中国科学院长春光学精密机械与物理研究所硕士研究生 e-mail: 875289508@qq.com

摘要

针对目前应用Savitzky-Golay(SG)滤波器进行高光谱图像滤波过程中空间信息无法利用, 造成小麦赤霉病高光谱分类识别模型精度仅能达到87.088 9%的问题, 提出高光谱图像空-谱维联合SG滤波(TSG滤波)的方法, 使模型精度相比采用SG滤波提升了12.066 7%。 该算法将一维的SG卷积核按四个方向扩展成二维的SG卷积核, 根据卷积定理利用快速傅里叶变换对高光谱图像数据进行空间及光谱维联合快速滤波。 设置TSG滤波核窗口系数 m=2~4, 阶数 n=3~5, 滤波后图像信噪比提升了10%以上、 峰值信噪比高于30 db、 结构相似度大于96%, TSG滤波能保持原图特征并显著提升图像信噪比。 对比Pavia University高光谱图像经TSG滤波( m=3, n=4)、 SG滤波( m=7, n=3)后的灰度图像与光谱图, 可以看出TSG滤波后图像条带噪声得到了抑制、 特征峰相对峰值高度最高提升31.68%、 特征波段平均强度提升41.83%, 而SG滤波后图像条带噪声依然清晰且特征峰相对峰值高度至少降低了13.40%。 构建基于TSG-PCA-SVM算法的小麦赤霉病高光谱分类识别模型, 训练集包含500个样本点, 测试集包含4500个样本点, 模型测试集分类精度高达99.155 6%、 卡帕系数0.983 613, 对于小麦高光谱数据集中全部116 880个样本点的总分类精度高达99.206 0%。 经TSG滤波后分类模型精度高、 一致性好, 分类精度相较于SG滤波后的87.088 9%获得了显著提升。 综上所述, 该研究为高光谱图像滤波提供了一种新的思路, 为小麦赤霉病高光谱识别系统构建提供了参考与依据。

关键词: SG滤波器; 高光谱图像; 主成分分析; 支持向量机; 分类识别
中图分类号:TP79 文献标志码:A
Joint Space-Spectrum SG Filtering Algorithms for Hyperspectral Images and Its Application
NING Hong-zhang1,2, TAN Xin1,*, LI Yu-hang1,2, JIAO Qing-bin1, LI Wen-hao1
1. Changchun Institute of Optics, Fine Mechanics and Physics, Chinese Academy of Sciences, Changchun 130033, China
2. University of Chinese Academy of Sciences, Beijing 100049, China
*Corresponding author
Abstract

In the process of hyperspectral image(HI) filtering by Savitzky-Golay(SG) filter, the spatial information of HI is ignored which lead to the accuracy of recognition model of wheat HI dataset can only reach 87.088 9%. This paper proposes a method, TSG filter, that combines space-spectrum information of HI. By this way, the accuracy of the model is improved by 12.066 7% compared with SG filter. The algorithm expands one-dimensional SG convolution core into two-dimensional SG convolution core in four directions. Then the HI data can be quickly convoluted using convolution theorem and fast Fourier transform, so that the space-spectrum noise of HI can quickly filter. When the TSG filter core coefficient m=2 ~4, n=3 ~5, the SNR of the HI is increased by more than 10%, the PSNR is higher than 30 dB, and the SSIM is greater than 96%, which means TSG filter maintains the original HI characteristics well and improve the SNR significantly. After TSG filtering ( m=3, n=4) or SG filtering ( m=7, n=3), by comparing with the gray image and spectrogram of Pavia University HI, it can be seen that after TSG filtering, the band noise of the image is suppressed, the peak height of the characteristic peaks is increased by 31.68%, and the average intensity of the characteristic band is increased by 41.83%, while after SG filtering the band noise of the image is still clear and the relative peak height of the characteristic peak is up to 13.40%. The model of wheat HI recognition model based on TSG-PCA-SVM algorithm is constructed. The training set contains 500 sample points and the test set contains 4 500 sample points. The accuracy of this model is as high as 99.155 6% and the kappa coefficient is 0.983 613 while predicting the test set. The total accuracy predicting all 116 880 samples in the wheat HI data set is as high as 99.206 0%, which means the classification model has high accuracy and good consistency, and the classification accuracy is significantly improved compared with SG filtering that only reaches 87.088 9%. In conclusion, this paper provides a new idea for HI filtering and provides a reference for the construction of a hyperspectral identification system of wheat Hi dataset.

Keyword: Savitzky-Golay filter; Hyperspectrum image; Principal components analysis; Support vector machine; Recognition
引言

高光谱遥感技术能够提供目标区域丰富的光谱以及空间信息, 被广泛应用于农业、 军事、 地物目标勘测、 目标识别等等领域[1, 2]。 高光谱图像中的噪声分布复杂, 降噪滤波是制约高光谱图像分析精度的难题[3]。 高光谱图像噪声滤除的主要方法有直方图匹配、 矩匹配、 光谱微分、 Savitzky-Golay滤波等等方法, 其中SG滤波被广泛应用于高光谱数据降噪滤波[4]。 然而, 对受噪声污染严重的波段, 以上滤波算法所带来的信息丢失会导致图像失真更为严重。 如由小麦籽粒三维形态影响造成高光谱图像中部分像素点过亮或过暗, 即使在SG滤波后小麦籽粒赤霉病识别精度仍只有87.088 9%。

为了解决这一问题, 提出将一维的SG卷积核按水平、 竖直、 斜向下、 斜向上四个方向扩展成二维SG卷积核, 与待滤波高光谱空间维数据进行卷积的TSG滤波方法。 经过TSG滤波后的小麦籽粒赤霉病识别精度高达99.155 6%。 采用PaviaU高光谱图像结合图像信噪比、 峰值信噪比、 结构相似度获取最优的TSG滤波核参数区间; 对比SG和TSG滤波后灰度图像与光谱图, 研究SG和TSG滤波性能; 采用小麦籽粒高光谱图像开展TSG滤波算法应用研究, 构建了基于TSG-PCA-SVM算法的小麦赤霉病高光谱分类识别模型。

1 算法描述

基于最小二乘原理的SG滤波算法是一种多项式平滑算法。 首先确定一个固定大小(2m+1)的窗口, 将窗口内的所有数据作为一个集合, 各测量点x=[-m, 1-m, …, 0, 1, …, m], 采用多项式(1)来拟合它[5]

p(x)=k=0Nakxk(1)

计算拟合曲线与原始光谱的二乘残差, 设置二乘残差最小值作为边界条件[5], 求解可得最佳的系数矩阵为B=X(XTX)-1XT, 将系数矩阵与高光谱图像中每个样本点对应的光谱进行卷积, 即完成SG滤波。

如图1所示, 设置m=2, n=3计算得到一维SG卷积核, 可以看出一维卷积核系数是关于中心点对称的, 将它按水平、 竖直、 斜向上、 斜向下四个方向可组合成一个二维的卷积核。 对卷积核内的每个元素(x, y), 可以通过式(2)来描述

f(i, j)=Bi2+j24, ij(i+j)(i-j)=0i, j不同时为0B[0], i=0j=00, 其他(2)

图1 将一维SG卷积核按四个方向扩展成二维的卷积核Fig.1 Extending One-D SG convolution kernel into Two-D convolution kernel in four directions

其中 i2+j2表示不大于i2+j2的最大整数。通过二维快速傅里叶变换实现f(i,j)与各波段图像的卷积, 即完成TSG滤波。

2 实验部分
2.1 TSG滤波核参数优化方法

如式(1)及式(2)所示, SG/TSG滤波算法均存在窗口系数m、 阶数n两个核参数, 其大小直接影响滤波效果, 因此需对其进行优化选择。 采用通用的信噪比(SNR)、 峰值信噪比(PSNR)、 结构相似度(SSIM)三个指标[5]对SG/TSG滤波后高光谱图像进行评价, 利用枚举法依据上述三个评价指标进行核参数优化。

实验图像采用Pavia University高光谱图像, 该高光谱图像地面空间分辨率为1.3 m, 大小为610× 340像素, 共包含115个波段, 去除其中水吸收严重的12个波段[6], 如图2所示, 选取其中的一部分进行模拟实验, 大小为200× 200× 103。 在对图像滤波之前先对图像进行归一化, 归一化采用式(3)

ref=R(f-fmin)fref-fmin(3)

式(3)中, f为某一像元的DN值, fmin为高光谱图像暗噪声, 通常通过关闭镜头盖测得, fref为标准反射率板对应像元的DN值, R为标准反射率板的反射率, ref为该像元对应的反射率。

图2 Pavia University高光谱图像Fig.2 Pavia University hyperspectral image

设置SG滤波窗口系数m在3~15之间, TSG滤波窗口系数m在1~10之间, 阶数n均在2~6之间, 对归一化后的图像进行滤波, 求滤波后图像的SNR, PSNR和SSIM, 如图3所示为滤波后图像信噪比改善量、 峰值信噪比、 结构相似度等高线图(核参数满足n< 2m+1, 图中空白部分无值)。

图3 不同卷积核参数下TSG、 SG滤波算法性能比较
(a— c): SG滤波后信噪比改善量、 峰值信噪比、 结构相似度; (d— f): TSG滤波后信噪比改善量、 峰值信噪比、 结构相似度
Fig.3 The performance comparison of TSG and SG with different convolution kernel parameters
(a— c): SNR, PSNR, SSIM after SG filter; (d— f): SNR, PSNR, SSIM after TSG filter

信噪比作为图像噪声评价的关键指标, 其数值往往是图像滤波算法所必须的[7], 对比图3(a)和(d)可知TSG滤波后图像信噪比较原图提升了10%以上, 而SG滤波最高提升不到1%。 一般图像滤波或压缩过程中PSNR大于30 db, 为了尽可能多的提升图像信噪比, TSG滤波窗口系数m在2~4、 阶数n在3~5较为合适。 SG滤波窗口系数m与阶数n可选择区间范围相对较广, 一般针对不同数据须多次迭代对比才能找到最优的核参数区间。

2.2 TSG滤波与SG滤波性能对比

根据以上实验设置SG滤波核参数m=7和n=3, TSG滤波核参数m=3, n=4对归一化后高光谱图像分别进行SG和TSG滤波。 如图4所示分别为未滤波、 SG滤波后、 TSG滤波后高光谱图像中77波段处的灰度图。 可以看出原图中央存在明显的条带噪声, 经SG滤波后条带噪声依然清晰可见, 经过TSG滤波后条带得到了明显抑制。

对比原始图像及经两种算法滤波后高光谱图像中三个随机像素点的光谱曲线图如图5所示, 从原始光谱分布看, 三个随机点在70~90波段均存在两个特征反射峰1, 3和一个特征吸收峰2。 如图5(c)中Δ H1, Δ H2, Δ H3分别为三个特征峰的相对峰值高度, 经过SG滤波后(45, 45), (75, 75), (105, 105)点的这三个特征峰的相对峰值高度平均比原始图像降低了13.92%, 14.59%和13.40%, 特征趋于融合。 TSG滤波后图像光谱较原始图像平滑, (45, 45), (75, 75), (105, 105)点的这三个特征峰的相对峰值高度平均比原始图像提升了31.68%, 9.39%和7.01%; 同时(45, 45)点在70~90波段内的平均强度较原始光谱提升了41.83%。 上述结果表明TSG滤波在平滑原始光谱的同时, 可有效提升特征峰显著性, 并提升特征波段显著性。

图4 77波段处灰度图像
(a): 原始图像; (b): SG滤波后图像; (c): TSG滤波后图像
Fig.4 Gray image of 77 band
(a): Raw image; (b): Processed by SG filter; (c): Processed by TSG filter

图5 采用不同滤波算法后的光谱
(a): 原始光谱; (b): SG滤波后光谱; (c): TSG滤波后光谱
Fig.5 The spectrum after processed by different filtering algorithms
(a): Raw spectrum; (b): Processed by SG filter; (c): Processed by TSG filter

2.3 TSG滤波应用

SG滤波常被作为高光谱图像预处理的一个关键环节[8], TSG滤波具备许多优于SG滤波的特性, 构建TSG-PCA-SVM分类识别模型, 开展TSG滤波算法应用研究。 采用如图6所示的高光谱成像系统采集小麦籽粒高光谱数据, 系统主要包括①成像高光谱仪、 ②光源、 ③标准反射率板、 ④样品台、 ⑤电控位移平台、 ⑥分析计算软件等部分。 其中成像高光谱仪为自主开发设备, 主要参数如下: 成像波谱范围为375~910 nm, 光谱分辨率2.3 nm, 共540个波段, 线视场含960个像素, 镜头焦距为35 mm, 光源为21 V/150 W溴钨灯。 将待测样本均匀平铺在白色背景板上并放置在位移平台中部, 转动下方的电动位移平台, 转速控制在0.6 m· min-1, 镜头与样本距离为300 mm, CCD 积分时间为16 ms。

图6 高光谱图像采集系统Fig.6 The acquisition system of hyperspectral image

小麦籽粒样本由安徽省农业科学院及合肥物质研究院太和试验站提供。 使用图6中的采集系统, 连续采集小麦赤霉病染病率为0%和100%的小麦籽粒的高光谱图像如图7(a, e)所示。 其中染病/健康小麦高光谱影像大小均为470× 280像素, 均包含540个波段。

图7 小麦籽粒高光谱图像掩膜与分类结果可视化
(a— d): 健康小麦高光谱图像、 掩膜图像、 SG滤波后分类结果、 TSG滤波后分类结果; (e— h): 染病小麦高光谱图像、 掩膜图像、 SG滤波后分类结果、 TSG滤波后分类结果
Fig.7 The visualization of classification results and mask of wheat hyperspectral image
(a— d): The hyperspectral image, mask imgae, classification results after SG/TSG filter of health wheat; (e— h): The hyperspectral image, mask imgae, classification results after SG/TSG filter of infected wheat

对比标准反射率板数据, 利用式(3)对小麦籽粒高光谱图像进行归一化并黑白掩膜标定如图7(b, f)所示。 标定后图像中一共包含了116 880个样本点, 其中健康小麦籽粒样本点70 007个, 染病小麦籽粒样本点46 873个。 分别对归一化后的图像进行SG、 TSG滤波, 然后采用PCA算法保留包含信息量最多的前六个主成分, 运用SVM构建分类识别模型。 SVM模型以高斯径向基核函数(RBF)作为核函数, 训练采用十折交叉验证的方法评估, 核参数优化采用网络交叉验证法。 随机选取高光谱图像中500个样本点作为训练集, 4 500个作为测试集, 其中染病与健康样本点各占一半。 在前面所得到的核参数优化区间内采用枚举法多次实验选取最优TSG(m=3, n=4), SG(m=6, n=3)核参数对高光谱图像滤波, 滤波后预测模型测试集平均分类精度、 测试集卡帕系数[9]、 所有样本点的总体分类精度如表1所示, 图像预测结果如图7(c, d, g, h)所示。

表1 采用不同滤波算法后图像分类性能 Table 1 Image classification performance after processed by different filtering algorithms

表1可以看出, 对于小麦籽粒数据集, 采用SG滤波算法后预测模型平均分类精度只有87.088 9%, 比未经滤波时提高了1.155 6%。 而采用本文提出的TSG滤波算法对小麦高光谱图像滤波后, 相同预测模型下分类精度高达99.155 6%, 模型分类精度提高了13.222 3%。 从图7可以看出, 经SG滤波后的图像预测结果中, 会有一些分散的样本点(分散在小麦籽粒的边缘或中心)被错误分类, 这些样本点中大部分都是受小麦籽粒三维形态影响而过亮或者过暗的异常点, TSG滤波能够根据像素点周围点的信息增强其光谱特征, 如图5中经TSG滤波后(45, 45)点的光谱特征就得到了显著增强, 从而提高这些点的分类精度。

3 结论

采用Pavia University、 小麦赤霉病高光谱数据, 针对所提出的TSG滤波算法开展了滤波性能评价与应用研究。 主要结论如下:

(1)结合滤波后图像的信噪比、 峰值信噪比、 结构相似度得到TSG滤波的优选窗口系数m在2~4、 阶数n在3~5之间。

(2)TSG滤波(m=3, n=4)后图像信噪比提升了10%以上、 峰值信噪比大于30 db, 三个随机点中70~90波段光谱相对峰值高度最高提升31.68%, 平均强度提升41.83%。 实验结果表明相较于SG滤波, TSG滤波能够有效抑制条带噪声、 增强光谱特征峰, 且能增强光谱特征波段。

(3)TSG滤波(m=3, n=4)后基于PCA-SVM算法的小麦赤霉病识别模型分类精度高达99.155 6%, 卡帕系数0.983 613, 模型分类精度比采用SG滤波提升了12.0667%, 为小麦赤霉病高光谱识别系统建立提供了参考和依据。

致谢:感谢安徽省农业科学院汪建来研究员以及中国科学院合肥物质研究院太和试验站提供的小麦籽粒样本; 感谢杭州大江东空间信息研究院潘明忠副研究员对于实验所用高光谱硬件设备的技术支持与指导; 感谢刘爽师兄在生活及实验中的帮助。

参考文献
[1] Zhang Yuxiang, Du Bo, Zhang Liangpei. IEEE Transactions on Geoscience and Remote Sensing, 2015, 53(3): 1346. [本文引用:1]
[2] Du Bo, Zhang Yuxiang, Zhang Liangpei, et al. IEEE Transactions on Image Procession, 2016, 25(11): 5345. [本文引用:1]
[3] Luo G, Chen G, Tian L, et al. Canadian Journal of Remote Sensing, 2016, 42(2): 106. [本文引用:1]
[4] ZHANG Yi-zhou, XU Ting-fa, LIU Zi-wei, et al(张一舟, 许廷发, 刘子伟, ). Chinese Optics(中国光学), 2015, 8(1): 51. [本文引用:1]
[5] Yang J X, Zhao Y Q, Yi C, et al. Remote Sensing, 2017, 9(4): 305. [本文引用:3]
[6] Fang Leyuan, Li Shutao, Duan Wuhui, et al. IEEE Transactions on Geoscience and Remote Sensing, 2015, 12: 6663. [本文引用:1]
[7] Li C, Ma Y, Mei X G, et al. Remote Sensing, 2017, 9(11): 1166. [本文引用:1]
[8] Jiang C H, Zhang Q Y, Fan R, et al. Scientific Reprots, 2018, 8(1): 8799. [本文引用:1]
[9] Yang G Y, Wang Q Y, Liu C, et al. Spectrochimica Acta Part A: Molecular and Biomolecalar Spectroscopy, 2018, 200: 186. [本文引用:1]