作者简介: 郭峰, 1996年生, 中北大学信息与通信工程学院硕士研究生 e-mail: 1679825469@qq.com
高光谱成像凭借高的光谱分辨率、 图谱合一、 波段多的特点, 能够为待分类目标提供多维的参考信息, 从而提高分类精度。 爆炸破片的识别回收能够为爆炸威力的评估和防爆措施的设计提供参考。 针对当前破片检测中多采用可见光波段或红外波段等单个波段进行检测, 忽略了破片目标与背景对不同波长的光有着不同的吸收程度, 没有将多波段破片特征充分利用, 为此结合高光谱检测手段, 提出了一种空间分割结合光谱信息的爆炸破片识别方法。 在实验室环境下, 首先采集铁质破片、 石头、 树叶的高光谱图像, 对采集的样本图像数据做预处理, 包括去噪声以及黑白校正反演反射率信息等, 感兴趣区域随机提取三类样本像素点共750个, 随机选取600个点作为训练集其余作为测试集, 通过训练后得到预测准确度分别为88%、 88%、 94%的决策树模型。 其次模拟了铁质破片散落在含有石头树叶的沙土中的场景并采集其高光谱数据, 通过前后级联的空谱融合方法, 在空域经过图像增强和去噪等预处理之后, 采用边缘检测结合区域生长以及形态学处理的方法对空间图像进行分割, 得到沙土上有形态的目标, 空间分割的交并比(IOU)达到93.5%, 真阳率(TPR)达到97.4%; 然后结合光谱域训练得到的决策树模型, 对各个分割区域的每个像素点进行谱域的类型识别, 参与分类的三类像素点个数分别为146 172、 50 484、 213 438, 识别准确度分别为87%、 86%、 96%; 最后将分类结果可视化, 以每个区域像素点最多的一类代表该区域类别, 将目标破片与石子和树叶两种背景进行了准确的识别, 以标定后的分割图像为标准, 三类像素点个数分别为155 502、 52 045、 217 794, 识别率分别为94%、 97%、 98%。 分析结果表明空间分割结合光谱信息的识别方法能够有效利用空间和高光谱的特征信息对铁质破片目标进行准确识别。 同时验证了使用高光谱成像进行空谱联合识别爆炸破片的科学性以及可行性, 对未来采用智能化识别破片的方式评估破片战斗部威力具有一定的实用意义。
Hyperspectral imaging can provide multi-dimensional reference information for the target to be classified by its high spectral resolution, spectrum integration and multiple bands, thus improving the classification accuracy. The identification and recovery of explosive fragments can provide a reference for evaluating explosive power and designing explosion-proof measures. Because of the current fragment detection, single bands such as visible light band or infrared band are mostly used for detection, ignoring that the fragment target and background have different degrees of absorption of light of different wavelengths and do not make full use of the characteristics of multi-band fragments. Therefore, this paper combines hyperspectral detection means and proposes a method of explosive fragment recognition based on spatial segmentation and spectral information. In the laboratory environment, first collect the hyperspectral images of iron fragments, rocks and leaves, and preprocess the collected sample image data, including noise removal and black and white correction to retrieve the reflectivity information. Randomly extract 750 sample pixels of three types from the region of interest, and randomly select 600 points as the rest of the training set as the test set. After training, a decision tree model with a prediction accuracy of 88%, 88% and 94% is obtained. Secondly, the scene of iron fragments scattered in the sand with stone leaves is simulated, and its hyperspectral data is collected. Through the cascade space spectrum fusion method, after image enhancement and denoising in the spatial domain, the spatial image is segmented using edge detection combined with region growth and morphological processing methods to obtain the morphological targets on the sand. The intersection and union ratio (IOU) of spatial segmentation reaches 93.5%, and the true positive rate (TPR) reached 97.4%; Then, combined with the decision tree model trained in the spectral domain, each pixel point in each segmentation area is identified in the spectral domain. The number three types of pixel points involved in classification are 146 172, 50 484, 213 438, and the recognition accuracy is 87%, 86%, 96% respectively; Finally, the classification results are visualized. The category with the largest number of pixels in each region represents the category of the region. The target fragments and the two backgrounds of stones and leaves are accurately recognized. With the calibrated segmented image as the standard, the number of pixels in the three categories is 155 502, 52 045, 217 794, and the recognition rate is 94%, 97%, and 98% respectively. The analysis results show that the recognition method of spatial segmentation combined with spectral information can effectively use spatial and hyperspectral feature information to identify iron fragment targets accurately. At the same time, it also verified the scientificity and feasibility of using hyperspectral imaging to conduct space spectrum joint identification of explosive fragments, which has a certain practical significance for the future assessment of fragment warhead power using intelligent fragment identification.
无论是对战斗部爆炸威力进行评价[1]还是计算民间反恐防暴时震爆弹的安全半径[2], 都需分析爆炸破片的散布情况并对破片进行识别回收。 当破片散落在沙土、 石子以及落叶等背景时显著性极其差, 一般的相机无法准确识别出背景中的破片, 而且以人工识别为代表的传统破片识别方法效率低且易受人为主观影响。 因此需要探索出一种高效准确的分类识别技术, 从而更好区分破片与其存在的背景。
高光谱成像技术是近十几年发展起来的集探测器件、 精密光学器械、 微弱信号检测、 计算机及信息处理等技术于一体的综合性影像技术[3]。 近年来, 学者利用高光谱成像进行了垃圾分类、 药品产地识别[4]、 迷彩伪装识别[5]、 疾病诊断和手术指导[6]等研究, 将光谱识别方法应用到农业、 医学、 军事、 民生等领域。
针对破片和背景的材质差异、 分子结构不同, 对不同波长的光的吸收特性不同, 本文提出了空间分割结合光谱信息的空谱联合检测方法, 采集了铁质破片与背景的高光谱图像和模拟破片散布的高光谱图像, 在谱域通过特征选择降低维度、 决策树建立破片与背景的识别模型; 在空间域通过边缘检测结合区域生长以及形态学处理的方法对空间图像进行分割, 得到沙土上有形态的目标; 然后采用前后级联的空谱联合方法在空间分割的基础上采用训练好的决策树模型对破片与背景逐像素点进行识别。 实验结果表明, 在实验室环境下采用高光谱的检测手段能够将铁质破片与背景分类识别, 验证了高光谱成像在破片识别领域的可行性。
实验选用美国Headwall公司产的Hyperspec VNIR-A型号高光谱成像光谱仪。 成像系统由1 600× 2 500高分辨率CCD镜头、 全反射式光栅、 狭缝及镜头组成。 本实验通过以2.5 nm(平均间隔)波段间隔, 对实验样品在380~1 000 nm共234个波段进行光谱成像。 光谱仪具体参数如表1所示。
![]() | 表1 高光谱成像相机参数 Table 1 Hyperspectral imaging camera parameters |
高光谱成像系统如图1(a, b, c)所示, 实验样本图像的采集在暗室中进行, 系统光源为卤素灯模拟的太阳光, 通过光源控制调节系统光源亮度并稳压, 避免图像过饱和; 设置相机积分时间和凝视时间防止图像发生畸变; 调节镜头焦距, 使待测目标成像清晰; 测量待测样本和相机狭缝的距离, 并计算设置移动载物平台的推扫速度, 使采集到的样本图像清晰且不失帧, 保证样本光谱信息和空间信息的完整性。
(1)模拟破片散布
以铁质破片为研究对象, 选取从爆炸场收集的铁质破片两枚、 石子两个、 树叶一片放在载有沙土的沙盘上。 采集其高光谱图像, 得到模拟的空间图像及其光谱数据, 空间图形如图2所示。
(2)建立破片识别模型数据库
根据模拟破片散布场的特点, 由于沙土与破片、 石子、 树叶, 相对无规则且复杂, 将其视为第一背景, 通过空间分割将其去除。 然后对沙土上的目标用谱域信息进行分类识别, 因此需要建立包含石子和树叶的破片识别数据库。 另取铁质破片、 石头、 树叶若干样本, 采集它们的高光谱图像, 感兴趣区域提取像素点作为样本库, 为了使提取的样本点具有代表性, 采集数据时要进行样本多角度采集, 选取样本点也要广泛全面。 图3(a, b, c)为采集的破片及其背景样本图例。
1.3.1 图像数据预处理
为了消除相机暗电流和光线带来的图像噪声, 需要对采集的高光谱图像进行黑白校正。 分别采集反射率为99.9%的白板得到白板标定图像Rwhite和盖上相机盖后的全暗参考图像Rdark, 然后对采集的原始图像Rraw, 采用校正公式(1)处理得到校正图像Rnorm, 用于后续分析。
${{R}_{\text{norm}}}=\frac{{{R}_{\text{raw}}}\ \ \ -\ \ \ {{R}_{\text{dark}}}}{{{R}_{\text{white}}}\ \ \ -\ \ \ {{R}_{\text{dark}}}}\ \ \ $(1)
同时为了更加清楚直观地了解空间图形特征, 对模拟破片散布的空域图像进行去噪和增强等预处理, 方便后期的区域分割提取。
1.3.2 破片识别模型
(1) ReliefF特征选择
由于实验样本比较少, 光谱维度较高, 为避免信息冗余和出现过拟合, 采用有监督的特征选择方法ReliefF对样本数据进行降维, 经过训练选择对分类识别任务权重高的的波段来代替原始高维数据, 去除冗余。
经过改进的ReliefF算法主要处理多分类问题。 通过每次从训练样本集中随机取出一个样本R, 然后从与R同类的样本集中找出R的k个近邻样本(near Hits), 从每个R的不同类的样本集中寻找出k个近邻样本(near Misses), 然后更新每个特征的权重[7]。 计算公式如式(2)所示
$\begin{array}{*{35}{l}} \text{W}\left( \text{A} \right)=\text{W}\left( \text{A} \right)-\overset{k}{\mathop{\underset{j-1}{\mathop \sum }\,}}\,\text{diff}\left( A,R,{{H}_{j}} \right)/\left( mk \right)+ \\ \underset{C\ne \text{class}\left( R \right)}{\mathop \sum }\,\left\{ \frac{p\left( C \right)}{1-p\left[ \text{Class}\left( R \right) \right]}\overset{k}{\mathop{\underset{j-1}{\mathop \sum }\,}}\,\text{diff}\left[ A,R,{{M}_{j}}\left( C \right) \right] \right\}/\left( mk \right) \\ \end{array}$(2)
式(2)中, m为设定的迭代次数, class(R)为样本R所述类别, p(C)为类别C的先验概率, p[Class(R)]为样本R所属类别的先验概率, Mj(C)为C中的第j个最近邻样本, diff(A, R1, R2)为样本R1和样本R2在特征上A的差, 其计算公式如式(3)所示
经过训练集样本的训练, 输出每个波段在分类中所占权重, 权重越高表示该波段分类能力越强, 作为特征波段输出。 在分类任务中根据每增加一个特征, 训练样本需要增加10的原则, 设置样本的抽样次数为100, 设定输出特征波段的权重阈值, 最近邻样本个数设为4个; 从234个波段中输出63个特征子集, 在63个波段下铁质破片、 石子和树叶的参考光谱图分别为如图4(a, b, c)所示。
![]() | 图4 (a)、 (b) 和(c) 分别为破片、 石子和树叶的参考光谱Fig.4 (a), (b) and (c) are the reference spectra of fragments, stones and leaves |
从图4可知, 铁质破片、 石子、 树叶在这63个波段中均存在不同位置的波峰(波谷), 且波形趋势与反射率明显不同, 表明特征选择提取的63个特征波段可以代表原始样本用于分类。
(2)决策树分类模型
决策树作为一种有监督的机器学习方法, 能够有效处理光谱反射率的二分类或多分类问题。 利用信息论中的信息增益寻找样本集中具有最大信息量的波段, 将其作为决策树的一个结点, 再根据该波段的不同取值建立树的分支, 再在每个分支子集中重复建立下层结点和分支, 从而完成分类任务[8]。 其中决策树的每一个节点代表的是对其中某个特征的测试, 分支则代表这个特征的测试结果, 决策树的每一个叶子节点代表了一类样本。
构造决策树的具体过程[9]: 首先寻找初始分裂, 整个训练集作为产生决策树的集合, 训练集每个样本必须是带有标签的, 以此来决定哪个属性能够做出最准确的判断, 做法是对所有属性域的分裂指标做出量化, 计算每个分裂的多样性指标来求出最好的一个分裂, 然后, 重复上述步骤, 直至每个叶节点的判断结果都属于同一类且增长到一棵完整的树。 然后从树的底层开始向根节点计算, 判断是否需要剪枝, 通过剪枝操作后得到一个泛化能力更强的决策树, 用于分类任务。
将经过去噪声、 黑白校正、 反演光谱反射率信息等预处理后的样本高光谱数据, 感兴趣区域随机提取铁质破片样本点250个, 石子样本点250个, 树叶样本点250个, 三类样本像素点共750个样本点, 随机选取600个点作为训练集其余作为测试集, 通过训练后得到破片、 石子、 树叶的预测准确度分别为88%、 88%、 94%, 平均预测准确度为90%的决策树分类模型。
1.3.3 空间分割
为了简化识别模型、 提高识别精度、 美化识别结果, 采用边缘检测结合区域生长的方法进行空间分割。 具体为通过Sobel边缘检测得到的边缘来限制区域生长, 从而提取到破片散布场中相对有规则、 有形状的目标。
(1) Sobel边缘检测
Sobel算子是一种用于边缘检测蹬离散微分算子, 其结合了高斯平滑和微分求导, 通过计算破片散布图像中明暗程度近似值, 根据图像边缘旁边明暗程度把该区域内超过某个数的特定点记为边缘。 对于噪声较夺, 灰度渐变的高光谱空域图像, Sobel算子的边缘定位更准确。 其算法模板[10]如式(4)所示, 其中dx表示水平方向, dy表示垂直方向。
(2) 区域生长
将在破片散布场中, 破片、 树叶、 石子各自区域内像素集像素相似。 对每个需要分割的目标区域设定一个或者多个种子像素作为生长的起点, 就可以将种子像素周围邻域中与种子像素具有相同或相似性质的像素合并到种子像素所在的区域中, 将这些新像素当做新的种子像素继续进行上面的过程, 直到再没有满足条件的像素可被包括进来。 这样就可以将破片散布场中的待分割目标区域提取出来。
1.3.4 空谱联合
针对破片高光谱图像特点, 在前期研究的基础上, 采用前后级联空谱融合方法。 在空域分割信息基础上, 对各分割区域进行谱域的类型识别, 以获得准确的目标和背景信息。 具体流程如图5所示。
将高光谱相机采集的模拟破片散落在背景中的空间图像经过增强、 去噪等预处理后, 采用边缘检测结合区域生长的前后级联空谱联合法进行空间分割, 然后对分割的结果进行形态学处理后得到空域分割结果图。 其中灰度值255代表了提取到的待分类目标。 采用matlab里自带的image labeler对空间原始图进行逐像素标记生成标定图像, 用于评价该空间分割算法的分割效果, 主要结果如图6所示。
从图6(a)到图6(c)呈现了分割的过程, 经过图像增强的图像(a)中的待分割样本轮廓更加清晰, 经过边缘检测后在边缘检测的基础上进行区域生长得到图6(b), 在图6(b)中存在过分割和欠分割问题, 通过形态学处理补充区域内的欠分割和减少过分割得到最终分割图6(c)。 图6(d)展现了手动标定的结果, 用于和算法分割图像(c)进行对比评价。
采用交并比(IOU)和真阳率(TPR)两种指标对空间分割结果进行评价, 计算公式如式(5)
$\text{IOU}=\frac{TP}{FN+TP+FP}~\text{TPR}=\frac{TP}{TP+FN}$(5)
式(5)中, TP为分割结果和标定结果的交集, FN为欠分割部分, FP为过分割部分。 对空域分割评价如表2。
![]() | 表2 空域分割评价表 Table 2 Airspace segmentation evaluation table |
交并比(IOU)是算法分割和标定结果的交叠率, 即它们的交集与并集的比值, 比值越高说明分割效果越好, 当IOU为1的时为完全分割。 真阳率(TPR)代表了分割结果与标定结果的交集与标定结果的比值, 即在标定结果上实际分割了多少, 当TPR为1时也代表完全分割。 本次实验结果0.935的IOU和0.974的TPR均大于0.9, 表明该算法取得了很好的分割效果。
在空间分割的二值图上, 设计相关算法读取目标区域每一个像素的光谱信息, 然后输入到训练好的决策树模型判断得到该点的类别, 对不同类别的像素点赋予不同的颜色, 将分类结果可视化得到图7(a)。 然后设计了区域数目最大点代表该区域类别算法, 通过计数比较后赋值得到空谱联合最终识别结果见图7(b)。
![]() | 图7 空谱联合结果图 (a): 分类结果图; (b): 最终识别结果图Fig.7 Combined result of empty spectrum (a): Classification result; (b): Final recognition result |
在图7(a)中, 黄色代表石子的像素点、 银白色代表铁质破片、 绿色代表树叶。 对谱域破片分类识别图和前后级联空谱联合图进行像素点计数分析。 对于决策树分类模型的预测准确度, 采用算法分割图像和标定图像交集评价谱域的识别准确度, 避免过分割引起的误差, 分类结果评价如表3。 对空谱联合的识别结果与标定图像的交集作为最终识别率进行评价即真阳率(TPR), 空谱联合最终识别结果评价如表4所示。
![]() | 表3 光谱分类结果统计表 Table 3 Statistics of spectral classification results |
![]() | 表4 空谱联合识别结果统计表 Table 4 Statistical table of joint identification results of space spectrum |
从空间分割的评价结果来看, 边缘检测结合区域生长的空间分割效果很好, 达到了预期效果, 可以将模拟破片散布场中的有形态目标分割出来, IOU和TPR均在90%以上, 但存在不足, 内部的边缘影响到区域生长, 从而影响到分割精度, 后续研究需弥补此不足。
上述对谱域识别的统计结果表明, 标定图像中三类样本原本点数分别为155 502、 52 045、 217 794, 识别到的点数分别为146 172、 50 484、 213 438, 基于前后级联方法的空谱联合识别方法以先聚类后识别的方法将识别率提高到94%、 97%、 98%。 基于决策树识别分类模型训练得到的预测准确度分别为88%、 88%、 94%, 满足设计的空谱联合分类算法识别的要求, 并且成功地将模拟破片散布场中的目标分类表示, 测试样本点的分类准确度分别为87%、 86%、 96%。 影响分类准确度的因素主要是提取的样本点太少, 以至于分类识别模型准确度比较低, 另一方面是石子与铁质破片的光谱反射率特征曲线有一定相似性, 这一点在表3和表4中铁质破片与石头的相互误判比较高体现出来。
采集了铁质破片和常见背景的全波段高光谱数据, 感兴趣区域提取样本点, 建立本实验的样本点库; 对样本库中的样本点的234个波段进行特征选择提取到能够代表原始样本数据进行分类的63个波段作为特征空间; 构建了决策树并训练了样本库中750个样本点得到平均预测准确度90%的分类识别模型; 采集了模拟破片散落在沙土、 树叶、 石头三种背景的高光谱图像; 对模拟的空间图形采用边缘检测结合区域生长以及形态学处理的方法进行分割, IOU和TPR均在90%以上; 设计了前后级联空谱联合算法在空间分割的基础上结合决策树分类模型对模拟图像的每个像素分类识别, 成功识别出破片与存在的不同背景, 并且最终平均识别率达到96.3%; 将分割图像与标定图像交集的像素点作为测试集测试了训练的决策树模型, 测试得到模型平均预测准确度为89.7%。
采用高光谱相机对模拟破片散落在背景中行成像, 采用空谱联合的方法对散布场中目标分类识别的可行性, 对战场破片散布识别提供了实验方法和理论依据。 后续工作将增加破片与背景的种类, 研究深度学习的算法来提高分类准确度并完成多分类任务。
[1] |
|
[2] |
|
[3] |
|
[4] |
|
[5] |
|
[6] |
|
[7] |
|
[8] |
|
[9] |
|
[10] |
|