作者简介: 张怡婷, 女, 2000年生, 铀资源探采与核遥感全国重点实验室, 核工业北京地质研究院硕士研究生 e-mail: bwfyzwy224@126.com
无人机搭载高光谱传感器获取的遥感影像具有光谱信息丰富、 空间分辨率高的优势, 可为城镇不透水面提取提供更有效的数据。 然而, 高光谱影像包含大量波段, 存在信息冗余, 会增加模型训练的复杂度, 随着数据维度增加, 数据空间体积呈指数级增长, 有限样本量在高维空间中会稀疏分布, 易导致模型过拟合。 此外, 传统提取方法特征学习能力有限, 处理高维数据效果不佳, 且未能关注不透水面具体材质信息。 为更有效利用无人机高光谱数据获取城镇不透水面信息, 评估城镇建设发展情况, 选择河北省张家口市怀来县东花园镇为研究区域, 从机载高光谱遥感数据中获取了150个有效波段。 在此基础上, 运用逐步判别分析法选择适用于城镇不透水面提取的高光谱特征波段, 并使用波段标准差、 波段间相关性和主成分分析的方法进行验证和综合分析, 最终确定了14个具有代表性的波段。 随后, 提出了一种基于卷积神经网络的遥感不透水面提取方法。 通过改进AlexNet网络架构, 构建了一个包含四个卷积层、 一个池化层和两个全连接层的深度学习网络模型。 最后, 在研究区设计了两组对比实验, 分别比较高光谱原始影像与选取特征波段的不透水面信息提取精度, 以及提出的网络模型与常见不透水面提取方法的信息提取精度。 结果表明, 所选的特征波段组合能够作为不透水面提取的最佳波段组合, 显著提升了各类方法的提取精度。 同时, 提出的网络模型为不透水面提取的最优方法, 结合最佳波段组合, 最终分类的总体精度和Kappa系数分别达到了99.07%和0.988 3, 表现优异。 该研究成果对于城镇建设的可持续发展和生态环境保护具有重要意义, 可为相关领域的研究提供有力支持。
Remote sensing images acquired by UAV-mounted hyperspectral sensors have the advantages of rich spectral information and high spatial resolution, which can provide more effective data for extracting impervious surfaces in towns and cities. However, hyperspectral images contain many bands, information redundancy increases the complexity of model training, and the volume of data space grows exponentially with data dimensions. The limited sample size will be sparsely distributed in high-dimensional space, easily leading to model overfitting. In addition, the traditional extraction method has limited feature learning capability, is ineffective in dealing with high-dimensional data, and fails to focus on the specific material information of the impervious surface. To make more effective use of UAV hyperspectral data to obtain information on impervious surfaces in towns and assess the development of town construction, this study selects Donghuayuan Town, Huailai County, Zhangjiakou City, Hebei Province, as the study area and acquires 150 effective bands from airborne hyperspectral remote sensing data. On this basis, the hyperspectral feature bands applicable to extracting impervious surfaces in towns were selected using stepwise discriminant analysis, validated, and comprehensively analyzed using principal component analysis, band standard deviation, and inter-band correlation, and 14 representative bands were finally identified. Subsequently, a remote sensing impervious surface extraction method based on a convolutional neural network was proposed. By improving the AlexNet network architecture, a deep learning network model containing four convolutional layers, one pooling layer, and two fully connected layers was constructed. Finally, two sets of comparison experiments were designed in the study area to compare the information extraction accuracy of impervious surfaces in hyperspectral raw images with selected feature bands and the information extraction accuracy of the proposed network model with common impervious surface extraction methods, respectively. The experimental results show that the selected combination of feature bands can be used as the best combination of bands for impervious surface extraction, which significantly improves the extraction accuracy of various methods. Meanwhile, the network model proposed in this study is the optimal method for impervious surface extraction, and combined with the optimal band combination, the overall accuracy and Kappa coefficient of the final classification reach 99.07% and 0.988 3, respectively, showing excellent performance. The research results in this paper are of great significance for the sustainable development of town construction and ecological and environmental protection and can provide strong support for research in related fields.
不透水面是由瓦片、 沥青、 水泥混凝土等材料覆盖的表面, 如屋顶、 道路和广场等[1]。 随着城镇化建设推进, 土地利用和覆盖类型发生巨大变化。 不透水面是评估城镇化发展的关键指标, 同时其材质信息有助于有效管理水资源、 环境保护、 城市规划、 防洪防灾和生态系统维护。 因此, 获取准确的不透水面信息对于制定建设规划和可持续发展战略至关重要。
遥感技术因其空间覆盖范围广和高时间分辨率, 在不透水面提取中应用广泛。 早期研究多用中分辨率多光谱卫星数据如TM[2, 3]和ETM+[4]。 近年来, 高分辨率多光谱卫星影像如高分一号、 高景一号、 Quickbird等被广泛应用, 但这些影像的光谱分辨率较低, 难以区分不同地物。 相比之下, 高光谱遥感具有高光谱分辨率, 可更好地反映地物特性并进行精细分类[5]。 此外, 卫星平台上的高光谱传感器空间分辨率较低, 易导致分类结果精度低。 因此, 同时拥有高空间分辨率和高光谱分辨率的无人机高光谱遥感影像成为理想的数据源。 已有研究表明, 无人机高光谱图像在地物分类中取得了良好效果[6, 7]。
不透水面提取方法主要包括光谱混合分析法、 指数计算法、 机器学习法和深度学习法。 光谱混合分析法利用混合像元和纯像元的光谱特性, 计算混合像元中各类地物的面积比以解决混合像元问题[8, 9], 但在复杂场景中适用性有限且计算量大。 指数计算法利用遥感图像中的光谱指数, 对不透水表面的信息进行增强与提取。 常见的指数有ISA指数[10]、 NDISI指数[11]、 MNDISI指数[12]、 UCI指数[13]等, 简单高效, 但对复杂地物识别能力有限[1]。 使用机器学习提取不透水面主要有决策树[14, 15, 16]、 支持向量机[17, 18, 19]和随机森林[20, 21]等方法, 这些模型适应不同类型的遥感影像和地理环境, 具有良好的泛化能力, 得到广泛应用。 随着深度学习的发展, 研究者们开始使用深度学习网络进行不透水面提取。 孙根云等[22]提出了一个大尺度高分辨率不透水面提取方法提取越南不透水面。 Fu等[23]使用卷积神经网络对透水面与不透水面进行语义分割提取。 Huang等[24]和Parekh等[25]使用深度学习网络在复杂城市地区提取了建筑和道路。 Zheng等[26]使用卷积神经网络提取了成都地区的不透水面、 裸土、 植被、 水域四种类型面积区域。 深度学习由于其出色的特征学习能力, 能够出色的完成不透水面的提取任务。
尽管已有多种不透水面提取方法, 但相关研究数据源主要为多光谱。 维度高的高光谱数据, 会增加模型训练的复杂度和计算量, 当样本数量有限时, 数据在高维空间中稀疏分布, 易导致维数灾难[27]。 此外, 前人研究中很少关注不透水面的材质信息。 因此, 本工作利用无人机高光谱遥感数据, 通过波段分析, 从150个波段中确定适用于区分城镇不透水面的特征波段组合。 随后, 通过改进AlexNet, 提出一个卷积神经网络模型, 提取各类材质的不透水面, 同时改善无人机影像产生的阴影带来的错分误分, 提高提取精度。
研究区位于河北省张家口市怀来县东花园镇, 东西宽约200 m, 南北长约250 m。 根据研究区大小设计无人机飞行轨迹如图1所示。 该区地处中温带半干旱地区, 四季分明, 光照充足, 雨热同期, 属于温带大陆性季风气候, 年均日照时数3 027 h, 平均气温9.1 ℃, 年均降水396 mm, 昼夜温差大。 实地考察表明该区域包含城镇不透水面的基本类型, 具有典型性。
采用M600无人机搭载pikaL高光谱传感器采集研究区影像数据, 光谱分辨率为2.7 nm, 空间分辨率为0.1 m, 像元尺寸为5.86 μ m。 为减少阴影对分类结果的影响, 选择光线良好的时段进行航拍。 对影像数据进行波段选择, 剔除受水汽和二氧化碳影响严重、 噪声多、 质量差的波段, 最终保留150个有效波段(394~1 032 nm)。 之后进行大气校正和影像拼接, 并去除畸变严重区域, 得到影像如图2所示。 结合影像进行目视解译, 发现不透水表面主要包括三类材质: 混凝土(包括道路、 停车场、 高层建筑)、 金属面(蓝色屋顶)、 瓦片(红色屋顶), 透水面主要包括两类裸土、 植被(作物、 灌木和树木)。 相关地物类型如表1。 典型不透水地面和透水面的光谱特征如下: 混凝土表面反射率较高, 光谱曲线在可见光波段较为平坦, 但在近红外波段有明显反射率变化; 金属屋顶在可见光波段有特定的吸收特征, 反射率较低, 但在近红外波段反射率较高; 瓦片屋顶在红光波段有较高的反射率, 而在其他可见光波段反射率较低; 植被在近红外波段反射率显著高于可见光波段, 具有典型的“ 红边” 特征; 土壤光谱特征较为复杂, 但通常在可见光和近红外波段有较高的反射率, 与植被有明显区别, 这些光谱特征的差异为后续的分类提供了依据。
![]() | 表1 城镇典型地物类型 Table 1 Typical land cover types of towns |
为了降低模型处理负担并消除因波段间高度相关性引起的数据冗余, 需要对无人机高光谱数据中的150个波段进行筛选, 选出最适合提取城镇不透水面的特征波段。 波段选择应符合以下要求: (1) 所选波段具有较大的信息量; (2) 所选波段之间的相关性应尽可能低; (3) 波段对不同地物类别有明显的光谱差异。 基于这些原则, 采用逐步判别分析法进行波段选择, 同时使用波段标准差分析、 波段间相关性和主成分分析综合分析判断。
2.1.1 逐步判别分析法
逐步判别分析是一种动态调节变量的方法, 用于选择高光谱影像中最具判别能力的特征波段。 该方法初始状态下不包含任何变量, 逐步引入具有最强判别能力的变量, 同时剔除那些因引入新变量而判别能力下降的旧变量[8]。 通过对判别式的统计检验, 当没有符合标准的变量可引入时, 判别过程终止, 最终的判别函数仅包含少量但判别能力强的变量。 逐步判别分析使用Wilk's Lambda来度量引入或剔除变量的标准, 用Λ 表示。 Wilk's Lambda的取值范围在0到1之间, 数值越小代表变量对判别模型的贡献越大。 因此, 在每一步中, 选择Λ 值最小的变量加入模型。 逐步判别分析的整体过程如图3所示。
在使用逐步判别分析法选择波段前, 首先需要确定不同地物类别在所有波段中的反射率。 选定了城镇遥感影像中的五种常见地物类型, 包括不透水面的混凝土、 金属材质屋顶、 瓦片屋顶, 以及透水面的植被和裸土。 根据实地调研信息和地理坐标, 在遥感影像中为五类地物各选择50个样本区域, 记录这些样本点在高光谱影像150个波段中的反射率值, 作为标准分类组。 然后, 使用SPSS软件中的逐步判别分析模型, 对150个波段分别进行分析, 最终选择了14个满足条件的特征波段, 分别为394、 407、 443、 509、 517、 533、 592、 625、 680、 689、 710、 749、 848和911 nm。
2.1.2 波段信息量分析
使用波段标准差来评价其信息量, 标准差越大, 包含的地物信息量越丰富。 图4显示了东花园镇图像各波段的标准偏差变化曲线。 总体来看, 从可见光到近红外波长范围内, 各波段的标准差随波段增加先上升后下降, 在可见光绿色波段达到最大。 对150个波段的标准差进行排序, 前十的波段分别为554、 538、 550、 546、 533、 562、 558、 529、 542和592 nm, 表明可见光绿色波段信息量大。 同时在近红外波段848 nm和可见红光波段749nm有明显的峰值, 这些波段皆为该类波段中信息量大的波长。
2.1.3 相关性分析
波段相关性通常通过计算相关系数进行评估。 图5显示了高光谱图像150个波段之间的相关系数。 总体来看, 150个波段间的相关性较高, 但有一定的块状特征。 A区块为B1到B30波段区间(394~513 nm), B区块为B31到B90波段区间(517~766 nm), C区块为B91到B130区间(770~941 nm), D区块为B131到B150区间(946~1 032 nm)。 这些区块内部波段的相关系数非常高, 超过0.95, 但不同区块之间的相关系数较低, 如AD区块和AC区块的平均相关系数分别为0.78和0.82。 为确保所选波段能表达独立且全面的特征信息, 最佳特征波段应从不同区块中挑选。
2.1.4 主成分分析
对高光谱影像的150个波段进行主成分分析(PCA), 以解决波段过多和信息重叠的问题。 图6展示了各个主成分的特征值分布。 结果表明, 前5个PCA分量占原始影像光谱信息的99.17%, 其中前两个主成分PC1和PC2占比之和为97.06%。 这表明经过PCA运算后, 150个波段的信息几乎全部集中在前5个PCA分量中, 且以PC1和PC2为主导。
表2统计了各波段对PC1— PC5的贡献。 表3展示了每个PCA成分的贡献率排序的前10个波段。 从表中可知, 对PC1贡献最大的波段主要集中在近红外波段。 对PC2贡献最大波段主要集中在红光波段。 由于PC1和PC2占原始光谱信息的97.06%, 并包括大部分原始图像信息, 因此这些主导波长在区分不透水表面和透水表面时具有重要意义。
![]() | 表2 影像PCA分量特征值所占比例 Table 2 Proportion of image PCA components |
![]() | 表3 与前五个主成分相关的波段 Table 3 The spectral regions well explained by each principal component |
2.1.5 特征波段选择结果分析
为了对逐步判别分析得到14个特征波段进行更全面的考量, 对比了不同方法的结果。 分析显示, 这些波段涵盖了标准差排名靠前, 信息量丰富的绿色波段(如533和592 nm)、 近红外波段(848 nm)及红光波段(749 nm)。 根据相关性分析结果表明, 属于不同区间的波段的相关性更小。 选择的14个波段中394、 407、 443和509 nm在A区, 517、 533、 592、 625、 680、 689、 710和749 nm属于B区, 848和911 nm属于D区。 这三个区块两两组合相关性较小。 主成分分析揭示, 主导波段为近红外与红光波段的PC1和PC2占原始光谱信息的97.06%, 且所选波段中半数为这两种类型, 其中入选波段394与407 nm在PC1中贡献显著。 图7展示了各类地物在150个波段下的光谱特征, 所选波段为灰色虚线所在位置。
卷积神经网络近年来在众多研究领域得到应用, 其在图像分类、 目标检测等诸多任务上都表现优异。 本研究主要使用改进的AlexNet网络架构进行城镇不透水面的提取工作。 AlexNet网络结构相对简单直观, 易于理解, 相比目前一些深度和宽度更大的模型, 其参数量较少, 训练和推理速度会更快, 在面对中小规模的数据集或资源受限的环境时, 具有一定的优势。 AlexNet原网络共有8个层次, 其中包括5个卷积层和3个全连接层, 此外网络还有三个最大池化层。 由于池化层的降维作用会使训练样本在高层次的尺寸过小[28], 引起信息丢失和限制模型的表征能力。 为了提高对阴影区域的分类精度, 本工作设计的卷积网络仅保留最后一层池化层, 同时设计4个卷积层, 参数设置分别为32@7× 7、 64@7× 7、 64@5× 5和1 28@5× 5, 卷积核大小分别为1、 1、 3和1, 步长统一设置为1。 在池化层部分选择使用2× 2大小、 步长为2的最大池化方法, 最后设计两个节点数分别为256和128的全连接层, 整体模型结构如图8所示。 需要说明的是, 由于实验数据具有14个波段, 因此需要使用GDAL将遥感影像转换为Numpy格式, 并将其转换为深度学习框架的张量, 然后输入模型进行处理。 整个网络的学习率初始化为0.001, 权重衰减因子为0.001, 全连接层前后使用的Dropout分别设置为0.25和0.5, 采用了Adam优化算法。
本研究选取了混凝土、 金属材质、 瓦片、 植被和裸土五类地物, 各类选取50个样本区域, 共计16, 160个像素级训练样本。 由于样本数量差异明显, 使用重采样来平衡各类别的样本数量, 如表4所示。 每类地物随机选取70%的样本用于训练, 剩余30%的样本用于验证。
![]() | 表4 各类型的像素级样本数量 Table 4 Number of pixel-level samples of each type |
为了验证本方法的有效性, 设计两步验证思路: (1) 对比使用高光谱原始影像和特征波段影像的实验结果, 评估高光谱特征波段选择方法对城镇不透水面提取的效果。 (2) 将提出的卷积神经网络模型的提取结果与AlexNet网络及三种常用机器学习方法: 朴素贝叶斯(NB)、 支持向量机(SVM)和随机森林(RF)的结果进行对比, 证明所设计网络模型的优越性。 论文精度评估指标包括: 总体精度(OA), 用户精度(UA), 生产者精度(PA), Kappa系数和Macro F1(F1)。
其中, 真阳性(TP)表示正确分类的特定类型像素数量, 假阳性(FP)表示错误分类为特定类型的像素数量, 假阴性(FN)表示特定类型像素被错误分类的数量。 P0表示观察到的一致比例, Pe表示偶然期望的一致比例。
表5展示了特征波段组合数据在提出的卷积神经网络上的提取结果的混淆矩阵, 构建的网络模型的OA为99.07%, Kappa系数为0.988 3。 每类地物的PA和UA都超过了97%, 其中透水面类型植被的PA和UA均超过99%。
![]() | 表5 CNN分类结果的混淆矩阵 Table 5 Confusion matrix of the CNN classification results |
原始150个波段的高光谱数据由于高相关性和信息冗余, 无法在卷积神经网络中有效提取不透水面。 表6给出了各方法使用原始数据和特征波段组合的提取结果。 所有方法在使用特征波段组合后, 提取效果显著提升。 各方法的OA表现为: SVM提高19.17%, RF提高21.14%, NB提高21.17%, AlexNet提高14.43%, 本文提出的CNN提高12.82%; Kappa系数: SVM提高24.95%, RF提高27.80%, NB提高26.96%, AlexNet提高18.98%, 本文提出的CNN提高16.57%。 不同方法得到的提取结果如图9所示。 图9(a1)、 (b1)、 (c1)为特征波段影像提取结果, 图9(a2)、 (b2)、 (c2)为原始影像提取结果。 对比可发现, 在图9(a1)、 (b1)、 (c1)中, 黑色区域的面积更小, 即影像中未被分类的地物更少。 各类地物的分类界线更加清晰, 错分的地物类型也更少。 同时, 处于阴影下的地物类型能够更精确的被分辨和提取, 如图9黄色椭圆区域。
![]() | 表6 不透水面提取结果对比 Table 6 Comparison of the extraction results of the impermeable surface |
通过表6可得到, 在相同训练数据下, 本文提出的方法为最优, 比AlexNet模型在不透水面提取任务中的OA提高了3.63%和5.11%, 分别达到了99.07%和87.81%的优异结果。 Kappa系数比AlexNet模型分别提高了4.59%和6.75%。 相比于三种机器学习方法, 改进的卷积神经网络在OA和Kappa系数上平均领先15.12%和21.04%。 对比图9各行中的提取结果, 机器学习的方法在遇到存在阴影的地物时, 会出现无法分类的情况, 如图中黑色区域。 改进后的卷积神经网络能更好地解决阴影中的地物类型分类, 如图9(a1)的红色椭圆, 同时分类结果图像更为平滑, 边界更为清晰, 对小目标能很好进行提取, 如路边的行道树, 所提出的卷积神经网络模型能够最为准确地提取(图9中黑色椭圆)。
通过高光谱特征波段提取的14个波段组合成的影像通过卷积神经网络模型提取出的不透水面结果如图10, 各类别面积的占比情况如表7所示。 从表格可得东花园镇不透水面面积高于透水面面积22.76%, 其中混凝土面积最大, 占不透水面总面积的64.94%。 瓦片和金属材质是该地区常见的民居屋顶材料, 瓦片面积是金属材质的两倍以上, 金属材质面积仅占7.02%。 透水面主要由裸土和植被构成, 裸土面积为植被的两倍多。 实地考察显示, 由于当地气温较低, 5月末居民区周边农田作物尚未生长, 因此提取结果中裸土占比较高。
![]() | 表7 东花园镇不透水面提取结果 Table 7 Extraction results of impervious surface in Donghuayuan Town |
通过逐步判别分析、 标准偏差、 相关性和主成分分析, 提出了一组无人机高光谱不透水面提取的最佳波段组合, 并优化了 AlexNet 网络架构, 构建了适用于城镇不透水面提取的卷积神经网络模型。 实验结果表明, 提出的最佳波段组合有效解决了高光谱波段间的信息冗余和高相关性问题, 显著提高了模型的计算精度和效率。 相比常用的不透水面提取方法, 所提出的卷积神经网络模型效果最优, 结合最佳波段组合, 出色地完成了材质分类任务, 并改善了由阴影引起的分类错误。 根据研究结果生成了怀来县东花园镇的不透水面地图, 并结合实地调研分析了城镇化建设与生态环境状况, 发现当地基础设施完善, 有合理的绿化面积。 高光谱影像在材质分类方面表现出色, 未来可进一步利用其进行更细致的分类, 提高不透水面信息提取的准确性和精度。
[1] |
|
[2] |
|
[3] |
|
[4] |
|
[5] |
|
[6] |
|
[7] |
|
[8] |
|
[9] |
|
[10] |
|
[11] |
|
[12] |
|
[13] |
|
[14] |
|
[15] |
|
[16] |
|
[17] |
|
[18] |
|
[19] |
|
[20] |
|
[21] |
|
[22] |
|
[23] |
|
[24] |
|
[25] |
|
[26] |
|
[27] |
|
[28] |
|