基于光谱特征的拉萨市人造地表遥感提取研究
王金枝1, 周广胜2,*, 吕晓敏2, 任鸿瑞1
1.太原理工大学测绘科学与技术系, 山西 太原 030024
2.中国气象科学研究院, 北京 100081
*通讯作者 e-mail: zhougs@cma.gov.cn

作者简介: 王金枝, 女, 2000年生, 太原理工大学测绘科学与技术系硕士研究生 e-mail: wangjinzhi0761@link.tyut.edu.cn

摘要

青藏高原在全球生态系统中占重要地位; 拉萨市作为其核心城市, 在研究平衡城市发展水平与生态系统服务能力方面具有代表意义。 该研究在谷歌地球引擎(GEE)云平台, 使用Sentinel-2、 VIIRS、 SRTM遥感影像数据, 基于光谱结合地形、 纹理等特征信息, 分别通过基于像元(PB)与面向对象(OO)分类方法对拉萨市人造地表覆盖进行提取。 使用基于像元/面向对象, 是否加入纹理特征, 随机森林(RF)/支持向量机(SVM)分类器三组对比方法各部分表现效果。 结果表明: 基于相同光谱特征, 在OO方法中不使用纹理特征参与RF分类器分类(OO_RF), 可获得最佳的提取结果, 其总体精度(OA)为98.03%, Kappa系数(KC)为0.9520, 用户精度(UA)为94.44%, 生产者精度(PA)为98.84%。 纹理特征在人造地表提取中作用效果较弱, 仅在基于像素方法中有微弱提升, 使用RF分类器(PB_RF)时OA提升0.51%; 使用SVM分类器(PB_SVM)时OA提升0.68%。 RF分类器在本研究中表现最佳, 能够避免高估, 更准确地识别城市内部非人造地表覆盖。 本研究提供了提取生态城市人造地表覆盖信息的方法及参数, 为进一步进行动态监测及分析提供了数据, 具有实际应用意义。

关键词: 面向对象; 基于像元; 光谱特征; 谷歌地球引擎; 人造地表
中图分类号:P237 文献标志码:A
Research on Remote Sensing Extraction of Artificial Surface in Lhasa City Based on Spectral Features
WANG Jin-zhi1, ZHOU Guang-sheng2,*, LÜ Xiao-min2, REN Hong-rui1
1. Department of Geomatics, Taiyuan University of Technology, Taiyuan 030024, China
2. Chinese Academy of Meteorological Sciences, Beijing 100081, China
*Corresponding author
Abstract

The Qinghai-Tibet Plateau holds a crucial position in the global ecosystem. As its core city, Lhasa City stands as a representative focal point for studying the delicate balance between urban development levels and ecosystem service capacities. This study was conducted on the Google Earth Engine (GEE) cloud platform, utilizing Sentinel-2, VIIRS, and SRTM remote sensing imagery data. Based on spectral data combined with terrain and texture features, the study extracted artificial surfaces in Lhasa City through Pixel-Based (PB) and Object-Oriented (OO)classification methods. To compare the performance of different parts of the method, this study conducted a comparative analysis of three groups: OO or PB classification, inclusion or exclusion of texture features, and using Random Forest (RF) or Support Vector Machine (SVM) classifiers. The results showed that Based on the same spectral features, the best extraction result can be obtained by not using texture features in the RF classifier in the OO method (OO_RF), with an Overall Accuracy (OA) of 98.03%, a Kappa Coefficient of 0.952 0, a User Accuracy (UA) of 0.944 4, and a Producer Accuracy (PA) of 0.988 4. The effect of texture features in extracting artificial surfaces is relatively weak, with only slight improvements observed in PB methods. Specifically, the OA increased by 0.51% when using the RF classifier (PB_RF) and 0.68% when using the SVM classifier (PB_SVM). The RF classifier performed the best in this study, avoiding over estimation and identifying non-artificial surfaces within cities more accurately. In conclusion, this study provides a reference for extracting artificial surface information regarding methods and parameter settings at the urban scale. Using result data allows for further analysis and dynamic monitoring, which has practical application significance.

Keyword: Object-Oriented; Pixel-Based; Spectral features; Google Earth Engine; Artificial surface
引言

人造地表是指由人类活动所建造或改变的地表, 包括城镇村各级居民点、 工矿、 交通运输、 水利设施建设等不透水部分, 及景观园林、 绿化带、 农业经济建设用地等透水部分[1, 2]。 随着全球城镇化发展, 地表覆盖大量转入人造地表, 破坏了生态环境的稳定, 直接导致生物多样性减少、 水污染及土壤退化等问题[3, 4]。 更为重要的是, 局部环境的变化会产生全球性的影响[1], 使全球生态系统服务能力不断退化[5]。 因此, 准确掌握人造地表覆盖信息, 对合理规划土地使用方式及生态恢复, 以达到满足人类当前需求和维持生物圈长期服务能力之间的平衡尤为重要[6]

过去关于人造地表覆盖的研究通常采用传统的实地调查方式, 依靠经验知识进行人工处理。 这种方法所获取的数据精度高但体量大, 考虑到时效性及成本, 在大范围尺度的应用方面存在一定限制。 随着地球观测遥感卫星的大规模发射以及遥感技术的不断发展与突破, 涵盖各种研究领域的遥感数据正变得更易获取。 与此同时, 这些数据的时空分辨率及其承载的波段信息也在不断优化, 逐渐形成了覆盖范围广、 时间序列长、 更新速度快的数据集合。 在本地进行海量遥感数据处理对软硬件有极高要求, ENVI等传统桌面端遥感处理平台无法满足当前遥感大数据的应用需求[7]。 作为目前世界上先进的高性能云端服务器, 谷歌地球引擎(Google Earth Engine, GEE)云平台集成海量数据资源供用户在线获取调用, 降低了不同数据源影像质量的不确定性; 同时用户可基于其提供的模型直接开发各类算法, 避免了大量的本地计算过程, 在大尺度海量遥感的处理与分析中具有良好的应用前景[7, 8]

GEE平台提供的数据资源如Landsat、 Sentinel、 SRTM等系列影像, 在全球尺度人造地表相关研究中被广泛应用。 欧共体联合研究中心提供的全球人类居住区(GHSL)数据, 由Sentinel-2复合数据和Landsat多时数据通过符号机器学习(symbolic machine learning, SML)方法生产, 显示整个陆地上每单位表面的建筑物密度, 其亮度随建筑物密度的增加而增加, 数据总体精度(overall accuracy, OA)在干旱地区为84.96%, 农村地区为84.74%[9, 10]。 陈军使用Landsat TM and ETM, OLI及HJ-1数据, 提出了一种基于像素-对象-知识(pok-based)的分类方法, 主要通过目视解译及监督分类, 共生成GlobeLand30 2000/2010/2020三期数据, 其中Globeland30 V2010的人造地表用户精度(user accuracy, UA)为86.70%[11]。 陈学鸿等基于GlobeLand30结合对象级分割及像素分类方法, 使用专家知识人工编辑进行结果优化, 提取了全球人造地表斑块产品[12]。 然而基于“ 知识” 人工编辑优化占用大量时间及人力成本, 产品更新周期长; 且产品多是以全球尺度生产, 提取结果在城市区域表现一致, 但在村镇等非人口聚集区明显存在大量差异, 以城市尺度提取的人造地表覆盖产品仍存在缺失。

目前人造地表相关研究主要包括基于像元(pixel-based, PB)及面向对象(object-oriented, OO)两类方法, 其中基于像元方法更为传统, 以像元为基本研究单元, 不考虑地理空间的上下文信息, 因此会出现“ 椒盐” 现象影响结果精度; 而面向对象方法的基本单元为对象, 分割对象内部特征相似, 具有同质性, 可减轻噪声造成的影响。 面向对象的分割方法及其参数的设置会对分割结果乃至分类结果产生影响, 因此探讨人造地表提取时不同分割尺度参数设置具有重要意义。 影像纹理特征能够展现图像不同像素之间的相关性, 尽管在诸多地表覆盖遥感分类研究中已被使用, 但在人造地表相关研究中的作用力仍有待研究证明。 以上两种方法的分类过程均需使用机器学习, Nery等[13]的研究表明使用支持向量机(support vector machine, SVM)或随机森林(random forest, RF)算法在光学影像分类中更具优势; 本研究对比SVM及RF两种分类方法在人造地表分类提取中的作用力, 以分析算法适用性。

青藏高原作为世界上海拔最高、 面积最大的高原, 在全球生态系统中占重要地位, 拉萨市作为其核心发展城市, 生态环境脆弱, 地理条件特殊, 城镇分布主要受地形影响。 为此, 在GEE平台使用Sentinel-2遥感影像数据, 在基于像元和面向对象方法中, 基于多种光谱特征并结合纹理、 地形特征, 对比是否使用纹理特征, 通过SVM和RF分类器进行结果分类。 对这些不同组合方法的分类结果进行了分析评估, 为后续研究者进行生态城市人造地表提取时可使用的最佳方法及参数提供参考。

1 实验部分
1.1 研究区概况

拉萨市(91° 06'E, 29° 36'N)位于青藏高原中南部, 地势整体由东向西倾斜, 地形以高原山地为主, 平均海拔约3 650 m。 行政区域内现辖5县3区, 东西长约277 km, 南北宽约202 km。 该地区属高原温带半干旱季风气候, 农业主要种植青稞、 小麦等喜凉作物, 植被覆盖垂直地带性显著。 受喜马拉雅山脉对当地大气环流的影响主下沉气流, 全年多晴朗天气, 被称为“ 日光城” , 作为重要生态区域青藏高原的核心发展城市, 人口聚集程度高, 社会基础设施完善, 在政教文卫各方面起着带头作用[14, 15]

图1 拉萨市DEM及行政区域分布Fig.1 Digital elevation model (DEM) and administrative division of Lhasa City

1.2 遥感数据

Sentinel-2(S2)卫星搭载多光谱成像仪(MSI), 覆盖4个10 m、 6个20 m及3个60 m波段, 两颗卫星互补重访周期为5 d。 GEE云平台提供的地表反射率产品Sentinel-2 MSI已经过正射校正和大气校正, 可节约数据获取及处理时间成本, 保证数据质量。

拉萨市地区夏季植被生长旺盛, 闲荒的农田、 裸地等易与人造地表混淆的覆盖类型较少[16]。 选取的拉萨市数据的时间范围为2022年7月1日至8月31日, 使用QA60波段对其进行去云处理, 并将质量较差的像元掩膜, 根据需求选择Green, Red, Blue, NIR, SWIR1, SWIR2共六个波段。

1.3 采样点数据

基于S2结合Google Earth Pro高分辨率遥感影像进行目视解译, 采用随机抽样的方法, 在拉萨市的遥感影像上进行训练数据的选取。 通常将目视解译得到的全部样本点通过分层随机抽样的方式, 按7:3的比例分为训练及验证数据[5, 11], 但这种方式易使模型过拟合, 从而产生过高的验证精度, 影响研究结果的判断。 因此, 本研究的测试样本点在研究区内随机生成, 再利用遥感影像目视解译对其进行类型判别赋予属性, 同时考虑到各地表覆盖类型样点数据的比例, 在人造地表聚集区重点生成。 本研究共生成了2 028个样本点, 其中训练样本1 420个, 验证样本608个, 样本点具体分布状况见图2。

图2 采样点分布状况Fig.2 Distribution of sampling points

1.4 特征选择

大量研究结果表明, 分类特征构建会产生巨大影响, 使用全面的特征组合是克服遥感影像“ 异物同谱、 同谱异物” 现象的重要手段[17]。 拉萨市居民点主要分布在地形平坦、 水热条件优越的河谷地区及交通主干道沿线, 可知该地城镇化形态以地形为主要驱动因素。 地形和纹理特征可以从不同方面描述数据的表面形态信息, 添加如高程、 坡度、 坡向的形态特征作为辅助数据能够提高分类精度[11]。 在GEE云平台调用研究区30 m分辨率的SRTM数据, 重采样至10 m后通过该DEM数据计算提取高程、 坡度、 坡向因子。

空间纹理特征能够在中分辨率影像的分类上提供光谱信号所不具备的信息, 通常被认为是提取低密度人造地表覆盖的重要辅助特征[13]。 在基于像元及面向对象的分类方法中对比加入和不加入纹理特征的结果精度, 分析纹理特征在10 m分辨率数据源下进行城市尺度人造地表提取中的作用力。 使用基于统计的灰度共生矩阵(gray-level co-occurrence matrix, GLCM)算法提取纹理特征, 基于S2影像信息通过式(1)加权线性组合得到灰度图像。

Gray=(0.3×NIR)+(0.59×Red)+(0.11×Green)(1)

式(1)中, NIR为近红外波段反射率, Red为红波段反射率, Green为绿波段反射率。

对计算得到的纹理信息采用主成分分析(principal component analysis, PCA)压缩, 其中第一主成分(principal component 1, PC1)被认为包含绝大多数的结构信息[11, 18], 因此使用PC1作为本研究的纹理特征。

夜间灯光指数是拉萨市人口分布的主导因子[19], 人类聚集性活动不断推动人造地表覆盖的发展, 因此认为夜间灯光(nighttime light, NTL)遥感数据可直接反映城镇化的分布概况, 是人造地表覆盖提取的重要辅助数据[20, 21]。 EVI调整夜间灯光指数(EVI adjusted nighttime light index, EANTLI)是EVI参与调整后的NTL指数, 该指数能够有效克服裸土效应, 突显城市内部差异[22], 对DMSP-OLS和NPP-VIIRS两种夜间灯光数据集的处理都产生了很好的校正效果[20]。 VIIRS数据时空分辨率均高于DMSP数据, 且很大程度上降低了DMSP数据中的过饱和问题[21]。 因此, 通过GEE提供的2022年EVI数据调整NPP-VIIRS数据, 重采样至10m计算EANTLI指数参与分类。

多种光谱指数根据不同的研究需求不断发展, 在增加可用信息的基础上改善最终分类结果[11]。 本研究以光谱特征为主, 结合地形、 纹理共23个特征(见表1), 为探明在特征集合中加入纹理特征对人造地表提取的精度影响, 另一组特征剔除纹理特征。

除地形因子、 夜间灯光指数及纹理特征外, 还使用了在城镇用地信息相关提取中被广泛应用的12种光谱指数。 使用夏季植被生长旺盛时期数据提取NDVI、 EVI有助于提升植被区分度; SAVI、 MSAVI、 BSI、 IBI、 EIBI、 NDBI、 NDBBI可减弱大气及地形的影响, 将易被混淆为人造地表的土地类型如土壤及裸地等与建筑区差异增强; NDWI、 MNDWI能够提升水体识别能力, 避免大片建筑物阴影误判, 这些特征组合可增强对研究区内大片水体、 植被、 裸地、 农田等覆盖类型的区分能力, 优化人造地表覆盖提取结果[23, 24]。 将上述使用的所有相关数据重采样至10 m分辨率参与分类提取过程。

表1 人造地表提取特征选择 Table 1 Features selection for artificial surface extraction
1.5 方法

1.5.1 研究方法

1.5.1.1 研究方法技术流程

使用2022年7月— 8月S2遥感数据, 基于光谱特征对拉萨市人造地表进行提取。 对比输入特征组合是否包含纹理特征, 使用基于像元还是面向对象分类方法, 基于SVM或RF分类器时的分类结果, 以期获取10 m分辨率在生态城市尺度进行人造地表覆盖提取时的最优方法组合。 共形成了八种分类方法组合, 包括基于像元方法中(1)SVM分类器(PB_SVM), (2)输入纹理特征的SVM分类器(PB_GLCM_SVM), (3)RF分类器(PB_RF), (4)输入纹理特征的RF分类器(PB_GLCM_RF); 面向对象方法中通过简单非迭代聚类(simple non-iterative clustering, SNIC)算法分割影像后(5)SVM分类器(OO_SVM), (6)输入纹理特征的RF分类器(OO_GLCM_SVM), (7)RF分类器(OO_RF), (8)输入纹理特征的RF分类器(OO_GLCM_RF)。

图3 研究方法流程图Fig.3 Research methodology flowchart

在过去机器学习的研究过程中, 地表覆盖提取方法被发展为基于像元及面向对象两大部分, 两者区别主要表现为处理数据的基本单元不同。

1.5.1.2 基于像元的分类方法

SVM分类算法在上世纪九十年代被开发[25], 作为一个二值分类器, 该方法在高维空间中利用输入向量寻找最优超平面, 将两类训练向量分离到两个子空间中以获得分类结果, 遵循结构风险最小化原则, 能够很好的平衡风险与分类器性能。 SVM以其良好的表现在城镇用地相关研究中被广泛使用, GlobeLand30、 MSMT_IS30-2015等数据集产品的处理过程都使用了该方法[17]

RF分类算法是由Breiman[26]2001年在决策树的基础上发展而来的集成分类器, 通过控制内部决策树数量, 能够有效避免模型出现过拟合并提高泛化性及预测能力[27]。 在实际应用过程中发现, 当决策树数量达到一定程度后, 棵数增加对结果精度只会带来微弱波动, 但会增加数据量造成计算存储的负担。 RF以其灵活性、 高效率、 准确性等各方面的优势, 被应用于多源遥感及地理数据的处理, 在遥感、 生态等领域得到了广泛应用[28]

1.5.1.3 面向对象的分类方法

以对象为单位的分类方法能够优化基于像元结果中的“ 椒盐” 现象, 在地表覆盖提取、 生态遥感、 动态监测等方面都得到了广泛应用。 影像分割尺度参数是面向对象方法中最重要的部分, 分割原则是保证影像分割对象内部异质性低, 同时不同对象之间的差异性显著, 以提升不同覆盖类型之间的区分度[29]

为了更好的发掘面向对象方法的优势, 获得更有意义的分割对象, 多种图像分割算法被开发, 主要包括基于图、 梯度上升两类方法, 如NC05、 GS04、 SL08、 WS91等[30]。 与这些传统方法相比, Achanta等[30]提出基于K-means聚类生成的超像素方法(SLIC), 该方法在处理速度、 分割质量、 参数调优等方面具有绝对性的优势, 更适用于海量数据处理。 本研究使用的SNIC算法是SLIC的进阶版本, 兼具性能稳定与高效率内存计算的优势。

尺度分割的参数对分类结果精度影响极大。 综合考虑研究区地表覆盖分布特性、 计算内存压力及分类结果精度, 衡量数据计算存储压力与分割结果, 设置SNIC分割方法参数为: 种子距离(Size): 10, 分割紧密度(Compactness): 0, 连通性(Connectivity): 8, 邻域大小(Neighborhoodsize): 256[31]

1.5.2 精度评定

使用混淆矩阵, 从不同角度进行分类结果的精度评定, 包括: 总体精度(overall accuracy, OA)、 Kappa系数(Kappa coefficient, KC)、 生产者精度(producer accuracy, PA)、 用户精度(user accuracy, UA)等指标。 其中OA代表总体数据的精度, 可直接判断分类效果的优劣。 而Kappa系数兼顾正确、 错分及漏分数据, 更能够体现分类与实地类型的适配程度, 对分类结果精度更具指示性意义, 高于0.8则认为分类结果基本正确。 PA代表分类结果中该类别得到的正确数量与该类别在测试集中实际具有的数量的比值, UA代表在分类结果中该类别正确分类的数量与影像中被分类判定为该类别的总数的比值。

这些精度评定指标的计算公式如式(2)— 式(5)

OA=i=1naiii=1nj=1naij(2)

Kappa=Ni=1naii-i=1n(ai+·a+i)N2-i=1n(ai+·a+i)(3)

PA=aija+j(4)

UA=aijai+(5)

式(2)— 式(5)中, i=1naii代表正确分类样本数量和, i=1nai+i=1na+i分别代表第i行、第i列的样本数量和。

2 结果与讨论
2.1 尺度分割最优种子距离结果

不同分割尺度会产生不同的结果, 影响到最终提取结果的精度。 由表2不同种子距离尺度分割影像提取精度可知, 总体精度及Kappa系数随种子像素距离增大而逐渐提升, 在种子像素距离为10像素时达到峰值, 随后逐渐减小至最小值附近波动。 因此, 选取研究区的最优种子距离为10像素。

表2 不同种子距离尺度分割影像提取精度对比 Table 2 The comparison of extraction accuracy for image segmentation at different seed distance scale
2.2 拉萨市人造地表覆盖提取精度结果

共生成8组提取组合方法, 各分类方法获得的OA、 Kappa系数、 UA、 PA见表3。 对比结果可发现, 使用不同分类器时面向对象方法结果精度基本都高于基于像元方法, 不使用纹理特征参与RF分类时, 面向对象OA、 Kappa分别提升了0.005 7、 0.012 2; 不使用纹理特征参与SVM分类时, 面向对象OA、 Kappa分别提升了0.019 9、 0.049 1; 使用纹理特征参与SVM分类的方法, 面向对象OA、 Kappa分别提升了0.011 4、 0.025 2。 仅在使用纹理特征参与RF分类的方法时有差异, 面向对象OA、 Kappa分别降低了0.004 4、 0.011 9。

表3 拉萨市人造地表覆盖提取不同方法结果精度 Table 3 Accuracies of different methods for extracting artificial surface coverage in Lhasa City

分类组合方法中的最优方法及参数设置为: 在面向对象方法中使用SNIC算法对影像进行分割, 设置分割参数为Size: 10, Compactness: 0, Connectivity: 8, Neighborhoodsize: 256, 使用150棵树的RF分类器进行分类, 得到总体精度为98.03%, Kappa系数为0.952 0, 人造地表覆盖提取准确。

2.3 拉萨市人造地表覆盖提取图像结果

各组合方法通过参数设置获得的最优人造地表覆盖提取结果图见图4及图5, 其中图4为基于像元方法, 图5为面向对象方法。 对比图4(a)、 图4(b)与图4(c)、 图4(d)及图5(e)、 图5(f)与图5(g)、 图5(h)可发现, 对相同尺度的遥感数据, SVM比RF分类器提取结果范围更广, 结果高估于RF算法。 对于城市内部流域纵穿区域, RF对其分隔能力更强, 而SVM将更多的流域内干涸硬土地识别为人造地表覆盖类型, 识别能力较弱。

图4 基于像元方法拉萨市人造地表覆盖提取结果图
(a): PB_SVM; (b): PB_GLCM_SVM; (c): PB_RF; (d): PB_GLCM_RF
Fig.4 Artificial surface extraction in Lhasa City based on pixel-based method
(a): PB_SVM; (b): PB_GLCM_SVM; (c): PB_RF; (d): PB_GLCM_RF

图5 面向对象方法拉萨市人造地表覆盖提取结果图
(e): OO_SVM; (f): OO_GLCM_SVM; (g): OO_RF; (h): OO_GLCM_RF
Fig.5 Artificial surface extraction in Lhasa City based on object-oriented method
(e): OO_SVM; (f): OO_GLCM_SVM; (g): OO_RF; (h): OO_GLCM_RF

为了分析在输入分类器的特征中是否加入纹理信息, 共产生了包括基于像元/面向对象、 使用SVM/RF分类器的四组结果。 由结果可知, 纹理特征的作用效果不大, 甚至可能会对分类结果的精度产生负面影响。 分析其原因, 地形及纹理特征都是用于描述遥感数据表面特征信息, 两者之间相关性较高, 相互作用使得数据冗余, 在一定程度上减弱了纹理信息的作用能力。 使用更高分辨率的数据, 能获取更为精细的信息, 纹理特征可能会有更好的表现。

图6 纹理特征输入与否分类结果对比Fig.6 Comparison of accuracy between method with and without texture features input

对比使用不同分类器的结果精度可知, 不管使用基于像元还是面向对象方法, 是否输入纹理特征参与分类, 使用RF分类器都比SVM分类器能够获得更好的结果。 随着数据时空分辨率的发展, 大多使用长时序、 多源数据结合进行遥感数据分析处理。 RF分类器在处理高维多源数据时具有稳定性, 能够在较短的计算时间内获得较高的精度, 具有高处理效率。 通过目视解译手段获取训练数据仍被广泛使用, 这种方式获得的数据有概率存在主观误差, 使用具有鲁棒性的RF分类器, 可抵抗该误差对结果的影响[10]。 因此, 在人造地表相关信息提取的研究中, 选择不同机器学习算法获得结果的差异明显, 使用RF能够获得更好的结果。

图7 SVM/RF分类结果精度对比Fig.7 Comparison of accuracy between SVM and RF classification results

保持基于像元和面向对象方法使用的数据源、 输入特征及分类器相同, 对比了两种分类方法提取人造地表的效果。 仅基于整体分类精度判别时, 两种分类结果精度不存在较大的差异, 但面向对象比基于像元方法占用更多运算时间[32]。 对使用相同分类器的分类结果进行目视解译判别, 从结果图细节对比可发现, 面向对象方法比基于像元的结果图噪点更少, 图像效果更好。 使用基于像元方法对人造地表提取时, 考虑到城市内部异质性较强, 难以保证单一像元内部均为纯净, 在一定程度上导致提取结果的误差; 而基于对象的方法以分割后的均质对象为单位, 充分考虑不同对象之间的邻域拓扑关系, 能够减少分类结果中的“ 椒盐” 现象[30], 因此使用面向对象方法获得的图像的细节更为准确。

图8 结果细节噪点情况对比图Fig.8 Comparison of noise details

不透水面由人类活动建造, 是城镇化的主要的地表覆盖类型, 对人造地表的提取结果具有重要参考意义。 使用认可度高、 更新及时的高分辨率全球不透水地表相关数据集作为提取结果的参照数据。 各数据集在拉萨市行政区域内的分布状况见图9, 包括30 m全球土地覆盖数据集(GlobeLand30, 2020)[11]; 全球精细分辨率土地覆盖观测与监测(FROM_GLC, 2017)[33]; 全球30米不透水表面动态数据集(GISD30, 2020)[34]

图9 高分辨率全球不透水地表相关数据集合对比Fig.9 Comparison of high-resolution global impervious surface datasets

通过图像对比可发现, 结果与各数据集城市范围分布一致性强, 仅在交通轨道沿线及城郊、 村镇等人口密集程度低的区域差异较大, 证明本研究结果具有可靠性, 是进行城市乃至更大尺度的人造地表覆盖提取的有效手段。 而离散居民点处的区别较大的原因, 主要在于原始数据影像的空间分辨率, 及不可避免存在混合像元使得地物识别能力受限; 加上各研究使用的采样点数量、 质量、 分布等状况不一致, 导致模型训练的效果有差异。 在更大范围的研究中, 考虑到目视解译遥感影像采样的方式耗费较多人工, 且易产生主观判别错误, 可使用统一时间范围的各相关数据集叠加, 筛选后进行采样数据的选取。

3 结论

在GEE云平台使用Sentinel-2夏季数据, 基于光谱特征, 通过基于像元/面向对象, 用和不用纹理特征, SVM/RF三组对比, 发掘了在10 m分辨率下提取生态城市人造地表覆盖的最优方法及参数组合, 具体表现为: 在面向对象方法中使用SNIC分割, 设置参数为种子距离: 10, 分割紧密度: 0, 连通性: 8, 邻域大小: 256, 通过150棵树的RF分类器进行分类。 研究结果表明: (1)总体而言, 使用10 m分辨率的原始遥感数据, 在基于像元和面向对象的分类中, 获得的分类结果总体分类精度相似; (2)在对结果图像进行细节处的目视解译可发现, 面向对象分类方法能够获得噪声点更少的高质量结果图像, 与基于像元相比分类结果的误差更少; (3)在使用10 m分辨率数据时, 添加GLCM提取的纹理特征对于城市尺度人造地表提取分类的辅助作用并不大, 仅在基于像元方法中有微弱提升, 在面向对象方法中甚至有可能降低分类结果的精度; (4)RF分类器作为在GEE环境中应用最为广泛的机器学习方式, 在本研究中表现十分良好。

本研究筛选出生态城市尺度下人造地表信息提取的最优方法及参数, 为后续进行非热门城市乃至更大范围的人造地表覆盖提取提供研究方法的参考, 为更高时空分辨率的城市动态监测提供数据信息。 基于本研究结果分析, 进一步考虑加入多源遥感数据, 如激光雷达数据识别阴影的能力可提升城市内部建筑密集区域区分度, 或应用深度学习方式代替传统的机器学习手段。

参考文献
[1] Tassi A, Gigante D, Modica G, et al. Remote Sensing, 2021, 13(12): 2299. [本文引用:2]
[2] Zhuo L, Shi Q L, Tao H Y, et al. ISPRS Journal of Photogrammetry and Remote Sensing, 2018, 142: 64. [本文引用:1]
[3] Zhang B, Shi Y T, Wang S. Journal of Resources and Ecology, 2022, 13(1): 68. [本文引用:1]
[4] Foley J A, DeFries R, Asner G P, et al. Science, 2005, 309(5734): 570. [本文引用:1]
[5] Lautenbach S, Kugel C, Lausch A, et al. Ecological Indicators, 2011, 11(2): 676. [本文引用:2]
[6] Ban Y F, Jacob A. IEEE Transactions on Geoscience and Remote Sensing, 2013, 51(4): 1998. [本文引用:1]
[7] WANG Xiao-na, TIAN Jin-yan, LI Xiao-juan, et al(王小娜, 田金炎, 李小娟, ). National Remote Sensing Bulletin(遥感学报), 2022, 26(2): 299. [本文引用:2]
[8] Gorelick N, Hancher M, Dixon M, et al. Remote Sensing of Environment, 2017, 202: 18. [本文引用:1]
[9] European Commission GHSL Data Package 2023, Publications Office of the European Union, Luxembourg, 2023, doi: 10.2760/098587. [本文引用:1]
[10] Ren H Q, Liu Y, Chang X Y, et al. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2022, 15: 7288. [本文引用:2]
[11] Chen J, Chen J, Liao A P, et al. ISPRS Journal of Photogrammetry and Remote Sensing, 2015, 103: 7. [本文引用:6]
[12] Chen X H, Cao X, Liao A P, et al. Science China Earth Sciences, 2016, 59(12): 2295. [本文引用:1]
[13] Nery T, Sadler R, Solis-Aulestia M, et al. Proceedings of 2016 IEEE International Geoscience and Remote Sensing Symposium (IGARSS). Beijing: IEEE, 2016: 5165. [本文引用:2]
[14] ZHANG Yi-li, LI Xiu-bin, FU Xiao-feng, et al(张镱锂, 李秀彬, 傅小锋, ). Acta Geographica Sinica(地理学报), 2000, 55(4): 395. [本文引用:1]
[15] NIE Yu, YANG Yan-min, WANG Yi-hang, et al(聂宇, 杨彦敏, 王一航, ). Acta Ecologica Sinica(生态学报), 2022, 42(6): 2202. [本文引用:1]
[16] WANG Hao, LU Shan-long, WU Bing-fang, et al(王浩, 卢善龙, 吴炳方, ). Advances in Earth Science(地球科学进展), 2013, 28(3): 327. [本文引用:1]
[17] Shao Z F, Cheng T, Fu H Y, et al. Remote Sensing, 2023, 15(10): 2562. [本文引用:2]
[18] LIU Tong, REN Hong-rui(刘通, 任鸿瑞). Transactions of the Chinese Society of Agricultural Engineering(农业工程学报), 2022, 38(12): 189. [本文引用:1]
[19] WANG Chao, KAN Ai-ke, ZENG Ye-long, et al(王超, 阚瑷珂, 曾业隆, ). Acta Geographica Sinica(地理学报), 2019, 74(4): 664. [本文引用:1]
[20] LI Feng, ZHANG Xiao-bo, LIAO Shun-bao, et al(李峰, 张晓博, 廖顺宝, ). Bulletin of Surveying and Mapping(测绘通报), 2020, (9): 89. [本文引用:2]
[21] Zhuo L, Zheng J, Zhang X F, et al. International Journal of Remote Sensing, 2015, 36(16): 4114. [本文引用:2]
[22] Zhang Q L, Seto K C. Remote Sensing of Environment, 2011, 115(9): 2320. [本文引用:1]
[23] Kalnay E, Cai M. Nature, 2003, 423: 528. [本文引用:1]
[24] de Leeuw J, Jia H, Yang L, et al. International Journal of Remote Sensing, 2006, 27(1): 223. [本文引用:1]
[25] Cortes C, Vapnik V. Machine Learning, 1995, 20: 273. [本文引用:1]
[26] Breiman L. Machine Learning, 2001, 45: 5. [本文引用:1]
[27] WANG Meng, ZHANG Xin-chang, WANG Jia-yao, et al(王猛, 张新长, 王家耀, ). Acta Geodaetica et Cartographica Sinica(测绘学报), 2020, 49(2): 235. [本文引用:1]
[28] DU Shang-hai, GU Cheng-ke, ZHANG Wen-jing(杜尚海, 古成科, 张文静). China Environmental Science(中国环境科学), 2022, 42(9): 4285. [本文引用:1]
[29] GU Hai-yan, YAN Li, LI Hai-tao, et al(顾海燕, 闫利, 李海涛, ). Geomatics and Information Science of Wuhan University(武汉大学学报·信息科学版), 2016, 41(2): 228. [本文引用:1]
[30] Achanta R, Shaji A, Smith K, et al. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2012, 34(11): 2274. [本文引用:3]
[31] Tassi A, Vizzari M. Remote Sensing, 2020, 12(22): 3776. [本文引用:1]
[32] Duro D C, Franklin S E, Dubé M G. Remote Sensing of Environment, 2012, 118: 259. [本文引用:1]
[33] Gong P, Liu H, Zhang M N, et al. Science Bulletin, 2019, 64(6): 370. [本文引用:1]
[34] Zhang X, Liu L Y, Zhao T T, et al. Earth System Science Data, 2022, 14(4): 1831. [本文引用:1]