基于半监督光学分类的白洋淀叶绿素a浓度反演方法
陈雯玥1,2, 赵起超1,2,*, 杨秀峰1,2, 韩宝辉1,2,3, 张雨晴1,2
1.北华航天工业学院遥感信息工程学院, 河北 廊坊 065000
2.河北省航天遥感信息处理与应用协同创新中心, 河北 廊坊 065000
3.河北省激光研究所, 河北 石家庄 050000
*通讯作者 e-mail: rs_zhao@nciae.edu.cn

作者简介: 陈雯玥,女, 2000年生,北华航天工业学院遥感信息工程学院硕士研究生 e-mail: cwy0102@stumail.nciae.edu.cn

摘要

利用遥感技术反演叶绿素a浓度(Chlorophyll-a, Chl-a)被认为是实现水体富营养化监测的有效途径。 由于内陆水体光学性质复杂且存在较大时空分异性, 单一的反演模型难以准确反演Chl-a浓度, 基于水体光学分类结果进行针对性建模反演是内陆水体Chl-a反演的重要技术方法之一。 以白洋淀为研究区, 以实测反射光谱和Chl-a浓度为数据源, 提出一种基于半监督光学分类的反演方法。 首先, 为确保分类后各类别样本数量足以支持反演模型的构建, 按照7∶1的比例对样本进行划分建模集和验证集。 通过多种光谱指数及摩尔投票算法选取出白洋淀具有代表性的标记样本。 其次, 选取模糊C均值聚类算法和随机森林算法构建半监督分类器, 基于获取的代表性标记样本, 进一步挖掘未标记样本中的潜在信息, 提高未标记样本的分类精度。 最后, 针对各水体类型分别建立反演模型, 计算各水体类型的质心光谱, 利用距离权重进行混合加权获取最终反演结果。 结果表明, 白洋淀水体可根据光谱特征分为浮游植物主导型、 中间型和悬浮物主导型, 不同类型水体具有较为明显的光学性质差异, 根据光学分类结果可针对性选择最优反演模型, 提升反演精度。 与传统的光学分类策略相比, 本方法表现最佳, 其平均相对误差、 均方根误差和平均绝对误差均有所下降, 能更加准确的反演Chl-a浓度(MRE=0.10, RMSE=0.126 μg·L-1, MAE=0.106 μg·L-1)。 此外, 应用ZY01-02E影像数据进行Chl-a反演, 能够有效揭示Chl-a浓度的空间分布状况。 该方法展现出在水体富营养化监测中的应用潜力, 也为内陆水体Chl-a浓度的遥感反演提供了新思路。

关键词: 半监督分类; 水体光学类型; 叶绿素a; 白洋淀
中图分类号:TP79 文献标志码:A
Estimation Approach of Chlorophyll-a Concentration in Baiyangdian Based on Semi-Supervised Optical Classification
CHEN Wen-yue1,2, ZHAO Qi-chao1,2,*, YANG Xiu-feng1,2, HAN Bao-hui1,2,3, ZHANG Yu-qing1,2
1. North China Institute of Aerospace Engineering, Institute of Remote Sensing Information Engineering, Langfang 065000, China
2. Hebei Aerospace Remote Sensing Information Processing and Application Collaborative Innovation Center, Langfang 065000, China
3. Hebei Institute of Laser, Shijiazhuang 050000, China
*Corresponding author
Abstract

The estimation of Chlorophyll-a concentration (Chl-a) using remote sensing technology is considered an effective way to monitor eutrophication in water bodies. Due to the complexity of the optical properties of inland water bodies and the existence of large spatial and temporal variability, it is difficult for a single estimation model to accurately estimate Chl-a concentration, and targeted modelling estimation based on the results of the optical classification of water bodies is one of the most important technological approaches for inland water body Chl-a inversion. In this study, Baiyangdian is taken as the study area, and a semi-supervised optical classification-based estimation method is proposed using the measured reflectance spectra and Chl-a concentration as the data source. First, to ensure that the number of samples in each category after classification is sufficient to support the construction of the estimation model, this study divides the samples into modelling set and validation set according to the ratio of 7∶1. Representative labelled samples of Baiyangdian were selected by multiple spectral indices and Moore's voting algorithm. Secondly, the fuzzy C-mean clustering algorithm and random forest algorithm are selected to construct a semi-supervised classifier, based on the representative labelled samples obtained, to further explore the potential information in the unlabelled samples and improve the classification accuracy of the unlabelled samples. Finally, the estimation models were established for each water type, the centre-of-mass spectra of each water type were calculated, and the final estimation results were obtained by hybrid-weighting using distance weights. The results show that Baiyangdian water bodies can be classified into phytoplankton-dominated, intermediate and suspended matter-dominated according to the spectral characteristics, and different types of water bodies have obvious differences in optical properties, which can be used to select the optimal estimation model and improve the estimation accuracy according to the optical classification results. Compared with the traditional optical classification strategy, the method proposed in this study performed the best, with a decrease in the mean relative error, root mean square error and mean absolute error, and was able to estimate Chl-a concentration more accurately (MRE=0.10, RMSE=0.126 μg·L-1, MAE=0.106 μg·L-1). In addition, applying ZY01-02E image data for Chl-a estimation in this study can effectively reveal the spatial distribution of Chl-a concentration. This method demonstrates the potential for application in eutrophication monitoring of water bodies, and also provides a new idea for remote sensing estimation of Chl-a concentration in inland water bodies.

Keyword: Semi-supervised classification; Optical type of water; Chlorophyll-a; Baiyangdian
引言

内陆水体(湖泊、 河流等)作为陆地的重要组成部分, 发挥着不可或缺的生态和社会功能。 近年来, 随着城市化进程的加快和人类活动的增加, 内陆水体面临着不同程度的富营养化问题[1]。 Chl-a广泛存在于浮游植物之中, 不仅反映了水体中浮游植物的光合作用水平, 而且也是评估水体水质状况的重要指标[2, 3]。 因此, 监测Chl-a浓度对于评估水体富营养化程度、 保证流域生态可持续开发利用具有重要意义[4]

内陆水体光学性质的高度动态性和多样性, 传统的手工采样检测方法, 其采样点位分布离散, 难以有效表征水体Chl-a浓度的时空变化。 遥感技术有监测范围广、 时效性强、 成本低的特点[5], 在监测Chl-a浓度方面展现出显著优势。 然而, 由于内陆水体受气候变化和人类活动的影响, 通常会受到浮游植物、 悬浮物和有色溶解有机物(colored dissolved organic matter, CDOM)等多种因素的交互作用[6], 使其光学性质变得更加复杂, 仅依赖单一的遥感反演模型难以准确反演Chl-a浓度。 针对这一问题, 许多学者提出基于水体光学性质分类的反演策略, 可以有效提升反演精度[7]。 水体分类主要根据不同水体类型表现出的不同生物光学特征, 将具有相似光学特性的水体划分为一类, 并为各类型水体分别构建合适的反演模型[6, 8]。 通常根据水体组分的光谱特征进行分类, 主要分为浮游植物主导型、 浮游植物和悬浮物共同主导型和悬浮物主导型三类水体。

国内外学者针对水体分类反演策略进行了广泛研究。 目前, 基于水体分类的反演方法主要有无监督分类和基于光学拓征的阈值分割[9]。 无监督分类主要通过度量水体光谱相似度对水体按照光学性质差异进行划分, Shi等[10]利用层次聚类算法将相似光学特征的水域分类建立反演模型, 证明基于水体分类的方法在内陆水体更具通用性; 张方方等[11]基于K均值聚类算法实现对高分一号数据的软分类, 经验证算法精度较高, 效果较好。 但无监督分类通常在缺乏先验知识的情况下, 仅依赖相似度进行分类, 导致其分类结果的可解释性较差, 可能存在与实际情况不相符的情况。 基于光学特征的阈值分割方法主要通过测量水体固有光学量、 光谱反射率等, 通过构造光谱指数来对水体进行阈值分割, Dang等[12]利用高分辨率卫星数据建立基于光谱特征分类的中低营养水域混合Chl-a反演方法, 提高了中低营养水体Chl-a反演的准确性; Jiang等[13]基于浮游植物色素吸收和非色素吸收系数比值(aph(443)/ad(443)), 建立适用于Chl-a浓度变化大的分类方法; Le等[14]根据光谱的斜率特征建立水体分类方法, 证明光学分类能够提高光学复杂水域中反演Chl-a的准确性; Sun等[15]建立基于红波段的NTD675水体分类方法, 并构建特定类型反演模型, 通过与未分类反演模型对比, 证明类型特异性模型与NTD675水体分类方法结合能提升光学性质复杂的水域的Chl-a反演精度。 该方法一是由于固有光学量获取困难, 二是由于内陆水体光学性质具有明显的区域性、 季节性变化, 这使得在光谱特征选择及阈值确定过程中存在不确定性, 在迁移应用到其他研究区时容易导致精度下降。 因此, 如何根据研究区水体自身光学特性, 在先验知识有效指导的情况下进行光学分类, 成为提升Chl-a反演精度的关键问题。

针对上述问题, 以白洋淀为研究区, 提出一种基于半监督光学分类的Chl-a反演策略。 参考前人提出的多种光学特征, 通过摩尔投票方法标记出具有代表性水体光学类型样本, 用以指导后续的光学分类。 在此基础上, 将模糊C均值算法(fuzzy C-means algorithm, FCM)与随机森林算法(random forest, RF)相结合, 构建半监督分类器, 在标记样本指导下进一步挖掘未标记样本中的潜在信息, 实现水体光学分类。 最后根据分类结果, 为不同水体类型建立优选模型, 并利用距离权重混合加权得到最终反演结果。

1 实验部分
1.1 研究区及数据采集

白洋淀(115° 45'E— 116° 07'E, 38° 44'N— 38° 59'N)是华北地区最大的湿地生态系统, 具有丰富的生物多样性和重要的生态功能。 由于所处地理位置独特, 白洋淀不仅为众多水生生物提供了栖息地, 还在调节区域水循环、 维护生物多样性以及改善气候条件等方面发挥重要作用。 近年来, 白洋淀水质受到周边农业、 城市发展及人类活动等影响, 存在一定程度的水体富营养化现象, 威胁水域的生态健康。 因此, 有必要监测水域内Chl-a浓度, 以有效监测水体营养状态。 白洋淀地理位置如图1所示。

图1 研究区的空间分布和采样点的具体位置
(a): 河北省; (b): 雄安新区; (c): 白洋淀
Fig.1 The spatial distribution of the study area and the specific locations of sampling sites
(a): Hebei Province; (b): Xiong'an New Area; (c): Baiyangdian

在2021年、 2023年期间进行了7次采样, 同时共采集研究区87个水样进行水质参数测定(表1)。 研究区采样点分布如图1。 水体反射光谱采集参考水面以上测量法, 使用ASD Hand-Held2手持式地物光谱仪。 采样时段为北京时间10:00— 15:00; 采样时天气晴朗, 水面平静; 每个采样点进行15次测量[16]

表1 采样点位置及生物光学特征的信息, 包括Chl-a和TSS的最大值、 最小值和平均值 Table 1 Information on the location of sampling points and bio-optical characteristics, including maximum, minimum and mean values of Chl-a and total suspended solids (TSS)

图2 白洋淀采集的遥感反射率数据Fig.2 Remote sensing reflectance data collected in Baiyangdian

同步在光谱测量点位水面下20~30 cm处采集水样。 使用实验室L5S紫外可见分光光度计测定样本的Chl-a浓度[17]。 在本研究区中, Chl-a浓度范围为1.990~27.000 μg· L-1, 平均浓度为11.316 μg· L-1

1.2 基于光学特征的半监督算法

参考前人提出的比值特征[12]、 CI675[13]、 斜率特征[14]和NTD675[15]光谱指数和层次聚类[10]共5种方法, 对同一数据集进行了分类操作, 每种方法将样本分为类型1浮游植物主导水体, 类型2浮游植物和悬浮物共同主导水体(中间型)和类型3悬浮物主导型这三类。 将各分类结果结合摩尔投票选取标记样本。 某一样本若得票数≥ 3则将其对应的分类结果作为类别标签, 该样本即为标记样本; 反之, 该样本不作为标记样本。 通过多种方法共同决策, 来降低由于区域性、 季节性变化带来的影响, 将得到分歧最小的标记样本, 作为后续分类的先验知识。

采用基于聚类分析的半监督分类算法[18], 采用FCM进行聚类分析, 并使用RF作为分类器。 在半监督分类过程中, 标记样本用于训练RF分类器。 FCM计算未标记样本在不同类别中的隶属度。 之后, 由训练好的分类器对高隶属度的未标记样本进行分类, 将高置信度的未标记数据及对应的分类标签添加至标记数据集中。 FCM对剩余的未标记数据进行重新聚类, 并利用标记样本重新训练分类器。 重复此过程, 为所有未标记样本确定水体类别标签。 具体算法流程如下, 半监督光学分类单次迭代流程如图3所示。

表2 半监督分类算法流程 Table 2 Semi-supervised classification algorithm process

图3 半监督光学分类单次迭代流程图Fig.3 The process of semi-supervised classification for single iteration

1.3 Chl-a反演模型构建

选取了波段比值模型(包括蓝/绿、 红/绿、 近红/红)、 NDCI模型和三波段模型来进行建模反演。 由于水体中Chl-a的自然分布通常被认为是对数正态分布, 因此Chl-a算法采用对数变换数据。

logcChlaRrs(λ1)Rrs(λ2)(1)

logcChlaRrs(708)-Rrs665Rrs(708)+Rrs665(2)

logcChla1Rrs(λ3)-1Rrs(λ4)×Rrs(λ5)(3)

其中, logcChl-a为实测Chl-a浓度取对数; Rrs(λ i)为高光谱在波段λ i处的反射值。 针对3种不同类型的水体建立合适的反演模型, 并采用张方方等[11]的方法构建混合加权反演模型。 根据半监督光学分类后的结果, 计算各水体类型的质心光谱, 利用距离权重进行混合加权获取最终反演结果, 如式(4)。

C=C1×W1+C2×W2+C3×W3(4)

式中, C1C2C3分别是同一样本在3种水体类型反演模型的反演结果, W1W2W3分别是根据光谱角度距离计算的同一样本所占3种水体类型的权重。

2 结果与讨论
2.1 基于光谱数据的半监督光学分类

利用半监督光学分类算法将数据集中的76个样本光谱分为3类。 图4和图5分别展示了标记样本及分类后3个水体类型光谱以及对应的质心光谱。 在整个光谱曲线中, 紫光、 蓝光和红外波段反射率表现为低反射率, 光谱整体表现为两边低、 中间高的特性。 蓝光波段反射率低主要是由于浮游植物、 悬浮物及CDOM等在该波段的高吸收特性; 由于纯水高吸收所造成红外波段反射率低。 3种水体类型反射光谱之间的差异归因于浮游植物和悬浮沉积物的吸收对总吸收的不同贡献。 各水体组分的浓度不同, 反射峰的个数、 位置以及相对大小均有所不同。

图4 标记样本光谱
(a): 类型1的光谱; (b): 类型2的光谱; (c): 类型3的光谱; (d): 三种水体类型的质心光谱
Fig.4 Labeled spectral samples
(a): Spectra for Type 1; (b): Spectra for Type 2; (c): Spectra for Type 3; (d): Centroid spectra for three types of water

图5 半监督光学分类后的样本光谱
(a): 类型1的光谱; (b): 类型2的光谱; (c): 类型3的光谱; (d): 三种水体类型的质心光谱
Fig.5 Spectra of samples after post semi-supervised optical classification
(a): Spectra for Type 1; (b): Spectra for Type 2; (c): Spectra for Type 3; (d): Centroid spectra for three types of water

类型1有22条样本[图5(a)]。 其主要特征为700 nm附近具有因浮游植物色素所造成的明显反射峰, 这是由于叶绿素荧光作用产生; 在575 nm具有明显的反射峰, 这是由于藻类细胞壁散射和相对较低的吸收共同导致; 670 nm具有明显的吸收谷, 这是由于叶绿素在红波段的强吸收。 上述特征光谱表明该类水体光学活性主要由藻类色素影响, 印证了本工作光学分类结果的正确性。

类型2[图5(b)]与类型1的光谱特征相似, 也出现了一定的藻类色素特征光谱, 但是特征的强度有所减弱, 例如, 类型2在700 nm附近波峰较低, 670 nm处的波谷较浅。 这可能是由于该类水体同时受到藻类色素和悬浮物的共同影响。

类型3[图5(c)]样本数量最少(N=15)。 与其他两类相比, 类型3在575、 670和700 nm附近没有出现典型的藻类色素特征光谱, 表明藻类色素的光学活性相对较低。 类型3水体光谱呈现双峰特征, 在520~620 nm为形状较宽的反射峰, 并且该宽峰反射率左侧为相对高值; 在770 nm附近表现为第二个反射峰, 其形状较窄。 这种双峰特征与前人观察的高浑浊水体较为一致[19], 暗示类型3水体光学活性主要由悬浮物影响。 除此之外, 类型3在近红外区域光谱不具有明显的反射峰, 这也是由于悬浮物发生了较强的后向散射, 掩盖了浮游植物的吸收特性。 图5(d)质心光谱能够清晰的展现出3种不同水体类型的差异。

半监督光学分类前后各水体类型质心光谱的光谱特征和变化趋势基本一致。 但半监督光学分类前后各类型的光谱反射率值发生了细微的变化。 在半监督光学分类之后, 悬浮物含量相对减少, 导致了水体的浑浊度减轻, 散射作用减少。 类型2和类型3的光谱反射率值降低。 在半监督光学分类过程中, 不断引入的光谱具有多样性和覆盖范围广的特点。 这使得多样的光谱信息对质心光谱反射率值产生了影响。 虽然半监督光学分类前后的质心光谱反射率值发生了变化, 但是半监督光学分类通过深度挖掘数据集的内在信息, 确保了质心光谱更贴近研究区水体的实际光学特性。

图6 标记样本的权重Fig.6 The weight of labeled samples

根据光谱角度距离, 计算标记样本与半监督光学分类后的质心光谱之间的权重。 每个标记样本类别占比最高的权重均在40%以上, 且与其摩尔投票确定的类别能够相互对应。 虽然半监督光学分类前后质心光谱反射率值发生变化, 但各类别的光谱特征未发生改变, 也能准确的将水体样本进行软分类。

2.2 候选反演模型及精度评估

内陆水体光学性质复杂, 难以统一应用一种Chl-a反演模型进行反演。 通过水体分类, 根据各水体类型的特性能够构建更为精准的反演方法。 比较了几种Chl-a反演模型在不同类型水体中的性能。 基于蓝-绿波段的Chl-a反演模型在类型1水体表现出色, 这与其适用于以浮游植物为主的水域相对应。 对于类型2的水体, NDCI反演模型表现效果较好。 该模型通过选择665和708 nm两个波段, 有效避免了悬浮物和CDOM在较短波长下对光谱反射的干扰。 同时, 通过归一化处理, 进一步消除了反射率、 季节和方位角差异带来的不确定性。 与蓝绿比值模型相比, NDCI模型显著降低了其他水体组分的影响, 从而提高了Chl-a反演的准确性。 对于类型3水体, 基于红-绿波段的Chl-a反演模型表现最佳。 三波段反演模型因其可解释的物理机理为基础, 在波段选择上尽可能减少悬浮物和CDOM的干扰。 在类型2和类型3水体中, 三波段反演模型均表现较好。

图7 (a) 类型1样本的蓝-绿波段模型反演结果; (b) 类型2样本的NDCI模型反演结果; (c) 类型3样本的红-绿波段模型反演结果; (d) 全部样本的混合加权模型反演结果Fig.7 (a) The Blue-Green modeling result of the Type 1 samples; (b) The NDCI modeling result of the Type 2 samples; (c) The Red-Green modeling result of the Type 3 samples; (d) The hybrid-weighted modeling result of the all samples

表3 各水体类型的算法对比结果, MRE和RMSE单位为log10 Table 3 Comparative results of the algorithms for each water type, MRE and RMSE given in log10

根据相似光学性质样本建立的模型精度较差, 反演效果不好。 因此, 建立了混合加权模型。 与单模型反演结果相比, 混合加权模型的预测值与实测值之间的匹配点更贴近1∶ 1线, 呈现出较高的相关性(Pearson r=0.86); R2提升至0.74, 反演精度得到提升。

2.3 Chl-a反演模型对比

为进一步检验基于半监督光学分类的反演方法的精度, 使用白洋淀独立的实测数据(即未参与分类过程与模型开发的数据)进行验证[图8(a)]。 结果表明了所有样本的反演误差与基于其他分类方法反演误差对比, 各评价指标均处在最低(MRE=0.10, MAE=0.106 μg· L-1, RMSE=0.126 μg· L-1); 预测值与实测值之间存在较高的相关性(Pearson r=0.82)。 这一结果有力地证明了本方法的可行性。

图8 基于不同光学分类方法的验证结果
(a): 基于半监督光学分类的验证结果; (b): 基于K均值分类的验证结果; (c): 基于斜率特征分类的验证结果; (d): 基于NTD675分类的验证结果
Fig.8 Validation results based on different optical classification methods
(a): Validation results of the semi-supervised optical classification method; (b): Validation results of the K-means classification method; (c): Validation results of the slopes classification method; (d): Validation results of the NTD675 classification method

选取了K-means聚类、 NTD675指数分类和斜率特征分类等3种光学分类反演策略进行对比。 基于K-means聚类的反演结果精度最低[图8(b)], 部分验证点预测值与真实值的绝对误差达到0.647 μg· L-1, 这表明利用K-means聚类进行分类反演存在局限性。 Chl-a/TSS大(均值为4.222× 10-3)的样本预测值呈现出低估现象, 而Chl-a/TSS小(均值为2.001× 10-3)的样本预测值呈现出高估现象, 由于K-means聚类在没有先验知识的辅助下, 仅用光谱之间的相似度进行分类, 导致对样本的区分能力不足, 无法捕捉Chl-a浓度的复杂变化。

在基于斜率特征阈值分割的反演结果中[图8(c)], 大部分验证点预测值与真实值的绝对误差在0.0103~0.099 μg· L-1范围内, 表明该方法整体上具有相对较高的准确性。 然而, 个别验证点的预测误差偏大(绝对误差分别为0.477和1.075 μg· L-1), 这反映出该方法在特定情况下存在局限性。 造成这一现象的原因可能包括两个方面: (1)该分类过程中主要采用绿光、 近红外与650 nm波长的光谱斜率特征, 这一特征可能不是所有情况下都适用的最佳特征, 对于Chl-a浓度较大的样本分类结果可能存在偏差; (2)阈值的选择可能对分类结果产生影响, 阈值设定不当, 可能导致阈值边缘样本被错误分类。 分类结果的误差间接影响反演结果精度下降。 与基于斜率特征的反演方法对比, 基于NTD675的反演方法精度较好[图8(d)], 各项指标均有所降低(RMSE降低了0.176 μg· L-1, MRE为2%, MAE为0.038 μg· L-1)。 不同光谱特征在同一水域表现出不同敏感性, 这种差异对分类结果产生重要影响, 间接影响反演结果整体精度。

本方法的反演结果精度表现最优(表4), 各项指标均低于基于NTD675分类反演方法, RMSE降低0.056 μg· L-1, MRE降低3%, MAE降低0.04 μg· L-1。 与基于K-means聚类反演方法对比, RMSE降低0.161 μg· L-1, MRE降低17%, MAE降低0.125 μg· L-1。 半监督光学分类方法利用代表性的标记样本作为辅助, 结合未标记样本, 不断优化模型, 有效避免了无监督聚类和基于光学特征阈值分割的局限性, 提高了分类准确性, 间接提升反演精度。

表4 不同反演模型验证集结果对比 Table 4 Comparison of results of validation sets of different estimation models

选取了随机森林等三种机器学习模型进行不分类反演对比, 验证结果表明本方法精度明显好于3种机器学习模型, 以MRE为例, 基于半监督光学分类的混合加权反演模型为10%, 而3种机器学习模型均在15%以上。 机器学习模型存在一定的过拟合, 验证集各项精度指标明显下降; 而本模型在训练集和验证集上精度相当, 这是因为本文是从经典的半分析模型中进行优选, 并进行了混合加权反演, 在建模过程中具有更好的可解释性, 模型泛化能力也更好。

图9 机器学习模型的验证结果
(a): 随机森林; (b): 支持向量机; (c): XGBoost
Fig.9 Validation results of the machine learning models
(a): Random forest; (b): Support vector machine; (c): XGBoost

2.4 空间分布

针对白洋淀三种水体类型, 采用波段比值、 NDCI、 三波段模型建立反演模型来实现Chl-a浓度的反演。 分别利用(b11/b18)、 [(b39-b34)/ (b39+b34)]、 [(1/b34-1/b37)× b35]做反演变量, 与三个类别的数据分别建立指数模型, 三个类型对应的Chl-a反演模型如下:

类型1:

cChla=10-0.366×(b11b18)2+1.566×(b11b18)-0.1873

类型2:

cChla=100.5912×(b39-b34b39+b34)2-0.1921×(b39-b34b39+b34)+1.063

类型3:

cChla=100.3072×[(1b34-1b37)×b45]-0.1873

基于大气校正后的ZY01-02E白洋淀高光谱数据, 首先, 利用分类结果计算ZY01-02E数据的质心光谱, 利用光谱角度距离进行匹配, 并转化为权重, 获取每个像元的各类别权重, 最后结合混合加权反演模型预测, 获取白洋淀水体Chl-a浓度的空间分布图(图10)。 由Chl-a反演结果可知, 当日白洋淀Chl-a浓度呈现淀中心地区较高(10~16 μg· L-1), 其四周逐渐降低的分布趋势; 西南部最高, Chl-a浓度分布在大多10~32 μg· L-1之间, 存在一定的富营养化问题。

图10 基于混合加权模型的白洋淀Chl-a浓度反演结果空间分布(2023年5月22日)
(a): 假彩色影像; (b): Chl-a 反演结果
Fig.10 Estimated spatial distribution of Chl-a concentration in Baiyangdian based on hybrid-weighted model on 22 May 2023
(a): False color image; (b): The estimation results of Chl-a

造成该现象可能原因为白洋淀的入淀河流主要位于白洋淀的西、 南部, 岸边农业面源污染、 生活生产污水及工业废水等随河流汇入白洋淀, 为浮游植物的生长提供了条件, 导致西南地区的Chl-a浓度高; 白洋淀北部为主要旅游景区, 中心地区村庄分布密集, 人类生产生活活动剧烈, 水体营养物质增加, Chl-a浓度相对较高。

3 结论

基于白洋淀实测参数及卫星数据ZY01-02E, 在实测光谱分类的基础上实现ZY01-02E影像光谱分类及Chl-a浓度的反演, 进而分析与探讨白洋淀Chl-a浓度的空间分布。 研究结果表明:

(1)利用半监督光学分类方法, 能够明显区别出不同光学特性水体光谱的形状特征, 从而实现ZY01-02E影像的分类, 类别1— 类别3分别为浮游植物主导型、 浮游植物和悬浮物共同主导型、 悬浮物主导型;

(2)针对三种类别分别建立对应的反演模型, 为提升反演精度, 构建了混合加权反演模型。 混合加权反演模型预测值与实测值的匹配点更贴近1∶ 1线, 呈现出较高的相关性(Pearson r=0.86), 有效减少了预测误差;

(3)与基于其他光学分类反演方法对比, 基于半监督光学分类反演方法具有较高的精度。 本方法的验证集RMSE=0.126 μg· L-1, MRE=10%, MAE=0.106 μg· L-1, 表明模型能有效对内陆二类水体进行分类, 避免了无监督聚类和基于光学特征阈值分割难以有效挖掘数据内部信息的局限性, 具有较高的分类精度, 能准确反映水体状态; 将分类模型应用到ZY01-02E白洋淀影像上, 可较好的显示出白洋淀水体Chl-a浓度空间分布。

本研究提出半监督光学分类反演算法, 以白洋淀为研究区, 采用具有代表性的标记样本作为辅助, 结合未标记样本不断优化模型, 从而实现更高的分类精度和泛化能力。 同时, 也为迁移至其他内陆水体应用奠定了基础, 促进对内陆水体生态状况的全面评估和监测。

参考文献
[1] LI Na, LI Jia-xi, LI Guo-wen, et al(李娜, 黎佳茜, 李国文, ). Acta Hydrobiologica Sinica(水生生物学报), 2018, 42(4): 854. [本文引用:1]
[2] BAO Ying, TIAN Qing-jiu, CHEN Min, et al(包颖, 田庆久, 陈旻, ). Spectroscopy and Spectral Analysis(光谱学与光谱分析), 2016, 36(8): 2562. [本文引用:1]
[3] Cui T W, Zhang J, Wang K, et al. ISPRS Journal of Photogrammetry and Remote Sensing, 2020, 163: 187. [本文引用:1]
[4] LUO Jie-chun-yi, QIN Long-jun, MAO Peng, et al(罗婕纯一, 秦龙君, 毛鹏, ). Remote Sensing Technology and Application(遥感技术与应用), 2021, 36(3): 473. [本文引用:1]
[5] KUANG Run-yuan, ZHAO Yan-fu, LUO Wei, et al(况润元, 赵艳福, 罗卫, ). Journal of China Hydrology(水文), 2017, 37(6): 23. [本文引用:1]
[6] LI Yun-mei, ZHAO Huan, BI Shun, et al(李云梅, 赵焕, 毕顺, ). National Remote Sensing Bulletin(遥感学报), 2022, 26(1): 19. [本文引用:2]
[7] FENG Chi, JIN Qi, WANG Yan-nan, et al(冯驰, 金琦, 王艳楠, ). Environmental Science(环境科学), 2015, 36(5): 1557. [本文引用:1]
[8] SONG Zi-hao, KUANG Run-yuan(宋子豪, 况润元). Jiangxi Hydraulic Science & Technology(江西水利科技), 2021, 47(1): 70. [本文引用:1]
[9] Zhang F, Li J, Shen Q, et al. International Journal of Applied Earth Observation and Geoinformation, 2019, 74: 138. [本文引用:1]
[10] Shi K, Li Y, Li L, et al. Science of the Total Environment, 2013, 444: 1. [本文引用:2]
[11] ZHANG Fang-fang, LI Jun-sheng, WANG Chao, et al(张方方, 李俊生, 王超, ). National Remote Sensing Bulletin(遥感学报), 2023, 27(3): 769. [本文引用:2]
[12] Dang X, Du J, Wang C, et al. Remote Sensing, 2023, 15(8): 2209. [本文引用:2]
[13] Jiang G, Loiselle S A, Yang D, et al. Remote Sensing of Environment, 2020, 241: 111735. [本文引用:2]
[14] Le C, Li Y, Zha Y, et al. Remote Sensing of Environment: An Interdisciplinary Journal, 2011, 115(2): 725. [本文引用:2]
[15] Sun D, Hu C, Qiu Z, et al. Remote Sensing of Environment, 2014, 155: 289. [本文引用:2]
[16] HAN Bao-hui, ZHAO Qi-chao, CHANG Rong, et al(韩宝辉, 赵起超, 常荣, ). Journal of Geo-Information Science(地球信息科学学报), 2023, 25(9): 1882. [本文引用:1]
[17] Lichtenthaler H K, Buschmann C. Current Protocols in Food Analytical Chemistry, John Wiley & Sons, Inc. , 2001. [本文引用:1]
[18] Gan H, Sang N, Huang R, et al. Neurocomputing, 2013, 101: 290. [本文引用:1]
[19] KUANG Run-yuan, LUO Wei, ZHANG Meng(况润元, 罗卫, 张萌). Resources and Environment in the Yangtze Basin(长江流域资源与环境), 2015, 24(5): 773. [本文引用:1]