星载激光雷达云和气溶胶分类反演算法研究
李明阳1,2, 范萌1,*, 陶金花1, 苏林1, 吴桐1,3, 陈良富1, 张自力4
1. 中国科学院遥感与数字地球研究所遥感科学国家重点实验室, 北京 100101
2. 中国科学院大学遥感与数字地球研究所, 北京 100049
3. 山东科技大学测绘科学与工程学院, 山东 青岛 266510
4. 浙江省环境监测中心, 浙江 杭州 310007
*通讯联系人 E-mail: fanmeng@radi.ac.cn

作者简介: 李明阳, 1990年生, 中国科学院遥感与数字地球研究所遥感科学国家重点实验室硕士研究生 E-mail: limy2015@radi.ac.cn

摘要

激光探测对于获取云和气溶胶的垂直廓线, 研究大气中云和气溶胶的垂直分布特征以及对全球气候变化的影响意义重大。 而星载大气激光雷达云气溶胶分类算法的研究, 对于激光雷达数据的参数反演及应用极为重要。 针对激光条件下探测的云和气溶胶特有的光学信息和空间分布, 结合概率统计与机器学习算法, 提出了一种对于云/气溶胶、 云相态及气溶胶子类型识别的分类算法, 实现了星载激光雷达的大气特征层快速、 有效分类。 算法采用中国地区2016年CALIOP的观测数据作为样本数据, 主要由三部分组成: (1)基于激光探测的云和气溶胶层不同的光学特性以及地理空间分布特征, 分别构建了云和气溶胶的 γ532, χ, δ, Z和lat的五维概率密度函数, 以此为基础构建云气溶胶的分类置信函数, 并基于此实现了云和气溶胶类型的反演; (2)选取支持向量机(SVM)作为随机朝向冰晶粒子(ROI)和水云分类的算法模型基础, 结合云层的 γ532, χ, δ Z和云顶温度 T的概率密度函数构建ROI, 水平朝向冰晶粒子(HOI)和水云的分类置信函数以修正SVM误分的特征层以及筛选出水云中少部分的HOI冰云,获得云相态的分类结果; (3)以各气溶胶子类型的光学以及空间分布特性为基础,采用决策树策略的气溶胶子类型识别算法实现了对气溶胶子类型的区分,完成气溶胶子类型的识别。 利用现有CALIOP观测结果作为样本数据构建分类数据库, 避免了对于地面以及航测数据的依赖, 而机器学习则大大简化了算法的实现过程, 使得云气溶胶分类更加高效。 算法结果与正交极化云气溶胶激光雷达垂直特征层分布数据(CALIPSO VFM)产品对比分析: 云层有98.51%一致性, 气溶胶有88.43%的一致性, 且白天比夜间一致性高。 对于云相态分类, 可以有效区分出水云和冰云, 其中二者水云一致性高达93.44%。 在气溶胶子类型反演结果中, 可以准确识别出大多数气溶胶特征层子类型。 霾、 沙尘以及晴空三种典型情况下的反演结果均与CALIOP VFM产品数据具有较好的一致性。 其中, 霾天的大部分煤烟型以及污染型(污染沙尘以及污染大陆)气溶胶反演结果与VFM具有较好的一致性。 沙尘天也能够获得较好的沙尘以及污染沙尘的结果。 晴空为数不多的气溶胶层也取得了较为一致的结果。 对于实现的星载大气激光雷达特征层分类算法, 针对CALIOP激光测量的云气溶胶层的分类进行了重要的改进, 在保证一定精度的基础上, 简化了算法, 提高了数据处理的效率, 在下一步工作中, 将分别构建不同时段和季节的分类模型以及提高两种不同偏振特性的冰云和气溶胶子类型的分类精度。

关键词: 星载激光雷达; 云和气溶胶分类; 概率密度函数; 支持向量机; 决策树
中图分类号:P407.5 文献标志码:A
The Space-Borne Lidar Cloud and Aerosol Classification Algorithms
LI Ming-yang1,2, FAN Meng1,*, TAO Jin-hua1, SU Lin1, WU Tong1,3, CHEN Liang-fu1, ZHANG Zi-li4
1. State Key Laboratory of Remote Sensing Science, Jointly Sponsored by Institute of Remote Sensing and Digital Earth of Chinese Academy of Sciences and Beijing Normal University, Beijing 100101, China
2. Institute of Remote Sensing and Digital Earth, University of Chinese Academy of Sciences, Beijing 100049, China
3. College of Geomatics, Shandong University of Science and Technology, Qingdao 266510, China
4. Zhejiang Environment Monitoring Centre, Hangzhou 310007, China
Abstract

LIDAR plays significant roles in monitoring the vertical distribution characteristics of clouds and aerosols and studying their impacts on the global climate change. For the space-born LIDAR, discrimination between clouds and aerosol is the first step of cloud/aerosol vertically optical property retrieve, and to a great extent, the retrieval precision depends on the accuracy of cloud and aerosol classification algorithm. Based on the optical and geographic characteristics of aerosols and clouds observed by LIDAR, in this study, the CALIOP aerosol and cloud products over China in the year of 2016 were trained as the sample sets. An effective cloud/aerosol classification algorithm was developed by combining the support vector machines (SVM) and decision tree methods. Our algorithm includes 3 parts: cloud and aerosol discrimination, ice-water cloud classification and aerosol subtype classification. (1) The cloud and aerosol were discriminated by the classification confidence functionsof 5-D probability density function (PDF) with parameters of γ532, χ, δ, Z and lat. (2) Randomly oriented ice (ROI) and water cloud were classified based onthe SVM. And by constructing the PDFs with γ532, χ, δ, Z and T, feature layers misclassified by SVM were corrected, and a small portion of the horizontally oriented ice (HOI) clouds were removed from the water clouds. (3) Based on the optical and geographic characteristics of aerosol subtypes,decision tree classification was used for the determination of aerosol subtypes. Our retrieval results showed a good agreement with the CALIOP VFM products. For the cloud and aerosol discrimination results,the consistency ratios between our retrieves and VFM products for aerosol and cloud are up to 98.51% and 88.43%,respectively. And the consistency ratios in the day are higher than those at night. For the cloud phase retrieval results, water clouds can be well separated, and the consistency ratio of water cloud between our retrieves and VFM products is as high as 93.44%. The consistency ratio of HOI is low due largely to the confusion between HOI and ROI. For the aerosol subtype classification, most aerosol subtypes could be well recognized by our algorithm. However, the consistency ratios of the mixed subtypes (e. g. polluted continental and polluted dust) between retrieval results and VFM products are relatively lower. Moreover, the cloud/aerosol, cloud phase and aerosol subtype classifications were also compared with the VFM products under three typical air conditions, i. e. haze, dust and clean. Under the haze condition, our results for most of the smoke aerosols agree quite well with the corresponding results from VFM. Under the duststorm condition, our algorithm can effectively discriminate the most of dust and polluted dust aerosols. For the clear day, our results for the few existing cloud and aerosol layers are quite consistent with the VFM results. This paper is an important improvement of the cloud and aerosol classification algorithms, which can simplify the processing and improve efficiency with satis factory accuracy. In the future work, we will build day/night and seasonal training sample sets, and consider more ice cloud phases and aerosol properties in the cloud/aerosol classification retrieval algorithm.

Keyword: Space-borne lidar; Cloud and aerosol classification; Probability density function; SVM; Decision tree classification
引 言

激光雷达是探测大气中云和气溶胶类型及时空分布的重要技术手段之一, 对于研究气候变化、 环境污染和人类健康至关重要。 相比于地基激光雷达观测, 星载激光雷达可以获取大区域范围内不同高度和类型的云、 气溶胶分布, 对于研究云和气溶胶的微物理特性、 辐射强迫效应、 污染物传输以及污染源的解析等具有不可替代的作用。 在激光雷达云和气溶胶光学参数反演中, 基于云和气溶胶类型的识别结果进而设定不同大气情况下的雷达比也是其关键步骤之一[1]。 因此, 星载激光雷达云和气溶胶类型反演算法的研究对于全球气候变化过程的认识和人类生存环境的改善有着重要的现实意义。

搭载有星载激光雷达CALIOP的CALIPSO卫星由美国国家航天局(NASA)与法国国家航天中心合作于2006年发射, 已获取了十年的全球云和气溶胶类型的垂直分布数据, 为全球气候和环境变化研究提供了重要资料[2, 3]。 目前CALIOP已超期服役, 国内外均已开始了新一代星载激光雷达的研制, 旨在持续获取全球云、 气溶胶类型和光学特性的垂直分布信息, 支持全球气候变化、 云与气溶胶相互作用等研究。 其中, 欧洲与日本计划于2018年合作发射的EARTHCARE卫星上搭载有ALID(Atmosphere Lidar)载荷[4, 5], 美国NASA计划在2020年实施的ACE(Advanced Composition Explorer)卫星发射计划也将搭载新一代激光雷达系统。 国内, 航天科技集团九院704所研制中的星载多波束激光雷达, 将作为我国首个星载激光雷达, 预计于2020年发射。 由上海光机所负责研发的具有中国自主知识产权的星载激光雷达ACDL也预计在2020年发射。

国内外基于星载激光雷达的云和气溶胶类型反演算法的研究进展如表1所示, 主要内容包括三个部分: 云/气溶胶分类、 云相态反演和气溶胶子类型反演。

表1 云/气溶胶分类算法研究进展 Table 1 The introduction of the Cloud and Aerosol Classification Algorithms

目前, 在基于CALIOP激光测量的云和气溶胶类型反演算法中, 所使用的样本都是NASA前期气溶胶观测实验得到的结果, 样本数量有限, 且对于初始信号大气特征层的判断多依赖于人为判断。 在NASA公开的CALIOP反演算法文档中, 许多参数的设定并未提及, 算法实现过程比较复杂, 而国内星载大气激光雷达的研究还处于起步阶段, 相关研究非常有限。 因此, 本工作针对中国地区, 通过直接应用现有CALIOP观测结果来选择类别明确的大气特征层作为样本数据以提高分类精度, 并将支持向量机和决策树方法引入云和气溶胶类型反演算法, 该算法可以在保证分类精度的同时降低验证样本的需求数量, 简化算法。

1 方法与数据

NASA对于CALIOP大气特征层分类以监督分类方法为基础, 根据训练样本学习分类规则, 对未知类别的样本进行分类, 即构建一个分类器尽可能准确地预测特征属性空间中每个点的类别。 用n个概率来描述包含k个特征属性的向量X=(x1, …, xk)归属于n个类别的可能性, 即

fi(X)=Pr(y=i|X)(1)

式(1)中, Pr()为概率函数, fi(X)反映了向量X属于第i类别的概率大小, 这是NASA CALIOP大气特征层分类算法的理论基础。 但在实际分类过程中, fi(X)是未知的, 只能通过训练和学习已知样本得到fi(X)的近似估计函数 f̅i(X)。 因此, 在考虑到NASA已有算法本身的局限性和计算复杂性, 提出了一种基于现有CALIOP观测结果, 结合支持向量机与决策树方法来实现云/气溶胶分类、 云相态反演、 气溶胶子类型反演的新思路。

为研究星载激光雷达在中国地区的云/气溶胶类型反演问题, 选取了中国地区2016年共3376轨CALIOP L2级5 km云/气溶胶产品。 对其中置信度绝对值为100的大气特征层作为有效特征层进行提取, 共提取到1 610 111个云特征层和270 389个气溶胶特征层。

2 云和气溶胶类型反演算法
2.1 云/气溶胶分类算法

基于云和气溶胶的γ 532, χ , δ , Z和lat五个参数的不同特点, 构建云/气溶胶的置信函数f5D来进行云和气溶胶分类, 即

f5D(γ532, χ, δ, Z, lat)=Pc(γ532, χ, δ, Z, lat)-Pa(γ532, χ, δ, Z, lat)Pc(γ532, χ, δ, Z, lat)+Pa(γ532, χ, δ, Z, lat)(2)

式(2)中, PcPa分别为云和气溶胶的概率密度函数。 f5D为置信函数, 取值范围为-1~1, 表征云或气溶胶。 云/气溶胶分类算法流程如图1所示, 具体步骤为:

图1 云/气溶胶分类算法流程图Fig.1 Flowchart of cloud/aerosol discrimination algorithm

(1)采用2016年CALIOP的云/气溶胶数据, 构建云和气溶胶分类置信函数[式(2)];

(2)对于CALIOP激光雷达探测到的大气特征层, 获取并计算其光学参数(γ 532, χ , δ )和地理参数(Z, lat);

(3)采用对流层高度辅助数据, 提取对流层内大气特征层进行分类计算;

(4)利用提取的特征参数计算f5D, 若函数值小于0, 则分类为气溶胶, 函数值大于0, 则分类为云, 函数值为0, 则类别不确定, 并取函数值(× 100%)作为特征层类别的置信度CAD_Score。

2.2 云相态反演算法

基于2016年CALIPSO分类产品, 引入支持向量机方法(SVM), 其优点在于以直接观测数据为样本, 实现云相态的高效分类。

采用1 339 201个云特征层数据(1 080 496个ROI特征层, 8 777个HOI特征层, 249 928个水云特征层)[图2(a)], 研究不同相态云的δ γ 532之间的关系[图2(b)], ROI和水云呈现出明显的线性可分性, HOI则相对分散地夹杂二者之间。 基于此, 选用线性核函数的SVM对云相态进行反演。

图2 (a)云特征层的相态数量统计, (b)不同相态云的层积分退偏比与层积分后向散射系数关系图Fig.2 (a) Numbers of three cloud phases and (b)relationships between γ 532 and δ for clouds with different phases

对于SVM的分类结果[图2(b)中黑色实线为分类线], 其误判频数统计结果如图3(a), 主要集中在分类线周围。 为此, 结合分类置信函数对SVM进行改进, 即在SVM的基础上, 结合水云和HOI的γ 532, χ , δ , Z和云顶温度T构建置信函数[见式(3)]

f5D=P水云(γ532, δ, χ, Z, T)-PROI(γ532, δ, χ, Z, T)P水云(γ532, δ, χ, Z, T)+PROI(γ532, δ, χ, Z, T)(3)

图3 对SVM结果(a)修正前和(b)修正后频数分布Fig.3 Frequency distributions of (a) SVM and (b) SVM+f5D classification results

改进后的结果中误判特征层数量显著减少[图3(b)]。 误判总数量减少了3 948, 其中, ROI误判减少了889, 水云误判减少了3 059(表2)。

表2 ROI/水云分类结果 Table 2 The result of ROIs and water clouds classification

为了提高分类效率且考虑到ROI和HOI的雷达比设定相同, 仅需区分出水云中的HOI。 与ROI和水云分类计算类似, 通过构建水云和HOI的置信函数[公式(4)]筛选水云中的HOI。

f5D=P水云(γ532, δ, χ, Z, T)-PHOI(γ532, δ, χ, Z, T)P水云(γ532, δ, χ, Z, T)+PHOI(γ532, δ, χ, Z, T)(4)

云相态反演算法流程如图4所示, 具体步骤包括:

图4 云相态分类流程图Fig.4 Flowchart of ice/water cloud algorithm

(1)SVM核函数及其参数的设定: 线性核函数简单实用并且在选择处罚和损失函数时具有较大的灵活性, 因此本文选用线性核函数作为SVM分类时的核函数。 此外考虑到样本中ROI和水云之间数量不对等, 需要根据样本数据量的大小自动设置类别权重; 利用SVM分类器初步区分水云和ROI;

(2)针对SVM误判的结果, 依据误判特征的直方图分布设定阈值范围建立不确定区[范围即图2(b)黑色虚线之间], 并通过构建ROI和水云的置信函数[式(3)]对区间内进行重新分类; 在不确定区外, 对置信度大于80%的误判特征层进行修正;

(3)构建HOI和水云的置信函数[式(4)]将HOI从水云中分离出来;

(4)依据水云和冰云的温度特征, 将云相态反演结果中云顶温度高于0 ℃的冰云修正为水云, 将云顶温度低于-40 ℃的水云修正为冰云(ROI)。

2.3 气溶胶子类型反演算法

基于观测实验以及AERONET的长期观测结果, CALIPSO产品将气溶胶分为沙尘、 煤烟、 洁净大陆、 污染大陆、 海洋、 污染沙尘和其他七个类型。

在此基础上, 利用不同气溶胶子类型的光学和空间分布特征, 增加决策树分类策略对气溶胶子类型进行反演。 沙尘型气溶胶一般具有较大的δ 且主要分布在沙漠地区, 以0.3为阈值, 首先识别出主要的沙尘气溶胶, 之后参考IGBP土地类型, 筛选出洁净大陆型; 然后依据IGBP, 识别出沙漠地区的沙尘型和污染沙尘型气溶胶并参考δ 将二者区分, 以及主要分布在海洋上的洁净海洋型气溶胶; 此外, 针对不同类型气溶胶的垂直分布, 利用层中间高度信息, 将气溶胶分为主要分布在~1.5 km以下的污染大陆型和污染沙尘型气溶胶和~2 km以上的高空的煤烟型和洁净大陆型气溶胶; 最后参考气溶胶层顶温度区分出污染大陆性和污染沙尘型气溶胶, 并根据γ 532χ 的主要分布范围, 识别出煤烟型和洁净大陆型气溶胶, 完成气溶胶子类型分类。 具体流程图如图5所示。

图5 决策树气溶胶子类型分类流程图Fig.5 Flowchart of decision tree algorithm for aerosol subtype classification

3 反演结果与分析
3.1 基于CALIOPVFM产品的比对分析

考虑到CALIPSO官方数据自2006年起已通过多次实验验证[11], 选取2016年12月CALIOP垂直特征层数据与本文结果进行一致性比较, 以说明本文算法的可靠性和适用性。

表3为云/气溶胶分类结果统计, 本算法实现了大多数云和气溶胶的识别, 无法识别的比例均小于1%, 具有较高的适用性。 此外, 与CALIOP VFM产品具有较高的一致性, 其中差异性主要为, 本文1.49%云在VFM产品中被判定为气溶胶, 11.57%的气溶胶被判定为云。 且白天云和气溶胶的反演一致性普遍高于夜晚, 主要因为白天的训练样本数据量多, 使得训练得到的分类模型对白天特征层的表征能力高于夜晚。 图6为本文算法(红色)与相对应的CALIOP(蓝色)置信度CAD_Score的比较结果。 其置信度频率分布与VFM产品基本一致, 尤其正值区域的云分类结果。 在CAD_Score=-100处, 本文云/气溶胶分类算法对于气溶胶识别率高于VFM产品, 但在其他地方, 尤其是当CAD_Score=0± 5时, 云和气溶胶的混合特征层较多, 识别率远低于VFM产品, 其中, 当CAD_Score=0时, 本文和CALIOP VFM的频率密度差值达到0.024。

表3 云/气溶胶分类结果 Table 3 The results of cloud and aerosol discrimination

图6 本算法与CALIOP VFM产品的云/气溶胶分类置信度分布直方图Fig.6 Statistical histograms of CAD_Score for our algorithm retrievals and CALIOP VFM products

通过将云相态反演结果与CALIOP VFM产品比对(图7和表4), 二者对水云识别一致性达到93.44%。 二者的差异主要体现在对ROI和HOI两种冰云的判识上, 其中ROI的一致性为88.04%, HOI仅为51.11%。 但由于两者均为冰云, 雷达比近似相同(CALIOP产品中将二者的雷达比均设为25), 因此, 两种冰云之间的误判对于云消光系数的反演结果影响较小。

图7 不同相态云分类结果柱状图Fig.7 The result of cloud phase classification

表4 云相态分类结果 Table 4 The results of cloud phase classification

图8为本文气溶胶子类型反演结果与CALIOP VFM产品的比对结果。 结果表明, 海洋型气溶胶一致性可以达到84%, 煤烟型则可以达到72%。 沙尘型则有46%的一致性, 但有37%被标记为污染沙尘型。 污染大陆型有43%的一致性, 有29%分为海洋型。 对于洁净大陆型, 总体数量较少, 一致性可以达到42%, 有38%的分为煤烟型。 污染沙尘型的一致性有54%, 有17%分为煤烟型。 总体来说, 海洋型、 煤烟型以及污染沙尘型具有较高的一致性; 部分沙尘型被标记为污染沙尘型以及污染大陆型被标记为海洋型, 原因主要在于污染沙尘型和污染大陆型气溶胶都被定义为沙尘或大陆型与其他气溶胶混合的类型, 因此决策树算法会出现识别混淆。

图8 气溶胶子类型分类结果柱状图Fig.8 The result of aerosol subtype classification

3.2 不同大气条件下反演结果分析

以华北地区为例, 分别选择霾(2017年1月25日)、 沙尘(2017年5月4日)和晴天(2017年10月29日)三种大气条件下的反演结果与CALIOP VFM产品进行比对, CALIOP过境轨迹与对应的MODIS真彩影像如图9所示。

图9 不同大气条件下CALIOP轨迹及MODIS真彩图
(a): 2017年1月25日, 霾; (b): 2017年5月4日, 沙尘; (c): 2017年10月29日, 晴空
Fig.9 CALIOP trajectory and the corresponding MODIS true color image under different atmosphere conditions
(a): Jan 25, 2017, haze; (b): May 4, 2017, dust; (c): October 29, 2017, clean

图10为2017年1月25日华北地区重污染天气条件下的分类结果比对图, 可以看出, 云和气溶胶特征层的反演结果与VFM产品基本一致。 云和气溶胶获得了较好的区分[图10(a)], 但在5~8 km处的云下或云中沙尘和污染沙尘气溶胶被识别为云; 在云相态分类[图10(b)]中, 水云具有较高的一致性, 对于ROI和HOI两种冰云区分效果不理想; 霾天条件的气溶胶子类型识别[图10(c)]极为重要, 从图中可以看出, 5 km以下的气溶胶层的污染沙尘型以及污染大陆性识别较一致, 但在2.5 km左右(43° N, 119° E)处, 本文反演结果为煤烟型气溶胶, 而在VFM产品中则被标记为沙尘, 但华北地区冬季少沙尘而多因供暖烧煤产生的霾, 因此需参考地面数据进一步分析。

图10 2017年1月25日霾天天气CALIPSO数据的(a)云/气溶胶分类、 (b)云相态分类、 (c)气溶胶子(VFM产品(上), 本文算法结果(下))Fig.10 The CALIPSO VFM (upper) and the result of this paper (lower) of cloud and aerosol discrimination (a), cloud phase (b) and aerosol subtype classification (c) on Jan 25, 2017

2017年5月3日— 5日在中国北部地区出现一次强沙尘过程, 选择2017年5月4日陕西境内的一组数据作为沙尘天气条件下的典型例子与VFM产品对比分析, 结果如图11所示: 云/气溶胶分类结果[图11(a)]与VFM产品基本一致, 且有效反演出沙尘的垂直空间分布[图11(c)]; 云相态分类中[图11(b)], 冰云和水云区分效果较好; 在气溶胶分类中, 大多数云下或云中沙尘气溶胶被误识别为云, 下一步工作将着重解决云气溶胶混合层的识别和分解。

图11 2017年5月4日沙尘天气CALIPSO数据的(a)云/气溶胶分类、 (b)云相态分类、 (c)气溶胶子类型分类(VFM产品(上), 本文算法结果(下))Fig.11 The CALIPSO VFM (upper) and the result of this paper (lower) of cloud and aerosol discrimination (a), cloud phase (b) and aerosol subtype classification (c) on May 4 2017

选择2017年10月29日北京地区分类结果图进行晴空条件下的对比分析, 从图中可以看出, 晴空条件下云层以及气溶胶层数量都比较少, 云/气溶胶分类结果[图12(a)]、 云相态分类结果[图12(b)]以及气溶胶分类结果[图12(c)]与CALIOP VFM产品数据的一致性明显高于重污染天气。 但在研究区域的北部内蒙古境内出现的污染沙尘型气溶胶, 被判别为煤烟型, 以及南部山西境内2.5 km处, 本文算法结果中识别的ROI冰云, VFM产品中却未能进行成功分类。

图12 2017年10月29日晴空天气CALIPSO数据的(a)云/气溶胶分类、 (b)云相态分类、 (c)气溶胶子(VFM产品(上), 本文算法结果(下))
4 结 论
发展了一种基于CALIOP 2016年中国地区数据所构建的激光探测的云和气溶胶的光学及空间特征数据库, 实现了星载激光雷达的大气特征层快速、 有效分类, 并将本文反演结果与CALIOP垂直特征层数据进行了对比分析, 主要得出以下结论:
Fig.12 The CALIPSO VFM (upper) and the result of this paper (lower) of cloud and aerosol discrimination (a), cloud phase (b) and aerosol subtype classification (c) on October 29, 2017

(1)基于激光探测的云和气溶胶层不同的光学以及地理空间分布特征, 分别构建云和气溶胶的五维概率密度函数和分类置信函数, 基于此实现了云和气溶胶类型的反演。 通过将反演结果与CALIOP VFM产品对比, 二者的云层反演一致性达到97.93%, 气溶胶层一致性达到87.85%, 得到了较好的效果。 选取SVM作为ROI和水云分类的算法模型基础, 结合云层的γ 532, χ , δ , Z和云顶温度T的概率密度函数构建云相态的分类置信函数以修正SVM误分的特征层以及筛选出水云中少部分的HOI冰云。 通过对比分析, 水云一致性为93.44%, ROI为88.04%, HOI为51.11%。 其中ROI和HOI的雷达比设定相同, 二者的混淆对于后续消光系数反演影响极小。 将基于决策树算法的气溶胶子类型反演结果与CALIOP产品对比分析, 二者海洋型气溶胶一致性为84%, 煤烟型为72%, 沙尘型有46%的一致性, 污染沙尘型一致性则有54%, 污染大陆型有43%的一致性, 对于洁净大陆型, 总体数量较少, 一致性可以达到42%。 二差异性主要是混合型气溶胶的误判, 混合型气溶胶定义为多种气溶胶类型的混合类, 容易导致决策树分类算法误分。 利用现有CALIOP观测结果作为样本数据构建分类数据库, 避免了对于地面以及航测数据的依赖, 利用机器学习可以自动获取云、 气溶胶分类策略, 不需要计算过多的属性参数, 大大简化了算法的实现过程, 使得云气溶胶分类更加高效。

(2)霾、 沙尘以及晴空三种典型情况下的反演结果均与CALIOP VFM产品数据具有较好的一致性。 其中, 霾天的大部分煤烟型气溶胶反演结果与VFM具有较好的一致性。 沙尘天能够识别出大多数的沙尘以及污染沙尘。 晴空为数不多的气溶胶层结果也较为一致。 但是, 对于云下以及云中的云/气溶胶混合层的识别还需要加强。

(3)对于本文实现的星载大气激光雷达特征层分类算法, 在下一步工作中, 将针对不同时段(日间/夜间)和季节云和气溶胶表现出不同的特性, 分别构建分类模型以提高分类精度。 本文算法分类结果基于雷达比的设定与CALIOP产品获得了较好的一致性, 基本满足了对于大气特征层垂直消光系数廓线反演的要求, 但仍需要进一步分析不同相态的云以及对于不同气溶胶子类型光学和空间分布特性来提高分类精度, 以保证云和气溶胶不同类型的垂直分布特性研究以及应用的精度要求。

致谢: 感谢位于NASA Langley Research Centre的CALIPSO卫星组提供的CALIOP激光雷达探测数据。

The authors have declared that no competing interests exist.

参考文献
[1] Cuesta J, Flamant J P H. Applied Optics, 2010, 49(12): 2232. [本文引用:1]
[2] Pand it A K, Gadhavi H S, Ratnam M V, et al. Atmospheric Chemistry and Physics, 2015, 15(24): 13833. [本文引用:1]
[3] Khaykin S M, Godin-Beekmann S, Keckhut P, et al. Atmospheric Chemistry and Physics, 2017, 17(3): 1829. [本文引用:1]
[4] Sugimoto N, Nishizawa T, Shimizu A, et al. AEROSOL Classification Retrieval Algorithms for Earth CARE/ATLID, CALIPSO/CALIOP, and Ground-Based Lidars. in Geoscience and Remote Sensing Symposium. 2011. [本文引用:1]
[5] Illingworth A J, Barker H W, Beljaars A, et al. , Bulletin of the American Meteorological Society, 2015, 31(1): 197. [本文引用:1]
[6] Chen B, Minnis P, Hu Y, et al. Atmos. Chem. Phys. , 2010, 10: 4241. [本文引用:1]
[7] Liu Z Y, Vaughan M, Winker D, et al. Journal of Atmospheric and Oceanic Technology, 2009, 26(7): 1198. [本文引用:1]
[8] Ma Y Y, Gong Y W. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2012, 5(6): 1849. [本文引用:1]
[9] Naeger A R, Christopher S A, Ferrare R, et al. IEEE Transactions on Geoscience and Remote Sensing, 2013, 51(1): 642. [本文引用:1]
[10] Hu Y X, Winker D, Vaughan M, et al. Journal of Atmospheric and Oceanic Technology, 2009, 26(11): 2293. [本文引用:1]
[11] Burton S P, Ferrare R A, Vaughan M A, et al. Atmospheric Measurement Techniques, 2013, 6(5): 1397. [本文引用:1]