RN-SM: 基于ResNet特征提取的恒星光谱分类算法
杨佳铭1, 屠良平1,2,*, 李建喜2, 苗嘉伟1
1.辽宁科技大学电子与信息工程学院, 辽宁 鞍山 114051
2.闽南师范大学数学与统计学院, 福建 漳州 363000
*通讯作者 e-mail: tuliangping@ustl.edu.cn

作者简介: 杨佳铭, 1985年生,辽宁科技大学电子与信息工程学院博士研究生 e-mail: 598045063@qq.com

摘要

大型巡天望远镜的问世, 让建立恒星光谱数据库变为了可能。 为更好、 更快研究数据库中的海量恒星光谱数据, 需要寻找快捷、 高效的恒星光谱自动处理算法。 以深度学习模型ResNet为基础, 搭建了一个混合深度学习算法: RN-SM。 该算法共包含5个步骤: ①归一化处理: 使用线性归一化函数, 对恒星光谱做归一化处理, 让恒星光谱具有相同的尺度。 ②去噪处理: 使用Ces算法对恒星光谱做去噪处理, 以剔除恒星光谱中的噪声。 ③合成RGB图像: RGB图像的三个通道, 对应同一条光谱生成的灰色图像。 同一条光谱的叠加使用, 让恒星光谱的主要特征更加明显, 更加方便后续工作的进行。 在这里, 我们对恒星光谱的连续谱进行了归一化处理, 使得RGB图像所示内容为恒星光谱的谱线信息。 同时, 分析了数据转换(合成RGB图像)的可行性: 以恒星光谱的主要谱线信息作为参考, 考察合成RGB图像的相关像素位置, 是否包含这些特征。 通过证实, 所提出的数据转换(合成RGB图像)方法是可行的。 ④特征提取: 为方便连接SoftMax算法, 使用ResNet算法对恒星光谱做特征提取, 将尺度为64×64的RGB图像, 特征提取为1×2 048的特征向量, 使用的ResNet算法共含49个卷积层。 ⑤自动分类: 将特征向量传至SoftMax模块进行自动分类。 SoftMax使用的损失函数为数据集损失和正则项损失的加和, 迭代10 000次后, 损失函数趋于稳定。 RN-SM算法在使用r波段信噪比大于30的A、 B、 dM、 F、 G、 gM、 K型恒星光谱进行分类时, 分类正确率为0.91。 这一分类正确率也超过了CNN+Bayes、 CNN+Knn、 CNN+SVM、 CNN+Adaboost和CNN+RF算法0.862, 0.876, 0.894, 0.868, 0.889的分类正确率。

关键词: 恒星光谱; ResNet; SoftMax; LAMOST
中图分类号:P144.1 文献标志码:A
RN-SM: Stellar Spectral Classification Algorithm Based on ResNet Feature Extraction
YANG Jia-ming1, TU Liang-ping1,2,*, LI Jian-xi2, MIAO Jia-wei1
1. School of Electronic and Information Engineering, University of Science and Technology, Anshan 114051, China
2. School of Mathematics and Statistics, Minnan Normal University, Zhangzhou 363000, China
*Corresponding author
Abstract

The advent of the Large Survey Telescope made it possible to build spectral databases of stellar. To study the massive stellar spectrum data in the database more efficiently and effectively, it is necessary to develop a fast and efficient automatic stellar spectrum processing algorithm. Based on the deep learning model ResNet, a hybrid deep learning algorithm named RN-SM is built in this paper. The algorithm consists of five steps: ① Normalization processing: A linear normalization function is used to normalize the stellar spectrum, ensuring it has a uniform scale. ② Denoising processing: The Ces algorithm is used to denoise the stellar spectrum, removing noise from the data. ③ Composite RGB image: Three channels of an RGB image, corresponding to the gray image generated by the same spectrum. The superposition of the same spectrum makes the main features of the stellar spectrum more pronounced and easier to work with in subsequent analysis. Here, we normalize the continuous spectrum of the stellar spectrum so that the content shown in the RGB image is the spectral line information of the stellar spectrum. At the same time, we analyze the feasibility of data conversion (synthetic RGB image) by using the main spectral line information of the stellar spectrum as a reference and investigating whether the relevant pixel position of the synthetic RGB image contains these features. It is proven that the method of data conversion (synthesizing an RGB image) proposed in this paper is feasible. ④ Feature extraction: To facilitate the connection of the SoftMax algorithm, the ResNet algorithm was used to extract features from stellar spectra. The 1×2 048 feature vector from the 64×64 RGB image was extracted. The ResNet algorithm contains 49 convolution layers in total. Automatic classification: The feature vector is transferred to the SoftMax module for automatic classification. The loss function used by SoftMax is the sum of the dataset loss and the regularization term loss. After 10000 iterations, the loss function becomes stable. When the RN-SM algorithm uses the spectra of A, B, dM, F, G, gM, and K-type stars with R-band signal-to-noise ratio greater than 30 for classification, the classification accuracy is 0.91. This classification accuracy is also higher than that of the CNN+Bayes, CNN+Knn, CNN+SVM, CNN+AdaBoost, and CNN+RF algorithms, at 0.862, 0.876, 0.894, 0.868, and 0.889, respectively.

Keyword: Stellar spectrum; ResNet; SoftMax; LAMOST
引言

恒星光谱作为一种“ 工具” , 是人类了解恒星的重要媒介。 不同的元素、 分子在不同的波长位置处, 吸收光线的程度不同, 通过对吸收线的研究可以确定恒星大气层的化学组成。 恒星光谱大致由三部分组成: 连续谱、 谱线和噪声, 其中连续谱反映恒星表面温度, 温度越低, 连续谱越向长波长方向移动, 通过连续谱所蕴含的物理化学信息可以计算恒星的表面温度。 整个波长区间内, 恒星光谱的形状、 强度, 同恒星自身的温度、 密度、 金属元素的特征密切相关, 对于温度更高、 更稠密和金属元素含量更高的天体, 其光谱的峰值通常更宽、 更强。 如果恒星光谱有红移或蓝移出现, 根据红移和蓝移信息可以反推出恒星的运动速度。 对于恒星光谱中出现的红移现象, 其表示恒星正在远离我们, 蓝移恰恰相反, 其表示恒星在朝我们移动。 恒星发出的光会有偏振现象出现, 偏振的方向和程度与恒星的磁场、 星风等性质密切相关, 通过对偏振的研究可以了解恒星的磁场和大气信息。 恒星光谱分类为上述科研工作的顺利进行埋下了重要伏笔, 因此寻找合适的恒星光谱自动分类算法是必要的。

在天体光谱分类领域, 学者们已经有了一些研究成果。 Liu等将恒星光谱MK类别映射为光谱特征, 突出了谱线的等效宽度, 形成了一个按MK等级排序良好的干净恒星轨迹, 并用SVM算法进行了分类研究[1]; Li等研究了流量在没有绝对校正情况下的恒星光谱分类问题, 其使用17阶多项式对恒星光谱做归一化处理, 然后再使用随机森林算法进行自动分类[2]; Wang等提出了一种自动化提取恒星光谱特征的方法, 该方法可有效应用于恒星光谱的自动分类和缺陷光谱的恢复[3]; Mese等按照MK过程, 搭建了一个自动分类器, 可以将矮星与明亮的巨星和超巨星分开[4]; Crawford等提出了第一个基于光谱对HdC进行分类的系统, 该系统完全基于HdC可观察的外观[5]; Vincent等使用了一种数据驱动的pipeline, 用于对WD候选者进行快速选择和光谱自动分类[6]; Bu等基于局部线性嵌入, 研究了恒星光谱的亚类分类问题[7]; Wang等使用机器学习算法, 对ELG光谱进行了有效分类[8]; Du等使用贝叶斯支持向量机对恒星光谱进行了分类, 该方法的优势在于可以根据不同数据集自适应推断所有模型的参数[9]; Zhang等提出了一种基于二维傅里叶光谱图像的天文光谱特征提取方法, 并将该方法应用于LAMOST(大天空区域多目标光纤光谱望远镜)恒星光谱数据的分类研究[10]; 范雅雯等设计了SSTransformer (stellar spectrum transformer)分类模型, 该模型可以对A、 F、 G、 K、 M恒星光谱进行自动分类[11]; Xue等使用无监督学习算法SOFM对恒星光谱进行分类, 该方法不仅将数据反映在了特征图上, 同时还保留了原始数据空间的大部分拓扑字符[12]

本文搭建了RN-SM恒星光谱自动分类算法, 其性能优异, 可以很好适用于A、 B、 dM、 F、 G、 gM、 K型恒星光谱分类任务。

1 RN-SM算法

RN-SM算法共有5层, 其中ResNet特征提取层是核心控制层, 算法工作流程如图1所示。

图1 RN-SM算法流程图Fig.1 Flowchart of RN-SM algorithm

1.1 归一化层

本文使用的r波段信噪比大于30的恒星光谱数据, 共有A型、 B型、 dM型、 F型、 G型、 gM型、 K型7类, 波长覆盖范围为3 801~7 896 Å , 共4 096 Å , 每类恒星光谱数据共2 000条。 对恒星光谱进行归一化处理的原因有两个: ①消除差异。 天体自身亮度不同、 距地球的距离也不同, 这就导致望远镜观测天体时获取到的能量也不同, 间接导致恒星光谱数据间的差异很大, 归一化处理可以保证模型训练时的稳定性, 消除天体亮度和望远镜曝光时间造成的光谱差异。 ②获取相同的尺度。 恒星光谱的维度较高, 对恒星光谱进行归一化处理, 将流量强度转换至0~1之间, 可以很好地保留完整的光谱信息, 且以相同的尺度来比较恒星光谱间的差异。 本文使用如式(1)的线性归一化函数对恒星光谱做归一化处理。

Flux=flux-fluxminfluxmax-fluxmin(1)

式(1)中, Flux表示归一化后的光谱流量, flux表示原始光谱数据, fluxmax、 fluxmin分别表示原始光谱流量的最大值和最小值。 归一化后的恒星光谱, 如图5每幅小图中的最上方图所示。

1.2 去噪层

光从天体发出到望远镜接收的过程中, 会受到大气湍流等自然因素的影响, 导致天体光谱数据掺杂一定的噪声; 另外, 巡天望远镜自身的局限性也是光谱掺杂噪声的一个重要原因。 虽然巡天设备的PipeLine会对天体光谱做一些去噪处理, 但并没有达到彻底去噪的程度。 因此需要对天体光谱做进一步的去噪处理, 最大限度避免噪声对科研工作的影响。 随着数字巡天技术的飞速发展, 获取海量的恒星光谱数据已经成为了现实, 寻找合适的天体光谱降噪算法已然成为一个重要的课题。

天体光谱的噪声多是狭窄的天光线以及脉冲噪声, 本文使用Ces算法[13]对恒星光谱做去噪处理, 以降低天光线和脉冲噪声的影响。 记去噪后的光谱为de_flux, 去噪后的恒星光谱如图5每幅小图中的中间图所示。

1.3 数据加强层

为了将恒星光谱数据更好地放进ResNet模型, 本层对光谱进行数据转换。 我们将一条恒星光谱使用三次, 每次形成一个灰度图像, 每个灰度图像单独作为一个通道, 最后合成一个三通道的RGB图像, 也就是说一条光谱变成了一个图片。 原始A、 B、 dM、 F、 G、 gM、 K型恒星光谱如图2所示(图片来自LAMOST官网), 转换后的光谱数据如图3所示。

图2 原始恒星光谱图Fig.2 Spectral diagram of the original star

图3 转换后的光谱数据图Fig.3 Spectrum data after conversion

对LAMOST产出光谱来说, 由于连续谱没有做流量定标, 因此谱线是最有效信息。 连续谱本身并不是无效信息, 其形状由天体自身的有效温度、 化学成分和表面重力加速度所决定。 不同类型的天体, 连续谱差异巨大, 如早型星、 晚型星、 致密星和类星体的连续谱, 真可谓形状各异。 在现代天体物理学中, 常采用多测光的方法来测量连续谱, 但是对于特殊类型的天体, 如有特殊发射线和吸收线的天体, 需要采用更精确的方法来测量连续谱信息。 从图3可以看出, 虽然转换后的数据可以明显区分出是不同类型的光谱数据, 但是就单张图片数据而言, 所含噪声过多, 无法很好凸出光谱的谱线信息。 因此, 我们决定使用光谱的谱线信息做数据转换。

想要使用恒星光谱的谱线信息, 需要对恒星光谱的连续谱进行归一化处理。 本文使用11阶多项式来拟合光谱的连续谱, 记拟合连续谱为pseudo_flux。 拟合连续谱后, 便可计算恒星光谱的谱线信息, 记谱线信息为flux_ratio, 则有

flux_ratio=de_fluxpseudo_flux(2)

连续谱归一化后的恒星光谱, 如图5每幅小图中的最下方图所示。

使用谱线信息转换后的光谱数据如图4所示。 需要说明的是, 图3和图4所涉及的数据转换并不涉及繁杂的算法, 只是将一维的光谱向量以图像的形式展现了出来, 对原始流量没有任何的破坏。 图3和图4的每一个像素点对应着原始恒星光谱的一个流量值。

图4 使用谱线信息转换后的光谱数据图Fig.4 Spectral data converted using spectral line information

图5 恒星光谱处理过程展示图Fig.5 Shows the processing of stellar spectra

恒星光谱经流量归一化、 去噪和连续谱归一化处理后的图片如图5所示, 7张图片依次对应A、 B、 dM、 F、 G、 gM、 K型恒星光谱。

为了验证数据转换是否可行, 我们依据光谱的重要谱线信息进行检验。 对于A型恒星光谱, 其在4 102.89 Å 处有一条明显的Hσ 吸收线, 在4 341.68 Å 处有一条明显的Hγ 吸收线, 在4 862.68 Å 处有一条明显的Hb吸收线, 在5 895.6 Å 处有一条明显的Na吸收线, 在6 302.05 Å 处有一条明显的OI吸收线, 在6 564.1 Å 处有一条明显的Hα 吸收线; 对于B型恒星光谱, 其在4 102.89 Å 处有一条明显的Hσ 吸收线, 在4 341.68 Å 处有一条明显的Hγ 吸收线, 在4 862.68 Å 处有一条明显的Hβ 吸收线, 在5 895.6 Å 处有一条明显的Na吸收线, 在6 302.05 Å 处有一条明显的OI吸收线, 在6 564.1 Å 处有一条明显的Hα 吸收线; 对于dM型恒星光谱, 其在4 960.214 Å 处有一条明显的OIII发射线, 在4 227.92 Å 处有一条明显的CaI吸收线, 在5 176.7 Å 处有一条明显的Mg吸收线, 在5 895.6 Å 处有一条明显的Na吸收线, 在6 302.05 Å 处有一条明显的OI吸收线; 对于F型恒星光谱, 其在6 301.943 Å 处有一条明显的OI发射线, 在4 862.68 Å 处有一条明显的Hβ 吸收线, 在5 176.7 Å 处有一条明显的Mg吸收线, 在5 895.6 Å 处有一条明显的Na吸收线, 在6 564.61 Å 处有一条明显的Hα 吸收线; 对于G型恒星光谱, 其在6 301.943 Å 处有一条明显的OI发射线, 在4 102.89 Å 处有一条明显的Hσ 吸收线, 在4 227.92 Å 处有一条明显的Hβ 吸收线, 在4 862.68 Å 处有一条明显的Hb吸收线, 在5 176.7 Å 处有一条明显的Mg吸收线, 在5 895.6 Å 处有一条明显的Na吸收线, 在6 302.05 Å 处有一条明显的OI吸收线, 在6 564.61 Å 处有一条明显的Hα 吸收线; 对于gM型恒星光谱, 其在4 960.3 Å 处有一条明显的OIII吸收线, 在5 176.7 Å 处有一条明显的Mg吸收线, 在5 895.6 Å 处有一条明显的Na吸收线, 在6 302.05 Å 处有一条明显的OI吸收线, 在6 564.1 Å 处有一条明显的Hα 吸收线, 在6 718.29 Å 处有一条明显的SII吸收线; 对于K型恒星光谱, 其在4 364.378 Å 处有一条明显的OIII发射线, 在6 301.943 Å 处有一条明显的OI发射线, 在4 227.92 Å 处有一条明显的CaI吸收线, 在5 176.7 Å 处有一条明显的Mg吸收线, 在5 895.6 Å 处有一条明显的Na吸收线, 在6 302.05 Å 处有一条明显的OI吸收线, 在6 564.1 Å 处有一条明显的Hα 吸收线。

以上吸收线和发射线, 均是该类恒星光谱的重要谱线特征, 本节所述“ 检验” , 即看这些特征是否都体现在转换后的RGB图像中。 对于图像数据, 像素值越低, 图片颜色越深, 相反, 像素值越高, 图片颜色越浅。 在恒星光谱中, 吸收线对应低流量值, 发射线对应高流量值, 因此吸收线在图片中“ 颜色” 更深, 发射线在图片中“ 颜色” 更浅。 图6即为本次的实验结果。 在图6中, 从左至右依次为A、 B、 dM、 F、 G、 gM、 K型恒星光谱, 绿色圆圈标注位为恒星光谱的吸收线特征, 红色圆圈标注位为恒星光谱的发射线特征。 就A型恒星光谱来说, 上文所述的吸收线特征按从左至右, 从上至下的顺序体现在图片中, 也就是说, 光谱特征按列写入到图片中去。 其他类型的光谱也是按此规律进行标注的。

图6 谱线信息展示图Fig.6 Spectral line information display diagram

从图6可以看出, 绿色圆圈位置的像素点颜色较深, 红色圆圈位置的像素点较浅。 因此, 本文的数据转换是较成功的, 转换后的数据可以很好凸显出原始光谱特征, 吸收线和发射线信息很好地表现出来了。

1.4 ResNet特征提取层

1.4.1 结构图

本文使用的ResNet模型, 共有5个Stage层, 其中Stage 0是预处理层, Stage 1有3个Bottleneck操作, Stage 2有4个Bottleneck操作, Stage 3有6个Bottleneck操作, Stage 4 有3个Bottleneck操作。 模型结构如图7所示。

图7 ResNet模型图Fig.7 ResNet model diagram

1.4.2 模型介绍

Stage 0层的输入设置为(3, 224, 224), 即输入的通道数是3, 输入数据的高、 宽最高是224。 本层卷积核尺寸为7× 7, 共有64个卷积核, 卷积核步长是2, 使用的是ReLU激活函数。 最大池化函数的kernel大小是3× 3, 步长是2。 本层的输出设置为(64, 56, 56)。

由于接下来的4个Stage层由BottleNeck操作构成, 因此先介绍BottleNeck操作。 BottleNeck操作有两个: BottleNeck1和BottleNeck2。 BottleNeck2共有3个可变参数: 输入数据的通道数、 数据的高和数据的宽。 设输入数据为x, 记卷积等相关操作为τ (x), 则ReLU激活函数对τ (x)+x处理后就是BottleNeck2的输出。 需要说明的是, BottleNeck2操作的输入和输出的形状是一样的。 BottleNeck1共有5个可变参数: 输入数据的通道数、 数据的高、 数据的宽、 C1和S。 相较BottleNeck2来说, BottleNeck1多了一个卷积操作, 记这个卷积操作为δ (x)。 如果说BottleNeck2是为了避免数据维度发生变化, 那么BottleNeck1就是为数据维度发生变化而设置的, 正是多出来的卷积操作, 让输入数据x变成了δ (x), 最后再对τ (x)和δ (x)进行加和计算。

Stage 1层的输入设置为(64, 56, 56), 即输入的通道数是64, 输入数据的高、 宽最高是56。 本层的输出设置为(256, 56, 56)。

Stage 2层的输入设置为(256, 56, 56), 即输入的通道数是256, 输入数据的高、 宽最高是56。 本层的输出设置为(512, 28, 28)。

Stage 3层的输入设置为(512, 28, 28), 即输入的通道数是512, 输入数据的高、 宽最高是28。 本层的输出设置为(1 024, 14, 14)。

Stage 4层的输入设置为(1 024, 14, 14), 即输入的通道数是1024, 输入数据的高、 宽最高是14。 本层的输出设置为(2 048, 7, 7)。

1.4.3 ResNet对转换数据进行特征提取

本文使用7类64× 64的合成光谱图片训练模型。 每类图片共2 000张, 其中训练集共9 800张图片, 测试集共4 200张图片。 在本节, 我们可视化了卷积层特征提取的过程。 其中, 第1, 2卷积层特征提取的A、 B、 dM、 F、 G、 gM、 K型恒星光谱如图8和图9所示。 从图8, 图9可以看出, 7类恒星光谱图发生不同程度变化, 这正是特征提取的奇妙之处: 将恒星光谱一些不明显特征变得明显, 将一些肉眼不易发现的特征, 直接体现在了特征提取图中。

图8 第1卷积层可视化数据图Fig.8 Visualized data diagram of the first convolution layer

图9 第2卷积层可视化数据图Fig.9 Visualized data diagram of the second convolution layer

特征提取后的恒星光谱数据如图10所示, 也即ResNet模型最后一个卷积层的输出。 特征提取最终的输出是一个1× 2 048的向量, 可以发现, 经过ResNet的特征提取, 恒星光谱的维度由4 096变为了2 048。 换言之, 一个4 096维的恒星光谱, 将由一个2 048维的向量替代。

图10 特征提取后的恒星光谱数据Fig.10 Star spectral data after feature extraction

1.5 SoftMax层

所谓Softmax函数, 即我们常说的归一化指数函数, 它源于sigmoid二分类函数, 是为了适应多分类任务不断推广出来的。 现如今, 在搭建“ 多分类任务” 网时, 其常用作最后一层进行最终的分类。 Softmax函数如式(3)所示

Softmax(xi)=exii=1nexi(0, 1(3)

相较于使用最普通的max()方法, Softmax函数的优势在于融合使用了e的幂函数, 这样可以更好的做到“ 两极分化” : Softmax让正样本的结果更接近1, 负样本的结果更接近0。 需要说明的是, 样本绝对值越大, “ 两极分化” 现象越明显。

在本文中, 使用交叉熵作为损失函数来对模型进行评估, 计算方式如式(4)。

loss=-1ni=1nj=1myijlogaij(4)

式(4)中, n是样本数, m是分类数, y是标签值, a是预测值。

2 实验部分
2.1 高质量恒星光谱数据实验

在前文的论述中, 我们详细介绍了RN-SM算法的搭建过程, 并且介绍了数据的处理过程。 在本节中, 我们选用r波段信噪比大于30的高质量恒星光谱数据进行实验, 以检验RN-SM算法的性能。 其中, A、 B、 dM、 F、 G、 gM、 K型恒星光谱各2000条。 在SoftMax层, 训练集数据∶ 测试集数据=7∶ 3。 本次实验结果如表1所示, 混淆矩阵如图11所示, 损失函数收敛曲线如图12所示。

表1 各分类指标展示表 Table 1 Classification experiment each classification index results display table

图11 分类实验混淆矩阵Fig.11 Confusion matrix of classification experiment

图12 损失函数收敛曲线图Fig.12 Convergence diagram of loss function

表1中的实验结果, 四舍五入取小数点后3位。 从本次实验可以看出, RN-SM算法测试集分类正确率为0.91。 本次实验中, G型恒星光谱对应的分类指标有3个偏低, F型恒星光谱对应的分类指标有2个偏低, 此种现象或许是以下两个原因导致的: (1)虽然选择的数据r波段信噪比均大于30, 但是相对于其他类型的恒星光谱, 这两个类型光谱数据的信噪比还是偏低。 (2)F、 G型恒星光谱, 相较于其他类型的恒星光谱是不太好用的数据, 这可能是观测设备自身的一些局限性导致F、 G型恒星光谱的观测、 导出不准确。

2.2 对比实验

CNN作为最经典的卷积神经网络, 在诸多领域已大放异彩。 在本节中, 我们将其作为特征提取器, 并同经典机器学习算法结合使用来对本文的恒星光谱数据进行分类, 以对比本文提出的RN-SM算法的性能。 使用的经典机器学习算法有: 贝叶斯算法(Bayes)、 K近邻算法(Knn)、 支持向量机算法(SVM)、 Adaboost算法和随机森林算法(RF)。

CNN算法由四部分组成: 输入层、 卷积层、 池化层和全连接层, 卷积层是CNN算法的核心控制层, 卷积的计算如式(5)和式(6)。

xq(τ)=pNqγp(τ-1)δpq(τ)+ετ(5)

γpτ=ReLU(xq(τ))=max(0, xq(τ))(6)

其中, τ 是网络的层数, q是特征数, δ 为卷积核, ε 为偏置, ReLU是激活函数。

在本节中, 我们将全部恒星光谱整合成数据矩阵, 一次性全部输入至模型中, 数据矩阵的一行代表一条恒星光谱。 卷积层对数据矩阵进行卷积操作, 以生成“ 卷积数据” 。 池化层可以降低数据矩阵的规模, 这样就可以让“ 卷积数据” 的维度减小, 方便算法的运行。 池化层以最大池化方法, 保留了数据矩阵的局部信息, 产生的池化数据矩阵最终输入至全连接层进行整合重组, 重组后的数据输入至经典机器学习算法中进行自动分类。 本次实验结果如表2所示。 表2中实验结果, 四舍五入取小数点后3位。

表2 对比算法的分类正确率 Table 2 Classification accuracy of comparison algorithm

可以看出, 在众多对比算法中以CNN+SVM的分类正确率最高, 为0.894, 然而这一分类正确率还是低于RN-SM算法的分类正确率。 因此认为, 本文提出的RN-SM算法具有一定的实践应用基础, 可以很好服务于恒星光谱分类任务。

2.3 不同信噪比数据实验

信噪比是衡量天体光谱质量的参数, 信噪比越高, 天体光谱的质量越好, 相反, 信噪比越低, 天体光谱的质量越差。 LAMOST产出光谱共有u、 g、 r、 i、 z五个波段, 本文仅使用其r波段信噪比。 在上一节中, 我们考察了RN-SM算法使用r波段信噪比大于30数据时的性能。 在本节中, 我们依据r波段信噪比, 将数据分为3组: (0, 10), (10, 20)和(20, 30)来考察使用不同信噪比数据对RN-SM算法的影响。 除(10, 20)区间的B型数据1 603条, (20, 30)区间的B型数据850条外, 其余每个区间, 每类恒星光谱选用2 000条数据。 对比算法同为2.2节所述算法。 本次实验结果如表3表4所示。 表3表4中的实验结果, 四舍五入取小数点后3位。

表3 不同的信噪比数据分类指标结果 Table 3 Classification index results of different signal-to-noise ratio data
表4 不同信噪比数据对比算法分类正确率 Table 4 Classification accuracy rate of different SNR data comparison algorithm

表3可以看出, 随着数据质量的提高, RN-SM算法的分类正确率也在提高, 即RN-SM算法受约束于数据的信噪比。 从表3也可以看出, F、 G型恒星光谱对应的分类指标共有2~3个偏低, 再次证实了2.1节所述的猜想。 由表4可以看出, 随着信噪比的提高, 各对比算法的分类正确率也在提高, 但是, 四个区间波段对应的分类正确率均低于RN-SM算法的分类正确率。 因此认为, 本文提出的RN-SM算法具有一定的实践应用基础, 可以很好服务于恒星光谱分类任务。

3 结论

深邃的宇宙一直吸引着人类的目光, 人类渴望了解宇宙。 随着大型巡天项目的不断问世, 人类可以获取到海量的恒星光谱数据, 对恒星光谱进行准确分类可以帮助我们间接了解宇宙的奥秘。 本文提出了一个恒星光谱自动分类算法: RN-SM, 该算法可以很好适用于A、 B、 dM、 F、 G、 gM、 K型恒星光谱分类任务, 其0.91的分类正确率高于众多混合深度学习算法。 RN-SM算法的出现, 为人类研究恒星光谱又提供了一个很好的工具。

参考文献
[1] Liu C, Cui W, Zhang B, et al. Research in Astronomy and Astrophysics, 2015, 15(8): 1137. [本文引用:1]
[2] Li X, Lin Y, Qiu K. Research in Astronomy and Astrophysics, 2019, 19(8): 111. [本文引用:1]
[3] Wang Ke, Guo Ping, Luo A-li. Monthly Notices of the Royal Astronomical Society, 2017, 465(4): 4311. [本文引用:1]
[4] Mese G D, López-Cruz O, Schuster W J, et al. Monthly Notices of the Royal Astronomical Society, 2020, 494(2): 2995. [本文引用:1]
[5] Courtney L Crawford, Patrick Tisserand , Geoffrey C Clayton, et al. Monthly Notices of the Royal Astronomical Society, 2023, 521(2): 1674. [本文引用:1]
[6] Vincent O, Bergeron P, Dufour P. Monthly Notices of the Royal Astronomical Society, 2023, 521(1): 760. [本文引用:1]
[7] Bu Yude, Pan Jingchang, Jiang Bin, et al. Publications of the Astronomical Sciety of Japan, 2013, 65(4): 81. [本文引用:1]
[8] Wang Lili, Zheng Wenyan, Rong Lixia, et al. New Astronomy, 2023, 99: 101965. [本文引用:1]
[9] Du Changde, Luo Ali, Yang Haifeng. New Astronomy, 2017, 51: 51. [本文引用:1]
[10] Zhang Jingmin, Ma Chenye, Wang Lu, et al. Chinese Astronomy and Astrophysics, 2020, 44(3): 334. [本文引用:1]
[11] FAN Ya-wen, LIU Yan-ping, QIU Bo, et al(范雅雯, 刘艳萍, 邱波, ). Spectroscopy and Spectral Analysis(光谱学与光谱分析), 2023, 43(8): 2523. [本文引用:1]
[12] Xue Jianqiao, Li Qibin, Zhao Yongheng. Chinese Astronomy and Astrophysics, 2001, 25(1): 120. [本文引用:1]
[13] Yang Jiaming, Tu Liangping, Liu Hao, et al. Current Science, 2024, 127(11): 1301. [本文引用:1]