光谱与测光数据融合算法在变星分类上的应用
吴超1, 邱波1,*, 潘志仁1, 李晓彤1, 王林倩1, 曹冠龙1, 孔啸2
1. 河北工业大学, 天津 300400
2. 中国科学院国家天文台, 北京 100012
*通讯作者 e-mail: qiubo@hebut.edu.cn

作者简介: 吴 超, 1988年生, 河北工业大学研究生 e-mail: wuchao101@hotmail.com

摘要

天文学上把亮度随时间变化的恒星称为变星。 它对于研究星系的距离, 恒星的演化以及恒星在不同阶段的性质具有非常重要的意义。 目前对变星的识别主要依靠长时间观测其亮度变化, 并结合对恒星的光谱进行分析才能最终完成认证。 这项工作需要天文学家投入大量时间, 难以开展大规模分类。 针对上述问题本文提出了一种将测光图像与一维光谱进行数据融合用于对变星进行分类的方法——光谱-测光融合网络(ASPF-Net)。 该网络由C1网络和C2网络两部分组成, 其中C1是用于提取光谱特征的一维卷积神经网络, C2是用于提取测光数据特征的二维卷积神经网络; 最后将两者提取到的特征进行融合, 用一个全连接前馈神经网络完成分类。 该研究在对食变星、 脉冲变星和标准星分类问题上进行了实验。 实验数据均来自于斯隆数字巡天项目(SDSS), 该项目包含了测光图像和光谱两种数据。 对于光谱数据本文选取波长在380.0 ~680.0 nm范围内的流量值。 测光图像由: u、 g、 r、 i和z共5个波段数据组成, 对应的中心波长分别为: 355.1、 468.6、 616.6、 748.0和893.2 nm。 相比于传统的利用其中三个波段合成RGB图像, 原始SDSS数据拥有更高的灰度等级。 为了方便网络训练, 对测光数据和光谱数据均做了标准化处理。 分类性能分析方面, 使用了精确率, 召回率, F1值和平均准确率四个指标进行评估。 提出的光谱-测光融合网络(ASPF-Net)在针对食双星、 脉冲变星和标准星的分类任务, 精确率分别为: 91.1%、 92.8%和98.2%。 实验证明, 数据融合之后的分类性能优于单独使用光谱数据或测光数据的分类性能。 说明将光谱数据和测光数据结合起来对变星进行分类是一种有效的方法, 这为今后的变星的分类提供了一种新的思路和方法。

关键词: 数据融合; 光谱分类; 多模态融合网络; 测光图像; 变星分类
中图分类号:P157.2 文献标志码:A
Application of Spectral and Metering Data Fusion Algorithm in Variable Star Classification
WU Chao1, QIU Bo1,*, PAN Zhi-ren1, LI Xiao-tong1, WANG Lin-qian1, CAO Guan-long1, KONG Xiao2
1. Hebei University of Technology, Tianjin 300400, China
2. National Astronomical Observatory, Chinese Academy of Sciences, Beijing 100012, China
*Corresponding author
Abstract

In astronomy, stars whose brightness changes with time are called variable stars. It is of great significance to study the distance of galaxies, the evolution of stars and the properties of stars in different stages. At present, the identification of variable stars mainly depends on observing their brightness changes for a long time and analyzing the spectrum of stars. This work requires astronomers to invest much time, so it is not easy to carry out large-scale classification. A data fusion method of photometric image and one-dimensional spectrum is proposed to classify variable stars. Experiments are carried out on identifying eclipsing variable stars, pulsar variable stars and standard stars. The Sloan Digital Sky Survey project includes photometric images and spectral data. For spectral data, this paper selects the flow value in the wavelength range of 380.0~680.0 nm. The photometric image comprises five data bands: u, g, r, i and z. The corresponding center wavelengths are 355.1, 468.6, 616.6, 748.0 and 893.2 nm respectively. The photometric value is generally distributed between 0 and 200. For the image part, this paper uses the data of five bands for classification, and locates the position of the target star in the photometric image through the star catalogue. In order to facilitate network training, photometric and spectral data are standardized. The method of combining photometric image and spectral data for classification proposed in this paper uses four indicators: accuracy, recall, F1 value and average accuracy. The experimental results after data fusion are better than those using spectral or photometric data alone. For the classification tasks of eclipsing binaries, pulsars and standard stars, the accuracy rates are 91.1%, 92.8% and 98.2% respectively. Experiments show that the combination of image data and photometric data is an effective method for star classification, which provides a new idea and method for star classification in the future.

Keyword: Data fusion; Spectral classification; Feature fusion network; Photometry image; Variable star classification
引言

随着众多大规模巡天任务的开展, 如GAIA(global astrometric interferometer for astrophysics)[1]、 SDSS(sloan digital sky survey[2]和LAMOST(large sky area multi-object fiber spectroscopic telescope)[3]等巡天项目, 为天文学研究带来了数以亿计的测光数据和光谱数据。 由于数据量巨大, 传统的数据处理方式很难完成对海量数据进行分析的任务。 近些年随着机器学习的兴起, 天体的自动分类方法也迅速发展。 尤其是深度神经网络的出现, 大大刺激了自动分类任务的发展。 覃冬梅[4]等使用主成分分析(PCA)结合支持向量机(SVM)对天体光谱进行了分类, SVM多用于数据量不大的分类任务中, 随着数据集中样本数量的增加, 会出现训练时间长、 难以收敛的问题。 并且SVM的核函数需要根据数据的不同, 凭借经验来选取, 这影响了其在海量天文数据上的应用。 杨金福[5]等将神经网络中的覆盖算法应用在天文光谱分类中。 通过实验验证了其比SVM分类具有更高的准确率。 Li[6]等利用随机森林(RF)对LAMOST光谱进行特征评估和分类, 该算法利用决策树对光谱数据进行特征提取并且能够分析不同类型的天文光谱之间的差异。 Liu[7]等将卷积神经网络应用在一维光谱数据中, 提出了SSCNN网络。 在对F、 G和K类恒星光谱的分类任务中, 取得了高于90%的准确率。 实验结果证明SSCNN算法相比于RF算法有更好的分类性能。 以上算法均是基于单一的光谱数据进行的分类研究, 随着深度学习技术在不同研究领域的广泛应用, 学者们开始研究如何将不同形式的数据应用在同一个神经网络中, 从而取得优于单模态数据输入的效果。 例如Tian[8]等设计了一种可以同时接受图像和文字信息的多模态神经网络。 其在情感分类上的优异表现, 给予了本文将测光数据和光谱进行信息融合用于变星分类任务的灵感。

天文学上把亮度随时间变化的恒星称为变星。 变星总表GCVS(combined general catalog of variable stars)[9]按光变的起源和特征将变星划分为六类: 食变星、 脉冲变星、 激变变星、 喷发变星、 旋转变星、 X射线变星。 食变星由两颗恒星组成, 通常来说, 变星的演变速度比普通恒星的演变速度要快很多。 对变星的研究可以为恒星演化的早期和晚期阶段提供很多有价值的信息, 对天文学研究具有非常重要的意义。 目前搜寻变星的常用的方法对变星进行多次测光检测, 记录其亮度的周期变化从而判断该变星所属的类型, 这项工作需要耗费巨大的人力和时间。 而大规模巡天提供的海量的光谱和测光数据, 为我们判别变星类型提供了另外一种途径, 即通过海量的测光或光谱数据寻找特征, 从而完成变星的分类任务。

尽管机器学习在光谱分类中得到了广泛的应用, 但将同源的测光数据和光谱数据相结合的研究目前还很少。 本文主要通过深度神经网络将SDSS光谱数据与测光数据进行融合, 从而提高变星分类的精度。 光谱数据能够比较精确地得到恒星在各个波段的流量值, 但是却不能反映这些流量值的空间分布信息。 而测光数据虽然能够反映出恒星亮度值的空间分布即恒星的形态信息, 但是其测光信息仅相当于在5个波段附近流量值的叠加, 不如光谱流量值精确。 本文提出的光谱与测光融合网络(ASPF-Net)能够有效地融合光谱的流量信息和测光图像的形态信息, 从而得到更好的分类性能。

1 数据处理
1.1 数据介绍

SDSS是美国、 日本和德国等国的八个大学和研究所的合作项目, 覆盖了整个天空1/3的区域, 并获取超过300万个天体的光谱[10]。 测光图像包含u、 g、 r、 i和z共5个波段的测光数据, 各波段对应的中心波长分别为355.1、 468.6、 616.6、 748.0和893.2 nm。 本实验通过变星总表查询到变星的赤经、 赤纬信息, 然后与SDSS数据库交叉获得其测光数据和光谱数据。 图1为利用g、 r和i三个波段的测光数据合成的测光图像。 SDSS的光谱数据则是通过光纤将天体的光引入到光谱仪中, 其分辨能力可达R=λ /FWHM~2 000, 其中λ 为波长, FWHM为半峰全宽。 通过光谱仪分光后得到红端和蓝端的二维光谱, 最后经过去除宇宙射线、 去除噪声、 抽谱、 减天光、 频谱对接等处理, 最终得到波长范围覆盖380.0~920.0 nm的一维光谱, 如图2所示。

图1 利用SDSS测光数据合成的图像
框中的星体为食双星
Fig.1 An image synthesized using SDSS photometric data
The star in the box is an eclipsing double star

图2 图1中目标星体的光谱Fig.2 The spectral data of the target star in Figure 1

1.2 一维光谱归一化

一维光谱可以看作是间断谱和连续谱的叠加, 其中间断谱主要由发射线和吸收线组成, 含有光谱中的大多数重要信息。 为了防止后续标准化过程中将间断谱中的重要信息淹没, 需要先对一维光谱进行归一化处理, 具体来说是:

(1)利用三次样条插值得到平滑谱[见图3(a)红色曲线]。

图3 一维光谱归一化Fig.3 One dimensional spectral normalization

(2)原始一维谱除以平滑谱得到归一化谱线[见图3(b)]。

1.3 数据标准化

测光图像一般是用星体的测光亮度来表示, 而光谱则是用每个波段的光流量来表示。 由于恒星的亮度以及与地球的距离不同, 流量值的变动范围很大。 如果将这两种数据直接送入ASPF-Net网络进行训练, 由于两种数据的差异较大, 会导致模型难以收敛。 针对上述问题, 本文同时对测光数据和光谱数据进行了标准化处理。 本文数据标准化的方式为零-均值规范化(Z-score)。 使得数据均值都为0, 方差为1的标准分布, Z-score标准化的公式见式(1)

x˙=x-μσ(1)

式(1)中, x为原始的测光或光谱数据, x˙为标准化后的数据, μ 为原始数据均值, σ 为原始数据方差。

2 算法介绍
2.1 卷积神经网络

卷积神经网络(convolutional neural network, CNN)已经成为人工智能方向中最成功、 应用最广泛的方向之一。 目前CNN网络在众多领域都取得了广泛的应用。 CNN在分类任务中通常包含输入层、 卷积层、 池化层、 和全连接层等。 输入层一般将待处理的数据以张量的形式传入神经网络。 卷积层和池化层一般用于特征提取, 而全连接层通常起到分类器的作用。 最后通过输出层将分类的结果展示出来。 为了提高网络的高维映射能力, 通常在卷积层或全连接层之后引入激活函数。 层中的每个节点称之为神经元, 神经元的输出为式(2)

Y=f(x)=σ(1Nwixi+b)(2)

式(2)中, Y为神经元输出; w=(w1, w2, …, wN)为权重参数; X=(x1, x2, …, xN)为神经元输入; b为偏置项; σ 为激活函数(非线性函数)。 目前常用的非线性函数是ReLU函数, 其结构为σ (x)=max(0, x)。 ReLU函数相较于Sigmoid函数具有计算复杂度低、 没有梯度饱和的优点, 通常情况下收敛速度更快。 然而, ReLU单元有时会导致神经元输出总是为零的情况, 即神经元死亡。 为了缓解这个问题, 本文使用Leaky ReLU函数[11], 该函数在负值区间具有较小的非零斜率, 结构如式(3)

σ(x)=xx00.01xx< 0(3)

2.2 光谱-测光融合网络(ASPF-Net)

测光数据和光谱数据均只包含天体的部分特征, 测光数据可以反映出天体的位置、 形态和在五个波段的星等值。 光谱数据能够精确的得到天体的红移、 波长与流量的关系以及化学组成等信息。 本文提出的ASPF-Net能够有效地融合光谱的流量信息和测光图像的形态信息, 从而得到更好的分类性能。 本文提出的ASPF-Net网络是基于CNN神经网络构架, 在中间层之间使用Leaky ReLu函数, 在输出层使用SoftMax函数进行分类。 对于测光数据进行二维卷积操作, 包含6个卷积层, 4个最大池化层, 得到256× 4× 4的特征图, 然后将特征图展平成长度为4 096的一维特征向量。 针对光谱数据, 本实验采用一维卷积神经网络, 包含6个卷积层和3个最大池化层, 生成长度为4 864的一维特征向量。 最后将图像的特征向量与光谱的特征向量进行融合生成的特征向量进行融合, 形成8 960的一维向量。 生成的一维向量经过3个全连接层后经过SoftMax输出分类结果。 ASPF-Net网络的具体网络结构如图4所示, 其中黄色部分为卷积层, 用于特征提取; 橙色部分为池化层, 用于下采样; 紫色部分为全连接层, 用作分类器。 值得注意的是, 当待测天体缺少光谱和测光数据两者之一时, ASPF-Net网络仍然可以完成分类任务, 这大大提高了该网络的实用性。

图4 光谱测光融合网络的网络模型Fig.4 The network model of spectral photometric fusion network

3 实验及结果讨论
3.1 实验

本实验的实验环境为Intel Core I5处理器 16GRAM、 学习框架为pytorch1.7、 python3.7。 光谱和测光图像数据均来自于SDSS巡天DR16。 通过法国斯特拉斯堡天文信息数据库得到目前所有的掩食双星、 脉动变星和标准恒星的星表, 再与SDSS DR16进行交叉, 得到同时包含测光图像和光谱数据的星体。 最终通过交叉得到食双星: 1 125颗, 脉动变星: 2 550颗, 标准恒星: 2 660颗。 分别将其中的900、 1 950, 2 060作为训练集。 选取250, 600, 600作为测试集。 由于掩食双星的数据量偏少, 为了缓解样本类间比例失衡问题。 实验过程中对掩食双星、 脉动变星和标准恒星的训练权重设置为1.2∶ 1∶ 1。 提高样本数量较少的类别的训练权重, 可以提高神经网络对该类别的关注程度。 同时, 在训练过程中, 增加食双星样本的采样频率以减小数据不平衡带来的训练误差。 另外, 训练过程中会以20%的概率随机将其中一个支路的数据置零, 从而提高网络对单一数据源输入的识别能力。 实验总体流程如图5所示。

图5 实验总体流程Fig.5 Overall flow chart of the experiment

3.2 结果讨论

图6为分别使用测光分类网络, 一维光谱分类网络和ASPF-Net网络测得的混淆矩阵。 矩阵的纵坐标为样本预测标签, 横坐标为样本真实标签; EB、 PU和ST分别代表食双星、 脉动变星和标准星; Img、 Spec和Img& Specnet分别代表: 只使用测光数据的二维卷积网络、 只使用光谱的一维卷积网络和融合了测光数据和光谱数据的ASPF-Net网络。

图6 测试样本分类结果的混淆矩阵Fig.6 The confusion matrix of test sample classification results

处于矩阵对角线位置的部分为分类准确的样本数量。 通过混淆矩阵可以看出, 测光分类网络在三者中的分类性能最差, 对250个食双星样本, 仅有144个样本能够被正确分类。 而光谱测光融合网络由于结合光谱和测光数据的特征, 取得了三者中最好的分类性能。

为了验证光谱图像融合网络的有效性, 本次实验使用平均准确率, 精确率、 召回率以及F1-csore作为性能评价指标。 本实验针对图像数据和光谱数据分别使用C1网络和C2网络部分进行训练并与ASPF-Net的性能作对比。 ASPF-Net的分类结果如表1所示, 食双星、 脉动变星和标准恒星的分类精确率分别为91.1%、 92.8%和98.2%。 该结果比单用测光数据的精确率分别高了13.3%、 7.3%和9.7%, 比单用光谱数据一维卷积网络提高了14.3%、 7.8%和2.4%。 图7为三种神经网络的实验结果, 从左至右分别为: 精确率、 召回率和F1-score。 与本文方法不同的, 覃冬梅等[4]的PCA+SVM和Liu等[7]的SSCNN网络均采用的一维光谱作为输入。 我们通过实验得到经过PCA降维到400个特征点时, SVM获得最高的分类准确率: 84.1%。 与同为卷积神经网络的SSCNN相比, 本文提出的ASPF-Net由于融合了测光数据的形态信息, 分类性能比前者提高了5.1%, 结果对比见表2。 结果证明, ASPF-Net网络能够有效的结合图像和光谱的特征, 从而取得更高的分类性能。 此外本文还研究了不同波段的测光图像组合对分类结果的影响。 通过实验测得选用5个波段的数据能够得到最高的分类准确率85.7%, 实验结果如表3所示。

表1 光谱测光融合网络的精确率、 召回率、 F1-score和准确率 Table 1 The precision, recall, F1 score and accuracy of ASPF-Net

图7 Imgnet、 specnet和Img& Specnet分类结果对比Fig.7 The comparison of imgnet, specnet and img & specnet classification results

表2 ASPF-Net与其他方法的结果对比 Table 2 The Comparison results of ASPF-Net and other methods
表3 不同波段测光图像的分类准确率 Table 3 The classification accuracy of photometric in different bands

为了分析神经网络如何利用光谱数据进行分类, 为天体光谱学分析提供指导, 本文通过Class Activation Mapping[12] (CAM)对一维光谱进行了可视化, 该可视化的结果有利于我们对将算法学习到的特征与天体物理学划分所用到的特征进行比对, 可以为天文学一维光谱的研究提供指导。 可视化结果如图8所示。 热力图上方的数字代表分类为某类星体的置信度, 谱线上的颜色深浅代表网络对不同波长处流量值的关注程度, 颜色越浅, 代表关注程度越高。 对于食双星的光谱, 网络主要关注550.0~650.0 nm的红端谱线, 而对于脉动变星和标准恒星来说, 网络则重点关注380.0~550.0 nm的红端数据, 其背后代表的天文物理学意义还需要结合天体物理学进一步进行分析。

图8 模型对光谱数据关注区域热力图Fig.8 Heatmaps of the model for the interesting region of spectra

4 结论

旨在探寻将测光数据与一维光谱数据进行特征融合, 用于天体分类的方法。 我们将这种方法应用在对食变星、 脉动变星和标准恒星的分类任务中。 实验结果表明, 本文提出的光谱测光融合网络可以融合光谱和测光图像的特征, 从而有效提高分类精度, 最终得到94.5%的分类准确率, 高于单独使用光谱或测光数据的准确率。 该多模态数据融合的方法也可以应用在其他类型的天体分类任务中, 为天体分类研究提供了一种新的思路。 本文还针对光谱数据, 对网络模型做了数据可视化, 可视化的结果可以直观地观察模型分类的依据, 为天文学一维光谱的研究提供一些指导, 提高了网络模型的可解释性。

参考文献
[1] Chen B, Stoughton C, Smith J A, et al. The Astrophysical Journal, 2001, 553(1): 184. [本文引用:1]
[2] Perryman M A C, de Boer K S, Gilmore G, et al. Astronomy & Astrophysics, 2001, 369(1): 339. [本文引用:1]
[3] Cui X Q, Zhao Y H, Chu Y Q, et al. Research in Astronomy and Astrophysics, 2012, 12(9): 1197. [本文引用:1]
[4] QIN Dong-mei, HU Zhan-yi, ZHAO Yong-heng (覃冬梅, 胡占义, 赵永恒). Spectroscopy and Spectral Analysis(光谱学与光谱分析), 2004, 24(4): 507. [本文引用:2]
[5] YANG Jin-fu, WU Fu-chao, LUO A-li, et al(杨金福, 吴福朝, 罗阿理, ). Pattern Recognition & Artificial Intelligence(模式识别与人工智能), 2006, 19(3): 368. [本文引用:1]
[6] Li X R, Lin Y T, Qiu K B. Research in Astronomy and Astrophysics, 2019, 19(8): 111. [本文引用:1]
[7] Liu W, Zhu M, Dai C, et al. Monthly Notices of the Royal Astronomical Society, 2019, 483(4): 4774. [本文引用:2]
[8] Tian F, Wang Q, Li X, et al. Journal of Visual Communication and Image Representation, 2019, 58: 544. [本文引用:1]
[9] Kazarovets E V, Samus N N, Durlevich O V, et al. Astronomy Reports, 2009, 53(11): 1013. [本文引用:1]
[10] Smee S A, Gunn J E, Uomoto A, et al. The Astronomical Journal, 2013, 146(2): 32. [本文引用:1]
[11] Maas A L, Hannun A Y, Ng A Y. International Conference on Machine Learning, 2013, 30(1): 3. [本文引用:1]
[12] Zhou B, Khosla A, Lapedriza A, et al. Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 2016: 2921. [本文引用:1]