白矮主序双星光谱的卷积特征提取
王文玉, 郭格霖, 马春雨, 姜斌*
山东大学(威海)机电与信息工程学院, 山东 威海 264209
*通讯联系人 e-mail: emilyMCY@163.com

作者简介: 王文玉, 1976年生, 山东大学(威海)机电与信息工程学院博士研究生 e-mail: sdwangwenyu@163.com

摘要

通过卷积运算提取白矮主序双星的光谱特征是提高识别精度的有效手段。 通过设计一维卷积神经网络, 以判别学习的方式从大量混合光谱中拟合出具有稳定分布的12个卷积核, 有效提取白矮主序双星的卷积特征。 通过引入相对松弛的光谱类别先验分布, 提出反贝叶斯学习策略以解决由于光谱抽样有偏带来的问题, 显著提高识别精度。 通过比较光谱在不同信噪比下的交叉熵测试误差, 分析卷积特征的提取过程对光谱信噪比的鲁棒性。 实验发现, 基于反贝叶斯学习策略的一维卷积神经网络对白矮主序双星的识别准确率达到99.0(±0.3), 超过了经典的PCA+SVM模型。 卷积特征谱的池化过程以降低光谱分辨率的形式缓解了光谱噪声对识别精度的影响。 当信噪比小于3时, 必须通过增加模型在光谱上的迭代次数以形成稳定的卷积核; 当信噪比介于3与6之间时, 光谱卷积特征较为稳定; 当信噪比大于6时, 光谱卷积特征的稳定性显著上升, 信噪比对于模型识别精度带来的影响可以忽略。

关键词: 白矮主序双星; 一维卷积神经网络; 反贝叶斯学习策略; 信噪比
中图分类号:TP29 文献标识码:A
Extracting Convolutional Features of WDMS Spectra with Anti Bayesian Learning Paradigm
WANG Wen-yu, GUO Ge-lin, MA Chun-yu, JIANG Bin*
School of Mechanical, Electrical & Information Engineering, Shandong University, Weihai, Weihai 264209, China
Abstract

In the task of White Dwarf+Main Sequence (WDMS) finding in massive spectral data release, convolution can significantly improve the classification accuracy by extracting hierarchical, translational-invariant features. In this paper, by designing one dimensional convolutional neural network (1-D CNN) which was further trained in a discriminative, supervised way, 12 kernels with stable numerical distributions were produced, helping to generate spectral feature maps of WDMS. To solve the problem brought by biased sampling in the WDMS training set, we proposed a learning principle called Anti-Bayesian Learning Paradigm (ALP) which was built on the basis of order statistics by implying a comparatively looser prior distribution of spectral types. And in the way of separating training spectra into several groups according to their signal-to-noise ratios (SNR), we analyzed the robustness of convolutional extraction process to spectral noise. Experimental results indicated that, (1) WDMS classification with 1-D CNN and ALP reached the accuracy of 99.0%±0.3%, which outperformed the classic PCA+SVM model. (2) Pooling after convolution operations relieved the negative impact of spectral noise by lowering resolution. (3) When the SNR was less than 3, more epochs were required to learn stable kernels; when the SNR was between 3 and 6, the spectral convolutional features was stable; when the SNR was greater than 6, the convolution process acquired higher stability to eliminate the negative impact of SNR on model performance.

Key words: WDMS; One dimensional CNN; Anti-bayesian learning paradigm; SNR
引 言

白矮-主序双星[1](WDMS)是银河系中常见的致密双星系统, 包含一颗白矮星主星和一颗小质量主序星伴星, 对研究密近致密双星的演化理论有重要作用。

对尚未发生物质交换或形成吸积盘的WDMS双星而言, 可近似认为双星之间没有或者仅有很弱的相互作用。 在光谱上表现为: 蓝端是白矮星特征, 红端是小质量主序星特征。 通过使用具有特定分布的核向量对光谱进行卷积运算能够有效提取不同波段的局部流量特征, 实现不同类型光谱的高效识别。

在针对WDMS自动化识别的研究中, 基于径向基神经网络[2] (RBF)系统在大规模挖掘任务中具有较好的表现, 发现了25颗新的候选体。 然而作为一种浅层网络, RBF难以有效提取光谱的层次化特征。 2014年, Pavel首次引入基于可学习核的多层卷积神经网络[3](convolutional neural network, CNN)进行不同类型天体(quasar, star, galaxy)的光谱分类。 但由于传统的CNN不适用于一维光谱数据, Pavel采取了将一维光谱折叠成二维向量的方式。 该方法保证了模型的可用性, 但存在准确率偏低, 卷积特征缺乏功能性解释等缺点。

为解决上述问题, 本工作改变了传统CNN[4]的拓扑结构, 实现了用于直接处理光谱数据的一维卷积神经网络(1-D CNN); 针对WDMS光谱抽样有偏问题, 提出反贝叶斯学习策略用于模型训练, 提高了识别准确率; 对光谱信噪比进行分组实验, 探究模型对不同光谱信噪比的敏感性和提取特征的鲁棒性。

1 卷积神经网络

经典的卷积神经网络被设计并用于二维、 三维图像的识别, 具有出色的特征提取和特征组合能力[5, 6, 7]。 在WDMS光谱实验中发现, 原始光谱在不同特征空间的表征通过隐含层的形式进行组织, 特别是在深度结构的支撑下, 不同阶段的隐含层能够提取光谱中的低水平特征(低分辨率谱、 flux突变波段等)并组合形成高水平的概念化特征以完成自动识别。

1.1 一维平展

由于恒星光谱在计算机中以一维向量形式存储, 必须对网络进行必要的结构化平展, 使其拥有处理一维WDMS光谱的能力。 平展后用于WDMS光谱识别的一维卷积神经网络(1-D CNN)结构如图1所示。

图1 1-D CNN的结构图Fig.1 Structure of 1-D CNN

1-D CNN是包含4个隐含层的深度网络, C1和C2层为两个卷积层, 通过生成可学习核的形式, 在WDMS光谱上进行卷积运算

C(k, n)=ds(n-d)w(k, d)(1)

其中w称为卷积核, 以线性赋权运算的形式提取光谱的卷积特征, 产生对应的特征谱(feature spectrum)。

P1和P2是对应的两个下采样层, 以池化(pooling)的形式降低特征谱的分辨率, 有效降低了噪声对光谱类型识别带来的负面影响。 本实验采取了平均池化策略, 即对上一个卷积层的特征谱f, 产生低分辨率谱f'

f'(n)=mean(f(n-1)d, , fnd)(2)

其中d为池化窗口尺寸。 为保证上层光谱特征的完整传递, 池化窗口在实验中不宜选取过小。

FC为全联接层, P2层的多个低分辨率特征光谱在该层被平展为一维向量, 与200个非线性神经元全联接, 在输出层通过sigmoid函数计算被归类为WDMS光谱的概率。

1.2 反贝叶斯学习策略

在“ 学习” 过程中, 用于网络训练的光谱数据对模型性能的提升尤为重要。 实验发现, 由于WDMS光谱的数量相对稀少, 信噪比低, 并且负样例的抽样有偏, 使得模型在挖掘

任务中反映出泛化能力(generalization)低下的缺点。 为解决光谱的数据特殊性为模型带来的问题, 基于次序统计量[8]提出“ 反贝叶斯学习策略(anti-bayesian learning paradigm, ALP)” 用于光谱卷积模型的学习。

ALP基于下述的重要假设:

假设: 对不同恒星的类别先验分布p(t|y), 假设其为等方差正态, 且均值为次序统计量一阶矩y± σ D/ 2π而非y, 其中σ D为光谱的样本方差。

通过最大化光谱的数据似然, 上述假设直接导出带偏倚修正项的网络代价函数

J(θ)=12n(yi-θxi)2γn(yi-θxi)(3)

其中超参数γ =2σ D/ 2π的值决定了假设的强度: 当σ D→ 0时γ → 0, ALP假设消失。 通常γ 的取值在0.1~0.9之间, 控制着先验分布的偏倚程度。

2 光谱卷积特征提取方法
2.1 光谱数据及其预处理

获取SDSS光谱库中不同信噪比(SNR)的WDMS及其部分候选体的光谱共4 000条和经由人工筛选产生的负样例(NEG)光谱10 000条, 波长3 800~7 322 Å , 信噪比1~22。

由于光谱将经由神经网络的输入层进行卷积运算, 对每一条原始光谱s进行如下标准化, 产生实验光谱s'

s'i=si-mean(Si)σ(Si)(4)

其中Si表示所有波长为i的光谱流量所形成的一维向量, mean(· )为均值算子, σ (· )为标准差算子。

图2 WDMS与非WDMS光谱的两层卷积图Fig.2 Two level convolutions of WDMS spec and NEG spec

2.2 实验方法

建立如图1所示的1-D CNN, 各层的配置参数(神经元个数nl, 卷积核个数nk, 激活函数)如表1所示。 使用基于ALP假设的BP算法对14 000条混合光谱进行判别学习, 在C1层和C2层各生成稳定的6个卷积核, 其中C2层是C1层的高层非线性组合。

表1 1-D CNN的配置参数 Table 1 Structural configuration for 1-D CNN
2.3 实验结果

选取SNR> 10的一条WDMS光谱和NEG光谱, 输入训练充分的网络模型(h), 可视化C1和C2层的前3个卷积核如图2所示。 训练后形成稳定分布的卷积核对光谱有显著的特征提取作用。

如图3所示, 第一层包含高斯滤波算子(gaussian filtering operator, GFO)、 低通算子(low-pass operator, LO)和互补高通算子(complementary high-pass operator, CHO)。 其中, GFO降低了光谱的分辨率[9], LO使得卷积窗口内具有较低flux的波段在特征谱对应位置有更高的激活值, 而CHO则以完全互补的形式对窗口内的光谱产生高通效果, 最大化局部flux对光谱类型的影响。

图3 三个特征提取内核(a)和相应的直方图(b)Fig.3 Three functional feature extraction kernels (a) and corresponding histograms (b)

与模板匹配方法[10]不同, 基于1-D CNN的卷积特征提取显著减少了对不同类型恒星光谱先验分布, 以及理论模板的计算需求。

图4 用1-D CNN识别WDMS光谱的交叉验证准确率Fig.4 Cross-validation classification accuracy of WDMS with 1-D CNN

在忽略光谱信噪比的情况下对WDMS进行识别实验后发现, 基于ALP的1-D CNN识别算法在标准WDMS光谱库中的识别准确率高达99.0%± 0.3%, 远高于在同等数据集中传统用于光谱识别的PCA+SVM, SSNN, RBF等算法, 克服了由于标准光谱抽样带偏引起泛化误差过大的问题。

3 信噪比对WDMS光谱识别的影响
3.1 实验方法

将2.1小节中的14 000条实验光谱以3为步长划分为SNR≤ 3, 3< SNR≤ 6, 6< SNR≤ 9, 9< SNR≤ 12, 12< SNR≤ 15, SNR> 15六个区间, 初始化表1配置下的1-D CNN对六组光谱(包含WDMS和NEG)进行识别分类实验。

分别对六组光谱进行五折交叉验证, 计算在5次实验中的识别准确率均值作为衡量指标。

3.2 实验结果

不同信噪比区间下的1-D CNN的识别准确率均值:

如图5所示, 当光谱SNR≤ 3时, WDMS信噪比对1-D CNN影响较大, 准确率均值为96.33%。

图5 不同信噪比区间的模型识别准确率Fig.5 Model validation accuracy in different SNR interval

当光谱3< SNR≤ 6时, 模型具有更高的稳定性, 准确性均值显著提高为98.7%。

当光谱6< SNR≤ 9, 9< SNR≤ 12, 12< SNR≤ 15, SNR> 15时, WDMS识别准确率提高, 且稳定在99%附近。

分析图5, 准确率在6< SNR≤ 9, 9< SNR≤ 12, 12< SNR≤ 15, SNR> 15四个区间趋于稳定, 故合并为一个区间SNR> 6, 并进一步在SNR≤ 3, 3< SNR≤ 6, SNR> 6三个区间分别进行10次五折交叉验证。

不同信噪比区间下的样本分布和1-D CNN的交叉熵误差(cross-entropy error):

进一步分析图6, 当光谱SNR≤ 3时, 1-D CNN在算法收敛前对WDMS信噪比具有较大的敏感性, 第一次迭代产生的交叉熵误差标准差高达0.5。

图6 实验光谱的信噪比分布和1-D CNN在不同信噪比区间的敏感度Fig.6 SNR distribution of experimental spectrum and the performance of 1-D CNN in different SNR interval

当光谱3< SNR≤ 6时, 模型具有更高的稳定性, 且误差均值远低于第一组实验。

当光谱SNR> 6时, 算法在误差均值和稳定性(标准差)方面都更加鲁棒(robust), 有效提高了WDMS识别准确率。

4 结 论

重点研究了如何通过卷积神经网络提取WDMS光谱的卷积特征, 及其在WDMS光谱识别工作中的有效性分析。 由于恒星光谱在计算机中以一维向量的形式存储, 将广泛用于二维图像识别的传统卷积神经网络进行一维拓扑平展, 形成具有4隐含层的深度网络。 为使模型在针对光谱的训练过程中具有更好的抽样鲁棒性, 提出反贝叶斯学习策略以替代传统的代价函数。

在对14 000条混合光谱进行50次迭代训练后, 1-D CNN在卷积层的共12个可学习核均形成良好的稳定分布, 功能上表现为高斯滤波算子、 低通算子和互补高通算子, 一方面降低了光谱分辨率, 另一方面通过设定流量阈值, 提取出不同类型光谱在相同局部波段的判别特征。 实验证明, 1-D CNN能够提取出更加有效的光谱特征以满足类型识别的需求。

卷积运算在C1和C2层形成高维特征谱, 针对特征谱的池化过程将其维度迅速降低到一个可接受范围内, 有效缓解了由于信噪比对光谱识别带来的负面影响。 通过实验发现, 当SNR≤ 3时, 必须增加1-D CNN在训练集上的迭代次数以达到理想的识别性能; 当3< SNR≤ 6时, 信噪比对WDMS识别性能的影响较弱, 但在计算条件允许的情况下仍应适当增加迭代次数; 当SNR> 6时, 信噪比对模型的表现几乎无影响, 可以忽略。

The authors have declared that no competing interests exist.

参考文献
[1] REN Juan-juan, LUO A-li, ZHAO Yong-heng(任娟娟, 罗阿理, 赵永恒). Progress in Astronomy(天文学进展), 2014, 32(4): 462. [本文引用:1]
[2] Yu H, Xie T, Paszczynski S, et al. IEEE Transactions on Industrial Electronics, 2011, 58(12): 5438. [本文引用:1]
[3] Yue J, Zhao W, Mao S, et al. Remote Sensing Letters, 2015, 6(6): 468. [本文引用:1]
[4] Sun M, Song Z, Jiang X, et al. Neurocomputing, 2017, 224: 96. [本文引用:1]
[5] Bashkirova D. BioNanoScience, 2016, 6(3): 246. [本文引用:1]
[6] Guohao L Y U, Hui Y I N, Xinyan Y U, et al. IEICE TRANSACTIONS on Information and Systems, 2016, 99(8): 2190. [本文引用:1]
[7] Krizhevsky Alex, Sutskever I, Hinton G E. Advances in Neural Information Processing Systems, 2012, 25(2): 2012. [本文引用:1]
[8] Oommen, John B, Thomas A. Pattern Recognition, 2014, 47(1): 40. [本文引用:1]
[9] Du Wei, Luo A-li, Zhao Yong-heng. Spectroscopy and Spectral Analysis, 2012, 32(7): 1886. [本文引用:1]
[10] Rebassa-Mansergas A, Nebot Gomez-Moran A, Schreiber M R, et al. Monthly Notices of the Royal Astronomical Society, 2012, 419(1): 806. [本文引用:1]