技术领域:
本发明属于在训练数据量少的情况下的统计学习分类方法,具体是对恒星光谱数据的分类。
背景技术:
:
随着天文观测仪器的发展,近几十年来天文学中产生了越来越多的光谱数据,例如斯隆数字巡天,全球天体物理天体物理干涉仪和大型天空区多目标光纤光谱望远镜。恒星的分类有助于我们研究银河系的整体结构和演化。它对于检测特定的天体也是有效的。我们可以获得包含连续光谱带信息和紫外到红外波段范围的光谱数据。恒星光谱具有许多波段和连续光谱特征,有利于分类和识别。所以对特定天体的搜索和识别对天文学家来说具有重要的意义。
从数据处理和挖掘角度看,对于已有大量的标注信息的数据,我们可以用传统的有监督的学习方法,通过首先训练神经网络的模型,然后再对未知的观测数据进行分类。然而,针对特色天体和稀有天文现象,我们获得观测数据的数量很少。也就是说,与大量已知天体或者天文现象相比,特色天体和稀有天文现象所对应的观测数据属于小样本。因此,我们在海量观测数据中搜寻特色天体或者稀有天文现象,本质上是关于小样本或者样本不均衡的分类问题。使用传统的无监督的学习方法存在的问题是精度不高,所以用少量光谱提高分类器的准确度是一个具有挑战性的问题。
mk(morgan等,1973)是一种广泛使用的光谱分类方法,它基于小规模标准恒星的光谱特征。mk系统基于恒星的温度从高到低,将恒星光谱分为七类。然而,mk星分类系统主要通过将光谱与少量标准恒星进行比较来手动完成,当光谱数量非常大时,这种分类效率低且不可靠。bailer-jones(1997)直接从观测到的光谱中使用物理参数来训练人工神经网络(ann),这可以应用于光谱分类。bailerjones(2003)倾向于使用模式识别算法并概述两种替代框架(并行和分层)进行分类,数据均来自galactic调查任务gaia。广泛用于分类的监督方法可以充分利用先验知识来改善分类器的性能。然而,需要大量标记光谱来训练模型,并且获得大量标记光谱是耗时且昂贵的。而且,已知特定天体的光谱数量通常很小。
技术实现要素:
:
发明了一种基于对抗生成网络的恒星光谱小样本分类方法,利用对抗生成网络的强大特征学习能力,学习恒星光谱的特征。然后,利用少量带标签的数据微调网络,最终解决小样本下的不同恒星光谱分类问题。
基于对抗生成网络的恒星光谱小样本分类方法,该方法包括:
1)收集恒星光谱数据,对恒星光谱数据进行预处理,预处理数据使用z-score标准化方法对数据进行预处理。
2)使用未标记的真实光谱和由生成模型生成的伪光谱来训练生成对抗网络(gan),其中训练的生成模型用来模拟生成一维的恒星光谱,训练的判别模模型用来判别恒星光谱是否是由生成网络所生成。
3)步骤2中,在训练生成对抗网络模型时,生成模型的输入是随机噪声pz(z)=μ(-1,1)。
4)步骤2中,在训练生成对抗网络模型时,生成模型使用上采样的方案获得与真实光谱相同尺寸的伪光谱。
5)步骤2中,在训练生成网络模型时,生成模型使用tanh激活函数来表示非线性,生成模型的最后一层连接到判别模型的输入层。
6)在训练好生成对抗网络后,删除生成模型,保留判别模型,并增加判别模型输出的维数。
7)使用softmax函数替换保留下来的判别模型的输出,softmax通常用作多分类问题的分类器。修改后的判别网络可以将恒星光谱分类为多类。
8)使用少量带标签的光谱数据来微调修改后的判别网络。
9)在使用少量带标签的数据重新训练网络后,该网络可实现多分类任务
附图说明:
图1为scgan网络的框架
图2为生成的光谱图像
图3为sdss恒星光谱分类的不同方法的混淆矩阵
图4为sdss上比较的不同算法的分类精度结果
附图标记说明:
标记0表示判别网络最后输出的一个类别
标记1表示判别网络最后输出的另一个类别
标记2表示生成网络
标记3表示判别网络
标记4表示svm混淆矩阵
标记5表示rf混淆矩阵
标记6表示cnn混淆矩阵
标记7表示scgan混淆矩阵
标记x表示随机噪声
标记z表示由噪声生成的假的光谱
具体实施方式:
本发明具体实施方式如下:
本发明由两部分组成,第一部分是对生成对抗网络(gan)的训练,对抗生成网络包括生成模型(g),主要用来模拟生成一维恒星光谱,和判别模型(d)两部分,判别网络是用来判别恒星光谱是否是由生成网络所生成。第二部分是用少量带标签的恒星光谱对第一部分训练好的判别模型(d)做微调。下面对两部分进行详述。
第一部分:
1)我们使用上采样方案来获得与真实光谱相同尺寸的伪光谱
2)输入是随机噪声pz(z)=μ(-1,1)。
3)为了获得与真实光谱相同大小的伪光谱(图1中的x),我们使用上采样来生成和真实信号相同维度的数据。
4)我们在g中使用tanh激活函数来表示非线性(nair和hinton,2010)。g的最后一层连接到d的输入层。
5)我们使用未标记的真实光谱和由g生成的伪光谱来训练d和g。scgan的网络框架如图1所示。在scgan训练过程中,生成网络的任务就是产生尽可能真实的数据来欺骗判别网络,而判别网络主要目标是把生成网络生成的数据判别为假,即能够将真实数据与生成的假数据区分开来。这样,生成网络与判别网络形成了一个“动态博弈过程”:
6)在生成对抗网络训练好之后,图2为生成模型生成的光谱图像。然后,我们删除g并增加d输出的维数。
7)我们将d设计为基于一维卷积的分类器,其中非线性映射是通过relu激活函数。
8)保存训练好的模型。
第二部分:
9)使用softmax函数替换d的输出,softmax通常用作多分类问题的分类器。通过这种方式,d可以将恒星光谱分类为多类。
10)使用少量带标签的光谱数据来微调第一部分生成的d。
11)在这种情况下,重新训练的d可用于分类三种光谱类型:f型光谱,g型光谱和k型光谱,达到多分类的目的。实验结果,图3表示了sdss恒星光谱分类的不同方法的混淆矩阵。
12)我们利用f1-score和混淆矩阵来评估scgan的分类性能。f1-score是精度和召回的调和平均值,通常使用混淆度量来评估分类任务中方法的性能。图4为在sdss上比较了不同算法的分类精度结果图。
1.一种基于对抗生成网络的恒星光谱小样本分类方法,其特征在于,包括以下步骤:
步骤1:利用生成对抗生成网络学习大量无标签的恒星光谱特征;
步骤2:在训练好生成对抗网络的g和d以后,当d无法区分真实光谱和假光谱时,保存训练好的模型d;
步骤3:用softmax函数替换训练好的d的输出;
步骤4:使用少量带标签的光谱数据微调d,重新训练好的d可以实现对多个类别的恒星光谱进行分类。
2.根据权利要求1所述的基于对抗生成网络的恒星光谱小样本分类方法,在生成对抗网络中,g的输入是随机噪声pz(z)=μ(-1,1)。
3.根据权利要求1所述的基于对抗生成网络的恒星光谱小样本分类方法,在生成对抗网络中,g使用tanh激活函数来表示非线性,并把g的最后一层连接到d的输入层。
4.根据权利要求1所述的基于对抗生成网络的恒星光谱小样本分类方法,训练好生成对抗网络中g和d以后,删除g,并增加d输出的维数,用softmax替换了d的最后一层,将d设计为基于一维卷积的分类器,其中非线性映射是通过relu激活函数。
技术总结