CN113656754B - 恒星光谱数据增强方法及系统 - Google Patents
恒星光谱数据增强方法及系统 Download PDFInfo
- Publication number
- CN113656754B CN113656754B CN202110813458.9A CN202110813458A CN113656754B CN 113656754 B CN113656754 B CN 113656754B CN 202110813458 A CN202110813458 A CN 202110813458A CN 113656754 B CN113656754 B CN 113656754B
- Authority
- CN
- China
- Prior art keywords
- layer
- data
- spectrum data
- spectrum
- size
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001228 spectrum Methods 0.000 title claims abstract description 108
- 238000000034 method Methods 0.000 title claims abstract description 28
- 239000013598 vector Substances 0.000 claims abstract description 54
- 238000012549 training Methods 0.000 claims abstract description 18
- 238000007781 pre-processing Methods 0.000 claims abstract description 11
- 238000013135 deep learning Methods 0.000 claims abstract description 4
- 230000006870 function Effects 0.000 claims description 23
- 210000002569 neuron Anatomy 0.000 claims description 18
- 230000004913 activation Effects 0.000 claims description 15
- 238000013527 convolutional neural network Methods 0.000 claims description 13
- 230000003595 spectral effect Effects 0.000 claims description 11
- 238000005070 sampling Methods 0.000 claims description 9
- 229910052799 carbon Inorganic materials 0.000 claims description 7
- 238000009826 distribution Methods 0.000 claims description 7
- 238000005457 optimization Methods 0.000 claims description 7
- 238000004422 calculation algorithm Methods 0.000 claims description 5
- 230000002708 enhancing effect Effects 0.000 claims description 4
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 claims description 3
- 238000012937 correction Methods 0.000 claims description 3
- 230000009466 transformation Effects 0.000 claims description 3
- 238000003825 pressing Methods 0.000 claims description 2
- 230000008485 antagonism Effects 0.000 abstract description 3
- 238000010276 construction Methods 0.000 abstract description 2
- 238000004140 cleaning Methods 0.000 abstract 1
- 238000010606 normalization Methods 0.000 abstract 1
- 238000004590 computer program Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 7
- 238000013528 artificial neural network Methods 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 5
- 238000011160 research Methods 0.000 description 3
- 238000003860 storage Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000013145 classification model Methods 0.000 description 2
- 230000001965 increasing effect Effects 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 230000003042 antagnostic effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000009191 jumping Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Computational Mathematics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- General Health & Medical Sciences (AREA)
- Mathematical Analysis (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Operations Research (AREA)
- Probability & Statistics with Applications (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Algebra (AREA)
- Databases & Information Systems (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种恒星光谱数据增强方法及系统,包括光谱数据预处理模块:对原始的恒星光谱数据进行清洗、归一化、深度学习标签构建等数据预处理工作;搭建与训练条件生成对抗网络模块:基于博弈论理论搭建条件生成对抗网络,构建随机噪声向量,训练生成恒星光谱数据;基于训练好的生成模型进行数据增强模块:基于前面训练好的条件生成对抗网络,从随机的噪声向量生成恒星光谱数据。本发明的恒星光谱数据增强方法基于博弈论的理论基础,利用生成对抗网络,建立了不同类别恒星光谱的数据增强模型,使得本发明以较小的时间代价获得了足够的恒星光谱数据。
Description
技术领域
本发明属于天文光谱智能处理技术领域,尤其涉及一种恒星光谱数据增强方法及系统。
背景技术
天文学是一门历史悠久的观测科学,随着斯隆数字巡天(SDSS)和大天区面积多目标光纤光谱天文望远镜(LAMOST)等多光纤光谱大型巡天计划的出现,天文光谱数据规模正以指数级爆炸性增长,由此导致了天文光谱数据自动分类方法研究的必要性和迫切性日益增强。通过分析光谱数据可以得到天体位置和状态的信息,这些信息有助于挖掘出宇宙中特殊的、未知的天体,对恒星演化研究和宇宙奥秘探索都有着积极的意义。
天文光谱数据分类就是要从上千维的光谱数据特征中选择和提取对分类识别最有效的特征来构建特征空间,例如选择特定波长或波段上的光谱流量值等作为特征,并运用算法对各种天体进行区分。目前常用的光谱分类模型可以分为基于距离计算的天文光谱分类与基于神经网络的天文光谱数据分类。
关于基于距离计算的天文光谱数据分类,美国学者Gray利用含有标准光谱模板的知识库,基于距离差值实现分类。赵永恒教授和罗阿理教授团队通过从光谱数据中提取特定波长的关键数据实现分类任务。陈淑鑫等学者采用基于距离计算的模板匹配完成天文光谱数据分类。但是,上述方法的计算复杂度一般都是数据量和数据维度的平方,不适合海量高维数据的分类。以来自LAMOST的光谱数据为例,目前已经有超过1000万条的光谱数据,很多光谱的数据维度都在数千以上,面对这样高维的天文大数据,传统的人工或半人工的数据分类越来越困难。
关于基于神经网络的天文光谱数据分类,有基于使用全连接网络和自组织映射方法进行天文光谱分类。Wang等学者通过伪逆学习逐层训练的方法,构建了神经网络分类模型。Fabbro和Zou等学者构建了深度神经网络,通过卷积的方法来进行分类。上述方法可以对部分光谱进行较好地分类,但是基于神经网络的分类方法需要大量的训练数据,而这常常不能得到满足。例如,LAMOST第4版数据集中,识别的碳星还不到3000。
在天体实际分布中,各类天体种类不是均衡的,其特征差异也很大,目前大多数研究或者单独挖掘稀有光谱数据或者直接对全体数据集进行分类,导致数据识别的效率和精度并不能让人满意。
发明内容
为了解决现有技术存在的问题,本发明提供一种恒星光谱数据增强方法,能够为了克服现有的深度神经网络过于依赖充足的训练数据的不足,生成模拟的缺失数据,补全不完整的数据分布。
本发明所要解决的技术问题是通过以下技术方案实现的:
第一方面,提供了一种恒星光谱数据增强方法,包括:
对恒星光谱进行预处理,对处理后的光谱数据按照类别设置标签;
构建条件生成对抗网络模型并采用设置标签的的光谱数据对网络模型进行训练;
基于训练好的条件生成对抗网络模型进行数据增强。
结合第一方面,进一步的,所述对恒星光谱进行预处理包括:
对于光谱样本集中D中的每个每个恒星光谱样本Si,设置统一的维度m,在维度m处将Si截断得到使其每个维度都有值;
其中,D={S1,S2,S3,...Si...,Sn},Si代表第i个恒星光谱样本,n代表真实的恒星光谱的个数;
根据式(1)得到归一化后的恒星光谱样本数据
结合第一方面,进一步的,所述根据输入向量N′=(N,C)生成条件生成对抗网络模型包括:
通过Reshape层、卷积层、上采样层、压平层和全连接层搭建生成模型;
通过生成模型将输入向量N′拓展到真实光谱数据D同样的数据维度,得到生成的光谱数据F;
通过Reshape层、卷积层、丢弃层、压平层和全连接层搭建卷积神经网络判别模型;
将生成的光谱数据F与真实光谱数据D混合,按照类别生成标签向量L,送入卷积神经网络判别模型;
通过深度学习迭代学习,得到训练好的条件生成对抗网络模型。
结合第一方面,进一步的,条件生成对抗网络模型的训练样本的批大小设为512,选用交叉熵损失函数,然后使用激活函数为修正线性单元,由激活函数完成非线性变换,通过Adam优化算法进行参数寻优,其中学习率为设为0.001,衰减项设置为1e-08,动量设置为0.9,迭代次数设置为100。
结合第一方面,进一步的,所述条件生成对抗网络模型的生成模型部分包括:
第一层:为一Reshape层,其输入数据为输入向量N′
第二层:为一卷积层,包含4个大小为4×1的卷积核,步长设为1;
第三层:为一大小为2×1的上采样层;
第四层:为一包含8个大小为4×1的卷积核的卷积层,步长为1;
第五层:为一大小为2×1的上采样层;
第六层:为一个包含16个大小为4×1的卷积核的卷积层,步长为1;
第七层:为一平压层;
第八层:为一包含3700个神经元节点的全连接层。
结合第一方面,进一步的,所述条件生成对抗网络模型的卷积神经网络判别模型包括:
第一层:为一Reshape层,其输入数据为混合后的恒星光谱数据;
第二层:为一包含4个大小为3×1的卷积核的卷积层,步长为(2,1);
第三层:为一Dropout丢弃层,随机丢弃前面卷积层40%的神经元;
第四层:为一含8个大小为3×1的卷积核的卷积层,步长为(2,1);
第五层:为一Dropout丢弃层,随机丢弃前面卷积层40%的神经元;
第六层:为一包含16个大小为3×1的卷积核的卷积层,步长为(2,1);
第七层:为一Dropout丢弃层,随机丢弃前面卷积层40%的神经元;
第八层:为一压平层;
第九层:为一包含128个神经元的全连接层;
第十层:为一包含1个神经元的全连接层。
第二方面,提供了一种恒星光谱数据增强方法,包括:
光谱数据预处理模块,用于对恒星光谱进行预处理,对处理后的光谱数据按照类别设置标签;
模型训练模块,用于构建条件生成对抗网络模型并采用设置标签的的光谱数据对网络模型进行训练;
数据增强模块,用于基于训练好的条件生成对抗网络模型进行数据增强。
本发明有益效果主要如下:
(1)现有的单一的数据增强模型只适用于单个类别的数据进行增强,如果需要对多种类别的数据进行增强,需要重复训练多个数据增强模型,训练任务将会有很大的计算代价,本发明引入类别控制向量,使用条件生成对抗网络将大大减小运算代价,提高了运算速度;
(2)由于恒星光谱数据维度高、特征多。卷积网络在提取特征表示上具有优势,上采样层可以逐层放大输入向量。本发明提出了一种基于卷积神经网络的条件生成对抗网络来进行恒星光谱数据增强,针对数据的高维度特点,发挥卷积的优点,有效地提高了生成数据的真实性。
附图说明
图1是本发明恒星光谱数据增强方法的流程图;
图2是本发明中恒星光谱预处理的流程图;
图3是本发明中条件生成对抗网络的结构示意图。
具体实施方式
为了进一步描述本发明的技术特点和效果,以下结合附图和具体实施方式对本发明做进一步描述。
实施例1
本发明所提出的一种恒星光谱数据增强方法,如图1-3所示,主要包括以下步骤
a.恒星光谱数据预处理
先采用流量标准化对恒星光谱数据进行预处理,将恒星光谱数据统一缩放到[0,1之间,再分析不同类别的恒星光谱数据的维度,截取统一长度的光谱数据,最后按照光谱类别构建对应的标签;
b.搭建与训练条件生成对抗网络
所述模块包括条件生成对抗网络模型的建立与模型训练两个部分:将随机噪声向量与控制向量输入生成模型,由生成模型生成光谱数据,然后将真实恒星光谱数据与生成的恒星光谱数据输入卷积神经网络判别模型中,再训练判别模型去判别输入数据是真实数据还是生成数据,最后基于判别模型的识别进行对抗训练学习;
c.基于训练好的生成模型进行数据增强
基于上面训练好的条件生成对抗网络模型,去除模型的判别器部分,得到用于数据增强的生成模型,最终使用该模型对恒星光谱数据进行数据增强,得到数据增强后分布均衡的恒星光谱。
如图2、所述的a.恒星光谱预处理算法具体包括:
输入:光谱样本集D={S1,S2,S3,...Si...,Sn},Si代表第i个恒星光谱样本,n代表真实的恒星光谱的个数;
输出:归一化后的恒星光谱
a1.对光谱数据集进行遍历,设置循环变量i从1到n,n表示真实恒星光谱数据的总数,初始时i=1;
a2.对于光谱样本集中D中的每个每个恒星光谱样本Si,设置统一的维度m(这里的维度指光谱的波长),在维度m处将Si截断得到保证所有的Si其每个维度都有值;
a3.计算每个恒星光谱样本的归一化数据
a4.执行i=i+1;
a5.当i<n时,跳转至a2,否则完成恒星光谱数据的预处理。
进一步的,所述b.搭建与训练条件生成对抗网络包括:
b1.基于高斯分布,生成随机噪声向量N,并配对的生成类别控制向量C;
b2.将随机噪声向量N和类别控制向量C拼接成一个输入向量N′=(N,C);
b3.搭建条件生成对抗网络模型:
输入:随机噪声向量N和类别控制向量C拼接的输入向量N′=(N,C),真实的光谱数据D'={S'1,S'2,S'3,...S'i...,S'n},其中,S'i为阶段后的恒星光谱样本归一化后的值
输出:条件生成对抗网络
3.1)通过Reshape层、卷积层、上采样层、压平层和全连接层等搭建生成模型;
3.2)通过生成模型将输入向量N'拓展到真实光谱数据D同样的数据维度,得到生成的光谱数据F;
3.3)通过Reshape层、卷积层、丢弃层、压平层和全连接层搭建卷积神经网络判别模型;
3.4)将生成的光谱数据F与真实光谱数据D混合,按照类别组成标签向量L,作为数据与标签送入卷积神经网络判别模型;
3.5)损失函数及优化方法
在上述模型构建后,训练该模型,其中设置训练样本的批大小为512,选用交叉熵损失函数,然后使用激活函数为修正线性单元,由激活函数完成非线性变换,通过Adam优化算法进行参数寻优,其中学习率为0.001,衰减项1e-08,动量0.9,迭代次数设置为100来获得最佳模型;
b4.通过深度学习迭代学习,得到训练好权重的条件生成对抗网络。
其中,如图3所示,所述的条件生成对抗网络具体包括:
生成模型:
第一层:输入数据为拼接后的输入向量N',包括服从高斯分布的随机噪声向量N与类别控制向量C,随机噪声向量的维度为896,类别控制向量的维度为4,经过Reshape层,将输入向量的维度改为(900,1,1);
第二层:是一个包含4个大小为4×1的卷积核的卷积层,步长为1,经过LeakyReLU激活函数处理,输入数据为(900,1,1)维度的输入向量,输出维度为(897,1,4)的数据;
第三层:是一个大小为2×1的上采样层,得到维度为(1794,1,4)的数据;
第四层:是一个包含8个大小为4×1的卷积核的卷积层,步长为1,经过LeakyReLU激活函数处理,输入数据为(1794,1,4)维度的输入向量,输出维度为(1791,1,8)的数据;
第五层:是一个大小为2×1的上采样层,得到维度为(3582,1,8)的数据;
第六层:是一个包含16个大小为4×1的卷积核的卷积层,步长为1,经过LeakyReLU激活函数处理,输入数据为(3582,1,8)维度的输入向量,输出维度为(3579,1,16)的数据;
第七层:是一个压平层,输入数据为(3579,1,16)维度的输入向量,输出维度为57264的数据;
第八层:是一个包含3700个神经元节点的全连接层,经过tanh激活函数处理,得到维度为3700的数据,该数据就是使用生成模式生成的恒星光谱数据。
卷积神经网络判别模型:
第一层:一个改变输入数据维度的Reshape层,输入数据为混合后的恒星光谱数据,包含真实的恒星光谱数据与生成的恒星光谱数据,光谱数据的维度为3700,输出维度为(3700,1,1)的数据;
第二层:是一个包含4个大小为3×1的卷积核的卷积层,步长为(2,1),经过LeakyReLU激活函数处理,输入数据为(3700,1,1)维度的输入向量,输出维度为(1849,1,4)的数据;
第三层:是一个Dropout丢弃层,随机丢弃前面卷积层40%的神经元,控制模型大小;
第四层:是一个包含8个大小为3×1的卷积核的卷积层,步长为(2,1),经过LeakyReLU激活函数处理,输入数据为(1849,1,4)维度的输入向量,输出维度为(924,1,8)的数据;
第五层:是一个Dropout丢弃层,随机丢弃前面卷积层40%的神经元,控制模型大小;
第六层:是一个包含16个大小为3×1的卷积核的卷积层,步长为(2,1),经过LeakyReLU激活函数处理,输入数据为(924,1,8)维度的输入向量,输出维度为(461,1,16)的数据;
第七层:是一个Dropout丢弃层,随机丢弃前面卷积层40%的神经元,控制模型大小;
第八层:是一个压平层,输入数据为(461,1,16)维度的输入向量,输出维度为7376的数据;
第九层:是一个包含128个神经元的全连接层,经过ReLU激活函数处理,输入数据为7376维度的输入向量,输出维度为128的数据;
第十层:是一个包含1个神经元的全连接层,经过Sigmoid激活函数处理,输入数据为128维度的输入向量,输出维度为1的数据,代表判断输入的数据是真实数据还是生成数据,模型认为是真实恒星光谱就输出1,否则输出0。
c.基于训练好的生成模型进行数据增强包括:
c1.提取训练好的条件生成对抗网络中的生成模型:
输入:训练好的条件生成对抗网络模型
输出:生成模型
1.1)拆分条件生成对抗网络:
按照生成模型与卷积神经网络判别模型两部分拆分条件生成对抗网络。
1.2)去除卷积神经网络判别器模型:
只保留训练好的生成模型。
c2.构造服从高斯分布的噪声向量N,将新的噪声向量N与类别控制向量C拼接后送入生成模型:
c3.利用生成模型前向传播,从输入向量生成逼真的恒星光谱数据。
相对于现有技术,在本发明中恒星光谱数据增强方法融合了生成对抗网络、博弈论等知识,针对天文光谱维度高的特点,针对性的调整网络模型,兼顾多类别的光谱数据增强,在计算代价减小的情况下也能各种恒星光谱数据。本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求保护范围之内。
Claims (4)
1.一种恒星光谱数据增强方法,其特征在于,包括:
对恒星光谱进行预处理,对处理后的光谱数据按照类别设置标签;
构建条件生成对抗网络模型并采用设置标签的的光谱数据对网络模型进行训练;
基于训练好的条件生成对抗网络模型进行数据增强;
所述对恒星光谱进行预处理包括:
对于光谱样本集中D中的每个每个恒星光谱样本Si,设置统一的维度m,在维度m处将Si截断得到使其每个维度都有值;
其中,D={S1,S2,S3,...Si...,Sn},Si代表第i个恒星光谱样本,n代表真实的恒星光谱的个数;
根据式(1)得到归一化后的恒星光谱样本数据
所述构建条件生成对抗网络模型包括:
基于高斯分布,生成随机噪声向量N,并配对的生成类别控制向量C;
将随机噪声向量N和类别控制向量C拼接成一个输入向量N′=(N,C);
根据输入向量N′=(N,C)生成条件生成对抗网络模型;
所述根据输入向量N′=(N,C)生成条件生成对抗网络模型包括:
通过Reshape层、卷积层、上采样层、压平层和全连接层搭建生成模型;
通过生成模型将输入向量N′拓展到真实光谱数据D同样的数据维度,得到生成的光谱数据F;
通过Reshape层、卷积层、丢弃层、压平层和全连接层搭建卷积神经网络判别模型;
将生成的光谱数据F与真实光谱数据D混合,按照类别生成标签向量L,送入卷积神经网络判别模型;
通过深度学习迭代学习,得到训练好的条件生成对抗网络模型。
2.根据权利要求1所述的一种恒星光谱数据增强方法,其特征在于,条件生成对抗网络模型的训练样本的批大小设为512,选用交叉熵损失函数,然后使用激活函数为修正线性单元,由激活函数完成非线性变换,通过Adam优化算法进行参数寻优,其中学习率为设为0.001,衰减项设置为1e-08,动量设置为0.9,迭代次数设置为100。
3.根据权利要求1所述的一种恒星光谱数据增强方法,其特征在于,所述条件生成对抗网络模型的生成模型部分包括:
第一层:为一Reshape层,其输入数据为输入向量N′
第二层:为一卷积层,包含4个大小为4×1的卷积核,步长设为1;
第三层:为一大小为2×1的上采样层;
第四层:为一包含8个大小为4×1的卷积核的卷积层,步长为1;
第五层:为一大小为2×1的上采样层;
第六层:为一个包含16个大小为4×1的卷积核的卷积层,步长为1;
第七层:为一平压层;
第八层:为一包含3700个神经元节点的全连接层。
4.根据权利要求1所述的一种恒星光谱数据增强方法,其特征在于:所述条件生成对抗网络模型的卷积神经网络判别模型包括:
第一层:为一Reshape层,其输入数据为混合后的恒星光谱数据;
第二层:为一包含4个大小为3×1的卷积核的卷积层,步长为(2,1);
第三层:为一Dropout丢弃层,随机丢弃前面卷积层40%的神经元;
第四层:为一含8个大小为3×1的卷积核的卷积层,步长为(2,1);
第五层:为一Dropout丢弃层,随机丢弃前面卷积层40%的神经元;
第六层:为一包含16个大小为3×1的卷积核的卷积层,步长为(2,1);
第七层:为一Dropout丢弃层,随机丢弃前面卷积层40%的神经元;
第八层:为一压平层;
第九层:为一包含128个神经元的全连接层;
第十层:为一包含1个神经元的全连接层。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110813458.9A CN113656754B (zh) | 2021-09-16 | 2021-09-16 | 恒星光谱数据增强方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110813458.9A CN113656754B (zh) | 2021-09-16 | 2021-09-16 | 恒星光谱数据增强方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113656754A CN113656754A (zh) | 2021-11-16 |
CN113656754B true CN113656754B (zh) | 2024-02-23 |
Family
ID=78477451
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110813458.9A Active CN113656754B (zh) | 2021-09-16 | 2021-09-16 | 恒星光谱数据增强方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113656754B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114492526B (zh) * | 2022-01-25 | 2022-11-22 | 太原科技大学 | 一种面向多星光谱自动识别的SPEC-Net网络架构及识别方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111242201A (zh) * | 2020-01-07 | 2020-06-05 | 北京师范大学 | 基于对抗生成网络的恒星光谱小样本分类方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10763092B2 (en) * | 2017-11-29 | 2020-09-01 | L-3 Communications Corporation-Insight Technology Division | Dual-spectrum photocathode for image intensification |
-
2021
- 2021-09-16 CN CN202110813458.9A patent/CN113656754B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111242201A (zh) * | 2020-01-07 | 2020-06-05 | 北京师范大学 | 基于对抗生成网络的恒星光谱小样本分类方法 |
Non-Patent Citations (1)
Title |
---|
基于深度学习的恒星光谱分类;何东远;刘伟;曹硕;耿率博;刘宇婷;姚迦文;;北京师范大学学报(自然科学版)(01);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN113656754A (zh) | 2021-11-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Voss et al. | TMVA, the toolkit for multivariate data analysis with ROOT | |
CN107273936B (zh) | 一种gan图像处理方法及系统 | |
US8489529B2 (en) | Deep convex network with joint use of nonlinear random projection, Restricted Boltzmann Machine and batch-based parallelizable optimization | |
CN109543502A (zh) | 一种基于深度多尺度神经网络的语义分割方法 | |
CN112884059B (zh) | 一种融合先验知识的小样本雷达工作模式分类方法 | |
CN110287311B (zh) | 文本分类方法及装置、存储介质、计算机设备 | |
CN115249332B (zh) | 基于空谱双分支卷积网络的高光谱图像分类方法及设备 | |
CN114157539B (zh) | 一种数据知识双驱动的调制智能识别方法 | |
CN113656754B (zh) | 恒星光谱数据增强方法及系统 | |
EP4232957A1 (en) | Personalized neural network pruning | |
CN116958688A (zh) | 一种基于YOLOv8网络的目标检测方法及系统 | |
CN111598460A (zh) | 土壤重金属含量的监测方法、装置、设备及存储介质 | |
CN116152554A (zh) | 基于知识引导的小样本图像识别系统 | |
CN111563161A (zh) | 一种语句识别方法、语句识别装置及智能设备 | |
CN113109782B (zh) | 一种直接应用于雷达辐射源幅度序列的分类方法 | |
CN111553424A (zh) | 一种基于cgan的图像数据平衡和分类方法 | |
CN112560034A (zh) | 基于反馈式深度对抗网络的恶意代码样本合成方法及装置 | |
CN111401069A (zh) | 会话文本的意图识别方法、意图识别装置及终端 | |
CN114997378A (zh) | 归纳式图神经网络剪枝方法、系统、设备及存储介质 | |
CN115358473A (zh) | 基于深度学习的电力负荷预测方法及预测系统 | |
CN103761530A (zh) | 一种基于相关向量机的高光谱图像解混方法 | |
CN113723456B (zh) | 一种基于无监督机器学习的天文图像自动化分类方法及系统 | |
CN117786705B (zh) | 一种基于异构图变换网络的语句级漏洞检测方法及系统 | |
Hallyal et al. | Optimized recognition of CAPTCHA through attention models | |
CN114821206B (zh) | 基于对抗互补特征的多模态图像融合分类方法与系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |