CN110263878A - 一种基于集成学习的脉冲星候选体识别方法 - Google Patents

一种基于集成学习的脉冲星候选体识别方法 Download PDF

Info

Publication number
CN110263878A
CN110263878A CN201910573104.4A CN201910573104A CN110263878A CN 110263878 A CN110263878 A CN 110263878A CN 201910573104 A CN201910573104 A CN 201910573104A CN 110263878 A CN110263878 A CN 110263878A
Authority
CN
China
Prior art keywords
pulsar
measured
candidate
characteristic image
submodel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201910573104.4A
Other languages
English (en)
Inventor
王显海
王腾
罗锦宏
王烨青
陈霞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Changzhou College of Information Technology CCIT
Original Assignee
Changzhou College of Information Technology CCIT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Changzhou College of Information Technology CCIT filed Critical Changzhou College of Information Technology CCIT
Priority to CN201910573104.4A priority Critical patent/CN110263878A/zh
Publication of CN110263878A publication Critical patent/CN110263878A/zh
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种基于集成学习的脉冲星候选体识别方法,根据脉冲星数据,生成脉冲星特征图像,使用脉冲星特征图像进行对应子模型的训练,根据训练好的各子模型的权重对各子模型进行加权,构建综合识别模型,将根据待测目标数据生成的待测目标的子图像输入综合识别模型中,对待测目标进行脉冲星候选体识别;本发明提供的方案能更全面的识别脉冲星候选体,提高了脉冲星候选体识别的准确性和效率。

Description

一种基于集成学习的脉冲星候选体识别方法
技术领域
本发明涉及一种基于集成学习的脉冲星候选体识别方法,属于图像识别技术领域。
背景技术
研究表明银河系内可观测脉冲星超过140000颗。如此大量的脉冲星有待发现,促使了天文界通过改进观测设备和观测技术等手段不断地提高观测的效果,以发现更多脉冲星。目前,射电望远镜的单次巡天可以产生百万数量级的脉冲星候选体。我国500m口径球面射电望远镜(FAST),预计可能产生千万数量级的脉冲星候选体。面对如此庞大的数据,以往利用人工识别的方法对脉冲星候选体进行人为筛选显然已不能满足对海量数据筛选的需求。在识别性能方面,需要考虑更复杂的脉冲星候选体子图特征,提出更全面的模型,提高识别性能。
近年来,在利用深度学习方法对脉冲星信号进行识别方面的研究已经取得一定的成果,模型多种多样,对未来进一步开展脉冲星识别的研究有一定的借鉴意义。但对集成学习技术在脉冲星识别方面的研究还没有充分展开,目前仍然缺乏系统、广泛的研究。
发明内容
本发明的目的在于提供一种基于集成学习的脉冲星候选体识别方法,以解决现有技术中导致的上述多项缺陷或缺陷之一。
为达到上述目的,本发明是采用下述技术方案实现的:
本发明提供一种基于集成学习的脉冲星候选体识别方法,所述方法包括如下步骤:
获取脉冲星的子图像;所述脉冲星的子图像包括脉冲星轮廓图、脉冲星相位图、脉冲星周期和色散度值、脉冲星色散度曲线图;
使用脉冲星的子图像进行对应子模型的训练;根据训练好的各子模型的权重对各子模型进行加权,构建综合识别模型;
将待测目标的子图像输入综合识别模型中,进行脉冲星候选体识别;所述待测目标的子图像包括待测目标轮廓图、待测目标相位图、待测目标周期和色散度值、待测目标色散度曲线图。
进一步的,根据脉冲星数据,生成脉冲星的多特征图像;分割脉冲星的多特征图像,生成脉冲星的子图像。
根据待测目标数据,生成待测目标的多特征图像;分割待测目标的多特征图像,生成待测目标的子图像。
优选的,使用脉冲星数据处理软件PSRCHIVE处理待测目标数据,获取待测目标的多特征图像。
优选的,对脉冲星的多特征图像和待测目标的多特征图像进行分割的软件为MATLAB软件。
进一步的,在分割脉冲星的多特征图像之前,方法还包括对脉冲星的多特征图像进行灰度化处理;
在分割待测目标的多特征图像前,方法还包括对待测目标的多特征图像进行灰度化处理。
优选的,对脉冲星的多特征图像和待测目标的多特征图像进行灰度化处理的软件包括MATLAB软件。
进一步的,子模型包括:
用于进行脉冲星轮廓图识别的基于深度卷积网络和支持向量机的轮廓图识别模型;
用于进行脉冲星相位图识别的基于深度卷积生成对抗网络和支持向量机的相位图识别模型;
用于进行脉冲星周期和色散度值识别的基于深度卷积网络和随机森林的周期和色散度值识别模型;
用于进行脉冲星色散度曲线图识别的基于深度卷积生成对抗网络和支持向量机的色散度曲线图识别模型。
所述综合识别模型的表达式为:
T=F(a1M1(I1)+a2M2(I2)+a3M3(I3)+a4M4(I4)) (1)
式中,F为判别函数,T为判别结果,其值为1或0,判别结果为1表示测试目标是脉冲星,判别函数值为0表示测试目标不是脉冲星;Mi(i=1,2,3,4)为第i个子模型的指示函数;Ii(i=1,2,3,4)为第i个子模型的指示函数的特征数据;ai为第i个子模型识别权重系数,ai为0到1之间的实数。
本发明提供的基于集成学习的脉冲星候选体识别方法,利用集成学习技术提高脉冲星候选体的识别准确率,其利用了脉冲星轮廓图、相位图、周期和DM值、DM曲线图建立了更全面的脉冲星候选体自动识别方法。本发明同时利用了脉冲星的五项特征数据进行特征学习,大幅减少了手工设计特征的工作量,提高了识别准确率。
附图说明
图1是根据本发明实施例提供的综合识别模型框图。
图2是根据本发明实施例提供的子模型的训练流程图。
图3是根据本发明实施例提供的脉冲星候选体识别方法流程图。
具体实施方式
下面结合附图对本发明作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。
本实施例提供一种基于集成学习的脉冲星候选体识别方法,方法包括如下步骤:
步骤1:训练子模型;
步骤1.1:利用脉冲星数据处理软件PSRCHIVE处理脉冲星数据,产生脉冲星的多特征图,并利用Matlab软件先将多特征图进行灰度化预处理,再将多特征图进行分割,分别得到脉冲星轮廓图、脉冲星相位图、脉冲星周期和DM(色散度)值、脉冲星DM曲线图的子图像;所述脉冲星周期和DM值为包含脉冲星周期和色散度数值的图像。
步骤1.2:根据脉冲星轮廓图、脉冲星相位图、脉冲星周期和DM(色散度)值、脉冲星DM曲线图的子图像训练对应的子模型,子模型包括轮廓图识别子模型M1、相位图识别子模型M2、周期和色散度值识别子模型M3、色散度曲线图识别模型M4:
M1为采用深度卷积网络对脉冲星轮廓图进行图像特征提取,并利用支持向量积对特征进行分类的子模型;
M2为采用深度卷积生成对抗网络(DCGAN)对脉冲星相位图图像特征进行提取,并利用支持向量积进行分类的子模型,DCGAN产生与真实数据相似的训练数据,补偿训练数据样本的不足;
M3为利用深度卷积网络对包含周期和DM值的图像提取相应的数字特征,并利用随机森林进行多分类的子模型;
M4为利用深度卷积生成对抗网络对DM曲线图的图像特征进行提取,并利用支持向量积进行分类的子模型。
以轮廓图识别子模型M1为例,训练各子模型的方法包括如下步骤:
根据获取的脉冲星轮廓图构建样本集,将样本集按8:1:1的比例均匀随机地分为训练数据集、验证数据集和测试数据集,对轮廓图识别子模型M1进行训练:
S1:通过选取大量训练数据对模型进行训练,直到训练结果满足准确率要求;
S2:利用验证数据集对训练的模型进行验证,若验证结果不满足准确率要求,根据验证结果调整模型参数,再返回步骤1,若验证结果符合期望的准确率要求,则进入步骤3;
S3:利用测试数据集对模型进行测试,并根据测试结果对模型进行适当调整或修改训练策略。
步骤2:构建综合识别模型;
参照步骤1对四个子模型的训练完成后,根据对各模型的训练结果的准确率表现赋予各模型不同的权重值,增大准确率高的子模型的模型权重系数值,减小准确率低的子模型的权重系数值,并对四个子模型进行加权,得到如下式(1)表述的综合识别模型:
T=F(a1M1(I1)+a2M2(I2)+a3M3(I3)+a4M4(I4)) (1)
式中,T为判别结果,F为判别函数,对于判别函数,当F(x)中的x大于等于阈值时,判别结果T的值为1,否则为0;根据公式(1),在本发明实施例中,x=a1M1(I1)+a2M2(I2)+a3M3(I3)+a4M4(I4)),当判别结果T的值为1时,代表测试目标为是脉冲星,否则,表示测试目标不是脉冲星;a1-a4分别为各子模型权重系数,均为0到1之间的实数。阈值和模型识别置信度的权重值主要是根据经验值和由不同权重值产生的综合结果分析得到。Mi(i=1,2,3,4)为第i个子模型的指示函数,Ii(i=1,2,3,4)为对应各个指示函数的特征数据;
对各子模型的权重系数分别取不同数值,并将各子模型的不同权重系数值构成多种组合,分别使用脉冲星的子图像对综合模型进行测试,通过测试综合模型的识别准确率来判定各子模型的权重系数的合适性。
步骤3:进行脉冲星候选体识别;
参照步骤1.1,根据待测目标数据获取待测目标的子图像,待测目标的子图像包括待测目标轮廓图、待测目标相位图、待测目标周期和色散度值、待测目标色散度曲线图;将待测目标的子图像输入根据步骤1、步骤2获取的综合识别模型中,进行脉冲星候选体识别:
根据如公式(1)所述的综合识别模型,若判别结果T为1,则待测脉目标为脉冲星候选体;若判别结果T为0,则判别待测目标为噪声信号。
本发明实施例提供的一种基于集成学习的脉冲星候选体识别方法,根据脉冲星数据,生成脉冲星特征图像和或脉冲星特征数据,使用脉冲星特征图像和或脉冲星特征数据进行对应子模型的训练,根据训练好的各子模型的权重对各子模型进行加权,构建综合识别模型,将待测目标的子图像输入综合识别模型中,进行脉冲星候选体识别;本发明提供的方案能更全面的识别脉冲星候选体,提高了脉冲星候选体识别的准确性和效率。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变形,这些改进和变形也应视为本发明的保护范围。
本发明的工作,由国家自然科学基金(项目批准号:U1731120)、江苏省高等学校自然科学研究项目(项目编号:17KJB160001)和常州信息职业技术学院校级工业物联网应用与技术科研平台项目(KYPT201803Z)资助。

Claims (8)

1.一种基于集成学习的脉冲星候选体识别方法,其特征在于,所述方法包括如下步骤:
获取脉冲星的子图像;所述脉冲星的子图像包括脉冲星轮廓图、脉冲星相位图、脉冲星周期和色散度值、脉冲星色散度曲线图;
使用脉冲星的子图像进行对应子模型的训练;根据训练好的各子模型的权重对各子模型进行加权,构建综合识别模型;
将待测目标的子图像输入综合识别模型中,进行脉冲星候选体识别;所述待测目标的子图像包括待测目标轮廓图、待测目标相位图、待测目标周期和色散度值、待测目标色散度曲线图。
2.根据权利要求1所述的基于集成学习的脉冲星候选体识别方法,其特征在于,所述方法还包括:
根据脉冲星数据,生成脉冲星的多特征图像;分割脉冲星的多特征图像,生成脉冲星的子图像。
根据待测目标数据,生成待测目标的多特征图像;分割待测目标的多特征图像,生成待测目标的子图像。
3.根据权利要求2所述的基于集成学习的脉冲星候选体识别方法,其特征在于,所述方法还包括,使用脉冲星数据处理软件PSRCHIVE处理待测目标数据,获取待测目标的多特征图像。
4.根据权利要求2所述的基于集成学习的脉冲星候选体识别方法,其特征在于,对脉冲星的多特征图像和待测目标的多特征图像进行分割的软件包括MATLAB软件。
5.根据权利要求2所述的基于集成学习的脉冲星候选体识别方法,其特征在于,在分割脉冲星的多特征图像之前,方法还包括对脉冲星的多特征图像进行灰度化处理;在分割待测目标的多特征图像前,方法还包括对待测目标的多特征图像进行灰度化处理。
6.根据权利要求5所述的基于集成学习的脉冲星候选体识别方法,其特征在于,对脉冲星的多特征图像和待测目标的多特征图像进行灰度化处理的软件为MATLAB软件。
7.根据权利要求1所述的基于集成学习的脉冲星候选体识别方法,其特征在于,所述子模型包括:
用于进行脉冲星轮廓图识别的基于深度卷积网络和支持向量机的轮廓图识别模型;
用于进行脉冲星相位图识别的基于深度卷积生成对抗网络和支持向量机的相位图识别模型;
用于进行脉冲星周期和色散度值识别的基于深度卷积网络和随机森林的周期和色散度值识别模型;
用于进行脉冲星色散度曲线图识别的基于深度卷积生成对抗网络和支持向量机的色散度曲线图识别模型。
8.根据权利要求1所述的基于集成学习的脉冲星候选体识别方法,其特征在于,所述综合识别模型的表达式为:
T=F(a1M1(I1)+a2M2(I2)+a3M3(I3)+a4M4(I4))
式中,F为判别函数,T为判别结果,其值为1或0,判别结果为1表示测试目标是脉冲星,判别函数值为0表示测试目标不是脉冲星;
Mi(i=1,2,3,4)为第i个子模型的指示函数;Ii(i=1,2,3,4)为第i个子模型的指示函数的特征数据;ai为第i个子模型识别权重系数,ai为0到1之间的实数。
CN201910573104.4A 2019-06-28 2019-06-28 一种基于集成学习的脉冲星候选体识别方法 Withdrawn CN110263878A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910573104.4A CN110263878A (zh) 2019-06-28 2019-06-28 一种基于集成学习的脉冲星候选体识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910573104.4A CN110263878A (zh) 2019-06-28 2019-06-28 一种基于集成学习的脉冲星候选体识别方法

Publications (1)

Publication Number Publication Date
CN110263878A true CN110263878A (zh) 2019-09-20

Family

ID=67922814

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910573104.4A Withdrawn CN110263878A (zh) 2019-06-28 2019-06-28 一种基于集成学习的脉冲星候选体识别方法

Country Status (1)

Country Link
CN (1) CN110263878A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116611025A (zh) * 2023-05-19 2023-08-18 贵州师范大学 一种脉冲星候选信号的多模态特征融合方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109272026A (zh) * 2018-08-30 2019-01-25 昆明理工大学 一种基于卷积神经网络的脉冲星识别方法
CN109508746A (zh) * 2018-11-16 2019-03-22 西安电子科技大学 基于卷积神经网络的脉冲星候选体识别方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109272026A (zh) * 2018-08-30 2019-01-25 昆明理工大学 一种基于卷积神经网络的脉冲星识别方法
CN109508746A (zh) * 2018-11-16 2019-03-22 西安电子科技大学 基于卷积神经网络的脉冲星候选体识别方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
孙利雷: "基于深度学习的脉冲星识别系统设计与实现", 《中国优秀硕士学位论文全文数据库基础科学辑》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116611025A (zh) * 2023-05-19 2023-08-18 贵州师范大学 一种脉冲星候选信号的多模态特征融合方法
CN116611025B (zh) * 2023-05-19 2024-01-26 贵州师范大学 一种脉冲星候选信号的多模态特征融合方法

Similar Documents

Publication Publication Date Title
CN107132516B (zh) 一种基于深度置信网络的雷达一维距离像目标识别方法
CN109509187B (zh) 一种针对大分辨率布匹图像中的小瑕疵的高效检验算法
JP2020508531A (ja) 画像品質の評価方法及び画像品質の評価システム
CN109977234A (zh) 一种基于主题关键词过滤的知识图谱补全方法
CN108959794A (zh) 一种基于深度学习的结构频响动力学模型修正方法
CN105740404A (zh) 标签关联方法及装置
CN104598920B (zh) 基于Gist特征与极限学习机的场景分类方法
CN109346056A (zh) 基于深度度量网络的语音合成方法及装置
US20230306559A1 (en) Point cloud denoising method based on multi-level attention perception
CN113111786B (zh) 基于小样本训练图卷积网络的水下目标识别方法
CN115308799B (zh) 一种地震成像游离气构造识别方法及系统
CN114022446A (zh) 一种基于改进YOLOv3的皮革瑕疵检测方法及系统
CN111127454A (zh) 基于深度学习生成工业缺陷样本的方法及系统
CN109063983B (zh) 一种基于社交媒体数据的自然灾害损失实时评估方法
CN105895089A (zh) 一种语音识别方法及装置
CN110263878A (zh) 一种基于集成学习的脉冲星候选体识别方法
Cagas et al. PreFIC: Predictability of faculty instructional performance through hybrid prediction model
CN112489689B (zh) 基于多尺度差异对抗的跨数据库语音情感识别方法及装置
CN112052686B (zh) 一种用户交互式教育的语音学习资源推送方法
CN112330512A (zh) 知识蒸馏学习模型的预测方法、系统、设备及存储介质
Santika et al. Green entrepreneurial intention: A survey of students in Bali
CN108074240A (zh) 识别方法、识别装置、计算机可读存储介质及程序产品
CN111967276B (zh) 翻译质量评估方法及装置、电子设备、存储介质
CN114897884A (zh) 基于多尺度边缘特征融合的无参考屏幕内容图像质量评估方法
CN109726690A (zh) 基于DenseCap网络的学习者行为图像多区域描述方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20190920

WW01 Invention patent application withdrawn after publication