CN105718941B - 基于模糊大间隔最小球分类的恒星光谱离群数据挖掘方法 - Google Patents

基于模糊大间隔最小球分类的恒星光谱离群数据挖掘方法 Download PDF

Info

Publication number
CN105718941B
CN105718941B CN201610031687.4A CN201610031687A CN105718941B CN 105718941 B CN105718941 B CN 105718941B CN 201610031687 A CN201610031687 A CN 201610031687A CN 105718941 B CN105718941 B CN 105718941B
Authority
CN
China
Prior art keywords
sample
sigma
class
alpha
fuzzy
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201610031687.4A
Other languages
English (en)
Other versions
CN105718941A (zh
Inventor
刘忠宝
赵文娟
杨秋翔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
North University of China
Original Assignee
North University of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by North University of China filed Critical North University of China
Priority to CN201610031687.4A priority Critical patent/CN105718941B/zh
Publication of CN105718941A publication Critical patent/CN105718941A/zh
Application granted granted Critical
Publication of CN105718941B publication Critical patent/CN105718941B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2413Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
    • G06F18/24133Distances to prototypes

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)

Abstract

本发明提供了一种基于模糊大间隔最小球分类的恒星光谱离群数据挖掘方法,首先选取训练样本集,然后构建基于模糊大间隔最小球分类模型,接着定义决策函数,最后利用决策函数对测试样本集进行类别判定。在该模型中,模糊技术的引入保证将样本区别对待,这样便减少噪声点和奇异点对分类结果的影响。本发明基于模糊最大间隔最小球模型对离群点较为敏感,在一定程度上克服了已有分类方法在特殊天体发现方面的不足,为特殊天体发现研究提供了新的思路。

Description

基于模糊大间隔最小球分类的恒星光谱离群数据挖掘方法
技术领域
本发明涉及一种基于模糊大间隔最小球分类的恒星光谱离群数据挖掘方法,属于天体光谱分类领域。
背景技术
大型天文望远镜采集到的海量天体数据使天文学家摆脱了“数据贫乏”的窘境,但随之而来的问题是如何对这些数据进行有效分析和处理。由于人类对宇宙的认识还较为有限,因此,大型天文望远镜巡天的任务之一就是发现一些新的、特殊的天体。特殊天体的发现对于人类了解宇宙演变规律具有重要意义。目前,常见特殊天体发现方法的基本思想是利用智能分类算法对离群数据进行处理和分析。离群数据是指不满足其他数据的一般规律或分布性状,与已有数据不一致的数据。与一般数据相比,离群数据包含更重要的信息,深入挖掘这部分数据对于特征天体发现至关重要。
近年来天体光谱数据分类方法不断涌现,主要包括:Autoclass基于贝叶斯理论并采用非监督学习算法;Starck将小波变换引入光谱分析;Gulati等采用两层BP网络实现恒星光谱分类;Bailer-Jones利用多层感知神经网络和主元分析进行恒星光谱自动分类;覃冬梅等利用主元分析和最近邻分类器实现恒星光谱自动分类;刘蓉等利用小波特征对光谱星系进行分类;杨金福等提出基于核技巧与覆盖算法的光谱自动分类方法;许馨等利用核技巧将非线性问题转化为高维线性问题并利用线性判别分析算法进行光谱分类;赵梅芳等提出基于自适应增强的光谱分类方法;孙士卫等提出基于数据仓库的星系光谱分类方法;张怀福等利用小波包和支持向量机技术对活动天体和非天体光谱分类问题展开研究;张继福等提出基于约束概念格的恒星光谱数据自动分类方法;刘蓉等提出基于贝叶斯和主元分析的光谱分类方法;李乡儒等提出基于最近邻算法的光谱分类方法;Mahdi利用自组织映射算法进行光谱分类;Navarro等利用人工神经网络进行光谱分类;刘忠宝等提出基于流形判别分析和支持向量机的恒星光谱分类方法。
上述分类方法均能较好地完成天体光谱分类任务,但它们均对离群数据不敏感,分类性能甚至受离群点影响较大,因而无法完成特殊天体发现任务。
发明内容
为了解决现有技术的不足,本发明提供了一种基于模糊大间隔最小球分类的恒星光谱离群数据挖掘方法,该方法基于模糊最大间隔最小球模型(Fuzzy Large Margin andMinimum Ball Classification Model,FLM-MBC),该模型对离群点较为敏感,在一定程度上克服了已有分类方法在特殊天体发现方面的不足,为特殊天体发现研究提供了新的思路。在该模型中,模糊技术的引入保证将样本区别对待,这样便减少噪声点和奇异点对分类结果的影响。
本发明为解决其技术问题所采用的技术方案是:提供了一种基于模糊大间隔最小球分类的恒星光谱离群数据挖掘方法,包括以下步骤:
(1)对于斯隆望远镜采集回的天体光谱数据,根据每一个光谱数据的流量、峰宽和形状将其离散化,得到待处理的数据集;假设所述样本集由m1′个一般类样本和m2′个离群类样本构成,样本总数n′=m1′+m2′,m2′<<m1′;由m1′个一般类样本组成的集合中xi表示一般类样本,1≤i≤m1′,yi表示类别标签,yi=1表示该样本属于一般类;m2′个离群类样本组成的集合中xj表示离群类样本,m1′+1≤j≤n′,yj表示类别标签,yj=-1,表示该样本属于离群类;从样本集中随机选取n个样本构成训练样本集,使训练样本集中的一般类样本和离群类样本的数量分别为m1和m2,比例保持为m1/m2=m1′/m2′,样本集中除其训练样本集以外的样本组成测试样本集;
(2)利用训练样本集构建基于模糊大间隔最小球分类模型,所述基于模糊大间隔最小球分类模型的最优化问题为:
其约束条件为:
其中,c和R分别为待求的最小球的中心和半径;ρ2为待求的最小球边界与离群类样本之间的间隔;ξ=[ξ12,...,ξn]T为待求的松弛因子;s=[s1,s2,...,sn]T为模糊因子,通过模糊隶属度函数s(x)计算得到,sk=s(xk),1≤k≤n;v、v1和v2为正常数,通过网格搜索策略获得;φ(xi)为样本x的核化形式;
(3)利用Lagrangian乘子法将最优化问题转化为QP对偶形式,求得最小球的球心c,根据球心c定义决策函数;
(4)利用决策函数对测试样本集中的样本进行类别判定,以判别测试样本集中的样本属于一般类或离群类。
步骤(2)中,所述模糊隶属度函数采用基于距离的隶属度函数:
其中,为训练样本集的类中心,即训练样本集中所有样本的均值,r为训练样本集的类半径且δ为正数,其取值范围为(10-3,10-2),它保证s(xi)>0。
将基于模糊大间隔最小球分类模型的最优化问题表示为Lagrangian函数为:
其中,αi和βj为拉格朗日乘子且αi>0,βj>0;
对L(R,c,ρ,ξ,α,β)分别对R、c、ρ、ξ、α和β进行求导并令导数为0,得到:
将上述求导后得到的式子代入Lagrangian函数得到最优化问题的QP对偶形式为:
其中核函数K(x,y)=φ(x)Tφ(y)。
步骤(3)所述的决策函数为:
其中,若f(x)>0,则样本x是一般类,否则样本x是离群类。
本发明基于其技术方案所具有的有益效果在于:
(1)本发明的一种基于模糊大间隔最小球分类的恒星光谱离群数据挖掘方法,基于模糊最大间隔最小球模型(Fuzzy Large Margin and Minimum Ball ClassificationModel,FLM-MBC),该模型对离群点较为敏感,在一定程度上克服了已有分类方法在特殊天体发现方面的不足,为特殊天体发现研究提供了新的思路;
(2)本发明的一种基于模糊大间隔最小球分类的恒星光谱离群数据挖掘方法,在FLM-MBC模型中引入了模糊技术,保证将样本区别对待,这样便减少噪声点和奇异点对分类结果的影响;
(3)本发明的一种基于模糊大间隔最小球分类的恒星光谱离群数据挖掘方法,其模型容易利用Lagrangian乘子法将最优化问题转化为QP对偶形式,计算效率高;
(4)实验对比证实本发明的一种基于模糊大间隔最小球分类的恒星光谱离群数据挖掘方法,具有更优的分类能力,能够较好地完成离群数据发现任务,并且如果两类天体光谱数据差异较大,本发明所提供的基于模糊大间隔最小球分类的恒星光谱离群数据挖掘方法的识别率结果更优,说明本发明所提供的方法在特殊天体方面的优越性。
具体实施方式
下面结合实施例对本发明作进一步说明。
本发明的基于模糊大间隔最小球分类的恒星光谱离群数据挖掘方法原理为:
本发明采用了支持向量数据描述(Support Vector Data Description,SVDD),SVDD是一种常见的新颖检测方法,其目标是找到一个以c为球心,R为半径的球状模型。建立该球状模型的关键是确定其球心和半径,它们可由如下最优化问题求得:
线性形式:
minR2 (1)
s.t. ||c-xi||2≤R2 i=1,...,N (2)
其中c和R分别为最小包含球的球心和半径。
非线性形式:
minR2
其中N和分别表示样本数和原始空间到高维空间的映射函数。
上述优化问题的对偶形式如下:
s.t. αT1=1,α≥0 (5)
其中α=[α1,...,αN]T,1=[1,...,1]T,核函数0=[0,...,0]T
本发明采用了模糊技术,模糊技术用于处理不精确或不确定性信息,模糊技术将某特征属于某集合的程度由0和1之间的隶属度来表示,常用的隶属度函数有:
(1)基于距离的隶属度函数:
其中,为类中心,r为类半径且δ为很小的正数,其取值范围为(10-3,10-2),它保证s(xi)>0。
(2)基于紧密度的隶属度函数:
其中,分别表示两类半径,分别表示两类中心,表示两类中心间距,分别表示各样本到其类中心的距离,ε为半径控制因子,ε>0,δ为很小的正数,其取值范围为(10-3,10-2),它保证
为了解决传统分类方法无法解决的离群样本发现问题,本发明提出了模糊大间隔最小球分类模型FLM-MBC,该模型的基本思想是首先利用部分一般类样本和离群类样本构建最小球模型;然后,为了减小错分离群类样本的可能性,特将最小球边界与离群类样本之间的间隔最大化;最后,通过引入模糊技术,使得FLM-MBC将样本区别对待,从而少噪声对分类结果的影响。
基于上述原理,本发明提供的一种基于模糊大间隔最小球分类的恒星光谱离群数据挖掘方法,包括以下步骤:
(1)对于斯隆望远镜采集回的天体光谱数据,根据每一个光谱数据的流量、峰宽和形状将其离散化,得到待处理的数据集;假设所述样本集由m1′个一般类样本和m2′个离群类样本构成,样本总数n′=m1′+m2′,一般情况下,离群类样本数远小于一般类样本数,则m2′<<m1′,由m1′个一般类样本组成的集合中xi表示一般类样本,1≤i≤m1′,yi表示类别标签,yi=1表示该样本属于一般类;m2′个离群类样本组成的集合中xj表示离群类样本,m1′+1≤j≤n′,yj表示类别标签,yj=-1,表示该样本属于离群类;从样本集中随机选取n个样本构成训练样本集,使训练样本集中的一般类样本和离群类样本的数量分别为m1和m2,比例保持为m1/m2=m1′/m2′,样本集中除其训练样本集以外的样本组成测试样本集;
(2)利用训练样本集构建基于模糊大间隔最小球分类模型,所述基于模糊大间隔最小球分类模型的最优化问题为:
其约束条件为:
其中,c和R分别为待求的最小球的中心和半径;ρ2为待求的最小球边界与离群类样本之间的间隔;ξ=[ξ12,...,ξn]T为待求的松弛因子;s=[s1,s2,...,sn]T为模糊因子,通过模糊隶属度函数s(x)计算得到,sk=s(xk),1≤k≤n;v、v1和v2为正常数,通过网格搜索策略获得;φ(xi)为样本x的核化形式;
一般的模糊隶属度函数都可以有效地表征不同样本的重要程度。鉴于天体数据结构复杂的特性,本发明选取模糊隶属度函数的主要依据是其计算效率。
所述模糊隶属度函数采用基于距离的隶属度函数:
其中,为训练样本集的类中心,即训练样本集中所有样本的均值,r为训练样本集的类半径且δ为正数,其取值范围为(10-3,10-2),它保证s(xi)>0。
所述模糊隶属度函数也可以采用基于紧密度的隶属度函数:
其中,分别表示一般样本和离群样本的类半径,分别表示一般样本和离群样本的类中心,表示一般样本和离群样本这两类的中心间距,分别表示样本到其类中心的距离,ε为半径控制因子,ε>0,δ为正数,其取值范围为(10-3,10-2),它保证
(3)利用Lagrangian乘子法将最优化问题转化为QP对偶形式,求得最小球的球心c,根据球心c定义决策函数;具体包括以下过程:
将基于模糊大间隔最小球分类模型的最优化问题表示为Lagrangian函数为:
其中,αi和βj为拉格朗日乘子且αi>0,βj>0;
对L(R,c,ρ,ξ,α,β)分别对R、c、ρ、ξ、α和β进行求导并令导数为0,得到:
利用式(15)可求得FLM-MBC的球心c;利用式(11)可求得FLM-MBC的最小球半径R;利用式(12)可以求得FLM-MBC的最小球边界与离群类样本之间的间隔ρ2
将上述求导后得到的式子(11)至(15)代入Lagrangian函数式(10)得到最优化问题的QP对偶形式为:
其中核函数K(x,y)=φ(x)Tφ(y);
将球心c代入下式即得到决策函数为:
其中,
(4)利用式(21)给出的决策函数对测试样本集中的样本进行类别判定,以判别测试样本集中的样本属于一般类或离群类;若f(x)>0,则样本x是一般类,否则样本x是离群类。
FLM-MBC决策函数的基本思想是对于一个类属未知的样本x,考察其与最小球球心之间的距离,若该距离小于半径,则该样本为一般类样本;若该距离大于半径,则该样本为离群类样本。
下面将本发明的基于模糊大间隔最小球分类的恒星光谱离群数据挖掘方法进行实验分析。
实验采用美国斯隆望远镜巡天发布的第8批恒星光谱数据SDSS DR8。将K型中的5500条K1次型光谱数据作为一般类样本集,将500条K7次型光谱数据作为离群类样本集。实验数据经过如下预处理:(1)选择间隔为20的200个波长作为条件属性;(2)根据每一个波长处的流量、峰宽和形状,将其离散化为十三中数值之一;(3)恒星类别为决策属性。实验分别选取一般样本集和离群样本集的30%、40%、50%、60%、70%作为训练样本集,剩余的光谱数据作为测试样本集。实验选用基于距离的模糊隶属度函数。
FLM-MBC的有效性通过与C-SVM、SVDD、KNN等当前主流分类方法的比较实验验证。本实验参数的获取方式采用10倍交叉验证法。利用网格搜索策略可对最佳实验参数进行选择。C-SVM中的参数C在网格{0.1,0.5,1,5,10}中搜索;KNN中参数K在网格{1,3,5,7,9}中搜索;FLM-MBC中的参数v、v1、v2在网格{0.1,0.2,0.3,0.4,0.5,0.6,0.7,0.8,0.9}中搜索。实验重点考察上述算法对离群样本的识别率,实验结果存放于表1,其中Training Size、TestSize、Average分别表示训练样本集大小、测试样本集大小以及平均分类性能。在TrainingSize和Test Size中,括号前的值表示训练样本和测试样本的规模,括号中的值依次表示一般样本和离群样本的规模。
表1 各方法的分类结果
由表1可以看出,随着训练样本规模的增大,各类算法的分类效率均有不同程度的提升。当选取不同的训练样本规模时,FLM-MBC较之C-SVM、SVDD、KNN等传统方法均具有更优的分类能力。从平均分类性能看,FLM-MBC亦具有较大优势。究其原因,一方面FLM-MBC在建立最优化问题时就将离群数据考虑在内;另一方面,模糊技术的引入,使得FLM-MBC在分类决策时减小了噪声对分类结果的影响。
上述实验选取的是SDSSDR8中的K型恒星数据K1次型和K7次型,两种次型具有较大的相似性,但从分类效果看,本文所提算法FLM-MBC能较好地完成离群类数据发现任务。在实际应用中,如果两类天体光谱数据差异较大,FLM-MBC的识别率较之本实验所得结果则更优,这说明FLM-MBC在特殊天体方面的优越性。

Claims (3)

1.一种基于模糊大间隔最小球分类的恒星光谱离群数据挖掘方法,其特征在于包括以下步骤:
(1)对于斯隆望远镜采集回的天体光谱数据,根据每一个光谱数据的流量、峰宽和形状将其离散化,得到待处理的数据集;假设样本集由m1′个一般类样本和m2′个离群类样本构成,样本总数n′=m1′+m2′,m2′<<m1′;由m1′个一般类样本组成的集合中xi表示一般类样本,1≤i≤m1′,yi表示类别标签,yi=1表示该样本属于一般类;m2′个离群类样本组成的集合中xj表示离群类样本,m1′+1≤j≤n′,yj表示类别标签,yj=-1,表示该样本属于离群类;从样本集中随机选取n个样本构成训练样本集,使训练样本集中的一般类样本和离群类样本的数量分别为m1和m2,比例保持为m1/m2=m1′/m2′,样本集中除其训练样本集以外的样本组成测试样本集;
(2)利用训练样本集构建基于模糊大间隔最小球分类模型,所述基于模糊大间隔最小球分类模型的最优化问题为:
m i n R , c , &rho; , &xi; R 2 - v&rho; 2 + 1 v 1 m 1 &Sigma; i = 1 m 1 s i &xi; i + 1 v 2 m 2 &Sigma; j = m 1 + 1 m 2 s j &xi; j
其约束条件为:
s.t. ||φ(xi)-c||2≤R2i 1≤i≤m1
||φ(xj)-c||2≥R22j m1+1≤j≤n
ξk≥0 1≤k≤n
其中,c和R分别为待求的最小球的中心和半径;ρ2为待求的最小球边界与离群类样本之间的间隔;ξ=[ξ12,...,ξn]T为待求的松弛因子;s=[s1,s2,...,sn]T为模糊因子,通过模糊隶属度函数s(x)计算得到,sk=s(xk),1≤k≤n;v、v1和v2为正常数,通过网格搜索策略获得;φ(xi)为样本x的核化形式;所述模糊隶属度函数采用基于距离的隶属度函数:
s ( x i ) = 1 - | | x i - x &OverBar; | | r + &delta;
其中,为训练样本集的类中心,即训练样本集中所有样本的均值,r为训练样本集的类半径且δ为正数,其取值范围为(10-3,10-2),它保证s(xi)>0;
(3)利用Lagrangian乘子法将最优化问题转化为QP对偶形式,求得最小球的球心c,根据球心c定义决策函数;
(4)利用决策函数对测试样本集中的样本进行类别判定,以判别测试样本集中的样本属于一般类或离群类。
2.根据权利要求1所述的基于模糊大间隔最小球分类的恒星光谱离群数据挖掘方法,其特征在于:步骤(3)所述利用Lagrangian乘子法将最优化问题转化为QP对偶形式,具体包括以下过程:
将基于模糊大间隔最小球分类模型的最优化问题表示为Lagrangian函数为:
L ( R , c , &rho; , &xi; , &alpha; , &beta; ) = R 2 - v&rho; 2 + 1 v 1 m 1 &Sigma; i = 1 m 1 s i &xi; i + 1 v 2 m 2 &Sigma; j = m 1 + 1 n s j &xi; j + &Sigma; i = 1 m 1 &alpha; i ( | | &phi; ( x i ) - c | | 2 - R 2 - &xi; i ) - &Sigma; j = m 1 + 1 n &beta; j ( | | &phi; ( x j ) - c | | 2 - R 2 - &rho; 2 + &xi; j ) - &Sigma; k = 1 n &beta; k &beta; k
其中,αi和βj为拉格朗日乘子且αi>0,βj>0;
对L(R,c,ρ,ξ,α,β)分别对R、c、ρ、ξ、α和β进行求导并令导数为0,得到:
&part; L &part; R = 2 R ( 1 - &Sigma; i = 1 n &alpha; i y i ) = 0
&part; L &part; &rho; = 2 &rho; ( &Sigma; j = m 1 + 1 n &alpha; j - v ) = 0
&part; L &part; &xi; i = s i v 1 m 1 - &alpha; i - &beta; i = 0 1 &le; i &le; m 1
&part; L &part; &xi; j = s j v 2 m 2 - &alpha; j - &beta; j = 0 m 1 + 1 &le; j &le; n
&part; L &part; c = 2 c &Sigma; i = 1 n &alpha; i y i - 2 c &Sigma; i = 1 n &alpha; i y i &phi; ( x i ) = 0 &DoubleRightArrow; c = &Sigma; i = 1 n &alpha; i y i &phi; ( x i ) &Sigma; i = 1 n &alpha; i y i = &Sigma; i = 1 n &alpha; i y i &phi; ( x i )
将上述求导后得到的式子代入Lagrangian函数得到最优化问题的QP对偶形式为:
m i n R , c , &rho; , &xi; &Sigma; i = 1 n &Sigma; j = 1 n &alpha; i &alpha; j y i y j K ( x i , x j ) - &Sigma; i = 1 n &alpha; i y i K ( x i , x i )
s . t . 0 &le; &alpha; i &le; s i v 1 m 1 1 &le; i &le; m 1
0 &le; &alpha; j &le; s j v 2 m 2 m 1 + 1 &le; j &le; n
&Sigma; i = 1 n &alpha; i y i = 1
&Sigma; i = 1 n &alpha; i = 2 v + 1
其中核函数K(x,y)=φ(x)Tφ(y)。
3.根据权利要求2所述的基于模糊大间隔最小球分类的恒星光谱离群数据挖掘方法,其特征在于:步骤(3)所述的决策函数为:
f ( x ) = s g n ( R 2 - | | &phi; ( x ) - c | | 2 ) = s g n ( R 2 - < c , c > - K ( x , x ) + 2 &Sigma; k = 1 n &alpha; k y k K ( x , x k ) )
其中,若f(x)>0,则样本x是一般类,否则样本x是离群类。
CN201610031687.4A 2016-01-18 2016-01-18 基于模糊大间隔最小球分类的恒星光谱离群数据挖掘方法 Expired - Fee Related CN105718941B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610031687.4A CN105718941B (zh) 2016-01-18 2016-01-18 基于模糊大间隔最小球分类的恒星光谱离群数据挖掘方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610031687.4A CN105718941B (zh) 2016-01-18 2016-01-18 基于模糊大间隔最小球分类的恒星光谱离群数据挖掘方法

Publications (2)

Publication Number Publication Date
CN105718941A CN105718941A (zh) 2016-06-29
CN105718941B true CN105718941B (zh) 2017-06-27

Family

ID=56147332

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610031687.4A Expired - Fee Related CN105718941B (zh) 2016-01-18 2016-01-18 基于模糊大间隔最小球分类的恒星光谱离群数据挖掘方法

Country Status (1)

Country Link
CN (1) CN105718941B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108537290A (zh) * 2018-04-25 2018-09-14 攀枝花学院 基于数据分布特征及模糊隶属度函数的恒星光谱分类方法
CN110555054B (zh) * 2018-06-15 2023-06-09 泉州信息工程学院 一种基于模糊双超球分类模型的数据分类方法及系统

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
《A Small Sphere and Large Margin Approach for Novelty Detection Using Training Data with Outliers》;Mingrui Wu等;《IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE》;20091130;第31卷(第11期);第2088-2092页 *
《基于流形模糊双支持向量机的恒星光谱分类方法》;刘忠宝等;《光谱学与光谱分析》;20150131;第35卷(第1期);第263-265页 *
《大间隔最小压缩包含球学习机》;陶剑文等;《软件学报》;20120630;第23卷(第6期);第1458-1471页 *
《总间隔模糊超球学习机》;陶剑文等;《模式识别与人工智能》;20120430;第25卷(第2期);第237-246页 *
《流形判别分析和支持向量机的恒星光谱数据自动分类方法》;刘忠宝等;《光谱学与光谱分析》;20140131;第34卷(第1期);第263-266页 *

Also Published As

Publication number Publication date
CN105718941A (zh) 2016-06-29

Similar Documents

Publication Publication Date Title
Wen et al. Big data driven marine environment information forecasting: a time series prediction network
CN106779087B (zh) 一种通用机器学习数据分析平台
CN110266672B (zh) 基于信息熵和置信度下采样的网络入侵检测方法
CN109492673A (zh) 一种基于谱聚类采样的不平衡数据预测方法
CN105574642A (zh) 一种基于智能电网大数据的电价执行稽查方法
CN105718941B (zh) 基于模糊大间隔最小球分类的恒星光谱离群数据挖掘方法
Zhang et al. Machine training and parameter settings with social emotional optimization algorithm for support vector machine
CN112906790A (zh) 一种基于用电数据的独居老人识别方法和系统
CN113657678A (zh) 一种基于信息新鲜度的电网电力数据预测方法
Al-Gunaid et al. Forecasting energy consumption with the data reliability estimatimation in the management of hybrid energy system using fuzzy decision trees
CN106056167A (zh) 一种基于高斯核混合人工蜂群算法的归一化可能性模糊熵聚类方法
CN112215490B (zh) 一种基于相关性系数改进K-means的电力负荷聚类分析方法
CN103020864B (zh) 玉米良种选育方法
CN115796402B (zh) 一种基于组合模型的空气质量指数预测方法
Mao et al. Naive Bayesian algorithm classification model with local attribute weighted based on KNN
CN106340874A (zh) 电力负荷分解的辨识决策方法和系统
Miao et al. Ultra-short-term prediction of wind power based on sample similarity analysis
Ma The Research of Stock Predictive Model based on the Combination of CART and DBSCAN
CN110738249B (zh) 一种基于深度神经网络的极光图像聚类方法
CN111768066B (zh) 基于融合特征的园区电热负荷耦合关系分析方法及装置
CN114185956A (zh) 基于canopy、k-means算法的数据挖掘方法
Anke et al. Clustering analysis of gene data based on PCA and SOM neural networks
Zhu Improvement of spatial data clustering algorithm in city location
CN107665379A (zh) 一种基于气象特征的风电场风速超短期预测方法
Cai et al. A new method for clustering of boundary spectra

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20170627

Termination date: 20190118