CN110555054A - 一种基于模糊双超球分类模型的数据分类方法及系统 - Google Patents
一种基于模糊双超球分类模型的数据分类方法及系统 Download PDFInfo
- Publication number
- CN110555054A CN110555054A CN201810623801.1A CN201810623801A CN110555054A CN 110555054 A CN110555054 A CN 110555054A CN 201810623801 A CN201810623801 A CN 201810623801A CN 110555054 A CN110555054 A CN 110555054A
- Authority
- CN
- China
- Prior art keywords
- fuzzy
- hypersphere
- model
- class
- training sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000013145 classification model Methods 0.000 title claims abstract description 65
- 238000000034 method Methods 0.000 title claims abstract description 61
- 238000012549 training Methods 0.000 claims abstract description 210
- 230000009977 dual effect Effects 0.000 claims description 29
- 239000011159 matrix material Substances 0.000 claims description 24
- 238000005457 optimization Methods 0.000 claims description 18
- 108010074864 Factor XI Proteins 0.000 claims description 6
- 230000008569 process Effects 0.000 abstract description 3
- 230000006870 function Effects 0.000 description 72
- 235000019892 Stellar Nutrition 0.000 description 17
- 238000001228 spectrum Methods 0.000 description 14
- 238000012706 support-vector machine Methods 0.000 description 13
- 238000012360 testing method Methods 0.000 description 13
- 230000003595 spectral effect Effects 0.000 description 11
- 238000010586 diagram Methods 0.000 description 10
- 238000004590 computer program Methods 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 230000000052 comparative effect Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000006872 improvement Effects 0.000 description 3
- 238000003860 storage Methods 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 2
- 229910001006 Constantan Inorganic materials 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T90/00—Enabling technologies or technologies with a potential or indirect contribution to GHG emissions mitigation
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及一种基于模糊双超球分类模型的数据分类方法及系统,所述方法包括:获取待测数据;通过预先建立的模糊双超球分类模型的决策函数确定所述待测数据的分类结果;其中,所述模糊双超球分类模型包括决策函数和两个模糊超球模型;所述决策函数通过两个模糊超球模型的最优球心和最优半径进行确定,所述两个模糊超球模型的最优球心和最优半径通过对各自的训练样本集进行训练确定,采用该技术方案不仅时间复杂度低,效率更高,同时在构建超球模型的过程中引入模糊隶属度函数,避免现有技术中易受奇异点和噪声点影响的问题,实现高精确度的数据分类。
Description
技术领域
本发明涉及数据分类技术领域,具体涉及一种基于模糊双超球分类模型的数据分类方法及系统。
背景技术
随着高科技数据采集和探测技术的发展,获取数据的途径越来月光,效率也大幅上升,观测数据的规模也日益庞大,传统的数据分类方法无法满足实际需要,需将智能分类方法引入到数据分类方法中,在现有的数据分类方法中,应用比较广泛的有支持向量机(Support Vector Machine,SVM)和双支持向量机(Twin Support Vector Machine,TWSVM);其中,支持向量机通过构建一个超平面达到对数据进行分类的效果,但由于时间复杂度过高,导致计算效率低下,双支持向量机采用构造一对分类超平面将两类数据分开,该方法的时间复杂度仅是SVM的1/4,这在很大程度上提高了支持向量机的计算效率。然而,该方法易受到奇异点和噪声点的影响,分类精度有待提高。
发明内容
本发明提供种基于模糊双超球分类模型的数据分类方法及系统,其目的是通过训练每一类训练样本数据分别构造两个模糊超球模型,然后利用两个模糊超球模型的最优球心和最优确定决策函数并达到数据分类的目的,其中引入模糊隶属度函数,有效地降低了奇异点和噪声点对分类结果的影响,提升分类精确度。
本发明的目的是采用下述技术方案实现的:
一种基于模糊双超球分类模型的数据分类方法,其改进之处在于,所述方法包括:
获取待测数据;
通过预先建立的模糊双超球分类模型的决策函数确定所述待测数据的分类结果;
其中,所述模糊双超球分类模型包括决策函数和两个模糊超球模型;所述决策函数通过两个模糊超球模型的最优球心和最优半径进行确定,所述两个模糊超球模型的最优球心和最优半径通过对各自的训练样本集进行训练确定;所述两个模糊超球模型的训练样本集为分别从对应类型的实验数据中随机抽取的数据集合。
优选地,所述决策函数通过两个模糊超球模型的最优球心和最优半径进行确定,包括:按下式确定所述模糊双超球分类模型的决策函数f(x):
式中,c'+为第一模糊超球模型的最优球心,c'-为第二模糊超球模型的最优球心,R'+为第一模糊超球模型的最优半径,R'-为第二模糊超球模型的最优半径,x为待测样本点。
优选地,所述两个模糊超球模型的最优球心和最优半径通过对各自的训练样本集进行训练确定,包括:
从所述实验数据中随机抽取数据确定为训练样本集,并根据实验数据的类别标签将所述训练样本集分为第一类训练样本集和第二类训练样本集;
分别对所述第一类训练样本集和第二类训练样本集进行训练构建第一模糊超球模型和第二模糊超球模型;
利用拉普拉斯乘子法,引入拉格朗日乘子,将第一模糊超球模型和第二模糊超球模型的最优化问题转换为对偶形式,获取数据模糊双超球分类模型的最优球心和最优半径。
进一步地,所述分别对所述第一类训练样本集和第二类训练样本集进行训练构建第一模糊超球模型和第二模糊超球模型,包括:
按下式训练所述第一类训练样本集构建第一模糊超球模型:
按下式训练所述第二类训练样本集构建第二模糊超球模型:
其中,c+为第一模糊超球模型的球心,c-为第二模糊超球模型的球心,R+为第一模糊超球模型的半径,R-为第二模糊超球模型的半径,τ+为第一模糊超球模型的样本矩阵,τ-为第二模糊超球模型的样本矩阵,xi为第一类训练样本集的第i个样本点,i∈(1,l-),xj为第二类训练样本集的第j个样本点,j∈(1,l+),l+为第一类训练样本集的样本规模,l-为第二类训练样本集的样本规模,l++l-=l,l为两类训练样本集的总样本规模;c1为第一模糊超球模型的惩罚因子,c1>0,c2为第二模糊超球模型的惩罚因子,c2>0;ν1为第一模糊超球模型的平衡参数,ν1>0,ν2为第二模糊超球模型的平衡参数,ν2>0;si为第一模糊超球模型第i个样本点对应的模糊隶属度函数,sj为第二模糊超球模型第j个样本点对应的模糊隶属度函数,ξi为第一模糊超球模型第i个样本点对应的松弛因子,ξj为第二模糊超球模型第j个样本点对应的松弛因子。
进一步地,按下式确定所述第一模糊超球模型第i个样本点对应的模糊隶属度函数si:
按下式确定所述第二模糊超球模型第j个样本点对应的模糊隶属度函数sj
其中,δ>0,δ∈(10-3,10-2), 为第一类训练样本集的类中心,r+为第一类训练样本集的类半径; 为第二类训练样本集的类中心,r-为第二类训练样本集的类半径,δ为干扰因子。
进一步地,所述利用拉普拉斯乘子法,引入拉格朗日乘子,将第一模糊超球模型和第二模糊超球模型的最优化问题转换为对偶形式,获取数据模糊双超球分类模型的最优球心和最优半径,包括:
按下式将第一模糊超球模型的最优化问题转换为对偶形式:
其中,第一模糊超球模型的最优球心c'+为:
第一模糊超球模型的最优半径R'+为:
式中,xi为第一类训练样本集的第i个样本点,i∈(1,l-),xj为第二类训练样本集的第j个样本点,j∈(1,l+),l+为第一类训练样本集的样本规模,l++l-=l,l为两类训练样本集的总样本规模,l-为第一类训练样本集的样本规模,c1为第一模糊超球模型的惩罚因子,c1>0,ξi为第一模糊超球模型第i个样本点对应的松弛因子,αi、ri和s为拉格朗日乘子,si为第一模糊超球模型第i个样本点对应的模糊隶属度函数,τ+为第一模糊超球模型的样本矩阵,ν1为第一模糊超球模型的平衡参数,ν1>0,
按下式将第二超球分类模型转换为对偶形式:
其中,第二模糊超球模型的最优球心c-为:
第二模糊超球模型的最优半径R+为:
式中,c2为第一模糊超球模型的惩罚因子,c2>0,ξj为第二模糊超球模型第j个样本点对应的松弛因子,βj为拉格朗日乘子,sj为第二模糊超球模型第j个样本点对应的模糊隶属度函数,τ-为第二模糊超球模型的样本矩阵,ν2第二模糊超球模型的平衡参数,ν2>0,
一种基于模糊双超球分类模型的数据分类系统,其改进之处在于,所述系统包括:
获取模块,用于获取待测数据;
执行模块,用于通过预先建立的模糊双超球分类模型的决策函数确定所述待测数据的分类结果;
其中,所述模糊双超球分类模型包括决策函数和两个模糊超球模型;所述决策函数通过两个模糊超球模型的最优球心和最优半径进行确定,所述两个模糊超球模型的最优球心和最优半径通过对各自的训练样本集进行训练确定;所述两个模糊超球模型的训练样本集为分别从对应类型的实验数据中随机抽取的数据集合。
优选地,按下式确定所述模糊双超球分类模型的决策函数f(x):
式中,c'+为第一模糊超球模型的最优球心,c'-为第二模糊超球模型的最优球心,R'+为第一模糊超球模型的最优半径,R'-为第二模糊超球模型的最优半径,x为待测样本点。
优选地,所述两个模糊超球模型的最优球心和最优半径通过对各自的训练样本集进行训练确定,包括:
从所述实验数据中随机抽取数据确定为训练样本集,并根据实验数据的类别标签将所述训练样本集分为第一类训练样本集和第二类训练样本集;
分别对所述第一类训练样本集和第二类训练样本集进行训练构建第一模糊超球模型和第二模糊超球模型;
利用拉普拉斯乘子法,引入拉格朗日乘子,将第一模糊超球模型和第二模糊超球模型的最优化问题转换为对偶形式,获取数据模糊双超球分类模型的最优球心和最优半径。
进一步地,所述分别对所述第一类训练样本集和第二类训练样本集进行训练构建第一模糊超球模型和第二模糊超球模型,包括:
按下式训练所述第一类训练样本集构建第一模糊超球模型:
按下式训练所述第二类训练样本集构建第二模糊超球模型:
其中,c+为第一模糊超球模型的球心,c-为第二模糊超球模型的球心,R+为第一模糊超球模型的半径,R-为第二模糊超球模型的半径,τ+为第一模糊超球模型的样本矩阵,τ-为第二模糊超球模型的样本矩阵,xi为第一类训练样本集的第i个样本点,i∈(1,l-),xj为第二类训练样本集的第j个样本点,j∈(1,l+),l+为第一类训练样本集的样本规模,l-为第二类训练样本集的样本规模,l++l-=l,l为两类训练样本集的总样本规模;c1为第一模糊超球模型的惩罚因子,c1>0,c2为第二模糊超球模型的惩罚因子,c2>0;ν1为第一模糊超球模型的平衡参数,ν1>0,ν2为第二模糊超球模型的平衡参数,ν2>0;si为第一模糊超球模型第i个样本点对应的模糊隶属度函数,sj为第二模糊超球模型第j个样本点对应的模糊隶属度函数,ξi为第一模糊超球模型第i个样本点对应的松弛因子,ξj为第二模糊超球模型第j个样本点对应的松弛因子。
进一步地,按下式确定所述第一模糊超球模型第i个样本点对应的模糊隶属度函数si:
按下式确定所述第二模糊超球模型第j个样本点对应的模糊隶属度函数sj
其中,δ>0,δ∈(10-3,10-2), 为第一类训练样本集的类中心,r+为第一类训练样本集的类半径; 为第二类训练样本集的类中心,r-为第二类训练样本集的类半径,δ为干扰因子。
进一步地,所述利用拉普拉斯乘子法,引入拉格朗日乘子,将第一模糊超球模型和第二模糊超球模型的最优化问题转换为对偶形式,获取数据模糊双超球分类模型的最优球心和最优半径,包括:
按下式将第一模糊超球模型的最优化问题转换为对偶形式:
其中,第一模糊超球模型的最优球心c'+为:
第一模糊超球模型的最优半径R'+为:
式中,xi为第一类训练样本集的第i个样本点,i∈(1,l-),xj为第二类训练样本集的第j个样本点,j∈(1,l+),l+为第一类训练样本集的样本规模,l++l-=l,l为两类训练样本集的总样本规模,l-为第一类训练样本集的样本规模,c1为第一模糊超球模型的惩罚因子,c1>0,ξi为第一模糊超球模型第i个样本点对应的松弛因子,αi、ri和s为拉格朗日乘子,si为第一模糊超球模型第i个样本点对应的模糊隶属度函数,τ+为第一模糊超球模型的样本矩阵,ν1为第一模糊超球模型的平衡参数,ν1>0,
按下式将第二超球分类模型转换为对偶形式:
其中,第二模糊超球模型的最优球心c-为:
第二模糊超球模型的最优半径R+为:
式中,c2为第一模糊超球模型的惩罚因子,c2>0,ξj为第二模糊超球模型第j个样本点对应的松弛因子,βj为拉格朗日乘子,sj为第二模糊超球模型第j个样本点对应的模糊隶属度函数,τ-为第二模糊超球模型的样本矩阵,ν2第二模糊超球模型的平衡参数,ν2>0,
与最接近的现有技术相比,本发明还具有如下有益效果:
本发明采用的技术手段包括获取待测数据,通过预先建立的模糊双超球分类模型的决策函数确定所述待测数据的分类结果;其中,所述模糊双超球分类模型包括决策函数和两个模糊超球模型;所述决策函数通过两个模糊超球模型的最优球心和最优半径进行确定,所述两个模糊超球模型的最优球心和最优半径通过对各自的训练样本集进行训练确定;采用本发明的技术方案降低了大规模数据的分类时间复杂度,提高了分类效率,构建超球模型的过程中,引入了模糊隶属度函数,有效避免了奇异点和噪声点对分类结果的影响,从而得到精确度更高的分类结果。
附图说明
图1是本发明实施例基于模糊双超球分类模型的数据分类方法的流程图;
图2是本发明实施例中获取决策函数的流程图;
图3是本发明实施例基于模糊双超球分类模型的数据分类系统的结构示意图。
具体实施方式
下面结合附图对本发明的具体实施方式作详细说明。
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
本发明提供了一种基于模糊双超球分类模型的数据分类方法及系统,下面进行说明。
图1示出了本发明实施例基于模糊双超球分类模型的数据分类方法的流程图,如图1所示,所述方法可以包括:
101.获取待测数据;
102.通过预先建立的模糊双超球分类模型的决策函数确定所述待测数据的分类结果;
其中,所述预先建立的模糊双超球分类模型可以包括决策函数和两个模糊超球模型;所述决策函数通过两个模糊超球模型的最优球心和最优半径进行确定,所述两个模糊超球模型的最优球心和最优半径通过对各自的训练样本集进行训练确定;所述两个模糊超球模型的训练样本集为分别从对应类型的实验数据中随机抽取的数据集合。
所述决策函数通过两个模糊超球模型的最优球心和最优半径进行确定,可以包括:按下式确定所述模糊双超球分类模型的决策函数f(x):
式中,c'+为第一模糊超球模型的最优球心,c'-为第二模糊超球模型的最优球心,R'+为第一模糊超球模型的最优半径,R'-为第二模糊超球模型的最优半径,x为待测样本点。
图2示出了本发明实施例基于模糊双超球分类模型的数据分类方法获取模糊超球模型最优球心和最优半径的流程图,如图2所示,可以包括:
所述两个模糊超球模型的最优球心和最优半径通过对各自的训练样本集进行训练确定,可以包括:
从所述实验数据中随机抽取数据确定为训练样本集,并根据实验数据的类别标签利用二分类法将所述训练样本集分为第一类训练样本集和第二类训练样本集;
分别对所述第一类训练样本集和第二类训练样本集进行训练构建第一模糊超球模型和第二模糊超球模型;
利用拉普拉斯乘子法,引入拉格朗日乘子,将第一模糊超球模型和第二模糊超球模型的最优化问题转换为对偶形式,获取恒星光谱数据模糊双超球分类模型的最优球心和最优半径。
根据数据模糊双超球分类模型的样本规模和模糊隶属度函数构建数据模糊双超球分类模型,可以包括:
所述分别对所述第一类训练样本集和第二类训练样本集进行训练构建第一模糊超球模型和第二模糊超球模型,可以包括:
按下式训练所述第一类训练样本集构建第一模糊超球模型:
按下式训练所述第二类训练样本集构建第二模糊超球模型:
其中,c+为第一模糊超球模型的球心,c-为第二模糊超球模型的球心,R+为第一模糊超球模型的半径,R-为第二模糊超球模型的半径,τ+为第一模糊超球模型的样本矩阵,τ-为第二模糊超球模型的样本矩阵,xi为第一类训练样本集的第i个样本点,i∈(1,l-),xj为第二类训练样本集的第j个样本点,j∈(1,l+),l+为第一类训练样本集的样本规模,l-为第二类训练样本集的样本规模,l++l-=l,l为两类训练样本集的总样本规模;c1为第一模糊超球模型的惩罚因子,c1>0,c2为第二模糊超球模型的惩罚因子,c2>0;ν1为第一模糊超球模型的平衡参数,ν1>0,ν2为第二模糊超球模型的平衡参数,ν2>0;si为第一模糊超球模型第i个样本点对应的模糊隶属度函数,sj为第二模糊超球模型第j个样本点对应的模糊隶属度函数,ξi为第一模糊超球模型第i个样本点对应的松弛因子,ξj为第二模糊超球模型第j个样本点对应的松弛因子;
其中,模糊隶属度函数选用基于距离的模糊隶属度函数,按下式确定所述第一模糊超球模型第i个样本点对应的模糊隶属度函数si:
按下式确定所述第二模糊超球模型第j个样本点对应的模糊隶属度函数sj
其中,δ>0,δ∈(10-3,10-2), 为第一类训练样本集的类中心,即训练样本集中所有样本的均值,r+为第一类训练样本集的类半径; 为第二类训练样本集的类中心,r-为第二类训练样本集的类半径。
进一步,利用拉普拉斯乘子法,引入拉格朗日乘子,将第一模糊超球模型和第二模糊超球模型的最优化问题转换为对偶形式,获取恒星光谱数据模糊双超球分类模型的最优球心和最优半径,可以包括:
按下式将第一模糊超球分类模型转换为对偶形式:
根据由KKT最优化条件(Karush-Kuhn-Tucher)可得:
||xi-c+||2≤R+ 2+ξi (7)
αi(||xi-c+||2-R+ 2-ξi)=0 (8)
riξi=0,ξi≥0,ri≥0 (9)
当(1)式取最优解时,R+ 2>0,则s=0,由(5)式可得则有:
按下式获取第一模糊超球模型的最优球心c'+:
按下式获取第一模糊超球模型的最优半径R'+:
式中,xi为第一模糊超球模型训练样本集的第i个样本点,i∈(1,l-),xj为第二模糊超球模型训练样本集的第j个样本点,j∈(1,l+),l+为第一模糊超球模型的样本规模,l++l-=l,l为两类训练样本集的总体样本规模,l-为第二模糊超球模型的样本规模,c1为第一模糊超球模型的惩罚因子,c1>0,ξi为第一模糊超球模型第i个样本点对应的松弛因子,αi、ri和s为拉格朗日乘子,αi≥0,ri≥0,si为第一模糊超球模型第i个样本点对应的模糊隶属度函数,τ+为第一模糊超球模型的样本矩阵,ν1为第一模糊超球模型的平衡参数,ν1>0,
将(5)式、(6)式、(11)式代入(4)式,可得(1)式的对偶形式:
将上述优化问题的目标函数乘以(1-ν1),并去掉常数项,可得第一模糊超球分类模型的对偶形式如下式:
同理按下式将第二超球分类模型转换为对偶形式:
第二超球分类模型的对偶形式如下式:
按下式获取第二模糊超球模型的最优球心c'-:
按下式获取第二模糊超球模型的最优半径R'-:
式中,c2为第一模糊超球模型的惩罚因子,c2>0,ξj为第二模糊超球模型第j个样本点对应的松弛因子,βj、βj1和βj2、为拉格朗日乘子,βj1≠βj2,sj为第二模糊超球模型第j个样本点对应的模糊隶属度函数,τ-为第二模糊超球模型的样本矩阵,ν2第二模糊超球模型的平衡参数,ν2>0,
一个新的待测样本点x的类属判定取决于对应的的决策函数;根据数据模糊双超球分类模型的最优球心和最优半径确定数据模糊双超球分类模型对应的决策函数,可以包括:
按下式确定数据模糊双超球分类模型对应的决策函数f(x):
式中,c'+为第一模糊超球模型的最优球心,c'-为第二模糊超球模型的最优球心,R'+为第一模糊超球模型的最优半径,R'-为第二模糊超球模型的最优半径,x为待测样本点;
利用所述数据分类目标函数获取测试样本集样本点的类属,并根据所述测试样本集样本点的类属确定数据分类目标函数的分类精确度。
具体地,实验数据中随机抽取部分数据作为训练样本集后,剩下的实验数据作为测试样本集,训练样本集和测试样本集的比例根据实际应用中的需求确定;在根据两个模糊超球模型的最优球心和最优半径进行确定决策函数之后,可以包括:
利用所述决策函数计算获取测试样本集中各个样本点的类属,并将获取的所述测试样本集样本点的类属与测试样本集原有的类属比较确定数据分类目标函数的分类精确度。
实施例二:
随着恒星观测设备的持续运行以及观测技术的不断完善,人们在恒星光谱分类技术中获得的观测光谱数据越来越多,传统的人工处理方式无法满足实际需要,下面将本发明的数据分类方法应用到恒星光谱数据分类方法中;
实验选取斯隆巡天发布的SDSS DR10中的K型、F型、G型恒星光谱作为实验数据集。将SDSS DR10中各个类型恒星光谱数据分别作为三批实验数据,从三批试验数据中分别选取用于训练模糊双超球模型的训练样本集;以K型恒星光谱数据为例,K型恒星光谱可以包括K1、K3、K5、K7次型,两两次型的数据用于构建一对模糊超球模型,因此,K型恒星光谱数据中的四个次型最终构建两对模糊超球模型和相应的两个决策函数,从而得到两个双超球分类模型。对于后续接收到的需要进行分类的K型恒星光谱数据,可以分别代入到两个双超球分类模型的决策函数中进行计算,选择计算结果最小的值所对应的次型即为恒星光谱数据的分类;
试验数据中的K型恒星光谱可以包括K1、K3、K5、K7次型,其各次型光谱的性噪比(Signal Noise Ratio,SNR)区间均为(60,65);F型光谱包括F2、F5、F9次型,其各次型光谱的性噪比区间分别为(50,65),(65,70),(75,80);G型光谱包括G0、G2、G5次型,其各次型性噪比区间为(55,65),(60,65),(40,70);实验数据集如表1(a)-(c)所示。
表1(a)K型恒星光谱数据集
表1(b)F型恒星光谱数据集
表1(c)G型恒星光谱数据集
通过与支持向量机(SVM)、双支持向量机(TWSVM)等分类方法的比较来验证本发明的技术方案模糊双超球恒星数据分类方法(THCM)的有效性;上述分类方法的性能与所选的参数有关,本文选用10折交叉验证法获取实验参数,而参数的选择采用网格搜索法。在SVM和TWSVM中,惩罚因子在网格{0.01,0.05,0.1,0.5,1,5,10}中搜索。实验选取基于距离的模糊隶属度函数。分别选取实验对象的30%、40%、50%、60%、70%作为训练样本集,而剩余样本作为测试样本集。实验结果如表2(a)-(c)所示,其中括号前的值表示样本规模,括号中的值表示所占比例。
表2(a)K型恒星数据集上的比较实验结果
表2(b)F型恒星数据集上的比较实验结果
表2(c)G型恒星数据集上的比较实验结果
由表2(a)-(c)可以看出:各分类方法的分类精度随样本规模的增大而提升。在K型、F型、G型恒星光谱数据集上,当训练样本分别选取实验数据集的30%、40%、50%、60%、70%时,与SVM、TWSVM等分类方法相比,THCM具有更优的分类精度;从平均分类精度看,THCM较之SVM、TWSVM具有更优的分类能力;究其原因,THCM一方面具有TWSVM高效的计算效率;另一方面,由于模糊隶属度函数的引入,该方法有效地降低了奇异点和噪声点对分类结果的影响;因此,THCM在恒星光谱分类中较之传统方法具有优势。
实施例三:
图3示出了本发明实施例基于模糊双超球分类模型的数据分类系统的结构示意图,如图3所示,所述系统可以包括:
获取模块,用于获取待测数据;
执行模块,用于通过预先建立的模糊双超球分类模型的决策函数确定所述待测数据的分类结果;
其中,所述预先建立的模糊双超球分类模型可以包括决策函数和两个模糊超球模型;所述决策函数通过两个模糊超球模型的最优球心和最优半径进行确定,所述两个模糊超球模型的最优球心和最优半径通过对各自的训练样本集进行训练确定;所述两个模糊超球模型的训练样本集为分别从对应类型的实验数据中随机抽取的数据集合。
其中,按下式确定所述模糊双超球分类模型的决策函数f(x):
式中,c'+为第一模糊超球模型的最优球心,c'-为第二模糊超球模型的最优球心,R'+为第一模糊超球模型的最优半径,R'-为第二模糊超球模型的最优半径,x为待测样本点。
所述两个模糊超球模型的最优球心和最优半径通过对各自的训练样本集进行训练确定,可以包括:
从所述实验数据中随机抽取数据确定为训练样本集,并根据实验数据的类别标签利用二分类法将所述训练样本集分为第一类训练样本集和第二类训练样本集;
分别对所述第一类训练样本集和第二类训练样本集进行训练构建第一模糊超球模型和第二模糊超球模型;
利用拉普拉斯乘子法,引入拉格朗日乘子,将第一模糊超球模型和第二模糊超球模型的最优化问题转换为对偶形式,获取恒星光谱数据模糊双超球分类模型的最优球心和最优半径。
其中,所述分别对所述第一类训练样本集和第二类训练样本集进行训练构建第一模糊超球模型和第二模糊超球模型,可以包括:
按下式训练所述第一类训练样本集构建第一模糊超球模型:
按下式训练所述第二类训练样本集构建第二模糊超球模型:
其中,c+为第一模糊超球模型的球心,c-为第二模糊超球模型的球心,R+为第一模糊超球模型的半径,R-为第二模糊超球模型的半径,τ+为第一模糊超球模型的样本矩阵,τ-为第二模糊超球模型的样本矩阵,xi为第一类训练样本集的第i个样本点,i∈(1,l-),xj为第二类训练样本集的第j个样本点,j∈(1,l+),l+为第一类训练样本集的样本规模,l-为第二类训练样本集的样本规模,l++l-=l,l为两类训练样本集的总样本规模;c1为第一模糊超球模型的惩罚因子,c1>0,c2为第二模糊超球模型的惩罚因子,c2>0;ν1为第一模糊超球模型的平衡参数,ν1>0,ν2为第二模糊超球模型的平衡参数,ν2>0;si为第一模糊超球模型第i个样本点对应的模糊隶属度函数,sj为第二模糊超球模型第j个样本点对应的模糊隶属度函数,ξi为第一模糊超球模型第i个样本点对应的松弛因子,ξj为第二模糊超球模型第j个样本点对应的松弛因子。
具体地,按下式确定所述第一模糊超球模型第i个样本点对应的模糊隶属度函数si:
按下式确定所述第二模糊超球模型第j个样本点对应的模糊隶属度函数sj
其中,δ>0,δ∈(10-3,10-2), 为第一类训练样本集的类中心,r+为第一类训练样本集的类半径; 为第二类训练样本集的类中心,r-为第二类训练样本集的类半径,δ为干扰因子。
所述利用拉普拉斯乘子法,引入拉格朗日乘子,将第一模糊超球模型和第二模糊超球模型的最优化问题转换为对偶形式,获取恒星光谱数据模糊双超球分类模型的最优球心和最优半径,可以包括:
按下式将第一模糊超球模型的最优化问题转换为对偶形式:
其中,第一模糊超球模型的最优球心c'+为:
第一模糊超球模型的最优半径R'+为:
式中,xi为第一类训练样本集的第i个样本点,i∈(1,l-),xj为第二类训练样本集的第j个样本点,j∈(1,l+),l+为第一类训练样本集的样本规模,l++l-=l,l为两类训练样本集的总样本规模,l-为第一类训练样本集的样本规模,c1为第一模糊超球模型的惩罚因子,c1>0,ξi为第一模糊超球模型第i个样本点对应的松弛因子,αi、ri和s为拉格朗日乘子,si为第一模糊超球模型第i个样本点对应的模糊隶属度函数,τ+为第一模糊超球模型的样本矩阵,ν1为第一模糊超球模型的平衡参数,ν1>0,
按下式将第二超球分类模型转换为对偶形式:
其中,第二模糊超球模型的最优球心c-为:
第二模糊超球模型的最优半径R+为:
式中,c2为第一模糊超球模型的惩罚因子,c2>0,ξj为第二模糊超球模型第j个样本点对应的松弛因子,βj为拉格朗日乘子,sj为第二模糊超球模型第j个样本点对应的模糊隶属度函数,τ-为第二模糊超球模型的样本矩阵,ν2第二模糊超球模型的平衡参数,ν2>0,
具体地,实验数据中随机抽取部分数据作为训练样本集后,剩下的实验数据作为测试样本集,在根据两个模糊超球模型的最优球心和最优半径进行确定决策函数之后,可以包括:
利用所述决策函数计算获取测试样本集中各个样本点的类属,并将获取的所述测试样本集样本点的类属与测试样本集原有的类属比较确定数据分类目标函数的分类精确度。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求保护范围之内。
Claims (12)
1.一种基于模糊双超球分类模型的数据分类方法,其特征在于,所述方法包括:
获取待测数据;
通过预先建立的模糊双超球分类模型的决策函数确定所述待测数据的分类结果;
其中,所述模糊双超球分类模型包括决策函数和两个模糊超球模型;所述决策函数通过两个模糊超球模型的最优球心和最优半径进行确定,所述两个模糊超球模型的最优球心和最优半径通过对各自的训练样本集进行训练确定;所述两个模糊超球模型的训练样本集为分别从对应类型的实验数据中随机抽取的数据集合。
2.如权利要求1所述的方法,其特征在于,所述决策函数通过两个模糊超球模型的最优球心和最优半径进行确定,包括:
按下式确定所述模糊双超球分类模型的决策函数f(x):
式中,C'+为第一模糊超球模型的最优球心,C'_为第二模糊超球模型的最优球心,R'+为第一模糊超球模型的最优半径,R'_为第二模糊超球模型的最优半径,x为待测样本点。
3.如权利要求1所述的方法,其特征在于,所述两个模糊超球模型的最优球心和最优半径通过对各自的训练样本集进行训练确定,包括:
从所述实验数据中随机抽取数据确定为训练样本集,并根据实验数据的类别标签将所述训练样本集分为第一类训练样本集和第二类训练样本集;
分别对所述第一类训练样本集和第二类训练样本集进行训练得到第一模糊超球模型和第二模糊超球模型;
利用拉普拉斯乘子法,引入拉格朗日乘子,将第一模糊超球模型和第二模糊超球模型的最优化问题转换为对偶形式,获取数据模糊双超球分类模型的最优球心和最优半径。
4.如权利要求3所述的方法,其特征在于,所述分别对所述第一类训练样本集和第二类训练样本集进行训练构建第一模糊超球模型和第二模糊超球模型,包括:
按下式训练所述第一类训练样本集构建第一模糊超球模型:
按下式训练所述第二类训练样本集构建第二模糊超球模型:
其中,c+为第一模糊超球模型的球心,c-为第二模糊超球模型的球心,R+为第一模糊超球模型的半径,R-为第二模糊超球模型的半径,τ+为第一模糊超球模型的样本矩阵,τ-为第二模糊超球模型的样本矩阵,xi为第一类训练样本集的第i个样本点,i∈(1,l-),xj为第二类训练样本集的第j个样本点,j∈(1,l+),l+为第一类训练样本集的样本规模,l-为第二类训练样本集的样本规模,l++l-=l,l为两类训练样本集的总样本规模;c1为第一模糊超球模型的惩罚因子,c1>0,c2为第二模糊超球模型的惩罚因子,c2>0;ν1为第一模糊超球模型的平衡参数,ν1>0,ν2为第二模糊超球模型的平衡参数,ν2>0;si为第一模糊超球模型第i个样本点对应的模糊隶属度函数,sj为第二模糊超球模型第j个样本点对应的模糊隶属度函数,ξi为第一模糊超球模型第i个样本点对应的松弛因子,ξj为第二模糊超球模型第j个样本点对应的松弛因子。
5.如权利要求4所述的方法,其特征在于,按下式确定所述第一模糊超球模型第i个样本点对应的模糊隶属度函数si:
按下式确定所述第二模糊超球模型第j个样本点对应的模糊隶属度函数sj
其中,δ>0,δ∈(10-3,10-2), 为第一类训练样本集的类中心,r+为第一类训练样本集的类半径; 为第二类训练样本集的类中心,r-为第二类训练样本集的类半径,δ为干扰因子。
6.如权利要求3所述的方法,其特征在于,所述利用拉普拉斯乘子法,引入拉格朗日乘子,将第一模糊超球模型和第二模糊超球模型的最优化问题转换为对偶形式,获取数据模糊双超球分类模型的最优球心和最优半径,包括:
按下式将第一模糊超球模型的最优化问题转换为对偶形式:
其中,第一模糊超球模型的最优球心c'+为:
第一模糊超球模型的最优半径R'+为:
式中,xi为第一类训练样本集的第i个样本点,i∈(1,l-),xj为第二类训练样本集的第j个样本点,j∈(1,l+),l+为第一类训练样本集的样本规模,l++l-=l,l为两类训练样本集的总样本规模,l-为第一类训练样本集的样本规模,c1为第一模糊超球模型的惩罚因子,c1>0,ξi为第一模糊超球模型第i个样本点对应的松弛因子,αi、ri和s为拉格朗日乘子,si为第一模糊超球模型第i个样本点对应的模糊隶属度函数,τ+为第一模糊超球模型的样本矩阵,ν1为第一模糊超球模型的平衡参数,ν1>0,
按下式将第二超球分类模型转换为对偶形式:
其中,第二模糊超球模型的最优球心c-为:
第二模糊超球模型的最优半径R+为:
式中,c2为第一模糊超球模型的惩罚因子,c2>0,ξj为第二模糊超球模型第j个样本点对应的松弛因子,βj为拉格朗日乘子,sj为第二模糊超球模型第j个样本点对应的模糊隶属度函数,τ-为第二模糊超球模型的样本矩阵,ν2第二模糊超球模型的平衡参数,ν2>0,
7.一种基于模糊双超球分类模型的数据分类系统,其特征在于,所述系统包括:
获取模块,用于获取待测数据;
执行模块,用于通过预先建立的模糊双超球分类模型的决策函数确定所述待测数据的分类结果;
其中,所述模糊双超球分类模型包括决策函数和两个模糊超球模型;所述决策函数通过两个模糊超球模型的最优球心和最优半径进行确定,所述两个模糊超球模型的最优球心和最优半径通过对各自的训练样本集进行训练确定;所述两个模糊超球模型的训练样本集为分别从对应类型的实验数据中随机抽取的数据集合。
8.如权利要求7所述的系统,其特征在于,按下式确定所述模糊双超球分类模型的决策函数f(x):
式中,c'+为第一模糊超球模型的最优球心,c'_为第二模糊超球模型的最优球心,R'+为第一模糊超球模型的最优半径,R'_为第二模糊超球模型的最优半径,x为待测样本点。
9.如权利要求7所述的系统,其特征在于,所述两个模糊超球模型的最优球心和最优半径通过对各自的训练样本集进行训练确定,包括:
从所述实验数据中随机抽取数据确定为训练样本集,并根据实验数据的类别标签将所述训练样本集分为第一类训练样本集和第二类训练样本集;
分别对所述第一类训练样本集和第二类训练样本集进行训练构建第一模糊超球模型和第二模糊超球模型;
利用拉普拉斯乘子法,引入拉格朗日乘子,将第一模糊超球模型和第二模糊超球模型的最优化问题转换为对偶形式,获取数据模糊双超球分类模型的最优球心和最优半径。
10.如权利要求9所述的系统,其特征在于,所述分别对所述第一类训练样本集和第二类训练样本集进行训练构建第一模糊超球模型和第二模糊超球模型,包括:
按下式训练所述第一类训练样本集构建第一模糊超球模型:
按下式训练所述第二类训练样本集构建第二模糊超球模型:
其中,c+为第一模糊超球模型的球心,c-为第二模糊超球模型的球心,R+为第一模糊超球模型的半径,R-为第二模糊超球模型的半径,τ+为第一模糊超球模型的样本矩阵,τ-为第二模糊超球模型的样本矩阵,xi为第一类训练样本集的第i个样本点,i∈(1,l-),xj为第二类训练样本集的第j个样本点,j∈(1,l+),l+为第一类训练样本集的样本规模,l-为第二类训练样本集的样本规模,l++l-=l,l为两类训练样本集的总样本规模;c1为第一模糊超球模型的惩罚因子,c1>0,c2为第二模糊超球模型的惩罚因子,c2>0;ν1为第一模糊超球模型的平衡参数,ν1>0,ν2为第二模糊超球模型的平衡参数,ν2>0;si为第一模糊超球模型第i个样本点对应的模糊隶属度函数,sj为第二模糊超球模型第j个样本点对应的模糊隶属度函数,ξi为第一模糊超球模型第i个样本点对应的松弛因子,ξj为第二模糊超球模型第j个样本点对应的松弛因子。
11.如权利要求10所述的系统,其特征在于,按下式确定所述第一模糊超球模型第i个样本点对应的模糊隶属度函数si:
按下式确定所述第二模糊超球模型第j个样本点对应的模糊隶属度函数sj
其中,δ>0,δ∈(10-3,10-2), 为第一类训练样本集的类中心,r+为第一类训练样本集的类半径; 为第二类训练样本集的类中心,r-为第二类训练样本集的类半径,δ为干扰因子。
12.如权利要求9所述的系统,其特征在于,所述利用拉普拉斯乘子法,引入拉格朗日乘子,将第一模糊超球模型和第二模糊超球模型的最优化问题转换为对偶形式,获取数据模糊双超球分类模型的最优球心和最优半径,包括:
按下式将第一模糊超球模型的最优化问题转换为对偶形式:
其中,第一模糊超球模型的最优球心c'+为:
第一模糊超球模型的最优半径R'+为:
式中,xi为第一类训练样本集的第i个样本点,i∈(1,l-),xj为第二类训练样本集的第j个样本点,j∈(1,l+),l+为第一类训练样本集的样本规模,l++l-=l,l为两类训练样本集的总样本规模,l-为第一类训练样本集的样本规模,c1为第一模糊超球模型的惩罚因子,c1>0,ξi为第一模糊超球模型第i个样本点对应的松弛因子,αi、ri和s为拉格朗日乘子,si为第一模糊超球模型第i个样本点对应的模糊隶属度函数,τ+为第一模糊超球模型的样本矩阵,ν1为第一模糊超球模型的平衡参数,ν1>0,
按下式将第二超球分类模型转换为对偶形式:
其中,第二模糊超球模型的最优球心c-为:
第二模糊超球模型的最优半径R+为:
式中,c2为第一模糊超球模型的惩罚因子,c2>0,ξj为第二模糊超球模型第j个样本点对应的松弛因子,βj为拉格朗日乘子,sj为第二模糊超球模型第j个样本点对应的模糊隶属度函数,τ-为第二模糊超球模型的样本矩阵,ν2第二模糊超球模型的平衡参数,ν2>0,
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810623801.1A CN110555054B (zh) | 2018-06-15 | 2018-06-15 | 一种基于模糊双超球分类模型的数据分类方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810623801.1A CN110555054B (zh) | 2018-06-15 | 2018-06-15 | 一种基于模糊双超球分类模型的数据分类方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110555054A true CN110555054A (zh) | 2019-12-10 |
CN110555054B CN110555054B (zh) | 2023-06-09 |
Family
ID=68736145
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810623801.1A Active CN110555054B (zh) | 2018-06-15 | 2018-06-15 | 一种基于模糊双超球分类模型的数据分类方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110555054B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111611867A (zh) * | 2020-04-24 | 2020-09-01 | 滁州学院 | 基于多分类模糊相关向量机的滚动轴承智能故障诊断方法 |
WO2021139249A1 (zh) * | 2020-05-28 | 2021-07-15 | 平安科技(深圳)有限公司 | 数据异常检测方法、装置、设备及存储介质 |
CN118035773A (zh) * | 2024-04-11 | 2024-05-14 | 浙江公路水运工程咨询集团有限公司 | 基于特征聚类的批量二次规划交通异常检测方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104112143A (zh) * | 2014-07-23 | 2014-10-22 | 大连民族学院 | 基于加权超球支持向量机算法的图像分类方法 |
CN104679860A (zh) * | 2015-02-27 | 2015-06-03 | 北京航空航天大学 | 一种不平衡数据的分类方法 |
CN105718941A (zh) * | 2016-01-18 | 2016-06-29 | 中北大学 | 基于模糊大间隔最小球分类的恒星光谱离群数据挖掘方法 |
CN106203500A (zh) * | 2016-06-30 | 2016-12-07 | 浙江群力电气有限公司 | 一种基于改进的模糊支持向量机的故障分类方法 |
WO2017092022A1 (zh) * | 2015-12-04 | 2017-06-08 | 深圳先进技术研究院 | 一种张量模式下的有监督学习优化方法及系统 |
-
2018
- 2018-06-15 CN CN201810623801.1A patent/CN110555054B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104112143A (zh) * | 2014-07-23 | 2014-10-22 | 大连民族学院 | 基于加权超球支持向量机算法的图像分类方法 |
CN104679860A (zh) * | 2015-02-27 | 2015-06-03 | 北京航空航天大学 | 一种不平衡数据的分类方法 |
WO2017092022A1 (zh) * | 2015-12-04 | 2017-06-08 | 深圳先进技术研究院 | 一种张量模式下的有监督学习优化方法及系统 |
CN105718941A (zh) * | 2016-01-18 | 2016-06-29 | 中北大学 | 基于模糊大间隔最小球分类的恒星光谱离群数据挖掘方法 |
CN106203500A (zh) * | 2016-06-30 | 2016-12-07 | 浙江群力电气有限公司 | 一种基于改进的模糊支持向量机的故障分类方法 |
Non-Patent Citations (1)
Title |
---|
刘宏兵: "多目标粒度支持向量机及其应用研究" * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111611867A (zh) * | 2020-04-24 | 2020-09-01 | 滁州学院 | 基于多分类模糊相关向量机的滚动轴承智能故障诊断方法 |
CN111611867B (zh) * | 2020-04-24 | 2023-03-24 | 滁州学院 | 基于多分类模糊相关向量机的滚动轴承智能故障诊断方法 |
WO2021139249A1 (zh) * | 2020-05-28 | 2021-07-15 | 平安科技(深圳)有限公司 | 数据异常检测方法、装置、设备及存储介质 |
CN118035773A (zh) * | 2024-04-11 | 2024-05-14 | 浙江公路水运工程咨询集团有限公司 | 基于特征聚类的批量二次规划交通异常检测方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN110555054B (zh) | 2023-06-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Schäfer et al. | Detection of gravitational-wave signals from binary neutron star mergers using machine learning | |
CN104881706B (zh) | 一种基于大数据技术的电力系统短期负荷预测方法 | |
CN106447098B (zh) | 一种光伏超短期功率预测方法及装置 | |
CN110555054B (zh) | 一种基于模糊双超球分类模型的数据分类方法及系统 | |
Han et al. | A new method in wheel hub surface defect detection: Object detection algorithm based on deep learning | |
CN110659207A (zh) | 基于核谱映射迁移集成的异构跨项目软件缺陷预测方法 | |
CN109886284B (zh) | 基于层次化聚类的欺诈检测方法及系统 | |
CN108846338A (zh) | 基于面向对象随机森林的极化特征选择及分类方法 | |
CN108388745B (zh) | 基于分布并行局部优化参数的最小二乘支持向量机软测量方法 | |
CN115510965A (zh) | 一种基于生成数据融合的轴承不平衡故障诊断方法 | |
Li et al. | Rolling bearing fault diagnosis under data imbalance and variable speed based on adaptive clustering weighted oversampling | |
CN110659682A (zh) | 一种基于MCWD-KSMOTE-AdaBoost-DenseNet算法的数据分类方法 | |
CN104504361B (zh) | 基于方向特征的手掌静脉主方向特征提取方法 | |
CN108876595A (zh) | 一种基于数据挖掘的p2p个人信用评估方法及装置 | |
CN114186862A (zh) | 基于熵权topsis模型的双层能源绩效评估系统 | |
CN113868960B (zh) | 一种基于典型相关森林的土壤重金属特征选取方法及系统 | |
CN110929761A (zh) | 智能系统安全体系态势感知构架中采集样本的平衡方法 | |
CN104318224A (zh) | 一种人脸识别方法及监控设备 | |
CN106611012A (zh) | 一种大数据环境下异构数据实时检索方法 | |
CN103136440A (zh) | 数据处理方法和装置 | |
CN104112147B (zh) | 一种基于最近特征线的人脸特征提取方法 | |
CN110542659A (zh) | 基于可见光光谱的珍珠光泽检测方法 | |
Wu et al. | Optimization and improvement based on K-Means Cluster algorithm | |
CN106709598B (zh) | 一种基于单类样本的电压稳定性预测判断方法 | |
CN106485286B (zh) | 一种基于局部敏感判别的矩阵分类模型 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |