CN105184316B - 一种基于特征权学习的支持向量机电网业务分类方法 - Google Patents
一种基于特征权学习的支持向量机电网业务分类方法 Download PDFInfo
- Publication number
- CN105184316B CN105184316B CN201510543111.1A CN201510543111A CN105184316B CN 105184316 B CN105184316 B CN 105184316B CN 201510543111 A CN201510543111 A CN 201510543111A CN 105184316 B CN105184316 B CN 105184316B
- Authority
- CN
- China
- Prior art keywords
- feature
- sample
- svm
- training
- bis
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 29
- 238000012706 support-vector machine Methods 0.000 title claims abstract description 11
- 239000013598 vector Substances 0.000 claims abstract description 91
- 238000012549 training Methods 0.000 claims abstract description 88
- 238000012360 testing method Methods 0.000 claims abstract description 17
- 239000011159 matrix material Substances 0.000 claims description 44
- 230000006870 function Effects 0.000 claims description 16
- 230000010287 polarization Effects 0.000 claims description 9
- 230000007812 deficiency Effects 0.000 claims description 4
- 230000008030 elimination Effects 0.000 claims description 4
- 238000003379 elimination reaction Methods 0.000 claims description 4
- 230000005611 electricity Effects 0.000 claims 1
- 238000005457 optimization Methods 0.000 abstract description 7
- 241000208340 Araliaceae Species 0.000 description 4
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 4
- 235000003140 Panax quinquefolius Nutrition 0.000 description 4
- 235000008434 ginseng Nutrition 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 238000013468 resource allocation Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Water Supply & Treatment (AREA)
- Public Health (AREA)
- Primary Health Care (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及一种基于特征权学习的支持向量机电网业务分类方法,利用特征权学习方法结合支持向量机多分类特点,对业务分类问题进行处理,包括:将采集数据划分为训练集与测试集,采用1‑a‑1SVM分类方法将多分类问题分解为一系列SVM二分类问题,对每个SVM二分类器分别进行参数寻优与特征子集选取,并引入特征学习思想,对不同特征赋予不同的权值,以表征其重要性程度。根据选取的最优特征子集与最优参数训练模型,得到的模型即为分类模型,然后对测试集样本进行分类;本发明提供的方法,通过根据各自特点分别选取每个SVM二分类器中最优参数与特征子集重新训练SVM分类模型,充分考虑了不同子分类器之间的差异性,具有更好的分类精度。
Description
技术领域
本发明涉及数据处理与分类领域,具体涉及一种基于特征权学习的支持向量机电网业务分类方法。
背景技术
随着智能电网和“三集五大”建设的深入进行,电网中承载的业务种类日益增多,趋于复杂多变,为更好地对业务进行管控,优化网络资源配置,为不同的业务定制个性化需求,必须对业务进行分类处理。
支持向量机(Support Vector Machine,SVM)方法在小样本、非线性及高维分类问题上具有优势,支持向量机分类的关键是寻求最优分类超平面。一般将数据分为训练集与测试集,通过训练集确定最优分类边界,得到分类模型,再将测试集输入分类模型中,即可得到分类结果,但是支持向量机分类本质上是解决二分类问题的方法,而电网业务分类是多分类问题,如何将SVM二分类问题有效扩展以解决多分类问题是目前研究的重点之一。Debnathl等人提出的1-a-1SVM为解决上述问题提供了一个简单可行的措施:首先,训练阶段,对每两类训练一个二分类器,将训练模型保存;测试阶段,每一个待分类样本进行分类时,在每个子分类器中都需对其类别进行判别,并对相应类别投票,得票最多的即为待分类样本的类别。
SVM中参数优化与特征子集的选择在SVM分类系统中至关重要,对于SVM二分类的参数优化及特征选择已提出了很多可行的措施,如:网格法、遗传算法、粒子算法;F-score、卡方方法等。在传统多分类SVM中,在整体上寻求最优参数与最优特征子集,即:在个SVM二分类器中寻求整体最优参数与最优特征子集,训练模型中,所有的SVM二分类器均采用相同的最优参数与最优特征子集。但是,每个二分类器中样本的分布不尽相同,每个分类器均有各自的特点,每个子分类器采用相同的参数与特征子集会导致分类边界划分不准确,因此有必要对其加以改进。
发明内容
针对现有技术的不足,本发明提供一种基于特征权学习的支持向量机电网业务分类方法,通过根据各自特点分别选取每个SVM二分类器中最优参数与特征子集并利用选取出的最优特征子集与最优参数训练SVM分类模型,充分考虑了不同子分类器之间的差异性,具有更好的分类精度。
本发明的目的是采用下述技术方案实现的:
一种基于特征权学习的支持向量机电网业务分类方法,其改进之处在于,所述方法包括:
(1)采集电网数据并对电网数据进行预处理,将预处理后的电网数据分为训练集和测试集;
(2)将所述训练集中每两类的样本进行组合为一个训练子集并训练为一个SVM二分类器,第m个SVM二分类器的训练子集为[Xm,Ym],共个SVM二分类器,根据每个SVM二分类器的特征子集构建维特征选择矩阵ξ,根据每个SVM二分类器的特征权重构建维特征权重矩阵A,根据每个SVM二分类器的参数向量构建维参数矩阵γ,Xm=[x1,x2,…,xi,…,xl]T为所述第m个SVM二分类器的训练子集的样本,样本为样本xi的第k维特征,d为电网业务类别对应特征数,Ym=[y1,y2,…,yl]T为所述第m个SVM二分类器的训练子集中样本对应的类别,l为所述第m个SVM二分类器的训练子集中电网业务流个数,c为电网业务类别的总数目;
(3)采用特征选择算法对所述训练子集[Xm,Ym]进行处理,获取所述训练子集[Xm,Ym]对应的最优特征选择向量ξm,并根据所述最优特征选择向量更新特征选择矩阵及训练子集的样本X′m=Xm(:,ξm);
(4)采用特征权重学习算法对所述最优特征选择向量ξm进行处理,获取所述最优特征选择向量ξm对应的权重向量Am,并根据所述最优特征选择向量ξm对应的权重向量Am更新所述特征权重矩阵A;
(5)根据更新后的特征权重矩阵A重构所述训练子集[Xm,Ym]对应的特征;
(6)采用网格交叉验证的方法获取训练子集[Xm,Ym]的惩罚因子Cm和核函数参数
σm,其中,γm=[Cm,σm]为第m个训练子集对应的优化参数向量,更新所述参数矩阵
(7)判断是否每个SVM二分类器的训练子集的特征子集、特征权重和参数向量均更新为其对应的最优选择向量、权重向量和优化参数向量,若是则执行步骤(8),若否则返回步骤(3);
(8)基于更新后的特征选择矩阵ξ、特征权重矩阵A和参数矩阵γ训练1-v-1SVM多分类模型,并根据所述1-v-1SVM多分类模型对所述测试集进行分类,依据投票结果确定测试集中样本的类别。
优选的,所述步骤(1)包括:
(1-1)剔除电网数据中错误数据或维度不完整数据;
(1-2)删除电网数据中类的样本数小于30的类;
(1-3)电网数据中类的样本数大于500的类,从该类中选择250个加入训练集;
(1-4)电网数据中类的样本数大于30且小于500的类,从该类中选择一半加入训练集,另一半加入测试集。
优选的,所述步骤(3)包括:
(3-1)采用向后递归消除特征选择算法RFE获取所述训练子集[Xm,Ym]的最优特征选择向量ξm;
(3-2)更新特征选择矩阵及训练子集的样本X′m=Xm(:,ξm)。
优选的,所述步骤(4)包括:
(4-1)定义所述最优特征选择向量ξm对应的权重向量Am的特征权重学习模型Am=Gm=argmaxP(K)m,设置步长step和迭代终止条件norm(ΔGm)<ε,其中,迭代终止条件norm(ΔGm)<ε为相邻两次迭代获取的最优特征选择向量对应的权重向量Gm之差小于ε,为训练子集[Xm,Ym]中样本第k个特征对应的权重值,n为训练子集[Xm,Ym]中样本特征数;
(4-2)计算所述训练子集[Xm,Ym]的高斯核函数kRBF(xi,xj)m,公式为:
式(1)中,为样本xi的第k维特征,为样本xj的第k维特征,σ为高斯核函数参数;
(4-3)计算核极化核函数度量标准P(K)m对特征权值的梯度公式为:
式(2)中,yi为样本xi对应的类别,yj为样本xj对应的类别,l为所述第m个训练子集中电网业务流个数;其中,所述核极化核函数度量标准P(K)m的公式为:
(4-4)初始化
(4-5)根据核极化核函数度量标准P(K)对特征权值g(k)的梯度▽g(k)P(K)获取更新后的特征权值公式为:
(4-6)根据更新后的特征权值获取更新后最优特征选择向量对应的权重向量G′m,若更新后最优特征选择向量对应的权重向量G′m满足迭代终止条件norm(ΔGm)<ε,则根据更新后最优特征选择向量对应的权重向量G′m更新所述特征权重矩阵A,否则重复执行步骤(4-5)。
优选的,所述步骤(5)包括:根据更新后的特征权重矩阵A重构所述训练子集[Xm,Ym]对应的特征,公式为:
式(5)中,为样本xi的第k维特征,为特征权重矩阵中第m个训练子集的第k个特征对应的权重向量。
与最接近的现有技术相比,本发明具有的有益效果:
本发明提供的一种基于特征权学习的支持向量机电网业务分类方法,能够多分类算法中,对每个SVM子分类器分别进行参数寻优与特征选择,并结合特征权思想,对每个特征赋予不同的权重,生成支持向量机分类模型,最后将待分类数据输入网络流量分类模型得到分类结果,充分考虑了不同子分类器之间的差异性,具有更好的分类精度。
附图说明
图1是本发明提供的一种基于特征权学习的支持向量机电网业务分类方法流程图;
图2为支持向量机模型分类流程图。
具体实施方式
下面结合附图对本发明的具体实施方式作进一步的详细说明。
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
本发明提供了一种基于特征权学习的支持向量机电网业务分类方法,如图1所示,包括:
(1)采集电网数据并对电网数据进行预处理,将预处理后的电网数据分为训练集和测试集;
(2)将所述训练集中每两类的样本进行组合为一个训练子集并训练为一个SVM二分类器,第m个SVM二分类器的训练子集为[Xm,Ym],共个SVM二分类器,根据每个SVM二分类器的特征子集构建维特征选择矩阵ξ,根据每个SVM二分类器的特征权重构建维特征权重矩阵A,根据每个SVM二分类器的参数向量构建维参数矩阵γ,Xm=[x1,x2,…,xi,…,xl]T为所述第m个SVM二分类器的训练子集的样本,样本为样本xi的第k维特征,d为电网业务类别对应特征数,Ym=[y1,y2,…,yl]T为所述第m个SVM二分类器的训练子集中样本对应的类别,l为所述第m个SVM二分类器的训练子集中电网业务流个数,c为电网业务类别的总数目;
(3)采用特征选择算法对所述训练子集[Xm,Ym]进行处理,获取所述训练子集[Xm,Ym]对应的最优特征选择向量ξm,并根据所述最优特征选择向量更新特征选择矩阵及训练子集的样本X′m=Xm(:,ξm);
(4)采用特征权重学习算法对所述最优特征选择向量ξm进行处理,获取所述最优特征选择向量ξm对应的权重向量Am,并根据所述最优特征选择向量ξm对应的权重向量Am更新所述特征权重矩阵A;
(5)根据更新后的特征权重矩阵A重构所述训练子集[Xm,Ym]对应的特征;
(6)采用网格交叉验证的方法获取训练子集[Xm,Ym]的惩罚因子Cm和核函数参数
σm,其中,γm=[Cm,σm]为第m个训练子集对应的优化参数向量,更新所述参数矩阵
(7)判断是否每个SVM二分类器的训练子集的特征子集、特征权重和参数向量均更新为其对应的最优选择向量、权重向量和优化参数向量,若是则执行步骤(8),若否则返回步骤(3);
(8)基于更新后的特征选择矩阵ξ、特征权重矩阵A和参数矩阵γ训练1-v-1SVM多分类模型,并根据所述1-v-1SVM多分类模型对所述测试集进行分类,依据投票结果确定测试集中样本的类别。
具体的,所述步骤(1)包括:
(1-1)剔除电网数据中错误数据或维度不完整数据;
(1-2)删除电网数据中类的样本数小于30的类;
(1-3)电网数据中类的样本数大于500的类,从该类中选择250个加入训练集;
(1-4)电网数据中类的样本数大于30且小于500的类,从该类中选择一半加入训练集,另一半加入测试集。
对于多分类系统,传统SVM是在整体上寻求最优参数与最优特征子集,即:在个SVM二分类器中寻求整体最优参数与最优特征子集,训练模型中,所有的SVM二分类器均采用相同的最优参数与最优特征子集,并没有考虑不同子分类器之间的差异性,本发明提供的方法分别根据每个SVM二分类器的特点进行参数寻优与特征子集选取,首先分别对每个SVM二分类器进行特征选择并获取其对应的最优选择向量,所述步骤(3)包括:
(3-1)采用向后递归消除特征选择算法RFE获取所述训练子集[Xm,Ym]的最优特征选择向量ξm;
(3-2)更新特征选择矩阵及训练子集的样本X′m=Xm(:,ξm)。
例如:采用向后递归消除特征选择算法RFE对样本集进行处理,具体步骤如下:
1)初始化特征排序向量γ=[];初始化特征索引序列s=[1,2,3,...,d];初始化特征选择向量κ=[],F-score矩阵F=[]。
2)若特征索引序列为空集,则跳至8),否则,循环执行3)~7).
3)根据当前特征更新训练样本,去除训练样本中被去除的特征,即:X=X(:,s)
4)以更新后的样本训练SVM分类器,得到支持向量的相关系数ω=(ω1,ω2,...,ωd),其中d为样本x的维数。
5)根据系数ω计算
6)找出最小对应的特征si,将其加入特征排序向量中:γ=[si,γ]。
7)从特征索引序列中去除最小对应的特征。
8)若特征排序向量γ为空集,则,跳至11),否则,循环执行9)~10)。
9)从特征排序向量中选取第一个特征放入特征选择向量中:κ=[γ1],γ=[γ2,γ3,...,γd]。
10)根据特征子集更新训练样本,计算F-score,更新F=score矩阵:F=[F-score,F]。
选取F-score矩阵中最大值对应的特征选择向量,此即最优特征选择向量,其中,计算F-score值的公式为:
式中,P为SVM二分类器的准确率,R为SVM二分类器的召回率。
然后结合特征权思想,对每个特征赋予不同的权重,所述步骤(4)包括:
(4-1)定义所述最优特征选择向量ξm对应的权重向量Am的特征权重学习模型Am=Gm=argmaxP(K)m,设置步长step和迭代终止条件norm(ΔGm)<ε,其中,迭代终止条件norm(ΔGm)<ε为相邻两次迭代获取的最优特征选择向量对应的权重向量Gm之差小于ε,为训练子集[Xm,Ym]中样本第k个特征对应的权重值,n为训练子集[Xm,Ym]中样本特征数;
(4-2)计算所述训练子集[Xm,Ym]的高斯核函数kRBF(xi,xj)m,公式为:
式(1)中,为样本xi的第k维特征,为样本xj的第k维特征,σ为高斯核函数参数;
(4-3)计算核极化核函数度量标准P(K)m对特征权值的梯度公式为:
式(2)中,yi为样本xi对应的类别,yj为样本xj对应的类别,l为所述第m个训练子集中电网业务流个数;其中,所述核极化核函数度量标准P(K)m的公式为:
(4-4)初始化
(4-5)根据核极化核函数度量标准P(K)对特征权值g(k)的梯度▽g(k)P(K)获取更新后的特征权值公式为:
(4-6)根据更新后的特征权值获取更新后最优特征选择向量对应的权重向量G′m,若更新后最优特征选择向量对应的权重向量G′m满足迭代终止条件norm(ΔGm)<ε,则根据更新后最优特征选择向量对应的权重向量G′m更新所述特征权重矩阵A,否则重复执行步骤(4-5)。
所述步骤(5)包括:根据更新后的特征权重矩阵A重构所述训练子集[Xm,Ym]对应的特征,公式为:
式(5)中,为样本xi的第k维特征,为特征权重矩阵中第m个训练子集的第k个特征对应的权重向量。
所述步骤(7)中,根据所述1-v-1SVM多分类模型对所述测试集进行分类,依据投票结果确定测试集中样本的类别,如图2所示,输入测试集样本数据后,每个所述1-v-1SVM均会对该样本数据进行分类获取一个分类结果,最终采用多数投票原则,选择票数最多的类为该样本的类别。
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求保护范围之内。
Claims (4)
1.一种基于特征权学习的支持向量机电网业务分类方法,其特征在于,所述方法包括:
(1)采集电网数据并对电网数据进行预处理,将预处理后的电网数据分为训练集和测试集;
(2)将所述训练集中每两类的样本进行组合为一个训练子集并训练为一个SVM二分类器,第m个SVM二分类器的训练子集为[Xm,Ym],共个SVM二分类器,根据每个SVM二分类器的特征子集构建维特征选择矩阵ξ,根据每个SVM二分类器的特征权重构建维特征权重矩阵A,根据每个SVM二分类器的参数向量构建维参数矩阵γ,Xm=[x1,x2,…,xi,…,xl]T为所述第m个SVM二分类器的训练子集的样本,样本 为样本xi的第k维特征,d为电网业务类别对应特征数,Ym=[y1,y2,…,yl]T为所述第m个SVM二分类器的训练子集中样本对应的类别,l为所述第m个SVM二分类器的训练子集中电网业务流个数,c为电网业务类别的总数目;
(3)采用特征选择算法对所述训练子集[Xm,Ym]进行处理,获取所述训练子集[Xm,Ym]对应的最优特征选择向量ξm,并根据所述最优特征选择向量更新特征选择矩阵及训练子集的样本X′m=Xm(:,ξm);
(4)采用特征权重学习算法对所述最优特征选择向量ξm进行处理,获取所述最优特征选择向量ξm对应的权重向量Am,并根据所述最优特征选择向量ξm对应的权重向量Am更新所述特征权重矩阵A;
(5)根据更新后的特征权重矩阵A重构所述训练子集[Xm,Ym]对应的特征;
(6)采用网格交叉验证的方法获取训练子集[Xm,Ym]的惩罚因子Cm和高斯核函数参数σm,其中,γm=[Cm,σm]为第m个训练子集对应的优化参数向量,更新所述参数矩阵
(7)判断是否每个SVM二分类器的训练子集的特征子集、特征权重和参数向量均更新为其对应的最优选择向量、权重向量和优化参数向量,若是则执行步骤(8),若否则返回步骤(3);
(8)基于更新后的特征选择矩阵ξ、特征权重矩阵A和参数矩阵γ训练1-v-1SVM多分类模型,并根据所述1-v-1SVM多分类模型对所述测试集进行分类,依据投票结果确定测试集中样本的类别;
所述步骤(3)包括:
(3-1)采用向后递归消除特征选择算法RFE获取所述训练子集[Xm,Ym]的最优特征选择向量ξm;
(3-2)更新特征选择矩阵及训练子集的样本X′m=Xm(:,ξm)。
2.如权利要求1所述的方法,其特征在于,所述步骤(1)包括:
(1-1)剔除电网数据中错误数据或维度不完整数据;
(1-2)删除电网数据中类的样本数小于30的类;
(1-3)电网数据中类的样本数大于500的类,从该类中选择250个加入训练集;
(1-4)电网数据中类的样本数大于30且小于500的类,从该类中选择一半加入训练集,另一半加入测试集。
3.如权利要求1所述的方法,其特征在于,所述步骤(4)包括:
(4-1)定义所述最优特征选择向量ξm对应的权重向量Am的特征权重学习模型Am=Gm=argmaxP(K)m,设置步长step和迭代终止条件norm(ΔGm)<ε,其中,迭代终止条件norm(ΔGm)<ε为相邻两次迭代获取的最优特征选择向量对应的权重向量Gm之差小于ε, 为训练子集[Xm,Ym]中样本第k个特征对应的权重值,n为训练子集[Xm,Ym]中样本特征数;
(4-2)计算所述训练子集[Xm,Ym]的高斯核函数kRBF(xi,xj)m,公式为:
式(1)中,为样本xi的第k维特征,为样本xj的第k维特征,σ为高斯核函数参数;
(4-3)计算核极化核函数度量标准P(K)m对特征权值的梯度公式为:
式(2)中,yi为样本xi对应的类别,yj为样本xj对应的类别,l为所述第m个训练子集中电网业务流个数;其中,所述核极化核函数度量标准P(K)m的公式为:
(4-4)初始化
(4-5)根据核极化核函数度量标准P(K)对特征权值g(k)的梯度获取更新后的特征权值公式为:
(4-6)根据更新后的特征权值获取更新后最优特征选择向量对应的权重向量G′m,若更新后最优特征选择向量对应的权重向量G′m满足迭代终止条件norm(ΔGm)<ε,则根据更新后最优特征选择向量对应的权重向量G′m更新所述特征权重矩阵A,否则重复执行步骤(4-5)。
4.如权利要求1所述的方法,其特征在于,所述步骤(5)包括:根据更新后的特征权重矩阵A重构所述训练子集[Xm,Ym]对应的特征,公式为:
式(5)中,为样本xi的第k维特征,为特征权重矩阵中第m个训练子集的第k个特征对应的权重向量。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510543111.1A CN105184316B (zh) | 2015-08-28 | 2015-08-28 | 一种基于特征权学习的支持向量机电网业务分类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510543111.1A CN105184316B (zh) | 2015-08-28 | 2015-08-28 | 一种基于特征权学习的支持向量机电网业务分类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105184316A CN105184316A (zh) | 2015-12-23 |
CN105184316B true CN105184316B (zh) | 2019-05-14 |
Family
ID=54906380
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510543111.1A Active CN105184316B (zh) | 2015-08-28 | 2015-08-28 | 一种基于特征权学习的支持向量机电网业务分类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105184316B (zh) |
Families Citing this family (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105974219B (zh) * | 2016-04-11 | 2021-01-15 | 中国电力科学研究院 | 一种节能电器负荷类型的分类识别方法 |
CN107346433B (zh) * | 2016-05-06 | 2020-09-18 | 华为技术有限公司 | 一种文本数据分类方法及服务器 |
CN106651317A (zh) * | 2016-12-28 | 2017-05-10 | 浙江省公众信息产业有限公司 | 一种业务流程相关性的判别方法和装置 |
CN106886792B (zh) * | 2017-01-22 | 2020-01-17 | 北京工业大学 | 一种基于分层机制构建多分类器融合模型的脑电情感识别方法 |
CN107065839B (zh) * | 2017-06-06 | 2019-09-27 | 苏州大学 | 一种基于相异性递归消除特征的故障诊断方法及装置 |
CN107292292A (zh) * | 2017-07-20 | 2017-10-24 | 浙江好络维医疗技术有限公司 | 一种基于支持向量机的qrs波群分类方法 |
CN107463963A (zh) * | 2017-08-10 | 2017-12-12 | 郑州云海信息技术有限公司 | 一种故障分类方法及装置 |
CN109086187A (zh) * | 2018-07-26 | 2018-12-25 | 郑州云海信息技术有限公司 | 一种性能告警方法和装置 |
CN109492664B (zh) * | 2018-09-28 | 2021-10-22 | 昆明理工大学 | 一种基于特征加权模糊支持向量机的音乐流派分类方法及系统 |
CN109035066A (zh) * | 2018-09-30 | 2018-12-18 | 国网山西省电力公司阳泉供电公司 | 基于svm的10千伏配网高掉闸线路成因分析及治理方法 |
CN109257383B (zh) * | 2018-11-09 | 2021-09-21 | 中国人民解放军战略支援部队信息工程大学 | 一种bgp异常检测方法及系统 |
CN109739844B (zh) * | 2018-12-26 | 2023-03-24 | 西安电子科技大学 | 基于衰减权重的数据分类方法 |
CN110263856B (zh) * | 2019-06-20 | 2021-04-27 | 北京实力伟业环保科技有限公司 | 基于物联网的风机故障评价方法、系统及设备 |
CN110288048B (zh) * | 2019-07-02 | 2022-11-29 | 东北大学 | 一种svm有向无环图的海底管道风险评估方法 |
CN110516041A (zh) * | 2019-08-28 | 2019-11-29 | 深圳勇艺达机器人有限公司 | 一种人机对话系统的文本分类方法 |
CN110912910A (zh) * | 2019-11-29 | 2020-03-24 | 北京工业大学 | 一种dns网络数据过滤方法及装置 |
CN113128544B (zh) * | 2020-01-15 | 2024-06-18 | 富士通株式会社 | 训练人工智能模型的方法和装置 |
CN113779236B (zh) * | 2021-08-11 | 2022-12-27 | 浙江义乌购电子商务有限公司 | 一种基于人工智能的问题分类的方法及装置 |
CN116226629B (zh) * | 2022-11-01 | 2024-03-22 | 内蒙古卫数数据科技有限公司 | 一种基于特征贡献的多模型特征选择方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102025620A (zh) * | 2010-12-07 | 2011-04-20 | 南京邮电大学 | 基于业务区分的认知网络QoS保障方法 |
CN102542028A (zh) * | 2011-12-23 | 2012-07-04 | 国网电力科学研究院 | 一种基于自动控制理论的智能电网信息迭代分类方法 |
CN103258255A (zh) * | 2013-03-28 | 2013-08-21 | 国家电网公司 | 一种适用于电网管理系统的知识发现方法 |
CN103473308A (zh) * | 2013-09-10 | 2013-12-25 | 浙江大学 | 基于最大间隔张量学习的高维多媒体数据分类方法 |
CN104751200A (zh) * | 2015-04-10 | 2015-07-01 | 中国电力科学研究院 | 一种svm网络业务分类的方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120220875A1 (en) * | 2010-04-20 | 2012-08-30 | Suri Jasjit S | Mobile Architecture Using Cloud for Hashimoto's Thyroiditis Disease Classification |
-
2015
- 2015-08-28 CN CN201510543111.1A patent/CN105184316B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102025620A (zh) * | 2010-12-07 | 2011-04-20 | 南京邮电大学 | 基于业务区分的认知网络QoS保障方法 |
CN102542028A (zh) * | 2011-12-23 | 2012-07-04 | 国网电力科学研究院 | 一种基于自动控制理论的智能电网信息迭代分类方法 |
CN103258255A (zh) * | 2013-03-28 | 2013-08-21 | 国家电网公司 | 一种适用于电网管理系统的知识发现方法 |
CN103473308A (zh) * | 2013-09-10 | 2013-12-25 | 浙江大学 | 基于最大间隔张量学习的高维多媒体数据分类方法 |
CN104751200A (zh) * | 2015-04-10 | 2015-07-01 | 中国电力科学研究院 | 一种svm网络业务分类的方法 |
Also Published As
Publication number | Publication date |
---|---|
CN105184316A (zh) | 2015-12-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105184316B (zh) | 一种基于特征权学习的支持向量机电网业务分类方法 | |
CN110674407B (zh) | 基于图卷积神经网络的混合推荐方法 | |
CN108520357B (zh) | 一种线损异常原因的判别方法、装置及服务器 | |
CN104155574B (zh) | 基于自适应神经模糊推理系统的配电网故障分类方法 | |
CN106201871A (zh) | 基于代价敏感半监督的软件缺陷预测方法 | |
CN104933428B (zh) | 一种基于张量描述的人脸识别方法及装置 | |
CN105354595A (zh) | 一种鲁棒视觉图像分类方法及系统 | |
CN108051660A (zh) | 一种变压器故障组合诊断模型建立方法及诊断方法 | |
CN112149873B (zh) | 一种基于深度学习的低压台区线损合理区间预测方法 | |
CN107832412B (zh) | 一种基于文献引用关系的刊物聚类方法 | |
CN112200471B (zh) | 充电桩的数量配置方法、装置和充电桩的分布系统 | |
CN105654196A (zh) | 一种基于电力大数据的自适应负荷预测选择方法 | |
CN104200217A (zh) | 基于一种复合核函数的高光谱分类方法 | |
CN109767312A (zh) | 一种信用评估模型训练、评估方法与装置 | |
CN105471647B (zh) | 一种电力通信网故障定位方法 | |
CN103258210A (zh) | 一种基于字典学习的高清图像分类方法 | |
CN116205355B (zh) | 电力负荷的预测方法、装置以及存储介质 | |
CN110458189A (zh) | 压缩感知和深度卷积神经网络电能质量扰动分类方法 | |
CN109492766A (zh) | 一种基于最小p范数的宽度学习方法 | |
CN109754122A (zh) | 一种基于随机森林特征提取的bp神经网络的数值预测方法 | |
CN109978074A (zh) | 基于深度多任务学习的图像美感和情感联合分类方法及系统 | |
CN108318810A (zh) | 高压隔离开关故障确定方法和装置 | |
CN104657574A (zh) | 一种医疗诊断模型的建立方法及装置 | |
CN110263644A (zh) | 基于三胞胎网络的遥感图像分类方法、系统、设备及介质 | |
CN113918806A (zh) | 自动推荐培训课程的方法及相关设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |