CN114091961A - 一种基于半监督svm的电力企业供应商评价方法 - Google Patents

一种基于半监督svm的电力企业供应商评价方法 Download PDF

Info

Publication number
CN114091961A
CN114091961A CN202111439891.7A CN202111439891A CN114091961A CN 114091961 A CN114091961 A CN 114091961A CN 202111439891 A CN202111439891 A CN 202111439891A CN 114091961 A CN114091961 A CN 114091961A
Authority
CN
China
Prior art keywords
svm
evaluation
power enterprise
semi
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111439891.7A
Other languages
English (en)
Inventor
向泽江
柯晓凡
陶俭
马晓燕
陈竞翔
刘振华
章世喜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huaneng Energy Transportation Industry Holding Co ltd
Shanghai Huaneng E Commerce Co ltd
Original Assignee
Huaneng Energy Transportation Industry Holding Co ltd
Shanghai Huaneng E Commerce Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huaneng Energy Transportation Industry Holding Co ltd, Shanghai Huaneng E Commerce Co ltd filed Critical Huaneng Energy Transportation Industry Holding Co ltd
Priority to CN202111439891.7A priority Critical patent/CN114091961A/zh
Publication of CN114091961A publication Critical patent/CN114091961A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • G06F18/2155Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the incorporation of unlabelled data, e.g. multiple instance learning [MIL], semi-supervised techniques using expectation-maximisation [EM] or naïve labelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23211Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with adaptive number of clusters
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/067Enterprise or organisation modelling

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • General Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Educational Administration (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Development Economics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Game Theory and Decision Science (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Probability & Statistics with Applications (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于半监督SVM的电力企业供应商评价方法,包括:建立电力企业供应商综合评价指标体系并对评价对象进行分级;根据改进的模糊C均值对训练样本自动标识并进行半监督式预处理,得到支持向量的样本;根据电力企业供应商的分级,构造多层SVM分类器,根据训练样本,对多层SVM分类器进行训练与测试;利用训练后的模型对评价对象进行评价,得出评价结果。本发明避免了人工标识训练样本,减少了工作量,使标识结果更加客观;提高了SVM的训练速度和精度;采用SVM对供电企业综合水平划分等级,在小样本情况下表现出良好的泛化性能;解决了电力企业供应商评价方法不准确的问题,进而达到了提高电力企业供应商评价方法准确性的效果。

Description

一种基于半监督SVM的电力企业供应商评价方法
技术领域
本发明涉及电力数据的技术领域,尤其涉及一种基于半监督SVM的电力企业供应商评价方法。
背景技术
电力企业作为国民经济支柱产业,肩负着履行社会责任的重任,为了促进电力企业物资集约化管理和运营效,为电力企业招标采购工作提供一定的参考作用,如何客观正确地评价一个电力企业供应商显得尤为重要。为了综合、全面地评价电厂整个生产过程,监督评价体系的研究近年来虽然得到了较快发展,但基本以统计数据分析为主,如因子分析法、聚类分析法、层次分析法等,该类方法主观性太强,且评价过程做了较多简化,结果不明确。
随着计算机技术的快速发展,一种以计算机仿真和数值模拟为主的评价方法越来越受到人们的关注,如神经网络、支持向量机等,其可操作性强,评价结果接近实际,能很好地应用在企业监督评价中。然而,由于神经网络遵循的是基于样本的训练误差最小化原则,在学习过程中,可能陷入局部极小值,并容易过度拟合训练样本,降低分类器的泛化精度,将严重影响神经网络分类器的评价性能。另外,但由于支持向量机SVM是监督式学习机制,要求必须采用标识样本进行训练,人工标识供电企业评价等级不仅工作量大,而且标识结果可能会因人的主观感觉而出现差异,纯非监督机制又往往会由于可利用信息量的减少导致实际分类的不准确。
发明内容
本部分的目的在于概述本发明的实施例的一些方面以及简要介绍一些较佳实施例。在本部分以及本申请的说明书摘要和发明名称中可能会做些简化或省略以避免使本部分、说明书摘要和发明名称的目的模糊,而这种简化或省略不能用于限制本发明的范围。
鉴于上述现有存在的问题,提出了本发明。
因此,本发明解决的技术问题是:传统供应商评价方法主观性太强、结果不明确,神经网络学习过程中可能陷入局部极小值,并容易过度拟合训练样本,降低分类器的泛化精度,传统SVM人工标识供电企业评价等级不仅工作量大,而且标识结果可能会因人的主观感觉而出现差异。
为解决上述技术问题,本发明提供如下技术方案:建立电力企业供应商综合评价指标体系并对评价对象进行分级;根据改进的模糊C均值对训练样本自动标识并进行半监督式预处理,得到支持向量的样本;根据电力企业供应商的分级,构造多层SVM分类器,根据所述训练样本,对所述多层SVM分类器进行训练与测试;利用训练后的模型对评价对象进行评价,得出评价结果。
作为本发明所述的基于半监督SVM的电力企业供应商评价方法的一种优选方案,其中:所述电力企业供应商综合评价指标体系建立遵循的基本原则包括全面性、典型性、独立性和实用性的基本原则。
作为本发明所述的基于半监督SVM的电力企业供应商评价方法的一种优选方案,其中:影响所述电力企业供应商评价结果的因素包括组织因素、产品因素、供货因素、售后因素和社会责任因素。
作为本发明所述的基于半监督SVM的电力企业供应商评价方法的一种优选方案,其中:所述半监督式预处理过程包括,
设置算法迭代计数器t=0,设定迭代停止阈值ε=0.001,选择分类数c=4,选择初始聚类中心V={vj};
计算第i个样本点属于第j个聚类中心的隶属度uij
Figure BDA0003382903030000021
更新聚类中心,并把所述隶属度uij更新为
Figure BDA0003382903030000022
t=t+1:
Figure BDA0003382903030000023
Figure BDA0003382903030000024
则结束,否则继续更新所述聚类中心和所述隶属度;
对最终计算出来的隶属度进行归一化处理:
Figure BDA0003382903030000025
去除uij大于τ的样本,取τ=0.8,完成对数据的半监督式预处理。
作为本发明所述的基于半监督SVM的电力企业供应商评价方法的一种优选方案,其中:所述训练集和测试集的划分包括,随机选取所收集数据的70%的样本作为SVM分类模型的训练集,30%的样本作为测试集。
作为本发明所述的基于半监督SVM的电力企业供应商评价方法的一种优选方案,其中:构造所述多层SVM分类器过程包括,
基于所述训练样本集(x1,y1),…,(xl,yl),x∈Rn,y∈{+1,-1},在训练样本集线性可分情况下,最优分类超平面的定义可表述为如下凸优化问题:
Figure BDA0003382903030000031
s.t.yi[w·xi+b]≥1,i=1,…,l
引入松弛变量ξ≥0,构造软间隔最优超平面:
Figure BDA0003382903030000032
s.t.yi[w·xi+b]≥1-ξ1
通过拉格朗日乘子法将所述优化问题转化为其对偶形式:
Figure BDA0003382903030000033
Figure BDA0003382903030000034
利用原空间的核函数K(xi,xj)代替高维特征空间的复杂的点积运算
Figure BDA0003382903030000035
则目标函数为:
Figure BDA0003382903030000036
根据所述目标函数得出基于最优超平面的分类规则:
Figure BDA0003382903030000037
其中:
Figure BDA0003382903030000038
Figure BDA0003382903030000039
其中,x*(1)表示属于第一类的任一支持向量,x*(-1)表示属于第二类的任一支持向量。
作为本发明所述的基于半监督SVM的电力企业供应商评价方法的一种优选方案,其中:所述分类函数包括,
Figure BDA0003382903030000041
其中,j表示第j个SVM分类器的决策函数,若:
Figure BDA0003382903030000042
则输入样本属于第n类。
作为本发明所述的基于半监督SVM的电力企业供应商评价方法的一种优选方案,其中:所述多层SVM分类器包括三层SVM分类器:SVM1、SVM2、SVM3,所述三层SVM分类器的训练过程为:对于第i(i=1,2,3)个SVM,对应于第i类中的训练样本的决策属性值置为+1,将其他样本的决策属性值置为-1;分别把训练样本的条件属性值和第i类对应的决策属性值送入3个SVM中进行训练。
作为本发明所述的基于半监督SVM的电力企业供应商评价方法的一种优选方案,其中:利用训练后的模型对评价对象进行评价,所述评价过程包括,先将待评价对象输入到SVM1中,如果它的输出为+1,则判断它的评价等级为优,评价过程结束;否则,把它输入到SVM2中,如果它的输出+1,则判断它为良,评价过程结束;否则,再把它输入到SVM3中,如果它的输出为+1,则判断它为中,否则判断它为差。
本发明的有益效果:避免了人工标识训练样本,减少了工作量,也使标识结果更加客观;挑选出了最有可能成为支持向量的样本,缩减了训练集,减少了计算量,从而提高了SVM的训练速度和精度;采用SVM对供电企业综合水平划分等级,在小样本情况下表现出良好的泛化性能;通过获取待评价的供应商的多个评价项目信息,将多个评价项目信息输入到预先训练好的评价模型中进行评价,得到评价结果,根据评价结果确定待评价的供应商的等级,解决了电力企业供应商评价方法不准确的问题,进而达到了提高电力企业供应商评价方法准确性的效果。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。其中:
图1为本发明一个实施例提供的一种基于半监督SVM的电力企业供应商评价方法的综合评价指标体系结构图;
图2为本发明一个实施例提供的一种基于半监督SVM的电力企业供应商评价方法的基于三层SVM的电力企业供应商评价过程图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合说明书附图对本发明的具体实施方式做详细的说明,显然所描述的实施例是本发明的一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明的保护的范围。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是本发明还可以采用其他不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似推广,因此本发明不受下面公开的具体实施例的限制。
其次,此处所称的“一个实施例”或“实施例”是指可包含于本发明至少一个实现方式中的特定特征、结构或特性。在本说明书中不同地方出现的“在一个实施例中”并非均指同一个实施例,也不是单独的或选择性的与其他实施例互相排斥的实施例。
本发明结合示意图进行详细描述,在详述本发明实施例时,为便于说明,表示器件结构的剖面图会不依一般比例作局部放大,而且所述示意图只是示例,其在此不应限制本发明保护的范围。此外,在实际制作中应包含长度、宽度及深度的三维空间尺寸。
同时在本发明的描述中,需要说明的是,术语中的“上、下、内和外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一、第二或第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。
本发明中除非另有明确的规定和限定,术语“安装、相连、连接”应做广义理解,例如:可以是固定连接、可拆卸连接或一体式连接;同样可以是机械连接、电连接或直接连接,也可以通过中间媒介间接相连,也可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
实施例1
参照图1~2,为本发明的一个实施例,提供了一种基于半监督SVM的电力企业供应商评价方法,包括:
S1:基于全面性、典型性、独立性和实用性的基本原则,建立电力企业供应商综合评价指标体系并对评价对象进行分级;
需要说明的是,电力企业作为国民经济支柱产业,肩负着履行社会责任的重任,其指标体系的构建应在传统供应商全寿命周期的基础上,综合考虑其社会责任维度指标;另外,由于电力企业供应商具有种类繁多、行业分布广、供应商差异大等特点,造成供应商关系管理难度加大;现有的理论研究比较侧重于指标体系的构建以及运用综合评价法对供应商进行综合评价,但是基于社会责任角度对电力企业供应商评价研究还比较少,当前国网已经制定了各类型物资的评价指标体系,但是未能实现评价结果与招投标管理的有效联动,因此,需要构建一个完善的供应商综合评价模型。
根据市场调研和前人的研究,将影响电力企业供应商评价等级的各种因素整理出来,大致分为五大主要因素,分别为组织因素、产品因素、供货因素、售后因素和社会责任因素,直接影响评价结果,每个因素都有不同的评价指标,影响各个上级因素的评价结果。具体来说,组织因素的评价指标有资产总额、合作次数、资质得分、净资产收益率、资产负债率,产品因素的评价指标有产品合格率、高级技术人员占比、奖项及专利,供货因素的评价指标有合同签订及时性、供货完整性、三单合格率,售后因素的评价指标有服务合格率和服务网点数,社会责任因素的评价指标有上缴利税总额、就业岗位增加数、慈善捐赠累计值。以此来建立合理完整的电力企业供应商综合评价指标体系,体系结构图如图1所示。
进一步的,根据能效监督评价结果要接近实际、便于判断的要求,将评价对象分为优、良、中、差四个等级。
S2:根据改进的模糊C均值对训练样本自动标识并进行半监督式预处理,得到支持向量的样本。
S3:根据电力企业供应商的分级,构造多层SVM分类器,根据训练样本,对多层SVM分类器进行训练与测试。
需要说明的是,S2~S3步骤具体包括:
SVM能够有效地解决有限样本、高维数、非线性、局部最优解等问题,但由于SVM是监督式学习机制,要求必须采用标识样本进行训练,人工标识电力企业供应商评价等级不仅工作量大,而且标识结果可能会因人的主观感觉而出现差异,纯非监督机制往往会由于可利用信息量的减少导致实际分类的不准确,因此本发明对SVM进行半监督式改进,首先根据先验知识,找出各类的初始聚类中心,然后利用一种改进的FCM聚类技术对其他样本自动标识,最后训练多层SVM分类器,完成对电力企业供应商评价等级的划分。
进一步的,SVM的最优分类超平面主要是由支持向量来确定,而那些离最优分类超平面比较远的样本对SVM训练的作用很小,如果能预先取出这些样本,必能大大减少计算量,从而提高SVM的训练速度;FCM聚类是对样本的软划分,它并不对样本进行强制的分类,而是以一个隶属度的概念来评价样本属于某一类别的程度;因此本发明利用FCM对训练样本进行预处理,去除uij大于τ的样本,这里uij是第i个样本点属于第j个聚类中心的隶属度,一般取τ=0.8。
其中,FCM聚类是一种基于目标函数的软聚类方法,它把聚类归结为如下一个带约束的非线性规划问题:
Figure BDA0003382903030000071
Figure BDA0003382903030000072
uij≥0,j=1,2,...,c
∑uij>0
其中,X=(x1,x2,…,xn)∈Rs是样本集,U={uij}为模糊隶属度矩阵,V={vj}是聚类中心的集合,c是聚类中心数且1<c<n,dij=‖xi~vj‖是样本点xi到聚类中心vj的欧式距离,m是模糊加权指数,一般取m=2。
由于归一化条件式在样本集不理想的情况下,FCM聚类方法可能会出现不理想的聚类结果。例如,当某个样本点远离各类的聚类中心时,本来它严格属于各类的隶属度都很小,但由于归一化条件的要求,将会使它对各类都有较大的隶属度(比如两类情况下各类的隶属度都是0.5),从而影响迭代的最终结果;为了使算法具有更好的鲁棒性,提出放松的归一化条件代替式,使所有样本对各类的隶属度总和为n,即:
Figure BDA0003382903030000081
根据目标函数,利用拉格朗日乘数法得到如下基于迭代的FCM聚类算法:
(1)设置算法迭代计数器t=0,设定迭代停止阈值ε=0.001,选择分类数c=4。
(2)选择初始聚类中心V={vj},由于FCM算法对初始的聚类中心值极为敏感,容易陷入局部最优解,而且如果选择的初始值和最终迭代结果很相近,就可以大大减少FCM的迭代次数,提高FCM的聚类速度,因此根据先验知识人工确定FCM的初始聚类中心。
(3)计算第i个样本点属于第j个聚类中心的隶属度:
Figure BDA0003382903030000082
(4)更新聚类中心:
Figure BDA0003382903030000083
将隶属度uij更新为
Figure BDA0003382903030000084
t=t+1。
(5)如果
Figure BDA0003382903030000085
则结束,否则转到(4)继续。
(6)对最终计算出来的隶属度进行归一化:
Figure BDA0003382903030000086
进一步的,SVM是由Vapnik提出的一种基于结构风险最小化(SRM)原则的机器学习方法,它实现如下思想:通过一个非线性映射
Figure BDA0003382903030000087
将输入向量x映射到一个高维线性特征空间,在这个空间中构造最优分类超平面
Figure BDA0003382903030000088
所谓最优分类超平面就是要求不但能把训练数据没有错误的分开(即经验风险为零),而且离超平面最近的样本与超平面之间的距离(即分类间隔)最大。该定义体现了SVM最小化风险泛函的策略,即保持经验风险固定并最小化置信范围。
随机选取所收集数据的70%的样本作为SVM分类模型的训练集,30%的样本作为测试集。给出训练样本集(x1,y1),…,(xl,yl),x∈Rn,y∈{+1,-1},在训练样本集线性可分情况下,最优分类超平面的定义可表述为如下凸优化问题:
Figure BDA0003382903030000091
s.t.yi[w·xi+b]≥1,i=1,…,l
考虑到训练样本集线性不可分的情况,引入松弛变量ξ≥0,构造软间隔最优超平面:
Figure BDA0003382903030000092
s.t.yi[w·xi+b]≥1-ξ1
其中,C≥0为惩罚参数。
通过拉格朗日乘子法可将该优化问题转化为其对偶形式:
Figure BDA0003382903030000093
Figure BDA0003382903030000094
针对训练样本集非线性情况,支持向量机用原空间的核函数K(xi,xj)代替高维特征空间的复杂的点积运算
Figure BDA0003382903030000095
所以目标函数可以表示为:
Figure BDA0003382903030000096
这是一个不等式约束下二次函数寻优问题,存在唯一的解。由K-T条件可知,只有支持向量的系数αi才可能为非零值,即只有支持向量影响最终的划分结果,于是w可以表示为:
Figure BDA0003382903030000097
b可表示为:
Figure BDA0003382903030000098
其中,x*(1)表示属于第一类的任一支持向量,x*(-1)表示属于第二类的任一支持向量。
于是,基于最优超平面的分类规则可表示为下面的指示函数:
Figure BDA0003382903030000101
采用一对多SVM将两类SVM推广解决多分类问题,假设样本集有k(k≥2)类,把类1作为一类,其余k-1类视为一类,自然地将k分类问题转化为二分类问题,这种分类方法在训练过程中,每个分类函数都需要所有的样本参与,其中,分类函数为:
Figure BDA0003382903030000102
其中,上标表示第j个SVM分类器的决策函数;
对待测样本,若:
Figure BDA0003382903030000103
则输入样本属于第n类。
更进一步的,电力企业供应商有4个评价等级,这是一个多分类问题,本发明采用基于二叉树的SVM来实现多分类,构造了三层SVM分类器,得到SVM1、SVM2、SVM3,它的主要训练过程为:对于第i(i=1,2,3)个SVM,对应于第i类中的训练样本的决策属性值置为+1,而将其他样本的决策属性值置为-1,分别把训练样本的条件属性值和第i类对应的决策属性值送人3个SVM中进行训练,训练好多层SVM之后,用选出的测试样本测试模型的可靠性。
S4:利用训练后的模型对评价对象进行评价,得出评价结果。
需要说明的是,将待评价对象输入到训练好的模型中进行评价,评价过程为:先把待评价对象输入到SVM1中,如果它的输出为+1,则判断它的评价等级为优,评价过程结束;否则,把它输入到SVM2中,如果它的输出+1,则判断它为良,评价过程结束;否则,再把它输入到SVM3中,如果它的输出为+1,则判断它为中,否则判断它为差,具体过程如图2所示。
实施例2
该实施例为本发明另一个实施例,该实施例不同于第一个实施例的是,提供了一种基于半监督SVM的电力企业供应商评价方法的验证测试,为对本方法中采用的技术效果加以验证说明,本实施例采用本发明方法进行论证测试,以科学论证的手段验证本方法所具有的真实效果。
本实施例采用RBF核函数k(x,y)=exp[-‖x–y‖2/(2δ2)],x、y为训练集输入,δ为径向基函数的宽度。经多次测试,δ取值为0.310221,误差惩罚因子C取值为950 782 342,分类效果最佳。
其中,测试结果如下:
SVM1的测试样本集={1个优,2个良,4个中,1个差};
SVM1的输出={+1,-1,-1,-1,-1,-1,-1,-1};
SVM1正确区分了优与其他级别(良、中、差)的样本。
SVM2的测试样本集={2个良,4个中,1个差};
SVM2的输出={+1,+1,-1,-1,-1,-1,-1};
SVM2正确区分了良与其他级别(中、差)的样本。
SVM3的测试样本集={4个中,1个差},
SVM3的输出={+1,+1,+1,+1,-1},
SVM3正确区分了中与差的样本。
由此可见,SVM能够准确地对电力企业供应商的评价等级进行划分,当训练样本较少时,SVM算法用少量支持向量代表整个样本集,表现出良好的泛化性能。
应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。

Claims (9)

1.一种基于半监督SVM的电力企业供应商评价方法,其特征在于,包括:
建立电力企业供应商综合评价指标体系并对评价对象进行分级;
根据改进的模糊C均值对训练样本自动标识并进行半监督式预处理,得到支持向量的样本;
根据电力企业供应商的分级,构造多层SVM分类器,根据所述训练样本,对所述多层SVM分类器进行训练与测试;
利用训练后的模型对评价对象进行评价,得出评价结果。
2.如权利要求1所述的基于半监督SVM的电力企业供应商评价方法,其特征在于:所述电力企业供应商综合评价指标体系建立遵循的基本原则包括全面性、典型性、独立性和实用性的基本原则。
3.如权利要求1或2所述的基于半监督SVM的电力企业供应商评价方法,其特征在于:影响所述电力企业供应商评价结果的因素包括组织因素、产品因素、供货因素、售后因素和社会责任因素。
4.如权利要求1所述的基于半监督SVM的电力企业供应商评价方法,其特征在于:所述半监督式预处理过程包括,
设置算法迭代计数器t=0,设定迭代停止阈值ε=0.001,选择分类数c=4,选择初始聚类中心V={vj};
计算第i个样本点属于第j个聚类中心的隶属度uij
Figure FDA0003382903020000011
更新聚类中心,并把所述隶属度uij更新为
Figure FDA0003382903020000012
Figure FDA0003382903020000013
Figure FDA0003382903020000014
则结束,否则继续更新所述聚类中心和所述隶属度;
对最终计算出来的隶属度进行归一化处理:
Figure FDA0003382903020000015
去除uij大于τ的样本,取τ=0.8,完成对数据的半监督式预处理。
5.如权利要求1所述的基于半监督SVM的电力企业供应商评价方法,其特征在于:所述训练集和测试集的划分包括,
随机选取所收集数据的70%的样本作为SVM分类模型的训练集,30%的样本作为测试集。
6.如权利要求1或5所述的基于半监督SVM的电力企业供应商评价方法,其特征在于:构造所述多层SVM分类器过程包括,
基于所述训练样本集(x1,y1),…,(xl,yl),x∈Rn,y∈{+1,-1},在训练样本集线性可分情况下,最优分类超平面的定义可表述为如下凸优化问题:
Figure FDA0003382903020000021
s.t.yi[w·xi+b]≥1,i=1,…,l
引入松弛变量ξ≥0,构造软间隔最优超平面:
Figure FDA0003382903020000022
s.t.yi[w·xi+b]≥1-ξ1
通过拉格朗日乘子法将所述优化问题转化为其对偶形式:
Figure FDA0003382903020000023
Figure FDA0003382903020000024
利用原空间的核函数K(xi,xj)代替高维特征空间的复杂的点积运算
Figure FDA0003382903020000025
则目标函数为:
Figure FDA0003382903020000026
根据所述目标函数得出基于最优超平面的分类规则:
Figure FDA0003382903020000027
其中:
Figure FDA0003382903020000028
Figure FDA0003382903020000031
其中,x*(1)表示属于第一类的任一支持向量,x*(-1)表示属于第二类的任一支持向量。
7.如权利要求1所述的基于半监督SVM的电力企业供应商评价方法,其特征在于:所述分类函数包括,
Figure FDA0003382903020000032
其中,j表示第j个SVM分类器的决策函数,若:
Figure FDA0003382903020000033
则输入样本属于第n类。
8.如权利要求7所述的基于半监督SVM的电力企业供应商评价方法,其特征在于:所述多层SVM分类器包括三层SVM分类器:SVM1、SVM2、SVM3,所述三层SVM分类器的训练过程为:
对于第i(i=1,2,3)个SVM,对应于第i类中的训练样本的决策属性值置为+1,将其他样本的决策属性值置为-1;
分别把训练样本的条件属性值和第i类对应的决策属性值送入3个SVM中进行训练。
9.如权利要求8所述的基于半监督SVM的电力企业供应商评价方法,其特征在于:利用训练后的模型对评价对象进行评价,所述评价过程包括,
先将待评价对象输入到SVM1中,如果它的输出为+1,则判断它的评价等级为优,评价过程结束;否则,把它输入到SVM2中,如果它的输出+1,则判断它为良,评价过程结束;否则,再把它输入到SVM3中,如果它的输出为+1,则判断它为中,否则判断它为差。
CN202111439891.7A 2021-11-30 2021-11-30 一种基于半监督svm的电力企业供应商评价方法 Pending CN114091961A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111439891.7A CN114091961A (zh) 2021-11-30 2021-11-30 一种基于半监督svm的电力企业供应商评价方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111439891.7A CN114091961A (zh) 2021-11-30 2021-11-30 一种基于半监督svm的电力企业供应商评价方法

Publications (1)

Publication Number Publication Date
CN114091961A true CN114091961A (zh) 2022-02-25

Family

ID=80305667

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111439891.7A Pending CN114091961A (zh) 2021-11-30 2021-11-30 一种基于半监督svm的电力企业供应商评价方法

Country Status (1)

Country Link
CN (1) CN114091961A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115310879A (zh) * 2022-10-11 2022-11-08 浙江浙石油综合能源销售有限公司 一种基于半监督聚类算法的多加油站用电量能耗管控方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040111453A1 (en) * 2002-12-06 2004-06-10 Harris Christopher K. Effective multi-class support vector machine classification
CN108241932A (zh) * 2018-01-24 2018-07-03 国网山东省电力公司泰安供电公司 一种电力供应商评价模型的建立方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040111453A1 (en) * 2002-12-06 2004-06-10 Harris Christopher K. Effective multi-class support vector machine classification
CN108241932A (zh) * 2018-01-24 2018-07-03 国网山东省电力公司泰安供电公司 一种电力供应商评价模型的建立方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
孙薇 等: "基于半监督支持向量机的供电企业安全性评", 《电气应用》, vol. 27, no. 1, pages 57 - 60 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115310879A (zh) * 2022-10-11 2022-11-08 浙江浙石油综合能源销售有限公司 一种基于半监督聚类算法的多加油站用电量能耗管控方法
CN115310879B (zh) * 2022-10-11 2022-12-16 浙江浙石油综合能源销售有限公司 一种基于半监督聚类算法的多加油站用电量能耗管控方法

Similar Documents

Publication Publication Date Title
Qin et al. XGBoost optimized by adaptive particle swarm optimization for credit scoring
CN112070125A (zh) 一种基于孤立森林学习的不平衡数据集的预测方法
CN110956273A (zh) 融合多种机器学习模型的征信评分方法及系统
CN110619360A (zh) 一种考虑历史样本相似性的超短期风功率预测方法
CN106845717A (zh) 一种基于多模型融合策略的能源效率评价方法
CN110555459A (zh) 基于模糊聚类和支持向量回归的成绩预测方法
Lin et al. Tourism demand forecasting: Econometric model based on multivariate adaptive regression splines, artificial neural network and support vector regression
CN112529683A (zh) 一种基于cs-pnn的客户信贷风险的评估方法及系统
Alzaeemi et al. Examining the forecasting movement of palm oil price using RBFNN-2SATRA metaheuristic algorithms for logic mining
CN113240527A (zh) 基于可解释机器学习的债券市场违约风险预警方法
Zhang et al. A novel hybrid correlation measure for probabilistic linguistic term sets and crisp numbers and its application in customer relationship management
CN114091961A (zh) 一种基于半监督svm的电力企业供应商评价方法
CN110335160A (zh) 一种基于分组和注意力改进Bi-GRU的就医迁移行为预测方法及系统
CN112417308A (zh) 一种基于电力大数据的用户画像标签生成方法
Yao Hybrid classifier using neighborhood rough set and SVM for credit scoring
CN113344589A (zh) 一种基于vaegmm模型的发电企业串谋行为的智能识别方法
Gritta et al. A review of the history of air carrier bankruptcy forecasting and the application of various models to the US airline industry, 1980-2005
CN112330051A (zh) 一种基于Kmeans与FR-DBN的短期负荷预测方法
Daneshmandi et al. A hybrid data mining model to improve customer response modeling in direct marketing
Madeira et al. Comparison of target selection methods in direct marketing
CN116629904A (zh) 一种基于大数据的客户分层匹配方法
CN114358474A (zh) 一种典型多能用户模型建立方法
Sangadiev et al. A review on recent advances in scenario aggregation methods for power system analysis
Xiong et al. L-RBF: A customer churn prediction model based on lasso+ RBF
Kadam et al. Data mining in finance

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination