CN109472453A - 基于全局最优模糊核聚类模型的电力用户信用评价方法 - Google Patents
基于全局最优模糊核聚类模型的电力用户信用评价方法 Download PDFInfo
- Publication number
- CN109472453A CN109472453A CN201811190590.3A CN201811190590A CN109472453A CN 109472453 A CN109472453 A CN 109472453A CN 201811190590 A CN201811190590 A CN 201811190590A CN 109472453 A CN109472453 A CN 109472453A
- Authority
- CN
- China
- Prior art keywords
- index
- cluster
- power consumer
- global optimum
- credit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 60
- 238000011156 evaluation Methods 0.000 claims abstract description 34
- 238000000605 extraction Methods 0.000 claims abstract description 15
- 238000004451 qualitative analysis Methods 0.000 claims abstract description 8
- 239000000284 extract Substances 0.000 claims abstract description 7
- 239000002245 particle Substances 0.000 claims description 52
- 230000008569 process Effects 0.000 claims description 31
- 238000004458 analytical method Methods 0.000 claims description 22
- 230000003044 adaptive effect Effects 0.000 claims description 5
- 238000006243 chemical reaction Methods 0.000 claims description 5
- 238000013507 mapping Methods 0.000 claims description 5
- 238000005457 optimization Methods 0.000 claims description 5
- 230000001133 acceleration Effects 0.000 claims description 4
- 239000011159 matrix material Substances 0.000 claims description 4
- 230000035772 mutation Effects 0.000 claims description 4
- 238000013139 quantization Methods 0.000 claims description 4
- 238000010219 correlation analysis Methods 0.000 claims description 3
- 230000001419 dependent effect Effects 0.000 claims description 2
- 230000004069 differentiation Effects 0.000 claims description 2
- 230000009466 transformation Effects 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 5
- 230000006399 behavior Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 230000007812 deficiency Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000011002 quantification Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 2
- 238000012804 iterative process Methods 0.000 description 2
- FNMKZDDKPDBYJM-UHFFFAOYSA-N 3-(1,3-benzodioxol-5-yl)-7-(3-methylbut-2-enoxy)chromen-4-one Chemical compound C1=C2OCOC2=CC(C2=COC=3C(C2=O)=CC=C(C=3)OCC=C(C)C)=C1 FNMKZDDKPDBYJM-UHFFFAOYSA-N 0.000 description 1
- 241000271566 Aves Species 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012854 evaluation process Methods 0.000 description 1
- 210000003746 feather Anatomy 0.000 description 1
- 244000144992 flock Species 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000004064 recycling Methods 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000007306 turnover Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Strategic Management (AREA)
- General Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- Data Mining & Analysis (AREA)
- Marketing (AREA)
- Educational Administration (AREA)
- Tourism & Hospitality (AREA)
- Development Economics (AREA)
- General Business, Economics & Management (AREA)
- Quality & Reliability (AREA)
- Game Theory and Decision Science (AREA)
- Health & Medical Sciences (AREA)
- Operations Research (AREA)
- Artificial Intelligence (AREA)
- Probability & Statistics with Applications (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了基于全局最优模糊核聚类模型的电力用户信用评价方法,包括:建立电力用户信用评价指标体系,并对待评价指标数据进行预处理;建立全局最优模糊核聚类算法模型;将预处理后的待评价的电力用户信用评价数据输入建立的全局最优模糊核聚类算法模型,获取聚类结果;对获取的聚类结果进行定性分析,获取每一类的信用等级;提取聚类结果中每一个聚类的特征指标以及对应的特征值;根据提取的每一个聚类的特征值指标以及对应的特征值,再次评价待评价的电力用户的信用结果。替代了人工对电力用户的信用的评估工作,减轻了人力的投入,节约了电力企业管理成本,并且提高了评价工作的科学性与精确性。
Description
技术领域
本公开涉及信息处理技术领域,特别是涉及基于全局最优模糊核聚类模型的电力用户信用评价方法。
背景技术
随着国家经济与能源产业的快速发展,电力用户对电能的需求越来越大,供电企业在电能营销过程中,电力用户的信用情况将对电力企业的经营产生直接的影响。在目前庞大的电力用户群体中,存在相当一部分用户抗风险能力弱,容易产生资金周转不畅,无法按时缴费,以致窃电、欠费等类似信用缺失现象的发生,这些现象为电力企业带来了不可规避的经济损失,因此,如何及时地评价掌握电力用户的信用情况,有效地规避经营风险,是电力企业目前亟待解决的现实问题。
信用评价工作经过多年的发展,由最初的人工评估发展到信息化的计算评估,发明人发现近些年的信息化评价过程大都基于主观打分法以及主客观指标权重法等,这些方法在面对大样本数据时效率低下,评价过程也缺乏科学性,并且算法复杂度较高;此外,在以往的信用评价过程中,评价对象的指标特征分析往往不够精确,这种指标精确处理的欠缺以及特征分析的欠缺,容易导致评价结果出现比较大的误差。
发明内容
为了解决现有技术的不足,本公开提供了基于全局最优模糊核聚类模型的电力用户信用评价方法,该方法能够快速有效的处理大样本数据,并能够精确地获取用户信用等级。
为了实现上述目的,本申请公开了以下技术方案:
基于全局最优模糊核聚类模型的电力用户信用评价方法,包括:
建立电力用户信用评价指标体系,并对待评价指标数据进行预处理;
建立全局最优模糊核聚类算法模型;
将预处理后的待评价的电力用户信用评价数据输入建立的全局最优模糊核聚类算法模型,获取聚类结果;
对获取的聚类结果进行定性分析,获取每一类的信用等级;
提取聚类结果中每一个聚类的特征指标以及对应的特征值;
根据提取的每一个聚类的特征值指标以及对应的特征值,再次评价待评价的电力用户的信用结果。
进一步的技术方案,建立电力用户信用评价指标体系,并对待评价指标数据进行预处理的步骤包括:
对指标数据进行统一量化,并且对指标数据均采用归一化处理;
采用相关性分析算法,计算指标间的共线性;
判断指标的方差膨胀因子,将共线性度高的指标去掉;
计算指标鉴别能力,计算指标变异系数;
判断指标变异系数的大小,把区分评价指标对象特征差异能力小的指标去除掉。
进一步的技术方案,指标间的共线性由指标的方差膨胀因子决定,指标的方差膨胀因子记为VIFp,p=1,2,3,…..P,P为指标的总数,其计算过程为:
上述计算中,Rp 2是一个以第p个指标为因变量,并且剩余其他指标为自变量的辅助回归的判定系数;
进行指标共线性的判断:指标的方差膨胀因子在设定范围内时,指标不存在多重共线性;指标的方差膨胀因子超过设定阈值时,指标存在共线性。
进一步的技术方案,建立全局最优模糊核聚类算法模型的步骤包括:
步骤B1:设定聚类中心个数K,设定全局最优搜索粒子群数目N,根据样本计算高斯核函数;
步骤B2:随机初始化粒子的位置向量Zo,并进行粒子编码,并初始化每一个粒子的速度;
步骤B3:计算每一个样本数据到当前各聚类中心的隶属度,并更新聚类中心;
步骤B4:计算每个粒子的适应度函数值fitt(m);
步骤B5:根据步骤B4中计算的粒子的适应值fitt(m),计算粒子质量Mm(t);
步骤B6:计算粒子优化力度Fm e,并根据步骤B5计算的粒子质量Mm(t),计算粒子的加速度αm e(t);
步骤B7:执行高斯核函数中的变异操作:
步骤B8:更新粒子的速度和位置向量;
步骤B9:判断是否满足终止条件,若是,粒子位置解码,输出隶属度矩阵和各类聚类中心以及聚类结果,否则跳转到步骤B3。
进一步的技术方案,所述步骤B3中,在模糊核聚类过程中,利用高斯核函数对样本进行空间转换,定义非线性转换映射:其中,F为映射后高维特征空间,通过采用高斯核函数,获得聚类准则;
对上述聚类准则通过拉格朗日算子进行求解,获取每一个样本数据到当前各聚类中心的隶属度计算过程;
通过上述隶属度的获取,更新新的聚类中心计算过程。
进一步的技术方案,提取聚类结果中每一个聚类的特征指标以及对应的特征值的步骤包括:
步骤E1:对聚类模型中聚类所采用的指标进行排列组合计算,并作为特征分析聚类指标,其中,特征聚类指标数大于等于2;
步骤E2:分别对获取的聚类结果以及对应的类中对象数据,按照步骤E1获取的指标排列组合为特征分析聚类指标,并进行间接聚类,聚类数仍为一类;
步骤E3:以特征分析聚类指标为依据,计算步骤E2的每一次聚类结果中,每一个对象数据点到聚类中心点的平均距离;
步骤E4:选择步骤E3中最小距离对应的指标作为每一类的关键特征指标;
步骤E5:以E4中获取的关键特征指标为特征聚类指标,将聚类结果中的每一个类重新聚为一类,获取聚类中心点的值为每一类信用等级的关键特征指标的特征值。
所述步骤E1,聚类结束之后,对象数据被分成了k个类,为了进一步提高精准度的分析,需要提取每个类的关键特征,而每个类的关键特征是指能够使聚类内部密度更大,紧致性更大的一组指标,这些指标能突出表现某些样本隶属于某一聚类,即部分起关键决定性作用的指标以及他们的值为聚类的关键特征值。
对聚类所采用的指标进行排列组合计算,并作为特征分析聚类指标,其中,特征聚类指标组合为:
进一步的技术方案,所述步骤E3中,以特征分析聚类指标为依据,计算步骤E2的每一次聚类结果中,计算每一个对象数据点到聚类中心点的平均距离。
进一步的技术方案,根据提取的每一个聚类的特征指标以及对应的特征值,再评价待测对象的信用结果的步骤包括:
步骤F1:计算待评价对象的特征值与步骤E5获取的每类特征中心点的距离;
步骤F2:比较F1计算的每个距离的大小,距离最小的将该对象归为某一类,即获取该类相对应的信用评价结果。
本发明的第二目的是提供基于全局最优模糊核聚类模型的电力用户信用评价系统。
为了实现上述目的,本发明采用如下一种技术方案:
基于全局最优模糊核聚类模型的电力用户信用评价系统,包括:
指标体系建立及预处理单元,建立电力用户信用评价指标体系,并对待评价指标数据进行预处理;
模型建立单元,建立全局最优模糊核聚类算法模型;
聚类单元,将预处理后的待评价的电力用户信用评价数据输入建立的全局最优模糊核聚类算法模型,获取聚类结果;
信用等级分析单元,对获取的聚类结果进行定性分析,获取每一类的信用等级;
提关键特征提取单元,取聚类结果中每一个聚类的特征指标以及对应的特征值;
信用评价单元,根据提取的每一个聚类的特征值指标以及对应的特征值,再次评价待评价的电力用户的信用结果。
本发明的第三目的是提供一种计算机可读存储介质。
为了实现上述目的,本发明采用如下一种技术方案:
一种计算机可读存储介质,其中存储有多条指令,所述指令适于由终端设备的处理器加载并执行所述的基于全局最优模糊核聚类模型的电力用户信用评价方法。
本发明的第四目的是提供一种终端设备。
为了实现上述目的,本发明采用如下一种技术方案:
一种终端设备,包括处理器和计算机可读存储介质,处理器用于实现各指令;计算机可读存储介质用于存储多条指令,所述指令适于由处理器加载并执行所述的基于全局最优模糊核聚类模型的电力用户信用评价方法。
与现有技术相比,本公开的有益效果是:
本公开采用全局最优模糊核聚类解决了传统信用评价算法在面对大样本数据处理时存在的效率低下问题,并在此基础上,通过引入全局最优搜索过程,提高改进了模糊核聚类的全局搜索能力,有效规避了聚类算法容易陷入局部最优的问题;此外,针对传统信用评价算法,在评价精度方面存在的误差问题,本次发明对评价对象的关键特征进行提取分析,提高了信用评价的精确度。
通过本公开提供的一种基于全局最优模糊核聚类与高密度关键特征提取的电力用户信用评价方法,解决了以往电力用户信用评估过程中存在的效率低下、评价误差大、缺乏科学依据的问题;据此,相关电力企业能够及时地根据电力用户的行为属性获取用户的信用情况,为电力用户电费的回收以及电力企业的营销管理提供了理论依据以及技术支持,具体表现在电力企业可根据获取的用户信用等级,制定相应的用户风险管理预防措施,及时有效地规避电力企业的经营风险,从而避免因电力用户信用缺失造成的经济损失。
此外,本公开提供的一种基于全局最优模糊核聚类与高密度关键特征提取的电力用户信用评价方法替代了人工对电力用户的信用的评估工作,减轻了人力的投入,节约了电力企业管理成本,并且提高了评价工作的科学性与精确性。
附图说明
构成本申请的一部分的说明书附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。
图1本申请实施例子的整体流程图;
图2本申请实施例子的指标预处理流程图;
图3本申请实施例子的基于全局最优模糊核聚类模型建立流程图;
图4本申请实施例子的高度密关键特征提取流程图。
图5本申请实施例子的再次信用评价流程图;
图6本申请实施例子的电力用户信用评价初始指标体系示意图;
图7本申请实施例子的经过共线性诊断后处理的指标体系示意图;
具体实施方式
应该指出,以下详细说明都是例示性的,旨在对本申请提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
实施例1:
本申请的该实施例子中通过采用全局最优模糊核聚类、聚类评价分析、高密度关键特征提取、以及待评对象再评价的算法,为电力用户信用评价提供技术支持。包括以下步骤:首先建立电力用户信用评价指标体系,并对待评价指标数据进行量化处理;其次,建立全局最优模糊核聚类模型,将待评价的电力用户信用评价数据输入上述步骤建立的聚类模型,获取聚类结果;接下来进行专家定性分析,获取上述聚类结果的信用情况;其次在基于保证类内高密度原则下,提取聚类结果中每一类的特征值;最后根据提取的每一个类的特征值以及对应的信用等级,再评价待测对象的信用结果。
如附图1发明整体流程图所示,基于全局最优模糊核聚类与高密度关键特征提取的电力用户信用评价方法整体流程图描述了本发明的全过程,如步骤101所述,建立电力用户信用评价指标体系,并对待评价指标数据进行预处理,需在具体实施过程中,将影响电力用户信用的因素进行量化处理,制定一组信用评价指标体系。
如附图2指标预处理流程图所示,步骤201对指标进行量化处理。为了使得初始指标数据具有可比性,评价指标均采用数据量化,并且对指标数据进行归一化处理。在本实施例中采用的电力用户信用评价初始指标体系如图6所示。
针对上述图6中每一个二级指标,本次实施例对非数量化指标采用指标下的一致规则,将指标值采用0,1编码进行量化,此外,为了使指标间具有可比性,对量化后的非数量化指标以及其他数量化指标进行归一化预处理,本次实施例采用最大最小值预处理法,指标预处理过程如下:
如附图2指标预处理流程图所示,步骤202计算指标的共线性。为了避免在电力用户信用评价过程中指标的选择不同引起的评价结果的误差问题,对选择指标过程进行创新,加入指标筛选过程,采用相关性分析算法,计算指标间的共线性,将共线性度高的指标去掉。
指标间的共线性由指标的方差膨胀因子决定,指标的方差膨胀因子记为VIFp(p=1,2,3,…..P),其计算过程为:上述计算中,Rp 2是一个以第p个指标为因变量,并且剩余其他指标为自变量的辅助回归的判定系数。在本次发明中,通过如下判断方法进行指标共线性的判断:0<VIFp<10时,指标不存在多重共线性;VIFp>=10时,指标存在共线性。在本次实施例中经过计算,指标累计欠费金额、累计欠费记录之间存在多重共线性,累计欠费记录指标的方差膨胀因子VIFp为12.90,满足VIFp>=10,故按步骤203所述,将累计欠费记录指标去掉。经过共线性诊断后处理的指标体系如图7所示。
如附图2指标预处理流程图所示,步骤204计算指标鉴别能力。指标变异系数的计算过程为:其中X′表示平均值,Sp表示标准差,平均值的计算过程为: 其中,变异系数越大,说明此指标的鉴别力越好,反之,指标的鉴别力越差。在本次实施例中,指标的变异系数均在阈值范围内,故保留步骤205保存的所有指标。
如附图1发明整体流程图中,步骤102建立全局最优模糊核聚类模型,其流程如附图3基于全局最优模糊核聚类模型建立流程图。
如附图3基于全局最优模糊核聚类模型建立流程图所示,在建立电力用户信用评价指标体系后,进行基于全局最优模糊核聚类模型的建立,步骤301设定聚类中心个数K,设定全局最优搜索粒子群数目N,计算高斯核函数,其中聚类个数k根据信用等级类别进行设定,在本次实施例中将评判等级设为:A级(优秀)、B级(良好)、C级(一般)、D级(较差)、E级(恶劣),所以聚类个数k设定为5。
如步骤301所述,在模糊核聚类过程中,为了提高非线性样本的聚类效果,需要降低聚类结果对聚类样本分布特征的依赖,高斯核函数计算公式为:其中X={xi,i=1,2,.......n}为样本集,n为样本集大小,xi={xi1,xi2,xi3,....xie}为样本xi的各个指标值。
如步骤302所述,初始化粒子的位置向量以及每一个粒子的速度。随机初始化每一个粒子的速度vm k,m∈[1,N];随机初始化粒子的位置向量Zo,并进行粒子编码,所谓粒子编号即用初始化的聚类中心进行初始化位置向量Zo=(c1,c2,ci,...,ck),在全局最优搜索算法中,一个粒子表示待求解的聚类中心集合,其中,ck为粒子的第k个聚类中心。
如步骤303所述,计算每一个样本数据到当前各聚类中心的隶属度,并更新聚类中心。在模糊核聚类过程中,为了提高非线性样本的聚类效果,需要降低聚类结果对聚类样本分布特征的依赖,本发明针对上述情况,利用高斯核函数对样本进行空间转换,定义非线性转换映射:则其中,F为映射后高维特征空间,通过采用高斯核函数,聚类准则为:
对上述聚类准则通过拉格朗日算子进行求解,获取每一个样本数据到当前各聚类中心的隶属度计算过程为:
在本次实施例中,在t时刻的迭代计算过程中,各对象xi的隶属度如下:
其中,每一个对象xi的隶属度之和为1,在迭代计算过程中,根据对象的隶属度最大原则进行归类,归类完成后,重新计算更新聚类中心,计算方式如下:
如步骤304所述,计算每个粒子的适应度函数值。在全局最优搜索过程中,根据映射空间的聚类准则,粒子的适应度函数为:
其中,e是一个微小的正数,在本次实施例中取值e=1/109。
如步骤305所述,根据步骤304中计算的粒子的适应值,计算粒子质量Mm(t)。
fitt(m)表示粒子m在时刻t的适应度,fworst表示适应度的最差值,fbest表示适应度的最优值。
fbest=minfitm(t),m∈{1,……N}
fworst=maxfitm(t),m∈{1,……N}
如步骤306所述,计算粒子优化力度,并根据步骤305计算的粒子质量,计算粒子的加速度。在t时刻粒子m在第e维的力为:
其中,Fm e是粒子在e维受到其他粒子的总优化力度为的随机加权和,randm是[0,1]之间的一个随机数,根据牛顿第二定律,在时刻t,粒子m在第e维上的加速度计算过程为:
如步骤307所述,执行高斯核函数中的变异操作。在全局最优搜索过程中,当粒子在寻找最优解的过程中,粒子状态连续几次不发生变化时,执行高斯变异操作,目的是为了增加群体粒子的多样性,提高全局搜索能力,采用变异机制对已经趋于稳定的粒子群进行一定程度的扰动,对粒子位置进行变异:
ck′=ck+ckr0
其中,r0为一个高斯分布随机函数,其平均值为0、标准差为1。
如步骤308所述,更新粒子的速度和位置向量。更新粒子的速度vm e(t+1),位置xm e(t+1):
vm e(t+1)=randj*vm e(t)+am e(t)
xm e(t+1)=xm e(t)+vm e(t+1)
其中:randj表示[0,1]的之间一个随机数。
如步骤309所述,判断粒子适应值是否处于阈值范围内。在本次实施例中,阈值取值为:1/r0,其中r0为一个高斯分布随机函数。
如步骤310所述,粒子位置解码,输出隶属度矩阵和各类聚类中心以及聚类结果。根据步骤309的判断,若粒子的适应值处于阈值范围内,进行粒子位置解码,并输出隶属度矩阵和各类聚类中心以及聚类结果,根据最大隶属度归类原则,进行对象的归类。
如附图1发明整体流程图所示,步骤103将待评价的电力用户信用评价数据输入步骤102中建立的聚类模型,获取聚类结果。通过聚类模型获取初步的样本分类结果,并交由步骤104进行专家定性分析获取聚类信用情况。
如附图1发明整体流程图所示,步骤105在基于保证类内高密度原则下,提取聚类结果中每一类的特征值。详细流程如附图4特征提取流程图所示。
如附图4特征提取流程图所示,提取附图3中获取的每一个聚类的特征指标以及对应的特征值的流程图,具体实施过程如下:
如步骤401对聚类所采用的指标进行排列组合计算所述,附图3聚类结束之后,对象数据被分成了5个类,为了进一步提高评价精度以及准确度,需要提取每个类的关键特征,而每个类的关键特征是指能够使聚类内部密度更大,紧致性更大的一组指标,这些指标能突出表现某些样本隶属于某一聚类,即部分起关键决定性作用的指标以及他们的值为聚类的关键特征值。对附图3基于全局最优模糊核聚类模型建立流程图中聚类所采用的指标进行排列组合计算,并作为特征分析聚类指标,其中,特征聚类指标数大于等于2,在本次实施例中,部分特征分析指标如表1所示:
表1
如步骤402所述,分别对附图3中获取的聚类结果以及对应的类中对象数据,按照步骤401获取的特征分析聚类指标,按附图3进行间接聚类,聚类数仍为一类。
如步骤403所述,以不同特征分析聚类指标的聚类结果为依据,计算步骤402的每一次聚类结果中,每一个对象数据点到聚类中心点的平均距离。
以特征分析聚类指标为依据,计算步骤402的每一次聚类结果中,每一个对象数据点到聚类中心点的平均距离为:
如步骤404所述,选择步骤403中最小距离对应的指标作为每一类的关键特征指标。步骤403中,对象到聚类中心点平均距离越小,表示类内密度越高,步骤403中最小距离对应的指标作即表示该组特征分析指标能使类内密度最大,即为特征指标。
如步骤405所述,以步骤404中获取的关键特征指标为特征聚类指标,将附图3中的每一个类重新聚为一类,获取聚类中心点。以特征指标进行重新聚类获取的聚类中心点可作为每一聚类的特征值,作为待评价对象的参考特征值。
如附图1发明整体流程图所示,步骤106根据步骤105中提取的每一个类的特征值以及对应的信用评价结果,再评价待测对象的信用结果。详细流程如附图5评价待测对象的信用结果流程图所示。
如附图5评价待测样本的信用结果流程图所示,根据附图4获取的聚类特征中心点,再评价待测样本的信用结果。
如步骤501所述,计算待评价对象的特征值与附图4中获取的每类特征中心点的距离,计算方式为:
如步骤502所述,判断步骤501计算的每个距离是否为最小距离,即比较步骤501计算的每个距离的大小。
如步骤503所述,将待评价对象归为最小距离对应的某一类,获取该类相对应的信用等级作为对象信用评价结果,即通过步骤501计算的每个距离来判断待测对象与已归类对象的相似度,根据距离最小归类原则,获取待评对象相对应的信用评价结果。
本次发明提出的一种基于全局最优模糊核聚类与高密度关键特征提取的电力用户信用评价方法,通过建立全局最优模糊核聚类模型,对样本数据进行最优化聚类,克服了聚类算法容易陷入局部最优解的缺陷,解决了传统信用评价算法面对大样本数据处理效率低下的问题,并借助专家分析以及高密度关键特征指标分析,提高了评价过程的精确度,最终实现了待测电力用户的信用评价。
实施例子2
本申请的该实施例子还公开了基于全局最优模糊核聚类模型的电力用户信用评价系统,包括:
指标体系建立及预处理单元,建立电力用户信用评价指标体系,并对待评价指标数据进行预处理;
模型建立单元,建立全局最优模糊核聚类算法模型;
聚类单元,将预处理后的待评价的电力用户信用评价数据输入建立的全局最优模糊核聚类算法模型,获取聚类结果;
信用等级分析单元,对获取的聚类结果进行定性分析,获取每一类的信用等级;
提关键特征提取单元,取聚类结果中每一个聚类的特征指标以及对应的特征值;
信用评价单元,根据提取的每一个聚类的特征值指标以及对应的特征值,再次评价待评价的电力用户的信用结果。
实施例子3
该实施例子公开了一种计算机可读存储介质,其中存储有多条指令,所述指令适于由终端设备的处理器加载并执行所述的基于全局最优模糊核聚类模型的电力用户信用评价方法。
实施例4
该实施例子公开了一种终端设备,包括处理器和计算机可读存储介质,处理器用于实现各指令;计算机可读存储介质用于存储多条指令,所述指令适于由处理器加载并执行所述的基于全局最优模糊核聚类模型的电力用户信用评价方法。
需要注意的是,附图中的流程图和框图示出了根据本公开的各种实施例的方法和系统的可能实现的体系架构、功能和操作。应当注意,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,所述模块、程序段、或代码的一部分可以包括一个或多个用于实现各个实施例中所规定的逻辑功能的可执行指令。也应当注意,在有些作为备选的实现中,方框中所标注的功能也可以按照不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,或者它们有时也可以按照相反的顺序执行,这取决于所涉及的功能。同样应当注意的是,流程图和/或框图中的每个方框、以及流程图和/或框图中的方框的组合,可以使用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以使用专用硬件与计算机指令的组合来实现。
在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合下面结合附图与实施例对本发明作进一步说明。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (10)
1.基于全局最优模糊核聚类模型的电力用户信用评价方法,其特征是,包括:
建立电力用户信用评价指标体系,并对待评价指标数据进行预处理;
建立全局最优模糊核聚类算法模型;
将预处理后的待评价的电力用户信用评价数据输入建立的全局最优模糊核聚类算法模型,获取聚类结果;
对获取的聚类结果进行定性分析,获取每一类的信用等级;
提取聚类结果中每一个聚类的特征指标以及对应的特征值;
根据提取的每一个聚类的特征值指标以及对应的特征值,再次评价待评价的电力用户的信用结果。
2.如权利要求1所述的基于全局最优模糊核聚类模型的电力用户信用评价方法,其特征是,建立电力用户信用评价指标体系,并对待评价指标数据进行预处理的步骤包括:
对指标数据进行统一量化,并且对指标数据均采用归一化处理;
采用相关性分析算法,计算指标间的共线性;
判断指标的方差膨胀因子,将共线性度高的指标去掉;
计算指标鉴别能力,计算指标变异系数;
判断指标变异系数的大小,把区分评价指标对象特征差异能力小的指标去除掉。
3.如权利要求2所述的基于全局最优模糊核聚类模型的电力用户信用评价方法,其特征是,指标间的共线性由指标的方差膨胀因子决定,指标的方差膨胀因子记为VIFp,p=1,2,3,…..P,P为指标的总数,其计算过程为:
上述计算中,Rp 2是一个以第p个指标为因变量,并且剩余其他指标为自变量的辅助回归的判定系数;
进行指标共线性的判断:指标的方差膨胀因子在设定范围内时,指标不存在多重共线性;指标的方差膨胀因子超过设定阈值时,指标存在共线性。
4.如权利要求1所述的基于全局最优模糊核聚类模型的电力用户信用评价方法,其特征是,建立全局最优模糊核聚类算法模型的步骤包括:
步骤B1:设定聚类中心个数K,设定全局最优搜索粒子群数目N,根据样本计算高斯核函数;
步骤B2:随机初始化粒子的位置向量Zo,并进行粒子编码,并初始化每一个粒子的速度;
步骤B3:计算每一个样本数据到当前各聚类中心的隶属度,并更新聚类中心;
步骤B4:计算每个粒子的适应度函数值fitt(m);
步骤B5:根据步骤B4中计算的粒子的适应值fitt(m),计算粒子质量Mm(t);
步骤B6:计算粒子优化力度Fm e,并根据步骤B5计算的粒子质量Mm(t),计算粒子的加速度am e(t);
步骤B7:执行高斯核函数中的变异操作:
步骤B8:更新粒子的速度和位置向量;
步骤B9:判断是否满足终止条件,若是,粒子位置解码,输出隶属度矩阵和各类聚类中心以及聚类结果,否则跳转到步骤B3。
5.如权利要求4所述的基于全局最优模糊核聚类模型的电力用户信用评价方法,其特征是,所述步骤B3中,在模糊核聚类过程中,利用高斯核函数对样本进行空间转换,定义非线性转换映射:其中,F为映射后高维特征空间,通过采用高斯核函数,获得聚类准则;
对上述聚类准则通过拉格朗日算子进行求解,获取每一个样本数据到当前各聚类中心的隶属度计算过程;
通过上述隶属度的获取,更新新的聚类中心计算过程。
6.如权利要求4所述的基于全局最优模糊核聚类模型的电力用户信用评价方法,其特征是,提取聚类结果中每一个聚类的特征指标以及对应的特征值的步骤包括:
步骤E1:对聚类模型中聚类所采用的指标进行排列组合计算,并作为特征分析聚类指标,其中,特征聚类指标数大于等于2;
步骤E2:分别对获取的聚类结果以及对应的类中对象数据,按照步骤E1获取的指标排列组合为特征分析聚类指标,并进行间接聚类,聚类数仍为一类;
步骤E3:以特征分析聚类指标为依据,计算步骤E2的每一次聚类结果中,每一个对象数据点到聚类中心点的平均距离;
步骤E4:选择步骤E3中最小距离对应的指标作为每一类的关键特征指标;
步骤E5:以E4中获取的关键特征指标为特征聚类指标,将聚类结果中的每一个类重新聚为一类,获取聚类中心点的值为每一类信用等级的关键特征指标的特征值。
7.如权利要求6所述的基于全局最优模糊核聚类模型的电力用户信用评价方法,其特征是,所述步骤E3中,以特征分析聚类指标为依据,计算步骤E2的每一次聚类结果中,计算每一个对象数据点到聚类中心点的平均距离。
8.如权利要求6所述的基于全局最优模糊核聚类模型的电力用户信用评价方法,其特征是,根据提取的每一个聚类的特征指标以及对应的特征值,再评价待测对象的信用结果的步骤包括:
步骤F1:计算待评价对象的特征值与步骤E5获取的每类特征中心点的距离;
步骤F2:比较F1计算的每个距离的大小,距离最小的将该对象归为某一类,即获取该类相对应的信用评价结果。
9.基于全局最优模糊核聚类模型的电力用户信用评价系统,其特征是,包括:
指标体系建立及预处理单元,建立电力用户信用评价指标体系,并对待评价指标数据进行预处理;
模型建立单元,建立全局最优模糊核聚类算法模型;
聚类单元,将预处理后的待评价的电力用户信用评价数据输入建立的全局最优模糊核聚类算法模型,获取聚类结果;
信用等级分析单元,对获取的聚类结果进行定性分析,获取每一类的信用等级;
提关键特征提取单元,取聚类结果中每一个聚类的特征指标以及对应的特征值;
信用评价单元,根据提取的每一个聚类的特征值指标以及对应的特征值,再次评价待评价的电力用户的信用结果。
10.一种计算机可读存储介质,其中存储有多条指令,其特征是,所述指令适于由终端设备的处理器加载并执行权利要求1-8任一所述的基于全局最优模糊核聚类模型的电力用户信用评价方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811190590.3A CN109472453B (zh) | 2018-10-12 | 2018-10-12 | 基于全局最优模糊核聚类模型的电力用户信用评价方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811190590.3A CN109472453B (zh) | 2018-10-12 | 2018-10-12 | 基于全局最优模糊核聚类模型的电力用户信用评价方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109472453A true CN109472453A (zh) | 2019-03-15 |
CN109472453B CN109472453B (zh) | 2021-09-21 |
Family
ID=65663810
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811190590.3A Active CN109472453B (zh) | 2018-10-12 | 2018-10-12 | 基于全局最优模糊核聚类模型的电力用户信用评价方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109472453B (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110889750A (zh) * | 2019-12-06 | 2020-03-17 | 昆明电力交易中心有限责任公司 | 一种电力市场交易主体信用评价方法 |
CN111598457A (zh) * | 2020-05-18 | 2020-08-28 | 全球能源互联网研究院有限公司 | 一种电力无线网络质量的确定方法及装置 |
CN111898839A (zh) * | 2019-05-05 | 2020-11-06 | 中国农业大学 | 电力用户的重要程度分类方法及装置 |
CN113128535A (zh) * | 2019-12-31 | 2021-07-16 | 深圳云天励飞技术有限公司 | 一种聚类模型的选取方法、装置、电子设备及存储介质 |
CN114004529A (zh) * | 2021-11-10 | 2022-02-01 | 广东电网有限责任公司 | 一种配电网故障停电影响指标降维预处理方法及系统 |
CN114660095A (zh) * | 2022-01-30 | 2022-06-24 | 江苏新时高温材料股份有限公司 | 基于光学的烧结刚玉的气孔率测定方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101254177B1 (ko) * | 2011-10-07 | 2013-04-19 | 위아코퍼레이션 주식회사 | 방사형 기저 함수 신경회로망 알고리즘을 이용한 실시간 얼굴 인식 시스템 |
CN103514566A (zh) * | 2013-10-15 | 2014-01-15 | 国家电网公司 | 一种风险控制系统及方法 |
CN104809066A (zh) * | 2015-04-30 | 2015-07-29 | 重庆大学 | 一种通过代码质量评估预测开源软件维护工作量的方法 |
CN104915681A (zh) * | 2015-06-05 | 2015-09-16 | 华南理工大学 | 兼顾电压暂降监测信息及其关联因素的变电站聚类方法 |
CN107492092A (zh) * | 2017-07-13 | 2017-12-19 | 青岛黄海学院 | 基于fcm算法融合改进gsa算法的医学图像分割方法 |
-
2018
- 2018-10-12 CN CN201811190590.3A patent/CN109472453B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101254177B1 (ko) * | 2011-10-07 | 2013-04-19 | 위아코퍼레이션 주식회사 | 방사형 기저 함수 신경회로망 알고리즘을 이용한 실시간 얼굴 인식 시스템 |
CN103514566A (zh) * | 2013-10-15 | 2014-01-15 | 国家电网公司 | 一种风险控制系统及方法 |
CN104809066A (zh) * | 2015-04-30 | 2015-07-29 | 重庆大学 | 一种通过代码质量评估预测开源软件维护工作量的方法 |
CN104915681A (zh) * | 2015-06-05 | 2015-09-16 | 华南理工大学 | 兼顾电压暂降监测信息及其关联因素的变电站聚类方法 |
CN107492092A (zh) * | 2017-07-13 | 2017-12-19 | 青岛黄海学院 | 基于fcm算法融合改进gsa算法的医学图像分割方法 |
Non-Patent Citations (1)
Title |
---|
李频: "基于模糊聚类分析的电力客户信用评价算法", 《计测技术》 * |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111898839A (zh) * | 2019-05-05 | 2020-11-06 | 中国农业大学 | 电力用户的重要程度分类方法及装置 |
CN111898839B (zh) * | 2019-05-05 | 2023-12-15 | 中国农业大学 | 电力用户的重要程度分类方法及装置 |
CN110889750A (zh) * | 2019-12-06 | 2020-03-17 | 昆明电力交易中心有限责任公司 | 一种电力市场交易主体信用评价方法 |
CN110889750B (zh) * | 2019-12-06 | 2022-08-26 | 昆明电力交易中心有限责任公司 | 一种电力市场交易主体信用评价方法 |
CN113128535A (zh) * | 2019-12-31 | 2021-07-16 | 深圳云天励飞技术有限公司 | 一种聚类模型的选取方法、装置、电子设备及存储介质 |
CN111598457A (zh) * | 2020-05-18 | 2020-08-28 | 全球能源互联网研究院有限公司 | 一种电力无线网络质量的确定方法及装置 |
CN111598457B (zh) * | 2020-05-18 | 2023-06-30 | 全球能源互联网研究院有限公司 | 一种电力无线网络质量的确定方法及装置 |
CN114004529A (zh) * | 2021-11-10 | 2022-02-01 | 广东电网有限责任公司 | 一种配电网故障停电影响指标降维预处理方法及系统 |
CN114660095A (zh) * | 2022-01-30 | 2022-06-24 | 江苏新时高温材料股份有限公司 | 基于光学的烧结刚玉的气孔率测定方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN109472453B (zh) | 2021-09-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109472453A (zh) | 基于全局最优模糊核聚类模型的电力用户信用评价方法 | |
Li et al. | Adaptive multi-objective swarm fusion for imbalanced data classification | |
CN102521656B (zh) | 非平衡样本分类的集成迁移学习方法 | |
CN109325844A (zh) | 多维数据下的网贷借款人信用评价方法 | |
CN110188209A (zh) | 基于层次标签的跨模态哈希模型构建方法、搜索方法及装置 | |
CN107766929B (zh) | 模型分析方法及装置 | |
CN111080442A (zh) | 信用评分模型的构建方法、装置、设备及存储介质 | |
CN104966105A (zh) | 一种鲁棒机器错误检索方法与系统 | |
CN109145960A (zh) | 基于改进粒子群算法的数据特征选择方法及系统 | |
CN112417176B (zh) | 基于图特征的企业间隐性关联关系挖掘方法、设备及介质 | |
CN109214444B (zh) | 基于孪生神经网络和gmm的游戏防沉迷判定系统及方法 | |
CN111104972A (zh) | 基于遗传算法优化支持向量机多分类器的台区低电压风险识别方法 | |
CN102629272A (zh) | 一种基于聚类的考试系统试题库优化方法 | |
CN101923604A (zh) | 基于邻域粗糙集的加权knn肿瘤基因表达谱分类方法 | |
CN107545038A (zh) | 一种文本分类方法与设备 | |
CN110930038A (zh) | 一种贷款需求识别方法、装置、终端及存储介质 | |
CN110287985A (zh) | 一种基于带变异粒子群算法的可变拓扑结构的深度神经网络图像识别方法 | |
CN104966106A (zh) | 一种基于支持向量机的生物年龄分步预测方法 | |
CN107305640A (zh) | 一种不均衡数据分类的方法 | |
CN112418987B (zh) | 交通运输单位信用评级方法、系统、电子设备及存储介质 | |
CN110490234A (zh) | 基于聚类分类联合机制的分类器的构建方法以及分类方法 | |
Rofik et al. | The Optimization of Credit Scoring Model Using Stacking Ensemble Learning and Oversampling Techniques | |
CN109978023A (zh) | 面向高维大数据分析的特征选择方法及计算机存储介质 | |
CN109685133A (zh) | 基于构建的预测模型低成本、高区分度的数据分类方法 | |
CN113129188A (zh) | 一种基于人工智能大数据的省级教育教学评估系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |