CN114004530A - 基于排序支撑向量机的企业电力信用分建模方法及系统 - Google Patents
基于排序支撑向量机的企业电力信用分建模方法及系统 Download PDFInfo
- Publication number
- CN114004530A CN114004530A CN202111329766.0A CN202111329766A CN114004530A CN 114004530 A CN114004530 A CN 114004530A CN 202111329766 A CN202111329766 A CN 202111329766A CN 114004530 A CN114004530 A CN 114004530A
- Authority
- CN
- China
- Prior art keywords
- enterprise
- electricity
- level
- indexes
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 40
- 238000012163 sequencing technique Methods 0.000 title claims description 20
- 238000012706 support-vector machine Methods 0.000 title claims description 12
- 230000005611 electricity Effects 0.000 claims abstract description 135
- 238000012545 processing Methods 0.000 claims abstract description 18
- 238000005457 optimization Methods 0.000 claims abstract description 13
- 238000010276 construction Methods 0.000 claims abstract description 6
- 230000006399 behavior Effects 0.000 claims description 47
- 239000013598 vector Substances 0.000 claims description 45
- 238000012549 training Methods 0.000 claims description 20
- 238000011156 evaluation Methods 0.000 claims description 15
- 230000008859 change Effects 0.000 claims description 14
- 238000011084 recovery Methods 0.000 claims description 9
- 230000009977 dual effect Effects 0.000 claims description 6
- 238000006243 chemical reaction Methods 0.000 claims description 2
- 238000013507 mapping Methods 0.000 claims description 2
- 230000007547 defect Effects 0.000 abstract description 5
- 230000007773 growth pattern Effects 0.000 abstract description 4
- 238000002372 labelling Methods 0.000 abstract description 4
- 238000005516 engineering process Methods 0.000 abstract description 3
- 238000000605 extraction Methods 0.000 abstract description 2
- 238000004364 calculation method Methods 0.000 description 17
- 230000000875 corresponding effect Effects 0.000 description 10
- 230000006870 function Effects 0.000 description 5
- 238000010606 normalization Methods 0.000 description 5
- 230000002596 correlated effect Effects 0.000 description 3
- 230000012010 growth Effects 0.000 description 3
- 238000004064 recycling Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000001186 cumulative effect Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 1
- 238000011038 discontinuous diafiltration by volume reduction Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000009304 pastoral farming Methods 0.000 description 1
- 238000013106 supervised machine learning method Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/10—Machine learning using kernel methods, e.g. support vector machines [SVM]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/067—Enterprise or organisation modelling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Entrepreneurship & Innovation (AREA)
- General Physics & Mathematics (AREA)
- Marketing (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Development Economics (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Educational Administration (AREA)
- Game Theory and Decision Science (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Public Health (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Water Supply & Treatment (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明基于先进的大数据处理技术和优化算法,提供了一种基于电力大数据的企业信用分模型构建方法。首先,通过基于数据的分类方法来对企业用电特征进行提取,充分利用多维度的电力大数据,确保准确提取企业用电特征,克服了多维度电力大数据使用不充分不完全的问题。其次,采用数据驱动的关联因素识别方法,将企业的用电特征、运营状况和企业成长性模式关联起来,通过Ranking SVM的方法构建企业信用分模型,仅需要使用一部分数据标签来训练模型,无需依赖全部数据和大量标签,大大降低了数据标注的成本。本发明的信用分生成模型,可以克服传统的专家经验模型存在主观性较强的缺陷,能更好的利用多维度的电力大数据,提高了模型输出信用分的准确性。
Description
技术领域
本发明属于电力大数据处理技术领域,更具体地,基于排序支撑向量机的企业电力信用分建模方法,尤其是涉及基于电力数据的企业信用分数模型训练方法、信用分数计算方法。
背景技术
目前普遍使用的是传统的专家经验模型来构建企业信用分,而传统的专家经验模型通常是挑选少数重要数据指标,利用专家经验做出判断,得到信用评分,但是其缺点是没有充分利用已有的多维度的电力大数据,而且存在主观性较强,得到的信用评分结果往往不够准确的问题。
同时现有技术试图对企业进行信用评分时,常常面临这样的现状:积累了大量电力数据,但基本没有可用于有监督机器学习的标注数据,因为电力大数据涉及的电力数据维度多指标丰富,数据标注成本较高且费时费力,同时利用人工来标注也难以保证对各个企业电力数据标注的准确性,因此难以使用逻辑回归等需要准确标注数据的模型来对电力大数据进行充分利用。
基于以上原因,无法利用当前流行的预测比较精准的有监督机器学习方法来构建基于企业电力大数据的信用分数模型,因此目前的方法无法准确高效的生成基于电力数据的企业信用分,无法对企业用电等行为进行有效评估,也就不能很好的为金融机构提供金融风控、客户推荐、数据共享等有偿的电力数据产品和服务。
发明内容
为解决现有技术中存在的不足,本发明的目的在于,提供基于数据的分类方法来对企业用电特征进行提取,充分利用了多维度的电力大数据,确保企业用电特征提取的准确,克服了多维度电力大数据使用不充分不完全的问题。其次,采用了数据驱动的关联因素识别方法,将企业用电特征的变化与企业运营状况的变化和企业的成长性模式关联起来,通过Ranking SVM的方法构建企业信用分模型,Ranking SVM方法的优点在于仅需要使用一部分数据标签来进行模型训练,无需依赖全部数据和大量标签,大大降低了数据标注的成本。
本发明采用如下的技术方案。本发明的第一方面提供了一种基于排序支撑向量机的企业电力信用分建模方法,包括以下步骤:
步骤1,以多维度电力数据划分评估指标体系,包括:指标的级别数量,各级别指标具体内容以及上下级指标隶属关系;
步骤2,针对该特征集合,对该特征集合进行特征工程的处理,得到一个特征向量值;
步骤3,得到表征各个企业电力数据情况的向量以及可以获得每对企业之间信用情况相对好坏的标签数据,将此作为模型训练数据,通过使用Ranking SVM来对对象对的排序进行分类,并将此分类器用于各个企业信用分高低排序任务中,以此得到准确的信用分;
步骤4,通过模型训练数据确定出各个参数,也即得到企业用电行为的排序模型,可以得到所有企业的排序位置关系。
优选地,步骤1具体包括:
步骤1.1,将企业电力数据按照企业基本信息、用电账户信息、电费水平、缴费行为、用电规范、用电行为、用电容量划分为三个级别的指标,并且将这七个类别作为一级指标;
步骤1.2,为每个一级指标配置相应的二级指标和三级指标,对多维度电力数据划分评估指标后逐层计算,以量化的形式表示每个一级指标;
步骤1.3,将企业基本信息、用电账户信息、电费水平、缴费行为、用电规范、用电行为、用电容量等七个维度的数据组成一个特征集合。
优选地,步骤1.2具体包括:
步骤1.2.1,企业基本信息包括基本信息、经营场所特征两个二级指标;企业基本信息包括户龄和所属行业类别两个三级指标,经营场所特征包括企业用电账户数量一个三级指标;
步骤1.2.2,用电账户信息包括用电合同和经营场所特征两个二级指标;用电合同包括用户状态、合同容量和汇总计量点个数三个三级指标,经营场所特征包含可关联房产数量一个三级指标;
步骤1.2.3,电费水平包括实际缴费情况、应收电费水平和应收电费趋势三个二级指标;实际缴费情况包括企业最近12个月月均实缴电费与实际用电量两个三级指标,应收电费水平包括企业最近12个月应收电费行业水平一个三级指标,应收电费趋势包括最近12个月应收电费增长趋势一个三级指标;
步骤1.2.4,缴费行为包括电费缴纳水平、电费回收水平、回款时长三个二级指标,其中电费缴纳水平包括当前费控余额、企业近12个月电费拖欠情况、当前是否有电费拖欠情况三个三级指标;电费回收水平包括企业近12个月月应收电费回收水平得分一个三级指标;回款时长包括企业近12个月平均回款时长一个三级指标;
步骤1.2.5,用电规范包括窃电行为和违约用电行为两个二级指标,其中窃电行为包括近24个月窃电次数与窃电违约总费用两个三级指标,违约用电行为包括近24个月违约用电次数与违约用电总费用两个三级指标;
步骤1.2.6,用电行为包括用电增长趋势、用电波动、用电特性三个二级指标,其中用电增长趋势包括企业近12个月用电量同比增长率一个三级指标,用电波动包括企业近12个月用电量波动在当地同行业中水平、企业近12个月月电量差异度两个三级指标,用电特性包括企业近6个月平均负载率一个三级指标;
步骤1.2.7,用电容量包括容量状态、容量变化两个二级指标,其中容量状态包括申请容量变更一个三级指标,容量变化包括近24个月累计增容次数、减容次数两个三级指标。
优选地,步骤2具体包括:
对该特征集合进行归一化处理,得到一个特征向量值,将数据映射到[-1,1]区间,或者[0,1]区间、或更小的区间。
优选地,步骤3具体包括:
步骤3.1,构建模型训练数据集;
步骤3.2,将Ranking SVM转化为二次规划问题;
步骤3.3,通过将约束条件带入进原始优化问题的松弛变量中,转化为非约束的优化问题;
步骤3.4,转化为对偶问题,得到一个易于求解的形式。
优选地,步骤3.1具体包括:
模型训练数据形如m表示样本数量,其中每个样本包括两个特征向量分别表示两家企业经过处理的电力大数据特征向量,和一个标签yi∈{+1,-1},表示哪一个特征向量表示的企业信用表现更好,+1表示第一个特征向量代表的企业信用表现更好,-1表示第二个特征向量代表的企业信用表现更好。
优选地,步骤3中,
步骤3.2,将Ranking SVM转化为二次规划问题,以如下公式表示,
ξi≥0 i=1,2,…,m
式中:
‖·‖表示L2范数,
m表示训练样本的数量,
C表示系数,C>0,
ξi表示松弛变量;
步骤3.3,通过将约束条件带入进原始优化问题的松弛变量中,转化为非约束的优化问题,以如下公式表示,
式中:
加和的第一项代表了Hinge损失函数,
λ‖ω‖2,即第二项代表了正则项;
步骤3.4,转化为对偶问题,以如下公式表示,
0≤αi≤C
i=1,2,…,N。
优选地,步骤4,最终求解得到相应的参数后,排序函数可以以如下公式表示,
式中:
优选地,步骤4中,得到所有企业的排序位置关系,找基准企业进行分层划分输出分数,其它的企业再依据与这些基准企业的相对位置关系,来确定企业的信用分高低,以此得到各个企业的准确信用分。
本发明的第二方面提供了一种基于排序支撑向量机的企业电力信用分建模系统,运行所述的基于排序支撑向量机的企业电力信用分建模方法,包括:电力大数据处理模块、企业用电行为模型构建模块和企业电力信用分输出模块,其中,
所述电力大数据处理模块用于对多维度电力数据划分评估指标,逐层计算,将这些数据组成一个特征集合,对该特征集合进行特征工程的处理,得到一个特征向量值。
所述企业用电行为模型构建模块用于在电力大数据处理模块的支撑下,得到表征各个企业电力数据情况的向量以及可以获得每对企业之间信用情况相对好坏的标签数据,将此作为模型训练数据,通过使用Ranking SVM来对对象对的排序进行分类,并将此分类器用于各个企业信用分高低排序任务中,通过模型训练数据确定出各个参数;
所述企业电力信用分输出模块用于得到企业用电行为的排序模型,进而得到所有企业的排序位置关系,找基准企业进行分层划分输出分数,其它的企业再依据与这些基准企业的相对位置关系,来确定企业的信用分高低。
本发明的有益效果在于,与现有技术相比,本发明的系统基于先进的大数据处理技术和优化算法,提供了一种基于电力大数据的企业信用分模型构建方法,首先,该方法通过基于数据的分类方法来对企业用电特征进行提取,充分利用了多维度的电力大数据,确保企业用电特征提取的准确,克服了多维度电力大数据使用不充分不完全的问题。其次,采用了数据驱动的关联因素识别方法,将企业用电特征的变化与企业运营状况的变化和企业的成长性模式关联起来,通过Ranking SVM的方法构建企业信用分模型,Ranking SVM方法的优点在于仅需要使用一部分数据标签来进行模型训练,无需依赖全部数据和大量标签,大大降低了数据标注的成本。
本发明的信用分生成模型,可以克服传统的专家经验模型存在主观性较强的缺陷,能更好的利用多维度的电力大数据,提高了模型输出信用分的准确性。本发明的模型,通过企业用电特征准确的来预测企业运营状况的变化和企业的成长性,以此生成企业信用分,实现科学有效地评价用电企业的信用,从而形成量化可靠的信用评估,克服了传统专家经验模型受主观影响较大,对信用分评估不够准确的问题。
附图说明
图1为企业信用分生成流程图。
具体实施方式
下面结合附图对本申请作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本申请的保护范围。
如图1所示,本发明提供了基于排序支撑向量机的企业电力信用分建模方法,包括以下步骤:
步骤1,以多维度电力数据划分评估指标体系,包括:指标的级别数量,各级别指标具体内容以及上下级指标隶属关系。
在本发明进一步优选但非限制性的实施方式中,步骤1具体包括:
步骤1.1,将企业电力数据按照企业基本信息、用电账户信息、电费水平、缴费行为、用电规范、用电行为、用电容量划分为三个级别的指标,并且将这七个类别作为一级指标。
值得注意的是,步骤1中可以使用更多或者更少的类别作为一级指标,可以使用三级以上或者三级以下的层级数量,在本发明的优选实施例中,给出的七个类别作为一级指标,以及围绕七个一级指标配置三个层级的指标是一种优选但非限制性的实施方式。更进一步地,既可以使用七个一级指标以内的类别,也可以使用这七个类别以外的类别。
步骤1.2,为每个一级指标配置相应的二级指标和三级指标,对多维度电力数据划分评估指标后逐层计算,以量化的形式表示每个一级指标。在本发明进一步优选但非限制性的实施方式中,步骤1.2具体包括:
步骤1.2.1,企业基本信息包括基本信息、经营场所特征两个二级指标;企业基本信息包括户龄和所属行业类别、两个三级指标,经营场所特征包括企业用电账户数量一个三级指标。
更具体地,企业基本信息得分=基本信息得分、经营场所特征得分与相应的权重x1、x2乘积之和,x1=0.2,x2=0.1。
基本信息得分:
计算方法:户龄长度=a、行业所属类别=b,
评判标准:
a>15,得分:100分;
a=[5,15],得分:80分;
a=(0,5),得分:60分。
b=制造业、电力燃气及水的生产和供应业、建筑业,得分:100分;
b=农、林、牧、渔业,得分:80分;
b=其它行业,得分:60分;
经营场所得分:
计算方法:企业用电账户数量=c,
评判标准:
c>20,得分:100分;
c=[5,20],得分:80分;
c=(0,5),得分:50分。
步骤1.2.2,用电账户信息包括用电合同和经营场所特征两个二级指标;用电合同包括用户状态、合同容量和汇总计量点个数三个三级指标,经营场所特征包含可关联房产数量一个三级指标。
更具体地,用电账户信息得分=用电合同得分、经营场所特征得分分别与相应的权重x3、x4乘积之和,x3=0.25,x4=0.13。
用电合同得分:
计算方法:用户状态=d,合同容量=e,汇总计量点个数=f,
评判标准:
d=在业,得分:100分;
d=续存,得分:50分;
d=迁入、迁出,得分:0分;
d=其它,得分:-50分。
e>20MVA,得分:100分;
e=5MVA~20MVA,得分:60分;
e=0~5MVA,得分:20分。
f>200,得分:100分;
f=[100,200],得分:80分;
f=(0,100),得分:50分;
经营场所特征得分:
计算方法:可关联房产数量=g,
评判标准:
g>20,得分:100分;
g=[10,20],得分:50分;
g=(0,10],得分:20分。
步骤1.2.3,电费水平包括实际缴费情况、应收电费水平和应收电费趋势三个二级指标;实际缴费情况包括企业最近12个月月均实缴电费与实际用电量两个三级指标,应收电费水平包括企业最近12个月应收电费一个三级指标,应收电费趋势包括最近12个月应收电费增长趋势一个三级指标。
更具体地,电费水平得分=实际缴费情况得分、应收电费水平得分、应收电费趋势得分分别与相应的权重x5、x6、x7乘积之和,x5=0.5,x6=0.3,x7=0.25。
实际缴费情况得分:
计算方法:企业最近12个月月均实缴电费=h万元,企业最近12个月月均实际用电量=i度,
评判标准:
h>4,得分:100分;
h=[2,4],得分:80分;
h=[1,2),得分:50分;
h<1,得分:20分;
i>3000,得分:100分;
i=[1000,3000],得分:70分;
i<1000,得分:40分;
应收电费水平得分:
计算方法:企业最近12个月应收电费=j万元,
评判标准:
j>50,得分:100分;
j=[20,50],得分:70分;
j<20,得分:40分;
应收电费趋势得分:
计算方法:企业最近12个月比上12个月应收电费增长=k万元,
评判标准:
k>24,得分:100分;
k=[12,24],得分:80分;
k=[0,12),得分:50分;
k<0,得分:0分。
步骤1.2.4,缴费行为包括电费缴纳水平、电费回收水平、回款时长三个二级指标,其中电费缴纳水平包括当前费控余额、企业近12个月电费拖欠情况、当前是否有电费拖欠情况三个三级指标。电费回收水平包括企业近12个月月应收电费回收水平得分一个三级指标。回款时长包括企业近12个月平均回款时长一个三级指标。
更具体地,缴费行为得分=电费缴纳水平得分、电费回收水平得分、回款时长得分分别与相应的权重x8、x9、x10乘积之和,x8=0.8,x9=0.15,x10=0.2。
电费缴纳水平得分:
计算方法:当前费控余额=l万元,企业近12个月电费拖欠=m万元,企业当前电费拖欠=n万元,
l>50,得分:100分;
l=[20,50],得分:70分;
l=[10,20),得分:50分;
l=[0,10),得分:30分;
m>50,得分:-100分;
m=[20,50],得分:-50分;
m=(0,20),得分:-30分;
m=0,得分:100分;
n>50,得分:-100分;
n=[10,50],得分:-50分;
n=(0,10),得分:-20分;
n=0,得分:100分;
电费回收水平得分:
计算方法:企业近12个月月应收电费回收水平=o,
o>0.8,得分:100分;
o=[0.4,0.8],得分:50分;
o<0.4,得分:0分;
回款时长得分:
计算方法:企业近12个月平均回款时长=p天,
p<5,得分:100分;
p=[5,15],得分:50分;
p>15,得分:0分。
步骤1.2.5,用电规范包括窃电行为和违约用电行为两个二级指标,其中窃电行为包括近24个月窃电次数与窃电违约总费用两个三级指标,违约用电行为包括近24个月违约用电次数与违约用电总费用两个三级指标。
更具体地,用电规范得分=窃电行为得分、违约用电行为得分分别与相应的权重x11、x12乘积之和,x11=0.6,x12=0.6。
窃电行为得分:
计算方法:近24个月窃电次数=q,近24个月窃电违约总费用=r万元,
q<2,得分:100分;
q=[2,10],得分;40分;
q>10,得分:0分;
r<1,得分:100分;
r=[1,10],得分:40分;
r>10,得分:0分;
违约用电行为得分:
计算方法:近24个月违约用电次数=s,近24个月违约用电总费用=t,
s<2,得分:100分;
s=[2,10],得分;40分;
s>10,得分:0分;
t<1,得分:100分;
t=[1,10],得分:40分;
t>10,得分:0分。
步骤1.2.6,用电行为包括用电增长趋势、用电波动、用电特性三个二级指标,其中用电增长趋势包括企业近12个月用电量同比增长率一个三级指标,用电波动包括企业近12个月用电量波动在当地同行业中水平、企业近12个月月电量差异度两个三级指标,用电特性包括企业近6个月平均负载率一个三级指标。
更具体地,用电行为得分=用电增长趋势得分、用电波动得分、用电特性得分分别与相应的权重x13、x14、x15乘积之和,x13=0.4,x14=0.3,x15=0.2。
用电增长趋势得分:
计算方法:企业近12个月用电量比上12个月同比增长率=u,
u>0.8,得分:100分;
u=[0.4,0.8],得分:50分;
u=(0,0.4),得分:30分;
用电波动得分:
计算方法:企业近12个月用电波动在当地同行中水平=v,企业近12个月月电量差异度=w,
v<0.2,得分:100分;
v=[0.2,0.6],得分:60分;
v>0.6,得分0分;
w<0.2,得分100分;
w=[0.2,0.7],得分60分;
w>0.7,得分0分;
用电特性得分:
计算方法:企业近6个月平均负载率=x,
x>0.8,得分:100分;
x=[0.4,0.8],得分:50分;
x=(0,0.4),得分:10分。
步骤1.2.7,用电容量包括容量状态、容量变化两个二级指标,其中容量状态包括申请容量变更一个三级指标,容量变化包括近24个月累计增容次数、减容次数两个三级指标。
更具体地,用电容量得分=容量状态得分、容量变化得分分别与相应的权重x16、x17乘积之和,x16=0.15,x17=0.2。
容量状态得分:
计算方法:申请容量变更次数=y
y<6,得分:100分;
y=[6,20],得分:50分;
y>20,得分:30分;
容量变化得分:
计算方法:近24个月累计增容次数z1,近24个月累计减容次数z2,
z1>8,得分:100分;
z1=[4,8],得分:70分;
z1<4,得分:20分;
z2<4,得分:100分;
z2=[4,10],得分:70分;
z2>10,得分:0分。
步骤1.3,将企业基本信息、用电账户信息、电费水平、缴费行为、用电规范、用电行为、用电容量等七个维度的数据组成一个特征集合,该特征集合内包含大量数据,如特征集合(5,300,1200,-120,60,230,8)等。
步骤2,针对该特征集合,对该特征集合进行特征工程的处理,即对该特征集合进行归一化处理,得到一个特征向量值。
针对该特征集合,对该特征集合进行特征工程的处理,如对该特征集合进行归一化处理,得到一个特征向量值。例如,归一化处理得到一个特征向量(0.3,0.8,0.2,-0.5,0.8,0.6,0.56,0.4),其中归一化处理的原因是:由于特征集合内的数据范围不同,有些数据的范围可能特别大,其导致的结果是收敛慢、训练时间长。而且数据范围大的数据在模式分类中的作用可能会偏大,而数据范围小的数据在模式分类中的作用可能会偏小,因此可以通过对数据进行归一化处理,将数据映射到[0,1]区间,或者[-1,1]区间、或更小的区间,以避免数据范围导致的问题。
步骤3,企业用电行为模型构建模块,在电力大数据处理模块的支撑下,得到表征各个企业电力数据情况的向量以及可以获得每对企业之间信用情况相对好坏的标签数据,将此作为模型训练数据,通过使用Ranking SVM来对对象对的排序进行分类,并将此分类器用于各个企业信用分高低排序任务中,以此得到准确的信用分。在本发明进一步优选但非限制性的实施方式中,步骤3具体包括:
步骤3.1,模型训练数据形如m其中每个样本包括两个特征向量分别表示两家企业经过处理的电力大数据特征向量,和一个标签yi∈{+1,-1},表示哪一个特征向量表示的企业信用表现更好,+1表示第一个特征向量代表的企业信用表现更好,-1表示第二个特征向量代表的企业信用表现更好。
步骤3.2,将Ranking SVM转化为QP(Quadratic Programming,二次规划)问题,具体地,以如下公式表示,
ξi≥0 i=1,2,…,m
式中:
‖·‖表示L2范数,
m表示训练样本的数量,
C表示系数,C>0,
ξi表示松弛变量。
步骤3.3,通过将约束条件带入进原始优化问题的松弛变量中,进一步转化为非约束的优化问题,以如下公式表示,
式中:
加和的第一项代表了Hinge损失函数(Hinge Loss Function),
λ‖ω‖2,即第二项代表了正则项。
步骤3.4,二次规划问题(QP problem)较难求解,如果使用通用的QP解决方式则费时费力,我们可以将其转化为对偶问题(dual problem),得到一个易于求解的形式,以如下公式表示,
0≤αi≤C
i=1,2,…,N
步骤4,最终求解得到相应的参数后,排序函数可以以如下公式表示,
通过模型训练数据确定出各个参数,也即得到企业用电行为的排序模型,可以得到所有企业的排序位置关系,找基准企业进行分层划分输出分数,如排名第1的企业初定电力信用分数为900,排名末尾的企业初定电力信用分数为300,中位的企业电力信用分数为600,其它的企业再依据与这些基准企业的相对位置关系,来确定企业的信用分高低,以此得到各个企业的准确信用分,可以对企业用电等行为进行有效评估,能很好的为金融机构提供金融风控、客户推荐、数据共享等有偿的电力数据产品和服务。
本发明的有益效果在于,与现有技术相比,本发明的系统基于先进的大数据处理技术和优化算法,提供了一种基于电力大数据的企业信用分模型构建方法,首先,该方法通过基于数据的分类方法来对企业用电特征进行提取,充分利用了多维度的电力大数据,确保企业用电特征提取的准确,克服了多维度电力大数据使用不充分不完全的问题。其次,采用了数据驱动的关联因素识别方法,将企业用电特征的变化与企业运营状况的变化和企业的成长性模式关联起来,通过Ranking SVM的方法构建企业信用分模型,Ranking SVM方法的优点在于仅需要使用一部分数据标签来进行模型训练,无需依赖全部数据和大量标签,大大降低了数据标注的成本。
本发明的信用分生成模型,可以克服传统的专家经验模型存在主观性较强的缺陷,能更好的利用多维度的电力大数据,提高了模型输出信用分的准确性。本发明的模型,通过企业用电特征准确的来预测企业运营状况的变化和企业的成长性,以此生成企业信用分,实现科学有效地评价用电企业的信用,从而形成量化可靠的信用评估,克服了传统专家经验模型受主观影响较大,对信用分评估不够准确的问题。
本发明申请人结合说明书附图对本发明的实施示例做了详细的说明与描述,但是本领域技术人员应该理解,以上实施示例仅为本发明的优选实施方案,详尽的说明只是为了帮助读者更好地理解本发明精神,而并非对本发明保护范围的限制,相反,任何基于本发明的发明精神所作的任何改进或修饰都应当落在本发明的保护范围之内。
Claims (10)
1.基于排序支撑向量机的企业电力信用分建模方法,其特征在于,包括以下步骤:
步骤1,以多维度电力数据划分评估指标体系,包括:指标的级别数量,各级别指标具体内容以及上下级指标隶属关系;
步骤2,针对该特征集合,对该特征集合进行特征工程的处理,得到一个特征向量值;
步骤3,得到表征各个企业电力数据情况的向量以及可以获得每对企业之间信用情况相对好坏的标签数据,将此作为模型训练数据,通过使用Ranking SVM来对对象对的排序进行分类,并将此分类器用于各个企业信用分高低排序任务中,以此得到准确的信用分;
步骤4,通过模型训练数据确定出各个参数,也即得到企业用电行为的排序模型,可以得到所有企业的排序位置关系。
2.根据权利要求1所述的基于排序支撑向量机的企业电力信用分建模方法,其特征在于:
步骤1具体包括:
步骤1.1,将企业电力数据按照企业基本信息、用电账户信息、电费水平、缴费行为、用电规范、用电行为、用电容量划分为三个级别的指标,并且将这七个类别作为一级指标;
步骤1.2,为每个一级指标配置相应的二级指标和三级指标,对多维度电力数据划分评估指标后逐层计算,以量化的形式表示每个一级指标;
步骤1.3,将企业基本信息、用电账户信息、电费水平、缴费行为、用电规范、用电行为、用电容量等七个维度的数据组成一个特征集合。
3.根据权利要求2所述的基于排序支撑向量机的企业电力信用分建模方法,其特征在于:
步骤1.2具体包括:
步骤1.2.1,企业基本信息包括基本信息、经营场所特征两个二级指标;企业基本信息包括户龄和所属行业类别两个三级指标,经营场所特征包括企业用电账户数量一个三级指标;
步骤1.2.2,用电账户信息包括用电合同和经营场所特征两个二级指标;用电合同包括用户状态、合同容量和汇总计量点个数三个三级指标,经营场所特征包含可关联房产数量一个三级指标;
步骤1.2.3,电费水平包括实际缴费情况、应收电费水平和应收电费趋势三个二级指标;实际缴费情况包括企业最近12个月月均实缴电费与实际用电量两个三级指标,应收电费水平包括企业最近12个月应收电费行业水平一个三级指标,应收电费趋势包括最近12个月应收电费增长趋势一个三级指标;
步骤1.2.4,缴费行为包括电费缴纳水平、电费回收水平、回款时长三个二级指标,其中电费缴纳水平包括当前费控余额、企业近12个月电费拖欠情况、当前是否有电费拖欠情况三个三级指标;电费回收水平包括企业近12个月月应收电费回收水平得分一个三级指标;回款时长包括企业近12个月平均回款时长一个三级指标;
步骤1.2.5,用电规范包括窃电行为和违约用电行为两个二级指标,其中窃电行为包括近24个月窃电次数与窃电违约总费用两个三级指标,违约用电行为包括近24个月违约用电次数与违约用电总费用两个三级指标;
步骤1.2.6,用电行为包括用电增长趋势、用电波动、用电特性三个二级指标,其中用电增长趋势包括企业近12个月用电量同比增长率一个三级指标,用电波动包括企业近12个月用电量波动在当地同行业中水平、企业近12个月月电量差异度两个三级指标,用电特性包括企业近6个月平均负载率一个三级指标;
步骤1.2.7,用电容量包括容量状态、容量变化两个二级指标,其中容量状态包括申请容量变更一个三级指标,容量变化包括近24个月累计增容次数、减容次数两个三级指标。
4.根据权利要求1至3中任一项所述的基于排序支撑向量机的企业电力信用分建模方法,其特征在于:
步骤2具体包括:
对该特征集合进行归一化处理,得到一个特征向量值,将数据映射到[-1,1]区间,或者[0,1]区间、或更小的区间。
5.根据权利要求4所述的基于排序支撑向量机的企业电力信用分建模方法,其特征在于:
步骤3具体包括:
步骤3.1,构建模型训练数据集;
步骤3.2,将Ranking SVM转化为二次规划问题;
步骤3.3,通过将约束条件带入进原始优化问题的松弛变量中,转化为非约束的优化问题;
步骤3.4,转化为对偶问题,得到一个易于求解的形式。
7.根据权利要求6所述的基于排序支撑向量机的企业电力信用分建模方法,其特征在于:
步骤3中,
步骤3.2,将Ranking SVM转化为二次规划问题,以如下公式表示,
ξi≥0 i=1,2,…,m
式中:
‖·‖表示L2范数,
m表示训练样本的数量,
C表示系数,C>0,
ξi表示松弛变量;
步骤3.3,通过将约束条件带入进原始优化问题的松弛变量中,转化为非约束的优化问题,以如下公式表示,
式中:
加和的第一项代表了Hinge损失函数,
λ‖ω‖2,即第二项代表了正则项;
步骤3.4,转化为对偶问题,以如下公式表示,
0≤αi≤C
i=1,2,…,N。
9.根据权利要求8所述的基于排序支撑向量机的企业电力信用分建模方法,其特征在于:
步骤4中,得到所有企业的排序位置关系,找基准企业进行分层划分输出分数,其它的企业再依据与这些基准企业的相对位置关系,来确定企业的信用分高低,以此得到各个企业的准确信用分。
10.基于排序支撑向量机的企业电力信用分建模系统,运行如权利要求1至9中任一项所述的基于排序支撑向量机的企业电力信用分建模方法,包括:电力大数据处理模块、企业用电行为模型构建模块和企业电力信用分输出模块,其特征在于:
所述电力大数据处理模块用于对多维度电力数据划分评估指标,逐层计算,将这些数据组成一个特征集合,对该特征集合进行特征工程的处理,得到一个特征向量值。
所述企业用电行为模型构建模块用于在电力大数据处理模块的支撑下,得到表征各个企业电力数据情况的向量以及可以获得每对企业之间信用情况相对好坏的标签数据,将此作为模型训练数据,通过使用Ranking SVM来对对象对的排序进行分类,并将此分类器用于各个企业信用分高低排序任务中,通过模型训练数据确定出各个参数;
所述企业电力信用分输出模块用于得到企业用电行为的排序模型,进而得到所有企业的排序位置关系,找基准企业进行分层划分输出分数,其它的企业再依据与这些基准企业的相对位置关系,来确定企业的信用分高低。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111329766.0A CN114004530B (zh) | 2021-11-11 | 2021-11-11 | 基于排序支撑向量机的企业电力信用分建模方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111329766.0A CN114004530B (zh) | 2021-11-11 | 2021-11-11 | 基于排序支撑向量机的企业电力信用分建模方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114004530A true CN114004530A (zh) | 2022-02-01 |
CN114004530B CN114004530B (zh) | 2024-02-13 |
Family
ID=79928554
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111329766.0A Active CN114004530B (zh) | 2021-11-11 | 2021-11-11 | 基于排序支撑向量机的企业电力信用分建模方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114004530B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115310999A (zh) * | 2022-06-27 | 2022-11-08 | 国网江苏省电力有限公司苏州供电分公司 | 基于多层感知机和排序网络的企业用电行为分析方法及系统 |
CN115907119A (zh) * | 2022-11-11 | 2023-04-04 | 国网江苏省电力有限公司苏州供电分公司 | 企业电力消费成长分预测方法和系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200334744A1 (en) * | 2018-12-28 | 2020-10-22 | The Beekin Company Limited | Predicting real estate tenant occupancy |
CN112819308A (zh) * | 2021-01-23 | 2021-05-18 | 罗家德 | 一种基于双向图卷积神经网络的头部企业识别方法 |
CN113052483A (zh) * | 2021-04-08 | 2021-06-29 | 国网江苏省电力有限公司扬州供电分公司 | 基于电力大数据的信用分析方法 |
-
2021
- 2021-11-11 CN CN202111329766.0A patent/CN114004530B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200334744A1 (en) * | 2018-12-28 | 2020-10-22 | The Beekin Company Limited | Predicting real estate tenant occupancy |
CN112819308A (zh) * | 2021-01-23 | 2021-05-18 | 罗家德 | 一种基于双向图卷积神经网络的头部企业识别方法 |
CN113052483A (zh) * | 2021-04-08 | 2021-06-29 | 国网江苏省电力有限公司扬州供电分公司 | 基于电力大数据的信用分析方法 |
Non-Patent Citations (1)
Title |
---|
张目;周宗放;: "基于多目标规划和支持向量机的企业信用评估模型", 中国软科学, no. 04 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115310999A (zh) * | 2022-06-27 | 2022-11-08 | 国网江苏省电力有限公司苏州供电分公司 | 基于多层感知机和排序网络的企业用电行为分析方法及系统 |
CN115310999B (zh) * | 2022-06-27 | 2024-02-02 | 国网江苏省电力有限公司苏州供电分公司 | 基于多层感知机和排序网络的企业用电行为分析方法及系统 |
CN115907119A (zh) * | 2022-11-11 | 2023-04-04 | 国网江苏省电力有限公司苏州供电分公司 | 企业电力消费成长分预测方法和系统 |
Also Published As
Publication number | Publication date |
---|---|
CN114004530B (zh) | 2024-02-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Du et al. | Application of innovative risk early warning mode under big data technology in Internet credit financial risk assessment | |
CN114004530A (zh) | 基于排序支撑向量机的企业电力信用分建模方法及系统 | |
Meng et al. | Forecasting energy consumption based on SVR and Markov model: A case study of China | |
CN112418476A (zh) | 一种超短期电力负荷预测方法 | |
CN111489259A (zh) | 一种基于深度学习的股票市场风险预测智能实现方法 | |
CN111428766B (zh) | 一种高维海量量测数据的用电模式分类方法 | |
Wang et al. | Big data analytics for price forecasting in smart grids | |
CN117391247A (zh) | 一种基于深度学习的企业风险等级预测方法及系统 | |
Zhu et al. | An evolutionary cost‐sensitive support vector machine for carbon price trend forecasting | |
CN106097094A (zh) | 一种面向中小企业的人机结合信贷评估新模型 | |
CN113762591B (zh) | 一种基于gru和多核svm对抗学习的短期电量预测方法及系统 | |
Zhang et al. | Consumer credit risk assessment: A review from the state-of-the-art classification algorithms, data traits, and learning methods | |
Li et al. | A medium to long-term multi-influencing factor copper price prediction method based on CNN-LSTM | |
CN117674119A (zh) | 电网运行风险评估方法、装置、计算机设备和存储介质 | |
CN112163731A (zh) | 一种基于加权随机森林的专变用户电费回收风险识别方法 | |
Jiang et al. | On the build and application of bank customer churn warning model | |
CN110969313A (zh) | 一种基于深度学习的景气指数预测的方法和系统 | |
Su | Nonlinear ARIMA models with feedback SVR in financial market forecasting | |
CN105741143A (zh) | 一种基于负荷特性及其聚类分析的电力商品定价模型建立方法 | |
CN115310999A (zh) | 基于多层感知机和排序网络的企业用电行为分析方法及系统 | |
CN115619033A (zh) | 基于工业互联网的采购供应链一体化优化方法和设备 | |
Chen et al. | Multi-factor stock selecting model based on residual net and LSTM deep learning algorithm | |
Zeng | A comparison study on the era of internet finance China construction of credit scoring system model | |
Ding et al. | Machine Learning-based Models for House Price Prediction in Provincial Administrative Regions of China | |
Wu et al. | Application of an Ensemble Learning Method in the Risk Prediction of Electricity Tariff Recovery |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |