CN114219606A - 一种基于电力数据的用电企业信用评价的方法和系统 - Google Patents
一种基于电力数据的用电企业信用评价的方法和系统 Download PDFInfo
- Publication number
- CN114219606A CN114219606A CN202111335708.9A CN202111335708A CN114219606A CN 114219606 A CN114219606 A CN 114219606A CN 202111335708 A CN202111335708 A CN 202111335708A CN 114219606 A CN114219606 A CN 114219606A
- Authority
- CN
- China
- Prior art keywords
- score
- index
- credit
- expressed
- competitiveness
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/03—Credit; Loans; Processing thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2462—Approximate or statistical queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
- G06Q50/06—Electricity, gas or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Economics (AREA)
- General Physics & Mathematics (AREA)
- Finance (AREA)
- Probability & Statistics with Applications (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Accounting & Taxation (AREA)
- Health & Medical Sciences (AREA)
- General Business, Economics & Management (AREA)
- Public Health (AREA)
- Development Economics (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Primary Health Care (AREA)
- Tourism & Hospitality (AREA)
- Technology Law (AREA)
- Fuzzy Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本发明公开了一种基于电力数据的用电企业信用评价的方法和系统,所述方法包括:对电力数据的指标进行梳理,筛选出企业的稳定性指标和竞争力指标;对企业的稳定性和竞争力进行评分;根据稳定性评分和竞争力评分,判断是否采用该用电企业的电力数据;若是,基于逻辑回归的方法,利用训练集进行训练,获得回归模型;基于回归模型,建立评分模型;根据评分模型对用电企业的电力数据进行分析,获得用电企业的信用评价。基于用电企业的电力数据,分析挖掘企业的用电数据,得出企业稳定性评分和企业竞争力评分,通过构建回归模型和评分模型,对企业信用进行评价,为金融机构提供贷前风险评估,以及贷后风险和贷后预警提供有益的数据支撑。
Description
技术领域
本发明涉及信用分析技术领域,具体涉及一种基于电力数据的用电企业信用评价的方法和系统。
背景技术
金融机构以银行为主导,信贷业务已成为银行关键业务,并且成为银行收入主要来源,而信贷风险也变成其面临的主要风险。其中,企业信贷风险又是银行的主要的信贷风险。这一切对已经全面对外开放的商业银行的风险管理技术和水平以及风险管理体制等都提出了严峻的挑战,商业银行必须持续不断地提高企业信贷风险管理技术和水平。
随着我国深化经济结构改革,加快民营企业创业创新发展步伐,出台了一系列扶持中小企业快速发展政策。降低了成立公司门槛,如注册资金由实缴登记制改为认缴登记制;经营范围只要表述清楚规范,法定代表人和股东无需人人到场,只需要身份证复印件即可批准成立公司。从而加剧了企业风险,进一步对企业信贷风险管理提出了挑战。
电力资源作为企业生成经营过程中不可或缺,贯穿始终,电力数据可以全面的反映生产企业的日常生产、经营和管理状态,是全面掌握企业生产状况的重要数据资源。因此,深度挖掘企业的电力数据,通过电力数据对用电企业的信用进行评价尤为重要。
发明内容
针对现有技术中存在的上述技术问题,本发明提供一种基于电力数据的用电企业信用评价的方法和系统,通过企业的电力数据对企业稳定性、竞争力以及信用进行评价,为金融机构的贷前风险评估、贷后预警提供支撑数据。
本发明公开了一种基于电力数据的用电企业信用评价的方法,所述方法包括:对电力数据的指标进行梳理,筛选出企业的稳定性指标和竞争力指标;根据所述稳定性指标,对企业的稳定性进行评分;根据所述竞争力指标,对企业的竞争力进行评分;根据所述稳定性评分和竞争力评分,判断是否采用该用电企业的电力数据;若是,将所述电力数据加入到训练集;基于逻辑回归的方法,利用训练集进行训练,获得回归模型;基于所述回归模型,建立评分模型;根据所述评分模型对用电企业的电力数据进行分析,获得用电企业的信用评价。
优选的,对企业的稳定性或竞争力进行评分的方法包括:
设定稳定性指标或竞争力指标的域值区间和相应的分值;
基于所述指标的实际值匹配相应的分值;
根据所述指标的分值及其权重,获得稳定性或竞争力的评分。
优选的,本发明的方法还包括线性计算指标分值的方法:
设置指标的线性区间;
若指标值小于线性区间的下限,指标分值为零;
若指标值大于线性区间的上限,指标分值为最高分值;
若指标值在线性区间内,通过公式1或公式3计算指标分值:
score=((X-A)/(B-A))×top (1);
score=[1-(X-A)/(B-A)]×top (3)
其中,score为指标分值,X表示为指标值,A表示为线性区间的下限,B表示为线性区间的上限,top表示为最高分;
通过公式2计算稳定性评分:
B16Ls×W1+B17Ls×W2+…+BnLs×Wn=SSCORE (2)
其中,BnLs表示为稳定性指标,Wn表示为稳定性指标的权重,SSCORE表示为稳定性评分;
通过公式11计算竞争力评分:
B35Lc×W35+B37Lc×W37+…+BmLc×Wm=CSCORE (11)
其中,BmLc表示为竞争力指标,Wm表示为竞争力指标的权重,CSCORE表示为竞争力评分。
优选的,通过信息熵的方法获得指标的权重:
其中,Ek表示为指标k的信息熵,Xik表示为指标k的第i个值,n表示为指标k具有n个值;
通过公式14获得指标的权重:
其中,Wk表示为指标k的权重,K表示为指标数量。
优选的,采用该用电企业的电力数据的方法包括:
根据公式21计算综合得分:
V=λ1×SSCORE+λ2×CSCORE (21)
其中,V表示为综合得分,λ1为稳定性评分的权重;λ2竞争力评分的权重;
若V大于第一域值,则对用电企业进行信用评价。
优选的,训练回归模型的方法包括:
为训练集中的用电企业打标签,所述标签包括正标签和负标签;
对训练集中的用电数据进行预处理和标准化处理;
对指标进行分箱,获得指标分组,使各分组的证据权重呈单调趋势或U型趋势;
根据公式22计算证据权重:
其中,WOEt表示为分组t的证据权重,Bt表示为分组t中负标签的数量,BT表示为总负标签的数量,Gt表示为分组t中正标签的数量,GT表示为总正标签的数量;Pt1表示为分组t中负标签与总负标签的比例,Pt0表示为分组t中正标签与总正标签的比例;
根据公式23和24计算信息价值:
其中,IVt表示为分组t的信息价值,u表示为指标分组数,IV表示为指标信息价值;
判断指标信息价值是否大于第四域值;
若大于第四域值,将该指标作为建模指标;
通过建模指标的证据权重训练逻辑回归模型:
ln(odds)=α+βX (27)
其中,pi表示为正标签的概率,X表示为证据权重的数据,odds表示为正标签的发生比,α和β表示为逻辑回归的参数;
建立评分模型的方法包括:
根据公式28获得信用评分:
Score=A-Bln(odds)=A-B(α+βX) (28)
其中,Score表示为信用评分,A和B为常数;
根据公式29获得常数的值:
其中,PDO表示为比率翻番的分数,P0表示为设定比率为θ0的特定点的分值,比率为2θ0的点分值为P0-PDO。
优选的,本发明的方法还包括贷后信用评价的方法:
筛选贷后信用评价指标;
为贷后信用评价指标预设第二域值区间及其评分;
根据公式32计算贷后信用评分:
Lscore=W11×X11+…+Wk×Xk+Adj (32)
其中,Lscore表示为贷后信用评分,Wk表示为指标k的权重,Xk表示为指标k的评分,Adj表示为调整项;
通过公式31获得指标k的权重:
Wk=0.1×EntropyWeight+0.5×FAHPWeight1+0.4×FAHPWeight2(31)
Entropyweight表示为熵权法构建指标的权重,FAHPWeight1表示为基于TFN-AHP模糊层次分析法构建的第一指标的权重,FAHPWeight2表示为基于TFN-AHP模糊层次分析法构建的第二指标的权重。
优选的,本发明的方法还包括根据贷后信用进行贷后预警的方法:
为贷后信用评分预设第三域值区间及其区间评价和报警信息;
根据贷后的电力数据计算贷后信用评分;
根据所计算的贷后信用评分,匹配相应的评价和报警信息;
根据所述报警信息,向管理者发送报警。
本发明还提供一种用于实现上述方法的系统,包括筛选模块、稳定性评分模块、竞争力评分模块、预选模块、训练模块和分析模块,
所述筛选模块用于对电力数据的指标进行梳理,筛选出企业的稳定性指标和竞争力指标;
所述稳定性评分模块用于根据所述稳定性指标,对企业的稳定性进行评分;
所述竞争力评分模块用于根据所述竞争力指标,对企业的竞争力进行评分;
所述预选模块用于根据所述稳定性评分和竞争力评分,采用该用电企业的电力数据;
若是,将所述电力数据加入到训练集;基于逻辑回归的方法,利用训练集进行训练,获得回归模型;基于所述回归模型,建立评分模型;
所述分析模块用于通过所述评分模型对用电企业的电力数据进行分析,获得用电企业的信用评价。
本发明的系统还包括贷后信用评价模块和预警模块,
所述贷后信用评价模块用于根据电力数据,对用电企业的进行贷后信用评分和评价;所述预警模块用于根据贷后信用评分和评价生成报警信息。
与现有技术相比,本发明的有益效果为:基于用电企业的电力数据,分析挖掘企业的用电数据,得出企业稳定性评分和企业竞争力评分,通过构建的回归模型和评分模型,对企业信用进行评价,为金融机构提供贷前风险评估,以及贷后风险和贷后预警提供有益的数据支撑。有效对空壳企业进行识别和筛查,保障市场的经济和金融秩序,保护金融机构的资产不受损害。
附图说明
图1是本发明的基于电力数据的用电企业信用评价的方法流程图;
图2是本发明的系统逻辑框图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面结合附图对本发明做进一步的详细描述:
一种基于电力数据的用电企业信用评价的方法,如图1所示,所述方法包括:
步骤101:对电力数据的指标进行梳理,筛选出企业的稳定性指标和竞争力指标。
例如,近一年平均月度用电量、近一年连续用电时长、近一年用电波动方差、近一年用电波动环比绝对平均值、近一年用电最大环比波动、近一年缴费金额等指标作为稳定性指标;相对行业立户时长比、近一年企业相对用电规模比、近一年企业相对用电增长比等指标作为竞争力指标。其中,还包括对电力数据进行预处理的方法,对数据的缺失值、冗余值、异常值进行处理,减少异常数据对模型带来的干扰,缺失值处理:对样本数据中缺少关键字段的样本进行删除,包括用电日期、用电户号;冗余值处理:对重复样本数据进行删除处理;异常值处理:对用电日期大于当前日期的样本进行删除。
步骤102:根据所述稳定性指标,对企业的稳定性进行评分。可以通过域值分割的方法进行评分。
步骤103:根据所述竞争力指标,对企业的竞争力进行评分。
步骤104:根据所述稳定性评分和竞争力评分,判断是否采用该用电企业的电力数据。
若是,执行步骤105:将所述电力数据加入到训练集。
若否,企业的稳定性和竞争力评分较低,为较差企业,不纳入到训练集中。
步骤106:基于逻辑回归的方法,利用训练集进行训练,获得回归模型。
步骤107:基于所述回归模型,建立评分模型。
步骤108:根据所述评分模型对用电企业的电力数据进行分析,获得用电企业的信用评价。
基于用电企业的电力数据,分析挖掘企业的用电数据,得出企业稳定性评分和企业竞争力评分,通过构建的回归模型和评分模型,对企业信用进行评价,为金融机构提供贷前风险评估,以及贷后风险和贷后预警提供有益的数据支撑。有效对空壳企业进行识别和筛查,保障市场的经济和金融秩序,保护金融机构的资产不受损害。
步骤102和103中,对企业的稳定性或竞争力进行评分的方法包括:
步骤201:设定稳定性指标或竞争力指标的域值区间和相应的分值。
步骤202:基于所述指标的实际值匹配相应的分值。例如,指标B17原始值为12时,得分100分。
步骤203:根据所述指标的分值及其权重,获得稳定性或竞争力的评分。
应当指出的是,不同领域的电力数据具有不同的特征,因此,在企业对比中,应当将同领域的企业进行比较。具体的,获取行业代号,归类提供的若干个行业代码为89个行业大类。若行业代号前两位数字相同,则归为同一大类,该大类代码为这两位相同数字+00,例如:行业代号3401和3402都归为3400类。
步骤201中,域值区间的分值可以通过定值的方法或者线性计算指标分值的方法。线性计算指标分值的方法包括:
步骤301:设置指标的线性区间。
步骤302:若指标值小于线性区间的下限(例如,前length×seg),指标分值设置为零。其中,length表示为原始值的个数,seg表示为原始值占比。在一个具体实施例中,B16指标的计算逻辑如下表所示:
原始值B16 | 排序(从小到大) | 指标分值 | 计算逻辑 |
12 | 3 | 3.70 | ((X-A)/(B-A))*top |
45 | 5 | 45.68 | ((X-A)/(B-A))*top |
33 | 4 | 30.86 | ((X-A)/(B-A))*top |
75 | 10 | 82.72 | ((X-A)/(B-A))*top |
3 | 1 | 0 | 前length*seg |
8 | 2 | 0 | 前length*seg |
45 | 5 | 45.68 | ((X-A)/(B-A))*top |
59 | 8 | 62.96 | ((X-A)/(B-A))*top |
50 | 7 | 51.85 | ((X-A)/(B-A))*top |
64 | 9 | 69.14 | ((X-A)/(B-A))*top |
89 | 11 | 100 | 后length*seg |
94 | 12 | 100 | 后length*seg |
其中,Top=100,A=8,B=89。
步骤303:若指标值大于线性区间的上限(例如,后length×seg),指标分值设置为最高分值。
步骤304:若指标值在线性区间内,通过公式1或公式3计算指标分值。
score=((X-A)/(B-A))×top (1);
score=[1-(X-A)/(B-A)]×top (3)
其中,score为指标分值,X表示为指标值,A表示为线性区间的下限,B表示为线性区间的上限,top表示为最高分;公式1中,X与指标分值成正相关性,公式3中,X与指标分值呈负相关性。可以分行业,对指标的值求线性,以获得参数A和B。
步骤305:通过公式2计算稳定性评分:
B16Ls×W1+B17Ls×W2+…+BnLs×Wn=SSCORE (2)
其中,BnLs表示为稳定性指标,Wn表示为稳定性指标的权重,SSCORE表示为稳定性评分;
步骤305:通过公式11计算竞争力评分:
B35Lc×W35+B37Lc×W37+…+BmLc×Wm=CSCORE (11)
其中,BmLc表示为竞争力指标,Wm表示为竞争力指标的权重,CSCORE表示为竞争力评分。
步骤306:通过信息熵的方法获得指标的权重:
其中,Ek表示为指标k的信息熵,Xik表示为指标k的第i个值,n表示为指标k具有n个值;
通过公式14获得指标的权重:
其中,Wk表示为指标k的权重,K表示为指标数量。通过步骤306可以计算稳定性指标和竞争力指标的权重。
步骤104中,判断是否采用该用电企业的电力数据的方法包括:
根据公式21计算综合得分:
V=λ1×SSCORE+λ2×CSCORE (21)
其中,V表示为综合得分,λ1为稳定性评分的权重;λ2竞争力评分的权重;
若V大于第一域值,例如V大于45分,将所述电力数据加入到训练集,该用电企业为优质客户。综合得分小于第一域值,则认为该企业为较差的用户,该用电企业的用电数据不纳入到逻辑回归模型和评分模型的建模中,以提高回归模型和评分模型对优质客户评价的准确性。在一个具体实施例中,公式21表示为:V=0.4×SSCORE+0.6×CSCORE。
步骤106中,训练回归模型的方法包括:
步骤401:为训练集中的用电企业打标签,所述标签包括正标签和负标签。其中正标签表示为正常用电企业(正样本),负标签表示为违约用电企业(负样本),可以通过选取阙值定义负标签。
步骤402:对训练集中的用电数据进行预处理和标准化处理,如Min-max标准化处理。预处理和标准化处理为现有技术,本申请中不再赘述。信用评价的指标可以包括近一年平均月度用电量、近一年连续用电时长、近一年用电波动方差、近一年用电波动环比绝对平均值、近一年用电最大环比波动、近一年缴费金额、相对行业立户时长比、近一年企业相对用电规模比、近一年企业相对用电增长比等指标,但不限于此。
步骤403:对指标进行分箱,获得指标分组,使各分组的证据权重呈单调趋势或U型趋势。
步骤404:根据公式22计算证据权重:
其中,WOEt表示为分组t的证据权重,Bt表示为分组t中负样本或负标签的数量,BT表示为总负样本的数量,Gt表示为分组t中正样本或正标签的数量,GT表示为总正样本的数量;Pt1表示为分组t中负样本与总负样的比例,Pt0表示为分组t中正样本与总正样本的比例。WOE(Weight of Evidence)是对自变量的一种编码形式。
步骤405:根据公式23和24计算信息价值:
其中,IVt表示为分组t的信息价值,u表示为指标分组数,IV表示为指标信息价值。IV(Information Value)用来衡量自变量的信息价值和预测能力。
步骤406:判断指标信息价值是否大于第四域值。
若大于第四域值,执行步骤407:将该指标作为建模指标。但不限于通过指标信息价值筛选建模指标的方法,也可以通过皮尔逊相关性系数对变量进行筛选。小于第四域值(例如0.02)的指标,对信用评价的贡献弱,可以剔除,而不参与后面的逻辑回归拟合过程;这些指标即使进入变量拟合库,其贡献也基本上等于没有。
步骤408:通过建模指标的证据权重训练逻辑回归模型:
ln(odds)=α+βX (27)
其中,pi表示为正样本的概率,X表示为证据权重的数据,odds表示为正样本的发生比,α和β表示为逻辑回归的累积概率密度函数的参数。本发明中通过公式22中计算得出的证据权重来构建逻辑模型。
步骤409:根据回归模型,建立评分模型。根据公式28获得信用评分:
Score=A-Bln(odds)=A-B(α+βX) (28)
其中,Score表示为信用评分,A和B为常数。信用评分是对用电企业信用评价的量化,在一个具体实施例中,通过信用评分与预设的评分卡进行匹配,获得信用评分相应的信用评价。
步骤410:利用回归模型获得评分模型的参数。根据公式29获得常数的值:
其中,PDO表示为比率翻番的分数,P0表示为设定比率为θ0的特定点的分值,比率为2θ0的点分值为P0-PDO。
本发明还包括贷后信用评价的方法:
步骤501:筛选贷后信用评价指标。在一个具体实施例中,贷后信用评价指标包括10个评价指标和4个调整项共14项,分布在容量变化、用电量水平、缴费行为、用电行为、用电规范和企业基本信息六大维度。在评价维度中,容量变化占17.5%,用电量水平占47.6%,缴费行为占9.3%,以及用电行为占25.6%。
步骤502:为贷后信用评价指标预设第二域值区间及其评分。
步骤503:根据公式32计算贷后信用评分:
Lscore=W11×X11+…+Wk×Xk+Adj (32)
其中,Lscore表示为贷后信用评分,Wk表示为指标k的权重,Xk表示为指标k的评分,Adj表示为调整项。
其中,可以通过公式31获得指标k的权重:
Wk=0.1×EntropyWeight+0.5×FAHPWeight1+0.4×FAHPWeight2 (31)
EntropyWeight表示为熵权法构建指标的权重,FAHPWeight1表示为基于TFN-AHP模糊层次分析法构建的第一指标的权重,FAHPWeight2表示为基于TFN-AHP模糊层次分析法构建的第二指标的权重。其中,第一指标和第二指标的指标类型不同,第一指标为用电量水平相关的指标,第二指标为缴费行为和用电行为的指标。
根据贷后信用进行贷后预警的方法:
步骤504:为贷后信用评分预设第三域值区间及其区间评价和报警信息。
步骤505:根据用电企业贷后的电力数据计算贷后信用评分。
步骤506:根据所计算的贷后信用评分,匹配相应的评价和报警信息。
步骤507:根据所述报警信息,向管理者发送报警。
例如,容量变化:
近12个月内增容次数X11(权重W11=0.104),其评分逻辑为:
01=0次 | 650 |
02=[1,3]次 | 700+(x-0)/3*150 |
03=[4,+)次 | 850 |
04=其他未说明 | 650 |
近12个月内减容次数X12(权重W12=0.071),其评分逻辑为:
01=0次 | 850 |
02=[1,3]次 | 700-(x-0)/3*150 |
03=[4,+)次 | 450 |
04=其他未说明 | 650 |
调整项Adj的评分逻辑或预警逻辑为:
步骤504中,一个具体的评分模型如下表所示:
一个具体的报警信息模型如下表所示:
报警信息 | 报警条件 |
企业近12个月减容次数得分 | 分数<560 |
企业近一个月内用电量相对于行业的水平 | 分数<400 |
近三个月用电量的变异系数得分 | 分数<560 |
近一个月用电量的环比增长率得分 | 分数<560 |
近一个月用电量的同比增长率得分 | 分数<560 |
企业近三个月用电量同比增长率相对于行业的水平 | 分数<400 |
企业近1年缴费金额的平均值相对于行业的水平 | 分数<400 |
连续开机天数得分 | 分数<560 |
近一个月内用电量为0的天数得分 | 分数<560 |
营业场所位置变更历史 | 不为0 |
注销户号 | 不为0 |
窃电情况 | 不为0 |
本发明还提供一种用于实现上述方法的系统,如图2所示,包括筛选模块1、稳定性评分模块2、竞争力评分模块3、预选模块4、训练模块5和分析模块6,
筛选模块1用于对电力数据的指标进行梳理,筛选出企业的稳定性指标和竞争力指标;
稳定性评分模块2用于根据所述稳定性指标,对企业的稳定性进行评分;
竞争力评分模块3用于根据所述竞争力指标,对企业的竞争力进行评分;
预选模块4用于根据所述稳定性评分和竞争力评分,判断是否采用该用电企业的电力数据;
若是,训练模块5将所述电力数据加入到训练集;基于逻辑回归的方法,利用训练集进行训练,获得回归模型;基于所述回归模型,建立评分模型;
分析模块6用于通过所述评分模型对用电企业的电力数据进行分析,获得用电企业的信用评价。
本发明的系统还包括贷后信用评价模块7和预警模块8,贷后信用评价模块7用于根据电力数据,对用电企业的进行贷后信用评分和评价;
预警模块8用于根据贷后信用评分和评价生成报警信息。
以上仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种基于电力数据的用电企业信用评价的方法,其特征在于,所述方法包括:
对电力数据的指标进行梳理,筛选出企业的稳定性指标和竞争力指标;
根据所述稳定性指标,对企业的稳定性进行评分;
根据所述竞争力指标,对企业的竞争力进行评分;
根据所述稳定性评分和竞争力评分,判断是否采用该用电企业的电力数据;
若是,将所述电力数据加入到训练集;
基于逻辑回归的方法,利用训练集进行训练,获得回归模型;
基于所述回归模型,建立评分模型;
根据所述评分模型对用电企业的电力数据进行分析,获得用电企业的信用评价。
2.根据权利要求1所述的方法,其特征在于,对企业的稳定性或竞争力进行评分的方法包括:
设定稳定性指标或竞争力指标的域值区间和相应的分值;
基于指标的实际值匹配相应的分值;
根据所述指标的分值及其权重,获得稳定性或竞争力的评分。
3.根据权利要求2所述的方法,其特征在于,还包括线性计算指标分值的方法:
设置指标的线性区间;
若指标值小于线性区间的下限,指标分值为零;
若指标值大于线性区间的上限,指标分值为最高分值;
若指标值在线性区间内,通过公式1或公式3计算指标分值:
score=((X-A)/(B-A))×top (1);
score=[1-(X-A)/(B-A)]×top (3)
其中,score为指标分值,X表示为指标值,A表示为线性区间的下限,B表示为线性区间的上限,top表示为最高分;
通过公式2计算稳定性评分:
B16Ls×W1+B17Ls×W2+…+BnLs×Wn=SSCORE (2)
其中,BnLs表示为稳定性指标,Wn表示为稳定性指标的权重,SSCORE表示为稳定性评分;
通过公式11计算竞争力评分:
B35Lc×W35+B37Lc×W37+…+BmLc×Wm=CSCORE (11)
其中,BmLc表示为竞争力指标,Wm表示为竞争力指标的权重,CSCORE表示为竞争力评分。
5.根据权利要求4所述的方法,其特征在于,判断是否采用该用电企业的电力数据的方法包括:
根据公式21计算综合得分:
V=λ1×SSCORE+λ2×CSCORE (21)
其中,V表示为综合得分,λ1为稳定性评分的权重;λ2竞争力评分的权重;
若V大于第一域值,则对用电企业进行信用评价。
6.根据权利要求1所述的方法,其特征在于,训练回归模型的方法包括:
为训练集中的用电企业打标签,所述标签包括正标签和负标签;
对训练集中的用电数据进行预处理和标准化处理;
对指标进行分箱,获得指标分组,使各分组的证据权重呈单调趋势或U型趋势;
根据公式22计算证据权重:
其中,WOEt表示为分组t的证据权重,Bt表示为分组t中负标签的数量,BT表示为总负标签的数量,Gt表示为分组t中正标签的数量,GT表示为总正标签的数量;Pt1表示为分组t中负标签与总负标签的比例,Pt0表示为分组t中正标签与总正标签的比例;
根据公式23和24计算信息价值:
其中,IVt表示为分组t的信息价值,u表示为指标分组数,IV表示为指标信息价值;
判断指标信息价值是否大于第四域值;
若大于第四域值,将该指标作为建模指标;
通过建模指标的证据权重训练逻辑回归模型:
ln(odds)=α+βX (27)
其中,pi表示为正标签的概率,X表示为证据权重的数据,odds表示为正标签的发生比,α和β表示为逻辑回归的参数;
建立评分模型的方法包括:
根据公式28获得信用评分:
Score=A-Bln(odds)=A-B(α+βX) (28)
其中,Score表示为信用评分,A和B为常数;
根据公式29获得常数的值:
其中,PDO表示为比率翻番的分数,P0表示为设定比率为θ0的特定点的分值,比率为2θ0的点分值为P0-PDO。
7.根据权利要求1所述的方法,其特征在于,还包括贷后信用评价的方法:
筛选贷后信用评价指标;
为贷后信用评价指标预设第二域值区间及其评分;
根据公式32计算贷后信用评分:
Lscore=W11×X11+…+Wk×Xk+Adj (32)
其中,Lscore表示为贷后信用评分,Wk表示为指标k的权重,Xk表示为指标k的评分,Adj表示为调整项;
通过公式31获得指标k的权重:
Wk=0.1×EntropyWeight+0.5×FAHPWeight1+0.4×FAHPWeight2 (31)
EntropyWeight表示为熵权法构建指标的权重,FAHPWeiqht1表示为基于TFN-AHP模糊层次分析法构建的第一指标的权重,FAHPWeight2表示为基于TFN-AHP模糊层次分析法构建的第二指标的权重。
8.根据权利要求7所述的方法,其特征在于,还包括根据贷后信用进行贷后预警的方法:
为贷后信用评分预设第三域值区间及其区间评价和报警信息;
根据贷后的电力数据计算贷后信用评分;
根据所计算的贷后信用评分,匹配相应的评价和报警信息;
根据所述报警信息,向管理者发送报警。
9.一种用于实现如权利要求1-8任一项所述方法的系统,其特征在于,包括筛选模块、稳定性评分模块、竞争力评分模块、预选模块、训练模块和分析模块,
所述筛选模块用于对电力数据的指标进行梳理,筛选出企业的稳定性指标和竞争力指标;
所述稳定性评分模块用于根据所述稳定性指标,对企业的稳定性进行评分;
所述竞争力评分模块用于根据所述竞争力指标,对企业的竞争力进行评分;
所述预选模块用于根据所述稳定性评分和竞争力评分,判断是否采用该用电企业的电力数据;
若是,所述训练模块根据将所述电力数据加入到训练集;基于逻辑回归的方法,利用训练集进行训练,获得回归模型;基于所述回归模型,建立评分模型;
所述分析模块用于通过所述评分模型对用电企业的电力数据进行分析,获得用电企业的信用评价。
10.根据权利要求9所述的系统,其特征在于,还包括贷后信用评价模块和预警模块,
所述贷后信用评价模块用于根据电力数据,对用电企业的进行贷后信用评分和评价;所述预警模块用于根据贷后信用评分和评价生成报警信息。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111335708.9A CN114219606A (zh) | 2021-11-11 | 2021-11-11 | 一种基于电力数据的用电企业信用评价的方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111335708.9A CN114219606A (zh) | 2021-11-11 | 2021-11-11 | 一种基于电力数据的用电企业信用评价的方法和系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114219606A true CN114219606A (zh) | 2022-03-22 |
Family
ID=80697016
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111335708.9A Pending CN114219606A (zh) | 2021-11-11 | 2021-11-11 | 一种基于电力数据的用电企业信用评价的方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114219606A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115310999A (zh) * | 2022-06-27 | 2022-11-08 | 国网江苏省电力有限公司苏州供电分公司 | 基于多层感知机和排序网络的企业用电行为分析方法及系统 |
-
2021
- 2021-11-11 CN CN202111335708.9A patent/CN114219606A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115310999A (zh) * | 2022-06-27 | 2022-11-08 | 国网江苏省电力有限公司苏州供电分公司 | 基于多层感知机和排序网络的企业用电行为分析方法及系统 |
CN115310999B (zh) * | 2022-06-27 | 2024-02-02 | 国网江苏省电力有限公司苏州供电分公司 | 基于多层感知机和排序网络的企业用电行为分析方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Maldonado et al. | Credit scoring using three-way decisions with probabilistic rough sets | |
Emel et al. | A credit scoring approach for the commercial banking sector | |
Siddiqi | Credit risk scorecards: developing and implementing intelligent credit scoring | |
Doumpos et al. | Developing and testing models for replicating credit ratings: A multicriteria approach | |
Antunes et al. | Firm default probabilities revisited | |
Bravo et al. | Granting and managing loans for micro-entrepreneurs: New developments and practical experiences | |
Mousavi et al. | Multi-criteria ranking of corporate distress prediction models: empirical evaluation and methodological contributions | |
CN111476660A (zh) | 一种基于数据分析的智能风控系统及方法 | |
Wang et al. | Integrating decision tree with back propagation network to conduct business diagnosis and performance simulation for solar companies | |
Chi et al. | Debt rating model based on default identification: Empirical evidence from Chinese small industrial enterprises | |
Cascarino et al. | Explainable artificial intelligence: interpreting default forecasting models based on machine learning | |
Ghale Rudkhani et al. | The effect of financial ratios on auditor opinion in the companies listed on TSE | |
Shakouri et al. | Stochastic p-robust DEA efficiency scores approach to banking sector | |
Demirhan et al. | Predicting the Financial Failures of Manufacturing Companies Trading in the Borsa Istanbul (2007-2019) | |
Korol | The implementation of fuzzy logic in forecasting financial ratios | |
CN114219606A (zh) | 一种基于电力数据的用电企业信用评价的方法和系统 | |
Wagdi et al. | The integration of big data and artificial neural networks for enhancing credit risk scoring in emerging markets: Evidence from Egypt | |
KR102499182B1 (ko) | 인공지능을 이용한 가계대출 사기/부실 상시감사지원시스템 | |
Giannopoulos | The effectiveness of artificial credit scoring models in predicting NPLs using micro accounting data | |
Çamlibel | Comparison of management and financial performance in the Turkish insurance sector: An example of clustering analysis | |
Gopalan et al. | Assessing the quality of bank loan ratings | |
Giannouli et al. | Towards an improved credit scoring system: the Greek case | |
Nazari et al. | Using the Hybrid Model for Credit Scoring (Case Study: Credit Clients of microloans, Bank Refah-Kargeran of Zanjan, Iran) | |
Sjoblom et al. | Profitability vs. credit score models—a new approach to short term credit in the UK | |
Rizal et al. | Determinants of audit fees in the consumer goods industry listed on the Indonesia stock exchange |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |