CN110119948A - 基于时变权重动态组合的电力用户信用评价方法及系统 - Google Patents
基于时变权重动态组合的电力用户信用评价方法及系统 Download PDFInfo
- Publication number
- CN110119948A CN110119948A CN201910324774.2A CN201910324774A CN110119948A CN 110119948 A CN110119948 A CN 110119948A CN 201910324774 A CN201910324774 A CN 201910324774A CN 110119948 A CN110119948 A CN 110119948A
- Authority
- CN
- China
- Prior art keywords
- credit
- evaluation
- user
- time
- sliding window
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 18
- 238000011156 evaluation Methods 0.000 claims abstract description 159
- 230000005611 electricity Effects 0.000 claims description 49
- 238000007781 pre-processing Methods 0.000 claims description 12
- 238000004364 calculation method Methods 0.000 claims description 11
- 238000012216 screening Methods 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 6
- 230000002159 abnormal effect Effects 0.000 claims description 4
- 238000010606 normalization Methods 0.000 claims description 3
- 230000001502 supplementing effect Effects 0.000 claims 1
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000006872 improvement Effects 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000000546 chi-square test Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012854 evaluation process Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000013077 scoring method Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q20/00—Payment architectures, schemes or protocols
- G06Q20/38—Payment protocols; Details thereof
- G06Q20/40—Authorisation, e.g. identification of payer or payee, verification of customer or shop credentials; Review and approval of payers, e.g. check credit lines or negative lists
- G06Q20/403—Solvency checks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Strategic Management (AREA)
- Accounting & Taxation (AREA)
- Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- General Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- Tourism & Hospitality (AREA)
- Primary Health Care (AREA)
- Marketing (AREA)
- General Health & Medical Sciences (AREA)
- Water Supply & Treatment (AREA)
- Computer Security & Cryptography (AREA)
- Public Health (AREA)
- Finance (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种基于时变权重动态组合的电力用户信用评价方法及系统,所述方法包括以下步骤:接收用户信息和相应的历史用电信息;提取历史用电信息中的信用评价指标数据,计算每个用户的信用评分;接收评价周期和滑动窗口的设定,所述滑动窗口的大小为评价周期的整数倍;所述滑动窗口随时间滑动,每次滑动一个评价周期的距离,每次滑动后,均根据距当前时刻的时间长短,更新当前滑动窗口内各评价周期的信用评分权重;基于当前滑动窗口内的历史信用评分和信用评分权重,对下一评价周期内的信用评分进行预测。本发明实现了电力用户信用评价的动态自适应。
Description
技术领域
本发明涉及智能用电领域,特别涉及一种基于时变权重动态组合的电力用户信用评价方法及系统。
背景技术
随着电力市场改革深入,传统的电力用户无差异管理严重制约着电力企业的市场竞争,为全方位提高电力用户日常管理和服务质量,亟需开展电力用户信用等级评价。一方面,由于电力企业的经营现状为先消费后付款,用户信用缺失而导致用电欠费及呆死账现象日益突出,严重影响和制约了电力企业的资金运转,另一方面,对于优质信用用户,针对性的奖励机制可促使用户信用水平的保持及提高,从而可节约电力企业的运维监管费用。此外,随着电力系统海量用电数据的积累,高级电力应用业务的开展(如终端故障预测、违约窃电预测等),亦亟需电力用户信用评价数据的支撑。
当前电力用户信用等级评价模型还不够成熟,用户信用等级评价模型主要依赖于专家打分法和层次分析法,难以保证对不断增长的电力用户实现客观信用评价,随着数据挖掘技术的应用,机器学习与统计学方法也开始应用于用户信用等级评价,然而,现有方法往往采用固化信用等级归类用户评价,一方面,新用户由于缺乏充分的用电数据而导致评价困难,另一方面,由于用户采集数据的持续更新,非时变的评价方式往往导致等级偏移,难以满足用户信用等级评价的动态自适应性。
发明内容
为克服上述现有技术的不足,本发明提供了一种基于时变权重动态组合的电力用户信用评价方法及系统,实现了电力用户信用评价的动态自适应。
为实现上述目的,本发明的一个或多个实施例提供了如下技术方案:
一种基于时变权重动态组合的电力用户信用评价方法,包括以下步骤:
接收用户信息和相应的历史用电信息;
提取历史用电信息中的信用评价指标数据,计算每个用户的信用评分;
接收评价周期和滑动窗口的设定,所述滑动窗口的大小为评价周期的整数倍;
所述滑动窗口随时间滑动,每次滑动一个评价周期的距离,每次滑动后,均根据距当前时刻的时间长短,更新当前滑动窗口内各评价周期的信用评分权重;
基于当前滑动窗口内的历史信用评分和信用评分权重,对下一评价周期内的信用评分进行预测。
一个或多个实施例一种基于时变权重动态组合的电力用户信用评价系统,包括:
数据获取模块,接收用户信息和相应的历史用电信息;
信用评分计算模块,提取历史用电信息中的信用评价指标数据,计算每个用户的信用评分;
评价周期和滑动窗口的设定模块,接收评价周期和滑动窗口的设定,所述滑动窗口的大小为评价周期的整数倍;
信用评分预测模块,所述滑动窗口随时间滑动,每次滑动一个评价周期的距离,每次滑动后,均根据距当前时刻的时间长短,更新当前滑动窗口内各评价周期的信用评分权重;基于当前滑动窗口内的历史信用评分和信用评分权重,对下一评价周期内的信用评分进行预测。
一个或多个实施例提供了一种计算装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现所述的基于时变权重动态组合的电力用户信用评价方法。
一个或多个实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现所述的基于时变权重动态组合的电力用户信用评价方法。
以上一个或多个技术方案存在以下有益效果:
本发明提出了基于滑动窗口进行信用评分的预测的方法,滑动窗口内包括多个评价周期,窗口滑动时,在新的评价周期信用评分数据进入时,时间距离最远的评价周期数据滑出窗口,滑动窗口内的历史评价数据用于预测下一评价周期的信用评分,从而在保证历史评价数据充分的前提下,不断更新历史评价数据,并在信用评分阶段,根据距当前时刻的时间长短,更新当前滑动窗口内各评价周期的信用评分权重,既保证最新样本采集数据的高占比趋势预测性,又基于历史数据实现信用趋势预测的稳定性,从而提高整体信用评分预测准确度。
附图说明
构成本发明的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。
图1为本发明一个或多个实施例中电力用户信用评价方法整体流程图;
图2为本发明一个或多个实施例中历史样本各评价周期的信用评分曲线;
图3为本发明一个或多个实施例中滑动窗口示意图。
具体实施方式
应该指出,以下详细说明都是示例性的,旨在对本发明提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本发明的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
本发明提出的总体思路:首先针对历史用电终端样本记录,采用熵权法实现终端样本的信用评分,并结合Jaccard系数和欧氏距离相结合的方式实现新入网终端的信用评分预估及历史数据填充,随后,以滑动窗口的方式终端样本数据的更新,并以信用评分的信息熵动态调整各个滑动窗口内的评分周期个数,结合艾宾浩斯遗忘曲线基于评价周期距离调节遗忘权重,从而实现一种基于时变权重动态预测的电力用户信用评价方法,不仅对用电历史数据充足的已有样本数据进行信用评价预测,而且对没有或者只有少量用电历史数据的新入网终端样本进行信用评价预测。
实施例一
本实施例公开了一种基于时变权重动态组合的电力用户信用评价方法,实现对电力新、老用户的信用评价与预测,具体包括以下步骤:
步骤1:采集用户信息和相应的历史用电信息。
具体地,所述用户信息和历史用电信息的采集方式为:基于用电信息采集系统和营销业务应用系统,采用接口+中间件抽取电力用户终端样本的历史用电信息、初始注册信息和缴费信息,生成用户用电历史数据表、用户初始注册信息、缴费信息表、窃电案件信息表、违约用电窃电信息表,并存储于生成数据库。本实施例的实验数据来自2017年03月01日到2018 年02年28日期间,国网某电力公司的某一地市的电力用户数据。
步骤2:对历史用电信息进行数据预处理。
对每一用户电力终端所采集到的历史用电信息,均进行数据预处理。所述数据预处理包括数据补全、异常值剔除和归一化,具体地,步骤2包括:
步骤2.1:通过电压等级对用户进行用电等级分类后,对历史用电信息利用scikit-learn预处理模型中的inputer类以同类众数补全样本缺失数据;用电电压通常包括220V、380V和10000V 3类,不同电压的用户历史用电数据差别很大,故在数据预处理阶段需对不同电压等级的样本进行分类。
步骤2.2:对样本各类指标数据进行密度聚类并计算聚类中心距离,判定中心距离超过三倍标准差的样本指标值为异常值,以同类众数替换异常值;
步骤2.3:针对不同评价指标具有不同的量纲和量纲单位,采用最大- 最小值归一化方法,使指标数据处于同一数量级;
步骤3:筛选信用评价指标。
基于数据预处理后的电力用户终端样本,通过专家打分得到部分样本的信用评分,采用互信息计算样本各类指标与信用评分的相关度,并进行排序,设定筛选阈值提取信用评价指标如下:
表1信用评价指标说明
步骤4:提取每一用电用户的信用评价指标数据,计算信用评分;具体地,该步骤包括两方面的内容:老用户信用评分计算和新用户信用评分计算,本实施例中,将入电网1年以内的用户认为是新用户。
(1)老用户信用评分计算具体包括:
针对历史样本数据,提取其信用评价指标数据,采用熵权法计算每一项评价指标的权重,由于指标熵值与指标数据离散程度呈正比,故低指标值赋值综合评价的权重值高,由此计算得每一例样本的信用评分。
A、对于每一个样本,计算每一项指标值占该指标的比重。第j项指标下第i个样本值占该指标的比重计算方法为:
其中,j表示指标,i表示样本,xij表示第i个用户的第j个指标分值,n表示样本数量。
B、基于每一指标值占相应指标的比重,计算各指标的熵值,熵值代表该指标可提供的有效信息量的大小。熵值最大为1,代表该指标各数据取值相同,第j项指标的熵值计算方法为:
其中,满足ej≥0,m为指标数量;
C、基于熵值确定各指标的权重。第j项指标的权重计算方法为:
指标的权重越大,说明该指标在信用评价过程中区分度越高;
D、利用得到的指标权重计算各样本的综合得分s:
si作为样本i的信用评分。
本实施例计算得到的5个指标的权重示例如下表所示:
表2利用熵权法计算得到的部分指标权重
上表中各项数值分别表示以下指标的数据:累计欠费次数、欠费金额、累计窃电次数、电费缴纳及时率、用电检查配合,由表可以看出,累计窃电次数的权重最大,电费缴纳及时率和用电检查配合的权重相同且最低,最终得到的部分历史样本的信用评分如图2所示。
(2)新用户信用评分计算具体包括:
新入电网终端样本的信用评估,由于新样本初始没有用电数据且短时间内只有少量历史用电数据,无法基于充分的用电数据计算其信用评分,因此采用新样本的初始注册信息结合有限的用电数据动态变化趋势,以新老样本相似匹配的方式将新样本进行信用评分动态归类。
A、构建样本相似匹配指标集,由于新入电网终端样本没有或者只有少量历史数据,更多的评价信息来源于样本初始注册信息,故基于初始注册信息作为样本相似匹配指标;
表3初始注册信息指标详情
B、基于样本相似匹配指标的分类,针对初始信息,采用广义Jaccard 系数,计算新入电网终端样本与历史终端样本初始注册信息,即样本哑变量的相似度EJ(A,B),基于相似度将新入电网终端样本进行归类。所述样本哑变量的相似度EJ(A,B)计算方法为:
其中,A为待评价的新入电网终端样本,B为具有信用评分的历史样本, |A∩B|为样本A与样本B的哑变量指标取值相同的个数,|A∪B|为样本A与样本B的哑变量指标取值并集的个数,由于样本初始注册信息是符号度量,而Jaccard相关系数可基于哑变量值计算样本件的相似度,从而将新入网终端样本归入EJ(A,B)=1的样本集,并以该类的信用评分众数作为新样本的初始信用评分。本实施例采用18976例作为历史样本训练集,将新入网终端样本归入EJ(A,B)=1的样本集,并以该类的信用评分众数作为新样本的初始信用评分;
C、对于每个类别,基于类别内老用户信用评价指标和新用户有限用电数据,提取新用户样本指标值其中,新样本无数据的采集指标项分值为满分,其同类老用户历史样本指标集合为采用欧氏距离计算新样本与历史样本的匹配度;
基于获取的新样本与同类历史样本的相似度,对相似度进行排序,选出 K个相似性最高的历史样本,选取K个历史样本中出现频率最高的信用评分作为新样本的信用评分,并将前K个历史样本的历史指标数据均值作为新样本的历史指标数据,最终得到待评价的新样本与同类历史样本的信用相似度如下所示:
表4用户最终相似度
步骤5:设定信用评价周期t,纵向时间T个评价周期为一个滑动窗口,基于信用评分信息熵进行滑动窗口动态调整,采用滑动窗口方法更新样本指标数据。
其中,12表示12个评价周期,一个评价周期为1个月,hi为12个评价周期内的信用评分si的熵值,公式如(1)(2)所示,即根据一年内的信用熵值,确定滑动窗口的大小,在0.99999≤hi≤1时,每个评价周期的信用评分趋势稳定,故为减少计算机内存消耗,提高运算效率,故降低样本i的滑动窗口大小,而在信用熵值变化较大时,表示评分多变性较高,故提高滑动窗口大小,从而可基于更多历史评分实现信用预测。
表5基于信用评分信息熵确定的信用评价周期个数示例
步骤6:所述滑动窗口随时间滑动,每次滑动一个评价周期的距离,淘汰一个旧的评价周期指标集数据,纳入一个新的评价周期指标集数据;每次滑动后,均根据距当前时刻的时间长短,更新各评价周期的信用评分权重
其中,ω为基于艾宾浩斯遗忘曲线获取的权重调节遗忘值,为其遗忘值归一化后的权重系数,|ti|为评价周期距离,即为评价周期ti距当前时刻的周期间隔个数,从而在历史信用评价的基础上,实现对新样本与历史样本的信用更新。
步骤7:基于动态权重组合的信用评分预测,基于滑动窗口内包含的评价周期获取的样本信用评价分值,以滑动窗口内各周期的信用评分对样本下一评价周期的信用趋势加以预测Si:
其中,αT为基于评价周期个数T的参数调节因子。
步骤9:将样本信用评分预测结果与实际信用评分进行对比,从而以高斯分布的误差反馈调节参数αT,不断与H进行迭代优化,从而完成信用评分预测模型的构建,并以卡方检验验证该模型的预测结果与实际结果的拟合度为98.56%。
实施例二
本实施例的目的是基于实施例一所述方法,提供一种基于时变权重动态组合的电力用户信用评价系统,包括:
数据获取模块,接收用户信息和相应的历史用电信息;
数据预处理模块,对每个用户相应的历史用电信息进行数据预处理;
信用评价指标筛选模块,基于历史用电信息中的评价指标筛选信用评价指标;
信用评分计算模块,提取历史用电信息中的信用评价指标数据,计算每个用户的信用评分;
评价周期和滑动窗口的设定模块,接收评价周期和滑动窗口的设定,所述滑动窗口的大小为评价周期的整数倍;
信用评分预测模块,所述滑动窗口随时间滑动,每次滑动一个评价周期的距离,每次滑动后,均根据距当前时刻的时间长短,更新当前滑动窗口内各评价周期的信用评分权重;基于当前滑动窗口内的历史信用评分和信用评分权重,对下一评价周期内的信用评分进行预测。
实施例三
本实施例的目的是基于实施例一所述方法,提供一种计算装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现:
接收用户信息和相应的历史用电信息;
对每个用户相应的历史用电信息进行数据预处理;
基于历史用电信息中的评价指标筛选信用评价指标;
提取历史用电信息中的信用评价指标数据,计算每个用户的信用评分;
接收评价周期和滑动窗口的设定,所述滑动窗口的大小为评价周期的整数倍;
所述滑动窗口随时间滑动,每次滑动一个评价周期的距离,每次滑动后,均根据距当前时刻的时间长短,更新当前滑动窗口内各评价周期的信用评分权重;基于当前滑动窗口内的历史信用评分和信用评分权重,对下一评价周期内的信用评分进行预测。
实施例三
本实施例的目的是提供一种计算机可读存储介质。
一种计算机可读存储介质,其上存储有计算机程序,用于指纹图谱相似度计算,该程序被处理器执行时实现:
接收用户信息和相应的历史用电信息;
对每个用户相应的历史用电信息进行数据预处理;
基于历史用电信息中的评价指标筛选信用评价指标;
提取历史用电信息中的信用评价指标数据,计算每个用户的信用评分;
接收评价周期和滑动窗口的设定,所述滑动窗口的大小为评价周期的整数倍;
所述滑动窗口随时间滑动,每次滑动一个评价周期的距离,每次滑动后,均根据距当前时刻的时间长短,更新当前滑动窗口内各评价周期的信用评分权重;基于当前滑动窗口内的历史信用评分和信用评分权重,对下一评价周期内的信用评分进行预测。
以上实施例二、三和四中涉及的各步骤与方法实施例一相对应,具体实施方式可参见实施例一的相关说明部分。术语“计算机可读存储介质”应该理解为包括一个或多个指令集的单个介质或多个介质;还应当被理解为包括任何介质,所述任何介质能够存储、编码或承载用于由处理器执行的指令集并使处理器执行本发明中的任一方法。
以上一个或多个实施例具有以下技术效果:
基于信息熵实现了信用预测的双向组合调整,一方面基于熵权法设定信用评分指标权重,通过纵向维度计算不同用户历史指标值的复杂度,以信息熵计算每类指标的权重值,从而挖掘不同指标对信用评分的贡献度;另一方面,基于信息熵动态设定滑动窗口时长,通过横向维度计算单用户历次信用评估分值的信息熵,从而以信息熵度量历史评分的不确定性,并以信用评分熵值调整滑动窗口内评价周期个数,对于信用评分稳定的样本,设定少量评价周期,从而减少计算机内存开销,提高计算效率,对于信用评分不稳定样本,通过增加其评价周期,从而结合历史评价分值实现对信用评分的预测;
基于历史样本数据实现了新入网用户的信用评估,首先采用Jaccard系数计算新入网用户与老用户历史样本的哑变量相似度,从而实现新入网用户的类别划分,实现基于用电属性、基本信息和地域信息的归类;随后,基于短期内少量评价周期采集数据,以欧式距离求相似度匹配同类老用户历史样本数据,基于相似度高的老用户的信用评分估计新用户信用评分,一方面可大概率的保证新入网用户的信用评分的可靠性,另一方面新入网用户可滑动自适应本发明的信用评分方法,保证预测方法的泛化性;
基于滑动窗口的历史数据更新,以信用评分信息熵确定的评价周期的个数作为滑动窗口,并在新的评价周期信用评分数据进入时,时间距离最远的评价周期数据滑出窗口,从而在保证历史评价数据充分的前提下,不断更新历史评价数据,并在信用评分阶段,结合艾宾浩斯遗忘曲线对滑动窗口内的各评价周期设置权重,即保证最新样本采集数据的高占比趋势预测性,又基于历史数据实现信用趋势预测的稳定性,从而提高整体信用评分预测准确度。
本领域技术人员应该明白,上述本发明的各模块或各步骤可以用通用的计算机装置来实现,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。本发明不限制于任何特定的硬件和软件的结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。
Claims (10)
1.一种基于时变权重动态组合的电力用户信用评价方法,其特征在于,包括以下步骤:
接收用户信息和相应的历史用电信息;
提取历史用电信息中的信用评价指标数据,计算每个用户的信用评分;
接收评价周期和滑动窗口的设定,所述滑动窗口的大小为评价周期的整数倍;
所述滑动窗口随时间滑动,每次滑动一个评价周期的距离,每次滑动后,均根据距当前时刻的时间长短,更新当前滑动窗口内各评价周期的信用评分权重;
基于当前滑动窗口内的历史信用评分和信用评分权重,对下一评价周期内的信用评分进行预测。
2.如权利要求1所述的一种基于时变权重动态组合的电力用户信用评价方法,其特征在于,采集用户信息和相应的历史用电信息后,还对每个用户相应的历史用电信息进行数据预处理,包括:
根据用电电压等级对历史用电信息进行用电等级分类;
对历史用电信息中的缺失数据,采用相同用电等级内的众数补全;
通过对各类指标数据进行聚类确定异常值,采用相同用电等级相同指标的众数替换异常值;
对各类指标数据进行归一化处理。
3.如权利要求2所述的一种基于时变权重动态组合的电力用户信用评价方法,其特征在于,数据预处理后还进行信用评价指标筛选,包括:
获取针对部分用户的历史专家信用评分;
将该部分用户相应的各评价指标数据分别与历史专家信用评分进行相关度评价,基于相关度阈值筛选信用评价指标。
4.如权利要求1所述的一种基于时变权重动态组合的电力用户信用评价方法,其特征在于,基于入电网的时间长短划分新老用户,计算一个老用户的信用评分包括以下步骤:
计算每一项信用评价指标的值占该指标的比重;
计算每一项信用评价指标的信息熵;
基于熵值确定各信用评价指标的权重;
根据得到的权重计算该老用户的综合得分;
计算一个新用户的信用评分包括以下步骤:
将所述新用户和老用户的用户信息采用广义Jaccard系数进行相似度计算,基于相似度对所述新用户进行归类;
基于欧氏距离计算所述新用户和老用户的信用评价指标值的相似度,并获取相似度最高的多个老用户;
将所述多个老用户中频率最高的信用评分作为所述新用户的信用评分,并采用所述多个老用户的各信用评价指标值的均值更新所述新用户的历史用电信息。
5.如权利要求1所述的一种基于时变权重动态组合的电力用户信用评价方法,其特征在于,还根据滑动窗口内各评价周期的信用评分的信息熵调整所述滑动窗口的大小。
6.如权利要求1所述的一种基于时变权重动态组合的电力用户信用评价方法,其特征在于,更新当前滑动窗口内各评价周期的信用评分权重为:
其中,ωi为用户i基于艾宾浩斯遗忘曲线获取的权重调节遗忘值,为其遗忘值归一化后的权重系数,|ti|为待更新评价周期距当前时刻的间隔评价周期个数。
7.如权利要求6所述的一种基于时变权重动态组合的电力用户信用评价方法,其特征在于,下一评价周期内的信用评分的预测值为:
其中,Si为用户i下一评价周期内的信用评分,T为移动窗口内评价周期的个数,αT为基于参数调节因子,sik为用户i第k个评价周期的信用评分。
8.一种基于时变权重动态组合的电力用户信用评价系统,其特征在于,包括:
数据获取模块,接收用户信息和相应的历史用电信息;
信用评分计算模块,提取历史用电信息中的信用评价指标数据,计算每个用户的信用评分;
评价周期和滑动窗口的设定模块,接收评价周期和滑动窗口的设定,所述滑动窗口的大小为评价周期的整数倍;
信用评分预测模块,所述滑动窗口随时间滑动,每次滑动一个评价周期的距离,每次滑动后,均根据距当前时刻的时间长短,更新当前滑动窗口内各评价周期的信用评分权重;基于当前滑动窗口内的历史信用评分和信用评分权重,对下一评价周期内的信用评分进行预测。
9.一种计算装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-7任一项所述的基于时变权重动态组合的电力用户信用评价方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7任一项所述的基于时变权重动态组合的电力用户信用评价方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910324774.2A CN110119948B (zh) | 2019-04-22 | 2019-04-22 | 基于时变权重动态组合的电力用户信用评价方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910324774.2A CN110119948B (zh) | 2019-04-22 | 2019-04-22 | 基于时变权重动态组合的电力用户信用评价方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110119948A true CN110119948A (zh) | 2019-08-13 |
CN110119948B CN110119948B (zh) | 2020-12-08 |
Family
ID=67521328
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910324774.2A Active CN110119948B (zh) | 2019-04-22 | 2019-04-22 | 基于时变权重动态组合的电力用户信用评价方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110119948B (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110600093A (zh) * | 2019-08-16 | 2019-12-20 | 东莞市康助医疗科技有限公司 | 一种健康管理方法、系统、终端设备及存储介质 |
CN111461524A (zh) * | 2020-03-30 | 2020-07-28 | 上海交通大学 | 司法辅助机构信誉评价方法、系统、设备及存储介质 |
CN111784080A (zh) * | 2020-07-28 | 2020-10-16 | 南方电网能源发展研究院有限责任公司 | 售电公司客户信用预测方法、装置、设备及存储介质 |
CN112132722A (zh) * | 2020-08-20 | 2020-12-25 | 彭涛 | 政务热线数量趋势异常确定方法、装置、电子设备及介质 |
CN113660237A (zh) * | 2021-08-10 | 2021-11-16 | 和中通信科技有限公司 | 一种基于动态滑动窗口的工业互联网数据流异常检测方法、存储器和处理器 |
CN115496553A (zh) * | 2022-09-20 | 2022-12-20 | 青岛畅联科技有限公司 | 边缘计算下基于可信计算的用户信用评价系统及方法 |
CN118364005A (zh) * | 2024-04-19 | 2024-07-19 | 南京财经大学 | 一种时间序列数据挖掘方法和系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120054023A1 (en) * | 2010-08-25 | 2012-03-01 | Yang Pan | Delivering Highly Targeted Advertisements Based on a Credit System |
CN106226699A (zh) * | 2016-07-11 | 2016-12-14 | 北京航空航天大学 | 一种基于时变权重最优匹配相似性的锂离子电池寿命预测方法 |
CN106504125A (zh) * | 2016-12-27 | 2017-03-15 | 北京中电普华信息技术有限公司 | 一种构建电力客户综合评价体系的方法及装置 |
CN107133822A (zh) * | 2017-04-28 | 2017-09-05 | 国网山东省电力公司泰安供电公司 | 用户信用评价方法及装置 |
CN108647849A (zh) * | 2018-03-29 | 2018-10-12 | 安徽电力交易中心有限公司 | 一种基于灰色关联度的分布式电源电力客户信用评价方法 |
-
2019
- 2019-04-22 CN CN201910324774.2A patent/CN110119948B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120054023A1 (en) * | 2010-08-25 | 2012-03-01 | Yang Pan | Delivering Highly Targeted Advertisements Based on a Credit System |
CN106226699A (zh) * | 2016-07-11 | 2016-12-14 | 北京航空航天大学 | 一种基于时变权重最优匹配相似性的锂离子电池寿命预测方法 |
CN106504125A (zh) * | 2016-12-27 | 2017-03-15 | 北京中电普华信息技术有限公司 | 一种构建电力客户综合评价体系的方法及装置 |
CN107133822A (zh) * | 2017-04-28 | 2017-09-05 | 国网山东省电力公司泰安供电公司 | 用户信用评价方法及装置 |
CN108647849A (zh) * | 2018-03-29 | 2018-10-12 | 安徽电力交易中心有限公司 | 一种基于灰色关联度的分布式电源电力客户信用评价方法 |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110600093A (zh) * | 2019-08-16 | 2019-12-20 | 东莞市康助医疗科技有限公司 | 一种健康管理方法、系统、终端设备及存储介质 |
CN111461524A (zh) * | 2020-03-30 | 2020-07-28 | 上海交通大学 | 司法辅助机构信誉评价方法、系统、设备及存储介质 |
CN111784080A (zh) * | 2020-07-28 | 2020-10-16 | 南方电网能源发展研究院有限责任公司 | 售电公司客户信用预测方法、装置、设备及存储介质 |
CN112132722A (zh) * | 2020-08-20 | 2020-12-25 | 彭涛 | 政务热线数量趋势异常确定方法、装置、电子设备及介质 |
CN112132722B (zh) * | 2020-08-20 | 2023-12-26 | 彭涛 | 政务热线数量趋势异常确定方法、装置、电子设备及介质 |
CN113660237A (zh) * | 2021-08-10 | 2021-11-16 | 和中通信科技有限公司 | 一种基于动态滑动窗口的工业互联网数据流异常检测方法、存储器和处理器 |
CN115496553A (zh) * | 2022-09-20 | 2022-12-20 | 青岛畅联科技有限公司 | 边缘计算下基于可信计算的用户信用评价系统及方法 |
CN115496553B (zh) * | 2022-09-20 | 2023-10-17 | 青岛畅联科技有限公司 | 边缘计算下基于可信计算的用户信用评价系统及方法 |
CN118364005A (zh) * | 2024-04-19 | 2024-07-19 | 南京财经大学 | 一种时间序列数据挖掘方法和系统 |
Also Published As
Publication number | Publication date |
---|---|
CN110119948B (zh) | 2020-12-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110119948B (zh) | 基于时变权重动态组合的电力用户信用评价方法及系统 | |
CN107766929B (zh) | 模型分析方法及装置 | |
CN108399453A (zh) | 一种电力客户信用等级评价方法和装置 | |
CN110852856A (zh) | 一种基于动态网络表征的发票虚开识别方法 | |
CN105184402B (zh) | 一种基于决策树的个性化用户短期负荷预测算法 | |
CN105225135B (zh) | 潜力客户识别方法以及装置 | |
CN108460486A (zh) | 一种基于改进聚类算法和神经网络的电压偏差预测方法 | |
TW202133080A (zh) | 資源資訊推送方法、裝置、伺服器及存儲介質 | |
CN112418476A (zh) | 一种超短期电力负荷预测方法 | |
CN108154311A (zh) | 基于随机森林和决策树的优质客户识别方法及装置 | |
CN114004654A (zh) | 基于大数据分析的互联网卡用户画像构建方法及系统 | |
CN104850868A (zh) | 一种基于k-means和神经网络聚类的客户细分方法 | |
CN111061948A (zh) | 一种用户标签推荐方法、装置、计算机设备及存储介质 | |
CN111221868A (zh) | 一种应用于电力客户渠道偏好的数据挖掘与分析方法 | |
CN116823496A (zh) | 基于人工智能的智能保险风险评估和定价系统 | |
CN114519651A (zh) | 基于电力大数据的智能配电方法 | |
CN117455529A (zh) | 基于大数据技术的用户用电特征画像构建方法及系统 | |
CN112200209A (zh) | 一种基于日差分用电量的贫困用户识别方法 | |
CN113392920B (zh) | 生成作弊预测模型的方法、装置、设备、介质及程序产品 | |
CN117952740A (zh) | 一种客户的资源量处理策略的确定方法、装置、服务器 | |
Majidpour | Time series prediction for electric vehicle charging load and solar power generation in the context of smart grid | |
CN117131460A (zh) | 一种电信欺诈账户识别模型训练方法、装置、设备及介质 | |
CN111915116A (zh) | 一种基于K-means聚类的电力居民用户分类方法 | |
CN115689708A (zh) | 训练数据的筛选方法、风险评估方法、装置、设备和介质 | |
CN114676931A (zh) | 一种基于数据中台技术的电量预测系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |