CN110298574B - 一种基于卷积神经网络的用电用户缴费风险评级方法 - Google Patents
一种基于卷积神经网络的用电用户缴费风险评级方法 Download PDFInfo
- Publication number
- CN110298574B CN110298574B CN201910539995.1A CN201910539995A CN110298574B CN 110298574 B CN110298574 B CN 110298574B CN 201910539995 A CN201910539995 A CN 201910539995A CN 110298574 B CN110298574 B CN 110298574B
- Authority
- CN
- China
- Prior art keywords
- neural network
- network model
- convolutional neural
- user
- risk
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000013527 convolutional neural network Methods 0.000 title claims abstract description 70
- 238000000034 method Methods 0.000 title claims abstract description 42
- 230000005611 electricity Effects 0.000 title claims abstract description 39
- 239000002245 particle Substances 0.000 claims abstract description 49
- 238000012549 training Methods 0.000 claims abstract description 31
- 239000011159 matrix material Substances 0.000 claims abstract description 24
- 238000012360 testing method Methods 0.000 claims abstract description 20
- 239000013598 vector Substances 0.000 claims abstract description 20
- 230000006870 function Effects 0.000 claims description 10
- 238000013528 artificial neural network Methods 0.000 claims description 8
- 210000002569 neuron Anatomy 0.000 claims description 7
- 230000004913 activation Effects 0.000 claims description 3
- 238000013507 mapping Methods 0.000 claims description 3
- 230000007704 transition Effects 0.000 claims description 3
- 238000007726 management method Methods 0.000 description 16
- 230000006399 behavior Effects 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000011084 recovery Methods 0.000 description 4
- 230000002159 abnormal effect Effects 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000007405 data analysis Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013523 data management Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/004—Artificial life, i.e. computing arrangements simulating life
- G06N3/006—Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0609—Buyer or seller confidence or verification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Strategic Management (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- Health & Medical Sciences (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Human Resources & Organizations (AREA)
- Data Mining & Analysis (AREA)
- General Business, Economics & Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Tourism & Hospitality (AREA)
- Game Theory and Decision Science (AREA)
- Primary Health Care (AREA)
- Water Supply & Treatment (AREA)
- Public Health (AREA)
- Educational Administration (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明的一种基于卷积神经网络的用电用户缴费风险评级方法,包括如下步骤:选取用户的多种电网数据构成用户评级影响因素向量,由多个用户所对应的多组评级影响因素向量构成待评估用户矩阵,将待评估用户矩阵的集合划分为训练集和测试集;设定用户评级规则,划分用户风险等级;建立卷积神经网络模型,将训练集输入到卷积神经网络模型,对卷积神经网络模型进行训练;将测试集输入到训练好的卷积神经网络模型进行评级,获得对测试集中每个用户的初步评级结果;采用粒子群算法对测试集进行聚类,以对初步评级结果验证,若粒子群算法求解的评级结果和卷积神经网络模型获得初步评级结果相同,则将初步评级结果作为最终评级结果输出。
Description
技术领域
本发明属于人工智能技术领域,涉及一种基于卷积神经网络的用电用户缴费风险评级方法。
背景技术
随着信息化程度的不断提高,大数据时代已经到来,从大量价值密度较低的数据中挖掘出有价值的信息,已经成为各行各业密切关注的热点问题。对于电力行业来说,随着电力系统信息化程度的不断提高和配用电数据量的迅速增长,各类装置及系统都有大量的数据要处理,数据规模庞大,蕴含的事件信息种类繁多,但是到目前为止,仍然面临“数据海量,信息匮乏”的重要问题。同时,由于多种通信故障、设备故障、电网波动以及用户异常用电行为等原因,出现了大量数据异常的现象。这些异常数据影响了电能数据的准确性、完备性、自洽性和动态性,但也蕴藏了电网的重要事件信息。
电力企业的生产经营活动中存在各种风险,而对风险的管理一直是众多企业所关心的重点问题,风险管理的效果直接影响到企业的成本及经营利润。电力企业是比较典型的资产密集型产业,电力设备种类较多,资产数量多、金额大、技术发展快,资产管理面临的风险比较广泛、涉及范围复杂。电费回收,作为供电企业的生命线,不仅关乎保护国家财产和企业利益的问题,而且如若得不到重视、关注或处理不当,极有可能造成一个地区的电力发展受损和不特定电力用户利益受损等情况。因此,供电企业对电费回收都极其重视,电费回收风险也是供电企业风险的重要组成部分。可以说,风险管理一直是电力企业运营中的重点工作。随着企业的不断壮大,企业间竞争的日益激烈,原先以投资生产拉动的企业,因不太重视风险管理问题而导致的利润降低亦变得更为明显。
在大数据背景下,供电企业治理的理念、机制、模式需要全新变革,稳步推进用数据决策、数据管理的理念对供电企业数据进行统筹管理显得尤为重要。传统简单粗放的服务管理模式越来越不能适应供电企业的发展,迫切需要运用大数据系统,提升服务管理的精细化水平。电力行业数据量大、类型多,对于电力企业盈利与管理水平的提升有很高的价值,通过基于电力营销大数据的用电客户异常用电行为以及缴费风险评级与风险预警,建立数据分析挖掘结果与业务应用之间的桥梁,具备对客户更深层次、全维度的了解,提升差异化管理水平。
用电客户电费风险评级是目前供电企业电费回收风险管理中识别用电客户电费风险的普遍做法,具体方法是:参照金融行业信用评级的方式建立用电客户电费风险评级模型,用于评估用电客户是否存在电费风险以及风险的高低程度(以不同级别表示),并以此为依据制定对应的处置措施。建立一个科学、实用、精确的评级模型是开展评级工作的基础。一般而言,一个数学模型的建立需要大量的数据积累,并运用专业工具进行数据挖掘和分析,最终用准确的数据语言进行表达。
发明内容
本发明的目的是提供一种基于卷积神经网络的用电用户缴费风险评级方法,以实现对用电客户进行等级的分类,从而识别出哪些是存在风险的用户,以及评出风险程度的大小,对电网的风险的经营和管理更加有序的进行。
本发明提供一种基于卷积神经网络的用电用户缴费风险评级方法,包括如下步骤:
步骤1:选取用户的多种电网数据构成用户评级影响因素向量,由多个用户所对应的多组评级影响因素向量构成待评估用户矩阵,将待评估用户矩阵的集合划分为训练集和测试集;
步骤2:设定用户评级规则,划分用户风险等级;
步骤3:建立卷积神经网络模型,将训练集输入到卷积神经网络模型,对卷积神经网络模型进行训练;
步骤4:将测试集输入到训练好的卷积神经网络模型进行评级,获得对测试集中每个用户的初步评级结果;
步骤5:采用粒子群算法对测试集进行聚类,以对初步评级结果验证,若粒子群算法求解的评级结果和卷积神经网络模型获得初步评级结果相同,则将初步评级结果作为最终评级结果输出。
在本发明的基于卷积神经网络的用电用户缴费风险评级方法中,所述步骤1中的电网数据包括:用电量、实收金额、欠费金额、应收金额、违约金额、电费上缴率、缴费及时率、缴费次数、缴费金额、经营状况和催缴次数;
在本发明的基于卷积神经网络的用电用户缴费风险评级方法中,所述步骤2具体为:
风险等级从高到低分别划分为A级:极高风险、B级:高风险、C级:一般风险、D级:低风险、E级:极低风险;对应的阈值分别为A级为80-100分、B级为60-79分、C级为35-59分、D级为21-34分、E级20为分及以下。
在本发明的基于卷积神经网络的用电用户缴费风险评级方法中,所述步骤3包括:
步骤3.1:对卷积神经网络模型的权值进行初始化,各层的权值初始值均设为零,并设置网络模型的训练参数,包括学习效率、权值衰减系数;
步骤3.2:将训练集作为卷积神经网络模型的输入,基于用户缴费历史数据和专家经验对训练集的用户缴费风险进行分级得到的评级结果,作为期望的输出目标值;
步骤3.3:求出隐含层和输出层的实际输出值;
步骤3.4:计算网络模型中每层的实际输出值和目标输出值的偏差,并将网络模型中各层的偏差进行累加,获得网络模型的最终实际误差;
步骤3.5:计算网络模型的期望平方误差,当最终实际误差小于期望平方误差时,结束网络模型训练,并保存训练好的网络模型;
步骤3.6:当最终实际误差大于期望平方误差时,将误差传回网络模型中,依次求得全连接层,下采样层,卷积层的误差;
步骤3.7:计算网络模型的梯度误差,利用梯度误差对网络各层的权值进行更新,将更新后的权值带入到网络模型,直到最终实际误差小于期望平方误差时,完成卷积神经网络模型的训练。
在本发明的基于卷积神经网络的用电用户缴费风险评级方法中,所述步骤3.4中根据下式计算各层的实际输出值和目标输出值的偏差:
其中,δ(l+1)为网络模型的第l层的一个特征映射的误差项,即实际输出值和目标输出值的偏差,ω(l+1,k)为第l层的权值,k表示第k个特征映射,Zl为构成卷积神经网络模型的第l层的内部转态,f()为卷积神经网络模型的映射函数,up()为上采样函数。
在本发明的基于卷积神经网络的用电用户缴费风险评级方法中,所述步骤3.5中根据下式计算网络模型的期望平方误差:
其中,M是输入用户的总数,表示第m个用户对应的第k个影响因素;可以用激活函数f(x)求得,βj是第j个输出层神经元的输入值,θj是第j个输出层神经元的阈值;表示第m个用电客户在神经元网络中对应的第k个输出可以直接得到。
在本发明的基于卷积神经网络的用电用户缴费风险评级方法中,所述步骤3.7中根据下面公式计算网络模型的梯度误差和更新的权值:
ωij *=ωij+Δωij
其中,η是学习效率,ωij *更新的权值,ωij为原权值。
在本发明的基于卷积神经网络的用电用户缴费风险评级方法中,所述步骤5包括:
步骤5.1:初始化粒子群,将测试集中的每个用户评级影响因素向量作为一个粒子,设置聚类的数目等于风险等级的数目,设置粒子数目;
步骤5.2:计算聚类的中心和每个粒子的适应度;
步骤5.3:将每个粒子的当前位置的适应度与本身最优位置的适应度进行比较,如果当前位置的适应度大于最优位置的适应度,则将当前位置作为个体最优位置;
步骤5.4:将每个粒子的个体最优位置的适应度与全局最优位置的适应度进行比较,如果某粒子的个体最优位置的适应度大于全局最优位置的适应度,则将该粒子的个体最优位置作为全局最优位置;
步骤5.5:根据个体最优位置和全局最优位置更新粒子群的惯性权重,当达到最大迭代次数或者满足算法要求时条件终止;
步骤5.6:再次计算新的聚类中心。
在本发明的基于卷积神经网络的用电用户缴费风险评级方法中,所述步骤5.2中根据下列公式计算聚类的中心:
根据下式计算粒子适应度:
其中,F全代表全局所经过的最优位置的适应度,公式中ωij是一个S×S的加权矩阵,矩阵元素只有0和1,当实验数据i属于类j时,加权矩阵元素取1,不属于即为0,Cij是相应的聚类中心算子,可计算出全局所经过的最优位置的适应度F。
在本发明的基于卷积神经网络的用电用户缴费风险评级方法中,所述步骤5.5中分别根据下列公式对惯性权重和粒子的位置进行更新:
其中,ωmax是权值的最大值,ωmin是权值的最小值,t为当前的迭代次数,T是最大的迭代次数,ω为惯性权重,c1,c2为学习因子,r1、r2为分布在[0,1]之间的随机数,pid为粒子的个体最优位置。当算法达到最大迭代次数或者满足算法要求时条件终止。
本发明可以实现对用电客户进行等级的分类,从而识别出哪些是存在风险的用户,以及评出风险程度的大小,对电网的风险的经营和管理更加有序的进行。该方法构建了一种针对CNN训练用户信任等级划分过程的CNN信任模型,使用该模型相对于传统的人工神经网络可以对设定好的卷积神经网络进行训练,能够较快的确定特定应用CNN算法中用户信任等级分类问题。为了保证分级的准确性,本发明采用基于粒子群聚类算法给予检验,可使得评级体系更加稳定,评级结果更加可靠。
附图说明
图1是本发明的一种基于卷积神经网络的用电用户缴费风险评级方法的流程图;
图2是卷积神经网络的训练过程的流程图;
图3是粒子群算法对初步评级结果验证的流程图。
具体实施方式
如图1所示,本发明的一种基于卷积神经网络的用电用户缴费风险评级方法,包括如下步骤:
步骤1:选取用户的多种电网数据构成用户评级影响因素向量,由多个用户所对应的多组评级影响因素向量构成待评估用户矩阵,将待评估用户矩阵的集合划分为训练集和测试集;
所述步骤1中的电网数据包括:用电量、实收金额、欠费金额、应收金额、违约金额、电费上缴率、缴费及时率、缴费次数、缴费金额、经营状况和催缴次数,其中:
用电量此处是采集用户一个月为周期的用电量,单位度;
实收金额此处是采集用户一个月为周期的缴费金额,单位元;
欠费金额此处是采集用户一个月为周期的缴费金额,单位元;
应收金额此处是采集用户一个月为周期的缴费金额,单位元;
违约金额此处是采集用户一个月为周期的违约金额,单位元;
电费上缴率,此处是用户一个月为周期的实际缴费金额与应缴金额的比值,无量纲;
缴费及时率是用户一年为周期的按规定时间内缴费次数与缴费总次数的比值,无量纲;
缴费次数此处是采集用户一个月为周期的缴费次数,单位度;
缴费金额此处是采集用户一个月为周期的缴费金额,单位度;
外加经营状况,此处若是经营良好则为1,不好为0,无量纲;
催缴次数,是指一年内被电网公司催缴费用的次数,单位次。
将多个电力系统和营销系统提供的电网数据,构成用户评级影响因素向量,具体表示为d为电网数据总数,本发明中采集11种电网数据,即d=11,为一个电网数据值,即一个评级影响因素;待评估用户矩阵表示为X={Xm|m=1,2,3...},每个电网数据的权值表示为ωij,以yi为输出的信任。
那么对电力用户某行为的信任程度可以表示为信任度yi。设zi为构成神经网络的某个神经元节点的内部状态,xi为输入信号,ωij表示从zi到zj连接的权值。则其形式化描述如下:信任节点的输入xi可以表示为对行为属性的测算值,而行为的每一个属性对于用户信任值的影响可以通过权值ωij来表现。
输入数据经过卷积层、下采样层、全连接层的向前传播得到输出值;利用卷积神经网络模型(Convolutional Neural Networks,CNN),从模型文件中选出代表用户信任关系的词向量。使得每个用户信息都变成多个词向量的集合,最终可以用一个矩阵来表示每个用电客户总的信息。
步骤2:设定用户评级规则,划分用户风险等级,其中风险等级从高到低分别划分为A级:极高风险、B级:高风险、C级:一般风险、D级:低风险、E级:极低风险;对应的阈值分别为A级为80-100分、B级为60-79分、C级为35-59分、D级为21-34分、E级20为分及以下。
步骤3:建立卷积神经网络模型,将训练集输入到卷积神经网络模型,对卷积神经网络模型进行训练,如图2所示为神经网络的训练流程图。训练过程包括如下步骤:
步骤3.1:对卷积神经网络模型的权值进行初始化,各层的权值初始值均设为零,并设置网络模型的训练参数,包括学习效率、权值衰减系数;
步骤3.2:将训练集作为卷积神经网络模型的输入,基于用户缴费历史数据和专家经验对训练集的用户缴费风险进行分级得到的评级结果,作为期望的输出目标值;
步骤3.3:求出隐含层和输出层的实际输出值;
步骤3.4:计算网络模型中每层的实际输出值和目标输出值的偏差,并将网络模型中各层的偏差进行累加,获得网络模型的最终实际误差;
具体实施时,根据下式计算各层的实际输出值和目标输出值的偏差:
其中,δ(l+1)为网络模型的第l层的一个特征映射的误差项,即实际输出值和目标输出值的偏差,ω(l+1,k)为第l层的权值,k表示第k个特征映射,Zl为构成卷积神经网络模型的第l层的内部转态,f()为卷积神经网络模型的映射函数,up()为上采样函数。
步骤3.5:计算网络模型的期望平方误差,当最终实际误差小于期望平方误差时,结束网络模型训练,并保存训练好的网络模型;
具体实施时,根据下式计算网络模型的期望平方误差:
其中,M是输入用户的总数,表示第m个用户对应的第k个影响因素;可以用激活函数f(x)求得,βj是第j个输出层神经元的输入值,θj是第j个输出层神经元的阈值;表示第m个用电客户在神经元网络中对应的第k个输出可以直接得到。
步骤3.6:当最终实际误差大于期望平方误差时,将误差传回网络模型中,依次求得全连接层,下采样层,卷积层的误差;
步骤3.7:计算网络模型的梯度误差,利用梯度误差对网络各层的权值进行更新,将更新后的权值带入到网络模型,直到最终实际误差小于期望平方误差时,完成卷积神经网络模型的训练。
具体实施时,根据下面公式计算网络模型的梯度误差和更新的权值:
ωij *=ωij+Δωij
其中,η是学习效率,ωij *更新的权值,ωij为原权值。
在寻找到神经网络的权值收敛点后,并通过求得每个不同等级样本所对应各节点信任值的平均值来获得样本各个信任等级节点的信任值,再利用卷积神经网络的学习功能,将权值收敛点作为一个评估点,一旦输入端有待分类的网络信任值输入时,经过一个由初始输入向稳态收敛的过程,网络中的权值系数就会确定,最终达到稳定状态后,网络信任等级就是所对应的风险分类等级。由于待评估用户矩阵的列数是可变动的,这里选取用户属性维度不超过11,这样,待评估用户矩阵的行数为11,设定用户属性维度不足11时,在矩阵中用零向量补齐。在神经网络模型中,评级影响因素的的维度是在模型学习时就设定好的,当得到评级影响模型后,根据训练特征的维度信息计算得到了各个评级影响因素,再根据两个词向量之间的余弦值大小来判断两个用户的相关程度。网络通过自学收敛到评估点,进而得到不同用电客户的风险等级。
步骤4:将测试集输入到训练好的卷积神经网络模型进行评级,获得对测试集中每个用户的初步评级结果;
步骤5:采用粒子群算法对测试集进行聚类,以对初步评级结果验证,若粒子群算法求解的评级结果和卷积神经网络模型获得初步评级结果相同,则将初步评级结果作为最终评级结果输出,如图3所示为粒子群算法聚类的流程,具体包括:
步骤5.1:初始化粒子群,将测试集中的每个用户评级影响因素向量作为一个粒子,设置聚类的数目等于风险等级的数目,设置粒子数目;
步骤5.2:计算聚类的中心和每个粒子的适应度;
具体实施时,根据下列公式计算聚类的中心:
其中,公式中ωij是一个S×S的加权矩阵,矩阵元素只有0和1,当实验数据i属于类j时,加权矩阵元素取1,不属于即为0。
根据下式计算粒子适应度:
其中,F全代表全局所经过的最优位置的适应度。
步骤5.3:将每个粒子的当前位置的适应度与本身最优位置的适应度进行比较,如果当前位置的适应度大于最优位置的适应度,则将当前位置作为个体最优位置;
步骤5.4:将每个粒子的个体最优位置的适应度与全局最优位置的适应度进行比较,如果某粒子的个体最优位置的适应度大于全局最优位置的适应度,则将该粒子的个体最优位置作为全局最优位置;
步骤5.5:根据个体最优位置和全局最优位置更新粒子群的惯性权重,当达到最大迭代次数或者满足算法要求时条件终止;
具体实施时,分别根据下列公式对惯性权重和粒子的位置进行更新:
其中,ωmax是权值的最大值,ωmin是权值的最小值,t为当前的迭代次数,T是最大的迭代次数,ω为惯性权重,c1,c2为学习因子,r1、r2为分布在[0,1]之间的随机数,pid为粒子的个体最优位置。当算法达到最大迭代次数或者满足算法要求时条件终止。
步骤5.6:再次计算新的聚类中心,新聚类中心为离聚类中心最近的粒子,表示为其中:i=1,2,…,n;j=1,2,…,k;n为样本总数,xi表示样本,zij表示第i个粒子的第j维(聚类中心);并通过调整聚类中心获得最优划分,如果多次扰动下聚类划分不变,则认为当前的聚类为最优聚类,则证明用神经网络判断得出的分级结果是符合要求的分级结果。
以上所述仅为本发明的较佳实施例,并不用以限制本发明的思想,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (9)
1.一种基于卷积神经网络的用电用户缴费风险评级方法,其特征在于,包括如下步骤:
步骤1:选取用户的多种电网数据构成用户评级影响因素向量,由多个用户所对应的多组评级影响因素向量构成待评估用户矩阵,将待评估用户矩阵的集合划分为训练集和测试集;
步骤2:设定用户评级规则,划分用户风险等级;
步骤3:建立卷积神经网络模型,将训练集输入到卷积神经网络模型,对卷积神经网络模型进行训练;
步骤4:将测试集输入到训练好的卷积神经网络模型进行评级,获得对测试集中每个用户的初步评级结果;
步骤5:采用粒子群算法对测试集进行聚类,以对初步评级结果验证,若粒子群算法求解的评级结果和卷积神经网络模型获得初步评级结果相同,则将初步评级结果作为最终评级结果输出;
所述步骤1中的电网数据包括:用电量、实收金额、欠费金额、应收金额、违约金额、电费上缴率、缴费及时率、缴费次数、缴费金额、经营状况和催缴次数;
2.如权利要求1所述的基于卷积神经网络的用电用户缴费风险评级方法,其特征在于,所述步骤2具体为:
风险等级从高到低分别划分为A级:极高风险、B级:高风险、C级:一般风险、D级:低风险、E级:极低风险;对应的阈值分别为A级为80-100分、B级为60-79分、C级为35-59分、D级为21-34分、E级为20分及以下。
3.如权利要求1所述的基于卷积神经网络的用电用户缴费风险评级方法,其特征在于,所述步骤3包括:
步骤3.1:对卷积神经网络模型的权值进行初始化,各层的权值初始值均设为零,并设置网络模型的训练参数,包括学习效率、权值衰减系数;
步骤3.2:将训练集作为卷积神经网络模型的输入,基于用户缴费历史数据和专家经验对训练集的用户缴费风险进行分级得到的评级结果,作为期望的输出目标值;
步骤3.3:求出隐含层和输出层的实际输出值;
步骤3.4:计算网络模型中每层的实际输出值和目标输出值的偏差,并将网络模型中各层的偏差进行累加,获得网络模型的最终实际误差;
步骤3.5:计算网络模型的期望平方误差,当最终实际误差小于期望平方误差时,结束网络模型训练,并保存训练好的网络模型;
步骤3.6:当最终实际误差大于期望平方误差时,将误差传回网络模型中,依次求得全连接层、下采样层、卷积层的误差;
步骤3.7:计算网络模型的梯度误差,利用梯度误差对网络各层的权值进行更新,将更新后的权值带入到网络模型,直到最终实际误差小于期望平方误差时,完成卷积神经网络模型的训练。
7.如权利要求1所述的基于卷积神经网络的用电用户缴费风险评级方法,其特征在于,所述步骤5包括:
步骤5.1:初始化粒子群,将测试集中的每个用户评级影响因素向量作为一个粒子,设置聚类的数目等于风险等级的数目,设置粒子数目;
步骤5.2:计算聚类的中心和每个粒子的适应度;
步骤5.3:将每个粒子的当前位置的适应度与本身最优位置的适应度进行比较,如果当前位置的适应度大于最优位置的适应度,则将当前位置作为个体最优位置;
步骤5.4:将每个粒子的个体最优位置的适应度与全局最优位置的适应度进行比较,如果某粒子的个体最优位置的适应度大于全局最优位置的适应度,则将该粒子的个体最优位置作为全局最优位置;
步骤5.5:根据个体最优位置和全局最优位置更新粒子群的惯性权重,当达到最大迭代次数或者满足算法要求时条件终止;
步骤5.6:再次计算新的聚类中心。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910539995.1A CN110298574B (zh) | 2019-06-21 | 2019-06-21 | 一种基于卷积神经网络的用电用户缴费风险评级方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910539995.1A CN110298574B (zh) | 2019-06-21 | 2019-06-21 | 一种基于卷积神经网络的用电用户缴费风险评级方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110298574A CN110298574A (zh) | 2019-10-01 |
CN110298574B true CN110298574B (zh) | 2023-06-13 |
Family
ID=68028310
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910539995.1A Active CN110298574B (zh) | 2019-06-21 | 2019-06-21 | 一种基于卷积神经网络的用电用户缴费风险评级方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110298574B (zh) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110852785B (zh) * | 2019-10-12 | 2023-11-21 | 中国平安人寿保险股份有限公司 | 用户分级方法、装置及计算机可读存储介质 |
CN111061151B (zh) * | 2019-11-21 | 2021-06-01 | 东北大学 | 一种基于多元卷积神经网络的分布式能源状态监测方法 |
CN112950239B (zh) * | 2019-11-26 | 2024-07-16 | 多点(深圳)数字科技有限公司 | 用于生成用户信息的方法、装置、设备和计算机可读介质 |
CN111461923A (zh) * | 2020-04-03 | 2020-07-28 | 国网山东省电力公司聊城供电公司 | 一种基于深度卷积神经网络的窃电监测系统和方法 |
CN112148355B (zh) * | 2020-10-21 | 2021-09-14 | 红石阳光(北京)科技股份有限公司 | 一种基于深度学习的系统差分升级方法及装置 |
CN112508684B (zh) * | 2020-12-04 | 2023-03-07 | 中信银行股份有限公司 | 一种基于联合卷积神经网络的催收风险评级方法及系统 |
CN112906765A (zh) * | 2021-02-01 | 2021-06-04 | 中国建设银行股份有限公司 | 一种基于rbf神经网络的客户洗钱风险等级划分方法及系统 |
CN113538125A (zh) * | 2021-06-29 | 2021-10-22 | 百维金科(上海)信息科技有限公司 | 一种基于萤火虫算法优化Hopfield神经网络的风险评级方法 |
CN115034608A (zh) * | 2022-06-09 | 2022-09-09 | 广东电网有限责任公司广州供电局 | 基于配网要素和神经网络的配网风险评估方法 |
CN116029555B (zh) * | 2023-03-22 | 2023-06-13 | 西南科技大学 | 基于轻量化神经网络的桥梁风险识别预警系统及应用方法 |
CN117973879B (zh) * | 2024-04-02 | 2024-07-19 | 国网山东省电力公司营销服务中心(计量中心) | 基于多源数据联合分析的电力缴费风险识别方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105260786A (zh) * | 2015-09-08 | 2016-01-20 | 哈尔滨工程大学 | 一种电力推进系统仿真可信度评估模型综合优化方法 |
CN105956682A (zh) * | 2016-04-19 | 2016-09-21 | 上海电力学院 | 基于bp神经网络与马尔可夫链的短期电价预测方法 |
CN106530073A (zh) * | 2016-09-12 | 2017-03-22 | 国网辽宁省电力有限公司鞍山供电公司 | 一种基于cart算法的分析用户信用等级的方法 |
CN107507076A (zh) * | 2017-09-26 | 2017-12-22 | 贵州电网有限责任公司 | 基于数据挖掘的电力客户的综合评级的方法 |
CN108399453A (zh) * | 2018-01-24 | 2018-08-14 | 国家电网公司 | 一种电力客户信用等级评价方法和装置 |
-
2019
- 2019-06-21 CN CN201910539995.1A patent/CN110298574B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105260786A (zh) * | 2015-09-08 | 2016-01-20 | 哈尔滨工程大学 | 一种电力推进系统仿真可信度评估模型综合优化方法 |
CN105956682A (zh) * | 2016-04-19 | 2016-09-21 | 上海电力学院 | 基于bp神经网络与马尔可夫链的短期电价预测方法 |
CN106530073A (zh) * | 2016-09-12 | 2017-03-22 | 国网辽宁省电力有限公司鞍山供电公司 | 一种基于cart算法的分析用户信用等级的方法 |
CN107507076A (zh) * | 2017-09-26 | 2017-12-22 | 贵州电网有限责任公司 | 基于数据挖掘的电力客户的综合评级的方法 |
CN108399453A (zh) * | 2018-01-24 | 2018-08-14 | 国家电网公司 | 一种电力客户信用等级评价方法和装置 |
Non-Patent Citations (3)
Title |
---|
基于缴费行为的用电客户细分研究;杜忠莲等;《智能电网》;20180621;第8卷(第3期);全文 * |
用电信息采集系统运行监控提升技术;张占清 等;《广东电力》;20161031;第29卷(第10期);全文 * |
电力客户细分及增值服务系统研究;卢海明;《中国优秀硕士学位论文全文数据库(经济与管理科学辑)》;20161015(第10期);第3章 * |
Also Published As
Publication number | Publication date |
---|---|
CN110298574A (zh) | 2019-10-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110298574B (zh) | 一种基于卷积神经网络的用电用户缴费风险评级方法 | |
US12112391B2 (en) | Methods and systems for machine-learning for prediction of grid carbon emissions | |
Massaferro et al. | Fraud detection in electric power distribution: An approach that maximizes the economic return | |
Mohamed et al. | History matching and uncertainty quantification: multiobjective particle swarm optimisation approach | |
CN109308571B (zh) | 配电线路线变关系检测方法 | |
CN116681187B (zh) | 一种基于企业经营数据的企业碳配额预测方法 | |
CN110544015A (zh) | 一种基于大数据分析的企业碳数据或碳资产智能管控平台 | |
Ahmed et al. | Energy theft detection in smart grids: Taxonomy, comparative analysis, challenges, and future research directions | |
Jeyaraj et al. | Computer‐assisted demand‐side energy management in residential smart grid employing novel pooling deep learning algorithm | |
CN115905319B (zh) | 一种海量用户电费异常的自动识别方法及系统 | |
CN109872252A (zh) | 一种基于matlab算法的电力供应商综合评价方法 | |
Du et al. | Applying deep convolutional neural network for fast security assessment with N-1 contingency | |
CN106600146A (zh) | 一种电费回收风险评价方法和装置 | |
CN117575328A (zh) | 一种基于图注意力神经网络的产业链风险评估方法及装置 | |
CN116911994B (zh) | 对外贸易风险预警系统 | |
CN114240069A (zh) | 一种基于回归学习与特征挖掘的电网在线风险计算方法 | |
CN110246024A (zh) | 违约指数评估方法 | |
Boyuan et al. | Scenario-based modeling and solving research on robust weapon project planning problems | |
Chaves et al. | Stochastic fuzzy neural network: case study of optimal reservoir operation | |
Jalalvand et al. | A multi-objective risk-averse workforce planning under uncertainty | |
Alikhani et al. | Optimal demand response programs selection using CNN‐LSTM algorithm with big data analysis of load curves | |
Barros et al. | Maximizing the financial return of non-technical loss management in power distribution systems | |
Niknam et al. | A hybrid approach combining the multi-dimensional time series k-means algorithm and long short-term memory networks to predict the monthly water demand according to the uncertainty in the dataset | |
Bagde et al. | Analysis of fraud detection mechanism in health insurance using statistical data mining techniques | |
Khansong et al. | Customer Service Improvement based on Electricity Payment Behaviors Analysis using Data Mining Approaches |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |