CN111784381B - 基于隐私保护和som网络的电力客户细分方法及系统 - Google Patents
基于隐私保护和som网络的电力客户细分方法及系统 Download PDFInfo
- Publication number
- CN111784381B CN111784381B CN202010520053.1A CN202010520053A CN111784381B CN 111784381 B CN111784381 B CN 111784381B CN 202010520053 A CN202010520053 A CN 202010520053A CN 111784381 B CN111784381 B CN 111784381B
- Authority
- CN
- China
- Prior art keywords
- neural network
- power
- som
- clustering
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 42
- 230000005611 electricity Effects 0.000 claims abstract description 101
- 238000013528 artificial neural network Methods 0.000 claims abstract description 97
- 210000002569 neuron Anatomy 0.000 claims description 43
- 238000007781 pre-processing Methods 0.000 claims description 11
- 238000012545 processing Methods 0.000 claims description 11
- 238000004590 computer program Methods 0.000 claims description 5
- 238000011084 recovery Methods 0.000 claims description 5
- 238000012217 deletion Methods 0.000 claims description 4
- 230000037430 deletion Effects 0.000 claims description 4
- 239000011159 matrix material Substances 0.000 claims description 4
- 238000010606 normalization Methods 0.000 claims description 4
- 230000002159 abnormal effect Effects 0.000 claims description 3
- 230000008030 elimination Effects 0.000 claims description 3
- 238000003379 elimination reaction Methods 0.000 claims description 3
- 201000004569 Blindness Diseases 0.000 abstract description 4
- 238000010586 diagram Methods 0.000 description 10
- 238000004891 communication Methods 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 2
- 230000002860 competitive effect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000003542 behavioural effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/231—Hierarchical techniques, i.e. dividing or merging pattern sets so as to obtain a dendrogram
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/602—Providing cryptographic facilities or services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
- G06F21/6245—Protecting personal data, e.g. for financial or medical purposes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Strategic Management (AREA)
- Development Economics (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Economics (AREA)
- Accounting & Taxation (AREA)
- Bioethics (AREA)
- Evolutionary Computation (AREA)
- Finance (AREA)
- Entrepreneurship & Innovation (AREA)
- Computer Security & Cryptography (AREA)
- Computer Hardware Design (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Tourism & Hospitality (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Primary Health Care (AREA)
- Human Resources & Organizations (AREA)
- Water Supply & Treatment (AREA)
Abstract
本发明实施例提供一种基于隐私保护和SOM网络的电力客户细分方法及系统,该方法包括:通过智能电表,获取电力客户的用电多维数据;对所述用电多维数据进行聚类处理,获取电力客户的聚类数和初始聚类中心;将所述用电多维数据输入到改进的SOM神经网络中,并将所述聚类数和所述初始聚类中心作为改进的SOM神经网络的初始值,得到电力客户细分结果;其中,所述改进的SOM神经网络是通过等偏差理论对SOM神经网络进行改进得到的。本发明实施例提高SOM网络在电力网客户细分上的准确率,在客户数量较大时,能够实现对客户的快速和有效聚类,极大地减少了人为指定聚类个数的盲目性和主观性。
Description
技术领域
本发明涉及电力系统技术领域,尤其涉及一种基于隐私保护和SOM网络的电力客户细分方法及系统。
背景技术
随着智能电网的发展以及电力产业结构改革的深入推进,电力客户在电力市场中扮演着越来越重要的作用,因此,需要加强对电力客户的细分,从而针对不同的电力客户采取不同的销售和服务策略。对客户进行细分的主要思路是利用现有的各种有效方法,对客户及其需求进行收集、分类和分析,接着对不同行为特征的客户群体的风险与价值进行分类管理,从而提升企业的服务水平,实现个性化服务。在电力市场中,对客户进行细分,有助于供电企业对于客户用电习惯进行了解,识别价值客户,从而可以制定出个性化的服务策略和差异化营销战略,从而提升服务水平。
近年来,国内许多高校和电力研究院开始研究电力系统中的用电客户细分,提出了许多的用电客户细分策略。很多学者主要从供电企业的角度开展基于价值的电力客户细分研究。在细分的技术方面,大多采用操作简单的聚类方法,但是较多研究未考虑大量客户的情形。随着客户数量的增加,对客户逐个计算价值再聚类将非常耗时,“噪声”和孤立点数据的增多直接影响聚类的效果,导致现有的电力客户细分效果较差。
因此,现在亟需一种基于隐私保护和SOM网络的电力客户细分方法及系统来解决上述问题。
发明内容
针对现有技术存在的问题,本发明实施例提供一种基于隐私保护和SOM网络的电力客户细分方法及系统。
第一方面,本发明实施例提供了一种基于隐私保护和SOM网络的电力客户细分方法,包括:
通过智能电表,获取电力客户的用电多维数据;
对所述用电多维数据进行聚类处理,获取电力客户的聚类数和初始聚类中心;
将所述用电多维数据输入到改进的SOM神经网络中,并将所述聚类数和所述初始聚类中心作为改进的SOM神经网络的初始值,得到电力客户细分结果;其中,所述改进的SOM神经网络是通过等偏差理论对SOM神经网络进行改进得到的。
进一步地,所述对所述用电多维数据进行聚类处理,获取电力客户的聚类数和初始聚类中心,包括:
通过UMPGA的分层聚类方法,对电力客户进行聚类,构建电力客户列表,并得到每个电力客户的信息领域对应的聚类数;
获取所述电力客户列表中每个节点的得分,将得分最高的节点作为将电力客户的密集区域,并添加到链表中;
根据每个节点的得分,对电力客户进行分类,并根据分类结果,获取电力客户的初始聚类中心。
进一步地,在所述将所述用电多维数据输入到改进的SOM神经网络中,并将所述聚类数和所述初始聚类中心作为改进的SOM神经网络的初始值,得到电力客户细分结果之前,所述方法还包括:
S1,获取样本电力客户列表中得分最高的K个数据点;
S2,通过所述K个数据点,对SOM神经网络的连接权值、学习率、邻域半径和聚类单元内部偏差进行初始化处理,得到初始化后的SOM神经网络;
S3,基于初始化后的SOM神经网络,通过用电多维样本数据、竞争层神经元和聚类单元内部偏差,确定获胜神经元;
S4,对所述获胜神经元的连接权重进行更新,并对相邻神经元的连接权值进行更新,得到更新后的SOM神经网络;
S5,调整更新后的SOM神经网络的学习速率和邻接半径,得到调整后的SOM神经网络;
S6,基于等偏差理论,获取调整后的SOM神经网络中整个输入空间的偏差值,并对获胜神经元的连接权重,以及相邻神经元的连接权值进行更新;
S7,重复步骤S4至步骤S6,直到满足预设条件,得到改进的SOM神经网络,以对电力客户进行电力客户细分。
进一步地,所述基于等偏差理论,获取调整后的SOM神经网络中整个输入空间的偏差值,包括:
将调整后的SOM神经网络的输入空间S划分为K个小空间{S1,S2,...,SK},并根据划分后的K个小空间,获取调整后的SOM神经网络的竞争层神经元Zi,公式为:
其中,Si表示第i个小空间,xi表示第i个小空间中的输入样本,xl表示空间Si中的第l个样本点;
根据每个小空间的输入样本xi和竞争层神经元Zi,获取每个小空间的聚类单元内部偏差D(Si),公式为:
根据每个小空间的聚类单元内部偏差D(Si),获取调整后的SOM神经网络中整个输入空间的偏差值。
进一步地,所述通过智能电表,获取电力客户的用电多维数据,包括:
通过智能电表,获取电力客户的用电信息数据;
将所述用电信息数据和电力数据指标进行预处理,得到电力客户的用电多维数据,所述预处理包括缺失值和异常值的剔除,以及归一化处理。
进一步地,所述电力数据指标包括:平均电价指标、当前用电量、客户欠费率指标、客户信誉度、客户用电增长率、低谷用电率、电量增长贡献率、电费增长贡献率、历史同期电费增长率、本期电费回收率和历史同期电量增长率。
进一步地,所述通过智能电表,获取电力客户的用电信息数据,包括:
获取电力客户的用电信息加密数据,所述用电信息加密数据是由智能电表通过RSA加密算法,对电力客户的用电信息数据进行加密得到的;
对所述用电信息加密数据进行解密,得到电力客户的用户信息数据。
第二方面,本发明实施例提供了一种基于隐私保护和SOM网络的电力客户细分系统,包括:
用电数据获取模块,用于通过智能电表,获取电力客户的用电多维数据;
用电数据聚类模块,用于对所述用电多维数据进行聚类处理,获取电力客户的聚类数和初始聚类中心;
电力客户细分模块,用于将所述用电多维数据输入到改进的SOM神经网络中,并将所述聚类数和所述初始聚类中心作为改进的SOM神经网络的初始值,得到电力客户细分结果;其中,所述改进的SOM神经网络是通过等偏差理论对SOM神经网络进行改进得到的。
第三方面,本发明实施例提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如第一方面所提供的方法的步骤。
第四方面,本发明实施例提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如第一方面所提供的方法的步骤。
本发明实施例提供的基于隐私保护和SOM网络的电力客户细分方法及系统,通过检测数据密集区域中心的方法,初始化网络连接权值,使得初始化靠近每个类别中心的连接权重可以提高收敛概率和学习速度;同时,调整偏差来指导SOM神经网络的学习,提高SOM网络在电力网客户细分上的准确率,在客户数量较大时,能够实现对客户的快速和有效聚类,极大地减少了人为指定聚类个数的盲目性和主观性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的基于隐私保护和SOM网络的电力客户细分方法的流程示意图;
图2为本发明实施例提供的预处理后的部分样本数据示意图;
图3为本发明实施例提供的部分权值的初始化结果示意图;
图4为本发明实施例提供的更新后权值的示意图;
图5为本发明实施例提供的基于隐私保护和SOM网络的电力客户细分系统的结构示意图;
图6为本发明实施例提供的电子设备结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
随着智能电网的发展以及电力改革事业的推进,电力客户的服务质量的地位越来越凸显。针对类似客户构成的小群体的销售策略,比面向大而广的客户群体所采用的营销策略更高效,质量也更高。对于用电客户的细分,有助于制定准确而有效的营销策略,提高用电客户的服务质量。目前的电力客户具有极大的数据量,并且存在着一定数量的孤立点,从而给用电客户细分带来了很大的挑战。同时,在智能电网的用电信息采集系统中,数以亿计的智能电表需要不断地从家庭终端采集用户的用电信息数据,再将数据经由建筑域网络、区域网络传输至控制中心。如果数据在存储、处理、传输等过程中发生泄露,则会暴露用户的用电规律,并可由此推断出用户的生活习惯等隐私信息,对用户的财产和人身安全造成威胁。因此,在采集信息过程中,保护用户隐私安全尤为重要在采集信息时,如果不能够很好地保护用户隐私,那么用户的电力数据就极有可能被恶意利用。
现有的SOM神经网络采用随机初始权值的方式,导致算法收敛和学习速度不确定,本发明实施例引入一种密集初始化理论,通过检测数据密集区域中心的方法,初始化网络连接权值,使得初始化靠近每个类别中心的连接权重可以提高收敛概率和学习速度。
图1为本发明实施例提供的基于隐私保护和SOM网络的电力客户细分方法的流程示意图,如图1所示,本发明实施例提供了一种基于隐私保护和SOM网络的电力客户细分方法,包括:
步骤101,通过智能电表,获取电力客户的用电多维数据;
在本发明实施例中,电力控制中心通过智能电表发送的加密传输数据,获取到电力客户的用电多维数据,优选地,在本发明实施例中,对获取到的用电多维数据进行数据预处理,以使得后续的电力客户细分更为准确。
步骤102,对所述用电多维数据进行聚类处理,获取电力客户的聚类数和初始聚类中心。
在本发明实施例中,在获取到一组用电多维数据之后,通过算术均值的非加权对群法(UMPGA)对该组用电多维数据进行聚类处理,从而获得该组用电多维数据的聚类数和初始聚类中心。
步骤103,将所述用电多维数据输入到改进的SOM神经网络中,并将所述聚类数和所述初始聚类中心作为改进的SOM神经网络的初始值,得到电力客户细分结果;其中,所述改进的SOM神经网络是通过等偏差理论对SOM神经网络进行改进得到的。
本发明实施例提供的基于隐私保护和SOM网络的电力客户细分方法,通过检测数据密集区域中心的方法,初始化网络连接权值,使得初始化靠近每个类别中心的连接权重可以提高收敛概率和学习速度;同时,调整偏差来指导SOM神经网络的学习,提高SOM网络在电力网客户细分上的准确率,在客户数量较大时,能够实现对客户的快速和有效聚类,极大地减少了人为指定聚类个数的盲目性和主观性。
在上述实施例的基础上,所述对所述用电多维数据进行聚类处理,获取电力客户的聚类数和初始聚类中心,包括:
通过UMPGA的分层聚类方法,对电力客户进行聚类,构建电力客户列表,并得到每个电力客户的信息领域对应的聚类数;
获取所述电力客户列表中每个节点的得分,将得分最高的节点作为将电力客户的密集区域,并添加到链表中;
在本发明实施例中,基于UMPGA的分层聚类算法,首先通过用电多维数据对电力客户进行聚类,从而构建电力客户列表,使得每个电力客户的信息领域形成一个聚类数;然后,通过该算法获取得分最高的节点,此节点为电力客户的密集区域,再将该节点添加到链表中,并且,在电力客户的密集区域中,很可能存在类别的中心。在本发明实施例中,节点得分=平均相似度×电力客户数。
根据每个节点的得分,对电力客户进行分类,并根据分类结果,获取电力客户的初始聚类中心。
进一步地,根据上述实施例中得到的节点分数,对电力客户列表中的电力客户进行分类,并通过中心向量的每个维度的权重,取该电力客户密集区域中客户数据的平均权重,以用于选取这些电力客户密集区域的中心,即获取电力客户的初始聚类中心。
在上述实施例的基础上,在所述将所述用电多维数据输入到改进的SOM神经网络中,并将所述聚类数和所述初始聚类中心作为改进的SOM神经网络的初始值,得到电力客户细分结果之前,所述方法还包括:
步骤S1,获取样本电力客户列表中得分最高的K个数据点;
步骤S2,通过所述K个数据点,对SOM神经网络的连接权值、学习率、邻域半径和聚类单元内部偏差进行初始化处理,得到初始化后的SOM神经网络。
在本发明实施例中,从样本电力客户列表中得分最高的K个数据点中,获取到该样本电力客户列表的聚类数和初始聚类中心,以根据聚类数和初始聚类中心初始化SOM神经网络的连接权值,初始化连接权重w、学习率ao、邻域半径Nbo和聚类单元内部偏差D(Si)=1,i=1,2,…,K。
步骤S3,基于初始化后的SOM神经网络,通过用电多维样本数据Xj、竞争层神经元Zi和聚类单元内部偏差D(Si),确定获胜神经元,公式为:
其中,∑-1(Xj,Zi)表示Xj和Zi的协方差矩阵。
步骤S4,对所述获胜神经元的连接权重进行更新,并对相邻神经元的连接权值进行更新,得到更新后的SOM神经网络;
步骤S5,调整更新后的SOM神经网络的学习速率和邻接半径,得到调整后的SOM神经网络。
在本发明实施例中,随着迭代次数的增加,学习速率和邻接半径会降低,为了保证算法的收敛性,需要调整学习速度和邻域半径,以使得到最后只有获胜神经元在学习调整。
步骤S6,基于等偏差理论,获取调整后的SOM神经网络中整个输入空间的偏差值,并对获胜神经元的连接权重,以及相邻神经元的连接权值进行更新。
在本发明实施例中,基于等偏差理论,计算每个竞争层神经元内部类的偏离值D(Si),即聚类单元内部偏差。针对竞争层神经元获胜次数的不同,采用不同的公式获取D(Si),具体为,若获胜次数不为0,公式为:
其中,num表示神经元获胜次数,wi表示第i个竞争层神经元的连接权值,xj表示第j个输入样本,non_zero表示获胜次数非零的神经元个数,∑-1(xj,wi)表示xj和wi协方差矩阵;
若获胜次数为0,公式为:
其中,zero表示获胜次数为零的神经元个数。
进一步地,根据上述实施例得到的每个竞争层神经元内部类的偏离值D(Si),获取调整后的SOM神经网络中整个输入空间的偏差值。
S7,重复步骤S4至步骤S6,直到满足预设条件,得到改进的SOM神经网络,以对电力客户进行电力客户细分。
在本发明实施例中,通过不断迭代,直至满足最大迭代次数或者算法收敛,得到改进的SOM神经网络,从而根据该改进的SOM神经网络对电力客户进行细分。
在上述实施例的基础上,所述基于等偏差理论,获取调整后的SOM神经网络中整个输入空间的偏差值,包括:
将调整后的SOM神经网络的输入空间S划分为K个小空间{S1,S2,...,SK},并根据划分后的K个小空间,获取调整后的SOM神经网络的竞争层神经元Zi,公式为:
其中,Si表示第i个小空间,xi表示第i个小空间中的输入样本,xl表示空间Si中的第l个样本点;竞争层神经元Zi为小空间Si的中心,在本发明实施例中,是用最接近Si中的算术中心点进行表示;
根据每个小空间的输入样本xi和竞争层神经元Zi,获取每个小空间的聚类单元内部偏差D(Si),公式为:
在本发明实施例中,通过D(Si)表示第i类的偏差,即从小空间Si的点到小空间Si中心的距离之和。
根据每个小空间的聚类单元内部偏差D(Si),获取调整后的SOM神经网络中整个输入空间的偏差值。
在本发明实施例中,基于等偏差理论,使得调整后的SOM神经网络中整个输入空间的偏差值D(S)最小,通过上述实施例计算得到的每个小空间Si的D(Si),计算SOM神经网络中输入空间S的整个偏差D(S),公式为:
在上述实施例的基础上,所述通过智能电表,获取电力客户的用电多维数据,包括:
通过智能电表,获取电力客户的用电信息数据;
将所述用电信息数据和电力数据指标进行预处理,得到电力客户的用电多维数据,所述预处理包括缺失值和异常值的剔除,以及归一化处理。
在上述实施例的基础上,所述电力数据指标包括:平均电价指标、当前用电量、客户欠费率指标、客户信誉度、客户用电增长率、低谷用电率、电量增长贡献率、电费增长贡献率、历史同期电费增长率、本期电费回收率和历史同期电量增长率。
在上述实施例的基础上,所述通过智能电表,获取电力客户的用电信息数据,包括:
获取电力客户的用电信息加密数据,所述用电信息加密数据是由智能电表通过RSA加密算法,对电力客户的用电信息数据进行加密得到的;
对所述用电信息加密数据进行解密,得到电力客户的用户信息数据。
在本发明实施例中,智能电表通过RSA加密算法,将电力客户的用电信息数据传输至控制中心,控制中心在解密后,获取电力客户用电数据;然后,将电力客户用电数据与平均电价指标、当前用电量、客户欠费率指标、客户信誉度、客户用电增长率、低谷用电率、电量增长贡献率、电费增长贡献率、历史同期电费增长率、本期电费回收率、历史同期电量增长率等指标一起进行预处理,从而得到电力客户的用电多维数据。
本发明实施例通过使用RSA加密算法传输数据,极大地保护了电力客户的隐私,同时,经过预处理后的用电多维数据,使得后续电力客户细分的准确性更高。
在本发明一实施例中,设置K=5,即将电力客户分为五类:卓越客户、优质客户、稳定客户、潜在欠费风险客户和潜在流失风险客户;在本发明实施例中,0至4依次代表:卓越客户、优质客户、稳定客户、潜在欠费风险客户和潜在流失风险客户;进一步地,从数据集中选取18个样本作为分析,该数据集中的样本为电力客户近几年的多维数据指标,包括当前用电量、平均电价指标、客户欠费率指标、客户用电增长率、客户信誉度、低谷用电率、电量增长贡献率、电费增长贡献率、历史同期电费增长率、本期电费回收率和历史同期电量增长率等指标。
进一步地,对上述实施例获得的数据进行预处理,包括缺失值和异常值剔除,以及数据归一化处理,图2为本发明实施例提供的预处理后的部分样本数据示意图,预处理后的数据可参考图2所示。然后,通过这些预处理数据,对电力客户进行聚类,在本发明实施例中,通过使用UMPGA的分层聚类方法,根据得到的分数对电力客户列表进行分类;分类结果如下:[0 4 1 2 0 3 0 1 3 4 0 1 2 4 2 3 1 1],其中0至4依次对应着:卓越客户、优质客户、稳定客户、潜在欠费风险客户和潜在流失风险客户。
进一步地,利用K个数据点,初始化SOM神经网络的连接权值,初始化连接权重、学习率、邻域半径、聚类单元内部偏差。其中,初始化学习率为0.05,邻域半径为5。图3为本发明实施例提供的部分权值的初始化结果示意图。
在上述实施例的基础上,接下来需要对获胜神经元的连接权重进行更新,同时,对相邻神经元的连接权值进行更新,图4为本发明实施例提供的更新后权值的示意图。通过对获胜神经元的连接权重和相邻神经元的连接权值进行迭代更新,直到满足最大迭代次数或算法收敛,最终得到电力客户细分结果,最终分类结果为:[0 1 1 2 0 3 1 0 3 4 0 4 2 12 3 1 2],其中0至4依次对应着:卓越客户、优质客户、稳定客户、潜在欠费风险客户和潜在流失风险客户,即原样本分类结果为:[卓越客户、优质客户、优质客户、稳定客户、卓越客户、潜在欠费风险客户、优质客户、卓越客户、潜在欠费风险客户、潜在流失风险客户、卓越客户、潜在流失风险客户、稳定客户、卓越客户、稳定客户、潜在欠费风险客户、优质客户、稳定客户]。
图5为本发明实施例提供的基于隐私保护和SOM网络的电力客户细分系统的结构示意图,如图5所示,本发明实施例提供了一种基于隐私保护和SOM网络的电力客户细分系统,包括用电数据获取模块501、用电数据聚类模块502和电力客户细分模块503,其中,用电数据获取模块501用于通过智能电表,获取电力客户的用电多维数据;用电数据聚类模块502用于对所述用电多维数据进行聚类处理,获取电力客户的聚类数和初始聚类中心;电力客户细分模块503用于将所述用电多维数据输入到改进的SOM神经网络中,并将所述聚类数和所述初始聚类中心作为改进的SOM神经网络的初始值,得到电力客户细分结果;其中,所述改进的SOM神经网络是通过等偏差理论对SOM神经网络进行改进得到的。
本发明实施例提供的基于隐私保护和SOM网络的电力客户细分系统,通过检测数据密集区域中心的方法,初始化网络连接权值,使得初始化靠近每个类别中心的连接权重可以提高收敛概率和学习速度;同时,调整偏差来指导SOM神经网络的学习,提高SOM网络在电力网客户细分上的准确率,在客户数量较大时,能够实现对客户的快速和有效聚类,极大地减少了人为指定聚类个数的盲目性和主观性。
本发明实施例提供的系统是用于执行上述各方法实施例的,具体流程和详细内容请参照上述实施例,此处不再赘述。
图6为本发明实施例提供的电子设备结构示意图,参照图6,该电子设备可以包括:处理器(processor)601、通信接口(Communications Interface)602、存储器(memory)603和通信总线604,其中,处理器601,通信接口602,存储器603通过通信总线604完成相互间的通信。处理器601可以调用存储器603中的逻辑指令,以执行如下方法:通过智能电表,获取电力客户的用电多维数据;对所述用电多维数据进行聚类处理,获取电力客户的聚类数和初始聚类中心;将所述用电多维数据输入到改进的SOM神经网络中,并将所述聚类数和所述初始聚类中心作为改进的SOM神经网络的初始值,得到电力客户细分结果;其中,所述改进的SOM神经网络是通过等偏差理论对SOM神经网络进行改进得到的。
此外,上述的存储器603中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明实施例还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各实施例提供的基于隐私保护和SOM网络的电力客户细分方法,例如包括:通过智能电表,获取电力客户的用电多维数据;对所述用电多维数据进行聚类处理,获取电力客户的聚类数和初始聚类中心;将所述用电多维数据输入到改进的SOM神经网络中,并将所述聚类数和所述初始聚类中心作为改进的SOM神经网络的初始值,得到电力客户细分结果;其中,所述改进的SOM神经网络是通过等偏差理论对SOM神经网络进行改进得到的。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (9)
1.一种基于隐私保护和SOM网络的电力客户细分方法,其特征在于,包括:
通过智能电表,获取电力客户的用电多维数据;
对所述用电多维数据进行聚类处理,获取电力客户的聚类数和初始聚类中心;
将所述用电多维数据输入到改进的SOM神经网络中,并将所述聚类数和所述初始聚类中心作为改进的SOM神经网络的初始值,得到电力客户细分结果;其中,所述改进的SOM神经网络是通过等偏差理论对SOM神经网络进行改进得到的;
在所述将所述用电多维数据输入到改进的SOM神经网络中,并将所述聚类数和所述初始聚类中心作为改进的SOM神经网络的初始值,得到电力客户细分结果之前,所述方法还包括:
S1,获取样本电力客户列表中得分最高的K个数据点;
S2,通过所述K个数据点,对SOM神经网络的连接权值、学习率、邻域半径和聚类单元内部偏差进行初始化处理,得到初始化后的SOM神经网络;
S3,基于初始化后的SOM神经网络,通过用电多维样本数据、竞争层神经元和聚类单元内部偏差,确定获胜神经元,公式为:
其中,∑-1(Xj,Zi)表示Xj和Zi的协方差矩阵,Xj表示用电多维样本数据,Zi表示竞争层神经元,D(Si)表示聚类单元内部偏差;
S4,对所述获胜神经元的连接权重进行更新,并对相邻神经元的连接权值进行更新,得到更新后的SOM神经网络;
S5,调整更新后的SOM神经网络的学习速率和邻接半径,得到调整后的SOM神经网络;
S6,基于等偏差理论,获取调整后的SOM神经网络中整个输入空间的偏差值,并对获胜神经元的连接权重,以及相邻神经元的连接权值进行更新;
S7,重复步骤S4至步骤S6,直到满足预设条件,得到改进的SOM神经网络,以对电力客户进行电力客户细分。
2.根据权利要求1所述的基于隐私保护和SOM网络的电力客户细分方法,其特征在于,所述对所述用电多维数据进行聚类处理,获取电力客户的聚类数和初始聚类中心,包括:
通过UMPGA的分层聚类方法,对电力客户进行聚类,构建电力客户列表,并得到每个电力客户的信息领域对应的聚类数;
获取所述电力客户列表中每个节点的得分,将得分最高的节点作为将电力客户的密集区域,并添加到链表中;
根据每个节点的得分,对电力客户进行分类,并根据分类结果,获取电力客户的初始聚类中心。
3.根据权利要求2所述的基于隐私保护和SOM网络的电力客户细分方法,其特征在于,所述基于等偏差理论,获取调整后的SOM神经网络中整个输入空间的偏差值,包括:
将调整后的SOM神经网络的输入空间S划分为K个小空间{S1,S2,...,SK},并根据划分后的K个小空间,获取调整后的SOM神经网络的竞争层神经元Zi,公式为:
其中,Si表示第i个小空间,xi表示第i个小空间中的输入样本,xl表示空间Si中的第l个样本点;
根据每个小空间的输入样本xi和竞争层神经元Zi,获取每个小空间的聚类单元内部偏差D(Si),公式为:
根据每个小空间的聚类单元内部偏差D(Si),获取调整后的SOM神经网络中整个输入空间的偏差值。
4.根据权利要求1所述的基于隐私保护和SOM网络的电力客户细分方法,其特征在于,所述通过智能电表,获取电力客户的用电多维数据,包括:
通过智能电表,获取电力客户的用电信息数据;
将所述用电信息数据和电力数据指标进行预处理,得到电力客户的用电多维数据,所述预处理包括缺失值和异常值的剔除,以及归一化处理。
5.根据权利要求4所述的基于隐私保护和SOM网络的电力客户细分方法,其特征在于,所述电力数据指标包括:平均电价指标、当前用电量、客户欠费率指标、客户信誉度、客户用电增长率、低谷用电率、电量增长贡献率、电费增长贡献率、历史同期电费增长率、本期电费回收率和历史同期电量增长率。
6.根据权利要求4所述的基于隐私保护和SOM网络的电力客户细分方法,其特征在于,所述通过智能电表,获取电力客户的用电信息数据,包括:
获取电力客户的用电信息加密数据,所述用电信息加密数据是由智能电表通过RSA加密算法,对电力客户的用电信息数据进行加密得到的;
对所述用电信息加密数据进行解密,得到电力客户的用户信息数据。
7.一种基于隐私保护和SOM网络的电力客户细分系统,其特征在于,包括:
用电数据获取模块,用于通过智能电表,获取电力客户的用电多维数据;
用电数据聚类模块,用于对所述用电多维数据进行聚类处理,获取电力客户的聚类数和初始聚类中心;
电力客户细分模块,用于将所述用电多维数据输入到改进的SOM神经网络中,并将所述聚类数和所述初始聚类中心作为改进的SOM神经网络的初始值,得到电力客户细分结果;其中,所述改进的SOM神经网络是通过等偏差理论对SOM神经网络进行改进得到的;
所述系统还用于:
S1,获取样本电力客户列表中得分最高的K个数据点;
S2,通过所述K个数据点,对SOM神经网络的连接权值、学习率、邻域半径和聚类单元内部偏差进行初始化处理,得到初始化后的SOM神经网络;
S3,基于初始化后的SOM神经网络,通过用电多维样本数据、竞争层神经元和聚类单元内部偏差,确定获胜神经元,公式为:
其中,∑-1(Xj,Zi)表示Xj和Zi的协方差矩阵,Xj表示用电多维样本数据,Zi表示竞争层神经元,D(Si)表示聚类单元内部偏差;
S4,对所述获胜神经元的连接权重进行更新,并对相邻神经元的连接权值进行更新,得到更新后的SOM神经网络;
S5,调整更新后的SOM神经网络的学习速率和邻接半径,得到调整后的SOM神经网络;
S6,基于等偏差理论,获取调整后的SOM神经网络中整个输入空间的偏差值,并对获胜神经元的连接权重,以及相邻神经元的连接权值进行更新;
S7,重复步骤S4至步骤S6,直到满足预设条件,得到改进的SOM神经网络,以对电力客户进行电力客户细分。
8.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至6任一项所述基于隐私保护和SOM网络的电力客户细分方法的步骤。
9.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1至6任一项所述基于隐私保护和SOM网络的电力客户细分方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010520053.1A CN111784381B (zh) | 2020-06-09 | 2020-06-09 | 基于隐私保护和som网络的电力客户细分方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010520053.1A CN111784381B (zh) | 2020-06-09 | 2020-06-09 | 基于隐私保护和som网络的电力客户细分方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111784381A CN111784381A (zh) | 2020-10-16 |
CN111784381B true CN111784381B (zh) | 2023-05-16 |
Family
ID=72755870
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010520053.1A Active CN111784381B (zh) | 2020-06-09 | 2020-06-09 | 基于隐私保护和som网络的电力客户细分方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111784381B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115829418B (zh) * | 2023-02-07 | 2023-06-27 | 国网江苏省电力有限公司营销服务中心 | 适用于负荷管理的电力用户负荷特性画像构建方法和系统 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106296315A (zh) * | 2016-11-03 | 2017-01-04 | 广东电网有限责任公司佛山供电局 | 基于用户用电数据的情境感知系统 |
JP7319757B2 (ja) * | 2016-12-05 | 2023-08-02 | 株式会社日立製作所 | データ処理システム及びデータ処理方法 |
CN108280479B (zh) * | 2018-01-25 | 2020-06-05 | 重庆大学 | 一种基于负荷特性指标加权聚类算法的电网用户分类方法 |
CN110851502B (zh) * | 2019-11-19 | 2023-04-07 | 国网吉林省电力有限公司 | 一种基于数据挖掘技术的负荷特征场景分类方法 |
-
2020
- 2020-06-09 CN CN202010520053.1A patent/CN111784381B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN111784381A (zh) | 2020-10-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105224872B (zh) | 一种基于神经网络聚类的用户异常行为检测方法 | |
CN110889434B (zh) | 一种基于活动的社交网络活动特征提取方法 | |
CN111626431A (zh) | 基于生成的机器学习流水线来操作数据中心的系统和方法 | |
JP2021530026A (ja) | 目的の個体群を発見する遺伝的ネットワークのフィルタリング | |
WO2013067461A2 (en) | Identifying associations in data | |
Zhang et al. | A novel fuzzy time series forecasting model based on multiple linear regression and time series clustering | |
CN111091247A (zh) | 基于深度神经网络模型融合的电力负荷预测方法、装置 | |
CN113609398A (zh) | 一种基于异构图神经网络的社交推荐方法 | |
CN112885468A (zh) | 一种基于随机响应差分隐私技术的教师共识聚集学习方法 | |
CN114332984B (zh) | 训练数据处理方法、装置和存储介质 | |
CN113360777B (zh) | 内容推荐模型训练方法、内容推荐方法及相关设备 | |
CN113839926B (zh) | 一种基于灰狼算法特征选择的入侵检测系统建模方法、系统及装置 | |
Alyasseri et al. | EEG channel selection using multiobjective cuckoo search for person identification as protection system in healthcare applications | |
Hewapathirana et al. | Change detection in noisy dynamic networks: a spectral embedding approach | |
Khan et al. | DVAEGMM: Dual variational autoencoder with gaussian mixture model for anomaly detection on attributed networks | |
CN111784381B (zh) | 基于隐私保护和som网络的电力客户细分方法及系统 | |
Cheng et al. | An unsupervised ensemble framework for node anomaly behavior detection in social network | |
CN112541530B (zh) | 针对聚类模型的数据预处理方法及装置 | |
CN114912109B (zh) | 一种基于图嵌入的异常行为序列识别方法及系统 | |
CN115695025A (zh) | 网络安全态势预测模型的训练方法及装置 | |
Tian et al. | [Retracted] Intrusion Detection Method Based on Deep Learning | |
Sullivan et al. | Identifying indicators of chemical, biological, radiological, and nuclear (CBRN) weapons development activity in sub-national terrorist groups | |
Lewis et al. | Approximating grouped fixed effects estimation via fuzzy clustering regression | |
CN117150321B (zh) | 设备信任度评价方法、装置、服务设备及存储介质 | |
CN115831339B (zh) | 基于深度学习的医疗系统风险管控事前预测方法、系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |