CN109146707A - 基于大数据分析的电力用户分析方法、装置及电子设备 - Google Patents
基于大数据分析的电力用户分析方法、装置及电子设备 Download PDFInfo
- Publication number
- CN109146707A CN109146707A CN201810978981.5A CN201810978981A CN109146707A CN 109146707 A CN109146707 A CN 109146707A CN 201810978981 A CN201810978981 A CN 201810978981A CN 109146707 A CN109146707 A CN 109146707A
- Authority
- CN
- China
- Prior art keywords
- user
- group
- node
- label
- power consumer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
- G06Q50/06—Electricity, gas or water supply
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/01—Customer relationship services
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Abstract
本发明实施例公开了一种基于大数据分析的电力用户分析方法、装置及电子设备。其中的方法包括:根据预先设定的多个至少基于两个维度生成的用户标签,为电网中的每一用户匹配对应的用户标签,并以每一用户作为网络节点,构建电力用户及其标签的关系网络;计算所述关系网络中任意两节点间的相关度;依据网络中任意两节点间的相关度,对节点进行合并,形成多个用户群;确定所述每一用户群的群标签属性和用电行为特征。本发明便于为电力用户提供个性化用电服务、精准实施需求响应策略、深入发掘客户价值。
Description
技术领域
本发明涉及电力领域,尤其涉及一种基于大数据分析的电力用户分析方法、装置及电子设备。
背景技术
当前,随着能源互联网及智能用电技术的发展,深入了解电力用户群体特征,并提供精准电力服务,成为“互联网+”智慧能源的重要研究内容。
目前,对电力用户群体分析方法多是基于历史负荷数据,建立基于人工智能方法的负荷识别和预测模型,再利用聚类的方法实现基于用电行为的用户群体分析,或是基于行业或领域等用户属性将电力用户进行细分,进而形成群体属性的关系。这些分类方法往往一个群体中的用户只包含了个别共同属性,难以真正形成包含个体属性用电行为和互联网行为等多种属性的相似用户群体,进而影响基于群体特征的用户用电行为分析预测模型的构建。
发明内容
有鉴于此,本发明实施例提供了一种基于大数据分析的电力用户分析方法、装置及电子设备,至少部分的解决现有技术中存在的问题。
第一方面,本发明实施例提供了基于大数据分析的电力用户分析方法,包括:
根据预先设定的多个至少基于两个维度生成的用户标签,为电网中的每一用户匹配对应的用户标签,并以每一用户作为网络节点,构建电力用户及其标签的关系网络;
计算所述关系网络中任意两节点间的相关度;
依据网络中任意两节点间的相关度,对节点进行合并,形成多个用户群;
确定所述每一用户群的群标签属性和用电行为特征。
根据本发明基于大数据分析的电力用户分析方法实施例的一种具体实现方式,还包括:
接收新用户信息,依据所述预先设定的多个用户的标签,确定与新用户关联的标签;
依据所述用户群的群标签属性和用电行为特征,确定所述新用户所归属的用户群;
预测新用户用电负荷量。
根据本发明基于大数据分析的电力用户分析方法实施例的一种具体实现方式,所述用户标签基于用户社会属性和用户用电行为生成。
根据本发明基于大数据分析的电力用户分析方法实施例的一种具体实现方式,所述计算所述关系网络中任意两节点间的相关度为:
依据预先设定的网络节点间相互关系权重模型,计算所述关系网络中任意两节点间的关系权重;其中,所述相互关系模型为:
α=Nij×Sij
i表示第i个用户;
j表示第j个用户;
α为所述关系网络中任意两节点,用户i和用户j的相互关系权重;
Nij为所述关系网络中任意两节点,用户i和用户j之间相同标签的个数;
Sij为权重因子,其为所述关系网络中任意两节点,用户i和用户j用电行为相似度;
并且,所述用电行为相似度Sij通过如下方式确定:
Lin为用户i日均负荷曲线中,各小时的平均负荷,1≤n≤24;
Ljn为用户j日均负荷曲线中,各小时的平均负荷,1≤n≤24;
根据本发明基于大数据分析的电力用户分析方法实施例的一种具体实现方式,所述依据网络中任意两节点间的相关度,对节点进行合并,形成多个用户群为:
计算所述关系网络中任意两节点用户之间的相互关系权重;
将所述相互关系权重最大的两个节点合并为一个用户群,并视其为网络中的一个新节点;
计算所述新节点与其他各个节点的相互关系权重,将权重最大的节点合并至该群中,形成更新的用户群;在所述用户群中的用户超过售电体预先设定的用户数的情况下,完成相似用户群体的识别和构建。
根据本发明基于大数据分析的电力用户分析方法实施例的一种具体实现方式,
在确定用户i和用户j之间相同标签的个数Nij时,可供选择的用户标签包括:用户社会属性、用户信用和购电渠道。
第二方面,本发明实施例提供了一种基于大数据分析的电力用户分析装置,包括:
关系网络构建模块,用于根据预先设定的多个至少基于两个维度生成的用户标签,为电网中的每一用户匹配对应的用户标签,并以每一用户作为网络节点,构建电力用户及其标签的关系网络;
相关度计算模块,用于计算所述关系网络中任意两节点间的相关度;
用户群生成模块,用于依据网络中任意两节点间的相关度,对节点进行合并,形成多个用户群;
特征确定模块,用于确定所述每一用户群的群标签属性和用电行为特征。
根据本发明基于大数据分析的电力用户分析装置实施例的一种具体实现方式,还包括:
新用户标签确定模块,用于接收新用户信息,依据所述预先设定的多个用户的标签,确定与新用户关联的标签;
归属确定模块,用于依据所述用户群的群标签属性和用电行为特征,确定所述新用户所归属的用户群;
预测模块,用于预测新用户用电负荷量。
根据本发明基于大数据分析的电力用户分析装置实施例的一种具体实现方式,所述用户标签基于用户社会属性和用户用电行为生成。
根据本发明基于大数据分析的电力用户分析装置实施例的一种具体实现方式,所述相关度计算模块用于:
依据预先设定的网络节点间相互关系权重模型,计算所述关系网络中任意两节点间的关系权重;其中,所述相互关系模型为:
α=Nij×Sij
i表示第i个用户;
j表示第j个用户;
α为所述关系网络中任意两节点,用户i和用户j的相互关系权重;
Nij为所述关系网络中任意两节点,用户i和用户j之间相同标签的个数;
Sij为权重因子,其为所述关系网络中任意两节点,用户i和用户j用电行为相似度;
并且,所述用电行为相似度Sij通过如下方式确定:
Lin为用户i日均负荷曲线中,各小时的平均负荷,1≤n≤24;
Ljn为用户j日均负荷曲线中,各小时的平均负荷,1≤n≤24;
根据本发明基于大数据分析的电力用户分析装置实施例的一种具体实现方式,所述用户群生成模块包括:
计算单元,用于计算所述关系网络中任意两节点用户之间的相互关系权重;
第一合并单元,用于将所述相互关系权重最大的两个节点合并为一个用户群,并视其为网络中的一个新节点;
第二合并单元,用于计算所述新节点与其他各个节点的相互关系权重,将权重最大的节点合并至该群中,形成更新的用户群;在所述用户群中的用户超过售电体预先设定的用户数的情况下,完成相似用户群体的识别和构建。
根据本发明基于大数据分析的电力用户分析装置实施例的一种具体实现方式,在确定用户i和用户j之间相同标签的个数Nij时,可供选择的用户标签包括:用户社会属性、用户信用和购电渠道。
第三方面,本发明实施例还提供了一种电子设备,该电子设备包括:
至少一个处理器;以及,
与该至少一个处理器通信连接的存储器;其中,
该存储器存储有可被该至少一个处理器执行的指令,该指令被该至少一个处理器执行,以使该至少一个处理器能够执行前述任第一方面或第一方面的任一实现方式中的基于大数据分析的电力用户分析方法。
第四方面,本发明实施例还提供了一种非暂态计算机可读存储介质,该非暂态计算机可读存储介质存储计算机指令,该计算机指令用于使该计算机执行前述第一方面或第一方面的任一实现方式中的基于大数据分析的电力用户分析方法。
第五方面,本发明实施例还提供了一种计算机程序产品,该计算机程序产品包括存储在非暂态计算机可读存储介质上的计算程序,该计算机程序包括程序指令,当该程序指令被计算机执行时,使该计算机执行前述第一方面或第一方面的任一实现方式中的基于大数据分析的电力用户分析方法。
本发明实施例提供的基于大数据分析的电力用户分析方法、装置及电子设备非暂态计算机可读存储介质及计算机程序,针对电力用户至少两个维度的属性特征,例如,用电行为和社会属性特征,建立用户标签体系及用户关系网络,计算所述关系网络中任意两节点间的相关度;并依据网络中任意两节点间的相关度,对节点进行合并,形成多个用户群;进而确定所述每一用户群的群标签属性和用电行为特征,一般指典型负荷特征。也就是说,通过对标签的分析,可以得到相似用户群体,准确提取相似用户群用电行为特征,发现群体中的重要用户,并预测新入网用户的负荷曲线趋势,便于为电力用户提供个性化用电服务、精准实施需求响应策略、深入发掘客户价值。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1为本发明实施例提供了基于大数据分析的电力用户分析方法的步骤流程图;
图2为本发明实施例提供的基于大数据分析的电力用户分析方法中,电力用户群体的分类和用电行为分析示意图;
图3为本发明实施例提供的基于大数据分析的电力用户分析方法中,电力用户及其标签的关系网络示意图;
图4为本发明实施例提供的基于大数据分析的电力用户分析方法中,用户群形成的步骤流程图;
图5为本发明实施例提供的基于大数据分析的电力用户分析方法中,用户群形成原理图;
图6为本发明实施例提供的基于大数据分析的电力用户分析方法中,新用户用电负荷预测的步骤流程图;
图7为用户群典型负荷与个体负荷均方根误差的示意图;
图8为新用户实际负荷与预测复合的对比图;
图9为本发明实施例提供的一种基于大数据分析的电力用户分析装置的结构框图;
图9A为本发明实施例提供的一种基于大数据分析的电力用户分析装置中,用户群生成模块的结构框图;
图10为本发明实施例提供的另一种基于大数据分析的电力用户分析装置的结构框图;
图11为本发明实施例提供的一种电子设备结构框图。
具体实施方式
下面结合附图对本发明实施例进行详细描述。
应当明确,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
图1为本发明实施例提供了基于大数据分析的电力用户分析方法的步骤流程图,包括:
步骤S110,根据预先设定的多个至少基于两个维度生成的用户标签,为电网中的每一用户匹配对应的用户标签,并以每一用户作为网络节点,构建电力用户及其标签的关系网络。
在其中的一个实施例中,优先选择从电力用户的社会属性和用电行为两个维度来生成用户标签。
也就是说,在其中一个实施例中,将对于电力用户的个体行为可以分为两类,一是电力用户的社会属性,包括家庭人口、住房面积、房屋均价、户内热源类型等反映了电力用户对电力的消费能力和潜力,该类描述可以帮助售电体刻画用户的形象,进而对用户进行分类或归纳;二是电力用户的用电行为,包括历史负荷曲线、互联网购电行为、用户信用等级等,反映了电力用户的实际电能消费量、购电渠道等用电行为特征,动态展示了用户的用电行为特点,可以帮助售电体了解用户的用电模式和消费习惯。对于电力用户群体的分类和行为刻画体现在基于用户个体行为,形成对群体典型负荷和群体标签的描述,其中群体标签包含了群体中用户共同的社会属性和用电行为。具体参考图2所示。
可以看出,用户标签是对用户属性、行为等一系列特征的一个或多个定性描述。用户标签可以包括,家庭人口标签、住房面积标签、房屋均价标签、户内热源标签,以及,历史负荷标签、互联网购电行为标签、用户信用等级标签等。一个标签通常是人为规定的高度精炼的特征标识,搜索用户在数据库的历史记录,为每一用户匹配对应的用户标签
例如,如电力用户的房屋面积标签:70~90m2,人口标签:3人,信用等级标签:2级,等等。标签呈现出两个重要特征:语义化,能方便地理解每个标签含义,这也使得个体用户刻画模型具备实际意义;短文本,每个标签通常只表示一种含义,标签本身无需再做过多文本分析等预处理工作,这为利用机器提取标准化信息提供了便利。
如图3所示,对电力用户全体分析的第一步是定义电力用户社会属性及用电行为标签,将用户与其所属的标签进行连接,形成关系网络,其中a、b、c、d代表用户节点,L1、D2、L3、L4代表用户标签。
需要说明的是,选择从电力用户的社会属性和用电行为两个维度来生成用户标签,只是本发明的一个具体实施例,在实际实施时,可以根据技术的发展和情况的改变,适应性的调整(比如,者增加或减少相关的维度),或者,增加或减少某一维度下相关标签数量,本发明在此不做限定。
步骤S120,计算所述关系网络中任意两节点间的相关度。
在本实施例中,任意两节点间的相关度又称为用户节点间的相互关系权重。
用户节点间的相互关系权重是用户相似度的表现,包括图2所示的用户社会属性相似度和用电行为相似度,其中用户社会属性、用户信用和购电渠道等可以定义为静态标签,用相同标签数量表征其相似性,但用电行为中的历史负荷为动态数据,难以用标签描述,该指标却是用户相似性和群体刻画的关键内容。基于上述因素,本实施例以标签相同个数为权重模型的基础,将负荷相似度作为权重因子,使得权重模型既包含静态标签相似性,又包含动态负荷相似性。
在一个实施例中,关系网络中任意两节点间用户相互关系权重通过如下方式计算:
依据预先设定的网络节点间相互关系权重模型,计算关系网络中任意两节点间的相互关系权重;其中,相互关系模型为:
α=Nij×Sij
i表示第i个用户;
j表示第j个用户;
α为关系网络中任意两节点,用户i和用户j的相互关系权重;
Nij为关系网络中任意两节点,用户i和用户j之间相同标签的个数;
Sij为权重因子,其为关系网络中任意两节点,用户i和用户j用电行为相似度;
并且,用电行为相似度Sij通过如下方式确定:
Lin为用户i日均负荷曲线中,各小时的平均负荷,1≤n≤24;
Ljn为用户j日均负荷曲线中,各小时的平均负荷,1≤n≤24。
当然,也可以采用其他计算相互关系权重的方式,上述计算方式仅仅是本发明的一个实施例,本发明对此不做限定。本领域技术人员根据现有技术习知的其他算法,例如,其他的一些聚类算法,也在本发明的保护范围之内。
步骤S130,依据网络中任意两节点间的相关度,对节点进行合并,形成多个用户群。
参照图4,图4为本发明实施例提供的基于大数据分析的电力用户分析方法中,用户群形成的步骤流程图,包括如下步骤:
步骤S410,构建用户与其标签的关系网络;
步骤S420,建立用户节点间相互关系权重模型;
步骤S430,计算用户节点网络中任意两节点之间相互关系权重,将关系权重最大的两个点合并为一个群;
步骤S440,计算形成的群与其他节点的权重;
步骤S450,判断群中包含的用户数是否达到预设数量,若否,则反回执行步骤S440,若是,则执行S460,
步骤S460,流程结束。
图5为发明实施例提供的基于大数据分析的电力用户分析方法中,用户群形成原理图。
用户群体的形成过程包括:基于用户节点间相互关系权重模型,计算关系网络中a、b、c、d、e、f、g任意两节点的权重,将权重最大的两个节点a和b合并为一个群,并视其为网络中的一个节点,再与其他节点进行关系权重计算。然后,将权重最大的节点合并至群中,形成新的用户群(未示出);如果群中的用户超过售电体设定的用户数,则完成相似用户群体的识别和构建;反之则继续计算更新的群与其他节点的关系权重,不断更新群组成在计算群与节点关系权重过程中,标签只取群中用户共有特征,负荷量取群中所有用户的平均值,由于相似用户的识别过程是对网络中所有用户节点进行遍历计箅,再进行权重排序,计算顺序将不影响模型结果。
步骤S140,确定所述每一用户群的群标签属性和用电行为特征。
通过上述说明可以看出,本发明实施例是关于电力用户相似群体识别与特征分析方法,针对电力用户用电行为和社会属性特征,建立用户标签体系及“用户标签”关系网络,并以标签对比结果为基础将用户历史负荷相似度作为动态系数修成标签对比结果,构建用户相互关系权重模型,作为衡量用户相似度识别的标准,在网络中聚合用户形成相似群体,进而获得群属性标签和典型负荷特征。也就是说,本发明实施例通过对标签数据的分析,可以得到相似用户群体,准确提取相似用户群用电行为特征以及发现群体中的重要用户,方便制定售电体面向群体的销售决策。
进一步地,参照图6,本发明基于大数据分析的电力用户分析方法实施例还可以包括如下步骤:
步骤S610,接收新用户信息,依据所述预先设定的多个用户的标签,确定与新用户关联的标签;
步骤S620,依据所述用户群的群标签属性和用电行为特征,确定所述新用户所归属的用户群;
步骤S630,预测新用户用电负荷量。
在识别和构建相似用户群体后,一方面可以如上所述,分析和获得群标签属性和用电行为特征,用以表征电力用户群体行为,实现售电体面向群体的销售决策;另一方面,用户群体的属性包含了个体用户的行为刻画,能够帮助售电体预测用户个体的用电行为,实现面向用户的电力精准营销。其中,群体标签为群户共同拥有的标签类型,从群识别过程可以获得;群典型负荷量L反映了群体共同的用电行为特征,计算方法为:
其中:Li为用户群中用户i的日负荷量,N为群中用户的数量。
通过群分析预测个体用户的用电行为,主要体现在对其负荷量的预测,对于新入网用户j,为了预测其用电行为特征,需要先识别该用户属于的群体,方法为分别计算用户j与所有群的相同标签个数,数值最大的群则为j的归属群,其负荷量
其中:Li为所属群中与j相同标签个数最多的K个用户的负荷量,K为售电体设定值,小于N。
本实施例以群为基础,基于新入网用户属性标签将其归入某一群中,并进一步预测新用户的用电行为特征。该方法通过对标签数据的分析,在得到相似用户群,准确提取用户群用电行为特征以及发现群体中的重要用户的基础上,能够进一步预测新入网用户的负荷曲线趋势,便于为电力用户提供个性化用电服务、精准实施需求响应策略、深入发掘客户价值。
下面,以一个实例,对上述方法做进一步的说明:
利用某地区抽样1000户居民的用电行为刻画数据,进行相似识别,分析群特征。
1、电力用户标签体和关系网
如表1所示,用户标签主要包含家庭人口、住房面积、房屋均价、热源类型、用户信用、购电渠道等内容如图2所示,为每个用户赋予相应的标签,形成“用户-标签”关系网络,构建大数据分析系统。
表1用户标签
2、用户群识别与分析
利用之前所述的相用户群分析方法,设定群用户数量N=50,识别出相似用户群的共同标签特征包括:2~3人、60~90m2、7000~12000元/m2、燃气、市政热力。计算出群的典型日负荷量,与50户个体负荷量各个小时的均方根误差均值,见图7,各时刻平均为3.2%,表明群体典型日负荷量与个体负荷量误差较小,较为准确地体现了群体中个体普遍的用电行为特征。本实施例提出的群识别方法能够有效识别出具有相似用电行为的用户群体。
为了进一步验证通过对用户群的分析,可以用于预测新入网用户的用电行为特征,随机取实验样本以外的一个用户样本,提取样本用户标签后,寻找与该用户相同标签数量最多的用户群作为该用户的归属群,再分别计算该用户与归属群中其他用户的相同标签个数,取数值最大的前10个用户,计算其平均日负荷量,作为该用户的负荷量预测值。
如图8所示,预测负荷值的曲线与实际值的曲线趋势相似,根据图中的数据,计算获得其均方根误差平均值为5.3%。从而表明,基于相似群体分类结果,利用新入网用户的属性标签,可以有效预测用户的用电行为趋势特征,对于以用户为中心实施基于互联网大数据的精准营销、制定需求响应策略、深入发掘客户价值提供基础支撑作用。
第二方面,本发明实施例提供了一种基于大数据分析的电力用户分析装置,参照图9,包括:关系网络构建模块90、相关度计算模块91、用户群生成模块92和特征确定模块93。下面,对各个模块做进一步的说明。
关系网络构建模块90,用于根据预先设定的多个至少基于两个维度生成的用户标签,为电网中的每一用户匹配对应的用户标签,并以每一用户作为网络节点,构建电力用户及其标签的关系网络。
在其中的一个实施例中,优先选择从电力用户的社会属性和用电行为两个维度来生成用户标签。
也就是说,在其中一个实施例中,将对于电力用户的个体行为可以分为两类,一是电力用户的社会属性,包括家庭人口、住房面积、房屋均价、户内热源类型等反映了电力用户对电力的消费能力和潜力,该类描述可以帮助售电体刻画用户的形象,进而对用户进行分类或归纳;二是电力用户的用电行为,包括历史负荷曲线、互联网购电行为、用户信用等级等,反映了电力用户的实际电能消费量、购电渠道等用电行为特征,动态展示了用户的用电行为特点,可以帮助售电体了解用户的用电模式和消费习惯。对于电力用户群体的分类和行为刻画体现在基于用户个体行为,形成对群体典型负荷和群体标签的描述,其中群体标签包含了群体中用户共同的社会属性和用电行为。具体参考图2所示。
可以看出,用户标签是对用户属性、行为等一系列特征的一个或多个定性描述。用户标签可以包括,家庭人口标签、住房面积标签、房屋均价标签、户内热源标签,以及,历史负荷标签、互联网购电行为标签、用户信用等级标签等。一个标签通常是人为规定的高度精炼的特征标识,搜索用户在数据库的历史记录,为每一用户匹配对应的用户标签
例如,如电力用户的房屋面积标签:70~90m2,人口标签:3人,信用等级标签:2级,等等。标签呈现出两个重要特征:语义化,能方便地理解每个标签含义,这也使得个体用户刻画模型具备实际意义;短文本,每个标签通常只表示一种含义,标签本身无需再做过多文本分析等预处理工作,这为利用机器提取标准化信息提供了便利。
如图3所示,对电力用户全体分析的第一步是定义电力用户社会属性及用电行为标签,将用户与其所属的标签进行连接,形成关系网络,其中a、b、c、d代表用户节点,L1、D2、L3、L4代表用户标签。
需要说明的是,选择从电力用户的社会属性和用电行为两个维度来生成用户标签,只是本发明的一个具体实施例,在实际实施时,可以根据技术的发展和情况的改变,适应性的调整(比如,者增加或减少相关的维度),或者,增加或减少某一维度下相关标签数量,本发明在此不做限定。
相关度计算模块91,用于计算所述关系网络中任意两节点间的相关度。
在本实施例中,任意两节点间的相关度又称为用户节点间的相互关系权重。
用户节点间的相互关系权重是用户相似度的表现,包括图2所示的用户社会属性相似度和用电行为相似度,其中用户社会属性、用户信用和购电渠道等可以定义为静态标签,用相同标签数量表征其相似性,但用电行为中的历史负荷为动态数据,难以用标签描述,该指标却是用户相似性和群体刻画的关键内容。基于上述因素,本实施例以标签相同个数为权重模型的基础,将负荷相似度作为权重因子,使得权重模型既包含静态标签相似性,又包含动态负荷相似性。
在一个实施例中,关系网络中任意两节点间用户相互关系权重通过如下方式计算:
依据预先设定的网络节点间相互关系权重模型,计算关系网络中任意两节点间的相互关系权重;其中,相互关系模型为:
Δ=Nij×Sij
i表示第i个用户;
j表示第j个用户;
α为关系网络中任意两节点,用户i和用户j的相互关系权重;
Nij为关系网络中任意两节点,用户i和用户j之间相同标签的个数;
Sij为权重因子,其为关系网络中任意两节点,用户i和用户j用电行为相似度;
并且,用电行为相似度Sij通过如下方式确定:
Lin为用户i日均负荷曲线中,各小时的平均负荷,1≤n≤24;
Ljn为用户j日均负荷曲线中,各小时的平均负荷,1≤n≤24。
当然,也可以采用其他计算相互关系权重的方式,上述计算方式仅仅是本发明的一个实施例,本发明对此不做限定。本领域技术人员根据现有技术习知的其他算法,例如,其他的一些聚类算法,也在本发明的保护范围之内。
用户群生成模块92,用于依据网络中任意两节点间的相关度,对节点进行合并,形成多个用户群。
用户群体的形成过程包括:基于用户节点间相互关系权重模型,计算关系网络中任意两节点的权重,将权重最大的两个节点合并为一个群,并视其为网络中的一个节点,再与其他节点进行关系权重计算。然后,将权重最大的节点合并至群中,形成新的用户群;如果群中的用户超过售电体设定的用户数,则完成相似用户群体的识别和构建;反之则继续计算更新的群与其他节点的关系权重,不断更新群组成在计算群与节点关系权重过程中,标签只取群中用户共有特征,负荷量取群中所有用户的平均值,由于相似用户的识别过程是对网络中所有用户节点进行遍历计箅,再进行权重排序,计算顺序将不影响模型结果。
在一个实施例中,参照图9A,用户群生成模块92进一步包括:
计算单元921,用于计算所述关系网络中任意两节点用户之间的相互关系权重;
第一合并单元922,用于将所述相互关系权重最大的两个节点合并为一个用户群,并视其为网络中的一个新节点;
第二合并单元923,用于计算所述新节点与其他各个节点的相互关系权重,将权重最大的节点合并至该群中,形成更新的用户群;在所述用户群中的用户超过售电体预先设定的用户数的情况下,完成相似用户群体的识别和构建。
上述工作过程和原理可以参照图4和图5所示,在上面说明方法实施例时,已经进行了阐述,故在此不再赘述,相关之处参照上述说明即可。
特征确定模块93,用于确定所述每一用户群的群标签属性和用电行为特征。
通过上述说明可以看出,本发明实施例是关于电力用户相似群体识别与特征分析方法,针对电力用户用电行为和社会属性特征,建立用户标签体系及“用户标签”关系网络,并以标签对比结果为基础将用户历史负荷相似度作为动态系数修成标签对比结果,构建用户相互关系权重模型,作为衡量用户相似度识别的标准,在网络中聚合用户形成相似群体,进而获得群属性标签和典型负荷特征。也就是说,本发明实施例通过对标签数据的分析,可以得到相似用户群体,准确提取相似用户群用电行为特征以及发现群体中的重要用户,方便制定售电体面向群体的销售决策。
参照图10。本发明实施例还提供了另一种基于大数据分析的电力用户分析装置,包括:关系网络构建模块1001、相关度计算模块1002、用户群生成模块1003和特征确定模块1004;还包括用于预测新用户用电负荷量的结构,包括:
新用户标签确定模块1005A,用于接收新用户信息,依据所述预先设定的多个用户的标签,确定与新用户关联的标签;
归属确定模块1005B,用于依据所述用户群的群标签属性和用电行为特征,确定所述新用户所归属的用户群;
预测模块1005C,用于预测新用户用电负荷量。
在识别和构建相似用户群体后,一方面可以如上所述,分析和获得群标签属性和用电行为特征,用以表征电力用户群体行为,实现售电体面向群体的销售决策;另一方面,用户群体的属性包含了个体用户的行为刻画,能够帮助售电体预测用户个体的用电行为,实现面向用户的电力精准营销。其中,群体标签为群户共同拥有的标签类型,从群识别过程可以获得;群典型负荷量L反映了群体共同的用电行为特征,计算方法为:
其中:Li为用户群中用户i的日负荷量,N为群中用户的数量。
通过群分析预测个体用户的用电行为,主要体现在对其负荷量的预测,对于新入网用户j,为了预测其用电行为特征,需要先识别该用户属于的群体,方法为分别计算用户j与所有群的相同标签个数,数值最大的群则为j的归属群,其负荷量
其中:Li为所属群中与j相同标签个数最多的K个用户的负荷量,K为售电体设定值,小于N。
本实施例以群为基础,基于新入网用户属性标签将其归入某一群中,并进一步预测新用户的用电行为特征。该方法通过对标签数据的分析,在得到相似用户群,准确提取用户群用电行为特征以及发现群体中的重要用户的基础上,能够进一步预测新入网用户的负荷曲线趋势,便于为电力用户提供个性化用电服务、精准实施需求响应策略、深入发掘客户价值。
上述实施例中各模块的功能与其对应的方法实施例中的内容相对应,在此不再赘述。
图11示出了本发明实施例提供的电子设备110的结构示意图,电子设备110包括至少一个处理器1101(例如CPU),至少一个输入输出接口1104,存储器1102,和至少一个通信总线1103,用于实现这些部件之间的连接通信。至少一个处理器1101用于执行存储器1102中存储的计算机指令,以使所述至少一个处理器1101能够执行前述任一分表方法的实施例。存储器1102为非暂态存储器(non-transitory memory),其可以包含易失性存储器,例如高速随机存取存储器(RAM:Random Access Memory),也可以包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。通过至少一个输入输出接口1104(可以是有线或者无线通信接口)实现与至少一个其他设备或单元之间的通信连接。
在一些实施方式中,存储器1102存储了程序11021,处理器1101执行程序11021,用于执行前述任一分表方法实施例中的内容。
该电子设备可以以多种形式存在,包括但不限于:
(1)移动通信设备:这类设备的特点是具备移动通信功能,并且以提供话音、数据通信为主要目标。这类终端包括:智能手机(例如iPhone)、多媒体手机、功能性手机,以及低端手机等。
(2)超移动个人计算机设备:这类设备属于个人计算机的范畴,有计算和处理功能,一般也具备移动上网特性。这类终端包括:PDA、MID和UMPC设备等,例如iPad。
(3)便携式娱乐设备:这类设备可以显示和播放多媒体内容。该类设备包括:音频、视频播放器(例如iPod),掌上游戏机,电子书,以及智能玩具和便携式车载导航设备。
(4)特定服务器:提供计算服务的设备,服务器的构成包括处理器、硬盘、内存、系统总线等,服务器和通用的计算机架构类似,但是由于需要提供高可靠的服务,因此在处理能力、稳定性、可靠性、安全性、可扩展性、可管理性等方面要求较高。
(5)其他具有数据交互功能的电子设备。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。
尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。
在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
Claims (10)
1.一种基于大数据分析的电力用户分析方法,其特征在于,包括:
根据预先设定的多个至少基于两个维度生成的用户标签,为电网中的每一用户匹配对应的用户标签,并以每一用户作为网络节点,构建电力用户及其标签的关系网络;
计算所述关系网络中任意两节点间的相关度;
依据网络中任意两节点间的相关度,对节点进行合并,形成多个用户群;
确定所述每一用户群的群标签属性和用电行为特征。
2.根据权利要求1所述的基于大数据分析的电力用户分析方法,其特征在于,还包括:
接收新用户信息,依据所述预先设定的多个用户的标签,确定与新用户关联的标签;
依据所述用户群的群标签属性和用电行为特征,确定所述新用户所归属的用户群;
预测新用户用电负荷量。
3.根据权利要求1或2所述的基于大数据分析的电力用户分析方法,其特征在于,
所述用户标签基于用户社会属性和用户用电行为生成。
4.根据权利要求3所述的基于大数据分析的电力用户分析方法,其特征在于,所述计算所述关系网络中任意两节点间的相关度为:
依据预先设定的网络节点间相互关系权重模型,计算所述关系网络中任意两节点间的关系权重;其中,所述相互关系模型为:
α=Nij×Sij
i表示第i个用户;
j表示第j个用户;
α为所述关系网络中任意两节点,用户i和用户j的相互关系权重;
Nij为所述关系网络中任意两节点,用户i和用户j之间相同标签的个数;
Sij为权重因子,其为所述关系网络中任意两节点,用户i和用户j用电行为相似度;
并且,所述用电行为相似度Sij通过如下方式确定:
Lin为用户i日均负荷曲线中,各小时的平均负荷,1≤n≤24;
Ljn为用户j日均负荷曲线中,各小时的平均负荷,1≤n≤24。
5.根据权利要求4所述的基于大数据分析的电力用户分析方法,其特征在于,所述依据网络中任意两节点间的相关度,对节点进行合并,形成多个用户群为:
计算所述关系网络中任意两节点用户之间的相互关系权重;
将所述相互关系权重最大的两个节点合并为一个用户群,并视其为网络中的一个新节点;
计算所述新节点与其他各个节点的相互关系权重,将权重最大的节点合并至该群中,形成更新的用户群;在所述用户群中的用户超过售电体预先设定的用户数的情况下,完成相似用户群体的识别和构建。
6.根据权利要求5所述的基于大数据分析的电力用户分析方法,其特征在于,
在确定用户i和用户j之间相同标签的个数Nij时,可供选择的用户标签包括:用户社会属性、用户信用和购电渠道。
7.一种基于大数据分析的电力用户分析装置,其特征在于,包括:
关系网络构建模块,用于根据预先设定的多个至少基于两个维度生成的用户标签,为电网中的每一用户匹配对应的用户标签,并以每一用户作为网络节点,构建电力用户及其标签的关系网络;
相关度计算模块,用于计算所述关系网络中任意两节点间的相关度;
用户群生成模块,用于依据网络中任意两节点间的相关度,对节点进行合并,形成多个用户群;
特征确定模块,用于确定所述每一用户群的群标签属性和用电行为特征。
8.根据权利要求7所述的基于大数据分析的电力用户分析装置,其特征在于,还包括:
新用户标签确定模块,用于接收新用户信息,依据所述预先设定的多个用户的标签,确定与新用户关联的标签;
归属确定模块,用于依据所述用户群的群标签属性和用电行为特征,确定所述新用户所归属的用户群;
预测模块,用于预测新用户用电负荷量。
9.一种电子设备,包括:
至少一个处理器,以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行前述任一权利要求1-6任一项所述的基于大数据分析的电力用户分析方法。
10.一种非暂态计算机可读存储介质,其特征在于,
存储计算机指令;
该计算机指令用于使该计算机执行权利要求1-6中任一项所述的基于大数据分析的电力用户分析方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810978981.5A CN109146707A (zh) | 2018-08-27 | 2018-08-27 | 基于大数据分析的电力用户分析方法、装置及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810978981.5A CN109146707A (zh) | 2018-08-27 | 2018-08-27 | 基于大数据分析的电力用户分析方法、装置及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109146707A true CN109146707A (zh) | 2019-01-04 |
Family
ID=64828099
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810978981.5A Pending CN109146707A (zh) | 2018-08-27 | 2018-08-27 | 基于大数据分析的电力用户分析方法、装置及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109146707A (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110197402A (zh) * | 2019-06-05 | 2019-09-03 | 中国联合网络通信集团有限公司 | 基于用户群的用户标签分析方法、装置、设备和存储介质 |
CN110245964A (zh) * | 2019-06-14 | 2019-09-17 | 北京市商汤科技开发有限公司 | 信息推送方法和装置以及存储介质 |
CN110992087A (zh) * | 2019-11-19 | 2020-04-10 | 国网浙江省电力有限公司宁波供电公司 | 客户用电行为区域差异化方法及装置 |
CN111242423A (zh) * | 2019-12-31 | 2020-06-05 | 深圳能源售电有限公司 | 主动需求响应潜力分析方法、装置、设备以及存储介质 |
CN111598713A (zh) * | 2020-07-24 | 2020-08-28 | 北京淇瑀信息科技有限公司 | 基于相似度权重更新的团伙识别方法、装置及电子设备 |
CN113450022A (zh) * | 2021-07-20 | 2021-09-28 | 山东普赛通信科技股份有限公司 | 一种基于生活习惯的智能节能平衡方法与系统 |
CN113536081A (zh) * | 2021-06-25 | 2021-10-22 | 浙江海瑞网络科技有限公司 | 基于人工智能的数据中心数据管理方法及系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106204161A (zh) * | 2016-07-26 | 2016-12-07 | 郑州郑大智能科技股份有限公司 | 一种互联网环境下电力用户群体分析方法 |
US20160379268A1 (en) * | 2013-12-10 | 2016-12-29 | Tencent Technology (Shenzhen) Company Limited | User behavior data analysis method and device |
CN106651424A (zh) * | 2016-09-28 | 2017-05-10 | 国网山东省电力公司电力科学研究院 | 基于大数据技术的电力用户画像建立与分析方法 |
-
2018
- 2018-08-27 CN CN201810978981.5A patent/CN109146707A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160379268A1 (en) * | 2013-12-10 | 2016-12-29 | Tencent Technology (Shenzhen) Company Limited | User behavior data analysis method and device |
CN106204161A (zh) * | 2016-07-26 | 2016-12-07 | 郑州郑大智能科技股份有限公司 | 一种互联网环境下电力用户群体分析方法 |
CN106651424A (zh) * | 2016-09-28 | 2017-05-10 | 国网山东省电力公司电力科学研究院 | 基于大数据技术的电力用户画像建立与分析方法 |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110197402A (zh) * | 2019-06-05 | 2019-09-03 | 中国联合网络通信集团有限公司 | 基于用户群的用户标签分析方法、装置、设备和存储介质 |
CN110245964A (zh) * | 2019-06-14 | 2019-09-17 | 北京市商汤科技开发有限公司 | 信息推送方法和装置以及存储介质 |
CN110992087A (zh) * | 2019-11-19 | 2020-04-10 | 国网浙江省电力有限公司宁波供电公司 | 客户用电行为区域差异化方法及装置 |
CN111242423A (zh) * | 2019-12-31 | 2020-06-05 | 深圳能源售电有限公司 | 主动需求响应潜力分析方法、装置、设备以及存储介质 |
CN111598713A (zh) * | 2020-07-24 | 2020-08-28 | 北京淇瑀信息科技有限公司 | 基于相似度权重更新的团伙识别方法、装置及电子设备 |
CN111598713B (zh) * | 2020-07-24 | 2021-12-14 | 北京淇瑀信息科技有限公司 | 基于相似度权重更新的团伙识别方法、装置及电子设备 |
CN113536081A (zh) * | 2021-06-25 | 2021-10-22 | 浙江海瑞网络科技有限公司 | 基于人工智能的数据中心数据管理方法及系统 |
WO2022267085A1 (zh) * | 2021-06-25 | 2022-12-29 | 浙江海瑞网络科技有限公司 | 基于人工智能的数据中心数据管理方法及系统 |
CN113450022A (zh) * | 2021-07-20 | 2021-09-28 | 山东普赛通信科技股份有限公司 | 一种基于生活习惯的智能节能平衡方法与系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109146707A (zh) | 基于大数据分析的电力用户分析方法、装置及电子设备 | |
CN106651424B (zh) | 基于大数据技术的电力用户画像建立与分析方法 | |
Liu et al. | A cocktail approach for travel package recommendation | |
CN101354714B (zh) | 一种基于概率潜在语义分析的问题推荐方法 | |
CN102523247B (zh) | 一种基于多属性匹配的云服务推荐方法及装置 | |
Lai et al. | Novel personal and group-based trust models in collaborative filtering for document recommendation | |
CN107491554B (zh) | 文本分类器的构建方法、构建装置及文本分类方法 | |
Liu et al. | Using context similarity for service recommendation | |
CN108920527A (zh) | 一种基于知识图谱的个性化推荐方法 | |
CN103761254B (zh) | 多领域服务主题匹配推荐方法 | |
CN103744917B (zh) | 混合推荐方法及系统 | |
CN105893406A (zh) | 群体用户画像方法及系统 | |
CN104572797A (zh) | 基于主题模型的个性化服务推荐系统和方法 | |
CN111125453A (zh) | 基于子图同构的社交网络中意见领袖角色识别方法及存储介质 | |
WO2017107416A1 (zh) | 一种基于大数据的领域交叉推荐方法及装置 | |
CN103678618A (zh) | 一种基于社交网络平台的Web服务推荐方法 | |
CN105426550B (zh) | 一种基于用户质量模型的协同过滤标签推荐方法及系统 | |
CN106126549A (zh) | 一种基于概率矩阵分解的社区信任推荐方法及其系统 | |
Bin et al. | Collaborative filtering recommendation algorithm based on multi-relationship social network | |
CN103970802A (zh) | 一种歌曲推荐的方法及装置 | |
CN108647800A (zh) | 一种基于节点嵌入的在线社交网络用户缺失属性预测方法 | |
CN110083764A (zh) | 一种协同过滤算法冷启动问题的解决方法 | |
CN108628967A (zh) | 一种基于学习生成网络相似度的网络学习群组划分方法 | |
CN103617146B (zh) | 一种基于硬件资源消耗的机器学习方法及装置 | |
CN112948575A (zh) | 文本数据处理方法、装置和计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190104 |
|
RJ01 | Rejection of invention patent application after publication |