CN114386822A - 基于加权余弦相似度的重点人员用电行为异常分析方法 - Google Patents

基于加权余弦相似度的重点人员用电行为异常分析方法 Download PDF

Info

Publication number
CN114386822A
CN114386822A CN202210002817.7A CN202210002817A CN114386822A CN 114386822 A CN114386822 A CN 114386822A CN 202210002817 A CN202210002817 A CN 202210002817A CN 114386822 A CN114386822 A CN 114386822A
Authority
CN
China
Prior art keywords
key personnel
day
historical
cosine similarity
electricity consumption
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210002817.7A
Other languages
English (en)
Inventor
任禹同
吴恒
步如飞
李磊
秦伟
邓士伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu Zhizhen Energy Technology Co ltd
Original Assignee
Jiangsu Zhizhen Energy Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu Zhizhen Energy Technology Co ltd filed Critical Jiangsu Zhizhen Energy Technology Co ltd
Priority to CN202210002817.7A priority Critical patent/CN114386822A/zh
Publication of CN114386822A publication Critical patent/CN114386822A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J13/00Circuit arrangements for providing remote indication of network conditions, e.g. an instantaneous record of the open or closed condition of each circuitbreaker in the network; Circuit arrangements for providing remote control of switching means in a power distribution network, e.g. switching in and out of current consumers by using a pulse code signal carried by the network
    • H02J13/00001Circuit arrangements for providing remote indication of network conditions, e.g. an instantaneous record of the open or closed condition of each circuitbreaker in the network; Circuit arrangements for providing remote control of switching means in a power distribution network, e.g. switching in and out of current consumers by using a pulse code signal carried by the network characterised by the display of information or by user interaction, e.g. supervisory control and data acquisition systems [SCADA] or graphical user interfaces [GUI]
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J13/00Circuit arrangements for providing remote indication of network conditions, e.g. an instantaneous record of the open or closed condition of each circuitbreaker in the network; Circuit arrangements for providing remote control of switching means in a power distribution network, e.g. switching in and out of current consumers by using a pulse code signal carried by the network
    • H02J13/00002Circuit arrangements for providing remote indication of network conditions, e.g. an instantaneous record of the open or closed condition of each circuitbreaker in the network; Circuit arrangements for providing remote control of switching means in a power distribution network, e.g. switching in and out of current consumers by using a pulse code signal carried by the network characterised by monitoring
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J13/00Circuit arrangements for providing remote indication of network conditions, e.g. an instantaneous record of the open or closed condition of each circuitbreaker in the network; Circuit arrangements for providing remote control of switching means in a power distribution network, e.g. switching in and out of current consumers by using a pulse code signal carried by the network
    • H02J13/00032Systems characterised by the controlled or operated power network elements or equipment, the power network elements or equipment not otherwise provided for
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J3/00Circuit arrangements for ac mains or ac distribution networks
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J2203/00Indexing scheme relating to details of circuit arrangements for AC mains or AC distribution networks
    • H02J2203/10Power transmission or distribution systems management focussing at grid-level, e.g. load flow analysis, node profile computation, meshed network optimisation, active network management or spinning reserve management
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J2203/00Indexing scheme relating to details of circuit arrangements for AC mains or AC distribution networks
    • H02J2203/20Simulating, e g planning, reliability check, modelling or computer assisted design [CAD]
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02BCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO BUILDINGS, e.g. HOUSING, HOUSE APPLIANCES OR RELATED END-USER APPLICATIONS
    • Y02B70/00Technologies for an efficient end-user side electric power management and consumption
    • Y02B70/30Systems integrating technologies related to power network operation and communication or information technologies for improving the carbon footprint of the management of residential or tertiary loads, i.e. smart grids as climate change mitigation technology in the buildings sector, including also the last stages of power distribution and the control, monitoring or operating management systems at local level
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S20/00Management or operation of end-user stationary applications or the last stages of power distribution; Controlling, monitoring or operating thereof
    • Y04S20/20End-user application control systems
    • Y04S20/242Home appliances

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Human Resources & Organizations (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • Power Engineering (AREA)
  • Strategic Management (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Business, Economics & Management (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Tourism & Hospitality (AREA)
  • General Engineering & Computer Science (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Game Theory and Decision Science (AREA)
  • Human Computer Interaction (AREA)
  • Probability & Statistics with Applications (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种基于加权余弦相似度的重点人员用电行为异常分析方法,通过需求部门对重点人员进行信息标注,选取用电行为分析特征,采集其当前时刻的用电负荷辨识数据以及当前时刻的环境变量特征信息,依据当前时刻的环境变量特征信息获取对应的所述的历史时刻的历史用电行为特征,将所述的当前用电行为特征与历史时刻的用电行为特征进行加权余弦相似度计算,获取历史日与待测日的相似程度,并设定相似度阈值,当历史数据量越大时,特征选取越丰富,所得到的相似度越贴近真实的用电行为。本发明能有效提高异常行为研判的精准度,提高效率。更准确反映样本相似性,使计算结果更贴近于实际。减少以人为中心调动监管力量的监督模式。

Description

基于加权余弦相似度的重点人员用电行为异常分析方法
技术领域
本发明涉及一种基于加权余弦相似度的重点人员用电行为异常分析方法,属于智能电网技术领域。
背景技术
随着全球进入信息化、数字化时代,中国的城镇化和城市化发展日趋成熟,大数据挖掘、云计算、人工智能、高级量测等技术应用日趋广泛,对我国社会治理的思想观念、体制建设、技术手段等方面提出了新的要求。电力数据具有巨大的潜在价值,但电力数据对于服务市域社会治理的多领域主体的支撑相对较弱。与此同时,政府部门也在积极的推进数字化转型发展,考虑社会治理对于城市的管理的精细化、人员配置的精准化、数据采集感知的实时化提出了更高的要求,智能电网应从服务电力系统内部向辅助服务全社会治理发展转型,发挥电力数据强实时性、细粒度等特点结合公众标签信息、天气气象信息、地理位置信息等多维数据融合分析,辅助支撑公安、应急、安监、民政等多领域建设主体数字化建设。
经济社会的不断发展,重点人员漏管、脱管、失控等现象频发,重点人员管控难度增大。针对重点人员的管控目前仅能通过活动路线定位、定期到场汇报、北斗定位、酒店入住登记信息等方式获取重点人员的异常信息,但这些手段多数要耗费大量的人力、物力,且监管的时效性较低。因为,电力是生活中必不可少的能源,通过对重点人员家中的电力负荷的实时监控,可以较好的辅助政府各部门对重点人员的管控,同时通过多元数据融合分析,可以较为精准的对重点人员异常行为进行分析。
可以看出,电力数据与多元数据融合分析在重点人员行为分析中具备得天独厚的天然优势,但是之前受限于居民电力负荷感知的颗粒度不够,而如今非介入式负荷辨识技术为此提供了条件。其可以在重点人员不知情的情况下,不入户安装任何设备,仅通过入户的电流、电压检测,实现空调、冰箱、热水器等电器的使用情况的监测。但是现有技术缺乏通过应用这种技术,针对重点人员电力数据及多元数据挖掘进行行为异常分析,辅助需求部门进行重点人员管理的数据应用方法。
发明内容
发明目的:针对上述现有存在的问题和不足,本发明的目的是提供一种基于加权余弦相似度的重点人员用电行为异常分析方法,有效提高用电异常行为研判的精准度,提高核查的效率。更准确地反映样本之间的相似性,使计算结果更贴近于实际。提升监管工作精准化、精细化、实时化,减少以人为中心调动监管力量的监督模式。
技术方案:为实现上述发明目的,本发明采用以下技术方案:
一种基于加权余弦相似度的重点人员用电行为异常分析方法,包括如下步骤:
步骤1:需求部门输入重点人员的管控标签,根据所述标签确定所述重点人员的小区名称和用户编号,采集待测日该用户全天的电力负荷辨识数据及待测日环境特征数据;
步骤2:读取历史用电数据库中该用户编号,以及和待测日环境特征数据相似的历史电力负荷辨识数据,采用密度聚类算法构建历史日特征向量以及获取的待测日特征向量;
步骤3:通过熵权法对历史日特征数据进行权重计算,得到各个特征在历史日的权重分配;
步骤4:根据步骤3得到的各个特征在历史日的权重分配赋予到余弦相似度中,构建加权余弦相似计算公式,设置相似度阈值;
步骤5:将历史日均值特征向量和待测日特征向量代入加权余弦相似度模型,求解相似度,若相似度超过阈值,则为用电行为正常,若低于阈值,则为用电行为异常,将把用电异常的重点人员以告警形式推送给需求部门。
进一步的,所述步骤1中具体步骤为:
步骤1.1:需求部门输入重点人员的管控标签,根据所述标签对对应的所述重点人员的房屋信息和居住人数统计为居住信息;
步骤1.2:根据步骤1.1所得的所述居住信息读取用电数据库中的重点人员的用户编号,根据所述用户编号,读取重点人员待测日的电力负荷辨识数据;
步骤1.3:获取气象局的气象数据,读取重点人员待测日的环境特征数据;
步骤1.4:将步骤1.1中的管控标签和步骤1.2中的电力负荷辨识数据与步骤1.3中实时的环境特征数据进行关联。
进一步的,所述步骤2中具体步骤为:
步骤2.1:通过待测日的电力负荷辨识数据,得到若干个用电行为特征;
步骤2.2:根据重点人员待测日的环境特征数据,得到
Figure 100002_DEST_PATH_IMAGE002
个相似历史日;
步骤2.3:对步骤2.2选取的
Figure 267249DEST_PATH_IMAGE002
个相似历史日的若干个用电行为特征标记为负荷特征,采用密度聚类算法,对
Figure 729454DEST_PATH_IMAGE002
个负荷特征直接聚类获取,自动过滤掉异常噪声点,以密度中心线作为该用户当前环境特征数据下的典型负荷特征曲线;
步骤2.4:根据已获得的数据,设i个历史日影响典型日负荷的特征向量为
Figure 100002_DEST_PATH_IMAGE004
,待测日为
Figure 100002_DEST_PATH_IMAGE006
Figure 100002_DEST_PATH_IMAGE008
为影响参数的数量。
进一步的,所述步骤2.1中所述若干个用电行为特征包括日总用电量
Figure 100002_DEST_PATH_IMAGE010
、日电器使用种类数量
Figure 100002_DEST_PATH_IMAGE012
、日空调总电量
Figure 100002_DEST_PATH_IMAGE014
、日电热总电量
Figure 100002_DEST_PATH_IMAGE016
和日厨房电器总用电量
Figure 100002_DEST_PATH_IMAGE018
进一步的,所述若干个用电行为特征还包括日空调用电时长
Figure 100002_DEST_PATH_IMAGE020
、日电热总用电时长
Figure 100002_DEST_PATH_IMAGE022
和厨房电器总用电时长
Figure 100002_DEST_PATH_IMAGE024
进一步的,所述日电器使用种类数量计算为:
Figure 100002_DEST_PATH_IMAGE026
,日空调用电量占比公式为:
Figure 100002_DEST_PATH_IMAGE028
,日电热总用电量占比为:
Figure 100002_DEST_PATH_IMAGE030
,日厨房电器总用电量占比为:。
进一步的,所述步骤2.2中的环境特征数据包括季节、天气、最高温、最低温和是否是工作日,当一历史日和待测日的所述季节相同、天气相同、最高温±(0-2)、最低温±(0-2)和是否是工作日相同五个条件同时符合,则认为对应历史日为相似历史日。
进一步的,所述步骤3具体步骤为:
步骤3.1:对i个历史日构造判断矩阵
Figure 100002_DEST_PATH_IMAGE032
,其中
Figure 100002_DEST_PATH_IMAGE034
为参数
Figure 100002_DEST_PATH_IMAGE036
相对于历史日
Figure 716739DEST_PATH_IMAGE002
的相对重要程度系数,指标
Figure 922593DEST_PATH_IMAGE036
越大越重要,
Figure 39453DEST_PATH_IMAGE008
表示矩阵的阶数即参数数量,
判断矩阵标准化为
Figure 100002_DEST_PATH_IMAGE038
,则
Figure 100002_DEST_PATH_IMAGE040
为参数
Figure 531615DEST_PATH_IMAGE036
的第
Figure 507661DEST_PATH_IMAGE002
个历史日的比重,计算公式为:
Figure 100002_DEST_PATH_IMAGE042
步骤3.2:计算参数
Figure 313943DEST_PATH_IMAGE036
的信息熵
Figure 100002_DEST_PATH_IMAGE044
,计算公式为:
Figure 100002_DEST_PATH_IMAGE046
步骤3.3:根据信息熵的计算公式,计算出各个特征参数指标的信息熵为:
Figure 100002_DEST_PATH_IMAGE048
步骤3.4:通过信息熵计算各个特征参数指标的权重
Figure 100002_DEST_PATH_IMAGE050
的公式为:
Figure 100002_DEST_PATH_IMAGE052
进一步的,所述步骤4的具体步骤为:
步骤4.1:将相似历史日的特征向量
Figure 100002_DEST_PATH_IMAGE054
与待测日特征向量
Figure 100002_DEST_PATH_IMAGE056
构建余弦相似度为:
Figure 100002_DEST_PATH_IMAGE058
步骤4.2:通过各个特征参数指标的权重,定义加权余弦相似度计算公式为:
Figure 100002_DEST_PATH_IMAGE060
,计算结果为N,取值范围为
Figure 100002_DEST_PATH_IMAGE062
,其取值越大,向量的形态越相似,其用电行为越正常,在0.7-0.8取值范围内取阈值
Figure 100002_DEST_PATH_IMAGE064
进一步的,所述步骤5的具体步骤为:根据加权余弦相似度计算结果
Figure 100002_DEST_PATH_IMAGE066
,若结算结果
Figure 100002_DEST_PATH_IMAGE068
,则判断重点人员用电正常,若结算结果
Figure 100002_DEST_PATH_IMAGE070
,则判断重点人员存在高可能性的用电异常,最终生成重点人员用电异常告警及核查表。
有益效果:与现有技术相比,本发明具有以下优点:
(1)以被标记的需求部门关注的重点人员为分析样本,通过在相似的环境特征条件下,通过加权余弦相似度求解算法,计算长时间粒度的历史的细粒度用电特征数据与实时的细粒度用电特征数据,能够有效提高用电异常行为研判的精准度,提高核查的效率。
(2)特征权重机制,对细粒度用电特征赋予不同的特征权值,并可以根据不同的环境特征信息动态调整用电特征的权重,能够更准确地反映样本之间的相似性,使计算结果更贴近于实际。
(3)数据驱动的监管模式具有针对性的对被监管对象进行预警预判,提升监管工作精准化、精细化、实时化,减少以人为中心调动监管力量的监督模式。
附图说明
图1是本发明的方法流程图;
图2是本发明实施例的各特征标签权重指标示意图。
具体实施方式
下面结合附图和具体实施例,进一步阐明本发明,应理解这些实施例仅用于说明本发明而不用于限制本发明的范围,在阅读了本发明之后,本领域技术人员对本发明的各种等价形式的修改均落于本申请所附权利要求所限定的范围。
如图1的流程所示,本发明提出了一种基于加权余弦相似度的重点人员用电行为异常分析方法,所述需求部门为公安部门、政府职能部门或者电力工等企事业单位,需要通关电力数据融合分析的用户。所述方法包括以下五个步骤:
步骤1:需求部门进行重点人员管控标签输入,根据标签确定重点人员的小区名称、用户编号等信息,采集当前时刻的该用户的电力负荷辨识数据及环境特征数据,
其中步骤1中通过以下步骤对重点人员标签、负荷辨识数据以及环境特征数据进行关联:
步骤1.1根据需求部门提供的重点人员标签信息,根据需求部门提供的重点人员标签为某小区某用户,对所标记的重点人员房屋信息、居住人数等进行数据统计;
步骤1.2根据重点人员居住信息,读取用电数据库中重点人员的用户编号,根据用户编号,读取重点人员的历史及实时的电力负荷辨识数据;
步骤1.3通过获取气象局的气象数据,读取重点人员居住地的某日实时的环境特征数据如表1所示:
表1 待测某日的环境特征数据
户号 季节 最高温度 最低温度 天气 风向 平均空气指数
**** 33℃ 25℃ 多云 东风2级 42
并根据待测某日的环境特征数据选取与之相似的10日作为历史日。
步骤1.4:将需求部门标签数据、电力负荷辨识数据以及实时的环境特征数据进行关联。
上述的基于加权余弦相似度的重点人员用电行为异常分析方法,其中,步骤2通过以下步骤构建历史日特征向量及待测日特征向量。
步骤2:选取用电行为特征,读取用电数据库中该用户编号的与待测日环境特征数据相似的历史电力负荷辨识数据,并采用密度聚类算法构建历史日特征向量以及获取的待测日特征向量。
步骤2.1:所述的行为特征,通过电力负荷辨识数据所得到包括但不限于的日总用电量
Figure 164872DEST_PATH_IMAGE010
、日电器使用种类数量
Figure 93514DEST_PATH_IMAGE012
、日空调总电量
Figure 556856DEST_PATH_IMAGE014
、日电热总电量
Figure 730611DEST_PATH_IMAGE016
、日厨房电器总用电量
Figure 963009DEST_PATH_IMAGE018
以及日空调用电时长
Figure 469077DEST_PATH_IMAGE020
、日电热总用电时长
Figure 13191DEST_PATH_IMAGE022
、厨房电器总用电时长
Figure 630117DEST_PATH_IMAGE024
等。
步骤2.2:通过电力负荷辨识数据,通过计算得到:
日电器使用种类数量计算为:
Figure 451442DEST_PATH_IMAGE026
日空调用电量占比公式为:
Figure 253045DEST_PATH_IMAGE028
日电热总用电量占比为:
Figure 425401DEST_PATH_IMAGE030
日厨房电器总用电量占比为:
Figure 100002_DEST_PATH_IMAGE072
根据电力负荷辨识数据以及计算得到的上述特征选取10个作为用户的特征标签。
步骤2.3:基于历史负荷辨识数据及环境特征数据,基于重点人员典型日负荷曲线选择
Figure DEST_PATH_IMAGE074
个历史日的包括但不限于日总用电量
Figure 908334DEST_PATH_IMAGE010
、日电器使用种类数量
Figure 849746DEST_PATH_IMAGE012
、日空调总电量
Figure 55206DEST_PATH_IMAGE014
、日电热总电量
Figure 714857DEST_PATH_IMAGE016
、日厨房电器总用电量
Figure 673586DEST_PATH_IMAGE018
以及日空调用电时长
Figure 328558DEST_PATH_IMAGE020
、日电热总用电时长
Figure 347330DEST_PATH_IMAGE022
以及日空调用电量占比
Figure DEST_PATH_IMAGE076
,日电热总用电量占比
Figure DEST_PATH_IMAGE078
,日厨房电器总用电量占比
Figure DEST_PATH_IMAGE080
等行为特征作为典型标签,采用密度聚类算法,对
Figure 415649DEST_PATH_IMAGE074
个历史日负荷特征直接聚类获取,自动过滤掉异常噪声点,以密度中心线作为该用户当前环境特征数据下的典型负荷特征向量如下所示:
步骤2.4:根据已获取的电力负荷辨识数据以及通过计算得到的数据,设10个典型历史日的特征向量为
Figure DEST_PATH_IMAGE082
,根据密度聚类得到的典型日特征向量如下式所示:
Figure DEST_PATH_IMAGE084
同时选取两个该环境特征下的待测日特征向量为
Figure DEST_PATH_IMAGE086
如下式所示,影响参数的数量为10个。
Figure DEST_PATH_IMAGE088
Figure DEST_PATH_IMAGE090
步骤3:根据熵权法对历史日特征数据进行权重计算,得到各个特征相对于历史日的权重分配。
步骤4:根据各个特征参数权重,将权重赋予到余弦相似度中,构建加权余弦相似计算公式,设置相似度阈值。
步骤5:将历史日均值特征向量与待测日特征向量带入加权余弦相似度模型,求解相似度。根据相似度求解结果,若相似度超过阈值,则判断为用电行为正常;若相似度低于阈值,则判断用电行为异常,从而将用电异常重点人员以告警的形式推送给需求部门。
步骤3.1:首先需对i个历史日所选取的特征参数数据进行预处理来保证评估结果的客观、合理。
步骤3.2:构造判断矩阵
Figure DEST_PATH_IMAGE092
,其中
Figure DEST_PATH_IMAGE094
为参数
Figure DEST_PATH_IMAGE096
相对于历史日
Figure DEST_PATH_IMAGE098
的相对重要程度系数,越大指标
Figure DEST_PATH_IMAGE096A
越重要,
Figure DEST_PATH_IMAGE100
表示矩阵的阶数即参数数量。
判断矩阵标准化为
Figure DEST_PATH_IMAGE102
。则
Figure DEST_PATH_IMAGE104
为参数
Figure DEST_PATH_IMAGE096AA
的第
Figure DEST_PATH_IMAGE098A
个历史日的比重,计算公式为:
Figure DEST_PATH_IMAGE106
步骤3.3:计算参数
Figure DEST_PATH_IMAGE096AAA
的信息熵
Figure DEST_PATH_IMAGE108
,计算公式为:
Figure DEST_PATH_IMAGE110
步骤3.4:根据信息熵的计算公式,计算出各个特征参数指标的信息熵为:
Figure DEST_PATH_IMAGE048A
步骤3.5:通过信息熵计算各个特征参数指标的权重
Figure DEST_PATH_IMAGE112
的公式为:
Figure DEST_PATH_IMAGE114
根据上述步骤,得到各个特征参数指标的权重为图2所示。
上述的基于加权余弦相似度的重点人员用电行为异常分析方法,其中,步骤4中构建加权余弦相似度计算步骤如下:
步骤4.1:根据历史日影响平均参数的特征向量
Figure DEST_PATH_IMAGE054A
与待测日特征向量
Figure DEST_PATH_IMAGE056A
构建余弦相似度为:
Figure DEST_PATH_IMAGE058A
步骤4.2:综合各个特征参数指标的权重,定义的加权余弦相似度计算公式为:
Figure DEST_PATH_IMAGE060A
根据各个参数的权重指标得到加权后的特征向量:
Figure DEST_PATH_IMAGE116
Figure DEST_PATH_IMAGE118
Figure DEST_PATH_IMAGE120
加权余弦相似度通过测量特征向量为
Figure DEST_PATH_IMAGE054AA
与待测日特征向量
Figure DEST_PATH_IMAGE056AA
两个向量的夹角余弦值来度量它们之间的相似程度,计算结果为
Figure DEST_PATH_IMAGE066A
,其度量的取值范围为
Figure DEST_PATH_IMAGE122
,其取值越大,向量的形态越相似,其用电行为约正常,根据该原则设定相似度的预警阈值为0.7。
上述的基于加权余弦相似度的重点人员用电行为异常分析方法,其中,所述步骤5中,根据加权余弦相似度计算结果
Figure DEST_PATH_IMAGE066AA
,若结算结果
Figure DEST_PATH_IMAGE068A
,则判断重点人员用电正常,若结算结果
Figure DEST_PATH_IMAGE070A
,则判断重点人员存在高可能性的用电异常,最终生成重点人员用电异常告警及核查表。若历史数据样本足够大、用电分析特征选取足够丰富,历史日的特征权重更贴近于真实数值,则历史日与待测日的用电相似度分析则更贴近于实际。
根据加权后的典型历史日特征向量以及两个加权后的待测日特征向量计算得到历史日与待测日1即
Figure DEST_PATH_IMAGE124
的加权余弦相似度计算结果
Figure DEST_PATH_IMAGE126
Figure DEST_PATH_IMAGE128
判断重点人员用电正常,得到历史日与待测日1即
Figure DEST_PATH_IMAGE130
的加权余弦相似度计算结果
Figure DEST_PATH_IMAGE132
Figure DEST_PATH_IMAGE134
,判断重点人员存在高可能性的用电异常,最终生成重点人员用电异常告警及核查表。若历史数据样本足够大、用电分析特征选取足够丰富,历史日的特征权重更贴近于真实数值,则历史日与待测日的用电相似度分析则更贴近于实际。

Claims (10)

1.一种基于加权余弦相似度的重点人员用电行为异常分析方法,其特征在于:包括如下步骤:
步骤1:需求部门输入重点人员的管控标签,根据所述标签确定所述重点人员的小区名称和用户编号,采集待测日该用户全天的电力负荷辨识数据及待测日环境特征数据;
步骤2:读取历史用电数据库中该用户编号,以及和待测日环境特征数据相似的历史电力负荷辨识数据,采用密度聚类算法构建历史日特征向量以及获取的待测日特征向量;
步骤3:通过熵权法对历史日特征数据进行权重计算,得到各个特征在历史日的权重分配;
步骤4:根据步骤3得到的各个特征在历史日的权重分配赋予到余弦相似度中,构建加权余弦相似计算公式,设置相似度阈值;
步骤5:将历史日均值特征向量和待测日特征向量代入加权余弦相似度模型,求解相似度,若相似度超过阈值,则为用电行为正常,若低于阈值,则为用电行为异常,将把用电异常的重点人员以告警形式推送给需求部门。
2.根据权利要求1所述的基于加权余弦相似度的重点人员用电行为异常分析方法,其特征在于:所述步骤1中具体步骤为:
步骤1.1:需求部门输入重点人员的管控标签,根据所述标签对对应的所述重点人员的房屋信息和居住人数统计为居住信息;
步骤1.2:根据步骤1.1所得的所述居住信息读取用电数据库中的重点人员的用户编号,根据所述用户编号,读取重点人员待测日的电力负荷辨识数据;
步骤1.3:获取气象局的气象数据,读取重点人员待测日的环境特征数据;
步骤1.4:将步骤1.1中的管控标签和步骤1.2中的电力负荷辨识数据与步骤1.3中实时的环境特征数据进行关联。
3.根据权利要求1所述的基于加权余弦相似度的重点人员用电行为异常分析方法,其特征在于:所述步骤2中具体步骤为:
步骤2.1:通过待测日的电力负荷辨识数据,得到若干个用电行为特征;
步骤2.2:根据重点人员待测日的环境特征数据,得到
Figure DEST_PATH_IMAGE002
个相似历史日;
步骤2.3:对步骤2.2选取的
Figure 571072DEST_PATH_IMAGE002
个相似历史日的若干个用电行为特征标记为负荷特征,采用密度聚类算法,对
Figure 488212DEST_PATH_IMAGE002
个负荷特征直接聚类获取,自动过滤掉异常噪声点,以密度中心线作为该用户当前环境特征数据下的典型负荷特征曲线;
步骤2.4:根据已获得的数据,设i个历史日影响典型日负荷的特征向量为
Figure DEST_PATH_IMAGE004
,待测日为
Figure DEST_PATH_IMAGE006
Figure DEST_PATH_IMAGE008
为影响参数的数量。
4.根据权利要求3所述的基于加权余弦相似度的重点人员用电行为异常分析方法,其特征在于:所述步骤2.1中所述若干个用电行为特征包括日总用电量
Figure DEST_PATH_IMAGE010
、日电器使用种类数量
Figure DEST_PATH_IMAGE012
、日空调总电量
Figure DEST_PATH_IMAGE014
、日电热总电量
Figure DEST_PATH_IMAGE016
和日厨房电器总用电量
Figure DEST_PATH_IMAGE018
5.根据权利要求4所述的基于加权余弦相似度的重点人员用电行为异常分析方法,其特征在于:所述若干个用电行为特征还包括日空调用电时长
Figure DEST_PATH_IMAGE020
、日电热总用电时长
Figure DEST_PATH_IMAGE022
和厨房电器总用电时长
Figure DEST_PATH_IMAGE024
6.根据权利要求4或5所述的基于加权余弦相似度的重点人员用电行为异常分析方法,其特征在于:所述日电器使用种类数量计算为:
Figure DEST_PATH_IMAGE026
,日空调用电量占比公式为:
Figure DEST_PATH_IMAGE028
,日电热总用电量占比为:
Figure DEST_PATH_IMAGE030
,日厨房电器总用电量占比为:
Figure DEST_PATH_IMAGE032
7.根据权利要求3-5任一项所述的基于加权余弦相似度的重点人员用电行为异常分析方法,其特征在于:所述步骤2.2中的环境特征数据包括季节、天气、最高温、最低温和是否是工作日,当一历史日和待测日的所述季节相同、天气相同、最高温±(0-2)、最低温±(0-2)和是否是工作日相同五个条件同时符合,则认为对应历史日为相似历史日。
8.根据权利要求1所述的基于加权余弦相似度的重点人员用电行为异常分析方法,其特征在于:所述步骤3具体步骤为:
步骤3.1:对i个历史日构造判断矩阵
Figure DEST_PATH_IMAGE034
,其中
Figure DEST_PATH_IMAGE036
为参数
Figure DEST_PATH_IMAGE038
相对于历史日
Figure 641851DEST_PATH_IMAGE002
的相对重要程度系数,指标
Figure 37060DEST_PATH_IMAGE038
越大越重要,
Figure 851432DEST_PATH_IMAGE008
表示矩阵的阶数即参数数量,
判断矩阵标准化为
Figure DEST_PATH_IMAGE040
,则
Figure DEST_PATH_IMAGE042
为参数
Figure 736212DEST_PATH_IMAGE038
的第
Figure 3245DEST_PATH_IMAGE002
个历史日的比重,计算公式为:
Figure DEST_PATH_IMAGE044
步骤3.2:计算参数
Figure 848752DEST_PATH_IMAGE038
的信息熵
Figure DEST_PATH_IMAGE046
,计算公式为:
Figure DEST_PATH_IMAGE048
步骤3.3:根据信息熵的计算公式,计算出各个特征参数指标的信息熵为:
Figure DEST_PATH_IMAGE050
步骤3.4:通过信息熵计算各个特征参数指标的权重
Figure DEST_PATH_IMAGE052
的公式为:
Figure DEST_PATH_IMAGE054
9.根据权利要求1所述的基于加权余弦相似度的重点人员用电行为异常分析方法,其特征在于:所述步骤4的具体步骤为:
步骤4.1:将相似历史日的特征向量
Figure DEST_PATH_IMAGE056
与待测日特征向量
Figure DEST_PATH_IMAGE058
构建余弦相似度为:
Figure DEST_PATH_IMAGE060
步骤4.2:通过各个特征参数指标的权重,定义加权余弦相似度计算公式为:
Figure DEST_PATH_IMAGE062
,计算结果为N,取值范围为
Figure DEST_PATH_IMAGE064
,其取值越大,向量的形态越相似,其用电行为越正常,在0.7-0.8取值范围内取阈值
Figure DEST_PATH_IMAGE066
10.根据权利要求1所述的基于加权余弦相似度的重点人员用电行为异常分析方法,其特征在于:所述步骤5的具体步骤为:根据加权余弦相似度计算结果
Figure DEST_PATH_IMAGE068
,若结算结果
Figure DEST_PATH_IMAGE070
,则判断重点人员用电正常,若结算结果
Figure DEST_PATH_IMAGE072
,则判断重点人员存在高可能性的用电异常,最终生成重点人员用电异常告警及核查表。
CN202210002817.7A 2022-01-05 2022-01-05 基于加权余弦相似度的重点人员用电行为异常分析方法 Pending CN114386822A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210002817.7A CN114386822A (zh) 2022-01-05 2022-01-05 基于加权余弦相似度的重点人员用电行为异常分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210002817.7A CN114386822A (zh) 2022-01-05 2022-01-05 基于加权余弦相似度的重点人员用电行为异常分析方法

Publications (1)

Publication Number Publication Date
CN114386822A true CN114386822A (zh) 2022-04-22

Family

ID=81199875

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210002817.7A Pending CN114386822A (zh) 2022-01-05 2022-01-05 基于加权余弦相似度的重点人员用电行为异常分析方法

Country Status (1)

Country Link
CN (1) CN114386822A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116383753A (zh) * 2023-05-26 2023-07-04 深圳市博昌智控科技有限公司 基于物联网的异常行为提示方法、装置、设备及介质
CN117717278A (zh) * 2024-02-18 2024-03-19 广东敏卓机电股份有限公司 一种烤箱定时器、多层烤箱及其控制方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116383753A (zh) * 2023-05-26 2023-07-04 深圳市博昌智控科技有限公司 基于物联网的异常行为提示方法、装置、设备及介质
CN116383753B (zh) * 2023-05-26 2023-08-18 深圳市博昌智控科技有限公司 基于物联网的异常行为提示方法、装置、设备及介质
CN117717278A (zh) * 2024-02-18 2024-03-19 广东敏卓机电股份有限公司 一种烤箱定时器、多层烤箱及其控制方法
CN117717278B (zh) * 2024-02-18 2024-05-10 广东敏卓机电股份有限公司 一种烤箱定时器、多层烤箱及其控制方法

Similar Documents

Publication Publication Date Title
CN110097297B (zh) 一种多维度窃电态势智能感知方法、系统、设备及介质
Sheng et al. Short-term solar power forecasting based on weighted Gaussian process regression
CN108593990B (zh) 一种基于电能用户用电行为模式的窃电检测方法和应用
Lin et al. A privacy-preserving federated learning method for probabilistic community-level behind-the-meter solar generation disaggregation
CN106570581B (zh) 能源互联网环境下基于属性关联的负荷预测系统及其方法
Li et al. Federated learning-based short-term building energy consumption prediction method for solving the data silos problem
CN109345409B (zh) 一种基于宽带载波的居民用户综合能效管理方法
Tian et al. Predictive model of energy consumption for office building by using improved GWO-BP
CN114386822A (zh) 基于加权余弦相似度的重点人员用电行为异常分析方法
Wang et al. New methods for clustering district heating users based on consumption patterns
CN110782153A (zh) 一种企业园区综合能效评估体系建模方法及系统
Chen et al. A new method utilizing smart meter data for identifying the existence of air conditioning in residential homes
Wang et al. A review of load forecasting of the distributed energy system
CN112149890A (zh) 基于用户用能标签的综合能源负荷预测方法及系统
Xianliang et al. Analysis to energy consumption characteristics and influencing factors of terminal building based on airport operating data
CN115660225A (zh) 一种基于电表通信模块的用电负荷预测管理方法及系统
Jing et al. Energy-saving diagnosis model of central air-conditioning refrigeration system in large shopping mall
Amasyali et al. Hybrid approach for energy consumption prediction: Coupling data-driven and physical approaches
Tavarov et al. Model and Algorithm of Electricity Consumption Management for Household Consumers in the Republic of Tajikistan.
CN115907822A (zh) 一种考虑区域及经济影响的负荷特征指标关联性挖掘方法
Yu et al. Estimating power demand shaving capacity of buildings on an urban scale using extracted demand response profiles through machine learning models
Xue et al. A framework for short-term energy consumption prediction based on room air conditioner group characteristics
CN112307675B (zh) 一种基于神经网络的温度敏感型负荷分离辨识方法及系统
Li et al. The impacts of temperature on residential electricity consumption in Anhui, China: does the electricity price matter?
CN112365082A (zh) 一种基于机器学习的公共能源消耗预测方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination