CN106716454B - 利用机器学习来识别非技术性损失 - Google Patents

利用机器学习来识别非技术性损失 Download PDF

Info

Publication number
CN106716454B
CN106716454B CN201580050923.0A CN201580050923A CN106716454B CN 106716454 B CN106716454 B CN 106716454B CN 201580050923 A CN201580050923 A CN 201580050923A CN 106716454 B CN106716454 B CN 106716454B
Authority
CN
China
Prior art keywords
data
signal
signals
energy
category
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201580050923.0A
Other languages
English (en)
Other versions
CN106716454A (zh
Inventor
托马斯·M·西贝尔
爱德华·Y·阿博
霍曼·比扎迪
阿维德·博斯塔尼
尼基尔·克里什南
赵坤雷
亨里克·奥尔松
路易斯·波里尔
杰里米·柯尔特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sirui Artificial Intelligence Co
Original Assignee
Sirui Artificial Intelligence Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sirui Artificial Intelligence Co filed Critical Sirui Artificial Intelligence Co
Priority to CN202110829239.XA priority Critical patent/CN113918139A/zh
Publication of CN106716454A publication Critical patent/CN106716454A/zh
Application granted granted Critical
Publication of CN106716454B publication Critical patent/CN106716454B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/30Creation or generation of source code
    • G06F8/34Graphical or visual programming
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01RMEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
    • G01R21/00Arrangements for measuring electric power or power factor
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01RMEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
    • G01R21/00Arrangements for measuring electric power or power factor
    • G01R21/06Arrangements for measuring electric power or power factor by measuring current and voltage
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B17/00Monitoring; Testing
    • H04B17/30Monitoring; Testing of propagation channels
    • H04B17/391Modelling the propagation channel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W52/00Power management, e.g. TPC [Transmission Power Control], power saving or power classes
    • H04W52/04TPC

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • General Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Primary Health Care (AREA)
  • Mathematical Physics (AREA)
  • Electromagnetism (AREA)
  • Marketing (AREA)
  • Human Resources & Organizations (AREA)
  • General Health & Medical Sciences (AREA)
  • Water Supply & Treatment (AREA)
  • Tourism & Hospitality (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Public Health (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Power Engineering (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Supply And Distribution Of Alternating Current (AREA)
  • Control Of Electric Motors In General (AREA)
  • Operation Control Of Excavators (AREA)

Abstract

本公开的各种实施方案可以包括被配置以选择与多个能量使用条件相关的一组信号的系统、方法和非暂时性计算机可读介质。可以确定该组信号的信号值。机器学习可应用于信号值以识别与非技术性损失相关联的能量使用条件。

Description

利用机器学习来识别非技术性损失
发明领域
本发明技术涉及能量管理领域。更具体地,本发明技术提供了用于利用机器学习来识别非技术性损失(NTL)的技术。
背景
常规能量管理工具旨在帮助公司跟踪能量使用。例如,这种工具可以收集某些类型的能量相关信息,包括计费声明和能量仪表读数。收集的信息可以用于理解或分析能量使用。这种工具还可以生成详细的能量相关信息和使用的报告。
在一些情况下,能量提供商(例如,公共设施公司)可能面临与所提供的能量损失相关的挑战,诸如技术性损失和非技术性损失(NTL)。技术性损失可包括由于预期或自然限制(诸如由于电缆、电线、电力线等的电阻造成的功率损失)而在正常使用期间的能量损失。非技术性损失可以包括不是由于这种限制的一种或多种损失。非技术性损失可能与不合规格(或不期望)的能量使用有关,诸如例如能量分配系统中的能量失窃或故障形式的损失。
对于能量提供商来说,非技术性损失可以是昂贵的。检测非技术性损失的常规方法通常需要大量的人力。此外,常规方法也可能是不准确的、低效的或无效的。因此,非技术性损失的情况常常被忽视、未被检测、被误诊或以其他方式没有得到充分解决。这些和其他问题可能给能量提供商以及他们的客户带来挑战。
概述
本公开的各种实施方案可以包括被配置以选择与多个能量使用条件相关的一组信号的系统、方法和非暂时性计算机可读介质。该组信号的信号值可以被确定。机器学习可应用于信号值以识别与非技术性损失相关联的能量使用条件。
在实施方案中,可以为多个能量使用条件生成多个N维表示。多个N维表示可以基于信号值生成。机器学习的应用可以包括将至少一个机器学习算法应用于多个N维表示以产生用于识别非技术性损失的分类器模型。
在实施方案中,多个N维表示的至少第一部分可以被预先识别为对应于非技术性损失。多个N维表示的至少第二部分可以被预先识别为对应于正常能量使用。
在实施方案中,至少一个机器学习算法可以包括监管进程,该监管进程将多个N维表示中的在第一部分的容许的N维邻近范围内的至少第三部分分类为对应的非技术性损失。监管进程还可以将多个N维表示中的在第二部分的容许的N维邻近范围内的至少第四部分分类为对应于正常能量使用。
在实施方案中,该组信号的新信号值可以被接收。新信号值可以与特定的能量使用条件相关联。可以基于新信号值针对特定能量使用条件生成新的N维表示。新的N维表示可以基于分类器模型来分类。
在实施方案中,至少一个机器学习算法可以应用于新的N维表示以修改分类器模型。
在实施方案中,新的N维表示可以被识别为对应于非技术性损失。非技术性损失可以被报告给与特定能量使用条件相关联的能量提供商。
在实施方案中,特定能量使用条件与非技术性损失相关联的确认或非确认中的至少一个可以从一个或更多个实体获取。
在实施方案中,分类器模型可以基于确认或非确认中的至少一个来修改。
在实施方案中,至少一个机器学习算法可以与支持向量机、增强决策树、分类树、回归树、bagging树、随机森林、神经网络或旋转森林中的至少一个相关联。
在实施方案中,具有与非技术性损失相关联的可能性的多个公共设施表可以被识别。多个公共设施仪表可以基于与非技术性损失相关联的可能性来进行排名。
在实施方案中,可以确定多个仪表中的至少一些满足指定的排名阈值标准。多个仪表中的至少一些可以被识别为用于调查的候选。
在实施方案中,该组信号中的一个或多个信号可以与以下中的至少一个相关联:帐户属性信号类别、异常负载信号类别、计算的状态信号类别、电流分析信号类别、丢失的数据信号类别、断开信号类别、仪表事件信号类别、月度仪表异常负载信号类别、非活动的月度仪表消耗信号类别、中断信号类别、被盗仪表信号类别、异常生产信号类别、工作订单信号类别或零读取信号类别。
在实施方案中,可以获取该组信号的一组公式。该组公式中的每个公式可以对应于该组信号中的相应信号。该组信号的信号值可以基于该组公式来计算。
在实施方案中,至少一些信号值可以来源于从与多个能量使用条件相关联的多个仪表获取的数据。
在实施方案中,可以基于对该组信号中的第二信号的修改来生成该组信号中的第一信号。
在实施方案中,可以从能量提供商接收与能量使用条件相关的、不包括在该组信号中的至少一个信号,以识别非技术性损失。
在实施方案中,至少一个机器学习算法可以包括无监管进程。在一些实例中,无监管进程可以利用未分类的数据来识别非技术性损失。
根据附图和下面的详细描述,所公开的技术的许多其它特征和实施方案将是明显的。
附图简述
图1示出了根据本公开的实施方案的能量管理平台的示例环境。
图2示出了根据本公开的实施方案的示例能量管理平台。
图3示出了根据本公开的实施方案的能量管理平台的示例应用服务器。
图4示出了根据本公开的实施方案的被配置以利用机器学习来识别非技术性损失的示例非技术性损失(NTL)识别模块。
图5示出了根据本公开的实施方案的包括一组示例信号的示例信号值的示例表。
图6示出了根据本公开的实施方案的包括基于示例信号值生成的示例N维表示的示例图。
图7示出了根据本公开的实施方案的用于利用机器学习来识别非技术性损失的示例方法。
图8示出了根据本公开的实施方案的示例机器,在所述示例机器中可以执行用于使机器执行本文描述的一个或多个实施方案的一组指令。
附图仅出于说明的目的描绘了本公开的各种实施方案,其中附图使用相同的参考标记来标识相同的元件。本领域技术人员将从以下讨论容易地认识到,可以采用图中所示的结构和方法的替代实施方案,并不脱离本文所描述的所公开的技术的原理。
详细描述
为了各种目的,每天消耗或使用能量。在一个示例中,消费者可以使用燃气来为家庭中的各种电器提供动力,并且企业可以使用燃气来操作各种机器。在另一示例中,消费者和企业可以使用电力来为各种电子设备和其他电气设备和组件供电。能量消耗通过由供应能量的能量提供商提供便利以满足需求。
能量提供商(诸如公共设施公司)可以提供一种或多种形式的能量,例如燃气和电力。能量提供商可以利用能量分配系统向其预期客户或用户提供或递送能量。在一些情况下,在递送期间可能存在能量损失。例如,即使在正常使用中,在电力线、电缆和/或电线等中可能存在电阻,使得电能在通过这些通道递送期间损失。这种能量损失归因于预期的或自然的原因,并且可以被称为技术性损失。然而,在一些情况下,除了技术性损失之外还可能有能量损失。能量可能由于不合规格或不期望的能量使用而损失。例如,能量可能由于能量分配系统及其分配节点中的盗窃和/或故障而损失(例如,故障的公共设施仪表)。这种能量损失可以称为非技术性损失(NTL)。
能量损失,诸如非技术性损失(NTL),对于能量提供商可能是昂贵的。然而,试图检测、防止和减少非技术性损失的常规方法是有问题的。通常,常规方法需要大量的人力来分析在检测非技术性损失(诸如由于盗窃或公共设施仪表故障)的尝试中的信息。此外,常规方法通常仅考虑有限量的信息。更糟的是,常规方法通常依赖于人工估计和近似,这可能导致不准确和错误计算。因此,用于检测、防止和减少非技术性损失的改进方法可能是有利的。
本公开的各种实施方案被设计为考虑所有类型的综合信息,诸如与能量分配或管理系统的能量提供商、能量客户、公共设施仪表以及其他组件相关联的信息。可以分析信息(诸如通过利用机器学习技术)以确定可能与非技术性损失相关联的属性或特性。具有类似性质或特性的能量使用的情况可以被分类为可能对应于非技术性损失。可以识别和报告这种能量使用的情况,以帮助防止或减少进一步的非技术性损失。还可以预期许多变化是可能的。
图1示出了根据本公开的实施方案的用于能量管理的示例环境100。环境100包括能量管理平台102、外部数据源1041-n、企业106和网络108。本文更详细讨论的能量管理平台102提供允许企业106跟踪、分析和优化企业106的能量使用的功能。能量管理平台102可以构成分析平台。分析平台可以为能量管理平台102的所有应用处理数据管理、多层分析和数据可视化能力。分析平台可以被特别设计以处理和分析大量频繁更新的数据,同时保持高性能水平。
能量管理平台102可以通过由用于企业106的能量管理平台102呈现的用户接口(UI)与企业106通信。UI可以向企业106提供信息并从企业106接收信息。能量管理平台102可以通过API和其他通信接口与外部数据源1041-n通信。本文更详细地讨论涉及能量管理平台102、外部数据源1041-n和企业106的通信。
能量管理平台102可以被实现为计算机系统,诸如服务器或一系列服务器和其他硬件(例如,应用服务器、分析计算服务器、数据库服务器、数据集成器服务器、网络基础设施(例如,防火墙、路由器、通信节点))。服务器可以被布置为服务器群或群集。本公开的实施方案可以在服务器侧、在客户端侧或两者的组合上实现。例如,本公开的实施方案可以由能量管理平台102的一个或多个服务器实现。作为另一示例,本公开的实施方案可以由能量管理平台102的服务器和企业106的计算机系统的组合来实现。
外部数据源1041-n可以表示与能量管理分析相关的众多可能的数据源。外部数据源1041-n可以包括例如电网和公共设施运营系统、仪表数据管理(MDM)系统、客户信息系统(CIS)、计费系统、公共设施客户系统、公共设施企业系统、公共设施节能措施和折扣数据库。外部数据源1041-n还可以包括例如建筑特征系统、天气数据源、第三方属性管理系统和工业标准基准数据库。
企业106可以表示能量管理平台102的用户(例如,客户)。企业106可以包括任何私人或公共业务,诸如大公司、中小企业、家庭、个人、管理团体、政府机构、非政府组织、非营利组织等。企业106可以包括能量提供商和供应商(例如公共设施)、能量服务公司(ESCO)和能量消费者。企业106可以与分布在许多地理位置上的一个或许多个设施相关联。企业106可以与任何目的、产业或其他类型的简况(profile)相关联。
网络108可以使用标准通信技术和协议。因此,网络108可以包括使用诸如以太网、802.11、全球微波接入互操作性(WiMAX)、3G、4G、CDMA、GSM、LTE、数字用户线路(DSL)等等的技术的链路。类似地,在网络108上使用的网络协议可以包括多协议标签交换(MPLS)、传输控制协议/因特网协议(TCP/IP)、用户数据报协议(UDP)、超文本传输协议(HTTP)、简单邮件传输协议(SMTP)、文件传输协议(FTP)等。通过网络108交换的数据可以使用包括超文本标记语言(HTML)和可扩展标记语言(XML)的技术和/或格式来表示。此外,可以使用诸如安全套接字层(SSL)、传输层安全(TLS)和互联网协议安全(IPsec)的常规加密技术对所有或一些链路进行加密。
在实施方案中,能量管理平台102、外部数据源1041-n和企业106中的每一个可以被实现为计算机系统。计算机系统可以包括一个或多个机器,其中的每一个可以被实现为在本文中进一步详细描述图8的机器800。
图2示出了根据本公开的实施方案的示例能量管理平台202。在某些实施方案中,示例能量管理平台202可以被实现为图1的能量管理平台102。在实施方案中,能量管理平台202可以包括数据管理模块210、应用服务器212、关系数据库214和键/值储存器216。
数据管理模块210可以支持根据能量管理平台202上的需求自动地和动态地缩放能量管理平台202的计算资源的网络的能力。由数据管理模块210支持的动态缩放可以包括提供附加计算资源(或节点)以适应增加的计算需求的能力。同样,数据管理模块210可以包括释放计算资源以适应减少的计算需求的能力。数据管理模块210可以包括一个或多个动作218、队列220、调度器222、资源管理器224和群集管理器226。
动作218可以表示响应于提供给能量管理平台202的请求而执行的任务。每个动作218可以表示由应用服务器212执行的工作单元。动作218可以与数据类型相关联并且绑定到引擎(或模块)。请求可以涉及能量管理平台202支持的任何任务。例如,请求可以涉及例如分析处理、加载能量相关数据、检索能源之星读数、检索基准数据等。动作218被提供给动作队列220。
动作队列220可以接收每个动作218。动作队列220可以是分布式任务队列,并且表示要被路由到适当的计算资源然后被执行的工作。
调度器222可以将排队的动作关联到将执行该动作的引擎并将排队的动作切换到该动作的引擎。调度器222可以基于负载平衡和其他优化考虑来控制每个排队动作到应用服务器212中的特定一个的路由。在当前计算资源处于或高于阈值容量时,调度器222可以从资源管理器224接收用于供应新节点的指令。在当前计算资源处于或低于阈值容量时,调度器222可以从资源管理器接收用于释放节点的指令。调度器222因此可以指示群集管理器226基于对计算资源的需求动态地供应新节点或释放现有节点。节点可以是与应用服务器212、关系数据库214和键/值储存器216连接的计算节点或存储节点。
资源管理器224可以监视动作队列220。资源管理器224还可以监视应用服务器212上的当前负载,以确定用于执行排队动作的资源的可用性。基于监视,资源管理器可以通过调度器222与群集管理器226通信,以请求节点的动态分配和解除分配。
群集管理器226可以是管理应用服务器212的所有节点的分布式实体。群集管理器226可以基于对计算资源的需求动态地供应新节点或释放现有节点。群集管理器226可以实现组成员服务协议。群集管理器226还可以执行任务监视功能。任务监控功能可以涉及跟踪资源使用,诸如CPU利用率、读/写的数据量、存储大小等。
应用服务器212可以执行管理或托管分析服务器执行、数据请求等的进程。由能量管理平台202提供的引擎(诸如执行数据服务、批处理、流服务的引擎)可以在应用服务器212内托管。本文更详细地讨论了引擎。
在实施方案中,应用服务器212可以是多个松散或紧密连接的计算机的计算机群集的一部分,这些计算机被协调以在执行能量管理平台202的服务和应用时作为系统来工作。群集的节点(例如,服务器)可以通过快速局域网(“LAN”)彼此连接,其中每个节点运行其自己的操作系统的实例。应用服务器212可以被实现为计算机群集以将其性能和可用性提高到高于单个计算机的性能和可用性,同时是通常比具有可比速度或可用性的单个计算机更具成本效益。应用服务器212可以是软件、硬件或两者的组合。
关系数据库214可以维护支持能量管理平台202的各种数据。在实施方案中,如本文更详细地讨论的,非时间序列数据可以存储在关系数据库214中。
键/值储存器216可以维护支持能量管理平台202的各种数据。在实施方案中,如本文更详细讨论的,时间序列数据(例如,仪表读数、仪表事件等)可以存储在键/值存储中。在实施方案中,键/值储存器216可以用Apache Cassandra来实现,其中Apache Cassandra是被设计为处理在众多商品服务器上的大量数据的开源分布式数据库管理系统。在实施方案中,可以使用用于键/值存储的其他数据库管理系统。
在实施方案中,应用服务器212、关系数据库214和键/值储存器216中的一个或多个可以由拥有、维护或控制能量管理平台202的实体来实现。
在实施方案中,应用服务器212、关系数据库214和键/值储存器216中的一个或更多个可以由第三方实现,该第三方可以向拥有、维护或控制能量管理平台202的实体提供用于租赁的计算环境。在实施方案中,由第三方实现的应用服务器212、关系数据库214和键/值储存器216可以通过诸如网络208的网络与能量管理平台202通信。
由第三方为拥有、维护或控制能量管理平台202的实体提供的计算环境可以是云计算平台,该云计算平台允许拥有、维护或控制能量管理平台202的实体租用虚拟计算机,在虚拟计算机上运行实体自己的计算机应用。这种应用可以包括例如由应用服务器200执行的应用,如本文更详细地讨论的。在实施方案中,计算环境可以通过提供web服务来允许应用的可扩展部署,通过该web服务,拥有、维护或控制能量管理平台202的实体可以启动用于创建包含任何期望的软件的虚拟机的虚拟设备。在实施方案中,拥有、维护或控制能量管理平台202的实体可以根据需要创建、启动和终止服务器实例,基于时间使用时间、数据使用或这些或其他因素的任何组合进行支付。以这种方式提供和释放计算资源的能力支持能量管理平台202根据能量管理平台202上的需求进行动态缩放的能力。
图3示出了根据本公开的实施方案的能量管理平台的示例应用服务器300。在实施方案中,图2的应用服务器212中的一个或多个可以利用图3的应用服务器300来实现。应用服务器300包括数据集成器(数据加载)模块302、集成服务模块304、数据服务模块306、计算服务模块308、流分析服务模块310、批量并行处理分析服务模块312、规范化模块314、分析容器316、数据模型318和用户界面(UI)服务模块324。在某些实施方案中,应用服务器300还可以包括非技术性损失(NTL)识别模块330。
应用服务器300支持的分析平台包括多个服务,每个服务处理特定的数据管理或分析能力。服务包括数据集成器模块302、集成服务模块304、数据服务模块306、计算服务模块308、流分析服务模块310、批量并行处理分析服务模块312和UI服务模块324。分析平台内的所有或一些服务可以是模块化的,并且因此被具体地构造以针对大数据量和高速度执行它们各自的能力。可以通过包括应用服务器212的计算机群集上的用于高性能分布式计算的软件中优化服务。
图3中的应用服务器300的模块和组件以及本文的所有附图仅仅是示例性的,并且可以被不同地组合成更少的模块和组件,或者被分离成额外的模块和组件。所描述的模块和组件的功能可以由其他模块和组件执行。
数据集成器模块302是用于将维护在外部数据源1041-n的软件系统或数据库中的数据自动导入到图1的能量管理平台102中的工具。导入的数据可以用于能量管理平台102或应用服务器300的各种应用。数据集成器模块302从广泛的数据源接受数据,包括电网和操作系统(诸如MDM、CIS和计费系统)以及第三方数据源(诸如天气数据库、建筑物数据库(例如,城市规划委员会数据库)、第三方财产管理系统和外部基准数据库。导入的数据可以包括例如以最小每日或其他时间间隔(例如,15分钟间隔)提供的仪表数据(例如,电力消耗、用水量、天然气消耗)、以每日或其它时间间隔(例如,每小时间隔)的天气数据(例如,温度、湿度)、建筑物数据(例如,平方英尺、占用、年龄、建筑类型、楼层数、空调平方英尺)、群集定义(层级)(例如,仪表所属建筑、建筑所属城市街区、建筑物的区域识别)和资产数据(例如,HVAC资产的数量和类型,生产单元的数量和类型(用于工厂))。
数据集成器模块302还具有从平面文件(诸如Excel电子表格)导入信息的能力,并且具有捕获直接输入到能量管理平台102的应用中的信息的能力。通过结合来自广泛的源阵列的数据,应用服务器300能够执行复杂和详细的分析,实现更大的商业洞察。
数据集成器模块302提供一组标准化规范对象定义(标准化接口定义),所述标准化规范对象定义可用于将数据加载到应用服务器300的应用中。数据集成器模块302的规范对象可以基于当前或新兴的公共设施工业标准(诸如公共信息模型(CIM)、绿色按钮和开放自动数据交换)或基于应用服务器300的规范。应用服务器300可以支持这些和其他标准,以确保大范围的公共设施数据源将能够容易地连接到能量管理平台102。规范对象可以包括,例如:
Figure BDA0001250820810000111
一旦接收到规范形式的数据,数据集成器模块302可以根据数据模型318将数据变换成单独的数据实体,使得数据可以被加载到数据库模式中以被存储、处理和分析。
数据集成器模块302能够处理非常大量的数据(例如,“大数据”)。例如,数据集成器模块302可以频繁地处理来自数百万个数字仪表的间隔数据。为了接收数据,应用服务器300可以提供一致的安全web服务API(例如,REST)。集成可以在异步批处理或实时模式下执行。数据集成器模块302可以合并来自例如公共设施客户系统、建筑特征系统、工业标准基准系统、公共设施节能措施和折扣数据库、公共设施企业系统、MDM和公共设施运营系统的实时和批量数据。当外部数据源不具有提取数据的API或计算机化装置时,应用服务器300可以直接从与外部数据源相关联的网页(例如,通过使用网络抓取)提取数据。
数据集成器模块302还可以执行初始数据验证。数据集成器模块302可以检查输入数据的结构,以确保存在所需的字段并且数据具有正确的数据类型。例如,数据集成器模块302可以识别所提供的数据的格式与期望的格式不匹配(例如,数字值被错误地提供为文本格式)、防止不匹配的数据被加载,并且记录问题以供查看和调查。以这种方式,数据集成器模块302可以用作确保输入数据满足准确分析的要求的第一防线。
集成服务模块304用作数据验证或校对的第二层,确保在数据被加载到数据库或存储之前是无错误的。集成服务模块304从数据集成器模块302接收数据、在数据流入时监视数据、执行第二轮数据检查,并将数据传递到数据服务模块306以被存储。
集成服务模块304可以提供各种数据管理功能。集成服务模块304可以执行重复处理。集成服务模块304可以识别数据重复的情况,以确保分析在单个数据集上被准确地进行。集成服务模块304可以被配置以根据用户指定的商业需求来处理重复(例如,将两个重复记录视为相同或对重复记录取平均)。这种灵活性允许应用服务器300符合用于数据处理的客户标准。
集成服务模块304可以执行数据验证。集成服务模块304可以检测数据间隙和数据异常(例如,统计异常)、识别异常值以及进行参考完整性检查。参考完整性检查确保数据具有正确的关联网络,以实现分析和聚合,诸如确保加载的仪表数据与设施相关联,或者相反,确保设施具有关联的仪表。集成服务模块304根据用户指定的商业需求来解决数据验证问题。例如,如果存在数据间隙,则可以使用线性插值来填充丢失的数据,或者间隙可以保持原样。
集成服务模块304可以执行数据监视。集成服务模块304可以在整个数据加载进程中提供端到端的可见性。用户可以在从重复检测到数据存储的过程中监视数据集成进程。这种监视有助于确保数据被适当地加载,并且没有重复和验证错误。
数据服务模块306负责存留(存储)大的数据量和不断增加的数据量,同时还使数据容易用于分析计算。数据服务模块306将数据分割成关系和非关系(键/值存储)数据库,并且还对存储的数据执行操作。这些操作包括创建、读取、更新和删除数据。数据服务模块306的数据引擎可以存留数据用于流处理。数据服务模块306的数据引擎还可以结合用于批量并行处理的批作业来识别要处理的数据集。
数据服务模块306可以执行数据分割。数据服务模块306利用关系数据存储和非关系数据存储(诸如图2的关系数据库214和键/值储存器216)的优势。通过将数据“分割”成两个单独的数据存储,关系数据库214和键/值储存器216,应用服务器300确保其应用可以有效地处理和分析大量数据,诸如源自仪表和电网传感器的间隔数据。根据能量管理平台102的数据模型318存储关系数据库214和键/值储存器216中的数据。
关系数据库214被设计以管理结构化和缓慢变化的数据。这种数据的示例包括组织(例如,客户)和设施数据。关系数据库(像关系数据库214)被设计用于随机存取更新。
键/值储存器216被设计以管理非常大量的间隔(时间序列)数据,诸如仪表和电网传感器数据。键/值存储(像键/值储存器216)被设计用于以特定顺序读取的大的“仅附加”数据的流。“仅附加”是指仅添加到关联文件末尾的新数据。通过使用用于间隔数据的专用键/值储存器216,应用服务器300确保这种类型的数据被有效地存储并且可以被快速访问。
数据服务模块306可以执行分布式数据管理。数据服务模块306可以包括事件队列,所述事件队列安排提供通知以执行流处理和批量并行处理。关于批量并行处理,安排可以基于考虑能量管理平台102中的相关联的群集中的处理资源的可用性的规则。随着数据量增长,数据服务模块306自动地向群集添加节点以适应(例如,存储和进程)新数据。随着节点被添加,数据服务模块306自动地在所有节点上重新平衡和分割数据,确保持续的高性能和可靠性。
计算服务模块308是分析函数的库,所述分析函数的库由流分析服务模块310和批量并行处理分析服务模块312调用以执行商业分析。该函数可以单独或组合执行以形成复杂的分析。由计算服务模块308提供的服务可以是模块化的(即,专用于单个任务),使得计算服务模块308可以同时并快速并行地处理大量计算,这允许显著的计算可扩展性。
计算服务模块308还可以利用分布式处理来创建甚至更大的可扩展性。例如,如果用户对计算数十万个仪表的平均年度用电量感兴趣,则能量管理平台102能够通过在多个服务器上分布请求来快速响应。
流分析服务模块310对实时和近实时数据流执行复杂分析。流可以表示例如来自仪表、子仪表或电网传感器的高容量数据的馈送。在实施方案中,流可以是数据监管和数据采集(SCADA)馈送。当分析需要在数据生成后不久进行时,可以调用流分析服务模块310来分析该数据。
流分析服务模块310可以包括流处理器,以将流转换为根据数据模型318的数据。流分析服务模块310还可以包括流处理逻辑,其可以由能量管理平台102的用户提供。流处理逻辑可以提供可以被存留并且用于后续分析的计算结果。流处理逻辑还可以基于计算结果提供警报。例如,当负载出现意外和显着的下降或尖峰时,公共事业公司(utility)可能希望接收警报和即时分析。这种负载变化可能是由设备的故障件或设备突然损坏引起的,并且可能表示对分配系统或最终用户的巨大风险。关于意外负载变化的数据可以被快速识别、分析并用于发送必要的警报。流处理逻辑还可以在处理原始流之后,基于处理的原始流来提供新流用于另一目的或用于能量管理平台102的应用。
流分析服务模块310可以执行近实时的连续处理。因为由流分析服务模块310进行的处理在数据到达之后非常快地发生,所以由能量管理平台102提供的时间敏感的高优先级分析是有意义的(relevant)和可行的。
流分析服务模块310可以提供水平可扩展性。为了同时管理大量的数据,由流分析服务模块310进行的处理可以分布在整个服务器群集(一起工作的一组计算机)中。
流分析服务模块310可以提供容错。流可以被存留。如果在一个节点(例如,群集中的计算机)上发生处理故障,则工作负载将被分发到群集内的其他节点而没有数据丢失。在对流执行的处理完成之后,可以丢弃流。
提供非限制性示例以示出流分析服务模块310的性能。假设最近产生的电力消耗和需求数据的流。流可以被提供给与数据服务模块306相关联的事件队列。当数据到达事件队列时,触发自动分析进程。多个分析进程或分析可以在相同的数据集上运行。分析进程可以并行执行。对相同数据集的并行处理能够更快地处理多个分析。这些分析进程的输出可以是警报和计算,然后将警报和计算存储在数据库中并使其可作为分析结果用于指定的终端用户。分析进程和处理任务可以分布在支持流分析服务模块310的多个服务器上。以这种方式,大数据量可以由流分析服务模块310快速处理。
批量并行处理分析服务模块312可以执行能量管理平台102的用户所需的大部分分析。批量并行处理分析服务模块312可分析由当前和历史数据组成的大数据集以创建报告和分析,诸如周期性关键性能指标(KPI)报告、历史电力使用分析、预测、异常值分析、能效项目财务影响分析等。在实施方案中,批量并行处理分析服务模块312可以基于MapReduce(用于处理大型数据集并将计算分布在一个或多个计算机群集上的编程模型)。批量并行处理分析服务模块312自动执行并行化、容错和负载平衡的任务,从而提高处理密集型任务的性能和可靠性。
提供非限制性示例以示出批量并行处理分析服务模块312的性能。作为示例,能量强度的基准分析、针对关键性能指标的性能汇总以及由于非技术性损失导致的未计费能量的分析可以是由批量并行处理分析服务模块312处理的作业。当在能量管理平台102中调用批处理作业时,与批量并行处理分析服务模块312相关联的输入读取器将处理作业分解为多个较小批量。这种分解降低了作业的复杂性和处理时间。然后,将每个批次传递给工作进程以执行其分配的任务(例如,计算或估计)。然后将结果“混洗”,其指的是数据集的重新排列,使得下一组工作进程可以有效地完成计算(或估计)并通过输出写入器将结果快速写入数据库。
批量并行处理分析服务模块312可以跨多个服务器分配工作进程。这种分布式处理用于充分利用群集的计算能力并确保计算快速有效地完成。以这种方式,批量并行处理分析服务模块312提供可扩展性和高性能。
规范化模块314可以规范化要在键/值储存器216中维护的仪表数据。例如,仪表数据的规范化可以涉及填充数据中的空白和解决数据中的异常值。例如,如果预期仪表数据处于一致的间隔,但是实际提供给能量管理平台102的数据在某些间隔处不具有仪表数据,则规范化模块314可以应用某些算法(例如,内插)来提供丢失的数据。作为另一示例,能量使用的反常值可以由规范化模块314检测和解决。在实施方案中,规范化模块314执行的规范化可以是可配置的。例如,规范化模块314使用的算法(例如,线性、非线性)可以由能量管理平台102的管理员或用户指定。规范化数据可以被提供给键/值储存器216。
UI服务模块324为能量管理平台102的所有应用提供图形框架。UI服务模块提供分析结果的可视化,使得终端用户可以接收清晰且可行的洞察。在由流分析服务模块310或批量并行处理分析服务模块312完成分析之后,它们可以由UI服务模块324以图形方式呈现、提供给能量管理平台102的适当的应用,并且最终呈现在用户的计算机系统(例如,机器)上。这以直观和易于理解的格式向用户提供数据洞察。
UI服务模块324提供了许多特征。UI服务模块324可以提供图表类型的库和页面布局的库。图表类型和页面布局的所有变体由UI服务模块324维护。UI服务模块324还可以提供页面布局定制。用户(诸如管理员)可以添加、重命名和分组字段。例如,能量管理平台102允许公共设施管理员将能量强度、能量消耗和能量需求一起分组在页面上以便于观看。UI服务模块324可以提供基于角色的访问控制。管理员可以确定应用的哪些部分将对某些类型的用户可见。使用这些特征,UI服务模块324确保终端用户享受一致的视觉体验,访问与他们的角色相关的能力和数据,并且可以与提供清晰的商业洞察的图表和报告交互。
此外,在一些实现中,应用服务器300包括非技术性损失(NTL)识别模块330,如图3所示。非技术性损失识别模块330可以被配置以便于利用机器学习来识别非技术性损失。在某些实施方案中,非技术性损失识别模块330可以被实现为硬件、软件和/或其组合。还设想在一些实例中,非技术性损失识别模块330的一个或多个部分或组件可以利用图1的能量管理平台102的一个或多个其他模块、引擎和/或组件来实现。
在一个示例中,非技术性损失识别模块330可以被配置以获取或确定指示非技术性损失(例如,NTL)的存在的一组信号的信号值。指示非技术性损失的存在的该组信号可以直接或间接地反映能量使用的各种条件。这种能量使用条件可以涉及例如能量使用的类型、能量使用的状态、能量使用的量、仪表的能量使用读数、仪表的操作状态、能量提供商的客户账户的状态,以及任何直接或间接反映能量供应、使用、可用性和付款的其他考虑。来自该组信号的每个信号可以反映特定的能量使用条件。来自该组信号中的信号的信号值可以是描述与信号相关联的能量使用条件的大小、类型或存在(或不存在)的数值、布尔、二进制或定性值。例如,能量使用条件可以指各种情况,在这些情况期间能量正被使用或消耗,包括零消耗或不使用的情况。在一些情况下,能量使用条件可以表示由能量或公共设施仪表(例如,燃气表、电表、水表等)测量的能量使用的状态(例如,当前状态)。在一些情况下,特定能量使用条件可以与由特定能量消耗者或客户在特定时间或间隔在特定场所的特定地理位置处使用特定类型的能量相关联。因此,能量使用条件不仅可以与测量使用的仪表相关联,而且还与客户信息、位置信息、场所类型、日期和时间等相关联。
该组信号可以对应于基于所获取的数据(诸如从图1的外部数据源1041-n接收的数据)生成的选定的一组分析或特征。在某些实施方案中,可以基于研究、开发、观察、机器学习和/或实验等来选定、选择或确定该组信号。例如,基于经验分析,可以确定某些信号对于指示非技术性损失(NTL)更有用,并且因此这些信号被选定或优先于不能或不太可能指示非技术性损失的其他信号。从数据源接收的数据可以包括但不限于AMI系统数据(仪表数据管理和头端数据)、客户信息数据、客户消费数据、计费信息、合同信息、仪表事件信息、中断管理系统(OMS)数据、发生器生成、工作订单管理(WO)数据、验证的盗窃和故障数据、天气和地理定位。数据源可以包括但不限于电网和公共设施操作系统、仪表数据管理(MDM)系统、客户信息系统(CIS)、计费系统、公共设施客户系统、公共设施企业系统、公共设施节能措施、折扣数据库、建筑特征系统、天气数据源、第三方财产管理系统、行业标准基准数据库等。
借助于在大量信号类别中的大量的各种信号和这些信号的相应信号值,可以实现对能量使用的更好的理解。可以生成来自各种信号类别的类别的每个信号,并且基于所获取的数据的至少一部分来计算其相应的信号值。在一些情况下,可以存在数十个信号类别,并且在每个信号类别内,存在数百个信号或更多。本公开将仅讨论几个示例。应当理解的是,除了本文中明确讨论的那些之外的许多信号类别及其信号也可以被利用。在一些实现中,信号值可以是数值、在0和1之间的值、二进制值等。
示例信号类别是“帐户属性”信号类别。“帐户信号”类别可以包括各种信号。例如,“帐户信号”类别的第一信号可以被称为“季节性仪表”信号。“季节性仪表”信号可以指示房屋(或客户)是否被记录为季节性的,例如对于度假屋。来自CIS的数据(例如客户信息和客户消费数据)可以指示房屋是季节性的,并且可以为“季节性仪表”信号设置信号值以表示房屋是季节性的。
作为另一示例,“帐户属性”信号类别的第二信号可以被称为“服务断开”信号。“服务断开”信号可以指示房屋是否具有服务点,所述服务点在相关的分析时间(例如,数据获取的时间)已经终止或断开的。如果服务点已断开,则“服务断开”信号的信号值将指示服务点已断开。如果服务点没有被断开,则信号值将指示服务点尚未被断开。
另一个示例信号类别是“异常负载”信号类别。“异常负载”信号类别可以包括“有功功率与无功功率曲线分析”信号,其涉及分析有功和无功功率数据并识别指示盗窃和/或故障的异常模式。例如,“有功功率与无功功率曲线分析”信号的信号值可以表征给定客户的逐年消耗模式的不规则变化,这可以指示盗窃和/或故障的可能性。“异常负载”信号类别还可以包括“具有逐年消耗下降的天数计数”信号,其涉及记录具有逐年减少使用的天数。此外,“异常负载”信号类别可以包括“逐年变化(每四分之一小时)”信号,其涉及计算从一年到上一年的同一个月(one month from one year to the previous year)期间的消耗的最大差异。此外,“异常负载”信号类别可以包括与跟踪消耗曲线并且当仪表的15天滚动平均消耗下降超过20%时记录有关的“消耗下降”信号。
另一示例信号类别是“计算状态”信号类别,其可以包括促进交叉检查仪表的状态的信号,例如通过检查仪表状态是否被设置为活动的或者仪表是否报告通信问题。该类别中的“仪表位置室内”信号可以指示仪表在室内。该类别中的“仪表位置室外”信号可以指示仪表在室外。该类别中的“服务不活动的消耗(电)”信号可以指示服务不活动,但是尽管如此在仪表上仍然存在电消耗。
另一示例信号类别是“非活动消耗”信号类别。“非活动消耗”信号类别可以包括“非活动消耗”信号,其涉及检测具有由公共设施公司断开的服务帐户的、非零消费的客户。“非活动消耗”信号类别还可以包括“非活动消耗(燃气)”信号,其涉及没有服务协议活动的情况,但是仪表上存在燃气消耗。
另一示例信号类别是“电流分析”信号类别。该类别中的信号可以与分析历史电流(安培数)曲线相关联,以评估在负载谐波、实际功率与无功功率测量以及潜在中断之间的任何不一致。该类别可以包括指示电流互感器(CT)大于0.5安培的间隔的“CT>0.5安培”信号和指示电流互感器(CT)小于0.05安培的间隔的“CT<0.05安培”信号。
另一示例信号类别是“丢失数据”信号类别,其包括与丢失数据相关的信号。该信号类别中的“丢失数据”信号涉及识别仪表是否丢失消耗数据。
另一示例信号类别是“断开”信号类别,其包括与评估仪表是否已经从通信网络断开相关联的信号。此类别中的“电断开不可达”信号可以指示远程断开的高级计量基础设施(AMI)仪表变得不可达之后的天数。此类别中的“硬断开后通信”信号可以指示在服务点在极点或服务前期(head)断开后检测到网络接口控制器(NIC)电源恢复事件。此类别中的“不可达之前断开的天数”信号可以指示仪表在变得不可达之前断开的天数。
另一示例信号类别是“仪表事件”信号类别,其包括跟踪各种仪表事件(例如,仪表篡改事件、仪表故障事件、仪表最后气息事件(meter last gasp event)等)并且过滤任何噪声(例如,由于被仪表报告的大量仪表事件,其中许多是假阳性)的信号。此类别中的“故障事件”信号可以识别具有故障事件的仪表,并且可以计算已触发故障事件的次数。此类别中的“故障和关闭事件计数”信号可以识别具有故障事件的仪表,并且可以计算故障和关闭事件的读数。该类别中的“损害事件计数”信号可以评估记录的仪表损害事件的数量。在该信号类别中的“与关闭仪表事件组合的故障组合的损害”可以识别具有组合的仪表事件的仪表,包括损害事件、故障事件和关闭事件。
另一示例信号类别是“每月仪表”信号类别,其包括与每月间隔报告数据的仪表相关联的信号。这些信号可以提供对每月报告仪表的洞察,或者更一般地,可以便于利用较少可用数据来预测模式。此信号类别中的“最大每月消耗下降”信号可以记录最大逐月消耗下降。此类别中的“逐年变化(每月、季节的)”信号可以计算非季节性仪表的从一年到上一年的同一个月期间的消耗的最大差异。“非活动仪表消耗(每月)”信号可以识别仪表合同已结束,并且在合同终止日期之后记录的非零(每月)消耗。
另一示例信号类别是“中断”信号类别,其包括可以跟踪中断、干扰并且可以与消耗曲线相关的信号,以提供关于仪表是否被损害或者仪表是否经历中断的更多洞察。此类别中的“线路中断事件”信号可以识别是否针对仪表记录了线路中断事件。该类别中的“与消耗下降相关的中断”信号可以跟踪中断数据,并且当存在与消耗曲线中的下降相关的中断时设置标志。此类别中的“部分线路中断事件”信号可以跟踪是否检测到部分线路中断事件。
另一示例信号类别是“被盗仪表”信号类别。此类别中的“中断和被盗仪表”信号涉及仪表是否被盗,以及它是否在短暂的中断中发生。此类别中的“被盗仪表距离”信号涉及仪表距离预期安装位置是否>300英尺。
另一示例信号类别是“异常生产”信号类别,其包括可跟踪生产电力(例如,太阳能电力)的网络计量客户并且可以检测到生产数据是异常的信号。该类别中的“黑暗后生产”信号可以识别是否检测到在黑暗时间期间的生产(逆向消耗)。该类别中的“黑暗后电力生产”信号可以指示在黑暗时间期间产生的电力。
另一示例信号类别是“工作订单”信号类别,其包括跟踪工作订单以获得洞察的信号,所述洞察是关于客户是否已被报告偷窃或在他或她的帐户上具有未付款历史等。“工作订单”类别中的信号可以在与消耗模式和盗窃模式相关联的洞察中是强大的。此类别中的“取消工作订单”信号可以识别对于错过支付的客户的服务的取消。此类别中的“合同变更”信号可以识别合同的服务更改是否已注册。此类别中的“仪表变化”信号可以为与仪表变化相对应的每个工作订单生成结果。
另一示例信号类别是“零读取”信号类别,其包括跟踪仪表上的零读取的信号,以检测不匹配最近邻居或对等账户群集的零消耗模式。该类别中的“间歇零读数”信号可以识别对于指定数量的顺序仪表读数持续的仪表零读数(例如,在指定时间段内)。此类别中的“与中断(非季节的)相关的持续零读数”信号可跟踪与中断(非季节的)仪表相关的持续零读数(例如,超过7天)。该类别中的“间歇零”信号可以指示持续指定时间段(例如,至少6小时)的零读取时间段。
同样,本文所描述的信号和信号类别是示例性的,并且是出于说明的目的。可以附加地或备选地采用其他合适的信号和信号类别。还可以预期许多变化是可能的。在一些情况下,可以存在比本文所描述的信号更多(或更少)的信号。在某些实施方案中,可以基于对该组信号中的第二信号的修改来生成该组信号中的第一信号。在一个示例中,可以基于第二信号的置换来生成第一信号。在另一个示例中,可以基于第二信号和第三信号的组合来生成第一信号。
在一些实例中,可以存在比本文所描述的信号类别更多(或更少)的信号类别。例如,在某些实施方案中,该组信号中的一个或多个信号可以与以下中的至少一个相关联:帐户属性信号类别、异常负载信号类别、计算的状态信号类别、非活动消耗信号类别、电流分析信号类别、丢失的数据信号类别、断开信号类别、仪表事件信号类别、月度仪表异常负载信号类别、非活动的月度仪表消耗信号类别、中断信号类别、被盗仪表信号类别、异常生产信号类别、工作订单信号类别或零读取信号类别。
在从所选信号类别确定一组所选信号之后,可以基于从数据源接收的数据来确定信号的信号值。在一些实施方式中,确定信号值可以包括确定该组信号的一组公式。该组公式中的每个公式可以对应于该组信号中的相应信号。然后,可以基于该组公式计算该组信号的信号值。通过说明的方式,“消耗下降”信号的信号值可以对应于与仪表的平均消耗相比的仪表的数字消耗下降量。应了解的是,可针对各种其它信号获取或开发许多其它公式。此外,在一些实施方式中,信号值可以在该组信号上被规范化。
在确定用于该组信号的信号值之后,非技术性损失识别模块330可基于信号值产生多个N维表示(例如,N维空间中的点)以用于多个能量使用条件,其中N表示指示非技术性损失的存在的一组信号中的信号的数量(即,信号量)。例如,如果存在150个信号,则N维表示可以具有150个维度。每个维度可以对应于相应的信号。多个能量使用条件中的特定能量使用条件基于信号值可以表示为具有坐标的N维空间中的点。
非技术性损失识别模块330还可以将至少一个机器学习算法应用于多个N维表示以产生用于识别非技术性损失的分类器模型。分类器模型可以用于识别可能涉及诸如以盗窃或故障的形式的非技术性损失的能量使用条件。
图4示出了根据本公开的实施方案的被配置以利用机器学习来识别非技术性损失的示例非技术性损失(NTL)识别模块400。示例非技术性损失识别模块400可以实现为图3的非技术性损失识别模块330。如上所述,在某些实施方案中,非技术性损失识别模块400的各个部分可以被实现为图2的能量管理平台202的一个或多个组件。例如,在某些实施方案中,非技术性损失识别模块400的至少一些部分可以被实现为图3的应用服务器300的一个或多个组件。
如图4中所示,非技术性损失识别模块400可以包括信号数据获取模块402、N维表示模块404、机器学习模块406和结果处理模块408。信号数据获取模块402可以被配置以确定该组信号的一组信号和相关联的信号值。信号值可以与多个能量使用条件相关联。在某些实施方案中,信号数据获取模块402可以被实现为驻留在图3的数据集成器模块302中,和/或结合图3的数据集成器模块302来操作。可以接收来自外部数据源1041-n的数据,并且可以基于这种接收的数据生成该组信号。信号数据获取模块402可以确定该组信号的信号值,诸如通过应用该组信号的一组公式。该组公式中的每个公式可以对应于该组信号中的相应信号。在一些情况下,该组公式可以从研究、分析、观察、实验等导出或开发。信号数据获取模块402可以被配置以基于该组公式计算该组信号的信号值。在一些情况下,能量使用的每个条件可以由一个或多个相应的信号值表示。例如,特定的一组信号值可以与特定位置和场所处的特定客户的特定公共设施仪表的当前状态相关联。
N维表示模块404可以被配置以生成多个能量使用条件的多个N维表示。可以基于信号值生成多个N维表示。可以基于与能量使用的相应条件相关联的信号值来生成每个N维表示。每个N维表示可以具有对应于该组信号的信号量的N维。在一个示例中,每个能量使用条件可以表示为N维空间中的点,并且可以具有与其相应的信号值相对应的坐标。在另一个示例中,每个能量使用条件可以表示为N维向量,所述N维向量具有与其相应的信号值相对应的向量值。也可以使用其他N维表示。
机器学习模块406可以被配置以将至少一个机器学习算法应用于多个N维表示。可以基于对多个N维表示应用至少一个机器学习算法来产生、开发或生成用于识别非技术性损失的分类器模型。
在某些实施方案中,至少一个机器学习算法可以与监管进程相关联。在一个示例中,多个N维表示的至少第一部分可以已经被预先识别或验证为对应于非技术性损失。多个N维表示的至少第二部分可以已经被预先识别或验证为对应于正常能量使用。机器学习模块406可以基于新信号值与已经被验证为正常或与NTL相关联的N维表示的接近度,将与新能量使用条件相关联的新信号值分类为正常或与NTL相关联。机器学习模块406可以被配置以确定与第一部分接近或群集的一个或多个N维表示。机器学习模块406可以将与第一部分接近或群集的这些一个或多个N维表示分类为对应于非技术性损失,因为它们具有与第一部分的属性类似的属性(例如,信号值)。在一些情况下,当第一表示和第二表示在彼此的容许的N维接近度(或阈值)内时,第一表示邻近(或群集、靠近等)第二表示。例如,机器学习模块406可以将多个N维表示中的至少第三部分(其在第一部分的容许的N维接近度内)分类为对应于非技术性损失。
相似地,机器学习模块406可以将与第二部分接近或群集的一个或多个N维表示分类为对应于正常能量使用,因为它们具有与第二部分的属性相似的属性(例如,信号值)。例如,机器学习模块406可以将多个N维表示中的至少第四部分(在第二部分的容许的N维接近度内)分类为对应于正常能量使用。
此外,机器学习模块406可以被配置以接收或获取该组信号的新信号值。新的信号值可以与关于新的能量使用条件的改变的环境相关联。例如,可以从特定公共设施计量表接收新数据,并且可以基于接收到的新数据来计算新信号值。机器学习模块406可以基于新的信号值生成用于新的能量使用条件的新的N维表示。例如,新信号值可以用于在N维空间中生成新点。由于信号值和N维表示是新的,它们还没有被分类。机器学习模块406可以基于分类器模型对新的N维表示进行分类。例如,如果分类器模型指示新的N维表示类似于(或者在N维接近度中足够靠近于、邻近、群集等)已经被分类为对应于非技术性损失的N维表示的另一个表示群集,则新的N维表示也可以被分类为对应于非技术性损失。因此,至少一个机器学习算法可以有助于基于信号值将至少一些N维表示映射到非技术性损失。另一方面,如果分类器模型确定新表示与被分类为正常能量使用的另一表示相似,则新表示可以被分类为正常能量使用。
在一些实例中,至少一个机器学习算法包括无监管进程。因此,未分类的数据(例如,新的信号值)可以用于检测用于识别非技术性损失的新模式、趋势、属性和/或特性。例如,可以假设高密度群集的N维表示对应于正常使用。无监管进程可以尝试对在高密度群集外部或基本上从高密度群集分离的N维表示的小群集进行分类。如果小群集中的一个表示被验证为对应于非技术性损失,则整个小群集可以被分类为对应于非技术性损失。在一些情况下,人工查看或确认可以促进无监管进程。
在一些情况下,可以获取和分析与新能量使用条件相关联的一个或多个新信号值,以连续地或周期性地训练分类器模型。通过监管进程或无监管进程,可以分析新的信号值以提供对更准确地识别可能与非技术性损失相关联与可能正常的能量使用条件的改进的理解。随着机器学习模块406接收到指示非技术性损失的新信号值和指示正常能量使用的新信号值,至少一个机器学习算法可修改分类器模型以考虑新信号值。因此,分类器模型可以随时间学习、改变和改进。在某些实施方案中,分类器模型可以确定:,用于分类能量使用条件的某些信号基于它们的信号值可能对于非技术性损失的确定不是特别相关或重要。因此,能量使用识别模块400可以选择性地考虑消除非技术性损失的识别中的某些信号。
在某些实施方案中,可以选择信号以便最大化产出。在此上下文中,产出可以指正确识别的提示(lead)相对于与非技术性损失的潜在实例相关的总提示的数字。还可以选择信号以最小化假阳性。假阳性可以指非正确识别的非技术性损失的实例,这可能导致相关的成本和延迟。
在某些实施方案中,至少一个机器学习算法可以与支持向量机、增强决策树、分类树、回归树、bagging树、随机森林、神经网络或旋转森林中的至少一个相关联。应当理解的是,可以利用许多其它变化、方法、技术和/或进程。
结果处理模块408可以被配置以促进数据的处理,诸如将至少一个机器学习算法应用于多个N维表示所产生的数据。在某些实施方案中,结果处理模块408可以被配置以识别具有与非技术性损失相关联的可能性的多个公共设施仪表,诸如气量计、功率计和水表。例如,所识别的仪表可以与能量使用条件相关联,所述能量使用条件由已经被分类为对应于非技术性损失的某些N维表示来表示。
此外,结果处理模块408可以基于与所述非技术性损失相关联的可能性对所识别的多个公共设施仪表进行排名。例如,结果处理模块408可以基于所识别的仪表与非技术性损失相关联的相应可能性来为其生成排名或分数。在一些实施方式中,所识别的仪表与特定能量使用条件相关联的可能性可以取决于与一个能量使用条件相关联的表示和被验证为对应于非技术性损失的另一表示之间的N维接近度。较小的N维接近度可以指示较高的可能性。
结果处理模块408还可以确定多个仪表中的至少一些仪表满足指定的排名阈值标准,并且可以提供多个公共设施仪表中的至少一些作为用于关于潜在的非技术性损失的调查的候选。在一个示例中,排名阈值标准可以指定最小可能性百分比量。在另一个示例中,排名阈值标准可以指定具有最高可能性的量。满足排名阈值标准的那些排名的仪表可以是最可能遇到非技术性损失的仪表,诸如由于盗窃或故障。
此外,如先前所讨论的,新的N维表示可以被识别为对应于非技术性损失。结果处理模块408可以向与特定能量使用条件相关联的一个或多个实体报告非技术性损失。例如,被确定为最可能遇到非技术性损失的仪表可以被呈现给一个或多个能量提供商或供应商(例如,公共设施公司)。能量提供商或供应商接着可以调查和解决任何问题。
在一些情况下,结果处理模块408可以从一个或多个实体(诸如能量提供商)获取特定能量使用条件与非技术性损失相关联的确认或非确认中的至少一个。例如,一个或多个实体可以进行现场调查或进行其他进程以确认非技术性损失或不存在非技术性损失。实体可以将其发现报告回非技术性损失识别模块400。另外,在一些实例中,可以基于确认或非确认中的至少一个来修改、改进或改善分类器模型。
图5示出了根据本公开的实施方案的包括一组示例信号的示例信号值的示例表500。如图5中所示的,示例表500可以示出一组三个示例信号(信号A、信号B和信号N)。因此,用于该组示例信号的信号量是三。可以预期许多变化是可能的。
在图5的示例中,信号A是“消耗下降”信号。例如,信号A的信号值被计算为0.82。在该示例中,信号B可以对应于“线路中断事件”信号并且可以具有0.74的信号值。例如,信号N可以是具有0.91的信号值的“取消工作订单”信号。这些信号值可以与特定的能量使用条件相关联。例如,这些信号值可以在特定时间与特定公共设施仪表相关联。基于这些信号值,可以生成N维表示,这将参考图6更详细地讨论。
图6示出了根据本公开的实施方案的包括基于示例信号值生成的示例N维表示的示例图600。示例图600可以示出基于图5的示例表500中所示的该组信号的信号值生成的N维表示(例如,点)610。
由于图5中的该组信号的信号量为三,因此示例图600中的维度数量为三(例如,N=3)。图6的N维空间中的每个维度与轴相关联,并且可以对应于图5中的相应信号。因此,维度A 602可对应于图5的信号A,维度B 604可对应于信号B,并且维度N 606可对应于信号N。因此,N维表示610具有坐标(A=0.82,B=0.74,N=0.91),并且相应地呈现在示例图600中。
如图6的示例中所示,表示610在包括其他N维表示的群集612内,其可以表示涉及例如其他仪表的其他能量使用条件。在一个示例中,如果表示610在离群集612的容许距离内,则可以根据群集612对表示进行分类。例如,如果群集612已经被验证为与NTL(或备选地,正常能量使用)相关联,则当位于距离群集612允许的距离内时表示610将类似地被分类为与NTL(或,备选地,正常能量使用)相关联。
在另一示例中,如果验证表示610对应于非技术性损失,则表示610所属的整个群集612可以被分类为对应于非技术性损失(并且对于正常能量反之亦然)。如果群集612中的另一表示被验证为对应于非技术性损失,并且如果表示610尚未被分类,则表示610(和整个群集612)可以被分类为对应于非技术性损失(并且对于正常能量使用反之亦然)。示例图600中的其他群集可以以类似的方式分类。
此外,应当理解的是,出于说明的目的提供了图6的示例图600。在一些实施方式中,N维表示不需要以图形或视觉形式呈现。
图7示出了根据本公开的实施方案的用于利用机器学习来识别非技术性损失的示例方法700。应当理解的是,除非另有说明,否则在各种实施方案的范围内可以存在以类似的或可替代的顺序(或并行)执行的附加的、更少的或可替代的步骤。
在框702处,示例方法700可以选择与多个能量使用条件相关的一组信号。在一些情况下,该组信号可以与多个能量使用条件相关联。在一些实施方式中,该组信号可以由能量管理平台102的操作者全部或部分地确定。该组信号可以存储在能量管理平台102内或外的库中。在一些实例下,该组信号可以随时间增长、收缩和/或改变。例如,可以基于用于分类能量使用条件的机器学习算法来修改该组信号的信号量。在一些实施方案中,诸如公共设施公司的能量提供商可以创建他们自己的信号并且将这些信号提供给能量管理平台102以除了由能量管理平台102的操作者确定的该组信号之外来使用或者代替由能量管理平台102的操作者确定的该组信号。
在框704处,示例方法700可以确定该组信号的信号值。在一些实例中,可以基于信号值生成多个能量使用条件的多个N维表示。此外,每个N维表示可以具有对应于该组信号的信号量的N维。
在框706处,示例方法700可以将机器学习应用于信号值以识别与非技术性损失相关联的能量使用条件。在一些实例中,对于信号值的机器学习的应用可以涉及将至少一个机器学习算法应用于多个N维表示以产生用于识别非技术性损失的分类器模型。在一些实施方案中,分类器模型可随时间被修改、改善和/或改进。以上讨论了示例方法700的附加细节,并且这里不再重复。
进一步预期,可以存在与本公开的各种实施方案相关联的许多其它用途、应用和/或变型。
图8示出了根据本公开的实施方案的示例机器800,在所述示例机器中可以执行用于使机器执行本文描述的一个或多个实施方案的一组指令。该机器可以连接(例如,联网)到其他机器。在联网部署中,该机器可以在客户端-服务器网络环境中以服务器或客户端机器的能力操作,或者在对等(或分布式)网络环境中作为对等机器操作。
机器800包括处理器802(例如,中央处理单元(CPU)、图形处理单元(GPU)或两者)、主存储器804和非易失性存储器806(例如易失性RAM和非易失性RAM),其经由总线808彼此通信。例如,在一些实施方案中,机器800可以是台式计算机、膝上型计算机、个人数字助理(PDA)或移动电话。在一个实施方案中,机器800还包括视频显示器810、字母数字输入设备812(例如,键盘)、光标控制设备814(例如,鼠标)、驱动单元816、信号生成设备818(例如,扬声器)和网络接口设备820。
在一个实施方案中,视频显示器810包括用于用户输入的触敏屏幕。在一个实施方案中,使用触敏屏幕而不是键盘和鼠标。盘驱动单元816包括机器可读介质822,在其上存储体现本文描述的任何一个或多个方法或功能的一组或多组指令824(例如,软件)。指令824还可以在其被计算机系统800执行期间完全或至少部分地驻留在主存储器804内和/或处理器802内。指令824还可以经由网络接口设备820通过网络840发送或接收。在一些实施方案中,机器可读介质822还包括数据库825。
易失性RAM可以被实现为动态RAM(DRAM),其持续地需要电力以便刷新或维持存储器中的数据。非易失性存储器通常是磁性硬盘驱动器、磁性光学驱动器、光学驱动器(例如,DVD RAM)或即使在从系统移除电力之后仍保持数据的其它类型的存储器系统。非易失性存储器也可以是随机存取存储器。非易失性存储器可以是直接耦合到数据处理系统中的其余组件的本地设备。还可以使用远离系统的非易失性存储器,诸如通过网络接口(诸如调制解调器或以太网接口)耦合到本文所描述的任何计算机系统的网络存储设备。
尽管机器可读介质822在示例性实施方案中被示为是单个介质,但是术语“机器可读介质”应该被认为包括存储一组或多组指令单个介质或多个介质(例如,集中式或分布式数据库,和/或相关联的高速缓存和服务器)。术语“机器可读介质”还将被认为包括能够存储、编码或携带用于由机器执行的一组指令并且使得机器执行本公开的任何一种或多种方法的任何介质。因此,术语“机器可读介质”应被认为包括但不限于固态存储器、光和磁介质以及载波信号。如本文所使用的术语“存储模块”可以使用机器可读介质来实现。
一般来说,被执行以实现本公开的实施方案的例程可以被实现为被称为“程序”或“应用”的操作系统或特定应用、组件、程序、对象、模块或指令序列的一部分。例如,一个或多个程序或应用可以用于执行本文描述的特定进程。程序或应用通常包括在机器中的各种存储器和存储设备中的各种时间设置的一个或多个指令,并且当由一个或更多个处理器读取和执行时,其使得机器执行操作以执行涉及本文所描述的实施方案的各个方面的元件。
可执行的例程和数据可以存储在各种地方,包括例如ROM、易失性RAM、非易失性存储器和/或高速缓存。这些例程和/或数据的部分可以存储在这些存储设备中的任何一个中。此外,例程和数据可以从集中式服务器或对等网络获得。在不同的时间和在不同的通信会话中或在相同的通信会话中,可以从不同的集中式服务器和/或对等网络获得例程和数据的不同部分。可以在应用的执行之前整体获得例程和数据。备选地,当需要执行时,可以及时动态地获得例程和数据的部分。因此,不要求例程和数据在特定的时间实例处整体在机器可读介质上。
尽管已经在机器的上下文中完全描述了实施方案,但是本领域技术人员将理解,各种实施方案能够作为程序产品以各种形式分布,并且本文描述的实施方案同样适用而不管用于实际实现分发的机器可读介质或计算机可读介质的特定类型。机器可读介质的示例包括但不限于可记录型介质,诸如易失性和非易失性存储器设备、软盘和其他可移动盘、硬盘驱动器、光盘(例如,压缩盘只读存储器(CD ROMS)、数字通用盘(DVD)等),以及传输类型介质,诸如数字和模拟通信链路。
备选地或组合地,可使用具有或不具有软件指令(诸如使用专用集成电路(ASIC)或现场可编程门阵列(FPGA))的专用电路来实现本文所描述的实施方案。实施方案可以使用没有软件指令或与软件指令组合的硬连线电路来实现。因此,所述技术既不限于硬件电路和软件的任何特定组合,也不限于由数据处理系统执行的指令的任何特定源。
为了说明的目的,阐述了许多具体细节以便提供对本说明书的透彻理解。然而,对于本领域技术人员明显的是,本公开的实施方案可以在没有这些具体细节的情况下实施。在一些实例中,以框图形式示出模块、结构、进程、特征和设备,以便避免使描述模糊。在其他实例中,功能框图和流程图被示为表示数据和逻辑流程。框图和流程图的组件(例如,模块、引擎、块、结构、设备、特征等)可以以不同于本文中明确描述和描绘的方式被不同地组合、分离、移除、重新排序和替换。
在本说明书中对“一个实施方案”、“实施方案”、“其它实施方案”、“另一实施方案”等的引用是指,结合实施方案描述的特定特征、设计、结构或特性包括在本公开的至少一个实施方案中。例如,在说明书中各处出现的短语“根据实施方案”、“在一个实施方案中”、“在实施方案中”或“在另一个实施方案中”不一定都指代相同的实施方案,也不一定都指与其它实施方案相互排斥的单独或替代实施方案。此外,不管是否存在对“实施方案”等的明确提及,描述了各种特征,其可以被不同地组合并包括在一些实施方案中,但是在其他实施方案中也可以被各种省略。类似地,描述了各种特征,其可以是对于一些实施方案而不是其他实施方案的优选或要求。
虽然已经参考具体示例性实施方案描述了实施方案,但是显然可以对这些实施方案进行各种修改和改变。因此,说明书和附图被认为是说明性的而不是限制性的。前述说明书提供了参考具体示例性实施方案的描述。显然,在不脱离如所附权利要求中阐述的更广泛的精神和范围的情况下,可以对其进行各种修改。因此,说明书和附图被认为是说明性的而不是限制性的。
尽管一些附图以特定顺序示出了多个操作或方法步骤,但是不是顺序依赖的步骤可以被重新排序,并且其他步骤可以被组合或省略。虽然具体提及了一些重新排序或其他分组,但是其它的对于本领域的普通技术人员将是明显的,并且因此不提供可替换的详尽列表。此外,应当认识到,这些阶段可以在硬件、固件、软件或其任何组合中实现。
还应当理解的是,在不脱离本公开的本质的情况下可以进行各种改变。这种改变也隐含地包括在描述中。它们仍落在本公开的范围内。应当理解的是,本公开旨在产生覆盖所公开的技术的多个方面的专利,无论是独立地还是作为整体系统,以及在方法和装置模式中。
此外,本公开和权利要求的各种元件中的每一个也可以以各种方式实现。本公开应当被理解为包括每个这样的变化,是任何装置实施方案、方法或进程实施方案的实施方案的变化,或者甚至仅仅是这些的任何元件的变型。

Claims (18)

1.一种计算机实现的方法,所述方法包括:
从多个数据源获取数据,其中所述数据包括能量相关数据或客户相关数据;
对于所述多个数据源中的每一个,获得选自所述能量相关数据或客户相关数据的一组信号的信号值,其中所述一组信号涉及多个能量使用条件;
基于所述信号值,生成N维空间中的多个N维表示,其中N等于所述一组信号中的信号的数量;
将无监管机器学习算法应用于所述N维表示以识别所述N维空间中的多个群集,其中所述多个群集中的每一个对应于所述多个数据源中的一子集;以及
确定所述多个群集中的一群集是异常值,该异常值对应于与非技术性损失相关联的所述多个数据源中的子集。
2.根据权利要求1所述的计算机实现的方法,其中所述多个N维表示中的至少第一部分先前已被识别为对应于所述非技术性损失,并且其中所述多个N维表示中的至少第二部分先前已被识别为对应于正常能量使用。
3.如权利要求1所述的计算机实现的方法,还包括:
接收所述一组信号的新信号值,所述新信号值与特定能量使用条件相关联;
基于所述新信号值,生成所述N维空间中的多个新的N维表示。
4.根据权利要求3所述的计算机实现的方法,还包括:
将所述无监管机器学习算法应用于所述N维空间中的所述N维表示,以识别所述N维空间中的多个新群集。
5.如权利要求4所述的计算机实现的方法,还包括:
确定所述多个新群集中的一群集是异常值,该异常值对应于与非技术性损失相关联的所述多个数据源中的子集;以及
将与非技术性损失相关联的所述多个数据源中的所述子集报告给能量提供商。
6.根据权利要求5所述的计算机实现的方法,还包括:
从所述能量提供商获取对特定数据源与所述非技术性损失相关联的确认或非确认中的至少一个。
7.根据权利要求6所述的计算机实现的方法,还包括:
基于所述确认或所述非确认中的所述至少一个来修改所述无监管机器学习算法。
8.根据权利要求1所述的计算机实现的方法,还包括:
识别具有与所述非技术性损失相关联的可能性的多个仪表;和
基于与所述非技术性损失相关联的所述可能性对所述多个仪表进行排名。
9.如权利要求8所述的计算机实现的方法,还包括:
确定所述多个仪表中的至少一些满足指定的排名阈值标准;和
将所述多个仪表中的所述至少一些识别为候选以用于调查。
10.根据权利要求1所述的计算机实现的方法,其中所述一组信号中的一个或多个信号与以下中的至少一个相关联:帐户属性信号类别、异常负载信号类别、计算的状态信号类别、电流分析信号类别、丢失的数据信号类别、断开信号类别、仪表事件信号类别、月度仪表异常负载信号类别、非活动的月度仪表消耗信号类别、中断信号类别、被盗仪表信号类别、异常生产信号类别、工作订单信号类别或零读取信号类别。
11.如权利要求1所述的计算机实现的方法,还包括:
获取用于所述一组信号的一组公式,所述一组公式中的每个公式对应于所述一组信号中的相应信号;和
基于所述一组公式计算所述一组信号的所述信号值。
12.根据权利要求1所述的计算机实现的方法,其中至少一些所述信号值来源于从与所述多个能量使用条件相关联的多个仪表获取的数据。
13.根据权利要求1所述的计算机实现的方法,其中所述一组信号中的第一信号是基于对所述一组信号中的第二信号的修改而生成的。
14.根据权利要求1所述的计算机实现的方法,还包括从能量提供商接收与能量使用条件相关的、不包括在所述一组信号中的至少一个信号,以识别所述非技术性损失。
15.根据权利要求1所述的计算机实现的方法,其中所述无监管机器学习算法包括无监管进程,并且其中所述无监管进程利用未分类数据来识别非技术性损失。
16.根据权利要求1所述的计算机实现的方法,其中所述数据包括两种或更多不同类型的能量相关数据或客户相关数据。
17.根据权利要求1所述的计算机实现的方法,其中所述数据是通过应用程序接口API或者通信接口从所述多个数据源获取的。
18.一种用于利用机器学习来识别非技术性损失的系统,包括:
与多个数据源通信的服务器;和
存储指令的存储器,所述指令当由所述服务器执行时使所述服务器执行包括以下操作的操作:
从所述多个数据源获取数据,其中所述数据包括能量相关数据或客户相关数据;
从所述多个数据源获得选自所述能量相关数据或客户相关数据的一组信号的信号值,其中所述一组信号涉及多个能量使用条件;
基于所述信号值,生成N维空间中的多个N维表示,其中N等于所述一组信号中的信号的数量;
将无监管机器学习算法应用于所述N维表示以识别所述N维空间中的多个群集,其中所述多个群集中的每一个对应于所述多个数据源中的一子集;以及
确定所述多个群集中的一群集是异常值,该异常值对应于与非技术性损失相关联的所述多个数据源中的子集。
CN201580050923.0A 2014-09-24 2015-09-24 利用机器学习来识别非技术性损失 Active CN106716454B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110829239.XA CN113918139A (zh) 2014-09-24 2015-09-24 利用机器学习来识别非技术性损失

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US14/495,848 2014-09-24
US14/495,848 US10296843B2 (en) 2014-09-24 2014-09-24 Systems and methods for utilizing machine learning to identify non-technical loss
PCT/US2015/052048 WO2016049369A1 (en) 2014-09-24 2015-09-24 Utilizing machine learning to identify non-technical loss

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN202110829239.XA Division CN113918139A (zh) 2014-09-24 2015-09-24 利用机器学习来识别非技术性损失

Publications (2)

Publication Number Publication Date
CN106716454A CN106716454A (zh) 2017-05-24
CN106716454B true CN106716454B (zh) 2021-08-17

Family

ID=55582024

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201580050923.0A Active CN106716454B (zh) 2014-09-24 2015-09-24 利用机器学习来识别非技术性损失
CN202110829239.XA Pending CN113918139A (zh) 2014-09-24 2015-09-24 利用机器学习来识别非技术性损失

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN202110829239.XA Pending CN113918139A (zh) 2014-09-24 2015-09-24 利用机器学习来识别非技术性损失

Country Status (9)

Country Link
US (4) US10296843B2 (zh)
EP (1) EP3198529A4 (zh)
JP (1) JP6734265B2 (zh)
KR (1) KR20170060031A (zh)
CN (2) CN106716454B (zh)
AU (1) AU2015320559A1 (zh)
CA (1) CA2962226A1 (zh)
MX (1) MX2017003142A (zh)
WO (1) WO2016049369A1 (zh)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10296843B2 (en) 2014-09-24 2019-05-21 C3 Iot, Inc. Systems and methods for utilizing machine learning to identify non-technical loss
US10592564B2 (en) * 2016-01-22 2020-03-17 Aerinet Solutions, L.L.C. Real-time outage analytics and reliability benchmarking system
US20170301044A1 (en) * 2016-04-15 2017-10-19 Oracle International Corporation Systems and methods for managing outages in utility systems
CA2936212A1 (fr) 2016-07-14 2018-01-14 Hydro-Quebec Detection de non-conformites electriques par observation d'ecarts a une modelisation de reseau
US10212024B2 (en) * 2017-06-02 2019-02-19 Sas Institute Inc. Techniques for multi-stage analysis of measurement data with event stream processing
US11067618B2 (en) * 2017-07-20 2021-07-20 The Southern Company Systems and methods of diagnosing root causes of anomalous AMI information
WO2019075431A1 (en) * 2017-10-13 2019-04-18 Honeywell International, Inc. DEVICE FOR DETECTING ENERGY FLIGHT
US10637239B2 (en) 2017-10-13 2020-04-28 Honeywell International Inc. Utility network monitoring device
EP3518152A1 (en) * 2018-01-29 2019-07-31 Panasonic Intellectual Property Corporation of America Information processing method and information processing system
EP3776376A4 (en) * 2018-04-09 2021-12-01 Veda Data Solutions, Inc. PROCESSING OF PERSONAL DATA USING MACHINE LEARNING ALGORITHMS, AND RELATED APPLICATIONS
US11062036B2 (en) 2018-05-11 2021-07-13 Paypal, Inc. System and method for generating privacy data containment and reporting
US11562315B2 (en) 2018-08-31 2023-01-24 Accenture Global Solutions Limited Detecting an issue related to a report
US10713143B1 (en) * 2019-06-24 2020-07-14 Accenture Global Solutions Limited Calibratable log projection and error remediation system
KR102126577B1 (ko) * 2019-10-29 2020-06-25 (주)대은 다채널 모듈센서를 이용한 태양광발전 모니터링 시스템
US11294929B1 (en) 2021-06-09 2022-04-05 Aeec Smart water data analytics

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103942453A (zh) * 2014-05-07 2014-07-23 华北电力大学 一种针对非技术性损失的智能用电异常检测方法

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1333552C (zh) * 2005-03-23 2007-08-22 北京首信科技有限公司 基于机器学习的用户行为异常的检测方法
KR20110007205A (ko) * 2008-04-21 2011-01-21 어댑티브 컴퓨팅 엔터프라이즈 인코포레이티드 컴퓨트 환경에서 에너지 소비를 관리하기 위한 시스템 및 방법
US8156055B2 (en) 2009-05-04 2012-04-10 ThinkEco, Inc. System and method for utility usage, monitoring and management
US20110231316A1 (en) * 2010-03-09 2011-09-22 Cummins Intellectual Properties, Inc. Method, system and computer readable media containing a program for identifying whether a product is genuine
US8924033B2 (en) * 2010-05-12 2014-12-30 Alstom Grid Inc. Generalized grid security framework
KR101420784B1 (ko) * 2010-08-06 2014-07-17 엠파이어 테크놀로지 디벨롭먼트 엘엘씨 통신 네트워크 모니터링
FR2968145B1 (fr) * 2010-11-25 2012-11-23 Schneider Electric Ind Sas Procede et dispositif de determination de la structure d'un reseau de distribution d'electricite
US9013283B1 (en) * 2010-12-10 2015-04-21 Tackaberry Electronics, LLC Smart electrical outlet, and smart grid electrical management system
US9200591B2 (en) * 2011-07-06 2015-12-01 Honeywell International Inc. Automatic identification of operating parameters for power plants
US9207735B2 (en) * 2011-08-02 2015-12-08 Gram Power, Inc. Power management device and system
US20130124436A1 (en) 2011-11-15 2013-05-16 Fujitsu Limited Profiling Energy Consumption
CN102866321B (zh) * 2012-08-13 2014-10-22 广东电网公司电力科学研究院 一种自适应的防窃漏电诊断方法
US8768795B2 (en) 2012-09-12 2014-07-01 General Electric Company Methods and systems for estimating recoverable utility revenue
US20150196002A1 (en) * 2014-01-12 2015-07-16 Kevin Friesth Automated hybrid aquaponics and bioreactor system including product processing and storage facilities with integrated robotics, control system, and renewable energy system cross-reference to related applications
WO2014080515A1 (ja) * 2012-11-26 2014-05-30 三菱電機株式会社 データ分析装置及びプログラム
US9945889B2 (en) 2013-02-19 2018-04-17 Mitsubishi Electric Research Laboratories, Inc. Method for detecting power theft in a power distribution system
US9098553B2 (en) 2013-03-15 2015-08-04 Gridglo Llc System and method for remote activity detection
US9595006B2 (en) * 2013-06-04 2017-03-14 International Business Machines Corporation Detecting electricity theft via meter tampering using statistical methods
US9702730B2 (en) * 2013-08-09 2017-07-11 Utilidata, Inc. Systems and methods for estimating conservation allocation with partial AMI
US9092741B1 (en) * 2014-04-21 2015-07-28 Amber Flux Private Limited Cognitive platform and method for energy management for enterprises
US10296843B2 (en) 2014-09-24 2019-05-21 C3 Iot, Inc. Systems and methods for utilizing machine learning to identify non-technical loss
US10379146B2 (en) * 2015-09-23 2019-08-13 International Business Machines Corporation Detecting non-technical losses in electrical networks based on multi-layered statistical techniques from smart meter data
CN111366889B (zh) * 2020-04-29 2022-01-25 云南电网有限责任公司电力科学研究院 一种智能电表异常用电检测方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103942453A (zh) * 2014-05-07 2014-07-23 华北电力大学 一种针对非技术性损失的智能用电异常检测方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Energy-Theft Detection Issues for Advanced Metering Infrastructure in Smart Grid;Rong Jiang et al.;《TSINGHUA SCIENCE AND TECHNOLOGY》;20140430;第19卷(第2期);第105-120页 *
Load Profiling Method in Detecting non-Technical Loss Activities in a Power Utility;A.H.Nizar et al.;《First International Power and Energy Coference PECon 2006》;20061129;第82-87页 *
Non-Technical Loss Analysis for Detection of Electricity Theft using Support Vector Machines;J. Nagi et al.;《2nd IEEE International Conference on Power and Energy (PECon 08)》;20081203;第907-912页 *

Also Published As

Publication number Publication date
EP3198529A1 (en) 2017-08-02
US20180107941A1 (en) 2018-04-19
EP3198529A4 (en) 2018-05-02
WO2016049369A1 (en) 2016-03-31
CN106716454A (zh) 2017-05-24
US20230027296A1 (en) 2023-01-26
CN113918139A (zh) 2022-01-11
CA2962226A1 (en) 2016-03-31
KR20170060031A (ko) 2017-05-31
AU2015320559A1 (en) 2017-03-23
JP6734265B2 (ja) 2020-08-05
US20190340535A1 (en) 2019-11-07
US10296843B2 (en) 2019-05-21
MX2017003142A (es) 2017-09-12
US11886843B2 (en) 2024-01-30
JP2017536604A (ja) 2017-12-07
US11449315B2 (en) 2022-09-20
US20240045659A1 (en) 2024-02-08

Similar Documents

Publication Publication Date Title
US11886843B2 (en) Systems and methods for utilizing machine learning to identify non-technical loss
US20220283208A1 (en) Systems and methods for processing different data types
Bhattarai et al. Big data analytics in smart grids: state‐of‐the‐art, challenges, opportunities, and future directions
US9652723B2 (en) Electrical transformer failure prediction
WO2018234741A1 (en) SYSTEMS AND METHODS FOR INTELLIGENCE OF INDUSTRIAL ASSETS BY DISTRIBUTED SYSTEMIC ANTICIPATION
US9269062B2 (en) Methods for optimizing energy consumption and devices thereof
US20220215295A1 (en) Systems and methods for determining disaggregated energy consumption based on limited energy billing data
EP4016410A1 (en) Systems and methods for regression-based determination of expected energy consumption and efficient energy consumption
Alquthami et al. Analytics framework for optimal smart meters data processing
Di Stefano et al. Prometheus and aiops for the orchestration of cloud-native applications in ananke
CN115310923A (zh) 能源管理服务系统及方法
CN114757448B (zh) 一种基于数据空间模型的制造环节间最优价值链构建方法
Siebel et al. WITHDRAWN APPLICATION AS PER THE LATEST USPTO WITHDRAWN LIST
Zayas et al. Getting ready for data analytics of electric power distribution systems
Sarker et al. Cp-sam: Cyber-power security assessment and resiliency analysis tool for distribution system
Akerkar et al. Big Data in Electric Power Industry
Gupta et al. A Review of Big Data role in Smart Grid
Luciano A Data Warehouse for Energy Management

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: California, USA

Applicant after: Sirui IoT Co.

Address before: California, USA

Applicant before: C3 Co.

CB02 Change of applicant information
CB02 Change of applicant information

Address after: California, USA

Applicant after: Sirui Artificial Intelligence Co.

Address before: California, USA

Applicant before: Sirui IoT Co.

CB03 Change of inventor or designer information
CB03 Change of inventor or designer information

Inventor after: Thomas - M - West

Inventor after: Edward - Y - Agbo

Inventor after: Hohmann Bizadi

Inventor after: Arvid Bostani

Inventor after: Nikhil Krishnan

Inventor after: Zhao Kunlei

Inventor after: Olsson Henrik

Inventor after: Luis Poril

Inventor after: Jeremy Colt

Inventor before: Thomas - M - West

Inventor before: Edward - Y - Agbo

Inventor before: Hohmann Bizadi

Inventor before: Arvid Bostani

Inventor before: Nikhil Krishnan

Inventor before: Zhao Kunlei

Inventor before: Olsson Henrik

Inventor before: Luis Poril

Inventor before: Zick Colt

GR01 Patent grant
GR01 Patent grant