CN109844653B - 使用预测来控制目标系统 - Google Patents

使用预测来控制目标系统 Download PDF

Info

Publication number
CN109844653B
CN109844653B CN201780033948.9A CN201780033948A CN109844653B CN 109844653 B CN109844653 B CN 109844653B CN 201780033948 A CN201780033948 A CN 201780033948A CN 109844653 B CN109844653 B CN 109844653B
Authority
CN
China
Prior art keywords
target
information
model
rules
target system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201780033948.9A
Other languages
English (en)
Other versions
CN109844653A (zh
Inventor
沃尔夫·科恩
迈克尔·路易斯·桑多瓦尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Willystone Alpha
Original Assignee
Willystone Alpha
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Willystone Alpha filed Critical Willystone Alpha
Publication of CN109844653A publication Critical patent/CN109844653A/zh
Application granted granted Critical
Publication of CN109844653B publication Critical patent/CN109844653B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/042Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F24HEATING; RANGES; VENTILATING
    • F24FAIR-CONDITIONING; AIR-HUMIDIFICATION; VENTILATION; USE OF AIR CURRENTS FOR SCREENING
    • F24F11/00Control or safety arrangements
    • F24F11/30Control or safety arrangements for purposes related to the operation of the system, e.g. for safety or monitoring
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F24HEATING; RANGES; VENTILATING
    • F24FAIR-CONDITIONING; AIR-HUMIDIFICATION; VENTILATION; USE OF AIR CURRENTS FOR SCREENING
    • F24F11/00Control or safety arrangements
    • F24F11/30Control or safety arrangements for purposes related to the operation of the system, e.g. for safety or monitoring
    • F24F11/46Improving electric energy efficiency or saving
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F24HEATING; RANGES; VENTILATING
    • F24FAIR-CONDITIONING; AIR-HUMIDIFICATION; VENTILATION; USE OF AIR CURRENTS FOR SCREENING
    • F24F11/00Control or safety arrangements
    • F24F11/62Control or safety arrangements characterised by the type of control or by internal processing, e.g. using fuzzy logic, adaptive control or estimation of values
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F24HEATING; RANGES; VENTILATING
    • F24FAIR-CONDITIONING; AIR-HUMIDIFICATION; VENTILATION; USE OF AIR CURRENTS FOR SCREENING
    • F24F11/00Control or safety arrangements
    • F24F11/62Control or safety arrangements characterised by the type of control or by internal processing, e.g. using fuzzy logic, adaptive control or estimation of values
    • F24F11/63Electronic processing
    • F24F11/64Electronic processing using pre-stored data
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/0265Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/048Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators using a predictor
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B17/00Systems involving the use of models or simulators of said systems
    • G05B17/02Systems involving the use of models or simulators of said systems electric
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B19/00Programme-control systems
    • G05B19/02Programme-control systems electric
    • G05B19/18Numerical control [NC], i.e. automatically operating machines, in particular machine tools, e.g. in a manufacturing environment, so as to execute positioning, movement or co-ordinated operations by means of programme data in numerical form
    • G05B19/406Numerical control [NC], i.e. automatically operating machines, in particular machine tools, e.g. in a manufacturing environment, so as to execute positioning, movement or co-ordinated operations by means of programme data in numerical form characterised by monitoring or safety
    • G05B19/4069Simulating machining process on screen
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F24HEATING; RANGES; VENTILATING
    • F24FAIR-CONDITIONING; AIR-HUMIDIFICATION; VENTILATION; USE OF AIR CURRENTS FOR SCREENING
    • F24F11/00Control or safety arrangements
    • F24F11/62Control or safety arrangements characterised by the type of control or by internal processing, e.g. using fuzzy logic, adaptive control or estimation of values
    • F24F11/63Electronic processing
    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F24HEATING; RANGES; VENTILATING
    • F24FAIR-CONDITIONING; AIR-HUMIDIFICATION; VENTILATION; USE OF AIR CURRENTS FOR SCREENING
    • F24F2140/00Control inputs relating to system states

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Chemical & Material Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Mechanical Engineering (AREA)
  • Combustion & Propulsion (AREA)
  • General Physics & Mathematics (AREA)
  • Automation & Control Theory (AREA)
  • Signal Processing (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Health & Medical Sciences (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Human Computer Interaction (AREA)
  • Manufacturing & Machinery (AREA)
  • Feedback Control In General (AREA)
  • Supply And Distribution Of Alternating Current (AREA)
  • Remote Monitoring And Control Of Power-Distribution Networks (AREA)
  • Testing And Monitoring For Control Systems (AREA)

Abstract

描述了用于实施自动化控制系统以控制指定的物理目标系统的操作的技术。在一些情况下,所描述的技术包括获得和分析关于目标系统的操作的传感器数据,以便生成目标系统的当前状态的改进的模型,以及使用所建模的状态信息作为进一步确定对于目标系统采取的当前和/或未来的自动控制动作的一部分,以例如生成对目标系统的内部操作建模的函数和/或其他结构,而不仅仅是在不理解目标系统的内部结构和操作的情况下试图从输入来估计目标系统输出。

Description

使用预测来控制目标系统
背景技术
已做出尝试来针对具有输入或其他控制元件的各种类型的物理系统实施自动化控制系统,控制系统可以操纵这些输入或其他控制元件以尝试提供物理系统的期望输出或其他行为。此类自动化控制系统已使用各种类型的架构和底层计算技术来尝试实施此类功能性,包括尝试处理与在物理系统受控制状态下的不确定性有关的问题、需要在极少量的时间内并且仅有部分信息的情况下作出控制决策等。此类自动化控制系统的一个示例包括用于控制放出电功率以支持负载和/或使用来自某个源的电功率进行充电的电池的操作的系统,具有关于电池的内部温度和/或化学状态的不确定性,并且潜在地具有负载、来源和/或电池内部状态持续变化。
然而,现有的自动化控制系统及其底层架构和计算技术存在各种困难,包括关于管理被控制的系统的当前状态方面以及不同类型的输入将如何影响自动化控制系统的操作的方面的不确定性。
附图说明
图1A是示出其中可以配置和发起用于执行对目标系统的协作分布式控制的系统的示例性环境的网络图。
图1B是示出其中可以实施用于执行对目标系统的协作分布式控制的系统的示例性环境的网络图。
图1C是示出可如何使用数据断层扫描部件来估计对应目标系统的状态信息的流程图。
图1D是示出可如何使用断层扫描技术来基于对应目标系统的传感器数据生成软规则和其他信息并将其添加到数据哈密顿函数的流程图。
图1E是示出系统的代理架构概览的示例的框图,所述系统使用断层扫描技术校正或以其他方式完成从目标系统的部分已知状态丢失的信息。
图1F是示出使用断层扫描技术校正或以其他方式完成从目标系统的部分已知状态丢失的信息的示例的流程图。
图1G是示出涉及目标系统的示例性传感器的操作的框图。
图2A-2F是示出系统的实施方式的示例性部件的框图,所述系统用于部分地基于使用传感器数据建模的电池状态执行对来自电池的DC功率的自动化控制。
图2G-2J示出分析电池系统操作数据以改进电池系统的自动化控制的示例。
图2K是示出系统的实施方式的示例性部件的框图,所述系统用于部分地基于使用传感器数据建模的电池的状态执行对来自电池的DC功率的自动化控制。
图3是示出示例性计算系统的框图,所述计算系统适合于以配置的方式执行用于执行对目标系统的协作分布式控制的系统的实施方式。
图4示出协同分布式决策(CDD)系统例程的示例性实施方式的流程图。
图5A至图5C示出CDD决策模块构建例程的示例性实施方式的流程图。
图6A至图6B示出决策模块例程的示例性实施方式的流程图。
图7A至图7B示出CDD控制动作确定例程的示例性实施方式的流程图。
图8A至图8B示出CDD协调控制管理例程的示例性实施方式的流程图。
图9示出用于被控制的目标系统的例程的示例性实施方式的流程图。
图10是示出包括作为状态信息修复过程的一部分实现的断层扫描部件的自动化控制系统的实施方式的操作的流程图。
图11是示出分布式自动化控制系统的示例性实施方式的框图,所述分布式自动化控制系统具有多个断层扫描部件,每个断层扫描部件与底层目标系统的多个独立部件中的一个相关联。
图12A是示出系统的实施方式的示例性部件的框图,所述系统包括断层扫描部件并以协调的方式执行对来自多个电池的DC功率的自动化控制。
图12B是示出系统的实施方式的示例性部件的框图,所述系统用于执行对来自电池的DC功率的自动化控制,所述电池是利用太阳能发电的家庭电力系统的一部分,其中通过外部实体来监控和同步家庭发电与用电。
具体实施方式
描述了用于实施自动化控制系统以控制或以其他方式操纵指定的物理系统或其他目标系统的至少一些操作的技术。在至少一些实施方式中,所描述的技术包括:获得和分析关于目标系统的操作的数据(例如,来自传感器设备),以便生成目标系统的当前状态和操作特性的改进的模型;以及,使用改进的模型作为进一步确定对于目标系统要采取的当前和/或未来的自动控制动作的一部分。在至少一些这样的实施方式中,对数据的分析以及对目标系统的当前状态和操作特性的建模可以包括分析对目标系统的先前输入数据和目标系统的所得行为,以生成对目标系统的内部操作进行建模的函数和/或其他结构(本文通常称为“断层扫描”或“断层扫描的”技术,例如通过“断层扫描”部件),而不仅仅是在不理解目标系统的内部结构和操作的情况下(称为执行“系统识别”)试图从输入来估计目标系统输出。此外,在至少一些实施方式中,可以执行目标系统的当前状态的建模,以完成或修复或以其他方式解决目标系统的一个或多个部分的状态信息中的冲突(例如由于缺乏足够的内部状态结构信息或其他信息),并且使对目标系统的内部状态和操作特性的函数或其他模型的学习或其他改进能够实现。以下描述与执行和改进目标系统的状态和操作特性的这种建模、以及以特定方式使用由此得到的目标系统的改进模型有关的附加细节,并且在至少一些实施方式中,通过一个或多个‘断层扫描’部件的自动化操作来执行所描述的技术中的一些或全部,可选地作为控制目标系统的特定类型的一个或多个CDD(协同分布式决策)系统的一部分或结合控制目标系统的特定类型的一个或多个CDD(协同分布式决策)系统的一部分。
如上所述,各种类型的数据可以获得并用作对目标系统的当前状态和操作特性建模的一部分,包括关于对目标系统的先前输入数据和目标系统的所得行为的信息。在一些实施方式和情况中,这样的数据可以包括以自动方式从各种类型的一个或多个硬件传感器收集的数据,并且在一些实施方式和情况中,这样的数据可以包括关于人类用户的动作的信息或者关于此类人类的其他信息。本文使用的术语“传感器”和“传感器数据”通常指代此类数据,而不论源或类型,包括来自硬件传感器的数据和/或来自或关于人类用户的数据,除非关于特定情况另有说明。下文包括与获取和使用这种传感器数据有关的其他细节。
所描述的用于对目标系统的当前状态和操作特性建模、以及使用目标系统的所得模型作为确定针对目标系统采取的当前和/或将来的自动化控制动作的一部分的技术,可在各种实施方式中执行用于各种类型的目标系统。作为一个非排他性示例,物理目标系统可以包括用于存储和提供电功率的一个或多个电池(例如,用于局部负载、用于支持各种位置中的各种负载的电网等),并且用于控制目标系统的自动化操作可以包括使用每个电池的状态的特性来执行对从电池提供和/或由电池存储的DC(直流电)功率的自动化控制。在这样的实施方式中,一个或多个断层扫描部件的自动化操作可以包括接收关于一个或多个电池的输入、来自一个或多个电池的输出、提供给一个或多个电池的控制信号指令以及一个或多个电池的其他状态的信息(例如,内部温度读数、被输出使用的电流和/或电压被输入用于存储的电流和/或电压、作为一个或多个电池的周围环境的一部分的一个或多个电池外部的温度读数等),以及使用这些信息作为对一个或多个电池的电流状态和操作特性建模的一部分—给定这种改进的建模信息,控制一个或多个电池的CDD系统可以使用这种信息来对更好地反映目标系统的实际当前状态和行为的当前和/或未来控制动作作出决策。作为另一个非排他性示例,物理目标系统可以包括包括供暖和/或供冷(例如,一个或多个HVAC或暖通空调单元)的多房间建筑物,并且用于控制目标系统的自动化操作可以包括:使用房间子集的特性(例如,在具有温度传感器的房间子集中测量的温度)来向所有房间执行对从供暖和/或供冷能力提供的供暖和/或供冷的自动化控制。在此类实施方式中,一个或多个断层扫描部件的自动化操作可以包括:接收关于建筑物的至少一些房间的输入、来自这些房间的输出、提供至这些房间的控制信号指令以及供暖和/或供冷能力和建筑物的至少一些房间的其他状态(例如,内部温度读数、供暖和/或供冷能力的时间量和/或能量使用量、建筑物外部作为其周围环境的一部分的温度读数等)的信息,以及使用这些信息作为对建筑物的房间的温度的当前状态进行建模的一部分—给定这种改进的建模信息,控制加热和/或冷却能力的CDD系统然后可以使用这种信息来对当前和/或未来的控制动作作出决策,这些控制动作更好地反映目标系统的实际当前状态和行为。
下文包括与目标系统的当前状态和操作特性的这种建模以及对建模信息的这种使用有关的附加细节,尽管可以理解,所描述的技术还可以与各种其他类型的目标系统一起使用,无论是否替代或附加具有用于存储和提供电力的一个或多个电池和/或供暖和/或供冷能力的目标系统,其中一些将在下面进一步讨论。这种断层扫描技术可用于对目标系统的当前状态建模的目标系统的非排他性示例包括以下各项:微电网电力设施,诸如在包括一个或多个电源(例如,一个或多个太阳能电池板电网、一个或多个风力涡轮机等)的住宅位置以及一个或多个电力储存和源机钩(例如,一个或多个电池);用于生成能量的生物可降解废物或其他固体废物系统;用于动态负载的智能微电网调度;具有船基发电机的微电网;谐波采集系统(例如,用于具有辐射和对流机构的炉和其他热过程;DC-AC逆变器;AC-DC功率转换器和整流器;辐射系统);等。
图1C示出示例性流程图195,该示例性流程图195示出可如何使用数据断层扫描部件来估计相应目标系统的状态信息。特别地,数据可以随时间从目标系统的实际操作获得(例如识别提供给目标系统的一些或所有输入、目标系统的所得输出、关于目标系统的操作测量的传感器数据等),并用于生成目标系统操作的数据模型,如图1C所示关于元件195b。然后,可以将一系列查询195a提供给数据模型,例如以收集与涉及一个或多个输入或传感器的不同值的多个情况对应的提取的观测数据195d,在本示例中称为确定单个“第k个”传感器195c的电势。然后,在这个示例中,传感器的观测数据被供应至传播子部件195e,传播子部件195e生成目标系统及其操作的总表示,并将生成的表示供应至数据断层扫描部件195g—在这个示例中,生成的总表示是总哈密顿函数的形式,如下文将更详细地讨论的。此外,具有关于目标系统的操作的规则的知识库195f(例如,使用那些规则来表示目标系统的目标系统的初始模型)生成目标系统及其操作的第二基于规则的表示,并且还将该生成的第二表示供应至数据断层扫描部件195g,例如以能够确定由规则预测的第k个传感器的行为—在本示例中,规则是评估为真或假的二进制规则,以及从元件195f生成的第二表示是基于规则的哈密顿函数的形式,如下文将更详细地讨论的。然后,数据断层扫描部件195g评估两个不同生成之间的差异(例如,基于规则的第二生成表示在如第一总生成表示所反映的这种情况中未能预测目标系统的实际行为的方式),同样使用I/O历史信息195h,并创建反映这些差异的目标系统及其操作的第三生成表示—在本示例中,生成的第三表示是表示一个或多个软规则。(例如,可以采用多个可能值的规则,包括除了真值和假值之外的一个或多个值,并且可以对特定值进一步具有相关的置信度)的哈密顿函数的形式,如下文更详细地讨论的。然后,数据断层扫描195g使用所生成的第三表示来产生一个或多个软规则195i来表示这些差异,使得针对一个或多个软规则所生成的第三基于规则的表示与所生成的第二基于软规则的表示的组合可以更好地对目标系统及其操作进行建模。下面包括以这种方式使用数据断层扫描的进一步讨论。
然而,在进一步讨论数据断层扫描部件及其功能之前,提供使用此类表示和其他模型来控制目标系统的更一般的描述。特别地,图1A是示出其中可以配置和发起用于执行对一个或多个目标系统的协作分布式控制的系统的示例性环境的网络图。特别地,CDD系统140的实施方式在一个或多个计算系统190上执行,在所示出的实施方式中包括以在线方式进行操作并提供图形用户接口(GUI)(未示出)和/或其他接口(119),以使得客户端计算系统110的一个或多个远程用户能够通过一个或多个介入的计算机网络100与CDD系统140相互作用,从而配置和创建一个或多个决策模块以包括作为要与待控制的一个或多个目标系统中的每一者一起使用的自动化控制系统的一部分。
特别地,目标系统1 160和目标系统2 170是这个示例中所示出的示例性目标系统,不过将了解,在特定的实施方式和情况中可能仅一个目标系统或众多目标系统可用,并且每个此类目标系统可以包括多种机械、电子、化学、生物和/或其他类型的部件,从而以特定于该目标系统的方式来实施该目标系统的操作。在这个示例中,一个或多个用户(未示出)可以与CDD系统140相互作用,以产生用于目标系统1的示例性自动化控制系统122,其中在这个示例中所述自动化控制系统包括的多个决策模块124,这些决策模块在稍后部署和实施时将协作地相互作用以控制目标系统1 160的多个部分。用户与CDD系统140相互作用以创建自动化控制系统122的过程可能随时间的推移而涉及多种相互作用,在一些情况下包括不同组用户的独立动作,如在别处更详细地讨论的。另外,作为创建和/或训练或测试自动化控制系统122的过程的一部分,它可以执行与如所示出的目标系统1的一个或多个相互作用以便获得部分初始状态信息,不过在至少一些实施方式中,一些或所有训练活动可以包括在目标系统1中模拟控制动作的效果,而实际在当时并不实施那些控制动作。在一些实施方式和情况中,此类初始用户相互作用可以用于产生目标系统的初始的基于规则的系统模型(所述模型基于二进制规则),诸如在图1C的知识库195f中所反映的—如果是这样,则数据断层扫描部件可以通过自动学习附加的软规则来改进这种初始的基于规则的系统模型以包括在目标系统的修订模型中。
在创建自动化控制系统122之后,可以部署和实施自动化控制系统以开始执行涉及控制目标系统1 160的操作,诸如,通过可选地在CDD系统140的一个或多个计算系统190上执行自动化控制系统122,以便通过计算机网络100与目标系统1相互作用。在其他实施方式和情况中,可以改为通过诸如在作为目标系统1的一部分的一个或多个计算系统(未示出)上以在目标系统1局部的方式执行自动化控制系统122中的一些或全部的局部副本(例如,多个决策模块124中的一者或多者)来部署自动化控制系统122,如关于一些或全部的自动化控制系统1的部署副本121所示出的。另外,在其中初始用户相互作用用于产生目标系统的初始的基于规则的系统模型(所述模型基于二进制规则)的实施方式和情况中,初始部署的自动化控制系统122可以基于此类初始的基于规则的系统模型,并且可以收集并使用在初始部署的自动化控制系统122的控制下来自目标系统的操作的数据以用于附加软规则的后续自动化学习,诸如在图1C的数据域信息195b中所反映的—如果是这样,则数据断层扫描部件可以通过自动学习附加的软规则来改进这种初始的基于规则的系统模型以包括在目标系统的修订模型中,自动控制系统122的修订模型后续被部署以包括那些自动学习的软规则的函数性。
以与关于自动化控制系统122所讨论的方式类似的方式,一个或多个用户(无论是相同的用户、重叠的用户或与参与创建自动化控制系统122的用户完全无关的用户)可以类似地通过计算机网络100与CDD系统140相互作用,以创建用于控制目标系统2 170中的一些或全部的单独自动化控制系统126。在这个示例中,目标系统2的自动化控制系统126仅包括将为自动化控制系统126执行所有控制动作的单个决策模块128。可以类似地以与关于自动化控制系统122所讨论的方式类似的方式针对目标系统2来部署和实施自动化控制系统126,以便在一个或多个计算系统190和/或作为目标系统2的一部分的一个或多个计算系统(未示出)上局部执行,不过在这个示例中并未示出自动化控制系统2的部署副本。将进一步了解,自动化控制系统122和/或126可以还包括分别与特定决策模块124和128分离的其他部件和/或功能性,不过图1中并未示出此类其他部件和/或功能性。
例如,网络100可以是可能由各种不同的当事方操作的被链接的网络的可公开访问网络(诸如,因特网),其中CDD系统140通过网络100可供任何用户使用或仅可供某些用户使用。在其他实施方式中,网络100可以是专用网络,诸如例如,完全或部分地不可被非特权用户访问的公司或高校网络。在还有其他实施方式中,网络100可以包括可以访问因特网和/或从因特网访问的一个或多个专用网络。因此,虽然在所示出的实施方式中以在线方式来实施CDD系统140以便通过一个或多个计算机网络100支持各种用户,但在其他实施方式中,可以改为以其他方式实施CDD系统140的副本诸如以便支持单个用户或一组相关用户(例如,公司或其他组织),诸如如果一个或多个计算机网络100改为是公司或其他组织的内部计算机网络,并且其中CDD系统的此类副本可选地不可供公司或其他组织外部的其他用户使用。在一些实施方式和情况中,CDD系统140的在线版本和/或CDD系统140的局部副本版本可以以基于收费的方式操作,使得一个或多个用户提供各种费用以使用CDD系统的各种操作,以便执行相互作用以产生决策模块和对应的自动化控制系统,和/或以各种方式部署或实施此类决策模块和对应的自动化控制系统。另外,CDD系统140、其每个部件(包括部件142和可选的其他部件117,诸如一个或多个CDD控制动作确定部件和/或一个或多个CDD协调控制管理部件)、每个决策模块和/或每个自动化控制系统可以包括软件指令,由一个或多个处理器(未示出)在一个或多个计算系统(未示出)上执行这些软件指令,以便将那些处理器和计算系统配置成操作为关于执行其编程功能性的专门化机器。
图1B是示出其中可以实施用于执行对目标系统的协作分布式控制的系统的示例性环境的网络图,且特定地继续关于图1A所讨论的示例。在图1B的示例性环境中,示出目标系统1 160,其中自动化控制系统122(无论是初始版本还是修订版本)现在被部署和实施成用于主动地控制目标系统1 160。在图1B的示例中,决策模块124被表示为个别决策模块124a、124b等至124n,并且可以在目标系统1 160的局部和/或通过一个或多个介入的计算机网络(未示出)以远程的方式执行。在所示出的示例中,每个决策模块124包括CDD控制动作确定部件144的局部副本,诸如其中部件144a支持其局部决策模块124a,部件144b支持其局部决策模块124b,并且部件144n支持其局部决策模块124n。类似地,在所示出的实施方式中,以对等方式协调和同步各种决策模块124的动作,其中每个决策模块124包括CDD协调控制管理部件146的副本以执行此类同步,其中部件146a支持其局部决策模块124a,部件146b支持其局部决策模块124b,并且部件146n支持其局部决策模块124n。
当决策模块124和自动化控制系统122执行时,执行决策模块124之间的各种相互作用175,诸如共享关于决策模块的当前模型和其他状态的信息,以使得各种决策模块之间能够协作和协调,以便使特定决策模块相对于一个或多个其他决策模块以部分同步一致性的方式(并且在一些情况下,以所有决策模块124的一致性动作收敛的完全同步的方式)操作。在决策模块124和自动化控制系统122的操作期间,可以由自动化控制系统122从目标系统160获得各种状态信息143,诸如初始状态信息和随时间的推移而改变的状态信息,并且包括目标系统1中的来自决策模块124所执行的控制动作的输出或其他结果。例如,此类状态信息可以被收集并用于附加软规则的后续自动化学习,以用来诸如由数据断层扫描部件通过自动学习软规则来改进初始系统模型以包括在目标系统的修订模型中,不过图1B中并未示出此类操作。
在这个示例中,目标系统1包括自动化控制系统122可以操纵的各种控制元件161,并且在这个示例中,每个决策模块124可以具有其所操纵的单独一组一个或多个控制元件161(使得决策模块A 124a执行相互作用169a以对控制元件A 161a执行控制动作A147a,,决策模块B 124b执行相互作用169b以对控制元件B 161b执行控制动作B 147b,并且决策模块N 124n执行相互作用169n以对控制元件N 161n执行控制动作N147n)。此类控制动作影响目标系统1的其他元件的内部状态163,包括可选地导致或影响一个或多个输出162。当目标系统1的操作持续时,向决策模块中的一些或全部提供至少一些内部状态信息163以影响其持续的控制动作,其中在这个示例中,决策模块124a至124n中的每一者有可能分别具有一组不同的状态信息143a至143n。
如在别处更详细地讨论的,每个决策模块124可以使用目标系统的决策模块的此类状态信息143和局部模型145以确定接下来要执行的特定控制动作147(诸如,在多个时间段中的每一者内),不过在其他实施方式和情况中,特定的自动化控制系统可以仅在一个时间段内或仅在一些时间段内执行与特定目标系统的相互作用。例如,决策模块124的局部CDD控制动作确定部件144可以确定该决策模块的局部模型145的近似最佳定位解,并且其中局部CDD协调控制管理部件146确定同步一致性解以反映决策模块124中的其他者,包括基于所确定的此类局部解和/或同步解来更新决策模块的局部模型145。因此,在执行自动化控制系统122期间,自动化控制系统执行与目标系统160的各种相互作用,包括请求状态信息和提供指令以修改目标系统160的控制元件161的值或以其他方式操纵目标系统160的控制元件161。例如,在多个时间段中的每一者内,决策模块124a可以执行与目标系统的一个或多个控制元件161a的一个或多个相互作用169a,而决策模块124b可以类似地执行与一个或多个单独的控制元件B 161b的一个或多个相互作用169b,并且决策模块124n可以执行与目标系统160的一个或多个控制元件N 161n的一个或多个相互作用169n。在其他实施方式和情况中,至少一些控制元件可能在每个时间段内不执行控制动作。
虽然图1B中并未示出示例性目标系统2 170,但是出于参考目的示出自动化控制系统126的决策模块128的进一步细节,不过此类决策模块128将通常不与控制目标系统1的决策模块124一起实施。特别地,在这个示例中,自动化控制系统126的部署副本仅包括单个执行决策模块128,不过在其他实施方式中,自动化控制系统126可以包括其他部件和功能性。另外,由于仅实施自动化控制系统126的单个决策模块128,所以该决策模块128包括局部CDD控制动作确定部件184,但在所示出的实施方式中不包括任何局部CDD协调控制管理部件(因为不存在要同步和相互作用的其他决策模块)。
虽然图1A和图1B中并未示出,但是自动化控制系统的操作(诸如,122的操作)的分布式性质允许各种决策模块的部分解耦操作,包括当自动化控制系统122在使用中时允许随时间的推移修改一组决策模块124,以便添加新的决策模块124和/或移除现有的决策模块124。以类似的方式,可以对特定决策模块124和/或128作出改变,以便改变特定于特定决策模块的规则或其他限制和/或随时间的推移改变特定于特定决策模块的目标,其中在此类决策模块内产生和部署新的对应模型,包括在一些实施方式和情况中当对应的自动化控制系统继续对应的目标系统的控制操作时。作为一个示例,至少一些此类修改可以反映一个或多个数据断层扫描部件的用于在一个或多个时间改进目标系统模型(或针对特定控制元件的模型)的操作,包括自动学习所添加的一个或多个软规则(无论是自动的还是响应于附加的用户指令或相互作用),以产生然后部署的改进的目标系统模型。另外,虽然在图1A和图1B的示例中每个自动化控制系统被描述为控制单个目标系统,但在其他实施方式和情况中可以使用其他配置,诸如使单个自动化控制系统控制多个目标系统(例如,多个相互关联的目标系统、同一类型的多个目标系统等),和/或多个自动化控制系统可以操作以控制单个目标系统,诸如通过每一者进行独立操作以控制该目标控制系统的不同部分。将了解,在其他实施方式和情况中,可以类似地使用其他配置。
在涉及包括用于存储和提供电功率的一个或多个电池的物理目标系统的情况下,用于控制目标系统的自动化操作可包括使用每个电池的状态的特性来执行对从电池提供的DC(直流)功率的自动化控制,诸如通过使用连接到电池的DC到DC放大器(例如,场效晶体管或FET、放大器)来实时地和以优化电池的长期操作为目的控制从电池输出的电流和/或电压的量。例如,DC到DC放大器可以是在使电流从其输入(供应)到其输出(负载)逐步上升时使电压逐步减低的降压式转换器(或降压转换器)的一部分,和/或在使电流从其输入(供应)到其输出(负载)逐步减低时使电压逐步上升的升压式转换器(或升压转换器)的一部分,其在本文中通常有时被称为“升压式/降压式控制器”或“降压式/升压式控制器”。另外,在一些实施方式和情况中,可以以这样的方式通过使用多个控制模块(每个控制模块与一个电池相关联)并以分布式方式协调对多个电池的整体控制(诸如,基于多个电池的多个关联控制模块之间的相互作用)来控制多个电池。在一些实施方式和情况中,一种包括要控制的一个或多个电池的系统可以还包括附加部件,诸如一个或多个电源和/或一个或多个电负载,这种类型的系统的一个非排他性示例是一个或多个家庭或企业电力系统,所述家庭或企业电力系统可以可选地包括发电源(例如,太阳能电池板、风力涡轮机等)以及来自家庭或企业的电负载。
图2A包括示出系统的实施方式的示例性部件的框图200A,所述系统用于使用电池状态的特性连同其他相关信息执行对来自电池的DC功率的自动化控制—特别地,示例性系统200A的各种部件相互作用,以考虑到限定的约束、规则和其他准则根据一个或多个限定的目标来控制电池的操作,如下文进一步讨论的。在一些实施方式中,用于控制电池的自动化活动可以实时地和/或以优化电池的长期操作(例如,电池的寿命)为目的来执行,同时满足尽可能多(例如,至少限定的百分比或数量的此类请求)的外部功率请求(例如,来自电池可以经由一个或多个对应负载290向其供应功率的公共设施260)。具体地,可以使用数据断层扫描部件来生成并使用更新的改进的控制代理(在这里被称为CDI代理,或者CDD决策模块或系统),如关于图2C-2J的示例详细讨论的那样。
在图2A的所示出的示例中,示出了经由致动器230被控制的电池210,所述致动器从电池控制器部件240(本文中有时也称为“跟踪控制器”和/或“电池跟踪控制器”)接收对应的控制信号,诸如通过电池控制器指定待产生作为电池的DC输出的功率量。指定的要产生的功率量可以包括指示例性如将输出的功率增加或减少一指定量或不改变功率输出的信息。电池的输出可以用来向一个或多个负载290提供功率,并且在至少一些实施方式中可以连接到逆变器/整流器部件(未示出),以将电池的功率输出转换为AC功率来支持对应的负载—例如,此类逆变器可以通过调节AC功率的电压和/或频率来控制从电池提供的功率。类似地,但是电池的输入可以用来从一个或多个源290接收功率,并且在至少一些实施方式中可以连接到逆变器/整流器部件(未示出),以将从这些源输入的AC功率转换为电池的DC功率—例如,此类整流器可以通过调节AC功率的电压和/或频率来控制向电池提供的功率。
作为确定如何控制电池的一部分,电池控制器部件240从一个或多个硬件传感器模块220接收关于电池内部状态(未示出)的输入,诸如电压、电流、温度等的当前值,并向初始控制代理250A供应对应的信息—虽然在本示例将电池控制器部件示出为向控制代理250A提供相关信息,但在其他实施方式中,控制代理250A可以以其他方式,诸如直接从传感器模块获得某些或全部此类信息。控制代理从电池控制器接收与电池状态有关的信息,并且还从公共设施部件260接收功率供应请求(诸如,在电池有时候或一直向受公共设施控制的电网(未示出)供应功率的情况下)。特别地,控制代理从公共设施接收特定请求,接收和分析关于电池状态,并确定在当前时间要对电池采取的对应操作(例如,要从电池供应的输出功率的量,和/或电池要接收和存储的输入功率的量),这些操作在至少一些情况下涉及尝试完全或部分地实时满足来自公共设施的功率请求(如果可以以一种也满足关于电池性能的其他约束的方式满足该请求,给定电池的当前状态和(一个或多个)限定的目标),以便使得电池能够在期望的不饱和范围中或以期望的不饱和水平(例如,关于电池的估计的内部温度和/或电池的估计的内部化学)操作。在确定在当前时间要对电池采取的对应操作之后,控制代理向电池控制器提供对应的跟踪控制信号,电池控制器确定当前如何修改或操纵致动器以针对跟踪控制信号实现对应操作(例如,在从电池输出的电流量方面作正或负变化的量),并将对应的控制信号发送到致动器,如上文所讨论的。
虽然图2A中也并未示出,但是在一些实施方式中控制代理和/或电池控制器可以包括电池的存储模型,所述存储模型用于估计电池的内部状态并且部分地基于该内部状态来选择要执行的特定操作,该内部状态稍后可以基于学习要使用的软规则的断层扫描部件的动作来更新,如下面关于图2C-2J更详细讨论的那样。例如,在一些实施方式中,可以使用适用于任何类型的电池的通用电池模型,而在其他实施方式中,可以使用特定于某种电池类型的电池模型(例如,用于储电和/或发电的化学反应类型,诸如锂离子或镍镉),而在又其他实施方式中,可以使用专门为使用中的特定电池设计和/或配置的电池模型。因此,可以随时间的推移更新最初被用在具有特定电池的特定系统中的这种电池模型,以便反映对模型底层结构的改进和/或训练模型以反映特定于使用中的特定电池和/或系统的操作特性(例如,通过监控可观测的电池状态的变化是如何与对应的外部电池电负载和/或电源相关的),诸如至少部分的基于学习要使用的软规则的断层扫描的动作—当训练模型或以其他方式调适模型以使其适应特定的电池和/或系统时,在一些实施方式中,可以最初在训练阶段(在使用自动化控制系统来控制电池之前)中执行训练/调适操作,和/或在一些实施方式中,可以在自动化控制系统控制电池(例如,以反映电池阻抗剖面随时间的推移的变化)时持续地或定期地执行训练/适应操作。本文中别处包括了关于此类模型的附加细节,包括其构建和使用。另外,虽然在一些实施方式中电池控制器和控制代理可以实施为单独的部件(例如,其中电池控制器全部或部分地实施在硬件和/或固件中,所述硬件和/或固件附接到电池或以其他方式附接在电池的某个位置处,并且其中控制代理部分地由软件指令实施,这些软件指令在远离电池位置且可选地通过一个或多个介入的计算机网络与电池控制器通信的一个或多个计算系统上执行),但是在其他实施方式中,控制代理和电池控制器可以实施为单个部件(无论是在电池的位置处还是远离电池的位置)。类似地,虽然在一些实施方式中,数据断层扫描部件和控制代理可以被实现为单独的部件(例如,断层扫描部件全部或部分在电池位置实现,和/或全部或部分在远程位置实现),但在其他实施方式中,控制代理和断层扫描部件可以实现为单个部件(无论是在电池的位置还是远离电池的位置)。下文更详细地讨论关于控制代理的操作的进一步细节,以确定要对电池采取的操作。
另外,虽然关于图2A并未示出,但是在一些实施方式中,多个电池(例如,几十个、几百个、几千个、几百万个等)可以各自具有以类似的方式控制该电池的动作的关联控制代理,并且其中各种电池以协调的方式一起作用以向公共设施或其他实体供应集合功率(aggregate power)。在此类实施方式中,公共设施或其他外部实体可以发送同步和监控信号以供由包括电池在内的各种系统使用,并且与各种电池相关联的多个控制代理可以相互作用以交换信息并且维持电池的操作之间的至少部分协调。
在至少一些实施方式中,使用一个或多个数据哈密顿函数来执行目标系统的状态的初始建模,并且所描述的技术包括使用断层扫描技术基于对一种或多种传感器数据的分析来修复或以其他方式改进数据哈密顿函数(例如,为了完成底层基于哈密顿的模型)。在至少一些实施方式和情况中,控制这种目标系统的CDD系统可以实现多个CDI控制代理,以通过具有同步的基于代理的网络、经由平均场哈密顿方法来分布控制和管理,例如每个代理由定义目标系统中一个或多个对应部件的动态和相互作用的数据哈密顿来表征,并且代理的每个这样的数据哈密顿从传感数据和动作来动态地计算。这样的数据哈密顿(对于单个目标系统部件)和/或平均场哈密顿(对于多个协调的目标系统部件)可以被认为是数学函数,该函数通过定义可能结果的谱来帮助操纵通过巨大的信息体的查询,包括对历史、当前情况和可能的选择进行建模。本文中进一步描述了使用这些技术的非排他性示例实施方式,但是应当理解,其他实施方式可以以一种或多种方式与这些示例性实施方式不同。
数据哈密顿可以被实现为捕获数据域的流和相互依赖性的函数,并且可以具有三种类型的变量(例如,状态变量、流变量、以及决策或控制变量)。CDI控制代理可被实现为在属于多数据域的数据域中操作的基于优化的推理引擎,其中代理优化函数性被编码在代理的哈密顿中。CDD系统可以被实现为形式的、分布式推理基于规则的优化过程,用于实时地解决来自基于分布式代理的域的基于时间的查询。CDD系统的CDI控制代理可以使用三种类型的霍恩子句(Horn clause)规则实现,如下所示:绝对规则,其表征被控制的物理目标系统的物理特性(或者以其他方式描述其他类型的目标系统中的不可变规则),并且在任何哈密顿实现中具有等于真的真值(例如,对于假的值为0或对于真的值为1);硬规则,其表征期望的行为和目标,并且在任何哈密顿实现中具有等于真的真值(例如,对于假的值为0或对于真的值为1);以及软规则,其表征关于操作、启发式策略、经济调度和对异常和学习策略的响应的经验知识,并且在[0,1]中具有可变的、概率性真值,以及在一些实施方式中具有该可变的概率性真值的相关联置信值。元规则是用于将传感数据和期望行为转换为约束数据哈密顿的具体种类的软规则。软规则可以被认为是用于通过“梯度”(既非真也非假的信息)操纵查询,作为识别哪些区域的数据与任何给定查询相关的一种手段。因此,用于CDI控制代理的这些规则限定了对于该代理的数据哈密顿的约束,并且可以转换为相应的CDD系统所解决的约束优化问题。例如,这种转换可以包括以下步骤:将真值{0,1}转换为[0,1]区间;将变量和参数转换为连续变量和参数;将绝对规则转换为等式约束;将硬规则转换为等式约束;将软规则转换为不等式约束;将包含集转换为函数形式;将算法转换为微分方程;等。
此外,如上所述,在至少一些实施方式和情况中,某些或所有这些软规则可以由用于特定目标系统的一个或多个数据断层扫描部件自动学习,并用于改进目标系统的先前模型,以便更好地控制目标系统向前发展。相应地,图2B还包括信息200B,其示出了在图2A的示例中,初始控制代理250A由一个或多个用户285构建,用户285为系统200A提供绝对规则和硬规则280。在至少一些实施方式和情况中,初始控制代理250A可以还包括来自一个或多个源255的信息,例如历史电力供应和需求,和/或天气数据,不论是通过用户285的动作并入还是自动包括在初始控制代理250A中。
图2C进一步示出了200C,初始控制代理250A的使用可以用于收集各种信息235,以便建立反映电池210的实际操作的数据模型245。在该示例中,这样的信息235包括来自一个或多个传感器模块220的传感器模块数据,经由致动器230提供的以影响电池210的操作的控制信号信息和/或所得动作,从一个或多个源和/或负载290向电池210的或来自电池210的所得功率输入和/或输出等。
在收集了图2C的信息235和数据模型245之后,图2D示出了关于数据断层扫描部件270的操作的其他信息200D,以产生用于电池210的更新的改进的控制代理250D。特别地,如关于图1C和别处更详细地讨论的,断层扫描270使用数据模型245来确定电池210的实际操作与由用于初始控制代理的绝对规则和硬规则所预测的操作的差异,以便生成反映这些差异的新的(或修改的)软规则。然后使用该所生成的软规则信息来更新初始控制代理以产生改进的更新的控制代理250D。
然后图2E示出了系统200E的修改版本,其中现在使用更新的控制代理250D代替初始控制代理来控制电池210和系统200E的其他元件的进一步操作。虽然图2D中的断层扫描组件的操作在一些实施方式和情形中可以仅执行一次,例如学习未由一个或多个用户285提供的软规则,但在其他实施方式中,可以以类似的方式多次(例如,周期性地、连续地或大致连续地等)使用断层扫描部件,例如以随时间继续改进控制代理(例如,在结构上使控制代理适应随时间对系统发生的变化,例如添加和/或移除和/或修改一个或多个负载,添加和/或移除和/或修改一个或多个源,电池210的内部状态和操作特性的改变,一个或多个其他元件220或230或240或260的改变等)。因此,图2F示出了图2E的修改版本,其中图2F的系统200F包括断层扫描部件270,用于在一个或多个附加时间进一步更新控制代理250D。如上所述,可以继续提供附加的数据源元件255,以允许断层扫描部件270获得和使用一种或多种类型的传感器信息作为其操作的一部分(例如,过去和/或当前天气数据、过去和/或当前价格数据、过去和/或当前关于电源和/或需求的数据、来自传感器模块210的电流、电压和内部温度数据、关于用作控制电池210的输入的跟踪和/或控制信号的信息等)。
图2G-2J提供了与图2A-2F中所示的目标系统的操作有关的其他示例性数据,以及与断层扫描部件270在改进目标系统的控制代理方面的动作有关的其他示例性数据。
特别地,图2G示出了示例性数据290,例如以反映关于图2C讨论的数据235的一部分。数据290被显示为一个表,其中每一行对应于不同的时间292e,各列292a-292d示出每个时间的各种传感器数据和控制信号/动作信息,而其他列292u-292w示出每个时间的各种系统输出或结果信息。应当理解,为了示例而简化了数据,并且可以在其他实施方式和情况中收集并使用各种其他类型的数据,而不管是除了示例性数据还是代替示例性数据。图2H包括信息296,用来说明用于目标系统的示例性绝对规则和硬规则,例如以对应于用户285提供的一些规则280。在这个示例中,根据满足指示条件的指示的传感器值,每个规则评估为真或假。例如,对于前两个指示的规则,它们具有指示内部温度温度传感器的值是否分别低于最大温度阈值或高于最小温度阈值的指示条件。因此,对于时间E1(对应于表290的行294-1),如果内部温度温度值A1低于温度最大但不高于温度最小,则第一规则将评估为真,第二规则将评估为假。图2I包括信息297,以说明断层扫描部件270可以执行以确定一个或多个软规则的示例性查询,例如针对一个或多个指示的传感器,通过对具有不同的组的一个或多个输入值的电压_入/出的值进行3次或更多次查询。所示的第四个查询具有不同的形式,从而针对一个或多个指示的传感器,对具有不同的组的一个或多个输入值的功率_入/出的值导致是或否的答案。图2J包括信息298,用于提供断层成像组件270可以学习用于目标系统的两个软规则的示例,例如以用作更新的控制代理250D的一部分。第一学习软规则对应于关于电压_入/出值如何与电池年龄的学习关系,具有由概率Q表示的相关联置信水平,而第二学习软规则对应于预期电池寿命的学习变化,其中由概率N表示的相关置信水平。应当理解,图2A-2J的细节并非旨在限制本发明的范围,而是为了说明目的而提供的。
图2K包括框图200K,其示出由CDI控制代理250J自动地控制(诸如,在断层扫描部件270已经在控制代理中自动学习了要使用的软规则之后)的另一个目标系统的实施方式的示例性部件。在这个示例中,控制代理250J执行自动化操作以来控制经由一个或多个HVAC单元272对建筑物271的供暖和/或供冷,以便考虑到限定的约束、规则和控制代理中所表示的其他准则来满足一个或多个限定的目标。在一些实施方式中,可以实时地和/或以优化供暖和/或供冷活动的成本为目的来执行用于控制(一个或多个)HVAC单元的自动化活动,同时根据一个或多个限定的准则维持对建筑物的一些或全部房间的供暖和/或供冷(例如,维持在某个温度范围内,以对住客供应的动态请求作出响应来在特定的时间升高或降低特定房间内的温度等)。
在图2K的所示出的示例中,建筑物具有多个楼层274,其中每个楼层具有多个房间275。一些房间具有温度传感器276以供应该房间的温度,而一些房间(无论是相同的房间还是不同的房间)可以具有住客可选择的指令盒277以请求对与那些指令盒相关联的一个或多个房间进行供暖和/或供冷。控制代理250J和/或断层扫描270接收以下各者:来自目标系统的传感器(例如,室内温度传感器276、一个或多个外部温度传感器、与建筑物的(一个或多个)HVAC单元272和/或功率供应器273的操作相关联的传感器等)的信息;从控制代理250J供应到(一个或多个)HVAC单元272和/或功率供应器273的控制信号信息;关于目标系统操作的输出或结果的其他信息等—虽然在这个示例中控制代理被示出为直接向(一个或多个)HVAC单元和/或功率供应器提供指令,但是在其他实施方式中,控制代理可以改为向一个或多个中间系统(例如,智能建筑物管理系统)供应控制指令。将了解,可以类似地针对目标系统200K执行与关于图2A至图2J所描述的活动类似的活动,不过此处为了简洁起见并未示出此类细节。
关于在至少一些实施方式中断层扫描部件的操作的附加示例性细节如下,但是将理解,一些实施方式可以以其他方式执行断层扫描技术。
下面的方程对应于目标系统的第k个传感器,如图1G的图199所示,并且以代数方式求解,每次在一个传感器上迭代,以获得系统的哈密顿的近似。
Figure BDA0001887267510000201
其中:Yk是与第k个传感器相关联的信号
Hi T是通过第i个代理的断层扫描的数据断层扫描估计
每个代理i的规则哈密顿包括绝对规则、硬规则和软规则:
Figure BDA0001887267510000202
如果哈密顿HR是完整的,则
Figure BDA0001887267510000203
Figure BDA0001887267510000204
如果2不满足,
j,HR]≠0
则HR不完整,并且其完整性需要通过经由断层扫描动态从传感信号和来自其他代理的数据的修复过程来确定。
引理:给定域(例如,SBIR),由与一组规则{ri(x,p,u),i=1,...n}
的相对应的一组电势{φi(x,p,u)=0,i=1,...n}来表征。让G(x,u)作为与查询g(x,u)相关联的电势。
则我们可以找到关于{ri(x,p,u),i=1,...n}的对g的解
当且仅当
Figure BDA0001887267510000211
(电势的凸组合=查询)
其中{gi(x,p,u)=0,i=1,…n}是域变量的连续微分函数
解是满足域的规则的查询中变量的一组值。
定理1
完整的哈密顿必须满足断层扫描条件,
j,HR]+[φj,HT]=0 j=1,...,n,n是主动规则的数量,
其中
HT是断层扫描完整性
Figure BDA0001887267510000212
并且[φj,HR+HT]=0,j=1,...,n
上述定理提供了对于传感数据的结构适应要求。
从断层扫描条件,可以导出结构可观测性条件,以确保足够的传感信息可用。
让Yk(t)作为由第k个传感器生成的矢量传感器信号:
Yk(t)=Ψk(t,x,p),其中Ψk是传感器的模型
定理2
HR+HT必须满足传感器完整断层扫描条件,
Figure BDA0001887267510000221
对于每一个代理i所有的传感器k,k=1,...,Ki同时。
推论
结构可观测性对应于HT的唯一解。
一般来说,结构可观测性仅在宽松的意义上实现,例如,极小最小二乘。
一般来说,断层扫描方程的收敛速度和质量随着独立传感信号的数量而增加。实现断层扫描的算法是基于逆模型方法的应用。
让Yk(t)作为由第k个传感器生成的矢量传感器信号:
Yk(t)=Ψk(t,x,p),其中Ψk是传感器的模型,HT,k是其哈密顿形式
Figure BDA0001887267510000222
定理3
Figure BDA0001887267510000223
满足传感器完整断层扫描条件,
对于具有“循环条件”k=0modL的第一k–l个传感器
L=传感器数量,则第k个完整满足,
Figure BDA0001887267510000224
Figure BDA0001887267510000225
对于每个传感器k,k=0modL
定理3的迭代过程可以用西格尔狄拉克过程在代数上实现。
让Yk(t)作为由第k个传感器生成的矢量传感器信号:
Yk(t)=Ψk(t,x,p),其中Ψk是传感器的模型
定理4
Figure BDA0001887267510000231
满足传感器完整断层扫描条件,
对于具有“循环条件”k=0modL的第一k–l个传感器
L=传感器数量,则第k个完整满足,
Figure BDA0001887267510000232
对于每个传感器k,k=0modL,
其中,
Figure BDA0001887267510000233
是传感器k的哈密顿,其使由传感器引入的熵最小化
关于在至少一些实施方式中断层扫描部件的操作的其他示例性细节如下:
本文描述的数据断层扫描部件的操作和功能性可以类似于用于成像(例如,X射线、MRI等)的断层扫描方法。作为示例,考虑构建膝盖的图像(用于手术)。多个信号或探测被传送通过膝盖,并且根据与每个信号相关联的密度信息重构图像。在本文描述的数据断层扫描部件中,提交查询以获得信息,并且查询的结果被用来构建用于被研究的目标系统的数据哈密顿函数(在本文也仅称为“哈密顿”)。例如,一个查询可能是有多少人经历了膝盖的疼痛。另一个查询可能是进行了膝盖手术患者的年龄。另一个查询可能是关于恢复时间。构建的数据哈密顿是感兴趣区域的局部数据,类似于膝盖图像是局部的方式,并且不提供关于肩膀、臀部或身体其他部分的信息。在某些情况下,可能不存在整个数据集的全局哈密顿,但是可以参照查询构建局部哈密顿。
在至少一些实施方式中,所描述的数据哈密顿的创建和学习结合了归纳和演绎策略。演绎策略假定数据的属性在强烈意义上是有效的;它们将这些属性表征为逻辑规则(二进制真/假规则)。这些逻辑规则具有两种类型,表征数据中通常有效的内容的绝对规则,以及作为表征从数据中提取所需信息的特定方法的逻辑规则的硬规则。这些规则在历史上是有效的,可以用来构建初始哈密顿。
归纳策略由一组规则表征,所述一组规则在完全假(0)和完全真(1)之间具有真值评估。这些被称为具有在[0,1]区间中的值的软规则。软规则可能具有依赖于数据的附加元素,称为阈值。阈值是与确定查询的真实性评估的规则相关联的数据的函数。绝对规则和硬规则的组合确定了称为数据哈密顿的数据编码结构。数据哈密顿与哈密顿物理学共有许多性质,如传播机制、正性性质、数据成分之间的相关性、单调性等。数据哈密顿结构是表征数据域的变量、数据域中的数据的可变性(数据动量)和数据域的修改参数的函数形式。
对于异构数据,对于每个数据类(不一定是不相交的)构建单独的哈密顿结构可能是有用的,并且可以构建平均场哈密顿聚集结构以将整个数据宇宙表征为单个数据结构。
软规则是通过经由构建哈密顿结构的学习算法来提取数据而被学习的:这个部件称为数据断层扫描部件。数据断层扫描工作如下。对于数据上的给定查询,它通过首先生成作为对与初始查询相关联的特定数据类的探测的一组查询,来生成答案(可能为空答案)。数据断层扫描使用该组查询和相关联的响应(输入和输出对)以从对该组查询的响应来构建(或更新)功能结构。与特定查询相关联的哈密顿可以通过样条或分段多项式来近似。数据断层扫描生成与特定查询(或目标)相关联的软规则。只能从软规则中得到的哈密顿那部分叫做软断层扫描。
与数据的特定方面相关联的总哈密顿是关于该类的数据哈密顿和基于规则的哈密顿的总和,包括由绝对规则构建的绝对哈密顿、由硬规则构建的硬哈密顿和由数据提取构建的软哈密顿。这个总哈密顿表征数据类。
数据断层扫描的另一方面是一组条件,所述一组条件指示由断层扫描生成的查询是否正在提供新信息,或者是否存在足够的信息并且不再需要查询。当条件满足时,则哈密顿提供了接近近似,并且不再构建软规则。当条件尚未满足时,则通过传播与特定查询相关联的传感器方程并根据特定数据类的需要添加更多的输入-输出对,来细化或学习哈密顿。
在哈密顿结构中对数据进行编码具有来自其中数据的互相关很重要的其他方法的优点。来自一个数据类和其他数据类的数据的互相关是通过一类的哈密顿和平均场哈密顿之间的相互作用来调解的,而不是通过一类的数据哈密顿和其他类的哈密顿的直接相关来调解的。这种方法为这种互相关提供了多项式复杂性。互相关答案的质量仅由互相关计算所允许的迭代误差(量化误差)确定。对于跨多个数据类的查询的推断也是如此。
所描述的技术适用于动态数据、具有高度不确定性的数据、高维数据、互相关数据等,具有低复杂度计算(二阶多项式计算)。
使用所描述的技术从数据学习或推断是基于生成朝向使相对熵最小化的答案的数据的收敛轨迹的。它通过适当地为查询的变量分配与数据相关的值(数值或以其他方式),将答案近似为熵减少的函数。
许多复杂系统的特征动态,特别是涉及计算过程(算法)的系统,不容易用传统的数学约束进行建模。数据断层扫描部件的使用允许基于传感数据和规则来提取系统的动态,使得系统能够以最佳方式学习和适应变化的环境条件,本文有时称为结构适应。
数据断层扫描部件操作以两种方式进行。首先,它将传感信号转换成哈密顿,其次,它从传感信号中提取规则,这些规则然后可用于系统的哈密顿中。断层扫描基于更新的数据和更新的规则提供对系统的动态的结构调整。规则是能够量化行为的软规则。通过这种方式,断层扫描使得元控制方法能够随着环境的变化学习和更新哈密顿。反过来,断层扫描可以提取软规则,从而随着系统的发展,为用户提供对系统的理解。断层扫描是学习系统结构(结构自适应)并能够发现和修改软规则的实时系统。
为了从传感数据中提取规则,断层扫描“激励”与目标相关联的数据。经由与激励目标相关联的传感器观察到的域动态生成所提取的可感测数据,该可观测数据馈送与现有规则(在知识库中)和新数据相关联的哈密顿的传播子。图1C示出断层扫描如何生成软规则。
图1C的哈密顿传播子生成与激励-传感器对相关联的域的总哈密顿。包括规则和观测数据的总哈密顿,是HT(x,p,u,t)并且由传播子生成。它附加地可分解为两个哈密顿:基于规则的哈密顿
H0(x,p,u,t).
以及与提取数据相关的哈密顿
HS(x,p,u,t).。
因此我们具有
HT(x,p,u,t)=H0(x,p,u,t)+HS(x,p,u,t)
然而,为了断层扫描的目的,我们将其重写为:
HS(x,p,u,t)=HT(x,p,u,t)-H0(x,p,u,t).
我们知道总哈密顿和基于规则的哈密顿,因此我们可以确定与提取的数据相关联的哈密顿。潜在哈密顿表示软规则,该软规则是通过求解以下方程来确定的
ln(Pk(t,x,p)—阈值)=HS(x,p,u,t)
以获得相应的软规则
Figure BDA0001887267510000261
与由第k个传感器测量的数据相关联。
图1G中描述了第k个传感器模型,包括数据源和规则。第k个传感器由一组规则表征,这组规则依赖于用于迫使数据生成传感器信号Yk(t,x,p)的激励,作为算法时间的函数。由给定激励生成的传感数据的数据历史驱动总哈密顿传播子方程。
下列传播子是关于系统的总哈密顿的双曲方程,因为它涉及第k个传感器信号,
Figure BDA0001887267510000262
对于k=1,…n,其中,Yk是与第k个传感器相关联的信号,且Hi T是通过第i个代理的断层扫描的数据断层扫描估计。求解(实时)给出总哈密顿的估计。状态和共态轨迹由相应的哈密顿-雅各布方程生成。每个代理i的规则哈密顿包括绝对规则、硬规则和软规则:
Figure BDA0001887267510000271
其中HA(x,p,u)是绝对规则的哈密顿,每个软规则被编码至其电势函数φj(x,p,u)。
由于激励不产生信号,或者所产生的信号与总哈密顿完全兼容(即,传感器不提供新信息),所以可能给定传感器不会生成对其哈密顿的修改。如果信号是完全兼容的,则我们说哈密顿是完整的。如果规则哈密顿是完整的,则对于每个电势j满足以下两个条件:
(1)φj(x,p,u)=0,并且
(2)[φj(x,p,u),HR(x,p,u)]=0
这些是规则电势条件,泊松括号是由以下等式给出
Figure BDA0001887267510000272
如果条件(2)不满足,即如果对于至少一个j[φj(x,p,u),HR(x,p,u)]≠0,则HR不完整,并且其完整需要通过修复过程来确定,修复过程经由动态使用来自其他代理的传感信号和数据。
下面的条件是可以数值测试的以决定是否需要修复过程,或者当前的哈密顿是否完整。
条件(3):给定由与一组规则{ri(x,p,u),i=1,...n}相对应的一组电势φi(x,p,u)=0,i=1,...,n表征的域。让G(x,u)=0作为与查询g(x,u)相关联的电势。则我们可以找到关于这组规则{ri(x,p,u)=0,i=1,...,n}的查询的解,当且仅当电势的凸组合等于查询时,即,
Figure BDA0001887267510000273
其中函数gi(x,p,u)=0,i=1,...,n是域变量的连续微分函数。
如果条件(3)在数值上被满足,则存在满足域的规则的查询中变量的一组值的解,并且由数据断层扫描生成的规则哈密顿是完整的。
即使当规则哈密顿是完整的时候,它也应该与现有的规则兼容。为了使新数据与现有规则兼容,以下条件证明经由传感数据对总哈密顿的修改的语义生成是合理的。它还提供了传感数据和规则的结构适应。根据断层扫描条件,给定电势能和规则,可计算完整的哈密顿。可以导出结构可观测性条件,以确保用于完整的哈密顿的足够的传感信息。
条件(4):完整的哈密顿满足断层扫描条件,对于j=1,...,n,
j(x,p,u),HR(x,p,u)]+[φj(x,p,u),HT(x,p,u)]=0
对于j=1,...,n,其中HT是完整哈密顿,
HR(x,p,u)=HA(x,p,u)+∑jλjφj(x,p,u),
并且对于j=1,...,n,[φj(x,p,u),HR+HT]=0。
当条件不满足时,则根据新的信息构建或学习新的哈密顿。哈密顿的结构适应是通过从数据中提取信息实现的,如本文所述。让Yk(t)作为由第k个传感器生成的矢量传感器信号。则我们有
Yk(t)=Ψk(t,x,p)
其中Ψk(t,x,p)是传感器的模型。以下条件提供了传感数据和结构可观察性之间的关系。实现断层扫描的算法是基于逆模型方法的应用。一般来说,用断层扫描求解哈密顿的收敛速度和质量随着独立传感信号的数量而增加。条件(5).HR(x,p,u)+HT(x,p,u)满足传感器完整条件,
Figure BDA0001887267510000281
对于每一个代理i所有的传感器,k=1,...,Ki同时。
结构可观测性对应于HT的唯一解。一般来说,结构可观测性仅在宽松的意义上实现。现在,给定矢量传感器信号Y_k(t),以及传感器的模型
Ψk(t,x,p),其中
Yk(t)=Ψk(t,x,p)
关联的哈密顿,由HT,K表示,具有形式
Figure BDA0001887267510000282
下面的迭代过程提供了结构自适应的数值实现。该过程和符号是基于用于约束哈密顿的狄拉克理论的。结构适应过程1。让
Figure BDA0001887267510000283
满足对于具有“循环条件”k=0modL的第一k-1个传感器的传感器完整条件,其中L是传感器的数量。则第k个完整满足
Figure BDA0001887267510000291
其中对于每个传感器k,k=0modL,
Figure BDA0001887267510000292
接下来建立一个迭代过程,用于在哈密顿中合并许多传感器信号,以保证给定代理的多个传感器彼此兼容。请注意,修复条件也提供完整。结构适应过程2。让
Figure BDA0001887267510000293
满足对于具有“循环条件”k=0modL的第一k-1个传感器的传感器完整条件,其中L是传感器的数量。则第k个完整满足修复条件,
Figure BDA0001887267510000294
其中对于k=0modL的每个传感器k,
Figure BDA0001887267510000295
并且其中
Figure BDA0001887267510000296
是使由传感器引起的熵最小化的传感器k的哈密顿,。
除了图1C和图1G的细节之外,图1D还示出了示例性流程图和附加信息196,其指示可如何使用断层扫描技术来基于用于相应目标系统的传感器数据生成和向数据哈密顿添加软规则和其他信息。图1E进一步示出了示例性框图197,该示例性框图197示出了使用断层扫描技术来校正或以其他方式完成从目标系统的部分已知状态丢失的信息的系统的代理架构概览的示例。此外,图1F示出了示例性流程和附加信息198,其指示当表示相应目标系统的哈密顿仅部分已知时,如何优化CDD系统的规则和其他状态信息,包括通过使用断层扫描来校正或以其他方式完成从部分已知状态丢失的信息。图10进一步说明了CDD系统的实施方式的高级流程1000,其中断层扫描部件的活动可作为所指示的修复过程的一部分实现。图11示出了在分布式CDD系统实施方式中使用多个断层扫描部件的其他示例性细节的框图1100,其中每个断层扫描部件与N个CDI代理中的一个相关联。
所描述的涉及断层扫描技术的使用的技术可以提供各种益处和优点。这些优点和优点的非排他性示例包括以下各项:改进目标系统的当前状态如何建模,例如以生成函数和/或结构,其对目标系统的内部操作建模,而不是在不了解目标系统内部结构和操作的情况下仅仅尝试从输入估计目标系统输出;增加处理不确定性管理和/或优化调度和承诺和/或异常检测和响应的能力;执行结构适应以自动学习与目标系统的变化相对应的新规则;等等。
另外,关于其中控制电池在DC侧上的功率输出(例如,通过改变电池的DC电流和电压)的实施方式,所描述的技术的好处和优势包括:允许电池关于内部温度和/或其他电池参数以其最佳或近似最佳物理状态操作(例如,通过将电池的内部化学维持在一个或多个化学计量界限内,诸如化学计量范围),而非将由连接到电池的逆变器提供的AC(交流)电压和/或电流固定在单个指定的水平,以及迫使电池在提供最大功率但以可能的不可逆电池损坏为代价的饱和水平下操作—以这种方式,考虑到至少部分地通过本文所述的断层扫描技术生成的电池状态信息,通过允许电池在其中电池化学变化可逆并且其中短路和其他不可逆损伤减少或消除的优选范围中操作,电池寿命及其他操作性能就可以通过所描述的技术得到优化或以其他方式得到增强。另外,在至少一些实施方式中,对电池的自动化控制可以还包括:对电池的主动控制,以增强和维持与其他部件(例如,负载和/或外部电网)产生共鸣的功率输出量,使得所提供的功率量不超过所需的功率量,同时也满足至少限定的百分比或其他量的功率输出请求或负载量(例如,50%、65%、100%或任何其他限定的百分比或其他量)。以这种方式,此类实施方式可以被概念化为用于管理被控制的电池的内部状态和操作性能(包括寿命)同时满足功率输出请求(如果可能的话)的自动化控制系统,而非被概念化为固定电池的输出电压或电流并且满足所有功率请求(即使这导致电池损坏或其他问题(例如,过热))的现有系统。虽然在上面和本文中的一些其他位置中所讨论的好处和操作与控制从电池输出的功率有关,但将了解,相同的技术可以被用来控制从一个或多个源存储到电池中的功率,以便在存储功率时导致电池关于热和其他电池参数以其最佳或近似最佳物理状态操作,以及通过以下步骤来优化或以其他方式增强电池寿命和其他操作性能:允许电池在其中电池化学变化是可逆的优选范围中操作,同时满足针对由一个或多个源供应的功率的至少限定的百分比或其他量(例如,50%、65%、100%或任何其他限定的百分比或其他量)的功率输入请求。附加的好处和优势包括以下各者,其中如本文中所使用的术语“优化”特征或结果通常意指改进该特征或结果(例如,经由部分优化或完全优化),以及其中如本文中所使用的术语“实时”意指关于特定于被控制的结果部件或系统的时间框架(例如,几分之一秒、几秒、几分钟等),除非另有说明:
●可以通过优化DC控制变量(诸如,I(电流)、V(电压)和R(所输出的功率的量))来改进电池寿命;
●可以通过优化DC控制变量(I、V、R)结合电池化学的先前特征化来改进电池寿命,并且可以在DC水平下优化以改进性能和寿命;
●可以在DC域中实时优化变量,以求解AC相位中的目标;
●可以实时优化AC输出以与电网频率相匹配,从而导致谐振操作,诸如经由只控制电池输出而不控制其他电网部件;
●可以改进充/放电循环,以改进长期的电池可用性;
●可以改进AC负载响应;
●可以改进AC负载响应结合改进长期的电池可用性;
●电池控制器可以作为嵌入式软件在处理器上以自给自足的方式运行;
●可以从外部位置(例如,云端或其他网络可访问位置)不断地监控和更新电池控制器;
●电池控制器可以传输电池特性以改进性能;
●可以避免静电棒补偿器硬件的费用。
在至少一些实施方式中,可以进一步实现各种其他好处和优势,如下文更详细地部分讨论的。为了说明性目的,下文包括关于一些实施方式的一些附加细节,在所述实施方式中,以特定方式执行特定类型的操作,包括关于特定类型的目标系统和针对以特定方式确定的特定类型的控制活动。这些示例是为了说明性目的而提供的并为了简洁起见而被简化,并且本发明技术可以用于广泛多种其他情况中,包括在其他实施方式中使用和与其他类型的自动化控制动作确定技术(其中一些自动化控制动作确定技术在下文进行讨论)一起使用。
图3是示出示例性计算系统的框图,所述计算系统适合于执行用于至少部分地基于使用断层扫描技术生成的状态信息以配置的方式实施自动化控制系统以控制或以其他方式操纵指定的物理系统或其他目标系统的至少一些操作的技术,如在本文中别处更详细地讨论的。特别地,图3示出适合于提供CDD系统包括一个或多个断层扫描部件的至少某种功能性的服务器计算系统300,不过在其他实施方式中,可以使用多个计算系统以进行执行(例如,具有执行CDD决策模块构建部件的不同的计算系统以在发生运行时控制之前进行初始配置和设置,以及用于实际运行时控制的CDD控制动作确定部件344和/或CDD协调控制管理部件346和/或断层扫描部件345的一个或多个副本;具有执行断层扫描部件的一个或多个计算系统,所述计算系统与执行断层扫描部件与之相互作用的CDD系统中的一些或全部的一个或多个计算系统分离;具有执行不同断层扫描部件的不同的计算系统;等)。图3还示出可以由CDD系统340的客户或其他用户使用的各种客户端计算机系统350,以及具有要控制的一个或多个目标系统(在这个示例中为目标系统1 360和目标系统2 370,CDD系统340和其断层扫描部件345通过一个或多个计算机网络390可访问这些目标系统)。
在所示出的实施方式中,一个或多个断层扫描部件345在存储器330中执行为CDD系统340的一部分,并且在一些实施方式中,所述(一个或多个)部件各自包括各种软件指令,这些软件指令在被执行时对硬件CPU处理器305中的一者或多者进行编程以提供如本文中别处所描述的断层扫描部件的实施方式。在操作期间,在至少一些实施方式中,每个断层扫描部件可修改或以其他方式生成一个或多个目标系统状态模型(例如,存储在存储装置320上的模型322的内存(in-memory)副本),获得各种输入数据324,并且与其他执行部件交换各种信息,如在本文中别处更详细地讨论的。在所示出的实施方式中,服务器计算系统300具有包括以下各者的部件:一个或多个硬件CPU(“中央处理单元”)计算机处理器305、各种I/O(“输入/输出”)硬件部件310、存储装置320和存储器330。所示出的I/O部件包括显示器311、网络连接312、计算机可读媒体驱动器313和其他I/O装置315(例如,键盘、鼠标、扬声器等)。另外,所示出的客户端计算机系统350可以各自具有与服务器计算系统300的部件类似的部件,包括一个或多个硬件CPU 351、I/O部件352、存储装置354和存储器357,不过为了简洁起见并未针对计算系统350示出一些细节。目标系统360和370还可以各自包括一个或多个计算系统(未示出),所述计算系统具有与关于服务器计算系统300所示出的部件中的一些或全部类似的部件,但为了简洁起见,在这个示例中并未示出此类计算系统和部件。
CDD系统340在存储器330中执行并包括部件342至346,并且在一些实施方式中,所述系统和/或部件各自包括各种软件指令,这些软件指令在被执行时对CPU处理器305中的一者或多者进行编程以提供如本文中别处所描述的CDD系统的实施方式。CDD系统340可以通过网络390(例如,经由因特网和/或万维网、经由专用蜂窝网络等)与计算系统350以及在这个示例中的目标系统360和370相互作用。在这个示例性实施方式中,CDD系统包括与以配置方式为客户或其他用户产生和部署决策模块有关的功能性,如在本文中别处更详细地讨论的,以及在运行时生成或部署断层扫描部件345,以改进相应目标系统的建模状态信息。其他计算系统350也可以执行各种软件,以作为与CDD系统340和/或其部件的相互作用的一部分。例如,客户端计算系统350可以是存储器357中的执行软件,用于:与CDD系统340相互作用(例如,作为web浏览器的一部分、专门化的客户端侧应用程序等),以便与CDD系统340的一个或多个接口(未示出)相互作用以配置和部署自动化控制系统(例如,所存储的自动化控制系统325,其先前由CDD系统340创建以用于控制一个或多个物理目标系统)或其他决策模块329;以及执行各种其他类型的动作,如在别处更详细地讨论的。与CDD系统340的功能性有关的各种信息可以存储在存储装置320中,诸如与CDD系统的用户有关的信息321(例如,帐户信息)、以及与一个或多个目标系统(例如,具有要控制的电池的系统)有关的信息323。
将理解的是,计算系统300和350以及目标系统360和370仅仅是说明性的,且并不意在限制本发明的范围。计算系统可以改为各自包括多个相互作用的计算系统或装置,并且计算系统/节点可以连接到未示出的其他装置,包括通过一个或多个网络(诸如,因特网)、经由Web或经由专用网络(例如,移动通信网络等)。更一般地说,计算节点或其他计算系统或装置可以包括可相互作用并执行所描述类型的功能的任何硬件的组合,包括但不限于台式或其他计算机、数据库服务器、网络存储装置和其他网络装置、PDA、手机、无线电话、寻呼机、电子组织器、因特网器具、基于电视的系统(例如,使用机顶盒和/或个人/数字录像机)以及包括适当通信能力的各种其他消费产品。另外,在一些实施方式中,由所示出的CDD系统340及其部件提供的功能性可以分布在附加部件中。类似地,在一些实施方式中,可能不提供CDD系统340和/或CDD部件342至346的一些功能性,和/或其他附加功能性可能是可用的。
作为实施特定目标系统的此类自动化控制系统的一部分,协同分布式决策(CDD)系统的实施方式可以使用所描述的技术来执行在构建和实施自动化控制系统中所涉及的各种自动化活动,包括用于控制特定目标系统的一个或多个CDI代理(也称为CDD决策模块或系统,或此类模块或系统的一部分)。
特别地,在一些实施方式中,CDD系统可以实施决策模块构建部件,所述决策模块构建部件与一个或多个用户相互作用以获得目标系统的描述,包括与目标系统的各种元件有关的限制、以及在控制目标系统期间要达到的一个或多个目标—然后,决策模块构建部件执行各种自动化动作,以产生、测试和部署待用于执行对目标系统的控制一个或多个可执行决策模块(有时也称为“决策元件”和/或“代理”)。当部署和执行一个或多个可执行决策模块时,CDD系统可以进一步提供在被执行的决策模块内部或外部的各种部件以管理它们对目标系统的控制,诸如:每个决策模块的控制动作确定部件,用于优化或以其他方式增强决策模块所产生的控制动作;改进目标系统建模状态信息的断层图像部件;和/或一个或多个协调控制管理部件,用于协调共同地执行对目标系统的控制的多个决策模块的控制动作。
如上所述,在一些实施方式中,协同分布式决策(CDD)系统可以使用所描述的技术中的至少一些技术来执行在为指定的目标系统构建和实施自动化控制系统中所涉及的各种自动化活动,以便修改或以其他方式操纵目标系统的影响其操作(例如,影响目标系统的一个或多个输出)的输入或其他控制元件。在一些情况下,此类目标系统的自动化控制系统可以具有提供对目标系统的协作分布式控制的分布式架构,诸如具有多个决策模块,这些决策模块各自控制目标系统的一部分并且相对于彼此以部分解耦的方式操作。如果是这样,则即使不能保证或达到所有决策模块始终完全同步收敛,各种决策模块针对自动化控制系统的操作也可以至少部分地被同步(诸如,通过使每一者在一个或多个时间与一个或多个其他决策模块达到一致性)。
在一些实施方式中,CDD系统可以实施决策模块构建部件,所述决策模块构建部件与一个或多个用户相互作用以获得目标系统的描述,包括与目标系统的各种元件有关的限制、以及在控制目标系统期间要达到的一个或多个目标—然后,决策模块构建部件执行各种自动化动作,以产生、测试和部署待用于执行对目标系统的控制的一个或多个可执行决策模块。因此,决策模块构建部件可以操作为配置或设置阶段的一部分,该配置或设置阶段发生在稍后的运行时阶段(其中执行所产生的决策模块以执行对目标系统的控制)之前,不过在一些实施方式和情况中,可以在初始部署之后进一步使用决策模块构建部件以改进或扩展或以其他方式修改具有一个或多个决策模块的自动化控制系统(例如,当自动化控制系统继续被用来控制目标系统时),诸如以便实现数据断层扫描部件的功能以改进和更新被控制的目标系统的模型,或者添加、移除或修改自动化控制系统的决策模块。
在一些实施方式中,所产生和部署的一些或所有自动化控制系统可以进一步在其内部提供各种部件以供在自动化控制系统的运行时操作期间执行,诸如在一些实施方式和情况中通过将此类部件包括在决策模块内。例如,此类部件可以包括每个决策模块(或一些决策模块)的控制动作确定部件,其用于优化或以其他方式确定和改进决策模块所产生的控制动作,和/或每个决策模块(或一些决策模块)的断层扫描部件,以改进目标系统的建模状态信息。例如,在一些实施方式中,决策模块中的此类控制动作确定部件可以尝试在特定时间内自动确定决策模块的控制动作,以反映关于一个或多个目标并且考虑到具有多个相互关联约束的目标系统的决策模块的模型并且基于针对目标系统建模的当前状态信息的近似最佳解—如果是这样,则此类近似最佳解可以至少部分地基于在完全优化解的阈限量内的部分优化解。对要执行的一个或多个控制动作的此类确定可以发生在特定时间内并且针对一个或多个决策模块中的每一者,以及在一些情况下由至少一些决策模块重复多次以实现持续控制。在一些实施方式中,决策模块的模型被实施为哈密顿函数,该哈密顿函数部分地基于表示目标系统的至少一部分的约束来反映一组耦合微分方程,以便通过在演化的哈密顿函数内添加附加表达式来允许在多个时间段内更新该模型及其哈密顿函数实施方式,如在本文中别处更详细地讨论的。
在一些实施方式中,包括在所产生和部署的自动化控制系统内以在自动化控制系统的运行时操作期间执行的部件可以还包括一个或多个协调控制管理部件,以协调共同地执行对自动化控制系统的目标系统的控制的多个决策模块的控制动作。例如,在一些实施方式中,一些或所有决策模块可以各自包括此类控制动作确定部件,以尝试将该决策模块的局部解和所提议的控制动作与自动化控制系统中的一个或多个其他决策模块的局部解和所提议的控制动作同步,诸如通过确定与那些其他决策模块的一致性共享模型,所述一致性共享模型同时提供来自该决策模块的局部模型和一个或多个其他决策模块的模型的解。此类模块间同步可以重复发生以在特定时间确定每个决策模块的一个或多个控制动作,以及被重复多次以实现持续控制。另外,在一些实施方式中,每个决策模块的模型被实施为哈密顿函数,该哈密顿函数部分地基于表示目标系统的至少一部分的约束来反映一组耦合微分方程,以便允许每个决策模块的模型及其哈密顿函数实施方式与一个或多个其他决策模块的模型组合(通过在该决策模块的局部模型的初始哈密顿函数内添加那些其他决策模块的模型的附加表达式),如在本文中别处更详细地讨论的。
还将了解,虽然各种项目被示出为在使用时被存储在存储器中或存储装置上,但为了存储器管理和数据完整性的目的,可以在存储器与其他存储装置之间转移这些项目或其部分。替代地,在其他实施方式中,软件模块和/或系统中的一些或全部可以在另一装置上的存储器中执行,并且经由计算机间通信与所示出的计算系统通信。因此,在一些实施方式中,当由一个或多个软件程序(例如,由断层扫描部件345和/或CDD部件342至346,或者更一般地由CDD系统340)和/或数据结构(诸如,通过执行一个或多个软件程序的软件指令和/或通过存储此类软件指令和/或数据结构)配置时,所描述的技术中的一些或全部可以通过包括一个或多个处理器和/或存储器和/或存储装置的硬件构件来执行。此外,在一些实施方式中,系统、模块和/或部件中的一些或全部可以以其他方式来实施或提供,诸如通过使用至少部分地或完全在固件和/或硬件中实施的构件,包括但不限于一个或多个专用集成电路(ASIC)、标准集成电路、控制器(例如,通过执行适当的指令,并且包括微控制器和/或嵌入式控制器)、现场可编程门阵列(FPGA)、复杂可编程逻辑装置(CPLD)等。部件、系统和数据结构中的一些或全部也可以存储(例如,作为软件指令或结构化数据)在非暂时性计算机可读存储媒体上,诸如硬盘或快闪驱动器或其他非易失性存储装置、易失性或非易失性存储器(例如,RAM)、网络存储装置或待由适当驱动器(例如,DVD盘、CD盘、光盘等)或经由适当连接读取的便携式媒体物件。在一些实施方式中,系统、部件和数据结构还可以作为产生的数据信号(例如,作为载波或其他模拟或数字传播信号的一部分)在多种计算机可读传输媒体(包括基于无线和基于有线/电缆的媒体)上进行传输,并且可以采取多种形式(例如,作为单个或多路模拟信号的一部分,或作为多个离散数字分组或帧)。在其他实施方式中,此类计算机程序产品也可以采取其他形式。因此,可以利用其他计算机系统配置来实践本发明。
图4是协同分布式决策(CDD)系统例程400的示例性实施方式的流程图,例如,例程可以通过执行图3的CDD系统340和/或图1A的CDD系统140来提供,以便提供为指定的目标系统构建和实施自动化控制系统的功能性。
例程的所示出的实施方式始于框410处,其中接收信息或指令。如果在框420中确定框410的信息或指令包括创建或修正一个或多个决策模块以供用作特定目标系统的自动化控制系统的一部分的指示,则例程继续到框425以发起对决策模块构建部件的执行,并在框430中获得并存储目标系统的在框425中创建的一个或多个所得决策模块。关于图5A至图5C来更详细地讨论用于此类决策模块构建部件的例程的一个示例。
在框430之后,或者如果改为在框420中确定在框410中接收的信息或指令不是创建或修正一个或多个决策模块,则例程继续到框440以确定在框410中接收的信息或指令是否指示部署一个或多个已创建的决策模块来控制指定的目标系统,诸如针对作为该目标系统的自动化控制系统的一部分的一个或多个决策模块。要部署的一个或多个决策模块可以是紧接在框425之前创建的,使得部署以基本上与创建同时进行的方式发生,或者在其他情况下可以包括在先前时间创建并被存储以供稍后使用的一个或多个决策模块。如果确定为此类目标系统部署一个或多个此类决策模块,则例程继续到框450以发起对该目标系统的那些一个或多个决策模块的执行,诸如在目标系统的环境局部的一个或多个计算系统上,或改为在通过一个或多个中间计算机网络(例如,在CDD系统提供者的控制下的一个或多个计算系统)与目标系统通信的一个或多个远程计算系统上。
在框450之后,例程继续到框460以确定是否执行对以在那些决策模块外部的方式部署的多个决策模块的分布式管理,诸如经由一个或多个集中式协调控制管理部件。如果是这样,则例程继续到框465以发起对一个或多个此类集中式CDD协调控制管理部件的执行以供与那些决策模块一起使用。在框465之后,或者如果改为在框460中确定不以外部的方式执行此类分布式管理(例如,如果仅执行一个决策模块,如果执行多个决策模块但以分布式对等方式协调它们的操作等等),则例程继续到框470以可选地获得并存储关于一个或多个决策模块的操作和/或在目标系统中发生的所得活动的信息,诸如供稍后分析和/或报告。
如果改为在框440中确定在框410中接收的信息或指令将不部署一个或多个决策模块,则例程改为继续到框485以在适当的情况下执行一个或多个其他指示的操作。例如,此类其他授权操作可以包括:以其他方式(例如,通过监控目标系统的输出或其他状态信息)获得关于目标系统的操作的结果信息;分析决策模块的操作的结果和/或对应的目标系统的活动;产生报告或以其他方式向用户提供关于此类操作和/或活动的信息等。另外,在一些实施方式中,对特定目标系统随时间的推移的活动的分析可以允许在目标系统的操作中识别模式,以便允许相应地修改该目标系统的模型(无论是手动地还是以自动学习的方式)以反映那些模式并基于它们作出响应。另外,如在别处更详细地讨论的,自动化控制系统的多个决策模块以部分解耦的方式实现的分布式操作允许当自动化控制系统在操作中时作出各种改变,以便添加一个或多个新决策模块、移除一个或多个现有的决策模块、修改特定决策模块的操作(例如,通过改变规则或作为决策模块的模型的一部分的描述目标系统的其他信息)等。另外,自动化控制系统中的多个此类决策模块的部分解耦性质允许一个或多个此类决策模块有时个别地操作,诸如如果网络通信问题或其他问题阻止了多个决策模块之间的将原本允许协调它们的个体化控制动作的通信—在此类情况下,即使无法从共同地为目标系统提供自动化控制系统的一组多个决策模块之间的协调和同步中识别最佳或近似最佳解,一些或所有此类决策模块也可以继续以个体化的方式操作以便为目标系统提供有用的持续控制操作。
在框470或485之后,例程继续到框495以确定是否继续,诸如直到接收到明确的终止指示。如果确定继续,则例程返回到框410,否则继续到框499并结束。
图5A至图5C示出CDD决策模块构建例程500的示例性实施方式的流程图。例如,例程可以通过执行图3的部件342和/或部件345和/或图1A的部件142来提供,以便提供以下功能性:允许用户提供描述感兴趣的目标系统的信息,并执行对应的自动化操作以构建一个或多个决策模块来用于以指定的方式控制目标系统。虽然例程的所示出的实施方式以特定的方式(诸如,经由显示的GUI(图形用户接口))与用户相互作用,但将了解,例程的其他实施方式可以以其他方式与用户相互作用,诸如经由执行程序代表用户所调用的限定的API(应用程序编程接口)。在一些实施方式中,例程可以进一步实施为可供一个或多个用户使用的集成开发环境或其他软件工具的一部分,诸如通过实施通过公共网络(诸如,因特网)可供多种远程用户使用的在线接口,而在其他实施方式中,CDD系统和/或特定CDD部件的副本可以被用来支持单个组织或其他一组一或多个用户,诸如通过在组织或组的控制下在计算系统上执行。另外,在一些实施方式和情况中,CDD决策模块构建部件可以被分离为多个子部件,诸如:规则编辑器部件,用户与所述规则编辑器部件相互作用以指定用于目标系统的规则和其他描述信息;以及规则编译器引擎,所述规则编译器引擎处理用户指定的规则和其他信息以创建一个或多个对应的决策模块。
例程500的所示出的实施方式始于框505处,其中例程确定当前是否使用数据断层扫描部件来学习新的软规则以用于潜在地添加到目标系统的模型(诸如,定期地、响应于满足一个或多个触发条件、基于被图6B的框684调用等)。如果是这样,则例程继续到图5C的框563,否则继续到框510,其中例程向一个或多个用户提供所显示的用户接口或更新所显示的用户接口,诸如经由在实施方式程的部件的在线版本处接收的请求,或者改为基于由一个或多个此类用户在他们所控制的计算系统上执行的例程。虽然出于说明的目的在例程的所示出的实施方式中将各种操作示为以串行方式发生,但将了解,用户与此类用户接口的相互作用可以以迭代的方式和/或在多个时间段和/或用户会话内发生,包括以各种方式更新先前向用户显示的用户接口(例如,反映用户动作,反映通过例程的操作所产生或来自另一个部件的用户反馈等)。
在框510之后,例程继续到框520以从一个或多个此类用户接收描述要控制的目标系统的信息,包括:关于目标系统的包括一个或多个可操纵控制元件的多个元件以及可选地这些控制元件所影响的一个或多个输出的信息;关于指定涉及这些元件的限制的规则的信息;关于将在系统的控制期间可用的状态信息的信息(例如,特定元件或其他状态变量的值);以及在目标系统的控制期间要达到的一个或多个目标。将了解,此类信息可以在一段时间内从一个或多个用户获得,包括在一些实施方式中用于供应与目标系统有关的一些信息的第一组一个或多个用户以及用于独立地提供关于目标系统的其他信息的一个或多个其他第二组用户,以便反映不同用户的不同专业领域和/或目标系统的不同部分。
在框520之后,例程继续到框525以识别已在用户输入中接收的任何错误,并提示(一个或多个)用户校正那些错误,诸如通过以如关于框510所讨论的对应方式来更新显示。虽然对此类错误的识别被示出为发生于在框520中接收到信息之后,但将了解,一些或所有此类错误可以改为在用户将信息输入到用户接口中时被识别,以便识别在规则或用户指定的其他信息中的语法错误。在框525之后,例程的所示出的实施方式继续到框530以可选地将关于目标系统的信息分解为多个子集,每个子集对应于目标系统的一部分,诸如其中每个子集具有可通过由例程创建的自动化控制系统操纵的一个或多个不同控制元件,以及可选地具有重叠或完全不同的目标和/或描述目标系统的相应部分的若干组规则和其他信息。如别处讨论的,此类分解(如果执行的话)在一些情况下可以由用户(指示他们所输入的不同信息子组)手动地执行,和/或由例程基于对已被指定的信息的分析(例如,基于针对目标系统所供应的规则和其他描述性信息的大小,基于不同规则或目标或其他信息之间的相互关系等)以自动化方式执行。在其他实施方式中,可能不执行此类分解。
在框530之后,例程继续到框535,以针对目标系统描述信息的每个子集(或在未识别出此类子集的情况下,针对所有接收到的信息)而将该子集(或所有信息)转换为封装该子集(或所有信息)的限制、目标和其他指定信息的一组约束。在框540中,然后,例程识别从转换过程中发生的任何错误,并且如果有任何错误被识别,则可以提示用户校正那些错误,诸如以与关于框525和510所描述的方式类似的方式。虽然在这个示例中并未示出,但在一些情况下,当识别出此类错误时,框525和/或540中的例程可以返回到框510,以向(一个或多个)用户显示对应的反馈并允许(一个或多个)用户进行校正并重新执行后面的操作,诸如框520至540的操作。在框540中的转换过程中所识别的错误可以包括例如与不一致的限制有关的错误,诸如如果不可能满足作为一个组的这些限制。
在框540之后,例程继续到框545,以针对每组约束(或如果在框530中未识别子集,则为单个约束组)将一个或多个验证规则应用于该组约束,以测试这些约束所表示的对应信息的整体有效性,并提示一个或多个用户校正以与关于框525、540和510的方式类似的方式被识别的任何错误。此类验证规则可以测试可控性、可观测性、稳定性和目标完整性中的一者或多者以及任何用户添加的验证规则,如在别处更详细地讨论的。在框550中,然后,例程将每组已验证的约束转换为一组耦合微分方程,该组耦合微分方程对底层信息所对应的目标系统的至少一部分进行建模。
在框550之后,例程继续到框553以执行与训练每组耦合微分方程的模型有关的活动,包括确定要使用的训练时间窗口的大小、该时间窗口内的多个训练时间切片的大小和/或该时间窗口内的训练时间切片的类型中的一者或多者。在一些实施方式和情况中,通过使用默认或预先指定的信息来执行对信息的一个或多个此类大小或类型的确定,而在其他实施方式和情况中,用户可以指定此类信息,或者可以以一种或多种方式来执行对此类信息的自动化确定(例如,通过测试不同的大小并对结果进行评估以找到具有最佳性能的大小)。例如,不同类型的时间切片可以包括重叠或不重叠的时间切片的传承(succession),使得针对第二时间切片的训练可以仅取决于第一时间切片的结果(如果它们不重叠),或者改为可以至少部分地基于针对第一时间切片中的至少一些已经确定的更新信息(如果它们部分或全部重叠的话)。在框553之后,例程继续到框555,以针对表示模型的每组耦合微分方程使用目标系统的部分初始状态信息来训练该组耦合微分方程组的模型,包括通过模拟在时间窗口内(诸如,在贯穿时间窗口的连续时间切片内)执行控制动作的效果来估计目标系统的不被知道和/或不可直接观测到的变量的值,并测试已训练模型的模拟性能。本文中包括了与训练和测试有关的附加细节。
在框555之后,例程继续到框560以确定训练和测试是否成功,并且如果不成功,则返回到框510以向用户显示对应的反馈信息以允许他们校正导致不成功的错误。然而,如果改为在框560中确定测试和训练是成功的,或者在图5C的框581(其中用一个或多个所学习的软规则来更新模型)之后,则例程改为继续到框585,以针对每个已训练和测试模型产生可执行决策模块,所述可执行决策模块包括:该模型;以及局部CCD控制动作确定部件,决策模块在被执行时将使用该局部CCD控制动作确定部件以基于模型中所包括的信息并考虑到该决策模块的一个或多个目标来确定要针对目标系统执行的最佳或近似最佳的控制动作。在一些实施方式和情况中,所产生的可执行决策模块可以还包括:局部CCD协调控制管理部件,用于协调将共同地为目标系统提供自动化控制系统的多个决策模块的控制动作,诸如通过随时间的推移同步各种决策模块的相应模型。在框585之后,例程继续到框590以提供所产生的可执行决策模块以供使用,包括可选地存储它们以供稍后执行和/或部署。
如果在框505中确定使用数据断层扫描部件来学习新的软规则以用于潜在地添加到目标系统的模型,则例程继续到图5C的框563,其中获得目标系统的一个或多个现有的所产生的模型(例如,基于二进制规则的初始模型)。在框565中,然后,例程随时间的推移收集来自目标系统的操作的实际操作数据(例如,如由一个或多个现有的所产生的模型控制),以便从存储装置中检索先前产生的并且被存储的数据,从而进入继续下去直到指定量的数据可用的数据收集阶段等。在框565处,例程继续到框567,以使用数据断层扫描部件从所收集的数据中重复地查询数据模型以获得关于目标系统在一个或多个传感器和/或控制件的变化的情况和值下的性能的回答,诸如关于目标系统的对应于要达到的指定的目标的一个或多个输出。在框569中,然后,例程基于查询/回答对来创建系统的总数据模型,以便构建总哈密顿函数。在框571中,然后,例程获得系统的基于规则的模型(例如,基于规则的哈密顿函数),并且将总模型与基于规则的模型相比较以便识别出任何差异,然后使用这些差异来创建与查询有关的零个或更多个潜在软规则。
在框573中,然后,例程确定每个此类潜在软规则的关联的完整性值,诸如基于框565至571的执行是否继续以关于潜在软规则产生新的信息。如果任何此类潜在软规则并不十分完整(例如,具有低于关联的阈值的完整性值),则例程返回到框567以执行附加的查询,否则继续到框577以选择是充分完整的以作为要在目标系统的改进的更新模型中使用的候选者的潜在软规则中的任一者。在框579中,然后,例程确定是否自动更新现有模型,如果是这样,则例程继续到框581以使用所学习的(一个或多个)候选软规则来更新现有的基于规则的模型,之后继续到框585。否则,例程继续到框583,以向与现有模型和/或目标系统相关联的一个或多个用户提供关于所学习的(一个或多个)候选软规则的信息,以便使得(一个或多个)用户能够决定是否使用它们来更新现有的基于规则的模型,之后继续到框505(例如,从用户接收针对关于框520的此类更新的进一步指令)。
在框590之后,例程继续到框595以确定是否继续,诸如直到接收到明确的终止指示。如果确定继续,则例程返回到框510,否则继续到框599并结束。
图6A至图6B示出例程600的示例性实施方式的流程图,所述例程对应于被执行的决策模块的通用表示。例如,例程可以通过执行决策模块329来提供,或被提供作为图3的自动化控制系统325和/或图1A或图1B的决策模块124或128的一部分,以便提供用于以特定于信息和针对决策模块所编码的模型的方式控制目标系统的至少一部分,包括反映由决策模块在其控制活动期间要达到的一个或多个目标。如在别处更详细地讨论的,在一些实施方式和情况中,多个决策模块可以共同地和协作地起作用以控制特定目标系统,诸如其中每个决策模块控制目标系统的一个或多个不同的控制元件,或者以其他方式表示目标系统的一部分或与目标系统的一部分相互作用,而在其他实施方式和情况中,单个决策模块可以单独起作用以控制目标系统。例程600进一步反映由特定的示例性决策模块在被部署成控制目标系统的一部分时所执行的动作,不过对决策模块的至少若干部分的执行可以在其他时间发生,以便在部署决策模块之前最初训练决策模块的模型,如关于图5A至图5C的CDD决策模块构建例程500更详细地讨论的。
例程600的所示出的实施方式始于框610处,其中确定决策模块的初始模型,该初始模型描述要控制的目标系统的至少一部分、决策模块尝试实现的与目标系统的控制有关的一个或多个目标、以及可选地目标系统的初始状态信息。例程继续到框615以执行一个或多个动作以便在需要时训练初始模型,如关于图5A至图5C的框553和555更详细地讨论的—在一些实施方式和情况中,只有在图5A至图5C的例程500没有完成初始训练时,才执行框615的此类训练,而在其他实施方式和情况中,执行框615的训练,以在决策模块开始执行的时候(例如,如果没有在初始创建和训练之后立即部署)捕获关于目标系统的当前状态的信息和/或有时重新训练模型,如关于图7A至图7B的如由框630发起的例程700更详细地讨论的。
在框615之后,例程继续到框617以确定待用于执行决策模块的每个控制动作决策的时间段,以便反映需要在目标系统中进行控制元件修改的速率和/或反映接收新传入的状态信息的速率,所述新传入的状态信息可以变更控制元件的未来操纵。然后,例程继续到框620以开始下一个时间段,即以从起动对决策模块的执行起向前移的第一时间段开始。然后,在每个此类时间段内向前以循环的方式执行框620至680,直到对决策模块的执行被暂停或终止,不过在其他实施方式中,特定决策模块可以仅在单个时间段内执行(每次其被执行时)。
在框625中,例程可选地获得在该时间段内的状态信息,诸如自上一时间段开始以来已针对目标系统或者一个或多个有关的外部源接收的当前状态信息,和/或根据需要通过主动检索目标系统的一个或多个元件或对应变量的当前值。在框630中,然后,例程发起对决策模块的局部CCD控制动作确定部件的执行,其中关于图7A至图7B的例程700更详细地讨论了此类例程的一个示例。在框635中,接收框630中的部件的执行结果,包括:要么获得以下两个决策模块的更新模型,即在当前时间段内具有局部解的决策模块,以及包括决策模块在当前时间段内可能执行的一个或多个所提议的控制动作确定的决策模块;要么接收在对于框630中部件的执行而言的允许时间内未找到决策模块的局部解的指示。然后,在框640中确定是否找到解,并且如果是这样,则继续到框642以存储决策模块的更新模型,否则继续到框643以使用决策模块的先验模型来基于先前的模型(例如,不反映状态信息的最近变化和/或决策模块的活动的最近变化,如果有的话)确定针对当前时间段所提议的一个或多个控制动作确定,如关于图7A至图7B的例程700更详细地讨论。
在框642或643之后,例程继续到框644以确定其他的决策模块是否共同地控制当前目标系统的多个部分(诸如,与局部决策模块相同的自动化控制系统的一部分),并且如果是这样,则继续到框645。否则,例程将决策模块的局部所提议的控制动作选择作为要执行的最终确定的控制动作,并继续到框675以在当前时间段内实施那些控制动作。
如果存在其他的操作决策模块,则框645中的例程确定局部决策模块是否包括CDD协调控制管理(CCM)部件的局部副本,以用于使针对决策模块的局部解所提议的控制动作确定与共同地控制同一目标系统的其他决策模块的活动同步。如果是这样,则例程继续到框647以向局部CDD CCM部件提供决策模块的一个或多个所提议的控制动作确定以及决策模块的对应的当前局部模型,否则继续到框649以向一个或多个集中式CDD CCM部件提供决策模块的一个或多个所提议的控制动作确定以及决策模块的对应的局部模型。
在框647或649之后,例程继续到框655,以获得框647或649中(一个或多个)CDDCCM部件的动作结果,包括:要么获得由当前决策模块的局部模型与来自一个或多个其他决策模块的信息的同步产生的另外的更新模型,使得所述另外的更新模型指示在该时间段内针对当前决策模块要执行的一个或多个最终控制动作确定;要么获得在允许时间内未完成此类同步的指示。例程继续到框660以确定同步是否完成,并且如果是这样,则继续到框665以存储因同步产生的另外的更新模型,否则继续到框670以将决策模块局部的先前提议的控制动作确定用作在该时间段内的最终控制动作确定。
在框665或670之后,例程继续到框675以在目标系统中实施决策模块的一个或多个最终确定的控制动作,诸如通过与目标系统中修改目标系统的一个或多个控制元件的值或以其他方式操纵目标系统的一个或多个控制元件的一个或多个执行器相互作用,或者通过以其他方式向目标系统提供输入以导致发生此类修改或其他操纵。在框680中,例程可选地获得关于所执行的控制动作在目标系统中的结果的信息,并存储关于此类所获得的结果和/或关于在当前时间段内决策模块的活动的信息和/或向CDD系统提供该信息。在框680之后,例程继续到框682以基于所学习的软规则来确定是否做可能的结构模型适配更新(诸如,定期地、基于是否关于框640找到了解、基于是否关于框660完成了同步等)。如果是这样,则例程继续到框684以发起CDD决策模块构建部件关于框563至583中的数据断层扫描部件所做的操作,以便返回模型和/或对应的决策模块的更新版本。
在框684之后,或者如果在框682中基于所学习的软规则来确定不做可能的结构模型适配更新,则例程继续到框695以确定是否继续,诸如直到接收到终止或暂停的指示(例如,反映目标系统的当前操作的结束或使用决策模块来控制目标系统的至少一部分的结束)。如果确定继续,则例程返回到框620以开始下一个时间段,否则继续到框699并结束。
图7A至图7B是CDD控制动作确定例程700的示例性实施方式的流程图。例如,例程可以通过执行图3的部件344和/或图1B的部件144a至144n或184来提供,以便确定在特定时间段期间针对目标系统要提议和/或实施的决策模块的控制动作,包括在一些实施方式中执行优化以确定关于一个或多个目标要执行的近似最佳动作(例如,在最佳解的阈值内)(如果可能的话)。虽然例程的所示出的实施方式是以特定决策模块的局部方式来执行的,使得一些或所有决策模块可以各自实施此类例程的局部版本,但在其他实施方式中,例程可以由一个或多个决策模块通过一个或多个网络与之相互作用的一个或多个部件以集中的方式来实施,诸如其中特定决策模块被指示为在特定时间使用而非代表局部决策模块来起作用。
例程700的所示出的实施方式始于框703处,其中接收信息或请求。例程继续到框705以确定信息或请求的类型,且因此继续进行。特别地,如果在框703中接收到尝试确定在当前时间段内的解(给定局部决策模块的当前模型)的请求,则例程继续到框710以开始执行此类活动,如关于框710至790更详细地讨论的。如果改为在框705中确定接收到针对局部决策模块的当前模型放松一个或多个规则或其他限制的请求(诸如,关于框760和765更详细地讨论的),则例程继续到框765。如果在框705中确定接收到针对局部决策模块的当前模型修复一个或多个规则或其他限制的请求(诸如,关于框775和780更详细地讨论的),则例程继续到框780以获得在规则修复过程期间要使用的用户输入(例如,与CDD决策模块构建部件相互作用,或改为以另一种方式与一个或多个用户相互作用),以便允许稍后基于另外所得的用户动作来更新和替换局部决策模块的当前模型,或者如果可以暂停目标系统的操作,则可选地等待着进一步执行例程700,直到接收到此类更新模型。如果改为在框705中确定信息或请求是另一种类型,则例程改为继续到框708以酌情执行一个或多个其他指示的操作,然后继续进行到框799。例如,此类其他指示的操作可以包括:接收关于当前模型和/或由共同地控制具有局部决策模块的目标系统的一个或多个其他决策模块提议或执行的控制动作的信息(诸如,用于通过产生一致性或收敛共享模型使局部决策模块的模型与此类其他的决策模块同步,如关于图8A至图8B的例程800更详细地讨论的);接收对模型或模型底层信息的更新以用于例程700的持续操作中(例如,来自CDD决策模块构建部件,诸如由在框780中执行的相互作用产生的结果);接收目标系统的当前状态信息,诸如如图6A至图6B的例程600中所讨论来使用等。
如果在框705中确定在当前时间段内并且基于局部决策模块的当前模型在框703中接收到针对解的请求,则例程继续到框710以接收表示目标系统的至少一部分的局部决策模块的当前模型的一组当前耦合微分方程,可选地连同在当前时间内目标系统的附加状态信息。然后,例程继续到框715以确定是否训练或重新训练模型,诸如如果在最初执行对应的决策模块时首次调用例程,或者如果来自持续操作的错误测量指示需要重新训练(如关于框755、770和730更详细地讨论的)。如果确定训练或重新训练模型,则例程继续到框720,以确定训练时间窗口的大小、该时间窗口内的训练时间切片的大小和/或训练时间窗口内的训练时间切片的类型中的一者或多者,诸如以与先前关于图5A至图5C的例程500的框553所讨论的方式类似的方式。在框720之后,例程继续到框725以使用目标系统的部分初始状态信息来训练模型,包括通过针对每个时间切片模拟在时间窗口内执行控制动作的效果来估计目标系统的不被知道和/或不可直接观测到的状态变量的值,如关于图5A至图5C的例程500的框555更详细地讨论的。
在框725之后,或者如果改为在框715中确定不训练或重新训练模型,则例程继续到框730以执行分段线性分析,从而试图确定当前模型的解和在框710中获得的任何附加状态信息,其中所述解(如果确定的话)包括在当前时间段内要采取的针对局部决策模块的一个或多个所提议的控制动作确定,以及在一些实施方式中使用一个或多个模型误差量规以关于当前模型进行一个或多个误差测量,如在别处更详细地讨论的。然后,例程继续到框735,以确定框730中的操作是否在对于框730的操作而言允许的时间量(例如,当前时间段的限定的子集或分率)内确定了解,并且如果是这样,则继续到框740以更新一组当前耦合微分方程和局部决策模块的所得当前模型以反映该解,其中所得更新信息被提供作为例程700的输出。
如果改为在框735中确定框730的操作没有确定解,则框745中的例程确定当前时间段内是否有附加时间可用以进一步尝试确定解,并且如果不,则继续到框790以提供例程700的输出,所述输出指示在当前时间段内未确定解。
然而,如果当前时间段内有附加时间可用,则例程继续以执行框755至780以便执行一次或多次进一步尝试来识别解—将了解,如果有足够的时间可供使用以继续进一步的解确定尝试,则可以在给定的时间段内多次重复地执行框755至780的操作中的一者或多者。特别地,如果在框745中确定有附加时间可用,则例程继续到框755,其中例程确定来自一个或多个量规的测量是否指示需要超过指示对模型的修改的一个或多个阈值的模型误差测量,诸如基于关于框730所讨论的来自量规的模型误差测量。如果没有,则例程继续到框760,以确定当前模型中是否存在可用于在当前时间段内被放松(如果这不是在当前时间段内第一遍通过路线的这个部分,则先前未尝试过在该时间段内被放松)的一个或多个规则或其他限制,并且如果是这样,则继续到框765以放松一个或多个次此类规则或其他限制,并返回到框730以基于那些被放松的规则或其他限制利用修正模型来重新尝试分段线性分析。
如果改为在框755中确定来自一个或多个量规的模型误差测量足以满足一个或多个对应的阈值,则例程改为继续到框770以基于指示足够的误差如愿(诸如,基于在模型更新的一个或多个时间段内的累积误差)的量规中的一者或多者来确定是否重新训练模型。如果是这样,则例程返回到框720以在框720和725中执行此类重新训练,然后继续到框730以利用所得已重新训练的模型来重新尝试分段线性分析。
如果改为在框770中确定不重新训练模型(或者如果该模型已经在当前时间段内被重新训练,并且框730中的所得重新尝试再次未能找到解),则例程继续到框775,以确定来自一个或多个量规的模型误差测量是否指示模型中潜在地具有需要修复的错误的一个或多个规则或其他限制的子集。如果是这样,则例程继续到框780以经由CDD决策模块构建部件向一个或多个用户提供信息,以允许用户酌情修正这些规则或其他限制,不过在其他实施方式中,可以改为以自动化方式来尝试或执行一些或所有此类规则修复活动。在框780之后,或者如果改为在框775中确定不修复任何规则,则例程继续到框790以提供在当前时间段内未确定解的指示。在框740、708或790之后,例程继续到框799并结束。将了解,如果例程700改为被实施为支持远离例程的执行部件的一个或多个决策模块的集中式例程,则例程700可以改为返回到框703以等候进一步的信息或请求。
图8A至图8B是CDD协调控制管理例程800的示例性实施方式的流程图。例如,例程可以通过执行图3的部件346和/或图1B的部件146a至146n来提供,以便尝试在共同地控制目标系统的多个决策模块之间同步当前模型及它们的所提议的控制动作。在例程的所示出的实施方式中,通过使用帕累托博弈技术来确定在一致性共享模型中所表示的帕累托均衡(如果可能的话),在特定局部决策模块的局部当前模型与该决策模块的中间共享模型(所述中间共享模型是基于关于一个或多个其他决策模块的当前状态的信息)之间以配对方式执行同步,不过在其他实施方式中,可以使用其他类型的同步方法。另外,在所示出的实施方式中,例程800是针对特定局部决策模块以局部的方式执行的,诸如通过被包括在该局部决策模块内,不过在其他实施方式中,可以以集中的方式实施方式程800以支持一个或多个决策模块,所述决策模块远离实施方式程的部件的计算系统并通过一个或多个计算机网络与那些决策模块通信,诸如其中特定决策模块被指示为在特定时间使用而非代表局部决策模块来起作用。
例程800的所示出的实施方式始于框805处,其中例程等待着接收信息或另一个指示。例程继续到框810以确定是否已接收到另一个决策模块的一致性模型或其他更新信息(诸如,来自例程800的针对该另一个决策模块执行的副本),并且如果是这样,则继续到框815以使用接收到的信息来更新供与局部决策模块(例程800的当前副本代表所述局部决策模块正在执行)一起使用的局部中间共享模型信息,如关于框830更详细地讨论的。如果改为在框810中确定框805中所接收的信息或请求不是与一个或多个其他决策模块有关的信息,或者在框815之后,则例程继续到框820以确定当前是否通过使用关于局部决策模块的中间共享模型的信息(包括一个或多个其他决策模块的信息)来执行局部决策模块的当前局部模型的同步,以便每次在框805中接收到对局部决策模块的模型的更新(例如,基于例程700针对该决策模块局部的CDD控制动作确定部件的副本所进行的操作)时和/或每次在框805中接收到并在框815中使用用于更新局部决策模块的中间共享模型的信息时完成此类同步,或改为如框805中明确地指示的—如果要在当前执行同步,则例程继续到框825并开始执行与此类同步活动有关的框820至880。否则,例程继续到框885以酌情执行一个或多个其他指示的操作,以便从CDD系统或其他请求者接收针对关于例程800操作的当前信息的请求和/或向一个或多个实体提供对应的信息(例如,反映先前的请求)等。
如果在框820中确定要在当前执行同步(诸如,基于在框805中接收的与更新模型有关的信息),则例程继续到框825以获得局部决策模块的当前局部模型以用于同步,其中所述模型包括基于局部决策模块的局部解在当前时间段内要执行的一个或多个所提议的控制动作。然后,例程继续到框830以检索局部决策模块的中间共享模型的信息,所述信息表示共同地参与控制目标系统的一个或多个其他决策模块(例如,所有其他决策模块)的信息,其中该中间共享模型类似地表示由那些一个或多个其他决策模块的局部解产生的一个或多个其他所提议的控制动作,可选地在已针对那些其他决策模块在它们自身之间执行了部分或完全同步之后。
然后,例程继续到框835,以尝试通过同时提供局部决策模块的当前模型与中间共享模型两者的解来确定使局部决策模块的当前模型和中间共享模型同步的一致性共享模型。在一些实施方式中,以与关于图7A至7B的例程700的框710至730所讨论的方式类似的方式执行框835的操作,诸如如果将局部模型和中间共享模型组合以创建要识别针对其的一个或多个解的组合模型。如在别处更详细地讨论的,在一些实施方式中,局部当前模型和中间共享模型可以各自由哈密顿函数表示,以使得能够针对相应的哈密顿函数以加法的方式直接创建此类组合模型,其中图6A至图6B和图7A至图7B的例程600和/或700的操作分别类似地表示它们使用此类哈密顿函数所更新和以其他方式所操纵的模型。
在框835之后,例程继续到框840以确定框835的操作在允许的时间量内是否成功,诸如当前时间段(将尝试在该当前时间段内执行同步)的某个分率或其他部分,并且如果是这样,则例程继续到框845以更新局部决策模块的局部模型与中间共享模型两者以便反映一致性共享模型。如较早所述,如果允许每个决策模块有足够的时间来重复地确定具有变化的中间共享模型(这些中间共享模型表示集体组的一个或多个其他决策模块)的一致性共享模型,则集体组的决策模块最终可能收敛在单个收敛共享模型上,不过在其他实施方式和情况中,可能没有足够的时间来发生此类收敛,或者其他问题可能阻止了此类收敛。在框845之后,例程继续到框850以可选地将针对局部决策模块所确定的一致性共享模型(和/或收敛共享模型,如果835的操作是创建此类收敛共享模型中的最后一步)通知给其他决策模块,诸如如果每个通知到的决策模块正实施它自己的例程800局部版本并且所提供的信息将被用作那些其他决策模块的中间共享模型的一部分,所述信息包括来自当前局部决策模块的新近构建的一致性共享模型的信息。
如果改为在框840中确定在允许时间内不发生同步,则例程继续执行框860至875以在进行一次或多次修改的情况下(有时是重复地,如果有足够时间可用)并且以与关于图7A至图7B的例程700的框745至780所讨论的方式类似的方式来重新尝试同步。在所示出的示例中,例程在框860中确定是否有附加时间可用于在同步时进行一次或多次此类重新尝试,并且如果没有,则例程继续到框880以提供在允许时间内不执行同步的指示。否则,例程继续到框870来采取一个或多个动作,以关于局部决策模块的当前模型和/或一个或多个其他决策模块(所述其他决策模块的信息表示在局部决策模块的中间共享模型中)中的一者或两者执行放松规则或其他限制、修复规则或其他限制和/或重新训练模型中的一者或多者。如果在框870中确定以这种方式继续进行,则例程继续到框875以便以与关于例程700所讨论的方式类似的方式执行对应的动作(有时一次一个动作),包括导致对局部决策模块的当前模型和/或局部决策模块的局部中间共享模型进行所得更新,其后,例程返回到框835以重新尝试使局部决策模块的局部模型和中间共享模型同步。
如果改为在框870中确定将不执行关于放松、修复和/或重新训练的进一步动作,则例程改为继续到框880。在框850、880或885之后,例程继续到框895以确定是否继续,诸如直到接收到终止或暂停例程800的操作的明确指示,以便反映目标系统的操作的结束和/或使用局部决策模块和/或多个决策模块的集体组来控制目标系统的结束。如果确定继续,则例程返回到框805,否则在框899结束。
图9示出例程900的示例性实施方式的流程图,所述例程是针对代表性的通用目标系统关于目标系统与控制目标系统的至少一部分的一个或多个决策模块之间的相互作用来执行的。例如,例程可以通过执行图3的目标系统360和/或370、和/或图1A和图1B的目标系统160和/或170来提供,以便实施特定于目标系统的操作。将了解,例程的所示出的实施方式着重于目标系统与一个或多个决策模块的相互作用,并且许多或所有此类目标系统将以特定于那些目标系统(出于简洁的目的,此处并未示出这些目标系统)的方式执行许多其他操作。
例程始于框910处,其中例程可选地向CDD系统提供目标系统的初始状态信息以供在目标系统的CDD系统的自动化控制系统中使用,诸如响应于来自目标系统的CDD系统或其自动化控制系统的请求,或者改为基于特定于目标系统的配置(例如,待在起动目标系统启动时执行)。在框910之后,例程继续到框920,以从实施目标系统的自动化控制系统的一个或多个决策模块的集合组接收一个或多个输入,包括由自动化控制系统的此类决策模块执行的目标系统的多个元件中的一个或多个控制元件的一个或多个修改值或对目标系统的多个元件中的一个或多个控制元件的其他操纵。如在别处更详细地讨论的,可以在多个时间段中的每一者内重复地执行框920、930、940,所述多个时间段取决于目标系统在时间上可能变化很大(例如,1微秒、1毫秒、百分之一秒、十分之一秒、1秒、2秒、5秒、10秒、15秒、30秒、1分钟、5分钟、10分钟、15分钟、30分钟、1小时等)。
在框920之后,例程继续到框930以基于接收到的输入在目标系统中执行一个或多个动作,包括可选地基于对控制元件的操纵在目标系统内产生一个或多个所得输出或其他结果。在框940中,然后,例程可选地提供关于目标系统内的输出或其他结果的信息,和/或向CDD系统的自动化控制系统和/或自动化控制系统的特定决策模块提供目标系统的其他当前状态信息。然后,例程继续到框995以确定是否继续,诸如直到接收到终止或暂停目标系统的操作的明确指示。如果确定继续,则例程返回到框920以开始在下一个时间段内进行下一组控制动作,否则继续到框999并结束。如在别处更详细地所讨论的,向特定决策模块提供的状态信息可以包括从外部系统到目标系统的请求,自动化控制系统及其决策模块可以确定如何以一种或多种方式来响应这些请求。
图12B示出控制作为较大型目标系统的一部分的电池的实施方式,在这个示例中,所述较大型目标系统是涉及包括太阳能电池板的家庭电力系统的系统1250—因此,在一些情况下,可以将先前关于图2A和/或本文中别处所讨论的示例性实施方式用作较大型系统(诸如,示例性系统1250)的一部分。特别地,图12B的框图示出系统1250的实施方式的示例性部件,所述系统用于执行对来自电池(所述电池是利用太阳能发电的家庭电力系统的一部分)的DC功率的自动化控制,诸如实时地和/或以优化电池的长期操作为目的,并且其中通过外部实体(诸如,提供或管理一个或多个CDI代理以控制系统1250的电池的实体)来监控和同步家庭发电与用电。在图12B的示例中,示例性家庭电力系统还连接到外部电网,其在各个时间从该外部电网接收功率并提供功率,其中电池用来存储由太阳能系统产生的电功率并酌情向房屋和/或电网供电。
在图12B的所示出的示例中,继续示出与图2A的部件类似的部件,包括电池210、硬件传感器模块220、用于电池的致动器230、现场电池跟踪控制器240等。然而,在图12B的示例中,并未将图2A的CDI代理250示出为存在于示例性房屋的物理位置处的部件的一部分,诸如如果关于图12B的在使用中的CDI代理250改为在远程位置中(例如,在云端或其他计算机网络位置中)执行并且以与关于图2A所示出的方式类似的方式向图AD9B的电池跟踪控制器240提供跟踪和/或同步信号。例如,此类跟踪和/或同步信号可以包括在当前时间或紧接着的后续时间内电池的期望功率输出和/或期望电池参数(例如,内部温度、电压、电流等)。另外,如在本文中别处更详细地讨论的,(一个或多个)CDI代理可以基于关于电池210(和被控制的任何其他电池)的监控信息、来自管理外部电网的公共设施的功率请求、限定的约束或要使用的其他规则、所预测的功率相关值等来产生此类跟踪和/或同步信号。
另外,图12B中示出若干个附加部件,包括:逆变器/整流器模块1210,所述逆变器/整流器模块从电池接收输出功率和/或向电池供应电功率以进行存储;太阳能电池板1220,所述太阳能电池板产生电功率并具有它自己的关联硬件传感器和逆变器;配电箱1230,所述配电箱接收和/或向外部电网供应功率并且控制至房屋的负载1240的功率分配等。另外,示出两个局部控制代理1260和1270以协助控制图12B的电池跟踪控制器240的操作,其中代理1 1260与电池跟踪控制器直接相互作用,并且代理2 1270执行包括使电池的功率的AC相位与房屋电力系统和/或电网的AC相位同步的活动,诸如以便为被接收和/或提供的功率提供谐振。在这个示例中,电池跟踪控制器240以及代理1260和1270(不同于公共设施传感器处理器)一起被称为“控制处理器”,其中电池跟踪控制器提供系统状态更新,并且其中管理代理之间的通信以支持此类多代理架构。代理2的断层扫描可以用于跟踪电池状态的动态变化并生成相应的建模状态信息,如本文别处所描述的,诸如通过以类似于使用非破坏性x射线的方式来获得和使用传感器信息,以便获得关于感兴趣的物理对象的内部物理结构的信息。另外,在这个示例中,外部实体1280(例如,提供或管理外部电网的公共设施)向电池跟踪控制器240提供监控和同步信号,诸如协调经由众多此类家庭电力系统和/或其他客户使用和/或提供的功率。
虽然图12B的示例涉及在太阳能电池板系统中使用电池210,但将了解,电池可以在多种类型的环境和系统中充电和/或放电,并且对应的CDI代理的类似活动可以被用来以本文中所描述的方式控制此类活动。
图12A是示出系统1200的实施方式的示例性部件的框图,所述系统以协调的方式(诸如,实时地和以优化电池的长期操作为目的)执行对来自多个电池的DC功率的自动化控制。特别地,图12A的系统1200与图12B的系统有一些相似之处,但示出用于支持对大量电池和关联系统(例如,在这个示例中,超过一百万的此类电池和关联系统,以便对应于一个或多个区域、州、国家等)的协调控制的系统的示例性架构。特别地,在所示出的示例中,示出各种电池和具有现场电池跟踪控制器的关联系统1205(例如,具有太阳能电池板的庭电力系统),连同提供针对电池和关联系统1205的功率请求的一个或多个公共设施1285、以及充当系统管理员以管理电池和关联系统1205的分布式控制系统1275的一个或多个实体1290。虽然在这个示例性实施方式中并未示出单独的断层扫描部件,但它们可以操作为例如一个或多个其他部件(诸如,集群中的CDI代理)的一部分。
在这个示例中,分布式控制系统1275以集中的方式在网络可访问位置中实施(诸如,经由在线计算环境(例如,Microsoft Azure)),不过在其他实施方式中它可以以其他方式来实施。分布式控制系统1275包括:一个或多个部件,用于与公共设施1285建立接口并相互作用;一个或多个部件,用于与电池和关联系统1205建立接口并相互作用;以及一个或多个监控和/或配置部件,系统管理实体1290可以与其相互作用以监控和/或控制分布式控制系统1275。另外,支持电池和关联系统1205的各种CDI代理(例如,其中每电池组和关联系统为一个CDI代理)在网络可访问位置中被执行并聚集在一起,其中使用各种集群间通信机制(例如,具有各种主题的发布/订阅系统、至少一些CDI代理和/或集群之间的通信服务总线等)。在各种实施方式中,可以各种方式形成集群,以便基于具有共享一个或多个特性(诸如,地理位置(例如,是系统电网变电站区域的一部分)和/或操作特性)的关联电池和系统来对CDI代理进行分组。另外,集群可以被用来分阶段和/或分层协调CDI代理,以便首先协调一个集群内的CDI代理,然后在两个或更多个集群之间进行协调等,并且可选地具有集群的多个层(例如,以等级的方式结构化)。各种附加部件可被提供并使用作为分布式控制系统1275的一部分,诸如:站点管理系统,用于管理CDI代理和/或电池及关联系统中的变化(例如,为新电池系统添加新CDI代理和/或针对从系统1275管理中被移除的现有电池系统来移除现有CDI代理;向特定集群添加新CDI代理和/或从集群中移除现有CDI代理;创建、移除和修改集群;等);从网络可访问位置可获得的存储服务,用于存储和交换被使用的状态和其他信息;从网络可访问位置可获得的资源管理服务,用于管理由网络可访问位置提供的计算资源等。
在以下条款中进一步讨论了本文中所描述的非排他性示例实施方式。
1.一种计算机实施方法,包括:
通过一个或多个配置的计算系统,来接收对具有多个传感器以及一个或多个控制和一个或多个输出的指定类型的物理系统的操作进行建模的一组二进制规则,其中,每个传感器测量与所述指定类型的物理系统的操作相关的至少一种类型的状态信息,其中,每个控制是可操纵的以修改所述指定类型的物理系统的至少一个输出,并且其中,所述二进制规则指定涉及状态信息的条件被评估为达到用于采取所得控制动作以操纵所述一个或多个控制的真值或假值;
通过所述配置的计算系统,获得描述所述指定类型的目标物理系统在时间段内的实际操作的数据,对于在所述时间段期间的多个时间中的每个时间,所述数据包括关于在所述时间对于所述目标物理系统的所述传感器的值的信息,以及在所述时间针对目标物理系统用来操纵所述控制所采取的一个或多个控制动作的信息,以及在所述时间由所述一个或多个控制动作导致的来自所述目标物理系统的输出的信息;
通过所述配置的计算系统并从获得的数据生成表示所述目标物理系统的所述实际操作的数据模型;
通过所述配置的计算系统并从生成的数据模型自动学习一个或多个软规则,所述一个或多个软规则进一步对所述目标物理系统的所述实际操作进行建模,其中,每个软规则指定一个或多个附加条件被评估为达到除真或假之外的具有关联的可能性的多个可能值中的一个可能值,其中,所述学习包括:
在所述目标物理系统的一个或多个传感器具有多个值中的每一个的指定情况下,查询所述数据模型以从所述目标物理系统的所述实际操作获得结果;
确定从查询所述数据模型获得的结果与来自所述一组二进制规则的所述指定情况的其他预期结果之间的差异;以及
构建所述一个或多个软规则以表示所确定的差异;以及
通过所述配置的计算系统,提供有关所学习的软规则的信息,以用于进一步控制所述目标物理系统。
2.根据条款1所述的计算机实施方法,还包括:
通过在所述一个或多个配置的计算系统上执行的所述协作分布式决策系统,获得识别所述目标物理系统的至少一个传感器的当前状态信息的传感器信息;
通过所述协作分布式决策系统,创建描述所述目标物理系统的当前状态的模型,所述模型包括来自至少所述二进制规则的耦合微分方程和所获得的传感器信息,以及为所述指定类型的物理系统指定的目标;
通过所述协作分布式决策系统并基于所创建的模型,执行所述耦合微分方程的分段线性分析以识别至少一个控制动作,所述控制动作操纵所述目标物理系统的至少一个控制并提供所述目标的解;以及
在所述目标物理系统中发起执行所述至少一个控制动作,以操纵所述至少一个控制并且在所述目标物理系统的至少一个输出中引起所得变化。
3.根据条款2所述的计算机实施方法,其中,所述目标物理系统包括具有至少一个电负载和至少一个电源的电池,其中,所述控制包括提供指令以导致从所述电池供应指定量的能量或由所述电池接收指定量的能量,其中,所述输出包括向所述电池提供或从所述电池提供的所述能量,并且其中,所述指定类型的物理系统的所述指定的目标是:最大化所述电池的寿命,同时根据指示的准则从所述电池供应能量。
4.根据条款2所述的计算机实施方法,其中,所述目标物理系统包括建筑物,所述建筑物具有多个房间并且具有用于执行对所述建筑物的所述房间供暖和供冷中的至少一者的一个或多个温度控制单元,其中,所述控制包括:提供指令以导致从所述温度控制单元供应指定量的供暖和供冷中的所述至少一者,其中,所述输出包括从所述温度控制单元供应的供暖和供冷中的所述至少一者,并且其中,所述指定类型的物理系统的所述指定的目标是:最小化由所述温度控制单元使用的能量的量,以根据指示的准则执行对所述建筑物的所述房间的供暖和供冷中的所述至少一者。
5.根据条款2所述的计算机实施方法,其中,提供关于所学习的一个或多个软规则的信息包括,通过所述协作分布式决策系统自动更新所创建的模型以包括所学习的一个或多个软规则的表示,并使用所更新的所创建模型来在所述目标物理系统中确定和执行一个或多个附加的控制动作。
6.根据条款5所述的计算机实施方法,其中,所述模型的创建是在获得数据之前执行的、并且进一步部分基于接收的一个或多个初始软规则来对所述指定类型的物理系统的操作建模,其中对所述目标物理系统的一个或多个结构修改在模型的创建和数据的获得之间发生,其中,一个或多个软规则的自动学习包括学习至少一个与所述一个或多个修改相关的附加软规则,并且其中,所创建的模型的自动更新包括调整所创建的模型以表示所述一个或多个结构修改。
7.根据条款1所述的计算机实施方法,其中,所述一组二进制规则的接收包括通过所述一个或多个配置的计算系统,从正在构建所述目标物理系统模型的用户接收所述一组二进制规则,并且其中,提供关于所学习的一个或多个软规则的信息包括向用户提供用于进一步构建所述目标物理系统的模型的信息。
8.根据条款1所述的计算机实施方法,其中,对一个或多个软规则的学习还包括:
通过所述一个或多个配置的计算系统,生成表示从所述数据模型的查询中获得的结果的总哈密顿函数;以及
通过所述一个或多个配置的计算系统,并至少部分地基于所述二进制规则,生成基于二进制规则的哈密顿函数,所述基于二进制规则的哈密顿函数表示所述指定类型的物理系统的基于规则的模型,
并且其中,确定所述差异包括通过所述一个或多个配置的计算系统,生成表示所述总哈密顿函数和所述基于所述二进制规则的哈密顿函数之间的差异的基于软规则的哈密顿函数,并且其中,构建构建一个或多个软规则包括通过所述一个或多个配置的计算系统,执行所述基于软规则的哈密顿函数的自然对数。
9.根据条款8所述的计算机实施方法,其中,所述差异的确定还包括通过所述一个或多个配置的计算系统,通过确定一个或多个样条或一个或多个分段多项式函数中的至少一个来表示所述基于软规则的哈密顿函数来近似所述基于软规则的哈密顿函数。
10.根据条款1所述的计算机实施方法,其中,所述数据的获得还包括,对于所述时间段期间的多个附加时间中的每一个,获得关于所述目标物理系统在所述附加时间的所述传感器的值的附加信息和所述目标物理系统在所述附加时间的输出的附加信息,并且其中,所获得的数据的生成还部分地基于所获得的附加信息。
11.根据条款1所述的计算机实施方法,其中,对一个或多个软规则的学习还包括:
确定从所述数据模型的查询获得的结果没有提供满足一个或多个软规则的关联可能性的阈值的足够的信息;
执行对所述数据模型的进一步查询,以从所述目标物理系统的实际操作获得附加结果,直到所述附加结果提供足够的信息来满足一个或多个软规则的关联可能性的所述阈值,
并且其中,所确定的差异还包括来自数据模型的附加结果与来自所述一组二进制规则的附加预期结果之间的差异。
12.根据条款1所述的计算机实施方法,其中,对一个或多个软规则的学习还包括:
在查询数据模型以获得结果之前,执行数据模型的其他查询,以在所述目标物理系统的一个或多个传感器具有多个其他值的每个的其他指定的情况下,从所述目标物理系统的实际操作中获得初始结果;
确定从查询数据模型获得的结果提供关于满足阈值的初始结果的新信息;以及
执行对数据模型的进一步查询,以从所述目标物理系统的实际操作中获得附加结果,直到所述附加结果没有提供与先前结果有关的满足所述阈值的足够的新信息,
并且其中,所确定的差异还包括来自数据模型的附加结果与来自所述一组二进制规则的附加预期结果之间的差异。
13.根据条款1所述的计算机实施方法,还包括:
通过所述一个或多个配置的计算系统,获得描述所述指定类型的第二所述目标物理系统在第二时间段内的实际操作的第二数据,对于在所述第二时间段期间的多个时间中的每个时间,所述数据包括关于在所述时间对于所述第二目标物理系统的所述传感器的值的信息,以及在所述时间针对第二所述目标物理系统用来操纵所述控制所采取的一个或多个控制动作的信息,以及在所述时间由所述一个或多个控制动作导致的来自所述第二目标物理系统的输出的信息;
通过所述一个或多个配置的计算系统并从获得的数据生成表示所述第二目标物理系统的所述实际操作的第二数据模型;
通过所述一个或多个配置的计算系统并从生成的第二数据模型自动学习一个或多个第二软规则,所述一个或多个第二软规则进一步建模所述第二目标物理系统的所述实际操作,其中,其中,所述一个或多个第二软规则不同于用于所述目标物理系统的学习的一个或多个软规则,以反映所述目标物理系统和所述第二目标物理系统之间的差异;以及
通过所述一个或多个配置的计算系统,提供有关所学习的一个或多个第二软规则的信息,以用于进一步控制所述第二目标物理系统。
14.根据条款1所述的计算机实施方法,其中,所述一组二进制规则包括一个或多个绝对规则,所述一个或多个绝对规则指定作为关于所述指定类型的物理系统的操作的要求的不可修改限制,并还包括一个或多个硬规则,所述硬规则指定关于所述指定类型的物理系统的操作的限制,所述限制能够在指定的情况下进行修改。
15.一种非暂时性计算机可读媒体,其具有所存储的软件指令,所述软件指令在被执行时导致实施自动化控制系统的至少一部分的一个或多个装置执行根据条款1至14中任一项所述的方法。
16.一种系统,其包括:
一个或多个装置的一个或多个硬件处理器;以及
存储指令的一个或多个存储器,所述指令在由所述一个或多个硬件处理器中的至少一者执行时导致所述系统执行根据条款1至14中任一项所述的方法。
17.一种非暂时性计算机可读媒体,其具有所存储的内容,所述内容导致一个或多个计算系统执行操作,所述操作包括:
通过所述一个或多个计算系统来接收对具有传感器以及一个或多个控制和一个或多个输出的目标系统的操作进行建模的二进制规则,其中,所述传感器测量与所述目标系统的部件的物理状态相关的信息,其中,至少一个控制是可操纵的以修改所述目标系统的至少一个输出,并且其中,所述二进制规则指定涉及状态信息的条件被评估为达到用于采取所得控制动作以操纵所述一个或多个控制的真值或假值;
通过所述一个或多个计算系统获得描述所述目标系统在时间段内的操作的数据,对于在所述时间段期间的多个时间中的每个时间,所述数据包括关于在所述时间对于所述目标系统的传感器的值的信息,以及在所述时间针对目标系统操纵所述控制的一个或多个控制动作的信息,以及在所述时间来自所述目标系统的一个或多个输出的信息;
通过所述一个或多个计算系统和从获得的数据自动学习一个或多个软规则,所述一个或多个软规则进一步对所述目标系统的操作进行建模,其中,每个软规则指定一个或多个附加条件被评估为达到除真或假之外的具有关联的可能性的可能值,其中,所述学习包括:
在所述目标系统的一个或多个传感器具有多个值中的每一个的指定情况下,执行查询以从关于所述目标系统的操作的所获得的数据来获得结果;
确定从所述查询获得的结果与来自所述二进制规则的所述指定情况的其他预期结果之间的差异;以及
构建所述一个或多个软规则以表示所确定的差异;以及通过所述一个或多个计算系统提供有关所学习的一个或多个软规则的信息,以用于进一步控制所述目标系统。
18.根据条款17所述的非暂时性计算机可读媒体,其中,所述存储的内容包括软件指令,所述软件指令在被执行时导致所述一个或多个计算设备进一步执行根据条款1至14中一个或多个的任意组合所述的方法。
19.一种系统,其包括:
一个或多个计算系统的一个或多个硬件处理器;以及
存储指令的一个或多个存储器,所述指令在由所述一个或多个硬件处理器中的至少一者执行时导致所述系统通过以下步骤来实施目标系统的自动化控制系统:
接收对具有传感器以及一个或多个控制和一个或多个输出的目标系统的操作进行建模的二进制规则,其中,所述传感器测量与所述目标系统相关的状态信息,其中,至少一个控制是可操纵的以修改所述目标系统的至少一个输出,并且其中,所述二进制规则指定涉及所述状态信息的条件被评估为达到用于采取所得控制动作以操纵所述一个或多个控制的真值或假值;
基于所述二进制规则创建描述所述目标物理系统的初始模型,所述初始模型包括来自所述二进制规则的耦合微分方程和所获得的传感器信息,以及为所述目标系统指定的目标;
使用所创建的初始模型在时间段内的多个时间控制所述目标系统的操作并获得描述所控制的操作的数据,其中,控制所述目标系统的操作包括对于所述多个时间中的每个时间执行所述耦合微分方程的分段线性分析以识别在所述时间采取的至少一个控制动作,所述控制动作操纵所述物理系统的至少一个控制并提供所述目标的解,并且其中,获得的数据包括关于传感器的值信息、关于操纵用于所述目标系统的控制的控制动作的信息以及关于来自所述目标系统的输出的信息;
从获得的数据自动学习一个或多个软规则,所述一个或多个软规则进一步对所述目标系统的操作进行建模,其中,每个软规则指定一个或多个附加条件被评估为达到除真或假之外的具有关联的可能性的可能值,其中,所述学习包括:
在所述目标系统的一个或多个传感器具有多个值中的每一个的指定情况下,执行查询以从关于所述目标系统的操作的所获得的数据来获得结果;
确定从所述查询获得的结果与根据所创建的初始模型的所述指定情况的其他预期结果之间的差异;以及
构建所述一个或多个软规则以表示所确定的差异;以及
提供有关所学习的一个或多个软规则的信息,以用于进一步控制所述目标系统。
20.根据条款19所述的系统,其中,所述存储的内容包括软件指令,所述软件指令在被执行时导致所述一个或多个计算设备进一步执行根据条款1至14中一个或多个的任意组合所述的方法。
从上述内容中将了解,尽管本文中已为了说明的目的描述了特定的实施方式,但是在不偏离本发明的精神和范围的情况下可以作出各种修改。因此,除受所附权利要求及其中所叙述的要素的限制之外,本发明是不受限制的。另外,虽然下文以某些权利要求形式呈现了本发明的某些方面,但发明人以任何可用的权利要求形式来预期本发明的各种方面。例如,虽然本发明的仅一些方面目前可以被叙述为体现在计算机可读媒体中,但其他方面可以同样如此体现。

Claims (25)

1.一种计算机实施方法,包括:
通过一个或多个配置的计算系统,接收对具有多个传感器以及一个或多个控制和一个或多个输出的指定类型的物理系统的操作进行建模的一组二进制规则,其中,每个传感器测量与所述指定类型的物理系统的操作相关的至少一种类型的状态信息,其中,每个控制是可操纵的以修改所述指定类型的物理系统的至少一个输出,并且其中,所述二进制规则指定涉及状态信息的条件被评估为达到用于操纵所述一个或多个控制的所得控制动作的真值或假值;
通过所述一个或多个配置的计算系统,获得描述所述指定类型的目标物理系统在时间段内的实际操作的数据,对于在所述时间段期间的多个时间中的每个时间,所述数据包括关于在所述时间对于所述目标物理系统的所述传感器的值的信息,以及在所述时间针对所述目标物理系统用来操纵所述控制所执行的一个或多个控制动作的信息,以及在所述时间由所述一个或多个控制动作导致的来自所述目标物理系统的输出的信息;
通过所述一个或多个配置的计算系统并从获得的数据生成表示所述目标物理系统的所述实际操作的数据模型;
通过所述一个或多个配置的计算系统并从生成的数据模型自动学习一个或多个软规则,所述一个或多个软规则进一步对所述目标物理系统的所述实际操作进行建模,其中,每个软规则指定一个或多个附加条件被评估为达到多个可能值中的一个可能值,其中,所述多个可能值表示概率值,其中,所述一个可能值具有关联的可能性,并且其中,所述学习包括:
在所述目标物理系统的一个或多个传感器具有多个值中的每一个的指定情况下,查询所述数据模型以从所述目标物理系统的所述实际操作获得结果;
确定从查询所述数据模型获得的结果与来自所述一组二进制规则的所述指定情况的预期结果之间的差异;以及
构建所述一个或多个软规则以表示所确定的差异;以及
通过所述一个或多个配置的计算系统,提供关于所学习的一个或多个软规则的信息,以用于进一步控制所述目标物理系统。
2.根据权利要求1所述的计算机实施方法,还包括:
通过在所述一个或多个配置的计算系统上执行的协作分布式决策系统,获得识别所述目标物理系统的至少一个传感器的当前状态信息的传感器信息;
通过所述协作分布式决策系统,创建描述所述目标物理系统的当前状态的模型,所述模型包括来自至少所述二进制规则的耦合微分方程和所获得的传感器信息,以及为所述指定类型的物理系统指定的目标;
通过所述协作分布式决策系统并基于所创建的模型,执行所述耦合微分方程的分段线性分析以识别至少一个控制动作,所述至少一个控制动作操纵所述目标物理系统的至少一个控制并提供所述目标的解;以及
在所述目标物理系统中发起执行所述至少一个控制动作,以操纵所述至少一个控制并且在所述目标物理系统的至少一个输出中引起所得变化。
3.根据权利要求2所述的计算机实施方法,其中,所述目标物理系统包括具有至少一个电负载和至少一个电源的电池,其中,所述控制包括提供指令以导致从所述电池供应指定量的能量或由所述电池接收指定量的能量,其中,所述输出包括向所述电池提供或从所述电池提供的所述能量,并且其中,所述指定类型的物理系统的所述指定的目标是:最大化所述电池的寿命,同时根据指示的准则从所述电池供应能量。
4.根据权利要求2所述的计算机实施方法,其中,所述目标物理系统包括建筑物,所述建筑物具有多个房间并且具有用于执行对所述建筑物的所述房间供暖和供冷中的至少一者的一个或多个温度控制单元,其中,所述控制包括:提供指令以导致从所述温度控制单元供应指定量的供暖和供冷中的所述至少一者,其中,所述输出包括从所述温度控制单元供应的供暖和供冷中的所述至少一者,并且其中,所述指定类型的物理系统的所述指定的目标是:最小化由所述温度控制单元使用的能量的量,以根据指示的准则执行对所述建筑物的所述房间的供暖和供冷中的所述至少一者。
5.根据权利要求2所述的计算机实施方法,其中,提供关于所学习的一个或多个软规则的信息包括:通过所述协作分布式决策系统,自动更新所创建的模型以包括所学习的一个或多个软规则的表示;以及使用所更新的所创建的模型来在所述目标物理系统中确定和执行一个或多个附加的控制动作。
6.根据权利要求5所述的计算机实施方法,其中,所述模型的创建是在获得所述数据之前执行的,并且进一步部分基于接收的一个或多个初始软规则来对所述指定类型的物理系统的操作建模,其中,对所述目标物理系统的一个或多个结构修改发生在所述模型的创建和所述数据的获得之间,其中,所述一个或多个软规则的自动学习包括学习至少一个与所述一个或多个结构修改相关的附加软规则,并且其中,所创建的模型的自动更新包括调整所创建的模型以表示所述一个或多个结构修改。
7.根据权利要求1所述的计算机实施方法,其中,所述一组二进制规则的接收包括通过所述一个或多个配置的计算系统,从正在构建所述目标物理系统模型的用户接收所述一组二进制规则,并且其中,提供关于所学习的一个或多个软规则的信息包括向用户提供用于进一步构建所述目标物理系统的模型的信息。
8.根据权利要求1所述的计算机实施方法,其中,对所述一个或多个软规则的学习还包括:
通过所述一个或多个配置的计算系统,生成表示从所述数据模型的查询中获得的结果的总哈密顿函数;以及
通过所述一个或多个配置的计算系统并至少部分地基于所述二进制规则,生成基于二进制规则的哈密顿函数,所述基于二进制规则的哈密顿函数表示所述指定类型的物理系统的基于规则的模型,
并且其中,确定所述差异包括通过所述一个或多个配置的计算系统,生成表示所述总哈密顿函数和所述基于二进制规则的哈密顿函数之间的差异的基于软规则的哈密顿函数,并且其中,构建一个或多个软规则包括通过所述一个或多个配置的计算系统,执行所述基于软规则的哈密顿函数的自然对数。
9.根据权利要求8所述的计算机实施方法,其中,确定所述差异还包括通过所述一个或多个配置的计算系统,通过确定一个或多个样条或一个或多个分段多项式函数中的至少一个以表示所述基于软规则的哈密顿函数来近似所述基于软规则的哈密顿函数。
10.根据权利要求1所述的计算机实施方法,其中,所述数据的获得还包括,对于所述时间段期间的多个附加时间中的每一个,获得关于所述目标物理系统在所述附加时间的所述传感器的值的附加信息以及所述目标物理系统在所述附加时间的输出的附加信息,并且其中,所获得的数据的生成还部分地基于所获得的附加信息。
11.根据权利要求1所述的计算机实施方法,其中,对所述一个或多个软规则的学习还包括:
确定从所述数据模型的查询中获得的结果没有提供满足所述一个或多个软规则的所述关联可能性的阈值的足够的信息;以及
执行对所述数据模型的进一步查询,以从所述目标物理系统的所述实际操作获得附加结果,直到所述附加结果提供满足所述一个或多个软规则的所述关联可能性的所述阈值的足够的信息,
并且其中,所确定的差异还包括来自所述数据模型的所述附加结果与来自所述一组二进制规则的附加预期结果之间的差异。
12.根据权利要求1所述的计算机实施方法,其中,对所述一个或多个软规则的学习还包括:
在查询所述数据模型以获得所述结果之前,执行所述数据模型的其他查询,以在所述目标物理系统的所述一个或多个传感器具有多个其他值中的每个值的其他指定的情况下,从所述目标物理系统的所述实际操作获得初始结果;
确定从查询所述数据模型获得的结果提供关于满足阈值的所述初始结果的新信息;以及
执行对所述数据模型的进一步查询,以从所述目标物理系统的所述实际操作中获得附加结果,直到所述附加结果没有提供与先前结果有关的满足所述阈值的足够的新信息,
并且其中,所确定的差异还包括来自所述数据模型的所述附加结果与来自所述一组二进制规则的附加预期结果之间的差异。
13.根据权利要求1所述的计算机实施方法,还包括:
通过所述一个或多个配置的计算系统,获得描述所述指定类型的第二目标物理系统在第二时间段内的实际操作的第二数据,对于在所述第二时间段期间的多个时间中的每个时间,所述数据包括关于在所述时间对于所述第二目标物理系统的所述传感器的值的信息,以及在所述时间针对所述第二目标物理系统用来操纵所述控制所执行的一个或多个控制动作的信息,以及在所述时间由所述一个或多个控制动作导致的来自所述第二目标物理系统的输出的信息;
通过所述一个或多个配置的计算系统并从获得的数据生成表示所述第二目标物理系统的所述实际操作的第二数据模型;
通过所述一个或多个配置的计算系统并从生成的第二数据模型自动学习一个或多个第二软规则,所述一个或多个第二软规则进一步对所述第二目标物理系统的所述实际操作进行建模,其中,所述一个或多个第二软规则不同于针对所述目标物理系统的所学习的一个或多个软规则,以反映所述目标物理系统和所述第二目标物理系统之间的差异;以及
通过所述一个或多个配置的计算系统,提供有关所学习的一个或多个第二软规则的信息,以用于进一步控制所述第二目标物理系统。
14.根据权利要求1所述的计算机实施方法,其中,所述一组二进制规则包括一个或多个绝对规则,所述一个或多个绝对规则指定作为关于所述指定类型的物理系统的操作的要求的不可修改限制,并还包括一个或多个硬规则,所述硬规则指定关于所述指定类型的物理系统的操作的限制,所述限制能够在指定的情况下进行修改。
15.一种非暂时性计算机可读媒体,其具有所存储的内容,所述内容导致一个或多个计算系统执行操作,所述操作包括:
通过所述一个或多个计算系统,接收对具有传感器以及一个或多个控制和一个或多个输出的目标系统的操作进行建模的二进制规则,其中,所述传感器测量与所述目标系统的部件的物理状态相关的信息,其中,至少一个控制是可操纵的以修改所述目标系统的至少一个输出,并且其中,所述二进制规则指定涉及状态信息的条件被评估为达到用于操纵所述一个或多个控制的所得控制动作的真值或假值;
通过所述一个或多个计算系统,获得描述所述目标系统在时间段内的操作的数据,对于在所述时间段期间的多个时间中的每个时间,所述数据包括关于在所述时间对于所述目标系统的传感器的值的信息,以及在所述时间针对所述目标系统操纵所述控制的一个或多个控制动作的信息,以及在所述时间来自所述目标系统的一个或多个输出的信息;
通过所述一个或多个计算系统并从获得的数据自动学习一个或多个软规则,所述一个或多个软规则进一步对所述目标系统的操作进行建模,其中,每个软规则指定一个或多个附加条件被评估为达到可能值,其中,所述可能值表示概率值并具有关联的可能性,并且其中,所述学习包括:
在所述目标系统的一个或多个传感器具有多个值中的每一个的指定情况下,执行查询以从关于所述目标系统的操作的所获得的数据中获得结果;
确定从所述查询获得的结果与来自所述二进制规则的所述指定情况的预期结果之间的差异;以及
构建所述一个或多个软规则以表示所确定的差异;以及
通过所述一个或多个计算系统,提供关于所学习的一个或多个软规则的信息,以用于进一步控制所述目标系统。
16.根据权利要求15所述的非暂时性计算机可读媒体,其中,所存储的内容包括软件指令,所述软件指令在被执行时进一步导致所述一个或多个计算系统执行附加操作,所述附加操作包括:
获得识别所述目标系统的至少一个传感器的状态信息的传感器信息;
创建描述所述目标系统的状态的模型,所述模型包括来自至少所述二进制规则的耦合微分方程和所获得的传感器信息,以及为所述目标系统指定的目标;
基于所创建的模型,执行所述耦合微分方程的分段线性分析以识别至少一个控制动作,所述至少一个控制动作操纵所述目标系统的至少一个控制并提供所述目标的解;以及
在所述目标系统中发起执行所述至少一个控制动作,以操纵所述至少一个控制并且在所述目标系统的至少一个输出中引起所得变化。
17.根据权利要求16所述的非暂时性计算机可读媒体,其中,所述目标系统是指定类型的物理系统,其中,所接收的二进制规则进一步用于对所述指定类型的物理系统的操作进行建模,并且其中,提供关于所学习的一个或多个软规则的信息包括:自动更新所创建的模型以包括所学习的一个或多个软规则的表示;以及使用所更新的所创建的模型来在所述目标系统中确定和执行一个或多个附加的控制动作。
18.根据权利要求15所述的非暂时性计算机可读媒体,其中,对所述一个或多个软规则的学习还包括:
生成表示从所述查询中获得的结果的总哈密顿函数;以及
至少部分地基于所述二进制规则,生成基于二进制规则的哈密顿函数,所述基于二进制规则的哈密顿函数表示所述目标系统的基于规则的模型,
并且其中,确定所述差异包括生成表示所述总哈密顿函数和所述基于二进制规则的哈密顿函数之间的差异的基于软规则的哈密顿函数。
19.根据权利要求15所述的非暂时性计算机可读媒体,其中,对所述一个或多个软规则的学习还包括:
确定从所述查询中获得的结果没有提供满足所述一个或多个软规则的所述关联可能性的阈值的足够的信息;以及
执行进一步查询,以从所获得的数据中获得附加结果,直到所述附加结果提供满足所述一个或多个软规则的所述关联可能性的所述阈值的足够的信息,
并且其中,所确定的差异还包括来自所述查询的所述附加结果与来自所述二进制规则的附加预期结果之间的差异。
20.根据权利要求15所述的非暂时性计算机可读媒体,其中,对所述一个或多个软规则的学习还包括:
在执行所述查询以获得所述结果之前,执行其他查询,以在所述目标系统的所述一个或多个传感器具有多个其他值中的每个值的其他指定的情况下,从所获得的与所述目标系统的所述操作有关的数据中获得初始结果;
确定从所述查询获得的结果提供关于足以满足阈值的所述初始结果的新信息;以及
执行进一步查询,以从所获得的与所述目标系统的所述操作有关的数据中获得附加结果,直到所述附加结果没有提供与先前结果有关的满足所述阈值的足够的新信息,
并且其中,所确定的差异还包括来自所述进一步查询的所述附加结果与来自所述二进制规则的附加预期结果之间的差异。
21.用于控制目标系统的系统,其包括:
一个或多个计算系统的一个或多个硬件处理器;以及
存储指令的一个或多个存储器,所述指令在由所述一个或多个硬件处理器中的至少一者执行时导致所述系统通过以下步骤来实施所述目标系统的自动化控制系统:
接收对具有传感器以及一个或多个控制和一个或多个输出的所述目标系统的操作进行建模的二进制规则,其中,所述传感器测量与所述目标系统相关的状态信息,其中,至少一个控制是可操纵的以修改所述目标系统的至少一个输出,并且其中,所述二进制规则指定涉及所述状态信息的条件被评估为达到用于操纵所述一个或多个控制的所得控制动作的真值或假值;
基于所述二进制规则创建描述所述目标系统的初始模型,所述初始模型包括来自所述二进制规则的耦合微分方程和所获得的传感器信息,以及为所述目标系统指定的目标;
使用所创建的初始模型在时间段期间的多个时间控制所述目标系统的操作并获得描述所控制的操作的数据,其中,控制所述目标系统的操作包括对于所述多个时间中的每个时间执行所述耦合微分方程的分段线性分析以识别在所述时间执行的至少一个控制动作,所述控制动作操纵所述目标系统的至少一个控制并提供所述目标的解,并且其中,所获得的数据包括关于传感器的值信息、关于操纵用于所述目标系统的控制的控制动作的信息以及关于来自所述目标系统的输出的信息;
从所获得的数据自动学习一个或多个软规则,所述一个或多个软规则进一步对所述目标系统的操作进行建模,其中,每个软规则指定一个或多个附加条件被评估为达到可能值,其中,所述可能值表示概率值并具有关联的可能性,并且其中,所述学习包括:
在所述目标系统的一个或多个传感器具有多个值中的每一个的指定情况下,执行查询以从关于所述目标系统的操作的所获得的数据中获得结果;
确定从所述查询获得的结果与来自所创建的初始模型的所述指定情况的预期结果之间的差异;以及
构建所述一个或多个软规则以表示所确定的差异;以及
提供关于所学习的一个或多个软规则的信息,以用于进一步控制所述目标系统。
22.根据权利要求21所述的系统,其中,提供关于所学习的一个或多个软规则的信息包括:自动更新所创建的初始模型以包括所学习的一个或多个软规则的表示;以及使用所更新的所创建的模型来在所述目标系统中确定和执行一个或多个附加的控制动作。
23.根据权利要求21所述的系统,其中,所述目标系统是指定类型的物理系统,其中,所接收的二进制规则进一步用于对所述指定类型的物理系统的操作进行建模,并且其中,对所述一个或多个软规则的学习还包括:
生成表示从所述查询中获得的结果的总哈密顿函数;以及
至少部分地基于所述二进制规则,生成基于规则的哈密顿函数,所述基于规则的哈密顿函数表示所创建的初始模型,
并且其中,确定所述差异包括生成表示所述总哈密顿函数和所述基于规则的哈密顿函数之间的差异的基于软规则的哈密顿函数。
24.根据权利要求21所述的系统,其中,对所述一个或多个软规则的学习还包括:
确定从所述查询中获得的结果没有提供满足所述一个或多个软规则的所述关联可能性的阈值的足够的信息;以及
执行进一步查询,以从所获得的数据中获得附加结果,直到所述附加结果提供满足所述一个或多个软规则的所述关联可能性的所述阈值的足够的信息,
并且其中,所确定的差异还包括来自所述查询的所述附加结果与来自所述二进制规则的附加预期结果之间的差异。
25.根据权利要求21所述的系统,其中,对所述一个或多个软规则的学习还包括:
在执行所述查询以获得所述结果之前,执行其他查询,以在所述目标系统的所述一个或多个传感器具有多个其他值中的每个值的其他指定的情况下,从所获得的与所述目标系统的所述操作有关的数据中获得初始结果;
确定从所述查询获得的结果提供关于足以满足阈值的所述初始结果的新信息;以及
执行进一步查询,以从所获得的与所述目标系统的所述操作有关的数据中获得附加结果,直到所述附加结果没有提供与先前结果有关的满足所述阈值的足够的新信息,
并且其中,所确定的差异还包括来自所述进一步查询的所述附加结果与来自所述二进制规则的附加预期结果之间的差异。
CN201780033948.9A 2016-05-13 2017-05-11 使用预测来控制目标系统 Expired - Fee Related CN109844653B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201662336418P 2016-05-13 2016-05-13
US62/336,418 2016-05-13
US15/410,647 US10303131B2 (en) 2016-05-13 2017-01-19 Using sensor data to assist in controlling a target system by modeling the functionality of the target system
US15/410,647 2017-01-19
PCT/US2017/032291 WO2017197201A1 (en) 2016-05-13 2017-05-11 Using sensor data to assist in controlling a target system by modeling the functionality of the target system

Publications (2)

Publication Number Publication Date
CN109844653A CN109844653A (zh) 2019-06-04
CN109844653B true CN109844653B (zh) 2020-10-30

Family

ID=60266823

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780033948.9A Expired - Fee Related CN109844653B (zh) 2016-05-13 2017-05-11 使用预测来控制目标系统

Country Status (6)

Country Link
US (1) US10303131B2 (zh)
EP (1) EP3449425B1 (zh)
JP (1) JP6626224B2 (zh)
KR (1) KR102080468B1 (zh)
CN (1) CN109844653B (zh)
WO (1) WO2017197201A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2791840C2 (ru) * 2021-12-21 2023-03-13 Владимир Германович Крюков Система принятия решений в мультиагентной среде

Families Citing this family (72)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CH706736A1 (de) * 2012-07-09 2014-01-15 Belimo Holding Ag Verfahren zum Betrieb eines Wärmetauschers sowie HVAC-Anlage zur Durchführung des Verfahrens.
US9411327B2 (en) 2012-08-27 2016-08-09 Johnson Controls Technology Company Systems and methods for classifying data in building automation systems
US20160004228A1 (en) * 2014-06-20 2016-01-07 Atigeo Corp. Cooperative distributed control of target systems
US10534326B2 (en) 2015-10-21 2020-01-14 Johnson Controls Technology Company Building automation system with integrated building information model
US11947785B2 (en) 2016-01-22 2024-04-02 Johnson Controls Technology Company Building system with a building graph
US11268732B2 (en) 2016-01-22 2022-03-08 Johnson Controls Technology Company Building energy management system with energy analytics
CN109154802A (zh) 2016-03-31 2019-01-04 江森自控科技公司 分布式建筑物管理系统中的hvac装置注册
US10901373B2 (en) 2017-06-15 2021-01-26 Johnson Controls Technology Company Building management system with artificial intelligence for unified agent based control of building subsystems
US10417451B2 (en) 2017-09-27 2019-09-17 Johnson Controls Technology Company Building system with smart entity personal identifying information (PII) masking
US11774920B2 (en) 2016-05-04 2023-10-03 Johnson Controls Technology Company Building system with user presentation composition based on building context
US10505756B2 (en) 2017-02-10 2019-12-10 Johnson Controls Technology Company Building management system with space graphs
US11347751B2 (en) * 2016-12-07 2022-05-31 MyFitnessPal, Inc. System and method for associating user-entered text to database entries
US10684033B2 (en) 2017-01-06 2020-06-16 Johnson Controls Technology Company HVAC system with automated device pairing
US11900287B2 (en) 2017-05-25 2024-02-13 Johnson Controls Tyco IP Holdings LLP Model predictive maintenance system with budgetary constraints
US11764991B2 (en) 2017-02-10 2023-09-19 Johnson Controls Technology Company Building management system with identity management
US10095756B2 (en) 2017-02-10 2018-10-09 Johnson Controls Technology Company Building management system with declarative views of timeseries data
US10854194B2 (en) 2017-02-10 2020-12-01 Johnson Controls Technology Company Building system with digital twin based data ingestion and processing
US11360447B2 (en) * 2017-02-10 2022-06-14 Johnson Controls Technology Company Building smart entity system with agent based communication and control
US11275348B2 (en) 2017-02-10 2022-03-15 Johnson Controls Technology Company Building system with digital twin based agent processing
US10515098B2 (en) 2017-02-10 2019-12-24 Johnson Controls Technology Company Building management smart entity creation and maintenance using time series data
US11042144B2 (en) 2017-03-24 2021-06-22 Johnson Controls Technology Company Building management system with dynamic channel communication
US11327737B2 (en) 2017-04-21 2022-05-10 Johnson Controls Tyco IP Holdings LLP Building management system with cloud management of gateway configurations
US10788229B2 (en) 2017-05-10 2020-09-29 Johnson Controls Technology Company Building management system with a distributed blockchain database
US11022947B2 (en) 2017-06-07 2021-06-01 Johnson Controls Technology Company Building energy optimization system with economic load demand response (ELDR) optimization and ELDR user interfaces
US10705492B2 (en) * 2017-06-12 2020-07-07 PassiveLogic, Inc. Heuristic method of automated and learning control, and building automation systems thereof
US10708078B2 (en) * 2017-06-13 2020-07-07 PassiveLogic, Inc. Automatic control method of generating sub-systems and sub-system arbitration from the deconstruction of a complex equipment graph
JP7037289B2 (ja) * 2017-06-26 2022-03-16 三菱重工業株式会社 制御切替装置、プラント、制御切替方法およびプログラム
WO2019018304A1 (en) * 2017-07-17 2019-01-24 Johnson Controls Technology Company SYSTEMS AND METHODS FOR BUILDING SIMULATION ON THE BASIS OF AN AGENT FOR OPTIMAL CONTROL
US11733663B2 (en) 2017-07-21 2023-08-22 Johnson Controls Tyco IP Holdings LLP Building management system with dynamic work order generation with adaptive diagnostic task details
US20190033811A1 (en) 2017-07-27 2019-01-31 Johnson Controls Technology Company Building management system with on-demand meter roll-ups
US11314788B2 (en) 2017-09-27 2022-04-26 Johnson Controls Tyco IP Holdings LLP Smart entity management for building management systems
US10962945B2 (en) 2017-09-27 2021-03-30 Johnson Controls Technology Company Building management system with integration of data into smart entities
US11314726B2 (en) 2017-09-27 2022-04-26 Johnson Controls Tyco IP Holdings LLP Web services for smart entity management for sensor systems
US20190096014A1 (en) 2017-09-27 2019-03-28 Johnson Controls Technology Company Building risk analysis system with risk decay
US10809682B2 (en) 2017-11-15 2020-10-20 Johnson Controls Technology Company Building management system with optimized processing of building system data
US11281169B2 (en) 2017-11-15 2022-03-22 Johnson Controls Tyco IP Holdings LLP Building management system with point virtualization for online meters
US11127235B2 (en) 2017-11-22 2021-09-21 Johnson Controls Tyco IP Holdings LLP Building campus with integrated smart environment
US11080363B2 (en) * 2017-12-15 2021-08-03 International Business Machines Corporation Free-form discovery of differential equations
US11954713B2 (en) 2018-03-13 2024-04-09 Johnson Controls Tyco IP Holdings LLP Variable refrigerant flow system with electricity consumption apportionment
US10666076B1 (en) * 2018-08-14 2020-05-26 Veritone Alpha, Inc. Using battery state excitation to control battery operations
US11016648B2 (en) 2018-10-30 2021-05-25 Johnson Controls Technology Company Systems and methods for entity visualization and management with an entity node editor
US11927925B2 (en) 2018-11-19 2024-03-12 Johnson Controls Tyco IP Holdings LLP Building system with a time correlated reliability data stream
US10452045B1 (en) * 2018-11-30 2019-10-22 Veritone Alpha, Inc. Controlling ongoing battery system usage while repeatedly reducing power dissipation
US11769117B2 (en) 2019-01-18 2023-09-26 Johnson Controls Tyco IP Holdings LLP Building automation system with fault analysis and component procurement
US10816949B1 (en) * 2019-01-22 2020-10-27 Veritone Alpha, Inc. Managing coordinated improvement of control operations for multiple electrical devices to reduce power dissipation
US10788798B2 (en) 2019-01-28 2020-09-29 Johnson Controls Technology Company Building management system with hybrid edge-cloud processing
US11069926B1 (en) * 2019-02-14 2021-07-20 Vcritonc Alpha, Inc. Controlling ongoing battery system usage via parametric linear approximation
CN110851684B (zh) * 2019-11-12 2022-10-04 重庆邮电大学 一种基于三元关联图的社交话题影响力识别方法及装置
US20210200792A1 (en) 2019-12-31 2021-07-01 Johnson Controls Technology Company Building data platform with graph projections
US11894944B2 (en) 2019-12-31 2024-02-06 Johnson Controls Tyco IP Holdings LLP Building data platform with an enrichment loop
US11890550B2 (en) * 2020-01-02 2024-02-06 Mattel, Inc. Electrical tomography-based object recognition
US11296928B2 (en) * 2020-03-03 2022-04-05 Level 3 Communications, Llc Containing a faulty stimulus in a content delivery network
US11537386B2 (en) 2020-04-06 2022-12-27 Johnson Controls Tyco IP Holdings LLP Building system with dynamic configuration of network resources for 5G networks
EP4142968A4 (en) * 2020-04-29 2023-12-20 Hewlett-Packard Development Company, L.P. DETERMINATION OF THE DEVIATION OF PHYSICAL PROPERTIES OF A THREE-DIMENSIONAL OBJECT
US11651081B1 (en) * 2020-06-03 2023-05-16 Architecture Technology Corporation Systems and methods of application layer security
US11874809B2 (en) 2020-06-08 2024-01-16 Johnson Controls Tyco IP Holdings LLP Building system with naming schema encoding entity type and entity relationships
US11954154B2 (en) 2020-09-30 2024-04-09 Johnson Controls Tyco IP Holdings LLP Building management system with semantic model integration
US11397773B2 (en) 2020-09-30 2022-07-26 Johnson Controls Tyco IP Holdings LLP Building management system with semantic model integration
EP4222657A1 (en) * 2020-10-01 2023-08-09 Telefonaktiebolaget LM Ericsson (publ) Cell multi-agent coordination in shared control elements
US20220138492A1 (en) 2020-10-30 2022-05-05 Johnson Controls Technology Company Data preprocessing and refinement tool
US11921481B2 (en) 2021-03-17 2024-03-05 Johnson Controls Tyco IP Holdings LLP Systems and methods for determining equipment energy waste
EP4089277A1 (en) * 2021-05-12 2022-11-16 General Electric Renovables España S.L. A method for operating a wind turbine, and a power plant
US11769066B2 (en) 2021-11-17 2023-09-26 Johnson Controls Tyco IP Holdings LLP Building data platform with digital twin triggers and actions
US11899723B2 (en) 2021-06-22 2024-02-13 Johnson Controls Tyco IP Holdings LLP Building data platform with context based twin function processing
US11892809B2 (en) * 2021-07-26 2024-02-06 Veritone, Inc. Controlling operation of an electrical grid using reinforcement learning and multi-particle modeling
US20230133652A1 (en) * 2021-10-29 2023-05-04 GE Grid GmbH Systems and methods for uncertainty prediction using machine learning
US11796974B2 (en) 2021-11-16 2023-10-24 Johnson Controls Tyco IP Holdings LLP Building data platform with schema extensibility for properties and tags of a digital twin
US11934966B2 (en) 2021-11-17 2024-03-19 Johnson Controls Tyco IP Holdings LLP Building data platform with digital twin inferences
US11704311B2 (en) 2021-11-24 2023-07-18 Johnson Controls Tyco IP Holdings LLP Building data platform with a distributed digital twin
US11714930B2 (en) 2021-11-29 2023-08-01 Johnson Controls Tyco IP Holdings LLP Building data platform with digital twin based inferences and predictions for a graphical building model
WO2023121514A1 (ru) * 2021-12-21 2023-06-29 Владимир Германович КРЮКОВ Система принятия решений в мультиагентной среде
US20240014657A1 (en) * 2022-07-07 2024-01-11 Sherif ABDELRAZEK Method and software to aid in creating dispatch profiles of energy storage systems and to model performance of energy storage systems

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5755378A (en) * 1997-01-21 1998-05-26 Ford Global Technologies, Inc. Method and system for controlling an automotive HVAC system to prevent formation of cabin thermal stratification
US20090113049A1 (en) * 2006-04-12 2009-04-30 Edsa Micro Corporation Systems and methods for real-time forecasting and predicting of electrical peaks and managing the energy, health, reliability, and performance of electrical power systems based on an artificial adaptive neural network
US20120072181A1 (en) * 2010-09-22 2012-03-22 Behzad Imani Method and apparatus for optimizing hvac systems in buildings
US20120143356A1 (en) * 2010-09-02 2012-06-07 Pepperdash Technology Corporation Automated facilities management system
CN102707622A (zh) * 2011-03-18 2012-10-03 洛克威尔自动控制技术股份有限公司 用于优化的图形语言和使用
US20140217976A1 (en) * 2011-10-10 2014-08-07 Proterra Inc. Systems and methods for battery life maximization under fixed-route applications
US20150184550A1 (en) * 2013-12-31 2015-07-02 General Electric Company Methods and systems for enhancing control of power plant generating units
US20160004228A1 (en) * 2014-06-20 2016-01-07 Atigeo Corp. Cooperative distributed control of target systems

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US1024858A (en) 1911-12-06 1912-04-30 James M Kissinger Fence-post.
US6088689A (en) 1995-11-29 2000-07-11 Hynomics Corporation Multiple-agent hybrid control architecture for intelligent real-time control of distributed nonlinear processes
US5727128A (en) 1996-05-08 1998-03-10 Fisher-Rosemount Systems, Inc. System and method for automatically determining a set of variables for use in creating a process model
US5963447A (en) 1997-08-22 1999-10-05 Hynomics Corporation Multiple-agent hybrid control architecture for intelligent real-time control of distributed nonlinear processes
US20030069868A1 (en) 2001-06-29 2003-04-10 Vos Jules Jakob Distributed decision processing system
AU2003210750A1 (en) 2002-02-02 2003-09-02 E-Wings, Inc. Distributed system for interactive collaboration
US7072808B2 (en) 2002-02-04 2006-07-04 Tuszynski Steve W Manufacturing design and process analysis system
US7565333B2 (en) 2005-04-08 2009-07-21 Caterpillar Inc. Control system and method
US20130253942A1 (en) 2012-03-22 2013-09-26 Hong Kong Baptist University Methods and Apparatus for Smart Healthcare Decision Analytics and Support
US20140250377A1 (en) 2013-03-04 2014-09-04 Atigeo Llc Method and system for searching and analyzing large numbers of electronic documents
US20150058078A1 (en) 2013-08-26 2015-02-26 Microsoft Corporation Rule to constraint translator for business application systems
US20170271984A1 (en) * 2016-03-04 2017-09-21 Atigeo Corp. Using battery dc characteristics to control power output
JP7222883B2 (ja) * 2016-04-28 2023-02-15 ヴェリトーン アルファ インコーポレイテッド 予測を使用してターゲットシステムを制御すること

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5755378A (en) * 1997-01-21 1998-05-26 Ford Global Technologies, Inc. Method and system for controlling an automotive HVAC system to prevent formation of cabin thermal stratification
US20090113049A1 (en) * 2006-04-12 2009-04-30 Edsa Micro Corporation Systems and methods for real-time forecasting and predicting of electrical peaks and managing the energy, health, reliability, and performance of electrical power systems based on an artificial adaptive neural network
US20120143356A1 (en) * 2010-09-02 2012-06-07 Pepperdash Technology Corporation Automated facilities management system
US20120072181A1 (en) * 2010-09-22 2012-03-22 Behzad Imani Method and apparatus for optimizing hvac systems in buildings
CN102707622A (zh) * 2011-03-18 2012-10-03 洛克威尔自动控制技术股份有限公司 用于优化的图形语言和使用
US20140217976A1 (en) * 2011-10-10 2014-08-07 Proterra Inc. Systems and methods for battery life maximization under fixed-route applications
US20150184550A1 (en) * 2013-12-31 2015-07-02 General Electric Company Methods and systems for enhancing control of power plant generating units
US20160004228A1 (en) * 2014-06-20 2016-01-07 Atigeo Corp. Cooperative distributed control of target systems
WO2016025080A1 (en) * 2014-06-20 2016-02-18 Atigeo Corp. Cooperative distributed control of target systems

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2791840C2 (ru) * 2021-12-21 2023-03-13 Владимир Германович Крюков Система принятия решений в мультиагентной среде

Also Published As

Publication number Publication date
JP2019528494A (ja) 2019-10-10
EP3449425A1 (en) 2019-03-06
US10303131B2 (en) 2019-05-28
US20170329289A1 (en) 2017-11-16
EP3449425A4 (en) 2019-06-26
KR102080468B1 (ko) 2020-02-24
KR20190022505A (ko) 2019-03-06
EP3449425B1 (en) 2021-08-11
WO2017197201A1 (en) 2017-11-16
JP6626224B2 (ja) 2019-12-25
CN109844653A (zh) 2019-06-04

Similar Documents

Publication Publication Date Title
CN109844653B (zh) 使用预测来控制目标系统
JP7222883B2 (ja) 予測を使用してターゲットシステムを制御すること
CN109478848B (zh) 使用电池直流特性来控制功率输出
Aguilar et al. A systematic literature review on the use of artificial intelligence in energy self-management in smart buildings
US10666076B1 (en) Using battery state excitation to control battery operations
Prauzek et al. Differential evolution of fuzzy controller for environmentally-powered wireless sensors
Lin et al. A smart home energy management system utilizing neurocomputing-based time-series load modeling and forecasting facilitated by energy decomposition for smart home automation
Muzumdar et al. Designing a robust and accurate model for consumer-centric short-term load forecasting in microgrid environment
Rodriguez-Mier et al. Feature selection and evolutionary rule learning for Big Data in smart building energy management
Fakhar et al. A survey of smart home energy conservation techniques
US11069926B1 (en) Controlling ongoing battery system usage via parametric linear approximation
WO2021076313A1 (en) Controlling use of a battery cell having an internal supercapacitor and battery
CN116954162A (zh) 生成用于工业系统的控制策略的方法及装置
WO2023009447A1 (en) Controlling operation of an electrical grid using reinforcement learning and multi-particle modeling
Zhang et al. Automated optimal control in energy systems: the reinforcement learning approach
Alhafidh et al. Comparison and performance analysis of machine learning algorithms for the prediction of human actions in a smart home environment
Bizjak et al. Time series prediction for EMS with machine learning
Xie et al. Demand Response in Microgrids with Attention-Based Deep Reinforcement Learning
Hadar et al. Developing a residential consumption forecast method
Desraches et al. Forecasting the usage of appliances of shared use: an analysis of simplicity over complexity
Sekhar et al. Large Scale Predictive Analytics based Real-Time Energy Management and Enhance Power Quality in Smart Grid
CN115907141A (zh) 一种短期电力负荷预测方法、系统及预测计算机
CN117390383A (zh) 一种电力数据可信决策方法及装置
Douhaniaris et al. Disaggregation of electricity data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20201030