CN115587677A - 基于互信息的电力系统负荷的关联因素分析方法及装置 - Google Patents
基于互信息的电力系统负荷的关联因素分析方法及装置 Download PDFInfo
- Publication number
- CN115587677A CN115587677A CN202211569113.4A CN202211569113A CN115587677A CN 115587677 A CN115587677 A CN 115587677A CN 202211569113 A CN202211569113 A CN 202211569113A CN 115587677 A CN115587677 A CN 115587677A
- Authority
- CN
- China
- Prior art keywords
- load data
- factor
- load
- correlation
- entropy
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 42
- 238000004590 computer program Methods 0.000 claims description 21
- 239000000126 substance Substances 0.000 claims description 9
- 238000004458 analytical method Methods 0.000 claims description 6
- 238000010219 correlation analysis Methods 0.000 abstract description 9
- 238000000556 factor analysis Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000013500 data storage Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 229910021389 graphene Inorganic materials 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2462—Approximate or statistical queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J3/00—Circuit arrangements for ac mains or ac distribution networks
- H02J3/003—Load forecast, e.g. methods or systems for forecasting future load demand
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J2203/00—Indexing scheme relating to details of circuit arrangements for AC mains or AC distribution networks
- H02J2203/20—Simulating, e g planning, reliability check, modelling or computer assisted design [CAD]
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- Data Mining & Analysis (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Probability & Statistics with Applications (AREA)
- Mathematical Physics (AREA)
- Tourism & Hospitality (AREA)
- Mathematical Analysis (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Computational Mathematics (AREA)
- Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Operations Research (AREA)
- Software Systems (AREA)
- Primary Health Care (AREA)
- Fuzzy Systems (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Water Supply & Treatment (AREA)
- Public Health (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Quality & Reliability (AREA)
- Evolutionary Biology (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Development Economics (AREA)
- Algebra (AREA)
- Power Engineering (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请涉及电力系统安全技术领域,提供了一种基于互信息的电力系统负荷的关联因素分析方法及装置,该方法包括:首先,获取电力系统的负荷数据,以及所述负荷数据的关联因素。然后,获取所述负荷数据对应的第一信息熵,所述关联因素对应的第二信息熵,以及所述负荷数据与所述关联因素之间的联合熵。接着,根据所述第一信息熵、所述第二信息熵以及所述联合熵,得到所述负荷数据与所述关联因素之间的互信息值。最后,在所述互信息值大于或等于预设相关性阈值的情况下,将所述关联因素,作为所述负荷数据的主要关联因素。本申请不仅能够有效提升电力系统负荷与关联因素的相关性分析结果的准确性,还能够提高获取电力系统负荷的主要关联因素的效率。
Description
技术领域
本申请涉及电力系统安全技术领域,特别是涉及一种基于互信息的电力系统负荷的关联因素分析方法及装置。
背景技术
电力系统负荷,是保障电力系统稳定运行的重要运行参数。因此,越来越多的电力系统技术人员,选择通过研究电力系统负荷与其他关联因素的相关性的方式,实现针对电力系统负荷的预测与评估。
然而,由于基于现有技术,研究电力系统负荷与其他关联因素的相关性时,并未衡量电力系统负荷与其他关联因素之间的非线性相关性,这使得基于现有技术获取得到的相关性分析结果,存在准确性较低的问题。
发明内容
基于此,有必要针对上述技术问题,提供一种基于互信息的电力系统负荷的关联因素分析方法及装置。
第一方面,本申请提供了一种基于互信息的电力系统负荷的关联因素分析方法。所述方法包括:
获取电力系统的负荷数据,以及所述负荷数据的关联因素;
获取所述负荷数据对应的第一信息熵,所述关联因素对应的第二信息熵,以及所述负荷数据与所述关联因素之间的联合熵;
根据所述第一信息熵、所述第二信息熵以及所述联合熵,得到所述负荷数据与所述关联因素之间的互信息值;
在所述互信息值大于或等于预设相关性阈值的情况下,将所述关联因素,作为所述负荷数据的主要关联因素。
在其中一个实施例中,所述负荷数据包括表征所述电力系统的负荷数据的负荷变量;所述关联因素包括表征所述负荷数据的关联因素的关联因素变量;
所述根据所述第一信息熵、所述第二信息熵以及所述联合熵,得到所述负荷数据与所述关联因素之间的互信息值的步骤中,采用如下公式得到所述负荷数据与所述关联因素之间的互信息值:
其中,I(X,Y)为所述互信息值;H(X)为所述第一信息熵;H(Y)为所述第二信息熵;H (X,Y)为所述联合熵。
在其中一个实施例中,所述获取所述负荷数据对应的第一信息熵,所述关联因素对应的第二信息熵,以及所述负荷数据与所述关联因素之间的联合熵的步骤中,采用如下公式获取所述负荷数据对应的第一信息熵:
其中,H(X)为所述第一信息熵;p(x)为所述负荷变量x的边缘概率分布;dx为对所述负荷变量x的微分。
在其中一个实施例中,所述获取所述负荷数据对应的第一信息熵,所述关联因素对应的第二信息熵,以及所述负荷数据与所述关联因素之间的联合熵的步骤中,采用如下公式获取所述关联因素对应的第二信息熵:
其中,H(Y)为所述第二信息熵;p(y)为所述关联因素变量y的边缘概率分布;dy为对所述关联因素变量y的微分。
在其中一个实施例中,所述获取所述负荷数据对应的第一信息熵,所述关联因素对应的第二信息熵,以及所述负荷数据与所述关联因素之间的联合熵的步骤中,采用如下公式获取所述负荷数据与所述关联因素之间的联合熵:
其中,H(X,Y)为所述负荷数据与所述关联因素之间的联合熵;p(x,y)为所述负荷变量x和所述关联因素变量y的联合概率分布;dx为对所述负荷变量x的微分;dy为对所述关联因素变量y的微分。
在其中一个实施例中,所述方法还包括:在所述互信息值小于所述预设相关性阈值的情况下,确定所述关联因素,不为所述负荷数据的主要关联因素。
第二方面,本申请还提供了一种基于互信息的电力系统负荷的关联因素分析装置。所述装置包括:
数据获取模块,用于获取电力系统的负荷数据,以及所述负荷数据的关联因素;
信息熵获取模块,用于获取所述负荷数据对应的第一信息熵,所述关联因素对应的第二信息熵,以及所述负荷数据与所述关联因素之间的联合熵;
互信息值获取模块,用于根据所述第一信息熵、所述第二信息熵以及所述联合熵,得到所述负荷数据与所述关联因素之间的互信息值;
分析结果输出模块,用于在所述互信息值大于或等于预设相关性阈值的情况下,将所述关联因素,作为所述负荷数据的主要关联因素。
第三方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取电力系统的负荷数据,以及所述负荷数据的关联因素;获取所述负荷数据对应的第一信息熵,所述关联因素对应的第二信息熵,以及所述负荷数据与所述关联因素之间的联合熵;根据所述第一信息熵、所述第二信息熵以及所述联合熵,得到所述负荷数据与所述关联因素之间的互信息值;在所述互信息值大于或等于预设相关性阈值的情况下,将所述关联因素,作为所述负荷数据的主要关联因素。
第四方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取电力系统的负荷数据,以及所述负荷数据的关联因素;获取所述负荷数据对应的第一信息熵,所述关联因素对应的第二信息熵,以及所述负荷数据与所述关联因素之间的联合熵;根据所述第一信息熵、所述第二信息熵以及所述联合熵,得到所述负荷数据与所述关联因素之间的互信息值;在所述互信息值大于或等于预设相关性阈值的情况下,将所述关联因素,作为所述负荷数据的主要关联因素。
第五方面,本申请还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
获取电力系统的负荷数据,以及所述负荷数据的关联因素;获取所述负荷数据对应的第一信息熵,所述关联因素对应的第二信息熵,以及所述负荷数据与所述关联因素之间的联合熵;根据所述第一信息熵、所述第二信息熵以及所述联合熵,得到所述负荷数据与所述关联因素之间的互信息值;在所述互信息值大于或等于预设相关性阈值的情况下,将所述关联因素,作为所述负荷数据的主要关联因素。
上述基于互信息的电力系统负荷的关联因素分析方法及装置,首先,获取电力系统的负荷数据,以及负荷数据的关联因素。然后,获取负荷数据对应的第一信息熵,关联因素对应的第二信息熵,以及负荷数据与关联因素之间的联合熵。接着,根据第一信息熵、第二信息熵以及联合熵,得到负荷数据与关联因素之间的互信息值,最后,在互信息值大于或等于预设相关性阈值的情况下,将关联因素,作为负荷数据的主要关联因素。本申请基于电力系统负荷与关联因素各自对应的信息熵和两者之间的联合熵,得到了电力系统负荷与关联因素之间的互信息值,实现了在兼顾线性相关性与非线性相关性的前提下,获取电力系统负荷与关联因素之间的相关性分析结果,不仅能够有效提升电力系统负荷与关联因素的相关性分析结果的准确性,还能够提高获取电力系统负荷的主要关联因素的效率。
附图说明
为了更清楚地说明本申请实施例或传统技术中的技术方案,下面将对实施例或传统技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来说,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为一个实施例中基于互信息的电力系统负荷的关联因素分析方法的应用环境图;
图2为一个实施例中基于互信息的电力系统负荷的关联因素分析方法的流程示意图;
图3为一个实施例中确定某一关联因素不为负荷数据的主要关联因素的具体方式的流程示意图;
图4为一个实施例中基于互信息的电力系统负荷的关联因素分析装置的结构框图;
图5为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
目前,现有技术通常采用皮尔逊相关系数,来衡量电力系统负荷与其他关联因素的相关性。然而,由于皮尔逊相关系数只能用于衡量两个变量之间的线性相关性,无法针对两个变量之间的非线性相关性展开评估,而电力系统负荷与一些关联因素之间存在非线性相关性,例如,电力系统的短期负荷与温度之间,存在类抛物线的非线性相关特性,因此,基于现有技术获取得到的相关性分析结果,由于无法明确体现电力系统负荷与关联因素之间存在的非线性相关性,而存在准确性较低的问题。
本申请实施例提供的基于互信息的电力系统负荷的关联因素分析方法,可以应用于如图1所示的应用环境中。
其中,终端102通过网络与服务器104进行通信。数据存储系统可以存储服务器104需要处理的数据。数据存储系统可以集成在服务器104上,也可以放在云上或其他网络服务器上。
具体而言,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑;服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种基于互信息的电力系统负荷的关联因素分析方法,以该方法应用于图1中的服务器为例进行说明,包括以下步骤:
步骤S210,获取电力系统的负荷数据,以及负荷数据的关联因素。
本步骤中,电力系统的负荷数据,是指表征电力系统的负荷量的相关数据;负荷数据的关联因素,是指与电力系统的负荷量具有某种关联关系的关联因素,例如,气象因素、温度因素、突发事件因素、经济因素等关联因素。
步骤S220,获取负荷数据对应的第一信息熵,关联因素对应的第二信息熵,以及负荷数据与关联因素之间的联合熵。
本步骤中,负荷数据,是指电力系统的负荷数据,即表征电力系统的负荷量的相关数据;负荷数据对应的第一信息熵,是指电力系统的负荷数据对应的第一信息熵;关联因素,是指负荷数据的关联因素,即与电力系统的负荷量具有某种关联关系的关联因素;关联因素对应的第二信息熵,是指负荷数据的关联因素对应的第二信息熵;负荷数据与关联因素之间的联合熵,是指电力系统的负荷数据,与负荷数据的关联因素之间的联合熵。
步骤S230,根据第一信息熵、第二信息熵以及联合熵,得到负荷数据与关联因素之间的互信息值。
本步骤中,第一信息熵,是指负荷数据对应的第一信息熵,即电力系统的负荷数据对应的第一信息熵;第二信息熵,是指关联因素对应的第二信息熵,即与电力系统的负荷量具有某种关联关系的关联因素对应的第二信息熵;联合熵,是指负荷数据与关联因素之间的联合熵,即电力系统的负荷数据,与负荷数据的关联因素之间的联合熵;负荷数据与关联因素之间的互信息值,是指电力系统的负荷数据,与负荷数据的关联因素之间的互信息值。
在实际应用中,在上述负荷数据与上述关联因素之间完全不相关或相互独立的情况下,两者之间的互信息值为0(即互信息值的最小值),该互信息值表征两者之间不存在相同信息;在上述负荷数据与上述关联因素之间具有相互依赖性的情况下,两者之间的互信息值越大,则表征两者之间存在的相同信息的数量越多,因此,互信息值可用于衡量两个变量之间相互依赖的程度。
步骤S240,在互信息值大于或等于预设相关性阈值的情况下,将上述关联因素,作为负荷数据的主要关联因素。
本步骤中,互信息值,是指负荷数据与关联因素之间的互信息值,即电力系统的负荷数据,与负荷数据的关联因素之间的互信息值,前述负荷数据的关联因素,即与电力系统的负荷量具有某种关联关系的关联因素;预设相关性阈值,是指用于评估上述负荷数据与上述关联因素之间,是否具备明显相关性的预设相关性阈值,其取值可以基于实际的相似性评估需求进行确定,例如,由于互信息值衡量的是两个变量之间统计相关性(即包含两个变量之间的所有相关性表现形式),互信息值的实际数值往往较低,故可以将预设相关性阈值设置为0.25;上述关联因素,是指负荷数据的关联因素,即与电力系统的负荷量具有某种关联关系的关联因素;主要关联因素,是指与电力系统的负荷量具有主要关联关系的关联因素;将上述关联因素,作为负荷数据的主要关联因素,是指将上述关联因素,作为与电力系统的负荷量具有主要关联关系的关联因素。
示例性的,在将上述预设相关性阈值设置为0.25的情况下,当负荷数据与关联因素之间的互信息值大于或等于0.25时,即可将上述关联因素,作为负荷数据的主要关联因素(即将上述关联因素,作为与电力系统的负荷量具有主要关联关系的关联因素)。
上述基于互信息的电力系统负荷的关联因素分析方法,首先,获取电力系统的负荷数据,以及负荷数据的关联因素。然后,获取负荷数据对应的第一信息熵,关联因素对应的第二信息熵,以及负荷数据与关联因素之间的联合熵。接着,根据第一信息熵、第二信息熵以及联合熵,得到负荷数据与关联因素之间的互信息值,最后,在互信息值大于或等于预设相关性阈值的情况下,将关联因素,作为负荷数据的主要关联因素。本申请基于电力系统负荷与关联因素各自对应的信息熵和两者之间的联合熵,得到了电力系统负荷与关联因素之间的互信息值,实现了在兼顾线性相关性与非线性相关性的前提下,获取电力系统负荷与关联因素之间的相关性分析结果,不仅能够有效提升电力系统负荷与关联因素的相关性分析结果的准确性,还能够提高获取电力系统负荷的主要关联因素的效率。
在一个实施例中,对于获取负荷数据与关联因素之间的互信息值的具体方式,上述负荷数据包括表征上述电力系统的负荷数据的负荷变量;上述关联因素包括表征上述负荷数据的关联因素的关联因素变量;在上述步骤S230中,采用如下公式得到负荷数据与关联因素之间的互信息值:
其中,I(X,Y)为上述互信息值;H(X)为上述第一信息熵;H(Y)为上述第二信息熵;H (X,Y)为上述联合熵。
具体而言,上述互信息值,是指上述负荷变量与上述关联因素变量之间的互信息值,即表征上述电力系统的负荷数据的负荷变量,与表征上述负荷数据的关联因素的关联因素变量之间的互信息值;负荷数据的关联因素,即与电力系统的负荷量具有某种关联关系的关联因素;上述第一信息熵,是指上述负荷变量对应的第一信息熵,即表征上述电力系统的负荷数据的负荷变量对应的第一信息熵;上述第二信息熵,是指上述关联因素变量对应的第二信息熵,即表征上述负荷数据的关联因素的关联因素变量;负荷数据的关联因素,是指与电力系统的负荷量具有某种关联关系的关联因素;上述联合熵,是指上述负荷变量与上述关联因素变量之间的联合熵,即表征上述电力系统的负荷数据的负荷变量,与表征上述负荷数据的关联因素的关联因素变量之间的联合熵。
上述实施例通过基于电力系统的负荷数据与关联因素各自对应的信息熵和联合熵,获取电力系统的负荷数据与关联因素对应的互信息值的方式,实现了在兼顾线性相关性与非线性相关性的前提下,获取电力系统的负荷数据与关联因素的分析结果,进而有效提升了电力系统负荷与关联因素的相关性分析结果的准确性。
在一个实施例中,对于获取负荷数据对应的第一信息熵的具体方式,在上述步骤S220中,采用如下公式获取负荷数据对应的第一信息熵:
其中,H(X)为上述第一信息熵;p(x)为上述负荷变量x的边缘概率分布;dx为对上述负荷变量x的微分。
具体而言,上述负荷变量,是指表征上述电力系统的负荷数据的负荷变量;上述第一信息熵,是指上述负荷变量对应的第一信息熵,即表征上述电力系统的负荷数据的负荷变量对应的第一信息熵;电力系统的负荷数据,是指表征电力系统的负荷量的相关数据。
上述实施例通过获取表征电力系统的负荷数据的负荷变量对应的第一信息熵的方式,实现了针对电力系统负荷对应的信息量的准确衡量,进而确保了电力系统负荷与关联因素的相关性分析结果的准确性。
在一个实施例中,对于获取关联因素对应的第二信息熵的具体方式,在上述步骤S220中,采用如下公式获取关联因素对应的第二信息熵:
其中,H(Y)为上述第二信息熵;p(y)为上述关联因素变量y的边缘概率分布;dy为对上述关联因素变量y的微分。
具体而言,上述关联因素变量,是指表征上述负荷数据的关联因素的关联因素变量;上述第二信息熵,是指上述关联因素变量对应的第二信息熵,即表征上述负荷数据的关联因素的关联因素变量对应的第二信息熵;负荷数据的关联因素,是指与电力系统的负荷量具有某种关联关系的关联因素。
上述实施例通过获取表征负荷数据的关联因素的关联因素变量对应的第二信息熵,实现了针对关联因素对应的信息量的准确衡量,不仅有效提升了电力系统负荷与关联因素的相关性分析结果的准确性,还提高了获取电力系统负荷的主要关联因素的效率。
在一个实施例中,对于获取负荷数据与关联因素之间的联合熵的具体方式,在上述步骤S220中,采用如下公式获取负荷数据与关联因素之间的联合熵:
其中,H(X,Y)为上述负荷数据与上述关联因素之间的联合熵;p(x,y)为上述负荷变量x和上述关联因素变量y的联合概率分布;dx为对上述负荷变量x的微分;dy为对上述关联因素变量y的微分。
具体而言,上述负荷变量,是指表征上述电力系统的负荷数据的负荷变量;上述关联因素变量,表征上述负荷数据的关联因素的关联因素变量;上述负荷数据与上述关联因素之间的联合熵,是指上述负荷变量与上述关联因素变量之间的联合熵,即表征上述电力系统的负荷数据的负荷变量,与表征上述负荷数据的关联因素的关联因素变量之间的联合熵。
上述实施例通过获取负荷数据与关联因素之间的联合熵的方式,实现了针对电力系统负荷与关联因素共同包含的信息量的准确衡量,进而保障了电力系统负荷与关联因素对应的互信息值的数据准确性。
在一个实施例中,结合上述用于获取负荷数据对应的第一信息熵H(X)、关联因素对应的第二信息熵H(Y)、以及负荷数据与关联因素之间的联合熵H(X,Y)的公式,也可以采用如下公式得到负荷数据与关联因素之间的互信息值:
其中,I(X,Y)为上述互信息值;p(x,y)为上述负荷变量x和上述关联因素变量y的联合概率分布;p(x)为上述负荷变量x的边缘概率分布;p(y)为上述关联因素变量y的边缘概率分布。
需要说明的是,上述负荷数据与关联因素之间的互信息值,衡量的是在获取得到上述关联因素变量y的信息之后,上述负荷变量x所获得的信息量;由于上述关于互信息值I (X,Y)的计算公式,描述的是上述负荷变量x与上述关联因素变量y之间的统计相关性,而无需依赖于其他先验模型的假定,故基于上述公式,可以实现在兼顾线性相关性与非线性相关性的前提下,获取电力系统负荷与关联因素之间的相关性分析结果。
在一个实施例中,对于确定某一关联因素不为负荷数据的主要关联因素的具体方式,如图3所示,上述方法还包括以下步骤:
步骤S310,在互信息值小于预设相关性阈值的情况下,确定上述关联因素,不为负荷数据的主要关联因素。
其中,互信息值,是指负荷数据与关联因素之间的互信息值,即电力系统的负荷数据,与负荷数据的关联因素之间的互信息值,前述负荷数据的关联因素,即与电力系统的负荷量具有某种关联关系的关联因素;预设相关性阈值,是指用于评估上述负荷数据与上述关联因素之间,是否具备明显相关性的预设相关性阈值,其取值可以基于实际的相似性评估需求进行确定,例如,由于互信息值衡量的是两个变量之间统计相关性(即包含两个变量之间的所有相关性表现形式),互信息值的实际数值往往较低,故可以将预设相关性阈值设置为0.25;上述关联因素,是指负荷数据的关联因素,即与电力系统的负荷量具有某种关联关系的关联因素;主要关联因素,是指与电力系统的负荷量具有主要关联关系的关联因素;确定上述关联因素,不为负荷数据的主要关联因素,是指确定上述关联因素,不能作为与电力系统的负荷量具有主要关联关系的关联因素。
需要说明的是,在上述互信息值小于上述预设相关性阈值的情况下,本步骤可以替换上述步骤S240。
示例性的,在将上述预设相关性阈值设置为0.25的情况下,当负荷数据与关联因素之间的互信息值小于0.25时,即可确定上述关联因素,不为负荷数据的主要关联因素(即上述关联因素,不能作为与电力系统的负荷量具有主要关联关系的关联因素);当负荷数据与关联因素之间的互信息值大于或等于0.25时,即可将上述关联因素,作为负荷数据的主要关联因素(即将上述关联因素,作为与电力系统的负荷量具有主要关联关系的关联因素)。
在实际应用中,可以通过采用任意程序语言,编写具有如下内容的函数的方式,实现基于上述预设相关性阈值0.25,确定某一关联因素,是否可以作为负荷数据的主要关联因素(即是否可以作为与电力系统的负荷量具有主要关联关系的关联因素):
其中,X为上述负荷变量x,Y为上述关联因素变量y,I(X,Y)为上述互信息值,is_ relate(X,Y)为用于衡量上述关联因素变量y和上述负荷变量x之间是否具备明显相关性的函数名称。
上述实施例通过基于预设相关性阈值,确定某一关联因素能否作为与电力系统的负荷量具有主要关联关系的关联因素的方式,有效提升了获取电力系统负荷的主要关联因素的效率。
应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的基于互信息的电力系统负荷的关联因素分析方法的基于互信息的电力系统负荷的关联因素分析装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个基于互信息的电力系统负荷的关联因素分析装置实施例中的具体限定可以参见上文中对于基于互信息的电力系统负荷的关联因素分析方法的限定,在此不再赘述。
在一个实施例中,如图4所示,提供了一种基于互信息的电力系统负荷的关联因素分析装置,该装置400包括:
数据获取模块410,用于获取电力系统的负荷数据,以及所述负荷数据的关联因素;
信息熵获取模块420,用于获取所述负荷数据对应的第一信息熵,所述关联因素对应的第二信息熵,以及所述负荷数据与所述关联因素之间的联合熵;
互信息值获取模块430,用于根据所述第一信息熵、所述第二信息熵以及所述联合熵,得到所述负荷数据与所述关联因素之间的互信息值;
分析结果输出模块440,用于在所述互信息值大于或等于预设相关性阈值的情况下,将所述关联因素,作为所述负荷数据的主要关联因素。
在其中一个实施例中,所述负荷数据包括表征所述电力系统的负荷数据的负荷变量;所述关联因素包括表征所述负荷数据的关联因素的关联因素变量;互信息值获取模块430,具体用于所述根据所述第一信息熵、所述第二信息熵以及所述联合熵,得到所述负荷数据与所述关联因素之间的互信息值的步骤中,采用如下公式得到所述负荷数据与所述关联因素之间的互信息值:
其中,I(X,Y)为所述互信息值;H(X)为所述第一信息熵;H(Y)为所述第二信息熵;H (X,Y)为所述联合熵。
在其中一个实施例中,信息熵获取模块420,具体用于所述获取所述负荷数据对应的第一信息熵,所述关联因素对应的第二信息熵,以及所述负荷数据与所述关联因素之间的联合熵的步骤中,采用如下公式获取所述负荷数据对应的第一信息熵:
其中,H(X)为所述第一信息熵;p(x)为所述负荷变量x的边缘概率分布;dx为对所述负荷变量x的微分。
在其中一个实施例中,信息熵获取模块420,还用于所述获取所述负荷数据对应的第一信息熵,所述关联因素对应的第二信息熵,以及所述负荷数据与所述关联因素之间的联合熵的步骤中,采用如下公式获取所述关联因素对应的第二信息熵:
其中,H(Y)为所述第二信息熵;p(y)为所述关联因素变量y的边缘概率分布;dy为对所述关联因素变量y的微分。
在其中一个实施例中,信息熵获取模块420,还用于所述获取所述负荷数据对应的第一信息熵,所述关联因素对应的第二信息熵,以及所述负荷数据与所述关联因素之间的联合熵的步骤中,采用如下公式获取所述负荷数据与所述关联因素之间的联合熵:
其中,H(X,Y)为所述负荷数据与所述关联因素之间的联合熵;p(x,y)为所述负荷变量x和所述关联因素变量y的联合概率分布;dx为对所述负荷变量x的微分;dy为对所述关联因素变量y的微分。
在其中一个实施例中,上述装置还包括:非主要关联因素确定模块,用于在所述互信息值小于所述预设相关性阈值的情况下,确定所述关联因素,不为所述负荷数据的主要关联因素。
上述基于互信息的电力系统负荷的关联因素分析装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图5所示。该计算机设备包括处理器、存储器、输入/输出接口(Input/Output,简称I/O)和通信接口。其中,处理器、存储器和输入/输出接口通过系统总线连接,通信接口通过输入/输出接口连接到系统总线。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储电力系统负荷的关联因素相关数据等数据。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于互信息的电力系统负荷的关联因素分析方法。
本领域技术人员可以理解,图5中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例的步骤。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述各方法实施例的步骤。
在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述各方法实施例的步骤。
需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。
Claims (10)
1.一种基于互信息的电力系统负荷的关联因素分析方法,其特征在于,所述方法包括:
获取电力系统的负荷数据,以及所述负荷数据的关联因素;
获取所述负荷数据对应的第一信息熵,所述关联因素对应的第二信息熵,以及所述负荷数据与所述关联因素之间的联合熵;
根据所述第一信息熵、所述第二信息熵以及所述联合熵,得到所述负荷数据与所述关联因素之间的互信息值;
在所述互信息值大于或等于预设相关性阈值的情况下,将所述关联因素,作为所述负荷数据的主要关联因素。
6.根据权利要求1至5中任一项所述的方法,其特征在于,所述方法还包括:
在所述互信息值小于所述预设相关性阈值的情况下,确定所述关联因素,不为所述负荷数据的主要关联因素。
7.一种基于互信息的电力系统负荷的关联因素分析装置,其特征在于,所述装置包括:
数据获取模块,用于获取电力系统的负荷数据,以及所述负荷数据的关联因素;
信息熵获取模块,用于获取所述负荷数据对应的第一信息熵,所述关联因素对应的第二信息熵,以及所述负荷数据与所述关联因素之间的联合熵;
互信息值获取模块,用于根据所述第一信息熵、所述第二信息熵以及所述联合熵,得到所述负荷数据与所述关联因素之间的互信息值;
分析结果输出模块,用于在所述互信息值大于或等于预设相关性阈值的情况下,将所述关联因素,作为所述负荷数据的主要关联因素。
8.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述的方法的步骤。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
10.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211569113.4A CN115587677A (zh) | 2022-12-08 | 2022-12-08 | 基于互信息的电力系统负荷的关联因素分析方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211569113.4A CN115587677A (zh) | 2022-12-08 | 2022-12-08 | 基于互信息的电力系统负荷的关联因素分析方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115587677A true CN115587677A (zh) | 2023-01-10 |
Family
ID=84783472
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211569113.4A Pending CN115587677A (zh) | 2022-12-08 | 2022-12-08 | 基于互信息的电力系统负荷的关联因素分析方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115587677A (zh) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113112090A (zh) * | 2021-04-29 | 2021-07-13 | 内蒙古电力(集团)有限责任公司内蒙古电力经济技术研究院分公司 | 基于综合互信息度的主成分分析的空间负荷预测方法 |
-
2022
- 2022-12-08 CN CN202211569113.4A patent/CN115587677A/zh active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113112090A (zh) * | 2021-04-29 | 2021-07-13 | 内蒙古电力(集团)有限责任公司内蒙古电力经济技术研究院分公司 | 基于综合互信息度的主成分分析的空间负荷预测方法 |
Non-Patent Citations (1)
Title |
---|
许飞: "基于机器学习的短期负荷预测", 《中国优秀硕士学位论文全文数据库工程科技Ⅱ辑》 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Dette et al. | A Copula‐Based Non‐parametric Measure of Regression Dependence | |
CN107622326B (zh) | 用户分类、可用资源预测方法、装置及设备 | |
CN114757602B (zh) | 供给侧电力碳排放风险预警方法、装置和计算机设备 | |
CN115795928B (zh) | 基于伽马过程的加速退化试验数据处理方法和装置 | |
CN112215398A (zh) | 电力用户负荷预测模型建立方法、装置、设备及存储介质 | |
CN116401238A (zh) | 偏离度监测方法、装置、设备、存储介质和程序产品 | |
CN113627950B (zh) | 基于动态图的用户交易特征提取的方法和系统 | |
CN115587677A (zh) | 基于互信息的电力系统负荷的关联因素分析方法及装置 | |
CN114387085B (zh) | 流水数据处理方法、装置、计算机设备和存储介质 | |
CN114881761A (zh) | 相似样本的确定方法与授信额度的确定方法 | |
CN116150200A (zh) | 数据处理方法、装置、电子设备及存储介质 | |
CN114925919A (zh) | 业务资源处理方法、装置、计算机设备和存储介质 | |
CN114529136A (zh) | 基于主成分分析和Topsis的电子部组件评价方法和装置 | |
CN109783877B (zh) | 时间序列模型建立方法、装置、计算机设备和存储介质 | |
CN113935574B (zh) | 异常交易的监测方法、装置、计算机设备和存储介质 | |
CN117151756A (zh) | 用户标签信息的确定方法、装置、设备、介质和程序产品 | |
Cheng et al. | Input modelling for multimodal data | |
CN113240472B (zh) | 理财产品推荐方法、电子设备及存储介质 | |
CN115587285A (zh) | 目标对象识别方法、装置、计算机设备和存储介质 | |
CN117251816A (zh) | 碳排放数据的验证方法、装置、计算机设备和存储介质 | |
CN116091209A (zh) | 信贷业务处理方法、装置、计算机设备和存储介质 | |
CN117171758A (zh) | 安全检测方法、装置、计算机设备和存储介质 | |
CN118279057A (zh) | 异常交易数据确定方法、装置、设备、存储介质和程序产品 | |
CN118154035A (zh) | 业务数据的价值评估方法、装置、设备、存储介质和产品 | |
CN118277193A (zh) | 业务数据的处理方法、装置、计算机设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20230110 |
|
RJ01 | Rejection of invention patent application after publication |