CN107704610A - 一种配电网运行数据事件关联分析系统及分析方法 - Google Patents
一种配电网运行数据事件关联分析系统及分析方法 Download PDFInfo
- Publication number
- CN107704610A CN107704610A CN201710972284.4A CN201710972284A CN107704610A CN 107704610 A CN107704610 A CN 107704610A CN 201710972284 A CN201710972284 A CN 201710972284A CN 107704610 A CN107704610 A CN 107704610A
- Authority
- CN
- China
- Prior art keywords
- data
- distribution network
- network operation
- affairs
- database
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000009826 distribution Methods 0.000 title claims abstract description 92
- 238000004458 analytical method Methods 0.000 title claims description 23
- 238000010219 correlation analysis Methods 0.000 title claims description 7
- 238000000034 method Methods 0.000 claims abstract description 24
- 230000015572 biosynthetic process Effects 0.000 claims abstract description 13
- 238000012545 processing Methods 0.000 claims description 13
- 230000002123 temporal effect Effects 0.000 claims description 9
- 238000012098 association analyses Methods 0.000 claims description 8
- 230000008859 change Effects 0.000 claims description 4
- 230000005611 electricity Effects 0.000 claims description 4
- 238000000605 extraction Methods 0.000 claims description 4
- 230000007423 decrease Effects 0.000 claims description 3
- 238000010606 normalization Methods 0.000 claims description 3
- 230000010365 information processing Effects 0.000 abstract description 2
- 238000003672 processing method Methods 0.000 abstract description 2
- 238000007726 management method Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 4
- 238000012423 maintenance Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000013138 pruning Methods 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 238000012097 association analysis method Methods 0.000 description 2
- 238000009412 basement excavation Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000032683 aging Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000002347 injection Methods 0.000 description 1
- 239000007924 injection Substances 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 239000011232 storage material Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000032258 transport Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/242—Query formulation
- G06F16/243—Natural language query formulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2216/00—Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
- G06F2216/03—Data mining
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Databases & Information Systems (AREA)
- Mathematical Physics (AREA)
- Entrepreneurship & Innovation (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Educational Administration (AREA)
- Tourism & Hospitality (AREA)
- Development Economics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Fuzzy Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Software Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开一种配电网运行数据事件关联分析方法,该方法包含:将配用电信息系统的数据信息输入数据库,构建配电网运行数据及运行事件数据库;对数据库中的报表类数据进行处理,将形成配电网运行因素、运行事件集;对数据库中的时序类数据进行处理,将形成配电网运行因素、运行事件集;采用Apriori算法对形成的配电网运行因素、运行事件集进行分析,形成关联事务关系集。本发明将Apriori关联算法运用到配电网运行海量数据中进行分析,可以得到电网运行各因素、事件之间的关联关系及关联强弱;对报表类数据、时序运行类数据的形成事务数据的处理方法,保留了配网运行要素,同时还保留了时序运行类数据的时序变化趋势特征。
Description
技术领域
本发明涉及电网运行数据分析领域,具体涉及一种基于Apriori关联算法的配电网运行数据事件关联分析系统及分析方法。
背景技术
近年来,信息技术日益发达,配电网运行积累了大量的运行及运维数据。在现在配电网运维中,主要存在以下问题:
1)配网网架基础薄弱,自动化水平低,检测手段相对落后,配网点多、线长、面广,电网的运行维护工作任务十分艰巨。
2)社会生产、生活用电激增负荷增长屡创新高。区域性、季节性负荷需求给配网供电能力、运行维护带来巨大压力。
3)配电网运维管理模式相对滞后。以上情况可以看出,当前配网基础较差,而配网架构日趋庞大、复杂。百姓生产、生活对供电质量的要求越来越高,对电网运行维护工作提出了更高的要求,且配网在每年运维工作中可投入的人力、物力资源有限,网架薄弱,设备老化等问题无法马上解决,亟需要新技术的注入改变以往陈旧的配网管理模式,使得配电网向“精益运维”过度。
大数据在电力系统中应用随着大数据时代而蓬勃兴起。国内电力大数据的研究主要集中在电力企业的生产、运营、管理等方面,并从传统平台迁移到大数据平台,在输变电设备故障识别与预测、配电设备负载估算及重过载预警、物资库存物料需求影响因素分析、配电网低电压实时监测应用、电网中长期负荷预测与用电量分析等方面已有实际应用。在配电网的用电量预测、空间负荷预测、多指标关联分析等领域,国内难以支持智能配电系统和用户侧管理系统的有效集成,国内外的大数据应用差距巨大。
随着配网业务的覆盖面进一步扩大,逐渐积累了超过TB级的数据,然而大多数电力企业的数据库仅仅实现了数据存储、查询、统计等最基本层次的功能,无法深入挖掘出隐藏在海量数据背后潜在的价值,对于数据的收集、存储和分析处理将提出更高的要求。配网数据具有典型的4V特性,大容量,多类型,价值密度低,变化快等特点。大数据技术在配网运维管理的应用已经势在必行,也是电网运维向更优、更强发展的必要手段,但是在实际电网运行中,面对每日产生的海量运行数据,缺乏适合的技术手段对数据进行分析,更不能发掘电网各运行因素、事件之间的关联关系。
发明内容
本发明提供一种配电网运行数据事件关联分析系统及分析方法,发掘配电网各运行因素、各运行事件之间关联关系及关联强弱。
为实现上述目的,本发明提供一种配电网运行数据事件关联分析方法,其特点是,该方法包含:
将配用电信息系统的数据信息输入数据库,构建配电网运行数据及运行事件数据库;
对数据库中的报表类数据进行处理,将形成配电网运行因素、运行事件集;
对数据库中的时序类数据进行处理,将形成配电网运行因素、运行事件集;
采用Apriori算法对形成的配电网运行因素、运行事件集进行分析,形成关联事务关系集。
上述将配用电信息系统的数据信息输入数据库,构建配电网运行数据及运行事件数据库的方法包含:
通过人工输入或经接口实时互联来获取配电网运行时序数据及报表类运行数据;
根据配电网关联事件分析需求,对所有数据进行筛选,并根据每种配电网运行信息的层级和类型构建用户关联分析的数据体系。
上述对数据库中的报表类数据进行处理,将形成配电网运行因素、运行事件集的方法包含:
数据归一化,将含义相同但由于某些原因表述不同的项目统一成相同的描述语言;
提取描述性语言的关键词:将“故障描述”等描述类数据,根据实际需要提取能够表征该项目描述的关键词,将关键词作为事务数据进行关联性分析;
去除无用项和重复项:将数据中重复的项目或者对于记录无实际区分作用的项目删除;
形成事务数据集,将报表类数据中的记录数据进行整理后,每个数据项的集合形成事务全集,报表中的每条记录是一个数据事务集。
上述对数据库中的时序类数据进行处理,将形成配电网运行因素、运行事件集的方法包含:
数据频度设置,按照实际计算机能力和分析频度需求,设置所分析的时序数据的数据频度;
连续时序数据事务离散化;
时序数据特征离散化;
事件事务设置:将断电、线路故障等这些突发性非时序事件,设置成事务项;
形成事务数据集,将时序类数据中的记录数据进行整理后,每个数据项的集合形成事务全集,报表中的每条记录是一个数据事务集。
上述连续时序数据事务离散化包含:
如当在时间t1时,馈线电流I在0≤I<1A范围内时,设置为事务I0,在1≤I<2A时,设置为事务I1,在2≤I<3A时,设置为事务I2…以此类推,将连续的馈线时序电流离散化;其中离散化的区间长度设置可根据具体时序数据的数值范围确定。
上述时序数据特征离散化包含:
将时序数据的变化趋势设置为事务,如在t2时刻时,馈线电流I在2≤I<3A,设置时序值事务为I2,若馈线电流相对t1时刻时是上升的,可设置时序特征事务为Iup;若馈线电流相对t1时刻时是下降的,可设置时序特征事务为Idown;若馈线电流相对t1时刻时是不变的,可设置时序特征事务为Iflat;即在每个时刻t,馈线电流将设置两个事务,其中Ik表征时序值本身,Iup或Idown或Iflat表示时序值变化趋势。
上述采用Apriori算法对形成的配电网运行因素、运行事件集进行分析,形成关联事务关系集包含:
设定合理的最小置信度阈值和支持度阈值,运用Apriori算法对配电网运行各因素和事件进行关联规则挖掘,找出所有的频繁项集,产生强关联规则,形成关联事务关系集。
一种配电网运行数据事件关联分析系统,其特点是,该系统包含:
数据库模块,其接收配用电信息系统的数据信息,构建配电网运行数据及运行事件数据库;
报表数据处理模块,其连接数据库模块,对数据库中的报表类数据进行处理,将形成配电网运行因素、运行事件集;
时序数据处理模块,其连接数据库模块,对数据库中的时序类数据进行处理,将形成配电网运行因素、运行事件集;
分析模块,其采用Apriori算法对形成的配电网运行因素、运行事件集进行分析,形成关联事务关系集。
本发明一种配电网运行数据事件关联分析系统及分析方法和现有技术相比,其优点在于,本发明能够将配电网运行中的报表类数据中的描述性语言,通过处理提取成可以关联分析的规范语言,从而形成运行因素或事件;本发明能够将配电网运行中的时序运行类数据转换成运行因素或事件,除了保留时序数据本身值的特征,同时还可以保留时序数据的上升或下降时序变化趋势特征;本发明能够将“停电”、“跳闸”等突发事件,转换成运行因素或事件,并保留突发事件在时序上的发生特征;本发明能够将报表类数据,时序类数据结合分析,运用关联规则算法,高效地分析配电网各运行因素和事件之间的关联关系及关联强弱。本发明挖掘的规则集受冗余信息的影响较小,说明数据挖掘能够把握重要关联规则,滤除干扰,在实际数据部分有错误或缺失时对配点网运行因素或事件关联分析影响很小,同时既可以在线挖掘实际运行数据,也可以在离线状态挖掘历史运行数据来挖掘关联规则,为配电网运行因素和事件关联关系挖掘提供更为简洁、实用和有效的处理手段。
附图说明
图1为本发明一种配电网运行数据事件关联分析方法的流程图。
具体实施方式
以下结合附图,进一步说明本发明的具体实施例。
如图1所示,公开了一种基于Apriori关联算法的配电网运行大数据关联分析方法的实施例,可以得到配电网运行中各因素及指标之间的相互关联关系,除了可以验证已知的配电网关联关系外,更大的意义在于可以挖掘在之前配电网运维中没有发现的配电网各运行因素与运维指标之间的隐性关联,使得配电网运行、管理部门能够更深刻地了解和掌握配电网运行情况与指标情况,为提高配电网运维指标提供决策建议。
该基于Apriori关联算法的配电网运行大数据关联分析方法具体包含以下步骤:
S1、即将现有配用电信息系统的输出数据导入数据库,以配用电运行系统中所记录的报表类和时序类数据作为数据源,构建配电网运行因素和事件关联分析数据体系。
S1.1、外部数据的导入,需要通过预留的接口,实现与配电自动化系统、SCADA系统、故障抢修系统等配用电信息系统的数据互联,并接收其给出的电气量、运行状态量、报表信息。
S1.2、之后分析不同数据源中所包含信息的具体信息类型及含义,确定关联分析中所需的信息层级,并根据关联分析的信息层级和信息类型等构建配电网运行因素和事件关联分析层次化数据体系。
S2、对报表类数据进行处理,转换形成事务数据集。处理流程:
S2.1、数据归一化:
将含义相同但由于某些原因表述不同的项目统一成相同的描述语言,提高算法计算效率。如,“电网故障”和“电网性故障”统一成“电网故障”,“过负荷”和“过载”统一成“过负荷”,“0.4kV”和“380V”统一成“0.4kV”。
S2.2、提取描述性语言的关键词:
现有技术手段无法对于描述性的语言进行分析,所以对于“故障描述”等填写主观性较强、规范性较低的项目,需要提取能够表征该项目描述的关键词,将关键词作为事务数据进行关联性分析。如“欠费停电,客户已付”提取关键词“欠费停电”,“【设备故障】客户报修此处电表内总闸跳闸,请处理。”提取关键词“设备故障”、“跳闸”,“【电能质量】客户报修一户电压低,电器无法正常使用,请处理。”提取关键词“电能质量”、“电压问题”、“电器无法使用”。
S2.3、去除无用项和重复项:
将实际填写中重复的项目或者对于记录无实际区分作用的项目删除,如项目“故障类型”,在实际填写中均填写的“非外损因素”或空,可以去除该项,避免关联计算时数据维度过高,影响计算效率。
S2.4、形成事务数据集:
按照上述原则,将每条记录中的数据进行整理后,每个数据项的集合形成事务全集I={i1,i2,...ik,...},其中ik为某项事务。
对每条记录即形成一个事务数据集tk={i1,i2,...ik,...},每个tk包含了若干个ik,将所有报表记录作为事务数据集的集合T={t1,t2,...tk,...},对事务数据集集合T进行关联分析,即可得到T中各事务ik之间或事务集X={i1,i2,...ik,...}(X是某些ik的集合)与事务集Y={i1,i2,...ik,...}(X是另一些ik的集合)之间的关联关系,并得到这些关联关系的支持度和置信度。
S3、对时序类数据进行处理,转换形成事务数据集。处理流程:
S3.1、数据频度设置:
数据设置频度需考虑时序数据频度、事件指标频度及实际计算能力。每个时间断面即会生成一个事务数据集,所以如果分析的数据频度过高,将会产生较多的事务数据集,如果分析的时序数据持续时间较长,将会产生高维数据矩阵,对计算机计算能力将会提出很高的要求。
建议可设置15分钟/断面或1小时/断面的频度,可以最大程度保留时序运行数据特性的同时分析关联特性。
S3.2、连续时序数据事务离散化:
将连续的时序数据离散化,如当在时间t1时,馈线电流I在0≤I<1A范围内时,设置为事务I0,在1≤I<2A时,设置为事务I1,在2≤I<3A时,设置为事务I2…以此类推,将连续的馈线时序电流离散化。离散化的区间长度设置可根据具体时序数据的数值范围确定。
在初步计算时,可将离散化区间长度设置的长,使得对应事务数量减少,降低事务数据集维度,从而降低计算量。当确定了关联签订较强的事务后,如I2,再将该区间继续分割离散化进行关联分析,从而确定更小的事务数据范围,提高精度。
S3.3、时序数据特征离散化:
时序数据的特征除了时序数据本身值外,主要包括时序数据的变化趋势,如增加趋势或减小趋势。除了设置时序数据本身值作为事务外,还可以将时序数据的变化趋势设置为事务。
如在t2时刻时,馈线电流I在2≤I<3A,设置时序值事务为I2,若馈线电流相对t1时刻时是上升的,可设置时序特征事务为Iup;若馈线电流相对t1时刻时是下降的,可设置时序特征事务为Idown;若馈线电流相对t1时刻时是不变的,可设置时序特征事务为Iflat。即在每个时刻t,馈线电流将设置两个事务,其中Ik表征时序值本身,Iup或Idown或Iflat表示时序值变化趋势。
通过上述事务设置,可在事务数据集中表征时序数据值本身和一次变化特征。若需要分析时序值的二次变化特征或其他变化特征,可按照上述原则进行设置。
S3.4、事件事务设置:
对于断电、线路故障等这些突发性非时序事件,同样需要设置事务项。
如当在tk时刻发生线路故障,可设置线路故障为事务Break,并可在t(k-1)时刻设置事务Break(former),在t(k+1)时刻设置事务Break(after)。
通过上述事务设置,可在事务数据集重表征线路故障等突发性非时序事件的发生趋势,通过与时序数据的变化趋势关联,可分析线路故障等突发性非时序事件发生时时序数据的变化趋势。
S3.5、形成事务数据集
对于时序事件数据,将系统运行数据与系统突发性非时序事件按照上述原则,每个时刻tk,形成一个事务数据集tk={i1,i2,...ik,...},,对事务数据集集合T进行关联分析,即可得到T中各事务ik之间或事务集X={i1,i2,...ik,...}(X是某些ik的集合)与事务集Y={i1,i2,...ik,...}(X是另一些ik的集合)之间的关联关系,即可得到时序运行数据与系统故障的突发性非时序事件的关联。
S4、采用Apriori关联算法对形成的事务数据集合进行关联分析,处理流程:
S4.1、找出所有的频繁项集(支持度必须大于等于给定的最小支持度阈值),在这个过程中连接步和剪枝步互相融合,最终得到最大的频繁项集Lk。
连接步:连接步的目的是找到K项集。对给定的最小支持度阈值,分别对1项候选集i1,剔除小于该阈值的项集得到1项频繁项集L1;下一步由L1自身连接产生两项候选集i2,保留i2中满足约束条件的项集得到两项频繁集,记为L2;再下一步由L2与L1连接产生三项候选集i3,保留i3中满足约束条件的项集得到三项频繁集,记为L3,等等。这样循环下去,得到最大频繁项集Lk。
剪枝步:剪枝步紧接着连接步,在产生候选项ik的过程中启到减小搜索空间的目的。由于ik是Lk-1与L1连接产生的,根据Apriori的性质频繁项集的所有非空子集也必须是频繁项集,所以不满足该性质的项集将不会存在于ik中,该过程就是剪枝。
S4.2、由频繁项集产生强关联规则:在S4.1可知未超过预定的最小支持度阈值的项集已被剔除,如果剩下这些规则又满足了预定的最小置信度阈值,那么就挖掘出了强关联规则。
根据挖掘得到的强关联规则即可分析配电网各时间、时序数据、运行指标等相互之间的关联关系,为提高配网运行指标提出指导。
本发明还公开了一种适用于上述配电网运行数据事件关联分析方法的分析系统,该系统包含:数据库模块、连接数据库模块的报表数据处理模块和时序数据处理模块、连接报表数据处理模块和时序数据处理模块输出的分析模块。
数据库模块用于接收配用电信息系统的数据信息,构建配电网运行数据及运行事件数据库;
报表数据处理模块用于对数据库中的报表类数据进行处理,将形成配电网运行因素、运行事件集;
时序数据处理模块用于对数据库中的时序类数据进行处理,将形成配电网运行因素、运行事件集;
分析模块用于采用Apriori算法对形成的配电网运行因素、运行事件集进行分析,形成关联事务关系集。
通过本发明,将Apriori关联算法运用到配电网运行海量数据(包括报表类数据和时序运行类数据)中进行分析,可以得到电网运行各因素、事件之间的关联关系及关联强弱。并且对报表类数据、时序运行类数据的形成事务数据的处理方法,保留了配网运行要素,同时还保留了时序运行类数据的时序变化趋势特征。
尽管本发明的内容已经通过上述优选实施例作了详细介绍,但应当认识到上述的描述不应被认为是对本发明的限制。在本领域技术人员阅读了上述内容后,对于本发明的多种修改和替代都将是显而易见的。因此,本发明的保护范围应由所附的权利要求来限定。
Claims (8)
1.一种配电网运行数据事件关联分析方法,其特征在于,该方法包含:
将配用电信息系统的数据信息输入数据库,构建配电网运行数据及运行事件数据库;
对数据库中的报表类数据进行处理,将形成配电网运行因素、运行事件集;
对数据库中的时序类数据进行处理,将形成配电网运行因素、运行事件集;
采用Apriori算法对形成的配电网运行因素、运行事件集进行分析,形成关联事务关系集。
2.如权利要求1所述的配电网运行数据事件关联分析方法,其特征在于,所述将配用电信息系统的数据信息输入数据库,构建配电网运行数据及运行事件数据库的方法包含:
通过人工输入或经接口实时互联来获取配电网运行时序数据及报表类运行数据;
根据配电网关联事件分析需求,对所有数据进行筛选,并根据每种配电网运行信息的层级和类型构建用户关联分析的数据体系。
3.如权利要求1所述的配电网运行数据事件关联分析方法,其特征在于,所述对数据库中的报表类数据进行处理,将形成配电网运行因素、运行事件集的方法包含:
数据归一化,将含义相同但由于某些原因表述不同的项目统一成相同的描述语言;
提取描述性语言的关键词:将“故障描述”等描述类数据,根据实际需要提取能够表征该项目描述的关键词,将关键词作为事务数据进行关联性分析;
去除无用项和重复项:将数据中重复的项目或者对于记录无实际区分作用的项目删除;
形成事务数据集,将报表类数据中的记录数据进行整理后,每个数据项的集合形成事务全集,报表中的每条记录是一个数据事务集。
4.如权利要求1所述的配电网运行数据事件关联分析方法,其特征在于,所述对数据库中的时序类数据进行处理,将形成配电网运行因素、运行事件集的方法包含:
数据频度设置,按照实际计算机能力和分析频度需求,设置所分析的时序数据的数据频度;
连续时序数据事务离散化;
时序数据特征离散化;
事件事务设置:将断电、线路故障等这些突发性非时序事件,设置成事务项;
形成事务数据集,将时序类数据中的记录数据进行整理后,每个数据项的集合形成事务全集,报表中的每条记录是一个数据事务集。
5.如权利要求4所述的配电网运行数据事件关联分析方法,其特征在于,所述连续时序数据事务离散化包含:
如当在时间t1时,馈线电流I在0≤I<1A范围内时,设置为事务I0,在1≤I<2A时,设置为事务I1,在2≤I<3A时,设置为事务I2…以此类推,将连续的馈线时序电流离散化;其中离散化的区间长度设置可根据具体时序数据的数值范围确定。
6.如权利要求4所述的配电网运行数据事件关联分析方法,其特征在于,所述时序数据特征离散化包含:
将时序数据的变化趋势设置为事务,如在t2时刻时,馈线电流I在2≤I<3A,设置时序值事务为I2,若馈线电流相对t1时刻时是上升的,可设置时序特征事务为Iup;若馈线电流相对t1时刻时是下降的,可设置时序特征事务为Idown;若馈线电流相对t1时刻时是不变的,可设置时序特征事务为Iflat;即在每个时刻t,馈线电流将设置两个事务,其中Ik表征时序值本身,Iup或Idown或Iflat表示时序值变化趋势。
7.如权利要求1所述的配电网运行数据事件关联分析方法,其特征在于,所述采用Apriori算法对形成的配电网运行因素、运行事件集进行分析,形成关联事务关系集包含:
设定合理的最小置信度阈值和支持度阈值,运用Apriori算法对配电网运行各因素和事件进行关联规则挖掘,找出所有的频繁项集,产生强关联规则,形成关联事务关系集。
8.一种配电网运行数据事件关联分析系统,其特征在于,该系统包含:
数据库模块,其接收配用电信息系统的数据信息,构建配电网运行数据及运行事件数据库;
报表数据处理模块,其连接数据库模块,对数据库中的报表类数据进行处理,将形成配电网运行因素、运行事件集;
时序数据处理模块,其连接数据库模块,对数据库中的时序类数据进行处理,将形成配电网运行因素、运行事件集;
分析模块,其采用Apriori算法对形成的配电网运行因素、运行事件集进行分析,形成关联事务关系集。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710972284.4A CN107704610A (zh) | 2017-10-18 | 2017-10-18 | 一种配电网运行数据事件关联分析系统及分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710972284.4A CN107704610A (zh) | 2017-10-18 | 2017-10-18 | 一种配电网运行数据事件关联分析系统及分析方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107704610A true CN107704610A (zh) | 2018-02-16 |
Family
ID=61181602
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710972284.4A Pending CN107704610A (zh) | 2017-10-18 | 2017-10-18 | 一种配电网运行数据事件关联分析系统及分析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107704610A (zh) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108510201A (zh) * | 2018-04-08 | 2018-09-07 | 上海金智晟东电力科技有限公司 | 建立配网自动化遥控指标的数据挖掘框架算法 |
CN108763816A (zh) * | 2018-06-11 | 2018-11-06 | 辽宁工业大学 | 一种基于关联分析的建筑安全检测方法 |
CN109034604A (zh) * | 2018-07-23 | 2018-12-18 | 长沙理工大学 | 一种考虑设备状态与气温的配网故障关联规则分析方法 |
CN109359693A (zh) * | 2018-10-24 | 2019-02-19 | 国网上海市电力公司 | 一种电能质量扰动分类方法 |
CN110838344A (zh) * | 2019-11-08 | 2020-02-25 | 北京理工大学 | 一种水质数据分析方法 |
CN110941642A (zh) * | 2019-11-20 | 2020-03-31 | 贵州电网有限责任公司电力科学研究院 | 基于Lucene全文检索的配电网数据处理方法、装置 |
CN112347489A (zh) * | 2019-08-08 | 2021-02-09 | 中移(苏州)软件技术有限公司 | 一种数据处理方法、装置及存储介质 |
CN112488871A (zh) * | 2020-10-23 | 2021-03-12 | 广西电网有限责任公司电力科学研究院 | 一种电网原始输入特征冗余数据剔除方法及系统 |
CN112734261A (zh) * | 2021-01-18 | 2021-04-30 | 国网山东省电力公司菏泽供电公司 | 一种配电网运行指标序列关联分析方法及系统 |
CN112801426A (zh) * | 2021-04-06 | 2021-05-14 | 浙江浙能技术研究院有限公司 | 一种基于关联参数挖掘的工业过程故障融合预测方法 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0525408A2 (en) * | 1991-07-01 | 1993-02-03 | Eastman Kodak Company | Method for multiframe Wiener restoration of noisy and blurred image sequences |
CN102722786A (zh) * | 2012-05-28 | 2012-10-10 | 广东电网公司电力调度控制中心 | 电网专业系统的智能调度支持平台 |
CN102938098A (zh) * | 2012-10-15 | 2013-02-20 | 深圳供电局有限公司 | 一种电网运行方式专家系统 |
CN104992239A (zh) * | 2015-06-24 | 2015-10-21 | 国网山东省电力公司电力科学研究院 | 一种基于相关系数的行业用电量规律预测方法 |
CN105225165A (zh) * | 2014-07-02 | 2016-01-06 | 深圳供电局有限公司 | 一种基于Apriori算法的变电站电压暂降特性分析方法 |
CN105303469A (zh) * | 2015-11-25 | 2016-02-03 | 广州供电局有限公司 | 线损异常原因数据挖掘分析的方法与系统 |
CN106019084A (zh) * | 2016-06-16 | 2016-10-12 | 上海交通大学 | 基于配用电数据关联的中压配电网断线故障诊断方法 |
CN106446131A (zh) * | 2016-09-19 | 2017-02-22 | 中国南方电网有限责任公司电网技术研究中心 | 配用电多源异构数据的混合存储方法和系统 |
CN106504116A (zh) * | 2016-10-31 | 2017-03-15 | 山东大学 | 基于电网运行与暂态稳定裕度指标关联的稳定评估方法 |
-
2017
- 2017-10-18 CN CN201710972284.4A patent/CN107704610A/zh active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0525408A2 (en) * | 1991-07-01 | 1993-02-03 | Eastman Kodak Company | Method for multiframe Wiener restoration of noisy and blurred image sequences |
CN102722786A (zh) * | 2012-05-28 | 2012-10-10 | 广东电网公司电力调度控制中心 | 电网专业系统的智能调度支持平台 |
CN102938098A (zh) * | 2012-10-15 | 2013-02-20 | 深圳供电局有限公司 | 一种电网运行方式专家系统 |
CN105225165A (zh) * | 2014-07-02 | 2016-01-06 | 深圳供电局有限公司 | 一种基于Apriori算法的变电站电压暂降特性分析方法 |
CN104992239A (zh) * | 2015-06-24 | 2015-10-21 | 国网山东省电力公司电力科学研究院 | 一种基于相关系数的行业用电量规律预测方法 |
CN105303469A (zh) * | 2015-11-25 | 2016-02-03 | 广州供电局有限公司 | 线损异常原因数据挖掘分析的方法与系统 |
CN106019084A (zh) * | 2016-06-16 | 2016-10-12 | 上海交通大学 | 基于配用电数据关联的中压配电网断线故障诊断方法 |
CN106446131A (zh) * | 2016-09-19 | 2017-02-22 | 中国南方电网有限责任公司电网技术研究中心 | 配用电多源异构数据的混合存储方法和系统 |
CN106504116A (zh) * | 2016-10-31 | 2017-03-15 | 山东大学 | 基于电网运行与暂态稳定裕度指标关联的稳定评估方法 |
Non-Patent Citations (2)
Title |
---|
李廷顺 等: ""基于大数据智能电网关键技术研究"", 《电源技术 研究与设计》 * |
魏三强 等: ""保护隐私的智能电网大数据分析挖掘技术"", 《广西大学学报(自然科学版)》 * |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108510201A (zh) * | 2018-04-08 | 2018-09-07 | 上海金智晟东电力科技有限公司 | 建立配网自动化遥控指标的数据挖掘框架算法 |
CN108510201B (zh) * | 2018-04-08 | 2021-06-08 | 上海金智晟东电力科技有限公司 | 建立配网自动化遥控指标的数据挖掘框架算法 |
CN108763816A (zh) * | 2018-06-11 | 2018-11-06 | 辽宁工业大学 | 一种基于关联分析的建筑安全检测方法 |
CN108763816B (zh) * | 2018-06-11 | 2022-05-06 | 辽宁工业大学 | 一种基于关联分析的建筑安全检测方法 |
CN109034604A (zh) * | 2018-07-23 | 2018-12-18 | 长沙理工大学 | 一种考虑设备状态与气温的配网故障关联规则分析方法 |
CN109359693A (zh) * | 2018-10-24 | 2019-02-19 | 国网上海市电力公司 | 一种电能质量扰动分类方法 |
CN112347489A (zh) * | 2019-08-08 | 2021-02-09 | 中移(苏州)软件技术有限公司 | 一种数据处理方法、装置及存储介质 |
CN112347489B (zh) * | 2019-08-08 | 2023-08-15 | 中移(苏州)软件技术有限公司 | 一种数据处理方法、装置及存储介质 |
CN110838344A (zh) * | 2019-11-08 | 2020-02-25 | 北京理工大学 | 一种水质数据分析方法 |
CN110838344B (zh) * | 2019-11-08 | 2023-04-07 | 北京理工大学 | 一种水质数据分析方法 |
CN110941642A (zh) * | 2019-11-20 | 2020-03-31 | 贵州电网有限责任公司电力科学研究院 | 基于Lucene全文检索的配电网数据处理方法、装置 |
CN112488871A (zh) * | 2020-10-23 | 2021-03-12 | 广西电网有限责任公司电力科学研究院 | 一种电网原始输入特征冗余数据剔除方法及系统 |
CN112734261A (zh) * | 2021-01-18 | 2021-04-30 | 国网山东省电力公司菏泽供电公司 | 一种配电网运行指标序列关联分析方法及系统 |
CN112801426A (zh) * | 2021-04-06 | 2021-05-14 | 浙江浙能技术研究院有限公司 | 一种基于关联参数挖掘的工业过程故障融合预测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107704610A (zh) | 一种配电网运行数据事件关联分析系统及分析方法 | |
CN103400214B (zh) | 基于多维多层关联规则的电压暂降预测分析方法 | |
Rocchetta et al. | A power-flow emulator approach for resilience assessment of repairable power grids subject to weather-induced failures and data deficiency | |
Carreras et al. | Validating OPA with WECC data | |
CN110969347B (zh) | 一种输电网结构形态评估方法 | |
CN104616092B (zh) | 一种基于分布式日志分析的行为模式处理方法 | |
CN106504116A (zh) | 基于电网运行与暂态稳定裕度指标关联的稳定评估方法 | |
CN103488802A (zh) | 一种基于粗糙集关联规则的超高压电网故障规则挖掘方法 | |
CN106019084A (zh) | 基于配用电数据关联的中压配电网断线故障诊断方法 | |
CN105225165A (zh) | 一种基于Apriori算法的变电站电压暂降特性分析方法 | |
CN106446016A (zh) | 一种基于并行关联规则挖掘的配电网运行可靠性预测方法 | |
CN108847686B (zh) | 一种光伏逆变器故障预测方法 | |
CN105184394A (zh) | 基于配电网cps在线数据挖掘的优化控制方法 | |
CN106990325B (zh) | 基于突变逻辑阵的配网小电流接地故障判定方法 | |
CN105023042A (zh) | 基于大数据神经网络算法的用户窃电嫌疑分析装置及方法 | |
CN105303469A (zh) | 线损异常原因数据挖掘分析的方法与系统 | |
CN105914755B (zh) | 电力系统动态无功优化配置方法和系统 | |
Xue et al. | Active learning-based XGBoost for cyber physical system against generic AC false data injection attacks | |
CN103198139A (zh) | 用户电力数据的用能分析方法 | |
CN104463692A (zh) | 考虑实时气象雷暴信息的高压输电线路故障风险排序方法 | |
CN106056466B (zh) | 基于FP-growth算法的大电网关键线路识别方法 | |
CN102709905A (zh) | 一种低压配网供电可靠率自动计算分析装置及方法 | |
CN110244099A (zh) | 基于用户电压的窃电检测方法 | |
CN103077484A (zh) | 基于电网历史信息统计分析的多维度潮流评价指标方法 | |
CN104317794A (zh) | 基于动态项权值的中文特征词关联模式挖掘方法及其系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180216 |