CN110427607A - 一种基于智能机器人的电网事故事件分析方法及系统 - Google Patents
一种基于智能机器人的电网事故事件分析方法及系统 Download PDFInfo
- Publication number
- CN110427607A CN110427607A CN201910499305.4A CN201910499305A CN110427607A CN 110427607 A CN110427607 A CN 110427607A CN 201910499305 A CN201910499305 A CN 201910499305A CN 110427607 A CN110427607 A CN 110427607A
- Authority
- CN
- China
- Prior art keywords
- power grid
- decision tree
- character
- data
- intelligent robot
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 49
- 238000003066 decision tree Methods 0.000 claims abstract description 63
- 238000000034 method Methods 0.000 claims abstract description 40
- 238000012545 processing Methods 0.000 claims abstract description 37
- 230000011218 segmentation Effects 0.000 claims abstract description 32
- 238000010801 machine learning Methods 0.000 claims abstract description 24
- 238000005259 measurement Methods 0.000 claims abstract description 8
- 238000005520 cutting process Methods 0.000 claims description 35
- 238000000605 extraction Methods 0.000 claims description 24
- 150000001875 compounds Chemical class 0.000 claims description 7
- 230000005540 biological transmission Effects 0.000 claims description 4
- 238000005457 optimization Methods 0.000 claims description 4
- 238000001914 filtration Methods 0.000 abstract description 3
- 230000000875 corresponding effect Effects 0.000 description 15
- 238000010586 diagram Methods 0.000 description 12
- 238000007726 management method Methods 0.000 description 10
- 238000012512 characterization method Methods 0.000 description 8
- 238000004519 manufacturing process Methods 0.000 description 8
- 230000005611 electricity Effects 0.000 description 6
- 238000011161 development Methods 0.000 description 5
- 230000018109 developmental process Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 238000012549 training Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 241001269238 Data Species 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000007476 Maximum Likelihood Methods 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 238000003912 environmental pollution Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Entrepreneurship & Innovation (AREA)
- Health & Medical Sciences (AREA)
- Marketing (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Development Economics (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Educational Administration (AREA)
- Water Supply & Treatment (AREA)
- Game Theory and Decision Science (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Public Health (AREA)
- Primary Health Care (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开的一种基于智能机器人的电网事故事件分析方法及系统,分析方法包括:S101、通过广域测量系统采集电网设备实时运行数据,过滤无效数据,提取有效数据形成数据样本;S102、将采集到的数据发送至调度中心;S103、将采集到的数据通过分词算法、机器学习算法分析处理后发送至智能机器人执行相应操作,同时发送至显示单元;S104、将接收到的数据信息进行显示;通过对机器学习原理的解析和应用,特别是决策树算法跟电网事故事件回溯的结合应用,大大的提高了电网事故事件回溯效率性、客观性和可靠性,从而提高事故事件处置效率和减少后续风险发生可能性。
Description
技术领域
本发明属于电网事故事件分析的技术领域,具体涉及一种基于智能机器人的电网事故事件分析方法及系统。
背景技术
我国在21世纪迅猛发展的同时也造成了许多资源匮乏和环境污染问题,在这种压力和形势下,我国电网的制度化改革和智能化的推进也迫在眉睫。不断的引入先进技术和智能化设备,大大增强了我国电网的智能化推进和制度化改革。然而,由于我国电网智能化发展起步较晚,经验缺乏以及相应的制度法律法规不完善,导致我国电网智能化的推进受到极大的阻碍。因此,必须采取相应针对性措施提高电网智能化的调度管理的水平。
我国在智能化电网信息管理上有着明显的管理缺陷,一方面,各部门之间的计算机系统软件不同造成信息管理时的沟通不便,导致信息管理效果直线下降。另一方面,信息管理制度不完善,缺乏统一规划,而且管理者管理意识和责任意识淡薄,执行力度不够大,最终导致信息管理工作质量低下,阻碍智能化电网的推进。另外,信息孤岛现象在我国的电力行业中较为普遍。目前我国在电网调度工作中,还有很多部门之间由于种种原因信息的交流传递并没有通过计算机网络技术来进行,甚至还存在“信息孤岛”的现象,这样严重影响了电网调度工作的效率与协调性,不利于智能电网的推行。
发明内容
本发明克服现有技术存在的不足,所要解决的技术问题为:提供一种能够提高电网事故事件回溯效率,且基于智能机器人的电网事故事件分析方法及系统。
为了解决上述技术问题,本发明采用的技术方案为:一种基于智能机器人的电网事故事件分析方法,包括:S101、通过广域测量系统采集电网设备实时运行数据,过滤无效数据,提取有效数据形成运行文本数据;S102、将采集到的运行文本数据发送至调度中心;S103、调度中心将采集到的运行文本数据通过分词算法、机器学习算法分析处理后发送至智能机器人执行相应操作,同时发送至显示单元;S104、将接收到的数据信息进行显示。
优选地,所述调度中心将采集到的运行文本数据通过分词算法、机器学习算法分析处理后发送至智能机器人执行相应操作,同时发送至显示单元,具体包括:将采集到的运行文本数据通过分词算法进行分词解析,生成切词字典;将分词算法处理后的运行文本数据通过机器学习算法中的决策树算法构建决策树。
优选地,所述将采集到的运行文本数据通过分词算法进行分词解析,生成切词字典,具体包括:加载运行文本数据中的相关字符,形成切词字典等待调用;识别每个字符的字符类型,将全角字符转化为半角字符,将大写字符转化为小写字符;对每个交叉集合的字符进行歧义消解,输出最优结果;处理遗漏的中文字符和中文数量词。
优选地,所述将分词算法处理后的运行文本数据通过机器学习算法中的决策树算法构建决策树,具体包括:提取部分切词字典;根据提取的切词字典,经决策树算法构建决策树。
优选地,所述根据提取的切词字典,经决策树算法构建决策树,具体包括:根据提取的切词字典确定影响电网事故结果的条件熵和条件经验熵;根据条件熵与条件经验熵的计算差值确定影响电网事故结果的信息增益;选择信息增益的最大值作为决策树结点的特征,由该特征的不同取值建立决策树的子节点,再对子结点进行信息增益的确定,从而构建决策树。
相应地,一种基于智能机器人的电网事故事件分析系统,其特征在于:包括:数据采集单元:用于通过广域测量系统采集电网设备实时运行数据,过滤无效数据,提取有效数据形成运行文本数据;传输单元:用于将采集到的运行文本数据发送至调度中心;处理单元:调度中心将采集到的运行文本数据通过分词算法、机器学习算法分析处理后发送至智能机器人执行相应操作,同时发送至显示单元;显示单元:用于将接收到的数据信息进行显示。
优选地,所述处理单元包括:第一处理单元:用于将采集到的运行文本数据通过分词算法进行分词解析,生成切词字典;第二处理单元:用于将分词算法处理后的运行文本数据通过机器学习算法中的决策树算法构建决策树。
优选地,所述第一处理单元包括:词典加载单元:用于加载运行文本数据中的相关字符,形成切词字典等待调用;预处理单元:用于识别每个字符的字符类型,将全角字符转化为半角字符,将大写字符转化为小写字符;歧义处理单元:用于对每个交叉集合的字符进行歧义消解,输出最优结果;优化单元:用于处理遗漏的中文字符和中文数量词。
优选地,所述第二处理单元包括:提取单元:用于提取部分切词字典;生成单元:根据提取的切词字典,经决策树算法构建决策树。
优选地,所述生成单元具体包括:第一确定单元:根据提取的切词字典确定影响电网事故结果的条件熵和条件经验熵;第二确定单元:根据条件熵与条件经验熵的计算差值确定影响电网事故结果的信息增益;选择单元:用于选择信息增益的最大值作为决策树结点的特征,由该特征的不同取值建立决策树的子节点,再对子结点进行信息增益的确定,从而构建决策树。
本发明与现有技术相比具有以下有益效果:
本发明提供的一种基于智能机器人的电网事故事件分析方法及系统,通过广域测量系统采集电网设备实时运行数据,过滤无效数据,提取有效数据形成运行文本数据,将采集到的运行文本数据发送至调度中心,调度中心通过分词算法、机器学习算法分析处理后发送至智能机器人执行相应操作,并发送至显示单元进行显示;随着我国电网未来发展的大趋势及先进技术和设备的支持下,能够在提高双向输电能力的同时,提高整个电力系统的效率和质量,它对电网的调度管理也有着更高、更精准的要求,通过对机器学习原理的解析和应用,特别是决策树算法跟电网事故事件回溯的结合应用,大大的提高了电网事故事件回溯效率性、客观性和可靠性,从而提高事故事件处置效率和减少后续风险发生可能性,随着包括智能机器人在内的高级应用软件的不断发展和进步,智能调度水平也将不断得到提高,最终实现智能电网的宏伟蓝图。
附图说明
下面结合附图对本发明做进一步详细的说明;
图1为本发明实施例一提供的一种基于智能机器人的电网事故事件分析方法的流程示意图;
图2为本发明实施例一提供的一种基于智能机器人的电网事故事件分析系统的结构示意图;
图3为本发明实施例二提供的一种基于智能机器人的电网事故事件分析系统的结构示意图;
图4为本发明实施例三提供的一种基于智能机器人的电网事故事件分析系统的结构示意图;
图5为本发明实施例四提供的一种基于智能机器人的电网事故事件分析系统的结构示意图;
图6为本发明实施例五提供的一种基于智能机器人的电网事故事件分析系统的结构示意图;
其中:101为数据采集单元,102为传输单元,103为处理单元,1031为第一处理单元,1032为第二处理单元,1033为词典加载单元,1034为预处理单元,1035为歧义处理单元,1036为优化单元,1037为提取单元,1038为生成单元,10381为第一确定单元,10382为第二确定单元,10383为选择单元,104为显示单元。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例;基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明实施例一提供的一种基于智能机器人的电网事故事件分析方法的流程示意图,如图1所示,一种基于智能机器人的电网事故事件分析方法,包括:
S101、通过广域测量系统采集电网设备实时运行数据,过滤无效数据,提取有效数据形成运行文本数据;
S102、将采集到的运行文本数据发送至调度中心;
S103、调度中心将采集到的运行文本数据通过分词算法、机器学习算法分析处理后发送至智能机器人执行相应操作,同时发送至显示单元;
S104、将接收到的数据信息进行显示。
进一步地,所述调度中心将采集到的运行文本数据通过分词算法、机器学习算法分析处理后发送至智能机器人执行相应操作,同时发送至显示单元,具体包括:将采集到的运行文本数据通过分词算法进行分词解析,生成切词字典;将分词算法处理后的运行文本数据通过机器学习算法中的决策树算法构建决策树。
进一步地,所述将采集到的运行文本数据通过分词算法进行分词解析,生成切词字典,具体包括:
加载运行文本数据中的相关字符,形成切词字典等待调用;识别每个字符的字符类型,将全角字符转化为半角字符,将大写字符转化为小写字符;对每个交叉集合的字符进行歧义消解,输出最优结果;处理遗漏的中文字符和中文数量词。
进一步地,所述将分词算法处理后的运行文本数据通过机器学习算法中的决策树算法构建决策树,具体包括:提取部分切词字典;根据提取的切词字典,经决策树算法构建决策树。
进一步地,所述根据提取的切词字典,经决策树算法构建决策树,具体包括:根据提取的切词字典确定影响电网事故结果的条件熵和条件经验熵;根据条件熵与条件经验熵的计算差值确定影响电网事故结果的信息增益;选择信息增益的最大值作为决策树结点的特征,由该特征的不同取值建立决策树的子节点,再对子结点进行信息增益的确定,从而构建决策树。
图2为本发明实施例一提供的一种基于智能机器人的电网事故事件分析系统的结构示意图,如图2所示,一种基于智能机器人的电网事故事件分析系统,包括:
数据采集单元101:用于通过广域测量系统采集电网设备实时运行数据,过滤无效数据,提取有效数据形成运行文本数据;
传输单元102:用于将采集到的运行文本数据发送至调度中心;
处理单元103:调度中心将采集到的运行文本数据通过分词算法、机器学习算法分析处理后发送至智能机器人执行相应操作,同时发送至显示单元;
显示单元104:用于将接收到的数据信息进行显示。
具体地,通过广域测量系统采集电网设备实时运行数据,过滤无效数据,提取有效数据形成运行文本数据,并发送至调度中心,调度中心经分词算法、机器学习算法分析处理后发送至智能机器人执行相应操作,同时发送至显示单元,使调度员容易监控的全方位信息,智能机器人可以完全处理正常的调度检修业务,并自动完成系统的电压、频率调节。
图3为本发明实施例二提供的一种基于智能机器人的电网事故事件分析系统的结构示意图,如图3所示,在实施例一基础上,所述处理单元103包括:
第一处理单元1031:用于将采集到的运行文本数据通过分词算法进行分词解析,生成切词字典;本实施例采用IKAnalyzer分词器对电网事故事件中的运行文档进行分词解析;IKAnalyzer分词器包括三个分词器:字符分词器、中文数量词分词器和中日韩文分词器,每种分词器分词有两种模式,即:smart模式和非smart模式,非smart模式可以认为是最小力度的分词,smart模式为力度最大的分词。
第二处理单元1032:用于将分词算法处理后的运行文本数据通过机器学习算法中的决策树算法构建决策树。
图4为本发明实施例三提供的一种基于智能机器人的电网事故事件分析系统的结构示意图,如图4所示,在实施例二基础上,所述第一处理单元1031包括:
词典加载单元1033:用于加载运行文本数据中的相关字符,形成切词字典等待调用;具体地,将运行文本数据中的字符通过前缀字符逐一比较对方式,快速查找词,形成字典树,也称为前缀树,字典树为一种结构简单的树型结构,通过字典树构建词典。
预处理单元1034:用于识别每个字符的字符类型,将全角字符转化为半角字符,将大写字符转化为小写字符;具体地,字符类型是在分词的时候需要,不同的分词器会根据不同的字符类型做特别处理,而字符转化则是要求文本字符与词典中的字符想匹配,比如对于12288、32这两个字符,分别是汉字和英文的空格,如果一篇文档中包含了汉字、英文这两个字符,那么分词器在分词的时候需要判断两个都是空格,同理在英文大小写上也存在类似的问题。
歧义处理单元1035:用于对每个交叉集合的字符进行歧义消解,输出最优结果;
具体地,当通过以上三个分词器将短语分词之后,会产生许多短的词语,即IK词元对象Lexeme,此时需要根据不同的策略输出最终的分词结果,目前IK支持两种策略:尽可能多的词语和尽可能少的词语,且词语之间不会出现交叉;当采用尽可能多的词语进行分词时,不会做任何处理,会把所有的分词结果都作为最后的分词结果输出;当采用尽可能少的词语进行分词时,会针对每个交叉集合进行歧义处理,输出最优结果;输出字符按以下原则进行排序:1、优先输出有效文本长度长的;2、优先输出词元个数小的;3、优先输出跨度大的;4、优先输出位置越靠后的,根据统计学结论,逆向切分概率高于正向切分,因此位置越靠后的优先;5、优先输出词长平均的;6、计算词元位置的权重,优先输出最大非交叉集合。
优化单元1036:用于处理遗漏的中文字符和中文数量词;具体地,遍历输入文本,把词之间每个中文字符也作为词输出,虽然词典中没有这样的词;如果中文量词刚好出现在中文数词的后面,或者中文量词刚好出现在阿拉伯数字的后面,则把数词和量词合并,比如“九寸”“十二亩”。
图5为本发明实施例四提供的一种基于智能机器人的电网事故事件分析系统的结构示意图,如图5所示,在实施例三基础上,所述第二处理单元(1032)包括:
提取单元1037:用于提取部分切词字典;
生成单元1038:根据提取的切词字典,经决策树算法构建决策树。
具体地,提取需要分析的切词字典后,将切词进行分类,并选取对构建决策树具有分类能力的特征,特征选择就是决定用哪个特征来划分特征空间,比如通过分析得到两个特征影响一个系统运行事故的发生,则分别由两个不同特征的根结点构成决策树。
图6为本发明实施例五提供的一种基于智能机器人的电网事故事件分析系统的结构示意图,如图6所示,在实施例四基础上,所述生成单元1038具体包括:
第一确定单元10381:根据提取的切词字典确定影响电网事故结果的条件熵和条件经验熵;
第二确定单元10382:根据条件熵与条件经验熵的计算差值确定影响电网事故结果的信息增益;
选择单元10383:用于选择信息增益的最大值作为决策树结点的特征,由该特征的不同取值建立决策树的子节点,再对子结点进行信息增益的确定,从而构建决策树。
具体地,条件熵H(Y|X)表示在已知随机变量X的条件下随机变量Y的不确定性;随机变量X给定的条件下随机变量Y的条件熵H(Y|X),定义为X给定条件下Y的条件概率分布的熵对X的数学期望:
pi=P(X=xi),i=1,2,…n (2)
式(1)中,n是分类的数目,熵越大,随机变量的不确定性就越大。
同理,当条件熵中的概率由数据估计(特别是极大似然估计)得到时,所对应的条件熵成为条件经验熵;所以,特征A对训练数据集D的信息增益g(D,A),定义为集合D的经验熵H(D)与特征A给定条件下D的经验条件熵H(D|A)之差,即:
g(D,A)=H(D)-H(D|A) (3)
熵H(D)与条件熵H(D|A)之差成为互信息,决策树学习中的信息增益等价于训练数据集中类与特征的互信息。
举例说明,设特征A有n个不同的取值{a1,a2,…,an,},根据特征A的取值将D划分为n个子集{D1,D2,…,Dn,},|Di|为Di的样本个数,记子集Di中属于Ck的样本的集合为|Dik|,即|Dik|=Di∩Ck,|Dik|为Dik的样本个数,于是经验条件熵的公式可以些为:
举例说明,以事故事件样本数据为例进行说明,特征A1为设备厂家,特征A2为是否下雨,特征A3为操作人员是否为新手,特征A4为是设备投产时间,设设备厂家是A厂家、B厂家和C厂家分别有5个
设A厂家中特征下雨数据有2个,未下雨数据有3个,特征操作人员为新手数据有1个,操作人员不是新手数据为4个,特征设备投产时间5年以内数据有3个,特征设备投产时间5~10年数据有2个,特征发生事故数据有2个,未发生事故数据有3个;
设B厂家中特征下雨数据有1个,未下雨数据有4个,特征操作人员为新手数据有3个,操作人员不是新手数据为2个,特征设备投产时间5年以内数据有1个,特征设备投产时间5~10年数据有2个,特征设备投产时间10年以上数据有2个,特征发生事故数据有3个,未发生事故数据有2个;
设C厂家中特征下雨数据有2个,未下雨数据有3个,特征操作人员为新手数据有2个,操作人员不是新手数据为3个,特征设备投产时间5年以内数据有1个,特征设备投产时间5~10年数据有2个,特征设备投产时间10年以上数据有2个,特征发生事故数据有4个,未发生事故数据有1个;
因此,设备厂家是A厂家的数据在训练数据集出现的概率是十五分之五,也就是三分之一,设备厂家是A厂家的数据的最终发生事故的概率为五分之二,因为在五个数据中,只有两个数据显示发生事故,同理,设备厂家是B厂家和C厂家的数据在训练数据集出现的概率也都是三分之一,设备厂家是B厂家发生事故的概率为五分之三,B厂家发生事故的概率为五分之四。
所以计算各特征的信息增益,过程如下:
式(5)为特征设备厂家的信息增益,式(6)为特征是否下雨的信息增益,式(7)为特征操作人员是否为新手的信息增益,式(8)为设备投产时间的信息增益,H(D)为训练数据集D的经验熵,其中,根据上述假设值可知,在15个数据中,9个数据的结果为发生事故,6个数据的结果为没有发生事故,所以数据集D的经验熵H(D)为:
最后,比较特征的信息增益,由于特征A3(操作人员是否新手)的信息增益值最大,所以选择特征A3操作人员是否为新手作为最优特征,也为根结点的特征,根据特征A3操作人员是否为新手,将训练集D划分为两个子集D1(A3取值为“是”)和D2(A3取值为“否”),由于D1只有同一类的样本点,所以它成为一个叶结点,结点的类标记为“是”。
对D2则需要从特征A1(设备厂家),A2(是否下雨)和A4(设备投产时间)中选择新的特征,计算各个特征的信息增益:
g(D2,A1)=H(D2)-H(D2|A1)=0.251 (10)
g(D2,A2)=H(D2)-H(D2|A2)=0.918 (11)
g(D2,A3)=H(D2)-H(D2|A3)=0.474 (12)
根据计算,选择信息增益最大的特征A2(是否下雨)作为结点的特征,由于A2有两个可能取值,从这一结点引出两个子结点:一个对应“是”(下雨)的子结点,包含3个样本,它们属于同一类,所以这是一个叶结点,类标记为“是”;另一个是对应“否”(没有下雨)的子结点,包含6个样本,它们也属于同一类,所以这也是一个叶结点,类标记为“否”,根据此方法,从根结点开始,对结点计算所有可能的特征的信息增益,选择信息增益最大的特征作为结点的特征,由该特征的不同取值建立子节点;再对子结点递归地调用以上方法,构建决策树;直到所有特征的信息增益均很小或没有特征可以选择为止。
本实施例使用ID3算法构建决策树,ID3算法相当于用极大似然法进行概率模型的选择,由此决策树的输出结果通过从历史数据信息层面的机器学习运行算出可能影响某省电网事故事件的因素,为事故事件的回溯和预估提供重要支撑依据。
构建决策树的算法还包括C4.5算法和CART算法,在此不再赘述。
本发明提供的一种基于智能机器人的电网事故事件分析方法及系统,随着我国电网未来发展的大趋势及先进技术和设备的支持下,能够在提高双向输电能力的同时,提高整个电力系统的效率和质量,它对电网的调度管理也有着更高、更精准的要求,通过对机器学习原理的解析和应用,特别是决策树算法跟电网事故事件回溯的结合应用,大大的提高了电网事故事件回溯效率性、客观性和可靠性,从而提高事故事件处置效率和减少后续风险发生可能性,随着包括智能机器人在内的高级应用软件的不断发展和进步,智能调度水平也将不断得到提高,最终实现智能电网的宏伟蓝图。
在本说明书的描述中,参考术语“一个实施例”、“一部分实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
可以理解的是,上述方法、装置及系统中的相关特征可以相互参考。另外,上述实施例中的“第一”、“第二”等是用于区分各实施例,而并不代表各实施例的优劣。
所述领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在此提供的算法和显示不与任何特定计算机、虚拟系统或者其他设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类装置所要求的结构是显而易见的。此外,本发明也不针对任何特定的编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在本申请所提供的实施例中,应该理解到,所揭露的系统和方法,可以通过其它的方式实现。以上所描述的系统实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
Claims (10)
1.一种基于智能机器人的电网事故事件分析方法,其特征在于:包括:
S101、通过广域测量系统采集电网设备实时运行数据,过滤无效数据,提取有效数据形成运行文本数据;
S102、将采集到的运行文本数据发送至调度中心;
S103、调度中心将采集到的运行文本数据通过分词算法、机器学习算法分析处理后发送至智能机器人执行相应操作,同时发送至显示单元;
S104、将接收到的数据信息进行显示。
2.根据权利要求1所述的一种基于智能机器人的电网事故事件分析方法,其特征在于:所述调度中心将采集到的运行文本数据通过分词算法、机器学习算法分析处理后发送至智能机器人执行相应操作,同时发送至显示单元,具体包括:
将采集到的运行文本数据通过分词算法进行分词解析,生成切词字典;
将分词算法处理后的运行文本数据通过机器学习算法中的决策树算法构建决策树。
3.根据权利要求2所述的一种基于智能机器人的电网事故事件分析方法,其特征在于:所述将采集到的运行文本数据通过分词算法进行分词解析,生成切词字典,具体包括:
加载运行文本数据中的相关字符,形成切词字典等待调用;
识别每个字符的字符类型,将全角字符转化为半角字符,将大写字符转化为小写字符;
对每个交叉集合的字符进行歧义消解,输出最优结果;
处理遗漏的中文字符和中文数量词。
4.根据权利要求2所述的一种基于智能机器人的电网事故事件分析方法,其特征在于:所述将分词算法处理后的运行文本数据通过机器学习算法中的决策树算法构建决策树,具体包括:
提取部分切词字典;
根据提取的切词字典,经决策树算法构建决策树。
5.根据权利要求4所述的一种基于智能机器人的电网事故事件分析方法,其特征在于:所述根据提取的切词字典,经决策树算法构建决策树,具体包括:
根据提取的切词字典确定影响电网事故结果的条件熵和条件经验熵;
根据条件熵与条件经验熵的计算差值确定影响电网事故结果的信息增益;
选择信息增益的最大值作为决策树结点的特征,由该特征的不同取值建立决策树的子节点,再对子结点进行信息增益的确定,从而构建决策树。
6.一种基于智能机器人的电网事故事件分析系统,其特征在于:包括:
数据采集单元(101):用于通过广域测量系统采集电网设备实时运行数据,过滤无效数据,提取有效数据形成运行文本数据;
传输单元(102):用于将采集到的运行文本数据发送至调度中心;
处理单元(103):调度中心将采集到的运行文本数据通过分词算法、机器学习算法分析处理后发送至智能机器人执行相应操作,同时发送至显示单元;
显示单元(104):用于将接收到的数据信息进行显示。
7.根据权利要求6所述的一种基于智能机器人的电网事故事件分析系统,其特征在于:所述处理单元(103)包括:
第一处理单元(1031):用于将采集到的运行文本数据通过分词算法进行分词解析,生成切词字典;
第二处理单元(1032):用于将分词算法处理后的运行文本数据通过机器学习算法中的决策树算法构建决策树。
8.根据权利要求7所述的一种基于智能机器人的电网事故事件分析系统,其特征在于:所述第一处理单元(1031)包括:
词典加载单元(1033):用于加载运行文本数据中的相关字符,形成切词字典等待调用;
预处理单元(1034):用于识别每个字符的字符类型,将全角字符转化为半角字符,将大写字符转化为小写字符;
歧义处理单元(1035):用于对每个交叉集合的字符进行歧义消解,输出最优结果;
优化单元(1036):用于处理遗漏的中文字符和中文数量词。
9.根据权利要求7所述的一种基于智能机器人的电网事故事件分析系统,其特征在于:所述第二处理单元(1032)包括:
提取单元(1037):用于提取部分切词字典;
生成单元(1038):根据提取的切词字典,经决策树算法构建决策树。
10.根据权利要求9所述的一种基于智能机器人的电网事故事件分析系统,其特征在于:所述生成单元(1038)具体包括:
第一确定单元(10381):根据提取的切词字典确定影响电网事故结果的条件熵和条件经验熵;
第二确定单元(10382):根据条件熵与条件经验熵的计算差值确定影响电网事故结果的信息增益;
选择单元(10383):用于选择信息增益的最大值作为决策树结点的特征,由该特征的不同取值建立决策树的子节点,再对子结点进行信息增益的确定,从而构建决策树。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910499305.4A CN110427607A (zh) | 2019-06-11 | 2019-06-11 | 一种基于智能机器人的电网事故事件分析方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910499305.4A CN110427607A (zh) | 2019-06-11 | 2019-06-11 | 一种基于智能机器人的电网事故事件分析方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110427607A true CN110427607A (zh) | 2019-11-08 |
Family
ID=68408561
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910499305.4A Pending CN110427607A (zh) | 2019-06-11 | 2019-06-11 | 一种基于智能机器人的电网事故事件分析方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110427607A (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109634243A (zh) * | 2018-12-27 | 2019-04-16 | 广东电网有限责任公司 | 一种基于智能机器人的调度程序化操作系统 |
CN109684447A (zh) * | 2018-12-13 | 2019-04-26 | 贵州电网有限责任公司 | 一种基于文本挖掘的电网调度运行日志故障信息分析方法 |
CN109726246A (zh) * | 2018-12-13 | 2019-05-07 | 贵州电网有限责任公司 | 一种基于数据挖掘和可视化的电网事故关联原因回溯方法 |
-
2019
- 2019-06-11 CN CN201910499305.4A patent/CN110427607A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109684447A (zh) * | 2018-12-13 | 2019-04-26 | 贵州电网有限责任公司 | 一种基于文本挖掘的电网调度运行日志故障信息分析方法 |
CN109726246A (zh) * | 2018-12-13 | 2019-05-07 | 贵州电网有限责任公司 | 一种基于数据挖掘和可视化的电网事故关联原因回溯方法 |
CN109634243A (zh) * | 2018-12-27 | 2019-04-16 | 广东电网有限责任公司 | 一种基于智能机器人的调度程序化操作系统 |
Non-Patent Citations (1)
Title |
---|
陈恩黔 等: "基于智能机器人的电网事故事件分析方法", 《通讯世界》 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109189901B (zh) | 一种智能客服系统中自动发现新分类以及对应语料的方法 | |
CN109726246A (zh) | 一种基于数据挖掘和可视化的电网事故关联原因回溯方法 | |
CN110837866A (zh) | 基于XGBoost的电力二次设备缺陷程度评估方法 | |
CN107273295B (zh) | 一种基于文本混乱度的软件问题报告分类方法 | |
CN105335752A (zh) | 一种基于主成分分析多变量决策树的接线方式识别方法 | |
CN105574165B (zh) | 一种基于聚类的电网运行监控信息辨识分类方法 | |
CN109614484A (zh) | 一种基于分类效用的文本聚类方法及其系统 | |
CN108876452A (zh) | 用电客户需求信息获取方法、装置以及电子设备 | |
CN112328792A (zh) | 一种基于dbscan聚类算法识别信用事件的优化方法 | |
CN111931031A (zh) | 一种用于政策信息匹配度计算的方法 | |
CN117371933A (zh) | 一种基于物联网的智慧实验室管理系统 | |
CN110717044A (zh) | 一种研报正文的文本分类方法 | |
CN104866606A (zh) | 一种MapReduce并行化大数据文本分类方法 | |
CN115130847A (zh) | 一种设备画像建模方法及系统 | |
CN114491081A (zh) | 基于数据血缘关系图谱的电力数据溯源方法及系统 | |
CN109902173A (zh) | 一种中文文本分类方法 | |
CN103929499A (zh) | 一种物联网异构标识识别方法和系统 | |
CN117544482A (zh) | 基于ai的运维故障确定方法、装置、设备和存储介质 | |
CN117932295A (zh) | 多源数据融合的电网监控运行特征信息提取方法及系统 | |
CN110427607A (zh) | 一种基于智能机器人的电网事故事件分析方法及系统 | |
CN102930007A (zh) | 大面积停电应急处理中的用户复电紧急程度分类方法 | |
CN113378024A (zh) | 一种基于深度学习面向公检法领域的相关事件识别方法 | |
CN117171244A (zh) | 基于数据中台构建的企业数据管理系统及其数据分析方法 | |
CN109635008A (zh) | 一种基于机器学习的设备故障检测方法 | |
CN116010358A (zh) | 一种日志数据处理方法、装置及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20191108 |