CN110175324B - 一种基于数据挖掘的电网运行操作指令校验方法及系统 - Google Patents

一种基于数据挖掘的电网运行操作指令校验方法及系统 Download PDF

Info

Publication number
CN110175324B
CN110175324B CN201910289537.7A CN201910289537A CN110175324B CN 110175324 B CN110175324 B CN 110175324B CN 201910289537 A CN201910289537 A CN 201910289537A CN 110175324 B CN110175324 B CN 110175324B
Authority
CN
China
Prior art keywords
equipment
power grid
text
data
operation instruction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910289537.7A
Other languages
English (en)
Other versions
CN110175324A (zh
Inventor
代江
王宁
单克
赵倩
田年杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guizhou Power Grid Co Ltd
Original Assignee
Guizhou Power Grid Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guizhou Power Grid Co Ltd filed Critical Guizhou Power Grid Co Ltd
Priority to CN201910289537.7A priority Critical patent/CN110175324B/zh
Publication of CN110175324A publication Critical patent/CN110175324A/zh
Application granted granted Critical
Publication of CN110175324B publication Critical patent/CN110175324B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • G06F30/20Design optimisation, verification or simulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Artificial Intelligence (AREA)
  • Economics (AREA)
  • Water Supply & Treatment (AREA)
  • Public Health (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Probability & Statistics with Applications (AREA)
  • Geometry (AREA)
  • Evolutionary Computation (AREA)
  • Computer Hardware Design (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开的一种基于数据挖掘的电网运行操作指令校验方法及系统,包括:S101、与SCADA系统电连接,用于采集设备在电网运行中的实时运行数据;S102、通过数字挖掘技术对电网运行操作指令数据进行分析,建立校验模型;S103、根据校验模型,在操作规格库中匹配运行设备对应的操作规则模板;S104、根据匹配得到的操作规则模板,生成操作指令;S105、在该操作指令下将设备运行状态与设备在电网运行中的实时运行数据进行对比;通过对操作指令进行校验,能够对其的正确性进行校验,从而降低误操作引发事故事件的概率,能够提高调度员的工作效率,大大的减轻调度员的工作压力,能够起到事半功倍的效果。

Description

一种基于数据挖掘的电网运行操作指令校验方法及系统
技术领域
本发明属于电网调度的技术领域,具体涉及一种基于数据挖掘的电网运行操作指令校验方法及系统。
背景技术
随着电网规模的逐渐扩大,其包含的设备的种类也越来越多,但不少的电网调度日志系统并没有对操作指令中相关的操作进行校核。确保操作的安全性是调度操作指令的根本,然而,安全校核是过去调度操作指令系统较少考虑的,其原因是没有与实时运行的电网监控系统连接,是离线运行的,没有结合实时运行状态进行安全校核分析。原有的调度日志系统,对于设备名称、设备状态等都没有实现规范化,而且在进行操作指令的记录时,并没有对相关的设备需求、设备特点来进行系统性的记录,基本上均是依靠于调度员,虽然在录入操作指令之前,由调度员进行人工的校验,而大部分调度员在工作期间是需要同时操作几个系统来进行信息的记录以及和其他的调度员来进行通信的,而没有经过统一校验的操作指令,很可能会引起一系列的连锁反应,导致多个系统都出现了问题,不仅大大的影响了工作效率和其他系统的正常运行和操作,而且也加大了调度员工作量和工作难度。
同时,由于一些设备结构的不同,不同的设备间具体的操作细节是存在差异的,所以它们的具体操作顺序也是不尽相同的,不能一概而论,因此没有进行校验的操作指令,容易引发事故事件,造成人员的伤亡和设备的损坏,带来十分大的安全隐患和财产的损失。
发明内容
本发明克服现有技术存在的不足,所要解决的技术问题为:提供一种能够对操作指令中相关的操作进行校验,且基于数据挖掘的电网运行操作指令校验方法及系统。
为了解决上述技术问题,本发明采用的技术方案为:一种基于数据挖掘的电网运行操作指令校验方法,包括:S101、与SCADA系统电连接,用于采集设备在电网运行中的实时运行数据;S102、通过数字挖掘技术对电网运行操作指令数据进行分析,建立校验模型;所述电网运行指令数据包括电网运行指令的操作票、操作指令和历史操作指令信息;S103、根据校验模型,在操作规格库中匹配运行设备对应的操作规则模板;S104、根据匹配得到的操作规则模板,生成操作指令;S105、在该操作指令下将设备运行状态与设备在电网运行中的实时运行数据进行对比,若设备在该操作指令下的初始状态与在电网运行中的实时状态一致,则该运行设备安全校核合格,否则,不合格。
优选地,所述通过数字挖掘技术对电网运行操作指令数据进行分析,建立校验模型,具体包括:对电网运行操作指令数据进行文本转化,过滤无效文本,得到与运行设备相关的文本数据;所述运行设备相关的文本数据包括设备名称、设备状态、操作措施和操作指令文本数据;分别对设备名称、设备状态、操作措施与操作指令文本数据之间的关联度进行排序,并建立校验模型。
优选地,所述对电网运行操作指令数据进行文本转化,过滤无效文本,得到与运行设备相关的文本数据,包括:将电网运行操作指令数据通过基于文本块统计的提取算法,得到系统运行文本的文字内容;将系统运行文本的文字内容进行分句,对已分好句的文本进行分词、词性标注与命名实体识别;将处理后的系统运行文本的文字内容进行词典构建,形成系统运行词典。过滤与运行设备无关语句,得到与运行设备相关的文本数据。
优选地,所述分别对设备名称、设备状态、操作措施与操作指令文本数据之间的关联度进行排序,并建立校验模型,包括:通过系统运行词典对设备名称、设备状态、操作措施与操作指令中的噪声进行过滤;统计过滤后的设备名称、设备状态、操作措施与操作指令同时出现的频率,过滤出现频率低的文本数据;通过上下文式关联计算方法,计算设备名称、设备状态、操作措施与操作指令之间的关联度;
所述上下文式关联计算方法,具体包括:根据两个操作票中设备名称、设备状态、操作措施同时出现在同一个操作票内容中作为设备名称、设备状态、操作措施存在关联的依据,然后基于统计的方法来量化这种关联度,引入条件概率:
Figure BDA0002024465380000021
式(1)中,
Figure BDA0002024465380000022
为pi pj同时出现的内容数目;/>
Figure BDA0002024465380000023
为pj出现的内容数目;pi pj同时出现的内容数目除以pj出现的内容数目,将式(1)中的条件概率P(pi|pj)和设备名称、设备状态、操作措施同时出现次数结合来衡量设备名称、设备状态、操作措施和操作指令的关联度;
asso(Pi|Pj)=w1*P(Pi|Pj)+w2*coor(PiPj) (2)
式(2)中,w1为式(1)中的条件概率P(pi|pj)的权重,w2为设备名称、设备状态、操作措施同时出现次数所占的权重,coor(PiPj)为设备名称、设备状态、操作措施占整个操作票的比重;将设备名称、设备状态、操作措施按照式(2)计算的关联度进行排序,取关联度最高的100个设备名称、设备状态、操作措施作为基准,基于它们来选择校验模型。
优选地,所述操作规则模板按设备类型分为母线、开关、变压器、线路、保护和重合闸共六类,每类又按总操作任务、接线形式、子操作任务、相关设备、初始状态、目标状态进一步划分。
相应地,一种基于数据挖掘的电网运行操作指令校验系统,包括:数据采集单元:与SCADA系统电连接,用于采集设备在电网运行中的实时运行数据;校验模型生成单元:用于通过数字挖掘技术对电网运行操作指令数据进行分析,建立校验模型;所述电网运行指令数据包括电网运行指令的操作票、操作指令和历史操作指令信息;匹配单元:根据校验模型,在操作规格库中匹配运行设备对应的操作规则模板;生成单元:根据匹配得到的操作规则模板,生成操作指令;判断单元:用于在该操作指令下将设备运行状态与设备在电网运行中的实时运行数据进行对比,若设备在该操作指令下的初始状态与在电网运行中的实时状态一致,则该运行设备安全校核合格,否则,不合格。
优选地,所述校验模型生成单元,具体包括:预处理单元:用于对电网运行操作指令数据进行文本转化,过滤无效文本,得到与运行设备相关的文本数据;所述运行设备相关的文本数据包括设备名称、设备状态、操作措施和操作指令文本数据;第一处理单元:用于分别对设备名称、设备状态、操作措施与操作指令文本数据之间的关联度进行排序,并建立校验模型。
优选地,所述预处理单元包括:提取单元:用于将电网运行操作指令数据通过基于文本块统计的提取算法,得到系统运行文本的文字内容;第二处理单元:将系统运行文本的文字内容进行分句,对已分好句的文本进行分词、词性标注与命名实体识别;运行词典建立单元:用于将处理后的系统运行文本的文字内容进行词典构建,形成系统运行词典;第一过滤单元:用于过滤与运行设备无关语句,得到与运行设备相关的文本数据。
优选地,所述第一处理单元包括:第二过滤单元:通过系统运行词典对设备名称、设备状态、操作措施与操作指令中的噪声进行过滤;第三过滤单元:用于统计过滤后的设备名称、设备状态、操作措施与操作指令同时出现的频率,过滤出现频率低的文本数据;第三处理单元:用于通过上下文式关联计算方法,计算设备名称、设备状态、操作措施与操作指令之间的关联度;
所述上下文式关联计算方法,具体包括:根据两个操作票中设备名称、设备状态、操作措施同时出现在同一个操作票内容中作为设备名称、设备状态、操作措施存在关联的依据,然后基于统计的方法来量化这种关联度,引入条件概率:
Figure BDA0002024465380000041
式(1)中,
Figure BDA0002024465380000042
为pi pj同时出现的内容数目;/>
Figure BDA0002024465380000043
为pj出现的内容数目;pipj同时出现的内容数目除以pj出现的内容数目,将式(1)中的条件概率P(pi|pj)和设备名称、设备状态、操作措施同时出现次数结合来衡量设备名称、设备状态、操作措施和操作指令的关联度;
asso(Pi|Pj)=w1*P(Pi|Pj)+w2*coor(PiPj) (2)
式(2)中,w1为式(1)中的条件概率P(pi|pj)的权重,w2为设备名称、设备状态、操作措施同时出现次数所占的权重,coor(PiPj)为设备名称、设备状态、操作措施占整个操作票的比重;将设备名称、设备状态、操作措施按照式(2)计算的关联度进行排序,取关联度最高的100个设备名称、设备状态、操作措施作为基准,基于它们来选择校验模型。
优选地,所述操作规则模板按设备类型分为母线、开关、变压器、线路、保护和重合闸共六类,每类又按总操作任务、接线形式、子操作任务、相关设备、初始状态、目标状态进一步划分。
本发明与现有技术相比具有以下有益效果:
1、本发明提供的一种基于数据挖掘的电网运行操作指令校验方法及系统,能够要求调度员严格按照操作指令的要求执行,减少事故事件发生,确保电网的运行安全,在执行操作指令之前,通过对操作指令进行校验,能够对其的正确性进行校验,从而降低误操作引发事故事件的概率。
2、本发明与SCADA系统电连接,能够采集设备在电网运行中的实时运行数据;通过与SCADA系统融合,使安全校核、网络流程化执行与管理得以实现。
3、通过对操作指令进行自动校验,能够提高调度员的工作效率,大大的减轻调度员的工作压力,能够起到事半功倍的效果。
附图说明
下面结合附图对本发明做进一步详细的说明;
图1为本发明实施例一提供的一种基于数据挖掘的电网运行操作指令校验方法的流程示意图;
图2为本发明实施例一提供的一种基于数据挖掘的电网运行操作指令校验系统的结构示意图;
图3为本发明实施例二提供的一种基于数据挖掘的电网运行操作指令校验系统的结构示意图;
图4为本发明实施例三提供的一种基于数据挖掘的电网运行操作指令校验系统的结构示意图;
图5为本发明实施例四提供的一种基于数据挖掘的电网运行操作指令校验系统的结构示意图;
图6为本发明中母线操作规则模板示意图;
图7为本发明中规则计算公式;
其中:101为数据采集单元,102为校验模型生成单元,1021为预处理单元,1022为第一处理单元,1023为提取单元,1024为第二处理单元,1025为运行词典建立单元,1026为第一过滤单元,1027为第二过滤单元,1028为第三过滤单元,1029为第三处理单元,103为匹配单元,104为生成单元,105为判断单元。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例;基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明实施例一提供的一种基于数据挖掘的电网运行操作指令校验方法的流程示意图,如图1所示,一种基于数据挖掘的电网运行操作指令校验方法,包括:
S101、与SCADA系统电连接,用于采集设备在电网运行中的实时运行数据;
S102、通过数字挖掘技术对电网运行操作指令数据进行分析,建立校验模型;所述电网运行指令数据包括电网运行指令的操作票、操作指令和历史操作指令信息;
S103、根据校验模型,在操作规格库中匹配运行设备对应的操作规则模板;
S104、根据匹配得到的操作规则模板,生成操作指令;所述操作规则模板按设备类型分为母线、开关、变压器、线路、保护和重合闸共六类,每类又按总操作任务、接线形式、子操作任务、相关设备、初始状态、目标状态进一步划分;如图6所示,以母线类为例的说明分层模板示意图;
S105、在该操作指令下将设备运行状态与设备在电网运行中的实时运行数据进行对比,若设备在该操作指令下的初始状态与在电网运行中的实时状态一致,则该运行设备安全校核合格,否则,不合格。
具体的,通过与SCADA系统电连接,能够从SCADA系统中读取所需的实时数据,结合操作规则模板底层设置的相关设备的初始状态与目标状态,比较设备在该操作指令下的初始状态与在电网运行中的实时状态一致,进行分析和安全校核,形成符合要求的操作步骤,或者提示安全校核不合格的设备,能够准确的反应出设备在该操作指令执行时的当前态,起到实时的跟踪设备状态的作用,从而进一步的评估该操作指令的正确性。经过校验后的操作指令,能够为与操作票关联的检修单、工作票等,提供可靠的数据来源,生成规范化的、有用的数据,而对于那些使用该数据作为基础的高级电网应用软件,像电网运行信息记录分析、调度月报和年报的图形汇总展示等软件来说,提供了关键的数据支持。
本发明提供的一种基于数据挖掘的电网运行操作指令校验方法及系统,能够要求调度员严格按照操作指令的要求执行,减少事故事件发生,确保电网的运行安全,在执行操作指令之前,通过对操作指令进行校验,不仅能够提高调度员的工作效率,大大的减轻调度员的工作压力,能够起到事半功倍的效果,还能够对操作指令的正确性进行校验,从而降低误操作引发事故事件的概率;本发明与SCADA系统电连接,能够采集设备在电网运行中的实时运行数据;通过与SCADA系统融合,使安全校核、网络流程化执行与管理得以实现。
具体的,所述通过数字挖掘技术对电网运行操作指令数据进行分析,建立校验模型,具体包括:
对电网运行操作指令数据进行文本转化,过滤无效文本,得到与运行设备相关的文本数据;所述运行设备相关的文本数据包括设备名称、设备状态、操作措施和操作指令文本数据;
分别对设备名称、设备状态、操作措施与操作指令文本数据之间的关联度进行排序,并建立校验模型。
进一步地,所述对电网运行操作指令数据进行文本转化,过滤无效文本,得到与运行设备相关的文本数据,包括:
将电网运行操作指令数据通过基于文本块统计的提取算法,得到系统运行文本的文字内容;
将系统运行文本的文字内容进行分句,对已分好句的文本进行分词、词性标注与命名实体识别;具体的,以文本中出现的中英文句号、问号、叹号等句子终结符作为句子的分隔符,将系统运行文本的文字内容进行分句,对已分好句的文本进行分词标注;
将分词标注处理后的系统运行文本的文字内容进行词典构建,形成系统运行词典;
根据制定的相关规则,过滤与运行设备无关语句,得到与运行设备相关的文本数据;通过过滤与运行设备无关语句,能够提高系统的处理效率。
进一步地,所述分别对设备名称、设备状态、操作措施与操作指令文本数据之间的关联度进行排序,并建立校验模型,包括:
通过系统运行词典对设备名称、设备状态、操作措施与操作指令中的噪声进行过滤,对过滤后的数据进行两两组合得到新的设备名称、设备状态、操作措施与操作指令;
统计过滤后的设备名称、设备状态、操作措施与操作指令同时出现的频率,过滤出现频率低的文本数据;具体的,统计所有操作票数据中每个类别为设备名称、设备状态、操作措施的出现频率,设备名称、设备状态、操作措施的出现频率越高说明该设备与操作指令两者存在关系的概率越高,通过这种方法过滤掉同时出现次数较少的设备名称、设备状态、操作措施,减少后续处理的工作量。
对于剩下的同时出现次数较高的设备名称、设备状态、操作措施,通过上下文式关联计算方法,计算设备名称、设备状态、操作措施与操作指令之间的关联度;
所述上下文式关联计算方法,具体包括:将两个操作票中设备名称、设备状态、操作措施同时出现在同一个操作票内容中作为设备名称、设备状态、操作措施存在关联的依据,然后基于统计的方法来量化这种关联度,引入条件概率:
Figure BDA0002024465380000081
式(1)中,
Figure BDA0002024465380000082
为pi pj同时出现的内容数目;/>
Figure BDA0002024465380000083
为pj出现的内容数目;pi pj同时出现的内容数目除以pj出现的内容数目,将式(1)中的条件概率P(pi|pj)和设备名称、设备状态、操作措施同时出现次数结合来衡量设备名称、设备状态、操作措施和操作指令的关联度;
asso(Pi|Pj)=w1*P(Pi|Pj)+w2*coor(PiPj) (2)
式(2)中,w1为式(1)中的条件概率P(pi|pj)的权重,w2为设备名称、设备状态、操作措施同时出现次数所占的权重,coor(PiPj)为设备名称、设备状态、操作措施占整个操作票的比重;将设备名称、设备状态、操作措施按照式(2)计算的关联度进行排序,取关联度最高的100个设备名称、设备状态、操作措施作为基准,基于它们来选择校验模型。
所述一种基于数据挖掘的电网运行操作指令校验方法,还包括:
以电网运行操作指令数据中的各类特征参数为主,选择合理、科学的评价指标体系,建立合理的指令健康状态等级,然后运用合适的计算方法,统筹兼顾评价系统中所有的运行设备、操作措施等对操作指令状态的影响,通过模糊综合评判法评估出操作指令的健康状态。
所述模糊综合评判法的主要步骤:1、确定评价因素集U={u1,u1,∧,un,};2、确定评语集V={v1,v2,∧,vm,};3、进行单因素评判得到ri={ri1,ri2,∧,rin,};4、构造综合评判矩阵:
Figure BDA0002024465380000091
得到R之后,在式(3)中,利用权重W={w1,w2,∧,wn,}和R来计算P,P=WδR,P为综合出现的概率,即根据隶属度最大原则求出来的综合评判结果;运算符δ为代替符,代表W与R之间多个不同的运算公式,具体的公式根据W权重的取值范围来确定,从而得到多个不同的计算模型,具体如图7所示。
前面基于数据挖掘技术,找出了设备名称、设备状态、操作措施和操作指令的关联,而根据它们的关联度的强弱,来选择不同的校验公式,通过校验公式计算出该操作指令的健康状态,并将不符合的标记为非健康的操作指令。
操作规则模板基于模糊综合评判法进行计算,它将设备与操作指令进行关联,基于多个因素来校验操作指令的正确性,通过建立分类分层的操作规则模板与不同类设备的操作规则相对应,同时研究基于操作规则模板通用的匹配推理机制和操作规则模板的用户专家指导学习机制,以解决操作指令的自适应性和用户可维护性,实现操作指令的通用性,并以该操作规则模板作为标准对调度员下达的操作指令进行校验。
用户可以根据电网的特点定制操作规则模板,并形成规则库供具体设备配制时引用,开发了基于规则模板的推理机制,根据用户选定的设备进行安全校核和拓扑分析,寻找相关接线形式和设备,然后查询操作规则库,采用数据驱动的前向推理机制,循环利用操作规则进行推理,逐步匹配形成操作序列,然后通过操作术语翻译成一条符合要求的操作指令。
图2为本发明实施例一提供的一种基于数据挖掘的电网运行操作指令校验系统的结构示意图,如图2所示,一种基于数据挖掘的电网运行操作指令校验系统,包括:
数据采集单元101:与SCADA系统电连接,用于采集设备在电网运行中的实时运行数据;
校验模型生成单元102:用于通过数字挖掘技术对电网运行操作指令数据进行分析,建立校验模型;所述电网运行指令数据包括电网运行指令的操作票、操作指令和历史操作指令信息;
匹配单元103:根据校验模型,在操作规格库中匹配运行设备对应的操作规则模板;
生成单元104:根据匹配得到的操作规则模板,生成操作指令;所述操作规则模板按设备类型分为母线、开关、变压器、线路、保护和重合闸共六类,每类又按总操作任务、接线形式、子操作任务、相关设备、初始状态、目标状态进一步划分;
判断单元105:用于在该操作指令下将设备运行状态与设备在电网运行中的实时运行数据进行对比,若设备在该操作指令下的初始状态与在电网运行中的实时状态一致,则该运行设备安全校核合格,否则,不合格。
图3为本发明实施例二提供的一种基于数据挖掘的电网运行操作指令校验系统的结构示意图,如图3所示,在实施例一的基础上,所述校验模型生成单元102,具体包括:
预处理单元1021:用于对电网运行操作指令数据进行文本转化,过滤无效文本,得到与运行设备相关的文本数据;所述运行设备相关的文本数据包括设备名称、设备状态、操作措施和操作指令文本数据;
第一处理单元1022:用于分别对设备名称、设备状态、操作措施与操作指令文本数据之间的关联度进行排序,并建立校验模型。
图4为本发明实施例三提供的一种基于数据挖掘的电网运行操作指令校验系统的结构示意图,如图4所示,在实施例二的基础上,所述预处理单元1021包括:
提取单元1023:用于将电网运行操作指令数据通过基于文本块统计的提取算法,得到系统运行文本的文字内容;
第二处理单元1024:将系统运行文本的文字内容进行分句,对已分好句的文本进行分词、词性标注与命名实体识别;
运行词典建立单元1025:用于将处理后的系统运行文本的文字内容进行词典构建,形成系统运行词典。
第一过滤单元1026:用于过滤与运行设备无关语句,得到与运行设备相关的文本数据。
图5为本发明实施例四提供的一种基于数据挖掘的电网运行操作指令校验系统的结构示意图,如图5所示,在实施例二的基础上,所述第一处理单元1022包括:
第二过滤单元1027:通过系统运行词典对设备名称、设备状态、操作措施与操作指令中的噪声进行过滤;
第三过滤单元1028:用于统计过滤后的设备名称、设备状态、操作措施与操作指令同时出现的频率,过滤出现频率低的文本数据;
第三处理单元1029:用于通过上下文式关联计算方法,计算设备名称、设备状态、操作措施与操作指令之间的关联度;
所述上下文式关联计算方法,具体包括:根据两个操作票中设备名称、设备状态、操作措施同时出现在同一个操作票内容中作为设备名称、设备状态、操作措施存在关联的依据,然后基于统计的方法来量化这种关联度,引入条件概率:
Figure BDA0002024465380000111
式(1)中,
Figure BDA0002024465380000112
为pi pj同时出现的内容数目;/>
Figure BDA0002024465380000113
为pj出现的内容数目;pipj同时出现的内容数目除以pj出现的内容数目,将式(1)中的条件概率P(pi|pj)和设备名称、设备状态、操作措施同时出现次数结合来衡量设备名称、设备状态、操作措施和操作指令的关联度;
asso(Pi|Pj)=w1*P(Pi|Pj)+w2*coor(PiPj) (2)
式(2)中,w1为式(1)中的条件概率P(pi|pj)的权重,w2为设备名称、设备状态、操作措施同时出现次数所占的权重,coor(PiPj)为设备名称、设备状态、操作措施占整个操作票的比重;将设备名称、设备状态、操作措施按照式(2)计算的关联度进行排序,取关联度最高的100个设备名称、设备状态、操作措施作为基准,基于它们来选择校验模型。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (7)

1.一种基于数据挖掘的电网运行操作指令校验方法,其特征在于:包括:
S101、与SCADA系统电连接,用于采集设备在电网运行中的实时运行数据;
S102、通过数字挖掘技术对电网运行操作指令数据进行分析,建立校验模型;所述电网运行操作指令数据包括电网运行指令的操作票、操作指令和历史操作指令信息;
S103、根据校验模型,在操作规格库中匹配运行设备对应的操作规则模板;
S104、根据匹配得到的操作规则模板,生成操作指令;
S105、在该操作指令下将设备运行状态与设备在电网运行中的实时运行数据进行对比,若设备在该操作指令下的初始状态与在电网运行中的实时状态一致,则该运行设备安全校核合格,否则,不合格;
所述通过数字挖掘技术对电网运行操作指令数据进行分析,建立校验模型,具体包括:
对电网运行操作指令数据进行文本转化,过滤无效文本,得到与运行设备相关的文本数据;所述运行设备相关的文本数据包括设备名称、设备状态、操作措施和操作指令文本数据;
分别对设备名称、设备状态、操作措施与操作指令文本数据之间的关联度进行排序,并建立校验模型;
所述对电网运行操作指令数据进行文本转化,过滤无效文本,得到与运行设备相关的文本数据,包括:
将电网运行操作指令数据通过基于文本块统计的提取算法,得到系统运行文本的文字内容;
将系统运行文本的文字内容进行分句,对已分好句的文本进行分词、词性标注与命名实体识别;
将处理后的系统运行文本的文字内容进行词典构建,形成系统运行词典;
过滤与运行设备无关语句,得到与运行设备相关的文本数据;
所述分别对设备名称、设备状态、操作措施与操作指令文本数据之间的关联度进行排序,并建立校验模型,包括:
通过系统运行词典对设备名称、设备状态、操作措施与操作指令中的噪声进行过滤;
统计过滤后的设备名称、设备状态、操作措施与操作指令同时出现的频率,过滤出现频率低的文本数据;
通过上下文式关联计算方法,计算设备名称、设备状态、操作措施与操作指令之间的关联度;
所述上下文式关联计算方法,具体包括:根据两个操作票中设备名称、设备状态、操作措施同时出现在同一个操作票内容中作为设备名称、设备状态、操作措施存在关联的依据,然后基于统计的方法来量化这种关联度,引入条件概率:
Figure FDA0004169496220000021
式(1)中,
Figure FDA0004169496220000022
为pi pj同时出现的内容数目;/>
Figure FDA0004169496220000023
为pj出现的内容数目;pi pj同时出现的内容数目除以pj出现的内容数目,将式(1)中的条件概率P(pi|pj)和设备名称、设备状态、操作措施同时出现次数结合来衡量设备名称、设备状态、操作措施和操作指令的关联度;/>
asso(Pi|Pj)=w1*P(Pi|Pj)+w2*coor(PiPj) (2)
式(2)中,w1为式(1)中的条件概率P(pi|pj)的权重,w2为设备名称、设备状态、操作措施同时出现次数所占的权重,coor(PiPj)为设备名称、设备状态、操作措施占整个操作票的比重;将设备名称、设备状态、操作措施按照式(2)计算的关联度进行排序,取关联度最高的100个设备名称、设备状态、操作措施作为基准,基于它们来选择校验模型。
2.根据权利要求1所述的一种基于数据挖掘的电网运行操作指令校验方法,其特征在于:所述操作规则模板按设备类型分为母线、开关、变压器、线路、保护和重合闸共六类,每类又按总操作任务、接线形式、子操作任务、相关设备、初始状态、目标状态进一步划分。
3.一种基于数据挖掘的电网运行操作指令校验系统,其特征在于:包括:
数据采集单元(101):与SCADA系统电连接,用于采集设备在电网运行中的实时运行数据;
校验模型生成单元(102):用于通过数字挖掘技术对电网运行操作指令数据进行分析,建立校验模型;所述电网运行操作指令数据包括电网运行指令的操作票、操作指令和历史操作指令信息;
匹配单元(103):根据校验模型,在操作规格库中匹配运行设备对应的操作规则模板;
生成单元(104):根据匹配得到的操作规则模板,生成操作指令;
判断单元(105):用于在该操作指令下将设备运行状态与设备在电网运行中的实时运行数据进行对比,若设备在该操作指令下的初始状态与在电网运行中的实时状态一致,则该运行设备安全校核合格,否则,不合格。
4.根据权利要求3所述的一种基于数据挖掘的电网运行操作指令校验系统,其特征在于:所述校验模型生成单元(102),具体包括:
预处理单元(1021):用于对电网运行操作指令数据进行文本转化,过滤无效文本,得到与运行设备相关的文本数据;所述运行设备相关的文本数据包括设备名称、设备状态、操作措施和操作指令文本数据;
第一处理单元(1022):用于分别对设备名称、设备状态、操作措施与操作指令文本数据之间的关联度进行排序,并建立校验模型。
5.根据权利要求4所述的一种基于数据挖掘的电网运行操作指令校验系统,其特征在于:所述预处理单元(1021)包括:
提取单元(1023):用于将电网运行操作指令数据通过基于文本块统计的提取算法,得到系统运行文本的文字内容;
第二处理单元(1024):将系统运行文本的文字内容进行分句,对已分好句的文本进行分词、词性标注与命名实体识别;
运行词典建立单元(1025):用于将处理后的系统运行文本的文字内容进行词典构建,形成系统运行词典;
第一过滤单元(1026):用于过滤与运行设备无关语句,得到与运行设备相关的文本数据。
6.根据权利要求4所述的一种基于数据挖掘的电网运行操作指令校验系统,其特征在于:所述第一处理单元(1022)包括:
第二过滤单元(1027):通过系统运行词典对设备名称、设备状态、操作措施与操作指令中的噪声进行过滤;
第三过滤单元(1028):用于统计过滤后的设备名称、设备状态、操作措施与操作指令同时出现的频率,过滤出现频率低的文本数据;
第三处理单元(1029):用于通过上下文式关联计算方法,计算设备名称、设备状态、操作措施与操作指令之间的关联度;
所述上下文式关联计算方法,具体包括:根据两个操作票中设备名称、设备状态、操作措施同时出现在同一个操作票内容中作为设备名称、设备状态、操作措施存在关联的依据,然后基于统计的方法来量化这种关联度,引入条件概率:
Figure FDA0004169496220000041
式(1)中,
Figure FDA0004169496220000042
为pi pj同时出现的内容数目;/>
Figure FDA0004169496220000043
为pj出现的内容数目;pi pj同时出现的内容数目除以pj出现的内容数目,将式(1)中的条件概率P(pi|pj)和设备名称、设备状态、操作措施同时出现次数结合来衡量设备名称、设备状态、操作措施和操作指令的关联度;
asso(Pi|Pj)=w1*P(Pi|Pj)+w2*coor(PiPj) (2)
式(2)中,w1为式(1)中的条件概率P(pi|pj)的权重,w2为设备名称、设备状态、操作措施同时出现次数所占的权重,coor(PiPj)为设备名称、设备状态、操作措施占整个操作票的比重;将设备名称、设备状态、操作措施按照式(2)计算的关联度进行排序,取关联度最高的100个设备名称、设备状态、操作措施作为基准,基于它们来选择校验模型。
7.根据权利要求3所述的一种基于数据挖掘的电网运行操作指令校验系统,其特征在于:所述操作规则模板按设备类型分为母线、开关、变压器、线路、保护和重合闸共六类,每类又按总操作任务、接线形式、子操作任务、相关设备、初始状态、目标状态进一步划分。
CN201910289537.7A 2019-04-11 2019-04-11 一种基于数据挖掘的电网运行操作指令校验方法及系统 Active CN110175324B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910289537.7A CN110175324B (zh) 2019-04-11 2019-04-11 一种基于数据挖掘的电网运行操作指令校验方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910289537.7A CN110175324B (zh) 2019-04-11 2019-04-11 一种基于数据挖掘的电网运行操作指令校验方法及系统

Publications (2)

Publication Number Publication Date
CN110175324A CN110175324A (zh) 2019-08-27
CN110175324B true CN110175324B (zh) 2023-05-23

Family

ID=67689588

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910289537.7A Active CN110175324B (zh) 2019-04-11 2019-04-11 一种基于数据挖掘的电网运行操作指令校验方法及系统

Country Status (1)

Country Link
CN (1) CN110175324B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110991188A (zh) * 2019-09-17 2020-04-10 国网浙江省电力有限公司杭州供电公司 应用于配网调度智能成票系统的成票方法
CN111199285A (zh) * 2020-02-25 2020-05-26 国网冀北电力有限公司唐山供电公司 一种基于关系型数据库的两票专家系统
CN111581965B (zh) * 2020-04-26 2022-07-15 云南电网有限责任公司昆明供电局 操作票生成方法及装置
CN111680975B (zh) * 2020-06-01 2023-06-27 广东电网有限责任公司 操作票的审核方法、装置、设备和介质
CN113515950B (zh) * 2021-04-30 2023-06-23 贵州电网有限责任公司 一种适用于电力智能调度的自然语言处理语义分析方法
CN113377419A (zh) * 2021-05-31 2021-09-10 同盾科技有限公司 一种业务处理方法、装置、可读存储介质及电子设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102891484A (zh) * 2012-09-20 2013-01-23 福建省电力有限公司 电网调度综合令的计算机拆解方法
CN105787809A (zh) * 2016-03-10 2016-07-20 国家电网公司 一种基于数据挖掘的电网设备运行状态智能校验方法
CN207320950U (zh) * 2017-11-01 2018-05-04 贵州电网有限责任公司 调控一体化防误系统
CN109376353A (zh) * 2018-09-04 2019-02-22 国家电网公司华东分部 一种基于自然语言处理的电网启动操作票生成装置及方法
CN109559737A (zh) * 2018-12-13 2019-04-02 朱明增 电力系统调度语音模型建立方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5347388B2 (ja) * 2008-09-05 2013-11-20 富士通株式会社 動作指示受付装置
CN103729734A (zh) * 2013-12-19 2014-04-16 国家电网公司 一种配网智能操作开票系统
CN103761624A (zh) * 2014-01-28 2014-04-30 国网安徽省电力公司 一体化电网调度操作智能防误预警系统的实现方法
CN104600840B (zh) * 2014-12-30 2018-05-08 国家电网公司 一种智能调度防误操作管理系统及方法
CN105608636B (zh) * 2015-12-17 2021-08-31 国家电网公司 一种基于规则挖掘的电网倒闸操作规则库建立方法
CN107769191A (zh) * 2016-08-18 2018-03-06 中国电力科学研究院 基于网络拓扑和潮流数据的关键输电断面自动识别方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102891484A (zh) * 2012-09-20 2013-01-23 福建省电力有限公司 电网调度综合令的计算机拆解方法
CN105787809A (zh) * 2016-03-10 2016-07-20 国家电网公司 一种基于数据挖掘的电网设备运行状态智能校验方法
CN207320950U (zh) * 2017-11-01 2018-05-04 贵州电网有限责任公司 调控一体化防误系统
CN109376353A (zh) * 2018-09-04 2019-02-22 国家电网公司华东分部 一种基于自然语言处理的电网启动操作票生成装置及方法
CN109559737A (zh) * 2018-12-13 2019-04-02 朱明增 电力系统调度语音模型建立方法

Also Published As

Publication number Publication date
CN110175324A (zh) 2019-08-27

Similar Documents

Publication Publication Date Title
CN110175324B (zh) 一种基于数据挖掘的电网运行操作指令校验方法及系统
CN113435652B (zh) 一种一次设备缺陷诊断与预测方法
CN110674189A (zh) 一种智能变电站二次状态监测与故障定位的方法
CN112818008A (zh) 核电调试故障智能诊断的方法、系统、介质及电子设备
CN112434532B (zh) 一种支持人机双向理解的电网环境模型及建模方法
CN110689148A (zh) 一种基于ar技术的计量设备故障检测方法
CN113095050A (zh) 一种智能成票方法、系统、设备及存储介质
CN113435759B (zh) 一种基于深度学习的一次设备风险智能评估方法
CN111832977A (zh) 一种基于自然语言解析的检修申请自动成票方法
CN110968703B (zh) 基于lstm端到端抽取算法的异常计量点知识库构建方法及系统
CN110033102A (zh) 一种巨型水电厂具有学习功能的智能诊断方法及专家系统
CN110363379A (zh) 一种电力系统的搜索及监控方法
CN114091912A (zh) 一种应用知识图谱分析中压电网拓扑异动方法
CN114996470A (zh) 一种智能调度检修识别库构建方法
CN114201328A (zh) 基于人工智能的故障处理方法、装置、电子设备及介质
CN116932523B (zh) 一种整合和监管第三方环境检测机构的平台
CN113065580A (zh) 一种基于多信息融合的电厂设备管理方法及系统
CN111736636A (zh) 一种基于知识图谱的水淹水车室预警方法及系统
CN111475548A (zh) 一种基于大数据挖掘技术的用电异常分析决策系统
CN115600695A (zh) 一种计量设备的故障诊断方法
CN115455133A (zh) 一种基于文本挖掘的操作票校核方法、系统及设备
CN115619117A (zh) 基于值班系统的电网智能调度方法
CN114969334A (zh) 异常日志检测方法、装置、电子设备及可读存储介质
CN115099232A (zh) 一种调度规程和历史数据的电网操作知识模型构建方法
CN113590825A (zh) 文本质检方法、装置及相关设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant