CN104036372A - 一种电力设备疑似重复数据识别方法 - Google Patents

一种电力设备疑似重复数据识别方法 Download PDF

Info

Publication number
CN104036372A
CN104036372A CN201410316351.3A CN201410316351A CN104036372A CN 104036372 A CN104036372 A CN 104036372A CN 201410316351 A CN201410316351 A CN 201410316351A CN 104036372 A CN104036372 A CN 104036372A
Authority
CN
China
Prior art keywords
power
phrase
module
equipment
scheduling
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410316351.3A
Other languages
English (en)
Inventor
陈飞
蒋亚坤
赵川
赵莹
罗洪
何文洪
张荣奎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
YUNNAN ELECTRIC POWER DISPATCH CONTROL CENTER
Tongfang Technology of Yunnan Power Grid Co Ltd
Original Assignee
YUNNAN ELECTRIC POWER DISPATCH CONTROL CENTER
Tongfang Technology of Yunnan Power Grid Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by YUNNAN ELECTRIC POWER DISPATCH CONTROL CENTER, Tongfang Technology of Yunnan Power Grid Co Ltd filed Critical YUNNAN ELECTRIC POWER DISPATCH CONTROL CENTER
Priority to CN201410316351.3A priority Critical patent/CN104036372A/zh
Publication of CN104036372A publication Critical patent/CN104036372A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Supply And Distribution Of Alternating Current (AREA)

Abstract

本发明涉及一种电力设备疑似重复数据识别方法,属于电力工程及电力调度信息化建设领域。该方法通过词组拆分、词组判定、生成匹配结果、电力调度命名规则等技术或功能的组合,实现了电力企业疑似重复电力设备数据的抽取、识别、对应,建立统一的电网设备台账信息;拆分词组,用于把电力设备名称的长句拆分为有意义的词组;词组选择,根据调度命名规则、电网公共模型及设备类别判断出疑似重复的设备;生成匹配结果,根据前两步判断结果,程序可自动生成以厂站为单位的匹配列表;电力调度命名规则,根据电力调度规程,实现电力调度命名规则的结构化,支持词组判定。

Description

一种电力设备疑似重复数据识别方法
技术领域
本发明属于电力工程及电力调度信息化建设领域,涉及一种关于电力设备疑似重复数据的识别方法。本方法主要是实现了调度控制中心在运行管理中,获得不同的系统设备数据后完成重复数据的匹配,为进一步利用设备数据奠定基础。
背景技术
现今的电力工程及电力调度信息化建设处于一个高速建设的过程中,但每个部门需求不同导致建设的系统中对设备台账的信息侧重点不同,由于建设的时间、建设厂家也是不同的,所以在业务需要以横向协同时,不同的设备数据难以在各个部门之间流转。换而言之,就算是同一台设备,由于系统最对应设备的命名不同,各个系统之间难以识别和对应其他系统发送过来的设备信息是本系统中哪一个设备。设备台账不统一,难以整合和利用,是如今电力企业在信息化建设过程中的一大难题。
目前,电力设备数据在电力企业,尤其在电网公司中,典型存在于电力调度自动化系统、电力调度运行管理系统、电网安全生产管理系统,这些系统中的电力设备其编码、命名均存在差异,设备数据资源具有以下特点:
1) 电力调度系统的电网模型面向电网网络分析和计算,符合 “模型互操作”的技术要求,严格遵循CIM模型标准,数据准确度较高,但数据模型主要为一次设备模型,仅包含一些保护设备模型,不能完整反应二次设备信息;
2) 电力调度运行管理系统内部的设备台账主要为发电资源信息,如编制发电计划所需的耗水率曲线、震动区和水头等信息,此外还有小水电、小火电等信息;编制检修计划或申请所需的检修设备库;
3) 电网安全生产管理系统的设备台账面向电网资产管理,几乎包含了变电站内所有的一次设备、二次设备以及辅助设备,线路设备上还包含了杆塔、金具等信息,总体来看,设备信息较为全面,但一般不包含发电厂信息。由于该系统的设备台账面向电网资产管理,其数据建模视角与电力调度管理需要存在一定的差异,例如其设备数据分为功能位置码和物理设备两类,这些概念与调度需要有所差异。
由于每个系统的设备台账信息的主要内容不同,设备编码、命名均寻在差异,设备台账的不完整、质量不高已成阻碍电网运行管理类系统提升功能的问题,一次设备和保护设备设备台账的完整性,设备台账的存量和增量的管理思路都是现存在的难以解决的问题。本发明是识别疑似重复数据的一套方法,主要是用于完成现有不同系统间重复设备的匹配。
发明内容
本发明为了解决上述难题,提出了一种电力设备疑似重复数据识别方法。通过该方法能够快速识别同一系统或不同系统的电力设备,既解决了同一部门或不同部门间电力设备信息不一致问题,为电力调度提供准确的基础信息;又能为跨部门的数据共享与交互提供统一的电力设备基础信息,保证了数据能够有效集成。该发明既提高了电力调度的安全性,又减少了因电力设备信息不一致增加的电网运营成本。
本发明采用的技术方案如下:
一种电力设备疑似重复数据识别方法,包括电力行业词组拆分模块、电力行业词组判定模块、生成匹配结果模块、电力调度命名规则模块、电力行业专有名词库模块;其中以电力调度命名规则模块为核心,由电力调度命名规则模块分别连接电力行业词组拆分模块、电力行业词组判定模块,电力行业词组拆分模块分别连接电力行业词组判定模块、电力行业专有名词库模块,词电力行业组判定模块分别连接电力行业专有名词库模块、生成匹配结果模块;电力调度命名规则模块根据“电力调度规程”进行命名规则的维护和管理;电力设备数据识别以电力调度命名规则库为基准依据,进行电力设备名称的词组拆分、词组判定、生成匹配结果;其中:
电力调度命名规则模块通过关系型数据库进行存储,实现规则的电子化、结构化;该模块对关键词的确认:根据调度的命名规则,程序识别出拆分的词组中调度命名的数字组,并对数字组进行比对,还能够根据电网公共模型,搜索上级厂站或线路,确认是否属于同一线路或厂站,以及再次确认设备是否属于同一类别,最终确认出重复数据,在完成对电力设备命名的拆分、判定后,自动生成匹配的对应关系列表;
电力行业专有名词库模块采用语义分析功能,使每一次对设备命名的拆分都做到 拆分成词;
电力行业词组拆分模块通过对电力调度中词组或语句的分析进行拆分,并通过电力行业专有名词库进行校验;本模块中的程序以自动智能的分解调度设备命名字段,将字段分解为有意义的词组,该拆分技术依赖于智能的语义分析以及电网行业词库的支持;(词组拆分:选定需要拆分的数据范围后,该方法实现的软件系统自动根据电力命名规则、电力调度语义逻辑和电力专有名词,对电力设备清单中指定列的内容进行词组拆分,形成单词和词组的混合词语库;)
判断疑似数据是否是同一个数据的方法是:完成词组判定,采用设备类别、调度命名规则、电网模型规则三步;第一步根据调度命名规则,找出词组中代表调度命名的数字组,判断疑似重复设备的调度命名是否相同,如果相同则进入下一规则判断;第二步根据两个系统中设备的基础信息,对设备的类别做初步判断,判断是否是同一个类别设备;第三步利用电网模型关系,追溯疑似重复设备的上级线路或上级厂站容器,判断是否属于同一线路或厂站。
本发明的有益效果是,通过该方法能够快速识别同一系统或不同系统的电力设备,既解决了同一部门或不同部门间电力设备信息不一致问题,为电力调度提供准确的基础信息;又能为跨部门的数据共享与交互提供统一的电力设备基础信息,保证了数据能够有效集成。该发明既提高了电力调度的安全性,又减少了因电力设备信息不一致增加的电网运营成本。
附图说明
图1为本发明中电力设备疑似重复数据识别的框架和逻辑图。
具体实施方式
如图1所示,一种电力设备疑似重复数据识别方法,包括电力行业词组拆分模块、电力行业词组判定模块、生成匹配结果模块、电力调度命名规则模块、电力行业专有名词库模块;其中以电力调度命名规则模块为核心,由电力调度命名规则模块分别连接电力行业词组拆分模块、电力行业词组判定模块,电力行业词组拆分模块分别连接电力行业词组判定模块、电力行业专有名词库模块,词电力行业组判定模块分别连接电力行业专有名词库模块、生成匹配结果模块;电力调度命名规则模块根据“电力调度规程”进行命名规则的维护和管理;电力设备数据识别以电力调度命名规则库为基准依据,进行电力设备名称的词组拆分、词组判定、生成匹配结果;其中:
电力调度命名规则模块通过关系型数据库进行存储,实现规则的电子化、结构化;该模块对关键词的确认:根据调度的命名规则,程序识别出拆分的词组中调度命名的数字组,并对数字组进行比对,还能够根据电网公共模型,搜索上级厂站或线路,确认是否属于同一线路或厂站,以及再次确认设备是否属于同一类别,最终确认出重复数据,在完成对电力设备命名的拆分、判定后,自动生成匹配的对应关系列表;
电力行业专有名词库模块采用语义分析功能,使每一次对设备命名的拆分都做到 拆分成词;
电力行业词组拆分模块通过对电力调度中词组或语句的分析进行拆分,并通过电力行业专有名词库进行校验;本模块中的程序以自动智能的分解调度设备命名字段,将字段分解为有意义的词组,该拆分技术依赖于智能的语义分析以及电网行业词库的支持;(词组拆分:选定需要拆分的数据范围后,该方法实现的软件系统自动根据电力命名规则、电力调度语义逻辑和电力专有名词,对电力设备清单中指定列的内容进行词组拆分,形成单词和词组的混合词语库;)
判断疑似数据是否是同一个数据的方法是:完成词组判定,采用设备类别、调度命名规则、电网模型规则三步;第一步根据调度命名规则,找出词组中代表调度命名的数字组,判断疑似重复设备的调度命名是否相同,如果相同则进入下一规则判断;第二步根据两个系统中设备的基础信息,对设备的类别做初步判断,判断是否是同一个类别设备;第三步利用电网模型关系,追溯疑似重复设备的上级线路或上级厂站容器,判断是否属于同一线路或厂站。
本发明中的其余模块均与电力调度命名规则和电力专有名词库模块链接;实现步骤如下:
第一步,建立基础信息。通过电力调度命名规则和电力专有名词库,实现企业中电力调度命名规则和电力行业及企业制定的专有名词的维护;
第二步,准备待识别的电力设备清单。若待别的电力设备位于不同信息系统的存储介质,可通过系统接口或文件导入两种方式,经电力设备清单导入到该方法实现的软件系统中。其中系统接口方式,实现了按钮操作,即只需点击数据导入按钮就实现数据导入;
第三步,词组拆分,选定需要拆分的数据范围后,该方法实现的软件系统自动根据电力命名规则、电力调度语义逻辑和电力专有名词,对电力设备清单中指定列的内容进行词组拆分,形成单词和词组的混合词语库;
第四步,词组判定,按照电力调度命名规则、语义逻辑、专有名词库、电网模型结构等对拆分后的词组进行判定,可录入词组判定说明内容;
第五步,生成匹配结果,根据词组判定结果自动生成判定结果。
以电网企业中电力调度自动化系统、电力调度运行管理系统、电网安全生产管理系统等三大系统中的电力设备数据识别为例,构建电网公司统一的电力设备台账库,其具体实施方式如下:
设备台账来源主要有以下途径,其中每个系统所包含的数据存在重复数据需要匹配:
1) 来源于电力调度自动化系统的电网模型,其中包含一次设备模型、保护设备模型;
2) 来源于PMS系统的电网设备台账,其中包含一次设备台账数据、二次设备台账数据;
3) 来源于电力调度运行管理系统的发电资源信息和检修设备数据,如发电厂、水库、小电厂等信息;
以上三个系统数据源各有特点,均有其利用价值,OMS系统设备台账可按照全景建模的技术思路,对三类数据资源进行整合,形成较为完备和准确的电网设备台账,方能较为全面地支持调度业务管理工作,对数据整合的基础就是完成重复数据的匹配工作。首先,电力调度自动化系统电网模型的数据准确高,一次设备也较为全面,可以该系统电网模型为基础,生成电网设备台账库,作为设备台账库的基础资源;其次进一步完成电力调度自动化系统与电力调度运行管理系统、电网安全生产管理系统的设备台账数据的匹配。由于电力调度自动化系统与电网安全生产管理系统的设备编码和命名存在一定的差异,利用本方法,实现两系统间编码的映射、匹配,以便于电力调度自动化系统与、电力调度运行管理系统、电网安全生产管理系统进行数据交换时,做相应的数据转换。

Claims (1)

1.一种电力设备疑似重复数据识别方法,其特征在于:包括电力行业词组拆分模块、电力行业词组判定模块、生成匹配结果模块、电力调度命名规则模块、电力行业专有名词库模块;其中以电力调度命名规则模块为核心,由电力调度命名规则模块分别连接电力行业词组拆分模块、电力行业词组判定模块,电力行业词组拆分模块分别连接电力行业词组判定模块、电力行业专有名词库模块,词电力行业组判定模块分别连接电力行业专有名词库模块、生成匹配结果模块;电力调度命名规则模块根据“电力调度规程”进行命名规则的维护和管理;电力设备数据识别以电力调度命名规则库为基准依据,进行电力设备名称的词组拆分、词组判定、生成匹配结果;其中:
电力调度命名规则模块通过关系型数据库进行存储,实现规则的电子化、结构化;该模块对关键词的确认:根据调度的命名规则,程序识别出拆分的词组中调度命名的数字组,并对数字组进行比对,还能够根据电网公共模型,搜索上级厂站或线路,确认是否属于同一线路或厂站,以及再次确认设备是否属于同一类别,最终确认出重复数据,在完成对电力设备命名的拆分、判定后,自动生成匹配的对应关系列表;
电力行业词组拆分模块通过对电力调度中词组或语句的分析进行拆分,并通过电力行业专有名词库进行校验;本模块中的程序以自动智能的分解调度设备命名字段,将字段分解为有意义的词组,该拆分技术依赖于智能的语义分析以及电网行业词库的支持;
判断疑似数据是否是同一个数据的方法是:完成词组判定,采用设备类别、调度命名规则、电网模型规则三步;第一步根据调度命名规则,找出词组中代表调度命名的数字组,判断疑似重复设备的调度命名是否相同,如果相同则进入下一规则判断;第二步根据两个系统中设备的基础信息,对设备的类别做初步判断,判断是否是同一个类别设备;第三步利用电网模型关系,追溯疑似重复设备的上级线路或上级厂站容器,判断是否属于同一线路或厂站。
CN201410316351.3A 2014-07-04 2014-07-04 一种电力设备疑似重复数据识别方法 Pending CN104036372A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410316351.3A CN104036372A (zh) 2014-07-04 2014-07-04 一种电力设备疑似重复数据识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410316351.3A CN104036372A (zh) 2014-07-04 2014-07-04 一种电力设备疑似重复数据识别方法

Publications (1)

Publication Number Publication Date
CN104036372A true CN104036372A (zh) 2014-09-10

Family

ID=51467135

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410316351.3A Pending CN104036372A (zh) 2014-07-04 2014-07-04 一种电力设备疑似重复数据识别方法

Country Status (1)

Country Link
CN (1) CN104036372A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105335899A (zh) * 2015-11-11 2016-02-17 国网山东省电力公司德州供电公司 一种电力线路智能命名系统
CN107944591A (zh) * 2017-05-22 2018-04-20 国家电网公司西南分部 基于电力调度通用数据对象的重复对象模糊检验优化算法
CN110019281A (zh) * 2017-09-13 2019-07-16 凌云天博光电科技股份有限公司 一种广电设备的识别方法及装置
CN110909525A (zh) * 2019-11-19 2020-03-24 云南电网有限责任公司信息中心 一种实现台账信息自动比对的系统及方法
CN111177323A (zh) * 2019-12-31 2020-05-19 国网安徽省电力有限公司安庆供电公司 基于人工智能的停电计划非结构化数据提取与识别方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1455286A1 (en) * 2003-03-05 2004-09-08 ABB Technology AG Computer-aided tendering of power supply facilities
CN102360470A (zh) * 2011-10-14 2012-02-22 广东电网公司电力科学研究院 一种电力系统信息匹配方法及其系统
CN103065217A (zh) * 2012-12-21 2013-04-24 浙江省电力公司台州电业局 电力整定计算系统中的数字模型拼接方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1455286A1 (en) * 2003-03-05 2004-09-08 ABB Technology AG Computer-aided tendering of power supply facilities
CN102360470A (zh) * 2011-10-14 2012-02-22 广东电网公司电力科学研究院 一种电力系统信息匹配方法及其系统
CN103065217A (zh) * 2012-12-21 2013-04-24 浙江省电力公司台州电业局 电力整定计算系统中的数字模型拼接方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
陈堃: "基于中文分词检索技术的企业名称查重系统的研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105335899A (zh) * 2015-11-11 2016-02-17 国网山东省电力公司德州供电公司 一种电力线路智能命名系统
CN107944591A (zh) * 2017-05-22 2018-04-20 国家电网公司西南分部 基于电力调度通用数据对象的重复对象模糊检验优化算法
CN110019281A (zh) * 2017-09-13 2019-07-16 凌云天博光电科技股份有限公司 一种广电设备的识别方法及装置
CN110019281B (zh) * 2017-09-13 2023-04-07 凌云天博光电科技股份有限公司 一种广电设备的识别方法及装置
CN110909525A (zh) * 2019-11-19 2020-03-24 云南电网有限责任公司信息中心 一种实现台账信息自动比对的系统及方法
CN111177323A (zh) * 2019-12-31 2020-05-19 国网安徽省电力有限公司安庆供电公司 基于人工智能的停电计划非结构化数据提取与识别方法
CN111177323B (zh) * 2019-12-31 2022-04-01 国网安徽省电力有限公司安庆供电公司 基于人工智能的停电计划非结构化数据提取与识别方法

Similar Documents

Publication Publication Date Title
CN104036372A (zh) 一种电力设备疑似重复数据识别方法
CN103955789A (zh) 一种基于调配用一体化模型的供电路径分析方法
CN108446396B (zh) 一种基于改进型cim模型的电力数据处理方法
CN103050931A (zh) 一种电力系统分层逐级数据匹配及继电保护定值融合方法
CN111985653A (zh) 基于知识图谱的电网故障知识推荐与知识管理系统及方法
CN101908176A (zh) 一种基于电力信息数据建模及元数据管理应用方法
CN102779156A (zh) 数字化变电站中通信装置的数据库配置方法
CN107590749A (zh) 一种配用电数据的处理方法及系统
CN104036373A (zh) 一种基于数据中心的电力调度设备主数据管理方法
CN102999524A (zh) 一种文档关联检索方法及系统
CN102142108A (zh) 适用于电力系统的物料与设备对应关系信息的处理方法
CN109802487B (zh) 一种主厂站源端维护功能实现方法及装置
CN111524031B (zh) 一种基于解析操作任务智能生成操作步骤的实现方法及系统
Hargreaves et al. Information standards to support application and enterprise interoperability for the smart grid
CN104240044A (zh) 智能核电站业务流程构建方法和统一业务流程处理平台
CN101867185A (zh) 电力系统的pi测点自动维护系统及其维护方法
CN104318739B (zh) 电力安全、质量现场监察主站-无线数据终端管理系统
CN110705911A (zh) 一种基于dms系统的配电网台帐异动的管理方法
CN104199663A (zh) 一种综合自动化信息表自动生成方法及系统
CN115347674A (zh) 配网虚拟生产指挥系统和方法
CN105574654A (zh) 一种基于数据中心的电力调度设备主数据管理方法
CN114782055A (zh) 一种电力营销便携式全方位操作台
CN113342987A (zh) 配电dtu验收专用语料库的复合网络构建方法
CN112446619A (zh) 配电网抢修处理方法和装置
CN105389300A (zh) 一种导入二维表格数据至配网GIS系统自动生成10kV设备数据的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20140910