CN113434584B - 电力设备数据处理方法、装置及电子设备 - Google Patents
电力设备数据处理方法、装置及电子设备 Download PDFInfo
- Publication number
- CN113434584B CN113434584B CN202110723477.2A CN202110723477A CN113434584B CN 113434584 B CN113434584 B CN 113434584B CN 202110723477 A CN202110723477 A CN 202110723477A CN 113434584 B CN113434584 B CN 113434584B
- Authority
- CN
- China
- Prior art keywords
- power
- record
- fields
- power equipment
- matching
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 25
- 238000000034 method Methods 0.000 claims abstract description 42
- 230000008569 process Effects 0.000 claims abstract description 13
- 230000015654 memory Effects 0.000 claims description 26
- 238000012545 processing Methods 0.000 claims description 25
- 238000004364 calculation method Methods 0.000 claims description 8
- 230000004044 response Effects 0.000 claims description 8
- 238000006243 chemical reaction Methods 0.000 claims 1
- 238000007726 management method Methods 0.000 description 14
- 238000010586 diagram Methods 0.000 description 13
- 238000004422 calculation algorithm Methods 0.000 description 8
- 230000005540 biological transmission Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 230000004927 fusion Effects 0.000 description 6
- 238000013461 design Methods 0.000 description 5
- 238000000605 extraction Methods 0.000 description 5
- 238000004590 computer program Methods 0.000 description 4
- 238000013507 mapping Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000010354 integration Effects 0.000 description 3
- 238000012423 maintenance Methods 0.000 description 3
- 238000012544 monitoring process Methods 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 238000011161 development Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000007499 fusion processing Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000005192 partition Methods 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013075 data extraction Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013467 fragmentation Methods 0.000 description 1
- 238000006062 fragmentation reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/25—Integrating or interfacing systems involving database management systems
- G06F16/252—Integrating or interfacing systems involving database management systems between a Database Management System and a front-end application
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/445—Program loading or initiating
- G06F9/44505—Configuring for program initiating, e.g. using registry, configuration files
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Public Health (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种电力设备数据处理方法、装置及电子设备。其中,该方法包括:获取第一电力系统中的第一电力设备记录,以及第二电力系统中的第二电力设备记录;提取第一电力设备记录中的字段,以及第二电力设备记录中的字段;将第一电力设备记录中的字段,以及第二电力设备记录中的字段进行匹配,得到第一电力设备记录中的字段与第二电力设备记录中的字段的近似度;在近似度超过预定阈值的情况下,建立第一电力设备记录和第二电力设备记录之间的关联关系。本发明解决了在电力系统中电力设备记录集成的过程中,存在不同系统之间的全字段匹配正确率低的技术问题。
Description
技术领域
本发明涉及计算机领域,具体而言,涉及一种电力设备数据处理方法、装置及电子设备。
背景技术
为保障电网的安全稳定运行,电网公司多个部门都建立了自己的业务系统。例如:调控中心的调度管理系统(outage management system,OMS),设备管理部的生产管理系统(power production management system,PMS)、供电服务指挥系统,等等。目前,在运营的电网拓扑类、设备运维类、资产管理类、保障信息类等各类业务系统多达数十个。各个业务系统采用不同的建模规则,同一个设备在不同的业务系统中的模型不同、身份编码(Identity document,ID)不同、字段名称不同。在保电指挥平台建设中,需要从多个不同类型的业务系统中接入数据,存在从多个业务系统接入类似的设备模型、同一个设备在不同的业务系统中存储在多个表、有多个ID、多个字段名称的问题,导致后期数据分析和应用很难开展。例如厂站表存在于地理信息系统(geographic Information System,GIS)系统及调度系统中,而两个系统的厂站ID不一致,从调度系统接入的变电站事故告警无法直接在GIS地图上展示,线路、一次设备等数据也存在类似的问题。基于上述问题,相关技术的电网设备模型在多个业务系统中进行数据融合时普遍仅采用简单的名称全匹配或者仅采用简单的部分匹配方法,前一种方法匹配的准确率高,但是由于电网设备命名不一致往往存在匹配数据覆盖率低的问题,后一种方法,提高了匹配覆盖率但会造成正确率下降。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种电力设备数据处理方法、装置及电子设备,以至少解决在电力系统中电力设备记录集成的过程中,存在不同系统之间的全字段匹配正确率低的技术问题。
根据本发明实施例的一个方面,提供了一种电力设备数据处理方法,包括:获取第一电力系统中的第一电力设备记录,以及第二电力系统中的第二电力设备记录;提取所述第一电力设备记录中的字段,以及所述第二电力设备记录中的字段;将所述第一电力设备记录中的字段,以及所述第二电力设备记录中的字段进行匹配,得到所述第一电力设备记录中的字段与所述第二电力设备记录中的字段的近似度;在所述近似度超过预定阈值的情况下,建立所述第一电力设备记录和所述第二电力设备记录之间的关联关系。
可选地,在所述第一电力设备记录中的字段为多个,所述第二电力设备记录中的字段也对应有多个的情况下,将所述第一电力设备记录中的字段,以及所述第二电力设备记录中的字段进行匹配,得到所述第一电力设备记录中的字段与所述第二电力设备记录中的字段的近似度,包括:针对所述第一电力设备记录中的第一字段,对应于所述第二电力设备记录中的第二字段,将所述第一字段与所述第二字段进行匹配,得到所述第一字段和所述第二字段之间的近似度,其中,所述第一字段为所述第一电力设备记录中多个字段中的任一字段;分别获得所述第一电力设备记录中多个字段分别与第二电力设备记录中的多个字段之间的多个近似度;对所述多个近似度进行处理,得到总近似度,将所述总近似度作为所述第一电力设备记录中的字段与所述第二电力设备记录中的字段的近似度。
可选地,将所述第一字段与所述第二字段进行匹配,得到所述第一字段和所述第二字段之间的近似度,包括:将所述第一字段转换为第一字符串,以及将所述第二字段转化为第二字符串;获取所述第一字符串和所述第二字符串之间的编辑距离;依据所述编辑距离确定所述第一字段和所述第二字段之间的近似度。
可选地,在获取第一电力系统中的第一电力设备记录,以及第二电力系统中的第二电力设备记录之前,还包括:通过配置界面接收匹配场景,以及进行匹配的配置信息,其中,所述匹配场景用于确定进行匹配的对象,所述配置信息用于确定进行匹配字段,以及进行匹配的所述预定阈值,进行匹配的对象包括所述第一电力设备记录和所述第二电力设备记录。
可选地,在所述近似度超过预定阈值的情况下,建立所述第一电力设备记录和所述第二电力设备记录之间的关联关系包括:在所述第二电力设备记录包括多个的情况下,对所述第一电力设备记录分别与多个第二电力设备记录之间对应的多个近似度进行排序,得到排序结果;依据排序结果,从所述多个第二电力设备记录中选择预定数量的第二电力设备记录;建立所述第一电力设备记录和所述预定数量的第二电力设备记录之间的关联关系。
可选地,上述方法还包括:通过匹配界面,显示所述第一电力系统中未匹配的第三电力设备记录,以及所述第二电力系统中用于匹配的多个第四电力设备记录;接收对所述多个第四电力设备记录中预定数量个第四电力设备记录的选中操作;响应建立关联关系的操作,建立所述第三电力设备记录与所述预定数量个第四电力设备记录之间的关联关系。
根据本发明实施例的另一方面,还提供了一种电力设备数据处理装置,包括:获取模块,用于获取第一电力系统中的第一电力设备记录,以及第二电力系统中的第二电力设备记录;提取模块,用于提取所述第一电力设备记录中的字段,以及所述第二电力设备记录中的字段;匹配模块,用于将所述第一电力设备记录中的字段,以及所述第二电力设备记录中的字段进行匹配,得到所述第一电力设备记录中的字段与所述第二电力设备记录中的字段的近似度;建立模块,用于在所述近似度超过预定阈值的情况下,建立所述第一电力设备记录和所述第二电力设备记录之间的关联关系。
根据本发明实施例的另一方面,还提供了一种电子设备,包括:处理器;用于存储所述处理器可执行指令的存储器;其中,所述处理器被配置为执行所述指令,以实现任一项所述的电力设备数据处理方法。
根据本发明实施例的另一方面,还提供了一种计算机可读存储介质,当所述计算机可读存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行任一项所述的电力设备数据处理方法。
根据本发明实施例的另一方面,还提供了一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现任一项所述的电力设备数据处理方法。
在本发明实施例中,采用在不同电力系统中依据近似度进行字段匹配的方式,达到了不同电力系统中电力设备记录相匹配的目的,从而实现了高效、准确地实现数据匹配的技术效果,进而解决了在电力系统中电力设备记录集成的过程中,存在不同系统之间的全字段匹配正确率低的技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的电力设备数据处理方法的流程图;
图2是根据本发明可选实施方式提供的完整匹配融合流程的流程图
图3是根据本发明可选实施方式提供的模型融合工具整体结构的结构框图;
图4是根据本发明可选实施方式提供的模型手动匹配界面的示意图;
图5是根据本发明可选实施方式提供的匹配场景和匹配规则配置界面的示意图;
图6是根据本发明实施例的电力设备数据处理装置的结构框图;
图7是根据本发明实施例的一种终端的装置框图;
图8是根据本发明实施例的一种服务器的装置框图。
具体实施方式
根据本发明实施例,提供了一种电力设备数据处理方法的实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图1是根据本发明实施例的电力设备数据处理方法,如图1所示,该方法包括如下步骤:
步骤S102,获取第一电力系统中的第一电力设备记录,以及第二电力系统中的第二电力设备记录;
步骤S104,提取第一电力设备记录中的字段,以及第二电力设备记录中的字段;
步骤S106,将第一电力设备记录中的字段,以及第二电力设备记录中的字段进行匹配,得到第一电力设备记录中的字段与第二电力设备记录中的字段的近似度;
步骤S108,在近似度超过预定阈值的情况下,建立第一电力设备记录和第二电力设备记录之间的关联关系。
通过上述步骤,采用在不同电力系统中依据近似度进行字段匹配的方式,达到了在不同电力系统中将电力设备记录相匹配的目的,实现了高效、准确地实现数据匹配的技术效果,进而解决了在电力系统中电力设备记录集成的过程中,存在不同系统之间的全字段匹配正确率低的技术问题。
作为一种可选的实施例,第一电力系统、第二电力系统可以是包括分布在电网公司的多个部门中的多个系统,可以包括多种类型下的系统,例如,电网拓扑类、设备运维类、资产管理类、保障信息类等各类业务系统。具体地,各类业务系统可以包括多种系统,例如,调控中心的调度管理系统(outage management system,OMS),设备管理部的生产管理系统(power production management system,PMS)、供电服务指挥系统,等等。在进行第一电力系统与第二电力系统的选取时,可以将某个电力设备记录更全,信息更新更及时的系统作为第一电力系统,将其他系统作为第二电力系统,将第一电力系统与第二电力系统中的电力设备记录进行匹配。能够解决多个业务系统存储在多个表、多种电力设备记录中字段名称不同的问题,保证所有接入电力系统的电力设备记录都能够相互关联。
作为一种可选的实施例,获取电力系统中的电力设备记录,其中,电力系统中根据作用不同,运营场景不同,包含多条电力设备记录,且在电力设备记录中,根据时间的不同,获取的电力设备记录中的字段数据信息会有所不同。所以根据需求选取需要匹配的电力设备记录,能够实时地,或者按规定时间段地将多个电力系统中的电力设备记录进行匹配。保证能够电力设备记录进行匹配,满足了不同场景下电力系统匹配的不同需求。
作为一种可选的实施例,提取电力系统中的字段,包括提取第一电力设备记录中的字段与第二电力设备记录中的字段,在不同的系统中,依据不同的建模规则,记载相同意义信息电力设备记录中的字段可能不同,所包括字段的个数也可能不同,例如,在总变电场站表中包括厂站ID(Identity document,ID),城市名称,电压等级,厂站名称,等等十种字段信息;在能量管理系统(Energy Management System,EMS)变电站表中包括OID(也称为baseid),变电站名称,所属于空去,电压等级,等等八种字段信息。可知,厂站ID与OID所表达意义相同,均表达该设备的ID编号;城市名称与所属于子控区所表达意义相同,均表达该设备作用的地区;厂站名称与变电站名称所表达意义相同,均表达该设备的名称;故字段信息不同,表达意义可能相同,基于上述问题,就要提取出电力设备记录中的字段,便于将不同的电力系统设备中电力设备记录进行匹配。
作为一种可选的实施例,将第一电力设备记录中的字段,以及第二电力设备记录中的字段进行匹配,得到第一电力设备记录中的字段与第二电力设备记录中的字段的近似度。在该字段的匹配过程中,可以运用多种方式,例如,全手动匹配,全自动匹配,自动匹配与手动匹配结合的匹配方式,等等;其中,在运用自动匹配进行字段的匹配过程中,又可以采用多种方法,例如,基于最小编辑距离计算匹配度实现自动匹配,基于数据库中字段匹配数据计算匹配度实现自动匹配,建立对应系统的字段匹配数据库计算匹配度实现自动匹配,等等。在自动匹配后,可以得到字段之间的近似度,以表示第一电力设备中的字段与第二电力设备记录中的字段之间的相似程度,即上述字段之间为相同意义字段的可能性大小,根据该近似度的大小对字段进行选取,保证在自动匹配过程中能够选出近似度较大的字段,便于后续字段的匹配处理。
作为一种可选的实施例,在第一电力设备记录中的字段为多个,第二电力设备记录中的字段也对应有多个的情况下,将第一电力设备记录中的字段,以及第二电力设备记录中的字段进行匹配,得到第一电力设备记录中的字段与第二电力设备记录中的字段的近似度。电力设备记录中字段一般为多个,为了将多个字段都进行相应的匹配,就要将选取出第一电力设备记录中字段与第二电力设备记录中字段相匹配的字段,实现字段全匹配,在多个字段中找到与之相对应的字段进行字段匹配,在实现字段全匹配的同时避免了电力设备记录遗漏,有利于实现电力系统中电力设备记录的匹配。
作为一种可选的实施例,将第一字段与第二字段进行匹配,得到第一字段和第二字段之间的近似度,其中,包括采用基于最小编辑距离算法计算匹配度,具体地,将第一字段转换为第一字符串,以及将第二字段转化为第二字符串;获取第一字符串和第二字符串之间的编辑距离;依据编辑距离确定第一字段和第二字段之间的近似度。在上述字段转换成字符串的过程中,可以对字段进行关键字提取,可以选取多种方式,基于特征的特征提取模型,基于数据库的网络模型,等等,以得到提取后的匹配字符串。其中,包括在字段个数为多个的情况,此时,可以采用某种策略计算出一个总的匹配度作为判断依据,其中,选取的策略可以为多种,例如,可以为平均值计算方法,加权平均值计算方法,等等。需要说明的是,选取策略的方式可以根据具体应用场景与需求进行选择。且在依据字符串的编辑距离得到字段之间的近似度时,上述字符串的编辑距离,是指利用字符操作,把字符串A转换成字符串B所需要的最少操作数,其中,字符操作可以包括多种,例如,删除一个字符、插入一个字符、修改一个字符。例如,对于字符串"if"和"iff",可以通过插入一个'f'或者删除一个'f'来达到目的,因此编辑距离为1。一般来说,两个字符串的编辑距离越小,则该字符串所表示的字段越相似。依据该最小编辑距离算法计算匹配度,保证计算所得匹配度准确,使得电力系统的电力设备记录匹配准确。
作为一种可选的实施例,得到第一电力设备记录中的字段与第二电力设备记录中的字段的近似度,在近似度超过预定阈值的情况下,建立第一电力设备记录和第二电力设备记录之间的关联关系。当近似度超过预定阈值时,可以认为当前第一电力设备记录中的字段与第二电力设备记录中的字段具有关联关系;当近似度低于或等于预定阈值时,可以认为当前第一电力设备记录中的字段与第二电力设备记录中的字段不具有关联关系,即不匹配。其中,关联关系可以有很多,例如,完全匹配,近似匹配,等等。其中,设定预定阈值以使上述字段具有关联关系,也可以采用多种方式,例如,设定预定阈值为100%,记为完全匹配,直接匹配当前第一电力设备记录与第二电力设备记录之间的字段;设定预定阈值为90%,记为近似匹配,认为当前第一电力设备记录与第二电路设备记录之间的字段相似;设定当前字段预定阈值为70%,领先其他字段预定阈值为100%,认为当前第一电力设备记录与第二电路设备记录之间的字段相似;设定当前字段预定阈值为80%,其他字段预定阈值为低于10%,认为当前第一电力设备记录与第二电路设备记录之间的字段相似;等等。需要说明的是,当关联关系为近似匹配时,在后续的电力设备记录处理过程中,可以进行校核等其他操作,确定该近似电力设备记录是否匹配相应的电力设备记录。上述依据实际需求或数据库所得最接近相关结果对该预定阈值进行设定,保证能够使得字段之间干扰程度最低,且能获得最相似、准确的近似结果。
作为一种可选的实施例,在近似度超过预定阈值的情况下,建立第一电力设备记录和第二电力设备记录之间的关联关系包括:在第二电力设备记录包括多个的情况下,对第一电力设备记录分别与多个第二电力设备记录之间对应的多个近似度进行排序,得到排序结果;依据排序结果,从多个第二电力设备记录中选择预定数量的第二电力设备记录。在近似度超过预定阈值的情况下,可以认为当前第一电力设备记录中的字段与第二电力设备记录中的字段具有关联关系,但是存在过多条第二电力设备记录与第一电力设备记录具有关联关系的情况,因此,需要对第二电力设备记录进行筛选。则依据第一电力设备记录分别与多个第二电力设备记录之间对应的多个近似度进行排序,选取预定数量个数据,能够保证与某一条第一电力设备记录具有关联关系的第二电力设备记录不会过于繁多,避免加重计算量。
作为一种可选的实施例,在获取第一电力系统中的第一电力设备记录,以及第二电力系统中的第二电力设备记录之前,还包括:通过配置界面接收匹配场景,以及进行匹配的配置信息,其中,匹配场景用于确定进行匹配的对象,配置信息用于确定进行匹配字段,以及进行匹配的预定阈值,进行匹配的对象包括第一电力设备记录和第二电力设备记录;建立第一电力设备记录和预定数量的第二电力设备记录之间的关联关系。其中,配置界面可以为多种,例如,B/S界面,APP应用程序,等等。以在B/S界面中为例,该步骤可以确定进行匹配的第一电力设备记录以及第二电力设备记录,确定进行匹配的字段,还可以设置用于匹配的预定阈值,以建立第一电力设备记录与预定数量的第二电力设备记录之间的关联关系。使得在电力系统中电力设备记录的匹配有据所依。
作为一种可选的实施例,通过匹配界面,显示第一电力系统中未匹配的第三电力设备记录,以及第二电力系统中用于匹配的多个第四电力设备记录;接收对多个第四电力设备记录中预定数量个第四电力设备记录的选中操作;响应建立关联关系的操作,建立第三电力设备记录与预定数量个第四电力设备记录之间的关联关系。其中,未匹配的电力设备记录,可以是电力设备记录中的字段匹配低于预定阈值的记录,即当近似度低于或等于预定阈值时,认为的当前第一电力设备记录中的字段与第二电力设备记录中的字段不具有关联关系的记录。在匹配界面可以将不具有关联关系,即未匹配电力设备记录进行匹配,保证全部电力设备记录都能够由对应的电力设备记录与之匹配,避免遗漏。
基于上述实施例及可选实施例,提供了一种可选实施方式,下面具体说明。
在相关技术中,电力信息集成类业务系统较多,具体地,对于保电指挥与输变电在线监测系统来说,结合上述保电指挥和输变电在线监测两个系统的具体需求可以得知,目前在电力信息集成类业务系统建设过程中,接入多套信息化系统数据时,往往会遇到模型不一致的问题(即各系统不识别其他系统中相同的对象),最典型的是资产管理类系统和调度自动化系统,由于种种原因各自都会从自身业务的需求出发建立各自独立的设备模型,造成数据割裂无法集成。
针对上述问题,提出了一种建立模型主表与模型子表,并将模型主表与模型子表中的数据相匹配的方法。在建立模型主表与模型子表的过程中,考虑到资产管理类系统中数据更全、信息更新更及时,可以在此类信息集成系统建模时以资产管理类系统的设备数据表作为模型主表,其他系统设备表如EMS系统设备表作为子表。即,以资产管理类系统的设备对象ID作为全局ID,同时扩展出其他系统模设备映射ID字段,通过模型匹配工具将子表的私有ID填入映射ID字段。
举例说明,表1是冬奥保电指挥平台模型中的变电站模型主表,表2是EMS系统导入的变电站子表,主表厂站ID以PMS系统厂站作为主键ID,导入的EMS系统厂站OID利用匹配工具填入主表“EMS_MAPPER_ID”字段。
表1
表2
如上述表1、表2的匹配变电站记录,匹配两条变电站记录的依据是一个或者多个字段相匹配,例如厂站名称、电压等级、地市名称等,其他的设备匹配也是一样的策略。但是不同系统的设备表相同的字段内容可能存在差异,比如厂站名称可能是A站、A门等等;线路名称会带有退役、支线标识,这会导致只有部分数据能够完全匹配,还有一部分数据只能部分匹配。
鉴于此,本发明可选实施方式中提供了一种基于最小编辑距离算法的保电全要素模型的匹配度多维计算方法,为了准确匹配设备记录,模型融合工具采用匹配度计算和近似判定的策略,实现电网拓扑、设备运维、资产管理、保障信息等各类系统间同一要素的模型自动匹配。与传统方法相比,将自动匹配与手动匹配相结合,同时提高了模型匹配正确率和覆盖率。能够支持多种电力系统的开发,例如,冬奥电力保障智慧指挥平台(EOC系统),下面对本发明可选实施方式进行详细说明。
(一)匹配
1.匹配度计算
经过关键字提取后的匹配字符串利用最小编辑距离算法计算匹配度,如果匹配的是多个字段,那么可以以某种策略,例如,平均值算法、加权平均值算法,等等,计算出一个总的匹配度进行比较作为判断依据。其中,在匹配度计算时,根据识别对象类型,可以调整算法里面某个加权值的权重,实现多种保电要素模型的匹配度多维计算。
需要说明的是,字符串的编辑距离,是指利用字符操作,把字符串A转换成字符串B所需要的最少操作数。其中,字符操作包括:1)删除一个字符;2)插入一个字符;3)修改一个字符。例如对于字符串"if"和"iff",可以通过插入一个'f'或者删除一个'f'来达到目的,因此编辑距离为1。一般来说,两个字符串的编辑距离越小,则它们越相似。
2.近似匹配
如果计算后的近似度为100,而且只存在一条匹配记录,那可以认为完全匹配。实际匹配过程中可能有一部分情况是非完全匹配,那么满足一定条件的记录也可以近似认为是完全匹配,例如只有一条记录匹配度达到阈值(例如70)而且领先第二名的幅度达到阈值(例如100%),则可以认为是近似匹配。表3是变电站模型主表中部分字段数据记录,表2是EMS变电站表中部分字段数据记录及匹配度记录。可知在表2中第一条数据为完全匹配,第二、三条数据为近似匹配。
表3
表4
模型融合工具提供自动、手动两种匹配模式,图2是根据本发明可选实施方式提供的完整匹配融合流程的流程图,如图2所示,自动匹配适用于数据抽取后对未匹配数据按照完全匹配和近似匹配策略进行自动匹配;手动匹配用于对无法自动匹配的模型进行手动匹配,采用B/S界面分区分别展示两个系统的模型表,用户点击任意一条记录,按照近似度排序展示一定数量的待匹配记录,用户确认后进行匹配。只有完全匹配的才能自动匹配入库,部分匹配的必须人工校核。
(二)整体设计
图3是根据本可选实施方式提供的模型融合工具整体结构的结构框图,如图3所示,模型融合工具按照模块化设计原装,在满足保电指挥和输变电在线监测系统的设备模型匹配需求基础上,将数据匹配功能提取出来作为通用的基础模块,可以为其他系统和项目基于字符串的对象匹配工具提供支撑。自动匹配和手动匹配工具与集成模型相关,目前保电指挥和输变电在线监测设计使用相同的电力设备模型,因此在上述两个系统中是通用的。
1、数据匹配基础模块
数据匹配基础模块设计为一个通用的数据匹配功能,与集成系统的具体模型无关。功能是对输入的待匹配数据和匹配数据集使用最小编辑距离算法,计算并返回一定数量的匹配数据及其匹配度。
输入:1)待匹配数据:模型主表中一条未匹配的记录;
2)匹配数据集:模型子表的一批记录;
3)匹配字段集:待匹配数据和匹配数据用于匹配的字段列表,相对应的字段数量和含义是一致的。
输出:匹配数据集和匹配度,即按照匹配度排序的匹配数据集合以及每条数据的匹配度,返回的匹配数据集的数量可以是固定的数值,也可以是输入匹配数据集数量的固定百分比。
2.自动匹配
自动匹配模块可以实现为后台程序,在ETL抽取后通过人工触发或者定时触发方式对未匹配数据进行一次批量自动匹配。需要说明的是,自动匹配分为完全匹配和近似匹配两种情况1)完全匹配:有且只有一条匹配度100的记录;2)近似匹配,可以包括a)、b)两种方式,其中,a)有且只要一条匹配度(如75)达到阈值(如70)的记录;b)该条记录匹配度(如80)与排第二的记录匹配度(如30)的比值(2.67)超过领先度阈值(如2.5)。
输入:1)集成模型:从关系库中读取未匹配的主模型数据、用于匹配的其他系统模型数据;
2)参考匹配数据集和匹配度:调用数据匹配基础模块获得其输出结果,即调用数据匹配基础模块进行匹配;
3)近似匹配规则,包括匹配度阈值和领先度阈值;
输出:集成模型,即判定匹配记录并在主模式上进行数据匹配。
3.手动匹配
手动匹配模块用于对无法自动匹配的模型进行手动匹配,采用B/S界面分区分别展示两个系统的模型表,用户点击任意一条记录,按照近似度排序展示一定数量的待匹配记录,用户确认后进行映射ID关联。
输入:1)集成模型:从关系库中读取未匹配的主模型数据、用于匹配的子模型数据;
2)参考匹配数据集和匹配度:调用数据匹配基础模块获得其输出结果,即调用上述自动匹配中数据匹配模块的匹配结果;
输出:集成模型,即根据用户操作在主模式上进行数据匹配。
4.匹配规则配置
手动匹配模块的B/S界面除了支持部分模型数据手动匹配之外,还提供了匹配场景和规则的配置功能,包括定义匹配模型、匹配字段、近似匹配规则,这些规则作为数据匹配基础模块和在自动匹配模块的输入。
(三)界面设计
图4是根据本可选实施方式提供的模型手动匹配界面的示意图,如图4所示,左侧的模型匹配菜单下展示了所有配置的匹配场景如厂站匹配、线路匹配等。点击任意匹配场景在右侧打开对应的匹配界面。匹配界面分左右展示匹配主表和子表的数据,鼠标选中主表任意记录,在右侧子表展示区域按照匹配度排序展示候选匹配记录并且自动选中匹配度最高的记录,用户可以手动修改其他候选匹配记录,点击关联按钮进行数据关联。如果点击主表已关联记录,在右侧子表用特殊颜色标识已匹配子表记录,点击按钮可以取消关联。界面上还提供了主表子表记录的筛选排序功能,可以按照各个匹配字段、关联状态进行筛选和排序。
图5是根据本可选实施方式提供的匹配场景和匹配规则配置界面的示意图,如图5所示,负责配置前述模型手动匹配界面所有的匹配场景和每个匹配场景对应的数据库表、字段和近似匹配规则。
(四)数据库设计
1.匹配表信息MAP_TABLE_INFO
存储所有通过WEB展示和配置的模型匹配场景,一条记录表示一个匹配场景如厂站匹配、线路匹配等,表5是记录信息,如表5所示,记录信息包括了主表、子表的数据库表名、映射字段的数据库字段名、近似匹配的匹配度阈值和领先度阈值。
表5
2.匹配域信息MAP_FIELD_INFO
存储每个匹配场景的匹配字段信息,一个匹配场景会有一个或者多个匹配字段,对应本表的多条记录,表6是匹配字段信息,如表所示,每条匹配字段信息包含了主表、子表的数据库字段名以及中文展示名称。
字段名 | 数据类型 | 键 | 非空 | 注释 |
MAP_FIELD_ID | NUMBER(8) | 主键 | Yes | 匹配字段信息ID |
MAP_TABLE_ID | NUMBER(8) | 外键 | Yes | 所属匹配表信息ID |
MAIN_MATCH_FIELD_NAME | VARchar(64) | Yes | 主表匹配字段名 | |
MAIN_MATCH_FIELD_CNAME | VARchar(64) | Yes | 主表匹配字段中文显示名 | |
SUB_MATCH_FIELD_NAME | VARchar(64) | Yes | 子表匹配字段名 | |
SUB_MATCH_FIELD_CNAME | VARchar(64) | Yes | 子表匹配字段中文显示名 |
表6
通过上述可选实施方式,可以达到至少以下几点有益效果:
(1)实现了涵盖各类业务系统间同一要素的模型匹配;
(2)将自动匹配与手动匹配相结合,提高了模型匹配正确率和覆盖率;
(3)能够支持多种电力系统的开发。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例的方法。
实施例2
根据本发明实施例,还提供了一种用于实施上述电力设备数据处理方法的装置,图6是根据本发明实施例的电力设备数据处理装置的结构框图,如图6所示,该装置包括:获取模块602,提取模块604,匹配模块606和建立模块608,下面对该装置进行详细说明。
获取模块602,用于获取第一电力系统中的第一电力设备记录,以及第二电力系统中的第二电力设备记录;提取模块604,连接于上述获取模块602,用于提取第一电力设备记录中的字段,以及第二电力设备记录中的字段;匹配模块606,连接于上述提取模块604,用于将第一电力设备记录中的字段,以及第二电力设备记录中的字段进行匹配,得到第一电力设备记录中的字段与第二电力设备记录中的字段的近似度;建立模块608,连接于上述匹配模块606,用于在近似度超过预定阈值的情况下,建立第一电力设备记录和第二电力设备记录之间的关联关系。
此处需要说明的是,上述第获取模块602,提取模块604,匹配模块606和建立模块608对应于实施电力设备数据处理方法中的步骤S102至步骤S108,多个模块与对应的步骤所实现的实例和应用场景相同,但不限于上述实施例1所公开的内容。
实施例3
本公开的实施例可以提供一种电子设备,该电子设备可以是一种终端,也可以是一种服务器。在本实施例中,该电子设备作为一种终端可以是计算机终端群中的任意一个计算机终端设备。可选地,在本实施例中,上述终端也可以为移动终端等终端设备。
可选地,在本实施例中,上述终端可以位于计算机网络的多个网络设备中的至少一个网络设备。
可选地,图7是根据一示例性实施例示出的一种终端的结构框图。如图7所示,该终端可以包括:一个或多个(图中仅示出一个)处理器71、用于存储处理器可执行指令的存储器72;其中,处理器被配置为执行指令,以实现上述任一项的电力设备数据处理方法。
其中,存储器可用于存储软件程序以及模块,如本公开实施例中的电力设备数据处理方法和装置对应的程序指令/模块,处理器通过运行存储在存储器内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的电力设备数据处理方法。存储器可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器可进一步包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至计算机终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
处理器可以通过传输装置调用存储器存储的信息及应用程序,以执行下述步骤:获取第一电力系统中的第一电力设备记录,以及第二电力系统中的第二电力设备记录;提取第一电力设备记录中的字段,以及第二电力设备记录中的字段;将第一电力设备记录中的字段,以及第二电力设备记录中的字段进行匹配,得到第一电力设备记录中的字段与第二电力设备记录中的字段的近似度;在近似度超过预定阈值的情况下,建立第一电力设备记录和第二电力设备记录之间的关联关系。
可选的,上述处理器还可以执行如下步骤的程序代码:在第一电力设备记录中的字段为多个,第二电力设备记录中的字段也对应有多个的情况下,将第一电力设备记录中的字段,以及第二电力设备记录中的字段进行匹配,得到第一电力设备记录中的字段与第二电力设备记录中的字段的近似度,包括:针对第一电力设备记录中的第一字段,对应于第二电力设备记录中的第二字段,将第一字段与第二字段进行匹配,得到第一字段和第二字段之间的近似度,其中,第一字段为第一电力设备记录中多个字段中的任一字段;分别获得第一电力设备记录中多个字段分别与第二电力设备记录中的多个字段之间的多个近似度;对多个近似度进行处理,得到总近似度,将总近似度作为第一电力设备记录中的字段与第二电力设备记录中的字段的近似度。
可选的,上述处理器还可以执行如下步骤的程序代码:将第一字段与第二字段进行匹配,得到第一字段和第二字段之间的近似度,包括:将第一字段转换为第一字符串,以及将第二字段转化为第二字符串;获取第一字符串和第二字符串之间的编辑距离;依据编辑距离确定第一字段和第二字段之间的近似度。
可选的,上述处理器还可以执行如下步骤的程序代码:在获取第一电力系统中的第一电力设备记录,以及第二电力系统中的第二电力设备记录之前,还包括:通过配置界面接收匹配场景,以及进行匹配的配置信息,其中,匹配场景用于确定进行匹配的对象,配置信息用于确定进行匹配字段,以及进行匹配的预定阈值,进行匹配的对象包括第一电力设备记录和第二电力设备记录。
可选的,上述处理器还可以执行如下步骤的程序代码:在近似度超过预定阈值的情况下,建立第一电力设备记录和第二电力设备记录之间的关联关系包括:在第二电力设备记录包括多个的情况下,对第一电力设备记录分别与多个第二电力设备记录之间对应的多个近似度进行排序,得到排序结果;依据排序结果,从多个第二电力设备记录中选择预定数量的第二电力设备记录;建立第一电力设备记录和预定数量的第二电力设备记录之间的关联关系。
可选的,上述处理器还可以执行如下步骤的程序代码:上述方法还包括:通过匹配界面,显示第一电力系统中未匹配的第三电力设备记录,以及第二电力系统中用于匹配的多个第四电力设备记录;接收对多个第四电力设备记录中预定数量个第四电力设备记录的选中操作;响应建立关联关系的操作,建立第三电力设备记录与预定数量个第四电力设备记录之间的关联关系。
在本公开的实施例中,该电子设备作为一种服务器,图8是根据一示例性实施例示出的一种服务器的结构框图。如图8所示,该服务器80可以包括:一个或多个(图中仅示出一个)处理组件81、用于存储处理组件81可执行指令的存储器82、提供电源的电源组件83,实现与外部网络通信的网络接口84和与外部进行数据传输的I/O输入输出接口85;其中,处理组件81被配置为执行指令,以实现上述任一项的电力设备数据处理方法。
其中,存储器可用于存储软件程序以及模块,如本公开实施例中的电力设备数据处理方法和装置对应的程序指令/模块,处理器通过运行存储在存储器内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的电力设备数据处理方法。存储器可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器可进一步包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至计算机终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
处理组件可以通过传输装置调用存储器存储的信息及应用程序,以执行下述步骤:获取第一电力系统中的第一电力设备记录,以及第二电力系统中的第二电力设备记录;提取第一电力设备记录中的字段,以及第二电力设备记录中的字段;将第一电力设备记录中的字段,以及第二电力设备记录中的字段进行匹配,得到第一电力设备记录中的字段与第二电力设备记录中的字段的近似度;在近似度超过预定阈值的情况下,建立第一电力设备记录和第二电力设备记录之间的关联关系。
可选的,上述处理组件还可以执行如下步骤的程序代码:在第一电力设备记录中的字段为多个,第二电力设备记录中的字段也对应有多个的情况下,将第一电力设备记录中的字段,以及第二电力设备记录中的字段进行匹配,得到第一电力设备记录中的字段与第二电力设备记录中的字段的近似度,包括:针对第一电力设备记录中的第一字段,对应于第二电力设备记录中的第二字段,将第一字段与第二字段进行匹配,得到第一字段和第二字段之间的近似度,其中,第一字段为第一电力设备记录中多个字段中的任一字段;分别获得第一电力设备记录中多个字段分别与第二电力设备记录中的多个字段之间的多个近似度;对多个近似度进行处理,得到总近似度,将总近似度作为第一电力设备记录中的字段与第二电力设备记录中的字段的近似度。
可选的,上述处理组件还可以执行如下步骤的程序代码:将第一字段与第二字段进行匹配,得到第一字段和第二字段之间的近似度,包括:将第一字段转换为第一字符串,以及将第二字段转化为第二字符串;获取第一字符串和第二字符串之间的编辑距离;依据编辑距离确定第一字段和第二字段之间的近似度。
可选的,上述处理组件还可以执行如下步骤的程序代码:在获取第一电力系统中的第一电力设备记录,以及第二电力系统中的第二电力设备记录之前,还包括:通过配置界面接收匹配场景,以及进行匹配的配置信息,其中,匹配场景用于确定进行匹配的对象,配置信息用于确定进行匹配字段,以及进行匹配的预定阈值,进行匹配的对象包括第一电力设备记录和第二电力设备记录。
可选的,上述处理组件还可以执行如下步骤的程序代码:在近似度超过预定阈值的情况下,建立第一电力设备记录和第二电力设备记录之间的关联关系包括:在第二电力设备记录包括多个的情况下,对第一电力设备记录分别与多个第二电力设备记录之间对应的多个近似度进行排序,得到排序结果;依据排序结果,从多个第二电力设备记录中选择预定数量的第二电力设备记录;建立第一电力设备记录和预定数量的第二电力设备记录之间的关联关系。
可选的,上述处理组件还可以执行如下步骤的程序代码:上述方法还包括:通过匹配界面,显示第一电力系统中未匹配的第三电力设备记录,以及第二电力系统中用于匹配的多个第四电力设备记录;接收对多个第四电力设备记录中预定数量个第四电力设备记录的选中操作;响应建立关联关系的操作,建立第三电力设备记录与预定数量个第四电力设备记录之间的关联关系。
本领域普通技术人员可以理解,图7,图8所示的结构仅为示意,例如,上述终端也可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌声电脑以及移动互联网设备(Mobile Internet Devices,MID)、PAD等终端设备。图7,图8其并不对上述电子装置的结构造成限定。例如,还可包括比图7,图8中所示更多或者更少的组件(如网络接口、显示装置等),或者具有与图7,图8所示不同的配置。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(Read-Only Memory,ROM)、随机存取器(RandomAccess Memory,RAM)、磁盘或光盘等。
实施例4
在示例性实施例中,还提供了一种包括指令的计算机可读存储介质,当计算机可读存储介质中的指令由终端的处理器执行时,使得终端能够执行上述任一项的电力设备数据处理方法。可选地,计算机可读存储介质可以是非临时性计算机可读存储介质,例如,非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
可选地,在本实施例中,上述计算机可读存储介质可以用于保存上述实施例所提供的电力设备数据处理方法所执行的程序代码。
可选地,在本实施例中,上述计算机可读存储介质可以位于计算机网络中计算机终端群中的任意一个计算机终端中,或者位于移动终端群中的任意一个移动终端中。
可选地,在本实施例中,计算机可读存储介质被设置为存储用于执行以下步骤的程序代码:获取第一电力系统中的第一电力设备记录,以及第二电力系统中的第二电力设备记录;提取第一电力设备记录中的字段,以及第二电力设备记录中的字段;将第一电力设备记录中的字段,以及第二电力设备记录中的字段进行匹配,得到第一电力设备记录中的字段与第二电力设备记录中的字段的近似度;在近似度超过预定阈值的情况下,建立第一电力设备记录和第二电力设备记录之间的关联关系。
可选地,在本实施例中,计算机可读存储介质被设置为存储用于执行以下步骤的程序代码:在第一电力设备记录中的字段为多个,第二电力设备记录中的字段也对应有多个的情况下,将第一电力设备记录中的字段,以及第二电力设备记录中的字段进行匹配,得到第一电力设备记录中的字段与第二电力设备记录中的字段的近似度,包括:针对第一电力设备记录中的第一字段,对应于第二电力设备记录中的第二字段,将第一字段与第二字段进行匹配,得到第一字段和第二字段之间的近似度,其中,第一字段为第一电力设备记录中多个字段中的任一字段;分别获得第一电力设备记录中多个字段分别与第二电力设备记录中的多个字段之间的多个近似度;对多个近似度进行处理,得到总近似度,将总近似度作为第一电力设备记录中的字段与第二电力设备记录中的字段的近似度。
可选地,在本实施例中,计算机可读存储介质被设置为存储用于执行以下步骤的程序代码:将第一字段与第二字段进行匹配,得到第一字段和第二字段之间的近似度,包括:将第一字段转换为第一字符串,以及将第二字段转化为第二字符串;获取第一字符串和第二字符串之间的编辑距离;依据编辑距离确定第一字段和第二字段之间的近似度。
可选地,在本实施例中,计算机可读存储介质被设置为存储用于执行以下步骤的程序代码:在获取第一电力系统中的第一电力设备记录,以及第二电力系统中的第二电力设备记录之前,还包括:通过配置界面接收匹配场景,以及进行匹配的配置信息,其中,匹配场景用于确定进行匹配的对象,配置信息用于确定进行匹配字段,以及进行匹配的预定阈值,进行匹配的对象包括第一电力设备记录和第二电力设备记录。
可选地,在本实施例中,计算机可读存储介质被设置为存储用于执行以下步骤的程序代码:在近似度超过预定阈值的情况下,建立第一电力设备记录和第二电力设备记录之间的关联关系包括:在第二电力设备记录包括多个的情况下,对第一电力设备记录分别与多个第二电力设备记录之间对应的多个近似度进行排序,得到排序结果;依据排序结果,从多个第二电力设备记录中选择预定数量的第二电力设备记录;建立第一电力设备记录和预定数量的第二电力设备记录之间的关联关系。
可选地,在本实施例中,计算机可读存储介质被设置为存储用于执行以下步骤的程序代码:上述方法还包括:通过匹配界面,显示第一电力系统中未匹配的第三电力设备记录,以及第二电力系统中用于匹配的多个第四电力设备记录;接收对多个第四电力设备记录中预定数量个第四电力设备记录的选中操作;响应建立关联关系的操作,建立第三电力设备记录与预定数量个第四电力设备记录之间的关联关系。
在示例性实施例中,还提供了一种计算机程序产品,当计算机程序产品中的计算机程序由电子设备的处理器执行时,使得电子设备能够执行上述任一项的电力设备数据处理方法。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (6)
1.一种电力设备数据处理方法,其特征在于,包括:
获取第一电力系统中的第一电力设备记录,以及第二电力系统中的第二电力设备记录;
提取所述第一电力设备记录中的字段,以及所述第二电力设备记录中的字段;
将所述第一电力设备记录中的字段,以及所述第二电力设备记录中的字段进行匹配,得到所述第一电力设备记录中的字段与所述第二电力设备记录中的字段的近似度;
在所述近似度超过预定阈值的情况下,建立所述第一电力设备记录和所述第二电力设备记录之间的关联关系;
其中,在所述第一电力设备记录中的字段为多个,所述第二电力设备记录中的字段也对应有多个的情况下,将所述第一电力设备记录中的字段,以及所述第二电力设备记录中的字段进行匹配,得到所述第一电力设备记录中的字段与所述第二电力设备记录中的字段的近似度,包括:针对所述第一电力设备记录中的第一字段,对应于所述第二电力设备记录中的第二字段,将所述第一字段与所述第二字段进行匹配,得到所述第一字段和所述第二字段之间的近似度,其中,所述第一字段为所述第一电力设备记录中多个字段中的任一字段;分别获得所述第一电力设备记录中多个字段分别与第二电力设备记录中的多个字段之间的多个近似度;对所述多个近似度进行处理,得到总近似度,将所述总近似度作为所述第一电力设备记录中的字段与所述第二电力设备记录中的字段的近似度;
其中,将所述第一字段与所述第二字段进行匹配,得到所述第一字段和所述第二字段之间的近似度,包括:将所述第一字段转换为第一字符串,以及将所述第二字段转化为第二字符串;获取所述第一字符串和所述第二字符串之间的编辑距离;依据所述编辑距离确定所述第一字段和所述第二字段之间的近似度;
其中,所述方法还包括:通过匹配界面,显示所述第一电力系统中未匹配的第三电力设备记录,以及所述第二电力系统中用于匹配的多个第四电力设备记录;接收对所述多个第四电力设备记录中预定数量个第四电力设备记录的选中操作;响应建立关联关系的操作,建立所述第三电力设备记录与所述预定数量个第四电力设备记录之间的关联关系;
其中,所述第一电力系统和所述第二电力系统是分布在电网公司的多个部门中的多个系统,其中,所述第一电力系统是信息更新更及时的系统,所述第二电力系统是除所述第一电力系统外的其它系统;
其中,所述关联关系为完全匹配或近似匹配,并在对所述关联关系为近似匹配的第一电力设备记录和第二电力设备记录进行处理时,对电力设备记录进行校核。
2.根据权利要求1所述的方法,其特征在于,在获取第一电力系统中的第一电力设备记录,以及第二电力系统中的第二电力设备记录之前,还包括:
通过配置界面接收匹配场景,以及进行匹配的配置信息,其中,所述匹配场景用于确定进行匹配的对象,所述配置信息用于确定进行匹配字段,以及进行匹配的所述预定阈值,进行匹配的对象包括所述第一电力设备记录和所述第二电力设备记录。
3.根据权利要求1所述的方法,其特征在于,在所述近似度超过预定阈值的情况下,建立所述第一电力设备记录和所述第二电力设备记录之间的关联关系包括:
在所述第二电力设备记录包括多个的情况下,对所述第一电力设备记录分别与多个第二电力设备记录之间对应的多个近似度进行排序,得到排序结果;
依据排序结果,从所述多个第二电力设备记录中选择预定数量的第二电力设备记录;
建立所述第一电力设备记录和所述预定数量的第二电力设备记录之间的关联关系。
4.一种电力设备数据处理装置,其特征在于,包括:
获取模块,用于获取第一电力系统中的第一电力设备记录,以及第二电力系统中的第二电力设备记录;
提取模块,用于提取所述第一电力设备记录中的字段,以及所述第二电力设备记录中的字段;
匹配模块,用于将所述第一电力设备记录中的字段,以及所述第二电力设备记录中的字段进行匹配,得到所述第一电力设备记录中的字段与所述第二电力设备记录中的字段的近似度;
建立模块,用于在所述近似度超过预定阈值的情况下,建立所述第一电力设备记录和所述第二电力设备记录之间的关联关系;
其中,所述匹配模块包括:匹配单元,用于针对所述第一电力设备记录中的第一字段,对应于所述第二电力设备记录中的第二字段,将所述第一字段与所述第二字段进行匹配,得到所述第一字段和所述第二字段之间的近似度,其中,所述第一字段为所述第一电力设备记录中多个字段中的任一字段;计算单元,用于分别获得所述第一电力设备记录中多个字段分别与第二电力设备记录中的多个字段之间的多个近似度;处理单元,用于对所述多个近似度进行处理,得到总近似度,将所述总近似度作为所述第一电力设备记录中的字段与所述第二电力设备记录中的字段的近似度;
其中,所述匹配模块还包括:转换单元,用于将所述第一字段转换为第一字符串,以及将所述第二字段转化为第二字符串;获取单元,用于获取所述第一字符串和所述第二字符串之间的编辑距离;确定单元,用于依据所述编辑距离确定所述第一字段和所述第二字段之间的近似度;
其中,所述装置还包括:显示单元,用于通过匹配界面,显示所述第一电力系统中未匹配的第三电力设备记录,以及所述第二电力系统中用于匹配的多个第四电力设备记录;接收单元,用于接收对所述多个第四电力设备记录中预定数量个第四电力设备记录的选中操作;响应单元,用于响应建立关联关系的操作,建立所述第三电力设备记录与所述预定数量个第四电力设备记录之间的关联关系;
其中,所述第一电力系统和所述第二电力系统是分布在电网公司的多个部门中的多个系统,其中,所述第一电力系统是信息更新更及时的系统,所述第二电力系统是除所述第一电力系统外的其它系统;
其中,所述关联关系为完全匹配或近似匹配,并在对所述关联关系为近似匹配的第一电力设备记录和第二电力设备记录进行处理时,对电力设备记录进行校核。
5.一种电子设备,其特征在于,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如权利要求1至3中任一项所述的电力设备数据处理方法。
6.一种计算机可读存储介质,其特征在于,当所述计算机可读存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如权利要求1至3中任一项所述的电力设备数据处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110723477.2A CN113434584B (zh) | 2021-06-28 | 2021-06-28 | 电力设备数据处理方法、装置及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110723477.2A CN113434584B (zh) | 2021-06-28 | 2021-06-28 | 电力设备数据处理方法、装置及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113434584A CN113434584A (zh) | 2021-09-24 |
CN113434584B true CN113434584B (zh) | 2022-10-14 |
Family
ID=77757428
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110723477.2A Active CN113434584B (zh) | 2021-06-28 | 2021-06-28 | 电力设备数据处理方法、装置及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113434584B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103473373A (zh) * | 2013-09-29 | 2013-12-25 | 方正国际软件有限公司 | 基于阈值匹配模型的相似度分析系统和方法 |
CN103530334A (zh) * | 2013-09-29 | 2014-01-22 | 方正国际软件有限公司 | 基于比较模板的数据匹配系统和方法 |
CN108595614A (zh) * | 2018-04-20 | 2018-09-28 | 成都智信电子技术有限公司 | 应用于his系统的数据表映射方法 |
CN112527970A (zh) * | 2020-12-24 | 2021-03-19 | 上海浦东发展银行股份有限公司 | 数据字典标准化处理方法、装置、设备及存储介质 |
CN112712086A (zh) * | 2020-12-28 | 2021-04-27 | 云镝智慧科技有限公司 | 数据处理方法、装置、计算机设备和存储介质 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11176549B2 (en) * | 2018-04-11 | 2021-11-16 | Sap Se | Systems and methods for matching transactional data |
CN112148761A (zh) * | 2020-10-20 | 2020-12-29 | 北京嘀嘀无限科技发展有限公司 | 一种数据处理方法和系统 |
-
2021
- 2021-06-28 CN CN202110723477.2A patent/CN113434584B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103473373A (zh) * | 2013-09-29 | 2013-12-25 | 方正国际软件有限公司 | 基于阈值匹配模型的相似度分析系统和方法 |
CN103530334A (zh) * | 2013-09-29 | 2014-01-22 | 方正国际软件有限公司 | 基于比较模板的数据匹配系统和方法 |
CN108595614A (zh) * | 2018-04-20 | 2018-09-28 | 成都智信电子技术有限公司 | 应用于his系统的数据表映射方法 |
CN112527970A (zh) * | 2020-12-24 | 2021-03-19 | 上海浦东发展银行股份有限公司 | 数据字典标准化处理方法、装置、设备及存储介质 |
CN112712086A (zh) * | 2020-12-28 | 2021-04-27 | 云镝智慧科技有限公司 | 数据处理方法、装置、计算机设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN113434584A (zh) | 2021-09-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113032868B (zh) | 预制构件管理方法、装置、电子设备及存储介质 | |
CN110727741A (zh) | 一种电力系统的知识图谱构建方法及系统 | |
CN106934068A (zh) | 机器人基于环境上下文的语义理解的方法 | |
CN111382956A (zh) | 企业集团关系的挖掘方法和装置 | |
CN104102790B (zh) | 基于gis的供电图自动成图系统及方法 | |
CN115858796A (zh) | 一种故障知识图谱构建方法及装置 | |
CN105045927A (zh) | 建设工程工料机数据自动编码方法及系统 | |
CN106910140B (zh) | 一种基于svg格式电力系统接线图网络拓扑分析的方法 | |
CN111435304A (zh) | 空间单元的生成方法、装置、存储介质及处理器 | |
CN102495916A (zh) | 一种基于对象匹配的多应用系统全景建模方法 | |
CN112100402A (zh) | 一种电网知识图谱构建方法及装置 | |
CN108228787B (zh) | 按照多级类目处理信息的方法和装置 | |
CN116993555A (zh) | 国土空间规划重点区域识别的分区方法、系统及存储介质 | |
CN114722974A (zh) | 基于事理逻辑和实体知识的多维度图谱融合方法 | |
CN114218291A (zh) | 基于目标对象的画像生成方法、装置、设备及存储介质 | |
CN102508971A (zh) | 概念设计阶段产品功能模型建立方法 | |
CN114265957A (zh) | 基于图数据库的多种数据源联合查询方法及系统 | |
CN113434584B (zh) | 电力设备数据处理方法、装置及电子设备 | |
CN107943912A (zh) | 一种响应式资源目录数据可视化管理方法、终端及装置 | |
CN107403386A (zh) | 基于银行网点的投保管理方法和系统 | |
CN115686497A (zh) | 业务开发数据管理方法、开发引擎、电子设备和存储介质 | |
CN115630066A (zh) | 一种动态本体语义融合模型的多源异构数据映射的方法 | |
CN115510116A (zh) | 数据目录构建方法、装置、介质及设备 | |
CN114818635A (zh) | 数据报表生成方法、装置、电子设备及存储介质 | |
CN111077861A (zh) | 一种智慧工厂的远程运维系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |