CN111078683A - 一种基于插值查找的电网台账数据填充与统计方法及装置 - Google Patents

一种基于插值查找的电网台账数据填充与统计方法及装置 Download PDF

Info

Publication number
CN111078683A
CN111078683A CN201911062337.4A CN201911062337A CN111078683A CN 111078683 A CN111078683 A CN 111078683A CN 201911062337 A CN201911062337 A CN 201911062337A CN 111078683 A CN111078683 A CN 111078683A
Authority
CN
China
Prior art keywords
power grid
equipment
character string
information
filling
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911062337.4A
Other languages
English (en)
Inventor
杨天蒙
张明理
韩震焘
梁毅
史喆
白坚实
程孟增
张泽宇
王义贺
吉星
杨方圆
蒋理
朱赫炎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenyang Electric Power Survey & Design Institute Co ltd
State Grid Corp of China SGCC
Economic and Technological Research Institute of State Grid Liaoning Electric Power Co Ltd
Original Assignee
Shenyang Electric Power Survey & Design Institute Co ltd
State Grid Corp of China SGCC
Economic and Technological Research Institute of State Grid Liaoning Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenyang Electric Power Survey & Design Institute Co ltd, State Grid Corp of China SGCC, Economic and Technological Research Institute of State Grid Liaoning Electric Power Co Ltd filed Critical Shenyang Electric Power Survey & Design Institute Co ltd
Priority to CN201911062337.4A priority Critical patent/CN111078683A/zh
Publication of CN111078683A publication Critical patent/CN111078683A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2468Fuzzy queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Business, Economics & Management (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Economics (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Marketing (AREA)
  • Automation & Control Theory (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Probability & Statistics with Applications (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Supply And Distribution Of Alternating Current (AREA)

Abstract

本发明涉及电气工程数据分析领域,更具体地来涉及一种基于插值查找的电网数据填充与统计方法及装置。本发明包括:获取并汇总电网设备台账数据,对电力设备按照统一原则进行命名;建立关键字索引字符串命名及提取规则并进行关键字索引字符串提取;基于插值查找算法对关键字索引字符串进行查找、匹配,将匹配到的电网设备台账中的缺省属性信息进行填充补全;针对未有查找匹配到的关键字索引字符串,进行关键字符串的二次模糊匹配并将缺省信息填充补全;对填充完整后的电网设备台账依据关键属性列进行排序及统计分析。本发明提大幅提高了补全电网设备台账信息及统计的效率及准确性,还提高了电网设备台账统计分析的效率及结果质量。

Description

一种基于插值查找的电网台账数据填充与统计方法及装置
技术领域
本发明涉及电气工程数据分析领域,更具体地来涉及一种基于插值查找的电网数据填充与统计方法及装置。
背景技术
随着大数据时代发展、泛在电力物联网建设的不断推进,电网数据呈几何式增长。电力系统中的各类设备数目及种类众多、且变更频繁,电网设备台账是掌握公司电力设备状态、反映设备类型、数目、分布及变动情况的重要数据源。然而,由于各类电网设备台账由不同的管理团队进行维护管理,相关维护人员在录入数据的时候由于一些个人偏好原因会造成电力设备同一类型的数据出现多种表现形式,同时由于一些操作失误会导致一些数据信息空缺或错误,都将影响电网设备台账数据的统计分析效率及结果,影响对电网现状的分析及未来的电网规划决策。
因此,目前的电网设备台账数据量大且数据质量较差,大量电网设备的相关属性信息都处于缺省状态,影响电网设备台账信息的统计分析结果。目前仅有的解决方法仅能依靠人工方式对缺省数据进行逐一查找及补全,不仅效率低、耗费人力物力,而且由于人工操作还可能造成数据录入的二次失误,影响台账数据的准确性。
发明内容
本发明的目的为了克服上述背景技术的不足之处,提供了一种基于插值查找的电网台账数据填充与统计方法及装置,用于解决现有技术对于电网设备台账大量数据缺省而影响台账现状统计分析,现有的处理方法只能通过人工方式对缺省数据进行逐一查找及补全,效率低、耗费人力物力,而且由于人工操作还可能造成数据录入的二次失误,影响台账数据准确性。
为了实现上述发明目的,本发明是通过以下技术方案来实现的:
一种基于插值查找的电网台账数据填充与统计方法,包括:
获取并汇总电网设备台账数据,对电力设备按照统一原则进行命名;
建立关键字索引字符串命名及提取规则并进行关键字索引字符串提取;
基于插值查找算法对关键字索引字符串进行查找、匹配,将匹配到的电网设备台账中的缺省属性信息进行填充补全;
针对未有查找匹配到的关键字索引字符串,进行关键字符串的二次模糊匹配并将缺省信息填充补全;
对填充完整后的电网设备台账依据关键属性列进行排序及统计分析。
所述获取并汇总电网设备台账数据,对电力设备按照统一原则进行命名;包括:
通过电网各个数据库平台获取电网设备的各项属性信息,进行分类汇总,并对设备名称按照统一的命名原则进行命名;
所述数据获取的来源数据库即包括电网数据库通用数据库平台,包括PMS2.0系统、PIS系统、D5000系统,还包括独立数据库。
所述统一原则包括:
(1)建立等价文字集合,包含部分电力设备的关键字符以及代表关键字符的常用符号之间的等价对应关系;
(2)基于建立的等价文字集合,建立统一的设备名称命名原则,将所有电力设备名称中不符合统一命名原则的关键字符进行替换;
(3)建立设备名称关键字符的统一的规范化组合顺序,并按照确立好的规范化组合顺序进行修改,组合顺序的基本规则为“线路名称+序号+具体的电力设备名称”。
所述建立关键字索引字符串命名及提取规则,是针对按照统一命名原则命名的设备名称提取关键字索引字符串,并构成关键字索引字符串集合。
所述关键字索引字符串的提取是针对电网设备台账中所需填充的缺省属性信息的,在配电网电力设备元件的各项信息中,其所属供电区属性及类型多数是空缺的,为了按照供电区属性及类型对电力设备进行详细的统计分析,对关联的设备台账进行查找检索,将电力设备元件所属的电力线路名称作为关键字索引字符串提取出来,再进行查找匹配以获得各电力设备相对应的供电区属性及类型。
所述基于插值查找算法对关键字索引字符串进行查找、匹配,将匹配到的电网设备台账中的缺省属性信息进行填充补全,是将各个台账信息表中关键字索引字符串结果一致的结果信息进行信息自动填充,将所有匹配到的电网设备台账的各项缺省的数据信息进行补全。
所述基于插值查找算法对关键字索引字符串进行查找、匹配,将匹配到的电网设备台账中的缺省属性信息进行填充补全的步骤包括:
步骤1,将需要查找的字符串Str0用分散的单个字符集合表示,为Str0={X1,X2,…,Xn},并计算对应字符首字母的ASCII码(大写字母的ASCII码)为{F(X1),F(X2),…,F(Xn)};
步骤2,关联电网设备台账表中被查找的关键字用字符串集合表示,即STR={Str1,Str2,…,StrN},i=1,2,…,N,其中Stri={Yi,1,Yi,2,…,Yi,M},对应的字符首字母的ASCII码(大写字母的ASCII码)为{F(Yi,1),F(Yi,2),…,F(Yi,M)};
步骤3,从第一个字符开始匹配,采用插值查找算法快速定位下一个查找的字符串位置,当定位到与第一个字符相同的字符后,接着采用插值查找算法匹配第二、三…个字符,直至获得在STR集合中与Str0字符串完全一致的字符串;
步骤4,根据匹配获得的完全一致的字符串的各类属性信息,则该关键字关键字符串的缺省属性信息即为其在关联设备台账中所匹配到的关键字索引字符串所对应的属性信息。
所述针对未有查找匹配到的关键字索引字符串,进行关键字符串的二次模糊匹配并将缺省信息填充补全,是指对关键字索引字符串进行字符拆分,进行关键字符串二次模糊匹配,将所有匹配到的电网设备各项缺省位置的数据信息进行自动填充补全。
所述对填充完整后的电网设备台账依据关键属性列进行排序及统计分析是针对补全所有关键信息的电网设备台账进行统计分析,按关键属性列进行排序及统计分析,获得基于供电区属性及供电区类型的电网设备统计分析结果;所述关键属性包括:电力设备所属的供电区属性及类型、电力设备的运行年限、无功补偿容量及使用性质。
一种基于插值查找的电网台账数据填充与统计装置,包括:
台账数据预处理模块,用于获取电网各个数据库平台的电网设备的各项属性信息,进行分类汇总,并对电力设备名称按照统一的命名原则进行命名;
关键字符串提取模块,用于建立关键字索引字符串命名及提取规则,针对已按照统一命名原则进行命名的设备名称提取关键字索引字符串,并构成关键字索引字符串集合;
缺省项信息填充模块,用于将各个台账信息表中与关键字索引字符串结果一致的信息自动填充至电网设备台账的缺省位置;
统计分析模块,用于针对补全所有关键信息的电网设备台账进行统计分析,按关键属性列进行排序并获得统计分析结果;
其中:台账数据预处理模块与关键字符串提取模块相连接,关键字符串提取模块与缺省项信息填充模块相连接,缺省项信息填充模块与统计分析模块相连接;缺省项信息填充模块还分别与关键字索引字符串查找、匹配子模块和二次模糊匹配子模块相连接。
所述缺省项信息填充模块包括:
关键字索引字符串查找、匹配子模块,用于对关键字索引字符串集合进行查找、匹配,找到各台账信息表中与所需查找的关键字索引字符串相匹配的结果并对缺省信息进行填充;
二次模糊匹配子模块,用于针对未有匹配到的关键字索引字符串,对关键字进行拆分或删减并进行二次模糊匹配,将所有匹配到的电网设备各项缺省的数据信息进行自动填充补全。
本发明具有以下的优点及有益效果:
本发明提供了一种基于插值查找算法的电网设备台账关联数据填充与统计分析方法及装置,在建立了等价文字集合以及设备名称统一命名原则的基础上,通过对关键字索引字符串进行提取,利用插值查找算法对电网设备台账内部相互关联的数据之间进行查找,对电网设备台账中的缺省信息进行补全,与以往的人工方式相比大幅提高了补全电网设备台账信息及统计的效率及准确性,由此也提高了电网设备台账统计分析的效率及结果质量。
附图说明
图1为本发明提出的一种基于插值查找算法的电网设备台账关联数据填充与统计分析方法的流程示意图;
图2为本发明提出的一种基于插值查找算法的电网设备台账关联数据填充与统计分析装置的结构示意图。
图中:台账数据预处理模块201,关键字符串提取模块202,缺省项信息填充模块203,关键字索引字符串查找、匹配子模块204,二次模糊匹配子模块205,统计分析模块206。
具体实施方式
为了使得本发明的技术方案的目的、技术方案和优点更加清楚,下文中将结合本发明具体实施例的附图,对本发明实施例的技术方案进行清楚、完整地描述。附图中相同的附图标记代表相同的部件。需要说明的是,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于所描述的本发明的实施例,本领域普通技术人员在无需创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明提供了一种基于插值查找算法的电网设备台账关联数据填充与统计分析方法及装置,包括:获取并汇总电网设备台账数据,对电力设备按照统一原则进行命名;建立关键字索引字符串命名及提取规则并进行关键字索引字符串提取;基于插值查找算法对关键字索引字符串进行查找、匹配,将匹配到的电网设备台账中的缺省属性信息进行填充补全;针对未有查找匹配到的关键字索引字符串,进行关键字符串的二次模糊匹配并将缺省信息填充补全;对填充完整后的电网设备台账依据关键属性列进行排序及统计分析。
如图1所示,本发明一种基于插值查找算法的电网设备台账关联数据填充与统计分析方法,包含以下步骤:
步骤101,通过电网各个数据库平台获取电网设备的各项属性信息,进行分类汇总,并对设备名称按照统一的命名原则进行命名。
需要说明的是,数据获取的来源数据库即包括电网数据库通用数据库平台包括PMS2.0系统、PIS系统、D5000系统等,也包括一些由各个电网公司或电网运营单位独自开发的独立数据库。
所述对设备名称的统一的命名原则主要包含:
(1)建立等价文字集合,主要包含部分电力设备的关键字符以及可以代表关键字符的一些常用符号之间的等价对应关系,比如号与NO.、#、2与02、II等;
(2)基于建立的等价文字集合,建立统一的设备名称命名原则,将所有电力设备名称中不符合统一命名原则的关键字符进行替换,如所有数字均用1、2替代,对于01、02和I、II全部进行替换;所有序号全部用“号”表示,对于“No.”、“#”表示的全部进行替换;
(3)建立设备名称关键字符的统一的规范化组合顺序,并按照确立好的规范化组合顺序进行修改,组合顺序的基本规则为“线路名称+序号+具体的电力设备名称”。如对于输电线路的名称的命名规则为以“线”字结尾,如“元宝线”;柱上变压器的名称的统一命名原则为“线路名+序号+(‘左/右’+序号+)‘号变压器’”,如“汤山线100右4号变压器”、“梨树线27号变压器”。
步骤102,建立关键字索引字符串命名及提取规则,针对按照统一命名原则命名的设备名称提取关键字索引字符串,并构成关键字索引字符串集合。
需要说明的是,关键字索引字符串的提取是针对电网设备台账中所需填充的缺省属性信息的,如在配电网电力设备元件的各项信息中,其所属供电区属性及类型多数是空缺的,为了按照供电区属性及类型对电力设备进行详细的统计分析,需要对关联的设备台账进行查找检索,即将电力设备元件所属的电力线路名称作为关键字索引字符串提取出来,再进行查找匹配以获得各电力设备相对应的供电区属性及类型。如柱上变压器的供电区属性的关键字索引字符串为其所属10kV线路名称,故将“汤山线”从“汤山线100右4号变压器”中提取出来,加入到关键字索引字符串集合中。
步骤103,基于插值查找算法对关键字索引字符串集合进行查找、匹配,将各个台账信息表中关键字索引字符串结果一致的结果信息进行信息自动填充,将所有匹配到的电网设备台账的各项缺省的数据信息进行补全。
需要说明的是,该过程的主要步骤包含以下几个步骤:
步骤103-1,将需要查找的字符串Str0用分散的单个字符集合表示,为Str0={X1,X2,…,Xn},并计算对应字符首字母的ASCII码(大写字母的ASCII码)为{F(X1),F(X2),…,F(Xn)}。
步骤103-2,关联电网设备台账表中被查找的关键字用字符串集合表示,即STR={Str1,Str2,…,StrN},i=1,2,…,N,其中Stri={Yi,1,Yi,2,…,Yi,M},对应的字符首字母的ASCII码(大写字母的ASCII码)为{F(Yi,1),F(Yi,2),…,F(Yi,M)}。
步骤103-3,从第一个字符开始匹配,采用插值查找算法快速定位下一个查找的字符串位置,当定位到与第一个字符相同的字符后,接着采用插值查找算法匹配第二、三…个字符,直至获得在STR集合中与Str0字符串完全一致的字符串。
步骤103-4,根据匹配获得的完全一致的字符串的各类属性信息,则该关键字关键字符串的缺省属性信息即为其在关联设备台账中所匹配到的关键字索引字符串所对应的属性信息。
需要说明的是,插值查找算法的具体含义及做法为,插值算法的具体含义为首先从第一个字符串的第一个字符开始比较,若比较后不相同则根据插值公式计算确定下一次需要查找的字符位置。
以匹配第一个字符X1为例进行说明,首先比较X1与Y1,1,若两个字符不相同,则根据公式(1)计算下一个查找的字符位置POS(其中,i=1,j=1),接着,比较X1与YPOS,1,直至找到与X1相匹配的字符。
POS=p+((N-p)/(F(YN,j)-F(Yp,j)))×(F(Xj)-F(Yp,j)) (1)
其中,POS为根据插值算法计算获得下一个字符查找序号值;N为字符串集合中字符串的总数目,即为10kV线路表中所有10kV线路名称的总数目;p为当前比较的字符串序号值;F(YN,j)为第N个字符串第j个字符的ASCII码值;F(Yp,j)为第p个字符串第j个字符的ASCII码值;F(Xj)为所需查找的字符串第j个字符的ASCII码值。
步骤104,针对未有匹配到的关键字索引字符串,对关键字索引字符串进行字符拆分,进行关键字符串二次模糊匹配,将所有匹配到的电网设备各项缺省位置的数据信息进行自动填充补全。
需要说明的是,此处主要针对一些无法从电力设备的命名中查找到所需的关键字符串信息的,主要采取的措施是对关键字索引字符串进行字符拆分,分别对拆分的字符串进行二次匹配,将匹配到的字符串进行反向校验,若校验为与关键字索引字符串相同的字符串,则将所有匹配到的电网设备各项缺省的数据信息进行填充补全。
步骤105,针对补全所有关键信息的电网设备台账进行统计分析,按关键属性列进行排序及统计分析,获得基于供电区属性及供电区类型的电网设备统计分析结果。
需要说明的是,通常对电力设备按关键属性列进行排序及统计分析包含的关键属性主要有:电力设备所属的供电区属性及类型、电力设备的运行年限、无功补偿容量、使用性质,在本实例中以电力设备所属的供电区属性及类型为例进行说明。
实施例1:
以下针对本发明提出的一种基于插值查找算法的电网设备台账关联数据填充与统计分析方法进行实际举例说明。电网设备的数据来源为PMS2.0系统,需要进行统计分析的电力设备台账为柱上变压器,各个设备所属的供电区属性及类型均为空值,无法对设备分布现状进行统计分析,按照上述方法进行信息补全及统计分析。
首先根据设备名称按照统一的命名原则进行命名,并将柱上变压器所属的10kV大馈线为关键字索引字符串。
以其中一个设备名称为例,所需查找的设备名称为“二台线西沟分龙山支28右8号变压器”,则提取出该柱上变压器的所属10kV大馈线线路关键字符串为“二台线”,所需查找的字符串Str0表示为{‘二’,‘台’,‘线’},假设需要查找的10kV线路表中含有13条10kV线路(在实际中10kV线路台账的数目远远多于此,在此仅起到举例作用),已按照字符串首字符A至Z的顺序升序排列,STR={“爱联线”,“安康线”,“北城甲线”,“北城乙线”,“滨河线”,“材博线”,“二道坊线”,“二台线”,“芙蓉线”,“凤山线”,“汇友线”,“机床线”,“江山线”},其中Str1表示为{‘爱’,‘联’,‘线’},其余同理。
首先查找字符‘二’,从第一个字符串开始查找,并基于插值计算公式计算下一个查找字符串序号,由此,所查找的字符串序号分别为1、6、7、8,即仅需要比较4次既可以查找到所需查找的字符串名称,其他设备同样根据上述方法进行匹配查找即可,在配电线路众多的电网设备台账中采用此种方法的字符串查找及匹配效率更高。
以上为本发明申请提供的一种基于插值查找算法的电网设备台账关联数据填充与统计分析方法的实施例的详细说明。
实施例2:
本发明一种基于插值查找算法的电网设备台账关联数据填充与统计分析装置的一个实施例的详细说明。
请参阅图2,本发明实施例提供了一种基于插值查找的电网台账数据填充与统计装置,包括:
台账数据预处理模块201,用于获取电网各个数据库平台的电网设备的各项属性信息,进行分类汇总,并对电力设备名称按照统一的命名原则进行命名。
关键字符串提取模块202,用于建立关键字索引字符串命名及提取规则,针对已按照统一命名原则进行命名的设备名称提取关键字索引字符串,并构成关键字索引字符串集合。
缺省项信息填充模块203,用于将各个台账信息表中与关键字索引字符串结果一致的信息自动填充至电网设备台账的缺省位置。
统计分析模块206,用于针对补全所有关键信息的电网设备台账进行统计分析,按关键属性列进行排序并获得统计分析结果。
更具体地,还包括:
关键字索引字符串查找、匹配子模块204,用于对关键字索引字符串集合进行查找、匹配,找到各台账信息表中与所需查找的关键字索引字符串相匹配的结果并对缺省信息进行填充。
二次模糊匹配子模块205,用于针对未有匹配到的关键字索引字符串,对关键字进行拆分或删减并进行二次模糊匹配,将所有匹配到的电网设备各项缺省的数据信息进行自动填充补全。
其中:台账数据预处理模块201与关键字符串提取模块202相连接,关键字符串提取模块202与缺省项信息填充模块203相连接,缺省项信息填充模块203与统计分析模块206相连接;缺省项信息填充模块203还分别与关键字索引字符串查找、匹配子模块204和二次模糊匹配子模块205相连接。
所述电力设备类型具体包括:一次设备、配电室、箱式变电站、柱上开关、断路器、负荷开关、柱上开关、柱上变压器。
为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
未详细说明的均为现有技术。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求保护范围之内。

Claims (10)

1.一种基于插值查找的电网台账数据填充与统计方法,其特征是:包括:
获取并汇总电网设备台账数据,对电力设备按照统一原则进行命名;
建立关键字索引字符串命名及提取规则并进行关键字索引字符串提取;
基于插值查找算法对关键字索引字符串进行查找、匹配,将匹配到的电网设备台账中的缺省属性信息进行填充补全;
针对未有查找匹配到的关键字索引字符串,进行关键字符串的二次模糊匹配并将缺省信息填充补全;
对填充完整后的电网设备台账依据关键属性列进行排序及统计分析。
2.根据权利要求1所述的一种基于插值查找的电网台账数据填充与统计方法,其特征是:所述获取并汇总电网设备台账数据,对电力设备按照统一原则进行命名;包括:
通过电网各个数据库平台获取电网设备的各项属性信息,进行分类汇总,并对设备名称按照统一的命名原则进行命名;
所述数据获取的来源数据库即包括电网数据库通用数据库平台,包括PMS2.0系统、PIS系统、D5000系统,还包括独立数据库;
所述统一原则包括:
(1)建立等价文字集合,包含部分电力设备的关键字符以及代表关键字符的常用符号之间的等价对应关系;
(2)基于建立的等价文字集合,建立统一的设备名称命名原则,将所有电力设备名称中不符合统一命名原则的关键字符进行替换;
(3)建立设备名称关键字符的统一的规范化组合顺序,并按照确立好的规范化组合顺序进行修改,组合顺序的基本规则为“线路名称+序号+具体的电力设备名称”。
3.根据权利要求1所述的一种基于插值查找的电网台账数据填充与统计方法,其特征是:所述建立关键字索引字符串命名及提取规则,是针对按照统一命名原则命名的设备名称提取关键字索引字符串,并构成关键字索引字符串集合。
4.根据权利要求1所述的一种基于插值查找的电网台账数据填充与统计方法,其特征是:所述关键字索引字符串的提取是针对电网设备台账中所需填充的缺省属性信息的,在配电网电力设备元件的各项信息中,其所属供电区属性及类型多数是空缺的,为了按照供电区属性及类型对电力设备进行详细的统计分析,对关联的设备台账进行查找检索,将电力设备元件所属的电力线路名称作为关键字索引字符串提取出来,再进行查找匹配以获得各电力设备相对应的供电区属性及类型。
5.根据权利要求1所述的一种基于插值查找的电网台账数据填充与统计方法,其特征是:所述基于插值查找算法对关键字索引字符串进行查找、匹配,将匹配到的电网设备台账中的缺省属性信息进行填充补全,是将各个台账信息表中关键字索引字符串结果一致的结果信息进行信息自动填充,将所有匹配到的电网设备台账的各项缺省的数据信息进行补全。
6.根据权利要求1所述的一种基于插值查找的电网台账数据填充与统计方法,其特征是:所述基于插值查找算法对关键字索引字符串进行查找、匹配,将匹配到的电网设备台账中的缺省属性信息进行填充补全的步骤包括:
步骤1,将需要查找的字符串Str0用分散的单个字符集合表示,为Str0={X1,X2,…,Xn},并计算对应字符首字母的ASCII码(大写字母的ASCII码)为{F(X1),F(X2),…,F(Xn)};
步骤2,关联电网设备台账表中被查找的关键字用字符串集合表示,即STR={Str1,Str2,…,StrN},i=1,2,…,N,其中Stri={Yi,1,Yi,2,…,Yi,M},对应的字符首字母的ASCII码(大写字母的ASCII码)为{F(Yi,1),F(Yi,2),…,F(Yi,M)};
步骤3,从第一个字符开始匹配,采用插值查找算法快速定位下一个查找的字符串位置,当定位到与第一个字符相同的字符后,接着采用插值查找算法匹配第二、三…个字符,直至获得在STR集合中与Str0字符串完全一致的字符串;
步骤4,根据匹配获得的完全一致的字符串的各类属性信息,则该关键字关键字符串的缺省属性信息即为其在关联设备台账中所匹配到的关键字索引字符串所对应的属性信息。
7.根据权利要求1所述的一种基于插值查找的电网台账数据填充与统计方法,其特征是:所述针对未有查找匹配到的关键字索引字符串,进行关键字符串的二次模糊匹配并将缺省信息填充补全,是指对关键字索引字符串进行字符拆分,进行关键字符串二次模糊匹配,将所有匹配到的电网设备各项缺省位置的数据信息进行自动填充补全。
8.根据权利要求1所述的一种基于插值查找的电网台账数据填充与统计方法,其特征是:所述对填充完整后的电网设备台账依据关键属性列进行排序及统计分析是针对补全所有关键信息的电网设备台账进行统计分析,按关键属性列进行排序及统计分析,获得基于供电区属性及供电区类型的电网设备统计分析结果;所述关键属性包括:电力设备所属的供电区属性及类型、电力设备的运行年限、无功补偿容量及使用性质。
9.一种基于插值查找的电网台账数据填充与统计装置,其特征是:包括:
台账数据预处理模块,用于获取电网各个数据库平台的电网设备的各项属性信息,进行分类汇总,并对电力设备名称按照统一的命名原则进行命名;
关键字符串提取模块,用于建立关键字索引字符串命名及提取规则,针对已按照统一命名原则进行命名的设备名称提取关键字索引字符串,并构成关键字索引字符串集合;
缺省项信息填充模块,用于将各个台账信息表中与关键字索引字符串结果一致的信息自动填充至电网设备台账的缺省位置;
统计分析模块,用于针对补全所有关键信息的电网设备台账进行统计分析,按关键属性列进行排序并获得统计分析结果;
其中:台账数据预处理模块与关键字符串提取模块相连接,关键字符串提取模块与缺省项信息填充模块相连接,缺省项信息填充模块与统计分析模块相连接;缺省项信息填充模块还分别与关键字索引字符串查找、匹配子模块和二次模糊匹配子模块相连接。
10.根据权利要求9所述的一种基于插值查找的电网台账数据填充与统计装置,其特征是:所述缺省项信息填充模块包括:
关键字索引字符串查找、匹配子模块,用于对关键字索引字符串集合进行查找、匹配,找到各台账信息表中与所需查找的关键字索引字符串相匹配的结果并对缺省信息进行填充;
二次模糊匹配子模块,用于针对未有匹配到的关键字索引字符串,对关键字进行拆分或删减并进行二次模糊匹配,将所有匹配到的电网设备各项缺省的数据信息进行自动填充补全。
CN201911062337.4A 2019-11-02 2019-11-02 一种基于插值查找的电网台账数据填充与统计方法及装置 Pending CN111078683A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911062337.4A CN111078683A (zh) 2019-11-02 2019-11-02 一种基于插值查找的电网台账数据填充与统计方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911062337.4A CN111078683A (zh) 2019-11-02 2019-11-02 一种基于插值查找的电网台账数据填充与统计方法及装置

Publications (1)

Publication Number Publication Date
CN111078683A true CN111078683A (zh) 2020-04-28

Family

ID=70310630

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911062337.4A Pending CN111078683A (zh) 2019-11-02 2019-11-02 一种基于插值查找的电网台账数据填充与统计方法及装置

Country Status (1)

Country Link
CN (1) CN111078683A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111784538A (zh) * 2020-07-01 2020-10-16 陈灼骁 一种智能电网大数据信息管理方法及系统
CN111913594A (zh) * 2020-08-19 2020-11-10 成都深思科技有限公司 一种流量分析表达式智能提示与补全的方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101131692A (zh) * 2006-08-25 2008-02-27 陈启星 分级统计-概率计算式查找算法
CN105184482A (zh) * 2015-09-06 2015-12-23 国网山东省电力公司电力科学研究院 一种变压器台账数据校验系统及其方法
CN107861449A (zh) * 2017-11-23 2018-03-30 国家电网公司 一种调度运行关键信息巡检告警方法及装置
CN109710647A (zh) * 2018-12-29 2019-05-03 广东电网有限责任公司 一种基于关键字搜索的电网台账数据融合方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101131692A (zh) * 2006-08-25 2008-02-27 陈启星 分级统计-概率计算式查找算法
CN105184482A (zh) * 2015-09-06 2015-12-23 国网山东省电力公司电力科学研究院 一种变压器台账数据校验系统及其方法
CN107861449A (zh) * 2017-11-23 2018-03-30 国家电网公司 一种调度运行关键信息巡检告警方法及装置
CN109710647A (zh) * 2018-12-29 2019-05-03 广东电网有限责任公司 一种基于关键字搜索的电网台账数据融合方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
邬蓉蓉;张炜;王乐;: "基于正则表达式的跳闸输电线路名称匹配方法" *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111784538A (zh) * 2020-07-01 2020-10-16 陈灼骁 一种智能电网大数据信息管理方法及系统
CN111913594A (zh) * 2020-08-19 2020-11-10 成都深思科技有限公司 一种流量分析表达式智能提示与补全的方法
CN111913594B (zh) * 2020-08-19 2023-09-29 成都锋卫科技有限公司 一种流量分析表达式智能提示与补全的方法

Similar Documents

Publication Publication Date Title
CN104375992A (zh) 一种地址匹配的方法和装置
CN108717433A (zh) 一种面向程序设计领域问答系统的知识库构建方法及装置
CN110442847B (zh) 基于代码仓库过程管理的代码相似性检测方法及装置
CN107016019B (zh) 数据库索引创建方法及装置
CN107665217A (zh) 一种用于搜索业务的词汇处理方法及系统
CN106126528B (zh) 一种基于平台模型的小卫星测试基础信息生成方法
CN103425672A (zh) 一种数据库索引的建立方法及装置
CN111127068B (zh) 一种工程量清单自动组价方法和装置
CN109710647B (zh) 一种基于关键字搜索的电网台账数据融合方法及装置
CN111260413A (zh) 一种基于矢量图形的电力主网工程施工图造价速算方法
CN111078683A (zh) 一种基于插值查找的电网台账数据填充与统计方法及装置
CN106910140B (zh) 一种基于svg格式电力系统接线图网络拓扑分析的方法
CN106484892A (zh) 数据操作方法及装置
CN109902087A (zh) 用于问答的数据处理方法及装置、服务器
CN105045927A (zh) 建设工程工料机数据自动编码方法及系统
CN107577744A (zh) 非标地址自动匹配模型、匹配方法以及模型建立方法
CN109800416A (zh) 一种电力设备名称识别方法
CN112488549A (zh) 发电设备的运维方法、装置及计算机可读存储介质
CN105574675A (zh) 基于规则库的建筑工程规划监督方法和系统
CN110941910A (zh) 一种电网三维设计评审智能辅助方法及系统
CN115292448A (zh) 语言转义方法、装置、设备及存储介质
CN111159420A (zh) 一种基于属性计算与知识模板的实体优化方法
CN103810365A (zh) 一种基于水电仿真培训系统自动评分的方法
CN111984673A (zh) 一种电网电能量计量系统树形结构模糊检索方法和装置
CN105335459A (zh) 基于xbrl智能报告平台的合并报表数据抽取方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200428