CN103377229B - 电网设备和设施的信息的提供方法与提供装置 - Google Patents

电网设备和设施的信息的提供方法与提供装置 Download PDF

Info

Publication number
CN103377229B
CN103377229B CN201210124470.XA CN201210124470A CN103377229B CN 103377229 B CN103377229 B CN 103377229B CN 201210124470 A CN201210124470 A CN 201210124470A CN 103377229 B CN103377229 B CN 103377229B
Authority
CN
China
Prior art keywords
word
keyword
facility
information
input item
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201210124470.XA
Other languages
English (en)
Other versions
CN103377229A (zh
Inventor
刘润生
叶妍
恽珺
官丽
王雷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Corp of China SGCC
Beijing Electric Power Corp
Original Assignee
State Grid Corp of China SGCC
Beijing Electric Power Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Corp of China SGCC, Beijing Electric Power Corp filed Critical State Grid Corp of China SGCC
Priority to CN201210124470.XA priority Critical patent/CN103377229B/zh
Publication of CN103377229A publication Critical patent/CN103377229A/zh
Application granted granted Critical
Publication of CN103377229B publication Critical patent/CN103377229B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种电网设备和设施的提供信息的方法及提供装置,用以解决在电网GIS系统中进行模糊查询时,信息检索的操作效率低的问题。该方法包括:根据从电网GIS中选择的电网设备和设施的文字名词信息建立数据索引表;从数据索引表中提取语义关键字,建立由语义关键字组成的倒排索引表;将接收的检索输入项中的关键字与倒排索引表中的关键字进行匹配得到检索结果然后输出。通过该方法能够提高检索效率,进而实现了对电网资源的智能化搜索。

Description

电网设备和设施的信息的提供方法与提供装置
技术领域
本发明涉及一种电网地理信息系统领域,更具体的涉及一种电网设备和设施的信息的提供方法与提供装置。
背景技术
随着GIS(Geographic Information System,地理信息系统)技术在电网生产运营中的深入应用,电网空间信息数据也开始呈现爆炸性增长的趋势。在现有的电网GIS技术中,主要应用是“图形显示”和“图属互查”,实现了图形与属性的对应性关联查询,但在针对电网设施/设备的智能化信息检索及显示方面则仍然功能比较薄弱。如何提升电网GIS技术的信息挖掘能力,已经成为当前迫切需要解决的问题。
在现有电网GIS技术中,由于对电网设备空间信息查询主要由空间数据库检索担任,设备和设施属性信息则由关系型数据库检索完成,信息检索机制没有考虑充分利用电网设备之间的空间关联关系,因此在需要进行电网设备信息模糊查询时,信息检索的操作效率会大大降低。例如,在关系型数据库中使用模糊匹配查找时,由于不能通过建立预索引来提高查询性能,搜索过程类似于一行行对数据库记录进行遍历,所以对于含有模糊查询的数据库操作来说查询性能会非常低。尤其是当对多个表多个字段进行模糊查询时,这种方式将严重影响查询效率,无法满足实际应用中的信息搜索要求。
针对相关技术中在电网GIS系统中进行电网设备信息模糊查询时,信息检索的操作效率低的问题,目前尚未提出有效的解决方案。
发明内容
本发明的主要目的是提供一种电网设备和设施的提供信息的方法及提供装置,以解决现有技术中电网GIS系统中进行电网设备信息模糊查询时,信息检索的操作效率低的问题。
根据本发明的一个方面,提供了一种电网设备和设施的信息的提供方法。
本发明的电网设备和设施的信息的提供方法包括:根据从电网地理信息系统GIS中选择的电网设备和设施的文字名词信息建立数据索引表;从数据索引表中提取语义关键字,建立由语义关键字组成的倒排索引表;将接收的检索输入项中的关键字与倒排索引表中的关键字进行匹配得到检索结果然后输出。
进一步地,上述文字名词信息包括:GIS系统中电网设备和设施的名称的名词,以及电网设备和设施的地理信息的文字名词。
进一步地,将接收的检索输入项中的关键字与倒排索引表中的关键字进行匹配之前,还包括:对检索输入项进行字词切分,得到多个关键字。
进一步地,对检索输入项进行字词切分包括:用机械匹配法对检索输入项进行字词切分;或用特征词库法对检索输入项进行字词切分。
进一步地,上述将接收的检索输入项中的关键字与倒排索引表中的关键字进行匹配包括:当检索输入项中关键字为一个字时,根据该关键字进行精确匹配查询,当检索输入项中的关键字为多个字时,分别对关键字进行精确匹配查询。
进一步地,上述方法还包括:按照预设的时间间隔根据GIS中的全部电网设备和设施文字名词信息对数据索引表和倒排索引表进行更新;或当GIS中的电网设备和设施的信息发生变化时,根据文字名词信息的变化增量对数据索引表和倒排索引表进行更新。
进一步地,上述得到检索结果然后输出还包括:根据接收到的用户的指令在检索结果的图形窗口中显示电网设备和设施的地理位置。
根据本发明的另一个方面提供了一种提供电网设备和设施的信息的提供装置。
本发明的电网设备和设施的信息的提供装置包括:数据索引表建立模块,用于根据从GIS中选择的电网设备和设施的文字名词信息建立数据索引表;倒排索引表建立模块,用于从数据索引表中提取语义关键字,建立由语义关键字组成的倒排索引表;匹配模块,用于将接收的检索输入项中的关键字与倒排索引表中的关键字进行匹配得到检索结果然后输出。
进一步地,上述提供装置还包括:字词切分模块,用于对检索输入项进行字词切分,得到多个关键字。
进一步地,上述字词切分模块还用于,用机械匹配法对检索输入项进行字词切分;或用特征词库法对检索输入项进行字词切分。
进一步地,上述匹配模块还用于,当检索输入项中的关键字为一个字时,根据该关键字进行精确匹配查询;当上述检索输入项中的关键字为多个字时,分别对上述关键字进行精确匹配查询。
进一步地,上述提供装置还包括:更新模块,用于按照预设的时间间隔根据GIS中的全部电网设备和设施文字名词信息对数据索引表和倒排索引表进行更新或当GIS中的电网设备和设施的信息发生变化时,根据文字名词信息的变化增量对数据索引表和倒排索引表进行更新。
根据本发明的技术方案,通过根据电网GIS系统数据库中的电网设备和设施的属性信息建立数据索引表;从数据索引表中提取语义关键字,建立倒排索引表;将检索输入项中的字词与倒排索引表中的关键字进行匹配得到检索结果。解决了在电网GIS系统中进行模糊查询时,信息检索的操作效率低的问题,能够提高检索效率,进而提高了电网GIS的信息挖掘能力。
附图说明
说明书附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的电网设备和设施的提供信息的方法的主要步骤示意图;
图2是根据本发明实施例的电网设备和设施的信息的提供装置的主要组成部分示意图;以及
图3是根据本发明实施例的另一种电网设备和设施的信息的提供装置的主要组成部分示意图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。
图1是根据本发明实施例的电网设备和设施的信息的提供的方法的主要步骤示意图。
如图1所示,该电网设备和设施的信息的提供的方法主要包括如下步骤:
步骤S202:根据从电网地理信息系统GIS中选择的电网设备和设施的文字名词信息建立数据索引表;
具体地,上述文字名词信息包括:GIS系统中电网设备和设施的名称的名词,以及电网设备和设施的地理信息的文字名词,该文字名词可以根据实际需要选择具体的语言文字,如电网设备和设施名称的汉字名词。
步骤S204:从数据索引表中提取语义关键字,建立由语义关键字组成的倒排索引表;
步骤S206:将接收的检索输入项中的关键字与倒排索引表中的关键字进行匹配得到检索结果然后输出。
上述检索输入项可以为单个、两个或两个以上的关键字或包含多个关键字的语句,该语句可以是对检索内容的描述性文字,基于此,可以实现在电网GIS系统中以文句为检索输入项。
通过本发明的技术方案,通过根据从电网GIS中选择的电网设备和设施的文字名词信息建立数据索引表;从数据索引表中提取语义关键字,建立由语义关键字组成的倒排索引表;将接收的检索输入项中的关键字与倒排索引表中的关键字进行匹配得到检索结果然后输出。解决了在电网GIS系统中进行模糊查询时,信息检索的操作效率低的问题,能够提高检索效率,进而提高了电网GIS的信息挖掘能力。
具体地,上述建立数据索引表及倒排索引表可以是将GIS中所有的设备和设施、地名、路名等文字名词信息复制至数据索引表中(设备和设施信息全表,简称表A);然后从表A中提取语义关键字,并建立倒排索引表:(关键字索引,简称表B)。
具体地,上述将接收的检索输入项中的关键字与倒排索引表中的关键字进行匹配之前,还包括:对检索输入项进行字词切分,得到多个关键字。
本实施例中从一个检索输入项的较长的名称或地址中找到所有单词(即分词)具体可以采用机械匹配法对检索输入项进行字词切分,或用特征词库法对检索输入项进行字词切分。机械匹配法:机械匹配法的基本思想是事先建立词库,其中包含所有电网业务中可能出现之字词。对给定的待提取的文字串S,按照某种确定的原则切取S的子串,若该子串与词库中的某字词相匹配,则该子串的语义得以确定,继续分割S剩余的部分。直到剩余部分为空:否则,该子串不是词,转上重新切取S的子串进行匹配。特征词库法,特征词库法的基本思想是事先建立一个语义特征词库,其中包含各种具有语义切分特征的词。对给定的待切分的文字串S,首先根据特征词库将S分割成若十个较短的子串,然后对每个子串分别采用机械匹配法进行字词提取。由于每个子串都比S短,所以字词提取速度较快。采用上述分词方法,使得电网GIS系统能够接受成句的描述文字作为检索输入项,在描述文句中,英文单词由于用空格分隔,比较容易处理,而中文单词间是连在一起的,在不同的分割下会产生不同的语义信息,因此需要用上述不同的处理方法来进行正确的字词分割处理。
上述将接收的检索输入项中的关键字与倒排索引表中的关键字进行匹配可以包括:当检索输入项中关键字为一个字时,根据该关键字进行精确匹配查询,当检索输入项中的关键字为多个字时,分别对关键字进行精确匹配查询。
具体地,本实施例中,对于单个查询关键字,可直接根据该关键字进行精确匹配查询,具体的结构化查询语言SQL(Structured Query Language)语句如下:
select a.记录ID,a.设备类型ID,a.设备唯一标识from表Aa,表Bb
where a.记录ID=b.记录ID and b.关键字=‘keyword’
order by a.设备类型ID
对于两个或多个查询关键字,可分别根据多个关键字进行精确匹配查询,并将查询结果中多次匹配关键字的记录显示在最前面。SQL语句如下:
select *from表A a,(select记录ID,count(*)count from(
select记录ID,关键字from表B where关键字=‘keyword 1’union
select记录ID,关键字from表B where关键字=‘keyword2’)
group by记录ID)b
where a.记录ID=b.记录ID
order by b.count desc,a.设备类型ID
由于数据索引表和倒排索引表中的数据将随着用户设备和设施内容的变化而变化,本实施例基于电网GIS平台提供定时维护和实时自动维护两种方式进行索引表维护作业,定时维护:按照预设的时间间隔根据GIS中的全部电网设备和设施文字名词信息对数据索引表和倒排索引表进行更新;实时自动维护:当GIS中的电网设备和设施的信息发生变化时,根据文字名词信息的变化增量对数据索引表和倒排索引表进行更新。
具体地,在上述得到检索结果然后输出的过程中还可以包括进一步地,上述得到检索结果然后输出还包括:根据接收到的用户的指令在检索结果的图形窗口中显示电网设备和设施的地理位置。实现搜索结果将通过列表和图形结合的方式进行可视化展示。此外,查询结果将根据数据记录中查询关键字出现频率、所属设备类型等进行排序。
图2是根据本发明实施例的电网设备和设施的信息的提供装置的主要组成部分示意图。
如图2所示,该电网设备和设施的信息的提供装置20包括:数据索引表建立模块21,用于根据从GIS中选择的电网设备和设施的文字名词信息建立数据索引表;倒排索引表建立模块22,用于从数据索引表中提取语义关键字,建立由语义关键字组成的倒排索引表;匹配模块23,用于将接收的检索输入项中的关键字与倒排索引表中的关键字进行匹配得到检索结果然后输出。
图3是根据本发明实施例的另一种电网设备和设施的信息的提供装置的主要组成部分示意图。
如图3所示,该提供装置30除了包括图2中的各组成部分外,还可以包括字词切分模块24,该模块用于对检索输入项进行字词切分,得到多个关键字。该字词切分模块24可以使用机械匹配法对检索输入项进行字词切分;或使用特征词库法对检索输入项进行字词切分。
具体地,上述匹配模块23还用于:当检索输入项中的关键字为一个字时,根据该关键字进行精确匹配查询,当检索输入项中的关键字为多个字时,分别对关键字进行精确匹配查询。
具体地,上述提供装置30还可以包括:更新模块(图中未示出),用于按照预设的时间间隔根据GIS中的全部电网设备和设施文字名词信息对数据索引表和倒排索引表进行更新;或当GIS中的电网设备和设施的信息发生变化时,根据文字名词信息的变化增量对数据索引表和倒排索引表进行更新。
利用本发明实施例的提供装置30实质上是一种电网设备和设施的信息的搜索引擎,可以利用该搜索引擎对电网设备和设施的信息进行搜索,从而提高了电网信息的查询效率。
通过本发明的技术方案,通过根据从GIS中选择的电网设备和设施的文字名词信息建立数据索引表;从数据索引表中提取语义关键字,建立由语义关键字组成的倒排索引表;将接收的检索输入项中的关键字与倒排索引表中的关键字进行匹配得到检索结果然后输出。通过建立了数据索引表和倒排索引表后,电网GIS系统可支持针对设备类型和关键字等搜索条件的高效率智能化模糊查询。解决了在电网GIS系统中进行模糊查询时,信息检索的操作效率低的问题,另外还可以达到以文句为检索输入项的目的,同时提高了电网GIS系统的模糊搜索的查询效率,提高了电网GIS的信息挖掘能力。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (11)

1.一种电网设备和设施的信息的提供方法,其特征在于,包括:
根据从电网地理信息系统GIS中选择的电网设备和设施的文字名词信息建立数据索引表;
从所述数据索引表中提取语义关键字,建立由所述语义关键字组成的倒排索引表;
将接收的检索输入项中的关键字与所述倒排索引表中的关键字进行匹配得到检索结果然后输出,
其中,所述检索结果将根据数据记录中查询关键字出现频率、和所属设备类型进行排序,
所述检索输入项包括单个、两个或两个以上关键字,或包含多个关键字的语句,所述语句是对检索内容的描述性文字;
其中,所述文字名词信息包括:
所述电网地理信息系统GIS中电网设备和设施的名称的文字名词,以及
所述电网设备和设施的地理信息的文字名词。
2.根据权利要求1所述的方法,其特征在于,将接收的检索输入项中的关键字与所述倒排索引表中的关键字进行匹配之前,还包括:
对所述检索输入项进行字词切分,得到多个关键字。
3.根据权利要求2所述的方法,其特征在于,对所述检索输入项进行字词切分包括:
用机械匹配法对所述检索输入项进行字词切分;或
用特征词库法对所述检索输入项进行字词切分。
4.根据权利要求1所述的方法,其特征在于,将接收的检索输入项中的关键字与所述倒排索引表中的关键字进行匹配包括:
当检索输入项中的关键字为一个字时,根据所述该关键字进行精确匹配查询;
当所述检索输入项中的关键字为多个字时,分别对所述关键字进行精确匹配查询。
5.根据权利要求1至4中任一项所述的方法,其特征在于,所述方法还包括:
按照预设的时间间隔根据所述电网地理信息系统GIS中的全部所述电网设备和设施文字名词信息对所述数据索引表和所述倒排索引表进行更新;或
当所述电网地理信息系统GIS中的电网设备和设施的信息发生变化时,根据所述文字名词信息的变化增量对所述数据索引表和所述倒排索引表进行更新。
6.根据权利要求1至4中任一项所述的方法,其特征在于,所述得到检索结果然后输出还包括:
根据接收到的用户的指令在所述检索结果的图形窗口中显示所述电网设备和设施的地理位置。
7.一种电网设备和设施的信息的提供装置,其特征在于,包括:
数据索引表建立模块,用于根据从电网地理信息系统GIS中选择的电网设备和设施的文字名词信息建立数据索引表;
倒排索引表建立模块,用于从所述数据索引表中提取语义关键字,建立由所述语义关键字组成的倒排索引表;
匹配模块,用于将接收的检索输入项中的关键字与所述倒排索引表中的关键字进行匹配得到检索结果然后输出,
其中,所述检索结果将根据数据记录中查询关键字出现频率、和所属设备类型进行排序,
所述检索输入项包括单个、两个或两个以上关键字,或包含多个关键字的语句,所述语句是对检索内容的描述性文字;
其中,所述文字名词信息包括:
所述电网地理信息系统GIS中电网设备和设施的名称的文字名词,以及
所述电网设备和设施的地理信息的文字名词。
8.根据权利要求7所述的提供装置,其特征在于,所述提供装置还包括:
字词切分模块,用于对所述检索输入项进行字词切分,得到多个关键字。
9.根据权利要求8所述的提供装置,其特征在于,所述字词切分模块还用于,
用机械匹配法对所述检索输入项进行字词切分;或
用特征词库法对所述检索输入项进行字词切分。
10.根据权利要求7所述的提供装置,其特征在于,所述匹配模块还用于,
当检索输入项中的关键字为一个字时,根据所述该关键字进行精确匹配查询;
当所述检索输入项中的关键字为多个字时,分别对所述关键字进行精确匹配查询。
11.根据权利要求7至10中任一项所述的提供装置,其特征在于,所述提供装置还包括:
更新模块,用于按照预设的时间间隔根据所述电网地理信息系统GIS中的全部所述电网设备和设施文字名词信息对所述数据索引表和所述倒排索引表进行更新或当所述电网地理信息系统GIS中的电网设备和设施的信息发生变化时,根据所述文字名词信息的变化增量对所述数据索引表和所述倒排索引表进行更新。
CN201210124470.XA 2012-04-25 2012-04-25 电网设备和设施的信息的提供方法与提供装置 Active CN103377229B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210124470.XA CN103377229B (zh) 2012-04-25 2012-04-25 电网设备和设施的信息的提供方法与提供装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210124470.XA CN103377229B (zh) 2012-04-25 2012-04-25 电网设备和设施的信息的提供方法与提供装置

Publications (2)

Publication Number Publication Date
CN103377229A CN103377229A (zh) 2013-10-30
CN103377229B true CN103377229B (zh) 2017-12-12

Family

ID=49462355

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210124470.XA Active CN103377229B (zh) 2012-04-25 2012-04-25 电网设备和设施的信息的提供方法与提供装置

Country Status (1)

Country Link
CN (1) CN103377229B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105574204B (zh) * 2016-01-08 2020-07-24 国网冀北电力有限公司 分布式电网调控运行数据的检索方法及系统
CN111078960B (zh) * 2019-12-20 2023-09-05 金现代信息产业股份有限公司 一种电力调度系统设备实时检索的实现方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5852822A (en) * 1996-12-09 1998-12-22 Oracle Corporation Index-only tables with nested group keys
CN1916905A (zh) * 2006-09-04 2007-02-21 北京航空航天大学 基于倒排表进行检索提示的方法
CN101616449A (zh) * 2009-07-16 2009-12-30 中兴通讯股份有限公司 资源存储方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5852822A (en) * 1996-12-09 1998-12-22 Oracle Corporation Index-only tables with nested group keys
CN1916905A (zh) * 2006-09-04 2007-02-21 北京航空航天大学 基于倒排表进行检索提示的方法
CN101616449A (zh) * 2009-07-16 2009-12-30 中兴通讯股份有限公司 资源存储方法及装置

Also Published As

Publication number Publication date
CN103377229A (zh) 2013-10-30

Similar Documents

Publication Publication Date Title
CN103605665B (zh) 一种基于关键词的评审专家智能检索与推荐方法
CN109800284A (zh) 一种面向任务的非结构化信息智能问答系统构建方法
CN104281702B (zh) 基于电力关键词分词的数据检索方法及装置
CN103425687A (zh) 一种基于关键词的检索方法和系统
CN102982076A (zh) 基于语义标签库的多维度内容标注方法
CN101996195A (zh) 音频文件中语音信息的搜索方法、装置及设备
CN102867049B (zh) 一种基于单词查找树实现的汉语拼音快速分词方法
CN110162768B (zh) 实体关系的获取方法、装置、计算机可读介质及电子设备
CN113190687B (zh) 知识图谱的确定方法、装置、计算机设备及存储介质
CN102156711A (zh) 一种基于云存储的电力全文检索方法及系统
CN110704577A (zh) 一种电网调度数据的搜索方法及系统
CN101241506A (zh) 一种多维检索方法和装置以及系统
CN104346331A (zh) Xml数据库的检索方法及系统
CN107463711A (zh) 一种数据的标签匹配方法及装置
CN104572978A (zh) 基于日志的电力调度自动化系统用户行为统计方法
CN101957860B (zh) 一种发布、搜索信息的方法及装置
CN102646124A (zh) 一种自动识别地址信息的方法
CN105389328B (zh) 一种大规模开源软件搜索排序优化方法
CN112214612A (zh) 知识图谱标签松散场景下地理信息索引结构及检索方法
CN109165331A (zh) 一种英文地名的索引建立方法及其查询方法和装置
CN103377229B (zh) 电网设备和设施的信息的提供方法与提供装置
Zhang et al. Research and improvement of search engine based on Lucene
CN115495545A (zh) 一种电网运行全景模型检索方法及电子设备、存储介质
CN100496091C (zh) 在有线电视单向机顶盒中进行全文检索的系统
CN111709239A (zh) 一种基于专家逻辑结构树的地学数据发现方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant