CN103377229A - 电网设备和设施的信息的提供方法与提供装置 - Google Patents
电网设备和设施的信息的提供方法与提供装置 Download PDFInfo
- Publication number
- CN103377229A CN103377229A CN201210124470XA CN201210124470A CN103377229A CN 103377229 A CN103377229 A CN 103377229A CN 201210124470X A CN201210124470X A CN 201210124470XA CN 201210124470 A CN201210124470 A CN 201210124470A CN 103377229 A CN103377229 A CN 103377229A
- Authority
- CN
- China
- Prior art keywords
- information
- input item
- retrieval
- key word
- facility
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供了一种电网设备和设施的提供信息的方法及提供装置,用以解决在电网GIS系统中进行模糊查询时,信息检索的操作效率低的问题。该方法包括:根据从电网GIS中选择的电网设备和设施的文字名词信息建立数据索引表;从数据索引表中提取语义关键字,建立由语义关键字组成的倒排索引表;将接收的检索输入项中的关键字与倒排索引表中的关键字进行匹配得到检索结果然后输出。通过该方法能够提高检索效率,进而实现了对电网资源的智能化搜索。
Description
技术领域
本发明涉及一种电网地理信息系统领域,更具体的涉及一种电网设备和设施的信息的提供方法与提供装置。
背景技术
随着GIS(Geographic Information System,地理信息系统)技术在电网生产运营中的深入应用,电网空间信息数据也开始呈现爆炸性增长的趋势。在现有的电网GIS技术中,主要应用是“图形显示”和“图属互查”,实现了图形与属性的对应性关联查询,但在针对电网设施/设备的智能化信息检索及显示方面则仍然功能比较薄弱。如何提升电网GIS技术的信息挖掘能力,已经成为当前迫切需要解决的问题。
在现有电网GIS技术中,由于对电网设备空间信息查询主要由空间数据库检索担任,设备和设施属性信息则由关系型数据库检索完成,信息检索机制没有考虑充分利用电网设备之间的空间关联关系,因此在需要进行电网设备信息模糊查询时,信息检索的操作效率会大大降低。例如,在关系型数据库中使用模糊匹配查找时,由于不能通过建立预索引来提高查询性能,搜索过程类似于一行行对数据库记录进行遍历,所以对于含有模糊查询的数据库操作来说查询性能会非常低。尤其是当对多个表多个字段进行模糊查询时,这种方式将严重影响查询效率,无法满足实际应用中的信息搜索要求。
针对相关技术中在电网GIS系统中进行电网设备信息模糊查询时,信息检索的操作效率低的问题,目前尚未提出有效的解决方案。
发明内容
本发明的主要目的是提供一种电网设备和设施的提供信息的方法及提供装置,以解决现有技术中电网GIS系统中进行电网设备信息模糊查询时,信息检索的操作效率低的问题。
根据本发明的一个方面,提供了一种电网设备和设施的信息的提供方法。
本发明的电网设备和设施的信息的提供方法包括:根据从电网地理信息系统GIS中选择的电网设备和设施的文字名词信息建立数据索引表;从数据索引表中提取语义关键字,建立由语义关键字组成的倒排索引表;将接收的检索输入项中的关键字与倒排索引表中的关键字进行匹配得到检索结果然后输出。
进一步地,上述文字名词信息包括:GIS系统中电网设备和设施的名称的名词,以及电网设备和设施的地理信息的文字名词。
进一步地,将接收的检索输入项中的关键字与倒排索引表中的关键字进行匹配之前,还包括:对检索输入项进行字词切分,得到多个关键字。
进一步地,对检索输入项进行字词切分包括:用机械匹配法对检索输入项进行字词切分;或用特征词库法对检索输入项进行字词切分。
进一步地,上述将接收的检索输入项中的关键字与倒排索引表中的关键字进行匹配包括:当检索输入项中关键字为一个字时,根据该关键字进行精确匹配查询,当检索输入项中的关键字为多个字时,分别对关键字进行精确匹配查询。
进一步地,上述方法还包括:按照预设的时间间隔根据GIS中的全部电网设备和设施文字名词信息对数据索引表和倒排索引表进行更新;或当GIS中的电网设备和设施的信息发生变化时,根据文字名词信息的变化增量对数据索引表和倒排索引表进行更新。
进一步地,上述得到检索结果然后输出还包括:根据接收到的用户的指令在检索结果的图形窗口中显示电网设备和设施的地理位置。
根据本发明的另一个方面提供了一种提供电网设备和设施的信息的提供装置。
本发明的电网设备和设施的信息的提供装置包括:数据索引表建立模块,用于根据从GIS中选择的电网设备和设施的文字名词信息建立数据索引表;倒排索引表建立模块,用于从数据索引表中提取语义关键字,建立由语义关键字组成的倒排索引表;匹配模块,用于将接收的检索输入项中的关键字与倒排索引表中的关键字进行匹配得到检索结果然后输出。
进一步地,上述提供装置还包括:字词切分模块,用于对检索输入项进行字词切分,得到多个关键字。
进一步地,上述字词切分模块还用于,用机械匹配法对检索输入项进行字词切分;或用特征词库法对检索输入项进行字词切分。
进一步地,上述匹配模块还用于,当检索输入项中的关键字为一个字时,根据该关键字进行精确匹配查询;当上述检索输入项中的关键字为多个字时,分别对上述关键字进行精确匹配查询。
进一步地,上述提供装置还包括:更新模块,用于按照预设的时间间隔根据GIS中的全部电网设备和设施文字名词信息对数据索引表和倒排索引表进行更新或当GIS中的电网设备和设施的信息发生变化时,根据文字名词信息的变化增量对数据索引表和倒排索引表进行更新。
根据本发明的技术方案,通过根据电网GIS系统数据库中的电网设备和设施的属性信息建立数据索引表;从数据索引表中提取语义关键字,建立倒排索引表;将检索输入项中的字词与倒排索引表中的关键字进行匹配得到检索结果。解决了在电网GIS系统中进行模糊查询时,信息检索的操作效率低的问题,能够提高检索效率,进而提高了电网GIS的信息挖掘能力。
附图说明
说明书附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的电网设备和设施的提供信息的方法的主要步骤示意图;
图2是根据本发明实施例的电网设备和设施的信息的提供装置的主要组成部分示意图;以及
图3是根据本发明实施例的另一种电网设备和设施的信息的提供装置的主要组成部分示意图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。
图1是根据本发明实施例的电网设备和设施的信息的提供的方法的主要步骤示意图。
如图1所示,该电网设备和设施的信息的提供的方法主要包括如下步骤:
步骤S202:根据从电网地理信息系统GIS中选择的电网设备和设施的文字名词信息建立数据索引表;
具体地,上述文字名词信息包括:GIS系统中电网设备和设施的名称的名词,以及电网设备和设施的地理信息的文字名词,该文字名词可以根据实际需要选择具体的语言文字,如电网设备和设施名称的汉字名词。
步骤S204:从数据索引表中提取语义关键字,建立由语义关键字组成的倒排索引表;
步骤S206:将接收的检索输入项中的关键字与倒排索引表中的关键字进行匹配得到检索结果然后输出。
上述检索输入项可以为单个、两个或两个以上的关键字或包含多个关键字的语句,该语句可以是对检索内容的描述性文字,基于此,可以实现在电网GIS系统中以文句为检索输入项。
通过本发明的技术方案,通过根据从电网GIS中选择的电网设备和设施的文字名词信息建立数据索引表;从数据索引表中提取语义关键字,建立由语义关键字组成的倒排索引表;将接收的检索输入项中的关键字与倒排索引表中的关键字进行匹配得到检索结果然后输出。解决了在电网GIS系统中进行模糊查询时,信息检索的操作效率低的问题,能够提高检索效率,进而提高了电网GIS的信息挖掘能力。
具体地,上述建立数据索引表及倒排索引表可以是将GIS中所有的设备和设施、地名、路名等文字名词信息复制至数据索引表中(设备和设施信息全表,简称表A);然后从表A中提取语义关键字,并建立倒排索引表:(关键字索引,简称表B)。
具体地,上述将接收的检索输入项中的关键字与倒排索引表中的关键字进行匹配之前,还包括:对检索输入项进行字词切分,得到多个关键字。
本实施例中从一个检索输入项的较长的名称或地址中找到所有单词(即分词)具体可以采用机械匹配法对检索输入项进行字词切分,或用特征词库法对检索输入项进行字词切分。机械匹配法:机械匹配法的基本思想是事先建立词库,其中包含所有电网业务中可能出现之字词。对给定的待提取的文字串S,按照某种确定的原则切取S的子串,若该子串与词库中的某字词相匹配,则该子串的语义得以确定,继续分割S剩余的部分。直到剩余部分为空:否则,该子串不是词,转上重新切取S的子串进行匹配。特征词库法,特征词库法的基本思想是事先建立一个语义特征词库,其中包含各种具有语义切分特征的词。对给定的待切分的文字串S,首先根据特征词库将S分割成若十个较短的子串,然后对每个子串分别采用机械匹配法进行字词提取。由于每个子串都比S短,所以字词提取速度较快。采用上述分词方法,使得电网GIS系统能够接受成句的描述文字作为检索输入项,在描述文句中,英文单词由于用空格分隔,比较容易处理,而中文单词间是连在一起的,在不同的分割下会产生不同的语义信息,因此需要用上述不同的处理方法来进行正确的字词分割处理。
上述将接收的检索输入项中的关键字与倒排索引表中的关键字进行匹配可以包括:当检索输入项中关键字为一个字时,根据该关键字进行精确匹配查询,当检索输入项中的关键字为多个字时,分别对关键字进行精确匹配查询。
具体地,本实施例中,对于单个查询关键字,可直接根据该关键字进行精确匹配查询,具体的结构化查询语言SQL(Structured Query Language)语句如下:
select a.记录ID,a.设备类型ID,a.设备唯一标识from表Aa,表Bb
where a.记录ID=b.记录ID and b.关键字=‘keyword’
order by a.设备类型ID
对于两个或多个查询关键字,可分别根据多个关键字进行精确匹配查询,并将查询结果中多次匹配关键字的记录显示在最前面。SQL语句如下:
select *from表A a,(select记录ID,count(*)count from(
select记录ID,关键字from表B where关键字=‘keyword 1’union
select记录ID,关键字from表B where关键字=‘keyword2’)
group by记录ID)b
where a.记录ID=b.记录ID
order by b.count desc,a.设备类型ID
由于数据索引表和倒排索引表中的数据将随着用户设备和设施内容的变化而变化,本实施例基于电网GIS平台提供定时维护和实时自动维护两种方式进行索引表维护作业,定时维护:按照预设的时间间隔根据GIS中的全部电网设备和设施文字名词信息对数据索引表和倒排索引表进行更新;实时自动维护:当GIS中的电网设备和设施的信息发生变化时,根据文字名词信息的变化增量对数据索引表和倒排索引表进行更新。
具体地,在上述得到检索结果然后输出的过程中还可以包括进一步地,上述得到检索结果然后输出还包括:根据接收到的用户的指令在检索结果的图形窗口中显示电网设备和设施的地理位置。实现搜索结果将通过列表和图形结合的方式进行可视化展示。此外,查询结果将根据数据记录中查询关键字出现频率、所属设备类型等进行排序。
图2是根据本发明实施例的电网设备和设施的信息的提供装置的主要组成部分示意图。
如图2所示,该电网设备和设施的信息的提供装置20包括:数据索引表建立模块21,用于根据从GIS中选择的电网设备和设施的文字名词信息建立数据索引表;倒排索引表建立模块22,用于从数据索引表中提取语义关键字,建立由语义关键字组成的倒排索引表;匹配模块23,用于将接收的检索输入项中的关键字与倒排索引表中的关键字进行匹配得到检索结果然后输出。
图3是根据本发明实施例的另一种电网设备和设施的信息的提供装置的主要组成部分示意图。
如图3所示,该提供装置30除了包括图2中的各组成部分外,还可以包括字词切分模块24,该模块用于对检索输入项进行字词切分,得到多个关键字。该字词切分模块24可以使用机械匹配法对检索输入项进行字词切分;或使用特征词库法对检索输入项进行字词切分。
具体地,上述匹配模块23还用于:当检索输入项中的关键字为一个字时,根据该关键字进行精确匹配查询,当检索输入项中的关键字为多个字时,分别对关键字进行精确匹配查询。
具体地,上述提供装置30还可以包括:更新模块(图中未示出),用于按照预设的时间间隔根据GIS中的全部电网设备和设施文字名词信息对数据索引表和倒排索引表进行更新;或当GIS中的电网设备和设施的信息发生变化时,根据文字名词信息的变化增量对数据索引表和倒排索引表进行更新。
利用本发明实施例的提供装置30实质上是一种电网设备和设施的信息的搜索引擎,可以利用该搜索引擎对电网设备和设施的信息进行搜索,从而提高了电网信息的查询效率。
通过本发明的技术方案,通过根据从GIS中选择的电网设备和设施的文字名词信息建立数据索引表;从数据索引表中提取语义关键字,建立由语义关键字组成的倒排索引表;将接收的检索输入项中的关键字与倒排索引表中的关键字进行匹配得到检索结果然后输出。通过建立了数据索引表和倒排索引表后,电网GIS系统可支持针对设备类型和关键字等搜索条件的高效率智能化模糊查询。解决了在电网GIS系统中进行模糊查询时,信息检索的操作效率低的问题,另外还可以达到以文句为检索输入项的目的,同时提高了电网GIS系统的模糊搜索的查询效率,提高了电网GIS的信息挖掘能力。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (12)
1.一种电网设备和设施的信息的提供方法,其特征在于,包括:
根据从电网地理信息系统GIS中选择的电网设备和设施的文字名词信息建立数据索引表;
从所述数据索引表中提取语义关键字,建立由所述语义关键字组成的倒排索引表;
将接收的检索输入项中的关键字与所述倒排索引表中的关键字进行匹配得到检索结果然后输出。
2.根据权利要求1所述的方法,其特征在于,所述文字名词信息包括:
所述电网地理信息系统GIS中电网设备和设施的名称的文字名词,以及
所述电网设备和设施的地理信息的文字名词。
3.根据权利要求1所述的方法,其特征在于,将接收的检索输入项中的关键字与所述倒排索引表中的关键字进行匹配之前,还包括:
对所述检索输入项进行字词切分,得到多个关键字。
4.根据权利要求3所述的方法,其特征在于,对所述检索输入项进行字词切分包括:
用机械匹配法对所述检索输入项进行字词切分;或
用特征词库法对所述检索输入项进行字词切分。
5.根据权利要求1所述的方法,其特征在于,将接收的检索输入项中的关键字与所述倒排索引表中的关键字进行匹配包括:
当检索输入项中的关键字为一个字时,根据所述该关键字进行精确匹配查询;
当所述检索输入项中的关键字为多个字时,分别对所述关键字进行精确匹配查询。
6.根据权利要求1至5中任一项所述的方法,其特征在于,所述方法还包括:
按照预设的时间间隔根据所述电网地理信息系统GIS中的全部所述电网设备和设施文字名词信息对所述数据索引表和所述倒排索引表进行更新;或
当所述电网地理信息系统GIS中的电网设备和设施的信息发生变化时,根据所述文字名词信息的变化增量对所述数据索引表和所述倒排索引表进行更新。
7.根据权利要求1至5中任一项所述的方法,其特征在于,所述得到检索结果然后输出还包括:
根据接收到的用户的指令在所述检索结果的图形窗口中显示所述电网设备和设施的地理位置。
8.一种电网设备和设施的信息的提供装置,其特征在于,包括:
数据索引表建立模块,用于根据从电网地理信息系统GIS中选择的电网设备和设施的文字名词信息建立数据索引表;
倒排索引表建立模块,用于从所述数据索引表中提取语义关键字,建立由所述语义关键字组成的倒排索引表;
匹配模块,用于将接收的检索输入项中的关键字与所述倒排索引表中的关键字进行匹配得到检索结果然后输出。
9.根据权利要求8所述的提供装置,其特征在于,所述提供装置还包括:
字词切分模块,用于对所述检索输入项进行字词切分,得到多个关键字。
10.根据权利要求9所述的提供装置,其特征在于,所述字词切分模块还用于,
用机械匹配法对所述检索输入项进行字词切分;或
用特征词库法对所述检索输入项进行字词切分。
11.根据权利要求8所述的提供装置,其特征在于,所述匹配模块还用于,
当检索输入项中的关键字为一个字时,根据所述该关键字进行精确匹配查询;
当所述检索输入项中的关键字为多个字时,分别对所述关键字进行精确匹配查询。
12.根据权利要求8至11中任一项所述的提供装置,其特征在于,所述提供装置还包括:
更新模块,用于按照预设的时间间隔根据所述电网地理信息系统GIS中的全部所述电网设备和设施文字名词信息对所述数据索引表和所述倒排索引表进行更新或当所述电网地理信息系统GIS中的电网设备和设施的信息发生变化时,根据所述文字名词信息的变化增量对所述数据索引表和所述倒排索引表进行更新。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210124470.XA CN103377229B (zh) | 2012-04-25 | 2012-04-25 | 电网设备和设施的信息的提供方法与提供装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210124470.XA CN103377229B (zh) | 2012-04-25 | 2012-04-25 | 电网设备和设施的信息的提供方法与提供装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103377229A true CN103377229A (zh) | 2013-10-30 |
CN103377229B CN103377229B (zh) | 2017-12-12 |
Family
ID=49462355
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210124470.XA Active CN103377229B (zh) | 2012-04-25 | 2012-04-25 | 电网设备和设施的信息的提供方法与提供装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103377229B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105574204A (zh) * | 2016-01-08 | 2016-05-11 | 国网冀北电力有限公司 | 分布式电网调控运行数据的检索方法及系统 |
CN111078960A (zh) * | 2019-12-20 | 2020-04-28 | 金现代信息产业股份有限公司 | 一种电力调度系统设备实时检索的实现方法及系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5852822A (en) * | 1996-12-09 | 1998-12-22 | Oracle Corporation | Index-only tables with nested group keys |
CN1916905A (zh) * | 2006-09-04 | 2007-02-21 | 北京航空航天大学 | 基于倒排表进行检索提示的方法 |
CN101616449A (zh) * | 2009-07-16 | 2009-12-30 | 中兴通讯股份有限公司 | 资源存储方法及装置 |
-
2012
- 2012-04-25 CN CN201210124470.XA patent/CN103377229B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5852822A (en) * | 1996-12-09 | 1998-12-22 | Oracle Corporation | Index-only tables with nested group keys |
CN1916905A (zh) * | 2006-09-04 | 2007-02-21 | 北京航空航天大学 | 基于倒排表进行检索提示的方法 |
CN101616449A (zh) * | 2009-07-16 | 2009-12-30 | 中兴通讯股份有限公司 | 资源存储方法及装置 |
Non-Patent Citations (3)
Title |
---|
姜跃: "数据库查询方法优化研究", 《电脑知识与技术》 * |
孙萧寒等: "关系型数据库系统查询优化分析", 《甘肃科技》 * |
王芳等: "关系数据库的查询优化", 《黑龙江科技信息》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105574204A (zh) * | 2016-01-08 | 2016-05-11 | 国网冀北电力有限公司 | 分布式电网调控运行数据的检索方法及系统 |
CN105574204B (zh) * | 2016-01-08 | 2020-07-24 | 国网冀北电力有限公司 | 分布式电网调控运行数据的检索方法及系统 |
CN111078960A (zh) * | 2019-12-20 | 2020-04-28 | 金现代信息产业股份有限公司 | 一种电力调度系统设备实时检索的实现方法及系统 |
CN111078960B (zh) * | 2019-12-20 | 2023-09-05 | 金现代信息产业股份有限公司 | 一种电力调度系统设备实时检索的实现方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN103377229B (zh) | 2017-12-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101516858B1 (ko) | 지도 검색을 위한 쿼리 파싱 방법 | |
CN104021198B (zh) | 基于本体语义索引的关系数据库信息检索方法及装置 | |
US8805808B2 (en) | String and sub-string searching using inverted indexes | |
US20060282455A1 (en) | System and method for ranking web content | |
KR101255557B1 (ko) | 음절 분리에 기반한 문자열 검색 시스템 및 그 방법 | |
CN105045852A (zh) | 一种教学资源的全文搜索引擎系统 | |
JPWO2018097091A1 (ja) | モデル作成装置、テキスト検索装置、モデル作成方法、テキスト検索方法、データ構造、及びプログラム | |
CN103353894A (zh) | 一种基于语义分析的数据搜索方法和系统 | |
CN101013443A (zh) | 一种智能组词输入的方法和一种输入法系统及其更新方法 | |
CN101350013A (zh) | 一种地理信息的搜索方法和系统 | |
KR20080008400A (ko) | 오리지널 유저 입력에 기초한 유저 입력의 제안 및 정제 | |
EP1908042A2 (en) | Identifying locations | |
CN104281702A (zh) | 基于电力关键词分词的数据检索方法及装置 | |
WO2014127500A1 (en) | Natural language processing based search | |
CN102156711A (zh) | 一种基于云存储的电力全文检索方法及系统 | |
CN108804592A (zh) | 知识库检索实现方法 | |
CN104679783A (zh) | 一种网络搜索方法和装置 | |
KR101095866B1 (ko) | 웹 기반의 정보 저장 및 검색 방법, 이를 위한 정보 관리 시스템 | |
CN102567365B (zh) | 一种针对于关键词进行标注的输入方法及系统 | |
CN103377229A (zh) | 电网设备和设施的信息的提供方法与提供装置 | |
JP2005242416A (ja) | 自然言語文の検索方法および検索装置 | |
CN100496091C (zh) | 在有线电视单向机顶盒中进行全文检索的系统 | |
CN113868375A (zh) | 基于结构化查询语言的数据查询方法、装置、设备及存储介质 | |
Feng et al. | Rule-Based Attractions Describe Paragraph Information Extraction | |
Leveling et al. | University of Hagen at GeoCLEF 2005: Using Semantic Networks for Interpreting Geographical Queries. |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |