CN110674285A - 一种电力调度台账智能检索系统及方法 - Google Patents

一种电力调度台账智能检索系统及方法 Download PDF

Info

Publication number
CN110674285A
CN110674285A CN201910881010.3A CN201910881010A CN110674285A CN 110674285 A CN110674285 A CN 110674285A CN 201910881010 A CN201910881010 A CN 201910881010A CN 110674285 A CN110674285 A CN 110674285A
Authority
CN
China
Prior art keywords
search
word
retrieval
power dispatching
file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910881010.3A
Other languages
English (en)
Inventor
黄进
夏友斌
黄学庆
潘文虎
韩亚平
张向阳
徐交建
陶颖
肖雅
杜力
赵剑飞
俞鹏
宋铭敏
苏志朋
周慧慧
胡小珊
章莉
高媛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Corp of China SGCC
Wuhu Power Supply Co of State Grid Anhui Electric Power Co Ltd
Original Assignee
State Grid Corp of China SGCC
Wuhu Power Supply Co of State Grid Anhui Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Corp of China SGCC, Wuhu Power Supply Co of State Grid Anhui Electric Power Co Ltd filed Critical State Grid Corp of China SGCC
Priority to CN201910881010.3A priority Critical patent/CN110674285A/zh
Publication of CN110674285A publication Critical patent/CN110674285A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/34Browsing; Visualisation therefor
    • G06F16/345Summarisation for human users
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Water Supply & Treatment (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • Human Resources & Organizations (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Public Health (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种电力调度台账智能检索系统及方法,该方法包括如下步骤:S1、接收录入的检索信息,确定检索要素,检索要素由搜索主题及搜索条件组成;S2、基于检索要素在索引库内进行本体搜索及关联检索;S3、将搜索结果进行显示。基于用户录入的搜索信息自动搜索相关的电力调度台账文件,极大的提高了调度台账的搜索效率及关联检索能力,从而从技术层面上提高了调度人员的调度台账信息的应用水平。

Description

一种电力调度台账智能检索系统及方法
技术领域
本发明属于电力调度技术领域,更具体地,本发明涉及一种电力调度台账智能检索系统及方法。
背景技术
电力调度管理系统中原始调度台账多以word、excel、pdf等非结构化形式存在。当前台账数据的使用方式,主要通过人工转录形成结构化数据存入数据库,并借助多个查询功能模块完成。台账数据随着时间推移越来越庞大,该方式效率低、关联程度不强且耗时耗力。
随着电力系统的发展和电网规模不断扩大,电网结构日趋复杂,对电网调度管理提出了新的要求,电网调度人员亟需借助智能高效、快捷灵活的信息检索方法,快速获取信息进而分析决策,以保障电网安全、稳定运行。
针对上述问题,目前尚未提出全面、有效的解决方法。
发明内容
本发明提供一种电力调度台账智能检索系统,电力调度台账智能检索方法,实现调度台账智能高效、方便快捷的检索,进而对调度人员分析决策提供有效支撑。
为了实现上述目的,本发明采取的技术方案为一种电力调度台账智能检索系统,该系统包括:
输入单元,用于接收录入的检索信息;
检索单元,基于检索信息确定检索要素,在索引库中检索主题标签与搜索主题一致,且条件标签与搜索条件一致的电力调度台账文件,以及主题标签与关联搜索主题一致,且条件标签与搜索条件一致的电力调度台账文件;
显示单元,显示相关电力调度台账文件;
索引库,保存电力调度台账文件与索引标签之间的映射关系;
电力专用词库,用于存储电力调度专用词,并定义电力调度专用词间的关联;
检索要素由搜索主题及搜索条件组成;
关联检索要素由关联搜索主题及搜索条件组成,关联搜索主题为与搜索主题使用关联或语义关联的电力调度专用词;
索引标签由主题标签及条件标签组成。
进一步的,所述检索单元包括:搜索主题确定模块及搜索条件确定模块;
搜索主题确定模块,对检索信息进行分词,分成若干个词段一,将与电力专用词库中电力调度专用词一致的词段一作为搜索主题;
搜索条件确定模块,在词段一中筛选词性为名词及量词的词段四,剔除词段四中的搜索主题,剩余的词段四即为搜索条件。
为了实现上述目的,本发明采取的技术方案为一种电力调度台账智能检索方法,该方法具体包括如下步骤:
S1、接收录入的检索信息,确定检索要素;
S2、基于检索要素对索引库内的电力调度台账文件进行本体检索及关联检索;
S3、将搜索结果进行显示;
本体检索是检索索引标签与检索要素一致的电力调度台账文件;
关联检索是检索索引标签与关联检索要素一致的电力调度台账文件。
进一步的,索引库的构建具体包括如下步骤:
S21、对原始电力调度台账文件进行扫描;
S22、识别扫描文件的文件类型,文件类型包括:word文档、excel文档、pdf文档三种类型中的任意一种;
S23、基于对应文件类型的文档解析器及中文分词工具包对扫描文件的内容进行分词,分成若干词段二;
S24、查找电力专用词库中是否存在与电力调度专用词一致的词段二,若存在,将与电力调度专用词一致的词段二作为电力调度台账文件中的主题标签,主题标签用于标识电力调度台账文件中的电力调度专用词;
S25、在词段二中筛选词性为名词及量词的词段三,剔除词段三中的主题标签,词段三中的剩余部分构成条件标签,条件标签用于限定主题标签中的各电力调度专用词的标识范围;
S26、建立索引标签与电力调度台账文件的映射关系。
进一步的,基于扫描文件的后缀名及MIME类型检测扫描文件的文件类型。
进一步的,搜索主题的确定方法包括如下步骤:
S11、对检索信息进行分词,分成若干个词段一;
S12、查找电力专用词库中是否存在与电力调度专用词一致的词段一,若存在,则将与电力调度专用词一致的词段一作为搜索主题。
进一步的,搜索条件的确定过程具体如下:
在词段一中筛选词性为名词及量词的词段四,剔除词段四中的搜索主题,剩余的词段四即为搜索条件。
本发明提供的电力调度台账智能检索系统具有如下有益效果:
该系统基于用户录入的搜索信息自动搜索相关的电力调度台账文件,极大的提高了调度台账的搜索效率及关联检索能力,从而从技术层面上提高了调度人员的调度台账信息的应用水平。
附图说明
图1为本发明实施例提供的电力调度台账智能检索系统结构示意图;
图2为本发明实施例提供的电力调度台账智能检索方法流程图。
具体实施方式
下面对照附图,通过对实施例的描述,对本发明的具体实施方式作进一步详细的说明,以帮助本领域的技术人员对本发明的发明构思、技术方案有更完整、准确和深入的理解。
图1为本发明实施例提供的电力调度台账智能检索系统结构示意图,为了便于说明,仅示出与本发明实施例相关的部分。
该系统包括:
输入单元,用于接收录入的检索信息;
检索单元,基于检索信息确定检索要素,在索引库中检索索引标签与检索要素、索引标签与关联检索要素一致的电力调度台账文件,其中,检索要素由搜索主题及搜索条件组成,关联检索要素由关联搜索主题及搜索条件组成,关联搜索主题为与搜索主题使用关联或语义关联的电力调度专用,词索引标签由主题标签及条件标签组成;索引标签与检索要素一致是指主题标签与搜索主题一致,且条件标签与搜索条件一致,索引标签与关联检索要素一致是指主题标签与关联搜索主题一致,且条件标签与搜索条件一致;
显示单元,显示相关电力调度台账文件;
索引库,建立电力调度台账文件与索引标签之间的映射关系;
主题标签为对应电力调度台账文件中出现的电力调度专用词,一个主题标签为一个电力调度专用词,条件标签用于限定主题标签中电力调度专用词的标识范围;
电力专用词库,用于存储电力调度的专用词汇,称为“电力调度专用词”,并定义电力调度专用词间的关联,包括使用关联及与语义关联;
本发明实施例中的电力调度专用词包括:线路名称、厂站名称、调度专业名称等。该电力专用词库为人工构建的,录入电力调度的常用专用词汇,并定义各电力调度专用词之间的关联,关联一般包括两种:一种使用关联,即电力调度专用词间关联使用的频率较高,如变电器包括:1#变电器,2#变电器……;另一种是语义关联,即词义相近和相同的电力调度专用词。
在本发明实施例中,上述检索单元包括:用于确定搜索主题的搜索主题确定模块、及用于确定搜索条件的搜索条件确定模块;
搜索主题确定模块,对检索信息进行分词,分成若干个词段一,将与电力专用词库中电力调度专用词一致的词段一作为搜索主题;
搜索条件确定模块,在词段一中筛选词性为名词及量词的词段四,剔除词段四中的搜索主题,剩余的词段四即为搜索条件。
图2为本发明实施例提供的电力调度台账智能检索方法流程图,该方法具体包括如下步骤:
S1、接收录入的检索信息,确定检索要素,索引要素由搜索主题及搜索条件组成;在本发明实施例中,搜索主题的确定方法包括如下步骤:
S11、对检索信息进行分词,分成若干个词段一;
本发明是采用基于Lucene的搜索引擎的中文分词工具包IKAnalyzer对检索信息进行分词。
S12、查找电力专用词库中是否存在与电力调度专用词一致的词段一,若存在,则将与电力调度专用词一致的词段一作为搜索主题。
在本发明实施例中,搜索条件的确定过程具体如下:
在词段一中筛选词性为名词及量词的词段四,剔除词段四中的搜索主题,剩余的词段四即为搜索条件。
S2、基于检索要素在索引库内进行本体搜索及关联检索;
在本发明实施例中,本体检索是检索索引标签与检索要素一致的电力调度台账文件;关联检索是检索索引标签与关联检索要素一致的电力调度台账文件,关联检索要素由关联搜索主题及搜索条件组成,关联搜索主题为与搜索主题使用关联或语义关联的电力调度专用词;
S3、将搜索结果进行显示。
在本发明实施例中,索引库的构建具体包括如下步骤:
S21、对原始电力调度台账文件进行扫描,
S22、识别扫描文件的文件类型,文件类型包括:word文档、excel文档、pdf文档三种类型中的任意一种;
在本分明实施例中,基于扫描文件的后缀名及Content-Type(MIME类型)检测扫描文件的文件类型。
S23、基于对应文件类型的文档解析器及中文分词工具包对扫描文件内容进行分词,分成若干词段一;
根据文件类型,选取专用的文档解析器,结合中文分词工具包,完成文档内容的解析,考虑到性能问题以及对中文的支持程度,本实施案例采用基于Lucene的搜索引擎的中文分词工具包IKAnalyzer。
S24、查找电力专用词库中是否存在与电力调度专用词一致的词段二,若存在,将与电力调度专用词一致的词段二作为电力调度台账文件中的主题标签;
S25、在词段二中筛选词性为名词及量词的词段三,剔除词段三中的主题标签,词段三中的剩余部分构成条件标签,条件标签用于限定主题标签中的各电力调度专用词的标识范围;
S26、建立索引标签与电力调度台账文件的映射关系。
本发明提供的电力调度台账智能检索系统具有如下有益效果:
基于用户录入的搜索信息自动搜索相关的电力调度台账文件,极大的提高了调度台账的搜索效率及关联检索能力,从而从技术层面上提高了调度人员的调度台账信息的应用水平。
上面结合附图对本发明进行了示例性描述,显然本发明具体实现并不受上述方式的限制,只要采用了本发明的方法构思和技术方案进行的各种非实质性的改进,或未经改进将本发明的构思和技术方案直接应用于其它场合的,均在本发明的保护范围之内。

Claims (7)

1.一种电力调度台账智能检索系统,其特征在于,所述系统包括:
输入单元,用于接收录入的检索信息;
检索单元,基于检索信息确定检索要素,在索引库中检索主题标签与搜索主题一致,且条件标签与搜索条件一致的电力调度台账文件,以及主题标签与关联搜索主题一致,且条件标签与搜索条件一致的电力调度台账文件;
显示单元,显示相关电力调度台账文件;
索引库,保存电力调度台账文件与索引标签之间的映射关系;
电力专用词库,用于存储电力调度专用词,并定义电力调度专用词间的关联;
检索要素由搜索主题及搜索条件组成;
关联检索要素由关联搜索主题及搜索条件组成,关联搜索主题为与搜索主题使用关联或语义关联的电力调度专用词;
索引标签由主题标签及条件标签组成。
2.如权利要求1所述电力调度台账智能检索系统,其特征在于,所述检索单元包括:搜索主题确定模块及搜索条件确定模块;
搜索主题确定模块,对检索信息进行分词,分成若干个词段一,将与电力专用词库中电力调度专用词一致的词段一作为搜索主题;
搜索条件确定模块,在词段一中筛选词性为名词及量词的词段四,剔除词段四中的搜索主题,剩余的词段四即为搜索条件。
3.一种基于权利要求1或2所述电力调度台账智能检索系统的电力调度台账智能检索方法,其特征在于,所述方法具体包括如下步骤:
S1、接收录入的检索信息,确定检索要素;
S2、基于检索要素对索引库内的电力调度台账文件进行本体检索及关联检索;
S3、将搜索结果进行显示;
本体检索是检索索引标签与检索要素一致的电力调度台账文件;
关联检索是检索索引标签与关联检索要素一致的电力调度台账文件。
4.如权利要求3所述电力调度台账智能检索方法,其特征在于,索引库的构建具体包括如下步骤:
S21、对原始电力调度台账文件进行扫描;
S22、识别扫描文件的文件类型,文件类型包括:word文档、excel文档、pdf文档三种类型中的任意一种;
S23、基于对应文件类型的文档解析器及中文分词工具包对扫描文件的内容进行分词,分成若干词段二;
S24、查找电力专用词库中是否存在与电力调度专用词一致的词段二,若存在,将与电力调度专用词一致的词段二作为电力调度台账文件中的主题标签,主题标签用于标识电力调度台账文件中的电力调度专用词;
S25、在词段二中筛选词性为名词及量词的词段三,剔除词段三中的主题标签,词段三中的剩余部分构成条件标签,条件标签用于限定主题标签中的各电力调度专用词的标识范围;
S26、建立索引标签与电力调度台账文件的映射关系。
5.如权利要求4所述电力调度台账智能检索方法,其特征在于,基于扫描文件的后缀名及MIME类型检测扫描文件的文件类型。
6.如权利要求3所述电力调度台账智能检索方法,其特征在于,搜索主题的确定方法包括如下步骤:
S11、对检索信息进行分词,分成若干个词段一;
S12、查找电力专用词库中是否存在与电力调度专用词一致的词段一,若存在,则将与电力调度专用词一致的词段一作为搜索主题。
7.如权利要求3所述电力调度台账智能检索方法,其特征在于,搜索条件的确定过程具体如下:
在词段一中筛选词性为名词及量词的词段四,剔除词段四中的搜索主题,剩余的词段四即为搜索条件。
CN201910881010.3A 2019-09-18 2019-09-18 一种电力调度台账智能检索系统及方法 Pending CN110674285A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910881010.3A CN110674285A (zh) 2019-09-18 2019-09-18 一种电力调度台账智能检索系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910881010.3A CN110674285A (zh) 2019-09-18 2019-09-18 一种电力调度台账智能检索系统及方法

Publications (1)

Publication Number Publication Date
CN110674285A true CN110674285A (zh) 2020-01-10

Family

ID=69078157

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910881010.3A Pending CN110674285A (zh) 2019-09-18 2019-09-18 一种电力调度台账智能检索系统及方法

Country Status (1)

Country Link
CN (1) CN110674285A (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106033466A (zh) * 2015-03-20 2016-10-19 华为技术有限公司 数据库查询的方法和设备
CN106354708A (zh) * 2015-07-13 2017-01-25 中国电力科学研究院 一种基于用电信息采集系统的客户互动信息搜索引擎系统
CN107562726A (zh) * 2017-09-06 2018-01-09 国家电网公司 一种基于热词的供电服务搜索引擎
CN107818815A (zh) * 2017-10-30 2018-03-20 北京康夫子科技有限公司 电子病历的检索方法及系统
CN108563773A (zh) * 2018-04-20 2018-09-21 武汉工程大学 基于知识图谱的法律条文精准搜索排序方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106033466A (zh) * 2015-03-20 2016-10-19 华为技术有限公司 数据库查询的方法和设备
CN106354708A (zh) * 2015-07-13 2017-01-25 中国电力科学研究院 一种基于用电信息采集系统的客户互动信息搜索引擎系统
CN107562726A (zh) * 2017-09-06 2018-01-09 国家电网公司 一种基于热词的供电服务搜索引擎
CN107818815A (zh) * 2017-10-30 2018-03-20 北京康夫子科技有限公司 电子病历的检索方法及系统
CN108563773A (zh) * 2018-04-20 2018-09-21 武汉工程大学 基于知识图谱的法律条文精准搜索排序方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
于程远等: "基于本体的坚强智能电网智能搜索系统", 《电力信息与通信技术》 *
曹宇等: "基于电网本体知识库的智能搜索研究与实现", 《电力与能源》 *
武芳等: "《空间数据库原理》", 31 May 2017, 武汉大学出版社 *

Similar Documents

Publication Publication Date Title
CN108829858B (zh) 数据查询方法、装置及计算机可读存储介质
US10565233B2 (en) Suffix tree similarity measure for document clustering
CN109726393B (zh) 一种基于自然语言处理技术的政策分析系统及方法
AU2017200585A1 (en) System and engine for seeded clustering of news events
CN102156711B (zh) 一种基于云存储的电力全文检索方法及系统
US20080208857A1 (en) Processing, browsing and extracting information from an electronic document
CN103593410A (zh) 通过替换概念性词语进行搜索推荐系统
US20090271353A1 (en) Method and device for tagging a document
CN115270738B (zh) 一种研报生成方法、系统及计算机存储介质
CN109947921A (zh) 一种基于自然语言处理的智能问答系统
CN113190687B (zh) 知识图谱的确定方法、装置、计算机设备及存储介质
CN111125086A (zh) 获取数据资源的方法、装置、存储介质及处理器
US20160041975A1 (en) Document tagging and retrieval using per-subject dictionaries including subject-determining-power scores for entries
Toda et al. A clustering method for news articles retrieval system
CN106951513B (zh) 一种法律案件或法律法规关键字处理方法及关键字处理系统
CN110674285A (zh) 一种电力调度台账智能检索系统及方法
CN114444636A (zh) 一种基于rfid标签的档案管理系统
CN110888920B (zh) 一种项目功能相似度的确定方法及装置
CN103744884A (zh) 一种整理信息碎片的方法及系统
CN110659344B (zh) 一种基于区块法的全文搜索方法
CN113761104A (zh) 知识图谱中实体关系的检测方法、装置和电子设备
CN114495138A (zh) 一种智能文档识别与特征提取方法、装置平台和存储介质
CN113342844A (zh) 工业智能搜索系统
CN112380811A (zh) word文本素材分级目录生成方法、装置及设备
CN113239201A (zh) 一种基于知识图谱的科技文献分类方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200110