CN112182019A - 一种电网统计专业指标特征提取的语义解析搜索方法 - Google Patents

一种电网统计专业指标特征提取的语义解析搜索方法 Download PDF

Info

Publication number
CN112182019A
CN112182019A CN202011121105.4A CN202011121105A CN112182019A CN 112182019 A CN112182019 A CN 112182019A CN 202011121105 A CN202011121105 A CN 202011121105A CN 112182019 A CN112182019 A CN 112182019A
Authority
CN
China
Prior art keywords
index
keywords
professional
power grid
search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011121105.4A
Other languages
English (en)
Other versions
CN112182019B (zh
Inventor
涂夏哲
荀超
邱向京
胡臻达
刘林
黄世诚
肖芬
洪居华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Fujian Electric Power Co Ltd
Economic and Technological Research Institute of State Grid Fujian Electric Power Co Ltd
Original Assignee
State Grid Fujian Electric Power Co Ltd
Economic and Technological Research Institute of State Grid Fujian Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Fujian Electric Power Co Ltd, Economic and Technological Research Institute of State Grid Fujian Electric Power Co Ltd filed Critical State Grid Fujian Electric Power Co Ltd
Priority to CN202011121105.4A priority Critical patent/CN112182019B/zh
Publication of CN112182019A publication Critical patent/CN112182019A/zh
Application granted granted Critical
Publication of CN112182019B publication Critical patent/CN112182019B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/2425Iterative querying; Query formulation based on the results of a preceding query
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/243Natural language query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2468Fuzzy queries
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Fuzzy Systems (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Automation & Control Theory (AREA)
  • Probability & Statistics with Applications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种电网统计专业指标特征提取的语义解析搜索方法,包括步骤:获取电网统计专业电网指标术语,建立术语库;建立电力专业指标数据库,所述电力专业指标数据库中包括电力专业指标数据以及根据各项指标的特性所提取指标的关键词;将所需搜索的内容切分为单个字义的关键词;将各个关键词在术语库中进行模糊匹配,得到标准的关键词;将得到的标准的关键词进行重组拼装,将重组的片段在所建立的术语库进行比对,筛选出所含关键词在电力专业指标数据库中存在对应的关键词的重组片段,将其作为最终的搜索片段;利用该搜索片段在电力专业指标数据库中获取相应的查询指标结果。本发明能够提高电网统计专业指标的查询效率。

Description

一种电网统计专业指标特征提取的语义解析搜索方法
技术领域
本发明涉及电力系统语义识别技术领域,特别是一种电网统计专业指标特征提取的语义解析搜索方法。
背景技术
目前,各种终端设备的智能化和集成化程度越来越高,传统的信息检索和菜单操作方式以及越来越无法满足大众需求。日常生活中已存在大量应用语音识别、语义解析技术的应用案例。因此,亟需应用语音识别、语义解析技术提高电网统计专业信息获取效率。
发明内容
有鉴于此,本发明的目的是提出一种电网统计专业指标特征提取的语义解析搜索方法,能够提高电网统计专业指标的查询效率。
本发明采用以下方案实现:一种电网统计专业指标特征提取的语义解析搜索方法,具体包括以下步骤:
获取电网统计专业电网指标术语,建立术语库;
建立电力专业指标数据库,所述电力专业指标数据库中包括电力专业指标数据以及根据各项指标的特性所提取指标的关键词;
将所需搜索的内容切分为单个字义的关键词;
将各个关键词在术语库中进行模糊匹配,得到标准的关键词;
将得到的标准的关键词进行重组拼装,将重组的片段在所建立的术语库进行比对,筛选出所含关键词在电力专业指标数据库中存在对应的关键词的重组片段,将其作为最终的搜索片段;
利用该搜索片段在电力专业指标数据库中获取相应的查询指标结果。
进一步地,所述建立的术语库,取自电网规划数据分析平台,包括生产、营销、调动在内的业务专业术语。
进一步地,所述建立电力专业指标数据库,具体为:根据各项指标的特性,提取指标关键词,同时确定指标查询所需的维度,提取指定搜索该指标的关键词组合。
进一步地,所述维度包括时间维度、地域维度、统计维度以及电压等级维度。
进一步地,所述所需搜索的内容包括采用语音识别技术转换用户输入的搜索语音得到的文字内容。
进一步地,所述筛选出所含关键词在电力专业指标数据库中存在对应的关键词的重组片段具体为:将一个重组片段与电力专业指标数据库中设定的提取指定搜索指标的关键词组合进行比对,当满足重组片段中的关键词包含电力专业指标数据库的至少一个指标关键词以及指定搜索指标的关键词组合时,将该重组片段作为最终的搜索片段。
进一步地,所述利用该搜索片段在电力专业指标数据库中获取相应的查询指标结果具体为:根据搜索片段中的关键词在电力专业指标数据库中进行定位,获取关键词所指定搜索的指标。
本发明还提供了一种电网统计专业指标特征提取的语义解析搜索系统,其特征在于,包括存储器、处理器以及存储在存储器上并能够被处理器所运行的计算机程序指令,当处理器运行该计算机程序指令时,能够实现如上文所述的方法步骤。
本发明还提供了一种计算机可读存储介质,其上存储有能够被处理器所运行的计算机程序指令,当处理器运行该计算机程序指令时,能够实现如上文所述的方法步骤。
与现有技术相比,本发明有以下有益效果:本发明运用语音识别技术提取文字信息,将文字放入电网统计信息网络中,提取电网统计相关信息特定术语,按匹配度模糊匹配识别出所需查询的结果,显示出多个合理的备选结果,以提高电网统计专业指标查询效率。
附图说明
图1为本发明实施例的原理示意图。
具体实施方式
下面结合附图及实施例对本发明做进一步说明。
应该指出,以下详细说明都是示例性的,旨在对本申请提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
如图1所示,本实施例提供了一种电网统计专业指标特征提取的语义解析搜索方法,具体包括以下步骤:
步骤S1:获取电网统计专业电网指标术语,建立术语库;所述建立的术语库,取自电网规划数据分析平台,包括生产、营销、调动在内的业务专业术语。通过录入相关的术语,星辰海量、专业的电网统计指标术语库;
步骤S2:建立电力专业指标数据库,所述电力专业指标数据库中包括电力专业指标数据以及根据各项指标的特性所提取指标的关键词;根据各项指标的特性,提取指标关键词,同时确定指标查询所需的维度,提取指定搜索该指标的关键词组合;所述维度包括时间维度、统计维度、地域维度以及电压等级维度等;其中指标的关键词包括“发电”、“用电”、“售电”、“利用小时”等;根据指标查询所需的多项维度,提取指定搜索关键词,如年份、月份等时间维度,福建省、福州市等地域维度,当月、累计等统计维度,500kV、110kV等电压等级维度;
步骤S3:将所需搜索的内容切分为单个字义的关键词;
其中,所述所需搜索的内容包括采用语音识别技术转换用户输入的搜索语音得到的文字内容,利用语音识别技术识别人类语言中的词汇内容。通过声学模型语言建模,将声音转化为计算机可读可识别的参数信息;通过已识别的语音信息,转换为汉语拼音,将词汇片段进行切片,形成单个字义。
步骤S4:将各个关键词在术语库中进行模糊匹配,得到标准的关键词;提取所需搜索的电网统计术语关键字片段,进行模糊匹配。例如语音识别词汇“2019年1到6月”与“2019年上半年”,两组词汇均需查询2019年1月份到2019年6月份累计值指标数据,将词汇切片后进行解析,得到关键字“2019年”、“1到6月”、“上半年”,根据关键字模糊匹配,可解析出计算机可识别词汇“2019年1-6月”、“累计值”等。该步骤即将口语化的术语通过在术语库中进行模糊匹配,将其转为为电网领域的专业术语,能够更好的被计算机识别;
步骤S5:将得到的标准的关键词进行重组拼装,将重组的片段在所建立的术语库进行比对,筛选出所含关键词在电力专业指标数据库中存在对应的关键词的重组片段,将其作为最终的搜索片段;
其中,筛选的过程具体为:将一个重组片段与电力专业指标数据库中设定的提取指定搜索指标的关键词组合进行比对,当满足重组片段中的关键词包含电力专业指标数据库的至少一个指标关键词以及指定搜索指标的关键词组合时,将该重组片段作为最终的搜索片段。
具体的,例如得到语音识别词汇“2019年上半年福建地区用电量”,将词汇进行逐字切片以及模糊匹配后,获得到词汇中关键词“2019年”、“上半年”、“福建”、“用电量”、“累计值”,再将词汇进行重组拼装,获得计算机可理解的片段“2019年1-6月福建省全省用电量累计值”等。将其与专业指标数据库进行比对,发现该片段与指标库中的一个指标的特征及制定搜索关键词组合相同,即“用电量”(指标特征)、“2019年1-6月”(时间维度指定搜索关键词)、“福建省”(地域维度指定搜索关键词)、“累计值”(统计维度指定搜索关键词)。因此将这个片段所谓最终的搜索片段。
步骤S6:利用该搜索片段在电力专业指标数据库中获取相应的查询指标结果:根据搜索片段中的关键词在电力专业指标数据库中进行定位,获取关键词所指定搜索的指标。根据片段中涉及到的几个维度上的指定搜索关键词进行定位,最后再根据指标关键词进行最后的定位,最终提取电力专业指标数据库中对应这些搜索关键词的指标作为本次的搜索结果。
本实施例还提供了一种电网统计专业指标特征提取的语义解析搜索系统,其特征在于,包括存储器、处理器以及存储在存储器上并能够被处理器所运行的计算机程序指令,当处理器运行该计算机程序指令时,能够实现如上文所述的方法步骤。
本实施例还提供了一种计算机可读存储介质,其上存储有能够被处理器所运行的计算机程序指令,当处理器运行该计算机程序指令时,能够实现如上文所述的方法步骤。
以上所述,仅是本发明的较佳实施例而已,并非是对本发明作其它形式的限制,任何熟悉本专业的技术人员可能利用上述揭示的技术内容加以变更或改型为等同变化的等效实施例。但是凡是未脱离本发明技术方案内容,依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与改型,仍属于本发明技术方案的保护范围。

Claims (9)

1.一种电网统计专业指标特征提取的语义解析搜索方法,其特征在于,包括以下步骤:
获取电网统计专业电网指标术语,建立术语库;
建立电力专业指标数据库,所述电力专业指标数据库中包括电力专业指标数据以及根据各项指标的特性所提取指标的关键词;
将所需搜索的内容切分为单个字义的关键词;
将各个关键词在术语库中进行模糊匹配,得到标准的关键词;
将得到的标准的关键词进行重组拼装,将重组的片段在所建立的术语库进行比对,筛选出所含关键词在电力专业指标数据库中存在对应的关键词的重组片段,将其作为最终的搜索片段;
利用该搜索片段在电力专业指标数据库中获取相应的查询指标结果。
2.根据权利要求1所述的一种电网统计专业指标特征提取的语义解析搜索方法,其特征在于,所述建立的术语库,取自电网规划数据分析平台,包括生产、营销、调动在内的业务专业术语。
3.根据权利要求1所述的一种电网统计专业指标特征提取的语义解析搜索方法,其特征在于,所述建立电力专业指标数据库,具体为:根据各项指标的特性,提取指标关键词,同时确定指标查询所需的维度,提取指定搜索该指标的关键词组合。
4.根据权利要求3所述的一种电网统计专业指标特征提取的语义解析搜索方法,其特征在于,所述维度包括时间维度、地域维度、统计维度以及电压等级维度。
5.根据权利要求1所述的一种电网统计专业指标特征提取的语义解析搜索方法,其特征在于,所述所需搜索的内容包括采用语音识别技术转换用户输入的搜索语音得到的文字内容。
6.根据权利要求1所述的一种电网统计专业指标特征提取的语义解析搜索方法,其特征在于,所述筛选出所含关键词在电力专业指标数据库中存在对应的关键词的重组片段具体为:将一个重组片段与电力专业指标数据库中设定的提取指定搜索指标的关键词组合进行比对,当满足重组片段中的关键词包含电力专业指标数据库的至少一个指标关键词以及指定搜索指标的关键词组合时,将该重组片段作为最终的搜索片段。
7.根据权利要求1所述的一种电网统计专业指标特征提取的语义解析搜索方法,其特征在于,所述利用该搜索片段在电力专业指标数据库中获取相应的查询指标结果具体为:根据搜索片段中的关键词在电力专业指标数据库中进行定位,获取关键词所指定搜索的指标。
8.一种电网统计专业指标特征提取的语义解析搜索系统,其特征在于,包括存储器、处理器以及存储在存储器上并能够被处理器所运行的计算机程序指令,当处理器运行该计算机程序指令时,能够实现如权利要求1-7任一项所述的方法步骤。
9.一种计算机可读存储介质,其特征在于,其上存储有能够被处理器所运行的计算机程序指令,当处理器运行该计算机程序指令时,能够实现如权利要求1-7任一项所述的方法步骤。
CN202011121105.4A 2020-10-20 2020-10-20 一种电网统计专业指标特征提取的语义解析搜索方法 Active CN112182019B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011121105.4A CN112182019B (zh) 2020-10-20 2020-10-20 一种电网统计专业指标特征提取的语义解析搜索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011121105.4A CN112182019B (zh) 2020-10-20 2020-10-20 一种电网统计专业指标特征提取的语义解析搜索方法

Publications (2)

Publication Number Publication Date
CN112182019A true CN112182019A (zh) 2021-01-05
CN112182019B CN112182019B (zh) 2022-09-06

Family

ID=73921942

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011121105.4A Active CN112182019B (zh) 2020-10-20 2020-10-20 一种电网统计专业指标特征提取的语义解析搜索方法

Country Status (1)

Country Link
CN (1) CN112182019B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113505594A (zh) * 2021-05-19 2021-10-15 国家电网有限公司大数据中心 电力行业术语库建设方法与系统
CN113722370A (zh) * 2021-08-30 2021-11-30 康键信息技术(深圳)有限公司 基于指标分析的数据管理方法、装置、设备及介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102819600A (zh) * 2012-08-15 2012-12-12 中国电力科学研究院 面向电力生产管理系统关系数据库的关键词搜索方法
CN103744919A (zh) * 2013-12-26 2014-04-23 广州供电局有限公司 电网知识库的自学习方法和系统
WO2015023031A1 (ko) * 2013-08-14 2015-02-19 숭실대학교산학협력단 전문분야 검색 지원 방법 및 그 장치
CN109816328A (zh) * 2018-12-15 2019-05-28 中国大唐集团科学技术研究院有限公司 电力工程项目技术经济信息系统
CN111078988A (zh) * 2019-12-23 2020-04-28 创意信息技术股份有限公司 一种电力服务信息热点检索方法、装置和电子设备
CN111126055A (zh) * 2019-10-28 2020-05-08 国电南瑞科技股份有限公司 电网设备名称匹配方法及系统
CN111582518A (zh) * 2020-05-19 2020-08-25 北京数字绿土科技有限公司 电力巡检报告自动生成方法、装置及终端设备

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102819600A (zh) * 2012-08-15 2012-12-12 中国电力科学研究院 面向电力生产管理系统关系数据库的关键词搜索方法
WO2015023031A1 (ko) * 2013-08-14 2015-02-19 숭실대학교산학협력단 전문분야 검색 지원 방법 및 그 장치
CN103744919A (zh) * 2013-12-26 2014-04-23 广州供电局有限公司 电网知识库的自学习方法和系统
CN109816328A (zh) * 2018-12-15 2019-05-28 中国大唐集团科学技术研究院有限公司 电力工程项目技术经济信息系统
CN111126055A (zh) * 2019-10-28 2020-05-08 国电南瑞科技股份有限公司 电网设备名称匹配方法及系统
CN111078988A (zh) * 2019-12-23 2020-04-28 创意信息技术股份有限公司 一种电力服务信息热点检索方法、装置和电子设备
CN111582518A (zh) * 2020-05-19 2020-08-25 北京数字绿土科技有限公司 电力巡检报告自动生成方法、装置及终端设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113505594A (zh) * 2021-05-19 2021-10-15 国家电网有限公司大数据中心 电力行业术语库建设方法与系统
CN113722370A (zh) * 2021-08-30 2021-11-30 康键信息技术(深圳)有限公司 基于指标分析的数据管理方法、装置、设备及介质

Also Published As

Publication number Publication date
CN112182019B (zh) 2022-09-06

Similar Documents

Publication Publication Date Title
CN108304375B (zh) 一种信息识别方法及其设备、存储介质、终端
CN102262634B (zh) 一种自动问答方法及系统
CN107766511A (zh) 智能问答方法、终端及存储介质
CN110633330B (zh) 事件发现方法、装置、设备及存储介质
CN103810998B (zh) 基于移动终端设备的离线语音识别方法以及实现方法
CN101952824A (zh) 计算机执行的对数据库中的文献进行索引和检索的方法以及信息检索系统
CN106777296A (zh) 一种基于语义匹配的人才搜索推荐方法及系统
CN112182019B (zh) 一种电网统计专业指标特征提取的语义解析搜索方法
WO2016119604A1 (zh) 一种语音信息搜索方法、装置及服务器
CN117290489B (zh) 一种行业问答知识库快速构建方法与系统
CN114036930A (zh) 文本纠错方法、装置、设备及计算机可读介质
CN108446316A (zh) 联想词的推荐方法、装置、电子设备及存储介质
CN109522396B (zh) 一种面向国防科技领域的知识处理方法及系统
CN113051362A (zh) 数据的查询方法、装置和服务器
CN110929007A (zh) 一种电力营销知识体系平台及应用方法
CN112445894A (zh) 基于人工智能的商务智能系统及其分析方法
CN110162651B (zh) 基于语义内容摘要的新闻内容图文不符鉴别系统及鉴别方法
CN114282513A (zh) 文本语义相似度的匹配方法、系统、智能终端及存储介质
KR20100073793A (ko) 집단지성을 이용한 지식 구조화 장치 및 그 방법과, 그를 이용한 지식서비스 제공 시스템
CN110633468B (zh) 一种关于对象特征提取的信息处理方法及装置
CN107562774A (zh) 小语种词嵌入模型的生成方法、系统及问答方法和系统
CN111949781B (zh) 一种基于自然语句句法分析的智能交互方法及装置
CN112328811A (zh) 一种基于同类型词组的词谱聚类智能生成方法
CN117575026B (zh) 基于外部知识增强的大模型推理分析方法、系统及产品
CN115438142B (zh) 一种对话式交互数据分析报告系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant