CN116010570A - 基于知识图谱的电力数据的查询方法、装置及电子设备 - Google Patents

基于知识图谱的电力数据的查询方法、装置及电子设备 Download PDF

Info

Publication number
CN116010570A
CN116010570A CN202211699927.XA CN202211699927A CN116010570A CN 116010570 A CN116010570 A CN 116010570A CN 202211699927 A CN202211699927 A CN 202211699927A CN 116010570 A CN116010570 A CN 116010570A
Authority
CN
China
Prior art keywords
query
information
power data
attribute
entity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211699927.XA
Other languages
English (en)
Inventor
董增波
陈曦
祝金会
吴人昌
辛锐
赵劭康
赵建斌
刘晓强
卢艳艳
彭姣
姜丹
郑涛
张鹏飞
常永娟
王梦迪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Corp of China SGCC
Information and Telecommunication Branch of State Grid Hebei Electric Power Co Ltd
Original Assignee
State Grid Corp of China SGCC
Information and Telecommunication Branch of State Grid Hebei Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Corp of China SGCC, Information and Telecommunication Branch of State Grid Hebei Electric Power Co Ltd filed Critical State Grid Corp of China SGCC
Priority to CN202211699927.XA priority Critical patent/CN116010570A/zh
Publication of CN116010570A publication Critical patent/CN116010570A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种基于知识图谱的电力数据的查询方法、装置及电子设备。该方法包括:获取用户提问的语音信息和用户提问时的应用场景;分析语音信息中电力数据的实体信息和属性信息,并进行用户意图识别,生成查询语句;将应用场景加入查询语句,生成目标查询语句;基于目标查询语句,查询预先设置的知识图谱数据库,得到电力数据的查询结果。本发明能够解决目前电力数据的查询结果准确率低,查询效率低的问题,提高电力数据的查询结果准确率低和查询效率,促进电力企业的科学化管理和信息化建设,有效提高电力企业的管理水平和业务水平。

Description

基于知识图谱的电力数据的查询方法、装置及电子设备
技术领域
本发明涉及电力系统技术领域,尤其涉及一种基于知识图谱的电力数据的查询方法、装置及电子设备。
背景技术
电力行业作为我国重大的基础能源体系,它的应用领域分布广泛。其中,电力营销、电力运维和电力检修等服务均较重要。随着知识管理进入全球化时代,高效地管理知识已经成为电力行业更好发展、竞争的必要条件,这就迫使电力行业急需向信息化和智能化转型。而传统的电力系统无法满足现有的需求。同时,随着互联网的不断发展和数据方面的研究不断被大家所重视,“大数据”成了推动行业发展的新动力,电力大数据成为电力领域改革发展的新思路。随着电力领域的发展,电力信息的利用率达到瓶颈期,为了提高电力数据的有效利用,实现电力系统的智能化、自动化,人工智能与电力领域的结合成了新的发展方向。
知识图谱是融合人工智能技术与传统数据库的智能数据库,用于大规模知识的结构化管理。将知识图谱与电力领域结合,使电力系统获得挖掘和分析大规模文本信息中有用知识的能力,能够串联电力领域内零散的知识点。基于此,对领域内的多源异构数据进行整合重构,形成结构化知识,利用图数据库实现高效存储,形成了电力领域知识图谱。利用上述知识图谱来实现智能化问答,充分理解用户意图,将用户想要知道的答案以可视化的形式进行展示,为电力公司管理层决策提供辅助。
一方面,目前电力数据的查询方法在接收到用户提问语句后直接搜索知识图谱数据库,而由于同一实体或属性具有不同的称谓,不同的用户采用不同的称谓查询同一实体或属性时,直接查询得到的结果准确率较低。而用户多次查询又导致查询效率较低。另一方面,宏观层面的领导层多提问查询辅助决策反面的数据,微观层面的基层管理人员多提问查询运维检修方面的数据或系统关联性的汇总数据。采用直接查询的方案得到的查询结果无法满足不同层面的用户需求,导致查询结果不准确,效率较低。
发明内容
本发明提供了一种基于知识图谱的电力数据的查询方法、装置及电子设备,能够解决目前电力数据的查询结果准确率低,查询效率低的问题,提高电力数据的查询结果准确率低和查询效率,促进电力企业的科学化管理和信息化建设,有效提高电力企业的管理水平和业务水平。
第一方面,本发明提供了一种基于知识图谱的电力数据的查询方法,包括:获取用户提问的语音信息和用户提问时的应用场景;分析语音信息中电力数据的实体信息和属性信息,并进行用户意图识别,生成查询语句;将应用场景加入查询语句,生成目标查询语句;基于目标查询语句,查询预先设置的知识图谱数据库,得到电力数据的查询结果。
在一种可能的实现方式中,分析语音信息中电力数据的实体信息和属性信息,进行用户意图识别,生成查询语句,包括:对语音信息进行分析,得到需要查询的实体信息和属性信息;实体信息包括以下至少一项:台区、单位、时段、线路、目录电价、计量点、变压器、用户定价策略、电能表、用户、互感器和行业;属性信息包括以下至少一项:标识信息,类别信息,运行状态信息,装机信息和位置信息。基于需要查询的实体信息和属性信息,对语音信息进行意图识别,得到用户意图;用户意图包括以下其中一项:单属性查询,多属性查询,属性比较查询,多实体查询,计数查询,属性排名查询和属性区间查询;基于需要查询的实体信息和属性信息,以及用户意图,生成查询语句。
在一种可能的实现方式中,对语音信息进行分析,得到需要查询的实体信息和属性信息,包括:提取语音信息中的类实体词组;计算类实体词组与电力数据的各实体信息相似度;将相似度大于第一相似度的实体信息,确定为需要查询的实体信息;提取语音信息中的类属性词组;计算类属性词组与电力数据的各属性信息相似度;将相似度大于第二相似度的属性信息,确定为需要查询的属性信息。
在一种可能的实现方式中,基于需要查询的实体信息和属性信息,以及用户意图,生成查询语句,包括:确定需要查询的实体信息对应的目标实体槽值;确定需要查询的属性信息对应的目标属性槽值;基于用户意图,确定查询语句对应的模板;基于查询语句对应的模板,目标实体槽值和目标属性槽值,确定查询语句。
在一种可能的实现方式中,基于目标查询语句,查询预先设置的知识图谱数据库,得到电力数据的查询结果之前,还包括:获取需要查询的电力数据,电力数据包括配电网中各电气设备的装机信息,各电力设备的历史运行状态信息,配电网的历史法规文件和配电网的历史营销记录,和配电网的历史决策记录;赋予各应用场景不同的场景槽值,并建立各场景槽值和电力数据之间的第一映射关系;应用场景包括用户场景,单位场景,台区场景,线路场景和行业场景;赋予各实体信息不同的实体槽值,并建立各实体槽值与电力数据之间的第二映射关系;赋予各属性信息不同的属性槽值,并建立各属性槽值的与电力数据之间的第三映射关系;基于第一映射关系,第二映射关系和第三映射关系,构建知识图谱数据库的索引;基于索引和电力数据,生成知识图谱数据库。
在一种可能的实现方式中,基于目标查询语句,查询预先设置的知识图谱数据库,得到电力数据的查询结果,包括:基于目标查询语句,分析得到场景槽值、实体槽值、属性槽值和用户意图;基于场景槽值、实体槽值和属性槽值,筛选知识图谱数据库中的电力数据,得到初筛数据;基于用户意图,对初筛数据进行处理,得到电力数据的查询结果。
在一种可能的实现方式中,基于所述目标查询语句,查询预先设置的知识图谱数据库,得到电力数据的查询结果之后,还包括:对查询结果进行特征分析,得到与查询结果匹配的特征类型;特征类型包括以下至少一项:时序变化特征、地域分布特征、上下级关系特征,对比关系特征和网络关系特征;基于与特征类型对应的图表,生成查询结果的可视化界面;基于应用场景,调整可视化界面,并显示调整后的可视化界面。
在一种可能的实现方式中,对查询结果进行特征分析,得到与查询结果匹配的特征类型,包括:计算查询结果与各特征类型之间的匹配度;将匹配度大于设定匹配度的特征类型,确定为与查询结果匹配的特征类型。
第二方面,本发明实施例提供了一种基于知识图谱的电力数据的查询装置,包括:通信模块,用于获取用户提问的语音信息和用户提问时的应用场景;处理模块,用于分析语音信息中电力数据的实体信息和属性信息,并进行用户意图识别,生成查询语句;将应用场景加入查询语句,生成目标查询语句;基于目标查询语句,查询预先设置的知识图谱数据库,得到电力数据的查询结果。
第三方面,本发明实施例提供了一种电子设备,其特征在于,所述电子设备包括存储器和处理器,该存储器存储有计算机程序,所述处理器用于调用并运行所述存储器中存储的计算机程序执行如上述第一方面以及第一方面中任一种可能的实现方式所述方法的步骤。
第四方面,本发明实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如上述第一方面以及第一方面中任一种可能的实现方式所述方法的步骤。
本发明提供一种基于知识图谱的电力数据的查询方法、装置及电子设备,一方面,本发明在获取到用户提问的语音信息后,对语音信息中电力数据的实体信息和属性信息进行分析,并进行意图识别,生成查询语句。如此,本发明可以在查询前对语音信息中的实体和属性进行分析,提高电力数据查询的准确性,降低用户的查询次数,提高查询效率。另一方面本发明在获取语音信息的同时,获取用户提问的应用场景,并将应用场景加入查询语句中,生成目标查询语句,之后,基于目标查询语句查询预先设置的知识图谱数据库,得到电力数据的查询结果。如此,本发明可以结合用户的应用场景进行电力数据查询,从而得到的查询结果可以满足不同应用场景的用户需求,提高电力数据的查询结果的准确率,降低用户的查询次数,提高查询效率。
示例性的,本发明可以在宏观层面为领导层提供辅助决策、微观层面为基层管理人员提供基于应用场景的数据关联展示和汇总信息。本发明通过构建智能问答及可视化系统,清晰的展示相关数据,提高电力数据的查询结果的准确率,提高数据获取效率,促进电力企业的科学化管理和信息化建设,有效提高电力企业的管理水平和业务水平。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种基于知识图谱的电力数据的查询方法的流程示意图;
图2是本发明实施例提供的一种电力数据的实体信息和属性信息的示意图;
图3是本发明实施例提供的另一种基于知识图谱的电力数据的查询方法的流程示意图;
图4是本发明实施例提供的另一种基于知识图谱的电力数据的查询方法的流程示意图;
图5是本发明实施例提供的另一种基于知识图谱的电力数据的查询方法的流程示意图;
图6是本发明实施例提供的一种基于知识图谱的电力数据的查询装置的结构示意图;
图7是本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本发明实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本发明。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本发明的描述。
在本发明的描述中,除非另有说明,“/”表示“或”的意思,例如,A/B可以表示A或B。本文中的“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。此外,“至少一个”“多个”是指两个或两个以上。“第一”、“第二”等字样并不对数量和执行次序进行限定,并且“第一”、“第二”等字样也并不限定一定不同。
在本申请实施例中,“示例性的”或者“例如”等词用于表示作例子、例证或说明。本申请实施例中被描述为“示例性的”或者“例如”的任何实施例或设计方案不应被解释为比其它实施例或设计方案更优选或更具优势。确切而言,使用“示例性的”或者“例如”等词旨在以具体方式呈现相关概念,便于理解。
此外,本申请的描述中所提到的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或模块的过程、方法、系统、产品或设备没有限定于已列出的步骤或模块,而是可选的还包括其他没有列出的步骤或模块,或可选的还包括对于这些过程、方法、产品或设备固有的其它步骤或模块。
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明的附图通过具体实施例来进行说明。
图1为本发明实施例提供的一种基于知识图谱的电力数据的查询方法的流程示意图。该方法的执行主体为查询装置。该方法包括步骤S101-S104。
S101、获取用户提问的语音信息和用户提问时的应用场景。
在一些实施例中,应用场景包括用户场景,单位场景,台区场景,线路场景和行业场景。
在一些实施例中,用户提问的语音信息为用户提问的一段语音,该段语音中包括用户的问题。示例性的,用户的问题可以为如表1中的示例。
表1
Figure BDA0004023652930000071
S102、分析语音信息中电力数据的实体信息和属性信息,并进行用户意图识别,生成查询语句。
在一些实施例中,电力数据的实体信息可以包括以下至少一项:台区、单位、时段、线路、目录电价、计量点、变压器、用户定价策略、电能表、用户、互感器和行业。
在一些实施例中,电力数据的属性信息包括以下至少一项:标识信息,类别信息,运行状态信息,装机信息和位置信息。
示例性的,如图2所示,本发明实施例提供了一种电力数据的实体信息和属性信息的示意图。其中,单位的属性信息可以包括设备标识、台区标识、运行状态和装机容量等。计量点的属性标识可以包括计量点名称、接线方式、线路标识和台区标识等。目录电价的属性标识可以包括计算参数版本号、电价码、目录电价名称和按范围执行标志等。
作为一种可能的实现方式,查询装置可以基于步骤S1021-S1023,生成查询语句。
S1021、对语音信息进行分析,得到需要查询的实体信息和属性信息。
示例性的,查询装置可以基于步骤A1-A6,确定需要查询的实体信息和属性信息。
A1、提取语音信息中的类实体词组。
A2、计算类实体词组与电力数据的各实体信息相似度。
A3、将相似度大于第一相似度的实体信息,确定为需要查询的实体信息。
A4、提取语音信息中的类属性词组。
A5、计算类属性词组与电力数据的各属性信息相似度。
A6、将相似度大于第二相似度的属性信息,确定为需要查询的属性信息。
需要说明的是,本发明实施例主要从用户提供的问句文本出发,判断问句的意图及提取相关的实体信息。由于问句文本的通俗表达的缺陷,往往导致从问句文本中提取到的实体信息存在信息不完整,信息内容部分错误以及通俗口语化等问题。因此提取到的实体信息无法链接到知识图谱当中。
对于从问句中获得的潜在实体指称很大程度上与知识图谱中的实体信息不一致,故需要通过实体链接将其链接到给定的知识图谱中无歧义的实体上。面对已经构建好的知识图谱,本发明提出了符合实际开发背景的实体链接方法,从潜在实体入手在知识图谱中筛选出候选实体,结合概念图谱中的实体关系,对潜在实体所属的类型关系进行校验,提高实体链接的准确性,同时尽可能确保后续生成的Cypher语句的可用性。
可以理解的是,槽值实体链接旨在根据已获取槽值中潜在的实体指称,将其链接到给定知识库中无歧义的实体上。因为部分类型实体数量过于庞大且数据已存储在知识图谱数据库中。采用基于词典和深度学习的实体链接方法存在局限性。故结合实际业务需求本发明采取基于知识图谱模糊查询进行槽值实体链接。
示例性的,本发明实施例通过对槽值分词处理,将分词后得到的结果结合意图识别得到的槽值类别构建Cypher查询语句,在Cypher查询语句中利用正则表达式实现基于知识图谱数据库的模糊查询。各个分词段模糊查询得到的结果构成候选实体集。考虑到可能出现意图识别得到的槽值类别有误的情况,根据概念图谱中的类别关系,将分词结果在相关类别中进行模糊查询,相关结果添加到候选实体集中。使用余弦相似度计算候选实体的相似度。根据相似度对候选实体进行排序,相似度最大的候选实体作为目标链接实体。如果候选实体集为空,则说明意图识别槽值有误,将错误信息反馈给意图识别模块。
S1022、基于需要查询的实体信息和属性信息,对语音信息进行意图识别,得到用户意图。
在一些实施例中,用户意图包括以下其中一项:单属性查询,多属性查询,属性比较查询,多实体查询,计数查询,属性排名查询和属性区间查询。
示例性的,如表1所示,本发明实施例提供了各用户意图对应的语音信息示例。如,某用户的计量方式是什么?其中,用户为实体,计量方式为属性,该语音信息为单属性查询。
S1023、基于需要查询的实体信息和属性信息,以及用户意图,生成查询语句。
在一些实施例中,查询语句可以为Cypher语句。或者,查询语句还可以为其他格式语句,本申请不作限定。
示例性的,查询装置可以基于步骤B1-B6,确定需要查询的实体信息和属性信息。
B1、确定需要查询的实体信息对应的目标实体槽值。
B2、确定需要查询的属性信息对应的目标属性槽值。
B3、基于用户意图,确定查询语句对应的模板。
B4、基于查询语句对应的模板,目标实体槽值和目标属性槽值,确定查询语句。
示例性的,如表2所示,本发明实施例提供了一种各查询模板对应的Cypher语句示意。
表2
Figure BDA0004023652930000101
需要说明的是,本发明实施例通过分析电力领域用户关心的问题发现,问句的查询目标主要包含实体查询和属性查询两大类。属性查询中单属性查询、多属性查询是针对问句中单实体的情况,而比较查询则是针对两个实体间属性值的比较;实体查询中,问题分为多实体查询、计数查询、属性排名查询和属性区间查询。对于复杂问题,涉及到多实体多属性查询,可以将复杂问题拆分成多个问题小类分析。
根据问题集的分类,从实体和属性的角度划分问题集构建查询模板。对于查询模板对应的Cypher语句模板格式如下:match(代称:实体名)-[关系]-(代称:实体名)where实体类别.属性类别=属性值return代称,order by排序要求。查询模板中Cypher语句模板的Match子句由实体之间的关系构成,Where子句则根据属性值情况构建约束条件,Return子句则构建返回实体的信息语句以及针对排名情况的约束条件。
电力领域概念图谱给出了概念层面的实体-属性关系。目标链接属性和对应的属性类型信息构建实体-属性关系。将意图识别槽分类成实体类,实体+属性类,比较类和排名类等。结合各槽值的类别分类情况匹配问题的查询模板。每个查询模板对应一个Cypher语句模板。
S103、将应用场景加入查询语句,生成目标查询语句。
作为一种可能的实现方式,查询装置可以在Cypher语句中增加应用场景字段后生成目标查询语句。
需要说明的是,本发明实施例根据槽值的实体类和属性类的数目情况以及意图识别结果匹配对应的查询模板,但此时构建的Cypher语句模板仅从问题的角度出发,未能结合知识图谱当中的具体内容,并且没有考虑到查询结果相关影响因素的呈现。因此,在划分查询模板生成Cypher语句模板的基础上融合应用场景对Cypher语句模板进行扩展。本发明实施例将场景槽值映射到知识图谱数据库中,进行匹配查询。结合场景中定义的扩展信息以及概念图谱当中邻近关系进行扩展,将扩展的概念实体关系添加进Cypher语句模板中的Match子句。同时加入的概念实体也要在Return子句中添加。最后将意图识别获取的槽值填充进扩展后的Cypher语句模板中生成对应的Cypher语句。
S104、基于目标查询语句,查询预先设置的知识图谱数据库,得到电力数据的查询结果。
在一些实施例中,预先设置的知识图谱数据库为查询装置基于电力数据构建的。
作为一种可能的实现方式,查询装置可以基于步骤S1041-S1043,得到电力数据的查询结果。
S1041、基于目标查询语句,分析得到场景槽值、实体槽值、属性槽值和用户意图。
S1042、基于场景槽值、实体槽值和属性槽值,筛选知识图谱数据库中的电力数据,得到初筛数据。
S1043、基于用户意图,对初筛数据进行处理,得到电力数据的查询结果。
本发明提供一种基于知识图谱的电力数据的查询方法、装置及电子设备,一方面,本发明在获取到用户提问的语音信息后,对语音信息中电力数据的实体信息和属性信息进行分析,并进行意图识别,生成查询语句。如此,本发明可以在查询前对语音信息中的实体和属性进行分析,提高电力数据查询的准确性,降低用户的查询次数,提高查询效率。另一方面本发明在获取语音信息的同时,获取用户提问的应用场景,并将应用场景加入查询语句中,生成目标查询语句,之后,基于目标查询语句查询预先设置的知识图谱数据库,得到电力数据的查询结果。如此,本发明可以结合用户的应用场景进行电力数据查询,从而得到的查询结果可以满足不同应用场景的用户需求,提高电力数据的查询结果的准确率,降低用户的查询次数,提高查询效率。
示例性的,本发明可以在宏观层面为领导层提供辅助决策、微观层面为基层管理人员提供基于应用场景的数据关联展示和汇总信息。本发明通过构建智能问答及可视化系统,清晰的展示相关数据,提高电力数据的查询结果的准确率,提高数据获取效率,促进电力企业的科学化管理和信息化建设,有效提高电力企业的管理水平和业务水平。
可选的,如图3所示,本发明实施例提供的基于知识图谱的电力数据的查询方法,在步骤S104之前,还包括步骤S201-S206。
S201、获取需要查询的电力数据。
在一些实施例中,电力数据包括配电网中各电气设备的装机信息,各电力设备的历史运行状态信息,配电网的历史法规文件和配电网的历史营销记录,和配电网的历史决策记录。
S202、赋予各应用场景不同的场景槽值,并建立各场景槽值和电力数据之间的第一映射关系。
在一些实施例中,应用场景包括用户场景,单位场景,台区场景,线路场景和行业场景。
S203、赋予各实体信息不同的实体槽值,并建立各实体槽值与电力数据之间的第二映射关系。
S204、赋予各属性信息不同的属性槽值,并建立各属性槽值的与电力数据之间的第三映射关系。
S205、基于第一映射关系,第二映射关系和第三映射关系,构建知识图谱数据库的索引。
S206、基于索引和电力数据,生成知识图谱数据库。
如此一来,本发明实施例可以在用户查询之前预先设置知识图谱数据库,为用户查询提供支撑。进一步的,本发明实施例通过建立第一映射关系,第二映射关系和第三映射关系,并建立知识图谱数据库的索引,使得在进行数据查询时通过索引查询知识图谱数据库,相比于直接查询知识图谱数据库,可以提高数据查询速度。本发明实施例在索引中增加场景槽值对应的第一映射关系,使得在数据查询时可以查询到更加符合应用场景的数据,提高电力数据的查询结果的准确度。
可选的,如图4所示,本发明实施例提供的基于知识图谱的电力数据的查询方法,在步骤S104之后,还包括步骤S301-S303。
S301、对查询结果进行特征分析,得到与查询结果匹配的特征类型。
在一些实施例中,特征类型包括以下至少一项:时序变化特征、地域分布特征、上下级关系特征,对比关系特征和网络关系特征。
作为一种可能的实现方式,查询装置可以计算查询结果与各特征类型之间的匹配度;将匹配度大于设定匹配度的特征类型,确定为与查询结果匹配的特征类型。
S302、基于与特征类型对应的图表,生成查询结果的可视化界面;
在一些实施例中,图表类型可以包括时序图、关系图、地理坐标图、折线图、条形图、树形图、对比图、列表和扇形图。
S303、基于应用场景,调整可视化界面,并显示调整后的可视化界面。
如此一来,本发明实施例可以在得到查询结果后,通过与查询结果较为匹配的图表进行可视化,呈现给用户,使得查询结果可以准确显示,为用户获取数据提供便利。
需要说明的是,从知识图谱数据库查询得到的查询结果为多层嵌套的json格式数据,根据return给出的数据格式一条查询结果对应一个json数据,查询结果中返回的实体数据包含实体各属性的值,以及该实体所属的类别。提取一条查询结果,分析各实体类别的特征以及模板中定义的返回数据,得到查询结果的特征。目前查询结果的特征分为五类,即时序变化特征、地域分布特征、上下级关系特征,对比关系特征和网络关系特征。对于前四类体现的特征鲜明,故先判断是否符合前四类,如果都不符合则为网络关系特征。根据各图表适合展示数据的特征定义图表的展示特征,然后将对上述分析得到的特征与各图表的展示特征做模糊匹配。依照匹配的相关性给每一个图表进行打分,最后根据排名的结果和相关度的阈值将得分达到阈值要求的图表组合呈现给用户。
需要说明的是,基于知识图谱的查询生成及可视化平台采用Django框架,提供应用场景定义和问答可视化两部分功能。应用场景定义功能满足用户自定义应用场景的需求,为融合应用场景的Cypher语句扩展提供实际的业务参考,提高扩展数据与实际业务的粘合度。问答可视化功能结合上述的技术步骤,处理用户输入的问句,采用Echarts组件将问句结果及相关影响因素以多视图可视化的方式呈现给用户。本实施案例的知识图谱中包含实例数据为:实体类型12种,实例结点14万级,属性260万级;关系类型9种,关系实例79万级。
需要说明的是,本发明实施例通过对已构建的电力数据的知识图谱数据库进行改进,设计并实现自然语言问句转化成Cypher语句的查询功能以及对查询结果和扩展内容自适应可视化展示,为电力领域智能问答提供查询生成和结果展示支持。本发明提出了面向电力领域知识图谱的查询语句的生成方法,并且创新的提出了融合应用场景对问句结果的形成因素进行呈现。对于知识图谱的查询结果提出了适应性可视化展示方法。对于各类基于知识图谱的问答系统具有较好的参考价值。本发明基于电力数据的知识图谱实现智能问答及可视化。
需要说明的是,本发明实施例基于知识图谱的问答系统工作流程如图5所示,意图识别模块对语音信息进行意图识别,生成查询语句。在知识图谱数据库中查询得到查询结果。可视化模块对查询结果进行可视化,得到可视化结果,呈现给用户。
本发明实施例提供的基于知识图谱的电力数据的查询方法,开发了基于Web端的问句查询交互平台。用户无需了解相关数据库查询语言的语法和使用,只需输入关心的问题即可得到相应的答案以及答案的相关影响因素情况。平台提高了使用群体的范围,最大可能的提高人员的利用率,进一步降低了企业运营的成本。本发明从某省电网实际业务背景出发,结合业务中常见的应用场景,利用知识图谱的网状衍生特性,为用户找出更加准确的信息,提供更全面的总结和更有深度相关的信息。本发明结合实际业务需求给出了切实可行的实现方式,具有一定的应用适用性和推广应用价值。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
以下为本发明的装置实施例,对于其中未详尽描述的细节,可以参考上述对应的方法实施例。
图6示出了本发明实施例提供的一种基于知识图谱的电力数据的查询装置的结构示意图。该查询装置400包括通信模块401和处理模块402。
通信模块401,用于获取用户提问的语音信息和用户提问时的应用场景。
处理模块402,用于分析语音信息中电力数据的实体信息和属性信息,并进行用户意图识别,生成查询语句;将应用场景加入查询语句,生成目标查询语句;基于目标查询语句,查询预先设置的知识图谱数据库,得到电力数据的查询结果。
在一种可能的实现方式中,处理模块402,具体用于对语音信息进行分析,得到需要查询的实体信息和属性信息;实体信息包括以下至少一项:台区、单位、时段、线路、目录电价、计量点、变压器、用户定价策略、电能表、用户、互感器和行业;属性信息包括以下至少一项:标识信息,类别信息,运行状态信息,装机信息和位置信息。基于需要查询的实体信息和属性信息,对语音信息进行意图识别,得到用户意图;用户意图包括以下其中一项:单属性查询,多属性查询,属性比较查询,多实体查询,计数查询,属性排名查询和属性区间查询;基于需要查询的实体信息和属性信息,以及用户意图,生成查询语句。
在一种可能的实现方式中,处理模块402,具体用于对语音信息进行分析,得到需要查询的实体信息和属性信息,包括:提取语音信息中的类实体词组;计算类实体词组与电力数据的各实体信息相似度;将相似度大于第一相似度的实体信息,确定为需要查询的实体信息;提取语音信息中的类属性词组;计算类属性词组与电力数据的各属性信息相似度;将相似度大于第二相似度的属性信息,确定为需要查询的属性信息。
在一种可能的实现方式中,处理模块402,具体用于基于需要查询的实体信息和属性信息,以及用户意图,生成查询语句,包括:确定需要查询的实体信息对应的目标实体槽值;确定需要查询的属性信息对应的目标属性槽值;基于用户意图,确定查询语句对应的模板;基于查询语句对应的模板,目标实体槽值和目标属性槽值,确定查询语句。
在一种可能的实现方式中,处理模块402,还用于获取需要查询的电力数据,电力数据包括配电网中各电气设备的装机信息,各电力设备的历史运行状态信息,配电网的历史法规文件和配电网的历史营销记录,和配电网的历史决策记录;赋予各应用场景不同的场景槽值,并建立各场景槽值和电力数据之间的第一映射关系;应用场景包括用户场景,单位场景,台区场景,线路场景和行业场景;赋予各实体信息不同的实体槽值,并建立各实体槽值与电力数据之间的第二映射关系;赋予各属性信息不同的属性槽值,并建立各属性槽值的与电力数据之间的第三映射关系;基于第一映射关系,第二映射关系和第三映射关系,构建知识图谱数据库的索引;基于索引和电力数据,生成知识图谱数据库。
在一种可能的实现方式中,处理模块402,具体用于基于目标查询语句,分析得到场景槽值、实体槽值、属性槽值和用户意图;基于场景槽值、实体槽值和属性槽值,筛选知识图谱数据库中的电力数据,得到初筛数据;基于用户意图,对初筛数据进行处理,得到电力数据的查询结果。
在一种可能的实现方式中,处理模块402,还用于对查询结果进行特征分析,得到与查询结果匹配的特征类型;特征类型包括以下至少一项:时序变化特征、地域分布特征、上下级关系特征,对比关系特征和网络关系特征;基于与特征类型对应的图表,生成查询结果的可视化界面;基于应用场景,调整可视化界面,并显示调整后的可视化界面。
在一种可能的实现方式中,处理模块402,具体用于计算查询结果与各特征类型之间的匹配度;将匹配度大于设定匹配度的特征类型,确定为与查询结果匹配的特征类型。
图7是本发明实施例提供的一种电子设备的结构示意图。如图7所示,该实施例的电子设备500包括:处理器501、存储器502以及存储在所述存储器502中并可在所述处理器501上运行的计算机程序503。所述处理器501执行所述计算机程序503时实现上述各方法实施例中的步骤,例如图1所示的步骤101至步骤104。或者,所述处理器501执行所述计算机程序503时实现上述各装置实施例中各模块/单元的功能,例如,图6所示通信模块401和处理模块402的功能。
示例性的,所述计算机程序503可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器502中,并由所述处理器501执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序503在所述电子设备500中的执行过程。例如,所述计算机程序503可以被分割成图6所示通信模块401和处理模块402。
所称处理器501可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器502可以是所述电子设备500的内部存储单元,例如电子设备500的硬盘或内存。所述存储器502也可以是所述电子设备500的外部存储设备,例如所述电子设备500上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(SecureDigital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器502还可以既包括所述电子设备500的内部存储单元也包括外部存储设备。所述存储器502用于存储所述计算机程序以及所述终端所需的其他程序和数据。所述存储器502还可以用于暂时地存储已经输出或者将要输出的数据。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的实施例中,应该理解到,所揭露的装置/终端和方法,可以通过其它的方式实现。例如,以上所描述的装置/终端实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、电载波信号、电信信号以及软件分发介质等。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

Claims (10)

1.一种基于知识图谱的电力数据的查询方法,其特征在于,包括:
获取用户提问的语音信息和用户提问时的应用场景;
分析所述语音信息中电力数据的实体信息和属性信息,并进行用户意图识别,生成查询语句;
将所述应用场景加入所述查询语句,生成目标查询语句;
基于所述目标查询语句,查询预先设置的知识图谱数据库,得到电力数据的查询结果。
2.根据权利要求1所述的基于知识图谱的电力数据的查询方法,其特征在于,所述分析所述语音信息中电力数据的实体信息和属性信息,进行用户意图识别,生成查询语句,包括:
对所述语音信息进行分析,得到需要查询的实体信息和属性信息;所述实体信息包括以下至少一项:台区、单位、时段、线路、目录电价、计量点、变压器、用户定价策略、电能表、用户、互感器和行业;所述属性信息包括以下至少一项:标识信息,类别信息,运行状态信息,装机信息和位置信息;
基于所述需要查询的实体信息和属性信息,对所述语音信息进行意图识别,得到用户意图;所述用户意图包括以下其中一项:单属性查询,多属性查询,属性比较查询,多实体查询,计数查询,属性排名查询和属性区间查询;
基于所述需要查询的实体信息和属性信息,以及所述用户意图,生成所述查询语句。
3.根据权利要求2所述的基于知识图谱的电力数据的查询方法,其特征在于,所述对所述语音信息进行分析,得到需要查询的实体信息和属性信息,包括:
提取所述语音信息中的类实体词组;
计算所述类实体词组与所述电力数据的各实体信息相似度;
将相似度大于第一相似度的实体信息,确定为所述需要查询的实体信息;
提取所述语音信息中的类属性词组;
计算所述类属性词组与所述电力数据的各属性信息相似度;
将相似度大于第二相似度的属性信息,确定为所述需要查询的属性信息。
4.根据权利要求2所述的基于知识图谱的电力数据的查询方法,其特征在于,所述基于所述需要查询的实体信息和属性信息,以及所述用户意图,生成所述查询语句,包括:
确定所述需要查询的实体信息对应的目标实体槽值;
确定所述需要查询的属性信息对应的目标属性槽值;
基于所述用户意图,确定所述查询语句对应的模板;
基于所述查询语句对应的模板,所述目标实体槽值和所述目标属性槽值,确定所述查询语句。
5.根据权利要求1所述的基于知识图谱的电力数据的查询方法,其特征在于,所述基于所述目标查询语句,查询预先设置的知识图谱数据库,得到电力数据的查询结果之前,还包括:
获取需要查询的电力数据,所述电力数据包括配电网中各电气设备的装机信息,各电力设备的历史运行状态信息,配电网的历史法规文件和配电网的历史营销记录,和配电网的历史决策记录;
赋予各应用场景不同的场景槽值,并建立各场景槽值和所述电力数据之间的第一映射关系;所述应用场景包括用户场景,单位场景,台区场景,线路场景和行业场景;
赋予各实体信息不同的实体槽值,并建立各实体槽值与所述电力数据之间的第二映射关系;
赋予各属性信息不同的属性槽值,并建立各属性槽值的与所述电力数据之间的第三映射关系;
基于所述第一映射关系,所述第二映射关系和所述第三映射关系,构建所述知识图谱数据库的索引;
基于所述索引和所述电力数据,生成所述知识图谱数据库。
6.根据权利要求5所述的基于知识图谱的电力数据的查询方法,其特征在于,所述基于所述目标查询语句,查询预先设置的知识图谱数据库,得到电力数据的查询结果,包括:
基于所述目标查询语句,分析得到场景槽值、实体槽值、所述属性槽值和所述用户意图;
基于所述场景槽值、所述实体槽值和所述属性槽值,筛选所述知识图谱数据库中的电力数据,得到初筛数据;
基于所述用户意图,对所述初筛数据进行处理,得到电力数据的查询结果。
7.根据权利要求1至6中任一项所述的基于知识图谱的电力数据的查询方法,其特征在于,所述基于所述目标查询语句,查询预先设置的知识图谱数据库,得到电力数据的查询结果之后,还包括:
对所述查询结果进行特征分析,得到与所述查询结果匹配的特征类型;所述特征类型包括以下至少一项:时序变化特征、地域分布特征、上下级关系特征,对比关系特征和网络关系特征;
基于与所述特征类型对应的图表,生成所述查询结果的可视化界面;
基于所述应用场景,调整所述可视化界面,并显示调整后的可视化界面。
8.根据权利要求7所述的基于知识图谱的电力数据的查询方法,其特征在于,所述对所述查询结果进行特征分析,得到与所述查询结果匹配的特征类型,包括:
计算所述查询结果与各特征类型之间的匹配度;
将匹配度大于设定匹配度的特征类型,确定为与所述查询结果匹配的特征类型。
9.一种基于知识图谱的电力数据的查询装置,其特征在于,包括:
通信模块,用于获取用户提问的语音信息和用户提问时的应用场景;
处理模块,用于分析所述语音信息中电力数据的实体信息和属性信息,并进行用户意图识别,生成查询语句;将所述应用场景加入所述查询语句,生成目标查询语句;基于所述目标查询语句,查询预先设置的知识图谱数据库,得到电力数据的查询结果。
10.一种电子设备,其特征在于,所述电子设备包括存储器和处理器,该存储器存储有计算机程序,所述处理器用于调用并运行所述存储器中存储的计算机程序执行如权利要求1至8中任一项所述的方法。
CN202211699927.XA 2022-12-28 2022-12-28 基于知识图谱的电力数据的查询方法、装置及电子设备 Pending CN116010570A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211699927.XA CN116010570A (zh) 2022-12-28 2022-12-28 基于知识图谱的电力数据的查询方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211699927.XA CN116010570A (zh) 2022-12-28 2022-12-28 基于知识图谱的电力数据的查询方法、装置及电子设备

Publications (1)

Publication Number Publication Date
CN116010570A true CN116010570A (zh) 2023-04-25

Family

ID=86027809

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211699927.XA Pending CN116010570A (zh) 2022-12-28 2022-12-28 基于知识图谱的电力数据的查询方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN116010570A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116596405A (zh) * 2023-07-06 2023-08-15 南方电网数字电网研究院有限公司 纯数据驱动的电力系统分析方法及系统
CN117194616A (zh) * 2023-11-06 2023-12-08 湖南四方天箭信息科技有限公司 一种垂域知识图谱的知识查询方法、装置、计算机设备和存储介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116596405A (zh) * 2023-07-06 2023-08-15 南方电网数字电网研究院有限公司 纯数据驱动的电力系统分析方法及系统
CN116596405B (zh) * 2023-07-06 2024-03-26 南方电网数字电网研究院有限公司 纯数据驱动的电力系统分析方法及系统
CN117194616A (zh) * 2023-11-06 2023-12-08 湖南四方天箭信息科技有限公司 一种垂域知识图谱的知识查询方法、装置、计算机设备和存储介质

Similar Documents

Publication Publication Date Title
CN110825882B (zh) 一种基于知识图谱的信息系统管理方法
CN116010570A (zh) 基于知识图谱的电力数据的查询方法、装置及电子设备
CN111177231A (zh) 报表生成方法和报表生成装置
CN107908606A (zh) 基于不同信息源自动生成报表的方法和系统
CN108509566B (zh) 一种基于云上95598数据发布服务业务系统网络拓扑可视化方法
CN109388637A (zh) 数据仓库信息处理方法、装置、系统、介质
CN109739878B (zh) 大数据查询方法、装置、服务器及存储介质
CN111260413A (zh) 一种基于矢量图形的电力主网工程施工图造价速算方法
CN110245240A (zh) 一种问题数据答案的确定方法及装置
CN110162754B (zh) 一种岗位描述文档的生成方法及设备
US20070088743A1 (en) Information processing device and information processing method
US11373101B2 (en) Document analyzer
Xiao et al. Mobile 3D assembly process information construction and transfer to the assembly station of complex products
US20210406281A1 (en) Data configuration query method and device
CN113095524A (zh) 电力设备检修工作单据智能生成方法、系统及存储介质
CN113887941A (zh) 业务流程生成方法、装置、电子设备及介质
CN112672370A (zh) 网元指标数据的自动检测方法及系统、设备和存储介质
CN115203435A (zh) 基于知识图谱的实体关系生成方法及数据查询方法
CN113626571B (zh) 答句生成方法、装置、计算机设备和存储介质
CN110675238A (zh) 客户标签配置方法、系统、可读存储介质及电子设备
CN114218291A (zh) 基于目标对象的画像生成方法、装置、设备及存储介质
CN114297516A (zh) 一种基于知识图谱的事件发现与展现方法及系统
CN112036150A (zh) 电价政策条款解析方法、存储介质及计算机
CN111444368A (zh) 构建用户画像的方法、装置、计算机设备及存储介质
CN116541578A (zh) 资产数字化多维度管理方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination