CN117539976A - 电力知识库更新方法、装置、设备、存储介质和程序产品 - Google Patents
电力知识库更新方法、装置、设备、存储介质和程序产品 Download PDFInfo
- Publication number
- CN117539976A CN117539976A CN202311377109.2A CN202311377109A CN117539976A CN 117539976 A CN117539976 A CN 117539976A CN 202311377109 A CN202311377109 A CN 202311377109A CN 117539976 A CN117539976 A CN 117539976A
- Authority
- CN
- China
- Prior art keywords
- power
- information
- text
- entity
- electric
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 62
- 238000004590 computer program Methods 0.000 claims abstract description 26
- 230000001960 triggered effect Effects 0.000 claims abstract description 13
- 230000011218 segmentation Effects 0.000 claims description 79
- 238000012545 processing Methods 0.000 claims description 14
- 238000004422 calculation algorithm Methods 0.000 claims description 11
- 238000000605 extraction Methods 0.000 claims description 11
- 230000004927 fusion Effects 0.000 claims description 4
- 238000013473 artificial intelligence Methods 0.000 abstract description 4
- 238000004458 analytical method Methods 0.000 description 12
- 238000003058 natural language processing Methods 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 7
- 239000011159 matrix material Substances 0.000 description 7
- 230000002159 abnormal effect Effects 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 230000004913 activation Effects 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 238000013145 classification model Methods 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- 238000011176 pooling Methods 0.000 description 4
- 238000010276 construction Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000008451 emotion Effects 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 230000005856 abnormality Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 206010063385 Intellectualisation Diseases 0.000 description 1
- 238000009411 base construction Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 229910021389 graphene Inorganic materials 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/34—Browsing; Visualisation therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请实施例提供了一种电力知识库更新方法、装置、计算机设备、存储介质和计算机程序产品,涉及人工智能技术领域。该方法包括:响应于目标用户在电力查询终端上触发的电力信息查询请求,获取电力查询文本信息;获取电力查询文本信息对应的至少一个目标电力实体,和获取各目标电力实体的关系信息;根据目标电力实体和关系信息,从电力知识库中获取电力查询文本信息对应的关联信息,并将关联信息在电力查询终端上进行展示;将目标电力实体和关系信息作为关联信息的电力标签,得到标注后的关联信息,并将标注后的关联信息更新至电力知识库。该方法,可以提高关联信息获取的准确性,以及可以提高电力知识库更新的准确性、简便性和效率。
Description
技术领域
本申请涉及人工智能技术领域,特别是涉及一种电力知识库更新方法、装置、计算机设备、存储介质和计算机程序产品。
背景技术
随着电力企业经营范围和市场占有量的不断增加,基于深度学习的人工智能(Artificial Intelligence,AI)机器人在电力行业发挥着越来越重要的作用。如今的客服机器人服务越来越接近真人沟通的方式,因为它不仅可以理解用户语言,也可以帮助用户完成一些任务。为了确保AI机器人服务目标用户的质量和效率,需要经常对AI机器人关联的电力知识库进行快速更新,目前存在的电力知识库更新方法存在繁琐,效率低的问题。
发明内容
基于此,有必要针对上述技术问题,提供一种电力知识库更新方法、装置、计算机设备、存储介质和计算机程序产品。
第一方面,本申请提供了一种电力知识库更新方法,应用于电力查询服务器。所述方法包括:
响应于目标用户在电力查询终端上触发的电力信息查询请求,获取所述电力信息查询请求中包含的电力查询文本信息;
获取所述电力查询文本信息对应的至少一个目标电力实体,以及获取各所述目标电力实体之间的关系信息;
根据所述目标电力实体和所述关系信息,从预先构建的电力知识库中获取所述电力查询文本信息对应的关联信息,并将所述关联信息在所述电力查询终端上进行展示;
将所述目标电力实体和所述关系信息作为所述关联信息的电力标签,得到标注后的关联信息,并将所述标注后的关联信息更新至所述电力知识库。
在其中一个实施例中,所述获取所述电力查询文本信息对应的至少一个目标电力实体,包括:对所述电力查询文本信息进行文本识别处理,得到所述电力查询文本信息的至少一个文本分词;将所述至少一个文本分词输入至主题词抽取模型,得到所述电力查询文本信息对应的电力关键词;获取所述电力关键词的至少一个电力实体,并将各所述电力实体作为所述电力查询文本信息对应的目标电力实体。
在其中一个实施例中,所述对所述电力查询文本信息进行文本识别处理,得到所述电力查询文本信息的至少一个文本分词,包括:对所述电力查询文本信息进行切分,得到所述电力查询文本信息对应的文本字符;利用最大匹配算法,基于所述文本字符,得到所述至少一个文本分词。
在其中一个实施例中,所述将所述至少一个文本分词输入至主题词抽取模型,得到所述电力查询文本信息对应的电力关键词,包括:获取各所述文本分词的分词词频;获取各所述文本分词的分词权重值;将所述分词词频和所述分词权重值的乘积确定为各所述文本分词的重要程度,并将所述重要程度大于预设重要阈值的文本分词确定为所述电力查询文本信息对应的电力关键词。
在其中一个实施例中,所述获取所述电力关键词的至少一个电力实体,包括:对各所述文本分词进行特征提取,得到各所述文本分词对应的词性标签;基于所述词性标签,获取所述电力关键词的至少一个电力实体。
在其中一个实施例中,所述方法还包括:从与电力业务系统关联的多个电力数据源获取所述电力业务系统的多个电力信息数据;基于所述多个电力信息数据获取所述电力业务系统的多个电力实体,并将所述多个电力信息数据进行信息融合,得到各所述电力实体对应的实体属性信息和各所述电力实体之间的实体关联信息;根据各所述电力实体对应的实体属性信息和所述实体关联信息,构建针对所述电力业务系统的所述电力知识库。
第二方面,本申请提供了一种电力知识库更新装置,应用于电力查询服务器。所述装置包括:
获取模块,用于响应于目标用户在电力查询终端上触发的电力信息查询请求,获取所述电力信息查询请求中包含的电力查询文本信息;
计算模块,用于获取所述电力查询文本信息对应的至少一个目标电力实体,以及获取各所述目标电力实体之间的关系信息;
查询模块,用于根据所述目标电力实体和所述关系信息,从预先构建的电力知识库中获取所述电力查询文本信息对应的关联信息,并将所述关联信息在所述电力查询终端上进行展示;
更新模块,用于将所述目标电力实体和所述关系信息作为所述关联信息的电力标签,得到标注后的关联信息,并将所述标注后的关联信息更新至所述电力知识库。
第三方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
响应于目标用户在电力查询终端上触发的电力信息查询请求,获取所述电力信息查询请求中包含的电力查询文本信息;
获取所述电力查询文本信息对应的至少一个目标电力实体,以及获取各所述目标电力实体之间的关系信息;
根据所述目标电力实体和所述关系信息,从预先构建的电力知识库中获取所述电力查询文本信息对应的关联信息,并将所述关联信息在所述电力查询终端上进行展示;
将所述目标电力实体和所述关系信息作为所述关联信息的电力标签,得到标注后的关联信息,并将所述标注后的关联信息更新至所述电力知识库。
第四方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
响应于目标用户在电力查询终端上触发的电力信息查询请求,获取所述电力信息查询请求中包含的电力查询文本信息;
获取所述电力查询文本信息对应的至少一个目标电力实体,以及获取各所述目标电力实体之间的关系信息;
根据所述目标电力实体和所述关系信息,从预先构建的电力知识库中获取所述电力查询文本信息对应的关联信息,并将所述关联信息在所述电力查询终端上进行展示;
将所述目标电力实体和所述关系信息作为所述关联信息的电力标签,得到标注后的关联信息,并将所述标注后的关联信息更新至所述电力知识库。
第五方面,本申请还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
响应于目标用户在电力查询终端上触发的电力信息查询请求,获取所述电力信息查询请求中包含的电力查询文本信息;
获取所述电力查询文本信息对应的至少一个目标电力实体,以及获取各所述目标电力实体之间的关系信息;
根据所述目标电力实体和所述关系信息,从预先构建的电力知识库中获取所述电力查询文本信息对应的关联信息,并将所述关联信息在所述电力查询终端上进行展示;
将所述目标电力实体和所述关系信息作为所述关联信息的电力标签,得到标注后的关联信息,并将所述标注后的关联信息更新至所述电力知识库。
上述电力知识库更新方法、装置、计算机设备、存储介质和计算机程序产品中,该电力知识库更新方法可以应用于电力查询服务器,该电力查询服务器可以基于目标用户的电力信息查询请求中包含的电力查询文本信息,在电力知识库中匹配得到该电力查询文本信息的关联信息,并可以基于该电力查询文本信息和该关联信息对该电力知识库进行更新,具体地,电力查询服务器可以响应于目标用户在电力查询终端上触发的电力信息查询请求,获取电力信息查询请求中包含的电力查询文本信息;接下来,可以获取该电力查询文本信息对应的至少一个目标电力实体,以及获取各目标电力实体之间的关系信息;进而,可以根据目标电力实体和关系信息,从预先构建的电力知识库中获取电力查询文本信息对应的关联信息,并将关联信息在电力查询终端上进行展示;另外,还可以将目标电力实体和关系信息作为关联信息的电力标签,得到标注后的关联信息,并将标注后的关联信息更新至电力知识库。本申请实施例提供的该方法中,可以获取电力查询文本信息对应的至少一个目标电力实体和各个目标电力实体之间的关系信息,进一步基于该目标电力实体和关系信息,在电力知识库获取该电力查询文本信息对应的关联信息,提高了识别目标用户意图的精确度,进一步提高了关联信息获取的准确性,另外,可以基于目标电力实体和该电力查询文本信息对应的关联信息对电力知识库进行更新,提高了电力知识库更新的准确性、简便性和效率。
附图说明
图1为一个实施例提供的一种电力知识库更新方法的流程示意图;
图2为一个实施例提供的构建电力知识库的流程示意图;
图3为一个实施例提供的一种电力知识库更新装置的结构框图;
图4为一个实施例提供的一种计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
在一个实施例中,如图1所示,提供了一种电力知识库更新方法,本实施例以该方法应用于电力查询服务器进行举例说明,可以理解的是,该方法也可以应用于电力查询终端,还可以应用于包括电力查询终端和电力查询服务器的系统,并通过电力查询终端和电力查询服务器的交互实现。本实施例中,该方法包括以下步骤:
步骤S101,响应于目标用户在电力查询终端上触发的电力信息查询请求,获取电力信息查询请求中包含的电力查询文本信息。
其中,在一种可能的实现方式中,电力业务系统可以包含多个电力查询终端,该电力查询终端可以是电力业务系统中的AI机器人,可以用于在该电力业务系统中为目标用户提供电力方面的服务,例如,电力信息查询、电力信息咨询和/或电力业务办理指引等。该电力查询终端可以通过网络与电力查询服务器之间进行通信。在另一些可能的实现方式中,该电力查询终端可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑、物联网设备和便携式可穿戴设备,物联网设备可为智能音箱、智能电视、智能空调、智能车载设备等。便携式可穿戴设备可为智能手表、智能手环、头戴设备等。该电力查询服务器可以是该电力业务系统中,用于设备运维的服务器,该电力服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。该目标用户可以是任意一个有利用该AI机器人进行电力信息查询需求的对象。目标用户在该电力查询终端上针对电力信息查询请求的触发方式可以包含多种方式,例如,文字输入、语音输入和/或文件上传等。该目标用户可以在该电力查询终端上注册登录该电力业务系统的电力查询服务平台,该电力查询终端可以响应于该目标人员触发的登录操作,展示电力信息查询页面;该目标用户可以在该电力信息查询页面触发电力信息查询请求,其中,该目标用户可以通过不同的触发方式触发该电力信息查询请求,例如,文字输入、语音输入和/或文件上传等,该电力查询终端可以通过网络将该电力信息查询请求发送至对应的电力查询服务器。该电力信息查询请求可以包含电力查询文本信息,该电力查询文本信息可以是关键字(例如,电力设备名)、自然语言(例如,查找用于电缆故障检测的电力设备)和/或实体-关系结构式的形式。其中,在一些可能的实现方式中,可以将自然语言转换为实体-关系结构式,以查找用于电缆故障检测的电力设备为例,可以通过自然语言技术识别“查找用于电缆故障检测的电力设备”中的实体为电缆和电力设备,两者之间的关系为,该电力设备可以用于对电缆进行故障检测。在一种可能的实现方式中,该电力查询文本信息可以包含电力业务系统中的电力相关信息,例如,电力设备标识、电力设备类型和电力设备名等;在另一种可能的实现方式中,该电力查询文本信息也可以包含该目标用户待了解的电力问题和查询需求。
步骤S102,获取电力查询文本信息对应的至少一个目标电力实体,以及获取各目标电力实体之间的关系信息。
在一些可能的实现方式中,可以通过自然语言处理技术对电力查询文本信息进行文本识别处理。该自然语言处理技术是一种使计算机能够理解、处理和生成自然语言的技术。它涉及到对文本或语音数据进行分析、理解和生成的一系列技术和方法。一般,自然语言处理技术可以包含:词法分析:对文本进行分词、词性标注等处理,以便后续的语义分析和理解。句法分析:分析句子的结构和语法关系,包括句子成分的识别、句法树的构建等。语义分析:理解文本的意义和语义关系,包括命名实体识别、语义角色标注、关系抽取等。语言模型:建立对语言的统计模型,用于自动完成、机器翻译、语音识别等任务。信息检索:通过对文本进行索引和搜索,实现文本的快速检索和相关性排序。机器翻译:将一种语言的文本自动翻译成另一种语言的技术。文本生成:根据给定的条件和语言模型,生成符合语法和语义规则的文本。情感分析:识别文本中的情感倾向和情感极性,如积极、消极或中性。在本实施例中,可以基于自然语言技术对该电力查询文本信息进行词法分析、句法分析和语义分析,最终,从该电力查询文本信息中提取出至少一个目标电力实体,以及各个目标电力实体之间的关系信息。该目标电力实体可以是电力查询文本信息中包含的电力业务系统中的电力实体,例如电力设备名、电力设备型号和电力材料等。该关系信息可以用于表征各个目标电力实体之间的相关性。
步骤S103,根据目标电力实体和关系信息,从预先构建的电力知识库中获取电力查询文本信息对应的关联信息,并将关联信息在电力查询终端上进行展示。
其中,该电力知识库是一种结构化的知识表示方式,可以用于描述该电力业务系统中的电力实体、以及各电力实体之间的关系。以电力实体和电力实体之间的关系为例,该电力知识库可以由一组节点和边组成,该节点可以表示电力实体,该边可以表示电力实体之间的关系。在构建该电力知识库过程中,可以基于各电力实体对应的实体属性信息,将各个电力实体链接至该电力知识库的节点,进而,由各个电力实体的关系信息,确定该电力知识库的边,从而,完成针对该电力知识库的构建。
应理解,基于该目标电力实体和关系信息,在该电力知识库中检索与该电力查询文本信息相关联的关联信息,在该过程中,首先,可以获取各个目标电力实体和该电力知识库中包含的各个电力实体之间的相关性;进而,可以将该相关性大于预设相关性阈值的电力实体确认为该目标电力实体的关联实体,接下来,可以获取各个关联实体之间的关系信息;最后,可以将该关联实体和各关联实体之间的关系信息通过该电力查询终端进行展示,目标用户可以直接通过该电力查询终端查看该电力查询文本信息的关联实体和各关联实体之间的关系信息,该关联实体可以是基于该电力查询文本信息体现的目标用户的查询意图,获取的与该电力查询文本信息和该查询意图相关的电力实体,例如,该电力设备的设备名、电力设备的异常原因和针对该异常原因的解决方案等。另外,该关联实体和各关联实体之间的关系信息还可以包含但不限于与该电力查询文本信息相近的电力设备、可能出现的异常状态,各个异常状态的产生原因以及各个异常状态对应的解决方案。该电力查询终端展示的关联实体和各个关联实体之间的关系信息可以以推荐列表的形式进行展示,该推荐列表可以包含多条推荐项。该多条推荐项可以包含多个关联信息,该多条推荐项可以根据该多个关联信息与该电力查询文本信息的相关程度进行优先级排序。各推荐项可以包含但不限于一个电力设备的设备名,对应的异常状态,该异常状态的产生原因,以及该异常状态的解决方案等。目标用户可以在该推荐列表中选择一个或多个关联信息,作为针对该电力查询文本信息的答案信息。其中,电力查询终端可以将该关联实体和各关联实体之间的关系信息,即关联信息,通过多种展示方式进行展示,例如,在电力查询终端的屏幕上以文字输出形式进行展示,和/或语音播报的形式。
步骤S104,将目标电力实体和关系信息作为关联信息的电力标签,得到标注后的关联信息,并将标注后的关联信息更新至电力知识库。
在获取到该电力查询文本信息对应的关联信息的情况下,可以将该电力查询文本信息和关联信息以问答的形式存储至该电力知识库中,完成对该电力知识库的更新。在一种可能的实现方式中,可以利用该目标电力实体和该关系信息对该关联信息进行标注,得到标注后的关联信息,该标注后的关联信息可以包含目标用户提出的该电力查询文本信息、该电力查询文本信息对应的答案信息,以及该电力查询文本信息和该答案信息的相关关系信息,进而,可以将该标注后的关联信息更新至该电力知识库中。
本实施例的方法中,该电力知识库更新方法可以应用于电力查询服务器,该电力查询服务器可以基于目标用户的电力信息查询请求中包含的电力查询文本信息,在电力知识库中匹配得到该电力查询文本信息的关联信息,并可以基于该电力查询文本信息和该关联信息对该电力知识库进行更新,具体地,电力查询服务器可以响应于目标用户在电力查询终端上触发的电力信息查询请求,获取电力信息查询请求中包含的电力查询文本信息;接下来,可以获取该电力查询文本信息对应的至少一个目标电力实体,以及获取各目标电力实体之间的关系信息;进而,可以根据目标电力实体和关系信息,从预先构建的电力知识库中获取电力查询文本信息对应的关联信息,并将关联信息在电力查询终端上进行展示;另外,还可以将目标电力实体和关系信息作为关联信息的电力标签,得到标注后的关联信息,并将标注后的关联信息更新至电力知识库。本申请实施例提供的该方法中,可以获取电力查询文本信息对应的至少一个目标电力实体和各个目标电力实体之间的关系信息,进一步基于该目标电力实体和关系信息,在电力知识库获取该电力查询文本信息对应的关联信息,提高了识别目标用户意图的精确度,进一步提高了关联信息获取的准确性,另外,可以基于目标电力实体和该电力查询文本信息对应的关联信息对电力知识库进行更新,提高了电力知识库更新的准确性、简便性和效率。
在一些实施例中,步骤S102中的获取电力查询文本信息对应的至少一个目标电力实体,可以包括:
对电力查询文本信息进行文本识别处理,得到电力查询文本信息的至少一个文本分词;将至少一个文本分词输入至主题词抽取模型,得到电力查询文本信息对应的电力关键词;获取电力关键词的至少一个电力实体,并将各电力实体作为电力查询文本信息对应的目标电力实体。
其中,可以通过自然语言处理技术对电力查询文本信息进行文本识别处理,获取电力查询文本信息对应的至少一个目标电力实体。首先,可以对该电力查询文本信息进行分词处理,得到该电力查询文本信息的至少一个文本分词;接下来,为了更精确地识别目标用户的查询意图,可以在该至少一个文本分词中筛选出一个或多个电力关键词;进而,可以将该电力关键词的至少一个电力实体作为该电力查询文本信息对应的至少一个目标电力实体。在一种可能的实现方式中,可以基于该主题词抽取模型获取电力查询文本信息对应的电力关键词。
具体地,首先,可以获取各个文本分词的分词词频,该分词词频可以通过以下公式(1)进行计算:
其中,ti可以是第i个文本分词在该电力查询文本信息中的出现次数;可以是该至少一个文本分词在该电力查询文本信息中的总出现次数;W(TF,i)可以是第i个文本分词在该电力查询文本信息中的分词频率。
接下来,可以获取各个文本分词的分词权重值,该分词权重值可以通过以下公式(2)进行计算:
其中,W(IDF,i)可以是第i个文本分词在该电力查询文本信息中的分词权重值。
最后,将分词词频和分词权重值的乘积确定为各文本分词的重要程度,并将重要程度大于预设重要阈值的文本分词确定为电力查询文本信息对应的电力关键词。
其中,该电力查询文本信息对应的电力关键词可以包含一个或者多个文本分词。在一种可能的实现方式中,该电力关键词的个数可以是一个,在这种情况下,可以将该电力查询文本信息的至少一个文本分词中重要程度最大的文本分词确定为该电力查询文本信息对应的电力关键词;在另一个可能的实现方式中,该电力关键词的个数可以是多个,在这种情况下,可以将重要程度大于预设重要阈值的文本分词确定为电力查询文本信息对应的电力关键词,该预设重要阈值可以是该至少一个文本分词的重要程度的平均值,也可以是基于经验的设置值。另外,该分词词频可以用于表征各个文本分词在该电力查询文本信息中的出现频率,进而,可以基于该出现频率设置各个文本分词的分词权重值,各个文本分词的分词词频和该分词权重值可以是负相关的关系。
本实施例的方法中,可以基于分词词频和分词权重值确定各个文本分词的重要程度,该分词词频可以用于表征各个文本分词在该电力查询文本信息中的出现频率,进而,可以基于该出现频率设置各个文本分词的分词权重值,各个文本分词的分词词频和该分词权重值可以是负相关的关系,结合分词词频和分词权重值确定各个文本分词的重要程度,可以提高电力关键词确定的准确性,进而,可以提高电力知识库更新的准确性。
在另一些实施例中,获取至少一个文本分词,可以包括:
对电力查询文本信息进行切分,得到电力查询文本信息对应的文本字符;利用最大匹配算法,基于文本字符,得到至少一个文本分词。
在一种可能的实现方式中,可以通过以下方法对该电力查询文本信息进行分词处理:可以对该电力查询文本信息进行切分,得到该电力查询文本信息的多个文本字符,例如,将{电力设备的设备型号}进行切分可以得到{“电”、“力”、“设”、“备”、“的”、“设”、“备”、“型”、“号”};进而,可以基于最大匹配算法对该多个文本字符进行匹配分词处理,最大匹配算法(Maximum Matching Algorithm,MMA)是一种常用于中文分词的算法。中文分词是将连续的汉字序列切分成有意义的词语的过程,而最大匹配算法是其中一种基于规则的分词方法。最大匹配算法的基本思想是从待分词的文本中选取最长的词语作为切分结果,然后将该词语从文本中去除,再继续选取剩余文本中的最长词语,直到文本被切分完毕或无法继续切分为止。具体实现时,最大匹配算法通常有两种策略:正向最大匹配:从文本的左侧开始,选取最长的词语作为切分结果,然后将该词语从文本中去除,继续选取剩余文本中的最长词语,直到文本被切分完毕或无法继续切分为止。逆向最大匹配:从文本的右侧开始,选取最长的词语作为切分结果,然后将该词语从文本中去除,继续选取剩余文本中的最长词语,直到文本被切分完毕或无法继续切分为止。例如,利用最大匹配算法对{“电”、“力”、“设”、“备”、“的”、“设”、“备”、“型”、“号”}进行分词处理,可以得到{“电力设备”、“的”、“设备型号”},其中“电力设备”、“的”、“设备型号”可以认为是电力查询文本信息{电力设备的设备型号}的三个文本分词。
本实施例的方法中,可以基于自然语言处理技术,对该电力查询文本信息进行分词处理,便于后续识别出该电力查询文本信息的电力实体,以及电力实体之间的关系信息,便于基于电力实体和关系信息在电力知识库中检索出管理啊信息,提高了知识库更新的简便性、智能化和高效性。
在一些实施例中,获取电力关键词的至少一个电力实体,可以包括:
对各文本分词进行特征提取,得到各文本分词对应的词性标签;基于词性标签,获取电力关键词的至少一个电力实体。
其中,可以基于预先构建的文本分类模型的特征提取模块对各个文本分词进行特征提取,得到各个文本分词的分词特征;进而,可以利用该文本分类模型的分类模块基于该分词特征,获取各个文本分词的词性标签;从而,可以基于该词性标签,获取电力关键词的至少一个电力实体。
该文本分类模型的特征提取模块可以包括至少一层卷积层和至少一层池化层,该卷积层用于提取输入的数据的特征;池化层用于对输入的数据进行采样。卷积层和池化层均包括激活函数。在本申请实施例中,目标文本信息可以包括至少一个文本分词。
具体地,卷积层可以用于提取至少一个文本分词的初始特征。第一步,将至少一个文本分词进行向量转换,得到至少一个文本分词向量,至少一个文本分词向量可以组合为一个文本分词向量矩阵;第二步,将该文本分词向量矩阵输入至卷积层,使用卷积核与文本分词向量矩阵进行卷积运算,也就是将文本分词向量矩阵和卷积核作内积运算,得到文本分词向量矩阵对应的卷积结果;接下来,基于激活函数对卷积结果进行非线性变换,并且加上偏置向量,得到初始特征向量;第三步,将初始特征向量输入至池化层,可以对初始特征向量进行特征采样;然后,基于激活函数对特征采样结果进行非线性变换,并且加上偏置向量,得到分词特征。
该文本分类模型的分类模块可以包括至少一层全连接层,该全连接层可以对分词特征进行分类,以便得到各个文本分词对应的词性标签。另外,该全连接层可以包括激活函数,激活函数包括权重矩阵和偏置常量。
具体地,电力查询服务器可以将分词特征输入至全连接层,基于激活函数的权重矩阵和偏置向量,对分词特征进行非线性变换,再通过归一化,得到各个文本分词对应的词性标签。
本实施例的方法中,可以基于预先构建的文本分类模型提取电力关键词的至少一个电力实体,准确把握目标用户的查询意图,提高了在电力知识库中查询电力查询文本信息的关联信息的准确性。
在一些实施例中,如图2所示,构建电力知识库可以包括:
步骤S201,从与电力业务系统关联的多个电力数据源获取电力业务系统的多个电力信息数据。
其中,该与电力业务系统关联的电力信息数据可以存在于与电力业务系统关联的多个电力数据源中,该与电力业务系统关联的多个电力数据源可以是与该电力业务系统进行信息交互的多个其他电力业务系统和/或数据库等,例如,电力交易平台、本地资源以及各类公开的网络信息资源等。该多个电力信息数据可以包含多种形式的数据,例如,文本信息、图像信息和视频信息等。该多个电力信息数据可以是与该电力业务系统的多个电力设备相关联的信息数据。
步骤S202,基于多个电力信息数据获取电力业务系统的多个电力实体,并将多个电力信息数据进行信息融合,得到各电力实体对应的实体属性信息和各电力实体之间的实体关联信息。
其中,该多个电力信息数据中可以包含该电力业务系统的多个电力实体,以及各个电力实体对应的实体属性信息,各个电力实体的实体信息可能来自于不同电力数据源,可以将来自于多个电力数据源的同一电力实体的实体信息进行融合,得到各个电力实体对应的实体属性信息。该实体属性信息可以是多个电力数据源中与各个电力实体相关联的实体信息,例如,各电力实体的交易信息、政策信息和标识信息等。在一种可能的实现方式中,可以通过自然语言处理技术对该多个电力信息数据进行文本识别。基于该自然语言处理技术对该多个电力信息数据进行词法分析、句法分析和语义分析,最终,从该多个电力信息数据中提取出多个电力实体,以及各个电力备实体之间的关系。其中,首先可以对该多个电力信息数据进行分词处理,得到该多个电力信息数据的至少一个文本分词;进而,利用自然语言处理技术中的命名实体识别获取各个文本分词对应的电力实体,以及各电力实体之间的关系信息。
步骤S203,根据各电力实体对应的实体属性信息和实体关联信息,构建针对电力业务系统的电力知识库。
其中,该电力知识库是一种结构化的知识表示方式,可以用于描述该电力业务系统中的电力实体、以及各电力实体之间的关系。以电力实体和电力实体之间的关系为例,该电力知识库可以由一组节点和边组成,该节点可以表示电力实体,该边可以表示电力实体之间的关系。在构建该电力知识库过程中,可以基于各电力实体对应的实体属性信息,将各个电力实体链接至该电力知识库的节点,进而,由各个电力实体的关系信息,确定该电力知识库的边,从而,完成针对该电力知识库的构建。
本实施例的方法中,构建电力知识库,便于目标用户进行电力查询,提高电力查询的准确性。
应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的电力知识库更新方法的电力知识库更新装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个电力知识库更新装置实施例中的具体限定可以参见上文中对于电力知识库更新方法的限定,在此不再赘述。
在一个实施例中,如图3所示,提供了一种电力知识库更新装置,包括:获取模块301、计算模块302、查询模块303和更新模块304,其中:
获取模块301,用于响应于目标用户在电力查询终端上触发的电力信息查询请求,获取所述电力信息查询请求中包含的电力查询文本信息;
计算模块302,用于获取所述电力查询文本信息对应的至少一个目标电力实体,以及获取各所述目标电力实体之间的关系信息;
查询模块303,用于根据所述目标电力实体和所述关系信息,从预先构建的电力知识库中获取所述电力查询文本信息对应的关联信息,并将所述关联信息在所述电力查询终端上进行展示;
更新模块304,用于将所述目标电力实体和所述关系信息作为所述关联信息的电力标签,得到标注后的关联信息,并将所述标注后的关联信息更新至所述电力知识库。
另外,计算模块302,还用于:对所述电力查询文本信息进行文本识别处理,得到所述电力查询文本信息的至少一个文本分词;将所述至少一个文本分词输入至主题词抽取模型,得到所述电力查询文本信息对应的电力关键词;获取所述电力关键词的至少一个电力实体,并将各所述电力实体作为所述电力查询文本信息对应的目标电力实体。
计算模块302,进一步用于:对所述电力查询文本信息进行切分,得到所述电力查询文本信息对应的文本字符;利用最大匹配算法,基于所述文本字符,得到所述至少一个文本分词。
进一步地,计算模块302,还用于:获取各所述文本分词的分词词频;获取各所述文本分词的分词权重值;将所述分词词频和所述分词权重值的乘积确定为各所述文本分词的重要程度,并将所述重要程度大于预设重要阈值的文本分词确定为所述电力查询文本信息对应的电力关键词。
计算模块302,还用于:对各所述文本分词进行特征提取,得到各所述文本分词对应的词性标签;基于所述词性标签,获取所述电力关键词的至少一个电力实体。
更新模块304,还用于:从与电力业务系统关联的多个电力数据源获取所述电力业务系统的多个电力信息数据;基于所述多个电力信息数据获取所述电力业务系统的多个电力实体,并将所述多个电力信息数据进行信息融合,得到各所述电力实体对应的实体属性信息和各所述电力实体之间的实体关联信息;根据各所述电力实体对应的实体属性信息和所述实体关联信息,构建针对所述电力业务系统的所述电力知识库。
上述电力知识库更新装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图4所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储电力知识库更新相关数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种电力知识库更新方法。
本领域技术人员可以理解,图4中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,还提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。
Claims (10)
1.一种电力知识库更新方法,其特征在于,应用于电力查询服务器,所述方法包括:
响应于目标用户在电力查询终端上触发的电力信息查询请求,获取所述电力信息查询请求中包含的电力查询文本信息;
获取所述电力查询文本信息对应的至少一个目标电力实体,以及获取各所述目标电力实体之间的关系信息;
根据所述目标电力实体和所述关系信息,从预先构建的电力知识库中获取所述电力查询文本信息对应的关联信息,并将所述关联信息在所述电力查询终端上进行展示;
将所述目标电力实体和所述关系信息作为所述关联信息的电力标签,得到标注后的关联信息,并将所述标注后的关联信息更新至所述电力知识库。
2.根据权利要求1所述的方法,其特征在于,所述获取所述电力查询文本信息对应的至少一个目标电力实体,包括:
对所述电力查询文本信息进行文本识别处理,得到所述电力查询文本信息的至少一个文本分词;
将所述至少一个文本分词输入至主题词抽取模型,得到所述电力查询文本信息对应的电力关键词;
获取所述电力关键词的至少一个电力实体,并将各所述电力实体作为所述电力查询文本信息对应的目标电力实体。
3.根据权利要求2所述的方法,其特征在于,所述对所述电力查询文本信息进行文本识别处理,得到所述电力查询文本信息的至少一个文本分词,包括:
对所述电力查询文本信息进行切分,得到所述电力查询文本信息对应的文本字符;
利用最大匹配算法,基于所述文本字符,得到所述至少一个文本分词。
4.根据权利要求2所述的方法,其特征在于,所述将所述至少一个文本分词输入至主题词抽取模型,得到所述电力查询文本信息对应的电力关键词,包括:
获取各所述文本分词的分词词频;
获取各所述文本分词的分词权重值;
将所述分词词频和所述分词权重值的乘积确定为各所述文本分词的重要程度,并将所述重要程度大于预设重要阈值的文本分词确定为所述电力查询文本信息对应的电力关键词。
5.根据权利要求2所述的方法,其特征在于,所述获取所述电力关键词的至少一个电力实体,包括:
对各所述文本分词进行特征提取,得到各所述文本分词对应的词性标签;
基于所述词性标签,获取所述电力关键词的至少一个电力实体。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
从与电力业务系统关联的多个电力数据源获取所述电力业务系统的多个电力信息数据;
基于所述多个电力信息数据获取所述电力业务系统的多个电力实体,并将所述多个电力信息数据进行信息融合,得到各所述电力实体对应的实体属性信息和各所述电力实体之间的实体关联信息;
根据各所述电力实体对应的实体属性信息和所述实体关联信息,构建针对所述电力业务系统的所述电力知识库。
7.一种电力知识库更新装置,其特征在于,应用于电力查询服务器,所述装置包括:
获取模块,用于响应于目标用户在电力查询终端上触发的电力信息查询请求,获取所述电力信息查询请求中包含的电力查询文本信息;
计算模块,用于获取所述电力查询文本信息对应的至少一个目标电力实体,以及获取各所述目标电力实体之间的关系信息;
查询模块,用于根据所述目标电力实体和所述关系信息,从预先构建的电力知识库中获取所述电力查询文本信息对应的关联信息,并将所述关联信息在所述电力查询终端上进行展示;
更新模块,用于将所述目标电力实体和所述关系信息作为所述关联信息的电力标签,得到标注后的关联信息,并将所述标注后的关联信息更新至所述电力知识库。
8.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1-6任一项所述的方法的步骤。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-6任一项所述的方法的步骤。
10.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1-6中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311377109.2A CN117539976A (zh) | 2023-10-23 | 2023-10-23 | 电力知识库更新方法、装置、设备、存储介质和程序产品 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311377109.2A CN117539976A (zh) | 2023-10-23 | 2023-10-23 | 电力知识库更新方法、装置、设备、存储介质和程序产品 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117539976A true CN117539976A (zh) | 2024-02-09 |
Family
ID=89794735
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311377109.2A Pending CN117539976A (zh) | 2023-10-23 | 2023-10-23 | 电力知识库更新方法、装置、设备、存储介质和程序产品 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117539976A (zh) |
-
2023
- 2023-10-23 CN CN202311377109.2A patent/CN117539976A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11768869B2 (en) | Knowledge-derived search suggestion | |
CN112860866B (zh) | 语义检索方法、装置、设备以及存储介质 | |
US10853697B2 (en) | System and method for monitoring online retail platform using artificial intelligence and fixing malfunction | |
WO2022116418A1 (zh) | 商标侵权的自动化判定方法、装置、电子设备和存储介质 | |
CN111522886B (zh) | 一种信息推荐方法、终端及存储介质 | |
CN111522889B (zh) | 用户兴趣标签扩展方法、装置、电子设备及存储介质 | |
CN112926308B (zh) | 匹配正文的方法、装置、设备、存储介质以及程序产品 | |
CN113704420A (zh) | 文本中的角色识别方法、装置、电子设备及存储介质 | |
Sulthana et al. | Context based classification of Reviews using association rule mining, fuzzy logics and ontology | |
CN114328800A (zh) | 文本处理方法、装置、电子设备和计算机可读存储介质 | |
CN117251777A (zh) | 数据处理方法、装置、计算机设备和存储介质 | |
CN117435685A (zh) | 文档检索方法、装置、计算机设备、存储介质和产品 | |
CN116597443A (zh) | 素材标签处理方法、装置、电子设备及介质 | |
Lande et al. | Transformation texts into complex network with applying visability graphs algorithms | |
CN114595389A (zh) | 通讯录查询方法、装置、设备、存储介质和程序产品 | |
CN117539976A (zh) | 电力知识库更新方法、装置、设备、存储介质和程序产品 | |
CN113779248A (zh) | 数据分类模型训练方法、数据处理方法及存储介质 | |
CN114168589A (zh) | 索引构建方法及装置 | |
CN117172755A (zh) | 金融设备运维方法、装置、计算机设备和存储介质 | |
CN118467848B (zh) | 基于情境识别的用户类型识别与交互系统及方法 | |
CN116681408B (zh) | 系统管理方法、装置、计算机设备和存储介质 | |
CN113505889B (zh) | 图谱化知识库的处理方法、装置、计算机设备和存储介质 | |
CN114416947B (zh) | 关系感知相似问题识别评估方法、系统、设备及存储介质 | |
CN118260338A (zh) | 资源对象推荐方法、装置、计算机设备、存储介质和计算机程序产品 | |
CN115146072A (zh) | 一种电力领域中知识地图的绘制方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |