CN114564595A - 知识图谱更新方法、装置及电子设备 - Google Patents
知识图谱更新方法、装置及电子设备 Download PDFInfo
- Publication number
- CN114564595A CN114564595A CN202210199069.6A CN202210199069A CN114564595A CN 114564595 A CN114564595 A CN 114564595A CN 202210199069 A CN202210199069 A CN 202210199069A CN 114564595 A CN114564595 A CN 114564595A
- Authority
- CN
- China
- Prior art keywords
- information
- key
- knowledge graph
- business
- classification model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
- G06F18/24155—Bayesian classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Databases & Information Systems (AREA)
- General Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Probability & Statistics with Applications (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Software Systems (AREA)
- Animal Behavior & Ethology (AREA)
- Biophysics (AREA)
- Human Computer Interaction (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请公开了一种知识图谱更新方法、装置及电子设备,该方法包括:基于获取到的询问信息和相对应的应答信息,生成待处理的业务数据;从所述业务数据中提取用于表示所述业务数据中关键内容的关键业务要素;基于关键业务要素,利用分类模型构建用于表征不同关键业务要素之间关系的三元组;基于所述三元组对所述业务数据对应的知识图谱进行更新。该方法能够在对客户进行服务的过程中收集与目标对象服务相关的新知识,利用收集到的新知识对知识图谱进行更新,无需人工更新操作,增加了知识图谱中知识的时效性和准确性,便于客服人员对其进行调用来解答当前客户的询问,提高了客户服务的效率和质量。
Description
技术领域
本申请涉及信息处理领域,特别涉及一种知识图谱更新方法、装置及电子设备。
背景技术
对于商家生产的产品,需要针对客户的咨询进行相应的解答。对于该问题可以使用知识图谱帮助客服来完成服务工作,但是知识图谱的编纂都是通过线上回复、电话沟通,线下总结更新的人工流程来完成。随着产品和服务的数量和类型越来越多,相应的咨询或提问变多,人力已经很难及时有效的对知识图谱进行更新。
发明内容
本申请实施例提供了一种知识图谱更新方法、装置及电子设备,其中该知识图谱更新方法,包括:
基于获取到的询问信息和相对应的应答信息,生成待处理的业务数据;
从所述业务数据中提取用于表示所述业务数据中关键内容的关键业务要素;
基于关键业务要素,利用分类模型构建用于表征不同关键业务要素之间关系的三元组;
基于所述三元组对所述业务数据对应的知识图谱进行更新。
作为可选,所述基于获取到的询问信息和相对应的应答信息,生成待处理的业务数据,包括:
基于时间属性,将所述询问信息以及相对应的所述应答信息进行关联,形成相应的问答单元;
基于所有的所述问答单元生成所述业务数据。
作为可选,所述从所述业务数据中提取用于表示所述业务数据中关键内容的关键业务要素,包括:对所述业务数据实施主题识别,提取其中的关键业务要素,其中包括:
依序对所述业务数据实施命名实体识别、实体识别以及主题提取的操作,生成相应的主题信息;
基于所述主题信息,确定所述业务数据对应的所述关键业务要素。
作为可选,所述基于关键业务要素,利用分类模型构建用于表征不同关键业务要素之间关系的三元组,包括:
通过所述分类模型,将所述关键业务要素确定为:关键词、类型信息或产品支持信息;
确定所述关键词、类型信息和/或产品支持信息之间的关联关系;
基于具有所述关联关系的所述关键词、类型信息和/或产品支持信息,构建出相应的三元组。
作为可选,所述基于所述三元组对所述业务数据对应的知识图谱进行更新,包括:
基于表征不同的所述关联关系的所述三元组,对所述知识图谱中对应的原始三元组进行更新,以更新所述业务数据对应的所述知识图谱。
作为可选,所述方法还包括:
至少按照预设时间间隔,使用更新后的所述知识图谱对所述分类模型进行更新。
作为可选,所述方法还包括:
利用更新后的所述知识图谱中的所述三元组和/或所述关键业务要素,对所述分类模型进行训练。
作为可选,所述方法还包括:
对所述分类模型进行更新和/或训练后的结果进行评测,生成相应的评测信息。
本申请实施例还提供了一种知识图谱更新装置,包括:
生成模块,其配置为基于获取到的询问信息和相对应的应答信息,生成待处理的业务数据;
提取模块,其配置为从所述业务数据中提取用于表示所述业务数据中关键内容的关键业务要素;
构建模块,其配置为基于关键业务要素,利用分类模型构建用于表征不同关键业务要素之间关系的三元组;
更新模块,其配置为基于所述三元组对所述业务数据对应的知识图谱进行更新。
本申请实施例还提供了一种电子设备,包括:存储器和处理器,所述存储器中存储有可执行程序,所述处理器执行所述可执行程序以实现如下步骤:
基于获取到的询问信息和相对应的应答信息,生成待处理的业务数据;
从所述业务数据中提取用于表示所述业务数据中关键内容的关键业务要素;
基于关键业务要素,利用分类模型构建用于表征不同关键业务要素之间关系的三元组;
基于所述三元组对所述业务数据对应的知识图谱进行更新。
本申请的该知识图谱更新方法,能够在对客户进行服务的过程中收集与目标对象服务相关的新知识,利用收集到的新知识对知识图谱进行更新,无需人工更新操作,增加了知识图谱中知识的时效性和准确性,便于客服人员对其进行调用来解答当前客户的询问,提高了客户服务的效率和质量。
附图说明
图1为本申请实施例的知识图谱更新方法的流程图;
图2为本申请实施例的图1中步骤S100的一个实施例的流程图;
图3为本申请实施例的图1中步骤S200的一个实施例的流程图;
图4为本申请实施例的图1中步骤S300的一个实施例的流程图;
图5为本申请实施例的知识图谱更新装置的一个使用场景的示意图;
图6为本申请实施例的知识图谱更新装置的结构框图;
图7为本申请实施例的电子设备的结构框图。
具体实施方式
此处参考附图描述本申请的各种方案以及特征。
应理解的是,可以对此处申请的实施例做出各种修改。因此,上述说明书不应该视为限制,而仅是作为实施例的范例。本领域的技术人员将想到在本申请的范围和精神内的其他修改。
包含在说明书中并构成说明书的一部分的附图示出了本申请的实施例,并且与上面给出的对本申请的大致描述以及下面给出的对实施例的详细描述一起用于解释本申请的原理。
通过下面参照附图对给定为非限制性实例的实施例的优选形式的描述,本申请的这些和其它特性将会变得显而易见。
还应当理解,尽管已经参照一些具体实例对本申请进行了描述,但本领域技术人员能够确定地实现本申请的很多其它等效形式。
当结合附图时,鉴于以下详细说明,本申请的上述和其他方面、特征和优势将变得更为显而易见。
此后参照附图描述本申请的具体实施例;然而,应当理解,所申请的实施例仅仅是本申请的实例,其可采用多种方式实施。熟知和/或重复的功能和结构并未详细描述以避免不必要或多余的细节使得本申请模糊不清。因此,本文所申请的具体的结构性和功能性细节并非意在限定,而是仅仅作为权利要求的基础和代表性基础用于教导本领域技术人员以实质上任意合适的详细结构多样地使用本申请。
本说明书可使用词组“在一种实施例中”、“在另一个实施例中”、“在又一实施例中”或“在其他实施例中”,其均可指代根据本申请的相同或不同实施例中的一个或多个。
本申请实施例的一种知识图谱更新方法,知识图谱是显示知识发展进程与结构关系的一系列各种不同的图形信息,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。在一些实施例中可以将知识图谱使用在针对用户进行服务的领域中,如使用知识图谱帮助客服来对用户进行服务的工作,例如使用知识图谱中的知识来解答客户的问题等。提高了客服的工作效率。
结合附图进行详细说明,图1为本申请实施例的知识图谱更新方法的流程图,如图1所示并结合图5,该方法包括以下步骤:
S100,基于获取到的询问信息和相对应的应答信息,生成待处理的业务数据。
示例性的,询问信息可以是针对目标对象的相关问题进行的询问。该询问信息包括询问的目标对象的相关信息,如询问主题、目标类型以及实体信息。而相应的应答信息则是用于应答该询问信息的信息。该询问信息与相匹配的应答信息可以是被验证的有效信息,例如该询问信息可以是用户询问客服的针对一目标对象的相关信息,如可以是在线问答语音输入,或是现场问答语音输入。应答信息则可以是客服针对用户的询问信息利用自身的专业知识来应答的信息。电子设备可以将询问信息与相匹配的应答信息进行捕获。
基于获取到的询问信息和相对应的应答信息,生成待处理的业务数据。该业务数据可以作为更新知识图谱的基础数据。业务数据中包括数量众多的询问信息和相对应的应答信息。电子设备可以获取不同阶段生成的业务数据,当然也可以从其他设备处直接获取待处理的业务数据。
S200,从所述业务数据中提取用于表示所述业务数据中关键内容的关键业务要素。
示例性的,业务数据以及相应的应答信息中包括部分的关键内容,还包括了重要性相对较低的其他内容。该关键内容可以是服务过程中提及到的目标对象的大的类型,如笔记本电脑类型、服务器类型等。还可以是目标对象的大的类型中具体的产品,如笔记本电脑中的thinkpad系列。还可以是目标对象的出现的具体问题,如thinkpad系列出现的电池过热问题,配件问题等信息。而非关键内容则可以是服务过程中涉及到的礼貌用语、生成时间等信息。
当然,对于业务数据中关键内容和非关键内容的判断,可以是基于预设条件来实施,该预设条件也可以根据实际使用情况而进行调整,从而使得确定出的关键内容更加适用于对当前的业务数据的处理。
本实施例中,可以基于确定出的关键内容来生成关键业务要素。关键业务要素可以是与服务相关联的实体。举例说明,可以将该关键内容进行语音识别转化为文字,而实体则可以是该文字中的关键内容,如可以是文本中含有PC的类型的词语、短语等。例如实体可以是PC的产品系列为ThinkPad系列,以及该ThinkPad系列中的具体型号。
在一些实施例中,关键业务要素从多个不同方面描述了该业务数据中的关键内容。此外,关键业务要素可以具有特定的数据结构,从而便于使用。
S300,基于关键业务要素,利用分类模型构建用于表征不同关键业务要素之间关系的三元组。
示例性的,分类模型可以首先被训练,完成训练的分类模型可以将关键业务要素按照预设类型进行分类。分类模型可以基于以下一种模型或多个模型构造,如:贝叶斯、决策树、支持向量机以及神经网络模型。关键业务要素的数据结构与构造出来的分类模型相适配。
进一步的,分类模型可以将关键业务要素作为输入,经过对关键业务要素的处理后,对于同一个业务数据可以生成与之相对应的三元组。三元组包括了三个节点以及节点之间的相互关系的信息。本实施例中,三元组中的节点可以是目标对象的相关内容,整个三元组能够表征不同关键业务要素之间关系。
举例说明,分类模型在初始阶段可以进行循环迭代的训练,作为初始模型,分类模型精确度会在训练过程中持续修正提升。分类模型对服务类型进行分类,生成的关键业务要素可以是:ThinkPad,电池,过热,输入分类模型,输出PC产品问题分类,感情倾向负向等信息。基于上述的关键服务要素可以生成相应的三元组,如:PC产品问题-分类-ThinkPad,ThinkPad-配件-电池,电池-平均-负面等。
在一个实施例中,还可以利用分类模型构建用于表征不同关键业务要素之间关系的其他的多元组。如四元组、五元组等。从而能够表示更加丰富的关键内容,以及表示出关联的关键业务要素之间的更加丰富的关系。
S400,基于所述三元组对所述业务数据对应的知识图谱进行更新。
示例性的,由于三元组包含了业务数据中的关键内容,以及相关联的关键内容之间的关联关系。知识图谱中的知识可以基于数量众多的三元组而构造。初始的知识图谱中具有初始的三元组。本实施例中,由于当前生成的三元组能够适用于当下的使用场景,因此本实施例中基于当前生成的三元组相应的知识图谱中的初始三元组进行更新,从而实现了对知识图谱的更新,从而增加了知识图谱中知识的时效性和准确性。例如,更新后的知识图谱可以在客户服务的场景中使用,其他客服人员可以直接调用该知识图谱来答复当前用户的询问信息。
本申请的该知识图谱更新方法,能够在对客户进行服务的过程中收集与目标对象服务相关的新知识,利用收集到的新知识对知识图谱进行更新,无需人工更新操作,增加了知识图谱中知识的时效性和准确性,便于客服人员对其进行调用来解答当前客户的询问,提高了客户服务的效率和质量。
在本申请的一个实施例中,所述基于获取到的询问信息和相对应的应答信息,生成待处理的业务数据,如图2所示,包括:
S110,基于时间属性,将所述询问信息以及相对应的所述应答信息进行关联,形成相应的问答单元。
示例性的,时间属性可以是获取询问信息和相对应的应答信息的时间属性。例如,可以将在同一时间段中获取到的询问信息和对应的应答信息,按照获取时间的先后顺序进行关联。从而能够准确的将询问信息以及相对应的应答信息相关联。
例如,按照时间顺序,获取的询问信息以及相对应的应答信息为如下内容:询问信息为ThinkPad系列笔记本的正常工作时的温度是多少,应答信息为正常工作温度在42度至45度的答复。基于时间属性则可以认为该询问信息和应答信息为相关联信息。从而形成的问答单元准确度更高。
S120,基于所有的所述问答单元生成所述业务数据。
示例性的,由于不同的询问信息分别于各自对应的应答信息连关联,这将形成内容不同的问答单元。多个问答单元能够从多个不同方面,将所有获取到的询问信息和应答信息的内容表示完整。这使得根据所有的问答单元而生成的业务数据可以更加全面的表示出用户与客户之间的提问与解答的全面信息。
在本申请的一个实施例中,所述从所述业务数据中提取用于表示所述业务数据中关键内容的关键业务要素,包括:对所述业务数据实施主题识别,提取其中的关键业务要素,如图3所示并结合图5,其中包括以下步骤:
S210,依序对所述业务数据实施命名实体识别、实体识别以及主题提取的操作,生成相应的主题信息。
S220,基于所述主题信息,确定所述业务数据对应的所述关键业务要素。
示例性的,命名实体识别(NER)是指服务中涉及目标对象的类型,如涉及询问的产品的大的类型,如服务器类型或是笔记本电脑类型。实体识别(ER)是指该产品类型下的产品系列,如笔记本电脑类型下的thinkpad系列。依序对业务数据实施命名实体识别、实体识别以及主题提取的操作能够准确地确定出该询问信息的主题内容,从而可以根据确定的主题信息来确定其中的关键内容。
例如确定的主题信息是指询问的问题的主题,如电池过热问题。而针对该电池过热问题可以确定其中的关键业务要素可以是电池过热的发生时间和使用状态,以及电池正常工作和异常时的温度、散热装置的参数等关键业务要素。从而避免了对关键业务要素判断的偏差,如无需关注鼠标键盘的使用信息。
在本申请的一个实施例中,所述基于关键业务要素,利用分类模型构建用于表征不同关键业务要素之间关系的三元组,如图4所示,包括以下步骤:
S310,通过所述分类模型,将所述关键业务要素确定为:关键词、类型信息或产品支持信息。
示例性的,关键业务要素可以包括多种类型的关键内容,本实施例中,可以将关键业务要素确定为:关键词、类型信息以及产品支持信息,从而使得关键业务要素能够基于不同的表达维度来确定,所表达的内容更加完整和具有层次。
当然,关键词、类型信息或产品支持信息的确定条件可以预先设定,从而根据预设条件准确地确定出该关键词、类型信息或产品支持信息。而该确定条件也可以根据所针对的目标对象的不同而进行调整。
S320,确定所述关键词、类型信息和/或产品支持信息之间的关联关系。
示例性的,关键词、类型信息以及产品支持信息可能均有多个,不同类型的上述关键业务要素所表达的内容可能不同。例如,可以按照内容之间的语义关系建立上述关键业务要素之间的关联关系。从而保证了使用的关键词、类型信息以及产品支持信息能够表达完整的语义。
S330,基于具有所述关联关系的所述关键词、类型信息和/或产品支持信息,构建出相应的三元组。
举例说明,构建出的三元组可以是“PC产品问题-分类-ThinkPad”,“ThinkPad-配件-电池”,“电池-平均-负面感情倾向”。这些三元组包括了三个节点以及节点之间的相互关系的信息。其中的节点均是目标对象的相关内容,整个三元组能够表现出关键词、类型信息和/或产品支持信息之间的关系。
在本申请的一个实施例中,所述基于所述三元组对所述业务数据对应的知识图谱进行更新,包括以下步骤:
基于表征不同的所述关联关系的所述三元组,对所述知识图谱中对应的原始三元组进行更新,以更新所述业务数据对应的所述知识图谱。
示例性的,知识图谱中具有原始三元组,原始三元组可以是默认数据,也可以是基于历史数据而构建,基于原始三元组构建的知识图谱可能并不适配于当前的使用场景。如,未更新前的知识图谱可能是针对老旧设备而构建的知识图谱,或者是基于老旧服务规定而构建的知识图谱,并不适用于新的客户服务场景。因此可以基于新构建的三元组对所述知识图谱中对应的原始三元组进行更新。具体的更新方法可以是直接替换掉原始三元组,或者是保留原始三元组但修改其使用属性使得不会被调用,从而在使用更新后的知识图谱中只是调用新生成的三元组。
更新后的知识图谱包括了与业务数据相关的知识内容。使用时,可以在遇到与业务数据相同或相似的其他数据时而调用该知识图谱,从而能够帮助客服人员对用户的询问信息进行准确而快速的应答。
在本申请的一个实施例中,所述方法还包括以下步骤:
至少按照预设时间间隔,使用更新后的所述知识图谱对所述分类模型进行更新。
示例性的,按照预设时间间隔,使用更新后的知识图谱可以对分类模型进行训练,训练完成后可以实现对分类模型的更新效果。如对分类模型中包含的贝叶斯、决策树、支持向量机和/或神经网络模型进行训练,从而实现对分类模型的更新操作。更新后的分类模型可以提高输出的分类结果的准确性,使得更新后的分类模型能够更加适配于当前的分类场景。
此外,还可以按照实际需求来对分类模型进行更新,例如客服人员需要在短时间内提高分类模型与新产品的适配程度,则可以立即对分类模型进行更新操作。
在本申请的一个实施例中,所述方法还包括以下步骤:
利用更新后的所述知识图谱中的所述三元组和/或所述关键业务要素,对所述分类模型进行训练。
示例性的,分类模型可以基于贝叶斯、决策树、支持向量机和/或神经网络模型而构造,在使用前或使用过程中均可以对分类模型进行训练,如,可以按照实际需求和/或一定时间间隔训练该分类模型,从而提高分类模型的输出结果的准确性。
在具体的训练过程中,知识图谱中具有三元组和/或关键业务要素,而分类模型的处理目标是生成三元组,本实施例中可以使用最新的三元组和/或关键业务要素来对分类模型进行训练,调整分类模型的模型参数,从而使得训练后的分类模型能够在被使用时生成最新的三元组。提高了分类模型处理数据的准确性。
在本申请的一个实施例中,所述方法还包括以下步骤:
对所述分类模型进行更新和/或训练后的结果进行评测,生成相应的评测信息。
示例性的,评价信息是对分类模型进行更新和/或训练后的结果的评价,起可以作为一个改进分类模型性能的参考数据。例如可以利用从预设存储空间中调用存储的评测信息,再对评测信息进行分析,以查验和/或校正分类模型,包括调整分类模型的模型参数和/或训练步骤,减少分类模型进行更新和/或训练的错误率。在本申请中,对于评测信息的生成过程,一方面,对于评测信息生成的时机可以是在分类模型进行更新和/或训练后同时生成;另一方面,也可以是在分类模型进行更新和/或训练过程中分阶段生成,从而丰富评测信息的同时也降低了电子设备的处理压力。
基于同样的发明构思,本申请实施例还提供了一种知识图谱更新装置,如图6所示并结合图5,该装置包括:
生成模块,其配置为基于获取到的询问信息和相对应的应答信息,生成待处理的业务数据。
示例性的,询问信息可以是针对目标对象的相关问题进行的询问。该询问信息包括询问的目标对象的相关信息,如询问主题、目标类型以及实体信息。而相应的应答信息则是用于应答该询问信息的信息。该询问信息与相匹配的应答信息可以是被验证的有效信息,例如该询问信息可以是用户询问客服的针对一目标对象的相关信息,如可以是在线问答语音输入,或是现场问答语音输入。应答信息则可以是客服针对用户的询问信息利用自身的专业知识来应答的信息。电子设备可以将询问信息与相匹配的应答信息进行捕获。
生成模块基于获取到的询问信息和相对应的应答信息,生成待处理的业务数据。该业务数据可以作为更新知识图谱的基础数据。业务数据中包括数量众多的询问信息和相对应的应答信息。电子设备可以获取生成模块不同阶段生成的业务数据,当然也可以从其他设备处直接获取待处理的业务数据。
提取模块,其配置为从所述业务数据中提取用于表示所述业务数据中关键内容的关键业务要素。
示例性的,业务数据以及相应的应答信息中包括部分的关键内容,还包括了重要性相对较低的其他内容。该关键内容可以是服务过程中提及到的目标对象的大的类型,如笔记本电脑类型、服务器类型等。还可以是目标对象的大的类型中具体的产品,如笔记本电脑中的thinkpad系列。还可以是目标对象的出现的具体问题,如thinkpad系列出现的电池过热问题,配件问题等信息。而非关键内容则可以是服务过程中涉及到的礼貌用语、生成时间等信息。
当然,提取模块对于业务数据中关键内容和非关键内容的判断,可以是基于预设条件来实施,该预设条件也可以根据实际使用情况而进行调整,从而使得确定出的关键内容更加适用于对当前的业务数据的处理。
本实施例中,提取模块可以基于确定出的关键内容来生成关键业务要素。关键业务要素可以是与服务相关联的实体。举例说明,可以将该关键内容进行语音识别转化为文字,而实体则可以是该文字中的关键内容,如可以是文本中含有PC的类型的词语、短语等。例如实体可以是PC的产品系列为ThinkPad系列,以及该ThinkPad系列中的具体型号。
在一些实施例中,关键业务要素从多个不同方面描述了该业务数据中的关键内容。此外,关键业务要素可以具有特定的数据结构,从而便于使用。
构建模块,其配置为基于关键业务要素,利用分类模型构建用于表征不同关键业务要素之间关系的三元组。
示例性的,分类模型可以首先被训练,完成训练的分类模型可以将关键业务要素按照预设类型进行分类。分类模型可以基于以下一种模型或多个模型构造,如:贝叶斯、决策树、支持向量机以及神经网络模型。关键业务要素的数据结构与构造出来的分类模型相适配。
进一步的,分类模型可以将关键业务要素作为输入,经过对关键业务要素的处理后,对于同一个业务数据可以生成与之相对应的三元组。三元组包括了三个节点以及节点之间的相互关系的信息。本实施例中,三元组中的节点可以是目标对象的相关内容,整个三元组能够表征不同关键业务要素之间关系。
举例说明,分类模型在初始阶段可以进行循环迭代的训练,作为初始模型,分类模型精确度会在训练过程中持续修正提升。分类模型对服务类型进行分类,生成的关键业务要素可以是:ThinkPad,电池,过热,输入分类模型,输出PC产品问题分类,感情倾向负向等信息。基于上述的关键服务要素可以生成相应的三元组,如:PC产品问题-分类-ThinkPad,ThinkPad-配件-电池,电池-平均-负面等。
在一个实施例中,构建模块还可以利用分类模型构建用于表征不同关键业务要素之间关系的其他的多元组。如四元组、五元组等。从而能够表示更加丰富的关键内容,以及表示出关联的关键业务要素之间的更加丰富的关系。
更新模块,其配置为基于所述三元组对所述业务数据对应的知识图谱进行更新。
示例性的,由于三元组包含了业务数据中的关键内容,以及相关联的关键内容之间的关联关系。知识图谱中的知识可以基于数量众多的三元组而构造。初始的知识图谱中具有初始的三元组。本实施例中,由于当前生成的三元组能够适用于当下的使用场景,因此本实施例中,更新模块基于当前生成的三元组相应的知识图谱中的初始三元组进行更新,从而实现了对知识图谱的更新,从而增加了知识图谱中知识的时效性和准确性。例如,更新后的知识图谱可以在客户服务的场景中使用,其他客服人员可以直接调用该知识图谱来答复当前用户的询问信息。
在本申请的一个实施例中,生成模块进一步配置为:
基于时间属性,将所述询问信息以及相对应的所述应答信息进行关联,形成相应的问答单元;
基于所有的所述问答单元生成所述业务数据。
在本申请的一个实施例中,提取模块进一步配置为:对所述业务数据实施主题识别,提取其中的关键业务要素,其中包括:
依序对所述业务数据实施命名实体识别、实体识别以及主题提取的操作,生成相应的主题信息;
基于所述主题信息,确定所述业务数据对应的所述关键业务要素。
在本申请的一个实施例中,构建模块进一步配置为:
通过所述分类模型,将所述关键业务要素确定为:关键词、类型信息或产品支持信息;
确定所述关键词、类型信息和/或产品支持信息之间的关联关系;
基于具有所述关联关系的所述关键词、类型信息和/或产品支持信息,构建出相应的三元组。
在本申请的一个实施例中,更新模块进一步配置为:
基于表征不同的所述关联关系的所述三元组,对所述知识图谱中对应的原始三元组进行更新,以更新所述业务数据对应的所述知识图谱。
在本申请的一个实施例中,更新模块进一步配置为:
至少按照预设时间间隔,使用更新后的所述知识图谱对所述分类模型进行更新。
在本申请的一个实施例中,知识图谱更新装置还包括训练模块,训练模块配置为:
利用更新后的所述知识图谱中的所述三元组和/或所述关键业务要素,对所述分类模型进行训练。
在本申请的一个实施例中,更新模块进一步配置为:
对所述分类模型进行更新和/或训练后的结果进行评测,生成相应的评测信息。
基于同样的发明构思,本申请实施例还提供了一种电子设备,如图7所示,包括:存储器和处理器,所述存储器中存储有可执行程序,所述处理器执行所述可执行程序以实现如下步骤:
基于获取到的询问信息和相对应的应答信息,生成待处理的业务数据;
从所述业务数据中提取用于表示所述业务数据中关键内容的关键业务要素;
基于关键业务要素,利用分类模型构建用于表征不同关键业务要素之间关系的三元组;
基于所述三元组对所述业务数据对应的知识图谱进行更新。
在本申请的一个实施例中,所述处理器执行所述可执行程序还可以实现如上方法中所述的步骤。
以上实施例仅为本申请的示例性实施例,不用于限制本申请,本申请的保护范围由权利要求书限定。本领域技术人员可以在本申请的实质和保护范围内,对本申请做出各种修改或等同替换,这种修改或等同替换也应视为落在本申请的保护范围内。
Claims (10)
1.一种知识图谱更新方法,包括:
基于获取到的询问信息和相对应的应答信息,生成待处理的业务数据;
从所述业务数据中提取用于表示所述业务数据中关键内容的关键业务要素;
基于关键业务要素,利用分类模型构建用于表征不同关键业务要素之间关系的三元组;
基于所述三元组对所述业务数据对应的知识图谱进行更新。
2.根据权利要求1所述的方法,所述基于获取到的询问信息和相对应的应答信息,生成待处理的业务数据,包括:
基于时间属性,将所述询问信息以及相对应的所述应答信息进行关联,形成相应的问答单元;
基于所有的所述问答单元生成所述业务数据。
3.根据权利要求1所述的方法,所述从所述业务数据中提取用于表示所述业务数据中关键内容的关键业务要素,包括:对所述业务数据实施主题识别,提取其中的关键业务要素,其中包括:
依序对所述业务数据实施命名实体识别、实体识别以及主题提取的操作,生成相应的主题信息;
基于所述主题信息,确定所述业务数据对应的所述关键业务要素。
4.根据权利要求1所述的方法,所述基于关键业务要素,利用分类模型构建用于表征不同关键业务要素之间关系的三元组,包括:
通过所述分类模型,将所述关键业务要素确定为:关键词、类型信息或产品支持信息;
确定所述关键词、类型信息和/或产品支持信息之间的关联关系;
基于具有所述关联关系的所述关键词、类型信息和/或产品支持信息,构建出相应的三元组。
5.根据权利要求4所述的方法,所述基于所述三元组对所述业务数据对应的知识图谱进行更新,包括:
基于表征不同的所述关联关系的所述三元组,对所述知识图谱中对应的原始三元组进行更新,以更新所述业务数据对应的所述知识图谱。
6.根据权利要求1所述的方法,所述方法还包括:
至少按照预设时间间隔,使用更新后的所述知识图谱对所述分类模型进行更新。
7.根据权利要求1所述的方法,所述方法还包括:
利用更新后的所述知识图谱中的所述三元组和/或所述关键业务要素,对所述分类模型进行训练。
8.根据权利要求6或7所述的方法,所述方法还包括:
对所述分类模型进行更新和/或训练后的结果进行评测,生成相应的评测信息。
9.一种知识图谱更新装置,包括:
生成模块,其配置为基于获取到的询问信息和相对应的应答信息,生成待处理的业务数据;
提取模块,其配置为从所述业务数据中提取用于表示所述业务数据中关键内容的关键业务要素;
构建模块,其配置为基于关键业务要素,利用分类模型构建用于表征不同关键业务要素之间关系的三元组;
更新模块,其配置为基于所述三元组对所述业务数据对应的知识图谱进行更新。
10.一种电子设备,包括:存储器和处理器,所述存储器中存储有可执行程序,所述处理器执行所述可执行程序以实现如下步骤:
基于获取到的询问信息和相对应的应答信息,生成待处理的业务数据;
从所述业务数据中提取用于表示所述业务数据中关键内容的关键业务要素;
基于关键业务要素,利用分类模型构建用于表征不同关键业务要素之间关系的三元组;
基于所述三元组对所述业务数据对应的知识图谱进行更新。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210199069.6A CN114564595A (zh) | 2022-03-02 | 2022-03-02 | 知识图谱更新方法、装置及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210199069.6A CN114564595A (zh) | 2022-03-02 | 2022-03-02 | 知识图谱更新方法、装置及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114564595A true CN114564595A (zh) | 2022-05-31 |
Family
ID=81715261
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210199069.6A Pending CN114564595A (zh) | 2022-03-02 | 2022-03-02 | 知识图谱更新方法、装置及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114564595A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115309870A (zh) * | 2022-10-11 | 2022-11-08 | 启元世界(北京)信息技术服务有限公司 | 一种知识获取方法及装置 |
CN116303516A (zh) * | 2023-04-21 | 2023-06-23 | 中信证券股份有限公司 | 一种更新知识图谱的方法、装置及相关设备 |
CN117171364A (zh) * | 2023-10-30 | 2023-12-05 | 北京华控智加科技有限公司 | 运维知识图谱更新方法及装置 |
CN117454990A (zh) * | 2023-11-14 | 2024-01-26 | 生命奇点(北京)科技有限公司 | 一种基于反馈结果对电子病历问答模型更新的系统 |
-
2022
- 2022-03-02 CN CN202210199069.6A patent/CN114564595A/zh active Pending
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115309870A (zh) * | 2022-10-11 | 2022-11-08 | 启元世界(北京)信息技术服务有限公司 | 一种知识获取方法及装置 |
CN115309870B (zh) * | 2022-10-11 | 2022-12-20 | 启元世界(北京)信息技术服务有限公司 | 一种知识获取方法及装置 |
CN116303516A (zh) * | 2023-04-21 | 2023-06-23 | 中信证券股份有限公司 | 一种更新知识图谱的方法、装置及相关设备 |
CN117171364A (zh) * | 2023-10-30 | 2023-12-05 | 北京华控智加科技有限公司 | 运维知识图谱更新方法及装置 |
CN117171364B (zh) * | 2023-10-30 | 2024-02-02 | 北京华控智加科技有限公司 | 运维知识图谱更新方法及装置 |
CN117454990A (zh) * | 2023-11-14 | 2024-01-26 | 生命奇点(北京)科技有限公司 | 一种基于反馈结果对电子病历问答模型更新的系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114564595A (zh) | 知识图谱更新方法、装置及电子设备 | |
CN107741976B (zh) | 智能应答方法、装置、介质和电子设备 | |
US10650818B2 (en) | Semi-supervised question answering machine | |
WO2021139343A1 (zh) | 基于自然语言处理的数据分析方法、装置和计算机设备 | |
CN112749266B (zh) | 一种工业问答方法、装置、系统、设备及存储介质 | |
CN111813910B (zh) | 客服问题的更新方法、系统、终端设备及计算机存储介质 | |
CN110795542A (zh) | 对话方法及相关装置、设备 | |
US9424344B2 (en) | Method and apparatus for natural language search for variables | |
CN111400465A (zh) | 客服机器人的生成方法、装置、电子设备及介质 | |
CN116955561A (zh) | 问答方法、装置、电子设备以及存储介质 | |
CN115481227A (zh) | 人机交互对话方法、装置以及设备 | |
US11688393B2 (en) | Machine learning to propose actions in response to natural language questions | |
CN109165180A (zh) | 一种提高房源经纪人作业效率的方法和系统 | |
CN112582073B (zh) | 医疗信息获取方法、装置、电子设备和介质 | |
CN110311943A (zh) | 一种电力企业大数据平台中数据的查询与展示方法 | |
US9176939B2 (en) | Alert driven interactive interface to a website mining system | |
CN117332068A (zh) | 人机交互方法、装置、电子设备以及存储介质 | |
CN112470216B (zh) | 语音应用平台 | |
CN117290478A (zh) | 一种知识图谱问答方法、装置、设备和存储介质 | |
CN111143524A (zh) | 一种用户意图确定方法及电子设备 | |
CN112328871B (zh) | 一种基于rpa模块的回复生成方法、装置、设备及存储介质 | |
CN114118937A (zh) | 基于任务的信息推荐方法、装置、电子设备及存储介质 | |
CN112182177A (zh) | 一种用户问题处理方法、装置、电子设备及存储介质 | |
CN111737425A (zh) | 一种应答方法、装置、服务器及存储介质 | |
CN117473070B (zh) | 智能机器人的多渠道应用方法、智能机器人和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |