CN114416941B - 融合知识图谱的对话知识点确定模型的生成方法及装置 - Google Patents
融合知识图谱的对话知识点确定模型的生成方法及装置 Download PDFInfo
- Publication number
- CN114416941B CN114416941B CN202111624827.6A CN202111624827A CN114416941B CN 114416941 B CN114416941 B CN 114416941B CN 202111624827 A CN202111624827 A CN 202111624827A CN 114416941 B CN114416941 B CN 114416941B
- Authority
- CN
- China
- Prior art keywords
- dialogue
- semantic
- semantic vector
- initial
- knowledge
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 76
- 239000013598 vector Substances 0.000 claims abstract description 169
- 238000012937 correction Methods 0.000 claims abstract description 54
- 238000012549 training Methods 0.000 claims abstract description 44
- 238000012545 processing Methods 0.000 claims description 11
- 230000008569 process Effects 0.000 claims description 7
- 238000013473 artificial intelligence Methods 0.000 abstract description 8
- 238000013135 deep learning Methods 0.000 abstract description 6
- 238000003058 natural language processing Methods 0.000 abstract description 6
- 230000004927 fusion Effects 0.000 description 13
- 238000004590 computer program Methods 0.000 description 12
- 238000010586 diagram Methods 0.000 description 11
- 238000005516 engineering process Methods 0.000 description 10
- 238000004891 communication Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 5
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000003993 interaction Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000009411 base construction Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 230000003924 mental process Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Databases & Information Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Human Computer Interaction (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Machine Translation (AREA)
Abstract
本申请公开了融合知识图谱的对话知识点确定模型的生成方法及装置,涉及计算机技术领域,尤其涉及自然语言处理、深度学习等人工智能领域。实现方案为:获取训练语料集;将对话文本中的历史对话文本输入初始语义模型中,确定历史对话文本对应的第一语义向量;将知识图谱中与对话文本中的答复语句对应的正样本节点及负样本节点输入初始图网络中,以确定正样本节点及负样本节点分别对应的第二语义向量及第三语义向量;根据第一语义向量分别与第二语义向量及第三语义向量间的关联度,确定初始语义模型及初始图网络分别对应的修正梯度;基于修正梯度,分别对初始语义模型及初始图网络进行修正,以获取对话知识点确定模型。该方法提高了知识点的准确性。
Description
技术领域
本申请涉及计算机技术领域,尤其涉及自然语言处理、深度学习等人工智能领域,具体涉及一种融合知识图谱的对话知识点确定模型的生成方法及装置。
背景技术
随着科学技术的发展,生成式对话系统在生活中的应用越来越广泛,给人们的生活带来了极大的便利。若生成式对话系统生成的对话中涉及的知识点不准确,显然会影响用户体验。
因此,如何提高知识点的准确性是亟待解决的问题。
发明内容
本申请提供了一种融合知识图谱的对话知识点确定模型的生成方法及装置。
根据本申请的一方面,提供了一种融合知识图谱的对话知识点确定模型的生成方法,包括:
获取训练语料集,其中,所述训练语料集中包括知识图谱及对话文本;
将所述对话文本中的历史对话文本输入初始语义模型中,以确定所述历史对话文本对应的第一语义向量;
将所述知识图谱中与所述对话文本中的答复语句对应的正样本节点及负样本节点输入初始图网络中,以确定所述正样本节点及负样本节点分别对应的第二语义向量及第三语义向量;
根据所述第一语义向量分别与所述第二语义向量及所述第三语义向量间的关联度,确定所述初始语义模型及所述初始图网络分别对应的修正梯度;
基于所述修正梯度,分别对所述初始语义模型及所述初始图网络进行修正,以获取对话知识点确定模型。
根据本申请的另一方面,提供了一种对话的生成方法,包括:
获取历史对话文本;
将所述历史对话文本输入预设的对话知识点确定模型中,以确定所述历史对话文本与各知识点间的关联度,其中,所述预设的对话知识点确定模型为采用如一方面实施例所述的方法生成的;
根据所述关联度,确定所述历史对话文本对应的目标知识点;
根据所述目标知识点及所述历史对话文本,生成答复语句。
根据本申请的另一方面,提供了一种融合知识图谱的对话知识点确定模型的生成装置,包括:
获取模块,用于获取训练语料集,其中,所述训练语料集中包括知识图谱及对话文本;
第一确定模块,用于将所述对话文本中的历史对话文本输入初始语义模型中,以确定所述历史对话文本对应的第一语义向量;
第二确定模块,用于将所述知识图谱中与所述对话文本中的答复语句对应的正样本节点及负样本节点输入初始图网络中,以确定所述正样本节点及负样本节点分别对应的第二语义向量及第三语义向量;
第三确定模块,用于根据所述第一语义向量分别与所述第二语义向量及所述第三语义向量间的关联度,确定所述初始语义模型及所述初始图网络分别对应的修正梯度;
修正模块,用于基于所述修正梯度,分别对所述初始语义模型及所述初始图网络进行修正,以获取对话知识点确定模型。
根据本申请的另一方面,提供了一种对话的生成装置,包括:
获取模块,用于获取历史对话文本;
第一确定模块,用于将所述历史对话文本输入预设的对话知识点确定模型中,以确定所述历史对话文本与各知识点间的关联度,其中,所述预设的对话知识点确定模型为采用如上述一方面实施例所述的方法生成的;
第二确定模块,用于根据所述关联度,确定所述历史对话文本对应的目标知识点;
生成模块,用于根据所述目标知识点及所述历史对话文本,生成答复语句。
根据本申请的另一方面,提供了一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述实施例所述的方法。
根据本申请的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据上述实施例所述的方法。
根据本申请的另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现上述实施例所述方法的步骤。
应当理解,本部分所描述的内容并非旨在标识本申请的实施例的关键或重要特征,也不用于限制本申请的范围。本申请的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本申请的限定。其中:
图1为本申请一实施例提供的融合知识图谱的对话知识点确定模型的生成方法的流程示意图;
图2为本申请另一实施例提供的融合知识图谱的对话知识点确定模型的生成方法的流程示意图;
图3为本申请另一实施例提供的融合知识图谱的对话知识点确定模型的生成方法的流程示意图;
图4为本申请一实施例提供的对话知识点确定模型的训练示意图;
图5为本申请一实施例提供的对话的生成方法的流程示意图;
图6为本申请一实施例提供的对话生成过程示意图;
图7为本申请一实施例提供的融合知识图谱的对话知识点确定模型的生成装置的结构示意图;
图8为本申请一实施例提供的对话的生成装置的结构示意图;
图9是用来实现本申请实施例的融合知识图谱的对话知识点确定模型的生成方法或对话的生成方法的电子设备的框图。
具体实施方式
以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
下面参考附图描述本申请实施例的融合知识图谱的对话知识点确定模型的生成方法及装置。
人工智能是研究使用计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科,既有硬件层面的技术领域也有软件层面的技术。人工智能硬件技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理等技术;人工智能软件技术包括计算机视觉技术、语音识别技术、自然语言处理技术以及深度学习、大数据处理技术、知识图谱技术等几大方向。
NLP(Natural Language Processing,自然语言处理)是计算机科学领域与人工智能领域中的一个重要方向,NLP研究的内容包括但不限于如下分支领域:文本分类、信息抽取、自动摘要、智能问答、话题推荐、机器翻译、主题词识别、知识库构建、深度文本表示、命名实体识别、文本生成、文本分析(词法、句法、语法等)、语音识别与合成等。
深度学习是机器学习领域中一个新的研究方向。深度学习是学习样本数据的内在规律和表示层次,这些学习过程中获得的信息对诸如文字,图像和声音等数据的解释有很大的帮助。它的最终目标是让机器能够像人一样具有分析学习能力,能够识别文字、图像和声音等数据。
图1为本申请一实施例提供的融合知识图谱的对话知识点确定模型的生成方法的流程示意图。
如图1所示,该融合知识图谱的对话知识点确定模型的生成方法包括:
步骤101,获取训练语料集,其中,训练语料集中包括知识图谱及对话文本。
本申请的对话知识点确定模型的生成方法,可以应用于某领域的生成式对话系统,比如应用于机场服务的生成式对话系统、应用于银行服务的对话系统等,也可以应用于开放域对话系统。若应用于某领域的对话系统,训练预料集中的知识图谱可以是针对该领域的,也可以是包含各个领域的;若应用于开放域对话系统,训练预料集中的知识图谱是包含各个领域的。
本申请中,对话文本可以是从对话系统中获取的一轮对话,对话文本可以包括此轮对话中的历史对话文本和当前问询语句对应的答复语句。其中,历史对话文本可以包括至少一对问答语句。
可以理解的是,训练预料集中可以包括多个对话文本,每个对话文本属于同一轮对话。
步骤102,将对话文本中的历史对话文本输入初始语义模型中,以确定历史对话文本对应的第一语义向量。
本申请中,可以将对话文本中的历史对话文本输入初始语义模型中,初始语义模型可以对历史对话文本中各个语句进行处理,获取各个语句的向量,并将各个语句的向量进行融合,得到历史对话文本对应的第一语义向量。在对每个语句进行处理时,可以考虑每个语句之前的历史语句,得到每个语句的向量,从而可以提高第一语义向量的准确性。
步骤103,将知识图谱中与对话文本中的答复语句对应的正样本节点及负样本节点输入初始图网络中,以确定正样本节点及负样本节点分别对应的第二语义向量及第三语义向量。
其中,正样本节点可以是知识图谱中与对话文本中的答复语句匹配的节点,负样本节点可以是与对话文本中的答复语句不匹配的节点,或者也可以是知识图谱中除正样本节点外的其他节点。
本申请中,正样本节点的数量可以是一个,也可以是多个,负样本节点的数量可以是一个,也可以是多个,本申请对此不作限定。
本申请中,可以将与答复语句对应的正样本节点和负样本节点分别输入到初始图网络中,初始图网络对正样本节点和负样本节点进行向量表示,以获取正样本节点对应的第二语义向量和负样本节点对应的第三语义向量。
步骤104,根据第一语义向量分别与第二语义向量及所述第三语义向量间的关联度,确定初始语义模型及初始图网络分别对应的修正梯度。
本申请中,可以根据历史对话文本对应的第一语义向量、正样本节点对应的第二语义向量、负样本节点对应的第三语义向量,对历史对话文本和知识图谱进行联合表示训练。
在实现时,可以计算第一语义向量与第二语义向量之间的关联度,以及第一语义向量与第三语义向量之间的关联度,并根据第一语义向量与第二语义向量之间的关联度,及第一语义向量与第三语义向量之间的关联度,确定初始语义模型和初始图网络分别对应的修正梯度。
由于第一语义向量与第二语义向量之间的关联度越大,第一语义向量与第三语义向量之间的关联度越小,说明语义模型和图网络的准确性越高,因此,本申请中,可以将第一语义向量与第二语义向量之间的关联度越大,第一语义向量与第三语义向量之间的关联度越小,作为训练目标,进而根据关联度确定修正梯度。
可以理解的是,第一语义向量与第二语义向量之间的关联度越小,修正梯度越大;第一语义向量与第三语义向量之间的关联度越大,修正梯度越大。
步骤105,基于修正梯度,分别对初始语义模型及初始图网络进行修正,以获取对话知识点确定模型。
本申请中,可以根据初始语义模型对应的修正梯度,对初始语义模型的参数进行调整,根据初始图网络对应的修正梯度,对初始图网络的参数进行调整。在对初始语义模型和初始图网络修正后,继续利用训练预料集中的对话文本,对修正后的初始语义模型和初始图网络进行修正,直至语义模型和图网络满足训练结束条件,获取对话知识点确定模型。
在训练结束时,根据图网络可以获取知识图谱中各节点的语义向量。
本申请实施例中,通过利用知识图谱和对话文本,对初始语义模型和初始图网络进行联合训练,从而对对话文本和知识图谱进行联合建模,对对话文本和知识图谱上的节点进行向量化表示,得到对话知识点确定模型利用对话知识点模型推断知识点,从而提高了知识点的准确性。
为了便于说明,本申请的另一个实施例提供了一种融合知识图谱的对话知识点确定模型的生成方法。下面结合图2进行说明,图2为本申请另一实施例提供的融合知识图谱的对话知识点确定模型的生成方法的流程示意图。
如图2所示,该融合知识图谱的对话知识点确定模型的生成方法,包括:
步骤201,获取训练语料集,其中,训练语料集中包括知识图谱及对话文本。
本申请中,步骤201与上述步骤101类似,故在此不再赘述。
步骤202,确定对话文本中的答复语句中包含的实体。
本申请中,可以对对话文本中的答复语句进行分词处理,获取答复语句中包含的各个分词,并根据各个分词的词性,确定答复语句中包含的实体。
比如,答复语句为“今天天气晴”,可以将词性为名词的“天气”,确定为该答复语句中包含的实体。
步骤203,确定知识图谱中与实体对应的节点为与答复语句对应的正样本节点。
在获取答复语句中包含的实体后,可以将实体与知识图谱中的各个节点进行匹配,并根据实体与各节点之间的匹配度,确定正样本节点。比如,可以将知识图谱中与实体匹配度最高的节点,作为答复语句对应的正样本节点。
由此,从答复语句中抽取实体,将实体映射到知识图谱中,将与实体对应的节点作为正样本节点,从而可以从知识图谱中确定出可以作为答复语句中知识点的节点。
步骤204,将知识图谱中除正样本节点外的至少一个其余节点,确定为答复语句对应的负样本节点。
考虑到模型的训练效率,在确定正样本节点之后,可以从知识图谱中除正样本节点外的节点中随机选择一个或者多个节点,作为答复语句对应的负样本节点。从而,可以从知识图谱中确定出不能作为答复语句中知识的节点。
步骤205,确定正样本节点及负样本节点分别在知识图谱中的边关系及关联节点。
其中,关联节点可以是指所有一级邻居节点,或者关联度最高的预设数量的一级邻居节点,或者邻居节点也可以是多级邻居节点等。
本申请中,可以根据知识图谱中各节点的图谱信息,确定正样本节点的邻居节点及正样本节点与邻居节点之间的边关系,也就是确定正样本节点在知识图谱中的边关系及关联节点。同样地,可以采用类似方式,确定负样本节点在知识图谱中的边关系及关联节点。
步骤206,根据边关系及关联节点,分别确定正样本节点及负样本节点对应的节点信息。
本申请中,可以根据正样本节点对应的边关系及关联节点,确定正样本节点对应节点信息。其中,正样本节点对应的节点信息,可以包括正样本节点的节点信息、正样本节点的关联节点的信息、正样本节点与其关联节点之间边关系的属性信息等。
同样地,可以根据负样本节点对应的边关系及关联节点,确定负样本节点对应节点信息。其中,负样本节点对应的节点信息,可以包括负样本节点的节点信息、负样本节点的关联节点的信息、负样本节点与其关联节点之间边关系的属性信息等。
步骤207,将对话文本中的历史对话文本输入初始语义模型中,以确定历史对话文本对应的第一语义向量。
本申请中,步骤207与上述步骤102类似,故在此不再赘述。
需要说明的是,步骤202-步骤206也可以在步骤207之后执行,本申请对此不作限定。
步骤208,将节点信息,输入初始图网络中,以确定正样本节点及负样本节点分别对应的第二语义向量及第三语义向量。
本申请中,可以将正样本节点对应的节点信息输入到初始图网络中,初始图网络对节点信息进行语义表示,确定正样本节点对应的第二语义向量。同样地,可以将负样本节点对应的节点信息输入到初始图网络中,初始图网络对节点信息进行语义表示,确定负样本节点对应的第三语义向量。
本申请中,通过将根据边关系及关联节点,分别确定的正样本节点及负样本节点对应的节点信息,输入到初始图网络中,得到第二语义向量和第三语义向量,从而可以使得正样本节点和负样本节点聚合它们周围的子图信息,使每个节点不仅包含自身的文本信息,更聚合了整个知识图谱的关联信息,从而提高了语义向量的准确性,进而提高了模型的准确性。
步骤209,根据第一语义向量分别与第二语义向量及第三语义向量间的关联度,确定初始语义模型及初始图网络分别对应的修正梯度。
步骤210,基于修正梯度,分别对初始语义模型及初始图网络进行修正,以获取对话知识点确定模型。
本申请中,步骤209-步骤210与上述步骤104-步骤105类似,故在此不再赘述。
本申请实施例中,通过根据对话文本中答复语句中包含的实体,从知识图谱中确定出答复语句对应的正样本节点和负样本节点,从而可以从知识图谱中确定出可以作为答复语句中知识点的节点,以及不能作为答复语句中知识的节点,并根据正样本节点及负样本节点分别在知识图谱中的边关系及关联节点,分别确定正样本节点及负样本节点对应的节点信息,根据节点信息,确定第二语义向量和第三语义向量,从而提高了语义向量的准确性。
为了便于说明,本申请的另一个实施例提供了一种融合知识图谱的对话知识点确定模型的生成方法。图3为本申请另一实施例提供的融合知识图谱的对话知识点确定模型的生成方法的流程示意图。
如图3所示,该融合知识图谱的对话知识点确定模型的生成方法,包括:
步骤301,获取训练语料集,其中,训练语料集中包括知识图谱及对话文本。
步骤302,将对话文本中的历史对话文本输入初始语义模型中,以确定历史对话文本对应的第一语义向量。
步骤303,将知识图谱中与对话文本中的答复语句对应的正样本节点及负样本节点输入初始图网络中,以确定正样本节点及负样本节点分别对应的第二语义向量及第三语义向量。
本申请中,步骤301-步骤303与上述实施例中记载的内容类似,故在此不再赘述。
步骤304,确定第一语义向量与第二语义向量间的第一关联度,及第一语义向量与第三语义向量间的第二关联度。
本申请中,可以计算第一语义向量与第二语义向量之间的距离,根据距离,确定第一关联度。其中,第一语义向量与第二语义向量之间的距离越小,说明第一关联度越大,第一语义向量与第二语义向量之间的距离越大,说明第一关联度越小。
同样地,可以计算第一语义向量与第三语义向量之间的距离,根据距离,确定第二关联度。
步骤305,根据第一关联度与第二关联度间的差值及大小关系,确定初始语义模型及初始图网络分别对应的修正梯度。
由于第一关联度是历史对话文本与正样本节点的之间的关联度,第二关联度历史对话文本与负样本节点的之间关联度,因此,本申请中,可以将第一关联度大于第二关联度、且第一关联度与第二关联度之间的差值越小,作为训练目标,由此可以根据第一关联度与第二关联度间的差值,以及第一关联度与第二关联度之间的大小关系,确定初始语义模型对应的修正梯度和初始图网络对应的修正梯度。
比如,若第一关联度小于第二关联度,那么修正梯度越大,若第一关联度大于第二关联度且差值越小,修正梯度越小。
步骤306,基于修正梯度,分别对初始语义模型及初始图网络进行修正,以获取对话知识点确定模型。
本申请中,步骤306与上述步骤105类似,故在此不再赘述。
本申请实施例中,在根据第一语义向量分别与第二语义向量及第三语义向量间的关联度,确定初始语义模型及初始图网络分别对应的修正梯度时,可以通过确定第一语义向量与第二语义向量间的第一关联度,及第一语义向量与第三语义向量间的第二关联度,并根据第一关联度与第二关联度间的差值及大小关系,确定初始语义模型及初始图网络分别对应的修正梯度。由此,在训练时考虑了负样本节点与历史对话文本之间的关联度,提高了模型的准确性。
上述实施例描述了,可以根据第一关联度与所述第二关联度间的差值及大小关系进行训练,在本申请的一个实施例中,还可以根据第一关联度和第二关联度与各自对应的阈值之间的差值,确定修正梯度,进而根据修正梯度修正模型。
在实现时,可以确定第一语义向量与第二语义向量间的第一关联度,及第一语义向量与所述第三语义向量间的第二关联度,方法与上述实施例中类似故在此不再赘述。之后,可以计算第一关联度与第一阈值之间的差值及第二关联度与第二阈值之间的差值,根据两个差值的和,确定初始语义模型对应的修正梯度及初始图网络对应的修正梯度,之后利用修正梯度调整初始语义模型和初始图网络。
其中,第一阈值大于第二阈值,第一阈值和第二阈值可以根据需要确定,本申请对此不作限定。
本申请中,两个差值的和越大,初始语义模型及初始图网络分别对应的修正梯度越大,两个差值的和越小,初始语义模型及初始图网络分别对应的修正梯度越小。
本申请实施例中,通过确定第一语义向量与第二语义向量间的第一关联度,及第一语义向量与第三语义向量间的第二关联度;根据第一关联度与第一阈值的差值,及第二关联度与第二阈值的差值,确定初始语义模型及初始图网络分别对应的修正梯度。由此,通过根据第一关联度与第一阈值的差值,及第二关联度与第二阈值的差值,确定修正梯度,在训练时考虑了负样本节点与历史对话文本之间的关联度,提高了模型的准确性。
为了便于理解,下面结合图4进行说明,图4为本申请一实施例提供的对话知识点确定模型的训练示意图。
如图4所示,对话知识点确定模型可以分为输入层、表示层、匹配层,可以将Transformer(前序编解码预测器)作为语义模型,将历史对话文本输入到Transformer中,可以得到历史对话文本对应的语义向量,同时可以从对话答复中抽取实体,将实体映射到知识图谱中得到正样本节点(可以作为答复语句中的知识点的节点)和负样本节点(随机采样的不能作为答复语句中的知识点的节点)。
在获取正样本节点和负样本节点后,可以将正样本节点和负样本节点分别输入到图网络中,可以获取正样本节点对应的语义向量和负样本节点对应的语义向量。之后,可以计算历史对话文本的语义向量与正样本节点对应的语义向量之间的第一关联度,以及历史对话文本的语义向量与负样本节点对应的语义向量之间的第二关联度,可以根据第一关联度和第二关联度,确定损失函数,利用损失函数分别调整Transformer和图网络的模型参数。
为了实现上述实施例,本申请实施例还提出一种对话的生成方法。图5为本申请一实施例提供的对话的生成方法的流程示意图。
如图5所示,该对话的生成方法包括:
步骤501,获取历史对话文本。
本申请中,可以获取本轮对话中之前的历史对话文本。其中,历史对话文本中可以一对或多对问答语句。
步骤502,将历史对话文本输入预设的对话知识点确定模型中,以确定历史对话文本与各知识点间的关联度。
其中,预设的对话知识点确定模型可以是采用上述实施例中记载的方式生成的,在此不再赘述。
本申请中,可以将历史对话文本中输入对话知识点确定模型中,对话知识点确定模型可以利用语义模型,确定历史对话文本对应的语义向量,并将历史对话文本对应的语义向量与知识图谱中各节点的语义向量分别进行匹配,从而可以确定历史对话文本与各知识点间的关联度。其中,知识图谱中的一个节点可以看作是一个知识点。
步骤503,根据关联度,确定历史对话文本对应的目标知识点。
本申请中,可以将关联度最大的知识点,作为历史对话文本对应的目标知识点,或者也可以将各知识点与历史对话文本间的关联度按照从大到小的顺序排序,将前预设数量的知识点,作为目标知识点。从而,可以从知识图谱中检索到知识点。
步骤504,根据目标知识点及历史对话文本,生成答复语句。
本申请中,可以将目标知识点和历史对话文本,输入到预先训练的对话生成模型中,以获取答复语句。
比如,目标知识点为“宾馆”,历史对话文本是关于旅游的对话,用户输入的问题为“A景点附近住宿方便吗”,生成的答复语句为“距离A景点800米处有一家住宿环境不错的b宾馆”
在训练对话生成模型时,可以使用预训练对话生成模型学习使用知识点生成包含知识点的答复语句。在训练过程中,可以使用相关技术中的对话预训练模型,利用带知识点的语料对对话预训练模型进行训练,其中,训练语料包对话文本和知识点。
为了让模型学到利用知识点的能力,训练预料中,知识点是从对话文本中的答复语句中抽取得到的,这样模型容易学到利用给定知识点生成回复。在训练中,可以将模型生成的答复语句与对话文本中的答复语句之间的差异,对模型参数进行更新。
本申请中,在训练对话生成模型时,可以采用深度学习的方式进行训练。
本申请实施例中,通过获取历史对话文本;将历史对话文本输入预设的对话知识点确定模型中,以确定历史对话文本与各知识点间的关联度,其中,预设的对话知识点确定模型为采用上述知识点确定模型方法生成的;根据关联度,确定历史对话文本对应的目标知识点;根据目标知识点及历史对话文本,生成答复语句。由此,通过利用历史对话文本和对话知识点确定模型,从知识图谱中检索到目标知识点,提高了知识点的准确性,那么基于目标知识点和历史对话文本生成答复语句,提高了答复语句的准确性。
为了便于理解,下面结合图6进行说明,图6为本申请一实施例提供的对话生成过程示意图。
如图6所示,对话生成过程可以分为两步,第一步是利用多轮对话历史和知识图谱,确定答复语句中应该出现的知识点;第二步是利用确定的知识点和多轮对话历史进行对话生成,得到答复语句。
为了实现上述实施例,本申请实施例还提出一种融合知识图谱的对话知识点确定模型的生成装置。图7为本申请一实施例提供的融合知识图谱的对话知识点确定模型的生成装置的结构示意图。
如图7所示,该融合知识图谱的对话知识点确定模型的生成装置700包括:
获取模块710,用于获取训练语料集,其中,训练语料集中包括知识图谱及对话文本;
第一确定模块720,用于将对话文本中的历史对话文本输入初始语义模型中,以确定历史对话文本对应的第一语义向量;
第二确定模块730,用于将知识图谱中与对话文本中的答复语句对应的正样本节点及负样本节点输入初始图网络中,以确定正样本节点及负样本节点分别对应的第二语义向量及第三语义向量;
第三确定模块740,用于根据第一语义向量分别与第二语义向量及第三语义向量间的关联度,确定初始语义模型及初始图网络分别对应的修正梯度;
修正模块750,用于基于修正梯度,分别对初始语义模型及初始图网络进行修正,以获取对话知识点确定模型。
在本申请实施例一种可能的实现方式中,该装置还可以包括:
第四确定模块,用于确定对话文本中的答复语句中包含的实体;
第五确定模块,用于确定知识图谱中与实体对应的节点为与答复语句对应的正样本节点;
第六确定模块,用于将知识图谱中除正样本节点外的至少一个其余节点,确定为答复语句对应的负样本节点。
在本申请实施例一种可能的实现方式中,第二确定模块730,用于:
确定正样本节点及负样本节点分别在知识图谱中的边关系及关联节点;
根据边关系及关联节点,分别确定正样本节点及负样本节点对应的节点信息;
将节点信息,输入初始图网络中。
在本申请实施例一种可能的实现方式中,第三确定模块740,用于:
确定第一语义向量与第二语义向量间的第一关联度,及第一语义向量与第三语义向量间的第二关联度;
根据第一关联度与第二关联度间的差值及大小关系,确定初始语义模型及初始图网络分别对应的修正梯度。
在本申请实施例一种可能的实现方式中,第三确定模块740,用于:
确定第一语义向量与第二语义向量间的第一关联度,及第一语义向量与第三语义向量间的第二关联度;
根据第一关联度与第一阈值的差值,及第二关联度与第二阈值的差值,确定初始语义模型及初始图网络分别对应的修正梯度,其中,第一阈值大于第二阈值。
需要说明的是,前述融合知识图谱的对话知识点确定模型的生成方法实施例的解释说明,也适用于该实施例的融合知识图谱的对话知识点确定模型的生成装置,故在此不再赘述。
本申请实施例中,通过利用知识图谱和对话文本,对初始语义模型和初始图网络进行联合训练,从而对对话文本和知识图谱进行联合建模,对对话文本和知识图谱上的节点进行向量化表示,得到对话知识点确定模型利用对话知识点模型推断知识点,从而提高了知识点的准确性。
为了实现上述实施例,本申请实施例还提出一种对话的生成装置。图8为本申请一实施例提供的对话的生成装置的结构示意图。
如图8所示,该对话的生成装置800包括:
获取模块810,用于获取历史对话文本;
第一确定模块820,用于将历史对话文本输入预设的对话知识点确定模型中,以确定历史对话文本与各知识点间的关联度,其中,预设的对话知识点确定模型为采用如上述实施例所述的知识点确定方法生成的;
第二确定模块830,用于根据关联度,确定历史对话文本对应的目标知识点;
生成模块840,用于根据目标知识点及历史对话文本,生成答复语句。
需要说明的是,前述对话的生成方法实施例的解释说明,也适用于该实施例的对话的生成装置,故在此不再赘述。
本申请实施例中,通过获取历史对话文本;将历史对话文本输入预设的对话知识点确定模型中,以确定历史对话文本与各知识点间的关联度,其中,预设的对话知识点确定模型为采用上述知识点确定模型方法生成的;根据关联度,确定历史对话文本对应的目标知识点;根据目标知识点及历史对话文本,生成答复语句。由此,通过利用历史对话文本和对话知识点确定模型,从知识图谱中检索到目标知识点,提高了知识点的准确性,那么基于目标知识点和历史对话文本生成答复语句,提高了答复语句的准确性。
根据本申请的实施例,本申请还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
图9示出了可以用来实施本申请的实施例的示例电子设备900的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。
如图9所示,设备900包括计算单元901,其可以根据存储在ROM(Read-OnlyMemory,只读存储器)902中的计算机程序或者从存储单元908加载到RAM(Random AccessMemory,随机访问/存取存储器)903中的计算机程序,来执行各种适当的动作和处理。在RAM903中,还可存储设备900操作所需的各种程序和数据。计算单元901、ROM 902以及RAM 903通过总线904彼此相连。I/O(Input/Output,输入/输出)接口905也连接至总线904。
设备900中的多个部件连接至I/O接口905,包括:输入单元906,例如键盘、鼠标等;输出单元907,例如各种类型的显示器、扬声器等;存储单元908,例如磁盘、光盘等;以及通信单元909,例如网卡、调制解调器、无线通信收发机等。通信单元909允许设备900通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元901可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元901的一些示例包括但不限于CPU(Central Processing Unit,中央处理单元)、GPU(Graphic Processing Units,图形处理单元)、各种专用的AI(Artificial Intelligence,人工智能)计算芯片、各种运行机器学习模型算法的计算单元、DSP(Digital SignalProcessor,数字信号处理器)、以及任何适当的处理器、控制器、微控制器等。计算单元901执行上文所描述的各个方法和处理,例如融合知识图谱的对话知识点确定模型的生成方法,或者对话的生成方法。例如,在一些实施例中,融合知识图谱的对话知识点确定模型的生成方法,或者对话的生成方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元908。在一些实施例中,计算机程序的部分或者全部可以经由ROM 902和/或通信单元909而被载入和/或安装到设备900上。当计算机程序加载到RAM 903并由计算单元901执行时,可以执行上文描述的融合知识图谱的对话知识点确定模型的生成方法,或者对话的生成方法的一个或多个步骤。备选地,在其他实施例中,计算单元901可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行融合知识图谱的对话知识点确定模型的生成方法,或者对话的生成方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、FPGA(Field Programmable Gate Array,现场可编程门阵列)、ASIC(Application-Specific Integrated Circuit,专用集成电路)、ASSP(Application Specific StandardProduct,专用标准产品)、SOC(System On Chip,芯片上系统的系统)、CPLD(ComplexProgrammable Logic Device,复杂可编程逻辑设备)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本申请的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本申请的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、RAM、ROM、EPROM(Electrically Programmable Read-Only-Memory,可擦除可编程只读存储器)或快闪存储器、光纤、CD-ROM(Compact Disc Read-Only Memory,便捷式紧凑盘只读存储器)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(Cathode-Ray Tube,阴极射线管)或者LCD(Liquid Crystal Display,液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:LAN(LocalArea Network,局域网)、WAN(Wide Area Network,广域网)、互联网和区块链网络。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务(VirtualPrivate Server,虚拟专用服务器)中,存在的管理难度大,业务扩展性弱的缺陷。服务器也可以为分布式系统的服务器,或者是结合了区块链的服务器。
根据本申请的实施例,本申请还提供了一种计算机程序产品,当计算机程序产品中的指令处理器执行时,执行本申请上述实施例提出的融合知识图谱的对话知识点确定模型的生成方法,或者对话的生成方法。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。
Claims (8)
1.一种融合知识图谱的对话知识点确定模型的生成方法,包括:
获取训练语料集,其中,所述训练语料集中包括知识图谱及对话文本,所述对话文本包括当前轮对话中的历史对话文本和当前问询语句对应的答复语句;
将所述对话文本中的历史对话文本输入初始语义模型中,所述初始语义模型对所述历史对话文本中各个语句进行处理,获取各个语句的向量,并将各个语句的向量进行融合,以确定所述历史对话文本对应的第一语义向量;
将所述知识图谱中与所述对话文本中的答复语句对应的正样本节点及负样本节点输入初始图网络中,以确定所述正样本节点及负样本节点分别对应的第二语义向量及第三语义向量;其中,所述正样本节点是所述知识图谱中与所述对话文本中的答复语句匹配的节点,所述负样本节点是与所述对话文本中的答复语句不匹配的节点或者是知识图谱中除所述正样本节点外的其他节点;
根据所述第一语义向量分别与所述第二语义向量及所述第三语义向量间的关联度,确定所述初始语义模型及所述初始图网络分别对应的修正梯度;其中,所述第一语义向量与所述第二语义向量之间的关联度越小,所述修正梯度越大;所述第一语义向量与所述第三语义向量之间的关联度越大,所述修正梯度越大;
基于所述修正梯度,分别对所述初始语义模型及所述初始图网络进行修正,以获取对话知识点确定模型;
其中,在所述获取训练语料集之后,还包括:
确定所述对话文本中的答复语句中包含的实体;
确定所述知识图谱中与所述实体对应的节点为与所述答复语句对应的正样本节点;
将所述知识图谱中除所述正样本节点外的至少一个其余节点,确定为所述答复语句对应的负样本节点;
其中,所述将所述知识图谱中与所述对话文本中的答复语句对应的正样本节点及负样本节点输入初始图网络中,包括:
确定所述正样本节点及负样本节点分别在所述知识图谱中的边关系及关联节点;
根据所述边关系及关联节点,分别确定所述正样本节点及所述负样本节点对应的节点信息;
将所述节点信息,输入所述初始图网络中;
其中,所述根据所述第一语义向量分别与所述第二语义向量及所述第三语义向量间的关联度,确定所述初始语义模型及所述初始图网络分别对应的修正梯度,包括:
确定所述第一语义向量与所述第二语义向量间的第一关联度,及所述第一语义向量与所述第三语义向量间的第二关联度;
根据所述第一关联度与所述第二关联度间的差值及大小关系,确定所述初始语义模型及所述初始图网络分别对应的修正梯度。
2.如权利要求1所述的方法,其中,所述根据所述第一语义向量分别与所述第二语义向量及所述第三语义向量间的关联度,确定所述初始语义模型及所述初始图网络分别对应的修正梯度,包括:
确定所述第一语义向量与所述第二语义向量间的第一关联度,及所述第一语义向量与所述第三语义向量间的第二关联度;
根据所述第一关联度与第一阈值的差值,及所述第二关联度与第二阈值的差值,确定所述初始语义模型及所述初始图网络分别对应的修正梯度,其中,所述第一阈值大于所述第二阈值。
3.一种对话的生成方法,包括:
获取历史对话文本;
将所述历史对话文本输入预设的对话知识点确定模型中,以确定所述历史对话文本与各知识点间的关联度,其中,所述预设的对话知识点确定模型为采用如权利要求1-2任一所述的方法生成的;
根据所述关联度,确定所述历史对话文本对应的目标知识点;
根据所述目标知识点及所述历史对话文本,生成答复语句。
4.一种融合知识图谱的对话知识点确定模型的生成装置,包括:
获取模块,用于获取训练语料集,其中,所述训练语料集中包括知识图谱及对话文本,所述对话文本包括当前轮对话中的历史对话文本和当前问询语句对应的答复语句;
第一确定模块,用于将所述对话文本中的历史对话文本输入初始语义模型中,所述初始语义模型对所述历史对话文本中各个语句进行处理,获取各个语句的向量,并将各个语句的向量进行融合,以确定所述历史对话文本对应的第一语义向量;
第二确定模块,用于将所述知识图谱中与所述对话文本中的答复语句对应的正样本节点及负样本节点输入初始图网络中,以确定所述正样本节点及负样本节点分别对应的第二语义向量及第三语义向量;其中,所述正样本节点是所述知识图谱中与所述对话文本中的答复语句匹配的节点,所述负样本节点是与所述对话文本中的答复语句不匹配的节点或者是知识图谱中除所述正样本节点外的其他节点;
第三确定模块,用于根据所述第一语义向量分别与所述第二语义向量及所述第三语义向量间的关联度,确定所述初始语义模型及所述初始图网络分别对应的修正梯度;其中,所述第一语义向量与所述第二语义向量之间的关联度越小,所述修正梯度越大;所述第一语义向量与所述第三语义向量之间的关联度越大,所述修正梯度越大;
修正模块,用于基于所述修正梯度,分别对所述初始语义模型及所述初始图网络进行修正,以获取对话知识点确定模型;
第四确定模块,用于确定所述对话文本中的答复语句中包含的实体;
第五确定模块,用于确定所述知识图谱中与所述实体对应的节点为与所述答复语句对应的正样本节点;
第六确定模块,用于将所述知识图谱中除所述正样本节点外的至少一个其余节点,确定为所述答复语句对应的负样本节点;
其中,所述第二确定模块,用于:确定所述正样本节点及负样本节点分别在所述知识图谱中的边关系及关联节点;根据所述边关系及关联节点,分别确定所述正样本节点及所述负样本节点对应的节点信息;将所述节点信息,输入所述初始图网络中;
所述第三确定模块,用于:确定所述第一语义向量与所述第二语义向量间的第一关联度,及所述第一语义向量与所述第三语义向量间的第二关联度;根据所述第一关联度与所述第二关联度间的差值及大小关系,确定所述初始语义模型及所述初始图网络分别对应的修正梯度。
5.如权利要求4所述的装置,其中,所述第三确定模块,用于:
确定所述第一语义向量与所述第二语义向量间的第一关联度,及所述第一语义向量与所述第三语义向量间的第二关联度;
根据所述第一关联度与第一阈值的差值,及所述第二关联度与第二阈值的差值,确定所述初始语义模型及所述初始图网络分别对应的修正梯度,其中,所述第一阈值大于所述第二阈值。
6.一种对话的生成装置,包括:
获取模块,用于获取历史对话文本;
第一确定模块,用于将所述历史对话文本输入预设的对话知识点确定模型中,以确定所述历史对话文本与各知识点间的关联度,其中,所述预设的对话知识点确定模型为采用如权利要求1-2任一所述的方法生成的;
第二确定模块,用于根据所述关联度,确定所述历史对话文本对应的目标知识点;
生成模块,用于根据所述目标知识点及所述历史对话文本,生成答复语句。
7.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-2中任一项所述的方法,或者能够执行权利要求3所述的方法。
8.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1-2中任一项所述的方法,或者执行根据权利要求3所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111624827.6A CN114416941B (zh) | 2021-12-28 | 2021-12-28 | 融合知识图谱的对话知识点确定模型的生成方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111624827.6A CN114416941B (zh) | 2021-12-28 | 2021-12-28 | 融合知识图谱的对话知识点确定模型的生成方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114416941A CN114416941A (zh) | 2022-04-29 |
CN114416941B true CN114416941B (zh) | 2023-09-05 |
Family
ID=81269802
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111624827.6A Active CN114416941B (zh) | 2021-12-28 | 2021-12-28 | 融合知识图谱的对话知识点确定模型的生成方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114416941B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117094387B (zh) * | 2023-10-19 | 2023-12-19 | 成都市智慧蓉城研究院有限公司 | 基于大数据的知识图谱构建方法及系统 |
Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110147451A (zh) * | 2019-05-10 | 2019-08-20 | 北京云知声信息技术有限公司 | 一种基于知识图谱的对话命令理解方法 |
CN110532360A (zh) * | 2019-07-19 | 2019-12-03 | 平安科技(深圳)有限公司 | 医疗领域知识图谱问答处理方法、装置、设备及存储介质 |
CN110874401A (zh) * | 2018-08-31 | 2020-03-10 | 阿里巴巴集团控股有限公司 | 信息处理方法、模型训练方法、装置、终端及计算设备 |
CN111160564A (zh) * | 2019-12-17 | 2020-05-15 | 电子科技大学 | 一种基于特征张量的中文知识图谱表示学习方法 |
CN111444305A (zh) * | 2020-03-19 | 2020-07-24 | 浙江大学 | 一种基于知识图谱嵌入的多三元组联合抽取方法 |
CN111639171A (zh) * | 2020-06-08 | 2020-09-08 | 吉林大学 | 一种知识图谱问答方法及装置 |
CN112417127A (zh) * | 2020-12-02 | 2021-02-26 | 网易(杭州)网络有限公司 | 对话模型的训练、对话生成方法、装置、设备及介质 |
CN112487173A (zh) * | 2020-12-18 | 2021-03-12 | 北京百度网讯科技有限公司 | 人机对话方法、设备和存储介质 |
CN112528005A (zh) * | 2020-12-25 | 2021-03-19 | 中山大学 | 基于知识检索图和预训练模型的中文对话知识检索方法 |
CN112732911A (zh) * | 2020-12-30 | 2021-04-30 | 平安科技(深圳)有限公司 | 基于语义识别的话术推荐方法、装置、设备及存储介质 |
CN113111190A (zh) * | 2021-04-16 | 2021-07-13 | 清华大学 | 一种知识驱动的对话生成方法及装置 |
CN113239147A (zh) * | 2021-05-12 | 2021-08-10 | 平安科技(深圳)有限公司 | 基于图神经网络的智能会话方法、系统及介质 |
CN113407759A (zh) * | 2021-08-18 | 2021-09-17 | 中国人民解放军国防科技大学 | 一种基于自适应特征融合的多模态实体对齐方法 |
CN113641829A (zh) * | 2021-07-13 | 2021-11-12 | 北京百度网讯科技有限公司 | 图神经网络的训练与知识图谱的补全方法、装置 |
CN113742463A (zh) * | 2021-07-27 | 2021-12-03 | 上海携旅信息技术有限公司 | 旅游场景下的对话预测方法、装置、电子设备、存储介质 |
CN113761105A (zh) * | 2021-05-24 | 2021-12-07 | 腾讯科技(深圳)有限公司 | 文本数据处理方法、装置、设备以及介质 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018209254A1 (en) * | 2017-05-11 | 2018-11-15 | Hubspot, Inc. | Methods and systems for automated generation of personalized messages |
US10909441B2 (en) * | 2017-06-02 | 2021-02-02 | Microsoft Technology Licensing, Llc | Modeling an action completion conversation using a knowledge graph |
-
2021
- 2021-12-28 CN CN202111624827.6A patent/CN114416941B/zh active Active
Patent Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110874401A (zh) * | 2018-08-31 | 2020-03-10 | 阿里巴巴集团控股有限公司 | 信息处理方法、模型训练方法、装置、终端及计算设备 |
CN110147451A (zh) * | 2019-05-10 | 2019-08-20 | 北京云知声信息技术有限公司 | 一种基于知识图谱的对话命令理解方法 |
CN110532360A (zh) * | 2019-07-19 | 2019-12-03 | 平安科技(深圳)有限公司 | 医疗领域知识图谱问答处理方法、装置、设备及存储介质 |
CN111160564A (zh) * | 2019-12-17 | 2020-05-15 | 电子科技大学 | 一种基于特征张量的中文知识图谱表示学习方法 |
CN111444305A (zh) * | 2020-03-19 | 2020-07-24 | 浙江大学 | 一种基于知识图谱嵌入的多三元组联合抽取方法 |
CN111639171A (zh) * | 2020-06-08 | 2020-09-08 | 吉林大学 | 一种知识图谱问答方法及装置 |
CN112417127A (zh) * | 2020-12-02 | 2021-02-26 | 网易(杭州)网络有限公司 | 对话模型的训练、对话生成方法、装置、设备及介质 |
CN112487173A (zh) * | 2020-12-18 | 2021-03-12 | 北京百度网讯科技有限公司 | 人机对话方法、设备和存储介质 |
CN112528005A (zh) * | 2020-12-25 | 2021-03-19 | 中山大学 | 基于知识检索图和预训练模型的中文对话知识检索方法 |
CN112732911A (zh) * | 2020-12-30 | 2021-04-30 | 平安科技(深圳)有限公司 | 基于语义识别的话术推荐方法、装置、设备及存储介质 |
CN113111190A (zh) * | 2021-04-16 | 2021-07-13 | 清华大学 | 一种知识驱动的对话生成方法及装置 |
CN113239147A (zh) * | 2021-05-12 | 2021-08-10 | 平安科技(深圳)有限公司 | 基于图神经网络的智能会话方法、系统及介质 |
CN113761105A (zh) * | 2021-05-24 | 2021-12-07 | 腾讯科技(深圳)有限公司 | 文本数据处理方法、装置、设备以及介质 |
CN113641829A (zh) * | 2021-07-13 | 2021-11-12 | 北京百度网讯科技有限公司 | 图神经网络的训练与知识图谱的补全方法、装置 |
CN113742463A (zh) * | 2021-07-27 | 2021-12-03 | 上海携旅信息技术有限公司 | 旅游场景下的对话预测方法、装置、电子设备、存储介质 |
CN113407759A (zh) * | 2021-08-18 | 2021-09-17 | 中国人民解放军国防科技大学 | 一种基于自适应特征融合的多模态实体对齐方法 |
Non-Patent Citations (1)
Title |
---|
"基于知识图谱的问答系统研究与应用";乔振浩;《中国优秀硕士学位论文全文数据库(信息科技辑)》(第2021第02期);I138-2528 * |
Also Published As
Publication number | Publication date |
---|---|
CN114416941A (zh) | 2022-04-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112560496B (zh) | 语义分析模型的训练方法、装置、电子设备及存储介质 | |
CN112487173B (zh) | 人机对话方法、设备和存储介质 | |
CN114416934B (zh) | 多模态的对话生成模型的训练方法、装置及电子设备 | |
CN114357105B (zh) | 地理预训练模型的预训练方法及模型微调方法 | |
CN113722493B (zh) | 文本分类的数据处理方法、设备、存储介质 | |
EP4113357A1 (en) | Method and apparatus for recognizing entity, electronic device and storage medium | |
CN115309877A (zh) | 对话生成方法、对话模型训练方法及装置 | |
CN114548110A (zh) | 语义理解方法、装置、电子设备及存储介质 | |
CN113791757A (zh) | 软件需求和代码映射方法及系统 | |
CN111368066B (zh) | 获取对话摘要的方法、装置和计算机可读存储介质 | |
CN113792153B (zh) | 问答推荐方法及其装置 | |
CN116152833B (zh) | 基于图像的表格还原模型的训练方法及表格还原方法 | |
CN112507103A (zh) | 任务型对话及模型训练方法、装置、设备和存储介质 | |
CN114973279B (zh) | 手写文本图像生成模型的训练方法、装置和存储介质 | |
CN113641805A (zh) | 结构化问答模型的获取方法、问答方法及对应装置 | |
JP2023015215A (ja) | テキスト情報の抽出方法、装置、電子機器及び記憶媒体 | |
CN115359323A (zh) | 图像的文本信息生成方法和深度学习模型的训练方法 | |
CN114416941B (zh) | 融合知识图谱的对话知识点确定模型的生成方法及装置 | |
CN117688946A (zh) | 基于大模型的意图识别方法、装置、电子设备和存储介质 | |
CN115577106B (zh) | 基于人工智能的文本分类方法、装置、设备和介质 | |
CN113807102B (zh) | 建立语义表示模型的方法、装置、设备和计算机存储介质 | |
CN112541557B (zh) | 生成式对抗网络的训练方法、装置及电子设备 | |
CN113408289B (zh) | 一种多特征融合的供应链管理实体知识抽取的方法及系统 | |
CN113204616B (zh) | 文本抽取模型的训练与文本抽取的方法、装置 | |
CN114817476A (zh) | 语言模型的训练方法、装置、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |