CN115934920B

CN115934920B - 针对人机对话的模型训练方法及相关装置

Info

Publication number: CN115934920B
Application number: CN202310162359.8A
Authority: CN
Inventors: 胡上峰
Original assignee: Shenzhen Renma Interactive Technology Co Ltd
Current assignee: Shenzhen Renma Interactive Technology Co Ltd
Priority date: 2023-02-24
Filing date: 2023-02-24
Publication date: 2023-06-16
Anticipated expiration: 2043-02-24
Also published as: CN115934920A

Abstract

本申请提供了一种针对人机对话的模型训练方法及相关装置，包括：将多个标准语句输入第一模型，得到每个标准语句对应的至少一个第一三元组；获取参考训练数据，所述参考训练数据包括多个训练单元，每个训练单元中包括一个标准语句和所述一个标准语句对应的至少一个第一三元组；根据所述参考训练数据训练第二模型，得到训练好的第二模型，所述训练好的第二模型为所述基于人工神经网络的语义关系提取模型。可以提高针对人机对话的模型的训练效率，增强人机对话的智能性和灵活性。

Description

针对人机对话的模型训练方法及相关装置

技术领域

本申请属于互联网产业的一般数据处理领域，具体涉及一种针对人机对话的模型训练方法及相关装置。

背景技术

在人机对话的开发过程中，语音引擎需要去分析用户输入的语句的语义，然后根据语义再确定要输出的下一句机器语句。而当前在对基于人机对话的模型进行训练时，均需要开发人员人工输入大量的语句作为训练参数，这样不仅效率低且训练好的模型能处理的对话情景有限，使得训练好的模型在人机对话在实际应用中不够灵活智能，用户使用体验不高。

发明内容

本申请实施例提供了一种针对人机对话的模型训练方法及相关装置，以期提高针对人机对话的模型的训练效率，增强人机对话的智能性和灵活性。

第一方面，本申请实施例提供了一种针对人机对话的模型训练方法，包括：

将多个标准语句输入第一模型，得到每个标准语句对应的至少一个第一三元组，所述第一模型为基于规则和/或语义知识网络的语义关系提取模型，三元组用于表征用户意图，包括关联关系和两个实体，每个实体中包括至少一个词语，所述关联关系用于表征所述两个实体的语义和/或语法关系；

获取参考训练数据，所述参考训练数据包括多个训练单元，每个训练单元中包括一个标准语句和所述一个标准语句对应的至少一个第一三元组；

根据所述参考训练数据训练第二模型，得到训练好的第二模型，所述训练好的第二模型为基于人工神经网络的语义关系提取模型。

第二方面，本申请实施例提供了一种针对人机对话的模型训练装置，包括：

输入单元，用于将多个标准语句输入第一模型，得到每个标准语句对应的至少一个第一三元组，所述第一模型为基于规则和/或语义知识网络的语义关系提取模型，三元组用于表征用户意图，包括关联关系和两个实体，每个实体中包括至少一个词语，所述关联关系用于表征所述两个实体的语义和/或语法关系；

获取单元，用于获取参考训练数据，所述参考训练数据包括多个训练单元，每个训练单元中包括一个标准语句和所述一个标准语句对应的至少一个第一三元组；

训练单元，用于根据所述参考训练数据训练第二模型，得到训练好的第二模型，所述训练好的第二模型为基于人工神经网络的语义关系提取模型。

第三方面，本申请实施例提供了一种电子设备，包括处理器、存储器、通信接口，以及一个或多个程序，所述一个或多个程序被存储在所述存储器中，并且被配置由所述处理器执行，所述程序包括用于执行本申请实施例第一方面中的步骤的指令。

第四方面，本申请实施例提供了一种计算机存储介质，其特征在于，存储用于电子数据交换的计算机程序，其中，所述计算机程序使得计算机执行如本实施例第一方面中所描述的部分或全部步骤。

第五方面，本申请实施例提供了一种计算机程序产品，其中，上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质，上述计算机程序可操作来使计算机执行如本申请实施例第一方面中所描述的部分或全部步骤。该计算机程序产品可以为一个软件安装包。

可见，本申请实施例中，先将多个标准语句输入第一模型，得到每个标准语句对应的至少一个第一三元组，然后获取参考训练数据，所述参考训练数据包括多个训练单元，每个训练单元中包括一个标准语句和所述一个标准语句对应的至少一个第一三元组，最后根据所述参考训练数据训练第二模型，得到训练好的第二模型，所述训练好的第二模型为基于人工神经网络的语义关系提取模型。这样可以提高针对人机对话的模型的训练效率，增强人机对话时的智能性和灵活性，提高用户对话体验。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的一种人机对话系统的结构示意图；

图2是本申请实施例提供的一种电子设备的结构示意图；

图3是本申请实施例提供的一种针对人机对话的模型训练方法的流程示意图；

图4是本申请实施例提供的一种人机话剧本的示意图；

图5是本申请实施例提供的一种针对人机对话的模型训练装置的功能单元组成框图；

图6是本申请实施例提供的另一种针对人机对话的模型训练装置的功能单元组成框图。

具体实施方式

为了使本技术领域的人员更好地理解本申请方案，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象，而不是用于描述特定顺序。此外，术语“包括”和“具有”以及它们任何变形，意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元，而是可选地还包括没有列出的步骤或单元，或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。

在本文中提及“实施例”意味着，结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例，也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是，本文所描述的实施例可以与其它实施例相结合。

当前在对基于人机对话的模型进行训练时，均需要开发人员人工输入大量的语句作为训练参数，这样不仅效率低且训练好的模型能处理的对话情景有限，使得训练好的模型在人机对话在实际应用中不够灵活智能，用户使用体验不高。

针对上述问题，本申请实施例提供了一种针对人机对话的模型训练方法及相关装置，下面结合附图对本申请实施例进行详细介绍。

请参阅图1，图1是本申请实施例提供的一种人机对话系统的结构示意图。如图1所示，所述人机对话系统10包括电子设备101和人机对话引擎102，电子设备101和人机对话引擎102通信连接。该电子设备101中包括针对人机对话的模型训练装置，用于训练第二模型，并生成每个剧情节点对应的人机对话的跳转条件，并将创建好的跳转条件发送给人机对话引擎102，使得人机对话引擎102可以获取用户输入语句，并根据该输入语句获取文本信息，然后对该文本信息进行语义识别，然后将获取的语义识别结果与当前剧情节点的跳转条件集合中的跳转条件进行匹配，并跳转到对应剧情节点，执行机器响应策略，以输出剧情语句，完成和用户的交流。

请参阅图2，图2是本申请实施例提供的一种电子设备的结构示意图。如图2所示，所述电子设备101包括处理器120、存储器130、通信接口140以及一个或多个程序131，其中，所述一个或多个程序131被存储在上述存储器130中，且被配置由上述处理器120执行，所述一个或多个程序131包括用于执行下述方法实施例中任一步骤的指令。具体实现中，所述处理器120用于执行如下述方法实施例中由电子设备执行的任一步骤，且在执行诸如发送等数据传输时，可选择的调用所述通信接口140来完成相应操作。

本申请实施例所涉及到的电子设备可以是具备通信能力的电子设备，该电子设备可以包括各种具有无线通信功能的手持设备、车载设备、可穿戴设备、计算设备或连接到无线调制解调器的其他处理设备，以及各种形式的用户设备（User Equipment，UE），移动台（Mobile Station，MS），终端设备（terminal device）等等。

请参阅图3，图3是本申请实施例提供的一种针对人机对话的模型训练方法的流程示意图。如图3所示，所述针对人机对话的模型训练方法包括以下步骤。

S201，将多个标准语句输入第一模型，得到每个标准语句对应的至少一个第一三元组。

其中，所述第一模型为基于规则和/或语义知识网络的语义关系提取模型，三元组用于表征用户意图，包括关联关系和两个实体，每个实体中包括至少一个词语，所述关联关系用于表征所述两个实体的语义和/或语法关系。所谓基于规则的模型，即包括基于符号规则的，基于图匹配规则的，基于语义知识网络的，以及联合使用概率或其它附加评估算法的模型。第一模型在获取到标准语句后，会先对每个标准语句执行分词、词性分析处理，然后第一模型再根据预设的提取规则从已处理的语句中提取至少一个第一三元组。三元组的结构的表现形式可以为（实体，语义和/或语法关系，实体），需要说明的是当前表现形式仅为三元组结构的其中一种示例的表现形式，其他包括有两个实体和两个实体间的语义和/或语法关系的三元组的表现形式，不再一一列出。例如标准语句为“我买个手机”，则对该标准语句进行分词、词性分析处理后得到的语句为“我（人名）/买（动词）/个（量词）/手机（名词）”，然后第一模型提取出的第一三元组可以包括如：（我，陈述主谓关系，买）和（买，陈述动宾关系，手机）。也就是说，一个标准语句可以通过第一模型得到一个或多个第一三元组。本方案中的标准语句为多个用户在使用人机对话功能时输入的语句，以及开发人员事先输入的语句，即存储在第一模型中的语句和其对应的三元组。

S202，获取参考训练数据，所述参考训练数据包括多个训练单元，每个训练单元中包括一个标准语句和所述一个标准语句对应的至少一个第一三元组。

其中，在获取参考训练数据时，可以先获取n个标准语句，即（D1、D2……Dn），然后将n个标准语句输入第一模型，得到n个第一三元组，即（R1、R2……Rn）。一个训练单元X1包括有一个标准语句D1和该标准语句对应的第一三元组R1，即训练单元Xn中包括有（Dn，Rn），同时参考训练数据中包括多个训练单元（X1……Xn）。

S203，根据所述参考训练数据训练第二模型，得到训练好的第二模型，所述训练好的第二模型为基于人工神经网络的语义关系提取模型。

可见，本实例中，先将多个标准语句输入第一模型，得到每个标准语句对应的至少一个第一三元组，然后获取参考训练数据，所述参考训练数据包括多个训练单元，每个训练单元中包括一个标准语句和所述一个标准语句对应的至少一个第一三元组，最后根据所述参考训练数据训练第二模型，得到训练好的第二模型，所述训练好的第二模型为基于人工神经网络的语义关系提取模型。这样可以提高针对人机对话的模型的训练效率，增强人机对话时的智能性和灵活性，提高用户对话体验。

在一个可能的实例中，所述训练好的第二模型用于获取用户输入语句对应的跳转条件，所述跳转条件中包括至少一个第二三元组，所述跳转条件用于指示针对所述跳转条件对应的用户输入语句的机器响应策略。

目前，由于语音引擎无法精确快速的对用户输入语句的语义进行理解，使得人机对话时不能够灵活地根据用户实际输入的语句进行交流，总是出现无法听懂的情况，使得人机对话在实际应用不够灵活智能，用户使用体验不高。

在人机对话场景中，会先生成一个人机对话剧本，该人机对话剧本中包括多个剧情节点，每个剧情节点包括至少一个预测用户语句集合和每个预测用户语句集合对应的机器响应策略。而在人机对话过程中要从当前剧情节点跳转到哪一个剧情节点则由跳转条件决定，即每个跳转条件对应有一个剧情节点，当用户输入语句与某一个跳转条件匹配时，则会将剧情节点跳转至该匹配的跳转条件对应的剧情节点。

其中，通过从第一模型中获取的训练数据对第二模型进行训练，可以使得在进行人机对话时，即使第二模型中未获取过相关语句，也能对该语句进行分析，并获取到对应的跳转条件，相比于第一模型来说，第二模型的泛化能力更好。所述机器响应策略至少包括输出机器语句，该机器响应策略还包括执行业务操作，例如播放视频操作等。在训练好第二模型后，用户输入语句对应的跳转条件则由通过第二模型获取的第二三元组指示。一个用户输入语句可以提取出多个第二三元组，同样一个第二三元组也可以对应多个不同的用户输入语句。一个跳转条件可以由一个第二三元组指示，也可以由多个第二三元组共同指示。不同的跳转条件也可以对应相同的剧情节点。如图4所示，图4是本申请实施例提供的一种人机话剧本的示意图。在剧情节点1-1时，当机器语句为“请问您想要什么品牌的手机”时，若用户输入语句分别为“我想要xxx（品牌）手机”和“我比较喜欢xxx（品牌）的手机”，这两句话通过第二模型得到的第二三元组均不相同，但均对应的是同一个要跳转的剧情节点1-2-1。而若用户输入语句为“不买手机”，则对应的第二三元组就与前述不同，因此对应的要跳转的剧情节点也不同，是1-2-2。当跳转到剧情节点1-2-1时，机器语句可以是“请问您想要什么价位的手机”，然后再根据用户输入语句跳转到剧情节点1-3-1。而剧情节点1-2-2的机器语句为“那你想买点儿别的吗”，然后再根据用户输入语句跳转到剧情节点1-4-1。可以看出，不同的跳转条件对应的剧情节点不同，不同的剧情节点对应的机器语句也不同。

在一个可能的实例中，所述将多个标准语句输入第一模型，得到每个标准语句对应的至少一个第一三元组之前，所述方法还包括：获取第二用户输入语句；将所述第二用户输入语句输入所述第一模型，得到第一备选三元组；确定是否存在与所述第一备选三元组匹配的标准三元组，所述标准三元组为预先存储在所述第一模型的三元组；若是，则确定所述第二用户输入语句对应的跳转条件为所述标准三元组；若否，则获取所述第二用户输入语句对应的第二备选三元组，并确定所述第二备选三元组为所述第二用户输入语句的跳转条件；存储所述第二备选三元组，并确定所述第二备选三元组为所述标准三元组。

其中，开发人员会先向第一模型输入语句，以及每个语句对应的标准三元组。在人机对话功能上线初期，由第一模型获取用户输入语句，然后根据预设提取规则对用户输入语句进行分析，得到第一备选三元组，若该第一备选三元组与事先存储的标准三元组匹配，则确定获取到该用户输入语句对应的三元组，即该用户输入语句对应的跳转条件。若匹配失败，则确定该用户输入语句不存在对应的跳转条件，则此时会由人工介入对该用户输入语句进行解析，得到对应的第二备选三元组，然后确定该对应的第二备选三元组为该用户输入语句对应的跳转条件，同时也会将该用户输入语句与对应的第二备选三元组存储在第一模型中，使得第一模型下次再获取到相同或类似的句子可以对其进行解析。该对用户输入语句进行分析包括对用户输入语句的分词处理和词性分析处理，该词性分析处理具体可以包括同义词替换等。

可见，本实例中，第一模型可以对简单语句进行分析，并获取对应的跳转条件，使得在人机对话功能上线初期，也能保证人机对话响应的及时性和准确性，且保证了后续用于训练第二模型时的训练数据的准确度。

在一个可能的实例中，所述第二模型还为预训练模型，所述方法还包括：用所述第一模型获取的所述参考训练数据中每个训练单元中的标准语句和所述一个标准语句对应的至少一个第一三元组，对第二模型进行微调训练。

其中，第二模型为一个大型预训练模型，例如生成式预训练（Generative Pre-training，GPT）模型，或者是来自Transformers的双向编码表示（Bidirectional EncoderRepresentation from Transformers，BERT）模型。也就是说第二模型同时包括两个属性，属性一使基于深度学习的语义关系提取模型，属性二是大型预训练模型。

在一个可能的实例中，所述根据所述参考训练数据训练第二模型，得到训练好的第二模型，包括：将当前训练单元中的标准语句输入所述第二模型，得到训练三元组；确定所述训练三元组与所述当前训练单元中的第一三元组的误差；确定所述误差是否小于预设值；若否，则根据所述误差调整所述第二模型的模型参数，并更新所述第二模型；重复上述步骤，直到所述误差小于预设值；若是，则确定下一个训练单元为所述当前训练单元；对所述参考训练数据中的所有训练单元执行上述步骤后，确定所述第二模型为训练好的第二模型。

其中，以第一个标准语句为例进行第二模型的训练说明，即将D1输入第二模型中，第二模型会输出D1对应的训练三元组r1，然后将r1与D1对应的第一三元组R1进行比对，根据R1与r1之间的误差修改第二模型的参数，使得误差减小。迭代多次，直到第二模型输出的r1与R1的误差小于预设值。该误差小于预设值的情况可以是R1与r1完全相同，或者R1和r1中的实体属于同义词等。则此时第二模型学会了根据D1输出R1。然后重复上述步骤，直到第二模型学会根据Dn输出Rn，则确定第二模型训练结束。

可见，本实例中，针对通过多个训练单元对第二模型进行迭代训练，调整第二模型的模型参数，使得训练好的第二模型可以准确地从用户输入语句中提取第二三元组，提高人机对话时答复的准确性和灵活性。

在一个可能的实例中，所述方法还包括：确定所述误差小于所述预设值的第一三元组为目标三元组；确定所述目标三元组为所述跳转条件。

其中，在对第二模型进行训练时，若训练三元组与第一三元组的误差小于预设值，则确定此时的训练三元组为当前标准语句的最终训练结果，即目标三元组，则可以确定此时得到的目标三元组为该标准语句对应的跳转条件。然后可以将该目标三元组和对应的标准语句进行存储，使得下次若第二模型再获取到相同的标准语句时，可以直接确定出对应的跳转条件。

可见，本实例中，在训练第二模型时，同步获取训练数据对应的跳转条件，可以避免对相同语句进行多次解析，提高人机对话的反应速度。

在一个可能的实例中，所述得到训练好的第二模型之后，所述方法还包括：对所述参考训练数据中的标准语句进行归纳学习，得到至少一个归纳语句；确定所述至少一个归纳语句中的正确语句，所述正确语句对应的语义符合逻辑；将所述正确语句输入所述训练好的第二模型，得到所述正确语句对应的跳转条件。

其中，在第二模型可以根据获取的用户输入语句输出准确的第二三元组后，还可以对已有的语句进行归纳分析，得到新的语句和该新的语句对应的第二三元组。该已有的语句可以是第二模型获取的标准语句，也可以是用户在使用人机对话功能时，第二模型获取的用户输入语句。例如，已有的语句包括：A1、A地区常年高温，A2、B地区常年高温，A3、C地区常年高温，A4、D地区常年高温（B地区、C地区和D地区位于A地区的周围），因此可以总结归纳得到多个归纳语句，包括：A5、A地区周边的所有地区常年高温，A6、A地区所在的国家常年高温。可知A5对应的语句符合逻辑，而A6对应的语句不符合逻辑，因此A5对应的语句为正确语句，可以将通过第二模型获取A5语句对应的第二三元组，并将该A5语句和对应的第二三元组进行存储。这样可以使得即使第二模型未获取过相应的语句，也可以对该语句进行准确的三元组提取，即第二模型可以处理不在训练集或未获取过的语句。

可见，本实例中，通过归纳总结获取新的语句，使得第二模型在实际应用时，可以覆盖更多、更大范围的句子，提高人机对话时的灵活性和准确度。

在一个可能的实例中，所述得到训练好的第二模型之后，所述方法还包括：

获取第一用户输入语句；

将所述第一用户输入语句输入所述训练好的第二模型，得到至少一个第二备选三元组；

确定是否存在与所述第二备选三元组匹配的目标三元组；

若是，则确定所述匹配的目标三元组是否包括多个；

若是，则从多个匹配的目标三元组中确定最终三元组，所述最终三元组为所述第一用户输入语句对应的跳转条件；

若否，则确定匹配的目标三元组为所述第一用户输入语句对应的跳转条件；

若否，则确定所述第二备选三元组的正确度；

在所述正确度高于第二预设值时，确定所述第二备选三元组为所述第一用户输入语句的跳转条件，并存储所述第二备选三元组，并将所述第二备选三元组确定为所述目标三元组；

在所述正确度不高于所述第二预设值时，获取开发人员确定的所述第一用户输入语句对应的第二目标三元组，确定所述第二目标三元组为所述第一用户输入语句的跳转条件，并存储所述第二目标三元组，并将所述第二目标三元组确定为所述目标三元组。

其中，由于一个用户输入语句可能会提取出多个第二三元组，因此就可能出现多个第二三元组分别与第二模型中存储的三元组匹配上，也就是说可能会同时对应有多个跳转条件。由于不同的跳转条件可能对应的是不同的剧情节点，因此需要确定出一个唯一的跳转条件才能成功跳转到下一个剧情节点，使得人机对话流畅进行。也就是说，若同时有多个存储在第二模型中的三元组与第二三元组匹配上，则需要从这多个三元组中确定出最终三元组，以该最终三元组为跳转条件，跳转到下个剧情节点。若只有一个存储在第二模型中的三元组与第二三元组匹配上，则可以直接确定该匹配上的三元组为跳转条件。若第二模型提取的第二三元组与存储的三元组均不匹配，则需要确定该提取的三元组是否正确，若正确，则可作为该用户输入语句对应的跳转条件，若不正确，则需要人工介入，对该用户输入语句进行分析得到跳转条件。

具体实现中，在确定最终三元组时，可以先确定出多个匹配的三元组中是否有多个三元组同时对应同一个跳转条件，若是，则该同时对应一个跳转条件的三元组则为最终三元组。若否，则确定多个匹配的三元组中每个三元组对应的跳转条件中是否存在对应同一个剧情节点的情况，若是，则确定对应同一个剧情节点的多个跳转条件中任意一个跳转条件对应的匹配的三元组为最终三元组。若均没有，则对每个三元组对应的用户语义进行分析，确定出最能表达用户意图的三元组为最终三元组。例如上述用户输入语句为“我买个手机”，提取出的匹配的三元组包括两个，分别为（我，陈述主谓关系，买）和（买，陈述动宾关系，手机），则此时可知第二个三元组能更准确地表达用户语义，则确定最终三元组为（买，陈述动宾关系，手机）。在确定最能表达用户意图的三元组时，可以根据三元组中的两个实体中包括的词语的词性确定，例如若两个实体对应的词语词性分别为动词和名词时，则该三元组最能表达用户意图。

具体实现中，在确定第二备选三元组的正确度时，可以通过确定出的第二备选三元组与已存储的三元组中的三元组的相似度来确定正确度。例如可以从已存储的三元组中确定与第二备选三元组最相似的三元组，然后确定当前第二备选三元组是否符合该最相似的三元组指示的跳转条件对应的剧情节点，若符合，则正确度高于第二预设值，并可以确定该第二备选三元组指示的跳转条件对应的剧情节点则为该最相似的三元组指示的跳转条件对应的剧情节点。若不符合，则需要人工确定该用户输入语句对应三元组，以及该三元组指示的跳转条件对应的剧情节点。

可见，本实例中，根据获取的用户输入语句提取三元组，并根据三元组确定跳转条件，可以提高人机对话时的响应策略的准确度，提高用户对话体验。

在一个可能的实例中，所述从多个匹配的目标三元组中确定最终三元组之后，所述方法还包括：确定每个匹配的目标三元组对应的生成规则；根据所述最终三元组调整所述每个匹配的目标三元组的生成规则的系数，所述系数越高，根据所述生成规则生成所述第二备选三元组时的概率更高。

其中，当同一个用户输入语句对应有多个三元组时，第二模型在输出时可以对不同的跳转条件进行排序，排序越靠前，则意味着该三元组越可能成为该用户输入语句对应的跳转条件。可以根据最终对跳转条件的选择结果给予第二模型反馈，并以该选择结果调整不同的跳转条件的生成规则，该生成规则也可以表达为生成逻辑。即对一个用户输入语句，可能会得到多个第二三元组，则可以根据人工选择或最终确定出的该用户输入语句对应的跳转条件确定出哪些三元组生成规则不对，哪些三元组生成规则更对。以此调高第二模型中被选择为跳转条件的三元组所对应的生成规则的系数，系数越高则意味着第二模型更普遍地使用该生成逻辑来生成三元组，且生成的三元组的排序越靠前，使得多次调整后第二模型给出的跳转条件可以更准确。

可见，本实例中，根据跳转条件的确定结果对第二模型进行更新，可以提高对跳转条件的确定的准确度。

在一个可能的实例中，所述将所述第一用户输入语句输入所述训练好的第二模型，得到至少一个第二备选三元组，包括：将所述第一用户输入语句输入所述训练好的第二模型，得到多个第二参考三元组；确定所述第二参考三元组中的至少一个关键三元组，所述至少一个关键三元组用于指示所述第一用户输入语句的完整语义；确定所述至少一个关键三元组为所述至少一个第二备选三元组。

其中，由于一个用户输入语句中可能同时存在多个三元组，而有的三元组对理解用户意图的贡献并不大，因此没有必要将该三元组提取出来，且若提取出该类三元组反而还会增大对确定跳转条件的难度，因此第二模型在进行三元组提取时可以进行取舍。例如一个句子存在6个三元组，全部6个三元组可以完整的表示该语句的意图，3个三元组（6个三元组中的一部分）也可以完整的表示该语句的完整意图，因此可以仅提取出这三个三元组就可以了。

可见，本实例中，第二模型对提取的三元组的数量进行取舍，可以提高生成跳转条件的效率。

与上述实施例一致的，请参阅图5，图5是本申请实施例提供的一种针对人机对话的模型训练装置的功能单元组成框图。所述针对人机对话的模型训练装置40包括：输入单元401，用于将多个标准语句输入第一模型，得到每个标准语句对应的至少一个第一三元组，所述第一模型为基于规则和/或语义知识网络的语义关系提取模型，三元组用于表征用户意图，包括关联关系和两个实体，每个实体中包括至少一个词语，所述关联关系用于表征所述两个实体的语义和/或语法关系；获取单元402，用于获取参考训练数据，所述参考训练数据包括多个训练单元，每个训练单元中包括一个标准语句和所述一个标准语句对应的至少一个第一三元组；训练单元403，用于根据所述参考训练数据训练第二模型，得到训练好的第二模型，所述训练好的第二模型为基于人工神经网络的语义关系提取模型。

在一个可能的实例中，所述第二模型还为预训练模型，所述针对人机对话的模型训练装置40还用于：用所述第一模型获取的所述参考训练数据中每个训练单元中的标准语句和所述一个标准语句对应的至少一个第一三元组，对第二模型进行微调训练。

在一个可能的实例中，在所述根据所述参考训练数据训练第二模型，得到训练好的第二模型方面，所述训练单元403具体用于：将当前训练单元中的标准语句输入所述第二模型，得到训练三元组；确定所述训练三元组与所述当前训练单元中的第一三元组的误差；确定所述误差是否小于预设值；若否，则根据所述误差调整所述第二模型的模型参数，并更新所述第二模型；重复上述步骤，直到所述误差小于预设值；若是，则确定下一个训练单元为所述当前训练单元；对所述参考训练数据中的所有训练单元执行上述步骤后，确定所述第二模型为训练好的第二模型。

在一个可能的实例中，所述训练单元403还用于：确定所述误差小于所述预设值的第一三元组为目标三元组；确定所述目标三元组为所述跳转条件。

在一个可能的实例中，所述得到训练好的第二模型之后，所述针对人机对话的模型训练装置40还用于：对所述参考训练数据中的标准语句进行归纳学习，得到至少一个归纳语句；确定所述至少一个归纳语句中的正确语句，所述正确语句对应的语义符合逻辑；将所述正确语句输入所述训练好的第二模型，得到所述正确语句对应的跳转条件。

在一个可能的实例中，所述得到训练好的第二模型之后，所述针对人机对话的模型训练装置40还用于：获取第一用户输入语句；

确定是否存在与所述第二备选三元组匹配的目标三元组；

若是，则确定所述匹配的目标三元组是否包括多个；

若否，则确定所述第二备选三元组的正确度；

在一个可能的实例中，所述从多个匹配的目标三元组中确定最终三元组之后，所述针对人机对话的模型训练装置40还用于：确定每个匹配的目标三元组对应的生成规则；根据所述最终三元组调整所述每个匹配的目标三元组的生成规则的系数，所述系数越高，根据所述生成规则生成所述第二备选三元组时的概率更高。

在一个可能的实例中，在所述将所述第一用户输入语句输入所述训练好的第二模型，得到至少一个第二备选三元组方面，所述针对人机对话的模型训练装置40还用于：将所述第一用户输入语句输入所述训练好的第二模型，得到多个第二参考三元组；确定所述第二参考三元组中的至少一个关键三元组，所述至少一个关键三元组用于指示所述第一用户输入语句的完整语义；确定所述至少一个关键三元组为所述至少一个第二备选三元组。

在一个可能的实例中，在所述将多个标准语句输入第一模型，得到每个标准语句对应的至少一个第一三元组之前，所述针对人机对话的模型训练装置40还用于：获取第二用户输入语句；将所述第二用户输入语句输入所述第一模型，得到第一备选三元组；确定是否存在与所述第一备选三元组匹配的标准三元组，所述标准三元组为预先存储在所述第一模型的三元组；若是，则确定所述第二用户输入语句对应的跳转条件为所述标准三元组；若否，则获取所述第二用户输入语句对应的第二备选三元组，并确定所述第二备选三元组为所述第二用户输入语句的跳转条件；存储所述第二备选三元组，并确定所述第二备选三元组为所述标准三元组。

可以理解的是，由于方法实施例与装置实施例为相同技术构思的不同呈现形式，因此，本申请中方法实施例部分的内容应同步适配于装置实施例部分，此处不再赘述。

在采用集成的单元的情况下，请参阅图6，图6是本申请实施例提供的另一种针对人机对话的模型训练装置的功能单元组成框图。在图6中，针对人机对话的模型训练装置500包括：处理模块512和通信模块511。处理模块512用于针对人机对话的模型训练装置的动作进行控制管理，例如，执行输入单元401、获取单元402和训练单元403的步骤，和/或用于执行本文所描述的技术的其它过程。通信模块511用于针对人机对话的模型训练装置与其他设备之间的交互。如图6所示，针对人机对话的模型训练装置500还可以包括存储模块513，存储模块513用于存储针对人机对话的模型训练装置的程序代码和数据。

其中，处理模块512可以是处理器或控制器，例如可以是中央处理器(CentralProcessing Unit，CPU)，通用处理器，数字信号处理器(DigitalSignalProcessor，DSP)，ASIC，FPGA或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框，模块和电路。所述处理器也可以是实现计算功能的组合，例如包含一个或多个微处理器组合，DSP和微处理器的组合等等。通信模块511可以是收发器、RF电路或通信接口等。存储模块513可以是存储器。

其中，上述方法实施例涉及的各场景的所有相关内容均可以援引到对应功能模块的功能描述，在此不再赘述。上述针对人机对话的模型训练装置500可执行上述图3所示的针对人机对话的模型训练方法。

上述主要从方法侧执行过程的角度对本申请实施例的方案进行了介绍。可以理解的是，电子设备为了实现上述功能，其包含了执行各个功能相应的硬件结构和软件模块。本领域技术人员应该很容易意识到，结合本文中所提供的实施例描述的各示例的单元及算法步骤，本申请能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

本申请实施例可以根据上述方法示例对电子设备进行功能单元的划分，例如，可以对应各个功能划分各个功能单元，也可以将两个或两个以上的功能集成在一个处理单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。需要说明的是，本申请实施例中对单元的划分是示意性的，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式。

本申请实施例还提供了一种芯片，其中，该芯片包括处理器，用于从存储器中调用并运行计算机程序，使得安装有所述芯片的设备执行如上述方法实施例中电子设备所描述的部分或全部步骤。

本申请实施例还提供一种计算机存储介质，其中，该计算机存储介质存储用于电子数据交换的计算机程序，该计算机程序使得计算机执行如上述方法实施例中记载的任一方法的部分或全部步骤，上述计算机包括电子设备。

本申请实施例还提供一种计算机程序产品，上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质，上述计算机程序可操作来使计算机执行如上述方法实施例中记载的任一方法的部分或全部步骤。该计算机程序产品可以为一个软件安装包，上述计算机包括电子设备。

需要说明的是，对于前述的各方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本申请并不受所描述的动作顺序的限制，因为依据本申请，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作和模块并不一定是本申请所必须的。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中，应该理解到，所揭露的装置，可通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如上述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性或其它的形式。

上述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

上述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储器中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储器中，包括若干指令用以使得一台计算机设备（可为个人计算机、服务器或者网络设备等）执行本申请各个实施例上述方法的全部或部分步骤。而前述的存储器包括：U盘、只读存储器（ROM，Read-Only Memory）、随机存取存储器（RAM，Random Access Memory）、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，该程序可以存储于一计算机可读存储器中，存储器可以包括：闪存盘、只读存储器（英文：Read-Only Memory ，简称：ROM）、随机存取器（英文：Random Access Memory，简称：RAM）、磁盘或光盘等。

以上对本申请实施例进行了详细介绍，本文中应用了具体个例对本申请的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本申请的方法及其核心思想；同时，对于本领域的一般技术人员，依据本申请的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本申请的限制。

虽然本发明披露如上，但本发明并非限定于此。任何本领域技术人员，在不脱离本发明的精神和范围内，可轻易想到变化或替换，均可作各种更动与修改，包含上述不同功能、实施步骤的组合，包含软件和硬件的实施方式，均在本发明的保护范围。

Claims

1.一种针对人机对话的模型训练方法，其特征在于，包括：

在未获取到训练好的第二模型的情况下，获取第二用户输入语句；

将所述第二用户输入语句输入第一模型，得到第一备选三元组；

确定是否存在与所述第一备选三元组匹配的标准三元组，所述标准三元组为预先存储在所述第一模型的三元组；

若是，则确定所述第二用户输入语句对应的跳转条件为所述标准三元组；

若否，则获取所述第二用户输入语句对应的第二备选三元组，并确定所述第二备选三元组为所述第二用户输入语句的跳转条件；

存储所述第二备选三元组，并确定所述第二备选三元组为所述标准三元组；

确定所述第二用户输入语句为标准语句，所述标准三元组为第一三元组；

根据所述参考训练数据训练第二模型，得到训练好的第二模型，所述训练好的第二模型为基于人工神经网络的语义关系提取模型，所述训练好的第二模型用于获取用户输入语句对应的跳转条件，所述跳转条件中包括至少一个第二三元组，所述跳转条件用于指示针对所述跳转条件对应的用户输入语句的机器响应策略；

所述得到训练好的第二模型之后，所述方法还包括：

获取第一用户输入语句；

确定是否存在与所述第二备选三元组匹配的目标三元组；

若是，则确定匹配的目标三元组是否包括多个；

若否，则确定所述第二备选三元组的正确度；

在所述正确度不高于所述第二预设值时，获取开发人员确定的所述第一用户输入语句对应的第二目标三元组，确定所述第二目标三元组为所述第一用户输入语句的跳转条件，并存储所述第二目标三元组，并将所述第二目标三元组确定为所述目标三元组；

所述从多个匹配的目标三元组中确定最终三元组之后，所述方法还包括：确定每个匹配的目标三元组对应的生成规则；根据所述最终三元组调整所述每个匹配的目标三元组的生成规则的系数，所述系数越高，根据所述生成规则生成所述第二备选三元组时的概率更高。

2.根据权利要求1所述的方法，所述第二模型还为预训练模型，所述方法还包括：

用所述第一模型获取的所述参考训练数据中每个训练单元中的标准语句和所述一个标准语句对应的至少一个第一三元组，对第二模型进行微调训练。

3.根据权利要求2所述的方法，其特征在于，所述根据所述参考训练数据训练第二模型，得到训练好的第二模型，包括：

将当前训练单元中的标准语句输入所述第二模型，得到训练三元组；

确定所述训练三元组与所述当前训练单元中的第一三元组的误差；

确定所述误差是否小于预设值；

若否，则根据所述误差调整所述第二模型的模型参数，并更新所述第二模型；

重复上述步骤，直到所述误差小于预设值；

若是，则确定下一个训练单元为所述当前训练单元；

对所述参考训练数据中的所有训练单元执行上述步骤后，确定所述第二模型为训练好的第二模型。

4.根据权利要求3所述的方法，其特征在于，所述方法还包括：

确定所述误差小于所述预设值的第一三元组为目标三元组；

确定所述目标三元组为所述跳转条件。

5.根据权利要求3所述的方法，其特征在于，所述得到训练好的第二模型之后，所述方法还包括：

对所述参考训练数据中的标准语句进行归纳学习，得到至少一个归纳语句；

确定所述至少一个归纳语句中的正确语句，所述正确语句对应的语义符合逻辑；

将所述正确语句输入所述训练好的第二模型，得到所述正确语句对应的跳转条件。

6.一种针对人机对话的模型训练装置，其特征在于，包括：

确定单元，用于在未获取到训练好的第二模型的情况下，获取第二用户输入语句；以及用于将所述第二用户输入语句输入第一模型，得到第一备选三元组；以及用于确定是否存在与所述第一备选三元组匹配的标准三元组，所述标准三元组为预先存储在所述第一模型的三元组；若是，则确定所述第二用户输入语句对应的跳转条件为所述标准三元组；若否，则获取所述第二用户输入语句对应的第二备选三元组，并确定所述第二备选三元组为所述第二用户输入语句的跳转条件；以及用于存储所述第二备选三元组，并确定所述第二备选三元组为所述标准三元组；以及用于确定所述第二用户输入语句为标准语句，所述标准三元组为第一三元组；

训练单元，用于根据所述参考训练数据训练第二模型，得到训练好的第二模型，所述训练好的第二模型为基于人工神经网络的语义关系提取模型，所述训练好的第二模型用于获取用户输入语句对应的跳转条件，所述跳转条件中包括至少一个第二三元组，所述跳转条件用于指示针对所述跳转条件对应的用户输入语句的机器响应策略；

所述得到训练好的第二模型之后，针对人机对话的模型训练装置还用于：

获取第一用户输入语句；

确定是否存在与所述第二备选三元组匹配的目标三元组；

若是，则确定匹配的目标三元组是否包括多个；

若否，则确定所述第二备选三元组的正确度；

所述从多个匹配的目标三元组中确定最终三元组之后，所述针对人机对话的模型训练装置还用于：确定每个匹配的目标三元组对应的生成规则；根据所述最终三元组调整所述每个匹配的目标三元组的生成规则的系数，所述系数越高，根据所述生成规则生成所述第二备选三元组时的概率更高。

7.一种电子设备，其特征在于，包括处理器、存储器，以及一个或多个程序，所述一个或多个程序被存储在所述存储器中，并且被配置由所述处理器执行，所述程序包括用于执行如权利要求1-5任一项所述的方法中的步骤的指令。