CN116257611B

CN116257611B - 问答模型的训练方法、问答处理方法、装置及存储介质

Info

Publication number: CN116257611B
Application number: CN202310065730.9A
Authority: CN
Inventors: 庞超; 王硕寰; 朱鹏飞; 孙宇; 李芝
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2023-01-13
Filing date: 2023-01-13
Publication date: 2023-11-10
Anticipated expiration: 2043-01-13
Also published as: CN116257611A

Abstract

本公开公开了一种问答模型的训练方法、问答处理方法及装置，涉及人工智能领域，尤其涉及自然语言处理、深度学习技术领域。具体实现方案为：获取训练数据集；利用训练数据集中的训练数据对预设问答模型中的预设检索网络进行训练，以得到目标检索网络；利用目标检索网络输出训练数据的候选答案向量集和训练向量；利用训练数据的候选答案向量集，训练向量和/或训练数据对预设问答模型中的预设生成网络进行训练，以得到目标生成网络；基于目标检索网络和目标生成网络，以得到目标问答模型。本公开实施例的目标问答模型适用范围较广，且目标检索网络和目标生成网络与行业数据解耦，均只需训练一次即可，无需重新训练，降低了模型训练成本。

Description

问答模型的训练方法、问答处理方法、装置及存储介质

技术领域

本公开涉及人工智能领域，尤其涉及自然语言处理、深度学习技术领域。

背景技术

随着深度学习的发展，问答模型得到了广泛应用。其中，问答模型可以通过海量的训练数据进行训练，使得问答模型捕获多种多样的知识，进而使得问答模型可以在下游任务上获得较好的效果。但是，不同行业对应的知识不同，因此需要通用适用于各个行业的问答模型，以使得问答模型的适用范围更加广泛。

现有技术中，问答模型通过人工收集大量某个行业的无监督文本数据，问答模型通过在该数据上的语言模型任务学习该数据中的行业知识，并训练好的问答模型应用到该行业的下游任务中去。但是，相关技术中的训练数据仅为该行业的无监督文本数据，数据来源单一，使得问答模型仅可以分析无监督文本数据，适用范围局限，并且问答模型需要针对不同行业进行重新训练，以及有新的行业知识时问答模型同样需要进行重新训练，增加了模型训练成本。

发明内容

本公开提供了一种问答模型的训练方法、问答处理方法、装置及存储介质。

根据本公开的一方面，提供了一种问答模型的训练方法，所述方法包括：获取训练数据集；利用所述训练数据集中的训练数据对预设问答模型中的预设检索网络进行训练，以得到目标检索网络；利用所述目标检索网络输出所述训练数据的候选答案向量集和训练向量；利用所述训练数据的候选答案向量集，所述训练向量和/或所述训练数据对所述预设问答模型中的预设生成网络进行训练，以得到目标生成网络；基于所述目标检索网络和所述目标生成网络，以得到目标问答模型。

根据本公开的另一方面，提供了一种问答处理方法，所述方法包括：获取需要回答的问题数据；将所述问题数据输入目标问答模型中的目标检索网络，以生成所述问题数据对应的问题向量和候选答案向量集；将所述问题数据和/或所述问题向量，和所述候选答案向量集输入所述目标问答模型中的目标生成网络，以生成所述问题数据的目标答案。

根据本公开的另一方面，提供了一种问答模型的训练装置，包括：获取模块，用于获取训练数据集；第一训练模块，用于利用所述训练数据集中的训练数据对预设问答模型中的预设检索网络进行训练，以得到目标检索网络；输出模块，用于利用所述目标检索网络输出所述训练数据的候选答案向量集和训练向量；第二训练模块，用于利用所述训练数据的候选答案向量集，所述训练向量和/或所述训练数据对所述预设问答模型中的预设生成网络进行训练，以得到目标生成网络；构建模块，用于基于所述目标检索网络和所述目标生成网络，以得到目标问答模型。

根据本公开的另一方面，提供了一种电子设备，包括：至少一个处理器；以及与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少个处理器执行，以使所述至少一个处理器能够执行本公开的问答模型的训练方法和问答处理方法。

根据本公开的另一方面，提供了一种存储有计算机指令的非瞬时计算机可读存储介质，所述计算机指令用于使所述计算机执行本公开的问答模型的训练方法和问答处理方法。

根据本公开的另一方面，提供了一种计算机程序产品，所述计算机程序被处理器执行时实现本公开的问答模型的训练方法和问答处理方法。

本公开相比于现有技术具备以下有益效果：

通过多种数据源对预设检索网络进行训练，得到目标检索网络，从而使得目标问答模型可以适用于多种数据源，适用范围较广，同时目标问答模型中的目标检索网络和目标生成网络均通过通用数据进行训练，也即是目标检索网络是将输入数据转换为对应的向量，目标生成网络是根据输入候选答案向量集，训练向量和/或训练数据生成训练数据的目标答案。基于此，目标检索网络和目标生成网络可以与行业数据解耦，均只需训练一次即可，无需重新训练，降低了模型训练成本。

应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

附图说明

附图用于更好地理解本方案，不构成对本公开的限定。其中：

图1是根据本公开实施例提供的一种问答模型的训练方法的流程示意图；

图2是根据本公开实施例提供的一种问答模型的训练方法的流程示意图；

图3是根据本公开实施例提供的一种问答模型的训练方法的流程示意图；

图4是根据本公开实施例提供的一种问答模型的训练方法的流程示意图；

图5是根据本公开实施例提供的一种问答模型的训练方法的流程示意图；

图6是根据本公开实施例提供的一种问答处理方法的流程示意图；

图7是根据本公开实施例提供的一种问答处理方法的流程示意图；

图8是根据本公开实施例提供的一种问答处理方法的流程示意图；

图9是根据本公开实施例提出的一种问答处理方法的流程示意图；

图10是根据本公开实施例提供的一种问答模型的训练装置的结构示意图；

图11是用来实现本公开实施例的电子设备的框图。

具体实施方式

以下结合附图对本公开的示范性实施例做出说明，其中包括本公开实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本公开的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。

下面参考附图描述本公开实施例的问答模型的训练方法、问答处理方法及装置。

图1是根据本公开第一实施例的示意图。

如图1所示，该问答模型的训练方法可以包括：

步骤101，获取训练数据集。

其中，需要说明的是，上述问答模型的训练方法的执行主体为问答模型的训练装置，该问答模型的训练装置可以由软件和/或硬件的方式实现，该实施例中的问答模型的训练装置可以配置在电子设备中。

其中，本示例实施例中电子设备可以包括终端设备和服务器等设备，该实施例对电子设备不作限定。

本公开实施例中，上述训练数据集中可以包括多模态数据、无结构文本数据、有结构文本数据。

本公开实施例中，上述多模态数据包括至少2个模态的数据。以及，上述模态包括但不限于视频、文本和音频。示例的，多模态数据可以为图片和文本数据。

本公开实施例中，上述有结构文本数据可以包括相关关系的文本数据，例如表格或者知识图谱；上述无结构文本数据可以为文本数据，例如一段文本。

本公开实施例中，基于上述训练数据集训练完成的目标问答模型可以对多模态数据、无结构文本数据、有结构文本数据中任意一种数据进行分析，而不仅适用于文本数据，从而使得目标问答模型，适用范围较广。

步骤102、利用训练数据集中的训练数据对预设问答模型中的预设检索网络进行训练，以得到目标检索网络。

本公开的实施例中，上述利用训练数据集中的训练数据对预设问答模型中的预设检索网络进行训练，以得到目标检索网络的方法可以包括以下步骤：

步骤1021、将训练数据集中的训练数据的输入至预设检索网络中，以得到训练数据的预测向量；

本公开实施例中，预设检索网络可以将输入的训练数据转换为同一空间的向量，也即是，预设检索网络将输入的多模态数据/无结构文本数据/有结构文本数据均转换为同一空间的向量，从而使得后续可以利用向量表示获取候选答案向量集。

本公开实施例中，上述预设检索网络中的参数可以为随机设置的初始值。

步骤1022、基于训练数据的预测向量和训练数据的真实向量，以得到对应的损失值；

本公开实施例中，可以将训练数据的预测向量和训练数据的真实向量输入损失函数中，得到对应的损失值。

步骤1023、基于损失值更新预设检索网络的参数，直至预设检索网络收敛，以得到目标检索网络。

本公开实施例中，通过上述步骤1021～步骤1023得到的目标检索网络，可以将输入的训练数据转换为同一空间的向量，也即是，目标检索网络可以输出训练数据对应的训练向量。

步骤103、利用目标检索网络输出训练数据的候选答案向量集和训练向量。

本公开实施例中，可以利用目标检索网络直接输出训练数据的训练向量，并且目标检索网络通过将训练向量与目标检索库中的向量进行相似度比较，得到训练数据的候选答案向量集。关于这部分内容会在后续实施例中进行详细介绍。

步骤104、利用训练数据的候选答案向量集，训练向量和/或训练数据对预设问答模型中的预设生成网络进行训练，以得到目标生成网络。

本公开实施例中，上述利用训练数据的候选答案向量集，训练向量和/或训练数据对预设问答模型中的预设生成网络进行训练时，可以根据训练数据中包括的模态类型，将训练数据的候选答案向量集，训练向量和/或训练数据输入至预设生成网络中，以得到训练数据对应的预测答案，并基于预测答案与真实答案调整预设生成网络中的参数，以得到目标生成网络。关于这部分内容会在后续实施例中进行详细介绍。

步骤105、基于目标检索网络和目标生成网络，以得到目标问答模型。

本公开实施例中，上述目标问答模型包括目标检索网络和目标生成网络，其中，目标问答模型的输入为问题数据，目标问答模型的输出为生成的目标答案。

本公开实施例中，可以通过多种数据源对预设检索网络进行训练，得到目标检索网络，从而使得目标问答模型可以适用于多种数据源，适用范围较广。

本公开实施例中，目标问答模型中的目标检索网络和目标生成网络均通过通用数据进行训练，也即是目标检索网络是将输入数据转换为对应的向量，目标生成网络是根据输入候选答案向量集，训练向量和/或训练数据生成训练数据的目标答案。基于此，目标检索网络和目标生成网络可以与行业数据解耦，均只需训练一次即可，无需重新训练，降低了模型训练成本。

图2是根据本公开第二实施例的示意图。

如图2所示，该问答模型的训练方法可以包括：

步骤201、获取训练数据集。

步骤202、利用训练数据集中的训练数据对预设问答模型中的预设检索网络进行训练，以得到目标检索网络。

其中，关于步骤201～步骤202的具体实现方式，可参见本公开实施例的相关描述，此处不再赘述。

步骤203、利用目标检索网络生成目标向量检索库。

需要说明的是，本公开实施例中，上述目标检索网络可以将输入数据转换为同一空间的向量表示，基于此可以利用目标检索网络对已有数据源中所有数据进行向量转换，得到每个数据的向量表示，并将所有数据的向量表示生成目标向量检索库。

本公开实施例中，目标向量检索库中检索中包括数据源中所有数据对应的向量，使得后续目标检索网络可以直接通过目标向量检索获取候选向量数据集。

步骤204、将训练数据输入目标检索网络进行向量转换，以生成训练数据对应的训练向量。

步骤205、目标检索网络基于训练向量，从目标向量检索库中获取训练向量对应的候选答案向量集。

本公开实施例中，目标检索网络基于训练向量，从目标向量检索库中获取训练向量对应的候选答案向量集时，可以通过向量之间的相似度从目标向量检索库中获取训练向量对应的候选答案向量集，无需对目标检索网络进行训练，从而使得仅需对预设检索网络训练一次，即可通过训练完成的目标检索网络得到训练数据的候选答案向量集和训练向量。

本公开实施例中，当有新的数据来源时，仅需通过目标检索网络得到该数据来源对应的向量，并将向量更新至目标向量检索库中即可，无需对目标检索网络进行重新训练，降低了训练成本。

步骤206、利用训练数据的候选答案向量集，训练向量和/或训练数据对预设问答模型中的预设生成网络进行训练，以得到目标生成网络。

步骤207、基于目标检索网络和目标生成网络，以得到目标问答模型。

其中，关于步骤206～步骤207的具体实现方式，可参见本公开实施例的相关描述，此处不再赘述。

本公开实施例中，目标检索网络基于训练向量，从目标向量检索库中获取训练向量对应的候选答案向量集，当有新的数据来源时，仅需通过目标检索网络得到该数据来源对应的向量，并将向量更新至目标向量检索库中即可，无需对目标检索网络进行重新训练，降低了训练成本。

图3是根据本公开第三实施例的示意图。

如图3所示，该问答模型的训练方法可以包括：

步骤301、获取训练数据集。

步骤302、利用训练数据集中的训练数据对预设问答模型中的预设检索网络进行训练，以得到目标检索网络。

步骤303、利用目标检索网络生成目标向量检索库。

步骤304、将训练数据输入目标检索网络进行向量转换，以生成训练数据对应的训练向量。

其中，关于步骤301～步骤304的具体实现方式，可参见本公开实施例的相关描述，此处不再赘述。

步骤305、目标检索网络基于训练向量与目标向量检索库中向量之间的相似度，获取训练向量对应的预设数量的候选答案向量。

本公开实施例中，目标检索网络可以计算训练向量与目标向量检索库中向量之间的相似度，并将与训练向量相似度最高的预设数量的向量确定为训练向量的候选答案向量。

步骤306、基于预设数量的候选答案向量，构成训练向量对应的候选答案向量集。

本公开实施例中，上述候选答案向量集中预设数量的候选答案向量是与训练向量最相似的向量，基于此，使得后续可以利用候选答案向量集生成目标答案，提高了目标答案的准确度。

步骤307、利用训练数据的候选答案向量集，训练向量和/或训练数据对预设问答模型中的预设生成网络进行训练，以得到目标生成网络。

步骤308、基于目标检索网络和目标生成网络，以得到目标问答模型。

其中，关于步骤307～步骤308的具体实现方式，可参见本公开实施例的相关描述，此处不再赘述。

本实施例中，可以通过训练向量与目标向量检索库中向量之间的相似度，获取训练向量对应的预设数量的候选答案向量，以使得预设数量的候选答案向量是与训练向量最相似的向量，从而使得后续利用候选答案向量集生成的目标答案更加准确，提高了目标答案的准确度。

图4是根据本公开第四实施例的示意图。

如图4所示，该问答模型的训练方法可以包括：

步骤401、获取训练数据集。

步骤402、利用训练数据集中的训练数据对预设问答模型中的预设检索网络进行训练，以得到目标检索网络。

步骤403、利用目标检索网络输出训练数据的候选答案向量集和训练向量。

其中，关于步骤401～步骤403的具体实现方式，可参见本公开实施例的相关描述，此处不再赘述。

步骤404、将训练数据的候选答案向量集，训练向量和/或训练数据输入至预设问答模型中的预设生成网络中，以得到训练数据的预测答案。

本公开实施例中，不同训练数据包括模态类型不同，以及不同模态类型对应输入至预设生成网络中的数据也不相同。

本公开实施例中，可以根据训练数据中包括的模态类型，确定预设生成网络的输入数据。关于这部分内容会在后续实施例中进行详细介绍。

本公开实施例中，预设生成网络可以根据训练向量和/或训练数据，根据候选答案向量集，得到训练数据的预测答案，其中预测答案不是从候选答案向量集中直接选择候选答案，而是根据候选答案向量集中的预设数量的候选答案向量生成训练数据的预测答案，也即是训练数据的预测答案可以包括多个候选答案向量中的内容，从而使得后续目标生成网络生成答案更加准确。

本公开实施例中，上述预设生成网络中的参数可以为随机设置的初始值。

步骤405、基于训练数据的预测答案和训练数据的真实答案，得到对应的损失值。

本公开实施例中，可以将训练数据的预测答案和训练数据的真实答案输入损失函数中，得到对应的损失值。

步骤406、基于损失值更新预设生成网络的参数，直至预设生成网络收敛，以得到目标生成网络。

本公开实施例中，通过上述步骤404～步骤406得到的目标生成网络，可以根据候选答案向量集中的预设数量的候选答案向量生成训练数据的目标答案，从而使得目标生成网络生成的目标答案更加准确，提高了目标答案的准确度。

步骤407、基于目标检索网络和所述目标生成网络，以得到目标问答模型。

图5是根据本公开第五实施例的示意图。

如图5所示，该问答模型的训练方法可以包括：

步骤501、获取训练数据集。

步骤502、利用训练数据集中的训练数据对预设问答模型中的预设检索网络进行训练，以得到目标检索网络。

步骤503、利用目标检索网络输出训练数据的候选答案向量集和训练向量。

其中，关于步骤501～步骤503的具体实现方式，可参见本公开实施例的相关描述，此处不再赘述。

步骤504、确定训练数据中的模态类型。

本公开实施例中，可以根据训练数据中包括的数据类型，确定训练数据中的模态类型。示例的，假设训练数据中包括图片数据和文本数据，则确定训练数据中包括图片类型和文本类型。

步骤505、基于模态类型，将训练数据和/或训练向量，和候选答案向量集输入预设生成网络。

具体的，基于模态类型，将训练数据和/或训练向量，和候选答案向量集输入预设生成网络的方法可以包括以下步骤：

步骤5051、若训练数据只包括文本模态，将训练数据和候选答案向量集输入预设生成网络；

步骤5052、若训练数据包括文本模态和其他模态，将训练数据中文本模态对应的文本数据和其他模态对应的训练向量，和候选答案向量集输入预设生成网络；

步骤5053、若训练数据不包括文本模态，将训练向量和候选答案向量集输入预设生成网络。

本公开实施例中，基于模态类型，将训练数据和/或训练向量，和候选答案向量集输入预设生成网络，可以使得后续预设生成网络可以根据具体模态类型生成对应模态类型对应的预测答案，以使得问答模型可以生成多模态输入数据对应的答案，从而使得问答模型可以适用于多种数据源，适用范围较广。

步骤506、预设生成网络将候选答案向量集中的候选答案向量进行拼接，并基于拼接后的向量和训练数据和/或训练向量，以得到训练数据的预测答案。

本公开实施例中，预设生成网络可以根据训练向量和/或训练数据，拼接后的向量，得到训练数据的预测答案，使得预测答案不是从候选答案向量集中直接选择的候选答案，而是根据候选答案向量集中候选答案向量拼接后的向量生成的训练数据的预测答案，也即是训练数据的预测答案可以包括多个候选答案向量中的内容，从而使得后续目标生成网络生成答案更加准确。

步骤507、基于训练数据的预测答案和训练数据的真实答案，得到对应的损失值。

步骤508、基于损失值更新预设生成网络的参数，直至预设生成网络收敛，以得到目标生成网络。

步骤509、基于目标检索网络和目标生成网络，以得到目标问答模型。

本公开实施例中，通过上述步骤507～步骤509的具体实现方式，可参见本公开实施例的相关描述，此处不再赘述。

本公开实施例中，预设生成网络可以根据训练向量和/或训练数据，拼接后的向量，得到训练数据的预测答案，使得预测答案不是从候选答案向量集中直接选择的候选答案，而是根据候选答案向量集中候选答案向量拼接后的向量生成的训练数据的预测答案，也即是训练数据的预测答案可能包括多个候选答案向量中的内容，从而使得后续目标生成网络生成答案更加准确。

图6是根据本公开第六实施例的示意图。

如图6所示，该问答处理方法可以包括：

步骤601、获取需要回答的问题数据。

本公开实施例中，上述问题数据为多模态数据、无结构文本数据、有结构文本数据中任意一种。

步骤602、将问题数据输入目标问答模型中的目标检索网络，以生成问题数据对应的问题向量和候选答案向量集。

步骤603、将问题数据和/或问题向量，和候选答案向量集输入目标问答模型中的目标生成网络，以生成问题数据的目标答案。

其中，关于上述步骤601～步骤603的详细介绍可以参考上述实施例中的相关介绍，本实施例在此不做赘述。

本实施例中，基于上述需要回答的问题数据可以为多模态数据、无结构文本数据、有结构文本数据中任意一种，也即是上述问答处理方法不仅适用于文本数据，适用范围较广。

图7是根据本公开第七实施例的示意图。

如图7所示，该问答处理方法可以包括：

步骤701、获取需要回答的问题数据。

步骤702、将问题数据输入目标检索网络进行向量转换，以生成问题数据对应的问题向量。

步骤703、目标检索网络基于问题向量，从目标向量检索库中获取问题向量对应的候选答案向量集。

本公开实施例中，上述目标问答模型还包括目标答案检索库。

步骤704、将问题数据和/或问题向量，和候选答案向量集输入目标问答模型中的目标生成网络，以生成问题数据的目标答案。

其中，关于上述步骤701～步骤704的详细介绍可以参考上述实施例中的相关介绍，本实施例在此不做赘述。

本实施例中，目标检索网络基于问题向量，从目标向量检索库中获取问题向量对应的候选答案向量集，当有新的数据来源时，仅需通过目标检索网络得到该数据来源对应的向量，并将向量更新至目标向量检索库中即可，无需对目标检索网络进行重新训练，降低了训练成本。

图8是根据本公开第八实施例的示意图。

如图8所示，该问答处理方法可以包括：

步骤801、获取需要回答的问题数据。

步骤802、将问题数据输入目标问答模型中的目标检索网络进行向量转换，以生成问题数据对应的问题向量。

步骤803、目标检索网络基于问题向量与目标向量检索库中向量之间的相似度，获取问题向量对应的预设数量的候选答案向量。

步骤804、基于预设数量的候选答案向量，构成问题向量对应的候选答案向量集。

步骤805、将问题数据和/或问题向量，和候选答案向量集输入目标问答模型中的目标生成网络，以生成问题数据的目标答案。

其中，关于上述步骤801～步骤805的详细介绍可以参考上述实施例中的相关介绍，本实施例在此不做赘述。

本实施例中，可以通过问题向量与目标向量检索库中向量之间的相似度，获取问题向量对应的预设数量的候选答案向量，以使得预设数量的候选答案向量是与训练向量最相似的向量，从而使得后续利用候选答案向量集生成的目标答案更加准确，提高了目标答案的准确度。

图9是根据本公开第九实施例的示意图。

如图9所示，该问答处理方法可以包括：

步骤901、获取需要回答的问题数据。

步骤902、将问题数据输入目标问答模型中的目标检索网络，以生成问题数据对应的问题向量和候选答案向量集。

步骤903、确定问题数据中的模态类型。

步骤904、基于模态类型，将问题数据和/或问题向量，和候选答案向量集输入目标问答模型中的目标生成网络。

本公开实施例中，不同问题数据包括模态类型不同，以及不同模态类型对应输入至目标生成网络中的数据也不相同。

具体的，基于模态类型，将训练数据和/或训练向量，和候选答案向量集输入目标问答模型中的目标生成网络的方法可以包括以下步骤：

步骤9041、若问题数据只包括文本模态，将问题数据和候选答案向量集输入目标问答模型中的目标生成网络；

步骤9042、若问题数据包括文本模态和其他模态，将问题数据中文本模态对应的文本数据和其他模态对应的问题向量，和候选答案向量集输入目标问答模型中的目标生成网络；

步骤9043、若问题数据不包括文本模态，将问题向量和候选答案向量集输入目标问答模型中的目标生成网络。

本公开实施例中，基于模态类型，将问题数据和/或问题向量，和候选答案向量集输入目标生成网络，可以使得后续目标生成网络可以根据具体模态类型生成对应模态类型对应的预测答案，以使得问答模型可以生成多模态输入数据对应的答案，从而使得上述问答处理方法可以适用于多种数据源，适用范围较广。

步骤905、目标生成网络将候选答案向量集中的候选答案向量进行拼接，并基于拼接后的向量和问题数据和/或问题向量，以生成问题数据的目标答案。

其中，关于上述步骤901～步骤905的详细介绍可以参考上述实施例中的相关介绍，本实施例在此不做赘述。

本实施例中，目标生成网络可以根据训练向量和/或训练数据，拼接后的向量，得到问题数据的目标答案，使得目标答案不是从候选答案向量集中直接选择的候选答案，而是根据候选答案向量集中候选答案向量拼接后的向量生成的问题数据的目标答案，也即是问题数据的目标答案可能包括多个候选答案向量中的内容，从而使得后续目标生成网络生成答案更加准确。

图10是根据本公开第十实施例的示意图。

如图10所示，该问答模型的训练装置1000可以包括：获取模块1001、第一训练模块1002、输出模块1003、第二训练模块1004、构建模块1005，其中：

获取模块1001，用于获取训练数据集；

第一训练模块1002，用于利用训练数据集中的训练数据对预设问答模型中的预设检索网络进行训练，以得到目标检索网络；

输出模块1003，用于利用目标检索网络输出训练数据的候选答案向量集和训练向量；

第二训练模块1004，用于利用训练数据的候选答案向量集，训练向量和/或训练数据对预设问答模型中的预设生成网络进行训练，以得到目标生成网络；

构建模块1005，用于基于目标检索网络和目标生成网络，以得到目标问答模型。

其中，需要说明的是，前述对问答模型的训练方法实施例的解释说明也适用于本实施例，本实施例对此不再赘述。

本公开实施例的问答模型的训练装置，通过多种数据源对预设检索网络进行网络，得到目标检索网络，从而使得目标问答模型可以适用于多种数据源，适用范围较广，以及目标问答模型中的目标检索网络和目标生成网络均通过通用数据进行训练，也即是目标检索网络是将输入数据转换为对应的向量，目标生成网络是根据输入候选答案向量集，训练向量和/或训练数据生成训练数据的目标答案。基于此，目标检索网络和目标生成网络可以与行业数据解耦，均只需训练一次即可，无需重新训练，降低了模型训练成本。

在本公开的一个实施例中，训练数据集中包括多模态数据、无结构文本数据、有结构文本数据。

在本公开的一个实施例中，上述装置，还用于：

利用目标检索网络生成目标向量检索库，目标向量检索中包括数据源中所有数据对应的向量。

在本公开的一个实施例中，上述输出模块1003，具体用于：

将训练数据输入目标检索网络进行向量转换，以生成训练数据对应的训练向量；

目标检索网络基于训练向量，从目标向量检索库中获取训练向量对应的候选答案向量集。

在本公开的一个实施例中，上述输出模块1003，还用于：

所述目标检索网络基于所述训练向量与所述目标向量检索库中向量之间的相似度，获取所述训练向量对应的预设数量的候选答案向量；

基于所述预设数量的候选答案向量，构成所述训练向量对应的候选答案向量集。

在本公开的一个实施例中，上述第二训练模块1004，具体用于：

将训练数据的候选答案向量集，训练向量和/或训练数据输入至所预设生成网络中，以得到训练数据的预测答案；

基于训练数据的预测答案和训练数据的真实答案，得到对应的损失值；

基于损失值更新预设生成网络的参数，直至所述预设生成网络收敛，以得到目标生成网络。

在本公开的一个实施例中，上述第二训练模块1004，还用于：

确定训练数据中的模态类型；

基于模态类型，将训练数据和/或训练向量，和候选答案向量集输入预设生成网络；

预设生成网络将候选答案向量集中的候选答案向量进行拼接，并基于拼接后的向量和训练数据和/或训练向量，得到训练数据的预测答案。

在本公开的一个实施例中，上述第二训练模块1004，还用于：

若训练数据只包括文本模态，将训练数据和候选答案向量集输入预设生成网络；

若训练数据包括文本模态和其他模态，将训练数据中文本模态对应的文本数据和其他模态对应的训练向量，和候选答案向量集输入预设生成网络；

若训练数据不包括文本模态，将训练向量和候选答案向量集输入预设生成网络。

根据本公开的实施例，本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。

图11示出了可以用来实施本公开的实施例的示例电子设备1100的示意性框图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本公开的实现。

如图11所示，设备1100包括计算单元1101，其可以根据存储在只读存储器(ROM)1102中的计算机程序或者从存储单元1108加载到随机访问存储器(RAM)1103中的计算机程序，来执行各种适当的动作和处理。在RAM 1103中，还可存储设备1100操作所需的各种程序和数据。计算单元1101、ROM 1102以及RAM 1103通过总线1104彼此相连。输入/输出(I/O)接口1105也连接至总线1104。

设备1100中的多个部件连接至I/O接口1105，包括：输入单元1106，例如键盘、鼠标等；输出单元1107，例如各种类型的显示器、扬声器等；存储单元1108，例如磁盘、光盘等；以及通信单元1109，例如网卡、调制解调器、无线通信收发机等。通信单元1109允许设备1100通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。

计算单元1101可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元1101的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元1101执行上文所描述的各个方法和处理，例如方法XXX。例如，在一些实施例中，方法XXX可被实现为计算机软件程序，其被有形地包含于机器可读介质，例如存储单元1108。在一些实施例中，计算机程序的部分或者全部可以经由ROM 1102和/或通信单元1109而被载入和/或安装到设备1100上。当计算机程序加载到RAM1103并由计算单元1101执行时，可以执行上文描述的方法XXX的一个或多个步骤。备选地，在其他实施例中，计算单元1101可以通过其他任何适当的方式(例如，借助于固件)而被配置为执行方法XXX。

本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器，使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行，作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本公开的上下文中，机器可读介质可以是有形的介质，其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备，或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的显示装置(例如，CRT(阴极射线管)或者LCD(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(LAN)、广域网(WAN)、互联网和区块链网络。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器，又称为云计算服务器或云主机，是云计算服务体系中的一项主机产品，以解决了传统物理主机与VPS服务("Virtual Private Server"，或简称"VPS")中，存在的管理难度大，业务扩展性弱的缺陷。服务器也可以为分布式系统的服务器，或者是结合了区块链的服务器。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本公开公开的技术方案所期望的结果，本文在此不进行限制。

上述具体实施方式，并不构成对本公开保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等，均应包含在本公开保护范围之内。

Claims

1.一种问答模型的训练方法，所述方法包括：

获取训练数据集；

利用所述训练数据集中的训练数据对预设问答模型中的预设检索网络进行训练，以得到目标检索网络；

利用所述目标检索网络输出所述训练数据的候选答案向量集和训练向量；

利用所述训练数据的候选答案向量集，所述训练向量和/或所述训练数据对所述预设问答模型中的预设生成网络进行训练，以得到目标生成网络；

基于所述目标检索网络和所述目标生成网络，以得到目标问答模型；

利用所述目标检索网络生成目标向量检索库，所述目标向量检索库中包括数据源中所有数据对应的向量。

2.如权利要求1所述的方法，其中，所述训练数据集中包括无结构文本数据、有结构文本数据。

3.如权利要求1所述的方法，其中，所述利用所述目标检索网络输出训练数据的候选答案向量集和所述训练数据对应的训练向量，包括：

将所述训练数据输入所述目标检索网络进行向量转换，以生成所述训练数据对应的训练向量；

所述目标检索网络基于所述训练向量，从目标向量检索库中获取所述训练向量对应的候选答案向量集。

4.如权利要求3所述的方法，其中，所述所述目标检索网络基于所述训练向量，从目标向量检索库中获取所述训练向量对应的候选答案向量集，包括：

5.如权利要求1所述的方法，其中，所述利用所述训练数据的候选答案向量集，所述训练向量和/或所述训练数据对所述预设问答模型中的预设生成网络进行训练，以得到目标生成网络，包括：

将所述训练数据的候选答案向量集，所述训练向量和/或所述训练数据输入至所述预设问答模型中的预设生成网络，以得到所述训练数据的预测答案；

基于所述训练数据的预测答案和所述训练数据的真实答案，得到对应的损失值；

基于所述损失值更新所述预设生成网络的参数，直至所述预设生成网络收敛，以得到目标生成网络。

6.如权利要求5所述的方法，其中，所述将所述训练数据的候选答案向量集，所述训练向量和/或所述训练数据输入至所述预设生成网络中，以得到所述训练数据的预测答案，包括：

确定所述训练数据中的模态类型；

基于所述模态类型，将所述训练数据和/或所述训练向量，和所述候选答案向量集输入所述预设生成网络；

所述预设生成网络将所述候选答案向量集中的候选答案向量进行拼接，并基于拼接后的向量和所述训练数据和/或所述训练向量，以得到所述训练数据的预测答案。

7.如权利要求6所述的方法，其中，所述基于所述模态类型，将所述训练数据和/或所述训练向量，和所述候选答案向量集输入所述预设生成网络，包括：

若所述训练数据只包括文本模态，将所述训练数据和所述候选答案向量集输入所述预设生成网络；

若所述训练数据包括文本模态和其他模态，将所述训练数据中文本模态对应的文本数据和所述其他模态对应的训练向量，和所述候选答案向量集输入所述预设生成网络；

若所述训练数据不包括文本模态，将所述训练向量和所述候选答案向量集输入所述预设生成网络。

8.一种问答处理方法，所述方法包括：

获取需要回答的问题数据；

将所述问题数据输入目标问答模型中的目标检索网络，以生成所述问题数据对应的问题向量和候选答案向量集；

将所述问题数据和/或所述问题向量，和所述候选答案向量集输入所述目标问答模型中的目标生成网络，以生成所述问题数据的目标答案；

其中，所述目标问答模型还包括目标向量检索库，其中，所述将所述问题数据输入目标问答模型中的目标检索网络，以生成所述问题数据对应的问题向量和候选答案向量集，包括：

将所述问题数据输入目标问答模型中的目标检索网络进行向量转换，以生成所述问题数据对应的问题向量；

所述目标检索网络基于所述问题向量，从所述目标向量检索库中获取所述问题向量对应的候选答案向量集。

9.如权利要求8所述的方法，其中，所述问题数据为无结构文本数据、有结构文本数据中任意一种。

10.如权利要求8所述的方法，其中，所述目标检索网络基于所述问题向量，从所述目标向量检索库中获取所述问题向量对应的候选答案向量集，包括：

所述目标检索网络基于所述问题向量与所述目标向量检索库中向量之间的相似度，获取所述问题向量对应的预设数量的候选答案向量；

基于所述预设数量的候选答案向量，构成所述问题向量对应的候选答案向量集。

11.如权利要求8所述的方法，其中，所述将所述问题数据和/或所述问题向量，和所述候选答案向量集输入所述目标问答模型中的目标生成网络，以生成所述问题数据的目标答案，包括：

确定所述问题数据中的模态类型；

基于所述模态类型，将所述问题数据和/或所述问题向量，和所述候选答案向量集输入所述目标问答模型中的目标生成网络；

所述目标生成网络将所述候选答案向量集中的候选答案向量进行拼接，并基于拼接后的向量和所述问题数据和/或所述问题向量，以生成所述问题数据的目标答案。

12.如权利要求11所述的方法，其中，所述基于所述模态类型，将所述问题数据和/或所述问题向量，和所述候选答案向量集输入所述目标问答模型中的目标生成网络，包括：

若所述问题数据只包括文本模态，将所述问题数据和所述候选答案向量集输入所述目标问答模型中的目标生成网络；

若所述问题数据包括文本模态和其他模态，将所述问题数据中文本模态对应的文本数据和所述其他模态对应的问题向量，和所述候选答案向量集输入所述目标问答模型中的目标生成网络；

若所述问题数据不包括文本模态，将所述问题向量和所述候选答案向量集输入所述目标问答模型中的目标生成网络。

13.一种问答模型的训练装置，所述装置包括：

获取模块，用于获取训练数据集；

第一训练模块，用于利用所述训练数据集中的训练数据对预设问答模型中的预设检索网络进行训练，以得到目标检索网络；

输出模块，用于利用所述目标检索网络输出所述训练数据的候选答案向量集和训练向量；

第二训练模块，用于利用所述训练数据的候选答案向量集，所述训练向量和/或所述训练数据对所述预设问答模型中的预设生成网络进行训练，以得到目标生成网络；

构建模块，用于基于所述目标检索网络和所述目标生成网络，以得到目标问答模型；

14.如权利要求13所述的装置，其中，所述训练数据集中包括无结构文本数据、有结构文本数据。

15.如权利要求13所述的装置，其中，所述输出模块，具体用于：

16.如权利要求15所述的装置，其中，所述输出模块，还用于：

17.如权利要求13所述的装置，其中，所述第二训练模块，具体用于：

18.如权利要求17所述的装置，其中，所述第二训练模块，还用于：

确定所述训练数据中的模态类型；

所述预设生成网络将所述候选答案向量集中的候选答案向量进行拼接，并基于拼接后的向量和所述训练数据和/或所述训练向量，得到所述训练数据的预测答案。

19.如权利要求18所述的装置，其中，所述第二训练模块，还用于：

20.一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-12中任一项所述的方法。

21.一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行权利要求1-12中任一项所述的方法。