CN114416953A

CN114416953A - 问答处理方法、问答模型的训练方法和装置

Info

Publication number: CN114416953A
Application number: CN202210069222.3A
Authority: CN
Inventors: 姜文斌; 吕雅娟; 柴春光; 朱勇
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2022-01-20
Filing date: 2022-01-20
Publication date: 2022-04-29
Anticipated expiration: 2042-01-20
Also published as: JP2023031322A; CN114416953B; US20230153337A1; KR20230008685A

Abstract

本公开提供了一种问答处理方法、问答模型的训练方法、装置、设备、介质和产品，涉及人工智能技术领域，具体为自然语言处理、深度学习、知识图谱技术领域。问答处理方法包括：获取待处理数据，其中，待处理数据包括问题数据和候选答案；对待处理数据进行通用语义理解，得到通用数据特征；基于通用数据特征，从候选问答处理模式中选择目标问答处理模式；利用目标问答处理模式处理通用数据特征，得到候选答案中针对问题数据的目标答案。

Description

问答处理方法、问答模型的训练方法和装置

技术领域

本公开涉及人工智能技术领域，具体为自然语言处理、深度学习、知识图谱技术领域，更具体地，涉及一种问答处理方法、问答模型的训练方法、装置、电子设备、介质和程序产品。

背景技术

相关技术中，当用户提出问题时，通常需要从多个候选答案中确定针对问题的目标答案。例如，在医疗问答领域，针对用户提出的医疗问题，需要从多个候选答案中确定针对该医疗问题的目标答案。但是，相关技术从多个候选答案中选择目标答案的准确性较低，难以满足用户的需求。

发明内容

本公开提供了一种问答处理方法、问答模型的训练方法、装置、电子设备、存储介质和程序产品。

根据本公开的一方面，提供了一种问答处理方法，包括：获取待处理数据，其中，所述待处理数据包括问题数据和候选答案；对所述待处理数据进行通用语义理解，得到通用数据特征；基于所述通用数据特征，从候选问答处理模式中选择目标问答处理模式；利用所述目标问答处理模式处理所述通用数据特征，得到所述候选答案中针对所述问题数据的目标答案。

根据本公开的另一方面，提供了一种问答模型的训练方法，包括：获取样本数据，其中，所述样本数据包括问题数据、候选答案和样本标签，所述样本标签表征了所述候选答案与所述问题数据之间的关联；利用待训练问答模型中的通用理解网络，对所述样本数据进行通用语义理解，得到通用数据特征；针对所述待训练问答模型中的候选问答网络，基于所述通用数据特征，从所述候选问答网络中选择目标问答网络；利用所述目标问答网络处理所述通用数据特征，得到所述候选答案中针对所述问题数据的目标答案；基于所述目标答案和所述样本标签，调整所述待训练问答模型的模型参数。

根据本公开的另一方面，提供了一种问答处理装置，包括：获取模块、语义理解模块、选择模块和处理模块。获取模块，用于获取待处理数据，其中，所述待处理数据包括问题数据和候选答案；语义理解模块，用于对所述待处理数据进行通用语义理解，得到通用数据特征；选择模块，用于基于所述通用数据特征，从候选问答处理模式中选择目标问答处理模式；处理模块，用于利用所述目标问答处理模式处理所述通用数据特征，得到所述候选答案中针对所述问题数据的目标答案。

根据本公开的另一方面，提供了一种问答模型的训练装置，包括：获取模块、语义理解模块、选择模块、处理模块和调整模块。获取模块，用于获取样本数据，其中，所述样本数据包括问题数据、候选答案和样本标签，所述样本标签表征了所述候选答案与所述问题数据之间的关联；语义理解模块，用于利用待训练问答模型中的通用理解网络，对所述样本数据进行通用语义理解，得到通用数据特征；选择模块，用于针对所述待训练问答模型中的候选问答网络，基于所述通用数据特征，从所述候选问答网络中选择目标问答网络；处理模块，用于利用所述目标问答网络处理所述通用数据特征，得到所述候选答案中针对所述问题数据的目标答案；调整模块，用于基于所述目标答案和所述样本标签，调整所述待训练问答模型的模型参数。

根据本公开的另一方面，提供了一种电子设备，包括：至少一个处理器和与所述至少一个处理器通信连接的存储器。其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行上述的问答处理方法和/或问答模型的训练方法。

根据本公开的另一方面，提供了一种存储有计算机指令的非瞬时计算机可读存储介质，所述计算机指令用于使所述计算机执行上述的问答处理方法和/或问答模型的训练方法。

根据本公开的另一方面，提供了一种计算机程序产品，包括计算机程序序/指令，所述计算机程序序/指令被处理器执行时实现上述问答处理方法的步骤和/或问答模型的训练方法的步骤。

应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

附图说明

附图用于更好地理解本方案，不构成对本公开的限定。其中：

图1示意性示出了一种示例的问答处理的应用场景；

图2示意性示出了根据本公开一实施例的问答处理方法的流程图；

图3示意性示出了根据本公开一实施例的问答处理方法的原理图；

图4示意性示出了根据本公开另一实施例的问答处理方法的原理图；

图5示意性示出了根据本公开一实施例的问答模型的训练方法的流程图；

图6示意性示出了根据本公开一实施例的问答处理装置的框图；

图7示意性示出了根据本公开一实施例的问答模型的训练装置的框图；以及

图8是用来实现本公开实施例的用于执行问答处理和/或问答模型的训练的电子设备的框图。

具体实施方式

以下结合附图对本公开的示范性实施例做出说明，其中包括本公开实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本公开的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。

在此使用的术语仅仅是为了描述具体实施例，而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在，但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。

在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义，除非另外定义。应注意，这里使用的术语应解释为具有与本说明书的上下文相一致的含义，而不应以理想化或过于刻板的方式来解释。

在使用类似于“A、B和C等中至少一个”这样的表述的情况下，一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如，“具有A、B和C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。

图1示意性示出了一种示例的问答处理的应用场景。

如图1所示，本公开实施例的应用场景100例如包括待处理数据101和问答模型102。

示例性地，待处理数据101例如包括问题数据和多个候选答案A、B、C。

将待处理数据101输入问答模型102中进行处理，以从多个候选答案A、B、C中选择针对问题数据的目标答案103，例如目标答案103包括候选答案B。

问题数据例如包括医疗问题，问答模型102例如包括自然语言处理模型、分类模型等等。

示例性地，问答模型102可以使用正则化(Regularization)方法、组合式(Ensembling)方法、回顾式(Rehearsal)方法、双记忆(Dual-memory)方法、稀疏化(Sparse-coding)方法进行训练。

正则化方法在更新问答模型102的模型参数时增加限制，使得模型在学习新任务的时候不影响之前的学习成果。

组合式方法在模型学习新任务的时候增加新的模型，使得多个任务实质上还是对应多个模型。

回顾式方法在模型学习新任务的同时混合原来任务的数据，让模型学习新任务时兼顾旧任务。

双记忆方法参考人类记忆机制设置长时记忆机制和短时记忆机制，通过两者之间的配合实现新旧知识之间的协调。

稀疏化方法通过让模型参数变得稀疏使得每次知识学习只影响少数神经元，从而减少新知识对旧知识的干扰。

本公开实施例的问答处理方法和问答模型参考了组合式方法和稀疏式方法。组合式方法通过引入多个模型网络以显式地增加模型的参数空间，在不同参数空间进行合理调配来实现持续学习。稀疏式方法通过稀疏化地激活不同参数空间以隐式地增加已有参数空间的潜力，从而降低新知识对旧知识的影响来实现持续学习。

本公开的实施例提出了一种优化的问答处理方法和问答模型的训练方法。下面参考图2～图5来描述根据本公开示例性实施方式的问答处理方法和问答模型的训练方法。

图2示意性示出了根据本公开一实施例的问答处理方法的流程图。

如图2所示，本公开实施例的问答处理方法200例如可以包括操作S210～操作S240。

在操作S210，获取待处理数据，待处理数据包括问题数据和候选答案。

在操作S220，对待处理数据进行通用语义理解，得到通用数据特征。

在操作S230，基于通用数据特征，从候选问答处理模式中选择目标问答处理模式。

在操作S240，利用目标问答处理模式处理通用数据特征，得到候选答案中针对问题数据的目标答案。

示例性地，待处理数据中例如包括问题数据和多个候选答案，多个候选答案中的每个候选答案与问题数据的匹配程度不同，因此需要从多个候选答案中选择与问题数据最匹配的候选答案，作为针对问题数据的目标答案。

例如，首先对待处理数据进行通用语义理解，得到通用数据特征，然后再基于通用数据特征从候选问答处理模式中选择目标问答处理模式，并利用目标问答处理模式处理通用特征数据，以从多个候选答案中选择针对问题数据的目标答案。

在一示例中，可以通过经训练的问答模型来处理待处理数据以得到目标答案。经训练的问答模型例如包括深度学习模型。例如，经训练的问答模型包括多个网络，多个网络包括通用理解网络和多个候选问答网络，候选问答网络例如包括分类网络，候选问答网络即为候选问答处理模式。

通过通用理解网络对待处理数据进行通用语义理解，得到通用数据特征，通用数据特征至少包括针对问题数据的特征和针对候选答案的特征。从候选问答网络中选择目标问答网络之后，利用目标问答网络对问题数据的特征和候选答案的特征进行处理，实现对多个候选答案进行分类，并基于分类结果从多个候选答案中选择与问题数据最匹配的目标答案。

根据本公开的实施例，首先进行通用语义理解得到待处理数据的通用数据特征，再基于通用数据特征从多个候选问答处理模式中选择合适的目标问答处理模式，利用目标问答处理模式处理通用数据特征得到目标答案，从而提高目标答案的准确性，提高问答效果。

图3示意性示出了根据本公开一实施例的问答处理方法的原理图。

如图3所示，待处理数据例如包括问题数据和多个候选答案A、B、C，利用通用理解模式310对待处理数据进行通用语义理解，得到通用数据特征。

示例性地，针对多个候选问答处理模式331、332、333，每个候选问答处理模式例如包括模式标签。

选择机制320基于通用数据特征与模式标签之间的相似度，从多个候选问答处理模式331、332、333中选择目标问答处理模式。

例如，通用数据特征表征了问题数据的领域信息，模式标签表征了候选问答处理模式所针对的领域。当问题数据是针对某一领域时，所选择的目标问答处理模式善于处理该领域的问题。

当问题数据是针对某一医疗领域的问题时，不同的候选问答处理模式例如善于处理不同医疗领域的问题，因此可以基于模式标签确定出善于处理问题数据所属领域的目标问答处理模式。

例如，以一个候选问答处理模式包括候选问答网络为例，利用某一个医疗领域的样本数据(样本数据包括问题和答案)来训练该候选问答网络，使得该候选问答网络善于处理该医疗领域的医疗问答数据。

例如，通用数据特征与多个候选问答处理模式331、332、333的模式标签之间的相似度分别为0.2、0.8、0.7。选择相似度高的一个或多个候选问答处理模式作为目标问答处理模式。

在确定目标问答处理模式的数目时，可以基于计算资源确定需要选择的目标问答处理模式的数目。然后，基于数目和通用数据特征，从多个候选问答处理模式中选择该数目个目标问答处理模式。

例如，当计算资源充足时，可以选择多个目标问答处理模式，当计算资源不足时，可以选择少量个(例如一个)目标问答处理模式。例如，当数目为2时，选择相似度最高的两个候选问答处理模式作为目标问答处理模式，即，目标问答处理模式包括候选问答处理模式332和候选问答处理模式332。

在确定多个目标问答处理模式之后，分别利用多个目标问答处理模式处理通用数据特征，得到与多个目标问答处理模式一一对应的多个目标答案。

例如，与第一个目标问答处理模式(候选问答处理模式332)对应的目标答案为候选答案A，第一个目标问答处理模式(候选问答处理模式332)还可以输出目标答案的概率0.7。与第二个目标问答处理模式(候选问答处理模式333)对应的目标答案为候选答案B，第二个目标问答处理模式(候选问答处理模式332)还可以输出目标答案的概率0.9。

针对每个目标问答处理模式，基于相似度确定针对每个目标问答处理模式的目标答案的权重，例如针对目标问答处理模式(候选问答处理模式332)的权重为0.8，针对目标问答处理模式(候选问答处理模式333)的权重为0.7。

基于权重，从多个目标答案中选择针对问题数据的目标答案。例如，将权重乘以概率得到计算结果，将数值高的计算结果对应的目标答案作为最终的目标答案。例如候选答案A的计算结果为0.56，候选答案B的计算结果为0.63，因此将候选答案B作为针对问题数据的目标答案。

在另一示例中，目标问答处理模式也可以只输出目标答案，并将相似度高的目标问答处理模式对应的目标答案作为最终的目标答案。

根据本公开的实施例，基于通用特征数据和候选问答处理模式的模式标签之间的相似度来确定目标问答处理模式，使得所确定的目标问答处理模式在基于问题数据得到目标答案时准确性更高。

另外，基于计算资源来确定目标问答处理模式的数目，提高了数据处理的灵活性，并且在计算资源充足的情况下，可以利用更多的目标问答处理模式来得到目标答案，提高了目标答案的准确性。

另外，基于相似度确定目标答案的权重，基于权重来选择最终的目标答案，综合考虑目标候选处理模式的专业度和处理精度，使得目标答案的准确性更高。

图4示意性示出了根据本公开另一实施例的问答处理方法的原理图。

如图4所示，在如上实施例的基础上，本公开的实施例还引入了第一知识数据440和第二知识数据450。

例如，当通过通用理解模式对待处理数据进行通用语义理解得到通用数据特征的过程中，可以获取第一知识数据440，并基于第一知识数据440对待处理数据进行通用语义理解，得到问题特征、候选答案特征以及第一关联信息，第一关联信息例如指示了问题数据和候选答案之间的关联。将问题特征、候选答案特征以及第一关联特征，确定为通用数据特征。

第一知识数据440例如包括常识数据或专业数据，第一知识数据440在一定程度上包含了问题数据和候选答案之间的联系。专业数据例如为医疗领域的数据。

在另一示例中，待处理数据还可以包括针对问题数据的描述信息，此时通用数据特征还包括针对描述信息的描述特征。例如，当问题数据是关于疾病问题时，描述信息可以包括疾病的症状。

可以理解，待处理数据包括描述信息，使得待处理数据中包括更加丰富的信息，提高问答效果。

在确定目标问答处理模式之后，可以获取第二知识数据450，并利用目标问答处理模式基于第二知识数据450处理通用数据特征，得到问题数据和候选答案之间的第二关联信息，即，第二关联信息例如指示了问题数据和候选答案之间的关联。然后，基于第二关联信息从候选答案中确定针对问题数据的目标答案。

第二知识数据450例如包括常识数据或专业数据，第二知识数据450在一定程度上包括问题数据和候选答案之间的联系。第二知识数据450和第一知识数据440可以相同也可以不同。第二知识数据450和第一知识数据440可以包括知识图谱数据。

根据本公开的实施例，在利用通用理解模式或目标问答处理模式进行数据处理时，参考知识数据的方式提高了处理结果的准确性。

为了便于理解，结合上文的原理图，给出一个具体的示例，应当理解，该示例不应对本公开造成任何限定。

例如，问题数据例如“具有某健康问题应该如何解决”，描述信息表示了该健康问题对应的各种症状，候选答案例如包括多种解决方式，例如，具有健康问题包括患有某疾病，解决方式包括针对该疾病的药物或缓和方式。示例性地，问题数据包括10个词语、描述信息包括100个词语、候选答案包括10个词语，总共120个词语。

通用理解模式例如具有自然语言处理功能，利用通用理解模式处理120个词语得到通用数据特征，通用数据特征例如包括120个向量。在一种方式中，可以参考第一知识数据来生成120个向量，使得生成的120个向量基于知识内容关联。例如，当问题数据中包括“感冒”词语、候选答案中包括“喝水”词语时，如果第一知识数据中具有“喝水可以缓解感冒症状”的知识，基于该知识生成的“感冒”向量和“喝水”向量具有一定关联性(具有关联例如包括向量比较相似)。

接下来，可以对通用理解模式得到的120个向量进行处理(例如平均处理)得到目标向量。针对每个候选问答处理模式，每个候选问答处理模式例如具有一个模式标签，用于表征候选问答处理模式所针对的领域，模式标签可以是向量。选择机制可以将目标向量和每个模式标签进行匹配，以激活相似度最高的一个或多个候选问答处理模式作为目标问答处理模式。

然后，将120个向量分别输入每个被激活的目标问答处理模式，每个被激活的目标问答处理模式输出目标答案。如果被激活的目标问答处理模式包括多个，将每个目标问答处理模式对应的相似度作为权重，对输出的目标答案进行加权，以便确定最终的目标答案。

示例性地，每个被激活的目标问答处理模式包括分类模型，分类模型基于120个向量进行分类得到分类结果，分类结果例如表征了10个候选答案中每个候选答案用于答复问题的概率。在一种情况下，在利用分类模型进行分类的过程中，也可以参考第二知识数据进行分类，以提高分类准确性。

图5示意性示出了根据本公开一实施例的问答模型的训练方法的流程图。

如图5所示，本公开实施例的问答模型的训练方法500例如可以包括操作S510～操作S560。

在操作S510，获取样本数据，样本数据包括问题数据、候选答案和样本标签，样本标签表征了候选答案与问题数据之间的关联。

在操作S520，利用待训练问答模型中的通用理解网络，对样本数据进行通用语义理解，得到通用数据特征。

在操作S530，针对待训练问答模型中的候选问答网络，基于通用数据特征，从候选问答网络中选择目标问答网络。

在操作S540，利用目标问答网络处理通用数据特征，得到候选答案中针对问题数据的目标答案。

在操作S550，基于目标答案和样本标签，调整待训练问答模型的模型参数。

本公开实施例的通用理解网络例如与上文提及的通用理解模式相同或类似，候选问答网络例如与上文提及的候选问答处理模式相同或类似，目标问答网络例如与上文提及的目标问答处理模式相同或类似。

示例性地，可以使用多个样本数据来训练问答模型。每个样本数据具有样本标签，样本标签表征了候选答案与问题数据之间的关联。例如，当样本数据包括一个问题数据和多个候选答案A、B、C时，样本标签例如表征候选答案B为针对问题数据的最佳答案。

在通过目标问答网络处理通用数据特征得到候选答案中针对问题数据的目标答案之后，将目标答案与样本标签进行比较，得到损失值，基于损失值反向调整待训练问答模型的模型参数，从而训练得到问答模型。模型参数包括通用理解网络的参数和候选问答网络的参数。

根据本公开的实施例，首先利用通用理解网络进行通用语义理解得到待处理数据的通用数据特征之后，再基于通用数据特征从多个候选问答网络中选择合适的目标问答网络，利用目标问答网络处理通用数据特征得到目标答案，基于目标答案和样本标签来调整模型参数，提高了问答模型的准确性，进而提高问答效果。

在一示例中，候选问答网络包括网络标签，可以基于通用数据特征与网络标签之间的相似度，从候选问答网络中选择目标问答网络，通用数据特征表征了问题数据的领域信息，网络标签表征了候选问答网络所针对的领域。其中，网络标签例如与上文提及的模式标签相同或类似。

在一示例中，目标问答网络包括多个目标问答网络。分别利用多个目标问答网络处理通用数据特征，得到与多个目标问答网络一一对应的多个目标答案。针对每个目标问答网络，基于相似度确定针对每个目标问答网络的目标答案的权重，然后，基于权重从多个目标答案中选择针对问题数据的目标答案。

在一示例中，候选问答网络包括多个候选问答网络，可以基于计算资源，确定需要选择的目标问答网络的数目。然后，基于数目和通用数据特征，从多个候选问答网络中选择数目个目标问答网络。

在一示例中，利用待训练问答模型中的通用理解网络，对样本数据进行通用语义理解，得到通用数据特征包括：获取第一知识数据，基于第一知识数据，对样本数据进行通用语义理解，得到问题特征、候选答案特征以及第一关联信息，第一关联信息指示了问题数据和候选答案之间的关联。然后，将问题特征、候选答案特征以及第一关联特征，确定为通用数据特征。

示例性地，样本数据还包括针对问题数据的描述信息，通用数据特征还包括针对描述信息的描述特征。

在一示例中，利用目标问答网络处理通用数据特征，得到候选答案中针对问题数据的目标答案包括：获取第二知识数据；

利用目标问答网络基于第二知识数据，处理通用数据特征，得到问题数据和候选答案之间的第二关联信息。然后，基于第二关联信息，从候选答案中确定针对问题数据的目标答案。

本公开实施例的问答模型参考了组合式方法和稀疏式方法。组合式方法通过引入多个模型网络以显式地增加模型的参数空间，在不同参数空间进行合理调配来实现持续学习，例如本公开实施例引入了多个候选问答网络。稀疏式方法通过稀疏化地激活不同参数空间以隐式地增加已有参数空间的潜力，从而降低新知识对旧知识的影响来实现持续学习，例如本公开实施例的多个候选问答网络可以是相同的模型结构，在训练不同的候选问答网络时，可以调整模型中的不同参数。

本公开实施例针对与领域场景无关的通用语义理解部分采用共享的通用理解网络，针对与领域场景相关的推理决策部分采用多个候选问答网络，在控制模型参数规模的前提下进行更高效的参数空间扩充和调配。换言之，引入多个候选问答网络，既能够有效控制模型参数规模，又能够根据选择机制进行更高效的候选问答网络调配，从而在有效控制模型参数规模的前提下实现更好的训练效果。

图6示意性示出了根据本公开一实施例的问答处理装置的框图。

如图6所示，本公开实施例的问答处理装置600例如包括获取模块610、语义理解模块620、选择模块630和处理模块640。

获取模块610可以用于获取待处理数据，其中，待处理数据包括问题数据和候选答案。根据本公开实施例，获取模块610例如可以执行上文参考图2描述的操作S210，在此不再赘述。

语义理解模块620可以用于对待处理数据进行通用语义理解，得到通用数据特征。根据本公开实施例，语义理解模块620例如可以执行上文参考图2描述的操作S220，在此不再赘述。

选择模块630可以用于基于通用数据特征，从候选问答处理模式中选择目标问答处理模式。根据本公开实施例，选择模块630例如可以执行上文参考图2描述的操作S230，在此不再赘述。

处理模块640可以用于利用目标问答处理模式处理通用数据特征，得到候选答案中针对问题数据的目标答案。根据本公开实施例，处理模块640例如可以执行上文参考图2描述的操作S240，在此不再赘述。

根据本公开实施例，候选问答处理模式包括模式标签；选择模块630还用于：基于通用数据特征与模式标签之间的相似度，从候选问答处理模式中选择目标问答处理模式，其中，通用数据特征表征了问题数据的领域信息，模式标签表征了候选问答处理模式所针对的领域。

根据本公开实施例，目标问答处理模式包括多个目标问答处理模式；处理模块640包括：第一处理子模块、第一确定子模块和第一选择子模块。第一处理子模块，用于分别利用多个目标问答处理模式处理通用数据特征，得到与多个目标问答处理模式一一对应的多个目标答案；第一确定子模块，用于针对每个目标问答处理模式，基于相似度，确定针对每个目标问答处理模式的目标答案的权重；第一选择子模块，用于基于权重，从多个目标答案中选择针对问题数据的目标答案。

根据本公开实施例，候选问答处理模式包括多个候选问答处理模式；选择模块630包括：第二确定子模块和第二选择子模块。第二确定子模块，用于基于计算资源，确定需要选择的目标问答处理模式的数目；第二选择子模块，用于基于数目和通用数据特征，从多个候选问答处理模式中选择数目个目标问答处理模式。

根据本公开实施例，语义理解模块620包括：第一获取子模块、语义理解子模块和第三确定子模块。第一获取子模块，用于获取第一知识数据；语义理解子模块，用于基于第一知识数据，对待处理数据进行通用语义理解，得到问题特征、候选答案特征以及第一关联信息，其中，第一关联信息指示了问题数据和候选答案之间的关联；第三确定子模块，用于将问题特征、候选答案特征以及第一关联特征，确定为通用数据特征。

根据本公开实施例，处理模块640包括：第二获取子模块、第二处理子模块和第四确定子模块。第二获取子模块，用于获取第二知识数据；第二处理子模块，用于利用目标问答处理模式基于第二知识数据，处理通用数据特征，得到问题数据和候选答案之间的第二关联信息；第四确定子模块，用于基于第二关联信息，从候选答案中确定针对问题数据的目标答案。

根据本公开实施例，待处理数据还包括针对问题数据的描述信息；通用数据特征还包括针对描述信息的描述特征。

图7示意性示出了根据本公开一实施例的问答模型的训练装置的框图。

如图7所示，本公开实施例的问答模型的训练装置700例如包括获取模块710、语义理解模块720、选择模块730、处理模块740和调整模块750。

获取模块710可以用于获取样本数据，其中，样本数据包括问题数据、候选答案和样本标签，样本标签表征了候选答案与问题数据之间的关联。根据本公开实施例，获取模块710例如可以执行上文参考图5描述的操作S510，在此不再赘述。

语义理解模块720可以用于利用待训练问答模型中的通用理解网络，对样本数据进行通用语义理解，得到通用数据特征。根据本公开实施例，语义理解模块720例如可以执行上文参考图5描述的操作S520，在此不再赘述。

选择模块730可以用于针对待训练问答模型中的候选问答网络，基于通用数据特征，从候选问答网络中选择目标问答网络。根据本公开实施例，选择模块730例如可以执行上文参考图5描述的操作S530，在此不再赘述。

处理模块740可以用于利用目标问答网络处理通用数据特征，得到候选答案中针对问题数据的目标答案。根据本公开实施例，处理模块740例如可以执行上文参考图5描述的操作S540，在此不再赘述。

调整模块750可以用于基于目标答案和样本标签，调整待训练问答模型的模型参数。根据本公开实施例，调整模块750例如可以执行上文参考图5描述的操作S550，在此不再赘述。

根据本公开实施例，候选问答网络包括网络标签；选择模块730还用于：基于通用数据特征与网络标签之间的相似度，从候选问答网络中选择目标问答网络，其中，通用数据特征表征了问题数据的领域信息，网络标签表征了候选问答网络所针对的领域。

根据本公开实施例，目标问答网络包括多个目标问答网络；处理模块740包括：第一处理子模块、第一确定子模块和第一选择子模块。第一处理子模块，用于分别利用多个目标问答网络处理通用数据特征，得到与多个目标问答网络一一对应的多个目标答案；第一确定子模块，用于针对每个目标问答网络，基于相似度，确定针对每个目标问答网络的目标答案的权重；第一选择子模块，用于基于权重，从多个目标答案中选择针对问题数据的目标答案。

根据本公开实施例，候选问答网络包括多个候选问答网络；选择模块730包括：第二确定子模块和第二选择子模块。第二确定子模块，用于基于计算资源，确定需要选择的目标问答网络的数目；第二选择子模块，用于基于数目和通用数据特征，从多个候选问答网络中选择数目个目标问答网络。

根据本公开实施例，语义理解模块720包括：第一获取子模块、语义理解子模块和第三确定子模块。第一获取子模块，用于获取第一知识数据；语义理解子模块，用于基于第一知识数据，对样本数据进行通用语义理解，得到问题特征、候选答案特征以及第一关联信息，其中，第一关联信息指示了问题数据和候选答案之间的关联；第三确定子模块，用于将问题特征、候选答案特征以及第一关联特征，确定为通用数据特征。

根据本公开实施例，处理模块740包括：第二获取子模块、第二处理子模块和第四确定子模块。第二获取子模块，用于获取第二知识数据；第二处理子模块，用于利用目标问答网络基于第二知识数据，处理通用数据特征，得到问题数据和候选答案之间的第二关联信息；第四确定子模块，用于基于第二关联信息，从候选答案中确定针对问题数据的目标答案。

根据本公开实施例，样本数据还包括针对问题数据的描述信息；通用数据特征还包括针对描述信息的描述特征。

本公开的技术方案中，所涉及的用户个人信息的收集、存储、使用、加工、传输、提供和公开等处理，均符合相关法律法规的规定，且不违背公序良俗。

根据本公开的实施例，本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。

图8示出了可以用来实施本公开实施例的示例电子设备800的示意性框图。电子设备800旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本公开的实现。

如图8所示，设备800包括计算单元801，其可以根据存储在只读存储器(ROM)802中的计算机程序或者从存储单元808加载到随机访问存储器(RAM)803中的计算机程序，来执行各种适当的动作和处理。在RAM 803中，还可存储设备800操作所需的各种程序和数据。计算单元801、ROM 802以及RAM 803通过总线804彼此相连。输入/输出(I/O)接口805也连接至总线804。

设备800中的多个部件连接至I/O接口805，包括：输入单元806，例如键盘、鼠标等；输出单元807，例如各种类型的显示器、扬声器等；存储单元808，例如磁盘、光盘等；以及通信单元809，例如网卡、调制解调器、无线通信收发机等。通信单元809允许设备800通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。

计算单元801可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元801的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元801执行上文所描述的各个方法和处理，例如问答处理方法和/或问答模型的训练方法。例如，在一些实施例中，问答处理方法和/或问答模型的训练方法可被实现为计算机软件程序，其被有形地包含于机器可读介质，例如存储单元808。在一些实施例中，计算机程序的部分或者全部可以经由ROM 802和/或通信单元809而被载入和/或安装到设备800上。当计算机程序加载到RAM 803并由计算单元801执行时，可以执行上文描述的问答处理方法和/或问答模型的训练方法的一个或多个步骤。备选地，在其他实施例中，计算单元801可以通过其他任何适当的方式(例如，借助于固件)而被配置为执行问答处理方法和/或问答模型的训练方法。

本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、复杂可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程问答处理装置和/或问答模型的训练装置的处理器或控制器，使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行，作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本公开的上下文中，机器可读介质可以是有形的介质，其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备，或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的问答处理装置和/或问答模型的训练装置(例如，CRT(阴极射线管)或者LCD(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(LAN)、广域网(WAN)和互联网。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器，也可以为分布式系统的服务器，或者是结合了区块链的服务器。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本公开公开的技术方案所期望的结果，本文在此不进行限制。

上述具体实施方式，并不构成对本公开保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等，均应包含在本公开保护范围之内。

Claims

1.一种问答处理方法，包括：

获取待处理数据，其中，所述待处理数据包括问题数据和候选答案；

对所述待处理数据进行通用语义理解，得到通用数据特征；

基于所述通用数据特征，从候选问答处理模式中选择目标问答处理模式；以及

利用所述目标问答处理模式处理所述通用数据特征，得到所述候选答案中针对所述问题数据的目标答案。

2.根据权利要求1所述的方法，其中，所述候选问答处理模式包括模式标签；所述基于所述通用数据特征，从候选问答处理模式中选择目标问答处理模式包括：

基于所述通用数据特征与所述模式标签之间的相似度，从所述候选问答处理模式中选择所述目标问答处理模式，

其中，所述通用数据特征表征了所述问题数据的领域信息，所述模式标签表征了所述候选问答处理模式所针对的领域。

3.根据权利要求2所述的方法，其中，所述目标问答处理模式包括多个目标问答处理模式；所述利用所述目标问答处理模式处理所述通用数据特征，得到所述候选答案中针对所述问题数据的目标答案包括：

分别利用所述多个目标问答处理模式处理所述通用数据特征，得到与所述多个目标问答处理模式一一对应的多个目标答案；

针对每个目标问答处理模式，基于所述相似度，确定针对每个目标问答处理模式的目标答案的权重；以及

基于所述权重，从所述多个目标答案中选择针对所述问题数据的目标答案。

4.根据权利要求1所述的方法，其中，所述候选问答处理模式包括多个候选问答处理模式；所述基于所述通用数据特征，从候选问答处理模式中选择目标问答处理模式包括：

基于计算资源，确定需要选择的目标问答处理模式的数目；以及

基于所述数目和所述通用数据特征，从所述多个候选问答处理模式中选择所述数目个所述目标问答处理模式。

5.根据权利要求1所述的方法，其中，所述对所述待处理数据进行通用语义理解，得到通用数据特征包括：

获取第一知识数据；

基于所述第一知识数据，对所述待处理数据进行通用语义理解，得到问题特征、候选答案特征以及第一关联信息，其中，所述第一关联信息指示了所述问题数据和所述候选答案之间的关联；以及

将所述问题特征、所述候选答案特征以及所述第一关联特征，确定为所述通用数据特征。

6.根据权利要求1或5所述的方法，其中，所述利用所述目标问答处理模式处理所述通用数据特征，得到所述候选答案中针对所述问题数据的目标答案包括：

获取第二知识数据；

利用所述目标问答处理模式基于所述第二知识数据，处理所述通用数据特征，得到所述问题数据和所述候选答案之间的第二关联信息；以及

基于所述第二关联信息，从所述候选答案中确定针对所述问题数据的目标答案。

7.根据权利要求5所述的方法，其中，所述待处理数据还包括针对所述问题数据的描述信息；所述通用数据特征还包括针对所述描述信息的描述特征。

8.一种问答模型的训练方法，包括：

获取样本数据，其中，所述样本数据包括问题数据、候选答案和样本标签，所述样本标签表征了所述候选答案与所述问题数据之间的关联；

利用待训练问答模型中的通用理解网络，对所述样本数据进行通用语义理解，得到通用数据特征；

针对所述待训练问答模型中的候选问答网络，基于所述通用数据特征，从所述候选问答网络中选择目标问答网络；

利用所述目标问答网络处理所述通用数据特征，得到所述候选答案中针对所述问题数据的目标答案；以及

基于所述目标答案和所述样本标签，调整所述待训练问答模型的模型参数。

9.根据权利要求8所述的方法，其中，所述候选问答网络包括网络标签；所述基于所述通用数据特征，从所述候选问答网络中选择目标问答网络包括：

基于所述通用数据特征与所述网络标签之间的相似度，从所述候选问答网络中选择所述目标问答网络，

其中，所述通用数据特征表征了所述问题数据的领域信息，所述网络标签表征了所述候选问答网络所针对的领域。

10.根据权利要求9所述的方法，其中，所述目标问答网络包括多个目标问答网络；所述利用所述目标问答网络处理所述通用数据特征，得到所述候选答案中针对所述问题数据的目标答案包括：

分别利用所述多个目标问答网络处理所述通用数据特征，得到与所述多个目标问答网络一一对应的多个目标答案；

针对每个目标问答网络，基于所述相似度，确定针对每个目标问答网络的目标答案的权重；以及

11.根据权利要求8所述的方法，其中，所述候选问答网络包括多个候选问答网络；所述基于所述通用数据特征，从所述候选问答网络中选择目标问答网络包括：

基于计算资源，确定需要选择的目标问答网络的数目；以及

基于所述数目和所述通用数据特征，从所述多个候选问答网络中选择所述数目个所述目标问答网络。

12.根据权利要求8所述的方法，其中，所述利用待训练问答模型中的通用理解网络，对所述样本数据进行通用语义理解，得到通用数据特征包括：

获取第一知识数据；

基于所述第一知识数据，对所述样本数据进行通用语义理解，得到问题特征、候选答案特征以及第一关联信息，其中，所述第一关联信息指示了所述问题数据和所述候选答案之间的关联；以及

13.根据权利要求8或12所述的方法，其中，所述利用所述目标问答网络处理所述通用数据特征，得到所述候选答案中针对所述问题数据的目标答案包括：

获取第二知识数据；

利用所述目标问答网络基于所述第二知识数据，处理所述通用数据特征，得到所述问题数据和所述候选答案之间的第二关联信息；以及

14.根据权利要求12所述的方法，其中，所述样本数据还包括针对所述问题数据的描述信息；所述通用数据特征还包括针对所述描述信息的描述特征。

15.一种问答处理装置，包括：

获取模块，用于获取待处理数据，其中，所述待处理数据包括问题数据和候选答案；

语义理解模块，用于对所述待处理数据进行通用语义理解，得到通用数据特征；

选择模块，用于基于所述通用数据特征，从候选问答处理模式中选择目标问答处理模式；以及

处理模块，用于利用所述目标问答处理模式处理所述通用数据特征，得到所述候选答案中针对所述问题数据的目标答案。

16.根据权利要求15所述的装置，其中，所述候选问答处理模式包括模式标签；所述选择模块还用于：

17.根据权利要求16所述的装置，其中，所述目标问答处理模式包括多个目标问答处理模式；所述处理模块包括：

第一处理子模块，用于分别利用所述多个目标问答处理模式处理所述通用数据特征，得到与所述多个目标问答处理模式一一对应的多个目标答案；

第一确定子模块，用于针对每个目标问答处理模式，基于所述相似度，确定针对每个目标问答处理模式的目标答案的权重；以及

第一选择子模块，用于基于所述权重，从所述多个目标答案中选择针对所述问题数据的目标答案。

18.根据权利要求15所述的装置，其中，所述候选问答处理模式包括多个候选问答处理模式；所述选择模块包括：

第二确定子模块，用于基于计算资源，确定需要选择的目标问答处理模式的数目；以及

第二选择子模块，用于基于所述数目和所述通用数据特征，从所述多个候选问答处理模式中选择所述数目个所述目标问答处理模式。

19.根据权利要求15所述的装置，其中，所述语义理解模块包括：

第一获取子模块，用于获取第一知识数据；

语义理解子模块，用于基于所述第一知识数据，对所述待处理数据进行通用语义理解，得到问题特征、候选答案特征以及第一关联信息，其中，所述第一关联信息指示了所述问题数据和所述候选答案之间的关联；以及

第三确定子模块，用于将所述问题特征、所述候选答案特征以及所述第一关联特征，确定为所述通用数据特征。

20.根据权利要求15或19所述的装置，其中，所述处理模块包括：

第二获取子模块，用于获取第二知识数据；

第二处理子模块，用于利用所述目标问答处理模式基于所述第二知识数据，处理所述通用数据特征，得到所述问题数据和所述候选答案之间的第二关联信息；以及

第四确定子模块，用于基于所述第二关联信息，从所述候选答案中确定针对所述问题数据的目标答案。

21.根据权利要求19所述的装置，其中，所述待处理数据还包括针对所述问题数据的描述信息；所述通用数据特征还包括针对所述描述信息的描述特征。

22.一种问答模型的训练装置，包括：

获取模块，用于获取样本数据，其中，所述样本数据包括问题数据、候选答案和样本标签，所述样本标签表征了所述候选答案与所述问题数据之间的关联；

语义理解模块，用于利用待训练问答模型中的通用理解网络，对所述样本数据进行通用语义理解，得到通用数据特征；

选择模块，用于针对所述待训练问答模型中的候选问答网络，基于所述通用数据特征，从所述候选问答网络中选择目标问答网络；

处理模块，用于利用所述目标问答网络处理所述通用数据特征，得到所述候选答案中针对所述问题数据的目标答案；以及

调整模块，用于基于所述目标答案和所述样本标签，调整所述待训练问答模型的模型参数。

23.根据权利要求22所述的装置，其中，所述候选问答网络包括网络标签；所述选择模块还用于：

24.根据权利要求23所述的装置，其中，所述目标问答网络包括多个目标问答网络；所述处理模块包括：

第一处理子模块，用于分别利用所述多个目标问答网络处理所述通用数据特征，得到与所述多个目标问答网络一一对应的多个目标答案；

第一确定子模块，用于针对每个目标问答网络，基于所述相似度，确定针对每个目标问答网络的目标答案的权重；以及

25.根据权利要求22所述的装置，其中，所述候选问答网络包括多个候选问答网络；所述选择模块包括：

第二确定子模块，用于基于计算资源，确定需要选择的目标问答网络的数目；以及

第二选择子模块，用于基于所述数目和所述通用数据特征，从所述多个候选问答网络中选择所述数目个所述目标问答网络。

26.根据权利要求22所述的装置，其中，所述语义理解模块包括：

第一获取子模块，用于获取第一知识数据；

语义理解子模块，用于基于所述第一知识数据，对所述样本数据进行通用语义理解，得到问题特征、候选答案特征以及第一关联信息，其中，所述第一关联信息指示了所述问题数据和所述候选答案之间的关联；以及

27.根据权利要求22或26所述的装置，其中，所述处理模块包括：

第二获取子模块，用于获取第二知识数据；

第二处理子模块，用于利用所述目标问答网络基于所述第二知识数据，处理所述通用数据特征，得到所述问题数据和所述候选答案之间的第二关联信息；以及

28.根据权利要求26所述的装置，其中，所述样本数据还包括针对所述问题数据的描述信息；所述通用数据特征还包括针对所述描述信息的描述特征。

29.一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-14中任一项所述的方法。

30.一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行权利要求1-14中任一项所述的方法。

31.一种计算机程序产品，包括计算机程序/指令，其特征在于，所述计算机程序/指令被处理器执行时实现根据权利要求1-14中任一项所述方法的步骤。