CN114897183A

CN114897183A - 问题数据处理方法、深度学习模型的训练方法和装置

Info

Publication number: CN114897183A
Application number: CN202210532898.1A
Authority: CN
Inventors: 夏宇; 姜文斌
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2022-05-16
Filing date: 2022-05-16
Publication date: 2022-08-12
Anticipated expiration: 2042-05-16
Also published as: CN114897183B

Abstract

本公开提供了一种问题数据处理方法、深度学习模型的训练方法、问答方法、装置、设备、介质和产品，涉及人工智能技术领域，具体涉及知识图谱、自然语言处理、深度学习等技术领域。问题数据处理方法包括：获取针对目标问题的第一子问题和针对第一子问题的第一答复顺序；基于目标问题、第一子问题以及第一答复顺序，得到针对目标问题的第二子问题，其中，针对第二子问题的第二答复顺序在第一答复顺序之后；基于第一子问题、第一答复顺序、第二子问题、第二答复顺序，得到针对目标问题的目标子问题集合，其中，目标子问题集合包括具有答复顺序的多个子问题，多个子问题至少包括第一子问题和第二子问题。

Description

问题数据处理方法、深度学习模型的训练方法和装置

技术领域

本公开涉及人工智能技术领域，具体涉及知识图谱、自然语言处理、深度学习等技术领域，更具体地，涉及一种问题数据处理方法、深度学习模型的训练方法、问答方法、装置、电子设备、介质和程序产品。

背景技术

在处理问题数据得到答案数据时，可以对问题数据进行理解或解析。但是，相关技术在对问题数据进行理解或解析时，理解或解析过程复杂繁琐、效果不佳，由此影响答案数据的准确性。

发明内容

本公开提供了一种问题数据处理方法、深度学习模型的训练方法、问答方法、装置、电子设备、存储介质和程序产品。

根据本公开的一方面，提供了一种问题数据处理方法，包括：获取针对目标问题的第一子问题和针对所述第一子问题的第一答复顺序；基于所述目标问题、所述第一子问题以及所述第一答复顺序，得到针对所述目标问题的第二子问题，其中，针对所述第二子问题的第二答复顺序在所述第一答复顺序之后；基于所述第一子问题、所述第一答复顺序、所述第二子问题、所述第二答复顺序，得到针对所述目标问题的目标子问题集合，其中，所述目标子问题集合包括具有答复顺序的多个子问题，所述多个子问题至少包括所述第一子问题和所述第二子问题。

根据本公开的另一方面，提供了一种深度学习模型的训练方法，包括：获取样本问题和针对所述样本问题的参考子问题集合，其中，所述参考子问题集合包括多个参考子问题和各个参考子问题对应的答复顺序；获取针对所述样本问题的第一子问题和针对所述第一子问题的第一答复顺序；利用深度学习模型处理所述样本问题、所述第一子问题以及所述第一答复顺序，得到针对所述样本问题的第二子问题，其中，针对所述第二子问题的第二答复顺序在所述第一答复顺序之后；基于所述第二答复顺序和各个参考子问题对应的答复顺序，从所述参考子问题集合中确定与所述第二子问题对应的参考子问题；基于所述第二子问题和所述参考子问题之间的相似度，确定损失函数值；基于所述损失函数值，调整所述深度学习模型的模型参数。

根据本公开的另一方面，提供了一种问题数据处理方法，包括：接收目标问题；利用深度学习模型处理所述目标问题，得到针对所述目标问题的目标子问题集合，其中，所述深度学习模型是利用如上所述的深度学习模型的训练方法得到的。

根据本公开的另一方面，提供了一种问答方法，包括：接收针对目标问题的目标子问题集合；基于所述目标子问题集合，确定针对所述目标问题的答案数据，其中，所述目标子问题集合是利用如上所述的问题数据处理方法得到的，或者，所述目标子问题集合是利用深度学习模型得到的，所述深度学习模型是利用如上所述的深度学习模型的训练方法得到的。

根据本公开的另一方面，提供了一种问题数据处理装置，包括：获取模块、第一获得模块和第二获得模块。获取模块，用于获取针对目标问题的第一子问题和针对所述第一子问题的第一答复顺序；第一获得模块，用于基于所述目标问题、所述第一子问题以及所述第一答复顺序，得到针对所述目标问题的第二子问题，其中，针对所述第二子问题的第二答复顺序在所述第一答复顺序之后；第二获得模块，用于基于所述第一子问题、所述第一答复顺序、所述第二子问题、所述第二答复顺序，得到针对所述目标问题的目标子问题集合，其中，所述目标子问题集合包括具有答复顺序的多个子问题，所述多个子问题至少包括所述第一子问题和所述第二子问题。

根据本公开的另一方面，提供了一种深度学习模型的训练装置，包括：第一获取模块、第二获取模块、处理模块、第一确定模块、第二确定模块和调整模块。第一获取模块，用于获取样本问题和针对所述样本问题的参考子问题集合，其中，所述参考子问题集合包括多个参考子问题和各个参考子问题对应的答复顺序；第二获取模块，用于获取针对所述样本问题的第一子问题和针对所述第一子问题的第一答复顺序；处理模块，用于利用深度学习模型处理所述样本问题、所述第一子问题以及所述第一答复顺序，得到针对所述样本问题的第二子问题，其中，针对所述第二子问题的第二答复顺序在所述第一答复顺序之后；第一确定模块，用于基于所述第二答复顺序和各个参考子问题对应的答复顺序，从所述参考子问题集合中确定与所述第二子问题对应的参考子问题；第二确定模块，用于基于所述第二子问题和所述参考子问题之间的相似度，确定损失函数值；调整模块，用于基于所述损失函数值，调整所述深度学习模型的模型参数。

根据本公开的另一方面，提供了一种问题数据处理装置，包括：接收模块和处理模块。接收模块，用于接收目标问题；处理模块，用于利用深度学习模型处理所述目标问题，得到针对所述目标问题的目标子问题集合，其中，所述深度学习模型是利用如上所述的深度学习模型的训练装置得到的。

根据本公开的另一方面，提供了一种问答装置，包括：接收模块和确定模块。接收模块，用于接收针对目标问题的目标子问题集合；确定模块，用于基于所述目标子问题集合，确定针对所述目标问题的答案数据，其中，所述目标子问题集合是利用如上所述的问题数据处理装置得到的，或者，所述目标子问题集合是利用深度学习模型得到的，所述深度学习模型是利用如上所述的深度学习模型的训练装置得到的。

根据本公开的另一方面，提供了一种电子设备，包括：至少一个处理器和与所述至少一个处理器通信连接的存储器。其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行上述的问题数据处理方法、深度学习模型的训练方法、问答方法中的任意一个或多个。

根据本公开的另一方面，提供了一种存储有计算机指令的非瞬时计算机可读存储介质，所述计算机指令用于使所述计算机执行上述的问题数据处理方法、深度学习模型的训练方法、问答方法中的任意一个或多个。

根据本公开的另一方面，提供了一种计算机程序产品，包括计算机程序序/指令，所述计算机程序序/指令被处理器执行时实现上述问题数据处理方法、深度学习模型的训练方法、问答方法中的任意一个或多个方法的步骤。

应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

附图说明

附图用于更好地理解本方案，不构成对本公开的限定。其中：

图1示意性示出了本公开一种示例的应用场景；

图2示意性示出了根据本公开一实施例的问题数据处理方法的流程图；

图3示意性示出了根据本公开一实施例的问题数据处理方法的原理图；

图4示意性示出了根据本公开一实施例的深度学习模型的训练方法的流程图；

图5示意性示出了根据本公开另一实施例的问题数据处理方法的流程图；

图6示意性示出了根据本公开一实施例的深度学习模型的训练方法的原理图；

图7示意性示出了根据本公开一实施例的问答方法的流程图；

图8示意性示出了根据本公开一实施例的问题数据处理装置的框图；

图9示意性示出了根据本公开一实施例的深度学习模型的训练装置的框图；

图10示意性示出了根据本公开另一实施例的问题数据处理装置的框图；

图11示意性示出了根据本公开一实施例的问答装置的框图；以及

图12是用来实现本公开实施例的用于执行问题数据处理、深度学习模型的训练、目标检测的电子设备的框图。

具体实施方式

以下结合附图对本公开的示范性实施例做出说明，其中包括本公开实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本公开的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。

在此使用的术语仅仅是为了描述具体实施例，而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在，但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。

在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义，除非另外定义。应注意，这里使用的术语应解释为具有与本说明书的上下文相一致的含义，而不应以理想化或过于刻板的方式来解释。

在使用类似于“A、B和C等中至少一个”这样的表述的情况下，一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如，“具有A、B和C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。

图1示意性示出了本公开一种示例的应用场景。

如图1所示，根据本公开实施例的应用场景100，包括待训练深度学习模型110。

示例性地，待训练深度学习模型110例如包括基于循环神经网络(RecurrentNeural Network，RNN)、双向自回归变压器(Bidirectional and Auto-RegressiveTransformers，BART)的编码解码网络。可以利用训练样本111训练待训练深度学习模型110，得到经训练深度学习模型120。

训练样本111例如包括多个样本，每个样本例如包括样本问题和参考子问题集合。参考子问题集合中的多个子问题例如是对样本问题进行解析理解得到的。参考子问题集合例如用于作为训练的标签。即，待训练深度学习模型110对样本问题进行解析，得到解析结果，解析结果例如包括多个子问题。将解析结果和参考子问题集合进行比较，以此经练待训练深度学习模型120。

在得到经训练深度学习模型120之后，可以利用经训练深度学习模型120解析目标问题121，得到针对目标问题121的目标子问题集合122，目标子问题集合122中例如包括多个子问题。

接下来，可以解答目标子问题集合122中的每个子问题，从而得到针对目标问题121的答案数据123。

问题语义解析是指将问题数据解析成求解此问题所需的多个原子操作，每个原子操作可以是一个子问题。例如，问题数据包括“这张图片中出现最多次数的颜色是什么”。解析后输出的多个原子操作(子问题)例如包括：第一步(第一个子问题)：找到所有物体；第二步(第二个子问题)：识别第一步所找到物体的颜色；第三步(第三个子问题)：统计第二步中颜色出现的次数；第四步(第四个子问题)：根据第三步返回出现次数最多的颜色。

这些原子操作可以以知识图谱的方式表示，例如多个原子操作由有向无环图来表示，有向无环图也称为有向无环计算图(简称计算图)。计算图中的节点表示问题求解过程中的原子操作(比如：获取属性、比较属性、寻找最大值等)，边表示操作之间的顺序。将自然语言描述的问题解析成结构化的计算图，并利用解析结果(计算图)辅助阅读理解模型或问答系统进行多步推理得到答案，以更好地理解复杂问题。通过获取解决问题的步骤，提高了阅读理解模型或问答系统的准确性。

在一些方式中，可以将计算图表示成序列结构，进而将针对问题数据的解析任务建模为序列到序列的生成过程。具体来说，基于RNN、BART等编码解码网络，使用编码网络将问题数据编码成向量，使用解码网络将向量解码成序列结构(计算图)。该过程直接基于问题数据得到包含多个子问题的序列结构(计算图)。

在另一些方式中，可以将计算图表示成针对问题数据的依存树结构，进而将针对问题数据的解析任务建模为依存句法分析的过程。例如，基于Biaffine句法解析架构将问题数据编码成向量，然后预测问题数据中的任意两个字词之间的关联标签，从而得到依存树结构。

在通过对问题数据进行解析生成序列结构(计算图)，或者生成针对问题数据的依存树结构时，通常都是从问题数据直接得到复杂结构(计算图或依存树结构)，整个过程复杂度较高且错误传播范围较大，一步错则步步错。

有鉴于此，本公开的实施例提出了一种优化的问题数据处理方法、深度学习模型的训练方法和问答方法。下面参考图2～图7来描述根据本公开示例性实施方式的问题数据处理方法、深度学习模型的训练方法和问答方法。

图2示意性示出了根据本公开一实施例的问题数据处理方法的流程图。

如图2所示，本公开实施例的问题数据处理方法200例如可以包括操作S210～操作S230。

在操作S210，获取针对目标问题的第一子问题和针对第一子问题的第一答复顺序。

在操作S220，基于目标问题、第一子问题以及第一答复顺序，得到针对目标问题的第二子问题。

在操作S230，基于第一子问题、第一答复顺序、第二子问题、第二答复顺序，得到针对目标问题的目标子问题集合。

示例性地，对目标问题进行解析，生成一个子问题，可以将生成的子问题作为第一子问题，第一子问题的第一答复顺序例如为“1”。或者，继续对目标问题和生成的子问题进行进一步解析，再得到一个子问题，该子问题的答复顺序为“2”，可以将生成的两个子问题作为第一子问题，针对第一子问题的第一答复顺序分别为“1”和“2”，由此，第一子问题可以包括一个或多个子问题。

在得到第一子问题和针对第一子问题的第一答复顺序之后，可以基于目标问题、第一子问题和第一答复顺序，生成第二子问题，针对第二子问题的第二答复顺序在第一答复顺序之后。

接下来，基于第一子问题、第一答复顺序、第二子问题、第二答复顺序，得到针对目标问题的目标子问题集合。目标子问题集合包括具有答复顺序的多个子问题，多个子问题至少包括第一子问题和第二子问题。

例如，可以将第一子问题和第二子问题作为目标子问题集合。或者，可以继续基于目标问题，第一子问题、第一答复顺序、第二子问题、第二答复顺序生成第三子问题，第三子问题的第三答复顺序在第二答复顺序之后，以此类推得到第四子问题、第五子问题等等。可以将第一子问题、第二子问题、第三子问题、第四子问题、第五子问题等等作为目标子问题集合。

根据本公开的实施例，在对目标问题进行解析时，每次生成一个子问题和该子问题对应的答复顺序，实现对问题数据的简单决策，降低了问题解析的难度，便于对每个子问题的生成过程进行指导或干预，以避免子问题准确性较低而影响后续子问题的准确性，由此提高目标子问题集合的整体准确性。

在本公开的另一示例中，在生成每个子问题时，可以生成多个候选子问题，然后从多个候选子问题选择一个或多个。以生成第二子问题为例，可以基于目标问题、第一子问题以及第一答复顺序，得到多个候选子问题和针对各个候选子问题的概率。接下来，基于针对第一子问题的概率和针对各个候选子问题的概率，从多个候选子问题中选择一个或多个候选子问题作为第二子问题。

根据本公开的实施例，在生成子问题时，可以扩大搜索范围，生成多个候选子问题，然后再从多个候选子问题中选择一个或多个子问题，实现寻找全局最优的子问题，尽量避免之前子问题不准确而影响后续子问题的准确性的问题，降低了错误传播的概率。

图3示意性示出了根据本公开一实施例的问题数据处理方法的原理图。

如图3所示，针对目标问题301，对目标问题301进行问题解析，得到多个候选子问题和各自对应的概率，概率越大，表示该候选子问题的准确性越高。多个候选子问题例如包括候选子问题A1、候选子问题A2、候选子问题A3，各自对应的概率例如分别为0.9、0.8、0.7。

从多个候选子问题中选择概率大的K个子问题作为第一子问题，K例如为大于等于1的整数。在一示例中，可以采用集束搜索(Beam Search)方式基于概率选择多个候选子问题，例如集束搜索方式指示了K大于1，以扩大搜索空间。以K＝2为例，从多个候选子问题A1、A2、A3中选择第一子问题A1和第一子问题A2，第一子问题A1、A2的第一答复顺序例如为“1”。

得到第一子问题A1、A2之后，基于目标问题301、第一子问题A1、A2以及第一答复顺序“1”，得到多个候选子问题和针对各个候选子问题的概率。

例如，基于目标问题301、第一子问题A1以及第一答复顺序“1”，得到多个候选子问题B1、B2、B3，多个候选子问题B1、B2、B3对应的概率分别是0.68、0.64、0.62。

例如，基于目标问题301、第一子问题A2以及第一答复顺序“1”，得到多个候选子问题B4、B5、B6，多个候选子问题B4、B5、B6对应的概率分别是0.88、0.56、052。

接下来，基于针对第一子问题的概率和针对各个候选子问题的概率，从多个候选子问题中选择第二子问题。

例如，基于针对第一子问题A1的概率0.9和针对各个候选子问题B1、B2、B3的概率，确定将各个候选子问题B1、B2、B3作为第二子问题的目标概率。例如，将候选子问题B1作为第二子问题的目标概率为0.9*0.68，候选子问题B2作为第二子问题的目标概率为0.9*0.64，将候选子问题B3作为第二子问题的目标概率为0.9*0.62。

例如，基于针对第一子问题A2的概率0.8和针对各个候选子问题B4、B5、B6的概率，确定将各个候选子问题B4、B5、B6作为第二子问题的目标概率。例如，将候选子问题B4作为第二子问题的目标概率为0.8*0.88，将候选子问题B5作为第二子问题的目标概率为0.8*0.56，将候选子问题B6作为第二子问题的目标概率为0.8*0.52。

基于各个候选子问题各自对应的目标概率，从多个候选子问题B1、B2、B3、B4、B5、B6中选择第二子问题B1、B4。

得到第二子问题之后，基于第一子问题、第一答复顺序、第二子问题、第二答复顺序，得到针对目标问题的多个候选子问题集合，各个候选子问题集合包括具有答复顺序的多个子问题。

例如，基于目标问题301、第一子问题A1、每个第二子问题B1、第一子问题A1的第一答复顺序、第二子问题B1的第二答复顺序，确定多个候选子问题C1、C2、C3和各自对应的概率。基于目标问题301、第一子问题A2、每个第二子问题B4、第一子问题A2的第一答复顺序、第二子问题B4的第二答复顺序，确定多个候选子问题C4、C5、C6和各自对应的概率。基于类似的方式，从候选子问题C1、C2、C3、C4、C5、C6中选择第三子问题C2、C4，以得到多个候选子问题集合。

多个候选子问题集合例如包括候选子问题集合AGG1和候选子问题集合AGG2。候选子问题集合AGG1例如包括第一子问题A1、第二子问题B1和第三子问题C2。候选子问题集合AGG2例如包括第一子问题A2、第二子问题B4和第三子问题C4。

示例性地，确定针对各个候选子问题集合的总概率，总概率包括各个候选子问题集合中各个子问题对应的概率之间的乘积。例如，候选子问题集合AGG1的总概率为A1、B1、C2之间的概率乘积，为0.9*0.68*0.59。候选子问题集合AGG2的总概率为A2、B4、C4之间的概率乘积，为0.8*0.88*0.6。

接下来，基于总概率，从多个候选子问题集合AGG1、AGG2中选择概率最大的集合作为目标子问题集合，例如目标子问题集合为AGG2。

在本公开的另一示例中，目标子问题集合AGG2中的多个子问题例如基于各自对应的答复顺序形成有向无环图数据303，向无环图数据303例如是一种知识图谱数据。有向无环图数据303例如包括多个节点和节点之间的边数据，各个节点表征对应的子问题，边数据表征答复顺序。例如，目标子问题集合AGG2中包括第一子问题A2、第二子问题B4、第三子问题C4。第一子问题A2、第二子问题B4、第三子问题C4各自对应一个节点，第一子问题A2指向第二子问题B4的边数据表示第二子问题B4的答复顺序在第一子问题A2之后，第二子问题B4指向第三子问题C4的边数据表示第三子问题C4的答复顺序在第二子问题B4之后。

根据本公开的实施例，在单步确定每个子问题之后，基于集束搜索的方式增大下一个子问题的搜索范围，搜索得到针对每个子问题的多个候选子问题，提高了搜索的准确性，然后基于候选子问题的概率和之前子问题的概率来选择下一个子问题。由此可见，单步搜索方式保证了每个子问题生成过程中的可干预性，降低每个子问题生成的错误率，集束搜索的方式实现了全局搜索得到多个候选子问题，降低了之前生成的子问题存在的错误影响后续子问题的概率，整体提高了子问题的生成准确性。

在本公开的另一示例中，得到目标子问题集合之后，可以将目标子问题输入问答系统，问答系统基于目标子问题集合依次解答每个子问题而得到针对目标问题的答案数据。

例如，确定针对答复顺序在前的子问题的第一答案数据，该第一答案数据可以作为答复顺序在后的子问题的解答依据。基于第一答案数据，确定针对答复顺序在后的子问题的第二答案数据，基于第二答案数据，依次解答所有子问题，直到得到针对目标问题的答案数据。

根据本公开的实施例，处理目标问题得到多个具有答复顺序的子问题之后，依次解答每个子问题得到针对目标问题的答案数据，提高了问题解析的准确性和效率。

图4示意性示出了根据本公开一实施例的深度学习模型的训练方法的流程图。

如图4所示，本公开实施例的深度学习模型的训练方法400例如可以包括操作S410～操作S460。

在操作S410，获取样本问题和针对样本问题的参考子问题集合，参考子问题集合包括多个参考子问题和各个参考子问题对应的答复顺序。

在操作S420，获取针对样本问题的第一子问题和针对第一子问题的第一答复顺序。

在操作S430，利用深度学习模型处理样本问题、第一子问题以及第一答复顺序，得到针对样本问题的第二子问题，针对第二子问题的第二答复顺序在第一答复顺序之后。

在操作S440，基于第二答复顺序和各个参考子问题对应的答复顺序，从参考子问题集合中确定与第二子问题对应的参考子问题。

在操作S450，基于第二子问题和参考子问题之间的相似度，确定损失函数值。

在操作S460，基于损失函数值，调整深度学习模型的模型参数。

根据本公开的实施例，在通过深度学习模型解析目标样本时，每次得到一个子问题。例如，当得到第一子问题之后，基于深度学习模型学习目标问题和第一子问题，得到第二子问题，第二子问题具有第二答复顺序。可以基于第二答复顺序和参考子问题集合中各个参考子问题对应的答复顺序，从多个参考子问题中确定与第二子问题对应的参考子问题，确定的参数子问题的答复顺序例如与第二答复顺序一致。

接下来，将第二子问题和参考子问题进行比较，得到两者之间的相似度，基于相似度确定损失函数值，基于损失函数值反向调整深度学习模型的模型参数，使得后续深度学习模型学习到的子问题与对应的参考子问题之间的相似度较大，以此训练得到深度学习模型。

根据本公开的实施例，在训练用于对目标问题进行解析的深度学习模型时，深度学习模型每次生成一个子问题和该子问题对应的答复顺序，实现对问题解析的简单决策，降低了问题解析的难度，便于对每个子问题的生成过程进行指导或干预，避免之前准确性较低的子问题影响后续子问题的准确性，由此提高深度学习模型对问题解析的准确性。

在本公开的另一示例中，第一子问题包括针对子问题的概率，可以利用深度学习模型执行以下操作得到第二子问题：

基于样本问题、第一子问题以及第一答复顺序，得到多个候选子问题和针对各个候选子问题的概率。然后，基于针对第一子问题的概率和针对各个候选子问题的概率，从多个候选子问题中选择第二子问题。

例如，基于针对第一子问题的概率和针对各个候选子问题的概率，确定将各个候选子问题作为第二子问题的目标概率，基于各个候选子问题各自对应的目标概率，从多个候选子问题中选择第二子问题。

该过程与上文内容相同或类似，在此不再赘述。

在本公开的另一示例中，在得到第一子问题、第二子问题之后，可以基于第一子问题、第一答复顺序、第二子问题、第二答复顺序，得到针对样本问题的样本子问题集合，样本子问题集合包括具有答复顺序的多个子问题，多个子问题至少包括第一子问题和第二子问题。过程与上文内容相同或类似，在此不再赘述。

在本公开的另一示例中，样本子问题集合中的多个子问题基于各自对应的答复顺序形成有向无环图数据，有向无环图数据包括多个节点和节点之间的边数据，各个节点表征对应的子问题，边数据表征答复顺序。过程与上文内容相同或类似，在此不再赘述。

图5示意性示出了根据本公开另一实施例的问题数据处理方法的流程图。

如图5所示，本公开实施例的问题数据处理方法500例如可以包括操作S510～操作S520。

在操作S510，接收目标问题。

在操作S520，利用深度学习模型处理目标问题，得到针对目标问题的目标子问题集合。

例如，接收到目标问题之后，将目标问题输入经训练的深度学习模型中，由经训练的深度学习模型处理目标问题，得到针对目标问题的目标子问题集合。

示例性地，深度学习模型是利用上文提及的方法训练得到的。

根据本公开的实施例，利用经训练的深度学习模型对目标问题进行解析得到子问题时，每次生成一个子问题和该子问题对应的答复顺序，实现对问题解析的简单决策，降低了问题解析的难度，便于对每个子问题的生成过程进行指导或干预，避免之前子问题错误而影响后续子问题的准确性，由此提高深度学习模型对问题解析的准确性。

图6示意性示出了根据本公开一实施例的深度学习模型的训练方法的原理图。

如图6所示，当前状态例如包括目标问题601和多个计算图602A、602B，计算图例如表征针对目标问题601的子问题和答复顺序。以计算图602A为例，计算图602A包括子问题A1和子问题B1，子问题B1的答复顺序在子问题A1之后。

深度学习模型例如包括单步决策网络，单步决策网络例如包括问题编码网络和图编码网络。将目标问题601输入问题编码网络，将计算图602A、602B输入图编码网络，得到下一个子问题。例如，针对计算图602A得到下一个子问题C2，针对计算图602B得到下一个子问题C4，由此得到多个计算图603A、603B。最后可以将计算图603B作为针对目标问题601的目标子问题集合604进行输出。

图7示意性示出了根据本公开一实施例的问答方法的流程图。

如图7所示，本公开实施例的问答方法700例如可以包括操作S710～操作S720。

在操作S710，接收针对目标问题的目标子问题集合。

在操作S720，基于目标子问题集合，确定针对目标问题的答案数据。

示例性地，目标子问题集合例如可以利用上文提及的问题数据处理方法得到.或者，目标子问题集合可以利用深度学习模型得到的，该深度学习模型可以利用上文提及的深度学习模型的训练方法得到。

根据本公开的实施例，处理目标问题得到多个具有答复顺序的子问题之后，可以依次解答每个子问题得到针对目标问题的答案数据，提高了问题解析的准确性和效率。

图8示意性示出了根据本公开一实施例的问题数据处理装置的框图。

如图8所示，公开实施例的问题数据处理装置800例如包括获取模块810、第一获得模块820和第二获得模块830。

获取模块810可以用于获取针对目标问题的第一子问题和针对第一子问题的第一答复顺序。根据本公开实施例，获取模块810例如可以执行上文参考图2描述的操作S210，在此不再赘述。

第一获得模块820可以用于基于目标问题、第一子问题以及第一答复顺序，得到针对目标问题的第二子问题，其中，针对第二子问题的第二答复顺序在第一答复顺序之后。根据本公开实施例，第一获得模块820例如可以执行上文参考图2描述的操作S220，在此不再赘述。

第二获得模块830可以用于基于第一子问题、第一答复顺序、第二子问题、第二答复顺序，得到针对目标问题的目标子问题集合，其中，目标子问题集合包括具有答复顺序的多个子问题，多个子问题至少包括第一子问题和第二子问题。根据本公开实施例，第二获得模块830例如可以执行上文参考图2描述的操作S230，在此不再赘述。

根据本公开的实施例，第一子问题包括针对子问题的概率；第一获得模块820包括：第一获得子模块和第一选择子模块。第一获得子模块，用于基于目标问题、第一子问题以及第一答复顺序，得到多个候选子问题和针对各个候选子问题的概率；第一选择子模块，用于基于针对第一子问题的概率和针对各个候选子问题的概率，从多个候选子问题中选择第二子问题。

根据本公开的实施例，第一选择子模块包括：确定单元和选择单元。确定单元，用于基于针对第一子问题的概率和针对各个候选子问题的概率，确定将各个候选子问题作为第二子问题的目标概率；选择单元，用于基于各个候选子问题各自对应的目标概率，从多个候选子问题中选择第二子问题。

根据本公开的实施例，第二获得模块830包括：第二获得子模块、确定子模块和第二选择子模块。第二获得子模块，用于基于第一子问题、第一答复顺序、第二子问题、第二答复顺序，得到针对目标问题的多个候选子问题集合，其中，各个候选子问题集合包括具有答复顺序的多个子问题；确定子模块，用于确定针对各个候选子问题集合的总概率，其中，总概率包括各个候选子问题集合中各个子问题对应的概率之间的乘积；第二选择子模块，用于基于总概率，从多个候选子问题集合中选择目标子问题集合。

根据本公开的实施例，目标子问题集合中的多个子问题基于各自对应的答复顺序形成有向无环图数据，有向无环图数据包括多个节点和节点之间的边数据，各个节点表征对应的子问题，边数据表征答复顺序。

根据本公开的实施例，装置800还可以包括：第一确定模块、第二确定模块和第三获得模块。第一确定模块，用于基于目标子问题集合，确定针对答复顺序在前的子问题的第一答案数据；第二确定模块，用于基于第一答案数据，确定针对答复顺序在后的子问题的第二答案数据；第三获得模块，用于基于第二答案数据，得到针对目标问题的答案数据。

图9示意性示出了根据本公开一实施例的深度学习模型的训练装置的框图。

如图9所示，本公开实施例的深度学习模型的训练装置900例如包括第一获取模块910、第二获取模块920、处理模块930、第一确定模块940、第二确定模块950和调整模块960。

第一获取模块910可以用于获取样本问题和针对样本问题的参考子问题集合，其中，参考子问题集合包括多个参考子问题和各个参考子问题对应的答复顺序。根据本公开实施例，第一获取模块910例如可以执行上文参考图4描述的操作S410，在此不再赘述。

第二获取模块920可以用于获取针对样本问题的第一子问题和针对第一子问题的第一答复顺序。根据本公开实施例，第二获取模块920例如可以执行上文参考图4描述的操作S420，在此不再赘述。

处理模块930可以用于利用深度学习模型处理样本问题、第一子问题以及第一答复顺序，得到针对样本问题的第二子问题，其中，针对第二子问题的第二答复顺序在第一答复顺序之后。根据本公开实施例，处理模块930例如可以执行上文参考图4描述的操作S430，在此不再赘述。

第一确定模块940可以用于基于第二答复顺序和各个参考子问题对应的答复顺序，从参考子问题集合中确定与第二子问题对应的参考子问题。根据本公开实施例，第一确定模块940例如可以执行上文参考图4描述的操作S440，在此不再赘述。

第二确定模块950可以用于基于第二子问题和参考子问题之间的相似度，确定损失函数值。根据本公开实施例，第二确定模块950例如可以执行上文参考图4描述的操作S450，在此不再赘述。

调整模块960可以用于基于损失函数值，调整深度学习模型的模型参数。根据本公开实施例，调整模块960例如可以执行上文参考图4描述的操作S460，在此不再赘述。

根据本公开的实施例，第一子问题包括针对子问题的概率；处理模块包括：获得子模块和选择子模块。获得子模块，用于基于样本问题、第一子问题以及第一答复顺序，得到多个候选子问题和针对各个候选子问题的概率；选择子模块，用于基于针对第一子问题的概率和针对各个候选子问题的概率，从多个候选子问题中选择第二子问题。

根据本公开的实施例，选择子模块包括：确定单元和选择单元。确定单元，用于基于针对第一子问题的概率和针对各个候选子问题的概率，确定将各个候选子问题作为第二子问题的目标概率；选择单元，用于基于各个候选子问题各自对应的目标概率，从多个候选子问题中选择第二子问题。

根据本公开的实施例，装置900还可以包括：获得模块，用于基于第一子问题、第一答复顺序、第二子问题、第二答复顺序，得到针对样本问题的样本子问题集合，其中，样本子问题集合包括具有答复顺序的多个子问题，多个子问题至少包括第一子问题和第二子问题。

根据本公开的实施例，样本子问题集合中的多个子问题基于各自对应的答复顺序形成有向无环图数据，有向无环图数据包括多个节点和节点之间的边数据，各个节点表征对应的子问题，边数据表征答复顺序。

图10示意性示出了根据本公开另一实施例的问题数据处理装置的框图。

如图10所示，本公开实施例的问题数据处理装置1000例如包括接收模块1010和处理模块1020。

接收模块1010可以用于接收目标问题。根据本公开实施例，处理模块1010例如可以执行上文参考图5描述的操作S510，在此不再赘述。

处理模块1020可以用于利用深度学习模型处理目标问题，得到针对目标问题的目标子问题集合。根据本公开实施例，处理模块1020例如可以执行上文参考图5描述的操作S520，在此不再赘述。

图11示意性示出了根据本公开一实施例的问答装置的框图。

如图11所示，本公开实施例的问答装置1100例如包括接收模块1110和确定模块1120。

接收模块1110可以用于接收针对目标问题的目标子问题集合。根据本公开实施例，接收模块1110例如可以执行上文参考图7描述的操作S710，在此不再赘述。

确定模块1120可以用于基于目标子问题集合，确定针对目标问题的答案数据。根据本公开实施例，确定模块1120例如可以执行上文参考图7描述的操作S720，在此不再赘述。

在本公开的技术方案中，所涉及的用户个人信息的收集、存储、使用、加工、传输、提供、公开和应用等处理，均符合相关法律法规的规定，采取了必要保密措施，且不违背公序良俗。

在本公开的技术方案中，在获取或采集用户个人信息之前，均获取了用户的授权或同意。

根据本公开的实施例，本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。

根据本公开实施例，提供了一种存储有计算机指令的非瞬时计算机可读存储介质，计算机指令用于使计算机执行上文所描述的问题数据处理方法、深度学习模型的训练方法、问答方法中的任意一个或多个。

根据本公开实施例，提供了一种计算机程序产品，包括计算机程序/指令，计算机程序/指令被处理器执行时实现上文所描述的问题数据处理方法、深度学习模型的训练方法、问答方法中的任意一个或多个。

图12示出了可以用来实施本公开实施例的示例电子设备1200的示意性框图。电子设备1200旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本公开的实现。

如图12所示，设备1200包括计算单元1201，其可以根据存储在只读存储器(ROM)1202中的计算机程序或者从存储单元1208加载到随机访问存储器(RAM)1203中的计算机程序，来执行各种适当的动作和处理。在RAM 1203中，还可存储设备1200操作所需的各种程序和数据。计算单元1201、ROM 1202以及RAM 1203通过总线1204彼此相连。输入/输出(I/O)接口1205也连接至总线1204。

设备1200中的多个部件连接至I/O接口1205，包括：输入单元1206，例如键盘、鼠标等；输出单元1207，例如各种类型的显示器、扬声器等；存储单元1208，例如磁盘、光盘等；以及通信单元1209，例如网卡、调制解调器、无线通信收发机等。通信单元1209允许设备1200通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。

计算单元1201可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元1201的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元1201执行上文所描述的各个方法和处理，例如问题数据处理方法、深度学习模型的训练方法、问答方法中的任意一个或多个。例如，在一些实施例中，问题数据处理方法、深度学习模型的训练方法、问答方法中的任意一个或多个可被实现为计算机软件程序，其被有形地包含于机器可读介质，例如存储单元1208。在一些实施例中，计算机程序的部分或者全部可以经由ROM 1202和/或通信单元1209而被载入和/或安装到设备1200上。当计算机程序加载到RAM 1203并由计算单元1201执行时，可以执行上文描述的问题数据处理方法、深度学习模型的训练方法、问答方法中的任意一个或多个的一个或多个步骤。备选地，在其他实施例中，计算单元1201可以通过其他任何适当的方式(例如，借助于固件)而被配置为执行问题数据处理方法、深度学习模型的训练方法、问答方法中的任意一个或多个。

本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、复杂可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程问题数据处理装置、深度学习模型的训练装置、问答装置中的任意一个或多个的处理器或控制器，使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行，作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本公开的上下文中，机器可读介质可以是有形的介质，其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备，或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的问题数据处理装置、深度学习模型的训练装置、问答装置中的任意一个或多个(例如，CRT(阴极射线管)或者LCD(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(LAN)、广域网(WAN)和互联网。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器，也可以为分布式系统的服务器，或者是结合了区块链的服务器。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本公开公开的技术方案所期望的结果，本文在此不进行限制。

上述具体实施方式，并不构成对本公开保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等，均应包含在本公开保护范围之内。

Claims

1.一种问题数据处理方法，包括：

获取针对目标问题的第一子问题和针对所述第一子问题的第一答复顺序；

基于所述目标问题、所述第一子问题以及所述第一答复顺序，得到针对所述目标问题的第二子问题，其中，针对所述第二子问题的第二答复顺序在所述第一答复顺序之后；以及

基于所述第一子问题、所述第一答复顺序、所述第二子问题、所述第二答复顺序，得到针对所述目标问题的目标子问题集合，其中，所述目标子问题集合包括具有答复顺序的多个子问题，所述多个子问题至少包括所述第一子问题和所述第二子问题。

2.根据权利要求2所述的方法，其中，所述第一子问题包括针对子问题的概率；所述基于所述目标问题、所述第一子问题以及所述第一答复顺序，得到针对所述目标问题的第二子问题包括：

基于所述目标问题、所述第一子问题以及所述第一答复顺序，得到多个候选子问题和针对各个候选子问题的概率；以及

基于针对所述第一子问题的概率和针对各个候选子问题的概率，从所述多个候选子问题中选择所述第二子问题。

3.根据权利要求2所述的方法，其中，所述基于针对所述第一子问题的概率和针对所述候选子问题的概率，从所述多个候选子问题中选择所述第二子问题包括：

基于针对所述第一子问题的概率和针对各个候选子问题的概率，确定将各个候选子问题作为第二子问题的目标概率；以及

基于各个候选子问题各自对应的目标概率，从所述多个候选子问题中选择所述第二子问题。

4.根据权利要求1所述的方法，其中，所述基于所述第一子问题、所述第一答复顺序、所述第二子问题、所述第二答复顺序，得到针对所述目标问题的目标子问题集合包括：

基于所述第一子问题、所述第一答复顺序、所述第二子问题、所述第二答复顺序，得到针对所述目标问题的多个候选子问题集合，其中，各个候选子问题集合包括具有答复顺序的多个子问题；

确定针对各个候选子问题集合的总概率，其中，所述总概率包括各个候选子问题集合中各个子问题对应的概率之间的乘积；以及

基于所述总概率，从所述多个候选子问题集合中选择所述目标子问题集合。

5.根据权利要求1-4中任意一项所述的方法，其中，所述目标子问题集合中的多个子问题基于各自对应的答复顺序形成有向无环图数据，所述有向无环图数据包括多个节点和节点之间的边数据，各个节点表征对应的子问题，所述边数据表征所述答复顺序。

6.根据权利要求1-5中任意一项所述的方法，还包括：

基于所述目标子问题集合，确定针对答复顺序在前的子问题的第一答案数据；

基于所述第一答案数据，确定针对答复顺序在后的子问题的第二答案数据；以及

基于所述第二答案数据，得到针对所述目标问题的答案数据。

7.一种深度学习模型的训练方法，包括：

获取样本问题和针对所述样本问题的参考子问题集合，其中，所述参考子问题集合包括多个参考子问题和各个参考子问题对应的答复顺序；

获取针对所述样本问题的第一子问题和针对所述第一子问题的第一答复顺序；

利用深度学习模型处理所述样本问题、所述第一子问题以及所述第一答复顺序，得到针对所述样本问题的第二子问题，其中，针对所述第二子问题的第二答复顺序在所述第一答复顺序之后；

基于所述第二答复顺序和各个参考子问题对应的答复顺序，从所述参考子问题集合中确定与所述第二子问题对应的参考子问题；

基于所述第二子问题和所述参考子问题之间的相似度，确定损失函数值；以及

基于所述损失函数值，调整所述深度学习模型的模型参数。

8.根据权利要求7所述的方法，其中，所述第一子问题包括针对子问题的概率；所述利用深度学习模型处理所述样本问题、所述第一子问题以及所述第一答复顺序，得到针对所述样本问题的第二子问题包括：

基于所述样本问题、所述第一子问题以及所述第一答复顺序，得到多个候选子问题和针对各个候选子问题的概率；以及

9.根据权利要求8所述的方法，其中，所述基于针对所述第一子问题的概率和针对所述候选子问题的概率，从所述多个候选子问题中选择所述第二子问题包括：

10.根据权利要求7所述的方法，还包括：

基于所述第一子问题、所述第一答复顺序、所述第二子问题、所述第二答复顺序，得到针对所述样本问题的样本子问题集合，其中，所述样本子问题集合包括具有答复顺序的多个子问题，所述多个子问题至少包括所述第一子问题和所述第二子问题。

11.根据权利要求7-10中任意一项所述的方法，其中，所述样本子问题集合中的多个子问题基于各自对应的答复顺序形成有向无环图数据，所述有向无环图数据包括多个节点和节点之间的边数据，各个节点表征对应的子问题，所述边数据表征所述答复顺序。

12.一种问题数据处理方法，包括：

接收目标问题；

利用深度学习模型处理所述目标问题，得到针对所述目标问题的目标子问题集合，

其中，所述深度学习模型是根据权利要求7-11中任意一项所述的方法得到的。

13.一种问答方法，包括：

接收针对目标问题的目标子问题集合；

基于所述目标子问题集合，确定针对所述目标问题的答案数据，

其中，所述目标子问题集合是根据权利要求1-6中任意一项所述的方法得到的，或者，所述目标子问题集合是利用深度学习模型得到的，所述深度学习模型是根据权利要求7-11中任意一项所述的方法得到的。

14.一种问题数据处理装置，包括：

获取模块，用于获取针对目标问题的第一子问题和针对所述第一子问题的第一答复顺序；

第一获得模块，用于基于所述目标问题、所述第一子问题以及所述第一答复顺序，得到针对所述目标问题的第二子问题，其中，针对所述第二子问题的第二答复顺序在所述第一答复顺序之后；以及

第二获得模块，用于基于所述第一子问题、所述第一答复顺序、所述第二子问题、所述第二答复顺序，得到针对所述目标问题的目标子问题集合，其中，所述目标子问题集合包括具有答复顺序的多个子问题，所述多个子问题至少包括所述第一子问题和所述第二子问题。

15.根据权利要求14所述的装置，其中，所述第一子问题包括针对子问题的概率；所述第一获得模块包括：

第一获得子模块，用于基于所述目标问题、所述第一子问题以及所述第一答复顺序，得到多个候选子问题和针对各个候选子问题的概率；以及

第一选择子模块，用于基于针对所述第一子问题的概率和针对各个候选子问题的概率，从所述多个候选子问题中选择所述第二子问题。

16.根据权利要求14所述的装置，其中，所述第一选择子模块包括：

确定单元，用于基于针对所述第一子问题的概率和针对各个候选子问题的概率，确定将各个候选子问题作为第二子问题的目标概率；以及

选择单元，用于基于各个候选子问题各自对应的目标概率，从所述多个候选子问题中选择所述第二子问题。

17.根据权利要求14所述的装置，其中，所述第二获得模块包括：

第二获得子模块，用于基于所述第一子问题、所述第一答复顺序、所述第二子问题、所述第二答复顺序，得到针对所述目标问题的多个候选子问题集合，其中，各个候选子问题集合包括具有答复顺序的多个子问题；

确定子模块，用于确定针对各个候选子问题集合的总概率，其中，所述总概率包括各个候选子问题集合中各个子问题对应的概率之间的乘积；以及

第二选择子模块，用于基于所述总概率，从所述多个候选子问题集合中选择所述目标子问题集合。

18.根据权利要求14-17中任意一项所述的装置，其中，所述目标子问题集合中的多个子问题基于各自对应的答复顺序形成有向无环图数据，所述有向无环图数据包括多个节点和节点之间的边数据，各个节点表征对应的子问题，所述边数据表征所述答复顺序。

19.根据权利要求14-18中任意一项所述的装置，还包括：

第一确定模块，用于基于所述目标子问题集合，确定针对答复顺序在前的子问题的第一答案数据；

第二确定模块，用于基于所述第一答案数据，确定针对答复顺序在后的子问题的第二答案数据；以及

第三获得模块，用于基于所述第二答案数据，得到针对所述目标问题的答案数据。

20.一种深度学习模型的训练装置，包括：

第一获取模块，用于获取样本问题和针对所述样本问题的参考子问题集合，其中，所述参考子问题集合包括多个参考子问题和各个参考子问题对应的答复顺序；

第二获取模块，用于获取针对所述样本问题的第一子问题和针对所述第一子问题的第一答复顺序；

处理模块，用于利用深度学习模型处理所述样本问题、所述第一子问题以及所述第一答复顺序，得到针对所述样本问题的第二子问题，其中，针对所述第二子问题的第二答复顺序在所述第一答复顺序之后；

第一确定模块，用于基于所述第二答复顺序和各个参考子问题对应的答复顺序，从所述参考子问题集合中确定与所述第二子问题对应的参考子问题；

第二确定模块，用于基于所述第二子问题和所述参考子问题之间的相似度，确定损失函数值；以及

调整模块，用于基于所述损失函数值，调整所述深度学习模型的模型参数。

21.根据权利要求20所述的装置，其中，所述第一子问题包括针对子问题的概率；所述处理模块包括：

获得子模块，用于基于所述样本问题、所述第一子问题以及所述第一答复顺序，得到多个候选子问题和针对各个候选子问题的概率；以及

选择子模块，用于基于针对所述第一子问题的概率和针对各个候选子问题的概率，从所述多个候选子问题中选择所述第二子问题。

22.根据权利要求21所述的装置，其中，所述选择子模块包括：

23.根据权利要求20所述的装置，还包括：

获得模块，用于基于所述第一子问题、所述第一答复顺序、所述第二子问题、所述第二答复顺序，得到针对所述样本问题的样本子问题集合，其中，所述样本子问题集合包括具有答复顺序的多个子问题，所述多个子问题至少包括所述第一子问题和所述第二子问题。

24.根据权利要求20-23中任意一项所述的装置，其中，所述样本子问题集合中的多个子问题基于各自对应的答复顺序形成有向无环图数据，所述有向无环图数据包括多个节点和节点之间的边数据，各个节点表征对应的子问题，所述边数据表征所述答复顺序。

25.一种问题数据处理装置，包括：

接收模块，用于接收目标问题；

处理模块，用于利用深度学习模型处理所述目标问题，得到针对所述目标问题的目标子问题集合，

其中，所述深度学习模型是根据权利要求20-24中任意一项所述的装置得到的。

26.一种问答装置，包括：

接收模块，用于接收针对目标问题的目标子问题集合；

确定模块，用于基于所述目标子问题集合，确定针对所述目标问题的答案数据，

其中，所述目标子问题集合是根据权利要求14-19中任意一项所述的装置得到的，或者，所述目标子问题集合是利用深度学习模型得到的，所述深度学习模型是根据权利要求20-24中任意一项所述的装置得到的。

27.一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-13中任一项所述的方法。

28.一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行权利要求1-13中任一项所述的方法。

29.一种计算机程序产品，包括计算机程序/指令，其特征在于，所述计算机程序/指令被处理器执行时实现根据权利要求1-13中任一项所述方法的步骤。