CN115952852B

CN115952852B - 模型训练方法、文本检索方法、装置、电子设备和介质

Info

Publication number: CN115952852B
Application number: CN202211653593.2A
Authority: CN
Inventors: 李威
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2022-12-20
Filing date: 2022-12-20
Publication date: 2024-03-12
Anticipated expiration: 2042-12-20
Also published as: CN115952852A

Abstract

本公开提供了一种深度学习模型的训练方法，涉及人工智能技术领域，尤其涉及深度学习、自然语言处理和检索技术领域，可应用于搜索引擎、智能问答、知识检索、对话系统等场景下。具体实现方案为：将至少一个第一样本文本对分别输入深度学习模型，得到至少一个第一样本文本向量对；将至少一个第二样本文本对分别输入深度学习模型，得到至少一个第二样本文本向量对，其中，第一样本文本向量对的两个第一样本文本向量之间的第一相似度大于或等于第二样本文本向量对的两个第二样本文本向量之间的第二相似度；以及根据至少一个第一相似度和至少一个第二相似度，训练深度学习模型。本公开还提供了一种文本检索方法、装置、电子设备和存储介质。

Description

模型训练方法、文本检索方法、装置、电子设备和介质

技术领域

本公开涉及人工智能技术领域，尤其涉及深度学习、自然语言处理和检索技术领域，可应用于搜索引擎、智能问答、知识检索、对话系统等场景下。更具体地，本公开提供了一种深度学习模型的训练方法、文本检索方法、装置、电子设备和存储介质。

背景技术

随着人工智能技术的发展，深度学习模型的应用场景不断增加。可以利用深度学习模型处理用户输入的文本，得到文本向量。根据文本向量，返回与输入文本相关的检索结果

发明内容

本公开提供了一种深度学习模型的训练方法、文本检索方法、装置、电子设备和存储介质。

根据本公开的一方面，提供了一种深度学习模型的训练方法，该方法包括：将至少一个第一样本文本对分别输入深度学习模型，得到至少一个第一样本文本向量对，其中，第一样本文本对包括两个第一样本文本，第一样本文本向量对包括两个第一样本文本向量；将至少一个第二样本文本对分别输入深度学习模型，得到至少一个第二样本文本向量对，其中，第二样本文本对包括两个第二样本文本，第二样本文本向量对包括两个第二样本文本向量，第一样本文本向量对的两个第一样本文本向量之间的第一相似度大于或等于第二样本文本向量对的两个第二样本文本向量之间的第二相似度；以及根据至少一个第一相似度和至少一个第二相似度，训练深度学习模型。

根据本公开的另一方面，提供了一种文本检索方法，该方法包括：将目标文本输入深度学习模型，得到目标文本向量；根据目标文本向量与多个预设文本向量之间的多个目标相似度，得到目标检索结果，其中，深度学习模型的编码器是利用本公开提供的方法训练的。

根据本公开的另一方面，提供了一种深度学习模型的训练装置，该装置包括：第一获得模块，用于将至少一个第一样本文本对分别输入深度学习模型，得到至少一个第一样本文本向量对，其中，所述第一样本文本对包括两个第一样本文本，第一样本文本向量对包括两个第一样本文本向量；第二获得模块，用于将至少一个第二样本文本对分别输入深度学习模型，得到至少一个第二样本文本向量对，其中，所述第二样本文本对包括两个第二样本文本，第二样本文本向量对包括两个第二样本文本向量，第一样本文本向量对的两个第一样本文本向量之间的第一相似度大于或等于第二样本文本向量对的两个第二样本文本向量之间的第二相似度；以及训练模块，用于根据至少一个第一相似度和至少一个第二相似度，训练深度学习模型。

根据本公开的另一方面，提供了一种文本检索装置，该装置包括：第三获得模块，用于将目标文本输入深度学习模型，得到目标文本向量；第四获得模块，用于根据目标文本向量与多个预设文本向量之间的多个目标相似度，得到目标检索结果，其中，深度学习模型的编码器是利用本公开提供的装置训练的。

根据本公开的另一方面，提供了一种电子设备，包括：至少一个处理器；以及与至少一个处理器通信连接的存储器；其中，存储器存储有可被至少一个处理器执行的指令，指令被至少一个处理器执行，以使至少一个处理器能够执行根据本公开提供的方法。

根据本公开的另一方面，提供了一种存储有计算机指令的非瞬时计算机可读存储介质，该计算机指令用于使计算机执行根据本公开提供的方法。

根据本公开的另一方面，提供了一种计算机程序产品，包括计算机程序，计算机程序在被处理器执行时实现根据本公开提供的方法。

应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

附图说明

附图用于更好地理解本方案，不构成对本公开的限定。其中：

图1是根据本公开的一个实施例的深度学习模型的训练方法的流程图；

图2是根据本公开的一个实施例的深度学习模型的示意图；

图3是根据本公开的另一个实施例的深度学习模型的示意图；

图4是根据本公开的一个实施例的文本检索方法的流程图；

图5是根据本公开的一个实施例的深度学习模型的训练装置的框图；

图6是根据本公开的一个实施例的文本检索装置的框图；以及

图7是根据本公开的一个实施例的可以应用深度学习模型的训练方法和/或文本检索方法的电子设备的框图。

具体实施方式

以下结合附图对本公开的示范性实施例做出说明，其中包括本公开实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本公开的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。

文本匹配包括交互式文本匹配和特征式文本匹配。例如，基于交互式文本匹配，可以将两个文本拼接在一起，得到拼接文本。对该拼接文本进行分类。基于分类结果，确定匹配结果。交互式文本匹配可以使得两个文本能够进行充分的比较，准确性通常较好，但是在检索场景的效率较差。又例如，基于特征式文本匹配，可以将两个句子分别进行编码，得到两个句向量。再对两个句向量进行简单的融合处理，以获取匹配结果。基于特征式文本匹配，可以提前计算并缓存好句向量，效率较高，但是句子间的交互程度较浅，匹配效果不如交互式。

在例如搜索引擎、智能问答、知识检索、对话系统等真实场景都可以应用文本匹配技术。在这些场景中，可以从大量的数据库中选取与用户输入内容最匹配的文本。用于文本匹配的相关模型的训练方式包括有监督训练和无监督训练。

在一些实施例中，可以利用各种模型确定文本之间的相似度，以便进行文本匹配。

例如，利用基于词频逆文档频率(Term Frequency-Inverse DocumentFrequency，TF-IDF)模型，可以对句子中的词进行独热(One-Hot)编码。根据词频和逆文档频率确定词的权重，以得到句向量。接下来，可以根据句向量进行文本相似度检索。词频逆文档频率模型可以在词汇层面进行相似度检索，检索效果有限。

例如，利用基于句子的Transformer的双向编码表示(Sentence-BERT)模型，可以在训练阶段提取不同句子的句向量。按照不同策略，对多个句向量进行拼接，得到拼接特征。再利用全连接层进行分类。在推理阶段，可以利用该模型提取句子的句向量。再确定该句向量与其他句向量之间的余弦相似度。训练阶段和推理阶段，该模型处理方式存在差异。在训练阶段未发挥余弦相似度的作用，导致训练难度较大，也导致模型的推理性能难以充分提高。

例如，利用基于Transformer的双向编码表示(Bidirectional EncoderRepresentations from Transformer，BERT)模型，可以将两个句子拼接为拼接文本，再处理拼接文本，使得两个句子可以充分的融合，以便进行比较。该模型可以包括一个用于确定相似度的全连接层。该模型的准确性较高，但一次只能处理一对句子，大规模检索性能较差。

图1是根据本公开的一个实施例的深度学习模型的训练方法的流程图。

如图1所示，该方法100可以包括操作S110至操作S130。

在操作S110，将至少一个第一样本文本对分别输入深度学习模型，得到至少一个第一样本文本向量对。

在本公开实施例中，第一样本文本对可以包括两个第一样本文本。例如，第一样本文本对(i，j)可以包括第一样本文本i和第一样本文本j。

在本公开实施例中，第一样本文本向量对可以包括两个第一样本文本向量。例如，第一样本文本向量对(u_i，u_j)可以包括第一样本文本向量u_i和第一样本文本向量u_j。第一样本文本向量u_i可以与第一样本文本i对应。第一样本文本向量u_j可以与第一样本文本j对应。

在本公开实施例中，第一样本文本对可以为N个。例如，N可以为大于或等于1的整数。

在本公开实施例中，可以将相似度较高的两个样本文本作为第一样本文本对。

在操作S120，将至少一个第二样本文本对分别输入深度学习模型，得到至少一个第二样本文本向量对。

在本公开实施例中，第二样本文本对可以包括两个第二样本文本。例如，第二样本文本对(k，l)可以包括第二样本文本k和第二样本文本1。

在本公开实施例中，第二样本文本向量对可以包括两个第二样本文本向量。例如，第二样本文本向量对(u_k，u_l)可以包括第二样本文本向量u_k和第二样本文本向量u_l。第二样本文本向量u_k可以与第二样本文本k对应。第一样本文本向量u_l可以与第一样本文本1对应。

在本公开实施例中，第二样本文本对可以为M个。例如，M可以为大于或等于1的整数。

在本公开实施例中，第一样本文本向量对的两个第一样本文本向量之间的第一相似度大于或等于第二样本文本向量对的两个第二样本文本向量之间的第二相似度。例如，第一相似度s_ij可以为第一样本文本向量u_i和第一样本文本向量u_j之间相似度。第二相似度s_kl可以为第二样本文本向量u_k和第二样本文本向量u_l之间相似度。第一相似度s_ij可以大于或等于第二相似度s_kl。

在本公开实施例中，可以将相似度较低的两个样本文本作为第二样本文本对。

在操作S130，根据至少一个第一相似度和至少一个第二相似度，训练深度学习模型。

在本公开实施例中，可以根据第一相似度与第二相似度之间的差异，调整深度学习模型的参数。例如，可以调整深度学习模型的参数，使得差异收敛。可以理解，可以进行H个轮次的训练，分别得到H个差异。H为大于1的整数。若第h个轮次的差异小于或等于第h-1个轮次的差异且第h个轮次的差异小于或等于第h+1个轮次的差异，可以确定在h个轮次训练后，差异收敛。h可以为大于1且小于H的整数。也可以理解，收敛的差异可以不为0。

通过本公开实施例，利用至少两个样本文本对的至少四个样本文本之间的相似性，训练了深度学习模型。可以在训练阶段就引入相似度。由此，针对用于文本匹配的模型，可以提高训练阶段和推理阶段的一致性。在推理阶段，经训练的深度学习模型的性能可以更加全面的发挥，有助于提高文本匹配或文本检索结果的精确度。

通过本公开实施例，可以利用相似度存在大小顺序的样本文本对来训练深度学习模型。由此，可以将各种文本对作为训练样本，降低了训练样本的获取难度，有助于进一步提高性能。

需要说明的是，操作S110与操作S120可以是先后执行的。但是本公开的实施例不限于此，这两组操作也可以按照其他顺序来执行，例如先执行操作S120，再执行操作S110，或者并行执行操作S110和操作S120。

可以理解，上文对本公开的方法流程进行了说明，下面将对本公开的深度学习模型进行说明。

图2是根据本公开的一个实施例的深度学习模型的示意图

在一些实施例中，深度学习模型可以包括编码器和解码器。如图2所示，深度学习模型200可以包括编码器210和解码器220。编码器210可以对样本文本进行编码，得到样本文本向量。解码器220可以对样本文本向量进行解码，得到解码结果。

本公开实施例中，编码器可以对样本文本进行编码，得到样本文本向量。

在本公开实施例中，训练深度学习模型可以包括：调整编码器的参数，以训练深度学习模型。

在本公开实施例中，深度学习模型可以是经过预训练的。例如，预训练的目标可以包括：使得深度学习模型可以输出较为准确的样本文本向量。例如，利用经过预训练的深度学习模型处理样本文本对中的样本文本，可以得到样本文本向量。又例如，在获取样本文本数据集时，可以将相似度较高的两个样本文本作为第一样本文本对，也可以将相似度较低的两个样本文本作为第二样本文本对。由此，利用经预训练的深度学习模型处理第一样本文本对的两个第一样本文本，可以得到两个第一样本文本向量。利用经预训练的深度学习模型处理第二样本文本对的两个第二样本文本，可以得到两个第二样本文本向量。两个第一样本文本向量之间的第一相似度可以大于两个第二样本文本向量之间的第二相似度。

可以理解，上文对本公开的深度学习模型进行了说明，下面将对训练深度学习模型的一些方式进行进一步说明。

在一些实施例中，可以将一个批次的样本文本输入深度学习模型。例如，第一批次batch1的样本文本可以包括第一样本文本对(i，j)和第二样本文本对(k，1)。

在一些实施例中，第一相似度可以为第一余弦相似度。例如，如图2所示，编码器210可以分别对第一样本文本对的第一样本文本i和第一样本文本j进行编码，得到第一样本文本向量对(u_i，u_j)。第一样本文本向量对(u_i，u_j)可以包括第一样本文本向量u_i和第一样本文本向量u_j。第一样本文本向量u_i和第一样本文本向量u_j之间的相似度可以为第一余弦相似度cos(u_i，u_j)。

在一些实施例中，第二相似度可以为第二余弦相似度。例如，如图2所示，编码器210可以分别对第二样本文本对的第二样本文本k和第二样本文本l进行编码，得到第二样本文本向量对(u_k，u_l)。第二样本文本向量对(u_k，u_l)可以包括第二样本文本向量u_k和第二样本文本向量u_l。第二样本文本向量u_k和第二样本文本向量u_l之间的相似度可以为第二余弦相似度cos(u_k，u_l)。

在一些实施例中，在上述的操作S230中，根据至少一个第一相似度和至少一个第二相似度，训练深度学习模型可以包括：确定至少一个第一相似度和至少一个第二相似度之间的至少一个差异。利用第一预设函数分别处理至少一个差异，得到至少一个第一处理结果。利用第二预设函数处理至少一个第一处理结果，得到损失信息。调整深度学习模型，使得损失信息收敛，以训练深度学习模型。通过本公开实施例，利用第一相似度和第二相似度之间的差异，确定了损失信息，使得深度学习模型可以学习到相似度高的样本文本对的信息，也可以学习到相似度低的样本文本对的信息。此外，利用两个预设函数依次处理了差异，有助于加快模型收敛，提高训练效率。

在本公开实施例中，确定至少一个第一相似度和至少一个第二相似度之间的至少一个差异可以包括：利用第二相似度减去第一相似度，得到差异。例如，可以利用第二余弦相似度cos(u_k，u_l)减去第一余弦相似度cos(u_i，u_j)。

在本公开实施例中，利用第一预设函数分别处理至少一个差异，得到至少一个第一处理结果包括：利用第一预设参数分别处理至少一个差异，得到至少一个第二处理结果。利用第一预设函数分别处理至少一个第二处理结果，得到至少一个第一处理结果。例如，第一预设参数可以为λ。λ可以为大于0的值。又例如，可以将第一预设参数与上述差异之间乘积，作为第二处理结果。又例如，第一预设函数可以为指数函数。该指数函数的底数可以为自然常数e。通过本公开实施例，在差异为负且第一预设函数为指数函数的情况下，利用第一预设参数处理相似度之间的差异，可以使得差异的绝对值增大，进而使得第二处理结果更加接近于0，有助于提高模型训练效率。

在本公开实施例中，利用第二预设函数处理至少一个第一处理结果，得到损失信息可以包括：将至少一个第一处理结果融合，得到第一融合结果。将第二预设参数和第一融合结果融合，得到第二融合结果。利用第二预设函数处理第二融合结果，得到损失信息。例如，可以将至少一个第一处理结果相加，得到第一融合结果。又例如，第二预设参数可以为预设值1。可以将第二预设参数与第一融合结果相加，得到第二融合结果。又例如，第二预设函数可以为对数函数。该对数函数的底数可以为任意数值。通过本公开实施例，将至少一个第一处理结果融合，使得深度学习模型可以处理一个批次的样本，提高训练效率。此外，在第二预设参数为1且第二预设函数为对数函数的情况下，有助于使得损失快速收敛，进一步提高训练效率。

例如，损失信息可以包括损失值。可以通过以下公式得到损失值loss1：

cos(u_i，u_j)可以为第一余弦相似度。cos(u_k，u_l)可以为第二余弦相似度。cos(u_k，u_l)-cos(u_i，u_j)可以作为上述的差异。e⁽⁾可以为第一预设函数。log()可以为第二预设函数。sim(i，j)＞sim(k.l)用于指示：第一样本文本对中两个样本文本之间的相似度大于第二样本文本对中两个样本文本之间的相似度。λ可以为第一预设参数。在一个示例中，λ可以为20。

可以理解，上文以第一批次的样本文本为示例，对本公开的深度学习模型进行了说明。但本公开不限于，一个批次的样本文本可以包括多个第一样本文本对和多个第二样本文本对，下面将结合图3进行说明。

图3是根据本公开的另一个实施例的深度学习模型的示意图。

第二批次batch2的样本文本可以包括第一样本文本对(i1，j1)、第一样本文本对(i2，j2)、第二样本文本对(k1，11)和第二样本文本对(k2，12)。

如图3所示，编码器310可以分别对第一样本文本对的第一样本文本i1和第一样本文本j1进行编码，得到第一样本文本向量对(u_i1，u_j1)。在第一样本文本向量对(u_i1，u_j1)中，第一样本文本向量u_i1和第一样本文本向量u_j1之间的相似度可以为第一余弦相似度cos(u_i1，u_j1)。编码器310也可以分别对第一样本文本对的第一样本文本i2和第一样本文本j2进行编码，得到第一样本文本向量对(u_i2，u_j2)。在第一样本文本向量对(u_i2，u_j2)中，第一样本文本向量u_i2和第一样本文本向量u_j2之间的相似度可以为第一余弦相似度cos(u_i2，u_j2)。

在本公开实施例中，第一相似度可以为正数。例如，第一余弦相似度cos(u_i1，u_j1)可以大于0。第一余弦相似度cos(u_i2，u_j2)可以大于o。

如图3所示，编码器310可以分别对第二样本文本对的第二样本文本k1和第er样本文本11进行编码，得到第二样本文本向量对(u_k1，u_l1)。在第二样本文本向量对(u_k1，u_l1)中，第二样本文本向量u_k1和第二样本文本向量u_l1之间的相似度可以为第二余弦相似度cos(u_k1，u_l1)。编码器310也可以分别对第二样本文本对的第二样本文本k2和第二样本文本12进行编码，得到第二样本文本向量对(u_k2，u_l2)。在第二样本文本向量对(u_k2，u₁₂)中，第二样本文本向量u_k2和第二样本文本向量u_l2之间的相似度可以为第二余弦相似度cos(u_k2，u₁₂)。

在本公开实施例中，第二相似度可以为负数。例如，第二余弦相似度cos(u_k1，u₁₁)可以小于0。第二余弦相似度cos(u_k2，u_l2)可以小于0。通过本公开实施例，第一样本文本对可以作为正样本对，第二样本文本对可以作为负样本对。利用正负样本对对模型进行训练，可以进一步提高模型训练效率。

例如，损失信息可以包括损失值。可以通过以下公式得到损失值loss1′：

e⁽⁾可以为第一预设函数。log()可以为第二预设函数。λ可以为第一预设参数。可以为包括多个第一样本文本对的集合。例如，集合/>可以包括第一样本文本对(i1，j1)和第一样本文本对(i2，j2)。/>可以为包括多个第二样本文本对的集合。例如，集合/>可以包括第二样本文本对(k1，11)和第二样本文本对(k2，12)。

可以表示第一处理结果。例如，本实施例中，多个第一处理结果可以包括：/> 以及/>将这些第一处理结果相加，可以得到第一融合结果

可以理解，可以利用上述的公式一或公式二确定损失值，但本公开不限于此，下面将结合相关实施例进行说明。

在本公开实施例中，可以根据第一相似度和第二相似度中的至少一个以及第三预设参数，确定损失信息。

例如，可以通过以下公式确定损失值：

loss2＝t(1-cos(u_x，u_y))+(1-t)(1+cos(ux，u_y)) (公式三)

cos(u_x，u_y)的取值可以为上述的第一余弦相似度或第二余弦相似度。t可以为第三预设参数。t可以为大于0且小于1的数值。通过本公开实施例，利用公式三可以确定多个损失值，以便训练深度学习模型。基于公式三确定的损失值训练深度学习模型之后，可以使得第一样本文本向量对中两个第一样本文本向量之间的相似度尽可能的大，也可以使得第二样本文本向量对中两个第二样本文本向量之间的相似度尽可能的小。

例如，也可以通过以下公式确定损失值：

loss2′＝t(1-cos(u_x，u_y))²+(1-t)cos²(u_x，u_y) (公式四)

cos(u_x，u_y)的取值可以为上述的第一余弦相似度或第二余弦相似度。t可以为第三预设参数。t可以为大于0且小于1的数值。通过本公开实施例，利用公式四可以确定多个损失值，以便训练深度学习模型。基于公式四确定的损失值训练深度学习模型之后，可以使得第一样本文本向量对中两个第一样本文本向量之间的相似度尽可能的大，也可以使得第二样本文本向量对中两个第二样本文本向量之间的相似度尽可能的小。

在本公开实施例中，可以分别利用公式一至公式四确定损失值，并利用相应的损失值进行模型训练实验。基于实验结果，与公式三或公式四相比，利用公式一或公式二确定的损失值训练模型，可以使得模型快速收敛。此外，在利用公式一或公式二确定的损失值训练模型之后，经训练的模型在推理阶段的性能更强。这可能是由于公式一和公式二包含第一相似度与第二相似度之间的差异，使得经训练的深度学习模型可以高效地从存在相似度高底顺序的第一样本文本对和第二样本文本对中学习相关信息。

图4是根据本公开的另一个实施例的文本检索方法的流程图。

如图4所示，该方法400可以包括操作S410至操作S420。

在操作S410，将目标文本输入深度学习模型，得到目标文本向量。

在本公开实施例中，目标文本可以是目标用户输入的文本。

在本公开实施例中，深度学习模型可以包括编码器和解码器。例如，编码器可以对目标文本进行编码，得到目标文本向量。解码器可以对目标文本向量进行解码，得到解码结果。

在本公开实施例中，深度学习模型的编码器可以是利用本公开提供的方法的训练的。例如，深度学习模型可以使用上述的方法200训练的。

在操作S420，根据目标文本向量与多个预设文本向量之间的多个目标相似度，得到目标检索结果。

在本公开实施例中，预设文本向量可以利用编码器对预设文本进行编码得到的。

在本公开实施例中，目标相似度可以是目标余弦相似度。

在本公开实施例中，目标检索结果可以是与目标文本对应的文本。例如，预设文本向量u_s与目标文本向量u_T之间的目标相似度最高。可以将预设文本向量u_s对应的预设文本作为目标检索结果。

图5是根据本公开的一个实施例的深度学习模型的训练装置的框图。

如图5所示，该装置500可以包括第一获得模块510、第二获得模块520和训练模块530。

第一获得模块510，用于将至少一个第一样本文本对分别输入深度学习模型，得到至少一个第一样本文本向量对。例如，所述第一样本文本对包括两个第一样本文本，第一样本文本向量对包括两个第一样本文本向量。

第二获得模块520，用于将至少一个第二样本文本对分别输入深度学习模型，得到至少一个第二样本文本向量对。例如，所述第二样本文本对包括两个第二样本文本，第二样本文本向量对包括两个第二样本文本向量，第一样本文本向量对的两个第一样本文本向量之间的第一相似度大于或等于第二样本文本向量对的两个第二样本文本向量之间的第二相似度。

训练模块530，用于根据至少一个第一相似度和至少一个第二相似度，训练深度学习模型。

在一些实施例中，训练模块包括：确定子模块，用于确定至少一个第一相似度和至少一个第二相似度之间的至少一个差异。第一处理子模块，用于利用第一预设函数分别处理至少一个差异，得到至少一个第一处理结果。第二处理子模块，用于利用第二预设函数处理至少一个第一处理结果，得到损失信息。第一调整子模块，用于调整深度学习模型，使得损失信息收敛，以训练深度学习模型。

在一些实施例中，确定子模块包括：获得单元，用于利用第二相似度减去第一相似度，得到差异。

在一些实施例中，第一处理子模块包括：第一处理单元，用于利用第一预设参数分别处理至少一个差异，得到至少一个第二处理结果。第二处理单元，用于利用第一预设函数分别处理至少一个第二处理结果，得到至少一个第一处理结果。

在一些实施例中，第二处理子模块包括：第一融合单元，用于将至少一个第一处理结果融合，得到第一融合结果。第二融合单元，用于将第二预设参数和第一融合结果融合，得到第二融合结果。第三处理单元，用于利用第二预设函数处理第二融合结果，得到损失信息。

在一些实施例中，第一相似度为第一余弦相似度，第二相似度为第二余弦相似度。

在一些实施例中，第一相似度为正数，第二相似度为负数。

在一些实施例中，深度学习模型包括编码器，训练模块包括：第二调整子模块，用于调整编码器的参数，以训练深度学习模型。

图6是根据本公开的另一个实施例的文本检索装置的框图。

如图6所示，该装置600可以包括第三获得模块61 0和第四获得模块620。

第三获得模块630，用于将目标文本输入深度学习模型，得到目标文本向量。

第四获得模块640，用于根据目标文本向量与多个预设文本向量之间的多个目标相似度，得到目标检索结果。

在本公开实施例中，深度学习模型的编码器是利用本公开提供的装置训练的。

本公开的技术方案中，所涉及的用户个人信息的收集、存储、使用、加工、传输、提供和公开等处理，均符合相关法律法规的规定，且不违背公序良俗。

根据本公开的实施例，本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。

图7示出了可以用来实施本公开的实施例的示例电子设备700的示意性框图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本公开的实现。

如图7所示，设备700包括计算单元701，其可以根据存储在只读存储器(ROM)702中的计算机程序或者从存储单元708加载到随机访问存储器(RAM)703中的计算机程序，来执行各种适当的动作和处理。在RAM 703中，还可存储设备700操作所需的各种程序和数据。计算单元701、ROM 702以及RAM 703通过总线704彼此相连。输入/输出(I/O)接口705也连接至总线704。

设备700中的多个部件连接至I/O接口705，包括：输入单元706，例如键盘、鼠标等；输出单元707，例如各种类型的显示器、扬声器等；存储单元708，例如磁盘、光盘等；以及通信单元709，例如网卡、调制解调器、无线通信收发机等。通信单元709允许设备700通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。

计算单元701可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元701的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元701执行上文所描述的各个方法和处理，例如深度学习模型的训练方法和/或文本检索方法。例如，在一些实施例中，深度学习模型的训练方法和/或文本检索方法可被实现为计算机软件程序，其被有形地包含于机器可读介质，例如存储单元708。在一些实施例中，计算机程序的部分或者全部可以经由ROM 702和/或通信单元709而被载入和/或安装到设备700上。当计算机程序加载到RAM703并由计算单元701执行时，可以执行上文描述的深度学习模型的训练方法和/或文本检索方法的一个或多个步骤。备选地，在其他实施例中，计算单元701可以通过其他任何适当的方式(例如，借助于固件)而被配置为执行深度学习模型的训练方法和/或文本检索方法。

本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、复杂可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器，使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行，作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本公开的上下文中，机器可读介质可以是有形的介质，其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备，或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的显示装置(例如，CRT(阴极射线管)显示器或者LCD(液晶显示器))；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(LAN)、广域网(WAN)和互联网。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本公开公开的技术方案所期望的结果，本文在此不进行限制。

上述具体实施方式，并不构成对本公开保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等，均应包含在本公开保护范围之内。

Claims

1.一种深度学习模型的训练方法，包括：

将至少一个第一样本文本对分别输入深度学习模型，得到至少一个第一样本文本向量对，其中，所述第一样本文本对包括两个第一样本文本，所述第一样本文本向量对包括两个第一样本文本向量，所述深度学习模型包括编码器；

将至少一个第二样本文本对分别输入所述深度学习模型，得到至少一个第二样本文本向量对，其中，所述第二样本文本对包括两个第二样本文本，所述第二样本文本向量对包括两个第二样本文本向量，所述第一样本文本向量对的两个所述第一样本文本向量之间的第一相似度大于或等于所述第二样本文本向量对的两个所述第二样本文本向量之间的第二相似度；

确定至少一个所述第一相似度和至少一个所述第二相似度之间的至少一个差异；

利用第一预设函数分别处理至少一个所述差异，得到至少一个第一处理结果；

利用第二预设函数处理至少一个所述第一处理结果，得到损失信息；以及

调整所述深度学习模型，使得所述损失信息收敛，以训练所述深度学习模型，

其中，所述确定至少一个所述第一相似度和至少一个所述第二相似度之间的至少一个差异包括：

利用所述第二相似度减去所述第一相似度，得到所述差异。

2.根据权利要求1所述的方法，其中，所述利用第一预设函数分别处理至少一个所述差异，得到至少一个第一处理结果包括：

利用第一预设参数分别处理至少一个所述差异，得到至少一个第二处理结果；

利用所述第一预设函数分别处理至少一个所述第二处理结果，得到至少一个所述第一处理结果。

3.根据权利要求1所述的方法，其中，所述利用第二预设函数处理至少一个所述第一处理结果，得到损失信息包括：

将至少一个所述第一处理结果融合，得到第一融合结果；

将第二预设参数和所述第一融合结果融合，得到第二融合结果；

利用所述第二预设函数处理所述第二融合结果，得到所述损失信息。

4.根据权利要求1所述的方法，其中，所述第一相似度为第一余弦相似度，所述第二相似度为第二余弦相似度。

5.根据权利要求1所述的方法，其中，所述第一相似度为正数，所述第二相似度为负数。

6.根据权利要求1所述的方法，其中，所述训练所述深度学习模型包括：

调整所述编码器的参数，以训练所述深度学习模型。

7.一种文本检索方法，包括：

将目标文本输入深度学习模型，得到目标文本向量；

根据目标文本向量与多个预设文本向量之间的多个目标相似度，得到目标检索结果，

其中，所述深度学习模型的编码器是利用权利要求1至6任一项所述的方法训练的。

8.一种深度学习模型的训练装置，包括：

第一获得模块，用于将至少一个第一样本文本对分别输入深度学习模型，得到至少一个第一样本文本向量对，其中，所述第一样本文本对包括两个第一样本文本，所述第一样本文本向量对包括两个第一样本文本向量，所述深度学习模型包括编码器；

第二获得模块，用于将至少一个第二样本文本对分别输入所述深度学习模型，得到至少一个第二样本文本向量对，其中，所述第二样本文本对包括两个第二样本文本，所述第二样本文本向量对包括两个第二样本文本向量，所述第一样本文本向量对的两个所述第一样本文本向量之间的第一相似度大于或等于所述第二样本文本向量对的两个所述第二样本文本向量之间的第二相似度；

确定子模块，用于确定至少一个所述第一相似度和至少一个所述第二相似度之间的至少一个差异；

第一处理子模块，用于利用第一预设函数分别处理至少一个所述差异，得到至少一个第一处理结果；

第二处理子模块，用于利用第二预设函数处理至少一个所述第一处理结果，得到损失信息；以及

第一调整子模块，用于调整所述深度学习模型，使得所述损失信息收敛，以训练所述深度学习模型，

其中，所述确定子模块包括：

获得单元，用于利用所述第二相似度减去所述第一相似度，得到所述差异。

9.根据权利要求8所述的装置，其中，所述第一处理子模块包括：

第一处理单元，用于利用第一预设参数分别处理至少一个所述差异，得到至少一个第二处理结果；

第二处理单元，用于利用所述第一预设函数分别处理至少一个所述第二处理结果，得到至少一个所述第一处理结果。

10.根据权利要求8所述的装置，其中，所述第二处理子模块包括：

第一融合单元，用于将至少一个所述第一处理结果融合，得到第一融合结果；

第二融合单元，用于将第二预设参数和所述第一融合结果融合，得到第二融合结果；

第三处理单元，用于利用所述第二预设函数处理所述第二融合结果，得到所述损失信息。

11.根据权利要求8所述的装置，其中，所述第一相似度为第一余弦相似度，所述第二相似度为第二余弦相似度。

12.根据权利要求8所述的装置，其中，所述第一相似度为正数，所述第二相似度为负数。

13.根据权利要求10所述的装置，其中，所述训练模块包括：

第二调整子模块，用于调整所述编码器的参数，以训练所述深度学习模型。

14.一种文本检索装置，包括：

第三获得模块，用于将目标文本输入深度学习模型，得到目标文本向量；

第四获得模块，用于根据目标文本向量与多个预设文本向量之间的多个目标相似度，得到目标检索结果，

其中，所述深度学习模型的编码器是利用权利要求8至13任一项所述的装置训练的。

15. 一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1至7中任一项所述的方法。

16.一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行根据权利要求1至7中任一项所述的方法。

17.一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现根据权利要求1至7中任一项所述的方法。