WO2022088602A1

WO2022088602A1 - 相似对问题预测的方法、装置及电子设备

Info

Publication number: WO2022088602A1
Application number: PCT/CN2021/083022
Authority: WO
Inventors: 常德杰; 刘邦长; 谷书锋; 赵红文; 罗晓斌; 张一坤; 武云召; 刘朝振; 王海; 张航飞; 季科
Original assignee: 北京妙医佳健康科技集团有限公司
Priority date: 2020-11-02
Filing date: 2021-03-25
Publication date: 2022-05-05
Also published as: CN112017777A; CN112017777B

Abstract

一种相似对问题预测的方法、装置及电子设备，其中，该方法将待预测相似对问题输入至多个不同的预测模型中，获得每个预测模型输出的预测结果(S102)；其中，至少一个预测模型的嵌入层加入随机扰动参数；对多个预测结果进行投票运算，得到待预测相似对问题的最终预测结果(S104)。该方法通过在预测模型的嵌入层加入随机扰动参数可有效防止预测模型过度学习样本知识造成的过拟合，进而利用上述预测模型对相似对问题进行预测可有效提高预测的准确性。

Description

相似对问题预测的方法、装置及电子设备

技术领域

本发明涉及神经网络模型技术领域，尤其是涉及一种相似对问题预测的方法、装置及电子设备。

背景技术

利用神经网络分类模型将患者常见的问题问答进行相似分类是一个有价值的事情，比如，识别患者相似问题，有利于理解患者真正诉求，帮助快速匹配准确答案，提升患者获得感；而归纳医生相似答案，可有助于分析答案规范性避免误诊。

目前，常在现有神经网络分类模型中加入固定扰动参数以防止过拟合，然而这种方式在模型训练的过程中容易学习到样本知识不利于防止过拟合。

发明内容

有鉴于此，本发明的目的在于提供一种相似对问题预测的方法、装置及电子设备，以缓解上述技术问题。

第一方面，本发明实施例提供了一种相似对问题预测的方法，其中，该方法包括：将待预测相似对问题输入至多个不同的预测模型中，获得每个预测模型输出的预测结果；其中，至少一个预测模型的嵌入层加入随机扰动参数；对多个预测结果进行投票运算，得到待预测相似对问题的最终预测结果。

结合第一方面，本发明实施例提供了第一方面的第一种可能的实施方式，其中，每个预测模型包括多个预测子模型，每个预测子模型是由分配函数确定的相似对问题训练样本集训练预测模型得到；获得每个预测模型输出的预测结果的步骤，包括：将待预测相似对问题输入每个预测模型包括的多个预测子模型中，得到每个预测子模型输出的预测子结果；将多个预测子结果进行投票运算，得到预测结果。

结合第一方面的第一种可能的实施方式，本发明实施例提供了第一方面的第二种可能的实施方式，其中，预测子模型采用以下方式训练，包括：获取原始相似对问题训练样本集；利用相似性传递原理对原始相似对问题训练样本集进行训练样本扩充处理，得到扩充相似对问题训练样本集；基于分配函数从扩充相似对问题训练样本集中确定相似对问题训练样本集；利用相似对问题训练样本集和特定相似对问题训练样本集训练预测模型得到预测子模型。

结合第一方面的第二种可能的实施方式，本发明实施例提供了第一方面的第三种可能的实施方式，其中，得到扩充相似对问题训练样本集之后，方法还包括：对扩充相似对问题训练样本集中的每对相似对问题训练样本进行顺序标号；基于分配函数从扩充相似对问题训练样本集中确定相似对问题训练样本集的步骤，包括：利用分配函数的第一函数从扩充相似对问题训练样本集中确定第一标号：利用分配函数的第二函数基于第一标号从扩充相似对问题训练样本集中确定第二标号：选取第一标号和第二标号区间内的扩充相似对问题训练样本集作为相似对问题训练样本集。

结合第一方面的第三种可能的实施方式，本发明实施例提供了第一方面的第四种可能的实施方式，其中，第一函数为：i＝AllNumber*radom(0,1)+offset；其中，i表示第一标号，i<AllNumber，AllNumber表示扩充相似对问题训练样本集的长度，offset表示偏移量，offset<AllNumber，offset为正整数。

结合第一方面的第三种可能的实施方式，本发明实施例提供了第一方面的第五种可能的实施方式，其中，第二函数为：j＝i+A％*AllNumber；其中，j表示第二标号，i≤j≤AllNumber，A为正整数，0≤A≤100，i表示第一标号，AllNumber表示扩充相似对问题训练样本集的长度。

结合第一方面的第二种可能的实施方式，本发明实施例提供了第一方面的第六种可能的实施方式，其中，特定相似对问题训练样本集中的每对特定相似对问题训练样本与相似对问题训练样本集的相似度均大于预设相似度；利用相似对问题训练样本集和特定相似对问题训练样本集训练预测模型得到预测子模型的步骤，包括：基于相似对问题训练样本集训练预测模型的第一预设网络层数参数，训练至预测模型的损失函数收敛时，得到预测模型的预测初步模型；基于特定相似对问题训练样本集训练预测初步模型的第二预设网络层数参数，训练至预测初步模型的损失函数收敛时，得到预测子模型。

结合第一方面，本发明实施例提供了第一方面的第气种可能的实施方式，其中，利用下式产生随机扰动参数：

其中，delta表示随机扰动参数，a表示参数因子，-5≤a≤5。

第二方面，本发明实施例还提供一种相似对问题预测的装置，其中，该装置包括：输入模块，用于将待预测相似对问题输入至多个不同的预测模型中，获得每个预测模型输出的预测结果；其中，至少一个预测模型的嵌入层加入随机扰动参数；运算模块，用于对多个预测结果进行一次投票运算，得到待预测相似对问题的最终预测结果。

第三方面，本发明实施例还提供一种电子设备，其中，包括处理器和存储器，存储器存储有能够被处理器执行的计算机可执行指令，处理器执行计算机可执行指令以实现上述方法。

本发明实施例带来了以下有益效果：

本发明实施例提供一种相似对问题预测的方法、装置及电子设备，其中，将待预测相似对问题输入至多个不同的预测模型中，获得每个预测模型输出的预测结果；其中，至少一个预测模型的嵌入层加入随机扰动参数；对多个预测结果进行投票运算，得到待预测相似对问题的最终预测结果。本申请通过在预测模型的嵌入层加入随机扰动参数可有效防止预测模型过度学习样本知识造成的过拟合，进而利用上述预测模型对相似对问题进行预测可有效提高预测的准确性。

本发明的其他特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本发明而了解。本发明的目的和其他优点在说明书以及附图中所特别指出的结构来实现和获得。

为使本发明的上述目的、特征和优点能更明显易懂，下文特举较佳实施例，并配合所附附图，作详细说明如下。

附图说明

为了更清楚地说明本发明具体实施方式或现有技术中的技术方案，下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施方式，对于本领域技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的一种相似对问题预测的方法的流程图；

图2为本发明实施例提供的一种训练样本扩充的示意图；

图3为本发明实施例提供的另一种相似对问题预测的方法的流程图；

图4为本发明实施例提供的一种相似对问题预测的装置的结构示意图；

图5为本发明实施例提供的一种电子设备的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合附图对本发明的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

目前，常在现有神经网络分类模型中加入固定扰动参数以防止过拟合，然而这种方式在模型训练的过程中容易学习到样本知识不利于防止过拟合。基于此，本发明实施例提供的一种相似对问题预测的方法、装置及电子设备，通过在预测模型的嵌入层加入随机扰动参数可有效防止预测模型过度学习样本知识造成的过拟合，进而利用上述预测模型对相似对问题进行预测可有效提高预测的准确性。

为便于对本实施例进行理解，首先对本发明实施例所公开的一种相似对问题预测的方法进行详细介绍。

参见图1所示的一种相似对问题预测的方法的流程图，该方法具体包括如下步骤：

步骤S102，将待预测相似对问题输入至多个不同的预测模型中，获得每个预测模型输出的预测结果；其中，至少一个预测模型的嵌入层加入随机扰动参数；

相似对问题是指两个比较相似的问题构成的一组相似对问题，比如，“剧烈运动后咯血，是怎么回事”和“剧烈运动后为什么会咯血”这两个问题构成一组相似对问题；“剧烈运动后咯血，是怎么回事”和“剧烈运动后咯血，应该怎么处理”这两个问题构成的一组相似对问题。

通常，不同的预测模型是指预测模型的类型不同，可选用常见的roberta wwm large模型、roberta pair large模型和ernie模型这三个预测类型不同的文本分类模型作为预测模型对待预测相似对问题进行预测，以分别得到这三个预测模型输出的预测结果。预测模型的确定可以根据实际需要进行选取，在此不进行限定。

其中，根据该预测结果可确定出该预测模型预测出该待预测相似对问题是含义相同的一组问题，还是含义不同的一组问题，如果得到的预测结果为0则表示含义相同，如果得到的预测结果为1则表示含义不相同，预测结果的含义可以根据需要进行设定，在此不进行限定。

在本实施例中，可在上述三个预测模型中至少一个模型的嵌入层加入随机扰动参数，可防止预测模型在模型训练过程中由于过度学习训练样本知识而导致的过拟合现象，进而可有效提高预测模型的预测能力。

具体地，利用下式产生随机扰动参数：

其中，delta表示随机扰动参数，a表示参数因子，-5≤a≤5。

步骤S104，对多个预测结果进行投票运算，得到待预测相似对问题的最终预测结果。

在本实施例中，投票运算可以为绝对多数投票法(得票超过一半)、相对多数投票法(得票最多)或加权投票法，可以根据实际需要进行确定具体的投票方法在此不进行限定。

在本实施例中，采用相对多数投票方法对上述三个预测模型的输出预测结果进行投票运算，得到待预测相似对问题的最终预测结果；比如，待预测相似对问题输入至roberta wwm large模型得到的预测结果为0，待预测相似对问题输入至roberta pair large模型得到的预测结果为0、待预测相似对问题输入至ernie模型得到的预测结果为1，基于相对多数投票法得到最终预测结果为0，则表示待预测相似对问题为含义相同的一组问题对。

本发明实施例提供一种相似对问题预测的方法，其中，将待预测相似对问题输入至多个不同的预测模型中，获得每个预测模型输出的预测结果；其中，至少一个预测模型的嵌入层加入随机扰动参数；对多个预测结果进行投票运算，得到待预测相似对问题的最终预测结果。本申请通过在预测模型的嵌入层加入随机扰动参数可有效防止预测模型过度学习样本知识造成的过拟合，进而利用上述预测模型对相似对问题进行预测可有效提高预测的准确性。

通常，每个预测模型包括多个预测子模型，每个预测子模型是由分配函数确定出的相似对问题训练样本集训练预测模型得到的；具体地，预测子模型的训练过程，可由步骤A1-步骤A4实现：

步骤A1，获取原始相似对问题训练样本集；

该原始相似对问题训练样本集可以为预先从网络或其它存储设备上获取的，经去噪和清洗后的原始相似对问题训练样本集；在实际使用时，可对该原始相似对问题训练样本集进行特点探索和特征分布探索，主要进行的手段有探索，类别分布，句子长度分布探索等，可根据探索到的特点进行数据分析，以便于对预测模型后续训练的研究。

步骤A2，利用相似性传递原理对原始相似对问题训练样本集进行训练样本扩充处理，得到扩充相似对问题训练样本集；

上述原始相似对问题训练样本集都是带有标签的训练样本，以用于训练预测模型的训练，为了便于理解，图2示出了一种训练样本扩充的示意图，如图2最左边示出的方框中，为采集到的原始相似对问题训练样本集，其中，query1(问题1)、query2(问题1)和label(标签)组成一组训练样本，比如，第一行中A和B对应的标签为1，表示问题A和问题B为含义不同的一组问题对，第二行中A和C对应的标签为1，表示问题A和问题C为含义不同的一组问题对，而第三行中的A和D、第四行中的A和E和第五行中的A和F对应的标签均为0，表示A和D为含义相同的一组问题对，A和E为含义相同的一组问题对，A和F为含义相同的一组问题对。

图2中右边方框所示的内容为利用相似性传递原理对左边方框中的原始相似对问题训练样本集进行训练样本扩充处理的扩充数据，具体地，由原始相似对问题训练样本集中的第一行训练样本和第二行训练样本可知，A和B为含义不同的一组问题对，A和C同样为含义不同的一组问题对，则可推断出B和C为含义不同的一组问题对；由原始相似对问题训练样本集中的第一行训练样本和第三行训练样本可知，由于A和D为含义相同的一组问题对，所以，B和D为含义相同的一组问题对；同理，可得到图2右边方框中的根据相似性传递原理对原始相似对问题训练样本集进行推导传递后的扩充数据，在此不对图2右边方框中剩余扩充数据的推导进行一一赘述。

为了保证扩充相似对问题训练样本集和相似对问题训练样本集的0/1标签分布比例相差无几，可在图2右边方框中选取出的扩充数据与原始相似对问题训练样本集的0/1标签分布比例接近于原始相似对问题训练样本集的0/1标签分布比例；由于原始相似对问题训练样本集的0/1标签分布比例为2:3，所以，可选取图2右边方框中选取一组标签为1和一组标签为0的扩充数据添加到原始相似对问题训练样本集以构成扩充相似对问题训练样本集，以保证扩充相似对问题训练样本集的0/1标签分布比例(3:4)与原始相似对问题训练样本集的0/1标签分布比例较为接近，具体地，可选取图2右边方框中第一行扩充数据和剩余6行扩充数据中的任意一行扩充数据添加到原始相似对问题训练样本集中形成训练扩充相似对问题训练样本集，以用于对预测子模型的训练。

步骤A3，基于分配函数从扩充相似对问题训练样本集中确定相似对问题训练样本集；

通常，在确定相似对问题训练样本集之前，需要对扩充相似对问题训练样本集中的每对相似对问题训练样本进行顺序标号，比如，上述扩充相似对问题训练样本集中一共有100个问题对，将该100个问题对按照顺序进行0-100的标号。

其中，步骤A3的过程可由步骤B1-步骤B3实现：

步骤B1，利用分配函数的第一函数从扩充相似对问题训练样本集中确定第一标号：

具体地，第一函数为：i＝AllNumber*radom(0,1)+offset；其中，i表示第一标号，i<AllNumber，AllNumber表示扩充相似对问题训练样本集的长度，offset表示偏移量，offset<AllNumber，offset为正整数。

继续以扩充相似对问题训练样本集中一共有100个问题对为例进行说明，其中，AllNumber的长度即为100，offset设置为10，在进行第一次确定第一标号时如果radom(0,1)的随机数为0.1，则经第一函数计算得到的第一标号为i＝20。其中，offset可以根据实际需要进行设置，在此不进行限定。

步骤B2，利用分配函数的第二函数基于第一标号从扩充相似对问题训练样本集中确定第二标注号：

上述第二函数为：j＝i+A％*AllNumber；其中，j表示第二标号，i≤j≤AllNumber，A为正整数，0≤A≤100。

如果设置A为20，则通过得到的i＝20可知，j＝40。其中，A可以根据实际需要进行设置，在此不进行限定。

步骤B3，选取第一标号和第二标号区间内的扩充相似对问题训练样本集作为相似对问题训练样本集。

在通过分配函数得到第一标号和第二标号后，分别与顺序标号的扩充相似对问题训练样本集进行标号匹配，将扩充相似对问题训练样本集中标号为20和标号为40区间内的训练样本作为一次相似对问题训练样本集。

由于分配函数中有radom(0,1)的存在，因此，每次确定出的相似对问题训练样本集也是随机的。

步骤A4，利用相似对问题训练样本集和特定相似对问题训练样本集训练预测模型得到预测子模型。

上述特定相似对问题训练样本集为根据实际预测问题对而特定采集的训练样本，以增强预测子模型的预测能力，例如，本次是医学方面的问题对预测，所以单纯倚靠上述三个预测模型(上述三个预测模型均为bert模型)本身预训练模型可能不够，所以本次在bert的基础上，通过网上获取医疗方面的语料样本训练一个医学方面的bert进行预训练的增强。

特定相似对问题训练样本集确定过程为：a)广泛收集网站上的问题对；b)和扩充相似对问题训练样本集中的问题对进行相似度的比对，可采用曼哈顿距离法、欧氏距离法、切比雪夫距离法等方法进行相似度的比对，在此不进行限定；将相似度大于预设相似度的医疗方面的语料样本留下，以构成特定相似对问题训练样本集。

具体利用相似对问题训练样本集和特定相似对问题训练样本集训练预测模型得到预测子模型的过程为：基于相似对问题训练样本集训练预测模型的第一预设网络层数参数，训练至预测模型的损失函数收敛时，得到预测模型的预测初步模型；基于特定相似对问题训练样本集训练预测初步模型的第二预设网络层数参数，训练至预测初步模型的损失函数收敛时，得到预测子模型。

比如，利用相似对问题训练样本集训练预测模型的前5层网络参数，得到预测初步模型，在使用筛选后的特定相似对问题训练样本集进行微调训练bert的表示层参数，以得到预测子模型。

基于以上对预测子模型的训练的描述，本实施例提供了另一种相似对问题预测的方法，该方法在上述实施例的基础上实现；本实施例重点描述获得每个预测模型输出的预测结果的具体实施方式。如图3所示的另一种相似对问题预测的方法的流程图，本实施例中的相似对问题预测的方法包括如下步骤：

步骤S302，将待预测相似对问题输入每个预测模型包括的多个预测子模型中，得到每个预测子模型输出的预测子结果；

预测模型包括的多个预测子模型均是利用分配函数确定出的多份相似对问题训练样本集和特定相似对问题训练样本集分别对预测模型(例如，roberta wwm large模型)进行训练得到的多个预测子模型，这多个预测子模型由于相似对问题训练样本集可能存在不同，所以，这多个训练好的预测子模型的内部参数可能不同，因此，多个预测子模型输出的预测子结果可能存在不同。

在本实施例中，每个预测模型利用分配函数确定出的5份相似对问题训练样本集和特定相似对问题训练样本集进行训练得到5个预测子模型为例进行说明，则上述三个预测模型可得到15个预测子模型。

步骤S304，将多个预测子结果进行投票运算，得到预测结果；

将每个预测模型包括的5个预测子模型分别进行一次投票运算，得到每个预测模型对应的预测结果，以roberta wwm large模型的5个预测子模型为例进行说明，其中，5个预测子模型得到的预测子结果分别为0、0、1、0、0，采用相对多数投票方法进行投票运算时，得到的roberta wwm large模型的预测结果则为0，roberta pair large模型的预测结果和ernie模型的预测结果同roberta wwm large模型得到的预测结果的方法相同，在此不一一进行赘述。其中，投票运算的方法可以根据实际需要进行选取，在此不进行限定。

步骤S306，对多个预测结果进行投票运算，得到待预测相似对问题的最终预测结果。

对于roberta wwm large模型、roberta pair large模型和ernie模型在分别利用其多个预测子模型的预测子结果得到预测结果后，还需要在进行一次投票运算才能得到待预测相似对问题的最终预测结果。

本发明实施例提供的上述似对问题预测的方法，首先通过每个预测模型包含的多个预测子模型输出的预测子结果的一次投票运算得到每个预测模型的预测结果，再将多个预测模型的预测结果进行二次投票才得到待预测相似对问题的最终预测结果。本申请利用预测模型内部投票结束后，再进行预测模型之间的投票，生成最终预测结果，二次投票运算能够增强模型可信度，可提高模型的预测准确率。

对应于上述方法实施例，本发明实施例提供了一种相似对问题预测的装置，图4示出了一种相似对问题预测的装置的结构示意图，如图4所示，该装置包括：

输入模块402，用于将待预测相似对问题输入至多个不同的预测模型中，获得每个预测模型输出的预测结果；其中，至少一个预测模型的嵌入层加入随机扰动参数；

运算模块404，用于对多个预测结果进行一次投票运算，得到待预测相似对问题的最终预测结果。

本发明实施例提供一种相似对问题预测的装置，其中，将待预测相似对问题输入至多个不同的预测模型中，获得每个预测模型输出的预测结果；其中，至少一个预测模型的嵌入层加入随机扰动参数；对多个预测结果进行投票运算，得到待预测相似对问题的最终预测结果。本申请通过在预测模型的嵌入层加入随机扰动参数可有效防止预测模型过度学习样本知识造成的过拟合，进而利用上述预测模型对相似对问题进行预测可有效提高预测的准确性。

本申请实施例还提供了一种电子设备，如图5所示，为该电子设备的结构示意图，其中，该电子设备包括处理器121和存储器120，该存储器120存储有能够被该处理器121执行的计算机可执行指令，该处理器121执行该计算机可执行指令以实现上述相似对问题预测的方法。

在图5示出的实施方式中，该电子设备还包括总线122和通信接口123，其中，处理器121、通信接口123和存储器120通过总线122连接。

其中，存储器120可能包含高速随机存取存储器(RAM，Random Access Memory)，也可能还包括非不稳定的存储器(non-volatile memory)，例如至少一个磁盘存储器。通过至少一个通信接口123(可以是有线或者无线)实现该系统网元与至少一个其他网元之间的通信连接，可以使用互联网，广域网，本地网，城域网等。总线122可以是ISA(Industry Standard Architecture，工业标准体系结构)总线、PCI(Peripheral Component Interconnect，外设部件互连标准)总线或EISA(Extended Industry Standard Architecture，扩展工业标准结构)总线等。所述总线122可以分为地址总线、数据总线、控制总线等。为便于表示，图5中仅用一个双向箭头表示，但并不表示仅有一根总线或一种类型的总线。

处理器121可能是一种集成电路芯片，具有信号的处理能力。在实现过程中，上述方法的各步骤可以通过处理器121中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器121可以是通用处理器，包括中央处理器(Central Processing Unit，简称CPU)、网络处理器(NetworkProcessor，简称NP)等；还可以是数字信号处理器(Digital Signal Processor，简称DSP)、专用集成电路(Application Specific Integrated Circuit，简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array，简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本申请实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器，闪存、只读存储器，可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器，处理器121读取存储器中的信息，结合其硬件完成前述实施例的相似对问题预测的方法的步骤。

本申请实施例还提供了一种计算机可读存储介质，该计算机可读存储介质存储有计算机可执行指令，该计算机可执行指令在被处理器调用和执行时，该计算机可执行指令促使处理器实现上述相似对问题预测的方法，具体实现可参见前述方法实施例，在此不再赘述。

本申请实施例所提供的相似对问题预测的方法、装置及电子设备的计算机程序产品，包括存储了程序代码的计算机可读存储介质，所述程序代码包括的指令可用于执行前面方法实施例中所述的方法，具体实现可参见方法实施例，在此不再赘述。

除非另外具体说明，否则在这些实施例中阐述的部件和步骤的相对步骤、数字表达式和数值并不限制本申请的范围。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

在本申请的描述中，需要说明的是，术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本申请和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本申请的限制。此外，术语“第一”、“第二”、“第三”仅用于描述目的，而不能理解为指示或暗示相对重要性。

最后应说明的是：以上所述实施例，仅为本申请的具体实施方式，用以说明本申请的技术方案，而非对其限制，本申请的保护范围并不局限于此，尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化，或者对其中部分技术特征进行等同替换；而这些修改、变化或者替换，并不使相应技术方案的本质脱离本申请实施例技术方案的精神和范围，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应所述以权利要求的保护范围为准。

Claims

一种相似对问题预测的方法，其特征在于，所述方法包括：

将待预测相似对问题输入至多个不同的预测模型中，获得每个所述预测模型输出的预测结果；其中，至少一个所述预测模型的嵌入层加入随机扰动参数；

对多个所述预测结果进行投票运算，得到所述待预测相似对问题的最终预测结果；

每个所述预测模型包括多个预测子模型，每个所述预测子模型是由特定相似对问题训练样本集和由分配函数确定的相似对问题训练样本集训练预测模型得到；

获得每个所述预测模型输出的预测结果的步骤，包括：

将所述待预测相似对问题输入每个所述预测模型包括的多个预测子模型中，得到每个所述预测子模型输出的预测子结果；

将多个所述预测子结果进行投票运算，得到所述预测结果；

所述预测子模型采用以下方式训练，包括：

获取原始相似对问题训练样本集；

利用相似性传递原理对所述原始相似对问题训练样本集进行训练样本扩充处理，得到扩充相似对问题训练样本集；

基于分配函数从所述扩充相似对问题训练样本集中确定相似对问题训练样本集；

利用所述相似对问题训练样本集和特定相似对问题训练样本集训练预测模型得到所述预测子模型；

其中，得到扩充相似对问题训练样本集之后，所述方法还包括：

对所述扩充相似对问题训练样本集中的每对相似对问题训练样本进行顺序标号；

基于所述分配函数从所述扩充相似对问题训练样本集中确定所述相似对问题训练样本集的步骤，包括：

利用所述分配函数的第一函数从所述扩充相似对问题训练样本集中确定第一标号：

利用所述分配函数的第二函数基于所述第一标号从所述扩充相似对问题训练样本集中确定第二标号：

选取所述第一标号和所述第二标号区间内的扩充相似对问题训练样本集作为所述相似对问题训练样本集。
根据权利要求1所述的方法，其特征在于，所述第一函数为：

i＝AllNumber*radom(0,1)+offset；

其中，i表示所述第一标号，i<AllNumber，AllNumber表示所述扩充相似对问题训练样本集的长度，offset表示偏移量，offset<AllNumber，offset为正整数。
根据权利要求2所述的方法，其特征在于，所述第二函数为：

j＝i+A％*AllNumber；

其中，j表示所述第二标号，i≤j≤AllNumber，A为正整数，0≤A≤100。
根据权利要求1所述的方法，其特征在于，所述特定相似对问题训练样本集中的每对特定相似对问题训练样本与所述相似对问题训练样本集的相似度均大于预设相似度；

利用所述相似对问题训练样本集和特定相似对问题训练样本集训练所述预测模型得到所述预测子模型的步骤，包括：

基于所述相似对问题训练样本集训练所述预测模型的第一预设网络层数参数，训练至预测模型的损失函数收敛时，得到所述预测模型的预测初步模型；

基于所述特定相似对问题训练样本集训练所述预测初步模型的第二预设网络层数参数，训练至所述预测初步模型的损失函数收敛时，得到所述预测子模型。
根据权利要求1所述的方法，其特征在于，利用下式产生所述随机扰动参数：

其中，delta表示所述随机扰动参数，a表示参数因子，-5≤a≤5。
一种相似对问题预测的装置，其特征在于，所述装置包括：

输入模块，用于将待预测相似对问题输入至多个不同的预测模型中，获得每个所述预测模型输出的预测结果；其中，至少一个所述预测模型的嵌入层加入随机扰动参数；

运算模块，用于对多个所述预测结果进行投票运算，得到所述待预测相似对问题的最终预测结果；

每个所述预测模型包括多个预测子模型，每个所述预测子模型是由特定相似对问题训练样本集和由分配函数确定的相似对问题训练样本集训练预测模型得到；

所述输入模块还用于，将所述待预测相似对问题输入每个所述预测模型包括的多个预测子模型中，得到每个所述预测子模型输出的预测子结果；

将多个所述预测子结果进行投票运算，得到所述预测结果；

所述预测子模型采用以下方式训练，包括：

获取原始相似对问题训练样本集；

利用相似性传递原理对所述原始相似对问题训练样本集进行训练样本扩充处理，得到扩充相似对问题训练样本集；

基于分配函数从所述扩充相似对问题训练样本集中确定相似对问题训练样本集；

利用所述相似对问题训练样本集和特定相似对问题训练样本集训练预测模型得到所述预测子模型；

其中，得到扩充相似对问题训练样本集之后，对所述扩充相似对问题训练样本集中的每对相似对问题训练样本进行顺序标号；

基于所述分配函数从所述扩充相似对问题训练样本集中确定所述相似对问题训练样本集的步骤，包括：

利用所述分配函数的第一函数从所述扩充相似对问题训练样本集中确定第一标号：

利用所述分配函数的第二函数基于所述第一标号从所述扩充相似对问题训练样本集中确定第二标号：

选取所述第一标号和所述第二标号区间内的扩充相似对问题训练样本集作为所述相似对问题训练样本集。
一种电子设备，其特征在于，包括处理器和存储器，所述存储器存储有能够被所述处理器执行的计算机可执行指令，所述处理器执行所述计算机可执行指令以实现权利要求1至5任一项所述方法。