WO2021139448A1

WO2021139448A1 - 基于多个源模型修正新模型的方法、装置以及计算机设备

Info

Publication number: WO2021139448A1
Application number: PCT/CN2020/132596
Authority: WO
Inventors: 徐玲玲; 雷晨雨; 张国辉; 宋晨
Original assignee: 平安科技（深圳）有限公司
Priority date: 2020-07-31
Filing date: 2020-11-30
Publication date: 2021-07-15
Also published as: CN111898682A; CN111898682B

Abstract

本申请及人工智能领域,提供了一种基于多个源模型修正新模型的方法、装置以及计算机设备，其中方法包括：将第一训练数据输入至新模型中得到第一当前向量；以及，将第一训练数据分别输入至多个预设的源模型中进行计算，得到对应各源模型的特征向量；并融合计算得到指标向量；计算第一当前向量与指标向量之间的梯度值；根据梯度值校正新模型中的参数。本申请的有益效果：通过将训练数据输入现有的多个源模型中，得到对应的多个特征向量，然后融合计算得到指标向量，然后计算指标向量与新模型得到的当前向量之间的梯度值，通过梯度值校正新模型中的参数。使新模型综合了多个源模型融合后的优点，避免了直接使用融合模型，体积变大，速度变慢的问题。

Description

基于多个源模型修正新模型的方法、装置以及计算机设备

本申请要求于2020年07月31日提交中国专利局、申请号为2020107609139，发明名称为“基于多个源模型修正新模型的方法、装置以及计算机设备”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及人工智能领域，特别涉及一种基于多个源模型修正新模型的方法、装置以及计算机设备。

背景技术

目前已经训练好的模型在某个场景下效果比较好，在其他场景下效果比较差，并且在外场训练的模型，其得到的数据不能直接利用，只能回流模型，但是后续继续优化新模型的时候缺少数据。设计新的模型需要清洗数据，给不同的数据添加相应的标签，若标签添加的不准确，则会导致输出的结果达不到精度要求，而发明人意识到直接使用融合模型，特别是使用多个模型时，融合后的模型过大，速度过慢。因此，亟需一种基于多个源模型修正新模型的方法。

技术问题

本申请的主要目的为提供一种基于多个源模型修正新模型的方法、装置以及计算机设备，旨在解决现有技术直接对多个模型直接进行融合时，导致融合后的模型过大的技术问题。

技术解决方案

一种基于多个源模型修正新模型的方法，包括：

将第一训练数据输入至所述新模型中进行计算，得到第一当前向量；以及，

将第一训练数据和翻转所述第一训练数据后得到的第二训练数据分别输入至多个预设的源模型中进行计算，得到对应各所述源模型的特征向量，其中，对应每一个所述源模型的特征向量包括多个；

分别计算每个所述源模型对应的所述特征向量的平均值；

将各所述源模型对应的平均值融合计算得到指标向量；

计算所述第一当前向量与所述指标向量的第一相似度值；

判断所述第一相似度值是否小于预设相似度值；

若所述第一相似度值小于预设相似度值，则计算所述第一当前向量与所述指标向量之间的梯度值；

根据所述梯度值校正所述新模型中的参数。

本申请还提供了一种基于多个源模型的新模型训练装置，包括：

训练数据计算模块，用于将第一训练数据输入至所述新模型中进行计算，得到第一当前向量；以及，

平均值计算模块，用于分别计算每个所述源模型对应的所述特征向量的平均值；

指标向量计算模块，用于将各所述源模型对应的平均值融合计算得到指标向量；

第一相似度值计算模块，用于计算所述第一当前向量与所述指标向量的第一相似度值；

第一相似度值判断模块，用于判断所述第一相似度值是否小于预设相似度值；

梯度值计算模块，用于若所述第一相似度值小于预设相似度值，则计算所述当前向量与所述指标向量之间的梯度值；

参数更新模块，用于根据所述梯度值校正所述新模型中的参数。

本申请还提供了一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现一种基于多个源模型修正新模型的方法的步骤：将第一训练数据输入至所述新模型中进行计算，得到第一当前向量；以及，

分别计算每个所述源模型对应的所述特征向量的平均值；

将各所述源模型对应的平均值融合计算得到指标向量；

计算所述第一当前向量与所述指标向量的第一相似度值；

判断所述第一相似度值是否小于预设相似度值；

根据所述梯度值校正所述新模型中的参数。

本申请还提供了一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现种基于多个源模型修正新模型的方法的步骤：将第一训练数据输入至所述新模型中进行计算，得到第一当前向量；以及，

分别计算每个所述源模型对应的所述特征向量的平均值；

将各所述源模型对应的平均值融合计算得到指标向量；

计算所述第一当前向量与所述指标向量的第一相似度值；

判断所述第一相似度值是否小于预设相似度值；

根据所述梯度值校正所述新模型中的参数。

有益效果

本申请的有益效果：通过将训练数据输入现有的多个源模型中，得到对应的多个特征向量，然后融合计算得到指标向量，然后计算指标向量与新模型得到的当前向量之间的梯度值，通过梯度值校正新模型中的参数。使新模型基于多个源模型训练而成，且无需将多个源模型进行融合，在提高新模型的计算精度的同时，使新模型综合了多个源模型融合后的优点，避免了直接使用融合模型，体积变大，速度变慢的问题。

附图说明

图1是本申请一实施例的一种基于多个源模型修正新模型的方法的流程示意图；

图2为本申请一实施例的基于多个源模型修正新模型的装置的结构示意框图；

图3为本申请一实施例的计算机设备的结构示意框图。

本发明的最佳实施方式

参照图1，本申请提出一种基于多个源模型修正新模型的方法，包括：

S1：将第一训练数据输入至所述新模型中进行计算，得到第一当前向量；以及，将第一训练数据和翻转所述第一训练数据后得到的第二训练数据分别输入至多个预设的源模型中进行计算，得到对应各所述源模型的特征向量，其中，对应每一个所述源模型的特征向量包括多个；

S2：分别计算每个所述源模型对应的所述特征向量的平均值；

S3：将各所述源模型对应的平均值融合计算得到指标向量；

S4：计算所述第一当前向量与所述指标向量的第一相似度值；

S5：判断所述第一相似度值是否小于预设相似度值；

S6：若所述第一相似度值小于预设相似度值，则计算所述当前向量与所述指标向量之间的梯度值；

S7：根据所述梯度值校正所述新模型中的参数。

如上述步骤S1所述，可以根据实际需要的数据选取多个预设的源模型，例如模型a在金融场景比较好，模型b在监控场景表现比较好，模型c在考勤场景比较比较好，需要获取的数据需要综合上边三个场景，那么就可以选取对应的模型a、模型b和模型c。需要说明的是，对于选取训练模型，其可以只是训练完毕的模型，而不需要其原始训练数据。将训练数据和其翻转后的数据输入至预设的源模型中，可以得到每个模型对应的多个特征向量，本文以只进行了左右翻转为例，假设为翻转前的第一训练数据输入至模型a中得到特征向量aV1，将左右翻转后的第二训练数据输入至模型a中得到特征向量aV2，当然，若输入至模型 b中，相应得到特征向量bV1和bV2,若还具有模型c，模型d等，按照相应的方法得到对应模型的两个特征向量，需要说明的是，由于训练数据相同，故而其翻转后的数据与该训练数据也是相似的，本申请将训练数据翻转，是为了获取训练数据在各模型中得到更多的值，以便于后续计算过程中提升训练模型的精度。与此同时，还将第一训练数据输入至新模型中，得到第一当前向量。

如上述步骤S2所述，不同的源模型通过第一训练数据和其翻转后的第二训练数据输计算得到多个特征向量，然后计算得到对应同一个源模型的特征向量的平均值。求出的平均值是各模型基于训练数据得到的一个优值，一般而言，该平均值的结果会优于将第一训练数据直接输入后得到的值。

如上述步骤S3所述，然后再将各源模型对应的平均值进行融合，形成一个完整的输出，即求各源模型对应的平均值的均值，或者将各平均值进行降维操作，举例而言，假设具有两个模型那么各模型的平均值分别为aV＝(aV1+aV2)/2，bV＝(bV1+bV2)/2，然后将其融合，假设融合是求各源模型对应的平均值的均值(指标向量)，那么均值V＝(aV+bV)/2，若融合是采取降维的方式，那么降维的方法可以是缺失值比率、低方差滤波、高相关滤波、随机森林/组合树、主成分分析和反特征消除中的一种，最终得到指标向量，用于对新模型训练的对比。

如上述步骤S4所述，将第一当前向量与指标向量进行比较，即计算第一相似度值，计算的公式可以是

当acc的值越接近于1，表明当前向量与指标向量越相似，当acc的值越接近于0时，表明当前向量与指标向量越不相似。其中公式中acc表示第一相似度值，zv _i表示在第i特征向量维度中对应的当前向量数值，v _i表示在第i特征向量维度中对应的指标向量数值，n为特征向量维度数量。

如上述步骤S5-S7所述，将计算的第一相似度值与相似度阈值进行比较，若当前的相似度大于相似度阈值，则可以说明当前向量可以相当于目标向量；若当前的相似度小于相似度阈值，则表明当前向量不是目标向量，还需要调整模型中的参数，重新获取当前向量，具体地，根据loss获取梯度值，获取梯度原始值的公式为

其中Loss(zV,V)为梯度的原始值，zv _i表示在第i特征向量维度中对应的当前向量，v _i表示在第i特征向量维度中对应的指标向量，n为特征向量维度数量。然后再对Loss(zV,V)进行求导，得到梯度值，然后再根据获取到的梯度值校正新模型中的参数，以达到训练新模型的技术效果。

本实施例中，上述若所述第一相似度值小于预设相似度值，则计算所述当前向量与所述指标向量之间的梯度值，并根据所述梯度值校正所述新模型中的参数的步骤S7之后，还包括：

S8：将所述第一训练数据输入到校正参数后的新模型中进行计算，得到第二当前向量，并计算所述第二当前向量与所述指标向量的第二相似度值；

S9：判断所述第二相似度值是否大于所述预设相似度值；

S10，若第二相似度值大于所述预设相似度值，则认定所述新模型基于所述第一训练数据的训练完成。

如上述步骤S8-S10所述，可以对校正后的参数再次进行检测，即将根据校正后的参数重新计算当前向量，并计算与指标向量的第二相似度值，若第二相似度值大于预设相似度值，则可以将重新计算后的当前向量记为目标向量。若第二相似度值小于或等于预设相似度值，则可以通过上述loss继续获取新的梯度值，根据新的梯度值更改对应的参数，重复多次，直至当前向量与指标向量的第二相似度值大于预设相似度值，认定所述新模型基于所述第一训练数据的训练完成。另外，还可以输入新的训练数据，获取新的指标向量和当前向量，对新模型进行多次反复的训练，达到一定次数后，视为完成了新模型的训练。

本实施例中，上述将各所述源模型对应的平均值融合计算得到指标向量的步骤S3，包括：

S301：获取所述新模型在不同应用场景的相关因子；

S302：根据选取的所述源模型的应用场景，依照公式

融合计算得到指标向量，其中，V为目标向量，w _i为第i个应用场景的相关因子，f(w _i)为应用场景为第i个场景的源模型的平均值。

如上述步骤S301-S302所述，获取新模型在不同应用场景下的相关因子，该相关因子可以是基于新模型的作用进行确定的，例如新模型是为了公司的人员管理，则相关因子较大的应用场景为监控场景、考勤场景等，而金融场景的相关因子较小，其中相关因子的数值可以根据新模型的作用进行确定，例如可以将监控场景的相关因子设置为0.5，将考勤的相关因子设置为0.7，将金融场景的相关因子设置为0.2，然后再根据公式

依据各个场景的相关因子计算得到指标向量，使后续基于指标向量计算相似度值，以及更新的参数可以更加贴近新模型的应用，使训练得到的新模型更好。

本实施例中，如上述计算所述第一当前向量与所述指标向量的第一相似度值的步骤S4，包括：

S401：获取所述指标向量和所述第一当前向量的参数值，其中所述参数值至少包括所述指标向量和所述当前向量的特征向量维度数量，以及在各维度中指标向量数值和当前向量数值；

S402：根据公式

计算第一相似度值，其中acc表示第一相似度值，zv _i表示在第i特征向量维度中对应的第一当前向量数值，v _i表示在第i特征向量维度中对应的指标向量数值，n为特征向量维度数量。

如上述步骤S401-S402所述，将根据所述指标向量和所述当前向量的特征向量维度数量，以及在各维度中指标向量数值和当前向量数值依照公式计算第一相似度值，当acc的值越接近于1，表明当前向量与指标向量越相似，当acc的值越接近于0时，表明当前向量与指标向量越不相似。其中公式中acc表示第一相似度值，zvi表示在第i特征向量维度中对应的当前向量数值，vi表示在第i特征向量维度中对应的指标向量数值，n为特征向量维度数量。根据上述公式计算的第一相似度值可以判断新模型的输出的当前向量，与其他模型融合后的指标向量的相似度，再根据相似度判断新模型是否需要调整参数。其中，第一相似度值越趋近于1时，则认为当前向量与指标向量越相关，第一相似度值越趋近于0时，则认为当前向量与指标向量越不相关。

本实施例中，上述将第一训练数据输入至所述新模型中进行计算，得到第一当前向量的步骤S1之前，包括：

S001：当所述第一训练数据为图片时，获取图片中的每个像素点，将每个所述像素点和预设像素点阈值进行比较；

S002：将小于所述预设像素点阈值的像素点设置为0，将大于所述预设像素点阈值的像素点设置为1；

S003：将所述图片平均划分为多个区域，并统计每个区域中的像素点为1的个数，并构成矩阵作为所述训练数据。

如上述步骤S001-S003所述，将图片进行数字化处理，得到图片中的每个像素点，然后将每个像素点和预设像素点阈值进行比较，该像素点阈值为事先设定的值，设计人员可以根据需要对预设像素点阈值进行设定不同的值，然后将小于所述预设像素点阈值的像素点设置为0，将大于所述预设像素点阈值的像素点设置为1，得到一个初始阵列，然后再将图片平均划分为多个区域，例如将32×32的初始阵列平均划分为多个区域，以得到8×8的矩阵，然后将得到的矩阵作为训练数据进行训练。当然，上述指的是对图片进行训练数据的处理，本申请还可以对其他训练数据进行其他的处理，例如文本，客户信息等，此处不再赘述。

本实施例中，上述将第一训练数据输入至所述新模型中进行计算，得到第一当前向量的步骤S1之前，还包括：

S011：根据所述新模型的应用场景计算对应的结构量化值；

S012：根据所述结构量化值与预设列表中的数据进行比对；其中，所述预设列表包括了所述结构量化值的数值与模型的对应关系；

S013：根据比对结果从模型数据库中筛选出所述新模型。

如上述步骤S011-S013所述，根据新模型的应用场景计算对应的结构量化值，其中结构量化值用于表示模型的结构复杂度，结构量化值越大，表示结构越复杂，结构量化值越小，表示模型越简单，举例而言，当新模型应用在终端，尤其是智能终端时，选择新模型时，新模型的结构不宜太复杂，否则容易占用终端CPU 的运行内存，减慢了终端的运行速度，若在服务器端，服务器一般有很高的运行内存，为了使得到的数据更加精确，故而可以使用复杂的新模型结构。应当理解的是，模型越复杂，占用的运行内存越高，对于数据的计算结果也更为准确，基于上述考虑，应该针对应用场景选择新模型，故而可以事先设置一个预设列表，或者预设函数，可以根据应用场景选择合适的新模型，使选择的新模型更加具有实用性。

本实施例中，所述选取多个所述源模型用于训练所述新模型的步骤S1，包括：

S111：通过公式

计算源模型数据库中各模型与所述新模型的相关度；其中X表示模型的特征集合，Y表示新模型的特征集合；

S112：将各个模型与所述新模型的相关度与预设相关度阈值进行比较；

S113：选取所述相关度大于所述预设相关度阈值模型作为所述源模型。

如上述步骤S111-S113所述，将源模型数据库中各模型的特征集合和新模型的特征集合通过公式

进行计算，其中模型的特征和新模型的特征可以是算法、应用场景、输入值以及输出值等，可以根据各自的特征计算相关度，当计算的相关度越趋近于1时，表示模型与新模型越相关，当计算的相关度越趋近于0时，表示模型与新模型越不相关。因此，可以设置一个预设相关度阈值，该预设相关度阈值为事先根据实际情况设置的值，例如若源模型数据库中的模型数量足够多，那么预设相关度阈值可以相应的设置大一些，若源模型数据库中的模型数量较少，那么预设相关度阈值可以相应的设置小一些。然后选取相关度大于预设相关度阈值的模型作为源模型，使基于选取的源模型对新模型训练的效果更好。

参照图2，本申请提出一种基于多个源模型的新模型训练装置，包括：

训练数据计算模块10，用于将第一训练数据输入至所述新模型中进行计算，得到第一当前向量；以及，

平均值计算模块20，用于分别计算每个所述源模型对应的所述特征向量的平均值；

指标向量计算模块30，用于将各所述源模型对应的平均值融合计算得到指标向量；

第一相似度值计算模块40，用于计算所述第一当前向量与所述指标向量的第一相似度值；

第一相似度值判断模块50，用于判断所述第一相似度值是否小于预设相似度值；

梯度值计算模块60，用于若所述第一相似度值小于预设相似度值，则计算所述当前向量与所述指标向量之间的梯度值；

参数更新模块70，用于根据所述梯度值校正所述新模型中的参数。

可以根据实际需要的数据选取多个预设的源模型，例如模型a在金融场景比较好，模型b在监控场景表现比较好，模型c在考勤场景比较比较好，需要获取的数据需要综合上边三个场景，那么就可以选取对应的模型a、模型b和模型c。需要说明的是，对于选取训练模型，其可以只是训练完毕的模型，而不需要其原始训练数据。将训练数据和其翻转后的数据输入至预设的源模型中，可以得到每个模型对应的多个特征向量，本文以只进行了左右翻转为例，假设为翻转前的第一训练数据输入至模型a中得到特征向量aV1，将左右翻转后的第二训练数据输入至模型a中得到特征向量aV2，当然，若输入至模型b中，相应得到特征向量bV1和bV2,若还具有模型c，模型d等，按照相应的方法得到对应模型的两个特征向量，需要说明的是，由于训练数据相同，故而其翻转后的数据与该训练数据也是相似的，本申请将训练数据翻转，是为了获取训练数据在各模型中得到更多的值，以便于后续计算过程中提升训练模型的精度。然后将第一训练数据输入至新模型中，得到第一当前向量。

不同的源模型通过第一训练数据和其翻转后的第二训练数据输计算得到多个特征向量，然后计算得到对应同一个源模型的特征向量的平均值。求出的平均值是各模型基于训练数据得到的一个优值，一般而言，该平均值的结果会优于将第一训练数据直接输入后得到的值。

然后再将各源模型对应的平均值进行融合，形成一个完整的输出，即求各源模型对应的平均值的均值，或者将各平均值进行降维操作，举例而言，假设具有两个模型那么各模型的平均值分别为aV＝(aV1+aV2)/2，bV＝(bV1+bV2)/2，然后将其融合，假设融合是求各源模型对应的平均值的均值(指标向量)，那么均值V＝(aV+bV)/2，若融合是采取降维的方式，那么降维的方法可以是缺失值比率、低方差滤波、高相关滤波、随机森林/组合树、主成分分析和反特征消除中的一种，最终得到指标向量，用于对新模型训练的对比。

将第一当前向量与指标向量进行比较，即计算第一相似度值，计算的公式可以是

将计算的第一相似度值与相似度阈值进行比较，若当前的相似度大于相似度阈值，则可以说明当前向量可以相当于目标向量；若当前的相似度小于相似度阈值，则表明当前向量不是目标向量，还需要调整模型中的参数，重新获取当前向量，具体地，根据loss获取梯度值，获取梯度原始值的公式为

本实施例中，基于多个源模型的新模型训练装置，还包括：

重新计算模块，用于将所述第一训练数据输入到校正参数后的新模型中进行计算，得到第二当前向量，并计算所述第二当前向量与所述指标向量的第二相似度值；

第二相似度值判断模块，用于判断所述第二相似度值是否大于所述预设相似度值；

训练认定模块，用于若第二相似度值大于所述预设相似度值，则认定所述新模型基于所述第一训练数据的训练完成。

可以对校正后的参数再次进行检测，即将根据校正后的参数重新计算当前向量，并计算与指标向量的第二相似度值，若第二相似度值大于预设相似度值，则可以将重新计算后的当前向量记为目标向量。若第二相似度值小于或等于预设相似度值，则可以通过上述loss继续获取新的梯度值，根据新的梯度值更改对应的参数，重复多次，直至当前向量与指标向量的第二相似度值大于预设相似度值，认定所述新模型基于所述第一训练数据的训练完成。另外，还可以输入新的训练数据，获取新的指标向量和当前向量，对新模型进行多次反复的训练，达到一定次数后，视为完成了新模型的训练。

本实施例中，指标向量计算模块30，包括：

相关因子获取子模块，用于获取所述新模型在不同应用场景的相关因子；

指标向量计算子模块，用于根据选取的所述源模型的应用场景，依照公式

获取新模型在不同应用场景下的相关因子，该相关因子可以是基于新模型的作用进行确定的，例如新模型是为了公司的人员管理，则相关因子较大的应用场景为监控场景、考勤场景等，而金融场景的相关因子较小，其中相关因子的数值可以根据新模型的作用进行确定，例如可以将监控场景的相关因子设置为0.5，将考勤的相关因子设置为0.7，将金融场景的相关因子设置为0.2，然后再根据公式

本实施例中，第一相似度值计算模块40，包括：

参数值获取子模块，用于获取所述指标向量和所述第一当前向量的参数值，其中所述参数值至少包括所述指标向量和所述当前向量的特征向量维度数量，以及在各维度中指标向量数值和当前向量数值；

第一计算子模块，用于根据公式

将根据所述指标向量和所述当前向量的特征向量维度数量，以及在各维度中指标向量数值和当前向量数值依照公式计算第一相似度值，当acc的值越接近于1，表明当前向量与指标向量越相似，当acc的值越接近于0时，表明当前向量与指标向量越不相似。其中公式中acc表示第一相似度值，zvi表示在第i特征向量维度中对应的当前向量数值，vi表示在第i特征向量维度中对应的指标向量数值，n为特征向量维度数量。根据上述公式计算的第一相似度值可以判断新模型的输出的当前向量，与其他模型融合后的指标向量的相似度，再根据相似度判断新模型是否需要调整参数。其中，第一相似度值越趋近于1时，则认为当前向量与指标向量越相关，第一相似度值越趋近于0时，则认为当前向量与指标向量越不相关。

本实施例中，基于多个源模型的新模型训练装置，包括：

像素点获取模块，用于当所述第一训练数据为图片时，获取图片中的每个像素点，将每个所述像素点和预设像素点阈值进行比较；

像素点设置模块，用于将小于所述预设像素点阈值的像素点设置为0，将大于所述预设像素点阈值的像素点设置为1；

区域划分模块，用于将所述图片平均划分为多个区域，并统计每个区域中的像素点为1的个数，并构成矩阵作为所述训练数据。

将图片进行数字化处理，得到图片中的每个像素点，然后将每个像素点和预设像素点阈值进行比较，该像素点阈值为事先设定的值，设计人员可以根据需要对预设像素点阈值进行设定不同的值，然后将小于所述预设像素点阈值的像素点设置为0，将大于所述预设像素点阈值的像素点设置为1，得到一个初始阵列，然后再将图片平均划分为多个区域，例如将32×32的初始阵列平均划分为多个区域，以得到8×8的矩阵，然后将得到的矩阵作为训练数据进行训练。当然，上述指的是对图片进行训练数据的处理，本申请还可以对其他训练数据进行其他的处理，例如文本，客户信息等，此处不再赘述。

本实施例中，上述基于多个源模型的新模型训练装置，还包括：

结构量化值计算模块，用于根据所述新模型的应用场景计算对应的结构量化值；

结构量化值比对模块，用于根据所述结构量化值与预设列表中的数据进行比对；其中，所述预设列表包括了所述结构量化值的数值与模型的对应关系；

新模型筛选模块，用于根据比对结果从模型数据库中筛选出所述新模型。

根据新模型的应用场景计算对应的结构量化值，其中结构量化值用于表示模型的结构复杂度，结构量化值越大，表示结构越复杂，结构量化值越小，表示模型越简单，举例而言，当新模型应用在终端，尤其是智能终端时，选择新模型时，新模型的结构不宜太复杂，否则容易占用终端CPU的运行内存，减慢了终端的运行速度，若在服务器端，服务器一般有很高的运行内存，为了使得到的数据更加精确，故而可以使用复杂的新模型结构。应当理解的是，模型越复杂，占用的运行内存越高，对于数据的计算结果也更为准确，基于上述考虑，应该针对应用场景选择新模型，故而可以事先设置一个预设列表，或者预设函数，可以根据应用场景选择合适的新模型，使选择的新模型更加具有实用性。

本实施例中，训练数据计算模块10，包括：

相关度计算子模块，用于通过公式

相关度比较模块，用于将各个模型与所述新模型的相关度与预设相关度阈值进行比较；

源模型选取模块，用于选取所述相关度大于所述预设相关度阈值模型作为所述源模型。

将源模型数据库中各模型的特征集合和新模型的特征集合通过公式

参照图3，本申请实施例中还提供一种计算机设备，该计算机设备可以是服务器，其内部结构可以如图3所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中，该计算机设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储各种训练数据等。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时可以实现上述任一实施例所述的基于多个源模型的新模型训练方法。

本领域技术人员可以理解，图3中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定。本申请实施例还提供一种计算机可读存储介质，上述存储介质可以是非易失性存储介质，也可以是易失性存储介质。其上存储有计算机程序，计算机程序被处理器执行时可以实现上述任一实施例所述的基于多个源模型修正新模型的方法。

Claims

一种基于多个源模型修正新模型的方法，其中，包括：

将第一训练数据输入至所述新模型中进行计算，得到第一当前向量；以及，

将第一训练数据和翻转所述第一训练数据后得到的第二训练数据分别输入至多个预设的源模型中进行计算，得到对应各所述源模型的特征向量，其中，对应每一个所述源模型的特征向量包括多个；

分别计算每个所述源模型对应的所述特征向量的平均值；

将各所述源模型对应的平均值融合计算得到指标向量；

计算所述第一当前向量与所述指标向量的第一相似度值；

判断所述第一相似度值是否小于预设相似度值；

若所述第一相似度值小于预设相似度值，则计算所述第一当前向量与所述指标向量之间的梯度值；

根据所述梯度值校正所述新模型中的参数。
如权利要求1所述的基于多个源模型修正新模型的方法，其中，所述根据所述梯度值校正所述新模型中的参数的步骤之后，还包括：

将所述第一训练数据输入到校正参数后的新模型中进行计算，得到第二当前向量，并计算所述第二当前向量与所述指标向量的第二相似度值；

判断所述第二相似度值是否大于所述预设相似度值；

若第二相似度值大于所述预设相似度值，则认定所述新模型基于所述第一训练数据的训练完成。
如权利要求1所述的基于多个源模型修正新模型的方法，其中，所述将各所述源模型对应的平均值融合计算得到指标向量的步骤，包括：

获取所述新模型在不同应用场景的相关因子；

根据选取的所述源模型的应用场景，依照公式
融合计算得到指标向量，其中，V为目标向量，w _i为第i个应用场景的相关因子，f(w _i)为应用场景为第i个场景的源模型的平均值。
如权利要求1所述的基于多个源模型修正新模型的方法，其中，所述计算所述第一当前向量与所述指标向量的第一相似度值的步骤，包括：

获取所述指标向量和所述第一当前向量的参数值，其中所述参数值至少包括所述指标向量和所述当前向量的特征向量维度数量，以及在各维度中指标向量数值和当前向量数值；

根据公式
计算第一相似度值，其中acc表示第一相似度值，zv _i表示在第i特征向量维度中对应的第一当前向量数值，v _i表示在第i特征向量维度中对应的指标向量数值，n为特征向量维度数量。
如权利要求1所述的基于多个源模型修正新模型的方法，其中，所述将第一训练数据和翻转所述第一训练数据后得到的第二训练数据分别输入至多个预设的源模型中进行计算，得到对应各所述源模型的特征向量的步骤之前，包括：

当所述第一训练数据为图片时，获取所述图片中的每个像素点，将每个所述像素点和预设像素点阈值进行比较；

将小于所述预设像素点阈值的像素点设置为0，将大于所述预设像素点阈值的像素点设置为1；

将所述图片平均划分为多个区域，并统计每个区域中的像素点为1的个数，并构成矩阵作为所述训练数据。
如权利要求1所述的基于多个源模型修正新模型的方法，其中，所述将第一训练数据输入至所述新模型中进行计算，得到第一当前向量的步骤之前，还包括：

根据所述新模型的应用场景计算对应的结构量化值；

根据所述结构量化值与预设列表中的数据进行比对；其中，所述预设列表包括了所述结构量化值的数值与模型的对应关系；

根据比对结果从模型数据库中筛选出所述新模型。
如权利要求1所述的基于多个源模型修正新模型的方法，其中，所述将第一训练数据和翻转所述第一训练数据后得到的第二训练数据分别输入至多个预设的源模型中进行计算，得到对应各所述源模型的特征向量的步骤之前，包括：

通过公式
计算源模型数据库中各模型与所述新模型的相关度；其中X表示模型的特征集合，Y表示新模型的特征集合；

将各个模型与所述新模型的相关度与预设相关度阈值进行比较；

选取所述相关度大于所述预设相关度阈值的模型作为所述源模型。
一种基于多个源模型的新模型训练装置，其中，包括：

训练数据计算模块，用于将第一训练数据输入至所述新模型中进行计算，得到第一当前向量；以及，

将第一训练数据和翻转所述第一训练数据后得到的第二训练数据分别输入至多个预设的源模型中进行计算，得到对应各所述源模型的特征向量，其中，对应每一个所述源模型的特征向量包括多个；

平均值计算模块，用于分别计算每个所述源模型对应的所述特征向量的平均值；

指标向量计算模块，用于将各所述源模型对应的平均值融合计算得到指标向量；

第一相似度值计算模块，用于计算所述第一当前向量与所述指标向量的第一相似度值；

第一相似度值判断模块，用于判断所述第一相似度值是否小于预设相似度值；

梯度值计算模块，用于若所述第一相似度值小于预设相似度值，则计算所述当前向量与所述指标向量之间的梯度值；

参数更新模块，用于根据所述梯度值校正所述新模型中的参数。
一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其中，所述处理器执行所述计算机程序时实现一种基于多个源模型的新模型训练方法的步骤:将第一训练数据输入至所述新模型中进行计算，得到第一当前向量；以及，

将第一训练数据和翻转所述第一训练数据后得到的第二训练数据分别输入至多个预设的源模型中进行计算，得到对应各所述源模型的特征向量，其中，对应每一个所述源模型的特征向量包括多个；

分别计算每个所述源模型对应的所述特征向量的平均值；

将各所述源模型对应的平均值融合计算得到指标向量；

计算所述第一当前向量与所述指标向量的第一相似度值；

判断所述第一相似度值是否小于预设相似度值；

若所述第一相似度值小于预设相似度值，则计算所述第一当前向量与所述指标向量之间的梯度值；

根据所述梯度值校正所述新模型中的参数。
如权利要求9所述的计算机设备，其中，所述根据所述梯度值校正所述新模型中的参数的步骤之后，还包括：

将所述第一训练数据输入到校正参数后的新模型中进行计算，得到第二当前向量，并计算所述第二当前向量与所述指标向量的第二相似度值；

判断所述第二相似度值是否大于所述预设相似度值；

若第二相似度值大于所述预设相似度值，则认定所述新模型基于所述第一训练数据的训练完成。
如权利要求9所述的计算机设备，其中，所述将各所述源模型对应的平均值融合计算得到指标向量的步骤，包括：

获取所述新模型在不同应用场景的相关因子；

根据选取的所述源模型的应用场景，依照公式
融合计算得到指标向量，其中，V为目标向量，wi为第i个应用场景的相关因子，f(wi)为应用场景为第i个场景的源模型的平均值。
如权利要求9所述的计算机设备，其中，所述计算所述第一当前向量与所述指标向量的第一相似度值的步骤，包括：

获取所述指标向量和所述第一当前向量的参数值，其中所述参数值至少包括所述指标向量和所述当前向量的特征向量维度数量，以及在各维度中指标向量数值和当前向量数值；

根据公式
计算第一相似度值，其中acc表示第一相似度值，zv _i表示在第i特征向量维度中对应的第一当前向量数值，v _i表示在第i特征向量维度中对应的指标向量数值，n为特征向量维度数量。
如权利要求9所述的计算机设备，其中，所述将第一训练数据和翻转所述第一训练数据后得到的第二训练数据分别输入至多个预设的源模型中进行计算，得到对应各所述源模型的特征向量的步骤之前，包括：

当所述第一训练数据为图片时，获取所述图片中的每个像素点，将每个所述像素点和预设像素点阈值进行比较；

将小于所述预设像素点阈值的像素点设置为0，将大于所述预设像素点阈值的像素点设置为1；

将所述图片平均划分为多个区域，并统计每个区域中的像素点为1的个数，并构成矩阵作为所述训练数据。
如权利要求9所述的计算机设备，其中，所述将第一训练数据输入至所述新模型中进行计算，得到第一当前向量的步骤之前，还包括：

根据所述新模型的应用场景计算对应的结构量化值；

根据所述结构量化值与预设列表中的数据进行比对；其中，所述预设列表包括了所述结构量化值的数值与模型的对应关系；

根据比对结果从模型数据库中筛选出所述新模型。
如权利要求9所述的计算机设备，其中，所述将第一训练数据和翻转所述第一训练数据后得到的第二训练数据分别输入至多个预设的源模型中进行计算，得到对应各所述源模型的特征向量的步骤之前，包括：

通过公式
计算源模型数据库中各模型与所述新模型的相关度；其中X表示模型的特征集合，Y表示新模型的特征集合；

将各个模型与所述新模型的相关度与预设相关度阈值进行比较；

选取所述相关度大于所述预设相关度阈值的模型作为所述源模型。
一种计算机可读存储介质，其上存储有计算机程序，其中，所述计算机程序被处理器执行时实现一种基于多个源模型修正新模型的方法的步骤。

将第一训练数据输入至所述新模型中进行计算，得到第一当前向量；以及，

将第一训练数据和翻转所述第一训练数据后得到的第二训练数据分别输入至多个预设的源模型中进行计算，得到对应各所述源模型的特征向量，其中，对应每一个所述源模型的特征向量包括多个；

分别计算每个所述源模型对应的所述特征向量的平均值；

将各所述源模型对应的平均值融合计算得到指标向量；

计算所述第一当前向量与所述指标向量的第一相似度值；

判断所述第一相似度值是否小于预设相似度值；

若所述第一相似度值小于预设相似度值，则计算所述第一当前向量与所述指标向量之间的梯度值；

根据所述梯度值校正所述新模型中的参数。
如权利要求16所述的计算机可读存储介质，其中，所述根据所述梯度值校正所述新模型中的参数的步骤之后，还包括：

将所述第一训练数据输入到校正参数后的新模型中进行计算，得到第二当前向量，并计算所述第二当前向量与所述指标向量的第二相似度值；

判断所述第二相似度值是否大于所述预设相似度值；

若第二相似度值大于所述预设相似度值，则认定所述新模型基于所述第一训练数据的训练完成。
如权利要求16所述的计算机可读存储介质，其中，所述将各所述源模型对应的平均值融合计算得到指标向量的步骤，包括：

获取所述新模型在不同应用场景的相关因子；

根据选取的所述源模型的应用场景，依照公式
融合计算得到指标向量，其中，V为目标向量，wi为第i个应用场景的相关因子，f(wi)为应用场景为第i个场景的源模型的平均值。
如权利要求16所述的计算机可读存储介质，其中，所述计算所述第一当前向量与所述指标向量的第一相似度值的步骤，包括：

获取所述指标向量和所述第一当前向量的参数值，其中所述参数值至少包括所述指标向量和所述当前向量的特征向量维度数量，以及在各维度中指标向量数值和当前向量数值；

根据公式
计算第一相似度值，其中acc表示第一相似度值，zvi表示在第i特征向量维度中对应的第一当前向量数值，vi表示在第i特征向量维度中对应的指标向量数值，n为特征向量维度数量。
如权利要求16所述的计算机可读存储介质，其中，所述将第一训练数据和翻转所述第一训练数据后得到的第二训练数据分别输入至多个预设的源模型中进行计算，得到对应各所述源模型的特征向量的步骤之前，包括：

当所述第一训练数据为图片时，获取所述图片中的每个像素点，将每个所述像素点和预设像素点阈值进行比较；

将小于所述预设像素点阈值的像素点设置为0，将大于所述预设像素点阈值的像素点设置为1；

将所述图片平均划分为多个区域，并统计每个区域中的像素点为1的个数，并构成矩阵作为所述训练数据。