CN113743448B

CN113743448B - 模型训练数据获取方法、模型训练方法和装置

Info

Publication number: CN113743448B
Application number: CN202110799060.4A
Authority: CN
Inventors: 彭泽钜; 彭泽慧; 杨灵; 阙士芯; 刘羿晟
Original assignee: Shanghai Pengxi Semiconductor Co ltd
Current assignee: Shanghai Pengxi Semiconductor Co ltd
Priority date: 2021-07-15
Filing date: 2021-07-15
Publication date: 2024-04-30
Anticipated expiration: 2041-07-15
Also published as: CN113743448A

Abstract

本申请涉及一种模型训练数据获取方法、模型训练方法和装置。所述模型训练数据获取方法包括：获取问题数据，所述问题数据携带有模型处理结果；计算模型训练样本与所述问题数据的相似度；对相似度满足预设条件的模型训练样本进行标签更新；将标签更新后的模型训练样本和问题数据作为模型训练数据。所述模型训练方法包括：根据所述的模型训练数据获取方法获取模型训练数据；根据所述模型训练数据进行模型训练。采用本方法能够提高模型的更新速度。

Description

模型训练数据获取方法、模型训练方法和装置

技术领域

本申请涉及人工智能技术领域，特别是涉及一种模型训练数据获取方法、模型训练方法和装置。

背景技术

随着人工智能技术的发展，出现了神经网络等技术，卷积神经网路(Convolutional Neural Network，CNN)是一种前馈神经网路，它的人工神经元可以回应一部分覆盖范围内的周围单元，对于大型图像处理有出色表现。与其他深度学习结构相比，卷积神经网路在图像和语音辨识方面能够给出更好的结果。

其中影像分类的人工智慧模型可大致分为两部分：模型基底(model base)、以及分类器(classifier)。一影像输入进模型基底，经计算后输出一n个分量的向量，称特征向量，其所在的n维空间称特征空间。n值视其模型基底的设计而定，通常等于该基底最后一层卷积层(convolution layer)的滤波器(filter)数量。特征向量再输入分类器便可计算出分数向量，其最大值所对应之类别即为该人工智能模型针对该输入图片所做的预测。

一个典型的，可持续训练AI模型的流程：先以初始建模资料训练出初始AI模型。当新资料的预测是正确的，不做任何处理；当发现新资料的预测是错误的，亦即，新资料的模型预测值不相符于人工判定值时，此份新资料会以人工判定值为建模依据，与原建模资料合并后，训练更新的AI模型。而后续新资料，再以新版模型预测，预测不相符的部分再合并至建模资料，如此不断循环下去，便可持续增加AI模型的准确率。

然后，上述新资料是每次模型训练错误的资料，其数量较少，对于模型的更新的速度较慢。

发明内容

基于此，有必要针对上述技术问题，提供一种能够提高模型更新速度的模型训练数据获取方法、模型训练方法和装置。

一种模型训练数据获取方法，所述模型训练数据获取方法包括：

获取问题数据，所述问题数据携带有模型处理结果；

计算模型训练样本与所述问题数据的相似度；

对相似度满足预设条件的模型训练样本进行标签更新；

将标签更新后的模型训练样本和问题数据作为模型训练数据。

在其中一个实施例中，所述计算模型训练样本与所述问题数据的相似度，包括：

从模型训练样本中获取标签与所述模型处理结果对应的待处理样本；

计算所述待处理样本与所述问题数据的相似度。

在其中一个实施例中，所述计算所述待处理样本与所述问题数据的相似度，包括：

通过模型的特征提取模块得到待处理样本对应的第一特征向量；

通过所述模型的特征提取模块得到所述问题数据的第二特征向量；

计算所述第一特征向量和所述第二特征向量的相似度作为所述待处理样本与所述问题数据的相似度。

在其中一个实施例中，所述对相似度满足预设条件的模型训练样本进行标签更新，包括：

输出相似度大于阈值的模型训练样本；

接收针对所输出的模型训练样本的标注指令，并根据所述标注指令更新所述模型训练样本的标签。

一种模型训练方法，所述模型训练方法包括：

根据上述任意一个实施例中所述的模型训练数据获取方法获取模型训练数据；

根据所述模型训练数据进行模型训练。

一种模型训练数据获取装置，所述模型训练数据获取装置包括：

问题数据获取模块，用于获取问题数据，所述问题数据携带有模型处理结果；

相似度计算模块，用于计算模型训练样本与所述问题数据的相似度；

标签更新模块，用于对相似度满足预设条件的模型训练样本进行标签更新；

输出模块，用于将标签更新后的模型训练样本和问题数据作为模型训练数据。

在其中一个实施例中，所述相似度计算模块包括：

待处理样本获取单元，用于从模型训练样本中获取标签与所述模型处理结果对应的待处理样本；

相似度计算单元，用于计算所述待处理样本与所述问题数据的相似度。

一种模型训练装置，所述模型训练装置包括：

训练数据获取模块，用于根据上述任意一个实施例中所述的模型训练数据获取装置获取模型训练数据；

训练模块，用于根据所述模型训练数据进行模型训练。

一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现任意一个实施例中所述的方法的步骤。

一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现任意一个实施例中所述的方法的步骤。

上述模型训练数据获取方法、模型训练方法和装置，在获取到问题数据后，还根据问题数据从模型训练数据中获取到一些数据，对该些数据也进行标签更新，从而更新标签的数据的量大于典型流程中数据的量，从而可以提高模型的训练更新速度。

附图说明

图1为现有技术中模型训练数据获取方法的流程框图；

图2为一个实施例中模型训练数据获取方法的应用环境图；

图3为一个实施例中模型训练数据获取方法的流程示意图；

图4为一个实施例中模型训练数据获取方法的流程框图；

图5为一个实施例中模型训练方法的流程示意图；

图6为一个实施例中模型训练数据获取装置的结构框图；

图7为一个实施例中模型训练装置的结构框图；

图8为一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

本申请提供的模型训练数据获取方法和模型训练方法，可以应用于如图2所示的应用环境中。其中，终端102通过网络与数据库104进行通信。终端102用于从数据库104获取问题数据，该问题数据是携带有模型处理结果的，然后终端102计算模型训练样本与问题数据的相似度；对相似度满足预设条件的模型训练样本进行标签更新，从而将标签更新后的模型训练样本和问题数据作为模型训练数据。这样在获取到问题数据后，还根据问题数据从模型训练数据中获取到一些数据，对该些数据也进行标签更新，从而更新标签的数据的量大于典型流程中数据的量，从而可以提高模型的训练更新速度。

其中，终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备，数据库104可以用独立的数据库或者是多个数据库组成的数据库集群来实现。

在一个实施例中，如图3所示，提供了一种模型训练数据获取方法，以该方法应用于图2中的终端为例进行说明，包括以下步骤：

S302：获取问题数据，问题数据携带有模型处理结果。

具体地，问题数据是指经过模型处理后，所得到的模型处理结果与人工标注的结果不相同的数据。其中需要说明的是模型一般是包括模型基底和分类器，将数据输入至模型中，先得到一特征向量，然后将特征向量输入至分类器从而可以获取到模型输出结果，进而将模型处理结果与已有的人工标注的结果进行比对，以判断该数据是否为问题数据。

其中一般地，在模型测试过程中，获取测试数据，该测试数据一般包括人工标注的结果，从而将测试数据输入至模型中可以得到模型处理结果，进而终端将模型处理结果与人工标注的结果进行比对，以判断该测试数据是否为问题数据，若是为问题数据，则可以将模型进行存储。

其中可选地，将问题数据进行存储的时候，可以按照模型处理结果的类型进行存储，以保证问题数据存储的有序性，从而便于后续处理。

S304：计算模型训练样本与问题数据的相似度。

具体地，此处的相似度可以是指余弦值，在其他的实施例中，还可以是其他的方式。

模型训练样本是指历史上用来训练模型的样本，其包括初始训练时的模型训练样本，以及后续多次模型更新时的模型训练样本。

其中终端可以获取到模型训练样本，并计算模型训练样本和问题数据的相似度，可选地，可以采用并行处理的方式，以进行计算。

在其中一个实施例中，在计算相似度之前，终端先分别提取模型训练样本和问题数据的特征向量，其中可选地，终端仅需要提取一次问题数据的特征向量，然后通过该特征向量依次或者是并行与所提取的模型训练样本的特征向量进行相似度的计算。

此外需要说明的是终端提取模型训练样本和问题数据的特征向量是需要通过统一的提取模块来进行提取的，以保证所提取的特征向量的维度和标准是相同的，从而后续计算相似度的时候具有可比性。

S306：对相似度满足预设条件的模型训练样本进行标签更新。

具体地，预设条件可以是相似度大于阈值，例如相似度大于一定值的数据，则认为其在特征空间上较为相似，因此该部分数据在初始判定，人工判定或者是机器自动判定的时候容易出现问题，从而对该部分模型训练样本进行标签更新。

S308：将标签更新后的模型训练样本和问题数据作为模型训练数据。

具体地，此处的模型训练数据是指更新后的模型训练数据，但是完整的模型训练数据是包括历史上多次进行模型训练和模型更新的数据，因此此处仅是终端将标签更新后的模型训练样本和问题数据加入到模型训练数据中，其中问题数据的标签是人工标注的标签，而非模型输出结果。

需要说明的是，在模型更新的时候，终端可以仅根据该新加入的模型训练数据进行更新，还可以通过全部的模型训练数据对模型进行更新，在此不做具体的限制。

上述模型训练数据获取方法，在获取到问题数据后，还根据问题数据从模型训练数据中获取到一些数据，对该些数据也进行标签更新，从而更新标签的数据的量大于典型流程中数据的量，从而可以提高模型的训练更新速度。

在其中一个实施例中，计算模型训练样本与问题数据的相似度，包括：从模型训练样本中获取标签与模型处理结果对应的待处理样本；计算待处理样本与问题数据的相似度。

具体地，此处的标签是指人工标注的结果，其中为了减少计算量，终端先从模型训练样本中获取标签与模型处理结果对应的待处理样本，然后仅计算该些待处理样本与问题数据的相似度。

具体地，假设一输入图片的模型预测分类B，不相符于人工判定C时。该误判现象暗示建模资料B与建模资料C有可能互相混淆，因此本实施例会按照后续演算法将建模资料B中最相似于问题数据的部分挑出，进行第二次人工判定。而不需要将所有的建模资料，即模型训练样本均进行判断，这样可以减少终端的处理量，从而提高模型训练数据的生成效率。

在其中一个实施例中，计算待处理样本与问题数据的相似度，包括：通过模型的特征提取模块得到待处理样本对应的第一特征向量；通过模型的特征提取模块得到问题数据的第二特征向量；计算第一特征向量和第二特征向量的相似度作为待处理样本与问题数据的相似度。

具体地，一般的模型包括特征提取模块和分类器，其中本实施例中为了方便，直接采用模型的特征提取模块来计算得到待处理样本对应的第一特征向量和问题数据的第二特征向量，这样第一特征向量和第二特征向量的维度和生成标准是一致的，从而第一特征向量和第二特征向量才具有可比性。且直接采用模型的特征提取模块，符合模型的处理标准，更进一步地提高后续处理的准确性。

计算第一特征向量和第二特征向量的相似度作为待处理样本与问题数据的相似度的步骤，可以是计算第一特征向量和第二特征向量的余弦值或者差值等，这样可以简化操作。

上述实施例中，通过相同的特征提取模块来计算得到待处理样本对应的第一特征向量和问题数据的第二特征向量，这样第一特征向量和第二特征向量的维度和生成标准是一致的，从而第一特征向量和第二特征向量才具有可比性。

在其中一个实施例中，对相似度满足预设条件的模型训练样本进行标签更新，包括：输出相似度大于阈值的模型训练样本；接收针对所输出的模型训练样本的标注指令，并根据标注指令更新模型训练样本的标签。

具体地，此处的阈值可以是预先设置的，或者是用户根据需要选取的，例如终端可以输入各个数量等级下的相似度，例如输出的模型训练样本数据的数量为不同数值时所对应的相似度的最小值，这样用户可以根据需要处理的模型训练样本的数量来确定对应的相似度的最小值，也即相似度阈值，从而终端根据该相似度阈值来输出对应数量的模型训练样本，进而用户对终端输出的模型训练样本进行二次判定，以确定该模型训练样本的真实标签，并输入至终端，终端获取到输入的更新后的标签后，建立模型训练样本与更新后的标签的对应关系，以实现模型训练样本的标签的更新。

在实际应用中，终端可以是直接获取到默认的阈值，从而直接输出大于该阈值的所有的模型训练样本。

在其他的实施例中，终端获取预设的数量等级，例如10、50、100、200等，在其他的实施例中可以采用其他的数值，然后获取到该预设的数量等级所对应的相似度的值，例如终端将模型训练样本和问题数据的相似度进行排序，然后获取每个数量等级所对应的模型训练样本，进而终端计算每个数量等级中排序最后的一个模型训练样本所对应的相似度，并分别输出该些相似度和模型训练样本的数量，以及其的对应关系。从而用户可以衡量工作量，以获取到最符合要求的模型训练样本的数量，并进行选择，从而终端可以根据所选择的模型训练样本的数量来确定相似度的阈值。进而根据该阈值获取到需要二次判定的模型训练样本，并输出。

上述实施例中，通过设置阈值，来选取对应的模型训练样本，并输出，以进行二次判定。

在其中一个实施例中，参见图4所示，图4为一个实施例中模型训练数据获取方法的流程框图，在该实施例中，一输入图片的模型预测值为类别B，在其对应的基征向量通常会靠近建模资料B的特征向量，但对该张图片的人工判别为C，这样代表B和C资料集可能有混淆，系统也会推荐附近之特征向量图片供人工检视，以让人决定该如何定义类别。

结合图4，在进行资料更新时，也即模型训练样本的更新时，附加自动校正机制，将原建模资料中与错误图片相似度高的部分重亲提交给人员做第二次判定，并将重新判定的新图片、原建模资料重新合并成新版建模资料。此流程每次更新建模资料的量会大于/等于典型流程，故可更快速提高AI模型准确率。

在一个实施例中，如图5所示，提供了一种模型训练方法，以该方法应用于图1中的终端为例进行说明，包括以下步骤：

S502：根据上述任意一个实施例中所述的模型训练数据获取方法获取模型训练数据。

具体地，对于模型训练数据的获取方式可以参见上文所述，在此不再赘述。

S504：根据模型训练数据进行模型训练。

具体地，模型训练的过程即根据模型训练数据来修正模型参数的过程，其中终端将模型训练数据输入至模型中得到模型输出结果，然后根据模型输出结果以及人工标注的结果计算得到损失函数，最后终端通过将损失函数来反向传播以对模型中的参数进行修正，从而完整模型的训练。

以图片为例，对于模型的修正可以是对于每个锚点框中每个像素点的权重的修正，从而以保证根据该权重计算得到的特征向量，经过模型的分类器后输出的模型处理结果与人工标注的结果相同。

上述模型训练方法，在获取到问题数据后，还根据问题数据从模型训练数据中获取到一些数据，对该些数据也进行标签更新，从而更新标签的数据的量大于典型流程中数据的量，从而可以提高模型的训练更新速度。

应该理解的是，虽然图3和图5的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，图3和图5中的至少一部分步骤可以包括多个步骤或者多个阶段，这些步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。

在一个实施例中，如图6所示，提供了一种模型训练数据获取装置，包括：问题数据获取模块601、相似度计算模块602、标签更新模块603和输出模块604，其中：

问题数据获取模块601，用于获取问题数据，问题数据携带有模型处理结果；

相似度计算模块602，用于计算模型训练样本与问题数据的相似度；

标签更新模块603，用于对相似度满足预设条件的模型训练样本进行标签更新；

输出模块604，用于将标签更新后的模型训练样本和问题数据作为模型训练数据。

在其中一个实施例中，相似度计算模块602包括：

待处理样本获取单元，用于从模型训练样本中获取标签与模型处理结果对应的待处理样本；

相似度计算单元，用于计算待处理样本与问题数据的相似度。

在其中一个实施例中，上述相似度计算单元包括：

第一特征向量计算子单元，用于通过模型的特征提取模块得到待处理样本对应的第一特征向量；

第二特征向量计算子单元，用于通过模型的特征提取模块得到问题数据的第二特征向量；

相似度计算子单元，用于计算第一特征向量和第二特征向量的相似度作为待处理样本与问题数据的相似度。

在其中一个实施例中，上述标签更新模块603包括：

输出单元，用于输出相似度大于阈值的模型训练样本；

标签更新单元，用于接收针对所输出的模型训练样本的标注指令，并根据标注指令更新模型训练样本的标签。

在一个实施例中，如图7所示，提供了一种模型训练装置，包括：训练数据获取模块701和训练模块702，其中：

训练数据获取模块701，用于根据上述任意一个实施例中的模型训练数据获取装置获取模型训练数据；

训练模块702，用于根据模型训练数据进行模型训练。

关于模型训练数据获取装置和模型训练装置的具体限定可以参见上文中对于模型训练数据获取方法和模型训练方法的限定，在此不再赘述。上述模型训练数据获取装置和模型训练装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中，提供了一种计算机设备，该计算机设备可以是终端，其内部结构图可以如图8所示。该计算机设备包括通过系统总线连接的处理器、存储器、通信接口、显示屏和输入装置。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信，无线方式可通过WIFI、运营商网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种模型训练数据获取方法和模型训练方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏，该计算机设备的输入装置可以是显示屏上覆盖的触摸层，也可以是计算机设备外壳上设置的按键、轨迹球或触控板，还可以是外接的键盘、触控板或鼠标等。

本领域技术人员可以理解，图8中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在一个实施例中，提供了一种计算机设备，包括存储器和处理器，存储器中存储有计算机程序，该处理器执行计算机程序时实现以下步骤：获取问题数据，问题数据携带有模型处理结果；计算模型训练样本与问题数据的相似度；对相似度满足预设条件的模型训练样本进行标签更新；将标签更新后的模型训练样本和问题数据作为模型训练数据。

在一个实施例中，处理器执行计算机程序时所实现的计算模型训练样本与问题数据的相似度，包括：从模型训练样本中获取标签与模型处理结果对应的待处理样本；计算待处理样本与问题数据的相似度。

在一个实施例中，处理器执行计算机程序时所实现的计算待处理样本与问题数据的相似度，包括：通过模型的特征提取模块得到待处理样本对应的第一特征向量；通过模型的特征提取模块得到问题数据的第二特征向量；计算第一特征向量和第二特征向量的相似度作为待处理样本与问题数据的相似度。

在一个实施例中，处理器执行计算机程序时所实现的对相似度满足预设条件的模型训练样本进行标签更新，包括：输出相似度大于阈值的模型训练样本；接收针对所输出的模型训练样本的标注指令，并根据标注指令更新模型训练样本的标签。

在一个实施例中，提供了一种计算机设备，包括存储器和处理器，存储器中存储有计算机程序，该处理器执行计算机程序时实现以下步骤：根据上述任意一个实施例中的模型训练数据获取方法获取模型训练数据；根据模型训练数据进行模型训练。

在一个实施例中，提供了一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现以下步骤：获取问题数据，问题数据携带有模型处理结果；计算模型训练样本与问题数据的相似度；对相似度满足预设条件的模型训练样本进行标签更新；将标签更新后的模型训练样本和问题数据作为模型训练数据。

在一个实施例中，计算机程序被处理器执行时所实现的计算模型训练样本与问题数据的相似度，包括：从模型训练样本中获取标签与模型处理结果对应的待处理样本；计算待处理样本与问题数据的相似度。

在一个实施例中，计算机程序被处理器执行时所实现的计算待处理样本与问题数据的相似度，包括：通过模型的特征提取模块得到待处理样本对应的第一特征向量；通过模型的特征提取模块得到问题数据的第二特征向量；计算第一特征向量和第二特征向量的相似度作为待处理样本与问题数据的相似度。

在一个实施例中，计算机程序被处理器执行时所实现的对相似度满足预设条件的模型训练样本进行标签更新，包括：输出相似度大于阈值的模型训练样本；接收针对所输出的模型训练样本的标注指令，并根据标注指令更新模型训练样本的标签。

在一个实施例中，提供了一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现以下步骤：根据上述任意一个实施例中的模型训练数据获取方法获取模型训练数据；根据模型训练数据进行模型训练。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory，ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory，RAM)或外部高速缓冲存储器。作为说明而非局限，RAM可以是多种形式，比如静态随机存取存储器(Static Random Access Memory，SRAM)或动态随机存取存储器(Dynamic Random Access Memory，DRAM)等。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请专利的保护范围应以所附权利要求为准。

Claims

1.一种模型训练数据获取方法，其特征在于，所述模型训练数据获取方法包括：

获取输入图片的问题数据，所述问题数据携带有模型处理结果；具体地，所述问题数据指经过模型处理后，所得到的模型处理结果与人工标注的结果不相同的数据；

计算模型训练样本与所述问题数据的相似度；

对相似度满足预设条件的模型训练样本进行标签更新；

2.根据权利要求1所述的模型训练数据获取方法，其特征在于，所述计算模型训练样本与所述问题数据的相似度，包括：

计算所述待处理样本与所述问题数据的相似度。

3.根据权利要求2所述的模型训练数据获取方法，其特征在于，所述计算所述待处理样本与所述问题数据的相似度，包括：

4.根据权利要求1至3任意一项所述的模型训练数据获取方法，其特征在于，所述对相似度满足预设条件的模型训练样本进行标签更新，包括：

输出相似度大于阈值的模型训练样本；

5.一种模型训练方法，其特征在于，所述模型训练方法包括：

根据权利要求1至4任意一项所述的模型训练数据获取方法获取模型训练数据；

根据所述模型训练数据进行模型训练。

6.一种模型训练数据获取装置，其特征在于，所述模型训练数据获取装置包括：

问题数据获取模块，用于获取输入图片的问题数据，所述问题数据携带有模型处理结果；具体地，所述问题数据指经过模型处理后，所得到的模型处理结果与人工标注的结果不相同的数据；

7.根据权利要求6所述的模型训练数据获取装置，其特征在于，所述相似度计算模块包括：

8.一种模型训练装置，其特征在于，所述模型训练装置包括：

训练数据获取模块，用于根据权利要求6或7所述的模型训练数据获取装置获取模型训练数据；

训练模块，用于根据所述模型训练数据进行模型训练。

9.一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至4或5中任一项所述的方法的步骤。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至4或5中任一项所述的方法的步骤。