CN110909803A

CN110909803A - 图像识别模型训练方法、装置和计算机可读存储介质

Info

Publication number: CN110909803A
Application number: CN201911174500.6A
Authority: CN
Inventors: 李悦翔; 陈嘉伟; 郑冶枫
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2019-11-26
Filing date: 2019-11-26
Publication date: 2020-03-24
Anticipated expiration: 2039-11-26
Also published as: CN110909803B

Abstract

本申请涉及一种图像识别模型训练方法、装置、计算机可读存储介质和计算机设备，该方法包括：使用标注图像进行训练，得到基准模型；将标注图像和未标注图像输入基准模型中训练，得到分类模型；将未标注图像输入分类模型中识别确定信息量，根据信息量确定目标未标注图像；根据目标未标注图像得到目标标注图像，根据目标标注图像确定更新的标注图像和更新的未标注图像；将更新的标注图像输入基准模型中训练，得到更新的基准模型，返回将标注图像和未标注图像输入到基准模型中，得到分类模型的步骤执行，直到更新的基准模型达到预设条件，将更新的基准模型作为目标模型。本申请提供的方案提高了使用少量标注图像训练得到的图像识别模型的准确率。

Description

图像识别模型训练方法、装置和计算机可读存储介质

技术领域

本申请涉及计算机技术领域，特别是涉及一种图像识别模型训练方法、装置、计算机可读存储介质和计算机设备。

背景技术

随着人工智能技术的发展，人们开始使用人工智能技术训练人工智能模型来解决各种问题。目前，在训练人工智能模型识别图像时，需要对图像数据进行标注，即在训练人工智能模型需要的大量的标注图像数据。由于无法获取到大量的标注图像数据，目前，通常使用少量标注图像数据进行人工智能模型的训练，然而，使用少量标注图像数据训练得到的人工智能模型识别图像数据的准确率低。

发明内容

基于此，有必要针对少量标注图像数据训练得到的人工智能模型识别图像数据的准确率低的技术问题，提供一种图像识别模型训练方法、装置、计算机可读存储介质和计算机设备。

一种图像识别模型训练方法，包括：

获取初始图像训练数据，初始图像训练数据包括标注图像数据和未标注图像数据，将初始图像训练数据作为当前训练数据；

根据标注图像数据使用卷积神经网络进行训练，得到基准神经网络模型；

将当前训练数据输入到基准神经网络模型中进行训练，得到分类神经网络模型，分类神经网络模型用于对数据进行分类；

将未标注图像数据输入到分类神经网络模型中进行识别，得到输出的类别概率；

根据类别概率确定未标注图像数据对应的信息量，从未标注图像数据中获取信息量超过预设阈值的目标未标注图像数据；

获取目标未标注图像数据对应的标注值，得到目标标注图像数据，根据目标标注图像数据确定更新的标注图像数据和更新的未标注图像数据，将更新的标注图像数据和更新的未标注图像数据作为当前训练数据；

将更新的标注图像数据输入到基准神经网络模型中进行训练，得到更新的基准神经网络模型，将更新的基准神经网络模型作为基准神经网络模型，返回将当前训练数据输入到基准神经网络模型中进行训练，得到分类神经网络模型的步骤执行，直到更新的基准神经网络模型达到预设条件，将更新的基准神经网络模型作为目标神经网络模型，以通过目标神经网络模型对目标图像进行识别。

一种模型训练装置，包括：

数据获取模块，用于获取初始图像训练数据，初始图像训练数据包括标注图像数据和未标注图像数据，将初始图像训练数据作为当前训练数据；

基准模型训练模块，用于根据标注图像数据使用卷积神经网络进行训练，得到基准神经网络模型；

分类模型训练模块，用于将当前训练数据输入到基准神经网络模型中进行训练，得到分类神经网络模型，分类神经网络模型用于对数据进行分类；

分类识别模块，用于将未标注图像数据输入到分类神经网络模型中进行识别，得到输出的类别概率；

目标数据获取模块，用于根据类别概率确定未标注图像数据对应的信息量，从未标注图像数据中获取信息量超过预设阈值的目标未标注图像数据；

数据更新模块，用于获取目标未标注图像数据对应的标注值，得到目标标注图像数据，根据目标标注图像数据确定更新的标注图像数据和更新的未标注图像数据，将更新的标注图像数据和更新的未标注图像数据作为当前训练数据；

目标模型得到模块，用于将更新的标注图像数据输入到基准神经网络模型中进行训练，得到更新的基准神经网络模型，将更新的基准神经网络模型作为基准神经网络模型，返回将当前训练数据输入到基准神经网络模型中进行训练，得到分类神经网络模型的步骤执行，直到更新的基准神经网络模型达到预设条件，将更新的基准神经网络模型作为目标神经网络模型，以通过目标神经网络模型对目标图像进行识别。

一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，该处理器执行程序时实现以下步骤：

一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时，使得处理器执行以下步骤：

上述图像识别模型训练方法、装置、计算机可读存储介质和计算机设备，通过使用标注图像数据训练得到基准神经网络模型，然后使用标注图像数据和未标注图像数据通过基准神经网络模型进行训练得到分类神经网络模型，能够使基准神经网络模型中的特征信息被分类神经网络模型复用，提高了训练得到分类神经网络模型的效率。然后通过使用分类神经网络模型来挑选信息量较高的未标注图像数据进行标注，并使用更新的标注图像数据重新训练调整基准神经网络模型，直到基准神经网络模型达到预设条件时，将更新的基准神经网络模型作为目标神经网络模型，以通过目标神经网络模型对目标图像进行识别。由于使用信息量较高的标注图像数据调整基准神经网络模型，因此，实现了在标注图像数据较少(相对于对所有的初始图像训练数据都进行标注)时，使训练得到的目标神经网络模型识别图像的准确率得到提高。

附图说明

图1为一个实施例中图像识别模型训练方法的应用环境图；

图2为一个实施例中图像识别模型训练方法的流程示意图；

图3为一个实施例中获取目标未标注图像数据的流程示意图；

图4为一个实施例中确定待识别图像数据对应的识别结果的流程示意图；

图5为一个实施例中确定目标神经网络模型的流程示意图；

图6为另一个实施例中图像识别模型训练方法的流程示意图；

图7为图5实施例中联合训练框架的示意图；

图8为一个实施例中得到待识别宫颈内镜图像对应的类别的流程示意图；

图9为一个实施例中模型训练装置的结构框图；

图10为一个实施例中计算机设备的结构框图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说，人工智能是计算机科学的一个综合技术，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法，使机器具有感知、推理与决策的功能。

人工智能技术是一门综合学科，涉及领域广泛，既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

机器学习(Machine Learning,ML)是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。

本申请实施例提供的方案涉及人工智能的人工神经网络等技术，具体通过如下实施例进行说明:

图1为一个实施例中图像识别模型训练方法的应用环境图。参照图1，该图像识别模型训练方法应用于模型训练系统。该模型训练系统包括终端102和服务器104。终端102和服务器104通过网络连接。终端102具体可以是台式终端或移动终端，移动终端具体可以手机、平板电脑、笔记本电脑等中的至少一种。服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

具体地，服务器104可以接受到终端102发送的训练开始指令，根据训练开始指令获取初始图像训练数据，初始图像训练数据包括标注图像数据和未标注图像数据，将初始图像训练数据作为当前训练数据；服务器104根据标注图像数据使用卷积神经网络进行训练，得到基准神经网络模型；服务器104将当前训练数据输入到基准神经网络模型中进行训练，得到分类神经网络模型，分类神经网络模型用于对数据进行分类；服务器104将未标注图像数据输入到分类神经网络模型中进行识别，得到输出的类别概率；服务器104根据类别概率确定未标注图像数据对应的信息量，从未标注图像数据中获取信息量超过预设阈值的目标未标注图像数据；服务器104获取目标未标注图像数据对应的标注值，得到目标标注图像数据，根据目标标注图像数据确定更新的标注图像数据和更新的未标注图像数据，将更新的标注图像数据和更新的未标注图像数据作为当前训练数据；服务器104将更新的标注图像数据输入到基准神经网络模型中进行训练，得到更新的基准神经网络模型，将更新的基准神经网络模型作为基准神经网络模型，返回将当前训练数据输入到基准神经网络模型中进行训练，得到分类神经网络模型的步骤执行，直到更新的基准神经网络模型达到预设条件，将更新的基准神经网络模型作为目标神经网络模型，以通过目标神经网络模型对目标图像进行识别。

如图2所示，在一个实施例中，提供了一种图像识别模型训练方法。本实施例主要以该方法应用于上述图1中的服务器104来举例说明。参照图2，该图像识别模型训练方法具体包括如下步骤：

S202，获取初始图像训练数据，初始图像训练数据包括标注图像数据和未标注图像数据，将初始图像训练数据作为当前训练数据。

其中，初始图像训练数据是指预先通过各种手段采集到的训练人工智能模型所需的图像数据。该初始图像训练数据中包括有大量未被标注的图像数据和少量已被标注的图像数据。标注图像数据是指通过数据加工人员借助标记工具对初始图像训练数据进行加工后，得到的图像数据。标注的基本方式可以有标注画框、3D画框、文本转录、图像打点、目标物体轮廓线等。

具体地，服务器在接受到终端发送的训练开始指令，根据训练开始指令获取到初始图像训练数据，比如，可以从数据库中获取到初始图像训练数据，可以从各种数据源采集到初始图像训练数据等。该初始图像训练数据中包括大量未标注图像数据和少量标注图像数据。该少量的标注图像数据可以是随机挑选部分采集到的图像数据进行标注后得到的。服务器将初始图像训练数据作为当前训练数据。

S204，根据标注图像数据使用卷积神经网络进行训练，得到基准神经网络模型。

其中，基准神经网络模型是指对随机初始化的卷积神经网络进行训练，使其具有一定的目标任务处理能力的卷积神经网络模型。其中，目标任务是指卷积神经网络能够处理的任务，比如，图像数据分类任务、图像数据识别任务等。卷积神经网络(ConvolutionalNeural Networks,CNN)是一类包含卷积计算且具有深度结构的前馈神经网络。其基本的结构包括输入层、隐含层和输出层，其中，隐含层包含卷积层、池化层和全连接层3类常见构筑。卷积神经网络的损失函数可以根据目标任务的不同而是使用不同的损失函数。常见的损失函数包括Softmax损失函数(softmax loss)、铰链损失函数(hinge loss)、三重损失函数(triplet loss)。比如，分类任务可以使用交叉熵损失函数。

具体地，服务器根据标注图像数据在目标任务上训练卷积神经网络，当目标任务的损失函数值达到一定的阈值或者训练达到最大的迭代次数时，得到训练好的神经网络模型，将该神经网络模型作为基准神经网络模型。基准神经网络模型可以用于对未标注图像数据进行数据挑选，得到具有较高信息量的未标注图像数据。

在一个实施例中，服务器根据标注图像数据使用VGG(Visual Geometry GroupNetwork，VGG模型)进行训练，得到基准神经网络模型。

在一个实施例中，服务器根据标注图像数据使用ResNet(Residual NeuralNetwork，深度残差网络)进行训练，得到基准神经网络模型。

在一个实施例中，服务器根据标注图像数据使用DenseNet(Dense ConvolutionalNetwork，密集卷积网络)进行训练，得到基准神经网络模型。

S206，将当前训练数据输入到基准神经网络模型中进行训练，得到分类神经网络模型，分类神经网络模型用于对图像数据进行分类。

其中，分类神经网络模型用于对图像数据进行分类判断，该图像数据类别包括图像数据被标注和图像数据未被标注两类。分类神经网络模型是通过当前训练数据使用基准神经网络模型进行自监督学习，得到的卷积神经网络模型。由于使用基准神经网络模型进行训练，使基准神经网络模型的特征能够被复用，提高了训练的效率。其中，自监督学习(Self-supervised Learning)是指没有人工标注标签的监督学习，其标签从输入数据中生成，鼓励机器自发的从数据中获取有用信息。即将图像数据是否标注视为自监督任务中的自监督信号，比如，自监督信号可以是图像数据已标注(1)、图像数据未标注(0)。即通过自监督学习可以将标注图像数据和未标注图像数据视为两个域，支持卷积神经网络自发的在这两个域中找寻域内样本共性与域间样本差异性。然后通过域间样本差异性来确定未标注图像数据的标注价值，即信息量。比如，域间样本差异性越大代表该图像数据在已标注域存在类似样本的几率越小，因此模型更需要学习此类样本以增加训练数据多样性，即需要对该未标注的图像数据进行标注。

具体地，服务器将将当前训练数据输入到基准神经网络模型中进行训练，当训练的损失函数值达到预设阈值或者训练达到最大迭代次数时，得到分类神经网络模型。其中，损失函数可以使用交叉熵损失函数如公式(1)所示。

其中，loss是指损失值，

是指自监督信号，y_i是指训练时网络输出值。

S208，将未标注图像数据输入到分类神经网络模型中进行识别，得到输出的类别概率。

具体地，服务器将未标注图像数据输入到分类神经网络模型中进行识别，得到输出的每个未标注图像数据对应的类别概率。即属于标注类别或者未标注类别的概率。

S210，根据类别概率确定未标注图像数据对应的信息量，从未标注图像数据中获取信息量超过预设阈值的目标未标注图像数据。

其中，信息量用于反映未标注图像数据域间差异性的大小，即表示未标注图像数据标注价值的大小。未标注图像数据域间差异性越大，即表示未标注图像数据标注价值越大，则未标注图像数据越需要被标注。预设阈值是指预先设置好的信息量阈值，可以是通过人为历史经验得到的。超过该信息量的未标注图像数据，说明该未标注图像数据的域间差异性的较大，是需要被标注的。

具体地，服务器根据标注类别或者未标注类别的概率确定未标注图像数据对应的信息量，其中，同一图像数据的标注类别的概率越低，未标注类别的概率越高，说明域间差异性越大，则得到的信息量越高。当标注类别的概率与未标注类别的概率越近时，说明域间差异性越小，则得到的信息量越低。此时，从未标注图像数据中选取信息量超过预设阈值的未标注图像数据，将选取到的未标注图像数据作为目标未标注图像数据。

S212，获取目标未标注图像数据对应的标注值，得到目标标注图像数据，根据目标标注图像数据确定更新的标注图像数据和更新的未标注图像数据，将更新的标注图像数据和更新的未标注图像数据作为当前训练数据。

其中，标注值是指目标未标注图像数据对应的标注。比如，别。图像识别是图像中的人脸识别任务时，则标注值可以是未标注图像数据中的人脸框。目标标注图像数据是对未标注图像数据进行标注后得到的数据。

具体地，服务器获取到目标未标注图像数据对应的标注值，该标注值可以是专业人员通过标记工具对目标未标注图像数据进行标注后得到的。服务器得到目标标注图像数据，然后根据目标标注图像数据和初始图像训练数据得到更新的标注图像数据和更新的未标注图像数据。此时，将将更新的标注图像数据和更新的未标注图像数据作为当前训练数据。

S214，将更新的标注图像数据输入到基准神经网络模型中进行训练，得到更新的基准神经网络模型。

具体地，服务器将更新的标注图像数据输入到基准神经网络模型中进行训练，即对基准神经网络模型进行参数调整，当目标任务的损失函数值达到预设阈值或者达到最大迭代次数时，得到更新的基准神经网络模型。此时，执行步骤S216。

S216，判断更新的基准神经网络模型是否达到了预设条件。

S218a，当达到了预设条件时，将更新的基准神经网络模型作为目标神经网络模型，以通过所述目标神经网络模型对目标图像进行识别。

S218b，当未达到预设条件时，将更新的基准神经网络模型作为基准神经网络模型，返回步骤S204继续执行。

其中，预测条件是指更新的基准神经网络模型性能达到了预先设置好的准确率或者更新的基准神经网络模型性能与未更新的基准神经网络模型准确率相比无明显提升。目标神经网络模型是指最终训练得到的图像识别对应的神经网络模型。该目标神经网络模型用于对目标图像进行识别，得到识别结果。

具体地，服务器判断更新的基准神经网络模型是否达到了预设条件，当未达到预设条件时，就进行主动学习，即执行步骤S218b。其中，主动学习是指通过一定的算法查询最有用的未标记样本，并交由专家人员进行标记，然后用查询到的样本重新训练神经网络模型来提高模型识别图像的准确率。当达到预设条件时，执行步骤S218a。即将更新的基准神经网络模型作为基准神经网络模型，返回步骤S204继续执行。当达到预设条件时，直接将更新的基准神经网络模型作为目标神经网络模型。

上述图像识别模型训练方法，通过使用标注图像数据训练得到基准神经网络模型，然后使用标注图像数据和未标注图像数据通过基准神经网络模型进行训练得到分类神经网络模型，能够使基准神经网络模型中的特征信息被分类神经网络模型复用，提高了训练得到分类神经网络模型的效率。然后通过使用分类神经网络模型来挑选到信息量较高的未标注图像数据进行标注，并使用更新的标注图像数据重新训练调整基准神经网络模型，直到基准神经网络模型达到预设条件时，将更新的基准神经网络模型作为目标神经网络模型，以通过目标神经网络模型对目标图像进行识别。即通过自监督学习与主动学习相结合的训练方法，通过在未标注图像数据中查找到最有价值的未标注图像数据。对最有价值的未标注图像数据进行标注，提供给基准神经网络模型进行模型调整，实现了只需要标注少量的数据，使得到的目标神经网络模型在图像识别上的准确率提高。同时，通过自监督学习，可以让卷积神经网络自主的学习鲁棒的特征表示能力，进一步提高训练得到的网络目标神经网络模型在图像识别上的准确率能。

在一个实施例中，如图3所示，步骤S210，即所述根据所述类别概率确定所述未标注图像数据对应的信息量，从所述未标注图像数据中获取所述信息量超过预设阈值的目标未标注图像数据，包括步骤：

S302，获取未标注图像数据的自监督信号，根据自监督信号和类别概率计算未标注图像数据的损失值。

其中，自监督信号是指数据是否被标注的信号，该信号是不需要人为标注的，该信号是数据自带的。

具体地，服务器获取未标注图像数据的自监督信号，根据自监督信号和类别概率使用自监督损失函数计算未标注图像数据的损失值。该自监督损失函数如公式(2)所示：

其中，loss_m是指未标注图像数据对应的损失值，

是指未标注图像数据的自监督信号，m_i是指未标注图像数据对应的类别概率。

S304，从未标注图像数据中获取损失值超过预设损失阈值的目标未标注图像数据。

其中，预设损失阈值是指预先设置好的未标注图像数据对应的损失阈值。该损失阈值越大，说明域间差异性越大，即未标注图像数据的信息量就越大。

具体地，服务器从未标注图像数据中选取损失值超过预设损失阈值的未标注图像数据，则该未标注图像数据为目标未标注图像数据。则该目标未标注图像数据需要进行人为的标注。

在上述实施例中，通过使用自监督的损失函数来确定需要进行标注的未标注图像数据，能够比较精确的得到需要进行标注的未标注图像数据，从而提高训练得到的目标神经网络模型的性能。

在一个实施例中，步骤S212，根据目标标注图像数据确定更新的标注图像数据和更新的未标注图像数据，包括步骤：

根据目标标注图像数据和标注图像数据得到更新的标注图像数据，根据未标注图像数据和目标标注图像数据得到更新的未标注图像数据。

具体地，服务器将目标标注图像数据扩充到初始图像训练数据的标注图像数据中，得到更新的标准数据。服务器获取到初始图像训练数据中未标注图像数据，根据未标注图像数据和目标标注图像数据确定更新的未标注图像数据，即将目标标注图像数据对应的未标注图像数据从未标注图像数据中删除。

在上述实施例中，服务器使用目标标准数据对当前训练数据进行更新，即得到更新的未标注图像数据和更新的标注图像数据，便于后续对当前训练数据进行更新，方便使用。

在一个实施例中，在步骤S218a，即在将更新的基准神经网络模型作为目标神经网络模型之后，还包括步骤：

将目标神经网络模型部署到云服务器中。

其中，云服务器一种简单高效、安全可靠、处理能力可弹性伸缩的计算服务。

具体地，将训练好的目标神经网络模型部署到云服务器中，能够快速部署，并且在目标神经网络模型使用时能够减少延迟、提高反应速度。具体来说：将目标神经网络模型导出为目标神经网络模型文件，在云服务器中进行目标神经网络模型的运行环境配置，然后将目标神经网络模型文件上传到云服务器中，运行目标神经网络模型文件，就可以将目标神经网络模型部署到云服务器中。

在一个实施例中，可以将训练好的目标神经网络模型直接部署到服务器的生产环境中进行使用。该生产环境是指正式提供图像识别服务的服务器环境。

在一个实施例中，在步骤S218a，在将更新的基准神经网络模型作为目标神经网络模型之后，还包括步骤：

S402，获取待识别图像数据，将待识别图像数据输入到目标神经网络模型中进行任务预测，得到输出的识别概率。

S406，根据识别概率确定待识别图像数据对应的识别结果。

其中，待识别图像数据是指需要进行图像识别的图像数据。识别概率是指该待识别图像数据对应的识别结果对应概率。识别结果是指该待识别图像数据对应的识别结果。比如，图像人脸识别任务，识别概率是指待识别图像数据中物体是人脸的概率，识别结果可以是图像中的人脸。

具体地，服务器在得到目标神经网络模型之后，服务器获取到要进行目标任务预测的待识别图像数据，将待识别图像数据输入到已训练完成的目标神经网络模型中进行任务预测，得到输出的识别概率。根据识别概率确定待识别图像数据对应的识别结果。比如，待识别图像数据是待识别图像，该目标任务是对人脸中的图像进行识别，将待识别图像输入到人脸识别神经网络模型，得到输出的待识别图像中存在的人脸概率，然后可以将超过预设人脸概率阈值的人脸确定为识别结果，即图像中存在的人脸。

在上述实施例中，通过目标神经网络模型对待识别图像数据进行预测，得到待识别图像数据对应的识别结果，提高了得到识别结果的效率和精准性。

在一个实施例中，步骤S210，即从未标注图像数据中获取信息量超过预设阈值的目标未标注图像数据,包括步骤：

按照信息量对未标注图像数据进行排序，根据排序结果选取预设数量的未标注图像数据，得到目标未标注图像数据。

具体地，服务器按照信息量的大小对未标注图像数据中的未标注图像进行标注，得到排序后的未标注图像数据，从排序后的未标注图像数据从大到小依次选取预设数量的未标注图像，得到目标未标注图像数据。其中，预设数量是根据人为经验设置的数量。

在一个实施例中，如图5所示，步骤S218，更新的基准神经网络模型达到预设条件，将更新的基准神经网络模型作为目标神经网络模型，包括步骤：

S502，获取测试图像数据和对应的已有识别结果。

S504，将测试图像数据输入到更新的基准神经网络模型中进行测试，得到输出的测试结果，根据已有识别结果和测试结果确定图像识别准确率。

S506，当图像识别准确率达到预设阈值时，将更新的基准神经网络模型作为目标神经网络模型。

其中，测试图像数据是用于对更新的基准神经网络模型进行测试的图像数据，该图像数据不包括在初始图像训练数据中。且该测试图像数据都有对应的已有识别结果。已有识别结果是指通过其他方式比如人工或者传统方式得到的测试图像的识别结果，并保存在服务器中的。

具体地，当服务器训练得到的更新的的基准神经网络模型时，获取到测试图像数据和对应的已有识别结果，将将测试图像数据输入到更新的基准神经网络模型中进行测试，得到输出的测试结果，将已有识别结果和测试结果进行比较，确定相同结果的测试图像数量和不同结果的测试图像数量，并根据测试图像数据中的测试图像总数量和相同结果的测试图像数量计算得到图像识别准确率。当图像识别准确率达到预先设置好的阈值或者图像识别准确率与前一更新基准神经网络模型的图像识别准确率相比未发生变化的时，将更新的基准神经网络模型作为目标神经网络模型。即通过测试得到更新的基准神经网络模型的图像识别准确率，从而得到符合要求的图像识别准确率的目标神经网络模型。

在一个具体实施例中，如图6所示，图像识别模型训练方法，包括步骤：

S602，获取初始宫颈内镜图像数据，初始宫颈内镜图像数据包括标注宫颈内镜图像数据和未标注宫颈内镜图像数据，将初始宫颈内镜图像数据作为当前训练数据。

S604，根据标注宫颈内镜图像数据使用卷积神经网络进行训练，得到基准图像识别模型。

S606，将当前训练数据输入到基准图像识别模型中进行训练，得到分类识别模型，分类识别模型用于对数据进行分类。

S608，将未标注宫颈内镜图像数据输入到分类神经网络模型中进行识别，得到输出的未标注类别概率。

S610，根据未标注类别概率确定未标注宫颈内镜图像数据对应的信息量，从未标注宫颈内镜图像数据中获取信息量超过预设阈值的目标未标注宫颈内镜图像数据。

S612，获取未标注宫颈内镜图像数据对应的标注值，得到目标标注宫颈内镜图像，根据目标标注宫颈内镜图像确定更新的标注宫颈内镜图像数据和更新的未标注宫颈内镜图像数据，将更新的标注宫颈内镜图像数据和更新的未标注宫颈内镜图像数据作为当前训练数据。

S614，将更新的标注宫颈内镜图像数据输入到基准图像识别模型中进行训练，得到更新的基准图像识别模型。

S616，判断更新的基准图像识别模型达到预设条件，当达到预设条件时，执行步骤S618a。当未达到预设条件时，执行步骤S618b并返回步骤S606继续执行。

S618a，将更新的基准图像识别模型作为宫颈内镜图像识别模型。

S618b，将更新的基准图像识别模型作为基准图像识别模型，并返回步骤S606继续执行。

具体地，将图像识别模型训练方法应用于判断宫颈内镜图像是否属于癌前病变阳性样本的任务中，该任务是分类任务，包括宫颈内镜图像属于癌前病变阳性图像和宫颈内镜图像属于癌前病变阴性图像两类。服务器采集到大量宫颈内镜图像数据集，其中，大部分为未标注的宫颈内镜图像数据集(unlabeled data)，其余部分为有标注的宫颈内镜图像数据集(labeled data)。通过上述步骤训练得到的宫颈内镜图像识别模型。如图7所示，为自监督学习和主动学习的联合训练框架示意图，服务器利用标注的宫颈内镜图像数据集使用主干网络(CNN)进行训练，得到基准图像识别模型。将大量宫颈内镜图像数据集一起输入到主干网络中进行训练，此时主干网络通过自监督损失函数(self-supervised loss)控制学习，得到训练好的分类神经网络模型，该分类神经网络模型用于识别宫颈内镜图像是否被标注(labeled or not)。然后利用训练完毕的分类神经网络模型对未标注的宫颈内镜图像数据集进行挑选，得到需要进行标注的未标注的宫颈内镜图像数据集。然后通过专业医生对未标注的宫颈内镜图像进行识别标注，将标注后的宫颈内镜图像数据集加入到标注的宫颈内镜图像数据集中，得到更新的标注的宫颈内镜图像数据集和未标注的宫颈内镜图像数据集，利用更新的标注的宫颈内镜图像数据集对主干网络再次进行调整，此时，使用识别宫颈内镜图像是否属于癌前病变阳性样本的任务的损失函数，即目标任务(target taskloss)的损失函数控制学习，得到更新的基准图像识别模型，当更新的基准图像识别模型符合预设条件时，将更新的基准图像识别模型作为最终的宫颈内镜图像识别模型。当未符合预设条件时，将更新的基准图像识别模型作为基准图像识别模型，并返回步骤S506继续执行，直到符合预设条件。其中，初始宫颈内镜图像数据中有7万多张宫颈内镜图像，该7万多张宫颈内镜图像有10％为标注的宫颈内镜图像，即7000多张宫颈内镜图像，剩余的都是未标注的宫颈内镜图像。当训练得到最终的宫颈内镜图像识别模型时，标注的宫颈内镜图像有2万多张。此时，明显的使用了少量的标注的宫颈内镜图像就训练得到的最终的宫颈内镜图像识别模型，从而不必标注所有的宫颈内镜图像，并且保证了最终的宫颈内镜图像识别模型的图像识别准确率。

在一个具体实施例中，如图8所示，在步骤S618a之后，即在将更新的基准图像识别模型作为宫颈内镜图像识别模型之后，还包括步骤：

S802，获取待识别宫颈内镜图像，将待识别宫颈内镜图像输入到宫颈内镜图像识别模型中，得到输出的类别预测概率。

S804，根据类别预测概率得到待识别宫颈内镜图像对应的类别。

具体地，在服务器得到训练好的宫颈内镜图像识别模型时，可以对待识别的宫颈内镜图像进行识别，将待识别宫颈内镜图像输入到宫颈内镜图像识别模型中，得到输出的类别预测概率，比如，输出的是宫颈内镜图像为癌前病变阳性图像的概率为20％，为癌前病变阴性图像的概率为80％。此时，将类别预测概率中最大概率对应的类别作为待识别宫颈内镜图像对应的类别。癌前病变阴性图像的概率为80％比癌前病变阳性图像的概率为20％大，则待识别宫颈内镜图像确定的类别为癌前病变阴性图像。通过上述实施例中，通过使用训练好的宫颈内镜图像识别模型进行识别，提高了宫颈内镜图像识别的效率和准确性。

应该理解的是，虽然图2-图6、图8的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，图2-图6、图8中的至少一部分步骤可以包括多个子步骤或者多个阶段，这些子步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些子步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

在一个实施例中，如图9所示，提供一种模型训练装置900，包括，数据获取模块902、基准模型训练模块904、分类模型训练模块906、分类识别模块808、目标数据获取模块910、数据更新模块912和目标模型得到模块914，其中：

数据获取模块902，用于获取初始图像训练数据，初始图像训练数据包括标注图像数据和未标注图像数据，将初始图像训练数据作为当前训练数据；

基准模型训练模块904，用于根据标注图像数据使用卷积神经网络进行训练，得到基准神经网络模型；

分类模型训练模块906，用于将当前训练数据输入到基准神经网络模型中进行训练，得到分类神经网络模型，分类神经网络模型用于对图像数据进行分类；

分类识别模块908，用于将未标注图像数据输入到分类神经网络模型中进行识别，得到输出的类别概率；

目标数据获取模块910，用于根据类别概率确定未标注图像数据对应的信息量，从未标注图像数据中获取信息量超过预设阈值的目标未标注图像数据；

数据更新模块912，用于获取目标未标注图像数据对应的标注值，得到目标标注图像数据，根据目标标注图像数据确定更新的标注图像数据和更新的未标注图像数据，将更新的标注图像数据和更新的未标注图像数据作为当前训练数据；

目标模型得到模块914，用于将更新的标注图像数据输入到基准神经网络模型中进行训练，得到更新的基准神经网络模型，将更新的基准神经网络模型作为基准神经网络模型，返回将当前训练数据输入到基准神经网络模型中进行训练，得到分类神经网络模型的步骤执行，直到更新的基准神经网络模型达到预设条件，将更新的基准神经网络模型作为目标神经网络模型，以通过目标神经网络模型对目标图像进行识别。

在一个实施例中，目标数据获取模块910，包括：

损失值确定单元，用于获取未标注图像数据的自监督信号，根据自监督信号和类别概率计算未标注图像数据的损失值；

目标数据确定单元，用于从未标注图像数据中获取损失值超过预设损失阈值的目标未标注图像数据。

在一个实施例中，数据更新模块912还用于根据目标标注图像数据和标注图像数据得到更新的标注图像数据，根据未标注图像数据和目标标注图像数据得到更新的未标注图像数据。

在一个实施例中，模型训练装置900，还包括：

部署模块，用于将目标神经网络模型部署到云服务器中。

在一个实施例中，模型训练装置900，还包括：

预测模块，用于获取待识别图像数据，将待识别图像数据输入到目标神经网络模型中进行任务预测，得到输出的识别概率；根据识别概率确定待识别图像数据对应的识别结果。

在一个实施例中，目标数据获取模块910,包括：

排序单元，用于按照所述信息量对所述未标注图像数据进行排序，根据所述排序结果选取预设数量的未标注图像数据，得到目标未标注图像数据。

在一个实施例中，目标模型得到模块914，包括：

测试数据获取单元，用于获取测试图像数据和对应的已有识别结果；

测试单元，用于将所述测试图像数据输入到所述更新的基准神经网络模型中进行测试，得到输出的测试结果，根据所述已有识别结果和所述测试结果确定图像识别准确率；

准确率比较单元，用于当所述图像识别准确率达到预设阈值时，将所述更新的基准神经网络模型作为目标神经网络模型。

在一个实施例中，模型训练装置900，还包括：

图像数据获取模块，用于获取初始宫颈内镜图像数据，初始宫颈内镜图像数据包括标注宫颈内镜图像数据和未标注宫颈内镜图像数据，将初始宫颈内镜图像数据作为当前训练数据；

图像模块训练模块，用于根据标注宫颈内镜图像数据使用卷积神经网络进行训练，得到基准图像识别模型；

图像分类模型训练模块，用于将当前训练数据输入到基准图像识别模型中进行训练，得到分类识别模型，分类识别模型用于对数据进行分类；

图像分类识别模块，用于将未标注宫颈内镜图像数据输入到分类神经网络模型中进行识别，得到输出的未标注类别概率；

图像数据获取模块，用于根据未标注类别概率确定未标注图像数据对应的信息量，从未标注宫颈内镜图像数据中获取信息量超过预设阈值的目标未标注宫颈内镜图像数据；

图像数据更新模块，用于获取未标注宫颈内镜图像数据对应的标注值，得到目标标注宫颈内镜图像，根据目标标注宫颈内镜图像确定更新的标注宫颈内镜图像数据和更新的未标注宫颈内镜图像数据，将更新的标注宫颈内镜图像数据和更新的未标注宫颈内镜图像数据作为当前训练数据；

图像识别模块得到模块，用于将更新的标注宫颈内镜图像数据输入到基准图像识别模型中进行训练，得到更新的基准图像识别模型，将更新的基准图像识别模型作为基准图像识别模型，返回将当前训练数据输入到基准图像识别模型中进行训练，得到分类识别模型的步骤执行，直到更新的基准图像识别模型达到预设条件，将更新的基准图像识别模型作为宫颈内镜图像识别模型。

在一个实施例中，模型训练装置900，还包括：

图像类别识别模块，用于获取待识别宫颈内镜图像，将待识别宫颈内镜图像输入到宫颈内镜图像识别模型中，得到输出的类别预测概率；根据类别预测概率得到待识别宫颈内镜图像对应的类别。

109示出了一个实施例中计算机设备的内部结构图。该计算机设备具体可以是图1中的服务器104。如图10所示，该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储门禁设备标识列表信息、地址信息等。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种图像识别模型训练方法。

本领域技术人员可以理解，图10中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在一个实施例中，本申请提供的模型训练装置可以实现为一种计算机程序的形式，计算机程序可在如图10所示的计算机设备上运行。计算机设备的存储器中可存储组成该模型训练装置的各个程序模块，比如，图9所示的数据获取模块902、基准模型训练模块904、分类模型训练模块906、分类识别模块908、目标数据获取模块910、数据更新模块912和目标模型得到模块914。各个程序模块构成的计算机程序使得处理器执行本说明书中描述的本申请各个实施例的图像识别模型训练方法中的步骤。

例如，图10所示的计算机设备可以通过如图9所示的模型训练装置中的数据获取模块902执行步骤S202。基准模型训练模块904执行步骤S204。分类模型训练模块906执行步骤S206。分类识别模块908执行步骤S208。目标数据获取模块910执行步骤S210.数据更新模块912执行步骤S212。目标模型得到模块914执行步骤S214、步骤S216、步骤S218a和步骤S218b。

在一个实施例中，提供了一种计算机设备，包括存储器和处理器，存储器存储有计算机程序，计算机程序被处理器执行时，使得处理器执行上述图像识别模型训练方法的步骤。此处图像识别模型训练方法的步骤可以是上述各个实施例的图像识别模型训练方法中的步骤。

在一个实施例中，提供了一种计算机可读存储介质，存储有计算机程序，计算机程序被处理器执行时，使得处理器执行上述图像识别模型训练方法的步骤。此处图像识别模型训练方法的步骤可以是上述各个实施例的图像识别模型训练方法中的步骤。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指示相关的硬件来完成，所述的程序可存储于一非易失性计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对本申请专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请专利的保护范围应以所附权利要求为准。

Claims

1.一种图像识别模型训练方法，包括：

获取初始图像训练数据，所述初始图像训练数据包括标注图像数据和未标注图像数据，将所述初始图像训练数据作为当前训练数据；

根据所述标注图像数据使用卷积神经网络进行训练，得到基准神经网络模型；

将所述当前训练数据输入到所述基准神经网络模型中进行训练，得到分类神经网络模型，所述分类神经网络模型用于对图像数据进行分类；

将所述未标注图像数据输入到分类神经网络模型中进行识别，得到输出的类别概率；

根据所述类别概率确定所述未标注图像数据对应的信息量，从所述未标注图像数据中获取所述信息量超过预设阈值的目标未标注图像数据；

获取所述目标未标注图像数据对应的标注值，得到目标标注图像数据，根据所述目标标注图像数据确定更新的标注图像数据和更新的未标注图像数据，将所述更新的标注图像数据和所述更新的未标注图像数据作为当前训练数据；

将所述更新的标注图像数据输入到所述基准神经网络模型中进行训练，得到更新的基准神经网络模型，将所述更新的基准神经网络模型作为基准神经网络模型，返回将所述当前训练数据输入到所述基准神经网络模型中进行训练，得到分类神经网络模型的步骤执行，直到所述更新的基准神经网络模型达到预设条件，将所述更新的基准神经网络模型作为目标神经网络模型，以通过所述目标神经网络模型对目标图像进行识别。

2.根据权利要求1所述的方法，其特征在于，所述根据所述类别概率确定所述未标注图像数据对应的信息量，从所述未标注图像数据中获取所述信息量超过预设阈值的目标未标注图像数据，包括：

获取所述未标注图像数据的自监督信号，根据所述自监督信号和所述类别概率计算所述未标注图像数据的损失值；

从所述未标注图像数据中获取所述损失值超过预设损失阈值的目标未标注图像数据。

3.根据权利要求1所述的方法，其特征在于，所述根据所述目标标注图像数据确定更新的标注图像数据和更新的未标注图像数据，包括：

根据所述目标标注图像数据和所述标注图像数据得到更新的标注图像数据，根据所述未标注图像数据和所述目标标注图像数据得到更新的未标注图像数据。

4.根据权利要求1所述的方法，其特征在于，在所述将更新的基准神经网络模型作为目标神经网络模型之后，还包括：

将所述目标神经网络模型部署到云服务器中。

5.根据权利要求1所述的方法，其特征在于，在所述将更新的基准神经网络模型作为目标神经网络模型之后，还包括：

获取待识别图像数据，将所述待识别图像数据输入到所述目标神经网络模型中进行识别，得到输出的识别概率；

根据所述识别概率确定所述待识别图像数据对应的识别结果。

6.根据权利要求1所述的方法，其特征在于，从所述未标注图像数据中获取所述信息量超过预设阈值的目标未标注图像数据,包括：

按照所述信息量对所述未标注图像数据进行排序，根据所述排序结果选取预设数量的未标注图像数据，得到目标未标注图像数据。

7.根据权利要求1所述的方法，其特征在于，所述更新的基准神经网络模型达到预设条件，将更新的基准神经网络模型作为目标神经网络模型，包括：

获取测试图像数据和对应的已有识别结果；

将所述测试图像数据输入到所述更新的基准神经网络模型中进行测试，得到输出的测试结果，根据所述已有识别结果和所述测试结果确定图像识别准确率；

当所述图像识别准确率达到预设阈值时，将所述更新的基准神经网络模型作为目标神经网络模型。

8.一种模型训练装置，其特征在于，所述装置包括：

数据获取模块，用于获取初始图像训练数据，所述初始图像训练数据包括标注图像数据和未标注图像数据，将所述初始图像训练数据作为当前训练数据；

基准模型训练模块，用于根据所述标注图像数据使用卷积神经网络进行训练，得到基准神经网络模型；

分类模型训练模块，用于将所述当前训练数据输入到所述基准神经网络模型中进行训练，得到分类神经网络模型，所述分类神经网络模型用于对数据进行分类；

分类识别模块，用于将所述未标注图像数据输入到分类神经网络模型中进行识别，得到输出的类别概率；

目标数据获取模块，用于根据所述类别概率确定所述未标注图像数据对应的信息量，从所述未标注图像数据中获取所述信息量超过预设阈值的目标未标注图像数据；

数据更新模块，用于获取所述目标未标注图像数据对应的标注值，得到目标标注图像数据，根据所述目标标注图像数据确定更新的标注图像数据和更新的未标注图像数据，将所述更新的标注图像数据和所述更新的未标注图像数据作为当前训练数据；

目标模型得到模块，用于将所述更新的标注图像数据输入到所述基准神经网络模型中进行训练，得到更新的基准神经网络模型，将所述更新的基准神经网络模型作为基准神经网络模型，返回将所述当前训练数据输入到所述基准神经网络模型中进行训练，得到分类神经网络模型的步骤执行，直到所述更新的基准神经网络模型达到预设条件，将所述更新的基准神经网络模型作为目标神经网络模型，以通过所述目标神经网络模型对目标图像进行识别。

9.一种计算机可读存储介质，存储有计算机程序，所述计算机程序被处理器执行时，使得所述处理器执行如权利要求1至7中任一项所述方法的步骤。

10.一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述计算机程序被所述处理器执行时，使得所述处理器执行如权利要求1至7中任一项所述方法的步骤。