CN112101162B

CN112101162B - 图像识别模型的生成方法、装置、存储介质和电子设备

Info

Publication number: CN112101162B
Application number: CN202010923990.1A
Authority: CN
Inventors: 王希; 何光宇; 平安; 程万军
Original assignee: Shenyang Neusoft Intelligent Medical Technology Research Institute Co Ltd
Current assignee: Shenyang Neusoft Intelligent Medical Technology Research Institute Co Ltd
Priority date: 2020-09-04
Filing date: 2020-09-04
Publication date: 2024-03-26
Anticipated expiration: 2040-09-04
Also published as: CN112101162A

Abstract

本公开涉及一种图像识别模型的生成方法、装置、存储介质和电子设备，该方法包括：将人体部位对应的待标注图像样本作为预训练后的子模型的输入，以获取针对于每个待标注图像样本中是否包含该人体部位的识别概率；根据该识别概率和每个待标注图像样本与人体部位对应的多个已标注图像样本之间的图像相似度，从待标注图像样本中筛选出目标样本；获取每个目标样本对应的已标注图像样本；通过多个已标注图像样本和测试集对子模型进行重训练，以生成图像识别模型。能够通过预训练后的识别模型确定图像样本的识别概率，并通过根据该识别概率和图像样本的相似度特征筛选出的图样样本对模型进行重训练，在保证模型训练效果的前提下，减少图像标注成本。

Description

图像识别模型的生成方法、装置、存储介质和电子设备

技术领域

本公开涉及信息管理领域，具体地，涉及一种图像识别模型的生成方法、装置、存储介质和电子设备。

背景技术

随着人工智能的不断发展，越来越多的行业开始通过人工智能模型代替人工完成具体的工作。人工智能模型的核心是对机器学习模型的训练和应用。针对于数据驱动的机器学习模型，其训练数据通常包括业务数据(对应于机器学习模型的输入数据)和业务数据相关的分类或预测结果(对应于机器学习模型的输出结果)，而训练数据中的分类或预测结果的标注是致使机器学习模型具备相应功能的关键因素。应用在医疗行业中，可以通过预先训练后的机器学习模型对医学图像进行分类或预测，以实现对医学图像的识别。相关技术中，针对于医学图像相关的图像识别模型，通常需要由经验丰富的医生在观看图像样本后对大量的图像样本中的分类或预测结果进行标注，再通过标注后的大量的图像样本对图像识别模型进行一次性地训练。但是，受制于劳动时间和个人隐私，对大量图像样本进行人工标注的成本很高，进而造成图像识别模型的训练成本较高，同时训练效率也较差。

发明内容

为克服相关技术中存在的问题，本公开的目的是提供一种图像识别模型的生成方法、装置、存储介质和电子设备。

为了实现上述目的，根据本公开实施例的第一方面，提供一种图像识别模型的生成方法，所述方法包括：

将目标人体部位对应的待标注图像样本集作为预训练后的第一子模型的输入，以获取所述第一子模型输出的所述待标注图像样本集中每个待标注图像样本对应的第一概率；其中，所述第一子模型为通过所述目标人体部位对应的图像样本集中的训练集对预设的分类模型进行预训练所获得的图像识别模型，所述第一概率用于表征待标注图像样本中包含所述目标人体部位的概率，所述目标人体部位为预设的多种人体部位中的任一人体部位；

根据所述每个待标注图像样本与所述目标人体部位对应的多个已标注图像样本之间的图像相似度，以及所述第一概率，从所述待标注图像样本集中筛选出多个目标图像样本；

输出所述多个目标图像样本，以获取到每个所述目标图像样本对应的目标已标注图像样本，作为目标图像样本集；

通过所述目标图像样本集和所述图像样本集中的测试集对所述第一子模型进行重训练，以获取所述目标人体部位对应的第二子模型；

通过所述多种人体部位中每种人体部位对应的第二子模型构建目标图像识别模型，所述目标图像识别模型用于确定图像中包含的人体部位。

可选的，所述根据所述每个待标注图像样本与所述目标人体部位对应的多个已标注图像样本之间的图像相似度，以及所述第一概率，从所述待标注图像样本集中筛选出多个目标图像样本，包括：

根据所述第一概率确定所述每个待标注图像样本对应的分类难度得分，所述分类难度得分是根据所述第一概率与预设概率的接近程度确定的；

获取所述图像相似度；

通过预设的筛选得分计算公式，根据所述图像相似度和所述分类难度得分确定所述每个待标注图像样本对应的筛选得分；

根据所述筛选得分，从所述待标注图像样本集中确定多个目标图像样本，所述目标图像样本对应的筛选得分大于预设得分；

其中，所述筛选得分计算公式表示为：

其中，h表示所述待标注图像样本的筛选得分，f表示所述待标注图像样本的分类难度得分，d表示所述待标注图像样本与所述目标人体部位对应的已标注图像样本之间的图像相似度，β为预设的权重参数。

可选的，所述获取所述图像相似度，包括：

针对所述每个待标注图像样本，通过预设的图像特征提取算法，获取该待标注图像样本对应的第一不变矩特征组，所述不变矩特征组包含该待标注图像样本对应的七个不变矩特征；

计算所述第一不变矩特征组和每个所述已标注图像样本对应的第二不变矩特征组之间的相似度；

将多个所述相似度中最大的相似度作为所述图像相似度。

可选的，所述通过所述目标图像样本集和所述图像样本集中的测试集对所述第一子模型进行重训练，以获取所述目标人体部位对应的第二子模型，包括：

通过所述目标图像样本集对所述第一子模型进行更新，以获取更新后的第三子模型；

确定所述第三子模型是否满足预设的训练终止条件；

在确定所述第三子模型不满足所述训练终止条件的情况下，将所述第三子模型作为所述第一子模型，重复执行从所述将目标人体部位对应的待标注图像样本集作为预训练后的第一子模型的输入，以获取所述第一子模型输出的所述待标注图像样本集中每个待标注图像样本对应的第一概率至所述通过所述目标图像样本集和所述图像样本集中的测试集对所述第一子模型进行重训练的步骤，直至所述第三子模型满足所述训练终止条件；

将满足所述训练终止条件的第三子模型作为所述第二子模型。

可选的，所述确定所述第三子模型是否满足预设的训练终止条件，包括：

通过所述测试集确定所述第三子模型的识别准确率；

在所述识别准确率大于预设准确率的情况下，确定所述第三子模型满足第一预设条件；

在已输入所述第三子模型的所述目标图像样本的总数量大于预设数量的情况下，确定所述第三子模型满足第二预设条件；

在确定所述第三子模型满足所述第一预设条件和所述第二预设条件中的至少一者的情况下，确定所述第三子模型满足所述训练终止条件。

可选的，在所述通过所述多种人体部位中每种人体部位对应的第二子模型构建目标图像识别模型之后，所述方法还包括：

将目标图像作为所述目标图像识别模型的输入，以获取所述目标图像识别模型输出的所述目标图像针对所述每种人体部位的第二概率；

确定所述目标图像包含的人体部位为对应于最高第二概率的人体部位；

根据所述目标图像包含的人体部位对所述目标图像进行分类归档储存。

根据本公开实施例的第二方面，提供一种图像识别模型的生成装置，所述装置包括：

第一概率获取模块，用于将目标人体部位对应的待标注图像样本集作为预训练后的第一子模型的输入，以获取所述第一子模型输出的所述待标注图像样本集中每个待标注图像样本对应的第一概率；其中，所述第一子模型为通过所述目标人体部位对应的图像样本集中的训练集对预设的分类模型进行预训练所获得的图像识别模型，所述第一概率用于表征所述每个待标注图像样本中包含所述目标人体部位的概率，所述目标人体部位为预设的多种人体部位中的任一人体部位；

样本筛选模块，用于根据所述每个待标注图像样本与所述目标人体部位对应的多个已标注图像样本之间的图像相似度，以及所述第一概率，从所述待标注图像样本集中筛选出多个目标图像样本；

样本集获取模块，用于输出所述多个目标图像样本集，以获取到每个所述目标图像样本对应的目标已标注图像样本，作为目标图像样本集；

模型重训练模块，用于通过所述目标图像样本集和所述图像样本集中的测试集对所述第一子模型进行重训练，以获取所述目标人体部位对应的第二子模型；

模型构建模块，用于通过所述多种人体部位中每种人体部位对应的第二子模型构建目标图像识别模型，所述目标图像识别模型用于确定图像中包含的人体部位。

可选的，所述样本筛选模块，用于：

获取所述图像相似度；

其中，所述筛选得分计算公式表示为：

可选的，所述样本筛选模块，用于：

将多个所述相似度中最大的相似度作为所述图像相似度。

可选的，所述模型重训练模块，用于：

确定所述第三子模型是否满足预设的训练终止条件；

可选的，所述模型重训练模块，用于：

通过所述测试集确定所述第三子模型的识别准确率；

可选的，所述装置还包括：

第二概率获取模块，用于将目标图像作为所述目标图像识别模型的输入，以获取所述目标图像识别模型输出的所述目标图像针对所述每种人体部位的第二概率；

部位确定模块，用于确定所述目标图像包含的人体部位为对应于最高第二概率的人体部位；

图像归档模块，用于根据所述目标图像包含的人体部位对所述目标图像进行分类归档储存。

根据本公开实施例的第三方面，提供一种计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现本公开实施例第一方面提供的图像识别模型的生成方法的步骤。

根据本公开实施例的第四方面，提供一种电子设备，包括：

存储器，其上存储有计算机程序；

处理器，用于执行所述存储器中的所述计算机程序，以实现本公开实施例第一方面提供的图像识别模型的生成方法的步骤。

通过上述技术方案，本公开能够将目标人体部位对应的待标注图像样本集作为预训练后的第一子模型的输入，以获取该第一子模型输出的该待标注图像样本集中每个待标注图像样本对应的第一概率；其中，该第一子模型为通过该目标人体部位对应的图像样本集中的训练集对预设的分类模型进行预训练所获得的图像识别模型，该第一概率用于表征待标注图像样本中包含该目标人体部位的概率，该目标人体部位为预设的多种人体部位中的任一人体部位；根据上述每个待标注图像样本与该目标人体部位对应的多个已标注图像样本之间的图像相似度，以及该第一概率，从该待标注图像样本集中筛选出多个目标图像样本；输出上述多个目标图像样本，以获取到每个该目标图像样本对应的目标已标注图像样本，作为目标图像样本集；通过该目标图像样本集和该图像样本集中的测试集对该第一子模型进行重训练，以获取用于识别该目标人体部位的第二子模型；通过上述多种人体部位中每种人体部位对应的第二子模型构建目标图像识别模型，该目标图像识别模型用于确定图像中包含的人体部位。能够通过预训练后的识别模型确定图像样本的识别概率，并通过根据该识别概率和图像样本的相似度特征筛选出的图样样本对模型进行重训练，在保证模型训练效果的前提下，减少图像标注成本。

本公开的其他特征和优点将在随后的具体实施方式部分予以详细说明。

附图说明

附图是用来提供对本公开的进一步理解，并且构成说明书的一部分，与下面的具体实施方式一起用于解释本公开，但并不构成对本公开的限制。在附图中：

图1是根据一示例性实施例示出的一种图像识别模型的生成方法的流程图；

图2是根据图1所示实施例示出的一种待标注图像的筛选方法的流程图；

图3是根据图1所示实施例示出的一种子模型的重训练方法的流程图；

图4是根据图1所示实施例示出的另一种图像识别模型的生成方法的流程图；

图5是根据一示例性实施例示出的一种图像识别模型的生成装置的框图；

图6是根据图5所示实施例示出的另一种图像识别模型的生成装置的框图；

图7是根据一示例性实施例示出的一种电子设备的框图。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

图1是根据一示例性实施例示出的一种图像识别模型的生成方法的流程图，如图1所示，该方法包括：

步骤101，将目标人体部位对应的待标注图像样本集作为预训练后的第一子模型的输入，以获取该第一子模型输出的该待标注图像样本集中每个待标注图像样本对应的第一概率。

其中，该第一子模型为通过该目标人体部位对应的图像样本集中的训练集对预设的分类模型进行预训练所获得的图像识别模型，该第一概率用于表征上述每个待标注图像样本中包含该目标人体部位的概率，该目标人体部位为预设的多种人体部位中的任一人体部位。

示例地，该图像样本集中包含的图像样本均为已标注图像样本，其附带的标注信息用于表征该图像样本中是否包含该目标人体部位。该目标人体部位可以为人的头、手、五官或各种内脏器官等。该图像样本集包括两个部分，一个部分是训练集，另一个部分是测试集，其中，训练集中包含的已标注图像样本用于对图像识别模型进行预训练，测试集中包含的已标注图像样本用于确定训练出的子模型是否达到了一定的正确率。另外，通过本公开实施例最终生成的目标图像识别模型包含多个子模型，每个子模型可以为二分类模型，对应于某个人体部位。需要说明的是，上述的训练集或测试集中包含的已标注图像样本所附带的标注信息为人工标注的标注信息，或者经其他技术手段标注后通过人工审核的标注信息，该标注信息的可以被认为是完全准确的。为了减少需要被人工标注和人工审核的图像样本的数量，该训练集，以及整个图像样本集可以被设定为包含的图像样本较少，因此，预训练后的第一子模型具备一定的图像识别能力。

示例地，在步骤101中，通过预训练后的第一子模型对未确定是否包含目标人体部位的待标注图像样本集中的待标注图像样本进行识别。该第一子模型可以为神经网络模型，该第一子模型的包含该目标人体部位的概率(即上述的第一概率)。在使用神经网络模型作为该第一子模型的情况下，上述的图像样本集中的已标注图像样本附带的标注信息可以为正类标注或负类标注，其中，该正类标注用于表征图像样本中包含该目标人体部位，该负类标注用于表征图像样本中不包含该目标人体部位。

步骤102，根据上述每个待标注图像样本与该目标人体部位对应的多个已标注图像样本之间的图像相似度，以及该第一概率，从该待标注图像样本集中筛选出多个目标图像样本。

示例地，上述步骤101至下列步骤105对图像识别模型中的每个子模型的重训练过程，在步骤102中，首先要获取重训练过程所需的训练样本，在本公开实施例中，这些训练样本为根据预设的筛选条件从多个待标注图像样本中筛选出的具备标注价值的目标图像样本。依据该筛选条件确定的目标图像样本能够达到在训练样本数量较少的情况下，保证对上述每个子模型的重训练的训练效果的目的。基于该目的，在步骤102中，该筛选条件包括上述的图像相似度和该第一概率，一方面，根据图像相似度可以剔除该待标注图像样本集中与预训练过程中使用的已标注图像样本过于相似的图像样本，减少需要标注的训练样本的数量；另一方面，根据该第一概率，可以获取该待标注图像样本集中难以被识别的图像样本，例如，第一概率接近50％，因此无法确定图像样本的附带的标注信息是正类标注还是负类标注，提高重训练训练样本和预训练训练样本的差异度，保证重训练的训练效果。

步骤103，输出上述多个目标图像样本，以获取到每个该目标图像样本对应的目标已标注图像样本，作为目标图像样本集。

示例地，确定多个具备标注价值的目标图像样本后，可以将这些目标图像样本输出至医疗领域的专业人士进行人工标注，或者，可以将上述多个目标图像样本连同其对应的第一概率一起输出至医疗领域的专业人士进行人工审核和修改。在人工标注工作完成之后，再接收被上传的每个目标图像样本对应的目标已标注图像样本，或者，接收被上传的每个目标图像样本对应的标注信息，再与目标图像样本结合生成该目标已标注图像样本，获得包含多个目标已标注图像样本的目标图像样本集。

步骤104，通过该目标图像样本集和该图像样本集中的测试集对该第一子模型进行重训练，以获取该目标人体部位对应的第二子模型。

示例地，该目标图像样本集用于对该第一子模型进行重训练，而该测试集用于验证重训练后的第一子模型的训练完成程度。若重训练后的第一子模型的识别正确率已经足够高，或者，已经输入该第一子模型的训练样本的数量样本足够多，则认为对该第一子模型的重训练完成，或者说对该第一子模型的训练整体完成，进而到的能够投入使用的第二子模型。

步骤105，通过上述多种人体部位中每种人体部位对应的第二子模型构建目标图像识别模型。

其中，该目标图像识别模型用于确定图像中包含的人体部位。

示例地，该构建过程为对训练好的各个人体部位对应的第二子模型进行连接。具体的连接方式可以为将所有第二子模型的输入接口合成为同一输入接口，以保证输入的待识别图像可以被输入至每个第二子模型。而同时保留每个第二子模型的输出。例如，该目标图像识别模型中包含10个第二子模型，每个第二子模型对应于不同的人体部位，在将待识别图像输入该目标图像识别模型后，该目标图像识别模型输出的10个识别概率，每个识别概率对应于一人体部位，其中具备最高识别概率的人体部位即为该目标图像中包含的人体部位。

综上所述，本公开能够将目标人体部位对应的待标注图像样本集作为预训练后的第一子模型的输入，以获取该第一子模型输出的该待标注图像样本集中每个待标注图像样本对应的第一概率；其中，该第一子模型为通过该目标人体部位对应的图像样本集中的训练集对预设的分类模型进行预训练所获得的图像识别模型，该第一概率用于表征待标注图像样本中包含该目标人体部位的概率，该目标人体部位为预设的多种人体部位中的任一人体部位；根据上述每个待标注图像样本与该目标人体部位对应的多个已标注图像样本之间的图像相似度，以及该第一概率，从该待标注图像样本集中筛选出多个目标图像样本；输出上述多个目标图像样本，以获取到每个该目标图像样本对应的目标已标注图像样本，作为目标图像样本集；通过该目标图像样本集和该图像样本集中的测试集对该第一子模型进行重训练，以获取用于识别该目标人体部位的第二子模型；通过上述多种人体部位中每种人体部位对应的第二子模型构建目标图像识别模型，该目标图像识别模型用于确定图像中包含的人体部位。能够通过预训练后的识别模型确定图像样本的识别概率，并通过根据该识别概率和图像样本的相似度特征筛选出的图样样本对模型进行重训练，在保证模型训练效果的前提下，减少图像标注成本，提高图像识别模型的训练效率。

图2是根据图1所示实施例示出的一种待标注图像的筛选方法的流程图，如图2所示，该步骤102可以包括：

步骤1021，根据该第一概率确定上述每个待标注图像样本对应的分类难度得分。

示例地，该分类难度得分是根据该第一概率与预设概率的接近程度确定的。具体地，上述的标注信息可以将图像样本区分为正类(附带正类标注)或负类(附带负类标注)。该第一子模型可以包括DenseNet神经网络模型，在该第一子模型的末尾部分为Sigmoid函数，该Sigmoid函数与该DenseNet神经网络模型的全连接层连接，该Sigmoid函数能够输出该第一概率，该第一概率用于反映该图像样本被预测或识别为正类的可能性，即，第一概率越大，该图像样本被预测或识别为正类的可能性越大。该Sigmoid函数可以表示为下列公式(1)：

其中，s表示上述全连接层的输出值，e为固定参数，g(s)表示该第一概率。在s等于0的情况下，g(s)＝0.5；在s远大于0的情况下，g(s)≈1，在s小于0的情况下，g(s)≈0。如此，g(s)将前一级全连接层的线性输出映射到[0，1]之间的数值概率上，作为上述的第一概率。可以理解的是，g(s)越接近1，则该图像样本为正类的可能性越大，g(s)越接近0，则该图像样本为负类的可能性越大。而在g(s)接近0.5情况下，可以认为该图像样本为正类或父类，或者说，该图像样本图像难被分类。基于上述的第一子模型，该预设概率为0.5，而该分类难度得分可以为根据该第一概率与0.5的差值确定的分类难度得分。该第一概率与0.5的差值越大，则该分类难度得分越小，反之，该第一概率与0.5的差值越小，则该分类难度得分越大。

步骤1022，获取该图像相似度。

示例地，为了提高用于重训练的多个目标图像样本相对于预训练中使用的已标注图像样本的差异性，使最终获得的多个目标图像样本能够完整而全面地体现各个不同分类的图像样本的特征，需要将待标注图像样本与预训练中使用的已标注图像样本进行对比，以获取图像相似度。可以理解的是，图像之间的相似度的对比实际为对图像样本的图像特征的对比，因此，在该步骤102中需要对每个图像样本的图像特征进行提取。在本公开实施例中，可以将图像样本的灰度值作为一个二维或三维的密度分布函数，通过矩方法提取每个图像对应的不变矩特征。每个图像样本对应的不变矩特征不会在本图像样本经历了平移、旋转和比例变化等操作的情况下出现变化。

示例地，该步骤1022可以包括：针对上述每个待标注图像样本，通过预设的图像特征提取算法，获取该待标注图像样本对应的第一不变矩特征组，该不变矩特征组包含该待标注图像样本对应的七个不变矩特征；计算该第一不变矩特征组和每个该已标注图像样本对应的第二不变矩特征组之间的相似度；将多个该相似度中最大的相似度作为该图像相似度。需要说明的是，可以根据欧式距离公式确定的两个特征组之间的欧氏距离表征两个特征组之间的相似度。在该步骤1022中，首先需要获取一个待标注图像样本与每一个已标注图像样本的相似度，再选出其中与该待标注图像样本最相似的已标注图像样本对应的相似度，作为该已标注图像样本。

步骤1023，通过预设的筛选得分计算公式，根据该图像相似度和该分类难度得分确定上述每个待标注图像样本对应的筛选得分。

示例地，该筛选得分计算公式表示为下列公式(2)：

其中，h表示该待标注图像样本的筛选得分，f表示该待标注图像样本的分类难度得分，d表示该待标注图像样本与该目标人体部位对应的已标注图像样本之间的图像相似度，β为预设的权重参数。分类难度越大的待标注图像样本越需要被标注，而与已标注图像相似度越高的待标注图像样本越不需要被标注，而上述的权重参数用于表征分类难度和图像相似度在决定该筛选得分的过程中所占的比重，可以在对第一子模型进行训练前根据业务场景中的实际需求确定该权重参数。

步骤1024，根据该筛选得分，从该待标注图像样本集中筛选出多个目标图像样本。

其中，该目标图像样本对应的筛选得分大于预设得分。

示例地，基于上述公式(2)，可以理解的是，筛选得分越高的待标注图像样本的标注价值越大，因此，在步骤1024中，可以将预设得分作为筛选依据，将筛选得分大于该预设得分的待标注图像样本作为该目标图像样本。或者，可以依据该筛选得分由高到低的顺序对该待标注图像样本集中的所有待标注图像样本进行排序，再选取其中排序靠前的，例如，前1000个待标注图像样本，作为上述的多个目标图像样本。

图3是根据图1所示实施例示出的一种子模型的重训练方法的流程图，如图3所示，上述步骤104可以包括：

步骤1041，通过该目标图像样本集对该第一子模型进行更新，以获取更新后的第三子模型。

步骤1042，确定该第三子模型是否满足预设的训练终止条件。

示例地，对于第一子模型的重训练过程包括对第一子模型进行一次或多次更新的过程，该更新过程的执行次数由上述的训练终止条件决定。该训练终止条件可以理解为训练完成的条件，当第一子模型经过更新后到达了一定的识别正确率，或者，对第一子模型进行更新所使用的训练样本的数量已经足够多，则可以认为用于对目标人提部位进行图像识别的第一子模型已经训练完成，不需要再继续对第一子模型进行更新。具体地，该步骤1042可以包括：通过该测试集确定该第三子模型的识别准确率；在该识别准确率大于预设准确率的情况下，确定该第三子模型满足第一预设条件；在已输入该第三子模型的该目标图像样本的总数量大于预设数量的情况下，确定该第三子模型满足第二预设条件；在确定该第三子模型满足该第一预设条件和该第二预设条件中的至少一者的情况下，确定该第三子模型满足该训练终止条件。相应地，在确定该第三子模型不满足该第一预设条件和该第二预设条件中的任何一者的情况下，确定该第三子模型不满足该训练终止条件。

步骤1043，在确定该第三子模型不满足该训练终止条件的情况下，将该第三子模型作为该第一子模型，重复执行从上述步骤101至上述步骤104，直至该第三子模型满足训练终止条件。

步骤1044，将满足该训练终止条件的第三子模型作为该第二子模型。

示例地，在第三子模型不满足该训练终止条件的情况下，需要新增更多的训练样本对该第三子模型进行进一步地更新，而新增的训练样本依旧可以为通过上述步骤101至上述步骤103中的样本筛选方式进行筛选而得到目标图像样本。因此，在第三子模型不满足该训练终止条件的情况下，可以将第三子模型作为该第一子模型，再筛选出一批新的目标图像样本，并重复该步骤104中的更新过程，直至更新出满足训练终止条件的的第三子模型作为该第二子模型。需要说明的是，步骤1043的重复执行过程中所需的已标注图像样本集和待标注图像样本集可以与首次执行上述步骤101至上述步骤104所使用的已标注图像样本集和待标注图像样本集相同或不同。

图4是根据图1所示实施例示出的另一种图像识别模型的生成方法的流程图，如图4所示，在上述步骤105之后，上述方法还可以包括：

步骤106，将目标图像作为该目标图像识别模型的输入，以获取该目标图像识别模型输出的该目标图像针对上述每种人体部位的第二概率。

步骤107，确定该目标图像包含的人体部位为对应于最高第二概率的人体部位。

示例地，该目标图像识别模型包含多个针对于不同人体部位进行识别的子模型，而在将当前需要进行识别的目标图像输入该目标图像识别模型后，该目标图像识别模型中的每个子模型都会接收到该目标图像，并对该目标图像进行识别。每个子模型的识别结果为该目标图像中包含子模型对应的人体部位的概率(即为上述的第二概率)，而其中对应于最高第二概率的人体部位即为对该目标图像中包含的人体部位。

步骤108，根据该目标图像包含的人体部位对该目标图像进行分类归档储存。

示例地，在对上述步骤101至107的图像识别模型训练和图像识别的过程可以应用于医院的医学图像归档流程中。具体来说，该目标图像可以为通过医院影像科的X光仪器、CT(Computerized tomography，电脑断层扫描)仪器、NMRI(Nuclear magnetic resonanceimaging，核磁共振成像)仪器等医学成像仪器拍摄出的医学图像。这些医学成像仪器与包含该目标图像识别模型的医学图像管理系统连接，拍摄完成的医学图像可以直接被输入该目标图像识别模型，以通过上述步骤106和107中的图像识别过程确定该医学图像包含的人体部位。在确定该医学图像包含的人体部位后，可以先将拍摄对象(即患者)的人个信息和该医学图像绑定，再根据医学图像包含的人体部位将该医学图像和其对应的个人信息发送至医院的总服务器中进行分类归档储存，或者直接分发至该人体部位对应的科室，实现医学图像归档的自动化，有效减轻影像科医生的操作负担。

图5是根据一示例性实施例示出的一种图像识别模型的生成装置的框图，如图5所示，该装置500包括：

第一概率获取模块510，用于将目标人体部位对应的待标注图像样本集作为预训练后的第一子模型的输入，以获取该第一子模型输出的该待标注图像样本集中每个待标注图像样本对应的第一概率；其中，该第一子模型为通过该目标人体部位对应的图像样本集中的训练集对预设的分类模型进行预训练所获得的图像识别模型，该第一概率用于表征上述每个待标注图像样本中包含该目标人体部位的概率，该目标人体部位为预设的多种人体部位中的任一人体部位；

样本筛选模块520，用于根据上述每个待标注图像样本与该目标人体部位对应的多个已标注图像样本之间的图像相似度，以及该第一概率，从该待标注图像样本集中筛选出多个目标图像样本；

样本集获取模块530，用于输出上述多个目标图像样本集，以获取到每个该目标图像样本对应的目标已标注图像样本，作为目标图像样本集；

模型重训练模块540，用于通过该目标图像样本集和该图像样本集中的测试集对该第一子模型进行重训练，以获取用于识别该目标人体部位的第二子模型；

模型构建模块550，用于通过上述多种人体部位中每种人体部位对应的第二子模型构建目标图像识别模型，该目标图像识别模型用于确定图像中包含的人体部位。

可选的，该样本筛选模块520，用于：

根据该第一概率确定上述每个待标注图像样本对应的分类难度得分，该分类难度得分是根据该第一概率与预设概率的接近程度确定的；

获取该图像相似度；

通过预设的筛选得分计算公式，根据该图像相似度和该分类难度得分确定上述每个待标注图像样本对应的筛选得分；

根据该筛选得分，从该待标注图像样本集中确定多个目标图像样本，该目标图像样本对应的筛选得分大于预设得分；

其中，该筛选得分计算公式表示为：

其中，h表示该待标注图像样本的筛选得分，f表示该待标注图像样本的分类难度得分，d表示该待标注图像样本与该目标人体部位对应的已标注图像样本之间的图像相似度，β为预设的权重参数。

可选的，该样本筛选模块520，用于：

针对上述每个待标注图像样本，通过预设的图像特征提取算法，获取该待标注图像样本对应的第一不变矩特征组，该不变矩特征组包含该待标注图像样本对应的七个不变矩特征；

计算该第一不变矩特征组和每个该已标注图像样本对应的第二不变矩特征组之间的相似度；

将多个该相似度中最大的相似度作为该图像相似度。

可选的，该模型重训练模块540，用于：

通过该目标图像样本集对该第一子模型进行更新，以获取更新后的第三子模型；

确定该第三子模型是否满足预设的训练终止条件；

在确定该第三子模型不满足该训练终止条件的情况下，将该第三子模型作为该第一子模型，重复执行从该将目标人体部位对应的待标注图像样本集作为预训练后的第一子模型的输入，以获取该第一子模型输出的该待标注图像样本集中每个待标注图像样本对应的第一概率至该通过该目标图像样本集和该图像样本集中的测试集对该第一子模型进行重训练的步骤，直至该第三子模型满足该训练终止条件；

将满足该训练终止条件的第三子模型作为该第二子模型。

可选的，该模型重训练模块540，用于：

通过该测试集确定该第三子模型的识别准确率；

在该识别准确率大于预设准确率的情况下，确定该第三子模型满足第一预设条件；

在已输入该第三子模型的该目标图像样本的总数量大于预设数量的情况下，确定该第三子模型满足第二预设条件；

在确定该第三子模型满足该第一预设条件和该第二预设条件中的至少一者的情况下，确定该第三子模型满足该训练终止条件。

图6是根据图5所示实施例示出的另一种图像识别模型的生成装置的框图，如图6所示，该装置500还包括：

第二概率获取模块560，用于将目标图像作为该目标图像识别模型的输入，以获取该目标图像识别模型输出的该目标图像针对上述每种人体部位的第二概率；

部位确定模块570，用于确定该目标图像包含的人体部位为对应于最高第二概率的人体部位；

图像归档模块580，用于根据该目标图像包含的人体部位对该目标图像进行分类归档储存。

关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

图7是根据一示例性实施例示出的一种电子设备700的框图。如图7所示，该电子设备700可以包括：处理器701，存储器702，多媒体组件703，输入/输出(I/O)接口704，以及通信组件705。

其中，处理器701用于控制该电子设备700的整体操作，以完成上述的图像识别模型的生成方法中的全部或部分步骤。存储器702用于存储各种类型的数据以支持在该电子设备700的操作，这些数据例如可以包括用于在该电子设备700上操作的任何应用程序或方法的指令，以及应用程序相关的数据，例如联系人数据、收发的消息、图片、音频、视频等等。该存储器702可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，例如静态随机存取存储器(Static Random Access Memory，简称SRAM)，电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory，简称EEPROM)，可擦除可编程只读存储器(Erasable Programmable Read-Only Memory，简称EPROM)，可编程只读存储器(Programmable Read-Only Memory，简称PROM)，只读存储器(Read-Only Memory，简称ROM)，磁存储器，快闪存储器，磁盘或光盘。多媒体组件703可以包括屏幕和音频组件。其中屏幕例如可以是触摸屏，音频组件用于输出和/或输入音频信号。例如，音频组件可以包括一个麦克风，麦克风用于接收外部音频信号。所接收的音频信号可以被进一步存储在存储器702或通过通信组件705发送。音频组件还包括至少一个扬声器，用于输出音频信号。I/O接口704为处理器701和其他接口模块之间提供接口，上述其他接口模块可以是键盘，鼠标，按钮等。这些按钮可以是虚拟按钮或者实体按钮。通信组件705用于该电子设备700与其他设备之间进行有线或无线通信。无线通信，例如Wi-Fi，蓝牙，近场通信(Near FieldCommunication，简称NFC)，2G、3G或4G，或它们中的一种或几种的组合，因此相应的该通信组件705可以包括：Wi-Fi模块，蓝牙模块，NFC模块。

在一示例性实施例中，电子设备700可以被一个或多个应用专用集成电路(Application Specific Integrated Circuit，简称ASIC)、数字信号处理器(DigitalSignal Processor，简称DSP)、数字信号处理设备(Digital Signal Processing Device，简称DSPD)、可编程逻辑器件(Programmable Logic Device，简称PLD)、现场可编程门阵列(Field Programmable Gate Array，简称FPGA)、控制器、微控制器、微处理器或其他电子元件实现，用于执行上述的图像识别模型的生成方法。

在另一示例性实施例中，还提供了一种包括程序指令的计算机可读存储介质，例如包括程序指令的存储器702，上述程序指令可由电子设备700的处理器701执行以完成上述的图像识别模型的生成方法。

以上结合附图详细描述了本公开的优选实施方式，但是，本公开并不限于上述实施方式中的具体细节，在本公开的技术构思范围内，本领域技术人员在考虑说明书及实践本公开后，容易想到本公开的其它实施方案，均属于本公开的保护范围。

另外需要说明的是，在上述具体实施方式中所描述的各个具体技术特征，在不矛盾的情况下，可以通过任何合适的方式进行组合。同时本公开的各种不同的实施方式之间也可以进行任意组合，只要其不违背本公开的思想，其同样应当视为本公开所公开的内容。本公开并不局限于上面已经描述出的精确结构，本公开的范围仅由所附的权利要求来限制。

Claims

1.一种图像识别模型的生成方法，其特征在于，所述方法包括：

通过所述多种人体部位中每种人体部位对应的第二子模型构建目标图像识别模型，所述目标图像识别模型用于确定图像中包含的人体部位；

所述通过所述目标图像样本集和所述图像样本集中的测试集对所述第一子模型进行重训练，以获取所述目标人体部位对应的第二子模型，包括：

确定所述第三子模型是否满足预设的训练终止条件；

2.根据权利要求1所述的方法，其特征在于，所述根据所述每个待标注图像样本与所述目标人体部位对应的多个已标注图像样本之间的图像相似度，以及所述第一概率，从所述待标注图像样本集中筛选出多个目标图像样本，包括：

获取所述图像相似度；

其中，所述筛选得分计算公式表示为：

3.根据权利要求2所述的方法，其特征在于，所述获取所述图像相似度，包括：

将多个所述相似度中最大的相似度作为所述图像相似度。

4.根据权利要求1所述的方法，其特征在于，所述确定所述第三子模型是否满足预设的训练终止条件，包括：

通过所述测试集确定所述第三子模型的识别准确率；

5.根据权利要求1所述的方法，其特征在于，在所述通过所述多种人体部位中每种人体部位对应的第二子模型构建目标图像识别模型之后，所述方法还包括：

6.一种图像识别模型的生成装置，其特征在于，所述装置包括：

模型重训练模块，用于通过所述目标图像样本集和所述图像样本集中的测试集对所述第一子模型进行重训练，以获取用于识别所述目标人体部位的第二子模型；

模型构建模块，用于通过所述多种人体部位中每种人体部位对应的第二子模型构建目标图像识别模型，所述目标图像识别模型用于确定图像中包含的人体部位；

所述模型重训练模块，用于：

确定所述第三子模型是否满足预设的训练终止条件；

7.根据权利要求6所述的装置，其特征在于，所述样本筛选模块，用于：

获取所述图像相似度；

其中，所述筛选得分计算公式表示为：

8.根据权利要求7所述的装置，其特征在于，所述样本筛选模块，用于：

将多个所述相似度中最大的相似度作为所述图像相似度。

9.根据权利要求6所述的装置，其特征在于，所述模型重训练模块，用于：

通过所述测试集确定所述第三子模型的识别准确率；

10.根据权利要求6所述的装置，其特征在于，所述装置还包括：

11.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1-5中任一项所述方法的步骤。

12.一种电子设备，其特征在于，包括：

存储器，其上存储有计算机程序；

处理器，用于执行所述存储器中的所述计算机程序，以实现权利要求1-5中任一项所述方法的步骤。