CN111931865A - 图像分类模型的训练方法、装置、计算机设备及存储介质 - Google Patents

图像分类模型的训练方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN111931865A
CN111931865A CN202010979940.5A CN202010979940A CN111931865A CN 111931865 A CN111931865 A CN 111931865A CN 202010979940 A CN202010979940 A CN 202010979940A CN 111931865 A CN111931865 A CN 111931865A
Authority
CN
China
Prior art keywords
image
parameter
sample image
classification model
objective function
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010979940.5A
Other languages
English (en)
Other versions
CN111931865B (zh
Inventor
曾昱为
王健宗
瞿晓阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN202010979940.5A priority Critical patent/CN111931865B/zh
Priority to PCT/CN2020/124324 priority patent/WO2021164306A1/zh
Publication of CN111931865A publication Critical patent/CN111931865A/zh
Application granted granted Critical
Publication of CN111931865B publication Critical patent/CN111931865B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0012Biomedical image inspection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biomedical Technology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Evolutionary Biology (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Quality & Reliability (AREA)
  • Radiology & Medical Imaging (AREA)
  • Databases & Information Systems (AREA)
  • Pathology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种图像分类模型的训练方法,应用于人工智能技术领域,用于解决现有技术无法用较少带标注的样本训练出高精度的图像分类模型的技术问题。本发明提供的方法包括:获取被标注的样本图像和未被标注的样本图像;计算未被标注的样本图像与分类层输出的其中一类图像原型之间的相似熵值;根据第一目标函数和第二目标函数确定目标损失函数;根据计算的相似熵值的大小,对于被标注的样本图像和未被标注的样本图像分别选用第一目标函数和第二目标函数交替对特征提取层的第一参数和分类层的第二参数进行训练,直至该目标损失函数的梯度小于预设值时,将该第一参数的取值作为该特征提取层的目标参数,将该第二参数的取值作为该分类层的目标参数。

Description

图像分类模型的训练方法、装置、计算机设备及存储介质
技术领域
本发明涉及人工智能技术领域,尤其涉及一种图像分类模型的训练方法、装置、计算机设备及存储介质。
背景技术
随着医学成像技术和计算机技术的不断发展和进步,医学图像分析已成为医学研究、临床疾病诊断和治疗中一个不可或缺的工具和技术手段。近几年来,深度学习,特别是深度卷积神经网络已经迅速发展成为医学图像分析的研究热点,它能够从医学图像大数据中自动特区隐含的疾病诊断特征。医学图像分类可以分为图像筛查和目标或病灶分类。图像筛查是深度学习在医学图像分析领域中的最早应用之一,目标或病灶的分类可以辅助医生对疾病进行诊断,例如分析肺部CT(Computed Tomography,电子计算机断层扫描)图像是否患某种疾病或严重程度分级。
图像分类技术在自然图像领域已经获得了很好的成就,在10分类任务中准确率可以轻松达到94%。然而,达到这种效果的需要大量的标注样本才能发挥作用。由其在医学图像领域,获取标注数据的成本非常大,成像设备获取图像之后,需要专业的医生花费大量的时间对图像进行标注才能获取用于深度学习的样本。
在数据量少的情况下,现有的方法有两种解决方案:
一是数据增强,通过旋转,平移,变形等变化,产生更多的图像。由于产生图像还是由原始图像演变而来,产生的图像与原始图像没有太多实质性的区别导致其并没有起到太多增大有效样本数据的效果。
二是使用迁移学习,其思想是通过在另一种大规模的数据集上面训练,得到的网络参数作为初始值,再在目标数据集上训练对参数进行调优。然而,如果训练出的特征对某个训练数据集或者识别任务具有特异性,用它做迁移学习就未必有好的效果。
发明内容
本发明实施例提供一种图像分类模型的训练方法、装置、计算机设备及存储介质,以解决现有技术无法用较少带标注的样本训练出高精度的图像分类模型的技术问题。
一种图像分类模型的训练方法,该方法包括:
获取被标注的样本数据集中被标注的样本图像,获取未被标注的样本数据集中未被标注的样本图像;
计算该未被标注的样本图像与图像分类模型的分类层输出的其中一类图像原型之间的相似熵值;
获取第一目标函数和第二目标函数,并根据该第一目标函数和该第二目标函数确定目标损失函数;
当计算的该相似熵值大于预设值时,对于被标注的样本图像选用第一目标函数对图像分类模型的特征提取层的第一参数进行训练,对于未被标注的样本图像选用第二目标函数对该图像分类模型的特征提取层的第一参数进行训练;
当计算的该相似熵值小于预设值时,对于被标注的样本图像选用第一目标函数对该图像分类模型的分类层的第二参数进行训练,对于未被标注的样本图像选用第二目标函数对该图像分类模型的分类层的第二参数进行训练;
交替对该第一参数和该第二参数进行训练,直至该目标损失函数的梯度小于预设值时,将该第一参数的取值作为该特征提取层的目标参数,将该第二参数的取值作为该分类层的目标参数。
一种图像分类模型的训练装置,该装置包括:
样本图像获取模块,用于获取被标注的样本数据集中被标注的样本图像,获取未被标注的样本数据集中未被标注的样本图像;
相似熵值计算模块,用于计算该未被标注的样本图像与图像分类模型的分类层输出的其中一类图像原型之间的相似熵值;
函数获取模块,用于获取第一目标函数和第二目标函数,并根据该第一目标函数和该第二目标函数确定目标损失函数;
第一训练模块,用于当计算的该相似熵值大于预设值时,对于被标注的样本图像选用第一目标函数对图像分类模型的特征提取层的第一参数进行训练,对于未被标注的样本图像选用第二目标函数对该图像分类模型的特征提取层的第一参数进行训练;
第二训练模块,用于当计算的该相似熵值小于预设值时,对于被标注的样本图像选用第一目标函数对该图像分类模型的分类层的第二参数进行训练,对于未被标注的样本图像选用第二目标函数对该图像分类模型的分类层的第二参数进行训练;
目标参数获取模块,用于交替对该第一参数和该第二参数进行训练,直至该目标损失函数的梯度小于预设值时,将该第一参数的取值作为该特征提取层的目标参数,将该第二参数的取值作为该分类层的目标参数。
一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述图像分类模型的训练方法的步骤。
一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述图像分类模型的训练方法的步骤。
本发明提出的图像分类模型的训练方法、装置、计算机设备及存储介质,通过计算该未被标注的样本图像与图像分类模型的分类层输出的其中一类图像原型之间的相似熵值,并在计算的该相似熵值大于预设值时,对于被标注的样本图像选用第一目标函数对图像分类模型的特征提取层的第一参数进行训练,对于未被标注的样本图像选用第二目标函数对该图像分类模型的特征提取层的第一参数进行训练,在计算的该相似熵值小于预设值时,对于被标注的样本图像选用第一目标函数对该图像分类模型的分类层的第二参数进行训练,对于未被标注的样本图像选用第二目标函数对该图像分类模型的分类层的第二参数进行训练,交替对该第一参数和该第二参数进行训练,直至该目标损失函数的梯度小于预设值时,将该第一参数的取值作为该特征提取层的目标参数,将该第二参数的取值作为该分类层的目标参数,在相似熵值大于和小于预设值时,分别采用不同的目标函数对特征提取层和分类层进行训练,这种对抗性的训练学习使得训练出的分类层的分类结果更靠近标准图像原型,使得训练图像分类模型的过程中,在依据较少标注样本的前提下,同时结合了未标注的目标样本图像,提高了有效训练样本的数量,同时使得训练出的图像分类模型具有更好的分类效果。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一实施例中图像分类模型的训练方法的一应用环境示意图;
图2是本发明一实施例中图像分类模型的训练方法的一流程图;
图3是本发明一实施例中网络结构与目标损失函数之间的关系;
图4是本发明一实施例中图像分类模型的训练方法的一局部流程图;
图5是本发明实施例图2中步骤S102的进一步流程图;
图6是本发明一实施例中图像分类模型的训练装置的结构示意图;
图7是本发明一实施例中计算机设备的一示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本申请提供的图像分类模型的训练方法,可应用在如图1所示的应用环境中。其中,该计算机设备包括但不限于各种个人计算机、笔记本电脑、智能手机、平板电脑等。
在一实施例中,如图2所示,提供一种图像分类模型的训练方法,以该方法应用在图1中的计算机设备为例进行说明,包括如下步骤S101至S106。
S101、获取被标注的样本数据集中被标注的样本图像,获取未被标注的样本数据集中未被标注的样本图像。
其中,该被标注的样本数据集包括被标注的公开数据和少量被标注的目标数据,该少量被标注的目标数据例如人体肺部CT图像中被医生确定标记为某种疾病原型的图片,该被标注的公开数据例如被医生标记有相关疾病原型的人体肺部CT图像;该未被标注的样本数据集中包含有若干未标注的目标图像,例如确定为某一类疾病原型但是未标注的CT图像。
进一步地,图4是本发明一实施例中图像分类模型的训练方法的一局部流程图,在该步骤S101的步骤之后,在以下步骤S102的步骤之前,该图像分类模型的训练方法还包括以下步骤S301和S302。
对该被标注的样本图像的灰度值进行非线性操作,使得该被标注的样本图像的输出灰度值与原始灰度值呈指数关系;
对该未被标注的样本图像的灰度值进行非线性操作,使得该未被标注的样本图像的输出灰度值与原始灰度值呈指数关系。
其中,对该被标注的样本图像的灰度值和该未被标注的样本图像的灰度值分别进行非线性操作即对图像进行Gamma变换,Gamma变换是对输入图像灰度值进行的非线性操作,使输出图像灰度值与输入图像灰度值呈指数关系:
Figure 990370DEST_PATH_IMAGE001
,这个指数即为Gamma
Figure 891330DEST_PATH_IMAGE002
Figure 188450DEST_PATH_IMAGE003
的取值范围为0~1,因此需要先进行归一化,然后取指数。
Gamma变换提升了图像的暗部细节,简单来说就是通过非线性变换,让图像从暴光强度的线性响应变得更接近人眼感受的响应,即将漂白或过暗的图片,进行矫正。
S102、计算该未被标注的样本图像与图像分类模型的分类层输出的其中一类图像原型之间的相似熵值。
分类层模块是添加一个
Figure 516663DEST_PATH_IMAGE004
线性分类层和一个随机初始化的权重矩阵W,最后一个线性层的权重向量,表示为
Figure 391078DEST_PATH_IMAGE005
其中n为总类别数,将W中的每个向量视为每类原型,如
Figure 971095DEST_PATH_IMAGE006
作为第一类疾病原型,
Figure 512935DEST_PATH_IMAGE007
作为第二类疾病原型,
Figure 887416DEST_PATH_IMAGE008
作为第 n 类病灶原型,原型指每类的代表。接着将特征提取层的输出结果送进分类层softmax,可以得到每个样本被分到每一类的概率值。根据公开数据集和目标域数集是否被标注,设计不同的目标函数。
进一步地,该步骤S102进一步包括:
通过该特征提取层对该未被标注的样本图像的第二特征进行提取;
将该第二特征输入至该分类层,得到该样本图像被预测为第k类图像原型的概率;
将该概率带入该第二目标函数,通过该第二目标函数计算该未被标注的样本图像与分类层输出的相似熵值。
作为可选地,所述第二目标函数H2为:
Figure 514706DEST_PATH_IMAGE009
其中,n表示所述图像原型的总类数,
Figure 367255DEST_PATH_IMAGE010
表示样本图像x被预测为第k类图像原型的概率,E表示训练的数据批大小batch size的平均值。
图5是本发明实施例图2中步骤S102的进一步流程图,进一步地,如图5所示,计算该未被标注的样本图像与图像分类模型的分类层输出的其中一类图像原型之间的相似熵值的步骤包括以下步骤S401至S403:
S401、通过该特征提取层对该未被标注的样本图像的第二特征进行提取;
S402、将该第二特征输入至该分类层,得到该样本图像被预测为第k类图像原型的概率;
S403、将该概率带入该第二目标函数,通过该第二目标函数计算该未被标注的样本图像与分类层输出的相似熵值。
S103、获取第一目标函数和第二目标函数,并根据该第一目标函数和该第二目标函数确定目标损失函数。
其中,该步骤S103进一步包括:
通过以下公式计算所述目标损失函数
Figure 763602DEST_PATH_IMAGE011
其中,所述H表示所述目标损失函数,H1表示所述第一目标函数,H2表示所述第二目标函数,当所述相似熵值大于0时所述H2的符号为正,当所述相似熵值小于0时所述H2的符号为负。
对于被标注的公开数据和少量被标注的目标数据,使用最大相关熵作为目标函数来训练特征提取层和分类层。其中,该相关熵值用于量化两个随机变量 A 和 B 之间的相似性,变量 A 和 B 的相关熵如公式(1)所示:
Figure 168038DEST_PATH_IMAGE012
作为可选地,将该相关熵的公式应用于有标签数据的训练中,对于被标注的数据,得到其第一目标函数H1为:
Figure 157991DEST_PATH_IMAGE013
其中,
Figure 673286DEST_PATH_IMAGE014
表示所述被标注的样本图像x被预测为第i类图像原型的预测结果,
Figure 344045DEST_PATH_IMAGE015
表示预先设置的值,
Figure 263591DEST_PATH_IMAGE016
表示图像x为第i类图像原型的真实值,n表示所述图像原型的总类数。
其中,该
Figure 6419DEST_PATH_IMAGE017
可以通过以下公式(2)得到:
Figure 325405DEST_PATH_IMAGE018
其中,
Figure 696343DEST_PATH_IMAGE019
为特征提取层提取的特征,W代表权重向量。
进一步地,获取该被标注的样本图像x被预测为第i类图像原型的预测结果的步骤包括:
通过该图像分类模型的特征提取层对该被标注的样本图像的第一特征进行提取;
将提取的该第一特征输入至该分类层进行分类,得到该被标注的样本图像被预测为第i类图像原型的预测结果。
S104、当计算的该相似熵值大于预设值时,对于被标注的样本图像选用第一目标函数对图像分类模型的特征提取层的第一参数进行训练,对于未被标注的样本图像选用第二目标函数对该图像分类模型的特征提取层的第一参数进行训练。
作为可选地,该预设值为0。网络结构与第一目标损失函数H1之间的关系如图3所示。其中,数据间自适应融合方法模型中的特征提取层,用于对 Resnet50网络进行迁移学习、微调网络结构和参数,自动学习提取隐含的多层次的疾病分类特征。作为可选地,移除ResNet50网络的最后一个线性层来构建该特征提取层,该网络引入跳连接,使得梯度的反向传播更加容易,让更深的网络得以有效训练。
使用第一目标损失函数H1可以确保特征提取层提取区别性特征。然而,该模型只是在公开数据和一小部分目标数据上进行分类训练的,这并不能学习整个目标数据的区别性特征。因此,对未标注的目标实例需要根据第二目标函数进行以及最大化条件熵对特征提取层的第一参数进行训练。
S105、当计算的该相似熵值小于预设值时,对于被标注的样本图像选用第一目标函数对该图像分类模型的分类层的第二参数进行训练,对于未被标注的样本图像选用第二目标函数对该图像分类模型的分类层的第二参数进行训练。
作为可选地,该预设值为0。
与上述步骤S104相对应地,当该相似熵值小于预设值时,对于被标注的样本图像选用第一目标函数对该图像分类模型的分类层的第二参数进行训练,未标注的目标实例需要根据第二目标函数进行以及最小化条件熵对分类层进行训练。
其中,网络结构与第二目标损失函数H2之间的关系如图3所示。图3中
Figure 580598DEST_PATH_IMAGE020
表示待训练的参数。
S106、交替对该第一参数和该第二参数进行训练,直至该目标损失函数的梯度小于预设值时,将该第一参数的取值作为该特征提取层的目标参数,将该第二参数的取值作为该分类层的目标参数。
通过最大化条件熵(即相似熵值大于某一预设值时)来训练分类器,最小化条件熵(即相似熵值小于某一预设值时)来训练特征提取器,一方面可以最大程度地减少类原型和未标注目标数据之间的距离,从而提取具有区别性的特征,提高有效训练样本数量。
另一方面,通过根据相似熵值的大小实现对特征提取层和分类层的交替式对抗训练,假设每个类都存在一个域不变的原型,它作为两个域的一个代表点。最后一个线性层权重向量的
Figure 138619DEST_PATH_IMAGE021
作为第i类疾病原型,则每一类疾病都对应一疾病原型。由于标注的数据中,公开数据居多,目标数据可能只有几个,因此估计的疾病原型靠近公开数据的分布,通过上述步骤S104、S105和S106可以实现移动目标数据中的未标注数据的特征,以使得训练出的图像分类模型更靠近
Figure 402241DEST_PATH_IMAGE021
这个图像原型位置。
本实施例利用被标注的样本数据集和未被标注的样本数据集进行半监督训练,使得未被标注的样本图像实现数据间自适应融合。基于迁移学习的思想,微调在 ImageNet数据集上训练的Resnet50深度卷积神经网络,提取肺部CT图像的特征,经过Softmax分类层得到预测概率。根据数据是否被标注,设计不同的目标函数。对于标注过的数据,使用第一目标函数作为损失函数对图像分类模型的特征提取层和分类层进行训练;对于没有标注的数据,使用最大最小化条件熵的方法,使用第二目标函数作为损失函数对图像分类模型的特征提取层和分类层进行训练,交替训练分类器的条件熵最大,并使特征提取器的条件熵最小,最终实现对无标注数据的高精度分类。
由于小样本学习分类发展迅速,面对繁多的分类任务,都可以通过训练一个模型来达到任务要求。元学习的机制是任务的通用性,即面对不同的任务,不需要构建不同的模型,用同样的一套学习算法即可解决多种不同的任务。定义一个模型的可学习参数
Figure 362107DEST_PATH_IMAGE020
,面对不同的任务,可以通过改变参数θ的值来解决相应的任务。而参数
Figure 544826DEST_PATH_IMAGE020
的值可以通过元学习器去学习,在面对不同任务的时候,根据损失函数通过梯度下降的方法不断地更新
Figure 190744DEST_PATH_IMAGE020
值,使这个模型不断向能解决这个任务的模型靠近,当
Figure 382691DEST_PATH_IMAGE020
值最终收敛时,认为元学习器学习到了一个较好的参数
Figure 338008DEST_PATH_IMAGE020
,让模型自适应地解决相应任务。本实施例同时建立了不同肺部CT图像样本数据集之间的跨域迁移方法。该方法通过对有标签公开数据与无标签临床数据进行跨域迁移,辅之以极少量带标签临床采集数据,实现了大量无标签临床数据的高精度识别,具有较高的灵敏度与特异度,且域自适应模型具有较好的泛化能力。
本实施例提出的图像分类模型的训练方法通过计算该未被标注的样本图像与图像分类模型的分类层输出的其中一类图像原型之间的相似熵值,并在计算的该相似熵值大于预设值时,对于被标注的样本图像选用第一目标函数对图像分类模型的特征提取层的第一参数进行训练,对于未被标注的样本图像选用第二目标函数对该图像分类模型的特征提取层的第一参数进行训练,在计算的该相似熵值小于预设值时,对于被标注的样本图像选用第一目标函数对该图像分类模型的分类层的第二参数进行训练,对于未被标注的样本图像选用第二目标函数对该图像分类模型的分类层的第二参数进行训练,交替对该第一参数和该第二参数进行训练,直至该目标损失函数的梯度小于预设值时,将该第一参数的取值作为该特征提取层的目标参数,将该第二参数的取值作为该分类层的目标参数,在相似熵值大于和小于预设值时,分别采用不同的目标函数对特征提取层和分类层进行训练,这种对抗性的训练学习使得训练出的分类层的分类结果更靠近标准图像原型,使得训练图像分类模型的过程中,在依据较少标注样本的前提下,同时结合了未标注的目标样本图像,提高了有效训练样本的数量,同时使得训练出的图像分类模型具有更好的分类效果。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
在一实施例中,提供一种图像分类模型的训练装置,该图像分类模型的训练装置与上述实施例中图像分类模型的训练方法一一对应。如图6所示,该图像分类模型的训练装置100包括样本图像获取模块11、相似熵值计算模块12、函数获取模块13、第一训练模块14、第二训练模块15和目标参数获取模块16。各功能模块详细说明如下:
样本图像获取模块11,用于获取被标注的样本数据集中被标注的样本图像,获取未被标注的样本数据集中未被标注的样本图像。
相似熵值计算模块12,用于计算该未被标注的样本图像与图像分类模型的分类层输出的其中一类图像原型之间的相似熵值。
其中,该相似熵值计算模块12进一步包括:
第二特征提取单元,用于通过该特征提取层对该未被标注的样本图像的第二特征进行提取;
概率预测单元,用于将该第二特征输入至该分类层,得到该样本图像被预测为第k类图像原型的概率;
熵值输出单元,用于将该概率带入该第二目标函数,通过该第二目标函数计算该未被标注的样本图像与分类层输出的相似熵值。
函数获取模块13,用于获取第一目标函数和第二目标函数,并根据该第一目标函数和该第二目标函数确定目标损失函数。
其中,所述第一目标函数为:
Figure 957209DEST_PATH_IMAGE013
其中,
Figure 506133DEST_PATH_IMAGE014
表示所述被标注的样本图像x被预测为第i类图像原型的预测结果,
Figure 236191DEST_PATH_IMAGE020
表示预先设置的值,
Figure 246348DEST_PATH_IMAGE016
表示图像x为第i类图像原型的真实值,n表示所述图像原型的总类数。
进一步地,该第二目标函数为:
Figure 911816DEST_PATH_IMAGE009
其中,n表示所述图像原型的总类数,
Figure 210686DEST_PATH_IMAGE010
表示样本图像x被预测为第k类图像原型的概率,E表示训练的数据批大小batch size的平均值。
进一步地,该函数获取模块13具体包括:
第一特征提取单元,用于通过该图像分类模型的特征提取层对该被标注的样本图像的第一特征进行提取;
结果预测单元,用于将提取的该第一特征输入至该分类层进行分类,得到该被标注的样本图像被预测为第i类图像原型的预测结果。
第一训练模块14,用于当计算的该相似熵值大于预设值时,对于被标注的样本图像选用第一目标函数对图像分类模型的特征提取层的第一参数进行训练,对于未被标注的样本图像选用第二目标函数对该图像分类模型的特征提取层的第一参数进行训练。
第二训练模块15,用于当计算的该相似熵值小于预设值时,对于被标注的样本图像选用第一目标函数对该图像分类模型的分类层的第二参数进行训练,对于未被标注的样本图像选用第二目标函数对该图像分类模型的分类层的第二参数进行训练。
目标参数获取模块16,用于交替对该第一参数和该第二参数进行训练,直至该目标损失函数的梯度小于预设值时,将该第一参数的取值作为该特征提取层的目标参数,将该第二参数的取值作为该分类层的目标参数。
在其中一个实施例中,函数获取模块13具体用于通过以下公式计算所述目标损失函数
Figure 885381DEST_PATH_IMAGE011
其中,所述H表示所述目标损失函数,H1表示所述第一目标函数,H2表示所述第二目标函数,当所述相似熵值大于0时所述H2的符号为正,当所述相似熵值小于0时所述H2的符号为负。
作为可选地,该图像分类模型的训练装置100还包括:
第一操作单元,用于对该被标注的样本图像的灰度值进行非线性操作,使得该被标注的样本图像的输出灰度值与原始灰度值呈指数关系;
第二操作单元,用于对该未被标注的样本图像的灰度值进行非线性操作,使得该未被标注的样本图像的输出灰度值与原始灰度值呈指数关系。
其中上述模块/单元中的“第一”和“第二”的意义仅在于将不同的模块/单元加以区分,并不用于限定哪个模块/单元的优先级更高或者其它的限定意义。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或模块的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或模块,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或模块,本申请中所出现的模块的划分,仅仅是一种逻辑上的划分,实际应用中实现时可以有另外的划分方式。
关于图像分类模型的训练装置的具体限定可以参见上文中对于图像分类模型的训练方法的限定,在此不再赘述。上述图像分类模型的训练装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图7所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部服务器通过网络连接通信。该计算机程序被处理器执行时以实现一种图像分类模型的训练方法。
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述实施例中图像分类模型的训练方法的步骤,例如图2所示的步骤101至步骤106及该方法的其它扩展和相关步骤的延伸。或者,处理器执行计算机程序时实现上述实施例中图像分类模型的训练装置的各模块/单元的功能,例如图6所示模块11至模块16的功能。为避免重复,这里不再赘述。
所述处理器可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器 (Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列 (Field-Programmable Gate Array,FPGA) 或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器是所述计算机装置的控制中心,利用各种接口和线路连接整个计算机装置的各个部分。
所述存储器可用于存储所述计算机程序和/或模块,所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现所述计算机装置的各种功能。所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、视频数据等)等。
所述存储器可以集成在所述处理器中,也可以与所述处理器分开设置。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述实施例中图像分类模型的训练方法的步骤,例如图2所示的步骤101至步骤106及该方法的其它扩展和相关步骤的延伸。或者,计算机程序被处理器执行时实现上述实施例中图像分类模型的训练装置的各模块/单元的功能,例如图7所示模块11至模块16的功能。为避免重复,这里不再赘述。
本实施例提出的图像分类模型的训练方法、装置、计算机设备及存储介质,通过计算该未被标注的样本图像与分类层输出的其中一类图像原型之间的相似熵值,并在计算的该相似熵值大于预设值时,对于被标注的样本图像选用第一目标函数对图像分类模型的特征提取层的第一参数进行训练,对于未被标注的样本图像选用第二目标函数对该图像分类模型的特征提取层的第一参数进行训练,在计算的该相似熵值小于预设值时,对于被标注的样本图像选用第一目标函数对该图像分类模型的分类层的第二参数进行训练,对于未被标注的样本图像选用第二目标函数对该图像分类模型的分类层的第二参数进行训练,交替对该第一参数和该第二参数进行训练,直至该目标损失函数的梯度小于预设值时,将该第一参数的取值作为该特征提取层的目标参数,将该第二参数的取值作为该分类层的目标参数,在相似熵值大于和小于预设值时,分别采用不同的目标函数对特征提取层和分类层进行训练,这种对抗性的训练学习使得训练出的分类层的分类结果更靠近标准图像原型,使得训练图像分类模型的过程中,在依据较少标注样本的前提下,同时结合了未标注的目标样本图像,提高了有效训练样本的数量,同时使得训练出的图像分类模型具有更好的分类效果。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink) DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

Claims (10)

1.一种图像分类模型的训练方法,其特征在于,所述方法包括:
获取被标注的样本数据集中被标注的样本图像,获取未被标注的样本数据集中未被标注的样本图像;
计算所述未被标注的样本图像与图像分类模型的分类层输出的其中一类图像原型之间的相似熵值;
获取第一目标函数和第二目标函数,并根据所述第一目标函数和所述第二目标函数确定目标损失函数;
当计算的所述相似熵值大于预设值时,对于被标注的样本图像选用第一目标函数对所述图像分类模型的特征提取层的第一参数进行训练,对于未被标注的样本图像选用第二目标函数对所述图像分类模型的特征提取层的第一参数进行训练;
当计算的所述相似熵值小于预设值时,对于被标注的样本图像选用第一目标函数对所述图像分类模型的分类层的第二参数进行训练,对于未被标注的样本图像选用第二目标函数对所述图像分类模型的分类层的第二参数进行训练;
交替对所述第一参数和所述第二参数进行训练,直至所述目标损失函数的梯度小于预设值时,将所述第一参数的取值作为所述特征提取层的目标参数,将所述第二参数的取值作为所述分类层的目标参数。
2.根据权利要求1所述的图像分类模型的训练方法,其特征在于,所述获取第一目标函数和第二目标函数,并根据所述第一目标函数和所述第二目标函数确定目标损失函数的步骤包括:
通过以下公式计算所述目标损失函数
Figure 324246DEST_PATH_IMAGE001
其中,所述H表示所述目标损失函数,H1表示所述第一目标函数,H2表示所述第二目标函数,当所述相似熵值大于0时所述H2的符号为正,当所述相似熵值小于0时所述H2的符号为负。
3.根据权利要求2所述的图像分类模型的训练方法,其特征在于,所述第一目标函数为:
Figure 699208DEST_PATH_IMAGE002
其中,
Figure 503216DEST_PATH_IMAGE003
表示所述被标注的样本图像x被预测为第i类图像原型的预测结果,
Figure 700980DEST_PATH_IMAGE004
表示预先设置的值,
Figure 983056DEST_PATH_IMAGE005
表示图像x为第i类图像原型的真实值,n表示所述图像原型的总类数。
4.根据权利要求3所述的图像分类模型的训练方法,其特征在于,获取所述被标注的样本图像x被预测为第i类图像原型的预测结果的步骤包括:
通过所述图像分类模型的特征提取层对所述被标注的样本图像的第一特征进行提取;
将提取的所述第一特征输入至所述分类层进行分类,得到所述被标注的样本图像被预测为第i类图像原型的预测结果。
5.根据权利要求2所述的图像分类模型的训练方法,其特征在于,所述第二目标函数为:
Figure 949875DEST_PATH_IMAGE006
其中,n表示所述图像原型的总类数,
Figure 924785DEST_PATH_IMAGE007
表示样本图像x被预测为第k类图像原型的概率。
6.根据权利要求5所述的图像分类模型的训练方法,其特征在于,所述计算所述未被标注的样本图像与图像分类模型的分类层输出的其中一类图像原型之间的相似熵值的步骤包括:
通过所述特征提取层对所述未被标注的样本图像的第二特征进行提取;
将所述第二特征输入至所述分类层,得到所述样本图像被预测为第k类图像原型的概率;
将所述概率带入所述第二目标函数,通过所述第二目标函数计算所述未被标注的样本图像与分类层输出的相似熵值。
7.根据权利要求1所述的图像分类模型的训练方法,其特征在于,在所述计算所述未被标注的样本图像与分类层输出的图像原型之间的相似熵值的步骤之前,所述方法还包括:
对所述被标注的样本图像的灰度值进行非线性操作,使得所述被标注的样本图像的输出灰度值与原始灰度值呈指数关系;
对所述未被标注的样本图像的灰度值进行非线性操作,使得所述未被标注的样本图像的输出灰度值与原始灰度值呈指数关系。
8.一种图像分类模型的训练装置,其特征在于,所述装置包括:
样本图像获取模块,用于获取被标注的样本数据集中被标注的样本图像,获取未被标注的样本数据集中未被标注的样本图像;
相似熵值计算模块,用于计算所述未被标注的样本图像与图像分类模型的分类层输出的其中一类图像原型之间的相似熵值;
函数获取模块,用于获取第一目标函数和第二目标函数,并根据所述第一目标函数和所述第二目标函数确定目标损失函数;
第一训练模块,用于当计算的所述相似熵值大于预设值时,对于被标注的样本图像选用第一目标函数对所述图像分类模型的特征提取层的第一参数进行训练,对于未被标注的样本图像选用第二目标函数对所述图像分类模型的特征提取层的第一参数进行训练;
第二训练模块,用于当计算的所述相似熵值小于预设值时,对于被标注的样本图像选用第一目标函数对所述图像分类模型的分类层的第二参数进行训练,对于未被标注的样本图像选用第二目标函数对所述图像分类模型的分类层的第二参数进行训练;
目标参数获取模块,用于交替对所述第一参数和所述第二参数进行训练,直至所述目标损失函数的梯度小于预设值时,将所述第一参数的取值作为所述特征提取层的目标参数,将所述第二参数的取值作为所述分类层的目标参数。
9.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7中任一项所述图像分类模型的训练方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述图像分类模型的训练方法的步骤。
CN202010979940.5A 2020-09-17 2020-09-17 图像分类模型的训练方法、装置、计算机设备及存储介质 Active CN111931865B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202010979940.5A CN111931865B (zh) 2020-09-17 2020-09-17 图像分类模型的训练方法、装置、计算机设备及存储介质
PCT/CN2020/124324 WO2021164306A1 (zh) 2020-09-17 2020-10-28 图像分类模型的训练方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010979940.5A CN111931865B (zh) 2020-09-17 2020-09-17 图像分类模型的训练方法、装置、计算机设备及存储介质

Publications (2)

Publication Number Publication Date
CN111931865A true CN111931865A (zh) 2020-11-13
CN111931865B CN111931865B (zh) 2021-01-26

Family

ID=73335325

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010979940.5A Active CN111931865B (zh) 2020-09-17 2020-09-17 图像分类模型的训练方法、装置、计算机设备及存储介质

Country Status (2)

Country Link
CN (1) CN111931865B (zh)
WO (1) WO2021164306A1 (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112215212A (zh) * 2020-12-02 2021-01-12 腾讯科技(深圳)有限公司 一种图像识别方法、装置、计算机设备及存储介质
CN112434754A (zh) * 2020-12-14 2021-03-02 前线智能科技(南京)有限公司 一种基于图神经网络的跨模态医学影像域适应分类方法
CN112784879A (zh) * 2020-12-31 2021-05-11 前线智能科技(南京)有限公司 一种基于小样本域自适应的医学影像分割或分类方法
CN113159202A (zh) * 2021-04-28 2021-07-23 平安科技(深圳)有限公司 图像分类方法、装置、电子设备及存储介质
CN113361543A (zh) * 2021-06-09 2021-09-07 北京工业大学 Ct图像特征提取方法、装置、电子设备和存储介质
CN113537151A (zh) * 2021-08-12 2021-10-22 北京达佳互联信息技术有限公司 图像处理模型的训练方法及装置、图像处理方法及装置
CN113673599A (zh) * 2021-08-20 2021-11-19 大连海事大学 一种基于校正原型学习的高光谱影像分类方法
CN115482436A (zh) * 2022-09-21 2022-12-16 北京百度网讯科技有限公司 图像筛选模型的训练方法、装置以及图像筛选方法

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113762393B (zh) * 2021-09-08 2024-04-30 杭州网易智企科技有限公司 模型训练方法、注视点检测方法、介质、装置和计算设备
CN113869376A (zh) * 2021-09-09 2021-12-31 深延科技(北京)有限公司 图像处理模型的训练方法、装置、电子设备及存储介质
CN114078197A (zh) * 2021-11-05 2022-02-22 清华大学深圳国际研究生院 一种基于支撑样本特征增强的小样本目标检测方法及装置
CN114612726A (zh) * 2022-03-22 2022-06-10 南京工业大学 一种基于字典学习的零样本图像分类方法
CN114693995B (zh) * 2022-04-14 2023-07-07 北京百度网讯科技有限公司 应用于图像处理的模型训练方法、图像处理方法和设备
CN114821203B (zh) * 2022-06-29 2022-09-27 中国科学院自动化研究所 基于一致性损失的细粒度图像模型训练及识别方法和装置
CN116663648B (zh) * 2023-04-23 2024-04-02 北京大学 模型训练方法、装置、设备及存储介质
CN116665135B (zh) * 2023-07-28 2023-10-20 中国华能集团清洁能源技术研究院有限公司 储能站电池组的热失控风险预警方法、装置和电子设备
CN117036869B (zh) * 2023-10-08 2024-01-09 之江实验室 一种基于多样性和随机策略的模型训练方法及装置
CN118470470A (zh) * 2024-07-12 2024-08-09 中国科学技术大学 小样本图像分布估计方法、装置及存储介质

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106250931A (zh) * 2016-08-03 2016-12-21 武汉大学 一种基于随机卷积神经网络的高分辨率图像场景分类方法
CN106971200A (zh) * 2017-03-13 2017-07-21 天津大学 一种基于自适应迁移学习的图像记忆度预测方法
CN107239802A (zh) * 2017-06-28 2017-10-10 广东工业大学 一种图像分类方法及装置
EP3276540A2 (en) * 2016-07-28 2018-01-31 Samsung Electronics Co., Ltd. Neural network method and apparatus
CN108460758A (zh) * 2018-02-09 2018-08-28 河南工业大学 肺结节检测模型的构建方法
CN108805160A (zh) * 2018-04-17 2018-11-13 平安科技(深圳)有限公司 迁移学习方法、装置、计算机设备和存储介质
CN110689086A (zh) * 2019-10-08 2020-01-14 郑州轻工业学院 基于生成式对抗网络的半监督高分遥感图像场景分类方法
CN110889332A (zh) * 2019-10-30 2020-03-17 中国科学院自动化研究所南京人工智能芯片创新研究院 一种基于面试中微表情的说谎检测方法
US20200097709A1 (en) * 2017-12-12 2020-03-26 Tencent Technology (Shenzhen) Company Limited Classification model training method, server, and storage medium
CN110956185A (zh) * 2019-11-21 2020-04-03 大连理工大学人工智能大连研究院 一种图像显著目标的检测方法
CN111626315A (zh) * 2019-02-28 2020-09-04 北京京东尚科信息技术有限公司 模型训练方法、对象识别方法、装置、介质及电子设备

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10430946B1 (en) * 2019-03-14 2019-10-01 Inception Institute of Artificial Intelligence, Ltd. Medical image segmentation and severity grading using neural network architectures with semi-supervised learning techniques
CN110674854B (zh) * 2019-09-09 2022-05-17 东软集团股份有限公司 一种图像分类模型训练方法、图像分类方法、装置及设备
CN110909784B (zh) * 2019-11-15 2022-09-02 北京奇艺世纪科技有限公司 一种图像识别模型的训练方法、装置及电子设备
CN111310846B (zh) * 2020-02-28 2024-07-02 平安科技(深圳)有限公司 一种选取样本图像的方法、装置、存储介质和服务器

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3276540A2 (en) * 2016-07-28 2018-01-31 Samsung Electronics Co., Ltd. Neural network method and apparatus
CN106250931A (zh) * 2016-08-03 2016-12-21 武汉大学 一种基于随机卷积神经网络的高分辨率图像场景分类方法
CN106971200A (zh) * 2017-03-13 2017-07-21 天津大学 一种基于自适应迁移学习的图像记忆度预测方法
CN107239802A (zh) * 2017-06-28 2017-10-10 广东工业大学 一种图像分类方法及装置
US20200097709A1 (en) * 2017-12-12 2020-03-26 Tencent Technology (Shenzhen) Company Limited Classification model training method, server, and storage medium
CN108460758A (zh) * 2018-02-09 2018-08-28 河南工业大学 肺结节检测模型的构建方法
CN108805160A (zh) * 2018-04-17 2018-11-13 平安科技(深圳)有限公司 迁移学习方法、装置、计算机设备和存储介质
CN111626315A (zh) * 2019-02-28 2020-09-04 北京京东尚科信息技术有限公司 模型训练方法、对象识别方法、装置、介质及电子设备
CN110689086A (zh) * 2019-10-08 2020-01-14 郑州轻工业学院 基于生成式对抗网络的半监督高分遥感图像场景分类方法
CN110889332A (zh) * 2019-10-30 2020-03-17 中国科学院自动化研究所南京人工智能芯片创新研究院 一种基于面试中微表情的说谎检测方法
CN110956185A (zh) * 2019-11-21 2020-04-03 大连理工大学人工智能大连研究院 一种图像显著目标的检测方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
A.E. AMIN: "Image Classification System Based on Hexagonal Image Processing and Evidential Neural Network Classifier", 《CONFERENCE ON COMPUTER SCIENCE AND ENVIRONMENTAL ENGINEERING》 *
SAMUEL SCHULTER ET AL: "Alternating Decision Forests", 《2013 IEEE CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION》 *
张戴克: "基于多核学习的图像分类研究", 《中国优秀硕士学位论文全文数据库 科技信息辑》 *
郑远攀 等: "深度学习在图像识别中的应用研究综述", 《计算机工程与应用》 *

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112215212B (zh) * 2020-12-02 2021-03-02 腾讯科技(深圳)有限公司 一种图像识别方法、装置、计算机设备及存储介质
CN112215212A (zh) * 2020-12-02 2021-01-12 腾讯科技(深圳)有限公司 一种图像识别方法、装置、计算机设备及存储介质
CN112434754A (zh) * 2020-12-14 2021-03-02 前线智能科技(南京)有限公司 一种基于图神经网络的跨模态医学影像域适应分类方法
CN112784879A (zh) * 2020-12-31 2021-05-11 前线智能科技(南京)有限公司 一种基于小样本域自适应的医学影像分割或分类方法
CN113159202B (zh) * 2021-04-28 2023-09-26 平安科技(深圳)有限公司 图像分类方法、装置、电子设备及存储介质
CN113159202A (zh) * 2021-04-28 2021-07-23 平安科技(深圳)有限公司 图像分类方法、装置、电子设备及存储介质
WO2022227169A1 (zh) * 2021-04-28 2022-11-03 平安科技(深圳)有限公司 图像分类方法、装置、电子设备及存储介质
CN113361543A (zh) * 2021-06-09 2021-09-07 北京工业大学 Ct图像特征提取方法、装置、电子设备和存储介质
CN113361543B (zh) * 2021-06-09 2024-05-21 北京工业大学 Ct图像特征提取方法、装置、电子设备和存储介质
CN113537151A (zh) * 2021-08-12 2021-10-22 北京达佳互联信息技术有限公司 图像处理模型的训练方法及装置、图像处理方法及装置
CN113537151B (zh) * 2021-08-12 2023-10-17 北京达佳互联信息技术有限公司 图像处理模型的训练方法及装置、图像处理方法及装置
CN113673599B (zh) * 2021-08-20 2024-04-12 大连海事大学 一种基于校正原型学习的高光谱影像分类方法
CN113673599A (zh) * 2021-08-20 2021-11-19 大连海事大学 一种基于校正原型学习的高光谱影像分类方法
CN115482436A (zh) * 2022-09-21 2022-12-16 北京百度网讯科技有限公司 图像筛选模型的训练方法、装置以及图像筛选方法

Also Published As

Publication number Publication date
CN111931865B (zh) 2021-01-26
WO2021164306A1 (zh) 2021-08-26

Similar Documents

Publication Publication Date Title
CN111931865B (zh) 图像分类模型的训练方法、装置、计算机设备及存储介质
CN111191791B (zh) 基于机器学习模型的图片分类方法、装置及设备
CN110136103B (zh) 医学影像解释方法、装置、计算机设备及存储介质
Wang et al. Zoom-in-net: Deep mining lesions for diabetic retinopathy detection
CN110889325A (zh) 多任务面部动作识别模型训练和多任务面部动作识别方法
CN111368672A (zh) 一种用于遗传病面部识别模型的构建方法及装置
Wang et al. Medical matting: a new perspective on medical segmentation with uncertainty
CN113793301A (zh) 基于稠密卷积网络模型的眼底影像分析模型的训练方法
Lin et al. Decoupled gradient harmonized detector for partial annotation: Application to signet ring cell detection
CN113283388B (zh) 活体人脸检测模型的训练方法、装置、设备及存储介质
Hussein et al. Auto-detection of the coronavirus disease by using deep convolutional neural networks and X-ray photographs
CN117975170A (zh) 基于大数据的医疗信息处理方法及系统
Sukumaran et al. Optimal feature selection with hybrid classification for automatic face shape classification using fitness sorted Grey wolf update
Zhang et al. A novel approach for automated diagnosis of kidney stones from CT images using optimized InceptionV4 based on combined dwarf mongoose optimizer
Kakarla et al. Investigations on Color Normalization Technique Using CycleGAN Based Machine Learning Algorithms for Breast Cancer Detection-Data Deployment
CN111833991A (zh) 基于人工智能的辅助判读方法、装置、终端和存储介质
CN117637029B (zh) 基于深度学习模型的抗体可开发性预测方法和装置
Kumar et al. Mobile-Based Classification and Detection of Diabetic Retinopathy Using TinyML
CN118398155B (zh) 医学报告的生成方法、模型训练方法、系统、设备及介质
WO2024216763A1 (zh) 图像处理方法、装置、电子设备及存储介质
Padhi et al. Covid Analysis using Recurrent Neural Network
Kumar et al. SCCNet: Skin Cancer Detection and Multi-Class Classification Using Deep CNN Model with Estimated Disease Probabilities
Cömert et al. Computerized otoscopy image-based artificial intelligence model utilizing deep features provided by vision transformer, grid search optimization, and support vector machine for otitis media diagnosis
Lim et al. KDViT: COVID-19 diagnosis on CT-scans with knowledge distillation of vision transformer
Murthy et al. Automated Detection of Infection in Diabetic Foot Ulcer Using Pre-trained Fast Convolutional Neural Network with U++ net

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant