CN112418327A - 图像分类模型的训练方法、装置、电子设备以及存储介质 - Google Patents

图像分类模型的训练方法、装置、电子设备以及存储介质 Download PDF

Info

Publication number
CN112418327A
CN112418327A CN202011339875.6A CN202011339875A CN112418327A CN 112418327 A CN112418327 A CN 112418327A CN 202011339875 A CN202011339875 A CN 202011339875A CN 112418327 A CN112418327 A CN 112418327A
Authority
CN
China
Prior art keywords
classification
training
image
label
preset
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011339875.6A
Other languages
English (en)
Inventor
罗彤
郭彦东
李亚乾
杨林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Jinsheng Communication Technology Co ltd
Guangdong Oppo Mobile Telecommunications Corp Ltd
Original Assignee
Shanghai Jinsheng Communication Technology Co ltd
Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Jinsheng Communication Technology Co ltd, Guangdong Oppo Mobile Telecommunications Corp Ltd filed Critical Shanghai Jinsheng Communication Technology Co ltd
Priority to CN202011339875.6A priority Critical patent/CN112418327A/zh
Publication of CN112418327A publication Critical patent/CN112418327A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

本申请公开了一种图像分类模型的训练方法、装置、电子设备以及存储介质。获取训练样本图像和训练样本图像对应的训练分类标签,训练分类标签为训练样本图像对应的多个分类标签中的部分分类标签,将训练样本图像输入分类网络,获取分类网络输出的多个预设分类标签中的每个预设分类标签的概率,基于训练分类标签和每个预设分类标签的概率,确定分类网络的损失信息,基于损失信息对分类网络进行迭代训练,获得图像分类模型,图像分类模型用于确定待分类图像对应的的多个分类标签。本申请通过标注部分分类标签的训练样本图像对分类网络进行训练,获得可以确定多个分类标签的图像分类网络,从而能够节省大量数据获取和标注的时间和财力成本。

Description

图像分类模型的训练方法、装置、电子设备以及存储介质
技术领域
本申请涉及人工智能技术领域,更具体地,涉及一种图像分类模型的训练 方法、装置、电子设备以及存储介质。
背景技术
随着科技水平的迅速发展,对图像中物体的分类引起了人们极大的研究兴 趣,并同时在很多应用产品中部署,智能化地解决了很多日常生活中的问题。 对于图像的多分类问题,一般通过训练的图像分类模型进行,但用于进行图像 分类模型训练的图像需要标注所有分类标签,造成时间成本和财力成本的过度 损耗。
发明内容
鉴于上述问题,本申请提出了一种图像分类模型的训练方法、装置、电子 设备以及存储介质,以解决上述问题。
第一方面,本申请实施例提供了一种图像分类模型的训练方法,所述方 法包括:获取训练样本图像和所述训练样本图像对应的训练分类标签,其中, 所述训练分类标签为所述训练样本图像对应的多个分类标签中的部分分类标 签;将所述训练样本图像输入分类网络,获取所述分类网络输出的多个预设分 类标签中的每个预设分类标签的概率;基于所述训练分类标签和所述每个预设 分类标签的概率,确定所述分类网络的损失信息;基于所述损失信息对所述分 类网络迭代训练,获得图像分类模型,其中,所述图像分类模型用于确定待分 类图像对应的多个分类标签。
第二方面,本申请实施例提供了一种图像分类模型的训练装置,所述装 置包括:训练分类标签获取模块,用于获取训练样本图像和所述训练样本图像 对应的训练分类标签,其中,所述训练分类标签为所述训练样本图像对应的多 个分类标签中的部分分类标签;概率获取模块,用于将所述训练样本图像输入 分类网络,获取所述分类网络输出的多个预设分类标签中的每个预设分类标签 的概率;损失信息获取模块,用于基于所述训练分类标签和所述每个预设分类 标签的概率,确定所述分类网络的损失信息;图像分类模型获得模块,用于基 于所述损失信息对所述分类网络迭代训练,获得图像分类模型,其中,所述图 像分类模型用于确定待分类图像对应的多个分类标签。
第三方面,本申请实施例提供了一种电子设备,包括存储器和处理器,所 述存储器耦接到所述处理器,所述存储器存储指令,当所述指令由所述处理器 执行时所述处理器执行上述方法。
第四方面,本申请实施例提供了一种计算机可读取存储介质,所述计算 机可读取存储介质中存储有程序代码,所述程序代码可被处理器调用执行上 述方法。
本申请实施例提供的图像分类模型的训练方法、装置、电子设备以及存 储介质,获取训练样本图像和训练样本图像对应的训练分类标签,训练分类 标签为训练样本图像对应的多个分类标签中的部分分类标签,将训练样本图 像输入分类网络,获取分类网络输出的多个预设分类标签中的每个预设分类 标签的概率,基于训练分类标签和每个预设分类标签的概率,确定分类网络 的损失信息,基于损失信息对分类网络进行迭代训练,获得图像分类模型, 图像分类模型用于确定待分类图像对应的多个分类标签,从而通过标注部分 分类标签的训练样本图像对分类网络进行训练,获得可以确定多个分类标签 的图像分类网络,从而能够节省大量数据获取和标注的时间和财力成本。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中 所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本 申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提 下,还可以根据这些附图获得其它的附图。
图1示出了本申请一个实施例提供的图像分类模型的训练方法的流程示 意图;
图2示出了本申请又一个实施例提供的图像分类模型的训练方法的流程 示意图;
图3示出了本申请的图2所示的图像分类模型的训练方法的步骤S230 的流程示意图;
图4示出了本申请再一个实施例提供的图像分类模型的训练方法的流程 示意图;
图5示出了本申请的图4所示的图像分类模型的训练方法的步骤S350 的流程示意图;
图6示出了本申请另一个实施例提供的图像分类模型的训练方法的流程 示意图;
图7示出了本申请实施例提供的图像分类模型的训练装置的模块框图;
图8示出了本申请实施例用于执行根据本申请实施例的图像分类模型的 训练方法的电子设备的框图;
图9示出了本申请实施例的用于保存或者携带实现根据本申请实施例的 图像分类模型的训练方法的程序代码的存储单元。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实 施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。
目前,大部分图像分类方案仅支持单标签分类,少部分图像分类方案支 持多标签分类,其中,单标签分类指示针对某个图像仅能获得一个类型标签, 多标签分类指示针对某个图像能获得多个类型标签。对于单标签分类问题, 一般通过训练的图像分类模型进行,且用于进行图像分类模型训练的图像仅 需要标注一个分类标签,虽然降低了时间成本和财力成本,但是在实际应用 时无法获得图像真实的多分类标签,造成分类效果不理想的问题。对于多标 签分类问题,一般通过训练的图像分类模型进行,且用于进行图像分类模型 训练的图像需要标注多个分类标签,而随着标签数量的上升,标注成本呈指 数级增加,造成时间成本和财力成本的过度损耗。
针对上述问题,发明人经过长期的研究发现,并提出了本申请实施例提 供的图像分类模型的训练方法、装置、电子设备以及存储介质,其通过标注 部分分类标签的训练样本图像对分类网络进行训练,获得可以确定多个分类 标签的图像分类网络,从而能够节省大量数据获取和标注的时间和财力成本。 其中,具体的图像分类模型的训练方法在后续的实施例中进行详细的说明。
请参阅图1,图1示出了本申请实施例提供的图像分类模型的训练方法 的流程示意图。该图像分类模型的训练方法用于通过标注部分分类标签的训 练样本图像对分类网络进行训练,获得可以确定多个分类标签的图像分类网 络,从而能够节省大量数据获取和标注的时间和财力成本。在具体的实施例 中,所述图像分类模型的训练方法应用于如图7所示的图像分类模型的训练 装置200以及配置有图像分类模型的训练装置200的电子设备100(图8)。 下面将以电子设备为例,说明本实施例的具体流程,当然,可以理解的,本 实施例所应用的电子设备可以包括智能手机、平板电脑、穿戴式电子设备等, 在此不做限定。下面将针对图1所示的流程进行详细的阐述,所述图像分类 模型的训练方法具体可以包括以下步骤:
步骤S110:获取训练样本图像和所述训练样本图像对应的训练分类标 签,其中,所述训练分类标签为所述训练样本图像对应的多个分类标签中的 部分分类标签。
其中,训练样本图像为需要进行分类的图像,该训练样本图像可以为电 子设备的本地存储的,可以为其他设备存储并发送至电子设备的,可以为从 服务器存储并发送至电子设备的,还可以为电子设备实时拍摄的等,在此不 做限定。另外,该训练样本图像包括但不限于是可见光图,可见光图是指 RGB(Red、Green、Blue)图像。可以通过彩色摄像头拍摄任意场景得到彩色 图像,即RGB图像。
其中,该训练样本图像对应的训练分类标签可以预先通过电子设备自动 标注获得,也可以预先通过人工手动标注获得,在此不做限定。在一些实施 方式中,该训练分类标签为训练样本图像对应的多个分类标签中的部分分类 标签,可选地,该训练分类标签为训练样本图像对应的多个分类标签中的单 分类标签。作为一种方式,假设训练样本图像对应的多个分类标签的数量为 10个,则训练分类标签的数量小于10个,可选地,训练样本标签可以为10 个分类标签中的任意一个。具体地,假设训练样本图像对应的多个分类标签 包括海滩、日出、岛屿、海鸥、天空以及树木,那么,训练分类标签可以为 海滩、日出、岛屿、海鸥、天空以及树木中的其中一个、其中两个、其中三 个、其中四个或其中五个,在此不做限定。
步骤S120:将所述训练样本图像输入分类网络,获取所述分类网络输出的 多个预设分类标签中的每个预设分类标签的概率。
在本实施例中,在获取训练样本图像和训练样本图像对应的训练分类标签 后,可以将训练样本图像输入分类网络,以获得分类网络输出的多个预设分类 标签中的每个预设分类标签的概率。
在一些实施方式中,分类网络可以包括特征提取模块以及分类模块,其 中,特征提取模块对训练样本图像的图像特征进行提取之后,将其输入至分 类模块,然后分类模块根据输入的图像特征,输出多个预设分类标签中的每 个预设分类标签的概率。
在一些实施方式中,特征提取模块可以为预先训练的神经网络。例如, 神经网络可以包括mobilenet、efficientnet等轻量级结构,也可以包括目视图 像生成器(VGG,visual graphics generator)模型,深度残差网络(ResNet,deep residual network)模型、xception等用于提取图像特征的模型。可选的,神经 网络可以为imageNet中预训练的卷积神经网络(例如VGG19),由于imageNet 中预训练的卷积神经网络已经有很强的特征提取能力,因此不需要重新训练, 基于imageNet中预训练的卷积神经网络即可对上述训练样本图像中的图像 特征进行提取。可选的,神经网络也可以是mobilenet,可以有效节省电子设 备的存储空间,提升电子设备的运行效率。
在一些实施方式中,分类模块可以为Softmax逻辑回归模型(Softmax logicalregression),也可以是支持向量机(Support Vector Machine,SVM) 等,具体的分类模块可以不作为限定。
在一些实施方式中,分类网络可以设置有多个预设分类标签,则分类模 块可以根据特征提取模块输入的图像特征,将特征提取模块输入的图像特征 与多个预设分类标签中的每个预设分类标签对应的图像特征进行比较,以确 定特征提取模块输入的图像特征与每个预设分类标签中的每个预设分类标签 对应的图像特征的相似度,基于特征提取模块输入的图像特征与每个预设分 类标签中的每个预设分类标签对应的图像特征的相似度获得每个预设分类标 签的概率并输出。
步骤S130:基于所述训练分类标签和所述每个预设分类标签的概率,确定 所述分类网络的损失信息。
在本实施例中,在获得训练分类标签和每个预设分类标签的概率后,可 以基于训练分类标签和每个预设分类标签的概率,确定该分类网络的损失信 息。
在一些实施方式中,在获得训练分类标签和每个预设分类标签的概率后, 可以对训练分类表标签和每个预设分类标签的概率进行计算,获得分类网络 的损失信息。
在一些实施方式中,在获得训练分类标签和每个预设分类标签的概率后, 可以获取训练分类标签和每个预设分类标签的概率之间的对应关系,基于该 对应关系,获得分类网络的损失信息。
步骤S140:基于所述损失信息对所述分类网络迭代训练,获得图像分类 模型,其中,所述图像分类模型用于确定待分类图像对应的多个分类标签。
在本实施例中,在获得分类网络的损失信息后,可以基于损失信息对分 类网络进行迭代训练,以获得图像分类模型,其中,该图像分类模型可以用 于确定待分类图像对应的多个分类标签,从而实现对待分类图像的多标签分 类。作为一种方式,在获得分类网络的损失信息后,可以基于损失信息使用 反向传播更新分类网络的参数,获得图像分类模型。
在一些实施方式中,可以根据分类网络的损失信息,使用Adam优化器 对分类网络进行迭代训练,直至基于分类网络输出的每个预设分类标签的概 率和训练分类标签确定的损失信息收敛,并将此时的分类网络进行保存,得 到图像分类模型。其中,Adam优化器,结合了AdaGra(Adaptive Gradient, 自适应梯度)和RMSProp两种优化算法的优点,对梯度的一阶矩估计(First Moment Estimation,即梯度的均值)和二阶矩估计(Second MomentEstimation,即梯度的未中心化的方差)进行综合考虑,计算出更新步长。
在一些实施方式中,迭代训练的终止条件可以包括:迭代训练的次数达 到目标次数;或者,分类网络的损失信息满足收敛条件。
在一种具体实施方式中,收敛条件是让损失信息尽可能小,使用初始学 习率1e-3,学习率随步数余弦衰减,batch_size=8,训练16个epoch后,即 可认为收敛完成。其中,batch_size可以理解为批处理参数,它的极限值为训 练集样本总数,epoch指使用训练集中的全部样本训练的次数,通俗的讲 epoch的值就是整个数据集被轮几次,1个epoch等于使用训练集中的全部样 本训练1次。
在另一种具体实施方式中,分类网络的损失信息满足收敛条件可以包括: 损失信息对应的损失值小于设定阈值。当然,具体收敛条件对应的设定阈值 大小可以不作为限定。
在一些实施方式中,在获得图像分类模型后可以存储在电子设备的本地。 基于此,电子设备在获取待分类图像后,可以直接在本地调用该图像分类模 型,例如,可以直接发送指令至图像分类模型,以指示该图像分类模型在目 标存储区域读取该待分类图像,或者电子设备可以直接将该待分类图像输入 存储在本地的图像分类模型,从而有效避免由于网络因素的影响降低待分类 图像输入图像分类网络的速度,以提升图像分类模型获取待分类图像的速度, 提升用户体验。
在一些实施方式中,在获得图像分类模型后可以存储在与电子设备通信 连接的服务器。基于此,电子设备在获取待分类图像后,可以通过网络发送 指令至存储在服务器的图像分类模型,以指示该图像分类模型通过网络读取 电子设备获取的待分类图像,或者电子设备可以通过网络将待分类图像发送 至存储在服务器的图像分类模型,从而通过将图像分类模型存储在服务器的 方式,减少对电子设备的存储空间的占用,降低对电子设备的正常运行的影 响。
在一些实施方式中,图像分类模型还可以周期性的或者不定期的获取新 的训练样本图像,对该图像分类模型进行训练和更新。例如,在存在图像被 误分类时,则可以将该图像作为训练样本图像,对训练样本图像进行标注后, 通过以上训练方式,再进行训练,从而可以提升图分类模型的多标签分类准 确度。
在一些实施方式中,由于图像分类模型是用于识别某些类别的图像,并 执行多标签分类,因此当用户需求图像分类模型识别的类别发生变化时,还 可以增加新的预设分类标签,或者删除某个预设分类标签,并根据变更后的 预设分类标签,对图像分类模型再进行训练。
本申请一个实施例提供的图像分类模型的训练方法,获取训练样本图像 和训练样本图像对应的训练分类标签,训练分类标签为训练样本图像对应的 多个分类标签中的部分分类标签,将训练样本图像输入分类网络,获取分类 网络输出的多个预设分类标签中的每个预设分类标签的概率,基于训练分类 标签和每个预设分类标签的概率,确定分类网络的损失信息,基于损失信息 对分类网络进行迭代训练,获得图像分类模型,图像分类模型用于确定待分 类图像对应的多个分类标签,从而通过标注部分分类标签的训练样本图像对 分类网络进行训练,获得可以确定多个分类标签的图像分类网络,从而能够 节省大量数据获取和标注的时间和财力成本。
请参阅图2,图2示出了本申请又一个实施例提供的图像分类模型的训 练方法的流程示意图。下面将针对图2所示的流程进行详细的阐述,所述图 像分类模型的训练方法具体可以包括以下步骤:
步骤S210:获取训练样本图像和所述训练样本图像对应的训练分类标签, 其中,所述训练分类标签为所述训练样本图像对应的多个分类标签中的部分分 类标签。
步骤S220:将所述训练样本图像输入分类网络,获取所述分类网络输出的 多个预设分类标签中的每个预设分类标签的概率。
其中,步骤S210-步骤S220的具体描述请参阅步骤S110-步骤S120,在此 不再赘述。
步骤S230:基于所述训练分类标签和所述每个预设分类标签的概率,获得 损失权重。
在本实施例中,在获得训练分类标签和每个预设分类标签的概率后,可以 基于训练分类标签和每个预设分类标签的概率,获得损失权重。作为一种方式, 在获得训练分类标签和每个预设分类标签的概率后,可以获取训练分类标签和 每个预设分类标签的概率之间的对应关系,基于该对应关系,获得损失权重。
请参阅图3,图3示出了本申请的图2所示的图像分类模型的训练方法的步 骤S230的流程示意图。下面将针对图3所示的流程进行详细的阐述,所述方法 具体可以包括以下步骤:
步骤S231:当所述多个预设分类标签中包括与所述训练分类标签匹配的第 一目标预设分类标签,且所述第一目标预设分类标签的概率小于第一概率时, 获得第一损失权重。
在一些实施方式中,电子设备可以预先设置并存储有第一损失权重和第二 损失权重,其中,第一损失权重大于第二损失权重,该第一损失权重和第二损 失权重均可以用于衡量或计算分类网络的损失信息。例如,该第一损失权重可 以为0.8,第二损失权重可以为0.2;或者,该第一损失权重可以为0.7,第二损 失权重可以为0.3等,在此不做限定。
在一些实施方式中,电子设备可以预先设置并存储有第一概率和第二概率, 其中,第二概率大于第一概率,该第一概率用于作为每个预设分类标签的概率 的判断依据,该第二概率用于作为每个预设分类标签的概率的判断依据。因此, 在本实施例中,在获得预设分类标签的概率时,可以将预设分类标签的概率与 第一概率进行比较,以判断预设分类标签的概率是否小于第一概率;在获得预 设分类标签的概率时,可以将预设分类标签的概率与第二概率进行比较,以判 断预设分类标签的概率是否大于第二概率。
在本实施例中,当多个预设分类标签中包含与训练分类标签匹配的第一目 标预设分类标签,且该第一目标预设分类标签的概率小于第一概率时,表征该 训练样本图像中确定存在的训练样本标签没有被分类网络检测到,这种是存在 检测错误的,则可以获得更大的第一损失权重。
步骤S232:当所述多个预设分类标签中包括与所述训练分类标签不匹配的 第二目标预设分类标签,且所述第二目标预设分类标签的概率大于第二概率时, 获得第二损失权重,其中,所述第二概率大于所述第一概率,所述第一损失权 重大于所述第二损失权重。
在本实施例中,当多个预设分类标签中包含与训练分类标签不匹配的第二 目标预设分类标签,且第二预设分类标签的概率大于第二概率时,表征该训练 样本图像中没有进行训练分类标签标注的标签被检测到,这种不能确定是训练 样本图像中确实不存在该标签,还是该训练样本图像中实际存在该标签但未进 行标注,这种检测不能确定是错误的,则可以获得更小的第二损失权重。
步骤S240:基于所述损失权重,确定所述分类网络的损失信息。
在本实施例中,在确定损失权重后,可以基于该损失权重,确定分类网络 的损失信息。在一些实施方式中,在确定损失权重后,可以基于该损失权重, 计算该分类网络的损失值,并将该损失值作为分类网络的损失信息。
步骤S250:基于所述损失信息对所述分类网络迭代训练,获得图像分类模 型,其中,所述图像分类模型用于确定待分类图像对应的多个分类标签。
其中,步骤S250的具体描述请参阅步骤S140,在此不再赘述。
本申请又一个实施例提供的图像分类模型的训练方法,获取训练样本图 像和训练样本图像对应的训练分类标签,其中,该训练分类标签为训练样本 图像对应的多个分类标签中的部分分类标签,将训练样本图像输入分类网络, 获取分类网络输出的多个预设分类标签中的每个预设分类标签的概率,基于 训练分类标签和每个预设分类标签的概率,获得损失权重,基于损失权重, 确定分类网络的损失信息,基于损失信息对分类网络进行迭代训练,获得图 像分类模型,其中,图像分类模型用于确定待分类图像对应的多个分类标签。 相较于图1所示的图像分类模型的训练方法,本实施例还基于训练分类标签 和每个预设分类标签的概率,获得损失权重,再根据损失权重,确定分类网 络的损失信息,以提升所确定的损失信息的准确性。
请参阅图4,图4示出了本申请再一个实施例提供的图像分类模型的训 练方法的流程示意图。下面将针对图4所示的流程进行详细的阐述,所述图 像分类模型的训练方法具体可以包括以下步骤:
步骤S310:获取训练样本图像和所述训练样本图像对应的训练分类标签, 其中,所述训练分类标签为所述训练样本图像对应的多个分类标签中的部分分 类标签。
步骤S320:将所述训练样本图像输入分类网络,获取所述分类网络输出的 多个预设分类标签中的每个预设分类标签的概率。
其中,步骤S310-步骤S320的具体描述请参阅步骤S110-步骤S120,在此 不再赘述。
步骤S330:基于所述训练分类标签获得所述训练样本图像对应的多个分类 标签对应的向量值,其中,所述训练样本图像对应的多个分类标签中的训练分 类标签对应第一向量值,所述训练样本图像对应的多个分类标签中除所述训练 分类标签之外的其他分类标签对应的第二向量值。
在一些实施方式中,在进行分类网络训练的过程中,可以对训练样本图像 的多个标签做one-hot编码,即固定标签的顺序,取和所有标签数相等长度的向 量,对每张训练样本图像来说,在训练样本图像上进行训练分类标签标注的标 签对应第一向量值,在训练样本图像上没有进行训练分类标签标注的标签对应 第二向量值。可选地,该第一向量值可以为1,第二向量值可以为0。
因此,在本实施例中,在获得训练样本图像对应的训练分类标签后,可以 基于该训练分类标签获得训练样本图像对应的多个分类标签对应的向量值。即, 训练样本图像对应的多个分类标签中标注有训练分类标签的标签对应第一向量 值,训练样本图像对应的多个分类标签中没有标签训练分类标签的标签对应第 二向量值。作为一种方式,训练样本图像对应的多个分类标签标注有训练分类 标签的标签对应向量值1,训练样本图像对应的多个分类标签没有标注训练分类 标签的标签对应向量值0。
步骤S340:基于所述训练样本图像对应的多个分类标签的向量值和所述每 个预设分类标签的概率,获得所述损失权重。
在本实施例中,在获得训练样本图像对应的多个分类标签的向量值和每个 预设分类标签的概率后,可以基于训练样本图像对应的多个分类标签的向量值 和每个预设分类标签的概率,获得损失权重。
在一些实施方式中,当训练样本图像对应的分类标签的向量值为1且对应 的预设分类标签的概率小于第一概率时,则获得第一损失权重作为该损失权重; 当训练样本图像对应的分类标签的向量值为0且对应的预设分类标签的概率大 于第二概率时,则获得第二损失权重作为该损失权重。
步骤S350:基于所述损失权重,确定所述分类网络的损失信息。
在本实施例中,在确定损失权重后,可以基于该损失权重,确定分类网络 的损失信息。在一些实施方式中,在确定损失权重后,可以基于该损失权重, 计算该分类网络的损失值,并将该损失值作为分类网络的损失信息。
请参阅图5,图5示出了本申请实施例提供的图像分类模型的训练方法的 步骤S350的流程示意图。下面将针对图5所示的流程进行详细的阐述,所述方 法具体可以包括以下步骤:
步骤S351:基于所述损失权重和预设损失函数,构建目标损失函数。
在本实施例中,在确定损失权重后,可以基于损失权重和预设损失函数, 构建目标损失函数。
在一些实施方式中,预设损失函数可以为: CE(y,p)=-∑(y*log(p)+(1-y)*log(1-p)),其中,y表示所述分类标签的向量值,p 表示所述预设分类标签的概率。那么,可以基于损失函数和预设损失函数,构 建目标损失函数:L(y,p)=-∑w(y*log(p)+(1-y)*log(1-p)),其中,
Figure BDA0002798314150000111
w 表示所述损失权重,1为第一向量值,0为第二向量值。
在一些实施方式中,在对于损失函数很大的样本,也可能是漏标注的样本, 因此,还可以对损失权重增加系数,以提升目标损失函数的计算准确性。具体 地,该预设损失函数可以为:L(y,p)=-∑w*(1-pt)γ*(y*log(p)+(1-y)*log(1-p)),其 中,
Figure BDA0002798314150000112
pt表示所述分类模型对所述预设分类标签的确定度,1-pt标识所述模型对所述预设分类标签的不确定度,γ为常数。其中,当γ为0时, 则可以得到预设损失函数:L(y,p)=-∑w(y*log(p)+(1-y)*log(1-p))。
步骤S352:基于所述目标损失函数对所述训练样本图像对应的多个分类标 签对应的向量值和所述每个预设分类标签的概率进行计算,获得所述分类网络 的损失值。
在一些实施方式中,在获得目标损失函数后,可以基于目标损失函数对训 练样本图像对应的多个分类标签对应的向量值和每个预设分类标签的概率进行 计算,获得分类网络的损失值。
在一些实施方式中,目标损失函数可以为 L(y,p)=-∑w(y*log(p)+(1-y)*log(1-p)),则可以基于 L(y,p)=-∑w(y*log(p)+(1-y)*log(1-p))对所述训练样本图像对应的多个分类标签对 应的向量值和所述每个预设分类标签的概率进行计算,获得所述分类网络的损 失值L(y,p)
在一些实施方式中,目标损失函数可以为: L(y,p)=-∑w*(1-pt)γ*(y*log(p)+(1-y)*log(1-p)),则可以基于 L(y,p)=-∑w*(1-pt)γ*(y*log(p)+(1-y)*log(1-p))对所述训练样本图像对应的多个分 类标签对应的向量值和所述每个预设分类标签的概率进行计算,获得所述分类 网络的损失值L(y,p)
步骤S360:基于所述损失信息对所述分类网络迭代训练,获得图像分类模 型,其中,所述图像分类模型用于确定待分类图像对应的多个分类标签。
其中,步骤S360的具体描述请参阅步骤S140,在此不再赘述。
本申请再一个实施例提供的图像分类模型的训练方法,获取训练样本图 像和训练样本图像对应的训练分类标签,其中,该训练分类标签为训练样本 图像对应的多个分类标签中的部分分类标签,将训练样本图像输入分类网络, 获取分类网络输出的多个预设分类标签中的每个预设分类标签的概率,基于 训练分类标签获得训练样本图像对应的多个分类标签对应的向量值,基于训 练样本图像对应的多个分类标签的向量值和每个预设分类标签的概率,获得 损失权重,基于损失权重,确定分类网络的损失信息,基于损失信息对分类 网络进行迭代训练,获得图像分类模型,其中,图像分类模型用于确定待分 类图像对应的多个分类标签。相较于图1所示的图像分类模型的训练方法, 本实施例还基于训练分类标签获得训练样本图像对应的多个分类标签的向量 值,基于训练分类标签获得训练样本图像对应的多个分类标签对应的向量值 和每个预设分类标签的概率,获得损失权重,基于损失权重确定分类网络的 损失信息,以提升所确定的损失信息的准确性。
请参阅图6,图6示出了本申请另一个实施例提供的图像分类模型的训 练方法的流程示意图。下面将针对图6所示的流程进行详细的阐述,所述图 像分类模型的训练方法具体可以包括以下步骤:
步骤S410:获取训练样本图像和所述训练样本图像对应的训练分类标签, 其中,所述训练分类标签为所述训练样本图像对应的多个分类标签中的部分分 类标签。
步骤S420:将所述训练样本图像输入分类网络,获取所述分类网络输出的 多个预设分类标签中的每个预设分类标签的概率。
步骤S430:基于所述训练分类标签和所述每个预设分类标签的概率,确定 所述分类网络的损失信息。
步骤S440:基于所述损失信息对所述分类网络迭代训练,获得图像分类模 型。
其中,步骤S410-步骤S440的具体描述请参阅步骤S110-步骤S140,在此 不再赘述。
步骤S450:获取待分类图像。
在本实施例中,电子设备可以获取待进行图像内容的类别分类的图像, 并将其作为待分类图像。其中,进行图像内容的类别分类,即对图像中的实 体对象进行类别的区分,例如对图像中的动物、植物等进行类别区分。
作为一种实施方式,电子设备为智能手机、平板电脑、智能手表等设置 有摄像头的设备时,可以通过前置摄像头或者后置摄像头进行图像采集,从 而获得待分类图像,例如,电子设备可以通过后置摄像头采集图像,并将获 得的图像作为待分类图像;作为又一种实施方式,电子设备可以从本地获取 待分类图像,也就是说,电子设备可以从本地存储的文件中获取待分类图像, 例如,电子设备为智能手机时,可以从相册获取待分类图像,即电子设备预 先通过摄像头采集图像后存储在本地相册,或者预先从网络下载图像后存储在本地相册等,然后在需要对图像进行类型识别时,从相册中读取待分类图 像;作为再一种方式,电子设备为智能手机或者电脑时,也可以从网络下载 图像作为待分类图像,例如,电子设备可以通过无线网络、数据网络等从相 应的服务器下载需求的图像,以进行对下载的图像进行图像类型识别。当然, 电子设备具体获取待分类图像的方式可以不作为限定。
步骤S460:将所述待分类图像输入所述图像分类模型,获得所述图像分类 模型输出的所述待分类图像对应的多个分类标签。
在本实施例中,在获取待分类图像后,可以将待分类图像输入图像分类模 型,获得图像分类模型输出的待分类图像对应的多个分类标签,以实现对图像 的多标签分类。
本申请另一个实施例提供的图像分类模型的训练方法,获取训练样本图 像和训练样本图像对应的训练分类标签,其中,该训练分类标签为训练样本 图像对应的多个分类标签中的部分分类标签,将训练样本图像输入分类网络, 获取分类网络输出的多个预设分类标签中的每个预设分类标签的概率,基于 训练分类标签和每个预设分类标签的概率,确定分类网络的损失信息,基于 损失信息对分类网络进行迭代训练,获得图像分类模型,获取待分类图像, 将待分类图像输入图像分类模型,获得图像分类模型输出的待分类图像对应 的多个分类标签。相较于图1所示的图像分类模型的训练方法,本实施例还 获取待分类图像输入图像分类模型,获得图像分类模型输出的待分类图像对 应的多个分类标签,以实现对待分类图像的多标签分类。
请参阅图7,图7示出了本申请实施例提供的图像分类模型的训练装置 的模块框图。该图像分类模型的训练装置200应用于上述电子设备,下面将 针对图7所示的框图进行阐述,所述图像分类模型的训练装置200包括:训 练分类标签获取模块210、概率获取模块220、损失信息获取模块230以及图 像分类模型获得模块240,其中:
训练分类标签获取模块210,用于获取训练样本图像和所述训练样本图像对 应的训练分类标签,其中,所述训练分类标签为所述训练样本图像对应的多个 分类标签中的部分分类标签。
概率获取模块220,用于将所述训练样本图像输入分类网络,获取所述分类 网络输出的多个预设分类标签中的每个预设分类标签的概率。
损失信息获取模块230,用于基于所述训练分类标签和所述每个预设分类标 签的概率,确定所述分类网络的损失信息。
进一步地,所述损失信息获取模块230包括:损失权重获得子模块和损失 信息确定子模块,其中:
损失权重获得子模块,用于基于所述训练分类标签和所述每个预设分类标 签的概率,获得损失权重。
进一步地,所述损失权重获得子模块包括:第一损失权重获得单元和第二 损失权重获得单元,其中:
第一损失权重获得单元,用于当所述多个预设分类标签中包括与所述训练 分类标签匹配的第一目标预设分类标签,且所述第一目标预设分类标签的概率 小于第一概率时,获得第一损失权重。
第二损失权重获得单元,用于当所述多个预设分类标签中包括与所述训练 分类标签不匹配的第二目标预设分类标签,且所述第二目标预设分类标签的概 率大于第二概率时,获得第二损失权重,其中,所述第二概率大于所述第一概 率,所述第一损失权重大于所述第二损失权重。
进一步地,所述损失权重获得子模块包括:向量值获得单元和第三损失权 重获得单元,其中:
向量值获得单元,用于基于所述训练分类标签获得所述训练样本图像对应 的多个分类标签对应的向量值,其中,所述训练样本图像对应的多个分类标签 中的训练分类标签对应第一向量值,所述训练样本图像对应的多个分类标签中 除所述训练分类标签之外的其他分类标签对应的第二向量值。
第三损失权重获得单元,用于基于所述训练样本图像对应的多个分类标签 的向量值和所述每个预设分类标签的概率,获得所述损失权重。
损失信息确定子模块,用于基于所述损失权重,确定所述分类网络的损失 信息。
进一步地,所述损失信息确定子模块包括:目标损失函数构建单元和损失 值确定单元,其中:
目标损失函数构建单元,用于基于所述损失权重和预设损失函数,构建目 标损失函数。
损失值确定单元,用于基于所述目标损失函数对所述训练样本图像对应的 多个分类标签对应的向量值和所述每个预设分类标签的概率进行计算,获得所 述分类网络的损失值。
进一步地,所述损失值确定单元包括:损失值确定子单元,其中:
损失值确定子单元,用于基于L(y,p)=-∑w(y*log(p)+(1-y)*log(1-p))对所述训练样本图像对应的多个分类标签对应的向量值和所述每个预设分类标签的概率 进行计算,获得所述分类网络的损失值L(y,p),其中,
Figure BDA0002798314150000151
w表示所述 损失权重,y表示所述分类标签的向量值,1为第一向量值,0为第二向量值,p 表示所述预设分类标签的概率。
进一步地,所述损失值确定子单元包括:损失值确定子子单元,其中:
损失值确定子子单元,用于基于 L(y,p)=-∑w*(1-pt)γ*(y*log(p)+(1-y)*log(1-p))对所述训练样本图像对应的多个 分类标签对应的向量值和所述每个预设分类标签的概率进行计算,获得所述分 类网络的损失值L(y,p),其中,
Figure RE-GDA0002889640130000162
pt表示所述分类模型对所述预 设分类标签的确定度,1-pt标识所述模型对所述预设分类标签的不确定度,γ
图像分类模型获得模块240,用于基于所述损失信息对所述分类网络迭代训 练,获得图像分类模型,其中,所述图像分类模型用于确定待分类图像对应的 多个分类标签。
进一步地,所述图像分类模型的训练装置200还包括:待分类图像获取 模块和分类标签获得模块,其中:
待分类图像获取模块,用于获取待分类图像。
分类标签获得模块,用于将所述待分类图像输入所述图像分类模型,获得 所述图像分类模型输出的所述待分类图像对应的多个分类标签。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描 述装置和模块的具体工作过程,可以参考前述方法实施例中的对应过程,在 此不再赘述。
在本申请所提供的几个实施例中,模块相互之间的耦合可以是电性,机 械或其它形式的耦合。
另外,在本申请各个实施例中的各功能模块可以集成在一个处理模块 中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一 个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功 能模块的形式实现。
请参阅图8,其示出了本申请实施例提供的一种电子设备100的结构框 图。该电子设备100可以是智能手机、平板电脑、电子书等能够运行应用程 序的电子设备。本申请中的电子设备100可以包括一个或多个如下部件:处 理器110、存储器120以及一个或多个应用程序,其中一个或多个应用程序 可以被存储在存储器120中并被配置为由一个或多个处理器110执行,一个 或多个程序配置用于执行如前述方法实施例所描述的方法。
其中,处理器110可以包括一个或者多个处理核。处理器110利用各种 接口和线路连接整个电子设备100内的各个部分,通过运行或执行存储在存 储器120内的指令、程序、代码集或指令集,以及调用存储在存储器120内 的数据,执行电子设备100的各种功能和处理数据。可选地,处理器110可 以采用数字信号处理(Digital Signal Processing,DSP)、现场可编程门阵列 (Field-Programmable Gate Array,FPGA)、可编程逻辑阵列(Programmable Logic Array,PLA)中的至少一种硬件形式来实现。处理器110可集成中央处理器(Central Processing Unit,CPU)、图形处理器(Graphics Processing Unit, GPU)和调制解调器等中的一种或几种的组合。其中,CPU主要处理操作系 统、用户界面和应用程序等;GPU用于负责待显示内容的渲染和绘制;调制 解调器用于处理无线通信。可以理解的是,上述调制解调器也可以不集成到 处理器110中,单独通过一块通信芯片进行实现。
存储器120可以包括随机存储器(Random Access Memory,RAM),也 可以包括只读存储器(Read-Only Memory)。存储器120可用于存储指令、 程序、代码、代码集或指令集。存储器120可包括存储程序区和存储数据区, 其中,存储程序区可存储用于实现操作系统的指令、用于实现至少一个功能 的指令(比如触控功能、声音播放功能、图像播放功能等)、用于实现下述 各个方法实施例的指令等。存储数据区还可以存储电子设备100在使用中所创建的数据(比如电话本、音视频数据、聊天记录数据)等。
请参阅图9,其示出了本申请实施例提供的一种计算机可读存储介质的 结构框图。该计算机可读介质300中存储有程序代码,所述程序代码可被处 理器调用执行上述方法实施例中所描述的方法。
计算机可读存储介质300可以是诸如闪存、EEPROM(电可擦除可编程 只读存储器)、EPROM、硬盘或者ROM之类的电子存储器。可选地,计算 机可读存储介质300包括非易失性计算机可读介质(non-transitory computer-readable storage medium)。计算机可读存储介质300具有执行上述 方法中的任何方法步骤的程序代码310的存储空间。这些程序代码可以从一 个或者多个计算机程序产品中读出或者写入到这一个或者多个计算机程序产 品中。程序代码310可以例如以适当形式进行压缩。
综上所述,本申请实施例提供的图像分类模型的训练方法、装置、电子 设备以及存储介质,获取训练样本图像和训练样本图像对应的训练分类标签, 训练分类标签为训练样本图像对应的训练样本图像对应的多个分类标签中的 部分分类标签,将训练样本图像输入分类网络,获取分类网络输出的多个预 设分类标签中的每个预设分类标签的概率,基于训练分类标签和每个预设分 类标签的概率,确定分类网络的损失信息,基于损失信息对分类网络进行迭 代训练,获得图像分类模型,图像分类模型用于确定待分类图像对应的训练 样本图像对应的多个分类标签,从而通过标注部分分类标签的训练样本图像 对分类网络进行训练,获得可以确定训练样本图像对应的多个分类标签的图 像分类网络,从而能够节省大量数据获取和标注的时间和财力成本。
最后应说明的是:以上实施例仅用以说明本申请的技术方案,而非对其 限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术 人员当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者 对其中部分技术特征进行等同替换;而这些修改或者替换,并不驱使相应技 术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims (11)

1.一种图像分类模型的训练方法,其特征在于,所述方法包括:
获取训练样本图像和所述训练样本图像对应的训练分类标签,其中,所述训练分类标签为所述训练样本图像对应的多个分类标签中的部分分类标签;
将所述训练样本图像输入分类网络,获取所述分类网络输出的多个预设分类标签中的每个预设分类标签的概率;
基于所述训练分类标签和所述每个预设分类标签的概率,确定所述分类网络的损失信息;
基于所述损失信息对所述分类网络迭代训练,获得图像分类模型,其中,所述图像分类模型用于确定待分类图像对应的多个分类标签。
2.根据权利要求1所述的方法,其特征在于,所述基于所述训练分类标签和所述每个预设分类标签的概率,确定所述分类网络的损失信息,包括:
基于所述训练分类标签和所述每个预设分类标签的概率,获得损失权重;
基于所述损失权重,确定所述分类网络的损失信息。
3.根据权利要求2所述的方法,其特征在于,所述基于所述训练分类标签和所述每个预设分类标签的概率,获得损失权重,包括:
当所述多个预设分类标签中包括与所述训练分类标签匹配的第一目标预设分类标签,且所述第一目标预设分类标签的概率小于第一概率时,获得第一损失权重;
当所述多个预设分类标签中包括与所述训练分类标签不匹配的第二目标预设分类标签,且所述第二目标预设分类标签的概率大于第二概率时,获得第二损失权重,其中,所述第二概率大于所述第一概率,所述第一损失权重大于所述第二损失权重。
4.根据权利要求2所述的方法,其特征在于,所述基于所述训练分类标签和所述每个预设分类标签的概率,获得损失权重,包括:
基于所述训练分类标签获得所述训练样本图像对应的多个分类标签对应的向量值,其中,所述训练样本图像对应的多个分类标签中的训练分类标签对应第一向量值,所述训练样本图像对应的多个分类标签中除所述训练分类标签之外的其他分类标签对应的第二向量值;
基于所述训练样本图像对应的多个分类标签的向量值和所述每个预设分类标签的概率,获得所述损失权重。
5.根据权利要求4所述的方法,其特征在于,所述基于所述损失权重,确定所述分类网络的损失信息,包括:
基于所述损失权重和预设损失函数,构建目标损失函数;
基于所述目标损失函数对所述训练样本图像对应的多个分类标签对应的向量值和所述每个预设分类标签的概率进行计算,获得所述分类网络的损失值。
6.根据权利要求5所述的方法,其特征在于,所述基于所述目标损失函数对所述训练样本图像对应的多个分类标签对应的向量值和所述每个预设分类标签的概率进行计算,获得所述分类网络的损失值,包括:
基于L(y,p)=-∑w(y*log(p)+(1-y)*log(1-p))对所述训练样本图像对应的多个分类标签对应的向量值和所述每个预设分类标签的概率进行计算,获得所述分类网络的损失值L(y,p),其中,
Figure FDA0002798314140000021
w表示所述损失权重,y表示所述分类标签的向量值,1为第一向量值,0为第二向量值,p表示所述预设分类标签的概率。
7.根据权利要求6所述的方法,其特征在于,所述基于L(y,p)=-∑w(y*log(p)+(1-y)*log(1-p))对所述训练样本图像对应的多个分类标签对应的向量值和所述每个预设分类标签的概率进行计算,获得所述分类网络的损失值L(y,p),包括:
基于L(y,p)=-∑w*(1-pt)γ*(y*log(p)+(1-y)*log(1-p))对所述训练样本图像对应的多个分类标签对应的向量值和所述每个预设分类标签的概率进行计算,获得所述分类网络的损失值L(y,p),其中,
Figure FDA0002798314140000022
pt表示所述分类模型对所述预设分类标签的确定度,1-pt标识所述模型对所述预设分类标签的不确定度,γ为常数。
8.根据权利要求1-7任一项所述的方法,其特征在于,在所述基于所述损失信息对所述分类网络迭代训练,获得图像分类模型之后,还包括:
获取待分类图像;
将所述待分类图像输入所述图像分类模型,获得所述图像分类模型输出的所述待分类图像对应的多个分类标签。
9.一种图像分类模型的训练装置,其特征在于,所述装置包括:
训练分类标签获取模块,用于获取训练样本图像和所述训练样本图像对应的训练分类标签,其中,所述训练分类标签为所述训练样本图像对应的多个分类标签中的部分分类标签;
概率获取模块,用于将所述训练样本图像输入分类网络,获取所述分类网络输出的多个预设分类标签中的每个预设分类标签的概率;
损失信息获取模块,用于基于所述训练分类标签和所述每个预设分类标签的概率,确定所述分类网络的损失信息;
图像分类模型获得模块,用于基于所述损失信息对所述分类网络迭代训练,获得图像分类模型,其中,所述图像分类模型用于确定待分类图像对应的多个分类标签。
10.一种电子设备,其特征在于,包括存储器和处理器,所述存储器耦接到所述处理器,所述存储器存储指令,当所述指令由所述处理器执行时所述处理器执行如权利要求1-8任一项所述的方法。
11.一种计算机可读取存储介质,其特征在于,所述计算机可读取存储介质中存储有程序代码,所述程序代码可被处理器调用执行如权利要求1-8任一项所述的方法。
CN202011339875.6A 2020-11-25 2020-11-25 图像分类模型的训练方法、装置、电子设备以及存储介质 Pending CN112418327A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011339875.6A CN112418327A (zh) 2020-11-25 2020-11-25 图像分类模型的训练方法、装置、电子设备以及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011339875.6A CN112418327A (zh) 2020-11-25 2020-11-25 图像分类模型的训练方法、装置、电子设备以及存储介质

Publications (1)

Publication Number Publication Date
CN112418327A true CN112418327A (zh) 2021-02-26

Family

ID=74842335

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011339875.6A Pending CN112418327A (zh) 2020-11-25 2020-11-25 图像分类模型的训练方法、装置、电子设备以及存储介质

Country Status (1)

Country Link
CN (1) CN112418327A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112906811A (zh) * 2021-03-09 2021-06-04 西安电子科技大学 基于物联网架构的工程车载设备图像自动分类方法
CN113096249A (zh) * 2021-03-30 2021-07-09 Oppo广东移动通信有限公司 训练顶点重建模型的方法、图像重建方法及电子设备
CN113222050A (zh) * 2021-05-26 2021-08-06 北京有竹居网络技术有限公司 图像分类方法、装置、可读介质及电子设备
CN115618964A (zh) * 2022-10-26 2023-01-17 支付宝(杭州)信息技术有限公司 一种模型训练的方法、装置、存储介质及电子设备

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160140451A1 (en) * 2014-11-17 2016-05-19 Yahoo! Inc. System and method for large-scale multi-label learning using incomplete label assignments
CN107463953A (zh) * 2017-07-21 2017-12-12 上海交通大学 在标签含噪情况下基于质量嵌入的图像分类方法及系统
CN110458245A (zh) * 2019-08-20 2019-11-15 图谱未来(南京)人工智能研究院有限公司 一种多标签分类模型训练方法、数据处理方法及装置
CN110472665A (zh) * 2019-07-17 2019-11-19 新华三大数据技术有限公司 模型训练方法、文本分类方法及相关装置
CN110490221A (zh) * 2019-07-05 2019-11-22 平安科技(深圳)有限公司 多标签分类方法、电子装置及计算机可读存储介质
CN110837869A (zh) * 2019-11-11 2020-02-25 深圳市商汤科技有限公司 图像分类模型训练方法、图像处理方法及装置
US20200160177A1 (en) * 2018-11-16 2020-05-21 Royal Bank Of Canada System and method for a convolutional neural network for multi-label classification with partial annotations

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160140451A1 (en) * 2014-11-17 2016-05-19 Yahoo! Inc. System and method for large-scale multi-label learning using incomplete label assignments
CN107463953A (zh) * 2017-07-21 2017-12-12 上海交通大学 在标签含噪情况下基于质量嵌入的图像分类方法及系统
US20200160177A1 (en) * 2018-11-16 2020-05-21 Royal Bank Of Canada System and method for a convolutional neural network for multi-label classification with partial annotations
CN110490221A (zh) * 2019-07-05 2019-11-22 平安科技(深圳)有限公司 多标签分类方法、电子装置及计算机可读存储介质
CN110472665A (zh) * 2019-07-17 2019-11-19 新华三大数据技术有限公司 模型训练方法、文本分类方法及相关装置
CN110458245A (zh) * 2019-08-20 2019-11-15 图谱未来(南京)人工智能研究院有限公司 一种多标签分类模型训练方法、数据处理方法及装置
CN110837869A (zh) * 2019-11-11 2020-02-25 深圳市商汤科技有限公司 图像分类模型训练方法、图像处理方法及装置

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112906811A (zh) * 2021-03-09 2021-06-04 西安电子科技大学 基于物联网架构的工程车载设备图像自动分类方法
CN112906811B (zh) * 2021-03-09 2023-04-18 西安电子科技大学 基于物联网架构的工程车载设备图像自动分类方法
CN113096249A (zh) * 2021-03-30 2021-07-09 Oppo广东移动通信有限公司 训练顶点重建模型的方法、图像重建方法及电子设备
CN113096249B (zh) * 2021-03-30 2023-02-17 Oppo广东移动通信有限公司 训练顶点重建模型的方法、图像重建方法及电子设备
CN113222050A (zh) * 2021-05-26 2021-08-06 北京有竹居网络技术有限公司 图像分类方法、装置、可读介质及电子设备
CN113222050B (zh) * 2021-05-26 2024-05-03 北京有竹居网络技术有限公司 图像分类方法、装置、可读介质及电子设备
CN115618964A (zh) * 2022-10-26 2023-01-17 支付宝(杭州)信息技术有限公司 一种模型训练的方法、装置、存储介质及电子设备
CN115618964B (zh) * 2022-10-26 2023-10-24 支付宝(杭州)信息技术有限公司 一种模型训练的方法、装置、存储介质及电子设备

Similar Documents

Publication Publication Date Title
WO2021169723A1 (zh) 图像识别方法、装置、电子设备及存储介质
WO2022033150A1 (zh) 图像识别方法、装置、电子设备及存储介质
CN109241880B (zh) 图像处理方法、图像处理装置、计算机可读存储介质
WO2019100724A1 (zh) 训练多标签分类模型的方法和装置
WO2019100723A1 (zh) 训练多标签分类模型的方法和装置
CN106355170B (zh) 照片分类方法及装置
CN112418327A (zh) 图像分类模型的训练方法、装置、电子设备以及存储介质
WO2020228446A1 (zh) 模型训练方法、装置、终端及存储介质
CN109117781B (zh) 多属性识别模型的建立方法、装置及多属性识别方法
CN107169148B (zh) 图像搜索方法、装置、设备以及存储介质
CN112651438A (zh) 多类别图像的分类方法、装置、终端设备和存储介质
CN111209970B (zh) 视频分类方法、装置、存储介质及服务器
CN106611015B (zh) 标签的处理方法及装置
CN114463586A (zh) 图像识别模型的训练与图像识别方法、装置、设备和介质
WO2022121485A1 (zh) 图像的多标签分类方法、装置、计算机设备及存储介质
US20210089825A1 (en) Systems and methods for cleaning data
CN114612728A (zh) 模型训练方法、装置、计算机设备及存储介质
CN116168119B (zh) 图像编辑方法、装置、电子设备、存储介质及程序产品
WO2023124278A1 (zh) 图像处理模型的训练方法、图像分类方法及装置
CN111814913A (zh) 图像分类模型的训练方法、装置、电子设备及存储介质
CN113743426A (zh) 一种训练方法、装置、设备以及计算机可读存储介质
CN113902944A (zh) 模型的训练及场景识别方法、装置、设备及介质
CN109963072B (zh) 对焦方法、装置、存储介质及电子设备
CN113887447A (zh) 对象分类模型的训练方法、对象分类预测方法及装置
CN114898266B (zh) 训练方法、图像处理方法、装置、电子设备以及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination