CN111275120A - 图像识别模型的训练方法及装置、图像识别方法及装置 - Google Patents

图像识别模型的训练方法及装置、图像识别方法及装置 Download PDF

Info

Publication number
CN111275120A
CN111275120A CN202010075299.2A CN202010075299A CN111275120A CN 111275120 A CN111275120 A CN 111275120A CN 202010075299 A CN202010075299 A CN 202010075299A CN 111275120 A CN111275120 A CN 111275120A
Authority
CN
China
Prior art keywords
image recognition
recognition model
trained
convolutional neural
neural network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010075299.2A
Other languages
English (en)
Other versions
CN111275120B (zh
Inventor
杨新星
李龙飞
周俊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alipay Hangzhou Information Technology Co Ltd
Original Assignee
Alipay Hangzhou Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alipay Hangzhou Information Technology Co Ltd filed Critical Alipay Hangzhou Information Technology Co Ltd
Priority to CN202010075299.2A priority Critical patent/CN111275120B/zh
Publication of CN111275120A publication Critical patent/CN111275120A/zh
Application granted granted Critical
Publication of CN111275120B publication Critical patent/CN111275120B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

本说明书实施例公开了一种图像识别模型的训练方法及装置、图像识别方法及装置。其中,训练方法包括:将待训练的第二图像识别模型中的每层卷积神经网络,分别与训练完的第一图像识别模型中的一个子网络相对应。根据训练完的第一图像识别模型中每个子网络的输入和输出,对待训练的第二图像识别模型中的每层卷积神经网络的参数进行初始化处理。将样本图像输入参数初始化处理后的待训练的第二图像识别模型,根据待训练的第二图像识别模型的输出和样本图像的标签,对待训练的第二图像识别模型进行训练。由此,实现了根据训练完的第一图像识别模型,对待训练的第二图像识别模型进行参数初始化处理,以加快对待训练的第二图像识别模型进行的训练。

Description

图像识别模型的训练方法及装置、图像识别方法及装置
【技术领域】
本说明书涉及图像识别技术领域,尤其涉及一种图像识别模型的训练方法及装置、图像识别方法及装置。
【背景技术】
在图像识别技术领域,通常使用训练后的图像识别模型,对待识别图像进行识别,得到识别结果。随着图像识别模型的识别准确度的不断提升,图像识别模型的结构变得越来越复杂,图像识别模型在训练和使用时占用的时间和硬件资源越来越多,不适于在硬件资源较少的终端设备上实现。
相关技术中,通过简化图像识别模型结构的方式,来降低图像识别模型在训练和使用时占用的时间和硬件资源,但却降低了图像识别模型的识别准确度,无法满足使用需求。
【发明内容】
本说明书实施例旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本说明书实施例的第一个目的在于提出一种图像识别模型的训练方法,根据训练完的第一图像识别模型,对待训练的第二图像识别模型进行参数初始化处理,以加快对待训练的第二图像识别模型进行的训练。
本说明书实施例的第二个目的在于提出一种图像识别方法。
本说明书实施例的第三个目的在于提出一种图像识别模型的训练装置。
本说明书实施例的第四个目的在于提出一种图像识别装置。
本说明书实施例的第五个目的在于提出一种计算机设备。
本说明书实施例的第六个目的在于提出一种计算机设备。
本说明书实施例的第七个目的在于提出一种非临时性计算机可读存储介质。
本说明书实施例的第八个目的在于提出一种非临时性计算机可读存储介质。
为达上述目的,本说明书实施例第一方面实施例提出了一种图像识别模型的训练方法,包括:获取带标签的样本图像;将所述样本图像输入训练完的第一图像识别模型;其中,所述训练完的第一图像识别模型包括M个子网络,M为正整数,每个所述子网络包括至少一层卷积神经网络;将待训练的第二图像识别模型中的每层卷积神经网络,分别与所述训练完的第一图像识别模型中的一个所述子网络相对应;其中,所述待训练的第二图像识别模型包括M层所述卷积神经网络;根据所述训练完的第一图像识别模型中的每个所述子网络的输入和输出,对所述待训练的第二图像识别模型中的每层所述卷积神经网络的参数进行初始化处理;将所述样本图像输入参数初始化处理后的所述待训练的第二图像识别模型;根据所述待训练的第二图像识别模型的输出和所述样本图像的标签,对所述待训练的第二图像识别模型进行训练;以及当满足预设条件时,完成对所述待训练的第二图像识别模型的训练。
和现有技术相比,本说明书实施例将待训练的第二图像识别模型中的每层卷积神经网络,分别与训练完的第一图像识别模型中的一个子网络相对应,根据训练完的第一图像识别模型中的每个子网络的输入和输出,对待训练的第二图像识别模型中的每层卷积神经网络的参数进行初始化处理,以加快对待训练的第二图像识别模型进行的训练。
另外,本说明书实施例的图像识别模型的训练方法,还具有如下附加的技术特征:
可选地,所述根据所述训练完的第一图像识别模型中的每个所述子网络的输入和输出,对所述待训练的第二图像识别模型中的每层所述卷积神经网络的参数进行初始化处理,包括:获取所述训练完的第一图像识别模型中的所述子网络的输入向量和输出向量;将所述训练完的第一图像识别模型中的所述子网络的输入向量,输入所述待训练的第二图像识别模型中对应的所述卷积神经网络;根据所述待训练的第二图像识别模型中对应的所述卷积神经网络的输出向量,和所述训练完的第一图像识别模型中的所述子网络的输出向量,对所述待训练的第二图像识别模型中对应的所述卷积神经网络的参数进行调整;当所述待训练的第二图像识别模型中对应的所述卷积神经网络的输出向量,和所述训练完的第一图像识别模型中的所述子网络的输出向量之间的相似度最小时,完成对所述待训练的第二图像识别模型中的所述卷积神经网络的参数的初始化处理。
可选地,在所述将所述训练完的第一图像识别模型中的所述子网络的输入向量,输入所述待训练的第二图像识别模型中对应的所述卷积神经网络之前,还包括:比较所述待训练的第二图像识别模型中对应的所述卷积神经网络的参数矩阵的行数,和所述训练完的第一图像识别模型中的所述子网络的输入向量的维数的大小关系;当所述待训练的第二图像识别模型中对应的所述卷积神经网络的参数矩阵的行数,小于所述训练完的第一图像识别模型中的所述子网络的输入向量的维数时,使用预设数值对所述待训练的第二图像识别模型中对应的所述卷积神经网络的参数矩阵进行填充。
可选地,在所述将所述训练完的第一图像识别模型中的所述子网络的输入向量,输入所述待训练的第二图像识别模型中对应的所述卷积神经网络之前,还包括:比较所述待训练的第二图像识别模型中对应的所述卷积神经网络的参数矩阵的列数,和所述训练完的第一图像识别模型中的所述子网络的输出向量的维数的大小关系;当所述待训练的第二图像识别模型中对应的所述卷积神经网络的参数矩阵的列数,小于所述训练完的第一图像识别模型中的所述子网络的输出向量的维数时,使用预设数值对所述待训练的第二图像识别模型中对应的所述卷积神经网络的参数矩阵进行填充。
本说明书实施例第二方面实施例提出了一种图像识别方法,包括:获取待识别图像;将所述待识别图像输入如前述训练方法训练后的第三图像识别模型中;以及根据所述训练后的第三图像识别模型的输出,生成所述待识别图像的识别结果。
本说明书实施例第三方面实施例提出了一种图像识别模型的训练装置,包括:第一获取模块,用于获取带标签的样本图像;第一输入模块,用于将所述样本图像输入所述训练完的第一图像识别模型;其中,所述训练完的第一图像识别模型包括M个子网络,M为正整数,每个所述子网络包括至少一层卷积神经网络;对应模块,用于将待训练的第二图像识别模型中的每层卷积神经网络,分别与所述训练完的第一图像识别模型中的一个所述子网络相对应;其中,所述待训练的第二图像识别模型包括M层所述卷积神经网络;处理模块,用于根据所述训练完的第一图像识别模型中的每个所述子网络的输入和输出,对所述待训练的第二图像识别模型中的每层所述卷积神经网络的参数进行初始化处理;第二输入模块,用于将所述样本图像输入参数初始化处理后的所述待训练的第二图像识别模型;训练模块,用于根据所述待训练的第二图像识别模型的输出和所述样本图像的标签,对所述待训练的第二图像识别模型进行训练;以及完成模块,用于当满足预设条件时,完成对所述待训练的第二图像识别模型的训练。
另外,本说明书实施例的图像识别模型的训练装置,还具有如下附加的技术特征:
可选地,所述处理模块,包括:获取子模块,用于获取所述训练完的第一图像识别模型中的所述子网络的输入向量和输出向量;输入子模块,用于将所述训练完的第一图像识别模型中的所述子网络的输入向量,输入所述待训练的第二图像识别模型中对应的所述卷积神经网络;调整子模块,用于根据所述待训练的第二图像识别模型中对应的所述卷积神经网络的输出向量,和所述训练完的第一图像识别模型中的所述子网络的输出向量,对所述待训练的第二图像识别模型中对应的所述卷积神经网络的参数进行调整;完成子模块,用于当所述待训练的第二图像识别模型中对应的所述卷积神经网络的输出向量,和所述训练完的第一图像识别模型中的所述子网络的输出向量之间的相似度最小时,完成对所述待训练的第二图像识别模型中的所述卷积神经网络的参数的初始化处理。
可选地,所述处理模块,还包括:第一比较子模块,用于比较所述待训练的第二图像识别模型中对应的所述卷积神经网络的参数矩阵的行数,和所述训练完的第一图像识别模型中的所述子网络的输入向量的维数的大小关系;第一填充子模块,用于当所述待训练的第二图像识别模型中对应的所述卷积神经网络的参数矩阵的行数,小于所述训练完的第一图像识别模型中的所述子网络的输入向量的维数时,使用预设数值对所述待训练的第二图像识别模型中对应的所述卷积神经网络的参数矩阵进行填充。
可选地,所述处理模块,还包括:第二比较子模块,用于比较所述待训练的第二图像识别模型中对应的所述卷积神经网络的参数矩阵的列数,和所述训练完的第一图像识别模型中的所述子网络的输出向量的维数的大小关系;第二填充子模块,用于当所述待训练的第二图像识别模型中对应的所述卷积神经网络的参数矩阵的列数,小于所述训练完的第一图像识别模型中的所述子网络的输出向量的维数时,使用预设数值对所述待训练的第二图像识别模型中对应的所述卷积神经网络的参数矩阵进行填充。
本说明书实施例第四方面实施例提出了一种图像识别装置,包括:第二获取模块,用于获取待识别图像;第三输入模块,用于将所述待识别图像输入如前述训练装置训练后的第三图像识别模型中;以及生成模块,用于根据所述训练后的第三图像识别模型的输出,生成所述待识别图像的识别结果。
本说明书实施例第五方面实施例提出了一种计算机设备,包括存储器和处理器;所述存储器上存储有可由处理器运行的计算机程序;所述处理器运行所述计算机程序时,执行如前述方法实施例所述的图像识别模型的训练方法。
本说明书实施例第六方面实施例提出了一种计算机设备,包括存储器和处理器;所述存储器上存储有可由处理器运行的计算机程序;所述处理器运行所述计算机程序时,执行如前述方法实施例所述的图像识别方法。
本说明书实施例第七方面实施例提出了一种非临时性计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如前述方法实施例所述的图像识别模型的训练方法。
本说明书实施例第八方面实施例提出了一种非临时性计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如前述方法实施例所述的图像识别方法。
本说明书实施例附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本说明书实施例的实践了解到。
【附图说明】
为了更清楚地说明本说明书实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
图1为本说明书实施例所提出的一种图像识别模型的训练方法的流程示意图;
图2为本说明书实施例所提出的待训练的第二图像识别模型和训练完的第一图像识别模型相对应的一个示例的示意图;
图3a为本说明书实施例对待训练的第二图像识别模型中的卷积神经网络的参数矩阵进行填充的一个示例的示意图;
图3b为本说明书实施例对待训练的第二图像识别模型中的卷积神经网络的参数矩阵进行填充的另一个示例的示意图;
图4为本说明书实施例所提出的另一种图像识别模型的训练方法的流程示意图;
图5为本说明书实施例所提出的一种图像识别方法的流程示意图;
图6为本说明书实施例所提出的一种图像识别模型的训练装置的结构示意图;
图7为本说明书实施例所提出的另一种图像识别模型的训练装置的结构示意图;以及
图8为本说明书实施例所提出的一种图像识别装置的结构示意图。
【具体实施方式】
下面详细描述本说明书的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本说明书实施例,而不能理解为对本说明书实施例的限制。
下面参考附图描述本说明书实施例的图像识别模型的训练方法及装置、图像识别方法及装置。
基于上述背景技术的说明,可以知道,相关技术中,通过简化图像识别模型结构的方式,来降低图像识别模型在训练和使用时占用的时间和硬件资源,但却降低了图像识别模型的识别准确度,无法满足使用需求。
针对这一问题,本说明书实施例提出了一种图像识别模型的训练方法,根据训练完的第一图像识别模型,对待训练的第二图像识别模型进行参数初始化处理,以加快对待训练的第二图像识别模型进行的训练。
需要说明的是,训练完的第一图像识别模型是背景技术中提到的结构复杂的图像识别模型,训练完的第一图像识别模型识别准确度很高,但是使用该图像识别模型却需要占用很大的资源。待训练的第二图像识别模型是背景技术中提到的结构简单的图像识别模型,该图像识别模型只需占用很少的资源。
图1为本说明书实施例所提出的一种图像识别模型的训练方法的流程示意图。如图1所示,该方法包括以下步骤:
步骤S101,获取带标签的样本图像。
其中,样本图像的标签就是样本图像的正确识别结果,因此样本图像和样本图像的标签能够用于训练待训练的第二图像识别模型,使得训练后的第二图像识别模型能够对待识别图像进行识别。
步骤S103,将样本图像输入训练完的第一图像识别模型。
其中,训练完的第一图像识别模型包括M个子网络,M为正整数,每个子网络包括至少一层卷积神经网络。
可以理解,为了加快对待训练的第二图像识别模型的训练,本说明书实施例借助训练完的第一图像识别模型来对待训练的第二图像识别模型进行参数初始化,使得待训练的第二图像识别模型在使用样本图像进行训练之前,就具有较好的识别准确度,在之后的训练过程中,识别准确度能够较快地超过预设阈值,完成训练。
需要说明的是,本说明书实施例为了获取训练完的第一图像识别模型中每个子网络的输入和输出,将样本图像输入训练完的第一图像识别模型,从而确定每个子网络的输入和输出。
步骤S105,将待训练的第二图像识别模型中的每层卷积神经网络,分别与训练完的第一图像识别模型中的一个子网络相对应。
其中,待训练的第二图像识别模型包括M层卷积神经网络。
基于前述说明,可以知道,训练完的第一图像识别模型的结构,比待训练的第二图像识别模型复杂,而两个图像识别模型都包括多层卷积神经网络,也就是说,训练完的第一图像识别模型中卷积神经网络的层数,大于或者等于待训练的第二图像识别模型中卷积神经网络的层数。
当待训练的第二图像识别模型包括M层卷积神经网络时,训练完的第一图像识别模型包括至少M层卷积神经网络。本说明书实施例将训练完的第一图像识别模型所包括的至少M层卷积神经网络进行划分,具体划分为M个子网络,使得训练完的第一图像识别模型所包括的M个子网络,分别与待训练的第二图像识别模型所包括的M层卷积神经网络一一对应。
可以理解,由于训练完的第一图像识别模型包括至少M层卷积神经网络,因此每个子网络包括至少一层卷积神经网络。
为了便于说明训练完的第一图像识别模型中的子网络与待训练的第二图像识别模型中的卷积神经网络的关系,下面进行举例说明。图2为本说明书实施例所提出的待训练的第二图像识别模型和训练完的第一图像识别模型相对应的一个示例的示意图。
如图2所示,训练完的第一图像识别模型包括九层卷积神经网络,待训练的第二图像识别模型包括六层卷积神经网络。对训练完的第一图像识别模型中的九层卷积神经网络进行划分,得到六个子网络,第一个子网络包括第一层网络和第二层网络,第二个子网络包括第三层网络,第三个子网络包括第四层网络和第五层网络,第四个子网络包括第六层网络,第五个子网络包括第七层网络,第六个子网络包括第八层网络和第九层网络。将每个子网络分别与待训练的第二图像识别模型中的一层卷积神经网络相对应。
步骤S107,根据训练完的第一图像识别模型中的每个子网络的输入和输出,对待训练的第二图像识别模型中的每层卷积神经网络的参数进行初始化处理。
基于前述步骤,对训练完的第一图像识别模型进行划分,得到与待训练的第二图像识别模型中的多层卷积神经网络相对应的多个子网络。
可以理解,为了让待训练的第二图像识别模型的识别准确度接近于训练完的第一图像识别模型,本说明书实施例通过让待训练的第二图像识别模型中的每层卷积神经网络的输入和输出,与训练完的第一图像识别模型中对应的子网络的输入和输出相近似的方式,来对待训练的第二图像识别模型中的每层卷积神经网络的参数进行初始化处理。
为了实现对待训练的第二图像识别模型中的每层卷积神经网络的参数进行初始化处理,本说明书实施例提出了一种可能的实现方式,步骤S107,根据训练完的第一图像识别模型中的每个子网络的输入和输出,对待训练的第二图像识别模型中的每层卷积神经网络的参数进行初始化处理,包括:
步骤S11,获取训练完的第一图像识别模型中的子网络的输入向量和输出向量。
应当理解,第一图像识别模型中的子网络的输入和输出都是向量的形式。
步骤S12,将训练完的第一图像识别模型中的子网络的输入向量,输入待训练的第二图像识别模型中对应的卷积神经网络。
步骤S13,根据待训练的第二图像识别模型中对应的卷积神经网络的输出向量,和训练完的第一图像识别模型中的子网络的输出向量,对待训练的第二图像识别模型中对应的卷积神经网络的参数进行调整。
基于前述说明,可以知道,本说明书实施例通过对待训练的第二图像识别模型的卷积神经网络的参数进行调整,以使待训练的第二图像识别模型的卷积神经网络,与训练完的第一图像识别模型中对应的子网络,在输入向量相同时,输出向量相近似。
因此,本说明书实施例将训练完的第一图像识别模型中的子网络的输入向量,输入待训练的第二图像识别模型中对应的卷积神经网络,再对训练完的第一图像识别模型中的子网络的输出向量,和待训练的第二图像识别模型中对应的卷积神经网络的输出向量进行相似度计算,根据计算结果,对待训练的第二图像识别模型中对应的卷积神经网络的参数进行调整。
步骤S14,当待训练的第二图像识别模型中对应的卷积神经网络的输出向量,和训练完的第一图像识别模型中的子网络的输出向量之间的相似度最小时,完成对待训练的第二图像识别模型中的卷积神经网络的参数的初始化处理。
具体来说,可以使用梯度下降法,确定待训练的第二图像识别模型中对应的卷积神经网络的输出向量,和训练完的第一图像识别模型中的子网络的输出向量之间的相似度的最小值点,进而确定待训练的第二图像识别模型中的卷积神经网络的初始化参数。
基于前述说明,可以知道,待训练的第二图像识别模型的结构简单,而训练完的第一图像识别模型的结构复杂,一方面,训练完的第一图像识别模型中所包括的卷积神经网络的层数,大于或者等于待训练的第二图像识别模型中所包括的卷积神经网络的层数。另一方面,训练完的第一图像识别模型中的子网络的输入向量(或者输出向量)的维度,大于或者等于待训练的第二图像识别模型中对应的卷积神经网络的输入向量(或者输出向量)的维度。
为了更加清楚地说明本说明书实施例是如何将训练完的第一图像识别模型中的子网络的输入向量,输入待训练的第二图像识别模型中对应的卷积神经网络的,下面进行举例说明。
图3a为本说明书实施例对待训练的第二图像识别模型中的卷积神经网络的参数矩阵进行填充的一个示例的示意图。
如图3a所示,训练完的第一图像识别模型中的子网络的输入向量的维度为4,输出向量的维度为3,待训练的第二图像识别模型中的卷积神经网络的输入向量的维度为3,输出向量的维度也为3。因此,需要对待训练的第二图像识别模型中的卷积神经网络进行填充,以使待训练的第二图像识别模型中的卷积神经网络能够输入维度为4的输入向量,具体可以通过增加神经元的方式来实现,并在参数初始化完成后,将增加的神经元进行删除。
具体来说,将输入向量输入训练完的第一图像识别模型中的子网络,得到输出向量的过程,可以用公式Y[1×3]=X[1×4]W[4×3]来表示。而将输入向量输入待训练的第二图像识别模型中的卷积神经网络的过程,可以用公式Y′[1×3]=X′[1×3]W′[3×3]来表示。为了让维数为4的输入向量X[1×4]能够与参数矩阵W′[3×3]进行计算,需要使用预设数值对参数矩阵W′[3×3]进行填充,变为参数矩阵W′[4×3],从而将公式Y′[1×3]=X′[1×3]W′[3×3],变为Y′[1×3]=X[1×4]W′[4×3],通过计算Y[1×3]和Y′[1×3]的相似度,对参数矩阵W′[4×3]中的参数进行调整。
需要特别说明的是,用于填充的预设数值在参数调整的过程中始终保持不变,并在参数调整完成后,从参数矩阵W′[4×3]中剔除,变回参数矩阵W′[3×3]
图3b为本说明书实施例对待训练的第二图像识别模型中的卷积神经网络的参数矩阵进行填充的另一个示例的示意图。
如图3b所示,训练完的第一图像识别模型中的子网络的输入向量的维度为3,输出向量的维度为4,待训练的第二图像识别模型中的卷积神经网络的输入向量的维度为3,输出向量的维度也为3。因此,需要对待训练的第二图像识别模型中的卷积神经网络进行填充,以使待训练的第二图像识别模型中的卷积神经网络能够输出维度为4的输出向量,具体可以通过增加神经元的方式来实现,并在参数初始化完成后,将增加的神经元进行删除。
具体来说,将输入向量输入训练完的第一图像识别模型中的子网络,得到输出向量的过程,可以用公式Y[1×4]=X[1×3]W[3×4]来表示。而将输入向量输入待训练的第二图像识别模型中的卷积神经网络的过程,可以用公式Y′[1×3]=X′[1×3]W′[3×3]来表示。为了让参数矩阵W′[3×3]能够输出维数为4的输出向量Y′[1×4],需要使用预设数值对参数矩阵W′[3×3]进行填充,变为参数矩阵W′[3×4],从而将公式Y′[1×3]=X′[1×3]W′[3×3],变为Y′[1×4]=X[1×3]W′[3×4],通过计算Y[1×4]和Y′[1×4]的相似度,对参数矩阵W′[3×4]中的参数进行调整。
需要特别说明的是,用于填充的预设数值在参数调整的过程中始终保持不变,并在参数调整完成后,从参数矩阵W′[3×4]中剔除,变回参数矩阵W′[3×3]
从上述例子中,可以看出,对于第一种情况,在步骤S12,将训练完的第一图像识别模型中的子网络的输入向量,输入待训练的第二图像识别模型中对应的卷积神经网络之前,还包括:比较待训练的第二图像识别模型中对应的卷积神经网络的参数矩阵的行数,和训练完的第一图像识别模型中的子网络的输入向量的维数的大小关系。当待训练的第二图像识别模型中对应的卷积神经网络的参数矩阵的行数,小于训练完的第一图像识别模型中的子网络的输入向量的维数时,使用预设数值对待训练的第二图像识别模型中对应的卷积神经网络的参数矩阵进行填充。
对于第二种情况,在步骤S21,将训练完的第一图像识别模型中的子网络的输入向量,输入待训练的第二图像识别模型中对应的卷积神经网络之前,还包括:比较待训练的第二图像识别模型中对应的卷积神经网络的参数矩阵的列数,和训练完的第一图像识别模型中的子网络的输出向量的维数的大小关系。当待训练的第二图像识别模型中对应的卷积神经网络的参数矩阵的列数,小于训练完的第一图像识别模型中的子网络的输出向量的维数时,使用预设数值对待训练的第二图像识别模型中对应的卷积神经网络的参数矩阵进行填充。
步骤S109,将样本图像输入参数初始化处理后的待训练的第二图像识别模型。
应当理解,虽然待训练的第二图像识别模型借助训练完的第一图像识别模型,实现了参数的初始化处理,但还无法满足使用需求,因此本说明书实施例还需要使用样本图像,以及样本图像的标签,对待训练的第二图像识别模型进行训练。
需要特别说明的是,用于训练第二图像识别模型的样本图像可以有多个,相应地,样本图像的标签也有多个,在训练待训练的第二图像识别模型时,需要依次将多个样本图像输入待训练的第二图像识别模型。
步骤S111,根据待训练的第二图像识别模型的输出和样本图像的标签,对待训练的第二图像识别模型进行训练。
应当理解,在待训练的第二图像识别模型的训练过程中,首先对待训练的第二图像识别模型的参数设定初始值,即进行参数初始化处理,然后将样本图像输入待训练的第二图像识别模型中,得到第二图像识别模型的输出。
需要说明的是,样本图像的标签是样本图像的正确识别结果,当待训练的第二图像识别模型的输出与样本图像的标签相同时,说明待训练的第二图像识别模型的识别准确。当待训练的第二图像识别模型的输出与样本图像的标签不同时,说明待训练的第二图像识别模型的识别不准确,需要对待训练的第二图像识别模型的参数进行调整和优化,使得待训练的第二图像识别模型的输出与样本图像的标签相同。
然后将下一个样本图像输入参数调整和优化后的第二图像识别模型,得到对应的输出,将该样本图像的标签,与该样本图像对应的输出进行比较,根据比较结果,对第二图像识别模型的参数进行再次调整和优化,使得第二图像识别模型的输出与样本图像的标签相同。
不断地使用样本图像和样本图像的标签对第二图像识别模型进行训练,使得第二图像识别模型的识别准确度不断增加。
步骤S113,当满足预设条件时,完成对待训练的第二图像识别模型的训练。
其中,预设条件可以是待训练的第二图像识别模型的识别准确度超过预设阈值,还可以是待训练的第二图像识别模型的训练次数超过预设次数,也可以是输入待训练的第二图像识别模型的样本图像的数量超过预设个数,本说明书实施例对此不做限定。
需要说明的是,对待训练的第二图像识别模型的训练次数越多,识别准确度越高,但是随着训练的进行,对识别准确度的提升越来越少。综合考虑训练消耗的时间和资源,以及使用需求,当待训练的第二图像识别模型的识别准确度超过预设阈值时,即完成对待训练的第二图像识别模型的训练。此时,待训练的第二图像识别模型已经能够对绝大部分的待识别图像进行准确识别,满足使用需求。
综上所述,本说明书实施例所提出的一种图像识别模型的训练方法,包括:获取带标签的样本图像,将样本图像输入训练完的第一图像识别模型,其中,训练完的第一图像识别模型包括M个子网络,M为正整数,每个子网络包括至少一层卷积神经网络。将待训练的第二图像识别模型中的每层卷积神经网络,分别与训练完的第一图像识别模型中的一个子网络相对应,其中,待训练的第二图像识别模型包括M层卷积神经网络。根据训练完的第一图像识别模型中的每个子网络的输入和输出,对待训练的第二图像识别模型中的每层卷积神经网络的参数进行初始化处理。将样本图像输入参数初始化处理后的待训练的第二图像识别模型,根据待训练的第二图像识别模型的输出和样本图像的标签,对待训练的第二图像识别模型进行训练。当满足预设条件时,完成对待训练的第二图像识别模型的训练。从而,实现了将待训练的第二图像识别模型中的每层卷积神经网络,分别与训练完的第一图像识别模型中的一个子网络相对应,根据训练完的第一图像识别模型中的每个子网络的输入和输出,对待训练的第二图像识别模型中的每层卷积神经网络的参数进行初始化处理,以加快对待训练的第二图像识别模型进行的训练。
为了更加清楚地说明本说明书实施例所提出的图像识别模型的训练方法,本说明书实施例还提出了另一种图像识别模型的训练方法,图4为本说明书实施例所提出的另一种图像识别模型的训练方法的流程示意图。如图4所示,该方法包括以下步骤:
步骤S201,获取带标签的样本图像。
步骤S203,将样本图像输入训练完的第一图像识别模型。
其中,训练完的第一图像识别模型包括M个子网络,M为正整数,每个子网络包括至少一层卷积神经网络。
步骤S205,将待训练的第二图像识别模型中的每层卷积神经网络,分别与训练完的第一图像识别模型中的一个子网络相对应。
其中,待训练的第二图像识别模型包括M层卷积神经网络。
步骤S207,获取训练完的第一图像识别模型中的子网络的输入向量和输出向量。
步骤S209,比较待训练的第二图像识别模型中对应的卷积神经网络的参数矩阵的行数,和训练完的第一图像识别模型中的子网络的输入向量的维数的大小关系。
步骤S211,当待训练的第二图像识别模型中对应的卷积神经网络的参数矩阵的行数,小于训练完的第一图像识别模型中的子网络的输入向量的维数时,使用预设数值对待训练的第二图像识别模型中对应的卷积神经网络的参数矩阵进行填充。
步骤S213,比较待训练的第二图像识别模型中对应的卷积神经网络的参数矩阵的列数,和训练完的第一图像识别模型中的子网络的输出向量的维数的大小关系。
步骤S215,当待训练的第二图像识别模型中对应的卷积神经网络的参数矩阵的列数,小于训练完的第一图像识别模型中的子网络的输出向量的维数时,使用预设数值对待训练的第二图像识别模型中对应的卷积神经网络的参数矩阵进行填充。
步骤S217,将训练完的第一图像识别模型中的子网络的输入向量,输入待训练的第二图像识别模型中对应的卷积神经网络。
步骤S219,根据待训练的第二图像识别模型中对应的卷积神经网络的输出向量,和训练完的第一图像识别模型中的子网络的输出向量,对待训练的第二图像识别模型中对应的卷积神经网络的参数进行调整。
步骤S221,当待训练的第二图像识别模型中对应的卷积神经网络的输出向量,和训练完的第一图像识别模型中的子网络的输出向量之间的相似度最小时,完成对待训练的第二图像识别模型中的卷积神经网络的参数的初始化处理。
步骤S223,将样本图像输入参数初始化处理后的待训练的第二图像识别模型。
步骤S225,根据待训练的第二图像识别模型的输出和样本图像的标签,对待训练的第二图像识别模型进行训练。
步骤S227,当满足预设条件时,完成对待训练的第二图像识别模型的训练。
需要说明的是,对前述实施例中步骤S101-步骤S113的解释说明,也适用于本说明书实施例的步骤S201-步骤S227,此处不再赘述。
从而,实现了使用预设数值对待训练的第二图像识别模型中对应的卷积神经网络的参数矩阵进行填充,通过训练完的第一图像识别模型中的子网络的输入向量和输出向量,对待训练的第二图像识别模型中对应的卷积神经网络的参数进行调整。
进一步地,本说明书实施例还提出了一种图像识别方法,图5为本说明书实施例所提出的一种图像识别方法的流程示意图。如图5所示,该方法包括以下步骤:
步骤S301,获取待识别图像。
步骤S303,将待识别图像输入如前述训练方法训练后的第三图像识别模型中。
基于对前述图像识别模型的训练方法实施例的说明,可以知道,前述训练方法中的待训练的第二图像识别模型的结构简单,完成训练后,变为训练后的第三图像识别模型,训练的过程没有改变该图像识别模型的结构,只是对图像识别模型的参数进行了调整,因此第三图像识别模型所占用的资源很少,能够在硬件资源较少的终端设备上使用。
步骤S305,根据训练后的第三图像识别模型的输出,生成待识别图像的识别结果。
综上所述,本说明书实施例所提出的一种图像识别方法,获取待识别图像,将待识别图像输入如前述训练方法训练后的第三图像识别模型中,根据训练后的第三图像识别模型的输出,生成待识别图像的识别结果。由此,实现了利用结构简单的图像识别模型,对待识别图像进行识别,减少了图像识别模型所占用的资源。
为了实现上述实施例,本说明书实施例还提出了一种图像识别模型的训练装置,图6为本说明书实施例所提出的一种图像识别模型的训练装置的结构示意图。如图6所示,该装置包括:第一获取模块410,第一输入模块420,对应模块430,处理模块440,第二输入模块450,训练模块460,完成模块470。
第一获取模块410,用于获取带标签的样本图像。
第一输入模块420,用于将样本图像输入训练完的第一图像识别模型。
其中,训练完的第一图像识别模型包括M个子网络,M为正整数,每个子网络包括至少一层卷积神经网络。
对应模块430,用于将待训练的第二图像识别模型中的每层卷积神经网络,分别与训练完的第一图像识别模型中的一个子网络相对应。
其中,待训练的第二图像识别模型包括M层卷积神经网络。
处理模块440,用于根据训练完的第一图像识别模型中的每个子网络的输入和输出,对待训练的第二图像识别模型中的每层卷积神经网络的参数进行初始化处理。
第二输入模块450,用于将样本图像输入参数初始化处理后的待训练的第二图像识别模型。
训练模块460,用于根据待训练的第二图像识别模型的输出和样本图像的标签,对待训练的第二图像识别模型进行训练。
完成模块470,用于当满足预设条件时,完成对待训练的第二图像识别模型的训练。
需要说明的是,前述对图像识别模型的训练方法实施例的解释说明,也适用于本说明书实施例的图像识别模型的训练装置,此处不再赘述。
综上所述,本说明书实施例所提出的一种图像识别模型的训练装置,在进行图像识别模型的训练时,获取带标签的样本图像,将样本图像输入训练完的第一图像识别模型,其中,训练完的第一图像识别模型包括M个子网络,M为正整数,每个子网络包括至少一层卷积神经网络。将待训练的第二图像识别模型中的每层卷积神经网络,分别与训练完的第一图像识别模型中的一个子网络相对应,其中,待训练的第二图像识别模型包括M层卷积神经网络。根据训练完的第一图像识别模型中的每个子网络的输入和输出,对待训练的第二图像识别模型中的每层卷积神经网络的参数进行初始化处理。将样本图像输入参数初始化处理后的待训练的第二图像识别模型,根据待训练的第二图像识别模型的输出和样本图像的标签,对待训练的第二图像识别模型进行训练。当满足预设条件时,完成对待训练的第二图像识别模型的训练。从而,实现了将待训练的第二图像识别模型中的每层卷积神经网络,分别与训练完的第一图像识别模型中的一个子网络相对应,根据训练完的第一图像识别模型中的每个子网络的输入和输出,对待训练的第二图像识别模型中的每层卷积神经网络的参数进行初始化处理,以加快对待训练的第二图像识别模型进行的训练。
为了实现上述实施例,本说明书实施例还提出了另一种图像识别模型的训练装置,图7为本说明书实施例所提出的另一种图像识别模型的训练装置的结构示意图。如图7所示,该装置包括:第一获取模块510,第一输入模块520,对应模块530,处理模块540,第二输入模块550,训练模块560,完成模块570。
第一获取模块510,用于获取带标签的样本图像。
第一输入模块520,用于将样本图像输入训练完的第一图像识别模型。
其中,训练完的第一图像识别模型包括M个子网络,M为正整数,每个子网络包括至少一层卷积神经网络。
对应模块530,用于将待训练的第二图像识别模型中的每层卷积神经网络,分别与训练完的第一图像识别模型中的一个子网络相对应。
其中,待训练的第二图像识别模型包括M层卷积神经网络。
处理模块540,用于根据训练完的第一图像识别模型中的每个子网络的输入和输出,对待训练的第二图像识别模型中的每层卷积神经网络的参数进行初始化处理。
第二输入模块550,用于将样本图像输入参数初始化处理后的待训练的第二图像识别模型。
训练模块560,用于根据待训练的第二图像识别模型的输出和样本图像的标签,对待训练的第二图像识别模型进行训练。
完成模块570,用于当满足预设条件时,完成对待训练的第二图像识别模型的训练。
其中,处理模块540,包括:获取子模块541,用于获取训练完的第一图像识别模型中的子网络的输入向量和输出向量。输入子模块542,用于将训练完的第一图像识别模型中的子网络的输入向量,输入待训练的第二图像识别模型中对应的卷积神经网络。调整子模块543,用于根据待训练的第二图像识别模型中对应的卷积神经网络的输出向量,和训练完的第一图像识别模型中的子网络的输出向量,对待训练的第二图像识别模型中对应的卷积神经网络的参数进行调整。完成子模块544,用于当待训练的第二图像识别模型中对应的卷积神经网络的输出向量,和训练完的第一图像识别模型中的子网络的输出向量之间的相似度最小时,完成对待训练的第二图像识别模型中的卷积神经网络的参数的初始化处理。
处理模块540,还包括:第一比较子模块545,用于比较待训练的第二图像识别模型中对应的卷积神经网络的参数矩阵的行数,和训练完的第一图像识别模型中的子网络的输入向量的维数的大小关系。第一填充子模块546,用于当待训练的第二图像识别模型中对应的卷积神经网络的参数矩阵的行数,小于训练完的第一图像识别模型中的子网络的输入向量的维数时,使用预设数值对待训练的第二图像识别模型中对应的卷积神经网络的参数矩阵进行填充。
处理模块540,还包括:第二比较子模块547,用于比较待训练的第二图像识别模型中对应的卷积神经网络的参数矩阵的列数,和训练完的第一图像识别模型中的子网络的输出向量的维数的大小关系。第二填充子模块548,用于当待训练的第二图像识别模型中对应的卷积神经网络的参数矩阵的列数,小于训练完的第一图像识别模型中的子网络的输出向量的维数时,使用预设数值对待训练的第二图像识别模型中对应的卷积神经网络的参数矩阵进行填充。
需要说明的是,前述对图像识别模型的训练方法实施例的解释说明,也适用于本说明书实施例的图像识别模型的训练装置,此处不再赘述。
从而,实现了使用预设数值对待训练的第二图像识别模型中对应的卷积神经网络的参数矩阵进行填充,通过训练完的第一图像识别模型中的子网络的输入向量和输出向量,对待训练的第二图像识别模型中对应的卷积神经网络的参数进行调整。
为了实现上述实施例,本说明书实施例还提出了一种图像识别装置,图8为本说明书实施例所提出的一种图像识别装置的结构示意图。如图8所示,该装置包括:第二获取模块610,第三输入模块620,生成模块630。
第二获取模块610,用于获取待识别图像。
第三输入模块620,用于将待识别图像输入前述训练装置训练后的第三图像识别模型中。
生成模块630,用于根据训练后的第三图像识别模型的输出,生成待识别图像的识别结果。
需要说明的是,前述对图像识别方法实施例的解释说明,也适用于本说明书实施例的图像识别装置,此处不再赘述。
综上所述,本说明书实施例所提出的一种图像识别装置,在进行图像识别时,获取待识别图像,将待识别图像输入如前述训练方法训练后的第三图像识别模型中,根据训练后的第三图像识别模型的输出,生成待识别图像的识别结果。由此,实现了利用结构简单的图像识别模型,对待识别图像进行识别,减少了图像识别模型所占用的资源。
为了实现上述实施例,本说明书实施例还提出一种计算机设备,包括存储器和处理器;存储器上存储有可由处理器运行的计算机程序;当处理器运行计算机程序时,执行如前述方法实施例的图像识别模型的训练方法。
为了实现上述实施例,本说明书实施例还提出一种计算机设备,包括存储器和处理器;存储器上存储有可由处理器运行的计算机程序;当处理器运行计算机程序时,执行如前述方法实施例的图像识别方法。
为了实现上述实施例,实施例还提出一种非临时性计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现如前述方法实施例的图像识别模型的训练方法。
为了实现上述实施例,实施例还提出一种非临时性计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现如前述方法实施例的图像识别方法。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本说明书实施例的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
在本说明书实施例中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”、“固定”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系,除非另有明确的限定。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本说明书实施例中的具体含义。
在本说明书实施例中,除非另有明确的规定和限定,第一特征在第二特征“上”或“下”可以是第一和第二特征直接接触,或第一和第二特征通过中间媒介间接接触。而且,第一特征在第二特征“之上”、“上方”和“上面”可是第一特征在第二特征正上方或斜上方,或仅仅表示第一特征水平高度高于第二特征。第一特征在第二特征“之下”、“下方”和“下面”可以是第一特征在第二特征正下方或斜下方,或仅仅表示第一特征水平高度小于第二特征。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本说明书实施例的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims (14)

1.一种图像识别模型的训练方法,包括:
获取带标签的样本图像;
将所述样本图像输入训练完的第一图像识别模型;其中,所述训练完的第一图像识别模型包括M个子网络,M为正整数,每个所述子网络包括至少一层卷积神经网络;
将待训练的第二图像识别模型中的每层卷积神经网络,分别与所述训练完的第一图像识别模型中的一个所述子网络相对应;其中,所述待训练的第二图像识别模型包括M层所述卷积神经网络;
根据所述训练完的第一图像识别模型中的每个所述子网络的输入和输出,对所述待训练的第二图像识别模型中的每层所述卷积神经网络的参数进行初始化处理;
将所述样本图像输入参数初始化处理后的所述待训练的第二图像识别模型;
根据所述待训练的第二图像识别模型的输出和所述样本图像的标签,对所述待训练的第二图像识别模型进行训练;以及
当满足预设条件时,完成对所述待训练的第二图像识别模型的训练。
2.如权利要求1所述的训练方法,其中,所述根据所述训练完的第一图像识别模型中的每个所述子网络的输入和输出,对所述待训练的第二图像识别模型中的每层所述卷积神经网络的参数进行初始化处理,包括:
获取所述训练完的第一图像识别模型中的所述子网络的输入向量和输出向量;
将所述训练完的第一图像识别模型中的所述子网络的输入向量,输入所述待训练的第二图像识别模型中对应的所述卷积神经网络;
根据所述待训练的第二图像识别模型中对应的所述卷积神经网络的输出向量,和所述训练完的第一图像识别模型中的所述子网络的输出向量,对所述待训练的第二图像识别模型中对应的所述卷积神经网络的参数进行调整;
当所述待训练的第二图像识别模型中对应的所述卷积神经网络的输出向量,和所述训练完的第一图像识别模型中的所述子网络的输出向量之间的相似度最小时,完成对所述待训练的第二图像识别模型中的所述卷积神经网络的参数的初始化处理。
3.如权利要求2所述的训练方法,其中,在所述将所述训练完的第一图像识别模型中的所述子网络的输入向量,输入所述待训练的第二图像识别模型中对应的所述卷积神经网络之前,还包括:
比较所述待训练的第二图像识别模型中对应的所述卷积神经网络的参数矩阵的行数,和所述训练完的第一图像识别模型中的所述子网络的输入向量的维数的大小关系;
当所述待训练的第二图像识别模型中对应的所述卷积神经网络的参数矩阵的行数,小于所述训练完的第一图像识别模型中的所述子网络的输入向量的维数时,使用预设数值对所述待训练的第二图像识别模型中对应的所述卷积神经网络的参数矩阵进行填充。
4.如权利要求2所述的训练方法,其中,在所述将所述训练完的第一图像识别模型中的所述子网络的输入向量,输入所述待训练的第二图像识别模型中对应的所述卷积神经网络之前,还包括:
比较所述待训练的第二图像识别模型中对应的所述卷积神经网络的参数矩阵的列数,和所述训练完的第一图像识别模型中的所述子网络的输出向量的维数的大小关系;
当所述待训练的第二图像识别模型中对应的所述卷积神经网络的参数矩阵的列数,小于所述训练完的第一图像识别模型中的所述子网络的输出向量的维数时,使用预设数值对所述待训练的第二图像识别模型中对应的所述卷积神经网络的参数矩阵进行填充。
5.一种图像识别方法,包括:
获取待识别图像;
将所述待识别图像输入如权利要求1-4中任一种训练方法训练后的第三图像识别模型中;以及
根据所述训练后的第三图像识别模型的输出,生成所述待识别图像的识别结果。
6.一种图像识别模型的训练装置,包括:
第一获取模块,用于获取带标签的样本图像;
第一输入模块,用于将所述样本图像输入所述训练完的第一图像识别模型;其中,所述训练完的第一图像识别模型包括M个子网络,M为正整数,每个所述子网络包括至少一层卷积神经网络;
对应模块,用于将待训练的第二图像识别模型中的每层卷积神经网络,分别与所述训练完的第一图像识别模型中的一个所述子网络相对应;其中,所述待训练的第二图像识别模型包括M层所述卷积神经网络;
处理模块,用于根据所述训练完的第一图像识别模型中的每个所述子网络的输入和输出,对所述待训练的第二图像识别模型中的每层所述卷积神经网络的参数进行初始化处理;
第二输入模块,用于将所述样本图像输入参数初始化处理后的所述待训练的第二图像识别模型;
训练模块,用于根据所述待训练的第二图像识别模型的输出和所述样本图像的标签,对所述待训练的第二图像识别模型进行训练;以及
完成模块,用于当满足预设条件时,完成对所述待训练的第二图像识别模型的训练。
7.如权利要求6所述的训练装置,其中,所述处理模块,包括:
获取子模块,用于获取所述训练完的第一图像识别模型中的所述子网络的输入向量和输出向量;
输入子模块,用于将所述训练完的第一图像识别模型中的所述子网络的输入向量,输入所述待训练的第二图像识别模型中对应的所述卷积神经网络;
调整子模块,用于根据所述待训练的第二图像识别模型中对应的所述卷积神经网络的输出向量,和所述训练完的第一图像识别模型中的所述子网络的输出向量,对所述待训练的第二图像识别模型中对应的所述卷积神经网络的参数进行调整;
完成子模块,用于当所述待训练的第二图像识别模型中对应的所述卷积神经网络的输出向量,和所述训练完的第一图像识别模型中的所述子网络的输出向量之间的相似度最小时,完成对所述待训练的第二图像识别模型中的所述卷积神经网络的参数的初始化处理。
8.如权利要求7所述的训练装置,其中,所述处理模块,还包括:
第一比较子模块,用于比较所述待训练的第二图像识别模型中对应的所述卷积神经网络的参数矩阵的行数,和所述训练完的第一图像识别模型中的所述子网络的输入向量的维数的大小关系;
第一填充子模块,用于当所述待训练的第二图像识别模型中对应的所述卷积神经网络的参数矩阵的行数,小于所述训练完的第一图像识别模型中的所述子网络的输入向量的维数时,使用预设数值对所述待训练的第二图像识别模型中对应的所述卷积神经网络的参数矩阵进行填充。
9.如权利要求7所述的训练装置,其中,所述处理模块,还包括:
第二比较子模块,用于比较所述待训练的第二图像识别模型中对应的所述卷积神经网络的参数矩阵的列数,和所述训练完的第一图像识别模型中的所述子网络的输出向量的维数的大小关系;
第二填充子模块,用于当所述待训练的第二图像识别模型中对应的所述卷积神经网络的参数矩阵的列数,小于所述训练完的第一图像识别模型中的所述子网络的输出向量的维数时,使用预设数值对所述待训练的第二图像识别模型中对应的所述卷积神经网络的参数矩阵进行填充。
10.一种图像识别装置,包括:
第二获取模块,用于获取待识别图像;
第三输入模块,用于将所述待识别图像输入如权利要求6-9中任一种训练装置训练后的第三图像识别模型中;以及
生成模块,用于根据所述训练后的第三图像识别模型的输出,生成所述待识别图像的识别结果。
11.一种计算机设备,包括存储器和处理器;所述存储器上存储有可由处理器运行的计算机程序;所述处理器运行所述计算机程序时,执行如权利要求1-4中任一项所述的图像识别模型的训练方法。
12.一种计算机设备,包括存储器和处理器;所述存储器上存储有可由处理器运行的计算机程序;所述处理器运行所述计算机程序时,执行如权利要求5所述的图像识别方法。
13.一种非临时性计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1-4中任一项所述的图像识别模型的训练方法。
14.一种非临时性计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求5所述的图像识别方法。
CN202010075299.2A 2020-01-22 2020-01-22 图像识别模型的训练方法及装置、图像识别方法及装置 Active CN111275120B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010075299.2A CN111275120B (zh) 2020-01-22 2020-01-22 图像识别模型的训练方法及装置、图像识别方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010075299.2A CN111275120B (zh) 2020-01-22 2020-01-22 图像识别模型的训练方法及装置、图像识别方法及装置

Publications (2)

Publication Number Publication Date
CN111275120A true CN111275120A (zh) 2020-06-12
CN111275120B CN111275120B (zh) 2022-07-26

Family

ID=71001188

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010075299.2A Active CN111275120B (zh) 2020-01-22 2020-01-22 图像识别模型的训练方法及装置、图像识别方法及装置

Country Status (1)

Country Link
CN (1) CN111275120B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111079833A (zh) * 2019-12-16 2020-04-28 腾讯科技(深圳)有限公司 图像识别方法、装置以及计算机可读存储介质
CN112101551A (zh) * 2020-09-25 2020-12-18 北京百度网讯科技有限公司 用于训练模型的方法、装置、设备以及存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109583506A (zh) * 2018-12-06 2019-04-05 哈尔滨工业大学 一种基于参数迁移学习的无监督图像识别方法
CN109801259A (zh) * 2018-12-18 2019-05-24 中国科学院深圳先进技术研究院 一种核磁共振图像的快速成像方法、装置及设备
CN110148120A (zh) * 2019-05-09 2019-08-20 四川省农业科学院农业信息与农村经济研究所 一种基于cnn与迁移学习的病害智能识别方法及系统
CN110505020A (zh) * 2019-07-15 2019-11-26 电子科技大学 基于迁移学习的光非线性均衡方法
CN110516745A (zh) * 2019-08-28 2019-11-29 北京达佳互联信息技术有限公司 图像识别模型的训练方法、装置及电子设备
WO2019232853A1 (zh) * 2018-06-04 2019-12-12 平安科技(深圳)有限公司 中文模型训练、中文图像识别方法、装置、设备及介质
CN110674629A (zh) * 2019-09-27 2020-01-10 上海智臻智能网络科技股份有限公司 标点符号标注模型及其训练方法、设备、存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019232853A1 (zh) * 2018-06-04 2019-12-12 平安科技(深圳)有限公司 中文模型训练、中文图像识别方法、装置、设备及介质
CN109583506A (zh) * 2018-12-06 2019-04-05 哈尔滨工业大学 一种基于参数迁移学习的无监督图像识别方法
CN109801259A (zh) * 2018-12-18 2019-05-24 中国科学院深圳先进技术研究院 一种核磁共振图像的快速成像方法、装置及设备
CN110148120A (zh) * 2019-05-09 2019-08-20 四川省农业科学院农业信息与农村经济研究所 一种基于cnn与迁移学习的病害智能识别方法及系统
CN110505020A (zh) * 2019-07-15 2019-11-26 电子科技大学 基于迁移学习的光非线性均衡方法
CN110516745A (zh) * 2019-08-28 2019-11-29 北京达佳互联信息技术有限公司 图像识别模型的训练方法、装置及电子设备
CN110674629A (zh) * 2019-09-27 2020-01-10 上海智臻智能网络科技股份有限公司 标点符号标注模型及其训练方法、设备、存储介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111079833A (zh) * 2019-12-16 2020-04-28 腾讯科技(深圳)有限公司 图像识别方法、装置以及计算机可读存储介质
CN111079833B (zh) * 2019-12-16 2022-05-06 腾讯医疗健康(深圳)有限公司 图像识别方法、装置以及计算机可读存储介质
CN112101551A (zh) * 2020-09-25 2020-12-18 北京百度网讯科技有限公司 用于训练模型的方法、装置、设备以及存储介质

Also Published As

Publication number Publication date
CN111275120B (zh) 2022-07-26

Similar Documents

Publication Publication Date Title
US10007865B1 (en) Learning method and learning device for adjusting parameters of CNN by using multi-scale feature maps and testing method and testing device using the same
CN107133934B (zh) 图像补全方法及装置
US10129456B1 (en) Apparatus for adjusting focus of camera and control method thereof
CN112149721B (zh) 一种基于主动学习降低标注需求的目标检测方法
JP7263216B2 (ja) ワッサースタイン距離を使用する物体形状回帰
CN111275120B (zh) 图像识别模型的训练方法及装置、图像识别方法及装置
US20220036167A1 (en) Sorting method, operation method and operation apparatus for convolutional neural network
CN111695624B (zh) 数据增强策略的更新方法、装置、设备及存储介质
Weber et al. Automated focal loss for image based object detection
JP7055769B2 (ja) データ生成装置、データ生成方法およびプログラム
CN114972850B (zh) 多分支网络的分发推理方法、装置、电子设备及存储介质
CN111553414A (zh) 一种基于改进Faster R-CNN的车内遗失物体检测方法
CN116266387A (zh) 基于重参数化残差结构和坐标注意力机制的yolov4的图像识别算法及系统
CN111985488A (zh) 一种基于离线高斯模型的目标检测分割方法及系统
Persand et al. Composition of saliency metrics for pruning with a myopic oracle
CN113642479A (zh) 人脸图像的评价方法、装置、电子设备及存储介质
US20230281981A1 (en) Methods, devices, and computer readable media for training a keypoint estimation network using cgan-based data augmentation
CN116128044A (zh) 一种模型剪枝方法、图像处理方法及相关装置
CN111242184A (zh) 图像特征提取模型的训练方法和图像检索方法
KR20210007234A (ko) 이미지 보정 방법 및 이미지 보정 시스템
CN115100115A (zh) 一种器官图像分割的方法、装置、设备及存储介质
JP2022088341A (ja) 機器学習装置及び方法
CN114358084A (zh) 一种基于ddqn和生成对抗网络的触觉材料分类方法
CN113886578A (zh) 一种表单分类方法及装置
CN113936320B (zh) 人脸图像质量评价方法、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant