CN116704281A - 模型训练方法、装置、图像识别方法、计算机设备 - Google Patents

模型训练方法、装置、图像识别方法、计算机设备 Download PDF

Info

Publication number
CN116704281A
CN116704281A CN202310595065.4A CN202310595065A CN116704281A CN 116704281 A CN116704281 A CN 116704281A CN 202310595065 A CN202310595065 A CN 202310595065A CN 116704281 A CN116704281 A CN 116704281A
Authority
CN
China
Prior art keywords
gray
image data
gray scale
image
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310595065.4A
Other languages
English (en)
Inventor
王体龙
詹晨
宋磊
魏丽莉
邓建春
韩剑平
戚乐乐
柏雪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
FAW Jiefang Automotive Co Ltd
Original Assignee
FAW Jiefang Automotive Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by FAW Jiefang Automotive Co Ltd filed Critical FAW Jiefang Automotive Co Ltd
Priority to CN202310595065.4A priority Critical patent/CN116704281A/zh
Publication of CN116704281A publication Critical patent/CN116704281A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/70Labelling scene content, e.g. deriving syntactic or semantic representations
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Image Analysis (AREA)

Abstract

本申请涉及一种模型训练方法、装置、图像识别方法、计算机设备、计算机可读存储介质和计算机程序产品。该模型训练方法包括:获取多个样本图像数据;对多个样本图像数据进行灰度化处理,得到多个第一灰度图像数据;对多个第一灰度图像数据的灰度级进行灰度量化等级处理,得到多个第二灰度图像数据。对各第二灰度图像数据中的对象进行合并标注处理;根据合并标注处理后的多个第二灰度图像数据训练初始检测模型,得到目标检测模型。本申请的方法能够弱化图像数据中的颜色特征,各第二灰度图像数据中的相同的对象标注为同一类别,从而扩增了该类别下的数据量,即相当于扩增了样本图像数据的总量,提高了训练得到的模型的检测精度。

Description

模型训练方法、装置、图像识别方法、计算机设备
技术领域
本申请涉及图像处理技术领域,特别是涉及一种模型训练方法、装置、图像识别方法、计算机设备、计算机可读存储介质和计算机程序产品。
背景技术
随着深度学习技术的发展,目标检测技术在人类生产生活中的应用越来越广泛。而基于深度学习的目标检测模型的训练需要大量的样本数据,样本数据量越大,则训练得到的目标检测模型的检测效果越好。因此,如何在有限的样本数据的基础上进行扩增,增大样本数据量,是目前需要解决的问题。
发明内容
基于此,有必要针对上述技术问题,提供一种能够对样本数据量进行扩增的模型训练方法、装置、图像识别方法、计算机设备、计算机可读存储介质和计算机程序产品。
一种模型训练方法,包括:获取多个样本图像数据;对所述多个样本图像数据进行灰度化处理,得到多个第一灰度图像数据;对所述多个第一灰度图像数据的灰度级进行灰度量化等级处理,得到多个第二灰度图像数据,其中,所述第二灰度图像数据的灰度级小于所述第一灰度图像数据的灰度级;对各所述第二灰度图像数据中的对象进行合并标注处理;根据合并标注处理后的多个第二灰度图像数据训练初始检测模型,得到目标检测模型。
在其中一个实施例中,所述对所述多个样本图像数据进行灰度化处理,得到多个第一灰度图像数据,包括:将所述多个样本图像数据中的每一像素单元中的多个不同颜色的子像素的灰度值均赋值为相同的目标灰度值,得到多个所述第一灰度图像数据,其中,所述目标灰度值为当前灰度级的上限值和下限值之间的任一数值。
在其中一个实施例中,所述对所述多个第一灰度图像数据的灰度级进行灰度量化等级处理,得到多个第二灰度图像数据,包括:将所述第一灰度图像数据对应的灰度级中包括的多个灰度值进行分区,得到多个灰度区间,其中,每一灰度区间内包括连续的数量相同的灰度值;将所述多个第一灰度图像数据中灰度值处于同一灰度区间内的多个像素单元的灰度值调整为同一目标灰度值,得到多个第二灰度图像数据,其中,各灰度区间分别对应的目标灰度值分别根据各灰度区间内的多个灰度值确定。
在其中一个实施例中,模型训练方法还包括:将灰度区间内包括的最小灰度值作为灰度区间对应的目标灰度值;或者,将灰度区间内包括的最大灰度值作为灰度区间对应的目标灰度值;或者,将灰度区间内包括的多个灰度值的平均灰度值作为灰度区间对应的目标灰度值。
在其中一个实施例中,所述根据各所述第二灰度图像数据的灰度值对各所述第二灰度图像数据的类别进行合并标注处理,包括:确定各所述第二灰度图像数据中形状相同且灰度值相同的对象;将各所述第二灰度图像数据中形状相同且灰度值相同的对象标注为同一类别。
一种图像识别方法,应用于采用前述的模型训练方法得到的目标检测模型,所述图像识别方法包括:获取待检测图像;将所述待检测图像进行灰度化处理,得到第一灰度待检测图像;将所述第一灰度待检测图像的灰度级进行灰度量化等级处理,得到第二灰度待检测图像,其中,所述第二灰度待检测图像的灰度级小于所述第一灰度待检测图像的灰度级;将所述第二灰度待检测图像输入所述目标检测模型中,识别出目标对象在所述第二灰度待检测图像中的位置。
一种模型训练装置,包括:
数据获取模块,用于获取多个样本图像数据;
灰度处理模块,用于对所述多个样本图像数据进行灰度化处理,得到多个第一灰度图像数据;
灰度调整模块,用于对所述多个第一灰度图像数据的灰度级进行灰度量化等级处理,得到多个第二灰度图像数据,其中,所述第二灰度图像数据的灰度级小于所述第一灰度图像数据的灰度级;
数据扩增模块,用于对各所述第二灰度图像数据中的对象进行合并标注处理;
模型训练模块,用于根据合并标注处理后的多个第二灰度图像数据训练初始检测模型,得到目标检测模型。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现前述的模型训练方法。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现前述的模型训练方法。
一种计算机程序产品,所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现前述的模型训练方法。
上述模型训练方法、装置、图像识别方法、计算机设备、计算机可读存储介质和计算机程序产品。该模型训练方法首先获取多个样本图像数据,然后对所述多个样本图像数据进行灰度化处理,将原本是彩色的样本图像数据转换为灰度图的第一灰度图像数据,从而弱化了图像数据中的颜色特征,由于通常来说,图像中的结构特征(例如形状等)对于目标检测的影响更大,往往会影响检测对象的分类,所以通过弱化图像数据中的颜色特征,使得图像的结构特征更加突出,减少了图像中形状相同的对象之间由于颜色不同带来的差异性,便于后续的对象类别合并扩增样本图像的数据量,并且也减少了图像的信息量,降低了后续模型训练的难度,提高了训练得到的模型的精确度。然后对多个第一灰度图像数据的灰度级进行灰度量化等级处理,降低第一灰度图像数据的灰度级,得到多个第二灰度图像数据,从而进一步的弱化了图像数据中的颜色特征。然后对各所述第二灰度图像数据中的对象进行合并标注处理,从而在弱化了图像数据中的颜色特征之后,将各第二灰度图像数据中的相同的对象标注为同一类别,从而扩增了该类别下的数据量,即相当于扩增了样本图像数据的总量。然后基于合并标注处理后的多个第二灰度图像数据训练初始检测模型,得到目标检测模型,由于样本图像数据的总量更大了,从而可以提高训练得到的目标检测模型的检测精度。
附图说明
为了更清楚地说明本申请实施例或传统技术中的技术方案,下面将对实施例或传统技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为一个实施例中模型训练方法的流程示意图;
图2为一个实施例中量化灰度等级的示意图;
图3为一个实施例中经过灰度量化处理后的对象的示意图;
图4为另一个实施例中量化灰度等级的示意图;
图5为一个实施例中得到第二灰度图像数据的方法的示意图;
图6为一个实施例中合并标注的方法的示意图;
图7为一个实施例中图像识别方法的示意图;
图8为一个实施例中图像识别装置的结构示意图;
图9为一个实施例中计算机设备的内部结构图。
具体实施方式
为了便于理解本申请,下面将参照相关附图对本申请进行更全面的描述。附图中给出了本申请的实施例。但是,本申请可以以许多不同的形式来实现,并不限于本文所描述的实施例。相反地,提供这些实施例的目的是使本申请的公开内容更加透彻全面。
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中在本申请的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本申请。
可以理解,本申请所使用的术语“第一”、“第二”等可在本文中用于描述各种元件,但这些元件不受这些术语限制。这些术语仅用于将第一个元件与另一个元件区分。
需要说明的是,当一个元件被认为是“连接”另一个元件时,它可以是直接连接到另一个元件,或者通过居中元件连接另一个元件。此外,以下实施例中的“连接”,如果被连接的对象之间具有电信号或数据的传递,则应理解为“电连接”、“通信连接”等。
在此使用时,单数形式的“一”、“一个”和“所述/该”也可以包括复数形式,除非上下文清楚指出另外的方式。还应当理解的是,术语“包括/包含”或“具有”等指定所陈述的特征、整体、步骤、操作、组件、部分或它们的组合的存在,但是不排除存在或添加一个或更多个其他特征、整体、步骤、操作、组件、部分或它们的组合的可能性。
在一个实施例中,如图1所示,提供了一种模型训练方法,包括:
步骤S100,获取多个样本图像数据。
其中,样本图像数据通常为彩色图像,图像中的每个像素单元的颜色由三个不同颜色的子像素的数值决定,可以为红、绿、蓝三原色,三种颜色的灰度值不完全相同。样本图像数据也可以为灰度图像,灰度图像中的每个像素单元的红、绿、蓝三种颜色的灰度值相同。
具体地,通常需要采用样本图像数据集对于检测模型进行训练,而样本数据量越大,则训练得到的检测模型的检测效果就越好。在数据集充足的情况下,自然能够训练得到性能较好的检测模型,但是通常情况下,在实际应用场景中,样本数据量可能是不足的,从而会影响训练得到的检测模型的检测效果。本申请的方法适用于在样本图像数据不足的情况下,能够对现有的有限数量的样本图像数据进行扩增,从而得到更多的样本图像数据。
步骤S110,对多个样本图像数据进行灰度化处理,得到多个第一灰度图像数据。
具体地,将原本为彩色图像的多个样本图像数据转换为灰度图像,即得到了多个第一灰度图像数据。将原本是彩色的样本图像数据转换为灰度图的第一灰度图像数据,弱化了图像数据中的颜色特征。
示例性地,将样本图像数据中的每个像素单元的RGB(红绿蓝)数值均赋值为相同的数值,即可使得样本图像数据转换为灰度图像。这是因为按照RGB的定义,只要R、G、B比重保持相同,则图像即为白色、黑色、灰色中的一种,当R、G、B数值最高时,图像为白色,R、G、B数值最低时,图像为黑色,其他情况图像为灰色。
步骤S120,对多个第一灰度图像数据的灰度级进行灰度量化等级处理,得到多个第二灰度图像数据。
其中,第二灰度图像数据的灰度级小于第一灰度图像数据的灰度级。
具体地,在保证图像中的对象的轮廓清晰的前提下,将第一灰度图像数据的灰度级降低,得到第二灰度图像数据。可以是把第一灰度图像数据的灰度级中的多个灰度值量化分区,将同一分区内的灰度值等效为同样的数值,从而分隔为更少的灰度数,即可得到第二灰度图像数据。
示例性地,第一灰度图像数据的灰度级为256级,将每32个灰度值分为一个区间,则256个灰度值可以分为8个区间,然后将每个区间内的灰度值等效为同样的数值,即得到了灰度级为8级的第二灰度图像数据,包括8个灰度值,灰度量化等级处理的过程如图2所示。
步骤S130,对各第二灰度图像数据中的对象进行合并标注处理。
具体地,第二灰度图像数据是已经弱化了图像中的对象的颜色特征的数据,对象的结构特征更加突出,所以原本由于颜色特征而被判定为不同类别的对象,在弱化了颜色特征后,由于结构特征相近,所以可以被合并标注处理为同一类别。即增加了这一类别下的数据量,实现了数据扩增的效果。
示例性地,如图3所示,对于橙色的logo1和蓝色的logo2,RGB值分别为(237,125,49)和(91,155,213),经过步骤S110进行灰度化后的第一灰度图像数据的灰度值分别为161和148,经过步骤S120进行灰度量化等级处理后得到的第二灰度图像数据的灰度值均为160,步骤S120的灰度量化等级处理的示意图如图4所示,将原本的256灰度级转换为4灰度级。从而原本是橙色的logo1和蓝色的logo2可以被合并标注为同一类别,从而由原来的橙色的logo1和蓝色的logo2分别为不同的类别,变为橙色的logo1和蓝色的logo2处于同一类别。
步骤S140,根据合并标注处理后的多个第二灰度图像数据训练初始检测模型,得到目标检测模型。
具体地,合并标注处理后的多个第二灰度图像数据中的同一类别下的对象的数据量更大了,采用根据合并标注处理后的多个第二灰度图像数据训练初始检测模型,即可得到性能更优的目标检测模型。
示例性地,初始检测模型可以为YOLO(You Only Look Once)模型。将第二灰度图像数据集输入到YOLO模型中进行训练,训练之前需要将数据集整理成符合模型要求的数据格式,具体可参考模型官方要求。把第二灰度图像数据集切分成训练集、验证集和测试集。在训练集上进行YOLO模型训练,当模型的损失值趋于稳定时,结束训练,并得到训练后的模型。验证集作为模型超参数调整的依据,测试集被用来测试模型的最终效果。
在本实施例中,首先获取多个样本图像数据,然后对多个样本图像数据进行灰度化处理,将原本是彩色的样本图像数据转换为灰度图的第一灰度图像数据,从而弱化了图像数据中的颜色特征,由于通常来说,图像中的结构特征(例如形状等)对于目标检测的影响更大,往往会影响检测对象的分类,所以通过弱化图像数据中的颜色特征,使得图像的结构特征更加突出,减少了图像中形状相同的对象之间由于颜色不同带来的差异性,便于后续的对象类别合并扩增样本图像的数据量,并且也减少了图像的信息量,降低了后续模型训练的难度,提高了训练得到的模型的精确度。然后对多个第一灰度图像数据的灰度级进行灰度量化等级处理,降低第一灰度图像数据的灰度级,得到多个第二灰度图像数据,从而进一步的弱化了图像数据中的颜色特征。然后根据各第二灰度图像数据的灰度值对各第二灰度图像数据中的对象的类别进行合并标注处理,从而在弱化了图像数据中的颜色特征之后,将各第二灰度图像数据中的相同的对象标注为同一类别,从而扩增了该类别下的数据量,即相当于扩增了样本图像数据的总量。然后基于合并标注处理后的多个第二灰度图像数据训练初始检测模型,得到目标检测模型,由于样本图像数据的总量更大了,从而可以提高训练得到的目标检测模型的检测精度。
在一个实施例中,步骤S110,对多个样本图像数据进行灰度化处理,得到多个第一灰度图像数据。包括:将多个样本图像数据中的每一像素单元中的多个不同颜色的子像素的灰度值均赋值为相同的目标灰度值,得到多个第一灰度图像数据。
其中,目标灰度值为当前灰度级的上限值和下限值之间的任一数值。
具体地,每个像素单元包括红绿蓝三个子像素,可以用(R,G,B)来表示,当R,G,B的数值相同时,则图像为灰度图像,因为按照RGB的定义,只要R、G、B比重保持相同,则图像即为白色、黑色、灰色中的一种,当R、G、B数值最高时,图像为白色,R、G、B数值最低时,图像为黑色,其他情况图像为灰色,所以目标灰度值为当前灰度级的上限值和下限值之间的任一数值。每个像素单元也可以表示为(m,n,R,G,B)的形式,其中m,n分别为该像素单元的横纵坐标,在进行本申请的处理时,不考虑像素的位置信息,仅考虑其R、G、B数值即可。
在本实施例中,通过将样本图像数据中的每一像素单元中的多个不同颜色的子像素的灰度值均赋值为相同的目标灰度值,从而将原本是彩色的样本图像转换为了灰度图像。
在一个实施例中,如图5所示,步骤S120,对多个第一灰度图像数据的灰度级进行灰度量化等级处理,得到多个第二灰度图像数据。包括:
步骤S500,将第一灰度图像数据对应的灰度级中包括的多个灰度值进行分区,得到多个灰度区间。
其中,每一灰度区间内包括连续的数量相同的灰度值。
具体地,可参见图2、图4,在图2中将256灰度值划分为了8个灰度区间,每个灰度区间内包含32个连续的灰度值。在图4中将256个灰度值划分为了4个灰度区间,每个灰度区间内包含64个连续的灰度值。
示例性地,也可以采用K-Means聚类方法进行更高精度的聚类。K-Means聚类大概流程为:首先人为选择K个聚类中心,然后分别计算集合中的数据距离这些聚类中心的距离,数据点划分到距离其最近的中心的类别中,接着对每一个类别重新寻找质心,形成新的聚类中心。在聚类过程中聚类中心会根据每一类别中现有的点进行动态调整,重复这一过程,直到聚类结果令人满意为止(例如没有(或最小数目)的数据被重新分配,没有(或最小数目)的聚类中心发生变化,误差平方和局部最小等等)。最终得到多组灰度值,例如为8组,则将灰度值划分为了8个灰度区间,第一灰度图像数据对应的灰度级被降低为8。
步骤S510,将多个第一灰度图像数据中灰度值处于同一灰度区间内的多个像素单元的灰度值调整为同一目标灰度值,得到多个第二灰度图像数据。
其中,各灰度区间分别对应的目标灰度值分别根据各灰度区间内的多个灰度值确定。将同一灰度区间内的灰度值等效为同一目标灰度值,则有多少个灰度区间,就会有多少个灰度值,这些目标灰度值即为量化降级后的灰度级里的灰度值。
示例性地,可以将灰度区间内包括的最小灰度值作为灰度区间对应的目标灰度值。或者,可以将灰度区间内包括的最大灰度值作为灰度区间对应的目标灰度值。或者,可以将灰度区间内包括的多个灰度值的平均灰度值作为灰度区间对应的目标灰度值。例如,原本的灰度级中包括0-255灰度值,四级量化后,得到的灰度级仅包括32、96、160、224这四个灰度值。
在本实施例中,通过将第一灰度图像对应的灰度级中包括的多个灰度值进行分区以便于将第一灰度图像的灰度级降低,得到第二灰度图像,在第二灰度图像中,颜色特征被进一步的弱化,结构特征被进一步的突出了,更加有利于后续的合并处理。
在一个实施例中,如图6所示,步骤S130,对各第二灰度图像数据中的对象进行合并标注处理。包括:
步骤S600,确定各第二灰度图像数据中形状相同且灰度值相同的对象。
其中,第二灰度图像数据是已经弱化了图像中的对象的颜色特征的数据,对象的结构特征更加突出,所以原本由于颜色特征而被判定为不同类别的对象,在弱化了颜色特征后,由于结构特征相近,所以可以被合并标注处理为同一类别。即增加了这一类别下的数据量,实现了数据扩增的效果。所以确定出第二灰度图像数据中形状相同且灰度值相同的对象,这些对象是可以被合并标注的,即可以被标注为同一类别。可参见图3,橙色的logo1和蓝色的logo2在变为第二灰度图像数据后,可以合并标注为同一类别。
步骤S610,将各第二灰度图像数据中形状相同且灰度值相同的对象标注为同一类别。
具体地,可以采用人工标注的方式,利用标注软件对各第二灰度图像数据进行标注处理,将其中的形状相同且灰度值相同的对象的位置标注出来,并标注该对象的类别即可。例如,如图3所示,将橙色的logo1和蓝色的logo2分别在对应的第二灰度图像数据中的位置标注出来,并且将橙色的logo1和蓝色的logo2标注为同一类别。
在本实施例中,对于弱化了图像数据中的颜色特征之后的第二灰度图像数据,将各第二灰度图像数据中的相同的对象标注为同一类别,从而扩增了该类别下的数据量,即相当于扩增了样本图像数据的总量。便于为后续的模型训练提供更多的样本数据。
在一个实施例中,如图7所示,提供了一种图像识别方法,应用于采用如上述实施例的模型训练方法得到的目标检测模型,该图像识别方法包括:
步骤S700,获取待检测图像。
示例性地,待检测图像通常为彩色图像。
步骤S710,将待检测图像进行灰度化处理,得到第一灰度待检测图像。
具体地,将待检测图像按照上述步骤S110中同样的方式进行灰度化处理,即可得到第一灰度待检测图像。
步骤S720,将第一灰度待检测图像的灰度级进行灰度量化等级处理,得到第二灰度待检测图像。
其中,第二灰度待检测图像的灰度级小于第一灰度待检测图像的灰度级。
具体地,将第一灰度待检测图像按照上述步骤S120中同样的方式进行灰度量化等级处理,即可得到第二灰度待检测图像。优选地,第二灰度待检测图像的灰度级与第二灰度图像数据的灰度级相同。
步骤S730,将第二灰度待检测图像输入目标检测模型中,识别出目标对象在第二灰度待检测图像中的位置。
具体地,将第二灰度待检测图像输入目标检测模型中,即可对第二灰度待检测图像进行目标检测,识别出第二灰度待检测图像中的目标对象的位置,从而便于后续进行处理,例如可以将目标对象去除,可以采用实心的矩形将目标对象遮盖等方式进行去除。
示例性地,目标对象可以为待检测图像中的噪音文字或噪音图片,在企业的文件管理过程中,每天会生成和传递多份研发文件、政策文件、汇报文件等,为了方便文件管理,需要满足线上化和保密的需求。线上化需求:需要对文件进行OCR(Optical CharacterRecognition,光学字符识别)识别后提取文本内容,但是LOGO(标志)、图章、零部件图中的文字并不代表文章的主体信息,可将其视为噪音文字,为避免影响对主体信息的提取,需要对这些噪音文字提取前去除。保密需求:为了防止文件敏感信息泄露,需要将LOGO、图章、零部件图去除。因此,需要将待检测图像中的目标对象识别出来然后去除。
在本实施例中,首先获取待检测图像,然后将待检测图像进行灰度化处理,再进行灰度量化等级处理,从而弱化了待检测图像中的颜色特征,突出了待检测图像中的结构特征,然后将经过处理后的第二灰度待检测图像输入目标检测模型中,即可识别出目标对象在待检测图像中的位置,便于后续的去除工作等。
应该理解的是,虽然图1、5、6、7的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图1、5、6、7中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图8所示,提供了一种模型训练装置,包括:数据获取模块801、灰度处理模块802、灰度调整模块803、数据扩增模块804,其中:
数据获取模块801,用于获取多个样本图像数据。
灰度处理模块802,用于对多个样本图像数据进行灰度化处理,得到多个第一灰度图像数据。
灰度调整模块803,用于对多个第一灰度图像数据的灰度级进行灰度量化等级处理,得到多个第二灰度图像数据,其中,第二灰度图像数据的灰度级小于第一灰度图像数据的灰度级。
数据扩增模块804,用于对各第二灰度图像数据中的对象进行合并标注处理。
模型训练模块805,用于根据合并标注处理后的多个第二灰度图像数据训练初始检测模型,得到目标检测模型。
在一个实施例中,灰度处理模块802进一步包括:第一灰度处理单元,用于将多个样本图像数据中的每一像素单元中的多个不同颜色的子像素的灰度值均赋值为相同的目标灰度值,得到多个第一灰度图像数据,其中,目标灰度值为当前灰度级的上限值和下限值之间的任一数值。
在一个实施例中,灰度调整模块803进一步包括:灰度分区单元、第二灰度处理单元,其中:
灰度分区单元,用于将第一灰度图像数据对应的灰度级中包括的多个灰度值进行分区,得到多个灰度区间,其中,每一灰度区间内包括连续的数量相同的灰度值。
第二灰度处理单元,用于将多个第一灰度图像数据中灰度值处于同一灰度区间内的多个像素单元的灰度值调整为同一目标灰度值,得到多个第二灰度图像数据,其中,各灰度区间分别对应的目标灰度值分别根据各灰度区间内的多个灰度值确定。
在一个实施例中,数据扩增模块804进一步包括:对象确定单元、标注单元,其中:
对象确定单元,用于确定各第二灰度图像数据中形状相同且灰度值相同的对象。
标注单元,用于将各第二灰度图像数据中形状相同且灰度值相同的对象标注为同一类别。
关于模型训练装置的具体限定可以参见上文中对于模型训练方法的限定,在此不再赘述。上述模型训练装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。需要说明的是,本申请实施例中对模块的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
在一个实施例中,提供了一种计算机设备,该计算机设备内部结构图可以如图9所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种模型训练方法。
本领域技术人员可以理解,图9中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic Random Access Memory,DRAM)等。
在本说明书的描述中,参考术语“有些实施例”、“其他实施例”、“理想实施例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特征包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性描述不一定指的是相同的实施例或示例。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种模型训练方法,其特征在于,包括:
获取多个样本图像数据;
对所述多个样本图像数据进行灰度化处理,得到多个第一灰度图像数据;
对所述多个第一灰度图像数据的灰度级进行灰度量化等级处理,得到多个第二灰度图像数据,其中,所述第二灰度图像数据的灰度级小于所述第一灰度图像数据的灰度级;
对各所述第二灰度图像数据中的对象进行合并标注处理;
根据合并标注处理后的多个第二灰度图像数据训练初始检测模型,得到目标检测模型。
2.根据权利要求1所述的模型训练方法,其特征在于,所述对所述多个样本图像数据进行灰度化处理,得到多个第一灰度图像数据,包括:
将所述多个样本图像数据中的每一像素单元中的多个不同颜色的子像素的灰度值均赋值为相同的目标灰度值,得到多个所述第一灰度图像数据,其中,所述目标灰度值为当前灰度级的上限值和下限值之间的任一数值。
3.根据权利要求1所述的模型训练方法,其特征在于,所述对所述多个第一灰度图像数据的灰度级进行灰度量化等级处理,得到多个第二灰度图像数据,包括:
将所述第一灰度图像数据对应的灰度级中包括的多个灰度值进行分区,得到多个灰度区间,其中,每一灰度区间内包括连续的数量相同的灰度值;
将所述多个第一灰度图像数据中灰度值处于同一灰度区间内的多个像素单元的灰度值调整为同一目标灰度值,得到多个第二灰度图像数据,其中,各灰度区间分别对应的目标灰度值分别根据各灰度区间内的多个灰度值确定。
4.根据权利要求3所述的模型训练方法,其特征在于,所述方法还包括:
将灰度区间内包括的最小灰度值作为灰度区间对应的目标灰度值;
或者,将灰度区间内包括的最大灰度值作为灰度区间对应的目标灰度值;
或者,将灰度区间内包括的多个灰度值的平均灰度值作为灰度区间对应的目标灰度值。
5.根据权利要求1-4任一项所述的模型训练方法,其特征在于,所述对各所述第二灰度图像数据中的对象进行合并标注处理,包括:
确定各所述第二灰度图像数据中形状相同且灰度值相同的对象;
将各所述第二灰度图像数据中形状相同且灰度值相同的对象标注为同一类别。
6.一种图像识别方法,其特征在于,应用于采用如权利要求1-4任一项所述的模型训练方法得到的目标检测模型,所述图像识别方法包括:
获取待检测图像;
将所述待检测图像进行灰度化处理,得到第一灰度待检测图像;
将所述第一灰度待检测图像的灰度级进行灰度量化等级处理,得到第二灰度待检测图像,其中,所述第二灰度待检测图像的灰度级小于所述第一灰度待检测图像的灰度级;
将所述第二灰度待检测图像输入所述目标检测模型中,识别出目标对象在所述第二灰度待检测图像中的位置。
7.一种模型训练装置,其特征在于,包括:
数据获取模块,用于获取多个样本图像数据;
灰度处理模块,用于对所述多个样本图像数据进行灰度化处理,得到多个第一灰度图像数据;
灰度调整模块,用于对所述多个第一灰度图像数据的灰度级进行灰度量化等级处理,得到多个第二灰度图像数据,其中,所述第二灰度图像数据的灰度级小于所述第一灰度图像数据的灰度级;
数据扩增模块,用于对各所述第二灰度图像数据中的对象进行合并标注处理;
模型训练模块,用于根据合并标注处理后的多个第二灰度图像数据训练初始检测模型,得到目标检测模型。
8.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1-6中任一项所述的方法的步骤。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-6中任一项所述的方法的步骤。
10.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1-6中任一项所述的方法的步骤。
CN202310595065.4A 2023-05-24 2023-05-24 模型训练方法、装置、图像识别方法、计算机设备 Pending CN116704281A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310595065.4A CN116704281A (zh) 2023-05-24 2023-05-24 模型训练方法、装置、图像识别方法、计算机设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310595065.4A CN116704281A (zh) 2023-05-24 2023-05-24 模型训练方法、装置、图像识别方法、计算机设备

Publications (1)

Publication Number Publication Date
CN116704281A true CN116704281A (zh) 2023-09-05

Family

ID=87826886

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310595065.4A Pending CN116704281A (zh) 2023-05-24 2023-05-24 模型训练方法、装置、图像识别方法、计算机设备

Country Status (1)

Country Link
CN (1) CN116704281A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117272124A (zh) * 2023-11-23 2023-12-22 湖南苏科智能科技有限公司 一种基于能级的化学品分类方法、系统、设备及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117272124A (zh) * 2023-11-23 2023-12-22 湖南苏科智能科技有限公司 一种基于能级的化学品分类方法、系统、设备及存储介质
CN117272124B (zh) * 2023-11-23 2024-03-12 湖南苏科智能科技有限公司 一种基于能级的化学品分类方法、系统、设备及存储介质

Similar Documents

Publication Publication Date Title
CN112241699A (zh) 物体缺陷类别识别方法、装置、计算机设备和存储介质
CN107292307B (zh) 一种倒置汉字验证码自动识别方法及系统
CN111401387B (zh) 异常样本构建方法、装置、计算机设备和存储介质
CN111310800B (zh) 图像分类模型生成方法、装置、计算机设备和存储介质
US8135216B2 (en) Systems and methods for unsupervised local boundary or region refinement of figure masks using over and under segmentation of regions
CN110728687B (zh) 文件图像分割方法、装置、计算机设备和存储介质
CN109145964B (zh) 一种实现图像颜色聚类的方法和系统
CN116704281A (zh) 模型训练方法、装置、图像识别方法、计算机设备
CN111259915A (zh) 翻拍图像识别的方法、装置、设备及介质
CN114972817A (zh) 图像相似度匹配方法、设备及存储介质
US8131077B2 (en) Systems and methods for segmenting an image based on perceptual information
CN108877030B (zh) 图像处理方法、装置、终端和计算机可读存储介质
CN111428814B (zh) 一种混纺纱颜色自动识别匹配方法
CN111199228B (zh) 一种车牌定位的方法及装置
CN110930287B (zh) 一种图像隐写检测方法、装置及计算机设备、存储介质
CN113256644A (zh) 票据图像分割方法、装置、介质和设备
CN113065407B (zh) 基于注意力机制和生成对抗网络的财务票据印章擦除方法
CN116089944A (zh) 基于迁移学习的跨平台应用程序异常检测方法、系统
KR102377056B1 (ko) 이미지 위조 탐지 장치 및 방법
CN113989307A (zh) 图像语义分割方法、电子设备及存储介质
JP2005175641A (ja) 画像処理装置
CN111325658A (zh) 一种彩色图像自适应去色方法
Togban et al. Identifying color space for improved image display
CN110555173B (zh) 一种基于poi的地域识别系统及其识别方法
CN115273095A (zh) Ocr训练样本生成方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination