CN110569873A - 图像识别模型训练方法、装置以及计算机设备 - Google Patents
图像识别模型训练方法、装置以及计算机设备 Download PDFInfo
- Publication number
- CN110569873A CN110569873A CN201910713464.XA CN201910713464A CN110569873A CN 110569873 A CN110569873 A CN 110569873A CN 201910713464 A CN201910713464 A CN 201910713464A CN 110569873 A CN110569873 A CN 110569873A
- Authority
- CN
- China
- Prior art keywords
- image
- recognition model
- image recognition
- block
- sampling
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012549 training Methods 0.000 title claims abstract description 91
- 238000000034 method Methods 0.000 title claims abstract description 31
- 238000005070 sampling Methods 0.000 claims abstract description 66
- 230000000903 blocking effect Effects 0.000 claims abstract description 24
- 230000011218 segmentation Effects 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims description 8
- 238000013527 convolutional neural network Methods 0.000 description 19
- 230000006870 function Effects 0.000 description 10
- 238000000605 extraction Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 238000001914 filtration Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000007796 conventional method Methods 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 230000008713 feedback mechanism Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000008094 contradictory effect Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
- G06V10/443—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
- G06V10/449—Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Biodiversity & Conservation Biology (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了一种图像识别模型训练方法,该方法包括:将获取的采样图像进行M*N分块;根据预设的Gabor滤波器组对每一分块图像进行空域卷积,获得每一分块图像对应的多个特征图像;对每一分块图像的每个特征图像进行降采样从而得到对应的特征值;将所有分块图像的所有特征值作为输入数据对预设的初始图像识别模型进行训练,得到第一图像识别模型。本发明还提供一种图像识别模型训练装置、计算机设备以及计算机可读存储介质。本发明提供的图像识别模型训练方法、装置、计算机设备及计算机可读存储介质能够在较少采样数据的情况下实现图像识别模型的训练,并且提升了训练后图像识别模型的准确度。
Description
技术领域
本发明涉及图像识别模型训练技术领域,尤其涉及一种图像识别模型训练方法、装置、计算机设备及计算机可读存储介质。
背景技术
随着人工智能技术的发展,基于神经网络的深度学习尤其是得到了广泛的发展和应用,例如,CNN(Convolutional Neural Network,卷积神经网络)模型已经被成功的应用到了多个领域,包括文字识别、人脸识别、姿态识别,还有近期的通用物体识别。CNN模型因为其前馈机制在目标识别领域极为有效,然而,CNN模型的通用性和较强的识别能力也是有代价的,它需要大量的采样数据作为训练样本。但是针对不同的目标类型训练都需要大量的采样数据,但是,有些目标的采样数据并不会那么容易获取到的。因此,由于缺少采样图像的情况下,训练出的CNN模型可能准确性不高,在应用方面常常会受到限制。
发明内容
有鉴于此,本发明提出一种图像识别模型训练方法、装置、计算机设备及计算机可读存储介质,能够将获取的采样图像进行M*N分块,得到分块图像,然后再根据预设的Gabor滤波器组对每一分块图像进行空域卷积,获得每一分块图像对应的多个特征图像;接着对每一分块图像的每个特征图像进行降采样,得到每一分块图像的每个特征图像的特征值;再将所有分块图像的所有特征值作为输入数据对预设的初始图像识别模型进行训练,得到第一图像识别模型。通过以上方式,能够利用少量的采样图像划分为分块图像,然后提取分块图像的特征值用于对初始图像识别模型进行训练,从而在较少采样数据的情况下实现图像识别模型的训练,并且提升了训练后图像识别模型的准确度。
首先,为实现上述目的,本发明提供一种图像识别模型训练方法,所述方法包括:
获取至少一张采样图像,将所述采样图像进行M*N分块,得到分块图像;根据预设的Gabor滤波器组对每一分块图像进行空域卷积,获得每一分块图像对应的多个特征图像;对每一分块图像的每个特征图像进行降采样,得到每一分块图像的每个特征图像的特征值;将所有分块图像的所有特征值作为输入数据对预设的初始图像识别模型进行训练,得到第一图像识别模型。
可选地,所述“根据预设的Gabor滤波器组对每一分块图像进行空域卷积,获得每一分块图像对应的多个特征图像”的步骤包括:根据预设的A尺度,B方向建立Gabor滤波器组,得到A*B滤波器组;将所述A*B滤波器组对每一分块图像进行空域卷积,得到对应于每一分块图像的A*B个特征值图像。
可选地,所述“对每一分块图像的每个特征图像进行降采样,得到每一分块图像的每个特征图像的特征值”步骤包括:根据Max-pooing方式对每一分块图像的A*B个特征值图像进行降采样,从而获得对应每个特征值图像的2*2个特征值。
可选地,所述方法还包括步骤:将所有采样图像作为输入数据对所述第一图像识别模型进行训练,得到最终图像识别模型。
此外,为实现上述目的,本发明还提供一种图像识别模型训练装置,所述装置包括:
分割模块,用于获取至少一张采样图像,将所述采样图像进行M*N分块,得到分块图像;卷积模块,用于根据预设的Gabor滤波器组对每一分块图像进行空域卷积,获得每一分块图像对应的多个特征图像;降采样模块,用于对每一分块图像的每个特征图像进行降采样,得到每一分块图像的每个特征图像的特征值;训练模块,用于将所有分块图像的所有特征值作为输入数据对预设的初始图像识别模型进行训练,得到第一图像识别模型。
可选地,所述卷积模块还用于:根据预设的A尺度,B方向建立Gabor滤波器组,得到A*B滤波器组;将所述A*B滤波器组对每一分块图像进行空域卷积,得到对应于每一分块图像的A*B个特征值图像。
可选地,所述降采样模块还用于:根据Max-pooing方式对每一分块图像的A*B个特征值图像进行降采样,从而获得对应每个特征值图像的2*2个特征值。
可选地,所述训练模块还用于:将所有采样图像作为输入数据对所述第一图像识别模型进行训练,得到最终图像识别模型。
进一步地,本发明还提出一种计算机设备,所述计算机设备包括存储器、处理器,所述存储器上存储有可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如上述的图像识别模型训练方法的步骤。
进一步地,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序可被至少一个处理器执行,以使所述至少一个处理器执行如上述的图像识别模型训练方法的步骤。
相较于现有技术,本发明所提出的图像识别模型训练方法、装置、计算机设备及计算机可读存储介质,能够将获取的采样图像进行M*N分块,得到分块图像,然后再根据预设的Gabor滤波器组对每一分块图像进行空域卷积,获得每一分块图像对应的多个特征图像;接着对每一分块图像的每个特征图像进行降采样,得到每一分块图像的每个特征图像的特征值;再将所有分块图像的所有特征值作为输入数据对预设的初始图像识别模型进行训练,得到第一图像识别模型。通过以上方式,能够利用少量的采样图像划分为分块图像,然后提取分块图像的特征值用于对初始图像识别模型进行训练,从而在较少采样数据的情况下实现图像识别模型的训练,并且提升了训练后图像识别模型的准确度。
附图说明
图1是本发明计算机设备一可选的硬件架构的示意图;
图2是本发明图像识别模型训练装置一实施例的程序模块示意图;
图3是本发明图像识别模型训练方法一实施例的流程示意图。
附图标记:
计算机设备 | 1 |
存储器 | 11 |
处理器 | 12 |
网络接口 | 13 |
图像识别模型训练装置 | 200 |
分割模块 | 201 |
卷积模块 | 202 |
降采样模块 | 203 |
训练模块 | 204 |
本发明目的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,在本发明中涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。
参阅图1所示,是本发明计算机设备1一可选的硬件架构的示意图。
本实施例中,所述计算机设备1可包括,但不仅限于,可通过系统总线相互通信连接存储器11、处理器12、网络接口13。
所述计算机设备1通过网络接口13连接网络(图1未标出),通过网络连接到其他终端设备如移动终端(Mobile Terminal)、用户设备(User Equipment,UE)、手机(handset)及便携设备(portable equipment),PC端等。所述网络可以是企业内部网(Intranet)、互联网(Internet)、全球移动通讯系统(Global System of Mobile communication,GSM)、宽带码分多址(Wideband Code Division Multiple Access,WCDMA)、4G网络、5G网络、蓝牙(Bluetooth)、Wi-Fi、通话网络等无线或有线网络。
需要指出的是,图1仅示出了具有组件11-13的计算机设备1,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。
其中,所述存储器11至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,所述存储器11可以是所述计算机设备1的内部存储单元,例如该计算机设备1的硬盘或内存。在另一些实施例中,所述存储器11也可以是所述计算机设备1的外部存储设备,例如该计算机设备1配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。当然,所述存储器11还可以既包括所述计算机设备1的内部存储单元也包括其外部存储设备。本实施例中,所述存储器11通常用于存储安装于所述计算机设备1的操作系统和各类应用软件,例如图像识别模型训练装置200的程序代码等。此外,所述存储器11还可以用于暂时地存储已经输出或者将要输出的各类数据。
所述处理器12在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器12通常用于控制所述计算机设备1的总体操作,例如执行数据交互或者通信相关的控制和处理等。本实施例中,所述处理器12用于运行所述存储器11中存储的程序代码或者处理数据,例如运行所述的图像识别模型训练装置200等。
所述网络接口13可包括无线网络接口或有线网络接口,该网络接口13通常用于在所述计算机设备1与其他终端设备如移动终端、用户设备、手机及便携设备,PC端等之间建立通信连接。
本实施例中,所述计算机设备1内安装并运行有图像识别模型训练装置200时,当所述图像识别模型训练装置200运行时,能够将获取的采样图像进行M*N分块,得到分块图像,然后再根据预设的Gabor滤波器组对每一分块图像进行空域卷积,获得每一分块图像对应的多个特征图像;接着对每一分块图像的每个特征图像进行降采样,得到每一分块图像的每个特征图像的特征值;再将所有分块图像的所有特征值作为输入数据对预设的初始图像识别模型进行训练,得到第一图像识别模型。通过以上方式,能够利用少量的采样图像划分为分块图像,然后提取分块图像的特征值用于对初始图像识别模型进行训练,从而在较少采样数据的情况下实现图像识别模型的训练,并且提升了训练后图像识别模型的准确度。
至此,己经详细介绍了本发明各个实施例的应用环境和相关设备的硬件结构和功能。下面,将基于上述应用环境和相关设备,提出本发明的各个实施例。
首先,本发明提出一种图像识别模型训练装置200。
参阅图2所示,是本发明图像识别模型训练装置200一实施例的程序模块图。
本实施例中,所述图像识别模型训练装置200包括一系列的存储于存储器11上的计算机程序指令,当该计算机程序指令被处理器12执行时,可以实现本发明各实施例的图像识别模型训练功能。在一些实施例中,基于该计算机程序指令各部分所实现的特定的操作,图像识别模型训练装置200可以被划分为一个或多个模块。例如,在图2中,所述图像识别模型训练装置200可以被分割成分割模块201、卷积模块202、降采样模块203和训练模块204。其中:
所述分割模块201,用于获取至少一张采样图像,将所述采样图像进行M*N分块,得到分块图像。
首先,所述计算机设备1建立CNN初始目标识别模型,在本实施例中,所述计算机设备1先利用一张采样图像对CNN图像识别模型进行训练,得到所述初始目标识别模型。其中,CNN图像识别模型为现有的用于识别图像的卷积神经网络学习算法函数,该学习算法函数中包括反向传播模块,能够将由输入的图像数据经该学习算法函数执行后的结果进行反馈,从而对学习算法函数中的特征描述的权值进行调整。在利用CNN模型建立初始目标识别模型之后,所述分割模块201从作为标注数据的采样图像中选择至少一张图像进行M*N分块,得到分块图像。在本实施例中,所述计算机设备1建立初始目标识别模型后,则进一步需要选择适当的数据对所述初始目标识别模型进行预训练,以提高初始目标识别模型的边、角等边缘特征的识别能力。然而,由于成本的考量,大量的采样数据作为训练样本显然是不容易实现的,因此,所述分割模块201可以先从采样图像中选择至少一张图像进行分块,然后利用分块图像进行边缘特征提取,用于对所述初始目标识别模型进行预训练。
所述卷积模块202,用于根据预设的Gabor滤波器组对每一分块图像进行空域卷积,获得每一分块图像对应的多个特征图像。
具体地,所述卷积模块202根据预设的A尺度,B方向建立Gabor滤波器组,得到A*B滤波器组,然后将所述A*B滤波器组对每一分块图像进行空域卷积,得到对应于每一分块图像的A*B个特征值图像。
在本实施例中,由于Gabor滤波器能够在频域上进行尺度划分,例如,采样图像的频域范围最高频率为Uh,最低频率为Ul,那么,所述卷积模块202可以设置所述Gabor滤波器将U1-Uh划分为多个等份频段,这频段的数量则定义为尺度,例如A个尺度。另外,Gabor滤波器进行滤波时,还能够对滤波和的平行条带进行方向的调整,从而获得在不同方向的平行条带上的频率分布,因此,所述卷积模块202在对所述频域进行尺度划分后,进一步进行平行条带方向的设置,在本实施例中,平行条带的方向包括0度-360度,因此,可以等份设置,例如设置B个方向,那么所述训练系统则在360/B度的整数倍的方向设置为平行条带方向以形成对应的Gabor滤波器。从而,所述卷积模块202完成设置A*B个滤波器组。接着,所述卷积模块202将每一分块图像与所述A*B个滤波器的滤波器组进行滤波,即空域卷积,得到对应的A*B个输出,即对应该分块图像的A*B个特征图像。其中,利用Gabor滤波器组对图像进行空域卷积为现有常用手段,这里不做赘述。
所述降采样模块203,用于对每一分块图像的每个特征图像进行降采样,得到每一分块图像的每个特征图像的特征值。在本实施例中,所述降采样模块203根据Max-pooing方式对每一分块图像的A*B个特征值图像进行降采样,从而获得对应每个特征值图像的2*2个特征值。
具体地,在所述卷积模块202对每一分块图像进行A*B空域卷积并得到每一分块图像对应的A*B个特征图之后,所述计算机设备1还会对每一分块图像的每个特征图进行特征值提取。在本实施例中,所述计算机设备1通过所述降采样模块203根据预设的降采样方式对特征图进行降采样,然后得到预设数量的特征值。在本实施例中,所述降采样模块203根据Max-pooing方式对每一分块图像的A*B个特征值图像进行降采样,获得每个特征值图像的2*2个特征值,那么,所述降采样模块203则需要将所述A*B个特征值图像划分成2*2的等份区间,然后将每个区间的最大值作为该区间的特征值,因此得到2*2个特征值。当然,在其他实施例中,也可以使用均差或者方差的方式对每一个特征图像进行特征值提取。
所述训练模块204,用于将所有分块图像的所有特征值作为输入数据对预设的初始图像识别模型进行训练,得到第一图像识别模型。当然,在获得所述第一图像识别模型之后,所述训练模块204进一步将所有采样图像作为输入数据对所述第一图像识别模型进行训练,得到最终图像识别模型。
当所述降采样模块203对每一分块图像的每个特征图像进行降采样之后,得到对应每一分块图像的A*B*2*2的特征值。接着,所述训练模块204进一步根据基于CNN模型的所述初始目标识别模型的反馈机制,即反向传播模块,将所有分块图像的所有特征值作为图像识别训练的执行结果数据进行输入,用以对所述初始目标识别模型进行校准。在本实施例中,所述训练模块204采用标准反向传播算法对所述初始目标识别模型进行预训练,将获取到的所有特征值进行输入,从而校准所述初始目标识别模型中用于识别图像的边缘特征的权值,从而优化识别模型,得到所述第一图像识别模型。其中,通过标准反向传播算法对基于CNN识别模型的训练属于常用现有技术,不再叙述。所述第一图像识别模型相对于初始目标识别模型拥有更高的识别准确度。
接着,所述训练模块204进一步将所有的采样图像作为输入数据,对所述第一图像识别模型进行训练,从而得到最终目标识别模型。
从上文可知,所述计算机设备1能够将获取的采样图像进行M*N分块,得到分块图像,然后再根据预设的Gabor滤波器组对每一分块图像进行空域卷积,获得每一分块图像对应的多个特征图像;接着对每一分块图像的每个特征图像进行降采样,得到每一分块图像的每个特征图像的特征值;再将所有分块图像的所有特征值作为输入数据对预设的初始图像识别模型进行训练,得到第一图像识别模型。通过以上方式,能够利用少量的采样图像划分为分块图像,然后提取分块图像的特征值用于对初始图像识别模型进行训练,从而在较少采样数据的情况下实现图像识别模型的训练,并且提升了训练后图像识别模型的准确度。
此外,本发明还提出一种图像识别模型训练方法,所述方法应用于计算机设备。
参阅图3所示,是本发明图像识别模型训练方法一实施例的流程示意图。在本实施例中,根据不同的需求,图3所示的流程图中的步骤的执行顺序可以改变,某些步骤可以省略。
步骤S500,获取至少一张采样图像,将所述采样图像进行M*N分块,得到分块图像。
首先,所述计算机设备建立CNN初始目标识别模型,在本实施例中,所述计算机设备先利用一张采样图像对CNN图像识别模型进行训练,得到所述初始目标识别模型。其中,CNN图像识别模型为现有的用于识别图像的卷积神经网络学习算法函数,该学习算法函数中包括反向传播模块,能够将由输入的图像数据经该学习算法函数执行后的结果进行反馈,从而对学习算法函数中的特征描述的权值进行调整。在利用CNN模型建立初始目标识别模型之后,所述计算机设备从作为标注数据的采样图像中选择至少一张图像进行M*N分块,得到分块图像。在本实施例中,所述计算机设备1建立初始目标识别模型后,则进一步需要选择适当的数据对所述初始目标识别模型进行预训练,以提高初始目标识别模型的边、角等边缘特征的识别能力。然而,由于成本的考量,大量的采样数据作为训练样本显然是不容易实现的,因此,所述计算机设备可以先从采样图像中选择至少一张图像进行分块,然后利用分块图像进行边缘特征提取,用于对所述初始目标识别模型进行预训练。
步骤S502,根据预设的Gabor滤波器组对每一分块图像进行空域卷积,获得每一分块图像对应的多个特征图像。
具体地,所述计算机设备根据预设的A尺度,B方向建立Gabor滤波器组,得到A*B滤波器组,然后将所述A*B滤波器组对每一分块图像进行空域卷积,得到对应于每一分块图像的A*B个特征值图像。
在本实施例中,由于Gabor滤波器能够在频域上进行尺度划分,例如,采样图像的频域范围最高频率为Uh,最低频率为Ul,那么,所述计算机设备可以设置所述Gabor滤波器将U1-Uh划分为多个等份频段,这频段的数量则定义为尺度,例如A个尺度。另外,Gabor滤波器进行滤波时,还能够对滤波和的平行条带进行方向的调整,从而获得在不同方向的平行条带上的频率分布,因此,所述计算机设备在对所述频域进行尺度划分后,进一步进行平行条带方向的设置,在本实施例中,平行条带的方向包括0度-360度,因此,可以等份设置,例如设置B个方向,那么所述训练系统则在360/B度的整数倍的方向设置为平行条带方向以形成对应的Gabor滤波器。从而,所述计算机设备完成设置A*B个滤波器组。接着,所述计算机设备将每一分块图像与所述A*B个滤波器的滤波器组进行滤波,即空域卷积,得到对应的A*B个输出,即对应该分块图像的A*B个特征图像。其中,利用Gabor滤波器组对图像进行空域卷积为现有常用手段,这里不做赘述。
步骤S504,对每一分块图像的每个特征图像进行降采样,得到每一分块图像的每个特征图像的特征值。
在本实施例中,所述计算机设备根据Max-pooing方式对每一分块图像的A*B个特征值图像进行降采样,从而获得对应每个特征值图像的2*2个特征值。具体地,在计算机设备对每一分块图像进行A*B空域卷积并得到每一分块图像对应的A*B个特征图之后,所述计算机设备还会对每一分块图像的每个特征图进行特征值提取。在本实施例中,所述计算机设备根据预设的降采样方式对特征图进行降采样,然后得到预设数量的特征值。在本实施例中,所述根据Max-pooing方式对每一分块图像的A*B个特征值图像进行降采样,获得每个特征值图像的2*2个特征值,那么,所述计算机设备则需要将所述A*B个特征值图像划分成2*2的等份区间,然后将每个区间的最大值作为该区间的特征值,因此得到2*2个特征值。当然,在其他实施例中,也可以使用均差或者方差的方式对每一个特征图像进行特征值提取。
步骤S506,将所有分块图像的所有特征值作为输入数据对预设的初始图像识别模型进行训练,得到第一图像识别模型。
步骤S508,将所有采样图像作为输入数据对所述第一图像识别模型进行训练,得到最终图像识别模型。
当所述计算机设备对每一分块图像的每个特征图像进行降采样之后,得到对应每一分块图像的A*B*2*2的特征值。接着,所述计算机设备进一步根据基于CNN模型的所述初始目标识别模型的反馈机制,即反向传播模块,将所有分块图像的所有特征值作为图像识别训练的执行结果数据进行输入,用以对所述初始目标识别模型进行校准。在本实施例中,所述计算机设备采用标准反向传播算法对所述初始目标识别模型进行预训练,将获取到的所有特征值进行输入,从而校准所述初始目标识别模型中用于识别图像的边缘特征的权值,从而优化识别模型,得到所述第一图像识别模型。其中,通过标准反向传播算法对基于CNN识别模型的训练属于常用现有技术,不再叙述。所述第一图像识别模型相对于初始目标识别模型拥有更高的识别准确度。
接着,所述计算机设备进一步将所有的采样图像作为输入数据,对所述第一图像识别模型进行训练,从而得到最终目标识别模型。
本实施例所提出的图像识别模型训练方法能够将获取的采样图像进行M*N分块,得到分块图像,然后再根据预设的Gabor滤波器组对每一分块图像进行空域卷积,获得每一分块图像对应的多个特征图像;接着对每一分块图像的每个特征图像进行降采样,得到每一分块图像的每个特征图像的特征值;再将所有分块图像的所有特征值作为输入数据对预设的初始图像识别模型进行训练,得到第一图像识别模型。通过以上方式,能够利用少量的采样图像划分为分块图像,然后提取分块图像的特征值用于对初始图像识别模型进行训练,从而在较少采样数据的情况下实现图像识别模型的训练,并且提升了训练后图像识别模型的准确度。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种图像识别模型训练方法,其特征在于,所述方法包括步骤:
获取至少一张采样图像;
将所述采样图像进行M*N分块,得到分块图像;
根据预设的Gabor滤波器组对每一分块图像进行空域卷积,获得每一分块图像对应的多个特征图像;
对每一分块图像的每个特征图像进行降采样,得到每一分块图像的每个特征图像的特征值;
将所有分块图像的所有特征值作为输入数据对预设的初始图像识别模型进行训练,得到第一图像识别模型。
2.如权利要求1所述的图像识别模型训练方法,其特征在于,所述“根据预设的Gabor滤波器组对每一分块图像进行空域卷积,获得每一分块图像对应的多个特征图像”的步骤包括:
根据预设的A尺度,B方向建立Gabor滤波器组,得到A*B滤波器组;
将所述A*B滤波器组对每一分块图像进行空域卷积,得到对应于每一分块图像的A*B个特征值图像。
3.如权利要求1或2所述的图像识别模型训练方法,其特征在于,所述“对每一分块图像的每个特征图像进行降采样,得到每一分块图像的每个特征图像的特征值”步骤包括:
根据Max-pooing方式对每一分块图像的A*B个特征值图像进行降采样,从而获得对应每个特征值图像的2*2个特征值。
4.如权利要求1-3任一项所述的图像识别模型训练方法,其特征在于,所述方法还包括步骤:
将所有采样图像作为输入数据对所述第一图像识别模型进行训练,得到最终图像识别模型。
5.一种图像识别模型训练装置,其特征在于,所述装置包括:
分割模块,用于获取至少一张采样图像,将所述采样图像进行M*N分块,得到分块图像;
卷积模块,用于根据预设的Gabor滤波器组对每一分块图像进行空域卷积,获得每一分块图像对应的多个特征图像;
降采样模块,用于对每一分块图像的每个特征图像进行降采样,得到每一分块图像的每个特征图像的特征值;
训练模块,用于将所有分块图像的所有特征值作为输入数据对预设的初始图像识别模型进行训练,得到第一图像识别模型。
6.如权利要求5所述的图像识别模型训练装置,其特征在于,所述卷积模块还用于:
根据预设的A尺度,B方向建立Gabor滤波器组,得到A*B滤波器组;
将所述A*B滤波器组对每一分块图像进行空域卷积,得到对应于每一分块图像的A*B个特征值图像。
7.如权利要求5或6所述的图像识别模型训练装置,其特征在于,所述降采样模块还用于:根据Max-pooing方式对每一分块图像的A*B个特征值图像进行降采样,从而获得对应每个特征值图像的2*2个特征值。
8.如权利要求5-7任一项所述的图像识别模型训练装置,其特征在于,
所述训练模块,还用于将所有采样图像作为输入数据对所述第一图像识别模型进行训练,得到最终图像识别模型。
9.一种计算机设备,其特征在于,所述计算机设备包括存储器、处理器,所述存储器上存储有可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1-4任一项所述的图像识别模型训练方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序可被至少一个处理器执行,以使所述至少一个处理器执行如权利要求1-4中任一项所述的图像识别模型训练方法的步骤。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910713464.XA CN110569873A (zh) | 2019-08-02 | 2019-08-02 | 图像识别模型训练方法、装置以及计算机设备 |
PCT/CN2019/117768 WO2021022712A1 (zh) | 2019-08-02 | 2019-11-13 | 图像识别模型训练方法、装置以及计算机设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910713464.XA CN110569873A (zh) | 2019-08-02 | 2019-08-02 | 图像识别模型训练方法、装置以及计算机设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110569873A true CN110569873A (zh) | 2019-12-13 |
Family
ID=68774483
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910713464.XA Pending CN110569873A (zh) | 2019-08-02 | 2019-08-02 | 图像识别模型训练方法、装置以及计算机设备 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN110569873A (zh) |
WO (1) | WO2021022712A1 (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114092489B (zh) * | 2021-11-02 | 2023-08-29 | 清华大学 | 多孔介质渗流通道提取、模型训练方法、装置及设备 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105095836A (zh) * | 2014-05-14 | 2015-11-25 | 中国科学院深圳先进技术研究院 | 一种基于Gabor特征的皮肤纹理检测方法及装置 |
WO2016169219A1 (zh) * | 2015-04-21 | 2016-10-27 | 深圳Tcl数字技术有限公司 | 提取人脸纹理的方法及装置 |
CN107392183A (zh) * | 2017-08-22 | 2017-11-24 | 深圳Tcl新技术有限公司 | 人脸分类识别方法、装置及可读存储介质 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106096605B (zh) * | 2016-06-02 | 2019-03-19 | 史方 | 一种基于深度学习的图像模糊区域检测方法及装置 |
CN106469316B (zh) * | 2016-09-07 | 2020-02-21 | 深圳大学 | 基于超像素级信息融合的高光谱图像的分类方法及系统 |
US10552671B2 (en) * | 2017-11-22 | 2020-02-04 | King Fahd University Of Petroleum And Minerals | Multi-kernel fuzzy local Gabor feature extraction method for automatic gait recognition |
-
2019
- 2019-08-02 CN CN201910713464.XA patent/CN110569873A/zh active Pending
- 2019-11-13 WO PCT/CN2019/117768 patent/WO2021022712A1/zh active Application Filing
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105095836A (zh) * | 2014-05-14 | 2015-11-25 | 中国科学院深圳先进技术研究院 | 一种基于Gabor特征的皮肤纹理检测方法及装置 |
WO2016169219A1 (zh) * | 2015-04-21 | 2016-10-27 | 深圳Tcl数字技术有限公司 | 提取人脸纹理的方法及装置 |
CN107392183A (zh) * | 2017-08-22 | 2017-11-24 | 深圳Tcl新技术有限公司 | 人脸分类识别方法、装置及可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
WO2021022712A1 (zh) | 2021-02-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2019205369A1 (zh) | 电子装置、基于人脸图像与声纹信息的身份识别方法及存储介质 | |
US9014480B2 (en) | Identifying a maximally stable extremal region (MSER) in an image by skipping comparison of pixels in the region | |
US20210327076A1 (en) | Target tracking method and apparatus, storage medium, and electronic device | |
CN110795976A (zh) | 一种训练物体检测模型的方法、装置以及设备 | |
CN110070037B (zh) | 人脸识别模型的平滑升级方法、装置和可读存储介质 | |
CN110866115B (zh) | 序列标注方法、系统、计算机设备及计算机可读存储介质 | |
CN109726195B (zh) | 一种数据增强方法及装置 | |
CN111444775A (zh) | 人脸关键点修正方法、装置以及计算机设备 | |
CN109685805B (zh) | 一种图像分割方法及装置 | |
CN112836820B (zh) | 用于图像分类任务的深度卷积网络训练方法、装置及系统 | |
CN112241646A (zh) | 车道线识别方法、装置、计算机设备和存储介质 | |
CN110942090A (zh) | 模型训练、图像处理方法、装置、电子设备及存储介质 | |
CN112016502A (zh) | 安全带检测方法、装置、计算机设备及存储介质 | |
CN112949706B (zh) | Ocr训练数据生成方法、装置、计算机设备及存储介质 | |
CN110569873A (zh) | 图像识别模型训练方法、装置以及计算机设备 | |
CN114240779A (zh) | 一种点云去噪方法、装置、设备及存储介质 | |
CN110210314B (zh) | 人脸检测方法、装置、计算机设备及存储介质 | |
CN116245901A (zh) | 一种基于边缘学习的建筑物规则矢量轮廓提取方法及系统 | |
CN112650741B (zh) | 异常数据的识别与修正方法、系统、设备及可读存储介质 | |
CN111815510B (zh) | 基于改进的卷积神经网络模型的图像处理方法及相关设备 | |
CN111985519B (zh) | 文本相似度量化方法、设备及系统 | |
CN112288748B (zh) | 一种语义分割网络训练、图像语义分割方法及装置 | |
CN113627262A (zh) | 文字识别方法、装置及设备 | |
CN113971738A (zh) | 图像检测方法、装置、电子设备及存储介质 | |
CN113032071A (zh) | 页面元素定位方法、页面测试方法、装置、设备和介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |