CN110287954A - 目标区域确定模型的训练方法、装置和计算机可读存储介质 - Google Patents

目标区域确定模型的训练方法、装置和计算机可读存储介质 Download PDF

Info

Publication number
CN110287954A
CN110287954A CN201910485054.4A CN201910485054A CN110287954A CN 110287954 A CN110287954 A CN 110287954A CN 201910485054 A CN201910485054 A CN 201910485054A CN 110287954 A CN110287954 A CN 110287954A
Authority
CN
China
Prior art keywords
target area
key point
model
prediction
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910485054.4A
Other languages
English (en)
Inventor
朱延东
周恺卉
王长虎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing ByteDance Network Technology Co Ltd
Original Assignee
Beijing ByteDance Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing ByteDance Network Technology Co Ltd filed Critical Beijing ByteDance Network Technology Co Ltd
Priority to CN201910485054.4A priority Critical patent/CN110287954A/zh
Publication of CN110287954A publication Critical patent/CN110287954A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • G06V20/625License plates

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Analysis (AREA)

Abstract

本公开一种目标区域确定模型的训练方法、装置、电子设备和计算机可读存储介质。其中方法包括:获取训练样本集合;其中,所述训练样本集合由多个标记了目标区域关键点的样本图像组成;将所述训练样本集合输入卷积神经网络进行训练直至满足收敛条件,得到目标区域确定模型;其中,所述目标区域确定模型用于预测所述目标区域上的多个关键点。本公开实施例通过训练得到目标区域确定模型,该目标区域确定模型用于预测所述目标区域上的多个关键点,使得根据该多个关键点形成目标区域,能够提高目标区域识别准确率。

Description

目标区域确定模型的训练方法、装置和计算机可读存储介质
技术领域
本公开涉及一种目标区域确定模型的训练技术领域,特别是涉及一种目标区域确定模型的训练方法、装置和计算机可读存储介质。
背景技术
拍摄的视频图像中很多都包含汽车,而包含汽车的图像中一般都会包括车牌,由于车牌涉及到隐私,因此需要对视频图像中的车牌进行处理或者使用其他图像来覆盖该车牌。而在对包含车牌的图像进行处理时,识别出图像中的车牌区域是关键。
现有技术中对于车牌区域的识别,一般是使用图像分割,基于卷积神经网络模型来识别,但是由于从卷积神经网络模型的低层到高层会导致图像信息的丢失,最终识别出来的车牌区域不精确,在边缘上会有比较多的抖动,导致识别率较低。
发明内容
本公开解决的技术问题是提供一种目标区域确定模型的训练方法,以至少部分地解决现有技术中目标区域识别效率低的技术问题。此外,还提供一种目标区域确定模型的训练装置、目标区域确定模型的训练硬件装置、计算机可读存储介质和目标区域确定模型的训练终端。
为了实现上述目的,根据本公开的一个方面,提供以下技术方案:
一种目标区域确定模型的训练方法,包括:
获取训练样本集合;其中,所述训练样本集合由多个标记了目标区域关键点的样本图像组成;
确定卷积神经网络的参数;
将所述训练样本集合输入所述卷积神经网络,得到每个样本图像的预测关键点;
根据每个样本图像的预测关键点和真实关键点确定预测误差;
若所述预测误差大于预设误差,则根据所述预设误差重新确定所述卷积神经网络的参数,继续重复训练过程,直至所述预测误差小于或等于所述预设误差,结束训练过程,得到所述目标区域确定模型。
进一步的,所述目标区域为车牌区域。
进一步的,所述关键点为所述车牌区域四个顶角对应的点。
为了实现上述目的,根据本公开的一个方面,提供以下技术方案:
一种目标区域确定方法,包括:
获取待识别图像;
将所述待识别图像输入采用上述任一项所述的目标区域确定模型的训练方法进行训练得到的目标区域确定模型;
通过所述目标区域确定模型预测得到多个关键点;
根据所述多个关键点确定目标区域。
进一步的,所述根据所述多个关键点确定目标区域,包括:
从所述多个关键点中筛选出预设个数关键点;
根据所述预设个数关键点确定所述目标区域。
进一步的,所述从所述多个关键点中筛选出预设个数关键点,包括:
通过目标区域识别模型对所述待识别图像进行识别,得到预测目标区域;
从所述多个关键点中筛选出位于所述预测目标区域内的预设个数关键点。
进一步的,所述根据所述多个关键点确定目标区域,包括:
从所述多个关键点中选取预设个数关键点进行连线,得到多个闭合区域;
根据预设条件从所述多个闭合区域中筛选出一个闭合区域作为所述目标区域。
进一步的,所述目标区域为车牌区域。
为了实现上述目的,根据本公开的一个方面,提供以下技术方案:
一种目标区域确定模型目标区域确定模型的训练装置,包括:
样本获取模块,用于获取训练样本集合;其中,所述训练样本集合由多个标记了目标区域关键点的样本图像组成;
参数确定模块,用于确定卷积神经网络的参数;
关键点预测模块,用于将所述训练样本集合输入所述卷积神经网络,得到每个样本图像的预测关键点;
误差确定模块,用于根据每个样本图像的预测关键点和真实关键点确定预测误差;
参数调整模块,用于若所述预测误差大于预设误差,则根据所述预设误差重新确定所述卷积神经网络的参数,继续重复训练过程,直至所述预测误差小于或等于所述预设误差,结束训练过程,得到目标区域确定模型。
进一步的,所述目标区域为车牌区域。
进一步的,所述关键点为所述车牌区域四个顶角对应的点。
为了实现上述目的,根据本公开的一个方面,提供以下技术方案:
一种目标区域确定装置,包括:
图像获取模块,用于获取待识别图像;
图像输入模块,用于将所述待识别图像输入采用所述的目标区域确定模型的训练方法进行训练得到的目标区域确定模型;
预测模块,用于通过所述目标区域确定模型预测得到多个关键点;
区域确定模块,用于根据所述多个关键点确定目标区域。
进一步的,所述预测模块包括:
关键点筛选单元,用于从所述多个关键点中筛选出预设个数关键点;
区域确定单元,用于根据所述预设个数关键点确定所述目标区域。
进一步的,所述关键点筛选单元具体用于:通过目标区域识别模型对所述待识别图像进行识别,得到预测目标区域;从所述多个关键点中筛选出位于所述预测目标区域内的预设个数关键点。
进一步的,所述预测模块具体用于:从所述多个关键点中选取预设个数关键点进行连线,得到多个闭合区域;根据预设条件从所述多个闭合区域中筛选出一个闭合区域作为所述目标区域。
进一步的,所述目标区域为车牌区域。
为了实现上述目的,根据本公开的一个方面,提供以下技术方案:
一种电子设备,包括:
存储器,用于存储非暂时性计算机可读指令;以及
处理器,用于运行所述计算机可读指令,使得所述处理器执行时实现上述任意一项所述的目标区域确定模型的训练方法。
为了实现上述目的,根据本公开的一个方面,提供以下技术方案:
一种计算机可读存储介质,用于存储非暂时性计算机可读指令,当所述非暂时性计算机可读指令由计算机执行时,使得所述计算机执行上述任意一项所述的目标区域确定模型的训练方法。
为了实现上述目的,根据本公开的一个方面,提供以下技术方案:
一种电子设备,包括:
存储器,用于存储非暂时性计算机可读指令;以及
处理器,用于运行所述计算机可读指令,使得所述处理器执行时实现上述任意一项所述的目标区域确定方法。
为了实现上述目的,根据本公开的一个方面,提供以下技术方案:
一种计算机可读存储介质,用于存储非暂时性计算机可读指令,当所述非暂时性计算机可读指令由计算机执行时,使得所述计算机执行上述任意一项所述的目标区域确定方法。
为了实现上述目的,根据本公开的又一个方面,还提供以下技术方案:
一种目标区域确定模型的训练终端,包括上述任一目标区域确定模型的训练装置。
为了实现上述目的,根据本公开的又一个方面,还提供以下技术方案:
一种数据读取终端,包括上述任一数据读取装置。
本公开实施例通过训练得到目标区域确定模型,该目标区域确定模型用于预测所述目标区域上的多个关键点,使得根据该多个关键点形成目标区域,能够提高目标区域确定准确率。
上述说明仅是本公开技术方案的概述,为了能更清楚了解本公开的技术手段,而可依照说明书的内容予以实施,并且为让本公开的上述和其他目的、特征和优点能够更明显易懂,以下特举较佳实施例,并配合附图,详细说明如下。
附图说明
图1a为根据本公开一个实施例的目标区域确定模型目标区域确定模型的训练方法的流程示意图;
图1b为根据本公开一个实施例的目标区域确定模型的训练方法中的卷积层的卷积过程示意图;
图1c为根据本公开一个实施例的目标区域确定模型的训练方法中的卷积层的卷积结果示意图;
图2为根据本公开一个实施例的目标区域确定方法的流程示意图;
图3为根据本公开一个实施例的目标区域确定模型的训练装置的结构示意图;
图4为根据本公开一个实施例的目标区域确定装置的结构示意图;
图5为根据本公开一个实施例的电子设备的结构示意图。
具体实施方式
以下通过特定的具体实例说明本公开的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本公开的其他优点与功效。显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。本公开还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本公开的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。基于本公开中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。
需要说明的是,下文描述在所附权利要求书的范围内的实施例的各种方面。应显而易见,本文中所描述的方面可体现于广泛多种形式中,且本文中所描述的任何特定结构及/或功能仅为说明性的。基于本公开,所属领域的技术人员应了解,本文中所描述的一个方面可与任何其它方面独立地实施,且可以各种方式组合这些方面中的两者或两者以上。举例来说,可使用本文中所阐述的任何数目个方面来实施设备及/或实践方法。另外,可使用除了本文中所阐述的方面中的一或多者之外的其它结构及/或功能性实施此设备及/或实践此方法。
还需要说明的是,以下实施例中所提供的图示仅以示意方式说明本公开的基本构想,图式中仅显示与本公开中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。
另外,在以下描述中,提供具体细节是为了便于透彻理解实例。然而,所属领域的技术人员将理解,可在没有这些特定细节的情况下实践所述方面。
实施例一
为了解决现有技术中目标区域识别效率低的技术问题,本公开实施例提供一种目标区域确定模型的训练方法。如图1a所示,该目标区域确定模型的训练方法主要包括如下步骤S11至步骤S12。其中:
步骤S11:获取训练样本集合;其中,所述训练样本集合由多个标记了目标区域关键点的样本图像组成。
其中,目标区域可以为车牌区域。
其中,关键点为目标区域内的像素点,具体可以目标区域边界的像素点。可以用坐标表示该关键点。例如,如果目标区域为车牌区域,由于车牌区域通常是一个矩形区域,那么关键点可以为该车辆区域四个顶角的像素点。
具体的,当训练样本的数量成万级别时,如果将这么多的数据同时训练,不仅会增加计算量,还会降低训练速度。因此,可以将训练样本进行分组,分别对每组训练样本集合进行训练。例如可以将每100个训练样本分为一组。
步骤S12:确定卷积神经网络的参数。
其中,卷积神经网络(Convolutional Neural Networks,CNN)是一类包含卷积计算且具有深度结构的前馈神经网络,主要包括输入层、卷积层、池化层、全连接层和输出层。并且,一个卷积神经网络可以包括多个卷积层。在本文中,卷积神经网络可以为直筒型卷积神经网络,也可以为深度学习卷积神经网络,这里不做具体限定。
其中,卷积层包括卷积核,卷积核可以为一个矩阵,用于对输入图像进行卷积,具体计算方法为对输入的图像的不同局部矩阵和卷积核矩阵各个位置的元素相乘,然后相加。在本文中,每个训练通道对应不同的卷积核。
举个例子,如图1b所示,输入是一个二维的3x4的矩阵,而卷积核是一个 2x2的矩阵。这里假设卷积是一次移动一个像素来卷积的,那么首先对输入的左上角2x2局部和卷积核卷积,即各个位置的元素相乘再相加,得到的输出矩阵S 的S00的元素,值为aw+bx+ey+fzaw+bx+ey+fz。接着将输入的局部向右平移一个像素,现在是(b,c,f,g)四个元素构成的矩阵和卷积核来卷积,这样得到了输出矩阵S的S01的元素,同样的方法,可以得到输出矩阵S的S02,S10,S11, S12,S10,S11,S12的元素。如图1c所示,最终得到卷积输出的矩阵为一个2x3 的矩阵S。
其中,所述参数包括卷积层的卷积核对应的参数,例如卷积矩阵的大小,例如可以设为3*3的矩阵,不同的卷积层可以设置不同的卷积核。此外,还可以包括池化层的参数,例如池化矩阵的大小,可以为3*3的池化矩阵,或者输出层的参数,例如线性系数矩阵及偏倚向量等。
步骤S13:将所述训练样本集合输入所述卷积神经网络,得到每个样本图像的预测关键点。
具体的,首先练样本集合通过所述卷积神经网络的输入层,将训练样本集合转化为多维向量,然后经过卷积层进行卷积计算,得到卷积阶段对应的特征图像,然后进入池化层、全连接层和输出层进行预测。
步骤S14:根据每个样本图像的预测关键点和真实关键点确定预测误差。
其中,预设误差可以自定义设置。
在本文中,可以使用像素点的坐标表示关键点。具体的,通过计算预测关键点的坐标与真实关键点的坐标的差值,将差值作为预测误差。
步骤S15:若所述预测误差大于预设误差,则根据所述预设误差重新确定所述卷积神经网络的参数,继续重复训练过程,直至所述预测误差小于或等于所述预设误差,结束训练过程,得到所述目标区域确定模型。
本实施例通过训练得到目标区域确定模型,该目标区域确定模型用于预测所述目标区域上的多个关键点,从而根据该多个关键点形成目标区域,能够提高目标区域确定准确率。
实施例二
为了解决现有技术中目标区域确定正确率低的技术问题,本公开实施例还提供一种目标区域确定方法,如图2所示,具体包括:
S21:获取待识别图像。
其中,可通过摄像头实时获取待识别图像。或者从本地获取预先存储的待识别图像。
S22:将所述待识别图像输入目标区域确定模型。
其中,目标区域确定模型采用上述实施例一所述的目标区域确定模型的训练方法进行训练得到,具体训练过程参见上述实施例一。
S23:通过所述目标区域确定模型预测得到多个关键点。
其中,预测得到的关键点的个数可以与训练目标区域确定模型时标记的目标区域的关键点个数相同,也可以多于训练目标区域确定模型时标记的目标区域的关键点个数。
S24:根据所述多个关键点确定目标区域。
其中,目标区域可以为车牌区域,用于对车牌区域的识别。具体的,可以直接将多个关键点连线形成的闭合区域作为目标区域。例如,如果目标区域为车牌区域,可以预测得到4个关键点,将该4个关键点连成线得到的闭合区域即为目标区域。
本实施例通过目标区域确定模型预测得到多个关键点,根据多个关键点确定目标区域,能够提高目标区域确定准确率。
在一个可选的实施例中,步骤S24具体包括:
步骤S241:从所述多个关键点中筛选出预设个数关键点。
其中,预设个数关键点可自定义设置,具体可以与训练目标区域确定模型时标记的目标区域的关键点个数相同。
具体的,预测的关键点可能会多于训练目标区域确定模型时标记的目标区域的关键点个数,当多于时,则从中筛选出预设个数关键点。例如,如果目标区域为车牌区域,在训练目标区域确定模型时标记的关键点为4个顶角的像素点,如果预测出的关键点个数为6个,则需要从6个关键点中筛选出4个关键点。
步骤S242:根据所述预设个数关键点确定所述目标区域。
具体的,可直接将预设个数关键点连线形成的闭合区域作为目标区域。例如,将步骤S241筛选出的4个关键点连线形成的矩形区域作为目标区域。。
进一步的,由于预测出的多个关键点有可能不是目标区域的关键点,因此为了保证确定的目标区域的准确度,步骤S241具体包括:
步骤S2411:通过目标区域识别模型对所述待识别图像进行识别,得到预测目标区域。
其中,目标区域识别模型可以为预先训练得到的目标区域确定模型,该目标区域确定模型用于预测目标区域。
其中,预测目标区域为通过目标区域确定模型预测得到的目标区域。
步骤S2412:从所述多个关键点中筛选出位于所述预测目标区域内的预设个数关键点。
在一个可选的实施例中,步骤S24具体包括:
步骤S243:从所述多个关键点中选取预设个数关键点进行连线,得到多个闭合区域。
具体的,预测的关键点可能会多于训练目标区域确定模型时标记的目标区域的关键点个数,当多于时,则从中组合选取出预设个数关键点,分别连线得到多个闭合区域。例如,如果目标区域为车牌区域,在训练目标区域确定模型时标记的关键点为4个顶角的像素点,如果预测出的关键点个数为6个,则需要从6 个关键点中组合选取出4个关键点,具体可有12种组合方式,那么就对应12个闭合区域。
其中,闭合区域可以为矩形区域、多边形区域、圆形区域等,这里不做居然限定。
步骤S244:根据预设条件从所述多个闭合区域中筛选出一个闭合区域作为所述目标区域。
其中,预设条件可自定义设置。当闭合区域为矩形区域时,预设条件可以为矩形区域宽高比。具体的,分别计算每个矩形区域的宽高比,将宽高比最接近真实目标区域宽高比的矩形区域作为目标区域。
或者,预设条件为预设训练得到的目标区域确定模型,该目标区域确定模型用于判断目标区域,例如,将多个矩形区域输入该目标区域确定模型,根据该目标区域确定模型的输出结果确定最接近目标区域的矩形区域,将该矩形区域作为目标区域。
本领域技术人员应能理解,在上述各个实施例的基础上,还可以进行明显变型(例如,对所列举的模式进行组合)或等同替换。
在上文中,虽然按照上述的顺序描述了目标区域确定模型目标区域确定模型的训练方法实施例中的各个步骤,本领域技术人员应清楚,本公开实施例中的步骤并不必然按照上述顺序执行,其也可以倒序、并行、交叉等其他顺序执行,而且,在上述步骤的基础上,本领域技术人员也可以再加入其他步骤,这些明显变型或等同替换的方式也应包含在本公开的保护范围之内,在此不再赘述。
下面为本公开装置实施例,本公开装置实施例可用于执行本公开方法实施例实现的步骤,为了便于说明,仅示出了与本公开实施例相关的部分,具体技术细节未揭示的,请参照本公开方法实施例。
实施例三
为了解决现有技术中目标区域确定正确率低的技术问题,本公开实施例提供一种目标区域确定模型的训练装置。该装置可以执行上述实施例一所述的目标区域确定模型的训练方法实施例中的步骤。如图3所示,该装置主要包括:样本获取模块31、参数确定模块32、关键点预测模块33、误差确定模块34和参数调整模块35;其中,
样本获取模块31用于获取训练样本集合;其中,所述训练样本集合由多个标记了目标区域关键点的样本图像组成;
参数确定模块32用于确定所述卷积神经网络的参数;
关键点预测模块33用于将所述训练样本集合输入所述卷积神经网络,得到每个样本图像的预测关键点;
误差确定模块34用于根据每个样本图像的预测关键点和真实关键点确定预测误差;
参数调整模块35用于若所述预测误差大于预设误差,则根据所述预设误差重新确定所述卷积神经网络的参数,继续重复训练过程,直至所述预测误差小于或等于所述预设误差,结束训练过程,得到所述目标区域确定模型。
进一步的,所述目标区域为车牌区域。
进一步的,所述关键点为所述车牌区域四个顶角对应的点。
有关目标区域确定模型目标区域确定模型的训练装置实施例的工作原理、实现的技术效果等详细说明可以参考前述目标区域确定模型目标区域确定模型的训练方法实施例中的相关说明,在此不再赘述。
实施例四
为了解决现有技术中目标区域确定正确率低的技术问题,本公开实施例提供一种目标区域确定装置。该装置可以执行上述实施例二所述的目标区域确定模型的训练方法实施例中的步骤。如图4所示,该装置主要包括:图像获取模块 41、图像输入模块42、预测模块43和区域确定模块44;其中,
图像获取模块41用于获取待识别图像;
图像输入模块42用于将所述待识别图像输入目标区域确定模型;
其中,所述目标区域确定模型采用实施例一所述的训练方法进行训练得到,具体参见上述实施例一,这里不再赘述。
预测模块43用于通过所述目标区域确定模型预测得到多个关键点;
区域确定模块44用于根据所述多个关键点确定目标区域。
进一步的,所述预测模块43包括:关键点筛选单元431和区域确定单元 432;其中,
关键点筛选单元431用于从所述多个关键点中筛选出预设个数关键点;
区域确定单元432用于根据所述预设个数关键点确定所述目标区域。
进一步的,所述关键点筛选单元431具体用于:通过目标区域识别模型对所述待识别图像进行识别,得到预测目标区域;从所述多个关键点中筛选出位于所述预测目标区域内的预设个数关键点。
进一步的,所述预测模块43具体用于:从所述多个关键点中选取预设个数关键点进行连线,得到多个闭合区域;根据预设条件从所述多个闭合区域中筛选出一个闭合区域作为所述目标区域。
进一步的,所述目标区域为车牌区域。
有关目标区域确定装置实施例的工作原理、实现的技术效果等详细说明可以参考前述目标区域确定方法实施例中的相关说明,在此不再赘述。
实施例五
下面参考图5,其示出了适于用来实现本公开实施例的电子设备的结构示意图。本公开实施例中的电子设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图5示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图5所示,电子设备可以包括处理装置(例如中央处理器、图形处理器等)501,其可以根据存储在只读存储器(ROM)502中的程序或者从存储装置 508加载到随机访问存储器(RAM)503中的程序而执行各种适当的动作和处理。在RAM 503中,还存储有电子设备操作所需的各种程序和数据。处理装置 501、ROM 502以及RAM 503通过总线504彼此相连。输入/输出(I/O)接口 505也连接至总线504。
通常,以下装置可以连接至I/O接口505:包括例如触摸屏、触摸板、键盘、鼠标、图像传感器、麦克风、加速度计、陀螺仪等的输入装置506;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置507;包括例如磁带、硬盘等的存储装置508;以及通信装置509。通信装置509可以允许电子设备与其他设备进行无线或有线通信以交换数据。虽然图5示出了具有各种装置的电子设备,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置509从网络上被下载和安装,或者从存储装置508被安装,或者从ROM 502被安装。在该计算机程序被处理装置501执行时,执行本公开实施例的方法中限定的上述功能。
需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:获取训练样本集合;其中,所述训练样本集合由多个标记了目标区域关键点的样本图像组成;确定卷积神经网络的参数;将所述训练样本集合输入所述卷积神经网络,得到每个样本图像的预测关键点;根据每个样本图像的预测关键点和真实关键点确定预测误差;若所述预测误差大于预设误差,则根据所述预设误差重新确定所述卷积神经网络的参数,继续重复训练过程,直至所述预测误差小于或等于所述预设误差,结束训练过程,得到所述目标区域确定模型。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言—诸如Java、 Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和 /或或流程图中的每个方框、以及框图和/或或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,单元的名称在某种情况下并不构成对该单元本身的限定。
以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开中所涉及的公开范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述公开构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (14)

1.一种目标区域确定模型的训练方法,其特征在于,包括:
获取训练样本集合;其中,所述训练样本集合由多个标记了目标区域关键点的样本图像组成;
确定卷积神经网络的参数;
将所述训练样本集合输入所述卷积神经网络,得到每个样本图像的预测关键点;
根据每个样本图像的预测关键点和真实关键点确定预测误差;
若所述预测误差大于预设误差,则根据所述预设误差重新确定所述卷积神经网络的参数,继续重复训练过程,直至所述预测误差小于或等于所述预设误差,结束训练过程,得到目标区域确定模型。
2.根据权利要求1所述的方法,其特征在于,所述目标区域为车牌区域。
3.根据权利要求2所述的方法,其特征在于,所述关键点为所述车牌区域四个顶角对应的点。
4.一种目标区域确定方法,其特征在于,包括:
获取待识别图像;
将所述待识别图像输入采用权利要求1-3任一项所述的目标区域确定模型的训练方法进行训练得到的目标区域确定模型;
通过所述目标区域确定模型预测得到多个关键点;
根据所述多个关键点确定目标区域。
5.根据权利要求4所述的方法,其特征在于,所述根据所述多个关键点确定目标区域,包括:
从所述多个关键点中筛选出预设个数关键点;
根据所述预设个数关键点确定所述目标区域。
6.根据权利要求5所述的方法,其特征在于,所述从所述多个关键点中筛选出预设个数关键点,包括:
通过目标区域识别模型对所述待识别图像进行识别,得到预测目标区域;
从所述多个关键点中筛选出位于所述预测目标区域内的预设个数关键点。
7.根据权利要求4所述的方法,其特征在于,所述根据所述多个关键点确定目标区域,包括:
从所述多个关键点中选取预设个数关键点进行连线,得到多个闭合区域;
根据预设条件从所述多个闭合区域中筛选出一个闭合区域作为所述目标区域。
8.根据权利要求4-7任一项所述的方法,其特征在于,所述目标区域为车牌区域。
9.一种目标区域确定模型的训练装置,其特征在于,包括:
样本获取模块,用于获取训练样本集合;其中,所述训练样本集合由多个标记了目标区域关键点的样本图像组成;
目标区域确定模型目标区域确定模型
参数确定模块,用于确定卷积神经网络的参数;
关键点预测模块,用于将所述训练样本集合输入所述卷积神经网络,得到每个样本图像的预测关键点;
误差确定模块,用于根据每个样本图像的预测关键点和真实关键点确定预测误差;
参数调整模块,用于若所述预测误差大于预设误差,则根据所述预设误差重新确定所述卷积神经网络的参数,继续重复训练过程,直至所述预测误差小于或等于所述预设误差,结束训练过程,得到目标区域确定模型。
10.一种目标区域确定装置,其特征在于,包括:
图像获取模块,用于获取待识别图像;
图像输入模块,用于将所述待识别图像输入采用权利要求1-3任一项所述的目标区域确定模型的训练方法进行训练得到的目标区域确定模型;
预测模块,用于通过所述目标区域确定模型预测得到多个关键点;
区域确定模块,用于根据所述多个关键点确定目标区域。
11.一种电子设备,包括:
存储器,用于存储非暂时性计算机可读指令;以及
处理器,用于运行所述计算机可读指令,使得所述处理器执行时实现根据权利要求1-3中任意一项所述的目标区域确定模型的训练方法。
12.一种计算机可读存储介质,用于存储非暂时性计算机可读指令,当所述非暂时性计算机可读指令由计算机执行时,使得所述计算机执行权利要求1-3中任意一项所述的目标区域确定模型的训练方法。
13.一种电子设备,包括:
存储器,用于存储非暂时性计算机可读指令;以及
处理器,用于运行所述计算机可读指令,使得所述处理器执行时实现根据权利要求4-8中任意一项所述的目标区域确定方法。
14.一种计算机可读存储介质,用于存储非暂时性计算机可读指令,当所述非暂时性计算机可读指令由计算机执行时,使得所述计算机执行权利要求4-8中任意一项所述的目标区域确定方法。
CN201910485054.4A 2019-06-05 2019-06-05 目标区域确定模型的训练方法、装置和计算机可读存储介质 Pending CN110287954A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910485054.4A CN110287954A (zh) 2019-06-05 2019-06-05 目标区域确定模型的训练方法、装置和计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910485054.4A CN110287954A (zh) 2019-06-05 2019-06-05 目标区域确定模型的训练方法、装置和计算机可读存储介质

Publications (1)

Publication Number Publication Date
CN110287954A true CN110287954A (zh) 2019-09-27

Family

ID=68003355

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910485054.4A Pending CN110287954A (zh) 2019-06-05 2019-06-05 目标区域确定模型的训练方法、装置和计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN110287954A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111953933A (zh) * 2020-07-03 2020-11-17 北京中安安博文化科技有限公司 一种确定火灾区域的方法、装置、介质和电子设备
CN112569591A (zh) * 2021-03-01 2021-03-30 腾讯科技(深圳)有限公司 一种数据处理方法、装置、设备及可读存储介质
CN113326860A (zh) * 2020-05-29 2021-08-31 阿里巴巴集团控股有限公司 数据处理方法、装置、电子设备和计算机存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105868769A (zh) * 2015-01-23 2016-08-17 阿里巴巴集团控股有限公司 图像中的人脸关键点定位方法及装置
CN106599830A (zh) * 2016-12-09 2017-04-26 中国科学院自动化研究所 人脸关键点定位方法及装置
CN108090423A (zh) * 2017-12-01 2018-05-29 上海工程技术大学 一种基于热力图和关键点回归的深度车牌检测方法
CN108230390A (zh) * 2017-06-23 2018-06-29 北京市商汤科技开发有限公司 训练方法、关键点检测方法、装置、存储介质和电子设备
CN108898087A (zh) * 2018-06-22 2018-11-27 腾讯科技(深圳)有限公司 人脸关键点定位模型的训练方法、装置、设备及存储介质
CN109508681A (zh) * 2018-11-20 2019-03-22 北京京东尚科信息技术有限公司 生成人体关键点检测模型的方法和装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105868769A (zh) * 2015-01-23 2016-08-17 阿里巴巴集团控股有限公司 图像中的人脸关键点定位方法及装置
CN106599830A (zh) * 2016-12-09 2017-04-26 中国科学院自动化研究所 人脸关键点定位方法及装置
CN108230390A (zh) * 2017-06-23 2018-06-29 北京市商汤科技开发有限公司 训练方法、关键点检测方法、装置、存储介质和电子设备
CN108090423A (zh) * 2017-12-01 2018-05-29 上海工程技术大学 一种基于热力图和关键点回归的深度车牌检测方法
CN108898087A (zh) * 2018-06-22 2018-11-27 腾讯科技(深圳)有限公司 人脸关键点定位模型的训练方法、装置、设备及存储介质
CN109508681A (zh) * 2018-11-20 2019-03-22 北京京东尚科信息技术有限公司 生成人体关键点检测模型的方法和装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
董欣: "车牌精确定位算法探究", 《中国优秀硕士学位论文全文数据库 _工程科技Ⅱ辑》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113326860A (zh) * 2020-05-29 2021-08-31 阿里巴巴集团控股有限公司 数据处理方法、装置、电子设备和计算机存储介质
CN113326860B (zh) * 2020-05-29 2023-12-15 阿里巴巴集团控股有限公司 数据处理方法、装置、电子设备和计算机存储介质
CN111953933A (zh) * 2020-07-03 2020-11-17 北京中安安博文化科技有限公司 一种确定火灾区域的方法、装置、介质和电子设备
CN111953933B (zh) * 2020-07-03 2022-07-05 北京中安安博文化科技有限公司 一种确定火灾区域的方法、装置、介质和电子设备
CN112569591A (zh) * 2021-03-01 2021-03-30 腾讯科技(深圳)有限公司 一种数据处理方法、装置、设备及可读存储介质

Similar Documents

Publication Publication Date Title
CN110276345A (zh) 卷积神经网络模型训练方法、装置和计算机可读存储介质
CN110276346A (zh) 目标区域识别模型训练方法、装置和计算机可读存储介质
CN110288082A (zh) 卷积神经网络模型训练方法、装置和计算机可读存储介质
CN110321958A (zh) 神经网络模型的训练方法、视频相似度确定方法
CN110287954A (zh) 目标区域确定模型的训练方法、装置和计算机可读存储介质
CN110399848A (zh) 视频封面生成方法、装置及电子设备
CN110381368A (zh) 视频封面生成方法、装置及电子设备
CN108491816A (zh) 在视频中进行目标跟踪的方法和装置
CN109976620A (zh) 列表项展现属性信息的确定方法、装置、设备及存储介质
CN110288037A (zh) 图像处理方法、装置及电子设备
CN110287816A (zh) 车门动作检测方法、装置和计算机可读存储介质
CN110287810A (zh) 车门动作检测方法、装置和计算机可读存储介质
CN110046310A (zh) 分析页面中的跳转链接的方法和装置
CN110191356A (zh) 视频审核方法、装置和电子设备
CN109948699A (zh) 用于生成特征图的方法和装置
CN109948700A (zh) 用于生成特征图的方法和装置
CN110347875A (zh) 一种视频场景分类方法、装置、移动终端及存储介质
CN110415276A (zh) 运动信息计算方法、装置及电子设备
CN110069191A (zh) 基于终端的图像拖拽变形实现方法和装置
CN108460454A (zh) 卷积神经网络和用于其的处理方法、装置、系统
CN110287817A (zh) 目标识别及目标识别模型的训练方法、装置和电子设备
CN115457364A (zh) 一种目标检测知识蒸馏方法、装置、终端设备和存储介质
CN109101294A (zh) 数据采集方法及插件、电子设备及存储介质
CN110287350A (zh) 图像检索方法、装置及电子设备
CN111627029B (zh) 图像实例分割结果的获取方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190927