CN111709461A - 动物识别模型的训练方法、装置、设备及存储介质 - Google Patents
动物识别模型的训练方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN111709461A CN111709461A CN202010462478.1A CN202010462478A CN111709461A CN 111709461 A CN111709461 A CN 111709461A CN 202010462478 A CN202010462478 A CN 202010462478A CN 111709461 A CN111709461 A CN 111709461A
- Authority
- CN
- China
- Prior art keywords
- sample
- recognition model
- key points
- animal
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 241001465754 Metazoa Species 0.000 title claims abstract description 220
- 238000012549 training Methods 0.000 title claims abstract description 80
- 238000000034 method Methods 0.000 title claims abstract description 52
- 238000002372 labelling Methods 0.000 claims abstract description 52
- 230000015654 memory Effects 0.000 claims description 19
- 238000012545 processing Methods 0.000 claims description 13
- 238000004364 calculation method Methods 0.000 claims description 5
- 238000013473 artificial intelligence Methods 0.000 abstract description 2
- 238000001514 detection method Methods 0.000 description 15
- 241000282326 Felis catus Species 0.000 description 8
- 238000004590 computer program Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 210000004709 eyebrow Anatomy 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/46—Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
- G06V10/462—Salient features, e.g. scale invariant feature transforms [SIFT]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本申请提出了一种动物识别模型的训练方法、装置、设备及存储介质,涉及人工智能领域,具体实现方案为:获取动物脸样本图像,动物脸样本图像之中包括多个标注关键点;将动物脸样本图像输入动物识别模型以生成多个样本关键点;根据多个样本关键点生成样本外接框,并根据多个标注关键点生成标注外接框;根据样本外接框和标注外接框生成第一损失值;以及根据第一损失值对动物识别模型进行训练,以便于根据训练后的动物识别模型对动物脸图像进行关键点的提取。由此,能够提高关键点检测的准确度,进而,提高基于关键点的应用的可靠性。
Description
技术领域
本申请涉及图像处理技术领域中的人工智能技术领域,尤其涉及一种动物识别模型的训练方法、装置、设备及存储介质。
背景技术
随着图像处理技术的进步,基于二维图像中关键点的检测进行三维模型的构建等场景应用越发常见,其中,关键点提取的精度将会直接影响场景应用的前景。
相关技术中的关键点检测方法,通过识别图像中的图像特征,根据图像特征确定出对应关键点的位置,然而,这种基于图像特征进行关键点提取的方式,容易被图像中的噪声影响,导致关键点的提取精度不高。
发明内容
本申请提出了一种动物识别模型的训练方法、装置、设备及存储介质。
本申请第一方面实施例提出了一种动物识别模型的训练方法,包括:
获取动物脸样本图像,其中,所述动物脸样本图像之中包括多个标注关键点;
将所述动物脸样本图像输入所述动物识别模型以生成多个样本关键点;
根据所述多个样本关键点生成样本外接框,并根据所述多个标注关键点生成标注外接框;
根据所述样本外接框和所述标注外接框生成第一损失值;以及
根据所述第一损失值对所述动物识别模型进行训练。
本申请第二方面实施例提出了一种动物识别模型的训练装置,包括:
获取模块,用于获取动物脸样本图像,其中,所述动物脸样本图像之中包括多个标注关键点;
处理模块,用于将所述动物脸样本图像输入所述动物识别模型以生成多个样本关键点;
第一生成模块,用于根据所述多个样本关键点生成样本外接框;
第二生成模块,用于根据所述多个标注关键点生成标注外接框;
第一计算模块,用于根据所述样本外接框和所述标注外接框生成第一损失值;以及
训练模块,用于根据所述第一损失值对所述动物识别模型进行训练。
本申请第三方面实施例提出了一种电子设备,包括至少一个处理器,以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如第一方面实施例所述的动物识别模型的训练方法。
本申请第四方面实施例提出了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行如第一方面实施例所述的动物识别模型的训练方法。
上述申请中的一个实施例具有如下优点或有益效果:由于采用了根据多个样本关键点生成样本外接框、根据多个标注关键点生成标注外接框,并通过样本外接框和标注外接框计算第一损失值,能够挖掘关键点分布的约束关系,使动物识别模型能够学习到关键点之间的约束关系。进而通过第一损失值训练动物识别模型,提高了动物识别模型的准确度。进一步根据训练的动物识别模型对动物脸图像进行关键点检测,提高了关键点检测的精度。
应当理解,本部分所描述的内容并非旨在标识本申请的实施例的关键或重要特征,也不用于限制本申请的范围。本申请的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本申请的限定。其中:
图1为本申请实施例所提供的一种动物识别模型的训练方法的流程示意图;
图2为本申请实施例所提供的一种外接框的示意图;
图3为本申请实施例所提供的另一种动物识别模型的训练方法的流程示意图;
图4为本申请实施例所提供的一种关键点检测的流程示意图;
图5为本申请实施例所提供的一种动物识别模型的训练装置的结构示意图;
图6为本申请实施例所提供的另一种动物识别模型的训练装置的结构示意图;
图7示出了适于用来实现本申请实施例的示例性电子设备的框图。
具体实施方式
以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
图1为本申请实施例所提供的一种动物识别模型的训练方法的流程示意图,如图1所示,该方法包括:
步骤101,获取动物脸样本图像,其中,动物脸样本图像之中包括多个标注关键点。
本实施例中,获取包括多个标注关键点的动物脸样本图像,并将动物脸样本图像作为动物识别模型的训练样本,其中动物脸样本图像可以有多个,每一动物脸样本图像中可包括多个标注关键点。标注关键点例如包括标注关键点的坐标信息。其中,标注关键点为真值,即根据标注关键点能够定位动物脸样本图像中动物脸部的关键区域位置,例如眼睛、嘴巴等。
需要说明的是,动物脸样本图像可以根据需要获取。作为一种示例,对于猫脸识别模型,可以获取猫脸样本图像,其中,猫脸样本图像之中包括多个标注关键点。作为另一种示例,对于人脸识别模型,可以获取人脸样本图像,其中,人脸样本图像之中包括多个标注关键点。
步骤102,将动物脸样本图像输入动物识别模型以生成多个样本关键点。
本实施例中,动物识别模型输入为图像,输出为图像之中的关键点。根据动物识别模型对动物脸样本图像进行处理,提取动物脸样本图像之中的多个关键点,并将动物识别模型识别到的多个关键点作为多个样本关键点。
其中,动物识别模型例如可以基于深度学习方法实现,本实施例中对此不作具体限制。
步骤103,根据多个样本关键点生成样本外接框,并根据多个标注关键点生成标注外接框。
本实施例中,根据多个样本关键点生成样本外接框,并根据多个标注关键点生成标注外接框,以根据样本外接框和标注外接框计算损失,从而能够挖掘关键点分布的约束关系。其中,多个样本关键点位于样本外接框上,或者,多个样本关键点位于样本外接框上和样本外接框内部。多个标注关键点位于标注外接框上,或者,多个标注关键点位于标注外接框上和标注外接框内部。
举例而言,以矩形框为例,参照图2,其中,样本关键点B1、B2、B3,分别对应标注关键点A1、A2、A3,生成的标注外接框如图中实线所示,生成的样本外接框如图中虚线所示。
需要说明的是,样本外接框和标注外接框的实现形式包括但不限于矩形外接框、三角形外接框等。
步骤104,根据样本外接框和标注外接框生成第一损失值。
本实施例中,通过计算样本外接框和标注外接框之间的位置损失,以生成第一损失值。作为一种示例,根据样本外接框的顶点坐标、标注外接框的顶点坐标,根据顶点坐标计算样本外接框和标注外接框之间的位置损失,以生成第一损失值。
在本申请的一个实施例中,样本外接框和标注外接框为矩形,获取样本外接框的左上角顶点坐标、右下角顶点坐标,以及获取标注外接框的左上角顶点坐标、右下角顶点坐标,以xy坐标系为例,分别计算样本外接框和标注外接框左上角和右下角在x和y两个方向共四个距离损失,根据距离损失得到第一损失值。
步骤105,根据第一损失值对动物识别模型进行训练。
本实施例中,根据第一损失值对动物识别模型进行监督训练,以损失来衡量输出值与标注值的差距,并据此差距对动物识别模型进行参数调整,参数调整例如通过反向传播算法调整。通过调整动物识别模型参数,以使动物识别模型输出的关键点,与标注关键点更接近,从而实现对动物识别模型进行训练。
本申请实施例的动物识别模型的训练方法,通过获取动物脸样本图像,其中,动物脸样本图像之中包括多个标注关键点;将动物脸样本图像输入动物识别模型以生成多个样本关键点,根据多个样本关键点生成样本外接框,并根据多个标注关键点生成标注外接框。进而,根据样本外接框和标注外接框生成第一损失值,以及根据第一损失值对动物识别模型进行训练。由此,在训练动物识别模型时,通过样本外接框和标注外接框计算第一损失值,能够挖掘关键点分布的约束关系,使动物识别模型能够学习到关键点之间的约束关系。通过第一损失值训练动物识别模型,使得动物识别模型预测的关键点和标注关键点更接近,提高了动物识别模型的关键点检测精度。进一步根据训练的动物识别模型对动物脸图像进行关键点检测,能够使关键点检测更准确,提高了关键点检测的精度。
基于上述实施例,下面以矩形外接框为例对动物识别模型的训练步骤进行进一步说明。
图3为本申请实施例所提供的另一种动物识别模型的训练方法的流程示意图,如图3所示,动物识别模型通过以下步骤训练得到:
步骤301,获取动物脸样本图像,其中,动物脸样本图像之中包括多个标注关键点。
步骤302,将动物脸样本图像输入动物识别模型以生成多个样本关键点。
步骤303,根据多个样本关键点生成样本外接框,并根据多个标注关键点生成标注外接框。
本实施例中,根据多个样本关键点生成样本外接框,并根据多个标注关键点生成标注外接框,以根据样本外接框和标注外接框计算损失。其中,样本外接框和标注外接框为矩形。
下面对生成样本外接框的实现方式进行说明。
作为一种可能的实现方式,根据多个样本关键点生成样本外接框,包括:获取多个样本关键点的位置坐标,获取多个样本关键点的位置坐标之中的最大坐标和最小坐标,以及根据多个样本关键点的位置坐标之中的最大坐标和最小坐标生成样本外接框。
其中,最大坐标可包括最大横坐标和最大纵坐标,最小坐标可包括最小横坐标和最小纵坐标。
作为一种示例,以xy坐标系为例,将动物脸样本图像输入动物识别模型以生成多个样本关键点之后,即可获取多个样本关键点的位置坐标。对于多个位置坐标,获取其中的最大横坐标x1和最大纵坐标y1,以及获取其中的最小横坐标x2和最小纵坐标y2,进而将(x1,y1)(x1,y2)(x2,y1)(x2,y2)作为样本外接框的四个顶点,根据四个顶点生成样本外接框。由此,能够根据样本关键点确定矩形样本外接框,进一步根据样本外接框计算损失值并对模型进行训练,能够挖掘关键点分布的约束关系,提高动物识别模型准确度。
下面对生成标注外接框的实现方式进行说明。
作为一种可能的实现方式,根据多个标注关键点生成标注外接框,包括:获取多个标注关键点的位置坐标,获取多个标注关键点的位置坐标之中的最大坐标和最小坐标,以及根据多个标注关键点的位置坐标之中的最大坐标和最小坐标生成标注外接框。
其中,最大坐标可包括最大横坐标和最大纵坐标,最小坐标可包括最小横坐标和最小纵坐标。
作为一种示例,以xy坐标系为例,对于动物脸样本图像,可获取多个标注关键点的位置坐标。对于多个位置坐标,获取其中的最大横坐标x3和最大纵坐标y3,以及获取其中的最小横坐标x4和最小纵坐标y4,进而将(x3,y3)(x3,y4)(x4,y3)(x4,y4)作为标注外接框的四个顶点,根据四个顶点生成标注外接框。由此,能够根据标注关键点确定矩形标注外接框,进一步根据标注外接框计算损失值并对模型进行训练,能够挖掘关键点分布的约束关系,提高动物识别模型准确度。
步骤304,根据多个样本关键点和多个标注关键点生成第二损失值。
本实施例中,分别计算多个样本关键点和对应的多个标注关键点之间的距离损失,根据距离损失生成第二损失值。可选地,距离损失可以根据关键点之间的位置差得到。
作为一种示例,对于样本关键点A、B,对应的标注关键点分别为a、b,根据A和a的坐标计算距离损失1,根据B和b的坐标计算距离损失2,将距离损失1、距离损失2相加得到第二损失值。
需要说明的是,上述生成第二损失值的实现方式仅为一种示例,本实施例中对此不作具体限制。
步骤305,根据样本外接框和标注外接框生成第一损失值。
本实施例中,通过计算样本外接框和标注外接框之间的位置损失,以生成第一损失值。
本实施例中,样本外接框和标注外接框为矩形,获取样本外接框的左上角顶点坐标、右下角顶点坐标,以及获取标注外接框的左上角顶点坐标、右下角顶点坐标,以xy坐标系为例,分别计算样本外接框和标注外接框左上角和右下角在x和y两个方向共四个距离损失,根据距离损失得到第一损失值。
可选地,第一损失值通过如下方式确定:
第一损失值L=smooth_L1_loss(x,x’)+smooth_L1_loss(y,y’)+smooth_L1_loss(X,X’)+smooth_L1_loss(Y,Y’)
其中,x为多个标注关键点的位置坐标之中的最小横坐标,
x’为多个样本关键点的位置坐标之中的最小横坐标,
y为多个标注关键点的位置坐标之中的最小纵坐标,
y’为多个样本关键点的位置坐标之中的最小纵坐标,
X为多个标注关键点的位置坐标之中的最大横坐标,
X’为多个样本关键点的位置坐标之中的最大横坐标,
Y为多个标注关键点的位置坐标之中的最大纵坐标,
Y’为多个样本关键点的位置坐标之中的最大纵坐标。
作为一种示例,以三个关键点为例,其中,样本关键点B1(bx1,by1)、B2(bx2,by2)、B3(bx3,by3),分别对应标注关键点A1(ax1,ay1)、A2(ax2,ay2)、A3(ax3,ay3)。
标注外接框左上角坐标(min(ax1,ax2,ax3),min(ay1,ay2,ay3)),标注外接框右下角坐标(max(ax1,ax2,ax3),max(ay1,ay2,ay3))。
样本外接框左上角坐标(min(bx1,bx2,bx3),min(by1,by2,by3)),样本外接框右下角坐标(max(bx1,bx2,bx3),max(by1,by2,by3))。
L=smooth_L1_loss(min(ax1,ax2,ax3),min(bx1,bx2,bx3))+smooth_L1_loss(min(ay1,ay2,ay3),min(by1,by2,by3))+smooth_L1_loss(max(ax1,ax2,ax3),max(bx1,bx2,bx3))+smooth_L1_loss(max(ay1,ay2,ay3),max(by1,by2,by3))。
步骤306,根据第一损失值和第二损失值对动物识别模型进行训练。
本实施例中,根据第一损失值和第二损失值对动物识别模型进行训练可包括:根据第一损失值和第二损失值确定第三损失值,根据第三损失值对动物识别模型进行训练。
其中,根据第一损失值和第二损失值确定第三损失值的实现方式有多种。
作为一种示例,将第一损失值和第二损失值之和作为第三损失值,根据第三损失值对动物识别模型进行训练。
作为另一种示例,将第一损失值和第二损失值的乘积作为第三损失值,根据第三损失值对动物识别模型进行训练。
需要说明的是,上述根据第一损失值和第二损失值确定第三损失值的实现方式仅为示例,可以根据实际需要选择不同的方式确定第三损失值,此处不作限制。
本实施例中,通过第三损失值对动物识别模型进行监督训练,以损失来衡量输出值与标注值的差距,并据此差距对动物识别模型进行参数调整,参数调整例如通过反向传播算法调整。通过调整动物识别模型参数,以使动物识别模型输出的关键点,与标注关键点更接近,从而实现对动物识别模型进行训练。
本申请实施例的动物识别模型的训练方法,通过获取动物脸样本图像,其中,动物脸样本图像之中包括多个标注关键点;将动物脸样本图像输入动物识别模型以生成多个样本关键点,根据多个样本关键点生成样本外接框,并根据多个标注关键点生成标注外接框。进而,根据多个样本关键点和多个标注关键点生成第二损失值,根据样本外接框和标注外接框生成第一损失值,以及根据第一损失值和第二损失值对动物识别模型进行训练。由此,在训练动物识别模型时,通过引入关键点的矩形外接框计算损失值,充分挖掘关键点分布的约束关系,使动物识别模型能够学习到关键点之间的约束关系。并且,通过外接框的损失和关键点的损失确定总损失值,根据总损失值实现动物识别模型的监督训练,使动物识别模型预测的关键点更接近真值,提高动物识别模型的准确度。
下面对通过动物识别模型提取动物脸图像之中的关键点进行说明。
图4为本申请实施例所提供的一种关键点检测的流程示意图,如图4所示,该方法包括:
步骤401,获取动物脸图像。
本申请实施例的动物识别模型的训练方法,应用于训练动物识别模型,其中,动物识别模型用于脸部图像的关键点检测。
本实施例中,在通过动物识别模型进行关键点检测时,可以获取动物脸图像,以根据动物脸图像检测关键点。
其中,获取动物脸图像的方式有多种。可选地,通过图像采集设备来获取动物脸图像,例如,用户站在图像采集设备的拍摄区域进行拍摄,获取包括用户脸部的图像,从而得到动物脸图像。可选地,通过相关应用程序从网络抓取动物脸图像。
其中,动物脸图像包括但不限于人脸图像、猫脸图像等。
步骤402,将动物脸图像输入至动物识别模型之中以提取动物脸图像之中的关键点。
本实施例中,预先训练动物识别模型,动物识别模型输入为动物脸图像,输出为动物脸图像之中的关键点。其中,在训练动物识别模型时,根据动物脸样本图像中的标注关键点确定标注关键点的标注外接框,根据动物识别模型预测得到的样本关键点确定样本外接框,进而根据标注外接框和样本外接框计算损失值,根据损失值对动物识别模型进行监督训练。进而,将动物脸图像输入至动物识别模型之中以提取动物脸图像之中的多个关键点。
作为一种示例,在获取动物脸图像后,将动物脸图像输入至动物识别模型中进行处理,输出动物脸图像之中关键点的坐标信息,从而实现提取动物脸图像之中的多个关键点。
在本申请的一个实施例中,根据动物脸图像的类别,训练与动物脸图像类别匹配的动物识别模型,进而通过与动物脸图像类别匹配的动物识别模型提取动物脸图像之中的多个关键点。例如,对于猫脸图像关键点检测,通过标注关键点的猫脸样本图像训练目标动物识别模型,在获取猫脸图像后,调用目标动物识别模型提取猫脸图像之中的多个关键点。
本实施例中,通过检测动物脸图像之中的多个关键点,可以根据检测得到的关键点定位动物脸部的关键区域位置,包括眉毛、眼睛、鼻子、嘴巴、脸部轮廓等。
本申请实施例的动物识别模型的训练方法,通过获取动物脸图像,将动物脸图像输入至动物识别模型之中以提取动物脸图像之中的多个关键点。由此,根据训练的动物识别模型对动物脸图像进行关键点检测,能够使关键点检测更准确,提高了关键点检测的精度,进一步将检测的关键点应用于关键区域定位、表情识别等场景,能够提高基于关键点的应用的可靠性。
为了实现上述实施例,本申请还提出一种动物识别模型的训练装置。
图5为本申请实施例所提供的一种动物识别模型的训练装置的结构示意图,如图5所示,该装置包括:获取模块10,处理模块20,第一生成模块30,第二生成模块40,第一计算模块50,训练模块60。
其中,获取模块10,用于获取动物脸样本图像,动物脸样本图像之中包括多个标注关键点。
处理模块20,用于将动物脸样本图像输入动物识别模型以生成多个样本关键点。
第一生成模块30,用于根据多个样本关键点生成样本外接框。
第二生成模块40,用于根据多个标注关键点生成标注外接框。
第一计算模块50,用于根据样本外接框和标注外接框生成第一损失值。
训练模块60,用于根据第一损失值对动物识别模型进行训练,以便于根据训练后的动物识别模型对动物脸图像进行关键点的提取。
在图4的基础上,图5所示的动物识别模型的训练装置还包括:第二计算模块70。
其中,第二计算模块70,用于根据多个样本关键点和多个标注关键点生成第二损失值;
训练模块60具体用于:根据第一损失值和第二损失值对动物识别模型进行训练。
可选地,第一生成模块30具体用于:获取多个样本关键点的位置坐标;获取多个样本关键点的位置坐标之中的最大坐标和最小坐标;以及根据多个样本关键点的位置坐标之中的最大坐标和最小坐标生成样本外接框。
可选地,第二生成模块40具体用于:获取多个标注关键点的位置坐标;获取多个标注关键点的位置坐标之中的最大坐标和最小坐标;以及根据多个标注关键点的位置坐标之中的最大坐标和最小坐标生成标注外接框。
可选地,训练模块60具体用于:将第一损失值和第二损失值之和作为第三损失值;以及根据第三损失值对动物识别模型进行训练。
前述实施例对动物识别模型的训练方法的解释说明同样适用于本实施例的动物识别模型的训练装置,此处不再赘述。
本申请实施例的动物识别模型的训练装置,通过获取动物脸样本图像,其中,动物脸样本图像之中包括多个标注关键点;将动物脸样本图像输入动物识别模型以生成多个样本关键点,根据多个样本关键点生成样本外接框,并根据多个标注关键点生成标注外接框。进而,根据样本外接框和标注外接框生成第一损失值,以及根据第一损失值对动物识别模型进行训练。由此,在训练动物识别模型时,通过样本外接框和标注外接框计算第一损失值,能够挖掘关键点分布的约束关系,使动物识别模型能够学习到关键点之间的约束关系。通过第一损失值训练动物识别模型,使得动物识别模型预测的关键点和标注关键点更接近,提高了动物识别模型的关键点检测精度。进一步根据训练的动物识别模型对动物脸图像进行关键点检测,能够使关键点检测更准确,提高了关键点检测的精度。
为了实现上述实施例,本申请还提出一种计算机程序产品,当计算机程序产品中的指令被处理器执行时实现如前述任一实施例所述的动物识别模型的训练方法。
根据本申请的实施例,本申请还提供了一种电子设备和一种可读存储介质。
如图7所示,是根据本申请实施例的动物识别模型的训练方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。
如图7所示,该电子设备包括:一个或多个处理器701、存储器702,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示GUI的图形信息的指令。在其它实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样,可以连接多个电子设备,各个设备提供部分必要的操作(例如,作为服务器阵列、一组刀片式服务器、或者多处理器系统)。图7中以一个处理器701为例。
存储器702即为本申请所提供的非瞬时计算机可读存储介质。其中,所述存储器存储有可由至少一个处理器执行的指令,以使所述至少一个处理器执行本申请所提供的动物识别模型的训练方法。本申请的非瞬时计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行本申请所提供的动物识别模型的训练方法。
存储器702作为一种非瞬时计算机可读存储介质,可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块,如本申请实施例中的动物识别模型的训练方法对应的程序指令/模块(例如,附图5所示的获取模块10,处理模块20,第一生成模块30,第二生成模块40,第一计算模块50,训练模块60)。处理器701通过运行存储在存储器702中的非瞬时软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例中的动物识别模型的训练方法。
存储器702可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据电子设备的使用所创建的数据等。此外,存储器702可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中,存储器702可选包括相对于处理器701远程设置的存储器,这些远程存储器可以通过网络连接至电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
动物识别模型的训练方法的电子设备还可以包括:输入装置703和输出装置704。处理器701、存储器702、输入装置703和输出装置704可以通过总线或者其他方式连接,图7中以通过总线连接为例。
输入装置703可接收输入的数字或字符信息,以及产生与电子设备的用户设置以及功能控制有关的键信号输入,例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置704可以包括显示设备、辅助照明装置(例如,LED)和触觉反馈装置(例如,振动电机)等。该显示设备可以包括但不限于,液晶显示器(LCD)、发光二极管(LED)显示器和等离子体显示器。在一些实施方式中,显示设备可以是触摸屏。
此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用ASIC(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令,并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(PLD)),包括,接收作为机器可读信号的机器指令的机器可读介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。
Claims (12)
1.一种动物识别模型的训练方法,包括:
获取动物脸样本图像,其中,所述动物脸样本图像之中包括多个标注关键点;
将所述动物脸样本图像输入所述动物识别模型以生成多个样本关键点;
根据所述多个样本关键点生成样本外接框,并根据所述多个标注关键点生成标注外接框;
根据所述样本外接框和所述标注外接框生成第一损失值;以及
根据所述第一损失值对所述动物识别模型进行训练。
2.如权利要求1所述的动物识别模型的训练方法,其中,在将所述动物脸样本图像输入所述动物识别模型以生成多个样本关键点之后,还包括:
根据所述多个样本关键点和所述多个标注关键点生成第二损失值;
所述根据所述第一损失值对所述动物识别模型进行训练,包括:
根据所述第一损失值和所述第二损失值对所述动物识别模型进行训练。
3.如权利要求1所述的动物识别模型的训练方法,其中,所述根据所述多个样本关键点生成样本外接框,包括:
获取所述多个样本关键点的位置坐标;
获取所述多个样本关键点的位置坐标之中的最大坐标和最小坐标;以及
根据所述多个样本关键点的位置坐标之中的最大坐标和最小坐标生成所述样本外接框。
4.如权利要求1所述的动物识别模型的训练方法,其中,所述根据所述多个标注关键点生成标注外接框,包括:
获取所述多个标注关键点的位置坐标;
获取所述多个标注关键点的位置坐标之中的最大坐标和最小坐标;以及
根据所述多个标注关键点的位置坐标之中的最大坐标和最小坐标生成所述标注外接框。
5.如权利要求2所述的动物识别模型的训练方法,其中,所述根据所述第一损失值和所述第二损失值对所述动物识别模型进行训练,包括:
将所述第一损失值和所述第二损失值之和作为第三损失值;以及
根据所述第三损失值对所述动物识别模型进行训练。
6.一种动物识别模型的训练装置,包括:
获取模块,用于获取动物脸样本图像,其中,所述动物脸样本图像之中包括多个标注关键点;
处理模块,用于将所述动物脸样本图像输入所述动物识别模型以生成多个样本关键点;
第一生成模块,用于根据所述多个样本关键点生成样本外接框;
第二生成模块,用于根据所述多个标注关键点生成标注外接框;
第一计算模块,用于根据所述样本外接框和所述标注外接框生成第一损失值;以及
训练模块,用于根据所述第一损失值对所述动物识别模型进行训练。
7.如权利要求6所述的动物识别模型的训练装置,还包括:
第二计算模块,用于根据所述多个样本关键点和所述多个标注关键点生成第二损失值;
所述训练模块具体用于:根据所述第一损失值和所述第二损失值对所述动物识别模型进行训练。
8.如权利要求6所述的动物识别模型的训练装置,其中,所述第一生成模块具体用于:
获取所述多个样本关键点的位置坐标;
获取所述多个样本关键点的位置坐标之中的最大坐标和最小坐标;以及
根据所述多个样本关键点的位置坐标之中的最大坐标和最小坐标生成所述样本外接框。
9.如权利要求6所述的动物识别模型的训练装置,其中,所述第二生成模块具体用于:
获取所述多个标注关键点的位置坐标;
获取所述多个标注关键点的位置坐标之中的最大坐标和最小坐标;以及
根据所述多个标注关键点的位置坐标之中的最大坐标和最小坐标生成所述标注外接框。
10.如权利要求7所述的动物识别模型的训练装置,其中,所述训练模块具体用于:
将所述第一损失值和所述第二损失值之和作为第三损失值;以及
根据所述第三损失值对所述动物识别模型进行训练。
11.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-5中任一项所述的动物识别模型的训练方法。
12.一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行权利要求1-5中任一项所述的动物识别模型的训练方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010462478.1A CN111709461A (zh) | 2020-05-27 | 2020-05-27 | 动物识别模型的训练方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010462478.1A CN111709461A (zh) | 2020-05-27 | 2020-05-27 | 动物识别模型的训练方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111709461A true CN111709461A (zh) | 2020-09-25 |
Family
ID=72538521
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010462478.1A Pending CN111709461A (zh) | 2020-05-27 | 2020-05-27 | 动物识别模型的训练方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111709461A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112507880A (zh) * | 2020-12-09 | 2021-03-16 | 杭州百世伽信息科技有限公司 | 模型训练方法、洗手行为检测方法、装置、设备及介质 |
CN113177607A (zh) * | 2021-05-21 | 2021-07-27 | 浙江大华技术股份有限公司 | 一种对训练对象的标注方法及客户端 |
CN115909403A (zh) * | 2022-11-25 | 2023-04-04 | 天津大学四川创新研究院 | 基于深度学习的低成本高精度猪脸识别方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106778585A (zh) * | 2016-12-08 | 2017-05-31 | 腾讯科技(上海)有限公司 | 一种人脸关键点跟踪方法和装置 |
CN110298291A (zh) * | 2019-06-25 | 2019-10-01 | 吉林大学 | 基于Mask-RCNN的牛脸及牛脸关键点检测方法 |
CN110414369A (zh) * | 2019-07-05 | 2019-11-05 | 安徽省农业科学院畜牧兽医研究所 | 一种牛脸的训练方法及装置 |
CN110705419A (zh) * | 2019-09-24 | 2020-01-17 | 新华三大数据技术有限公司 | 情绪识别方法、预警方法、模型训练方法和相关装置 |
CN110889446A (zh) * | 2019-11-22 | 2020-03-17 | 高创安邦(北京)技术有限公司 | 人脸图像识别模型训练及人脸图像识别方法和装置 |
-
2020
- 2020-05-27 CN CN202010462478.1A patent/CN111709461A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106778585A (zh) * | 2016-12-08 | 2017-05-31 | 腾讯科技(上海)有限公司 | 一种人脸关键点跟踪方法和装置 |
CN110298291A (zh) * | 2019-06-25 | 2019-10-01 | 吉林大学 | 基于Mask-RCNN的牛脸及牛脸关键点检测方法 |
CN110414369A (zh) * | 2019-07-05 | 2019-11-05 | 安徽省农业科学院畜牧兽医研究所 | 一种牛脸的训练方法及装置 |
CN110705419A (zh) * | 2019-09-24 | 2020-01-17 | 新华三大数据技术有限公司 | 情绪识别方法、预警方法、模型训练方法和相关装置 |
CN110889446A (zh) * | 2019-11-22 | 2020-03-17 | 高创安邦(北京)技术有限公司 | 人脸图像识别模型训练及人脸图像识别方法和装置 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112507880A (zh) * | 2020-12-09 | 2021-03-16 | 杭州百世伽信息科技有限公司 | 模型训练方法、洗手行为检测方法、装置、设备及介质 |
CN113177607A (zh) * | 2021-05-21 | 2021-07-27 | 浙江大华技术股份有限公司 | 一种对训练对象的标注方法及客户端 |
CN115909403A (zh) * | 2022-11-25 | 2023-04-04 | 天津大学四川创新研究院 | 基于深度学习的低成本高精度猪脸识别方法 |
CN115909403B (zh) * | 2022-11-25 | 2023-08-22 | 天津大学四川创新研究院 | 基于深度学习的低成本高精度猪脸识别方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111259751B (zh) | 基于视频的人体行为识别方法、装置、设备及存储介质 | |
CN111709461A (zh) | 动物识别模型的训练方法、装置、设备及存储介质 | |
CN112330730B (zh) | 图像处理方法、装置、设备及存储介质 | |
CN111767858A (zh) | 图像识别方法、装置、设备和计算机存储介质 | |
CN111968203B (zh) | 动画驱动方法、装置、电子设备及存储介质 | |
CN110659600B (zh) | 物体检测方法、装置及设备 | |
CN111832611B (zh) | 动物识别模型的训练方法、装置、设备及存储介质 | |
CN111722245A (zh) | 定位方法、定位装置和电子设备 | |
CN112270745B (zh) | 一种图像生成方法、装置、设备以及存储介质 | |
CN112001248B (zh) | 主动交互的方法、装置、电子设备和可读存储介质 | |
CN112241716B (zh) | 训练样本的生成方法和装置 | |
CN111462179B (zh) | 三维物体跟踪方法、装置及电子设备 | |
JPWO2019111932A1 (ja) | モデル学習装置、モデル学習方法及びコンピュータプログラム | |
CN112241704A (zh) | 一种判定肖像侵权的方法、装置、电子设备及存储介质 | |
CN111862031A (zh) | 一种人脸合成图检测方法、装置、电子设备及存储介质 | |
Park et al. | Self-training based augmented reality for robust 3D object registration and task assistance | |
CN112200169B (zh) | 用于训练模型的方法、装置、设备以及存储介质 | |
CN114200934A (zh) | 机器人目标跟随控制方法、装置、电子设备和存储介质 | |
JP2017033556A (ja) | 画像処理方法及び電子機器 | |
CN116092120B (zh) | 基于图像的动作确定方法、装置、电子设备及存储介质 | |
WO2019022829A1 (en) | HUMAN FEEDBACK IN A 3D MODEL ADJUSTMENT | |
CN112488126A (zh) | 特征图处理方法、装置、设备以及存储介质 | |
CN111832612B (zh) | 动物识别模型的训练方法、装置、设备及存储介质 | |
Itkarkar et al. | A study of vision based hand gesture recognition for human machine interaction | |
CN112560678A (zh) | 表情识别方法、装置、设备及计算机存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200925 |