CN110619262A - 图像识别的方法及装置 - Google Patents
图像识别的方法及装置 Download PDFInfo
- Publication number
- CN110619262A CN110619262A CN201910307237.7A CN201910307237A CN110619262A CN 110619262 A CN110619262 A CN 110619262A CN 201910307237 A CN201910307237 A CN 201910307237A CN 110619262 A CN110619262 A CN 110619262A
- Authority
- CN
- China
- Prior art keywords
- image
- preset
- key point
- model
- cat
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A40/00—Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
- Y02A40/70—Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in livestock or poultry
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本申请公开了一种图像识别的方法及装置。该申请的方法包括根据动物脸检测模型对当前图像进行检测,确定所述当前图像中的动物脸区域;根据动物脸关键点定位模型对所述动物脸区域中的预设关键点进行定位;并且,根据快速光流计算算法对当前图像中的预设关键点进行动态跟踪;根据预设关键点的位置将预设的贴纸图像融合到所述当前图像上。本申请解决相关的软件只能对人脸进行美化处理的问题。
Description
技术领域
本申请涉及图像处理技术领域,具体而言,涉及一种图像识别的方法及装置。
背景技术
随着手机摄像头的广泛使用,生活照片的拍摄与分享成为日常生活中的一种重要的娱乐和社交方式。为了提高娱乐性和可观赏性,现有很多技术和软件会对图像整体或针对照片中出现的人脸进行美化处理,比如美颜、粘贴一些美化的贴纸等,使得照片的视觉感观、可观赏性和趣味性提高,提高关注度和被分享的可能性。但是目前在生活照片分享中,人类的宠物(猫、狗等)出现在照片中的几率非常高,而相关的软件只能对人脸进行美化处理,无法满足用户对心爱的宠物美化的需求。
发明内容
本申请的主要目的在于提供一种图像识别的方法,以解决相关的软件只能对人脸进行美化处理的问题。
为了实现上述目的,根据本申请的一个方面,提供了一种图像识别的方法。
根据本申请的图像识别的方法包括:
根据动物脸检测模型对当前图像进行检测,确定所述当前图像中的动物脸区域;
根据动物脸关键点定位模型对所述动物脸区域中的预设关键点进行定位;并且,
根据快速光流计算算法对当前图像中的预设关键点进行动态跟踪;
根据预设关键点的位置将预设的贴纸图像融合到所述当前图像上。
进一步的,所述动物脸检测模型为猫脸检测模型,在根据动猫脸检测模型对当前图像进行检测之前,所述方法还包括:
收集预设数量的猫脸图像,以对猫脸图像进行五官区域的标注,得到已标注的猫脸图像;
将已标注的猫脸图像以及预设数量的猫脸图像输入到移动视觉网络 Mobilenet网络结构中;
根据损失函数对Mobilenet网络结构进行模型训练,得到所述猫脸检测模型。
进一步的,所述动物脸关键点定位模型为猫脸关键点定位模型,所述方法还包括:
获取所述已标注的猫脸图像,以对所述已标注的猫脸图像进行预设关键点的标注,得到关键点标注图像;
根据关键点标注图像训练关键点定位算法,得到猫脸关键点定位模型。
进一步的,所述关键点定位算法为级联姿势回归算法,所述根据关键点标注图像训练级联姿势回归算法,得到猫脸关键点定位模型还包括:
基于多点差值的特征提取法,确定训练时每次迭代过程中的特征提取点坐标;并且,
基于随机蕨对级联姿势回归算法进行模型的训练,得到猫脸关键点定位模型。
进一步的,所述根据快速光流计算算法对当前图像中的预设关键点进行动态跟踪包括:
根据快速光流计算方法,估计所述当前图像对应的前一帧图像中预设关键点在后一帧图像中的位置,得到第一位置;
根据所述猫脸关键点定位模型,确定所述当前图像对应的前一帧图像中预设关键点在后一帧图像中的位置,得到第二位置;
根据所述第一位置和所述第二位置之间的距离确定预设关键点在后一帧图像中的最终位置。
进一步的,所述根据所述第一位置和第二位置之间的距离确定预设关键点在后一帧图像中的最终位置包括:
比较所述距离与预设阈值的大小;
若所述距离小于所述预设阈值,则将所述第一位置确定为所述最终位置;
若所述距离大于等于所述预设阈值,则将所述第二位置确定为所述最终位置。
进一步的,所述根据预设关键点的位置将预设的贴纸图像融合到所述当前图像上包括:
获取预设的贴纸图像与预设关键点的位置对应关系;
根据图像融合算法以及所述位置对应关系将所述预设的贴纸图像融合到所述当前图像上。
为了实现上述目的,根据本申请的另一方面,提供了一种图像识别的装置。
根据本申请的图像识别的装置包括:
确定单元,用于根据动物脸检测模型对当前图像进行检测,确定所述当前图像中的动物脸区域;
定位单元,用于根据动物脸关键点定位模型对所述动物脸区域中的预设关键点进行定位;
跟踪单元,用于根据快速光流计算算法对当前图像中的预设关键点进行动态跟踪;
融合单元,用于根据预设关键点的位置将预设的贴纸图像融合到所述当前图像上。
进一步的,所述动物脸检测模型为猫脸检测模型,所述装置还包括:
收集单元,用于在根据猫脸检测模型对当前图像进行检测之前,收集预设数量的猫脸图像,以对猫脸图像进行五官区域的标注,得到已标注的猫脸图像;
输入单元,用于将已标注的猫脸图像以及预设数量的猫脸图像输入到移动视觉网络Mobilenet网络结构中;
第一训练单元,用于根据损失函数对Mobilenet网络结构进行模型训练,得到所述猫脸检测模型。
进一步的,所述动物脸关键点定位模型为猫脸关键点定位模型,所述装置还包括:
获取单元,用于获取所述已标注的猫脸图像,以对所述已标注的猫脸图像进行预设关键点的标注,得到关键点标注图像;
第二训练单元,用于根据关键点标注图像训练关键点定位算法,得到猫脸关键点定位模型。
进一步的,所述关键点定位算法为级联姿势回归算法,所述第二训练单元还包括:
确定模块,用于基于多点差值的特征提取法,确定训练时每次迭代过程中的特征提取点坐标;
训练模块,用于基于随机蕨对级联姿势回归算法进行模型的训练,得到猫脸关键点定位模型。
进一步的,所述跟踪单元包括:
第一位置确定模块,用于根据快速光流计算方法,估计所述当前图像对应的前一帧图像中预设关键点在后一帧图像中的位置,得到第一位置;
第二位置确定模块,用于根据所述猫脸关键点定位模型,确定所述当前图像对应的前一帧图像中预设关键点在后一帧图像中的位置,得到第二位置;
最终位置确定模块,用于根据所述第一位置和所述第二位置之间的距离确定预设关键点在后一帧图像中的最终位置。
进一步的,所述最终位置确定模块,用于:
比较所述距离与预设阈值的大小;
若所述距离小于所述预设阈值,则将所述第一位置确定为所述最终位置;
若所述距离大于等于所述预设阈值,则将所述第二位置确定为所述最终位置。
进一步的,所述融合单元包括:
获取模块,用于获取预设的贴纸图像与预设关键点的位置对应关系;
融合模块,用于根据图像融合算法以及所述位置对应关系将所述预设的贴纸图像融合到所述当前图像上。
在本申请实施例中,图像识别的方法和装置能够根据动物脸检测模型检测出图像中的动物脸区域,并能够根据动物脸定位模型定位动物脸的预设关键点,并且可以对图像中的预设关键点进行动态跟踪,最终将预设的贴纸图像融合在图像中。这种方式运用到拍照或者视频拍摄时,就可以实现在拍摄的过程中对图片或视频中出现的动物脸进行识别,并用美化的贴纸对动物脸进行美化,实现对动物脸的美化。
附图说明
构成本申请的一部分的附图用来提供对本申请的进一步理解,使得本申请的其它特征、目的和优点变得更明显。本申请的示意性实施例附图及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请一种实施例的图像识别的方法流程图;
图2是根据本申请另一种实施例的图像识别的方法流程图;
图3是根据本申请一种实施例的关键点定位算法训练过程中特征提取点p的示意图;
图4是根据本申请一种实施例的一种猫脸美化的效果示意图;
图5是根据本申请一种实施例的图像识别的装置的组成框图;
图6是根据本申请另一种实施例的图像识别的装置的组成框图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
根据本申请实施例,提供了一种图像识别的方法,如图1所示,该方法包括如下的步骤S101至步骤S104:
S101.根据动物脸检测模型对当前图像进行检测,确定当前图像中的动物脸区域。
动物脸检测模型是对大量的动物脸图像进行学习训练得到的,动物脸检测模型的输入为任一包含动物脸的图像,输出结果为将动物脸图像中的动物脸区域标示出,具体的标示形式可以为用预设形状的二维图像框框出等。因此,根据动物脸检测模型对当前图像进行检测,确定当前图像中的动物脸区域即将当前图像输入到动物脸检测模型中,得到被标出动物脸区域的当前图像。
另外需要说明的是,具体的在实际的应用中,由于不同的动物的脸部特征的差距,对应不同种类的动物对应不同的动物脸检测模型,因此在对当前图像进行检测之前,还需要根据当前图像中的动物的类型确定对应的动物脸检测模型,然后再进行检测。
S102.根据动物脸关键点定位模型对动物脸区域中的预设关键点进行定位。
动物脸关键点定位模型是对大量的已经标注预设关键点的动物脸图像进行学习训练得到的,动物脸关键点定位模型的输入为已经确定动物脸区域的图像,输出为将确定动物脸区域中的预设关键点标示出。其中预设关键点为动物脸的五官以及脸部轮廓的特征点,预设关键点的个数可以根据定位的精度适当的选择,比如可以选择23个点或者更多。
根据动物脸关键点定位模型对动物脸区域中的预设关键点进行定位即将步骤S101中的确定动物脸的当前图像输入到动物脸关键点定位模型中,得到已经标示出预设关键点的当前图像。
同样的,具体的在实际的应用中,由于不同的动物的脸部特征的差距,不同种类的动物对应不同的动物脸关键点定位模型,因此在对动物脸区域中的预设关键点进行定位之前,还需要根据当前图像中的动物的类型确定对应的动物脸关键点定位模型,然后再进行预设关键点的定位。
S103.根据快速光流计算算法对当前图像中的预设关键点进行动态跟踪。
本实施例主要的应用场景为拍照和视频拍摄,而在拍照和视频拍摄的过程中图像都是动态变化的,因此,为了实现对图像中的动物脸进行准确的美化,还需要对当前图像中确定的预设关键点进行持续的跟踪。
传统的关键点跟踪算法通过逐帧计算关键点的方法,这样会造成时序的不稳定性,造成关键点位置的波动,造成视频效果不佳。本实施例中具体的是根据快速光流计算算法实现对预设关键点进行跟踪。快速光流计算算法的原理是:给图像中的每一个像素点赋予一个速度矢量,这就形成了一个图像运动场,在运动的一个特定时刻,图像上的点与三维物体上的点一一对应,这种对应关系可由投影关系得到,根据各个像素点的速度矢量特征,可以对图像进行动态分析。具体的应用到本实施例中是对当前图像中的预设关键点的位置进行动态分析,实现持续准确的定位当前图像中的动物脸区域中预设关键点。具体的给出对某一预设关键点i运动的估计,假设运动的向量为(u,v),则对应的(u,v) 的计算公式,如下:
其中分别为i点在x和y方向上的坐标,t为当前时刻。
S104.根据预设关键点的位置将预设的贴纸图像融合到当前图像上。
本实施例的最终目标是将预设的贴纸图像准确的融合到当前图像中的动物脸上,不同预设的贴纸图像对应的融合到当前图像中位置是不同的,每种预设的贴纸图像都可以根据部分或者全部预设关键点的位置准确的融合到当前图像中动物脸区域上,比如眼镜贴纸可以根据与眼睛相关的关键点的位置进行融合,项链贴纸可以根据与下巴轮廓相关的关键点的位置进行融合。因此根据预设关键点的位置将预设的贴纸图像融合到当前图像上,即根据动物脸上预设关键点的位置将预设的贴纸图像准确的融合到当前图像中的动物脸区域中,上述步骤S103已经确定了预设关键点的位置,就可以通过获取预设贴纸图像与预设关键点位置的对应关系,然后根据该对应关系将预设贴纸图像融合到当前图像中的动物脸区域中。
从以上的描述中,可以看出,本申请实施例中图像识别的方法能够根据动物脸检测模型检测出图像中的动物脸区域,并能够根据动物脸定位模型定位动物脸的预设关键点,并且可以对图像中的预设关键点进行动态跟踪,最终将贴纸融合在图像中。这种方式运用到拍照或者视频拍摄时,就可以实现在拍摄的过程中对图片或视频中出现的动物脸进行识别,并用美化的贴纸对动物脸进行美化,实现对动物脸的美化。
根据本申请另一实施例,提供了一种图像识别的方法,如图2所示,该方法包括:
首先需要说明的是,本实施例中的图像识别的方法适用于对不同动物脸的美化,对于不同动物脸的美化的具体的实现方式,除了在进行模型训练时选取的训练样本(动物脸图像)的差异外,其他过程是相同的,因此本发明实施例以猫脸美化为例进行图像识别的说明。
S201.生成猫脸检测模型。
具体的生成猫脸检测模型的过程包括以下步骤:
第一,收集预设数量的猫脸图像,以对猫脸图像进行五官区域的标注,得到已标注的猫脸图像;
收集预设数量的所有类型的猫脸图像,然后通过人工标注或者其他标注的方式对猫脸图像进行五官区域的标注,具体的标注方式可以为将猫脸图像中的五官区域框到二维图像框中。
第二,将已标注的猫脸图像以及预设数量的猫脸图像输入到移动视觉网络Mobilenet网络结构中;
MobileNet网络结构是基于一个流线型的架构,它使用深度可分离的卷积来构建轻量级的深层神经网络。广泛的应用在物体检测,细粒度分类,人脸属性和大规模地理定位中。具体的应用在本实施例中是对动物脸的检测。
第三,根据损失函数对Mobilenet网络结构进行模型训练,得到猫脸检测模型。
具体的模型训练的过程为:将已标注的猫脸图像作为输出以及预设数量的猫脸图像作为输入反复的进行学习以及模型的训练,在训练的过程中,根据损失函数衡量每次实际的输出与期望的输出的差,当该差在一定的范围内时,训练结束,得到猫脸检测模型。
S202.生成关键点定位模型。
具体的生成关键点定位模型的过程包括以下步骤:
第一,获取已标注的猫脸图像,以对已标注的猫脸图像进行预设关键点的标注,得到关键点标注图像;
获取到步骤S201中的已标注的猫脸图像后,通过人工标注或者其他的标注方式标注出其中的预设关键点。其中,预设关键点为猫脸的五官以及脸部轮廓的特征点,预设关键点的个数可以根据定位的精度适当的选择,比如可以选择23个点或者更多。需要说明的是,标注的时候保持标注数据的一致性,即每张猫脸图像的预设关键点数目一致,并且每个预设关键点所对应的语义一致,比如若第10个点是代表鼻尖的点,那么每一张图像的顺位第10个点都标注为鼻尖。
第二,根据关键点标注图像训练关键点定位算法,得到猫脸关键点定位模型。
本实施例中关键点定位算法为级联姿势回归算法,级联姿势回归算法训练的原理如下:
要求:猫脸图像S和猫脸初始姿势S0
实现:估计的姿势ST
1.对i从1…T
2.ft=ht(I,St-1) 形状索引特征
3.ΔS=Rt(ft) 应用回归器Rt
4.St=St-1+ΔS 更新姿态
5.结束循环
猫脸初始姿势S0中包含预设关键点的位置,i为任一预设关键点,t=1, 2,…,T。
在上述训练的过程中,每一次迭代过程中特征提取和回归器也是至关重要的,本发明实施例中应用的是随机蕨(一种回归器)。特征提取是基于多点差值的特征提取法,确定训练时每次迭代过程中的特征提取点坐标。相比于大部分随机取点的方法对于脸部有大量绒毛的动物都有较大的效能提升。具体的,应用在本发明实施例中是对于所有的预设关键点按照每三个点组合确定一个特征提取点的方式,确定所有可能的特征提取点,给出示例进行说明:假设有三个任意预设关键点,i,j和k,特征提取点p的示意图,如图3所示,对应的特征提取点p的表达式如下:
其中S为当前的猫脸姿态,yi为i点的向量表达,vij和vik分别为i、j两点组成的向量和i、k两点组成的向量,α和β为随机数。通过这种方式使得选取的特征提取点始终跟预设关键点相关,提供特征提取的鲁棒性。
S203.根据动猫脸检测模型对当前图像进行检测,确定当前图像中的猫脸区域。
本步骤的实现方式与图1中S101中确定当前图像中的动物脸区域的方式相同,此处不再赘述。
S204.根据猫脸关键点定位模型对猫脸区域中的预设关键点进行定位。
本步骤的实现方式与图1中S102中对动物脸区域中的预设关键点进行定位的方式相同,此处不再赘述。
S205.根据快速光流计算方法,估计当前图像对应的前一帧图像中预设关键点在后一帧图像中的位置,得到第一位置。
根据图1步骤S103中对当前图像中的预设关键点跟踪的方式根据估计当前图像对应的前一帧图像中预设关键点在后一帧图像中的位置,得到第一位置。
S206.根据猫脸关键点定位模型,确定当前图像对应的前一帧图像中预设关键点在后一帧图像中的位置,得到第二位置。
根据步骤S202中生成的猫脸关键点定位模型,对当前图像对应的后一帧图像中预设关键点进行定位,确定预设关键点的位置,记为第二位置。
S207.根据第一位置和第二位置之间的距离确定预设关键点在后一帧图像中的最终位置。
首先,计算第一位置与第二位置之间的距离;然后比较距离与预设阈值的大小,预设阈值根据实际的需求自由设置;
若距离小于预设阈值,则将第一位置确定为最终位置:若距离小于预设阈值,表示用快速光流计算算法确定的预设关键点的位置与真实的预设关键点的位置相差很小,差值可以忽略,因此为了保证时序的稳定性,优先选择快速光流计算算法确定的预设关键点的位置作为上述最终位置。
若距离大于等于预设阈值,则将第二位置确定为最终位置:若距离大于等于预设阈值,表示用快速光流计算算法确定的预设关键点的位置与真实的预设关键点的位置相差很较大,差值不能忽略,因此不能选择快速光流计算算法确定的预设关键点的位置,只能将猫脸关键点定位模型确定的预设关键点的位置作为上述最终位置。
S208.获取预设的贴纸图像与预设关键点的位置对应关系,并根据图像融合算法以及位置对应关系将预设的贴纸图像融合到当前图像上。
每种预设的帖纸图像都可以根据部分或者全部预设关键点的位置准确的融合到动物脸区域上,比如眼镜贴纸可以根据与眼睛相关的关键点的位置进行融合,项链贴纸可以根据与下巴轮廓相关的关键点的位置进行融合。本实施例中需要提前设置不同类型的预设的贴纸图像与预设关键点的位置对应关系,当用户选择某一预设的贴纸图像时,根据该预设的贴纸图像与预设关键点的位置对应关系并利用图像融合算法将预设的贴纸图像准确的融合到当前图像的猫脸区域中。其中,图像融合算法是在将两幅或者多幅图像融合成一幅新图像的算法,图像融合算法包含简单的融合算法(加权法、最大值法)以及复杂多分辨率的图像融合算法(金字塔法、小波法等)。本发明实施例中对图像融合算法的具体实现方式不加限制,可以为任一种具体的图像融合算法。
另外,对于步骤S201以及S202中生成猫脸检测模型以及生成关键点定位模型不需要每次都进行,在实际应用中这两步是在猫脸检测之前就生成的,以后每次检测的时候直接利用就可以。
最后,为了更直观的对上述图1以及图2的实现效果进行展示,给出以猫脸美化为例的效果示意图,如图4所示:其中包括了猫脸检测、猫脸预设关键点定位、猫脸预设关键点跟踪、贴纸融合四个步骤以及对应的效果图。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
根据本申请实施例,还提供了一种用于实施上述图1和图2所述方法的图像识别的装置,如图5所示,该装置包括:
确定单元31,用于根据动物脸检测模型对当前图像进行检测,确定所述当前图像中的动物脸区域;
定位单元32,用于根据动物脸关键点定位模型对所述动物脸区域中的预设关键点进行定位;
跟踪单元33,用于根据快速光流计算算法对当前图像中的预设关键点进行动态跟踪;
融合单元34,用于根据预设关键点的位置将预设的贴纸图像融合到所述当前图像上。
从以上的描述中,可以看出,本申请实施例中图像识别的装置能够根据动物脸检测模型检测出图像中的动物脸区域,并能够根据动物脸定位模型定位动物脸的预设关键点,并且可以对图像中的预设关键点进行动态跟踪,最终将贴纸融合在图像中。这种方式运用到拍照或者视频拍摄时,就可以实现在拍摄的过程中对图片或视频中出现的动物脸进行识别,并用美化的贴纸对动物脸进行美化,实现对动物脸的美化。
进一步的,所述动物脸检测模型为猫脸检测模型,如图6所示,所述装置还包括:
收集单元35,用于在根据猫脸检测模型对当前图像进行检测之前,收集预设数量的猫脸图像,以对猫脸图像进行五官区域的标注,得到已标注的猫脸图像;
输入单元36,用于将已标注的猫脸图像以及预设数量的猫脸图像输入到移动视觉网络Mobilenet网络结构中;
第一训练单元37,用于根据损失函数对Mobilenet网络结构进行模型训练,得到所述猫脸检测模型。
进一步的,所述动物脸关键点定位模型为猫脸关键点定位模型,如图6 所示,所述装置还包括:
获取单元38,用于获取所述已标注的猫脸图像,以对所述已标注的猫脸图像进行预设关键点的标注,得到关键点标注图像;
第二训练单元39,用于根据关键点标注图像训练关键点定位算法,得到猫脸关键点定位模型。
进一步的,所述关键点定位算法为级联姿势回归算法,如图6所示,所述第二训练单元39还包括:
确定模块391,用于基于多点差值的特征提取法,确定训练时每次迭代过程中的特征提取点坐标;
训练模块392,用于基于随机蕨对级联姿势回归算法进行模型的训练,得到猫脸关键点定位模型。
进一步的,如图6所示,所述跟踪单元33包括:
第一位置确定模块331,用于根据快速光流计算方法,估计所述当前图像对应的前一帧图像中预设关键点在后一帧图像中的位置,得到第一位置;
第二位置确定模块332,用于根据所述猫脸关键点定位模型,确定所述当前图像对应的前一帧图像中预设关键点在后一帧图像中的位置,得到第二位置;
最终位置确定模块333,用于根据所述第一位置和所述第二位置之间的距离确定预设关键点在后一帧图像中的最终位置。
进一步的,如图6所示,所述最终位置确定模块333,用于:
比较所述距离与预设阈值的大小;
若所述距离小于所述预设阈值,则将所述第一位置确定为所述最终位置;
若所述距离大于等于所述预设阈值,则将所述第二位置确定为所述最终位置。
进一步的,如图6所示,所述融合单元34包括:
获取模块341,用于获取预设的贴纸图像与预设关键点的位置对应关系;
融合模块342,用于根据图像融合算法以及所述位置对应关系将所述预设的贴纸图像融合到所述当前图像上。
具体的,本申请实施例的装置中各模块实现其功能的具体过程可参见方法实施例中的相关描述,此处不再赘述。
显然,本领域的技术人员应该明白,上述的本申请的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本申请不限制于任何特定的硬件和软件结合。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (10)
1.一种图像识别的方法,其特征在于,包括:
根据动物脸检测模型对当前图像进行检测,确定所述当前图像中的动物脸区域;
根据动物脸关键点定位模型对所述动物脸区域中的预设关键点进行定位;并且,
根据快速光流计算算法对当前图像中的预设关键点进行动态跟踪;
根据预设关键点的位置将预设的贴纸图像融合到所述当前图像上。
2.根据权利要求1所述的图像识别的方法,其特征在于,所述动物脸检测模型为猫脸检测模型,在根据动猫脸检测模型对当前图像进行检测之前,所述方法还包括:
收集预设数量的猫脸图像,以对猫脸图像进行五官区域的标注,得到已标注的猫脸图像;
将已标注的猫脸图像以及预设数量的猫脸图像输入到移动视觉网络Mobilenet网络结构中;
根据损失函数对Mobilenet网络结构进行模型训练,得到所述猫脸检测模型。
3.根据权利要求2所述的图像识别的方法,其特征在于,所述动物脸关键点定位模型为猫脸关键点定位模型,所述方法还包括:
获取所述已标注的猫脸图像,以对所述已标注的猫脸图像进行预设关键点的标注,得到关键点标注图像;
根据关键点标注图像训练关键点定位算法,得到猫脸关键点定位模型。
4.根据权利要求3所述的图像识别的方法,其特征在于,所述关键点定位算法为级联姿势回归算法,所述根据关键点标注图像训练级联姿势回归算法,得到猫脸关键点定位模型还包括:
基于多点差值的特征提取法,确定训练时每次迭代过程中的特征提取点坐标;并且,
基于随机蕨对级联姿势回归算法进行模型的训练,得到猫脸关键点定位模型。
5.根据权利要求3或4所述的图像识别的方法,其特征在于,所述根据快速光流计算算法对当前图像中的预设关键点进行动态跟踪包括:
根据快速光流计算方法,估计所述当前图像对应的前一帧图像中预设关键点在后一帧图像中的位置,得到第一位置;
根据所述猫脸关键点定位模型,确定所述当前图像对应的前一帧图像中预设关键点在后一帧图像中的位置,得到第二位置;
根据所述第一位置和所述第二位置之间的距离确定预设关键点在后一帧图像中的最终位置。
6.根据权利要求5中所述的图像识别的方法,其特征在于,所述根据所述第一位置和第二位置之间的距离确定预设关键点在后一帧图像中的最终位置包括:
比较所述距离与预设阈值的大小;
若所述距离小于所述预设阈值,则将所述第一位置确定为所述最终位置;
若所述距离大于等于所述预设阈值,则将所述第二位置确定为所述最终位置。
7.根据权利要求6中所述的图像识别的方法,其特征在于,所述根据预设关键点的位置将预设的贴纸图像融合到所述当前图像上包括:
获取预设的贴纸图像与预设关键点的位置对应关系;
根据图像融合算法以及所述位置对应关系将所述预设的贴纸图像融合到所述当前图像上。
8.一种图像识别的装置,其特征在于,包括:
确定单元,用于根据动物脸检测模型对当前图像进行检测,确定所述当前图像中的动物脸区域;
定位单元,用于根据动物脸关键点定位模型对所述动物脸区域中的预设关键点进行定位;
跟踪单元,用于根据快速光流计算算法对当前图像中的预设关键点进行动态跟踪;
融合单元,用于根据预设关键点的位置将预设的贴纸图像融合到所述当前图像上。
9.根据权利要求8所述的图像识别的装置,其特征在于,所述动物脸检测模型为猫脸检测模型,所述装置还包括:
收集单元,用于在根据猫脸检测模型对当前图像进行检测之前,收集预设数量的猫脸图像,以对猫脸图像进行五官区域的标注,得到已标注的猫脸图像;
输入单元,用于将已标注的猫脸图像以及预设数量的猫脸图像输入到移动视觉网络Mobilenet网络结构中;
第一训练单元,用于根据损失函数对Mobilenet网络结构进行模型训练,得到所述猫脸检测模型。
10.根据权利要求9所述的图像识别的装置,其特征在于,所述动物脸关键点定位模型为猫脸关键点定位模型,所述装置还包括:
获取单元,用于获取所述已标注的猫脸图像,以对所述已标注的猫脸图像进行预设关键点的标注,得到关键点标注图像;
第二训练单元,用于根据关键点标注图像训练关键点定位算法,得到猫脸关键点定位模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910307237.7A CN110619262B (zh) | 2019-04-17 | 2019-04-17 | 图像识别的方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910307237.7A CN110619262B (zh) | 2019-04-17 | 2019-04-17 | 图像识别的方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110619262A true CN110619262A (zh) | 2019-12-27 |
CN110619262B CN110619262B (zh) | 2023-09-01 |
Family
ID=68921289
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910307237.7A Active CN110619262B (zh) | 2019-04-17 | 2019-04-17 | 图像识别的方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110619262B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112634126A (zh) * | 2020-12-22 | 2021-04-09 | 厦门美图之家科技有限公司 | 人像减龄处理方法、训练方法、装置、设备及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180007259A1 (en) * | 2015-09-18 | 2018-01-04 | Beijing Baidu Netcom Science And Technology Co., Ltd. | Photo-taking prompting method and apparatus, an apparatus and non-volatile computer storage medium |
CN107679497A (zh) * | 2017-10-11 | 2018-02-09 | 齐鲁工业大学 | 视频面部贴图特效处理方法及生成系统 |
CN107993216A (zh) * | 2017-11-22 | 2018-05-04 | 腾讯科技(深圳)有限公司 | 一种图像融合方法及其设备、存储介质、终端 |
CN109598196A (zh) * | 2018-10-29 | 2019-04-09 | 华中科技大学 | 一种多形变多姿态人脸序列的特征点定位方法 |
CN109871760A (zh) * | 2019-01-15 | 2019-06-11 | 北京奇艺世纪科技有限公司 | 一种人脸定位方法、装置、终端设备及存储介质 |
-
2019
- 2019-04-17 CN CN201910307237.7A patent/CN110619262B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180007259A1 (en) * | 2015-09-18 | 2018-01-04 | Beijing Baidu Netcom Science And Technology Co., Ltd. | Photo-taking prompting method and apparatus, an apparatus and non-volatile computer storage medium |
CN107679497A (zh) * | 2017-10-11 | 2018-02-09 | 齐鲁工业大学 | 视频面部贴图特效处理方法及生成系统 |
CN107993216A (zh) * | 2017-11-22 | 2018-05-04 | 腾讯科技(深圳)有限公司 | 一种图像融合方法及其设备、存储介质、终端 |
CN109598196A (zh) * | 2018-10-29 | 2019-04-09 | 华中科技大学 | 一种多形变多姿态人脸序列的特征点定位方法 |
CN109871760A (zh) * | 2019-01-15 | 2019-06-11 | 北京奇艺世纪科技有限公司 | 一种人脸定位方法、装置、终端设备及存储介质 |
Non-Patent Citations (1)
Title |
---|
李凯月: "鲁邦表情关键点定位系统设计与实现", 《中国优秀硕士论文全文数据库 信息科技辑》 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112634126A (zh) * | 2020-12-22 | 2021-04-09 | 厦门美图之家科技有限公司 | 人像减龄处理方法、训练方法、装置、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN110619262B (zh) | 2023-09-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Iqbal et al. | Hand pose estimation via latent 2.5 d heatmap regression | |
Qu et al. | RGBD salient object detection via deep fusion | |
US20200273180A1 (en) | Deformable object tracking | |
Zeng et al. | Silhouette-based gait recognition via deterministic learning | |
Lu et al. | Where am i in the dark: Exploring active transfer learning on the use of indoor localization based on thermal imaging | |
CN110555481A (zh) | 一种人像风格识别方法、装置和计算机可读存储介质 | |
CN108171133B (zh) | 一种基于特征协方差矩阵的动态手势识别方法 | |
JP6207210B2 (ja) | 情報処理装置およびその方法 | |
Jeni et al. | The first 3d face alignment in the wild (3dfaw) challenge | |
JP2022533464A (ja) | 三次元モデルの生成方法及び装置、コンピュータ機器並びに記憶媒体 | |
CN109086659B (zh) | 一种基于多模道特征融合的人体行为识别方法和装置 | |
Nuevo et al. | RSMAT: Robust simultaneous modeling and tracking | |
CN110866469B (zh) | 一种人脸五官识别方法、装置、设备及介质 | |
Yang et al. | Spatio-temporal reconstruction for 3D motion recovery | |
CN115376034A (zh) | 一种基于人体三维姿态时空关联动作识别的运动视频采集剪辑方法及装置 | |
CN104463962B (zh) | 基于gps信息视频的三维场景重建方法 | |
Cruz-Mota et al. | Sample and pixel weighting strategies for robust incremental visual tracking | |
CN112184886A (zh) | 一种图像处理方法、装置、计算机设备及存储介质 | |
Darujati et al. | Facial motion capture with 3D active appearance models | |
CN110619262B (zh) | 图像识别的方法及装置 | |
Gavrila | Vision-based 3-D tracking of humans in action | |
CN114663917A (zh) | 基于多视角的多人三维人体位姿估计方法及装置 | |
Wang et al. | A Visual SLAM Algorithm Based on Image Semantic Segmentation in Dynamic Environment | |
CN115862130A (zh) | 基于人体姿态及其躯干运动场的行为识别方法 | |
CN106202418B (zh) | 一种用于智能机器人的图片数据收集方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |