CN109919010A - 图像处理方法及装置 - Google Patents

图像处理方法及装置 Download PDF

Info

Publication number
CN109919010A
CN109919010A CN201910069268.3A CN201910069268A CN109919010A CN 109919010 A CN109919010 A CN 109919010A CN 201910069268 A CN201910069268 A CN 201910069268A CN 109919010 A CN109919010 A CN 109919010A
Authority
CN
China
Prior art keywords
human face
face region
basis
size
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910069268.3A
Other languages
English (en)
Inventor
李圣喜
柴振华
孟欢欢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sankuai Online Technology Co Ltd
Original Assignee
Beijing Sankuai Online Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sankuai Online Technology Co Ltd filed Critical Beijing Sankuai Online Technology Co Ltd
Priority to CN201910069268.3A priority Critical patent/CN109919010A/zh
Publication of CN109919010A publication Critical patent/CN109919010A/zh
Priority to PCT/CN2020/073836 priority patent/WO2020151750A1/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/24Aligning, centring, orientation detection or correction of the image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features

Abstract

本发明提供了一种图像处理方法及装置,所述方法包括:获取第一图像样本;识别所述第一图像样本中的人脸区域;第二图像样本生成模块,用于以所述人脸区域为基准确定多个目标区域得到多个第二图像样本,其中所述目标区域为以所述人脸区域为基准朝向预设方向进行扩展形成的。可以以人脸区域为基准扩展形成目标区域,得到第二图像样本,使得生成的第二图像样本一定包括人脸区域,有助于提高模型识别人脸的准确性。

Description

图像处理方法及装置
技术领域
本发明实施例涉及图像处理技术领域,尤其涉及一种图像处理方法及装置。
背景技术
人脸识别已经成为一种很重要的身份验证方式,可以采用预先训练好的卷积神经网络识别人脸。而卷积神经网络需要图像样本集进行训练。
现有技术中,为了提高图像样本的数量,在生成图像样本集时可以对图像样本进行增广。图像增广对图像样本进行一系列随机变换得到相似但不相同的图像样本,以扩大图像样本集。其中,随机变换具体包括随机剪裁、随机分割、随机变换光照等。
然而,上述方案有可能在随机变换过程中丢失人脸部分信息,导致通过该样本训练得到的模型识别人脸的准确性较差。
发明内容
本发明提供一种图像处理方法及装置,以解决现有技术中的上述问题。
根据本发明的第一方面,提供了一种图像处理方法,所述方法包括:
获取第一图像样本;
识别所述第一图像样本中的人脸区域;
以所述人脸区域为基准确定多个目标区域得到多个第二图像样本,其中所述目标区域为以所述人脸区域为基准朝向预设方向进行扩展形成的。
可选地,所述以所述人脸区域为基准确定多个尺寸的目标区域的步骤,包括:
以所述人脸区域为基准向上扩展多个第一尺寸;和/或,
以所述人脸区域为基准向下扩展多个第二尺寸;和/或,
以所述人脸区域为基准向左扩展多个第三尺寸;和/或,
以所述人脸区域为基准向右扩展多个第四尺寸。
可选地,所述第一尺寸、第二尺寸为所述人脸区域的上下方向尺寸的倍数,所述第三尺寸、第四尺寸为所述人脸区域的左右方向尺寸的倍数。
可选地,所述获取第一图像样本的步骤,包括:
接收拍摄设备发送的第一图像样本,其中所述第一图像样本的环境亮度、拍摄对象与拍摄设备之间的距离和/或角度不完全相同。
可选地,所述目标视频由多个子视频组成,所述子视频之间以预设标记分隔。
根据本发明的第二方面,提供了一种图像处理装置,所述装置包括:
第一图像样本获取模块,用于获取第一图像样本;
人脸区域识别模块,用于识别所述第一图像样本中的人脸区域;
第二图像样本生成模块,用于以所述人脸区域为基准确定多个目标区域得到多个第二图像样本,其中所述目标区域为以所述人脸区域为基准朝向预设方向进行扩展形成的。
可选地,所述第二图像样本生成模块,包括:
第一目标区域扩展子模块,用于以所述人脸区域为基准向上扩展多个第一尺寸;和/或,
第二目标区域扩展子模块,用于以所述人脸区域为基准向下扩展多个第二尺寸;和/或,
第三目标区域扩展子模块,用于以所述人脸区域为基准向左扩展多个第三尺寸;和/或,
第四目标区域扩展子模块,用于以所述人脸区域为基准向右扩展多个第四尺寸。
可选地,所述第一尺寸、第二尺寸为所述人脸区域的上下方向尺寸的倍数,所述第三尺寸、第四尺寸为所述人脸区域的左右方向尺寸的倍数。
可选地,所述第一图像样本获取模块,包括:
第一图像样本接收子模块,用于接收拍摄设备发送的第一图像样本,其中所述第一图像样本的环境亮度、拍摄对象与拍摄设备之间的距离和/或角度不完全相同。
可选地,所述目标视频由多个子视频组成,所述子视频之间以预设标记分隔。
根据本发明的第三方面,提供了一种电子设备,包括:
处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现前述的方法。
根据本发明的第四方面,提供了一种可读存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行前述的方法。
本发明实施例提供了一种图像处理方法及装置,所述包括:获取第一图像样本;识别所述第一图像样本中的人脸区域;以所述人脸区域为基准确定多个目标区域得到多个第二图像样本,其中所述目标区域为以所述人脸区域为基准朝向预设方向进行扩展形成的。可以以人脸区域为基准扩展形成目标区域,得到第二图像样本,使得生成的第二图像样本一定包括人脸区域,有助于提高模型识别人脸的准确性。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例一提供的一种图像处理方法的具体步骤流程图;
图2是本发明实施例二提供的一种图像处理方法的具体步骤流程图;
图3(A、B、C、D、E、F、G、H)分别是本发明实施例二中目标区域的示意图;
图4是本发明实施例三提供的一种图像处理装置的结构图;
图5是本发明实施例四提供的一种图像处理装置的结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一
参照图1,其示出了本发明实施例一提供的一种图像处理方法的具体步骤流程图。
步骤101,获取第一图像样本。
本发明实施例可以针对原图像生成类似但不相同的图像,可以用于深度学习中图像样本的增广。在人脸识别的身份验证过程中,识别设备需要获取人脸图像,并对从中识别出的人脸特征进行验证,在验证通过之后,允许用户进行操作;在验证失败之后,不允许用户进行操作。人脸认证的应用场景包括:网约车的司机验身份验证、门禁验证。而在一个实施例中存在一种风险:非法用户可以预先合法用户的录制视频或图片,从而使用播放设备播放该视频或图片,并用认证设备的摄像头拍摄该播放设备的屏幕,通过拍摄的图片进行身份验证,使得人脸识别的身份验证未达到验证效果,存在一定的安全风险。
在上述非法认证过程中,播放设备的边框部分通常会存在于拍摄的图片中,播放设备的屏幕也存在反光,播放设备和认证设备之间也可能存在一定角度。基于上述特征,本发明实施例生成的图像样本可以使得训练得到的模型(例如卷积神经网络)识别边框、反光、角度等特征,从而识别出上述非法认证。
其中,第一图像样本为原始图像样本,可以为包括各种信息的图片,例如,包括:播放设备的屏幕、边框、或播放设备周边的其他信息。
在本发明实施例中,第一图像样本可以通过拍摄得到,拍摄对象可以为播放视频或图片的播放设备。
步骤102,识别所述第一图像样本中的人脸区域。
具体地,可以采用人脸识别技术从第一图像样本中识别得到人脸特征点(例如,五官、轮廓等),从而确定人脸区域。
现有技术中,人脸识别技术已经很成熟,对于二维人脸识别算法,包括:
1、模板匹配法:根据人脸特征规律建立立体可调的模型框架,在定位出人脸区域之后用模型框架定位和调整人脸中的特征部位,解决人脸识别过程中的观察角度、遮挡和表情变化等因素影响。
2、奇异值特征法:人脸图像矩阵的奇异值特征反映了图像的本质属性,可以用于进行人脸识别。
3、子空间分析法:因其具有描述性强、计算代价小、易实现及可分性好等特点,被广泛应用于人脸特征提取,成为了人脸识别的主流方法之一。
4、局部保持投影(Locality Preserving Projections,LPP):是一种新的子空间分析方法,它是非线性方法的线性近似,既解决了主成分分析法难以保持原始数据非线性流形的缺点,又解决了非线性方法难以获得新样本点低维投影的缺点。
5、主成分分析法:通过降维降低数据处理的复杂度,提高计算速度。
对于三维人脸识别算法,包括:
1、基于图像特征的方法:首先匹配人脸整体的尺寸轮廓和三维空间方向;然后,在保持姿态固定的情况下,进行脸部不同特征点(这些特征点是人工的鉴别出来)的局部匹配。
2、基于模型可变参数的方法:使用通用人脸模型的三维变形和基于距离映射的矩阵迭代最小相结合,以恢复头部姿态和三维人脸。随着模型形变的关联关系的改变不断更新姿态参数,重复此过程直到最小化尺度达到要求。基于模型可变参数的方法与基于图像特征的方法的最大区别在于:后者在人脸姿态每变化一次后,需要重新搜索特征点的坐标,而前者只需调整3D变形模型的参数。
可以理解,本发明实施例对采用的人脸识别算法不加以限制。
步骤103,以所述人脸区域为基准确定多个目标区域得到多个第二图像样本,其中所述目标区域为以所述人脸区域为基准朝向预设方向进行扩展形成的。
具体地,以人脸区域为中心,向上、下、左、右其中一个方向或同时朝多个方向扩展不同大小的尺寸,得到包含人脸区域的多个目标区域。
可以理解,人脸区域和目标区域的形状可以根据场景选择矩形、菱形、圆形、梯形等,优选矩形。本发明实施例对其形状不加以限制。
本发明实施例可以确定包含人脸区域,且尺寸不同的目标区域,从而可以使得扩展得到的样本不仅包括人脸区域,还尽可能多的包括其他区域的信息,有助于帮助模型学习到更多信息,提高模型对人脸识别的准确度。这样可以根据现有的图像生成更多的图像样本,以在后续训练模型时提高模型的准确性。
由于人脸识别时的一个欺诈手段是:通过播放设备播放图像或流媒体文件,然后通过认证的拍摄设备进行拍摄以进行人脸认证。由于现有的人脸认证算法会将获取的认证图像中的人脸区域首先提取出来进行认证,这样即使拍摄设备拍摄到播放设备的边框时也不会对认证有影响。采用前述方式进行扩展后,能够使得至少一部分图像样本中包括播放设备的边框,以提高训练得到的模型具有更好的准确性。
可以理解,目标区域包含的图像形成第二图像样本。
在本发明实施例中,由于目标区域包括人脸区域,且向四周扩展,从而第二图像样本包括了人脸特征、以及其他区域的信息。
在一个实施例中,在生成训练用的图像样本时,首先,将第一图像样本复制一份;然后,从第一图像样本中剪裁出人脸区域、以及目标区域;最后,将剪裁出的图像保存为第二图像样本,从而可以将人脸区域构成的图像、多个第二图像样本以及第一图像样本作为训练模型的图像样本。在一个实施例中,由于可以以所述人脸区域为基准确定多个目标区域,因此可以从所述第一图像样本中裁剪出所述目标区域得到多个第二图像样本;且所述人脸区域位于所述多个第二图像样本内的不同位置。
综上所述,本发明实施例提供了一种图像处理方法,所述方法包括:获取第一图像样本;识别所述第一图像样本中的人脸区域;以所述人脸区域为基准确定多个目标区域得到多个第二图像样本,其中所述目标区域为以所述人脸区域为基准朝向预设方向进行扩展形成的。可以以人脸区域为基准扩展形成目标区域,得到第二图像样本,使得生成的第二图像样本一定包括人脸区域,有助于提高模型识别人脸的准确性。
实施例二
参照图2,其示出了本发明实施例二提供的一种图像处理方法的具体步骤流程图。
步骤201,通过拍摄设备获取第一图像样本,其中所述第一图像样本的环境亮度、拍摄对象与拍摄设备之间的距离和/或角度不完全相同。
具体的,可以将作为训练样本的图像样本生成一个循环播放的流媒体文件,以通过播放设备播放。通过拍摄设备对播放设备的屏幕进行拍摄,以获取流媒体文件中的多个第一图像样本;且通过将所述播放设备所在的环境亮度、与所述拍摄设备的距离和/或角度不断变化,可以通过这些图像样本得到更多的训练样本。
其中,拍摄设备可以为具有摄像头的任何设备,例如,手机、平板电脑、照相机等。
播放设备为可以自动调整屏幕角度的所有播放设备,在一个实施例中播放设备可以采用云台来承载播放设备;云台可以不断转动,以调整播放设备的屏幕与拍摄设备之间的角度。其中云台可以是在两维平面内转动,以根据图像生成多个不同的图像样本;云台还可以是在三维空间内转动,以在播放流媒体文件过程中不断转动屏幕。此外,为了实现距离的变化,可以将拍摄设备或播放设备置于可移动的设备上,从而在播放过程中调整两者之间的距离;最后,还可以将播放设备和拍摄设备置于亮度不断变化的灯光环境下,实现亮度的不断变化。
目标视频可以为包括人脸区域的图像序列,可以理解,拍摄设备拍摄图像序列之后将图像序列拆分为每帧图像,得到多个第一图像样本。
本发明实施例可以通过设备拍摄得到角度不同、亮度不同、距离不同的多个第一图像样本组成的图像样本集,实现了训练样本增广的多样化和自动化,相对于人工拍摄,有助于降低工作量,多样化的样本可以提高训练的准确度。
可选地,在本发明的另一种实施例中,所述目标视频由多个子视频组成,所述子视频之间以预设标记分隔。
其中,标记可以为具有指定标识的图像帧、或标识帧、或其他形式的标记。
本发明实施例可以将多个小视频拼接为长度较大的视频,从而可以批量生成第一图像样本,有助于进一步降低工作量。
步骤202,识别所述第一图像样本中的人脸区域。
该步骤可以参照步骤102的详细说明,在此不再赘述。
步骤203,以所述人脸区域为基准向上扩展多个第一尺寸形成多个目标区域,得到多个第二图像样本。
其中,尺寸可以按照像素点的数目表示,第一尺寸为向上扩展的像素数目。
本发明实施例可以向人脸区域的上方扩展第一尺寸,得到目标区域,从而目标区域包含人脸区域以及上方第一尺寸区域。如图3(A)所示,灰色区域F1为第一图像样本的整个图像区域,阴影部分区域F2为第一图像样本中的人脸区域,以人脸区域F2为基准,向上扩展得到目标区域为图3(B)中由虚线围起来的区域F3(包含区域F2)。
可以理解,第一尺寸可以为多个不同的尺寸,从而实现不同大小如F3的目标区域。
本发明实施例可以通过向上扩展得到目标区域,从而将上方包括屏幕、或设备或屏幕边框以及角度的目标区域作为第二图像样本,并在模型训练时学习到屏幕、或设备或屏幕边框以及角度的特点,可以识别到人脸区域上方的屏幕反光、设备或屏幕边框以及屏幕角度等信息,从而可以区分采用预先录制的视频或图片进行身份验证的场景,提高了人脸识别的准确度。
步骤204,以所述人脸区域为基准向下扩展多个第二尺寸形成多个目标区域,得到多个第二图像样本。
其中,第二尺寸为向下扩展的像素数目。
本发明实施例可以向人脸区域的下方扩展第二尺寸,得到目标区域,从而目标区域包含人脸区域以及下方第二尺寸区域。如图3(A)所示,以人脸区域F2为基准,向下扩展得到目标区域为图3(C)中由虚线围起来的区域F4(包含区域F2)。
可以理解,第二尺寸可以为多个不同的尺寸,从而实现不同大小如F4的目标区域。
本发明实施例可以通过向下扩展得到目标区域,从而将下方包括屏幕、或设备或屏幕边框以及角度的目标区域作为第二图像样本,并在模型训练时学习到屏幕、或设备或屏幕边框以及角度的特点,可以识别到人脸区域下方的屏幕反光、设备或屏幕边框以及屏幕角度等信息,从而可以区分采用预先录制的视频或图片进行身份验证的场景,提高了人脸识别的准确度。
步骤205,以所述人脸区域为基准向左扩展多个第三尺寸形成多个目标区域,得到多个第二图像样本。
其中,第三尺寸为向左扩展的像素数目。
本发明实施例可以向人脸区域的左方扩展第三尺寸,得到目标区域,从而目标区域包含人脸区域以及左方第三尺寸区域。如图3(A)所示,以人脸区域F2为基准,向左扩展得到目标区域为图3(D)中由虚线围起来的区域F5(包含区域F2)。
可以理解,第三尺寸可以为多个不同的尺寸,从而实现不同大小如F5的目标区域。
本发明实施例可以通过向左方扩展得到目标区域,从而将左方包括屏幕、或设备或屏幕边框以及角度的目标区域作为第二图像样本,并在模型训练时学习到屏幕、或设备或屏幕边框以及角度的特点,可以识别到人脸区域左方的屏幕反光、设备或屏幕边框以及屏幕角度等信息,从而可以区分采用预先录制的视频或图片进行身份验证的场景,提高了人脸识别的准确度。
步骤206,以所述人脸区域为基准向右扩展多个第四尺寸形成多个目标区域,得到多个第二图像样本。
其中,第四尺寸为向右扩展的像素数目。
本发明实施例可以向人脸区域的右方扩展第四尺寸,得到目标区域,从而目标区域包含人脸区域以及右方第四尺寸区域。如图3(A)所示,以人脸区域F2为基准,向右扩展得到目标区域为图3(E)中由虚线围起来的区域F6(包含区域F2)。
可以理解,第四尺寸可以为多个不同的尺寸,从而实现不同大小如F6的目标区域。
在一个实施例中,可以选择其中一个方向扩展,也可以将上下方向结合,得到目标区域为如图3(F)中虚线围成的区域F7;还可以将左右方向结合,得到目标区域为如图3(G)中虚线围成的区域F8;还可以将上下左右方向结合,得到目标区域为如图3(H)中虚线围成的区域F9。还可以将上下左右方向任意结合进行扩展,得到目标区域,例如,左上同时扩展、上左右同时扩展、上下右同时扩展等。其中,第一尺寸、第二尺寸、第三尺寸、第四尺寸可以相同也可以不同,特别地,为了实现简单且对称,在上下结合时,可以采用相同的第一尺寸和第二尺寸,在左右结合时,可以采用相同的第三尺寸和第四尺寸。
本发明实施例可以通过向右扩展得到目标区域,从而将右方包括屏幕、或设备或屏幕边框以及角度的目标区域作为第二图像样本,并在模型训练时学习到屏幕、或设备或屏幕边框以及角度的特点,可以识别到人脸区域右方的屏幕反光、设备或屏幕边框以及屏幕角度等信息,从而可以区分采用预先录制的视频或图片进行身份验证的场景,提高了人脸识别的准确度。
可选地,在本发明的另一种实施例中,所述第一尺寸、第二尺寸为所述人脸区域的上下方向尺寸的倍数,所述第三尺寸、第四尺寸为所述人脸区域的左右方向尺寸的倍数。
其中,人脸区域的上下方向尺寸可以理解为人脸区域高度,人脸区域的左右方向尺寸可以理解为人脸区域宽度。
具体地,若第一尺寸表示目标区域的上边界与人脸区域的上边界之间的距离,则第一尺寸可以为人脸区域高度的1倍、2倍、3倍等;若第二尺寸表示目标区域的下边界与人脸区域的下边界之间的距离,则第二尺寸可以为人脸区域高度的1倍、2倍、3倍等;若第三尺寸表示目标区域的左边界与人脸区域的左边界之间的距离,则第三尺寸可以为人脸区域宽度的1倍、2倍、3倍等;若第四尺寸表示目标区域的右边界与人脸区域的右边界之间的距离,则第四尺寸可以为人脸区域宽度的1倍、2倍、3倍等。
在一个实施例中,最大倍数可以以图像尺寸确定,不断扩展倍数直至到达第一图像样本的边界。例如,第一尺寸可以根据上方边界确定最大倍数,第二尺寸可以根据下方边界确定最大倍数,第三尺寸可以根据左方边界确定最大倍数,第四尺寸可以根据右方边界确定最大倍数。
本发明实施例可以根据人脸区域的尺寸的倍数扩展目标区域,可以简单有效的确定包含屏幕以及屏幕边框、设备边框的目标区域。
综上所述,本发明实施例提供了一种图像处理方法,所述方法包括:获取第一图像样本;识别所述第一图像样本中的人脸区域;以所述人脸区域为基准确定多个目标区域得到多个第二图像样本,其中所述目标区域为以所述人脸区域为基准朝向预设方向进行扩展形成的。可以以人脸区域为基准扩展形成目标区域,得到第二图像样本,使得生成的第二图像样本一定包括人脸区域,有助于提高模型识别人脸的准确性。
实施例三
参照图4,其示出了本发明实施例三提供的一种图像处理装置的结构图,具体如下。
第一图像样本获取模块301,用于获取第一图像样本。
人脸区域识别模块302,用于识别所述第一图像样本中的人脸区域。
第二图像样本生成模块303,用于以所述人脸区域为基准确定多个目标区域得到多个第二图像样本,其中所述目标区域为以所述人脸区域为基准朝向预设方向进行扩展形成的。
综上所述,本发明实施例提供了一种图像处理装置,所述装置包括:第一图像样本获取模块,用于获取第一图像样本;人脸区域识别模块,用于识别所述第一图像样本中的人脸区域;第二图像样本生成模块,用于以所述人脸区域为基准确定多个目标区域得到多个第二图像样本,其中所述目标区域为以所述人脸区域为基准朝向预设方向进行扩展形成的。可以以人脸区域为基准扩展形成目标区域,得到第二图像样本,使得生成的第二图像样本一定包括人脸区域,有助于提高模型识别人脸的准确性。
实施例三为方法实施例一对应的装置实施例,详细信息可以参照实施例一的详细说明,在此不再赘述。
实施例四
参照图5,其示出了本发明实施例四提供的一种图像处理装置的结构图,具体如下。
第一图像样本获取模块401,用于获取第一图像样本;可选地,在本发明的另一种实施例中,所述第一图像样本获取模块401,包括:
第一图像样本接收子模块4011,用于接收拍摄设备发送的第一图像样本,其中所述第一图像样本的环境亮度、拍摄对象与拍摄设备之间的距离和/或角度不完全相同。
人脸区域识别模块402,用于识别所述第一图像样本中的人脸区域。
第二图像样本生成模块403,用于以所述人脸区域为基准确定多个目标区域得到多个第二图像样本,其中所述目标区域为以所述人脸区域为基准朝向预设方向进行扩展形成的,包括:
第一目标区域扩展子模块4031,用于以所述人脸区域为基准向上扩展多个第一尺寸;和/或,
第二目标区域扩展子模块4032,用于以所述人脸区域为基准向下扩展多个第二尺寸;和/或,
第三目标区域扩展子模块4033,用于以所述人脸区域为基准向左扩展多个第三尺寸;和/或,
第四目标区域扩展子模块4034,用于以所述人脸区域为基准向右扩展多个第四尺寸。
可选地,在本发明的另一种实施例中,所述第一尺寸、第二尺寸为所述人脸区域的上下方向尺寸的倍数,所述第三尺寸、第四尺寸为所述人脸区域的左右方向尺寸的倍数。
可选地,在本发明的另一种实施例中,所述目标视频由多个子视频组成,所述子视频之间以预设标记分隔。
综上所述,本发明实施例提供了一种图像处理装置,所述装置包括:第一图像样本获取模块,用于获取第一图像样本;人脸区域识别模块,用于识别所述第一图像样本中的人脸区域;第二图像样本生成模块,用于以所述人脸区域为基准确定多个目标区域得到多个第二图像样本,其中所述目标区域为以所述人脸区域为基准朝向预设方向进行扩展形成的。可以以人脸区域为基准扩展形成目标区域,得到第二图像样本,使得生成的第二图像样本一定包括人脸区域,有助于提高模型识别人脸的准确性。
实施例四为方法实施例二对应的装置实施例,详细信息可以参照实施例二的详细说明,在此不再赘述。
本发明实施例还提供了一种电子设备,包括:处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现前述的方法。
本发明实施例还提供了一种可读存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行前述的方法。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的图像处理设备中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (12)

1.一种图像处理方法,其特征在于,所述方法包括:
获取第一图像样本;
识别所述第一图像样本中的人脸区域;
以所述人脸区域为基准确定多个目标区域得到多个第二图像样本,其中所述目标区域为以所述人脸区域为基准朝向预设方向进行扩展形成的。
2.根据权利要求1所述的方法,其特征在于,所述以所述人脸区域为基准朝向预设方向进行扩展的步骤,包括:
以所述人脸区域为基准向上扩展多个第一尺寸;和/或,
以所述人脸区域为基准向下扩展多个第二尺寸;和/或,
以所述人脸区域为基准向左扩展多个第三尺寸;和/或,
以所述人脸区域为基准向右扩展多个第四尺寸。
3.根据权利要求1所述的方法,其特征在于,所述第一尺寸、第二尺寸为所述人脸区域的上下方向尺寸的倍数,所述第三尺寸、第四尺寸为所述人脸区域的左右方向尺寸的倍数。
4.根据权利要求1所述的方法,其特征在于,所述获取第一图像样本的步骤,包括:
通过拍摄设备获取第一图像样本,其中所述第一图像样本的环境亮度、拍摄对象与拍摄设备之间的距离和/或角度不完全相同。
5.根据权利要求4所述的方法,其特征在于,所述目标视频由多个子视频组成,所述子视频之间以预设标记分隔。
6.一种图像处理装置,其特征在于,所述装置包括:
第一图像样本获取模块,用于获取第一图像样本;
人脸区域识别模块,用于识别所述第一图像样本中的人脸区域;
第二图像样本生成模块,用于以所述人脸区域为基准确定多个目标区域得到多个第二图像样本,其中所述目标区域为以所述人脸区域为基准朝向预设方向进行扩展形成的。
7.根据权利要求6所述的装置,其特征在于,所述第二图像样本生成模块,包括:
第一目标区域扩展子模块,用于以所述人脸区域为基准向上扩展多个第一尺寸;和/或,
第二目标区域扩展子模块,用于以所述人脸区域为基准向下扩展多个第二尺寸;和/或,
第三目标区域扩展子模块,用于以所述人脸区域为基准向左扩展多个第三尺寸;和/或,
第四目标区域扩展子模块,用于以所述人脸区域为基准向右扩展多个第四尺寸。
8.根据权利要求6所述的装置,其特征在于,所述第一尺寸、第二尺寸为所述人脸区域的上下方向尺寸的倍数,所述第三尺寸、第四尺寸为所述人脸区域的左右方向尺寸的倍数。
9.根据权利要求6所述的装置,其特征在于,所述第一图像样本获取模块,包括:
第一图像样本接收子模块,用于接收拍摄设备发送的第一图像样本,其中所述第一图像样本的环境亮度、拍摄对象与拍摄设备之间的距离和/或角度不完全相同。
10.根据权利要求9所述的装置,其特征在于,所述目标视频由多个子视频组成,所述子视频之间以预设标记分隔。
11.一种电子设备,其特征在于,包括:
处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至5中一个或多个所述的方法。
12.一种可读存储介质,其特征在于,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如方法权利要求1至5中一个或多个所述的方法。
CN201910069268.3A 2019-01-24 2019-01-24 图像处理方法及装置 Pending CN109919010A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201910069268.3A CN109919010A (zh) 2019-01-24 2019-01-24 图像处理方法及装置
PCT/CN2020/073836 WO2020151750A1 (zh) 2019-01-24 2020-01-22 图像处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910069268.3A CN109919010A (zh) 2019-01-24 2019-01-24 图像处理方法及装置

Publications (1)

Publication Number Publication Date
CN109919010A true CN109919010A (zh) 2019-06-21

Family

ID=66960672

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910069268.3A Pending CN109919010A (zh) 2019-01-24 2019-01-24 图像处理方法及装置

Country Status (2)

Country Link
CN (1) CN109919010A (zh)
WO (1) WO2020151750A1 (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110490054A (zh) * 2019-07-08 2019-11-22 北京三快在线科技有限公司 目标区域的检测方法、装置、电子设备及可读存储介质
CN110619600A (zh) * 2019-09-17 2019-12-27 南京旷云科技有限公司 神经网络模型训练方法及装置、存储介质及电子设备
CN110956147A (zh) * 2019-12-05 2020-04-03 京东数字科技控股有限公司 生成训练数据的方法及装置
WO2020151750A1 (zh) * 2019-01-24 2020-07-30 北京三快在线科技有限公司 图像处理方法及装置
CN112529097A (zh) * 2020-12-23 2021-03-19 北京百度网讯科技有限公司 样本图像生成方法、装置以及电子设备
CN112738404A (zh) * 2020-12-30 2021-04-30 维沃移动通信(杭州)有限公司 电子设备的控制方法及电子设备
CN113011468A (zh) * 2021-02-25 2021-06-22 上海皓桦科技股份有限公司 图像特征提取方法及装置
CN113052166A (zh) * 2021-02-05 2021-06-29 杭州依图医疗技术有限公司 病理图像的显示方法及装置
CN113420597A (zh) * 2021-05-24 2021-09-21 北京三快在线科技有限公司 环形交叉口识别方法及装置,电子设备及存储介质
CN113938615A (zh) * 2021-08-26 2022-01-14 秒针信息技术有限公司 一种人脸防伪数据集的获取方法、装置及电子设备

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112308758B (zh) * 2020-10-30 2023-11-03 上海禾儿盟智能科技有限公司 近红外图像数据在线增广装置、系统及方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1512453A (zh) * 2002-12-30 2004-07-14 佳能株式会社 图像处理方法及装置
CN107194376A (zh) * 2017-06-21 2017-09-22 北京市威富安防科技有限公司 面具造假卷积神经网络训练方法及人脸活体检测方法
CN107220635A (zh) * 2017-06-21 2017-09-29 北京市威富安防科技有限公司 基于多造假方式的人脸活体检测方法
CN108182409A (zh) * 2017-12-29 2018-06-19 北京智慧眼科技股份有限公司 活体检测方法、装置、设备及存储介质
CN108875730A (zh) * 2017-05-16 2018-11-23 中兴通讯股份有限公司 一种深度学习样本收集方法、装置、设备及存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011033657A1 (ja) * 2009-09-18 2011-03-24 株式会社東芝 特徴抽出装置
CN104573657B (zh) * 2015-01-09 2018-04-27 安徽清新互联信息科技有限公司 一种基于低头特征的盲驾检测方法
CN107203754B (zh) * 2017-05-26 2019-04-12 北京邮电大学 一种基于深度学习的车牌定位方法及装置
CN108154134B (zh) * 2018-01-11 2019-07-23 天格科技(杭州)有限公司 基于深度卷积神经网络的互联网直播色情图像检测方法
CN109919010A (zh) * 2019-01-24 2019-06-21 北京三快在线科技有限公司 图像处理方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1512453A (zh) * 2002-12-30 2004-07-14 佳能株式会社 图像处理方法及装置
CN108875730A (zh) * 2017-05-16 2018-11-23 中兴通讯股份有限公司 一种深度学习样本收集方法、装置、设备及存储介质
CN107194376A (zh) * 2017-06-21 2017-09-22 北京市威富安防科技有限公司 面具造假卷积神经网络训练方法及人脸活体检测方法
CN107220635A (zh) * 2017-06-21 2017-09-29 北京市威富安防科技有限公司 基于多造假方式的人脸活体检测方法
CN108182409A (zh) * 2017-12-29 2018-06-19 北京智慧眼科技股份有限公司 活体检测方法、装置、设备及存储介质

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020151750A1 (zh) * 2019-01-24 2020-07-30 北京三快在线科技有限公司 图像处理方法及装置
CN110490054B (zh) * 2019-07-08 2021-03-09 北京三快在线科技有限公司 目标区域的检测方法、装置、电子设备及可读存储介质
CN110490054A (zh) * 2019-07-08 2019-11-22 北京三快在线科技有限公司 目标区域的检测方法、装置、电子设备及可读存储介质
CN110619600B (zh) * 2019-09-17 2023-12-08 南京旷云科技有限公司 神经网络模型训练方法及装置、存储介质及电子设备
CN110619600A (zh) * 2019-09-17 2019-12-27 南京旷云科技有限公司 神经网络模型训练方法及装置、存储介质及电子设备
CN110956147A (zh) * 2019-12-05 2020-04-03 京东数字科技控股有限公司 生成训练数据的方法及装置
CN112529097A (zh) * 2020-12-23 2021-03-19 北京百度网讯科技有限公司 样本图像生成方法、装置以及电子设备
CN112529097B (zh) * 2020-12-23 2024-03-26 北京百度网讯科技有限公司 样本图像生成方法、装置以及电子设备
CN112738404A (zh) * 2020-12-30 2021-04-30 维沃移动通信(杭州)有限公司 电子设备的控制方法及电子设备
CN113052166A (zh) * 2021-02-05 2021-06-29 杭州依图医疗技术有限公司 病理图像的显示方法及装置
CN113011468A (zh) * 2021-02-25 2021-06-22 上海皓桦科技股份有限公司 图像特征提取方法及装置
CN113420597A (zh) * 2021-05-24 2021-09-21 北京三快在线科技有限公司 环形交叉口识别方法及装置,电子设备及存储介质
CN113938615A (zh) * 2021-08-26 2022-01-14 秒针信息技术有限公司 一种人脸防伪数据集的获取方法、装置及电子设备

Also Published As

Publication number Publication date
WO2020151750A1 (zh) 2020-07-30

Similar Documents

Publication Publication Date Title
CN109919010A (zh) 图像处理方法及装置
CN106797460B (zh) 三维视频的重建
US10504008B1 (en) System and method for relocalization and scene recognition
CN102831386B (zh) 物体识别方法及识别装置
Tang et al. Face flashing: a secure liveness detection protocol based on light reflections
CN104427252B (zh) 用于合成图像的方法及其电子设备
CN106407914A (zh) 用于检测人脸的方法、装置和远程柜员机系统
CN109076148A (zh) 日常场景重建引擎
KR102106135B1 (ko) 행동 인식 기반의 응용 서비스 제공 장치 및 그 방법
ES2688643T3 (es) Aparato y método de realidad aumentada
US9953247B2 (en) Method and apparatus for determining eye position information
CN110363061B (zh) 计算机可读介质、训练对象检测算法的方法及显示装置
CN106650723A (zh) 用于确定相机姿态以及用于识别真实环境的对象的方法
CN108986141A (zh) 物体运动信息处理方法、装置、增强现实设备及存储介质
CN103778643B (zh) 一种实时生成目标深度信息的方法及其装置
CN109815960A (zh) 基于深度学习的翻拍图像识别方法、装置、设备及介质
CN112037314A (zh) 图像显示方法、装置、显示设备及计算机可读存储介质
CN110245561A (zh) 一种人脸识别方法及装置
JP5442721B2 (ja) 形状の不変量アフィン認識方法及びデバイス
CN106023148A (zh) 一种序列聚焦观测模式下恒星像点位置提取方法
US20180217806A1 (en) Method of providing virtual reality using omnidirectional cameras and microphones, sound signal processing apparatus, and image signal processing apparatus for performing method thereof
CN110276251A (zh) 一种图像识别方法、装置、设备及存储介质
CN109769326A (zh) 一种追光方法、装置及设备
KR101399274B1 (ko) 다중 패턴 빔을 이용하는 3차원 촬영 장치 및 방법
CN109840885A (zh) 图像融合方法及相关产品

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190621