CN112488137A - 样本获取方法、装置、电子设备及机器可读存储介质 - Google Patents

样本获取方法、装置、电子设备及机器可读存储介质 Download PDF

Info

Publication number
CN112488137A
CN112488137A CN201910858414.0A CN201910858414A CN112488137A CN 112488137 A CN112488137 A CN 112488137A CN 201910858414 A CN201910858414 A CN 201910858414A CN 112488137 A CN112488137 A CN 112488137A
Authority
CN
China
Prior art keywords
sample data
negative sample
face image
living body
frequency domain
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910858414.0A
Other languages
English (en)
Inventor
黄颖
张文伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Huya Technology Co Ltd
Original Assignee
Guangzhou Huya Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Huya Technology Co Ltd filed Critical Guangzhou Huya Technology Co Ltd
Priority to CN201910858414.0A priority Critical patent/CN112488137A/zh
Publication of CN112488137A publication Critical patent/CN112488137A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/40Spoof detection, e.g. liveness detection
    • G06V40/45Detection of the body part being alive

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本发明实施例提出一种样本获取方法、装置、电子设备及机器可读存储介质,涉及数据增强技术领域,根据负样本数据中包含差异特征数据的目标特征数据对正样本数据进行处理,以将正样本数据转换为包含该差异特征数据的新的负样本数据。如此,可以快速地获得大量负样本数据。

Description

样本获取方法、装置、电子设备及机器可读存储介质
技术领域
本发明涉及数据增强技术领域,具体而言,涉及一种样本获取方法、装置、电子设备及机器可读存储介质。
背景技术
深度学习模型常用于作为类型识别的判别器。深度学习模型的模型参数较多,为了优化模型参数,需要获取大量的样本数据对深度学习模型进行训练。其中,正样本数据通常比较容易获取,但在一些场景中,负样本数据的获取存在难度。
发明内容
有鉴于此,本发明的目的之一在于提供一种样本获取方法、装置、电子设备及机器可读存储介质,能够快捷地获取大量负样本数据。
为了实现上述目的,本发明实施例采用的技术方案如下:
第一方面,本发明实施例提供一种样本获取方法,所述方法包括:
获取第一负样本数据;
从所述第一负样本数据提取目标特征信息,其中,所述目标特征信息包含用于区分所述第一负样本数据和正样本数据的差异特征信息;
根据所述目标特征信息对正样本数据进行处理,得到第二负样本数据。
在可选的实施方式中,所述正样本数据为活体人脸图像,所述第一负样本数据为非活体人脸图像,所述差异特征信息为非活体特征信息。
在可选的实施方式中,所述从所述第一负样本数据提取目标特征信息,包括:
对所述非活体人脸图像进行频域变换,得到所述非活体人脸图像的频谱图;
从所述非活体人脸图像的频谱图中获取包含所述非活体特征信息的第一频域块作为所述目标特征信息。
在可选的实施方式中,所述频域变换为傅里叶变换,所述目标特征信息为所述非活体人脸图像的频谱图中的至少一个高频频域块;或者,
所述频域变换为离散余弦变换,所述目标特征信息为所述非活体人脸图像的频谱图中的至少一个低频频域块。
在可选的实施方式中,所述根据所述目标特征信息对正样本数据进行处理,得到第二负样本数据,包括:
对所述活体人脸图像进行所述频域变换,得到所述活体人脸图像的第一频谱图;
从所述第一频谱图中确定与每个所述第一频域块对应的第二频域块,将确定的每个所述第二频域块替换成对应的所述第一频域块,得到第二频谱图;
对所述第二频谱图进行与所述频域变换对应的逆向变换,并将得到的人脸图像作为所述第二负样本数据。
在可选的实施方式中,所述目标特征信息包括所述非活体人脸图像的纹理特征、图像质量特征、颜色特征中的至少一个;
所述根据所述目标特征信息对正样本数据进行处理,得到第二负样本数据,包括:
将所述目标特征信息融合到所述活体人脸图像中,并将得到的人脸图像作为所述第二负样本数据。
在可选的实施方式中,所述根据所述目标特征信息对正样本数据进行处理,得到第二负样本数据,包括:
根据所述目标特征信息分别对包含不同人脸的多个活体人脸图像进行处理,得到包含不同人脸的多个第二负样本数据。
在可选的实施方式中,所述方法还包括:
采用所述正样本数据及所述第二负样本数据,对人脸活体识别模型进行训练或测试。
第二方面,本发明实施例提供一种样本获取装置,包括:
获取模块,用于获取第一负样本数据;
提取模块,用于从所述第一负样本数据提取目标特征信息,其中,所述目标特征信息包含用于区分所述第一负样本数据和正样本数据的差异特征信息;
样本处理模块,用于根据所述目标特征信息对正样本数据进行处理,得到第二负样本数据。
第三方面,本发明实施例提供一种电子设备,包括处理器及机器可读存储介质,所述机器可读存储介质上存储有机器可执行指令,所述机器可执行指令被执行时促使所述处理器实现前述第一方面的实施方式中任意一项所述的方法。
第四方面,本发明实施例提供一种机器可读存储介质,其上存储有机器可执行指令,所述机器可执行指令被执行时实现前述第一方面的实施方式中任意一项所述的方法。
相较于现有技术,本发明实施例具有的有益效果包括:
本发明实施例提供的样本获取方法、装置、电子设备及机器可读存储介质,只需直接制造少量的第一负样本数据,再通过处理使正样本数据包含第一负样本数据的差异特征信息,即可快速地获得大量的第二负样本数据,大大节约了获取负样本数据所需的时间和成本。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了本发明实施例提供的一种样本获取方法的流程示意图;
图2示出了图1所示步骤S120的一种子步骤示意图;
图3示出了本发明实施例提供的一个示例中人脸图像的频谱图;
图4示出了本发明实施例提供的另一个示例中,人脸图像的频谱图的区域划分示意图;
图5示出了图1所示步骤S130的一种子步骤示意图;
图6示出了本发明实施例提供的一个示例中的第二负样本数据的生成流程;
图7示出了按照图6所示流程生成的第二负样本数据的效果示意图;
图8示出了本发明实施例提供的一种电子设备的方框示意图;
图9示出了本发明实施例提供的一种样本获取装置的功能模块框图。
图标:100-电子设备;101-处理器;102-机器可读存储介质;103-系统总线;110-样本获取装置;111-获取模块;112-提取模块;113-样本处理模块。
具体实施方式
下面将结合本发明实施例中附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
在一些使用深度学习模型进行类别判定的场景中,用于训练深度学习模型的训练数据通常包括正样本数据和负样本数据。例如,用于判断待识别对象是否属于目标类别的深度学习模型,对其进行训练所需的正样本数据通常是属于目标类别的样例数据,负样本数据通常是属于与目标类别不同的其他类别的样例数据。
在实际应用中,有时无法确定用于判断目标类别和不同于目标类别的其他类别的具体特征,无法直接利用该具体特征来生成负样本数据,而是需要模拟其他类别的数据在实际应用中的出现场景,以获得相应的负样本数据。但模拟其他类别数据的出现场景需要花费大量的时间和金钱,成本较高,效率低下。
基于此,本发明实施例提供一种样本获取方法、装置、电子设备及机器可读存储介质,能够方便快捷地获取大量负样本。下面对该内容进行阐述。
请参照图1,图1是本实施例提供的一种样本获取方法的流程示意图,该方法可以由任意具有数据处理功能的电子设备来执行。下面对该方法的各个步骤进行详述。
步骤S110,获取第一负样本数据。
其中,第一负样本数据可以通过模拟不属于目标类别的数据的出现场景来预先获得。
步骤S120,从所述第一负样本数据中提取目标特征信息,其中,所述目标特征信息包含用于区分所述第一负样本数据和正样本数据的差异特征信息。
其中,差异特征信息是指第一负样本数据中能够和正样本数据区分开的信息,即能够标识第一负样本数据不属于目标类别的信息。
经研究,虽然无法直接确定用于区分目标类别和不同于目标类别的其他类别的差异特征信息,但是,基于产生目标类别数据和其他类别数据的场景及相关经验,可以预先确定所述差异特征信息通常隐含在数据的哪些部分中。其中,第一负样本数据中隐藏有所述差异特征信息的部分信息,即为本实施例描述的目标特征信息。
步骤S130,根据所述目标特征信息对正样本数据进行处理,得到第二负样本数据。
其中,基于目标特征信息对正样本数据进行处理的方式可以有多种,本实施例没有限制,只要能够将正样本数据处理为包含所述目标特征信息的数据即可。例如,可以采用目标特征信息替换正样本数据中的部分特征信息,以得到第二负样本数据。又如,可以将目标特征信息融合到正样本数据中,得到第二负样本数据。
实施时,可以预先获得大量的正样本数据和少量的第一负样本数据,其中,正样本数据通常可以从网络上抓取到,第一负样本数据可以通过模拟数据出现场景的方式获得。基于所述大量的正样本数据和少量的第一负样本数据获取第二负样本数据的方式可以有多种:
在一种实施方式中,可以依次从每个第一负样本数据中提取目标特征信息,对于提取的每个目标特征信息,依据该目标特征信息分别对各个正样本数据进行处理,得到对应的多个第二负样本数据。
在另一种实施方式中,每次可以随机地选取一个第一负样本数据和一个正样本数据,从随机选取的第一负样本数据中提取目标特征信息,依据该目标特征信息对随机选取的正样本数据进行处理,得到对应的一个第二负样本数据。重复前述流程,即可获得大量第二负样本数据。
因此,通过图1所示的方法,可以将第一负样本数据中包含差异特征信息的目标特征信息添加到正样本数据中,构造出包含第一负样本数据的差异特征信息的第二负样本数据。通过该方法,只需通过模拟数据出现场景的方式获取少量的负样本数据,大量的其他负样本数据均可通过数据处理的方式获得,大大节约了时间和模拟场景所需的花费,降低了成本,提高了效率。
本实施例提供的样本获取方法可以应用于不同的场景中。
比如,随着人脸识别技术日趋成熟,其应用越来越广泛。但是,人脸识别系统非常容易受到非真人人脸数据的恶意攻击,影响识别结果的准确性。因此,人脸识别系统通常会采用活体识别技术来判断捕捉的人脸是真实人脸,还是伪造的人脸攻击,如彩色纸张打印的人脸、电子设备屏幕中的人脸图像、人脸面具、3D打印的人脸模型等。
目前,实现活体识别的技术分为两大类:第一类,采用动作指令配合的方式来进行活体识别,即,提示用户按照指定的顺序做动作,若动作顺序不匹配,则将当前识别的对象确定为非活体(即,非真实人脸);第二类,基于采集的人脸图像的物理特征来进行活体识别的非配合式方案。由于第一种方式需要用户配合,体验较差,因此目前多采用第二种方式。
然而,上述第二类方式主要依赖于深度学习模型实现,训练该深度学习模型通常需要用到正样本数据和负样本数据。在此场景中,正样本数据是活体人脸图像(即,采用图像采集设备直接采集的真人人脸图像),负样本数据是非活体人脸图像。其中,活体人脸图像比较容易获得,如可以从网络抓取等。
然而,由于实际应用场景中,无法直接确定区别活体和非活体的差异特征,因而,无法直接基于该差异特征制造非活体人脸数据作为负样本数据,而只能采用与非活体攻击类似的方式来制造负样本数据,例如,通常采用翻拍人脸图像、翻录人脸视频、3D打印获得人脸头像模型、制造人脸面具等方式获得负样本数据,这些方式都需要花费较长时间,且所需成本较高。
通过将本实施例提供的样本获取方法应用于活体识别场景,可以改善以上问题。具体地,在活体识别场景中,步骤S110中的正样本数据可以为活体人脸图像,步骤S120中的第一负样本数据可以为非活体人脸图像,差异特征信息可以为非活体特征,即,非活体人脸图像中用于将非活体人脸图像和活体人脸图像区分开的特征信息。
以活体识别场景为例,非活体人脸图像中包含差异特征信息的目标特征信息可以有多种。
经研究发现,将图像从空域变换到频域后,图像中区分活体和非活体的差异特征信息通常集中在特定的频率区间。
因此,在第一种实施方式中,可以将作为第一负样本数据的非活体人脸图像从空域转换到频域,再从非活体人脸图像的频谱图中提取相应的目标特征信息。为了实现这一过程,如图2所示,步骤S120可以包括如下步骤。
步骤S120-1,对所述非活体人脸图像进行频域变换,得到所述非活体人脸图像的频谱图。
步骤S120-2,从所述非活体人脸图像的频谱图中获取包含所述非活体特征信息的第一频域块作为所述目标特征信息。
在步骤S120-1中,频域变换可以有多种实现方式。
在一个示例中,频域变换例如可以是傅里叶变换(FourierTransform,FT)。其中,非活体人脸图像上的一个像素点与其相邻像素点的差异大小可以用梯度表示,该梯度与非活体人脸图像的频谱图中的一个频率点对应。由此可以看出,频谱图中频率反映的是非活体人脸图像中像素信息的变化快慢,变化较快的图像细节信息(如,边缘信息、纹理信息等)通常集中在频谱图的高频部分中。
经研究分析,非活体人脸图像和活体人脸图像的边缘信息通常存在区别,并且,非活体人脸图像在图像细节上会出现明显的镜像反射、模糊、摩尔纹信息,这是活体人脸图像所不具备的。根据上述关于频谱图特性的描述,边缘信息、镜像反射、模糊、摩尔纹信息等变化明显的图像细节信息通常集中反映在非活体人脸图像的频谱图的高频部分。
因此,在步骤S120-2中,可以从非活体人脸图像的频谱图中选取高频频域块作为第一频域块。
在本实施例中,当频域变换为傅里叶变换时,非活体人脸图像的频谱图的中心通常表示非活体人脸图像的平均灰度,频率为0,即,中心为低频信息,外围为高频信息。
请参照图3,图3示出了一个人脸图像A1,及人脸图像A1经傅里叶变换得到的频谱图A1,可以从频谱图I1中确定包含其中心点的预设尺寸的频域块,例如一个1×1大小的频域块block1,在实施时,可以从频谱图I1中除block1之外的其他区域选取至少一个预设大小的频域块,提取的每个频域块均为本实施例中的第一频域块。例如,从block1之外的其他区域,提取n(n为大于等于1的整数)个m×m大小的频域块,其中,m例如可以取4、8、16等数值。
在另一个示例中,频域变换例如可以是离散余弦变换(DiscreteCosineTransform,DCT)。通过离散余弦变换,可以将原始图像(如,活体人脸图像或非活体人脸图像)中的图像细节信息映射到频谱图的低频部分,换言之,基于离散余弦变换得到的频谱图中的低频信息,可以很好地识别原始图像是否为活体人脸图像。
在此情况下,步骤S120-2中,可以从非活体人脸图像的频谱图中提取低频频域块作为第一频域块。
对应地,当频域变换为离散余弦变换时,非活体人脸图像的频谱图中,低频信息通常集中在频谱图的左上角区域,高频信息通常集中在频谱图的右下角区域。因此,对于经离散余弦变换得到的非活体人脸图像的频谱图,可以将该频谱图等分为如图4所示的S1、S2、S3、S4四个区域,在实施时,可以从位于左上角的区域S1提取至少一个预设大小的频域块,提取的每个频域块均为第一频域块。
可以理解,所述频域变换还可以通过其他算法实现,本实施例对此没有限制。
在本实施例中,当目标特征信息为非活体人脸图像的频谱图中的第一频域块时,可以基于第一频域块对作为正样本数据的活体人脸图像进行处理,具体处理方式可以有多种。
在一种方式中,请再次参照图5,步骤S130可以包括如下步骤。
步骤S130-1,对所述活体人脸图像进行所述频域变换,得到所述活体人脸图像的第一频谱图。
其中,对活体人脸图像进行频域变换的方式与上述步骤S120-1中,对非活体人脸图像进行频域变换的方式相同,在此不再赘述。
步骤S130-2,从所述第一频谱图中确定与每个所述第一频域块对应的第二频域块,将确定的每个所述第二频域块替换成对应的所述第一频域块,得到第二频谱图。
在本实施例中,可以将作为正样本数据的活体人脸图像和作为第一负样本数据的非活体人脸图像,预先处理为相同大小的图像,如此,步骤S120-1中得到的非活体人脸图像的频谱图与步骤S130-1中得到的第一频谱图的大小也将相同。在此情况下,可以将第一频谱图中与第一频域块所处位置相同的频域块,即为对应的第二频域块。
步骤S130-3,对所述第二频谱图进行与所述频域变换对应的逆向变换,并将得到的人脸图像作为所述第二负样本数据。
其中,当频域变换是傅里叶变换时,其对应的逆向变换为傅里叶逆变换;当频域变换是离散余弦变换时,其对应的逆向变换是离散余弦反变换。
请参照图6,其中以频域变换是傅里叶变换为例,示出了基于活体人脸图像的频谱图和非活体人脸图像的第一频谱图生成第二负样本数据的具体流程。
其中,活体人脸图像A1经傅里叶变换得到第一频谱图I1,非活体人脸图像A2经傅里叶变换得到第二频谱图I2。从第一频谱图I1中提取c1、c2、c3、c4四个第一频域块作为目标特征信息。在第二频谱图I2中,将第二频域块c1’替换成对应的第一频域块c1,将第二频域块c2’替换成对应的第一频域块c2,将第二频域块c3’替换成对应的第一频域块c3,将第二频域块c4’替换成对应的第一频域块c4,即可得到替换处理后的频谱图I3。然后,再对频谱图I3进行逆向傅里叶变换,得到的图像A3即为第二负样本数据。
请再参照图7,其中示出了图像A3的局部示意图,图像A3中人脸的基本轮廓没有发生改变,但在图像细节上具备了非活体人脸图像的差异特征信息。
在其他方式中,可以将第一频域块与活体人脸图像的频谱图中对应位置的第二频域块进行叠加,得到新的频谱图,再对新的频谱图进行与所述频域变换对应的逆向变换,即可得到第二负样本数据。
经研究发现,由于一些非活体人脸图像是通过对活体人脸图像翻拍、翻录而来,因此非活体人脸图像在图像质量上与活体人脸图像存在一定区别。此外,另一些非活体人脸图像是通过3D人脸模型、人脸面具获取的,其纹理信息和颜色信息与活体人脸图像存在一定区别。
基于此,在本实施例的第二种实施方式中,目标特征信息还可以是纹理特征、图像质量特征、颜色特征中的至少一种。本实施例中,可以采用已有的特征提取算法或模型,从作为第一负样本数据的非活体人脸图像中提取上述纹理特征、图像质量特征、颜色特征,再采用特征级的图像融合算法,将提取的特征融合到作为正样本数据的活体人脸图像中,如此,融合得到的新图像中包含了非活体人脸图像的纹理特征、图像质量特征、颜色特征中的至少一种,可以作为第二负样本数据。
在现有技术中,通过模拟非活体攻击的方式来制造非活体人脸图像,例如制造3D人脸模型、人脸面具等,往往受限于数据采集者在短时间内能够接触的不同身份人的数量,并且由于制造耗时较长,通常难以在短时间内制造大量包含不同人脸的非活体人脸图像。
为了改善上述问题,本实施例提供的样本获取方法还可以包括以下步骤:
根据所述目标特征信息分别对包含不同人脸的多个活体人脸图像进行处理,得到包含不同人脸的多个第二负样本数据。
换言之,可以按照图1所示流程对包含不同人脸的多个活体人脸图像进行处理,以得到大量的具有差异性的非活体人脸图像,使得后续基于该非活体人脸图像训练得到的深度学习模型在对不同人脸进行检测时,仍有较高的准确率,即,具有较好的泛化能力。
通过本实施例提供的样本获取方法获得的第二负样本数据可以和其他的正样本数据相互配合,用于深度学习模型的训练或测试,例如对用于活体识别的深度学习模型进行训练或测试。
请参照图8,图8示出了本实施例提供的一种电子设备100的方框示意图。电子设备100包括处理器101和机器可读存储介质102,处理器101和机器可读存储介质102可以经由系统总线103通信连接。机器可读存储介质102上存储有机器可执行指令,该机器可执行指令被执行时促使处理器101实现本实施例提供的样本获取方法的处理流程。
其中,机器可读存储介质102可以是,但不限于,随机存取存储器(Random AccessMemory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(ProgrammableRead-Only Memory,PROM),可擦除只读存储器(Erasable Programmable Read-OnlyMemory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-OnlyMemory,EEPROM)等。
值得说明的是,图8所示的结构仅为示意,电子设备100还可以具有比图8所示更多或更少的组件,或是具有与图8所示完全不同的配置,例如,图8所示电子设备100还可以包括用于与外部设备通信的通信单元,本实施例对此没有限制。
请参照图9,图9示出了本实施例提供的一种样本获取装置110的功能模块框图。其中,样本获取装置110包括至少一个可以以软件形式存储于机器可读存储介质102中的功能模块。从功能上划分,样本获取装置110可以包括获取模块111、提取模块112以及样本处理模块113。
其中,获取模块111用于获取第一负样本数据。
提取模块112用于从所述第一负样本数据提取目标特征信息,其中,所述目标特征信息包含用于区分所述第一负样本数据和正样本数据的差异特征信息。
样本处理模块113用于根据所述目标特征信息对正样本数据进行处理,得到第二负样本数据。
其中,在活体识别场景中,所述正样本数据可以为活体人脸图像,所述第一负样本数据可以为非活体人脸图像,所述差异特征信息可以为非活体特征信息。
关于上述功能模块的详细描述,具体可以参考前文对相关步骤的详细描述,在此不再赘述。
综上所述,本发明实施例提供的样本获取方法、装置、电子设备及机器可读存储介质,只需直接制造少量的第一负样本数据,再通过处理使正样本数据包含第一负样本数据的差异特征信息,即可快速地获得大量的第二负样本数据,大大节约了获取负样本数据所需的时间和成本。
需要说明的是,在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本发明的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本发明各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本发明的选定实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (11)

1.一种样本获取方法,其特征在于,所述方法包括:
获取第一负样本数据;
从所述第一负样本数据提取目标特征信息,其中,所述目标特征信息包含用于区分所述第一负样本数据和正样本数据的差异特征信息;
根据所述目标特征信息对正样本数据进行处理,得到第二负样本数据。
2.根据权利要求1所述的方法,其特征在于,所述正样本数据为活体人脸图像,所述第一负样本数据为非活体人脸图像,所述差异特征信息为非活体特征信息。
3.根据权利要求2所述的方法,其特征在于,所述从所述第一负样本数据提取目标特征信息,包括:
对所述非活体人脸图像进行频域变换,得到所述非活体人脸图像的频谱图;
从所述非活体人脸图像的频谱图中获取包含所述非活体特征信息的第一频域块作为所述目标特征信息。
4.根据权利要求3所述的方法,其特征在于,
所述频域变换为傅里叶变换,所述目标特征信息为所述非活体人脸图像的频谱图中的至少一个高频频域块;或者,
所述频域变换为离散余弦变换,所述目标特征信息为所述非活体人脸图像的频谱图中的至少一个低频频域块。
5.根据权利要求3或4所述的方法,其特征在于,所述根据所述目标特征信息对正样本数据进行处理,得到第二负样本数据,包括:
对所述活体人脸图像进行所述频域变换,得到所述活体人脸图像的第一频谱图;
从所述第一频谱图中确定与每个所述第一频域块对应的第二频域块,将确定的每个所述第二频域块替换成对应的所述第一频域块,得到第二频谱图;
对所述第二频谱图进行与所述频域变换对应的逆向变换,并将得到的人脸图像作为所述第二负样本数据。
6.根据权利要求2所述的方法,其特征在于,所述目标特征信息包括所述非活体人脸图像的纹理特征、图像质量特征、颜色特征中的至少一个;
所述根据所述目标特征信息对正样本数据进行处理,得到第二负样本数据,包括:
将所述目标特征信息融合到所述活体人脸图像中,并将得到的人脸图像作为所述第二负样本数据。
7.根据权利要求2所述的方法,其特征在于,所述根据所述目标特征信息对正样本数据进行处理,得到第二负样本数据,包括:
根据所述目标特征信息分别对包含不同人脸的多个活体人脸图像进行处理,得到包含不同人脸的多个第二负样本数据。
8.根据权利要求2-4及7中任意一项所述的方法,其特征在于,所述方法还包括:
采用所述正样本数据及所述第二负样本数据,对人脸活体识别模型进行训练或测试。
9.一种样本获取装置,其特征在于,包括:
获取模块,用于获取第一负样本数据;
提取模块,用于从所述第一负样本数据提取目标特征信息,其中,所述目标特征信息包含用于区分所述第一负样本数据和正样本数据的差异特征信息;
样本处理模块,用于根据所述目标特征信息对正样本数据进行处理,得到第二负样本数据。
10.一种电子设备,其特征在于,包括处理器及机器可读存储介质,所述机器可读存储介质上存储有机器可执行指令,所述机器可执行指令被执行时促使所述处理器实现权利要求1-8中任意一项所述的方法。
11.一种机器可读存储介质,其上存储有机器可执行指令,其特征在于,所述机器可执行指令被执行时实现权利要求1-8中任意一项所述的方法。
CN201910858414.0A 2019-09-11 2019-09-11 样本获取方法、装置、电子设备及机器可读存储介质 Pending CN112488137A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910858414.0A CN112488137A (zh) 2019-09-11 2019-09-11 样本获取方法、装置、电子设备及机器可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910858414.0A CN112488137A (zh) 2019-09-11 2019-09-11 样本获取方法、装置、电子设备及机器可读存储介质

Publications (1)

Publication Number Publication Date
CN112488137A true CN112488137A (zh) 2021-03-12

Family

ID=74920107

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910858414.0A Pending CN112488137A (zh) 2019-09-11 2019-09-11 样本获取方法、装置、电子设备及机器可读存储介质

Country Status (1)

Country Link
CN (1) CN112488137A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113111966A (zh) * 2021-04-29 2021-07-13 北京九章云极科技有限公司 一种图像处理方法和图像处理系统
CN113762138A (zh) * 2021-09-02 2021-12-07 恒安嘉新(北京)科技股份公司 伪造人脸图片的识别方法、装置、计算机设备及存储介质
CN115311525A (zh) * 2022-10-08 2022-11-08 阿里巴巴(中国)有限公司 深度伪造检测方法及对应装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113111966A (zh) * 2021-04-29 2021-07-13 北京九章云极科技有限公司 一种图像处理方法和图像处理系统
CN113762138A (zh) * 2021-09-02 2021-12-07 恒安嘉新(北京)科技股份公司 伪造人脸图片的识别方法、装置、计算机设备及存储介质
CN113762138B (zh) * 2021-09-02 2024-04-23 恒安嘉新(北京)科技股份公司 伪造人脸图片的识别方法、装置、计算机设备及存储介质
CN115311525A (zh) * 2022-10-08 2022-11-08 阿里巴巴(中国)有限公司 深度伪造检测方法及对应装置
CN115311525B (zh) * 2022-10-08 2023-03-14 阿里巴巴(中国)有限公司 深度伪造检测方法及对应装置

Similar Documents

Publication Publication Date Title
Matern et al. Exploiting visual artifacts to expose deepfakes and face manipulations
Jourabloo et al. Face de-spoofing: Anti-spoofing via noise modeling
Zhou et al. Two-stream neural networks for tampered face detection
RU2691195C1 (ru) Качество изображения и признака, улучшение изображения и выделение признаков для распознавания по сосудам глаза и лицам, и объединение информации о сосудах глаза с информацией о лицах и/или частях лиц для биометрических систем
AU2018292176B2 (en) Detection of manipulated images
Zhang et al. Face morphing detection using Fourier spectrum of sensor pattern noise
Zhang et al. A face antispoofing database with diverse attacks
CN105917353B (zh) 用于生物认证的特征提取及匹配以及模板更新
Spreeuwers et al. Towards robust evaluation of face morphing detection
CN112686812B (zh) 银行卡倾斜矫正检测方法、装置、可读存储介质和终端
CN111754396B (zh) 脸部图像处理方法、装置、计算机设备和存储介质
Boulkenafet et al. Scale space texture analysis for face anti-spoofing
CN108416343B (zh) 一种人脸图像识别方法及装置
Raghavendra et al. Presentation attack detection algorithms for finger vein biometrics: A comprehensive study
CN112488137A (zh) 样本获取方法、装置、电子设备及机器可读存储介质
CN112991345B (zh) 图像真伪检测方法、装置、计算机设备和存储介质
Su et al. A novel forgery detection algorithm for video foreground removal
Thajeel et al. A Novel Approach for Detection of Copy Move Forgery using Completed Robust Local Binary Pattern.
CN111192241A (zh) 一种人脸图像的质量评估方法、装置及计算机存储介质
Zhang et al. Distinguishing photographic images and photorealistic computer graphics using visual vocabulary on local image edges
CN112633221A (zh) 一种人脸方向的检测方法及相关装置
CN114724218A (zh) 视频检测方法、装置、设备及介质
CN109697442B (zh) 一种字符识别模型的训练方法和装置
CN111275070B (zh) 一种基于局部特征匹配的签名验证方法及设备
CN113807237B (zh) 活体检测模型的训练、活体检测方法、计算机设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination