CN110427862B - 一种人脸图片收集方法、装置及电子设备 - Google Patents
一种人脸图片收集方法、装置及电子设备 Download PDFInfo
- Publication number
- CN110427862B CN110427862B CN201910684871.2A CN201910684871A CN110427862B CN 110427862 B CN110427862 B CN 110427862B CN 201910684871 A CN201910684871 A CN 201910684871A CN 110427862 B CN110427862 B CN 110427862B
- Authority
- CN
- China
- Prior art keywords
- face
- videos
- cluster
- video
- cluster set
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/46—Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Abstract
本发明实施例提供了一种人脸图片收集方法及装置,其中,该方法包括:从多个视频中提取人脸特征,并记录提取的每个人脸特征在上述多个视频中的出现信息,对提取的人脸特征进行聚类,得到多个聚类集合,针对每个聚类集合,基于该聚类集合中每个人脸特征的出现信息,生成该聚类集合的人脸特征分布信息,从上述多个聚类集合中,选择出人脸特征分布信息与指定人物在上述多个视频中的人物分布信息最接近的聚类集合,作为目标聚类集合,收集该目标聚类集合中的各人脸特征所属的视频帧图片,作为该指定人物的人脸图片;本发明实施例解决了由于难以收集到指定人物的所需要的人脸图片而导致的难以对指定人物进行识别的问题,提高了人物识别的召回率。
Description
技术领域
本发明涉及多媒体识别技术领域,特别是涉及一种人脸图片收集方法、装置及电子设备。
背景技术
人脸识别是一种基于人的脸部特征信息进行身份识别的生物识别技术,其在各个领域已经逐渐崭露头角;人脸识别的方式主要有两种,一种是在线匹配,具体实现步骤是:收集指定人物的人脸图片,筛选得到指定人物具有代表性的标准图,基于待识别图片与标准图的相似度,判断该待识别图片中是否为指定人物的图片;另一种是模型识别,具体实现步骤是:收集指定人物的人脸图片,使用收集到的人脸图片对创建的模型进行训练,得到一个可以识别指定人物的独立模型,通过独立模型实现对指定人物的识别。
发明人在实现本发明的过程中发现,现有技术至少存在如下问题:
以上人脸识别的方式,均需要收集指定人物的人脸图片,传统的收集人脸图片的方法主要是依据人名从互联网上进行爬取,但是,由于一些人物在互联网上公开的人脸图片不多或者是几乎没有,很难通过上述的方法收集到所需要的人脸图片。
发明内容
本发明实施例的目的在于提供一种人脸图片收集方法及装置,用以解决由于难以收集到指定人物的所需要的人脸图片而导致的难以对指定人物进行识别的问题。具体技术方案如下:
本发明实施例提供了一种人脸图片收集方法,其包括:
从多个视频中提取人脸特征,并记录提取的每个人脸特征在所述多个视频中的出现信息,所述出现信息表示人脸特征所属的视频,所述多个视频中均出现有指定人物的人脸特征;
对提取的人脸特征进行聚类,得到多个聚类集合;
针对每个聚类集合,基于该聚类集合中每个人脸特征的出现信息,生成该聚类集合的人脸特征分布信息,所述人脸特征分布信息表示该聚类集合中人脸特征所属的视频;
从所述多个聚类集合中,选择出人脸特征分布信息与指定人物在所述多个视频中的人物分布信息最接近的聚类集合,作为目标聚类集合,所述指定人物的人物分布信息表示所述多个视频中出现有所述指定人物的视频,且与所述多个视频中的其他人物的人物分布信息不同;
收集所述目标聚类集合中的各人脸特征所属的视频帧图片,作为所述指定人物的人脸图片。
可选的,所述从所述多个聚类集合中,选择出人脸特征分布信息与指定人物在所述多个视频中的人物分布信息最接近的聚类集合,作为目标聚类集合,包括:
从所述多个聚类集合中,选择出人脸特征分布信息的视频数量最多的聚类集合,作为目标聚类集合。
可选的,所述从多个视频中提取人脸特征,包括:
将所述多个视频中的每个视频分解为连续多个视频帧图片;
针对分解得到的多个视频帧图片中的每个视频帧图片,对该视频帧图片进行人脸置信度检测,得到该视频帧图片的人脸置信度,所述人脸置信度表示该视频帧图片中具有人脸区域的程度;
当所述人脸置信度大于预设置信度阈值时,提取该视频帧图片的人脸特征。
可选的,所述对提取的人脸特征进行聚类,得到多个聚类集合,包括:
按照预设聚类数对提取的人脸特征进行聚类,得到所述预设聚类数个聚类集合,其中,所述预设聚类数不小于所述多个视频中出现的已知人物数量。
可选的,所述收集所述目标聚类集合中的各人脸特征所属的视频帧图片,作为所述指定人物的人脸图片,包括:
如果选择得到的目标聚类集合为多个,从多个目标聚类集合中选择具有人脸特征的数量最多的聚类集合,作为待收集聚类集合;
收集所述待收集聚类集合中的各人脸特征所属的视频帧图片,作为所述指定人物的人脸图片。
本发明实施例还提供了一种人脸图片收集装置,其包括:
人脸特征提取模块,用于从多个视频中提取人脸特征,并记录提取的每个人脸特征在所述多个视频中的出现信息,所述出现信息表示人脸特征所属的视频,所述多个视频中均出现有指定人物的人脸特征;
人脸特征聚类模块,用于对提取的人脸特征进行聚类,得到多个聚类集合;
分布信息生成模块,用于针对每个聚类集合,基于该聚类集合中每个人脸特征的出现信息,生成该聚类集合的人脸特征分布信息,所述人脸特征分布信息表示该聚类集合中人脸特征所属的视频;
目标聚类集合选取模块,用于从所述多个聚类集合中,选择出人脸特征分布信息与指定人物在所述多个视频中的人物分布信息最接近的聚类集合,作为目标聚类集合,所述指定人物的人物分布信息表示所述多个视频中出现有所述指定人物的视频,且与所述多个视频中的其他人物的人物分布信息不同;
人脸图片收集模块,用于收集所述目标聚类集合中的各人脸特征所属的视频帧图片,作为所述指定人物的人脸图片。
可选的,所述目标聚类集合选取模块,具体用于从所述多个聚类集合中,选择出人脸特征分布信息的视频数量最多的聚类集合,作为目标聚类集合。
可选的,所述人脸特征提取模块,包括:
视频分解子模块,用于将所述多个视频中的每个视频分解为连续多个视频帧图片;
人脸置信度检测子模块,用于针对分解得到的多个视频帧图片中的每个视频帧图片,对该视频帧图片进行人脸置信度检测,得到该视频帧图片的人脸置信度,所述人脸置信度表示该视频帧图片中具有人脸区域的程度;
人脸特征提取子模块,用于当所述人脸置信度大于预设置信度阈值时,提取该视频帧图片的人脸特征。
可选的,所述人脸特征聚类模块,具体用于按照预设聚类数对提取的人脸特征进行聚类,得到所述预设聚类数个聚类集合,其中,所述预设聚类数不小于所述多个视频中出现的已知人物数量。
可选的,所述人脸图片收集模块,具体用于如果选择得到的目标聚类集合为多个,从多个目标聚类集合中选择具有人脸特征的数量最多的聚类集合,作为待收集聚类集合;以及收集所述待收集聚类集合中的各人脸特征所属的视频帧图片,作为所述指定人物的人脸图片。
本发明实施例还提供了一种电子设备,其包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现上述任一所述的人脸图片收集方法的步骤。
本发明实施还提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述任一人脸图片收集方法的步骤。
本发明实施例还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述任一人脸图片收集方法。
本发明实施例有益效果:
本发明实施例提供的一种人脸图片收集方法及装置,通过从多个视频中提取人脸特征,并记录提取的每个人脸特征在该多个视频中的出现信息,然后对提取的人脸特征进行聚类,得到多个聚类集合,然后针对每个聚类集合,基于该聚类集合中每个人脸特征的出现信息,生成该聚类集合的人脸特征分布信息,再从上述的多个聚类集合中,选择出人脸特征分布信息与指定人物在上述多个视频中的人物分布信息最接近的聚类集合,作为目标聚类集合,然后收集上述目标聚类集合中的各人脸特征所属的视频帧图片,作为指定人物的人脸图片。采用本发明实施例提供的方案,能够收集指定人物的视频帧图片,解决由于难以收集到指定人物的所需要的人脸图片而导致的难以对指定人物进行识别的问题,提高人物识别的召回率。
当然,实施本发明的任一产品或方法并不一定需要同时达到以上所述的所有优点。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。
图1为本发明实施例提供的一种人脸图片收集方法的流程图;
图2为本发明实施例提供的一种从多个视频中提取人脸特征的流程图;
图3为本发明实施例提供的一种人脸图片收集装置的结构示意图;
图4为本发明实施例提供的一种人脸特征提取模块的结构示意图;
图5为本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。
本发明实施例提供一种人脸图片收集方法,如图1所示,具体可以包括如下步骤:
S101,从多个视频中提取人脸特征,并记录提取的每个人脸特征在该多个视频中的出现信息,该出现信息表示人脸特征所属的视频。
S102,对提取的人脸特征进行聚类,得到多个聚类集合。
S103,针对每个聚类集合,基于该聚类集合中每个人脸特征的出现信息,生成该聚类集合的人脸特征分布信息,该人脸特征分布信息表示该聚类集合中人脸特征所属的视频。
S104,从上述的多个聚类集合中,选择出人脸特征分布信息与指定人物在上述多个视频中的人物分布信息最接近的聚类集合,作为目标聚类集合,该指定人物的人物分布信息表示上述多个视频中出现有该指定人物的视频,且与该多个视频中的其他人物的人物分布信息不同。
S105,收集上述的目标聚类集合中的各人脸特征所属的视频帧图片,作为该指定人物的人脸图片。
采用本发明实施例提供的上述人脸图片收集方法,针对一些难以在网上收集到所需要的人脸图片的指定人物,可以收集该指定人物的视频帧图片,解决由于难以收集到指定人物的所需要的人脸图片而导致的难以对指定人物进行识别的问题,提高了人物识别的召回率。
下面对本发明实施例提供的人脸图片收集方法进行详细说明:
参见图1,图1为本发明实施例提供的一种人脸图片收集方法的流程图,可以包括如下步骤:
S101,从多个视频中提取人脸特征,并记录提取的每个人脸特征在该多个视频中的出现信息。
本申请实施例中的出现信息表示人脸特征所属的视频,可以理解为,从哪一个视频中提取的人脸特征。
本步骤中,在上述多个视频中,该指定人物的人物分布信息与其他人物的人物分布信息不同,其中,指定人物为需要收集人脸图片的人物,其他人物为在上述多个视频中的任一视频中出现过的除指定人物以外的任一人物,指定人物的人物分布信息表示上述多个视频中出现有该指定人物的视频,可以理解为,在上述多个视频中,指定人物在哪些视频中出现过;其他人物的人物分布信息表示上述多个视频中出现有该人物的视频,可以理解为,在上述多个视频中,该人物在哪些视频出现过。
本发明的一个实施例中,上述多个视频中均出现有指定人物的人脸特征,可以理解为,在上述多个视频中,只有指定人物的人脸特征在上述多个视频中的所有视频均出现,上述多个视频中至少存在一个其他人物没有出现的视频。
示例性的,上述多个视频中共有5个视频,分别为视频1、视频2、视频3、视频4和视频5,在这5个视频中出现过A、B、C、D、E、F、G共7个人物,其中A为指定人物,A在上述多个视频中的每个视频均出现过,B在视频1、视频2、视频3和视频5出现过,C在视频1、视频2、视频4和视频5出现过,D在视频1、视频2、视频3和视频4出现过,E在视频1和视频5出现过,F在视频3和视频5出现过,G只在视频1出现过。
在本步骤中,可以获取每个视频的出现的人物信息,基于各个视频出现的人物信息,可以通过人工筛选得到上述多个视频,也可以通过具体的算法得到上述多个视频。其中,视频出现的人物信息表示该视频中出现有哪些人物,在一个实施例中,视频出现的人物信息可以为视频公开的演员列表信息。
在一个实施例中,上述多个视频的获取步骤可以包括:
步骤一,根据视频数据库中的每个视频出现的人物信息,获取该指定人物出现过的所有视频。
本步骤中,可以根据每个视频公开的演员列表信息,可以获取该指定人物出现过的所有视频。
步骤二,从上述所有视频中随机选出一个视频组合,该视频组合的视频数量为多个。
步骤三,判断该指定人物在该视频组合中的人物分布信息是否与其他人物的人物分布信息不同。
步骤四,如果该指定人物在该视频组合中的人物分布信息与其他人物的人物分布信息不同,则将该视频组合作为上述的多个视频;如果存在其他人物在该视频组合中的人物分布信息与该指定人物在该视频组合中的人物分布信息相同,则返回步骤二,直到得到上述的多个视频。
示例性的,如果获取该指定人物出现过的所有视频的数量为10个,随机抽取其中3个视频作为一个视频组合,可以有120种视频组合,然后随机的从120种视频组合中抽取一个视频组合,根据该视频组合中的各个视频公开的人物出现信息,判断该指定人物在该视频组合中的人物分布信息是否与其他人物的人物分布信息不同,如果,不同,则可以将该视频组合作为上述的多个视频;如果相同,则可以从剩下的119中视频组合随机的抽取一个视频组合,判断该指定人物在该视频组合中的人物分布信息是否与其他人物的人物分布信息不同,以此类推,直到得到上述多个视频。如果,在上述120中视频组合中,均没有可以作为上述多个视频的视频组合,则随机抽取其中4个视频作为一个视频组合,可以有210种视频组合,重复上述步骤,直到得到上述多个视频。
S102,对提取的人脸特征进行聚类,得到多个聚类集合。
本步骤中,可以按照预设聚类数对提取的人脸特征进行聚类,得到预设聚类数个聚类集合,其中,该预设聚类数不小于上述多个视频中出现的已知人物数量。
在一个实施例中,上述的视频可以为影视作品视频,已知人物数量可以为已经参演的演员数量,由于在一些影视作品公开的参演演员信息是不全的,影视作品视频中的群众演员或者路人的信息没有在该影视作品公开的参演演员信息中,如果将影视作品公开的参演演员信息作为该视频出现的人物信息,将会导致上述多个视频中出现的已知人物数量小于上述多个视频中实际出现的人物数量,所以将该预设聚类数大于上述多个视频中出现的已知人物数量,有利于将同一个人物的人脸特征聚到同一个聚类集合。
在另一个实施例中,如果视频公开的参演演员信息是完善的,也就是说,视频中出现的所有演员的信息都被视频公开的参演演员信息公开,那么上述多个视频中出现的已知人物数量等于上述多个视频中实际出现的人物数量,此时,该预设聚类数等于上述多个视频中出现的已知人物数量,有利于将同一个人物的人脸特征聚到同一个聚类集合。
S103,针对每个聚类集合,基于该聚类集合中每个人脸特征的出现信息,生成该聚类集合的人脸特征分布信息。
本步骤中的人脸特征分布信息表示该聚类集合中人脸特征所属的视频,可以理解为,该聚类集合的每个人脸特征是从哪一个视频中提取的。
S104,从上述的多个聚类集合中,选择出人脸特征分布信息与指定人物在上述多个视频中的人物分布信息最接近的聚类集合,作为目标聚类集合。
本步骤中,该指定人物的人物分布信息表示上述多个视频中出现有该指定人物的视频,且与该多个视频中的其他人物的人物分布信息不同。
在一个实施例中,可以从上述多个聚类集合中,选择出人脸特征分布信息的视频数量最多的聚类集合,作为目标聚类集合。
示例性的,本申请实施例中的上述的多个视频共有5个视频,分别为视频1、视频2、视频3、视频4和视频5,该指定人物在上述5个视频中均出现过,上述的多个聚类集合可有4个聚类集合,分别为聚类集合1、聚类集合2、聚类集合3和聚类集合4,聚类集合1中的人脸特征有一部分属于视频1,有一部分属于视频2,有一部分属于视频3,有一部分属于视频4,有一部分属于视频5;聚类集合2中的人脸特征有一部分属于视频1,有一部分属于视频2,有一部分属于视频3,有一部分属于视频4,不存在属于视频5的人脸特征;聚类集合3中的人脸特征有一部分属于视频1,有一部分属于视频2,有一部分属于视频3,不存在属于视频4的人脸特征,不存在属于视频5的人脸特征;聚类集合4中的人脸特征有一部分属于视频1,有一部分属于视频2,有一部分属于视频3,不存在属于视频4的人脸特征,不存在属于视频5的人脸特征;则将聚类集合1作为目标聚类集合。
相应的,本申请实施例中的上述的多个视频共有5个视频,分别为视频1、视频2、视频3、视频4和视频5,该指定人物在上述5个视频中均出现过,上述的多个聚类集合可有4个聚类集合,分别为聚类集合1、聚类集合2、聚类集合3和聚类集合4,聚类集合1中的人脸特征有一部分属于视频1,有一部分属于视频2,有一部分属于视频3,有一部分属于视频4,不存在属于视频5的人脸特征;聚类集合2中的人脸特征有一部分属于视频1,有一部分属于视频2,有一部分属于视频3,不存在属于视频4的人脸特征,不存在属于视频5的人脸特征;聚类集合3中的人脸特征有一部分属于视频1,有一部分属于视频2,有一部分属于视频3,不存在属于视频4的人脸特征,不存在属于视频5的人脸特征;聚类集合4中的人脸特征有一部分属于视频1,有一部分属于视频2,有一部分属于视频4,不存在属于视频3的人脸特征,不存在属于视频5的人脸特征;则将聚类集合1作为目标聚类集合。
相应的,本申请实施例中的上述的多个视频共有5个视频,分别为视频1、视频2、视频3、视频4和视频5,该指定人物在上述5个视频中均出现过,上述的多个聚类集合可有4个聚类集合,分别为聚类集合1、聚类集合2、聚类集合3和聚类集合4,聚类集合1中的人脸特征有一部分属于视频1,有一部分属于视频2,有一部分属于视频3,有一部分属于视频4,有一部分属于视频5;聚类集合2中的人脸特征有一部分属于视频1,有一部分属于视频2,有一部分属于视频3,有一部分属于视频4,有一部分属于视频5;聚类集合3中的人脸特征有一部分属于视频1,有一部分属于视频2,有一部分属于视频3,不存在属于视频4的人脸特征,不存在属于视频5的人脸特征;聚类集合4中的人脸特征有一部分属于视频1,有一部分属于视频2,有一部分属于视频3,不存在属于视频4的人脸特征,不存在属于视频5的人脸特征;则将聚类集合1和聚类集合2作为目标聚类集合。
S105,收集上述的目标聚类集合中的各人脸特征所属的视频帧图片,作为该指定人物的人脸图片。
本发明的一个实施例中,如果选择得到的目标聚类集合为1个,收集该目标聚类集合中的各人脸特征所属的视频帧图片,作为该指定人物的人脸图片;也就是说,当选择得到的目标聚类集合的数量为1时,则将该目标聚类集合中的所有人脸特征所属的视频帧图片,作为该指定人物的人脸图片。
如果选择得到的目标聚类集合为多个,从多个目标聚类集合中选择具有人脸特征的数量最多的聚类集合,作为待收集聚类集合,也就是说,当选择得到的目标聚类集合的数量大于1时,选择具有人脸特征的数量最多的聚类集合作为待收集聚类集合,将待选择聚类集合中的所有人脸特征所属的视频帧图片,作为该指定人物的人脸图片,有利于获得更多该指定人物的人脸图片。
示例性的,本发明实施例得到3个目标聚类集合,分别为目标聚类集合1、目标聚类集合2和目标聚类集合3,目标聚类集合1具有25个人脸特征,目标聚类集合2具有12个人脸特征,目标聚类集合3具有15个人脸特征,则将目标聚类集合1作为待选择聚类集合,将该待选择聚类集合中的所有人脸特征所属的视频帧图片,作为该指定人物的人脸图片。
针对上述图1所示人脸图片收集方法中的步骤S101,从多个视频中提取人脸特征,在一个示例中,如图2所示,具体可以包括如下步骤:
S1011,将上述多个视频中的每个视频分解为连续多个视频帧图片。
本步骤中,上述多个视频中的每个视频分解为连续多个视频帧图片的过程,现有技术均能实现,在此不做详述。
S1012,针对分解得到的多个视频帧图片中的每个视频帧图片,对该视频帧图片进行人脸置信度检测,得到该视频帧图片的人脸置信度。
其中,人脸置信度可以表示该视频帧图片中具有人脸区域的程度,也可以理解为该视频帧图片中具有人脸区域的可能性,人脸置信度越高,表示具有人脸区域的可能性越大。
在一个实施例中,可以通过预先训练的人脸检测模型对该视频帧图片进行人脸置信度检测,人脸检测模型可以通过对已知具有人脸特征的人脸图片进行训练得到。
S1013,判断该人脸置信度是否大于预设置信度阈值,如果大于,进入步骤S1015;如果不大于,则进入步骤S1014。
本步骤中的预设置信度阈值,可以根据实际应用的需要,进行设置。
示例性的,本发明实施例的预设置信度阈值可以为0.55,通过预先训练的人脸检测模型对该视频帧图片进行人脸置信度检测,如果得到该视频帧图片的人脸置信度为0.6,则判定该视频帧图片中具有人脸区域,然后进入步骤S1015;如果得到该视频帧图片的人脸置信度为0.5,则判定该视频帧图片中不具有人脸区域,则进入步骤S1014。
S1014,将该视频帧图片过滤。
也就是说,当人脸置信度不大于预设置信度阈值时,将视频帧图片过滤掉。
S1015,当该人脸置信度大于预设置信度阈值时,提取该视频帧图片的人脸特征。
具体的,当人脸置信度大于预设置信度阈值时,可以确定视频帧图片中具有人脸区域,基于此,可以提取该视频帧图片的人脸特征。
采用本发明实施例提供的上述的从多个视频中提取人脸特征的方法,可以过滤掉不具有人脸区域的视频帧图片,得到具有人脸区域的视频帧图片,然后,从获得的具有人脸区域的视频帧图片,提取该视频帧图片的人脸特征。
相应于本发明实施例提供的上述人脸图片收集方法,本发明实施例还提供了一种人脸图片收集装置,参考图3,图3为本发明实施例提供的一种人脸图片收集装置的结构示意图,可以包括:
人脸特征提取模块201,用于从上述多个视频中提取人脸特征,并记录提取的每个人脸特征在上述多个视频中的出现信息,该出现信息表示人脸特征所属的视频,上述多个视频中均出现有指定人物的人脸特征。
人脸特征聚类模块202,用于对提取的人脸特征进行聚类,得到多个聚类集合。
分布信息生成模块203,用于针对每个聚类集合,基于该聚类集合中每个人脸特征的出现信息,生成该聚类集合的人脸特征分布信息,该人脸特征分布信息表示该聚类集合中人脸特征所属的视频。
目标聚类集合选取模块204,用于从上述多个聚类集合中,选择出人脸特征分布信息与指定人物在上述多个视频中的人物分布信息最接近的聚类集合,作为目标聚类集合,该指定人物的人物分布信息表示上述多个视频中出现有该指定人物的视频,且与上述多个视频中的其他人物的人物分布信息不同。
人脸图片收集模块205,用于收集该目标聚类集合中的各人脸特征所属的视频帧图片,作为该指定人物的人脸图片。
本发明实施例提供的如图3所示的人脸图片收集装置,针对一些难以在网上收集到所需要的人脸图片的指定人物,可以收集该指定人物的视频帧图片,解决由于难以收集到指定人物的所需要的人脸图片而导致的难以对指定人物进行识别的问题,提高了人物识别的召回率。
本发明的一个实施例中,目标聚类集合选取模块204,具体用于从所述多个聚类集合中,选择出人脸特征分布信息的视频数量最多的聚类集合,作为目标聚类集合。
本发明的一个实施例中,人脸特征提取模块201,如图4所示,包括:
视频分解子模块2011,用于将上述多个视频中的每个视频分解为连续多个视频帧图片。
人脸置信度检测子模块2012,用于针对分解得到的多个视频帧图片中的每个视频帧图片,对该视频帧图片进行人脸置信度检测,得到该视频帧图片的人脸置信度,该人脸置信度表示该视频帧图片中具有人脸区域的程度。
人脸特征提取子模块2013,用于当该人脸置信度大于预设置信度阈值时,提取该视频帧图片的人脸特征。
本发明的一个实施例中,人脸特征聚类模块202,具体用于按照预设聚类数对提取的人脸特征进行聚类,得到该预设聚类数个聚类集合,其中,该预设聚类数不小于上述多个视频中出现的已知人物数量。
本发明的一个实施例中,人脸图片收集模块205,具体用于如果选择得到的目标聚类集合为多个,从多个目标聚类集合中选择具有人脸特征的数量最多的聚类集合,作为待收集聚类集合;以及收集该待收集聚类集合中的各人脸特征所属的视频帧图片,作为该指定人物的人脸图片。
本发明实施例还提供了一种电子设备,如图5所示,包括处理器301、通信接口302、存储器303和通信总线304,其中,处理器301,通信接口302,存储器303通过通信总线304完成相互间的通信,
存储器303,用于存放计算机程序;
处理器301,用于执行存储器303上所存放的程序时,实现上述实施例中任一人脸图片收集方法的步骤。
上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述电子设备与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,RAM),也可以包括非易失性存储器(Non-Volatile Memory,NVM),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital SignalProcessing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述实施例中任一人脸图片收集方法的步骤。
在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一人脸图片收集方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、电子设备和计算机可读存储介质实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。
Claims (11)
1.一种人脸图片收集方法,其特征在于,包括:
从多个视频中提取人脸特征,并记录提取的每个人脸特征在所述多个视频中的出现信息,所述出现信息表示人脸特征所属的视频,所述多个视频中均出现有指定人物的人脸特征;
对提取的人脸特征进行聚类,得到多个聚类集合;
针对每个聚类集合,基于该聚类集合中每个人脸特征的出现信息,生成该聚类集合的人脸特征分布信息,所述人脸特征分布信息表示该聚类集合中人脸特征所属的视频;
从所述多个聚类集合中,选择出人脸特征分布信息与指定人物在所述多个视频中的人物分布信息最接近的聚类集合,作为目标聚类集合,所述指定人物的人物分布信息表示所述多个视频中出现有所述指定人物的视频,且与所述多个视频中的其他人物的人物分布信息不同;
收集所述目标聚类集合中的各人脸特征所属的视频帧图片,作为所述指定人物的人脸图片。
2.根据权利要求1所述的方法,其特征在于,所述从所述多个聚类集合中,选择出人脸特征分布信息与指定人物在所述多个视频中的人物分布信息最接近的聚类集合,作为目标聚类集合,包括:
从所述多个聚类集合中,选择出人脸特征分布信息的视频数量最多的聚类集合,作为目标聚类集合。
3.根据权利要求1所述的方法,其特征在于,所述从多个视频中提取人脸特征,包括:
将所述多个视频中的每个视频分解为连续多个视频帧图片;
针对分解得到的多个视频帧图片中的每个视频帧图片,对该视频帧图片进行人脸置信度检测,得到该视频帧图片的人脸置信度,所述人脸置信度表示该视频帧图片中具有人脸区域的程度;
当所述人脸置信度大于预设置信度阈值时,提取该视频帧图片的人脸特征。
4.根据权利要求1所述的方法,其特征在于,所述对提取的人脸特征进行聚类,得到多个聚类集合,包括:
按照预设聚类数对提取的人脸特征进行聚类,得到所述预设聚类数个聚类集合,其中,所述预设聚类数不小于所述多个视频中出现的已知人物数量。
5.根据权利要求1所述的方法,其特征在于,所述收集所述目标聚类集合中的各人脸特征所属的视频帧图片,作为所述指定人物的人脸图片,包括:
如果选择得到的目标聚类集合为多个,从多个目标聚类集合中选择具有人脸特征的数量最多的聚类集合,作为待收集聚类集合;
收集所述待收集聚类集合中的各人脸特征所属的视频帧图片,作为所述指定人物的人脸图片。
6.一种人脸图片收集装置,其特征在于,包括:
人脸特征提取模块,用于从多个视频中提取人脸特征,并记录提取的每个人脸特征在所述多个视频中的出现信息,所述出现信息表示人脸特征所属的视频,所述多个视频中均出现有指定人物的人脸特征;
人脸特征聚类模块,用于对提取的人脸特征进行聚类,得到多个聚类集合;
分布信息生成模块,用于针对每个聚类集合,基于该聚类集合中每个人脸特征的出现信息,生成该聚类集合的人脸特征分布信息,所述人脸特征分布信息表示该聚类集合中人脸特征所属的视频;
目标聚类集合选取模块,用于从所述多个聚类集合中,选择出人脸特征分布信息与指定人物在所述多个视频中的人物分布信息最接近的聚类集合,作为目标聚类集合,所述指定人物的人物分布信息表示所述多个视频中出现有所述指定人物的视频,且与所述多个视频中的其他人物的人物分布信息不同;
人脸图片收集模块,用于收集所述目标聚类集合中的各人脸特征所属的视频帧图片,作为所述指定人物的人脸图片。
7.根据权利要求6所述的装置,其特征在于,所述目标聚类集合选取模块,具体用于从所述多个聚类集合中,选择出人脸特征分布信息的视频数量最多的聚类集合,作为目标聚类集合。
8.根据权利要求6所述的装置,其特征在于,所述人脸特征提取模块,包括:
视频分解子模块,用于将所述多个视频中的每个视频分解为连续多个视频帧图片;
人脸置信度检测子模块,用于针对分解得到的多个视频帧图片中的每个视频帧图片,对该视频帧图片进行人脸置信度检测,得到该视频帧图片的人脸置信度,所述人脸置信度表示该视频帧图片中具有人脸区域的程度;
人脸特征提取子模块,用于当所述人脸置信度大于预设置信度阈值时,提取该视频帧图片的人脸特征。
9.根据权利要求6所述的装置,其特征在于,所述人脸特征聚类模块,具体用于按照预设聚类数对提取的人脸特征进行聚类,得到所述预设聚类数个聚类集合,其中,所述预设聚类数不小于所述多个视频中出现的已知人物数量。
10.根据权利要求6所述的装置,其特征在于,所述人脸图片收集模块,具体用于如果选择得到的目标聚类集合为多个,从多个目标聚类集合中选择具有人脸特征的数量最多的聚类集合,作为待收集聚类集合;以及收集所述待收集聚类集合中的各人脸特征所属的视频帧图片,作为所述指定人物的人脸图片。
11.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放计算机程序;
处理器,用于执行存储器上所存放的程序时,实现权利要求1-5任一所述的方法步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910684871.2A CN110427862B (zh) | 2019-07-26 | 2019-07-26 | 一种人脸图片收集方法、装置及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910684871.2A CN110427862B (zh) | 2019-07-26 | 2019-07-26 | 一种人脸图片收集方法、装置及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110427862A CN110427862A (zh) | 2019-11-08 |
CN110427862B true CN110427862B (zh) | 2021-08-27 |
Family
ID=68410949
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910684871.2A Active CN110427862B (zh) | 2019-07-26 | 2019-07-26 | 一种人脸图片收集方法、装置及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110427862B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112132030B (zh) * | 2020-09-23 | 2024-05-28 | 湖南快乐阳光互动娱乐传媒有限公司 | 视频处理方法及装置、存储介质及电子设备 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8705810B2 (en) * | 2007-12-28 | 2014-04-22 | Intel Corporation | Detecting and indexing characters of videos by NCuts and page ranking |
CN105631408A (zh) * | 2015-12-21 | 2016-06-01 | 小米科技有限责任公司 | 基于视频的面孔相册处理方法和装置 |
CN107644213A (zh) * | 2017-09-26 | 2018-01-30 | 司马大大(北京)智能系统有限公司 | 视频人物提取方法及装置 |
CN108154171A (zh) * | 2017-12-20 | 2018-06-12 | 北京奇艺世纪科技有限公司 | 一种人物识别方法、装置及电子设备 |
CN109684913A (zh) * | 2018-11-09 | 2019-04-26 | 长沙小钴科技有限公司 | 一种基于社区发现聚类的视频人脸标注方法和系统 |
CN110046586A (zh) * | 2019-04-19 | 2019-07-23 | 腾讯科技(深圳)有限公司 | 一种数据处理方法、设备及存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190065833A1 (en) * | 2017-08-30 | 2019-02-28 | Qualcomm Incorporated | Detecting false positives in face recognition |
-
2019
- 2019-07-26 CN CN201910684871.2A patent/CN110427862B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8705810B2 (en) * | 2007-12-28 | 2014-04-22 | Intel Corporation | Detecting and indexing characters of videos by NCuts and page ranking |
CN105631408A (zh) * | 2015-12-21 | 2016-06-01 | 小米科技有限责任公司 | 基于视频的面孔相册处理方法和装置 |
CN107644213A (zh) * | 2017-09-26 | 2018-01-30 | 司马大大(北京)智能系统有限公司 | 视频人物提取方法及装置 |
CN108154171A (zh) * | 2017-12-20 | 2018-06-12 | 北京奇艺世纪科技有限公司 | 一种人物识别方法、装置及电子设备 |
CN109684913A (zh) * | 2018-11-09 | 2019-04-26 | 长沙小钴科技有限公司 | 一种基于社区发现聚类的视频人脸标注方法和系统 |
CN110046586A (zh) * | 2019-04-19 | 2019-07-23 | 腾讯科技(深圳)有限公司 | 一种数据处理方法、设备及存储介质 |
Non-Patent Citations (2)
Title |
---|
Cluster Analysis of Facial Video Data in Video Surveillance Systems Using Deep Learning;Anastasiia D. Sokolova et al.;《Springer Proceedings in Mathematics & Statistics》;20181231;第113–120页 * |
影视视频结构解析及自动编目技术研究;高广宇;《中国博士学位论文全文数据库 信息科技辑》;20131215(第12期);第I138-44页 * |
Also Published As
Publication number | Publication date |
---|---|
CN110427862A (zh) | 2019-11-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10529381B2 (en) | Method, system and computer program product for interactively identifying same individuals or objects present in video recordings | |
EP3477506B1 (en) | Video detection method, server and storage medium | |
CA3111097C (en) | Bounding box doubling as redaction boundary | |
TWI742300B (zh) | 針對一感興趣的人與一使用者介接以促進影像搜尋之方法及系統 | |
US10990827B2 (en) | Imported video analysis device and method | |
CN110909205A (zh) | 一种视频封面确定方法、装置、电子设备及可读存储介质 | |
CN111738120B (zh) | 人物识别方法、装置、电子设备及存储介质 | |
JP2022518459A (ja) | 情報処理方法および装置、記憶媒体 | |
Jou et al. | Structured exploration of who, what, when, and where in heterogeneous multimedia news sources | |
CN111563105A (zh) | 归寝管理方法及装置、电子设备及存储介质 | |
CN110287361B (zh) | 一种人物图片筛选方法及装置 | |
CN110427862B (zh) | 一种人脸图片收集方法、装置及电子设备 | |
US20200073877A1 (en) | Video cookies | |
CN111128233A (zh) | 录音检测方法、装置、电子设备及存储介质 | |
CN112529939A (zh) | 一种目标轨迹匹配方法、装置、机器可读介质及设备 | |
CN112884866A (zh) | 一种黑白视频的上色方法、装置、设备及存储介质 | |
CN113472834A (zh) | 一种对象推送方法及设备 | |
CN110019951B (zh) | 一种生成视频缩略图的方法及设备 | |
Miyanishi et al. | Egocentric video search via physical interactions | |
Yang et al. | Lecture video browsing using multimodal information resources | |
Deotale et al. | Optimized hybrid RNN model for human activity recognition in untrimmed video | |
CN110163043B (zh) | 面部检测方法、装置、存储介质及电子装置 | |
CN113269125A (zh) | 一种人脸识别方法、装置、设备及存储介质 | |
CN108153863B (zh) | 一种视频信息的表示方法及装置 | |
CN111339829A (zh) | 用户身份鉴定方法、装置、计算机设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |