CN112364688B - 人脸聚类方法、装置、计算机设备和可读存储介质 - Google Patents
人脸聚类方法、装置、计算机设备和可读存储介质 Download PDFInfo
- Publication number
- CN112364688B CN112364688B CN202011055014.5A CN202011055014A CN112364688B CN 112364688 B CN112364688 B CN 112364688B CN 202011055014 A CN202011055014 A CN 202011055014A CN 112364688 B CN112364688 B CN 112364688B
- Authority
- CN
- China
- Prior art keywords
- similarity
- picture
- center
- face
- preset
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Oral & Maxillofacial Surgery (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明提供了一种人脸聚类方法、装置、计算机设备和可读存储介质。预设陌生人中心和已识别人中心,其中,已识别人中心包括属于同一人脸的主图片和辅助图片,人脸聚类方法包括:计算目标人脸图片与主图片的相似度,得到第一相似度,计算目标人脸图片与辅助图片的相似度,得到第二相似度;分别比较第一相似度与预设第一阈值、第一相似度与第二相似度的大小关系;以及若第一相似度达到预设第一阈值,且第一相似度与第二相似度的大小关系满足第一预设规则,则将目标人脸图片的类别识别为陌生人中心。通过本发明,无需收集训练数据和针对不同训练场景训练不同模型,且能够对聚类错误进行识别。
Description
技术领域
本发明涉及人脸识别技术领域,尤其涉及一种人脸聚类方法、装置、计算机设备和可读存储介质。
背景技术
人脸聚类是指通过聚类的方式将同一个人的人脸图片划分到同一个分组中,在实现人脸聚类时,通常会提取人脸图片的特征,将人脸图片映射(embedding)为一个高维的向量,经过映射后的人脸图片在高维空间里的分布不同,因而可以使用高维空间里的距离来度量人脸图片之间的相似度,实现人脸聚类。
但是,在现有技术的一种人脸聚类方法中,使用对应场景数据训练模型进行人脸识别,不仅需要收集大量对应场景的数据,而且需要针对不同应用场景训练不同的模型。因此,如何减小数据收集成本以及模型训练成本,成为本领域亟需解决的技术问题。
发明内容
本发明的目的是提供一种人脸聚类方法、装置、计算机设备和可读存储介质,用于解决现有技术中的技术问题。
一方面,为实现上述目的,本发明提供了一种人脸聚类方法。
预设陌生人中心和已识别人中心,其中,所述已识别人中心包括属于同一人脸的主图片和辅助图片,该人脸聚类方法包括:计算目标人脸图片与所述主图片的相似度,得到第一相似度,计算所述目标人脸图片与所述辅助图片的相似度,得到第二相似度;分别比较第一相似度与预设第一阈值、所述第一相似度与第二相似度的大小关系;以及若所述第一相似度达到所述预设第一阈值,且所述第一相似度与所述第二相似度的大小关系满足第一预设规则,则将所述目标人脸图片的类别识别为所述陌生人中心,其中,所述第一预设规则用于表示针对所述主图片和所述辅助图片,所述目标人脸图片与所述辅助图片更相似。
进一步地,分别比较第一相似度与预设第一阈值、所述第一相似度与第二相似度的大小关系的步骤包括:当确定所述目标人脸图片的类别为所述已识别人中心时,分别比较第一相似度与预设第一阈值、所述第一相似度与第二相似度的大小关系;其中,若所述第一相似度达到所述预设第一阈值,且所述第一相似度与所述第二相似度的大小关系满足第一预设规则,则将所述目标人脸图片的类别修正为所述陌生人中心。
进一步地,所述人脸聚类方法还包括:将所述目标人脸图片的类别修正为所述陌生人中心后,将所述辅助图片从对应的所述已识别人中心中删除。
进一步地,若所述第一相似度达到所述预设第一阈值,所述人脸聚类方法还包括:判断所述第一相似度是否达到预设第二阈值;若所述第一相似度达到所述预设第二阈值,将所述目标人脸图片加入对应的所述已识别人中心。
进一步地,若所述第一相似度与所述第二相似度的大小关系满足所述第一预设规则,所述人脸聚类方法还包括:计算所述主图片与所述辅助图片的相似度,得到第三相似度;若所述第一相似度与所述第三相似度满足第二预设规则,将所述辅助图片从对应的所述已识别人中心中删除,和/或,将所述目标人脸图片加入对应的所述已识别人中心,其中,所述第二预设规则用于表示针对所述辅助图片和所述目标人脸图片,所述主图片与所述目标人脸图片更相似。
进一步地,所述相似度为相似性距离,预设多个已识别人中心,不同的已识别人中心包括不同人脸的图片,每个所述已识别人中心包括一张所述主图片和多张所述辅助图片,所述人脸聚类方法还包括:针对每个已识别人中心,根据所述第一相似度和所述第二相似度,计算所述目标人脸图片与所述已识别人中心的距离,得到所述已识别人中心对应的识别距离;若各个所述识别距离均大于或等于预设第三阈值,则确定所述目标人脸图片的类别为所述陌生人中心;若存在所述识别距离小于所述预设第三阈值,则确定所述目标人脸图片的类别为最小所述识别距离所对应的已识别人中心。
进一步地,针对每个所述已识别人中心,采用以下公式计算所述识别距离:D=(m1*d1)+(m2*d12min),其中,D为所述识别距离,d1为所述第一相似度,d12min为所述第一相似度和各个所述第二相似度中的最小值,m1和m2分别为权重。
另一方面,为实现上述目的,本发明提供了一种人脸聚类装置。
预设陌生人中心和已识别人中心,其中,所述已识别人中心包括属于同一人脸的主图片和辅助图片,所述人脸聚类装置包括:计算模块,用于计算目标人脸图片与所述主图片的相似度,得到第一相似度,计算所述目标人脸图片与所述辅助图片的相似度,得到第二相似度;比较模块,用于分别比较第一相似度与预设第一阈值、所述第一相似度与第二相似度的大小关系;以及识别模块,用于若所述第一相似度达到所述预设第一阈值,且所述第一相似度与所述第二相似度的大小关系满足第一预设规则,则将所述目标人脸图片的类别识别为所述陌生人中心,其中,所述第一预设规则用于表示针对所述主图片和所述辅助图片,所述目标人脸图片与所述辅助图片更相似。
为实现上述目的,本发明还提供一种计算机设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,该处理器执行计算机程序时实现上述方法的步骤。
为实现上述目的,本发明还提供计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述方法的步骤。
本发明提供的人脸聚类方法、装置、计算机设备和可读存储介质,比较目标人脸图片与已识别人中心的主图片的第一相似度、目标人脸图片与已识别人中心的辅助图片的第二相似度以及预设第一阈值的大小关系,当第一相似度达到预设第一阈值,且第一相似度与第二相似度的大小关系满足第一预设规则,其中,该第一预设规则用于表示针对主图片和辅助图片,目标人脸图片与辅助图片更相似,也即目标人脸图片与主图片的相似性低,同时,相对主图片而言,目标人脸图片与辅助图片的相似性更高,则此时将目标人脸图片的类别识别为陌生人中心,实现了一种通过相似度进行人脸识别的方法,相对使用对应场景数据训练模型进行人脸识别的方法,无需收集大量对应场景的数据,降低了数据收集成本,此外,也无需针对不同应用场景训练不同的模型,减小了模型训练成本。
同时,在一种应用场景下,当确定目标人脸图片属于已识别人中心后,可采用本发明提供的人脸聚类方法对目标人脸图片是够真正属于已识别人中心进行判定和修正,也就是说,通过本发明,还能够判定和修正目标人脸图片的误识别,减小将属于陌生人中心的目标人脸图片判定为已识别人中心的概率,避免错误信息的传递。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1为本发明实施例一提供的人脸聚类方法的流程图;
图2为本发明实施例二提供的人脸聚类装置的框图;
图3为本发明实施例三提供的计算机设备的硬件结构图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在一种人脸识别方法中,需要收集大量对应场景的数据,使用对应场景数据训练模型进行人脸识别,并且需要针对不同应用场景训练不同的模型,收集数据的成本较大,训练的成本也较大。
在一种人脸聚类方法中,已知人员分类信息,利用已分类的人脸图片构建特征空间,对未知图片进行聚类。其中,如果将陌生人的人脸误识别为已知人员,会影响相应已知人员的特征空间,进而导致错误信息传递,出现后续聚类错误。
本发明提供的人脸聚类方法、装置、计算机设备和可读存储介质,可解决上述的技术问题。
在该人脸聚类方法中,预设陌生人中心和已识别人中心,其中,已识别人中心包括属于同一人脸的主图片和辅助图片,主图片相对辅助图片,更能够体现该人脸的特征,在对目标人脸图片进行聚类识别时,定义目标人脸图片与主图片的相似度为第一相似度,定义目标人脸图片与辅助图片的相似度为第二相似度。
在进行人脸聚类时,可分别比较第一相似度与预设第一阈值、第一相似度与第二相似度的大小关系,若第一相似度达到预设第一阈值,也即目标人脸图片与主图片的差异大于预设的差异,且第一相似度与第二相似度的大小关系满足第一预设规则,也即目标人脸图片与主图片的差异大于目标人脸图片与辅助图片的差异,此时,将目标人脸图片的类别识别为陌生人中心。从中可以看出,该人脸聚类方法通过相似度进行人脸识别的方法,相对使用对应场景数据训练模型进行人脸识别的方法,无需收集大量对应场景的数据,降低了数据收集成本,此外,也无需针对不同应用场景训练不同的模型,减小了模型训练成本。
当采用现有技术中的聚类方法判定目标人脸图片的类别为已识别人中心时,可分别比较第一相似度与预设第一阈值、第一相似度与第二相似度的大小关系,若第一相似度达到预设第一阈值,也即目标人脸图片与主图片的差异大于预设的差异,且第一相似度与第二相似度的大小关系满足第一预设规则,也即目标人脸图片与主图片的差异大于目标人脸图片与辅助图片的差异,此时,将目标人脸图片的类别识别为陌生人中心,也即将目标人脸图片的类别由已识别人中心修正为陌生人中心。从中可以看出,该人脸聚类方法能够对将陌生人的人脸误识别为已知人员的情况进行识别,避免错误信息传递。
关于本发明提供的人脸聚类方法、装置、计算机设备和可读存储介质的具体实施例,将在下文中详细描述。
需要说明的是,在本发明中,可采用相似性距离等第一类参数作为相似度,其中,相似性距离包括欧氏距离、汉明距离以及夹角余弦等。针对该第一类参数,计算两图片的第一类参数的值越大,两图片越不相似,第一类参数的值越小,两图片越相似。因此,当相似度为上述第一类参数时,相应地,第一相似度达到预设第一阈值包括第一相似度大于或等于预设第一阈值;第一相似度与第二相似度的大小关系满足第一预设规则包括第一相似度大于或等于第二相似度;第一相似度达到预设第二阈值包括第一相似度小于预设第二阈值,第一相似度与第三相似度满足第二预设规则包括第一相似度小于第三相似度。
或者,也可采用第二类参数作为相似度。针对该第二类参数,计算两图片的第二类参数的值越大,两图片越相似,第二类参数的值越小,两图片越不相似。因此,当相似度为上述第二类参数时,相应地,第一相似度达到预设第一阈值包括第一相似度小于或等于预设第一阈值;第一相似度与第二相似度的大小关系满足第一预设规则包括第一相似度小于或等于第二相似度;第一相似度达到预设第二阈值包括第一相似度大于预设第二阈值,第一相似度与第三相似度满足第二预设规则包括第一相似度大于第三相似度。
上述第一类参数和第二类参数均可作为本发明中的相似度,均在本发明的保护范围之内,在下述实施例中,仅以相似性距离作为相似度进行举例说明,以其他参数作为相似度的情况,该处不再赘述。
实施例一
本发明实施例一提供了一种人脸聚类方法,在该方法中,预设陌生人中心和已识别人中心,作为聚类中心,对目标人脸图片进行聚类,其中,已识别人中心包括属于同一人脸的主图片和辅助图片,主图片相对辅助图片,更能够体现该人脸的特征,通常主图片为人脸的正脸照片,较为精确,例如证件照等,辅助图片可以为在各个场景下拍摄的人脸。在一种场景下,通过该方法确定目标人脸图片是否属于陌生人中心。在另一种应用场景下,当确定目标人脸图片属于已识别人中心后,通过该方法,对该结果进行判定,并在判定结果错误时进行修正,避免错误信息传递。具体地,图1为本发明实施例一提供的人脸聚类方法的流程图,如图1所示,该实施例提供的人脸聚类方法包括如下的步骤S101至步骤S103。
步骤S101:计算目标人脸图片与主图片的相似度,得到第一相似度,计算目标人脸图片与辅助图片的相似度,得到第二相似度。
其中,相似度为相似性距离时,第一相似度也即第一相似性距离,第二相似度也即第二相似性距离。
具体而言,目标人脸图片为待聚类识别的人脸图片,识别目的在于确定目标人脸图片属于陌生人中心还是属于已识别人中心,当预设多个已识别人中心时,确定具体属于哪一个已识别人中心。两张人脸图片的相似性距离可以表征两张图人脸图片的相似程度,也即两张人脸图片属于同一人脸的可能性,相似距离越大,表征两张人脸图片的相似程度越小,两张人脸图片属于同一人脸的可能性越小。可选地,在计算相似性距离时,可以先提取图片的特征,例如通过卷积神经网络提取图片的深度特征,然后根据深度特征计算欧氏距离、马氏距离等可以度量相似程度的距离,得到两张图片的相似性距离。
在该实施例中,将目标人脸图片与主图片的相似性距离定义为第一相似性距离,表征目标人脸图片与主图片的相似程度。将目标人脸图片与辅助图片的相似性距离定义为第二相似性距离,表征目标人脸图片与辅助图片的相似程度。
步骤S102:当确定目标人脸图片的类别为已识别人中心时,分别比较第一相似度与预设第一阈值、第一相似度与第二相似度的大小关系。
具体而言,当采用任意的方法确定目标人脸图片的类别为已识别人中心时,在该步骤中,对第一相似性距离、预设第一阈值和第二相似性距离的大小关系进行比较,以对目标人脸图片属于已识别人中心这一结果进行正误判定。
步骤S103:若第一相似度达到预设第一阈值,且第一相似度与第二相似度的大小关系满足第一预设规则,则将目标人脸图片的类别识别为陌生人中心。
其中,第一预设规则用于表示针对主图片和所述辅助图片,目标人脸图片与辅助图片更相似。
也即,若第一相似性距离大于或等于预设第一阈值,且第一相似性距离大于或等于第二相似性距离,则将目标人脸图片的类别确定为陌生人中心。
具体而言,目标人脸图片与已识别人中心中图片的相似性距离越大,该目标人脸图片属于该已识别人中心的可能性越小,当目标人脸图片属于陌生人中心但被误判时,通常情况下的原因在于,目标人脸图片与已识别人中心中辅助图片的相似性距离较小。为了减小对这部分目标人脸图片误识别的概率,设定预设第一阈值,当目标人脸图片与已识别人中心的主图片的第一相似性距离大于该预设第一阈值,表明该目标人脸图片属于该已识别人中心的可能性较低。同时,如果该第一相似性距离小于目标人脸图片与该已识别人中心的辅助图片之间的第二相似性距离,也就是说,相对主图片来说,目标人脸图片与辅助图片的相似性更高,则可确定,该目标人脸图片实际上并不属于该已识别人中心,属于误判,需要进行修正。
在该实施例提供的人脸聚类方法中,比较目标人脸图片与已识别人中心的主图片的第一相似度、目标人脸图片与已识别人中心的辅助图片的第二相似度以及预设第一阈值的大小关系,当第一相似度达到预设第一阈值,且第一相似度与第二相似度的大小关系满足第一预设规则,其中,该第一预设规则用于表示针对主图片和辅助图片,目标人脸图片与辅助图片更相似,也即目标人脸图片与主图片的相似性低,同时,相对主图片而言,目标人脸图片与辅助图片的相似性更高,则此时将目标人脸图片的类别识别为陌生人中心,实现了一种通过相似度进行人脸识别的方法,相对使用对应场景数据训练模型进行人脸识别的方法,无需收集大量对应场景的数据,降低了数据收集成本,此外,也无需针对不同应用场景训练不同的模型,减小了模型训练成本。同时,在一种应用场景下,当确定目标人脸图片属于已识别人中心后,可采用本发明提供的人脸聚类方法对目标人脸图片是够真正属于已识别人中心进行判定和修正,也就是说,通过本发明,还能够判定和修正目标人脸图片的误识别,减小将属于陌生人中心的目标人脸图片判定为已识别人中心的概率,避免错误信息的传递。
可选地,在一种实施例中,人脸聚类方法还包括:将目标人脸图片的类别修正为陌生人中心后,将辅助图片从对应的已识别人中心中删除。
具体而言,如果目标人脸图片被误判为属于某已识别人中心A,且该已识别人中心A中的辅助图片与目标人脸图片的相似性距离,比主图片与目标人脸图片的相似性距离小,说明该辅助图片与目标人脸图片的相似性较大,而主图片与目标人脸图片的相似性又较小,即可确定该辅助图片与主图片的相似性也较小,采用该实施例提供的人脸聚类方法,将该辅助图片从该已识别人中心A中删除,能够避免后续出现同样的再次误判的情况,提升聚类的准确性。
可选地,当已识别人中心A包括一张主图片和多张辅助图片时,如果存在两张或两张以上辅助图片对应的第二相似性距离均小于第一相似性距离,则可将对应最小第二相似性距离的辅助图片删除,或者,也可将第二相似性距离小于第一相似性距离的各个辅助图片分别删除,或者,也可进一步比较第二相似性距离小于第一相似性距离的各个辅助图片与主图片的相似性距离的大小关系,来确定删除哪些辅助图片。
可选地,在一种实施例中,若第一相似度达到所述预设第一阈值,人脸聚类方法还包括:判断第一相似度是否达到预设第二阈值;若第一相似度达到预设第二阈值,将目标人脸图片加入对应的已识别人中心。
具体地,若第一相似性距离小于预设第一阈值,人脸聚类方法还包括:判断第一相似性距离是否小于预设第二阈值;若第一相似性距离小于预设第二阈值,将目标人脸图片加入已识别人中心。在将目标人脸图片确定为某已识别人中心A时,预设的第一阈值作为校正阈值,用于判断是否需要该聚类结果进行校正,如果满足校正条件,则校正为陌生人中心,如果不满足校正条件,则预设第二阈值作为聚类阈值,该聚类阈值小于上述校正阈值,通过预设的第二阈值进一步来判断,是否可以将该目标人脸图片加入该已识别人中心A,以作为后续聚类新的目标人脸图片的参考条件。当第一相似性距离小于预设第一阈值,也即目标人脸图片与主图片的相似性程度较高,不满足校正条件,无需校正,此时,进一步判断第一相似性距离是否小于预设第二阈值,其中,预设第二阈值小于预设第一阈值,如果第一相似性距离小于预设第二阈值,表明目标人脸图片与主图片的相似性程度非常高,采用该实施例提供的人脸聚类方法,将该目标人脸图片加入该已识别人中心A。从而在执行识别任务的过程中,不断的将满足该条件的目标人脸图片聚集到相应的已识别人中心,增大聚类中心的特征空间,来优化人脸识别效果,提高聚类的准确性。
进一步可选地,若第一相似性距离小于预设第二阈值,进一步判断该已识别人中心中图片的数量是否大于或等于预设图片阈值,如果已识别人中心中图片的数量大于或等于预设图片阈值,则将目标人脸图片与主图片的相似性距离、与辅助图片与主图片的相似性距离进行比较,如果目标人脸图片与主图片的相似性距离大于任意辅助图片与主图片的相似性距离,则不将目标人脸图片加入已识别人中心;如果目标人脸图片与主图片的相似性距离小于任意辅助图片与主图片的相似性距离,则将目标人脸图片加入已识别人中心,同时将与主图片相似性距离最大的辅助图片从已识别人中心删除。如果已识别人中心中图片的数量小于预设图片阈值,则直接将目标人脸图片加入已识别人中心。
可选地,在一种实施例中,若第一相似度与第二相似度的大小关系满足第一预设规则,人脸聚类方法还包括:计算主图片与辅助图片的相似度,得到第三相似度;若第一相似度与第三相似度满足第二预设规则,将辅助图片从对应的已识别人中心中删除,和/或,将目标人脸图片加入对应的已识别人中心,其中,第二预设规则用于表示针对辅助图片和目标人脸图片,主图片与目标人脸图片更相似。
具体地,若第一相似性距离小于第二相似性距离,人脸聚类方法还包括:计算主图片与辅助图片的相似性距离,得到第三相似性距离;若第一相似性距离小于第三相似性距离,将辅助图片从对应已识别人中心中删除,和/或,将目标人脸图片加入对应已识别人中心。在确定目标人脸图片的类别为某已识别人中心A时,第一相似性距离小于第二相似性距离,也即目标人脸图片与主图片的相似程度大于目标人脸图片与辅助图片的相似性程度,此时,计算主图片与辅助图片的相似性距离,以判断辅助图片和目标人脸图片哪一个更接近主图片,如果目标人脸图片更接近,此时,将辅助图片从该已识别人中心A中删除,同时可将目标人脸图片加入该已识别人中心A,以实现对已识别人中心A的特征空间的校正。
可选地,当已识别人中心包括一张主图片和多张辅助图片时,如果存在第一相似性距离小于两张或两张以上辅助图片对应的第二相似性距离,则在这些辅助图片中,计算每张辅助图片与主图片的相似性距离,并与第一相似性距离进行大小比较,如果存在第一相似性距离小于两张或两张以上辅助图片与主图片的相似性距离,则将与主图片相似性距离最大的辅助图片删除。
进一步,在删除时,也可判断该已识别人中心中图片的数量是否达到预设图片阈值,如果已识别人中心中图片的数量大于或等于预设图片阈值,则将与主图片相似性距离最大的辅助图片删除,将目标人脸图片加入已识别人中心;如果已识别人中心中图片的数量小于预设图片阈值,则将目标人脸图片加入已识别人中心。
可选地,在一种实施例中,预设多个已识别人中心,不同的已识别人中心包括不同人脸的图片,已识别人中心包括一张主图片和多张辅助图片,人脸聚类方法还包括:针对每个已识别人中心,根据第一相似性距离和第二相似性距离,计算目标人脸图片与已识别人中心的距离,得到已识别人中心对应的识别距离;若各个识别距离均大于或等于预设第三阈值,则确定目标人脸图片的类别为陌生人中心。若存在所述识别距离小于所述预设第三阈值,则确定所述目标人脸图片的类别为最小所述识别距离所对应的已识别人中心。
在该实施例提供的人脸聚类方法中,首先根据第一相似性距离和第二相似性距离计算识别距离,也即确定目标人脸图片与各个已识别人中心的关系,预设第三阈值为识别阈值,如果所有的识别距离均大于或等于该第三阈值,即可确定目标人脸图片的类别为陌生人中心。如果存在某一识别距离小于预设第三阈值,则确定目标人脸图片的类别为该识别距离所对应的已识别人中心,进一步,针对该识别距离所对应的已识别人中心,通过比较第一相似性距离与预设第一阈值、第一相似性距离与第二相似性距离的大小关系,来判断是否要对该结果进行修正。如果存在两个或两个以上的识别距离小于预设第三阈值,则确定目标人脸图片的类别为最小识别距离所对应的已识别人中心,进一步,针对该最小识别距离所对应的已识别人中心,通过比较第一相似性距离与预设第一阈值、第一相似性距离与第二相似性距离的大小关系,来判断是否要对该结果进行修正。
可选地,在一种实施例中,针对每个已识别人中心,采用以下公式计算识别距离:D=(m1*d1)+(m2*d12min),其中,D为识别距离,d1为第一相似性距离,d12min为第一相似性距离和第二相似性距离中的最小值,m1和m2分别为权重,m1和m2的和为1。
可选地,在一种实施例中,人脸聚类方法包括如下的步骤:
步骤S1:构建人脸底库,其中,人脸底库包括多个图片类(对应一个已识别人中心),每个图片类对应一个人脸ID,每个图片类包括至少两张图片,该至少两张图片中包括一张主图片(证件照)和至少一张辅助图片(不同场景的抓拍照);
步骤S2:获取目标人脸图片的人脸深度特征;
步骤S3:计算目标人脸图片的人脸深度特征和人脸底库中所有人脸ID之间的欧氏距离,并且利用以下公式计算目标人脸图片与每个图片类的识别距离:
distance=(m1*目标人脸图片与一个图片类中主图片的欧氏距离)+(m2*目标人脸图片与一个图片类中所有图片的欧氏距离中的最小值);
步骤S4:如果所有识别距离均大于预设第三阈值,将该目标人脸图片判定为陌生人(对应陌生人中心);
步骤S5:如果存在小于预设第三阈值的识别距离,则获取最小识别距离对应的图片类,作为待定图片类(也即目标中心);
步骤S6:计算目标人脸图片与待定图片类中各个图片的欧式距离;
步骤S7:如果目标人脸图片与主图片的欧氏距离大于预设第一阈值,且目标人脸图片与主图片的欧氏距离大于目标人脸图片与任何辅助图片的欧氏距离,将该目标人脸图片判定为陌生人,否则,确定目标人脸图片属于待定图片类。
进一步地,在步骤S7中,若将目标人脸图片判定为陌生人,将欧氏距离小于目标人脸图片与主图片的欧氏距离的辅助图片弹出待定图片类。
在步骤S7中,若确定目标人脸图片属于待定图片类,判断该待定图片类中辅助图片的数量是否达到预设数量:
未达到时,判断目标人脸图片与主图片的欧氏距离是否小于预设第二阈值,若小于预设第二阈值,则将该目标人脸图片加入该待定图片类;
已达到时,判断待定图片类中是否存在辅助图片与主图片的欧式距离大于目标人脸图片与主图片的欧氏距离,若存在,将距离主图片距离最远的辅助图片弹出底库,将该目标人脸图片加入该待定图片类。
采用该实施例提供的人脸聚类方法,无需训练,直接在执行识别任务的过程中自动聚类,解决了普通人脸聚类需要在应用前使用对应场景数据训练模型的问题;在方法的起始仅需要底库数据,随着识别任务的进行,不断进行聚类,方法的性能不断优化提升,最终达到一个较优效果,在运行期间动态调整聚类中心,降低了对数据的需求,解决了通用模型在不同场景下的结果差异,导致模型需要重新训练的问题;包含错误聚类的处理逻辑,添加了对错误聚类的判定,能将错误聚类的数据排除聚类中心,移除相应特征空间的方法,解决当前聚类算法聚类错误导致错误信息传递,影响整个任务的生命周期的问题。
实施例二
对应于上述实施例一,本发明实施例二提供了一种人脸聚类装置,相应地技术特征细节和对应的技术效果可参考上述实施例一,在该实施例中不再赘述。图2为本发明实施例二提供的人脸聚类装置,预设陌生人中心和已识别人中心,其中,所述已识别人中心包括属于同一人脸的主图片和辅助图片,如图2所示,该装置包括:计算模块201、比较模块202和识别模块203。
其中,计算模块201,用于计算目标人脸图片与所述主图片的相似度,得到第一相似度,计算所述目标人脸图片与所述辅助图片的相似度,得到第二相似度;比较模块202,用于分别比较第一相似度与预设第一阈值、所述第一相似度与第二相似度的大小关系;以及识别模块203,用于若所述第一相似度达到所述预设第一阈值,且所述第一相似度与所述第二相似度的大小关系满足第一预设规则,则将所述目标人脸图片的类别识别为所述陌生人中心,其中,所述第一预设规则用于表示针对所述主图片和所述辅助图片,所述目标人脸图片与所述辅助图片更相似。
可选地,在一种实施例中,比较模块202具体用于当确定所述目标人脸图片的类别为所述已识别人中心时,分别比较第一相似度与预设第一阈值、所述第一相似度与第二相似度的大小关系;识别模块203具体用于若所述第一相似度达到所述预设第一阈值,且所述第一相似度与所述第二相似度的大小关系满足第一预设规则,则将所述目标人脸图片的类别修正为所述陌生人中心。
可选地,在一种实施例中,所述人脸聚类装置还包括:第一删除模块,用于在所述目标人脸图片的类别修正为所述陌生人中心后,将所述辅助图片从对应的所述已识别人中心中删除。
可选地,在一种实施例中,若所述第一相似度达到所述预设第一阈值,所述人脸聚类装置还包括:判断模块,用于判断所述第一相似度是否达到预设第二阈值;第一处理模块,用于若所述第一相似度达到所述预设第二阈值,将所述目标人脸图片加入对应的所述已识别人中心。
可选地,在一种实施例中,若所述第一相似度与所述第二相似度的大小关系满足所述第一预设规则,计算模块201还用于计算所述主图片与所述辅助图片的相似度,得到第三相似度;所述人脸聚类装置还包括:第二删除模块和第二处理模块,其中,第二删除模块用于若所述第一相似度与所述第三相似度满足第二预设规则,将所述辅助图片从对应的所述已识别人中心中删除,第二处理模块用于将所述目标人脸图片加入对应的所述已识别人中心,其中,所述第二预设规则用于表示针对所述辅助图片和所述目标人脸图片,所述主图片与所述目标人脸图片更相似。
可选地,在一种实施例中,所述相似度为相似性距离,预设多个已识别人中心,不同的已识别人中心包括不同人脸的图片,每个所述已识别人中心包括一张所述主图片和多张所述辅助图片,计算模块201还用于针对每个已识别人中心,根据所述第一相似度和所述第二相似度,计算所述目标人脸图片与所述已识别人中心的距离,得到所述已识别人中心对应的识别距离;人脸聚类装置还包括:确定模块,若各个所述识别距离均大于或等于预设第三阈值,确定模块用语确定所述目标人脸图片的类别为所述陌生人中心。
可选地,在一种实施例中,若存在所述识别距离小于所述预设第三阈值,确定模块还用于确定所述目标人脸图片的类别为最小所述识别距离所对应的已识别人中心。
可选地,在一种实施例中,计算模块201针对每个所述已识别人中心,采用以下公式计算所述识别距离:D=(m1*d1)+(m2*d12min)其中,D为所述识别距离,d1为所述第一相似度,d12min为所述第一相似度和各个所述第二相似度中的最小值,m1和m2分别为权重。
实施例三
本实施例三还提供一种计算机设备,如可以执行程序的智能手机、平板电脑、笔记本电脑、台式计算机、机架式服务器、刀片式服务器、塔式服务器或机柜式服务器(包括独立的服务器,或者多个服务器所组成的服务器集群)等。如图3所示,本实施例的计算机设备01至少包括但不限于:可通过系统总线相互通信连接的存储器012、处理器011,如图3所示。需要指出的是,图3仅示出了具有组件存储器012和处理器011的计算机设备01,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。
本实施例中,存储器012(即可读存储介质)包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,存储器012可以是计算机设备01的内部存储单元,例如该计算机设备01的硬盘或内存。在另一些实施例中,存储器012也可以是计算机设备01的外部存储设备,例如该计算机设备01上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。当然,存储器012还可以既包括计算机设备01的内部存储单元也包括其外部存储设备。本实施例中,存储器012通常用于存储安装于计算机设备01的操作系统和各类应用软件,例如实施例二的人脸聚类装置的程序代码等。此外,存储器012还可以用于暂时地存储已经输出或者将要输出的各类数据。
处理器011在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器011通常用于控制计算机设备01的总体操作。本实施例中,处理器011用于运行存储器012中存储的程序代码或者处理数据,例如人脸聚类方法等。
实施例四
本实施例四还提供一种计算机可读存储介质,如闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘、服务器、App应用商城等等,其上存储有计算机程序,程序被处理器执行时实现相应功能。本实施例的计算机可读存储介质用于存储人脸聚类装置,被处理器执行时实现实施例一的人脸聚类方法。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种人脸聚类方法,其特征在于,预设陌生人中心和已识别人中心,其中,所述已识别人中心包括属于同一人脸的主图片和辅助图片,其中,所述主图片相对所述辅助图片更能够体现人脸的特征,所述主图片为人脸的正脸照片,所述人脸聚类方法包括:
计算目标人脸图片与所述主图片的相似度,得到第一相似度,计算所述目标人脸图片与所述辅助图片的相似度,得到第二相似度;
分别比较第一相似度与预设第一阈值、所述第一相似度与第二相似度的大小关系;以及
若所述第一相似度达到所述预设第一阈值,且所述第一相似度与所述第二相似度的大小关系满足第一预设规则,则将所述目标人脸图片的类别识别为所述陌生人中心,其中,所述第一预设规则用于表示针对所述主图片和所述辅助图片,所述目标人脸图片与所述辅助图片更相似。
2.根据权利要求1所述的人脸聚类方法,其特征在于,分别比较第一相似度与预设第一阈值、所述第一相似度与第二相似度的大小关系的步骤包括:
当确定所述目标人脸图片的类别为所述已识别人中心时,分别比较第一相似度与预设第一阈值、所述第一相似度与第二相似度的大小关系;
其中,若所述第一相似度达到所述预设第一阈值,且所述第一相似度与所述第二相似度的大小关系满足第一预设规则,则将所述目标人脸图片的类别修正为所述陌生人中心。
3.根据权利要求2所述的人脸聚类方法,其特征在于,所述人脸聚类方法还包括:
将所述目标人脸图片的类别修正为所述陌生人中心后,将所述辅助图片从对应的所述已识别人中心中删除。
4.根据权利要求2所述的人脸聚类方法,其特征在于,若所述第一相似度达到所述预设第一阈值,所述人脸聚类方法还包括:
判断所述第一相似度是否达到预设第二阈值;
若所述第一相似度达到所述预设第二阈值,将所述目标人脸图片加入对应的所述已识别人中心。
5.根据权利要求2所述的人脸聚类方法,其特征在于,若所述第一相似度与所述第二相似度的大小关系满足所述第一预设规则,所述人脸聚类方法还包括:
计算所述主图片与所述辅助图片的相似度,得到第三相似度;
若所述第一相似度与所述第三相似度满足第二预设规则,将所述辅助图片从对应的所述已识别人中心中删除,和/或,将所述目标人脸图片加入对应的所述已识别人中心,其中,所述第二预设规则用于表示针对所述辅助图片和所述目标人脸图片,所述主图片与所述目标人脸图片更相似。
6.根据权利要求1或2所述的人脸聚类方法,其特征在于,所述相似度为相似性距离,预设多个已识别人中心,不同的已识别人中心包括不同人脸的图片,每个所述已识别人中心包括一张所述主图片和多张所述辅助图片,所述人脸聚类方法还包括:
针对每个已识别人中心,根据所述第一相似度和所述第二相似度,计算所述目标人脸图片与所述已识别人中心的距离,得到所述已识别人中心对应的识别距离;
若各个所述识别距离均大于或等于预设第三阈值,则确定所述目标人脸图片的类别为所述陌生人中心;
若存在所述识别距离小于所述预设第三阈值,则确定所述目标人脸图片的类别为最小所述识别距离所对应的已识别人中心。
7.根据权利要求6所述的人脸聚类方法,其特征在于,针对每个所述已识别人中心,采用以下公式计算所述识别距离:
D=(m1*d1)+(m2*d12min)
其中,D为所述识别距离,d1为所述第一相似度,d12min为所述第一相似度和各个所述第二相似度中的最小值,m1和m2分别为权重。
8.一种人脸聚类装置,其特征在于,预设陌生人中心和已识别人中心,其中,所述已识别人中心包括属于同一人脸的主图片和辅助图片,其中,所述主图片相对所述辅助图片更能够体现人脸的特征,所述主图片为人脸的正脸照片,所述人脸聚类装置包括:
计算模块,用于计算目标人脸图片与所述主图片的相似度,得到第一相似度,计算所述目标人脸图片与所述辅助图片的相似度,得到第二相似度;
比较模块,用于分别比较第一相似度与预设第一阈值、所述第一相似度与第二相似度的大小关系;以及
识别模块,用于若所述第一相似度达到所述预设第一阈值,且所述第一相似度与所述第二相似度的大小关系满足第一预设规则,则将所述目标人脸图片的类别识别为所述陌生人中心,其中,所述第一预设规则用于表示针对所述主图片和所述辅助图片,所述目标人脸图片与所述辅助图片更相似。
9.一种计算机设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于:所述计算机程序被处理器执行时实现权利要求1至7任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011055014.5A CN112364688B (zh) | 2020-09-30 | 2020-09-30 | 人脸聚类方法、装置、计算机设备和可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011055014.5A CN112364688B (zh) | 2020-09-30 | 2020-09-30 | 人脸聚类方法、装置、计算机设备和可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112364688A CN112364688A (zh) | 2021-02-12 |
CN112364688B true CN112364688B (zh) | 2022-04-08 |
Family
ID=74506465
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011055014.5A Active CN112364688B (zh) | 2020-09-30 | 2020-09-30 | 人脸聚类方法、装置、计算机设备和可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112364688B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103530652A (zh) * | 2013-10-23 | 2014-01-22 | 北京中视广信科技有限公司 | 一种基于人脸聚类的视频编目方法、检索方法及其系统 |
CN107609466A (zh) * | 2017-07-26 | 2018-01-19 | 百度在线网络技术(北京)有限公司 | 人脸聚类方法、装置、设备及存储介质 |
CN108664920A (zh) * | 2018-05-10 | 2018-10-16 | 深圳市深网视界科技有限公司 | 一种实时的大规模级联人脸聚类方法和装置 |
CN109815788A (zh) * | 2018-12-11 | 2019-05-28 | 平安科技(深圳)有限公司 | 一种图片聚类方法、装置、存储介质及终端设备 |
CN111259738A (zh) * | 2020-01-08 | 2020-06-09 | 科大讯飞股份有限公司 | 人脸识别模型构建方法、人脸识别方法及相关装置 |
CN111625670A (zh) * | 2019-02-27 | 2020-09-04 | 华为技术有限公司 | 一种图片分组方法及设备 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110458078B (zh) * | 2019-08-05 | 2022-05-06 | 高新兴科技集团股份有限公司 | 一种人脸图像数据聚类方法、系统及设备 |
-
2020
- 2020-09-30 CN CN202011055014.5A patent/CN112364688B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103530652A (zh) * | 2013-10-23 | 2014-01-22 | 北京中视广信科技有限公司 | 一种基于人脸聚类的视频编目方法、检索方法及其系统 |
CN107609466A (zh) * | 2017-07-26 | 2018-01-19 | 百度在线网络技术(北京)有限公司 | 人脸聚类方法、装置、设备及存储介质 |
CN108664920A (zh) * | 2018-05-10 | 2018-10-16 | 深圳市深网视界科技有限公司 | 一种实时的大规模级联人脸聚类方法和装置 |
CN109815788A (zh) * | 2018-12-11 | 2019-05-28 | 平安科技(深圳)有限公司 | 一种图片聚类方法、装置、存储介质及终端设备 |
CN111625670A (zh) * | 2019-02-27 | 2020-09-04 | 华为技术有限公司 | 一种图片分组方法及设备 |
CN111259738A (zh) * | 2020-01-08 | 2020-06-09 | 科大讯飞股份有限公司 | 人脸识别模型构建方法、人脸识别方法及相关装置 |
Non-Patent Citations (3)
Title |
---|
A comparison of clustering algorithms for face clustering;Bijl, Erik 等;《fse.studenttheses.ub.rug.nl》;20181231;全文 * |
基于正交元空间的多模态图像增强技术研究;梁杰;《中国优秀博硕士学位论文全文数据库(硕士)信息科技辑》;20200315;全文 * |
基于类属超图的视频人脸识别关键技术研究;谭明明;《中国优秀博硕士学位论文全文数据库(硕士)信息科技辑》;20190315;全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN112364688A (zh) | 2021-02-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108920580B (zh) | 图像匹配方法、装置、存储介质及终端 | |
CN106446816B (zh) | 人脸识别方法及装置 | |
CN111814664B (zh) | 识别图纸中标注的方法、装置、计算机设备及存储介质 | |
CN111353549B (zh) | 图像标签的核验方法及装置、电子设备、存储介质 | |
JP7040104B2 (ja) | 学習プログラム、学習方法および学習装置 | |
CN110414376B (zh) | 更新人脸识别模型的方法、人脸识别相机及服务器 | |
WO2021174789A1 (zh) | 基于特征提取的图像识别方法及图像识别装置 | |
CN110659268B (zh) | 基于聚类算法的数据填充方法、装置及计算机设备 | |
WO2019095587A1 (zh) | 人脸识别方法、应用服务器及计算机可读存储介质 | |
WO2019119635A1 (zh) | 种子用户拓展方法、电子设备及计算机可读存储介质 | |
CN112668629A (zh) | 基于图片识别的智能仓储方法、系统、设备及存储介质 | |
CN110689323A (zh) | 图片审核方法、装置、计算机设备和存储介质 | |
CN112036362A (zh) | 图像处理方法、装置、计算机设备和可读存储介质 | |
CN114662602A (zh) | 一种离群点检测方法、装置、电子设备及存储介质 | |
CN114637877A (zh) | 标注方法、电子设备及存储介质 | |
CN112396048B (zh) | 图片信息提取方法、装置、计算机设备及存储介质 | |
CN112364688B (zh) | 人脸聚类方法、装置、计算机设备和可读存储介质 | |
US20230245421A1 (en) | Face clustering method and apparatus, classification storage method, medium and electronic device | |
CN116258748A (zh) | 轨迹跟踪方法 | |
CN111708988B (zh) | 侵权视频识别方法、装置、电子设备及存储介质 | |
CN114513341A (zh) | 恶意流量检测方法、装置、终端及计算机可读存储介质 | |
KR20220169469A (ko) | 이미지 처리 방법, 장치, 에지 컴퓨팅 기기 및 컴퓨터 저장 매체 | |
CN113705537A (zh) | 用户身份认证方法及装置 | |
CN115171048B (zh) | 基于图像识别的资产分类方法、系统、终端及存储介质 | |
CN116258769B (zh) | 一种定位校验方法、装置、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |