CN105243098B - 人脸图像的聚类方法及装置 - Google Patents

人脸图像的聚类方法及装置 Download PDF

Info

Publication number
CN105243098B
CN105243098B CN201510590287.2A CN201510590287A CN105243098B CN 105243098 B CN105243098 B CN 105243098B CN 201510590287 A CN201510590287 A CN 201510590287A CN 105243098 B CN105243098 B CN 105243098B
Authority
CN
China
Prior art keywords
photograph album
face photograph
facial image
priority
face
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510590287.2A
Other languages
English (en)
Other versions
CN105243098A (zh
Inventor
陈志军
张波
张涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiaomi Inc
Original Assignee
Xiaomi Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiaomi Inc filed Critical Xiaomi Inc
Priority to CN201510590287.2A priority Critical patent/CN105243098B/zh
Publication of CN105243098A publication Critical patent/CN105243098A/zh
Application granted granted Critical
Publication of CN105243098B publication Critical patent/CN105243098B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • G06F16/438Presentation of query results
    • G06F16/4387Presentation of query results by the use of playlists
    • G06F16/4393Multimedia presentations, e.g. slide shows, multimedia albums
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Library & Information Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • Human Computer Interaction (AREA)
  • Processing Or Creating Images (AREA)

Abstract

本公开是关于一种人脸图像的聚类方法及装置,属于图像处理技术领域。该方法包括:获取至少一张待处理人脸图像和至少一个人脸相册;根据各人脸相册的优先级,从至少一个人脸相册中,获取至少一个目标人脸相册,人脸相册的优先级根据人脸相册的属性信息确定;对至少一张待处理人脸图像及至少一个目标人脸相册进行聚类。本公开根据由人脸相册的属性信息所确定的优先级,从至少一个人脸相册中,获取至少一个目标人脸相册,从而在确保聚类结果准确的前提下,对至少一张待处理人脸图像及至少一个目标人脸相册进行聚类,大大地减少了计算量,节省了计算成本。

Description

人脸图像的聚类方法及装置
技术领域
本公开涉及图像处理技术领域,尤其涉及一种人脸图像的聚类方法及装置。
背景技术
随着图像处理技术的发展,智能手机、数码相机、平板电脑等具有拍照功能的终端逐渐走入用户的生活中。为了减少图像所占用存储空间,当检测到剩余存储空间小于一定数值时,终端会自动地将包含人脸的图像上传至服务器,服务器通过对上传的人脸图像与存储的多个人脸相册进行聚类,将上传的人脸图像存储到相应的人脸相册中。
相关技术在对人脸图像进行聚类时,主要采用如下方式:
第一步,提取每张待处理人脸图像的人脸特征值。
第二步,提取多个人脸相册所包含的每张人脸图像的人脸特征值。
第三步,根据提取的人脸特征值,计算每张待处理人脸图像与每个人脸相册中包含的每张人脸图像之间的相似度,根据计算结果及相似度度量方式,确定每张待处理人脸图像与每个人脸相册的相似度。
第四步,获取预先设置的相似度阈值,如果任一张待处理人脸图像与任一个人脸相册之间的相似度大于相似度阈值,确定该张待处理人脸图像属于该人脸相册,并将该张待处理人脸图像存储到该人脸相册中。
第五步,重复执行上述第三步和第四步,直至确定剩余的待处理人脸图像不属于任一人脸相册。
发明内容
本公开提供一种人脸图像的聚类方法及装置。
根据本公开实施例的第一方面,提供一种人脸图像的聚类方法,所述方法包括:
获取至少一张待处理人脸图像和至少一个人脸相册;
根据各人脸相册的优先级,从所述至少一个人脸相册中,获取至少一个目标人脸相册,人脸相册的优先级根据人脸相册的属性信息确定;
对所述至少一张待处理人脸图像及所述至少一个目标人脸相册进行聚类。
可选地,所述根据各人脸相册的优先级,从所述至少一个人脸相册中,获取至少一个目标人脸相册,包括:
获取预先设置的人脸相册的优先级阈值;
将所述至少一个人脸相册中的优先级高于或等于所述优先级阈值的人脸相册获取为目标人脸相册。
可选地,所述方法还包括:
从所述至少一个人脸相册中的优先级低于所述优先级阈值的人脸相册中,获取第一预设数量的人脸相册;
将所述第一预设数量的人脸相册获取为目标人脸相册。
可选地,所述方法还包括:
在下一次获取待处理人脸图像时,从所述至少一个人脸相册中的非目标人脸相册中,获取第二预设数量的人脸相册;
将所述优先级高于或等于所述优先级阈值的人脸相册及所述第二预设数量的人脸相册获取为下一次聚类时的目标人脸相册。
可选地,所述对所述至少一张待处理人脸图像及所述至少一个目标人脸相册进行聚类,包括:
提取所述至少一张待处理人脸图像的人脸特征值;
提取各目标人脸相册中的人脸图像的人脸特征值;
根据提取的人脸特征值,确定所述至少一张待处理人脸图像与各目标人脸相册之间的距离;
在所述至少一张待处理人脸图像中的预设人脸图像与所述至少一个目标人脸相册中的预设人脸相册之间的距离小于预设距离阈值时,将所述预设人脸图像与所述预设人脸相册合并。
可选地,所述方法还包括:
根据人脸相册的相册名称,计算人脸相册与终端用户的亲疏关系;
根据所述亲疏关系,对应设置人脸相册的优先级。
可选地,所述方法还包括:
根据人脸相册被点击的频率,计算人脸相册的被关注度;
根据所述被关注度,对应设置人脸相册的优先级。
可选地,所述方法还包括:
根据人脸相册中的人脸图像数量,计算人脸相册的重要性;
根据所述重要性,对应设置人脸相册的优先级。
根据本公开实施例的第二方面,提供一种人脸图像的聚类装置,所述装置包括:
第一获取模块,用于获取至少一张待处理人脸图像和至少一个人脸相册;
第二获取模块,用于根据各人脸相册的优先级,从所述至少一个人脸相册中,获取至少一个目标人脸相册,人脸相册的优先级根据人脸相册的属性信息确定;
聚类模块,用于对所述至少一张待处理人脸图像及所述至少一个目标人脸相册进行聚类。
可选地,所述第二获取模块,用于获取预先设置的人脸相册的优先级阈值;将所述至少一个人脸相册中的优先级高于或等于所述优先级阈值的人脸相册获取为目标人脸相册。
可选地,所述装置还包括:
第三获取模块,用于从所述至少一个人脸相册中的优先级低于所述优先级阈值的人脸相册中,获取第一预设数量的人脸相册;
第四获取模块,用于将所述第一预设数量的人脸相册获取为目标人脸相册。
可选地,所述装置还包括:
第五获取模块,用于在下一次获取待处理人脸图像时,从所述至少一个人脸相册中的非目标人脸相册中,获取第二预设数量的人脸相册;
第六获取模块,用于将所述优先级高于或等于所述优先级阈值的人脸相册及所述第二预设数量的人脸相册获取为下一次聚类时的目标人脸相册。
可选地,所述聚类模块,用于提取所述至少一张待处理人脸图像的人脸特征值;提取各目标人脸相册中的人脸图像的人脸特征值;根据提取的人脸特征值,确定所述至少一张待处理人脸图像与各目标人脸相册之间的距离;在所述至少一张待处理人脸图像中的预设人脸图像与所述至少一个目标人脸相册中的预设人脸相册之间的距离小于预设距离阈值时,将所述预设人脸图像与所述预设人脸相册合并。
可选地,所述装置还包括:
第一计算模块,用于根据人脸相册的相册名称,计算人脸相册与终端用户的亲疏关系;
第一设置模块,用于根据所述亲疏关系,对应设置人脸相册的优先级。
可选地,所述装置还包括:
第二计算模块,用于根据人脸相册被点击的频率,计算人脸相册的被关注度;
第二设置模块,用于根据所述被关注度,对应设置人脸相册的优先级。
可选地,所述装置还包括:
第三计算模块,用于根据人脸相册中的人脸图像数量,计算人脸相册的重要性;
第三设置模块,用于根据所述重要性,对应设置人脸相册的优先级。
根据本公开实施例的第三方面,提供一种人脸图像的聚类装置,所述装置包括:
处理器;
用于存储处理器可执行的指令的存储器;
其中,所述处理器被配置为:
获取至少一张待处理人脸图像和至少一个人脸相册;
根据各人脸相册的优先级,从所述至少一个人脸相册中,获取至少一个目标人脸相册,人脸相册的优先级根据人脸相册的属性信息确定;
对所述至少一张待处理人脸图像及所述至少一个目标人脸相册进行聚类。本公开的实施例提供的技术方案可以包括以下有益效果:
根据由人脸相册的属性信息所确定的优先级,从至少一个人脸相册中,获取至少一个目标人脸相册,从而在确保聚类结果准确的前提下,对至少一张待处理人脸图像及至少一个目标人脸相册进行聚类,大大地减少了计算量,节省了计算成本。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
图1是根据一示例性实施例示出的一种人脸图像的聚类方法的流程图。
图2是根据一示例性实施例示出的一种人脸图像的聚类方法的流程图。
图3是根据一示例性实施例示出的一种人脸图像的聚类装置的结构示意图。
图4是根据一示例性实施例示出的一种人脸图像的聚类装置的框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
图1是根据一示例性实施例示出的一种人脸图像的聚类方法的流程图。如图1所示,人脸图像的聚类方法可用于服务器和智能终端中,包括以下步骤。
在步骤S101中,获取至少一张待处理人脸图像和至少一个人脸相册。
在步骤S102中,根据各人脸相册的优先级,从至少一个人脸相册中,获取至少一个目标人脸相册,人脸相册的优先级根据人脸相册的属性信息确定。
在步骤S103中,对至少一张待处理人脸图像及至少一个目标人脸相册进行聚类。
本公开实施例提供的方法,根据由人脸相册的属性信息所确定的优先级,从至少一个人脸相册中,获取至少一个目标人脸相册,从而在确保聚类结果准确的前提下,对至少一张待处理人脸图像及至少一个目标人脸相册进行聚类,大大地减少了计算量,节省了计算成本。
在本公开的另一个实施例中,根据各人脸相册的优先级,从至少一个人脸相册中,获取至少一个目标人脸相册,包括:
获取预先设置的人脸相册的优先级阈值;
将至少一个人脸相册中的优先级高于或等于优先级阈值的人脸相册获取为目标人脸相册。
在本公开的另一个实施例中,该方法还包括:
从至少一个人脸相册中的优先级低于优先级阈值的人脸相册中,获取第一预设数量的人脸相册;
将第一预设数量的人脸相册获取为目标人脸相册。
在本公开的另一个实施例中,该方法还包括:
在下一次获取待处理人脸图像时,从至少一个人脸相册中的非目标人脸相册中,获取第二预设数量的人脸相册;
将优先级高于或等于优先级阈值的人脸相册及第二预设数量的人脸相册获取为下一次聚类时的目标人脸相册。
在本公开的另一个实施例中,对至少一张待处理人脸图像及至少一个目标人脸相册进行聚类,包括:
提取至少一张待处理人脸图像的人脸特征值;
提取各目标人脸相册中的人脸图像的人脸特征值;
根据提取的人脸特征值,确定至少一张待处理人脸图像与各目标人脸相册之间的距离;
在至少一张待处理人脸图像中的预设人脸图像与至少一个目标人脸相册中的预设人脸相册之间的距离小于预设距离阈值时,将预设人脸图像与预设人脸相册合并。
在本公开的另一个实施例中,该方法还包括:
根据人脸相册的相册名称,计算人脸相册与终端用户的亲疏关系;
根据亲疏关系,对应设置人脸相册的优先级。
在本公开的另一个实施例中,该方法还包括:
根据人脸相册被点击的频率,计算人脸相册的被关注度;
根据被关注度,对应设置人脸相册的优先级。
在本公开的另一个实施例中,该方法还包括:
根据人脸相册中的人脸图像数量,计算人脸相册的重要性;
根据重要性,对应设置人脸相册的优先级。
上述所有可选技术方案,可以采用任意结合形成本公开的可选实施例,在此不再一一赘述。
图2是根据一示例性实施例示出的一种人脸图像的聚类方法的流程图。如图2所示,人脸图像的聚类方法可以用于服务器和智能终端中,以应用于服务器为例,本实施例的人脸图像的聚类方法例如可以包括以下步骤。
在步骤S201中,服务器根据人脸相册的属性信息为人脸相册设置优先级。
在本实施例中,服务器上存储着终端用户的多个人脸相册,每个人脸相册中至少包含一张人脸图像,且每个脸相册中包含的人脸图像对应于同一用户。
在一实施例中,人脸相册的属性信息例如可以包括相册名称、被点击的频率、人脸图像的数量等等。
根据本公开一实施方式,根据人脸相册的属性信息,服务器为人脸相册设置优先级时,例如可采用如下几种方式中的至少其中一种方式。
第一种方式:服务器根据人脸相册的相册名称,计算人脸相册与终端用户的亲疏关系,进而根据计算出的亲疏关系,对应设置人脸相册的优先级。
一般情况下,人脸相册的相册名称可以反应出人脸相册与终端用户的亲疏关系。例如,用户为人脸相册设置的名称越亲昵,反应出人脸相册与终端用户的关系越亲密。例如用户为人脸相册设置的名称越生疏,或者用户并没有为人脸相册设置名称,均可以反应出相应人脸相册与终端用户的关系越疏远。因此,根据人脸相册的相册名称,服务器可计算出人脸相册与终端用户的亲疏关系,而根据人脸相册与终端用户的亲疏关系不同,服务器可以为人脸相册设置相应的优先级。示例的,可以将人脸相册的优先级由高到低的顺序依次设置为高级、中级、低级等,还可以为第一级、第二级、第三级等等,本公开对此不作限定。
例如,人脸相册A的相册名称为“小宝宝”、人脸相册B的相册名称为“小学同学张三”、人脸相册C的相册名称为“路人李四”,由人脸相册的相册名称可知,人脸相册与终端用户的亲疏关系由亲密到疏远依次为:人脸相册A、人脸相册B及人脸相册C。根据人脸相册与终端用户的亲疏关系,服务器为人脸相册A设置的优先级为高级,为人脸相册B设置的优先级为中级,为人脸相册C设置的优先级为低级。
第二种方式:服务器根据人脸相册被点击的频率,计算人脸相册的被关注度,进而根据计算出的被关注度,对应设置人脸相册的优先级。
通常人脸相册的被点击频率,可以反应人脸相册的被关注度。如,用户对人脸相册的点击频率越高,说明用户对人脸相册的关注度越高;用户对人脸相册的点击频率越低,说明用户对人脸相册的关注度越低。因此,根据人脸相册的被点击频率,服务器可计算出人脸相册的被关注度,而根据人脸相册的被关注度不同,服务器可以为人脸相册设置相应的优先级。
例如,人脸相册C的被点击频率为每天一次,人脸相册D的被点击频率为一个月一次,人脸相册E的被点击频率为五天一次。由人脸相册的被点击频率可知,人脸相册的被关注度由高到低依次为:人脸相册C、人脸相册E及人脸相册D。根据人脸相册的被关注度,服务器为人脸相册C设置的优先级为高级,为人脸相册E设置的优先级为中级,为人脸相册D设置的优先级为低级。
但本公开不以此为限,除了根据人脸相册的被关注度,将人脸相册设置的优先级为高级、中级、低级之外,还可以根据设定的阈值,将人脸相册的优先级设置为第一级、第二级、第三级、第四级等。
例如,可以将每周被点击五次及五次以上的人脸相册的优先级设置为第一级;将每周被点击一次到四次的人脸相册的优先级设置为第二级;将每两周被点击一次的人脸相册的优先级设置为第三级;将每月被点击一次的人脸相册的优先级设置为第四级等。在本实施例中,根据人脸相册的被关注度,服务器为人脸相册C设置的优先级为第一级,为人脸相册E设置的优先级为第二级,为人脸相册D设置的优先级为第四级。
第三种方式:服务器根据人脸相册中的人脸图像数量,计算人脸相册的重要性,进而根据计算出的重要性,对应设置人脸相册的优先级。
通常人脸相册中的人脸图像数量,可以反应人脸相册对终端用户的重要性。例如,人脸相册中的人脸图像数量越多,人脸相册对终端用户越重要;人脸相册中的人脸图像数量越少,人脸相册对终端用户越不重要。因此,根据人脸相册中的人脸图像数量,服务器可计算出人脸相册的重要性,而人脸相册的重要性不同,服务器为人脸相册设置的优先级也是不同的。
例如,人脸相册F中包含20张人脸图像,人脸相册G中包含45张人脸图像,人脸相册H中包含61张人脸图像,人脸相册I中包含3张人脸图像,由人脸相册中包含的人脸图像数量可知,人脸相册的重要性由高到低依次为:人脸相册H、人脸相册G、人脸相册F及人脸相册I。根据人脸相册的重要性,服务器可以为人脸相册H设置的优先级为第一级,为人脸相册G设置的优先级为第二级,为人脸相册F设置的优先级为第三级,为人脸相册I设置的优先级为第四级。
当然,服务器除了根据人脸相册的相册名称、人脸相册的被点击的频率、人脸相册的人脸图像的数量中的任一项,为人脸相册设置优先级外,还可以将人脸相册的相册名称、人脸相册的被点击的频率、人脸相册的人脸图像的数量中至少两项作为设置项,为人脸相册设置优先级。具体设置时,可为人脸相册的相册名称、人脸相册的被点击的频率、人脸相册的人脸图像的数量这三个设置项设置不同的权重值,并根据每个设置项的权重值,计算人脸相册与终端用户的亲密度分值,进而根据人脸相册与终端用户的亲密度分值,为人脸相册设置优先级。
需要说明的是,服务器在为人脸相册设置优先级时,可为每个人脸相册设置一个优先级,还可为多个人脸相册设置相同的优先级。
在步骤S202中,服务器获取至少一张待处理人脸图像和至少一个人脸相册。
为了避免人脸图像过多地占据终端的存储空间,降低终端的运行速度,终端检测到剩余存储空间小于一定数值时,终端会自动地将至少一个人脸图像上传至服务器,服务器接收到人脸图像后,将接收到的人脸图像作为获取到的待处理的人脸图像。为了有针对性将获取到的至少一个人脸图像进行存储,服务器还将获取终端用户的至少一个人脸相册,进而通过下述步骤203至步骤204服务器将至少一个待处理人脸图像存储到相应的人脸相册中。
在步骤S203中,服务器根据各人脸相册的优先级,从至少一个人脸相册中,获取至少一个目标人脸相册。
服务器根据各人脸相册的优先级,从至少一个人脸相册中,获取至少一个目标人脸相册时,可先获取预先设置的优先级阈值,进而将至少一个人脸相册中的优先级高于或等于优先级阈值的人脸相册获取为目标人脸相册。
例如,服务器获取到6个人脸相册,其中,人脸相册A的优先级为第一级,人脸相册B的优先级为第四级,人脸相册C的优先级为第六级,人脸相册D的优先级为第二级,人脸相册E的优先级为第五级,人脸相册F的优先级为第三级。设定优先级阈值为第三级,则可将人脸相册A、人脸相册D、人脸相册F作为目标人脸相册。
在一实施例中为了进一步地提高计算精度,本实施例提供的方法在将至少一个人脸相册中的优先级高于或等于优先级阈值的人脸相册获取为目标人脸相册之后,还将从至少一个人脸相册中的优先级低于优先级阈值的人脸相册中,获取第一预设数量的人脸相册,并将第一预设数量的人脸相册也作为目标人脸相册,此时目标人脸相册应包含优先级高于或等于优先级阈值的人脸相册以及第一预设数量的人脸相册。示例地,第一预设数量可以为1个、10个、20个等,本实施例不对第一预设数量作具体的限定。在本公开的另一个实施例中,服务器在获取第一预设数量的人脸相册时,可从优先级低于优先级阈值的人脸相册中,随机选取第一预设数量的人脸相册,还可以按照优先级由高到低的顺序,从优先级低于优先级阈值的人脸相册中,选取第一预设数量的人脸相册。
在另一实施例中,服务器根据各人脸相册的优先级,从至少一个人脸相册中,获取至少一个目标人脸相册时,还可以将至少一个人脸相册中的优先级排序比较靠前的至少一个人脸相册获取为目标人脸相册。
例如,服务器获取到6个人脸相册,其中,人脸相册A的优先级为第一级,人脸相册B的优先级为第四级,人脸相册C的优先级为第六级,人脸相册D的优先级为第二级,人脸相册E的优先级为第五级,人脸相册F的优先级为第三级。则可将优先级排序靠前的人脸相册A、人脸相册D、人脸相册F作为目标人脸相册。
在一实施例中为了进一步地提高计算精度,本实施例提供的方法在将至少一个人脸相册中的优先级排序比较靠前的至少一个人脸相册获取为目标人脸相册之后,还可以从至少一个人脸相册中的余下的人脸相册中,获取第一预设数量的人脸相册,并将第一预设数量的人脸相册也作为目标人脸相册,此时目标人脸相册应包含优先级较高的多个人脸相册和部分优先级较低的人脸相册。示例地,第一预设数量可以为优先级较高的人脸相册的数量的二分之一、四分之一等(其中,当第一预设数量不为整数时,小数部分可以按四舍五入等方式处理)。示例的,第一预设数量还可以为预设值,例如可以为1个、2个、5个等,本实施例不对第一预设数量作具体的限定。
在步骤204中,服务器对至少一张待处理人脸图像及至少一个目标人脸相册进行聚类。
在一实施例中,服务器对至少一张待处理人脸图像及至少一个目标人脸相册的进行聚类,时,可以包括下述步骤(1)~(4):
(1)、服务器提取至少一张待处理人脸图像的人脸特征值,该人脸特征值具有多个维度,可区别出任意两张人脸图像是否为同一人。
(2)、服务器提取各目标人脸相册中的人脸图像的人脸特征值。
本步骤与步骤(1)可以同时执行,也可以先后执行,本实施例不对该过程的具体执行顺序进行限定。
(3)、服务器根据提取的人脸特征值,确定至少一张待处理人脸图像与各目标人脸相册之间的距离。
对于任一张待处理人脸图像与任一个目标人脸相册,服务器在确定二者之间的距离时,可根据提取的人脸特征值,计算该张待处理人脸图像与该目标人脸相册中每张人脸图像之间距离,进而根据预先设定的距离度量方式及该张待处理人脸图像目标人脸相册中每张人脸图像之间距离,确定出该张待处理人脸图像与该目标人脸相册之间的距离。
其中,服务器根据提取的人脸特征值,计算任意两张人脸图像A和B之间的距离时,可采用如下公式:
其中,人脸图像A的人脸特征值A=(a1,a2,…,an),人脸图像B的人脸特征值B=(b1,b2,…,bn)。如果A=(0.2,0.5,0.3,0),B=(0,0.2,0.5,0.3),则人脸图像A与人脸图像B之间的距离为:
其中,距离度量方式至少包括最小距离、最大距离、平均距离等。如果距离度量方式为最小距离,则从该张待处理人脸图像与该目标人脸相册中每张人脸图像之间距离中,获取最小的距离,并将获取到的最小距离作为该待处理人脸图像与该目标人脸相册之间的距离;如果距离度量方式为最大距离,则从该张待处理人脸图像与该目标人脸相册中每张人脸图像之间距离中,获取最大的距离,并将获取到的最大距离作为该待处理人脸图像与该目标人脸相册之间的距离;如果距离度量方式为平均距离,则需要先计算该张待处理人脸图像与该目标人脸相册中每张人脸图像之间的距离平均值,进而将计算得到的平均值作为该待处理人脸图像与该目标人脸相册之间的距离。
(4)、在至少一张待处理人脸图像中的预设人脸图像与至少一个目标人脸相册中的预设人脸相册之间的距离小于预设距离阈值时,服务器将预设人脸图像与预设人脸相册合并。
其中,预设距离阈值可以为0.5、0.6、0.8等等。如果任一张待处理人脸图像与任一个目标人脸相册之间的距离小于预设距离阈值,说明该待处理图像属于该目标人脸相册,此时服务器会将该张待处理人脸图像与该目标人脸相册进行合并,也即是将该张待处理人脸图像存储到该目标人脸相册中。
上述以根据提取的人脸特征值,计算待处理人脸图像与目标人脸相册之间的距离,对待处理人脸图像与目标人脸相册进行聚类为例进行说明,在实际应用中,还可以采用其他方式对至少一个待处理人脸图像与至少一个目标人脸相册进行聚类,本实施例不再一一说明。
需要说明的是,当采用上述聚类方法对至少一个待处理人脸图像与至少一个目标人脸相册进行聚类时,如果至少一个待处理人脸图像与任一目标人脸相册之间的距离均大于或等于预设距离阈值,则确定该张待处理人脸图像不属于任一目标人脸相册,此时服务器会为该张待处理人脸图像创建一个新相册,并将该待处理人脸相册存储该新相册中。
示例的,通过上述步骤201~204可以实现对待处理人脸图像的一次聚类。当在下一次获取到待处理人脸图像时,服务器将从至少一个人脸相册中的非目标人脸相册中,获取第二预设数量的人脸相册。进而将优先级高于或等于优先级阈值的人脸相册及第二预设数量的人脸相册获取为第二次聚类时的目标人脸相册。在另一实施例中,将优先级排序靠前的至少一个人脸相册及第二预设数量的人脸相册获取为第二次聚类时的目标人脸相册。
在一实施例中,服务器在获取第二预设数量的人脸相册时,可从优先级低于优先级阈值的人脸相册中,随机选取第二预设数量的人脸相册,还可以按照优先级由高到低的顺序,从优先级低于优先级阈值的人脸相册中,选取第二预设数量的人脸相册。
在另一实施例中,服务器在获取第二预设数量的人脸相册时,可从非目标人脸相册中,随机选取第二预设数量的人脸相册,还可以按照优先级由高到低的顺序,从余下的人脸相册中,选取优先级较靠前的第二预设数量的人脸相册。第三次、第四次及之后的聚类中,目标人脸相册的选取与第一次、第二次聚类时的选取方法类似,在此不再赘述。
在第二次聚类完成之后,如果服务器又获取到待处理人脸图像,服务器将从第二次聚类后剩余的非目标人脸相册中选取第三预设数量的人脸相册,并将优先级高于或等于优先级阈值的人脸相册及第三预设数量的人脸相册作为第三次聚类时的目标人脸相册。在后续聚类时,服务器将一直从剩余的未参与过聚类且低于优先级阈值的人脸相册中选取一定数量的人脸相册,并将选取的人脸相册与优先级高于或等于优先级阈值的人脸相册作为目标人脸相册。经过多次聚类,如果优先级低于预设阈值的人脸相册全部参与过聚类,则服务器将重复执行上述获取第一预设数量的人脸相册的过程。其中,第二预设数量可以为5个、8个等等,第三预设数量可以为7个、11个等等,该第二预设数量与第一预设数量及第三预设在数量上并没有明确的关系。
通过上述轮流调度过程,使得优先级低于优先级阈值的每个人脸相册均能与待处理人脸图像进行聚类,大大地提高了计算的准确性。
对于上述过程,为了便于理解,下面将以一个具体的例子进行说明。
例如,高于或等于优先级阈值的人脸相册有15个,低于优先级阈值的人脸相册有100个,第一聚类时从100个人脸相册中随机选取30个人脸相册,此时参与第一次聚类的人脸相册为高于或等于优先级阈值的10个人脸相册及随机选取的30个人脸相册,也即是,第一聚类时目标人脸相册为45个;第二次聚类时从剩余的70个人脸相册中随机选取40个人脸相册,此时参与第二次聚类的人脸相册为高于或等于优先级阈值的10个人脸相册及随机选取的40个人脸相册,也即是,第二次聚类时目标人脸相册为55个;第三次聚类时将剩余的30个人脸相册及高于或等于优先级阈值的15个人脸相册作为目标人脸相册;第四次聚类时重新从100个人脸相册中选取一定数量的人脸相册,并将选取的人脸相册与高于或等于优先级阈值的15个人脸相册作为目标人脸相册。
本公开实施例提供的方法,根据由人脸相册的属性信息所确定的优先级,从至少一个人脸相册中,获取至少一个目标人脸相册,从而在确保聚类结果准确的前提下,对至少一张待处理人脸图像及至少一个目标人脸相册进行聚类,大大地减少了计算量,节省了计算成本。
图3是根据一示例性实施例示出的一种人脸图像的聚类装置示意图。参照图3,该装置包括:第一获取模块301、第二获取模块302及聚类模块303。
该第一获取模块301被配置为获取至少一张待处理人脸图像和至少一个人脸相册;
该第二获取模块302被配置为根据各人脸相册的优先级,从至少一个人脸相册中,获取至少一个目标人脸相册,人脸相册的优先级根据人脸相册的属性信息确定;
该聚类模块303被配置为对至少一张待处理人脸图像及至少一个目标人脸相册进行聚类。
在本公开的另一个实施例中,该第二获取模块302被配置为获取预先设置的人脸相册的优先级阈值;将至少一个人脸相册中的优先级高于或等于优先级阈值的人脸相册获取为目标人脸相册。
在本公开的另一个实施例中,该第二获取模块302还可以被配置为将至少一个人脸相册中的优先级排序比较靠前的至少一个人脸相册获取为目标人脸相册。例如,将优先级排序在第一位、第二位的人脸相册获取为目标人脸相册。在本公开的另一个实施例中,该装置还包括:第三获取模块和第四获取模块。
该第三获取模块被配置为从至少一个人脸相册中的优先级低于优先级阈值的人脸相册中,获取第一预设数量的人脸相册;
该第四获取模块被配置为将第一预设数量的人脸相册获取为目标人脸相册。
在本公开的另一个实施例中,该装置还包括:第五获取模块和第六获取模块。
该第五获取模块被配置为在下一次获取待处理人脸图像时,从至少一个人脸相册中的非目标人脸相册中,获取第二预设数量的人脸相册;
该第六获取模块被配置为将优先级高于或等于优先级阈值的人脸相册及第二预设数量的人脸相册获取为下一次聚类时的目标人脸相册。
在本公开的另一个实施例中,该聚类模块303被配置为提取至少一张待处理人脸图像的人脸特征值;提取各目标人脸相册中的人脸图像的人脸特征值;根据提取的人脸特征值,确定至少一张待处理人脸图像与各目标人脸相册之间的距离;在至少一张待处理人脸图像中的预设人脸图像与至少一个目标人脸相册中的预设人脸相册之间的距离小于预设距离阈值时,将预设人脸图像与预设人脸相册合并。
在本公开的另一个实施例中,该装置还包括:第一计算模块和第一设置模块。
该第一计算模块被配置为根据人脸相册的相册名称,计算人脸相册与终端用户的亲疏关系;
该第一设置模块被配置为根据亲疏关系,对应设置人脸相册的优先级。
在本公开的另一个实施例中,该装置还包括:第二计算模块和第二设置模块。
该第二计算模块被配置为根据人脸相册被点击的频率,计算人脸相册的被关注度;
该第二设置模块被配置为根据被关注度,对应设置人脸相册的优先级。
在本公开的另一个实施例中,该装置还包括:第三计算模块和第三设置模块。
该第三计算模块被配置为根据人脸相册中的人脸图像数量,计算人脸相册的重要性;
该第三设置模块被配置为根据重要性,对应设置人脸相册的优先级。
本公开实施例提供的装置,根据由人脸相册的属性信息所确定的优先级,从至少一个人脸相册中,获取至少一个目标人脸相册,从而在确保聚类结果准确的前提下,对至少一张待处理人脸图像及至少一个目标人脸相册进行聚类,大大地减少了计算量,节省了计算成本。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图4是根据一示例性实施例示出的一种用于人脸图像的聚类的装置400的框图。例如,装置400可以被提供为一服务器。参照图4,装置400包括处理组件422,其进一步包括一个或多个处理器,以及由存储器432所代表的存储器资源,用于存储可由处理组件422的执行的指令,例如应用程序。存储器432中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件422被配置为执行指令,以执行上述方法人脸图像的聚类方法。
获取至少一张待处理人脸图像和至少一个人脸相册。
根据各人脸相册的优先级,从至少一个人脸相册中,获取至少一个目标人脸相册,人脸相册的优先级根据人脸相册的属性信息确定。
对至少一张待处理人脸图像及至少一个目标人脸相册进行聚类。
在本公开的另一个实施例中,根据各人脸相册的优先级,从至少一个人脸相册中,获取至少一个目标人脸相册,包括:
获取预先设置的人脸相册的优先级阈值;
将至少一个人脸相册中的优先级高于或等于优先级阈值的人脸相册获取为目标人脸相册。
在本公开的另一个实施例中,该方法还包括:
从至少一个人脸相册中的优先级低于优先级阈值的人脸相册中,获取第一预设数量的人脸相册;
将第一预设数量的人脸相册获取为目标人脸相册。
在本公开的另一个实施例中,该方法还包括:
在下一次获取待处理人脸图像时,从至少一个人脸相册中的非目标人脸相册中,获取第二预设数量的人脸相册;
将优先级高于或等于优先级阈值的人脸相册及第二预设数量的人脸相册获取为下一次聚类时的目标人脸相册。
在本公开的另一个实施例中,对至少一张待处理人脸图像及至少一个目标人脸相册进行聚类,包括:
提取至少一张待处理人脸图像的人脸特征值;
提取各目标人脸相册中的人脸图像的人脸特征值;
根据提取的人脸特征值,确定至少一张待处理人脸图像与各目标人脸相册之间的距离;
在至少一张待处理人脸图像中的预设人脸图像与至少一个目标人脸相册中的预设人脸相册之间的距离小于预设距离阈值时,将预设人脸图像与预设人脸相册合并。
在本公开的另一个实施例中,该方法还包括:
根据人脸相册的相册名称,计算人脸相册与终端用户的亲疏关系;
根据亲疏关系,对应设置人脸相册的优先级。
在本公开的另一个实施例中,该方法还包括:
根据人脸相册被点击的频率,计算人脸相册的被关注度;
根据被关注度,对应设置人脸相册的优先级。
在本公开的另一个实施例中,该方法还包括:
根据人脸相册中的人脸图像数量,计算人脸相册的重要性;
根据重要性,对应设置人脸相册的优先级。
装置400还可以包括一个电源组件426被配置为执行装置400的电源管理,一个有线或无线网络接口450被配置为将装置400连接到网络,和一个输入输出(I/O)接口458。装置400可以操作基于存储在存储器432的操作系统,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM或类似。
本公开实施例提供的装置,根据由人脸相册的属性信息所确定的优先级,从至少一个人脸相册中,获取至少一个目标人脸相册,从而在确保聚类结果准确的前提下,对至少一张待处理人脸图像及至少一个目标人脸相册进行聚类,大大地减少了计算量,节省了计算成本。
本领域技术人员在考虑说明书及实践这里公开的公开后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims (13)

1.一种人脸图像的聚类方法,其特征在于,所述方法包括:
获取至少一张待处理人脸图像和至少一个人脸相册;
获取预先设置的人脸相册的优先级阈值,人脸相册的优先级根据人脸相册的属性信息确定,所述属性信息包括人脸相册的相册名称、人脸相册被点击的频率和人脸相册中的人脸图像数量中的至少一种;
将所述至少一个人脸相册中的优先级高于或等于所述优先级阈值的人脸相册获取为目标人脸相册;
从所述至少一个人脸相册中的优先级低于所述优先级阈值的人脸相册中,获取第一预设数量的人脸相册;
将所述第一预设数量的人脸相册获取为目标人脸相册;
对所述至少一张待处理人脸图像及至少一个目标人脸相册进行聚类。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在下一次获取待处理人脸图像时,从所述至少一个人脸相册中的非目标人脸相册中,获取第二预设数量的人脸相册;
将所述优先级高于或等于所述优先级阈值的人脸相册及所述第二预设数量的人脸相册获取为下一次聚类时的目标人脸相册。
3.根据权利要求1所述的方法,其特征在于,所述对所述至少一张待处理人脸图像及至少一个目标人脸相册进行聚类,包括:
提取所述至少一张待处理人脸图像的人脸特征值;
提取各目标人脸相册中的人脸图像的人脸特征值;
根据提取的人脸特征值,确定所述至少一张待处理人脸图像与各目标人脸相册之间的距离;
在所述至少一张待处理人脸图像中的预设人脸图像与所述至少一个目标人脸相册中的预设人脸相册之间的距离小于预设距离阈值时,将所述预设人脸图像与所述预设人脸相册合并。
4.根据权利要求1至3任一项所述的方法,其特征在于,所述方法还包括:
根据人脸相册的相册名称,计算人脸相册与终端用户的亲疏关系;
根据所述亲疏关系,对应设置人脸相册的优先级。
5.根据权利要求1至3任一项所述的方法,其特征在于,所述方法还包括:
根据人脸相册被点击的频率,计算人脸相册的被关注度;
根据所述被关注度,对应设置人脸相册的优先级。
6.根据权利要求1至3任一项所述的方法,其特征在于,所述方法还包括:
根据人脸相册中的人脸图像数量,计算人脸相册的重要性;
根据所述重要性,对应设置人脸相册的优先级。
7.一种人脸图像的聚类装置,其特征在于,所述装置包括:
第一获取模块,用于获取至少一张待处理人脸图像和至少一个人脸相册;
第二获取模块,用于获取预先设置的人脸相册的优先级阈值,人脸相册的优先级根据人脸相册的属性信息确定,所述属性信息包括人脸相册的相册名称、人脸相册被点击的频率和人脸相册中的人脸图像数量中的至少一种;将所述至少一个人脸相册中的优先级高于或等于所述优先级阈值的人脸相册获取为目标人脸相册;
第三获取模块,用于从所述至少一个人脸相册中的优先级低于所述优先级阈值的人脸相册中,获取第一预设数量的人脸相册;
第四获取模块,用于将所述第一预设数量的人脸相册获取为目标人脸相册;
聚类模块,用于对所述至少一张待处理人脸图像及至少一个目标人脸相册进行聚类。
8.根据权利要求7所述的装置,其特征在于,所述装置还包括:
第五获取模块,用于在下一次获取待处理人脸图像时,从所述至少一个人脸相册中的非目标人脸相册中,获取第二预设数量的人脸相册;
第六获取模块,用于将所述优先级高于或等于所述优先级阈值的人脸相册及所述第二预设数量的人脸相册获取为下一次聚类时的目标人脸相册。
9.根据权利要求7所述的装置,其特征在于,所述聚类模块,用于提取所述至少一张待处理人脸图像的人脸特征值;提取各目标人脸相册中的人脸图像的人脸特征值;根据提取的人脸特征值,确定所述至少一张待处理人脸图像与各目标人脸相册之间的距离;在所述至少一张待处理人脸图像中的预设人脸图像与所述至少一个目标人脸相册中的预设人脸相册之间的距离小于预设距离阈值时,将所述预设人脸图像与所述预设人脸相册合并。
10.根据权利要求7至9任一项所述的装置,其特征在于,所述装置还包括:
第一计算模块,用于根据人脸相册的相册名称,计算人脸相册与终端用户的亲疏关系;
第一设置模块,用于根据所述亲疏关系,对应设置人脸相册的优先级。
11.根据权利要求7至9任一项所述的装置,其特征在于,所述装置还包括:
第二计算模块,用于根据人脸相册被点击的频率,计算人脸相册的被关注度;
第二设置模块,用于根据所述被关注度,对应设置人脸相册的优先级。
12.根据权利要求7至9任一项所述的装置,其特征在于,所述装置还包括:
第三计算模块,用于根据人脸相册中的人脸图像数量,计算人脸相册的重要性;
第三设置模块,用于根据所述重要性,对应设置人脸相册的优先级。
13.一种人脸图像的聚类装置,其特征在于,包括:
处理器;
用于存储处理器可执行的指令的存储器;
其中,所述处理器被配置为:
获取至少一张待处理人脸图像和至少一个人脸相册;
获取预先设置的人脸相册的优先级阈值,人脸相册的优先级根据人脸相册的属性信息确定,所述属性信息包括人脸相册的相册名称、人脸相册被点击的频率和人脸相册中的人脸图像数量中的至少一种;
将所述至少一个人脸相册中的优先级高于或等于所述优先级阈值的人脸相册获取为目标人脸相册;
从所述至少一个人脸相册中的优先级低于所述优先级阈值的人脸相册中,获取第一预设数量的人脸相册;
将所述第一预设数量的人脸相册获取为目标人脸相册;
对所述至少一张待处理人脸图像及至少一个目标人脸相册进行聚类。
CN201510590287.2A 2015-09-16 2015-09-16 人脸图像的聚类方法及装置 Active CN105243098B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510590287.2A CN105243098B (zh) 2015-09-16 2015-09-16 人脸图像的聚类方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510590287.2A CN105243098B (zh) 2015-09-16 2015-09-16 人脸图像的聚类方法及装置

Publications (2)

Publication Number Publication Date
CN105243098A CN105243098A (zh) 2016-01-13
CN105243098B true CN105243098B (zh) 2018-10-26

Family

ID=55040747

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510590287.2A Active CN105243098B (zh) 2015-09-16 2015-09-16 人脸图像的聚类方法及装置

Country Status (1)

Country Link
CN (1) CN105243098B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109389019B (zh) * 2017-08-14 2021-11-05 杭州海康威视数字技术股份有限公司 人脸图像选择方法、装置及计算机设备
CN107729391B (zh) * 2017-09-15 2020-01-10 Oppo广东移动通信有限公司 图像处理方法、装置、计算机可读存储介质和移动终端
CN107944414B (zh) * 2017-12-05 2021-03-02 Oppo广东移动通信有限公司 图像处理方法、装置、电子设备及计算机可读存储介质
CN111061912A (zh) * 2018-10-16 2020-04-24 华为技术有限公司 一种处理视频文件的方法及电子设备
CN111625670A (zh) * 2019-02-27 2020-09-04 华为技术有限公司 一种图片分组方法及设备
CN109886239B (zh) * 2019-02-28 2021-05-04 北京旷视科技有限公司 人像聚类方法、装置及系统
CN109948734B (zh) * 2019-04-02 2022-03-29 北京旷视科技有限公司 图像聚类方法、装置及电子设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103207870A (zh) * 2012-01-17 2013-07-17 华为技术有限公司 一种照片分类管理方法、服务器、装置及系统
CN103399896A (zh) * 2013-07-19 2013-11-20 广州华多网络科技有限公司 识别用户间关联关系的方法及系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103207870A (zh) * 2012-01-17 2013-07-17 华为技术有限公司 一种照片分类管理方法、服务器、装置及系统
CN103399896A (zh) * 2013-07-19 2013-11-20 广州华多网络科技有限公司 识别用户间关联关系的方法及系统

Also Published As

Publication number Publication date
CN105243098A (zh) 2016-01-13

Similar Documents

Publication Publication Date Title
CN105243098B (zh) 人脸图像的聚类方法及装置
US20230319130A1 (en) Systems and methods for selecting media items
US10169900B2 (en) Picture processing method and apparatus
US11227006B2 (en) Content-aware filter options for media object collections
US20160358042A1 (en) Electronic Travel Album Generating Method and Computing Device
CN109523237B (zh) 基于用户偏好的众包任务推送方法及相关装置
WO2016155493A1 (zh) 数据处理方法及装置
CN110162270A (zh) 基于分布式存储系统的数据存储方法、存储节点及介质
KR20140009074A (ko) 동기화 애플리케이션들에 대한 스마트 스케줄링 동기화 방법 및 모바일 디바이스
CN110955838A (zh) 房源推荐处理方法、装置、终端及计算机可读存储介质
CN109033165B (zh) 一种数据展示方法、计算机可读存储介质及终端设备
CN110348519A (zh) 金融产品欺诈团伙的识别方法和装置
CN106874416A (zh) 排行榜单生成方法及排行榜单生成装置
CN115017400B (zh) 一种应用app推荐方法及电子设备
CN104679879A (zh) 一种照片智能存储方法和装置
US20130066872A1 (en) Method and Apparatus for Organizing Images
CN110910237A (zh) 区块链中的数据处理方法、装置及智能终端、存储介质
CN109658187A (zh) 推荐云服务商的方法、装置、存储介质及电子设备
CN109688217B (zh) 一种消息推送方法、装置及电子设备
CN106326436A (zh) 显示界面元素的方法及装置
CN104424345A (zh) 基于时间的相片分类方法及其系统
US20180329926A1 (en) Image-based semantic accommodation search
US20150029353A1 (en) Automatic Tuning of Images Based on Metadata
CN106535102A (zh) 一种移动终端定位方法及移动终端
US20140108405A1 (en) User-specified image grouping systems and methods

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant