CN112560963A - 大规模人脸图像聚类方法、装置、电子设备及介质 - Google Patents
大规模人脸图像聚类方法、装置、电子设备及介质 Download PDFInfo
- Publication number
- CN112560963A CN112560963A CN202011503304.1A CN202011503304A CN112560963A CN 112560963 A CN112560963 A CN 112560963A CN 202011503304 A CN202011503304 A CN 202011503304A CN 112560963 A CN112560963 A CN 112560963A
- Authority
- CN
- China
- Prior art keywords
- initial images
- image
- images
- initial
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 51
- 230000001815 facial effect Effects 0.000 title claims description 10
- 239000011159 matrix material Substances 0.000 claims abstract description 53
- 230000011218 segmentation Effects 0.000 claims description 8
- 238000004364 calculation method Methods 0.000 claims description 5
- 238000004422 calculation algorithm Methods 0.000 claims description 4
- 238000013527 convolutional neural network Methods 0.000 claims description 4
- 238000012549 training Methods 0.000 claims description 4
- 238000003709 image segmentation Methods 0.000 claims description 3
- 239000000126 substance Substances 0.000 claims description 3
- 238000012545 processing Methods 0.000 abstract description 6
- 238000004590 computer program Methods 0.000 description 14
- 238000010586 diagram Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 101100481876 Danio rerio pbk gene Proteins 0.000 description 1
- 101100481878 Mus musculus Pbk gene Proteins 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000010845 search algorithm Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
Abstract
本公开实施例中提供了一种大规模人脸图像聚类方法、装置、设备及介质,属于图像处理技术领域,具体包括:将多张初始图像输入人脸特征模型,得到全部初始图像对应的目标矩阵;计算全部初始图像之间的近邻关系矩阵;根据近邻关系矩阵建立全部初始图像对应的关系网;对关系网进行分割,得到多个图像簇;分别对每个图像簇内的图像进行聚类操作,将符合预设条件的初始图像形成目标图像组。通过本公开的方案,先计算全部初始图像对应的目标矩阵以及初始图像之间的近邻关系矩阵,并建立关系网,再对关系网进行分割,得到多个包含不同特定属性的图像簇,再进行聚类,将符合预设条件的初始图像形成目标图像组,提高了人脸图像聚类方法的效率和精确度。
Description
技术领域
本公开涉及图像处理技术领域,尤其涉及一种大规模人脸图像聚类方法、装置、设备及介质。
背景技术
目前,随着深度学习的发展,人脸识别相关技术也得到了很大进步,并且在实际场景中得到了广泛的应用。广泛的应用带来了海量的无标签人脸数据,对这些人脸图片根据身份进行分组就需要聚类技术。数据规模的增加会造成聚类的复杂度指数级增加,包括内存的使用、耗时、计算复杂度等,一般的聚类方法已经无法满足需求,现有的人脸聚类方法,直接通过计算人脸图像间的相似矩阵,然后根据阈值确定分组,或者每个类别根据一张图像进行分组,从而导致计算量过大或者分类存在误差。
可见,亟需一种高效且精准的大规模人脸图像聚类方法。
发明内容
有鉴于此,本公开实施例提供一种大规模人脸图像聚类方法、装置、设备及介质,至少部分解决现有技术中存在的分类效率和精度较低问题。
第一方面,本公开实施例提供了一种大规模人脸图像聚类方法,包括:
将多张初始图像输入人脸特征模型,得到全部所述初始图像对应的目标矩阵,其中,所述初始图像包括不同人员对应的人脸图像;
计算全部所述初始图像之间的近邻关系矩阵;
根据所述近邻关系矩阵和所述目标矩阵建立全部所述初始图像对应的关系网;
对所述关系网进行分割,得到多个图像簇;
分别对每个所述图像簇内的图像进行聚类操作,将符合预设条件的初始图像形成目标图像组。
根据本公开实施例的一种具体实现方式,所述将多张初始图像输入人脸特征模型,得到全部所述初始图像对应的目标矩阵的步骤之前,所述方法还包括:
利用预设数量的样本图像训练卷积神经网络得到所述人脸特征模型。
根据本公开实施例的一种具体实现方式,所述将多张初始图像输入人脸特征模型,得到全部所述初始图像对应的目标矩阵的步骤,包括:
根据所述人脸特征模型,计算全部所述初始图像的特征值;
根据所述特征值形成所述目标矩阵。
根据本公开实施例的一种具体实现方式,所述计算全部所述初始图像之间的近邻关系矩阵的步骤,包括:
根据距离公式计算全部所述初始图像之间的距离;
根据所述距离确定与每张初始图像相似度最高的若干图像索引;
将所述图像索引作为所述近邻关系矩阵。
根据本公开实施例的一种具体实现方式,所述对所述关系网进行分割,得到多个图像簇的步骤,包括:
对关系网采用图割算法,分割得到的多个子集对应多个所述图像簇。
根据本公开实施例的一种具体实现方式,所述分别对每个所述图像簇内的图像进行聚类操作,将符合预设条件的初始图像形成目标图像组的步骤,包括:
计算所述图像簇内全部所述初始图像之间的相似度;
选取所述相似度最高的两张所述初始图像;
判断所述相似度是否大于阈值;
若所述相似度大于所述阈值,则将两张所述初始图像形成所述目标图像组后,再次选取其他所述初始图像与所述目标图像组对应的相似度进行判断;
若所述相似度小于或等于所述阈值,则将全部所述初始图像分别形成不同的所述目标图像组。
第二方面,本公开实施例提供了一种大规模人脸图像聚类装置,包括:
输入模块,将多张初始图像输入人脸特征模型,得到全部所述初始图像对应的目标矩阵,其中,所述初始图像包括不同人员对应的人脸图像;
计算模块,计算全部所述初始图像之间的近邻关系矩阵;
建立模块,根据所述近邻关系矩阵和所述目标矩阵建立全部所述初始图像对应的关系网;
分割模块,对所述关系网进行分割,得到多个图像簇;
聚类模块,分别对每个所述图像簇内的图像进行聚类操作,将符合预设条件的初始图像形成目标图像组。
第三方面,本公开实施例还提供了一种电子设备,该电子设备包括:
至少一个处理器;以及,
与该至少一个处理器通信连接的存储器;其中,
该存储器存储有可被该至少一个处理器执行的指令,该指令被该至少一个处理器执行,以使该至少一个处理器能够执行前述第一方面或第一方面的任一实现方式中的大规模人脸图像聚类方法。
第四方面,本公开实施例还提供了一种非暂态计算机可读存储介质,该非暂态计算机可读存储介质存储计算机指令,该计算机指令用于使该计算机执行前述第一方面或第一方面的任一实现方式中的大规模人脸图像聚类方法。
第五方面,本公开实施例还提供了一种计算机程序产品,该计算机程序产品包括存储在非暂态计算机可读存储介质上的计算程序,该计算机程序包括程序指令,当该程序指令被计算机执行时,使该计算机执行前述第一方面或第一方面的任一实现方式中的大规模人脸图像聚类方法。
本公开实施例中的大规模人脸图像聚类方案,包括:将多张初始图像输入人脸特征模型,得到全部所述初始图像对应的目标矩阵,其中,所述初始图像包括不同人员对应的人脸图像;计算全部所述初始图像之间的近邻关系矩阵;根据所述近邻关系矩阵和所述目标矩阵建立全部所述初始图像对应的关系网;对所述关系网进行分割,得到多个图像簇;分别对每个所述图像簇内的图像进行聚类操作,将符合预设条件的初始图像形成目标图像组。通过本公开的方案,先计算全部初始图像对应的目标矩阵以及初始图像之间的近邻关系矩阵,并据此建立关系网,然后再对关系网进行分割,得到多个包含不同特定属性的图像簇,然后再进行进一步的聚类,将符合预设条件的初始图像形成目标图像组,提高了人脸图像聚类方法的效率和精确度。
附图说明
为了更清楚地说明本公开实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1为本公开实施例提供的一种大规模人脸图像聚类方法的流程示意图;
图2为本公开实施例提供的一种大规模人脸图像聚类方法涉及的得到所述目标矩阵示意图的流程示意图;
图3为本公开实施例提供的一种大规模人脸图像聚类装置的结构示意图;
图4为本公开实施例提供的电子设备示意图。
具体实施方式
下面结合附图对本公开实施例进行详细描述。
以下通过特定的具体实例说明本公开的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本公开的其他优点与功效。显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。本公开还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本公开的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。基于本公开中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。
需要说明的是,下文描述在所附权利要求书的范围内的实施例的各种方面。应显而易见,本文中所描述的方面可体现于广泛多种形式中,且本文中所描述的任何特定结构及/或功能仅为说明性的。基于本公开,所属领域的技术人员应了解,本文中所描述的一个方面可与任何其它方面独立地实施,且可以各种方式组合这些方面中的两者或两者以上。举例来说,可使用本文中所阐述的任何数目个方面来实施设备及/或实践方法。另外,可使用除了本文中所阐述的方面中的一或多者之外的其它结构及/或功能性实施此设备及/或实践此方法。
还需要说明的是,以下实施例中所提供的图示仅以示意方式说明本公开的基本构想,图式中仅显示与本公开中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。
另外,在以下描述中,提供具体细节是为了便于透彻理解实例。然而,所属领域的技术人员将理解,可在没有这些特定细节的情况下实践所述方面。
目前,随着深度学习的发展,人脸识别相关技术也得到了很大进步,并且在实际场景中得到了广泛的应用。广泛的应用带来了海量的无标签人脸数据,对这些人脸图片根据身份进行分组就需要聚类技术。数据规模的增加会造成聚类的复杂度指数级增加,包括内存的使用、耗时、计算复杂度等,一般的聚类方法已经无法满足需求,现有的人脸聚类方法,直接通过计算人脸图像间的相似矩阵,然后根据阈值确定分组,或者每个类别根据一张图像进行分组,从而导致计算量过大或者分类存在误差。本公开实施例提供一种大规模人脸图像聚类方法,所述方法可以应用于商场、景点等场景的人脸图像分类过程。
参见图1,为本公开实施例提供的一种大规模人脸图像聚类方法的流程示意图。如图1所示,所述方法主要包括以下步骤:
S101,将多张初始图像输入人脸特征模型,得到全部所述初始图像对应的目标矩阵,其中,所述初始图像包括不同人员对应的人脸图像;
具体实施时,可以先采集多张初始图像,在实际应用时,采集到的全部初始图像会包括不同人员对应的人脸图像,考虑到需要对全部所述初始图像根据不同人员进行关联分类,可以将多张所述初始图像输入所述人脸特征模型,以使得所述人脸特征模型计算全部所述初始图像对应的目标矩阵。
S102,计算全部所述初始图像之间的近邻关系矩阵;
具体实施时,可以通过全部所述初始图像之间的某些特定属性计算全部所述初始图像之间的相似度,根据相似度确定每张图像与其相似度最高的若干图像,从而构建出近邻关系矩阵。
S103,根据所述近邻关系矩阵和所述目标矩阵建立全部所述初始图像对应的关系网;
具体实施时,可以根据全部所述初始图像之间对应的近邻关系矩阵和所述目标矩阵,建立全部所述初始图像对应的关系网,以使得全部所述初始图像能进行关联,从而能进行下一步操作。
例如,得到每个所述初始图像与其最近的K个所述初始图像之后,根据此结果构建所述关系网G=(E,V),其中V代表节点,E代表节点之间的边。在本发明里,V对应每个所述初始图像,V的数量为全部所述初始图像集合N,E对应全部所述初始图像之间的关系,具体的可以表示为:
S104,对所述关系网进行分割,得到多个图像簇;
具体实施时,与精确的聚类不同,此步骤只需要保证召回,然后在分割时约束有连接的节点被分割在一起,从而得到多个所述图像簇。
S105,分别对每个所述图像簇内的图像进行聚类操作,将符合预设条件的初始图像形成目标图像组。
上述步骤得到的多个所述图像簇,可能一个所述图像簇内包含了多个人员的不同人脸图像,还需要根据所述预设条件对每个所述图像簇内的图像进行聚类操作,然后将符合所述预设条件的初始图像形成目标图像组,即对每个所述图像簇内的图像分组,以使得同一个人的人脸图像在同一个分组里。
本实施例提供的大规模人脸图像聚类方法,通过先计算全部初始图像对应的目标矩阵以及初始图像之间的近邻关系矩阵,并据此建立关系网,然后再对关系网进行分割,得到多个包含不同特定属性的图像簇,然后再进行进一步的聚类,将符合预设条件的初始图像形成目标图像组,提高了人脸图像聚类方法的效率和精确度。
在上述实施例的基础上,步骤S101所述的,将多张初始图像输入人脸特征模型,得到全部所述初始图像对应的目标矩阵之前,所述方法还包括:
利用预设数量的样本图像训练卷积神经网络得到所述人脸特征模型。
例如,可以利用100万张所述样本图像训练所述卷积神经网络,得到所述人脸特征模型,所述样本图像可以是不同的测试人员的多角度或者不同环境下拍摄的图像,以使得所述人脸特征模型的识别精度和鲁棒性更高。
进一步的,步骤S101所述的,如图2所示,将多张初始图像输入人脸特征模型,得到全部所述初始图像对应的目标矩阵,包括:
S201,根据所述人脸特征模型,计算全部所述初始图像的特征值;
例如,全部所述初始图像的集合为V,所述人脸特征模型采用深度残差网络训练建立,将全部所述初始图像输入人脸特征模型,然后根据所述人脸特征模型计算每一张所述初始图像对应的F维的特征值。
S202,根据所述特征值形成所述目标矩阵。
然后根据全部所述初始图像对应的所述特征值,得到所述目标矩阵为 VxF。
在上述实施例的基础上,步骤S102所述的,计算全部所述初始图像之间的近邻关系矩阵,包括:
根据距离公式计算全部所述初始图像之间的距离;
根据所述距离确定与每张初始图像相似度最高的多个图像索引;
将所述图像索引作为所述近邻关系矩阵。
具体实施时,可以根据所述距离公式计算全部所述初始图像之间的距离,然后根据距离找出与初始图像相似度最高的多个图像索引,并将全部所述图像索引作为所述近邻关系矩阵。当然,也可以采用一些近似搜索算法,如KDTree, BallTree,IVFADC等搜索结构,或者,采用目前已有很多成熟的近似搜索库可以使用,如FAISS,FLANN,Annoy等用于计算全部所述初始图像之间的近邻关系矩阵。此外,还能采用分布式搜索方案,对查询库与底库拆分,提高搜索效率。
在上述实施例的基础上,步骤S104所述的,对所述关系网进行分割,得到多个图像簇,包括:
对关系网采用图割算法,分割得到的多个子集对应多个所述图像簇。
具体实施时,考虑到在建立所述关系网时,是根据所述近邻关系矩阵和所述目标矩阵建立的,在对所述关系网进行分割时,约束有连接的节点被分割在一起,然后根据分割后的多个子集对应多个所述图像簇。需要说明的是,对于这种分割约束,可以采用基于多层次切分算法实现,例如,可以采用METIS 软件提供的工具包,可以将全部所述初始图像的集合V分割成多个小簇。
在上述实施例的基础上,步骤S105所述的,分别对每个所述图像簇内的图像进行聚类操作,将符合预设条件的初始图像形成目标图像组的步骤,包括:
计算所述图像簇内全部所述初始图像之间的相似度;
具体实施时,获取到不同的所述图像簇后,可以分别计算每个所述图像簇内全部所述初始图像之间的相似度。
选取所述相似度最高的两张所述初始图像;
例如,所述图像簇内有10张所述初始图像,选取所述相似度最高的两张所述初始图像为图像A和图像C,当然,还可以将剩余所述初始图像按相似度进行排序。
判断所述相似度是否大于阈值;
具体实施时,考虑到聚合精度,可以预先设置一个所述阈值,然后将所述相似度与所述阈值进行比对,从而确定下一步操作流程。
若所述相似度大于所述阈值,则将两张所述初始图像形成所述目标图像组后,再次选取其他所述初始图像与所述目标图像组对应的相似度进行判断;
若所述相似度小于或等于所述阈值,则将全部所述初始图像分别形成不同的所述目标图像组。
例如,所述相似度为80,所述阈值为75,则可以判定两张所述初始图像为同一个人员的图像,然后可以将两张所述初始图像合并为一组,形成所述目标图像组,然后可以再选取其他所述初始图像与所述目标图像组对应的相似度进行判断,若其他所述初始图像与所述目标图像组对应的相似度大于所述阈值,将可以将所述初始图像并入所述目标图像组。若所述相似度为60,则可以判定两张所述初始图像为不同人员的图像,则可以全部所述初始图像分别形成不同的所述目标图像组。
与上面的方法实施例相对应,参见图3,本公开实施例还提供了一种大规模人脸图像聚类装置30,包括:
输入模块301,将多张初始图像输入人脸特征模型,得到全部所述初始图像对应的目标矩阵,其中,所述初始图像包括不同人员对应的人脸图像;
计算模块302,计算全部所述初始图像之间的近邻关系矩阵;
建立模块303,根据所述近邻关系矩阵和所述目标矩阵建立全部所述初始图像对应的关系网;
分割模块304,对所述关系网进行分割,得到多个图像簇;
聚类模块305,分别对每个所述图像簇内的图像进行聚类操作,将符合预设条件的初始图像形成目标图像组。
图3所示装置可以对应的执行上述方法实施例中的内容,本实施例未详细描述的部分,参照上述方法实施例中记载的内容,在此不再赘述。
参见图4,本公开实施例还提供了一种电子设备40,该电子设备包括:
至少一个处理器;以及,
与该至少一个处理器通信连接的存储器;其中,
该存储器存储有可被该至少一个处理器执行的指令,该指令被该至少一个处理器执行,以使该至少一个处理器能够执行前述方法实施例中的大规模人脸图像聚类方法。
本公开实施例还提供了一种非暂态计算机可读存储介质,该非暂态计算机可读存储介质存储计算机指令,该计算机指令用于使该计算机执行前述方法实施例中的大规模人脸图像聚类方法。
本公开实施例还提供了一种计算机程序产品,该计算机程序产品包括存储在非暂态计算机可读存储介质上的计算程序,该计算机程序包括程序指令,当该程序指令被计算机执行时,使该计算机执行前述方法实施例中的大规模人脸图像聚类方法。
下面参考图4,其示出了适于用来实现本公开实施例的电子设备40的结构示意图。本公开实施例中的电子设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图4示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图4所示,电子设备40可以包括处理装置(例如中央处理器、图形处理器等)401,其可以根据存储在只读存储器(ROM)402中的程序或者从存储装置408加载到随机访问存储器(RAM)403中的程序而执行各种适当的动作和处理。在RAM 403中,还存储有电子设备40操作所需的各种程序和数据。处理装置401、ROM 402以及RAM 403通过总线404彼此相连。输入/输出(I/O) 接口405也连接至总线404。
通常,以下装置可以连接至I/O接口405:包括例如触摸屏、触摸板、键盘、鼠标、图像传感器、麦克风、加速度计、陀螺仪等的输入装置406;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置407;包括例如磁带、硬盘等的存储装置408;以及通信装置409。通信装置409可以允许电子设备 40与其他设备进行无线或有线通信以交换数据。虽然图中示出了具有各种装置的电子设备40,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置409 从网络上被下载和安装,或者从存储装置408被安装,或者从ROM 402被安装。在该计算机程序被处理装置401执行时,执行本公开实施例的方法中限定的上述功能。
需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM 或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备可以执行上述方法实施例的相关步骤。
或者,上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备可以执行上述方法实施例的相关步骤。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言—诸如 Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。
应当理解,本公开的各部分可以用硬件、软件、固件或它们的组合来实现。
以上所述,仅为本公开的具体实施方式,但本公开的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本公开揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本公开的保护范围之内。因此,本公开的保护范围应以权利要求的保护范围为准。
Claims (9)
1.一种大规模人脸图像聚类方法,其特征在于,包括:
将多张初始图像输入人脸特征模型,得到全部所述初始图像对应的目标矩阵,其中,所述初始图像包括不同人员对应的人脸图像;
计算全部所述初始图像之间的近邻关系矩阵;
根据所述近邻关系矩阵和所述目标矩阵建立全部所述初始图像对应的关系网;
对所述关系网进行分割,得到多个图像簇;
分别对每个所述图像簇内的图像进行聚类操作,将符合预设条件的初始图像形成目标图像组。
2.根据权利要求1所述的方法,其特征在于,所述将多张初始图像输入人脸特征模型,得到全部所述初始图像对应的目标矩阵的步骤之前,所述方法还包括:
利用预设数量的样本图像训练卷积神经网络得到所述人脸特征模型。
3.根据权利要求1所述的方法,其特征在于,所述将多张初始图像输入人脸特征模型,得到全部所述初始图像对应的目标矩阵的步骤,包括:
根据所述人脸特征模型,计算全部所述初始图像的特征值;
根据所述特征值形成所述目标矩阵。
4.根据权利要求1所述的方法,其特征在于,所述计算全部所述初始图像之间的近邻关系矩阵的步骤,包括:
根据距离公式计算全部所述初始图像之间的距离;
根据所述距离确定与每张初始图像相似度最高的多个图像索引;
将所述图像索引作为所述近邻关系矩阵。
5.根据权利要求1所述的方法,其特征在于,所述对所述关系网进行分割,得到多个图像簇的步骤,包括:
对关系网采用图割算法,分割得到的多个子集对应多个所述图像簇。
6.根据权利要求1所述的方法,其特征在于,所述分别对每个所述图像簇内的图像进行聚类操作,将符合预设条件的初始图像形成目标图像组的步骤,包括:
计算所述图像簇内全部所述初始图像之间的相似度;
选取所述相似度最高的两张所述初始图像;
判断所述相似度是否大于阈值;
若所述相似度大于所述阈值,则将两张所述初始图像形成所述目标图像组后,再次选取其他所述初始图像与所述目标图像组对应的相似度进行判断;
若所述相似度小于或等于所述阈值,则将全部所述初始图像分别形成不同的所述目标图像组。
7.一种大规模人脸图像聚类装置,其特征在于,包括:
输入模块,将多张初始图像输入人脸特征模型,得到全部所述初始图像对应的目标矩阵,其中,所述初始图像包括不同人员对应的人脸图像;
计算模块,计算全部所述初始图像之间的近邻关系矩阵;
建立模块,根据所述近邻关系矩阵和所述目标矩阵建立全部所述初始图像对应的关系网;
分割模块,对所述关系网进行分割,得到多个图像簇;
聚类模块,分别对每个所述图像簇内的图像进行聚类操作,将符合预设条件的初始图像形成目标图像组。
8.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行前述权利要求1-6中任一项所述的大规模人脸图像聚类方法。
9.一种非暂态计算机可读存储介质,该非暂态计算机可读存储介质存储计算机指令,该计算机指令用于使该计算机执行前述权利要求1-6中任一项所述的大规模人脸图像聚类方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011503304.1A CN112560963A (zh) | 2020-12-17 | 2020-12-17 | 大规模人脸图像聚类方法、装置、电子设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011503304.1A CN112560963A (zh) | 2020-12-17 | 2020-12-17 | 大规模人脸图像聚类方法、装置、电子设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112560963A true CN112560963A (zh) | 2021-03-26 |
Family
ID=75063652
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011503304.1A Pending CN112560963A (zh) | 2020-12-17 | 2020-12-17 | 大规模人脸图像聚类方法、装置、电子设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112560963A (zh) |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107609466A (zh) * | 2017-07-26 | 2018-01-19 | 百度在线网络技术(北京)有限公司 | 人脸聚类方法、装置、设备及存储介质 |
CN108875522A (zh) * | 2017-12-21 | 2018-11-23 | 北京旷视科技有限公司 | 人脸聚类方法、装置和系统及存储介质 |
WO2018219223A1 (zh) * | 2017-05-31 | 2018-12-06 | 腾讯科技(深圳)有限公司 | 数据处理方法、装置及存储介质 |
CN109086720A (zh) * | 2018-08-03 | 2018-12-25 | 腾讯科技(深圳)有限公司 | 一种人脸聚类方法、装置和存储介质 |
CN109800744A (zh) * | 2019-03-18 | 2019-05-24 | 深圳市商汤科技有限公司 | 图像聚类方法及装置、电子设备和存储介质 |
CN109829433A (zh) * | 2019-01-31 | 2019-05-31 | 北京市商汤科技开发有限公司 | 人脸图像识别方法、装置、电子设备及存储介质 |
CN109948734A (zh) * | 2019-04-02 | 2019-06-28 | 北京旷视科技有限公司 | 图像聚类方法、装置及电子设备 |
CN110020599A (zh) * | 2019-02-28 | 2019-07-16 | 浙江工业大学 | 一种稀疏强化型低秩约束的人脸图像聚类方法 |
CN111062431A (zh) * | 2019-12-12 | 2020-04-24 | Oppo广东移动通信有限公司 | 图像聚类方法、图像聚类装置、电子设备及存储介质 |
CN111291827A (zh) * | 2020-02-28 | 2020-06-16 | 北京市商汤科技开发有限公司 | 图像聚类方法、装置、设备及存储介质 |
CN111814923A (zh) * | 2020-09-10 | 2020-10-23 | 上海云从汇临人工智能科技有限公司 | 一种图像聚类方法、系统、设备和介质 |
-
2020
- 2020-12-17 CN CN202011503304.1A patent/CN112560963A/zh active Pending
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018219223A1 (zh) * | 2017-05-31 | 2018-12-06 | 腾讯科技(深圳)有限公司 | 数据处理方法、装置及存储介质 |
CN107609466A (zh) * | 2017-07-26 | 2018-01-19 | 百度在线网络技术(北京)有限公司 | 人脸聚类方法、装置、设备及存储介质 |
CN108875522A (zh) * | 2017-12-21 | 2018-11-23 | 北京旷视科技有限公司 | 人脸聚类方法、装置和系统及存储介质 |
CN109086720A (zh) * | 2018-08-03 | 2018-12-25 | 腾讯科技(深圳)有限公司 | 一种人脸聚类方法、装置和存储介质 |
CN109829433A (zh) * | 2019-01-31 | 2019-05-31 | 北京市商汤科技开发有限公司 | 人脸图像识别方法、装置、电子设备及存储介质 |
CN110020599A (zh) * | 2019-02-28 | 2019-07-16 | 浙江工业大学 | 一种稀疏强化型低秩约束的人脸图像聚类方法 |
CN109800744A (zh) * | 2019-03-18 | 2019-05-24 | 深圳市商汤科技有限公司 | 图像聚类方法及装置、电子设备和存储介质 |
CN109948734A (zh) * | 2019-04-02 | 2019-06-28 | 北京旷视科技有限公司 | 图像聚类方法、装置及电子设备 |
CN111062431A (zh) * | 2019-12-12 | 2020-04-24 | Oppo广东移动通信有限公司 | 图像聚类方法、图像聚类装置、电子设备及存储介质 |
CN111291827A (zh) * | 2020-02-28 | 2020-06-16 | 北京市商汤科技开发有限公司 | 图像聚类方法、装置、设备及存储介质 |
CN111814923A (zh) * | 2020-09-10 | 2020-10-23 | 上海云从汇临人工智能科技有限公司 | 一种图像聚类方法、系统、设备和介质 |
Non-Patent Citations (3)
Title |
---|
VEITH ROTHLINGSHOFER 等: "Self-supervised Face-Grouping on Graphs", 《PROCEEDINGS OF THE 27TH ACM INTERNATIONAL CONFERENCE ON MULTIMEDIA》, 15 October 2019 (2019-10-15), pages 247 - 256, XP058640367, DOI: 10.1145/3343031.3351071 * |
ZHONGDAO WANG 等: "Linkage Based Face Clustering via Graph Convolution Network", 《2019 IEEE/CVF CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION》, 9 January 2020 (2020-01-09), pages 1117 - 1125 * |
高阳;李昌华;李智杰;崔欢欢;: "基于谱特征和图分割的图聚类算法", 《计算机工程与应用》, vol. 53, no. 15, 25 March 2016 (2016-03-25), pages 222 - 226 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110971969B (zh) | 视频配乐方法、装置、电子设备及计算机可读存储介质 | |
CN110674349B (zh) | 视频poi识别方法、装置及电子设备 | |
CN110956255A (zh) | 难样本挖掘方法、装置、电子设备及计算机可读存储介质 | |
CN110415276B (zh) | 运动信息计算方法、装置及电子设备 | |
CN111738316B (zh) | 零样本学习的图像分类方法、装置及电子设备 | |
CN115271071A (zh) | 基于图神经网络的知识图谱实体对齐方法、系统及设备 | |
CN112149699B (zh) | 用于生成模型的方法、装置和用于识别图像的方法、装置 | |
CN111753114A (zh) | 图像预标注方法、装置及电子设备 | |
CN109359727B (zh) | 神经网络的结构确定方法、装置、设备及可读介质 | |
CN112990176B (zh) | 书写质量评价方法、装置和电子设备 | |
CN114494709A (zh) | 特征提取模型的生成方法、图像特征提取方法和装置 | |
CN113869599A (zh) | 鱼类疫病发展预测方法、系统、设备及介质 | |
CN113919320A (zh) | 异构图神经网络的早期谣言检测方法、系统及设备 | |
CN113971400B (zh) | 一种文本检测方法、装置、电子设备及存储介质 | |
CN110555861B (zh) | 光流计算方法、装置及电子设备 | |
CN110378936B (zh) | 光流计算方法、装置及电子设备 | |
CN110300329B (zh) | 基于离散特征的视频推送方法、装置及电子设备 | |
CN115563522B (zh) | 交通数据的聚类方法、装置、设备及介质 | |
JP2022541832A (ja) | 画像を検索するための方法及び装置 | |
CN111832354A (zh) | 目标对象年龄识别方法、装置及电子设备 | |
CN116957006A (zh) | 预测模型的训练方法、装置、设备、介质及程序产品 | |
CN112560963A (zh) | 大规模人脸图像聚类方法、装置、电子设备及介质 | |
CN110704679B (zh) | 视频分类方法、装置及电子设备 | |
CN111582456B (zh) | 用于生成网络模型信息的方法、装置、设备和介质 | |
CN114428867A (zh) | 数据挖掘方法、装置、存储介质及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |