CN113920353B - 一种无监督的人脸图像二次聚类方法、装置、介质 - Google Patents
一种无监督的人脸图像二次聚类方法、装置、介质 Download PDFInfo
- Publication number
- CN113920353B CN113920353B CN202111300505.6A CN202111300505A CN113920353B CN 113920353 B CN113920353 B CN 113920353B CN 202111300505 A CN202111300505 A CN 202111300505A CN 113920353 B CN113920353 B CN 113920353B
- Authority
- CN
- China
- Prior art keywords
- cluster
- clustering
- similarity
- face images
- clusters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Image Analysis (AREA)
Abstract
本发明提出了一种无监督的人脸图像二次聚类方法、装置及存储介质,该方法包括:对获取的n张人脸图像计算相似度矩阵和图像质量分数,并基于图像质量分数对相似度矩阵进行调整,基于调整后的相似度矩阵对n张人脸图像进行初次聚类得到初次聚类结果;基于所述聚类结果中的每个簇中的图像数量分为离散簇和聚集簇;在选出每个簇的代表元后,利用并查集算法先将满足条件的离散簇合并至聚集簇,再进行聚集簇之间的合并,得到二次聚类后的人脸图像。本发明创造性地提出了二次聚类的方式,在前后两次聚类中使用不同的相似度阈值,逐步求精;并且在聚类过程,针对聚类样本/聚类簇的特点对相似度计算作精细调整,最终实现高精确率和高归档率的人脸聚类。
Description
技术领域
本发明涉及人工智能技术领域,具体涉及一种无监督的人脸图像二次聚类 方法、装置、介质。
背景技术
人脸聚类是重要的人脸识别下游任务,其基本流程是在获取手工设计或通 过网络embedding得到的高维人脸特征向量的基础上,利用各种聚类方法进行 人脸聚类。目前常见的人脸聚类方法大致分为两种:无监督聚类方法,例如K- Means、Spectral、DBSCAN等方法;有监督聚类方法,例如CDP、GCN等方法。
但是,上述聚类方法应用于真实场景,如安防抓拍场景下的聚类主要存在两 个问题:一是抓拍图质量问题,由于抓拍人脸在角度,光照,姿态等方面的差异 较大,存在较多低质量图像,此时人脸识别系统提取到的人脸特征不够充分,导 致聚类困难;二是抓拍库的数量问题。应用于百万级甚至千万级人口城市的人脸 聚类时,由于相似人脸很多,聚类算法中的相似度阈值选择十分困难,具体来说, 阈值选择过大容易出现聚类遗漏,而阈值选择过小则容易出现聚类错误。因此, 大规模人脸聚类时,聚类方案的选定、聚类阈值的设置以及如何保证低质量图像 相似度计算的可靠性,是工程技术人员面临的技术难题。
发明内容
本发明针对上述现有技术中一个或多个技术缺陷,提出了如下技术方案。
一种无监督的人脸图像二次聚类方法,该方法包括:
初次聚类步骤,对获取的n张人脸图像计算相似度矩阵和图像质量分数, 并基于图像质量分数对相似度矩阵进行调整,基于调整后的相似度矩阵对n张 人脸图像进行初次聚类得到初次聚类结果,其中n≥2;
划分步骤,在初次聚类得到的初次聚类结果中,选出聚类簇中的最佳代表元 rep,并根据每个聚类簇中的图像数量分为离散簇和聚集簇;
二次聚类步骤,利用并查集算法先将满足条件的离散簇合并至聚集簇,再进 行聚集簇之间的合并,得到二次聚类后的人脸图像。
更进一步地,所述对获取的n张人脸图像计算相似度矩阵和图像质量分数, 并基于图像质量分数对相似度矩阵进行调整的操作为:使用卷积神经网络获取n 张人脸图像的高维人脸归一化特征向量emb,并计算每一人脸图像的表示人脸特 征质量的图像质量分数dp_score;计算n张人脸图像的1:n的余弦相似度并排 序得到前top_k个相似度矩阵D,其中,D为n×top_k的矩阵;根据每一人脸 图像的图像质量分数dp_score调整相似度矩阵D:如果两张人脸图像中任意一 张的质量分dp_score小于第一阈值thres_1,则将它们之间的相似度置为0, 如果否,则判断两张人脸图像的质量分dp_score是否都小于第二阈值thres_2, 如果是,则在thres_1和thres_2之间,根据较低分图片的质量分,线性衰减二 者之间的相似度,处理完毕后得到调整后的相似度矩阵D,其中, thres_1<thres_2。
更进一步地,所述基于调整后的相似度矩阵对n张人脸图像进行初次聚类 得到初次聚类结果的操作为:设定初次聚类的余弦相似度阈值eps1;根据调整 后的相似度矩阵D找到所有人脸图像的邻居neighbors,即与目标人脸图像相似 度大于eps_1的即判定为它的邻居;如果一张人脸图像的邻居数量>=2,则认为 该人脸图像为核心点core_samples;根据neighbors和core_samples对所有人 脸图像进行连通计算,得到所述初次聚类结果。
更进一步地,所述划分步骤的操作为:在初次聚类结果中选出每一个初始聚 类簇中的最佳代表元rep,包括:选出每一个初始聚类簇内质量分数大于阈值 thres_2的所有m个人脸图像,如果m=0或m=2,将该每一个初始聚类簇内质量 分数最高的图片设为代表元rep,否则,判断m>=1且m≠2是否成立,如果是, 则计算m个人脸图像的特征的平均作为该初始聚类簇的类中心,随后计算m个 样本与类中心的余弦相似度,相似度最高的图片成为代表元rep;再根据每一个 初始聚类簇内的人脸图像数量,将初始聚类簇进行划分,如果一个初始聚类簇内 的人脸图像数大于1则为聚集簇,如果初始聚类簇内的人脸图像数为1的则为 离散簇。
更进一步地,所述二次聚类步骤的操作为:使用代表元的特征和质量分代表 聚类簇,分别计算离散簇与聚集簇之间的相似度D1,聚集簇之间的相似度D2, 相似度计算和调整方式与初次聚类相同;离散簇与聚集簇间进行二次聚类,对相 似度D1>eps2_less的部分,使用并查集方法进行簇间合并;聚集簇间进行二次 聚类,该注意到,对聚集簇进行的簇间合并使用不同的相似度阈值,对样本数量 多的簇,适当降低其相似度阈值,具体地,聚集簇i与聚集簇j的合并阈值按下 式计算:
eps2_more_adjij=eps2_more-min{0.01×log2 Cij,0.08}
式中Cij为簇i和簇j包含人脸图像数量的乘积。
本发明还提出了一种无监督的人脸图像二次聚类装置,该装置包括:
初次聚类单元,对获取的n张人脸图像计算相似度矩阵和图像质量分数, 并基于图像质量分数对相似度矩阵进行调整,基于调整后的相似度矩阵对n张 人脸图像进行初次聚类得到初次聚类结果,其中n≥2;
划分单元,在初次聚类得到的初次聚类结果中,选出聚类簇中的最佳代表元 rep,并根据每个聚类簇中的图像数量分为离散簇和聚集簇;
二次聚类单元,利用并查集算法先将满足条件的离散簇合并至聚集簇,再进 行聚集簇之间的合并,得到二次聚类后的人脸图像。
更进一步地,所述对获取的n张人脸图像计算相似度矩阵和图像质量分数, 并基于图像质量分数对相似度矩阵进行调整的操作为:使用卷积神经网络获取n 张人脸图像的高维人脸归一化特征向量emb,并计算每一人脸图像的表示人脸特 征质量的图像质量分数dp_score;计算n张人脸图像的1:n的余弦相似度并排 序得到前top_k个相似度矩阵D,其中,D为n×top_k的矩阵;根据每一人脸 图像的图像质量分数dp_score调整相似度矩阵D:如果两张人脸图像中任意一 张的质量分dp_score小于第一阈值thres_1,则将它们之间的相似度置为0, 如果否,则判断两张人脸图像的质量分dp_score是否都小于第二阈值thres_2, 如果是,则在thres_1和thres_2之间,根据较低分图片的质量分,线性衰减二 者之间的相似度,处理完毕后得到调整后的相似度矩阵D,其中, thres_1<thres_2。
更进一步地,所述基于调整后的相似度矩阵对n张人脸图像进行初次聚类 得到初次聚类结果的操作为:设定初次聚类的余弦相似度阈值eps1;根据调整 后的相似度矩阵D找到所有人脸图像的邻居neighbors,即与目标人脸图像相似 度大于eps_1的即判定为它的邻居;如果一张人脸图像的邻居数量>=2,则认为 该人脸图像为核心点core_samples;根据neighbors和core_samples对所有人 脸图像进行连通计算,得到所述初次聚类结果。
更进一步地,所述划分单元执行的操作为:在初次聚类结果中选出每一个初 始聚类簇中的最佳代表元rep,包括:选出每一个初始聚类簇内质量分数大于阈 值thres_2的所有m个人脸图像,如果m=0或m=2,将该每一个初始聚类簇内质 量分数最高的图片设为代表元rep,否则,判断m>=1且m≠2是否成立,如果 是,则计算m个人脸图像的特征的平均作为该初始聚类簇的类中心,随后计算m 个样本与类中心的余弦相似度,相似度最高的图片成为代表元rep;再根据每一 个初始聚类簇内的人脸图像数量,将初始聚类簇进行划分,如果一个初始聚类簇 内的人脸图像数大于1则为聚集簇,如果初始聚类簇内的人脸图像数为1的则 为离散簇。
更进一步地,所述二次聚类单元执行的操作为:使用代表元的特征和质量分 代表聚类簇,分别计算离散簇与聚集簇之间的相似度D1,聚集簇之间的相似度D2,相似度计算和调整方式与初次聚类相同;离散簇与聚集簇间进行二次聚类, 对相似度D1>eps2_less的部分,使用并查集方法进行簇间合并;聚集簇间进行 二次聚类,该注意到,对聚集簇进行的簇间合并使用不同的相似度阈值,对样本 数量多的簇,适当降低其相似度阈值,具体地,聚集簇i与聚集簇j的合并阈值 按下式计算:
eps2_more_adjij=eps2_more-min{0.01×log2 Cij,0.08}
式中Cij为簇i和簇j包含人脸图像数量的乘积。
本发明还提出了一种计算机可读存储介质,所述存储介质上存储有计算机 程序代码,当所述计算机程序代码被计算机执行时执行上述之任一的方法。
本发明的技术效果在于:本发明的一种无监督的人脸图像二次聚类方法、装 置及存储介质,该方法包括:初次聚类步骤,对获取的n张人脸图像计算相似度 矩阵和图像质量分数,并基于图像质量分数对相似度矩阵进行调整,基于调整后 的相似度矩阵对n张人脸图像进行初次聚类得到初次聚类结果,其中n≥2;划 分步骤,在初次聚类得到了初始聚类簇的基础上,选出聚类簇中的最佳代表元 rep,并根据每个聚类簇中的图像数量分为离散簇和聚集簇;二次聚类步骤,利 用并查集算法先将满足条件的离散簇合并至聚集簇,再进行聚集簇之间的合并, 得到二次聚类后的人脸图像。本发明创造性地提出了二次聚类的方式,避免了采 用单一的阈值进行聚类。本发明中,基于计算出来的图像质量分数,对图像之间 的相似度进行调整,设置了相应的阈值,即如果质量分低于保留阈值,就直接将 二者的相似度设为0,如果质量分处在降分阈值范围,则进行相似度的微调,保 证了后续聚类的准确性。本发明中,基于人脸图像的邻居及图像是否为核心点进 行初始聚类,确保了初始聚类就是相对准确,为进一步准确的二次聚类奠定了良 好的基础。本发明二次聚类过程中,提出并利用代表元机制来更好地表征聚类簇, 并根据聚类簇的图像数量特点,提出阈值调整公式对合并相似度阈值进行动态 调整。综上,本发明采用二次聚类的方式,在前后两次聚类中使用不同的相似度 阈值,逐步求精;并且在聚类过程,针对聚类样本/聚类簇的特点对相似度计算 作精细调整,最终实现高精确率和高归档率的人脸聚类。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请 的其它特征、目的和优点将会变得更明显。
图1是根据本发明的实施例的一种无监督的人脸图像二次聚类方法的流程 图。
图2是根据本发明的实施例的一种无监督的人脸图像二次聚类装置的结构 图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处 所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要 说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可 以相互组合。下面将参考附图并结合实施例来详细说明本申请。
图1示出了本发明的一种无监督的人脸图像二次聚类方法,该方法包括:
初次聚类步骤S101,对获取的n张人脸图像计算相似度矩阵和图像质量分 数,并基于图像质量分数对相似度矩阵进行调整,基于调整后的相似度矩阵对n 张人脸图像进行初次聚类得到初次聚类结果,其中n≥2;
划分步骤S102,在初次聚类得到的初次聚类结果中,选出聚类簇中的最佳 代表元rep,并根据每个聚类簇中的图像数量分为离散簇和聚集簇;
二次聚类步骤S103,利用并查集算法先将满足条件的离散簇合并至聚集簇, 再进行聚集簇之间的合并,得到二次聚类后的人脸图像。
本发明应用于真实工作场景,比如车站、码头等人流密集的场景,采集的人 脸图像数量巨大,人脸图像可以是布设工作场景中摄像头进行抓拍的。
在一个实施例中,为了解决现有技术中的抓拍库的数量问题,即应用于百万 级甚至千万级人口城市的人脸聚类时,由于相似人脸很多,聚类算法中的相似度 阈值选择十分困难,具体来说,阈值选择过大容易出现聚类遗漏,而阈值选择过 小则容易出现聚类错误。因此,本发明提出一种级联二次聚类的整体聚类方案, 在前后两次聚类中使用不同的相似度阈值,逐步求精;并且在聚类过程,针对聚 类样本/聚类簇的特点对相似度计算作精细调整,最终实现高精确率和高归档率 的人脸聚类。这是本发明的一个重要发明点。
在一个实施例中,由于摄像头抓拍图像质量可能不高,比如由于抓拍人脸在 角度,光照,姿态等方面的差异较大,存在较多低质量图像,此时人脸识别系统 提取到的人脸特征不够充分,导致聚类困难。因此,运用本发明方案:所述对获 取的n张人脸图像计算相似度矩阵和图像质量分数,并基于图像质量分数对相 似度矩阵进行调整的操作为:使用卷积神经网络获取n张人脸图像的高维人脸 归一化特征向量emb,并计算每一人脸图像的表示人脸特征质量的图像质量分数 dp_score;计算n张人脸图像的1:n的余弦相似度并排序得到前top_k个相似 度矩阵D,其中,D为n×top_k的矩阵;根据每一人脸图像的图像质量分数 dp_score调整相似度矩阵D:如果两张人脸图像中任意一张的质量分dp_score 小于第一阈值thres_1,则将它们之间的相似度置为0,如果否,则判断两张人 脸图像的质量分dp_score是否都小于第二阈值thres_2,如果是,则在thres_1 和thres_2之间(thres_1<thres_2),根据较低分图片的质量分,线性衰减二者 之间的相似度,比如设置线性衰减值的范围[limit_1,limit_2],一般可设置为 [0,0.2],处理完毕后得到调整后的相似度矩阵D。人脸识别的1:n的比对即 系统采集了“我”的一张照片之后,从海量的人像数据库中找到与当前使用者人 脸数据相符合的图像,并进行匹配,找出来“我是谁”。
本发明中,为提高相似度计算的可靠性和准确性,基于计算出来的图像质量 分数,设置了相应的阈值,即如果质量分低于保留阈值,就直接将二者的相似度 设为0,如果质量分处在降分阈值范围,则进行相似度的微调,保证了后续聚类 的准确性,这是本发明的另一个重要发明点。
在一个实施例中,所述基于调整后的相似度矩阵对n张人脸图像进行初次 聚类得到初次聚类结果的操作为:设定初次聚类的余弦相似度阈值eps1;根据 调整后的相似度矩阵D找到所有人脸图像的邻居neighbors,即与目标人脸图像 相似度大于eps_1的即判定为它的邻居;如果一张人脸图像的邻居数量>=2,则 认为该人脸图像为核心点core_samples;根据neighbors和core_samples对所 有人脸图像进行连通计算,得到所述初次聚类结果,比如,可利用DBSCAN方法 进行连通计算,即得到所述初次聚类结果。
本发明中,基于人脸图像的邻居及图像是否为核心点进行初始聚类,确保了 初始聚类就是相对准确,为进一步准确的二次聚类奠定了良好的基础,这是本发 明的另一个重要发明点。
在一个实施例中,所述划分步骤的操作为:在初次聚类结果中选出每一个初 始聚类簇中的最佳代表元rep,包括:选出每一个初始聚类簇内质量分数大于阈 值thres_2的所有m个人脸图像,如果m=0或m=2,将该每一个初始聚类簇内质 量分数最高的图片设为代表元rep,否则,判断m>=1且m≠2是否成立,如果 是,则计算m个人脸图像的特征的平均作为该初始聚类簇的类中心,随后计算m 个样本与类中心的余弦相似度,相似度最高的图片成为代表元rep;再根据每一 个初始聚类簇内的人脸图像数量,将初始聚类簇进行划分,如果一个初始聚类簇 内的人脸图像数大于1则为聚集簇,如果初始聚类簇内的人脸图像数为1的则 为离散簇。
本发明对初始聚类结果进行处理,即根据图像质量分数确定每个簇中的代 表元,并根据每个簇中的图像数量将簇进行分类,以便于后续的簇间聚类,并提 出了具体的确定代表元的方法,这是本发明的另一个重要发明点。
在一个实施例中,所述二次聚类步骤的操作为:使用代表元的特征和质量分 代表聚类簇,分别计算离散簇与聚集簇之间的相似度D1,聚集簇之间的相似度 D2,相似度计算和调整方式与初次聚类相同;离散簇与聚集簇间进行二次聚类, 对相似度D1>eps2_less的部分,使用并查集方法进行簇间合并;聚集簇间进行 二次聚类,该注意到,对聚集簇进行的簇间合并使用不同的相似度阈值,对样本 数量多的簇,适当降低其相似度阈值,具体地,聚集簇i与聚集簇j的合并阈值 按下式计算:
eps2_more_adjij=eps2_more-min{0.01×log2 Cij,0.08}
式中Cij为簇i和簇j包含人脸图像数量的乘积。判断相似度D2是否 大于eps2_more_adjij,如果是,则使用并查集方法进行簇间合并,根 据并查集结果为同父节点的聚类簇所含人脸图像分配相同聚类标签, 完成人脸图像的最终聚类。
本发明中的各阈值的关系为阈值eps1>eps2_less>eps2_more, 例如取0.58/0.56/0.55。
本发明在二次聚类的过程中,提出并利用代表元机制来更好地表征聚类簇, 并根据聚类簇的图像数量特点,提出阈值调整公式对合并相似度阈值进行动态 调整,这是本发明的另一个重要发明点。
图2示出了本发明的一种无监督的人脸图像二次聚类装置,该装置包括:
初次聚类单元201,对获取的n张人脸图像计算相似度矩阵和图像质量分 数,并基于图像质量分数对相似度矩阵进行调整,基于调整后的相似度矩阵对n 张人脸图像进行初次聚类得到初次聚类结果,其中n≥2;
划分单元202,在初次聚类得到的初次聚类结果中,选出聚类簇中的最佳代 表元rep,并根据每个聚类簇中的图像数量分为离散簇和聚集簇;
二次聚类单元203,利用并查集算法先将满足条件的离散簇合并至聚集簇, 再进行聚集簇之间的合并,得到聚类后的人脸图像。
本发明应用于真实工作场景,比如车站、码头等人流密集的场景,采集的人 脸图像数量巨大,人脸图像可以是布设工作场景中摄像头进行抓拍的。
在一个实施例中,为了解决现有技术中的抓拍库的数量问题,即应用于百万 级甚至千万级人口城市的人脸聚类时,由于相似人脸很多,聚类算法中的相似度 阈值选择十分困难,具体来说,阈值选择过大容易出现聚类遗漏,而阈值选择过 小则容易出现聚类错误。因此,本发明提出一种级联二次聚类的整体聚类方案, 在前后两次聚类中使用不同的相似度阈值,逐步求精;并且在聚类过程,针对聚 类样本/聚类簇的特点对相似度计算作精细调整,最终实现高精确率和高归档率 的人脸聚类。这是本发明的一个重要发明点。
在一个实施例中,由于摄像头抓拍图像质量可能不高,比如由于抓拍人脸在 角度,光照,姿态等方面的差异较大,存在较多低质量图像,此时人脸识别系统 提取到的人脸特征不够充分,导致聚类困难。因此,运用本发明方案:所述对获 取的n张人脸图像计算相似度矩阵和图像质量分数,并基于图像质量分数对相 似度矩阵进行调整的操作为:使用卷积神经网络获取n张人脸图像的高维人脸 归一化特征向量emb,并计算每一人脸图像的表示人脸特征质量的图像质量分数 dp_score;计算n张人脸图像的1:n的余弦相似度并排序得到前top_k个相似 度矩阵D,其中,D为n×top_k的矩阵;根据每一人脸图像的图像质量分数 dp_score调整相似度矩阵D:如果两张人脸图像中任意一张的质量分dp_score 小于第一阈值thres_1,则将它们之间的相似度置为0,如果否,则判断两张人 脸图像的质量分dp_score是否都小于第二阈值thres_2,如果是,则在thres_1 和thres_2之间(thres_1<thres_2),根据较低分图片的质量分,线性衰减二者 之间的相似度,比如设置线性衰减值的范围[limit_1,limit_2],一般可设置为 [0,0.2],处理完毕后得到调整后的相似度矩阵D。人脸识别的1:n的比对即 系统采集了“我”的一张照片之后,从海量的人像数据库中找到与当前使用者人 脸数据相符合的图像,并进行匹配,找出来“我是谁”。
本发明中,为提高相似度计算的可靠性和准确性,基于计算出来的图像质量 分数,设置了相应的阈值,即如果质量分低于保留阈值,就直接将二者的相似度 设为0,如果质量分处在降分阈值范围,则进行相似度的微调,保证了后续聚类 的准确性,这是本发明的另一个重要发明点。
在一个实施例中,所述基于调整后的相似度矩阵对n张人脸图像进行初次 聚类得到初次聚类结果的操作为:设定初次聚类的余弦相似度阈值eps1;根据 调整后的相似度矩阵D找到所有人脸图像的邻居neighbors,即与目标人脸图像 相似度大于eps_1的即判定为它的邻居;如果一张人脸图像的邻居数量>=2,则 认为该人脸图像为核心点core_samples;根据neighbors和core_samples对所 有人脸图像进行连通计算,得到所述初次聚类结果,比如,可利用DBSCAN方法 进行连通计算,即得到所述初次聚类结果。
本发明中,基于人脸图像的邻居及图像是否为核心点进行初始聚类,确保了 初始聚类就是相对准确,为进一步准确的二次聚类奠定了良好的基础,这是本发 明的另一个重要发明点。
在一个实施例中,所述划分单元的操作为:在初次聚类结果中选出每一个初 始聚类簇中的最佳代表元rep,包括:选出每一个初始聚类簇内质量分数大于阈 值thres_2的所有m个人脸图像,如果m=0或m=2,将该每一个初始聚类簇内质 量分数最高的图片设为代表元rep,否则,判断m>=1且m≠2是否成立,如果 是,则计算m个人脸图像的特征的平均作为该初始聚类簇的类中心,随后计算m 个样本与类中心的余弦相似度,相似度最高的图片成为代表元rep;再根据每一 个初始聚类簇内的人脸图像数量,将初始聚类簇进行划分,如果一个初始聚类簇 内的人脸图像数大于1则为聚集簇,如果初始聚类簇内的人脸图像数为1的则 为离散簇。
本发明对初始聚类结果进行处理,即根据图像质量分数确定每个簇中的代 表元,并根据每个簇中的图像数量将簇进行分类,以便于后续的簇间聚类,并提 出了具体的确定代表元的方法,这是本发明的另一个重要发明点。
在一个实施例中,所述二次聚类单元的操作为:使用代表元的特征和质量分 代表聚类簇,分别计算离散簇与聚集簇之间的相似度D1,聚集簇之间的相似度 D2,相似度计算和调整方式与初次聚类相同;离散簇与聚集簇间进行二次聚类, 对相似度D1>eps2_less的部分,使用并查集方法进行簇间合并;聚集簇间进行 二次聚类,该注意到,对聚集簇进行的簇间合并使用不同的相似度阈值,对样本 数量多的簇,适当降低其相似度阈值,具体地,聚集簇i与聚集簇j的合并阈值 按下式计算:
eps2_more_adjij=eps2_more-min{0.01×log2 Cij,0.08}
式中Cij为簇i和簇j包含人脸图像数量的乘积,判断相似度D2是否 大于eps2_more_adjij,如果是,则使用并查集方法进行簇间合并,根 据并查集结果为同父节点的聚类簇所含人脸图像分配相同聚类标签,
本发明中的各阈值的关系为阈值eps1>eps2_less>eps2_more, 例如取0.58/0.56/0.55。
本发明在二次聚类的过程中,提出并利用代表元机制来更好地表征聚类簇,并根据聚类簇的图像数量特点,提出阈值调整公式对合并相似度阈值进行动态调整, 这是本发明的另一个重要发明点。
为了描述的方便,本发明对以上装置时以功能分为各种单元分别描述。当然, 在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
通过对以上实施方式的描述可知,本领域的技术人员可以清楚地了解到本 申请可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申请 的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体 现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘 等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者 网络设备等)执行本申请各个实施例或者实施例的某些部分所述的装置。
最后所应说明的是:以上实施例仅以说明而非限制本发明的技术方案,尽管 参照上述实施例对本发明进行了详细说明,本领域的普通技术人员应当理解:依 然可以对本发明进行修改或者等同替换,而不脱离本发明的精神和范围的任何 修改或局部替换,其均应涵盖在本发明的权利要求范围当中。
Claims (5)
1.一种无监督的人脸图像二次聚类方法,其特征在于,该方法包括:
初次聚类步骤,对获取的n张人脸图像计算相似度矩阵和图像质量分数,并基于图像质量分数对相似度矩阵进行调整,操作为:使用卷积神经网络获取n张人脸图像的高维人脸归一化特征向量emb,并计算每一人脸图像的表示人脸特征质量的图像质量分数dp_score;计算n张人脸图像的1: n的余弦相似度并排序得到前top_k个相似度矩阵D,其中,D为n×top_k的矩阵;根据每一人脸图像的图像质量分数dp_score调整相似度矩阵D:如果两张人脸图像中任意一张的质量分dp_score小于第一阈值thres_1,则将它们之间的相似度置为0,如果否,则判断两张人脸图像的质量分dp_score是否都小于第二阈值thres_2,如果是,则在thres_1和thres_2之间,根据较低分图片的质量分,线性衰减二者之间的相似度,处理完毕后得到调整后的相似度矩阵D,其中,thres_1<thres_2,基于调整后的相似度矩阵对n张人脸图像进行初次聚类得到初次聚类结果,其中n≥2;
划分步骤,在初次聚类得到的初次聚类结果中,选出聚类簇中的最佳代表元rep,并根据每个聚类簇中的图像数量分为离散簇和聚集簇,包括:选出每一个初始聚类簇内质量分数大于阈值thres_2的所有m个人脸图像,如果m=0或m=2,将该每一个初始聚类簇内质量分数最高的图片设为代表元rep,否则,判断m>=1且m≠2是否成立,如果是,则计算m个人脸图像的特征的平均作为该初始聚类簇的类中心,随后计算m个样本与类中心的余弦相似度,相似度最高的图片成为代表元rep;再根据每一个初始聚类簇内的人脸图像数量,将初始聚类簇进行划分,如果一个初始聚类簇内的人脸图像数大于1则为聚集簇,如果初始聚类簇内的人脸图像数为1的则为离散簇;
二次聚类步骤,利用并查集算法先将满足条件的离散簇合并至聚集簇,再进行聚集簇之间的合并,得到二次聚类后的人脸图像,所述二次聚类步骤的操作为:使用代表元的特征和质量分代表聚类簇,分别计算离散簇与聚集簇之间的相似度D1, 聚集簇之间的相似度D2,相似度计算和调整方式与初次聚类相同;离散簇与聚集簇间进行二次聚类,对相似度D1> eps2_less的部分,使用并查集方法进行簇间合并;聚集簇间进行二次聚类,对聚集簇进行的簇间合并使用不同的相似度阈值,对样本数量多的簇,适当降低其相似度阈值,聚集簇i与聚集簇j的合并阈值按下式计算:
式中C ij为簇i和簇j包含人脸图像数量的乘积。
2.根据权利要求1所述的方法,其特征在于,所述基于调整后的相似度矩阵对n张人脸图像进行初次聚类得到初次聚类结果的操作为:设定初次聚类的余弦相似度阈值eps1;根据调整后的相似度矩阵D找到所有人脸图像的邻居neighbors,即与目标人脸图像相似度大于eps_1的即判定为它的邻居;如果一张人脸图像的邻居数量>=2,则认为该人脸图像为核心点core_samples;根据neighbors和core_samples对所有人脸图像进行连通计算,得到所述初次聚类结果。
3.一种无监督的人脸图像二次聚类装置,其特征在于,该装置包括:
初次聚类单元,对获取的n张人脸图像计算相似度矩阵和图像质量分数,并基于图像质量分数对相似度矩阵进行调整,基于调整后的相似度矩阵对n张人脸图像进行初次聚类得到初次聚类结果,其中n≥2;所述对获取的n张人脸图像计算相似度矩阵和图像质量分数,并基于图像质量分数对相似度矩阵进行调整的操作为:使用卷积神经网络获取n张人脸图像的高维人脸归一化特征向量emb,并计算每一人脸图像的表示人脸特征质量的图像质量分数dp_score;计算n张人脸图像的1: n的余弦相似度并排序得到前top_k个相似度矩阵D,其中,D为n×top_k的矩阵;根据每一人脸图像的图像质量分数dp_score调整相似度矩阵D:如果两张人脸图像中任意一张的质量分dp_score小于第一阈值thres_1,则将它们之间的相似度置为0,如果否,则判断两张人脸图像的质量分dp_score是否都小于第二阈值thres_2,如果是,则在thres_1和thres_2之间,根据较低分图片的质量分,线性衰减二者之间的相似度,处理完毕后得到调整后的相似度矩阵D,其中,thres_1<thres_2;
划分单元,在初次聚类得到的初次聚类结果中,选出聚类簇中的最佳代表元rep,并根据每个聚类簇中的图像数量分为离散簇和聚集簇;包括:选出每一个初始聚类簇内质量分数大于阈值thres_2的所有m个人脸图像,如果m=0或m=2,将该每一个初始聚类簇内质量分数最高的图片设为代表元rep,否则,判断m>=1且m≠2是否成立,如果是,则计算m个人脸图像的特征的平均作为该初始聚类簇的类中心,随后计算m个样本与类中心的余弦相似度,相似度最高的图片成为代表元rep;再根据每一个初始聚类簇内的人脸图像数量,将初始聚类簇进行划分,如果一个初始聚类簇内的人脸图像数大于1则为聚集簇,如果初始聚类簇内的人脸图像数为1的则为离散簇;
二次聚类单元,利用并查集算法先将满足条件的离散簇合并至聚集簇,再进行聚集簇之间的合并,得到二次聚类后的人脸图像,所述二次聚类单元执行的操作为:使用代表元的特征和质量分代表聚类簇,分别计算离散簇与聚集簇之间的相似度D1, 聚集簇之间的相似度D2,相似度计算和调整方式与初次聚类相同;离散簇与聚集簇间进行二次聚类,对相似度D1 > eps2_less的部分,使用并查集方法进行簇间合并;聚集簇间进行二次聚类,对聚集簇进行的簇间合并使用不同的相似度阈值,对样本数量多的簇,适当降低其相似度阈值,聚集簇i与聚集簇j的合并阈值按下式计算:
式中C ij为簇i和簇j包含人脸图像数量的乘积。
4.根据权利要求3所述的装置,其特征在于,所述基于调整后的相似度矩阵对n张人脸图像进行初次聚类得到初次聚类结果的操作为:设定初次聚类的余弦相似度阈值eps1;根据调整后的相似度矩阵D找到所有人脸图像的邻居neighbors,即与目标人脸图像相似度大于eps_1的即判定为它的邻居;如果一张人脸图像的邻居数量>=2,则认为该人脸图像为核心点core_samples;根据neighbors和core_samples对所有人脸图像进行连通计算,得到所述初次聚类结果。
5.一种计算机存储介质,其特征在于,所述计算机存储介质上存储有计算机程序,当所述计算机程序被处理器执行时以实现权利要求1-2任一项的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111300505.6A CN113920353B (zh) | 2021-11-04 | 2021-11-04 | 一种无监督的人脸图像二次聚类方法、装置、介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111300505.6A CN113920353B (zh) | 2021-11-04 | 2021-11-04 | 一种无监督的人脸图像二次聚类方法、装置、介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113920353A CN113920353A (zh) | 2022-01-11 |
CN113920353B true CN113920353B (zh) | 2022-07-29 |
Family
ID=79245236
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111300505.6A Active CN113920353B (zh) | 2021-11-04 | 2021-11-04 | 一种无监督的人脸图像二次聚类方法、装置、介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113920353B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114492678A (zh) * | 2022-04-13 | 2022-05-13 | 深圳前海中电慧安科技有限公司 | 一种人像聚类建档方法、装置、设备及存储介质 |
CN118629024A (zh) * | 2024-08-09 | 2024-09-10 | 深圳爱莫科技有限公司 | 一种卷烟库存的人工智能识别方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8724910B1 (en) * | 2010-08-31 | 2014-05-13 | Google Inc. | Selection of representative images |
CN110069989A (zh) * | 2019-03-15 | 2019-07-30 | 上海拍拍贷金融信息服务有限公司 | 人脸图像处理方法及装置、计算机可读存储介质 |
CN110889433A (zh) * | 2019-10-29 | 2020-03-17 | 平安科技(深圳)有限公司 | 人脸聚类方法、装置、计算机设备及存储介质 |
CN112016623A (zh) * | 2020-08-28 | 2020-12-01 | 佳都新太科技股份有限公司 | 一种人脸聚类方法、装置、设备及存储介质 |
CN113052245A (zh) * | 2021-03-30 | 2021-06-29 | 重庆紫光华山智安科技有限公司 | 图像聚类方法和装置、电子设备及存储介质 |
-
2021
- 2021-11-04 CN CN202111300505.6A patent/CN113920353B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8724910B1 (en) * | 2010-08-31 | 2014-05-13 | Google Inc. | Selection of representative images |
CN110069989A (zh) * | 2019-03-15 | 2019-07-30 | 上海拍拍贷金融信息服务有限公司 | 人脸图像处理方法及装置、计算机可读存储介质 |
CN110889433A (zh) * | 2019-10-29 | 2020-03-17 | 平安科技(深圳)有限公司 | 人脸聚类方法、装置、计算机设备及存储介质 |
CN112016623A (zh) * | 2020-08-28 | 2020-12-01 | 佳都新太科技股份有限公司 | 一种人脸聚类方法、装置、设备及存储介质 |
CN113052245A (zh) * | 2021-03-30 | 2021-06-29 | 重庆紫光华山智安科技有限公司 | 图像聚类方法和装置、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN113920353A (zh) | 2022-01-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113920353B (zh) | 一种无监督的人脸图像二次聚类方法、装置、介质 | |
US8880566B2 (en) | Assembler and method thereof for generating a complex signature of an input multimedia data element | |
CN107871103B (zh) | 一种人脸认证方法和装置 | |
CN108647571B (zh) | 视频动作分类模型训练方法、装置及视频动作分类方法 | |
CN111738120B (zh) | 人物识别方法、装置、电子设备及存储介质 | |
CN111783681B (zh) | 大规模人脸库识别方法、系统、计算机设备及存储介质 | |
CN113052245B (zh) | 图像聚类方法和装置、电子设备及存储介质 | |
CN112163637B (zh) | 基于非平衡数据的图像分类模型训练方法、装置 | |
CN112948612A (zh) | 人体封面生成方法、装置、电子设备及存储介质 | |
CN112132279A (zh) | 卷积神经网络模型压缩方法、装置、设备及存储介质 | |
CN111985360A (zh) | 一种人脸识别的方法、装置、设备和介质 | |
CN113963303A (zh) | 图像处理方法、视频识别方法、装置、设备及存储介质 | |
CN112949751A (zh) | 车辆图像聚类及轨迹还原方法 | |
CN111091106A (zh) | 图像聚类方法及装置、存储介质、电子装置 | |
CN113378658A (zh) | 车辆数据聚类方法以及车辆轨迹还原方法 | |
CN113947800A (zh) | 一种基于时空碰撞的人脸置信方法、系统、设备和介质 | |
CN114519863A (zh) | 人体重识别方法、人体重识别装置、计算机设备及介质 | |
CN113569920A (zh) | 基于自动编码的第二近邻异常检测方法 | |
CN113408332A (zh) | 视频分镜方法、装置、设备及计算机可读存储介质 | |
CN113128278B (zh) | 一种图像识别方法及装置 | |
WO2023125839A1 (zh) | 人脸数据的归档方法及相关设备 | |
CN113988148A (zh) | 一种数据聚类的方法、系统、计算机设备和存储介质 | |
CN113743533B (zh) | 一种图片聚类方法、装置及存储介质 | |
CN113807319B (zh) | 人脸识别优化方法、装置、设备和介质 | |
CN112257666B (zh) | 目标图像内容的聚合方法、装置、设备及可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |