CN109447186A - 聚类方法及相关产品 - Google Patents
聚类方法及相关产品 Download PDFInfo
- Publication number
- CN109447186A CN109447186A CN201811527251.XA CN201811527251A CN109447186A CN 109447186 A CN109447186 A CN 109447186A CN 201811527251 A CN201811527251 A CN 201811527251A CN 109447186 A CN109447186 A CN 109447186A
- Authority
- CN
- China
- Prior art keywords
- cluster
- data
- class
- data set
- clusters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Abstract
本申请实施例公开了一种聚类方法及相关产品,其中方法包括:获取包含同种类型数据的第一数据集;按照第一聚类算法和第一相似度阈值对第一数据集进行第一次聚类,并获得第一聚类结果,第一聚类结果中包含多个第一类簇;从多个第一类簇中的每个类簇中挑选一个质量最好的数据作为代表数据,组成第二数据集;按照第一聚类算法对第二数据集进行第二次聚类,获得第二聚类结果;结合第一聚类结果和第二聚类结果,确定第一数据集的最终聚类结果。本申请实施例通过第一次聚类提升了类内精确率高,通过第二次聚类降低了类间误聚率。整个聚类过程提升了聚类的精确率和有效率。
Description
技术领域
本申请涉及数据处理技术领域,具体涉及一种聚类方法及相关产品。
背景技术
在数据处理的过程中,很多时候都需要进行聚类,获得多个类簇,同一个类簇中的数据相似度高,不同类簇间的数据相似度低。但是在这个过程中,存在着类内精确率和类间误聚率的矛盾,类内精确率是指类簇中正确分类的数据量占该类簇中总数据量的比值,内类精确率越高越好,类间误聚率是指类簇中重复类别的数据量占总类簇数量的比值,类间误聚率越低越好。如何使得聚类结果同时满足类内精确率和内间误聚率的需求,是一个亟待解决的问题。
发明内容
本申请实施例提供了一种聚类方法及相关产品,以期通过二次聚类,使得聚类结果同时满足类内精确率和内间误聚率的需求。
第一方面,本申请实施例提供一种聚类方法,所述方法包括:
获取包含同种类型数据的第一数据集;
按照第一聚类算法和第一相似度阈值对所述第一数据集进行第一次聚类,并获得第一聚类结果,所述第一聚类结果中包含多个第一类簇;
从所述多个第一类簇中的每个类簇中挑选一个质量最好的数据作为代表数据,组成第二数据集;
按照所述第一聚类算法对所述第二数据集进行第二次聚类,获得第二聚类结果;
结合所述第一聚类结果和所述第二聚类结果,确定所述第一数据集的最终聚类结果。
可选情况下,所述按照第一聚类算法对所述第一数据集进行第一次聚类,包括:
S21:获取第一数据集中的第一个数据作为基准数据;
S22:计算所述第一数据集中除了所述基准数据之外的剩余数据与所述基准数据之间的相似度,并将所述基准数据、以及与所述基准数据之间的相似度大于第一相似度阈值的数据划分到同一个类簇中;
S23:将所述第一数据集中剩余的未划分到类簇中的数据作为新的第一数据集,重复步骤S21和S22,直到第一数据集中的所有数据全部划分到类簇中,得到所述多个第一类簇。
可选情况下,所述第二聚类结果中包括多个第二类簇,所述多个为N个,N为大于1的整数,所述多个第二类簇中的每个第二类簇中包括一个或多个所述代表数据,所述结合所述第一聚类结果和所述第二聚类结果,确定所述第一数据集的最终聚类结果,包括:
S41、获取所述多个第二类簇中的第i个第二类簇,i为正整数;
S42、确定所述第i个第二类簇中的所有代表数据对应的所有第一类簇,并将所述所有第一类簇中的数据放置到同一个第三类簇中;
S43、赋值i=i+1,执行步骤S41和S42,直到遍历完所述多个第二类簇,得到多个第三类簇,即为最终聚类结果,i小于或等于N-1。
可选情况下,在所述从所述多个第一类簇中的每个类簇中挑选一个质量最好的数据作为代表数据之前,所述方法还包括:
获取所述第一数据集中每个数据对应的属性值;
根据所述属性值确定所述第一数据集中每一个数据的质量高低。
可选情况下,所述获取所述第一数据集中每个数据对应的属性值,包括:
S51:确定所述第一数据集中第j个数据被划分到的目标第一类簇,所述第一数据集中包含M个数据,j≤M;
S52:获取所述第j个数据与所述目标第一类簇中除第j个数据之外的每个数据之间的簇内相似度;
S53:对所述第j个数据对应的全部所述簇内相似度求和,获得第j个相似度和;
S54:将所述第j个相似度和作为所述第j个数据的属性值;
S55:重复步骤S51-S54,直到确定所述第一数据集中每个数据对应的属性值。
可选情况下,所述获取包含同种类型数据的第一数据集包括:
获取指定时间段由指定区域内的多个摄像头拍摄的视频集,得到多个视频集;
对所述多个视频集中每一视频集进行视频解析,得到多张视频图像;
对所述多张视频图像中每一张视频图像进行图像分割,得到多个人脸图像;
确定所述多个人脸图像的人脸角度,得到多个角度值;
从所述多个角度值中选取角度值处于预设角度范围的角度值,并确定其对应的多个目标人脸图像;
对所述多个目标人脸图像中每一目标人脸图像进行图像质量评价,得到多个图像质量评价值;
将所述多个图像质量评价值中大于预设质量评价阈值的图像质量评价值对应的目标人脸图像作为所述第一数据集。
第二方面,本申请提供一种聚类装置,所述聚类装置包括:
获取单元,用于获取包含同种类型数据的第一数据集;
第一聚类单元,按照第一聚类算法和第一相似度阈值对所述第一数据集进行第一次聚类,并获得第一聚类结果,所述第一聚类结果中包含多个第一类簇;
第二聚类单元,用于从所述多个第一类簇中的每个类簇中挑选一个质量最好的数据作为代表数据,组成第二数据集;按照第一聚类算法对所述第二数据集进行第二次聚类,获得第二聚类结果,所述第二聚类结果中包括多个第二类簇,所述多个第二类簇中的每个第二类簇中包括一个或多个所述代表数据;
结合单元,用于结合所述第一聚类结果和所述第二聚类结果,确定所述第一数据集的最终聚类结果。
第三方面,本申请实施例提供一种电子装置,包括处理器、存储器、通信接口,以及一个或多个程序,所述一个或多个程序被存储在所述存储器中,并且被配置由所述处理器执行,所述程序包括用于执行第一方面任一方法中的步骤的指令。
第四方面,本申请实施例提供了一种计算机可读存储介质,存储用于电子数据交换的计算机程序,其中,所述计算机程序使得计算机执行第一方面任一方法所述的步骤的指令。
第五方面,本申请实施例提供了一种计算机程序产品,其中,上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,上述计算机程序可操作来使计算机执行如本申请实施例第一方面任一方法中所描述的部分或全部步骤。该计算机程序产品可以为一个软件安装包。
可以看出,本申请实施例中,首先获取需要进行聚类的第一数据集,然后按照第一聚类算法对第一数据集进行第一次聚类,获得第一聚类结果,第一聚类结果中包括多个第一类簇;然后从多个第一类簇中的每个类簇中挑选一个质量最好的数据作为代表数据,组成第二数据集;按照第一聚类算法对第二数据集进行第二次聚类,获得第二聚类结果;最后结合第一聚类结果和第二聚类结果,确定第一数据集的最终聚类结果。在这个过程中,通过第一次聚类获得类内相似度大于第一相似度阈值的多个第一类簇,因为第一相似度阈值是一个较大的值,因此第一次聚类提升了类内精确率高;然后从第一类簇中的每个类簇中挑选一个质量最好的数据作为代表数据进行二次聚类,降低了类间误聚率。整个聚类过程提升了聚类的精确率和有效率。
附图说明
下面将对本申请实施例所涉及到的附图作简单地介绍。
图1A是本申请实施例提供的一种聚类方法流程示意图;
图1B是本申请实施例提供的一种第一次聚类过程示意图;
图1C是本申请实施例提供的一种第二次聚类过程示意图;
图1D是本申请实施例提供的一种获取最终聚类结果的示意图;
图2是申请实施例提供的另一种聚类方法流程示意图;
图3是本申请实施例提供的另一种聚类方法流程示意图;
图4是本申请实施例提供的一种电子装置的结构示意图;
图5是是本申请实施例公开的一种聚类装置的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
下面对本申请实施例进行详细介绍。
请参阅图1A,图1A为本申请实施例提供的一种聚类方法流程示意图,如图1A所示,所述聚类方法的步骤如下:
101、获取包含同种类型数据的第一数据集。
数据集是多个数据的集合,同一个类型的数据组成的集合可以用于进行分类或聚类,例如同为图像数据、地点数据或人物特征数据等。并且数据可以是一维数据,也可以是多维数据,可以是数据值型数据,也可以是字符型数据。
可选的,所述获取包含同种类型数据的第一数据集包括:
A1:获取指定时间段由指定区域内的多个摄像头拍摄的视频集,得到多个视频集;
A2:对所述多个视频集中每一视频集进行视频解析,得到多张视频图像;
A3:所述多张视频图像中每一张视频图像进行图像分割,得到多个人脸图像;
A4:确定所述多个人脸图像的人脸角度,得到多个角度值;
A5:从所述多个角度值中选取角度值处于预设角度范围的角度值,并确定其对应的多个目标人脸图像;
A6:对所述多个目标人脸图像中每一目标人脸图像进行图像质量评价,得到多个图像质量评价值;
A7:将所述多个图像质量评价值中大于预设质量评价阈值的图像质量评价值对应的目标人脸图像作为所述第一数据集。
具体地,第一数据集中的数据为人脸图像,人脸图像可通过监控视频获取。指定时间段可以是同一天中的早上6:00~12:00,或者是同一天的00:00~23:59,也可以是同一星期内的周一00:~周日23:59,由同一个区域内的多个监控摄像头拍摄的多个视频集,然后对多个视频集中的每个视频集进行解析,获得多张视频图像。视频图像中有干扰信息,对干扰信息进行处理,并对图像进行分割,得到人脸图像。因为监控摄像头与人站立的位置关系不同,因此获得的人脸图像中的人脸角度也有所不同,将人的正脸与摄像头正对时设置人脸角度为0°,人的后脑勺与摄像头正对时设置人脸角度为180°,左脸和右脸与摄像头的相对位置都处于0°~180°之间,且不对左右脸进行区分,即左脸与摄像头的相对位置为R°,或者右脸与摄像头的相对位置为R°,都记录为人脸角度为R°。当人脸角度越大时,人脸图像中得到的人脸信息越少,当人脸角度大于180度时,无法获得人脸信息,因此,设置预设角度范围为小于180°的目标人脸图像,并对目标人脸图像进行图像质量评价,并选择图像质量评价值大于预设质量评价阈值的图像质量评价对应的目标人脸图像作为第一数据集。
在对人脸图像进行图像质量评价时,图像质量评价指标可包括但不仅限于:平均灰度、均方差、熵、边缘保持度、信噪比等等。可定义为得到的图像质量评价值越大,则图像质量越好。
需要说明的是,由于采用单一评价指标对图像质量进行评价时,具有一定的局限性,因此,可采用多个图像质量评价指标对图像质量进行评价,当然,对图像质量进行评价时,并非图像质量评价指标越多越好,因为图像质量评价指标越多,图像质量评价过程的计算复杂度越高,也不见得图像质量评价效果越好,因此,在对图像质量评价要求较高的情况下,可采用2~10个图像质量评价指标对图像质量进行评价。具体地,选取图像质量评价指标的个数及哪个指标,依据具体实现情况而定。当然,也得结合具体地场景选取图像质量评价指标,在暗环境下进行图像质量评价和亮环境下进行图像质量评价选取的图像质量指标可不一样。
可选地,在对图像质量评价精度要求不高的情况下,可用一个图像质量评价指标进行评价,例如,以熵对待处理图像进行图像质量评价值,可认为熵越大,则说明图像质量越好,相反地,熵越小,则说明图像质量越差。
可选地,在对图像质量评价精度要求较高的情况下,可以采用多个图像质量评价指标对待评价图像进行评价,在多个图像质量评价指标对待评价图像进行图像质量评价时,可设置该多个图像质量评价指标中每一图像质量评价指标的权重,可得到多个图像质量评价值,根据该多个图像质量评价值及其对应的权重可得到最终的图像质量评价值,例如,三个图像质量评价指标分别为:A指标、B指标和C指标,A的权重为a1,B的权重为a2,C的权重为a3,采用A、B和C对某一图像进行图像质量评价时,A对应的图像质量评价值为b1,B对应的图像质量评价值为b2,C对应的图像质量评价值为b3,那么,最后的图像质量评价值=a1b1+a2b2+a3b3。通常情况下,图像质量评价值越大,说明图像质量越好。
可见,在本申请实施例中,通过采集视频集,并对视频集进行处理获得人脸图像,对人脸图像进行角度处理和图像质量评价,得到图像质量评价值高的人脸图像作为第一数据集,可以提升本聚类算法的针对性,而对人脸图像进行图像质量评价,能够筛选出图像质量评价值高的人脸图像用于聚类,提升了聚类的有效性和准确率。
102、按照第一聚类算法和第一相似度阈值对所述第一数据集进行第一次聚类,并获得第一聚类结果,所述第一聚类结果中包含多个第一类簇。
具体地,按照第一聚类算法对第一数据集聚类,在聚类的过程中,将大于或等于第一相似度阈值的数据聚类到同一个类簇中,获得第一聚类结果。
可选的,所述按照第一聚类算法对所述第一数据集进行第一次聚类,包括:
S21:获取第一数据集中的第一个数据作为基准数据;
S22:计算所述第一数据集中除了所述基准数据之外的剩余数据与所述基准数据之间的相似度,并将所述基准数据、以及与所述基准数据之间的相似度大于第一相似度阈值的数据划分到同一个类簇中;
S23:将所述第一数据集中剩余的未划分到类簇中的数据作为新的第一数据集,重复步骤S21和S22,直到第一数据集中的所有数据全部划分到类簇中,得到所述多个第一类簇。
假设第一数据集为T,其中包括的数据为{t1,t2,t3,t4,t5,t6,t7,t8,t9,t10,t11},首先顺序获取第一个数据即t1,作为基准数据,然后计算第一数据集中除了t1之外所有剩余数据与t1的相似度,然后将与t1的相似度大于第一相似度阈值的数据与t1划分到同一个类簇中。可选情况下,假设第一相似度阈值是一个很大的小数值或百分比值,例如0.9或80%等,这样可以提升聚类时的类内精确度。
请参阅图1B,图1B为本申请实施例提供的一种第一次聚类过程示意图,如图1B所示,在第一次聚类中,以a1为基准数据,进行聚类得到第一类簇T1,T1中包括{t1,t5,t6},然后将剩余的数据{t2,t3,t4,t7,t8,t9,t10,t11}作为新的第一数据集,以t2作为新的基准数据,重复上述聚类过程,得到第一类簇T2,T2中包括{t2,t3,t4,t9,t11}。继续聚类直到第一数据集中的所有数据全部被划分到类簇中,后续聚类还得到第一类簇T3和T4,T3中包括{t7,t8},T4中包括{t10}。
可选情况下,基准数据也可以从未聚类的数据集中随机获取。
103、从所述多个第一类簇中的每个类簇中挑选一个质量最好的数据作为代表数据,组成第二数据集。
具体地,经过第一次聚类后获得多个第一类簇,每一个第一类簇中包含一个或多个数据,由于在第一次聚类中,是以数据集中的第一个数据作为基准数据进行聚类的,这些数据的质量是不同的,以这些质量不同的数据作为基准数据进行聚类,可能存在类间误聚的情况,即相似度很高的数据可能被聚集到了不同的类簇中。那么从每个第一类簇中挑选一个质量最高的数据作为代表数据组成第二数据集,并进行第二次聚类,可以降低类间误聚率。
可选的,在所述从所述多个第一类簇中的每个类簇中挑选一个质量最好的数据作为代表数据之前,所述方法还包括:获取所述第一数据集中每个数据对应的属性值;根据所述属性值确定所述第一数据集中每一个数据的质量好坏。
为第一数据集中的每个数据设置属性值,然后根据属性值评价数据的质量好坏,可以是属性值越高,数据质量越好,属性值越低,数据质量越差。数据的属性值可以是数据本身的属性,例如针对图像数据,属性值可以是上述步骤101中描述的图像质量评价指标,包括平均灰度、均方差、熵、边缘保持度、信噪比等等;针对地点数据,属性值可以是精确度、维度等。属性值还可以是数据与数据之间的关联关系,例如数据与单个数据之间的相似度,数据与多个数据之间的相似度之和等。
可选的,所述获取所述第一数据集中每个数据对应的属性值,包括:
S51:确定所述第一数据集中第j个数据被划分到的目标第一类簇,所述第一数据集中包含M个数据,j≤M;
S52:获取所述第j个数据与所述目标第一类簇中除第j个数据之外的每个数据之间的簇内相似度;
S53:对所述第j个数据对应的全部所述簇内相似度求和,获得第j个相似度和;
S54:将所述第j个相似度和作为所述第j个数据的属性值;
S55:重复步骤S51-S54,直到确定所述第一数据集中每个数据对应的属性值。
如步骤102中所述,第一数据集中的数据t1被划分到目标第一类簇T1中,获取t1与T1中其他数据的簇内相似度,在获取簇内相似度的过程中,可以是实时计算并获取的,也可以是聚类过程中计算的相似度被保存到存储空间中,然后被直接获取的;T1中除了数据t1之外,还有t5和t6,分别获取t1与t5的相似度S15以及t1与t6的相似度S16,那么t1的属性值为:S1=S15+S16;同样地方法,可以计算获得第一数据集中其他数据的属性值。确定同一个第一类簇中属性值最大的数据作为质量最好的数据,获取该质量最好的数据作为代表数据,用于第二次聚类。
可见,在本申请实施例中,通过计算数据与它所在同一第一类簇中其他所有数据的相似度之和,确定该数据的属性值,进而根据属性值高低确定该数据的质量好坏,这样能够选取同一个类簇中与其他数据更相似,即更具有中心度的数据作为质量最好的数据,再以质量最好的数据作为代表数据,组成第二数据集,该数据集在减少了数据量的同时,最大可能地保证了数据集的代表性。
104、按照所述第一聚类算法对所述第二数据集进行第二次聚类,获得第二聚类结果。
具体地,请参阅图1C,图1C为本申请实施例提供的一种第二次聚类过程示意图,如图1C所示,如步骤102所述的第一数据集T,按照第一聚类算法进行聚类后,获得第一类簇T1,T2,T3,T4,从这四个第一类簇中的每个第一类簇中挑选出一个质量最好的代表数据,假设T1中挑选出t1,T2中挑选出t4,T3中挑选出t7,T4中挑选出t10,则第二数据集T’为{t1,t4,t7,t10},对第二数据集进行第二次聚类,挑选t1作为基准数据,计算t1与其他数据的相似度是否大于第二相似度阈值,第二相似度阈值可以与第一相似度阈值相同,也可以小于第二相似度阈值,降低相似度阈值能够有效降低类间误聚率。
在进行第二次聚类的过程中,由于t1在第一次聚类中已经被作为基准数据,因此如果第二相似度阈值与第一相似度阈值相同,那么第二次聚类时不会有数据与t1聚类到同一个第二类簇中,T1’中包括数据t1;然后以t4作为基准数据进行聚类,确定数据t10与t4聚类到同一个第二类簇中,T2’中包括数据t4和t10。剩下的数据t7生成第二类簇T3’。
本申请实施例中,按照第一聚类算法对第二数据集进行第二次聚类,能够将第一类簇中更具有代表性的数据用来进行第二次聚类,能够进一步提升类内精确度,同时有效降低类间误聚率,并且由于选取的是与第一次聚类结果的类簇个数相同的代表数据进行二次聚类,减少了聚类的时间消耗,提升了聚类效率。
105、结合所述第一聚类结果和所述第二聚类结果,确定所述第一数据集的最终聚类结果。
第一次聚类是对第一数据集中的所有数据进行的初次聚类,第二次聚类是对第一次聚类结果中的代表数据进行更加精确的第二次聚类,两次聚类结果结合,即可获得所有数据的精确聚类结果。
可选的,所述第二聚类结果中包括多个第二类簇,所述多个为N个,N为大于1的整数,所述多个第二类簇中的每个第二类簇中包括一个或多个所述代表数据,所述结合所述第一聚类结果和所述第二聚类结果,确定所述第一数据集的最终聚类结果,包括:
S41、获取所述多个第二类簇中的第i个第二类簇,i为正整数;
S42、确定所述第i个第二类簇中的所有代表数据对应的所有第一类簇,并将所述所有第一类簇中的数据放置到同一个第三类簇中;
S43、赋值i=i+1,执行步骤S41和S42,直到遍历完所述多个第二类簇,得到多个第三类簇,即为最终聚类结果,i小于或等于N-1。
请参阅图1D,图1D为本申请实施例提供的一种获取最终聚类结果的示意图,如图1D所示,第二聚类结果中包括T1’,T2’和T3’三个第二类簇,获取T1’,确定T1’中的所有代表数据对应的所有第一类簇,T1’中包括的代表数据为a1,而a1对应的第一类簇为T1,那么将T1放置到第一个第三类簇T11中;同理,获取T2’中所有的代表数据,包括t4和t10,t4对应的第一类簇为T2,t10对应的第一类簇为T4,将T2和T4放置到同一第三类簇T22中;剩余的T3’中的代表数据对应第一类簇为T3,将T3的数据放置到T33中,完成第二类簇的遍历,获得最终聚类结果。
可见,在本申请实施例中,通过遍历多个第二类簇中的每个第二类簇,确定每个第二类簇中的代表数据对应的第一类簇,然后将处于同一个第二类簇的代表数据对应的第一类簇中的数据放置到同一个第三类簇中,这个过程将原本属于同一个类别,但因为第一次聚类没有选择质量最好的数据而造成的类间误聚使得同一各类别的数据误被聚类到两个不同类别的情况被解决,降低了类间误聚率,提升了聚类准确率。
上述步骤101-105所涉及的实施例中,首先获取需要进行聚类的第一数据集,然后按照第一聚类算法对第一数据集进行第一次聚类,获得第一聚类结果,第一聚类结果中包括多个第一类簇;然后从多个第一类簇中的每个类簇中挑选一个质量最好的数据作为代表数据,组成第二数据集;按照第一聚类算法对第二数据集进行第二次聚类,获得第二聚类结果;最后结合第一聚类结果和第二聚类结果,确定第一数据集的最终聚类结果。在这个过程中,通过第一次聚类获得类内相似度大于第一相似度阈值的多个第一类簇,因为第一相似度阈值是一个较大的值,因此第一次聚类提升了类内精确率高;然后从第一类簇中的每个类簇中挑选一个质量最好的数据作为代表数据进行二次聚类,降低了类间误聚率。整个聚类过程提升了聚类的精确率和有效率。
请参阅图2,图2为本申请实施例提供的另一种聚类方法流程示意图,如图2所示,该方法包括如下步骤:
201、获取指定时间段由指定区域内的多个摄像头拍摄的视频集,得到多个视频集;
202、对所述多个视频集中每一视频集进行视频解析,得到多张视频图像;
203、对所述多张视频图像中每一张视频图像进行图像分割,得到多个人脸图像;
204、确定所述多个人脸图像的人脸角度,得到多个角度值;
205、从所述多个角度值中选取角度值处于预设角度范围的角度值,并确定其对应的多个目标人脸图像;
206、对所述多个目标人脸图像中每一目标人脸图像进行图像质量评价,得到多个图像质量评价值;
207、将所述多个图像质量评价值中大于预设质量评价阈值的图像质量评价值对应的目标人脸图像作为所述第一数据集;
208、按照第一聚类算法和第一相似度阈值对所述第一数据集进行第一次聚类,并获得第一聚类结果,所述第一聚类结果中包含多个第一类簇;
209、获取所述第一数据集中每个数据对应的属性值,并根据所述属性值确定所述第一数据集中每一个数据的质量好坏;
210、从所述多个第一类簇中的每个类簇中挑选一个质量最好的数据作为代表数据,组成第二数据集;
211、按照所述第一聚类算法对所述第二数据集进行第二次聚类,获得第二聚类结果;
212、结合所述第一聚类结果和所述第二聚类结果,确定所述第一数据集的最终聚类结果。
其中,上述步骤201-步骤212的具体描述可以参照图步骤101-步骤105所描述的聚类方法的相应描述,在此不再赘述。
可见,在申请实施例中,通过采集视频集,并对视频集进行处理获得人脸图像,对人脸图像进行角度处理和图像质量评价,得到图像质量评价值高的人脸图像作为第一数据集,可以提升聚类算法的针对性,而对人脸图像进行图像质量评价,能够筛选出图像质量评价值高的人脸图像用于聚类;在完成第一次聚类后,通过计算数据与它所在同一第一类簇中其他所有数据的相似度之和,确定该数据的属性值,进而根据属性值高低确定该数据的质量好坏,这样能够选取同一个类簇中与其他数据更相似,即更具有中心度的数据作为质量最好的数据,再以质量最好的数据作为代表数据,组成第二数据集,该数据集在减少了数据量的同时,最大可能地保证了数据集的代表性,进而提升了聚类的有效性和准确率。
请参阅图3,图3为本申请实施例提供的另一种聚类方法流程示意图,如图3所示,本申请实施例包括如下步骤:
301、获取包含同种类型数据的第一数据集;
302、获取第一数据集中的第一个数据作为基准数据;
303、计算所述第一数据集中除了所述基准数据之外的剩余数据与所述基准数据之间的相似度,并将所述基准数据、以及与所述基准数据之间的相似度大于第一相似度阈值的数据划分到同一个类簇中;
304、将所述第一数据集中剩余的未划分到类簇中的数据作为新的第一数据集,重复步骤302和303,直到第一数据集中的所有数据全部划分到类簇中,得到所述多个第一类簇;
305、从所述多个第一类簇中的每个类簇中挑选一个质量最好的数据作为代表数据,组成第二数据集;
306、按照所述第一聚类算法对所述第二数据集进行第二次聚类,获得第二聚类结果,所述第二聚类结果中包括多个第二类簇,所述多个为N个,N为大于1的整数;
307、获取所述多个第二类簇中的第i个第二类簇,i为正整数;
308、确定所述第i个第二类簇中的所有代表数据对应的所有第一类簇,并将所述所有第一类簇中的数据放置到同一个第三类簇中;
309、赋值i=i+1,执行步骤307和308,直到遍历完所述多个第二类簇,得到多个第三类簇,即为最终聚类结果,i小于或等于N-1。
其中,上述步骤301-步骤309的具体描述可以参照图步骤101-步骤105所描述的聚类方法的相应描述,在此不再赘述。
可见,在本申请实施例中,采用第一聚类算法对第一数据集进行聚类,因为第一基准数据为数据集中的第一个数据,获取方法简单,提升了聚类效率,设置的第一相似度阈值为一个较大的值,提升了类内精确度。然后按照第一聚类算法对第二数据集进行第二次聚类,将第一类簇中更具有代表性的数据用来进行第二次聚类,能够进一步提升类内精确度,同时有效降低类间误聚率,并且由于选取的是与第一次聚类结果的类簇个数相同的代表数据进行二次聚类,减少了聚类的时间消耗,提升了聚类效率。最后将第一聚类结果和第二聚类结果进行结合,获得最终聚类结果,使最终聚类结果覆盖了所有数据,且保证了高可靠性,进一步提升了聚类的准确率和有效率。
请参阅图4,图4为本申请实施例提供的一种电子装置的结构示意图,如图4所示,该电子装置包括处理器、存储器、通信接口,以及一个或多个程序,其中,上述一个或多个程序被存储在上述存储器中,并且被配置由上述处理器执行,上述程序包括用于执行以下步骤的指令:
获取包含同种类型数据的第一数据集;
按照第一聚类算法和第一相似度阈值对所述第一数据集进行第一次聚类,并获得第一聚类结果,所述第一聚类结果中包含多个第一类簇;
从所述多个第一类簇中的每个类簇中挑选一个质量最好的数据作为代表数据,组成第二数据集;
按照所述第一聚类算法对所述第二数据集进行第二次聚类,获得第二聚类结果;
结合所述第一聚类结果和所述第二聚类结果,确定所述第一数据集的最终聚类结果。
可见,该电子装置首先获取需要进行聚类的第一数据集,然后按照第一聚类算法对第一数据集进行第一次聚类,获得第一聚类结果,第一聚类结果中包括多个第一类簇;然后从多个第一类簇中的每个类簇中挑选一个质量最好的数据作为代表数据,组成第二数据集;按照第一聚类算法对第二数据集进行第二次聚类,获得第二聚类结果;最后结合第一聚类结果和第二聚类结果,确定第一数据集的最终聚类结果。在这个过程中,通过第一次聚类获得类内相似度大于第一相似度阈值的多个第一类簇,因为第一相似度阈值是一个较大的值,因此第一次聚类提升了类内精确率高;然后从第一类簇中的每个类簇中挑选一个质量最好的数据作为代表数据进行二次聚类,降低了类间误聚率。整个聚类过程提升了聚类的精确率和有效率。
在一个可能的示例中,所述按照第一聚类算法对所述第一数据集进行第一次聚类,包括:
S21:获取第一数据集中的第一个数据作为基准数据;
S22:计算所述第一数据集中除了所述基准数据之外的剩余数据与所述基准数据之间的相似度,并将所述基准数据、以及与所述基准数据之间的相似度大于第一相似度阈值的数据划分到同一个类簇中;
S23:将所述第一数据集中剩余的未划分到类簇中的数据作为新的第一数据集,重复步骤S21和S22,直到第一数据集中的所有数据全部划分到类簇中,得到所述多个第一类簇。
在一个可能的示例中,所述第二聚类结果中包括多个第二类簇,所述多个为N个,N为大于1的整数,所述多个第二类簇中的每个第二类簇中包括一个或多个所述代表数据,所述结合所述第一聚类结果和所述第二聚类结果,确定所述第一数据集的最终聚类结果,包括:
S41、获取所述多个第二类簇中的第i个第二类簇,i为正整数;
S42、确定所述第i个第二类簇中的所有代表数据对应的所有第一类簇,并将所述所有第一类簇中的数据放置到同一个第三类簇中;
S43、赋值i=i+1,执行步骤S41和S42,直到遍历完所述多个第二类簇,得到多个第三类簇,即为最终聚类结果,i小于或等于N-1。
在一个可能的示例中,在所述从所述多个第一类簇中的每个类簇中挑选一个质量最好的数据作为代表数据之前,所述方法还包括:
获取所述第一数据集中每个数据对应的属性值;
根据所述属性值确定所述第一数据集中每一个数据的质量好坏。
在一个可能的示例中,所述获取包含同种类型数据的第一数据集包括:
获取指定时间段由指定区域内的多个摄像头拍摄的视频集,得到多个视频集;
对所述多个视频集中每一视频集进行视频解析,得到多张视频图像;
对所述多张视频图像中每一张视频图像进行图像分割,得到多个人脸图像;
确定所述多个人脸图像的人脸角度,得到多个角度值;
从所述多个角度值中选取角度值处于预设角度范围的角度值,并确定其对应的多个目标人脸图像;
对所述多个目标人脸图像中每一目标人脸图像进行图像质量评价,得到多个图像质量评价值;
将所述多个图像质量评价值中大于预设质量评价阈值的图像质量评价值对应的目标人脸图像作为所述第一数据集。
本申请实施例可以根据上述方法示例对电子装置进行功能单元的划分,例如,可以对应各个功能划分各个功能单元,也可以将两个或两个以上的功能集成在一个处理单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。需要说明的是,本申请实施例中对单元的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
请参阅图5,图5是本申请实施例公开的一种聚类装置的结构示意图,如图5所示,该聚类装置500包括:
获取单元501,用于获取包含同种类型数据的第一数据集;
第一聚类单元502,按照第一聚类算法和第一相似度阈值对所述第一数据集进行第一次聚类,并获得第一聚类结果,所述第一聚类结果中包含多个第一类簇,所述第一相似度阈值大于第一预设值;
第二聚类单元503,用于从所述多个第一类簇中的每个类簇中挑选一个质量最好的数据作为代表数据,组成第二数据集;按照所述第一聚类算法对所述第二数据集进行第二次聚类,获得第二聚类结果,所述第二聚类结果中包括多个第二类簇,所述多个第二类簇中的每个第二类簇中包括一个或多个所述代表数据;
结合单元504,用于结合所述第一聚类结果和所述第二聚类结果,确定所述第一数据集的最终聚类结果。
可见,该聚类装置首先获取需要进行聚类的第一数据集,然后按照第一聚类算法对第一数据集进行第一次聚类,获得第一聚类结果,第一聚类结果中包括多个第一类簇;然后从多个第一类簇中的每个类簇中挑选一个质量最好的数据作为代表数据,组成第二数据集;按照第一聚类算法对第二数据集进行第二次聚类,获得第二聚类结果;最后结合第一聚类结果和第二聚类结果,确定第一数据集的最终聚类结果。在这个过程中,通过第一次聚类获得类内相似度大于第一相似度阈值的多个第一类簇,因为第一相似度阈值是一个较大的值,因此第一次聚类提升了类内精确率高;然后从第一类簇中的每个类簇中挑选一个质量最好的数据作为代表数据进行二次聚类,降低了类间误聚率。整个聚类过程提升了聚类的精确率和有效率。
其中,上述获取单元501可用于实现上述步骤101所描述的方法,第一聚类单元502可用于实现上述步骤102所描述的方法,上述第二聚类503可用于实现上述步骤103和步骤104所描述的方法,上述结合单元504可用于实现上述步骤105所描述的方法,以下如此类推。
在一个可能的示例中,所述第一聚类单元502具体用于:
S21:获取第一数据集中的第一个数据作为基准数据;
S22:计算所述第一数据集中除了所述基准数据之外的剩余数据与所述基准数据之间的相似度,并将所述基准数据、以及与所述基准数据之间的相似度大于第一相似度阈值的数据划分到同一个类簇中;
S23:将所述第一数据集中剩余的未划分到类簇中的数据作为新的第一数据集,重复步骤S21和S22,直到第一数据集中的所有数据全部划分到类簇中,得到所述多个第一类簇。
在一个可能的示例中,所述第二聚类结果中包括多个第二类簇,所述多个为N个,N为大于1的整数,所述多个第二类簇中的每个第二类簇中包括一个或多个所述代表数据,所述第二聚类单元503具体用于:
S41、获取所述多个第二类簇中的第i个第二类簇,i为正整数;
S42、确定所述第i个第二类簇中的所有代表数据对应的所有第一类簇,并将所述所有第一类簇中的数据放置到同一个第三类簇中;
S43、赋值i=i+1,执行步骤S41和S42,直到遍历完所述多个第二类簇,得到多个第三类簇,即为最终聚类结果,i小于或等于N-1。
在一个可能的示例中,所述装置还包括质量评价单元504,具体用于:
获取所述第一数据集中每个数据对应的属性值;
根据所述属性值确定所述第一数据集中每一个数据的质量高低。
在一个可能的示例中,所述获取单元具体501用于:
获取指定时间段由指定区域内的多个摄像头拍摄的视频集,得到多个视频集;
对所述多个视频集中每一视频集进行视频解析,得到多张视频图像;
对所述多张视频图像中每一张视频图像进行图像分割,得到多个人脸图像;
确定所述多个人脸图像的人脸角度,得到多个角度值;
从所述多个角度值中选取角度值处于预设角度范围的角度值,并确定其对应的多个目标人脸图像;
对所述多个目标人脸图像中每一目标人脸图像进行图像质量评价,得到多个图像质量评价值;
将所述多个图像质量评价值中大于预设质量评价阈值的图像质量评价值对应的目标人脸图像作为所述第一数据集。
可以理解的是,本实施例的情绪识别装置的各程序模块的功能可根据上述方法实施例中的方法具体实现,其具体实现过程可以参照上述方法实施例的相关描述,此处不再赘述。
本申请实施例还提供一种计算机存储介质,其中,该计算机存储介质可存储有程序,该程序执行时包括上述方法实施例中记载的任何一种聚类方法的部分或全部步骤。
本领域技术人员应明白,本申请的实施例可提供为方法、装置(设备)、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。计算机程序存储/分布在合适的介质中,与其它硬件一起提供或作为硬件的一部分,也可以采用其他分布形式,如通过Internet或其它有线或无线电信系统。
尽管结合具体特征及其实施例对本申请进行了描述,显而易见的,在不脱离本申请的精神和范围的情况下,可对其进行各种修改和组合。相应地,本说明书和附图仅仅是所附权利要求所界定的本申请的示例性说明,且视为已覆盖本申请范围内的任意和所有修改、变化、组合或等同物。显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。
Claims (10)
1.一种聚类方法,其特征在于,所述方法包括:
获取包含同种类型数据的第一数据集;
按照第一聚类算法和第一相似度阈值对所述第一数据集进行第一次聚类,并获得第一聚类结果,所述第一聚类结果中包含多个第一类簇;
从所述多个第一类簇中的每个类簇中挑选一个质量最好的数据作为代表数据,组成第二数据集;
按照所述第一聚类算法对所述第二数据集进行第二次聚类,获得第二聚类结果;
结合所述第一聚类结果和所述第二聚类结果,确定所述第一数据集的最终聚类结果。
2.根据权利要求1所述的方法,其特征在于,所述按照第一聚类算法和第一相似度阈值对所述第一数据集进行第一次聚类,包括:
S21:获取第一数据集中的第一个数据作为基准数据;
S22:计算所述第一数据集中除了所述基准数据之外的剩余数据与所述基准数据之间的相似度,并将所述基准数据、以及与所述基准数据之间的相似度大于第一相似度阈值的数据划分到同一个类簇中;
S23:将所述第一数据集中剩余的未划分到类簇中的数据作为新的第一数据集,重复步骤S21和S22,直到第一数据集中的所有数据全部划分到类簇中,得到所述多个第一类簇。
3.根据权利要求2所述的方法,其特征在于,所述第二聚类结果中包括多个第二类簇,所述多个为N个,N为大于1的整数,所述多个第二类簇中的每个第二类簇中包括一个或多个所述代表数据,所述结合所述第一聚类结果和所述第二聚类结果,确定所述第一数据集的最终聚类结果,包括:
S41、获取所述多个第二类簇中的第i个第二类簇,i为正整数;
S42、确定所述第i个第二类簇中的所有代表数据对应的所有第一类簇,并将所述所有第一类簇中的数据放置到同一个第三类簇中;
S43、赋值i=i+1,执行步骤S41和S42,直到遍历完所述多个第二类簇,得到多个第三类簇,即为最终聚类结果,i小于或等于N-1。
4.根据权利要求1-3任一项所述的方法,其特征在于,在所述从所述多个第一类簇中的每个类簇中挑选一个质量最好的数据作为代表数据之前,所述方法还包括:
获取所述第一数据集中每个数据对应的属性值;
根据所述属性值确定所述第一数据集中每一个数据的质量好坏。
5.根据权利要求1-4任一项所述的方法,其特征在于,所述获取包含同种类型数据的第一数据集包括:
获取指定时间段由指定区域内的多个摄像头拍摄的视频集,得到多个视频集;
对所述多个视频集中每一视频集进行视频解析,得到多张视频图像;
对所述多张视频图像中每一张视频图像进行图像分割,得到多个人脸图像;
确定所述多个人脸图像的人脸角度,得到多个角度值;
从所述多个角度值中选取角度值处于预设角度范围的角度值,并确定其对应的多个目标人脸图像;
对所述多个目标人脸图像中每一目标人脸图像进行图像质量评价,得到多个图像质量评价值;
将所述多个图像质量评价值中大于预设质量评价阈值的图像质量评价值对应的目标人脸图像作为所述第一数据集。
6.一种聚类装置,其特征在于,所述装置包括:
获取单元,用于获取包含同种类型数据的第一数据集;
第一聚类单元,按照第一聚类算法和第一相似度阈值对所述第一数据集进行第一次聚类,并获得第一聚类结果,所述第一聚类结果中包含多个第一类簇,所述第一相似度阈值大于第一预设值;
第二聚类单元,用于从所述多个第一类簇中的每个类簇中挑选一个质量最好的数据作为代表数据,组成第二数据集;按照所述第一聚类算法对所述第二数据集进行第二次聚类,获得第二聚类结果,所述第二聚类结果中包括多个第二类簇,所述多个第二类簇中的每个第二类簇中包括一个或多个所述代表数据;
结合单元,用于结合所述第一聚类结果和所述第二聚类结果,确定所述第一数据集的最终聚类结果。
7.根据权利要求6所述的装置,其特征在于,所述第一聚类单元具体用于:
S21:获取第一数据集中的第一个数据作为基准数据;
S22:计算所述第一数据集中除了所述基准数据之外的剩余数据与所述基准数据之间的相似度,并将所述基准数据、以及与所述基准数据之间的相似度大于第一相似度阈值的数据划分到同一个类簇中;
S23:将所述第一数据集中剩余的未划分到类簇中的数据作为新的第一数据集,重复步骤S21和S22,直到第一数据集中的所有数据全部划分到类簇中,得到所述多个第一类簇。
8.根据权利要求7所述的装置,其特征在于,所述第二聚类结果中包括多个第二类簇,所述多个为N个,N为大于1的整数,所述多个第二类簇中的每个第二类簇中包括一个或多个所述代表数据,所述第二聚类单元具体用于:
S41、获取所述多个第二类簇中的第i个第二类簇,i为正整数;
S42、确定所述第i个第二类簇中的所有代表数据对应的所有第一类簇,并将所述所有第一类簇中的数据放置到同一个第三类簇中;
S43、赋值i=i+1,执行步骤S41和S42,直到遍历完所述多个第二类簇,得到多个第三类簇,即为最终聚类结果,i小于或等于N-1。
9.根据权利要求6-8任一项所述的装置,其特征在于,所述装置还包括质量评价单元,具体用于:
获取所述第一数据集中每个数据对应的属性值;
根据所述属性值确定所述第一数据集中每一个数据的质量高低。
10.根据权利要求9所述的装置,其特征在于,所述获取单元具体用于:
获取指定时间段由指定区域内的多个摄像头拍摄的视频集,得到多个视频集;
对所述多个视频集中每一视频集进行视频解析,得到多张视频图像;
对所述多张视频图像中每一张视频图像进行图像分割,得到多个人脸图像;
确定所述多个人脸图像的人脸角度,得到多个角度值;
从所述多个角度值中选取角度值处于预设角度范围的角度值,并确定其对应的多个目标人脸图像;
对所述多个目标人脸图像中每一目标人脸图像进行图像质量评价,得到多个图像质量评价值;
将所述多个图像质量评价值中大于预设质量评价阈值的图像质量评价值对应的目标人脸图像作为所述第一数据集。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811527251.XA CN109447186A (zh) | 2018-12-13 | 2018-12-13 | 聚类方法及相关产品 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811527251.XA CN109447186A (zh) | 2018-12-13 | 2018-12-13 | 聚类方法及相关产品 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN109447186A true CN109447186A (zh) | 2019-03-08 |
Family
ID=65557722
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811527251.XA Pending CN109447186A (zh) | 2018-12-13 | 2018-12-13 | 聚类方法及相关产品 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109447186A (zh) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110598790A (zh) * | 2019-09-12 | 2019-12-20 | 北京达佳互联信息技术有限公司 | 一种图像的识别方法、装置、电子设备及存储介质 |
CN110909817A (zh) * | 2019-11-29 | 2020-03-24 | 深圳市商汤科技有限公司 | 分布式聚类方法及系统、处理器、电子设备及存储介质 |
CN111062407A (zh) * | 2019-10-15 | 2020-04-24 | 深圳市商汤科技有限公司 | 图像处理方法及装置、电子设备和存储介质 |
CN112035685A (zh) * | 2020-08-17 | 2020-12-04 | 中移(杭州)信息技术有限公司 | 相册视频生成方法、电子设备和存储介质 |
CN113033584A (zh) * | 2019-12-09 | 2021-06-25 | Oppo广东移动通信有限公司 | 数据处理方法及相关设备 |
CN114373212A (zh) * | 2022-01-10 | 2022-04-19 | 中国民航信息网络股份有限公司 | 人脸识别模型构建方法、人脸识别方法及相关设备 |
CN114492678A (zh) * | 2022-04-13 | 2022-05-13 | 深圳前海中电慧安科技有限公司 | 一种人像聚类建档方法、装置、设备及存储介质 |
CN114612967A (zh) * | 2022-03-03 | 2022-06-10 | 北京百度网讯科技有限公司 | 一种人脸聚类的方法、装置、设备及存储介质 |
CN114937165A (zh) * | 2022-07-20 | 2022-08-23 | 浙江大华技术股份有限公司 | 一种类簇合并方法、装置、终端及计算机可读存储介质 |
CN115100453A (zh) * | 2022-08-23 | 2022-09-23 | 浙江大华技术股份有限公司 | 一种图像聚类方法、装置、终端及计算机可读存储介质 |
WO2023016087A1 (zh) * | 2021-08-09 | 2023-02-16 | 腾讯科技(深圳)有限公司 | 图像聚类方法、装置、计算机设备及存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104123279A (zh) * | 2013-04-24 | 2014-10-29 | 腾讯科技(深圳)有限公司 | 关键词的聚类方法和装置 |
US8880525B2 (en) * | 2012-04-02 | 2014-11-04 | Xerox Corporation | Full and semi-batch clustering |
CN104794215A (zh) * | 2015-04-27 | 2015-07-22 | 北京工业大学 | 一种适合大规模数据的快速递归聚类方法 |
CN106228188A (zh) * | 2016-07-22 | 2016-12-14 | 北京市商汤科技开发有限公司 | 聚类方法、装置及电子设备 |
CN106878670A (zh) * | 2016-12-24 | 2017-06-20 | 深圳云天励飞技术有限公司 | 一种视频处理方法及装置 |
CN108875522A (zh) * | 2017-12-21 | 2018-11-23 | 北京旷视科技有限公司 | 人脸聚类方法、装置和系统及存储介质 |
-
2018
- 2018-12-13 CN CN201811527251.XA patent/CN109447186A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8880525B2 (en) * | 2012-04-02 | 2014-11-04 | Xerox Corporation | Full and semi-batch clustering |
CN104123279A (zh) * | 2013-04-24 | 2014-10-29 | 腾讯科技(深圳)有限公司 | 关键词的聚类方法和装置 |
CN104794215A (zh) * | 2015-04-27 | 2015-07-22 | 北京工业大学 | 一种适合大规模数据的快速递归聚类方法 |
CN106228188A (zh) * | 2016-07-22 | 2016-12-14 | 北京市商汤科技开发有限公司 | 聚类方法、装置及电子设备 |
CN106878670A (zh) * | 2016-12-24 | 2017-06-20 | 深圳云天励飞技术有限公司 | 一种视频处理方法及装置 |
CN108875522A (zh) * | 2017-12-21 | 2018-11-23 | 北京旷视科技有限公司 | 人脸聚类方法、装置和系统及存储介质 |
Non-Patent Citations (1)
Title |
---|
王莉: "数据挖掘中聚类方法的研究", 《中国博士学位论文全文数据库 信息科技辑》 * |
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110598790A (zh) * | 2019-09-12 | 2019-12-20 | 北京达佳互联信息技术有限公司 | 一种图像的识别方法、装置、电子设备及存储介质 |
CN111062407A (zh) * | 2019-10-15 | 2020-04-24 | 深圳市商汤科技有限公司 | 图像处理方法及装置、电子设备和存储介质 |
CN111062407B (zh) * | 2019-10-15 | 2023-12-19 | 深圳市商汤科技有限公司 | 图像处理方法及装置、电子设备和存储介质 |
CN110909817A (zh) * | 2019-11-29 | 2020-03-24 | 深圳市商汤科技有限公司 | 分布式聚类方法及系统、处理器、电子设备及存储介质 |
CN110909817B (zh) * | 2019-11-29 | 2022-11-11 | 深圳市商汤科技有限公司 | 分布式聚类方法及系统、处理器、电子设备及存储介质 |
CN113033584A (zh) * | 2019-12-09 | 2021-06-25 | Oppo广东移动通信有限公司 | 数据处理方法及相关设备 |
CN113033584B (zh) * | 2019-12-09 | 2023-07-07 | Oppo广东移动通信有限公司 | 数据处理方法及相关设备 |
CN112035685A (zh) * | 2020-08-17 | 2020-12-04 | 中移(杭州)信息技术有限公司 | 相册视频生成方法、电子设备和存储介质 |
WO2023016087A1 (zh) * | 2021-08-09 | 2023-02-16 | 腾讯科技(深圳)有限公司 | 图像聚类方法、装置、计算机设备及存储介质 |
CN114373212A (zh) * | 2022-01-10 | 2022-04-19 | 中国民航信息网络股份有限公司 | 人脸识别模型构建方法、人脸识别方法及相关设备 |
CN114612967A (zh) * | 2022-03-03 | 2022-06-10 | 北京百度网讯科技有限公司 | 一种人脸聚类的方法、装置、设备及存储介质 |
CN114492678A (zh) * | 2022-04-13 | 2022-05-13 | 深圳前海中电慧安科技有限公司 | 一种人像聚类建档方法、装置、设备及存储介质 |
CN114937165A (zh) * | 2022-07-20 | 2022-08-23 | 浙江大华技术股份有限公司 | 一种类簇合并方法、装置、终端及计算机可读存储介质 |
CN115100453B (zh) * | 2022-08-23 | 2022-11-18 | 浙江大华技术股份有限公司 | 一种图像聚类方法、装置、终端及计算机可读存储介质 |
CN115100453A (zh) * | 2022-08-23 | 2022-09-23 | 浙江大华技术股份有限公司 | 一种图像聚类方法、装置、终端及计算机可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109447186A (zh) | 聚类方法及相关产品 | |
CN109214337B (zh) | 一种人群统计方法、装置、设备及计算机可读存储介质 | |
CN109284733B (zh) | 一种基于yolo和多任务卷积神经网络的导购消极行为监控方法 | |
CN107944618B (zh) | 共享车辆的布点规划方法、装置以及电子设备 | |
CN107016322B (zh) | 一种尾随人员分析的方法及装置 | |
US9418297B2 (en) | Detecting video copies | |
CN105096269B (zh) | 基于畸变直线结构检测的图像径向畸变矫正的方法及系统 | |
CN110163076A (zh) | 一种图像数据处理方法和相关装置 | |
EP2983131A1 (en) | Method and device for camera calibration | |
CN109313805A (zh) | 图像处理装置、图像处理系统、图像处理方法和程序 | |
CN101073078A (zh) | 按照事件的多层图像聚类 | |
JP2005032246A (ja) | 画像グループの表現方法および表現方法によって導出される記述子、探索方法、装置、コンピュータプログラム、ならびに記憶媒体 | |
CN111160243A (zh) | 客流量统计方法及相关产品 | |
CN110889314B (zh) | 图像处理方法、装置、电子设备、服务器及系统 | |
CN109313806A (zh) | 图像处理装置、图像处理系统、图像处理方法和程序 | |
CN108932509A (zh) | 一种基于视频跟踪的跨场景目标检索方法及装置 | |
CN109559344A (zh) | 边框检测方法、装置及存储介质 | |
CN109902681B (zh) | 用户群体关系确定方法、装置、设备及存储介质 | |
CN109145127A (zh) | 图像处理方法及装置、电子设备和存储介质 | |
CN109559336A (zh) | 对象追踪方法、装置及存储介质 | |
CN115346169A (zh) | 一种睡岗行为检测方法及系统 | |
CN115273208A (zh) | 轨迹生成方法、系统、装置及电子设备 | |
US20200036961A1 (en) | Constructing a user's face model using particle filters | |
CN113177917B (zh) | 一种抓拍图像优选方法、系统、设备及介质 | |
CN110569840A (zh) | 目标检测方法及相关装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190308 |
|
RJ01 | Rejection of invention patent application after publication |