CN113901981A - 设备聚类方法、装置、计算机设备及存储介质 - Google Patents
设备聚类方法、装置、计算机设备及存储介质 Download PDFInfo
- Publication number
- CN113901981A CN113901981A CN202110997621.1A CN202110997621A CN113901981A CN 113901981 A CN113901981 A CN 113901981A CN 202110997621 A CN202110997621 A CN 202110997621A CN 113901981 A CN113901981 A CN 113901981A
- Authority
- CN
- China
- Prior art keywords
- clustering
- equipment
- shooting
- matrix
- shooting number
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/18—Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast
- H04N7/181—Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast for receiving images from a plurality of remote sources
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Probability & Statistics with Applications (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及数据处理技术领域,尤其涉及一种设备聚类方法、装置、计算机设备及存储介质。其方法包括:获取拍摄数向量集合;对拍摄数向量集合中任意两个拍摄数向量分别进行相似度计算,生成相似度矩阵;基于相似度矩阵对摄像设备进行聚类处理,得到摄像设备对应的设备聚类结果。本发明实现了基于摄像设备在预设时间段内的图像拍摄数特征对摄像设备进行聚类得到设备聚类结果,可以有效区分出摄像设备的应用场景,提高了对摄像设备进行应用场景分类的效率和准确度。
Description
技术领域
本发明涉及数据处理技术领域,尤其涉及一种设备聚类方法、装置、计算机设备及存储介质。
背景技术
随着互联网络的迅速发展,摄像设备的应用越来越广泛。摄像设备安装于停车场、图书馆、商场等各种应用场景中,是维护社会治安的一种监督手段。在侦查案件、排查嫌疑人时,通常需要集中排查某一类应用场景的监控影像。那么,就需要对摄像设备的应用场景进行有效分类,进而实现将同一应用场景的摄像设备聚成一类。目前,通过人工对摄像设备的应用场景进行标注,需要耗费大量的人力,效率很低。如何根据摄像设备所属的应用场景对摄像设备进行快速聚类成为亟待解决的问题。
发明内容
基于此,有必要针对上述技术问题,提供一种设备聚类方法、装置、计算机设备及存储介质,以解决无法根据摄像设备所属的应用场景对摄像设备进行快速聚类的问题。
一种设备聚类方法,包括:
获取拍摄数向量集合,所述拍摄数向量集合包括待聚类的各摄像设备对应的拍摄数向量,所述拍摄数向量是基于所述摄像设备在预设时间段内的拍摄数据生成的;
对所述拍摄数向量集合中任意两个拍摄数向量分别进行相似度计算,生成相似度矩阵;
基于所述相似度矩阵对所述摄像设备进行聚类处理,得到所述摄像设备对应的设备聚类结果。
一种设备聚类装置,包括:
拍摄数向量集合模块,用于获取拍摄数向量集合,所述拍摄数向量集合包括待聚类的各摄像设备对应的拍摄数向量,所述拍摄数向量是基于所述摄像设备在预设时间段内的拍摄数据生成的;
相似度矩阵模块,用于对所述拍摄数向量集合中任意两个拍摄数向量分别进行相似度计算,生成相似度矩阵;
设备聚类结果模块,用于基于所述相似度矩阵对所述摄像设备进行聚类处理,得到所述摄像设备对应的设备聚类结果。
一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机可读指令,所述处理器执行所述计算机可读指令时实现上述设备聚类方法。
一个或多个存储有计算机可读指令的可读存储介质,所述计算机可读指令被一个或多个处理器执行时,使得所述一个或多个处理器执行如上述设备聚类方法。
上述设备聚类方法、装置、计算机设备及存储介质,拍摄数向量集合包括待聚类的各摄像设备对应的拍摄数向量,而拍摄数向量是基于摄像设备在预设时间段内的拍摄数据生成的,由于拍摄数向量反映摄像设备在预设时间段内的图像拍摄数特征的一种特征信息,该特征信息与摄像设备所属的应用场景是存在关联的;对拍摄数向量集合中任意两个拍摄数向量分别进行相似度计算,生成相似度矩阵;通过基于相似度矩阵对摄像设备进行聚类处理,得到摄像设备对应的设备聚类结果,设备聚类结果包括两个或两个以上的设备聚类簇,每个设备聚类簇中的设备属于同一应用场景,由此实现了基于摄像设备在预设时间段内的图像拍摄数特征对摄像设备进行聚类得到设备聚类结果,可以有效区分出摄像设备的应用场景,提高了对摄像设备进行应用场景分类的效率和准确度。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一实施例中设备聚类方法的一流程示意图;
图2是本发明一实施例中设备聚类方法的一流程示意图;
图3是本发明一实施例中设备聚类方法的一流程示意图;
图4是本发明一实施例中设备聚类方法的一流程示意图;
图5是本发明一实施例中设备聚类方法的一流程示意图;
图6是本发明一实施例中设备聚类方法的一流程示意图;
图7是本发明一实施例中设备聚类方法的一流程示意图;
图8是本发明一实施例中设备聚类装置的一结构示意图;
图9是本发明一实施例中计算机设备的一示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在一实施例中,如图1所示,提供一种设备聚类方法,该方法可以应用于客户端或服务端,其中,客户端包括但不限于各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。服务端可以用独立的服务器或者是多个服务器组成的服务器集群来实现,以该方法应用在服务端为例进行说明,包括如下步骤:
S10、获取拍摄数向量集合;拍摄数向量集合包括待聚类的各摄像设备对应的拍摄数向量,拍摄数向量是基于摄像设备在预设时间段内的拍摄数据生成的。
在一个实施例中,拍摄数向量集合是由多个拍摄数向量构成的向量集合。一个拍摄数向量对应一个摄像设备,即每个拍摄数向量是基于单个摄像设备在预设时间段内的拍摄数据生成的。
在一个实施例中,摄像设备可以是用在安防方面的准专业摄像机,也可以是非安防方面的其它摄像设备,在此不作限定。
在一个实施例中,拍摄数向量是反映摄像设备在预设时间段内的拍摄数特征的一种特征信息,该特征信息与摄像设备所属的应用场景是存在关联的。
例如,摄像设备广泛应用于学校、公司、银行、交通、平安城市等多个应用场景。摄像设备会24小时不间断地检测是否有路人经过。当有路人进入摄像设备所监控的范围时,摄像设备会对其进行拍摄,得到拍摄图像。经过摄像设备所监控的范围的人越多,摄像设备所执行的拍摄次数就越多,图像拍摄数越大。由于在不同的应用场景,人流量存在差异,因此,同一个时间段经过该应用场景的人流量是不同,所以在同一时间段内,摄像设备在不同的应用场景的图像拍摄数也随之不同。
在一个实施例中,可以通过获取摄像设备在预设时间段内的拍摄数据,以生成该摄像设备对应的拍摄数向量,预设时间段内可根据需求设定,例如,预设时间段可设置为24小时。拍摄数据包括摄像设备进行拍摄的每一张图像以及每一张图像的属性信息,可以理解的是,上述属性信息可以包括拍摄时间,当然,该属性信息还可以包括摄像设备的标识信息等,在此不作限定。
具体的,在基于摄像设备在预设时间段内的拍摄数据生成该摄像设备对应的拍摄数向量时,可以是从待聚类的各摄像设备获取其在预设时间段内的拍摄数据,并按预设间隔时间从预设时间段内划分出多个时间片段。根据拍摄数据获取各个时间片段内的图像拍摄数,确定同一个摄像机在各个时间片段内的图像拍摄数。在得到同一个摄像机在各个时间片段内的图像拍摄数,按时间从前往后的顺序对各个时间片段进行排序,以生成由各个时间片段内的图像拍摄数所生成的一个向量,将其作为该摄像设备对应的拍摄数向量。在分别生成多个摄像设备对应的拍摄数向量后,则可以根据多个摄像设备对应的拍摄数向量生成拍摄数向量集合。
S20、对拍摄数向量集合中任意两个拍摄数向量分别进行相似度计算,生成相似度矩阵。
在一个实施例中,需要对拍摄数向量集合中任意两个拍摄数向量分别进行相似度计算,得到任意两个拍摄数向量之间的相似度,并根据任意两个拍摄数向量之间的相似度生成相似度矩阵,上述相似度可以反映两个摄像设备在图像拍摄数这一维度特征下的相似程度大小;相似度越大,则两个摄像设备在图像拍摄数这一维度特征的相似程度较高,相似度越小,则两个摄像设备在图像拍摄数这一维度特征的相似程度较低。可理解的,可以采用相似度模型对拍摄数向量集合中任意两个拍摄数向量分别进行相似度计算,得到任意两个拍摄数向量之间的相似度。其中,相似度模型包含以下公式SCR(X,Y),通过公式SCR(X,Y)计算出相似度。
其中,X为第一摄像设备,第一摄像设备属于待聚类的各摄像设备中任意一个;Y为第二摄像设备,第二摄像设备属于待聚类的各摄像设备中任意一个;SCR(X,Y)表示第一摄像设备X与第二摄像设备Y之间的Spearman(斯皮尔曼)相关系数;i表示在预设时间段内的时序号,其中,时序号为按时间顺序排列的顺序号,i的取值范围为[1,m],m为大于1的正整数。xi表示第一摄像设备X在时间序号i的图像拍摄数;yi表示第二摄像设备Y在时间序号i的图像拍摄数;rx(xi)表示图像拍摄数xi的次序号,其中,次序号为按图像拍摄数大小顺序排列的顺序号;ry(yi)表示图像拍摄数yi的次序号,其中,次序号为按图像拍摄数大小顺序的顺序号。
可理解的,拍摄数向量集合包括若干摄像设备的拍摄数向量。将拍摄数向量集合输入相似度模型,通过计算公式SCR(X,Y),可得到拍摄数向量集合中任意两个拍摄数向量之间的相似度。
可选的,还可以采用欧氏距离函数和Pearson相关系数函数来计算拍摄数向量集合中任意两个拍摄数向量之间的相似度,进而生成相似度矩阵。
在一示例中,例如,拍摄数向量集合包括6台摄像设备的拍摄数向量,6台摄像设备分别为d1,d2,...,d6,则生成的相似度矩阵如表1所示。
表1相似度矩阵
d<sub>1</sub> | d<sub>2</sub> | d<sub>3</sub> | d<sub>4</sub> | d<sub>5</sub> | d<sub>6</sub> | |
d<sub>1</sub> | 1 | |||||
d<sub>2</sub> | 0.92 | 1 | ||||
d<sub>3</sub> | 0.78 | 0.68 | 1 | |||
d4 | 0.61 | 0.49 | 0.62 | 1 | ||
d5 | 0.77 | 0.57 | 0.96 | 0.74 | 1 | |
d6 | 0.98 | 0.84 | 0.71 | 0.96 | 0.82 | 1 |
S30、基于相似度矩阵对摄像设备进行聚类处理,得到摄像设备对应的设备聚类结果。
可理解的,由于在不同的应用场景,人流量存在差异,因此,同一个时间段经过该应用场景的人流量是不同,所以在同一时间段内,摄像设备在不同的应用场景的图像拍摄数也随之不同。根据摄像设备的图像拍摄数的差异,实现根据摄像设备所属的应用场景对摄像设备进行聚类,得到设备聚类结果,设备聚类结果包括两个或两个以上的设备聚类簇,每个设备聚类簇中的设备属于同一应用场景。设备聚类模型用于根据相似度矩阵对待聚类的所有摄像设备进行聚类。在对待聚类的所有摄像设备进行聚类之前,需要对聚类的类别个数M进行设置,进而根据预设的类别个数M,将摄像设备聚类成不同的M类。
对待聚类的所有摄像设备进行聚类,可以通过设备聚类模型来实现,设备聚类模型包括但不限于k-means算法。k-means算法是一种基于划分的聚类方法。设备聚类结果是指摄像设备的聚类结果。设备聚类结果包括若干设备聚类簇。
具体的,可以根据相似度矩阵构建标准拉普拉斯矩阵,计算标准拉普拉斯矩阵的特征向量,根据特征向量生成特征向量矩阵,将特征向量矩阵F的每一行作为一个样本,共n个样本。通过设备聚类模型对n个样本进行聚类,得到n个摄像设备的聚类结果C(C1,C2,...,CM)。
在一示例中,有10台摄像设备(d1,d2,...,d10),M设置为4,则10台摄像设备的聚类结果为表2所示。10台摄像设备的聚类结果为表2所示。其中,设备聚类簇C1包括(d1、d2、d4),设备聚类簇C2包括(d4、d6、d7、d10),设备聚类簇C3包括(d5)和设备聚类簇C4包括(d3、d8)。
表2聚类结果
摄像设备 | 设备聚类簇 |
d<sub>1</sub>、d<sub>2</sub>、d<sub>4</sub> | C<sub>1</sub> |
d<sub>4</sub>、d<sub>6</sub>、d<sub>7</sub>、d<sub>10</sub> | C<sub>2</sub> |
d<sub>5</sub> | C<sub>3</sub> |
d<sub>3</sub>、d<sub>8</sub> | C<sub>4</sub> |
在步骤S10-S30中,拍摄数向量集合包括待聚类的各摄像设备对应的拍摄数向量,而拍摄数向量是基于摄像设备在预设时间段内的拍摄数据生成的,由于拍摄数向量反映摄像设备在预设时间段内的图像拍摄数特征的一种特征信息,该特征信息与摄像设备所属的应用场景是存在关联的;对拍摄数向量集合中任意两个拍摄数向量分别进行相似度计算,生成相似度矩阵;通过基于相似度矩阵对摄像设备进行聚类处理,得到摄像设备对应的设备聚类结果,设备聚类结果包括两个或两个以上的设备聚类簇,每个设备聚类簇中的设备属于同一应用场景,由此实现了基于摄像设备在预设时间段内的图像拍摄数特征对摄像设备进行聚类得到设备聚类结果,可以有效区分出摄像设备的应用场景,提高了对摄像设备进行应用场景分类的效率和准确度,进而便于在侦查案件、排查嫌疑人时,可根据摄像设备的聚类结果,集中排查属于某一类应用场景的监控影像,加快排查效率,节省人力资源。
可选的,如图2所示,在步骤S10中,即获取拍摄数向量集合;拍摄数向量集合包括多个拍摄数向量,包括:
S101、获取待聚类的各摄像设备在预设时间段内的拍摄数据;
S102、按照预设间隔时间将预设时间段划分为多个时间片段;
S103、根据拍摄数据,确定摄像设备在多个时间片段内的图像拍摄数;
S104、将摄像设备在多个时间片段内的图像拍摄数按照时间从前往后的顺序进行排序,生成摄像设备对应的拍摄数向量。
可理解的,预设时间段是预先设置的某一段时间,如可设置为24小时(一天)。
预设间隔时间是指根据时间设置指令设定的时间间隔。其中,时间设置指令是在操作人员(如,测试员)输入预设间隔时间之后生成的。例如,间隔时间可设置为6分钟。间隔时间可根据设备的实际情况设定,例如,不同设备处理数据的速度不同,间隔时间设置的越长,需要处理的数据越少,更适配数据处理速度较慢的设备。间隔时间设置的越短,需要处理的数据越多,更适配数据处理速度较快的设备。可选的,根据不同的间隔时间设置,可得到不同的拍摄数向量。可根据不同的拍摄数向量对摄像设备的应用场景进行聚类,提高聚类结果的准确性。
一个时间片段对应一个图像拍摄数,同一个摄像设备包含多个图像拍摄数。按图像拍摄数对应的时间将同一个摄像设备在不同时间片段的图像拍摄数按照时间从前往后的顺序进行排序,生成该摄像设备对应的拍摄数向量。
具体的,获取摄像设备在预设时间段内的图像拍摄数和拍摄时间。根据设置的间隔时间将预设时间段划分出多个时间片段。例如,如表3所示,预设间隔时间为6分钟,预设时间段为24小时,则得到240个时间片段,确定每个时间片段内的图像拍摄数,根据每个时间片段内的图像拍摄数,按时间从前往后的顺序对各个时间片段进行排序,生成该摄像设备对应的拍摄数向量,该拍摄数向量为(1372,5243,...,469)。
表3与间隔时间对应的时间片段和图像拍摄数
时间片段 | 图像拍摄数 |
00:00:00-00:06:00 | 1372 |
00:06:00-00:12:00 | 5243 |
... | ... |
23:54:00-24:00:00 | 469 |
在步骤S101-S103中,获取待聚类的各摄像设备在预设时间段内的拍摄数据;按照预设间隔时间将预设时间段划分为多个时间片段;根据拍摄数据,确定摄像设备在多个时间片段内的图像拍摄数;将摄像设备在多个时间片段内的图像拍摄数按照时间从前往后的顺序进行排序,生成摄像设备对应的拍摄数向量。通过设置多个时间片段,可以确定摄像设备在不同时间片段内的图像拍摄数,可以更加精准的反映出摄像设备在不同点的拍摄数特征,进而有效提高根据摄像设备在预设时间段内的拍摄数特征对摄像设备的应用场景进行聚类的准确性。
可选的,如图3所示,在步骤S20中,即对拍摄数向量集合中任意两个拍摄数向量分别进行相似度计算,生成相似度矩阵,包括:
S201、对拍摄数向量集合中任意两个拍摄数向量分别进行相似度计算,得到任意两个拍摄数向量之间的相似度;
S202、基于相似度,生成相似度矩阵。
可理解的,相似度模型用于对拍摄数向量集合进行相似度计算,得到相似度矩阵。其中,相关系数算法为:
其中,X为第一摄像设备,第一摄像设备属于待聚类的各摄像设备中任意一个;Y为第二摄像设备,第二摄像设备属于待聚类的各摄像设备中任意一个;SCR(X,Y)表示第一摄像设备X与第二摄像设备Y之间的Spearman(斯皮尔曼)相关系数;i表示在预设时间段内的时序号,其中,时序号为按时间顺序的顺序号,i的取值范围为[1,m],m为大于1的正整数。xi表示第一摄像设备X在时间序号i的图像拍摄数;yi表示第二摄像设备Y在时间序号i的图像拍摄数;rx(xi)表示图像拍摄数xi的次序号,其中,次序号为按图像拍摄数大小顺序的顺序号;ry(yi)表示图像拍摄数yi的次序号,其中,次序号为按图像拍摄数大小顺序的顺序号。
可理解的,拍摄数向量集合包括若干拍摄数向量。一个摄像设备对应一个拍摄数向量。根据相关系数算法对拍摄数向量集合进行计算,得到若干摄像设备两两之间的相似度。
具体的,根据相关系数算法SCR(X,Y),分别计算任意两个拍摄数向量之间的相似度,可得到任意两个拍摄数向量之间的相似度。进而,根据任意两个拍摄数向量之间的相似度,构建若干摄像设备之间的相似度矩阵。
在步骤S201和S202中,根据相关系数算法对拍摄数向量集合中任意两个拍摄数向量分别进行相似度计算,得到任意两个拍摄数向量之间的相似度;基于相似度,生成相似度矩阵。通过计算公式SCR(X,Y),可得到任意两个摄像设备之间的相似度,得到的相似度矩阵考虑了若干摄像设备之间在不同时间片段的相似度,使得聚类结果更加准确。
可选的,如图4所示,在步骤S30中,即基于相似度矩阵对摄像设备进行聚类处理,得到摄像设备对应的设备聚类结果的步骤S30,包括:
S301、根据相似度矩阵构建聚类矩阵;
S302、计算聚类矩阵的特征向量,根据特征向量生成特征向量矩阵;
S303、基于特征向量矩阵对摄像设备进行聚类处理,得到摄像设备对应的设备聚类结果。
可理解的,聚类矩阵为一种拉普拉斯矩阵,拉普拉斯矩阵(Laplacian matrix)也叫做导纳矩阵、基尔霍夫矩阵或离散拉普拉斯算子,主要应用在图论中,作为一个图的矩阵表示。首先需要将数据转换为图,即所有的数据看做空间中的点,点点之间用边相连。距离较远的两个点,它们之间边的权重值较低,距离较近的两点之间边的权重值较高。通过对所有数据点组成的图进行切图,让切图后不同的子图间边权重和尽可能的低,而子图内的边权重和尽可能的高,从而达到聚类的目的。
可理解的,拉普拉斯矩阵是半正定矩阵,特征值中0出现的次数就是图连通区域的个数,最小特征值是0,因为拉普拉斯矩阵每一行的和均为0。
在一个实施例中,如图5所示,根据相似度矩阵构建聚类矩阵的步骤S301可以包括:
S3011、根据相似度矩阵,构建与相似度矩阵对应的邻接矩阵和度矩阵;
S3012、根据邻接矩阵和度矩阵构建拉普拉斯矩阵;
S3013、对拉普拉斯矩阵进行标准化处理,生成聚类矩阵。
可理解的,邻接矩阵和度矩阵可以通过样本点距离度量的相似矩阵来获得。构建邻接矩阵的方法包括但不限于全连接法。全连接法,选择不同的核函数来定义边权重,例如,核函数是高斯核函数RBF。度矩阵是一个对角矩阵,只有主对角线有值,对应第i行的第i个点的度数。
具体的,在得到邻接矩阵和度矩阵之后,根据公式L对与该相似度矩阵对应的邻接矩阵和度矩阵进行计算,得到拉普拉斯矩阵L。
L=D-W
其中,D为度矩阵,D是对角矩阵且非对角元素均为0。W为邻接矩阵。在得到拉普拉斯矩阵L之后,根据公式Lsym=D-1/2LD-1/2,其中,D为度矩阵,L为拉普拉斯矩阵,将拉普拉斯矩阵L标准化,得到标准化后的标准拉普拉斯矩阵Lsym。将拉普拉斯矩阵L标准化就是对L中的元素进行标准化处理使得不同元素的量纲得到归一。例如,当对于不同子集,样本点之间的连边大小可能会差异很大,做这一步标准操作,可以将L中的元素归一化在[-1,1]之间,这样量纲一致,对算法迭代速度,结果的精度都是有很大提升。
例如,度矩阵为:
邻接矩阵为:
则拉普拉斯矩阵为:
在步骤S3011-S3014中,根据相似度矩阵,构建与相似度矩阵对应的邻接矩阵和度矩阵;根据邻接矩阵和度矩阵构建拉普拉斯矩阵;对拉普拉斯矩阵进行标准化处理,生成聚类矩阵。其中,对拉普拉斯矩阵进行标准化处理使得不同元素的量纲得到归一。例如,当对于不同子集,样本点之间的连边大小可能会差异很大,做这一步标准操作,可以将L中的元素归一化在[-1,1]之间,这样量纲一致,可提高算法迭代速度和精度。
在得到聚类矩阵之后,根据计算公式L=λE(L为聚类矩阵,E为对角矩阵且对角元素均为1),可计算出聚类矩阵L的K个最小特征值λ,进而根据线性方程LV=λEV,对V进行求解,得到与最小特征值λ对应的V的解,即得到与最小特征值λ对应的特征向量f。一个最小特征值λ对应一个特征向量f。根据K个最小特征值λ所对应的特征向量f构建特征向量矩阵F。其中,特征向量矩阵F为K*n维的矩阵,n为摄像设备的个数。
在一示例中,当K为2(即有两个最小特征值λ1、λ2),n为6,则对应得到两个特征向量f,若两个特征向量f1,f2分别为:
则可得到特征向量矩阵F:
在步骤S301-S303中,本发明基于相似度矩阵构建特征向量矩阵,对数据进行了降维处理,能更加有效的处理高维数据的聚类,提升数据处理效率。
可选的,如图6所示,在将特征向量矩阵输入设备聚类模型,获取设备聚类模型输出的设备聚类结果的步骤S30之后,包括:
S304、获取与设备聚类结果所包含的各设备聚类簇对应的场景设置信息;
S305、根据场景设置信息,为各设备聚类簇中的摄像设备添加场景标签。
可理解的,场景设置信息是由操作人员根据设备聚类结果输入的场景信息。场景设置信息是指摄像设备对应的应用场景的信息。例如,场景设置信息可以包括饭馆、旅店、停车场、咖啡馆、酒吧、体育场、公园、图书馆、商场(店)、候诊室、候车室和公共交通工具等应用场景。例如,聚类结果包含6个设备聚类簇,该6个设备聚类簇的场景设置信息为(饭馆、旅店、停车场、咖啡馆、酒吧、体育场)。设备聚类簇是指设备聚类结果所包含的类别。获取设备聚类结果的场景设置信息,根据场景设置信息,为与拍摄数向量对应的摄像设备添加场景标签。例如,摄像设备d1对应的拍摄数向量的聚类结果为类别a,类别a的场景设置信息为停车场,则将与该拍摄数向量对应的摄像设备d1添加场景标签,场景标签为“停车场”。
在步骤S304和S305中,根据聚类结果的场景设置信息,为摄像设备添加对应的场景标签,进而便于根据摄像设备所对应的场景标签进行相应的数据分析,如在侦查案件、排查嫌疑人时,可根据摄像设备的场景标签,集中排查某一类应用场景的监控影像,加快排查效率,节省人力资源。
在一个实施例中,参考图7,在基于相似度矩阵对摄像设备进行聚类处理,得到摄像设备对应的设备聚类结果的步骤S30之后,还包括:
S306、获取待分类的摄像设备对应的拍摄数向量;
S307、针对设备聚类结果所包含的各设备聚类簇,分别计算各设备聚类簇中的摄像设备对应的拍摄数向量的平均向量,作为各设备聚类簇对应的拍摄数平均向量;
S308、基于待分类的摄像设备对应的拍摄数向量以及各设备聚类簇对应的拍摄数平均向量,确定待分类的摄像设备所属的场景标签。
可理解的,设备聚类簇是指设备聚类的类别,每一个类别包含若干摄像设备的拍摄数向量。根据若干摄像设备的拍摄数向量,可计算得到与各个类别拍摄数向量对应的平均向量。
具体的,获取与待分类的摄像设备对应的拍摄数向量,并根据聚类结果中各个设备聚类簇的摄像设备的拍摄数向量,分别计算得到与各个设备聚类簇拍摄数向量对应的平均向量,将与各个设备聚类簇拍摄数向量对应的平均向量作为各设备聚类簇对应的拍摄数平均向量。进而,根据待分类的摄像设备对应的拍摄数向量以及各设备聚类簇对应的拍摄数平均向量,确定二者的相似度,将相似度最大值所对应的设备聚类簇作为待分类的摄像设备匹配度最高的设备聚类簇,将设备聚类簇对应场景标签作为待分类的摄像设备的标签。
在步骤S306-S308中,基于待分类的摄像设备对应的拍摄数向量以及各设备聚类簇对应的拍摄数平均向量,确定待分类的摄像设备所属的场景标签。由于拍摄数平均向量考虑了设备聚类簇中所有摄像设备对应的拍摄数向量,可使待分类的摄像设备的场景标签更加准确,提高待分类的摄像设备的分类准确性。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
在一实施例中,提供一种设备聚类装置,该设备聚类装置与上述实施例中设备聚类方法一一对应。如图8所示,该设备聚类装置包括拍摄数向量集合模块10、相似度矩阵模块20、和设备聚类结果模块30。各功能模块详细说明如下:
拍摄数向量集合模块10,用于获取拍摄数向量集合,所述拍摄数向量集合包括待聚类的各摄像设备对应的拍摄数向量,所述拍摄数向量是基于所述摄像设备在预设时间段内的拍摄数据生成的;
相似度矩阵模块20,用于对所述拍摄数向量集合中任意两个拍摄数向量分别进行相似度计算,生成相似度矩阵;
设备聚类结果模块30,用于基于所述相似度矩阵对所述摄像设备进行聚类处理,得到所述摄像设备对应的设备聚类结果用于获取拍摄数向量集合;所述拍摄数向量集合包括多个拍摄数向量;
可选的,设备聚类结果模块30,包括:
聚类矩阵单元,用于根据所述相似度矩阵构建聚类矩阵;
特征向量矩阵单元,用于计算所述聚类矩阵的特征向量,根据所述特征向量生成特征向量矩阵;
聚类处理单元,用于基于所述特征向量矩阵对所述摄像设备进行聚类处理,得到所述摄像设备对应的设备聚类结果。
可选的,所述拍摄数向量集合模块10,包括:
拍摄数据单元,用于获取待聚类的各摄像设备在预设时间段内的拍摄数据;
时间划分单元,用于按照预设间隔时间将所述预设时间段划分为多个时间片段;
图像拍摄数单元,用于根据所述拍摄数据,确定所述摄像设备在多个所述时间片段内的图像拍摄数;
拍摄数向量单元,用于将所述摄像设备在多个所述时间片段内的图像拍摄数按照时间从前往后的顺序进行排序,生成所述摄像设备对应的拍摄数向量。
可选的,相似度矩阵模块20,包括:
相似度单元,用于根据相关系数算法对所述拍摄数向量集合中任意两个拍摄数向量分别进行相似度计算,得到任意两个拍摄数向量之间的相似度;
相似度矩阵单元,用于基于所述相似度,生成所述相似度矩阵
可选的,设备聚类结果模块30,包括:
相似度矩阵处理单元,用于根据所述相似度矩阵,构建与所述相似度矩阵对应的邻接矩阵和度矩阵;
拉普拉斯矩阵单元,用于根据所述邻接矩阵和所述度矩阵构建拉普拉斯矩阵;
聚类矩阵单元,用于对所述拉普拉斯矩阵进行标准化处理,生成聚类矩阵。
可选的,在设备聚类结果模块30之后,包括:
场景设置信息模块,用于获取与所述设备聚类结果所包含的各设备聚类簇对应的场景设置信息;
场景标签模块,用于根据所述场景设置信息,为所述各设备聚类簇中的摄像设备添加场景标签。
可选的,在设备聚类结果模块30之后,还包括:
拍摄数向量获取单元,用于获取待分类的摄像设备对应的拍摄数向量;
平均向量单元,用于计算所述设备聚类簇中的摄像设备对应的拍摄数向量的平均向量,作为所述各设备聚类簇对应的拍摄数平均向量;
场景标签确定单元,用于基于待分类的摄像设备对应的拍摄数向量以及所述各设备聚类簇对应的拍摄数平均向量,确定待分类的摄像设备所属的场景标签。
关于设备聚类装置的具体限定可以参见上文中对于设备聚类方法的限定,在此不再赘述。上述设备聚类装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图9所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括可读存储介质、内存储器。该可读存储介质存储有操作系统、计算机可读指令和数据库。该内存储器为可读存储介质中的操作系统和计算机可读指令的运行提供环境。该计算机设备的数据库用于存储设备聚类方法所涉及的数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机可读指令被处理器执行时以实现一种设备聚类方法。本实施例所提供的可读存储介质包括非易失性可读存储介质和易失性可读存储介质。
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机可读指令,处理器执行计算机可读指令时实现以下步骤:
获取拍摄数向量集合,所述拍摄数向量集合包括待聚类的各摄像设备对应的拍摄数向量,所述拍摄数向量是基于所述摄像设备在预设时间段内的拍摄数据生成的;
对所述拍摄数向量集合中任意两个拍摄数向量分别进行相似度计算,生成相似度矩阵;
基于所述相似度矩阵对所述摄像设备进行聚类处理,得到所述摄像设备对应的设备聚类结果。
在一个实施例中,提供了一个或多个存储有计算机可读指令的计算机可读存储介质,本实施例所提供的可读存储介质包括非易失性可读存储介质和易失性可读存储介质。可读存储介质上存储有计算机可读指令,计算机可读指令被一个或多个处理器执行时实现以下步骤:
获取拍摄数向量集合,所述拍摄数向量集合包括待聚类的各摄像设备对应的拍摄数向量,所述拍摄数向量是基于所述摄像设备在预设时间段内的拍摄数据生成的;
对所述拍摄数向量集合中任意两个拍摄数向量分别进行相似度计算,生成相似度矩阵;
基于所述相似度矩阵对所述摄像设备进行聚类处理,得到所述摄像设备对应的设备聚类结果。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机可读指令来指令相关的硬件来完成,所述的计算机可读指令可存储于一非易失性可读取存储介质或易失性可读存储介质中,该计算机可读指令在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。
Claims (10)
1.一种设备聚类方法,其特征在于,包括:
获取拍摄数向量集合,所述拍摄数向量集合包括待聚类的各摄像设备对应的拍摄数向量,所述拍摄数向量是基于所述摄像设备在预设时间段内的拍摄数据生成的;
对所述拍摄数向量集合中任意两个拍摄数向量分别进行相似度计算,生成相似度矩阵;
基于所述相似度矩阵对所述摄像设备进行聚类处理,得到所述摄像设备对应的设备聚类结果。
2.如权利要求1所述的设备聚类方法,其特征在于,所述获取拍摄数向量集合,包括:
获取待聚类的各摄像设备在预设时间段内的拍摄数据;
按照预设间隔时间将所述预设时间段划分为多个时间片段;
根据所述拍摄数据,确定所述摄像设备在多个所述时间片段内的图像拍摄数;
将所述摄像设备在多个所述时间片段内的图像拍摄数按照时间从前往后的顺序进行排序,生成所述摄像设备对应的拍摄数向量。
3.如权利要求1所述的设备聚类方法,其特征在于,所述对所述拍摄数向量集合中任意两个拍摄数向量分别进行相似度计算,生成相似度矩阵,包括:
对所述拍摄数向量集合中任意两个拍摄数向量分别进行相似度计算,得到任意两个拍摄数向量之间的相似度;
基于所述相似度,生成所述相似度矩阵。
4.如权利要求1所述的设备聚类方法,其特征在于,所述基于所述相似度矩阵对所述摄像设备进行聚类处理,得到所述摄像设备对应的设备聚类结果,包括:
根据所述相似度矩阵构建聚类矩阵;
计算所述聚类矩阵的特征向量,根据所述特征向量生成特征向量矩阵;
基于所述特征向量矩阵对所述摄像设备进行聚类处理,得到所述摄像设备对应的设备聚类结果。
5.如权利要求4所述的设备聚类方法,其特征在于,所述根据所述相似度矩阵构建聚类矩阵,包括:
根据所述相似度矩阵,构建与所述相似度矩阵对应的邻接矩阵和度矩阵;
根据所述邻接矩阵和所述度矩阵构建拉普拉斯矩阵;
对所述拉普拉斯矩阵进行标准化处理,生成聚类矩阵。
6.如权利要求1所述的设备聚类方法,其特征在于,在所述基于所述相似度矩阵对所述摄像设备进行聚类处理,得到所述摄像设备对应的设备聚类结果之后,包括:
获取与所述设备聚类结果所包含的各设备聚类簇对应的场景设置信息;
根据所述场景设置信息,为所述各设备聚类簇中的摄像设备添加场景标签。
7.如权利要求1所述的设备聚类方法,其特征在于,在所述基于所述相似度矩阵对所述摄像设备进行聚类处理,得到所述摄像设备对应的设备聚类结果之后,还包括:
获取待分类的摄像设备对应的拍摄数向量;
针对所述设备聚类结果所包含的各设备聚类簇,分别计算所述各设备聚类簇中的摄像设备对应的拍摄数向量的平均向量,作为所述各设备聚类簇对应的拍摄数平均向量;
基于待分类的摄像设备对应的拍摄数向量以及所述各设备聚类簇对应的拍摄数平均向量,确定待分类的摄像设备所属的场景标签。
8.一种设备聚类装置,其特征在于,包括:
拍摄数向量集合模块,用于获取拍摄数向量集合,所述拍摄数向量集合包括待聚类的各摄像设备对应的拍摄数向量,所述拍摄数向量是基于所述摄像设备在预设时间段内的拍摄数据生成的;
相似度矩阵模块,用于对所述拍摄数向量集合中任意两个拍摄数向量分别进行相似度计算,生成相似度矩阵;
设备聚类结果模块,用于基于所述相似度矩阵对所述摄像设备进行聚类处理,得到所述摄像设备对应的设备聚类结果。
9.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机可读指令,其特征在于,所述处理器执行所述计算机可读指令时实现如权利要求1至7中任一项所述设备聚类方法。
10.一个或多个存储有计算机可读指令的可读存储介质,所述计算机可读指令被一个或多个处理器执行时,使得所述一个或多个处理器执行如权利要求1至7中任一项所述设备聚类方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110997621.1A CN113901981A (zh) | 2021-08-27 | 2021-08-27 | 设备聚类方法、装置、计算机设备及存储介质 |
PCT/CN2022/099443 WO2023024670A1 (zh) | 2021-08-27 | 2022-06-17 | 设备聚类方法、装置、计算机设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110997621.1A CN113901981A (zh) | 2021-08-27 | 2021-08-27 | 设备聚类方法、装置、计算机设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113901981A true CN113901981A (zh) | 2022-01-07 |
Family
ID=79187925
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110997621.1A Pending CN113901981A (zh) | 2021-08-27 | 2021-08-27 | 设备聚类方法、装置、计算机设备及存储介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN113901981A (zh) |
WO (1) | WO2023024670A1 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114639052A (zh) * | 2022-03-23 | 2022-06-17 | 阿里巴巴(中国)有限公司 | 生成拍摄场次分组信息的方法、装置及设备 |
WO2023024670A1 (zh) * | 2021-08-27 | 2023-03-02 | 深圳云天励飞技术股份有限公司 | 设备聚类方法、装置、计算机设备及存储介质 |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117236803B (zh) * | 2023-11-16 | 2024-01-23 | 中铁二十二局集团电气化工程有限公司 | 一种牵引变电站等级划分及评价方法、系统及电子设备 |
CN117975071B (zh) * | 2024-03-28 | 2024-06-18 | 浙江大华技术股份有限公司 | 图像聚类方法、计算机设备和存储介质 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5469181B2 (ja) * | 2010-01-25 | 2014-04-09 | パナソニック株式会社 | 画像分類装置、方法、プログラム、プログラムを記録する記録媒体及び集積回路 |
CN105631033B (zh) * | 2015-12-31 | 2020-06-19 | 北京奇艺世纪科技有限公司 | 一种视频数据的挖掘方法和装置 |
CN112131430A (zh) * | 2020-09-24 | 2020-12-25 | 腾讯科技(深圳)有限公司 | 视频聚类方法、装置、存储介质和电子设备 |
CN112801053B (zh) * | 2021-04-01 | 2021-07-13 | 腾讯科技(深圳)有限公司 | 视频数据处理方法、装置 |
CN113901981A (zh) * | 2021-08-27 | 2022-01-07 | 深圳云天励飞技术股份有限公司 | 设备聚类方法、装置、计算机设备及存储介质 |
-
2021
- 2021-08-27 CN CN202110997621.1A patent/CN113901981A/zh active Pending
-
2022
- 2022-06-17 WO PCT/CN2022/099443 patent/WO2023024670A1/zh unknown
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023024670A1 (zh) * | 2021-08-27 | 2023-03-02 | 深圳云天励飞技术股份有限公司 | 设备聚类方法、装置、计算机设备及存储介质 |
CN114639052A (zh) * | 2022-03-23 | 2022-06-17 | 阿里巴巴(中国)有限公司 | 生成拍摄场次分组信息的方法、装置及设备 |
CN114639052B (zh) * | 2022-03-23 | 2023-08-04 | 阿里巴巴(中国)有限公司 | 生成拍摄场次分组信息的方法、装置及设备 |
Also Published As
Publication number | Publication date |
---|---|
WO2023024670A1 (zh) | 2023-03-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2023024670A1 (zh) | 设备聚类方法、装置、计算机设备及存储介质 | |
US11495056B2 (en) | Intelligent gallery management for biometrics | |
CN112016623B (zh) | 一种人脸聚类方法、装置、设备及存储介质 | |
JP2022518469A (ja) | 情報処理方法および装置、記憶媒体 | |
CN109885597B (zh) | 基于机器学习的用户分群处理方法、装置及电子终端 | |
Subbiah et al. | An extensive study and comparison of the various approaches to object detection using deep learning | |
CN109949154A (zh) | 客户信息分类方法、装置、计算机设备和存储介质 | |
WO2021179631A1 (zh) | 卷积神经网络模型压缩方法、装置、设备及存储介质 | |
WO2021109724A1 (zh) | 日志异常检测方法及装置 | |
CN111062440B (zh) | 一种样本选择方法、装置、设备及存储介质 | |
CN105678333B (zh) | 一种拥挤区域的确定方法和装置 | |
CN114897764A (zh) | 基于标准化通道注意力的肺结节假阳性排除方法及装置 | |
CN113743533B (zh) | 一种图片聚类方法、装置及存储介质 | |
CN111563479B (zh) | 同行人去重方法、团伙分析方法、装置及电子设备 | |
CN112214639B (zh) | 视频筛选方法、视频筛选装置及终端设备 | |
Dong et al. | Research on fast face retrieval optimization algorithm based on fuzzy clustering | |
CN114528441A (zh) | 一种图结构数据节点分类方法、装置及电子设备 | |
CN111382628B (zh) | 同行判定方法及装置 | |
CN112734384A (zh) | 一种工程造价管理方法、装置、计算机设备及存储介质 | |
CN117333926B (zh) | 一种图片聚合方法、装置、电子设备及可读存储介质 | |
CN113221820B (zh) | 一种对象识别方法、装置、设备及介质 | |
CN115391071A (zh) | 崩溃堆栈上报方法、装置、计算机设备和存储介质 | |
CN116361496A (zh) | 图像搜索方法、存储介质及电子装置 | |
CN116993342A (zh) | 异常交易操作检测方法、装置、计算机设备和存储介质 | |
CN115098686A (zh) | 分级信息确定方法、装置、计算机设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |