CN112132178A - 对象分类方法、装置、电子设备及存储介质 - Google Patents
对象分类方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN112132178A CN112132178A CN202010839712.8A CN202010839712A CN112132178A CN 112132178 A CN112132178 A CN 112132178A CN 202010839712 A CN202010839712 A CN 202010839712A CN 112132178 A CN112132178 A CN 112132178A
- Authority
- CN
- China
- Prior art keywords
- matrix
- similarity
- objects
- classified
- global
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Image Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明实施例提供一种对象分类方法、装置、电子设备及存储介质,所述方法包括:获取全局对象的统计数据,所述全局对象包括待分类对象以及已分类对象,其中,待分类对象数量大于已分类对象数量;根据所述动态信息以及静态信息,计算得到所述全局对象对应的相似度融合矩阵;获取已分类对象的样本标签数据,并根据所述样本标签数据获取初始化样本标签矩阵;基于所述相似度融合矩阵与所述初始化样本标签矩阵对所述待分类对象进行标签传播,并迭代得到最终的标签分布矩阵;根据所述最终的标签分布矩阵对所述待分类对象进行分类。本发明可以提高对象分类的效果。
Description
技术领域
本发明涉及人工智能领域,尤其涉及一种对象分类方法、装置、电子设备及存储介质。
背景技术
随着人工智能研究的不断深入,图像识别产品越来越丰富,人们可以通过图像识别来提取图像中所隐含的特征信息,从而预测出该对象的属性,并根据该对象的属性对该对象进行分类或分析。图结构是一种根据不同对象之间的特征信息来表征不同对象之间的关系的一种分类方式,然而,由于图结构所应用的场景以及目的不同,因此从图像中提取的特征信息也各有不同,比如,对于人员对象分类,特征信息可以是提取人员的职业、年龄、学历等属性所对应的静态特征信息,也可以是人员对象的活动规律、健康状态等属性所对应的动态特征信息;对于场所对象分类,特征信息可以是场所的面积、有无停车位、外观等属性所对应的静态特征信息,也可以是场所的人员流动数、空气质量等属性所对应的动态特征信息。然而,由于静态特征信息与动态特征信息的特征表达形式的不同,使得现有对象图结构针对不同特征信息而言,具有异构性,这导致了对象图结构所表征的对象分类维度较为单一,比如以职业属性为特征信息构成的对象图结构,则只能表征职业属性的维度上将对象分类,无法进行复杂维度的对象分类,对象分类的效果不好。
发明内容
本发明实施例提供一种对象分类方法,能够在复杂维度上对象分类,提高对象分类的效果。
第一方面,本发明实施例提供一种对象分类方法,所述方法用于人员对象或场所对象的分类,所述方法包括以下步骤:
获取全局对象的统计数据,所述全局对象包括待分类对象以及已分类对象,其中,待分类对象数量大于已分类对象数量,所述全局对象的类型为人员对象或场所对象,所述统计数据包括基于时间变化属性的动态信息以及基于固定属性的静态信息;
根据所述动态信息以及静态信息,计算得到所述全局对象对应的相似度融合矩阵;
获取所述已分类对象的样本标签数据,并根据所述样本标签数据获取初始化样本标签矩阵,所述样本标签数据为预先对所述已分类对象进行标注得到,所述样本标签数据包括基于人员对象的类别标签或基于场所对象的类别标签或基于物体对象的类别标签;
基于所述相似度融合矩阵与所述初始化样本标签矩阵对所述待分类对象进行标签传播,并迭代得到最终的标签分布矩阵;
根据所述最终的标签分布矩阵对所述待分类对象进行分类。
可选的,所述根据所述动态信息以及静态信息,计算得到所述全局对象对应的相似度融合矩阵,包括:
根据所述动态信息以及静态信息,分别提取各个全局对象对应的动态特征以及静态特征;
根据所述动态特征与所述静态特征计算所述全局对象对应的相似度融合矩阵。
可选的,所述相似度融合矩阵为第一相似度融合矩阵,所述根据所述动态特征与所述静态特征计算所述全局对象对应的相似度融合矩阵,包括:
遍历计算各个全局对象之间的动态特征相似度,得到动态相似度矩阵;以及
遍历计算各个全局对象之间的静态特征相似度,得到静态相似度矩阵;
将所述动态相似度矩阵以及所述静态相似度矩阵进行融合,得到第一相似度融合矩阵。
可选的,所述将所述动态相似度矩阵以及所述静态相似度矩阵进行融合,得到第一相似度融合矩阵,包括:
获取第一权重参数以及第二权重参数,所述第一权重参数与所述第二权重参数为非负数,且所述第一权重参数与所述第二权重参数的和等于1;
通过所述第一权重参数对所述动态相似度矩阵进行加权计算,得到加权动态相似度矩阵;以及
通过所述第二权重参数对所述静态相似度矩阵进行加权计算,得到加权静态相似度矩阵;
将所述加权动态相似度矩阵与所述加权静态相似度矩阵求和,得到第一相似度融合矩阵。
可选的,所述相似度融合矩阵为第二相似度融合矩阵,所述根据所述动态特征与所述静态特征计算所述全局对象对应的相似度融合矩阵,包括:
将每个全局对象对应的动态特征以及静态特征进行拼接,得到每个全局对象对应的拼接特征;
遍历计算各个全局对象之间的拼接特征相似度,得到第二相似度融合矩阵。
可选的,所述遍历计算各个全局对象之间的拼接特征相似度,得到第二相似度融合矩阵,包括:
将所述全局对象对应的拼接特征构建成全局对象对应的拼接矩阵;
对所述拼接特征矩阵进行归一化,得到全局对象对应的归一化拼接矩阵;
遍历计算归一化拼接矩阵中,每两个全局对象对应的相似度,得到第二相似度融合矩阵。
可选的,所述基于所述相似度融合矩阵与所述初始化样本标签矩阵对所述待分类对象进行标签传播,并迭代得到最终的标签分布矩阵,包括:
获取第一先验参数以及第二先验参数,其中,第一先验参数与第二先验参数是和为1的非负数;
获取上一次迭代时得到的标签矩阵;
计算所述相似度融合矩阵与所述上一次迭代时得到的标签矩阵的乘积矩阵,并通过所述第一先验参数对所述乘积矩阵进行加权调整;
通过所述第二先验参数对所述初始化标签矩阵进行加权调整,并将加权调整后的初始化标签矩阵与所述乘积矩阵相加,得到当前迭代的标签矩阵;
迭代上述步骤直到收敛,得到最终的标签分布矩阵。
可选的,所述计算所述相似度矩阵与所述上一次迭代时得到的标签矩阵的乘积矩阵,包括:
获取所述相似度矩阵的对角矩阵,所述对角矩阵与所述相似度矩阵具有相同的行数与列数,所述对角矩阵的每一个对角值为所述相似度矩阵中相同行的总和;
基于所述对角矩阵,计算所述相似度矩阵的拉普拉斯矩阵;
计算所述度矩阵的拉普拉斯矩阵与所述上一次迭代时得到的标签矩阵的乘积,得到乘积矩阵。
可选的,所述统计数据根据所述全局对象的图像档案进行获取。
第二方面,本发明实施例提供一种对象分类装置,所述装置用于人员对象或场所对象的分类,所述装置包括:
第一获取模块,用于获取全局对象的统计数据,所述全局对象包括待分类对象以及已分类对象,其中,待分类对象数量大于已分类对象数量,所述全局对象的类型为人员对象或场所对象,所述统计数据包括基于时间变化属性的动态信息以及基于固定属性的静态信息,所述统计数据根据所述全局对象的图像档案进行获取;
计算模块,用于根据所述动态信息以及静态信息,计算得到所述全局对象对应的相似度融合矩阵;
第二获取模块,用于获取所述已分类对象的样本标签数据,并根据所述样本标签数据获取初始化样本标签矩阵,所述样本标签数据为预先对所述已分类对象进行标注得到,所述样本标签数据包括基于人员对象的类别标签或基于场所对象的类别标签或基于物体对象的类别标签;
迭代模块,用于基于所述相似度融合矩阵与所述初始化样本标签矩阵对所述待分类对象进行标签传播,并迭代得到最终的标签分布矩阵;
分类模块,用于根据所述最终的标签分布矩阵对所述待分类对象进行分类。
第三方面,本发明实施例提供一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现本发明实施例提供的对象分类方法中的步骤。
第四方面,本发明实施例提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现发明实施例提供的对象分类方法中的步骤。
本发明实施例中,获取全局对象的统计数据,所述全局对象包括待分类对象以及已分类对象,其中,待分类对象数量大于已分类对象数量,所述全局对象的类型为人员对象或场所对象,所述统计数据包括基于时间变化属性的动态信息以及基于固定属性的静态信息;根据所述动态信息以及静态信息,计算得到所述全局对象对应的相似度融合矩阵;获取所述已分类对象的样本标签数据,并根据所述样本标签数据获取初始化样本标签矩阵,所述样本标签数据为预设对所述已分类对象进行标注得到,所述样本标签数据包括基于人员对象的类别标签或基于场所对象的类别标签或基于物体对象的类别标签;基于所述相似度融合矩阵与所述初始化样本标签矩阵对所述待分类对象进行标签传播,并迭代得到最终的标签分布矩阵;根据所述最终的标签分布矩阵对所述待分类对象进行分类。通过将静态特征与动态特征的相似度融合矩阵,使得多个维度的特征被融合在一起,再通过标签传播对待分类对象进行分类,可以使得对象分类在复杂维度上进行,提高对象分类的效果,并且可以实现端对端的训练和分类。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种对象分类方法的流程图;
图2是本发明实施例提供的一种计算相似度融合矩阵的流程图;
图3是本发明实施例提供的一种计算第一相似度融合矩阵的流程图;
图4是本发明实施例提供的另一种计算相似度融合矩阵的流程图;
图5是本发明实施例提供的一种计算第二相似度融合矩阵的流程图;
图6是本发明实施例提供的迭代的效果图示意图;
图7是本发明实施例提供的一种对象分类装置的结构示意图;
图8是本发明实施例提供的另一种对象分类装置的结构示意图;
图9是本发明实施例提供的一种计算模块的结构示意图;
图10是本发明实施例提供的一种第一融合子模块的结构示意图;
图11是本发明实施例提供的另一种计算模块的结构示意图;
图12是本发明实施例提供的一种第三计算子模块的结构示意图;
图13是本发明实施例提供的一种迭代模块的结构示意图;
图14是本发明实施例提供的第一调整子模块的结构示意图;
图15是本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参见图1,图1是本发明实施例提供的一种对象分类方法的流程图,该方法用于用于人员对象或场所对象的分类,如图1所示,包括以下步骤:
101、获取全局对象的统计数据。
在该步骤,上述全局对象包括待分类对象以及已分类对象,其中,待分类对象数量大于已分类对象数量,上述全局对象的类型为人员对象或场所对象,上述统计数据包括基于时间变化属性的动态信息以及基于固定属性的静态信息,上述统计数据可以根据全局对象的图像档案进行获取。
上述的全局对象可以是人员对象、场所对象或物品对象等可以通过属性特征信息进行描述的任意一种对象。进一步的,上述的待分类对象以及已分类对象可以是人员对象、场所对象或物品对象等可以通过属性特征信息进行描述的任意一种对象。
上述的统计数据可以是根据图像档案中的图像提取出的信息数据,每个对象对应一个图像档案,图像档案中的图像包括可以是比如根据人脸图像、场所图像、物品图像等对象的图像,上述的信息数据可以是根据图像档案中的图像所提取出的信息。可选的,上述的图像可以是结构化或半结构化数据,比如,结构化或半结构化数据的图像=图像+根据图像提取出的静态信息以及动态信息。以人员对象为例,在摄像头抓拍到人员图像时,可以通过特征提取,提取出该人员的静态信息以及动态信息,并将该人员对象的人员图像、根据该人员图像提取出的静态信息以及动态信息作为结构化或半结构化数据存在到图像数据库中。更具体的,在摄像头抓拍到人员图像时,可以通过特征提取,提取出该人员的职业、年龄、学历等静态信息以及活动规律、健康状态等动态信息,并将该人员对象的人员图像、职业、年龄、学历、活动规律、健康状态等信息作为结构化或半结构化数据存在到图像数据库中,在获取该人员对象的统计信息时,可以从该图像数据库中提取该人员对象的结构化或半结构化数据即可进行统计。
上述的待分类对象可以理解为需要从多个维度进行分类的对象,
上述的已分类对象可以理解为类别已经被标定的对象,在对象分类中对待分类对象的分类具有指导意义。以场所对象为例,一个场所对象的类别被标定为动漫主题酒吧,其可以通过各个时段的人员流动数来确定其为酒吧的类别,通过动漫装饰的外观来确定其为动漫的类别,从而被描述为一个动漫主题酒吧,而另一个人员流动数以及外观都与其相似的场所,也可以认为是一个动漫主题酒吧。因而,已分类对象在对象分类中对待分类对象的分类具有指导意义。
进一步的,在本发明实施例中,上述的待分类对象数量远远大于已分类对象数量。假设全局对象的数据为(x1,...,xn,xn+1,...,xn+m),其中,(x1,...,xn)是已分类对象的数据,其中,x1表示第1个已分类对象的统计数据,xn表示第n个已分类对象的统计数据;(xn+1,...,xn+m)为未标注的待分类对象的数据,其中,xn+1表示第n+1个待分类对象的统计数据,xn+m表示第n+m个待分类对象的统计数据,其中,m为远远大于n的整数。在一种可能的实施例中,已分类对象的数据所占全局对象的2%左右。进一步的,在二分类的场景中,上述已分类对象包括正样本对象与负样本对象,上述正样本对象与负样本对象可以各占全局对象的1%左右。
在本发明实施例中,可以根据动态信息以及静态信息,计算得到上述全局对象对应的相似度融合矩阵。在相似度融合矩阵中,每个矩阵元素都代表对应两个全局对象的融合相似度,该融合相似度表示两个全局对象的动态信息与静态信息在融合后的相似度。可以将动态信息和静态信息进行矩阵编码或向量编码,从而根据矩阵编码或向量编码,提取出对应的特征,该特征可以用于计算全局对象对应的相似度,再根据该相似度构建对应的相似度融合矩阵。具体的可以参照下述步骤102以及步骤103。
102、根据统计数据的动态信息以及静态信息,分别提取各个全局对象对应的动态特征以及静态特征。
在该步骤中,可以根据动态特征可以是根据对应全局对象的动态信息进行提取,上述的静态特征可以是根据对应全局对象的静态信息进行提取。上述的动态信息指的是随着时间变化而变化的信息,比如动态信息可以是人员对象的活动规律、健康状态等属性所对应的信息;动态信息也可以是场所对象的人员流动数、空气质量等属性所对应的信息;动态信息还可以是物品的状态变化、位置变化等属性所对应的信息。上述的静态信息指的不随着时间变化而变化的信息,比如静态信息人员对象的职业、年龄、学历、居住地、身份证信息等属性所对应的信息;静态信息也可以是场所对象的位置、商业性质、面积、有无停车位、外观等属性所对应的信息;静态信息还可以是物品的颜色、形状、ID标识等属性所对应的信息。
上述的动态特征可以基于小时为时间单位进行提取,也可以是基于日期为时间单位进行提取。比如,考虑以小时为时间单位对动态特征进行提取,则一个对象在一天内的动态特征为24维的;若考虑以日期为时间单位对动态特征进行提取,则一个对象在一周内的动态特征为7维的;在一个月内的动态特征为30维的,具体的,当月有28天和29天的月份可以进行升维,当月有31天的月份可以进行降维,以使维度统一,比如,一个28维的动态特征的表示为1*28,则可以通过一个28*30的线性矩阵,将1*28线性变换为1*30的动态特征,线性变换为:1*28·28*30=1*30;在一年内的动态特征可以为365维或366维,当然,也可以通过线性变换,将365维的动态特征变换为366维的动态特征,以使维度统一,或将366维的动态特征变换为365维的动态特征,以使维度统一。
上述的静态特征不随时间的变化而变化,静态特征的维度取决用户需要,用户需要融合多少个不同属性,则静态特征的维度即是多少。以人员对象为例,用户希望融合职业、年龄、学历等三个不同属性时,则提取这三个不同属性对应的数据,构成3维的静态特征。
需要说明的是,上述的动态特征也可以称为动态特征向量,上述的静态特征也可以称为静态特征向量。
103、根据动态特征与静态特征计算全局对象对应的相似度融合矩阵。
在该步骤中,上述的相似度融合矩阵中,每个矩阵元素都代表对应两个全局对象的融合相似度,该融合相似度表示两个全局对象的动态特征与静态特征融合后的相似度。
假设全局对象融合后的动态特征和静态特征为(z1,...,zn,zn+1,...,zn+m),其中,(z1,...,zn)是已分类对象融合后的动态特征和静态特征,其中,z1表示第1个已分类对象融合后的动态特征和静态特征,zn表示第n个已分类对象融合后的动态特征和静态特征;(zn+1,...,zn+m)为未标注的待分类对象融合后的动态特征和静态特征,其中,zn+1表示第n+1个待分类对象融合后的动态特征和静态特征,zn+m表示第n+m个待分类对象融合后的动态特征和静态特征,其中,m为远远大于n的整数。n+m为全局对象的数量,在本发明实施例中,假设全局对象的数量为K,则n+m=K。
在本发明实施例中,可以通过分别计算动态相似度矩阵与静态相似度矩阵,再根据动态相似度矩阵与静态相似度矩阵进行融合计算,得到上述的相似度融合矩阵。其中,上述的动态相似度矩阵为根据各个全局对象之间的动态特征进行相似度计算得到的矩阵,上述的静态相似度矩阵为根据各个全局对象之间的静态特征进行相似度计算得到的矩阵。也可以通过将每个全局对象的动态特征与静态特征进行拼接融合,计算拼接融合后各个全局对象之间的相似度,得到上述的相似度融合矩阵。
上述的相似度计算可以是动态特征之间的欧式距离、高斯核函数距离、余弦距离、杰卡德距离或马氏距离等。
具体的,如图2所示,图2为本发明实施例提供的一种计算相似度融合矩阵的方法流程图,包括:
201、遍历计算各个全局对象之间的动态特征相似度,得到动态相似度矩阵。
在该步骤中,上述的动态特征相似度可以是动态特征之间的欧式距离、高斯核函数距离、余弦距离、杰卡德距离或马氏距离等。在本发明实施例中,以高斯核函数距离为例,计算动态特征相似度可以如公式进行:
(1)
其中,Dij表示动态相似度矩阵D第i行,第j列位置对应的相似度元素,上述的di与dj分别是全局对象i的动态特征与全局对象j的动态特征。σ2表示不同全局对象间动态信息的方差。
假设全局对象的数量为K,根据每两个全局对象来进行相似度计算,则相似度矩阵D为一个维度为K*K的矩阵,相似度矩阵中的每一个元素都表示两个全局对象的相似度。举例来说,动态相似度矩阵D可以如表1所示:
d<sub>1</sub> | …… | d<sub>i</sub> | …… | d<sub>j</sub> | …… | d<sub>K</sub> | |
d<sub>1</sub> | D<sub>11</sub> | …… | D<sub>1i</sub> | …… | D<sub>1j</sub> | …… | D<sub>1k</sub> |
…… | …… | …… | …… | …… | …… | …… | …… |
d<sub>i</sub> | D<sub>i1</sub> | …… | D<sub>ii</sub> | …… | D<sub>ij</sub> | …… | D<sub>ik</sub> |
…… | …… | …… | …… | …… | …… | …… | …… |
d<sub>j</sub> | D<sub>j1</sub> | …… | D<sub>ji</sub> | …… | D<sub>jj</sub> | …… | D<sub>jk</sub> |
…… | …… | …… | …… | …… | …… | …… | …… |
d<sub>K</sub> | D<sub>k1</sub> | …… | D<sub>ki</sub> | …… | D<sub>kj</sub> | …… | D<sub>kk</sub> |
表1
其中,Dij为动态特征di与动态特征dj相似度,进一步,Dij为全局对象i与全局对象j在动态特征上的相似度。可以看出,动态相似度矩阵D为一个维度为K*K的矩阵,动态相似度矩阵中的每一个元素都表示两个全局对象的动态特征相似度。
在一种可能的实施例中,在计算动态特征相似度之前,可以先根据各个全局对象的动态特征,构建一个所有全局对象的动态特征矩阵,假设全局对象的数量为K,动态特征维数为L,则该动态特征矩阵的维度为K*L,该动态特征矩阵的相似度矩阵则为该动态特征矩阵与该动态特征阵的转置矩阵的矩阵乘积,即D=K*L·L*K=K*K。这样,可以将零散的动态特征之间的相似度计算,转换为矩阵运算。
在本发明实施例中,在进行动态特征相似度计算之前,或在进行动态特征矩阵与该动态特征阵的转置矩阵的矩阵乘积之前,可以对各个全局对象的动态特征进行归一化,以得到浮点形式的动态特征,以便于计算机的浮点运算,同时,加快后续迭代过程的收敛速度。
202、遍历计算各个全局对象之间的静态特征相似度,得到静态相似度矩阵。
在该步骤中,上述的静态特征相似度可以是静态特征之间的欧式距离、高斯核函数距离、余弦距离、杰卡德距离或马氏距离等。在本发明实施例中,以杰卡德距离为例,计算静态特征相似度可以如公式进行:
(2)
其中,Sij表示静态相似度矩阵S第i行,第j列位置对应的相似度元素,si表示第i个全局对象的静态特征,sj表示第j个全局对象的静态特征。
同样的,假设全局对象的数量为K,根据每两个全局对象来进行相似度计算,则静态相似度矩阵S为一个维度为K*K的矩阵,相似度矩阵中的每一个元素都表示两个全局对象的相似度。举例来说,静态相似度矩阵S可以如表1所示:
s<sub>1</sub> | …… | s<sub>i</sub> | …… | s<sub>j</sub> | …… | s<sub>K</sub> | |
s<sub>1</sub> | S<sub>11</sub> | …… | S<sub>1i</sub> | …… | S<sub>1j</sub> | …… | S<sub>1k</sub> |
…… | …… | …… | …… | …… | …… | …… | …… |
s<sub>i</sub> | S<sub>i1</sub> | …… | S<sub>ii</sub> | …… | S<sub>ij</sub> | …… | S<sub>ik</sub> |
…… | …… | …… | …… | …… | …… | …… | …… |
s<sub>j</sub> | S<sub>j1</sub> | …… | S<sub>ji</sub> | …… | S<sub>jj</sub> | …… | S<sub>jk</sub> |
…… | …… | …… | …… | …… | …… | …… | …… |
s<sub>K</sub> | S<sub>k1</sub> | …… | S<sub>ki</sub> | …… | S<sub>kj</sub> | …… | S<sub>kk</sub> |
表2
其中,Sij为静态特征si与静态特征sj相似度,进一步,Sij为全局对象i与全局对象j在静态特征上的相似度。可以看出,静态相似度矩阵S为一个维度为K*K的矩阵,动态相似度矩阵中的每一个元素都表示两个全局对象的动态特征相似度。
在一种可能的实施例中,在计算静态相似度之前,可以先根据各个全局对象的静态特征,构建一个所有全局对象的静态特征矩阵,假设全局对象的数量为K,静态特征维数为H,则该静态特征矩阵的维度为K*H,该静态特征矩阵的相似度矩阵则为该静态特征矩阵与该静态特征阵的转置矩阵的矩阵乘积,即S=K*H·H*K=K*K。这样,可以将零散的静态特征之间的相似度计算,转换为矩阵运算。
在本发明实施例中,在进行静态特征相似度计算之前,或在进行静态特征矩阵与该静态特征阵的转置矩阵的矩阵乘积之前,可以对各个全局对象的静态特征进行归一化,以得到浮点形式的静态特征,以便于计算机的浮点运算,同时,加快后续迭代过程的收敛速度。
203、将动态相似度矩阵以及静态相似度矩阵进行融合,得到第一相似度融合矩阵。
在该步骤中,上述的融合可以是将动态相似度矩阵以及静态相似度矩阵相加,得到动态相似度矩阵以及静态相似度矩阵的相加和作为第一相似度融合矩阵,得到的第一相似度融合矩阵作为相似度融合矩阵M。
上述的融合也可以是分别对动态相似度矩阵以及静态相似度矩阵加权后,得到动态相似度矩阵以及静态相似度矩阵的加权和作为第一相似度融合矩阵,得到的第一相似度融合矩阵作为相似度融合矩阵M。
具体的,如图3所示,图3为本发明实施例提供的一种计算第一相似度融合矩阵的流程图,包括:
301、获取第一权重参数以及第二权重参数。
在本发明实施例中,上述第一权重参数与所述第二权重参数为非负数,且上述第一权重参数与上述第二权重参数的和等于1。设第一权重参数为α1,第二权重参数为α2,则α2=1-α1。
302、通过第一权重参数对动态相似度矩阵进行加权计算,得到加权动态相似度矩阵。
在本发明实施例中,第一权重参数α1对动态相似度矩阵D进行加权计算得到加权动态相似度矩阵为α1D,上述的第一权重参数α1为标量,动态相似度矩阵D为矩阵张量,则加权动态相似度矩阵的维度与动态相似度矩阵D具有相同的维度,比如,动态相似度矩阵D的维度为K*K,则加权动态相似度矩阵的维度也为K*K。
303、通过第二权重参数对静态相似度矩阵进行加权计算,得到加权静态相似度矩阵。
在本发明实施例中,第二权重参数α2对静态相似度矩阵D进行加权计算得到加权静态相似度矩阵为α2S,也可以写为(1-α1)S,上述的第二权重参数α2为标量,静态相似度矩阵S为矩阵张量,则加权静态相似度矩阵的维度与静态相似度矩阵S具有相同的维度,比如,静态相似度矩阵S的维度为K*K,则加权静态相似度矩阵的维度也为K*K。
304、将加权动态相似度矩阵与加权静态相似度矩阵求和,得到第一相似度融合矩阵。
在本发明实施例中,假设第一权重参数为α,第二权重参数为(1-α),第一相似度融合矩阵M1可以根据下式进行计算:
Mij=αDij+(1-α)Sij (3)
其中,Mij表示第一相似度融合矩阵M1第i行,第j列位置对应的相似度元素。由步骤302与303中可以知道,动态相似度矩阵D与静态相似度矩阵S具有相同的矩阵维度,所以是可以进行相加或加权后进行相加的,得到的第一相似度融合矩阵M1与动态相似度矩阵D和静态相似度矩阵S也都具有相同的维度,即第一相似度融合矩阵M1的维度也为K*K。
上述的第一权重参数α可以是用户自行设置,其中,当用户较为关注动态特征对待分类对象的分类影响时,可以将第一权重参数α设置较大,当用户较为关注静态特征对待分类对象的分类影响时,可以将第一权重参数α设置较小。当第一权重参数α设置较大,则第二权重参数为(1-α)越小,当第一权重参数α设置较小,则第二权重参数为(1-α)越大。
可选的,如图4所示,图4为本发明实施例提供的另一种计算相似度融合矩阵的方法流程图,包括:
401、将每个全局对象对应的动态特征以及静态特征进行拼接,得到每个全局对象对应的拼接特征。
在本发明实施例中,设动态特征为dx,静态特征为sx,拼接特征为fx,则有fx=dx||sx,其中,上述的||表示特征连接操作符。将动态特征以及静态特征进行拼接后,得到维度更高的拼接特征,比如,将24维的动态特征与3维的静态特征进行拼接,得到27维的拼接特征。
402、遍历计算各个全局对象之间的拼接特征相似度,得到第二相似度融合矩阵。
在本发明实施例中,通过计算各个全局对象之间的拼接特征相似度,可以得到全局对象之间动态特征与静态特征的整体分布。
可选的,如图5所示,图5为本发明实施例的一种计算第二相似度融合矩阵的方法流程图,包括:
501、将全局对象对应的拼接特征构建成全局对象对应的拼接矩阵。
在本发明实施例中,设全局对象为K个,全局对象的动态特征的维度为L,全局对象的静态特征的维度为H,拼接特征fx的维度为L+H,将全局的全局对象对应的拼接特征构建拼接矩阵F后,拼接矩阵F的维度为K*(L+H)。
502、对所述拼接特征矩阵进行归一化,得到全局对象对应的归一化拼接矩阵。
其中,上述的归一化可以是列归一化、对角矩阵归一化等用于对矩阵进行归一化的方法。以列归一化为例,可以根据如下进行列归一化:
其中,Fij表示拼接矩阵F第i行,第j列位置对应的拼接特征,F.j表示的是第j列的特征。通过对拼接矩阵F进行归一化,使得动态特征以及静态特征在拼接矩阵F中的空间信息进行融合,避免不同维度之间的属性壁垒,从而将动态特征以及静态特征更好的进行融合。需要说明的是,在对拼接矩阵F进行归一化的过程中,维度是没有下降的,因此,归一化拼接矩阵的维度也为K*(L+H)。
503、遍历计算归一化拼接矩阵中,每两个全局对象对应的相似度,得到第二相似度融合矩阵。
在本发明实施例中,可以取出归一化拼接矩阵中任意两个全局对象的拼接特征进行相似度计算,上述的相似度计算可以是动态特征之间的欧式距离、高斯核函数距离、余弦距离、杰卡德距离或马氏距离等。在该步骤中,可以采用与步骤201或202相似的方法进行相似度计算。
在一种可能的实施例中,第二相似度融合矩阵M2也可以为拼接矩阵与该拼接矩阵F的转置矩阵的矩阵乘积,即S=K*(L+H)·(L+H)*K=K*K。这样,可以将零散的静态特征之间的相似度计算,转换为矩阵运算。
104、获取已分类对象的样本标签数据,并根据所述样本标签数据获取初始化样本标签矩阵。
在本发明实施例中,设全局对象的数据为(x1,y1),…,(xn,yn),…,(xn+1,yn+1),…,(xn+m,yn+m)。X=(x1,...,xn,...,xn+1,...,xn+m)为全局对象的统计数据,该统计数据中包括有对应全局对象的动态信息和静态信息,上述的动态信息和静态信息中可以提取出对应的动态特征和静态特征,上述的样本标签数据为人工或自动标注算法对已分类对象的标注,比如(x1,y1),…,(xn,yn)是已分类对象的数据,其中,x1表示第1个已分类对象的统计数据,xn表示第n个已分类对象的统计数据,y1表示第1个已分类对象的统计数据对应的标签,yn表示第n个已分类对象的统计数据对应的标签,则有样本标签矩阵为Yn=(y1,…,yn);(xn+1,yn+1),…,(xn+m,yn+m)为未标注的待分类对象的数据,其中,xn+1表示第n+1个待分类对象的统计数据,xn+m表示第n+m个待分类对象的统计数据,其中,n为远远小于m的整数。上述Ym=(yn+1,…,yn+m)为无标签的统计数据,可以理解为待分类的数据。根据Yn与Ym构建初始化样本标签矩阵Y,初始化样本标签矩阵Y=(y1,…,yn,…,yn+1,…,yn+m)的维度为(n+m)*C,其中,C为属性分类的类别,在二分类中,C为2,当属性分类的类别为5时,则C为5。由于已分类对象的数量远小于等分类对象的数量,所以初始化样本标签矩阵Y为一个稀疏矩阵。本发明的原理则是由X、Yn来预测Ym,具体的,通过X、Yn进行标签传播,预测得到标签分布矩阵Yt,在Yt中,Ym由于标签传播,已经被传播赋值为对应的标签,所以可以得到Ym对应的标签。
105、基于相似度融合矩阵与初始化样本标签矩阵对待分类对象进行标签传播,并迭代得到最终的标签分布矩阵。
在本发明实施例中,相似度融合矩阵中每个矩阵元素代表对应两个全局对象的融合相似度,以每一个全局对象作为一个节点,每两个全局对象间的相似度作为对应两个节点之间的连线,构建对象图结构。
其中,上述对象图结构中包括待分类对象节点、已分类对象节点,上述待分类对象节点对应待分类对象,上述已分类对象节点对应已分类对象。
进一步的,在一种可能的实施例中,已分类对象包括正样本标签数据以及负样本标签数据,对应的,样本场所包括包括正样本对象与负样本对象,则上述对象图结构中包括待分类对象节点、正样本对象节点、负样本对象节点,上述待分类对象节点对应待分类对象,上述正样本对象节点对应正样本对象,上述负样本对象节点对应负样本对象。
可选的,两个节点之间的连线表示该两个节点之间的相似度,在一种可能的实施例中,不同的相似度,对应不同形式的连线,比如不同的相似度对应不同颜色值的连线,或不同的相似度对应不同粗细的连线等。
进一步的,在本发明实施例中,上述的场所图结构可以根据相似度矩阵进行构建,上述的场所图结构可以理解为相似度矩阵的地图显示。
在本发明实施例中,基于场所节点图结构,对目标场所节点进行标签传播。
在对象图结构中,一个对象节点会与多个对象节点进行连线,比如,设全局对象节点数量为K,则一个全局对象节点会与K-1个全局对象节点进行连线。假设有n个已分类对象节点,m个待分类对象节点,则一个已分类对象节点会与n-1个已分类对象节点连线,与m个待分类对象节点连线,同样的,一个待分类对象节点会与n个已分类对象节点连线,与m-1个待分类对象节点连线。
在本发明实施例中,由于待分类对象节点是没有标签的,而已分类对象节点是有标签的,可以根据已分类对象节点以及与已分类对象节点相关的相似度,对待分类对象节点进行标签传播。通过标签传播,将与已分类对象节点且有高相似度的待分类对象节点认为是同一类属性的对象,进而将已分类对象节点的标签传播到该待分类对象节点,使得该待分类对象节点具有与该已分类对象节点相同的标签。这样,就可以预测得到待分类对象节点的标签,从而根据标签将对应的目标对象进行分类。
遍历对象节点图结构,对所有的待分类对象进行标签传播,得到对应的标签矩阵。
在本发明实施例中,基于相似度融合矩阵与初始化样本标签矩阵对待分类对象进行标签传播的步骤直到收敛,得到最终的标签分布矩阵。
上述的收敛指的是两次迭代得到标签分布误差小于收敛条件误差。
本发明实施例中,在进行迭代前,可以先获取第一先验参数β1以及第二先验参数β2,其中,第一先验参数β1与第二先验参数β2是和为1的非负数,即β2=1-β1。
在当前迭代过程中,先获取上一次迭代时得到的标签分布矩阵Lt。计算相似度融合矩阵M与上一次迭代时得到的标签分布矩阵Lt的乘积矩阵,并通过所述先验参数β1对上述乘积矩阵进行调整。通过先验参数β2对上述初始化标签矩阵进行调整,并将调整后的初始化标签矩阵与上述乘积矩阵相加,得到当前迭代的标签分布矩阵。
其中,上述的先验参数指的是用户对于初始化样本标签矩阵的自信程度,这需要用户在构建初始化样本标签数据时进行,当用户对于初始化样本标签矩阵的自信程度较高,可以将β2设置较大,β1设置较小,此时,当前迭代所得的标签矩阵Lt+1受初始化标签矩阵影响较大,当用户对于初始化标签矩阵的自信程度较低,可以将β设置较小,β1设置较大,此时,当前迭代所得的标签矩阵Lt+1受初始化标签矩阵影响较小。
进一步的,在获取到相似度融合矩阵后,可以获取相似度融合矩阵的对角矩阵,其中,对角矩阵与上述相似度融合矩阵具有相同的行数与列数,上述对角矩阵的每一个对角值为上述相似度矩阵中相同行的总和。基于对角矩阵,计算相似度融合矩阵的拉普拉斯矩阵;计算度矩阵的拉普拉斯矩阵与上一次迭代时得到的标签分布矩阵的乘积,得到乘积矩阵。
具体的,本发明实施例中,设第一先验参数为β,第二先验参数为(1-β),有具体的迭代公式如下:
式中,D是对角矩阵,其对角值对应相似度融合矩阵M每行的总和。Y是初始化样本标签矩阵,Lt是上一次迭代得到的标签分布矩阵。通过迭代公式进行迭代学习,迭代上述步骤直到收敛。需要说明的是,上述的初始化样本标签矩阵与每次迭代得到的标签分布矩阵具有相同的维度。
需要说明的是,上述的对角矩阵D具有与相似度融合矩阵M相同的维度,设相似度融合矩阵M的维度为K*K,则对角矩阵D的维度也为K*K,初始化样本标签矩阵Y的维度为(n+m)*C,n为已分类对象数量,m为待分类对象数量,故n+m为全局对象的数量,也为K,即初始化样本标签矩阵Y的维度为K*C,C为属性的类别数。以第一次迭代为例,由于是第一次迭代,上一次迭代得到的标签分布矩阵可以认为是Y,则当前迭代得到的标签分布矩阵L=β(K*K*K*K*K*K)*K*C+(1-β)*K*C=β(K*C)+(1-β)*K*C;其中,需要说明的是,上述的K*K与K*C为矩阵的维度表达,并不是矩阵内具体数值表达,并不具备数值意义上的等同。
由上述的迭代公式可以看出,求解的时间开销在于式(5)。显然地,时间开销与矩阵维度相关。式(5)的时间复杂度为O(K3),K是相似度融合矩阵M的行维度。相较于时间复杂度为O(K2)或O(K1)的迭代方法而言,时间复杂度指数增加,其梯度下降更快,能够快速迭代收敛,迭代效果如图6所示。
106、根据最终的标签分布矩阵对待分类对象进行分类。
在迭代完成后,得到最终的全局对象节点的标签分布矩阵,根据该标签分布矩阵,可以查询对应的待分类对象节点的标签,从而确定待分类对象对应的标签,根据该待分类对象对应的标签来确定该待分类对象的属性分类。
本发明实施例中,获取全局对象的统计数据,所述全局对象包括待分类对象以及已分类对象,其中,待分类对象数量大于已分类对象数量;根据所述统计数据,提取各个全局对象对应的动态特征以及静态特征;根据所述动态特征与所述静态特征计算所述全局对象对应的相似度融合矩阵;获取已分类对象的样本标签数据,并根据所述样本标签数据获取初始化样本标签矩阵;基于所述相似度融合矩阵与所述初始化样本标签矩阵对所述待分类对象进行标签传播,并迭代得到最终的标签分布矩阵;根据所述最终的标签分布矩阵对所述待分类对象进行分类。通过将静态特征与动态特征的相似度融合矩阵,使得多个维度的特征被融合在一起,再通过标签传播对待分类对象进行分类,可以使得对象分类在复杂维度上进行,提高对象分类的效果。
需要说明的是,本发明实施例提供的对象分类方法可以应用于可以进行对象分类的手机、监控器、计算机、服务器等设备。
请参见图7,图7是本发明实施例提供的一种对象分类装置的结构示意图,该装置用于人员对象或场所对象的分类,如图7所示,所述装置包括:
第一获取模块701,用于获取全局对象的统计数据,所述全局对象包括待分类对象以及已分类对象,其中,待分类对象数量大于已分类对象数量,所述全局对象的类型为人员对象或场所对象,所述统计数据包括基于时间变化属性的动态信息以及基于固定属性的静态信息,所述统计数据根据所述全局对象的图像档案进行获取;
计算模块702,用于根据所述动态信息以及静态信息,计算得到所述全局对象对应的相似度融合矩阵;
第二获取模块703,用于获取所述已分类对象的样本标签数据,并根据所述样本标签数据获取初始化样本标签矩阵,所述样本标签数据为预先对所述已分类对象进行标注得到,所述样本标签数据包括基于人员对象的类别标签或基于场所对象的类别标签或基于物体对象的类别标签;
迭代模块704,用于基于所述相似度融合矩阵与所述初始化样本标签矩阵对所述待分类对象进行标签传播,并迭代得到最终的标签分布矩阵;
分类模块705,用于根据所述最终的标签分布矩阵对所述待分类对象进行分类。
可选的,如图8所示,所述计算模块702,包括:
提取子模块7021,用于根据所述动态信息以及静态信息,分别提取各个全局对象对应的动态特征以及静态特征;
计算子模块7022,用于根据所述动态特征与所述静态特征计算所述全局对象对应的相似度融合矩阵。
可选的,如图9所示,所述相似度融合矩阵为第一相似度融合矩阵,所述计算子模块7022,包括:
第一计算单元70221,用于遍历计算各个全局对象之间的动态特征相似度,得到动态相似度矩阵;以及
第二计算单元70222,用于遍历计算各个全局对象之间的静态特征相似度,得到静态相似度矩阵;
第一融合单元70223,用于将所述动态相似度矩阵以及所述静态相似度矩阵进行融合,得到第一相似度融合矩阵。
可选的,如图10所示,所述第一融合单元70223,包括:
获取子单元702231,用于获取第一权重参数以及第二权重参数,所述第一权重参数与所述第二权重参数为非负数,且所述第一权重参数与所述第二权重参数的和等于1;
第一计算子单元702232,用于通过所述第一权重参数对所述动态相似度矩阵进行加权计算,得到加权动态相似度矩阵;以及
第二计算子单元702233,用于通过所述第二权重参数对所述静态相似度矩阵进行加权计算,得到加权静态相似度矩阵;
第一融合子单元702234,用于将所述加权动态相似度矩阵与所述加权静态相似度矩阵求和,得到第一相似度融合矩阵。
可选的,如图11所示,所述相似度融合矩阵为第二相似度融合矩阵,所述计算子模块7022,包括:
拼接单元70224,用于将每个全局对象对应的动态特征以及静态特征进行拼接,得到每个全局对象对应的拼接特征;
第三计算单元70225,用于遍历计算各个全局对象之间的拼接特征相似度,得到第二相似度融合矩阵。
可选的,如图12所示,所述第三计算单元70225,包括:
拼接子单元702251,用于将所述全局对象对应的拼接特征构建成全局对象对应的拼接矩阵;
归一化子单元702252,用于对所述拼接特征矩阵进行归一化,得到全局对象对应的归一化拼接矩阵;
第一计算子单元702253,用于遍历计算归一化拼接矩阵中,每两个全局对象对应的相似度,得到第二相似度融合矩阵。
可选的,如图13所示,所述迭代模块704,包括:
第一获取子模块7041,用于获取第一先验参数以及第二先验参数,其中,第一先验参数与第二先验参数是和为1的非负数;
第二获取子模块7042,用于获取上一次迭代时得到的标签分布矩阵;
第一调整子模块7043,用于计算所述相似度融合矩阵与所述上一次迭代时得到的标签分布矩阵的乘积矩阵,并通过所述第一先验参数对所述乘积矩阵进行加权调整;
第二调整子模块7044,用于通过所述第二先验参数对所述初始化样本标签矩阵进行加权调整,并将加权调整后的初始化样本标签矩阵与所述乘积矩阵相加,得到当前迭代的标签分布矩阵;
迭代子模块7045,用于迭代上述步骤直到收敛,得到最终的标签分布矩阵。
可选的,如图14所示,所述第一调整子模块7043,包括:
获取单元70431,用于获取所述相似度融合矩阵的对角矩阵,所述对角矩阵与所述相似度融合矩阵具有相同的行数与列数,所述对角矩阵的每一个对角值为所述相似度融合矩阵中相同行的总和;
第二计算单元70432,用于基于所述对角矩阵,计算所述相似度融合矩阵的拉普拉斯矩阵;
第三计算单元70433,用于计算所述度矩阵的拉普拉斯矩阵与所述上一次迭代时得到的标签分布矩阵的乘积,得到乘积矩阵。
可选的,所述统计数据根据所述全局对象的图像档案进行获取。
需要说明的是,本发明实施例提供的对象分类装置可以应用于可以进行对象分类的手机、监控器、计算机、服务器等设备。
本发明实施例提供的对象分类装置能够实现上述方法实施例中对象分类方法实现的各个过程,且可以达到相同的有益效果。为避免重复,这里不再赘述。
参见图15,图15是本发明实施例提供的一种电子设备的结构示意图,如图15所示,包括:存储器1502、处理器1501及存储在所述存储器1502上并可在所述处理器1501上运行的计算机程序,其中:
处理器1501用于调用存储器1502存储的计算机程序,执行如下步骤:
获取全局对象的统计数据,所述全局对象包括待分类对象以及已分类对象,其中,待分类对象数量大于已分类对象数量,所述全局对象的类型为人员对象或场所对象,所述统计数据包括基于时间变化属性的动态信息以及基于固定属性的静态信息,所述统计数据根据所述全局对象的图像档案进行获取;
根据所述动态信息以及静态信息,计算得到所述全局对象对应的相似度融合矩阵;
获取所述已分类对象的样本标签数据,并根据所述样本标签数据获取初始化样本标签矩阵,所述样本标签数据为预先对所述已分类对象进行标注得到,所述样本标签数据包括基于人员对象的类别标签或基于场所对象的类别标签或基于物体对象的类别标签;
基于所述相似度融合矩阵与所述初始化样本标签矩阵对所述待分类对象进行标签传播,并迭代得到最终的标签分布矩阵;
根据所述最终的标签分布矩阵对所述待分类对象进行分类。
可选的,处理器1501执行的所述根据所述动态信息以及静态信息,计算得到所述全局对象对应的相似度融合矩阵,包括:
根据所述动态信息以及静态信息,分别提取各个全局对象对应的动态特征以及静态特征;
根据所述动态特征与所述静态特征计算所述全局对象对应的相似度融合矩阵。
可选的,所述相似度融合矩阵为第一相似度融合矩阵,处理器1501执行的所述根据所述动态特征与所述静态特征计算所述全局对象对应的相似度融合矩阵,包括:
遍历计算各个全局对象之间的动态特征相似度,得到动态相似度矩阵;以及
遍历计算各个全局对象之间的静态特征相似度,得到静态相似度矩阵;
将所述动态相似度矩阵以及所述静态相似度矩阵进行融合,得到第一相似度融合矩阵。
可选的,处理器1501执行的所述将所述动态相似度矩阵以及所述静态相似度矩阵进行融合,得到第一相似度融合矩阵,包括:
获取第一权重参数以及第二权重参数,所述第一权重参数与所述第二权重参数为非负数,且所述第一权重参数与所述第二权重参数的和等于1;
通过所述第一权重参数对所述动态相似度矩阵进行加权计算,得到加权动态相似度矩阵;以及
通过所述第二权重参数对所述静态相似度矩阵进行加权计算,得到加权静态相似度矩阵;
将所述加权动态相似度矩阵与所述加权静态相似度矩阵求和,得到第一相似度融合矩阵。
可选的,所述相似度融合矩阵为第二相似度融合矩阵,处理器1501执行的所述根据所述动态特征与所述静态特征计算所述全局对象对应的相似度融合矩阵,包括:
将每个全局对象对应的动态特征以及静态特征进行拼接,得到每个全局对象对应的拼接特征;
遍历计算各个全局对象之间的拼接特征相似度,得到第二相似度融合矩阵。
可选的,处理器1501执行的所述遍历计算各个全局对象之间的拼接特征相似度,得到第二相似度融合矩阵,包括:
将所述全局对象对应的拼接特征构建成全局对象对应的拼接矩阵;
对所述拼接特征矩阵进行归一化,得到全局对象对应的归一化拼接矩阵;
遍历计算归一化拼接矩阵中,每两个全局对象对应的相似度,得到第二相似度融合矩阵。
可选的,处理器1501执行的所述基于所述相似度融合矩阵与所述初始化样本标签矩阵对所述待分类对象进行标签传播,并迭代得到最终的标签分布矩阵,包括:
获取第一先验参数以及第二先验参数,其中,第一先验参数与第二先验参数是和为1的非负数;
获取上一次迭代时得到的标签分布矩阵;
计算所述相似度融合矩阵与所述上一次迭代时得到的标签分布矩阵的乘积矩阵,并通过所述第一先验参数对所述乘积矩阵进行加权调整;
通过所述第二先验参数对所述初始化样本标签矩阵进行加权调整,并将加权调整后的初始化样本标签矩阵与所述乘积矩阵相加,得到当前迭代的标签分布矩阵;
迭代上述步骤直到收敛,得到最终的标签分布矩阵。
可选的,处理器1501执行的所述计算所述相似度融合矩阵与所述上一次迭代时得到的标签分布矩阵的乘积矩阵,包括:
获取所述相似度融合矩阵的对角矩阵,所述对角矩阵与所述相似度融合矩阵具有相同的行数与列数,所述对角矩阵的每一个对角值为所述相似度融合矩阵中相同行的总和;
基于所述对角矩阵,计算所述相似度融合矩阵的拉普拉斯矩阵;
计算所述相似度融合矩阵的拉普拉斯矩阵与所述上一次迭代时得到的标签分布矩阵的乘积,得到乘积矩阵。
可选的,所述统计数据根据所述全局对象的图像档案进行获取。
需要说明的是,上述电子设备可以是可以应用于可以进行对象分类的手机、监控器、计算机、服务器等设备。
本发明实施例提供的电子设备能够实现上述方法实施例中对象分类方法实现的各个过程,且可以达到相同的有益效果,为避免重复,这里不再赘述。
本发明实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现本发明实施例提供的对象分类方法的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存取存储器(Random AccessMemory,简称RAM)等。
以上所揭露的仅为本发明较佳实施例而已,当然不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。
Claims (12)
1.一种对象分类方法,其特征在于,所述方法用于人员对象或场所对象的分类,所述方法包括以下步骤:
获取全局对象的统计数据,所述全局对象包括待分类对象以及已分类对象,其中,待分类对象数量大于已分类对象数量,所述全局对象的类型为人员对象或场所对象,所述统计数据包括基于时间变化属性的动态信息以及基于固定属性的静态信息;
根据所述动态信息以及静态信息,计算得到所述全局对象对应的相似度融合矩阵;
获取所述已分类对象的样本标签数据,并根据所述样本标签数据获取初始化样本标签矩阵,所述样本标签数据为预先对所述已分类对象进行标注得到,所述样本标签数据包括基于人员对象的类别标签或基于场所对象的类别标签或基于物体对象的类别标签;
基于所述相似度融合矩阵与所述初始化样本标签矩阵对所述待分类对象进行标签传播,并迭代得到最终的标签分布矩阵;
根据所述最终的标签分布矩阵对所述待分类对象进行分类。
2.如权利要求1所述的方法,其特征在于,所述根据所述动态信息以及静态信息,计算得到所述全局对象对应的相似度融合矩阵,包括:
根据所述动态信息以及静态信息,分别提取各个全局对象对应的动态特征以及静态特征;
根据所述动态特征与所述静态特征计算所述全局对象对应的相似度融合矩阵。
3.如权利要求2所述的方法,其特征在于,所述相似度融合矩阵为第一相似度融合矩阵,所述根据所述动态特征与所述静态特征计算所述全局对象对应的相似度融合矩阵,包括:
遍历计算各个全局对象之间的动态特征相似度,得到动态相似度矩阵;以及
遍历计算各个全局对象之间的静态特征相似度,得到静态相似度矩阵;
将所述动态相似度矩阵以及所述静态相似度矩阵进行融合,得到第一相似度融合矩阵。
4.如权利要求3所述的方法,其特征在于,所述将所述动态相似度矩阵以及所述静态相似度矩阵进行融合,得到第一相似度融合矩阵,包括:
获取第一权重参数以及第二权重参数,所述第一权重参数与所述第二权重参数为非负数,且所述第一权重参数与所述第二权重参数的和等于1;
通过所述第一权重参数对所述动态相似度矩阵进行加权计算,得到加权动态相似度矩阵;以及
通过所述第二权重参数对所述静态相似度矩阵进行加权计算,得到加权静态相似度矩阵;
将所述加权动态相似度矩阵与所述加权静态相似度矩阵求和,得到第一相似度融合矩阵。
5.如权利要求2所述的方法,其特征在于,所述相似度融合矩阵为第二相似度融合矩阵,所述根据所述动态特征与所述静态特征计算所述全局对象对应的相似度融合矩阵,包括:
将每个全局对象对应的动态特征以及静态特征进行拼接,得到每个全局对象对应的拼接特征;
遍历计算各个全局对象之间的拼接特征相似度,得到第二相似度融合矩阵。
6.如权利要求5所述的方法,其特征在于,所述遍历计算各个全局对象之间的拼接特征相似度,得到第二相似度融合矩阵,包括:
将所述全局对象对应的拼接特征构建成全局对象对应的拼接矩阵;
对所述拼接特征矩阵进行归一化,得到全局对象对应的归一化拼接矩阵;
遍历计算归一化拼接矩阵中,每两个全局对象对应的相似度,得到第二相似度融合矩阵。
7.如权利要求1-6中任一所述的方法,其特征在于,所述基于所述相似度融合矩阵与所述初始化样本标签矩阵对所述待分类对象进行标签传播,并迭代得到最终的标签分布矩阵,包括:
获取第一先验参数以及第二先验参数,其中,第一先验参数与第二先验参数是和为1的非负数;
获取上一次迭代时得到的标签分布矩阵;
计算所述相似度融合矩阵与所述上一次迭代时得到的标签分布矩阵的乘积矩阵,并通过所述第一先验参数对所述乘积矩阵进行加权调整;
通过所述第二先验参数对所述初始化样本标签矩阵进行加权调整,并将加权调整后的初始化样本标签矩阵与所述乘积矩阵相加,得到当前迭代的标签分布矩阵;
迭代上述步骤直到收敛,得到最终的标签分布矩阵。
8.如权利要求7所述的方法,其特征在于,所述计算所述相似度融合矩阵与所述上一次迭代时得到的标签分布矩阵的乘积矩阵,包括:
获取所述相似度融合矩阵的对角矩阵,所述对角矩阵与所述相似度融合矩阵具有相同的行数与列数,所述对角矩阵的每一个对角值为所述相似度融合矩阵中相同行的总和;
基于所述对角矩阵,计算所述相似度融合矩阵的拉普拉斯矩阵;
计算所述相似度融合矩阵的拉普拉斯矩阵与所述上一次迭代时得到的标签分布矩阵的乘积,得到乘积矩阵。
9.如权利要求1所述的方法,其特征在于,所述统计数据根据所述全局对象的图像档案进行获取。
10.一种对象分类装置,其特征在于,所述方法用于人员对象或场所对象的分类,所述装置包括:
第一获取模块,用于获取全局对象的统计数据,所述全局对象包括待分类对象以及已分类对象,其中,待分类对象数量大于已分类对象数量,所述全局对象的类型为人员对象或场所对象,所述统计数据包括基于时间变化属性的动态信息以及基于固定属性的静态信息,所述统计数据根据所述全局对象的图像档案进行获取;
计算模块,用于根据所述动态信息以及静态信息,计算得到所述全局对象对应的相似度融合矩阵;
第二获取模块,用于获取所述已分类对象的样本标签数据,并根据所述样本标签数据获取初始化样本标签矩阵,所述样本标签数据为预先对所述已分类对象进行标注得到,所述样本标签数据包括基于人员对象的类别标签或基于场所对象的类别标签或基于物体对象的类别标签;
迭代模块,用于基于所述相似度融合矩阵与所述初始化样本标签矩阵对所述待分类对象进行标签传播,并迭代得到最终的标签分布矩阵;
分类模块,用于根据所述最终的标签分布矩阵对所述待分类对象进行分类。
11.一种电子设备,其特征在于,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至9中任一项所述的对象分类方法中的步骤。
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至9中任一项所述的对象分类方法中的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010839712.8A CN112132178B (zh) | 2020-08-19 | 2020-08-19 | 对象分类方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010839712.8A CN112132178B (zh) | 2020-08-19 | 2020-08-19 | 对象分类方法、装置、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112132178A true CN112132178A (zh) | 2020-12-25 |
CN112132178B CN112132178B (zh) | 2023-10-13 |
Family
ID=73850990
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010839712.8A Active CN112132178B (zh) | 2020-08-19 | 2020-08-19 | 对象分类方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112132178B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113544700A (zh) * | 2020-12-31 | 2021-10-22 | 商汤国际私人有限公司 | 神经网络的训练方法和装置、关联对象的检测方法和装置 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9031951B1 (en) * | 2012-04-02 | 2015-05-12 | Google Inc. | Associating interest and disinterest keywords with similar and dissimilar users |
CN107146096A (zh) * | 2017-03-07 | 2017-09-08 | 浙江工业大学 | 一种智能视频广告展示方法及装置 |
WO2018013982A1 (en) * | 2016-07-14 | 2018-01-18 | Google Llc | Classifying images using machine learning models |
WO2018171531A1 (en) * | 2017-03-23 | 2018-09-27 | Beijing Didi Infinity Technology And Development Co., Ltd. | System and method for predicting classification for object |
US20180285658A1 (en) * | 2015-09-29 | 2018-10-04 | Volkswagen Aktiengesellschaft | Device and method for the characterization of objects |
CN108848065A (zh) * | 2018-05-24 | 2018-11-20 | 中电运行(北京)信息技术有限公司 | 一种网络入侵检测方法、系统、介质及设备 |
CN110428139A (zh) * | 2019-07-05 | 2019-11-08 | 阿里巴巴集团控股有限公司 | 基于标签传播的信息预测方法及装置 |
WO2020015075A1 (zh) * | 2018-07-18 | 2020-01-23 | 平安科技(深圳)有限公司 | 人脸图像比对方法、装置、计算机设备及存储介质 |
CN111178458A (zh) * | 2020-04-10 | 2020-05-19 | 支付宝(杭州)信息技术有限公司 | 分类模型的训练、对象分类方法及装置 |
CN111382190A (zh) * | 2020-03-04 | 2020-07-07 | 腾讯科技(深圳)有限公司 | 一种基于智能的对象推荐方法、装置和存储介质 |
-
2020
- 2020-08-19 CN CN202010839712.8A patent/CN112132178B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9031951B1 (en) * | 2012-04-02 | 2015-05-12 | Google Inc. | Associating interest and disinterest keywords with similar and dissimilar users |
US20180285658A1 (en) * | 2015-09-29 | 2018-10-04 | Volkswagen Aktiengesellschaft | Device and method for the characterization of objects |
WO2018013982A1 (en) * | 2016-07-14 | 2018-01-18 | Google Llc | Classifying images using machine learning models |
CN107146096A (zh) * | 2017-03-07 | 2017-09-08 | 浙江工业大学 | 一种智能视频广告展示方法及装置 |
WO2018171531A1 (en) * | 2017-03-23 | 2018-09-27 | Beijing Didi Infinity Technology And Development Co., Ltd. | System and method for predicting classification for object |
CN108848065A (zh) * | 2018-05-24 | 2018-11-20 | 中电运行(北京)信息技术有限公司 | 一种网络入侵检测方法、系统、介质及设备 |
WO2020015075A1 (zh) * | 2018-07-18 | 2020-01-23 | 平安科技(深圳)有限公司 | 人脸图像比对方法、装置、计算机设备及存储介质 |
CN110428139A (zh) * | 2019-07-05 | 2019-11-08 | 阿里巴巴集团控股有限公司 | 基于标签传播的信息预测方法及装置 |
CN111382190A (zh) * | 2020-03-04 | 2020-07-07 | 腾讯科技(深圳)有限公司 | 一种基于智能的对象推荐方法、装置和存储介质 |
CN111178458A (zh) * | 2020-04-10 | 2020-05-19 | 支付宝(杭州)信息技术有限公司 | 分类模型的训练、对象分类方法及装置 |
Non-Patent Citations (1)
Title |
---|
胡啸峰;石拓;瞿珂;: "融合静态属性和动态轨迹的盗窃前科人员分类研究", 北京理工大学学报, no. 01 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113544700A (zh) * | 2020-12-31 | 2021-10-22 | 商汤国际私人有限公司 | 神经网络的训练方法和装置、关联对象的检测方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
CN112132178B (zh) | 2023-10-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Dong et al. | Automatic age estimation based on deep learning algorithm | |
US9633045B2 (en) | Image ranking based on attribute correlation | |
Adams et al. | A survey of feature selection methods for Gaussian mixture models and hidden Markov models | |
CN111125358A (zh) | 一种基于超图的文本分类方法 | |
CN111881671B (zh) | 一种属性词提取方法 | |
CN110751038A (zh) | 一种基于图注意力机制的pdf表格结构识别方法 | |
CN115482418B (zh) | 基于伪负标签的半监督模型训练方法、系统及应用 | |
US20200258132A1 (en) | System and method for personalized product recommendation using hierarchical bayesian | |
CN116522143B (zh) | 模型训练方法、聚类方法、设备及介质 | |
CN110909125A (zh) | 推文级社会媒体谣言检测方法 | |
CN111191031A (zh) | 一种基于WordNet和IDF的非结构化文本的实体关系分类方法 | |
Taylor et al. | Artificial intelligence from colonial india: Race, statistics, and facial recognition in the global south | |
Kasai | Multi-view Wasserstein discriminant analysis with entropic regularized Wasserstein distance | |
CN112131261A (zh) | 基于社区网络的社区查询方法、装置和计算机设备 | |
CN112560504A (zh) | 抽取表单文档中信息的方法、电子设备和计算机可读介质 | |
Koduvely | Learning Bayesian Models with R | |
Qin | Application of efficient recognition algorithm based on deep neural network in English teaching scene | |
CN112132178B (zh) | 对象分类方法、装置、电子设备及存储介质 | |
Su et al. | Low‐Rank Deep Convolutional Neural Network for Multitask Learning | |
Huang et al. | Unsupervised learning of word-sequence representations from scratch via convolutional tensor decomposition | |
CN109299291A (zh) | 一种基于卷积神经网络的问答社区标签推荐方法 | |
Liu et al. | A three-stage method for batch-based incremental nonnegative matrix factorization | |
CN113496119B (zh) | 抽取表格中的元组数据的方法、电子设备和计算机可读介质 | |
CN111767402B (zh) | 一种基于对抗学习的限定域事件检测方法 | |
CN114529063A (zh) | 一种基于机器学习的金融领域数据预测方法、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |