CN113742510A - 聚档类簇中心的确定方法、装置、计算机设备和存储介质 - Google Patents
聚档类簇中心的确定方法、装置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN113742510A CN113742510A CN202110990263.1A CN202110990263A CN113742510A CN 113742510 A CN113742510 A CN 113742510A CN 202110990263 A CN202110990263 A CN 202110990263A CN 113742510 A CN113742510 A CN 113742510A
- Authority
- CN
- China
- Prior art keywords
- image
- correlation
- original
- cluster
- time
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 45
- 238000004364 calculation method Methods 0.000 claims abstract description 64
- 230000002123 temporal effect Effects 0.000 claims description 29
- 238000012216 screening Methods 0.000 claims description 27
- 238000004590 computer program Methods 0.000 claims description 18
- 238000012545 processing Methods 0.000 claims description 17
- 238000000605 extraction Methods 0.000 claims description 11
- 238000012512 characterization method Methods 0.000 claims description 10
- 238000012544 monitoring process Methods 0.000 abstract description 4
- 238000010586 diagram Methods 0.000 description 9
- 238000003062 neural network model Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/5866—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, manually generated location and time information
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/587—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using geographical or spatial information, e.g. location
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Library & Information Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Image Analysis (AREA)
Abstract
本申请涉及一种类簇中心的确定方法、装置、计算机设备以及计算机可读存储介质,通过获取图像档案中的原始图像、原始图像的拍摄时间和拍摄地点,得到原始图像的图像特征、时间特征和地理位置特征;基于上述特征,得到原始图像两两之间的图像相关性、时间相关性和空间相关性,对这三方面相关性的计算结果进行加权处理,得到原始图像两两之间的综合相关性,从而筛选出综合相关性超过预设相关性阈值的原始图像作为图像档案的类簇中心。本申请充分挖掘视频监控有效数据,除了利用原始图像本身的图像特征外,还利用了原始图像的时间特征和地理位置特征,通过这三方面相关性综合考虑,筛选出高质量的图像作为类簇中心,有效提高落档准确率。
Description
技术领域
本申请涉及图像处理技术领域,特别是涉及一种聚档类簇中心的确定方法、装置、计算机设备和计算机可读存储介质。
背景技术
在人像聚档中涉及一类关键技术:人像档案的类簇中心表示。前端设备抓拍的人像图像最终需要落档,人像图像需要与底档进行相似度的比较,找到与之匹配的档案并落档。但与档案中的每张图像都计算相似度计算量太大,这时需要有一个类簇中心来代表档案,待落档的图像只需与每个档案的类簇中心进行相似度的计算即可。类簇中心质量的好坏,直接关心到落档的准确性,对一人一档的目标至关重要。
相关技术中,根据图像特征的相关度确定一个档案中的类簇中心。
然而,图像特征是通过神经网络模型提取的,现有的神经网络模型提取的图像特征是从人像图像中提取的图像本身的特征信息,而不包含除人像图像以外的其他信息,导致最终筛选出来的聚簇中心不够准确,从而导致容易出现落档错误的问题。针对相关技术中,存在的落档准确率低的问题,目前尚未提出有效的解决方案。
发明内容
基于此,有必要针对上述技术问题,提供一种聚档类簇中心的确定方法、装置、计算机设备以及计算机可读存储介质,以解决相关技术中存在的落档准确率低的问题。
第一个方面,本申请实施例了一种聚档类簇中心的确定方法,包括以下步骤:
获取图像档案中的原始图像、所述原始图像的拍摄时间和所述原始图像的拍摄地点;
对所述原始图像、所述拍摄时间以及所述拍摄地点进行特征化处理,得到所述原始图像的图像特征、时间特征和地理位置特征;
基于所述图像特征、所述时间特征和所述地理位置特征,计算所述图像档案中的所述原始图像两两之间的图像相关性、时间相关性和空间相关性;
对所述图像相关性、所述时间相关性和所述空间相关性的计算结果进行加权处理,得到所述原始图像两两之间的综合相关性,从所述图像档案中筛选出所述综合相关性超过预设相关性阈值的所述原始图像作为所述图像档案的类簇中心。
在其中一些实施例中,基于所述图像特征、所述时间特征和所述地理位置特征,计算所述图像档案中的所述原始图像两两之间的图像相关性、时间相关性和空间相关性,包括以下步骤:
基于所述时间特征,计算所述图像档案中的所有所述原始图像两两之间的时间相关性,得到所述时间相关性的计算结果;
根据所述时间相关性的计算结果,从所述图像档案中筛选出所述时间相关性超过预设第一阈值的所述原始图像,组成第一图像集;
基于所述地理位置特征,计算所述第一图像集中的所述原始图像两两之间的空间相关性,得到所述空间相关性的计算结果;
根据所述空间相关性的计算结果,从所述第一图像集中筛选出所述空间相关性超过预设第二阈值的所述原始图像,组成第二图像集;
基于所述图像特征,计算所述第二图像集中的所述原始图像两两之间的图像相关性,得到所述图像相关性的计算结果。
在其中一些实施例中,所述时间相关度、所述空间相关性和所述图像相关性的计算方式为皮尔逊相关系数计算法或斯皮尔曼相关系数计算法。
在其中一些实施例中,在所述从所述图像档案中筛选出所述综合相关性超过预设相关性阈值的所述原始图像作为所述图像档案的类簇中心之后,所述方法还包括:
根据所述类簇中心中的所述原始图像的所述图像特征,得到所述类簇中心的结构化形式。
在其中一些实施例中,在所述从所述图像档案中筛选出所述综合相关性超过预设相关性阈值的所述原始图像作为所述图像档案的类簇中心之后,所述方法还包括:
根据所述类簇中心中的所述原始图像的所述图像特征和所述类簇中心中的所述原始图像两两之间的所述综合相关性,得到所述类簇中心的结构化形式。
在其中一些实施例中,所述原始图像的图像特征通过以下步骤得到:
将所述原始图像输入训练完备的特征提取网络,得到所述原始图像的图像特征。
在其中一些实施例中,所述时间特征为时间戳,所述地理位置特征为经纬度。
第二个方面,在本实施例中提供了一种聚档类簇中心的确定装置,所述装置包括:获取模块、特征模块、相关性模块、结果模块:
所述获取模块,用于获取图像档案中的原始图像、所述原始图像的拍摄时间和所述原始图像的拍摄地点;
所述特征模块,用于对所述原始图像、所述拍摄时间以及所述拍摄地点进行特征化处理,得到所述原始图像的图像特征、时间特征和地理位置特征;
所述相关性模块,用于基于所述图像特征、所述时间特征和所述地理位置特征,计算所述图像档案中的所述原始图像两两之间的图像相关性、时间相关性和空间相关性;
所述结果模块,用于对所述图像相关性、所述时间相关性和所述空间相关性的计算结果进行加权处理,得到所述原始图像两两之间的综合相关性,从所述图像档案中筛选出所述综合相关性超过预设相关性阈值的所述原始图像作为所述图像档案的类簇中心。
第三个方面,在本实施例中提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一个方面所述方法的步骤。
第四个方面,在本实施例中提供了计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述第一个方面所述的方法的步骤。
上述类簇中心的确定方法、装置、计算机设备以及计算机可读存储介质,通过获取图像档案中的原始图像、原始图像的拍摄时间和原始图像的拍摄地点;对原始图像、拍摄时间以及拍摄地点进行特征化处理,得到原始图像的图像特征、时间特征和地理位置特征;基于图像特征、时间特征和地理位置特征,计算图像档案中的原始图像两两之间的图像相关性、时间相关性和空间相关性;对图像相关性、时间相关性和空间相关性的计算结果进行加权处理,得到原始图像两两之间的综合相关性,从图像档案中筛选出综合相关性超过预设相关性阈值的原始图像作为图像档案的类簇中心。本申请在确定聚档类簇中心的过程中,充分挖掘图像档案的有效数据,除了利用原始图像本身的图像特征外,还利用了原始图像的时间特征和地理位置特征,通过这三方面相关性综合考虑,筛选出高质量的图像作为类簇中心,有效提高落档准确率。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请实施例提供的聚档类簇中心的确定方法的应用场景图;
图2是根据本申请实施例提供的聚档类簇中心的确定方法的原理图;
图3是根据本申请实施例提供的聚档类簇中心的确定方法的流程图一;
图4是根据本申请实施例提供的聚档类簇中心的确定方法的流程图二;
图5是根据本申请实施例提供的聚档类簇中心的确定装置的结构示意图;
图6是根据本申请实施例提供的计算机设备的结构示意图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行描述和说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。基于本申请提供的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
显而易见地,下面描述中的附图仅仅是本申请的一些示例或实施例,对于本领域的普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图将本申请应用于其他类似情景。此外,还可以理解的是,虽然这种开发过程中所作出的努力可能是复杂并且冗长的,然而对于与本申请公开的内容相关的本领域的普通技术人员而言,在本申请揭露的技术内容的基础上进行的一些设计,制造或者生产等变更只是常规的技术手段,不应当理解为本申请公开的内容不充分。
在本申请中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域普通技术人员显式地和隐式地理解的是,本申请所描述的实施例在不冲突的情况下,可以与其它实施例相结合。
除非另作定义,本申请所涉及的技术术语或者科学术语应当为本申请所属技术领域内具有一般技能的人士所理解的通常意义。本申请所涉及的“一”、“一个”、“一种”、“该”等类似词语并不表示数量限制,可表示单数或复数。本申请所涉及的术语“包括”、“包含”、“具有”以及它们任何变形,意图在于覆盖不排他的包含;例如包含了一系列步骤或模块(单元)的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可以还包括没有列出的步骤或单元,或可以还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。本申请所涉及的“连接”、“相连”、“耦接”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电气的连接,不管是直接的还是间接的。本申请所涉及的“多个”是指两个或两个以上。“和/或”描述关联对象的关联关系,表示可以存在三种关系,例如,“A和/或B”可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。本申请所涉及的术语“第一”、“第二”、“第三”等仅仅是区别类似的对象,不代表针对对象的特定排序。
图1为本申请一个实施例提供的聚档类簇中心的确定方法的应用场景图。如图1所示,服务器101与移动终端102之间均可以通过网络进行数据传输。其中,移动终端102用于采集原始图像,并将采集到的原始图像归档,形成图像档案,传输至服务器101中。在服务器101接收到该图像档案中的原始图像后,提取原始图像的拍摄时间和原始图像的拍摄地点;对原始图像、拍摄时间以及拍摄地点进行特征化处理,得到原始图像的图像特征、时间特征和地理位置特征;基于图像特征、时间特征和地理位置特征,计算图像档案中的原始图像两两之间的图像相关性、时间相关性和空间相关性;对图像相关性、时间相关性和空间相关性的计算结果进行加权处理,得到原始图像的综合相关性,从图像档案中筛选出综合相关性超过预设相关性阈值的原始图像作为图像档案的类簇中心。其中,服务器101可以由独立的服务器或者是多个服务器组成的服务器集群来实现,移动终端102可以为摄像机、手机等图像采集设备。
图2为本申请一个实施例提供的聚档类簇中心的确定方法的原理图。如图2所示,在图像档案中,往往包含了拍摄时间和拍摄地点信息。图像档案中有多组原始图像,一般原始图像上会记载抓拍的时间信息和前端设备所处的拍摄地点信息。本申请首先,获取图像档案中的原始图像、抓拍时间和拍摄地点。然后,将原始图像、拍摄时间和拍摄地点进行特征化。例如,通过将原始图像输入训练完备的特征提取网络,构建一个高维向量表示原始图像,得到原始图像的图像特征。抓拍时间转化为可计算形式,如时间2021-06-05 14:24:02转化为时间戳1622874242。地理位置特征主要指经纬度,如果拍摄地点不是经纬度,需要根据拍摄地点获取对应的GPS。其次,基于图像特征、时间特征和地理位置特征,计算图像档案中的原始图像两两之间的图像相关性、时间相关性和空间相关性。最后,最终聚档类簇中心的确定是由图像相关性、时间相关性和空间相关性共同决定的,三者的加权值作为最终作为筛选的依据。本申请在确定聚档类簇中心的过程中,充分挖掘图像档案的有效数据,除了利用原始图像本身的图像特征外,还利用了原始图像的时间特征和地理位置特征,通过这三方面相关性综合计算,筛选出高质量的图像作为类簇中心,有效提高落档准确率。
本申请实施例提供了一种聚档类簇中心的确定方法,可用于图像处理技术领域中的聚档类簇中心的确定,如图3所示,该方法包括如下步骤:
步骤S210,获取图像档案中的原始图像、原始图像的拍摄时间和原始图像的拍摄地点。
具体地,上述图像档案中的原始图像可以是摄像机或者照相机直接拍摄到的各种初始图像,例如人体图象或者其他图像。为了获得高质量的类簇中心,可以预先对初始图像进行预处理操作,比如去噪及增强处理,进而得到图像档案中的原始图像。以人体图像为例,现有的摄像机或者照相机在抓拍人体图像的时候就可以将拍摄时间和拍摄地点显示在人体图像上,所以在获取图像档案中的原始图像的同时,就可以获取到图像档案中的原始图像的拍摄时间和拍摄地点。在图像档案中的原始图像未显示拍摄时间的情况下,可以通过图像档案中的原始图像的保存时间读取原始图像的拍摄时间。在图像档案中的原始图像未显示拍摄地点的情况下,可以通过图像档案中的原始图像的显示内容读取原始图像的拍摄地点。
步骤S220,对原始图像、拍摄时间以及拍摄地点进行特征化处理,得到原始图像的图像特征、时间特征和地理位置特征。
本步骤通过将原始图像、拍摄时间以及拍摄地点进行特征化处理,得到原始图像的图像特征、时间特征和地理位置特征,以实现后续的相关性计算。具体地,可以通过将原始图像输入训练完备的特征提取网络,得到原始图像的图像特征。继续以人体图像为例,图像特征是经特征提取网络后输出的对人体的表征,图像特征表征原始图像中的人体信息,图像特征的表现形式是一个多维向量。可以通过一定的算法将拍摄时间和拍摄地点转化成可计算形式,即得到时间特征和地理位置特征。比如将拍摄时间转化为时间戳,时间戳即为时间特征。通过获取拍摄地点的GPS,将拍摄地点转化为经纬度,经纬度即为地理位置特征。
步骤S230,基于图像特征、时间特征和地理位置特征,计算图像档案中的原始图像两两之间的图像相关性、时间相关性和空间相关性。
具体地,时间相关性可理解为时间跨度,例如图像档案包含了从建档至今的所有的原始图像。对于人体图像而言,人随着时间会发生外貌、衣着和装饰审美等变化,时间太久远的原始图像自然不能作为类簇中心。此外,图像档案中的原始图像一般包含几个主要拍摄地点,不会在所有区域上都会有很频繁的抓拍记录,那些拍摄地点不经常出现的原始图像通常也不能作为类簇中心。图像特征能最直观地体现原始图像中的人体特征,图像相关性反映的是原始图像中的人体两两之间的相关性。可以通过皮尔逊相关系数计算法或斯皮尔曼相关系数计算法计算出图像档案中的原始图像两两之间的图像相关性、时间相关性和空间相关性。那些时间太久远的原始图像往往和图像档案中的其他原始图像的时间相关性很低,那些拍摄地点不经常出现的原始图像往往和图像档案中的其他原始图像的空间相关性很低。
步骤S240,对图像相关性、时间相关性和空间相关性的计算结果进行加权处理,得到原始图像的综合相关性,从图像档案中筛选出综合相关性超过预设相关性阈值的原始图像作为图像档案的类簇中心。
具体地,在上述步骤S230中已经计算出图像档案中的原始图像两两之间的图像相关性、时间相关性和空间相关性,对图像相关性、时间相关性和空间相关性的计算结果进行加权处理,例如赋予图像相关性、时间相关性和空间相关性的权重都为1/3,根据权重比例计算出原始图像两两之间的综合相关性。若在一个原始图像的集合中,所有原始图像两两之间的综合相关性都超过预设相关性阈值,则将这个集合中的原始图像从图像档案中筛选出来,作为图像档案的类簇中心。权重比例和预设相关性阈值可以根据实际需求进行调整。
相关技术中,只根据图像特征的相关度确定一个档案中的类簇中心,然而图像特征是通过神经网络模型提取的,现有的神经网络模型提取的图像特征是从人像图像中提取的图像本身的特征信息,而不包含除人像图像以外的其他信息,导致最终筛选出来的聚簇中心不够准确,从而导致容易出现落档错误的问题。本申请通过上述步骤S210至S240,通过获取图像档案中的原始图像、原始图像的拍摄时间和原始图像的拍摄地点;对原始图像、拍摄时间以及拍摄地点进行特征化处理,得到原始图像的图像特征、时间特征和地理位置特征;基于图像特征、时间特征和地理位置特征,计算图像档案中的原始图像两两之间的图像相关性、时间相关性和空间相关性;对图像相关性、时间相关性和空间相关性的计算结果进行加权处理,得到原始图像两两之间的综合相关性,从图像档案中筛选出综合相关性超过预设相关性阈值的原始图像作为图像档案的类簇中心。本申请在确定聚档类簇中心的过程中,充分挖掘视频监控有效数据,除了利用原始图像本身的图像特征外,还利用了原始图像的时间特征和地理位置特征,通过这三方面相关性综合考虑,筛选出高质量的图像作为类簇中心,有效提高落档准确率。
如图4所示,在其中一个实施例中,基于上述步骤S230,基于图像特征、时间特征和地理位置特征,计算图像档案中的原始图像两两之间的图像相关性、时间相关性和空间相关性,包括以下步骤:
步骤S231,基于时间特征,计算图像档案中的所有原始图像两两之间的时间相关性,得到时间相关性的计算结果。
具体地,在得到图像档案中的原始图像的图像特征、时间特征和地理位置特征之后,优先根据时间特征计算图像档案中的所有原始图像两两之间的时间相关性。
步骤S232,根据时间相关性的计算结果,从图像档案中筛选出时间相关性超过预设第一阈值的原始图像,组成第一图像集。
具体地,根据时间相关性的计算结果,淘汰掉与其他原始图像的时间相关性未超过第一阈值的原始图像,排除这类原始图像作为类簇中心的可能性。只保留与其他原始图像的时间相关性超过第一阈值的原始图像组成第一图像集,将第一图像集中的原始图像作为继续竞选类簇中心的图像,可以有效减少后续获取类簇中心的计算量。第一阈值可以根据实际需求进行设置。
步骤S233,基于地理位置特征,计算第一图像集中的原始图像两两之间的空间相关性,得到空间相关性的计算结果。
具体地,在上述步骤根据时间相关性过滤掉一部分质量差的原始图像后,再计算筛选出来的第一图像集中的原始图像两两之间的空间相关性。
步骤S234,根据空间相关性的计算结果,从第一图像集中筛选出空间相关性超过预设第二阈值的原始图像,组成第二图像集。
具体地,根据空间相关性的计算结果,对第一图像集的原始图像进行再一次过滤,淘汰掉与其他原始图像的空间相关性未超过第二阈值的原始图像,排除这类原始图像作为类簇中心的可能性。只保留与其他原始图像的空间相关性超过第二阈值的原始图像组成第二图像集,将第二图像集中的原始图像作为继续竞选类簇中心的图像,可以有效减少后续获取类簇中心的计算量。第二阈值可以根据实际需求进行设置。
步骤S235,基于图像特征,计算第二图像集中的原始图像两两之间的图像相关性,得到图像相关性的计算结果。
具体地,经过上述步骤从时间相关性和空间相关性的双重过滤之后,只保留了第二图像集中的原始图像,在此步骤中,只需计算第二图像集中的原始图像两两之间的图像相关性,得到图像相关性的计算结果。
上述步骤S231至S235,利用时间信息和空间信息,对图像档案中的原始图像进行预筛选,即一步步提高竞争类簇中心的原始图像的质量,又有效减少计算量。
在其中一个实施例中,时间相关度、空间相关性和图像相关性的计算方式为皮尔逊相关系数计算法或斯皮尔曼相关系数计算法。
不论是皮尔逊相关系数计算法还是斯皮尔曼相关系数计算法都能有效计算原始图像两两之间的时间相关度、空间相关性和图像相关性。
在其中一个实施例中,在步骤S240从图像档案中筛选出综合相关性超过预设相关性阈值的原始图像作为图像档案的类簇中心之后,聚档类簇中心的确定方法还包括以下步骤:
根据类簇中心中的原始图像的图像特征,得到类簇中心的结构化形式。
具体地,为了在人像落档时,类簇中心可以被直接用来计算相似度,在本实施例中,根据类簇中心中的原始图像的图像特征,得到类簇中心的结构化形式。例如,类簇中心有n张原始图像,这n张原始图像的图像特征分别为将类簇中心中的每张原始图像的图像特征的同一维度求取分均值,得到类簇中心的结构化形式为其中是对所有类簇中心中的每张原始图像的图像特征的第m维元素进行求和计算,是对所有类簇中心中的每张原始图像的图像特征的第m维元素求取分均值。
通过上述步骤可以客观准确地获取类簇中心的结构化形式,为后续人像落档奠定基础。
在其中一个实施例中,在步骤S240从图像档案中筛选出综合相关性超过预设相关性阈值的原始图像作为图像档案的类簇中心之后,聚档类簇中心的确定方法还包括以下步骤:
根据类簇中心中的原始图像的图像特征和类簇中心中的原始图像两两之间的综合相关性,得到类簇中心的结构化形式。
具体地,本实施例是另外一种获取类簇中心的结构化形式的方式。例如,类簇中心有n张原始图像,这n张原始图像的图像特征分别为利用类簇中心中的每张原始图像两两之间的综合相关性对图像特征的各维度进行加权,得到即为类簇中心的结构化形式,其中βmn表示第m张原始图像和第n张原始图像之间的综合相关性。
通过上述步骤可以客观准确地获取类簇中心的结构化形式,为后续人像落档奠定基础。
在其中一个实施例中,原始图像的图像特征通过以下步骤得到:
将原始图像输入训练完备的特征提取网络,得到原始图像的图像特征。
特征提取网络会利用历史数据定时进行更新,保证特征提取网络的准确性,通过将原始图像输入训练完备的特征提取网络,可以准确获取原始图像的图像特征。
在其中一个实施例中,时间特征为时间戳,地理位置特征为经纬度。
不同的时间对应的时间戳是唯一的,不同的地点对应的经纬度也是唯一的,时间戳和经纬度都是可计算的形式,用时间戳表示时间特征,用经纬度标识地理位置特征,可以为后续时间相关性和空间相关性的计算奠定基础。
图5是根据本发明实施例中聚档类簇中心的确定装置的示意图,如图5所示,提供了一种人体图像的聚档装置30,该装置包括获取模块31、特征模块32、相关性模块33和结果模块34,其中:
获取模块31,用于获取图像档案中的原始图像、原始图像的拍摄时间和原始图像的拍摄地点;
特征模块32,用于对原始图像、拍摄时间以及拍摄地点进行特征化处理,得到原始图像的图像特征、时间特征和地理位置特征;
相关性模块33,用于基于图像特征、时间特征和地理位置特征,计算图像档案中的原始图像两两之间的图像相关性、时间相关性和空间相关性;
结果模块34,用于对图像相关性、时间相关性和空间相关性的计算结果进行加权处理,得到原始图像两两之间的综合相关性,从图像档案中筛选出综合相关性超过预设相关性阈值的原始图像作为图像档案的类簇中心。
上述聚档类簇中心的确定装置30,通过获取图像档案中的原始图像、原始图像的拍摄时间和原始图像的拍摄地点;对原始图像、拍摄时间以及拍摄地点进行特征化处理,得到原始图像的图像特征、时间特征和地理位置特征;基于图像特征、时间特征和地理位置特征,计算图像档案中的原始图像两两之间的图像相关性、时间相关性和空间相关性;对图像相关性、时间相关性和空间相关性的计算结果进行加权处理,得到原始图像两两之间的综合相关性,从图像档案中筛选出综合相关性超过预设相关性阈值的原始图像作为图像档案的类簇中心。在确定聚档类簇中心的过程中,充分挖掘视频监控有效数据,除了利用原始图像本身的图像特征外,还利用了原始图像的时间特征和地理位置特征,通过这三方面相关性综合考虑,筛选出高质量的图像作为类簇中心,有效提高落档准确率。
在其中一个实施例中,相关性模块33还用于基于时间特征,计算图像档案中的所有原始图像两两之间的时间相关性,得到时间相关性的计算结果;
根据时间相关性的计算结果,从图像档案中筛选出时间相关性超过预设第一阈值的原始图像,组成第一图像集;
基于地理位置特征,计算第一图像集中的原始图像两两之间的空间相关性,得到空间相关性的计算结果;
根据空间相关性的计算结果,从第一图像集中筛选出空间相关性超过预设第二阈值的原始图像,组成第二图像集;
基于图像特征,计算第二图像集中的原始图像两两之间的图像相关性,得到图像相关性的计算结果。
在其中一个实施例中,时间相关度、空间相关性和图像相关性的计算方式为皮尔逊相关系数计算法或斯皮尔曼相关系数计算法。
在其中一个实施例中,聚档类簇中心的确定装置30还包括结构化模块,在从图像档案中筛选出综合相关性超过预设相关性阈值的原始图像作为图像档案的类簇中心之后,用于根据类簇中心中的原始图像的图像特征,得到类簇中心的结构化形式。
在其中一个实施例中,在从图像档案中筛选出综合相关性超过预设相关性阈值的原始图像作为图像档案的类簇中心之后,结构化模块还用于根据类簇中心中的原始图像的图像特征和类簇中心中的原始图像两两之间的综合相关性,得到类簇中心的结构化形式。
在其中一个实施例中,特征模块32还用于将原始图像输入训练完备的特征提取网络,得到原始图像的图像特征。
在其中一个实施例中,时间特征为时间戳,地理位置特征为经纬度。
需要说明地是,上述各个模块可以是功能模块也可以是程序模块,既可以通过软件实现,也可以通过硬件来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图6所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储预设配置信息集合。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现上述聚档类簇中心的确定方法。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种聚档类簇中心的确定方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图6中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
获取图像档案中的原始图像、原始图像的拍摄时间和原始图像的拍摄地点;
对原始图像、拍摄时间以及拍摄地点进行特征化处理,得到原始图像的图像特征、时间特征和地理位置特征;
基于图像特征、时间特征和地理位置特征,计算图像档案中的原始图像两两之间的图像相关性、时间相关性和空间相关性;
对图像相关性、时间相关性和空间相关性的计算结果进行加权处理,得到原始图像两两之间的综合相关性,从图像档案中筛选出综合相关性超过预设相关性阈值的原始图像作为图像档案的类簇中心。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
基于时间特征,计算图像档案中的所有原始图像两两之间的时间相关性,得到时间相关性的计算结果;
根据时间相关性的计算结果,从图像档案中筛选出时间相关性超过预设第一阈值的原始图像,组成第一图像集;
基于地理位置特征,计算第一图像集中的原始图像两两之间的空间相关性,得到空间相关性的计算结果;
根据空间相关性的计算结果,从第一图像集中筛选出空间相关性超过预设第二阈值的原始图像,组成第二图像集;
基于图像特征,计算第二图像集中的原始图像两两之间的图像相关性,得到图像相关性的计算结果。
在一个实施例中,时间相关度、空间相关性和图像相关性的计算方式为皮尔逊相关系数计算法或斯皮尔曼相关系数计算法。
在一个实施例中,在从图像档案中筛选出综合相关性超过预设相关性阈值的原始图像作为图像档案的类簇中心之后,处理器执行计算机程序时还实现以下步骤:
根据类簇中心中的原始图像的图像特征,得到类簇中心的结构化形式。
在一个实施例中,在从图像档案中筛选出综合相关性超过预设相关性阈值的原始图像作为图像档案的类簇中心之后,处理器执行计算机程序时还实现以下步骤:
根据类簇中心中的原始图像的图像特征和类簇中心中的原始图像两两之间的综合相关性,得到类簇中心的结构化形式。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
将原始图像输入训练完备的特征提取网络,得到原始图像的图像特征。
在一个实施例中,时间特征为时间戳,地理位置特征为经纬度。
上述存储介质,通过获取图像档案中的原始图像、原始图像的拍摄时间和原始图像的拍摄地点;对原始图像、拍摄时间以及拍摄地点进行特征化处理,得到原始图像的图像特征、时间特征和地理位置特征;基于图像特征、时间特征和地理位置特征,计算图像档案中的原始图像两两之间的图像相关性、时间相关性和空间相关性;对图像相关性、时间相关性和空间相关性的计算结果进行加权处理,得到原始图像两两之间的综合相关性,从图像档案中筛选出综合相关性超过预设相关性阈值的原始图像作为图像档案的类簇中心。本申请在确定聚档类簇中心的过程中,充分挖掘视频监控有效数据,除了利用原始图像本身的图像特征外,还利用了原始图像的时间特征和地理位置特征,通过这三方面相关性综合考虑,筛选出高质量的图像作为类簇中心,有效提高落档准确率。
应该明白的是,这里描述的具体实施例只是用来解释这个应用,而不是用来对它进行限定。根据本申请提供的实施例,本领域普通技术人员在不进行创造性劳动的情况下得到的所有其它实施例,均属本申请保护范围。
显然,附图只是本申请的一些例子或实施例,对本领域的普通技术人员来说,也可以根据这些附图将本申请适用于其他类似情况,但无需付出创造性劳动。另外,可以理解的是,尽管在此开发过程中所做的工作可能是复杂和漫长的,但是,对于本领域的普通技术人员来说,根据本申请披露的技术内容进行的某些设计、制造或生产等更改仅是常规的技术手段,不应被视为本申请公开的内容不足。
“实施例”一词在本申请中指的是结合实施例描述的具体特征、结构或特性可以包括在本申请的至少一个实施例中。该短语出现在说明书中的各个位置并不一定意味着相同的实施例,也不意味着与其它实施例相互排斥而具有独立性或可供选择。本领域的普通技术人员能够清楚或隐含地理解的是,本申请中描述的实施例在没有冲突的情况下,可以与其它实施例结合。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对专利保护范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。
Claims (10)
1.一种聚档类簇中心的确定方法,其特征在于,包括以下步骤:
获取图像档案中的原始图像、所述原始图像的拍摄时间和所述原始图像的拍摄地点;
对所述原始图像、所述拍摄时间以及所述拍摄地点进行特征化处理,得到所述原始图像的图像特征、时间特征和地理位置特征;
基于所述图像特征、所述时间特征和所述地理位置特征,计算所述图像档案中的所述原始图像两两之间的图像相关性、时间相关性和空间相关性;
对所述图像相关性、所述时间相关性和所述空间相关性的计算结果进行加权处理,得到所述原始图像两两之间的综合相关性,从所述图像档案中筛选出所述综合相关性超过预设相关性阈值的所述原始图像作为所述图像档案的类簇中心。
2.根据权利要求1所述的聚档类簇中心的确定方法,其特征在于,基于所述图像特征、所述时间特征和所述地理位置特征,计算所述图像档案中的所述原始图像两两之间的图像相关性、时间相关性和空间相关性,包括以下步骤:
基于所述时间特征,计算所述图像档案中的所有所述原始图像两两之间的时间相关性,得到所述时间相关性的计算结果;
根据所述时间相关性的计算结果,从所述图像档案中筛选出所述时间相关性超过预设第一阈值的所述原始图像,组成第一图像集;
基于所述地理位置特征,计算所述第一图像集中的所述原始图像两两之间的空间相关性,得到所述空间相关性的计算结果;
根据所述空间相关性的计算结果,从所述第一图像集中筛选出所述空间相关性超过预设第二阈值的所述原始图像,组成第二图像集;
基于所述图像特征,计算所述第二图像集中的所述原始图像两两之间的图像相关性,得到所述图像相关性的计算结果。
3.根据权利要求1或2所述的聚档类簇中心的确定方法,其特征在于,所述时间相关度、所述空间相关性和所述图像相关性的计算方式为皮尔逊相关系数计算法或斯皮尔曼相关系数计算法。
4.根据权利要求1或2所述的聚档类簇中心的确定方法,其特征在于,在所述从所述图像档案中筛选出所述综合相关性超过预设相关性阈值的所述原始图像作为所述图像档案的类簇中心之后,所述方法还包括:
根据所述类簇中心中的所述原始图像的所述图像特征,得到所述类簇中心的结构化形式。
5.根据权利要求1或2所述的聚档类簇中心的确定方法,其特征在于,在所述从所述图像档案中筛选出所述综合相关性超过预设相关性阈值的所述原始图像作为所述图像档案的类簇中心之后,所述方法还包括:
根据所述类簇中心中的所述原始图像的所述图像特征和所述类簇中心中的所述原始图像两两之间的所述综合相关性,得到所述类簇中心的结构化形式。
6.根据权利要求1或2所述的聚档类簇中心的确定方法,其特征在于,所述原始图像的图像特征通过以下步骤得到:
将所述原始图像输入训练完备的特征提取网络,得到所述原始图像的图像特征。
7.根据权利要求1或2所述的聚档类簇中心的确定方法,其特征在于,所述时间特征为时间戳,所述地理位置特征为经纬度。
8.一种聚档类簇中心的确定装置,其特征在于,所述装置包括:获取模块、特征模块、相关性模块、结果模块:
所述获取模块,用于获取图像档案中的原始图像、所述原始图像的拍摄时间和所述原始图像的拍摄地点;
所述特征模块,用于对所述原始图像、所述拍摄时间以及所述拍摄地点进行特征化处理,得到所述原始图像的图像特征、时间特征和地理位置特征;
所述相关性模块,用于基于所述图像特征、所述时间特征和所述地理位置特征,计算所述图像档案中的所述原始图像两两之间的图像相关性、时间相关性和空间相关性;
所述结果模块,用于对所述图像相关性、所述时间相关性和所述空间相关性的计算结果进行加权处理,得到所述原始图像两两之间的综合相关性,从所述图像档案中筛选出所述综合相关性超过预设相关性阈值的所述原始图像作为所述图像档案的类簇中心。
9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110990263.1A CN113742510B (zh) | 2021-08-26 | 聚档类簇中心的确定方法、装置、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110990263.1A CN113742510B (zh) | 2021-08-26 | 聚档类簇中心的确定方法、装置、计算机设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113742510A true CN113742510A (zh) | 2021-12-03 |
CN113742510B CN113742510B (zh) | 2024-06-25 |
Family
ID=
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2010219397A1 (en) * | 2010-09-10 | 2012-03-29 | Canon Kabushiki Kaisha | Method, system and apparatus for classifying a set of captured images |
CN103295030A (zh) * | 2013-06-21 | 2013-09-11 | 中国科学院对地观测与数字地球科学中心 | 一种基于高光谱遥感图像的分类方法及装置 |
CN105868309A (zh) * | 2016-03-24 | 2016-08-17 | 广东微模式软件股份有限公司 | 一种基于人脸图像聚类和识别技术的图像快速查找和自助打印方法 |
CN106557526A (zh) * | 2015-09-30 | 2017-04-05 | 富士通株式会社 | 处理图像的装置和方法 |
CN109447112A (zh) * | 2018-09-21 | 2019-03-08 | 深圳市深网视界科技有限公司 | 一种人像聚类方法、电子设备和存储介质 |
CN109784217A (zh) * | 2018-12-28 | 2019-05-21 | 上海依图网络科技有限公司 | 一种监控方法及装置 |
CN111782856A (zh) * | 2020-07-15 | 2020-10-16 | 上海依图网络科技有限公司 | 一种人体图像处理方法、装置、设备及介质 |
CN112948614A (zh) * | 2021-02-26 | 2021-06-11 | 北京百度网讯科技有限公司 | 图像处理方法、装置、电子设备及存储介质 |
CN113255518A (zh) * | 2021-05-25 | 2021-08-13 | 神威超算(北京)科技有限公司 | 一种视频异常事件检测方法和芯片 |
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2010219397A1 (en) * | 2010-09-10 | 2012-03-29 | Canon Kabushiki Kaisha | Method, system and apparatus for classifying a set of captured images |
CN103295030A (zh) * | 2013-06-21 | 2013-09-11 | 中国科学院对地观测与数字地球科学中心 | 一种基于高光谱遥感图像的分类方法及装置 |
CN106557526A (zh) * | 2015-09-30 | 2017-04-05 | 富士通株式会社 | 处理图像的装置和方法 |
CN105868309A (zh) * | 2016-03-24 | 2016-08-17 | 广东微模式软件股份有限公司 | 一种基于人脸图像聚类和识别技术的图像快速查找和自助打印方法 |
CN109447112A (zh) * | 2018-09-21 | 2019-03-08 | 深圳市深网视界科技有限公司 | 一种人像聚类方法、电子设备和存储介质 |
CN109784217A (zh) * | 2018-12-28 | 2019-05-21 | 上海依图网络科技有限公司 | 一种监控方法及装置 |
CN111782856A (zh) * | 2020-07-15 | 2020-10-16 | 上海依图网络科技有限公司 | 一种人体图像处理方法、装置、设备及介质 |
CN112948614A (zh) * | 2021-02-26 | 2021-06-11 | 北京百度网讯科技有限公司 | 图像处理方法、装置、电子设备及存储介质 |
CN113255518A (zh) * | 2021-05-25 | 2021-08-13 | 神威超算(北京)科技有限公司 | 一种视频异常事件检测方法和芯片 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110738235B (zh) | 肺结核判定方法、装置、计算机设备及存储介质 | |
US8983193B1 (en) | Techniques for automatic photo album generation | |
CN111027450A (zh) | 银行卡信息识别方法、装置、计算机设备及存储介质 | |
WO2019033568A1 (zh) | 嘴唇动作捕捉方法、装置及存储介质 | |
CN112115900B (zh) | 图像处理方法、装置、设备及存储介质 | |
CN111274999A (zh) | 数据处理、图像处理方法、装置及电子设备 | |
CN111291627A (zh) | 人脸识别方法、装置及计算机设备 | |
CN109241316B (zh) | 图像检索方法、装置、电子设备及存储介质 | |
CN113742510B (zh) | 聚档类簇中心的确定方法、装置、计算机设备和存储介质 | |
CN113742510A (zh) | 聚档类簇中心的确定方法、装置、计算机设备和存储介质 | |
CN111798019B (zh) | 意图预测方法、装置、存储介质及电子设备 | |
JP6620304B2 (ja) | プログラム,グループ予測装置,及びグループ予測方法 | |
CN110909188A (zh) | 检查图片确定方法及装置 | |
CN113362334B (zh) | 一种舌照处理方法及装置 | |
CN113191208B (zh) | 一种用于遥感图像实例分割的特征提取方法和计算机设备 | |
JP5523122B2 (ja) | 画像管理装置、方法及びプログラム | |
CN114997259A (zh) | 图像聚类方法、图像聚类模型训练方法和电子设备 | |
CN110675428B (zh) | 面向人机交互的目标跟踪方法、装置、计算机设备 | |
JP6734487B2 (ja) | 地域別笑顔度表示システム、地域別笑顔度表示方法及びプログラム | |
CN115705689A (zh) | 图像识别方法、装置、设备以及存储介质 | |
CN112633244A (zh) | 一种社交关系的识别方法、装置、电子设备及存储介质 | |
CN113537448A (zh) | 流式数据处理的方法、装置、半导体芯片和计算机设备 | |
CN113222097A (zh) | 数据处理方法和相关产品 | |
CN111353063A (zh) | 图片显示方法、装置及存储介质 | |
CN112381854B (zh) | 基于图像的运动检测方法、装置、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |