CN107704890A - 一种四元组图像的生成方法和装置 - Google Patents

一种四元组图像的生成方法和装置 Download PDF

Info

Publication number
CN107704890A
CN107704890A CN201711057015.1A CN201711057015A CN107704890A CN 107704890 A CN107704890 A CN 107704890A CN 201711057015 A CN201711057015 A CN 201711057015A CN 107704890 A CN107704890 A CN 107704890A
Authority
CN
China
Prior art keywords
image
tuple
similarity
pedestrian
images
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201711057015.1A
Other languages
English (en)
Other versions
CN107704890B (zh
Inventor
孙逸潇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Megvii Technology Co Ltd
Beijing Maigewei Technology Co Ltd
Original Assignee
Beijing Megvii Technology Co Ltd
Beijing Maigewei Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Megvii Technology Co Ltd, Beijing Maigewei Technology Co Ltd filed Critical Beijing Megvii Technology Co Ltd
Priority to CN201711057015.1A priority Critical patent/CN107704890B/zh
Publication of CN107704890A publication Critical patent/CN107704890A/zh
Application granted granted Critical
Publication of CN107704890B publication Critical patent/CN107704890B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/103Static body considered as a whole, e.g. static pedestrian or occupant recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本申请提供了一种四元组图像的生成方法和装置,包括:在行人重识别数据集中存在未生成四元组的图像时,分别获取不同行人的图像组成批处理样本集;处理批处理样本集中各图像,得到各图像之间的相似度;根据计算得到的各图像之间的相似度,分别确定出批处理样本集中各图像与各图像对应行人的其他图像中相似度最小的图像、以及各图像与其他行人图像中相似度最大的两幅图像,组成各图像的四元组图像。通过本申请实施例提供的四元组图像的生成方法和装置,可以提高训练出的行人重识别模型对行人的识别能力。

Description

一种四元组图像的生成方法和装置
技术领域
本申请涉及图像识别技术领域,具体而言,涉及一种四元组图像的生成方法和装置。
背景技术
目前,行人重识别技术,是利用计算机视觉技术判断图像或者视频序列中是否存在特定行人的技术,该技术正广泛应用于智能视频监控、智能安保等领域。为了对行人进行识别,需要将采集的行人重识别数据集作为训练集,通过神经网络(Neural Network,NN)训练出行人重识别模型,并以训练出的行人重识别模型进行行人重识别。
为了训练出行人重识别模型,一般是从行人重识别数据集中随机取出4个图像作为一个四元组,在将行人重识别数据集中待训练的行人图像形成多个四元组后,再对行人重识别模型进行训练。
但是,随机取出4个图像作为一个四元组,如果选出的4个图像的识别度较高,容易导致训练出的行人重识别模型对行人的识别能力较差。
发明内容
有鉴于此,本申请实施例的目的在于提供一种四元组图像的生成方法和装置,以提高训练出的行人重识别模型对行人的识别能力。
第一方面,本申请实施例提供了一种四元组图像的生成方法,包括:
在行人重识别数据集中分别获取不同行人的图像组成批处理样本集;
处理所述批处理样本集中各所述图像,得到各所述图像之间的相似度;
根据计算得到的各所述图像之间的相似度,对于所述批处理样本集中的每个所述图像,确定与所述图像对应于同一行人的其他图像中相似度最小的图像,以及确定与所述图像不对应于同一行人的其他图像中相似度最大的两幅图像;将所述确定的图像与所述图像一起组成所述四元组图像。
结合第一方面,本申请实施例提供了第一方面的第一种可能的实施方式,其中:处理所述批处理样本集中各所述图像,得到各所述图像之间的相似度,包括:
通过神经网络对所述批处理样本集中各所述图像进行处理,得到各所述图像的图像特征;
通过计算各所述图像的图像特征之间的距离,得到各所述图像之间的相似度。
结合第一方面,本申请实施例提供了第一方面的第二种可能的实施方式,其中:所述根据计算得到的各所述图像之间的相似度,对于所述批处理样本集中的每个所述图像,确定与所述图像对应于同一行人的其他图像中相似度最小的图像,以及确定与所述图像不对应于同一行人的其他图像中相似度最大的两幅图像;将所述确定的图像与所述图像一起组成所述四元组图像,包括:
在所述批处理样本集中任意选择一张图像作为所述四元组图像的第一图像;
在所述第一图像对应的行人的其他图像中确定与所述第一图像相似度最小的图像作为所述四元组图像的第二图像;
根据所述第一图像与除了所述第一图像对应的行人之外的其他行人的各图像之间的相似度,确定所述四元组图像的第三图像和第四图像。
结合第一方面,本申请实施例提供了第一方面的第三种可能的实施方式,其中:根据所述第一图像与除了所述第一图像对应的行人之外的其他行人的各图像之间的相似度,确定所述四元组图像的第三图像和第四图像,包括:
在所述其他行人的各图像中确定与所述第一图像相似度最大的图像作为所述四元组图像的第三图像;
在除了所述第一图像对应的行人以及所述第三图像对应的行人之外的其他行人的各图像中确定与所述第三图像相似度最大的图像作为所述四元组图像的第四图像。
结合第一方面,本申请实施例提供了第一方面的第四种可能的实施方式,其中:根据所述第一图像与除了所述第一图像对应的行人之外的其他行人的各图像之间的相似度,确定所述四元组图像的第三图像和第四图像,还包括:
在所述其他行人的各图像中确定与所述第一图像相似度最大的图像作为所述四元组图像的第三图像;
在除了所述第一图像对应的行人以及所述第三图像对应的行人之外的其他行人的各图像中确定与所述第一图像相似度第二大的图像作为所述四元组图像的第四图像。
第二方面,本申请实施例提供了一种四元组图像的生成装置,包括:
获取模块,用于在行人重识别数据集中分别获取不同行人的图像组成批处理样本集;
处理模块,用于处理所述批处理样本集中各所述图像,得到各所述图像之间的相似度;
四元组图像确定模块,用于根据计算得到的各所述图像之间的相似度,对于所述批处理样本集中的每个所述图像,确定与所述图像对应于同一行人的其他图像中相似度最小的图像,以及确定与所述图像不对应于同一行人的其他图像中相似度最大的两幅图像;将所述确定的图像与所述图像一起组成所述四元组图像。
结合第二方面,本申请实施例提供了第二方面的第一种可能的实施方式,其中:所述处理模块,包括:
图像处理单元,用于通过神经网络对所述批处理样本集中各所述图像进行处理,得到各所述图像的图像特征;
相似度计算单元,用于通过计算各所述图像的图像特征之间的距离,得到各所述图像之间的相似度。
结合第二方面,本申请实施例提供了第二方面的第二种可能的实施方式,其中:所述四元组图像确定模块,包括:
获取单元,用于在所述批处理样本集中任意选择一张图像作为所述四元组图像的第一图像;
第一确定单元,用于在所述第一图像对应的行人的其他图像中确定与所述第一图像相似度最小的图像作为所述四元组图像的第二图像;
第二确定单元,用于根据所述第一图像与除了所述第一图像对应的行人之外的其他行人的各图像之间的相似度,确定所述四元组图像的第三图像和第四图像。
结合第二方面,本申请实施例提供了第二方面的第三种可能的实施方式,其中:所述第二确定单元,具体用于:
在所述其他行人的各图像中确定与所述第一图像相似度最大的图像作为所述四元组图像的第三图像;
在除了所述第一图像对应行人以及所述第三图像对应的行人之外的其他行人的各图像中确定与所述第三图像相似度最大的图像作为所述四元组图像的第四图像。
结合第二方面,本申请实施例提供了第二方面的第四种可能的实施方式,其中:所述第二确定单元,还具体用于:
在所述其他行人的各图像中确定与所述第一图像相似度最大的图像作为所述四元组图像的第三图像;
在除了所述第一图像对应的行人以及所述第三图像对应的行人之外的其他行人的各图像中确定与所述第一图像相似度第二大的图像作为所述四元组图像的第四图像。
第三方面,本申请实施例提供了一种计算机系统,所述系统包括存储装置和处理器,所述存储装置上存储有由所述处理器运行的计算机程序,所述计算机程序在被所述处理器运行时执行上述的四元组图像的生成方法。
第四方面,本申请实施例提供了一种存储介质,所述存储介质上存储有计算机程序,所述计算机程序在运行时执行上述的四元组图像的生成方法。
本申请实施例提供的四元组图像的生成方法和装置,通过对批处理样本集中各图像进行处理得到各图像之间的相似度,并以各图像之间的相似度分别确定出批处理样本集中各图像与各图像对应行人的其他图像中相似度最小的图像、以及各图像与其他行人图像中相似度最大的两幅图像,组成各图像的四元组图像,与相关技术中随机生成图像的四元组相比,通过确定出批处理样本集中各图像与各图像对应行人的其他图像中相似度最小的图像、以及各图像与其他行人图像中相似度最大的两幅图像,组成各图像的难识别的四元组图像,从而在深度学习过程中专门对难识别的四元组图像进行训练,提升训练出的行人重识别模型对细节信息的提取能力,提高了行人重识别模型的行人识别能力。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1示出了可应用于本申请实施例所提供的一种四元组图像的生成方法的服务器的结构框图;
图2示出了本申请实施例1所提供的一种四元组图像的生成方法的流程图;
图3示出了本申请实施例1所提供的四元组图像的生成方法中,确定出批处理样本集中各图像的四元组图像的具体流程图;
图4示出了本申请实施例1所提供的四元组图像的生成方法中,通过计算得到的图像距离矩阵;
图5示出了本申请实施例2所提供的四元组图像的生成装置的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
图1示出了一种可应用于本申请实施例中的服务器的结构框图。如图1所示,服务器200包括:存储器201、处理器202以及网络模块203。
存储器201可用于存储软件程序以及模块,如本申请实施例中的四元组图像的生成方法和装置对应的程序指令/模块,处理器202通过运行存储在存储器201内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现本申请实施例中的四元组图像的生成方法。存储器201可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。进一步地,上述软件程序以及模块还可包括:操作系统221以及服务模块222。其中操作系统221,例如可为LINUX、UNIX、WINDOWS,其可包括各种用于管理系统任务(例如内存管理、存储设备控制、电源管理等)的软件组件和/或驱动,并可与各种硬件或软件组件相互通讯,从而提供其他软件组件的运行环境。服务模块222运行在操作系统221的基础上,并通过操作系统221的网络服务监听来自网络的请求,根据请求完成相应的数据处理,并返回处理结果给客户端。也就是说,服务模块222用于向客户端提供网络服务。
网络模块203用于接收以及发送网络信号。上述网络信号可包括无线信号或者有线信号。
可以理解,图1所示的结构仅为示意,服务器200还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。图1中所示的各组件可以采用硬件、软件或其组合实现。另外,本申请实施例中的服务器还可以包括多个具体不同功能的服务器。
为了训练出行人重识别模型,可以采用mini-batch的方式,即从行人重识别数据集中分批取出待训练的行人图像(在本申请中也可简称为图像),并从分批取出的行人图像中随机取出4个图像作为一个四元组,在将行人重识别数据集中待训练的行人的图像形成多个四元组后,再对行人重识别模型进行训练。
上述四元组,由四个不同的图像组成。如果设定一个四元组,包括第一图像、第二图像、第三图像和第四图像,那么,第一图像就是需要得到四元组的图像;第二图像和第一图像是同一行人的两个不同图像,第三图像是另一行人的图像,第四图像是不同于第一图像、第二图像、以及第三图像上行人的又一行人的图像。
为了通过图像对行人进行识别,需要确定待识别的行人图像与候选行人图像之间的相似度,如果待识别的行人图像与候选行人图像的相似度较大,那么就可以得到该待识别的行人图像中的行人就是该候选行人图像中的行人的识别结果。反之,如果待识别的行人图像与候选行人图像的相似度较小,那么就会得到待识别的行人图像与候选行人图像的行人不是同一行人的识别结果。
但是,在形成行人重识别数据集的过程中,经常会采集到同一行人不相似的图像以及不同行人相似的图像,而且,相关技术中四元组是随机生成的,不会专门将同一行人不相似的图像以及不同行人相似的图像放入同一四元组中,从而使通过随机生成的四元组训练的行人重识别模型,对同一行人不相似的图像以及不同行人相似的图像的识别能力较差,容易造成行人识别错误或者漏识别的缺陷。基于此,本申请提出一种四元组图像的生成方法和装置,可以将相同行人的不相似的图像以及不同行人相似的图像专门放到一个四元组中,形成行人重识别数据集中各图像的四元组图像。
本申请方案在生成行人重识别数据集中各图像的四元组时,主要是计算各图像之间的相似度,并根据得到的各图像之间的相似度,确定各图像的四元组图像,从而在训练行人重识别模型之前得到四元组图像,以在训练行人重识别模型过程中专门对难识别的四元组进行训练,提高行人重识别模型的行人识别能力。
为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本申请做进一步详细的说明。
实施例1
参见图2所示的四元组图像的生成方法,本实施例中负责执行四元组图像的生成方法的主体可以是上述图1所示的服务器。本实施例提出的一种访问控制方法,包括以下步骤:
步骤100、在行人重识别数据集中分别获取不同行人的图像组成批处理样本集。
这里,行人重识别数据集中存储的图像较多,通常会有几百人的几万、甚至十几万个图像;这些图像都是由服务器对与行人重识别数据集连接的摄像装置采集到的图片进行处理后得到的。
所以,为了对行人重识别数据集中的图像进行处理,可以采用mini-batch方式分批获取图像,在本申请实施例中该mini-batch方式分批获取图像被称为获取不同行人的图像组成批处理样本集。
上述批处理样本集,可以由通过mini-batch方式获取到的图像组成。
该mini-batch方式,一次可以从行人重识别数据集中获取100至1000个图像组成批处理样本集。具体获取的图像数量可以在每次生成用于训练行人重识别模型的四元组之前进行设置。
该mini-batch方式还具有以下特性:在从行人重识别数据集中获取不同行人的图像时,可以对不同行人中的各行人分别取出相同数量的图像。而每次mini-batch所取出的各行人分别取出相同数量的图像,也可以在每次生成用于训练行人重识别模型的四元组之前进行设置。
步骤102、处理上述批处理样本集中各上述图像,得到各上述图像之间的相似度。
具体地,上述步骤102,包括以下步骤(1)至步骤(2):
(1)通过神经网络对上述批处理样本集中各上述图像进行处理,得到各上述图像的图像特征;
(2)通过计算各上述图像的图像特征之间的距离,得到各上述图像之间的相似度。
在上述步骤(1)中,上述神经网络,可以是但不限于:卷积神经网络(Convolutional Neural Network,CNN)和深度神经网络(Deep Neural Network)DNN。
所以,可以通过CNN或者DNN对上述批处理样本集中各上述图像进行处理,得到各上述图像的图像特征。当然,在上述步骤(1)中,还可以采用现有技术中能够得到满足本申请需求的图像特征的神经网络对批处理样本集中各图像进行处理,这里不再一一赘述。
在上述步骤(2)中,各上述图像的图像特征之间的距离,可以是但不限于:街区距离、欧式距离、无穷范数、直方图相交、二次式距离、以及马氏距离。
通过对各个图像特征两两之间计算距离,可以得到一个距离矩阵,例如,总共有N个图像特征,那么将得到一个N*N的距离矩阵。
本实施例对各上述图像的图像特征之间的距离矩阵的计算过程不再赘述。
各上述图像的图像特征之间的距离,可以表征各图像之间的相似度。若两个图像的图像特征之间的距离越小,那么该两个图像的相似度就越大;反之,则该两个图像的相似度就越小。如果两个图像的距离为0,那么说明这两个图像是同一图像。
在通过以上步骤102计算得到的各上述图像之间的相似度后,可以继续通过以下步骤104确定出上述批处理样本集中各上述图像的四元组图像。
步骤104、根据计算得到的各上述图像之间的相似度,对于上述批处理样本集中的每个上述图像,确定与上述图像对应于同一行人的其他图像中相似度最小的图像,以及确定与上述图像不对应于同一行人的其他图像中相似度最大的两幅图像;将确定的图像与上述图像一起组成四元组图像。
上述四元组图像,包括:第一图像、第一图像对应行人的其他图像中与第一图像最不相似的第二图像、以及不同行人的图像中与第一图像最相似的第三图像和第四图像。其中,第三图像和第四图像为不同行人的图像。从以上四元组图像的描述可以看出,在四元组图像中,不仅第二图像与第一图像相关,而且,第三图像和第四图像与第一图像也有关系,并不是随机取得的。
具体地,为了得到各图像的四元组图像,参见图3所示的确定出上述批处理样本集中各图像的四元组图像的流程,上述步骤104可以包括以下步骤:
步骤300、在上述批处理样本集中任意选择一张图像作为上述四元组图像的第一图像。
步骤302、在上述第一图像对应的行人的其他图像中确定与上述第一图像相似度最小的图像作为上述四元组图像的第二图像。
在一个实施方式中,上述步骤302可以包括以下步骤(1)至步骤(2):
(1)获取上述第一图像与上述第一图像对应的行人的其他图像的相似度;
(2)将上述其他图像中与上述第一图像相似度最小的图像确定为上述四元组图像的第二图像。
在上述步骤(1)中,为了提高服务器的执行效率,可以通过映射(Map)-归约(reduce)的方式获取上述第一图像与上述第一图像对应行人的其他图像的相似度。
本实施例中并不对获取上述第一图像与上述第一图像对应行人的其他图像的相似度的过程进行赘述。
在通过上述步骤302确定上述第一图像的第二图像后,可以继续通过以下步骤304确定出与上述四元组图像的第三图像和第四图像。
步骤304、根据上述第一图像与除上述第一图像对应的行人之外的其他行人的各图像之间的相似度,确定出与上述四元组图像的第三图像和第四图像。
具体地,在一个实施方式中,上述步骤304包括以下步骤(1)至步骤(2):
(1)在上述其他行人的各图像中确定与上述第一图像相似度最大的图像作为上述四元组图像的第三图像;
(2)在除了上述第一图像对应的行人以及上述第三图像对应的行人之外的其他行人的各图像中确定出与上述第三图像相似度最大的图像作为上述四元组图像的第四图像。
上述步骤(1)确定上述四元组图像的第三图像和步骤(2)确定上述第四图像的过程与上述步骤302描述的确定四元组图像的第二图像的过程类似,这里不再赘述。
可选地,在另一种实施方式中,上述步骤304还可以包括以下步骤(10)至步骤(11):
(10)在上述其他行人的各图像中确定与上述第一图像相似度最大的图像作为上述四元组图像的第三图像;
(11)在除了上述第一图像对应的行人以及上述第三图像对应的行人之外的其他行人的各图像中确定与上述第一图像相似度第二大的图像作为上述四元组图像的第四图像。
在一个实施方式中,为了得到四元组图像,可以在将不同行人中各行人的图像与其他行人的图像之间的距离连续排列在一起,若通过mini-batch方式从行人重识别数据集中获取了p个行人,且每个行人k个图像,对p*k个图像进行排序,保证每个人的k张图在mini-batch中是连续存在的。对这p*k个图像按照顺序两两计算距离,就会得到一个(p*k)×(p*k)的距离矩阵。其中,距离矩阵的x轴和y轴上设置有所有行人的不同图像的标识,那么距离矩阵的每一行以及每一列就都会具有一个图像标识,即距离矩阵的每一行以及每一列均表示该图像标识对应图像与其他图像的距离。距离矩阵中的每个元素都是各图像间的距离值。
由于同一行人的图像是连续排列的,所以在距离矩阵对角线区域的若干方形区域表示的同一行人的各个图像两两之间的距离,参见图4所示的图像距离矩阵,对角线上的黑色方形区域即表示相同人的图像之间的距离。而距离矩阵的其他部分的白色方形区域表示不同人之间的距离。
那么,为了得到各图像的四元组,可以从距离矩阵的第一行开始,每一行都筛选出一个四元组。以第一行为例,以第一行的图像标识对应的图像为第一图像;先从第一行中最开始的k个元素中选择最大距离值所在列的图像标识对应的图像作为该四元组的第二图像;然后,从第一行剩下的(p-1)*k个元素中选择最小距离值所在列的图像标识对应的图像作为该四元组的第三图像;最后,在该第三图像所在列上,从除了该第三图像与该第一图像的距离值、以及除了该第三图像所对应的人的图像之间的距离值之外,选择最小距离值所在行的图像标识对应的图像作为该四元组的第四图像。从而确定出第一行的图像标识对应的图像的四元组图像。
重复上述过程,就可以得到距离矩阵中所有行的图像标识对应的图像的四元组图像。需要注意的是,对于第2个以及第2个以后的人,第一图像和第二图像需要在相同人的距离矩阵中选择,也即在距离矩阵的对角线上的每个矩形方框的每一行中进行选择,因为这部分表示的相同人的图像之间的距离。
在获得四元组之后,可以得到如下四元组代价函数Loss:
Loss=Max(0,Dist(A,B)-Dist(A,C)+margin1)+Max(0,Dist(A,B)-Dist(C,D)+margin2)
其中,Dist(A,B)表示四元组图像中第一图像和第二图像之间的距离,Dist(A,C)表示四元组图像中第一图像和第三图像之间的距离,Dist(C,D)表示四元组图像中第三图像和第四图像之间的距离,margin1和margin2表示不同的调整值,margin1和margin2的作用是为防止重复矫正已被矫正的图片对,其中,margin1大于margin2。
上述四元组代价函数是在三元组代价函数上多加了一组类似成对样本损失(Pairwise Loss)的弱约束,对相同的人起到更强的聚类效应。
综上所述,本实施例提供的四元组图像的生成方法,通过对批处理样本集中各图像进行处理得到各图像之间的相似度,并以各图像之间的相似度分别确定出批处理样本集中各图像与各图像对应行人的其他图像中相似度最小的图像、以及各图像与其他行人图像中相似度最大的两幅图像,组成各图像的四元组图像,与相关技术中随机生成图像的四元组相比,通过确定出批处理样本集中各图像与各图像对应行人的其他图像中相似度最小的图像、以及各图像与其他行人图像中相似度最大的两幅图像,组成各图像的难识别的四元组图像,从而在深度学习过程中专门对难识别的四元组图像进行训练,提升训练出的行人重识别模型对细节信息的提取能力,提高了行人重识别模型的行人识别能力。
实施例2
本实施例提出一种四元组图像的生成装置,用于执行上述实施例1提出的四元组图像的生成方法。
参见图5所示的四元组图像的生成装置的结构,本实施例提出的四元组图像的生成装置,包括:
获取模块500,用于在行人重识别数据集中分别获取不同行人的图像组成批处理样本集;
处理模块502,用于处理上述批处理样本集中各上述图像,得到各上述图像之间的相似度;
四元组图像确定模块504,用于根据计算得到的各上述图像之间的相似度,对于上述批处理样本集中的每个上述图像,确定与上述图像对应于同一行人的其他图像中相似度最小的图像,以及确定与上述图像不对应于同一行人的其他图像中相似度最大的两幅图像;将上述确定的图像与上述图像一起组成上述四元组图像。
具体地,上述处理模块502,包括:
图像处理单元,用于通过神经网络对上述批处理样本集中各上述图像进行处理,得到各上述图像的图像特征;
相似度计算单元,用于通过计算各上述图像的图像特征之间的距离,得到各上述图像之间的相似度。
具体地,上述四元组图像确定模块504,包括:
获取单元,用于在上述批处理样本集中任意选择一张图像作为上述四元组图像的第一图像;
第一确定单元,用于在上述第一图像对应的行人的其他图像中确定与上述第一图像相似度最小的图像作为上述四元组图像的第二图像;
第二确定单元,用于根据第一图像与除了上述第一图像对应行人外的其他行人的各图像之间的相似度,确定出与上述四元组图像的第三图像和第四图像。
上述第二确定单元,具体用于:
从上述其他行人的各图像中确定出与上述第一图像相似度最大的图像作为上述四元组图像的第三图像;
在除了上述第一图像对应行人以及上述第三图像对应的行人之外的其他行人的各图像中确定出与上述第三图像相似度最大的图像作为上述四元组图像的第四图像。
上述第二确定单元,还具体用于:
在上述其他行人的各图像中确定与上述第一图像相似度最大的图像作为上述四元组图像的第三图像;
在除了上述第一图像对应的行人以及上述第三图像对应的行人之外的其他行人的各图像中确定与上述第一图像相似度第二大的图像作为上述四元组图像的第四图像。
综上所述,本实施例提供的四元组图像的生成装置,通过对批处理样本集中各图像进行处理得到各图像之间的相似度,并以各图像之间的相似度分别确定出批处理样本集中各图像与各图像对应行人的其他图像中相似度最小的图像、以及各图像与其他行人图像中相似度最大的两幅图像,组成各图像的四元组图像,与相关技术中随机生成图像的四元组相比,通过确定出批处理样本集中各图像与各图像对应行人的其他图像中相似度最小的图像、以及各图像与其他行人图像中相似度最大的两幅图像,组成各图像的难识别的四元组图像,从而在深度学习过程中专门对难识别的四元组图像进行训练,提升训练出的行人重识别模型对细节信息的提取能力,提高了行人重识别模型的行人识别能力。
实施例3
本实施例提出一种计算机系统,上述系统包括存储装置和处理器,上述存储装置上存储有由上述处理器运行的计算机程序,上述计算机程序在被上述处理器运行时执行上述实施例1方法的步骤,具体实现可参见方法实施例,在此不再赘述。
本实施例还提出一种存储介质,上述存储介质上存储有计算机程序,上述计算机程序在运行时执行上述实施例1方法的步骤,具体实现可参见方法实施例,在此不再赘述。
本申请实施例所提供的进行四元组图像的生成方法的计算机程序产品,包括存储了程序代码的计算机可读存储介质,上述程序代码包括的指令可用于执行前面方法实施例中上述的方法,具体实现可参见方法实施例,在此不再赘述。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应所述以权利要求的保护范围为准。

Claims (12)

1.一种四元组图像的生成方法,其特征在于,包括:
在行人重识别数据集中分别获取不同行人的图像组成批处理样本集;
处理所述批处理样本集中各所述图像,得到各所述图像之间的相似度;
根据计算得到的各所述图像之间的相似度,对于所述批处理样本集中的每个所述图像,确定与所述图像对应于同一行人的其他图像中相似度最小的图像,以及确定与所述图像不对应于同一行人的其他图像中相似度最大的两幅图像;将所述确定的图像与所述图像一起组成所述四元组图像。
2.根据权利要求1所述的方法,其特征在于,处理所述批处理样本集中各所述图像,得到各所述图像之间的相似度,包括:
通过神经网络对所述批处理样本集中各所述图像进行处理,得到各所述图像的图像特征;
通过计算各所述图像的图像特征之间的距离,得到各所述图像之间的相似度。
3.根据权利要求1所述的方法,其特征在于,所述根据计算得到的各所述图像之间的相似度,对于所述批处理样本集中的每个所述图像,确定与所述图像对应于同一行人的其他图像中相似度最小的图像,以及确定与所述图像不对应于同一行人的其他图像中相似度最大的两幅图像;将所述确定的图像与所述图像一起组成所述四元组图像,包括:
在所述批处理样本集中任意选择一张图像作为所述四元组图像的第一图像;
在所述第一图像对应的行人的其他图像中确定与所述第一图像相似度最小的图像作为所述四元组图像的第二图像;
根据所述第一图像与除了所述第一图像对应的行人之外的其他行人的各图像之间的相似度,确定所述四元组图像的第三图像和第四图像。
4.根据权利要求3所述的方法,其特征在于,根据所述第一图像与除了所述第一图像对应的行人之外的其他行人的各图像之间的相似度,确定所述四元组图像的第三图像和第四图像,包括:
在所述其他行人的各图像中确定与所述第一图像相似度最大的图像作为所述四元组图像的第三图像;
在除了所述第一图像对应的行人以及所述第三图像对应的行人之外的其他行人的各图像中确定与所述第三图像相似度最大的图像作为所述四元组图像的第四图像。
5.根据权利要求3所述的方法,其特征在于,根据所述第一图像与除了所述第一图像对应的行人之外的其他行人的各图像之间的相似度,确定所述四元组图像的第三图像和第四图像,还包括:
在所述其他行人的各图像中确定与所述第一图像相似度最大的图像作为所述四元组图像的第三图像;
在除了所述第一图像对应的行人以及所述第三图像对应的行人之外的其他行人的各图像中确定与所述第一图像相似度第二大的图像作为所述四元组图像的第四图像。
6.一种四元组图像的生成装置,其特征在于,包括:
获取模块,用于在行人重识别数据集中分别获取不同行人的图像组成批处理样本集;
处理模块,用于处理所述批处理样本集中各所述图像,得到各所述图像之间的相似度;
四元组图像确定模块,用于根据计算得到的各所述图像之间的相似度,对于所述批处理样本集中的每个所述图像,确定与所述图像对应于同一行人的其他图像中相似度最小的图像,以及确定与所述图像不对应于同一行人的其他图像中相似度最大的两幅图像;将所述确定的图像与所述图像一起组成所述四元组图像。
7.根据权利要求6所述的装置,其特征在于,所述处理模块,包括:
图像处理单元,用于通过神经网络对所述批处理样本集中各所述图像进行处理,得到各所述图像的图像特征;
相似度计算单元,用于通过计算各所述图像的图像特征之间的距离,得到各所述图像之间的相似度。
8.根据权利要求6所述的装置,其特征在于,所述四元组图像确定模块,包括:
获取单元,用于在所述批处理样本集中任意选择一张图像作为所述四元组图像的第一图像;
第一确定单元,用于在所述第一图像对应的行人的其他图像中确定与所述第一图像相似度最小的图像作为所述四元组图像的第二图像;
第二确定单元,用于根据所述第一图像与除了所述第一图像对应的行人之外的其他行人的各图像之间的相似度,确定所述四元组图像的第三图像和第四图像。
9.根据权利要求8所述的装置,其特征在于,所述第二确定单元,具体用于:
在所述其他行人的各图像中确定与所述第一图像相似度最大的图像作为所述四元组图像的第三图像;
在除了所述第一图像对应行人以及所述第三图像对应的行人之外的其他行人的各图像中确定与所述第三图像相似度最大的图像作为所述四元组图像的第四图像。
10.根据权利要求8所述的装置,其特征在于,所述第二确定单元,还具体用于:
在所述其他行人的各图像中确定与所述第一图像相似度最大的图像作为所述四元组图像的第三图像;
在除了所述第一图像对应的行人以及所述第三图像对应的行人之外的其他行人的各图像中确定与所述第一图像相似度第二大的图像作为所述四元组图像的第四图像。
11.一种计算机系统,其特征在于,所述系统包括存储装置和处理器,所述存储装置上存储有由所述处理器运行的计算机程序,所述计算机程序在被所述处理器运行时执行如权利要求1-5中的任一项所述的四元组图像的生成方法。
12.一种存储介质,其特征在于,所述存储介质上存储有计算机程序,所述计算机程序在运行时执行如权利要求1-5中的任一项所述的四元组图像的生成方法。
CN201711057015.1A 2017-10-27 2017-10-27 一种四元组图像的生成方法和装置 Active CN107704890B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711057015.1A CN107704890B (zh) 2017-10-27 2017-10-27 一种四元组图像的生成方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711057015.1A CN107704890B (zh) 2017-10-27 2017-10-27 一种四元组图像的生成方法和装置

Publications (2)

Publication Number Publication Date
CN107704890A true CN107704890A (zh) 2018-02-16
CN107704890B CN107704890B (zh) 2020-01-14

Family

ID=61177493

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711057015.1A Active CN107704890B (zh) 2017-10-27 2017-10-27 一种四元组图像的生成方法和装置

Country Status (1)

Country Link
CN (1) CN107704890B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108491872A (zh) * 2018-03-16 2018-09-04 深圳市商汤科技有限公司 目标再识别方法和装置、电子设备、程序和存储介质
CN108960331A (zh) * 2018-07-10 2018-12-07 重庆邮电大学 一种基于行人图像特征聚类的行人再识别方法
CN109145991A (zh) * 2018-08-24 2019-01-04 北京地平线机器人技术研发有限公司 图像组生成方法、图像组生成装置和电子设备
WO2019200913A1 (zh) * 2018-04-19 2019-10-24 深圳市商汤科技有限公司 图像检索方法及装置
CN113850243A (zh) * 2021-11-29 2021-12-28 北京的卢深视科技有限公司 模型训练、人脸识别方法、电子设备及存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104298992A (zh) * 2014-10-14 2015-01-21 武汉大学 一种基于数据驱动的自适应尺度行人重识别方法
CN104462550A (zh) * 2014-12-25 2015-03-25 武汉大学 基于相似性和不相似性融合排序优化的行人重识别方法
CN106778527A (zh) * 2016-11-28 2017-05-31 中通服公众信息产业股份有限公司 一种基于三重损失的改进的神经网络行人再识别方法
CN106778464A (zh) * 2016-11-09 2017-05-31 深圳市深网视界科技有限公司 一种基于深度学习的行人重识别方法和装置
CN106778604A (zh) * 2015-12-15 2017-05-31 西安电子科技大学 基于匹配卷积神经网络的行人再识别方法
CN107145827A (zh) * 2017-04-01 2017-09-08 浙江大学 基于自适应距离度量学习的跨摄像机行人再识别方法
CN107153817A (zh) * 2017-04-29 2017-09-12 深圳市深网视界科技有限公司 行人重识别数据标注方法和装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104298992A (zh) * 2014-10-14 2015-01-21 武汉大学 一种基于数据驱动的自适应尺度行人重识别方法
CN104462550A (zh) * 2014-12-25 2015-03-25 武汉大学 基于相似性和不相似性融合排序优化的行人重识别方法
CN106778604A (zh) * 2015-12-15 2017-05-31 西安电子科技大学 基于匹配卷积神经网络的行人再识别方法
CN106778464A (zh) * 2016-11-09 2017-05-31 深圳市深网视界科技有限公司 一种基于深度学习的行人重识别方法和装置
CN106778527A (zh) * 2016-11-28 2017-05-31 中通服公众信息产业股份有限公司 一种基于三重损失的改进的神经网络行人再识别方法
CN107145827A (zh) * 2017-04-01 2017-09-08 浙江大学 基于自适应距离度量学习的跨摄像机行人再识别方法
CN107153817A (zh) * 2017-04-29 2017-09-12 深圳市深网视界科技有限公司 行人重识别数据标注方法和装置

Non-Patent Citations (8)

* Cited by examiner, † Cited by third party
Title
ALEXANDER HERMANS等: "In Defense of the Triplet Loss for Person Re-Identification", 《ARXIV:1703.07737V2》 *
JIAYUN WANG 等: "Deep Ranking Model by Large Adaptive Margin Learning for Person Re-identification", 《ARXIV:1707.00409V2》 *
QIQI XIAO 等: "Margin Sample Mining Loss: A Deep Learning Based Method for Person Re-identification", 《ARXIV:1710.00478V3》 *
SANPING ZHOU等: "Large Margin Learning in Set to Set Similarity Comparison for Person Re-identification", 《IEEE TRANSACTIONS ON MULTIMEDIA》 *
SHENGYONG DING 等: "Deep feature learning with relative distance comparison for person re-identification", 《PATTERN RECOGNITION》 *
WEIHUA CHEN等: "Beyond triplet loss: a deep quadruplet network for person re-identification", 《ARXIV:1704.01719V1》 *
丁宗元 等: "基于距离中心化与投影向量学习的行人重识别", 《计算机研究与发展》 *
王迪 等: "基于随机森林和RankSVM化的行人识别方法", 《电视技术》 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108491872A (zh) * 2018-03-16 2018-09-04 深圳市商汤科技有限公司 目标再识别方法和装置、电子设备、程序和存储介质
CN108491872B (zh) * 2018-03-16 2020-10-30 深圳市商汤科技有限公司 目标再识别方法和装置、电子设备、程序和存储介质
WO2019200913A1 (zh) * 2018-04-19 2019-10-24 深圳市商汤科技有限公司 图像检索方法及装置
JP2021508899A (ja) * 2018-04-19 2021-03-11 深▲セン▼市商湯科技有限公司Shenzhen Sensetime Technology Co.,Ltd. 画像検索方法、画像検索装置、電子機器、記憶媒体及びプログラム
US11328171B2 (en) 2018-04-19 2022-05-10 Shenzhen Sensetime Technology Co., Ltd. Image retrieval method and apparatus
CN108960331A (zh) * 2018-07-10 2018-12-07 重庆邮电大学 一种基于行人图像特征聚类的行人再识别方法
CN109145991A (zh) * 2018-08-24 2019-01-04 北京地平线机器人技术研发有限公司 图像组生成方法、图像组生成装置和电子设备
CN109145991B (zh) * 2018-08-24 2020-07-31 北京地平线机器人技术研发有限公司 图像组生成方法、图像组生成装置和电子设备
CN113850243A (zh) * 2021-11-29 2021-12-28 北京的卢深视科技有限公司 模型训练、人脸识别方法、电子设备及存储介质

Also Published As

Publication number Publication date
CN107704890B (zh) 2020-01-14

Similar Documents

Publication Publication Date Title
CN107704890A (zh) 一种四元组图像的生成方法和装置
KR102635987B1 (ko) 이미지 시맨틱 세그멘테이션 네트워크를 트레이닝하기 위한 방법, 장치, 디바이스 및 저장 매체
Maqueda et al. Event-based vision meets deep learning on steering prediction for self-driving cars
US20160196479A1 (en) Image similarity as a function of weighted descriptor similarities derived from neural networks
Stewart et al. Region growing with pulse-coupled neural networks: an alternative to seeded region growing
US9811718B2 (en) Method and a system for face verification
CN108229523B (zh) 图像检测、神经网络训练方法、装置和电子设备
CN109241903A (zh) 样本数据清洗方法、装置、计算机设备及存储介质
Rahaman et al. An efficient multilevel thresholding based satellite image segmentation approach using a new adaptive cuckoo search algorithm
CN104899579A (zh) 人脸识别方法和装置
CN113807399B (zh) 一种神经网络训练方法、检测方法以及装置
CN110046622B (zh) 一种有目标的攻击样本生成方法、装置、设备及存储介质
CN103164701B (zh) 手写体数字识别方法及装置
CN111310746B (zh) 文本行检测方法、模型训练方法、装置、服务器及介质
CN110991513A (zh) 一种具有类人连续学习能力的图像目标识别系统及方法
CN111723856B (zh) 一种图像数据处理方法、装置、设备及可读存储介质
CN112149694B (zh) 一种基于卷积神经网络池化模块的图像处理方法、系统、存储介质及终端
CN110399908A (zh) 基于事件型相机的分类方法和装置、存储介质、电子装置
WO2020086176A1 (en) Artificial neural network and method of training an artificial neural network with epigenetic neurogenesis
CN110728295A (zh) 半监督式的地貌分类模型训练和地貌图构建方法
Cuevas et al. Evolutionary computation techniques: a comparative perspective
CN113705461A (zh) 人脸清晰度检测方法、装置、设备及存储介质
CN115578590A (zh) 基于卷积神经网络模型的图像识别方法、装置及终端设备
CN114626476A (zh) 基于Transformer与部件特征融合的鸟类细粒度图像识别方法及装置
CN111539390A (zh) 一种基于Yolov3的小目标图像识别方法、设备和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: A Method and Device for Generating Quad Images

Effective date of registration: 20230404

Granted publication date: 20200114

Pledgee: Shanghai Yunxin Venture Capital Co.,Ltd.

Pledgor: BEIJING KUANGSHI TECHNOLOGY Co.,Ltd.|MEGVII (BEIJING) TECHNOLOGY Co.,Ltd.

Registration number: Y2023990000191

PE01 Entry into force of the registration of the contract for pledge of patent right