CN113887279A - 一种半身被遮挡的行人重识别方法及相关装置 - Google Patents
一种半身被遮挡的行人重识别方法及相关装置 Download PDFInfo
- Publication number
- CN113887279A CN113887279A CN202110976012.8A CN202110976012A CN113887279A CN 113887279 A CN113887279 A CN 113887279A CN 202110976012 A CN202110976012 A CN 202110976012A CN 113887279 A CN113887279 A CN 113887279A
- Authority
- CN
- China
- Prior art keywords
- target
- training sample
- model
- data set
- identified
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
Abstract
本申请实施例公开了一种半身被遮挡的行人重识别方法及相关装置,解决了半身被遮挡行人重识别的问题,且识别准确率高。本申请包括:获取目标人物的待识别初始图像集,所述待识别初始图像集至少包含一张图像;根据所述待识别初始图像集获取待识别数据集;将所述待识别数据集通过目标识别模型生成识别结果,所述目标识别模型由多个行人的全身数据样本、半身数据样本以及全身半身混合数据样本训练而得;根据所述识别结果判断所述待识别初始图像集中的目标人物的相似度是否大于第一预设值,若是,则确认所述待识别初始图像集中的目标人物为同一人。
Description
技术领域
本申请实施例涉及深度识别技术领域,特别涉及一种半身被遮挡的行人 重识别方法及相关装置。
背景技术
随着深度学习技术的发展,行人重识别相关技术也得到较大的应用与发 展。然而目前行人重识别技术在目标被遮挡时,算法识别率大大下降,尤其 是在不同地方或者不同摄像头前,行人经常会受到汽车、行李、非机动车或 者其他行人的遮挡,导致行人下半身区域经常看不到,但是在另外的场景或 者摄像机前面又能看到全身,而导致很难将遮挡下半身的行人与全身的行人 匹配上。
发明内容
本申请实施例提供了一种半身被遮挡的行人重识别方法及相关装置,解 决了半身被遮挡行人重识别的问题,且识别准确率高。
本申请实施例第一方面提供了一种半身被遮挡的行人重识别方法,包括:
获取目标人物的待识别初始图像集,所述待识别初始图像集至少包含一 张图像;
根据所述待识别初始图像集获取待识别数据集;
将所述待识别数据集通过目标识别模型生成识别结果,所述目标识别模 型由多个行人的全身数据样本、半身数据样本以及全身半身混合数据样本训 练而得;
根据所述识别结果判断所述待识别初始图像集中的目标人物的相似度是 否大于第一预设值,若是,则确认所述待识别初始图像集中的目标人物为同 一人。
可选的,在所述将所述待识别数据集通过目标识别模型生成识别结果, 所述目标识别模型由多个行人的全身数据样本、半身数据样本以及全身半身 混合数据样本训练而得之前,所述方法还包括:
获取训练样本图像集,所述训练样本图像集至少包含一份训练样本,所 述训练样本为行人的全身图像和/或半身图像;
根据所述训练样本图像集得到训练样本数据集,所述训练样本数据集包 括训练样本全身数据集、训练样本半身数据集以及训练样本全身半身混合数 据集;
根据所述训练样本数据集对初始模型进行训练,得到目标识别模型,所 述初始模型为基于深度神经网络建立的模型。
可选的,所述根据所述训练样本数据集对初始模型进行训练,得到目标 识别模型,所述初始模型为基于深度神经网络建立的模型,包括:
通过初始模型提取所述训练样本数据集的特征向量,所述初始模型为基 于深度神经网络建立的模型;
根据所述特征向量进行总损失值计算;
判断所述总损失值是否小于第二预设值,若是,则将所述初始模型确定 为目标识别模型;
若否,则根据所述总损失值调整所述初始模型的参数,并将所述训练样 本数据集重新输入更新参数后的初始模型。
可选的,所述根据所述特征向量进行总损失值计算,包括:
通过Id Loss损失函数和Triplet Loss损失函数对所述特征向量中不同 类别的样本数据分别进行损失值计算,得到三组Triplet Loss损失值和三组 Id Loss损失值,所述Id Loss损失函数用于区分所述特征向量中不同类别的 样本数据,所述Triplet Loss损失函数用于训练差异性较小的样本数据;
根据所述Triplet Loss损失值和所述Id Loss损失值计算总损失值。
可选的,在所述根据所述识别结果判断所述待识别初始图像集中的目标 人物的相似度是否大于第一预设值之后,所述方法还包括:
若否,则确认所述待识别初始图像集中的目标人物不是同一人。
可选的,所述获取目标人物的待识别初始图像集,包括:
通过目标定位网络获取目标人物的待识别初始图像集,所述目标定位网 络用于检测图像中存在的目标对象以及标定所述目标对象在所述图像中的位 置。
可选的,所述根据所述待识别初始图像集获取待识别数据集,包括:
通过检测模型对所述待识别初始图像集进行检测,所述检测模型用于检 测所述目标人物的身形轮廓并标定出轮廓坐标;
根据所述轮廓坐标剪裁出所述目标人物的全身图像集和半身图像集;
对所述全身图像集和所述半身图像集进行分类得到待识别数据集,所述 待识别数据集包括待识别全身数据集、待识别半身数据集以及待识别全身半 身混合数据集。
本申请实施例第二方面提供了一种半身被遮挡的行人重识别装置,包括:
第一获取单元,用于获取目标人物的待识别初始图像集,所述待识别初 始图像集至少包含一张图像;
第二获取单元,用于根据所述待识别初始图像集获取待识别数据集;
生成单元,用于将所述待识别数据集通过目标识别模型生成识别结果, 所述目标识别模型由多个行人的全身数据样本、半身数据样本以及全身半身 混合数据样本训练而得;
判断单元,用于根据所述识别结果判断所述待识别初始图像集中的目标 人物的相似度是否大于第一预设值;
确认单元,用于在所述判断单元根据所述识别结果判断所述待识别初始 图像集中的目标人物的相似度大于第一预设值之后,确认所述待识别初始图 像集中的目标人物为同一人。
可选的,在所述生成单元之前,所述装置还包括:
第三获取单元,用于获取训练样本图像集,所述训练样本图像集至少包 含一份训练样本,所述训练样本为行人的全身图像和/或半身图像;
第四获取单元,用于根据所述训练样本图像集得到训练样本数据集,所 述训练样本数据集包括训练样本全身数据集、训练样本半身数据集以及训练 样本全身半身混合数据集;
训练单元,用于根据所述训练样本数据集对初始模型进行训练,得到目 标识别模型,所述初始模型为基于深度神经网络建立的模型。
可选的,所述训练单元,包括:
提取模块,用于通过初始模型提取所述训练样本数据集的特征向量,所 述初始模型为基于深度神经网络建立的模型;
计算模块,用于根据所述特征向量进行总损失值计算;
判断模块,用于判断所述总损失值是否小于第二预设值;
确定模块,用于在所述判断模块根据所述识别结果判断所述待识别初始 图像集中的目标人物的相似度大于第一预设值之后,将所述初始模型确定为 目标识别模型;
调整模块,用于在所述判断模块根据所述识别结果判断所述待识别初始 图像集中的目标人物的相似度小于或等于第一预设值之后,根据所述总损失 值调整所述初始模型的参数,并将所述训练样本数据集重新输入更新参数后 的初始模型。
本申请实施例第三方面提供了一种半身被遮挡的行人重识别装置,包括:
处理器、存储器、输入输出单元以及总线;
所述处理器与所述存储器、输入输出单元以及总线相连;
所述处理器执行如下操作:
获取目标人物的待识别初始图像集,所述待识别初始图像集至少包含一 张图像;
根据所述待识别初始图像集获取待识别数据集;
将所述待识别数据集通过目标识别模型生成识别结果,所述目标识别模 型由多个行人的全身数据样本、半身数据样本以及全身半身混合数据样本训 练而得;
根据所述识别结果判断所述待识别初始图像集中的目标人物的相似度是 否大于第一预设值,若是,则确认所述待识别初始图像集中的目标人物为同 一人。
本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介 质上保存有程序,所述程序在计算机上执行时执行上述第一方面任意一种半 身被遮挡的行人重识别方法。
从以上技术方案可以看出,本申请实施例具有以下优点:
本申请中,当需要确认不同镜头下遮挡半身的行人与全身的行人是否为 同一人时,只需要获取该目标人物的待识别初始图像集,并根据该待识别初 始图像集获取待识别数据集,再通过目标识别模型生成识别结果,根据该识 别结果来确认遮挡半身的行人与全身的行人是否匹配,解决了半身被遮挡行 人重识别的问题,且识别准确率高。
附图说明
图1为本申请实施例中半身被遮挡的行人重识别方法一个实施例流程示 意图;
图2-1为本申请实施例中半身被遮挡的行人重识别方法另一实施例流程 示意图;
图2-2为本申请实施例中半身被遮挡的行人重识别方法另一实施例流程 示意图;
图3为本申请实施例中半身被遮挡的行人重识别装置一个实施例流程示 意图;
图4为本申请实施例中半身被遮挡的行人重识别装置另一实施例流程示 意图;
图5为本申请实施例中半身被遮挡的行人重识别装置另一实施例流程示 意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请中的技术方案,下面将结合 本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整的阐 述,显然阐述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。 基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动的前提 下所获得的所有其他实施例,都应当属于本申请保护范围。
本申请实施例提供了一种半身被遮挡的行人重识别方法及相关装置,解 决了半身被遮挡行人重识别的问题,且识别准确率高。
请参阅图1,本申请实施例中一种半身被遮挡的行人重识别方法一个实施 例包括:
101、获取目标人物的待识别初始图像集,所述待识别初始图像集至少包 含一张图像;
需要说明的是,当需要确认一个人的行踪轨迹等信息时,会通过多个监 控视频拍摄到的画面来获取,然而目标对象在不同的摄像头里被拍摄到的是 不同的角度,如果身边有障碍物,有时候该目标对象会受到不同程度的遮挡, 比如在第一摄像头里,该目标对象可以完整拍到全身,然而在第二摄像头里, 因被遮挡,只能看到上半身或者下半身等,以至于很难将遮挡半身的目标对 象与全身的目标对象匹配上。
为了提高算法识别率,本申请实施例中,获取目标人物多张不同角度下 拍摄到的待识别初始图像,组成待识别初始图像集,用作识别的基础。需要 说明的是,该待识别初始图像可以是全身图,也可以是半身图,具体不做限 制,可根据实际情况能够采集到的图像作为待识别初始图像。
还需要说明的是,本申请实施例中,该待识别初始图像集可以通过摄像 设备采集的监控视频获取,也可以通过用户上传终端或者在终端录入得到, 具体的待识别初始图像集的获取方式本申请实施例不做限制。
102、根据所述待识别初始图像集获取待识别数据集;
需要说明的是,因为待识别初始图像是一张包含了目标人物的同时可能 也包含了其他无关物品的图像,因此本申请实施例中,在获取到待识别初始 图像集之后,还需要对该待识别初始图像集进行检索,识别出图像里的目标 人物,并对该目标人物的全身或者半身进行坐标标定等处理操作,最终得到 待识别数据集。
103、将所述待识别数据集通过目标识别模型生成识别结果,所述目标识 别模型由多个行人的全身数据样本、半身数据样本以及全身半身混合数据样 本训练而得;
需要说明的是,本申请实施例中,将待识别数据集输入到目标识别模型 中,该目标识别模型会按照事先训练好的网络结构和损失函数自动对该待识 别数据集进行损失值计算等操作,并生成识别结果。
需要说明的是,目标识别模型距离的训练方法以及识别方法在下述实施 例会进行具体介绍,本申请实施例暂不做说明。
104、根据所述识别结果判断所述待识别初始图像集中的目标人物的相似 度是否大于第一预设值,若是,则执行步骤105;
需要说明的是,本申请实施例中,通过目标识别模型生成的识别结果显 示了目标人物在待识别初始图像集中每一张图像的位置坐标,并且每一张图 像中目标人物的相似度,通过判断该相似度是否大于预设的阈值来确认待识 别初始图像集中的目标人物是否为同一人。
本申请实施例中,若是相似度大于第一预设值,则执行步骤105。
105、确认所述待识别初始图像集中的目标人物为同一人。
需要说明的是,本申请实施例中,通过上述目标识别模型的识别结果得 知,该待识别初始图像集中的目标人物相似度达到预设值,说明该待识别初 始图像集中的目标人物皆为同一人。
本申请实施例中,当需要确认不同镜头下遮挡半身的行人与全身的行人 是否为同一人时,只需要获取该目标人物的待识别初始图像集,并根据该待 识别初始图像集获取待识别数据集,再通过目标识别模型生成识别结果,根 据该识别结果来确认遮挡半身的行人与全身的行人是否匹配,解决了半身被 遮挡行人重识别的问题,且识别准确率高。
上面对半身被遮挡的行人重识别方法进行了一个大概的说明,下面将对 半身被遮挡的行人重识别方法进行一个详细的介绍。
请参阅图2,本申请实施例中半身被遮挡的行人重识别方法另一实施例包 括:
201、通过目标定位网络获取目标人物的待识别初始图像集,所述目标定 位网络用于检测图像中存在的目标对象以及标定所述目标对象在所述图像中 的位置,所述待识别初始图像集至少包含一张图像;
本申请实施例中,通过目标定位网络检测监控视频或者图像中的目标对 象,并标定目标对象的坐标位置,以定位出目标人物的全身或者上半身或者 下半身,得到一份包含了目标人物的待识别初始图像集。
202、通过检测模型对所述待识别初始图像集进行检测,所述检测模型用 于检测所述目标人物的身形轮廓并标定出轮廓坐标;
需要说明的是,本申请实施例中,要检测出目标人物的全身,还需要事 先训练一个用于检测目标人物的身形轮廓并标定出轮廓坐标的检测模型,该 检测模型有全身检测模型和半身检测模型,因为一般正常使用的数据集基本 都是全身照,基本不会被遮挡的,因此本申请实施例主要采用全身检测模型 检测行人的全身。
203、根据所述轮廓坐标剪裁出所述目标人物的全身图像集和半身图像 集;
需要说明的是,本申请实施例中,通过检测模型检测出目标人物的身形 轮廓之后,会根据该检测框的坐标,将检测出的目标人物剪裁成上半部分和 下半部分。
需要说明的是,因为在实际中主要是解决下半部分遮挡的问题,因此本 申请实施例中需要将全身图和上半身图组成样本对。因为半身图是通过全身 图裁剪得到的,因此本申请的识别方法不需要半身图就可以得到,对于绝大 部分解决半身遮挡的行人重识别只能靠收集半身行人图像来解决的方案,本 申请不管全身图还是半身图都可以用来解决半身遮挡行人重识别的问题。
204、对所述全身图像集和所述半身图像集进行分类得到待识别数据集, 所述待识别数据集包括待识别全身数据集、待识别半身数据集以及待识别全 身半身混合数据集;
需要说明的是,本申请实施例中,将检测出的目标人物裁剪成上半部分 和下半部分后,将裁剪后的图按照类别进行分类并标签(如第1号),保证 半身图和全身图一样,这样待识别数据集由全身数据集一种得到了全身数据 集、半身数据集以及全身半身混合数据集三种。
205、获取训练样本图像集,所述训练样本图像集至少包含一份训练样本, 所述训练样本为行人的全身图像和/或半身图像;
为了得到一个识别率高的识别模型,本申请实施例中需要获取大量训练 样本进行模型训练。
需要说明的是,为了提高行人重识别的准确性,该训练样本图像集的选 取应该是多样的,例如可以包括行人姿势多样性、行人尺度多样性和背景多 样性等。本申请实施例对图像集获取方式不做限定,比如,可以通过摄像设 备拍摄的监控视频获取,也可以根据网友上传的直接从网络数据库中获取, 具体可以根据需要确定。
206、根据所述训练样本图像集得到训练样本数据集,所述训练样本数据 集包括训练样本全身数据集、训练样本半身数据集以及训练样本全身半身混 合数据集;
需要说明的是,本申请实施例中,获取到训练样本图像集之后,通过检 测模型等进行检测、剪裁以及分类等一系列预处理,得到训练样本数据集, 该训练样本数据集包括训练样本全身数据集、训练样本半身数据集以及训练 样本全身半身混合数据集。
207、通过所述初始模型提取所述训练样本数据集的特征向量,所述初始 模型为基于深度神经网络建立的模型;
需要说明的是,本申请实施例中,在训练出目标识别模型之前,可以选 用一个比较好的初始骨干网络进行训练,比如可以选用ResNet、MobileNet、 VGGNet、ibnResNet等目前常用的神经网络结构,具体本申请实施例不做限制。
此外,通过初始模型提取训练样本数据集的特征,该特征具体可以是行 人的衣服颜色、配饰、体态、发型、姿势和周围的建筑物等。
208、通过Id Loss损失函数和Triplet Loss损失函数对所述特征向量 中不同类别的样本数据分别进行损失值计算,得到三组Triplet Loss损失值 和三组Id Loss损失值,所述Id Loss损失函数用于区分所述特征向量中不 同类别的样本数据,所述TripletLoss损失函数用于训练差异性较小的样本 数据;
需要说明的是,本申请实施例中,采用Id Loss损失函数加上Triplet Loss 损失函数联合监督训练的方式,对训练样本数据进行损失值计算,其中,Id Loss主要是为了区分类别,其计算方式跟一般的Softmax一样;Triplet Loss 主要是为了训练过程中相同类别样本对之间的距离更小,不同类别的样本对 之间的距离变得更大,其对于半身图和全身图混合的数据集效果非常明显。
具体的损失计算公式为Ltriplet=dp-dn+a,其中,dp是一个训练Batch中相同 类别样本之间的归一化后的欧式距离,dn是一个训练Batch中不同类别样本之 间的归一化后的欧式距离,a是一个距离惩罚项,一般设置成0-1之间的浮点 型小数。
本申请实施例中,同时将训练样本全身数据集、训练样本半身数据集以 及训练样本全身半身混合数据集三个数据集送入确定好的初始网络结构(即 初始模型)中,三个数据集共用一个网络结构,但是初始模型会根据每组数 据采用的张数分别计算每组数据的损失,因此会得到三组Triplet Loss和三 组Id Losss,其中,三组Triplet Loss和三组IdLosss计算方式如下公式 (1)和公式(2)所示:
Ltriplet=a1*Ltriplet1+a2*Ltriplet2+a3*Ltriplet3 公式(1)
Lid=b1*Lid1+b2*Lid2+b3*Lid3 公式(2)
最后输出两个总的Loss。其中上述a1、a2、a3、b1、b2、b3分别为0-1之 间的权重,在本申请中更加关注半身图像,因此a2、a3、b2、b3可以设置大一 些。
209、根据所述Triplet Loss损失值和所述Id Loss损失值计算总损失 值;
需要说明的是,本申请实施例中,输出两个总的Loss后,再根据Ltriplet和Lid计算总损失值。
需要说明的是,不同的数据集,其损失值计算方式不同,一次训练所选 取的样本数也不同,如本申请实施例中,训练样本全身数据集的Batch Size 可以设置为48,训练样本半身数据集Batch Size可以设置为96、混合数据 集Batch Size为96。Batch Size的大小影响模型的优化程度和速度。同时 其直接影响到GPU内存的使用情况,假如你GPU内存不大,该数值最好设置 小一点。
此外,本申请实施例中学习率可以设置成0.01,每训练10万次迭代学习 率乘以0.1,一直到学习率降至0.00001,训练结束。
210、判断所述总损失值是否小于第二预设值,若是,则执行步骤211; 若否,则执行步骤212;
需要说明的是,本申请实施例中,为了确认该初始模型对训练样本数据 集的检测结果是否准确,还需要判断在前述步骤中计算得到的总损失值是否 大于预设阈值,即第二预设值,通过判断是否满足预设阈值,来确认该初始 模型的输出结果的准确率。
本申请实施例中,若是总损失值大于第二预设值,则执行步骤211;若是 小于或者等于预设值,则执行步骤212。
211、将所述初始模型确定为目标识别模型;
需要说明的是,本申请实施例中,若是总损失值大于第二预设值,则将 所述初始模型确定为目标识别模型。
212、若否,则根据所述总损失值调整所述初始模型的参数,并将所述训 练样本数据集重新输入更新参数后的初始模型;
需要说明的是,本申请实施例中,若是总损失值小于或者等于第二预设 值,则根据总损失值调整初始模型的参数,并将训练样本数据集重新输入更 新参数后的初始模型,再次进行训练,直至总损失值小于第二预设值之后, 执行步骤213。
213、将所述待识别数据集通过目标识别模型生成识别结果,所述目标识 别模型由多个行人的全身数据样本、半身数据样本以及全身半身混合数据样 本训练而得;
需要说明的是,本申请实施例中的步骤213与前述实施例中的步骤103 相似,此处不再赘述。
214、根据所述识别结果判断所述待识别初始图像集中的目标人物的相似 度是否大于第一预设值,若是,则执行步骤215;若否,则执行步骤216;
需要说明的是,本申请实施例中,通过目标识别模型生成的识别结果显 示了目标人物在待识别初始图像集中每一张图像的位置坐标,并且每一张图 像中目标人物的相似度,通过判断该相似度是否大于预设的阈值来确认待识 别初始图像集中的目标人物是否为同一人。
本申请实施例中,若是相似度大于第一预设值,则执行步骤215;若是小 于或者等于,则执行步骤216。
215、确认所述待识别初始图像集中的目标人物为同一人。
需要说明的是,本申请实施例中的步骤215与前述实施例中的步骤105 相似,此处不再赘述。
216、确认所述待识别初始图像集中的目标人物不是同一人。
需要说明的是,本申请实施例中,若是相似度小于或者等于第一预设值, 则确认待识别初始图像集中的目标人物不是同一人。
本申请实施例中,针对于行人被遮挡导致重识别准确率低的问题,专门 训练出一个目标识别模型,该目标识别模型不需要单独收集遮挡半身的样本 图像进行训练,可以直接通过全身图像进行裁剪得到半身图进行训练,简单, 方便,且这种方式训练得到的目标识别模型的识别率高。
上面对半身被遮挡的行人重识别方法进行了描述,下面将对该半身被遮 挡的行人重识别装置进行说明。
请参阅图3,本申请实施例中半身被遮挡的行人重识别装置一个实施例包 括:
第一获取单元301,用于获取目标人物的待识别初始图像集,所述待识别 初始图像集至少包含一张图像;
第二获取单元302,用于根据所述待识别初始图像集获取待识别数据集;
生成单元303,用于将所述待识别数据集通过目标识别模型生成识别结 果,所述目标识别模型由多个行人的全身数据样本、半身数据样本以及全身 半身混合数据样本训练而得;
判断单元304,用于根据所述识别结果判断所述待识别初始图像集中的目 标人物的相似度是否大于第一预设值;
确认单元305,用于在判断单元304根据所述识别结果判断所述待识别初 始图像集中的目标人物的相似度大于第一预设值之后,确认所述待识别初始 图像集中的目标人物为同一人。
本申请实施例中,当需要确认不同镜头下遮挡半身的行人与全身的行人 是否为同一人时,只需要通过第一获取单元301获取该目标人物的待识别初 始图像集,并通过第二获取单元302根据该待识别初始图像集获取待识别数 据集,再通过生成单元303根据目标识别模型生成识别结果,根据该识别结 果来确认遮挡半身的行人与全身的行人是否匹配,解决了半身被遮挡行人重 识别的问题,且识别准确率高。
上面对半身被遮挡的行人重识别装置的各单元功能进行一个大概的描 述,下面将对半身被遮挡的行人重识别装置的各单元功能进行一个详细的描 述。
请参阅图4,本申请实施例中,半身被遮挡的行人重识别装置另一实施例 包括:
第一获取单元401,用于获取目标人物的待识别初始图像集,所述待识别 初始图像集至少包含一张图像;
第二获取单元402,用于根据所述待识别初始图像集获取待识别数据集;
第三获取单元403,用于获取训练样本图像集,所述训练样本图像集至少 包含一份训练样本,所述训练样本为行人的全身图像和/或半身图像;
第四获取单元404,用于根据所述训练样本图像集得到训练样本数据集, 所述训练样本数据集包括训练样本全身数据集、训练样本半身数据集以及训 练样本全身半身混合数据集;
训练单元405,用于根据所述训练样本数据集对初始模型进行训练,得到 目标识别模型,所述初始模型为基于深度神经网络建立的模型;
可选的,训练单元405进一步还可以包括:
提取模块4051,用于通过初始模型提取所述训练样本数据集的特征向量, 所述初始模型为基于深度神经网络建立的模型;
计算模块4052,用于根据所述特征向量进行总损失值计算;
判断模块4053,用于判断所述总损失值是否小于第二预设值;
确定模块4054,用于在判断模块4053根据所述识别结果判断所述待识别 初始图像集中的目标人物的相似度大于第一预设值之后,将所述初始模型确 定为目标识别模型;
调整模块4055,用于在判断模块4053根据所述识别结果判断所述待识别 初始图像集中的目标人物的相似度小于或等于第一预设值之后,根据所述总 损失值调整所述初始模型的参数,并将所述训练样本数据集重新输入更新参 数后的初始模型。
生成单元406,用于将所述待识别数据集通过目标识别模型生成识别结 果,所述目标识别模型由多个行人的全身数据样本、半身数据样本以及全身 半身混合数据样本训练而得;
判断单元407,用于根据所述识别结果判断所述待识别初始图像集中的目 标人物的相似度是否大于第一预设值;
确认单元408,用于在判断单元407根据所述识别结果判断所述待识别初 始图像集中的目标人物的相似度大于第一预设值之后,确认所述待识别初始 图像集中的目标人物为同一人。
本申请实施例中,各单元模块的功能与前述图1至图2中所示实施例中 的步骤对应,此处不再赘述。
请参阅图5,本申请实施例中半身被遮挡的行人重识别装置另一实施例包 括:
处理器501、存储器502、输入输出单元503以及总线504;
处理器501与存储器502、输入输出单元503以及总线504相连;
处理器501执行如下操作:
获取目标人物的待识别初始图像集,所述待识别初始图像集至少包含一 张图像;
根据所述待识别初始图像集获取待识别数据集;
将所述待识别数据集通过目标识别模型生成识别结果,所述目标识别模 型由多个行人的全身数据样本、半身数据样本以及全身半身混合数据样本训 练而得;
根据所述识别结果判断所述待识别初始图像集中的目标人物的相似度是 否大于第一预设值,若是,则确认所述待识别初始图像集中的目标人物为同 一人。
本实施例中,处理器501的功能与前述图1至图2所示实施例中的步骤 对应,此处不再赘述。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描 述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应 过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和 方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示 意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可 以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个 系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间 的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合 或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作 为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方, 或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或 者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中, 也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单 元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单 元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售 或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本 申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的 全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个 存储介质中,包括若干指令,用以使得一台计算机设备(可以是个人计算机, 服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步 骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,read-onlymemory)、随机存取存储器(RAM,random access memory)、磁碟或者光盘 等各种可以存储程序代码的介质。
Claims (10)
1.一种半身被遮挡的行人重识别方法,其特征在于,包括:
获取目标人物的待识别初始图像集,所述待识别初始图像集至少包含一张图像;
根据所述待识别初始图像集获取待识别数据集;
将所述待识别数据集通过目标识别模型生成识别结果,所述目标识别模型由多个行人的全身数据样本、半身数据样本以及全身半身混合数据样本训练而得;
根据所述识别结果判断所述待识别初始图像集中的目标人物的相似度是否大于第一预设值,若是,则确认所述待识别初始图像集中的目标人物为同一人。
2.根据权利要求1所述的行人重识别方法,其特征在于,在所述将所述待识别数据集通过目标识别模型生成识别结果,所述目标识别模型由多个行人的全身数据样本、半身数据样本以及全身半身混合数据样本训练而得之前,所述方法还包括:
获取训练样本图像集,所述训练样本图像集至少包含一份训练样本,所述训练样本为行人的全身图像和/或半身图像;
根据所述训练样本图像集得到训练样本数据集,所述训练样本数据集包括训练样本全身数据集、训练样本半身数据集以及训练样本全身半身混合数据集;
根据所述训练样本数据集对初始模型进行训练,得到目标识别模型,所述初始模型为基于深度神经网络建立的模型。
3.根据权利要求2所述的行人重识别方法,其特征在于,所述根据所述训练样本数据集对初始模型进行训练,得到目标识别模型,所述初始模型为基于深度神经网络建立的模型,包括:
通过初始模型提取所述训练样本数据集的特征向量,所述初始模型为基于深度神经网络建立的模型;
根据所述特征向量进行总损失值计算;
判断所述总损失值是否小于第二预设值,若是,则将所述初始模型确定为目标识别模型;
若否,则根据所述总损失值调整所述初始模型的参数,并将所述训练样本数据集重新输入更新参数后的初始模型。
4.根据权利要求3所述的行人重识别方法,其特征在于,所述根据所述特征向量进行总损失值计算,包括:
通过Id Loss损失函数和Triplet Loss损失函数对所述特征向量中不同类别的样本数据分别进行损失值计算,得到三组Triplet Loss损失值和三组Id Loss损失值,所述IdLoss损失函数用于区分所述特征向量中不同类别的样本数据,所述Triplet Loss损失函数用于训练差异性较小的样本数据;
根据所述Triplet Loss损失值和所述Id Loss损失值计算总损失值。
5.根据权利要求1所述的行人重识别方法,其特征在于,在所述根据所述识别结果判断所述待识别初始图像集中的目标人物的相似度是否大于第一预设值之后,所述方法还包括:
若否,则确认所述待识别初始图像集中的目标人物不是同一人。
6.根据权利要求1至5中任意一项所述的行人重识别方法,其特征在于,所述获取目标人物的待识别初始图像集,包括:
通过目标定位网络获取目标人物的待识别初始图像集,所述目标定位网络用于检测图像中存在的目标对象以及标定所述目标对象在所述图像中的位置。
7.根据权利要求1至5中任意一项所述的行人重识别方法,其特征在于,所述根据所述待识别初始图像集获取待识别数据集,包括:
通过检测模型对所述待识别初始图像集进行检测,所述检测模型用于检测所述目标人物的身形轮廓并标定出轮廓坐标;
根据所述轮廓坐标剪裁出所述目标人物的全身图像集和半身图像集;
对所述全身图像集和所述半身图像集进行分类得到待识别数据集,所述待识别数据集包括待识别全身数据集、待识别半身数据集以及待识别全身半身混合数据集。
8.一种半身被遮挡的行人重识别装置,其特征在于,包括:
第一获取单元,用于获取目标人物的待识别初始图像集,所述待识别初始图像集至少包含一张图像;
第二获取单元,用于根据所述待识别初始图像集获取待识别数据集;
生成单元,用于将所述待识别数据集通过目标识别模型生成识别结果,所述目标识别模型由多个行人的全身数据样本、半身数据样本以及全身半身混合数据样本训练而得;
判断单元,用于根据所述识别结果判断所述待识别初始图像集中的目标人物的相似度是否大于第一预设值;
确认单元,用于在所述判断单元根据所述识别结果判断所述待识别初始图像集中的目标人物的相似度大于第一预设值之后,确认所述待识别初始图像集中的目标人物为同一人。
9.根据权利要求8所述的行人重识别装置,其特征在于,在所述生成单元之前,所述装置还包括:
第三获取单元,用于获取训练样本图像集,所述训练样本图像集至少包含一份训练样本,所述训练样本为行人的全身图像和/或半身图像;
第四获取单元,用于根据所述训练样本图像集得到训练样本数据集,所述训练样本数据集包括训练样本全身数据集、训练样本半身数据集以及训练样本全身半身混合数据集;
训练单元,用于根据所述训练样本数据集对初始模型进行训练,得到目标识别模型,所述初始模型为基于深度神经网络建立的模型。
10.根据权利要求9所述的行人重识别装置,其特征在于,所述训练单元,包括:
提取模块,用于通过初始模型提取所述训练样本数据集的特征向量,所述初始模型为基于深度神经网络建立的模型;
计算模块,用于根据所述特征向量进行总损失值计算;
判断模块,用于判断所述总损失值是否小于第二预设值;
确定模块,用于在所述判断模块根据所述识别结果判断所述待识别初始图像集中的目标人物的相似度大于第一预设值之后,将所述初始模型确定为目标识别模型;
调整模块,用于在所述判断模块根据所述识别结果判断所述待识别初始图像集中的目标人物的相似度小于或等于第一预设值之后,根据所述总损失值调整所述初始模型的参数,并将所述训练样本数据集重新输入更新参数后的初始模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110976012.8A CN113887279A (zh) | 2021-08-24 | 2021-08-24 | 一种半身被遮挡的行人重识别方法及相关装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110976012.8A CN113887279A (zh) | 2021-08-24 | 2021-08-24 | 一种半身被遮挡的行人重识别方法及相关装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113887279A true CN113887279A (zh) | 2022-01-04 |
Family
ID=79011360
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110976012.8A Pending CN113887279A (zh) | 2021-08-24 | 2021-08-24 | 一种半身被遮挡的行人重识别方法及相关装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113887279A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116052220A (zh) * | 2023-02-07 | 2023-05-02 | 北京多维视通技术有限公司 | 行人重识别方法、装置、设备及介质 |
-
2021
- 2021-08-24 CN CN202110976012.8A patent/CN113887279A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116052220A (zh) * | 2023-02-07 | 2023-05-02 | 北京多维视通技术有限公司 | 行人重识别方法、装置、设备及介质 |
CN116052220B (zh) * | 2023-02-07 | 2023-11-24 | 北京多维视通技术有限公司 | 行人重识别方法、装置、设备及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110084173B (zh) | 人头检测方法及装置 | |
CN111104867B (zh) | 基于部件分割的识别模型训练、车辆重识别方法及装置 | |
CN108108662B (zh) | 深度神经网络识别模型及识别方法 | |
CN109190470B (zh) | 行人重识别方法及装置 | |
CN104599287B (zh) | 对象跟踪方法和装置、对象识别方法和装置 | |
EP0844582A2 (en) | System and method for detecting a human face | |
CN110569731A (zh) | 一种人脸识别方法、装置及电子设备 | |
CN111353385B (zh) | 一种基于掩膜对齐与注意力机制的行人再识别方法和装置 | |
CN107944431A (zh) | 一种基于运动变化的智能识别方法 | |
JP2000003452A (ja) | デジタル画像における顔面の検出方法、顔面検出装置、画像判定方法、画像判定装置およびコンピュ―タ可読な記録媒体 | |
CN107423306B (zh) | 一种图像检索方法及装置 | |
US11380010B2 (en) | Image processing device, image processing method, and image processing program | |
CN104123543A (zh) | 一种基于人脸识别的眼球运动识别方法 | |
CN110991397B (zh) | 一种行进方向确定方法及相关设备 | |
CN110796101A (zh) | 一种嵌入式平台的人脸识别方法及系统 | |
CN111723687A (zh) | 基于神经网路的人体动作识别方法和装置 | |
CN111597910A (zh) | 一种人脸识别方法、装置、终端设备及介质 | |
CN111027481A (zh) | 基于人体关键点检测的行为分析方法及装置 | |
WO2013075295A1 (zh) | 低分辨率视频的服装识别方法及系统 | |
CN109117746A (zh) | 手部检测方法及机器可读存储介质 | |
CN110675442A (zh) | 一种结合目标识别技术的局部立体匹配方法及系统 | |
JPH07302327A (ja) | 物体画像検出方法及び検出装置 | |
CN111310720A (zh) | 基于图度量学习的行人重识别方法及系统 | |
CN113887279A (zh) | 一种半身被遮挡的行人重识别方法及相关装置 | |
CN106406507B (zh) | 图像处理方法以及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |