CN109948530B - 基于交叉学习的行人再识别性能提升方法 - Google Patents
基于交叉学习的行人再识别性能提升方法 Download PDFInfo
- Publication number
- CN109948530B CN109948530B CN201910207379.6A CN201910207379A CN109948530B CN 109948530 B CN109948530 B CN 109948530B CN 201910207379 A CN201910207379 A CN 201910207379A CN 109948530 B CN109948530 B CN 109948530B
- Authority
- CN
- China
- Prior art keywords
- learning
- pedestrian
- background
- cross
- cross learning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 29
- 238000010586 diagram Methods 0.000 claims description 5
- 238000001914 filtration Methods 0.000 claims description 4
- 238000000605 extraction Methods 0.000 claims description 3
- 238000013527 convolutional neural network Methods 0.000 abstract description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
Images
Landscapes
- Image Analysis (AREA)
Abstract
本发明涉及一种基于交叉学习的行人再识别性能提升方法。该方法提供一种交叉学习的策略并融合现有模型的特征,通过特征互补的方式,学习到更加具有鲁棒性的特征,结合卷积神经网络,对图像进行特征的提取,从而达到对行人再识别性能的提升。
Description
技术领域
本发明涉及计算机视觉、深度学习领域,具体涉及一种基于交叉学习的行人再识别性能提升方法。
背景技术
行人再识别(re-ID)是计算机视觉领域的一个重要的研究课题,其目的是在非重叠相机的视图中识别出同一个人。行人再识别对于真实场景下的视频监控系统具有很重要的意义,例如跨摄像头的跟踪,行人检索等。人的重新识别是一项非常具有挑战性的任务。当一个人被两个不同的摄像机捕捉到时,光照条件、背景杂波、遮挡、可观察到的人体部位和感知到的人的姿势可能会有显著的不同。
现有解决背景干扰的方法,多数是利用MaskR-CNN等分割的方法滤除掉背景,或者利用注意力机制的方法,让网络专注于前景信息的信息,尽可能的抑制背景信息,这些方法在一定程度上提升了行人再识别的性能。
目前解决背景干扰的方法,存在以下问题:这些现有的模型直接使用滤除掉背景的前景图提取特征,完全放弃掉了所有的背景信息,有些背景信息有时候是可以作为有用的上下文信息,忽视所有背景信息会忽略一些关于行人再识别任务的线索。与此同时:此模型并没有考虑到由于行人再识别图像分辨率较低,有的背景比较复杂,滤除掉背景的图像依然带有噪声,如图1所示。
发明内容
本发明的目的在于提供一种基于交叉学习的行人再识别性能提升方法,通过特征互补的方式,学习到更加具有鲁棒性的特征,结合卷积神经网络,对图像进行特征的提取,从而达到对行人再识别性能的提升。
为实现上述目的,本发明的技术方案是:一种基于交叉学习的行人再识别性能提升方法,包括如下步骤:
步骤S1:利用行人解析的网络滤除掉图像的背景,得到不包含背景的前景图像;
步骤S2:基于DenseNet121的网络架构,利用网络中的卷积层对步骤S1得到的前景图像进行特征提取,得到特征图;
步骤S3:通过Softmax层对步骤S2得到的特征图中进行分类,判断每个行人所属类别;具体的,
所述SoftMax层采用SoftMax回归模型,假设类别标签为y,有k个不同的取值,输入x和标签y表示成{(x1,y1),(x2,y2),...,(xi,yi)},yi∈{1,2,...,k};
假设对于每一个输入对应每个类别j的概率值P(y=j|X),输出是一个k维向量,表示k个估计值,函数公式如下所示:
其中,θ1,θ2,...,θk是SoftMax回归模型的参数,对结果进行最大值判断,得到概率最大的类别j,如下公式所示:
上述过程为交叉学习的第一阶段;
步骤S4:在步骤S3通过前景图像训练得到的模型基础上,继续学习原始图像背景中有用信息以及背景和前景间内在的联系,即使用原始图像对交叉学习第一阶段得到的模型继续学习特征信息,该过程为交叉学习的第二阶段;
步骤S5:完成交叉学习的两个阶段,通过特征互补的方式,即可得到更鲁棒的特征。
在本发明一实施例中,步骤S3中,k=3。
相较于现有技术,本发明具有以下有益效果:本发明方法考虑到背景信息可能存在有用信息,而提供一种交叉学习的策略并融合现有模型的特征,即采用交叉学习的方法,在先学习前景信息的基础上,在学习背景和前景间的内在联系以及背景中有用上下文信息,通过特征互补的方式,学习到更加具有鲁棒性的特征,结合卷积神经网络,对图像进行特征的提取,从而达到对行人再识别性能的提升。
附图说明
图1为现有行人识别结果示意图。
图2为本发明方法框图。
具体实施方式
下面结合附图,对本发明的技术方案进行具体说明。
行人再识别主要是在跨摄像头的角度下,检索出同一个人,准确检索出一个人是相当重要的。本文利用提出的交叉学习,不但能让模型专注于前景信息,滤除背景的干扰,并且能学习背景中有用的信息。最后通过特征融合的方式,得到更加鲁棒性的特征。
本发明提供了一种基于交叉学习的行人再识别性能提升方法,包括如下步骤:
步骤S1:利用行人解析的网络滤除掉图像的背景,得到不包含背景的前景图像;
步骤S2:基于DenseNet121的网络架构,利用网络中的卷积层对步骤S1得到的前景图像进行特征提取,得到特征图;
步骤S3:通过Softmax层对步骤S2得到的特征图中进行分类,判断每个行人所属类别;具体的,
所述SoftMax层采用SoftMax回归模型,假设类别标签为y,有k个不同的取值,输入x和标签y表示成{(x1,y1),(x2,y2),...,(xi,yi)},yi∈{1,2,...,k},k=3;
假设对于每一个输入对应每个类别j的概率值P(y=j|X),输出是一个k维向量,表示k个估计值,函数公式如下所示:
其中,θ1,θ2,...,θk是SoftMax回归模型的参数,对结果进行最大值判断,得到概率最大的类别j,如下公式所示:
上述过程为交叉学习的第一阶段;
步骤S4:在步骤S3通过前景图像训练得到的模型基础上,考虑到完全放弃的背景信息,对丢失掉行人的背景再识别有用的上下文线索,所以本发明让模型继续学习原始图像背景中有用信息以及背景和前景间内在的联系,即使用原始图像对交叉学习第一阶段得到的模型继续学习特征信息,该过程为交叉学习的第二阶段;
步骤S5:完成交叉学习的两个阶段,通过特征互补的方式,即可得到更鲁棒的特征。
以上是本发明的较佳实施例,凡依本发明技术方案所作的改变,所产生的功能作用未超出本发明技术方案的范围时,均属于本发明的保护范围。
Claims (2)
1.一种基于交叉学习的行人再识别性能提升方法,其特征在于,包括如下步骤:
步骤S1:利用行人解析的网络滤除掉图像的背景,得到不包含背景的前景图像;
步骤S2:基于DenseNet121的网络架构,利用网络中的卷积层对步骤S1得到的前景图像进行特征提取,得到特征图;
步骤S3:通过Softmax层对步骤S2得到的特征图中进行分类,判断每个行人所属类别;具体的,
所述SoftMax层采用SoftMax回归模型,假设类别标签为y,有k个不同的取值,输入x和标签y表示成{(x1,y1),(x2,y2),...,(xi,yi)},yi∈{1,2,...,k};
假设对于每一个输入对应每个类别j的概率值P(y=j|X),输出是一个k维向量,表示k个估计值,函数公式如下所示:
其中,θ1,θ2,...,θk是SoftMax回归模型的参数,对结果进行最大值判断,得到概率最大的类别j,如下公式所示:
上述过程为交叉学习的第一阶段;
步骤S4:在步骤S3通过前景图像训练得到的模型基础上,继续学习原始图像背景中有用信息以及背景和前景间内在的联系,即使用原始图像对交叉学习第一阶段得到的模型继续学习特征信息,该过程为交叉学习的第二阶段;
步骤S5:完成交叉学习的两个阶段,通过特征互补的方式,即可得到更鲁棒的特征。
2.根据权利要求1所述的一种基于交叉学习的行人再识别性能提升方法,其特征在于,步骤S3中,k=3。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910207379.6A CN109948530B (zh) | 2019-03-19 | 2019-03-19 | 基于交叉学习的行人再识别性能提升方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910207379.6A CN109948530B (zh) | 2019-03-19 | 2019-03-19 | 基于交叉学习的行人再识别性能提升方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109948530A CN109948530A (zh) | 2019-06-28 |
CN109948530B true CN109948530B (zh) | 2021-08-31 |
Family
ID=67008367
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910207379.6A Expired - Fee Related CN109948530B (zh) | 2019-03-19 | 2019-03-19 | 基于交叉学习的行人再识别性能提升方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109948530B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111667412A (zh) * | 2020-06-16 | 2020-09-15 | 中国矿业大学 | 基于交叉学习网络的图像超分辨率的重建方法及装置 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108255290A (zh) * | 2016-12-29 | 2018-07-06 | 谷歌有限责任公司 | 移动装置上的模态学习 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11176382B2 (en) * | 2017-03-06 | 2021-11-16 | Conduent Business Services, Llc | System and method for person re-identification using overhead view images |
-
2019
- 2019-03-19 CN CN201910207379.6A patent/CN109948530B/zh not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108255290A (zh) * | 2016-12-29 | 2018-07-06 | 谷歌有限责任公司 | 移动装置上的模态学习 |
Non-Patent Citations (3)
Title |
---|
"Asymmetric cross-view dictionary learning for person re-identification";Minyue Jiang.et al;《 2017 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP)》;20170619;全文 * |
"Person Re-Identification by Deep Learning Multi-Scale Representations";Yanbei Chen.et al;《ICCV》;20171231;全文 * |
"基于融合特征的行人再识别方法";袁立等;《模式识别与人工智能》;20170331;第30卷(第3期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN109948530A (zh) | 2019-06-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108830252B (zh) | 一种融合全局时空特征的卷积神经网络人体动作识别方法 | |
CN110929593B (zh) | 一种基于细节辨别区别的实时显著性行人检测方法 | |
Kim et al. | End-to-end ego lane estimation based on sequential transfer learning for self-driving cars | |
Sivaraman et al. | A general active-learning framework for on-road vehicle recognition and tracking | |
CN108875608B (zh) | 一种基于深度学习的机动车交通信号识别方法 | |
WO2018145470A1 (zh) | 一种图像检测方法和装置 | |
CN111639564B (zh) | 一种基于多注意力异构网络的视频行人重识别方法 | |
CN108416780B (zh) | 一种基于孪生-感兴趣区域池化模型的物体检测与匹配方法 | |
CN109460704B (zh) | 一种基于深度学习的疲劳检测方法、系统和计算机设备 | |
JP2021528784A (ja) | パノラマ画像のスカイフィルタ方法及び携帯端末 | |
KR102132407B1 (ko) | 점진적 딥러닝 학습을 이용한 적응적 영상 인식 기반 감성 추정 방법 및 장치 | |
CN105760858A (zh) | 一种基于类Haar中间层滤波特征的行人检测方法及装置 | |
Zhu et al. | Towards automatic wild animal detection in low quality camera-trap images using two-channeled perceiving residual pyramid networks | |
Nejati et al. | License plate recognition based on edge histogram analysis and classifier ensemble | |
Tsutsui et al. | Distantly supervised road segmentation | |
CN109948530B (zh) | 基于交叉学习的行人再识别性能提升方法 | |
KR20180092453A (ko) | Cnn과 스테레오 이미지를 이용한 얼굴 인식 방법 | |
CN115147450B (zh) | 基于运动帧差图像的移动目标检测方法及检测装置 | |
JP4740038B2 (ja) | 画像処理装置 | |
CN113887468B (zh) | 一种三阶段网络框架的单视角人-物交互的识别方法 | |
Liu et al. | Real-time pose classification for driver monitoring | |
CN113869151A (zh) | 一种基于特征融合的跨视角步态识别方法及系统 | |
Lin et al. | Boosted vehicle detection using local and global features | |
Bhandari et al. | Image aesthetic assessment using deep learning for automated classification of images into appealing or not-appealing | |
Zhang et al. | Multi-layer attention for person re-identification |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20210831 |
|
CF01 | Termination of patent right due to non-payment of annual fee |