CN112800898A - 行人重识别数据集增强方法、系统、终端、摄像头及介质 - Google Patents
行人重识别数据集增强方法、系统、终端、摄像头及介质 Download PDFInfo
- Publication number
- CN112800898A CN112800898A CN202110065005.2A CN202110065005A CN112800898A CN 112800898 A CN112800898 A CN 112800898A CN 202110065005 A CN202110065005 A CN 202110065005A CN 112800898 A CN112800898 A CN 112800898A
- Authority
- CN
- China
- Prior art keywords
- pedestrian
- coding
- appearance
- pictures
- data set
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 34
- 238000005286 illumination Methods 0.000 claims abstract description 14
- 230000036544 posture Effects 0.000 claims abstract description 14
- 238000012545 processing Methods 0.000 claims abstract description 4
- 238000004590 computer program Methods 0.000 claims description 8
- 238000005034 decoration Methods 0.000 claims description 8
- 230000010365 information processing Effects 0.000 claims description 7
- 238000005457 optimization Methods 0.000 claims description 5
- 239000004576 sand Substances 0.000 claims description 3
- 230000002708 enhancing effect Effects 0.000 abstract description 10
- 238000011161 development Methods 0.000 abstract description 3
- 238000005516 engineering process Methods 0.000 abstract description 3
- 238000002372 labelling Methods 0.000 abstract description 3
- 230000009466 transformation Effects 0.000 description 7
- 230000000694 effects Effects 0.000 description 6
- 238000012549 training Methods 0.000 description 6
- 230000007547 defect Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 208000037170 Delayed Emergence from Anesthesia Diseases 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000003014 reinforcing effect Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Evolutionary Biology (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Multimedia (AREA)
- Human Computer Interaction (AREA)
- Image Processing (AREA)
Abstract
本发明开一种行人重识别数据集增强方法、系统、终端、摄像头及介质,涉及图像处理技术领域。用于网络输入三张行人图片,分别使用外貌编码器和结构编码器进行编码,得到外貌编码和结构编码;使用Es编码器对xi进行编码,得到结构编码Cs i;使用Ea编码器对xk进行编码,得到xk的外貌编码Ca k,鉴别器D1和D2的判断;重复迭代得到最优生成器;利用训练好的最优生成器生成行人数据集,输入三张行人图片,交叉生成不同的外貌的行人图片,还交叉生成同一行人ID不同姿态、背景、光照、角度的行人图片。本发明降低行人重识别数据集采集及标注成本,丰富行人重识别数据集的多样性,助力行人重识别技术发展。
Description
技术领域
本发明公开涉及图像处理技术领域,尤其涉及一种行人重识别数据集增强方法、系统、终端、摄像头及介质。
背景技术
目前,几何变换包括翻转,旋转,裁剪,变形,缩放等增强方法;常见的颜色变换包括噪声、模糊、颜色变换、擦除、填充等增强方法;合成、拼接增强方法;基于动作预测的生成类增强方法。
现有技术的缺陷为:
几何变换、颜色变换、合成常用方法不适合用于行人重识别数据增强;基于动作预测的生产类方法生成的样本多样性不足,例如行人外表、衣着、装饰、姿态、背景、光照、角度等方面的缺失。
通过上述分析,现有技术存在的问题及缺陷为:
由于现有行人重识别数据集普遍偏小,多样性不足,不能满足深度神经网络训练要求,数据集过小,训练容易过拟合,数据集多样性不足,模型鲁棒性不高。
几何变换、颜色变换、合成等常用数据增强方法不适用于行人重识别数据集的增强。
基于动作预测的生产类方法生成的样本多样性不足,如行人外表、衣着、装饰、姿态、背景、光照、角度等方面的缺失。
难于生成清晰的样本图像。
加大行人数据采集力度,由于行人重识别数据集采集及标注难度较高,对人物、器材、场景需求非常大,直接采集扩充数据集非常困难,耗费巨大。
解决以上问题及缺陷的难度为:
需要保证行人ID不变的情况下,扩充该行人ID的多样性,包括行人外表、衣着、装饰、姿态、背景、光照、角度等。
生成对抗网络训练不稳定,训练自由度太大,生成器和判别器很容易陷入不正常的对抗。
需要预先采集一定量的数据集,用于模型训练。
解决以上问题及缺陷的意义为:
只需要预先采集少量的数据,然后通过本发明的方法就能扩充大量的数据,可以节省大量的人工成本、时间成本和物资成本。
扩充大量的行人重识别数据集,有助于行人重识别技术的发展。
发明内容
为克服相关技术中存在的问题,本发明公开实施例提供一种行人重识别数据集增强方法、系统、终端、摄像头及介质。所述技术方案如下:
根据本发明公开实施例的第一方面,提供一种基于生成对抗网络的行人重识别数据集增强方法,应用于数据信息处理终端,所述基于生成对抗网络的行人重识别数据集增强方法包括:
利用训练好的最优生成器G生成行人数据集,输入多张行人图片,交叉生成不同的外貌的行人图片;同时还交叉生成同一行人ID不同姿态、背景、光照、角度的行人图片;所述行人图片包括衣着、装饰。
优选地,所述最优生成器G生成方法包括:
第一步,网络输入三张行人图片分别为xi、xj、xk,其中xj与xk是同一行人在不同场景或不同时段采集的图片,分别使用外貌编码器Ea和结构编码器Es对xj进行编码,得到外貌编码Ca j和结构编码Cs j;Ea外貌编码器是ImageNet上预训练的ResNet50,移除全局平均池化层和全连接层后,加一个自适应max-pool,输出的外貌code的size为2048*1;Es结构编码器是一个比较浅的网络,输出的结构code为128*64*32,由四个卷积层后跟四个残差块组成;
第二步,使用第一步中的Es编码器对xi进行编码,得到结构编码Cs i;
第三步,使用第一步中的中的Ea编码器对xk进行编码,得到xk的外貌编码Ca k;
第四步,通过第一步~第三步生成对抗网络中生成器G,还需进行两个鉴别器D1和D2的判断;
第五步,重复迭代以上第一步~第四步,得到最优生成器G。
优选地,所述第一步得到外貌编码Ca j和结构编码Cs j后,再利用外貌编码Ca j和结构编码Cs j重构自身图像xj’,对于这个重构过程,使用简单的像素级L1损失:
Lj=E[||xj-G(Ca j,Cs j)||1]
优选地,所述第二步得到结构编码Cs i后,再利用xj的外貌编码Ca j和结构编码Cs i重构图像xi’,也是使用简单的像素级L1损失:
Li=E[||xi-G(Ca j,Cs i)||1]
优选地,所述第三步得到xk的外貌编码Ca k后,再利用第一步中xj的结构编码Cs j和结构编码Ca k重构图像xk’,也是使用简单的像素级L1损失:
Lk=E[||xj-G(Ca k,Cs j)||1]
所述第四步的D1鉴别器用以真假判断,由对抗损失监督,优化外貌编码器Ea、结构编码器Es和生成器,对抗损失函数:
LD1=E[logD1(xj)+log(1-D1(G(Ca j,Cs j))]
D2鉴别器用以类别判断,判断生成图片xn’以及输入图片对应生成图片的类别,D2模型优化时还进行优化生成器,使用分类损失:
LD2=E[logD2(xk)+log(1-D2(G(Ca k,Cs j))]
总优化目标:
Ltotal(Ea,Es,G,D1,D2)=λiLi+λjLj+λkLk+λD1LD1+λD1LD2
λi、λj、λk、λD1、λD1是控制各种loss之间联系的权重。
根据本发明公开实施例的第二方面,提供一种基于生成对抗网络的行人重识别数据集增强系统,应用于所述基于生成对抗网络的行人重识别数据集增强系统包括:
自身图像重构模块,用于网络输入三张行人图片分别为xi、xj、xk,其中xj与xk是同一行人在不同场景或不同时段采集的图片,分别使用外貌编码器Ea和结构编码器Es对xj进行编码,得到外貌编码Ca j和结构编码Cs j,然后利用外貌编码Ca j和结构编码Cs j重构自身图像xj’;
结构编码重构图像模块,用于使用Es编码器对xi进行编码,得到结构编码Cs i,然后利用xj的外貌编码Ca j和结构编码Cs i重构图像xi’;
外貌编码重构图像模块,用于使用Ea编码器对xk进行编码,得到xk的外貌编码Ca k,然后利用第S101步中xj的结构编码Cs j和结构编码Ca k重构图像xk’;
鉴别器判读模块,用于鉴别器D1和D2的判断;
最优生成器生成模块,用于重复迭代自身图像重构模块、结构编码重构图像模块、外貌编码重构图像模块、鉴别器判读模块运行程序,得到最优生成器G;
行人图片获取模块,用于利用训练好的最优生成器G生成行人数据集,输入三张行人图片,交叉生成不同的外貌的行人图片,还交叉生成同一行人ID不同姿态、背景、光照、角度的行人图片。
根据本发明公开实施例的第三方面,提供一种数据信息处理终端,所述数据信息处理终端用于实施所述的基于生成对抗网络的行人重识别数据集增强方法。
根据本发明公开实施例的第四方面,提供一种摄像头,所述摄像头搭载有所述的数据信息处理终端,还包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行所述的基于生成对抗网络的行人重识别数据集增强方法。
根据本发明公开实施例的第五方面,提供一种接收用户输入程序存储介质,所存储的计算机程序使电子设备执行权利要求任意一项所述包括下列步骤:
网络输入三张行人图片分别为xi、xj、xk,其中xj与xk是同一行人在不同场景或不同时段采集的图片,分别使用外貌编码器Ea和结构编码器Es对xj进行编码,得到外貌编码Ca j和结构编码Cs j,然后利用外貌编码Ca j和结构编码Cs j重构自身图像xj’;
使用Es编码器对xi进行编码,得到结构编码Cs i,然后利用xj的外貌编码Ca j和结构编码Cs i重构图像xi’;
使用Ea编码器对xk进行编码,得到xk的外貌编码Ca k,然后利用第S101步中xj的结构编码Cs j和结构编码Ca k重构图像xk’;
鉴别器D1和D2的判断;
重复迭代自身图像重构模块、结构编码重构图像模块、外貌编码重构图像模块、鉴别器判读模块运行程序,得到最优生成器G;
利用训练好的最优生成器G生成行人数据集,输入三张行人图片,交叉生成不同的外貌的行人图片,还交叉生成同一行人ID不同姿态、背景、光照、角度的行人图片。
本发明公开的实施例提供的技术方案可以包括以下有益效果:
本发明基于生成对抗网络生成类内行人不同外表、衣着、装饰、姿态、背景的图像,还可以模拟生成不同摄像头的光照、角度效果。
本发明降低行人重识别数据集采集及标注成本,丰富行人重识别数据集的多样性,助力行人重识别技术发展。
结合实验或试验数据和现有技术对比得到的效果和优点:
可以生成大量行人数据集,保证数据集多样性,满足深度神经网络的训练要求。
实现已有数据的内容交叉互换,如行人外表、衣着、装饰、姿态、背景、光照、角度等方面的缺失。
本发明能生成清晰度高的样本图像。
当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
图1是本发明实施例提供的基于生成对抗网络的行人重识别数据集增强方法流程图。
图2是本发明实施例提供的基于生成对抗网络的行人重识别数据集增强方法原理图。
图3是本发明实施例提供的生成图像效果图。
图4是本发明实施例提供的外貌多样性及场景多样性数据输入与输出对比图。
图5是本发明实施例提供的行人ID结构编码的重构的效果图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
如图1所示,本发明基于生成对抗网络的行人重识别数据集增强方法,包括以下步骤:
S101:网络输入三张行人图片分别为xi、xj、xk,其中xj与xk是同一行人在不同场景或不同时段采集的图片,分别使用外貌编码器Ea和结构编码器Es对xj进行编码,得到外貌编码Ca j和结构编码Cs j,然后利用外貌编码Ca j和结构编码Cs j重构自身图像xj’。
S102:使用S101中的Es编码器对xi进行编码,得到结构编码Cs i,然后利用第S101步中xj的外貌编码Ca j和结构编码Cs i重构图像xi’。
S103:使用S101中的Ea编码器对xk进行编码,得到xk的外貌编码Ca k,然后利用第S101步中xj的结构编码Cs j和结构编码Ca k重构图像xk’。
S104:通过步骤S101-步骤S103生成对抗网络中生成器G,还需进行两个鉴别器D1和D2的判断,D1鉴别器用以真假判断,由对抗损失监督,优化外貌编码器Ea、结构编码器Es和生成器。D2鉴别器用以类别判断,判断生成图片xn’以及输入图片对应生成图片的类别,D2模型优化时又反过来优化了生成器。
S105:重复迭代以上步骤S101-步骤S104,得到最优生成器G。
S106:利用训练好的最优生成器G生成行人数据集,输入三张行人图片,可以交叉生成不同的外貌的行人图片,包括衣着、装饰等;还可以交叉生成同一行人ID不同姿态、背景、光照、角度的行人图片。
其中,图2是本发明实施例提供的基于生成对抗网络的行人重识别数据集增强方法原理。
本发明还提供一种基于生成对抗网络的行人重识别数据集增强系统,应用于所述基于生成对抗网络的行人重识别数据集增强系统包括:
自身图像重构模块,用于网络输入三张行人图片分别为xi、xj、xk,其中xj与xk是同一行人在不同场景或不同时段采集的图片,分别使用外貌编码器Ea和结构编码器Es对xj进行编码,得到外貌编码Ca j和结构编码Cs j,然后利用外貌编码Ca j和结构编码Cs j重构自身图像xj’;
结构编码重构图像模块,用于使用Es编码器对xi进行编码,得到结构编码Cs i,然后利用xj的外貌编码Ca j和结构编码Cs i重构图像xi’;
外貌编码重构图像模块,用于使用Ea编码器对xk进行编码,得到xk的外貌编码Ca k,然后利用第S101步中xj的结构编码Cs j和结构编码Ca k重构图像xk’;
鉴别器判读模块,用于鉴别器D1和D2的判断;
最优生成器生成模块,用于重复迭代自身图像重构模块、结构编码重构图像模块、外貌编码重构图像模块、鉴别器判读模块运行程序,得到最优生成器G;
行人图片获取模块,用于利用训练好的最优生成器G生成行人数据集,输入三张行人图片,交叉生成不同的外貌的行人图片,还交叉生成同一行人ID不同姿态、背景、光照、角度的行人图片。
本发明还提供一种数据信息处理终端,所述数据信息处理终端用于实施所述的基于生成对抗网络的行人重识别数据集增强方法。
本发明还提供一种摄像头,所述摄像头搭载有所述的数据信息处理终端,还包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行所述的基于生成对抗网络的行人重识别数据集增强方法。
下面结合具体仿真实验对本发明的效果作进一步描述。
如图3所示,生成图像效果对比如表1:
表1
如图4、图5所示,行人外貌、场景多样性对比如表2:
表2
本领域技术人员在考虑说明书及实践这里公开的公开后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由所附的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围应由所附的权利要求来限制。
Claims (10)
1.一种基于生成对抗网络的行人重识别数据集增强方法,其特征在于,应用于数据信息处理终端,所述基于生成对抗网络的行人重识别数据集增强方法包括:
利用训练好的最优生成器G生成行人数据集,输入多张行人图片,交叉生成不同的外貌的行人图片;同时还交叉生成同一行人ID不同姿态、背景、光照、角度的行人图片;所述行人图片包括衣着、装饰。
4.如权利要求2所述的基于生成对抗网络的行人重识别数据集增强方法,其特征在于,所述第二步得到结构编码Cs i后,再利用xj的外貌编码Ca j和结构编码Cs i重构图像xi’。
6.如权利要求2所述的基于生成对抗网络的行人重识别数据集增强方法,其特征在于,所述第四步的D1鉴别器用以真假判断,由对抗损失监督,优化外貌编码器Ea、结构编码器Es和生成器;
D2鉴别器用以类别判断,判断生成图片xn’以及输入图片对应生成图片的类别,D2模型优化时还进行优化生成器。
7.一种基于生成对抗网络的行人重识别数据集增强系统,其特征在于,应用于所述基于生成对抗网络的行人重识别数据集增强系统包括:
自身图像重构模块,用于网络输入三张行人图片分别为xi、xj、xk,其中xj与xk是同一行人在不同场景或不同时段采集的图片,分别使用外貌编码器Ea和结构编码器Es对xj进行编码,得到外貌编码和结构编码然后利用外貌编码和结构编码重构自身图像xj’;
鉴别器判读模块,用于鉴别器D1和D2的判断;
最优生成器生成模块,用于重复迭代自身图像重构模块、结构编码重构图像模块、外貌编码重构图像模块、鉴别器判读模块运行程序,得到最优生成器G;
行人图片获取模块,用于利用训练好的最优生成器G生成行人数据集,输入三张行人图片,交叉生成不同的外貌的行人图片,还交叉生成同一行人ID不同姿态、背景、光照、角度的行人图片。
8.一种数据信息处理终端,其特征在于,所述数据信息处理终端用于实施权利要求1~6任意一项所述的基于生成对抗网络的行人重识别数据集增强方法。
9.一种摄像头,其特征在于,所述摄像头搭载有权利要求8所述的数据信息处理终端,还包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行权利要求1~6任意一项所述的基于生成对抗网络的行人重识别数据集增强方法。
10.一种接收用户输入程序存储介质,所存储的计算机程序使电子设备执行权利要求任意一项所述包括下列步骤:
网络输入三张行人图片分别为xi、xj、xk,其中xj与xk是同一行人在不同场景或不同时段采集的图片,分别使用外貌编码器Ea和结构编码器Es对xj进行编码,得到外貌编码和结构编码然后利用外貌编码和结构编码重构自身图像xj’;
鉴别器D1和D2的判断;
重复迭代自身图像重构模块、结构编码重构图像模块、外貌编码重构图像模块、鉴别器判读模块运行程序,得到最优生成器G;
利用训练好的最优生成器G生成行人数据集,输入三张行人图片,交叉生成不同的外貌的行人图片,还交叉生成同一行人ID不同姿态、背景、光照、角度的行人图片。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110065005.2A CN112800898A (zh) | 2021-01-18 | 2021-01-18 | 行人重识别数据集增强方法、系统、终端、摄像头及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110065005.2A CN112800898A (zh) | 2021-01-18 | 2021-01-18 | 行人重识别数据集增强方法、系统、终端、摄像头及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112800898A true CN112800898A (zh) | 2021-05-14 |
Family
ID=75810190
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110065005.2A Pending CN112800898A (zh) | 2021-01-18 | 2021-01-18 | 行人重识别数据集增强方法、系统、终端、摄像头及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112800898A (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108596024A (zh) * | 2018-03-13 | 2018-09-28 | 杭州电子科技大学 | 一种基于人脸结构信息的肖像生成方法 |
WO2019221654A1 (en) * | 2018-05-17 | 2019-11-21 | Tobii Ab | Autoencoding generative adversarial network for augmenting training data usable to train predictive models |
CN110688897A (zh) * | 2019-08-23 | 2020-01-14 | 深圳久凌软件技术有限公司 | 一种基于联合判断与生成学习的行人重识别方法及装置 |
CN111062899A (zh) * | 2019-10-30 | 2020-04-24 | 湖北工业大学 | 基于引导的生成对抗网络的眨眼视频生成方法 |
US20200342271A1 (en) * | 2019-04-29 | 2020-10-29 | Beijing Baidu Netcom Science And Technology Co., Ltd. | Pedestrian re-identification method, computer device and readable medium |
US20210012093A1 (en) * | 2018-06-01 | 2021-01-14 | Huawei Technologies Co., Ltd. | Method and apparatus for generating face rotation image |
-
2021
- 2021-01-18 CN CN202110065005.2A patent/CN112800898A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108596024A (zh) * | 2018-03-13 | 2018-09-28 | 杭州电子科技大学 | 一种基于人脸结构信息的肖像生成方法 |
WO2019221654A1 (en) * | 2018-05-17 | 2019-11-21 | Tobii Ab | Autoencoding generative adversarial network for augmenting training data usable to train predictive models |
US20210012093A1 (en) * | 2018-06-01 | 2021-01-14 | Huawei Technologies Co., Ltd. | Method and apparatus for generating face rotation image |
US20200342271A1 (en) * | 2019-04-29 | 2020-10-29 | Beijing Baidu Netcom Science And Technology Co., Ltd. | Pedestrian re-identification method, computer device and readable medium |
CN110688897A (zh) * | 2019-08-23 | 2020-01-14 | 深圳久凌软件技术有限公司 | 一种基于联合判断与生成学习的行人重识别方法及装置 |
CN111062899A (zh) * | 2019-10-30 | 2020-04-24 | 湖北工业大学 | 基于引导的生成对抗网络的眨眼视频生成方法 |
Non-Patent Citations (1)
Title |
---|
ZHEDONG ZHENG ET AL,: "Joint discriminative and generative learning for person re-identifcation", CVPR, pages 1 - 4 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Wan et al. | High-fidelity pluralistic image completion with transformers | |
CN112766160B (zh) | 基于多级属性编码器和注意力机制的人脸替换方法 | |
US10593021B1 (en) | Motion deblurring using neural network architectures | |
Neverova et al. | Dense pose transfer | |
Messaoud et al. | Structural consistency and controllability for diverse colorization | |
CN111861945B (zh) | 一种文本引导的图像修复方法和系统 | |
CN113901894A (zh) | 一种视频生成方法、装置、服务器及存储介质 | |
CN111833360B (zh) | 一种图像处理方法、装置、设备以及计算机可读存储介质 | |
CN116012255A (zh) | 一种基于循环一致性生成对抗网络的低光图像增强方法 | |
CN116863003A (zh) | 视频生成方法、训练视频生成模型的方法及装置 | |
CN115100223A (zh) | 一种基于深度时空学习的高分辨率视频虚拟人物抠像方法 | |
CN116051407A (zh) | 一种图像修复方法 | |
CN117557689B (zh) | 图像处理方法、装置、电子设备及存储介质 | |
CN113554655B (zh) | 基于多特征增强的光学遥感图像分割方法及装置 | |
CN114648604A (zh) | 一种图像渲染方法、电子设备、存储介质及程序产品 | |
Saint et al. | 3dbooster: 3d body shape and texture recovery | |
Abdelaziz et al. | Few-shot learning with saliency maps as additional visual information | |
CN112800898A (zh) | 行人重识别数据集增强方法、系统、终端、摄像头及介质 | |
CN114331894B (zh) | 一种基于潜在特征重构和掩模感知的人脸图像修复方法 | |
Jiang et al. | Mask‐guided image person removal with data synthesis | |
CN115496843A (zh) | 一种基于gan的局部写实感漫画风格迁移系统及方法 | |
CN109657589B (zh) | 一种基于人体交互动作的体验者动作生成方法 | |
Huang et al. | DF3Net: Dual frequency feature fusion network with hierarchical transformer for image inpainting | |
CN115115537B (zh) | 一种基于掩码训练的图像修复方法 | |
CN117994173B (zh) | 修复网络训练方法、图像处理方法、装置及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |