CN113822236A - 一种基于人体语义部件的上衣颜色替换方法 - Google Patents

一种基于人体语义部件的上衣颜色替换方法 Download PDF

Info

Publication number
CN113822236A
CN113822236A CN202111381735.XA CN202111381735A CN113822236A CN 113822236 A CN113822236 A CN 113822236A CN 202111381735 A CN202111381735 A CN 202111381735A CN 113822236 A CN113822236 A CN 113822236A
Authority
CN
China
Prior art keywords
semantic
pedestrian
model
gan
components
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111381735.XA
Other languages
English (en)
Inventor
龚心满
刘静
管慧艳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Yunqi Smart Vision Technology Co Ltd
Original Assignee
Hangzhou Yunqi Smart Vision Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Yunqi Smart Vision Technology Co Ltd filed Critical Hangzhou Yunqi Smart Vision Technology Co Ltd
Priority to CN202111381735.XA priority Critical patent/CN113822236A/zh
Publication of CN113822236A publication Critical patent/CN113822236A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/90Determination of colour characteristics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10024Color image

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本发明公开了一种基于人体语义部件的上衣颜色替换方法,包括以下步骤:S1、输入图片,首先通过语义分割模型对行人图片进行部件提取;S2、将上述提取的部件分割成多个身体部分和衣物部分;S3、其中,对于衣物部分通过颜色分类器分出多个颜色阈;S4、然后多颜色阈行人数据进行计算GAN生成模型;S5、将上述GAN训练结果进行后处理操作;S6、经过后处理操作后的图片,全部输出为结果。本发明的有益效果为:在不重新设计模型的基础上通过数据方法来增强模型对于上衣颜色的鲁棒性,进而提升模型对于换装行人检索的性能。

Description

一种基于人体语义部件的上衣颜色替换方法
技术领域
本发明涉及行人检索技术,具体来说,涉及一种基于人体语义部件的上衣颜色替换方法。
背景技术
近年来行人检索技术在安防领域已经得到广泛的应用,其主要技术是视频跟踪技术把行人检测和推入进底库,然后在进行行人的检索。但是在行人检索的过程中,由于不同位置、不同区域以及不同时间段的摄像头采集的行人图像会带来诸如,光照、姿态、摄像头角度、目标大小以及换装等问题,其中由于光照、姿态、摄像头角度以及大小目标等问题可以通过阈适应的方法得到一定的缓解,而换装问题给行人检索带来巨大的困难。
针对相关技术中的问题,目前尚未提出有效的解决方案。
发明内容
针对相关技术中的问题,本发明提出一种基于人体语义部件的上衣颜色替换方法,以克服现有相关技术所存在的上述技术问题。
本发明的技术方案是这样实现的:
根据本发明的一个方面,提供了一种基于人体语义部件的上衣颜色替换方法,包括以下步骤:
S1、输入图片,首先通过语义分割模型对行人图片进行部件提取;
S2、将上述提取的部件分割成多个身体部分和衣物部分;
S3、其中,对于衣物部分通过颜色分类器分出多个颜色阈;
S4、然后多颜色阈行人数据进行计算GAN生成模型;
具体包括以下步骤:
S41、首先将输入图片通过1x1卷积实现通道的变换,将3通道的图像变为64通道的特征图以供下面模块(ResBlk1-5内容编码模块与ResBlkx5风格编码模块)的使用;
S42、将步骤S41中的输出特征图输入到content编码器与style编码其中进行编码,分别得到content feature与 style class;
S43、将步骤S42得content feature结果结合style class进行上采样,同时将ResBlk-10得结果通过上采样后作为行人语义分割模型得一个输入,与此同时将输入图片作为行人语义分割模型得另一个输入,在训练期间把解码得风格图片得语义分割结果与输入图片得结果进行计算损失,来约束GAN模型;
S44、将解码后得风格图像与行人语义分割约束得图像通过1x1卷积输出到原有的3个通道图像,得到输出结果;
S5、将上述GAN训练结果进行后处理操作;
S6、经过后处理操作后的图片,全部输出为结果。
可选的,所述步骤S1中,获取特征的方法,使用ResNet18与通道注意力CAM结合的方法来获取行人语义部件的信息,所述步骤S4中所述GAN训练的同时通过人体语义部件进行约束,以得到固定位置的阈迁移。
可选的,所述后处理操作主要后处理包括高斯模糊和边界羽化中的一种或多种。
可选的,所述计算GAN生成模型中,生成的行人语义部件与实际约束语义部件的损失,该部分主要有2个损失函数,一个是用来约束GAN生成模型生成语义部件的损失函数dice loss和与标签语义部件的欧氏距离L2距离。
可选的,所述损失函数dice loss为:
Figure 496735DEST_PATH_IMAGE001
其中,X、Y分别表示GAN模型生成行人是产生的语义部件和语义部件标签。
可选的,所述L2距离为:
Figure 654047DEST_PATH_IMAGE002
其中,X、Y分别表示GAN模型生成行人是产生的语义部件和语义部件标签。
可选的,所述生成的行人语义部件与实际约束语义部件的损失:
Figure 572325DEST_PATH_IMAGE003
其中
Figure 473284DEST_PATH_IMAGE004
Figure 98301DEST_PATH_IMAGE005
分别表示dice loss与L2距离的加权系数。
可选的,在输入特征为A的情况下,所述CAM注意力机制流程如下:
S11、分别对A做reshape(C×N)和reshape与transpose(N×C);
S12、将得到的两个特征图相乘,再通过softmax得到channel attention map X(C×C);
S13、接着把X的转置(C×C)与reshape的A(C×N)做矩阵乘法,再乘以尺度系数β,再reshape为原来形状,最后与A相加得到最后的输出E;
S14、其中β初始化为0,并逐渐的学习得到更大的权重。
本发明的有益效果为:本申请采用一种基于语义部件与GAN来生成不同颜色的上衣颜色的图像来增强模型对于上衣颜色的鲁棒性,进而提升模型对于换装行人检索的性能。该方法是一种数据生成的方法,可以倍数级别扩增数据集,在使用时无需重新设计模型更不会带来额外的参数推模型推理负担。在不重新设计模型的基础上通过数据方法来增强模型对于上衣颜色的鲁棒性,进而提升模型对于换装行人检索的性能。
本发明的其他优点、目标和特征在某种程度上将在随后的说明书中进行阐述,并且在某种程度上,基于对下文的考察研究对本领域技术人员而言将是显而易见的,或者可以从本发明的实践中得到教导。本发明的目标和其他优点可以通过下面的说明书来实现和获得。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本发明实施例的一种基于人体语义部件的上衣颜色替换方法的流程图;
图2是根据本发明实施例的部件参考图;
图3是根据本发明实施例的GAN模型架构图;
图4是GAN换装数据集加入后实验结果参考表。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,根据本发明的实施例,提供了一种基于人体语义部件的上衣颜色替换方法,包括以下步骤:
S1、输入图片,首先通过语义分割模型对行人图片进行部件提取;
S2、将上述提取的部件分割成多个身体部分和衣物部分;
S3、其中,对于衣物部分通过颜色分类器分出多个颜色阈;
S4、然后多颜色阈行人数据进行计算GAN生成模型;
具体包括以下步骤:
S41、首先将输入图片通过1x1卷积实现通道的变换,将3通道的图像变为64通道的特征图以供下面模块(ResBlk1-5内容编码模块与ResBlkx5风格编码模块)的使用;
S42、将步骤S41中的输出特征图输入到content编码器与style编码其中进行编码,分别得到content feature与 style class;
S43、将步骤S42得content feature结果结合style class进行上采样,同时将ResBlk-10得结果通过上采样后作为行人语义分割模型得一个输入,与此同时将输入图片作为行人语义分割模型得另一个输入,在训练期间把解码得风格图片得语义分割结果与输入图片得结果进行计算损失,来约束GAN模型;
S44、将解码后得风格图像与行人语义分割约束得图像通过1x1卷积输出到原有的3个通道图像,得到输出结果;
S5、将上述GAN训练结果进行后处理操作;
S6、经过后处理操作后的图片,全部输出为结果。
其中,所述GAN训练的同时通过人体语义部件进行约束,以得到固定位置的阈迁移。
所述后处理操作主要后处理包括高斯模糊和边界羽化中的一种或多种。
所述计算GAN生成模型中,生成的行人语义部件与实际约束语义部件的损失,该部分主要有2个损失函数,一个是用来约束GAN生成模型生成语义部件的损失函数dice loss和与标签语义部件的欧氏距离L2距离。
所述损失函数dice loss为:
Figure 426514DEST_PATH_IMAGE001
其中,X、Y分别表示GAN模型生成行人是产生的语义部件和语义部件标签。
所述L2距离为:
Figure 832088DEST_PATH_IMAGE002
其中,X、Y分别表示GAN模型生成行人是产生的语义部件和语义部件标签。
所述生成的行人语义部件与实际约束语义部件的损失即总损失:
Figure 536738DEST_PATH_IMAGE003
其中
Figure 281841DEST_PATH_IMAGE004
Figure 780955DEST_PATH_IMAGE005
分别表示dice loss与L2距离的加权系数。
其中CAM注意力机制流程如下(图3,假设输入特征为A):
S11、分别对A做reshape(C×N)和reshape与transpose(N×C);
S12、将得到的两个特征图相乘,再通过softmax得到channel attention map X(C×C);
S13、接着把X的转置(C×C)与reshape的A(C×N)做矩阵乘法,再乘以尺度系数β,再reshape为原来形状,最后与A相加得到最后的输出E;
S14、其中β初始化为0,并逐渐的学习得到更大的权重。
为了方便理解本申请上述方法,提供如下实施例:
如图2-图3所示,以公开数据集Market-1501行人为例,把其划分为7个颜色阈值。根据本发明的实施例,包括以下步骤:
步骤S101、输入7个阈的图片,通过训练好的语义分割模型得到行人的语义部件,获取特征的方法,使用ResNet18与通道注意力CAM结合的方法来获取行人语义部件的信息,部件如图2所示。
步骤S102、计算GAN生成模型生成的行人语义部件与实际约束语义部件的损失,该部分主要有2个损失函数,一个是用来约束GAN生成模型生成语义部件的损失函数diceloss和与标签语义部件的欧氏距离L2距离:
dice loss函数:
Figure 408245DEST_PATH_IMAGE001
(1)
L2距离:
Figure 916587DEST_PATH_IMAGE002
(2)
总损失:
Figure 312933DEST_PATH_IMAGE003
(3)
式(1)和式(2)中的X、Y分别表示GAN模型生成行人是产生的语义部件和语义部件标签。而式(3)中的
Figure 186211DEST_PATH_IMAGE004
Figure 566377DEST_PATH_IMAGE005
分别表示dice loss与L2距离的加权系数,之类分别设为0.35、0.65。
步骤S103、推理时去除语义分支直接进行推理并进行后处理操作,主要后处理包括高斯模糊、边界羽化等操作;
步骤S104、经过后处理操作后的图片,全部输出为结果。
综上所述,借助于本发明的上述技术方案,采用一种基于语义部件与GAN来生成不同颜色的上衣颜色的图像来增强模型对于上衣颜色的鲁棒性,进而提升模型对于换装行人检索的性能。该方法是一种数据生成的方法,可以倍数级别扩增数据集,在使用时无需重新设计模型更不会带来额外的参数推模型推理负担。在不重新设计模型的基础上通过数据方法来增强模型对于上衣颜色的鲁棒性,进而提升模型对于换装行人检索的性能。
最后,如图4所示,通过GAN换装数据集加入后实验结果,从结果可以看出,在换装测试集上,增加GAN数据集后,mAP和CMC均有明显的提升。
最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (8)

1.一种基于人体语义部件的上衣颜色替换方法,其特征在于,包括以下步骤:
S1、输入图片,首先通过语义分割模型对行人图片进行部件提取;
S2、将上述提取的部件分割成多个身体部分和衣物部分;
S3、其中,对于衣物部分通过颜色分类器分出多个颜色阈;
S4、然后多颜色阈行人数据进行计算GAN生成模型;
具体包括以下步骤:
S41、首先将输入图片通过1x1卷积实现通道的变换,将3通道的图像变为64通道的特征图以供下面模块(ResBlk1-5内容编码模块与ResBlkx5风格编码模块)的使用;
S42、将步骤S41中的输出特征图输入到content编码器与style编码其中进行编码,分别得到content feature与 style class;
S43、将步骤S42得content feature结果结合style class进行上采样,同时将ResBlk-10得结果通过上采样后作为行人语义分割模型得一个输入,与此同时将输入图片作为行人语义分割模型得另一个输入,在训练期间把解码得风格图片得语义分割结果与输入图片得结果进行计算损失,来约束GAN模型;
S44、将解码后得风格图像与行人语义分割约束得图像通过1x1卷积输出到原有的3个通道图像,得到输出结果;
S5、将上述GAN训练结果进行后处理操作;
S6、经过后处理操作后的图片,全部输出为结果。
2.根据权利要求1所述的一种基于人体语义部件的上衣颜色替换方法,其特征在于,所述步骤S1中,获取特征的方法,使用ResNet18与通道注意力CAM结合的方法来获取行人语义部件的信息,所述步骤S4中所述GAN训练的同时通过人体语义部件进行约束,以得到固定位置的阈迁移。
3.根据权利要求1所述的一种基于人体语义部件的上衣颜色替换方法,其特征在于,所述后处理操作主要后处理包括高斯模糊和边界羽化中的一种或多种。
4.根据权利要求1所述的一种基于人体语义部件的上衣颜色替换方法,其特征在于,所述计算GAN生成模型中,生成的行人语义部件与实际约束语义部件的损失,该部分主要有2个损失函数,一个是用来约束GAN生成模型生成语义部件的损失函数dice loss和与标签语义部件的欧氏距离L2距离。
5.根据权利要求4所述的一种基于人体语义部件的上衣颜色替换方法,其特征在于,所述损失函数dice loss为:
Figure 904234DEST_PATH_IMAGE001
其中,X、Y分别表示GAN模型生成行人是产生的语义部件和语义部件标签。
6.根据权利要求5所述的一种基于人体语义部件的上衣颜色替换方法,其特征在于,所述L2距离为:
Figure 882554DEST_PATH_IMAGE002
其中,X、Y分别表示GAN模型生成行人是产生的语义部件和语义部件标签。
7.根据权利要求6所述的一种基于人体语义部件的上衣颜色替换方法,其特征在于,所述生成的行人语义部件与实际约束语义部件的损失:
Figure 606315DEST_PATH_IMAGE003
其中
Figure 37297DEST_PATH_IMAGE004
Figure 337828DEST_PATH_IMAGE005
分别表示dice loss与L2距离的加权系数。
8.根据权利要求2所述的一种基于人体语义部件的上衣颜色替换方法,其特征在于,在输入特征为A的情况下,所述CAM注意力机制流程如下:
S11、分别对A做reshape(C×N)和reshape与transpose(N×C);
S12、将得到的两个特征图相乘,再通过softmax得到channel attention map X(C×C);
S13、接着把X的转置(C×C)与reshape的A(C×N)做矩阵乘法,再乘以尺度系数β,再reshape为原来形状,最后与A相加得到最后的输出E;
S14、其中β初始化为0,并逐渐的学习得到更大的权重。
CN202111381735.XA 2021-11-22 2021-11-22 一种基于人体语义部件的上衣颜色替换方法 Pending CN113822236A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111381735.XA CN113822236A (zh) 2021-11-22 2021-11-22 一种基于人体语义部件的上衣颜色替换方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111381735.XA CN113822236A (zh) 2021-11-22 2021-11-22 一种基于人体语义部件的上衣颜色替换方法

Publications (1)

Publication Number Publication Date
CN113822236A true CN113822236A (zh) 2021-12-21

Family

ID=78917900

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111381735.XA Pending CN113822236A (zh) 2021-11-22 2021-11-22 一种基于人体语义部件的上衣颜色替换方法

Country Status (1)

Country Link
CN (1) CN113822236A (zh)

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190279075A1 (en) * 2018-03-09 2019-09-12 Nvidia Corporation Multi-modal image translation using neural networks
CN110310221A (zh) * 2019-06-14 2019-10-08 大连理工大学 一种基于生成对抗网络的多域图像风格迁移方法
CN110852276A (zh) * 2019-11-12 2020-02-28 智慧视通(杭州)科技发展有限公司 一种基于多任务深度学习的行人再识别方法
US20200226724A1 (en) * 2019-01-11 2020-07-16 Adobe Inc. Transferring Image Style to Content of a Digital Image
CN111539255A (zh) * 2020-03-27 2020-08-14 中国矿业大学 基于多模态图像风格转换的跨模态行人重识别方法
CN111652827A (zh) * 2020-04-24 2020-09-11 山东大学 一种基于生成对抗网络的正面人脸合成方法及系统
US20200311986A1 (en) * 2019-03-27 2020-10-01 GM Global Technology Operations LLC Semantic preserved style transfer
CN112001353A (zh) * 2020-09-03 2020-11-27 杭州云栖智慧视通科技有限公司 一种基于多任务联合监督学习的行人再识别方法
KR102240885B1 (ko) * 2019-11-12 2021-04-14 연세대학교 산학협력단 생성적 적대 신경망 학습 기반의 이미지 변환 방법 및 그를 위한 장치
CN112784728A (zh) * 2021-01-18 2021-05-11 山东省人工智能研究院 基于衣物脱敏网络的多粒度换衣行人重识别方法
CN112861805A (zh) * 2021-03-17 2021-05-28 中山大学 一种基于内容特征和风格特征的人脸图像生成方法
CN112950661A (zh) * 2021-03-23 2021-06-11 大连民族大学 一种基于注意力生成对抗网络人脸卡通画生成方法
CN113449676A (zh) * 2021-07-13 2021-09-28 凌坤(南通)智能科技有限公司 一种基于双路互促进解纠缠学习的行人重识别方法

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190279075A1 (en) * 2018-03-09 2019-09-12 Nvidia Corporation Multi-modal image translation using neural networks
US20200226724A1 (en) * 2019-01-11 2020-07-16 Adobe Inc. Transferring Image Style to Content of a Digital Image
US20200311986A1 (en) * 2019-03-27 2020-10-01 GM Global Technology Operations LLC Semantic preserved style transfer
CN110310221A (zh) * 2019-06-14 2019-10-08 大连理工大学 一种基于生成对抗网络的多域图像风格迁移方法
CN110852276A (zh) * 2019-11-12 2020-02-28 智慧视通(杭州)科技发展有限公司 一种基于多任务深度学习的行人再识别方法
KR102240885B1 (ko) * 2019-11-12 2021-04-14 연세대학교 산학협력단 생성적 적대 신경망 학습 기반의 이미지 변환 방법 및 그를 위한 장치
CN111539255A (zh) * 2020-03-27 2020-08-14 中国矿业大学 基于多模态图像风格转换的跨模态行人重识别方法
CN111652827A (zh) * 2020-04-24 2020-09-11 山东大学 一种基于生成对抗网络的正面人脸合成方法及系统
CN112001353A (zh) * 2020-09-03 2020-11-27 杭州云栖智慧视通科技有限公司 一种基于多任务联合监督学习的行人再识别方法
CN112784728A (zh) * 2021-01-18 2021-05-11 山东省人工智能研究院 基于衣物脱敏网络的多粒度换衣行人重识别方法
CN112861805A (zh) * 2021-03-17 2021-05-28 中山大学 一种基于内容特征和风格特征的人脸图像生成方法
CN112950661A (zh) * 2021-03-23 2021-06-11 大连民族大学 一种基于注意力生成对抗网络人脸卡通画生成方法
CN113449676A (zh) * 2021-07-13 2021-09-28 凌坤(南通)智能科技有限公司 一种基于双路互促进解纠缠学习的行人重识别方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
YACINE KHRAIMECHE 等: "Unsupervised Disentanglement GAN for Domain Adaptive Person Re-Identification", 《ARXIV》 *
YU-JHE LI 等: "Learning Shape Representations for Clothing Variation in Person Re-Identification", 《ARXIV》 *
ZHUN ZHONG 等: "CamStyle: A Novel Data Augmentation Method for Person Re-Identification", 《IEEE TRANSACTIONS ON IMAGE PROCESSING》 *
白静 等: "跨域变分对抗自编码器", 《计算机辅助设计与图形学学报》 *
陈杰: "基于生成对抗网路的图像风格迁移算法研究", 《中国优秀硕士学位论文全文数据库信息科技辑》 *

Similar Documents

Publication Publication Date Title
CN109711481B (zh) 用于画作多标签识别的神经网络、相关方法、介质和设备
CN110176027B (zh) 视频目标跟踪方法、装置、设备及存储介质
WO2022111355A1 (zh) 车牌识别方法及装置、存储介质、终端
Gao et al. Reading scene text with fully convolutional sequence modeling
CN112733822B (zh) 一种端到端文本检测和识别方法
Son et al. Urie: Universal image enhancement for visual recognition in the wild
CN112700460B (zh) 图像分割方法及系统
CN113505768A (zh) 模型训练、人脸识别方法、电子设备及存储介质
CN114140786B (zh) 基于HRNet编码与双分支解码的场景文本识别方法
CN114549567A (zh) 基于全方位感知的伪装目标图像分割方法
CN116091916A (zh) 一种多尺度从rgb图像重建对应的高光谱图像算法及系统
CN116071748A (zh) 一种基于频域全局滤波的无监督视频目标分割方法
CN108764233B (zh) 一种基于连续卷积激活的场景字符识别方法
CN112150363B (zh) 一种基于卷积神经网络的图像夜景处理方法及运行该方法的计算模块与可读存储介质
CN112927171A (zh) 一种基于生成对抗网络的单幅图像去模糊方法
CN113822236A (zh) 一种基于人体语义部件的上衣颜色替换方法
CN116895037A (zh) 基于边缘信息和多尺度交叉融合网络的帧插入方法及系统
CN116740399A (zh) 异源图像匹配模型的训练方法、匹配方法及介质
AU2021104479A4 (en) Text recognition method and system based on decoupled attention mechanism
CN115690115A (zh) 一种基于重建预训练的肺部医学图像分割方法
CN116266336A (zh) 视频超分辨率重建方法、装置、计算设备及存储介质
CN115830666A (zh) 一种基于时空特征解耦的视频表情识别方法及应用
Jiang et al. Deep Learning-Based Scene Text Image Super-Resolution Methods: A Survey
CN113221830B (zh) 一种超分活体识别方法、系统、终端及存储介质
CN113160101B (zh) 一种合成高仿真图像的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination