CN110457511B - 基于注意力机制和生成对抗网络的图像分类方法及系统 - Google Patents

基于注意力机制和生成对抗网络的图像分类方法及系统 Download PDF

Info

Publication number
CN110457511B
CN110457511B CN201910758505.7A CN201910758505A CN110457511B CN 110457511 B CN110457511 B CN 110457511B CN 201910758505 A CN201910758505 A CN 201910758505A CN 110457511 B CN110457511 B CN 110457511B
Authority
CN
China
Prior art keywords
network
image
generation
certificate
countermeasure network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910758505.7A
Other languages
English (en)
Other versions
CN110457511A (zh
Inventor
不公告发明人
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Shuzhilian Technology Co Ltd
Original Assignee
Chengdu Shuzhilian Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chengdu Shuzhilian Technology Co Ltd filed Critical Chengdu Shuzhilian Technology Co Ltd
Priority to CN201910758505.7A priority Critical patent/CN110457511B/zh
Publication of CN110457511A publication Critical patent/CN110457511A/zh
Application granted granted Critical
Publication of CN110457511B publication Critical patent/CN110457511B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/55Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了基于注意力机制和生成对抗网络的图像分类方法及系统,包括:从互联网获取商家上传的各种类型的证件照图像并存储;预处理获取的证件照图像;在生成对抗网络中引入注意力机制,构建改进的生成对抗网络;基于预处理后的证件照图像生成训练集,利用训练集训练改进的生成对抗网络;利用训练后的网络对待分类的证件照图像进行分类;本方法及系统利用生成对抗网络解决人为因素引入的图像噪声问题,利用注意力机制降低深度神经网络的冗杂度,提高运算效率,缩短计算时间。

Description

基于注意力机制和生成对抗网络的图像分类方法及系统
技术领域
本发明涉及图像处理领域,具体地,涉及基于注意力机制和生成对抗网络的图像分类方法及系统。
背景技术
随着互联网的发展,网络餐饮市场规模越来越大,相关部门对网络餐饮服务店铺的监管需求愈发迫切。不同于线下监管可采用实地考察、分时分地区抽查等方式,网络餐饮店铺的监管往往仅能基于商家上传的各类经营许可证加以监管。但受手机等便携设备分辨率、拍摄角度、光照以及上传压缩等影响,传统的图像分类技术并不能做到接近100%的准确率。虽然利用深度学习技术对图像进行分类已有广泛研究,但是不同数据集图像之间明暗度、图像分辨率的变化对图像分类结果的影响一直是现有单一深度学习模型难以解决的问题。这些噪声对图像分类的准确率影响极大,甚至同一张图像在改变少数像素点之后会被模型识别为不同类型。生成对抗网络利用噪声生成逼真的图像,并用判别网络辨别其真假,这样使得其对噪声问题不敏感,但是目前没有有效的训练方式能够使其对图像进行分类。有鉴于此,特提出本申请。
发明内容
本发明提供了一种基于注意力机制和生成对抗网络的图像分类方法及系统,本发明的目的在于利用生成对抗网络解决人为因素引入的图像噪声对图像分类结果的影响问题,利用注意力机制降低深度神经网络的冗杂度,提高运算效率,缩短计算时间。
为实现上述发明目的,本发明一方面提供了基于注意力机制和生成对抗网络的图像分类方法,所述方法包括:
从互联网获取商家上传的各种类型的证件照图像并存储;
预处理获取的证件照图像;
在生成对抗网络中引入注意力机制,构建改进的生成对抗网络;
基于预处理后的证件照图像生成训练集,利用训练集训练改进的生成对抗网络;
利用训练后的网络对待分类的证件照图像进行分类。
本发明方法采用生成对抗网络进行训练,使得网络在噪声干扰下依然具有较高的识别能力;并且本发明方法在生成器和编码器网络中引入注意力机制,使网络在分类时更关注重要区域的信息(如证件名字),在保证准确率基本不变的前提下,网络参数比其他常见分类网络少了一个数量级,同时分类速度也极大提高。
本发明采用新颖的设计,在同一个网络中训练分类模块和判别模块却不影响图像生成的质量。此外,注意力机制的引入大大减少网络的冗杂度,能以很浅的模型深度达到其他大型分类网络类似的效果,最终在2 万张图像测试中准确率达到99.39%。
进一步的,证件照图像的预处理包括:
将不同尺寸的证件照图像统一到相同尺寸,既能加快网络的训练速度,又能通过批处理降低极个别图像的噪声影响;
按照预设比例旋转变换每种类型的证件照图像,获得不同角度下的该类型证件照图像;
在图像采样时,根据不同类型证件照图像的数量进行平衡采样,以确保生成的数据集中各类型证件照图像的数量一致,可以平衡网络对各类样本的偏好。
进一步的,所述方法还包括:基于预处理后的证件照图像生成验证集和测试集,利用验证集和测试集分别验证和测试改进的生成对抗网络。
进一步的,本方法的数据获取方式具体包括:利用爬虫技术,从各大网络餐饮网站获取商家的各类证件照图像,包括6 个类别:食品经营许可证、食品流通许可证、食品服务许可证、营业执照、三小证件照、其他证件照,将获取的各类证件照图像分成训练集、验证集、测试集,并存储在云端服务器。
进一步的,本方法在利用训练集训练改进的生成对抗网络之后,以及利用训练后的网络对待分类的证件照图像进行分类之前,还包括步骤:
使用批梯度下降和目标函数更新改进的生成对抗网络的参数;
调整改进的生成对抗网络的超参数,在保持符合预设要求学习率的前提下寻求编码器Encoder 网络和生成器Generator 网络交替次数的平衡,使得在保证生成质量的前提下,让Encoder 网络关注到生成过程中注意力位置,并在分类过程中也加入注意力,提高分类质量。
进一步的,使用批梯度下降和目标函数更新改进的生成对抗网络的编码器E 和生成器G,包括:
Figure 97424DEST_PATH_IMAGE001
其中,ρ是两个向量的Pearson相关系数;E和G分别表示使目标函数最小化的编码器和生成器;z和x分别表示噪声向量和图像输入;T是将向量映射成标量的函数;f、g和h均为计算损失的函数;lossCrossEntropy表示编码器输出的分类向量与真实类别的交叉熵;λ为平衡 Pearson相关系数正则化项的超参数;x~p(x)表示输入编码器E的图像数据服从正态分布;z~p(z)表示输入编码器E的噪声向量服从正态分布;z~q(z)表示输入生成器G的图像数据服从正态分布;
Figure DEST_PATH_IMAGE002
其中,avg和std分别表示特征向量的均值和标准差;z和z^分别表示特征向量和真实类别编码的one-hot向量,cos(.)表示两个向量的余弦相似度;Pearson系数范围在[-1,1]之间,两个向量线性相关度越高,Pearson 系数值越大。由于Pearson 系数与原判别器优化目标函数的变化空间无关,能够同时训练和优化分类网络和判别网络且不较大干扰原函数变化的自由度。
进一步的,改进的生成对抗网络先利用生成网络解码和上采样随机采样的噪声得到一张和需要生成的目标图像大小一致的伪图,再经由判别网络判断其真伪,两者互为对抗学习;在生成对抗网络中引入注意力机制使得生成网络和判别网络均能更关注证件照图像预设重要区域的特征。
进一步的,证件照图像预设重要区域包括:证件照名称、颁发证件照的日期和有效期、证件照二维码和中华人民共和国国徽。
进一步的,在生成对抗网络中引入的注意力机制为:利用Pearson 相关系数计算每个特征图层和其余特征图层的相似度,每个特征图层能够看作分类目标的一部分,Pearson 相关系数的大小与该部分的特征和其余部分特征相关度的大小成正比,引入的注意力机制关注证件照图像预设重要区域的特征。
另一方面,本发明还提供了基于注意力机制和生成对抗网络的图像分类系统,所述系统包括:
数据获取与存储模块,用于从互联网获取商家上传的各种类型的证件照图像并存储;
所述数据获取与存储模块包括:图像获取单元,用于从各大网络餐饮网站获取商家的各类证件照图像,包括6个类别:食品经营许可证、食品流通许可证、食品服务许可证、营业执照、三小证件照、其他证件照,将获取的各类证件照图像分成训练集、验证集、测试集,并存储在云端服务器;
预处理模块,用于预处理获取的证件照图像;
所述预处理模块包括:
尺寸调整单元,用于将不同尺寸的证件照图像统一到相同的尺寸;
角度调整单元,用于按照预设比例旋转变换每种类型的证件照图像,获得不同角度下的该类型证件照图像;
图像采样单元,用于根据不同类型证件照图像的数量进行平衡采样,以确保生成的数据集中各类型证件照图像的数量一致;
对抗网络生成模块,用于在生成对抗网络中引入注意力机制,构建改进的生成对抗网络;
所述对抗网络生成模块包括:
对抗网络更新单元,用于使用批梯度下降和目标函数更新改进的生成对抗网络的编码器E和生成器G:
Figure 342460DEST_PATH_IMAGE001
其中,ρ是两个向量的Pearson相关系数;E和G分别表示使目标函数最小化的编码器和生成器;z和x分别表示噪声向量和图像输入;T是将向量映射成标量的函数;f、g和h均为计算损失的函数;lossCrossEntropy表示编码器输出的分类向量与真实类别的交叉熵;λ为平衡 Pearson相关系数正则化项的超参数;x~p(x)表示输入编码器E的图像数据服从正态分布;z~p(z)表示输入编码器E的噪声向量服从正态分布;z~q(z)表示输入生成器G的图像数据服从正态分布;
Figure 656286DEST_PATH_IMAGE002
其中,avg和std分别表示特征向量的均值和标准差;z和z^分别表示特征向量和真实类别编码的one-hot向量,cos(.)表示两个向量的余弦相似度;Pearson系数范围在[-1,1]之间,两个向量线性相关度越高,Pearson 系数值越大。由于Pearson 系数与原判别器优化目标函数的变化空间无关,能够同时训练和优化分类网络和判别网络且不较大干扰原函数变化的自由度;
参数调整模块,用于调整改进的生成对抗网络的超参数,在保持符合预设要求学习率的前提下寻求编码器Encoder网络和生成器Generator网络交替次数的平衡;
训练模块,用于基于预处理后的证件照图像生成训练集,利用训练集训练改进的生成对抗网络;
图像分类模块,用于利用训练后的改进的生成对抗网络对待分类的证件照图像进行分类。
本发明提供的一个或多个技术方案,至少具有如下技术效果或优点:
本发明采用生成对抗网络进行训练,使得网络在噪声干扰下依然具有较高的识别能力;
本发明在生成器网络和编码器网络中引入注意力机制,使网络在分类时更关注预设重要区域的信息,在保证准确率基本不变的前提下,网络参数比其他常见分类网络少一个数量级,同时分类速度也极大提高;
本发明能够在同一个网络中训练分类模块和判别模块且不影响生成图像的质量,注意力机制的引入大大减少网络的冗杂度,能以很浅的模型深度达到其他大型分类网络的效果,最终在2万张图像测试中准确率达到99.39%。
附图说明
此处所说明的附图用来提供对本发明实施例的进一步理解,构成本发明的一部分,并不构成对本发明实施例的限定;
图1是本发明中GAAC(Generative Adversarial Attention Classifier)网络结构的结构示意图;
图2是本发明中Attention Block结构的结构示意图;
图3是本发明中基于注意力机制和生成对抗网络的图像分类方法的流程示意图;
图4是本发明中基于注意力机制和生成对抗网络的图像分类系统的组成示意图。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是,在相互不冲突的情况下,本发明的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述范围内的其他方式来实施,因此,本发明的保护范围并不受下面公开的具体实施例的限制。
请参考图3,本发明提供了基于注意力机制和生成对抗网络的图像分类方法,所述方法包括:
步骤1:从互联网获取商家上传的各种类型的证件照图像并存储;
步骤2:预处理步骤1获取的证件照图像;
步骤3:在生成对抗网络中引入注意力机制,构建改进的生成对抗网络;
步骤4:基于预处理后的证件照图像生成训练集,利用训练集训练改进的生成对抗网络;
步骤5:基于训练后的网络对待分类的证件照图像进行分类。
其中,本方法中的步骤3可以在步骤1和步骤2之前,在具体实际的应用中可灵活调整。
本发明的目的可以通过GAAC(Generative Adversarial Attention Classifier)的神经网络实现。
其中,在具体实施过程中,本发明的图像分类方法具体包括:
步骤1:数据采集和存储,利用爬虫技术,从各大网络餐饮网站获取商家上传的各种证件照图像(食品经营许可证、食品流通许可证、食品服务许可证、营业执照、三小证件照、其他证件照),共6个大类,分成训练集、验证集、测试集,并存储在云端服务器。
步骤2:图像预处理:1) 为了能够使用批处理训练图像,将不同大小不同分辨率的图像统一Resize 到相同大小(256*256)。这样既能加快网络的训练速度,又能通过批处理降低极个别图像的噪声影响。2) 按照预设比例旋转变换每种类型证件照图像,让模型能适应从不同角度拍摄的证件照图像。3) 平衡采样,绝大部分网络餐饮商家都会上传营业执照,而三小证件照和其他类别相对较少,这使得模型学习的参数偏向营业执照的特征。为了解决样本类别不平衡问题,根据各类别样本数量进行平衡采样,平衡网络模型对各类样本的偏好。
步骤 3:网络模型结构基于DCGAN 和OGAN 改进和设计,使得对抗生成判别器网络既能判断生成器生成图像的真伪又能充当编码器对图像进行分类(如图1 所示)。
GAAC 网络先利用生成网络(Generator Network)解码和上采样随机采样的噪声得到一张和需要生成的目标图像大小一致的伪图,再经由判别网络(DiscriminatorNetwork)判断其真伪,两者互为对抗学习。整个网络在生成器生成图像越来越逼真,判别器判别真伪能力越来越强时趋于收敛。该网络创新之处在于在传统生成对抗网络中引入注意力机制(图1 中的Attention Block)使得生成网络和判别网络都能更关注证件照图像最重要区域的特征,从而提高生成质量和分类准确率。该网络中使用的注意力机制由图2 所示。另一创新是在不影响生成图像质量的前提下让判别器网络可以输出特征向量进行图像分类。
Pearson 相关系数用于计算每个特征图层和其余特征图层的相似度,因为每个特征图层以看作分类目标的一部分,Pearson 相关系数越大说明该部分的特征与其余部分特征越相似,即特征共性越高,如国徽、证照名称、证照抬头等,多关注这些特征能够大大提高网络的分类效率和准确率。
步骤 4:使用批梯度下降和目标函数(公式1)来更新改进的生成对抗网络的编码器E和生成器G:
Figure 51495DEST_PATH_IMAGE001
其中,ρ是两个向量的Pearson相关系数;E和G分别表示使目标函数最小化的编码器和生成器;z和x分别表示噪声向量和图像输入;T是将向量映射成标量的函数;f、g和h均为计算损失的函数;lossCrossEntropy表示编码器输出的分类向量与真实类别的交叉熵;λ为平衡 Pearson相关系数正则化项的超参数;x~p(x)表示输入编码器E的图像数据服从正态分布;z~p(z)表示输入编码器E的噪声向量服从正态分布;z~q(z)表示输入生成器G的图像数据服从正态分布;
Figure 131446DEST_PATH_IMAGE002
其中,avg和std分别表示特征向量的均值和标准差;z和z^分别表示特征向量和真实类别编码的one-hot向量,cos(.)表示两个向量的余弦相似度;Pearson系数范围在[-1,1]之间,两个向量线性相关度越高,Pearson 系数值越大。由于Pearson 系数与原判别器优化目标函数的变化空间无关,能够同时训练和优化分类网络和判别网络且不较大干扰原函数变化的自由度。
步骤5:调整超参数,在保持较大学习率的前提下寻求Encoder 网络和Generator网络交替次数的平衡。使得生成质量不错的前提下,让Encoder 关注到生成过程中注意力位置,并在分类过程中也加入注意力提高分类质量。
步骤6:利用预处理后的图像数据训练构建的网络;
步骤7:利用训练后的网络对待分类的证件照图像进行分类。
请参考图4,本发明实施例还提供了基于注意力机制和生成对抗网络的图像分类系统,所述系统包括:
数据获取与存储单元,用于从互联网获取商家上传的各种类型的证件照图像并存储;
预处理单元,用于预处理获取的证件照图像;改进的生成对抗网络构建单元,用于在生成对抗网络中引入注意力机制,构建改进的生成对抗网络;
训练单元,用于基于预处理后的证件照图像生成训练集,利用训练集训练改进的生成对抗网络;
图像分类单元,用于利用训练后的网络对待分类的证件照图像进行分类。
其中,本发明中的原始数据来源于美团外卖、饿了么、大众点评等网络餐饮平台商家提供合法经营的各类证照。其中食品流通许可证550 张,营业执照24473 张,其他类别证件2043张,三小证件照 2277 照,餐饮服务许可证1346 张,食品经营许可证13539 张用于训练集。
测试集包含以上6 个类别的证照共18101 张。
证件照图像通常包含几个重要信息,如证件照名称,颁发证件照的日期和有效期,证件照二维码以及中华人民共和国国徽。引入注意力机制和对抗训练明显提高了生成网络生成的假证图中上述几个区域的重构质量,使得编码器即判别网络在对真假两张图像进行分类时也会‘刻意’关注这些重要区域,大大提高网络效率,在几乎同等准确率的前提下比传统网络拥有更浅的模型深度和更少的参数。分类速度也极大提高,达到了60fps(一秒钟分类60 张图)以上。在18101 张测试图像上,本发明的模型准确率达到99.39%。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (5)

1.基于注意力机制和生成对抗网络的图像分类方法,其特征在于,所述方法包括:
S1:从互联网获取商家上传的各种类型的证件照图像并存储,包括以下步骤:
利用爬虫技术,从各大网络餐饮网站获取商家的各类证件照图像,包括6个类别:食品经营许可证、食品流通许可证、食品服务许可证、营业执照、三小证件照、其他证件照,将获取的各类证件照图像分成训练集、验证集、测试集,并存储在云端服务器;
S2:预处理获取的证件照图像,包括以下步骤:
将不同尺寸的证件照图像统一到相同的尺寸;
按照预设比例旋转变换每种类型的证件照图像,获得不同角度下的该类型证件照图像;
在图像采样时,根据不同类型证件照图像的数量进行平衡采样,以确保生成的数据集中各类型证件照图像的数量一致;
S3:在生成对抗网络中引入注意力机制,构建改进的生成对抗网络;
S4:使用批梯度下降和目标函数更新改进的生成对抗网络的参数,包括:
使用批梯度下降和目标函数更新改进的生成对抗网络的编码器E和生成器G:
Figure 564312DEST_PATH_IMAGE001
其中,ρ是两个向量的Pearson相关系数;E和G分别表示使目标函数最小化的编码器和生成器;z和x分别表示噪声向量和图像输入;T是将向量映射成标量的函数;f、g和h均为计算损失的函数;lossCrossEntropy表示编码器输出的分类向量与真实类别的交叉熵;λ为平衡Pearson相关系数正则化项的超参数;
Figure 809349DEST_PATH_IMAGE002
其中,avg和std分别表示特征向量的均值和标准差;z和z^分别表示特征向量和真实类别编码的one-hot向量,cos(.)表示两个向量的余弦相似度;
S5:调整改进的生成对抗网络的超参数,在保持符合预设要求学习率的前提下寻求编码器Encoder网络和生成器Generator网络交替次数的平衡;
S6:基于预处理后的证件照图像生成训练集、验证集和测试集,利用训练集训练改进的生成对抗网络,利用验证集和测试集分别验证和测试改进的生成对抗网络;
S7;利用训练后的网络对待分类的证件照图像进行分类。
2.根据权利要求1所述的基于注意力机制和生成对抗网络的图像分类方法,其特征在于,所述方法还包括:基于预处理后的证件照图像生成验证集和测试集,利用验证集和测试集分 别验证和测试改进的生成对抗网络。
3.根据权利要求1 所述的基于注意力机制和生成对抗网络的图像分类方法,其特征在于,改进的生成对抗网络先利用生成网络解码和上采样随机采样的噪声得到一张和需要生成的目标图像大小一致的伪图,再经由判别网络即编码器判断其真伪,两者互为对抗学习;在生成对抗网络中引入注意力机制使得生成网络和判别网络均能更关注证件照图像预设重要区域的特征。
4.根据权利要求3所述的基于注意力机制和生成对抗网络的图像分类方法,其特征在于, 证件照图像预设重要区域包括:证件照名称、颁发证件照的日期和有效期、证件照二维码和中华人民共和国国徽。
5.根据权利要求3所述的基于注意力机制和生成对抗网络的图像分类方法,其特征在于, 在生成对抗网络中引入注意力机制为:利用Pearson相关系数用于计算每个特征图层和其余特征图层的相似度,将每个特征图层看作分类目标的一部分,Pearson相关系数的大小与该部分的特征和其余部分特征的相关度大小成正比,引入的注意力机制关注证件照图像预设重要区域的特征。
CN201910758505.7A 2019-08-16 2019-08-16 基于注意力机制和生成对抗网络的图像分类方法及系统 Active CN110457511B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910758505.7A CN110457511B (zh) 2019-08-16 2019-08-16 基于注意力机制和生成对抗网络的图像分类方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910758505.7A CN110457511B (zh) 2019-08-16 2019-08-16 基于注意力机制和生成对抗网络的图像分类方法及系统

Publications (2)

Publication Number Publication Date
CN110457511A CN110457511A (zh) 2019-11-15
CN110457511B true CN110457511B (zh) 2022-12-06

Family

ID=68487198

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910758505.7A Active CN110457511B (zh) 2019-08-16 2019-08-16 基于注意力机制和生成对抗网络的图像分类方法及系统

Country Status (1)

Country Link
CN (1) CN110457511B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111091059A (zh) * 2019-11-19 2020-05-01 佛山市南海区广工大数控装备协同创新研究院 一种生活垃圾塑料瓶分类中的数据均衡方法
CN111079805A (zh) * 2019-12-03 2020-04-28 浙江工业大学 一种结合注意力机制及信息熵最小化的异常图像检测方法
CN113538604B (zh) * 2020-04-21 2024-03-19 中移(成都)信息通信科技有限公司 图像生成方法、装置、设备及介质
CN111950649B (zh) * 2020-08-20 2022-04-26 桂林电子科技大学 基于注意力机制与胶囊网络的低照度图像分类方法
CN113537247B (zh) * 2021-08-13 2023-05-16 重庆大学 一种针对换流变压器振动信号的数据增强方法
CN113963352B (zh) * 2021-09-22 2022-08-02 支付宝(杭州)信息技术有限公司 识别图片和训练神经网络的方法和装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109816593A (zh) * 2019-01-18 2019-05-28 大连海事大学 一种基于注意力机制的生成对抗网络的超分辨率图像重建方法
WO2019104221A1 (en) * 2017-11-22 2019-05-31 The Trustees Of Columbia University In The City Of New York System method and computer-accessible medium for determining breast cancer response using a convolutional neural network
CN110097060A (zh) * 2019-03-28 2019-08-06 浙江工业大学 一种面向树干图像的开集识别方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107909059A (zh) * 2017-11-30 2018-04-13 中南大学 一种面向复杂城市场景中协同仿生视觉的交通标志牌检测与识别方法
US10803347B2 (en) * 2017-12-01 2020-10-13 The University Of Chicago Image transformation with a hybrid autoencoder and generative adversarial network machine learning architecture
US10937540B2 (en) * 2017-12-21 2021-03-02 International Business Machines Coporation Medical image classification based on a generative adversarial network trained discriminator
CN109934282B (zh) * 2019-03-08 2022-05-31 哈尔滨工程大学 一种基于sagan样本扩充和辅助信息的sar目标分类方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019104221A1 (en) * 2017-11-22 2019-05-31 The Trustees Of Columbia University In The City Of New York System method and computer-accessible medium for determining breast cancer response using a convolutional neural network
CN109816593A (zh) * 2019-01-18 2019-05-28 大连海事大学 一种基于注意力机制的生成对抗网络的超分辨率图像重建方法
CN110097060A (zh) * 2019-03-28 2019-08-06 浙江工业大学 一种面向树干图像的开集识别方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Max-Margin Generative Adversarial Networks;Gao Wanshun等;《PROCEEDINGS OF 2018 TENTH INTERNATIONAL CONFERENCE ON ADVANCED COMPUTATIONAL INTELLIGENCE (ICACI)》;20181231;第607-612页 *
基于CNN的改进行人重识别技术;熊炜等;《计算机工程与科学》;20190415(第04期);第665-672页 *
基于生成对抗学习的图像去模糊算法研究;彭竞;《中国优秀硕士学位论文全文数据库(电子期刊)》;20190815;第I138-1140页 *

Also Published As

Publication number Publication date
CN110457511A (zh) 2019-11-15

Similar Documents

Publication Publication Date Title
CN110457511B (zh) 基于注意力机制和生成对抗网络的图像分类方法及系统
CN105574550A (zh) 一种车辆识别方法及装置
CN105654066A (zh) 一种车辆识别方法及装置
CN110046644A (zh) 一种证件防伪的方法及装置、计算设备和存储介质
CN110428399A (zh) 用于检测图像的方法、装置、设备和存储介质
CN110532855A (zh) 基于深度学习的自然场景证件图像文字识别方法
CN112651333B (zh) 静默活体检测方法、装置、终端设备和存储介质
CN102385592A (zh) 图像概念的检测方法和装置
CN108268865A (zh) 一种基于级联卷积网络的自然场景下车牌识别方法及系统
CN109949200A (zh) 基于滤波器子集选择和cnn的隐写分析框架构建方法
CN110427943A (zh) 一种基于r-cnn的智能电表数值识别方法
CN116152870A (zh) 人脸识别方法、装置、电子设备及计算机可读存储介质
CN116704585A (zh) 一种基于质量感知的人脸识别方法
CN114821229A (zh) 基于条件生成对抗网络的水下声学数据集增广方法及系统
Cheng et al. Generating high-resolution climate prediction through generative adversarial network
CN108038467B (zh) 一种镜像图与粗细层次结合的稀疏人脸识别方法
US20210158035A1 (en) System, method and computer program product for automatic remote verification of identity documents
CN116935130A (zh) 基于ResNet和OCR的图片联合分类方法、装置、电子设备及介质
CN116563957A (zh) 一种基于傅里叶域适应的人脸伪造视频检测方法
Abraham Digital image forgery detection approaches: A review and analysis
US10902584B2 (en) Detection of surface irregularities in coins
CN111429156A (zh) 一种手机使用的人工智能识别系统及其应用
CN109800719A (zh) 基于分部件和压缩字典稀疏表示的低分辨率人脸识别方法
KR102600092B1 (ko) 합성 데이터의 생성 품질 향상을 위한 도메인 적응을 통한 실제 데이터와 합성 데이터의 분류 시스템 및 그 방법
CN115861824B (zh) 基于改进Transformer的遥感图像识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: 610000 No. 270, floor 2, No. 8, Jinxiu street, Wuhou District, Chengdu, Sichuan

Applicant after: Chengdu shuzhilian Technology Co.,Ltd.

Address before: 610000 No.2, 4th floor, building 1, Jule Road intersection, West 1st section of 1st ring road, Wuhou District, Chengdu City, Sichuan Province

Applicant before: CHENGDU SHUZHILIAN TECHNOLOGY Co.,Ltd.

GR01 Patent grant
GR01 Patent grant