CN113240585A - 基于生成对抗网络的图像处理方法、装置及存储介质 - Google Patents
基于生成对抗网络的图像处理方法、装置及存储介质 Download PDFInfo
- Publication number
- CN113240585A CN113240585A CN202110608709.XA CN202110608709A CN113240585A CN 113240585 A CN113240585 A CN 113240585A CN 202110608709 A CN202110608709 A CN 202110608709A CN 113240585 A CN113240585 A CN 113240585A
- Authority
- CN
- China
- Prior art keywords
- layer
- data
- image processing
- self
- fuzzy
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 22
- 238000012545 processing Methods 0.000 claims abstract description 102
- 238000012549 training Methods 0.000 claims abstract description 84
- 230000006870 function Effects 0.000 claims description 70
- 239000013598 vector Substances 0.000 claims description 39
- 238000004422 calculation algorithm Methods 0.000 claims description 38
- 238000000034 method Methods 0.000 claims description 28
- 239000011159 matrix material Substances 0.000 claims description 23
- 230000008569 process Effects 0.000 claims description 17
- 238000010606 normalization Methods 0.000 claims description 16
- 238000005070 sampling Methods 0.000 claims description 11
- 238000004364 calculation method Methods 0.000 claims description 10
- 239000000126 substance Substances 0.000 claims description 6
- 238000011176 pooling Methods 0.000 claims description 5
- 238000004590 computer program Methods 0.000 claims description 4
- 238000013473 artificial intelligence Methods 0.000 abstract description 3
- 238000010586 diagram Methods 0.000 description 4
- 238000000605 extraction Methods 0.000 description 4
- 230000006872 improvement Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 239000000047 product Substances 0.000 description 3
- 238000009825 accumulation Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 239000013589 supplement Substances 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000003042 antagnostic effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4053—Scaling of whole images or parts thereof, e.g. expanding or contracting based on super-resolution, i.e. the output image resolution being higher than the sensor resolution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及人工智能,揭露一种基于生成对抗网络的图像处理方法,所述方法包括:获取样本数据,并基于所述样本数据获取模糊数据;基于所述模糊数据获取与所述模糊数据对应的高分辨率图,并基于所述高分辨率图、所述模糊数据和所述样本数据确定训练数据;基于所述训练数据训练构建的生成对抗网络模型,直至所述生成对抗网络模型的损失函数小于预设阈值,形成图像处理模型;基于所述图像处理模型对待处理图像进行分辨率处理。本发明可以提高图像处理的效率和精度。
Description
技术领域
本发明涉及人工智能机技术领域,尤其涉及一种基于生成对抗网络的图像处理的方法、装置、电子设备及计算机可读存储介质。
背景技术
随着人工智能技术的发展,越来越多的AI技术在各个领域中得到了实际的应用。在计算机视觉领域之中,诞生了一些新的网络模型,比如生成对抗网络(GAN),生成对抗网络在目前被广泛的应用于各种视觉任务之中,如图像的修复复原、低分辨率转高分辨率、图像的风格迁移等等。
但是现有的生成对抗网络,存在的主要问题是模型参数量过大,训练过程较慢,训练数据过少时不容易训练,训练数据过多且数据分布较集中时,容易对于训练数据过拟合,缺乏一定的人工引导;过于重视全局特征而对于局部差异较大的输入数据对无法很好的训练和推理。
此外,现有的方案往往通过人工添加mask区域来预处理数据对,让模型往mask区域去着重学习,但是这样做会带来额外的人工标记成本,并且无法解决数据分布过于集中的问题,影响生成对抗网络的处理效果及用户预期。
发明内容
本发明提供一种基于生成对抗网络的图像处理方法、装置、电子设备及计算机可读存储介质,其主要目的在于更好地自适应式的利用到局部特征,在超分辨率任务之中,生成的分辨率更高。
为实现上述目的,本发明提供的一种基于生成对抗网络的图像处理方法,所述方法包括:
获取样本数据,并基于所述样本数据获取模糊数据;
基于所述模糊数据获取与所述模糊数据对应的高分辨率图,并基于所述高分辨率图、所述模糊数据和所述样本数据确定训练数据;
基于所述训练数据训练构建的生成对抗网络模型,直至所述生成对抗网络模型的损失函数小于预设阈值,形成图像处理模型;
基于所述图像处理模型对待处理图像进行分辨率处理。
可选地,所述基于所述样本数据获取模糊数据,包括:
基于预设图像数据集确定所述样本数据;
对所述样本数据进行模糊算法处理,获取与所述样本数据对应的模糊数据;其中,所述模糊算法包括均值模糊算法和高斯模糊算法。
可选地,所述生成对抗网络模型包括编码器模块和解码器模块;
所述编码器模块包括输入层、降采样层、自注意力层和全连接层,所述解码器模块包括反卷积层、自注意力层和输出层;其中,
所述降采样层包括卷积层和池化层,所述自注意力层设置在相邻两降采样层之间;并且,
所述卷积层的输出和所述反卷积层的输入连接。
可选地,所述编码器模块包括输入层、卷积层1、卷积层2、自注意力层 1、卷积层3、自注意力层2、卷积层4、自注意力层3、卷积层5、自注意力层4、卷积层6和全连接层;
所述解码器模块包括与所述全连接层依次连接的反卷积层1、反卷积层2、自注意力层5、反卷积层3、自注意力层6、反卷积层4、自注意力层7、反卷积层5、自注意力层8、反卷积层6、反卷积层7和输出层;并且,
所述卷积层1和所述反卷积层6连接,所述卷积层2和所述反卷积层5 连接,所述卷积层3和所述反卷积层4连接,所述卷积层4和所述反卷积层3 连接,所述卷积层5和所述反卷积层2连接。
可选地,所述自注意力层对所述训练数据中的图像数据的处理过程包括:
所述自注意力层获取相邻的上一卷积层输出的图像数据的特征向量,并基于所述特征向量获取与所述特征向量对应的query、key和value;
对所述query和key进行相似度计算,并根据所述相似度计算结果获取与所述特征向量对应的权重;
基于softmax函数对所有权重进行归一化处理,并将归一化处理后的权重与value进行对位的矩阵乘法,获取所述自注意力层的输出特征,并将所述输出特征输入与所述自注意力层相邻的下一卷积层中。
可选地,所述损失函数包括平均绝对误差、均方误差和交叉熵函数;
所述平均绝对误差的表达公式为:
所述均方误差的表达公式为:
其中,n表示输入图像数据的个数,yi表示第i个图像数据的真实值,yi p表示第i个图像数据的预测值;
所述交叉熵函数的表达公式为:
可选地,所述训练构建的生成对抗网络模型,直至所述生成对抗网络模型的损失函数小于预设阈值,形成图像处理模型,包括:
在基于所述训练数据训练所述生成对抗网络模型的每次迭代过程中,随机选取部分输出层的输出图像进行保存;
对保存的输出图像进行分辨率判断,并获取判断结果;
基于所述损失函数和所述判断结果,确定所述成对抗网络模型的训练结束,并形成所述图像处理模型。
为了解决上述问题,本发明还提供一种基于生成对抗网络的图像处理装置,所述装置包括:
模糊数据获取单元,用于获取样本数据,并基于所述样本数据获取模糊数据;
训练数据确定单元,用于基于所述模糊数据获取与所述模糊数据对应的高分辨率图,并基于所述高分辨率图、所述模糊数据和所述样本数据确定训练数据;
图像处理模型形成单元,用于基于所述训练数据训练构建的生成对抗网络模型,直至所述生成对抗网络模型的损失函数小于预设阈值,形成图像处理模型;
图像处理单元,用于基于所述图像处理模型对待处理图像进行分辨率处理。
为了解决上述问题,本发明还提供一种电子设备,所述电子设备包括:
存储器,存储至少一个指令;及
处理器,执行所述存储器中存储的指令以实现上述所述的基于生成对抗网络的图像处理方法。
为了解决上述问题,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一个指令,所述至少一个指令被电子设备中的处理器执行以实现上述所述的基于生成对抗网络的图像处理方法。
本发明实施例通过获取样本数据,并基于样本数据逐步获取模糊数据和训练数据;然后,基于训练数据训练构建的生成对抗网络模型,直至生成对抗网络模型的损失函数小于预设阈值,形成图像处理模型;最后,基于图像处理模型对待处理图像进行分辨率处理,能够增加训练过程之中不同类别训练样本之间的差异性,提升生成对抗网络模型的泛化能力,避免因为数据分布不均衡等问题,导致的生成对抗网络模型出现过拟合的问题。
附图说明
图1为本发明一实施例提供的基于生成对抗网络的图像处理方法的流程示意图;
图2为本发明一实施例提供的生成对抗网络模型的示例结构;
图3为本发明一实施例提供的基于生成对抗网络的图像处理装置的模块示意图;
图4为本发明一实施例提供的实现基于生成对抗网络的图像处理方法的电子设备的内部结构示意图;
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明提供一种基于生成对抗网络的图像处理方法。参照图1所示,为本发明一实施例提供的基于生成对抗网络的图像处理方法的流程示意图。该方法可以由一个装置执行,该装置可以由软件和/或硬件实现。
在本实施例中,基于生成对抗网络的图像处理方法包括:
S110:获取样本数据,并基于样本数据获取模糊数据;
S120:基于所述模糊数据获取与所述模糊数据对应的高分辨率图,并基于所述高分辨率图、所述模糊数据和所述样本数据确定训练数据;
S130:基于训练数据训练构建的生成对抗网络模型,直至生成对抗网络模型的损失函数小于预设阈值,形成图像处理模型;
S140:基于图像处理模型对待处理图像进行分辨率处理。
具体地,以下将对上述各步骤进行详细描述。
在上述步骤S110中,基于训练数据获取模糊数据,可以包括:
首先,基于预设图像数据集确定训练数据;
然后,对样本数据进行模糊算法处理,获取与样本数据对应的模糊数据;其中,模糊算法包括均值模糊算法和高斯模糊算法。
具体地,样本数据可通过现有的公开的数据集进行获取,然后通过模糊处理算法对确定后的样本数据进行降采样,将其随机模糊处理形成与所述样本数据对应的模糊数据。
其中,模糊处理算法也可称为模糊算法,其主要是当对系统的模型认识不是很深刻,或者可观的原因导致的无法对系统的控制模型进行深入研究时,需要通过模糊算法进行模糊处理,作为具体示例,可采用均值模糊或高斯模糊等多种算法对样本数据进行处理,通过模糊算法计算样本数据的一个像素周边的某个领域内,相关像素的某个特征值的累加和及对应的权重,然后得到结果值,由于该算法无法区分图像的边缘等信息,导致被模糊后的图像细节严重丢失,一种简单的改进方式就是设置某个阈值,当领域像素和中心点像素的差距大于阈值时,设置其权重很小,甚至为0,这样对于本身比较平滑的区域,和原始的算法区别不大,而对于像素值变化较为明显的边缘地带,则能够有效地保留原始信息,这样就能起到降低噪音的同时保留边缘的信息。
在上述步骤S120中,基于模糊数据获取与所述模糊数据对应的高分辨率图,并基于所述高分辨率图、所述模糊数据和所述样本数据确定训练数据。其中,在获取高分辨率图的过程中,可将模糊数输入传统的U-net网络结构或其它网络结果中中,通过U-net网络输出与模糊数据对应的高分辨率的图。可知,训练数据包括模糊数据、与模糊数据对应的高分辨率图,以及样本数据 (真正高分辨率的图)。
在上述步骤S130中,所构建的生成对抗网络模型可包括编码器模块和解码器模块;其中,编码器模块进一步包括输入层、降采样层、自注意力层和全连接层,解码器模块包括反卷积层、自注意力层和输出层;降采样层包括卷积层和池化层,自注意力层设置在相邻两降采样层之间,自注意力层可收集图像数据在处理过程中的全局特征;并且,卷积层的输出和反卷积层的输入连接,通过concat合并操作完成对信息的补充,最终通过输出层,输出一个和输入图像尺寸相同的高清化图像。
图2示出了根据本发明实施例的生成对抗网络模型的示例结构。
如图2所示,在本发明的一个具体实施方式中,生成对抗网络模型包括解码器模块和编码器;其中,解码器模块包括输入层、卷积层1、卷积层2、自注意力层1、卷积层3、自注意力层2、卷积层4、自注意力层3、卷积层5、自注意力层4、卷积层6和全连接层;解码器模块包括与全连接层依次连接的反卷积层1、反卷积层2、自注意力层5、反卷积层3、自注意力层6、反卷积层4、自注意力层7、反卷积层5、自注意力层8、反卷积层6、反卷积层7和输出层。
进一步地,卷积层1和反卷积层6连接,卷积层2和反卷积层5连接,卷积层3和反卷积层4连接,卷积层4和反卷积层3连接,卷积层5和反卷积层2连接,此处的卷积层和反卷积层的连接,可以理解为卷积层的输出发送至对应的反卷积层的输入,即编码器模块在各层的输出与解码器模块中的对应的反卷积层连接,完成信息的补充,并最终通过输出层获取处理的图像数据。
此外,需要说明的是,在编码器模块的最后一个全连接层能够将输入的图像数据梳理为具有一定大小的图像特征,同时对输入的图像数据进行一个特征的提取(例如,人脸的特征),然后将提取后的特征直接和全连接层处理后的图像特征进行结合,并一同输入解码器模块中。其中,输入的图像数据即为上述处理后的训练数据。
在本发明的一个具体实施例中,当输入的训练数据为256(高)*256(宽) *3(通道)大小的图片数据时,可通过生成对抗网络模型对该模数数据(图像数据)进行5次降采样,每个降采样层包括卷积层和池化层,在降采样层之间设置有自注意力层用于收集图片的全局特征。进而全连接层将图像数据梳理为1*1*521大小,该1*1*521发小的特征向量和特征提取后的大小为 1*1*128的人脸ID特征,加起来构成大小为1*1*640的特征向量,最后将该特征向量输入解码器模块进行解码处理。解码器通过反卷积层和自注意力层的处理后,通过输出层输出一个尺寸为256(高)*256(宽)*3(通道)大小的高清图片。
本发明基于生成对抗网络的图像处理方法,在生成的UNet网络结构中,在每一个卷积层之间加入自注意力结构,让每个卷积层自主的通过反向传播学习到需要学习的区域,而不是通过掩码标记区域的格式,能够节省人工标记的成本,而且可以更充分的利用损失的反向传播机制。此外,取消了模型层和层之间的批归一化处理,并且用实例归一化代替,更好解决批处理层不能很好的反映整体数据的方差和均值的问题,而实例归一化处理能够比较好的获取到风格特征。
进一步地,在本发明的一个可选实施例中,自注意力层对训练数据中的图像数据的处理过程包括:
1、自注意力层获取相邻的上一卷积层输出的图像数据的特征向量,并基于特征向量获取与特征向量对应的query、key和value;
2、对query和key进行相似度计算,并根据相似度计算结果获取与特征向量对应的权重;
3、基于softmax函数对所有权重进行归一化处理,并将归一化处理后的权重与value进行对位的矩阵乘法,获取自注意力层的输出特征,并将输出特征你输入与自注意力层相邻的下一卷积层中。
具体地,上述自注意力层也可称为自注意力结构,其主要是在计算输入一个矩阵后,得到全局的注意力加成后的矩阵,在计算attention时主要分为四步,第一步是获取query,key,value矩阵,这一步通过不同的卷积层完成,第二步是将query和key进行相似度计算得到权重,常用的相似度函数有点积,拼接,感知机等;然后第三步一般是使用一个softmax函数对这些权重进行归一化;最后将权重和value进行对位的矩阵乘法得到最后的attention,也就是输出,这样我们就得到一个有着全局关注的一个特征矩阵;如果仅仅是通过卷积完成的话,则仅仅是关注了局部特征不,不利于提高模型的精度和图片处理的效果。
作为具体示例,如果自注意力层输入的数据为:X∈Rn×d,表示一个输入样本序列的特征,其中n为输入样本个数(序列长度),d表示单个样本的纬度。
则Query、Key和Value的定义分别如下所示:
Query:Q=X·WQ,其中WQ∈Rd×dq,Q表示Query矩阵,WQ表示Q的权重,X表示输入数据,dq表示Q的维度,R表示实数集;
Key:K=X·WK,其中WK∈Rd×dk,K表示Key矩阵,WK表示k的权重,X表示输入数据,dk表示K的维度,R表示实数集;
Value:V=X·WK,其中WV∈Rd×dv,其中,V表示Value矩阵,WV表示V的权重,X表示输入数据,dv表示V的维度,R表示实数集。
其中,Q、K和V矩阵均可以认为是空间变换矩阵。
此外,上述步骤S130还可包括:在基于训练数据训练所述生成对抗网络模型时,所述生成对抗网络模型的损失函数包括平均绝对误差(L1 loss函数)、均方误差(L2 loss函数)和交叉熵损失函数;其中,
平均绝对误差的表达公式为:
均方误差的表达公式为:
其中,n表示输入图像数据的个数,yi表示第i个图像数据的真实值,yip 表示第i个图像数据的预测值;
交叉熵函数的表达公式为:
具体地,L1 loss函数又称平均绝对误差(MAE),是一种用于回归模型的损失函数,因此它衡量的是一组预测值中的平均误差大小,而不考虑预测值的方向,L2 loss函数又称均方误差(MSE),由于交叉熵损失函数,常用于分类问题,计算衡量真实数据分布于预测数据分布的距离,由于本方案是衡量图像数据的每个像素点的相似度匹配,所以采用L1 loss函数跟合适且跟更直观,具体的损失函数可根据应用场景或需求进行选取,或选取其他类型的损失函数等等,在本发明中并不具体限制。
在本方案的另一具体实施方式中,训练构建的生成对抗网络模型,直至生成对抗网络模型的损失函数小于预设阈值,形成图像处理模型,包括:
1、在基于所述训练数据训练所述生成对抗网络模型的每次迭代过程中,随机选取部分输出层的输出图像进行保存;
2、基于保存的输出图像进行分辨率判断,获取判断结果;
3、基于损失函数和判断结果,确定所述成对抗网络模型的训练结束,,并形成所述图像处理模型。
具体地,在生成对抗网络模型的每次迭代中,均选取部分输出图像进行保存,以便人工进行分辨率查验,当损失函数不在降低,且人工无法鉴别出分辨率提升的情况下,确定生成对抗网络模型的训练完成,并终止训练。
本发明通过简单网络(ResNet-18)对低分辨率图片进行特征的提取,能够对不同的类别(如风景,人物等等)的图片进行特征提取,此外也可以使用one-hot或其他词嵌入算法对不同的类别进行编码。由于不同类别的图片存在特征差异,可以将这一部分加入到生成对抗网络模型的训练之中,在UNet 的中间层(编码器模块的最高层)会得到一个512维的特征向量,能够将反映输入图片类别的特征编码成128维的向量,和512维向量进行通道合并操作,得到640维包含图片类别差异的向量,再进行上采样或者反卷积。能够增加训练过程之中不同类别训练样本之间的差异性,提升生成对抗网络模型的泛化能力,避免因为数据分布不均衡等问题,导致的生成对抗网络模型出现过拟合的问题。
例如,使用onehot编码就是把特征编码成只有一位是1其余均是0的特征向量。比如32位one-hot编码就是只有1个1和31个0,这样编码比较简单,但是特征向量的维度会随着位数的增长而增长。其他的词向量嵌入算法则是使用一些预训练的模型直接对输入向量进行编码,输出固定位数的浮点型的特征向量,能够保证向量位数的不至于太长。在本方案中,使用简单的CNN网络进行编码,则会针对图片的特征进行提取,这样编码后的向量会涵盖图片的纹理细节特征,而且根据CNN网络最后的全连接层的输出通道数可以固定向量维度。
如图3所示,是本发明基于生成对抗网络的图像处理装置的功能模块图。
本发明所述基于生成对抗网络的图像处理装置200可以安装于电子设备中。根据实现的功能,所述基于生成对抗网络的图像处理装置可以包括模糊数据获取单元210、训练数据确定单元220、图像处理模型形成单元230、图像处理单元240。本发所述单元也可以称之为模块,是指一种能够被电子设备处理器所执行,并且能够完成固定功能的一系列计算机程序段,其存储在电子设备的存储器中。
在本实施例中,关于各模块/单元的功能如下:
模糊数据获取单元210,用于获取样本数据,并基于所述样本数据获取模糊数据;
训练数据确定单元220,用于基于所述模糊数据获取与所述模糊数据对应的高分辨率图,并基于所述高分辨率图、所述模糊数据和所述样本数据确定训练数据;图像处理模型形成单元230,用于基于所述训练数据训练构建的生成对抗网络模型,直至所述生成对抗网络模型的损失函数小于预设阈值,形成图像处理模型;
图像处理单元240,用于基于所述图像处理模型对待处理图像进行分辨率处理。
详细的,在上述模糊数据获取单元210中,基于样本数据获取模糊数据,可以包括:
首先,基于预设图像数据集确定训练数据;
然后,对样本数据进行模糊算法处理,获取与样本数据对应的模糊数据;其中,模糊算法包括均值模糊算法和高斯模糊算法。
具体地,样本数据可通过现有的公开的数据集进行获取,然后通过模糊处理算法对确定后的样本数据进行降采样,将其随机模糊处理形成与所述样本数据对应的模糊数据。
其中,模糊处理算法也可称为模糊算法,其主要是当对系统的模型认识不是很深刻,或者可观的原因导致的无法对系统的控制模型进行深入研究时,需要通过模糊算法进行模糊处理,作为具体示例,可采用均值模糊或高斯模糊等多种算法对样本数据进行处理,通过模糊算法计算样本数据的一个像素周边的某个领域内,相关像素的某个特征值的累加和及对应的权重,然后得到结果值,由于该算法无法区分图像的边缘等信息,导致被模糊后的图像细节严重丢失,一种简单的改进方式就是设置某个阈值,当领域像素和中心点像素的差距大于阈值时,设置其权重很小,甚至为0,这样对于本身比较平滑的区域,和原始的算法区别不大,而对于像素值变化较为明显的边缘地带,则能够有效地保留原始信息,这样就能起到降低噪音的同时保留边缘的信息。
在训练数据确定单元220中,基于模糊数据获取与所述模糊数据对应的高分辨率图,并基于所述高分辨率图、所述模糊数据和所述样本数据确定训练数据。其中,在获取高分辨率图的过程中,可将模糊数输入传统的U-net 网络结构或其它网络结果中中,通过U-net网络输出与模糊数据对应的高分辨率的图。可知,训练数据包括模糊数据、与模糊数据对应的高分辨率图,以及样本数据(真正高分辨率的图)。
在上述图像处理模型形成单元230中,所构建的生成对抗网络模型可包括编码器模块和解码器模块;其中,编码器模块进一步包括输入层、降采样层、自注意力层和全连接层,解码器模块包括反卷积层、自注意力层和输出层;降采样层包括卷积层和池化层,自注意力层设置在相邻两降采样层之间,自注意力层可收集图像数据在处理过程中的全局特征;并且,卷积层的输出和反卷积层的输入连接,通过concat合并操作完成对信息的补充,最终通过输出层,输出一个和输入图像尺寸相同的高清化图像。
在本发明的一个具体实施方式中,生成对抗网络模型包括解码器模块和编码器;其中,解码器模块包括输入层、卷积层1、卷积层2、自注意力层1、卷积层3、自注意力层2、卷积层4、自注意力层3、卷积层5、自注意力层4、卷积层6和全连接层;解码器模块包括与全连接层依次连接的反卷积层1、反卷积层2、自注意力层5、反卷积层3、自注意力层6、反卷积层4、自注意力层7、反卷积层5、自注意力层8、反卷积层6、反卷积层7和输出层。
进一步地,卷积层1和反卷积层6连接,卷积层2和反卷积层5连接,卷积层3和反卷积层4连接,卷积层4和反卷积层3连接,卷积层5和反卷积层2连接,此处的卷积层和反卷积层的连接,可以理解为卷积层的输出发送至对应的反卷积层的输入,即编码器模块在各层的输出与解码器模块中的对应的反卷积层连接,完成信息的补充,并最终通过输出层获取处理的图像数据。
此外,需要说明的是,在编码器模块的最后一个全连接层能够将输入的图像数据梳理为具有一定大小的图像特征,同时对输入的图像数据进行一个特征的提取(例如,人脸的特征),然后将提取后的特征直接和全连接层处理后的图像特征进行结合,并一同输入解码器模块中。其中,输入的图像数据即为上述处理后的训练数据。
在本发明的一个具体实施例中,当输入的训练数据为256(高)*256(宽) *3(通道)大小的图片数据时,可通过生成对抗网络模型对该模数数据(图像数据)进行5次降采样,每个降采样层包括卷积层和池化层,在降采样层之间设置有自注意力层用于收集图片的全局特征。进而全连接层将图像数据梳理为1*1*521大小,该1*1*521发小的特征向量和特征提取后的大小为 1*1*128的人脸ID特征,加起来构成大小为1*1*640的特征向量,最后将该特征向量输入解码器模块进行解码处理。解码器通过反卷积层和自注意力层的处理后,通过输出层输出一个尺寸为256(高)*256(宽)*3(通道)大小的高清图片。
本发明基于生成对抗网络的图像处理方法,在生成的UNet网络结构中,在每一个卷积层之间加入自注意力结构,让每个卷积层自主的通过反向传播学习到需要学习的区域,而不是通过掩码标记区域的格式,能够节省人工标记的成本,而且可以更充分的利用损失的反向传播机制。此外,取消了模型层和层之间的批归一化处理,并且用实例归一化代替,更好解决批处理层不能很好的反映整体数据的方差和均值的问题,而实例归一化处理能够比较好的获取到风格特征。
进一步地,在本发明的一个可选实施例中,自注意力层对训练数据中的图像数据的处理过程包括:
1、自注意力层获取相邻的上一卷积层输出的图像数据的特征向量,并基于特征向量获取与特征向量对应的query、key和value;
2、对query和key进行相似度计算,并根据相似度计算结果获取与特征向量对应的权重;
3、基于softmax函数对所有权重进行归一化处理,并将归一化处理后的权重与value进行对位的矩阵乘法,获取自注意力层的输出特征,并将输出特征你输入与自注意力层相邻的下一卷积层中。
具体地,上述自注意力层也可称为自注意力结构,其主要是在计算输入一个矩阵后,得到全局的注意力加成后的矩阵,在计算attention时主要分为四步,第一步是获取query,key,value矩阵,这一步通过不同的卷积层完成,第二步是将query和key进行相似度计算得到权重,常用的相似度函数有点积,拼接,感知机等;然后第三步一般是使用一个softmax函数对这些权重进行归一化;最后将权重和value进行对位的矩阵乘法得到最后的attention,也就是输出,这样我们就得到一个有着全局关注的一个特征矩阵;如果仅仅是通过卷积完成的话,则仅仅是关注了局部特征不,不利于提高模型的精度和图片处理的效果。
作为具体示例,如果自注意力层输入的数据为:X∈Rn×d,表示一个输入样本序列的特征,其中n为输入样本个数(序列长度),d表示单个样本的纬度。
则Query、Key和Value的定义分别如下所示:
Query:Q=X·WQ,其中WQ∈Rd×dq,Q表示Query矩阵,WQ表示Q的权重,X表示输入数据,dq表示Q的维度,R表示实数集;
Key:K=X·WK,其中WK∈Rd×dk,K表示Key矩阵,WK表示k 的权重,X表示输入数据,dk表示K的维度,R表示实数集;
Value:V=X·WK,其中WV∈Rd×dv,其中,V表示Value矩阵,WV 表示V的权重,X表示输入数据,dv表示V的维度,R表示实数集。
其中,Q、K和V矩阵均可以认为是空间变换矩阵。
此外,上述步骤S120还可包括:在基于训练数据训练所述生成对抗网络模型时,所述生成对抗网络模型的损失函数包括平均绝对误差(L1 loss函数)、均方误差(L2 loss函数)和交叉熵损失函数;其中,
平均绝对误差的表达公式为:
均方误差的表达公式为:
其中,n表示输入图像数据的个数,yi表示第i个图像数据的真实值,yi p表示第i个图像数据的预测值;
交叉熵函数的表达公式为:
具体地,L1 loss函数又称平均绝对误差(MAE),是一种用于回归模型的损失函数,因此它衡量的是一组预测值中的平均误差大小,而不考虑预测值的方向,L2 loss函数又称均方误差(MSE),由于交叉熵损失函数,常用于分类问题,计算衡量真实数据分布于预测数据分布的距离,由于本方案是衡量图像数据的每个像素点的相似度匹配,所以采用L1 loss函数跟合适且跟更直观,具体的损失函数可根据应用场景或需求进行选取,或选取其他类型的损失函数等等,在本发明中并不具体限制。
在本方案的另一具体实施方式中,训练构建的生成对抗网络模型,直至生成对抗网络模型的损失函数小于预设阈值,形成图像处理模型,包括:
1、在基于所述训练数据训练所述生成对抗网络模型的每次迭代过程中,随机选取部分输出层的输出图像进行保存;
2、基于保存的输出图像进行分辨率判断,获取判断结果;
3、基于损失函数和判断结果,确定所述成对抗网络模型的训练结束,,并形成所述图像处理模型。
具体地,在生成对抗网络模型的每次迭代中,均选取部分输出图像进行保存,以便人工进行分辨率查验,当损失函数不在降低,且人工无法鉴别出分辨率提升的情况下,确定生成对抗网络模型的训练完成,并终止训练。
如图4所示,是本发明实现基于生成对抗网络的图像处理方法的电子设备的结构示意图。
所述电子设备1可以包括处理器10、存储器11和总线,还可以包括存储在所述存储器11中并可在所述处理器10上运行的计算机程序,如基于生成对抗网络的图像处理程序12。
其中,所述存储器11至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、移动硬盘、多媒体卡、卡型存储器(例如:SD或DX存储器等)、磁性存储器、磁盘、光盘等。所述存储器11在一些实施例中可以是电子设备1的内部存储单元,例如该电子设备1的移动硬盘。所述存储器11在另一些实施例中也可以是电子设备1的外部存储设备,例如电子设备1上配备的插接式移动硬盘、智能存储卡(Smart Media Card,SMC)、安全数字 (SecureDigital,SD)卡、闪存卡(Flash Card)等。进一步地,所述存储器 11还可以既包括电子设备1的内部存储单元也包括外部存储设备。所述存储器11不仅可以用于存储安装于电子设备1的应用软件及各类数据,例如基于生成对抗网络的图像处理程序的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。
所述处理器10在一些实施例中可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多个中央处理器(Central Processing unit,CPU)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。所述处理器 10是所述电子设备的控制核心(Control Unit),利用各种接口和线路连接整个电子设备的各个部件,通过运行或执行存储在所述存储器11内的程序或者模块(例如基于生成对抗网络的图像处理程序等),以及调用存储在所述存储器11内的数据,以执行电子设备1的各种功能和处理数据。
所述总线可以是外设部件互连标准(peripheral component interconnect,简称PCI)总线或扩展工业标准结构(extended industry standard architecture,简称EISA)总线等。该总线可以分为地址总线、数据总线、控制总线等。所述总线被设置为实现所述存储器11以及至少一个处理器10等之间的连接通信。
图4仅示出了具有部件的电子设备,本领域技术人员可以理解的是,图3 示出的结构并不构成对所述电子设备1的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
例如,尽管未示出,所述电子设备1还可以包括给各个部件供电的电源 (比如电池),优选地,电源可以通过电源管理装置与所述至少一个处理器 10逻辑相连,从而通过电源管理装置实现充电管理、放电管理、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述电子设备1还可以包括多种传感器、蓝牙模块、Wi-Fi模块等,在此不再赘述。
进一步地,所述电子设备1还可以包括网络接口,可选地,所述网络接口可以包括有线接口和/或无线接口(如WI-FI接口、蓝牙接口等),通常用于在该电子设备1与其他电子设备之间建立通信连接。
可选地,该电子设备1还可以包括用户接口,用户接口可以是显示器 (Display)、输入单元(比如键盘(Keyboard)),可选地,用户接口还可以是标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是 LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在电子设备1中处理的信息以及用于显示可视化的用户界面。
应该了解,所述实施例仅为说明之用,在专利申请范围上并不受此结构的限制。
所述电子设备1中的所述存储器11存储的基于生成对抗网络的图像处理程序12是多个指令的组合,在所述处理器10中运行时,可以实现:
获取样本数据,并基于所述样本数据获取模糊数据;
基于所述模糊数据获取与所述模糊数据对应的高分辨率图,并基于所述高分辨率图、所述模糊数据和所述样本数据确定训练数据;
基于所述训练数据训练构建的生成对抗网络模型,直至所述生成对抗网络模型的损失函数小于预设阈值,形成图像处理模型;
基于所述图像处理模型对待处理图像进行分辨率处理。
可选地,所述基于所述样本数据获取模糊数据,包括:
基于预设图像数据集确定所述样本数据;
对所述样本数据进行模糊算法处理,获取与所述样本数据对应的模糊数据;其中,所述模糊算法包括均值模糊算法和高斯模糊算法。
可选地,所述生成对抗网络模型包括编码器模块和解码器模块;
所述编码器模块包括输入层、降采样层、自注意力层和全连接层,所述解码器模块包括反卷积层、自注意力层和输出层;其中,
所述降采样层包括卷积层和池化层,所述自注意力层设置在相邻两降采样层之间;并且,
所述卷积层的输出和所述反卷积层的输入连接。
可选地,所述编码器模块包括输入层、卷积层1、卷积层2、自注意力层 1、卷积层3、自注意力层2、卷积层4、自注意力层3、卷积层5、自注意力层4、卷积层6和全连接层;
所述解码器模块包括与所述全连接层依次连接的反卷积层1、反卷积层2、自注意力层5、反卷积层3、自注意力层6、反卷积层4、自注意力层7、反卷积层5、自注意力层8、反卷积层6、反卷积层7和输出层;并且,
所述卷积层1和所述反卷积层6连接,所述卷积层2和所述反卷积层5 连接,所述卷积层3和所述反卷积层4连接,所述卷积层4和所述反卷积层3 连接,所述卷积层5和所述反卷积层2连接。
可选地,所述自注意力层对所述训练数据中的图像数据的处理过程包括:
所述自注意力层获取相邻的上一卷积层输出的图像数据的特征向量,并基于所述特征向量获取与所述特征向量对应的query、key和value;
对所述query和key进行相似度计算,并根据所述相似度计算结果获取与所述特征向量对应的权重;
基于softmax函数对所有权重进行归一化处理,并将归一化处理后的权重与value进行对位的矩阵乘法,获取所述自注意力层的输出特征,并将所述输出特征你输入与所述自注意力层相邻的下一卷积层中。
可选地,所述损失函数包括平均绝对误差、均方误差和交叉熵函数;
所述平均绝对误差的表达公式为:
所述均方误差的表达公式为:
其中,n表示输入图像数据的个数,yi表示第i个图像数据的真实值,yi p表示第i个图像数据的预测值;
所述交叉熵函数的表达公式为:
可选地,所述训练构建的生成对抗网络模型,直至所述生成对抗网络模型的损失函数小于预设阈值,形成图像处理模型,包括:
在基于所述训练数据训练所述生成对抗网络模型的每次迭代过程中,随机选取部分输出层的输出图像进行保存;
对保存的输出图像进行分辨率判断,并获取判断结果;
基于所述损失函数和所述判断结果,确定所述成对抗网络模型的训练结束,并形成所述图像处理模型。
具体地,所述处理器10对上述指令的具体实现方法可参考图1对应实施例中相关步骤的描述,在此不赘述。进一步地,所述电子设备1集成的模块/ 单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)。
在本发明所提供的几个实施例中,应该理解到,所揭露的设备,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。
因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图标记视为限制所涉及的权利要求。
此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第二等词语用来表示名称,而并不表示任何特定的顺序。
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。
Claims (10)
1.一种基于生成对抗网络的图像处理方法,其特征在于,所述方法包括:
获取样本数据,并基于所述样本数据获取模糊数据;
基于所述模糊数据获取与所述模糊数据对应的高分辨率图,并基于所述高分辨率图、所述模糊数据和所述样本数据确定训练数据;
基于所述训练数据训练构建的生成对抗网络模型,直至所述生成对抗网络模型的损失函数小于预设阈值,形成图像处理模型;
基于所述图像处理模型对待处理图像进行分辨率处理。
2.如权利要求1所述的基于生成对抗网络的图像处理方法,其特征在于,所述基于所述样本数据获取模糊数据,包括:
基于预设图像数据集确定所述样本数据;
对所述样本数据进行模糊算法处理,获取与所述样本数据对应的模糊数据;其中,所述模糊算法包括均值模糊算法和高斯模糊算法。
3.如权利要求1所述的基于生成对抗网络的图像处理方法,其特征在于,
所述生成对抗网络模型包括编码器模块和解码器模块;
所述编码器模块包括输入层、降采样层、自注意力层和全连接层,所述解码器模块包括反卷积层、自注意力层和输出层;其中,
所述降采样层包括卷积层和池化层,所述自注意力层设置在相邻两降采样层之间;并且,
所述卷积层的输出和所述反卷积层的输入连接。
4.如权利要求3所述的基于生成对抗网络的图像处理方法,其特征在于,
所述编码器模块包括输入层、卷积层1、卷积层2、自注意力层1、卷积层3、自注意力层2、卷积层4、自注意力层3、卷积层5、自注意力层4、卷积层6和全连接层;
所述解码器模块包括与所述全连接层依次连接的反卷积层1、反卷积层2、自注意力层5、反卷积层3、自注意力层6、反卷积层4、自注意力层7、反卷积层5、自注意力层8、反卷积层6、反卷积层7和输出层;并且,
所述卷积层1和所述反卷积层6连接,所述卷积层2和所述反卷积层5连接,所述卷积层3和所述反卷积层4连接,所述卷积层4和所述反卷积层3连接,所述卷积层5和所述反卷积层2连接。
5.如权利要求3所述的基于生成对抗网络的图像处理方法,其特征在于,
所述自注意力层对所述训练数据中的图像数据的处理过程包括:
所述自注意力层获取相邻的上一卷积层输出的图像数据的特征向量,并基于所述特征向量获取与所述特征向量对应的query、key和value;
对所述query和key进行相似度计算,并根据所述相似度计算结果获取与所述特征向量对应的权重;
基于softmax函数对所有权重进行归一化处理,并将归一化处理后的权重与value进行对位的矩阵乘法,获取所述自注意力层的输出特征,并将所述输出特征你输入与所述自注意力层相邻的下一卷积层中。
7.如权利要求1所述的基于生成对抗网络的图像处理方法,其特征在于,所述训练构建的生成对抗网络模型,直至所述生成对抗网络模型的损失函数小于预设阈值,形成图像处理模型,包括:
在基于所述训练数据训练所述生成对抗网络模型的每次迭代过程中,随机选取部分输出层的输出图像进行保存;
对保存的输出图像进行分辨率判断,并获取判断结果;
基于所述损失函数和所述判断结果,确定所述成对抗网络模型的训练结束,并形成所述图像处理模型。
8.一种基于生成对抗网络的图像处理装置,其特征在于,所述装置包括:
模糊数据获取单元,用于获取样本数据,并基于所述样本数据获取模糊数据;
训练数据确定单元,用于基于所述模糊数据获取与所述模糊数据对应的高分辨率图,并基于所述高分辨率图、所述模糊数据和所述样本数据确定训练数据;
图像处理模型形成单元,用于基于所述样本数据训练构建的生成对抗网络模型,直至所述生成对抗网络模型的损失函数小于预设阈值,形成图像处理模型;
图像处理单元,用于基于所述图像处理模型对待处理图像进行分辨率处理。
9.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1至7中任一所述的基于生成对抗网络的图像处理方法中的步骤。
10.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任一所述的基于生成对抗网络的图像处理方法中的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110608709.XA CN113240585B (zh) | 2021-06-01 | 2021-06-01 | 基于生成对抗网络的图像处理方法、装置及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110608709.XA CN113240585B (zh) | 2021-06-01 | 2021-06-01 | 基于生成对抗网络的图像处理方法、装置及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113240585A true CN113240585A (zh) | 2021-08-10 |
CN113240585B CN113240585B (zh) | 2024-05-24 |
Family
ID=77136134
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110608709.XA Active CN113240585B (zh) | 2021-06-01 | 2021-06-01 | 基于生成对抗网络的图像处理方法、装置及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113240585B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115661002A (zh) * | 2022-12-14 | 2023-01-31 | 北京数慧时空信息技术有限公司 | 基于gan的多时相遥感数据修复方法 |
CN117612266A (zh) * | 2024-01-24 | 2024-02-27 | 南京信息工程大学 | 基于多尺度图像及特征层对齐的跨分辨率行人重识别方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200104978A1 (en) * | 2018-09-27 | 2020-04-02 | Google Llc | Image generation using subscaling and depth up-scaling |
US20200111194A1 (en) * | 2018-10-08 | 2020-04-09 | Rensselaer Polytechnic Institute | Ct super-resolution gan constrained by the identical, residual and cycle learning ensemble (gan-circle) |
CN111476717A (zh) * | 2020-04-07 | 2020-07-31 | 西安电子科技大学 | 基于自注意力生成对抗网络的人脸图像超分辨重建方法 |
CN111696624A (zh) * | 2020-06-08 | 2020-09-22 | 天津大学 | 基于自注意力机制的dna结合蛋白鉴定和功能注释的深度学习方法 |
US20210049452A1 (en) * | 2019-08-15 | 2021-02-18 | Intuit Inc. | Convolutional recurrent generative adversarial network for anomaly detection |
CN112419153A (zh) * | 2020-11-23 | 2021-02-26 | 深圳供电局有限公司 | 图像超分辨率重建方法、装置、计算机设备和存储介质 |
-
2021
- 2021-06-01 CN CN202110608709.XA patent/CN113240585B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200104978A1 (en) * | 2018-09-27 | 2020-04-02 | Google Llc | Image generation using subscaling and depth up-scaling |
US20200111194A1 (en) * | 2018-10-08 | 2020-04-09 | Rensselaer Polytechnic Institute | Ct super-resolution gan constrained by the identical, residual and cycle learning ensemble (gan-circle) |
US20210049452A1 (en) * | 2019-08-15 | 2021-02-18 | Intuit Inc. | Convolutional recurrent generative adversarial network for anomaly detection |
CN111476717A (zh) * | 2020-04-07 | 2020-07-31 | 西安电子科技大学 | 基于自注意力生成对抗网络的人脸图像超分辨重建方法 |
CN111696624A (zh) * | 2020-06-08 | 2020-09-22 | 天津大学 | 基于自注意力机制的dna结合蛋白鉴定和功能注释的深度学习方法 |
CN112419153A (zh) * | 2020-11-23 | 2021-02-26 | 深圳供电局有限公司 | 图像超分辨率重建方法、装置、计算机设备和存储介质 |
Non-Patent Citations (3)
Title |
---|
YAN WU等: "Self-attention convolutional neural network for improved MR image reconstruction", INFORMATION SCIENCES, 31 July 2019 (2019-07-31), pages 317 - 328 * |
数学编程: "图文理解自注意力(self-attention)", pages 1 - 9, Retrieved from the Internet <URL:https://mp.weixin.qq.com/s/j493E-px5EpEmLeGJF3nug> * |
郭佳等: "基于全注意力机制的多步网络流量预测", 信号处理, no. 05, 25 May 2019 (2019-05-25), pages 758 - 767 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115661002A (zh) * | 2022-12-14 | 2023-01-31 | 北京数慧时空信息技术有限公司 | 基于gan的多时相遥感数据修复方法 |
CN115661002B (zh) * | 2022-12-14 | 2023-04-21 | 北京数慧时空信息技术有限公司 | 基于gan的多时相遥感数据修复方法 |
CN117612266A (zh) * | 2024-01-24 | 2024-02-27 | 南京信息工程大学 | 基于多尺度图像及特征层对齐的跨分辨率行人重识别方法 |
CN117612266B (zh) * | 2024-01-24 | 2024-04-19 | 南京信息工程大学 | 基于多尺度图像及特征层对齐的跨分辨率行人重识别方法 |
Also Published As
Publication number | Publication date |
---|---|
CN113240585B (zh) | 2024-05-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2022121156A1 (zh) | 图像中目标物检测方法、装置、电子设备及可读存储介质 | |
WO2021164534A1 (zh) | 图像处理方法、装置、设备及存储介质 | |
CN113283446B (zh) | 图像中目标物识别方法、装置、电子设备及存储介质 | |
CN110443883B (zh) | 一种基于dropblock的单张彩色图片平面三维重建方法 | |
CN113240585B (zh) | 基于生成对抗网络的图像处理方法、装置及存储介质 | |
CN114972976B (zh) | 基于频域自注意力机制的夜间目标检测、训练方法及装置 | |
CN112884758B (zh) | 一种基于风格迁移方法的缺陷绝缘子样本生成方法及系统 | |
CN112541902A (zh) | 相似区域搜索方法、装置、电子设备及介质 | |
CN111274937A (zh) | 摔倒检测方法、装置、电子设备及计算机可读存储介质 | |
CN112507923A (zh) | 证件翻拍检测方法、装置、电子设备及介质 | |
CN113642585A (zh) | 图像处理方法、装置、设备、存储介质及计算机程序产品 | |
CN111985449A (zh) | 救援现场图像的识别方法、装置、设备及计算机介质 | |
CN108520532B (zh) | 识别视频中物体运动方向的方法及装置 | |
Zheng et al. | Transformer-based hierarchical dynamic decoders for salient object detection | |
CN111429388B (zh) | 一种图像处理方法、装置和终端设备 | |
CN116630712A (zh) | 基于模态组合的信息分类方法、装置、电子设备及介质 | |
CN116450880A (zh) | 一种语义检测的车载视频智能处理方法 | |
CN115798004A (zh) | 基于局部区域的人脸打卡方法、装置、电子设备及介质 | |
CN113705686B (zh) | 图像分类方法、装置、电子设备及可读存储介质 | |
CN113255456B (zh) | 非主动活体检测方法、装置、电子设备及存储介质 | |
CN114049676A (zh) | 疲劳状态检测方法、装置、设备及存储介质 | |
CN112541436A (zh) | 专注度分析方法、装置、电子设备及计算机存储介质 | |
CN112580505A (zh) | 网点开关门状态识别方法、装置、电子设备及存储介质 | |
CN114495290B (zh) | 活体检测方法、装置、设备及存储介质 | |
CN114627535B (zh) | 基于双目摄像头的坐标匹配方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |