CN110428378B - 图像的处理方法、装置及存储介质 - Google Patents

图像的处理方法、装置及存储介质 Download PDF

Info

Publication number
CN110428378B
CN110428378B CN201910684108.XA CN201910684108A CN110428378B CN 110428378 B CN110428378 B CN 110428378B CN 201910684108 A CN201910684108 A CN 201910684108A CN 110428378 B CN110428378 B CN 110428378B
Authority
CN
China
Prior art keywords
image
target
network model
resolution
training data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910684108.XA
Other languages
English (en)
Other versions
CN110428378A (zh
Inventor
马海龙
初祥祥
赵奇可
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Xiaomi Mobile Software Co Ltd
Original Assignee
Beijing Xiaomi Mobile Software Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Xiaomi Mobile Software Co Ltd filed Critical Beijing Xiaomi Mobile Software Co Ltd
Priority to CN201910684108.XA priority Critical patent/CN110428378B/zh
Publication of CN110428378A publication Critical patent/CN110428378A/zh
Priority to US16/687,645 priority patent/US11189014B2/en
Priority to EP19212587.0A priority patent/EP3770847B1/en
Application granted granted Critical
Publication of CN110428378B publication Critical patent/CN110428378B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/70Denoising; Smoothing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • G06T3/4053Scaling of whole images or parts thereof, e.g. expanding or contracting based on super-resolution, i.e. the output image resolution being higher than the sensor resolution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • G06T3/4053Scaling of whole images or parts thereof, e.g. expanding or contracting based on super-resolution, i.e. the output image resolution being higher than the sensor resolution
    • G06T3/4069Scaling of whole images or parts thereof, e.g. expanding or contracting based on super-resolution, i.e. the output image resolution being higher than the sensor resolution by subpixel displacements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/73Deblurring; Sharpening
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Image Processing (AREA)

Abstract

本公开涉及一种图像的处理方法、装置及存储介质,该方法包括:获取第一分辨率的待处理图像;通过目标神经网络模型对该待处理图像进行处理,得到目标图像,该目标图像为第二分辨率的降噪图像;其中,该第二分辨率高于该第一分辨率,该目标神经网络模型包括第一预设个数的卷积层和第二预设个数的亚像素上采样模块。这样通过目标神经网络模型对所述待处理图像进行处理,得到目标图像,能够利用目标神经网络模型实现在移动终端上对图像的降噪处理,同时具有降噪和超分辨率的功能,进而能够提高图像的性能。

Description

图像的处理方法、装置及存储介质
技术领域
本公开涉及图像处理领域,尤其涉及一种图像的处理方法、装置及存储介质。
背景技术
图像是互联网上信息传递的重要载体,由于带宽和资费等限制,互联网上传播的图像通常是将原始图像进行压缩处理,进而降低对宽带的压力,更快的使用图像传递信息,但同时也引入了噪声问题,导致图像的画质和分辨率下降等问题,一定程度影响了用户体验;相关技术中所使用的网络模型结构复杂,计算效率低,基本无法在移动设备上运行,并且对图像的处理并无降噪效果。
发明内容
为克服相关技术中存在的问题,本公开提供一种图像的处理方法、装置及存储介质。
根据本公开实施例的第一方面,提供一种图像的处理方法,应用于移动终端,所述方法包括:
获取第一分辨率的待处理图像;
通过目标神经网络模型对所述待处理图像进行处理,得到目标图像,所述目标图像为第二分辨率的降噪图像;
其中,所述第二分辨率高于所述第一分辨率,所述目标神经网络模型包括第一预设个数的卷积层和第二预设个数的亚像素上采样模块。
可选的,所述方法还包括:
对无噪图像数据进行预处理,以获取目标训练数据;
利用所述目标训练数据,通过随机梯度法进行初始网络模型的训练,以获取所述目标神经网络模型。
可选的,所述对无噪图像数据进行预处理,以获取目标训练数据,包括:
通过对所述无噪图像数据进行截取,确定具有预设大小的第一训练数据;
通过对所述第一训练数据进行预设倍数的降采样处理,获取降采样后的第二训练数据;
将预设的压缩噪音添加至所述第二训练数据中,以获取所述目标训练数据。
可选的,所述利用所述目标训练数据,通过随机梯度法进行初始网络模型的训练,以获取所述目标神经网络模型,包括:
将每批次具有预设批大小的所述目标训练数据作为输入,利用预设的损失函数,通过随机梯度法对所述初始神经网络模型的参数进行训练;
其中,所述损失函数包括均方误差、总变差以及感知损失;所述均方差包括红色通道误差、绿色通道误差以及蓝色通道误差。
根据本公开实施例的第二方面,提供一种图像的处理装置,所述装置包括:
获取模块,被配置为获取第一分辨率的待处理图像;
降噪模块,被配置为通过目标神经网络模型对所述待处理图像进行处理,得到目标图像,所述目标图像是为第二分辨率的降噪图像;
其中,所述第二分辨率高于所述第一分辨率,所述目标神经网络模型包括第一预设个数的卷积层和第二预设个数的亚像素上采样模块。
可选的,所述装置还包括:
预处理模块,被配置为对无噪图像数据进行预处理,以获取目标训练数据;
网络训练模块,被配置为利用所述目标训练数据,通过随机梯度法进行初始网络模型的训练,以获取所述目标神经网络模型。
可选的,所述预处理模块,包括:
图像截取子模块,被配置为通过对所述无噪图像数据进行截取,确定具有预设大小的第一训练数据;
降采样子模块,被配置为通过对所述第一训练数据进行预设倍数的降采样处理,获取降采样后的第二训练数据;
噪音添加子模块,被配置为将预设的压缩噪音添加至所述第二训练数据中,以获取所述目标训练数据。
可选的,所述网络训练模块,被配置为:
将每批次具有预设批大小的所述目标训练数据作为输入,利用预设的损失函数,通过随机梯度法对所述初始网络模型的参数进行训练;
其中,所述损失函数包括均方误差、总变差以及感知损失;所述均方差包括红色通道误差、绿色通道误差以及蓝色通道误差。
根据本公开实施例的第三方面,提供一种图像的处理装置,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:
获取第一分辨率的待处理图像;
通过目标神经网络模型对所述待处理图像进行处理,得到目标图像,所述目标图像为第二分辨率的降噪图像;
其中,所述第二分辨率高于所述第一分辨率,所述目标神经网络模型包括第一预设个数的卷积层和第二预设个数的亚像素上采样模块。
根据本公开实施例的第四方面,提供一种计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现本公开第一方面所提供的图像的处理方法的步骤。
本公开的实施例提供的技术方案可以包括以下有益效果:
获取第一分辨率的待处理图像;通过目标神经网络模型对所述待处理图像进行处理,得到目标图像,所述目标图像为第二分辨率的降噪图像;其中,所述第二分辨率高于所述第一分辨率,所述目标神经网络模型包括第一预设个数的卷积层和第二预设个数的亚像素上采样模块。这样通过目标神经网络模型对所述待处理图像进行处理,得到目标图像,能够利用目标神经网络模型实现在移动终端上对图像的降噪处理,同时具有降噪和超分辨率的功能,进而能够提高图像的性能。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
图1是根据一示例性实施例示出的一种图像的处理方法的流程图;
图2是根据一示例性实施例示出的另一种图像的处理方法的流程图;
图3是根据一示例性实施例示出的又一种图像的处理方法的流程图;
图4是根据一示例性实施例示出的一种图像的处理装置的框图;
图5是根据一示例性实施例示出的另一种图像的处理装置的框图;
图6是根据一示例性实施例示出的一种预处理模块的框图;
图7是根据一示例性实施例示出的又一种图像的处理装置的框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
在介绍本公开的实施例之前,首先对本公开的技术背景进行说明,超分辨率技术是用于对低分辨率图像进行处理,进而提升图像的分辨率和清晰度,获得更好的感官效果,是通过硬件或软件的方法提高原有图像的分辨率,利用一系列低分辨率的图像进而获得一幅高分辨率的图像过程。传统的超分辨率技术主要包括频域法、投影法、滤波器法和约束最小二乘法等,传统的超分辨率技术多基于人工提取的特征,需要大量的人工设计且效果不佳,因此随着深度学习的兴起,卷积神经网络在计算机视觉很多领域取得效果均显著超过了传统方法,将深度学习技术用来解决超分辨率问题成为研究的前沿内容。SRCNN(英文:SuperResolution Convolutional Neural Network;中文:超分辨率重建卷积神经网络)是较早利用卷积神经网络解决超分问题的算法,SRCNN通过将低分辨率图像通过上采样进行放大,得到指定尺寸大小的图像,之后通过三层卷积网络在高维空间对图像进行处理得到超分照片,在经典数据集的测试效果上持平或超过了传统方法。但SRCNN在高维空间的图像处理效率不高,因此提出在其中采用亚像素上采样技术,也就是说将大部分的运算控制在低维空间,之后通过亚像素采样将低维特征组合为高位特征输出。其中,典型的是网络模型是:SRGAN(英文:SuperResolution Generative Adversarial Network,中文:超分辨率生成对抗网络),将生成对抗网络(英文:Generative Adversarial Network,缩写:GAN)用在了解决超分辨率问题上,通过残差卷积神经网络,在预训练的基础上引入生成对抗网络技术,进而保证较高信噪比的同时,取得了更符合人眼视觉的超分辨率效果,其在训练网络时用均方差作为损失函数,并且利用感知损失(英文:Perceptual Loss)和对抗损失(英文:Adversarial Loss)来提升恢复出的图像的真实感,因此虽然能够获得很高的峰值信噪比,但是恢复出来的图像通常会丢失高频细节,使人不能有好的视觉感受。其中,感知损失是利用卷积神经网络提取出的特征,通过比较生成图像经过卷积神经网络后的特征和目标图像经过卷积神经网络后的特征的差别,使生成图像和目标图像在语义和风格上更相似。此外,在一些改进的网络结构中,用均方误差优化SRGAN的生成网络部分,使得能够得到具有很高的峰值信噪比的结果,并在训练好的VGG模型的高层特征上计算感知损失来优化SRGAN,并结合SRGAN的判别网络,能够得到峰值信噪比虽然不是最高,但具有逼真视觉效果的结果。
另外的一种将亚像素上采样技术引入至卷积神经网络解决超分问题的算法中的网络结构是EDSR(英文:Enhanced Deep Residual Networks for Single Image Super-Resolution;中文:单一尺度的超分辨率网络),EDSR在结构上与SRGAN的生成网络部分相比,将批规范化处理(英文:Batch Normalization,缩写:BN)操作去掉,由于批规范化层消耗了与它前面的卷积层相同大小的内存,因此当去掉这一步操作后,相同的计算资源下,EDSR就可以堆叠更多的网络层或者使每层提取更多的特征,从而得到更好的性能表现。同时,EDSR用L1范数样式的损失函数来优化网络模型,在训练时先训练低倍数的上采样模型,接着用训练低倍数上采样模型得到的参数来初始化高倍数的上采样模型,这样能减少高倍数上采样模型的训练时间,且训练结果也更好,取得了很高的信噪比。
但上述这些方法的缺点是计算效率往往较低,无法在移动设备上运行,且这些方法只是单纯的解决超分辨率问题,没有降噪作用。
因此本公开旨在解决现有技术中无法实现在计算能力有限的设备上进行图像的超分辨处理的问题,进而提出一种基于深度学习技术的能够应用于移动端的降噪超分辨率方法,基于深度学习技术,利用简化的网络结构,同时实现降噪和超分辨率。
图1是根据一示例性实施例示出的一种图像的处理方法的流程图,如图1所示,该方法用于移动终端,包括以下步骤:
在步骤101中,获取第一分辨率的待处理图像。
在步骤102中,通过目标神经网络模型对该待处理图像进行处理,得到目标图像,该目标图像为第二分辨率的降噪图像。
其中,该目标图像是待处理图像经目标神经网络模型处理后的具有第二分辨率的降噪图像,第二分辨率高于第一分辨率,也就是说获取到的待处理图像是低分辨率的,经目标神经网络处理后,得到降噪的高分辨率图像。
该目标神经网络模型包括第一预设个数的卷积层和第二预设个数的亚像素上采样模块。
示例地,本公开所用于进行图像处理的目标神经网络模型是由卷积层和亚像素上采样模块组成的,适用于任意尺寸的图像处理;该目标神经网络模型中的卷积层位于亚像素上采样模块的上层,可根据实际的应用场合对性能和效果的需求设置该第一预设个数,该第一预设个数的可选个数为5、6或者7;一般地,若对计算时间要求比较高,可以适当减少卷积层的个数,以提高图像处理性能;而对图像处理效果要求较高时,可以适当增加卷积层的个数,以提升图像的感官效果,其中卷积层的步长设置为1,可以实现本公开的技术方案所需的图像处理目的。之后再通过亚像素上采样模块实现对图像以亚像素为基本单位进行的采样,亚像素为标准像素的一个颜色分量,不同的亚像素采样方式,获取的原图像信息也就不同,以采样因子为3为例进行亚像素下采样,将分辨率为3M*3N的原图像L经过亚像素下采样模块后将得到分辨率为M*N的采样图像,同时为了使得通过目标神经网络模型后的图像保持大小不变,应选取对应的个数和对应大小的亚像素上采样模块,如前所述利用亚像素上采样模块替代了一般神经网络中所采用的全连接层,实现对待处理图像的原始大小的还原。
因此,本公开所提出的目标神经网络模型采用低维空间的特征提取和运算,进而降低了运算量,使其能够在计算能力较差的移动终端上使用,并同时实现对图像的降噪和超分辨处理。
图2是根据一示例性实施例示出的另一种图像的处理方法的流程图,如图2所示,该方法包括以下步骤:
在步骤103中,对无噪图像数据进行预处理,以获取目标训练数据。
示例地,在通过图1的实施例进行图像的处理之前,还需要确定目标神经网络模型,也就是进行该目标神经网络模型的训练,由于在上述实施例中用于图像处理的目标神经网络模型的输入为第一分辨率图像,原始低分辨率图像,也就是步骤101中的待处理图像,而经过该目标神经网络模型的处理后,可以将图像在传输、存储以及压缩和解压过程中所产生的噪音去除,并进行超分辨率的处理,以输出具有第二分辨率的降噪图像,也就是步骤102,并且由于第一分辨率是小于第二分辨率的,进而获取输出图像给用户带来较好的感官效果,提高用户体验。因此,对应的,在对该目标神经网络模型进行训练时,需要将第二分辨率也就是高分辨率的无噪图像数据进行预处理后,生成具有噪声的低分辨率图像和不带噪声的低分辨率图像的组合,作为对该目标神经网络模型进行训练时的目标训练数据,以通过梯度训练确定目标神经网络模型的参数。
在步骤104中,利用该目标训练数据,通过随机梯度法进行初始网络模型的训练,以获取该目标神经网络模型。
示例地,将每批次具有预设批大小的目标训练数据作为输入,利用预设的损失函数,通过随机梯度法进行初始网络模型的训练,以获取目标神经网络模型。
其中,损失函数包括均方误差、总变差以及感知损失;均方差包括红色通道误差、绿色通道误差以及蓝色通道误差。
其中,随机梯度法可以采用随机梯度下降法或者类梯度下降法进行处理,应用在机器学习和人工智能中实现递归性地逼近最小偏差模型,以优化确定目标神经网络模型中各个参数。其中损失函数是由均方误差、总变差以及感知损失的加权和构成,每个部分对应的加权大小对应于实际的应用场景进行取值,如果对于图像的处理更注重超分辨率效果,可以增大均方误差所占权重,而如果更注重降噪效果,可以增大总变差和感知损失所占权重;对应的均方差是由红色通道误差、绿色通道误差以及蓝色通道误差的加权和构成,每个部分所对应的加权值大小可调,由于人眼对于绿色较为敏感,因此可以设置均方差中绿色通道误差的权重较大。
通过随机梯度法,对初始网络模型中各层的参数进行训练,以获取优化的目标神经网络模型,进而实现对待处理图像的降噪和超分辨率处理。
图3是根据一示例性实施例示出的又一种图像的处理方法的流程图,如图3所示,在步骤103所述的对无噪图像数据进行预处理,以获取目标训练数据,包括以下步骤:
在步骤1031中,通过对该无噪图像数据进行截取,确定具有预设大小的第一训练数据。
其中,首先对无噪图像数据进行预设图像大小的截取,预设图像大小是随机预设的。
在步骤1032中,通过对该第一训练数据进行预设倍数的降采样处理,获取降采样后的第二训练数据。
示例地,通过对步骤1031中截取出的第一训练数据进行降采样处理,对应的降采样倍数在本公开所涉及的应用场景一般小于等于4,因此当降采样倍数为2时,对应的采用1个2倍放大的亚像素上采样模块;当降采用倍数为3时,对应的采用1个3倍放大的亚像素上采样模块;当降采样倍数为4时,对应的采用2个2倍放大的亚像素上采样模块,进而实现图像在通过目标神经网络模型后的大小保持不变。
在步骤1033中,将预设的压缩噪音添加至第二训练数据中,以获取目标训练数据。
示例地,由于第二训练数据是将高分辨率的无噪图像数据经过上述步骤2011的截取以及步骤2012的降采样,还需在第二训练数据中增加预设的压缩噪音,该噪音是通过人工构造的且具有不同级别的压缩噪音,可以根据具体应用场景和需求对比例参数进行微调,再将不同程度的压缩噪音随机添加至第二训练数据中之后,生成目标训练数据,以便之后步骤利用该目标训练数据进行目标神经网络模型的参数进行训练。
综上所述,本公开所提供的图像的处理方法,获取第一分辨率的待处理图像;根据待处理图像,利用目标神经网络模型,确定目标图像,该目标图像是待处理图像经目标神经网络模型处理后的具有第二分辨率的降噪图像;其中,第二分辨率高于第一分辨率,该目标神经网络模型包括第一预设个数的卷积层和第二预设个数的亚像素上采样模块。因此利用目标神经网络模型在移动终端上实现对图像的处理,同时具有降噪和超分辨率的功能,进而能够提高图像的性能,简化图像处理操作,进一步可以提升用户体验。
图4是根据一示例性实施例示出的一种图像的处理装置的框图。参照图4,用于实现上述所述方法的实施例,该装置400包括:
获取模块410,被配置为获取第一分辨率的待处理图像。
降噪模块420,被配置为通过目标神经网络模型对该待处理图像进行处理,得到目标图像,该目标图像为第二分辨率的降噪图像。
其中,第二分辨率高于第一分辨率,该目标神经网络模型包括第一预设个数的卷积层和第二预设个数的亚像素上采样模块。
图5是根据一示例性实施例示出的另一种图像的处理装置的框图。参照图5,该装置400还包括:
预处理模块430,被配置为对无噪图像数据进行预处理,以获取目标训练数据。
网络训练模块440,被配置为利用该目标训练数据,通过随机梯度法进行初始网络模型的训练,以获取该目标神经网络模型。
图6是根据一示例性实施例示出的一种预处理模块的框图。参照图6,该预处理模块430包括:
图像截取子模块431,被配置为通过对该无噪图像数据进行截取,确定具有预设大小的第一训练数据。
降采样子模块432,被配置为通过对该第一训练数据进行预设倍数的降采样处理,获取降采样后的第二训练数据。
噪音添加子模块433,被配置为将预设的压缩噪音添加至第二训练数据中,以获取目标训练数据。
可选的,网络训练模块440,被配置为:
将每批次具有预设批大小的目标训练数据作为输入,利用预设的损失函数,通过随机梯度法对初始网络模型的参数进行训练;
其中,损失函数包括均方误差、总变差以及感知损失;均方差包括红色通道误差、绿色通道误差以及蓝色通道误差。
综上所述,本公开所提供的图像的处理装置,获取第一分辨率的待处理图像;根据待处理图像,利用目标神经网络模型,确定目标图像,该目标图像是待处理图像经目标神经网络模型处理后的具有第二分辨率的降噪图像;其中,第二分辨率高于第一分辨率,该目标神经网络模型包括第一预设个数的卷积层和第二预设个数的亚像素上采样模块。因此利用目标神经网络模型在移动终端上实现对图像的处理,同时具有降噪和超分辨率的功能,进而能够提高图像的性能,简化图像处理操作,进一步提升用户体验。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
本公开还提供一种计算机可读存储介质,其上存储有计算机程序指令,该程序指令被处理器执行时实现本公开提供的图像的降噪处理方法的步骤。
图7是根据一示例性实施例示出的又一种图像的处理装置的框图。例如,装置700可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
参照图7,装置700可以包括以下一个或多个组件:处理组件702,存储器704,电力组件706,多媒体组件708,音频组件710,输入/输出(I/O)的接口712,传感器组件714,以及通信组件716。
处理组件702通常控制装置700的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件702可以包括一个或多个处理器720来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件702可以包括一个或多个模块,便于处理组件702和其他组件之间的交互。例如,处理组件702可以包括多媒体模块,以方便多媒体组件708和处理组件702之间的交互。
存储器704被配置为存储各种类型的数据以支持在装置700的操作。这些数据的示例包括用于在装置700上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图像,视频等。存储器704可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电力组件706为装置700的各种组件提供电力。电力组件706可以包括电源管理系统,一个或多个电源,及其他与为装置700生成、管理和分配电力相关联的组件。
多媒体组件708包括在所述装置700和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件708包括一个前置摄像头和/或后置摄像头。当装置700处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件710被配置为输出和/或输入音频信号。例如,音频组件710包括一个麦克风(MIC),当装置700处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器704或经由通信组件716发送。在一些实施例中,音频组件710还包括一个扬声器,用于输出音频信号。
I/O接口712为处理组件702和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件714包括一个或多个传感器,用于为装置700提供各个方面的状态评估。例如,传感器组件714可以检测到装置700的打开/关闭状态,组件的相对定位,例如所述组件为装置700的显示器和小键盘,传感器组件714还可以检测装置700或装置700一个组件的位置改变,用户与装置700接触的存在或不存在,装置700方位或加速/减速和装置700的温度变化。传感器组件714可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件714还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件714还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件716被配置为便于装置700和其他设备之间有线或无线方式的通信。装置700可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件716经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件716还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置700可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述图像的处理方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器704,上述指令可由装置700的处理器720执行以完成上述图像的处理方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
本领域技术人员在考虑说明书及实践本公开后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims (6)

1.一种图像的处理方法,其特征在于,应用于移动终端,所述方法包括:
获取第一分辨率的待处理图像;
通过目标神经网络模型对所述待处理图像进行处理,得到目标图像,所述目标图像为第二分辨率的降噪图像;
其中,所述第二分辨率高于所述第一分辨率,所述目标神经网络模型包括第一预设个数的卷积层和第二预设个数的亚像素上采样模块;
所述方法还包括:
对无噪图像数据进行预处理,以获取目标训练数据;
利用所述目标训练数据,通过随机梯度法进行初始网络模型的训练,以获取所述目标神经网络模型;
所述利用所述目标训练数据,通过随机梯度法进行初始网络模型的训练,以获取所述目标神经网络模型,包括:
将每批次具有预设批大小的所述目标训练数据作为输入,利用预设的损失函数,通过随机梯度法对所述初始网络模型的参数进行训练;
其中,所述损失函数包括均方误差、总变差以及感知损失;所述均方误 差包括红色通道误差、绿色通道误差以及蓝色通道误差,所述损失函数由均方误差、总变差以及感知损失的加权和构成,所述均方误 差由红色通道误差、绿色通道误差以及蓝色通道误差的加权和构成。
2.根据权利要求1所述的方法,其特征在于,所述对无噪图像数据进行预处理,以获取目标训练数据,包括:
通过对所述无噪图像数据进行截取,确定具有预设大小的第一训练数据;
通过对所述第一训练数据进行预设倍数的降采样处理,获取降采样后的第二训练数据;
将预设的压缩噪音添加至所述第二训练数据中,以获取所述目标训练数据。
3.一种图像的处理装置,其特征在于,应用于移动终端,所述装置包括:
获取模块,被配置为获取第一分辨率的待处理图像;
降噪模块,被配置为通过目标神经网络模型对所述待处理图像进行处理,得到目标图像,所述目标图像为第二分辨率的降噪图像;
其中,所述第二分辨率高于所述第一分辨率,所述目标神经网络模型包括第一预设个数的卷积层和第二预设个数的亚像素上采样模块;
所述装置还包括:
预处理模块,被配置为对无噪图像数据进行预处理,以获取目标训练数据;
网络训练模块,被配置为利用所述目标训练数据,通过随机梯度法进行初始网络模型的训练,以获取所述目标神经网络模型;
所述网络训练模块,被配置为:
将每批次具有预设批大小的所述目标训练数据作为输入,利用预设的损失函数,通过随机梯度法对所述初始网络模型的参数进行训练;
其中,所述损失函数包括均方误差、总变差以及感知损失;所述均方误 差包括红色通道误差、绿色通道误差以及蓝色通道误差,所述损失函数由均方误差、总变差以及感知损失的加权和构成,所述均方误 差由红色通道误差、绿色通道误差以及蓝色通道误差的加权和构成。
4.根据权利要求3所述的装置,其特征在于,所述预处理模块,包括:
图像截取子模块,被配置为通过对所述无噪图像数据进行截取,确定具有预设大小的第一训练数据;
降采样子模块,被配置为通过对所述第一训练数据进行预设倍数的降采样处理,获取降采样后的第二训练数据;
噪音添加子模块,被配置为将预设的压缩噪音添加至所述第二训练数据中,以获取所述目标训练数据。
5.一种图像的处理装置,其特征在于,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:
获取第一分辨率的待处理图像;
通过目标神经网络模型对所述待处理图像进行处理,得到目标图像,所述目标图像为第二分辨率的降噪图像;
其中,所述第二分辨率高于所述第一分辨率,所述目标神经网络模型包括第一预设个数的卷积层和第二预设个数的亚像素上采样模块;
所述处理器还被配置为:
对无噪图像数据进行预处理,以获取目标训练数据;
利用所述目标训练数据,通过随机梯度法进行初始网络模型的训练,以获取所述目标神经网络模型;
所述利用所述目标训练数据,通过随机梯度法进行初始网络模型的训练,以获取所述目标神经网络模型,包括:
将每批次具有预设批大小的所述目标训练数据作为输入,利用预设的损失函数,通过随机梯度法对所述初始网络模型的参数进行训练;
其中,所述损失函数包括均方误差、总变差以及感知损失;所述均方误 差包括红色通道误差、绿色通道误差以及蓝色通道误差,所述损失函数由均方误差、总变差以及感知损失的加权和构成,所述均方误 差由红色通道误差、绿色通道误差以及蓝色通道误差的加权和构成。
6.一种计算机可读存储介质,其上存储有计算机程序指令,其特征在于,所述计算机程序指令被处理器执行时实现权利要求1 ~ 2 中任一项所述方法的步骤。
CN201910684108.XA 2019-07-26 2019-07-26 图像的处理方法、装置及存储介质 Active CN110428378B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201910684108.XA CN110428378B (zh) 2019-07-26 2019-07-26 图像的处理方法、装置及存储介质
US16/687,645 US11189014B2 (en) 2019-07-26 2019-11-18 Method and device for processing image, and storage medium
EP19212587.0A EP3770847B1 (en) 2019-07-26 2019-11-29 Method and device for processing image

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910684108.XA CN110428378B (zh) 2019-07-26 2019-07-26 图像的处理方法、装置及存储介质

Publications (2)

Publication Number Publication Date
CN110428378A CN110428378A (zh) 2019-11-08
CN110428378B true CN110428378B (zh) 2022-02-08

Family

ID=68412761

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910684108.XA Active CN110428378B (zh) 2019-07-26 2019-07-26 图像的处理方法、装置及存储介质

Country Status (3)

Country Link
US (1) US11189014B2 (zh)
EP (1) EP3770847B1 (zh)
CN (1) CN110428378B (zh)

Families Citing this family (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11080833B2 (en) * 2019-11-22 2021-08-03 Adobe Inc. Image manipulation using deep learning techniques in a patch matching operation
US11508092B2 (en) * 2019-12-16 2022-11-22 X Development Llc Edge-based crop yield prediction
CN110992360B (zh) * 2019-12-24 2024-01-23 北京安兔兔科技有限公司 设备性能测试方法、装置及电子设备
CN113052768B (zh) * 2019-12-27 2024-03-19 武汉Tcl集团工业研究院有限公司 一种处理图像的方法、终端及计算机可读存储介质
CN111192255B (zh) * 2019-12-30 2024-04-26 上海联影智能医疗科技有限公司 指标检测方法、计算机设备和存储介质
CN111583145B (zh) * 2020-04-30 2023-11-28 深圳市商汤智能传感科技有限公司 图像降噪方法及装置、电子设备和存储介质
CN111583142B (zh) * 2020-04-30 2023-11-28 深圳市商汤智能传感科技有限公司 图像降噪方法及装置、电子设备和存储介质
WO2022011571A1 (zh) * 2020-07-14 2022-01-20 Oppo广东移动通信有限公司 视频处理方法、装置、设备、解码器、系统及存储介质
CN112001940B (zh) * 2020-08-21 2023-04-07 Oppo(重庆)智能科技有限公司 图像处理方法及装置、终端及可读存储介质
CN111951168B (zh) * 2020-08-25 2023-04-07 Oppo(重庆)智能科技有限公司 图像处理方法、图像处理装置、存储介质与电子设备
CN111932463B (zh) * 2020-08-26 2023-05-30 腾讯科技(深圳)有限公司 图像处理方法、装置、设备及存储介质
CN112115822B (zh) * 2020-09-04 2022-03-15 西北工业大学 一种水下移动目标智能融合感知方法
CN112184568A (zh) * 2020-09-04 2021-01-05 北京爱芯科技有限公司 图像处理方法、装置、电子设备及可读存储介质
CN112365398B (zh) * 2020-09-11 2024-04-05 成都旷视金智科技有限公司 超分辨率网络训练方法、数字变焦方法、装置及电子设备
CN112784857B (zh) * 2021-01-29 2022-11-04 北京三快在线科技有限公司 一种模型训练以及图像处理方法及装置
CN112907733A (zh) * 2021-02-23 2021-06-04 北京华清易通科技有限公司 重建三维模型的方法及装置和三维模型采集及重建系统
CN112861997A (zh) * 2021-03-15 2021-05-28 北京小米移动软件有限公司 信息的处理方法、装置、存储介质和电子设备
CN112819731B (zh) * 2021-03-19 2021-11-05 广东众聚人工智能科技有限公司 灰度图像增强方法、装置、计算机设备及存储介质
JP2022161004A (ja) * 2021-04-07 2022-10-20 キヤノンメディカルシステムズ株式会社 医用データ処理方法、モデル生成方法、医用データ処理装置、および医用データ処理プログラム
CN113222813B (zh) * 2021-04-19 2024-02-09 西安电子科技大学 图像超分辨率重建方法、装置、电子设备及存储介质
CN113177451B (zh) * 2021-04-21 2024-01-12 北京百度网讯科技有限公司 图像处理模型的训练方法、装置、电子设备及存储介质
CN113066014B (zh) * 2021-05-19 2022-09-02 云南电网有限责任公司电力科学研究院 一种图像超分辨方法及装置
CN113538235B (zh) * 2021-06-30 2024-01-09 北京百度网讯科技有限公司 图像处理模型的训练方法、装置、电子设备及存储介质
CN113554550B (zh) * 2021-06-30 2023-08-04 北京百度网讯科技有限公司 图像处理模型的训练方法、装置、电子设备及存储介质
CN113596471B (zh) * 2021-07-26 2023-09-12 北京市商汤科技开发有限公司 图像处理方法及装置、电子设备和存储介质
CN113610731B (zh) * 2021-08-06 2023-08-08 北京百度网讯科技有限公司 用于生成画质提升模型的方法、装置及计算机程序产品
CN113706583B (zh) * 2021-09-01 2024-03-22 上海联影医疗科技股份有限公司 图像处理方法、装置、计算机设备和存储介质
CN113920013B (zh) * 2021-10-14 2023-06-16 中国科学院深圳先进技术研究院 一种基于超分辨率的小图像多目标检测方法
CN114330576A (zh) * 2021-12-30 2022-04-12 北京百度网讯科技有限公司 模型处理方法、装置、图像识别方法及装置
JP2023103116A (ja) * 2022-01-13 2023-07-26 Tvs Regza株式会社 画像処理回路
WO2024055229A1 (zh) * 2022-09-15 2024-03-21 华为技术有限公司 图像处理方法、装置、系统及智能设备
CN115761448B (zh) * 2022-12-02 2024-03-01 美的集团(上海)有限公司 神经网络的训练方法、训练装置和可读存储介质
CN116433501B (zh) * 2023-02-08 2024-01-09 阿里巴巴(中国)有限公司 图像处理方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103020908A (zh) * 2012-12-05 2013-04-03 华为技术有限公司 图像降噪的方法和设备
WO2016132147A1 (en) * 2015-02-19 2016-08-25 Magic Pony Technology Limited Enhancement of visual data
CN108550115A (zh) * 2018-04-25 2018-09-18 中国矿业大学 一种图像超分辨率重建方法
CN109064428A (zh) * 2018-08-01 2018-12-21 Oppo广东移动通信有限公司 一种图像去噪处理方法、终端设备及计算机可读存储介质
CN109360154A (zh) * 2018-10-29 2019-02-19 厦门美图之家科技有限公司 一种卷积神经网络生成方法及图像的超分辨率方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109416830A (zh) * 2016-07-08 2019-03-01 深圳市大疆创新科技有限公司 用于图像处理的系统和方法
WO2018053340A1 (en) * 2016-09-15 2018-03-22 Twitter, Inc. Super resolution using a generative adversarial network
US11354577B2 (en) * 2017-03-15 2022-06-07 Samsung Electronics Co., Ltd System and method for designing efficient super resolution deep convolutional neural networks by cascade network training, cascade network trimming, and dilated convolutions
JP7417640B2 (ja) * 2019-06-18 2024-01-18 ホアウェイ・テクノロジーズ・カンパニー・リミテッド リアルタイム映像超高解像度

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103020908A (zh) * 2012-12-05 2013-04-03 华为技术有限公司 图像降噪的方法和设备
WO2016132147A1 (en) * 2015-02-19 2016-08-25 Magic Pony Technology Limited Enhancement of visual data
CN108550115A (zh) * 2018-04-25 2018-09-18 中国矿业大学 一种图像超分辨率重建方法
CN109064428A (zh) * 2018-08-01 2018-12-21 Oppo广东移动通信有限公司 一种图像去噪处理方法、终端设备及计算机可读存储介质
CN109360154A (zh) * 2018-10-29 2019-02-19 厦门美图之家科技有限公司 一种卷积神经网络生成方法及图像的超分辨率方法

Also Published As

Publication number Publication date
US11189014B2 (en) 2021-11-30
EP3770847B1 (en) 2024-07-03
EP3770847A1 (en) 2021-01-27
CN110428378A (zh) 2019-11-08
US20210027426A1 (en) 2021-01-28

Similar Documents

Publication Publication Date Title
CN110428378B (zh) 图像的处理方法、装置及存储介质
CN109345485B (zh) 一种图像增强方法、装置、电子设备及存储介质
CN109658401B (zh) 图像处理方法及装置、电子设备和存储介质
CN109544560B (zh) 图像处理方法及装置、电子设备和存储介质
US11580327B2 (en) Image denoising model training method, imaging denoising method, devices and storage medium
CN109859144B (zh) 图像处理方法及装置、电子设备和存储介质
US10963982B2 (en) Video watermark generation method and device, and terminal
CN107798654B (zh) 图像磨皮方法及装置、存储介质
CN104050645B (zh) 图像处理方法及装置
EP3816927B1 (en) Method and apparatus for training image processing models, and storage medium
CN111340731A (zh) 图像处理方法及装置、电子设备和存储介质
CN115205164B (zh) 图像处理模型的训练方法、视频处理方法、装置及设备
CN112288657B (zh) 图像处理方法、图像处理装置及存储介质
CN113660531A (zh) 视频处理方法及装置、电子设备和存储介质
CN113436062B (zh) 图像风格迁移方法、装置、电子设备及存储介质
CN111507131A (zh) 活体检测方法及装置、电子设备和存储介质
CN112188095B (zh) 拍照方法、拍照装置及存储介质
CN115552415A (zh) 图像处理方法、装置、电子设备及存储介质
CN115641269A (zh) 一种图像修补方法、装置及可读存储介质
CN113592733A (zh) 图像处理方法、装置、存储介质及电子设备
CN112200745A (zh) 遥感影像的处理方法及装置、电子设备和存储介质
CN113658038B (zh) 基于空间误差自适应的网络训练方法及装置
CN111915536B (zh) 一种提高图像清晰度的方法、装置及介质
CN112950465A (zh) 视频超分处理方法、视频超分处理装置及存储介质
CN116862778A (zh) 图像修复方法、装置、存储介质及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant