CN112634160A - 拍照方法及装置、终端、存储介质 - Google Patents
拍照方法及装置、终端、存储介质 Download PDFInfo
- Publication number
- CN112634160A CN112634160A CN202011563021.6A CN202011563021A CN112634160A CN 112634160 A CN112634160 A CN 112634160A CN 202011563021 A CN202011563021 A CN 202011563021A CN 112634160 A CN112634160 A CN 112634160A
- Authority
- CN
- China
- Prior art keywords
- image
- images
- fusion
- frame
- region
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 47
- 230000004927 fusion Effects 0.000 claims abstract description 136
- 238000012545 processing Methods 0.000 claims abstract description 38
- 230000008030 elimination Effects 0.000 claims abstract description 10
- 238000003379 elimination reaction Methods 0.000 claims abstract description 10
- 239000011159 matrix material Substances 0.000 claims description 39
- 238000010606 normalization Methods 0.000 claims description 30
- 230000004913 activation Effects 0.000 claims description 19
- 238000003709 image segmentation Methods 0.000 claims description 17
- 230000000694 effects Effects 0.000 abstract description 5
- 230000010354 integration Effects 0.000 abstract description 4
- 238000004891 communication Methods 0.000 description 10
- 238000012549 training Methods 0.000 description 10
- 238000013135 deep learning Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 9
- 230000003287 optical effect Effects 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 6
- 230000009467 reduction Effects 0.000 description 6
- 230000005236 sound signal Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000012706 support-vector machine Methods 0.000 description 3
- 230000001133 acceleration Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000002708 enhancing effect Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000001788 irregular Effects 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 238000011176 pooling Methods 0.000 description 2
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000019771 cognition Effects 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/80—Camera processing pipelines; Components thereof
- H04N23/81—Camera processing pipelines; Components thereof for suppressing or minimising disturbance in the image signal generation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/70—Denoising; Smoothing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/10—Machine learning using kernel methods, e.g. support vector machines [SVM]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4053—Scaling of whole images or parts thereof, e.g. expanding or contracting based on super-resolution, i.e. the output image resolution being higher than the sensor resolution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/50—Image enhancement or restoration using two or more images, e.g. averaging or subtraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/73—Deblurring; Sharpening
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/90—Dynamic range modification of images or parts thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/80—Camera processing pipelines; Components thereof
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N23/00—Cameras or camera modules comprising electronic image sensors; Control thereof
- H04N23/95—Computational photography systems, e.g. light-field imaging systems
- H04N23/951—Computational photography systems, e.g. light-field imaging systems by using two or more images to influence resolution, frame rate or aspect ratio
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/14—Picture signal circuitry for video frequency region
- H04N5/21—Circuitry for suppressing or minimising disturbance, e.g. moiré or halo
- H04N5/211—Ghost signal cancellation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20212—Image combination
- G06T2207/20221—Image fusion; Image merging
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Medical Informatics (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Image Processing (AREA)
- Studio Devices (AREA)
- Image Analysis (AREA)
Abstract
本公开是关于一种拍照方法及装置、终端、存储介质。该方法包括:在检测到拍照指令时,连续采集多帧图像;基于所述多帧图像,获得去除鬼影后的多帧图像;将所述去除鬼影后的多帧图像输入图像融合模型,获得融合图像;其中,所述融合图像的噪声低于所述多帧图像中任一帧图像的噪声,且所述融合图像的分辨率高于所述多帧图像中任一帧图像的分辨率;对所述融合图像做图像增强处理,获得目标图像并输出。该方法具有集成度高且处理效果好的特点。
Description
技术领域
本公开涉及电子设备技术领域,尤其涉及一种拍照方法及装置、终端、存储介质。
背景技术
手机相机系统发展到今天,为了满足用户不同的拍照需求,已经从最初的单摄像头,进化到了现在的4个摄像头甚至5个摄摄像头。超分算法在光学变焦的基础上,可以实现连续变焦和大倍率的数字变焦。图1是一种光学变焦镜头的示例图,该镜头可以做到5倍光学变焦,配合超分算法,就可以获得最高50倍的连续数字变焦,因而超分算法对于提升终端的变焦能力非常重要。
超分算法可以简单的分为单帧超分算法和多帧超分算法。目前手机变焦系统中广泛应用的是多帧超分算法。就是说,按下拍照按钮后,手机会连续拍摄多帧图像,由算法完成多帧图像融合,得到一张高画质的图像输出。多帧超分算法在噪声和解析力方面,相比单帧超分算法都有明显优势。
发明内容
本公开提供一种拍照方法及装置、终端、存储介质。
根据本公开实施例的第一方面,提供一种拍照方法,包括:
在检测到拍照指令时,连续采集多帧图像;
基于所述多帧图像,获得去除鬼影后的多帧图像;
将所述去除鬼影后的多帧图像输入图像融合模型,获得融合图像;其中,所述融合图像的噪声低于所述多帧图像中任一帧图像的噪声,且所述融合图像的分辨率高于所述多帧图像中任一帧图像的分辨率;
对所述融合图像做图像增强处理,获得目标图像并输出。
可选的,所述图像融合模型包括多个超分辨率模型;其中,所述超分辨率模型与图像类型一一对应;
所述将所述去除鬼影后的多帧图像输入图像融合模型,获得融合图像,包括:
对所述去除鬼影后的多帧图像中的每个单帧图像进行图像分割,得到多个区域图像;
将所述多个区域图像中属于同一图像类型的多个区域图像,输入所述同一图像类型对应的超分辨率模型中,获得所述同一图像类型的区域融合图像;其中,所述区域融合图像的噪声低于所述同一图像类型的多个区域图像中任一区域图像的噪声,且所述区域融合图像的分辨率高于所述同一图像类型的多个区域图像中任一区域图像的分辨率;
将不同图像类型的区域融合图像进行融合,获得所述融合图像。
可选的,所述对所述去除鬼影后的多帧图像中的每个单帧图像进行图像分割,得到多个区域图像,包括:
针对所述去除鬼影后的多帧图像中的每个单帧图像,判断所述单帧图像的每个像素的类型;
基于每个所述像素的类型确定所述像素所属的图像类型;
将属于同一单帧图像中同一图像类型的像素划分到同一区域图像中,得到多个所述区域图像。
可选的,所述将不同图像类型的区域融合图像进行融合,获得所述融合图像,包括:
基于不同类型区域融合图像对应的区域图像中像素的权重,对所述不同图像类型的区域融合图像进行融合,获得所述融合图像。
可选的,所述超分辨率模型包括:多个模块,每个模块包括:卷积层,归一化层和激活层;
所述将所述多个区域图像中属于同一图像类型的多个区域图像,输入所述同一图像类型对应的超分辨率模型中,获得所述同一图像类型的区域融合图像,包括:
将所述多个区域图像中属于同一图像类型的多个区域图像,输入所述同一图像类型对应的所述超分辨率模型中的卷积层,获得卷积结果;
将所述卷积结果输入归一化层,获得归一化结果;
基于所述归一化结果和所述激活层,获得所述同一图像类型的区域融合图像;其中,所述激活层的输入为所述归一化结果。
可选的,所述将所述多个区域图像中属于同一图像类型的多个区域图像,输入所述同一图像类型对应的所述超分辨率模型中的卷积层,获得卷积结果,包括:
将所述同一图像类型对应的超分辨率模型中所述卷积层的M个P行、L列的卷积核,转化为M行、P×L列的二维卷积矩阵;其中,所述M、P和L均为正整数;
基于所述卷积核的尺寸、预设卷积滑动步长、预设填充尺寸以及所述多个区域图像,获得多个二维待卷积的图像矩阵;其中,所述二维待卷积的图像矩阵中的每列共有P×L个数据,一列数据为所述卷积核在填充后的一个区域图像上执行一次卷积操作时待截取的数据,所述二维待卷积的图像矩阵的列数为:所述填充后的一个区域图像支持的最大卷积次数;
将所述二维卷积矩阵和每个所述二维待卷积的图像矩阵相乘,获得所述卷积结果。
可选的,所述图像类型包括以下至少之一:
纹理特征的图像;
颜色特征的图像;
形状特征的图像;
空间关系的图像。
可选的,所述基于所述多帧图像,获得去除鬼影后的多帧图像,包括:
将所述多帧图像对齐;
将对齐后的多帧图像进行去鬼影处理,获得所述去鬼影后的多帧图像。
可选的,所述对所述融合图像做图像增强处理,获得目标图像并输出,包括:
对所述融合图像做锐化处理,获得所述目标图像并输出。
根据本公开实施例的第二方面,提供一种拍照装置,包括:
采集模块,配置为在检测到拍照指令时,连续采集多帧图像;
去除模块,配置为基于所述多帧图像,获得去除鬼影后的多帧图像;
融合模块,配置为将所述去除鬼影后的多帧图像输入图像融合模型,获得融合图像;其中,所述融合图像的噪声低于所述多帧图像中任一帧图像的噪声,且所述融合图像的分辨率高于所述多帧图像中任一帧图像的分辨率;
增强模块,配置为对所述融合图像做图像增强处理,获得目标图像并输出。
可选的,所述图像融合模型包括多个超分辨率模型;其中,所述超分辨率模型与图像类型一一对应;
所述融合模块,具体配置为对所述去除鬼影后的多帧图像中的每个单帧图像进行图像分割,得到多个区域图像;将所述多个区域图像中属于同一图像类型的多个区域图像,输入所述同一图像类型对应的超分辨率模型中,获得所述同一图像类型的区域融合图像;其中,所述区域融合图像的噪声低于所述同一图像类型的多个区域图像中任一区域图像的噪声,且所述区域融合图像的分辨率高于所述同一图像类型的多个区域图像中任一区域图像的分辨率;将不同图像类型的区域融合图像进行融合,获得所述融合图像。
可选的,所述融合模块,具体配置为针对所述去除鬼影后的多帧图像中的每个单帧图像,判断所述单帧图像的每个像素的类型;基于每个所述像素的类型确定所述像素所属的图像类型;将属于同一单帧图像中同一图像类型的像素划分到同一区域图像中,得到多个所述区域图像。
可选的,所述融合模块,具体配置为基于不同类型区域融合图像对应的区域图像中像素的权重,对所述不同图像类型的区域融合图像进行融合,获得所述融合图像。
可选的,所述超分辨率模型包括:多个模块,每个模块包括:卷积层,归一化层和激活层;
所述融合模块,具体配置为将所述多个区域图像中属于同一图像类型的多个区域图像,输入所述同一图像类型对应的所述超分辨率模型中的卷积层,获得卷积结果;将所述卷积结果输入归一化层,获得归一化结果;基于所述归一化结果和所述激活层,获得所述同一图像类型的区域融合图像;其中,所述激活层的输入为所述归一化结果。
可选的,所述融合模块,具体配置为将所述同一图像类型对应的超分辨率模型中所述卷积层的M个P行、L列的卷积核,转化为M行、P×L列的二维卷积矩阵;其中,所述M、P和L均为正整数;基于所述卷积核的尺寸、预设卷积滑动步长、预设填充尺寸以及所述多个区域图像,获得多个二维待卷积的图像矩阵;其中,所述二维待卷积的图像矩阵中的每列共有P×L个数据,一列数据为所述卷积核在一个区域图像上执行一次卷积操作时待截取的数据,所述二维待卷积的图像矩阵的列数为:一个区域图像支持的最大卷积次数;将所述二维卷积矩阵和每个所述二维待卷积的图像矩阵相乘,获得所述卷积结果。
可选的,所述图像类型包括以下至少之一:
纹理特征的图像;
颜色特征的图像;
形状特征的图像;
空间关系的图像。
可选的,所述去除模块,具体配置为将所述多帧图像对齐;将对齐后的多帧图像进行去鬼影处理,获得所述去鬼影后的多帧图像。
可选的,所述增强模块,具体配置为对所述融合图像做锐化处理,获得所述目标图像并输出。
根据本公开实施例的第三方面,提供一种终端,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为执行如上述第一方面中所述的拍照方法。
根据本公开实施例的第四方面,提供一种存储介质,包括:
当所述存储介质中的指令由终端的处理器执行时,使得终端能够执行如上述第一方面中所述的拍照方法。
本公开的实施例提供的技术方案可以包括以下有益效果:
在本公开的实施例中,采用多帧超分算法,将去除鬼影后的多帧图像输入预训练好的图像融合模型,即可同步获得噪声降低且分辨率提升的融合图像,并进一步对融合图像做图像增强处理获得画质提升的目标图像并输出,而无需通过独立的降噪模块或超分模块来获得超分图像,具有集成度高且处理效果好的特点。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
图1是一种光学变焦镜头的示例图。
图2是本公开实施例示出的一种拍照方法流程图。
图3为本公开的一种鬼影示例图。
图4是本公开的一种文字示例图。
图5是本公开的一种卷积示例图。
图6是本公开一种应用于拍照中的超分算法流程示例图。
图7是根据一示例性实施例示出的一种拍照装置图。
图8是本公开实施例示出的一种终端的框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
图2是本公开实施例示出的一种拍照方法流程图,如图2所示,应用于终端中的拍照方法包括以下步骤:
S11、在检测到拍照指令时,连续采集多帧图像;
S12、基于所述多帧图像,获得去除鬼影后的多帧图像;
S13、将所述去除鬼影后的多帧图像输入图像融合模型,获得融合图像;其中,所述融合图像的噪声低于所述多帧图像中任一帧图像的噪声,且所述融合图像的分辨率高于所述多帧图像中任一帧图像的分辨率;
S14、对所述融合图像做图像增强处理,获得目标图像并输出。
在本公开的实施例中,终端包括:智能手机、相机、平板电脑或者可穿戴式电子设备等。终端中设置有图像采集组件,移动终端通过图像采集组件来实现拍照。以终端是手机为例,图像采集组件包括手机中的前置摄像头和后置摄像头。
在步骤S11中,终端在检测到拍照指令时,连续采集多帧图像。该多帧图像可以是对同一拍摄场景采集多帧不同曝光程度的低动态范围图像,例如短曝光、正常曝光和长曝光三帧图像。
在步骤S12中,终端基于检测的多帧图像,获得去除鬼影后的多帧图像。由于手持设备在拍摄过程中难免出现抖动或物体本身移动等原因而引起图像偏移或扭曲,使得采集到的图像上有残留影像,即鬼影。图3为本公开的一种鬼影示例图,如图3所示,图像左侧的玻璃处,可能因为拍摄过程中的手抖,使得画面上出现鬼影。
对此,本公开会对采集的多帧图像去除鬼影。在本公开的一种实施例中,为了提升去鬼影的效果,可事先将采集的多帧图像对齐后再去除鬼影。多帧对齐的难点在于,其精度需要在亚像素级别,而且需要支持极暗光。
在一种实施例中,步骤S12包括:
将所述多帧图像对齐;
将对齐后的多帧图像进行去鬼影处理,获得所述去鬼影后的多帧图像。
在该实施例中,在将多帧图像对齐时,可基于中值阈值位图(median thresholdbitmaps,MTB)方法将多帧图像对齐。此外,还可将多帧图像中的任一帧图像作为基准图像,再根据基准图像将其余非基准图像向基准图像对齐,例如通过分别提取基准图像和非基准图像的特征点,基于特征点将非基准图像和基准图像进行配准从而实现对齐。
在步骤S13中,终端获得去除鬼影后的多帧图像后,会将去除鬼影后的多帧图像输入图像融合模型,特别的是,该图像融合模型同时具备降噪和超分功能,从而使得融合后的图像相对于去除鬼影后的多帧图像中的任一帧图像的噪声要低,且分辨率要高。
在本公开的一种实施例中,图像融合模型可以是基于支持向量机训练获得的模型。在本公开的另一种实施例中,所述图像融合模型为采用深度学习网络训练获得的模型。
需要说明的是,在本公开的实施例中,本公开并不局限于使用支持向量机或深度学习网络训练获得图像融合模型。此外,在训练图像融合模型时,训练集中的输入图像是噪声多的低分辨率图像,而标签图像(GT图像)是噪声低的高分辨率图像。用(x,y)来表示一对训练数据,图像融合模型就是通过支持向量机网络或深度学习网络等来拟合x和y之间的对应关系y=f(x),函数f(x)同时具备降噪和超分能力,其中,x代表多帧输入图像,y代表输出图像。
在步骤14中,终端在获得噪声降低且分辨率提升的融合图像后,会对融合图像做图像增强处理,以获得画质进一步提升的目标图像并输出。
在本公开的实施例中,输出的目标图像即基于拍照指令最终呈现给用户的图像。
在一种实施例中,步骤S14包括:
对所述融合图像做锐化处理,获得所述目标图像并输出。
在该实施例中,图像增强处理包括锐化处理,通过锐化处理可以补偿图像的轮廓,增强图像的边缘及灰度跳变的部分,使图像变得更清晰,因而获得的目标图像画质更优,能提升用户的体验。
然而,在本公开的实施例中,图像增强处理并不限定于锐化处理,还可以是锐化处理与其他增强处理方式的结合,也可以是其他图像增强方式中的至少之一:对比度拉升、色彩校正等。
在超分算法中,噪声、细节和瑕疵是评价超分画质的主要考虑因素。超分算法的目标就是从细节、噪声和瑕疵三个方面来改善画质。本公开中,采用多帧超分算法,将去除鬼影后的多帧图像输入预训练好的图像融合模型,即可同步获得噪声降低且分辨率提升的融合图像,并进一步对融合图像做图像增强处理获得画质提升的目标图像并输出,而无需通过独立的降噪模块或超分模块来获得超分图像,具有集成度高且处理效果好的特点。
在一种实施例中,所述图像融合模型包括多个超分辨率模型;其中,所述超分辨率模型与图像类型一一对应;步骤S13包括:
对所述去除鬼影后的多帧图像中的每个单帧图像进行图像分割,得到多个区域图像;
将所述多个区域图像中属于同一图像类型的多个区域图像,输入所述同一图像类型对应的超分辨率模型中,获得所述同一图像类型的区域融合图像;其中,所述区域融合图像的噪声低于所述同一图像类型的多个区域图像中任一区域图像的噪声,且所述区域融合图像的分辨率高于所述同一图像类型的多个区域图像中任一区域图像的分辨率;
将不同图像类型的区域融合图像进行融合,获得所述融合图像。
在本公开的实施例中,由于不同类型的图像给人的主观感受是不一样的,因而本公开针对不同的图像类型来训练超分辨率模型,图像融合模型中包括不同图像类型分别对应的超分辨率模型,该超分辨率模型可以是基于深度学习网络训练获得的模型。
在一种实施例中,所述图像类型包括以下至少之一:
纹理特征的图像;
颜色特征的图像;
形状特征的图像;
空间关系的图像。
例如,对于路面、树木纹路、草地等属于纹理随机性更强的区域,而其整体的结构性可能相对弱一些,模型如果能保留更多的噪声反而能给人一种细节更强的“主观错觉”;而对于文字、建筑和人脸等,属于具有特定空间关系的图像,人可能关注于高层次的语义认知,而对纹理等关注可能较少,即更加关注于整体结构,因而模型需要有更强的降噪和更好的结构性细节。图4是本公开的一种文字示例图,人可能关注于每个文字的结构特征。
再例如,天空是蓝色的、树是绿色或黄色的、河流是接近透明色、人的肤色是黄色或黑色等,基于特定的对象,有其更倾向的颜色,因而模型可能更需要关注颜色特征。或者,再例如,太阳是圆形的,月亮是镰刀形状或圆形的,基于特定的对象,有其更倾向的形状,因而模型可能更需要关注形状特征。
因此,本公开针对不同类型的图像,有与图像类型对应的超分辨率模型。需要说明的是,本公开在训练图像融合模型时,可选取噪声大且分辨率低的大量同样以纹理特性为主的图像作为输入,而将对应的噪声小且分辨率高的图像作为标签图像来训练超分辨率模型。同理,也可分别训练以结构特性为主、颜色特征为主或空间关系为主的超分辨率模型,本公开不再详述。
然而,通常采集到的图像并不是单一对象的图像,例如,采集的画面中有建筑、有树木或天空等。不同的对象具有不同的特征,如前所述的,建筑可能更关注于整体结构,树木更关注于纹理,天空更关注于颜色等,因而本公开可事先分别对去除鬼影后的多帧图像中的单帧图像做图像分割,以获得去除鬼影后的单帧图像中包括不同类型的区域图像。例如,通过图像分割将上述图像分为建筑区域、树木区域和天空区域。
需要说明的是,因为多帧图像是连续采集的,画面内容的相似度较高,因而通常对不同的去除鬼影后的单帧图像做图像分割后,均能分割出具有同样类型的图像区域。当然,也可能存在部分去除鬼影后的单帧图像做图像分割后缺失部分图像类型的图像区域,本公开在有缺失时,即忽略该单帧图像中该图像类型的图像区域。
在本公开的一种实施例中,在做图像分割时,可以是基于预训练好的神经网络模型获得图像分割结果,图像分割结果包括分割后的区域图像,以及该区域图像对应的图像类型。
在另一种实施例中,所述对所述去除鬼影后的多帧图像中的每个单帧图像进行图像分割,得到多个区域图像,包括:
针对所述去除鬼影后的多帧图像中的每个单帧图像,判断所述单帧图像的每个像素的类型;
基于每个所述像素的类型确定所述像素所属的图像类型;
将属于同一单帧图像中同一图像类型的像素划分到同一区域图像中,得到多个所述区域图像。
在该实施例中,可针对去除鬼影后的单帧图像统计每个像素的类型,例如,采用区域生长法,从单个像素出发,将同一单帧图像中属于同一图像类型的像素逐步合并到同一区域,从而得到多个分割后的区域图像。在获得去除鬼影后的单帧图像中包括的不同图像类型的区域图像后,即可将不同多帧图像中属于同一突显类型的多帧区域图像,输入同一图像类型对应的超分辨率模型从而获得同一图像类型的区域融合图像。例如,当前同一图像类型的多帧区域图像是纹理类型时,则可将该多帧区域图像输入纹理类型对应的超分辨率模型,从而获得保留了更多的纹理细节而其余噪声降低且分辨率提升的区域融合图像。
在获得不同类型的区域融合图像后,即可基于图像分割时各类型图像的区域位置信息,将区域融合图像拼接成完整的融合图像。由于各区域融合图像的噪声降低其分辨率有提升,因而获得的融合图像也是噪声降低且分辨率提升的图像。
在一种实施例中,所述将不同图像类型的区域融合图像进行融合,获得所述融合图像,包括:
基于不同类型区域融合图像对应的区域图像中像素的权重,对所述不同图像类型的区域融合图像进行融合,获得所述融合图像。
在本公开的实施例中,在基于各类型图像的区域位置信息,将区域融合图像拼接成完成的融合图像时,可基于不同类型区域图像的权重,将各区域融合图像融合为融合图像。例如,若纹理特征的区域图像位于图像的中心区域,因而可将该纹理特征的区域图像内各像素的权重设置得较大,以在融合图像中突出中心区域。
需要说明的是,在本公开的实施例中,图像融合模型中的输入图像,也可以是来自于一幅图像中的局部区域图像,该局部区域图像也是通过对训练图像做图像分割后获得,本公开不再详述。
若采用深度学习网络来训练模型,由于卷积神经网络的特殊性,相关技术中都是将模型对整幅图像做操作,而不关注于图像中不同区域的类型特点,因而获得的超分图像的画质不能得到较好的提升。相对的,本公开考虑到了拍照场景的复杂性,训练了针对不同图像类型的超分辨率模型,然后对当前去除鬼影后的各单帧图像做图像分割后,再针对区域图像输入类型对应的超分辨率模型获得区域融合结果,能极大提升超分图像的画质。此外,本公开分图像区域输入对应的超分辨率模型,而无需将模型对整幅图像做操作,能极大的减少计算量。
在一种实施例中,所述超分辨率模型包括:多个模块,每个模块包括:卷积层,归一化层和激活层;
所述将所述多个区域图像中属于同一图像类型的多个区域图像,输入所述同一图像类型对应的超分辨率模型中,获得所述同一图像类型的区域融合图像,包括:
将所述多个区域图像中属于同一图像类型的多个区域图像,输入所述同一图像类型对应的所述超分辨率模型中的卷积层,获得卷积结果;
将所述卷积结果输入归一化层,获得归一化结果;
基于所述归一化结果和所述激活层,获得所述同一图像类型的区域融合图像;其中,所述激活层的输入为所述归一化结果。
如前所述的,超分辨率模型可以为采用深度学习网络训练获得的模型。在本公开的实施例中,超分辨率模型包括多个模块,例如,可包括16个模块,每个模块包括卷积层,归一化层和激活层。在使用超分辨率模型时,可将同一图像类型的多个区域图像输入对应的超分辨率模型的各模块中的卷积层,获得卷积结果,然后将卷积结果通过归一化层获得数值在预定数值区间的归一化结果以便于后续的计算。进一步地,在基于归一化结果和激活层,获得同一图像类型的区域融合图像时,可将归一化结果输入到激活层,以提升模型的表达能力,然后再将各模块中激活层的输出输入到池化层,池化层的输出作为全连接层的输入从而获得同一图像类型的区域融合图像。
如前所述的,本公开分图像区域输入对应的超分辨率模型,而无需将模型对整幅图像做操作,能极大的减少计算量。具体的,每一个超分辨率模型只在与其类型对应的区域图像上做卷积操作,而其他区域不做卷积操作,这样的计算量与模型的个数无关,因而能大大节省计算量。
在一种实施例中,所述将所述多个区域图像中属于同一图像类型的多个区域图像,输入所述同一图像类型对应的所述超分辨率模型中的卷积层,获得卷积结果,包括:
将所述同一图像类型对应的超分辨率模型中所述卷积层的M个P行、L列的卷积核,转化为M行、P×L列的二维卷积矩阵;其中,所述M、P和L均为正整数;
基于所述卷积核的尺寸、预设卷积滑动步长以及所述多个区域图像,获得多个二维待卷积的图像矩阵;其中,所述二维待卷积的图像矩阵中的每列共有P*L个数据,一列数据为所述卷积核在一个区域图像上执行一次卷积操作时待截取的数据,所述二维待卷积的图像矩阵的列数为:一个区域图像支持的最大卷积次数;
将所述二维卷积矩阵和每个所述二维待卷积的图像矩阵相乘,获得所述卷积结果。
在本公开的实施例中,超分辨率模型中可包括M个P×L的卷积核,转化为M行、P×L列的二维卷积矩阵,即将一个二维卷积核转化为一维卷积核,多个转化后的一维卷积核形成二维卷积矩阵。转化后的二维卷积矩阵的每一行即为一个二维卷积核中的权重值。
例如,M为卷积核个数,卷积核的尺寸P×L为k×k,转化后的二维卷积矩阵中的每行为一个卷积核向量,每行有k×k个权重值,总共有M行,表示M个卷积核。
进一步地,本公开基于卷积核的尺寸、预设卷积滑动步长以及单帧区域图像,获得二维待卷积的图像矩阵。
需要说明的是,在本公开的实施例中,为了保证卷积后的矩阵大小与输入卷积层的区域图像的大小保持一致,因而当卷积核的尺寸、卷积滑动步长以及待卷积的区域图像大小不足以满足上述需求时,可对一个区域图像的四周进行填充处理,获得填充后的区域图像,并对填充后的区域图像进行处理。
例如,卷积核为k×k的二维矩阵;预设卷积滑动步长在行方向为stride_h,在列方向为stride_w;预设填充尺寸在行方向上的填充长度为pad_h,在列方向为pad_w;单帧区域图像的尺寸为image_h×image_w;那么,获得的二维待卷积的图像矩阵共有k×k行(即P×L行),N列,N可通过如下公式(1)表示:
N=((image_h+2×pad_h–k)/stride_h+1)×((image_w+2×pad_w–k)/stride_w+1) (1)
二维待卷积的图像矩阵中的每列共有k×k个数据,一列数据为卷积核在填充后的单帧区域图像上执行一次卷积操作时所截取的数据,填充后的单帧区域图像上的各像素点的像素值通过N列数据覆盖,N值也是填充后的单帧区域图像支持的最大卷积次数。其中,对单帧区域图像进行填充时,可以是在单帧区域图像的周边填充满足预设填充尺寸的一圈值为0数据。
若区域图像无需填充,则二维待卷积的图像矩阵的列数N的值即为将pad_h和pad_w均为0时对应的值,也为区域图像支持的最大卷积次数。
图5是本公开的一种卷积示例图,如图5所示,将P×L的二维卷积核的尺寸记为K,则上述卷积过程即M×K的二维卷积矩阵,与K×N的二维待卷积图像矩阵的乘积,得到的是M×N的卷积结果矩阵,矩阵的一行即为一个特征图(feature map)。
可以理解的是,在本公开的实施例中,考虑到图像分割时,分割获得的区域图像可能并非是规则的矩形区域,且区域图像可能有不同的形状和大小,因而本公开针对性的将原本规则的矩形卷积操作修改为不规则的滑动,而无需对各不规则的区域图像做填充以满足卷积要求,且最终的计算复杂度也和区域图像的个数无关,只与单帧图像的总面积相关,因而降低了算法复杂度,极大提升了卷积效率。
图6是本公开一种应用于拍照中的超分算法流程示例图,如图6所示,超分算法包括如下步骤:
S21、多帧对齐。
在该实施例中,多帧对齐即将基于拍照指令连续采集的多帧图像对齐。
S22、去鬼影。
在该实施例中,即将对齐后的多帧图像进行去鬼影操作,获得去除鬼影后的多帧图像。
S23、深度学习多帧融合。
在该实施例中,即将去除鬼影后的多帧图像输入使用深度学习网络预训练好的图像融合模型,该图像融合模型同时具备降噪且提升分辨率的功能,因而去除鬼影后的多帧图像输入该图像融合模型后能获得噪声降低且分辨率提升的融合图像。
S24、锐化。
在该实施例中,通过步骤S23获得噪声降低且分辨率提升的融合图像后,即可对融合图像做锐化处理,以获得画质提升的目标图像并显示给用户。
可以立即的是,本公开采用多帧超分算法,将对齐并去除鬼影后的多帧图像输入以深度学习网络为基础预训练好的图像融合模型,即可同步获得噪声降低且分辨率提升的融合图像,并进一步对融合图像做锐化处理获得画质提升的目标图像并输出,而无需通过独立的降噪模块或超分模块来获得超分图像,具有集成度高且处理效果好的特点。
图7是根据一示例性实施例示出的一种拍照装置图。参照图7,拍照装置包括:
采集模块101,配置为在检测到拍照指令时,连续采集多帧图像;
去除模块102,配置为基于所述多帧图像,获得去除鬼影后的多帧图像;
融合模块103,配置为将所述去除鬼影后的多帧图像输入图像融合模型,获得融合图像;其中,所述融合图像的噪声低于所述多帧图像中任一帧图像的噪声,且所述融合图像的分辨率高于所述多帧图像中任一帧图像的分辨率;
增强模块104,配置为对所述融合图像做图像增强处理,获得目标图像并输出。
可选的,所述图像融合模型包括多个超分辨率模型;其中,所述超分辨率模型与图像类型一一对应;
所述融合模块103,具体配置为对所述去除鬼影后的多帧图像中的每个单帧图像进行图像分割,得到多个区域图像;将所述多个区域图像中属于同一图像类型的多个区域图像,输入所述同一图像类型对应的超分辨率模型中,获得所述同一图像类型的区域融合图像;其中,所述区域融合图像的噪声低于所述同一图像类型的多个区域图像中任一区域图像的噪声,且所述区域融合图像的分辨率高于所述同一图像类型的多个区域图像中任一区域图像的分辨率;将不同图像类型的区域融合图像进行融合,获得所述融合图像。
可选的,所述融合模块103,具体配置为针对所述去除鬼影后的多帧图像中的每个单帧图像,判断所述单帧图像的每个像素的类型;基于每个所述像素的类型确定所述像素所属的图像类型;将属于同一单帧图像中同一图像类型的像素划分到同一区域图像中,得到多个所述区域图像。
可选的,所述融合模块103,具体配置为基于不同类型区域融合图像对应的区域图像中像素的权重,对所述不同图像类型的区域融合图像进行融合,获得所述融合图像。
可选的,所述超分辨率模型包括:多个模块,每个模块包括:卷积层,归一化层和激活层;
所述融合模块103,具体配置为将所述多个区域图像中属于同一图像类型的多个区域图像,输入所述同一图像类型对应的所述超分辨率模型中的卷积层,获得卷积结果;将所述卷积结果输入归一化层,获得归一化结果;基于所述归一化结果和所述激活层,获得所述同一图像类型的区域融合图像;其中,所述激活层的输入为所述归一化结果。
可选的,所述融合模块103,具体配置为将所述同一图像类型对应的超分辨率模型中所述卷积层的M个P行、L列的卷积核,转化为M行、P×L列的二维卷积矩阵;其中,所述M、P和L均为正整数;基于所述卷积核的尺寸、预设卷积滑动步长以及所述多个区域图像,获得多个二维待卷积的图像矩阵;其中,所述二维待卷积的图像矩阵中的每列共有P×L个数据,一列数据为所述卷积核在一个区域图像上执行一次卷积操作时待截取的数据,所述二维待卷积的图像矩阵的列数为:一个区域图像支持的最大卷积次数;将所述二维卷积矩阵和所述二维待卷积的图像矩阵相乘,获得所述卷积结果。
可选的,所述图像类型包括以下至少之一:
纹理特征的图像;
颜色特征的图像;
形状特征的图像;
空间关系的图像。
可选的,所述去除模块102,具体配置为将所述多帧图像对齐;将对齐后的多帧图像进行去鬼影处理,获得所述去鬼影后的多帧图像。
可选的,所述增强模块104,具体配置为对所述融合图像做锐化处理,获得所述目标图像并输出。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图8是根据一示例性实施例示出的一种移动终端装置800的框图。例如,装置800可以是移动电话,移动电脑等。
参照图8,装置800可以包括以下一个或多个组件:处理组件802,存储器804,电源组件806,多媒体组件808,音频组件810,输入/输出(I/O)的接口812,传感器组件814,以及通信组件816。
处理组件802通常控制装置800的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件802可以包括一个或多个处理器820来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件802可以包括一个或多个模块,便于处理组件802和其他组件之间的交互。例如,处理组件802可以包括多媒体模块,以方便多媒体组件808和处理组件802之间的交互。
存储器804被配置为存储各种类型的数据以支持在设备800的操作。这些数据的示例包括用于在装置800上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器804可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电源组件806为装置800的各种组件提供电力。电力组件806可以包括电源管理系统,一个或多个电源,及其他与为装置800生成、管理和分配电力相关联的组件。
多媒体组件808包括在所述装置800和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件808包括一个前置摄像头和/或后置摄像头。当设备800处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件810被配置为输出和/或输入音频信号。例如,音频组件810包括一个麦克风(MIC),当装置800处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器804或经由通信组件816发送。在一些实施例中,音频组件810还包括一个扬声器,用于输出音频信号。
I/O接口812为处理组件802和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件814包括一个或多个传感器,用于为装置800提供各个方面的状态评估。例如,传感器组件814可以检测到设备800的打开/关闭状态,组件的相对定位,例如所述组件为装置800的显示器和小键盘,传感器组件814还可以检测装置800或装置800一个组件的位置改变,用户与装置800接触的存在或不存在,装置800方位或加速/减速和装置800的温度变化。传感器组件814可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件814还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件814还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件816被配置为便于装置800和其他设备之间有线或无线方式的通信。装置800可以接入基于通信标准的无线网络,如Wi-Fi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件816经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件816还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,装置800可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器804,上述指令可由装置800的处理器820执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
一种非临时性计算机可读存储介质,当所述存储介质中的指令由终端的处理器执行时,使得终端能够执行拍照方法,所述方法包括:
在检测到拍照指令时,连续采集多帧图像;
基于所述多帧图像,获得去除鬼影后的多帧图像;
将所述去除鬼影后的多帧图像输入图像融合模型,获得融合图像;其中,所述融合图像的噪声低于所述多帧图像中任一帧图像的噪声,且所述融合图像的分辨率高于所述多帧图像中任一帧图像的分辨率;
对所述融合图像做图像增强处理,获得目标图像并输出。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
Claims (13)
1.一种拍照方法,其特征在于,所述方法包括:
在检测到拍照指令时,连续采集多帧图像;
基于所述多帧图像,获得去除鬼影后的多帧图像;
将所述去除鬼影后的多帧图像输入图像融合模型,获得融合图像;其中,所述融合图像的噪声低于所述多帧图像中任一帧图像的噪声,且所述融合图像的分辨率高于所述多帧图像中任一帧图像的分辨率;
对所述融合图像做图像增强处理,获得目标图像并输出。
2.根据权利要求1所述的方法,其特征在于,所述图像融合模型包括多个超分辨率模型;其中,所述超分辨率模型与图像类型一一对应;
所述将所述去除鬼影后的多帧图像输入图像融合模型,获得融合图像,包括:
对所述去除鬼影后的多帧图像中的每个单帧图像进行图像分割,得到多个区域图像;
将所述多个区域图像中属于同一图像类型的多个区域图像,输入所述同一图像类型对应的超分辨率模型中,获得所述同一图像类型的区域融合图像;其中,所述区域融合图像的噪声低于所述同一图像类型的多个区域图像中任一区域图像的噪声,且所述区域融合图像的分辨率高于所述同一图像类型的多个区域图像中任一区域图像的分辨率;
将不同图像类型的区域融合图像进行融合,获得所述融合图像。
3.根据权利要求2所述的方法,其特征在于,所述对所述去除鬼影后的多帧图像中的每个单帧图像进行图像分割,得到多个区域图像,包括:
针对所述去除鬼影后的多帧图像中的每个单帧图像,判断所述单帧图像的每个像素的类型;
基于每个所述像素的类型确定所述像素所属的图像类型;
将属于同一单帧图像中同一图像类型的像素划分到同一区域图像中,得到多个所述区域图像。
4.根据权利要求2所述的方法,其特征在于,所述将不同图像类型的区域融合图像进行融合,获得所述融合图像,包括:
基于不同类型区域融合图像对应的区域图像中像素的权重,对所述不同图像类型的区域融合图像进行融合,获得所述融合图像。
5.根据权利要求2所述的方法,其特征在于,所述超分辨率模型包括:多个模块,每个模块包括:卷积层,归一化层和激活层;
所述将所述多个区域图像中属于同一图像类型的多个区域图像,输入所述同一图像类型对应的超分辨率模型中,获得所述同一图像类型的区域融合图像,包括:
将所述多个区域图像中属于同一图像类型的多个区域图像,输入所述同一图像类型对应的所述超分辨率模型中的卷积层,获得卷积结果;
将所述卷积结果输入归一化层,获得归一化结果;
基于所述归一化结果和所述激活层,获得所述同一图像类型的区域融合图像;其中,所述激活层的输入为所述归一化结果。
6.根据权利要求5所述的方法,其特征在于,所述将所述多个区域图像中属于同一图像类型的多个区域图像,输入所述同一图像类型对应的所述超分辨率模型中的卷积层,获得卷积结果,包括:
将所述同一图像类型对应的超分辨率模型中所述卷积层的M个P行、L列的卷积核,转化为M行、P×L列的二维卷积矩阵;其中,所述M、P和L均为正整数;
基于所述卷积核的尺寸、预设卷积滑动步长以及所述多个区域图像,获得多个二维待卷积的图像矩阵;其中,所述二维待卷积的图像矩阵中的每列共有P×L个数据,一列数据为所述卷积核在一个区域图像上执行一次卷积操作时待截取的数据,所述二维待卷积的图像矩阵的列数为:一个区域图像支持的最大卷积次数;
将所述二维卷积矩阵和每个所述二维待卷积的图像矩阵相乘,获得所述卷积结果。
7.根据权利要求2所述的方法,其特征在于,所述图像类型包括以下至少之一:
纹理特征的图像;
颜色特征的图像;
形状特征的图像;
空间关系的图像。
8.根据权利要求1至7中任一项所述的方法,其特征在于,所述基于所述多帧图像,获得去除鬼影后的多帧图像,包括:
将所述多帧图像对齐;
将对齐后的多帧图像进行去鬼影处理,获得所述去鬼影后的多帧图像。
9.根据权利要求1所述的方法,其特征在于,所述对所述融合图像做图像增强处理,获得目标图像并输出,包括:
对所述融合图像做锐化处理,获得所述目标图像并输出。
10.一种拍照装置,其特征在于,所述装置包括:
采集模块,配置为在检测到拍照指令时,连续采集多帧图像;
去除模块,配置为基于所述多帧图像,获得去除鬼影后的多帧图像;
融合模块,配置为将所述去除鬼影后的多帧图像输入图像融合模型,获得融合图像;其中,所述融合图像的噪声低于所述多帧图像中任一帧图像的噪声,且所述融合图像的分辨率高于所述多帧图像中任一帧图像的分辨率;
增强模块,配置为对所述融合图像做图像增强处理,获得目标图像并输出。
11.根据权利要求10所述的装置,其特征在于,所述图像融合模型包括多个超分辨率模型;其中,所述超分辨率模型与图像类型一一对应;
所述融合模块,具体配置为对所述去除鬼影后的多帧图像中的每个单帧图像进行图像分割,得到多个区域图像;将所述多个区域图像中属于同一图像类型的多个区域图像,输入所述同一图像类型对应的超分辨率模型中,获得所述同一图像类型的区域融合图像;其中,所述区域融合图像的噪声低于所述同一图像类型的多个区域图像中任一区域图像的噪声,且所述区域融合图像的分辨率高于所述同一图像类型的多个区域图像中任一区域图像的分辨率;将不同图像类型的区域融合图像进行融合,获得所述融合图像。
12.一种终端,其特征在于,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为执行如权利要求1至9中任一项所述的拍照方法。
13.一种非临时性计算机可读存储介质,当所述存储介质中的指令由终端的处理器执行时,使得终端能够执行如权利要求1至9中任一项所述的拍照方法。
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011563021.6A CN112634160A (zh) | 2020-12-25 | 2020-12-25 | 拍照方法及装置、终端、存储介质 |
KR1020210065213A KR102525293B1 (ko) | 2020-12-25 | 2021-05-21 | 촬영 방법 및 장치, 단말기, 저장 매체 |
US17/332,210 US11847769B2 (en) | 2020-12-25 | 2021-05-27 | Photographing method, terminal, and storage medium |
EP21176305.7A EP4020371A1 (en) | 2020-12-25 | 2021-05-27 | Photographing method, terminal, and storage medium |
JP2021091760A JP7221334B2 (ja) | 2020-12-25 | 2021-05-31 | 写真撮影の方法及び装置、端末、記憶媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011563021.6A CN112634160A (zh) | 2020-12-25 | 2020-12-25 | 拍照方法及装置、终端、存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112634160A true CN112634160A (zh) | 2021-04-09 |
Family
ID=75324908
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011563021.6A Pending CN112634160A (zh) | 2020-12-25 | 2020-12-25 | 拍照方法及装置、终端、存储介质 |
Country Status (5)
Country | Link |
---|---|
US (1) | US11847769B2 (zh) |
EP (1) | EP4020371A1 (zh) |
JP (1) | JP7221334B2 (zh) |
KR (1) | KR102525293B1 (zh) |
CN (1) | CN112634160A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113570531A (zh) * | 2021-07-27 | 2021-10-29 | Oppo广东移动通信有限公司 | 图像处理方法、装置、电子设备和计算机可读存储介质 |
CN113935934A (zh) * | 2021-10-08 | 2022-01-14 | Oppo广东移动通信有限公司 | 图像处理方法、装置、电子设备和计算机可读存储介质 |
WO2023245343A1 (zh) * | 2022-06-20 | 2023-12-28 | 北京小米移动软件有限公司 | 一种图像处理方法、图像处理装置及存储介质 |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112634160A (zh) * | 2020-12-25 | 2021-04-09 | 北京小米松果电子有限公司 | 拍照方法及装置、终端、存储介质 |
CN115633259B (zh) * | 2022-11-15 | 2023-03-10 | 深圳市泰迅数码有限公司 | 基于人工智能的智能摄像头自动调控方法及系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1402191A (zh) * | 2002-09-19 | 2003-03-12 | 上海交通大学 | 基于块分割的多聚焦图像融合方法 |
CN108898567A (zh) * | 2018-09-20 | 2018-11-27 | 北京旷视科技有限公司 | 图像降噪方法、装置及系统 |
CN110189285A (zh) * | 2019-05-28 | 2019-08-30 | 北京迈格威科技有限公司 | 一种多帧图像融合方法及装置 |
CN110599433A (zh) * | 2019-07-30 | 2019-12-20 | 西安电子科技大学 | 一种基于动态场景的双曝光图像融合方法 |
CN111523546A (zh) * | 2020-04-16 | 2020-08-11 | 湖南大学 | 图像语义分割方法、系统及计算机存储介质 |
CN117499794A (zh) * | 2022-07-22 | 2024-02-02 | 北京小米移动软件有限公司 | 拍照方法、拍照装置以及存储介质 |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102008034979B4 (de) * | 2008-07-25 | 2011-07-07 | EADS Deutschland GmbH, 85521 | Verfahren und Einrichtung zur Erzeugung von fehlerreduzierten hochauflösenden und kontrastverbesserten Bildern |
CN104520897B (zh) | 2012-08-06 | 2018-05-15 | 皇家飞利浦有限公司 | 图像噪声降低和/或图像分辨率提高 |
KR101805629B1 (ko) * | 2013-05-07 | 2017-12-07 | 삼성전자주식회사 | 영상의 상태에 따라 적응적인 영상 처리를 위한 방법 및 장치 |
US9275445B2 (en) * | 2013-08-26 | 2016-03-01 | Disney Enterprises, Inc. | High dynamic range and tone mapping imaging techniques |
JP2015121884A (ja) * | 2013-12-20 | 2015-07-02 | キヤノン株式会社 | 画像処理装置、その方法、及びプログラム |
US10306165B2 (en) | 2013-12-06 | 2019-05-28 | Huawei Device Co., Ltd. | Image generating method and dual-lens device |
JP2015197818A (ja) * | 2014-04-01 | 2015-11-09 | キヤノン株式会社 | 画像処理装置およびその方法 |
JP2017537403A (ja) | 2014-11-27 | 2017-12-14 | ノキア テクノロジーズ オサケユイチア | 超解像画像を生成するための方法、装置およびコンピュータ・プログラム・プロダクト |
US9665927B2 (en) * | 2015-06-03 | 2017-05-30 | Samsung Electronics Co., Ltd. | Method and apparatus of multi-frame super resolution robust to local and global motion |
US10504206B2 (en) * | 2016-07-06 | 2019-12-10 | Micro Biz Ventures LLC | Method and system for processing images from a remote image detector |
JP6809891B2 (ja) | 2016-12-15 | 2021-01-06 | 株式会社Fuji | 画像処理システム及び画像処理方法 |
CN115018701A (zh) * | 2018-08-08 | 2022-09-06 | 谷歌有限责任公司 | 用于创建场景的超分辨率图像的光学图像稳定移动 |
CN110136062B (zh) * | 2019-05-10 | 2020-11-03 | 武汉大学 | 一种联合语义分割的超分辨率重建方法 |
KR102410907B1 (ko) * | 2019-05-22 | 2022-06-21 | 삼성전자주식회사 | 영상 처리 장치 및 그 영상 처리 방법 |
US11531349B2 (en) * | 2019-06-21 | 2022-12-20 | Volkswagen Ag | Corner case detection and collection for a path planning system |
US11356604B2 (en) * | 2020-02-14 | 2022-06-07 | Pixelworks, Inc. | Methods and systems for image processing with multiple image sources |
CN113284054B (zh) * | 2020-02-19 | 2024-07-02 | 华为技术有限公司 | 图像增强方法以及图像增强装置 |
CN112634160A (zh) * | 2020-12-25 | 2021-04-09 | 北京小米松果电子有限公司 | 拍照方法及装置、终端、存储介质 |
-
2020
- 2020-12-25 CN CN202011563021.6A patent/CN112634160A/zh active Pending
-
2021
- 2021-05-21 KR KR1020210065213A patent/KR102525293B1/ko active IP Right Grant
- 2021-05-27 EP EP21176305.7A patent/EP4020371A1/en active Pending
- 2021-05-27 US US17/332,210 patent/US11847769B2/en active Active
- 2021-05-31 JP JP2021091760A patent/JP7221334B2/ja active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1402191A (zh) * | 2002-09-19 | 2003-03-12 | 上海交通大学 | 基于块分割的多聚焦图像融合方法 |
CN108898567A (zh) * | 2018-09-20 | 2018-11-27 | 北京旷视科技有限公司 | 图像降噪方法、装置及系统 |
CN110189285A (zh) * | 2019-05-28 | 2019-08-30 | 北京迈格威科技有限公司 | 一种多帧图像融合方法及装置 |
CN110599433A (zh) * | 2019-07-30 | 2019-12-20 | 西安电子科技大学 | 一种基于动态场景的双曝光图像融合方法 |
CN111523546A (zh) * | 2020-04-16 | 2020-08-11 | 湖南大学 | 图像语义分割方法、系统及计算机存储介质 |
CN117499794A (zh) * | 2022-07-22 | 2024-02-02 | 北京小米移动软件有限公司 | 拍照方法、拍照装置以及存储介质 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113570531A (zh) * | 2021-07-27 | 2021-10-29 | Oppo广东移动通信有限公司 | 图像处理方法、装置、电子设备和计算机可读存储介质 |
CN113935934A (zh) * | 2021-10-08 | 2022-01-14 | Oppo广东移动通信有限公司 | 图像处理方法、装置、电子设备和计算机可读存储介质 |
WO2023245343A1 (zh) * | 2022-06-20 | 2023-12-28 | 北京小米移动软件有限公司 | 一种图像处理方法、图像处理装置及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
EP4020371A1 (en) | 2022-06-29 |
JP7221334B2 (ja) | 2023-02-13 |
KR20220092771A (ko) | 2022-07-04 |
US20220207676A1 (en) | 2022-06-30 |
JP2022103020A (ja) | 2022-07-07 |
KR102525293B1 (ko) | 2023-04-25 |
US11847769B2 (en) | 2023-12-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109345485B (zh) | 一种图像增强方法、装置、电子设备及存储介质 | |
CN112634160A (zh) | 拍照方法及装置、终端、存储介质 | |
CN104050645B (zh) | 图像处理方法及装置 | |
CN109509195B (zh) | 前景处理方法、装置、电子设备及存储介质 | |
JP6909317B2 (ja) | 画像処理モデルのトレーニング方法、装置および媒体 | |
CN109784327B (zh) | 边界框确定方法、装置、电子设备及存储介质 | |
CN105528765A (zh) | 处理图像的方法及装置 | |
CN111968052A (zh) | 图像处理方法、图像处理装置及存储介质 | |
CN105574834B (zh) | 图像处理方法及装置 | |
CN112288657A (zh) | 图像处理方法、图像处理装置及存储介质 | |
CN115641269A (zh) | 一种图像修补方法、装置及可读存储介质 | |
CN112016595A (zh) | 图像分类方法和装置、电子设备、可读存储介质 | |
US20230385993A1 (en) | Image processing method and apparatus, electronic device, storage medium and chip | |
CN113191994B (zh) | 图像处理方法、装置及存储介质 | |
EP4304188A1 (en) | Photographing method and apparatus, medium and chip | |
CN117409056A (zh) | 图像处理方法、装置、电子设备及可读存储介质 | |
CN117670693A (zh) | 图像的处理方法、装置及存储介质 | |
CN118678237A (zh) | 图像处理方法、装置、终端及存储介质 | |
CN117710224A (zh) | 图像融合方法、装置、终端及存储介质 | |
CN113256490A (zh) | 文档图像的处理方法、装置及介质 | |
CN115708122A (zh) | 图像处理方法、装置、存储介质及终端 | |
CN117455782A (zh) | 图像增强方法、图像增强装置及存储介质 | |
CN116805976A (zh) | 视频处理方法、装置及存储介质 | |
CN116416505A (zh) | 图像处理模型的训练方法、图像处理方法、装置及存储介质 | |
CN116416141A (zh) | 图像处理方法及装置、设备、存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |