CN107578375B - 图像处理方法及装置 - Google Patents
图像处理方法及装置 Download PDFInfo
- Publication number
- CN107578375B CN107578375B CN201710719332.9A CN201710719332A CN107578375B CN 107578375 B CN107578375 B CN 107578375B CN 201710719332 A CN201710719332 A CN 201710719332A CN 107578375 B CN107578375 B CN 107578375B
- Authority
- CN
- China
- Prior art keywords
- target image
- image
- sample
- resolution
- key
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Image Processing (AREA)
- Image Analysis (AREA)
Abstract
本申请实施例公开了一种图像处理方法及装置,用以优化将低像素图像转换为高像素图像的效果。所述方法包括:获取目标图像,确定所述目标图像中的关键区域;根据预先生成的多尺度图像模型,提取所述关键区域内的深层特征,所述多尺度图像模型中包括各目标图像在至少一种尺寸下的关键区域内的深层特征信息;对所述目标图像以及所述关键区域内的深层特征进行处理,得到所述目标图像对应的高分辨率目标图像。该技术方案能够充分挖掘目标图像中的关键特征,进而使得最终得到的高分辨率目标图像能够充分刻画关键区域的边缘和纹理,优化了对目标图像提升分辨率的效果。
Description
技术领域
本发明涉及图像处理技术领域,尤其涉及一种图像处理方法及装置。
背景技术
随着技术的发展,如何利用计算机图像处理技术和计算机视觉技术将低像素的人脸生成高像素的人脸,成为安防和侦查等领域的又一个重要发展方向。人脸识别作为安防和侦查的主要依据,对其的研究在近年来得到越来越多的关注。而实际中的摄像头由于可覆盖的像素点有限,在保证广度的条件下,必然会丧失对目标像素点的覆盖,而低像素图像在进行人脸识别的时候必然会导致精度的降低。因此怎样将低像素人脸图像转化为高像素人脸变得愈加重要。
现有技术中,主要采用超分辨率方法提高图像的分辨率,然而,随着深度学习技术的发展,传统的超分辨率方法(如双三插值、样条插值等方法)的效果已经大大落后,原因在于,基于单张图像的超分辨率图像重建方法对目标的可利用信息较少,导致在有效提高超分辨率效果方面具有很大的难度,且缺少对边缘和纹理的有效刻画,从而使生成的图像变得较为模糊。
发明内容
本申请实施例的目的是提供一种图像处理方法及装置,用以优化将低像素图像转换为高像素图像的效果。
为解决上述技术问题,本申请实施例是这样实现的:
一方面,本申请实施例提供一种图像处理方法,包括:
获取目标图像,确定所述目标图像中的关键区域;
根据预先生成的多尺度图像模型,提取所述关键区域内的深层特征,所述多尺度图像模型中包括各目标图像在至少一种尺寸下的关键区域内的深层特征信息;
对所述目标图像以及所述关键区域内的深层特征进行处理,得到所述目标图像对应的高分辨率目标图像。
可选地,所述方法还包括:
利用预定超分辨率方式对所述目标图像进行超分辨率处理,得到待处理图像;
相应地,对所述目标图像以及所述关键区域内的深层特征进行处理,得到所述目标图像对应的高分辨率目标图像,包括:
融合所述待处理图像以及所述关键区域内的深层特征,得到所述目标图像对应的高分辨率目标图像。
可选地,所述方法还包括:
确定针对所述目标图像的期望提升尺寸;
相应地,所述提取所述关键区域内的深层特征,包括:
从所述多尺度图像模型中获取所述目标图像在所述期望提升尺寸下的关键区域内的深层特征信息;
根据所述获取的深层特征信息提取所述关键区域内的深层特征。
可选地,所述方法还包括:
获取多个被标记关键区域的样本目标图像,以及,获取各所述样本目标图像在所述至少一种尺寸下分别对应的样本高分辨率目标图像,所述样本高分辨率目标图像为与所述样本目标图像的图像内容相同、且分辨率更高的图像;
根据所述样本目标图像、各所述至少一个样本高分辨率目标图像以及所述样本目标图像中被标记的关键区域,以迭代方式多次学习各所述至少一个样本高分辨率目标图像中的关键区域内的特征信息,得到所述样本目标图像在所述至少一种尺寸下的关键区域内的深层特征信息;
根据所述深层特征信息,生成所述多尺度图像模型。
可选地,所述方法还包括:
构建所述样本目标图像和各所述样本高分辨率目标图像之间的一般像素损失函数和关键点像素损失函数,其中,所述关键点像素为所述关键区域内的点的像素,所述一般像素为所述样本目标图像中除所述关键区域之外的点的像素;
根据所述一般像素损失函数、所述关键点像素损失函数以及所述关键点像素的权重,构建所述样本目标图像和各所述样本高分辨率目标图像之间的综合损失函数;
相应地,以迭代方式多次学习各所述至少一个样本高分辨率目标图像中的关键区域内的特征信息,得到所述样本目标图像在所述至少一种尺寸下的关键区域内的深层特征信息,包括:
判断所述综合损失函数是否满足预设损失条件;
若否,则继续以迭代方式学习各所述样本高分辨率目标图像中的关键区域内的特征信息,直至所述综合损失函数满足所述预设损失条件;
若是,则停止迭代学习,并将当前学习到的特征信息确定为所述深层特征信息。
可选地,所述样本目标图像为对称图像;所述方法还包括:
构建所述样本目标图像和各所述样本高分辨率目标图像之间的图像对称损失函数;
相应地,根据所述一般像素损失函数、所述关键点像素损失函数以及所述关键点像素的权重,构建所述样本目标图像和各所述样本高分辨率目标图像之间的综合损失函数,包括:
根据所述一般像素损失函数、所述关键点像素损失函数、所述关键点像素的权重以及预设对称参数,构建所述样本目标图像和各所述样本高分辨率目标图像之间的综合损失函数。
可选地,所述预设损失条件包括以下至少一项:
所述综合损失函数的值低于预设损失值;
迭代次数达到预设次数。
可选地,获取各所述样本目标图像在所述至少一种尺寸下分别对应的样本高分辨率目标图像,包括:
通过反卷积方式,将所述样本目标图像的尺寸按照至少一个指定倍数进行提升,得到所述样本目标图像在所述至少一个指定倍数对应的尺寸下分别对应的样本高分辨率目标图像。
可选地,所述获取目标图像,包括:
获取包括所述目标图像的原始图像;
利用指定目标追踪算法,从所述原始图像中对所述目标图像进行追踪,以获得所述目标图像。
另一方面,本申请实施例提供一种图像处理装置,包括:
获取模块,用于获取目标图像,确定所述目标图像中的关键区域;
提取模块,用于根据预先生成的多尺度图像模型,提取所述关键区域内的深层特征,所述多尺度图像模型中包括各目标图像在至少一种尺寸下的关键区域内的深层特征信息;
处理模块,用于对所述目标图像以及所述关键区域内的深层特征进行处理,得到所述目标图像对应的高分辨率目标图像。
采用本发明实施例的技术方案,首先获取目标图像,确定目标图像中的关键区域,进而根据预先生成的多尺度图像模型提取关键区域内的深层特征,再对目标图像以及所提取的深层特征进行处理以得到目标图像对应的高分辨率目标图像。可见,该技术方案能够提取目标图像中关键区域内的深层特征,从而能够充分挖掘目标图像中的关键特征,进而使得最终得到的高分辨率目标图像能够充分刻画关键区域的边缘和纹理,优化了对目标图像提升分辨率的效果。
进一步地,该技术方案能够首先确定针对目标图像的期望提升尺寸,进而从多尺度图像模型中获取目标图像在期望提升尺寸下的关键区域内的深层特征信息,并根据获取的深层特征信息提取所述关键区域内的深层特征。因此,该技术方案在对目标图像提升分辨率时,能够兼顾目标图像的期望提升尺寸,从而使最终得到的高分辨率目标图像能够符合目标图像的期望提升尺寸。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是根据本发明一实施例的一种图像处理方法的示意性流程图;
图2是根据本发明另一实施例的一种图像处理方法的示意性流程图;
图3至图8是根据本发明一实施例的一种图像处理方法中人脸图像的示意图;
图9是根据本发明一实施例的一种图像处理装置的示意性框图。
具体实施方式
本申请实施例提供一种图像处理方法及装置,用以优化将低像素图像转换为高像素图像的效果。
为了使本技术领域的人员更好地理解本申请中的技术方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
图1是根据本发明一实施例的一种图像处理方法的示意性流程图,如图1所示,该方法包括:
步骤S101,获取目标图像,确定目标图像中的关键区域。
该步骤中,输入的目标图像并非一定是单独存在的,其可能是存在于更大尺寸的图像中的一部分。这种情况下,在获取目标图像时,可先获取包括目标图像的原始图像,进而利用指定目标追踪算法从原始图像中对目标图像进行追踪,且指定目标追踪算法可定位目标图像中的关键区域。
例如,目标图像为人脸图像,人脸图像中的关键区域为五官区域。可利用MTCNN人脸追踪算法对原始图像中的人脸图像进行追踪,以获得人脸图像。并且,可利用MTCNN人脸追踪算法定位人脸图像中的五官区域。
步骤S102,根据预先生成的多尺度图像模型,提取关键区域内的深层特征,多尺度图像模型中包括各目标图像在至少一种尺寸下的关键区域内的深层特征信息。
其中,关键区域内的深层特征信息为目标图像的关键区域在与其对应的高分辨率目标图像中的特征信息。
步骤S103,对目标图像以及关键区域内的深层特征进行处理,得到目标图像对应的高分辨率目标图像。
在一个实施例中,若只需突出关键区域,则可将目标图像和关键区域内的深层特征进行融合,从而得到目标图像对应的高分辨率目标图像。
采用本发明实施例的技术方案,首先获取目标图像,确定目标图像中的关键区域,进而根据预先生成的多尺度图像模型提取关键区域内的深层特征,再对目标图像以及所提取的深层特征进行处理以得到目标图像对应的高分辨率目标图像。可见,该技术方案能够提取目标图像中关键区域内的深层特征,从而能够充分挖掘目标图像中的关键特征,进而使得最终得到的高分辨率目标图像能够充分刻画关键区域的边缘和纹理,优化了对目标图像提升分辨率的效果。
图2是根据本发明另一实施例的一种图像处理方法的示意性流程图,如图2所示,该方法包括:
步骤S201,获取目标图像,确定目标图像中的关键区域。
步骤S202,利用预定超分辨率方式对目标图像进行超分辨率处理,得到待处理图像。
该步骤中,预定超分辨率方式可包括插值方式,如双三插值法、样条插值法等。具体的插值方式为现有技术,因此不再赘述。若已确定了目标图像的期望提升尺寸,则对目标图像进行超分辨率处理时需满足目标图像的期望提升尺寸,即,超分辨率处理后得到的待处理图像的尺寸符合目标图像的期望提升尺寸。
步骤S203,根据预先生成的多尺度图像模型,提取关键区域内的深层特征,多尺度图像模型中包括各目标图像在至少一种尺寸下的关键区域内的深层特征信息。
步骤S204,融合待处理图像以及关键区域内的深层特征,得到目标图像对应的高分辨率目标图像。
该技术方案中,通过融合对目标图像进行超分辨率处理后的待处理图像以及关键区域内的深层特征,得到目标图像对应的高分辨率目标图像,使得高分辨率目标图像不仅满足了整体图像的超分辨率效果,且兼顾了对目标图像中关键区域的刻画,尤其是边缘和纹理的刻画,从而很大程度上优化了高分辨率目标图像的效果。
在上述任一实施例中,基于多尺度图像模型中包括各目标图像在至少一种尺寸下的关键区域内的深层特征信息,因此,还可确定针对目标图像的期望提升尺寸,进而在提取关键区域内的深层特征时,可先从多尺度图像模型中获取目标图像在期望提升尺寸下的关键区域内的深层特征信息,然后根据获取的深层特征信息提取关键区域内的深层特征。
例如,多尺度图像模型中包括目标图像在“×4”、“×8”、“×16”等尺寸下的关键区域内的深层特征信息。若针对目标图像的期望提升尺寸为“×4”,则首先从多尺度图像模型中获取目标图像在尺寸为“×4”下的关键区域内的深层特征信息,进而根据获取到的深层特征信息提取关键区域内的深层特征。
以下详细说明如何训练生成多尺度图像模型。
在一个实施例中,生成多尺度图像模型的方法包括:
步骤A1,获取多个被标记关键区域的样本目标图像,以及,获取各样本目标图像在至少一种尺寸下分别对应的样本高分辨率目标图像。
其中,样本高分辨率目标图像为与样本目标图像的图像内容相同、且分辨率更高的图像。在训练多尺度图像模型时,输入的每个样本目标图像均对应有多个不同尺寸下的样本高分辨率目标图像,例如,每个样本目标图像均对应有尺寸为“×4”、“×8”、“×16”下的样本高分辨率目标图像。
在获取各样本目标图像在至少一种尺寸下分别对应的样本高分辨率目标图像,可通过反卷积方式将样本目标图像的尺寸按照至少一个指定倍数(如4倍、8倍、16倍等)进行提升。
步骤A2,根据样本目标图像、各至少一个样本高分辨率目标图像以及样本目标图像中被标记的关键区域,以迭代方式多次学习各至少一个样本高分辨率目标图像中的关键区域内的特征信息,得到样本目标图像在至少一种尺寸下的关键区域内的深层特征信息。
步骤A3,根据深层特征信息,生成多尺度图像模型。
本实施例中,生成的多尺度图像模型中,由于包括各目标图像在至少一种尺寸下的关键区域内的深层特征信息,因此,在利用多尺度图像模型对目标图像进行分辨率的提升时,能够实现在各个尺寸下的分辨率提升,提供目标图像在各个尺寸下的超分辨率结果。
在一个实施例中,在生成多尺度图像模型时,还可通过损失函数来优化多尺度图像模型,因此,上述方法还包括以下步骤B1-B2:
步骤B1,构建样本目标图像和各样本高分辨率目标图像之间的一般像素损失函数和关键点像素损失函数,其中,关键点像素为关键区域内的点的像素,一般像素为样本目标图像中除关键区域之外的点的像素。
步骤B2,根据一般像素损失函数、关键点像素损失函数以及关键点像素的权重,构建样本目标图像和各样本高分辨率目标图像之间的综合损失函数。
基于步骤B1-B2中对综合损失函数的构建,在执行步骤A2时,可根据综合损失函数的损失值确定迭代继续或者迭代停止。具体的,在迭代学习过程中,判断样本目标图像和样本高分辨率目标图像之间的综合损失函数是否满足预设损失条件;若不满足,则继续以迭代方式学习样本高分辨率目标图像中的关键区域内的特征信息,直至综合损失函数满足预设损失条件;若满足,则将当前学习到的特征信息确定为深层特征信息。
其中,预设损失条件包括:综合损失函数的值低于预设损失值;和/或,迭代次数达到预设次数。
如上述所说,每个样本目标图像均对应有多个不同尺寸下的样本高分辨率目标图像。针对同一样本目标图像对应的多个样本高分辨率目标图像,样本目标图像与各样本高分辨率目标图像之间综合损失函数的构建方式相同。
在一个实施例中,样本目标图像为对称图像,例如样本目标图像为人脸图像时,由于人脸图像中的五官具有一定的对称性,因此,在构建损失函数时,还可构建样本目标图像和各样本高分辨率目标图像之间的图像对称损失函数,并根据一般像素损失函数、关键点像素损失函数、关键点像素的权重以及预设对称参数,构建样本目标图像和各样本高分辨率目标图像之间的综合损失函数。其中,关键点像素的权重和预设对称参数分别表示关键点像素损失函数以及图像对称损失函数在综合损失函数中所占的权重。
以LNpixel表示样本目标图像和样本高分辨率目标图像之间的一般像素损失函数,以LKpixel表示样本目标图像和样本高分辨率目标图像之间的关键点像素损失函数,以Lsyn表示样本目标图像和样本高分辨率目标图像之间的图像对称损失函数,以μ表示关键点像素的权重,以λ表示预设对称参数。那么,综合损失函数Lall如公式(1)所示:
Lall=LNpixel+μLKpixel+λLsyn (1)
其中:
其中,W、H分别为目标图像的宽度和高度。为(x,y)点的真实像素值,为(x,y)点的像素预测值(即对应的样本高分辨率目标图像中的像素值)。D为关键区域内的点构成的像素集合。ηx,y为示性函数,即,当(x,y)∈D时,ηx,y=0;当D时,ηx,y=1。
下面以目标图像为人脸图像为例,说明如何对目标图像进行分辨率的提升。
对于如图3所示的原始图像,首先,利用人脸追踪算法(如MTCNN)追踪到原始图像中的人脸图像以及人脸图像中的五官区域,并确定针对人脸图像的期望提升尺寸。对人脸图像的区域框进行裁剪,得到如图4所示的人脸图像。
其次,利用预定超分辨率方式对人脸图像进行超分辨率处理,得到待处理图像。例如,利用插值方式对人脸图像进行超分辨率处理,得到对应分辨率的待处理图像,如图5所示。该步骤中,对人脸图像进行超分辨率处理时需满足人脸图像的期望提升尺寸,即,超分辨率处理后得到的待处理图像的尺寸符合人脸图像的期望提升尺寸。可看出,图5中人脸图像的分辨率高于图4中人脸图像的分辨率,但关键区域(即五官区域)内的图像仍然有些模糊,尤其是边缘和纹理不够清晰。接下来,我们通过下面的步骤继续对人脸图像进行处理。
再次,从预先生成的多尺度图像模型中获取人脸图像在期望提升尺寸下的五官区域内的深层特征信息,并利用获取到的深层特征信息提取人脸图像在五官区域内的深层特征。其中,多尺度图像模型中包括各人脸图像在至少一种尺寸下的五官区域内的深层特征信息。提取的深层特征如图6所示。
最后,融合图5所示的待处理图像以及图6所示的关键区域对应的深层特征,得到人脸图像对应的高分辨率目标图像,如图7所示。可看出,图7中人脸图像的分辨率较图5中人脸图像的分辨率更高,且刻画出了五官区域的边缘和纹理,从而优化了对人脸图像进行分辨率提升的效果。
此外,由于多尺度图像模型中包括各人脸图像在至少一种尺寸下的关键区域内的深层特征信息。因此,还可针对同一人脸图像进行不同尺寸下的分辨率提升。
假设需针对同一人脸图像进行尺寸为“×4”、“×8”下的分辨率提升。那么,需从多尺度图像模型中获取人脸图像在尺寸“×4”、“×8”下的五官区域内的深层特征信息,并根据人脸图像在尺寸“×4”、“×8”下的五官区域内的深层特征信息提取出人脸图像在尺寸“×4”、“×8”下的五官区域内的深层特征。然后,融合人脸图像在尺寸“×4”下的五官区域内的深层特征以及待处理图像(该待处理图像的尺寸为人脸图像的原始尺寸的4倍),即可得到人脸图像在尺寸“×4”下的高分辨率目标图像;对人脸图像在尺寸“×4”下的高分辨率目标图像进行尺寸提升,使其尺寸为人脸图像的原始尺寸的8倍。继续融合人脸图像在尺寸“×8”下的五官区域内的深层特征以及进行尺寸提升后的高分辨率目标图像,即可得到人脸图像在尺寸“×8”下的高分辨率目标图像,如图8所示。图8中的符号“+”表示对待处理图像或高分辨率目标图像以及提取出的深层特征进行融合。
综上,已经对本主题的特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作可以按照不同的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序,以实现期望的结果。在某些实施方式中,多任务处理和并行处理可以是有利的。
以上为本申请实施例提供的生成数据关系模型的方法,基于同样的思路,本申请实施例还提供一种图像处理装置。
图9是根据本发明一实施例的一种图像处理装置的示意性框图,如图9所示,该装置包括:
获取模块910,用于获取目标图像,确定所述目标图像中的关键区域;
提取模块920,用于根据预先生成的多尺度图像模型,提取所述关键区域内的深层特征,所述多尺度图像模型中包括各目标图像在至少一种尺寸下的关键区域内的深层特征信息;
处理模块930,用于对所述目标图像以及所述关键区域内的深层特征进行处理,得到所述目标图像对应的高分辨率目标图像。
在一个实施例中,上述装置还包括:
超分辨率处理模块,用于利用预定超分辨率方式对所述目标图像进行超分辨率处理,得到待处理图像;
相应地,处理模块930包括:
融合单元,用于融合所述待处理图像以及所述关键区域内的深层特征,得到所述目标图像对应的高分辨率目标图像。
在一个实施例中,上述装置还包括:
确定模块,用于确定针对所述目标图像的期望提升尺寸;
相应地,提取模块920包括:
获取单元,用于从所述多尺度图像模型中获取所述目标图像在所述期望提升尺寸下的关键区域内的深层特征信息;
提取单元,用于根据所述获取的深层特征信息提取所述关键区域内的深层特征。
本领域的技术人员应可理解,图9中的图像处理装置能够用来实现前文所述的图像处理方法,其中的细节描述应与前文方法部分描述类似,为避免繁琐,此处不另赘述。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。
Claims (7)
1.一种图像处理方法,其特征在于,包括:
获取目标图像,确定所述目标图像中的关键区域;
根据预先生成的多尺度图像模型,提取所述关键区域内的深层特征,所述多尺度图像模型中包括各目标图像在至少一种尺寸下的关键区域内的深层特征信息;
对所述目标图像以及所述关键区域内的深层特征进行处理,得到所述目标图像对应的高分辨率目标图像;
其中,生成多尺度图像模型的方法包括:
获取多个被标记关键区域的样本目标图像,以及,获取各所述样本目标图像在所述至少一种尺寸下分别对应的样本高分辨率目标图像,所述样本高分辨率目标图像为与所述样本目标图像的图像内容相同、且分辨率更高的图像;
根据所述样本目标图像、各所述样本高分辨率目标图像以及所述样本目标图像中被标记的关键区域,以迭代方式多次学习各所述样本高分辨率目标图像中的关键区域内的特征信息,得到所述样本目标图像在所述至少一种尺寸下的关键区域内的深层特征信息;
根据所述深层特征信息,生成所述多尺度图像模型;
所述样本目标图像为对称图像,所述生成多尺度图像模型的方法还包括:
构建所述样本目标图像和各所述样本高分辨率目标图像之间的一般像素损失函数和关键点像素损失函数,其中,所述关键点像素为所述关键区域内的点的像素,所述一般像素为所述样本目标图像中除所述关键区域之外的点的像素;
构建所述样本目标图像和各所述样本高分辨率目标图像之间的图像对称损失函数;
根据所述一般像素损失函数、所述关键点像素损失函数、所述关键点像素的权重以及预设对称参数,构建所述样本目标图像和各所述样本高分辨率目标图像之间的综合损失函数;
以LNpixel表示样本目标图像和样本高分辨率目标图像之间的一般像素损失函数,以LKpixel表示样本目标图像和样本高分辨率目标图像之间的关键点像素损失函数,以Lsyn表示样本目标图像和样本高分辨率目标图像之间的图像对称损失函数,以μ表示关键点像素的权重,以λ表示预设对称参数,综合损失函数Lall如公式(1)所示:
Lall=LNpixel+μLKpixel+λLsyn (1)
其中:
其中,W、H分别为目标图像的宽度和高度,为(x,y)点的真实像素值,为(x,y)点的像素预测值,D为关键区域内的点构成的像素集合,ηx,y为示性函数,即,当(x,y)∈D时,ηx,y=0;当时,ηx,y=1;
相应地,以迭代方式多次学习各所述样本高分辨率目标图像中的关键区域内的特征信息,得到所述样本目标图像在所述至少一种尺寸下的关键区域内的深层特征信息,包括:
判断所述综合损失函数是否满足预设损失条件;
若否,则继续以迭代方式学习各所述样本高分辨率目标图像中的关键区域内的特征信息,直至所述综合损失函数满足所述预设损失条件;
若是,则停止迭代学习,并将当前学习到的特征信息确定为所述深层特征信息。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
利用预定超分辨率方式对所述目标图像进行超分辨率处理,得到待处理图像;
相应地,对所述目标图像以及所述关键区域内的深层特征进行处理,得到所述目标图像对应的高分辨率目标图像,包括:
融合所述待处理图像以及所述关键区域内的深层特征,得到所述目标图像对应的高分辨率目标图像。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
确定针对所述目标图像的期望提升尺寸;
相应地,所述提取所述关键区域内的深层特征,包括:
从所述多尺度图像模型中获取所述目标图像在所述期望提升尺寸下的关键区域内的深层特征信息;
根据所述获取的深层特征信息提取所述关键区域内的深层特征。
4.根据权利要求1所述的方法,其特征在于,所述预设损失条件包括以下至少一项:
所述综合损失函数的值低于预设损失值;
迭代次数达到预设次数。
5.根据权利要求1所述的方法,其特征在于,获取各所述样本目标图像在所述至少一种尺寸下分别对应的样本高分辨率目标图像,包括:
通过反卷积方式,将所述样本目标图像的尺寸按照至少一个指定倍数进行提升,得到所述样本目标图像在所述至少一个指定倍数对应的尺寸下分别对应的样本高分辨率目标图像。
6.根据权利要求1所述的方法,其特征在于,所述获取目标图像,包括:
获取包括所述目标图像的原始图像;
利用指定目标追踪算法,从所述原始图像中对所述目标图像进行追踪,以获得所述目标图像。
7.一种图像处理装置,其特征在于,包括:
获取模块,用于获取目标图像,确定所述目标图像中的关键区域;
提取模块,用于根据预先生成的多尺度图像模型,提取所述关键区域内的深层特征,所述多尺度图像模型中包括各目标图像在至少一种尺寸下的关键区域内的深层特征信息;
处理模块,用于对所述目标图像以及所述关键区域内的深层特征进行处理,得到所述目标图像对应的高分辨率目标图像;
其中,生成多尺度图像模型的方法包括:
获取多个被标记关键区域的样本目标图像,以及,获取各所述样本目标图像在所述至少一种尺寸下分别对应的样本高分辨率目标图像,所述样本高分辨率目标图像为与所述样本目标图像的图像内容相同、且分辨率更高的图像;
根据所述样本目标图像、各所述样本高分辨率目标图像以及所述样本目标图像中被标记的关键区域,以迭代方式多次学习各所述样本高分辨率目标图像中的关键区域内的特征信息,得到所述样本目标图像在所述至少一种尺寸下的关键区域内的深层特征信息;
根据所述深层特征信息,生成所述多尺度图像模型;
所述生成多尺度图像模型的方法还包括:
构建所述样本目标图像和各所述样本高分辨率目标图像之间的一般像素损失函数和关键点像素损失函数,其中,所述关键点像素为所述关键区域内的点的像素,所述一般像素为所述样本目标图像中除所述关键区域之外的点的像素;
构建所述样本目标图像和各所述样本高分辨率目标图像之间的图像对称损失函数;
根据所述一般像素损失函数、所述关键点像素损失函数、所述关键点像素的权重以及预设对称参数,构建所述样本目标图像和各所述样本高分辨率目标图像之间的综合损失函数;
以LNpixel表示样本目标图像和样本高分辨率目标图像之间的一般像素损失函数,以LKpixel表示样本目标图像和样本高分辨率目标图像之间的关键点像素损失函数,以Lsyn表示样本目标图像和样本高分辨率目标图像之间的图像对称损失函数,以μ表示关键点像素的权重,以λ表示预设对称参数,综合损失函数Lall如公式(1)所示:
Lall=LNpixel+μLKpixel+λLsyn (1)
其中:
其中,W、H分别为目标图像的宽度和高度,为(x,y)点的真实像素值,为(x,y)点的像素预测值,D为关键区域内的点构成的像素集合,ηx,y为示性函数,即,当(x,y)∈D时,ηx,y=0;当时,ηx,y=1;
相应地,以迭代方式多次学习各所述样本高分辨率目标图像中的关键区域内的特征信息,得到所述样本目标图像在所述至少一种尺寸下的关键区域内的深层特征信息,包括:
判断所述综合损失函数是否满足预设损失条件;
若否,则继续以迭代方式学习各所述样本高分辨率目标图像中的关键区域内的特征信息,直至所述综合损失函数满足所述预设损失条件;
若是,则停止迭代学习,并将当前学习到的特征信息确定为所述深层特征信息。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710719332.9A CN107578375B (zh) | 2017-08-21 | 2017-08-21 | 图像处理方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710719332.9A CN107578375B (zh) | 2017-08-21 | 2017-08-21 | 图像处理方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107578375A CN107578375A (zh) | 2018-01-12 |
CN107578375B true CN107578375B (zh) | 2020-10-02 |
Family
ID=61033920
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710719332.9A Active CN107578375B (zh) | 2017-08-21 | 2017-08-21 | 图像处理方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107578375B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108921792B (zh) * | 2018-07-03 | 2023-06-27 | 北京字节跳动网络技术有限公司 | 用于处理图片的方法和装置 |
CN111488933B (zh) * | 2020-04-13 | 2024-02-27 | 上海联影智能医疗科技有限公司 | 图像分类方法、网络、计算机设备和存储介质 |
CN112597983B (zh) * | 2021-03-04 | 2021-05-14 | 湖南航天捷诚电子装备有限责任公司 | 一种遥感图像中目标对象的识别方法及其存储介质和系统 |
CN113096202B (zh) * | 2021-03-30 | 2023-01-31 | 深圳市商汤科技有限公司 | 图像压缩方法及装置、电子设备及计算机可读存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104361589A (zh) * | 2014-11-12 | 2015-02-18 | 河海大学 | 一种基于尺度间映射的高分辨率遥感影像分割方法 |
CN106204449A (zh) * | 2016-07-06 | 2016-12-07 | 安徽工业大学 | 一种基于对称深度网络的单幅图像超分辨率重建方法 |
CN106600553A (zh) * | 2016-12-15 | 2017-04-26 | 华中科技大学 | 一种基于卷积神经网络的dem超分辨率方法 |
CN106709875A (zh) * | 2016-12-30 | 2017-05-24 | 北京工业大学 | 一种基于联合深度网络的压缩低分辨率图像复原方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9558426B2 (en) * | 2014-04-24 | 2017-01-31 | Nant Holdings Ip, Llc | Robust feature identification for image-based object recognition |
-
2017
- 2017-08-21 CN CN201710719332.9A patent/CN107578375B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104361589A (zh) * | 2014-11-12 | 2015-02-18 | 河海大学 | 一种基于尺度间映射的高分辨率遥感影像分割方法 |
CN106204449A (zh) * | 2016-07-06 | 2016-12-07 | 安徽工业大学 | 一种基于对称深度网络的单幅图像超分辨率重建方法 |
CN106600553A (zh) * | 2016-12-15 | 2017-04-26 | 华中科技大学 | 一种基于卷积神经网络的dem超分辨率方法 |
CN106709875A (zh) * | 2016-12-30 | 2017-05-24 | 北京工业大学 | 一种基于联合深度网络的压缩低分辨率图像复原方法 |
Also Published As
Publication number | Publication date |
---|---|
CN107578375A (zh) | 2018-01-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10943145B2 (en) | Image processing methods and apparatus, and electronic devices | |
US9485432B1 (en) | Methods, systems and apparatuses for dual-camera based zooming | |
CN107578375B (zh) | 图像处理方法及装置 | |
CN111583097A (zh) | 图像处理方法、装置、电子设备及计算机可读存储介质 | |
CN110717851A (zh) | 图像处理方法及装置、神经网络的训练方法、存储介质 | |
CN110852349A (zh) | 一种图像处理方法、检测方法、相关设备及存储介质 | |
JP2015225665A (ja) | 画像ノイズ除去方法及び画像ノイズ除去装置 | |
CN113066034A (zh) | 人脸图像的修复方法与装置、修复模型、介质和设备 | |
CN114238904A (zh) | 身份识别方法、双通道超分模型的训练方法及装置 | |
Wu et al. | LiTMNet: A deep CNN for efficient HDR image reconstruction from a single LDR image | |
CN114372931A (zh) | 一种目标对象虚化方法、装置、存储介质及电子设备 | |
CN113628115B (zh) | 图像重建的处理方法、装置、电子设备和存储介质 | |
CN107945202B (zh) | 基于自适应阈值的图像分割方法、装置及计算设备 | |
CN114037740A (zh) | 图像数据流的处理方法、装置及电子设备 | |
CN112182648A (zh) | 一种隐私图像、人脸隐私的处理方法、装置及设备 | |
CN115393868B (zh) | 文本检测方法、装置、电子设备和存储介质 | |
Zheng et al. | Joint residual pyramid for joint image super-resolution | |
CN113469898B (zh) | 基于深度学习的图像去畸变方法及相关设备 | |
CN107944343B (zh) | 视频检测方法及装置 | |
CN114897700B (zh) | 图像优化方法、校正模型的训练方法及装置 | |
CN109712094A (zh) | 图像处理方法及装置 | |
Jing et al. | Biologically motivated spiral architecture for fast video processing | |
CN117522717B (zh) | 一种图像的合成方法、装置及设备 | |
CN117593619B (zh) | 图像处理方法、装置、电子设备及存储介质 | |
CN116778951B (zh) | 一种基于图增强的音频分类方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
EE01 | Entry into force of recordation of patent licensing contract |
Application publication date: 20180112 Assignee: Apple R&D (Beijing) Co., Ltd. Assignor: BEIJING MOSHANGHUA TECHNOLOGY CO., LTD. Contract record no.: 2019990000054 Denomination of invention: Image processing method and apparatus for watch-type camera License type: Exclusive License Record date: 20190211 |
|
EE01 | Entry into force of recordation of patent licensing contract | ||
GR01 | Patent grant | ||
GR01 | Patent grant |