CN105793891A - 用于确定高分辨率输出图像的方法和设备 - Google Patents
用于确定高分辨率输出图像的方法和设备 Download PDFInfo
- Publication number
- CN105793891A CN105793891A CN201480065403.2A CN201480065403A CN105793891A CN 105793891 A CN105793891 A CN 105793891A CN 201480065403 A CN201480065403 A CN 201480065403A CN 105793891 A CN105793891 A CN 105793891A
- Authority
- CN
- China
- Prior art keywords
- resolution
- semantic
- image
- semantic component
- component
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 42
- 238000012360 testing method Methods 0.000 claims description 7
- 238000001514 detection method Methods 0.000 claims description 3
- 239000000203 mixture Substances 0.000 description 31
- 238000005516 engineering process Methods 0.000 description 22
- 230000002708 enhancing effect Effects 0.000 description 9
- 238000002372 labelling Methods 0.000 description 9
- 230000008878 coupling Effects 0.000 description 8
- 238000010168 coupling process Methods 0.000 description 8
- 238000005859 coupling reaction Methods 0.000 description 8
- 230000009466 transformation Effects 0.000 description 8
- 210000001508 eye Anatomy 0.000 description 7
- 210000004709 eyebrow Anatomy 0.000 description 7
- 239000000463 material Substances 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 238000005728 strengthening Methods 0.000 description 7
- 238000012549 training Methods 0.000 description 7
- 239000011521 glass Substances 0.000 description 6
- 210000000214 mouth Anatomy 0.000 description 6
- 210000001331 nose Anatomy 0.000 description 6
- 230000015556 catabolic process Effects 0.000 description 5
- 238000005070 sampling Methods 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 3
- 238000006731 degradation reaction Methods 0.000 description 3
- 230000001815 facial effect Effects 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- 238000011084 recovery Methods 0.000 description 3
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 239000003086 colorant Substances 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000009499 grossing Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 241000282326 Felis catus Species 0.000 description 1
- 241000898323 Microtus irani Species 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004040 coloring Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 125000001475 halogen functional group Chemical group 0.000 description 1
- 238000005286 illumination Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 230000013011 mating Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000004091 panning Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000013550 semantic technology Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4053—Scaling of whole images or parts thereof, e.g. expanding or contracting based on super-resolution, i.e. the output image resolution being higher than the sensor resolution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/50—Image enhancement or restoration using two or more images, e.g. averaging or subtraction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/12—Edge-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10004—Still image; Photographic image
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Processing (AREA)
- Editing Of Facsimile Originals (AREA)
- Image Analysis (AREA)
Abstract
一种用于确定高分辨率输出图像的系统,包括接收低分辨率图像并确定中间高分辨率图像。该系统基于输入图像检测语义特征,并基于检测出的语义特征从数据库中选择对应的语义成分。基于来自该对应的语义成分的信息修改第一中间高分辨率图像,以确定高分辨率输出图像。
Description
技术领域
本发明涉及使用基于语义技术的图像增强。
背景技术
数字图像典型地表现为像素阵列。类似地,数字视频典型地表现为一系列图像或帧,每一图像或帧均含有像素阵列。每一像素包含信息,如亮度和/或颜色信息。在许多情况下,每一像素表现为三种颜色的组合,每种颜色被定义为八位色值。
在许多情况下,图像和/或视频编码和/或传输系统降级图像内容的质量以降低存储需要和/或传输所需的带宽。在编码和/或传输图像和/或视频后,对图像和/或视频使用恢复技术,以试图从低级版本恢复到高质量的原始图像内容。图像内容的降级发生的原因有很多,比如举例来说,图像传输、图像编码、采集或显示设备的限制等等。另一方面,降级后的图像增强试图改善图像和/或视频的呈现。
在其它情况下,以初始较低分辨率提供图像内容,例如逐行扫描或隔行扫描(比如,720×480像素)。图像内容可以是以非降级方式或降级方式提供的。较低分辨率图像内容可以某种方式增强以适合在具有比该较低分辨率图像内容更高分辨率的显示器上显示,比如4K显示器(比如,3840×2160像素)。
图像和/或视频的恢复和/或增强通常是图像/视频显示系统,特别是大尺寸显示器中的处理步骤。目的之一可能是为了恢复和增强图像和/或视频中重要成分的视觉呈现,比如边缘、纹理和其它细节。另一个目的是限制在恢复和增强期间引入有害视觉伪影和/或放大已存在的伪影。一个具体的例子是限制引入或放大图像和/或视频中已存在的噪声,比如照相机噪音或压缩噪音。另一个例子是限制引入边缘或轮廓附近的伪影,它们被称为“光晕(halo)”、“下冲(undershoot)”和“过冲(overshoot)”。
许多不同的技术已被用于尝试进行图像(包括视频)细节增强,以恢复图像。许多这类技术基于采用拉普拉斯金字塔(Laplacianpyramid)的分层框架将图像分解为多个图层,包括一个平滑的低频图像和其它高频成分。然后每个图层被增强并结合到一起形成增强图像。在分解图像时,可以使用边缘保护技术来减小光晕影响。
另一个进行图像细节增强的技术涉及采用双边滤波器来获得图像在多重光照条件下的不同成分,并通过结合这些成分来增强图像的细节。可以修改双边滤波器的范围以同时进行细节增强和噪声去除。另一个技术包括从多个尺度上的局部极值获得图像振荡的信息,并利用这些信息来构建用于增强图像细节的层级。还有一个技术涉及使用小波来构建多分辨率分析框架,以将图像分解为平滑成分及其细节成分,其中小波是根据图像的边缘内容来具体构建以减小光晕影响。
另一个进行图像细节增强的技术采用滤波器来进行图像的多尺度分解。该滤波器是边缘保护性的,并且平滑化基于加权最小二乘法(WeightedLeastSquares,即WLS)优化框架。这在数学上表示为计算下式的最小值,
其中g是输入图像,u是输出图像,下标p是像素的空间位置。该函数尝试使u尽可能靠近g并通过最小化u的偏导数来实现平滑。平滑权重由ax和ay确定,而λ控制平滑量。λ值越大表示越平滑。举例来说,该技术可被用在拉普拉斯金字塔框架中以获得不同图层的摘要。
如前所述,有许多不同的技术用来增强图像和提高分辨率。例如,D.Glasner,S.Bagon,M.Irani,Super-resolutionformasingleimage,ICCV2009,描述了在输入图像中使用冗余来构建具有低分辨率/高分辨率图像配对的金字塔,并使用基于学习的方法来实现输入图像的超分辨率。例如,J.Sun,Z.Xu,H.Y.Shum,GradientProfilePrior,CVPR2008,描述了采用自然图像的大数据库来学习梯度轮廓的分布,并修改输入图像的梯度信息以匹配该分布,以获得锐化边缘并从而实现图像的超分辨率。例如,Yang,J.Wright,T.HuandandY.Ma.,Imagesuper-resolutionviasparserepresentation,IEEETIP2010,描述了采用建立在稀疏信号处理思想上的基于字典的超分辨率方法,并展示了联合简明字典如何能被训练用来学习高分辨率和低分辨率训练图像块之间的对应。H.He,W.C.Siu.,Singleimagesuper-resolutionusingaGaussianProcessRegression,CVPR2010,描述了采用高斯过程回归模型而没有任何训练数据集的超分辨率技术。R.Fattal,Upsamplingviaimposededgestatistics,SIGGRAPH2007,描述了一种超分辨率方法的使用,该方法建立在基于低分辨率和高分辨率图像的局部亮度连续性的边缘统计之间关系的基础之上。W.Freeman,T.Jones,E.Pasztor,Example-basedsuper-resolution,IEEEComputerGraphicsandApplications2002,描述使用一种从高分辨率和低分辨率图像对的训练集中幻化(hallucinate)高频细节的技术。Y.W.Tai,S.Liu,M.Brown,S.Lin,Superresolutionusingedgepriorandsingleimagedetailsynthesis,CVPR2010,描述了一种扩展梯度轮廓技术的使用,该技术使用样本纹理块来获得图像细节的改善。J.Sun,J.Zhu,m.Tappen,Contextconstrainedhallucinationforimagesuper-resolution,CVPR2010,描述了一种被公式化为能量最小框架的图像超分辨率技术,其实施不同的标准,比如高分辨率图像相对于输入图像的保真度、像素相对于离散候选实例的保真度和边缘的平滑度。该方法分析了每一像素周围区域的纹理特征,以在数据库中检索具有相似特征的片段。这里提及的所有参考文献的全文均被引入。
许多用于细节增强的现有技术,例如上文提及的,对于增强图像和/或视频是有效的。然而,这些技术仍然会导致图像对于观看者来说不美观。
考虑以下本发明的详细说明书,并结合说明附图,能够更容易理解前文以及其它部分提及的本发明的目的、特征和优点。
发明内容
发明要解决的问题
当观看图像或视频时,人们对于图像的不同区域的焦点是不同的,这取决于图像描绘的内容。图像内容的突出成分将人们的注意力吸引到图像的不同区域。例如,当观看者在看树的图像时,对于观看者来说,像树叶和树枝这样的语义成分是重要的。例如,当观看者在看面部的图像时,像眼睛、眉毛、鼻子和嘴这样的语义成分是重要的。现有的分辨率增强技术趋向于或者进行不同像素的插值,或者使用基于重建的方法,该方法包括向下采样时高分辨率图像应当准确重现低分辨率图像的假设,或者使用基于学习的方法,在该方法中使用低分辨率和高分辨率图像的训练数据集逐块地重建图像的高频细节。然而,为了以适合观看者的方式增强图像内容,需要以有效的方式基于图像内容的语义内容来修改增强的图像。
用于解决问题的方案
本发明的一个方面提供一种确定高分辨率输出图像的方法,包括:接收具有第一分辨率的低分辨率图像;基于所述低分辨率图像确定具有第二分辨率的第一中间高分辨率图像,其中所述第二分辨率大于所述第一分辨率;基于所述低分辨率图像确定具有第三分辨率的第二中间高分辨率图像,其中所述第三分辨率大于所述第一分辨率;检测所述第二中间高分辨率图像的语义特征,并基于所检测出的语义特征从数据库中选择对应的语义成分;基于来自所述对应的语义成分的信息修改所述第一中间高分辨率图像,以确定具有第四分辨率的所述高分辨率输出图像,其中所述第四分辨率大于所述第一分辨率。
本发明的另一个方面提供一种确定高分辨率输出图像的设备,包括:接收部,其接收具有第一分辨率的低分辨率图像;第一确定部,其基于所述低分辨率图像确定具有第二分辨率的第一中间高分辨率图像,其中所述第二分辨率大于所述第一分辨率;第二确定部,其基于所述低分辨率图像确定具有第三分辨率的第二中间高分辨率图像,其中所述第三分辨率大于所述第一分辨率;检测部,其检测所述第二中间高分辨率图像的语义特征;选择部,其基于所检测出的语义特征从数据库中选择对应的语义成分;以及修改部,其基于来自所述对应的语义成分的信息修改所述第一中间高分辨率图像,以确定具有第四分辨率的所述高分辨率输出图像,其中所述第四分辨率大于所述第一分辨率。
发明效果
本发明该方面能够以适合于观看者的方式增强图像内容,并以有效的方式基于图像内容的语义内容修改增强后的图像。
附图说明
图1示出使用语义内容的图像增强系统。
图2示出使用面部语义内容的图像增强系统。
具体实施方式
参见图1,该图像增强技术可以接收输入图像100,输入图像100是低分辨率图像L1102。该低分辨率图像L1102可以被用于采用任何合适的技术来确定中间高分辨率输出图像110。该中间高分辨率输出图像110优选具有比低分辨率图像L1102高的分辨率。也就是说,可以基于所述低分辨率图像L1102确定具有第二分辨率的中间高分辨率输出图像110。第二分辨率大于所述低分辨率图像L1102的第一分辨率。而且,优选该中间高分辨率输出图像110具有与输出图像相同数量的像素。再参见作为图1的示例性实施方式的图2,采用任何适当的技术,优选采用基于字典的技术来完成中间高分辨率输出图像110。而且,优选中间高分辨率输出图像210具有与输出图像相同数量的像素。术语“高分辨率”通常用来指高质量图像和/或视频数据,例如含有高频成分的图像数据和/或含有精细的细节和纹理的图像数据和/或具有锐化边缘和轮廓的图像数据和/或比输入数据具有更多像素的数据。术语“低分辨率”通常用来指在抓拍、编码或传输过程中可能已经降级的图像和/或视频数据,并且通常较之输出数据包含较少的高频成分和/或较少的细节和/或压缩伪影和/或较少的像素。
低分辨率图像L1102优选增加分辨率至一个预先设定的分辨率以用于后续处理。也就是说,可以基于所述低分辨率图像L1102确定具有第三分辨率的第二中间高分辨率图像。所述第三分辨率可以大于所述低分辨率图像L1102的所述第一分辨率。低分辨率图像L1102在增加分辨率后,可以被用于采用任何合适的技术来检测图像的语义特征120。检测出的语义特征120标识该图像的特征,这些特征承载与图像中语义对象相对应的图像区域中的语义信息。例如,图像中的特征可以是面部、树、桌子、猫、女孩、男孩、瀑布、球等。再参见作为图1的示例性实施方式的图2,优选对增加分辨率后图像采用关键点提取220来完成语义特征检测120。关键点提取220采用任何合适的技术来标识图像中语义内容的点或区域。在检测面部图像的语义内容的情况下,关键点提取可以涉及不同的面部成分。
检测出的语义特征120可以被用于选择图像的低分辨率语义成分130。可能有一个或多个语义成分130被选择,比如语义成分1132、语义成分2134、语义成分3136至语义成分n138。再参见作为图1的示例性实施方式的图2,优选对于面部成分实施检测低分辨率语义成分230的检测技术,以选择眉毛232、眼睛234、鼻子236和嘴238。语义成分230优选是点表示或者其他方式,但不是包含语义成分的所有二维像素块。这允许增强与数据库的匹配。
来自低分辨率语义成分130的信息被提供用于高分辨率语义成分140。高分辨率语义成分140可以包括高分辨率语义成分1142、高分辨率语义成分2144、高分辨率语义成分3146至高分辨率语义成分n148。高分辨率语义成分140还从高分辨率和低分辨率图像的数据库150接收每个语义成分的对应信息。数据库150可以包括具有与高分辨率语义成分140的语义成分142、144、146、148相对应的标记语义成分的高分辨率图像的数据集。针对每个成分,分别以对于数据库150的低分辨率图像的预定匹配分辨率从数据库150中选择与低分辨率语义成分132、134、136、138相对应的优选匹配。在低分辨率图像150匹配低分辨率语义成分130的分辨率时,实现较高的计算效率和适当匹配。也就是说,可以基于所检测到的语义特征120从数据库150中选择对应的语义成分140。进一步地,所述第一语义成分130可以具有第一语义分辨率。所述对应的语义成分140可以具有第二语义分辨率。而且,所述第二语义分辨率大于所述第一语义分辨率。进一步地,所述数据库150可以包括表示所述第一语义成分130和所述对应的语义成分140的信息。而且,使用该分辨率增加处理更容易有效地处理具有不同分辨率的输入图像100。
参见作为图1的示例性实施方式的图2,来自低分辨率语义成分230的信息被提供用于高分辨率语义成分240。高分辨率语义成分240可以包括眉毛242、眼睛244、鼻子246和嘴248。高分辨率语义成分240还从高分辨率和低分辨率图像的数据库250接收每个面部成分的对应信息。数据库250可以包括具有与高分辨率语义成分240的语义成分242、244、246、248相对应的来自数据库250的标记语义成分的高分辨率图像的数据库。特别地,该数据库可以基于语义标记的面部图像,具有针对每个预期姿势构建的单独数据库(或者是它的一部分)。特别地,对于面部图像,可以包括每个标记的语义成分SCi,例如眼睛、眉毛、鼻子和嘴,其中i是语义成分的标记。这种解构可以被用于其它语义图像内容及其成分。
参见图2,对于每个测试图像,该系统可以首先确定面部姿势,然后使用与该面部姿势相对应的数据库。然后,该系统可以进行2个向上采样操作。首先,可以使用朴素(naive,i是分音符)双三次插值Il来对图像进行向上采样,然后标记不同的语义成分。随后,该系统可以使用基于字典的技术对图像Dl进行向上采样。图像D1是指已经通过基于向上采样字典技术进行了向上采样的低分辨率输入图像L1。语义成分的梯度信息被转移到该图像,以获得最终的增强图像。该系统可以在I1中标记不同的语义成分。
对于测试图像Ci中的每个语义成分,其中i是语义成分的标记,该系统可以从训练数据库中确定最佳匹配的对准成分。在对准和匹配这些成分以前,该系统还可以利用具体语义内容的信息,比如关于戴眼镜的人。对于戴眼镜的人,为了对准眼睛和眉毛,该系统可以使用只来自戴眼镜的人的眼睛、鼻子和眉毛的训练例子。类似地,对于不戴眼镜的人,该系统可以使用只来自不戴眼镜的人的眼睛、鼻子和眉毛的训练例子。对于其它语义成分比如嘴,该系统可以使用整个数据库,因为眼镜不会遮挡面部的嘴区域。对于特定的成分,使‘T’作为训练数据库所考虑的图像。训练数据库事先在线下生成。训练数据库被用来重构高分辨率输出图像。最终的高分辨率输出图像可以使用来自包括在训练数据库中的语义成分的梯度信息。需要说明的是,所述数据库可以包括与同一语义内容的不同变体有关的信息。
为了评估对准成分,该系统可以在多于一个维度上对SCi做仿射变换来确定与旋转、缩放和平移有关的参数。这可以通过对数据库中的每个图像求解下式来确定
其中i表示每个语义成分的标记,A是对训练数据库中的语义成分所做的仿射变换,r是关于旋转的参数,sx是用于在X轴方向进行缩放的参数,sy是在Y轴方向上进行缩放的参数,tx是在X轴方向进行平移的参数,ty是在Y轴方向上进行平移的参数。因为该系统优选对每个语义成分标记i单独进行对准,所以该系统能够有效考虑成分的不同的表达和尺寸。该系统可以使用这些变换参数将‘T’变换以获得‘AT’。训练数据库中的图像被称为‘T’。这些图像已将不同语义成分SCi做了标记。假定有一个测试图像,其语义成分已被标记,该系统首先确定变换参数的最优值,以将这些语义成分中的每一个与测试语义成分进行对准。通过解决上述最小化问题来确定最优参数。当这些最优变换参数被确定时,该系统将其应用到‘T’,从而得到‘AT’。数学上,每个变换参数可以用矩阵来表示。变换矩阵可被称为这些矩阵的乘积。‘AT’是变换矩阵和图像‘T’的乘积。也就是说,可以使用多维度缩放操作来确定所述对应的语义成分SCi。
当该系统已经将训练数据集中的每个成分与图像的对应成分对准时,下一步可以是从这些对准成分中寻找最佳匹配成分。寻找最佳匹配成分的标准优选是梯度信息。该系统可以对‘AT’的图像进行向下采样,然后通过双三次插值对这些图像进行向上缩放以获得‘UT’。对于每个成分标记i,该系统可以定义一组关键点的凸包的区域。使p为语义成分的凸包中存在的像素。可以如下式确定每个成分标记i的最佳匹配
其中是梯度运算符,H是由成分Ci定义的凸包,x是图像UT在‘UT’中的索引。这为面部图像的每个成分提供匹配的对准成分,并且可以针对每个成分检索不同的匹配
语义成分140、240优选是可以从中提取有用特征的二维图像。再参考图1,该系统可以从所选语义成分142、144、146、148中获取每个成分160的信息。例如,该信息可以是基于边缘的信息(例如梯度信息)、基于颜色的信息、纹理信息或者与一个或多个语义成分相关的其他合适信息。再参见作为图1的示例性实施方式的图2,该系统可以获得每个成分260的梯度信息,每个成分优选被对准并缩放。此外,每个成分240的空间位置同样被保留。
可以针对图像的所有需要的语义成分重复获取每个成分160(图1)、260(图2)的信息的处理。如果需要,该系统还可以以合适的方式融合将所有信息160、260融合在一起。融合后的信息被提供用于变换处理170,变换处理170基于语义特征适合地修改中间高分辨率输出图像110以确定高分辨率输出图像180。这种方式中,根据输入图像100的语义内容进一步修改中间高分辨率输出图像,以获得更适合观看的精细化的高分辨率输出图像180,否则其就是高分辨率输出图像。
参见作为图1的示例性实施方式的图2,梯度信息260可以被融合在一起以获得变换后的梯度映射该梯度映射是包含特定图像的梯度信息的图像。然后使用方程将该梯度映射转换成对应的成分L1,其中是梯度运算符,Ei(Ih|Ll)是图像域中的重构约束,是梯度域中的重构约束,α平衡图像域约束和梯度域约束。L1是低分辨率图像,并且通过最小化对梯度域和图像域都施加约束的能量函数来构建高分辨率图像Ih。可以通过梯度下降技术使能量最小化,其中
这是一个迭代处理,并且该系统可以采用D1作为用于Ih的初始步骤,τ是步长。在迭代处理中,步长是确定迭代表达如何快收敛的因素之一。最终强化图像Ih包括强化语义成分。G是指高斯核,↓是向下采样运算符,↑是向上采样运算符。
需要注意的是,所述用于确定高分辨率输出图像的方法的每一步骤可以由硬件逻辑来配置,或者可以由CPU执行的软件来实现。也就是说,本发明包括用于确定生成高分辨率输出图像的设备,该设备包括:接收部,其接收具有第一分辨率的低分辨率图像;第一确定部,其基于所述低分辨率图像确定具有第二分辨率的第一中间高分辨率图像,其中所述第二分辨率大于所述第一分辨率;第二确定部,其基于所述低分辨率图像确定具有第三分辨率的第二中间高分辨率图像,其中所述第三分辨率大于所述第一分辨率;检测部,其检测所述第二中间高分辨率图像的语义特征;选择部,其基于所检测出的语义特征从数据库中选择对应的语义成分;以及修改部,其基于来自所述对应的语义成分的信息修改所述第一中间高分辨率图像,以确定具有第四分辨率的所述高分辨率输出图像,其中所述第四分辨率大于所述第一分辨率。
前述说明书中采用的术语或表达在此作为描述性的措辞而不是限制行的措辞来使用,并且使用这些术语或表达并没有意图排除所示或描述特征或其部分的等同变换,应当理解,本发明的范围仅由所附权利要求定义和限制。
Claims (14)
1.一种确定高分辨率输出图像的方法,其特征在于,包括:
接收具有第一分辨率的低分辨率图像;
基于所述低分辨率图像确定具有第二分辨率的第一中间高分辨率图像,其中所述第二分辨率大于所述第一分辨率;
基于所述低分辨率图像确定具有第三分辨率的第二中间高分辨率图像,其中所述第三分辨率大于所述第一分辨率;
检测所述第二中间高分辨率图像的语义特征,并基于所检测出的语义特征从数据库中选择对应的语义成分;
基于来自所述对应的语义成分的信息修改所述第一中间高分辨率图像,以确定具有第四分辨率的所述高分辨率输出图像,其中所述第四分辨率大于所述第一分辨率。
2.根据权利要求1所述的方法,其中所述第二分辨率与所述第四分辨率相同,并且所述第二分辨率以及所述第四分辨率与所述第一分辨率不同。
3.根据权利要求1所述的方法,其中所述确定所述第一中间高分辨率图像基于字典技术。
4.根据权利要求1所述的方法,其中所述检测语义特征基于关键点提取技术。
5.根据权利要求1所述的方法,其中所检测出的语义特征被用来选择第一语义成分。
6.根据权利要求5所述的方法,其中所述对应的语义成分基于所述第一语义成分。
7.根据权利要求6所述的方法,其中所述第一语义成分具有第一语义分辨率,所述对应的语义成分具有第二语义分辨率,其中所述第二语义分辨率大于所述第一语义分辨率。
8.根据权利要求7所述的方法,其中所述数据库包括代表所述第一语义成分和所述对应的语义成分的信息。
9.根据权利要求8所述的方法,其中所述数据库包括与相同语义内容的不同变体相关的信息。
10.根据权利要求7所述的方法,其中使用多维尺度操作来确定所述对应的语义成分。
11.根据权利要求1所述的方法,其中来自所述对应的语义成分的所述信息是基于边缘的信息。
12.根据权利要求11所述的方法,其中将多个对应的语义成分的所述信息结合。
13.根据权利要求1所述的方法,其中修改所述第一中间高分辨率图像基于减少能量函数。
14.一种确定高分辨率输出图像的设备,其特征在于,包括:
接收部,其接收具有第一分辨率的低分辨率图像;
第一确定部,其基于所述低分辨率图像确定具有第二分辨率的第一中间高分辨率图像,其中所述第二分辨率大于所述第一分辨率;
第二确定部,其基于所述低分辨率图像确定具有第三分辨率的第二中间高分辨率图像,其中所述第三分辨率大于所述第一分辨率;
检测部,其检测所述第二中间高分辨率图像的语义特征;
选择部,其基于所检测出的语义特征从数据库中选择对应的语义成分;以及
修改部,其基于来自所述对应的语义成分的信息修改所述第一中间高分辨率图像,以确定具有第四分辨率的所述高分辨率输出图像,其中所述第四分辨率大于所述第一分辨率。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US14/093,425 | 2013-11-30 | ||
US14/093,425 US9208539B2 (en) | 2013-11-30 | 2013-11-30 | Image enhancement using semantic components |
PCT/JP2014/005996 WO2015079712A1 (en) | 2013-11-30 | 2014-12-01 | Method and device for determining a high resolution output image |
Publications (1)
Publication Number | Publication Date |
---|---|
CN105793891A true CN105793891A (zh) | 2016-07-20 |
Family
ID=53198674
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201480065403.2A Pending CN105793891A (zh) | 2013-11-30 | 2014-12-01 | 用于确定高分辨率输出图像的方法和设备 |
Country Status (4)
Country | Link |
---|---|
US (3) | US9208539B2 (zh) |
JP (1) | JP6352420B2 (zh) |
CN (1) | CN105793891A (zh) |
WO (1) | WO2015079712A1 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109949222A (zh) * | 2019-01-30 | 2019-06-28 | 北京交通大学 | 基于语义图的图像超分辨率重建方法 |
WO2020062191A1 (zh) * | 2018-09-29 | 2020-04-02 | 华为技术有限公司 | 图像处理方法、装置及设备 |
Families Citing this family (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014154773A1 (en) * | 2013-03-27 | 2014-10-02 | Thomson Licensing | Method and apparatus for generating a super-resolved image from a single image |
CN103700062B (zh) * | 2013-12-18 | 2017-06-06 | 华为技术有限公司 | 图像处理方法和装置 |
US9256920B1 (en) * | 2014-07-25 | 2016-02-09 | Sharp Laboratories Of America, Inc. | Image enhancement using a patch based technique |
US9538126B2 (en) | 2014-12-03 | 2017-01-03 | King Abdulaziz City For Science And Technology | Super-resolution of dynamic scenes using sampling rate diversity |
EP3259911B1 (en) | 2015-02-19 | 2021-04-07 | Magic Pony Technology Limited | Enhancing visual data using updated neural networks |
US10410398B2 (en) * | 2015-02-20 | 2019-09-10 | Qualcomm Incorporated | Systems and methods for reducing memory bandwidth using low quality tiles |
EP3278559B1 (en) | 2015-03-31 | 2021-05-05 | Magic Pony Technology Limited | Training end-to-end video processes |
GB201604672D0 (en) | 2016-03-18 | 2016-05-04 | Magic Pony Technology Ltd | Generative methods of super resolution |
EP3298579B1 (en) * | 2016-04-12 | 2021-07-21 | Magic Pony Technology Limited | Visual data processing using energy networks |
US10198839B2 (en) * | 2016-09-22 | 2019-02-05 | Apple Inc. | Style transfer-based image content correction |
US10147459B2 (en) | 2016-09-22 | 2018-12-04 | Apple Inc. | Artistic style transfer for videos |
US10410084B2 (en) | 2016-10-26 | 2019-09-10 | Canon Virginia, Inc. | Devices, systems, and methods for anomaly detection |
CN108133456A (zh) * | 2016-11-30 | 2018-06-08 | 京东方科技集团股份有限公司 | 人脸超分辨率重建方法、重建设备以及计算机系统 |
US10664963B1 (en) | 2017-09-11 | 2020-05-26 | Apple Inc. | Real-time selection of DNN style transfer networks from DNN sets |
US10997712B2 (en) | 2018-01-18 | 2021-05-04 | Canon Virginia, Inc. | Devices, systems, and methods for anchor-point-enabled multi-scale subfield alignment |
CN108282664B (zh) * | 2018-01-30 | 2020-12-29 | 深圳创维-Rgb电子有限公司 | 图像处理方法、装置、系统及计算机可读存储介质 |
US10997462B2 (en) | 2018-04-04 | 2021-05-04 | Canon Virginia, Inc. | Devices, systems, and methods for clustering reference images for non-destructive testing |
CN109308679B (zh) | 2018-08-13 | 2022-08-30 | 深圳市商汤科技有限公司 | 一种图像风格转换方法及装置、设备、存储介质 |
WO2020048359A1 (en) * | 2018-09-06 | 2020-03-12 | Guangdong Oppo Mobile Telecommunications Corp., Ltd. | Method, system, and computer-readable medium for improving quality of low-light images |
CN109409503B (zh) * | 2018-09-27 | 2020-07-24 | 深圳市铱硙医疗科技有限公司 | 神经网络的训练方法、图像转换方法、装置、设备及介质 |
US11429806B2 (en) | 2018-11-09 | 2022-08-30 | Canon Virginia, Inc. | Devices, systems, and methods for anomaly detection |
US11321846B2 (en) | 2019-03-28 | 2022-05-03 | Canon Virginia, Inc. | Devices, systems, and methods for topological normalization for anomaly detection |
US11367163B2 (en) | 2019-05-31 | 2022-06-21 | Apple Inc. | Enhanced image processing techniques for deep neural networks |
US12039696B2 (en) * | 2020-03-27 | 2024-07-16 | Alibaba Group Holding Limited | Method and system for video processing based on spatial or temporal importance |
KR20210121508A (ko) | 2020-03-30 | 2021-10-08 | 삼성전자주식회사 | 이미지 신호 처리부의 동작 방법 및 이미지 신호 처리부를 포함하는 이미지 시스템 |
CN111681166B (zh) * | 2020-06-02 | 2023-04-18 | 重庆理工大学 | 一种堆叠注意力机制编解码单元的图像超分辨率重建方法 |
CN113012175B (zh) * | 2021-03-15 | 2022-10-25 | 南京理工大学 | 一种红外图像增强的道路机载场景语义分割方法 |
CN113160234B (zh) * | 2021-05-14 | 2021-12-14 | 太原理工大学 | 基于超分辨率和域自适应的无监督遥感图像语义分割方法 |
GB2617145A (en) * | 2022-03-30 | 2023-10-04 | Sony Interactive Entertainment Europe Ltd | Adaptive tile based super resolution |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1445731A2 (en) * | 2003-02-05 | 2004-08-11 | Konica Minolta Holdings, Inc. | Image processing method, image processing apparatus and image processing program |
CN101751219A (zh) * | 2008-12-05 | 2010-06-23 | 索尼爱立信移动通信日本株式会社 | 终端装置、显示控制方法和显示控制程序 |
JP2011171843A (ja) * | 2010-02-16 | 2011-09-01 | Fujifilm Corp | 画像処理方法及び装置並びにプログラム |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0645736B1 (en) * | 1993-09-27 | 2003-02-05 | Canon Kabushiki Kaisha | Image processing apparatus |
DE69815251T2 (de) * | 1997-04-02 | 2004-04-29 | Koninklijke Philips Electronics N.V. | Bildbearbeitungssystem und -verfahren |
US6678426B1 (en) * | 1997-05-13 | 2004-01-13 | Hewlett-Packard Development Company, L.P. | Programmable mapping of lower resolution digital data to a higher resolution for output on a lower resolution device |
US6195473B1 (en) * | 1997-12-26 | 2001-02-27 | International Business Machines Corporation | Non-integer scaling of raster images with image quality enhancement |
US6198505B1 (en) * | 1999-07-19 | 2001-03-06 | Lockheed Martin Corp. | High resolution, high speed digital camera |
US6937774B1 (en) * | 2000-10-24 | 2005-08-30 | Lockheed Martin Corporation | Apparatus and method for efficiently increasing the spatial resolution of images |
FR2825817B1 (fr) * | 2001-06-07 | 2003-09-19 | Commissariat Energie Atomique | Procede de traitement d'images pour l'extraction automatique d'elements semantiques |
US7386049B2 (en) | 2002-05-29 | 2008-06-10 | Innovation Management Sciences, Llc | Predictive interpolation of a video signal |
JP2004240622A (ja) * | 2003-02-05 | 2004-08-26 | Konica Minolta Holdings Inc | 画像処理方法、画像処理装置及び画像処理プログラム |
US20050060140A1 (en) * | 2003-09-15 | 2005-03-17 | Maddox Paul Christopher | Using semantic feature structures for document comparisons |
US20070103595A1 (en) | 2005-10-27 | 2007-05-10 | Yihong Gong | Video super-resolution using personalized dictionary |
US8520736B2 (en) | 2009-04-14 | 2013-08-27 | Fastvdo, Llc | Real-time superresolution and video transmission |
US8355592B1 (en) * | 2009-05-06 | 2013-01-15 | Adobe Systems Incorporated | Generating a modified image with semantic constraint |
US8731337B2 (en) | 2011-08-05 | 2014-05-20 | Adobe Systems Incorporated | Denoising and artifact removal in image upscaling |
-
2013
- 2013-11-30 US US14/093,425 patent/US9208539B2/en not_active Expired - Fee Related
-
2014
- 2014-12-01 WO PCT/JP2014/005996 patent/WO2015079712A1/en active Application Filing
- 2014-12-01 CN CN201480065403.2A patent/CN105793891A/zh active Pending
- 2014-12-01 JP JP2016534258A patent/JP6352420B2/ja not_active Expired - Fee Related
-
2015
- 2015-12-02 US US14/956,986 patent/US9460490B2/en not_active Expired - Fee Related
-
2016
- 2016-09-29 US US15/279,917 patent/US9734566B2/en not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1445731A2 (en) * | 2003-02-05 | 2004-08-11 | Konica Minolta Holdings, Inc. | Image processing method, image processing apparatus and image processing program |
CN101751219A (zh) * | 2008-12-05 | 2010-06-23 | 索尼爱立信移动通信日本株式会社 | 终端装置、显示控制方法和显示控制程序 |
JP2011171843A (ja) * | 2010-02-16 | 2011-09-01 | Fujifilm Corp | 画像処理方法及び装置並びにプログラム |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020062191A1 (zh) * | 2018-09-29 | 2020-04-02 | 华为技术有限公司 | 图像处理方法、装置及设备 |
CN112088393A (zh) * | 2018-09-29 | 2020-12-15 | 华为技术有限公司 | 图像处理方法、装置及设备 |
CN112088393B (zh) * | 2018-09-29 | 2022-09-23 | 华为技术有限公司 | 图像处理方法、装置及设备 |
CN109949222A (zh) * | 2019-01-30 | 2019-06-28 | 北京交通大学 | 基于语义图的图像超分辨率重建方法 |
Also Published As
Publication number | Publication date |
---|---|
JP6352420B2 (ja) | 2018-07-04 |
US20160093026A1 (en) | 2016-03-31 |
US9208539B2 (en) | 2015-12-08 |
WO2015079712A1 (en) | 2015-06-04 |
US9460490B2 (en) | 2016-10-04 |
US20170018063A1 (en) | 2017-01-19 |
JP2016540307A (ja) | 2016-12-22 |
US9734566B2 (en) | 2017-08-15 |
US20150154739A1 (en) | 2015-06-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105793891A (zh) | 用于确定高分辨率输出图像的方法和设备 | |
Wang et al. | Deep learning for image super-resolution: A survey | |
Zhang et al. | Image restoration: From sparse and low-rank priors to deep priors [lecture notes] | |
Fang et al. | Face completion with hybrid dilated convolution | |
Chen et al. | MICU: Image super-resolution via multi-level information compensation and U-net | |
CN113516601B (zh) | 基于深度卷积神经网络与压缩感知的图像恢复方法 | |
CN109671023A (zh) | 一种人脸图像超分辨率二次重建方法 | |
CN109214989A (zh) | 基于多方向特征预测先验的单幅图像超分辨率重建方法 | |
Guan et al. | Srdgan: learning the noise prior for super resolution with dual generative adversarial networks | |
López-Tapia et al. | A single video super-resolution GAN for multiple downsampling operators based on pseudo-inverse image formation models | |
Yang et al. | Deep learning in medical image super resolution: a review | |
CN112163998A (zh) | 一种匹配自然降质条件的单图像超分辨率分析方法 | |
Testolina et al. | Towards image denoising in the latent space of learning-based compression | |
Yang et al. | An effective and comprehensive image super resolution algorithm combined with a novel convolutional neural network and wavelet transform | |
Gao et al. | Sinco: A novel structural regularizer for image compression using implicit neural representations | |
Luo et al. | LCDA-Net: Efficient Image Dehazing with Contrast-Regularized and Dilated Attention | |
Revathi et al. | Black and White Image Colorization Using Convolutional Neural Networks | |
Li et al. | Realistic single-image super-resolution using autoencoding adversarial networks | |
Li | Image super-resolution algorithm based on RRDB model | |
Wang et al. | Two-stream deep sparse network for accurate and efficient image restoration | |
Kou et al. | Learned NIR&VISCAM: multi-spectral fusion for large depth-of-field computational imaging | |
Nie et al. | Image restoration from patch-based compressed sensing measurement | |
Aarizou et al. | Perceptual-based super-resolution reconstruction using image-specific degradation estimation | |
Hu et al. | MAUN: Memory-Augmented Deep Unfolding Network for Hyperspectral Image Reconstruction | |
CN118071865B (zh) | 一种脑梗ct到t1的医学图像跨模态合成方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20160720 |