CN102047287A - 利用稀疏变换的图像/视频质量增强和超分辨率 - Google Patents
利用稀疏变换的图像/视频质量增强和超分辨率 Download PDFInfo
- Publication number
- CN102047287A CN102047287A CN2008801295826A CN200880129582A CN102047287A CN 102047287 A CN102047287 A CN 102047287A CN 2008801295826 A CN2008801295826 A CN 2008801295826A CN 200880129582 A CN200880129582 A CN 200880129582A CN 102047287 A CN102047287 A CN 102047287A
- Authority
- CN
- China
- Prior art keywords
- conversion
- subframe
- version
- medium
- accordance
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000009466 transformation Effects 0.000 title claims description 13
- 238000000844 transformation Methods 0.000 title 1
- 238000000034 method Methods 0.000 claims abstract description 104
- 230000003044 adaptive effect Effects 0.000 claims abstract description 43
- 238000006243 chemical reaction Methods 0.000 claims description 130
- 238000005070 sampling Methods 0.000 claims description 49
- 230000005540 biological transmission Effects 0.000 claims description 8
- 238000004891 communication Methods 0.000 claims description 5
- 238000004519 manufacturing process Methods 0.000 claims 6
- 238000012805 post-processing Methods 0.000 claims 2
- 238000012545 processing Methods 0.000 description 106
- 230000006870 function Effects 0.000 description 24
- 238000005516 engineering process Methods 0.000 description 21
- 230000008569 process Effects 0.000 description 18
- 238000010586 diagram Methods 0.000 description 16
- 230000002708 enhancing effect Effects 0.000 description 13
- 238000012546 transfer Methods 0.000 description 9
- 238000007906 compression Methods 0.000 description 8
- 230000006835 compression Effects 0.000 description 8
- 230000003247 decreasing effect Effects 0.000 description 6
- 238000004422 calculation algorithm Methods 0.000 description 5
- 238000001914 filtration Methods 0.000 description 5
- 238000012549 training Methods 0.000 description 5
- 230000004304 visual acuity Effects 0.000 description 5
- 230000015572 biosynthetic process Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000004088 simulation Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 238000004590 computer program Methods 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000001965 increasing effect Effects 0.000 description 2
- 238000004321 preservation Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000013144 data compression Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 230000004438 eyesight Effects 0.000 description 1
- 238000009432 framing Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000003032 molecular docking Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
- 238000007639 printing Methods 0.000 description 1
- 230000001915 proofreading effect Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 238000005728 strengthening Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformations in the plane of the image
- G06T3/40—Scaling of whole images or parts thereof, e.g. expanding or contracting
- G06T3/4084—Scaling of whole images or parts thereof, e.g. expanding or contracting in the transform domain, e.g. fast Fourier transform [FFT] domain scaling
Landscapes
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Image Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Studio Devices (AREA)
Abstract
这里公开一种用于质量增强/超分辨率技术的方法和设备。在一个实施例中,所述方法包括接收第一分辨率的第一版本的媒体,和利用至少一种变换和自适应阈值化来创建第二分辨率的第二版本的媒体,所述第二分辨率高于或等于第一分辨率。
Description
技术领域
本发明总体上涉及图像/视频信号处理。更具体地说,本发明涉及增强图像/视频信号的质量,和/或提高图像/视频信号的空间分辨率。
背景技术
目前,图像和视频信号处理广泛用在许多应用中。常常需要特定分辨率的图像或视频,然而只能获得较低分辨率的图像或视频。在这种情况下,使用多种方法来利用较低分辨率版本的图像创建较高分辨率的图像。这些现有方法包括对较低分辨率图像或视频应用线性或简单的非线性插值滤波器。
使用线性或非线性插值滤波器的例子包括比如在Gonzalez &Woods,“Digital Image Processing”(Pearson Education(第二版))中说明的双线性插值滤波器;在ITU-T Recommendation H.264 & ISO/IEC14496-10(MPEG-4)AVC,“Advanced Video Coding for Generic Audiovisual Services”,版本3:2005年中说明的线性插值滤波器;和在Vatis & Ostermann,“Locally Adaptive Non-Separable Interpolation Filter for H.264/AVC”,IEEE ICIP,2006年10月中说明的不可分插值滤波器。不过,这三种技术中的每一个可适用于具有平滑变化的像素值的图像/视频帧。这是因为这三种技术是利用平滑图像模型得到的,并且滤波器一般局限于低通滤波器。从而,它们并不适用于许多类型的区域,比如倾斜边缘、纹理等。此外,至少就ITU-T Recommendation H.264及Vatis & Ostermann来说,这两种技术只适用于其中使用被移动小部分像素的先前的一帧或多帧来预测当前帧的视频压缩应用。
另外,存在非常简单的基于变换的方法,用于提高图像/视频的分辨率,不过需要大量的迭代。在Guleryuz,“Predicting Wavelet Coefficients Over Edges Using Estimates Based on Nonlinear Approximants”,Proc.Data Compression Conference,2004年4月中说明了一个这样的例子。
不过,这种技术局限于并不适用于倾斜边缘和纹理的具有各种简化的块变化,并且涉及基本方法的多次迭代以获得良好的质量,从而复杂性惊人地昂贵。
发明内容
这里公开一种用于质量增强/超分辨率技术的方法和设备。在一个实施例中,所述方法包括接收第一分辨率的第一版本的媒体,和利用至少一种变换和自适应阈值化,创建第二分辨率的第二版本的媒体,所述第二分辨率高于或等于第一分辨率。
附图说明
根据下面给出的详细说明,以及根据本发明的各个实施例的附图,将更充分地理解本发明,不过,所述各个实施例不应被理解成把本发明局限于具体实施例,相反只是为了说明和理解。
图1A是进行媒体的质量增强/超分辨率的处理的一个实施例的流程图。
图1B是系统的方框图,图解说明质量增强/超分辨率技术的一个实施例对于压缩视频的应用情形。
图1C是系统的方框图,图解说明质量增强/超分辨率技术的一个实施例对于非压缩视频的应用情形。
图2是增强质量和/或提高分辨率的处理的一个实施例的流程图。
图3是上采样处理的一个实施例的流程图。
图4A-4M图解说明与子帧类型库对应的遮罩(mask)的例子。
图5表示当按光栅扫描顺序对像素编号时在像素I处的例证子帧zi。
图6是子帧选择处理的一个实施例的流程图。
图7是子帧的变换选择处理的一个实施例的流程图。
图8是阈值化变换系数的阈值化处理的一个实施例的流程图。
图9图解说明单调递减的阶梯函数。
图10是组合子帧以形成帧的处理的一个实施例的流程图。
图11是数据一致性操作的一个实施例的数据流图。
图12是例证的计算机系统的方框图。
图13A-E图解说明所选像素的样本子集。
具体实施方式
说明增强视频和/或图像的质量的增强技术。在一个实施例中,该技术还起分别产生与低分辨率输入图像和/或视频对应的高分辨率图像和/或视频的超分辨率技术的作用。在一个实施例中,这是通过对低分辨率和/或视频中的每个像素位置增加多个像素位置来实现的。为了本文的目的,增加的像素位置已知为插值位置,来自低分辨率图像的位置已知为原始位置。
在下面的说明中,陈述了众多的细节,以更彻底地说明本发明。不过,对本领域的技术人员来说,显然可在没有这些具体细节的情况下实践本发明。在其它情况下,以方框图的形式而非详细地表示了公知的结构和设备,以避免模糊本发明。下面的详细说明的一些部分是按照对于计算机存储器内的数据比特的算法和运算的符号表示给出的。这些算法说明和表示是数据处理领域内的技术人员用于向本领域的其他技术人员最有效地传达其工作的实质的手段。算法在这里并且通常被认为是产生希望结果的自相一致的一系列步骤。所述步骤是要求物理量的物理处理的步骤。这些物理量通常(不过并非必须)表现为能够被保存、传送、组合、比较和以其它方式操纵的电信号或磁信号的形式。已表明有时便利的是把这些信号称为比特、值、元素、符号、字符、项、数字等,主要是因为常用。不过,应记住所有这些和类似术语都与适当的物理量关联,并且仅仅是应用于这些物理量的便利标记。除非另有明确说明,像根据下面的论述显然的那样,否则要认识到在整个说明中,利用诸如“处理”或“计算”或“运算”或“确定”或“显示”之类术语的论述指的是操纵并把表示成计算机系统的寄存器和存储器内的物理(电子)量的数据变换成类似地表示成计算机系统存储器或寄存器或者其它这样的信息存储设备、传输或显示设备内的物理量的其它数据的计算机系统,或类似的电子计算设备的动作和处理。
本发明还涉及执行这里的操作的设备。该设备可以是为所需用途专门构成的,或者它可包括由保存在计算机中的计算机程序有选择地启动或重新配置的通用计算机。这样的计算机程序可被保存在计算机可读存储介质中,比如(但不限于)任何种类的磁盘,包括软盘、光盘、CD-ROM和磁光盘、只读存储器(ROM)、随机存取存储器(RAM)、EPROM、EEPROM、磁卡或光卡,或者适合于保存电子指令的任何种类的介质,并且每种都与计算机系统总线耦接。
这里给出的算法和显示并不固有地涉及任何特殊的计算机或其它设备。各种通用系统可以和按照这里的教的程序一起使用,或者可证明便利的是构成更专门的设备来执行所需要的方法步骤。各种各样的这些系统的所需结构将从下面的说明中显现出来。另外,并未参照任何特殊的编程语言说明本发明。要认识到可以使用各种编程语言来实现这里说明的本发明的教导。
机器可读介质包括以机器(例如,计算机)可读的形式保存或传送信息的任何机构。例如,机器可读介质包括只读存储器(ROM);随机存取存储器(RAM);磁盘存储介质;光学存储介质;闪速存储设备;电、光、声或其它形式的传播信号(例如,载波、红外信号、数字信号等);等等。
概述
公开了媒体(例如,图像、视频等)的快速和高性能质量增强和/或超分辨率技术。这些技术允许由低质量、低分辨率的图像和视频呈现高质量和高分辨率(如果需要的话)的媒体(例如,图像、视频等)。在一个实施例中,这些技术使得能够实现视频序列的高质量超分辨率重构(缩放)。
在一个实施例中,作为一种超分辨率技术,利用翘曲变换和自适应阈值化,产生更高分辨率的媒体。对翘曲变换来说,变换被翘曲,以对准边缘,导致对方向性边缘和角落的稀疏表示。与现有技术相比,翘曲变换的使用导致沿方向性边缘和角落的锐度增大。在一个实施例中,根据局部边缘方向,选择翘曲变换,以呈现最高质量的输出视频。可在每个像素独立地,或者对于像素的块一起,发生这种选择。例证的块大小为2×2、3×3、4×4、2×4、4×2等。
空间自适应阈值的使用使得能够按照局部信号统计量实现阈值的调制,这允许借助仅两次迭代,就获得很高的质量。与需要10次迭代来获得相似质量的某些现有技术相比,迭代次数要少得多。
图1A是进行媒体的质量增强/超分辨率重构的处理的一个实施例的流程图。该处理由处理逻辑执行,所述处理逻辑包括硬件(电路、专用逻辑等),软件(比如运行于通用计算机系统或专用机器上的软件),或者硬件和软件的组合。
参见图1A,通过处理逻辑接收第一分辨率的第一版本的媒体(例如,图像、视频等),开始所述处理(处理方框130)。在接收第一版本的媒体之后,处理逻辑利用至少一次翘曲变换和自适应阈值化,创建第二分辨率的第二版本的媒体,所述第二分辨率高于或等于第一分辨率(处理方框131)。
在一个实施例中,作为迭代处理的结果创建第二版本的媒体。在一个实施例中,所述迭代处理只经过两次迭代。
在一个实施例中,通过对子帧应用所述至少一次翘曲变换(例如,2D可分离DCT)以创建变换系数,进行第二版本的媒体的创建。在一个实施例中,所述方法包括在通过上采样第一版本的媒体而产生的图像中自适应地选择子帧,以致对子帧应用翘曲变换以产生变换系数包括对图像中的每个所选子帧应用变换。在一个实施例中,在图像中的每个像素处自适应地选择子帧。在一个实施例中,自适应阈值化包括空间自适应阈值的应用,创建第二版本的媒体包括计算自适应阈值,并利用自适应阈值,阈值化变换系数。
在一个实施例中,超分辨率技术包括选择2-D滤波器,并利用2-D滤波器上采样输入的图像/视频帧;选择起始于上采样帧的任意像素处的子帧,和在上采样帧中的每个像素处,形成子帧并对该子帧应用像素自适应翘曲变换;得到每个子帧的细节保持自适应阈值,利用硬阈值化(例如,如果变换系数的量值小于阈值,那么设为0)或者诸如软阈值化之类的其它方法,阈值化该子帧的变换系数,和对阈值化的变换系数应用逆变换以形成处理后的子帧;对处理后的子帧进行组合操作,以获得上采样帧的更好估计;和可选地对上采样帧进行校正操作,以实现上采样帧和输入帧之间的数据一致性。这些操作构成一次迭代,并产生超分辨率估计。在一个实施例中,重复从子帧选择到校正的操作,以进一步改进超分辨率估计。
在一个实施例中,质量增强技术包括选择起始于输入图像/视频帧的任意像素处的子帧,在输入帧中的每个像素处,形成子帧并对该子帧应用像素自适应翘曲变换;得到每个子帧的细节保持自适应阈值,利用硬阈值化(例如,如果变换系数的量值小于阈值,那么设为0)或者诸如软阈值化之类的其它方法,阈值化该子帧的变换系数,和对阈值化的变换系数应用逆变换,以形成处理后的子帧;对处理后的子帧进行组合操作,以获得增强质量版本的输入帧。这些操作构成一次迭代,并产生增强质量估计。在一个实施例中,重复整个处理,以进一步提高质量。
在一个实施例中,这里说明的技术使分辨率提高任意倍数。即,超分辨率技术的使用并不局限于分辨率的整数倍(例如2X,3X等)提高。超分辨率技术可把分辨率提高任意倍数(例如,1.2X,1.5X,2.6X等)。在一个实施例中,在借助或不借助边信息(side information)的帮助下,这里说明的技术被应用于压缩/非压缩图像/视频信号。图1B是系统的方框图,图解说明这里说明的技术的一个实施例对于压缩视频的应用情形。每个方框可包括硬件(电路、专用逻辑等),软件(比如运行于通用计算机系统或专用机器上的软件),或者硬件和软件的组合。参见图1B,低分辨率(LR)照相机101捕获低分辨率图像/视频,所述低分辨率图像/视频被发给视频/图像编码器102,以便压缩。利用通信平台103在空间和/或时间中传送编码视频,并且编码视频被发给视频/图像解码器104,以便解压缩。解码的视频113被发给超分辨率发生器和/或视频质量增强器105,以便进行这里说明的处理。超分辨率发生器和/或视频质量增强器105的输出被发给诸如LR显示器106或高分辨率(HR)显示器107之类的显示器。在一个实施例中,LR照相机101和编码器102发送照相机边信息110和编码器边信息111(表示成虚线),照相机边信息110和编码器边信息111被组合以形成可被超分辨率发生器和/或视频质量增强器105使用的边信息112。边信息可由任意的参数(例如,关于LR照相机101的信息(例如,透镜种类),量化步长等),或者对于质量增强和超分辨率技术的选择/模式决定组成。例如,某一边信息可帮助确定应使用哪种插值技术。边信息可包括默认设置。按照这种方式,边信息允许这里说明的技术被定义成不同的设置。在一个实施例中,边信息是代表不同选择的值的向量。用信号通知边信息的一种简单方式如下:令OP表示代表边信息的向量。利用该向量中的两个元素用信号通知每种选择。对第n种选择来说,OP(2*n)=代表选择的值。OP(2*n)需要被设定,并且只有当OP(2*n-1)=1才被使用。
图1C是系统的方框图,图解说明对于非压缩视频的这里说明的技术的一个实施例的应用情形。每个方框可包括硬件(电路、专用逻辑等),软件(比如运行于通用计算机系统或专用机器上的软件),或者硬件和软件的组合。参见图1C,LR照相机101捕获低分辨率图像/视频,所述低分辨率图像/视频被发给超分辨率发生器和/或视频质量增强器105,以便进行这里说明的处理。超分辨率发生器和/或视频质量增强器105的输出被发给诸如LR显示器106或HR显示器107之类的显示器。在一个实施例中,LR照相机101发送可被超分辨率发生器和/或视频质量增强器105使用的边信息121(表示成虚线)。如上所述,边信息可由任意的参数(例如,关于LR照相机101的信息),或者对于质量增强和超分辨率技术的选择/模式决定组成。如上所述,边信息允许质量增强和超分辨率技术被定制成不同的设置。
质量增强/超分辨率技术的一个实施例
图2是进行质量增强和提高分辨率的处理的一个实施例的流程图。该处理由处理逻辑执行,所述处理逻辑可包括硬件(电路、专用逻辑等),软件(比如运行于通用计算机系统或专用机器上的软件),或者硬件和软件的组合。
参见图2,x表示低分辨率(LR)的输入图像/视频帧。在一个实施例中,通过按光栅扫描顺序排列像素,把所有图像/视频帧表示成向量。另一方面,数据可被表示和/或保存为向量、矩阵或者任何其它格式。
首先,处理逻辑对输入帧x进行上采样,以获得上采样帧y(处理方框201)。通过利用被选择以得到输入帧x的上采样帧(y)的上采样2-D滤波器,可进行所述上采样。图3图解说明上采样处理的一个例子,并将在下面更详细地说明。注意当把这里说明的技术用于质量增强时,该操作是可选择的。当不执行该操作时,帧y被设定成等于帧x。
在上采样输入帧x以获得上采样帧y之后,对于每个像素i=1∶N,处理逻辑选择以像素i为中心点(pivot)的子帧zi(处理方框202)。N代表y中的像素的数目。在这个实施例中,对于图像中的每个像素形成和处理子帧。不过,在另一个实施例中,可以只对选择的像素子集,而不是对图像中的所有像素进行处理。子集可以是预定的,或者作为边信息的一部分被用信号通知。图13A-E图解说明这种子集的例子;其它子集可以和这里说明的教导一起使用。
在选择以像素i为中心点的子帧zi之后,处理逻辑选择变换Hi,并通过对子帧zi应用变换Hi,计算系数di(处理方框203)。在一个实施例中,所述变换是2-D DCT。在另一个实施例中,所述变换是2-D Hadamard变换。主阈值是可用于选择变换的输入。
在产生系数di之后,处理逻辑把主阈值应用于系数di以获得计算自适应阈值并把自适应阈值应用于系数di以自适应地对系数di阈值化,从而获得(处理方框204)。处理逻辑随后对阈值化系数应用逆变换以获得处理后的子帧(处理方框205)。随后,处理逻辑按照加权的方式组合与所有像素对应的所有处理后的子帧从而形成帧(处理方框206)。随后,处理逻辑对帧执行数据一致性步骤,以获得帧y′(处理方框207)。数据一致性步骤被定义为:
之后,处理逻辑确定是否需要更多的迭代(处理方框208)。在一个实施例中,迭代的次数为2。可以作为边信息的一部分,用信号通知迭代的实际次数。如果需要更多的迭代,那么处理转移到处理方框220,在处理方框220,处理逻辑计算新的主阈值并把帧y设定成等于y′(处理方框211),之后处理转移到处理方框202。如果处理逻辑确定不需要更多的迭代,那么处理转移到处理方框209,在处理方框209,处理逻辑输出帧y′,并且处理结束。注意在一个实施例中,处理方框201的线性插值操作和处理方框206的数据一致性操作是可选的。如果不进行线性插值操作(例如,通过禁用线性插值模块),那么视频/图像的输出分辨率与输入分辨率相同。从而,按照这个实施例,图像/视频的质量被提高,但是不存在超分辨率。
上采样处理
可按照各种方式选择上采样滤波器,以反转由下采样操作或者由于输入设备的物理限制造成的低通滤波。在输入设备是照相机的情况下,这些物理限制可包括(但不限于)自然分辨率、光学聚焦和快门速度。在一个实施例中,这种低通滤波被模拟成任意有限抽头滤波器或者模拟成小波滤波器的LL频带,比如Daubechies或Le Gall小波。在一个实施例中,低通滤波器被模拟成Daubechies 7/9小波,对应的逆小波滤波器被用于获得帧y。注意本发明的实施例并不局限于利用这些方法得到的上采样滤波器。可以使用能够提高图像/视频的分辨率的模块,包括(但不限于)任何上采样滤波器,比如双线性、双三次和H.264插值滤波器。
定义低通滤波器和/或上采样滤波器的参数可被包括在边信息(例如边信息112,边信息121等)中。
在一个实施例中,当低通滤波器被模拟成小波滤波器(LL频带)时,上采样滤波器是逆小波滤波器,当低通滤波器被模拟成任意有限抽头滤波器时,上采样滤波器是就原始帧和通过使原始帧连续通过低通滤波器和上采样滤波器而获得的帧之间的MSE来说最佳的维纳(Wiener)滤波器。在一个实施例中,最佳的滤波器取决于原始帧,并且是利用边信息,对每个像素独立地用信号通知的。
在一个实施例中,利用逆小波滤波器或者像素自适应维纳滤波器对输入帧x进行上采样和滤波,从而获得帧y。图3是上采样处理的一个实施例的流程图。该处理由处理逻辑执行,所述处理逻辑可包括硬件(电路、专用逻辑等),软件(比如运行于通用计算机系统或专用机器上的软件),或者硬件和软件的组合。
参见图3,通过利用低通滤波器的参数,处理逻辑确定低通滤波器是否被模拟成小波滤波器的LL频带(处理方框301)。这使处理逻辑可以把低通滤波器分类成小波滤波器,或者不分类成小波滤波器。如果处理逻辑确定低通滤波器是小波滤波器,那么处理逻辑用上采样器311对输入帧x进行上采样,并对输入帧x应用逆小波滤波器,从而获得帧y(处理方框303)。如果处理逻辑确定低通滤波器不是小波滤波器,那么处理逻辑用上采样器310对输入帧x进行上采样,并对输入帧x应用像素自适应维纳滤波器,以获得帧y(处理方框302)。
子帧选择处理
在完成上采样处理并且获得帧y之后,开始图2的处理方框202的子帧选择处理。子帧类型S被定义成M2×1整数值向量。为了本文的目的,M可以是大于0的任意整数。{S1,S2,S3,...}是子帧类型库。对于其中像素按光栅扫描顺序被编号的帧y中的每个所选像素i来说,从所述子帧类型库中选择子帧类型si,并将向量pi形成为其中是所有元素都等于1的M2×1向量。在一个实施例中,对未被选择的像素来说,pi是零向量。称为子帧的M2×1向量zi是用在与pi的元素对应的位置处的帧y的像素值形成的。像素i被称为子帧zi的中心点。图5表示当按光栅扫描顺序对像素编号时,在像素i处的例证子帧zi。参见图5,通过按照光栅扫描顺序从“1”开始对像素编号,发生像素的光栅扫描排序。子帧被表示成以像素i为中心点。子帧被组织成称为翘曲行的M个向量。第一翘曲行具有按1~M的顺序的子帧元素1~M;第二翘曲行具有元素(M+1)~2M;等等。在一个实施例中,M等于4,子帧类型库对应于在图4A-4M中图解说明的一组遮罩(mask)。参见图4A-4M,就该子帧库来说,遮罩对应于如用箭头所示的不同方向。这里,把图4A中的遮罩称为规则遮罩,因为它对应于规则的水平或垂直方向。其它遮罩被称为方向性遮罩,因为它们对应于非平凡(non-trivial)方向。遮罩中的像素(′a′~′p′)的差分位置(Ω)被定义为Ω=CC+W×CR,其中W是帧y的宽度。CC是为了到达关心的当前像素的列,需要从像素′a′的列开始向右水平移动的列数。CR是为了到达关心的当前像素的行,需要从像素′a′的行开始向下垂直移动的行数。例如,就图4H中的遮罩来说,像素′c′具有CC=-1,和CR=2。与遮罩对应的子帧类型是包含该遮罩中从′a′排序到′p′的像素的差分位置的向量。
在一个实施例中,通过选择总是对应于规则遮罩的子帧类型,进行像素的子帧类型的选择。在另一个实施例中,对于每个选择的像素,(1)通过关于每个子帧类型,估计在形成的子帧内的2-D DCT,(2)通过关于给定的阈值T,选择使量值大于T的非零变换系数的数目最小化的子帧类型,进行像素的子帧类型的选择。在又一个实施例中,通过关于每个选择的像素,选择使在所有翘曲行内平均的像素值的翘曲行方差最小化的子帧类型,进行像素的子帧类型的选择。在再一个实施例中,通过对于K×L像素的块,使每个像素对子帧类型进行投票(根据使在所有翘曲行内平均的像素值的翘曲行方差最小化的子帧类型),并选择对于K×L块中的所有像素而言具有最多票数的子帧类型,进行像素的子帧类型的选择,其中K和L可以是大于0的整数。在一个实施例中,K和L都被设定为4。在再一个实施例中,通过对于每个像素形成K×L像素的块,并通过对该像素块使用前述投票方案选择子帧类型,进行像素的子帧类型的选择。在每种情况下,选择的子帧类型被用于当前像素。从而,通过把这些测量的统计量之一用于每个遮罩,进行子帧的选择。
注意,可以使用除图4A-4M中的遮罩之外的遮罩。
图6是子帧选择处理的一个实施例的流程图。该处理由处理逻辑执行,所述处理逻辑可包括硬件(电路、专用逻辑等),软件(比如运行于通用计算机系统或专用机器上的软件),或者硬件和软件的组合。
参见图6,通过处理逻辑接收帧y并确定子帧是否是像素自适应的,开始该处理(处理方框601)。如果子帧不是像素自适应的,那么处理逻辑为所有像素选择规则子帧类型(处理方框602)。如果子帧y的子帧是像素自适应的,那么对于每个像素,处理逻辑标记使翘曲行方差最小化的子帧类型(处理方框603)。这是利用如上所述的子帧类型库(620)实现的。从而,对于每个像素,标记子帧类型库之中的使翘曲行方差最小化的子帧类型。
随后,处理逻辑确定选择是否是基于块的(处理方框604)。如果处理逻辑确定选择是基于块的,那么处理逻辑计数每个块中的标记每种子帧类型的像素的数目(处理方框606),并且对于块中的所有像素,处理逻辑选择由该块中的最多像素标记的子帧类型(处理方框607)。换句话说,如果选择是基于块的,那么对于该块中的所有像素,选择由块中的最多像素标记的子帧类型。如果处理逻辑确定选择不是基于块的,那么对于每个像素,处理逻辑选择由该像素标记的子帧类型(处理方框605)。换句话说,每个像素选择它自己标记的子帧类型。
每个像素的子帧类型的选择可以是边信息的一部分。
变换选择和应用
在选择子帧zi之后,利用像素自适应翘曲变换Hi,子帧zi被变换成di。这里该变换被称为“翘曲”变换,因为变换基的支持物(support)已被翘曲,以匹配子帧类型。由于除了子帧类型的选择可因像素而异之外,以不同像素为中心点的子帧可使用不同的变换,因此该变换被认为是像素自适应的。在一个实施例中,从变换库(例如可分离2-D Hadamard,可分离DCT,不可分DCT,2-D Gabor小波,可操纵金字塔,2-D方向小波,曲波和轮廓波)中选择变换Hi。应注意在被翘曲之后,可分离变换变成不可分离。选择可以是事先固定的,或者可以自适应于以不同像素为中心点的不同子帧。在一个实施例中,在自适应的情况下,选择的变换是绝对值大于主阈值的系数的数目最少的一种变换。在一个实施例中,变换的选择是边信息的一部分。图7中图解说明了子帧的变换选择处理的一个实施例的流程图。
参见图7,该处理由处理逻辑执行,所述处理逻辑可包括硬件(电路、专用逻辑等),软件(比如运行于通用计算机系统或专用机器上的软件),或者硬件和软件的组合。通过处理逻辑测试变换是否是像素自适应的,开始该处理(处理方框701)。可通过查阅列表,进行所述测试。在一个实施例中,所述列表可以是变换是非自适应变换的列表。在另一个实施例中,可以将所述列表作为边信息的一部分用信号通知。如果处理逻辑确定变换是非像素自适应的,那么处理逻辑选择2-D标准正交可分离DCT用作所述变换,并通过把该变换应用于子帧zi,产生变换系数di(处理方框702)。如果处理逻辑确定变换是像素自适应的,那么对于变换库{H1,H2,....}中的每种变换Hj(处理方框703),处理逻辑利用下面的公式计算变换系数dj:
dj=Hj×zi。
变换系数dj对应于变换Hj。
随后,对于每个j,处理逻辑计数dj中的绝对值大于主阈值的系数的数目(处理方框705),并从变换库中选择具有最小计数Hk的变换,把变换Hi设定成等于对应于最小计数(Hk)的变换,随后把系数di设定成等于变换系数dk(处理方框706)。
阈值化
作为在选择变换之后发生的阈值化处理的一部分,在一个实施例中,对变换系数di应用细节保持自适应阈值以获得这里把阈值称为细节保持,因为其值是适应的,以致图像/视频帧中的高频细节被保持。通过利用主阈值变换系数di也被阈值化,以获得可按照各种方式进行阈值化操作。在一个实施例中,利用硬阈值化,进行阈值化操作。在另一个实施例中,利用软阈值化,进行阈值化操作。硬阈值化操作被定义为其中T是使用的阈值。类似地,以T作为阈值的软阈值化操作被定义为
阈值化的结果可与损失的能量进行比较。如果失去过多的信号能量,那么对该特定区域来说,阈值可能过高,从而必须被降低。
其中f()代表函数。
函数f()是如图9中图解说明的单调递减阶梯函数。在一个实施例中,使用的函数是查寻表,所述查寻表可以是边信息的一部分。参见图9,表示了在自适应阈值化处理中使用的单调递减阶梯函数的形状。参数(f1,f2,...,fn)和(E1,E2,...,En)完全定义该函数。根据训练集调整函数(f1,f2,...,fn和E1,E2,...,En)的步进位置,从而在重构的图像/视频质量方面达到局部最佳。
对的可能值进行搜索,以使中的非零元素的数目最小化以致其中与整个图像相对照,local指的是图像的局部部分。Elocal可以是边信息的一部分,或者可以使用默认值。这可被看作对于算法的设置。在一个实施例中,通过根据训练集进行调整,并选择在重构的图像/视频质量方面达到局部最佳的值,可获得默认值。
对的可能值进行联合搜索以使对所有k∈{1,2,...,N}求和的中的非零元素的总数最小化,以致其中global指的是整个图像。Eglobal可以是边信息的一部分,或者可以使用默认值。这可被看作对于算法的设置。在一个实施例中,通过根据训练集进行调整,并选择在重构的图像/视频质量方面达到局部最佳的值,可获得默认值。
在一个实施例中,使用选项硬阈值化被用于阈值化操作。阈值化处理中的不同参数可以是边信息的一部分。
图8是对于阈值化变换系数di的阈值化处理的一个实施例的流程图。该处理由处理逻辑执行,所述处理逻辑可包括硬件(电路、专用逻辑等),软件(比如运行于通用计算机系统或专用机器上的软件),或者硬件和软件的组合。
按照这种方式,处理逻辑把绝对值小于主阈值的所有系数设为0,这些系数被保存为
随后,处理逻辑确定阈值是否是自适应的(处理方框802)。可通过查阅列表执行该测试。在一个实施例中,列表可以是阈值是非自适应阈值的列表。在另一个实施例中,将所述列表作为边信息的一部分用信号通知。如果处理逻辑确定未使用自适应阈值,那么处理逻辑直接从复制输出系数(处理方框803)。如果处理逻辑确定使用自适应阈值,那么处理逻辑如下所示,将自适应阈值计算为主阈值和绝对值(di和之间的L-2范数)的单调递减函数的乘积(处理方框804):
随后对于每个元素,处理逻辑按照下面的公式计算对应元素dij∈di(处理方框805):
组合子帧
L-p范数选项(p≥0):其中nmin是常数。
其中p≥0,函数g()是与在图9中图解说明的函数f()类似的单调递减阶梯函数。根据训练集调整函数(f1,f2,...,fn和E1,E2,...,En)的步进位置,从而在重构的图像/视频质量方面达到局部最佳。
其中p≥0,函数g()是与在图9中图解说明的函数f()类似的单调递减阶梯函数。根据训练集调整函数(f1,f3,...,fn和E1,E2,...,En)的步进位置,从而在重构的图像/视频质量方面达到局部最佳。
计算的权重wi可以是边信息的一部分。
设并且nj=0,其中nj是第j个像素的归一化系数。
如果像素j是pi的一部分
那么k=pi中的像素j的索引。
nj=nj+wi
图10是组合所有处理后的子帧以形成帧的处理的一个实施例的流程图。该处理由处理逻辑执行,所述处理逻辑可包括硬件(电路、专用逻辑等),软件(比如运行于通用计算机系统或专用机器上的软件),或者硬件和软件的组合。
在初始化之后,处理逻辑确定是否像素j∈pi(处理方框1003)。如果是,那么处理转移到处理方框1004。如果否,那么处理转移到处理方框1005。
nj=nj+wi
在处理方框1005,处理逻辑检查是否索引i=N,N是帧中的像素的总数。如果是,那么处理转移到处理方框1007。如果否,那么处理转移到处理方框1006。在处理方框1006,索引被加1,处理转移到处理方框1003。在处理方框1007,处理逻辑按照下面的等式更新
在更新之后,处理逻辑把索引i设成等于1(处理方框1008),并检查索引j是否等于N(处理方框1009)。如果是,那么处理结束。如果否,那么处理转移到处理方框1010,在处理方框1010,索引j被加1。在把索引j加1之后,处理转移到处理方框1003。
就视频来说,在一个实施例中,组合操作还包括基于前一帧的估计,以模仿自回归处理。这确保在具有许多高频细节的区域中的平滑视频重放。在数学上,这被表示成:
其中α代表自回归系数。在一个实施例中,α=0.5。在另一个实施例中,α可以是边信息的一部分,是对于当前帧和前一帧之间的场景运动而校正的前一帧的估计。
数据一致性操作
数据一致性操作保持相关的信号内容,以致可从高分辨率图像/视频恢复原始的低分辨率图像/视频。从而,由超分辨率技术产生的高分辨率图像/视频的数据与低分辨率图像/视频一致。
图11是数据一致性操作的一个实施例的数据流图。图11中的方框及它们的相关操作可包括硬件(电路,专用逻辑等),软件(比如运行于通用计算机系统或专用机器上的软件),或者硬件和软件的组合。参见图11,模拟的低通滤波器1101对组合帧滤波,下采样器1102对滤波输出下采样,以形成减法器1103从输入帧x中减去以形成低分辨率的差分帧上采样器1104利用图3中所示的处理,对差分帧上采样,以获得上采样版本加法器1105相加上采样版本和以形成超分辨率估计y′。
迭代
通过对如图2中图解说明的整个处理进行迭代,能够进一步改进增强质量/超分辨率估计帧y′。迭代的次数(N1)可以是大于0的任意整数。主阈值被更新,帧y′被复制成帧y。主阈值可以是任意的正实值,可按任意下述方式被更新:
在一个实施例中,迭代的次数(N1)和每次迭代的主阈值被包括为边信息的一部分。
在一个实施例中,迭代的次数(N1)是介于1和4之间的整数,对第一次迭代来说,主阈值被设定为100,并且例如,如果N1等于2,那么所述两次迭代的主阈值为100和50。从而,在一个实施例中,阈值的数目为两个,在第二次迭代中,主阈值被减小。
应用
在图像和/或视频的处理、编码和显示方面,质量增强和超分辨率技术具有各种各样的应用。通常,这些技术可用于把低质量、低分辨率图像和/或视频增强为高质量、低/高分辨率。
更具体地说,就广播视频来说,针对具有只处理低分辨率视频的显示器的设备(例如,移动电话机)的广播节目也能够用在诸如电视机之类高分辨率显示器可用的固定环境中。另外对于具有高分辨率显示器的电话机来说,以低分辨率可用的内容,例如,用于具有只处理低分辨率视频的显示器的移动电话机的内容可被处理,以匹配所述电话机的高分辨率显示器的更高分辨率。在一个实施例中,向一个或多个移动电话机广播低分辨率视频信号,所述一个或多个移动电话机显示低分辨率视频信号。移动电话机包括这里说明的功能,以把低分辨率视频转换成高分辨率视频,并自己显示高分辨率视频和/或把高分辨率视频发给高分辨率显示器,比如电视机。在一个实施例中,移动电话机利用局部无线传输,把高分辨率视频传给电视机。在另一个实施例中,蜂窝电话机把低分辨率视频发给停放站(docking station),停放站使用这里说明的技术以把低分辨率视频转换成高分辨率视频,并把高分辨率视频传给高分辨率显示器。
这里说明的技术的另一种应用是用于网络中的视频质量增强。例如,移动电话机照相机捕获的视频是低质量和低分辨率的。可在网络中使用所说明的技术,以把这些视频增强为高质量和高分辨率。捕获的视频可通过网络上传给服务器或其它基于处理器的系统,以便利用这里公开的技术进行增强(例如,减少压缩失真,提高分辨率等),之后,用户能够从网络下载增强的视频。
另一种应用是视频编码中的小部分像素的运动补偿,它带来压缩效率的显著提高。为了进行小部分像素运动补偿,输入图像/视频应被插值,以获得在分数像素位置的强度值。超分辨率技术可被用于进行所述插值。
类似地,由移动电话机捕获并通过网络共享的图像通常质量不好。当共享时,通过网络发送低质量、低分辨率的图像,与发送更高质量和/或分辨率级别的这种图像相比,带宽利用率被降低。从而,在传输之后,可利用这里说明的技术改善这些图像的质量,以获得“打印”质量或者更好,尤其是在用户希望打印一张这样的图像的情况下。另外,通过利用这里说明的技术,能够改善视频会议的质量。更具体地说,用于作为视频会议参与者之一进行通信的终端能够配备这里说明的功能,从而能够以更高的缩放级别和/或改善的质量显示会议视频。
视频质量增强技术还可被用作视频解码器中的环路滤波器,以提高压缩效率。
优点的例子
与现有技术相比,本发明的实施例获得高质量的性能。本发明的实施例适用于在所有方向具有平滑区域、纹理和边缘的各种各样图像/视频内容。本发明的实施例并不局限于具有水平或垂直边缘的区域。本发明的实施例根据局部像素统计量修改其参数。每当可能时,本发明的实施例可以使用来自图像/视频源的边信息。本发明的实施例需要较少的迭代,从而计算复杂性较低。
计算机系统的例子
图12是可执行这里说明的一个或多个操作的例证计算机系统的方框图。参见图12,计算机系统1200可包括例证的客户端或服务器计算机系统。计算机系统1200包括用于传递信息的通信机构或总线1211,和与总线1211耦接以处理信息的处理器1212。处理器1212包括微处理器(但不限于微处理器),比如PentiumTM,PowerPCTM,AlphaTM等等。
系统1200还包括与总线1211耦接用于保存信息和将由处理器1212执行的指令的随机存取存储器(RAM),或者其它动态存储设备1204(参见主存储器)。主存储器1204还可用于保存处理器1212执行指令期间的临时变量或其它中间信息。
计算机系统1200还包括用于为处理器1212保存静态信息和指令的与总线1211耦接的只读存储器(ROM)和/或其它静态存储设备1206,以及数据存储设备1207,比如磁盘或光盘及其对应磁盘驱动器。数据存储设备1207与总线1211耦接,用于保存信息和指令。
计算机系统1200还可与显示设备1221,比如阴极射线管(CRT)或液晶显示器(LCD)耦接,显示设备1221与总线1211耦接,用于向计算机用户显示信息。包括字母数字键和其它按键的字母数字输入设备1222也可与总线1211耦接,用于向处理器1212传送信息和命令选择。另外的用户输入设备是与总线1211耦接的光标控制装置1223,比如鼠标、跟踪球、轨迹板、铁笔或光标方向键,用于向处理器1212传送方向信息和命令选择,和控制显示器1221上的光标移动。
可与总线1211耦接的另一个设备是硬拷贝设备1224,硬拷贝设备1224可用于把信息标记在介质上,比如纸张、胶片或者类似种类的介质。可与总线1211耦接的另一个设备是与电话机或手持掌上设备通信的有线/无线通信设备1225。
注意在本发明中可以使用系统1200和相关硬件的任意或者全部组件。不过,可认识到计算机系统的其它配置可包括一些或全部的设备。本发明并不局限于个人计算机和膝上型计算机。本发明适用于移动电话机,智能电话机,PDA,便携式播放器等。
鉴于在阅读上面的说明之后,对本领域的普通技术人员来说,本发明的许多变更和修改无疑将变得显而易见,因此要明白举例表示和说明的任何特定实施例决不意图限制本发明。于是,对各个实施例的细节的引用并不意图限制权利要求的范围,权利要求本身只列举本发明的必要技术特征。
Claims (57)
1.一种方法,包括:
接收第一分辨率的第一版本的媒体;和
利用至少一种变换和自适应阈值化,创建第二分辨率的第二版本的媒体,所述第二分辨率高于或等于第一分辨率。
2.按照权利要求1所述的方法,其中创建第二版本的媒体包括:
对子帧应用至少一种翘曲变换,以创建变换系数。
3.按照权利要求2所述的方法,其中所述至少一种翘曲变换包括2-D可分离DCT或2-D Hadamard变换。
4.按照权利要求2所述的方法,还包括在通过上采样第一版本的媒体而创建的图像中自适应地选择子帧,并且其中对子帧应用所述至少一种翘曲变换以创建变换系数包括对图像中的每个所选子帧应用变换。
5.按照权利要求4所述的方法,其中子帧是在图像中的每个像素处自适应选择的。
6.按照权利要求4所述的方法,其中所述至少一种翘曲变换包括2-D可分离DCT或2-D Hadamard变换。
7.按照权利要求1所述的方法,其中所述至少一种变换包括2-D可分离DCT或2-D Hadamard变换。
8.按照权利要求1所述的方法,其中自适应阈值化包括空间自适应阈值的应用。
9.按照权利要求1所述的方法,其中创建第二版本的媒体包括:
计算自适应阈值;和
利用所述自适应阈值,使变换系数阈值化。
10.按照权利要求1所述的方法,其中创建第二版本的媒体包括:
上采样第一版本的媒体,以创建上采样图像;
利用用于每个子帧的变换,变换上采样图像中的子帧;
利用自适应阈值,使用于每个变换子帧的变换系数阈值化;
逆变换阈值化的变换系数,以在像素域中形成处理后的子帧;
组合处理后的子帧,以创建新帧;和
对新帧应用数据一致性操作。
11.按照权利要求10所述的方法,其中所述变换包括2-D可分离DCT或2-D Hadamard变换。
12.按照权利要求11所述的方法,还包括在每个像素处把子帧设定成是规则的。
13.按照权利要求10所述的方法,还包括在每个像素处把子帧设定成是规则的。
14.按照权利要求10所述的方法,还包括自适应选择用于每个子帧的变换。
15.按照权利要求10所述的方法,还包括在上采样图像中的每个像素处自适应地选择子帧。
16.按照权利要求15所述的方法,其中变换上采样图像中的子帧包括对所选子帧应用变换,其中所述变换包括2-D可分离DCT或2-DHadamard变换。
17.按照权利要求10所述的方法,还包括计算一个或多个自适应阈值,其中利用自适应阈值使用于每个变换子帧的变换系数阈值化包括用所述一个或多个自适应阈值之一使用于每个变换子帧的变换系数阈值化。
18.按照权利要求17所述的方法,还包括自适应地选择在每个像素处选择的子帧的变换。
19.按照权利要求10所述的方法,还包括自适应地选择在每个像素处选择的子帧的变换。
20.按照权利要求10所述的方法,还包括发送边信息。
21.按照权利要求1所述的方法,还包括迭代地重复用于创建第二版本的媒体的操作,以便创建第三版本的媒体。
22.按照权利要求1所述的方法,其中创建第二版本的媒体包括:
上采样第一版本的媒体;
对上采样图像中的每个像素,自适应选择子帧;
利用变换,变换每个选择的子帧,其中所述变换包括2-D可分离DCT或2-D Hadamard变换;
阈值化变换系数;
逆变换阈值化的变换系数,以在像素域中形成处理后的子帧;
组合处理后的子帧,以创建新帧;和
对新帧应用数据一致性操作,以致创建分辨率比第一版本的媒体高的第二版本的媒体。
23.按照权利要求22所述的方法,其中第一版本的媒体是由照相机产生的。
24.按照权利要求22所述的方法,其中所述变换是翘曲变换。
25.按照权利要求1所述的方法,其中在视频解码器中产生第一分辨率的第一版本的媒体,作为视频解码器中的后处理操作的一部分,执行第二版本的媒体的创建。
26.按照权利要求1所述的方法,其中在视频解码器中产生第一分辨率的第一版本的媒体,第二版本的媒体的创建部分地由视频解码器中的环路滤波器执行。
27.按照权利要求1所述的方法,其中响应在无线通信系统中传送第一版本的媒体,所述第一版本的媒体被移动设备接收,还包括把第二版本的媒体发给高分辨率显示器,以便在所述高分辨率显示器上显示。
28.按照权利要求27所述的方法,其中移动设备创建第二版本的媒体,并把第二版本的媒体发给高分辨率显示器。
29.按照权利要求27所述的方法,其中移动设备把第一版本的媒体发给停放站,所述停放站创建第二版本的媒体,并把第二版本的媒体发给高分辨率显示器。
30.按照权利要求1所述的方法,其中第一版本的媒体是终端通过网络接收的视频,所述终端创建第二版本的媒体,以便在所述终端上显示。
31.一种方法,包括:
利用用于每个子帧的变换,变换图像中的子帧;
用自适应阈值,使用于每个变换子帧的变换系数阈值化;
逆变换阈值化的变换系数,以在像素域中形成处理后的子帧;
组合处理后的子帧,以创建新帧。
32.按照权利要求31所述的方法,其中所述变换是翘曲变换。
33.按照权利要求31所述的方法,还包括:
上采样第一分辨率的第一版本的媒体,以创建图像。
34.按照权利要求33所述的方法,还包括:
对新帧应用数据一致性操作。
35.按照权利要求31所述的方法,还包括在每个像素处把子帧设定成规则的。
36.按照权利要求31所述的方法,还包括自适应地选择用于每个子帧的变换。
37.按照权利要求31所述的方法,还包括在上采样图像中的每个像素处自适应地选择子帧。
38.按照权利要求37所述的方法,其中变换上采样图像中的子帧包括对所选子帧应用2-D可分离DCT或2-D Hadamard变换。
39.按照权利要求31所述的方法,还包括计算一个或多个自适应阈值,其中利用自适应阈值使用于每个变换子帧的变换系数阈值化包括用所述一个或多个自适应阈值之一使用于每个变换子帧的变换系数阈值化。
40.按照权利要求39所述的方法,还包括自适应地选择用于每个像素处选择的子帧的变换。
41.按照权利要求31所述的方法,还包括自适应地选择用于每个像素处选择的子帧的变换。
42.按照权利要求31所述的方法,还包括发送边信息。
43.一种方法,包括:
利用变换,变换每个所选子帧,其中所述变换包括2-D可分离DCT或2-D Hadamard变换;
利用非自适应阈值,使变换系数阈值化;
逆变换阈值化的变换系数,以在像素域中形成处理后的子帧;
组合处理后的子帧,以创建新帧。
44.按照权利要求43所述的方法,还包括:
上采样第一版本的媒体;和
对上采样图像中的每个像素,自适应地选择子帧。
45.按照权利要求43所述的方法,还包括:
对新帧应用数据一致性操作。
46.按照权利要求43所述的方法,其中在视频解码器中产生所述每个所选子帧,作为视频解码器中的后处理操作的一部分,执行新帧的创建。
47.按照权利要求43所述的方法,其中在视频解码器中产生所述每个所选子帧,新帧的创建部分地由视频解码器中的环路滤波器执行。
48.按照权利要求43所述的方法,其中响应在无线通信系统中传送所述每个所选子帧,所述每个所选子帧被移动设备接收,还包括把新帧发给高分辨率显示器,以便在所述高分辨率显示器上显示。
49.按照权利要求48所述的方法,其中移动设备创建新帧,并把新帧发给高分辨率显示器。
50.按照权利要求48所述的方法,其中移动设备把所述每个所选子帧发给停放站,停放站创建新帧,并把新帧发给高分辨率显示器。
51.按照权利要求43所述的方法,其中所述每个所选子帧是终端通过网络接收的视频的一部分,所述终端创建新帧,以便在所述终端上显示。
52.一种具有其中保存指令的一个或多个计算机可读存储介质的制造产品,当被系统执行时,所述指令使系统执行包括下述步骤的方法:
接收第一分辨率的第一版本的媒体;和
利用至少一种变换和自适应阈值化,创建第二分辨率的第二版本的媒体,所述第二分辨率高于或等于第一分辨率。
53.按照权利要求52所述的制造产品,其中创建第二版本的媒体包括对子帧应用变换,以创建变换系数,其中所述变换包括2-D可分离DCT或2-D Hadamard变换。
54.按照权利要求53所述的制造产品,其中所述方法还包括在通过上采样第一版本的媒体而创建的图像中,自适应地选择子帧,并且其中对子帧应用至少一种翘曲变换以创建变换系数包括对图像中的每个所选子帧应用变换,其中所述变换包括2-D可分离DCT或2-D Hadamard变换。
55.按照权利要求54所述的制造产品,其中所述子帧是在图像中的每个像素处自适应选择的。
56.按照权利要求52所述的制造产品,其中自适应阈值包括空间自适应阈值。
57.按照权利要求52所述的制造产品,其中创建第二版本的媒体包括:
计算自适应阈值;和
利用所述自适应阈值,使变换系数阈值化。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US12/140,829 US8743963B2 (en) | 2007-08-13 | 2008-06-17 | Image/video quality enhancement and super-resolution using sparse transformations |
US12/140,829 | 2008-06-17 | ||
PCT/US2008/073203 WO2009154644A1 (en) | 2008-06-17 | 2008-08-14 | Image/video quality enhancement and super-resolution using sparse transformations |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102047287A true CN102047287A (zh) | 2011-05-04 |
CN102047287B CN102047287B (zh) | 2013-03-13 |
Family
ID=40561806
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200880129582.6A Active CN102047287B (zh) | 2008-06-17 | 2008-08-14 | 利用稀疏变换的图像/视频质量增强和超分辨率 |
Country Status (4)
Country | Link |
---|---|
EP (1) | EP2300982B1 (zh) |
JP (1) | JP5174238B2 (zh) |
CN (1) | CN102047287B (zh) |
WO (1) | WO2009154644A1 (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105408935A (zh) * | 2013-04-26 | 2016-03-16 | 弗劳恩霍夫应用研究促进协会 | 上采样和信号增强 |
WO2017049858A1 (zh) * | 2015-09-24 | 2017-03-30 | 京东方科技集团股份有限公司 | 视频信号转换方法、视频信号转换装置以及显示系统 |
CN112153465A (zh) * | 2019-06-28 | 2020-12-29 | 北京京东尚科信息技术有限公司 | 图像加载方法及装置 |
CN113728354A (zh) * | 2019-04-30 | 2021-11-30 | 华为技术有限公司 | 一种图像处理方法及装置 |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014123173A (ja) | 2012-12-20 | 2014-07-03 | Sony Corp | 画像処理装置、撮像装置及び画像処理方法 |
US9445124B2 (en) * | 2013-03-15 | 2016-09-13 | Samsung Electronics Co., Ltd. | Electronic system with frequency mechanism and method of operation thereof |
CN103714526B (zh) * | 2013-12-24 | 2016-04-20 | 西安电子科技大学 | 基于稀疏多流形嵌入的超分辨率图像重构方法 |
CN108616686B (zh) * | 2016-12-12 | 2020-09-11 | 南京理工大学 | 一种全哈达玛矩阵编码成像方法 |
EP3399757A1 (en) | 2017-05-04 | 2018-11-07 | Thomson Licensing | Method and apparatus to encode and decode two-dimension point clouds |
CN110992266B (zh) * | 2019-12-05 | 2022-06-03 | 北京理工大学 | 基于多维度非局部统计本征的去马赛克方法及系统 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3302731B2 (ja) * | 1992-06-02 | 2002-07-15 | 大日本印刷株式会社 | 画像拡大方法 |
JPH08294001A (ja) * | 1995-04-20 | 1996-11-05 | Seiko Epson Corp | 画像処理方法および画像処理装置 |
JP3378167B2 (ja) * | 1997-03-21 | 2003-02-17 | シャープ株式会社 | 画像処理方法 |
US6438275B1 (en) * | 1999-04-21 | 2002-08-20 | Intel Corporation | Method for motion compensated frame rate upsampling based on piecewise affine warping |
KR100504594B1 (ko) * | 2003-06-27 | 2005-08-30 | 주식회사 성진씨앤씨 | 데이터 압축 처리된 저해상도 영상으로부터 초해상도 영상복원 및 재구성 방법 |
US20050105817A1 (en) * | 2003-11-17 | 2005-05-19 | Guleryuz Onur G. | Inter and intra band prediction of singularity coefficients using estimates based on nonlinear approximants |
CN1892698A (zh) * | 2006-05-19 | 2007-01-10 | 中国科学院研究生院 | 基于小波分形的遥感图像插值方法 |
-
2008
- 2008-08-14 WO PCT/US2008/073203 patent/WO2009154644A1/en active Application Filing
- 2008-08-14 JP JP2011514565A patent/JP5174238B2/ja active Active
- 2008-08-14 CN CN200880129582.6A patent/CN102047287B/zh active Active
- 2008-08-14 EP EP08874742.3A patent/EP2300982B1/en active Active
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105408935A (zh) * | 2013-04-26 | 2016-03-16 | 弗劳恩霍夫应用研究促进协会 | 上采样和信号增强 |
CN105408935B (zh) * | 2013-04-26 | 2018-12-21 | 弗劳恩霍夫应用研究促进协会 | 上采样和信号增强 |
WO2017049858A1 (zh) * | 2015-09-24 | 2017-03-30 | 京东方科技集团股份有限公司 | 视频信号转换方法、视频信号转换装置以及显示系统 |
CN113728354A (zh) * | 2019-04-30 | 2021-11-30 | 华为技术有限公司 | 一种图像处理方法及装置 |
CN112153465A (zh) * | 2019-06-28 | 2020-12-29 | 北京京东尚科信息技术有限公司 | 图像加载方法及装置 |
CN112153465B (zh) * | 2019-06-28 | 2024-01-16 | 北京京东尚科信息技术有限公司 | 图像加载方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
JP2011524714A (ja) | 2011-09-01 |
EP2300982A1 (en) | 2011-03-30 |
EP2300982B1 (en) | 2015-07-22 |
CN102047287B (zh) | 2013-03-13 |
JP5174238B2 (ja) | 2013-04-03 |
WO2009154644A1 (en) | 2009-12-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102047287B (zh) | 利用稀疏变换的图像/视频质量增强和超分辨率 | |
US8743963B2 (en) | Image/video quality enhancement and super-resolution using sparse transformations | |
Zhang et al. | Residual non-local attention networks for image restoration | |
Sun et al. | Learned image downscaling for upscaling using content adaptive resampler | |
CN100524346C (zh) | 过滤数字图像的方法和系统、数字图像处理器 | |
US7085436B2 (en) | Image enhancement and data loss recovery using wavelet transforms | |
Mishra et al. | Wavelet-based deep auto encoder-decoder (wdaed)-based image compression | |
US20100124383A1 (en) | Systems and methods for resolution-invariant image representation | |
US8422767B2 (en) | Method and apparatus for transforming signal data | |
CN102378978A (zh) | 变换的快速和存储有效实现的方法 | |
CN105408935B (zh) | 上采样和信号增强 | |
Hung et al. | Novel DCT-Based Image Up-Sampling Using Learning-Based Adaptive ${k} $-NN MMSE Estimation | |
Ascenso et al. | Learning-based image coding: early solutions reviewing and subjective quality evaluation | |
Jakhetiya et al. | Maximum a posterior and perceptually motivated reconstruction algorithm: A generic framework | |
Cui et al. | Color image restoration exploiting inter-channel correlation with a 3-stage CNN | |
Jin et al. | Post-processing for intra coding through perceptual adversarial learning and progressive refinement | |
Amaranageswarao et al. | Residual learning based densely connected deep dilated network for joint deblocking and super resolution | |
Liu et al. | Arbitrary-scale super-resolution via deep learning: A comprehensive survey | |
Wang et al. | Super resolution for compressed screen content video | |
US20150003511A1 (en) | WEAV Video Super Compression System | |
WO2000056060A1 (fr) | Dispositif et procede de traitement d'image, et support enregistre | |
CN107018287A (zh) | 使用视频缩影对图像进行降噪的方法和装置 | |
Singh et al. | A content adaptive method of de-blocking and super-resolution of compressed images | |
CN112669240A (zh) | 高清图像修复方法、装置、电子设备和存储介质 | |
Zhan et al. | Image deblocking via joint domain learning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |