CN101473346A - 鲁棒的超分辨率视频缩放的方法及装置 - Google Patents

鲁棒的超分辨率视频缩放的方法及装置 Download PDF

Info

Publication number
CN101473346A
CN101473346A CNA2006800549563A CN200680054956A CN101473346A CN 101473346 A CN101473346 A CN 101473346A CN A2006800549563 A CNA2006800549563 A CN A2006800549563A CN 200680054956 A CN200680054956 A CN 200680054956A CN 101473346 A CN101473346 A CN 101473346A
Authority
CN
China
Prior art keywords
value
interpolation
new point
interpolator
space
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2006800549563A
Other languages
English (en)
Other versions
CN101473346B (zh
Inventor
霍安·布鲁尼亚
斯特凡娜·马拉特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zoran France SA
Original Assignee
Zoran France SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zoran France SA filed Critical Zoran France SA
Publication of CN101473346A publication Critical patent/CN101473346A/zh
Application granted granted Critical
Publication of CN101473346B publication Critical patent/CN101473346B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • G06T3/4007Scaling of whole images or parts thereof, e.g. expanding or contracting based on interpolation, e.g. bilinear interpolation

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Television Systems (AREA)
  • Image Processing (AREA)
  • Control Of Indicators Other Than Cathode Ray Tubes (AREA)

Abstract

一种用于缩放视频图像的方法及装置,特别应用于对视频序列格式的转换以及解隔行扫描技术。本发明包括参数化插值(101),用于在输出的每个新点上计算插值;不敏感区间估计(102),用于计算一个区间,在该区间中输出图像值的概率分布被估计具有最大值;不敏感损失计算(103),用于从一个区间不敏感概率分布为每个插值获得一个负对数似然测量;在空间调整(104)之后,本发明还包括最小化损失选择(105),用于在每个新点处选择损失最小的插值,并将该插值作为输出图像值。本发明还包括总变化增量模块和方向匹配误差模块,用于校正该不敏感损失,再发送给最小化损失选择。

Description

鲁棒的超分辨率视频缩放的方法及装置
技术领域
本发明涉及视频图像的处理,特别涉及通过缩放对视频序列格式进行转换的方法及装置。
背景技术
视频格式的多样性要求将输入视频的格式适配成显示设备或者传输所要求的格式。在隔行扫描视频中,每个连续图像,也被称为场(field),在时间上交替提供偶数行(even lines)和奇数行(odd lines)。标准清晰度电视(SDTV,Standard Definition Television),如NTSC,PAL和SECAM电视格式,都是隔行扫描的。隔行扫描监视器,如阴极射线管(CRT,Cathode Ray Tube)被设计用于显示这些具有偶数行和奇数行隔行扫描的场。逐行扫描视频图像格式在每幅图像中包含了所有行(偶数行和奇数行)。LCD视频监视器就是被设计用来显示这些逐行扫描视频的。因此,对于隔行扫描的输入视频,有必要执行解隔行扫描操作,该操作分别计算隔行扫描视频序列的每个场中缺失的奇数行和偶数行,从而输出逐行扫描视频。一些被采用的高清晰度电视(HDTV,High Definition Television)格式,具有720行的720p逐行扫描格式,或者1080行的1080i隔行扫描格式。典型地,将SDTV视频格式转换到HDTV视频格式需要执行解隔行扫描和改变行数,比如从NTSC格式的486行变为720p HDTV格式的720行。
视频序列的解隔行扫描和改变行数是一种缩放操作,该缩放操作将定义在隔行扫描采样网格(grid)上的输入视频转换成定义在输出采样网格上的输出视频。解隔行扫描是一种输出采样网格同时包含偶数行和奇数行的缩放。对行数的进一步修正是对输出采样网格作进一步修正。缩放视频需要从定义在不同的输入采样网格上的输入视频的像素值,在指定的输出采样网格上计算像素值。
第一种方法是,根据时间点t上的输入视频图像,计算在时间点t上的每个输出视频图像,其方式是通过FIR滤波执行空间插值,从输入采样值计算得到输出网格上的采样。当输入图像是隔行扫描时,以远低于香农采样频率(Shannon sampling rate)的频率对该输入图像进行采样,则插值会产生在结果视频中明显可见的人为失真(artifacts)。方向插值(Directional interpolation)能部分减少这些人为失真,但不能完全杜绝,其原因是无法获取执行插值操作所必需的信息。如果输入图像是逐行扫描的,则增加采样密度也会产生模糊不清的图像。专利号为6,614,489的美国专利提供了该方法的一个例子。
第二种方法被称为“运动自适应”,当在图像中没有检测到运动时,该方法执行时间插值(time interpolation),当在图像中检测到明显的运动时,该方法执行空间插值(spatial interpolation)。当出现明显的运动时,由于该方法使用了空间插值,因而会产生与使用空间插值技术时相同类型的人为失真。专利号为5,428,398的美国专利提供了该方法的一个例子。
第三种方法被称为“运动补偿”,该方法测量图像中的位移,并在时域执行插值操作,其中该插值操作考虑了所测量到的运动。通过合并时域上多个图像的信息,该技术能提高缩放后的图像的空间分辨率,并能恢复出更好的细节。因此这也被称为超分辨率处理。然而,已有的运动补偿技术并不稳定,并会引入可见的人为失真。事实上,精确计算图像像素的位移是非常困难的,特别是对于那些欠采样的隔行扫描图像。当在时间插值时使用这些运动向量时,被遮住而引起的运动不连续性(例如,一个原本在背景中可见的物体,由于在前景中的另一个物体的相对运动而被遮住),或者诸如灰尘引起的细小运动、或者运动的透明度都会产生引起人为失真的运动估计误差。为了减少这些人为失真,当被测量的运动的可信度不够时,运动补偿的缩放过程执行空间插值。这样,就以引入空间缩放所产生的人为失真为代价,以减少运动补偿技术中引入的运动人为失真。专利号为6,940,557的美国专利提供了该方法的一个例子。
现有技术中,没有任何一种视频缩放方法完全利用了由输入视频序列提供的空-时信息,以执行高质量的超分辨率缩放。因此,本发明的一个目的就是,消除或部分减轻前文所述缺陷中的至少一部分,以通过缩放过程对视频序列进行转换。
发明内容
本发明的一个主要目的是提出了一种对输入视频进行鲁棒的超分辨率缩放的方法及其装置,该发明可以包括解隔行扫描功能。
根据本发明的方法,对定义在空-时输入网格上的输入图像的视频信号进行处理,并在预定义的空-时输出网格上输出视频。在新点的空-时新网格上执行计算,这些新点是输出网格中的不在输入网格上的点。
本发明应用了预定义的线性操作的参数化插值器族,对新网格的每个新点的空-时邻域中的输入图像值进行参数化的加权平均,以在每个新点上输出参数化的插值。与需要估计运动,并需要沿着所估计的运动方向上决定采用空间插值或时间插值以计算插值的运动自适应技术或运动补偿技术相反的是,在本发明中不需要运动估计,并且因此可以减轻通常因为运动估计而产生的误差。不同于通过运动估计来优化插值,本发明计算可能的插值器的一个完整的族,并用鲁棒的最大似然技术选出一个最佳插值器,该最佳插值器使得由负对数似然定义的损失最小化。
在每个新点,给定一个新点的空-时邻域上的输入图像的值,该方法估计出每个新点的值的条件概率分布。因为在这样一个邻域上可获得的数据的数量是有限的以及视频值的变换范围很大,因此利用区间不敏感概率分布以获得鲁棒的结果。对于每个新点,从该新点的一个空-时邻域中的输入图像值估计出一个区间,这样,该新点的输出图像值的概率密度被估计在该区间中具有最大值。
对于每个新点,本发明为每个参数化插值,基于一个第二概率分布,计算出一个不敏感损失值,该第二概率分布在与所述新点相关的值的区间内是常数且最大。第二概率在这里也被称为“区间不敏感”。不敏感损失可以表示为所述插值后的值相对于区间不敏感概率分布的一个负对数似然,该区间不敏感概率分布根据与所述新点相关的值的区间定义。
对于每个参数化的插值器,不敏感损失被空间滤波,以在每个新点的空间邻域上用加权求和进行调整,该调整后的损失输入至最小化损失选择过程。
对于所述新网格的每个新点,本发明选择一个最佳参数化插值,使其在该新点上在所有参数化插值中,调整后的损失最小化。然后输出一个视频,该视频在输出网格的每个输出点上的值,当该输出点也在输入网格中时,该输出点上的值等于输入图像值;或者当该输出点是一个新点时,该输出点上的值等于在该输出点的最佳参数化插值。
在本发明中,对于每个新点,可以通过一个鲁棒过程估计得到不敏感区间,该鲁棒过程将该新点的空-时邻域划分成一组子邻域。对于每个子邻域,通过在该子邻域中对输入图像值进行排序获得的两个指定排序的值,估计得到一个部分的不敏感区间,并且,整个不敏感区间可通过合并这组部分的不敏感区间获得。
在本发明中,区间不敏感概率分布可以是瓦普尼克(Vapnik)区间不敏感概率分布,该分布在不敏感区间的外部具有指数衰减特性。
根据本发明的方法,还包括通过总变化增量得到的一个不敏感损失的校正(penalize)。该校正对由所选择的最佳插值引入的振动进行控制。对每个参数化插值器以及每个新点,在该新点的一维邻域上,该方法包括计算一个总变化增量,从包括输入图像值以及通过参数化插值器计算得到的插值后的值的集合中计算获得该总变化增量。该一维邻域可以选为水平的或垂直的。对每个参数化插值器,在每个新点的空间邻域中通过加权求和对该总变化增量进行空间滤波,并且调整后的总变化增量提供给最小化损失选择过程作为输入。对于每个新点,调整后的不敏感损失可以用于对在所述新点上的调整后的总变化增量进行校正,这样被选择的最佳参数化方向插值使得,在该新点上所有参数化插值中,该被校正的调整后的不敏感损失最小。
在本发明中,参数化插值器可以是参数化方向插值器,用于沿着输入网格的参数化空-时方向计算线性插值。
根据本发明的方法,还可以包括通过方向匹配误差得到不敏感损失的校正。对于方向校正插值器,该校正确保输入图像值在所选择的最佳插值的空-时方向上几乎没有变化。对于每个沿参数化空-时方向的参数化方向插值器以及每个新点,从与该新点沿该空-时方向对齐的插值后的输入图像值的差值中,计算得到一个方向匹配误差。对于每个参数化方向插值器,在每个新点的一个空间邻域中用加权求和,以对该方向匹配误差进行滤波,并且调整的匹配误差被作为最小化损失选择过程的输入。对于每个新点,由调整后的匹配误差对调整后的不敏感损失进行校正,以选择一个最佳参数化方向插值,该插值使得在该新点处的所有参数化插值中,被校正的调整后的不敏感损失最小化。对于每个新点,也可以由该新点的调整后的总变化增量和调整后的匹配误差一起对调整后的不敏感损失进行校正,以选择一个最佳参数化方向插值。
特别地,本发明的方法可应用于将输入为隔行扫描的视频转换成输出为逐行扫描视频的情形。对于这样的解隔行扫描,根据本发明的方法还可以包括将输入图像分类为“电影电视胶片类型”或“隔行扫描电视类型”,该分类还可以细分输入图像与“前”一帧输入图像最相似或与“后”一帧输入图像最相似。然后,该方法根据该图像分类,修正在每个新点处最佳参数化方向插值的选择,使得在该新点处被校正的调整后的不敏感损失最小,或者是该新点的“前”或“后”一帧图像值的拷贝。
本发明的另一个方面涉及数字视频缩放方法,该方法用于处理在一个空-时输入网格的各个点上具有各自输入图像值的输入视频信号,以产生在包括所述输入网格的点以及新点的一个空-时输出网格的各个点上具有各自输出图像值的输出视频信号。对于每个这样的新点,该方法包括以下步骤。在该新点对应的一个空-时邻域上对输入图像值应用一个预定义的参数化线性插值器的族,以在该新点处为该族中的每个插值器提供一个插值后的值。对应于该族中的每个插值器,从输入图像值和在该新点的一个一维空间邻域中用该插值器计算得到的插值后的值的集合中,计算一个总变化增量。对应于该族中的每个插值器,在该新点的一个空间邻域中,对该总变化增量进行空间滤波。选择该族中的一个插值器,使其满足一个依赖于该滤波后的总变化增量的最小化标准,其中被选择的插值器的插值后的值作为在该新点处的输出图像值。典型地,这样的最小化标准将滤波后的总变化增量与其他代价或损失值相结合,有利地,该代价或损失值包括如前文所述的从区间不敏感概率分布获得的滤波后的损失值。当然,其它代价或损失函数也可以用于本发明的其它可选实施例中。
本发明还包括一种用于在电视显示器上显示图像的电视系统,包括用于接收输入视频信号的装置,根据前述方法对输入视频信号进行处理的处理装置,以及显示由该处理装置产生的输出视频信号的装置。
本发明还包括一种视频缩放装置,包括用于执行上述方法的计算机装置。
本发明还包括一种计算机程序产品,当在计算机处理单元运行计算机程序时,包括用于执行上述方法的指令。
附图说明
本发明的上述目的以及其它目的,本发明的多个特征,以及本发明本身,可以通过结合附图和下列描述得到更完整的理解,其中所涉及的附图包括:
图1示出了本发明的一个示例性的实施例的框图,其中接收一个输入视频,并通过最小化一个区间不敏感损失,计算获得一个预定义输出网格上的输出视频。
图2示出了本发明的一个示例性的配置的框图,其中接收一个输入视频,通过最小化一个用调整后的总变化增量进行校正的区间不敏感损失,计算获得一个预定义输出网格上的输出视频。
图3示出了本发明的一个示例性的配置的框图,其中接收一个输入视频,通过最小化一个用总变化增量以及方向匹配误差进行校正的区间不敏感损失,计算获得一个预定义输出网格上的输出视频。
图4示出了用于计算总变化增量的输入网格点和新点的配置的示意性框图。
图5示出了用于一个解隔行扫描系统计算总变化增量的输入网格点和新点的配置的示意性框图。
图6示出了在一个新点处的用于空间方向插值的输入网格点的示意性框图。
图7示出了在一个新点处的用于空-时方向插值的输入网格点的示意性框图。
具体实施方式
图1所示的装置是本发明的一个实施例。该装置对定义在空-时输入网格
Figure A200680054956D0011141653QIETU
上的二维(2D)图像的视频信号进行处理。对于每个时间下标t,其中t是一个整数参数,空-时输入网格是在R3中的坐标是x(n1,n2,t)=n1τ1+αn2τ2+tτ34(t)的点的网格,,其中τ1=(1,0,0)和τ2=(0,1,0)是归一化的水平和垂直空间矢量,τ3=(0,0,1)是一个沿时间方向的矢量,τ4(t)是空间位移,其取决于该视频是隔行扫描还是逐行扫描。如果输入视频是隔行扫描的,则输入视频是由在两个时间点t和t+1上的两个场组成的,其中当t是偶数时,则第一个场包含偶数行,并且第二个场包含奇数行。在这种情况下,输入网格在R3中通过如下形式定义:取α=2,并且当t是偶数时τ4(t)=(0,0,0),以及t是奇数时τ4(t)=(0,1,0)。如果输入视频是逐行扫描的,则取α=1,且对于所有t取τ4(t)=(0,0,0)。对于每个输入网格点x(n1,n2,t),输入视频给出一个图像值υ(n1,n2,t)。例如,对于PAL标准,整数n1、n2的取值范围分别是从1到720以及从1到288,α等于2并且t的一个单元对应的时间增量是20ms。
典型地,图像值是一个多分量值。例如,在YCbCr颜色空间中,每个网格点都有一个表示亮度的Y分量,和两个共同确定颜色的色度分量Cb和Cr。这里描述的处理过程仅仅针对单个分量,也就是说图像值υ(n1,n2,t)可以用来表示任何一个单个分量的值。当然,同时处理所有分量的替代处理方法也是可能的,并将在下文做进一步的描述。
图1所示的超分辨率系统输出定义在空-时输出网格
Figure A200680054956D00121
上的二维图像的视频流。在每个时间点t上,输出网格
Figure A200680054956D00122
是由点 x ^ ( n 1 , n 2 , t ) = α 1 n 1 τ 1 + α 2 α n 2 τ 2 + t τ 3 + τ 5 ( t ) 组成的统一的空间网格,其中n1、n2和t都是整数,(α1,α2)是和输入网格相关的空间缩放参数,它们可能大于或小于1,而τ5(t)则是空间位移。如果输出网格是隔行扫描网格,则当t是偶数时,τ5(t)=(0,0,0);当t是奇数时,τ5(t)=(0,1,0)。如果输出网格是逐行扫描网格,则对于所有t,τ5(t)=(0,0,0)。在下文中,我们标记n=(n1,n2)。对于每个输出网格点
Figure A200680054956D00124
输出视频可以用值
Figure A200680054956D00125
表示。如果输入网格是隔行扫描而输出网格是逐行扫描的,则缩放系统是一个解隔行扫描系统。如果α1=α2=1,则该缩放系统是具有单位缩放的解隔行扫描系统。例如,对于720p HDTV标准,整数n1,n2的取值范围分别是从1到1280以及从1到720,如果输入视频是PAL标准,则参数α1=576/720,以及α2=720/1280。
在每个时间点t,超分辨率缩放系统接收输入图像υ(n,t+d),并输出图像
Figure A200680054956D00126
其中典型地,延迟d介于1到5之间。新网格
Figure A200680054956D00127
被定义为输出网格
Figure A200680054956D00128
中所有不属于网格的点的集合。新点(new point)指的是新网格中的点。
用最大似然方法计算
Figure A200680054956D00129
一个预先定义的插值器的族在每个新点上提供了一个图像值的族。可以从每个新点的邻域中所观察到的输入图像值估计得到未知新点的值的条件概率分布。
该装置包括参数化的插值模块(101),该模块接收输入视频,并应用一个线性插值器的族{Eγ}γ∈Γ,其下标为多参数γ,γ属于一个预定义的参数集合Γ。在每个新网格点处,模块(101)输出一个插值后的值的族
Figure A200680054956D00132
在点
Figure A200680054956D00133
处,线性插值器Eγ通过对输入图像值υ(n′,t-s)(其中|s|≤d)的参数化加权平均,以计算出 υ ^ γ ( n , t ) :
υ ^ γ ( n , t ) = E γ ( x ^ ( n . t ) , υ )
       = Σ n ′ Σ s = - d d K γ ( x ^ ( n , t ) - x ( n ′ , t - s ) ) υ ( n ′ , t - s ) . - - - ( 1 )
二维插值核Kr(x)具有有限支撑,因此当x(n′,t-s)足够接近于
Figure A200680054956D00137
时,可以在有限项上计算求和公式(1)。本发明中可以使用任何现有技术中的插值器。下文中还将描述一个使用方向空-时插值器的示例性实施例。可通过沿不同方向的可分离的一维线性插值执行插值运算。可以通过一个FIR线性滤波计算获得值f(p)中的u处的一维线性插值:
f ^ ( u ) = Σ p = - Δ Δ K ( u - p ) f ( p )
其中,插值核K具有包含在[-Δ,Δ]范围内的支撑,且对于所有u∈[0,1]满足 Σ p = - Δ Δ K ( u - p ) = 1 . 典型地,Δ介于1到8之间。
不敏感对数似然
有利地,可以通过对从输入图像值邻域υ(p,t)计算得到的负对数似然进行最小化,以在每个新点
Figure A200680054956D001310
处选择最优插值。可以在一个不敏感区间上估计得到已知邻域输入图像值的新点图像值的条件概率分布,在该区间中,因为缺乏用于区分概率分布值的数据,该概率分布被估计为最大值且是常数。点x和区间I=[a,b]之间的距离可以表示为:
| x - I | = a - x if x < a 0 if x &Element; I x - b if x > b
对于区间I=[a,b]以及
Figure A200680054956D0014142309QIETU
,区间不敏感概率分布pI(u)可以定义为:
Figure A200680054956D00142
其中,对于任何固定的
Figure A200680054956D0014142345QIETU
,并且f(u,
Figure A200680054956D0014142331QIETU
)是u的单调递减函数,调整η使得∫pI(u)dx=1。
Figure A200680054956D0014142401QIETU
的任何选择都是可能的。瓦普尼克(Vapnik)鲁棒区间不敏感概率分布可以定义为:
Figure A200680054956D00143
其相当于
Figure A200680054956D0014142422QIETU
。也可以选择
Figure A200680054956D0014142439QIETU
该装置还包括不敏感区间估计模块(102),为每个新点
Figure A200680054956D00144
计算不敏感区间I(n,t)=[a(n,t),b(n,t)],其中,在
Figure A200680054956D00145
点处的输出图像值很可能就位于该区间内,但是在该区间内却没有用于区分不同值的概率的重要的信息。从输入图像值υ(n′,t′)计算得到区间I(n,t),输入图像值υ(n′,t′)所在的点x(n′,t′)在
Figure A200680054956D00146
的一个指定的邻域N(n,t)中。令C(n,t)表示该邻域中的点的个数。在一个示例性实施例中,定义
Figure A200680054956D00147
的邻域N(n,t)为满足|t-t′|≤d的输入网格点x(n′,t′)的集合,而且,x(n′,t′)的空间坐标在以
Figure A200680054956D00148
的空间坐标为中心点的宽度为2Δ的空间正方形内,其中Δ是一个预定义参数。典型地,Δ介于1到5之间。
在一个示例性实施例中,可以从该邻域中所有点的均值m(n,t)以及标准差σ(n,t)计算得到不敏感区间:
m ( n , t ) = 1 C ( n , t ) &Sigma; ( n &prime; , t &prime; ) &Element; N ( n , t ) &upsi; ( n &prime; , t &prime; ) ,
&sigma; 2 ( n , t ) = 1 C ( n , t ) &Sigma; ( n &prime; , t &prime; ) &Element; N ( n , t ) ( &upsi; ( n &prime; , t &prime; ) - m ( n , t ) ) 2 .
模块(102)设置I(n,t)=[m(n,t)-βσ(n,t),m(n,t)+βσ(n,t)],其中β是一个常数,典型地,β小于3。在另一个实施例中,模块(102)从N(n,t)中的点的排序统计中估计得到一个不敏感区间。我们将N(n,t)中的C(n,t)个排序的值标记为{υk}1≤k≤C(n,t),其中υk≥υk+1。令p是正整数,且p<C(n,t)/2。当C(n,t)是偶数时,则k1=C(n,t)/2-p+1以及k2=C(n,t)/2+p;而当C(n,t)是奇数时,则k1=(C(n,t)+1)/2-p以及k2=(C(n,t)+1)/2+p。用 a ( n , t ) = &upsi; k 1 以及 b ( n , t ) = &upsi; k 2 定义一个排序的统计不敏感区间I(n,t)=[a(n,t),b(n,t)]。典型地,p介于1到3之间。
在另一个示例性实施例中,通过将邻域N(n,t)分割成一组互不相交的子集 N ( n , t ) = U i = 1 k N i ( n , t ) 以估计不敏感区间。可以通过任意计算过程,例如用平均值和标准差过程,或者排序统计过程从每个Ni(n,t)计算获得不敏感区间Ii(n,t)。这些不敏感区间然后被合并成一整个不敏感区间。在一个示例性实施例中,N(n,t)被分割成包括满足t′=t的所有的点x(n′,t′)∈N(n,t)的集合N1(n,t)以及包括满足当t′≠t的所有的点x(n′,t′)∈N(n,t)的集合N2(n,t)。如果两个不敏感区间I1(n,t)和I2(n,t)存在非空交集,则可以将最终的不敏感区间I(n,t)定义为该交集,否则,区间I(n,t)是上述两个区间的并集。
该装置还包括不敏感损失计算模块(103),对于每个插值器Eγ以及每个新点
Figure A200680054956D00156
该模块输出
Figure A200680054956D00157
相对于该区间不敏感概率分布的负对数似然,其中在区间I(n,t)=[a(n,t),b(n,t)]上计算得到该区间不敏感概率分布。其目标是使该损失最小化,因此可以从对数似然中删除加性常数。作为(2)的一个结果,对于,该损失可以表示为:
Figure A200680054956D00161
其它
对于瓦普尼克鲁棒区间不敏感概率分布(3),该损失可表示为:
Figure A200680054956D00162
空间调整模块(104)接收在每个新点
Figure A200680054956D00163
为每个γ∈Γ计算得到的不敏感损失lγ(n,t)作为输入,然后执行空间低通滤波,并在空间邻域
Figure A200680054956D00164
上,通过在该邻域上进行求加权和的方式,计算调整后的损失。在一个示例性实施例中,
Figure A200680054956D00165
是一个以
Figure A200680054956D00166
为中心点的矩形,其包括固定的C1个数目的新网格点,并且所有权重都设为1。可通过计算这些C1个点的和得到(空间调整模块(104)所作的)调整,典型地,C1介于16到256之间,
l ^ &gamma; ( n , t ) = &Sigma; x ^ ( p , t ) &Element; N &OverBar; 1 ( n , t ) l &gamma; ( p , t ) . - - - ( 4 )
现有技术中任何快速算法都可以用来计算该和。在另一个示例性实施例中,该和被一个加权求和替代,其中在
Figure A200680054956D00168
中所有权重的和等于一个常数,该常数对所有新点
Figure A200680054956D00169
保持相同。
如图1所示的装置包括最小损失选择模块(105),该模块接收针对每个新点
Figure A200680054956D001610
以及所有γ∈Γ的
Figure A200680054956D001611
作为输入,并找到最优插值器的参数φ(n,t)∈Γ,使得在所有插值器中,损失
Figure A200680054956D001612
最小:
l ^ &phi; ( n , t ) ( n , t ) = min &gamma; &Element; &Gamma; l ^ &gamma; ( n , t ) .
损失选择模块(105)为每个新点输出损失最小化插值
Figure A200680054956D00171
输入/新网格整合模块(106)接收在每个新点的损失最小化插值
Figure A200680054956D00173
以及输入图像值υ(p,t)作为输入,该模块输出定义在输出网格
Figure A200680054956D00174
上的超分辨率视频。对于每个新点
Figure A200680054956D00175
整合模块(106)输出损失最小化插值 &upsi; ^ ( n , t ) = &upsi; ^ &phi; ( n , t ) ( n , t ) . 对于每个在输入网格中的输出点
Figure A200680054956D00177
整合模块(106)输出对应的输入图像值 &upsi; ^ ( n , t ) = &upsi; ( p , t ) .
以上给出了根据图1所示的一个示例性实施例的详细描述,对于本领域技术人员来说,各种变型、修改或者等同的技术方案是显而易见的。例如,在本发明的基础上,在模块(101)、(102)、(103)、(104)、(105)和(106)中,对于计算的各种优化和顺序调整,将计算进行空间局限化,以减少内存的需求,在不脱离本发明的精神下执行各种相同的功能,对于本邻域技术人员都是显而易见的。
以上描述的装置对视频图像的单个分量进行了处理。对于多分量图像,可以独立地处理所有分量。本发明还可同时处理所有分量,并将不敏感损失模块(103)定义为从每个分量获得的不敏感损失的加权求和,这样对于在任何给定的新点上的所有分量,选择相同的最优插值器Eγ
总变化增量的校正(penalization)
根据本发明的方法还可以包括通过总变化增量对不敏感损失进行校正。该校正对被选择的最佳插值所引入的振动进行了控制。
图2示出了根据本发明的另一个装置。在该实施例中,用总的变化增量对用于选择参数化插值的损失函数进行校正。图2中的模块(201)、(202)、(203)和(204)分别与图1中的模块(101)、(102)、(103)和(104)相同。图2中的模块(208)也与图1中的模块(106)相同。
图2所示的装置包括总变化增量模块(205),用于在每个新点
Figure A200680054956D00179
的一个邻域中,为每个插值器Eγ,计算因为在输入图像值的网格中插入插值后的新点值的网格而产生的总变化增量。在一个优选实施例中,邻域被选成一维的,要么水平方向,要么垂直方向。
对于一个解隔行扫描系统来说,该邻域被选为垂直方向,以控制因为解隔行扫描而产生的垂直方向上总的图像变化增量。下面将描述一个选择垂直方向一维邻域的示例性实施例。通过交换图像的行和列的作用,相同的过程可以适用于选择水平方向的邻域的情形。
Figure A200680054956D00181
的垂直方向一维邻域,是一个以点
Figure A200680054956D00182
为中心、长度为L的垂直线段。典型地,L的值是介于1到15之间的参数。自上而下,我们将在
Figure A200680054956D00183
的该邻域中,
Figure A200680054956D00184
的新点的垂直坐标标记为
Figure A200680054956D00185
将Eγ计算获得的对应的插值后的值标记为
Figure A200680054956D00186
图4示出了输入点x(p,t)位于带叉的位置上,新点
Figure A200680054956D00187
用黑实心圆表示,其它新点
Figure A200680054956D00188
用空心圆表示,一维垂直邻域用垂直虚线段表示。对于和该垂直虚线段相交的输入图像中的每一行,在交叉位置上,沿着该图像行的方向通过一维插值操作计算得到一个输入图像值。从上而下,我们用{hk}k标记这些交叉位置的垂直坐标,用{υk}k标记对应的输入图像值。在图4中,这些插值后的点的位置用三角形进行标记。如果输入网格是隔行扫描网格,输出网格是逐行扫描网格,且缩放因子α1=α2=1,则新点位于和输入点相同的列上,因此υk对应于输入图像值,如图5所示。
对于在垂直坐标为
Figure A200680054956D00189
的垂直邻域中的每个新点,要么存在两个连续的输入图像点,其坐标为hk和hk+1,使得hk>hl≥hk+1,要么这个点对应于该垂直线段的最底部或最顶部。如果满足第一个条件,则因为在υk和υk+1之间插入
Figure A200680054956D001810
而引起的总变化增量就等于
Figure A200680054956D001811
和区间Ik=[min(υk,υk+1),max(υk,υk+1)]之间的距离,该距离可标记为对于在垂直邻域中的介于两个输入图像点值之间的每个新点,计算该距离。
相反地,对于在垂直坐标为hk的垂直邻域中每个输入点,要么存在两个连续的新点,其坐标为
Figure A200680054956D001813
Figure A200680054956D001814
使得 h ^ l &prime; > h k &GreaterEqual; h ^ l &prime; + 1 , 要么这个点对应于该垂直线段的最底部或最顶部。因在
Figure A200680054956D001816
之间插入υk而引起的总变化增量就等于υk和区间 I ^ l &prime; = [ min ( &upsi; ^ l &prime; , &upsi; ^ l &prime; - 1 ) , max ( &upsi; ^ l &prime; , &upsi; ^ l &prime; - 1 ) ] 之间的距离,该距离可标记为
Figure A200680054956D00192
对于每个介于两个新点图像值
Figure A200680054956D00193
之间的υk,计算该距离。
估计器Eγ
Figure A200680054956D00195
的垂直邻域中的总变化增量测量的结果标记为ωγ(n,t)。通过整合在该邻域中介于两个新点图像值
Figure A200680054956D00197
之间的所有输入点υk,以及介于两个输入点图像值υk和υk+1之间的所有插值后的值
Figure A200680054956D00198
所获得的总变化增量,获得该ωγ(n,t)。在一个示例性实施例中,ωγ(n,t)是上述总变化增量的加权平均值。在另一个示例性实施例中,从所有这些总变化增量的一个排序统计中获得该ωγ(n,t)。通过所有总变化增量的排序列表中的p值获得ωγ(n,t),其中p是一个固定的正整数。
图2中示出的空间调整模块(206)接收在每个新点
Figure A200680054956D00199
为每个参数化插值器Eγ计算得到的总变化ωγ(n,t)作为输入,执行空间低通滤波,以在一个更大的空间邻域上通过加权求和,计算一个调整后的总变化增量。在一个示例性实施例中,模块(206)在的一个长方形空间邻域上求和,该邻域包括固定个数C2个新网格点,典型地,C2介于4到64之间:
w ^ &gamma; ( n , t ) = &Sigma; x ^ ( p , t ) &Element; N &OverBar; 2 ( n , t ) w &gamma; ( p , t ) . - - - ( 5 )
在另一个示例性实施例中,该求和用一个加权求和代替,其中,
Figure A200680054956D001913
中的所有权重之和等于一个常数,并且该常数对于所有新点都保持相同。
最小化损失选择模块(207)接收针对每个新点
Figure A200680054956D001915
以及针对每个插值器Eγ所计算得到的调整后的区间不敏感损失
Figure A200680054956D001916
以及调整后的总变化
Figure A200680054956D001917
作为输入,并计算一个校正损失:
l &OverBar; &gamma; ( n , t ) = l ^ &gamma; ( n , t ) + &lambda; w ^ &gamma; ( n , t )
其中,λ是一个预定义的校正常数,典型地,λ介于1到10之间。模块(207)找到最佳插值器的参数φ(n,t)∈Γ,使得在所有插值器中,上述该校正损失lγ(n,t)最小:
l &OverBar; &phi; ( n , t ) ( n , t ) = min &gamma; &Element; &Gamma; l &OverBar; &gamma; ( n , t )
并且,该模块还为每个新点输出一个最小损失估计
Figure A200680054956D00202
可以用总变化校正进行损失测量以改进最佳插值器的选择,该损失测量不同于参照图1所描述的区间不敏感损失。因此它也可以应用于与本发明不同的配置中。
如图1所示的装置,前文所描述的装置对视频图像的单个分量进行了处理。对于多分量图像,可以独立地处理所有分量。可选地,本发明也包括同时处理所有分量的方式,并定义模块(207)的校正损失为每个分量所获得的校正损失的加权求和,这样就在任何给定一个新网格点上为所有分量选择同一个最佳插值器Eγ
参数化方向插值
图3示出了根据本发明的另一个实施例的装置。沿着参数化方向执行插值,并且一个方向匹配损失给出了沿着这些方向输入图像的变化的测量。图3中的模块(302)、(303)、(304)、(306)分别与图2中的模块(202)、(203)、(204)、(206)相同,并且图3中的模块(311)与图2中的模块(208)相同。
参数化方向插值器模块(301)接收输入视频作为输入,并在每个新网格点
Figure A200680054956D00203
通过应用一个以多参数γ为下标并包含一个方向参数的线性插值器{Eγ}γ∈Γ的族,计算以获得一个插值 { &upsi; ^ &gamma; ( n , t ) } &gamma; &Element; &Gamma; 的族。在一个优选实施例中,通过沿着输入图像的行或列方向上的一维插值,以及沿着参数化空-时方向上的方向插值,计算出这些参数化方向插值器。现有技术中的过程可应用于上述一维插值。
方向匹配误差模块(307)接收输入图像,并在每个新网格点
Figure A200680054956D00211
计算出与参数化方向插值器{Eγ}γ∈Γ相关联的一个方向匹配误差{eγ(n,t)}γ∈Γ的族。在一个优选实施例中,从沿着每个参数化方向上的输入图像值之间的差值中计算得到这些匹配误差。这些方向匹配误差量化了每个方向插值器在空-时方向上输入视频的变化。
在一个优选实施例中,用空-时方向对插值器进行参数化,该空-时方向由一个空间向量ω=ω1τ12τ2=(ω1,ω2,0)和一个时间增量s确定,该时间增量确定了输入图像值υ(p,t-s)和υ(p,t+s),从这些值中可计算出在
Figure A200680054956D00212
处的插值后的值。这样,这些插值器就由多参数值γ=(ω1,ω2,s)确定,该参数从一个预定义的空-时参数的族Γ中选择。
Γ中时间偏移s的最大值就是超分辨率系统的延迟d。为了估计新点值υγ(n,t),需要直至s=d的图像x(n,t+s),并且为了执行这些估计,我们必须在内存中保留2d+1个图像x(n,t′),其中t-d≤t′≤t+d
如果s=0,则通过一个空间插值器从输入图像υ(n′,t)计算得到
Figure A200680054956D00213
空间插值通过可分离的插值进行,首先沿着一个优选方向进行插值,该优选方向可以是水平方向或是垂直方向,然后再沿着空间方向ω=(ω1,ω2,0)进行插值。如果输入视频是隔行扫描的,则优选插值方向可以选为水平方向,其原因是行方向上的采样分布是列方向上的两倍。如果输入视频是逐行扫描的,则当(ω1,ω2)与水平方向的(1,0)之间的夹角小于π/4时,优选插值方向可以选为垂直方向,此时我们规一化ω1=1;当(ω1,ω2)与水平方向的(1,0)之间的夹角大于π/4时,优选插值方向可以选为水平方向,此时我们规一化ω2=1。
假设在
Figure A200680054956D00214
处的优选插值方向为水平方向,并且ω=(ω1,1)。如果
Figure A200680054956D00221
位于输入网格的某一行中,则在
Figure A200680054956D00222
处通过沿该行方向上的一个一维线性插值,计算出υγ(n,t)。如果
Figure A200680054956D00223
不在输入网格的某一行中,则它的位置可以表示为 x ^ ( n , t ) = x 1 &tau; 1 + &alpha; x 2 &tau; 2 + &tau; 4 ( t ) + t&tau; 3 , 令n2为满足n2<x2<n2+1的唯一整数。令 y = x ^ ( n , t ) + &alpha; ( n 2 + 1 - x 2 ) w z = x ^ ( n , t ) - &alpha; ( x 2 - n 2 ) w
Figure A200680054956D00227
在方向ω上在输入图像正好上方的行和正好下方的行的投影。在y处的图像值υy可以用一维插值对沿着该行的输入图像值υ(n′,t)进行插值得到,其中n′=(p,n2),且p是变量。在z处的图像值υz可以用沿着该行的输入图像值υ(n′,t)的一维插值得到,其中n′=(p,n2+1)。在一个示例性实施例中,在
Figure A200680054956D00228
处的图像插值定义为υy和υz之间的一个一阶线性插值:
&upsi; ^ &gamma; ( n , t ) = ( n 2 + 1 - x 2 ) &upsi; y + ( x 2 - n 2 ) &upsi; z . - - - ( 6 )
模块(307)为插值器Eγ
Figure A200680054956D002210
处计算出的方向匹配误差,就是υy和υz之间的方向ω上的方向变化:
eγ(n,t)=|υyz|η             (7)
其中,η>0是一个预先选择的固定指数,典型地,等于1或2。在以单位缩放的解隔行扫描的特殊情况下,x2=n2+1/2,因此 &upsi; ^ &gamma; ( n , t ) = ( &upsi; y + &upsi; z ) / 2 . 这种情况如图6所示。
当优选插值方向是垂直方向而不是水平方向时,即ω=(1,ω2),通过交换水平坐标轴和垂直坐标轴,交换输入图像的行和列,以及用1取代α,相同的计算方法也适用于(垂直方向的)插值器。
如果s>0,则
Figure A200680054956D002212
在时刻t-s和时刻t+s的图像中的空-时投影位于 y = x ^ ( n , t ) - w - s &tau; 3 z = x ^ ( n , t ) + w + s &tau; 3 上。可以通过沿着在网格点x(n′,t-s)的输入图像值υ(n′,t-s)的行和列方向上进行可分离的插值计算得到在y处的图像值υy。类似地,可以通过沿着在网格点x(n′,t+s)的输入图像值υ(n′,t+s)的行和列方向上进行可分离的插值计算得到在z处的图像值υz。在
Figure A200680054956D002215
处估计的图像值是 &upsi; ^ &gamma; ( n , t ) = ( &upsi; y + &upsi; z ) / 2 , 方向匹配误差是eγ(n,t)=|υyz|η
在一个优选实施例中,选取所有可能方向ω的集合,使得对于每个新点在时刻t-s和时刻t+s的投影部分y和z位于统一的网格中,通过采用固定因子沿着输入图像υ(n′,t-s)和υ(n′,t+s)的行和列对输入图像υ(n′,t-s)和υ(n′,t+s)进行过采样,以预先计算得到该网格。
对于一个解隔行扫描系统来说,优选的空间插值方向是水平方向。在一个采用单位缩放的示例性实施例中,若s=0,则空间方向矢量ω的族是{(k/q,1,0)}-K≤k≤K,其中q是固定的整数。图6示出了执行这些空间插值所需要的过采样,其中典型的选择是q=2和K=4。十字表示输入图像点x(p,t),空心圆表示中间插值点,黑实心圆表示新点,其中显示了9个不同的方向。空-时方向矢量的族依赖于时间偏移的奇偶。当s是奇数时,则空-时方向矢量的族是 { w = ( k / q , 2 l , 0 ) } - K l &le; k &le; K l , - L &le; l &le; L , 当s>0且s是偶数时,则空-时方向矢量的族是 { w = ( k / q , 2 l + 1 , 0 ) } - K l &le; k &le; K l , - L &le; l &le; L ; 其中Kl依赖于l或者选为一个常数,典型地,该常数介于2到8之间。典型地,q的值介于1到8之间,L的值介于1到5之间。对于这样的方向矢量的族,所有投影位置y和z都在统一的网格上,且可利用因子q通过对输入图像行υ(n′,t-s)和υ(n′,t+s)进行过采样而获得该网格。图7示出了对应于过采样因子q=2的空-时插值方向。十字表示输入图像点x(p,t),空心圆表示中间插值点,黑实心圆表示一个新点
Figure A200680054956D00235
图3所示的空间调整模块(308)接收在每个新点
Figure A200680054956D00236
为每个参数化插值器Eγ计算得到的方向匹配误差eγ(n,t)作为输入,执行空间低通滤波,通过在一个更大空间邻域上的加权求和,计算得到调整后的方向匹配误差。在一个示例性实施例中,模块(308)在的一个长方形空间邻域
Figure A200680054956D00238
上求和,该邻域包含固定数目C3个新网格点,典型地,C3介于16到256之间:
e ^ &gamma; ( n , t ) = &Sigma; x ^ ( p , t ) &Element; N &OverBar; 3 ( n , t ) e &gamma; ( p , t ) . - - - ( 8 )
在另一个示例性实施例中,上述求和被一个加权求和代替,其中
Figure A200680054956D00242
中的所有权重之和等于一个常数,该常数对于所有新点保持相同。
对于一个单位缩放的解隔行扫描系统来说,为了对电影电视胶片格式的输入视频进行解隔行扫描,需要包括用于执行对前一帧图像和后一帧图像拷贝的两个简单的插值器。我们将拷贝前一帧图像的插值器标记为Eγp,Eγp设置υγp(n,t)=υ(n′,t-1),其中x(n′,t-1)具有和
Figure A200680054956D00244
相同的空间位置。我们将拷贝后一帧图像的插值器标记为Eγn,Eγn设置υγn(n,t)=υ(n′,t+1),其中x(n′,t+1)具有和
Figure A200680054956D00245
相同的空间位置。
对于一个解隔行扫描系统来说,缩放系统可包括一个全局电视/电影分类器(309),该模块为每帧输入图像υ(n,t)输出一个图像类型c(t),用于确定图像是属于“隔行扫描电视类型(Interlaced Video Type)”序列还是属于“电影电视胶片类型(Telecined Film Type)”序列。“隔行扫描电视类型”类表明该图像是隔行扫描视频的一个场;“电影电视胶片类型”类表明该输入图像是一个电影电视胶片的场。上述类型的每一类又根据图像υ(n,t)是更接近于“前”一帧输入图像还是更接近于“后”一帧图像进一步细分。因此得到四种分类,分别是:“电影电视胶片类型,后”、“电影电视胶片类型、前”、“隔行扫描电视类型,后”、“隔行扫描电视类型,前”。
在第一实施例中,全局电视/电影分类器(309)拥有一个用户界面,允许用户确定该图像是“隔行扫描电视类型”图像还是“电影电视胶片类型”图像。在模块(309)的一个自动化实施例中,通过全局的总变化增量测量进行分类。对于每个新点
Figure A200680054956D00246
总变化增量模块(305)输出对应于每个插值器Eγ的总变化增量ωγ(n,t),特别地,当γ=γp且γ=γn时,对应于拷贝前一帧图像和后一帧图像。模块(309)接收这些总变化增量ωγp(n,t)和ωγn(n,t)作为输入,并在整个新网格上计算全局总变化增量:
Figure A200680054956D00251
以及
Figure A200680054956D00253
如果
Figure A200680054956D00254
其中η1>1,典型地,其取值小于10;η2>1,典型地,其取值小于10;则设置图像类型c(t)为“电影电视胶片类型”图像。否则,对于阈值T,典型地,预先设定的1字节图像的该阈值介于1到50之间,如果
Figure A200680054956D00255
则设置c(t)也为“电影电视胶片类型”图像。否则,设置c(t)为“隔行扫描电视类型”图像。在上述任意一种情况下,如果Wγn(t)<Wγp(t),则图像的子类型是“后”,表示该图像更接近于后一帧图像;否则,图像的子类型是“前”。
最小损失选择模块(310)接收对每个新点
Figure A200680054956D00256
以及每个插值器Eγ的调整后的区间不敏感损失调整后的总变化增量
Figure A200680054956D00258
以及调整后的方向匹配误差
Figure A200680054956D00259
作为输入。该模块计算校正损失,并在给定图像类型c(t)下,执行条件性最小化操作,以找到最佳插值器的参数φ(n,t)。模块(310)为每个新点
Figure A200680054956D002510
输出最小损失估计 &upsi; ^ &phi; ( n , t ) ( n , t ) .
如果缩放系统不是单位缩放的解隔行扫描系统,则对于每个新点
Figure A200680054956D00262
通过输入总变化增量和方向匹配误差对调整后的不敏感损失进行校正:
l &OverBar; &gamma; ( n , t ) = l ^ &gamma; ( n , t ) + &lambda; w ^ &gamma; ( n , t ) + &mu; e ^ &gamma; ( n , t ) ,
其中,λ和μ是两个校正常数,它们的典型选择是介于1到10之间的数。最小损失选择模块(310)找到参数ξ,使得不包括这两个拷贝插值器的校正损失最小:
l &OverBar; &xi; ( n , t ) = min &gamma; &Element; &Gamma; &gamma; &NotEqual; &gamma; p , &gamma; &NotEqual; &gamma; n l &OverBar; &gamma; ( n , t ) - - - ( 9 )
其中,设置φ(n,t)=ξ。
如果缩放系统是单位缩放的解隔行扫描系统,则最佳插值器的选择依赖于全局电视/电影分类器(309)的输出。如果图像类型c(t)是“电影电视胶片类型,后”,则设置φ(n,t)=γn,其对应于从后一帧图像的拷贝。如果图像类型c(t)是“电影电视胶片类型,前”,则设置φ(n,t)=γp,其对应于从前一帧图像的拷贝。如果图像类型是“隔行扫描电视类型”,则根据公式(9)计算下标为ξ的插值器的最小损失。如果图像类型c(t)是“隔行扫描电视类型,后”,则最佳插值器与本地的电影电视胶片序列的从后一帧图像插值器的拷贝进行比较。如果
l ^ &xi; ( n , t ) + &lambda; &prime; w ^ &xi; ( n , t ) < l ^ &gamma; n ( n , t ) + &lambda; &prime; &omega; ^ &gamma; n ( n , t )
其中,λ′是校正常数,则φ(n,t)=ξ,否则φ(n,t)=γn。典型地,选择λ′介于1到10之间。相似地,如果图像类型c(t)是“隔行扫描电视类型,前”,则当
l ^ &xi; ( n , t ) + &lambda; &prime; w ^ &xi; ( n , t ) < l ^ &gamma; p ( n , t ) + &lambda; &prime; &omega; ^ &gamma; p ( n , t )
其中λ′是校正常数,则φ(n,t)=ξ,否则φ(n,t)=γp
如图1和图2所示的装置一样,上述描述的这些装置对视频图像的单个分量进行了处理。
对于多分量图像,可以独立地处理所有分量。本发明中也包括了同时处理所有分量的处理方法,此时,将校正损失模块(310)定义为从每个分量获得的校正损失的加权求和,这样就可以在任何给定的新网格点为所有分量选择相同的最佳插值器Eγ
本发明可以体现为运行在通用目的微处理器或数字信号处理器上的软件,此时,如图1~3中所描述的各个模块可以理解为是软件模块或程序,或形成软件模块或程序的一部分。本发明也可以用硬件加以实施,例如通过ASIC或FPGA,此时,前面提及的模块可以形成固体组件的一些区域。本发明的这些实施例可以体现在不同形式的装置中,如机顶盒或者高分辨率电视机,其输入隔行扫描的SDTV视频,并输出或显示HDTV视频。本发明也可以体现在上/交叉/下转换器中以修改输入视频的格式,并输出任何指定的视频格式。
以上给出了本发明的示例性实施例的详细描述,不同的变型、修改或者等同的实施方案对于本领域普通技术人员来说都是显而易见的。例如,以上所描述的本发明的参数化插值器模块或最小损失选择模块的不同组成部分用于执行某些指定的功能,本领域普通技术人员在不偏离本发明的精神下,很容易想到用服务模块的其他组成部分或电路执行其中的一些或全部功能。因此,上述对本发明的描述不能被认为是对本发明所要求保护的范围的限制,也即所附的权利要求限定的保护范围。

Claims (16)

1.一种用于处理输入视频信号以得到输出视频信号的数字视频缩放方法,所述输入视频信号在一个空-时输入网格的各个点上具有各自的输入图像值,所述输出视频信号在一个空-时输出网格的各个点上具有各自的输出图像值,该空-时输出网格的各个点包括所述输入网格的点和新点,对于每个所述新点,该方法包括如下步骤:
(a)对所述新点所对应的一个空-时邻域上的输入图像值应用一个预定义的参数化线性插值器的族,以在所述新点上为所述族的每个插值器提供一个插值后的值;
(b)从所述新点的空-时邻域上的输入图像值估计一个与所述新点相关联的值的区间,以使得所述新点上的输出图像值的概率分布被估计在所述值的区间内具有一个全局最大值;
(c)基于一个在与所述新点相关联的值的区间内是常数且最大值的第二概率分布,为所述新点上的每个插值后的值计算一个损失值;
(d)在所述新点的一个空间邻域中,对为所述族中的每个插值器计算得到的损失值进行空间滤波;以及
(e)选择所述族中的一个插值器,该插值器满足基于滤波后的损失值最小化标准,其中,将所选择的插值器的插值后的值作为在所述新点处的输出图像值。
2.根据权利要求1所述的缩放方法,其中在所述新点处为一个插值后的值计算得到的损失值,表示为所述插值后的值相对于所述第二概率分布的负对数似然。
3.根据权利要求1或2所述的缩放方法,其中估计所述新点的值的区间的步骤包括:
(a)将用于估计所述值的区间的所述空-时邻域分割成多个子邻域;
(b)对每个所述子邻域中的输入图像值进行排序;
(c)对每个所述子邻域,从被排序的输入图像值中的两个指定排序的值估计一个部分区间;以及
(d)合并所述多个部分区间,以形成与所述新点相关联的所述值的区间。
4.根据权利要求1至3中任一项所述的缩放方法,其中所述第二概率分布在所述值的区间之外具有指数衰减。
5.根据权利要求1至4中任一项所述的缩放方法,对于每个所述新点以及所述族中的每个插值器,还包括以下步骤:
(a)从所述输入图像值和所述插值后的值的集合中计算一个总变化增量,其中所述插值后的值是在所述新点的一个一维空间邻域上通过所述插值器计算获得;以及
(b)在所述新点的一个空间邻域内,对所述总变化增量进行空间滤波,
其中,为所述新点选择所述族中的一个插值器的所述最小化标准还依赖于滤波后的总变化增量。
6.根据权利要求5所述的缩放方法,其中所述一维空间邻域是一个垂直或水平的空间邻域。
7.根据权利要求5或6所述的缩放方法,其中为所述新点选择所述族中的一个插值器的最小化标准包括所述滤波后的损失值和所述滤波后的总变化增量的加权求和。
8.根据权利要求1至7中任一项所述的缩放方法,其中所述族中的插值器包括参数化方向插值器,用于沿着所述输入网格的各自的参数化空-时方向计算线性插值。
9.根据权利要求8所述的缩放方法,对每个所述新点以及所述族的每个方向插值器,还包括如下步骤:
(a)从沿着与所述插值器对应的空-时方向与所述新点对齐的插值后的输入图像值的差值中,计算得到一个方向匹配误差;以及
(b)在所述新点的一个空间邻域中,对所述方向匹配误差进行空间滤波,
其中,为所述新点选择所述族中的一个插值器的所述最小化标准还依赖于滤波后的方向匹配误差。
10.根据权利要求9所述的缩放方法,其中为所述新点选择所述族中的一个插值器的所述最小化标准包括对所述滤波后的损失值和所述滤波后的方向匹配误差的一个加权求和。
11.根据权利要求5和9所述的缩放方法,其中,为所述新点选择所述族中的一个插值器的所述最小化标准包括对所述滤波后的损失值、所述滤波后的总变化增量以及所述滤波后的方向匹配误差的一个加权求和。
12.根据权利要求1至11中任一项所述的缩放方法,其中所述输入视频信号是隔行扫描的,并且输出视频信号是逐行扫描的。
13.根据权利要求12所述的缩放方法,还包括步骤:
(a)将所述输入视频信号的每幅图像分类为“隔行扫描电视类型”或者“电影电视胶片类型”;
(b)确定所述图像是否更接近于所述输入视频信号的前一帧图像而不接近所述输入视频信号的后一帧图像;
其中,介于类型为“电影电视胶片类型”的连续图像之间的新点的值通过拷贝所述新点位置之前或之后的图像合成,而类型为“隔行扫描电视类型”的新点的值通过选择所述族中的插值器的方式合成。
14.一种用于在电视显示器上显示图像的电视系统,包括用于接收输入视频信号的装置,根据上述权利要求中任一项所述方法的用于处理输入视频信号的装置,以及用于显示由所述处理装置产生的输出视频信号的装置。
15.一种视频缩放设备,包括用于执行根据权利要求1-13中任一项所述的方法的计算机装置。
16.一种计算机程序产品,其特征在于,当在一个计算机处理单元运行所述计算机程序产品时,包括用于执行权利要求1-13中任一项所述的方法的指令。
CN2006800549563A 2006-04-12 2006-04-12 鲁棒的超分辨率视频缩放的方法及装置 Expired - Fee Related CN101473346B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/EP2006/004316 WO2007115583A1 (en) 2006-04-12 2006-04-12 Method and apparatus for robust super-resolution video scaling

Publications (2)

Publication Number Publication Date
CN101473346A true CN101473346A (zh) 2009-07-01
CN101473346B CN101473346B (zh) 2012-06-20

Family

ID=36722577

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2006800549563A Expired - Fee Related CN101473346B (zh) 2006-04-12 2006-04-12 鲁棒的超分辨率视频缩放的方法及装置

Country Status (5)

Country Link
US (1) US8054380B2 (zh)
EP (1) EP2008240B1 (zh)
JP (1) JP4932900B2 (zh)
CN (1) CN101473346B (zh)
WO (1) WO2007115583A1 (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105427245A (zh) * 2015-11-06 2016-03-23 浙江宇视科技有限公司 一种双三次插值误差累积消除方法及装置
CN105531725A (zh) * 2013-06-28 2016-04-27 D-波系统公司 用于对数据进行量子处理的系统和方法
CN107995490A (zh) * 2017-12-14 2018-05-04 清华大学 信号获取方法及装置
US11386346B2 (en) 2018-07-10 2022-07-12 D-Wave Systems Inc. Systems and methods for quantum bayesian networks
US11461644B2 (en) 2018-11-15 2022-10-04 D-Wave Systems Inc. Systems and methods for semantic segmentation
US11468293B2 (en) 2018-12-14 2022-10-11 D-Wave Systems Inc. Simulating and post-processing using a generative adversarial network
US11481669B2 (en) 2016-09-26 2022-10-25 D-Wave Systems Inc. Systems, methods and apparatus for sampling from a sampling server
US11586915B2 (en) 2017-12-14 2023-02-21 D-Wave Systems Inc. Systems and methods for collaborative filtering with variational autoencoders
US11625612B2 (en) 2019-02-12 2023-04-11 D-Wave Systems Inc. Systems and methods for domain adaptation
US11900264B2 (en) 2019-02-08 2024-02-13 D-Wave Systems Inc. Systems and methods for hybrid quantum-classical computing

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100763917B1 (ko) * 2006-06-21 2007-10-05 삼성전자주식회사 고속으로 움직임을 추정하는 방법 및 장치
US8244057B2 (en) * 2007-06-06 2012-08-14 Microsoft Corporation Removal of image artifacts from sensor dust
KR20100118978A (ko) 2008-01-11 2010-11-08 조란(프랑스) 초 해상도 비디오 프로세싱을 위한 스파스 지오메트리
US8503533B1 (en) 2008-02-01 2013-08-06 Zenverge, Inc. Motion estimation engine for performing multiple types of operations
GB2491772B (en) 2010-04-02 2013-12-11 Zoran France Cadence detection for interlaced video based on temporal regularity
WO2011141196A1 (en) 2010-05-11 2011-11-17 Zoran (France) Two-dimensional super resolution scaling
DE112011101938T5 (de) 2010-06-07 2013-07-18 Zoran (France) Bildinterpolationsverfahren mit Entscheidungsmix
US10318881B2 (en) 2013-06-28 2019-06-11 D-Wave Systems Inc. Systems and methods for quantum processing of data

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5428398A (en) 1992-04-10 1995-06-27 Faroudja; Yves C. Method and apparatus for producing from a standard-bandwidth television signal a signal which when reproduced provides a high-definition-like video image relatively free of artifacts
US5661525A (en) * 1995-03-27 1997-08-26 Lucent Technologies Inc. Method and apparatus for converting an interlaced video frame sequence into a progressively-scanned sequence
US5936676A (en) * 1997-08-21 1999-08-10 Miranda Technologies Inc. Apparatus and method for line interpolating an interlaced video signal
US6181382B1 (en) * 1998-04-03 2001-01-30 Miranda Technologies Inc. HDTV up converter
KR100303728B1 (ko) * 1999-07-29 2001-09-29 구자홍 격행주사 영상의 디인터레이싱 방법
GB2352910B (en) 1999-07-30 2004-03-03 Sony Uk Ltd Method of processing signals and apparatus for signal processing
US6940557B2 (en) 2001-02-08 2005-09-06 Micronas Semiconductors, Inc. Adaptive interlace-to-progressive scan conversion algorithm
US20060045384A1 (en) * 2002-09-11 2006-03-02 Koninklijke Philips Electronics N.V. Unit for and method of image conversion
KR100568105B1 (ko) * 2003-10-02 2006-04-05 삼성전자주식회사 에지 기반의 영상 적응형 디인터레이싱 방법
KR100995398B1 (ko) * 2004-01-20 2010-11-19 삼성전자주식회사 수직 및 수평 방향의 패턴을 고려한 전역 움직임 보상순차주사화 방법
CN1312635C (zh) * 2004-03-17 2007-04-25 致伸科技股份有限公司 图像的缩放方法
US7352919B2 (en) * 2004-04-28 2008-04-01 Seiko Epson Corporation Method and system of generating a high-resolution image from a set of low-resolution images
CN1293514C (zh) * 2004-07-08 2007-01-03 北京中星微电子有限公司 一种数字图像的缩放处理系统
CN100351869C (zh) * 2004-09-15 2007-11-28 致伸科技股份有限公司 一种数字图像插值处理方法
US7567294B2 (en) * 2005-03-28 2009-07-28 Intel Corporation Gradient adaptive video de-interlacing
DE102005063072B4 (de) * 2005-12-30 2017-02-02 Entropic Communications, Inc. Verfahren und Vorrichtung zur Zwischenzeileninterpolation

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105531725A (zh) * 2013-06-28 2016-04-27 D-波系统公司 用于对数据进行量子处理的系统和方法
CN105531725B (zh) * 2013-06-28 2018-03-13 D-波系统公司 用于对数据进行量子处理的系统和方法
US11501195B2 (en) 2013-06-28 2022-11-15 D-Wave Systems Inc. Systems and methods for quantum processing of data using a sparse coded dictionary learned from unlabeled data and supervised learning using encoded labeled data elements
CN105427245A (zh) * 2015-11-06 2016-03-23 浙江宇视科技有限公司 一种双三次插值误差累积消除方法及装置
CN105427245B (zh) * 2015-11-06 2018-12-07 浙江宇视科技有限公司 一种双三次插值误差累积消除方法及装置
US11481669B2 (en) 2016-09-26 2022-10-25 D-Wave Systems Inc. Systems, methods and apparatus for sampling from a sampling server
CN107995490A (zh) * 2017-12-14 2018-05-04 清华大学 信号获取方法及装置
US11586915B2 (en) 2017-12-14 2023-02-21 D-Wave Systems Inc. Systems and methods for collaborative filtering with variational autoencoders
US11386346B2 (en) 2018-07-10 2022-07-12 D-Wave Systems Inc. Systems and methods for quantum bayesian networks
US11461644B2 (en) 2018-11-15 2022-10-04 D-Wave Systems Inc. Systems and methods for semantic segmentation
US11468293B2 (en) 2018-12-14 2022-10-11 D-Wave Systems Inc. Simulating and post-processing using a generative adversarial network
US11900264B2 (en) 2019-02-08 2024-02-13 D-Wave Systems Inc. Systems and methods for hybrid quantum-classical computing
US11625612B2 (en) 2019-02-12 2023-04-11 D-Wave Systems Inc. Systems and methods for domain adaptation

Also Published As

Publication number Publication date
WO2007115583A1 (en) 2007-10-18
JP2009533909A (ja) 2009-09-17
US8054380B2 (en) 2011-11-08
JP4932900B2 (ja) 2012-05-16
CN101473346B (zh) 2012-06-20
EP2008240B1 (en) 2014-01-08
US20090278981A1 (en) 2009-11-12
EP2008240A1 (en) 2008-12-31

Similar Documents

Publication Publication Date Title
CN101473346B (zh) 鲁棒的超分辨率视频缩放的方法及装置
US7667773B2 (en) Apparatus and method of motion-compensation adaptive deinterlacing
US6331874B1 (en) Motion compensated de-interlacing
US7042512B2 (en) Apparatus and method for adaptive motion compensated de-interlacing of video data
EP1223748B1 (en) Motion detection in an interlaced video signal
US6810081B2 (en) Method for improving accuracy of block based motion compensation
EP1164792A2 (en) Format converter using bidirectional motion vector and method thereof
US6822691B1 (en) Method of detecting motion in an interlaced video sequence utilizing region by region motion information and apparatus for motion detection
EP1143712A2 (en) Method and apparatus for calculating motion vectors
JP4103073B2 (ja) ビデオ信号を変換する方法および装置
US6614485B2 (en) Deinterlacing apparatus
US8355442B2 (en) Method and system for automatically turning off motion compensation when motion vectors are inaccurate
CN101647292B (zh) 色度视频信号的运动自适应上采样
US20030112369A1 (en) Apparatus and method for deinterlace of video signal
US6930728B2 (en) Scan conversion apparatus
US7421150B2 (en) Coordinate conversion apparatus and method
Park et al. Covariance-based adaptive deinterlacing method using edge map
US20050162548A1 (en) Apparatus and method for performing intra-field interpolation for de-interlacer
US8494292B2 (en) Image processing apparatus
EP1665781B1 (en) Robust de-interlacing of video signals
JP4250807B2 (ja) フィールド周波数変換装置および変換方法
JPH08186802A (ja) 飛び越し走査画像の補間画素作成方法
JP3800638B2 (ja) 画像情報変換装置および方法
KR100441552B1 (ko) 영상변환장치 및 방법
KR101174601B1 (ko) Fdif와 적응적인 가중치를 이용한 디인터레이싱 장치 및 방법

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20120620

Termination date: 20130412