CN1154361C - 图像处理设备、图像处理方法及为其提供的媒体 - Google Patents

图像处理设备、图像处理方法及为其提供的媒体 Download PDF

Info

Publication number
CN1154361C
CN1154361C CNB991010477A CN99101047A CN1154361C CN 1154361 C CN1154361 C CN 1154361C CN B991010477 A CNB991010477 A CN B991010477A CN 99101047 A CN99101047 A CN 99101047A CN 1154361 C CN1154361 C CN 1154361C
Authority
CN
China
Prior art keywords
image
distribution
movement
level
pixel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB991010477A
Other languages
English (en)
Other versions
CN1230079A (zh
Inventor
近藤哲二郎
中屋秀雄
田中健司
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of CN1230079A publication Critical patent/CN1230079A/zh
Application granted granted Critical
Publication of CN1154361C publication Critical patent/CN1154361C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/14Picture signal circuitry for video frequency region
    • H04N5/144Movement detection
    • H04N5/145Movement estimation

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Television Systems (AREA)
  • Image Analysis (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

估算部分根据两个连续的帧计算每一个象素的运动矢量和其可靠度,并产生相应于所述第k帧和第k+1帧的一级运动分布图像,可把任何的运动矢量和可靠度分配给每一个象素。更新部分把相应于所述第k+1帧的输入一级运动分布图像和相应于第k帧的四级运动分布图像组合,以产生相应于所述第k+1帧的二级运动分布图像。预测部分产生相应于所述第k+1帧的三级运动分布图像。内插部分用不偏置估算以产生相应于所述第k+1帧的四级运动分布图像。

Description

图像处理设备、图像处理方法及为其提供的媒体
本申请涉及第08/816,867号美国专利申请,该申请于1997年3月13日提交,它部分地转让给本发明的受让人,本申请还涉及第08/837,491号美国专利申请,该申请于1997年4月18日提交,它转给本发明的受让人,而所述相关的美国专利申请都通过参照被引入于此。
技术领域
本发明涉及图像处理设备、图像处理方法和其记录媒体,本发明尤其涉及及图像处理设备、图像处理方法和其记录媒体,其中可以根据时间上连续的图像以象素为单位来估算运动。
背景技术
作为根据运动画面估算指出图像运动(下面称的运动估算)的参数的方法,已知一种仪用最小预测偏差(residual)法则的方法,例如,块匹配方法,在使用最小预测偏差法则的运动估算方法中,由于把图像划分为由多个象素形成的块,并且运动估算以块为单位执行,故运动估算的空间分辨率较低,并且运动估算只能对于刚体执行,形成该刚体的部分平行地运动。结果,用这种方法不能对具有不均匀的运动分布的非刚体进行运动估算。
例如,在使用最小预测偏差法则的运动估算方法中,用块匹配方法,当实际运动超出搜索范围时,运动估算有较大误差,并出现较低耐久性。相应地,希望提供一种方法、设备和计算机程序,以在图像运动估算中提高空间分辨率,并确保耐久性。考虑了上述情况做出本发明。
本发明的一个目的是使用不偏置估算,通过非判决理论(non-decisiontyeory)方法提高运动估算的空间分辨率,并确保耐久性。
本发明的一个特点是通过使用不偏置估算,以象素为单位进行运动估算,由此提高运动估算的空间分辨率和耐久性。
根据本发明的一个方面,用于估算运动画面(该画面包含多个图像)的运动的方法包括下述步骤:根据第k个图像和第(k+1)个图像估算相应于第k个图像的每一个象素的运动参数,以产生相应干第k个图像的一级运动分布图像,相应于第k个图像的一级运动分布图像由相应干第k个图像的象素的运动参数来表示;至少根据第(k+1)个图像估算相应于第(k+1)个图像的每一个象素的运动参数,以产生相应于第(k+1)个图像的一级运动分布图像,相应于第(k+1)个图像的一级运动分布图像的相应于第(k+1)个图像的象素的运动参数来表示;更新相应于第(k+1)个图像的一级运动分布图像,以产生相应于第(k+1)个图像的二极运动分布图像;根据相应于第(k+1)个图像的二极运动分布图像预测相应于第(k+1)个图像的三级运动分布图像;以及内插相应于第(k+1)个图像的三级运动分布图像,从产生相应于第(k+1)个图像的四级运动分布图像,这里k是整数,并且其中更新步骤用高于从第k个图像产生的一级运动分布的图像的运动分布图像,更新相应于第(k+1)个图像的一级运动分布图像。
根据本发明另一个方面,用于估算运动画面的移动的设备。(运动画面包括多个图像)包括估算装置,用于根据第k个图像和第(k+1)个图像估算相应于第k个图像的每一个像素的运动产物,以产生相应于第k个图像的一级运动分布图像,相应于第k个图像的一级运动分布图像的相应于第k个图像的素素的运动参数表示;估算装置,用于根据第(k+1)个图像估算相应于第(k+1)个图像的每一个像素的运动参数,以产生相应于第(k+1)个图像的一级运动分布图像,相应于第(k+1)个图像的一级运动分布图像由相应于第(k+1)个图像的象素的运动参数表示;更新装置,用于更新相应于第(k+1)个图像的一级运动分布图像,以产生相应于第(k+1)个图像的二级运动分布图像;预测装置,用于根据相应于第(k+1)个图像的二级运动分布图像预测相应于第(k+1)个图像的三级运动分布图像;及内插装置,用于内插相应于第(k+1)个图像的三级运动分布图像,从产生相应于第(k+2)个图像的四级运动分布图像,这里k是整数,并且其中更新装置用高于根据第k个图像产生的一级运动分布图像的运动分布图像,更新相应于第(k+1)个图像的一级运动分布图像。
附图说明
当参照下面的描述和附图考虑时,这些和其他的目的、特点和优点将是显然的,这里相同类似的标号代表相同或相似的部分。
图1是示出应用本发明的图像处理设备结构的方框图。
图2是流程图,描述图1所示的图像处理设备的操作。
图3是示出图1所示的图像处理设备的操作的图。
图4是图2的步骤S3中所示的估算处理的流程图。
图5是描述图2的步骤S6中所示的预测处理的图。
图6是描述图2的步骤S6中所示的预测处理的另一图。
图7是图2的步骤S6中所示的预测处理的流程图。
图8是图2的步骤S7中所示的内插处理的流程图。
图9是图2的步骤S5中更新处理的流程图。
图10A和10B是示于显示器上的灰度等级图像的照片,用于在本发明和传统的图像处理之间进行比较。
图11A、11B、11C和11D示出示于显示器上的灰度等级图像的照片,以描述将本发明应用于拉摄图像的情况。
具体实施方式
下面描述本发明的实施例。下面将通过参照图1描述应用本发明的图像处理设备的结构。图像处理设备中的控制部分1控制整个设备。硬盘2存储预先输入的运动图像,并根据控制部分1的控制,将运动图像输出到再现部分3。一系列运动图像一个(场景)由多个静止图像(帧)形成,对这些帧分配帧序号(fr=0,1,2,…,k,k+1。…,N)。
再现部分3以帧为(作为静止图像)单位从硬盘2送来的运动图像,并将这样的数据输出到估算部分4。
估算部分4根据第k帧和第(k+1)帧相应于k帧为每一个象素计算运动矢量及其可靠度,第k帧和第(k+1)帧在时序上是连续的,并从再现部分3送出。估算部分4还通过将运动矢量和其可靠度分配给每一个象素(执行无偏置估算)而产生相应于第k帧的一级运动分布图像,并将这样的数据输出给更新部分5。相应于第0帧的一级运动分布图像输出到预测部分6。
更新部分5组合了相应于从估算部分4送出的第(k+1)帧的一级运动分布图像以及相应于从内插部分7(在下面描述)送出的第k帧的四级运动分布图像,以产生相应于第(k+1)帧的二级运动分布图像,并将其输出到预测部分6。在相应于第0帧(fr=0)的一级运动分配图像的情况下,不执行此更新操作。
预测部分6根据相应于从更新部分5送出的第k+1帧的二级运动分布图像(或者在fr=0的情况下,相应于从估算部分4送出的第0帧的一级运动分布图像),预测相应于第(k+1)帧的三级运动分布图像,并将其输出到内插部分7。在这种情况下,三级运动分布图像中每一个象素的运动矢量由一假设预测,即二级分配图像(或者在fr=0的情况下,相应于第0帧的一级运动分布图像)中每一个象素的运动矢量不变。
内插部分7使用不偏置估算在相应于输入第(k+1)帧的三级运动分布图像的空白间隙中内插,以产生相应于第(k+1)帧的四级运动分布图像。作为最后的运动分布图像输出,相应于第(k+1)帧的四级运动分布图像,它表示从第k帧到第(k+1)帧的移动,并被提供给更新部分5。
作为每一个部分的工作区域,存储器8暂时地存储信息并将其输出到每一个部分。如图1中所示,控制部分1、硬盘2、再现部分3、估算部分4、更新部分5、预测部分6、内插部分7和储存器8通过总线9耦合。
下面将参照图2和图3中所示的流程图描述这个图像处理设备的操作。在步骤S1中,控制部分1检查构成存储在硬盘2中的构成一个场景的帧的总数N,并初始化指出帧的顺序的参数fr(fr设置为0)。
在步骤S2中,判定fr是否为N(N表示最后帧)。当确定fr不是N时,处理进入至步骤S3。
在步骤S3中,执行估算处理。下面将参照图4的流程图描述估算处理的细节。
在步骤S11中,要在估算帧(第k级帧)中估算的象素的坐标(i,j)初始化为(0,0)。在步骤S12中,判定要估算的象素的坐标(i,j)是否不大于最大值(imax,jmax)(即在帧内)。当判定要估算的象素的坐标(i,j)不大于最大值(imax,jmax)(即在帧内)时,处理进至步骤S13。
在步骤13中,变量“counter”和“sum”设置为零。在步骤S14中,参考帧(第(k+1)帧)中参考象素的坐标(ix,jy)初始化(i-range,j-range)。参考帧中的参考象素的区域是一个正方形,它具有规定长度(2×range)的边,中心在坐标(i,j)处。因此,坐标(ix-range,iy-range)指出参考区域左上角处的象素。
在步骤15中,算出要估算的象素(i,j)的象素值和参考象素(ix,iy)之间差值的平方和+0.01)的值,并加到变量“sum”中。数值0.01是为防止可靠度发散到无限大的补偿值。
在步骤16中,算出参考象素的坐标(ix,iy)和要估算的象素的坐标(i,j)之间的差值(ix-i,iy-j)(运动数量)。用参考区域中象素的序号“counter”把算出的值设置在数组iv_hist[counter]中。以相同的方法,用参考区域中的象素的序号counter把变量sum设置在数组sum_histp[counter]中,阵列sum_hist[counter]用于下面描述步骤S21中计算可靠度P。
在步骤S17中,判定参考象素的坐标(ix,iy)是否小于最大值(i+range,j+range)(在参考区域中是否在尚未被参考的象素)。当确定它们不小于(即已经参考参考区域中所有的象素时),处理进至步骤S18。如果存在尚未被参考的象素,则处理进至步骤S23,而变量counter递增。然后处理进至步骤S24,在该步骤处坐标(ix,iy)递增。然后用另一个要处理的象素执行步骤S15。
在步骤S18中,变量sum_thres定义为变量sum乘以一随机数(在0和1之间)。换句话说,使用定义阈值,在步骤S19中,变量ocunter初始化为零。
在步骤S20中,判定数组sum_hist[counter]的值是否大于在步骤S18中随机地定义为sum_thres(阈值)(它是否不适合作为参考象素)。如果数组sum_hist[counter]的值小于或等于sum_thres(它不适合作为参考象素),则处理进至步骤S25。变量counter递增,而处理返回步骤S20。如在步骤中描述的,由于经过处理的值一次在变量sum中累加,当变量counter变大时,sum_hist[counter]的值也变大。结果sum_hist[counter]的值变得大于sum_thres的值的可能性增加。
当判定数组sum_hist[counter]的值大于sum_thres(即,象素适合作为参考象素时),处理进至步骤S21。在步骤S21中,相应于数组sum_hist[counter]设置在数组iv_hist[counter]中运动矢量拷贝为要估算的移动矢量(在坐标(i,j)处的象素),而(sum_hist[counter]-sum_hist[counter])/sum的值算为它的可靠度P,并被设定。
在步骤S22中,递增坐标(i,j)。当有其他设置的坐标要被处理时,处理返回到步骤S12。
在步骤S12中,如果判定(i,j)大于最大值(imax,jmax)(不在帧内),则相应于第fr帧的一级估算分布图像的估算处理结束,而相应于第fr帧的一级估算分配图像的处理返回到图2中的步骤S3。
在上述方法中,已经用不偏置估算产生了fr=0的一级运动分布图像。
下面将再次描述图2中的流程图。
以上述方式执行了估算处理后,在步骤S4判定是否帧参数fr=0(指出开始帧)。当判定fr不是零时,处理进至步骤S5。在步骤S5中,更新部分5执行更新处理。但如果起先fr为0,则跳过步骤S5中的更新处理,而处理进至步骤S6。
在步骤S6中,执行预测处理,如图5中所示。即,相应于第(fr+1)帧的每一个象素作预测,其假设为在相应于第fr帧的输入二级移动分配图像中(如果fr=0相应于第0级帧的一级移动分配图像)中象素以相同的速度运动。还有,如图6中所示,当可考虑多个移动矢量,使用具有最大可靠度P的移动矢量。下面将参照图7的流程图描述预测处理的细节。
在步骤S31中,把相应于第fr级帧的输入二级移动分配图像(或如果fr=0,相应于第fr帧的一级移动分配图像)的移动矢量(x,y)和安排在输入数据数组src[i,j]中。
在步骤S32中,把输出数组dst[i,j]初始化(把移动矢量和可靠度P都设置为零)。在步骤S33中,要预测的象素的坐标(i,j)初始化为(0,0)。
在步骤S34中,判定第fr帧的要预测的象素的坐标(i,j)是否不大于最大值(imax,jmax)(在帧内)。如果判定坐标(i,j)不大于最大值(imax,jmax)(在帧的范围内),则处理进至步骤S35。
在步骤35中,把变量(fx,fy)设定为输入数据数组src[i,j]的移动矢量(x,y)(fx设定为移动矢量的x分量,而fy设定为移动矢量的y分量)。
在步骤36中,判定dst[i+fx,j+fy]的可靠度P是否小于scr[i,j]的可靠度。当判定dst[i+fx,j+fy]的可靠度P小于src[i,j]的可靠度时,处理进至步骤S37。在步骤S37中,把dst[i+fx,j+fy]的移动矢量(三级移动分配图像的移动矢量)设定为src[i,j]的运动矢量。换句话说,执行图6所示的处理。当判定dst[i+fx,j+fy]的可靠度P不小于scr[i,j]的可靠度时,或当步骤S37结束时,在步骤38中递增坐标(i,j),并且然后当有另一个被设定要处理的象素时处理回到步骤S34。在步骤S34中,当判定要预测为象素的坐标(i,j)大于最大值(imax,jmax)(不在帧内)时,预测处理结束,并且处理返回至图2中的步骤S6。用上述方法,用图3中所示的预测处理得到相应于第(fr+1)帧的三级移动分配图像。
下面将再描述图2中的处理。
在用上述方式执行了相应于第(fr+1)帧的移动分配图像的预测处理之后,在步骤S7内插部分7对相应于第(fr+1)帧的三级移动分配图像执行内插处理。下面将参照图8中的流程图描述内插处理的细节。
在步骤S41中,内插的第(fr+1)帧的象素的坐标(i,j)(内插目标)初始化为(0,0)。在步骤S42中,判定坐标(i,j)是否大于最大值(imax,jmax)(在帧内)。当判定要内插的象素的坐标(i,j)不大于最大值(imax,jmax)(在帧内),则处理进至步骤S43。
在步骤S43中,内插部分7判定坐标(i,j)处象素的可靠度P(i,j)是否小于规定的参考值。当判断可靠度P小于规定的参考值(象素缺少信息)时,处理进至步骤S44。当可靠度P(i,j)不小于规定的值时,由于象素不缺少信息。故不需要内插处理。处理进至步骤S55。坐标(i,j)递增。当有另一个要处理的象素时,处理返回到步骤S42,并执行相同的处理。
在步骤S44中,变量counter和sum设定为零。在步骤S45中,参考帧中的参考象素的坐标(ix,jy)初始化为(i-range,j-range)。参考象素区域是一个正方形,具有规定长度(2×range)的边,并且执行在坐标(i,j)处。因此,坐标(i-range,j-range)指出在参考区域的左上角处的象素。
在步骤S46中,内插部分7判断坐标(ix,iy)处的象素的可靠度P(ix,iy)是否大于零。当判定可靠度大于零(即,象素适合作为将其信息(象素值)拷贝到缺少信息的象素上)时,处理进至步骤S47。当可靠度为零时,象素不适合作为拷贝源象素。因此处理进至步骤S56。坐标(ix,iy)递增,并且在另一个要处理的象素时,返回到步骤S46。
在步骤S47中,把L((ix,iy),(i,j))的值加到变量sum,其中L((ix,iy),(i,j))指出一函数,该函数表示坐标(ix,iy)处的象素是否适合作为要内插的象素(i,j)的拷贝源象素,并表示如下:
L((ix,iy),(i,j))=P(ix,iy)×Exp(-P1((ix,iy),(i,j))/a-D2((ix,iy),(i,j)/b)
其中P(ix,iy)指出参考象素的可靠度,D1((ix,iy),(i,j)指出坐标(ix,iy)和(i,j)之间的距离,而D2((ix,iy),(i,j))指出(ix,iy)和(i,j)的象素值之间的差值。
在步骤S48中,算出参考象素(把它当作其要象素值是适合的拷贝源象素)的坐标(ix,iy)之间的差值(ix-1,iy-j)(移动矢量)。用参考区域中的象素的序号counter把算得的值(移动矢量)设置在数组iv_hist[counter]中。用同样的方式,用参考区域中的象素的序号数counter把变量sum设置在sum_hist[counter]中。
在步骤S49中,判定参考象素的坐标(ix,iy)是否小于最大值(i+range,j+range)(在参考区域中是否还存在未被参考的象素)。当判定它们不小于最大值时,(即参考区域中的所有象素都被参考了),则处理进至步骤S50。如果还有未被参考的象素,则处理进至步骤S57,并且变量counter递增。然后处理进至步骤S56。坐标(ix,iy)递增。当有另一个要处理的象素时,执行从步骤S46起的处理。
在步骤S50中,判定变量sum和counter大于零。当贫困sum和counter大于零(在参考区域中存在适合于拷贝的源象素),则处理进至步骤S51。当sum和counter中至少一个是零时,由于参考区域中不存在适合于作拷贝源的象素,故处理进至步骤58。坐标(ix,iy)的可靠度P设置为零,并且处理进至步骤S55。步骤(ix,iy)递增,并且当有另一个要处理的象素时,执行从步骤S42起的处理。
在步骤51中,变量“sum_thres”定义为变量“sum”乘以随机数(在0和1之间)。换句话说,通过使用随机数来定义阈值。在步骤S52中,变量“counter”初始化为零。
在步骤53中,判定数组sum_hist[counter]的值是否大于在步骤51中随机定义的sum_thres(阈值)(它是否适合作为拷贝源象素)。如果数组sum_hist[counter]的值不大于sum_thres(它适合作为拷贝源象素),则处理进至步骤S39。变量“counter”递增,并且处理返回步骤S53。如在步骤S47中所述的,由于处理的值依次在变量“sum”中累加,故当变量“counter”变大时,sum_hist[counter]的值[counter]也变大。结果,sum_hist[counter]的值变得大于sum_thres的值的可能性增加。
当数组sum_hist[counter]的值大于sum_thres(它适合作为拷贝源象素)时,处理进入步骤S54。在步骤S54中,(设置在数组“iv_hist[counter]”中的)可靠度和运动矢量拷贝为要内插的象素的可靠度p(i,j)和运动矢量V1(i,j)。然后,在步骤S55中,坐标(i,j)递增。处理返回到步骤S42,并且执行后继的处理。
在步骤S42中,如果判定(i,j)大于最大值(imax,jmax)(不在帧内)(换句话说,帧中所有的象素已经被处理),则内插处理结束,并且处理返回图2中的步骤S7。
按照上述方式,通过使用不偏置估算(如图3中所示),相应于第(fr+1)帧的四级运动分布图像已经由内插产生。相应于第(fr+1)帧的四级运动分布图像输出为最后的运动分布图像,并用于更新相应于第(fr+1)帧的一级分布图像,以及产生相应于第(fr-1)帧的二级运动分布图像。
下面将描述如图2中所示的流程图。
在按照上述方式执行了内插处理后,在步骤S8中fr递增1,并且处理返回到步骤S2。
在步骤S2和S3中,按照相同的方式执行上述处理。在步骤S4中,由于fr不为零,则处理进到步骤S5,并且更新部分5执行更新处理。下面将参照图9描述更新处理的细节。
在步骤S71中,要更新的象素的坐标(i,j)初始化为(0,0)。在步骤S72中,判定(i,j)是否不大于最大值(imax,jmax)(在帧内)。当判定(i,j)不大于最大值(imax,jmax)(在帧内)时,处理进至步骤S73。
在步骤S73中,变量pp设定为相应于静止图像的四级运动分布图像的数据数组pre[i,j]的可靠度p,其中静止图像具有从内插部分7送出的fr=k(初始k=0)。按照相同的方式,变量cp设定为到相应于静止图像的一级运动分布图像的数据数组cur[i,j]的可靠度p,其中静止图像具有从内插部分7送出的fr=(k+1)。
在步骤S74中,判定变量pp是否大于变量cp。当判定pp大于cp(四级运动分布图像的可靠度p大于一级运动分布图像的可靠度)时,则处理进至步骤S75。当判定pp不大于cp(一级运动分布图像的可靠度p大于四级运动分布图像的可靠度)时,则运动矢量不被更新,并且处理进至步骤S76。坐标(i,j)递增,并且在有另一个要处理的象素时,处理返回到步骤S72。
在步骤S75中,使用“pp”和“cp”用下面的表达式计算一级运动分布图像的运动矢量和四级运动分布图像的运动矢量的加权平均值,以得到和设定相应于第(k+1)帧的二级运动分布图像的运动矢量。
二级运动分布图像的运动矢量
=(pre[i,j]的运动矢量)×{pp/(pp+cp))
+(cur[i,j]的运动矢量)×{cp/(pp+cp))
在步骤S72中,当判定(i,j)大于最大值(imax,jmax)时,更新处理结束,并且处理返回到图2中的步骤S5。
在上述方式中,通过图3中所示的更新处理得到二级运动分布图像。
现在将比较由上述图像处理设备得到的运动分布图像和由传统方式得到的运动分布图像。图10A中示出由应用本发明的图像处理设备得到的运动分布图像。图10B示出根据最大似然估算(这是传统的方法)得到的运动分布图像。用两种方式处理相同的图像(其中模型卡车在固定的桌子上沿左向移动)。图10A中,从最上端的图像开始,示出相应于fr=0静止图像的一级运动分布图像、相应于fr=1的静止图像的三级运动分布图像和相应于fr=4的静止图像的三级运动分布图像。这些图像中的象素密度指出沿水平方向(图像中的左向)运动矢量的大小。
在图10B所示的图像中,模型卡车的轮廓模糊,并且桌子(它是固定的,并在模型的下面)的象素具有某一密度(它指出运动)。另一方面,在图10A所示的图像中,当fr增加时,信息被积累。模型卡车的轮廓变清自析,并且固定部分(桌子)的象素密度增加。换句话说,在图像的固定部分和图像的移动部分之间的相对对比度增加。因此,判定图10A示出具有错误判决少的运动分布图像。
有了如此得到的正确的运动分布图像,可以得出并描绘移动部分的图像,并且变得可能进行运动估算。
现在参照图11A-11D,当拉摄图像时,考虑象素的运动矢量(图像的水平分量)具有朝图像的中心的方向(如图11D中所示),并且其大小数量在其位置离开中心线时增加。图11A描述了根据源数据的图像(代表蝴蝶的图像)。图11B示出图11A的拉摄的图像,其中图11B是相应于fr=1的三级运动分布图像。在图11C(该图示出相应于fr=4的三级运动分布图像)中,图像中象素的密度从左到右逐渐地变浓。其性质类似于如图11D中所示的性质。因此,可以说,可利用本发明的图像处理设备执行变焦的运动估算。
虽然只用了水平运动以解释本发明,但本发明同样可应用于沿诸如垂直的轴等其他轴的运动。另外,本发明还能移应用于指出深度的参数的估算。
虽然为了解释本发明,四级运动分布图像作为最后的运动分布图像输出,但另外的运动分布图像(即第一、第二或第三运动分布图像)亦可以作为最后的运动分布图像输出。
执行上述每一个处理的计算机程序可以通过诸如互联网和数字卫星之类的网络媒体提供给用户。另外,程序存储装置或信息记录媒体(诸如磁盘、CD-ROM、RAM、磁带或DVD)可以用于包含这样的计算机程序。这样的计算机程序可以由机器执行,以执行根据本发明估算移动的方法步骤。
如上所述,根据本发明的图像处理设备、图像处理方法和记录媒体,由于以象素为单位通过使用不偏置估算执行运动估算,故运动估算的空间分辨率增加,并且确保其耐用性。
虽然只详细描述了一些实施例,但那些具有本领域一般技术的人将知道,在不背离本发明的主旨的基础上可以作许多种修改。打算把所有这些修改包括在下面的权利要求中。

Claims (14)

1.一种用于估算运动画面的运动的方法,所述运动画面包括多个图像,其特征在于所述方法包括下述步骤:
根据第k个图像和第k+1个图像估算相应于所述第k个图像的每一个象素的运动参数,以产生相应于所述第k个图像的一级运动分布图像,所述相应于第k个图像的一级运动分布图像,由相应于所述第k个图像的象素的运动参数表示;
至少根据所述第k+1个图像估算相应于所述第k+1个图像的每一个象素的运动参数,以产生相应于所述第k+1个的图像的一级运动分布图像,所述相应于第k+1个图像的一级运动分布图像,由相应于所述第k+1个图像的象素的运动参数表示;
更新相应于第k+1个图像的一级运动分布图像,以产生相应于第k+1个图像的二级运动分布图像;
根据相应于所述第k+1个图像的二级运动分布图像预测相应于所述第k+1个图像的三级运动分布图像;及
内插相应于所述第k+1个图像的三级运动分布图像,以产生相应于所述第k+1个图像的四级运动分布图像,其中k是整数,及
更新步骤使用高于根据所述第k个图像产生的一级运动分布图像的运动分布图像,更新相应于所述第k+1个图像的一级运动分布图像。
2.如权利要求1所述的方法,其特征在于所述高于根据第k个图像产生的一级运动分布图像的运动分布图像是相应于第k个图像的四级运动分布图像。
3.如权利要求1所述的方法,其特征在于所述高于根据第k个图像产生的一级运动分布图像的运动分布图像是相应于第k个图像的四级运动分布图像,所述方法还包括下述步骤:
根据相应于所述第k个图像的一级运动分布图像预测相应于所述第k个图像的三级运动分布图像;及
内插相应于所述第k个图像的三级运动分布图像,以产生相应于所述第k个图像的四级运动分布图像,
其中k=0。
4.如权利要求1所述的方法,其特征在于预测步骤根据相应于所述第k+1个图像的二级运动分布图像预测相应于所述第k+1个图像的三级运动分布图像,其中假设如在相应于所述第k+1个图像的二级运动分布图像中那样,象素以相同的速度运动。
5.如权利要求1所述的方法,其特征在于所述运动参数包括运动矢量和可靠度的指示。
6.如权利要求5所述的方法,其特征在于,根据由所述第k个图像产生的所述一级和高于一级的运动分布图像的可靠度,
所述更新步骤对每一个象素把表示相应于所述第k+1个图像的所述一级运动分布图像的运动矢量和表示高于根据第k个图像产生的所述一级运动分布图像的运动分布图像的运动矢量相组合。
7.如权利要求6所述的方法,其特征在于,高于根据第k个图像产生的一级运动分布图像的运动分布图像是相应于所述第k个图像的四级运动分布图像。
8.一种用于估算运动画面的运动的设备,所述运动画面包括多个图像,其特征在于,所述设备包括:
用于根据第k个图像和第k+1个图像估算相应于所述第k个图像的每一个象素的运动参数的装置,以产生相应于所述第k个图像的一级运动分布图像,所述相应于所述第k个图像的一级运动分布图像由相应所述第k个图像的象素的运动参数表示;
用于至少根据所述第k+1个图像估算相应于所述第k+1个图像的每一个象素的运动参数的装置,以产生相应于所述第k+1个图像的一级运动分布图像,相应于第k+1个图像的一级运动分布图像由相应于所述第k+1个图像的象素的运动参数表示;
用于更新的装置,更新相应于所述第k+1个图像的一级运动分布图像,以产生相应于所述第k+1个图像的二级运动分布图像;
用于预测的装置,根据相应于第k+1个图像的二级运动分布图像预测相应于所述第k+1个图像的三级运动分布图像;及
用于内插的装置,内插相应于所述第k+1个图像的三级运动分布图像,以产生相应于所述第k+1个图像的四级运动分布图像,其中k是整数,及
其中,用于更新的装置使用高于根据所述第k个图像产生的一级运动分布图像的运动分布图像,更新相应于所述第k+1个图像的一级运动分布图像。
9.如权利要求8所述的设备,其特征在于所述高于根据所述第k个图像产生的一级运动分布图像的运动分布图像是相应于所述第k个图像的四级运动分布图像。
10.如权利要求8所述的设备,其特征在于所述高于根据所述第k个图像产生的一级运动分布图像的运动分布图像是相应于所述第k个图像的四级运动分布图像,
其中,所述用于预测的装置根据相应于所述第k个图像的一级运动分布图像预测相应于所述第k个图像的三级运动分布图像;及
所述内插装置内插相应于所述第k个图像的三级运动分布图像,以产生相应于所述第k个图像的四级运动分布图像,
其中k=0。
11.如权利要求8所述的设备,其特征在于所述用于预测的装置根据相应于所述第k+1个图像的二级图像预测相应于所述第k+1个图像的三级运动分布图像,其中假设如在相应于所述第k+1个图像的二级运动分布图像中那样,象素以相同的速度运动。
12.如权利要求8所述的设备,
其特征在于所述运动参数包括运动矢量和可靠度的指示。
13.如权利要求12所述的设备,其特征在于,
对每一个象素,所述用于更新的装置,根据由所述第k个图像产生的一级和高于一级的运动分布图像的可靠度,把表示相应于所述第k+1个图像的一级运动分布图像的运动矢量,和表示高于根据所述第k个图像产生的一级运动分布图像的运动分布图像的运动矢量组合起来。
14.如权利要求13所述的设备,其特征在于所述高于根据第k个图像产生的一级运动分布图像的运动分布图像是相应于所述第k个图像的四运动分布图像。
CNB991010477A 1998-01-07 1999-01-07 图像处理设备、图像处理方法及为其提供的媒体 Expired - Fee Related CN1154361C (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP013456/98 1998-01-07
JP013456/1998 1998-01-07
JP1345698A JP4016227B2 (ja) 1998-01-07 1998-01-07 画像処理装置および方法、並びに記録媒体

Publications (2)

Publication Number Publication Date
CN1230079A CN1230079A (zh) 1999-09-29
CN1154361C true CN1154361C (zh) 2004-06-16

Family

ID=11833660

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB991010477A Expired - Fee Related CN1154361C (zh) 1998-01-07 1999-01-07 图像处理设备、图像处理方法及为其提供的媒体

Country Status (8)

Country Link
US (1) US6285712B1 (zh)
EP (1) EP0929192B1 (zh)
JP (1) JP4016227B2 (zh)
KR (1) KR100590145B1 (zh)
CN (1) CN1154361C (zh)
AU (1) AU748671B2 (zh)
CA (1) CA2257669C (zh)
DE (1) DE69930333T2 (zh)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE60127866T2 (de) 2001-01-16 2007-12-20 Koninklijke Philips Electronics N.V. Verringern von aura-artigen effekten bei der bewegungskompensierten interpolation
US7408989B2 (en) * 2003-01-16 2008-08-05 Vix5 Systems Inc Method of video encoding using windows and system thereof
US20060233258A1 (en) * 2005-04-15 2006-10-19 Microsoft Corporation Scalable motion estimation
US8229166B2 (en) 2009-07-07 2012-07-24 Trimble Navigation, Ltd Image-based tracking
US8155195B2 (en) 2006-04-07 2012-04-10 Microsoft Corporation Switching distortion metrics during motion estimation
US8494052B2 (en) 2006-04-07 2013-07-23 Microsoft Corporation Dynamic selection of motion estimation search ranges and extended motion vector ranges
US20070268964A1 (en) * 2006-05-22 2007-11-22 Microsoft Corporation Unit co-location-based motion estimation
GB2479933B (en) 2010-04-30 2016-05-25 Snell Ltd Motion estimation
JP5961589B2 (ja) * 2013-07-10 2016-08-02 日本電信電話株式会社 映像生成装置、方法及びプログラム
KR102357965B1 (ko) 2015-01-12 2022-02-03 삼성전자주식회사 객체 인식 방법 및 장치

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2648254B2 (fr) 1988-09-23 1991-08-30 Thomson Csf Procede et dispositif d'estimation de mouvement dans une sequence d'images animees
US5276513A (en) 1992-06-10 1994-01-04 Rca Thomson Licensing Corporation Implementation architecture for performing hierarchical motion analysis of video images in real time
FR2699780B1 (fr) 1992-12-22 1995-03-17 Philips Electronique Lab Dispositif de traitement récursif de signal vidéo comprenant une pluralité de branches.
KR100292138B1 (ko) * 1993-07-12 2002-06-20 이데이 노부유끼 디지탈비디오신호용송신기및수신기
JP3321936B2 (ja) * 1993-11-05 2002-09-09 株式会社豊田中央研究所 移動物体検出装置
KR0128875B1 (ko) * 1994-02-24 1998-04-10 배순훈 큰 움직임을 갖는 영상의 움직임 벡터 추정 방법
IL114475A0 (en) * 1995-07-06 1995-11-27 Grid Point Ltd Method for 2D and 3D image capturing representation processing and compression
JPH0955941A (ja) * 1995-08-16 1997-02-25 Sony Corp 画像符号化方法、画像符号化装置、及び画像符号化データの記録装置
JP3994445B2 (ja) * 1995-12-05 2007-10-17 ソニー株式会社 動きベクトル検出装置及び動きベクトル検出方法
US6078616A (en) * 1997-03-13 2000-06-20 Sony Corporation Methods and apparatus for error concealment utilizing temporal domain motion vector estimation

Also Published As

Publication number Publication date
US6285712B1 (en) 2001-09-04
DE69930333T2 (de) 2006-10-05
KR100590145B1 (ko) 2006-06-15
EP0929192B1 (en) 2006-03-15
DE69930333D1 (de) 2006-05-11
JP4016227B2 (ja) 2007-12-05
CA2257669C (en) 2009-09-22
KR19990067759A (ko) 1999-08-25
AU748671B2 (en) 2002-06-06
AU9824198A (en) 1999-07-29
CA2257669A1 (en) 1999-07-07
EP0929192A2 (en) 1999-07-14
CN1230079A (zh) 1999-09-29
JPH11203483A (ja) 1999-07-30
EP0929192A3 (en) 1999-08-04

Similar Documents

Publication Publication Date Title
CN114731408B (zh) 使用结构化神经网络进行视频帧插值的系统、设备和方法
CN1154361C (zh) 图像处理设备、图像处理方法及为其提供的媒体
CN1578469A (zh) 考虑到块之间相关性的估计运动的装置及其方法
Liu et al. Towards multi-domain single image dehazing via test-time training
CN1681291A (zh) 运动补偿帧速率转换
CN1547725A (zh) 图像匹配
KR20010043717A (ko) 이미지 인식 및 상관 시스템
KR20030008150A (ko) 단일 텔레비전 신호 필드들에서 병렬로 발생하는 필름 및비디오 오브젝트들의 인식
KR20000069107A (ko) 모션 추정 및 모션 보상된 보간법
CN1440203A (zh) 自适应运动估计装置和方法
US10977549B2 (en) Object animation using generative neural networks
CN113570516B (zh) 基于CNN-Transformer混合自编码器的图像盲运动去模糊方法
CN1110187C (zh) 选择运动矢量的方法及实现该方法的图象处理装置
CN1672174A (zh) 用于分割的系统和方法
JP2001043368A5 (zh)
JP6275719B2 (ja) ビデオシーケンスの画像の色をサンプル化する方法および色クラスタリングへの適用
JP4548942B2 (ja) 分類適応型空間−時間フォーマット変換方法及び装置
JP2005339535A (ja) 相違度の計算
CN1529874A (zh) 特征点选择
CN115187768A (zh) 一种基于改进YOLOv5的鱼眼图像目标检测方法
JP2001036907A (ja) デジタル映像分割方法及びその装置
CN114219877A (zh) 人像头发流动特效处理方法、装置、介质和电子设备
CN113658231A (zh) 光流预测方法、装置、电子设备及存储介质
CN1228987C (zh) 分段匹配中的优先顺序划分
GB2373660A (en) Image segmentation

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20040616

Termination date: 20140107