CN102474568A - 基于共同处理元件执行视频稳定化和检测视频镜头边界的技术 - Google Patents

基于共同处理元件执行视频稳定化和检测视频镜头边界的技术 Download PDF

Info

Publication number
CN102474568A
CN102474568A CN2009801609495A CN200980160949A CN102474568A CN 102474568 A CN102474568 A CN 102474568A CN 2009801609495 A CN2009801609495 A CN 2009801609495A CN 200980160949 A CN200980160949 A CN 200980160949A CN 102474568 A CN102474568 A CN 102474568A
Authority
CN
China
Prior art keywords
present frame
frame
piece
logic
confirm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2009801609495A
Other languages
English (en)
Other versions
CN102474568B (zh
Inventor
L·徐
Y·邱
Q·黄
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Intel Corp
Original Assignee
Intel Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Intel Corp filed Critical Intel Corp
Publication of CN102474568A publication Critical patent/CN102474568A/zh
Application granted granted Critical
Publication of CN102474568B publication Critical patent/CN102474568B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/14Picture signal circuitry for video frequency region
    • H04N5/144Movement detection
    • H04N5/145Movement estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/68Control of cameras or camera modules for stable pick-up of the scene, e.g. compensating for camera body vibrations
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/68Control of cameras or camera modules for stable pick-up of the scene, e.g. compensating for camera body vibrations
    • H04N23/682Vibration or motion blur correction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/14Picture signal circuitry for video frequency region
    • H04N5/147Scene change detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Studio Devices (AREA)

Abstract

本文公开了用于执行视频稳定化和检测视频镜头边界的设备、系统和方法。所述方法包括:接收视频的当前帧;减小该当前帧;将该减小的当前帧存储到缓冲器的一部分中;确定减小的参考帧中的块与该减小的当前帧中的目标块之间的绝对差和;确定该减小的当前帧的帧间主要运动参数;以及部分地基于绝对差和以及运动参数的至少一个来执行视频稳定化和镜头边界检测的至少一个。

Description

基于共同处理元件执行视频稳定化和检测视频镜头边界的技术
技术领域
本文中公开的主题一般涉及使用共同处理元件来执行视频稳定化和检测视频镜头(shot)边界的技术。
背景技术
视频稳定化旨在改进数字摄影机(video camera)所捕捉的视频序列的视觉质量。当摄像机(camera)是手持式的或安装在不稳定的平台上时,捕捉的视频能够由于不想要的摄像机运动而显得摇晃,这导致降级的观众体验。视频稳定化技术能够用于消除或减少捕捉的视频帧中不想要的运动。
视频通常由场景组成,并且每个场景包括一个或多个镜头。镜头被定义为在单个连续动作中由单个摄像机捕捉的帧序列。从一个镜头到另一镜头的变化也称为镜头转变,包括两种关键类型:突变(abrupttransition,CUT)和渐变(gradual transition,GT)。视频镜头边界检测旨在检测镜头边界帧。视频镜头边界检测能够在各种应用中被应用,例如视频编码、视频索引、视频检索及视频编辑中的内部帧识别。
附图说明
在图中,本发明的实施例以示例方式而不是以限制方式示出,并且图中,相似的引用标号表示类似的要素。
图1示出根据一实施例的视频稳定化系统的框图格式。
图2示出根据一实施例的帧间主要运动估计模块的框图。
图3提供根据一实施例的为改进视频稳定化而执行的过程的流程图。
图4示出根据一实施例的镜头边界检测系统的框图。
图5提供根据一实施例的镜头边界判定方案的过程。
图6示出根据一实施例的执行视频稳定化和镜头边界检测的系统的框图。
图7示出使用搜索窗口来识别参考帧中匹配块的示例,其中匹配块对应于当前帧中的目标块。
具体实施方式
遍及此说明书对“一个实施例”或“一实施例”的引用指连同该实施例描述的特定特征、结构或特性包括在本发明的至少一个实施例中。因此,遍及此说明书各个位置中出现的“在一个实施例中”或“一实施例”短语不一定全部指相同实施例。此外,特定的特征、结构或特性可在一个或多个实施例中被组合。
图形处理系统可需要支持多个视频处理特征及各种视频编码或解码标准。各种实施例允许图形处理系统支持视频稳定化和视频镜头边界检测特征。具体而言,各种实施例允许图形处理系统为视频稳定化和镜头边界检测使用某些处理能力。在一些实施例中,图形处理系统的下采样和块运动搜索特征用于视频稳定化和视频镜头边界检测。特征的再使用可降低制造图形处理系统的成本,并且也降低图形处理系统的大小。
各种实施例能够根据多种标准来编码或解码视频或静态图像,所述标准例如但不限于:MPEG-4第10部分高级视频编解码器(AVC)/H.264。H.264标准已由联合视频小组(Joint Video Team,JVT)来制定,它包括也称为VCEG(视频编码专家组)的ITU-T SG16 Q.6和称为MPEG(运动图片专家组)的ISO-IEC JTC1/SC29/WG11(2003)。另外,实施例可在多种静态图像或视频压缩系统中被使用,包括但不限于面向对象的视频编码、基于模型的视频编码、可伸缩视频编码及MPEG-2(从瑞士日内瓦的国际标准化组织可得到的ISO/IEC 13818-1(2000))、VCI(从SMPTE White Plains,NY 10601可得到的SMPTE421M(2006))及MPEG-4、MPEG-2和VCl的变型。
图1以框图格式示出根据一实施例的视频稳定化系统100。视频稳定化系统100包括帧间主要运动估计(DME)块102、轨迹(trajectory)计算块104、轨迹平滑块106及抖动补偿块108。帧间DME块102要确定视频序列中两个连续帧之间的摄像机震动。帧间DME块102要识别本地运动向量,并随后基于那些本地运动向量来确定主要运动参数。轨迹计算块104要通过那些确定的主要运动参数来运算运动轨迹。轨迹平滑块106要平滑运算出的运动轨迹以提供更平滑的轨迹。抖动补偿模块108要降低更平滑的轨迹中的抖动。
图2示出根据一实施例的帧间主要运动估计模块200的框图。模块200包括帧下采样块202、参考缓冲器204、块运动搜索块206、迭代最小二乘解答器块208及运动增大(up-scaling)块210。
下采样块202要将输入帧减小(down scale)到更小大小。例如,可使用大约4-5的下采样因子,但能够使用其它值。在一些实施例中,下采样块202提供大约为160x120个像素的更小大小的帧。所得到的减小的帧具有更少数量的块。由于共同处理元件的设计,块可以是8x8、16x16或其它大小。通常,使用16x16块。减小过程还减小块运动向量。在各种实施例中,运动向量表示帧之间的像素、块或图像的垂直和水平位移。减小帧还减小两个帧之间的x和y运动。例如,如果下采样因子是4,并且运动向量是(20,20),则下采样的运动向量将在减小的帧中大约是(5,5)。结果,更小图片上的窗口/区域受限块运动搜索能够包括原始帧上更大的运动。相应地,能够降低用于识别过程块的处理速度和处理资源。
下采样块202要将下采样的帧存储到参考缓冲器204中。参考缓冲器204可以是可用于至少在执行视频稳定化和镜头边界检测中使用的存储器中的区域。该区域可以是缓冲器或缓冲器的一部分。例如,如果该区域是缓冲器的一部分,则相同缓冲器的其它部分能够由其它应用或过程同时或在其它时间来使用。在各种实施例中,为了视频稳定化和镜头边界检测使用了单个参考帧。因此,参考缓冲器的大小能够设为存储一个帧。在参考缓冲器每次更新时,参考帧能够被替代为另一参考帧。
块运动搜索块206要从下采样块202接收下采样的当前帧,并且还要从参考缓冲器204接收下采样的以前参考帧。块运动搜索块206要识别预定义的搜索窗口内选择的块的本地运动向量。例如,识别的运动向量能够是与搜索窗口中相对于当前帧中目标块带有最小绝对差和(SAD)的块相关联的运动向量。搜索窗口中的块可以是宏块或小的块,例如8x8个像素,但其它大小能够被使用。在一些实施例中,块大小是16x16个像素,并且搜索窗口能够设为48x32个像素。在各种实施例中,块运动搜索块206不搜索与帧边界上的块相关联的运动向量。
在一些实施例中,块运动搜索块206要确定对于每个帧的宏块的绝对差和(SAD)。例如,为帧中的每个宏块确定SAD可包括比较参考帧的每个16x16像素宏块和当前帧中的16x16像素宏块。例如,在一些实施例中,能够比较参考帧的48x32像素搜索窗口内的所有宏块和当前帧中的目标16x16像素宏块。能够逐一或以棋盘图案来挑选目标宏块。对于完全搜索,可比较48x32搜索窗口中的所有宏块和目标宏块。因此,能够比较32x16(512)个宏块。当在48x32搜索窗口内移动16x16宏块时,能够有32x16个位置来移动。因此,在此示例中,确定512个SAD。
图7示出使用搜索窗口来识别参考帧中匹配块的示例,其中匹配块对应于当前帧中的目标块。示范块运动搜索可包括以下步骤。
(1)选择当前帧中的多个目标块。假设目标块的坐标是(x_i,y_i),其中,i是块索引。能够逐一来选择当前帧中的目标块。但是,能够使用其它选择技术,例如以棋盘方式选择它们。
(2)对于当前帧中的目标块i,块运动搜索在搜索窗口中用于识别匹配块和获得本地运动向量(mvx_i,mvy_i)。在参考帧中对于目标块i查找搜索窗口中的匹配块能够包括比较参考帧搜索窗口中的所有候选块和目标块,并且带有最小SAD的一个块被认为是匹配块。
(3)在对于块i的块运动搜索后,运算:x′_i=x_i+mvx_i和y′_i=y_i+mvy_i。随后,(x_i,y_i)和(x′_i,y′_i)被视为一对。
(4)在为当前帧中所有选择的目标块执行块运动搜索后,获得多个对(x_i,y_i)和(x′_i,y′_i)。
如图7中所示,对于当前帧中的一个目标块(x,y),48x32搜索窗口在参考帧中被指定,并且搜索窗口的位置能够由(x,y)来定中心。在通过块运动搜索在搜索窗口中查找匹配块后,获得对于目标块的本地运动向量(mvx,mvy)。匹配块的坐标(x′,y′)是x′=x+mvx,y′=y+mvy。随后,(x,y)和(x′,y′)被视为一对。
再次参照图2,迭代最小二乘解答器208要基于至少两个识别的本地运动向量来确定主要运动参数。在一些实施例中,迭代最小二乘解答器208要应用图2中所示的相似性运动模型来近似主要帧间运动参数。相似性运动模型还能够以下面的等式(1)的格式来编写。
x ′ y ′ = a b - b a x y + c d - - - ( 1 )
其中:
(x′,y′)表示参考帧中的匹配块坐标,
(x,y)表示当前帧中的块坐标,以及
(a,b,c,d)表示主要运动参数,其中,参数a和b涉及旋转,以及参数c和d涉及转换。
例如,只要一直被使用,块坐标(x′,y′)和(x,y)能够被定义为左上角、右下角或块的块中心。对于其坐标是(x,y)并且识别的本地运动向量(来自块206)是(mvx,mvy)的块,通过x′=x+mvx和y′=y+mvy而获得其匹配块的坐标(x′,y′)。在各种实施例中,帧的所有(x,y)和(x′,y′)对在等式(1)中被使用。迭代最小二乘解答器块208要通过使用最小二乘(LS)技术解等式(1)来确定运动参数(a,b,c,d)。
如果由迭代最小二乘解答器208考虑,则异常(outlier)本地运动向量可不利地影响主要运动的估计。如果从包括前景对象或重复的类似图案的区域来选择当前帧中的一些块,则可由块运动搜索块206来识别异常本地运动向量。在各种实施例中,迭代最小二乘解答器208通过识别和从考虑中去除异常位置运动向量,使用迭代最小二乘(ILS)解答器来降低异常本地运动向量的影响。在此类实施例中,在使用上面的等式(1)确定主要运动参数后,迭代最小二乘解答器208要确定当前帧中每个剩余块位置(xi,yi)的二乘估计误差(SEE)。只要一直被使用,块位置(xi,yi)能够是左上角、右下角或块中心。
SEEi=(axi+byi+c-xi)2+(-bxi+ayi+d-yi)2    (2)
本地运动向量在其对应二乘估计误差(SEE)满足等式(3)时被认为是异常。
SEE i > T 2 n Σ j = 1 n SEE j , - - - ( 3 )
其中,
T是常数,其能够根据经验设为1.4,但能够使用其它值,以及
n是当前帧中剩余块的数量。
上面的等式(1)-(3)重复进行,直至未检测到异常本地运动向量,或者剩余块的数量小于预定义的阈值数量。例如,阈值数量能够是12,但能够使用其它数量。在等式(1)-(3)的每次迭代中,不考虑检测到的异常运动向量和与异常运动向量相关联的块。相反,考虑与剩余块相关联的运动向量。在从考虑中去除异常本地运动向量后,迭代最小二乘块208执行等式(1)以确定运动参数。
运动增大块210要根据减小块202所应用的下采样因子的逆来增大转换运动参数c和d。由于下采样过程不影响两个帧之间的旋转和缩放运动,因此,参数a和b可不被增大。
再参照图1,轨迹计算块104要确定轨迹。例如,轨迹计算块104要使用如在等式(4)中定义的累积运动来确定帧j的运动轨迹Tj
T j = T j - 1 M j M j = a j b j c j - b j a j d j 0 0 1 , T 0 = 1 0 0 0 1 0 0 0 1 - - - ( 4 )
其中,
Mj是帧j与j-1之间的全局运动矩阵,并且基于主要运动参数(a,b,c,d)。主要运动参数(a,b,c,d)在等式(4)中用于当前帧(称为帧j)。
帧间全局运动向量包括摄像机预期运动和摄像机抖动运动。轨迹平滑块106要从帧间全局运动向量来降低摄像机抖动运动。在各种实施例中,轨迹平滑块106要通过使用运动轨迹平滑来降低摄像机抖动运动。运动轨迹的低频分量被识别为摄像机预期移动。在轨迹计算块104确定每个帧的运动轨迹后,轨迹平滑块106要使用例如但不限于高斯滤波器的低通滤波器来增加运动轨迹的平滑度。高斯滤波器窗口能够设置到2n+1帧。滤波过程带来了n帧延迟。实验结果显示,n能够设为5,但能够使用其它值。更平滑的运动轨迹T′j能够使用等式(5)来确定。
T j ′ = Σ k = - n k = n g ( k ) · T j + k - - - ( 5 )
其中,g(k)是高斯滤波器核。高斯滤波器是低通滤波器,
Figure BPA00001514055900073
在指定其变化值δ后,能够运算滤波器系数。在一些实施例中,变化值设为1.5,但它能够设为其它值。更大的变化值可产生更平滑的运动轨迹。
抖动补偿块108要补偿未平滑的原始轨迹中的抖动。摄像机抖动运动是轨迹的高频分量。轨迹的高频分量是原始轨迹与平滑的轨迹之间的差别。抖动补偿块108要补偿高频分量并提供更稳定化的当前帧。例如,通过借助于抖动运动参数来扭曲(warp)当前帧F(j),可获得当前帧的更稳定化的帧表示,帧F′(j)。
在执行第j个当前帧F(j)的轨迹平滑后,T(j)与T′(j)之间的运动差别(在等式4和5中示出)被认为是抖动运动。抖动运动能够由抖动运动参数(a′,b′,c′,d′)来表示。下述内容描述从T(j)与T′(j)之间的差别来确定(a′,b′,c′,d′)的方式。假设T(j)的抖动运动参数是(a1,b1,c1,d1),并且T′(j)的平滑的抖动运动参数是(a2,b2,c2,d2)。设置θ1=arctan(b1/a1),以及θ2=arctan(b2/a2),抖动运动参数被确定如下:
a’=cos(θ1-θ2),b’=sin(θ1-θ2),c’=c1-c2,d’=d1-d2。
示范扭曲过程如下所述。
(1)对于位于更稳定化帧F′(j)中(x,y)的任何像素,像素值表示为F′(x,y,j)。
(2)当前帧F(j)中的对应位置(x′,y′)被确定为x′=a′*x+b′*y+c′,y′=-b′*x+a′*y+d′。
(3)如果x′和y′是整数,则设置F′(x,y,j)=F(x′,y′,j)。否则,使用位置(x′,y′)周围的F(j)中的像素,通过双线性插值来运算F′(x,y,j)。
(4)如果(x′,y′)在当前帧F(j)外,则设置F′(x,y,j)到黑像素。
图3提供根据一实施例的改进视频稳定化的过程的流程图。块302包括执行帧大小减小。例如,有关下采样块202所述的技术可用于执行帧大小减小。
块34包括执行块运动搜索以识别两个或更多本地运动向量。例如,有关块运动搜索块206所述的技术可用于识别一个或多个本地运动向量。
块306包括确定主要运动参数。例如,有关迭代最小二乘块208所述的技术可用于确定主要运动参数。
块308包括增大主要运动参数。例如,有关增大块210所述的技术可用于增大主要运动参数。
块310包括确定轨迹。例如,有关轨迹计算块104所述的技术可用于确定轨迹。
块312包括改进轨迹平滑度。例如,有关轨迹平滑块106所述的技术可用于执行轨迹平滑。
块314包括通过扭曲当前帧以提供当前帧的更稳定版本而执行抖动补偿。例如,有关抖动补偿块108所述的技术可用于降低抖动。
图4示出根据一实施例的镜头边界检测系统的框图。在各种实施例中,来自视频稳定化系统100使用的帧间主要运动估计块102的一些结果也由镜头边界检测系统400使用。例如,能够在视频稳定化和镜头边界检测之一或两者中使用从下采样块202、参考缓冲器204和块运动搜索块206的任意之一可得到的相同信息。在一些实施例中,镜头边界检测系统400检测突然场景转变(即,CUT场景)。镜头边界判定块402要确定帧是否是场景改变帧。例如,镜头边界判定块402可使用有关图5所述的过程来确定当前帧是否是场景改变帧。
图5提供根据一实施例的镜头边界判定方案的过程。块502和504大致类似于相应块302和304。
块506包括确定对于当前帧的平均绝对差和(SAD)。注意,当前帧是减小的帧。例如,块506可包括从块运动搜索块206接收对于当前帧中每个宏块的SAD,并且确定当前帧中所有宏块的SAD的平均值。
块508包括确定平均SAD是否小于阈值T0。T0能够根据经验对16x16块设为大约1600,但能够使用其它值。如果平均SAD小于阈值,则帧不是镜头边界帧。如果平均SAD不小于阈值,则块510跟随块508。
块510包括确定SAD大于阈值T1的块的数量。阈值T1能够根据经验设为平均SAD的4倍,但能够使用其它值。
块512包括确定SAD大于阈值T1的块的数量是否小于另一阈值T2。阈值T2能够根据经验设为帧中目标块的总数的三分之二,但能够使用T2的其它值。如果SAD大于阈值T1的块的数量小于阈值T2,则当前帧不被认为是镜头边界帧。如果块的数量等于或大于阈值T2,则当前帧被认为是镜头边界帧。
图6示出根据一实施例的要执行视频稳定化和镜头边界检测的系统的框图。在各种实施例中,帧下采样和块运动搜索操作在硬件中实现。帧下采样和块运动搜索操作由视频稳定化和镜头边界检测两个应用来共享。在各种实施例中,对于视频稳定化(VS),轨迹计算、轨迹平滑、抖动运动确定及抖动补偿操作在处理器运行的软件中执行。在各种实施例中,镜头边界检测(SBD)在处理器运行的软件中执行,其中镜头边界检测使用来自硬件实现的帧下采样和块运动搜索操作的结果。其它视频或图像处理技术能够利用下采样或块运动搜索所提供的结果。
处理的图像和视频能够存储到任何类型的存储器中,例如基于晶体管的存储器或磁存储器。
帧缓冲器可以是存储器中的区域。存储器能够实现为易失性存储器装置,例如但不限于随机存取存储器(RAM)、动态随机存取存储器(DRAM)、静态RAM(SRAM)或其它类型的基于半导体的存储器或磁存储器,例如磁存储装置。
在设计带有例如视频编码、解交织、超分辨率、帧率转换等等多视频处理特征的媒体处理器时,硬件再使用能够是节约成本和降低形状因素(form factor)的十分有效的方式。各种实施例大大降低了在相同媒体处理器上实现视频稳定化和视频镜头边界检测特征的复杂性,特别是在媒体处理器已支持块运动估计功能时。
本文中所述的图形和/或视频处理技术可在各种硬件架构中实现。例如,图形和/或视频功能性可集成在芯片组内。备选的是,可使用离散图形和/或视频处理器。作为仍有的另一实施例,图形和/或视频功能可由包括多核处理器的通用处理器来实现。在又一实施例中,功能可在例如带有能够显示静态图像或视频的显示装置的便携式计算机和移动电话的消费者电子装置中实现。消费者电子装置还可包括能够使用例如以太网(例如,IEEE 802.3)或无线标准(例如,IEEE 802.11或16)的任何标准而连接到例如因特网的任何网络的网络接口。
本发明的实施例可实现为以下任意之一或其组合:使用母板互连的一个或多个微芯片或集成电路、硬件逻辑、由存储器装置存储并且由微处理器运行的软件、固件、专用集成电路(ASIC)和/或现场可编程门阵列(FPGA)。术语“逻辑”可包括(作为示例)软件或硬件和/或软件和硬件的组合。
本发明的实施例例如可提供为计算机程序产品,所述计算机程序产品可包括其上存储有一个或多个机器可运行指令的一个或多个机器可读媒体,所述指令在由例如计算机、计算机的网络或其它电子装置的一个或多个机器运行时,可促使所述一个或多个机器实行根据本发明的实施例的操作。机器可读媒体可包括但不限于软盘、光盘、CD-ROM(紧致盘只读存储器)、磁光盘、ROM(只读存储器)、RAM(随机存取存储器)、EPROM(可擦除可编程只读存储器)、EEPROM(电可擦除可编程只读存储器)、磁卡或光学卡、闪速存储器和/或适用于存储机器可运行指令的其它类型的媒体/机器可读媒体。
图和上面的描述给出了本发明的示例。虽然示为多个全异的功能项目,但本领域技术人员将领会到,一个或多个此类要素可很好地组合成单个功能要素。备选的是,某些要素可分割成多个功能要素。来自一个实施例的要素可添加到另一实施例。例如,本文中所述过程的顺序可被改变并且不限于本文中所述的方式。另外,任何流程图的动作无需以所示顺序来实现;所有动作也不一定要被执行。此外,不依赖其它动作的那些动作可与所述其它动作并行来执行。然而本发明的范围决不受限于这些特定示例。许多变化是可能,而无论是否在说明书中明确给出,例如结构、维度和材料使用中的差别。本发明的范围至少与随附权利要求所给出的一样广。

Claims (20)

1.一种设备,包括:
帧间主要运动估计逻辑,确定当前帧的运动参数和确定所述当前帧中块的绝对差和;
镜头边界判定逻辑,部分地基于所述绝对差和来确定所述当前帧是否是场景改变帧;以及
视频稳定化块,部分地基于所述运动参数来提供当前帧序列的更稳定化版本。
2.如权利要求1所述的设备,其中所述帧间主要运动估计逻辑在硬件中实现。
3.如权利要求1所述的设备,其中所述帧间主要运动估计逻辑要:
减小所述当前帧;
将所减小的当前帧存储到缓冲器的一部分中;
确定当前帧和参考帧中的块之间的绝对差和;
确定所减小的帧的帧间主要运动参数;以及
增大所述帧间主要运动参数。
4.如权利要求3所述的设备,其中确定所减小的帧的帧间主要运动参数的逻辑要:
在搜索窗口中识别在参考帧中相对于目标块带有最小绝对差和的匹配块;
确定所述匹配块的本地运动向量;
部分地基于所述本地运动向量来确定所述匹配块的坐标;以及
应用相似性运动模型以部分地基于所述匹配块的坐标和所述目标块的坐标来确定所述主要运动参数。
5.如权利要求4所述的设备,其中确定所减小的帧的帧间主要运动参数的逻辑还要:
忽视任何异常本地运动向量。
6.如权利要求1所述的设备,其中所述视频稳定化块包括:
轨迹计算块,部分地基于所述运动参数来确定所述当前帧的轨迹;
轨迹平滑块,增加所述当前帧的轨迹的平滑度;以及
抖动补偿块,降低所述当前帧的轨迹中的抖动。
7.如权利要求6所述的设备,其中所述视频稳定化块还要:
部分地基于所述运动轨迹与所述更平滑的轨迹之间的差别来确定抖动运动参数;以及
用所述抖动运动参数来扭曲所述当前帧。
8.如权利要求1所述的设备,其中所述镜头边界判定逻辑要:
确定所述当前帧中所有块的绝对差和的平均值;以及
部分地基于其绝对差和大于阈值的块的数量来确定所述当前帧是否是镜头边界帧。
9.一种系统,包括:
确定当前帧的运动参数和确定所述当前帧中块的绝对差和的硬件实现的帧间主要运动估计器;
部分地基于所述绝对差和来确定所述当前帧是否是场景改变帧的逻辑;
部分地基于所述运动参数来提供所述当前帧的更稳定化版本的逻辑;以及
接收和显示视频的显示器。
10.如权利要求9所述的系统,其中确定的逻辑和提供的逻辑存储在计算机可读媒体上并且由处理器来运行。
11.如权利要求9所述的系统,其中所述帧间主要运动估计器要:
减小所述当前帧;
将所减小的当前帧存储到缓冲器的一部分中;
确定当前帧和参考帧中的块之间的绝对差和;
确定所减小的帧的帧间主要运动参数;以及
增大所述帧间主要运动参数。
12.如权利要求9所述的系统,其中提供所述当前帧的更稳定化版本的逻辑包括:
部分地基于所述运动参数来确定所述当前帧的轨迹的逻辑;
增加所述当前帧的轨迹的平滑度的逻辑;
降低所述当前帧的轨迹中的抖动的逻辑;
部分地基于所述轨迹与所述更平滑的轨迹之间的差别来确定抖动运动参数的逻辑;以及
用所述抖动运动参数来扭曲所述当前帧的逻辑。
13.如权利要求9所述的系统,其中部分地基于所述绝对差和来确定所述当前帧是否是场景改变帧的逻辑包括:
确定所述当前帧中块的绝对差和的平均值的逻辑;以及
部分地基于其绝对差和大于阈值的块的数量来确定所述当前帧是否是镜头边界帧的逻辑。
14.一种计算机实现的方法,包括:
接收视频的当前帧;
减小所述当前帧;
将所减小的当前帧存储到缓冲器的一部分中;
确定减小的参考帧中的块与所减小的当前帧中的目标块之间的绝对差和;
确定所减小的当前帧的帧间主要运动参数;以及
部分地基于所述绝对差和以及所述运动参数的至少一个来执行视频稳定化和镜头边界检测的至少一个。
15.如权利要求14所述的方法,还包括:
增大所述帧间主要运动参数。
16.如权利要求14所述的方法,其中确定所减小的当前帧的帧是主要运动参数包括:
在搜索窗口中识别在参考帧中相对于所述目标块带有最小绝对差和的匹配块;
确定所述匹配块的本地运动向量;
忽视任何异常本地运动向量;
部分地基于所述本地运动向量来确定所述匹配块的坐标;以及
应用相似性运动模型以部分地基于所述匹配块的坐标和所述目标块的坐标来确定所述主要运动参数。
17.如权利要求14所述的方法,其中所述执行视频稳定化包括:
部分地基于所述运动参数来确定所述当前帧的轨迹;
增加所述当前帧的轨迹的平滑度;
降低所述当前帧的轨迹中的抖动;
部分地基于所述轨迹与所述更平滑的运动轨迹之间的差别来确定抖动运动参数;以及
用所述抖动运动参数来扭曲所述当前帧。
18.如权利要求14所述的方法,其中所述执行镜头边界检测包括:
确定所述当前帧中块的绝对差和的平均值;以及
部分地基于其绝对差和大于阈值的块的数量来确定所述当前帧是否是镜头边界帧。
19.如权利要求14所述的方法,其中所述减小,存储,确定绝对差和、以及确定帧间主要运动参数在硬件中实现。
20.如权利要求14所述的方法,其中所述执行视频稳定化和镜头边界检测的至少一个被实现为处理器运行的软件指令。
CN200980160949.5A 2009-08-12 2009-08-12 基于共同处理元件执行视频稳定化和检测视频镜头边界的技术 Expired - Fee Related CN102474568B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2009/000920 WO2011017823A1 (en) 2009-08-12 2009-08-12 Techniques to perform video stabilization and detect video shot boundaries based on common processing elements

Publications (2)

Publication Number Publication Date
CN102474568A true CN102474568A (zh) 2012-05-23
CN102474568B CN102474568B (zh) 2015-07-29

Family

ID=43585832

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200980160949.5A Expired - Fee Related CN102474568B (zh) 2009-08-12 2009-08-12 基于共同处理元件执行视频稳定化和检测视频镜头边界的技术

Country Status (5)

Country Link
EP (1) EP2465254A4 (zh)
JP (1) JP5435518B2 (zh)
KR (1) KR101445009B1 (zh)
CN (1) CN102474568B (zh)
WO (1) WO2011017823A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103442161A (zh) * 2013-08-20 2013-12-11 合肥工业大学 基于3d空时图像估计技术的视频稳像方法
CN104754180A (zh) * 2013-12-26 2015-07-01 智原科技股份有限公司 降低视频画面抖动的方法与装置
CN107079111A (zh) * 2014-09-19 2017-08-18 英特尔公司 用于视频稳定化的轨迹规划
CN114095659A (zh) * 2021-11-29 2022-02-25 厦门美图之家科技有限公司 一种视频防抖方法、装置、设备及存储介质

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2798832A4 (en) * 2011-12-30 2016-02-24 Intel Corp OBJECT DETECTION BY MEANS OF MOTION ESTIMATION
US8810666B2 (en) 2012-01-16 2014-08-19 Google Inc. Methods and systems for processing a video for stabilization using dynamic crop
US9516309B2 (en) 2012-07-09 2016-12-06 Qualcomm Incorporated Adaptive difference domain spatial and temporal reference reconstruction and smoothing
US9819965B2 (en) * 2012-11-13 2017-11-14 Intel Corporation Content adaptive transform coding for next generation video
CN103310451B (zh) * 2013-06-17 2016-12-28 中国传媒大学 基于渐进二分和自适应阈值的视频镜头边界检测方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070076982A1 (en) * 2005-09-30 2007-04-05 Petrescu Doina I System and method for video stabilization
WO2007114796A1 (en) * 2006-04-05 2007-10-11 Agency For Science, Technology And Research Apparatus and method for analysing a video broadcast
CN101087413A (zh) * 2006-06-07 2007-12-12 中兴通讯股份有限公司 视频序列中运动物体的分割方法
CN101383899A (zh) * 2008-09-28 2009-03-11 北京航空航天大学 一种空基平台悬停视频稳像方法
WO2009031751A1 (en) * 2007-09-05 2009-03-12 Electronics And Telecommunications Research Institute Video object extraction apparatus and method

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07115584A (ja) * 1993-10-19 1995-05-02 Canon Inc 画像揺れ補正装置
US5614945A (en) * 1993-10-19 1997-03-25 Canon Kabushiki Kaisha Image processing system modifying image shake correction based on superimposed images
JP3755155B2 (ja) * 1994-09-30 2006-03-15 ソニー株式会社 画像符号化装置
US7489341B2 (en) 2005-01-18 2009-02-10 Primax Electronics Ltd. Method to stabilize digital video motion
US8134603B2 (en) * 2005-08-12 2012-03-13 Nxp B.V. Method and system for digital image stabilization
JP2007243335A (ja) * 2006-03-06 2007-09-20 Fujifilm Corp 手振れ補正方法、手振れ補正装置および撮像装置
JP2007323458A (ja) * 2006-06-02 2007-12-13 Sony Corp 画像処理装置および画像処理方法
US8130845B2 (en) * 2006-11-02 2012-03-06 Seiko Epson Corporation Method and apparatus for estimating and compensating for jitter in digital video
US20080112630A1 (en) * 2006-11-09 2008-05-15 Oscar Nestares Digital video stabilization based on robust dominant motion estimation

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070076982A1 (en) * 2005-09-30 2007-04-05 Petrescu Doina I System and method for video stabilization
WO2007114796A1 (en) * 2006-04-05 2007-10-11 Agency For Science, Technology And Research Apparatus and method for analysing a video broadcast
CN101087413A (zh) * 2006-06-07 2007-12-12 中兴通讯股份有限公司 视频序列中运动物体的分割方法
WO2009031751A1 (en) * 2007-09-05 2009-03-12 Electronics And Telecommunications Research Institute Video object extraction apparatus and method
CN101383899A (zh) * 2008-09-28 2009-03-11 北京航空航天大学 一种空基平台悬停视频稳像方法

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103442161A (zh) * 2013-08-20 2013-12-11 合肥工业大学 基于3d空时图像估计技术的视频稳像方法
CN103442161B (zh) * 2013-08-20 2016-03-02 合肥工业大学 基于3d空时图像估计技术的视频稳像方法
CN104754180A (zh) * 2013-12-26 2015-07-01 智原科技股份有限公司 降低视频画面抖动的方法与装置
CN104754180B (zh) * 2013-12-26 2018-04-24 联咏科技股份有限公司 降低视频画面抖动的方法与装置
CN107079111A (zh) * 2014-09-19 2017-08-18 英特尔公司 用于视频稳定化的轨迹规划
CN107079111B (zh) * 2014-09-19 2020-04-21 英特尔公司 用于视频稳定化的轨迹规划
CN114095659A (zh) * 2021-11-29 2022-02-25 厦门美图之家科技有限公司 一种视频防抖方法、装置、设备及存储介质
CN114095659B (zh) * 2021-11-29 2024-01-23 厦门美图之家科技有限公司 一种视频防抖方法、装置、设备及存储介质

Also Published As

Publication number Publication date
KR101445009B1 (ko) 2014-09-26
CN102474568B (zh) 2015-07-29
EP2465254A4 (en) 2015-09-09
JP2013502101A (ja) 2013-01-17
KR20120032560A (ko) 2012-04-05
JP5435518B2 (ja) 2014-03-05
WO2011017823A1 (en) 2011-02-17
EP2465254A1 (en) 2012-06-20

Similar Documents

Publication Publication Date Title
CN102474568A (zh) 基于共同处理元件执行视频稳定化和检测视频镜头边界的技术
US20190335196A1 (en) Adaptive Affine Motion Compensation Unit Determing in Video Picture Coding Method, Video Picture Decoding Method, Coding Device, and Decoding Device
Dufaux et al. Efficient, robust, and fast global motion estimation for video coding
TWI572196B (zh) 用於次世代視訊編碼之投射式內插預測產生之技術
US20200099955A1 (en) Method and device for encoding and decoding a stack of images, and corresponding computer program product
US20010002922A1 (en) Motion vector search apparatus and method
Liu et al. Codingflow: Enable video coding for video stabilization
CN109391814A (zh) 视频图像编码和解码的方法、装置及设备
TW201528777A (zh) 用於次世代視訊編碼之內容適應性主要移動補償預測之技術
Ting et al. Center-biased frame selection algorithms for fast multi-frame motion estimation in H. 264
JP2011097572A (ja) 動画像符号化装置
JP2007053767A (ja) 画像または画像シーケンスについて、各画像を分割したブロックに割り当てられる動きベクトルからグローバル動きパラメータの集合を反復的に計算する方法および装置
US20170180745A1 (en) Prediction method and Electronic Apparatus of encoding mode of variable resolution
US20110187924A1 (en) Frame rate conversion device, corresponding point estimation device, corresponding point estimation method and corresponding point estimation program
Wee Reversing motion vector fields
WO2017078814A1 (en) Motion vector assisted video stabilization
Kim et al. An efficient motion-compensated frame interpolation method using temporal information for high-resolution videos
Cho et al. Temporal incoherence-free video retargeting using foreground aware extrapolation
JP6208936B2 (ja) 映像動き評価方法および映像動き評価装置
WO2013031071A1 (ja) 動画像復号装置、動画像復号方法、及び集積回路
US10567790B2 (en) Non-transitory computer-readable storage medium for storing image compression program, image compression device, and image compression method
De Praeter et al. Moving object detection in the HEVC compressed domain for ultra-high-resolution interactive video
Nam et al. Low complexity content-aware video retargeting for mobile devices
KR100558364B1 (ko) 키 프레임의 움직임 유형을 이용한 화상의 움직임 유형결정 방법 및 장치
Nguyen et al. Prediction-based directional search for fast block-matching motion estimation

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20150729

Termination date: 20180812