CN101411181A - 电子视频图像稳定 - Google Patents

电子视频图像稳定 Download PDF

Info

Publication number
CN101411181A
CN101411181A CNA2007800108423A CN200780010842A CN101411181A CN 101411181 A CN101411181 A CN 101411181A CN A2007800108423 A CNA2007800108423 A CN A2007800108423A CN 200780010842 A CN200780010842 A CN 200780010842A CN 101411181 A CN101411181 A CN 101411181A
Authority
CN
China
Prior art keywords
macro block
motion vector
video
frame
statistics
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2007800108423A
Other languages
English (en)
Other versions
CN101411181B (zh
Inventor
拉戈哈文德拉·C·纳加拉杰
纳伦德拉纳特·马拉亚特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of CN101411181A publication Critical patent/CN101411181A/zh
Application granted granted Critical
Publication of CN101411181B publication Critical patent/CN101411181B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/527Global motion vector estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/68Control of cameras or camera modules for stable pick-up of the scene, e.g. compensating for camera body vibrations
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/68Control of cameras or camera modules for stable pick-up of the scene, e.g. compensating for camera body vibrations
    • H04N23/681Motion detection
    • H04N23/6811Motion detection based on the image signal
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/68Control of cameras or camera modules for stable pick-up of the scene, e.g. compensating for camera body vibrations
    • H04N23/682Vibration or motion blur correction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/68Control of cameras or camera modules for stable pick-up of the scene, e.g. compensating for camera body vibrations
    • H04N23/682Vibration or motion blur correction
    • H04N23/683Vibration or motion blur correction performed by a processor, e.g. controlling the readout of an image memory

Abstract

本发明描述用于成像和视频装置的电子视频图像稳定技术。所述技术涉及确定帧的个别宏块的运动和空间统计,以及基于所述宏块中的每一者的所述统计而确定所述帧的全局运动向量。在一个实施例中,一种执行电子图像稳定的方法包括:对一图像的一帧内的多个宏块中的每一者执行空间估计以获得所述宏块中的每一者的空间统计;对所述多个宏块中的每一者执行运动估计以获得所述宏块中的每一者的运动统计;整合所述宏块中的每一者的所述空间统计和所述运动统计以确定所述帧的全局运动向量;以及根据所述全局运动向量使所述图像相对于参考窗偏移。

Description

电子视频图像稳定
本申请案主张2006年4月6日申请的第60/790,514号美国临时申请案的权益,所述申请案的全部内容以引用的方式并入本文中。
技术领域
本发明涉及视频处理,且更具体地说,涉及用于电子视频应用中的电子图像稳定的技术。
背景技术
随着成像装置变得较轻且较小,由此类装置俘获的图像由于无意的抖动而较容易受到质量降级的影响。在静止图像俘获中,抖动可能产生模糊图像。在视频俘获中,抖动可能导致视频图像中的抖动或跳动。抖动和跳动可能使人类视觉系统难以聚焦和集中于视频内的相关区域和目标上。当此抖动呈现出与视频中的真实运动结合时,可混合不利效应。在任何情况下,视频或图像的观看体验的质量降低。
图像稳定系统尝试补偿图像抖动以产生较好的图像质量。图像稳定系统通常可分为三种主要类别:光学图像稳定器(OIS)、机械图像稳定器(MIS)和电子图像稳定器(EIS)。OIS系统利用可调整的透镜,其在图像到达传感器之前使图像变形,其中所述透镜由外部运动传感器控制。MIS系统使整个相机稳定而非相机所俘获的图像。具体地说,MIS系统通常使用相机的重心、平衡系统以及相机操作者的身体来维持平滑运动。
EIS系统利用信号处理算法来更改所俘获的图像。一些EIS系统在许多情形中工作良好,但可能遭受不能够区分真实运动与非所要的抖动。变焦EIS涉及通过变焦来增加所俘获图像的大小,且接着在图像内变焦以选择补偿抖动所导致的移动的略小图像。超大EIS涉及俘获略大于所需分辨率的图像,且在超大图像内摇摄以补偿由抖动引起的移动。
发明内容
本发明描述有用于具有视频成像能力的装置的电子图像稳定技术。本发明中所描述的技术有效地区分装置的非所要抖动和在所俘获场景中发生的真实运动。在操作中,视频序列中的视频帧分为多个非重叠宏块。一旦计算出空间和运动统计,就确定每一宏块的运动向量。运动向量指示宏块相对于视频序列中的另一帧中的相应宏块的移动。空间统计指示所述帧内的宏块的平均数和方差。
宏块的空间和运动统计经整合以获得所述帧的全局运动向量。稳定涉及基于全局运动向量将一偏移应用到帧以补偿抖动。举例来说,全局运动向量可用以在超大图像内摇摄以选择补偿抖动的略小的图像。已经可用于编码帧的目的的空间和运动统计也可用以支持电子图像稳定。以此方式,空间和运动统计支持在区分抖动和真实运动方面同样有效的有效稳定技术。
在一个实施例中,本发明提供一种装置,其包含:空间估计模块,其产生视频帧内的宏块的空间统计;运动估计模块,其产生所述视频帧内的所述宏块的运动统计;运动整合模块,其整合所述空间统计和所述运动统计以确定所述帧的全局运动向量;以及稳定模块,其基于所述全局运动向量而将一偏移应用到由所述宏块界定的图像。
在另一实施例中,本发明提供一种执行电子图像稳定的方法,其包含:产生视频帧内的宏块的空间统计;产生所述视频帧内的所述宏块的运动统计;整合所述空间统计和所述运动统计以确定所述帧的全局运动向量;以及基于所述全局运动向量将一偏移应用到由所述宏块界定的图像。
在另一实施例中,本发明提供一种用于执行电子图像稳定的装置,其包含:用于产生视频帧内的宏块的空间统计的装置;用于产生所述视频帧内的所述宏块的运动统计的装置;用于整合所述空间统计和所述运动统计以确定所述帧的全局运动向量的装置;以及用于基于所述全局运动向量而将一偏移应用到由所述宏块界定的图像的装置。
可以硬件、软件、固件或其任何组合来实施本文所描述的这些和其它技术。如果以软件来实施,那么可在数字信号处理器(DSP)或其它类型的处理器中执行软件。执行所述技术的软件可最初存储在计算机可读媒体中,且加载及在DSP中执行以用于所俘获图像的有效图像稳定。
因此,本发明也涵盖一种计算机可读媒体,其包含通过在装置中执行而使所述装置执行以下操作的指令:对一图像的一帧内的多个宏块中的每一者执行空间估计,以获得宏块中的每一者的空间统计;以及对多个宏块中的每一者执行运动估计,以获得所述宏块中的每一者的运动统计。计算机可读媒体进一步包含通过在装置中执行而使所述装置进行以下操作的指令:整合所述宏块中的每一者的所述空间统计和所述运动统计以确定所述帧的全局运动向量;以及根据所述全局运动向量而相对于参考窗使图像偏移。
在附图和以下描述中陈述了本发明的一个或一个以上实施例的细节。根据描述和附图以及根据权利要求书将明白本发明的其它特征、目的和优势。
附图说明
图1是根据本发明经装备以执行可缩放电子图像稳定的示范性视频处理装置的框图。
图2是说明在图1的装置中有用的示范性前端处理单元的框图。
图3是说明图2中的处理单元的各种组件用以执行可缩放电子图像稳定的操作的框图。
图4是说明图1的装置在实施可缩放图像稳定技术过程中的示范性操作的流程图。
图5是说明基于全局运动向量将图像偏移应用到视频帧内的图像以支持图像稳定的图。
图6是说明使用包含宏块的子集的区域来建立用于图像稳定的全局运动向量的图。
图7是说明适于并入如本发明所述的视频处理装置的移动调制解调器的实例性视频核心的框图。
图8A-8D是说明根据本发明用于实施可缩放图像稳定技术的实例性实施方案的框图。
图9是说明其中可实施本发明的图像稳定技术的示范性无线通信装置的框图。
具体实施方式
图1是可根据本发明实施可缩放电子图像稳定技术的示范性装置2的框图。装置2可形成能够编码视频数据的数字视频处理装置的部分。数字视频处理装置可处理由视频俘获装置(例如摄像机或存储先前俘获的视频的视频档案)获得的视频。举例来说,装置2可形成数码摄像机、膝上型计算机、台式计算机、无线通信装置(例如蜂窝式或卫星无线电电话)、个人数字助理(PDA)或具有数字视频能力的任何装置的部分。视频俘获装置可能容易受到破坏视频质量的非所要抖动的影响。运动估计可用于图像稳定。然而,可能由于视频俘获装置的无意抖动或由摇摄、变焦、倾斜或其它操作产生的有意移动,以及在所俘获场景中发生的实际运动而发生运动。因此,应用运动估计以提供有效的视频稳定可具有挑战性。本文所揭示的图像稳定技术可在维持有意移动的存在的同时补偿无意移动。
视频处理设备4操作以通过确定视频帧序列中的每一视频帧的全局运动向量来提供电子视频图像稳定。视频处理设备4使用将进一步详细描述的全局运动向量来补偿由抖动引起的图像移动。全局运动向量表示当前视频帧内的图像相对于另一视频帧(例如,先前视频帧)内的图像的整体移动。
视频处理设备4通过将帧分为非重叠块且对每一块执行空间估计和运动估计以确定每一块的空间和运动统计而获得全局运动向量。在一些实施例中,视频处理设备4可使用经产生用于视频编码的空间和运动统计。视频处理设备4可基于空间和运动统计而产生视频帧中的每一块的运动向量。
视频处理设备4整合针对每一个别块所获得的所有信息以获得全局运动向量。以此方式,视频处理设备4补偿俘获视频帧以大体上移除由装置2的无意平移运动(例如由于抖动)引起的运动外观。
视频处理设备4可存储原始视频数据且对此数据执行各种视频处理技术。视频处理设备4可包含“芯片集”,其包括数字信号处理器(DSP)和芯片上存储器。在其它情况下,设备4可包含处理器、硬件、软件或固件的任何组合。而且,设备4可包含单个集成芯片。
在图1的实例中,视频处理设备4包括本地存储器8、存储器控制器10和视频处理单元6。视频处理单元6包括前端处理单元18,且也可包括编码单元19。前端处理单元18可执行前端操作,例如滤波、去马赛克、透镜消散校正、缩放、色彩校正、色彩转换、噪声减少滤波、空间滤波和除了本发明所述的视频图像稳定以外的其它操作。在一些实施例中,前端处理单元18可执行本发明的技术且可包括多个图像处理模块(如下文进一步详细论述)。在其它实施例中,前端处理单元18和编码单元19中的每一者可包括执行本发明的技术的视频处理模块中的一者或一者以上。在一些情况下,前端处理单元18可与编码单元19合作。举例来说,前端处理单元18可获得空间和运动统计且将其提供给编码单元19以用于编码,进而避免此些统计的计算的重复。作为替代,空间和运动统计或其部分可用于编码单元19内的视频编码和前端处理单元18内的图像稳定两者。
当设备4经装备以编码在视频流中获得的视频(例如)来用于压缩存储或在有线或无线通信媒体上传输到远程装置时可提供编码单元19。在此情况下,编码单元19可执行视频编码,其可应用一个或一个以上视频压缩技术,例如帧间压缩或帧内压缩。举例来说,编码单元19可实施运动估计和运动压缩技术以采用时间或帧间数据相关性来提供帧间压缩。或者,或另外,编码单元19可执行空间估计和帧内预测技术以采用空间或帧内数据相关性来提供帧内压缩。在一些实施例中,编码单元19可使用由前端处理单元18获得的空间和运动统计(例如)以减少计算的重复。或者,编码单元19可将其自身的运动估计、运动压缩和空间估计技术应用到由前端处理单元产生的视频。
一般来说,编码单元19可根据多种视频编码标准中的任一者来应用视频编码,例如MPEG-1、MPEG-2、MPEG-4、ITU H.261、ITU H.263、ITU H.264和/或其它标准。编码单元19也可用以压缩静止图像。编码单元19可形成组合编码器/解码器(CODEC)的部分。CODEC可实施在硬件、软件、固件、DSP、微处理器、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散硬件组件或其各种组合内。可提供各种数字滤波器和硬件组件以支持编码和解码应用两者。
本地存储器8通常存储原始视频数据,且也可在由视频处理单元6执行的任何处理之后存储经处理的视频数据。举例来说,存储器8也可存储由编码单元19产生的经编码视频数据。存储器控制器10控制本地存储器8内的存储器组织。存储器控制器10也控制从本地存储器8到视频处理单元6的存储器负载,且从视频处理单元6写回到本地存储器8。
装置2可包括视频俘获设备12以俘获视频。举例来说,视频俘获设备12可为集成在另一装置(例如移动电话)内的摄像机,从而形成所谓的相机电话或视频电话。或者,视频俘获设备12可为相机,其经耦合以直接通过有线或无线媒体(例如,通用串行总线(USB)或IEEE 1394连接)或间接通过交换可移除存储媒体(例如,快闪存储卡、磁性硬盘驱动器或其它媒体)来提供视频到视频处理设备。视频俘获设备12可包含一组图像传感器,其包括(例如)以拜尔(Bayer)模式布置在各自传感器的表面上的彩色滤光器阵列(CFA)。
当视频俘获设备12与视频处理设备4集成在一起时,图像传感器可直接耦合到视频处理单元6以避免取景器图像(即,经由相对小格式、低分辨率显示器大体上实时呈现给用户的图像)的图像处理中的等待时间。然而,其它类型的图像传感器也可用以俘获视频数据。可用于实现图像俘获设备12的其它示范性传感器包括固态传感器元件阵列,例如互补金氧半导体(CMOS)传感器元件、电荷耦合装置(CCD)传感器元件等等。
根据本发明来处理视频俘获设备12所获得的视频以提供图像稳定来补充非所要的抖动。视频俘获设备12可俘获具有比视频编码所必需的大小大的大小的视频帧。以此方式,所俘获的视频帧提供过多面积来准许电子图像稳定。具体地说,较大的所俘获视频帧内的所要图像可基于全局运动向量来垂直地、水平地或垂直水平地移动,从而补偿抖动。
作为视频俘获设备12的替代方案,视频处理设备4可处理从存储先前所俘获的视频的视频档案获得的视频。因此,图像稳定可立即(大体上实时)应用到其正俘获的视频或作为后处理步骤应用到先前俘获的视频。在任何情况下,图像稳定在编码之前补偿视频中的抖动,以增强用户最终所观看到的视频的质量。可能需要在俘获视频时的图像稳定的即时应用以增强取景器图像质量以及最终的原始或编码视频质量。
装置2可包括显示器21,其显示由图像俘获设备12取样的取景器图像的实时序列以模拟实时视频。这些图像在宽度上可相对较小。因此,由于此些小图像经俘获,其可直接逐行载入到前端处理单元18中。在处理之后,可将取景器图像写入到本地存储器8或外部存储器14。接着将经处理图像发送到显示器21以用于呈现给用户。显示器21也可用于在由前端处理单元18处理此些静止图像之后显示静止图像。然而,在一些情况下,可在未由装置2显示的情况下处理和存储静止图像。在俘获静止图像之后,本地存储器8可存储原始数据。
在一些情况下,装置2可包括多个存储器。举例来说,装置2可包括外部存储器14,其通常包含相对大的存储器空间。外部存储器14(例如)可包含动态随机存取存储器(DRAM)或快闪存储器。在其它实例中,外部存储器14可包含非易失性存储器或任何其它类型的数据存储单元。与外部存储器14相反,本地存储器8可包含较小且较快速的存储器空间,但本发明不必限于此方面。举例来说,本地存储器8可包含同步动态随机存取存储器(SDRAM)。
在任何情况下,存储器14和8仅仅为示范性的,且可经组合到同一存储器中,或可用许多其它配置来实施。在一个实施例中,本地存储器8形成外部存储器14的部分,通常在SDRAM中。在此情况下,存储器8和14两者从存储器与视频处理单元6不位于“芯片上”的意义上来讲处于“外部”。因此,仅图像处理单元6的行缓冲器可为“芯片级”存储器。
在一些实施例中,装置2也可包括用以(例如)经由有线或无线通信媒体将经处理视频或经编码视频(或其它信息)传输到另一装置的传输器(未图示)。而且,在一些实施例中,装置2包括用以接收来自另一装置的经处理视频或经编码视频(或其它信息)的接收器。本地存储器8、显示器21和外部存储器14(以及其它组件,如果需要的话)可经由通信总线15耦合。装置2中也可包括许多其它元件,但为了简单且易于说明起见并未在图1中具体说明。图1中所说明的结构仅仅是示范性的,因为可使用多种其它结构来实施本文所描述的技术。
图2是根据本发明的原理进一步详细说明图1的实例性前端处理单元18的框图。如图2中所示,前端处理单元18可包括空间估计模块22和运动估计模块24。另外,前端处理单元18可包括运动整合模块26、运动补偿模块28、统计存储器27和原始帧存储器29。前端处理单元18将视频帧分为非重叠宏块。空间估计模块22和运动估计模块24两者均相对于另一帧中的相应(即,最紧密匹配)宏块而分析帧的宏块中的每一者,从而分别获得空间和运动统计。
统计存储器27存储空间和运动统计。原始帧存储器29存储由视频俘获装置获得的视频帧。存储在原始视频帧存储器29中的视频帧可包括非所要的抖动。运动整合模块26基于空间估计模块22和运动估计模块24所产生的空间和运动统计而产生全局运动向量。运动补偿模块28使用全局运动向量将一偏移应用到所接收的视频帧内的图像,且进而补偿抖动。
图3是说明图2中的处理单元的各种组件用以执行可缩放电子图像稳定的操作的框图。如图3所示,空间估计模块22、运动估计模块24、统计存储器27、原始帧存储器29形成电子图像稳定(EIS)宏块(MB)环路的部分。EIS MB环路处理抖动图像以产生空间和运动统计。运动整合模块26接收来自统计存储器27的统计,且产生全局运动向量以用于由运动补偿模块28应用而产生稳定的图像。
空间估计模块22对来自当前视频帧的个别非重叠宏块执行空间估计。空间估计提供帧的特性的指示,例如在纹理方面。在一个实施例中,执行空间估计包含测量与宏块内的像素相关联的亮度值的平均数和方差。空间估计模块22将平均数和方差作为空间统计存储在统计存储器27中,统计存储器27可形成本地存储器8的部分。
运动估计模块24对个别非重叠宏块执行运动估计。运动估计模块24确定当前帧中的每一宏块的运动向量以表示所述宏块从其先前帧中的位置的位移。换句话说,运动向量指示当前帧中的宏块相对于经发现最紧密匹配当前宏块的先前帧中的宏块的位移。运动估计模块24通过将当前帧中的每一宏块与先前帧中其周围区中的宏块进行比较以发现最佳匹配来执行此功能。运动估计模块24也可确定当前帧中给定宏块与来自先前帧内的搜索区的候选宏块之间的绝对差和(SAD)。运动估计模块24将运动向量和SAD作为运动统计存储在本地存储器8中。
由模块22、24提供的空间估计和运动估计操作通常可符合视频编码中执行的类似操作,例如根据MPEG-1、MPEG-2、MPEG-4、ITU H.261、ITU H.263或ITU H.264标准的编码。一旦当前帧的个别非重叠宏块中的每一者的空间和运动统计已存储在统计存储器27中,运动整合模块26就将个别运动向量整合为单个全局运动向量,其将用以补偿由抖动产生的移动。运动整合模块26可如下所述利用非线性整合功能。举例来说,在一个实施例中,运动整合模块26建立二维(2D)直方图(其具有对应于可能运动向量中的每一者的区间),且选择与具有最大值的直方图区间相关联的运动向量作为全局运动向量。一旦运动整合模块26已计算出全局运动向量,运动补偿模块28就将当前图像整体偏移此向量。此外,当前图像可对应于较大图像内的区域,较大图像已为了准许图像稳定而经扩大,即通过在较大图像内垂直地、水平地或垂直水平地移位较小图像。经移位图像接着可经取样以用于进一步处理,例如视频编码。
在一些实施例中,图2和图3的示范性前端处理单元18中所示的图像处理模块中的一者或一者以上可驻存在装置2的不同于前端处理单元18的位置中。举例来说,空间估计模块22和运动估计模块24可位于编码单元19内,使得图像稳定和视频编码依赖于用于空间估计和运动估计的共同硬件、固件和/或软件单元。另外,前端处理单元18可包括未图示的其它图像处理模块。举例来说,前端处理单元18的额外模块可包括2维滤波模块、去马赛克模块、透镜消散校正模块、缩放模块、色彩校正模块、色彩转换模块、噪声减少滤波模块、空间滤波模块或其它类型的模块。
图4是说明图1的装置2在实施本发明的技术时的示范性操作的流程图。图像俘获设备12俘获视频图像以形成具有一连串帧形式的视频帧(30)。图象处理单元6接收所俘获的图像。前端处理单元18将图像的当前帧分为宏块(32)。举例来说,前端处理单元18可将帧分为包含十六乘十六像素阵列的宏块。或者,宏块可具有更小或更大的大小,例如八乘八、四乘四、八乘十六、四乘八等等。因此,术语“宏块”可指代视频帧内的像素阵列。此阵列的大小可以是固定的或可变的,且可具有一定范围内的大小。可分析宏块内的像素以提供整体应用到宏块的统计集合。
空间估计模块22对来自当前帧(C)的个别非重叠宏块集合(cij∈C)执行空间估计(34)。空间估计模块22可通过测量宏块的平均数和方差来执行宏块的空间估计。在一个实施例中,空间估计模块22根据以下等式来测量平均数和方差:
Figure A20078001084200131
(1)
Figure A20078001084200132
(2)
在此实施例中,空间估计模块22未使用熟悉的平方近似来测量方差,因为所示的简单近似(取代平方的绝对值)可足以用于图像稳定目的。然而,可在其它实施例中使用平方和。空间估计模块22将平均数和方差作为空间统计(例如)存储在本地存储器8中(36)。
运动估计模块24对当前帧的个别非重叠宏块执行运动估计(38)。举例来说,运动估计模块24确定当前帧中每一宏块的运动向量,其表示所述宏块从其在先前宏块中的位置(即,从先前帧中最紧密匹配宏块的位置)的位移。运动估计模块24通过将当前帧中的每一宏块与先前帧中其周围区中的宏块进行比较以发现最佳匹配来执行此功能。举例来说,在先前帧的搜索区S中搜索每一宏块。搜索区(SX,SY)的大小可依据实施技术所处的平台以及依据源视频而变化。
运动估计模块24自适应地在运动向量预测值(mvpij x,mvpij y)或(0,0)向量周围选择搜索区中心(搜索_中心ij x,搜索_中心ij y)。运动估计模块24基于潜在搜索区中心的邻域中的运动的可靠性而决定选择哪个向量作为搜索区中心。此由时空_可靠性_指数ij表示,在下一段中展示其计算。如下所示,基于相邻宏块的运动向量来计算运动向量预测值(mvpij x,mvpij y):
mvp ij x = Median ( mv i - 1 j x , mv ij - 1 x , mv i + 1 j - 1 x ) , 以及
(3)
mvp ij y = Median ( mv i - 1 j y , mv ij - 1 y , mv i + 1 j - 1 y ) ,
(4)
其中
(mvi-1j x,mvi-1j y)是左边宏块的运动向量,
(mvij-1 x,mvij-1 y)是顶部宏块的运动向量,以及
(mvij+1 x,mvi+1j-1 y)是左边宏块的运动向量。
运动估计模块24如下自适应地选择搜索区中心:
如果(时空_可靠性_指数ij<搜索_中心_阈值)
{
Figure A20078001084200151
Figure A20078001084200152
}
否则
{
Figure A20078001084200153
Figure A20078001084200154
}。
上述步骤的结果是运动向量(mvij x,mvij y),其导致执行搜索的当前帧中的给定宏块的最佳匹配。
也可通过数量测量来描述匹配的程度。在一个实施例中,运动估计模块24确定给定宏块(cij∈C)与来自搜索区(sj∈S)的候选宏块之间的绝对差和(SAD)(绝对差和ij)作为数量测量。SAD由以下等式给定:
Figure A20078001084200155
(5)
运动估计模块24将用于宏块的运动向量和用于宏块的SAD存储为用于宏块(cij∈C)的运动统计(40)。
一旦前端处理单元18已获得当前帧的个别非重叠宏块中的每一者(cij∈C)的空间和运动统计,运动整合模块26就将个别运动向量整合为单个全局运动向量,其将用于补偿由抖动产生的移动(42)。运动整合模块26可利用如下所述的非线性整合功能。在一个实施例中,运动整合模块26建立二维(2D)直方图(直方图(p,q)),其具有对应于可能运动向量中的每一者的区间。然而,运动整合模块26可使用将个别运动向量整合为全局运动向量的其它方法。2D直方图的二维对应于帧的水平和垂直方向。用值/贡献(贡献ij)来更新对应于每一块(cij)的运动向量(mvij x,mvij y)的区间,如下所界定。
贡献反映其所关联运动向量(mvij x,mvij y)的可靠性。运动整合模块26为此目的计算三种类型的可靠性指数:空间_可靠性_指数ij、时间_可靠性_指数ij和时空_可靠性_指数ij,其取决于cij的空间、时间和时空特性。运动整合模块26使用方差ij来计算可靠性指数空间_可靠性_指数ij,其如下规范化为固定标度(0到最大_可靠性_指数):
空间_可靠性_指数ij=(方差ij-方差_偏移)/方差_标度,
空间_可靠性_指数ij=MIN(最大_可靠性_指数,MAX(0,空间_可靠性_指数ij))。
运动整合模块26使用绝对差和ij来计算可靠性指数时间_可靠性_指数ij,其如下规范化为固定标度(0到最大_可靠性_指数):
时间_可靠性_指数ij=(绝对差和ij-绝对差和_偏移)/绝对差和_标度,
时间_可靠性_指数ij=MIN(最大_可靠性_指数,MAX(0,时间_可靠性_指数ij))。
运动整合模块26将相邻块的运动向量的同质性考虑在内来计算可靠性指数时空_可靠性_指数ij。运动整合模块26也如下将此指数正规化为固定标度(0到最大_可靠性_指数):
时空_可靠性_指数ij=最大_可靠性_指数;
如果
Figure A20078001084200161
时空_可靠性_指数ij-=(最大_可靠性_指数/5);
如果
Figure A20078001084200162
时空_可靠性_指数ij-=(最大_可靠性_指数/5);
如果
Figure A20078001084200163
时空_可靠性_指数ij-=(最大_可靠性_指数/5);
如果
Figure A20078001084200164
时空_可靠性_指数ij-=(最大_可靠性_指数/5);
如果
Figure A20078001084200165
时空_可靠性_指数ij-=(最大_可靠性_指数/5);
如果
Figure A20078001084200166
时空_可靠性_指数ij-=(最大_可靠性_指数/5);
时空_可靠性_指数ij=MAX(0,时空_可靠性_指数ij).
运动整合模块26将贡献(贡献ij)计算为:
如果(空间_可靠性_指数ij>空间_阈值&&
时空_可靠性_指数ij>时空_阈值)
{
贡献ij=(空间_可靠性_指数ij+时间_可靠性_指数ij)/2;
}
否则
{
贡献ij=0;
}。
运动整合模块26对于每一块cij如下更新直方图(直方图(p,q)):
直方图
Figure A20078001084200171
(6)
运动整合模块26选择具有最大值的直方图位置作为全局运动向量(Px,Py):
(px,py)=(p,q)|max直方图(p,q)。
(7)
一旦运动整合模块26已计算出全局运动向量(Px,Py),运动补偿模块28就将当前图像整体偏移此向量(44)。经移位图像接着经取样用于进一步处理。可存储当前帧以用作参考帧,以用于确定下一帧的全局运动向量。
图5是说明根据较大参考窗48内的全局运动向量(Px,Py)的示范性当前图像46偏移的框图。当前图像46具有垂直尺寸IV和水平尺寸IH,且参考窗48具有垂直尺寸RV和水平尺寸RH。前端处理单元18计算每一连续帧的全局运动向量(Px,Py),使得每一连续帧根据参考窗48内的全局运动向量而位移。
图6是说明其中区域52包含帧的宏块子集的实例性帧50的图。图6展示界定本文所揭示技术的可缩放复杂性的区域52的实例性参数。上述技术可提供复杂可缩放性以在执行电子图像稳定时使用最少资源。具体地说,前端处理单元18无需使用帧的每个宏块来确定所述帧的全局运动向量。作为替代,对宏块子集的分析可产生帧的适当全局运动向量。举例来说,在上述实例性实施例中,执行运动整合的步骤需要发现2D直方图的峰值以便发现帧50的全局运动向量。块的子集(cij∈R)可产生2D直方图中的峰值。R被界定为是C的子集的区域。
区域R应足够大以使峰值为可靠的,且还应包含可靠运动的区。可利用以下参数将R界定为C的函数。区域开始行是区域的开始行,以整数块的形式。区域开始列是区域的开始列,以整数块的形式。区域数目行是区域中行的数目,以整数块的形式。区域数目列是区域中列的数目,以整数块的形式。区域行密度是区域中行的密度(以百分数计),且区域列密度是区域中列的密度(以百分数计)。在一些实施方案中,使用100%的区域列密度对于硬件的有效使用是优选的。
为了维持性能与灵活性之间的合理平衡度,可结合可编程硬件来使用数字信号处理器(DSP)或其它处理实体以实施本发明的电子图像稳定技术。在此配置中,DSP控制各种硬件组件的编程和执行。现将结合图像稳定来描述此结构的实例。
图7是说明用于无线通信装置(例如移动无线电电话)中的移动台调制解调器(MSM)平台的实例性视频核心54的框图。在图1的实例中,仅可从DSP且不可从处理器核心访问视频核心54。视频核心54提供功率高效解决方案以用于在视频编码和解码期间移动像素;因此,可利用视频核心54进行本文所揭示的电子图像稳定技术的所有像素密集操作(例如空间估计和运动估计)。因为电子图像稳定仅需要视频编码所需的操作子集,所以仅需要利用视频核心的低版本(thin version)。处理器核心或DSP可容纳图像稳定算法的运动整合方面。
如图7所示,可在视频前端(VFE)56与视频后端(VBE)58之间分割视频核心54。通常,VFE 56囊封功能性和预处理操作以支持多种相机或摄像机应用,且包括用于控制这些操作的灵活的处理器间接口。VFE 56的主要任务是实时处理引入的视频输入数据60。VFE 56接收视频输入数据60,且基于从控制器(未图示)接收的命令和配置参数25将待产生视频输出数据的数据处理为VBE 16可接受的格式。
举例来说,VFE 56可使用上述电子图像稳定技术来处理视频输入数据60。另外,VFE 56可格式化视频输入数据60来产生具有适于由显示模块(未图示)显示的形式的视频显示数据。VFE 56将视频输出数据和视频显示数据存储在视频存储器(未图示)内以用于分别由VBE 58和控制器存取。VFE 56经由处理器间接口提供状态信息以指示待决命令的状态。
VBE 58可包含任何软件应用、硬件单元等等,其编码或解码视频数据。更具体地说,VBE 58可利用视频输出数据来产生视频序列的经编码位流。
当作为编码器来操作时,VBE 16编码视频输出数据,且可缓冲视频存储器内的编码位流,(例如)用于经由传输器/接收器(未图示)进行无线传输。举例来说,VBE 16可包含用于数码相机的JPEG静止图像编码器、用于数码摄像机的MPEG视频编码器等等。因此,VBE可为专有编码器或解码器,或可根据多种数据压缩标准中的一者或一者以上(例如MPEG-1、MPEG-2、MPEG-4、ITU H.261、ITU H.263、ITU H.264和/或其它标准)处理视频输出数据。
或者,或另外,VBE 58可作为解码器来操作。更具体地说,VBE 58可接收来自接收器/传输器的经编码视频序列的位流,且处理位流以产生经解码视频序列以用于由VFE56处理和显示。VFE 56和VBE 58可交换控制信号以触发视频处理操作。举例来说,控制器或VFE 56可触发由VBE 58进行的编码操作。当作为解码器来操作时,控制器或VBE 58可触发由VFE 56进行的操作。VFE 56和VBE 58可经提供为独立的硬件或软件模块,例如由DSP 62执行的软件模块或其组合。
图8A-8D是说明用于在图7的平台上实施本发明的图像稳定技术的实例性实施方案的框图。图8A是说明用于在MSM7K平台上实施图像稳定的一个选项的框图。如图8A所示,处理器核心74发布“编码”命令两次;一次用于图像稳定且再一次用于实际编码帧。在图像稳定阶段,DSP 76和视频核心78以如同帧被编码的相同方式而运行。在此阶段,以每个宏块为基础将运动和空间统计发送回处理器核心74以支持图像稳定。处理器核心74接着将实施如上所述的运动整合技术。由处理器核心74计算的全局运动向量接着在下一阶段期间被返回编程,在下一阶段中执行实际编码。
图8B是说明用于在MSM7K平台上实施图像稳定的另一选项的框图。在此选项中,处理器核心74仅需实施“图像稳定”命令,其将自适应地控制上述电子图像稳定技术。处理器核心74在发布用于编码帧的“编码命令”之前发布“图像稳定”命令。“图像稳定”命令指令DSP 76仅编码帧的子集,即区域R。此可允许可缩放界面实施本发明的电子图像稳定技术。其余步骤与图8A的步骤大体上相同。
图8C是说明用于在MSM7K平台上实施图像稳定的另一选项的框图。此选项需要在DSP 76上实施已知为稳定模式(“稳定(stab)”模式)的新的功能性。稳定模式仅允许运行视频核心78的子集。具体地说,并非运行编码所需的所有操作,而是可运行足以支持用于图像稳定的空间和运动估计的操作的子集。此可帮助减少在图像稳定阶段期间所耗费的时间。其余步骤与图8B的步骤大体上相同。
图8D是用于在图7的平台上实施图像稳定的另一选项的框图。此选项需要在DSP 76内实施算法的运动整合步骤。此可最小化处理器核心74与DSP 76之间必需的通信量(即,基于每个宏块的运动与空间统计的通信)。因此,处理器核心74每个帧发布单个命令(编码和稳定组合)。DSP 76执行包括运动整合和确定全局运动向量的图像稳定,且接着在因数化全局运动向量的同时对帧进行编码。
图9是说明可实施本发明的技术的示范性数字视频装置80的框图。数字视频装置80可作为源装置进行操作,其将视频数据的经编码序列无线传输到接收装置(未图示)。类似地,数字视频装置80可作为能够无线地接收和解码视频数据的接收装置进行操作。数字视频装置可支持视频广播、视频会议、视频电话或任何需要传输视频的其它应用。举例来说,数字视频装置80可为无线通信装置,例如蜂窝式或卫星无线电电话、或个人数字助理(PDA)。
前端处理单元82可用以根据上述图像稳定技术来处理视频俘获装置84所俘获的视频帧。存储器86可存储视频序列。举例来说,存储器86可存储当前帧以用作用于稳定和编码后续帧的参考。编码器88可使用压缩算法来编码所存储的视频序列。编码器88可包括(例如)各种硬件、软件或固件或一个或一个以上DSP,其执行可编程软件模块以控制视频编码技术,如本文所述。数字视频装置80也包括传输器20,其用以经由无线天线92将经编码序列传输到接收装置(未图示)。
本发明所描述的技术可以硬件、软件、固件或其任何组合来实施。举例来说,所述技术的各方面可实施在一个或一个以上微处理器、DSP、专用集成电路(ASIC)、现场可编程逻辑阵列(FPGA)、或任何其它等效集成或离散逻辑电路、以及此些组件的任何组合内。术语“处理器”或“处理电路”一般可指代上述逻辑电路中的任一者,无论是独立的或与其它逻辑电路组合。
当以软件实施时,归于本发明中所描述的系统和装置的功能性可实施为计算机可读媒体上的指令,所述计算机可读媒体例如为随机存取存储器(RAM)、只读存储器(ROM)、非易失性随机存取存储器(NVRAM)、电可擦可编程只读存储器(EEPROM)、快闪存储器、磁性媒体、光学媒体等等。执行所述指令以支持本发明所描述功能性的一个或一个以上方面。
已描述了各种实施例。所描述的实施例仅用于示范性目的。这些和其它实施例在所附权力要求书的范围之内。

Claims (35)

1.一种装置,包含:
空间估计模块,其产生视频帧内的宏块的空间统计;
运动估计模块,其产生所述视频帧内的所述宏块的运动统计;
运动整合模块,其整合所述空间统计和所述运动统计以确定所述帧的全局运动向量;以及
稳定模块,其基于所述全局运动向量而将一偏移应用到由所述宏块界定的图像。
2.根据权利要求1所述的装置,其中所述空间统计包含与所述宏块中的每一者相关联的视频信息的平均数和方差。
3.根据权利要求1所述的装置,其中所述运动统计包含指示所述宏块与先前视频帧中的相应宏块之间的移动的运动向量。
4.根据权利要求3所述的装置,其中所述运动统计包括绝对差和(SAD)值,其指示所述宏块与所述先前帧中的所述相应宏块之间的差。
5.根据权利要求3所述的装置,其中所述运动统计模块自适应地选择所述先前帧的搜索区中心,且将所述宏块和与所述搜索区中心相关联的搜索区中的所述先前帧的宏块进行比较以发现所述先前帧的最佳匹配宏块。
6.根据权利要求1所述的装置,其中所述运动整合模块建立包含对应于多个可能运动向量中的每一者的区间的二维(2D)直方图,且将与具有最大值的所述区间相关联的所述运动向量指定为所述全局运动向量。
7.根据权利要求1所述的装置,其进一步包含:
数字信号处理器;以及
处理器核心,其向所述数字信号处理器发布两个编码命令,其中在接收到所述第一编码命令时,所述数字信号处理器促使所述空间估计模块获得空间统计且促使所述运动估计模块获得运动估计,且其中所述处理器核心促使所述运动整合模块整合所述宏块中的每一者的所述空间统计和所述运动统计以确定所述帧的所述全局运动向量。
8.根据权利要求7所述的装置,其中所述处理器核心使用所述全局运动向量编程所述数字信号处理器,且其中在接收到所述第二编码命令时,所述数字信号处理器将所述图像的编码执行为由所述运动补偿模块进行的偏移。
9.根据权利要求1所述的装置,其进一步包含:
数字信号处理器;以及
处理器核心,其向所述数字信号处理器发布图像稳定命令,所述命令指令所述数字信号处理器对由所述帧的所述宏块的子集组成的区域R执行图像稳定,其中所述运动整合模块基于所述区域R内的所述宏块中的每一者的所述运动统计和空间统计而确定所述帧的所述全局运动向量。
10.根据权利要求9所述的装置,其进一步包含视频核心,其中所述数字信号处理器实施稳定模式,且其中所述稳定模式允许所述装置仅运行所述视频核心的子集。
11.根据权利要求1所述的装置,其进一步包含:
数字信号处理器,其促使所述运动整合模块整合所述宏块中的每一者的所述空间统计和所述运动统计,以确定所述帧的全局运动向量;以及
处理器核心,其向所述数字信号处理器发布命令,所述命令指令所述数字信号处理器执行图像稳定以及所述帧的编码。
12.根据权利要求1所述的装置,其进一步包含俘获所述图像的图像俘获设备。
13.根据权利要求1所述的装置,其中所述装置对十六像素乘十六像素宏块执行所述空间估计和所述运动估计。
14.根据权利要求1所述的装置,其中所述装置包括无线通信装置、个人数字助理、膝上型计算机、台式计算机、数码相机、数字记录装置、具有视频能力的蜂窝式无线电电话以及具有视频能力的卫星无线电电话中的至少一者。
15.根据权利要求1所述的装置,其进一步包含传输器,其用以传输由所述空间估计模块、所述运动估计模块、所述运动整合模块和所述运动补偿模块处理的视频帧。
16.一种执行电子图像稳定的方法,其包含:
产生视频帧内的宏块的空间统计;
产生所述视频帧内的所述宏块的运动统计;
整合所述空间统计和所述运动统计以确定所述帧的全局运动向量;以及
基于所述全局运动向量将一偏移应用到由所述宏块界定的图像。
17.根据权利要求16所述的方法,其中产生空间统计包含获得所述宏块中的每一者的平均数和方差。
18.根据权利要求16所述的方法,其中所述运动统计包含指示所述宏块与先前视频帧中的相应宏块之间的移动的运动向量。
19.根据权利要求16所述的方法,其中产生运动统计包含确定所述宏块的运动向量以及所述宏块与来自先前帧的宏块之间的绝对差和(SAD)。
20.根据权利要求19所述的方法,其中确定所述运动向量包含:
自适应地选择搜索区中心;以及
将所述宏块和与所述先前帧的所述搜索区中心相关联的搜索区中的宏块进行比较以发现所述先前帧的最佳匹配宏块。
21.根据权利要求16所述的方法,其中整合所述空间统计和所述运动统计包含建立包含对应于多个可能运动向量中的每一者的区间的二维(2D)直方图,且将与具有最大值的所述区间相关联的所述运动向量指定为所述全局运动向量。
22.根据权利要求16所述的方法,其进一步包含:
将所述帧内的所述宏块的子集界定为区域R;以及
基于所述区域R内的所述宏块中的每一者的所述运动统计和空间统计来确定所述帧的所述全局运动向量。
23.一种计算机可读媒体,其包含在装置中执行时促使所述装置进行以下操作的指令:
产生视频帧内的宏块的空间统计;
产生所述视频帧内的所述宏块的运动统计;
整合所述空间统计和所述运动统计以确定所述帧的全局运动向量;以及
基于所述全局运动向量而将一偏移应用到由所述宏块界定的图像。
24.根据权利要求23所述的计算机可读媒体,其中所述指令促使所述处理器通过获得所述宏块中的每一者的平均数和方差而产生空间统计。
25.根据权利要求23所述的计算机可读媒体,其中所述运动统计包含指示所述宏块与先前视频帧中的相应宏块之间的移动的运动向量。
26.根据权利要求23所述的计算机可读媒体,其中所述指令促使所述处理器通过确定所述宏块的运动向量以及所述宏块与来自先前帧的宏块之间的绝对差和(SAD)而产生运动统计。
27.根据权利要求23所述的计算机可读媒体,其进一步包含在装置中执行时促使所述装置进行以下操作的指令:
建立包含对应于多个可能运动向量中的每一者的区间的二维(2D)直方图;以及
将与具有最大值的所述区间相关联的所述运动向量指定为所述全局运动向量。
28.根据权利要求23所述的计算机可读媒体,其进一步包含在装置中执行时促使所述装置进行以下操作的指令:
将所述帧内的所述宏块的子集界定为区域R;以及
基于所述区域R内的所述宏块中的每一者的所述运动统计和空间统计而确定所述帧的所述全局运动向量。
29.一种用于执行电子图像稳定的装置,其包含:
用于产生视频帧内的宏块的空间统计的装置;
用于产生所述视频帧内的所述宏块的运动统计的装置;
用于整合所述空间统计和所述运动统计以确定所述帧的全局运动向量的装置;以及
用于基于所述全局运动向量而将一偏移应用到由所述宏块界定的图像的装置。
30.根据权利要求29所述的装置,其中所述用于产生空间统计的装置包含用于获得所述宏块中的每一者的平均数和方差的装置。
31.根据权利要求29所述的装置,其中所述运动统计包含指示所述宏块与先前视频帧中的相应宏块之间的移动的运动向量。
32.根据权利要求29所述的装置,其中所述用于产生运动统计的装置包含用于确定所述宏块的运动向量以及所述宏块与来自先前帧的宏块之间的绝对差和(SAD)的装置。
33.根据权利要求32所述的装置,其中所述用于确定所述运动向量的装置包含:
用于自适应地选择搜索区中心的装置;以及
用于将所述宏块和与所述先前帧的所述搜索区中心相关联的搜索区中的宏块进行比较以发现所述先前帧的最佳匹配宏块的装置。
34.根据权利要求29所述的装置,其中所述用于整合所述空间统计和所述运动统计的装置包含用于建立包含对应于多个可能运动向量中的每一者的区间的二维(2D)直方图的装置,以及用于将与具有最大值的所述区间相关联的所述运动向量指定为所述全局运动向量的装置。
35.根据权利要求29所述的装置,其进一步包含:
用于将所述帧内的所述宏块的子集界定为区域R的装置;以及
用于基于所述区域R内的所述宏块中的每一者的所述运动统计和空间统计而确定所述帧的所述全局运动向量的装置。
CN2007800108423A 2006-04-06 2007-04-06 执行电子视频图像稳定的装置和方法 Active CN101411181B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US79051406P 2006-04-06 2006-04-06
US60/790,514 2006-04-06
US11/487,078 2006-07-14
US11/487,078 US7840085B2 (en) 2006-04-06 2006-07-14 Electronic video image stabilization
PCT/US2007/066152 WO2007118197A2 (en) 2006-04-06 2007-04-06 Electronic video image stabilization

Publications (2)

Publication Number Publication Date
CN101411181A true CN101411181A (zh) 2009-04-15
CN101411181B CN101411181B (zh) 2011-07-06

Family

ID=38442958

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2007800108423A Active CN101411181B (zh) 2006-04-06 2007-04-06 执行电子视频图像稳定的装置和方法

Country Status (7)

Country Link
US (1) US7840085B2 (zh)
EP (1) EP2002649B1 (zh)
JP (2) JP2009533009A (zh)
KR (1) KR101027353B1 (zh)
CN (1) CN101411181B (zh)
ES (1) ES2565177T3 (zh)
WO (1) WO2007118197A2 (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102075681A (zh) * 2009-11-24 2011-05-25 索尼公司 图像处理设备、图像处理方法、程序和记录介质
CN102355581A (zh) * 2011-09-22 2012-02-15 山东大学 用于视频编码芯片硬件系统中的多级稳定性处理方法
CN103139446A (zh) * 2011-10-14 2013-06-05 斯凯普公司 接收的视频稳定化
US9635256B2 (en) 2011-09-26 2017-04-25 Skype Video stabilization
CN107222659A (zh) * 2017-05-03 2017-09-29 武汉东智科技股份有限公司 一种视频异常检测方法
CN108702512A (zh) * 2017-10-31 2018-10-23 深圳市大疆创新科技有限公司 运动估计方法和装置
US10412305B2 (en) 2011-05-31 2019-09-10 Skype Video stabilization
CN114257756A (zh) * 2020-09-25 2022-03-29 瑞昱半导体股份有限公司 校正移动向量的视频处理方法
CN115176455A (zh) * 2020-03-03 2022-10-11 高通股份有限公司 功率高效的动态电子图像稳定
WO2023279275A1 (en) * 2021-07-07 2023-01-12 Qualcomm Incorporated Local motion detection for improving image capture and/or processing operations

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4838699B2 (ja) * 2006-12-19 2011-12-14 キヤノン株式会社 色処理装置および方法
US8428142B2 (en) 2007-03-05 2013-04-23 Stmicroelectronics International N.V. System and method for transcoding data from one video standard to another video standard
US20090073283A1 (en) * 2007-09-18 2009-03-19 Atmel Corporation Method and apparatus for capturing images
JP4940164B2 (ja) * 2008-02-07 2012-05-30 オリンパス株式会社 撮像装置及び撮像方法
JP5048542B2 (ja) * 2008-02-07 2012-10-17 オリンパス株式会社 画像処理装置及び画像処理プログラム
JP4561845B2 (ja) * 2008-02-29 2010-10-13 カシオ計算機株式会社 撮像装置と画像処理プログラム
JP4561919B2 (ja) * 2008-04-21 2010-10-13 ソニー株式会社 撮像装置、画像処理装置及び画像処理方法
US8120659B2 (en) * 2008-05-22 2012-02-21 Aptina Imaging Corporation Method and system for motion estimation in digital imaging applications
US8185823B2 (en) * 2008-09-30 2012-05-22 Apple Inc. Zoom indication for stabilizing unstable video clips
US20100215104A1 (en) * 2009-02-26 2010-08-26 Akira Osamoto Method and System for Motion Estimation
US20100295957A1 (en) * 2009-05-19 2010-11-25 Sony Ericsson Mobile Communications Ab Method of capturing digital images and image capturing apparatus
TW201230805A (en) * 2011-01-04 2012-07-16 Aptos Technology Inc Video playback apparatus and method
JP5708097B2 (ja) * 2011-03-18 2015-04-30 株式会社リコー 撮像装置、撮像方法、及び撮像プログラム
CN102637295B (zh) * 2012-03-31 2014-07-23 北京智安邦科技有限公司 一种快速图像电子稳定方法及装置
JP5996418B2 (ja) * 2012-12-20 2016-09-21 オリンパス株式会社 撮像装置および撮像方法
US10602175B2 (en) * 2012-12-21 2020-03-24 Nvidia Corporation Using an average motion vector for a motion search
KR101783990B1 (ko) * 2012-12-21 2017-10-10 한화테크윈 주식회사 디지털 영상 처리 장치 및 영상의 대표 움직임 예측 방법
CN103455983A (zh) * 2013-08-30 2013-12-18 深圳市川大智胜科技发展有限公司 嵌入式视频系统中的图像扰动消除方法
US20150071343A1 (en) * 2013-09-12 2015-03-12 Magnum Semiconductor, Inc. Methods and apparatuses including an encoding system with temporally adaptive quantization
KR102290964B1 (ko) 2014-02-19 2021-08-18 삼성전자주식회사 적응적 서치 레인지를 이용한 비디오 인코딩 장치 및 그 방법
KR101589186B1 (ko) * 2014-04-16 2016-01-27 국방과학연구소 글로벌 모션벡터 보상을 이용한 영상정합 방법
EP3378221B1 (en) * 2015-11-16 2022-01-12 Google LLC Stabilization based on accelerometer data
KR20180117597A (ko) * 2016-03-03 2018-10-29 소니 주식회사 화상 처리 장치, 화상 처리 방법, 컴퓨터 프로그램 및 전자 기기
US10432864B1 (en) * 2018-09-19 2019-10-01 Gopro, Inc. Systems and methods for stabilizing videos
CN111010494B (zh) * 2019-10-28 2020-11-03 武汉大学 一种带有地理编码的光学卫星视频稳像方法及系统
US11418810B2 (en) * 2020-09-21 2022-08-16 Tencent America LLC Methods of inter picture motion prediction for multi-view video compression
CN112351281A (zh) * 2020-10-28 2021-02-09 西安万像电子科技有限公司 图像处理方法及装置、处理器、非易失性存储介质
US11863791B1 (en) 2021-11-17 2024-01-02 Google Llc Methods and systems for non-destructive stabilization-based encoder optimization

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0514798A (ja) * 1991-07-03 1993-01-22 Sony Corp 手振れ補正装置
JP3221785B2 (ja) * 1993-10-07 2001-10-22 株式会社日立製作所 撮像装置
US5835138A (en) 1995-08-30 1998-11-10 Sony Corporation Image signal processing apparatus and recording/reproducing apparatus
JP3951321B2 (ja) * 1995-08-30 2007-08-01 ソニー株式会社 画像信号処理装置および記録/再生装置
JP4245695B2 (ja) * 1998-09-24 2009-03-25 シャープ株式会社 画像動きベクトル検出方法およびその装置
CA2368136A1 (en) * 1999-03-18 2000-09-21 British Broadcasting Corporation Watermarking
EP1075147A1 (en) 1999-08-02 2001-02-07 Koninklijke Philips Electronics N.V. Motion estimation
US6809758B1 (en) 1999-12-29 2004-10-26 Eastman Kodak Company Automated stabilization method for digital image sequences
FR2831698A1 (fr) * 2001-10-30 2003-05-02 Koninkl Philips Electronics Nv Station d'imagerie medicale a fonction d'extraction de trajectoire au sein d'un objet ramifie
JP2004015376A (ja) * 2002-06-06 2004-01-15 Canon Inc 像振れ防止装置およびカメラ
EP1377040A1 (en) * 2002-06-19 2004-01-02 STMicroelectronics S.r.l. Method of stabilizing an image sequence
US7184991B1 (en) * 2002-07-12 2007-02-27 Chroma Energy, Inc. Pattern recognition applied to oil exploration and production
US7188092B2 (en) * 2002-07-12 2007-03-06 Chroma Energy, Inc. Pattern recognition template application applied to oil exploration and production
CN1258925C (zh) * 2003-06-27 2006-06-07 中国科学院计算技术研究所 多视角视频编解码预测补偿方法及装置
US7705884B2 (en) * 2004-07-21 2010-04-27 Zoran Corporation Processing of video data to compensate for unintended camera motion between acquired image frames

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102075681A (zh) * 2009-11-24 2011-05-25 索尼公司 图像处理设备、图像处理方法、程序和记录介质
US10412305B2 (en) 2011-05-31 2019-09-10 Skype Video stabilization
CN102355581A (zh) * 2011-09-22 2012-02-15 山东大学 用于视频编码芯片硬件系统中的多级稳定性处理方法
US9635256B2 (en) 2011-09-26 2017-04-25 Skype Video stabilization
CN103139446B (zh) * 2011-10-14 2016-12-21 斯凯普公司 接收的视频稳定化
US9762799B2 (en) 2011-10-14 2017-09-12 Skype Received video stabilization
CN103139446A (zh) * 2011-10-14 2013-06-05 斯凯普公司 接收的视频稳定化
CN107222659A (zh) * 2017-05-03 2017-09-29 武汉东智科技股份有限公司 一种视频异常检测方法
CN108702512A (zh) * 2017-10-31 2018-10-23 深圳市大疆创新科技有限公司 运动估计方法和装置
WO2019084801A1 (zh) * 2017-10-31 2019-05-09 深圳市大疆创新科技有限公司 运动估计方法和装置
US11019356B2 (en) 2017-10-31 2021-05-25 SZ DJI Technology Co., Ltd. Motion estimation method and device
CN115176455A (zh) * 2020-03-03 2022-10-11 高通股份有限公司 功率高效的动态电子图像稳定
CN114257756A (zh) * 2020-09-25 2022-03-29 瑞昱半导体股份有限公司 校正移动向量的视频处理方法
WO2023279275A1 (en) * 2021-07-07 2023-01-12 Qualcomm Incorporated Local motion detection for improving image capture and/or processing operations

Also Published As

Publication number Publication date
US20070236578A1 (en) 2007-10-11
WO2007118197A2 (en) 2007-10-18
WO2007118197A3 (en) 2008-01-03
JP5129370B2 (ja) 2013-01-30
EP2002649A2 (en) 2008-12-17
JP2009533009A (ja) 2009-09-10
ES2565177T3 (es) 2016-04-01
US7840085B2 (en) 2010-11-23
KR101027353B1 (ko) 2011-04-11
KR20090016553A (ko) 2009-02-16
JP2012009036A (ja) 2012-01-12
CN101411181B (zh) 2011-07-06
EP2002649B1 (en) 2016-01-13

Similar Documents

Publication Publication Date Title
CN101411181B (zh) 执行电子视频图像稳定的装置和方法
US8780991B2 (en) Motion estimation in enhancement layers in video encoding
US8160150B2 (en) Method and system for rate distortion optimization
KR102215951B1 (ko) 복호 장치 및 복호 방법, 및 부호화 장치 및 부호화 방법
TWI569627B (zh) An image processing apparatus, an image processing method, an image processing program, and a recording medium
CN108924565B (zh) 图像处理设备和方法
US20100215104A1 (en) Method and System for Motion Estimation
CN101911701A (zh) 用于图像配准和视频编码的共享的块比较架构
KR20090063120A (ko) 결합 이미지를 생성하는 방법 및 장치
JP5581688B2 (ja) 画像処理装置および方法、並びにプログラム
CN112995663B (zh) 视频编码的方法、视频解码的方法及相应装置
CN112465698A (zh) 一种图像处理方法和装置
US20190020851A1 (en) Image encoding apparatus, and control method thereof
JP2010057166A (ja) 画像符号化装置、画像符号化方法、集積回路及びカメラ
AU2017393149A1 (en) Image processing device and image processing method
CN112088534B (zh) 一种帧间预测的方法、装置、设备及存储介质
US20100135644A1 (en) Photographing apparatus and method of controlling the same
Li et al. Quadtree-based coding framework for high-density camera array-based light field image
JP5869839B2 (ja) 画像処理装置およびその制御方法
JP7248013B2 (ja) 復号方法、復号装置、符号化装置及びプログラム
JP7076983B2 (ja) 符号化装置、画像処理装置及び画像処理方法
KR100928272B1 (ko) 동영상 부호화를 위한 움직임 추정 방법 및 장치
JP2014053831A (ja) 符号化装置
Jansson et al. Video Stabilisering för Mobil Utrustning

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant