CN103503460B - 译码视频数据的方法和设备 - Google Patents

译码视频数据的方法和设备 Download PDF

Info

Publication number
CN103503460B
CN103503460B CN201280019147.4A CN201280019147A CN103503460B CN 103503460 B CN103503460 B CN 103503460B CN 201280019147 A CN201280019147 A CN 201280019147A CN 103503460 B CN103503460 B CN 103503460B
Authority
CN
China
Prior art keywords
motion vector
vector prediction
candidate list
motion
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201280019147.4A
Other languages
English (en)
Other versions
CN103503460A (zh
Inventor
陈盈
陈培松
马尔塔·卡切维奇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of CN103503460A publication Critical patent/CN103503460A/zh
Application granted granted Critical
Publication of CN103503460B publication Critical patent/CN103503460B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding

Abstract

在一实例中,本发明的方面涉及一种方法,所述方法包括从第一视角识别第一时间位置中的视频数据的第一块,其中所述第一块与第一视差运动向量相关联。所述方法还包括确定与视频数据的第二块相关联的第二运动向量的运动向量预测符,其中所述运动向量预测符是基于所述第一视差运动向量。在所述第二运动向量包含视差运动向量时,所述方法包括确定所述运动向量预测符,确定所述运动向量预测符包含缩放所述第一视差运动向量以产生缩放的运动向量预测符,其中缩放所述第一视差运动向量包含将缩放因数应用于所述第一视差运动向量,所述缩放因数包含所述第二视差运动向量的视距除以所述第一运动向量的视距。

Description

译码视频数据的方法和设备
本发明主张2011年4月20申请的美国临时申请案第61/477,561号和2011年7月28日申请的美国临时申请案第61/512,765号的优先权,所述两个申请案的全部内容以引用的方式并入本文中。
技术领域
本发明涉及视频译码。
背景技术
数字视频能力可并入到广泛范围的装置中,所述装置包括数字电视、数字直播系统、无线广播系统、个人数字助理(PDA)、膝上型或桌上型计算机、平板型计算机、电子书阅读器、数字相机、数字记录装置、数字媒体播放器、视频游戏装置、视频游戏控制台、蜂窝式或卫星无线电电话、所谓的“智能电话”、视频电传会议装置、视频串流装置,和其类似者。数字视频装置实施视频压缩技术,例如以下各者中描述的那些技术:由MPEG-2、MPEG-4、ITU-TH.263、ITU-T H.264/MPEG-4第10部分(高级视频译码(AVC))定义的标准、目前在开发中的高效率视频译码(HEVC)标准,和这些标准的扩展。视频装置可通过实施这些视频压缩技术而较有效率地发射、接收、编码、解码和/或存储数字视频信息。
视频压缩技术执行空间(图片内)预测和/或时间(图片间)预测,以减少或移除视频序列中所固有的冗余。对于基于块的视频译码,可将一视频切片(即,图片或图片的一部分)分割成多个视频块,其还可被称作树型块、译码单元(CU)和/或译码节点。可使用相对于同一图片中的相邻块中的参考样本的空间预测来编码图片的帧内译码(I)切片中的视频块。图片的帧间译码(P或B)切片中的视频块可使用相对于同一图片中的相邻块中的参考样本的空间预测或相对于其它参考图片中的参考样本的时间预测。
空间或时间预测产生待译码的块的预测性块。残余数据表示待译码的原始块与预测性块之间的像素差。根据指向形成预测性块的参考样本的块的运动向量和指示经译码块与预测性块之间的差的残余数据来编码帧间译码块。根据帧内译码模式和残余数据来编码帧内译码块。为进行进一步压缩,可将残余数据从像素域变换到变换域,从而产生接着可量化的残余变换系数。可扫描最初布置成二维阵列的经量化的变换系数以便产生变换系数的一维向量,且可应用熵译码以实现甚至更多压缩。
发明内容
一般而言,本发明描述用于译码视频数据的技术。本发明描述用于在多视图视频译码(MVC)中进行帧间模式译码(即,相对于其它图片的块译码当前块)时执行运动向量预测、运动估计和运动补偿的技术。一般而言,MVC为用于囊封多个视图的视频数据的视频译码标准。每一视图可对应于常见场景的对应视频数据被俘获所处的不同观点或角度。本发明的技术一般包括在多视图视频译码的上下文中预测运动预测数据。即,例如,根据本发明的技术,来自处于与当前正经译码的块相同或不同的视图中的块的视差运动向量可用以预测当前块的运动向量。在另一实例中,根据本发明的技术,来自处于与当前正经译码的块相同或不同的视图中的块的时间运动向量可用以预测当前块的运动向量。
在一实例中,本发明的方面涉及一种译码视频数据的方法,所述方法包含:从第一视图识别第一时间位置中的视频数据的第一块,其中所述第一块与第一视差运动向量相关联;确定与视频数据的第二块相关联的第二运动向量的运动向量预测符,其中所述运动向量预测符是基于所述第一视差运动向量;其中当所述第二运动向量包含视差运动向量时,确定所述运动向量预测符包含缩放所述第一视差运动向量以产生缩放的运动向量预测符,其中缩放所述第一视差运动向量包含将缩放因数应用于所述第一视差运动向量,所述缩放因数包含所述第二视差运动向量的视距除以所述第一运动向量的视距;以及使用所述缩放的运动向量预测符译码所述第二块的预测数据。
在另一实例中,本发明的方面涉及一种用于译码视频数据的设备,所述设备包含一个或一个以上处理器,所述一个或一个以上处理器经配置以执行以下操作:从第一视图识别第一时间位置中的视频数据的第一块,其中所述第一块与第一视差运动向量相关联;确定与视频数据的第二块相关联的第二运动向量的运动向量预测符,其中所述运动向量预测符是基于所述第一视差运动向量;其中当所述第二运动向量包含视差运动向量时,所述一个或一个以上处理器经配置以通过缩放所述第一视差运动向量以产生缩放的运动向量预测符而确定所述运动向量预测符,其中缩放所述第一视差运动向量包含将缩放因数应用于所述第一视差运动向量,所述缩放因数包含所述第二视差运动向量的视距除以所述第一运动向量的视距;以及基于所述缩放的运动向量预测符译码所述第二块的预测数据。
在另一实例中,本发明的方面涉及一种用于译码视频数据的设备,所述设备包含:用于从第一视图识别第一时间位置中的视频数据的第一块的装置,其中所述第一块与第一视差运动向量相关联;用于确定与视频数据的第二块相关联的第二运动向量的运动向量预测符的装置,其中所述运动向量预测符是基于所述第一视差运动向量;其中当所述第二运动向量包含视差运动向量时,用于确定所述运动向量预测符的所述装置经配置以通过缩放所述第一视差运动向量以产生缩放的运动向量预测符而确定所述运动向量预测符,其中缩放所述第一视差运动向量包含将缩放因数应用于所述第一视差运动向量,所述缩放因数包含所述第二视差运动向量的视距除以所述第一运动向量的视距;以及用于基于所述缩放的运动向量预测符译码所述第二块的预测数据的装置。
在另一实例中,本发明的方面涉及一种存储有指令的计算机可读存储媒体,所述指令在执行时致使一个或一个以上处理器执行以下操作:从第一视图识别第一时间位置中的视频数据的第一块,其中所述第一块与第一视差运动向量相关联;确定与视频数据的第二块相关联的第二运动向量的运动向量预测符,其中所述运动向量预测符是基于所述第一视差运动向量;其中当所述第二运动向量包含视差运动向量时,所述指令致使所述一个或一个以上处理器通过缩放所述第一视差运动向量以产生缩放的运动向量预测符而确定所述运动向量预测符,其中缩放所述第一视差运动向量包含将缩放因数应用于所述第一视差运动向量,所述缩放因数包含所述第二视差运动向量的视距除以所述第一运动向量的视距;以及基于所述缩放的运动向量预测符译码所述第二块的预测数据。
在另一实例中,本发明的方面涉及一种译码视频数据的方法,所述方法包含:从第一视图识别第一时间位置中的视频数据的第一块,其中视频数据的所述第一块与第一时间运动向量相关联;当与视频数据的第二块相关联的第二运动向量包含时间运动向量且所述第二块来自第二视图时,基于所述第一时间运动向量确定所述第二运动向量的运动向量预测符;以及使用所述运动向量预测符译码所述第二块的预测数据。
在另一实例中,本发明的方面涉及一种用于译码视频数据的设备,所述设备包含一个或一个以上处理器,所述一个或一个以上处理器经配置以执行以下操作:从第一视图识别第一时间位置中的视频数据的第一块,其中视频数据的所述第一块与第一时间运动向量相关联;当与视频数据的第二块相关联的第二运动向量包含时间运动向量且所述第二块来自第二视图时,基于所述第一时间运动向量确定所述第二运动向量的运动向量预测符;以及使用所述运动向量预测符译码所述第二块的预测数据。
在另一实例中,本发明的方面涉及一种译码视频数据的设备,所述设备包含:用于从第一视图识别第一时间位置中的视频数据的第一块的装置,其中视频数据的所述第一块与第一时间运动向量相关联;用于在与视频数据的第二块相关联的第二运动向量包含时间运动向量且所述第二块来自第二视图时,基于所述第一时间运动向量确定所述第二运动向量的运动向量预测符的装置;以及用于使用所述运动向量预测符译码所述第二块的预测数据的装置。
在一实例中,本发明的方面涉及一种存储有指令的计算机可读存储媒体,所述指令在执行时致使一个或一个以上处理器执行以下操作:从第一视图识别第一时间位置中的视频数据的第一块,其中视频数据的所述第一块与第一时间运动向量相关联;当与视频数据的第二块相关联的第二运动向量包含时间运动向量且所述第二块来自第二视图时,基于所述第一时间运动向量确定所述第二运动向量的运动向量预测符;以及使用所述运动向量预测符译码所述第二块的预测数据。
在附图和下文的描述中阐述本发明的一个或一个以上方面的细节。本发明中所描述的技术的其它特征、目标和优点将从描述和图式以及从权利要求书显而易见。
附图说明
图1为说明可利用本发明中所描述的技术的实例视频编码和解码系统的方框图。
图2为说明可实施本发明中所描述的技术的实例视频编码器的方框图。
图3为说明可实施本发明中所描述的技术的实例视频解码器的方框图。
图4为说明实例多视图视频译码(MVC)预测模式的概念图。
图5为说明运动向量预测符候选者的实例位置的方框图。
图6为说明根据本发明的方面的产生和缩放运动向量预测符的概念图。
图7为说明根据本发明的方面的产生和缩放运动向量预测符的另一概念图。
图8为说明根据本发明的方面的产生和缩放运动向量预测符的另一概念图。
图9为说明译码视频数据的块的预测信息的实例方法的流程图。
图10为说明从处于与当前块不同的视图中的块产生运动向量预测符的概念图。
图11为说明从处于与当前块不同的视图中的块产生运动向量预测符的实例方法的流程图。
具体实施方式
根据某些视频译码系统,运动估计和运动补偿可用以减少视频序列中的时间冗余,以便实现数据压缩。在此状况下,可产生识别视频数据的预测性块(例如,来自另一视频图片或切片的块)的运动向量,其可用以预测正经译码的当前视频块的值。从当前视频块的值减去预测性视频块的值以产生残余数据的块。将运动信息(例如,运动向量、运动向量索引、预测方向或其它信息)连同残余数据从视频编码器传达到视频解码器。解码器可定位相同预测性块(基于运动向量),且通过组合残余数据与预测性块的数据而重构经编码的视频块。
在一些状况下,还应用运动向量的预测性译码以进一步减少传达运动向量所需的数据量。当建立运动向量时,从目标图片到参考图片来建立运动向量。可在空间上或时间上预测运动向量。空间上预测的运动向量与可用空间块(相同时间瞬时的块)相关联。时间上预测的运动向量与可用时间块(不同时间瞬时的块)相关联。在运动向量预测的状况下,编码器编码和传达相对于已知(或可知)运动向量的运动向量差(MVD),而非编码和传达运动向量自身。在H.264/AVC中,可通过所谓的运动向量预测符(MVP)来定义可供MVD使用以定义当前运动向量的已知运动向量。作为有效的MVP,运动向量必须指向与当前通过MVP和MVD译码的运动向量相同的图片。
视频译码器可建置运动向量预测符候选者列表,所述列表包括在空间和时间方向上的若干相邻块作为MVP的候选者。在此状况下,视频编码器可基于编码速率和失真的分析(例如,使用速率-失真成本分析或其它译码效率分析)而从候选者集合选择最准确的预测符。可将运动向量预测符索引(mvp_idx)发射到视频解码器以告知解码器在何处定位MVP。还传达MVD。解码器可组合MVD与MVP(其由运动向量预测符索引而定义)以便重构运动向量。
所谓的“合并模式”还可为可用的,其中正经译码的当前视频块继承相邻视频块的运动信息(例如,运动向量、参考图片索引、预测方向或其它信息)。索引值可用以识别相邻者,当前视频块从相邻者继承其运动信息。
多视图视频译码(MVC)为用于囊封多个视图的视频数据的视频译码标准。一般而言,每一视图对应于常见场景的对应视频数据被俘获所处的不同观点或角度。MVC提供元数据集合,即,视图的描述性数据(共同地和个别地)。
经译码视图可用于视频数据的三维(3D)显示。举例来说,可使用光的不同偏振而同时或接近同时显示两个视图(例如,人类观看者的左眼视图和右眼视图),且观看者可佩戴被动型偏光眼镜以使得观看者的眼睛中每一者接收到所述视图中的相应视图。或者,观看者可佩戴为每一眼睛独立地装设快门(shutter)的主动型眼镜,且显示器可与眼镜同步而在每一眼睛的图像之间迅速交替。
在MVC中,特定视图的特定图片被称作视图分量。即,视图的视图分量对应于视图的特定时间瞬时。通常,两个视图的相同或对应对象不位于同一地点。术语“视差向量”可用以指代指示视图的图片中的对象相对于不同视图中的对应对象的移位的向量。此向量还可被称作“移位向量”。视差向量还可适用于图片的视频数据的像素或块。举例来说,第一视图的图片中的像素可相对于第二视图的图片中的对应像素而移位与不同相机位置有关的特定视差,从所述相机位置俘获第一视图和第二视图。在一些实例中,视差可用以预测从视图到另一视图的运动向量。
在MVC的上下文中,一视图的图片可从另一视图的图片予以预测。举例来说,视频数据的块可相对于相同时间瞬时但不同视图的参考图片中的视频数据的块予以预测。在一实例中,当前正经译码的块可被称作“当前块”。从处于不同视图但处于相同时间瞬时的块预测当前块的运动向量称为“视差运动向量”。视差运动向量通常适用于一个以上视图可用的多视图视频译码的上下文中。根据本发明,视差运动向量的“视距”可指代参考图片的视图与目标图片的视图之间的平移差。即,可将视距表示为参考图片的视图识别符与目标图片的视图识别符之间的视图识别符差。
另一类型的运动向量为“时间运动向量”。在多视图视频译码的上下文中,时间运动向量指代从处于不同时间瞬时中但在相同视图内的块预测当前块的运动向量。根据本发明,时间运动向量的“时间距离”可指代从参考图片到目标图片的图片次序计数(pictureorder count,POC)距离。
本发明的某些技术针对使用与多视图设定中的视频数据的块相关联的运动信息(例如,运动向量、运动向量索引、预测方向或其它信息)以预测当前正经译码的块的运动信息。举例来说,根据本发明的方面,可添加从不同视图预测的运动向量作为用于当前块的运动向量预测的一个或一个以上运动向量列表的候选者。在一些实例中,视频译码器可使用与处于与当前正经译码的块不同的视图中的块相关联的视差运动向量,以预测当前块的运动向量,且可将经预测的视差运动向量添加到候选运动向量列表。在其它实例中,视频译码器可使用与处于与当前正经译码的块不同的视图中的块相关联的时间运动向量,以预测当前块的运动向量,且可将经预测的时间运动向量添加到候选运动向量列表。
根据本发明的方面,可在视差运动向量用作当前正经译码的块的运动向量预测符之前缩放所述视差运动向量。举例来说,如果视差运动向量识别具有与正经预测的当前运动向量相同的视图识别符的参考图片,且视差运动向量具有具与正经预测的当前运动向量相同的视图识别符的目标图片,则在视差运动向量用以预测当前块的运动向量之前可能不缩放所述视差运动向量。在其它例子中,可在视差运动向量用以预测当前块的运动向量之前缩放所述视差运动向量。
在另一实例中,可从与空间上相邻的块相关联的视差运动向量预测视差运动向量。在此实例中,如果视差运动向量的参考图片的视图识别符与待预测的运动向量(例如,与当前正经预测的块相关联的运动向量)的参考图片的视图识别符相同,则可能不需要缩放。否则,可基于用以俘获视频数据的相机的相机位置而缩放视差运动向量。即,例如,可根据视差运动向量的参考图片的视图识别符与所述运动向量的目标图片的视图识别符之间的差而缩放用于预测的视差运动向量。在一些实例中,可基于视图的平移而缩放视差运动向量的缩放。
在另一实例中,可从与时间上相邻的块相关联的视差运动向量预测视差运动向量。在此实例中,如果视差运动向量的参考图片的视图识别符与待预测的运动向量的参考图片的视图识别符相同,且视差运动向量的目标图片的视图识别符与待预测的运动向量的参考图片的视图识别符相同,则可能不需要缩放。否则,可基于视图识别符的差而缩放视差运动向量,如关于先前实例所描述。
关于时间运动向量预测,根据本发明的方面,目标图片在第一视图中的时间运动向量可用以预测目标图片在第二不同视图中的时间运动向量。在一些实例中,用于预测的时间运动向量的目标图片中的块与不同视图中的当前正经预测的块可位于同一地点。在其它实例中,归因于两个视图之间的视差,用于预测的时间运动向量的目标图片中的块可从当前块偏移。
在一些实例中,当从不同视图预测的运动向量为时间运动向量时,可基于图片次序计数(POC)距离的差而缩放所述运动向量。举例来说,根据本发明的方面,如果用于预测的时间运动向量的参考图片具有与正经预测的当前运动向量的参考图片相同的POC值,且用于预测的时间运动向量的目标图片具有与正经预测的当前运动向量的参考图片相同的POC值,则可能不缩放用于预测的运动向量。否则,仍可基于用于预测的运动向量的参考图片与当前正经预测的运动向量的参考图片之间POC值的差而缩放用于预测的运动向量。
根据本发明的一些方面,可将来自不同视图的时间和/或视差运动向量用作MVP候选者。举例来说,时间和/或视差运动向量可用以计算当前块的MVD。根据本发明的其它方面,可将来自不同视图的时间和/或视差运动向量用作合并候选者。举例来说,当前块可继承时间和/或视差运动向量。在这些实例中,索引值可用以识别相邻者,当前视频块从相邻者继承其运动信息。在任何情况下,可在来自不同视图的用作MVP或合并候选者的视差和/或时间运动向量用作MVP或合并候选者之前缩放所述视差和/或时间运动向量。
图1为说明可利用用于多视图译码中的运动向量预测的技术的实例视频编码和解码系统10的方框图。如图1中所展示,系统10包括源装置12,源装置12提供稍后待由目的地装置14解码的经编码的视频数据。具体来说,源装置12经由计算机可读媒体16而将视频数据提供到目的地装置14。源装置12和目的地装置14可包含广泛范围的装置中的任一者,包括桌上型计算机、笔记型(即,膝上型)计算机、平板型计算机、机顶盒、电话手持机(例如,所谓的“智能型”电话)、所谓的“智能型”平板设备(smart pad)、电视、相机、显示装置、数字媒体播放器、视频游戏控制台、视频串流装置,或其类似者。在一些状况下,源装置12和目的地装置14可为无线通信而装备。
目的地装置14可经由计算机可读媒体16接收待解码的经编码的视频数据。计算机可读媒体16可包含能够将经编码的视频数据从源装置12移到目的地装置14的任何类型的媒体或装置。在一实例中,计算机可读媒体16可包含用以使源装置12能够将经编码的视频数据直接实时发射到目的地装置14的通信媒体。
可根据通信标准(例如,无线通信协议)调制经编码的视频数据,且将经编码的视频数据发射到目的地装置14。通信媒体可包含任何无线或有线通信媒体,例如,射频(RF)频谱或一个或一个以上物理传输线。通信媒体可形成基于包的网络(例如,局域网络、广域网络或例如因特网的全球网络)的部分。通信媒体可包括路由器、交换器、基站,或可用以促进从源装置12到目的地装置14的通信的任何其它设备。
在一些实例中,可将经编码数据从输出接口22输出到存储装置。类似地,可通过输入接口从存储装置存取经编码数据。存储装置可包括多种分布式或本地存取式数据存储媒体中的任一者,例如,硬盘、蓝光光盘、DVD、CD-ROM、快闪存储器、易失性或非易失性存储器,或用于存储经编码的视频数据的任何其它合适的数字存储媒体。在另一实例中,存储装置可对应于文件服务器或可存储由源装置12产生的经编码视频的另一中间存储装置。
目的地装置14可经由串流传输或下载而从存储装置存取经存储的视频数据。文件服务器可为能够存储经编码的视频数据且将所述经编码的视频数据发射到目的地装置14的任何类型的服务器。实例文件服务器包括web服务器(例如,针对网站)、FTP服务器、网络附接存储(NAS)装置,或本地磁盘驱动器。目的地装置14可经由任何标准数据连接(包括因特网连接)而存取经编码的视频数据。此数据连接可包括适合于存取存储于文件服务器上的经编码的视频数据的无线信道(例如,Wi-Fi连接)、有线连接(例如,DSL、缆线调制解调器等),或两者的组合。经编码的视频数据从存储装置的传输可为串流传输、下载传输,或其组合。
本发明的技术未必限于无线应用或环境。所述技术可应用于支持例如以下应用的多种多媒体应用中的任一者的视频译码:无线电视广播、有线电视发射、卫星电视发射、例如HTTP动态自适应串流(DASH)的因特网串流视频发射、经编码到数据存储媒体上的数字视频、存储于数据存储媒体上的数字视频的解码,或其它应用。在一些实例中,系统10可经配置以支持单向或双向视频发射以支持例如视频串流传输、视频播放、视频广播和/或视频电话的应用。
在图1的实例中,源装置12包括视频源18、视频编码器20和输出接口22。目的地装置14包括输入接口28、视频解码器30和显示装置32。根据本发明,源装置12的视频编码器20可经配置以应用用于多视图译码中的运动向量预测的技术。在其它实例中,源装置和目的地装置可包括其它组件或布置。举例来说,源装置12可从外部视频源18(例如,外部相机)接收视频数据。同样地,目的地装置14可与外部显示装置介接,而非包括集成式显示装置。
图1的所说明的系统10仅为一实例。可通过任何数字视频编码和/或解码装置来执行多视图译码中的运动向量预测的技术。尽管本发明的技术一般是通过视频编码装置来执行,但所述技术还可通过视频编码器/解码器(通常被称作“编解码器(CODEC)”)来执行。此外,还可通过视频预处理器来执行本发明的技术。源装置12和目的地装置14仅为这些译码装置的实例,其中源装置12产生用于发射到目的地装置14的经编码的视频数据。在一些实例中,装置12、14可以实质上对称的方式操作,使得装置12、14中的每一者包括视频编码和解码组件。因此,系统10可支持视频装置12、14之间的单向或双向视频发射(例如)以用于视频串流传输、视频播放、视频广播或视频电话。
源装置12的视频源18可包括例如视频相机的视频俘获装置、含有先前俘获的视频的视频档案,和/或用以从视频内容提供者接收视频的视频馈入接口。作为另一替代例,视频源18可产生基于计算机图形的数据作为源视频,或产生实况视频、经存档视频和计算机产生的视频的组合。在一些状况下,如果视频源18为视频相机,则源装置12和目的地装置14可形成所谓的相机电话或视频电话。然而,如上文所提及,本发明中所描述的技术可一般适用于视频译码,且可应用于无线和/或有线应用。在每一状况下,可通过视频编码器20编码经俘获的视频、经预先俘获的视频或计算机产生的视频。可接着通过输出接口22将经编码的视频信息输出到计算机可读媒体16上。
计算机可读媒体16可包括暂时性媒体,例如,无线广播或有线网络传输;或存储媒体(即,非暂时性存储媒体),例如,硬盘、快闪驱动器、压缩光盘、数字视频光盘、蓝光光盘或其它计算机可读媒体。在一些实例中,网络服务器(图中未展示)可从源装置12接收经编码的视频数据,且(例如)经由网络发射将所述经编码的视频数据提供到目的地装置14。类似地,媒体生产设施(例如,光盘压印设施)的计算装置可从源装置12接收经编码的视频数据且产生含有所述经编码的视频数据的光盘。因此,在各种实例中,可将计算机可读媒体16理解成包括各种形式的一个或一个以上计算机可读媒体。
目的地装置14的输入接口28从计算机可读媒体16接收信息。计算机可读媒体16的信息可包括由视频编码器20定义的语法信息,所述语法信息还由视频解码器30使用且包括描述块和其它经译码单元(例如,GOP)的特性和/或处理的语法元素。显示装置32向用户显示经解码的视频数据,且可包含多种显示装置中的任一者,例如,阴极射线管(CRT)、液晶显示器(LCD)、等离子体显示器、有机发光二极管(OLED)显示器或另一类型的显示装置。
视频编码器20和视频解码器30可根据例如目前在开发中的高效率视频译码(HEVC)标准的视频译码标准而操作,且可符合HEVC测试模型(HM)。或者,视频编码器20和视频解码器30可根据例如ITU-T H.264标准或者被称作MPEG-4第10部分(高级视频译码(AVC)的其它专属或工业标准或这些标准的扩展而操作。然而,本发明的技术不限于任何特定译码标准。视频译码标准的其它实例包括MPEG-2和ITU-T H.263。尽管未在图1中展示,但在一些方面中,视频编码器20和视频解码器30可各自与音频编码器和解码器集成,且可包括适当的多路复用器-解多路复用器(MUX-DEMUX)单元或其它硬件和软件,以处置共同数据串流或若干单独数据串流中的音频和视频两者的编码。如果适用,则MUX-DEMUX单元可符合ITUH.223多路复用器协议或例如用户数据报协议(UDP)的其它协议。
ITU-T H.264/MPEG-4(AVC)标准是作为被称为联合视频小组(JVT)的集体合作的产品而由ITU-T视频译码专家群组(VCEG)与ISO/IEC动画专家组(MPEG)一起制定。在一些方面中,可将本发明中所描述的技术应用于大体上符合H.264标准的装置。H.264标准是由ITU-T研究小组在2005年3月描述于ITU-T国际标准H.264“用于通用视听服务的高级视频译码(Advanced Video Coding for generic audiovisual services)”中,所述标准可在本文中被称作H.264标准或H.264规范,或H.264/AVC标准或规范。联合视频小组(JVT)仍旧致力于对H.264/MPEG-4AVC的扩展。
JCT-VC致力于HEVC标准的开发。HEVC标准化努力是基于视频译码装置的演进模型,其被称作HEVC测试模型(HM)。HM假设视频译码装置相对于根据(例如)ITU-T H.264/AVC的现有装置的若干额外能力。举例来说,H.264提供九个帧内预测编码模式,而HM可提供多达三十三个帧内预测编码模式。
一般而言,HM的工作模型描述视频图片(或“帧”)可划分成包括明度样本和色度样本两者的树型块或最大译码单元(LCU)的序列。位流内的语法数据可定义LCU的大小,LCU为就像素数目而言的最大译码单元。切片包括按译码次序的数个连续树型块。图片可分割成一个或一个以上切片。每一树型块可根据四叉树而分裂成若干译码单元(CU)。一般而言,四叉树数据结构中每CU包括一个节点,其中根节点对应于树型块。如果CU分裂成四个子CU,则对应于CU的节点包括四个叶节点,其中每一者对应于子CU中的一者。
四叉树数据结构的每一节点可提供对应CU的语法数据。举例来说,四叉树中的节点可包括分裂旗标,其指示对应于节点的CU是否分裂成子CU。CU的语法元素可被递归地定义,且可取决于CU是否分裂成子CU。如果CU不进一步分裂,则其被称作叶CU。在本发明中,即使不存在原始叶CU的明确分裂,叶CU的四个子CU也将被称作叶CU。举例来说,如果16×16大小的CU不进一步分裂,则尽管16×16CU永不分裂,但四个8×8子CU还将被称作叶CU。
除了CU不具有大小区别之外,CU的意义类似于H.264标准的宏块的意义。举例来说,树型块可分裂成四个子代节点(还被称作子CU),且每一子代节点可又为父代节点并分裂成另外四个子代节点。最后未分裂的子代节点(被称作四叉树的叶节点)包含译码节点(还被称作叶CU)。与经译码的位流相关联的语法数据可定义树型块可分裂的最大次数(被称作最大CU深度),且还可定义译码节点的最小大小。因此,位流还可定义最小译码单元(SCU)。本发明使用术语“块”指代在HEVC的上下文中的CU、PU或TU中的任一者,或在其它标准的上下文中的类似数据结构(例如,在H.264/AVC中的宏块和子块)。
CU包括译码节点和与所述译码节点相关联的若干预测单元(PU)和变换单元(TU)。CU的大小对应于译码节点的大小,且形状必须为正方形。CU的大小的范围可从8×8像素直到具有最大64×64像素或大于64×64像素的树型块的大小。每一CU可含有一个或一个以上PU和一个或一个以上TU。与CU相关联的语法数据可描述(例如)CU到一个或一个以上PU的分割。分割模式可视CU是被跳过还是被直接模式编码、被帧内预测模式编码还是被帧间预测模式编码而不同。PU的形状可分割成非正方形。与CU相关联的语法数据还可描述(例如)CU根据四叉树到一个或一个以上TU的分割。TU的形状可为正方形或非正方形(例如,矩形)。
HEVC标准允许根据TU的变换,所述变换对于不同CU可不同。通常基于针对经分割LCU所定义的给定CU内的PU的大小而设定TU大小,但可能并非总是如此状况。TU通常具有与PU相同的大小,或小于PU。在一些实例中,可使用称为“残余四叉树”(RQT)的四叉树结构将对应于CU的残余样本再分成若干较小单元。RQT的叶节点可被称作变换单元(TU)。可变换与TU相关联的像素差值以产生可量化的变换系数。
叶CU可包括一个或一个以上预测单元(PU)。一般而言,PU表示对应于对应CU的全部或一部分的空间区域,且可包括用于检索PU的参考样本的数据。此外,PU包括与预测有关的数据。举例来说,当PU经帧内模式编码时,用于PU的数据可包括于残余四叉树(RQT)中,残余四叉树可包括描述对应于PU的TU的帧内预测模式的数据。作为另一实例,当PU经帧间模式编码时,PU可包括定义所述PU的一个或一个以上运动向量的数据。定义PU的运动向量的数据可描述(例如)运动向量的水平分量、运动向量的垂直分量、运动向量的分辨率(例如,四分之一像素精度或八分之一像素精度)、运动向量所指向的参考图片,和/或运动向量的参考图片列表(例如,列表0、列表1或列表C)。
具有一个或一个以上PU的叶CU还可包括一个或一个以上变换单元(TU)。可使用RQT(还被称作TU四叉树结构)指定变换单元,如上文所论述。举例来说,分裂旗标可指示叶CU是否分裂成四个变换单元。接着,每一变换单元可进一步分裂成其它子TU。当TU不进一步分裂时,其可被称作叶TU。一般而言,对于帧内译码,属于叶CU的所有叶TU共享相同帧内预测模式。即,一般应用相同帧内预测模式以计算叶CU的所有TU的预测值。对于帧内译码,视频编码器20可使用帧内预测模式计算每一叶TU的残余值,作为对应于TU的CU的部分与原始块之间的差。TU未必限于PU的大小。因此,TU可能大于或小于PU。对于帧内译码,PU可布置有相同CU的对应叶TU。在一些实例中,叶TU的最大大小可对应于对应叶CU的大小。
此外,叶CU的TU还可与被称作残余四叉树(RQT)的相应四叉树数据结构相关联。即,叶CU可包括指示叶CU如何分割成TU的四叉树。TU四叉树的根节点一般对应于叶CU,而CU四叉树的根节点一般对应于树型块(或LCU)。RQT的不分裂的TU被称作叶TU。一般而言,除非另外注释,否则本发明使用术语CU和TU以分别指代叶CU和叶TU。
视频序列通常包括一系列图片。如本文中所描述,“图片”和“帧”可互换地使用。即,含有视频数据的图片可被称作视频帧,或仅称作“帧”。图片群组(GOP)一般包含一系列视频图片中的一者或一者以上。GOP可在GOP的标头、图片中的一者或一者以上的标头中或在别处包括描述包括于GOP中的图片数目的语法数据。图片的每一切片可包括描述所述相应切片的编码模式的切片语法数据。视频编码器20通常对个别视频切片内的视频块进行操作,以便编码视频数据。视频块可对应于CU内的译码节点。视频块可具有固定或变化的大小,且可根据指定译码标准而具有不同大小。
作为一实例,HM支持以各种PU大小进行预测。假定特定CU的大小为2N×2N,则HM支持以2N×2N或N×N的PU大小进行帧内预测,以及以2N×2N、2N×N、N×2N或N×N的对称PU大小进行帧间预测。HM还支持以2N×nU、2N×nD、nL×2N和nR×2N的PU大小进行帧间预测的不对称分割。在不对称分割中,CU的一方向未分割,而另一方向分割成25%和75%。CU的对应于25%分割的部分由“n”继之以“上”、“下”、“左”或“右”的指示来指示。因此,例如,“2N×nU”指代在水平方向上以顶部2N×0.5N PU和底部2N×1.5N PU分割的2N×2N CU。
在本发明中,“N×N”与“N乘N”可互换地使用以指代视频块在垂直尺寸与水平尺寸方面的像素尺寸,例如,16×16像素或16乘16像素。一般而言,16×16块将在垂直方向上具有16个像素(y=16),且在水平方向上具有16个像素(x=16)。同样地,N×N块一般在垂直方向上具有N个像素,且在水平方向上具有N个像素,其中N表示非负整数值。可以行和列布置块中的像素。此外,块未必需要在水平方向上具有与垂直方向上相同数目个像素。举例来说,块可包含N×M个像素,其中M未必等于N。
在使用CU的PU进行帧内预测性或帧间预测性译码之后,视频编码器20可计算CU的TU的残余数据。PU可包含描述在空间域(还被称作像素域)中产生预测性像素数据的方法或模式的语法元素,且TU可包含在将(例如)离散余弦变换(DCT)、整数变换、小波变换或概念上类似的变换的变换应用于残余视频数据之后变换域中的系数。残余数据可对应于未经编码的图片的像素与对应于PU的预测值之间的像素差。视频编码器20可形成包括CU的残余数据的TU,且接着变换所述TU以产生CU的变换系数。
在应用任何变换以产生变换系数之后,视频编码器20可执行变换系数的量化。量化一般指代如下过程:将变换系数量化以可能地减少用以表示所述系数的数据的量,从而提供进一步压缩。量化过程可减小与所述系数中的一些或全部相关联的位深度。举例来说,n位值在量化期间可下舍入到m位值,其中n大于m。
在量化之后,视频编码器可扫描变换系数,从而从包括经量化的变换系数的二维矩阵产生一维向量。所述扫描可经设计以将较高能量(且因此较低频率)系数置于阵列前部,且将较低能量(且因此较高频率)系数置于阵列后部。在一些实例中,视频编码器20可利用预定义扫描次序来扫描经量化的变换系数,以产生可经熵编码的串行化向量。在其它实例中,视频编码器20可执行自适应扫描。在扫描经量化的变换系数以形成一维向量之后,视频编码器20可(例如)根据上下文自适应可变长度译码(CAVLC)、上下文自适应二进制算术译码(CABAC)、基于语法的上下文自适应二进制算术译码(SBAC)、概率区间分割熵(PIPE)译码或另一熵编码方法而熵编码所述一维向量。视频编码器20还可熵编码与经编码的视频数据相关联的语法元素以供视频解码器30用于解码视频数据。
为了执行CABAC,视频编码器20可将上下文模型内的上下文指派给待发射的符号。所述上下文可能涉及(例如)符号的相邻值是否为非零。为了执行CAVLC,视频编码器20可针对待发射的符号选择可变长度码。可将VLC中的码字建构成使得相对较短码对应于更有可能的符号,而较长码对应于较不可能的符号。以此方式,相较于(例如)针对待发射的每一符号使用相等长度的码字,使用VLC可实现位节省。概率确定可基于指派给符号的上下文而进行。
视频编码器20可进一步在(例如)图片标头、块标头、切片标头或GOP标头中将语法数据(例如,基于块的语法数据、基于图片的语法数据和基于GOP的语法数据)发送到视频解码器30。GOP语法数据可描述相应GOP中的图片数目,且图片语法数据可指示用以编码对应图片的编码/预测模式。
视频编码器20和视频解码器30各自可在适用时实施为例如以下各者的多种合适编码器或解码器电路中的任一者:一个或一个以上微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑电路、软件、硬件、固件或其任何组合。视频编码器20和视频解码器30中的每一者可包括于一个或一个以上编码器或解码器中,其中的任一者可集成为组合式视频编码器/解码器(CODEC)的部分。包括视频编码器20和/或视频解码器30的装置可包含集成电路、微处理器和/或无线通信装置(例如,蜂窝式电话)。
图2为说明可实施本发明中所描述的用于在多视图译码中预测运动向量的技术的实例视频编码器20的方框图。视频编码器20可执行视频切片内的视频块的帧内译码和帧间译码。帧内译码依赖于空间预测以减少或移除给定图片内的视频的空间冗余。帧间译码依赖于时间预测以减少或移除视频序列的邻近图片或各图片内的视频的时间冗余。帧内模式(I模式)可指代若干基于空间的压缩模式中的任一者。例如单向预测(P模式)或双向预测(B模式)的帧间模式可指代若干基于时间的压缩模式中的任一者。
如图2中所展示,视频编码器20接收待编码的视频数据。在图2的实例中,视频编码器20包括模式选择单元40、求和器50、变换处理单元52、量化单元54、熵编码单元56,和参考图片存储器64。模式选择单元40又包括运动估计单元42、运动补偿单元44、帧内预测单元46,和分割单元48。对于视频块重构,视频编码器20还包括反量化单元58、反变换单元60,和求和器62。还可包括解块滤波器(图2中未展示)以对块边界进行滤波,从而从经重构的视频移除块性效应假影。必要时,解块滤波器将通常对求和器62的输出进行滤波。除了解块滤波器以外,还可使用额外回路滤波器(回路内或回路后)。为简洁起见未展示这些滤波器,但这些滤波器必要时可对求和器50的输出进行滤波(作为回路内滤波器)。
在编码过程期间,视频编码器20接收待译码的图片或切片。可将图片或切片划分成多个视频块。运动估计单元42和运动补偿单元44执行所接收的视频块相对于一个或一个以上参考图片中的一个或一个以上块的帧间预测性译码,以提供时间压缩。或者,帧内预测单元46可执行所接收的视频块相对于处于与待译码的块相同的图片或切片中的一个或一个以上相邻块的帧内预测性译码,以提供空间压缩。视频编码器20可执行多个译码回合(例如)以选择用于视频数据的每一块的适当译码模式。
此外,分割单元48可基于先前译码回合中的先前分割方案的评估而将视频数据的块分割成若干子块。举例来说,分割单元48可最初基于速率-失真分析(例如,速率-失真优化)将一图片或切片分割成若干LCU,且将所述LCU中的每一者分割成若干子CU。模式选择单元40可进一步产生指示LCU到子CU的分割的四叉树数据结构。四叉树的叶节点CU可包括一个或一个以上PU和一个或一个以上TU。
模式选择单元40可(例如)基于误差结果而选择译码模式(帧内或帧间)中的一者,且将所得帧内或帧间译码的块提供到求和器50以产生残余块数据和提供到求和器62以重构经编码的块来用作参考图片。模式选择单元40还将例如运动向量、帧内模式指示符、分割信息和其它此类语法信息的语法元素提供到熵编码单元56。
可高度集成运动估计单元42、运动向量预测单元43与运动补偿单元44,但出于概念性目的而对所述单元单独加以说明。由运动估计单元42执行的运动估计为产生运动向量的过程,运动向量估计视频块的运动。举例来说,运动向量可指示当前图片内的视频块的PU相对于参考图片内的预测性块(或其它经译码单元)的移位,所述参考图片与当前图片内正经译码的当前块(或其它经译码单元)有关。
预测性块为依据像素差被发现与待译码的块紧密匹配的块,可通过绝对差和(SAD)、平方差和(SSD)或其它差量度来确定像素差。在一些实例中,视频编码器20可计算存储于参考图片存储器64(其还可被称作参考图片缓冲器)中的参考图片的分段整数(sub-integer)像素位置的值。举例来说,视频编码器20可内插参考图片的四分之一像素位置、八分之一像素位置或其它分率像素位置的值。因此,运动估计单元42可执行相对于全像素位置和分率像素位置的运动搜索,且以分率像素精度输出运动向量。
运动估计单元42通过比较帧间译码切片中的视频块的PU的位置与参考图片的预测性块的位置而计算所述PU的运动向量。因此,一般而言,运动向量的数据可包括参考图片列表、到参考图片列表中的索引(ref_idx)、水平分量,和垂直分量。参考图片可选自第一参考图片列表(列表0)、第二参考图片列表(列表1)或组合的参考图片列表(列表c),其中的每一者识别存储于参考图片存储器64中的一个或一个以上参考图片。
运动估计单元42可产生识别参考图片的预测性块的运动向量且将所述运动向量发送到熵编码单元56和运动补偿单元44。即,运动估计单元42可产生并发送识别以下各者的运动向量数据以在所识别的图片内定位预测性块:含有预测性块的参考图片列表、到识别预测性块的图片的参考图片列表中的索引,以及水平和垂直分量。
在一些实例中,运动向量预测单元43可预测运动向量以进一步减少传达运动向量所需的数据量,而非发送当前PU的实际运动向量。在此状况下,运动向量预测单元43可产生相对于已知(或可知)运动向量的运动向量差(MVD),而非编码和传达运动向量自身。可通过所谓的运动向量预测符(MVP)来定义可供MVD使用以定义当前运动向量的已知运动向量。一般而言,作为有效的MVP,用于预测的运动向量必须指向与当前正经译码的运动向量相同的参考图片。
在一些实例中,如下文关于图5更详细描述,运动向量预测单元43可建置运动向量预测符候选者列表,所述列表包括在空间和/或时间方向上的若干相邻块作为MVP的候选者。根据本发明的方面,如下文更详细描述,还可在不同视图的图片中(例如,在多视图译码中)识别运动向量预测符候选者。当多个运动向量预测符候选者可用(来自多个候选块)时,运动向量预测单元43可根据预定选择准则而确定当前块的运动向量预测符。举例来说,运动向量预测单元43可基于编码速率和失真的分析(例如,使用速率-失真成本分析或其它译码效率分析)而从候选者集合选择最准确的预测符。在其它实例中,运动向量预测单元43可产生运动向量预测符候选者的平均值。选择运动向量预测符的其它方法也是可能的。
在选择运动向量预测符时,运动向量预测单元43可确定运动向量预测符索引(mvp_flag),所述索引可用以告知视频解码器(例如,视频解码器30)在含有MVP候选块的参考图片列表中何处定位MVP。运动向量预测单元43还可确定当前块与选定MVP之间的MVD。MVP索引和MVD可用以重构运动向量。
在一些实例中,运动向量预测单元43可替代地实施所谓的“合并”模式,其中运动向量预测单元43可“合并”预测性视频块与当前视频块的运动信息(例如,运动向量、参考图片索引、预测方向或其它信息)。因此,关于合并模式,当前视频块从另一已知(或可知)视频块继承运动信息。运动向量预测单元43可建置合并模式候选者列表,所述列表包括在空间和/或时间方向上的若干相邻块作为合并模式的候选者。运动向量预测单元43可确定索引值(例如,merge_idx),所述索引值可用以告知视频解码器(例如,视频解码器30)在含有合并候选块的参考图片列表中何处定位合并视频块。
根据本发明的方面,运动向量预测单元43可在多视图译码中识别(例如)用于产生MVD或合并的运动向量预测符。举例来说,运动向量预测单元43可从处于与当前块不同的视图分量中的块识别视差运动向量以预测当前块的运动向量。在其它实例中,运动向量预测单元43可从处于与当前块不同的视图分量中的块识别时间运动向量以预测当前块的运动向量。
关于视差运动向量预测,运动向量预测单元43可从候选块识别视差运动向量候选者,以预测当前正经译码的视频块(被称作“当前块”)的运动向量。当前块可位于与候选块相同的图片中(例如,空间上与候选块相邻),或可位于与候选块相同的视图内的另一图片中。在一些实例中,运动向量预测单元43可识别指代处于与当前块的运动向量不同的视图中的参考图片的运动向量预测符。在这些例子中,根据本发明的技术,运动向量预测单元43可基于两个视图(例如,由运动向量预测符参考的视图,和由当前运动向量参考的视图)之间的相机位置差而缩放运动向量预测符。举例来说,运动向量预测单元43可根据两个视图之间的差而缩放视差运动向量预测符。在一些实例中,两个视图之间的差可通过与所述视图相关联的视图识别符(view_id)之间的差来表示。
关于时间运动向量预测,运动向量预测单元43可从处于与当前块不同的视图中的候选块识别时间运动向量候选者,以预测当前块的运动向量。举例来说,运动向量预测单元43可识别第一视图中的时间运动向量预测符候选者,其指代所述第一视图的另一时间位置处的图片中的块。根据本发明的方面,运动向量预测单元43可使用所识别的时间运动向量预测符候选者以预测与第二不同视图中的当前块相关联的运动向量。候选块(其包括运动向量预测符候选者)与当前块可位于同一地点。然而,归因于两个视图之间的视差,候选块的相对位置可从当前块偏移。
根据本发明的方面,运动向量预测单元43可产生MVP索引(mvp_flag)和MVD,或可产生合并索引(merge_idx)。举例来说,运动向量预测单元43可产生MVP或合并候选者的列表。根据本发明的方面,MVP和/或合并候选者包括位于与当前正经解码的视频块不同的视图中的一个或一个以上视频块。
由运动补偿单元44执行的运动补偿可涉及基于通过运动估计单元42所确定的运动向量和/或来自运动向量预测单元43的信息而取得或产生预测性块。此外,在一些实例中,运动估计单元42、运动向量预测单元43和运动补偿单元44可在功能上集成。在接收到当前视频块的PU的运动向量时,运动补偿单元44可将运动向量所指向的预测性块定位于参考图片列表中的一者中。
求和器50通过从正经译码的当前视频块的像素值减去预测性块的像素值从而形成像素差值来形成残余视频块,如下文所论述。一般而言,运动估计单元42执行相对于明度分量的运动估计,且运动补偿单元44针对色度分量和明度分量两者使用基于明度分量而计算的运动向量。模式选择单元40还可产生与视频块和视频切片相关联的语法元素以供视频解码器30用于解码视频切片的视频块。
作为由运动估计单元42和运动补偿单元44执行的帧间预测(如上文所描述)的替代,帧内预测单元46可帧内预测当前块。具体来说,帧内预测单元46可确定使用帧内预测模式以译码当前块。在一些实例中,帧内预测单元46可(例如)在单独编码回合期间使用各种帧内预测模式编码当前块,且帧内预测单元46(或在一些实例中,模式选择单元40)可从经测试模式选择将使用的适当帧内预测模式。
举例来说,帧内预测单元46可使用对各种经测试的帧内预测模式的速率-失真分析而计算速率-失真值,且在经测试模式当中选择具有最佳速率-失真特性的帧内预测模式。速率-失真分析一般确定经译码块与原始未经译码块之间的失真(或误差)的量以及用以产生经编码块的位率(即,位数目),所述原始未经编码块经编码以产生所述经编码块。帧内预测单元46可从失真和速率计算各种经编码块的比率以确定哪一帧内预测模式展现块的最佳速率-失真值。
在选择块的帧内预测模式之后,帧内预测单元46可将指示块的选定帧内预测模式的信息提供到熵编码单元56。熵编码单元56可编码指示选定帧内预测模式的信息。视频编码器20可在经发射的位流配置数据中包括各种块的编码上下文的定义和将用于所述上下文中的每一者的最有可能的帧内预测模式、帧内预测模式索引表和经修改的帧内预测模式索引表的指示,所述位流配置数据可包括多个帧内预测模式索引表和多个经修改的帧内预测模式索引表(还被称作码字映射表)。
视频编码器20通过从正经译码的原始视频块减去来自模式选择单元40的预测数据而形成残余视频块。求和器50表示执行此减法运算的(多个)组件。变换处理单元52将例如离散余弦变换(DCT)或概念上类似的变换的变换应用于残余块,从而产生包含残余变换系数值的视频块。变换处理单元52可执行概念上类似于DCT的其它变换。还可使用小波变换、整数变换、子频带变换或其它类型的变换。在任何状况下,变换处理单元52将变换应用于残余块,从而产生残余变换系数的块。所述变换可将残余信息从像素值域转换到变换域(例如,频域)。
变换处理单元52可将所得变换系数发送到量化单元54。量化单元54量化所述变换系数以进一步减小位率。量化过程可减小与所述系数中的一些或全部相关联的位深度。可通过调整量化参数而修改量化程度。在一些实例中,量化单元54可接着执行包括经量化的变换系数的矩阵的扫描。或者,熵编码单元56可执行所述扫描。
在量化之后,熵编码单元56熵译码经量化的变换系数。举例来说,熵编码单元56可执行上下文自适应可变长度译码(CAVLC)、上下文自适应二进制算术译码(CABAC)、基于语法的上下文自适应二进制算术译码(SBAC)、概率区间分割熵(PIPE)译码,或另一熵译码技术。在基于上下文的熵译码的状况下,上下文可基于相邻块。在通过熵编码单元56进行的熵译码之后,可将经译码的位串流传输到另一装置(例如,视频解码器30)或经存档以供稍后发射或检索。
反量化单元58和反变换单元60分别应用反量化和反变换,以在像素域中重构残余块(例如)供稍后用作参考块。运动补偿单元44可通过将残余块加到参考图片存储器64的图片中的一者的预测性块来计算参考块。运动补偿单元44还可将一个或一个以上内插滤波器应用于经重构的残余块以计算分段整数像素值以供用于运动估计中。求和器62将经重构的残余块加到由运动补偿单元44产生的运动补偿预测块,以产生经重构的视频块以供存储于参考图片存储器64中。经重构的视频块可由运动估计单元42和运动补偿单元44用作参考块以帧间译码后续图片中的块。
图3为说明可实施本发明中所描述的用于在多视图译码中预测运动向量的技术的实例视频解码器30的方框图。在图3的实例中,视频解码器30包括熵解码单元80、预测单元81、反量化单元86、反变换单元88、求和器90,和参考图片存储器92。预测单元81包括运动补偿单元82和帧内预测单元84。
在解码过程期间,视频解码器30从视频编码器20接收经编码的视频位流,所述串流表示经编码的视频切片的视频块和相关联的语法元素。视频解码器30的熵解码单元80熵解码所述位流以产生经量化的系数、运动向量和其它语法元素。熵解码单元80将运动向量和其它语法元素转递到预测单元81。视频解码器30可在视频切片层级和/或视频块层级处接收语法元素。
举例来说,通过背景技术,视频解码器30可接收为了经由网络发射而已压缩成所谓的“网络抽象层单元”或NAL单元的经压缩的视频数据。每一NAL单元可包括识别存储到所述NAL单元的数据的类型的标头。存在通常存储到NAL单元的两种类型的数据。存储到NAL单元的第一类型的数据为视频译码层(VCL)数据,其包括经压缩的视频数据。存储到NAL单元的第二类型的数据被称作非VCL数据,其包括例如定义为大量NAL单元所共有的标头数据的参数集和补充增强信息(SEI)的额外信息。
举例来说,参数集可含有序列层级标头信息(例如,在序列参数集(SPS))中和不频繁改变的图片层级标头信息(例如,在图片参数集(PPS))中。不需要针对每一序列或图片重复参数集中所含有的不频繁改变的信息,借此改进译码效率。另外,参数集的使用实现标头信息的频带外发射,借此避免为实现误差恢复的冗余发射的需要。
当视频切片经译码为帧内译码(I)切片时,预测单元81的帧内预测单元84可基于用信号发送的帧内预测模式和来自当前图片的先前经解码块的数据而产生当前视频切片的视频块的预测数据。当图片经译码为帧间译码(即,B、P或GPB)切片时,预测单元81的运动补偿单元82基于从熵解码单元80接收的运动向量和其它语法元素而产生当前视频切片的视频块的预测性块。可从参考图片列表中的一者内的参考图片中的一者产生预测性块。视频解码器30可基于存储于参考图片存储器92中的参考图片使用预设建构技术来建构参考图片列表:列表0和列表1。
运动补偿单元82通过解析运动向量和其它语法元素而确定当前视频切片的视频块的预测信息,且使用所述预测信息以产生正经解码的当前视频块的预测性块。举例来说,运动补偿单元82使用一些所接收的语法元素以确定用以译码视频切片的视频块的预测模式(例如,帧内预测或帧间预测)、帧间预测切片类型(例如,B切片、P切片或GPB切片)、切片的参考图片列表中的一者或一者以上的建构信息、切片的每一帧间编码视频块的运动向量、切片的每一帧间译码视频块的帧间预测状态,和用以解码当前视频切片中的视频块的其它信息。在一些实例中,运动补偿单元82可从运动向量预测单元83接收某些运动信息。
根据本发明的方面,运动向量预测单元83可接收指示在何处检索当前块的运动信息的预测数据。举例来说,运动向量预测单元83可接收例如MVP索引(mvp_flag)、MVD、合并旗标(merge_flag)和/或合并索引(merge_idx)的运动向量预测信息,且使用此信息以识别用以预测当前块的运动信息。即,如上文关于视频编码器20所提及,根据本发明的方面,运动向量预测单元83可接收MVP索引(mvp_flag)和MVD,且使用此信息以确定用以预测当前块的运动向量。运动向量预测单元83可产生MVP或合并候选者的列表。根据本发明的方面,MVP和/或合并候选者可包括位于与当前正经解码的视频块不同的视图中的一个或一个以上视频块。
运动向量预测单元83可使用MVP或合并索引以识别用以预测当前块的运动向量的运动信息。即,例如,运动向量预测单元83可使用MVP索引(mvp_flag)从参考图片的列表识别MVP。运动向量预测单元83可组合所识别的MVP与所接收的MVD以确定当前块的运动向量。在其它实例中,运动向量预测单元83可使用合并索引(merge_idx)从参考图片的列表识别合并候选者以确定当前块的运动信息。在任何情况下,在确定当前块的运动信息之后,运动向量预测单元83可产生当前块的预测性块。
根据本发明的方面,运动向量预测单元83可确定多视图译码中的运动向量预测符。举例来说,运动向量预测单元83可接收特定信息,所述信息指定来自处于与当前块不同的视图分量中的块的视差运动向量,所述视差运动向量用以预测当前块的运动向量。在其它实例中,运动向量预测单元83可接收特定信息,所述信息识别来自处于与当前块不同的视图分量中的块的时间运动向量,所述时间运动向量用以预测当前块的运动向量。
关于视差运动向量预测,运动向量预测单元83可从候选块预测当前块的视差运动向量。候选块可位于与当前块相同(例如,空间上与候选块相邻)的图片中,或可位于与当前块相同的视图内的另一图片中。候选块还可位于不同视图的图片中,但处于与当前块相同的时间瞬时。
举例来说,关于MVP或合并模式,待预测的当前块的视差运动向量“A”的目标图片和参考图片为已知的(先前经确定)。出于解释的目的,假定来自候选块的运动向量为“B”。根据本发明的方面,如果运动向量B不为视差运动向量,则运动向量预测单元83可认为候选块不可用(例如,不可用于预测运动向量A)。即,运动向量预测单元83可停用使用候选块以实现运动向量预测目的的能力。
如果运动向量B为视差运动向量且运动向量B的参考图片属于与视差运动向量A的参考图片的视图相同的视图,且运动向量B的目标图片属于与视差运动向量A的目标图片相同的视图,则运动向量预测单元83可使用运动向量B直接作为运动向量A的候选预测符。否则,在视差运动向量B可用作运动向量A的候选预测符之前,运动向量预测单元83可缩放视差运动向量B。在这些例子中,根据本发明的技术,运动向量预测单元83可基于运动向量A的视距和运动向量B的视距而缩放视差运动向量。举例来说,运动向量预测单元83可按特定缩放因数来缩放视差运动向量B,所述缩放因数等于运动向量A的视距除以运动向量B的视距。在一些实例中,运动向量预测单元83可使用参考图片和目标图片的视图识别符来执行此缩放。
关于时间运动向量预测,运动向量预测单元83可从处于与当前块的视图不同的视图中的候选块预测当前块的时间运动向量。举例来说,运动向量预测单元83可识别时间运动向量预测符候选者,其目标图片在第一视图中且指代所述第一视图的另一时间位置处的参考图片中的块。根据本发明的方面,运动向量预测单元83可使用所识别的时间运动向量预测符候选者以预测与第二不同视图中的当前块相关联的运动向量。
举例来说,关于MVP或合并模式,待预测的当前块的时间运动向量“A”的目标图片和参考图片为已知的(先前经确定)。出于解释的目的,假定来自候选块的运动向量为“B”。根据本发明的方面,如果来自候选块的运动向量B不为时间运动向量,则运动向量预测单元83可认为候选块不可用(例如,不可用于预测运动向量A)。即,在一些实例中,运动向量预测单元83可停用使用候选块以实现运动向量预测目的的能力。
如果运动向量B为时间运动向量,且运动向量B的参考图片的POC与运动向量A的参考图片相同,且运动向量B的目标图片的POC与运动向量B的目标图片相同,则运动向量预测单元83可使用运动向量B直接作为运动向量A的候选预测符。否则,运动向量预测单元83可基于时间距离缩放时间运动向量B。不同视图中的候选块(其包括运动向量预测符候选者)与当前块可位于同一地点。然而,归因于两个视图之间的视差,候选块的相对位置可从当前块偏移。
反量化单元86将位流中所提供且由熵解码单元80解码的经量化的变换系数反量化(即,解量化)。反量化过程可包括使用由视频编码器20针对视频切片中的每一视频块计算的量化参数,以确定量化程度和(同样)应应用的反量化的程度。
反变换单元88将反变换(例如,反DCT、反整数变换或概念上类似的反变换过程)应用于变换系数,以便在像素域中产生残余块。根据本发明的方面,反变换单元88可确定将变换应用于残余数据的方式。即,例如,反变换单元88可确定表示将变换(例如,DCT、整数变换、小波变换或一个或一个以上其它变换)应用于与所接收的视频数据的块相关联的残余明度样本和残余色度样本的方式的RQT。
在运动补偿单元82基于运动向量和其它语法元素产生当前视频块的预测性块之后,视频解码器30通过对来自反变换单元88的残余块与由运动补偿单元82产生的对应预测性块求和而形成经解码的视频块。求和器90表示执行此求和运算的(多个)组件。必要时,还可应用解块滤波器来对经解码的块进行滤波,以便移除块性效应假影。其它回路滤波器(译码回路中或译码回路后)还可用以使像素转变平滑,或以其它方式改进视频质量。接着将给定图片中的经解码的视频块存储于参考图片存储器92中,参考图片存储器92存储用于后续运动补偿的参考图片。参考图片存储器92还存储经解码的视频以用于稍后在显示装置(例如,图1的显示装置32)上呈现。
图4为说明实例MVC预测模式的概念图。在图4的实例中,说明八个视图,且针对每一视图说明十二个时间位置。一般而言,图4中的每一行对应于一视图,而每一列指示一时间位置。可使用视图识别符(“view_id”)来识别视图中的每一者,所述识别符可用以指示相对于其它视图的相对相机位置。在图4中所展示的实例中,将视图ID指示为“S0”到“S7”,但还可使用数字视图ID。另外,可使用指示图片的显示次序的图片次序计数(POC)值来识别时间位置中的每一者。在图4中所展示的实例中,将POC值指示为“T0”到“T11”。
尽管MVC具有可通过H.264/AVC解码器解码的所谓的基本视图且MVC可支持立体视图对,但MVC可支持两个以上视图作为3D视频输入。因此,具有MVC解码器的客户端的呈现器可预期具有多个视图的3D视频内容。
在图4中使用包括字母的着色块来指示图片,所述字母指定对应图片是经帧内译码(即,I帧)还是在一个方向上经帧间译码(即,作为P帧)或在多个方向上经帧间译码(即,作为B帧)。一般而言,用箭头指示预测,其中所指向(pointed-to)的图片将所指出(point-from)的对象用于预测参考。举例来说,从视图S0的处于时间位置T0的I帧来预测视图S2的处于时间位置T0的P帧。
如同单视图视频编码,可关于处于不同时间位置的图片预测性地编码多视图视频序列的图片。举例来说,视图S0的处于时间位置T1的b帧具有从视图S0的处于时间位置T0的I帧指向其的箭头,从而指示从I帧预测所述b帧。然而,另外,在多视图视频编码的上下文中,可以视图间的方式预测图片。即,视图分量可将其它视图中的视图分量用于参考。举例来说,在MVC中,实现视图间预测,就好像另一视图中的视图分量为帧间预测参考一样。在序列参数集(SPS)MVC扩展中用信号发送可能的视图间参考,且可通过参考图片列表建构过程来修改可能的视图间参考,此举实现帧间预测或视图间预测参考的灵活排序。
图4提供视图间预测的各种实例。在图4的实例中,将视图S1的图片说明为从视图S1的处于不同时间位置处的图片而预测,以及从视图S0与S2的处于相同时间位置的图片的图片而视图间预测。举例来说,从视图S1的处于时间位置T0与T2的B帧中的每一者以及视图S0与S2的处于时间位置T1的b帧预测视图S1的处于时间位置T1的b帧。
在图4的实例中,大写字母“B”和小写字母“b”意欲指示图片之间的不同阶层关系而非不同编码方法。一般而言,相比于小写字母“b”帧,大写字母“B”帧在预测阶层中相对较高。图4还使用不同程度的着色来说明预测阶层的变化,其中相比于具有较少着色(即,相对较浅)的那些图片,较大量的着色(即,相对较深)图片在预测阶层中较高。举例来说,以完全着色来说明图4中的所有I帧,而P帧具有稍微较浅的着色,且B帧(和小写字母b帧)具有相对于彼此的各种程度的着色,但始终浅于P帧和I帧的着色。
一般而言,预测阶层与视图次序索引有关,这是因为应在解码在预测阶层中相对较低的图片之前解码在所述阶层中相对较高的图片,以使得在所述阶层中相对较高的那些图片可在解码在所述阶层中相对较低的图片期间用作参考图片。视图次序索引为指示存取单元中的视图分量的解码次序的索引。可在参数集(例如,SPS)中暗示视图次序索引。
以此方式,用作参考图片的图片可在解码参考所述参考图片而编码的图片之前予以解码。视图次序索引为指示存取单元中的视图分量的解码次序的索引。对于每一视图次序索引i,用信号发送对应view_id。视图分量的解码遵循视图次序索引的升序。如果呈现所有视图,则视图次序索引的集合包含从零到比视图的总数小一的经连续排序的集合。
在MVC中,可提取整个位流的子集以形成仍符合MVC的子位流。存在特定应用基于(例如)以下各项而可能需要的许多可能的子位流:由服务器提供的服务、一个或一个以上客户端的解码器的容量、支持和能力,和/或一个或一个以上客户端的偏好。举例来说,客户端可能仅需要三个视图,且可能存在两种情况。在一实例中,一个客户端可能需要平滑观看体验且可偏好具有view_id值S0、S1和S2的视图,而另一其它客户端可能需要视图可缩放性且偏好具有view_id值S0、S2和S4的视图。注意,可将这些两个子位流解码为独立MVC位流,且可同时支持这些两个子位流。
图5为说明当执行运动向量预测(包括合并模式)时的可能的运动向量预测符候选者的方框图。即,对于当前正经译码的块100,来自相邻块A0、A1、B0、B1和B2的运动信息(例如,包含水平分量和垂直分量的运动向量、运动向量索引、预测方向或其它信息)可用以预测块100的运动信息。另外,与位于同一地点的块COL相关联的运动信息还可用以预测块100的运动信息。在运动向量预测的上下文中,相邻块A0、A1、B0、B1和B2以及位于同一地点的块COL可大体上在下文被称作运动向量预测符候选者。
在一些实例中,可在执行运动向量预测(例如,不管是产生MVD还是执行合并模式)时识别图5中所展示的运动向量预测符候选者。在其它实例中,可在执行合并模式和运动向量预测时识别不同候选者。即,视频译码器可识别用于执行合并模式的运动向量预测符候选者的集合,所述集合与用于执行运动向量预测的运动向量预测符候选者的集合不同。
为了执行合并模式,在一实例中,视频编码器(例如,视频编码器20)可最初确定来自运动向量预测符候选者的哪些运动向量可用于与块100合并。即,在一些例子中,归因于(例如)运动向量预测符候选者中的一者或一者以上正经帧内译码、尚未经译码或不存在(例如,运动向量预测符候选者中的一者或一者以上位于另一图片或切片中),可使运动向量预测符候选者的运动信息不可用。视频编码器20可建构包括可用运动向量预测符候选块中的每一者的运动向量预测符候选者列表。
在建构候选者列表之后,视频编码器20可从所述候选者列表选择运动向量以用作当前块100的运动向量。在一些实例中,视频编码器20可从候选者列表选择与块100的运动向量最佳匹配的运动向量。即,视频编码器20可根据速率失真分析从候选者列表选择运动向量。
视频编码器20可提供块100是使用合并模式予以编码的指示。举例来说,视频编码器20可设定指示块100的运动向量是使用合并模式予以预测的旗标或其它语法元素。在一实例中,视频编码器20可指示:块100的帧间预测参数是通过设定merge_flag[x0][y0]而从运动向量预测符候选者推断出。在此实例中,阵列索引x0、y0可指定预测块的左上方明度样本相对于图片(或切片)的左上方明度样本的位置(x0,y0)。
另外,在一些实例中,视频编码器20可提供识别特定合并候选者的索引,块100从所述合并候选者继承其运动向量。举例来说,merge_idx[x0][y0]可指定合并候选者索引,合并候选者索引识别合并候选者列表中的图片,且其中x0、y0指定预测块的左上方明度样本相对于图片(或切片)的左上方明度样本的位置(x0,y0)。
视频解码器(例如,视频解码器30)可在解码块100时执行类似步骤以识别适当合并候选者。举例来说,视频解码器30可接收块100是使用合并模式予以预测的指示。在一实例中,视频解码器30可接收merge_flag[x0][y0],其中(x0,y0)指定预测块的左上方明度样本相对于图片(或切片)的左上方明度样本的位置。
另外,视频解码器30可建构合并候选者列表。举例来说,视频解码器30可接收指示可用于运动向量预测的视频块的一个或一个以上语法元素(例如,旗标)。视频解码器30可基于所接收的旗标而建构合并候选者列表。根据一些实例,视频解码器30可根据以下序列建构合并候选者列表(例如,mergeCandList):
1.A1,如果availableFlagA1等于1
2.B1,如果availableFlagB1等于1
3.B0,如果availableFlagB0等于1
4.A0,如果availableFlagA0等于1
5.B2,如果availableFlagB2等于1
6.Col,如果availableFlagCol等于1
如果若干合并候选者具有相同运动向量和相同参考索引,则可从列表移除所述合并候选者。
视频解码器30可根据所接收的索引识别适当合并候选者。举例来说,视频解码器30可接收识别特定合并候选者的索引,块100从所述合并候选者继承其运动向量。在一实例中,merge_idx[x0][y0]可指定合并候选者索引,合并候选者索引识别合并候选者列表中的图片,且其中x0、y0指定预测块的左上方明度样本相对于图片(或切片)的左上方明度样本的位置(x0,y0)。
在一些实例中,视频解码器30可在使候选块的运动信息与块100合并之前缩放运动向量预测符。举例来说,关于时间运动向量预测符,如果所述运动向量预测符指代参考图片中的特定预测性块,则视频解码器30可缩放所述运动向量预测符,所述预测性块位于与由块100(例如,块100的实际运动向量)所指代的预测性块不同的时间位置中。举例来说,视频解码器30可缩放运动向量预测符,使得其指代与块100的参考图片相同的参考图片。在一些实例中,视频解码器30可根据图片次序计数(POC)值的差而缩放运动向量预测符。即,视频解码器30可基于以下两者的差而缩放运动向量预测符:候选块与由运动向量预测符所指代的预测性块之间的POC距离,和块100与当前参考图片(例如,由块100的实际运动向量所指代)之间的POC距离。在选择适当运动向量预测符之后,视频解码器30可将与运动向量预测符相关联的运动信息与块100的运动信息合并。
可通过视频编码器20和视频解码器30实施类似过程以执行视频数据的当前块的运动向量预测。举例来说,视频编码器20可最初确定来自运动向量预测符候选者的哪些运动向量可用作MVP。归因于(例如)运动向量预测符候选者中的一者或一者以上正经帧内译码、尚未经译码或不存在,来自所述运动向量预测符候选者的运动信息可能不可用。
为了确定哪些运动向量预测符候选者可用,视频编码器20可又根据基于优先权的预定方案而分析运动向量预测符候选者中的每一者。举例来说,对于每一运动向量预测符候选者,视频编码器20可确定运动向量预测符是否指代与块100的实际运动向量相同的参考图片。如果运动向量预测符指代相同参考图片,则视频编码器20可将所述运动向量预测符候选者添加到MVP候选者列表。如果运动向量预测符不指代相同参考图片,则可在将运动向量预测符添加到MVP候选者列表之前缩放所述运动向量预测符(例如,基于POC距离而缩放,如上文所论述)。
关于位于同一地点的块COL,如果所述位于同一地点的块包括一个以上运动向量预测符(例如,COL被预测为B帧),则视频编码器20可根据当前列表和当前参考图片(针对块100)选择时间运动向量预测符中的一者。视频编码器20可接着将选定时间运动向量预测符添加到运动向量预测符候选者列表。
视频编码器20可用信号发送如下信息:通过设定enable_temporal_mvp_flag而使一个或一个以上运动向量预测符可用。在建置候选者列表之后,视频编码器20可从候选者选择待用作块100的运动向量预测符的运动向量。在一些实例中,视频编码器20可根据速率失真分析选择候选运动向量。
视频编码器20可使用识别候选者列表中的MVP的MVP索引(mvp_flag)而用信号发送选定运动向量预测符。举例来说,视频编码器20可设定mvp_l0_flag[x0][y0]以指定列表0的运动向量预测符索引,其中x0、y0指定候选块的左上方明度样本相对于图片的左上方明度样本的位置(x0,y0)。在另一实例中,视频编码器20可设定mvp_l1_flag[x0][y0]以指定列表1的运动向量预测符索引,其中x0、y0指定候选块的左上方明度样本相对于图片的左上方明度样本的位置(x0,y0)。在又一实例中,视频编码器20可设定mvp_lc_flag[x0][y0]以指定列表c的运动向量预测符索引,其中x0、y0指定候选块的左上方明度样本相对于图片的左上方明度样本的位置(x0,y0)。
视频编码器20还可产生运动向量差值(MVD)。MVD可构成选定运动向量预测符与块100的实际运动向量之间的差。视频编码器20可用信号随MVP索引发送MVD。
视频解码器30可使用运动向量预测符执行类似操作以确定当前块的运动向量。举例来说,视频解码器30可在参数集(例如,图片参数集(PPS))中接收指示针对一个或一个以上图片启用运动向量预测的指示。即,在一实例中,视频解码器30可在PPS中接收enable_temporal_mvp_flag。当特定图片参考具有等于零的enable_temporal_mvp_flag的PPS时,参考图片存储器中的参考图片可被标记为“未用于时间运动向量预测”。
如果实施运动向量预测,则在接收块100后,视频解码器30可即刻建构MVP候选者列表。视频解码器30可使用上文关于视频编码器20所论述的相同方案以建构MVP候选者列表。在一些例子中,视频解码器30可执行类似于上文关于视频编码器20所描述的运动向量缩放的运动向量缩放。举例来说,如果运动向量预测符不指代与块100相同的参考图片,则可在将运动向量预测符添加到MVP候选者列表之前缩放所述运动向量预测符(例如,基于POC距离而缩放,如上文所论述)。视频解码器30可使用识别候选者列表中的MVP的所接收的MVP索引(mvp_flag)而识别块100的适当运动向量预测符。视频解码器30可接着使用MVP和所接收的MVD产生块100的运动向量。
图5大体上说明单视图中的合并模式和运动向量预测。应理解,图5中所展示的运动向量预测符候选块仅出于实例的目的而提供,为实现预测运动信息的目的,可使用更多、更少或不同块。根据本发明的方面,如下文所描述,当译码一个以上视图时(例如,在MVC中),还可应用合并模式和运动向量预测。在这些例子中,运动向量预测符和预测性块可位于与块100不同的视图中。
图6为说明在多视图译码中产生和缩放运动向量预测符的概念图。举例来说,根据本发明的方面,视频译码器(例如,视频编码器20或视频解码器30)可缩放来自视差运动向量预测符候选块122(“候选块”)的视差运动向量120(mv),以产生当前块126的运动向量预测符124(mv')。虽然图6涉及视频解码器30予以描述,但应理解,可通过多种其它视频译码器实施本发明的技术,其它视频编码器包括其它处理器、处理单元、例如编码器/解码器(CODEC)的基于硬件的译码单元,和其类似者。
在图6的实例中,在视图分量2(view_id 2)中,候选块122在空间上与当前块126相邻。候选块122经帧间预测,且包括指代(或“指向”)视图分量0(view_id 0)中的预测性块的运动向量120。举例来说,运动向量120的目标图片在视图2(view_id 2)中且其参考图片在视图0(view_id 0)中。当前块126还经帧间预测,且包括指代视图分量1(view_id 1)中的预测性块的实际运动向量(图中未展示)。即,例如,当前块126的实际运动向量的目标图片在视图2(view_id 2)中且其参考块在视图1(view_id 1)中。
根据本发明的方面,视频解码器30可使用运动向量120的缩放的版本来产生当前块126的运动向量预测符124。举例来说,视频解码器30可基于运动向量120与当前块126的实际运动向量之间的视距差而缩放运动向量120。即,视频解码器30可基于以下两者之间的差而缩放运动向量120:用以俘获候选块122的预测性块(在参考图片中)的相机的相机位置,和用以俘获当前块126的预测性块(在参考图片中)的相机的相机位置。因此,视频解码器30可根据以下两者之间的差而缩放视差运动向量120(例如,用于预测的运动向量):由候选块122的运动向量120所指代的视图分量,和由当前块126的实际运动向量所指代的视图分量。
在一实例中,视频解码器30可根据以下所展示的等式(1)来产生当前块的缩放的运动向量预测符:
其中ViewDistance(mv)等于运动向量120的参考图片的视图ID(例如,ViewId(RefPic(mv))与运动向量120的目标图片的视图ID(例如,ViewId(TargetPic(mv))之间的差,且ViewDistance(mv')等于运动向量预测符124的参考图片的视图ID(例如,ViewId(RefPic(mv'))与运动向量预测符124的目标图片的视图ID(例如,ViewId(TargetPic(mv'))之间的差。因此,在此实例中,运动向量预测符124的参考图片RefPic(mv')属于新目标视图,且运动向量预测符124的目标图片TargetPic(mv')属于当前视图。类似地,运动向量120的参考图片RefPic(mv)属于候选运动向量所指向的视图,且运动向量120的目标图片TargetPic(mv)属于当前视图。因此,视频解码器30可根据以下等式(2)来产生缩放的运动向量预测符:
其中mv'表示当前块的缩放的运动向量预测符,mv表示候选块的运动向量,ViewID(新目标)为由当前块的实际运动向量所指代的视图分量,ViewID(当前)为当前块的视图分量,且ViewID(候选)为候选块的视图分量。
在将等式(2)应用于图6中的实例的情况下,mv'表示当前块126的缩放的运动向量预测符,mv表示运动向量120,ViewID(新目标)为由运动向量124所指代的视图分量,ViewID(当前)为当前块126的视图分量,且ViewID(候选)为候选块122的视图分量。因此,在图4中所展示的实例中,运动向量预测符124为缩放到一半的运动向量120(例如,即,视频解码器30可将运动向量120的水平移位分量和垂直移位分量两者缩放到一半,从而产生当前块126的运动向量预测符124。
可执行关于图6所描述的运动向量缩放以用于合并和运动向量预测两者。即,例如,视频解码器30可在使运动向量120与当前块126的运动信息合并之前缩放运动向量120。在另一实例中,视频解码器30可在根据运动向量预测符124与当前块126的实际运动向量之间的差来计算运动向量差值(MVD)之前缩放运动向量120。
如图6的实例中所展示,候选块122和当前块126可位于同一视图分量中。然而,在其它实例中,如关于图7和图8更详细描述,候选块可位于与当前块不同的视图分量中。
图7为说明产生和缩放运动向量预测符的另一概念图。举例来说,根据本发明的方面,视频译码器(例如,视频编码器20或视频解码器30)可缩放来自视差运动向量预测符候选块132(x',y')的视差运动向量130(mv),以产生当前块136(x,y)的运动向量预测符134(mv'),其中候选块132属于与当前块136不同的视图分量。因此,关于图7所展示并描述的过程可一般被称作视图间视差运动向量预测。虽然关于视频解码器30来描述图7,但应理解,可通过多种其它视频译码器实施本发明的技术,其它视频编码器包括其它处理器、处理单元、例如编码器/解码器(CODEC)的基于硬件的译码单元,和其类似者。
在图7中所展示的实例中,候选块132位于视图分量1(view_id 1)中。候选块132经帧间预测,且包括指代视图分量0(view_id 0)中的预测性块的运动向量130(mv)。举例来说,运动向量130的目标图片在视图1(view_id 1)中且其参考图片在视图0(view_id 0)中。当前块136与候选块132位于同一地点,且位于视图分量2(view_id 2)中。如下文更详细描述,在一些实例中,当前块136可包括识别第一参考视图(view_id 1)中的块的实际运动向量(图中未展示)。即,例如,当前块136的实际运动向量的目标图片在视图2(view_id 2)中且其参考块可在视图1(view_id 1)中。在其它实例中,当前块可包括识别第二参考视图(view_id 0)中的块的实际运动向量。即,例如,当前块136的实际运动向量的目标图片在视图2(view_id 2)中且其参考块可在视图0(view_id 0)中。因此,运动向量预测符134(mv')可指代第一参考视图(view_id 1)中的块。在另一实例中,第二运动向量预测符138(mv”)可指代第二参考视图(view_id 0)中的块。
在一些实例中,第二运动向量预测符138可能不可用于实现运动向量预测的目的。举例来说,如果第二参考视图中的预测性块可用于直接视图间预测,则可仅产生第二运动向量预测符138。可(例如)在与当前块136相关联的参数集(例如,序列参数集(SPS)或图片参数集(PPS))或切片标头中指定第二参考视图中的预测性块的可用性。
根据本发明的方面,视频解码器可使用合并模式或使用运动向量预测来执行视图间视差运动向量预测。关于合并模式,视频解码器30可最初选择当前块136的“目标视图”。一般而言,目标视图包括当前块136的预测性块。在一些实例中,目标视图可为第一参考视图(在图7中被展示为view_id 1)。在其它实例中,目标视图可为第二参考视图(在图7中被展示为view_id 0)。然而,如上文所提及,在一些实例中,如果第二参考视图中的预测性块可用于实现视图间预测的目的,则第二参考视图可仅用作目标视图。
在一些实例中,视频解码器30可选择第一参考视图作为目标视图。在其它实例中,视频解码器30可选择第二参考视图(在可用时)作为目标视图。可(例如)基于预测性块的可用性和/或预定选择算法来确定目标视图的选择。当前块136的参考索引(ref_idx)对应于目标视图的含有预测性块的图片的索引,将所述图片添加到当前块136的参考图片列表。
在选择目标视图之后,视频解码器30可定位候选块132。在一实例中,出于说明的目的,假定当前块136的左上方明度样本在图片(或切片)中位于坐标(x,y)处。视频解码器30可确定在视图分量1中候选块132的位于同一地点坐标。另外,在一些实例中,视频解码器30可基于当前块136的视图分量(视图分量2)与候选块132的视图分量(视图分量1)之间的视差而调整坐标。因此,视频解码器30可将候选块132的坐标确定为(x',y'),其中(x',y',)=(x,y)+视差。在一些实例中,视差可包括于SPS、PPS、切片标头、CU语法和/或PU语法中,和/或在SPS、PPS、切片标头、CU语法和/或PU语法中进行计算。
在定位候选块132之后,视频解码器30可基于运动向量130与当前块136的实际运动向量之间的视距差而缩放候选块132的运动向量130。即,视频解码器30可基于以下两者之间的差而缩放运动向量130:用以俘获候选块132的预测性块的相机的相机位置,和用以俘获当前块136的预测性块(例如,目标视图中的预测性块)的相机的相机位置。即,视频解码器30可根据以下两者之间的差而缩放视差运动向量130(例如,用于预测的运动向量):由候选块132的运动向量130所指代的视图分量,和目标视图的视图分量。
在一实例中,视频解码器30可根据以下所展示的等式(3)来产生当前块的缩放的运动向量预测符:
其中mv'表示当前块的缩放的运动向量预测符,mv表示候选块的运动向量,ViewID(目标)为选定目标视图的视图分量,ViewID(当前)为当前块的视图分量,且ViewID(第二参考)为第二参考视图(如果可用)的视图分量,且ViewID(参考)为第一参考视图的视图分量。在一些实例中,ViewID(目标)减去ViewID(当前)可被称作运动向量预测符134的视距,而ViewID(第二参考)减去ViewID(参考)可被称作运动向量130的视距。即,运动向量预测符134的视距为运动向量预测符134的目标图片(view_id 1)与参考图片(view_id 2)之间的差,而运动向量130的视距为运动向量130的目标图片(view_id 0)与参考图片(view_id 1)之间的差。
在将等式(3)应用于图7中的实例的情况下,mv'表示缩放的运动向量预测符134或缩放的运动向量预测符138,此取决于选择哪一视图分量用于目标视图。举例来说,如果选择第一参考视图(view_id 1)作为目标视图,则mv'表示缩放的运动向量预测符134,mv表示运动向量130,ViewID(目标)为由运动向量预测符134所指代的视图分量,ViewID(当前)为当前块136的视图分量,ViewID(第二参考)为第二参考视图(view_id 0)的视图分量,且ViewID(参考)为第一参考视图(view_id 1)的视图分量。因此,在图7中所展示的实例中,运动向量预测符134为缩放到一倍的运动向量130(例如,)。即,运动向量130的水平移位分量和垂直移位分量可与运动向量预测符134的水平移位分量和垂直移位分量相同。
或者,如果选择第二参考视图(view_id 0)用于目标视图,则mv'表示缩放的运动向量预测符138,mv表示运动向量130,ViewID(目标)为由运动向量预测符138所指代的视图分量,ViewID(当前)为当前块136的视图分量,ViewID(第二参考)为第二参考视图(view_id0)的视图分量,且ViewID(参考)为第一参考视图(view_id 1)的视图分量。因此,在图7中所展示的实例中,运动向量预测符138为缩放到两倍的运动向量130(例如,即,视频解码器30可将运动向量130的水平移位分量和垂直移位分量两者缩放到两倍,从而产生当前块136的运动向量预测符138。
根据本发明的方面,视频解码器30可在执行运动向量预测(例如,产生MVP)时执行类似步骤。举例来说,视频解码器30可选择目标视图,所述目标视图可为第一参考视图(view_id 1)或第二参考视图(view_id 0)。然而,如果含有当前块的预测性块的视图分量的参考图片不可用于实现视图间预测的目,则不可使用对应预测符。因此,可(例如)基于预测性块的可用性和/或预定选择算法来确定目标视图的选择。
如果当前块136的预测性块在第一参考视图(view_id 1)或第二参考视图(view_id 0)中不可用于直接视图间预测,则视频解码器30不可执行运动向量预测。如果至少一个预测性块可用,则视频解码器30可选择包括与当前块136的实际运动向量相关联的预测性块的参考视图。
在选择目标视图之后,视频解码器30可接着重复上文关于合并模式所描述的步骤。举例来说,视频解码器30可定位候选块132。即,视频解码器30可确定在视图分量1中候选块132的位于同一地点坐标。另外,在一些实例中,视频解码器30可基于当前块136的视图分量(视图分量2)与候选块132的视图分量(视图分量1)之间的视差而调整坐标。
另外,在定位候选块132之后,视频解码器30可基于以下两者之间的差而缩放候选块132的运动向量130:用以俘获候选块132的预测性块的相机的相机位置,和用以俘获当前块136的预测性块(例如,目标视图中的预测性块)的相机的相机位置。即,视频解码器30可根据以下两者之间的差而缩放视差运动向量130(例如,用于预测的运动向量):通过候选块132的运动向量130所指代的视图分量,和目标视图的视图分量。在一些实例中,视频解码器30可使用上文的等式(2)执行运动向量预测符缩放。在其它实例中,如下文关于图8所描述,运动向量预测符缩放可扩展到其它视图。
视频解码器30可在执行合并模式和/或运动向量预测(例如,关于上文的图5所描述)时将候选块132添加到候选者列表。根据本发明的方面,可以多种方式将候选块添加到运动向量预测符候选者列表(例如,对于合并模式或通过MVP的运动向量预测)。举例来说,视频解码器30可通过根据以下方案定位合并模式候选者来建构候选者列表:
1.A1,如果availableFlagA1等于1
2.V,如果availableFlagV等于1
3.B1,如果availableFlagB1等于1
4.B0,如果availableFlagB0等于1
5.A0,如果availableFlagA0等于1
6.B2,如果availableFlagB2等于1
7.Col,如果availableFlagCol等于1
其中V表示候选块132。在其它实例中,可定位候选块132且将所述候选块132添加到候选者列表处于候选者列表的任何其它位置中。
图8为说明根据本发明的方面的产生和缩放运动向量预测符的另一概念图。举例来说,根据本发明的方面,视频译码器(例如,视频编码器20或视频解码器30)可缩放来自视差运动向量预测符候选块142的视差运动向量140(mv),以产生当前块146的运动向量预测符144(mv'),其中候选块142属于与当前块146不同的视图分量。虽然关于视频解码器30来描述图8,但应理解,可通过多种其它视频编码器实施本发明的技术,其它视频译码器包括其它处理器、处理单元、例如编码器/解码器(CODEC)的基于硬件的译码单元,和其类似者。
图8中所展示的实例将关于图7所展示并描述的运动向量预测扩展到包括三个以上视图的环境。举例来说,如图8中所展示,候选块142位于视图分量2(view_id 2)中。候选块142经帧间预测,且包括指代视图分量1(view_id 1)中的预测性块的运动向量140(mv)。举例来说,运动向量140的目标图片在视图2(view_id 2)中且其参考图片在视图1(view_id1)中。当前块146与候选块142位于同一地点,且位于视图分量3(view_id 3)中。
根据本发明的方面,视频解码器30可将当前块146的目标视图选择为视图分量0(view_id 0)。举例来说,目标视图一般包括当前块的预测性块。如果含有预测性块的图片为视图间参考图片,且当前块146的预测性块位于第三参考视图(view_id 0)中,则视频解码器30可选择第三参考视图作为目标视图。
在选择目标视图之后,视频解码器30可定位候选块142。举例来说,在假定当前块146的左上方明度样本在视图分量3中位于图片(或切片)中坐标(x,y)处的情况下,视频解码器30可确定视图分量2中候选块142的位于同一地点坐标。另外,如上文所提及,视频解码器30可基于当前块146的视图分量(视图分量3)与候选块142的视图分量(视图分量2)之间的视差而调整坐标。
在定位候选块142之后,视频解码器30可基于运动向量140与当前块146的实际运动向量之间的视距差而缩放候选块142的运动向量140。即,视频解码器30可基于以下两者之间的差而缩放运动向量130:用以俘获候选块142的预测性块的相机的相机位置,和用以俘获当前块146的预测性块(例如,目标视图中的预测性块)的相机的相机位置。即,视频解码器30可根据以下两者之间的差而缩放视差运动向量140(例如,用于预测的运动向量):通过候选块142的运动向量140所指代的视图分量,和目标视图(view_id 0)的视图分量。
在一实例中,视频解码器30可根据以下所展示的等式(4)来产生当前块的缩放的运动向量预测符:
其中mv'表示当前块的缩放的运动向量预测符,mv表示候选块的运动向量,ViewID(第三)为第三参考视图的视图分量,ViewID(当前)为当前块的视图分量,且ViewID(第二参考)为第二参考视图(如果可用)的视图分量,且ViewID(参考)为第一参考视图的视图分量。在一些实例中,ViewID(第三)减去ViewID(当前)可被称作运动向量预测符144的视距,而ViewID(第二参考)减去ViewID(参考)可被称作运动向量140的视距。即,运动向量预测符144的视距为运动向量预测符144的目标图片(view_id 0)与参考图片(view_id 3)之间的差,而运动向量140的视距为运动向量140的目标图片(view_id 1)与参考图片(view_id 2)之间的差。
在将等式(3)应用于图8中的实例的情况下,mv'表示缩放的运动向量预测符144。举例来说,ViewID(第三)为第三参考视图(view_id 0),mv'表示缩放的运动向量预测符144,mv表示运动向量140,ViewID(当前)为当前块146的视图分量,ViewID(第二参考)为第二参考视图(view_id 1)的视图分量,且ViewID(参考)为第一参考视图(view_id 2)的视图分量。因此,在图8中所展示的实例中,运动向量预测符144为缩放到三倍的运动向量140(例如,)。即,视频解码器30可将运动向量140的水平移位分量和垂直移位分量缩放到三倍,从而形成运动向量预测符144。
虽然图7到图8提供视图间视差运动向量预测的实例,但应理解,这些实例仅出于说明的目的而提供。即,用于视差运动向量预测的技术可应用于比所展示的视图多或少的视图。或者或另外,可在各视图具有不同视图识别符的情形中应用用于视差运动向量预测的技术。
图9为说明译码视频数据的块的预测信息的实例方法的流程图。图9中所展示的实例一般被描述为通过视频译码器执行。应理解,在一些实例中,图9的方法可通过上文所描述的视频编码器20(图1和图2)或视频解码器30(图1和图3)实施。在其它实例中,图9的方法可通过多种其它处理器、处理单元、例如编码器/解码器(CODEC)的基于硬件的译码单元和其类似者执行。
根据图9中所展示的实例方法,视频译码器可识别第一视图中的视频数据的第一块,其中视频数据的第一块与第一视差运动向量相关联(160)。举例来说,视频数据的第一块的运动向量可为识别另一视图分量中的参考块的视差运动向量。视频译码器可接着确定与视频数据的第二块相关联的第二运动向量是否为视差运动向量(162)。
如果第二运动向量不为视差运动向量(步骤162的“否”分支),则视频译码器可识别不同的运动向量预测符候选者(164)。即,根据本发明的一些方面,可停用使用视差运动向量(例如,第一运动向量)以预测时间运动向量(例如,当第二运动向量为时间运动向量时预测第二运动向量)的能力。在这些例子中,视频译码器可将第一运动向量识别为不可用于实现运动向量预测的目的。
如果第二运动向量为视差运动向量(步骤162的“是”分支),则视频译码器可缩放第一运动向量以产生第二运动向量的运动向量预测符(166)。举例来说,根据本发明的方面,视频译码器可基于以下两者的差而缩放第一运动向量以产生视差运动向量预测符:与第一视差运动向量相关联的视距,和与第二运动向量相关联的视距。即,在一些实例中,视频译码器可基于相机位置而缩放第二块的运动向量预测符。举例来说,视频译码器可根据如关于图6到图8所展示并描述的视图识别符的差而缩放第二运动向量。
视频译码器可接着使用缩放的运动向量预测符来译码第二块的预测数据(168)。举例来说,视频译码器可使用合并模式或使用运动向量预测来译码第二块的预测数据。对于合并模式,视频译码器可使用缩放的第二运动向量预测符直接译码第二块的预测数据。对于运动向量预测,视频译码器可通过产生MVD而译码第二块的预测数据。MVD可包括第一运动向量与缩放的第二运动向量之间的差。
还应理解,关于图9所展示并描述的步骤仅作为一实例而提供。即,图9的方法的步骤未必需要以图9中所展示的次序来执行,且可执行更少、额外或替代步骤。
图10为说明从处于与当前块不同的视图中的块产生运动向量预测符的概念图。举例来说,根据本发明的方面,视频译码器(例如,视频编码器20或视频解码器30)可使用来自时间运动向量预测符候选块182的时间运动向量180(mv)以产生当前块186的运动向量预测符184(mv'),其中候选块182属于与当前块186不同的视图分量。虽然关于视频解码器30来描述图10,但应理解,可通过多种其它视频译码器实施本发明的技术,其它视频译码器包括其它处理器、处理单元、例如编码器/解码器(CODEC)的基于硬件的译码单元,和其类似者。
如图10中所展示,当前块186位于视图分量1(view_id 1)中。候选块182位于视图分量0(view_id 0)中。候选块182经时间预测,且包括指代同一视图分量内的处于不同时间位置中的预测性块的运动向量180(mv)。即,在图10中所展示的实例中,运动向量180识别具有等于变量i的参考索引(ref_idx=i)的图片中的预测性块。
假定当前块186的左上方明度样本在图片(或切片)中位于坐标(x,y)处。视频解码器30可通过确定在视图分量0中候选块182的位于同一地点坐标而定位候选块182。在一些实例中,视频解码器30可基于当前块186的视图分量(view_id 1)与候选块182的视图分量(view_id 0)之间的视差而调整候选块182的坐标。因此,视频解码器30可将候选块182的坐标确定为(x',y'),其中(x',y',)=(x,y)+视差。在一些实例中,视差可包括于SPS、PPS、切片标头、CU语法和/或PU语法中,和/或在SPS、PPS、切片标头、CU语法和/或PU语法中进行计算。
根据本发明的方面,视频解码器30可接着再映射运动向量180的参考索引以用于实现预测的目的。一般而言,如上文所提及,运动向量的数据包括参考图片列表、到参考图片列表中的索引(被称作ref_idx)、水平分量,和垂直分量。在HEVC中,可存在两个常规的参考图片列表(例如,列表0和列表1)和组合的参考图片列表(例如,列表c)。不失一般性,假定当前参考图片列表为列表t(其可对应于列表0、列表1或列表c中的任一者)。根据图10中所展示的实例,候选块182的运动向量180可识别位于视图分量0(view_id 0)中的特定图片中的预测性块,所述图片的POC值为2且其ref_idx等于i。根据本发明的方面,视频解码器30可识别处于与当前块186相同的时间瞬时的当前块186的位于同一地点的预测性块。即,候选块182的预测性块与当前块186的预测性块具有相同时间位置,但位于两个不同视图的图片中。
在一实例中,如果当前块186的所识别的预测性块对应于当前图片的参考图片列表t中的第j个参考图片,则视频解码器30可将当前块186的参考索引(ref_idx)预测为j,且视频解码器30可将运动向量预测符184设定成与运动向量180相同的值。因此,视频解码器30将当前块186的参考索引从ref_idx i有效地再映射到ref_idx j。即,视频解码器30确定出当前块186的运动向量预测符184具有与候选块182相同的参考图片列表、水平分量和垂直分量,然而,运动向量预测符184指代参考图片列表中的第j个参考图片,而非参考图片列表中的第i个参考图片。
根据本发明的方面,在一些实例中,视频解码器还可缩放运动向量预测符184。举例来说,如果含有当前块186的所识别的预测性块的图片不包括于参考图片列表t中,则视频解码器30可识别参考图片列表t中最接近的第二图片。在一些实例中,如果两个图片具有距含有当前块186的所识别的预测性块的图片相等的距离,则视频解码器30可选择更接近含有当前块186的图片的图片作为第二图片。出于解释的目的,假定所识别的图片具有参考索引k。在此实例中,视频解码器30可接着将运动向量预测符184的参考索引预测为k,且视频解码器30可基于图片次序计数(POC)的差而缩放运动向量预测符184。即,视频解码器30可基于以下两者之间的差而缩放运动向量预测符184:当前块186与参考索引j处的图片之间的距离,和当前块186与参考索引k处的图片之间的距离。
根据一些实例,视频解码器30可在执行运动向量预测时执行相同过程。然而,在确定运动向量预测符184之后,视频解码器30可使用MVD产生当前块186的运动向量。运动向量预测可使用相同过程。在另一实例中,关于运动向量预测,如果当前块186的预测性块不能被定位(被识别为位于上文的参考索引j处),则视频解码器30不可执行当前块186的合并模式或运动向量预测。即,视频解码器30可认为运动向量预测符184不可用,而非缩放运动向量预测符184。
视频解码器30可将候选块182添加到候选者列表以用于执行合并模式和/或运动向量预测(例如,关于上文的图5所描述)。根据本发明的方面,可以多种方式将候选块182添加到运动向量预测符候选者列表(例如,用于合并模式或通过MVP的运动向量预测)。举例来说,视频解码器30可通过根据以下方案定位候选者来建构候选者列表:
1.A1,如果availableFlagA1等于1
2.V,如果availableFlagV等于1
3.B1,如果availableFlagB1等于1
4.B0,如果availableFlagB0等于1
5.A0,如果availableFlagA0等于1
6.B2,如果availableFlagB2等于1
7.Col,如果availableFlagCol等于1
其中V表示候选块182。在其它实例中,可定位候选块132且将所述候选块132添加到候选者列表处于候选者列表的任何其它位置中。
图11为说明产生运动向量预测符的实例方法的流程图。图11中所展示的实例一般被描述为通过视频译码器执行。应理解,在一些实例中,图11的方法可通过上文所描述的视频译码器20(图1和图2)或视频解码器30(图1和图3)实施。在其它实例中,图11的方法可通过多种其它处理器、处理单元、例如编码器/解码器(CODEC)的基于硬件的译码单元和其类似者执行。
根据图11中所展示的实例,视频译码器可识别第一视图的第一时间位置中的视频数据的第一块,其中所述第一块与第一时间运动向量相关联(202)。根据本发明的方面,当与视频数据的第二块相关联的第二运动向量为时间运动向量且所述第二块来自与第一块不同的第二视图(步骤204的“是”分支)时,视频译码器可基于第一运动向量确定运动向量预测符(206)。即,例如,视频译码器可从第一运动向量确定用于预测第二运动向量的运动向量预测符。视频译码器还可使用运动向量预测符译码第二块的预测数据(208)。举例来说,视频译码器可将运动向量预测符用于合并模式中或使用运动向量预测符以产生MVD值。
如果第二运动向量不为时间运动向量和/或视频数据的第二块并非来自与视频数据的第一块不同的视图(步骤204的“否”分支),则视频译码器可确定第二运动向量是否为视差运动向量(210)。根据本发明的方面,如果第二运动向量不为视差运动向量(步骤210的“否”分支),则视频译码器可识别不同的运动向量预测符候选者(212)。即,在一些实例中,视频译码器可不使用第一运动向量来预测第二运动向量。
如果第二运动向量为视差运动向量(步骤210的“是”分支),则视频译码器可确定是否停用视差运动向量预测(214)。即,根据本发明的一些方面,可停用使用时间运动向量(例如,第一运动向量)以预测视差运动向量(例如,当第二运动向量为视差运动向量时预测第二运动向量)的能力。在这些例子中,视频译码器可识别不同的运动向量预测符候选者(212)(步骤214的“否”分支)。
如果视频译码器确定启用视差运动向量预测(例如,或启用/停用此功能的能力不存在),则视频译码器可基于第一运动向量确定第二运动向量的运动向量预测符(206)(步骤214的“是”分支)。另外,视频译码器还可使用运动向量预测符译码第二块的预测数据(208)。举例来说,视频译码器可将运动向量预测符用于合并模式中或使用运动向量预测符以产生MVD值。
还应理解,关于图11所展示并描述的步骤仅作为一实例而提供。即,图11的方法的步骤未必需要以图11中所展示的次序来执行,且可执行更少、额外或替代步骤。
应理解,取决于实例,可以不同序列执行本文所描述的方法中的任一者的某些动作或事件,可添加、合并或全部省去所述动作或事件(例如,并非所有所描述的动作或事件对于实践所述方法为必要的)。此外,在某些实例中,可(例如)经由多线程处理、中断处理或多个处理器同时而非循序地执行动作或事件。另外,虽然本发明的某些方面出于清楚的目的而描述为是通过单一模块或单元来执行,但应理解,本发明的技术可通过与视频译码器相关联的单元或模块的组合来执行。
在一个或一个以上实例中,所描述的功能可以硬件、软件、固件或其任何组合来实施。如果以软件实施,则功能可作为一个或一个以上指令或程序代码而存储于计算机可读媒体上或经由计算机可读媒体而传输,且通过基于硬件的处理单元执行。计算机可读媒体可包括对应于有形媒体(例如,数据存储媒体)的计算机可读存储媒体或包括促进(例如)根据通信协议将计算机程序从一处传送到另一处的任何媒体的通信媒体。
以此方式,计算机可读媒体可对应于(1)非暂时性有形计算机可读存储媒体或(2)例如信号或载波的通信媒体。数据存储媒体可为可由一个或一个以上计算机或一个或一个以上处理器存取以检索指令、程序代码和/或数据结构来用于实施本发明中所描述的技术的任何可用媒体。计算机程序产品可包括计算机可读媒体。
举例来说而非限制,这些计算机可读存储媒体可包含RAM、ROM、EEPROM、CD-ROM或其它光盘存储器、磁盘存储器或其它磁性存储装置、快闪存储器,或可用以存储呈指令或数据结构的形式的所要程序代码且可由计算机存取的任何其它媒体。而且,适当地将任何连接称为计算机可读媒体。举例来说,如果使用同轴缆线、光纤缆线、双绞线、数字订户线(DSL)或例如红外线、无线电和微波的无线技术而从网站、服务器或其它远程源发射指令,则同轴缆线、光纤缆线、双绞线、DSL或例如红外线、无线电和微波的无线技术包括于媒体的定义中。
然而,应理解,计算机可读存储媒体和数据存储媒体不包括连接、载波、信号或其它暂时性媒体,而是替代地针对非暂时性有形存储媒体。如本文中所使用,磁盘和光盘包括压缩光盘(CD)、激光光盘、光学光盘、数字多功能光盘(DVD)、软盘和蓝光光盘,其中磁盘通常以磁性方式再现数据,而光盘用激光以光学方式再现数据。上述各者的组合也应包括于计算机可读媒体的范围内。
可由例如以下各者的一个或一个以上处理器执行指令:一个或一个以上数字信号处理器(DSP)、通用微处理器、专用集成电路(ASIC)、现场可编程逻辑阵列(FPGA)或其它等效集成或离散逻辑电路。因此,如本文所使用的术语“处理器”可指代前述结构或适于实施本文中所描述的技术的任何其它结构中的任一者。另外,在一些方面中,可将本文所描述的功能性提供于经配置以用于编码和解码的专用硬件和/或软件模块内,或并入组合式编解码器中。而且,所述技术可完全实施于一个或一个以上电路或逻辑组件中。
可在包括无线手机、集成电路(IC)或IC集合(例如,芯片组)的广泛多种装置或设备中实施本发明的技术。各种组件、模块或单元描述于本发明中以强调经配置以执行所揭示的技术的装置的功能方面,但未必需要通过不同硬件单元实现。更确切而言,如上文所描述,各种单元可组合于编解码器硬件单元中或由交互操作的硬件单元的集合(包括如上文所描述的一个或一个以上处理器)结合合适软件和/或固件来提供。
已描述本发明的各种方面。这些和其它方面在所附权利要求书的范围内。

Claims (83)

1.一种译码视频数据的方法,所述方法包含:
从第一视图识别第一时间位置中的视频数据的第一块,其中所述第一块与第一视差运动向量相关联;
产生用于预测所述第一视差运动向量的运动向量预测符候选者列表,其中产生所述运动向量预测符候选者列表包含:
识别第二视图中的视频数据的第二块的第二运动向量,所述第二视图与所述第一视图不同;
当所述第二运动向量是视差运动向量时,基于所述第二运动向量将运动向量预测符添加到所述运动向量预测符候选者列表以用于预测所述第一视差运动向量;
当所述第二运动向量不是视差运动向量时,确定所述第二运动向量不可用于运动向量预测,以使得不将所述第二运动向量添加到所述候选者列表;以及
将至少一个其它运动向量预测符添加到所述运动向量预测符候选者列表,其中所述至少一个其它运动向量预测符包括基于来自所述第一视图的第二时间位置中的第三块的视差运动向量的运动向量预测符,所述第二时间位置与所述第一时间位置不同;以及
使用来自所述运动向量预测符候选者列表的运动向量预测符来译码所述第一块的预测数据。
2.根据权利要求1所述的方法,其中视频数据的所述第二块位于所述第一时间位置中。
3.根据权利要求2所述的方法,其进一步包含基于归因于所述第二视图的所述第二块与所述第一视图的所述第一块之间的视差的偏移来识别所述第二块。
4.根据权利要求1所述的方法,其中视频数据的所述第二块位于与所述第一时间位置不同的第二时间位置中。
5.根据权利要求1所述的方法,
其中,在所述第二运动向量为视差运动向量时,所述方法进一步包含:
缩放所述第二运动向量以产生缩放的运动向量预测符,
其中缩放所述第二运动向量包含将缩放因数应用于所述第二运动向量,所述缩放因数包含所述第一视差运动向量的视距除以所述第二运动向量的视距,且
其中将所述运动向量预测符添加到所述候选者列表包含将所述缩放的运动向量预测符添加到所述候选者列表。
6.根据权利要求5所述的方法,其中视差运动向量的视距包含以下两者之间的差:参考图片的视图识别符,和与所述视差运动向量相关联的目标图片的视图识别符。
7.根据权利要求5所述的方法,其中视差运动向量的视距包含以下两者之间的几何距离:含有参考图片的视图的相机位置,和含有与所述视差运动向量相关联的目标图片的视图的相机位置。
8.根据权利要求1所述的方法,其中译码视频数据的所述第一块的所述预测数据包含编码所述预测数据。
9.根据权利要求1所述的方法,其中译码视频数据的所述第一块的所述预测数据包含解码所述预测数据。
10.根据权利要求9所述的方法,其中所述运动向量预测符候选者列表包含一个或多个其它运动向量预测符,且所述方法进一步包含基于运动向量预测符索引值从所述候选者列表选择所述运动向量预测符。
11.根据权利要求1所述的方法,其进一步包含使用视频数据的所述第一块的所述预测数据来译码视频数据的所述第一块。
12.一种用于译码视频数据的设备,其包含一个或多个处理器,所述一个或多个处理器经配置以执行以下操作:
从第一视图识别第一时间位置中的视频数据的第一块,其中所述第一块与第一视差运动向量相关联;
产生用于预测所述第一视差运动向量的运动向量预测符候选者列表,其中为了产生所述运动向量预测符候选者列表,所述一个或多个处理器经配置以执行以下操作:
识别第二视图中的视频数据的第二块的第二运动向量,所述第二视图与所述第一视图不同;
当所述第二运动向量是视差运动向量时,基于所述第二运动向量将运动向量预测符添加到所述运动向量预测符候选者列表以用于预测所述第一视差运动向量;
当所述第二运动向量不是视差运动向量时,确定所述第二运动向量不可用于运动向量预测,以使得不将所述第二运动向量添加到所述候选者列表;以及
将至少一个其它运动向量预测符添加到所述运动向量预测符候选者列表,其中所述至少一个其它运动向量预测符包括基于来自所述第一视图的第二时间位置中的第三块的视差运动向量的运动向量预测符,所述第二时间位置与所述第一时间位置不同;以及
基于来自所述运动向量预测符候选者列表的运动向量预测符来译码所述第一块的预测数据。
13.根据权利要求12所述的设备,其中视频数据的所述第二块位于所述第一时间位置中。
14.根据权利要求13所述的设备,其中所述一个或多个处理器进一步经配置以基于归因于使用所述第二视图的所述第二块与所述第一视图的所述第一块之间的视差的偏移来识别所述第二块。
15.根据权利要求12所述的设备,其中视频数据的所述第二块位于与所述第一时间位置不同的第二时间位置中。
16.根据权利要求12所述的设备,
其中,在所述第二运动向量为视差运动向量时,所述一个或多个处理器进一步经配置以缩放所述第二运动向量以产生缩放的运动向量预测符,
其中为了缩放所述第二运动向量,所述一个或多个处理器经配置以将缩放因数应用于所述第二运动向量,所述缩放因数包含所述第一视差运动向量的视距除以所述第二运动向量的视距,且
其中为了将所述运动向量预测符添加到所述候选者列表,所述一个或多个处理器经配置以将所述缩放的运动向量预测符添加到所述候选者列表。
17.根据权利要求16所述的设备,其中视差运动向量的视距包含以下两者之间的差:参考图片的视图识别符,和与所述视差运动向量相关联的目标图片的视图识别符。
18.根据权利要求16所述的设备,其中视差运动向量的视距包含以下两者之间的几何距离:含有参考图片的视图的相机位置,和含有与所述视差运动向量相关联的目标图片的视图的相机位置。
19.根据权利要求12所述的设备,其中,为了译码视频数据的所述第一块的所述预测数据,所述一个或多个处理器经配置以编码所述预测数据。
20.根据权利要求12所述的设备,其中,为了译码视频数据的所述第一块的所述预测数据,所述一个或多个处理器经配置以解码所述预测数据。
21.根据权利要求20所述的设备,其中所述运动向量预测符候选者列表包含一个或多个其它运动向量预测符,且其中所述一个或多个处理器进一步经配置以基于运动向量预测符索引值从所述候选者列表选择所述运动向量预测符。
22.根据权利要求12所述的设备,其中所述一个或多个处理器进一步经配置以使用视频数据的所述第一块的所述预测数据来译码视频数据的所述第一块。
23.一种用于译码视频数据的设备,所述设备包含:
用于从第一视图识别第一时间位置中的视频数据的第一块的装置,其中所述第一块与第一视差运动向量相关联;
用于产生用于预测所述第一视差运动向量的运动向量预测符候选者列表的装置,其中所述用于产生用于预测所述第一视差运动向量的运动向量预测符候选者列表的装置包含:
用于识别第二视图中的视频数据的第二块的第二运动向量的装置,所述第二视图与所述第一视图不同;
用于当所述第二运动向量是视差运动向量时,基于所述第二运动向量将运动向量预测符添加到所述运动向量预测符候选者列表以用于预测所述第一视差运动向量的装置;
用于当所述第二运动向量不是视差运动向量时,确定所述第二运动向量不可用于运动向量预测,以使得不将所述第二运动向量添加到所述候选者列表的装置;以及
用于将至少一个其它运动向量预测符添加到所述运动向量预测符候选者列表的装置,其中所述至少一个其它运动向量预测符包括基于来自所述第一视图的第二时间位置中的第三块的视差运动向量的运动向量预测符,所述第二时间位置与所述第一时间位置不同;以及
用于基于来自所述运动向量预测符候选者列表的运动向量预测符来译码所述第一块的预测数据的装置。
24.根据权利要求23所述的设备,其中视频数据的所述第二块位于所述第一时间位置中。
25.根据权利要求24所述的设备,其进一步包含用于基于归因于所述第二视图的所述第二块与所述第一视图的所述第一块之间的视差的偏移来识别所述第二块的装置。
26.根据权利要求23所述的设备,其中视频数据的所述第二块位于与所述第一时间位置不同的第二时间位置中。
27.根据权利要求23所述的设备,
其中,在所述第二运动向量为视差运动向量时,所述设备进一步包括:
用于缩放所述第二运动向量以产生缩放的运动向量预测符的装置,
其中用于缩放所述第二运动向量的装置包含用于将缩放因数应用于所述第二运动向量的装置,所述缩放因数包含所述第一视差运动向量的视距除以所述第二运动向量的视距,且
其中所述用于将所述运动向量预测符添加到所述候选者列表的装置包含用于将所述缩放的运动向量预测符添加到所述候选者列表的装置。
28.根据权利要求27所述的设备,其中视差运动向量的视距包含以下两者之间的差:参考图片的视图识别符,和与所述视差运动向量相关联的目标图片的视图识别符。
29.根据权利要求27所述的设备,其中视差运动向量的视距包含以下两者之间的几何距离:含有参考图片的视图的相机位置,和含有与所述视差运动向量相关联的目标图片的视图的相机位置。
30.根据权利要求23所述的设备,其中用于译码视频数据的所述第一块的预测数据的装置包含用于编码所述预测数据的装置。
31.根据权利要求23所述的设备,其中用于译码视频数据的所述第一块的预测数据的装置包含用于解码所述预测数据的装置。
32.根据权利要求31所述的设备,其中所述运动向量预测符候选者列表包含一个或多个其它运动向量预测符,且进一步包含用于基于运动向量预测符索引值从所述候选者列表选择所述运动向量预测符的装置。
33.根据权利要求23所述的设备,其进一步包含用于使用视频数据的所述第一块的所述预测数据译码视频数据的所述第一块的装置。
34.一种解码视频数据的方法,所述方法包含:
建构运动向量预测符候选者列表,所述运动向量预测符候选者列表包含一个或多个候选运动向量预测符以用于预测当前正被解码的视频数据块的第一运动向量,其中建构所述运动向量预测符候选者列表包含:
基于由与所述第一运动向量相关联的参考索引识别的参考图片的类型来确定所述第一运动向量的运动向量类型;
基于由与一个或多个运动向量的对应运动向量相关联的参考索引识别的参考图片的位置来确定所述一个或多个运动向量的运动向量类型以供包括于所述运动向量预测符候选者列表中;以及
基于具有与所述第一运动向量的所述运动向量类型相同的运动向量类型的运动向量而将所述一个或多个运动向量中的运动向量添加到所述运动向量预测符候选者列表,以使得从所构建的运动向量预测符候选者列表中排除具有与所述第一运动向量的所述运动向量类型不同的运动向量类型的运动向量;以及
使用来自所述运动向量预测符候选者列表的运动向量预测符解码所述视频数据块的所述第一运动向量。
35.根据权利要求34所述的方法,其进一步包含,当所述一个或多个运动向量具有与所述块相同的运动向量类型且所述类型为时间运动向量类型时,如果时间运动向量的参考图片的图片次序计数POC值与所述一个或多个运动向量的参考图片的POC值相同,且所述时间运动向量的目标图片的POC值与所述一个或多个运动向量的所述参考图片的POC值相同,则将所述一个或多个运动向量添加到所述运动向量预测符候选者列表,而不缩放所述一个或多个运动向量。
36.根据权利要求34所述的方法,
其中第一运动向量类型包含视差运动向量类型,使得确定参考图片的所述位置包含在与所述视频数据块不同的视图中识别参考图片,
其中第二运动向量类型包含时间运动向量类型,使得确定参考图片的所述位置包含在与所述视频数据块相同的视图中识别参考图片。
37.根据权利要求36所述的方法,其中确定所述一个或多个运动向量的所述运动向量类型以供包括于所述运动向量预测符候选者列表中包含:确定所述第一运动向量的相邻块的所述运动向量类型以供包括于所述运动向量预测符候选者列表中。
38.根据权利要求36所述的方法,其进一步包含,当所述一个或多个运动向量具有与所述块相同的运动向量类型且所述类型是所述视差运动向量类型时,如果视差运动向量的参考图片的视图识别符与所述一个或多个运动向量的参考图片的视图识别符相同,则将所述一个或多个运动向量添加到所述运动向量预测符候选者列表,而不缩放所述一个或多个运动向量。
39.根据权利要求36所述的方法,其进一步包含,当所述第一运动向量的所述运动向量类型包含时间运动向量且所述一个或多个运动向量中的至少一者的运动向量类型包含视差运动向量时,确定所述至少一个运动向量不可用于包括于所述运动向量预测符候选者列表中。
40.根据权利要求34所述的方法,其中所述运动向量预测符候选者列表用于执行合并模式。
41.根据权利要求34所述的方法,其中所述运动向量预测符候选者列表用于执行运动向量预测。
42.根据权利要求34所述的方法,其中使用来自所述运动向量预测符候选者列表的所述运动向量预测符解码所述第一运动向量包含:
从经编码位流检索包含所述第一运动向量与所述运动向量预测符之间的差的运动向量差值以及到所述运动向量预测符候选者列表的索引;
基于所述所检索的索引从所述运动向量预测符候选者列表识别所述运动向量预测符;以及
将所述所识别的运动向量预测符和所述运动向量差值进行组合以产生所述第一运动向量。
43.根据权利要求34所述的方法,其中使用来自所述运动向量预测符候选者列表的所述运动向量预测符解码所述第一运动向量包含:
从经编码位流检索到所述运动向量预测符候选者列表的索引;
基于所述所检索的索引从所述运动向量预测符候选者列表识别所述运动向量预测符;以及
将所述运动向量预测符与所述第一运动向量进行合并,使得所述第一运动向量继承来自所述运动向量预测符的运动信息。
44.一种用于解码视频数据的设备,所述设备包含一个或多个处理器,所述一个或多个处理器经配置以:
建构运动向量预测符候选者列表,所述运动向量预测符候选者列表包含一个或多个候选运动向量预测符以用于预测当前正被解码的视频数据块的第一运动向量,其中为了建构所述运动向量预测符候选者列表,所述一个或多个处理器经配置以:
基于由与所述第一运动向量相关联的参考索引识别的参考图片的类型来确定所述第一运动向量的运动向量类型;
基于由与一个或多个运动向量的对应运动向量相关联的参考索引识别的参考图片的位置来确定所述一个或多个运动向量的运动向量类型以供包括于所述运动向量预测符候选者列表中;以及
基于具有与所述第一运动向量的所述运动向量类型相同的运动向量类型的运动向量而将所述一个或多个运动向量中的运动向量添加到所述运动向量预测符候选者列表,得从所构建的运动向量预测符候选者列表中排除具有与所述第一运动向量的所述运动向量类型不同的运动向量类型的运动向量;以及
使用来自所述运动向量预测符候选者列表的运动向量预测符解码所述视频数据块的所述第一运动向量。
45.根据权利要求44所述的设备,其中所述一个或多个处理器进一步经配置以当所述一个或多个运动向量具有与所述块相同的运动向量类型且所述类型为时间运动向量类型时,如果时间运动向量的参考图片的图片次序计数POC值与所述一个或多个运动向量的参考图片的POC值相同,且所述时间运动向量的目标图片的POC值与所述一个或多个运动向量的所述参考图片的POC值相同,则将所述一个或多个运动向量添加到所述运动向量预测符候选者列表,而不缩放所述一个或多个运动向量。
46.根据权利要求44所述的设备,
其中第一运动向量类型包含视差运动向量类型,使得为了确定参考图片的所述位置,所述一个或多个处理器经配置以在与所述视频数据块不同的视图中识别参考图片,
其中第二运动向量类型包含时间运动向量类型,使得为了确定参考图片的所述位置,所述一个或多个处理器经配置以在与所述视频数据块相同的视图中识别参考图片。
47.根据权利要求46所述的设备,其中为了确定所述一个或多个运动向量的所述运动向量类型以供包括于所述运动向量预测符候选者列表中,所述一个或多个处理器经配置以确定所述第一运动向量的相邻块的所述运动向量类型以供包括于所述运动向量预测符候选者列表中。
48.根据权利要求46所述的设备,其中所述一个或多个处理器进一步经配置以当所述一个或多个运动向量具有与所述块相同的运动向量类型且所述类型是所述视差运动向量类型时,如果视差运动向量的参考图片的视图识别符与所述一个或多个运动向量的参考图片的视图识别符相同,则将所述一个或多个运动向量添加到所述运动向量预测符候选者列表,而不缩放所述一个或多个运动向量。
49.根据权利要求46所述的设备,其中所述一个或多个处理器进一步经配置以当所述第一运动向量的所述运动向量类型包含时间运动向量且所述一个或多个运动向量中的至少一者的运动向量类型包含视差运动向量时,确定所述至少一个运动向量不可用于包括于所述运动向量预测符候选者列表中。
50.根据权利要求44所述的设备,其中所述运动向量预测符候选者列表用于执行合并模式。
51.根据权利要求44所述的设备,其中所述运动向量预测符候选者列表用于执行运动向量预测。
52.根据权利要求44所述的设备,其中为了使用来自所述运动向量预测符候选者列表的所述运动向量预测符解码所述第一运动向量,所述一个或多个处理器经配置以:
从经编码位流检索包含所述第一运动向量与所述运动向量预测符之间的差的运动向量差值以及到所述运动向量预测符候选者列表的索引;
基于所述所检索的索引从所述运动向量预测符候选者列表识别所述运动向量预测符;以及
将所述所识别的运动向量预测符和所述运动向量差值进行组合以产生所述第一运动向量。
53.根据权利要求44所述的设备,其中为了使用来自所述运动向量预测符候选者列表的所述运动向量预测符解码所述第一运动向量,所述一个或多个处理器经配置以:从经编码位流检索到所述运动向量预测符候选者列表的索引;
基于所述所检索的索引从所述运动向量预测符候选者列表识别所述运动向量预测符;以及
将所述运动向量预测符与所述第一运动向量进行合并,使得所述第一运动向量继承来自所述运动向量预测符的运动信息。
54.一种编码视频数据的方法,所述方法包含:
建构运动向量预测符候选者列表,所述运动向量预测符候选者列表包含一个或多个候选运动向量预测符以用于预测当前正被编码的视频数据块的第一运动向量,其中建构所述运动向量预测符候选者列表包含:
基于由与所述第一运动向量相关联的参考索引识别的参考图片的类型来确定所述第一运动向量的运动向量类型;
基于由与一个或多个运动向量的对应运动向量相关联的参考索引识别的参考图片的位置来确定所述一个或多个运动向量的运动向量类型以供包括于所述运动向量预测符候选者列表中;
基于具有与所述第一运动向量的所述运动向量类型相同的运动向量类型的运动向量而将所述一个或多个运动向量中的运动向量添加到所述运动向量预测符候选者列表,以使得从所构建的运动向量预测符候选者列表中排除具有与所述第一运动向量的所述运动向量类型不同的运动向量类型的运动向量;以及
使用来自所述运动向量预测符候选者列表的运动向量预测符编码所述视频数据块的所述第一运动向量。
55.根据权利要求54所述的方法,其进一步包含,当所述一个或多个运动向量具有与所述块相同的运动向量类型且所述类型为时间运动向量类型时,如果时间运动向量的参考图片的图片次序计数POC值与所述一个或多个运动向量的参考图片的POC值相同,且所述时间运动向量的目标图片的POC值与所述一个或多个运动向量的所述参考图片的POC值相同,则将所述一个或多个运动向量添加到所述运动向量预测符候选者列表,而不缩放所述一个或多个运动向量。
56.根据权利要求54所述的方法,
其中第一运动向量类型包含视差运动向量类型,使得确定参考图片的所述位置包含在与所述视频数据块不同的视图中识别参考图片,
其中第二运动向量类型包含时间运动向量类型,使得确定参考图片的所述位置包含在与所述视频数据块相同的视图中识别参考图片。
57.根据权利要求56所述的方法,其中确定所述一个或多个运动向量的所述运动向量类型以供包括于所述运动向量预测符候选者列表中包含:确定包括于所述运动向量预测符候选者列表中的所述第一运动向量的相邻块的所述运动向量类型。
58.根据权利要求56所述的方法,其进一步包含,当所述一个或多个运动向量具有与所述块相同的运动向量类型且所述类型是所述视差运动向量类型时,如果视差运动向量的参考图片的视图识别符与所述一个或多个运动向量的参考图片的视图识别符相同,则将所述一个或多个运动向量添加到所述运动向量预测符候选者列表,而不缩放所述一个或多个运动向量。
59.根据权利要求56所述的方法,其进一步包含,当所述第一运动向量的所述运动向量类型包含时间运动向量且所述一个或多个运动向量中的至少一者的运动向量类型包含视差运动向量时,确定所述至少一个运动向量不可用于包括于所述运动向量预测符候选者列表中。
60.根据权利要求54所述的方法,其中所述运动向量预测符候选者列表用于执行合并模式。
61.根据权利要求54所述的方法,其中所述运动向量预测符候选者列表用于执行运动向量预测。
62.根据权利要求54所述的方法,其中使用来自所述运动向量预测符候选者列表的所述运动向量预测符编码所述第一运动向量包含:
确定运动向量差值,所述运动向量差值包含所述第一运动向量与来自所述运动向量预测符候选者列表的所述运动向量预测符之间的差;
确定到所述运动向量预测符候选者列表的索引,从而识别来自所述运动向量预测符候选者列表的所述运动向量预测符;以及
产生位流以包括表示所述运动向量差值以及到所述运动向量预测符候选者列表的所述索引的数据。
63.根据权利要求54所述的方法,其中使用来自所述运动向量预测符候选者列表的所述运动向量预测符编码所述第一运动向量包含:
确定到所述运动向量预测符候选者列表的索引,从而识别来自所述运动向量预测符候选者列表的所述运动向量预测符以与所述第一运动向量进行合并;以及
产生位流以包括表示到所述运动向量预测符候选者列表的所述索引的数据。
64.一种用于编码视频数据的设备,所述设备包含一个或多个处理器,所述一个或多个处理器经配置以:
建构运动向量预测符候选者列表,所述运动向量预测符候选者列表包含一个或多个候选运动向量预测符以用于预测当前正被编码的视频数据块的第一运动向量,其中为了建构所述运动向量预测符候选者列表,所述一个或多个处理器经配置以:
基于由与所述第一运动向量相关联的参考索引识别的参考图片的类型来确定所述第一运动向量的运动向量类型;
基于由与一个或多个运动向量的对应运动向量相关联的参考索引识别的参考图片的位置来确定所述一个或多个运动向量的运动向量类型以供包括于所述运动向量预测符候选者列表中;以及
基于具有与所述第一运动向量的所述运动向量类型相同的运动向量类型的运动向量而将所述一个或多个运动向量中的运动向量添加到所述运动向量预测符候选者列表,以使得从所构建的运动向量预测符候选者列表中排除具有与所述第一运动向量的所述运动向量类型不同的运动向量类型的运动向量;以及
使用来自所述运动向量预测符候选者列表的运动向量预测符编码所述视频数据块的所述第一运动向量。
65.根据权利要求64所述的设备,其中所述一个或多个处理器进一步经配置以当所述一个或多个运动向量具有与所述块相同的运动向量类型且所述类型为时间运动向量类型时,如果时间运动向量的参考图片的图片次序计数POC值与所述一个或多个运动向量的参考图片的POC值相同,且所述时间运动向量的目标图片的POC值与所述一个或多个运动向量的所述参考图片的POC值相同,则将所述一个或多个运动向量添加到所述运动向量预测符候选者列表,而不缩放所述一个或多个运动向量。
66.根据权利要求64所述的设备,
其中第一运动向量类型包含视差运动向量类型,使得为了确定参考图片的所述位置,所述一个或多个处理器经配置以在与所述视频数据块不同的视图中识别参考图片,
其中第二运动向量类型包含时间运动向量类型,使得为了确定参考图片的所述位置,所述一个或多个处理器经配置以在与所述视频数据块相同的视图中识别参考图片。
67.根据权利要求66所述的设备,其中为了确定所述一个或多个运动向量的所述运动向量类型以供包括于所述运动向量预测符候选者列表中,所述一个或多个处理器经配置以确定所述第一运动向量的相邻块的所述运动向量类型以供包括于所述运动向量预测符候选者列表中。
68.根据权利要求66所述的设备,其中所述一个或多个处理器进一步经配置以当所述一个或多个运动向量具有与所述块相同的运动向量类型且所述类型是所述视差运动向量类型时,如果视差运动向量的参考图片的视图识别符与所述一个或多个运动向量的参考图片的视图识别符相同,则将所述一个或多个运动向量添加到所述运动向量预测符候选者列表,而不缩放所述一个或多个运动向量。
69.根据权利要求66所述的设备,其中所述一个或多个处理器进一步经配置以当所述第一运动向量的所述运动向量类型包含时间运动向量且所述一个或多个运动向量中的至少一者的运动向量类型包含视差运动向量时,确定所述至少一个运动向量不可用于包括于所述运动向量预测符候选者列表中。
70.根据权利要求64所述的设备,其中所述运动向量预测符候选者列表用于执行合并模式。
71.根据权利要求64所述的设备,其中所述运动向量预测符候选者列表用于执行运动向量预测。
72.根据权利要求64所述的设备,其中为了使用来自所述运动向量预测符候选者列表的所述运动向量预测符编码所述第一运动向量,所述一个或多个处理器经配置以:
确定运动向量差值,所述运动向量差值包含所述第一运动向量与来自所述运动向量预测符候选者列表的所述运动向量预测符之间的差;
确定到所述运动向量预测符候选者列表的索引,从而识别来自所述运动向量预测符候选者列表的所述运动向量预测符;以及
产生位流以包括表示所述运动向量差值以及到所述运动向量预测符候选者列表的所述索引的数据。
73.根据权利要求64所述的设备,其中为了使用来自所述运动向量预测符候选者列表的所述运动向量预测符编码所述第一运动向量,所述一个或多个处理器经配置以:
确定到所述运动向量预测符候选者列表的索引,从而识别来自所述运动向量预测符候选者列表的所述运动向量预测符以与所述第一运动向量进行合并;以及
产生位流以包括表示到所述运动向量预测符候选者列表的所述索引的数据。
74.一种用于编码视频数据的设备,所述设备包含:
用于建构运动向量预测符候选者列表的装置,所述运动向量预测符候选者列表包含一个或多个候选运动向量预测符以用于预测当前正被编码的视频数据块的第一运动向量,其中所述用于建构所述运动向量预测符候选者列表的装置包含:
用于基于由与所述第一运动向量相关联的参考索引识别的参考图片的类型来确定所述第一运动向量的运动向量类型的装置;
用于基于由与一个或多个运动向量的对应运动向量相关联的参考索引识别的参考图片的位置来确定所述一个或多个运动向量的运动向量类型以供包括于所述运动向量预测符候选者列表中的装置;以及
用于基于具有与所述第一运动向量的所述运动向量类型相同的运动向量类型的运动向量而将所述一个或多个运动向量中的运动向量添加到所述运动向量预测符候选者列表以使得从所构建的运动向量预测符候选者列表中排除具有与所述第一运动向量的所述运动向量类型不同的运动向量类型的运动向量的装置;以及
用于使用来自所述运动向量预测符候选者列表的运动向量预测符编码所述视频数据块的所述第一运动向量的装置。
75.根据权利要求74所述的设备,其进一步包含,当所述一个或多个运动向量具有与所述块相同的运动向量类型且所述类型为时间运动向量类型时,用于如果时间运动向量的参考图片的图片次序计数POC值与所述一个或多个运动向量的参考图片的POC值相同,且所述时间运动向量的目标图片的POC值与所述一个或多个运动向量的所述参考图片的POC值相同,则将所述一个或多个运动向量添加到所述运动向量预测符候选者列表而不缩放所述一个或多个运动向量的装置。
76.根据权利要求74所述的设备,
其中第一运动向量类型包含视差运动向量类型,使得所述用于确定参考图片的所述位置的装置包含用于在与所述视频数据块不同的视图中识别参考图片的装置,
其中第二运动向量类型包含时间运动向量类型,使得所述用于确定参考图片的所述位置的装置包含用于在与所述视频数据块相同的视图中识别参考图片的装置。
77.根据权利要求76所述的设备,其中所述用于确定所述一个或多个运动向量的所述运动向量类型以供包括于所述运动向量预测符候选者列表中的装置包含用于确定所述第一运动向量的相邻块的所述运动向量类型以供包括于所述运动向量预测符候选者列表中的装置。
78.根据权利要求76所述的设备,其进一步包含,当所述一个或多个运动向量具有与所述块相同的运动向量类型且所述类型是所述视差运动向量类型时,用于如果视差运动向量的参考图片的视图识别符与所述一个或多个运动向量的参考图片的视图识别符相同,则将所述一个或多个运动向量添加到所述运动向量预测符候选者列表而不缩放所述一个或多个运动向量的装置。
79.根据权利要求76所述的设备,其进一步包含,当所述第一运动向量的所述运动向量类型包含时间运动向量且所述一个或多个运动向量中的至少一者的运动向量类型包含视差运动向量时,用于确定所述至少一个运动向量不可用于包括于所述运动向量预测符候选者列表中的装置。
80.根据权利要求74所述的设备,其中所述运动向量预测符候选者列表用于执行合并模式。
81.根据权利要求74所述的设备,其中所述运动向量预测符候选者列表用于执行运动向量预测。
82.根据权利要求74所述的设备,其中所述用于使用来自所述运动向量预测符候选者列表的所述运动向量预测符编码所述第一运动向量的装置包含:
用于确定运动向量差值的装置,所述运动向量差值包含所述第一运动向量与来自所述运动向量预测符候选者列表的所述运动向量预测符之间的差;
用于确定到所述运动向量预测符候选者列表的索引从而识别来自所述运动向量预测符候选者列表的所述运动向量预测符的装置;以及
用于产生位流以包括表示所述运动向量差值以及到所述运动向量预测符候选者列表的所述索引的数据的装置。
83.根据权利要求74所述的设备,其中所述用于使用来自所述运动向量预测符候选者列表的所述运动向量预测符编码所述第一运动向量的装置包含:
用于确定到所述运动向量预测符候选者列表的索引从而识别来自所述运动向量预测符候选者列表的所述运动向量预测符以与所述第一运动向量进行合并的装置;
以及
用于产生位流以包括表示到所述运动向量预测符候选者列表的所述索引的数据的装置。
CN201280019147.4A 2011-04-20 2012-04-20 译码视频数据的方法和设备 Active CN103503460B (zh)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US201161477561P 2011-04-20 2011-04-20
US61/477,561 2011-04-20
US201161512765P 2011-07-28 2011-07-28
US61/512,765 2011-07-28
US13/451,161 US9485517B2 (en) 2011-04-20 2012-04-19 Motion vector prediction with motion vectors from multiple views in multi-view video coding
US13/451,161 2012-04-19
PCT/US2012/034508 WO2012145663A1 (en) 2011-04-20 2012-04-20 Motion vector prediction in video coding

Publications (2)

Publication Number Publication Date
CN103503460A CN103503460A (zh) 2014-01-08
CN103503460B true CN103503460B (zh) 2017-08-25

Family

ID=47021330

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201280019147.4A Active CN103503460B (zh) 2011-04-20 2012-04-20 译码视频数据的方法和设备
CN201280019189.8A Active CN103650505B (zh) 2011-04-20 2012-04-20 视频译码中的运动向量预测

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN201280019189.8A Active CN103650505B (zh) 2011-04-20 2012-04-20 视频译码中的运动向量预测

Country Status (15)

Country Link
US (3) US9485517B2 (zh)
EP (2) EP2700227A1 (zh)
JP (3) JP5805850B2 (zh)
KR (2) KR101658694B1 (zh)
CN (2) CN103503460B (zh)
AU (1) AU2012245299B2 (zh)
BR (1) BR112013026961A2 (zh)
CA (1) CA2833302C (zh)
ES (1) ES2633150T3 (zh)
HU (1) HUE034333T2 (zh)
IL (1) IL228804A (zh)
MY (1) MY185037A (zh)
SG (2) SG194058A1 (zh)
TW (2) TWI526055B (zh)
WO (2) WO2012145663A1 (zh)

Families Citing this family (89)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8107535B2 (en) * 2003-06-10 2012-01-31 Rensselaer Polytechnic Institute (Rpi) Method and apparatus for scalable motion vector coding
AU2011362447B2 (en) * 2011-03-14 2015-09-24 Hfi Innovation Inc. Method and apparatus for deriving temporal motion vector prediction
JP5664762B2 (ja) * 2011-03-17 2015-02-04 富士通株式会社 動画像復号方法、動画像符号化方法、動画像復号装置及び動画像復号プログラム
US9485517B2 (en) 2011-04-20 2016-11-01 Qualcomm Incorporated Motion vector prediction with motion vectors from multiple views in multi-view video coding
WO2012167711A1 (en) * 2011-06-10 2012-12-13 Mediatek Inc. Method and apparatus of scalable video coding
WO2012177052A2 (ko) 2011-06-21 2012-12-27 한국전자통신연구원 인터 예측 방법 및 그 장치
KR20120140592A (ko) * 2011-06-21 2012-12-31 한국전자통신연구원 움직임 보상의 계산 복잡도 감소 및 부호화 효율을 증가시키는 방법 및 장치
HUE056547T2 (hu) 2011-06-28 2022-02-28 Lg Electronics Inc Eljárás mozgásvektor-prediktor levezetésére
WO2013001749A1 (ja) * 2011-06-29 2013-01-03 パナソニック株式会社 画像符号化方法、画像復号方法、画像符号化装置、画像復号装置および画像符号化復号装置
US11245912B2 (en) 2011-07-12 2022-02-08 Texas Instruments Incorporated Fast motion estimation for hierarchical coding structures
US9819963B2 (en) 2011-07-12 2017-11-14 Electronics And Telecommunications Research Institute Inter prediction method and apparatus for same
EP2705668A1 (en) * 2011-07-12 2014-03-12 Huawei Technologies Co., Ltd Pixel-based intra prediction for coding in hevc
MX365013B (es) * 2011-08-29 2019-05-20 Ibex Pt Holdings Co Ltd Metodo para generar un bloque de prediccion en modo de prediccion de vector de movimiento avanzada (amvp).
KR101626683B1 (ko) * 2011-08-30 2016-06-01 인텔 코포레이션 멀티뷰 비디오 코딩 방안
KR20130030181A (ko) * 2011-09-16 2013-03-26 한국전자통신연구원 움직임 벡터 예측기를 이용한 움직임 벡터 부호화/복호화 방법 및 장치
US9712819B2 (en) * 2011-10-12 2017-07-18 Lg Electronics Inc. Image encoding method and image decoding method
JP5768662B2 (ja) * 2011-10-31 2015-08-26 富士通株式会社 動画像復号装置、動画像符号化装置、動画像復号方法、動画像符号化方法、動画像復号プログラム及び動画像符号化プログラム
US9571833B2 (en) 2011-11-04 2017-02-14 Nokia Technologies Oy Method for coding and an apparatus
WO2013068548A2 (en) 2011-11-11 2013-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Efficient multi-view coding using depth-map estimate for a dependent view
IN2014KN00990A (zh) 2011-11-11 2015-10-09 Fraunhofer Ges Forschung
EP3739886A1 (en) * 2011-11-18 2020-11-18 GE Video Compression, LLC Multi-view coding with efficient residual handling
CA2841058C (en) 2011-12-16 2021-03-23 Panasonic Corporation Video image coding method, video image coding device, video image decoding method, video image decoding device and video image coding/decoding device
WO2013109093A1 (ko) * 2012-01-19 2013-07-25 한국전자통신연구원 영상 부호화/복호화 방법 및 장치
US9729873B2 (en) 2012-01-24 2017-08-08 Qualcomm Incorporated Video coding using parallel motion estimation
US9445076B2 (en) 2012-03-14 2016-09-13 Qualcomm Incorporated Disparity vector construction method for 3D-HEVC
US9525861B2 (en) 2012-03-14 2016-12-20 Qualcomm Incorporated Disparity vector prediction in video coding
US10200709B2 (en) 2012-03-16 2019-02-05 Qualcomm Incorporated High-level syntax extensions for high efficiency video coding
US9503720B2 (en) 2012-03-16 2016-11-22 Qualcomm Incorporated Motion vector coding and bi-prediction in HEVC and its extensions
US9549180B2 (en) 2012-04-20 2017-01-17 Qualcomm Incorporated Disparity vector generation for inter-view prediction for video coding
JP6361847B2 (ja) * 2012-05-02 2018-07-25 サン パテント トラスト 画像符号化方法、画像復号方法、画像符号化装置および画像復号装置
US9860555B2 (en) * 2012-05-22 2018-01-02 Lg Electronics Inc. Method and apparatus for processing video signal
AU2013284038B2 (en) * 2012-06-28 2015-11-05 Hfi Innovation Inc. Method and apparatus of disparity vector derivation in 3D video coding
US9325990B2 (en) 2012-07-09 2016-04-26 Qualcomm Incorporated Temporal motion vector prediction in video coding extensions
PL400344A1 (pl) * 2012-08-13 2014-02-17 Politechnika Poznanska Sposób wyznaczania predyktora wektora ruchu
US20140071235A1 (en) * 2012-09-13 2014-03-13 Qualcomm Incorporated Inter-view motion prediction for 3d video
CN104769949B (zh) 2012-09-19 2018-03-13 高通股份有限公司 用于视差向量导出的图片的选择的方法和装置
WO2014050675A1 (ja) * 2012-09-28 2014-04-03 ソニー株式会社 画像処理装置および方法
US9253486B2 (en) * 2012-09-28 2016-02-02 Mitsubishi Electric Research Laboratories, Inc. Method and system for motion field backward warping using neighboring blocks in videos
US9264691B2 (en) * 2012-09-28 2016-02-16 Mitsubishi Electric Research Laboratories, Inc. Method and system for backward 3D-view synthesis prediction using neighboring blocks
KR102257542B1 (ko) 2012-10-01 2021-05-31 지이 비디오 컴프레션, 엘엘씨 향상 레이어에서 변환 계수 블록들의 서브블록-기반 코딩을 이용한 스케일러블 비디오 코딩
US10075728B2 (en) * 2012-10-01 2018-09-11 Inria Institut National De Recherche En Informatique Et En Automatique Method and device for motion information prediction refinement
KR101706318B1 (ko) * 2012-10-03 2017-02-15 에이치에프아이 이노베이션 인크. 3차원 비디오 코딩을 위한 모션 데이터 버퍼 감소 방법 및 장치
CN102883163B (zh) * 2012-10-08 2014-05-28 华为技术有限公司 用于运动矢量预测的运动矢量列表建立的方法、装置
EP2966868B1 (en) * 2012-10-09 2018-07-18 HFI Innovation Inc. Method for motion information prediction and inheritance in video coding
WO2014073173A1 (ja) * 2012-11-06 2014-05-15 日本電気株式会社 映像符号化方法、映像符号化装置および映像符号化プログラム
US9819965B2 (en) * 2012-11-13 2017-11-14 Intel Corporation Content adaptive transform coding for next generation video
US9948939B2 (en) 2012-12-07 2018-04-17 Qualcomm Incorporated Advanced residual prediction in scalable and multi-view video coding
US9350970B2 (en) 2012-12-14 2016-05-24 Qualcomm Incorporated Disparity vector derivation
US9674542B2 (en) 2013-01-02 2017-06-06 Qualcomm Incorporated Motion vector prediction for video coding
WO2014120368A1 (en) 2013-01-30 2014-08-07 Intel Corporation Content adaptive entropy coding for next generation video
US10616607B2 (en) * 2013-02-25 2020-04-07 Lg Electronics Inc. Method for encoding video of multi-layer structure supporting scalability and method for decoding same and apparatus therefor
US9800857B2 (en) 2013-03-08 2017-10-24 Qualcomm Incorporated Inter-view residual prediction in multi-view or 3-dimensional video coding
US9609347B2 (en) * 2013-04-04 2017-03-28 Qualcomm Incorporated Advanced merge mode for three-dimensional (3D) video coding
US9930363B2 (en) 2013-04-12 2018-03-27 Nokia Technologies Oy Harmonized inter-view and view synthesis prediction for 3D video coding
US9800895B2 (en) * 2013-06-27 2017-10-24 Qualcomm Incorporated Depth oriented inter-view motion vector prediction
WO2015006922A1 (en) * 2013-07-16 2015-01-22 Mediatek Singapore Pte. Ltd. Methods for residual prediction
WO2015009092A1 (ko) * 2013-07-18 2015-01-22 엘지전자 주식회사 비디오 신호 처리 방법 및 장치
US9426465B2 (en) * 2013-08-20 2016-08-23 Qualcomm Incorporated Sub-PU level advanced residual prediction
US9832479B2 (en) * 2013-10-04 2017-11-28 Ati Technologies Ulc Motion estimation apparatus and method for multiview video
US10110895B2 (en) * 2013-12-13 2018-10-23 Qualcomm Incorporated Signaling of simplified depth coding (SDC) for depth intra- and inter-prediction modes in 3D video coding
US9967592B2 (en) * 2014-01-11 2018-05-08 Qualcomm Incorporated Block-based advanced residual prediction for 3D video coding
US20170180755A1 (en) * 2014-03-20 2017-06-22 Lg Electronics Inc. 3d video encoding/decoding method and device
US10645404B2 (en) * 2014-03-24 2020-05-05 Qualcomm Incorporated Generic use of HEVC SEI messages for multi-layer codecs
CN105208396B (zh) * 2014-06-20 2019-01-15 联想(北京)有限公司 一种视频帧的编码及解码方法和装置
US9924191B2 (en) * 2014-06-26 2018-03-20 Qualcomm Incorporated Filters for advanced residual prediction in video coding
EP3140988B1 (en) * 2014-06-26 2019-09-11 Huawei Technologies Co., Ltd. Method and device for reducing a computational load in high efficiency video coding
WO2016048834A1 (en) * 2014-09-26 2016-03-31 Vid Scale, Inc. Intra block copy coding with temporal block vector prediction
WO2016050219A1 (en) * 2014-09-30 2016-04-07 Mediatek Inc. Method of adaptive motion vetor resolution for video coding
US9992512B2 (en) * 2014-10-06 2018-06-05 Mediatek Inc. Method and apparatus for motion vector predictor derivation
CN107113442B (zh) * 2014-10-31 2020-08-07 三星电子株式会社 用于对运动矢量进行编码/解码的方法和装置
US10602176B2 (en) * 2016-04-15 2020-03-24 Google Llc Coding interpolation filter type
CN116708784A (zh) * 2016-07-12 2023-09-05 韩国电子通信研究院 图像编码/解码方法以及用于该方法的记录介质
US11496747B2 (en) * 2017-03-22 2022-11-08 Qualcomm Incorporated Intra-prediction mode propagation
CN109089119B (zh) 2017-06-13 2021-08-13 浙江大学 一种运动矢量预测的方法及设备
US10687077B2 (en) * 2017-06-26 2020-06-16 Qualcomm Incorporated Motion information propagation in video coding
US11082702B2 (en) 2017-07-03 2021-08-03 Lg Electronics Inc. Inter prediction mode-based image processing method and device therefor
CN111095926A (zh) 2017-09-12 2020-05-01 三星电子株式会社 用于对运动信息进行编码和解码的方法以及用于对运动信息进行编码和解码的装置
US11212547B2 (en) * 2017-09-19 2021-12-28 Samsung Electronics Co., Ltd. Method for encoding and decoding motion information, and apparatus for encoding and decoding motion information
US10856003B2 (en) * 2017-10-03 2020-12-01 Qualcomm Incorporated Coding affine prediction motion information for video coding
EP3780608A4 (en) 2018-04-02 2021-12-01 SZ DJI Technology Co., Ltd. IMAGE PROCESSING PROCESS AND IMAGE PROCESSING DEVICE
US11146796B2 (en) * 2018-04-06 2021-10-12 Arris Enterprises Llc Reducing motion vector information transmission in bi-directional temporal prediction
US10587885B2 (en) * 2018-06-04 2020-03-10 Tencent America LLC Method and apparatus for merge mode with additional middle candidates in video coding
US10638145B2 (en) * 2018-06-19 2020-04-28 Novatek Microelectronics Corp. Video encoding apparatus and operating method thereof
CN111107354A (zh) 2018-10-29 2020-05-05 华为技术有限公司 一种视频图像预测方法及装置
CN113273205A (zh) * 2018-12-21 2021-08-17 北京字节跳动网络技术有限公司 使用更高比特深度精度的运动矢量推导
CN111213381B (zh) * 2018-12-29 2021-11-12 深圳市大疆创新科技有限公司 视频处理方法和设备
MX2022003940A (es) * 2019-10-03 2022-04-25 Huawei Tech Co Ltd Proceso de codificacion para modo de particion geometrica.
JP2023511276A (ja) * 2020-01-14 2023-03-17 華為技術有限公司 マージ・モードのための候補の数をシグナリングする方法及び装置
CN117221604A (zh) * 2020-04-03 2023-12-12 北京达佳互联信息技术有限公司 用于视频编解码中的高级语法的方法和设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101491096A (zh) * 2006-07-12 2009-07-22 Lg电子株式会社 信号处理方法及其装置
CN101945277A (zh) * 2006-01-12 2011-01-12 Lg电子株式会社 处理多视图视频

Family Cites Families (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE4344924A1 (de) 1993-12-30 1995-08-10 Thomson Brandt Gmbh Verfahren und Vorrichtung zur Bewegungsschätzung
JP2004023458A (ja) 2002-06-17 2004-01-22 Toshiba Corp 動画像符号化/復号化方法及び装置
KR100584603B1 (ko) 2004-08-03 2006-05-30 학교법인 대양학원 다시점 영상의 다이렉트 모드 움직임 예측 방법 및 장치
US20070014346A1 (en) 2005-07-13 2007-01-18 Nokia Corporation Coding dependency indication in scalable video coding
JP5020953B2 (ja) 2005-07-18 2012-09-05 エレクトロニクス アンド テレコミュニケーションズ リサーチ インスチチュート 時間及び視点間参照映像バッファを活用した予測符号化/復号化装置及びその方法
US8644386B2 (en) * 2005-09-22 2014-02-04 Samsung Electronics Co., Ltd. Method of estimating disparity vector, and method and apparatus for encoding and decoding multi-view moving picture using the disparity vector estimation method
EP1929783B1 (en) * 2005-09-29 2017-06-21 Samsung Electronics Co., Ltd. Method and apparatus for encoding a multi-view picture using disparity vectors, and computer readable recording medium storing a program for executing the method
KR101276720B1 (ko) 2005-09-29 2013-06-19 삼성전자주식회사 카메라 파라미터를 이용하여 시차 벡터를 예측하는 방법,그 방법을 이용하여 다시점 영상을 부호화 및 복호화하는장치 및 이를 수행하기 위한 프로그램이 기록된 기록 매체
ZA200805337B (en) 2006-01-09 2009-11-25 Thomson Licensing Method and apparatus for providing reduced resolution update mode for multiview video coding
WO2007081177A1 (en) 2006-01-12 2007-07-19 Lg Electronics Inc. Processing multiview video
KR100959538B1 (ko) 2006-03-30 2010-05-27 엘지전자 주식회사 비디오 신호를 디코딩/인코딩하기 위한 방법 및 장치
BRPI0714022A2 (pt) 2006-07-06 2012-12-04 Thomson Licensing método e aparelho para separar o número do quadro e /ou a contagem de ordem de imagem (poc) para codificação e decodificação de vìdeo multi-visão
KR101336204B1 (ko) * 2006-08-18 2013-12-03 주식회사 케이티 다시점 비디오에서 전역변이를 이용하여 상이한 시점의 화면들을 압축 또는 복호하는 인코더와 인코딩하는 방법 및디코더와 디코딩하는 방법
CA2663084C (en) 2006-09-20 2014-08-12 Nippon Telegraph And Telephone Corporation Image encoding method and decoding method, apparatuses therefor, programs therefor, and storage media for storing the programs
BRPI0717321A2 (pt) 2006-10-13 2013-10-22 Thomson Licensing Método para gerenciamento de imagens de referência envolvendo codificação de vídeo com mútiplas visualizações
ES2702704T3 (es) 2006-10-16 2019-03-05 Nokia Technologies Oy Sistema y procedimiento para implementar una administración eficiente de memoria intermedia decodificada en codificación de video de vistas múltiples
JP2010507975A (ja) 2006-10-24 2010-03-11 トムソン ライセンシング 多視点映像符号化のための画像の管理
JP4999859B2 (ja) 2006-10-30 2012-08-15 日本電信電話株式会社 予測参照情報生成方法、動画像符号化及び復号方法、それらの装置、及びそれらのプログラム並びにプログラムを記録した記憶媒体
ES2439444T3 (es) 2006-10-30 2014-01-23 Nippon Telegraph And Telephone Corporation Método de codificación y método de descodificación de vídeo, aparatos para los mismos, programas para los mismos y medios de almacenamiento que almacenan los programas
JP5023739B2 (ja) 2007-02-28 2012-09-12 ソニー株式会社 画像情報符号化装置及び符号化方法
EP2135454A4 (en) 2007-03-02 2010-09-01 Lg Electronics Inc METHOD AND DEVICE FOR DECODING / CODING A VIDEO SIGNAL
US10298952B2 (en) * 2007-08-06 2019-05-21 Interdigital Madison Patent Holdings Methods and apparatus for motion skip move with multiple inter-view reference pictures
EP2177036A2 (en) * 2007-08-15 2010-04-21 Thomson Licensing Methods and apparatus for motion skip mode in multi-view coded video using regional disparity vectors
KR101712915B1 (ko) 2007-10-16 2017-03-07 엘지전자 주식회사 비디오 신호 처리 방법 및 장치
KR101385884B1 (ko) 2008-01-30 2014-04-16 고려대학교 산학협력단 다시점 동영상의 부호화 및 복호화 방법 및 장치
ES2812473T3 (es) 2008-03-19 2021-03-17 Nokia Technologies Oy Vector de movimiento combinado y predicción de índice de referencia para la codificación de vídeo
KR101727311B1 (ko) * 2008-04-25 2017-04-14 톰슨 라이센싱 깊이 정보에 기초한 디스패리티 예측을 구비한 다중 시점 비디오 코딩
US20100086063A1 (en) 2008-10-02 2010-04-08 Apple Inc. Quality metrics for coded video using just noticeable difference models
WO2010043773A1 (en) 2008-10-17 2010-04-22 Nokia Corporation Sharing of motion vector in 3d video coding
WO2010086500A1 (en) 2009-01-28 2010-08-05 Nokia Corporation Method and apparatus for video coding and decoding
US20100246683A1 (en) 2009-03-27 2010-09-30 Jennifer Lois Harmon Webb Error Resilience in Video Decoding
JP5429034B2 (ja) * 2009-06-29 2014-02-26 ソニー株式会社 立体画像データ送信装置、立体画像データ送信方法、立体画像データ受信装置および立体画像データ受信方法
US9060176B2 (en) 2009-10-01 2015-06-16 Ntt Docomo, Inc. Motion vector prediction in video coding
KR101768207B1 (ko) 2010-01-19 2017-08-16 삼성전자주식회사 축소된 예측 움직임 벡터의 후보들에 기초해 움직임 벡터를 부호화, 복호화하는 방법 및 장치
WO2012096164A1 (ja) 2011-01-12 2012-07-19 パナソニック株式会社 画像符号化方法、画像復号方法、画像符号化装置および画像復号装置
US20120189060A1 (en) * 2011-01-20 2012-07-26 Industry-Academic Cooperation Foundation, Yonsei University Apparatus and method for encoding and decoding motion information and disparity information
US9749657B2 (en) 2011-01-21 2017-08-29 Sharp Kabushiki Kaisha Buffer compression for motion vector competition
KR20120095610A (ko) 2011-02-21 2012-08-29 삼성전자주식회사 다시점 비디오의 부호화 방법 및 장치, 그 복호화 방법 및 장치
JP5664762B2 (ja) 2011-03-17 2015-02-04 富士通株式会社 動画像復号方法、動画像符号化方法、動画像復号装置及び動画像復号プログラム
KR20120118780A (ko) 2011-04-19 2012-10-29 삼성전자주식회사 다시점 비디오의 움직임 벡터 부호화 방법 및 장치, 그 복호화 방법 및 장치
US9485517B2 (en) 2011-04-20 2016-11-01 Qualcomm Incorporated Motion vector prediction with motion vectors from multiple views in multi-view video coding
EP2745513B1 (en) 2011-08-19 2020-03-11 Telefonaktiebolaget LM Ericsson (publ) Motion vector processing
RU2583040C2 (ru) 2011-08-30 2016-05-10 Нокиа Текнолоджиз Ой Устройство, способ и компьютерная программа для кодирования и декодирования видеосигналов
US9503720B2 (en) 2012-03-16 2016-11-22 Qualcomm Incorporated Motion vector coding and bi-prediction in HEVC and its extensions
US10200709B2 (en) 2012-03-16 2019-02-05 Qualcomm Incorporated High-level syntax extensions for high efficiency video coding

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101945277A (zh) * 2006-01-12 2011-01-12 Lg电子株式会社 处理多视图视频
CN101491096A (zh) * 2006-07-12 2009-07-22 Lg电子株式会社 信号处理方法及其装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Disparity vector prediction CE plan for MVC/CE4;Takanori Senoh;《MOTION PICTUREEXPERT GROUP OR ISO/IEC JTC1/SC29/WG11》;20060329;第1页倒数第1-2行、第2页第14-17行、第4页第25-31行、图1、图3 *

Also Published As

Publication number Publication date
JP2016026435A (ja) 2016-02-12
JP2014514862A (ja) 2014-06-19
EP2700227A1 (en) 2014-02-26
JP6552923B2 (ja) 2019-07-31
AU2012245299A1 (en) 2013-10-24
TWI543591B (zh) 2016-07-21
AU2012245299B2 (en) 2015-12-24
US20130272408A1 (en) 2013-10-17
JP5805850B2 (ja) 2015-11-10
KR101658694B1 (ko) 2016-09-21
BR112013026961A2 (pt) 2017-01-10
EP2700228B1 (en) 2017-04-12
US20120269270A1 (en) 2012-10-25
US9584823B2 (en) 2017-02-28
JP2014514861A (ja) 2014-06-19
JP5805849B2 (ja) 2015-11-10
WO2012145670A1 (en) 2012-10-26
RU2013151612A (ru) 2015-05-27
US20120269271A1 (en) 2012-10-25
HUE034333T2 (en) 2018-02-28
KR101600154B1 (ko) 2016-03-14
TW201249215A (en) 2012-12-01
US9247249B2 (en) 2016-01-26
SG10201602588RA (en) 2016-05-30
MY185037A (en) 2021-04-30
WO2012145663A1 (en) 2012-10-26
KR20140018968A (ko) 2014-02-13
CN103650505B (zh) 2018-01-23
CN103503460A (zh) 2014-01-08
US9485517B2 (en) 2016-11-01
TWI526055B (zh) 2016-03-11
CA2833302A1 (en) 2012-10-26
EP2700228A1 (en) 2014-02-26
CA2833302C (en) 2018-07-03
ES2633150T3 (es) 2017-09-19
IL228804A0 (en) 2013-12-31
SG194058A1 (en) 2013-11-29
KR20140018967A (ko) 2014-02-13
CN103650505A (zh) 2014-03-19
IL228804A (en) 2016-11-30
TW201249214A (en) 2012-12-01

Similar Documents

Publication Publication Date Title
CN103503460B (zh) 译码视频数据的方法和设备
CN107211156B (zh) 一种译码视频数据的方法、装置及计算机可读存储媒体
CN104170380B (zh) 视频译码中的视差矢量预测
CN105379282B (zh) 用于纹理译码的先进残余预测(arp)的方法和设备
CN104769949B (zh) 用于视差向量导出的图片的选择的方法和装置
CN104025602B (zh) 三维视频译码中用信号通知视图合成预测支持
CN105874797B (zh) 视频数据的编解码方法、装置、设备和存储媒体
CN105122812B (zh) 用于三维(3d)视频译码的高级合并模式
CN105359530B (zh) 面向深度的视图间运动向量预测
CN105556969B (zh) 视频译码中使用视差向量的块识别
CN104303502B (zh) 对多视图视频数据进行编码、解码和译码的方法、装置及计算机可读存储介质
CN104396250B (zh) 用于3d视频译码的深度图的帧内译码的方法和装置
CN104126305B (zh) 用于多视图视频译码mvc兼容三维视频译码3dvc的序列等级信息
CN105027571B (zh) 三维视频译码中导出的视差向量
CN104396243B (zh) 用于视频压缩的自适应上取样滤波器
CN110100436A (zh) 使用导出色度模式译码视频数据
CN105122811B (zh) 3d视频译码中的相邻块视差向量导出
CN104838651A (zh) 可缩放及多视角视频译码中的高级残差预测
CN105874788B (zh) 对3d视频译码中较大预测块的逐段dc译码的简化
CN106105216A (zh) 用于3d视频译码的受约束深度帧内模式译码
CN105580374B (zh) 一种对多层视频数据进行编解码的方法、视频解码设备及存储媒体
CN105191319A (zh) 对3d视频译码中的视差向量导出和运动向量预测的简化
CN104704833A (zh) 多视图或3维视频译码中的高级视图间残差预测
CN106471806A (zh) 3d‑hevc中的简化移位合并候选者及合并列表导出
CN104272741A (zh) 多视图译码和3d译码中的视图相依性

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1189734

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1189734

Country of ref document: HK