CN101611633A - 用于针对多视角视频编码和解码解耦合帧号和/或图像顺序计数(poc)的方法和装置 - Google Patents

用于针对多视角视频编码和解码解耦合帧号和/或图像顺序计数(poc)的方法和装置 Download PDF

Info

Publication number
CN101611633A
CN101611633A CNA2007800257184A CN200780025718A CN101611633A CN 101611633 A CN101611633 A CN 101611633A CN A2007800257184 A CNA2007800257184 A CN A2007800257184A CN 200780025718 A CN200780025718 A CN 200780025718A CN 101611633 A CN101611633 A CN 101611633A
Authority
CN
China
Prior art keywords
visual angle
image
existing
visual
identifier
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2007800257184A
Other languages
English (en)
Other versions
CN101611633B (zh
Inventor
帕文·拜哈斯·潘迪特
苏晔平
尹鹏
克里斯蒂娜·古米拉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
InterDigital VC Holdings Inc
Original Assignee
Thomson Licensing SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Licensing SAS filed Critical Thomson Licensing SAS
Priority claimed from PCT/US2007/015678 external-priority patent/WO2008005574A2/en
Publication of CN101611633A publication Critical patent/CN101611633A/zh
Application granted granted Critical
Publication of CN101611633B publication Critical patent/CN101611633B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/597Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding specially adapted for multi-view video sequence encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

公开和描述了一种用于对于来自比特流的多视角视频内容的至少两个视角中的至少一个视角相对应的至少一个图像进行解码的解码器(250)和解码方法(410),其中在比特流中,该至少一个图像的编码顺序信息和输出顺序信息中的至少一个被与至少一个图像所对应的至少一个视角解耦合。此外,公开和描述了一种用于对与多视角视频内容的至少两个视角中的至少一个视角相对应的至少一个图像进行编码以形成结果比特流的编码器(200)和编码方法(360),其中在结果比特流中,该至少一个图像的编码顺序信息和输出顺序信息中的至少一种被与至少一个图像所对应的至少一个视角解耦合。

Description

用于针对多视角视频编码和解码解耦合帧号和/或图像顺序计数(POC)的方法和装置
相关申请的交叉引用
本申请要求2006年7月6日提交的美国临时申请No.60/818,874和2006年7月18日提交的美国临时申请No.60/807,706的优先权,这两个申请通过引用分别整体结合于此。另外,本申请与共同转让且同时提交的题为“Method and Apparatus for Decoupling Frame Number and/or Picture OrderCount(POC)for Multi-view Video Encoding and Decoding”的非临时申请(律师案卷号No.PU060220)有关,该申请也通过引用结合于此。
技术领域
本发明的原理一般地涉及视频编码和解码,更具体而言,涉及用于针对多视角(multi-view)视频编码和解码将帧号(frame number)和/或图像顺序计数(Picture Order Count,POC)解耦合的方法和装置。
背景技术
在国际标准化组织/国际电工委员会(ISO/IEC)运动图像专家组-4(MPEG-4)第10部分高级视频编码(AVC)标准/国际电信联盟电信部门(ITU-T)H.264推荐(下文中称为“MPEG-4 AVC标准”)中,语法元素frame_num被用作图像的标识符,并且具有若干约束,如MPEG-4AVC标准中所定义的。frame_num的主要目的是用作计数器,其在每次图像被解码时递增,从而如果存在数据损失,则解码器可以检测到某些图像丢失并将能够隐藏该问题。frame_num按照访问单元的解码顺序增大,并且并不一定指示显示顺序。存储器管理控制操作(MMCO)使用frame_num的值来标记图像作为长期(long term)和短期参考;或者将参考图像标记为未用于参考图像。frame_num还用于P和SP片断(slice)的默认参考列表排序。
MPEG-4 AVC标准中的图像顺序计数是对特定图像的定时或输出排序的指示。图像顺序计数是一个变量,其值相对于按解码顺序的前一瞬时解码刷新(IDR)图像或者相对于包含存储器管理控制操作(将所有参考图像标记为“不用作参考”)的前一图像并不随着输出顺序的图像位置的增大而减小。从片断头部语法元素中导出图像顺序计数。图像顺序计数被用在时间直接模式(temporal DIRECT mode)内的运动向量的导出中、隐式加权预测中、以及B片断的默认初始参考图像列表排序中。
具体而言,一般来说对于当前宏块/块,通过考虑后续参考图像(或者更精确地说是第一列表1参考)中共位位置(co-located position)内的运动信息,来导出使用时间相关的直接模式运动参数。转到图1,标号100总地指示图示B片断编码中的时间直接预测的视图。下面假定一个对象正以恒定速度移动,则这些参数根据所涉及的参考图像的时间距离(如图1所示)被缩放。直接编码块的运动向量
Figure A20078002571800121
Figure A20078002571800122
相对于其第一列表1参考中的共位位置的运动向量
Figure A20078002571800123
是按如下方式计算的:
X=(16384+abs(TDD/2))/TDD            (1)
ScaleFactor=clip(-1024,1023,(TDB×X+32)>>6)        (2)
MV → L 0 = ( ScaleFactor × MV → + 128 ) > > 8 - - - ( 3 )
MV → L 1 = MV → L 0 - MV → - - - ( 4 )
在前面的等式中,TDB和TDD分别是与当前和列表1图像相比、列表1图像中的共位块的列表0运动向量所使用的参考图像的时间距离(或更正确地说,是图像顺序计数(POC)距离)。列表1参考图像和被列表中的共位块的运动向量所参考的列表0中的参考被用作直接模式的两个参考。如果参考索引refIdxL0指的是长期参考图像,或者DiffPicOrderCnt(pic1,pic0)等于0,则直接模式分区的运动向量
Figure A20078002571800126
通过下式导出:
Figure A20078002571800128
MV → L 1 = 0
隐式加权预测工具也使用图像顺序计数信息来确定权重。在隐式加权预测(WP)模式中,权重因子并不在片断头部中明确发送,而是基于当前图像和参考图像之间的相对距离来导出。隐式模式仅用于B片断中双向预测编码的宏块和宏块分区,包括那些使用直接模式的宏块。对于隐式模式,使用了等式(1)中所示的公式,不同之处在于偏移值O0和O1等于零,并且权重因子W0和W1是利用下面的等式(6)至等式(10)中的公式导出的:
predPartC[x,y]=Clip1C(((predPartL0C[x,y]*w0+predPartL1C[x,y]*    (5)
w1+2logWD)>>(logWD+1))+((o0+o1+1)>>1))
X=(16384+(TDD>>1))/TDD      (6)
Z=clip3(-1024,1023,(TDB·X+32)>>6)         (7)
W1=Z>>2       (8)
W0=64-W1        (9)
这是下式的无除法16比特安全操作实现方式:
W1=(64·TDD)/TDB      (10)
DiffPicOrderCnt(picA,picB)=PicOrderCnt(picA)-PicOrderCnt(picB)    (11)
其中TDB是列表1参考图像和列表0参考图像之间的时间差,其被限制在范围[-128,127]内,TDB是当前图像和列表0参考图像之间的差,其被限制在范围[-128,127]内。在多视角视频编码中,可能存在TDD值为零的情况(当等式(11)中的DiffPicOrderCnt(pic1,pic2)变为零时,这一情况发生)。在这种情况下,权重W0和W1被设置为32。
在多视角视频编码(MVC)的当前的符合MPEG-4 AVC的实现方式中,参考软件通过将所有视频序列交织到单个流中来实现多视角预测。这样,视角之间的frame_num和图像顺序计数被耦合在一起。这样有若干缺点。一个缺点是对于部分解码在frame_num的值中存在间隙。这可能使参考图像列表的管理复杂或者使基于frame_num间隙的错误损失检测无法实现。另一个缺点是图像顺序计数不具有真正物理上的含义,它可能破坏依赖于图像顺序计数信息的任何编码工具,例如时间直接模式或隐式加权预测。另一个缺点是耦合使得多视角序列的并行编码更加困难。
发明内容
现有技术的这些和其他不足和缺点由本发明的原理加以解决,本发明的原理涉及一种用于针对多视角视频编码和解码来解耦合帧号和图像顺序计数(POC)的方法和装置。
根据本发明的原理的一方面,提供了一种装置。该装置包括编码器,该编码器用于对与多视角视频内容的至少两个视角中的至少一个视角相对应的至少一个图像进行编码以形成结果比特流。在结果比特流中,该至少一个图像的编码顺序信息和输出顺序信息中的至少一种被与至少一个图像所对应的至少一个视角解耦合。
根据本发明的原理的另一方面,提供了一种方法。该方法包括对与多视角视频内容的至少两个视角中的至少一个视角相对应的至少一个图像进行编码以形成结果比特流。在结果比特流中,该至少一个图像的编码顺序信息和输出顺序信息中的至少一种被与至少一个图像所对应的至少一个视角解耦合。
根据本发明的原理的又一方面,提供了一种装置。该装置包括编码器,该编码器用于对与多视角视频内容相对应的至少两个视角中的至少一个进行编码。该编码器利用默认参考图像列表构造过程和参考图像列表重排序中的重新定义的变量来对至少两个视角中的至少一个进行编码,该默认参考图像列表构造过程和参考图像列表重排序对应于国际标准化组织/国际电工委员会运动图像专家组-4第10部分高级视频编码标准/国际电信联盟电信部门H.264推荐。
根据本发明的原理的又一方面,提供了一种装置。该装置包括编码器,该编码器用于对与多视角视频内容相对应的至少两个视角中的至少一个进行编码。该编码器利用解码参考图像标记过程中的重新定义的变量来对至少两个视角中的至少一个进行编码,该解码参考图像标记过程对应于国际标准化组织/国际电工委员会运动图像专家组-4第10部分高级视频编码标准/国际电信联盟电信部门H.264推荐。
根据本发明的原理的又一方面,提供了一种方法。该方法包括对与多视角视频内容相对应的至少两个视角中的至少一个进行编码。该编码步骤利用默认参考图像列表构造过程和参考图像列表重排序中的重新定义的变量来对至少两个视角中的至少一个进行编码,该默认参考图像列表构造过程和参考图像列表重排序对应于国际标准化组织/国际电工委员会运动图像专家组-4第10部分高级视频编码标准/国际电信联盟电信部门H.264推荐。
根据本发明的原理的又一方面,提供了一种方法。该方法包括对与多视角视频内容相对应的至少两个视角中的至少一个进行编码。该编码步骤利用解码参考图像标记过程中的重新定义的变量来对至少两个视角中的至少一个进行编码,该解码参考图像标记过程对应于国际标准化组织/国际电工委员会运动图像专家组-4第10部分高级视频编码标准/国际电信联盟电信部门H.264推荐。
本发明的原理的这些和其他方面、特征和优点将从下面结合附图阅读的对示例性实施例的详细描述中变清楚。
附图说明
根据以下的示例性附图可以更好地理解本发明的原理,在附图中:
图1是图示B片断编码中的时间直接预测的视图;
图2A是根据本发明的原理的实施例、本发明的原理可以应用到的示例性多视角视频编码(MVC)编码器的框图;
图2B是根据本发明的原理的实施例、本发明的原理可以应用到的示例性多视角视频编码(MVC)解码器的框图;
图3是根据本发明的原理的实施例、用于利用修改后的解码参考图像标记来对多视角视频内容进行编码的示例性方法的流程图;
图4是根据本发明的原理的实施例、用于利用修改后的解码参考图像标记来对多视角视频内容进行解码的示例性方法的流程图;
图5是根据本发明的原理的实施例、用于利用修改后的参考图像列表构造来对多视角视频内容进行编码的示例性方法的流程图;
图6是根据本发明的原理的实施例、用于利用修改后的参考图像列表构造来对多视角视频内容进行编码的另一种示例性方法的流程图;
图7是根据本发明的原理的实施例、用于利用修改后的参考图像列表构造来对多视角视频内容进行编码的又一种示例性方法的流程图;
图8是根据本发明的原理的实施例、用于利用修改后的参考图像列表构造来对多视角视频内容进行解码的示例性方法的流程图;
图9是根据本发明的原理的实施例、用于利用修改后的参考图像列表构造来对多视角视频内容进行解码的另一种示例性方法的流程图;
图10是根据本发明的原理的实施例、用于利用修改后的参考图像列表构造来对多视角视频内容进行解码的又一种示例性方法的流程图;
图11是根据本发明的原理的实施例、用于利用时间直接模式和隐式加权预测来对多视角视频内容进行编码的示例性方法的流程图;
图12是根据本发明的原理的实施例、用于利用时间直接模式和隐式加权预测来对多视角视频内容进行编码的另一种示例性方法的流程图;
图13是根据本发明的原理的实施例、用于利用修改后的解码参考图像标记来对多视角视频内容进行解码的示例性方法的流程图;
图14是根据本发明的原理的实施例、用于利用修改后的解码参考图像标记来对多视角视频内容进行解码的另一种示例性方法的流程图;
图15是根据本发明的原理的实施例、用于利用修改后的解码参考图像标记来对多视角视频内容进行编码的示例性方法的流程图;
图16是根据本发明的原理的实施例、用于利用修改后的解码参考图像标记来对多视角视频内容进行解码的示例性方法的流程图;
图17是根据本发明的原理的实施例、用于利用修改后的参考图像列表构造和帧号计算来对多视角视频内容进行编码的示例性方法的流程图;
图18是根据本发明的原理的实施例、用于利用修改后的参考图像列表构造和帧号计算来对多视角视频内容进行编码的另一种示例性方法的流程图;
图19是根据本发明的原理的实施例、用于利用修改后的参考图像列表构造和帧号计算来对多视角视频内容进行解码的示例性方法的流程图;
图20是根据本发明的原理的实施例、用于利用修改后的参考图像列表构造和帧号计算来对多视角视频内容进行解码的另一种示例性方法的流程图;
图21是根据本发明的原理的实施例、用于通过参考图像列表重排序(RPLR)命令、利用修改后的参考图像列表初始化来对多视角视频内容进行编码的示例性方法的流程图;
图22是根据本发明的原理的实施例、用于通过参考图像列表重排序(RPLR)命令、利用修改后的参考图像列表初始化来对多视角视频内容进行编码的另一种示例性方法的流程图;
图23是根据本发明的原理的实施例、用于通过参考图像列表重排序(RPLR)命令、利用修改后的参考图像列表构造来对多视角视频内容进行解码的示例性方法的流程图;以及
图24是根据本发明的原理的实施例、用于通过参考图像列表重排序(RPLR)命令、利用修改后的参考图像列表构造来对多视角视频内容进行解码的另一种示例性方法的流程图。
具体实施方式
本发明的原理涉及一种用于针对多视角视频编码和解码来将帧号和图像顺序计数(POC)解耦合的方法和装置。
这里的描述说明了本发明的原理。因而,将会意识到,本领域技术人员能够设计各种布置,这些布置尽管在这里没有明确描述或示出,但是也能实现本发明的原理并且被包括在其精神和范围内。
这里所记载的所有示例和条件性语言都是为了教导目的,以帮助阅读者理解作为本发明的发明人对现有技术的贡献的本发明的原理和概念,并且被解释为不以任何方式限制这里具体记载的示例和条件。
而且,这里记载本发明的原理的各方面和实施例以及其特定示例的所有陈述都是为了包含其结构和功能等同物两者。另外,希望这些等同物既包括当前已知的等同物,又包括在未来开发的等同物,即,开发来执行相同功能(无论结构如何)的任何元素。
因而,例如,本领域技术人员将意识到,这里给出的框图表示实现本发明的原理的说明性电路的概念图。类似地,将会意识到,任何的流程表、流程图、状态转变图、伪代码等等都表示可以实质表示在计算机可读介质中并因此被计算机或处理器执行的各种过程,无论这种计算机或处理器是否明确示出。
附图中所示的各种元素的功能可以通过使用专用硬件以及能够与适当软件相关联地运行软件的硬件来提供。当由处理器提供时,这些功能可以由单个专用处理器提供,由单个共享处理器提供,或者由多个独立处理器提供,其中这多个处理器中的一些可以被共享。而且,术语“处理器”或“控制器”的明确使用不应当被解释为专有地指代能够运行软件的硬件,而是可以隐含地包括但不限于数字信号处理器(DSP)硬件、用于存储软件的只读存储器(ROM)、随机访问存储器(RAM)和非易失性存储装置。
也可包括其他硬件(常规的和/或定制的)。类似地,附图中所示的任何开关都只是概念性的。它们的功能可以通过程序逻辑的操作、通过专用逻辑、通过程序控制和专用逻辑的交互或者甚至手工地来执行,实施者可选择的特定技术可以从上下文中得到更具体的理解。
在其权利要求中,表达为用于执行特定功能的装置的任何元素都是为了包含执行该功能的任何方式,例如包括a)执行该功能的电路元素的组合或者b)任何形式的软件(包括固件、微代码等等)与用于执行该软件以实现功能的适当电路的组合。这些权利要求中所定义的本发明的原理体现了这样一个事实,即所记载的各种装置所提供的功能被组合并以权利要求所引用的方式被结合在一起。因而,可以认为可提供这些功能的任何装置都等同于这里所示出的内容。
说明书中提到本发明的原理的“一个实施例”或“实施例”是指结合实施例所描述的特定特征、结构、特性等等被包括在本发明的原理的至少一个实施例中。因而,在说明书中各处出现的术语“在一个实施例中”或“在实施例中”并不一定指的是同一实施例。
这里所用的“高层语法”是指在比特流中存在的语法,其在分级结构中位于宏块层之上。例如,这里所用的高层语法可以指(但不限于)在片断头部级别、在补充增强信息(SEI)级别、在图像参数集级别、在序列参数集级别和在NAL单元头部级别的语法。
另外,这里所用的“先前未使用的语法”是指还未存在于任何当前已知的视频编码标准和推荐及其扩展(包括但不限于MPEG-4 AVC标准)中的语法。
另外,这里所用的“编码顺序信息”是指存在于视频比特流中的信息,其指示比特流中的图像被编码和/或解码的顺序。编码顺序信息例如可包括frame_num。
另外,这里所用的“输出顺序信息”是指存在于视频比特流中的信息,其指示比特流中的图像被输出的顺序。输出顺序信息例如可包括图像顺序计数(POC)值。
而且,将要意识到,尽管这里本发明的原理是针对MPEG-4 AVC标准描述的,但是本发明的原理并不仅限于这一标准,因而,可以用于其他视频编码标准和其扩展,包括MPEG-4 AVC标准的扩展,同时仍然保持了本发明的原理的精神。
另外,这里互换使用的“交叉视角”(cross-view)和“间隔视角”(inter-view)都是指属于除了当前视角以外的视角的图像。
转到图2A,标号100总地指示一种示例性的多视角视频编码(MVC)编码器。编码器100包括组合器105,组合器105具有与变换器110的输入相连以进行信号传输的输出。变换器110的输出与量化器115的输入相连以进行信号传输。量化器115的输出与熵编码器120的输入和逆量化器125的输入相连以进行信号传输。逆量化器125的输出与逆变换器130的输入相连以进行信号传输。逆变换器130的输出与组合器135的第一非反相输入相连以进行信号传输。组合器135的输出与内预测器145的输入和解块滤波器150的输入相连以进行信号传输。解块滤波器150的输出与参考图像存储装置155(用于视角i)的输入相连以进行信号传输。参考图像存储装置155的输出与运动补偿器175的第一输入和运动估计器180的第一输入相连以进行信号传输。运动估计器180的输出与运动补偿器175的第二输入相连以进行信号传输。
参考图像存储装置160(用于其他视角)与差异估计器170的第一输入和差异补偿器165的第一输入相连以进行信号传输。差异估计器170的输出与差异补偿器165的第二输入相连以进行信号传输。
熵编码器120的输出可用作编码器100的输出。组合器105的非反相输入可用作编码器100的输入,并且与差异估计器170的第二输入和运动估计器180的第二输入相连以进行信号传输。开关185的输出与组合器135的第二非反相输入和组合器105的反相输入相连以进行信号传输。开关185包括与运动补偿器175的输出相连以进行信号传输的第一输入、与差异补偿器165的输出相连以进行信号传输的第二输入、以及与内预测器145的输出相连以进行信号传输的第三输入。
转到图2B,标号3200总地指示一种示例性的多视角视频编码(MVC)解码器。解码器3200包括熵解码器3205,熵解码器3205具有与逆量化器3210的输入相连以进行信号传输的输出。逆量化器的输出与逆变换器3215的输入相连以进行信号传输。逆变换器3215的输出与组合器3220的第一非反相输入相连以进行信号传输。组合器3220的输出与解块滤波器3225的输入和内预测器3230的输入相连以进行信号传输。解块滤波器3225的输出与参考图像存储装置3240(用于视角i)的输入相连以进行信号传输。参考图像存储装置3240的输出与运动补偿器3235的第一输入相连以进行信号传输。
参考图像存储装置3245(用于其他视角)与差异补偿器3250的第一输入相连以进行信号传输。
熵解码器3205的输入可用作对解码器3200的输入,用于接收残留比特流。而且,开关3255的控制输入也可用作对解码器3200的输入,用于接收控制语法以控制哪一个输入被开关3255选择。另外,运动补偿器3235的第二输入可用作解码器3200的输入,用于接收运动向量。另外,差异补偿器3250的第二输入可用作对解码器3200的输入,用于接收差异向量。
开关3255的输出与组合器320的第二非反相输入相连以进行信号传输。开关3255的第一输入与差异补偿器3250的输出相连以进行信号传输。开关3255的第二输入与运动补偿器3235的输出相连以进行信号传输。开关3255的第三输入与内预测器3230的输出相连以进行信号传输。模式模块3260的输出与开关3255相连以进行信号传输,用于控制哪一个输入被开关3255选择。解块滤波器3225的输出可用作解码器的输出。
根据本发明的原理,可以对MPEG-4 AVC标准的高层语法提出若干改变以高效地对多视角视频序列进行编码。在一个实施例中,提出了在对多视角视频序列编码时解耦合视角之间的帧号(frame_num)和/或图像顺序计数(POC)值。一种可能的应用是,可以对每个视角独立地应用符合MPEG-4 AVC的解码和输出过程。在一个实施例中,视角之间的帧号和/或图像顺序计数值是通过发送针对每个视角的视角id(viewId)来解耦合的。先前,已经简单地提出了在高层语法中添加视角标识符(view_id),这是因为对于若干种多视角视频编码(MVC)需求来说需要view_id信息,这些需求包括视角插值/合成、视角随机访问、并行处理等等。view_id信息也可以用于只与交叉视角预测有关的特殊编码模式。根据本发明的原理,正是该view_id可用来对多视角视频内容的视角之间的帧号和图像顺序计数值解耦合。而且,在一个实施例中,提出了一种用于针对多视角视频编码固定MPEG-4 AVC标准中的编码工具的解决方案。
在一个实施例中,每个视角将具有不同的view_id,从而允许相同的frame_num和POC被重新用于不同的视角。
T0 T8 T4 T2 T6 T1 T3 T5 T7(时间)
S0 I0 I8 B4 B2 B6 B1 B3 B5 B7(视角0片断类型)
S1 B0 B8 B4 B2 B6 B1 B3 B5 B7(视角1片断类型)
S2 P0 P8 B4 B2 B6 B1 B3 B5 B7(视角2片断类型)
0 1 2 3 4 5 6 7 8(frame_num)
存在若干种可以对不同视角编码以进行并行处理的方式。一种可能的方式是以这样一种方式编码,该方式使得对于一个GOP一个视角中的图像被首先编码,接着是来自另一视角的图像被用相同GOP大小编码,直到对于该GOP所有视角都已被编码为止。然后对于其他GOP重复该过程。在以上说明中,首先是视角S0中的图像被编码,接着是来自视角S2的图像,然后是来自S1的图像。
另一种可能的方式是对于所有视角中属于相同时间段的所有图像首先进行编码,接着是对所有视角中属于另一时间段的另一组图像进行编码。该过程被重复,直到所有图像都已被编码为止。在以上说明中,首先视角S0、S1、S2中在时间段T0的所有图像被编码,接着是T8、T4等。本发明不需要明确图像被编码的顺序。
下文中,将讨论根据本发明的原理的各种实施例对MPEG-4 AVC标准的改变。还将示出这些改变中的一个或多个是如何可以对多视角序列进行并行编码的。然而,将会意识到,尽管本发明的原理在这里主要是针对MPEG-4 AVC标准描述的,但是本发明的原理也可以针对MPEG-4 AVC标准的扩展以及其他视频编码标准及其推荐和扩展实现,同时仍保持本发明的原理的范围,这在给定这里提供的本发明的原理的教导的情况下很容易被本领域技术人员所确定。
解码参考图像标记过程
在当前MPEG-4 AVC标准中,在解码图像缓冲器(DPB)中不允许多个图像具有相同的frame_num。然而,根据本发明的原理的实施例,该限制可以在多视角视频编码(MVC)中得到放松,这是因为已将frame_num和/或图像顺序计数解耦合,即,提出了每个视角具有其自身的独立frame_num和/或图像顺序计数值。为了实现这一目的,在一个实施例中,将view_id与解码图像相关联。这对于每个图像引入了另一维度。因而,在一个实施例中,解码参考图像标记过程被重新定义以包括view_id。
有两种方法供MPEG-4 AVC标准来实现解码参考图像标记。MPEG-4AVC标准中用于解码参考图像标记的第一方法涉及滑动窗口解码参考图像标记。MPEG-4 AVC标准中用于解码参考图像标记的第二方法涉及自适应存储器控制解码参考图像标记。
根据本发明的原理的各种实施例,这些方法中的一个或多个被改变以考虑到在片断头部中存在的新view_id。表1图示了根据本发明的原理的实施例的片断头部语法。
表1
  slice_header(){  C   描述符
 first_mb_in_slice   2   ue(v)
 slice_type   2   ue(v)
 pic_parameter_set_id   2   ue(v)
 if(nal_unit_type==22||nal_unit_type==23){
     view_parameter_set_ID   2   ue(v)
     view_ID   2   ue(v)
 }
 frame_num   2   u(v)
 if(!frame_mbs_only_flag){
    field_pic_flag   2   u(l)
    if(field_pic_flag)
       bottom_field_flag   2   u(l)
 }
......
}
对于MPEG-4 AVC标准中用于解码参考图像标记的第一方法,当存在具有相同frame_num/POC值但是具有不同view_id值的图像时,应当指定默认行为。根据本发明的原理的这样的默认行为的一个实施例是仅仅向与当前解码图像具有相同view_id的那些图像应用MMCO命令。
对于MPEG-4 AVC标准中用于解码参考图像标记的第二方法,提供了根据本发明的原理的各种实施例,其中引入了新的存储器管理控制操作(MMCO)命令并且/或者修改了MPEG-4 AVC标准中的现有MMCO命令,以考虑到需要被标记的图像的view_id。重新定义现有MMCO(当memory_management_control_operation等于1时)的一个实施例涉及以下过程:
令picNumX由下式指定:
picNumX=CurrPicNum-(difference_of_pic_nums_minus1+1)
viewIdX=CurrViewId-(difference_of_view_ids_minus1+1)
其中picNumX、CurrPicNum、difference_of_pic_nums_mins1在当前MPEG-4 AVC标准中被定义,并且viewIdX是要利用MMCO命令标记的图像的viewId,CurrViewId是当前解码图像的viewId,并且difference_of_view_ids_minus1是当前viewId和要利用MMCO命令标记的图像的viewId之间的差。
另外,对于滑动窗口解码参考图像标记过程的默认行为,只有与当前图像具有相同view_id的图像被考虑以被标记为“不用作参考”。
转到图3,标号300总地指示一种用于利用修改后的解码参考图像标记来对多视角视频内容进行编码的示例性方法,该方法使用视角优先编码。
方法300包括开始框305,开始框305将控制传递给功能框310。功能框310读取编码器配置文件,并将控制传递给功能框315。功能框315令视角数为N,其中变量i(视角号索引)和j(图像号索引)都设置为零,并将控制传递给判决框320。判决框320确定i是否小于N。如果是,则控制被传递给判决框325。否则,控制被传递给结束框399。
判决框325确定j是否小于视角i中的图像数。如果是,则控制被传递给功能框330。否则,控制被传递给功能框350。
功能框330对视角i中的图像j编码,递增j,并将控制传递给判决框335。判决框335确定存储器管理控制操作(MMCO)命令是否与当前图像相关联。如果是,则控制被传递给功能框340。否则,控制被传递给功能框355。
功能框340计算difference_of_pic_nums_minus1和difference_of_view_ids_minus1来确定要被标记为“不用作参考”的参考图像的图像和view_id,并将控制传递给功能框345。功能框345将当前图像插入在解码图像缓冲器(DPB)中,并将控制传递给功能框360。功能框360针对当前view_id改变frame_num和图像顺序计数(POC),并将控制返回给功能框325。
功能框350递增i,复位frame_num和图像顺序计数(POC),并将控制返回给判决框320。
功能框355选择view_id等于当前图像的view_id的图像来被标记为“不用作参考”,以供MPEG-4 AVC过程用于滑动窗口参考图像标记,并将控制传递给功能框355。
转到图4,标号400总地指示一种用于利用修改后的解码参考图像标记来对多视角视频内容进行解码的示例性方法。
方法400包括开始框405,开始框405将控制传递给功能框310。功能框410解析比特流、view_id、frame_num和图像顺序计数(POC),并将控制传递给功能框415。功能框415对当前图像解码,并将控制传递给判决框420。判决框420确定存储器管理控制操作(MMCO)命令是否存在。如果是,则控制被传递给功能框425。否则,控制被传递给功能框440。
功能框425解析difference_of_pic_nums_minus1和difference_of_view_ids_minus1来确定作为“不用作参考”的参考图像的图像和view_id,并将控制传递给功能框430。功能框430将当前图像插入在解码图像缓冲器(DPB)中,并将控制传递给判决框435。判决框435确定是否所有图像都已被解码。如果是,则控制被传递给结束框499。否则,控制被返回给功能框410。
功能框440选择view_id等于当前图像的view_id的图像来标记为“不用作参考”,以供MPEG-4 AVC过程用于滑动窗口解码参考图像标记,并将控制传递给功能框430。
转到图15,标号1500总地指示一种用于利用修改后的解码参考图像标记来对多视角视频内容进行编码的示例性方法。
方法1500包括开始框1505,开始框1505将控制传递给功能框1510。功能框1510读取编码器配置文件,并将控制传递给功能框1515。功能框1515令视角数为N,其中变量i(视角号索引)和j(图像号索引)都设置为零,并将控制传递给判决框1520。判决框1520确定i是否小于N。如果是,则控制被传递给判决框1525。否则,控制被传递给结束框1599。
判决框1525确定j是否小于视角i中的图像数。如果是,则控制被传递给功能框1530。否则,控制被传递给功能框1550。
功能框1530对视角i中的图像j编码,递增j,并将控制传递给判决框1535。判决框1535确定存储器管理控制操作(MMCO)命令是否与当前图像相关联。如果是,则控制被传递给功能框1540。否则,控制被传递给功能框1555。
功能框1540只针对view_id等于当前图像的view_id的图像执行相关联的MMCO命令,并将控制传递给功能框1545。功能框1545将当前图像插入在解码图像缓冲器(DPB)中,并将控制传递给功能框1560。功能框1560针对当前view_id改变frame_num和图像顺序计数(POC),并将控制返回给功能框1525。
功能框1550递增i,复位frame_num和图像顺序计数(POC),并将控制返回给判决框1520。
功能框1555选择view_id等于当前图像的view_id的图像来被标记为“不用作参考”,以供MPEG-4 AVC过程用于滑动窗口参考图像标记,并将控制传递给功能框1555。
转到图16,标号1600总地指示一种用于利用修改后的解码参考图像标记来对多视角视频内容进行解码的示例性方法。
方法1600包括开始框1605,开始框1605将控制传递给功能框1610。功能框1610解析比特流、view_id、frame_num和图像顺序计数(POC),并将控制传递给功能框1615。功能框1615对当前图像解码,并将控制传递给判决框1620。判决框1620确定存储器管理控制操作(MMCO)命令是否存在。如果是,则控制被传递给功能框1625。否则,控制被传递给功能框1640。
功能框1625解析MMCO命令,并仅针对view_id等于当前图像的view_id的图像执行MMCO命令,并将控制传递给功能框1630。功能框1630将当前图像插入在解码图像缓冲器(DPB)中,并将控制传递给判决框1635。判决框1635确定是否所有图像都已被解码。如果是,则控制被传递给结束框1699。否则,控制被返回给功能框1610。
功能框1640选择view_id等于当前图像的view_id的图像来被标记为“不用作参考”,以供MPEG-4 AVC过程用于滑动窗口解码参考图像标记,并将控制传递给功能框1630。
参考图像列表构造
根据本发明的原理的实施例,将view_id与解码参考图像相关联。因此,在一个实施例中,重新定义了参考图像的初始化过程和参考图像列表的重排序过程以包括view_id。
MPEG-4 AVC标准指定了默认过程来初始化P和B片断的参考列表。该默认过程随后可以通过比特流中存在的特殊参考图像列表重排序(RPLR)命令来修改。
该参考图像的默认排序和重排序是基于frame_num和图像顺序计数值的。然而,由于允许在解码图像缓冲器(DPB)中存在具有相同frame_num/POC值的图像,因此需要利用view_id在相同的frame_num/POC值之间进行区分。在一个实施例中,设置参考图像列表的这些过程中的一个或多个被改变。
初始化P和B片断的参考列表的默认初始化过程的一个实施例涉及只允许参考列表中的时间参考图像并且忽略view_id不同于当前图像的view_id的所有图像。时间参考图像将遵循在MPEG-4 AVC标准中指定的相同默认初始化过程。另一实施例涉及仅将交叉视角参考放置在列表中,以使得最近的view_id被放置在列表中较靠前的位置。另一实施例涉及首先利用时间参考初始化参考列表,然后在某些固定位置处放置交叉视角参考帧,例如在被构造的参考列表的结尾处。
在一个实施例中,对于重排序列表的参考图像列表重排序命令,引入了新的命令并且/或者修改了现有命令的语义,以考虑到需要被移动的图像的view_id。
在一个实施例中,如下所示重新定义了在该过程中使用的MPEG-4AVC标准变量,从而使在MPEG-4 AVC标准中指定的参考图像列表重排序命令保持不变。
重新定义与重排序参考列表有关的MPEG-4 AVC标准的变量的一个实施例如下所示。在该实施例中,下式成立:
FrameNum=frame_num*N+view_id;并且
MaxFrameNum=2(log2_max_frame_num_minus4+4)*N
变量CurrPicNum如下所示地导出:如果field_pic_flag等于0,则CurrPicNum被设置为等于frame_num*N+view_id;否则,如果field_pic_flag等于1,则CurrPicNum被设置为等于2*(frame_num*N+view_id)+1。
MPEG-4 AVC标准中某一片断的图像顺序计数被定义如下:
if(picX是帧或互补场对)
则PicOrderCnt(picX)=该帧或互补场对picX的Min(TopFieldOrderCnt,BottomFieldOrderCnt)
else if(picX是顶部场)
则PicOrderCnt(picX)=场picX的TopFieldOrderCnt
else if(picX是底部场)
则PicOrderCnt(picX)=场picX的BottomFieldOrderCnt
对于多视角视频编码片断,图像顺序计数按如下方式导出,以用于参考图像列表构造的解码过程和解码参考图像标记过程:
PicOrderCnt(picX)=PicOrderCnt(picX)*N+view_id
其中N表示视角数。视角数是利用比特流中的高层语法指示的,并且可以带内或带外呈递。一个实施例在MPEG-4 AVC标准的参数集(例如,序列参数集(SPS)、图像参数集(PPS)或视角参数集(VPS))中包括该参数。
重新定义与重排序参考列表有关的MPEG-4 AVC标准的变量的另一实施例如下所示。在该实施例中,下式成立:
FrameNum=GOP_length*view_id+frame_num
对于多视角视频编码片断,图像顺序计数按如下方式导出,以用于参考图像列表构造的解码过程和解码参考图像标记过程:
PicOrderCnt(picX)=PicOrderCnt(picX)+GOP_length*view_id
其中GOP_length被定义为锚定图像和在时间上位于每个视角的锚定图像和前一锚定图像之间的所有图像。
在另一实施例中,改变现有的RPLR命令的语义,以使得它们仅应用于与当前视角具有相同view_id的图像。
转到图5,标号500总地指示一种用于利用修改后的参考图像列表构造来对多视角视频内容进行编码的示例性方法。方法500包括开始框505,开始框505将控制传递给功能框510。功能框510读取编码器配置文件,并将控制传递给功能框515。功能框515令视角数等于变量N,将变量i(视角号索引)和j(图像号索引)都设置为零,并将控制传递给判决框520。判决框520确定i是否小于N。如果是,则控制被传递给判决框525。否则,控制被传递给结束框599。
判决框525确定j是否小于视角i中的图像数。如果是,则控制被传递给功能框530。否则,控制被传递给功能框545。
对于间隔图像(inter picture),功能框530仅包括view_id等于当前图像的view_id的图像,以供MPEG-4 AVC过程用于参考列表初始化,并将控制传递给功能框532。功能框532对参考列表重排序,并将控制传递给功能框535。功能框535对视角i中的图像j编码,递增j,并将控制传递给功能框540。功能框540递增frame_num和图像顺序计数(POC),并将控制返回给判决框525。
功能框545递增i,复位frame_num和图像顺序计数(POC),并将控制返回给判决框520。
转到图6,标号600总地指示另一种用于利用修改后的参考图像列表构造来对多视角视频内容进行编码的示例性方法。
方法600包括开始框605,开始框605将控制传递给功能框610。功能框610读取编码器配置文件,并将控制传递给功能框615。功能框615令视角数等于变量N,将变量i(视角号索引)和j(图像号索引)都设置为零,并将控制传递给判决框620。判决框620确定i是否小于N。如果是,则控制被传递给判决框625。否则,控制被传递给结束框699。
判决框625确定j是否小于视角i中的图像数。如果是,则控制被传递给功能框630。否则,控制被传递给功能框645。
对于间隔图像,功能框630初始化仅具有view_id不同于当前图像的view_id的图像的参考列表,这种图像与当前图像同时被采样,并且被排序使得最近的view_id被放置在列表中较靠前的位置,然后功能框630将控制传递给功能框632。功能框632对参考列表重排序,并将控制传递给功能框635。功能框635对视角i中的图像j编码,递增j,并将控制传递给功能框640。功能框640递增frame_num和图像顺序计数(POC),并将控制返回给判决框625。
功能框645递增i,复位frame_num和图像顺序计数(POC),并将控制返回给判决框620。
转到图7,标号700总地指示又一种用于利用修改后的参考图像列表构造来对多视角视频内容进行编码的示例性方法。
方法700包括开始框705,开始框705将控制传递给功能框710。功能框710读取编码器配置文件,并将控制传递给功能框715。功能框715令视角数等于变量N,将变量i(视角号索引)和j(图像号索引)都设置为零,并将控制传递给判决框720。判决框720确定i是否小于N。如果是,则控制被传递给判决框725。否则,控制被传递给结束框799。
判决框725确定j是否小于视角i中的图像数。如果是,则控制被传递给功能框730。否则,控制被传递给功能框745。
功能框730仅包括view_id等于当前图像的view_id的图像,以供MPEG-4 AVC过程用于参考列表初始化,并将控制传递给功能框732。功能框732在参考列表的结尾插入与当前图像具有相同时间位置的交叉视角图像,并将控制传递给功能框735。功能框735对视角i中的图像j编码,递增j,并将控制传递给功能框740。功能框740递增frame_num和图像顺序计数(POC),并将控制返回给判决框725。
功能框745递增i,复位frame_num和图像顺序计数(POC),并将控制返回给判决框720。
转到图8,标号800总地指示一种用于利用修改后的参考图像列表构造来对多视角视频内容进行解码的示例性方法。方法800包括开始框805,开始框805将控制传递给功能框810。功能框810解析比特流、view_id、frame_num和图像顺序计数(POC),并将控制传递给功能框815。功能框815仅包括view_id等于当前图像的view_id的图像,以供MPEG-4 AVC过程用于参考列表初始化,并将控制传递给功能框820。功能框820对当前图像解码,并将控制传递给功能框825。功能框825将当前图像插入在解码图像缓冲器中,并将控制传递给判决框830。判决框830确定是否所有图像都已被解码。如果是,则控制被传递给结束框899。否则,控制被返回给功能框810。
转到图9,标号900总地指示另一种用于利用修改后的参考图像列表构造来对多视角视频内容进行解码的示例性方法。方法900包括开始框905,开始框905将控制传递给功能框910。功能框910解析比特流、view_id、frame_num和图像顺序计数(POC),并将控制传递给功能框915。功能框915初始化仅具有view_id不同于当前图像的view_id的图像的参考列表,这种图像与当前图像同时被采样,并且被排序使得最近的view_id被放置在列表中较靠前的位置,然后功能框915将控制传递给功能框920。功能框920对当前图像解码,并将控制传递给功能框925。功能框925将当前图像插入在解码图像缓冲器(DPB)中,并将控制传递给判决框930。判决框930确定是否所有图像都已被解码。如果是,则控制被传递给结束框999。否则,控制被返回给功能框910。
转到图10,标号1000总地指示又一种用于利用修改后的参考图像列表构造来对多视角视频内容进行解码的示例性方法。方法1000包括开始框1005,开始框1005将控制传递给功能框1010。功能框1010解析比特流、view_id、frame_num和图像顺序计数(POC),并将控制传递给功能框1015。功能框1015仅包括view_id等于当前图像的view_id的图像,以供MPEG-4 AVC过程用于参考列表初始化,并将控制传递给功能框1020。功能框1020在参考列表的结尾插入与当前图像具有相同时间位置的交叉视角图像,并将控制传递给功能框1025。功能框1025将当前图像插入在解码图像缓冲器中,并将控制传递给判决框1030。判决框1030确定是否所有图像都已被解码。如果是,则控制被传递给结束框1099。否则,控制被返回给功能框1010。
转到图17,标号1700总地指示一种用于利用修改后的参考图像列表构造和帧号计算来对多视角视频内容进行编码的示例性方法。
方法1700包括开始框1705,开始框1705将控制传递给功能框1710。功能框1710读取编码器配置文件,并将控制传递给功能框1715。功能框1715令视角数等于变量N,将变量i(视角号索引)和j(图像号索引)都设置为零,并将控制传递给判决框1720。判决框1720确定i是否小于N。如果是,则控制被传递给判决框1725。否则,控制被传递给结束框1799。
判决框1725确定j是否小于视角i中的图像数。如果是,则控制被传递给功能框1730。否则,控制被传递给功能框1745。
功能框1730设置frame_num=frame_num*N+view_id,设置PicOrderCnt(picX)=PicOrderCnt(picX)*N+view_id,并将控制传递给功能框1735。功能框1735对视角i中的图像j编码,递增j,并将控制传递给功能框1740。功能框1740递增frame_num和图像顺序计数(POC),并将控制返回给判决框1725。
功能框1745递增i,复位frame_num和图像顺序计数(POC),并将控制返回给判决框1720。
转到图18,标号1800总地指示另一种用于利用修改后的参考图像列表构造和帧号计算来对多视角视频内容进行编码的示例性方法。
方法1800包括开始框1805,开始框1805将控制传递给功能框1810。功能框1810读取编码器配置文件,并将控制传递给功能框1815。功能框1815令视角数等于变量N,将变量i(视角号索引)和j(图像号索引)都设置为零,并将控制传递给判决框1820。判决框1820确定i是否小于N。如果是,则控制被传递给判决框1825。否则,控制被传递给结束框1899。
判决框1825确定j是否小于视角i中的图像数。如果是,则控制被传递给功能框1830。否则,控制被传递给功能框1845。
功能框1830设置frame_num=GOP_length*view_id+frame_num,设置PicOrderCnt(picX)=PicOrderCnt(picX)+GOP_length*view_id,并将控制传递给功能框1835。功能框1835对视角i中的图像j编码,递增j,并将控制传递给功能框1840。功能框1840递增frame_num和图像顺序计数(POC),并将控制返回给判决框1825。
功能框1845递增i,复位frame_num和图像顺序计数(POC),并将控制返回给判决框1820。
转到图19,标号1900总地指示一种用于利用修改后的参考图像列表构造和帧号计算来对多视角视频内容进行解码的示例性方法。方法1900包括开始框1905,开始框1905将控制传递给功能框1910。功能框1910解析比特流、view_id、frame_num和图像顺序计数(POC),并将控制传递给功能框1915。功能框1915设置frame_num=frame_num*N+view_id,设置PicOrderCnt(picX)=PicOrderCnt(picX)*N+view_id,并将控制传递给功能框1920。功能框1920对当前图像解码,并将控制传递给功能框1925。功能框1925将当前图像插入在解码图像缓冲器(DPB)中,并将控制传递给判决框1930。判决框1930确定是否所有图像都已被解码。如果是,则控制被传递给结束框1999。否则,控制被返回给功能框1910。
转到图20,标号2000总地指示另一种用于利用修改后的参考图像列表构造和帧号计算来对多视角视频内容进行解码的示例性方法。方法2000包括开始框2005,开始框2005将控制传递给功能框2010。功能框2010解析比特流、view_id、frame_num和图像顺序计数(POC),并将控制传递给功能框2015。功能框2015设置frame_num=GOP_length*view_id-frame_num,设置PicOrderCnt(picX)=PicOrderCnt(picX)+GOP_length*view_id,并将控制传递给功能框2020。功能框2020对当前图像解码,并将控制传递给功能框2025。功能框2025将当前图像插入在解码图像缓冲器(DPB)中,并将控制传递给判决框2030。判决框2030确定是否所有图像都已被解码。如果是,则控制被传递给结束框2099。否则,控制被返回给功能框2010。
转到图21,标号2100总地指示一种用于通过参考图像列表重排序(RPLR)命令、利用修改后的参考图像列表初始化来对多视角视频内容进行编码的示例性方法。
方法2100包括开始框2105,开始框2105将控制传递给功能框2110。功能框2110读取编码器配置文件,并将控制传递给功能框2115。功能框2115令视角数等于变量N,将变量i(视角号索引)和j(图像号索引)都设置为零,并将控制传递给判决框2120。判决框2120确定i是否小于N。如果是,则控制被传递给判决框2125。否则,控制被传递给结束框2199。
判决框2125确定j是否小于视角i中的图像数。如果是,则控制被传递给功能框2130。否则,控制被传递给功能框2145。
对于间隔图像,功能框2130执行默认参考列表初始化,并将控制传递给功能框2132。功能框2132从编码器配置文件读取RPLR命令,并将控制传递给功能框2134。功能框2134仅针对view_id等于当前图像的view_id的图像执行RPLR命令,并将控制传递给功能框2135。功能框2135对视角i中的图像j编码,递增j,并将控制传递给功能框2140。功能框2140递增frame_num和图像顺序计数(POC),并将控制返回给判决框2125。
功能框2145递增i,复位frame_num和图像顺序计数(POC),并将控制返回给判决框2120。
转到图22,标号2200总地指示另一种用于通过参考图像列表重排序(RPLR)命令、利用修改后的参考图像列表初始化来对多视角视频内容进行编码的示例性方法。
方法2200包括开始框2205,开始框2205将控制传递给功能框2210。功能框2210读取编码器配置文件,并将控制传递给功能框2215。功能框2215令视角数等于变量N,将变量i(视角号索引)和j(图像号索引)都设置为零,并将控制传递给判决框2220。判决框2220确定i是否小于N。如果是,则控制被传递给判决框2225。否则,控制被传递给结束框2299。
判决框2225确定j是否小于视角i中的图像数。如果是,则控制被传递给功能框2230。否则,控制被传递给功能框2245。
对于间隔图像,功能框2230执行默认参考列表初始化,并将控制传递给功能框2232。功能框2232从编码器配置文件读取RPLR命令,并将控制传递给功能框2234。功能框2234对于在RPLR命令中指示的view_id中指定的图像执行RPLR命令,并将控制传递给功能框2235。功能框2235对视角i中的图像j编码,递增j,并将控制传递给功能框2240。功能框2240递增frame_num和图像顺序计数(POC),并将控制返回给判决框2225。
功能框2245递增i,复位frame_num和图像顺序计数(POC),并将控制返回给判决框2220。
转到图23,标号2300总地指示一种用于通过参考图像列表重排序(RPLR)命令、利用修改后的参考图像列表构造来对多视角视频内容进行解码的示例性方法。方法2300包括开始框2305,开始框2305将控制传递给功能框2310。功能框2310解析比特流、view_id、frame_num和图像顺序计数(POC),并将控制传递给功能框2315。功能框2315仅包括view_id等于当前图像的view_id的图像,以供MPEG-4 AVC过程用于参考列表初始化,并将控制传递给功能框2317。功能框2317读取RPLR命令,并将控制传递给功能框2319。功能框2319仅针对view_id等于当前图像的view_id的图像执行RPLR命令,并将控制传递给功能框2320。功能框2320对当前图像解码,并将控制传递给功能框2325。功能框2325将当前图像插入在解码图像缓冲器中,并将控制传递给判决框2330。判决框2330确定是否所有图像都已被解码。如果是,则控制被传递给结束框2399。否则,控制被返回给功能框2310。
转到图24,标号2400总地指示另一种用于通过参考图像列表重排序(RPLR)命令、利用修改后的参考图像列表构造来对多视角视频内容进行解码的示例性方法。方法2400包括开始框2405,开始框2405将控制传递给功能框2410。功能框2410解析比特流、view_id、frame_num和图像顺序计数(POC),并将控制传递给功能框2415。功能框2415仅包括view_id等于当前图像的view_id的图像,以供MPEG-4 AVC过程用于参考列表初始化,并将控制传递给功能框2417。功能框2417读取RPLR命令,并将控制传递给功能框2419。功能框2419仅针对view_id等于当前图像的view_id的图像执行RPLR命令,并将控制传递给功能框2420。功能框2420对当前图像解码,并将控制传递给功能框2425。功能框2425将当前图像插入在解码图像缓冲器中,并将控制传递给判决框2430。判决框2430确定是否所有图像都已被解码。如果是,则控制被传递给结束框2499。否则,控制被返回给功能框2410。
时间直接模式
如上所述,时间直接模式使用图像顺序计数信息来导出给定宏块的运动向量。由于将frame_num和/或图像顺序计数值解耦合,对于多视角视频内容的每个视角引入了view_id,并且允许将交叉视角图像放置在解码图像缓冲器和参考列表中,因此在一个实施例中,还对这一模式进行了改进,以应对在交叉视角图像指的是来自于不同于当前视角的视角的图像的情况下的正确导出。
在时间直接模式中,存在以下示例性情况:
(1)参考列表1中的图像和参考列表0中的图像具有不同的POC和相同的view_id;
(2)参考列表1中的图像和参考列表0中的图像具有不同的POC和不同的view_id;
(3)参考列表1中的图像和参考列表0中的图像具有相同的POC和不同的view_id;以及
(4)参考列表1中的图像和参考列表0中的图像具有相同的POC和相同的view_id。
在时间直接模式中获得运动向量的一个实施例是使用现有的MPEG-4AVC方法,即简单忽略比特流中存在的view_id信息。在另一实施例中,重新定义了时间直接模式来考虑到view_id信息以及图像顺序计数信息。
隐式加权预测
与时间直接模式类似,隐式加权预测(如上所述)也使用图像顺序计数值来确定要应用到参考图像的权重。因此,在一个实施例中,应用到时间直接模式的所有改变将间接地固定隐式加权预测模式。在另一实施例中,在隐式加权预测模式中获得权重的方法可以被重新定义以考虑到view_id信息以及图像顺序计数信息。例如,可以通过考虑如上所述的view_id信息和视角数来计算图像顺序计数,并在之后取图像顺序计数之间的差,以获得所需值来执行隐式加权预测。
转到图11,标号1100总地指示一种用于利用时间直接模式和隐式加权预测来对多视角视频内容进行编码的示例性方法。
方法1100包括开始框1105,开始框1105将控制传递给功能框1110。功能框1110读取编码器配置文件,并将控制传递给功能框1115。功能框1115令视角数等于变量N,将变量i(视角号索引)和j(图像号索引)都设置为零,并将控制传递给判决框1120。判决框1120确定i是否小于N。如果是,则控制被传递给判决框1125。否则,控制被传递给结束框1199。
判决框1125确定j是否小于视角i中的图像数。如果是,则控制被传递给判决框1132。否则,控制被传递给功能框1145。
判决框1132确定对于当前片断是否能启用加权预测。如果是,则控制被传递给功能框1134。否则,控制被传递给功能框1136。
功能框1134对于加权预测忽略view_id信息,并将控制传递给功能框1136。
功能框1136开始对当前宏块编码,并将控制传递给判决框1138。判决框1138确定对于该宏块是否选择直接模式。如果是,则控制被传递给功能框1142。否则,控制被传递给功能框1152。
功能框1142对于直接模式忽略view_id,并将控制传递给功能框1152。
功能框1152对当前宏块编码,并将控制传递给判决框1154。判决框1154确定是否所有宏块都已被编码。如果是,则控制被传递给功能框1156。否则,控制被返回给功能框1136。
功能框1156递增变量j,并将控制传递给功能框1140。功能框1140递增frame_num和图像顺序计数,并将控制返回给判决框1125。
功能框1145递增i,复位frame_num和图像顺序计数,并将控制返回给判决框1120。
转到图12,标号1200总地指示另一种用于利用时间直接模式和隐式加权预测来对多视角视频内容进行编码的示例性方法。
方法1200包括开始框1205,开始框1205将控制传递给功能框1210。功能框1210读取编码器配置文件,并将控制传递给功能框1215。功能框1215令视角数等于变量N,将变量i(视角号索引)和j(图像号索引)都设置为零,并将控制传递给判决框1220。判决框1220确定i是否小于N。如果是,则控制被传递给判决框1225。否则,控制被传递给结束框1299。
判决框1225确定j是否小于视角i中的图像数。如果是,则控制被传递给判决框1232。否则,控制被传递给功能框1245。
判决框1232确定对于当前片断是否能启用加权预测。如果是,则控制被传递给功能框1234。否则,控制被传递给功能框1236。
功能框1234对于加权预测忽略view_id信息,并将控制传递给功能框1236。
功能框1236开始对当前宏块编码,并将控制传递给判决框1238。判决框1238确定对于该宏块是否选择直接模式。如果是,则控制被传递给功能框1242。否则,控制被传递给功能框1252。
功能框1242对于直接模式考虑view_id,并将控制传递给功能框1252。
功能框1252对当前宏块编码,并将控制传递给判决框1254。判决框1254确定是否所有宏块都已被编码。如果是,则控制被传递给功能框1256。否则,控制被返回给功能框1236。
功能框1256递增变量j,并将控制传递给功能框1240。功能框1240递增frame_num和图像顺序计数,并将控制返回给判决框1225。
功能框1245递增i,复位frame_num和图像顺序计数,并将控制返回给判决框1220。
转到图13,标号1300总地指示一种用于利用修改后的解码参考图像标记来对多视角视频内容进行解码的示例性方法。
方法1300包括开始框1305,开始框1305将控制传递给功能框1310。功能框1310解析比特流、view_id、frame_num和图像顺序计数(POC),并将控制传递给功能框1315。功能框1315解析宏块模式、运动向量、ref_idx,并将控制传递给判决框1320。判决框1320确定对于该图像是否能启用加权预测。如果是,则控制被传递给功能框1325。否则,控制被传递给判决框1330。
功能框1325对于加权预测忽略view_id信息,并将控制传递给判决框1330。
判决框1330确定宏块是否是直接模式宏块。如果是,则控制被传递给功能框1355。否则,控制被传递给功能框1335。
功能框1355对于直接模式忽略view_id信息,并将控制传递给功能框1335。
功能框1335对当前宏块解码,并将控制传递给判决框1340。判决框1340确定是否所有宏块都已被解码。如果是,则控制被传递给功能框1345。否则,控制被返回给功能框1315。
功能框1345将当前图像插入在解码图像缓冲器中,并将控制传递给判决框1350。判决框1350确定是否所有图像都已被解码。如果是,则控制被传递给结束框1399。否则,控制被返回给功能框1310。
转到图14,标号1400总地指示另一种用于利用修改后的解码参考图像标记来对多视角视频内容进行解码的示例性方法。
方法1400包括开始框1405,开始框1405将控制传递给功能框1410。功能框1410解析比特流、view_id、frame_num和图像顺序计数(POC),并将控制传递给功能框1415。功能框1415解析宏块模式、运动向量、ref_idx,并将控制传递给判决框1420。判决框1420确定对于该图像是否能启用加权预测。如果是,则控制被传递给功能框1425。否则,控制被传递给判决框1430。
功能框1425对于加权预测忽略view_id信息,并将控制传递给判决框1430。
判决框1430确定宏块是否是直接模式宏块。如果是,则控制被传递给功能框1455。否则,控制被传递给功能框1435。
功能框1455对于直接模式考虑view_id信息,并将控制传递给功能框1435。
功能框1435对当前宏块解码,并将控制传递给判决框1440。判决框1440确定是否所有宏块都已被解码。如果是,则控制被传递给功能框1445。否则,控制被返回给功能框1415。
功能框1445将当前图像插入在解码图像缓冲器中,并将控制传递给判决框1450。判决框1450确定是否所有图像都已被解码。如果是,则控制被传递给结束框1499。否则,控制被返回给功能框1410。
MVC的并行编码
由于在多视角视频内容序列的处理中涉及的数据量,在多视角视频编码中对于并行编码/解码的支持对于许多应用来说是很重要的,尤其是那些具有实时约束的应用。在当前的符合MPEG-4 AVC的多视角视频编码的实现方式中,启用了交叉视角预测,但是没有提供对时间参考和交叉视角参考的区分。通过在多视角视频编码编码器和/或解码器中添加view_id支持并在解码参考图像管理的构造和参考列表构造中包括view_id(正如这里所提出的),清楚地定义了并行处理引擎之间的数据依赖性,这有利于MVC编解码器的并行实现方式。
现在将描述本发明的许多附带优点/特征中的一些,其中某些优点/特征上面已提到。例如,一个优点/特征是一种包括编码器的装置,该编码器用于对与多视角视频内容的至少两个视角中的至少一个视角相对应的至少一个图像进行编码以形成结果比特流。在结果比特流中,该至少一个图像的编码顺序信息和输出顺序信息中的至少一种被与该至少一个图像所对应的至少一个视角解耦合。
另一个优点/特征是具有如上所述的编码器的装置,其中该编码器利用至少一个现有的语法元素(frame_num和pic_order_cnt_lsb)来将至少一个图像的编码顺序信息和输出顺序信息中的至少一种解耦合,该至少一个现有的语法元素对应于国际标准化组织/国际电工委员会运动图像专家组-4第10部分高级视频编码标准/国际电信联盟电信部门H.264推荐。
又一个优点/特征是具有如上所述的编码器的装置,其中该编码器利用视角标识符来将该至少一个图像的编码顺序信息和输出顺序信息中的至少一种解耦合。
又一个优点/特征是具有如上所述的编码器的装置,其中该编码器利用视角标识符来将该至少一个图像的编码顺序信息和输出顺序信息中的至少一种解耦合,并且该视角标识符存在于结果比特流中的片断级别。
又一个优点/特征是具有如上所述的编码器的装置,其中该编码器利用视角标识符来将该至少一个图像的编码顺序信息和输出顺序信息中的至少一种解耦合,并且该视角标识符存在于结果比特流中高于宏块级别的级别。
而且,另一个优点/特征是具有如上所述的编码器的装置,其中该编码器利用存在于较高级别的视角标识符来将该至少一个图像的编码顺序信息和输出顺序信息中的至少一种解耦合,并且该编码器在结果比特流中包括视角标识符,以供解码参考图像标记过程使用。
另外,另一个优点/特征是具有如上所述的编码器的装置,其中该编码器在结果比特流中包括视角标识符以供解码参考图像标记过程使用,并且该编码器在结果比特流中包括视角标识符以指示要被解码参考图像标记过程标记的特定图像属于至少两个视角中的哪一个视角。
另外,另一个优点/特征是具有如上所述的编码器的装置,其中该编码器利用视角标识符来将该至少一个图像的编码顺序信息和输出顺序信息中的至少一种解耦合,并且该编码器使用至少一个现有的语法元素(no_output_of_prior_pics_flag,long_term_reference_flag,adaptive__ref_pic_marking_mode_flag,memory_management_control_operation,difference_of_pic_nums_minus1,long_term_pic_num,long_term_frame_idx,max_long_term_frame_idx_plus1)来支持在重新定义的解码参考图像标记过程中使用视角标识符,其中该至少一个现有的语法元素的语义被重新定义以供重新定义的解码参考图像标记过程使用,该重新定义的解码参考图像标记过程对应于国际标准化组织/国际电工委员会运动图像专家组-4第10部分高级视频编码标准/国际电信联盟电信部门H.264推荐。
另外,另一个优点/特征是具有如上所述的编码器的装置,其中该编码器使用视角标识符和至少一个现有的语法元素,并且在该重新定义的解码参考图像标记过程中,只有与当前解码的图像具有相同视角标识符的图像被标记。
而且,另一个优点/特征是具有如上所述的编码器的装置,其中该编码器使用视角标识符和至少一个现有的语法元素,并且滑动窗口解码参考图像标记过程和自适应存储器控制解码参考图像标记过程中的至少一种被应用。
另外,另一个优点/特征是具有如上所述的编码器的装置,其中该编码器使用视角标识符和至少一个现有的语法元素,其中在该重新定义的解码参考图像标记过程中,与该至少一个图像具有不同的视角标识符的图像被利用先前未使用的语法元素(difference_of_view_ids_minus1)标记。
另外,另一个优点/特征是具有如上所述的编码器的装置,其中该编码器利用视角标识符来将该至少一个图像的编码顺序信息和输出顺序信息中的至少一种解耦合,并且该编码器在结果比特流中包括视角标识符以用于默认参考图像列表构造。
另外,另一个优点/特征是具有如上所述的编码器的装置,其中该编码器在结果比特流中包括视角标识符以用于默认参考图像列表构造,并且在得到来自视角标识符的额外支持的情况下,根据用于参考图像列表构造的至少一个现有的语法元素(frame_num和pic_order_cnt_lsb)、现有的语义和现有的解码过程,间隔视角参考图像被禁止添加到用于与参考图像列表构造相对应的默认参考图像列表创建过程的参考列表上,其中该现有的语法、现有的语义和现有的解码过程对应于国际标准化组织/国际电工委员会运动图像专家组-4第10部分高级视频编码标准/国际电信联盟电信部门H.264推荐。
另外,另一个优点/特征是具有如上所述的编码器的装置,其中该编码器在结果比特流中包括视角标识符以用于默认参考图像列表构造,并且在得到来自视角标识符的额外支持的情况下,根据用于默认参考图像列表构造的至少一个现有的语法元素(frame_num和pic_order_cnt_lsb),只有间隔视角参考图像被添加到用于与参考图像列表构造相对应的默认参考图像列表创建过程的参考列表上。
而且,另一个优点/特征是具有如上所述的编码器的装置,其中在该编码器中,仅有间隔视角参考图像被添加到用于默认参考图像列表创建过程的参考列表上,并且间隔视角参考图像在时间参考之后被添加。
另外,另一个优点/特征是具有如上所述的编码器的装置,其中该编码器利用视角标识符来将该至少一个图像的编码顺序信息和输出顺序信息中的至少一种解耦合,并且该编码器使用被重新定义的至少一个现有的语法元素(ref_pic_list_reordering_flag_I0,reordering_of_pic_nums_idc,abs_diff_pic_num_minus1,long_term_pic_num,ref_pic_list_reordering_flag_I1,reordering_of_pic_nums_idc,abs_diff_pic_num_minus1,long_term_pic_num),以用在重新定义的参考图像列表重排序过程中,以支持在重新定义的参考图像列表重排序过程中使用视角标识符,其中该重新定义的参考图像列表重排序过程对应于国际标准化组织/国际电工委员会运动图像专家组-4第10部分高级视频编码标准/国际电信联盟电信部门H.264推荐。
另外,另一个优点/特征是具有如上所述的编码器的装置,其中该编码器使用视角标识符和至少一个现有的语法元素,并且在该重新定义的参考图像列表重排序过程中,只有与当前解码的图像具有相同视角标识符的图像被重排序。
另外,另一个优点/特征是具有如上所述的编码器的装置,其中在该编码器中,只有与当前解码的图像具有相同视角标识符的图像被重排序,并且其中视角标识符指示要移动到相应参考图像列表中的当前索引的特定图像对应于至少两个视角中的哪一个视角。
另外,另一个优点/特征是具有如上所述的编码器的装置,其中在该编码器中,只有与当前解码的图像具有相同视角标识符的图像被重排序,并且其中仅当要排序的参考图像的视角标识符不同于该至少一个图像的视角标识符时,才需要视角标识符。
另外,另一个优点/特征是具有如上所述的编码器的装置,其中该编码器利用视角标识符来将该至少一个图像的编码顺序信息和输出顺序信息中的至少一种解耦合,并且编码器使用针对时间直接模式重新定义的现有的语法元素(pic_order_cnt_lsb)以支持在时间直接模式中使用视角标识符,该现有的语法对应于国际标准化组织/国际电工委员会运动图像专家组-4第10部分高级视频编码标准/国际电信联盟电信部门H.264推荐。
另外,另一个优点/特征是具有如上所述的编码器的装置,其中该编码器使用视角标识符和现有的语法元素,并且时间直接模式是基于图像顺序计数值和视角标识符中的至少一个导出的。
另外,另一个优点/特征是具有如上所述的编码器的装置,其中该编码器利用视角标识符来将该至少一个图像的编码顺序信息和输出顺序信息中的至少一种解耦合,并且该编码器使用现有的语法元素(pic_order_cnt_lsb)、现有的语义和现有的解码过程以用于时间直接模式,其中该现有的语法、现有的语义和现有的解码过程对应于国际标准化组织/国际电工委员会运动图像专家组-4第10部分高级视频编码标准/国际电信联盟电信部门H.264推荐。
另外,另一个优点/特征是具有如上所述的编码器的装置,其中该编码器利用视角标识符来将该至少一个图像的编码顺序信息和输出顺序信息中的至少一种解耦合,并且该编码器使用针对隐式加权预测重新定义的现有的语法元素(pic_order_cnt_lsb)以支持在隐式加权预测中使用视角标识符,其中该现有的语法对应于国际标准化组织/国际电工委员会运动图像专家组-4第10部分高级视频编码标准/国际电信联盟电信部门H.264推荐。
而且,另一个优点/特征是具有如上所述的编码器的装置,其中该编码器使用视角标识符和现有的语法元素,并且隐式加权预测是基于图像顺序计数值和视角标识符中的至少一个导出的。
另外,另一个优点/特征是具有如上所述的编码器的装置,其中该编码器利用视角标识符来将该至少一个图像的编码顺序信息和输出顺序信息中的至少一种解耦合,并且该编码器使用现有的语法元素(pic_order_cnt_lsb)、现有的语义和现有的解码过程以用于隐式加权预测,其中该现有的语法、现有的语义和现有的解码过程对应于国际标准化组织/国际电工委员会运动图像专家组-4第10部分高级视频编码标准/国际电信联盟电信部门H.264推荐。
另外,另一个优点/特征是具有如上所述的编码器的装置,其中该编码器使用与特定图像相对应的至少两个视角中的特定一个视角来指定在至少两个视角中的不同的那些视角的并行编码中的间隔视角依赖性。
又一个优点/特征是一种包括编码器的装置,该编码器用于对与多视角视频内容相对应的至少两个视角中的至少一个进行编码。该编码器利用默认参考图像列表构造过程和参考图像列表重排序中的重新定义的变量来对至少两个视角中的至少一个进行编码,该默认参考图像列表构造过程和参考图像列表重排序对应于国际标准化组织/国际电工委员会运动图像专家组-4第10部分高级视频编码标准/国际电信联盟电信部门H.264推荐。
而且,另一个优点/特征是包括如上所述的编码器的装置,其中视角数和视角标识符信息中的至少一个被用于重新定义变量。
而且,另一个优点/特征是包括如上所述的编码器的装置,其中图像组长度和视角标识符信息中的至少一个被用于重新定义变量。
又一个优点/特征是一种包括编码器的装置,该编码器用于对与多视角视频内容相对应的至少两个视角中的至少一个进行编码。该编码器利用解码参考图像标记过程中的重新定义的变量来对至少两个视角中的至少一个进行编码,该解码参考图像标记过程对应于国际标准化组织/国际电工委员会运动图像专家组-4第10部分高级视频编码标准/国际电信联盟电信部门H.264推荐。
而且,另一个优点/特征是包括如上所述的编码器的装置,其中视角数和视角标识符信息中的至少一个被用于重新定义变量。
而且,另一个优点/特征是包括如上所述的编码器的装置,其中图像组长度和视角标识符信息中的至少一个被用于重新定义变量。
将会意识到,对特定语法名(尤其是针对本发明的原理的各种创造性方面描述的先前未使用的语法名)的选择是用于说明和澄清目的,因而,给定这里提供的本发明的原理的教导,其他名称和/或字符等也可用于替代和/或补充这里提供的语法名,同时仍然维持本发明的原理的精神。
本发明的原理的这些和其他的特征和优点可以基于这里的教导很容易被本领域技术人员所确定。将会理解,本发明的原理的教导可以按各种形式实现,包括硬件、软件、固件、专用处理器或其组合。
更优选地,本发明的原理的教导被实现为硬件和软件的组合。而且,软件可以实现为有形地实现在程序存储单元上的应用程序。应用程序可以被上载到包括任何合适体系结构的机器并被该机器执行。优选地,该机器实现在计算机平台上,该计算机平台具有诸如一个或多个中央处理单元(CPU)、随机访问存储器(RAM)和输入/输出(I/O)接口之类的硬件。计算机平台还可包括操作系统和微指令代码。这里描述的各种过程和功能可以是微指令代码的一部分,或者可以是应用程序的一部分,或者是其任何组合,其可以由CPU执行。另外,各种其他外围单元可以连接到诸如额外的数据存储单元和打印单元之类的计算机平台。
还将会理解,因为在附图中示出的某些构成系统组件和方法优选地是以软件实现的,所以系统组件或过程功能框之间的实际连接可能取决于当前原理被编程的方式而有所不同。给定这里的教导,本领域技术人员将能够预期本发明的原理的这些和类似的实现方式或配置。
尽管已参考附图描述了说明性实施例,但是将会理解,本发明的原理并不限于这些精确实施例,而且本领域技术人员可以实现各种改变和修改,而不脱离本发明的原理的范围或精神。所有这些改变和修改都意图被包括在权利要求中所给出的本发明的原理的范围内。

Claims (70)

1.一种装置,包括:
编码器(200),用于对与多视角视频内容的至少两个视角中的至少一个视角相对应的至少一个图像进行编码以形成结果比特流,其中在所述结果比特流中,所述至少一个图像的编码顺序信息和输出顺序信息中的至少一种被从与所述至少一个图像相对应的至少一个视角解耦合。
2.如权利要求1所述的装置,其中所述编码器(200)利用至少一个现有的语法元素来将所述至少一个图像的编码顺序信息和输出顺序信息中的至少一种解耦合,所述至少一个现有的语法元素对应于国际标准化组织/国际电工委员会运动图像专家组-4第10部分高级视频编码标准/国际电信联盟电信部门H.264推荐。
3.如权利要求1所述的装置,其中所述编码器(200)利用视角标识符来将所述至少一个图像的编码顺序信息和输出顺序信息中的至少一种解耦合。
4.如权利要求3所述的装置,其中所述视角标识符存在于所述结果比特流中的片断级别。
5.如权利要求3所述的装置,其中所述视角标识符存在于所述结果比特流中高于宏块级别的级别。
6.如权利要求5所述的装置,其中所述编码器(200)在所述结果比特流中包括所述视角标识符,以供解码参考图像标记过程使用。
7.如权利要求6所述的装置,其中所述编码器(200)在所述结果比特流中包括所述视角标识符,以指示要被所述解码参考图像标记过程标记的特定图像属于所述至少两个视角中的哪一个视角。
8.如权利要求3所述的装置,其中所述编码器(200)使用至少一个现有的语法元素来支持在重新定义的解码参考图像标记过程中使用所述视角标识符,其中所述至少一个现有的语法元素的语义被重新定义以供所述重新定义的解码参考图像标记过程使用,所述重新定义的解码参考图像标记过程对应于国际标准化组织/国际电工委员会运动图像专家组-4第10部分高级视频编码标准/国际电信联盟电信部门H.264推荐。
9.如权利要求8所述的装置,其中在所述重新定义的解码参考图像标记过程中,只有与当前解码的图像具有相同视角标识符的图像被标记。
10.如权利要求8所述的装置,其中滑动窗口解码参考图像标记过程和自适应存储器控制解码参考图像标记过程中的至少一种被应用。
11.如权利要求8所述的装置,其中在所述重新定义的解码参考图像标记过程中,与所述至少一个图像具有不同的视角标识符的图像被利用先前未使用的语法元素标记。
12.如权利要求3所述的装置,其中所述编码器(200)在所述结果比特流中包括所述视角标识符,以用于默认参考图像列表构造。
13.如权利要求12所述的装置,其中在得到来自视角标识符的额外支持的情况下,根据用于所述参考图像列表构造的至少一个现有的语法元素、现有的语义和现有的解码过程,间隔视角参考图像被禁止添加到用于与所述参考图像列表构造相对应的默认参考图像列表创建过程的参考列表上,其中所述现有的语法、现有的语义和现有的解码过程对应于国际标准化组织/国际电工委员会运动图像专家组-4第10部分高级视频编码标准/国际电信联盟电信部门H.264推荐。
14.如权利要求12所述的装置,其中在得到来自视角标识符的额外支持的情况下,根据用于所述默认参考图像列表构造的至少一个现有的语法元素,只有间隔视角参考图像被添加到用于与所述参考图像列表构造相对应的默认参考图像列表创建过程的参考列表上。
15.如权利要求14所述的装置,其中所述间隔视角参考图像在时间参考之后被添加。
16.如权利要求3所述的装置,其中所述编码器(200)使用被重新定义的至少一个现有的语法元素,以用在重新定义的参考图像列表重排序过程中,以支持在所述重新定义的参考图像列表重排序过程中使用所述视角标识符,其中所述重新定义的参考图像列表重排序过程对应于国际标准化组织/国际电工委员会运动图像专家组-4第10部分高级视频编码标准/国际电信联盟电信部门H.264推荐。
17.如权利要求16所述的装置,其中在所述重新定义的参考图像列表重排序过程中,只有与当前解码的图像具有相同视角标识符的图像被重排序。
18.如权利要求17所述的装置,其中所述视角标识符指示要移动到相应参考图像列表中的当前索引的特定图像对应于所述至少两个视角中的哪一个视角。
19.如权利要求17所述的装置,其中仅当要排序的参考图像的视角标识符不同于所述至少一个图像的视角标识符时,才需要所述视角标识符。
20.如权利要求3所述的装置,其中所述编码器(200)使用针对时间直接模式重新定义的现有的语法元素以支持在所述时间直接模式中使用所述视角标识符,所述现有的语法对应于国际标准化组织/国际电工委员会运动图像专家组-4第10部分高级视频编码标准/国际电信联盟电信部门H.264推荐。
21.如权利要求20所述的装置,其中所述时间直接模式是基于图像顺序计数值和视角标识符中的至少一个导出的。
22.如权利要求3所述的装置,其中所述编码器(200)使用现有的语法元素、现有的语义和现有的解码过程以用于时间直接模式,其中所述现有的语法、现有的语义和现有的解码过程对应于国际标准化组织/国际电工委员会运动图像专家组-4第10部分高级视频编码标准/国际电信联盟电信部门H.264推荐。
23.如权利要求3所述的装置,其中所述编码器(200)使用针对隐式加权预测重新定义的现有的语法元素以支持在所述隐式加权预测中使用所述视角标识符,其中所述现有的语法对应于国际标准化组织/国际电工委员会运动图像专家组-4第10部分高级视频编码标准/国际电信联盟电信部门H.264推荐。
24.如权利要求23所述的装置,其中所述隐式加权预测是基于图像顺序计数值和视角标识符中的至少一个导出的。
25.如权利要求3所述的装置,其中所述编码器(200)使用现有的语法元素、现有的语义和现有的解码过程以用于隐式加权预测,其中所述现有的语法、现有的语义和现有的解码过程对应于国际标准化组织/国际电工委员会运动图像专家组-4第10部分高级视频编码标准/国际电信联盟电信部门H.264推荐。
26.如权利要求1所述的装置,其中所述编码器(200)使用与特定图像相对应的至少两个视角中的特定一个视角来指定在对所述至少两个视角中的不同的那些视角的并行编码中的间隔视角依赖性。
27.一种方法,包括:
对与多视角视频内容的至少两个视角中的至少一个视角相对应的至少一个图像进行编码以形成结果比特流,其中在所述结果比特流中,所述至少一个图像的编码顺序信息和输出顺序信息中的至少一种被从与所述至少一个图像相对应的至少一个视角解耦合(360)。
28.如权利要求27所述的方法,其中编码步骤利用至少一个现有的语法元素来将所述至少一个图像的编码顺序信息和输出顺序信息中的至少一种解耦合(360),所述至少一个现有的语法元素对应于国际标准化组织/国际电工委员会运动图像专家组-4第10部分高级视频编码标准/国际电信联盟电信部门H.264推荐。
29.如权利要求27所述的方法,其中编码步骤利用视角标识符来将所述至少一个图像的编码顺序信息和输出顺序信息中的至少一种解耦合(340、355)。
30.如权利要求29所述的方法,其中所述视角标识符存在于所述结果比特流中的片断级别。
31.如权利要求29所述的方法,其中所述视角标识符存在于所述结果比特流中高于宏块级别的级别。
32.如权利要求31所述的方法,其中编码步骤在所述结果比特流中包括所述视角标识符,以供解码参考图像标记过程使用(340、355)。
33.如权利要求32所述的方法,其中编码步骤在所述结果比特流中包括所述视角标识符,以指示要被所述解码参考图像标记过程标记的特定图像属于所述至少两个视角中的哪一个视角(340、355)。
34.如权利要求29所述的方法,其中编码步骤使用至少一个现有的语法元素来支持在重新定义的解码参考图像标记过程(1620)中使用所述视角标识符,其中所述至少一个现有的语法元素的语义被重新定义以供所述重新定义的解码参考图像标记过程使用,所述重新定义的解码参考图像标记过程对应于国际标准化组织/国际电工委员会运动图像专家组-4第10部分高级视频编码标准/国际电信联盟电信部门H.264推荐。
35.如权利要求34所述的方法,其中在所述重新定义的解码参考图像标记过程中,只有与当前解码的图像具有相同视角标识符的图像被标记(1540、1555)。
36.如权利要求34所述的方法,其中滑动窗口解码参考图像标记过程和自适应存储器控制解码参考图像标记过程中的至少一种被应用。
37.如权利要求34所述的方法,其中在所述重新定义的解码参考图像标记过程中,与所述至少一个图像具有不同的视角标识符的图像被利用先前未使用的语法元素标记。
38.如权利要求31所述的方法,其中编码步骤在所述结果比特流中包括所述视角标识符,以用于默认参考图像列表构造(530)。
39.如权利要求38所述的方法,其中根据用于所述参考图像列表构造的至少一个现有的语法元素,间隔视角参考图像被禁止添加到用于与所述参考图像列表构造相对应的默认参考图像列表创建过程(530)的参考列表上。
40.如权利要求38所述的方法,其中根据用于所述默认参考图像列表构造的至少一个现有的语法元素,只有间隔视角参考图像被添加到用于与所述参考图像列表构造相对应的默认参考图像列表创建过程(630)的参考列表上。
41.如权利要求40所述的方法,其中所述间隔视角参考图像在时间参考之后被添加。
42.如权利要求29所述的方法,其中编码步骤使用被重新定义的至少一个现有的语法元素,以用在重新定义的参考图像列表重排序过程(2132)中,以支持在所述重新定义的参考图像列表重排序过程中使用所述视角标识符,其中所述重新定义的参考图像列表重排序过程对应于国际标准化组织/国际电工委员会运动图像专家组-4第10部分高级视频编码标准/国际电信联盟电信部门H.264推荐。
43.如权利要求42所述的方法,其中在所述重新定义的参考图像列表重排序过程中,只有与当前解码的图像具有相同视角标识符的图像被重排序(2134)。
44.如权利要求43所述的方法,其中所述视角标识符指示要移动到相应参考图像列表中的当前索引的特定图像对应于所述至少两个视角中的哪一个视角(2234)。
45.如权利要求43所述的方法,其中仅当要排序的参考图像的视角标识符不同于所述至少一个图像的视角标识符时,才需要所述视角标识符。
46.如权利要求29所述的方法,其中编码步骤使用针对时间直接模式(1130、1230)重新定义的现有的语法元素以支持在所述时间直接模式中使用所述视角标识符,所述现有的语法对应于国际标准化组织/国际电工委员会运动图像专家组-4第10部分高级视频编码标准/国际电信联盟电信部门H.264推荐。
47.如权利要求46所述的方法,其中所述时间直接模式是基于图像顺序计数值和视角标识符中的至少一个导出的(1230)。
48.如权利要求29所述的方法,其中编码步骤使用现有的语法元素、现有的语义和现有的解码过程以用于时间直接模式,其中所述现有的语法、现有的语义和现有的解码过程对应于国际标准化组织/国际电工委员会运动图像专家组-4第10部分高级视频编码标准/国际电信联盟电信部门H.264推荐。
49.如权利要求29所述的方法,其中编码步骤使用针对隐式加权预测(1132、1232)重新定义的现有的语法元素以支持在所述隐式加权预测中使用所述视角标识符,其中所述现有的语法对应于国际标准化组织/国际电工委员会运动图像专家组-4第10部分高级视频编码标准/国际电信联盟电信部门H.264推荐。
50.如权利要求49所述的方法,其中所述隐式加权预测是基于图像顺序计数值和视角标识符中的至少一个导出的(1232)。
51.如权利要求29所述的方法,其中编码步骤使用现有的语法元素、现有的语义和现有的解码过程以用于隐式加权预测,其中所述现有的语法、现有的语义和现有的解码过程对应于国际标准化组织/国际电工委员会运动图像专家组-4第10部分高级视频编码标准/国际电信联盟电信部门H.264推荐。
52.如权利要求27所述的方法,其中编码步骤使用与特定图像相对应的至少两个视角中的特定一个视角来指定在对所述至少两个视角中的不同的那些视角的并行编码中的间隔视角依赖性(350)。
53.一种用于视频编码的视频信号结构,包括:
与多视角视频内容的至少两个视角中的至少一个视角相对应的至少一个图像,被编码以形成结果比特流,其中在所述结果比特流中,所述至少一个图像的编码顺序信息和输出顺序信息中的至少一种被从与所述至少一个图像相对应的至少一个视角解耦合。
54.一种其上编码有视频信号数据的存储介质,包括:
与多视角视频内容的至少两个视角中的至少一个视角相对应的至少一个图像,被编码以形成结果比特流,其中在所述结果比特流中,所述至少一个图像的编码顺序信息和输出顺序信息中的至少一种被从与所述至少一个图像相对应的至少一个视角解耦合。
55.一种装置,包括:
编码器(200),用于对与多视角视频内容相对应的至少两个视角中的至少一个视角进行编码,其中所述编码器利用默认参考图像列表构造过程和参考图像列表重排序中的重新定义的变量来对所述至少两个视角中的至少一个视角进行编码,所述默认参考图像列表构造过程和参考图像列表重排序对应于国际标准化组织/国际电工委员会运动图像专家组-4第10部分高级视频编码标准/国际电信联盟电信部门H.264推荐。
56.如权利要求55所述的装置,其中视角数和视角标识符信息中的至少一个被用于重新定义所述变量。
57.如权利要求55所述的装置,其中图像组长度和视角标识符信息中的至少一个被用于重新定义所述变量。
58.一种装置,包括:
编码器(200),用于对与多视角视频内容相对应的至少两个视角中的至少一个视角进行编码,其中所述编码器利用解码参考图像标记过程中的重新定义的变量来对所述至少两个视角中的至少一个视角进行编码,所述解码参考图像标记过程对应于国际标准化组织/国际电工委员会运动图像专家组-4第10部分高级视频编码标准/国际电信联盟电信部门H.264推荐。
59.如权利要求58所述的装置,其中视角数和视角标识符信息中的至少一个被用于重新定义所述变量。
60.如权利要求58所述的装置,其中图像组长度和视角标识符信息中的至少一个被用于重新定义所述变量。
61.一种方法,包括:
对与多视角视频内容相对应的至少两个视角中的至少一个视角进行编码,其中编码步骤利用默认参考图像列表构造过程和参考图像列表重排序中的重新定义的变量来对所述至少两个视角中的至少一个视角进行编码(1730、1830),所述默认参考图像列表构造过程和参考图像列表重排序对应于国际标准化组织/国际电工委员会运动图像专家组-4第10部分高级视频编码标准/国际电信联盟电信部门H.264推荐。
62.如权利要求61所述的方法,其中视角数和视角标识符信息中的至少一个被用于重新定义所述变量(1730)。
63.如权利要求61所述的方法,其中图像组长度和视角标识符信息中的至少一个被用于重新定义所述变量(1830)。
64.一种方法,包括:
对与多视角视频内容相对应的至少两个视角中的至少一个视角进行编码,其中编码步骤利用解码参考图像标记过程中的重新定义的变量来对所述至少两个视角中的至少一个视角进行编码(1730、1830),所述解码参考图像标记过程对应于国际标准化组织/国际电工委员会运动图像专家组-4第10部分高级视频编码标准/国际电信联盟电信部门H.264推荐。
65.如权利要求64所述的方法,其中视角数和视角标识符信息中的至少一个被用于重新定义所述变量(1730)。
66.如权利要求64所述的方法,其中图像组长度和视角标识符信息中的至少一个被用于重新定义所述变量(1830)。
67.一种用于视频编码的视频信号结构,包括:
与多视角视频内容相对应的至少两个视角中的至少一个视角,其中所述至少两个视角中的至少一个视角被利用默认参考图像列表构造过程和参考图像列表重排序中的重新定义的变量来进行编码,所述默认参考图像列表构造过程和参考图像列表重排序对应于国际标准化组织/国际电工委员会运动图像专家组-4第10部分高级视频编码标准/国际电信联盟电信部门H.264推荐。
68.一种其上编码有视频信号数据的存储介质,包括:
与多视角视频内容相对应的至少两个视角中的至少一个视角,其中所述至少两个视角中的至少一个视角被利用默认参考图像列表构造过程和参考图像列表重排序中的重新定义的变量来进行编码,所述默认参考图像列表构造过程和参考图像列表重排序对应于国际标准化组织/国际电工委员会运动图像专家组-4第10部分高级视频编码标准/国际电信联盟电信部门H.264推荐。
69.一种用于视频编码的视频信号结构,包括:
与多视角视频内容相对应的至少两个视角中的至少一个视角,其中所述至少两个视角中的至少一个视角被利用解码参考图像标记过程中的重新定义的变量来进行编码,所述解码参考图像标记过程对应于国际标准化组织/国际电工委员会运动图像专家组-4第10部分高级视频编码标准/国际电信联盟电信部门H.264推荐。
70.一种其上编码有视频信号数据的存储介质,包括:
与多视角视频内容相对应的至少两个视角中的至少一个视角,其中所述至少两个视角中的至少一个视角被利用解码参考图像标记过程中的重新定义的变量来进行编码,所述解码参考图像标记过程对应于国际标准化组织/国际电工委员会运动图像专家组-4第10部分高级视频编码标准/国际电信联盟电信部门H.264推荐。
CN2007800257184A 2006-07-06 2007-07-05 用于针对多视角视频编码和解码解耦合帧号和/或图像顺序计数(poc)的方法和装置 Active CN101611633B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US81887406P 2006-07-06 2006-07-06
US60/818,874 2006-07-06
US80770606P 2006-07-18 2006-07-18
US60/807,706 2006-07-18
PCT/US2007/015678 WO2008005574A2 (en) 2006-07-06 2007-07-05 Method and apparatus for decoupling frame number and/or picture order count (poc) for multi-view video encoding and decoding

Publications (2)

Publication Number Publication Date
CN101611633A true CN101611633A (zh) 2009-12-23
CN101611633B CN101611633B (zh) 2012-10-03

Family

ID=40925508

Family Applications (2)

Application Number Title Priority Date Filing Date
CN2007800257184A Active CN101611633B (zh) 2006-07-06 2007-07-05 用于针对多视角视频编码和解码解耦合帧号和/或图像顺序计数(poc)的方法和装置
CN2007800257057A Active CN101496407B (zh) 2006-07-06 2007-07-05 用于针对多视角视频编码和解码解耦合帧号和/或图像顺序计数(poc)的方法和装置

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN2007800257057A Active CN101496407B (zh) 2006-07-06 2007-07-05 用于针对多视角视频编码和解码解耦合帧号和/或图像顺序计数(poc)的方法和装置

Country Status (3)

Country Link
US (2) US10244231B2 (zh)
CN (2) CN101611633B (zh)
ZA (2) ZA200900102B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103037209A (zh) * 2011-09-30 2013-04-10 腾讯科技(深圳)有限公司 视频帧的解码处理方法和装置
WO2014089805A1 (en) * 2012-12-13 2014-06-19 Mediatek Singapore Pte. Ltd. A new reference management method for video coding
CN103931189A (zh) * 2011-09-22 2014-07-16 Lg电子株式会社 用信号发送图像信息的方法和装置,以及使用其的解码方法和装置

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9635355B2 (en) * 2011-07-28 2017-04-25 Qualcomm Incorporated Multiview video coding
CN110650336B (zh) * 2012-01-18 2022-11-29 韩国电子通信研究院 视频解码装置、视频编码装置和传输比特流的方法
US10200709B2 (en) 2012-03-16 2019-02-05 Qualcomm Incorporated High-level syntax extensions for high efficiency video coding
US9503720B2 (en) * 2012-03-16 2016-11-22 Qualcomm Incorporated Motion vector coding and bi-prediction in HEVC and its extensions
EP2830313B1 (en) 2012-04-16 2019-10-16 Samsung Electronics Co., Ltd. Method and apparatus for determining reference picture set of image
US20140010277A1 (en) * 2012-07-09 2014-01-09 Qualcomm, Incorporated Supplemental enhancement information (sei) messages having a fixed-length coded video parameter set (vps) id
EP2946558B1 (en) 2013-01-15 2020-04-29 Huawei Technologies Co., Ltd. Method for decoding an hevc video bitstream
CA2921759C (en) 2013-10-17 2018-05-15 Mediatek Inc. Method of motion information prediction and inheritance in multi-view and three-dimensional video coding
US9654774B2 (en) * 2013-12-12 2017-05-16 Qualcomm Incorporated POC value design for multi-layer video coding
US10158867B2 (en) * 2014-06-20 2018-12-18 Qualcomm Incorporated Picture order count reset for multi-layer codecs
US10771791B2 (en) * 2016-08-08 2020-09-08 Mediatek Inc. View-independent decoding for omnidirectional video
CN107194961B (zh) * 2017-05-19 2020-09-22 西安电子科技大学 群体图像编码中多参考图像的确定方法
CN117135346A (zh) 2018-04-02 2023-11-28 深圳市大疆创新科技有限公司 用于图像处理的方法和图像处理装置
CN113194811A (zh) * 2018-12-29 2021-07-30 深圳迈瑞生物医疗电子股份有限公司 院内病人恢复状态的评估方法、装置、系统及存储介质

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE4331376C1 (de) 1993-09-15 1994-11-10 Fraunhofer Ges Forschung Verfahren zum Bestimmen der zu wählenden Codierungsart für die Codierung von wenigstens zwei Signalen
EP0945001B1 (en) 1996-12-18 2003-04-23 Thomson Consumer Electronics, Inc. A multiple format video signal processor
RU2201654C2 (ru) 1997-12-23 2003-03-27 Томсон Лайсенсинг С.А. Способ низкошумового кодирования и декодирования
SG99889A1 (en) 2000-02-25 2003-11-27 Sony Corp Recording medium, recording apparatus and reading apparatus
RU2237283C2 (ru) 2001-11-27 2004-09-27 Самсунг Электроникс Ко., Лтд. Устройство и способ представления трехмерного объекта на основе изображений с глубиной
KR100508798B1 (ko) 2002-04-09 2005-08-19 엘지전자 주식회사 쌍방향 예측 블록 예측 방법
KR100481732B1 (ko) 2002-04-20 2005-04-11 전자부품연구원 다 시점 동영상 부호화 장치
JP2004048579A (ja) 2002-07-15 2004-02-12 Sharp Corp 動画像符号化装置および復号装置
KR100475060B1 (ko) 2002-08-07 2005-03-10 한국전자통신연구원 다시점 3차원 동영상에 대한 사용자 요구가 반영된 다중화장치 및 방법
JP2004228617A (ja) 2003-01-17 2004-08-12 Matsushita Electric Ind Co Ltd 動画像符号化装置および動画像復号化装置
US7724818B2 (en) * 2003-04-30 2010-05-25 Nokia Corporation Method for coding sequences of pictures
US7809059B2 (en) 2003-06-25 2010-10-05 Thomson Licensing Method and apparatus for weighted prediction estimation using a displaced frame differential
US7664292B2 (en) 2003-12-03 2010-02-16 Safehouse International, Inc. Monitoring an output from a camera
JP3879741B2 (ja) 2004-02-25 2007-02-14 ソニー株式会社 画像情報符号化装置および画像情報符号化方法
JP4185014B2 (ja) 2004-04-14 2008-11-19 日本電信電話株式会社 映像符号化方法、映像符号化装置、映像符号化プログラム及びそのプログラムを記録したコンピュータ読み取り可能な記録媒体、並びに、映像復号方法、映像復号装置、映像復号プログラム及びそのプログラムを記録したコンピュータ読み取り可能な記録媒体
KR100679740B1 (ko) 2004-06-25 2007-02-07 학교법인연세대학교 시점 선택이 가능한 다시점 동영상 부호화/복호화 방법
US8155186B2 (en) 2004-08-11 2012-04-10 Hitachi, Ltd. Bit stream recording medium, video encoder, and video decoder
CN1918917A (zh) 2004-10-07 2007-02-21 日本电信电话株式会社 视频编码方法及装置、视频解码方法及装置、它们的程序及记录这些程序的记录媒体
US20060083298A1 (en) * 2004-10-14 2006-04-20 Nokia Corporation Reference picture management in video coding
ITMI20041971A1 (it) * 2004-10-15 2005-01-15 Uni Degli Studi Brescia Metodo di codifica video scalabile
WO2006049412A1 (en) 2004-11-01 2006-05-11 Electronics And Telecommunications Research Institute Method for encoding/decoding a video sequence based on hierarchical b-picture using adaptively-adjusted gop structure
US20090107945A1 (en) 2005-07-29 2009-04-30 Franz Ehrenleitner Folding Boom
US7903737B2 (en) 2005-11-30 2011-03-08 Mitsubishi Electric Research Laboratories, Inc. Method and system for randomly accessing multiview videos with known prediction dependency
ZA200805337B (en) * 2006-01-09 2009-11-25 Thomson Licensing Method and apparatus for providing reduced resolution update mode for multiview video coding
WO2007114612A1 (en) 2006-03-30 2007-10-11 Lg Electronics Inc. A method and apparatus for decoding/encoding a video signal
RU2443074C2 (ru) 2006-07-06 2012-02-20 Томсон Лайсенсинг Способ и устройство для отделения номера кадра и/или счетчика очередности изображения (рос) для мультивидового видеокодирования и видеодекодирования

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103931189A (zh) * 2011-09-22 2014-07-16 Lg电子株式会社 用信号发送图像信息的方法和装置,以及使用其的解码方法和装置
CN103931189B (zh) * 2011-09-22 2017-11-03 Lg电子株式会社 用信号发送图像信息的方法和装置,以及使用其的解码方法和装置
US10321154B2 (en) 2011-09-22 2019-06-11 Lg Electronics Inc. Method and apparatus for signaling image information, and decoding method and apparatus using same
US10791337B2 (en) 2011-09-22 2020-09-29 Lg Electronics Inc. Method and apparatus for signaling image information, and decoding method and apparatus using same
US11412252B2 (en) 2011-09-22 2022-08-09 Lg Electronics Inc. Method and apparatus for signaling image information, and decoding method and apparatus using same
US11743494B2 (en) 2011-09-22 2023-08-29 Lg Electronics Inc. Method and apparatus for signaling image information, and decoding method and apparatus using same
CN103037209A (zh) * 2011-09-30 2013-04-10 腾讯科技(深圳)有限公司 视频帧的解码处理方法和装置
CN103037209B (zh) * 2011-09-30 2016-05-04 腾讯科技(深圳)有限公司 视频帧的解码处理方法和装置
WO2014089805A1 (en) * 2012-12-13 2014-06-19 Mediatek Singapore Pte. Ltd. A new reference management method for video coding

Also Published As

Publication number Publication date
CN101496407A (zh) 2009-07-29
US20190238834A1 (en) 2019-08-01
CN101496407B (zh) 2013-02-06
US20170264893A1 (en) 2017-09-14
ZA200900857B (en) 2010-05-26
US10244231B2 (en) 2019-03-26
CN101611633B (zh) 2012-10-03
ZA200900102B (en) 2010-05-26

Similar Documents

Publication Publication Date Title
CN101496407B (zh) 用于针对多视角视频编码和解码解耦合帧号和/或图像顺序计数(poc)的方法和装置
JP6462828B2 (ja) マルチビュービデオ符号化及び復号化のためにフレームナンバー及び/又はピクチャオーダカウント(poc)を分離する方法及び装置
CN101366285B (zh) 用于多视角视频编码的方法和装置
CN101653000B (zh) 用于包含多视点视频编码的参考图像管理的方法
CN101491079A (zh) 用在多视角视频编码中的方法和装置
TW201244487A (en) Picture identification for multi-view video coding
CN101785317A (zh) 使用区域视差向量的多视角编码视频中的运动跳过模式的方法和装置
CN101653001A (zh) 用于多视点视频编码的参考图像列表管理语法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CP02 Change in the address of a patent holder

Address after: I Si Eli Murli Nor, France

Patentee after: THOMSON LICENSING

Address before: France's Nigeria - Billancourt City

Patentee before: THOMSON LICENSING

CP02 Change in the address of a patent holder
TR01 Transfer of patent right

Effective date of registration: 20190529

Address after: American Delaware

Patentee after: Interactive Digital VC Holdings

Address before: I Si Eli Murli Nor, France

Patentee before: THOMSON LICENSING

TR01 Transfer of patent right