CN101390402A - 使用不同类型的下层信息对交织视频信号进行编码/解码的方法和设备 - Google Patents

使用不同类型的下层信息对交织视频信号进行编码/解码的方法和设备 Download PDF

Info

Publication number
CN101390402A
CN101390402A CNA2007800065184A CN200780006518A CN101390402A CN 101390402 A CN101390402 A CN 101390402A CN A2007800065184 A CNA2007800065184 A CN A2007800065184A CN 200780006518 A CN200780006518 A CN 200780006518A CN 101390402 A CN101390402 A CN 101390402A
Authority
CN
China
Prior art keywords
macro block
lower floor
pair
field
anterior layer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2007800065184A
Other languages
English (en)
Other versions
CN101390402B (zh
Inventor
金素英
李教爀
韩宇镇
李泰美
玛修·摩奴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of CN101390402A publication Critical patent/CN101390402A/zh
Application granted granted Critical
Publication of CN101390402B publication Critical patent/CN101390402B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/33Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the spatial domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/112Selection of coding mode or of prediction mode according to a given display mode, e.g. for interlaced or progressive display mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/16Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter for a given display mode, e.g. for interlaced or progressive display mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

提供一种用于对具有以交织方式编码的宏块的多层交织视频信号进行编码/解码的方法和设备。所述方法包括:确定当前层的一对宏块是否是帧类型,下层的相应的一对宏块是否是场类型;以及如果当前层的一对宏块是帧类型且下层的相应的一对宏块是场类型,并且已经以不同的预测模式对下层的顶场和底场的相应的一对宏块的进行了编码,则通过对下层的顶场或底场的相应的宏块的信息进行插值来对当前层的宏块进行预测和编码。

Description

使用不同类型的下层信息对交织视频信号进行编码/解码的方法和设备
技术领域
与本发明一致的方法和设备涉及对视频信号进行编码/解码,更具体地说,涉及使用不同类型的下层信息对交织视频信号进行编码/解码。
背景技术
随着模拟视频压缩技术引入了交织场扫描。尽管逐行扫描提供更好的数字压缩和图像质量,但是在许多现有技术的成像设备中坚持使用交织场扫描。交织场扫描是指将形成屏幕的多个行划分成偶数行和奇数行,分别发送数据,并且分别扫描偶数行和奇数行。
图1是将现有技术的逐行帧与交织场进行比较的示图。参照图1,逐行帧110包括屏幕中的所有图像信息。在从逐行帧110提取偶数场之后获得顶场112。在从逐行帧110提取奇数场之后获得底场114。将逐行帧划分为两个交织的场,并且将交织的场的再现时间设置为小于预定时间段。
发明内容
技术问题
由于交织场扫描应用于视频编码,因此需要改变逐行扫描的预测和补偿处理。
具体地,不同于逐行扫描,在交织场扫描中,由于关于相邻像素或区域的信息属于不同的场,因此很难执行运动预测。因此,需要适合交织场扫描的运动预测处理。
技术方案
本发明提供一种用于在交织视频编码和解码中执行运动预测的方法和设备。
然而,本发明的各方面不限于在此阐述的这些方面。通过参照下面给出的本发明的详细描述,本发明的上述和其它方面对于本发明所属领域的普通技术人员将变得更加明显。
根据本发明的一方面,提供一种对包括以交织方式编码的宏块的多层交织视频信号进行编码的方法。所述方法包括:确定当前层的一对宏块是否是帧类型,下层的相应的一对宏块是否是场类型,并且确定是否已经以不同的预测模式对下层的顶场和底场的相应的一对宏块进行了编码;以及如果当前层的一对宏块是帧类型且下层的相应的一对宏块是场类型,并已经以不同的预测模式对下层的顶场和底场的相应的一对宏块进行了编码,则通过对下层的顶场或底场的相应的宏块的信息进行插值来对当前层的宏块进行预测和编码。
根据本发明的另一方面,提供一种对包括以交织方式编码的宏块的多层交织视频信号进行解码的方法。所述方法包括:确定当前层的一对宏块是否是帧类型,下层的相应的一对宏块是否是场类型,并且确定是否已经以不同的预测模式对下层的顶场和底场的相应的一对宏块进行了编码;以及如果当前层的一对宏块是帧类型且下层的相应的一对宏块是场类型,并已经以不同的预测模式对下层的顶场和底场的相应的一对宏块进行了编码,则通过对下层的顶场或底场的相应的宏块的信息进行插值来对当前层的宏块进行预测和解码。
根据本发明的另一方面,提供一种对包括以交织方式编码的宏块的多层交织视频信号进行编码的方法。所述方法包括:确定当前层的一对宏块是否是场类型,下层的相应的一对宏块是否是帧类型,并且确定是否已经以不同的预测模式对组成下层的相应的一对宏块的顶宏块和底宏块进行了编码;以及如果当前层的一对宏块是场类型且下层的相应的一对宏块是帧类型,并已经以不同的预测模式对组成下层的相应的一对宏块的顶宏块和底宏块进行了编码,则参照下层的帧类型帧间宏块的子块对当前层的帧间宏块进行编码。
根据本发明的另一方面,提供一种对包括以交织方式编码的宏块的多层交织视频信号进行解码的方法。所述方法包括:确定当前层的一对宏块是否是场类型,下层的相应的一对宏块是否是帧类型,并且确定是否已经以不同的预测模式对组成下层的相应的一对宏块的顶宏块和底宏块进行了编码;以及如果当前层的一对宏块是场类型且下层的相应的一对宏块是帧类型,并已经以不同的预测模式对组成下层的相应的一对宏块的顶宏块和底宏块进行了编码,则参照下层的帧类型帧间宏块的子块对当前层的帧间宏块进行解码。
根据本发明的另一方面,提供一种对包括以交织方式编码的宏块的多层交织视频信号进行编码的方法。所述方法包括:确定当前层的一对宏块是否是场类型,下层的相应的一对宏块是否是帧类型;如果当前层的一对宏块是场类型且下层的相应的一对宏块是帧类型,则将当前层的宏块的参考索引设置为下层的相应的宏块的参考索引的两倍;以及使用设置的参考索引对当前层的宏块进行编码。
根据本发明的另一方面,提供一种对包括以交织方式编码的宏块的多层交织视频信号进行解码的方法。所述方法包括:确定当前层的一对宏块是否是场类型,下层的相应的一对宏块是否是帧类型;如果当前层的一对宏块是场类型且下层的相应的一对宏块是帧类型,则将当前层的宏块的参考索引设置为下层的相应的宏块的参考索引的两倍;以及使用设置的参考索引对当前层的宏块进行解码。
根据本发明的另一方面,提供一种对包括以交织方式编码的宏块的多层交织视频信号进行编码的方法。所述方法包括:确定当前层的一对宏块是否是场类型,下层的相应的一对宏块是否是帧类型;以及如果当前层的一对宏块是场类型且下层的相应的一对宏块是帧类型,则通过将当前层的宏块的第一场中的顶块的像素设置为所述宏块的场中的底块的像素值来放大所述像素,并且对当前层的宏块进行编码。
根据本发明的另一方面,提供一种对包括以交织方式编码的宏块的多层交织视频信号进行解码的方法。所述方法包括:确定当前层的一对宏块是否是场类型,下层的相应的一对宏块是否是帧类型;以及如果当前层的一对宏块是场类型且下层的相应的一对宏块是帧类型,则通过将当前层的宏块的第一场中的顶块的像素设置为所述宏块的场中的底块的像素值来放大所述像素,并且对当前层的宏块进行解码。
根据本发明的另一方面,提供一种对包括以交织方式编码的宏块的多层交织视频信号进行编码的设备。所述设备包括:场/帧转换单元,确定当前层的一对宏块是否是帧类型,下层的相应的一对宏块是否是场类型,并且确定是否已经以不同的预测模式对下层的顶场和底场的相应的一对宏块进行了编码,并且如果当前层的一对宏块是帧类型且下层的相应的一对宏块是场类型,并已经以不同的预测模式对下层的顶场和底场的相应的一对宏块进行了编码,则对下层的顶场或底场的宏块的信息进行插值以预测当前层的相应的宏块;以及预测编码单元,基于预测结果对当前层的相应的宏块进行编码。
根据本发明的另一方面,提供一种对包括以交织方式编码的宏块的多层交织视频信号进行解码的设备。所述设备包括:场/帧转换单元,确定当前层的一对宏块是否是帧类型,下层的相应的一对宏块是否是场类型,并且确定是否已经以不同的预测模式对下层的顶场和底场的相应的一对宏块进行了编码,并且如果当前层的一对宏块是帧类型且下层的相应的一对宏块是场类型,并已经以不同的预测模式对下层的顶场和底场的相应的一对宏块进行了编码,则对下层的顶场或底场的宏块的信息进行插值以预测当前层的相应的宏块;以及预测解码单元,基于预测结果对当前层的相应的宏块进行解码。
根据本发明的另一方面,提供一种对包括以交织方式编码的宏块的多层交织视频信号进行编码的设备。所述设备包括:场/帧转换单元,确定当前层的一对宏块是否是场类型,下层的相应的一对宏块是否是帧类型,并且确定是否已经以不同的预测模式对组成下层的相应的一对宏块的顶宏块和底宏块进行了编码,并且如果当前层的一对宏块是场类型,下层的相应的一对宏块是帧类型,并已经以不同的预测模式对组成下层的相应的一对宏块的顶宏块和底宏块进行了编码,则参照下层的帧类型帧间宏块的子块以对当前层的帧间宏块进行预测;以及预测编码单元,使用预测结果对当前层的帧间宏块进行编码。
根据本发明的另一方面,提供一种对包括以交织方式编码的宏块的多层交织视频信号进行解码的设备。所述设备包括:场/帧转换单元,确定当前层的一对宏块是否是帧类型,下层的相应的一对宏块是否是场类型,并确定是否已经以不同的预测模式对组成下层的相应的一对宏块的顶宏块和底宏块进行了编码,并且如果当前层的一对宏块是场类型,下层的相应的一对宏块是帧类型,并已经以不同的预测模式对组成下层的相应的一对宏块的顶宏块和底宏块进行了编码,则参照下层的帧类型帧间宏块的子块以对当前层的帧间宏块进行预测;以及预测解码单元,使用预测结果对当前层的帧间宏块进行解码。
根据本发明的另一方面,提供一种对包括以交织方式编码的宏块的多层交织视频信号进行编码的设备。所述设备包括:场/帧转换单元,确定当前层的一对宏块是否是场类型,下层的相应的一对宏块是否是帧类型,并且如果当前层的一对宏块是场类型且下层的相应的一对宏块是帧类型,则将当前层的宏块的参考索引设置为下层的相应的宏块的参考索引的两倍;以及预测编码单元,使用设置的参考索引对当前层的宏块进行编码。
根据本发明的另一方面,提供一种对包括以交织方式编码的宏块的多层交织视频信号进行解码的设备。所述设备包括:场/帧转换单元,确定当前层的一对宏块是否是场类型,下层的相应的一对宏块是否是帧类型,并且如果当前层的一对宏块是场类型且下层的相应的一对宏块是帧类型,则将当前层的宏块的参考索引设置为下层的相应的宏块的参考索引的两倍;以及预测解码单元,使用设置的参考索引对当前层的宏块进行解码。
根据本发明的另一方面,提供一种对包括以交织方式编码的宏块的多层交织视频信号进行编码的设备。所述设备包括:场/帧转换单元,确定当前层的一对宏块是否是场类型,下层的相应的一对宏块是否是帧类型,并且如果当前层的一对宏块是场类型且下层的相应的一对宏块是帧类型,则通过将当前层的宏块的第一场中的顶块的像素设置为所述宏块的场中的底块的像素值来放大所述像素;以及预测编码单元,参考设置的像素值对当前层的宏块进行编码。
根据本发明的另一方面,提供一种对包括以交织方式编码的宏块的多层交织视频信号进行解码的设备。所述设备包括:场/帧转换单元,确定当前层的宏块是否是场类型,下层的相应的宏块是否是帧类型,并且如果当前层的宏块是场类型且下层的相应的宏块是帧类型,则通过将当前层的宏块的第一场中的顶块的像素设置为所述宏块的场中的底块的像素值来放大所述像素;以及预测解码单元,参考设置的像素值对当前层的宏块进行解码。
附图说明
通过下面参照附图对本发明的优选实施例进行的详细描述,本发明的上述和其它方面将会变得更加明显,其中:
图1是将现有技术的逐行帧与交织场进行比较的示图;
图2是示出当前层的宏块是帧类型和低于当前层的基层的宏块是场类型的两种情况的示图;
图3是示出根据本发明的示例性实施例的用于对基层的宏块进行插值的处理的示图;
图4是示出根据本发明的示例性实施例的参考索引设置的示图;
图5是示出根据本发明的另一示例性实施例的运动向量设置的示图;
图6是示出根据本发明的示例性实施例的使用宏块帧类推顶场和底场的处理的示图;
图7是示出根据本发明的示例性实施例的使用基层的帧内宏块预测当前层的场宏块的处理的示图;
图8是示出根据本发明的示例性实施例的编码处理的流程图;
图9是示出根据本发明的示例性实施例的包括在视频编码器中的对增强层进行编码的增强层编码单元的框图;以及
图10是示出根据本发明的示例性实施例的包括在视频解码器中的对增强层进行解码的增强层解码单元的框图。
具体实施方式
现将参照附图更加全面地描述本发明,其中,在附图中示出本发明的示例性实施例。然而,本发明可以以许多不同的形式被实施并且不应被解释为局限于在此阐述的示例性实施例;更恰当地,提供这些示例性实施例从而本公开将会彻底和完整,并完全地将本发明的构思传达给本领域的技术人员。附图中相同的标号是指相同的部件,因此将省略它们的描述。
以下,将参照框图或流程图描述根据本发明的实施例的使用不同类型的下层信息对交织视频信号进行编码/解码的方法和设备。应该理解,流程图的每一个块和在流程图中的块的组合可由计算机程序指令实现。这些计算机程序指令可被提供给通用计算机、专用计算机、或者其他可编程数据处理设备的处理器,从而经由计算机或者其他可编程数据处理设备的处理器执行的指令创建用于实现在一个流程图块或多个流程图块中指定的功能的装置。
这些计算机程序指令也可被存储在可指导计算机或者其他可编程数据处理设备以特定方式运行的计算机可用或计算机可读存储器中,从而存储在计算机可用或计算机可读存储器中的指令生成包括执行在一个流程图块或多个流程图块中指定的功能的指令装置的产品。
计算机程序指令也可被载入计算机或其他可编程数据处理设备,以使得一系列操作步骤在计算机或其他可编程设备上被执行以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在一个流程图块或多个流程图块中指定的功能的步骤。
流程图的每块可代表模块、代码段或代码的一部分,其包括一个或更多用于实现特定的逻辑功能的可执行指令。应注意的是,在一些替换的实现中,在这些块中标注的功能可不按顺序执行。例如,连续示出的两个块事实上可基本同时地被执行,或者有时块以相反的顺序执行,这取决于涉及的功能。
当将交织场扫描应用于视频编码(诸如H.264)时,可在帧编码的情况下选择三种编码方法中的一种,所述三种编码方法为:将两场合并为一帧并对所述帧进行编码的方法(帧模式),将两场中的每一场进行编码而不合并两个场的方法(场编码),以及将两场合并并压缩为一帧以进行编码,将一对垂直相邻的宏块划分为两场并对所述两场进行编码的方法。
如果帧包括与不动区混和的运动区,则在帧模式下对不动区进行编码,在场模式下对运动区进行编码可能是有效的。换句话说,对于帧中的每个垂直宏块对,可以独立地进行帧/场编码的确定。这种编码选择被称为宏块自适应帧/场(MBAFF)编码。为了在帧模式下对一对宏块进行编码,此对宏块中的每个宏块必须包括帧线。另外,为了在场模式下对一对宏块进行编码,此对宏块中的顶宏块包括顶场线(1ine),底宏块包括底场线。
当在多层结构中参照基层时,由于基层和当前层的宏块之间的差异,因此可进行各种组合。表1显示了这些组合的示例。
参照表1,当前层的宏块的类型可以是帧类型,基层的宏块的类型可以是场类型。另外,基层中的一对宏块(顶宏块和底宏块)可以是已经被不同地编码。也就是说,所述一对宏块中的一个宏块可以是已经进行了帧内编码,而另一宏块可以是已经进行了帧间编码。在这种情况下,不能执行层间预测,原因是必须使用基层的帧内编码的宏块对当前层的顶线进行预测,并且必须使用基层的帧间编码的宏块对当前层的底线进行预测。
  表1
 
当前层的宏块类型
基层的宏块类型
 
顶宏块的预测模式底宏块的预测模式 帧间帧内 帧内帧间 帧间帧内 帧内帧间
图2是示出当前层的宏块210是帧类型和低于当前层的基层的宏块是场类型的两种情况的示图。在第一种情况下,基层的顶场是帧内编码的宏块220,底场是帧间编码的宏块230。在第二种情况下,基层的顶场是帧间编码的宏块240,底场是帧内编码的宏块250。
在图2示出的两种情况下,本发明的示例性实施例提出将插值作为预测当前层的方法。使用插值滤波器将基层的16×16顶宏块产生为一对16×32帧内编码的宏块。当前层的16×32宏块参照因此插值的16×32帧内编码的宏块。当前层的16×32宏块可使用帧内基层(BL)方法。
图3是示出根据本发明的示例性实施例的用于对基层的宏块进行插值的处理的示图。在图3中,示出对图2的基层的帧内编码的宏块220和帧间编码的宏块230进行插值的处理。
参照图3,对基层中顶场的帧内编码的宏块320进行插值,并且将其放大到帧内编码的宏块350,对基层中底场的帧间编码的宏块330进行插值,并且将其放大到帧间编码的宏块360。在对顶场进行插值的方法的示例中,可对顶场的宏块和下一顶场的宏块之间的空白空间进行插值。
如果将插值滤波器设置到基层中底场的帧间编码的宏块,则将基层中的顶场的16×16宏块插值为一对16×32帧间编码的宏块。对于残差预测,参照16×32帧间编码的宏块。如果基层的被插值的宏块是帧间编码的宏块,则可通过将每个4×4子块乘以2来从基层计算运动向量。可从基层得到宏块划分。
当前层的帧宏块可选择预测模式。换句话说,可使用率失真(RD)计算执行帧间预测和定向帧内预测。
上面已经参照图2和图3描述了在当前层的宏块类型是帧类型并且基层的宏块类型是场类型时可用于进行预测的插值方法。
以下,将描述当前层的宏块类型是场类型并且基层的宏块类型是帧类型的情况。
具体地,现将描述在基层的一对宏块分别是帧类型帧间宏块和帧类型帧内宏块时对参考索引和运动向量执行层间预测。图4是示出根据本发明的示例性实施例的参考索引设置的示图。如图4所示,参考索引被设置。当基层420的帧类型帧间宏块422和帧类型帧内宏块424用于当前层410的宏块预测时,当前层410的场类型帧间宏块412参照基层420中帧类型帧间宏块422的上部分中的子块。类似地,当前层410的场类型帧间宏块414参照基层420的帧类型帧间宏块422的下部分中的子块。
图5是示出根据本发明的另一示例性实施例的运动向量设置的示图。
参照图5,在当前层510的顶场中的场类型帧间宏块512和当前层510的底场中的场类型帧间宏块514中的每一个中,运动向量被设置为“0”。将当前层510的4×4宏块的运动向量设置为0的原因是:基层520的帧类型帧内宏块524的运动向量被设置为0。
在宏块的层间残差和纹理预测的情况下,当前层中的一对宏块可以是一对场宏块,并且基层中的相应的一对宏块可以是一对帧宏块,或者相反。另外,基层的一对宏块中的一个宏块可以是已经在帧内预测模式下被编码,并且对所述一对宏块中的另一个宏块可以是已经在帧间预测模式下被编码。在这种情况下,将base_mode_flag设置为0,可在单回路解码模式下将intra_base_flag设置为0,并且还可将residual_prediction_flag设置为0。在层间运动预测中,当前层的一对宏块可以是一对帧宏块,并且基层的相应的一对宏块可以是一对场宏块。另外,基层的一对宏块中的一个宏块可以是已经在帧内预测模式下被编码,并且所述一对宏块中的另一个宏块可以是已经在帧间预测模式下被编码。在这种情况下,对于当前层的宏块,可以将base_mode_flag设置为0。
图6是示出根据本发明的示例性实施例的使用宏块帧650类推顶场610和底场620的处理的示图。这里,除了图6还可参照图4和图5。可在包括下面的示例的各种情况下执行类推处理。
1)如果当前层的宏块是顶场610,并且已经对相应的宏块进行了帧间编码,也就是说,已经对基层的相应的一对宏块进行了帧间编码,则用于顶场610的第一8×8宏块部分和第二8×8宏块部分的参考索引可被设置为用于基层的相应的一对宏块中的顶宏块的第一8×8宏块部分和第二8×8宏块部分的参考索引的两倍。另外,用于第三8×8宏块部分和第四8×8宏块部分的参考索引可被设置为用于基层的相应的一对宏块中的底宏块的第一8×8宏块部分和第二8×8宏块部分的参考索引的两倍。
2)如果当前层的宏块是顶场610,并且已经对相应的宏块进行了帧内编码,则用于顶场610的第一8×8宏块部分和第三8×8宏块部分的参考索引可被设置为用于基层的相应的一对宏块中的底宏块的第一8×8宏块部分的参考索引的两倍。另外,用于第二8×8宏块部分和第四8×8宏块部分的参考索引可被设置为用于基层的相应的一对宏块中的底宏块的第二8×8宏块部分的参考索引的两倍。
3)如果当前层的宏块是顶场610,并且已经对基层的相应的一对宏块中的底宏块进行了帧内编码,则用于顶场610的第一8×8宏块部分和第三8×8宏块部分的参考索引可被设置为用于基层的相应的一对宏块中的顶宏块的第一8×8宏块部分的参考索引的两倍。另外,用于第二8×8宏块部分和第四8×8宏块部分的参考索引可被设置为用于基层的相应的一对宏块中的顶宏块的第二8×8宏块部分的参考索引的两倍。
4)如果当前层的宏块是底场620,并且已经对相应的一对顶宏块进行了帧内编码,则用于底场620的第一8×8宏块部分和第三8×8宏块部分的参考索引可被设置为用于基层的相应的一对宏块中的底宏块的第三8×8宏块部分的参考索引的两倍。另外,用于第二8×8宏块部分和第四8×8宏块部分的参考索引可被设置为用于基层的相应的一对宏块中的底宏块的第四8×8宏块部分的参考索引的两倍。
5)如果当前层的宏块是底场620,并且已经对相应的一对顶宏块进行了帧内编码,则用于底场620的第一8×8宏块部分和第三8×8宏块部分的参考索引可被设置为用于基层的相应的一对宏块中的顶宏块的第三8×8宏块部分的参考索引的两倍。另外,用于第二8×8宏块部分和第四8×8宏块部分的参考索引可被设置为用于基层的相应的一对宏块中的顶宏块的第四8×8宏块部分的参考索引的两倍。
6)如果当前层的宏块是底场620,并且已经对相应的一对顶宏块进行了帧间编码,则用于底场620的第一8×8宏块部分和第二8×8宏块部分的参考索引可被设置为用于基层的相应的一对宏块中的顶宏块的第三8×8宏块部分和第四8×8宏块部分的参考索引的两倍。另外,用于第三8×8宏块部分和第四8×8宏块部分的参考索引可被设置为用于基层的相应的一对宏块中的底宏块的第三8×8宏块部分和第四8×8宏块部分的参考索引的两倍。
可使用下面的等式来计算运动向量。如果当前层的宏块是场宏块且基层的宏块是帧宏块,则可应用下面的等式。在计算运动向量之前,将描述等式中的元素。LX表示(0,1)中的列表索引(list index),x和y分别表示当前宏块中4×4块的水平位置和垂直位置,并且具有0和3之间的值。另外,Curr和BL分别表示当前层的一对宏块和基层的相应的一对宏块。
FrameToField(mv)返回满足下面特性的运动向量mv*。如果将水平元素输入到运动向量,则mv*[0]=mv[0]。如果输入了垂直元素的运动向量除以2,则mv*[1]=mv[1]/2。
1)如下计算顶宏块的4×4块的第一行和第三行的运动向量以及底宏块的4×4块的第二行和第四行的运动向量。
[等式1]
如果顶帧是帧间帧(inter frame):
则MVTopField(LX,x,0,Curr)=FrameToField(MVTopFrame(LX,x,0,BL))
如果顶帧是帧内帧(intra frame):则MVTopField(LX,x,0,Curr)=0。
[等式2]
如果底帧是帧间帧:
则MVTopField(LX,x,2,Curr)=FrameToField(MVBottomFrame(LX,x,0,BL))
如果底帧是帧内帧:则MVTopField(LX,x,2,Curr)=0。
[等式3]
如果顶帧是帧间帧:
则MVBottomField(LX,x,1,Curr)=FrameToField(MVTopFrame(LX,x,3,BL))
如果顶帧是帧内帧:则MVBottomField(LX,x,1,Curr)=0。
[等式4]
如果底帧是帧间帧:
则MVBottomField(LX,x,3,Curr)=FrameToField(MVBottomFrame(LX,x,3,BL))
如果底帧是帧内帧:则MVBottomField(LX,x,3,Curr)=0。
在等式1至等式4中,x可具有值0、1、2或3。
2)如果用于基层的顶宏块的第一8×8宏块部分和第三8×8宏块部分的参考画面索引相等,则可应用下面的等式。
[等式5]
如果顶帧是帧间帧:
则MVTopField(LX,x,1,Curr)=FrameToField(MVTopFrame(LX,x,2,BL))
如果顶帧是帧内帧:则MVTopField(LX,x,1,Curr)=0。
[等式6]
如果顶帧是帧间帧:
则MVBottomField(LX,x,0,Curr)=FrameToField(MVTopFrame(LX,x,1,BL))
如果顶帧是帧内帧:则MVBottomField(LX,x,0,Curr)=0。
在等式5和等式6中,x可具有值0或1。如果用于基层的顶宏块的第一8×8宏块部分和第三8×8宏块部分的参考画面索引不相等,则可应用下面的等式7和等式8。
[等式7]
如果顶帧是帧间帧:
则MVTopField(LX,x,1,Curr)=FrameToField(MVTopFrame(LX,x,1,BL))
如果顶帧是帧内帧:则MVTopField(LX,x,1,Curr)=0。
[等式8]
如果顶帧是帧间帧:
则MVBottomField(LX,x,0,Curr)=FrameToField(MVTopFrame(LX,x,2,BL))
如果顶帧是帧内帧:则MVBottomField(LX,x,0,Curr)=0。
在等式7和等式8中,x可具有值0和1。
类似地,如果用于基层的顶宏块的第二8×8宏块部分和第四8×8宏块部分的参考画面索引相等,则可将x=2或x=3应用于等式5和6。在其它情况下,可将x=2或x=3应用于等式7和8。
3)如果用于基层的底宏块的第一8×8宏块部分和第三8×8宏块部分的参考画面索引相等,则可应用下面的等式。
[等式9]
如果底帧是帧间帧:
则MVTopField(LX,x,3,Curr)=FrameToField(MVBottomFrame(LX,x,2,BL))
如果底帧是帧内帧:则MVTopField(LX,x,3,Curr)=0。
[等式10]
如果底帧是帧间帧:
则MVBottomField(LX,x,2,Curr)=FrameToField(MVTopFrame(LX,x,2,BL))
如果底帧是帧内帧:则MVBottomField(LX,x,2,Curr)=0。
在等式9和等式10中,x可具有值0或1。
如果用于基层的底宏块的第一8×8宏块部分和第三8×8宏块部分的参考画面索引不相等,则可应用等式11和等式12。
[等式11]
如果底帧是帧间帧:
则MVTopField(LX,x,3,Curr)=FrameToField(MVBottomFrame(LX,x,1,BL))
如果底帧是帧内帧:则MVTopField(LX,x,3,Curr)=0。
[等式12]
如果底帧是帧间帧:
则MVBottomField(LX,x,2,Curr)=FrameToField(MVTopFrame(LX,x,2,BL))
如果底帧是帧内帧:则MVBottomField(LX,x,2,Curr)=0。
在等式11和等式12中,x可具有值0或1。
类似地,如果用于基层的顶宏块的第二8×8宏块部分和第四8×8宏块部分的参考画面索引相等,则可将x=2或x=3应用于等式9和10。在其它情况下,可将x=2或x=3应用于等式11和12。
4)如果当前层的宏块是帧宏块且基层的宏块是场宏块,则可应用下面的等式。在下面的等式中,LX表示(0,1)中的列表索引,x和y分别表示当前宏块中4×4块的水平位置和垂直位置,并且具有0和3之间的值。另外,Curr和BL分别表示当前层的一对宏块和基层的相应的一对宏块。
FrameToField(mv)返回满足下面特性的运动向量mv*。如果将水平元素输入到运动向量,则mv*[0]=mv[0]。如果输入了垂直元素的运动向量除以二(2),则mv*[1]=mv[1]/2。
在等式13和等式14中,y可具有值0或1,x可具有值0、1、2或3。
[等式13]
MVTopFrame(LX,x,y,Curr)=FieldToFrame(MVTopField(LX,x,y,BL))
[等式14]
MVBottomFrame(LX,x,y,Curr)=FieldToFrame(MVTopField(LX,x,y+2,BL))
在等式15和等式16中,y可具有值2或3,x可具有值0、1、2或3。
[等式15]
MVTopFrame(LX,x,y,Curr)=FieldToFrame(MVBottomField(LX,x,y-2,BL))
[等式16]
MVBottomFrame(LX,x,y,Curr)=FieldToFrame(MVBottomField(LX,x,y,BL))
图7是示出根据本发明的示例性实施例的使用基层的帧内宏块预测当前层的场宏块的处理的示图。可使用基层的帧内宏块来预测当前层的场宏块。在图7中,当前层的每个场的底宏块使用帧内基层(IBL)预测模式,在IBL预测模式下,使用基层的帧类型帧内宏块。在这种情况下,当前层的每个场的顶宏块不能具有适当的预测值。因此可使用下面的方法以获得顶宏块(图7所示的用点填充的区域730和区域740)的适当的预测值。
1)可用像素值128填充区域730和区域740。
2)可放大区域730和区域740中的每一个,并且用图7所示的宏块750中示出的底宏块的每一个的顶像素值来填充区域730和区域740中的每一个。
3)IBL预测模式中的定向帧内模式之一可被代替。在检查是否使用定向帧内模式之一之后,可将当前模式改变为IBL模式。尽管当前16×16场宏块使用定向帧内模式,但是与基层的纹理相应的当前场块需要具有定向帧内模式的基层的纹理信息。与基层的纹理不相应的块使用先前的方向。
4)16×16宏块可具有IBL标志和定向帧内信息。图7的区域730和区域740被设置为先前的定向帧内模式,并且可使用如图7的宏块760中示出的IBL预测模式预测相应的底宏块。
在图7中,使用基层的帧类型帧间宏块对当前层的顶宏块执行残差预测。当前层的底宏块在基层中不能具有残差。在这种情况下,如果基层的相应的宏块是帧内宏块,则可分配值0。
图8是示出根据本发明的示例性实施例的编码处理的流程图。
参照图8,确定当前层的宏块是否是帧宏块,下层的宏块是否是场宏块(操作S910)。如果确定当前层的宏块是帧宏块且下层的宏块是场宏块,则还确定是否已经对下层的顶场和底场的宏块进行了不同的编码(操作S920)。如果确定已经对下层的顶场和底场的宏块进行了不同的编码,则如图2所示,对顶场或底场的信息进行插值并编码(操作S925)。
下层可以是上面描述的基层,或者可以是低于当前层的层或者在多层结构情况下的精细颗粒可扩展(FGS)层。
如果在操作S910确定当前层的宏块不是帧宏块且下层的宏块不是场宏块,则还可确定当前层的宏块是否是场宏块,下层的宏块是否是帧宏块(操作S930)。如果确定当前层的宏块是场宏块且下层的宏块是帧宏块,则还确定是否已经对当前层的顶场和底场的宏块进行了不同的编码(操作S940)。然后,参照下层的帧类型帧间宏块的子块对当前层的帧间宏块进行编码(操作S955)。
上述处理是使用基层或下层对当前层进行编码的处理。可按照与上述处理类似的处理执行解码。在解码端对当前层解码之前,解码端可对下层的数据进行插值或参照下层的数据,这可以如图8所示来确定。
图9是示出根据本发明的示例性实施例的编码单元的框图。
每个组件意思是,但不限于,软件或硬件组件,诸如现场可编程门阵列(FPGA)或专用集成电路(ASIC)。组件可以方便地被配置以驻留在可寻址的存储介质上,并且可被配置以在一个或多个处理器上执行。在组件中提供的功能可被组合为更少的组件,或者可进一步被分离成另外的组件另外,所述组件可被实现为在系统中的一个或多个计算机上执行。
具体地说,图9是根据本发明的示例性实施例的包括在视频编码器中的对增强层进行编码的增强层编码单元900的框图。由于包括在对基层或视频信号编码的处理中的量化处理是现有技术,因此在本公开中将省略对其的详细描述。增强层编码单元900对层(即,当前层)的视频信号进行编码,这可参照另一下层(诸如基层或FGS层)。
增强层编码单元900使用场/帧转换单元920和上层宏块处理单元950产生用于对上层(当前层)的宏块进行编码的预测数据。然后,预测编码单元960使用产生的预测数据对上层的宏块进行编码。
如果当前层和下层(基层)中的任何一个的宏块类型是场类型,另一个的宏块类型是帧类型,则场/帧转换单元920使用下层宏块处理单元910的信息执行插值、区域扩展或两倍放大,从而当前层可参照下层的数据。
图10是示出根据本发明的示例性实施例的包括在视频解码器中的对增强层进行解码的增强层解码单元1000的框图。由于包括在对基层或视频信号解码的处理中的反量化处理是现有技术,因此在本公开中将省略对其的详细描述。
图10的增强层解码单元1000具有与图9的增强层编码单元900相似的结构。为了对增强层视频流进行解码,需要恢复将被参照的下层的宏块。因此,如果当前层和下层(基层)中的任何一个的宏块类型是场类型,另一个的宏块类型是帧类型,则场/帧转换单元1020使用下层宏块处理单元1010的信息执行插值、区域扩展或两倍放大,从而当前层可参照下层的数据。
产业上的可利用性
根据本发明的示例性实施例,即使当前层和下层具有不同的宏块类型(帧类型和场类型),也可参照下层的数据。
根据本发明的示例性实施例,可通过参照下层的数据来提高编码效率。
尽管已经参照本发明的示例性实施例具体显示并描述了本发明,但是本领域的技术人员将理解,在不脱离权利要求限定的本发明的精神和范围的情况下,可以在形式和细节上对其进行各种改变。示例性实施例应该被认为仅是描述性的而不是限制目的。因此,由权利要求而不是本发明的详细描述限定本发明的范围,并且所述范围内的所有差异将被解释为包括在本发明中。

Claims (60)

1、一种对具有以交织方式编码的宏块的多层交织视频信号进行编码的方法,所述方法包括:
确定当前层的一对宏块是否是帧类型,下层的相应的一对宏块是否是场类型,并且确定是否已经以不同的预测模式对下层的顶场和底场的相应的一对宏块进行了编码;以及
如果当前层的一对宏块是帧类型且下层的相应的一对宏块是场类型,并且已经以不同的预测模式对下层的顶场和底场的相应的一对宏块进行了编码,则通过对下层的顶场或底场的相应的宏块的信息进行插值来对当前层的宏块进行预测和编码。
2、如权利要求1所述的方法,其中,用于下层的顶场的相应的一对宏块的预测模式是帧间预测模式,用于下层的底场的相应的一对宏块的预测模式是帧内预测模式,或者用于下层的顶场的相应的一对宏块的预测模式是帧内预测模式,用于下层的底场的相应的一对宏块的预测模式是帧间预测模式。
3、如权利要求1所述的方法,其中,对当前层的宏块进行预测和编码的步骤还包括:对下层的帧间编码的宏块或帧内编码的宏块中的相邻像素之间存在的像素的信息进行插值,并计算所述像素的信息。
4、如权利要求1所述的方法,还包括:在对当前层的宏块进行预测和编码之前通过将插值的下层的4×4子块乘以2来计算运动向量。
5、一种对具有以交织方式编码的宏块的多层交织视频信号进行解码的方法,所述方法包括:
确定当前层的一对宏块是否是帧类型,下层的相应的一对宏块是否是场类型,并且确定是否已经以不同的预测模式对下层的顶场和底场的相应的一对宏块进行了编码;以及
如果当前层的一对宏块是帧类型且下层的相应的一对宏块是场类型,并且已经以不同的预测模式对下层的顶场和底场的相应的一对宏块的进行了编码,则通过对下层的顶场或底场的相应的宏块的信息进行插值来对当前层的宏块进行预测和解码。
6、如权利要求5所述的方法,其中,用于下层的顶场的相应的一对宏块的预测模式是帧间预测模式,用于下层的底场的相应的一对宏块的预测模式是帧内预测模式,或者用于下层的顶场的相应的一对宏块的预测模式是帧内预测模式,用于下层的底场的相应的一对宏块的预测模式是帧间预测模式。
7、如权利要求5所述的方法,其中,对当前层的宏块进行预测和解码的步骤还包括:对下层的帧间编码的宏块或帧内编码的宏块中的相邻像素之间存在的像素的信息进行插值,并计算所述像素的信息。
8、如权利要求5所述的方法,还包括:在对当前层的宏块进行预测和解码之前,通过将插值的下层的4×4子块乘以2来计算运动向量。
9、一种对具有以交织方式编码的宏块的多层交织视频信号进行编码的方法,所述方法包括:
确定当前层的一对宏块是否是场类型,下层的相应的一对宏块是否是帧类型,并且确定是否已经以不同的预测模式对组成下层的相应的一对宏块的顶宏块和底宏块进行了编码;以及
如果当前层的一对宏块是场类型且下层的相应的一对宏块是帧类型,并已经以不同的预测模式对组成下层的相应的一对宏块的顶宏块和底宏块进行了编码,则参照下层的帧类型帧间宏块的子块对当前层的帧间宏块进行编码。
10、如权利要求9所述的方法,其中,下层的帧类型帧间宏块的子块和当前层的帧间宏块两者被放置在上级位置或下级位置。
11、如权利要求9所述的方法,其中,当前层的帧间宏块的运动向量被设置为0。
12、一种对具有以交织方式编码的宏块的多层交织视频信号进行解码的方法,所述方法包括:
确定当前层的一对宏块是否是场类型,下层的相应的一对宏块是否是帧类型,并且确定是否已经以不同的预测模式对组成下层的相应的一对宏块的顶宏块和底宏块进行了编码;以及
如果当前层的一对宏块是场类型且下层的相应的一对宏块是帧类型,并且已经以不同的预测模式对组成下层的相应的一对宏块的顶宏块和底宏块进行了编码,则参照下层的帧类型帧间宏块的子块对当前层的帧间宏块进行解码。
13、如权利要求12所述的方法,其中,下层的帧类型帧间宏块的子块和当前层的帧间宏块两者被放置在上级位置或下级位置。
14、如权利要求12所述的方法,其中,当前层的帧间宏块的运动向量被设置为0。
15、一种对具有以交织方式编码的宏块的多层交织视频信号进行编码的方法,所述方法包括:
确定当前层的一对宏块是否是场类型,下层的相应的一对宏块是否是帧类型;
如果当前层的一对宏块是场类型且下层的相应的一对宏块是帧类型,则将当前层的宏块的参考索引设置为下层的相应的宏块的参考索引的两倍;以及
使用设置的参考索引对当前层的宏块进行编码。
16、如权利要求15所述的方法,其中,设置参考索引的步骤包括:如果当前层的宏块是顶场,则将当前层的顶场的宏块的第一子块和第二子块的参考索引分别设置为下层的相应宏块的顶宏块的第一子块和第二子块的参考索引的两倍。
17、如权利要求15所述的方法,其中,设置参考索引的步骤包括:如果当前层的宏块是顶场,则将当前层的顶场的宏块的第三子块和第四子块的参考索引分别设置为下层的相应宏块的底宏块的第一子块和第二子块的参考索引的两倍。
18、如权利要求15所述的方法,其中,设置参考索引的步骤包括:如果当前层的宏块是底场,则将当前层的底场的宏块的第一子块和第二子块的参考索引分别设置为下层的相应宏块的顶宏块的第三子块和第四子块的参考索引的两倍。
19、如权利要求15所述的方法,其中,设置参考索引的步骤包括:如果当前层的宏块是底场,则将当前层的底场的宏块的第三子块和第四子块的参考索引分别设置为下层的相应宏块的底宏块的第三子块和第四子块的参考索引的两倍。
20、一种对具有以交织方式编码的宏块的多层交织视频信号进行解码的方法,所述方法包括:
确定当前层的一对宏块是否是场类型,下层的相应的一对宏块是否是帧类型;
如果当前层的一对宏块是场类型且下层的相应的一对宏块是帧类型,则将当前层的宏块的参考索引设置为下层的相应的宏块的参考索引的两倍;以及
使用设置的参考索引对当前层的宏块进行解码。
21、如权利要求20所述的方法,其中,设置参考索引的步骤包括:如果当前层的宏块是顶场,则将当前层的顶场的宏块的第一子块和第二子块的参考索引分别设置为下层的相应宏块的顶宏块的第一子块和第二子块的参考索引的两倍。
22、如权利要求21所述的方法,其中,设置参考索引的步骤包括:如果当前层的宏块是顶场,则将当前层的顶场的宏块的第三子块和第四子块的参考索引分别设置为下层的相应宏块的底宏块的第一子块和第二子块的参考索引的两倍。
23、如权利要求21所述的方法,其中,设置参考索引的步骤包括:如果当前层的宏块是底场,则将当前层的底场的宏块的第一子块和第二子块的参考索引分别设置为下层的相应宏块的顶宏块的第三子块和第四子块的参考索引的两倍。
24、如权利要求21所述的方法,其中,设置参考索引的步骤包括:如果当前层的宏块是底场,则将当前层的底场的宏块的第三子块和第四子块的参考索引分别设置为下层的相应宏块的底宏块的第三子块和第四子块的参考索引的两倍。
25、一种对具有以交织方式编码的宏块的多层交织视频信号进行编码的方法,所述方法包括:
确定当前层的一对宏块是否是场类型,下层的相应的一对宏块是否是帧类型;以及
如果当前层的一对宏块是场类型且下层的相应的一对宏块是帧类型,则通过将当前层的宏块的第一场中的顶块的像素设置为所述宏块的场中的底块的像素值来放大所述像素,并且对当前层的宏块进行编码。
26、如权利要求25所述的方法,其中,第一场是顶场或底场。
27、如权利要求25所述的方法,还包括:如果当前层的宏块的第一场中的顶块使用定向帧内模式,则将定向帧内模式改变为帧内基层(IBL)模式。
28、一种对具有以交织方式编码的宏块的多层交织视频信号进行解码的方法,所述方法包括:
确定当前层的一对宏块是否是场类型,下层的相应的一对宏块是否是帧类型;以及
如果当前层的一对宏块是场类型且下层的相应的一对宏块是帧类型,则通过将当前层的宏块的第一层中的顶块的像素设置为所述宏块的场中的底块的像素值来放大所述像素,并且对当前层的宏块进行解码。
29、如权利要求28所述的方法,其中,第一场是顶场或底场。
30、如权利要求28所述的方法,还包括:如果当前层的宏块的第一场中的顶块使用定向帧内模式,则将定向帧内模式改变为帧内基层(IBL)模式。
31、一种对具有以交织方式编码的宏块的多层交织视频信号进行编码的设备,所述设备包括:
场/帧转换单元,确定当前层的一对宏块是否是帧类型,下层的相应的一对宏块是否是场类型,并且确定是否已经以不同的预测模式对下层的顶场和底场的相应的一对宏块进行了编码,并且如果当前层的一对宏块是帧类型且下层的相应的一对宏块是场类型,并且已经以不同的预测模式对下层的顶场和底场的相应的一对宏块进行了编码,则对下层的顶场或底场的宏块的信息进行插值以预测当前层的相应的宏块;以及
预测编码单元,基于预测结果对当前层的相应的宏块进行编码。
32、如权利要求31所述的设备,其中,用于下层的顶场的相应的一对宏块的预测模式是帧间预测模式,用于下层的底场的相应的一对宏块的预测模式是帧内预测模式,或者用于下层的顶场的相应的一对宏块的预测模式是帧内预测模式,用于下层的底场的相应的一对宏块的预测模式是帧间预测模式。
33、如权利要求31所述的设备,其中,场/帧转换单元对下层的帧间编码的宏块或帧内编码的宏块中的相邻像素之间存在的像素的信息进行插值,并计算所述像素的信息。
34、如权利要求31所述的设备,其中,场/帧转换单元通过将插值的下层的4×4子块乘以2来计算运动向量。
35、一种对具有以交织方式编码的宏块的多层交织视频信号进行解码的设备,所述设备包括:
场/帧转换单元,确定当前层的一对宏块是否是帧类型,下层的相应的一对宏块是否是场类型,并且确定是否已经以不同的预测模式对下层的顶场和底场的相应的一对宏块进行了编码,并且如果当前层的一对宏块是帧类型且下层的相应的一对宏块是场类型,并已经以不同的预测模式对下层的顶场和底场的相应的一对宏块进行了编码,则对下层的顶场或底场的宏块的信息进行插值以预测当前层的相应的宏块;以及
预测解码单元,基于预测结果对当前层的相应的宏块进行解码。
36、如权利要求35所述的设备,其中,用于下层的顶场的相应的一对宏块的预测模式是帧间预测模式,用于下层的底场的相应的一对宏块的预测模式是帧内预测模式,或者用于下层的顶场的相应的一对宏块的预测模式是帧内预测模式,用于下层的底场的相应的一对宏块的预测模式是帧间预测模式。
37、如权利要求35所述的设备,其中,场/帧转换单元对下层的帧间编码的宏块或帧内编码的宏块中的相邻像素之间存在的像素的信息进行插值,并计算所述像素的信息。
38、如权利要求35所述的设备,其中,场/帧转换单元通过将插值的下层的4×4子块乘以2来计算运动向量。
39、一种对具有以交织方式编码的宏块的多层交织视频信号进行编码的设备,所述设备包括:
场/帧转换单元,确定当前层的一对宏块是否是帧类型,下层的相应的一对宏块是否是场类型,并且确定是否已经以不同的预测模式对组成下层的相应的一对宏块的顶宏块和底宏块进行了编码,并且如果当前层的一对宏块是场类型,下层的相应的一对宏块是帧类型,并已经以不同的预测模式对组成下层的相应的一对宏块的顶宏块和底宏块进行了编码,则参照下层的帧类型帧间宏块的子块以对当前层的帧间宏块进行预测;以及
预测编码单元,使用预测结果对当前层的帧间宏块进行编码。
40、如权利要求39所述的设备,其中,下层的帧类型帧间宏块的子块和当前层的帧间宏块两者被放置在上级位置或下级位置。
41、如权利要求39所述的设备,其中,当前层的帧间宏块的运动向量被设置为0。
42、一种对具有以交织方式编码的宏块的多层交织视频信号进行解码的设备,所述设备包括:
场/帧转换单元,确定当前层的一对宏块是否是帧类型,下层的相应的一对宏块是否是场类型,并且确定是否已经以不同的预测模式对组成下层的相应的一对宏块的顶宏块和底宏块进行了编码,并且如果当前层的一对宏块是场类型,下层的相应的一对宏块是帧类型,并已经以不同的预测模式对组成下层的相应的一对宏块的顶宏块和底宏块进行了编码,则参照下层的帧类型帧间宏块的子块以对当前层的帧间宏块进行预测;以及
预测解码单元,使用预测结果对当前层的帧间宏块进行解码。
43、如权利要求42所述的设备,其中,下层的帧类型帧间宏块的子块和当前层的帧间宏块两者被放置在上级位置或下级位置。
44、如权利要求42所述的设备,其中,当前层的帧间宏块的运动向量被设置为0。
45、一种对具有以交织方式编码的宏块的多层交织视频信号进行编码的设备,所述设备包括:
场/帧转换单元,确定当前层的一对宏块是否是场类型,下层的相应的一对宏块是否是帧类型,并且如果当前层的一对宏块是场类型且下层的相应的一对宏块是帧类型,则将当前层的宏块的参考索引设置为下层的相应宏块的参考索引的两倍;以及
预测编码单元,使用设置的参考索引对当前层的宏块进行编码。
46、如权利要求45所述的设备,其中,如果当前层的宏块是顶场,则场/帧转换单元将当前层的顶场的宏块的第一子块和第二子块的参考索引分别设置为下层的相应的宏块的顶宏块的第一子块和第二子块的参考索引的两倍。
47、如权利要求45所述的设备,其中,如果当前层的宏块是顶场,则场/帧转换单元将当前层的顶场的宏块的第三子块和第四子块的参考索引分别设置为下层的相应的宏块的底宏块的第一子块和第二子块的参考索引的两倍。
48、如权利要求45所述的设备,其中,如果当前层的宏块是底场,则场/帧转换单元将当前层的底场的宏块的第一子块和第二子块的参考索引分别设置为下层的相应的宏块的顶宏块的第三子块和第四子块的参考索引的两倍。
49、如权利要求45所述的设备,其中,如果当前层的宏块是底场,则场/帧转换单元将当前层的底场的宏块的第三子块和第四子块的参考索引分别设置为下层的相应的宏块的底宏块的第三子块和第四子块的参考索引的两倍。
50、一种对具有以交织方式编码的宏块的多层交织视频信号进行解码的设备,所述设备包括:
场/帧转换单元,确定当前层的一对宏块是否是场类型,下层的相应的一对宏块是否是帧类型,并且如果当前层的一对宏块是场类型且下层的相应的一对宏块是帧类型,则将当前层的宏块的参考索引设置为下层的相应宏块的参考索引的两倍;以及
预测解码单元,使用设置的参考索引对当前层的宏块进行解码。
51、如权利要求50所述的设备,其中,如果当前层的宏块是顶场,则场/帧转换单元将当前层的顶场的宏块的第一子块和第二子块的参考索引分别设置为下层的相应的宏块的顶宏块的第一子块和第二子块的参考索引的两倍。
52、如权利要求51所述的设备,其中,如果当前层的宏块是顶场,则场/帧转换单元将当前层的顶场的宏块的第三子块和第四子块的参考索引分别设置为下层的相应的宏块的底宏块的第一子块和第二子块的参考索引的两倍。
53、如权利要求51所述的设备,其中,如果当前层的宏块是底场,则场/帧转换单元将当前层的底场的宏块的第一子块和第二子块的参考索引分别设置为下层的相应的宏块的顶宏块的第三子块和第四子块的参考索引的两倍。
54、如权利要求51所述的设备,其中,如果当前层的宏块是底场,则场/帧转换单元将当前层的底场的宏块的第三子块和第四子块的参考索引分别设置为下层的相应的宏块的底宏块的第三子块和第四子块的参考索引的两倍。
55、一种对具有以交织方式编码的宏块的多层交织视频信号进行编码的设备,所述设备包括:
场/帧转换单元,确定当前层的宏块是否是场类型,下层的相应的宏块是否是帧类型,并且如果当前层的宏块是场类型且下层的相应的宏块是帧类型,则通过将当前层的宏块的第一场中的顶块的像素设置为所述宏块的场中的底块的像素值来放大所述像素;以及
预测编码单元,参考设置的像素值对当前层的宏块进行编码。
56、如权利要求55所述的设备,其中,第一场是顶场或底场。
57、如权利要求55所述的设备,其中,如果当前层的宏块的第一场中的顶块使用定向帧内模式,则将定向帧内模式改变为帧内基层(IBL)模式。
58、一种对具有以交织方式编码的宏块的多层交织视频信号进行解码码的设备,所述设备包括:
场/帧转换单元,确定当前层的一对宏块是否是场类型,下层的相应的一对宏块是否是帧类型,并且如果当前层的一对宏块是场类型且下层的相应的一对宏块是帧类型,则通过将当前层的宏块的第一场中的顶块的像素设置为所述宏块的场中的底块的像素值来放大所述像素;以及
预测解码单元,参考设置的像素值对当前层的宏块进行解码。
59、如权利要求58所述的设备,其中,第一场是顶场或底场。
60、如权利要求58所述的设备,其中,如果当前层的宏块的第一场中的顶块使用定向帧内模式,则将定向帧内模式改变为帧内基层(IBL)模式。
CN2007800065184A 2006-02-22 2007-02-21 使用不同类型的下层信息对交织视频信号进行编码/解码的方法和设备 Expired - Fee Related CN101390402B (zh)

Applications Claiming Priority (10)

Application Number Priority Date Filing Date Title
US77534206P 2006-02-22 2006-02-22
US60/775,342 2006-02-22
US78752006P 2006-03-31 2006-03-31
US78749506P 2006-03-31 2006-03-31
US60/787,495 2006-03-31
US60/787,520 2006-03-31
KR1020060053130 2006-06-13
KR1020060053130A KR100809296B1 (ko) 2006-02-22 2006-06-13 타입이 일치하지 않는 하위 계층의 정보를 사용하여인터레이스 비디오 신호를 인코딩/디코딩 하는 방법 및장치
KR10-2006-0053130 2006-06-13
PCT/KR2007/000886 WO2007097562A1 (en) 2006-02-22 2007-02-21 Method and apparatus for encoding/decoding interlaced video signal using different types of information of lower layer

Publications (2)

Publication Number Publication Date
CN101390402A true CN101390402A (zh) 2009-03-18
CN101390402B CN101390402B (zh) 2010-12-08

Family

ID=38437566

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2007800065184A Expired - Fee Related CN101390402B (zh) 2006-02-22 2007-02-21 使用不同类型的下层信息对交织视频信号进行编码/解码的方法和设备

Country Status (6)

Country Link
US (1) US20070274389A1 (zh)
EP (1) EP1992170A1 (zh)
JP (1) JP2009527977A (zh)
KR (1) KR100809296B1 (zh)
CN (1) CN101390402B (zh)
WO (1) WO2007097562A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105933706A (zh) * 2015-02-27 2016-09-07 三星电子株式会社 多媒体编解码器、应用处理器和电子装置

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9330060B1 (en) 2003-04-15 2016-05-03 Nvidia Corporation Method and device for encoding and decoding video image data
US8660182B2 (en) 2003-06-09 2014-02-25 Nvidia Corporation MPEG motion estimation based on dual start points
US8731071B1 (en) 2005-12-15 2014-05-20 Nvidia Corporation System for performing finite input response (FIR) filtering in motion estimation
WO2007100187A1 (en) * 2006-01-09 2007-09-07 Lg Electronics Inc. Inter-layer prediction method for video signal
US8724702B1 (en) 2006-03-29 2014-05-13 Nvidia Corporation Methods and systems for motion estimation used in video coding
US8660380B2 (en) 2006-08-25 2014-02-25 Nvidia Corporation Method and system for performing two-dimensional transform on data value array with reduced power consumption
US8756482B2 (en) 2007-05-25 2014-06-17 Nvidia Corporation Efficient encoding/decoding of a sequence of data frames
US9118927B2 (en) 2007-06-13 2015-08-25 Nvidia Corporation Sub-pixel interpolation and its application in motion compensated encoding of a video signal
US8873625B2 (en) * 2007-07-18 2014-10-28 Nvidia Corporation Enhanced compression in representing non-frame-edge blocks of image frames
US8698838B1 (en) * 2007-09-07 2014-04-15 Zenverge, Inc. Architecture for multiple graphics planes
US8275033B2 (en) * 2008-01-15 2012-09-25 Sony Corporation Picture mode selection for video transcoding
KR100963424B1 (ko) * 2008-07-23 2010-06-15 한국전자통신연구원 스케일러블 영상 복호화기 및 그 제어 방법
US8666181B2 (en) 2008-12-10 2014-03-04 Nvidia Corporation Adaptive multiple engine image motion detection system and method
DE102009039095A1 (de) * 2009-08-27 2011-03-10 Siemens Aktiengesellschaft Verfahren und Vorrichtung zum Erzeugen, Decodieren und Transcodieren eines codierten Videodatenstroms
US20110280311A1 (en) * 2010-05-13 2011-11-17 Qualcomm Incorporated One-stream coding for asymmetric stereo video
US9049497B2 (en) 2010-06-29 2015-06-02 Qualcomm Incorporated Signaling random access points for streaming video data
US9185439B2 (en) 2010-07-15 2015-11-10 Qualcomm Incorporated Signaling data for multiplexing video components
US9596447B2 (en) 2010-07-21 2017-03-14 Qualcomm Incorporated Providing frame packing type information for video coding
WO2013115609A1 (ko) * 2012-02-02 2013-08-08 한국전자통신연구원 영상신호의 계층간 예측 방법 및 그 장치

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3189258B2 (ja) * 1993-01-11 2001-07-16 ソニー株式会社 画像信号符号化方法および画像信号符号化装置、並びに画像信号復号化方法および画像信号復号化装置
CA2127151A1 (en) * 1993-09-21 1995-03-22 Atul Puri Spatially scalable video encoding and decoding
EP1082855A1 (en) * 1999-03-26 2001-03-14 Koninklijke Philips Electronics N.V. Video coding method and corresponding video coder
JP2002199399A (ja) * 2000-12-27 2002-07-12 Sony Corp 動きベクトル変換方法及び変換装置
JP2003319391A (ja) * 2002-04-26 2003-11-07 Sony Corp 符号化装置および方法、復号装置および方法、記録媒体、並びにプログラム
JP4127182B2 (ja) 2002-11-07 2008-07-30 日本ビクター株式会社 動画像時間軸階層符号化方法、符号化装置、復号化方法及び復号化装置並びにコンピュータプログラム
US7447264B2 (en) * 2002-11-07 2008-11-04 Victor Company Of Japan, Ltd. Moving-picture temporal scalable coding method, coding apparatus, decoding method, decoding apparatus, and computer program therefor
AU2003283723A1 (en) * 2002-12-10 2004-06-30 Koninklijke Philips Electronics N.V. A unified metric for digital video processing (umdvp)
EP1455534A1 (en) * 2003-03-03 2004-09-08 Thomson Licensing S.A. Scalable encoding and decoding of interlaced digital video data
KR100693669B1 (ko) * 2003-03-03 2007-03-09 엘지전자 주식회사 피일드 매크로 블록의 레퍼런스 픽쳐 결정 방법
JP4222274B2 (ja) 2004-08-20 2009-02-12 日本ビクター株式会社 符号化モード選択装置及び符号化モード選択プログラム
WO2007100187A1 (en) * 2006-01-09 2007-09-07 Lg Electronics Inc. Inter-layer prediction method for video signal

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105933706A (zh) * 2015-02-27 2016-09-07 三星电子株式会社 多媒体编解码器、应用处理器和电子装置
CN105933706B (zh) * 2015-02-27 2020-06-23 三星电子株式会社 多媒体编解码器、应用处理器和电子装置

Also Published As

Publication number Publication date
EP1992170A1 (en) 2008-11-19
US20070274389A1 (en) 2007-11-29
JP2009527977A (ja) 2009-07-30
KR20070085003A (ko) 2007-08-27
CN101390402B (zh) 2010-12-08
KR100809296B1 (ko) 2008-03-04
WO2007097562A1 (en) 2007-08-30

Similar Documents

Publication Publication Date Title
CN101390402B (zh) 使用不同类型的下层信息对交织视频信号进行编码/解码的方法和设备
JP6681758B2 (ja) デジタルビデオコンテンツのマクロブロックレベルにおける適応フレーム/フィールド符号化
CN101385350B (zh) 用于视频信号的层间预测方法
JP4095664B2 (ja) 動画像符号化装置
JP2005510985A5 (zh)
CN103493492A (zh) 用于对多视点视频进行编码和解码的方法和设备
EP1835758B1 (en) Motion picture encoding
US9014495B2 (en) Parallel intra prediction method for video data
CN109891892A (zh) 依赖于图像编译系统中的帧内预测的图像解码方法和装置
CN103096078B (zh) 用于视频信号的层间预测方法和装置
JP5037517B2 (ja) 動き及びテクスチャデータを予測する方法
JP2010081635A (ja) 動き補償予測符号化装置、動き補償予測符号化方法及びプログラム
CN101189880B (zh) 带有混合参考纹理的视频解码器
JP5479648B1 (ja) 画像符号化方法及び画像復号化方法
JP5444497B2 (ja) 画像符号化方法及び画像復号化方法
CN101189879B (zh) 多程视频解码方法与装置
KR101049258B1 (ko) 타입이 일치하지 않는 하위 계층의 정보를 사용하여인터레이스 비디오 신호를 인코딩/디코딩 하는 방법 및장치
CN100411436C (zh) 存储已解码宏块运动向量的存储器使用方法
CN103888780B (zh) 动态图像编码装置、动态图像解码装置、动态图像编码方法及动态图像解码方法
JP2014131294A (ja) 画像符号化方法及び画像復号化方法
JP5509398B1 (ja) 画像符号化方法及び画像復号化方法
JP2006180014A (ja) 動き補償予測符号化装置及び動き補償予測符号化方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20101208

Termination date: 20120221