CN104541505A - 层间内部模式预测 - Google Patents

层间内部模式预测 Download PDF

Info

Publication number
CN104541505A
CN104541505A CN201280075461.4A CN201280075461A CN104541505A CN 104541505 A CN104541505 A CN 104541505A CN 201280075461 A CN201280075461 A CN 201280075461A CN 104541505 A CN104541505 A CN 104541505A
Authority
CN
China
Prior art keywords
internal schema
candidate
block
prediction
internal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201280075461.4A
Other languages
English (en)
Other versions
CN104541505B (zh
Inventor
张文豪
邱怡仁
徐理东
韩钰
邓智玭
蔡晓霞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Intel Corp
Original Assignee
Intel Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Intel Corp filed Critical Intel Corp
Publication of CN104541505A publication Critical patent/CN104541505A/zh
Application granted granted Critical
Publication of CN104541505B publication Critical patent/CN104541505B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/59Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/187Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scalable video layer

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

描述了系统、装置和方法,其包含在增强层(EL)视频译码器至少部分基于从较低级EL帧或基础层(BL)帧中的至少一个获得的一个或多个第一内部模式候选确定EL帧的当前块的内部模式。

Description

层间内部模式预测
背景技术
当前在由ISO/IEC运动画面专家组(MPEG)和ITU-T视频编码专家组(VCEG)形成的关于视频编码的联合协作团队(JCT-VC)开发下的高效率视频编码(HEVC)是规划预期在2012年完成的视频压缩标准。类似于先前视频编码标准,HEVC包含诸如内部/中间预测、变换、量化以及环内滤波和熵编码的基本功能模块。HEVC定义了画面的最大编码单元(LCU),其然后被划分成采用具有可变大小的矩形块形式的编码单元(CU)。在每个LCU内,基于四叉树的分割方案规定CU划分模式。HECV还定义了预测单元(PU)和变换单元(TU),其规定分别为了预测和变换目的要如何划分给定CU。CU通常包含一个亮度编码块(CB)和两个色度CB连同关联的语法,并且PU可进一步被分成预测块(PB),大小范围从64x64个样本下至4x4个样本。在内部或中间预测之后,变换操作可应用于残余块以生成系数。然后系数被量化、扫描到一维阶,并且最后进行熵译码。
HEVC还合并了用于执行亮度样本的内部预测的最可能模式(MPM)编码方案。一般而言,HEVC包含高达33个有向内部预测模式("Intra_Angular"预测模式或"方向"),并且对于正在编码的给定PU,可基于之前解码的相邻PU对内部预测模式译码。例如,对于大小NxN的PU(或PB),总数4N+1个空间上相邻的样本可用于预测目的。Intra_Angular有向模式可由范围从2到34的索引k标记,使得Intra_Angular[k]规定特定有向内部编码模式(例如对应于垂直内部预测的Intra_Angular[26])。剩余的非有向内部编码模式是Intra_Planar(k=0)和Intra_DC,其中Intra_Planar(k=1)使用基于四个角参考样本的两个线性预测的平均值,并且Intra_DC使用参考样本的平均用于预测。
在常规MPM方案中,当前PU的三个候选内部译码模式可从在邻近同一画面中当前PU定位的已经编码的PU中使用的内部模式导出。一般而言,如果邻近译码的PU不可用或者非内部编码,则Intra_DC被选择作为当前PU的候选模式。
如果邻近的之前编码的PU是可用的、是内部编码的,则传统MPM方案中的候选内部模式根据左侧邻近PU("LeftMode")的内部模式和上面邻近PU("TopMode")的内部模式对应于三个特定内部模式候选的集合。如果上面邻近PU来自另一LCU,则TopMode可以设置成Intra_DC。如果LeftMode与TopMode相同,则三个内部模式候选按如下指定:如果LeftMode是Intra_Planar或Intra_DC,则三个候选内部模式是Intra_Planar、Intra_DC和Intra_Angular[26](垂直);否则,三个候选内部模式是LeftMode、LeftMode-1和LeftMode+1。另一方面,如果LeftMode和TopMode不同,则三个内部模式候选是LeftMode和TopMode,并且第三候选模式按如下指定:如果LeftMode或TopMode都不是Intra_Planar,则第三候选模式是Intra_Planar;如果LeftMode或TopMode都不是Intra_DC,则第三候选模式是Intra_DC;如果LeftMode或TopMode都不是Intra_Planar或Intra_DC,则第三候选模式是Intra_Angular[26](垂直)。
HEVC也预期包含可缩放视频编码(SVC)扩展。HECV SVC位流包含以不同空间分辨率、帧速率、质量、位深度等表示源视频内容的若干子集位流。可缩放性然后使用一般包含基础层(BL)和至少一个增强层(EL)的多层编码结构实现。这允许根据较低层画面(例如BL画面)或在同一层中之前编码的画面预测属于EL的画面或部分画面(诸如PU)。然而,在常规MPM方案中,可仅采用同一层(例如EL)的邻近PU的内部模式来确定当前PU的候选内部预测模式。
附图说明
本文描述的材料作为示例而非限制在附图中图示。为了图示的简洁和清晰起见,在附图中图示的元件不一定按比例绘制。例如,为了清晰起见,一些元件的尺寸相对于其它元件可能放大。进一步说,在合适的地方,附图标记在各图之间已经被重复以指示对应或类似元件。附图中:
图1是示例视频译码器系统的示意图;
图2是示例译码系统的示意图;
图3是图示示例过程的流程图;
图4是示例系统的示意图;
图5是示例编码方案的示意图;
图6是示例编码方案的示意图;
图7是示例编码方案的示意图;
图8是各种内部模式的示意图;
图9是示例位流的示意图;
图10是示例编码方案的示意图;
图11是示例解码系统的示意图;
图12是图示示例过程的流程图;
图13是示例系统的示意图;以及
图14图示了全都按照本公开的至少一些实现布置的示例装置。
具体实施方式
现在参考附图描述一个或多个实施例或实现。虽然讨论了特定配置和布置,但应该理解,这仅是用于说明性目的。相关领域的技术人员将认识到,在不脱离本描述的精神和范围的情况下可采用其它配置和布置。相关领域的技术人员将明白,本文描述的技术和/或布置也可被用在不同于本文所描述的各种其它系统和应用中。
虽然如下描述阐述了可在例如诸如片上系统(SoC)架构的架构中表明的各种实现,但本文描述的技术和/或布置的实现不限于具体架构和/或计算系统,而是可为了类似目的由任何架构和/或计算系统实现。比如,例如采用多个集成电路(IC)芯片和/或封装的各种架构和/或各种计算装置和/或消费电子(CE)装置(诸如机顶盒、智能电话等)可实现本文描述的技术和/或布置。进一步说,虽然如下描述可阐述众多特定细节,诸如系统组件的逻辑实现、类型和相互关系、逻辑划分/集成选择等,但所要求保护的主题可在没有此类特定细节的情况下实行。在其它实例中,一些材料(诸如例如控制结构和全软件指令序列)可能未详细示出,以免使本文公开的材料模糊不清。
本文公开的材料可用硬件、固件、软件或它们的任何组合来实现。本文公开的材料还可被实现为存储在机器可读介质上的指令,所述指令可由一个或多个处理器读取和执行。机器可读介质可包含用于存储或传送由机器(例如计算装置)可读形式的信息的任何介质和/或机构。例如,机器可读介质可包含只读存储器(ROM);随机存取存储器(RAM);磁盘存储介质;光存储介质;闪存装置;电、光、声或其它形式的传播信号(例如载波、红外信号、数字信号等)及其它。
在说明书中提到“一个实现”、“实现”、“示例实现”等指示所描述的实现可包含具体特征、结构或特性,但每一个实施例可能不一定包含该具体特征、结构或特性。而且,此类短语不一定是指同一实现。进一步说,当结合一个实施例描述具体特征、结构或特性时,认为结合不管本文是否明确描述的其它实现来实现此类特征、结构或特性在本领域技术人员的知识范围内。
下面描述包含用于采用层间内部模式预测的视频编码的操作的系统、设备、制品和方法。
如本文所使用的,术语“编码器(coder)”可指的是译码器(encoder)和/或解码器(decoder)。类似地,如本文所使用的,术语“编码”可指的是经由译码器译码和/或经由解码器解码。例如,视频译码器和视频解码器都可以是能够编码的编码器示例。此外,如本文所使用的,术语“编解码器”可指的是可实现译码器和/或解码器的任何过程、程序或操作集合,诸如例如软件、固件和/或硬件的任何组合。
在可缩放视频编码系统中,多层编码用于支持若干种可缩放性,包含空间可缩放性、时间可缩放性、质量可缩放性、位深度可缩放性等等。按照本公开,可使用各种层间内部模式预测方案增大可缩放视频编码系统中的编码效率和/或编码灵活性。
图1图示了按照本公开的示例可缩放视频编码(SVC)编码系统100。在各种实现中,系统100可根据一个或多个标准或规范(诸如例如高效率视频编码(HEVC)标准(见ISO/IECJTC/SC29/WG11和ITU-TSG16WP3, "High efficiency video coding (HEVC) text specification draft8"(JCTVC-J1003_d7), 2012年7月)以及其任何可缩放视频编码(SVC)扩展)承担视频压缩和解压缩和/或实现视频编解码器。尽管本文在HEVC标准的SVC扩展的上下文中描述了系统100和/或其它系统、方案或过程,但本公开不限于任何具体视频译码标准或规范或其扩展。
如所图示的,系统100包含具有多个视频译码器(包含层0或基础层(BL)译码器102、层1或第一增强层(EL)译码器104和层2或第二EL译码器106)的译码器子系统101。系统100还包含解码器子系统103的对应视频解码器,包含层0(BL)解码器108、层1(EL)解码器110和层2(EL)解码器112。一般而言,BL可以进行HEVC可兼容编码。当用等于N的层标识(ID)编码EL时,SVC编码方案提供了具有小于N的层ID的所有编码层供层间预测方案之用,使得可根据较低层画面(例如在BL或一个或多个较低层EL中)或同一EL中之前编码的画面来预测属于具体EL的画面。
在各种实现中,HEVC规定了画面的最大编码单元(LCU),其然后可被划分成采用具有可变大小的矩形块形式的编码单元(CU)。在每个LCU内,基于四叉树的分割方案规定CU划分模式。HECV还定义了预测单元(PU)和变换单元(TU),其规定分别为了预测和变换目的要如何划分给定CU。CU通常包含一个亮度编码块(CB)和两个色度CB连同关联的语法,并且PU可进一步被分成预测块(PB),大小范围从64x64个样本下至4x4个样本。如本文所使用的,术语“块”可以指的是视频画面的任何分区或子分区。例如,块可以指的是PU或PB。
按照本公开,如下面将更详细说明的,EL译码器104和106中任一个或二者可使用从译码器102或104获得的内部模式候选来执行层间内部模式预测。例如,在一些实现中,译码器104可至少部分使用从译码器102获得并由层间预测模块116处理的候选内部模式114执行层间内部模式预测。此外,在一些实现中,译码器106可至少部分使用分别从译码器102或译码器104获得并分别由层间预测模块120或层间预测模块122处理的候选模式114或候选模式118执行层间内部模式预测。
本文所使用的“层间内部模式预测”指的是使用从较低层画面获得的至少一个候选模式执行一部分增强层画面的内部模式预测,诸如预测单元(PU)。进一步说,本文所使用的“内部模式预测”指的是用于预测或编码参考层画面块(例如PU)的内部编码模式。通过重新使用编码信息,诸如参考层的一个或多个内部模式候选,层间内部模式预测可改进SVC系统(诸如系统100)的压缩效率和编码灵活性和/或SVC编解码器设计。在按照本公开的各种实现中,层间内部模式预测可应用在时间、空间和/或质量可缩放视频编码应用的任何组合中。
采用层间预测模块116、120和/或122、译码器102、104和106中的任一个或多个可向熵译码器124提供单独位流。熵译码器124然后可向解码器子系统103的熵解码器128提供压缩位流126,包含可缩放视频内容的多层。按照本公开,如也将在下面更详细地说明的,EL解码器110和112中的任一个或二者可使用从解码器108或110获得的候选内部模式执行层间内部模式预测。例如,在一些实现中,解码器110可使用从解码器108获得并由层间预测模块130处理的一个或多个候选内部模式执行层间内部模式预测。此外,在一些实现中,解码器112可使用分别从解码器108和/或解码器110中的任一个或二者获得并分别由层间预测模块132和/或层间预测模块134中的任一个或二者处理的一个或多个候选内部模式执行层间内部模式预测。
虽然图1将系统100图示为采用可缩放视频内容的三层以及子系统101中三个译码器和子系统103中三个解码器的对应集合,但按照本公开可利用任何数量的可缩放视频编码层和对应的译码器和解码器。进一步说,本公开不限于图1中图示的具体组件和/或布置系统100的各种组件的方式。比如,在各种实现中,系统100的一些元件,诸如例如译码器子系统101的层间预测模块116、120和122,可由耦合到所有三个译码器102、104和106等的单个层间预测模块实现。
进一步说,可认识到,译码器子系统101可与内容提供商系统(例如包含视频内容服务器系统)关联和/或由其提供,并且位流126可由各种通信组件和/或系统(诸如在图1中未描绘的收发器、天线、网络系统等)传送或输送到解码器子系统103。还可认识到,解码器子系统103可与经由各种通信组件和/或系统(诸如图1中未描绘的收发器、天线、网络系统等)接收位流126的客户端系统(诸如计算装置(例如台式计算机、膝上型计算机、平板计算机、智能电话等))关联。进一步说,虽然本文描述的系统、设备和方法可指的是执行诸如EL画面的PU的块的层间内部模式预测,但本公开不限于这方面,并且可对于EL画面的任何分区(例如包含PU的PB子分区)执行层间内部模式预测。
图2图示了按照本公开的示例SVC译码系统200。系统200包含例如可分别对应于系统100的译码器102和译码器104的参考BL译码器202和目标EL译码器204。虽然系统200仅包含对应于两个SVC编码层的两个译码器202和204,但除了在图2中描绘的那些之外,按照本公开还可利用任何数量的SVC编码层和对应译码器。例如,对应于附加增强层的附加译码器可被包含在系统200中,并且可采用类似于下面相对于EL译码器204所描述的方式与BL译码器202交互。进一步说,译码器202可以是任何参考译码器,诸如在比目标EL译码器204的层更低的层的另一EL译码器。
当采用系统200承担SVC编码时,增强层中的画面或图像帧(诸如EL输入帧206)可由EL译码器204根据由BL译码器202处理的画面(诸如BL输入帧208)或之前由EL译码器204译码的同一增强层中的其它画面预测。如将在下面更详细描述的,当使用系统200承担层间内部模式预测操作时,层204中画面中的块的内部模式(诸如EL输入帧206)可至少部分使用由BL译码器202提供的一个或多个内部模式候选210进行预测。如上面所指出的,可在对应于像素值的一个或多个块的单元中编码EL输入帧206。进一步说,编码可应用在切片、画面或层级。
用于层间内部模式预测的内部模式候选210可使用包含变换和量化模块212、逆变换和逆量化模块214以及内部预测模块216的编码环,从BL输入帧208的处理中获得。具体地说,当操作BL译码器202执行层间内部模式预测时,可从内部预测模块216获得内部模式候选210。BL译码器202还可包含中间预测模块218和环内滤波模块220。模块212、214、218和220的功能性在本领域已经得到了足够的认识,并且在本文将不再更详细描述。
在EL译码器204,由BL译码器202提供的内部模式候选210可在EL译码器204的层间内部模式预测模块226接收,并且可用于至少部分使用包含变换和量化模块228以及逆变换和逆量化模块230的编码环预测EL输入帧206的内部编码模式。当操作成承担EL输入帧206的层间内部模式预测时,EL译码器204可不采用中间预测模块234或环内滤波模块236中的任一个。模块228、230、234和236的功能性在本领域已经得到了足够的认识,并且在本文将不再更详细描述。
在各种实现中,BL译码器202和EL译码器204中的任一个或二者可分别向熵译码器模块238提供对应于至少一些BL输入帧208和至少一些EL输入帧206的编码残差的压缩系数。模块238然后可执行残差的无损压缩,并提供包含译码残差的复用SVC位流作为来自系统200的输出。
图3图示了根据本公开各种实现的示例过程300的流程图。过程300可包含由图3的块301、302、304、306、308、310、312、314和316中的一个或多个所图示的一个或多个操作、功能或动作。作为非限制示例,过程300可形成由译码器系统200所承担的EL层的一部分(例如在此实现中是CU)的可缩放视频编码过程的至少一部分。
进一步说,过程300在本文还将参考使用图4的可缩放视频编码系统400对增强层CU编码来描述,其中系统400包含处理器402、SVC编解码器模块406和存储器408。处理器402可例示SVC编解码器模块406以按照本公开提供层间内部模式预测。在系统400的示例中,存储器408可存储包含至少一些BL输入帧208和/或至少一些EL输入帧206的视频内容,以及其它项目,诸如内部模式候选的列表等,这将在下面更详细地说明。SVC编解码器模块406可由适合于实现编码系统200的软件、固件和/或硬件的任何组合提供。存储器408可以是任何类型的存储器,诸如易失性存储器(例如静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)等)或非易失性存储器(例如闪存等),诸如此类。在非限制示例中,存储器408可由高速缓冲存储器实现。
过程300可开始于块301,在此可以确定是否应该对于当前EL PU执行层间内部模式预测。在各种实现中,确定是否执行层间内部模式预测可基于速率失真成本。例如,SVC编解码器406可基于已知速率失真成本技术确定是否对于PU执行层间内部模式预测。如果要执行层间内部模式预测,则过程300可在块302继续,然而如果不执行层间内部模式预测,则过程300可结束。
过程300可在块302继续,在此对于当前PU,可确定对应于PU的BL的一个或多个协同定位块。例如,图5图示了EL输入帧206的当前PU502,其中PU502空间上对应于BL输入帧208的协同定位块504。在这个示例中,PU502对应于BL输入帧208的四个协同定位块504。然而,在各种实现中,根据EL和BL或较低级EL之间的空间缩放,可相对于具体EL PU协同定位任何数量的BL或较低级EL块。在其它实现中,仅一部分BL或较低级EL块可与EL PU协同定位。
进一步说,在不应用空间缩放使得EL和较低EL或BL具有1的空间比的一些可缩放实现中(例如当在层之间应用质量缩放而没有空间缩放时),在EL中的块与较低EL中或BL中的块之间可能存在一对一的对应关系。相对于图5的示例,在块302确定协同定位块可涉及将块504标示或以别的方式标记为相对于当前PU502协同定位。
过程300可在块304继续,在此可访问对应于协同定位块的内部模式。比如,参考图4和图5,块304可涉及SVC编解码器406使用处理器402从存储器408获得对应于协同定位块504的内部模式。比如,存储器408可充当用于暂时存储视频内容(诸如包含块504的内部模式的BL输入帧208的部分)的帧缓冲器。
图6图示了按照本公开的示例层间内部模式预测方案600。方案600包含具有层ID n的EL画面或帧604的当前PU602(标记为A n )。如所描绘的,方案600包含空间上邻近帧604中当前PU602的三个已经译码的PU606、608和610(分别标记为B、D和C)。此外,方案600描绘了具有层ID i的较低EL画面或帧614中的协同定位块612(标记为A i )以及具有层ID 0的BL画面或帧618中的协同定位块616(标记为A0)。
返回到在图4和图6示例的上下文中图3的讨论,块304可涉及SVC编解码器406访问存储器408中的内部模式,其中内部模式对应于用于对块612和/或块616编码的内部模式。例如,在一些实现中,块304可涉及访问对应于块612或块616的内部模式。在其它实现中,块304可涉及访问对应于块612和616二者的内部模式。在各种实现中,对应于块612和/或616的内部模式可以是三十五(35)个内部模式之一,包含但不限于Intra_Planar、Intra_DC和三十三(33)Intra_Angular模式。
过程300可在块306继续,在此可确定是否包含来自EL的内部模式。在各种实现中,块306可涉及SVC编解码器406确定是否访问空间上邻近的块606、608和/或610中的一个或多个的内部模式。如果块306的结果是否定的,则过程300可进行到块310,并且可以不访问空间上邻近EL604中当前PU602的块的内部模式。
如果块306的结果是肯定的,则过程300可进行到块308,并且可以访问空间上邻近EL604中当前PU602的块的一个或多个内部模式。例如,在一些实现中,块308可涉及访问对应于块606、608和/或块610中一个或多个的内部模式。在其它实现中,块304可涉及访问对应于块606、608和/或块610的任何组合的内部模式。在各种实现中,对应于块606、608和块610的内部模式可以是三十五(35)个内部模式之一,包含但不限于Intra_Planar、Intra_DC和三十三(33)Intra_Angular模式。
过程300可在块310继续,在此可生成内部模式候选的集合或列表。在各种实现中,块310可涉及SVC编解码器406至少部分基于在块304访问的一个或多个内部模式确定PU602的候选内部模式列表。此外,在各种实现中,块310可涉及SVC编解码器406也基于在块308访问的一个或多个内部模式确定PU602的候选内部模式列表。在各种实现中,在块310生成的候选内部模式列表可指示与每个内部模式候选关联的优先级。例如,可向与更靠近包含当前PU的层的层关联的内部模式指配比与更远离包含当前PU的层的层关联的内部模式更高的优先级。比如,参考方案600,可向与块612关联的内部模式指配比与块616关联的内部模式更高的优先级。
在各种实现中,在块310,SVC编解码器406可至少部分使用最可能模式(MPM)编码算法生成候选内部模式列表。例如,图7图示了按照本公开的另一示例层间内部模式预测方案700。在方案700中,可分别在过程300的块308和304,访问对应于三个块:第一EL706中的两个空间上邻近的块702和704以及基础层710中的一个协同定位块708的内部模式。
在各种实现中,在示例方案700的上下文中,块310可包含采用如下示例MPM算法生成层706中当前PU712的内部模式候选的列表,其中"LeftMode"指的是左邻居块702的内部模式,"TopMode"指的是顶部邻居块704的内部模式,并且"BaseLayerMode"指的是基础层块708的内部模式:
从当前PU的基础层、左邻居块和顶部邻居块导出的三个候选:
如果当前PU的相邻块不可用或者不是内部编码,则将候选模式设置成Intra_DC;
如果顶部邻居来自另一LCU,则将候选模式设置成Intra_DC(并且移除用于存储模式的行缓冲器);
如果基础层块不是内部编码,则将候选模式设置成Intra_DC。
候选推导:
从而,在此示例中,根据在相邻块702和704中采用的内部模式,在块310生成的候选列表可包含从另一层获得的层间候选模式(例如对应于基础层块708的"BaseLayerMode")。
如之前所指出的,一般而言,HEVC包含高达33个有向内部预测模式("Intra_Angular"预测模式或"方向"),并且对于正在编码的给定PU,可基于之前解码的相邻PU对内部预测模式译码。例如,对于大小NxN的PU(或PB),总数4N+1个空间上相邻的样本可用于预测目的。Intra_Angular有向模式可由范围从2到34的索引k标记,使得Intra_Angular[k]规定特定有向内部编码模式(例如对应于垂直内部预测的Intra_Angular[26])。剩余的非有向内部编码模式是Intra_Planar(k=0)和Intra_DC,其中Intra_Planar(k=1)使用基于四个角参考样本的两个线性预测的平均值,并且Intra_DC使用参考样本的平均用于预测。例如,图8图示了对应于所有三十三(33)个HEVC Intra_Angular模式的方向。
在块310已经生成了内部模式候选列表,过程300可在块314继续,在此可响应于内部模式候选对于当前PU确定所执行的预测内部模式。例如,在各种实现中,SVC编解码器406可使用已知技术将单独应用三十五(35)个HEVC内部模式中每个的结果与当前PU相比较,以确定哪个内部模式导致当前PU的最低速率失真成本。在一些实现中,SVC编解码器406可使用已知技术将单独应用三十五(35)个HEVC内部模式子集中每个的结果与当前PU相比较,以确定哪个内部模式导致当前PU的最低速率失真成本。在各种实现中,可使用硬件逻辑(诸如固定功能电路)来执行确定速率失真成本所需的算术运算承担块314。而且,此类硬件逻辑可允许并行确定将内部模式候选应用于当前PU的各种组合的速率失真成本。
按照本公开,块314可导致对应于在块310生成的候选内部模式列表中内部模式之一的预测内部模式。如果预测内部模式对应于候选内部模式,则SVC编解码器406可使用EL译码器204在位流239中放指示符以规定用于当前PU的那个内部模式。在各种实现中,指示符可以是索引。比如,在存在三个候选内部模式的方案700的示例中,可使用2位索引值指示当前PU的MPM。一般而言,2位索引字段可足以指示两个、三个或四个候选内部模式之一,并且可用于比指示三十五个HEVC内部模式中每个将需要的5位索引值更有效地传递预测内部模式。对于多于4个但少于9个的候选内部模式,3位索引字段可能足够了。然而,本公开不限于任何具体数量的候选内部模式。
按照本公开,块314可导致不对应于在块310生成的候选内部模式列表中内部模式之一的预测内部模式。在各种实现中,如果块314导致类似于候选内部模式的具体内部模式的预测内部模式,则可通过提供对应于具体候选内部模式的索引连同对应于预测内部模式与具体候选内部模式之间差的值来指示预测内部模式。例如,参考图8,如果当前PU的预测内部模式802是Intra_Angular[27],并且不直接对应于候选内部模式之一,但候选内部模式804之一是Intra_Angular[26],则SVC编解码器406可使用EL译码器204在位流239中放置对应于候选内部模式804的指示符连同表示模式802与804之间差的值一(1)(例如(mode27-mode26)=1)。提供MPM索引和差值二者可用于比指示三十五个HEVC内部模式中的每个将需要的5位索引值更有效地传递预测内部模式。
按照本公开,块314可导致不对应于并且不类似于在块310生成的候选内部模式列表中内部模式之一的预测内部模式。在各种实现中,如果块314导致不同于或类似于任何候选内部模式的预测内部模式,则可通过提供足以规定三十五(35)个内部模式之一的索引来指示预测内部模式。例如,可使用5位索引字段来规定用于当前PU的三十五(35)个内部模式中的任何内部模式。
过程300可终止在块316,在此可形成位流,其中位流包含当前PU的预测内部模式的指示。比如,图9图示了可在块316形成的示例位流900。例如,位流900可对应于如在承担块316中可由SVC编解码器406所形成的位流239。如图6中所描绘的,位流900包含报头部分902和数据部分904。报头部分902包含一个或多个指示符906。比如,指示符906可包含指示符908,其值规定是否执行当前PU的层间内部模式预测,如本文所描述的。
在各种实现中,当在块314预测的内部模式对应于候选内部模式之一时,指示符906可包含内部模式字段或指示符910,其值规定候选内部模式。例如,在一些实现中,指示符910可以是可用于指示四个候选内部模式中任何候选内部模式的2位字段。进一步说,在各种实现中,当在块314预测的内部模式类似于候选内部模式之一时,除了内部模式字段或指示符910之外,指示符906还可包含差字段或指示符912,其值规定预测内部模式与候选内部模式之一之间的差。
虽然本文已经在图5和图6的上下文中描述了过程300,但本公开不限于执行层间内部模式预测,其中根据从协同定位的较低EL和/或BL块导出的候选来预测EL PU的内部模式。从而,在各种实现中,可采用空间上邻近协同定位块的块的内部模式作为内部模式候选。进一步说,在EL中的当前块对应于协同定位的较低EL和/或BL中多于一个块的实现中,可在块304访问协同定位块中各种块的内部模式候选。
例如,图10图示了EL层中当前PU1002对应于四个协同定位块1004的方案1000。在各种实现中,块304可涉及访问仅是内部编码和/或可用的那些块1004的内部模式。例如,在一些实现中,块1004的块0和1可以是内部编码的,而块2和3可以是中间编码的。在此类情形下,块304可涉及访问用于块0和/或1而不用于块2和3的内部模式。进一步说,在另一示例中,块1004的块0和1可能已经是内部编码,而编码(或者内部或者中间)可能未应用于块2和3。在此类情形下,块304也可涉及访问用于块0和/或1而不用于块2和3的内部模式。此外,在各种实现中,一个或多个协同定位块可具有较高优先级。比如,访问块0(协同定位块1004的左上块)的内部模式可优先于访问块1004中其它块的内部模式。
图11图示了按照本公开的示例SVC解码系统1100。系统1100包含例如可分别对应于系统100的解码器108和解码器110的参考BL解码器1102和目标EL译码器1104。虽然系统1100仅包含对应于两个SVC编码层的两个解码器1102和1104,但按照本公开,除了图11中描绘的那些之外,还可利用任何数量的SVC编码层和对应解码器。例如,对应于附加增强层的附加解码器可被包含在系统1100中,并且可采用类似于下面相对于EL解码器1104所描述的方式与BL解码器1102交互。
当采用系统1100承担SVC编码时,增强层中的画面或图像帧(诸如EL输出帧1106)可由EL解码器1104根据由BL解码器1102处理的画面(诸如BL输出帧1108)或之前由EL解码器1104译码的同一增强层中的其它画面进行中间预测。如将在下面更详细描述的,当使用系统1100承担层间内部模式预测操作时,层1104中画面中的块的内部模式(诸如EL输出帧1106)可使用由BL解码器1102提供的内部模式候选1110进行预测。候选1110可从BL解码器1102的内部预测模块1112中获得。BL解码器1102还可包含逆变换和逆量化模块1114、中间预测模块1116和环内滤波模块1118。
如下面所更详细描述的,内部模式候选1110可被提供给EL解码器1104的内部预测模块1120。EL解码器1104还可包含逆变换和逆量化模块1122、中间预测模块1124和环内滤波模块1126。当操作成承担层间内部模式预测时,EL解码器1104当预测EL输出帧1106的各种块的内部模式时可使用候选内部模式1110。
本文描述的系统的各种组件可用软件、固件和硬件和/或它们的任何组合实现。例如,系统700的各种组件可至少部分通过计算片上系统(SoC)的硬件来提供,诸如可在诸如例如智能电话的计算系统中所找到的。本领域技术人员可认识到,本文描述的系统可包含未在对应附图中描绘的附加组件。例如,系统200和1100可包含为了简洁起见未在图2和11中描绘的附加组件,诸如位流复用器模块等。
图12图示了根据本公开各种实现的示例过程1200的流程图。过程1200可包含由图12的块1202、1204、1206、1208、1210、1212、1214、1216、1218和1220中的一个或多个所图示的一个或多个操作、功能或动作。作为非限制示例,过程1200可形成由解码器系统1100所承担的EL层的一部分(例如在此实现中是PU)的可缩放视频编码过程的至少一部分。进一步说,过程1200在本文还将参考使用图4的可缩放视频编码系统400对增强层PU编码以及图9的示例位流900来描述,其中SVC编解码器模块406可例示解码器系统1100。
过程1200可开始于块1202,在此可以确定是否承担正在解码的当前EL PU的跳跃模式,其中当前PU将基于一个或多个之前解码的PU进行解码。在各种实现中,SVC编解码器406可响应于在位流900的报头部分902中接收的指示符的值而承担块1202。比如,如果指示符具有第一值(例如1),则SVC编解码器406可确定承担当前PU的跳跃模式。另一方面,如果指示符具有第二值(例如0),则SVC编解码器406可确定不承担当前PU的跳跃模式。
如果块1202导致否定确定,则过程1200可进行到块1204,在此可确定是执行PU的内部编码还是中间编码。如果选择内部预测,则过程1200可进行到块1208,在此可使用已知内部预测技术执行内部预测。如果选择内部预测,则过程1200可进行到块1206,在此可使用已知中间预测技术执行中间预测。在各种实现中,SVC编解码器406可承担块1204、1206和1208,例如使用解码器1104的内部预测模块1130承担块1208,并使用解码器1104的中间预测模块1124来承担块1206。过程1200然后可在块1210继续,在此可使用已知解码技术以及块1206或1208的结果承担残差解码。
返回到块1202的讨论,如果块1202导致肯定确定,并且对于PU调用跳跃模式,则过程1200可进行到块1212,在此可确定是否执行当前PU的层间内部模式预测。在各种实现中,SVC编解码器406可响应于在位流900的报头部分902中接收的指示符908的值而承担块1212。比如,如果指示符908具有第一值(例如1),则SVC编解码器406可确定承担当前PU的层间内部模式预测。另一方面,如果指示符908具有第二值(例如0),则SVC编解码器406可确定不承担当前PU的层间内部模式预测。
如果块1212导致肯定确定,则过程1200可进行到块1214,在此可采用类似于上面相对于过程300描述的方式的方式,对于当前PU执行层间内部模式预测。例如,块1214可涉及生成如在过程300中所描述的候选模式列表[块1216],其中候选内部模式包含来自较低层(诸如较低EL或BL)的至少一个候选内部模式。块1214然后可包含响应于内部模式候选而确定PU的预测内部模式。
在各种实现中,SVC编解码器406可响应于具有第一值(例如1)的指示符908而承担块1214。在各种实现中,其中在译码(过程300)期间预测内部模式匹配候选模式,SVC编解码器406可通过访问指示符910的值并将那个索引值与在块1216使用上面相对于过程300所描述的MPM算法开发的候选内部模式相比较来实现块1214。在一些实现中,其中在译码(过程300)期间预测内部模式被确定为类似于候选模式,SVC编解码器406可通过访问指示符910的值并将那个索引值与在块1216使用早先所描述的MPM算法开发的候选内部模式相比较并且通过访问指示符912以确定差值来实现块1214。过程800然后可终止于块1220,在此至少部分基于块1214的结果确定当前PU的内部模式。
虽然过程1200在本文中被描述为EL PU的解码过程,但本公开不限于在PU级执行层间内部模式预测。从而,在各种实现中,过程1200还可应用于CU或TU。进一步说,如之前所指出的,本文描述的所有层间内部模式预测过程(包含过程1200)可应用在时间、空间和/或质量可缩放视频编码的任何组合的上下文中。
虽然图3和图12中所图示的示例过程300和1200的实现可包含承担按所图示次序示出的所有块,但本公开不限于这方面,并且在各种示例中,过程300和1200的实现可包含仅承担所示出和/或按与所图示的不同次序的块的子集。
此外,可响应于由一个或多个计算机程序产品提供的指令而承担图3和图12的任何一个或多个块。此类程序产品可包含提供指令的信号承载介质,所述指令例如当由处理器执行时可提供本文描述的功能性。计算机程序产品可以一个或多个机器可读介质的任何形式提供。从而,例如,包含一个或多个处理器核的处理器可响应于由一个或多个机器可读介质输送到处理器的程序代码和/或指令或指令集而承担图3和图12中示出的一个或多个块。一般而言,机器可读介质可输送以可使本文描述的任何装置和/或系统实现至少部分视频系统100、200和1100和/或SVC代码块406的程序代码和/或指令或指令集形式的软件。
如在本文中描述的任何实现中所使用的,术语“模块”指的是配置成提供本文描述的功能性的软件逻辑、固件逻辑和/或硬件逻辑的任何组合。软件可实施为软件包、代码和/或指令集或指令,并且在本文描述的任何实现中所使用的“硬件”例如可以单个或任何组合方式包含存储由可编程电路执行的指令的硬连线电路、可编程电路、状态机电路和/或固件。模块可共同或单独实施为形成部分更大系统(例如集成电路(IC)、片上系统(SoC)等)的电路。
图13图示了按照本公开的示例系统1300。在各种实现中,系统1300可以是媒体系统,不过系统1300不限于此上下文。例如,系统1300可被合并到个人计算机(PC)、膝上型计算机、超膝上型计算机、平板、触摸板、便携计算机、手持计算机、掌上计算机、个人数字助理(PDA)、蜂窝电话、组合蜂窝电话/PDA、电视、智能装置(例如智能电话、智能平板或智能电视)、移动因特网装置(MID)、消息传递装置、数据通信装置、相机(例如傻瓜相机、超级变焦相机、数码单反(DSLR)相机)等等中。
在各种实现中,系统1300包含耦合到显示器1320的平台1302。平台1302可从内容装置(诸如内容服务装置1330或内容递送装置1340或其它类似内容源)接收内容。包含一个或多个导航特征的导航控制器1350可用于例如与平台1302和/或显示器1320交互。下面更详细描述这些组件中的每个组件。
在各种实现中,平台1302可包含芯片集1305、处理器1310、存储器1312、存储装置1314、图形子系统1315、应用1316和/或无线电1318的任何组合。芯片集1305可提供处理器1310、存储器1312、存储装置1314、图形子系统1315、应用1316和/或无线电1318之间的互通信。例如,芯片集1305可包含能够提供与存储装置1314的互通信的存储装置适配器(未描绘)。
处理器1310可实现为复杂指令集计算机(CISC)或精简指令集计算机(RISC)处理器、x86指令集可兼容处理器、多核或任何其它微处理器或中央处理单元(CPU)。在各种实现中,处理器1310可以是双核处理器、双核移动处理器等等。
存储器1312可实现为易失性存储装置,诸如但不限于随机存取存储器(RAM)、动态随机存取存储器(DRAM)或静态RAM(SRAM)。
存储装置1314可实现为非易失性存储装置,诸如但不限于磁盘驱动器、光盘驱动器、磁带驱动器、内部存储装置、附连的存储装置、闪存、电池备份的SDRAM(同步DRAM)和/或网络可访问存储装置。在各种实现中,例如当包含多个硬驱时,存储装置1314可包括用于增加有价值数字媒体的存储性能增强保护的技术。
图形子系统1315可执行图像(诸如静止图像或视频)处理以便显示。图形子系统1315例如可以是图形处理单元(GPU)或视觉处理单元(VPU)。可使用模拟接口或数字接口以通信方式耦合图形子系统1315和显示器1320。例如,接口可以是符合高清晰多媒体接口、显示端口、无线HDMI和/或无线HD的技术中的任何技术。图形子系统1315可被集成到处理器1310或芯片集1305中。在一些实现中,图形子系统1315可以是以通信方式耦合到芯片集1305的独立装置。
本文描述的图形和/或视频处理技术可实现在各种硬件架构中。例如,图形和/或视频功能性可集成在芯片集内。备选地,可使用分立图形和/或视频处理器。作为又一实现,图形和/或视频功能可由通用处理器(包含多核处理器)提供。在另一实施例中,功能可实现在消费电子装置中。
收发器1318可包含能够使用各种适合的无线通信技术传送和接收信号的一个或多个无线电。此类技术可涉及在一个或多个无线网络上的通信。示例无线网络包含(但不限于)无线局域网(WLAN)、无线个域网(WPAN)、无线城域网(WMAN)、蜂窝网络和卫星网络。在此类网络上的通信中,无线电1318可按照任何版本的一个或多个可应用标准进行操作。
在各种实现中,显示器1320可包含任何电视型监视器或显示器。显示器1320例如可包含计算机显示屏、触摸屏显示器、视频监视器、电视类装置和/或电视。显示器1320可以是数字的和/或模拟的。在各种实现中,显示器1320可以是全息显示器。还有,显示器1320可以是可接收视觉投影的透明表面。此类投影可输送各种形式的信息、图像和/或对象。例如,此类投影可以是用于移动增强现实(MAR)应用的视觉重叠。在一个或多个软件应用1316的控制下,平台1302可在显示器1320上显示用户接口1322。
在各种实现中,内容服务装置1330可由任何国家、国际和/或独立服务托管,并且从而例如可经由因特网访问平台1302。内容服务装置1330可耦合到平台1302和/或显示器1320。平台1302和/或内容服务装置1330可耦合到网络1360以向网络1360和从网络1360传递(例如发送和/或接收)媒体信息。内容递送装置1340还可耦合到平台1302和/或显示器1320。
在各种实现中,内容服务装置1330可包含有线电视盒、个人计算机、网络、电话、能够递送数字信息和/或内容的因特网使能装置或电器以及能够在内容提供商与平台1302和/或显示器1320之间经由网络1360或直接单向或双向传递内容的任何其它类似装置。将认识到,可经由网络1360向和从系统1300中的任一组件和内容提供商单向和/或双向传递内容。内容示例可包含任何媒体信息,例如包含视频、音乐、医疗和游戏信息等等。
内容服务装置1330可接收诸如有线电视节目的内容,包含媒体信息、数字信息和/或其它内容。内容提供商的示例可包含任何有线电视或卫星电视或者无线电或因特网内容提供商。所提供的示例不打算以任何方式限制按照本公开的实现。
在各种实现中,平台1302可从具有一个或多个导航特征的导航控制器1350接收控制信号。控制器1350的导航特征例如可用于与用户接口1322交互。在各种实施例中,导航控制器1350可以是指点装置,其可以是允许用户将空间(例如连续和多维)数据输入到计算机中的计算机硬件组件(特别地,人工接口装置)。许多系统诸如图形用户接口(GUI)以及电视和监视器允许用户使用身体姿势控制数据并将数据提供给计算机或电视。
移动控制器1350的导航特征可通过移动指针、光标、焦圈或显示在显示器上的其它视觉指示符来在显示器(例如显示器1320)上复制。例如,在软件应用1316的控制下,位于导航控制器1350上的导航特征例如可映射到显示在用户接口1322上的虚拟导航特征。在各种实施例中,控制器1350可以不是单独的组件,而是可集成到平台1302和/或显示器1320中。然而,本公开不限于本文示出或描述的元件或上下文。
在各种实现中,驱动器(未示出)可包含在初始引导后(例如当启用时)使用户能够通过触摸按钮而立即打开和关闭平台1302(如电视)的技术。当平台“关闭”时,程序逻辑可允许平台1302向媒体适配器或其它内容服务装置1330或内容递送装置1340流播内容。此外,芯片集1305例如可包含对于5.1环绕声音频和/或高清7.1环绕声音频的硬件和/或软件支持。驱动器可包含用于集成图形平台的图形驱动器。在各种实施例中,图形驱动器可包括外围组件互连(PCI)快速图形卡。
在各种实现中,可集成系统1300中示出的组件中的任何一个或多个。例如,平台1302和内容服务装置1330可被集成,或者平台1302和内容递送装置1340可被集成,或者例如平台1302、内容服务装置1330和内容递送装置1340可被集成。在各种实施例中,平台1302和显示器1320可以是集成单元。例如,显示器1320和内容服务装置1330可被集成,或者显示器1320和内容递送装置1340可被集成。这些示例不打算限制本公开。
在各种实施例中,系统1300可被实现为无线系统、有线系统或二者的组合。当实现为无线系统时,系统1300可包含适合于通过无线共享介质(诸如一个或多个天线、传送器、接收器、收发器、放大器、滤波器、控制逻辑等)通信的组件和接口。无线共享介质的示例可包含部分无线频谱,诸如RF频谱等。当实现为有线系统时,系统1300可包含适合于通过有线通信介质(诸如输入/输出(I/O)适配器、连接I/O适配器与对应有线通信介质的物理连接器、网络接口卡(NIC)、盘控制器、视频控制器、音频控制器等)通信的组件和接口。有线通信介质的示例可包含有线、电缆、金属引线、印刷电路板(PCB)、背板、开关组构、半导体材料、双绞线、同轴电缆、光纤等等。
平台1302可建立一个或多个逻辑或物理信道以传递信息。信息可包含媒体信息和控制信息。媒体信息可指的是表示送往用户的内容的任何数据。内容的示例例如可包含来自语音对话、视频会议、流播视频、电子邮件("email")消息、语音邮件消息、字母数字符号、图形、图像、视频、文本等的数据。来自语音对话的数据例如可以是语音信息、沉默周期、背景噪声、舒适噪声、音调等等。控制信息可指的是表示送往自动化系统的命令、指令或控制字的任何数据。例如,控制信息可用于通过系统路由媒体信息,或指令节点按预定方式处理媒体信息。然而,实施例不限于图13中示出或描述的元件或上下文。
如上所述,系统1300可按变化的物理样式或形状因子实施。图14图示了可实施系统1400的小形状因子装置1400的实现。在各种实施例中,例如,装置1400可实现为具有无线能力的移动计算装置。移动计算装置可指的是例如具有处理系统和移动功率源或电源(诸如一个或更多电池)的任何装置。
如上所述,移动计算装置的示例可包含个人计算机(PC)、膝上型计算机、超膝上型计算机、平板、触摸板、便携计算机、手持计算机、掌上计算机、个人数字助理(PDA)、蜂窝电话、组合蜂窝电话/PDA、电视、智能装置(例如智能电话、智能平板或智能电视)、移动因特网装置(MID)、消息传递装置、数据通信装置、相机(例如傻瓜相机、超级变焦相机、数码单反(DSLR)相机)等等。
移动计算装置的示例还可包含布置成由人穿戴的计算机,诸如手腕计算机、手指计算机、戒指计算机、眼镜计算机、皮带扣计算机、臂带计算机、鞋计算机、衣服计算机以及其它可穿戴计算机。在各种实施例中,例如,移动计算装置可实现为能够执行计算机应用以及语音通信和/或数据通信的智能电话。尽管一些实施例作为示例可用实现为智能电话的移动计算装置进行描述,但可认识到,其它实施例也可使用其它无线移动计算装置实现。实施例不限于此上下文。
如图14中所示,装置1400可包含外壳1402、显示器1404、输入/输出(I/O)装置1406和天线1408。装置1400还可包含导航特征1412。显示器1404可包含用于显示适合于移动计算装置的信息的任何适合的显示单元。I/O装置1406可包含用于将信息录入到移动计算装置中的任何适合的I/O装置。I/O装置1406的示例可包含字母数字键盘、数字键区、触摸盘、输入键、按钮、开关、摇臂开关、麦克风、扬声器、语音识别装置和软件等等。信息还可通过麦克风(未示出)录入到装置1400中。此类信息可通过语音识别装置(未示出)数字化。实施例不限于此上下文。
各种实施例可使用硬件元件、软件元件或二者的组合来实现。硬件元件的示例可包含处理器、微处理器、电路、电路元件(例如晶体管、电阻器、电容器、电感器等等)、集成电路、专用集成电路(ASIC)、可编程逻辑装置(PLD)、数字信号处理器(DSP)、现场可编程门阵列(FPGA)、逻辑门、寄存器、半导体装置、芯片、微芯片、芯片集等等。软件的示例可包含软件组件、程序、应用、计算机程序、应用程序、系统程序、机器程序、操作系统软件、中间件、固件、软件模块、例程、子例程、功能、方法、过程、软件接口、应用程序接口(API)、指令集、计算代码、计算机代码、代码段、计算机代码段、字、值、符号或它们的任何组合。确定实施例是否使用硬件元件和/或软件元件来实现可按照许多因素(诸如期望的计算速率、功率级、耐热性、处理循环预算、输入数据速率、输出数据速率、存储资源、数据总线速度以及其它设计或性能约束)变化。
至少一个实施例的一个或多个方面可由存储在表示处理器内各种逻辑的机器可读介质上的代表性指令实现,这些指令当由机器读取时使机器制作执行本文描述的技术的逻辑。称为“IP核”的此类表示可存储在有形机器可读介质上,并被提供给各种顾客或制造设施,以加载到实际上制定逻辑或处理器的制作机器中。
虽然已经参考各种实现描述了本文阐述的某些特征,但此描述不打算视为限制意义。因此,对本公开涉及的领域的技术人员显而易见的本文描述的实现的各种修改以及其它实现被认为位于本公开的精神和范围内。

Claims (30)

1. 一种用于执行视频编码的方法,包括:
在增强层(EL)视频解码器:
至少部分响应于从较低级EL帧或基础层(BL)帧中的至少一个获得的一个或多个第一内部模式候选确定EL帧的当前块的预测内部模式。
2. 如权利要求1所述的方法,其中所述一个或多个第一内部模式候选包括所述较低级EL帧和/或所述BL帧的一个或多个协同定位块的内部模式。
3. 如权利要求2所述的方法,其中所述一个或多个第一内部模式候选进一步包括空间上邻近所述协同定位块的一个或多个块的内部模式。
4. 如权利要求1所述的方法,其中确定所述预测内部模式包括至少部分响应于所述一个或多个第一内部模式候选以及从空间上邻近所述EL帧中所述当前块的至少一个块获得的一个或多个第二内部模式候选而确定所述当前块的所述预测内部模式。
5. 如权利要求1所述的方法,进一步包括:访问位流中的一个或多个指示符,其中确定所述预测内部模式包括基于所述一个或多个指示符确定所述预测内部模式。
6. 如权利要求5所述的方法,其中所述一个或多个指示符包括规定是否执行所述当前块的内部模式预测的指示符。
7. 如权利要求5所述的方法,其中所述一个或多个指示符包括规定候选内部模式索引的指示符。
8. 如权利要求7所述的方法,其中所述候选内部模式索引规定对应于所述当前块的所述预测内部模式的所述第一内部模式候选之一。
9. 如权利要求7所述的方法,其中所述一个或多个指示符进一步包括规定所述第一内部模式候选之一与所述当前块的所述预测内部模式之间差异的另一指示符。
10. 如权利要求1所述的方法,进一步包括:生成包含所述第一内部模式候选的内部模式候选列表。
11. 如权利要求10所述的方法,其中所述内部模式候选列表包含每一个所述内部模式候选的优先级的指示,其中更靠近所述EL的层的内部模式候选具有比更远离所述EL的层的内部模式候选的优先级更高的优先级,并且其中所述EL中的上面邻近块的内部模式具有比所述EL中其它相邻块的内部模式更高的优先级。
12. 如权利要求1所述的方法,其中所述EL解码器至少部分用硬件实现。
13. 至少一个机器可读介质,包括多个指令,所述指令响应于在计算装置上执行而使所述计算装置执行如权利要求1至12中任一项所述的方法。
14. 一种设备,当操作时配置成执行如权利要求1至12中任一项所述的方法。
15. 一种设备,包括用于执行如权利要求1至12中任一项所述的方法的部件。
16. 一种用于执行视频编码的方法,包括:
在增强层(EL)视频译码器:
至少部分响应于从较低级EL帧或基础层(BL)帧中的至少一个获得的一个或多个第一内部模式候选确定EL帧的当前块的预测内部模式。
17. 如权利要求16所述的方法,其中所述一个或多个第一内部模式候选包括所述较低级EL帧和/或所述BL帧的一个或多个协同定位块的内部模式。
18. 如权利要求17所述的方法,其中所述一个或多个第一内部模式候选进一步包括空间上邻近所述协同定位块的一个或多个块的内部模式。
19. 如权利要求16所述的方法,其中确定所述预测内部模式包括至少部分响应于所述一个或多个第一内部模式候选以及从空间上邻近所述EL帧中所述当前块定位的至少一个块获得的一个或多个第二内部模式候选而确定所述当前块的所述预测内部模式。
20. 如权利要求16所述的方法,进一步包括:生成位流的一个或多个指示符,所述一个或多个指示符规定所述当前块的所述预测内部模式。
21. 如权利要求20所述的方法,其中所述一个或多个指示符包括规定是否执行所述当前块的内部模式预测的指示符。
22. 如权利要求20所述的方法,其中所述一个或多个指示符包括规定候选内部模式索引的指示符。
23. 如权利要求22所述的方法,其中所述候选内部模式索引规定对应于所述当前块的所述预测内部模式的所述第一内部模式候选之一。
24. 如权利要求22所述的方法,其中所述一个或多个指示符进一步包括规定所述第一内部模式候选之一与所述当前块的所述预测内部模式之间差异的另一指示符。
25. 如权利要求16所述的方法,进一步包括:生成包含所述第一内部模式候选的内部模式候选列表。
26. 如权利要求25所述的方法,其中所述内部模式候选列表包含每一个所述内部模式候选的优先级的指示,其中更靠近所述EL的层的内部模式候选具有比更远离所述EL的层的内部模式候选的优先级更高的优先级,并且其中所述EL中的上面邻近块的内部模式具有比所述EL中其它相邻块的内部模式更高的优先级。
27. 如权利要求16所述的方法,其中所述EL译码器至少部分用硬件实现。
28. 至少一个机器可读介质,包括多个指令,所述指令响应于在计算装置上执行而使所述计算装置执行如权利要求16至27中任一项所述的方法。
29. 一种设备,当操作时配置成执行如权利要求16至27中任一项所述的方法。
30. 一种设备,包括用于执行如权利要求16至27中任一项所述的方法的部件。
CN201280075461.4A 2012-09-28 2012-09-28 层间内部模式预测方法、设备及装置 Active CN104541505B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2012/082323 WO2014047881A1 (en) 2012-09-28 2012-09-28 Inter-layer intra mode prediction

Publications (2)

Publication Number Publication Date
CN104541505A true CN104541505A (zh) 2015-04-22
CN104541505B CN104541505B (zh) 2019-07-05

Family

ID=50386855

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201280075461.4A Active CN104541505B (zh) 2012-09-28 2012-09-28 层间内部模式预测方法、设备及装置

Country Status (6)

Country Link
US (1) US9860558B2 (zh)
EP (1) EP2901693A4 (zh)
KR (1) KR101650742B1 (zh)
CN (1) CN104541505B (zh)
SG (1) SG11201500316PA (zh)
WO (1) WO2014047881A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109328461A (zh) * 2016-04-29 2019-02-12 世宗大学校产学协力团 视频信号编码/解码方法和设备
WO2020133380A1 (zh) * 2018-12-29 2020-07-02 富士通株式会社 一种图像的块内编码或解码方法、数据处理装置和电子设备
US11849074B2 (en) 2016-04-29 2023-12-19 Industry Academy Cooperation Foundation Of Sejong University Video signal encoding/decoding method and apparatus

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8902978B2 (en) * 2010-05-30 2014-12-02 Lg Electronics Inc. Enhanced intra prediction mode signaling
CN103299622B (zh) * 2011-01-07 2016-06-29 联发科技(新加坡)私人有限公司 编码方法与装置以及解码方法与装置
CN104247423B (zh) * 2012-03-21 2018-08-07 联发科技(新加坡)私人有限公司 可伸缩视频编码系统的帧内模式编码方法和装置
US10375405B2 (en) * 2012-10-05 2019-08-06 Qualcomm Incorporated Motion field upsampling for scalable coding based on high efficiency video coding
GB2509901A (en) * 2013-01-04 2014-07-23 Canon Kk Image coding methods based on suitability of base layer (BL) prediction data, and most probable prediction modes (MPMs)
KR102341872B1 (ko) * 2015-06-12 2021-12-23 삼성디스플레이 주식회사 영상의 부호화, 복호화 방법 및 장치
CN109417633B (zh) * 2016-04-29 2023-11-28 英迪股份有限公司 用于编码/解码视频信号的方法和装置
KR20230101932A (ko) * 2016-04-29 2023-07-06 인텔렉추얼디스커버리 주식회사 영상 신호 부호화/복호화 방법 및 장치
US10448056B2 (en) * 2016-07-15 2019-10-15 Qualcomm Incorporated Signaling of quantization information in non-quadtree-only partitioned video coding
US10511853B2 (en) * 2016-11-24 2019-12-17 Ecole De Technologie Superieure Method and system for parallel rate-constrained motion estimation in video coding
US10585837B2 (en) * 2017-10-17 2020-03-10 Megachips Technology America Corporation Data transmission method and data transmission system
WO2020171647A1 (ko) * 2019-02-21 2020-08-27 엘지전자 주식회사 영상 코딩 시스템에서 인트라 예측을 사용하는 영상 디코딩 방법 및 그 장치

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1656820A (zh) * 2002-05-29 2005-08-17 皇家飞利浦电子股份有限公司 用于Laplace-Makov源的约束熵的标量量化器
US20080111721A1 (en) * 2006-11-14 2008-05-15 Qualcomm, Incorporated Memory efficient coding of variable length codes
CN101379511A (zh) * 2005-03-18 2009-03-04 夏普株式会社 具有画面级调整的扩展空间可缩放性的方法和系统
US20090074061A1 (en) * 2005-07-11 2009-03-19 Peng Yin Method and Apparatus for Macroblock Adaptive Inter-Layer Intra Texture Prediction
CN101578870A (zh) * 2007-01-05 2009-11-11 高通股份有限公司 用于精细化系数译码的基于块类型统计的可变长度译码表选择
CN101584217A (zh) * 2007-01-08 2009-11-18 高通股份有限公司 用于空间可缩放性的扩展的层间译码
US20120057310A1 (en) * 2010-09-07 2012-03-08 Kabushiki Kaisha Toshiba Television and electronic apparatus
US20120177113A1 (en) * 2011-01-07 2012-07-12 Mediatek Singapore Pte. Ltd. Method and Apparatus of Improved Intra Luma Prediction Mode Coding
US20120201301A1 (en) * 2006-01-11 2012-08-09 Qualcomm Incorporated Video coding with fine granularity spatial scalability

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8374238B2 (en) * 2004-07-13 2013-02-12 Microsoft Corporation Spatial scalability in 3D sub-band decoding of SDMCTF-encoded video
US20060153295A1 (en) 2005-01-12 2006-07-13 Nokia Corporation Method and system for inter-layer prediction mode coding in scalable video coding
KR100913088B1 (ko) 2005-01-21 2009-08-21 엘지전자 주식회사 베이스 레이어의 내부모드 블록의 예측정보를 이용하여영상신호를 엔코딩/디코딩하는 방법 및 장치
KR100703748B1 (ko) * 2005-01-25 2007-04-05 삼성전자주식회사 다 계층 기반의 비디오 프레임을 효율적으로 예측하는 방법및 그 방법을 이용한 비디오 코딩 방법 및 장치
WO2006080779A1 (en) 2005-01-25 2006-08-03 Samsung Electronics Co., Ltd. Method of effectively predicting multi-layer based video frame, and video coding method and apparatus using the same
US8879856B2 (en) * 2005-09-27 2014-11-04 Qualcomm Incorporated Content driven transcoder that orchestrates multimedia transcoding using content information
US7573407B2 (en) * 2006-11-14 2009-08-11 Qualcomm Incorporated Memory efficient adaptive block coding
US8724697B2 (en) * 2008-09-26 2014-05-13 Qualcomm Incorporated Locating motion vectors for video data units
KR100954172B1 (ko) 2008-10-24 2010-04-20 부산대학교 산학협력단 Svc 복호화기의 공용 예측 블록 시스템
US8724707B2 (en) * 2009-05-07 2014-05-13 Qualcomm Incorporated Video decoding using temporally constrained spatial dependency
US8451904B2 (en) * 2009-06-24 2013-05-28 Qualcomm Incorporated 8-point transform for media data coding
KR101040087B1 (ko) 2010-01-13 2011-06-09 전자부품연구원 H.264 svc를 위한 효율적인 부호화 방법
US8879634B2 (en) * 2010-08-13 2014-11-04 Qualcomm Incorporated Coding blocks of data using one-to-one codes
GB2483294B (en) * 2010-09-03 2013-01-02 Canon Kk Method and device for motion estimation of video data coded according to a scalable coding structure
US8526495B2 (en) * 2010-11-22 2013-09-03 Mediatek Singapore Pte. Ltd. Apparatus and method of constrained partition size for high efficiency video coding
US9706227B2 (en) 2011-03-10 2017-07-11 Qualcomm Incorporated Video coding techniques for coding dependent pictures after random access
US9131239B2 (en) * 2011-06-20 2015-09-08 Qualcomm Incorporated Unified merge mode and adaptive motion vector prediction mode candidates selection
US10200709B2 (en) * 2012-03-16 2019-02-05 Qualcomm Incorporated High-level syntax extensions for high efficiency video coding
US9392274B2 (en) * 2012-03-22 2016-07-12 Qualcomm Incorporated Inter layer texture prediction for video coding
WO2014043885A1 (en) * 2012-09-21 2014-03-27 Intel Corporation Cross-layer motion vector prediction
US20140086328A1 (en) * 2012-09-25 2014-03-27 Qualcomm Incorporated Scalable video coding in hevc
US9491461B2 (en) * 2012-09-27 2016-11-08 Qualcomm Incorporated Scalable extensions to HEVC and temporal motion vector prediction

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1656820A (zh) * 2002-05-29 2005-08-17 皇家飞利浦电子股份有限公司 用于Laplace-Makov源的约束熵的标量量化器
CN101379511A (zh) * 2005-03-18 2009-03-04 夏普株式会社 具有画面级调整的扩展空间可缩放性的方法和系统
US20090074061A1 (en) * 2005-07-11 2009-03-19 Peng Yin Method and Apparatus for Macroblock Adaptive Inter-Layer Intra Texture Prediction
US20120201301A1 (en) * 2006-01-11 2012-08-09 Qualcomm Incorporated Video coding with fine granularity spatial scalability
US20080111721A1 (en) * 2006-11-14 2008-05-15 Qualcomm, Incorporated Memory efficient coding of variable length codes
CN101578870A (zh) * 2007-01-05 2009-11-11 高通股份有限公司 用于精细化系数译码的基于块类型统计的可变长度译码表选择
CN101584217A (zh) * 2007-01-08 2009-11-18 高通股份有限公司 用于空间可缩放性的扩展的层间译码
US20120057310A1 (en) * 2010-09-07 2012-03-08 Kabushiki Kaisha Toshiba Television and electronic apparatus
US20120177113A1 (en) * 2011-01-07 2012-07-12 Mediatek Singapore Pte. Ltd. Method and Apparatus of Improved Intra Luma Prediction Mode Coding

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109328461A (zh) * 2016-04-29 2019-02-12 世宗大学校产学协力团 视频信号编码/解码方法和设备
CN109328461B (zh) * 2016-04-29 2023-09-05 世宗大学校产学协力团 视频信号编码/解码方法和设备
US11849074B2 (en) 2016-04-29 2023-12-19 Industry Academy Cooperation Foundation Of Sejong University Video signal encoding/decoding method and apparatus
WO2020133380A1 (zh) * 2018-12-29 2020-07-02 富士通株式会社 一种图像的块内编码或解码方法、数据处理装置和电子设备
CN112106368A (zh) * 2018-12-29 2020-12-18 富士通株式会社 一种图像的块内编码或解码方法、数据处理装置和电子设备

Also Published As

Publication number Publication date
CN104541505B (zh) 2019-07-05
EP2901693A4 (en) 2016-04-27
WO2014047881A1 (en) 2014-04-03
KR20150038296A (ko) 2015-04-08
US9860558B2 (en) 2018-01-02
KR101650742B1 (ko) 2016-08-24
US20150163512A1 (en) 2015-06-11
EP2901693A1 (en) 2015-08-05
SG11201500316PA (en) 2015-02-27

Similar Documents

Publication Publication Date Title
CN104541505A (zh) 层间内部模式预测
CN104541506A (zh) 层间像素样本预测
CN104584553A (zh) 层间残差预测
CN103918265B (zh) 跨通道残余预测
CN104937932B (zh) 可适性视频编码的增强参考区域利用
CN104219524A (zh) 使用感兴趣对象的数据对视频成码的比特率控制
CN104321970A (zh) 层间编码单元四叉树模式预测
CN103581665A (zh) 转码视频数据
CN104798373A (zh) 包括在多个独立编码流之间的共享运动估计的视频编码
CN104756498A (zh) 跨层运动向量预测
CN104169971A (zh) 使用非线性缩放和自适应源块大小的分层运动估计
CN104053005A (zh) 使用分级相平面相关性和块匹配的运动估计
US10536710B2 (en) Cross-layer cross-channel residual prediction
TWI559749B (zh) 層間移動資料繼承之技術
CN104322062B (zh) 跨层跨通道样本预测
CN104272738A (zh) 用于可扩展视频编码的自适应滤波
CN103975594B (zh) 用于残差预测的运动估计方法
CN104717501A (zh) 层间像素样本预测
KR101777487B1 (ko) 코딩 단위 비트 수 제한
CN104023238B (zh) 跨通道残余预测
JP2015146599A (ja) レイヤ間画素サンプル予測

Legal Events

Date Code Title Description
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant