CN109196869A - 帧内预测模式的基于邻近的发信号 - Google Patents

帧内预测模式的基于邻近的发信号 Download PDF

Info

Publication number
CN109196869A
CN109196869A CN201780028534.7A CN201780028534A CN109196869A CN 109196869 A CN109196869 A CN 109196869A CN 201780028534 A CN201780028534 A CN 201780028534A CN 109196869 A CN109196869 A CN 109196869A
Authority
CN
China
Prior art keywords
intra prediction
prediction mode
mode
contiguous block
candidate list
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201780028534.7A
Other languages
English (en)
Other versions
CN109196869B (zh
Inventor
瓦迪姆·谢廖金
赵欣
阿米尔·赛义德
马尔塔·卡切维奇
胡楠
钱威俊
维贾伊拉加哈万·提鲁马莱
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of CN109196869A publication Critical patent/CN109196869A/zh
Application granted granted Critical
Publication of CN109196869B publication Critical patent/CN109196869B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/41Bandwidth or redundancy reduction
    • H04N1/411Bandwidth or redundancy reduction for the transmission or storage or reproduction of two-tone pictures, e.g. black and white pictures
    • H04N1/413Systems or arrangements allowing the picture to be reproduced without loss or modification of picture-information
    • H04N1/417Systems or arrangements allowing the picture to be reproduced without loss or modification of picture-information using predictive or differential encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/463Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/91Television signal processing therefor
    • H04N5/92Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N5/926Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback by pulse code modulation
    • H04N5/9261Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback by pulse code modulation involving data reduction
    • H04N5/9262Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback by pulse code modulation involving data reduction using predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/804Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components
    • H04N9/8042Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components involving data reduction
    • H04N9/8045Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components involving data reduction using predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/808Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the composite colour video-signal
    • H04N9/8081Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the composite colour video-signal involving data reduction
    • H04N9/8082Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the composite colour video-signal involving data reduction using predictive coding

Abstract

一种用于译码视频数据的装置经配置以:确定视频数据的当前块是使用帧内预测模式译码;添加所述当前块的第一邻近块的帧内预测模式到用于所述当前块的最可能模式候选列表;添加用于所述当前块的第二邻近块的帧内预测模式到用于所述当前块的所述最可能模式候选列表;添加用于所述当前块的第三邻近块的帧内预测模式到用于所述当前块的所述最可能模式候选列表;及使用帧内预测模式译码视频数据的所述当前块。

Description

帧内预测模式的基于邻近的发信号
本申请案要求以下各者的权益:
2016年5月13日申请的美国临时专利申请案62/336,414;及
2016年10月4日申请的美国临时专利申请案62/404,128
所述申请案中的每一者的全部内容以引用的方式并入本文中。
技术领域
本发明涉及视频编码及视频解码。
背景技术
数字视频能力可并入到广泛范围的装置中,包含数字电视、数字直播系统、无线广播系统、个人数字助理(PDA)、膝上型或台式计算机、平板计算机、电子书阅读器、数字摄像机、数字记录装置、数字媒体播放机、视频游戏装置、视频游戏控制台、蜂窝式或卫星无线电电话(所谓的“智能型电话”)、视频电话会议装置、视频流装置及其类似者。数字视频装置实施视频压缩技术,例如由MPEG-2、MPEG-4、ITU-T H.263、ITU-TH.264/MPEG-4第10部分高级视频译码(AVC)定义的标准、目前正在开发的高效率视频译码(HEVC)标准及这些标准的扩展中所描述的那些视频压缩技术。视频装置可通过实施这些视频压缩技术来更有效地传输、接收、编码、解码及/或存储数字视频信息。
视频压缩技术执行空间(图片内)预测及/或时间(图片间)预测以减少或移除视频序列中固有的冗余。对于基于块的视频译码,可将视频图块(即,视频帧或视频帧的一部分)分割成视频块,其也可被称作树型块、译码单元(CU)及/或译码节点。使用相对于同一图片中的相邻块中的参考样本的空间预测来编码图片的经帧内译码(I)的图块中的视频块。图片的经帧间译码(P或B)图块中的视频块可使用相对于同一图片中的相邻块中的参考样本的空间预测或相对于其它参考图片中的参考样本的时间预测。图片可被称作帧,且参考图片可被称作参考帧。
空间或时间预测产生用于待译码的块的预测性块。残余数据表示待译码的原始块与预测性块之间的像素差。根据指向形成预测性块的参考样本的块的运动向量及指示经译码块与预测性块之间的差异的残余数据来编码经帧间译码块。根据帧内译码模式及残余数据来编码经帧内译码块。为进一步压缩,可将残余数据从像素域变换到变换域,从而产生残余变换系数,其接着可被量化。可扫描最初按二维阵列布置的经量化变换系数以便产生变换系数的一维向量,且可应用熵译码以达成甚至更多压缩。
发明内容
本发明描述与帧内预测相关的技术,且更特定来说,用于将由视频解码器使用以确定将用以解码特定视频数据块的帧内预测模式的信息从视频编码器发信号到视频解码器的技术。
在一个实例中,一种用于解码视频数据的方法包含确定视频数据的当前块是使用帧内预测模式译码;添加当前块的第一邻近块的帧内预测模式到用于所述当前块的最可能模式候选列表;添加用于当前块的第二邻近块的帧内预测模式到用于当前块的最可能模式候选列表;添加用于当前块的第三邻近块的帧内预测模式到用于当前块的最可能模式候选列表;使用最可能模式候选列表确定帧内预测模式;及使用所述帧内预测模式解码视频数据的当前块。
在另一实例中,用于解码视频数据的装置包含存储器,其经配置以存储视频数据;及一或多个处理器,其经配置以确定视频数据的当前块是使用帧内预测模式译码;添加当前块的第一邻近块的帧内预测模式到用于当前块的最可能模式候选列表;添加用于当前块的第二邻近块的帧内预测模式到用于当前块的最可能模式候选列表;添加用于当前块的第三邻近块的帧内预测模式到用于当前块的最可能模式候选列表;使用所述最可能模式候选列表确定帧内预测模式;及使用所述帧内预测模式解码当前块。
在另一实例中,一种用于编码视频数据的方法包含确定视频数据的当前块是使用帧内预测模式译码;添加当前块的第一邻近块的帧内预测模式到用于所述当前块的最可能模式候选列表;添加用于当前块的第二邻近块的帧内预测模式到用于当前块的最可能模式候选列表;添加用于当前块的第三邻近块的帧内预测模式到用于当前块的最可能模式候选列表;使用最可能模式候选列表确定帧内预测模式;及使用所述帧内预测模式编码视频数据的当前块。
在另一实例中,一种用于编码视频数据的装置包含存储器,其经配置以存储视频数据;及一或多个处理器,其经配置以确定视频数据的当前块是使用帧内预测模式译码;添加当前块的第一邻近块的帧内预测模式到用于当前块的最可能模式候选列表;添加用于当前块的第二邻近块的帧内预测模式到用于当前块的最可能模式候选列表;添加用于当前块的第三邻近块的帧内预测模式到用于当前块的最可能模式候选列表;使用所述最可能模式候选列表确定帧内预测模式;及使用所述帧内预测模式编码视频数据的当前块。
在另一实例中,一种计算机可读存储媒体存储指令,所述指令在由一或多个处理器执行时使得所述一或多个处理器:确定视频数据的当前块是使用帧内预测模式译码;添加当前块的第一邻近块的帧内预测模式到用于当前块的最可能模式候选列表;添加用于当前块的第二邻近块的帧内预测模式到用于当前块的最可能模式候选列表;添加用于当前块的第三邻近块的帧内预测模式到用于当前块的最可能模式候选列表;使用所述最可能模式候选列表确定帧内预测模式;及使用所述帧内预测模式解码当前块。
在另一实例中,一种用于解码视频数据的装置包含用于确定视频数据的当前块是使用帧内预测模式译码的装置;用于添加当前块的第一邻近块的帧内预测模式到用于所述当前块的最可能模式候选列表的装置;用于添加用于当前块的第二邻近块的帧内预测模式到用于当前块的最可能模式候选列表的装置;用于添加用于当前块的第三邻近块的帧内预测模式到用于当前块的最可能模式候选列表的装置;用于使用最可能模式候选列表确定帧内预测模式的装置;及用于使用帧内预测模式解码视频数据的当前块的装置。
在另一实例中,一种计算机可读存储媒体存储指令,所述指令在由一或多个处理器执行时使得所述一或多个处理器:确定视频数据的当前块是使用帧内预测模式译码;添加当前块的第一邻近块的帧内预测模式到用于当前块的最可能模式候选列表;添加用于当前块的第二邻近块的帧内预测模式到用于当前块的最可能模式候选列表;添加用于当前块的第三邻近块的帧内预测模式到用于当前块的最可能模式候选列表;使用所述最可能模式候选列表确定帧内预测模式;及使用所述帧内预测模式编码视频数据的当前块。
在另一实例中,一种用于编码视频数据的装置包含用于确定视频数据的当前块是使用帧内预测模式译码的装置;用于添加当前块的第一邻近块的帧内预测模式到用于所述当前块的最可能模式候选列表的装置;用于添加用于当前块的第二邻近块的帧内预测模式到用于当前块的最可能模式候选列表的装置;用于添加用于当前块的第三邻近块的帧内预测模式到用于当前块的最可能模式候选列表的装置;用于使用最可能模式候选列表确定帧内预测模式的装置;及用于使用帧内预测模式编码视频数据的当前块的装置。
在附图及以下描述中阐明本发明的一或多个实例的细节。其它特征、目标及优势从描述、图式及权利要求书将为显而易见的。
附图说明
图1为说明可利用本发明中所描述的技术的实例视频编码及解码系统的框图。
图2展示HEVC中所使用的帧内预测模式的实例说明。
图3A到3E展示用于当前块的邻近块的位置的实例。
图4展示MPM模式分类的实例。
图5为说明可实施本发明中所描述的技术的实例视频编码器的框图。
图6为说明可实施本发明中所描述的技术的实例视频解码器的框图。
图7A及7B为说明二进制算术译码中的范围更新过程的概念图。
图8为说明二进制算术译码中的输出过程的概念图。
图9为说明视频编码器中的上下文自适应性二进制算术译码器的框图。
图10为说明视频解码器中的上下文自适应性二进制算术译码器的框图。
图11为说明根据本发明的技术的建构最可能模式候选列表的技术的流程图。
图12为说明根据本发明的技术的编码视频数据块的技术的流程图。
图13为说明根据本发明的技术的解码视频数据块的技术的流程图。
具体实施方式
包含最近开发的高效视频译码(HEVC)标准的各种视频译码标准包含用于视频块的预测译码模式,其中基于视频数据的已经译码块预测当前正经译码的块。在帧内预测模式中,基于与当前块在相同图片中的一或多个先前经译码的邻近块预测当前块,而在帧间预测模式中,基于不同图片中的已经译码块预测当前块。在帧间预测中,确定先前经译码帧的块用作预测性块的过程有时被称作运动估计,其通常由视频编码器执行,且识别并检索预测性块的过程有时被称作运动补偿,其由视频编码器及视频解码器两者执行。HEVC的扩展及HEVC的后续也可使用例如帧内块复制、词典及调色板译码模式的其它译码模式。
本发明描述与帧内预测相关的技术,且更特定来说,用于将由视频解码器使用以确定将用以解码特定视频数据块的帧内预测模式的信息从视频编码器发信号到视频解码器的技术。本发明描述确定用于视频数据块的最可能帧内预测模式的列表的技术及发信号来自最可能帧内预测模式的列表的最可能帧内预测模式中的哪一者用以编码视频数据块以使得视频解码器可使用所述帧内预测模式解码所述视频数据块的技术。在本发明中,最可能帧内预测模式也可被简称为最可能模式或MPM。最可能帧内预测模式的列表也可被简称为最可能模式候选列表或MPM候选列表。
根据下文更详细描述的本发明的技术,当块使用帧内预测模式译码时,视频编码器可确定用于所述块的MPM候选列表。视频解码器可通过实施与由视频编码器实施的相同MPM候选列表建构过程来确定与由视频编码器所确定相同的MPM候选列表。由于视频编码器及视频解码器建构相同MPM候选列表,视频编码器可通过发信号对应于MPM候选列表中的特定候选者的索引值将帧内预测模式发信号到视频解码器。除非明确地相反陈述,否则本文所描述的MPM候选列表建构技术可通过视频编码器抑或视频解码器执行。
MPM候选列表可(例如)包含全部可用帧内预测模式的相对较小子集。作为一个实例,帧内预测模式的总数可为如由HEVC支持的35个或超过60个,如针对HEVC的后续标准所预期,且包含于MPM候选列表中的最可能模式的数目可为5或6,或一些其它数目,或可为可变的。并非MPM候选列表的一部分的模式可被称作非最可能模式。本发明的技术不限于任何特定数目的帧内预测模式或最可能模式。
下文更详细地描述确定哪些帧内预测模式为用于任何给定块的最可能模式的技术。经选择作为用于特定块的最可能模式的帧内预测模式通常对应于统计学上更可能用于译码所述块的帧内预测模式。如下文将更详细地解释,当发信号用于视频数据块的实际帧内预测模式时,与实际帧内预测为非最可能模式中的一者的情况相比,在实际帧内预测模式为最可能模式中的一者(例如,MPM候选列表中的帧内预测模式)的情况下,可使用不同发信号技术。与用于非最可能模式的发信号技术相比,用于发信号最可能模式技术通常可使用更少位。因此,如果实际帧内预测模式比非最可能模式更加频繁地为最可能模式,那么可通过更加频繁地使用与最可能模式相关联的较低位发信号技术来达成整体位节省。
本发明描述用于确定MPM候选列表中包括哪些最可能模式的技术,且描述与在实际帧内预测模式为最可能模式中的一者时的情况下发信号用于块的实际帧内预测模式相关的技术。本发明描述与帧内预测模式发信号相关的技术,且更特定来说,本发明描述用于将已经译码邻近块的帧内预测模式用作最可能模式的预测子的技术。另外,本发明描述用于使用关于上下文的熵译码发信号与最可能模式相关的信息的技术。
本发明有时可指视频译码器。视频译码器意欲为指视频编码或视频解码的通用术语。同样地,术语视频译码意欲为指视频编码或视频解码的通用术语。可参考视频编码或视频解码描述某些技术,然而除非另有明确地陈述,否则不应假定那些技术不同等地适用于视频编码或视频解码中的另一者。因此,即使参考视频编码器或视频解码器中的一者描述本发明的某些技术,但通常应假定所述技术也适用于视频编码器或视频解码器中的另一者。
本发明(例如)描述用于产生MPM候选列表及确定用于熵译码某些信息的上下文的技术。通过视频编码器执行的用于产生MPM候选列表及确定上下文的技术可与通过视频解码器执行的技术相同,以使得视频解码器可使用极少或不使用从视频编码器到视频解码器的显式发信号确定与编码器相同的MPM候选列表或相同的上下文。
图1为说明可利用本发明中所描述的技术的实例视频编码及解码系统10的框图,所述技术包含用于以帧内预测模式编码及解码块的技术。如图1中所展示,系统10包含源装置12,其产生稍后时间待由目的地装置14解码的经编码视频数据。源装置12及目的地装置14可包括广泛范围的装置中的任一者,包含台式计算机、笔记型(即,膝上型)计算机、平板计算机、机顶盒、电话手持机(例如,所谓的“智能型”手机)、所谓的“智能型”平板计算机、电视机、摄像机、显示装置、数字媒体播放器、视频游戏控制台、视频流装置或其类似者。在一些情况下,可装备源装置12及目的地装置14以用于无线通信。
目的地装置14可经由链路16接收待解码的经编码视频数据。链路16可包括能够将经编码视频数据从源装置12移动到目的地装置14的任何类型的媒体或装置。在一个实例中,链路16可包括使源装置12能够实时地将经编码视频数据直接传输到目的地装置14的通信媒体。可根据通信标准(例如,无线通信协议)调制经编码视频数据,且将其传输到目的地装置14。通信媒体可包括任何无线或有线通信媒体,例如,射频(RF)频谱或一或多个物理传输线。通信媒体可形成基于包的网络(例如,局域网、广域网或例如因特网的全球网络)的部分。通信媒体可包含路由器、交换器、基站或可用于促进从源装置12到目的地装置14的通信的任何其它装备。
替代地,经编码数据可从输出接口22输出到存储装置17。类似地,经编码数据可通过输入接口从存储装置17存取。存储装置17可包含多种分布式或本机存取式数据存储媒体中的任一者,例如,硬盘机、蓝光光盘、DVD、CD-ROM、快闪存储器、易失性或非易失性存储器或用于存储经编码视频数据的任何其它适合数字存储媒体。在另一实例中,存储装置17可对应于可保持由源装置12产生的经编码视频的文件服务器或另一中间存储装置。目的地装置14可经由流传输或下载而从存储装置17存取所存储的视频数据。文件服务器可为能够存储经编码视频数据且将所述经编码视频数据传输到目的地装置14的任何类型的服务器。实例文件服务器包含网页服务器(例如,用于网站)、FTP服务器、网络附加存储(NAS)装置或本机磁盘机。目的地装置14可经由任何标准数据连接(包含因特网连接)而存取经编码的视频数据。此数据连接可包含适合用于存取存储于文件服务器上的经编码视频数据的无线信道(例如,Wi-Fi连接)、有线连接(例如,DSL、缆线调制解调器等)或两者的组合。经编码视频数据从存储装置17的传输可为流传输、下载传输或两者的组合。
本发明的技术未必限于无线应用或设定。所述技术可应用于视频译码以支持多种多媒体应用中的任一者,例如空中电视广播、有线电视传输、卫星电视传输、流视频传输(例如,经由因特网)、编码数字视频以存储于数据存储媒体上、解码存储于数据存储媒体上的数字视频,或其它应用。在一些实例中,系统10可经配置以支持单向或双向视频传输,以支持例如视频流、视频播放、视频广播及/或视频电话的应用。
在图1的实例中,源装置12包含视频源18、视频编码器20及输出接口22。在一些情况下,输出接口22可包含调制器/解调器(调制解调器)及/或传输器。在源装置12中,视频源18可包含例如以下各项的源:视频捕获装置(例如,视频摄像机)、含有先前所捕获视频的视频封存档、用以从视频内容提供者接收视频的视频馈入接口,及/或用于产生计算机图形数据作为源视频的计算机图形系统,或这些源的组合。作为一个实例,如果视频源18为视频摄像机,那么源装置12及目的地装置14可形成所谓的摄像机电话或视频电话。然而,本发明中所描述的技术一般可适用于视频译码,且可应用于无线及/或有线应用。
所捕获、预捕获或计算机产生的视频可由视频编码器20编码。经编码视频数据可经由源装置12的输出接口22直接传输到目的地装置14。也可(或替代地)将经编码视频数据存储到存储装置17上以供稍后通过目的地装置14或其它装置存取以用于解码及/或播放。
目的地装置14包含输入接口28、视频解码器30及显示装置34。在一些情况下,输入接口28可包含接收器及/或调制解调器。目的地装置14的输入接口28经由链路16接收经编码视频数据。经由链路16传达或在存储装置17上提供的经编码视频数据可包含由视频编码器20产生的多种语法元素以供例如视频解码器30的视频解码器在解码所述视频数据时使用。可包含这些语法元素以及传输于通信媒体上、存储于存储媒体上或存储于文件服务器上的经编码视频数据。
显示装置34可与目的地装置14集成或在目的地装置的外部。在一些实例中,目的地装置14可包含集成式显示装置,且也经配置以与外部显示装置介接。在其它实例中,目的地装置14可为显示装置。大体来说,显示装置34向用户显示经解码视频数据,且可包括多种显示装置中的任一者,例如液晶显示器(LCD)、等离子显示器、有机发光二极管(OLED)显示器或另一类型的显示装置。
视频编码器20及视频解码器30可根据例如HEVC的视频压缩标准操作,且可符合HEVC测试模型(HM)。被称作“HEVC工作草案10”或“HEVC WD10”的HEVC标准的工作草案描述于布罗斯(Bross)等人的“编者的对HEVC版本1的所提议校正(Editors'proposedcorrections to HEVC version 1)”(ITU-T SG16WP3及ISO/IEC JTC1/SC29/WG11的视频译码联合合作小组(JCT-VC)第13次会议,韩国仁川,2013年4月)。另一HEVC草案规范可从http://phenix.int-evry.fr/jct/doc_end_user/documents/15_Geneva/wg11/JCTVC-O1003-v2.zip.获得。本发明中所描述的技术也可根据当前正在开发中的HEVC标准的扩展而操作。
替代地或另外,视频编码器20及视频解码器30可根据其它专有或行业标准(例如,ITU-T H.264标准,替代地被称作MPEG-4第10部分高级视频译码(AVC))或这些标准的扩展而操作。然而,本发明的技术不限于任何特定译码标准。视频压缩标准的其它实例包含ITU-T H.261、ISO/IEC MPEG-1Visual、ITU-T H.262或ISO/IEC MPEG-2Visual、ITU-T H.263、ISO/IEC MPEG-4Visual及ITU-T H.264(也被称作ISO/IEC MPEG-4AVC),其包含可调式视频译码(SVC)及多视图视频译码(MVC)扩展。视频译码标准也包含专有视频编解码器(例如Google VP8、VP9、VP10)及由其它组织(例如,开放媒体联盟)开发的视频编解码器。
HEVC的设计已由ITU-T视频译码专家组(VCEG)及ISO/IEC运动图片专家组(MPEG)的JCT-VC定案。HEVC的范围扩展(被称作HEVC RExt)也正由JCT-VC开发。范围扩展的最近工作草案(WD)(下文中被称作RExt WD7)可从http://phenix.int-evry.fr/jct/doc_end_user/documents/17_Valencia/wg11/JCTVC-Q1005-v4.zip获得。
本发明大体上将最近定案的HEVC规范文本称为HEVC版本1或基础HEVC。范围扩展规范可变为HEVC的版本2。关于许多译码工具(例如,运动向量预测),HEVC版本1及范围扩展规范在技术上类似。因此,不论何时本发明描述相对于HEVC版本1的变化,相同变化也可适用于范围扩展规范,其大体上包含基础HEVC规范,加上一些额外译码工具。此外,可大体上假设HEVC版本1模组也可并入到实施HEVC范围扩展的解码器中。
例如JVET测试模型的新视频译码标准当前正被开发作为HEVC的后续。本发明将使用HEVC术语描述某些视频技术以易于解释。然而,应理解,此类技术不限于HEVC且可适用于除HEVC外的视频译码标准。
本发明大体上预期,源装置12的视频编码器20可经配置以根据这些当前或未来标准中的任一者编码视频数据。类似地,也大体上预期,目的地装置14的视频解码器30可经配置以根据这些当前或未来标准中的任一者解码视频数据。
尽管图1中未展示,但在一些方面中,视频编码器20及视频解码器30可各自与音频编码器及解码器集成,且可包含适当多路复用器-多路分用器(MUX-DEMUX)单元或其它硬件及软件,以处置共同数据流或单独数据流中的音频及视频两者的编码。如果适用,那么在一些实例中,多路复用器-多路分用器单元可符合ITU H.223多路复用器协议或其它协议(例如,用户数据报协议(UDP))。
视频编码器20及视频解码器30各自可实施为多种合适编码器电路中的任一者,例如,一或多个微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑、软件、硬件、固件或其任何组合。当所述技术部分地以软件实施时,装置可将用于软件的指令存储于合适的非暂时性计算机可读媒体中,且使用一或多个处理器执行硬件中的指令以执行本发明的技术。视频编码器20及视频解码器30中的每一者可包含于一或多个编码器或解码器中,编码器或解码器中的任一者可集成为各别装置中的组合式编码器/解码器(编码解码器(CODEC))的部分。
如上文所引入,JCT-VC最近已定案HEVC标准的开发。HEVC标准化努力是基于视频译码装置的演进模型(被称作HEVC测试模型(HM))。HM根据(例如)ITU-TH.264/AVC假定视频译码装置相对于现有装置的若干其它能力。举例来说,H.264提供九个帧内预测编码模式,HM可提供多达三十五个帧内预测编码模式。
在HEVC及其它视频译码规范中,视频序列通常包含一系列图片。图片也可被称作“帧”。图片可包含三个样本阵列,表示为SL、SCb及SCr。SL为明度样本的二维阵列(即,块)。SCb为Cb彩度(chrominance)样本的二维阵列。SCr为Cr彩度样本的二维阵列。彩度样本也可在本文中被称作“色度(chroma)”样本。在其它情况下,图片可为单色的且可仅包含明度样本的阵列。
为产生图片的经编码表示,视频编码器20可产生译码树型单元(CTU)的集合。CTU中的每一者可包括明度样本的译码树型块、色度样本的两个对应译码树型块及用以对译码树型块的样本译码的语法结构。在单色图片或具有三个单独色彩平面的图片中,CTU可包括单一译码树型块及用以对译码树型块的样本译码的语法结构。译码树型块可为样本的N×N块。CTU也可被称作“树型块”或“最大译码单元”(LCU)。HEVC的CTU可广泛地类似于例如H.264/AVC的其它标准的宏块。然而,CTU未必限于特定大小且可包括一或多个译码单元(CU)。图块可包含以光栅扫描次序连续排序的整数数目个CTU。
为产生经译码CTU,视频编码器20可对CTU的译码树型块递回地执行四分树分割,以将译码树型块划分成译码块,因此名称为“译码树型单元”。译码块可为样本的N×N块。CU可包括明度样本的译码块及具有明度样本阵列、Cb样本阵列及Cr样本阵列的图片的色度样本的两个对应译码块,以及用以对译码块的样本译码的语法结构。在单色图片或具有三个单独色彩平面的图片中,CU可包括单一译码块及用以对译码树型块的样本译码的语法结构。
视频编码器20可将CU的译码块分割为一或多个预测块。预测块可其上应用相同预测的样本的矩形(即,正方形或非正方形)块。CU的预测单元(PU)可包括明度样本的预测块、色度样本的两个对应预测块及用以预测所述预测块的语法结构。在单色图片或具有三个单独色彩平面的图片中,PU可包括单一预测块及用以预测所述预测块的语法结构。视频编码器20可产生用于CU的每一PU的明度预测块、Cb预测块及Cr预测块的预测性明度块、预测性Cb块及预测性Cr块。
视频编码器20可使用帧内预测或帧间预测以产生用于PU的预测性块。如果视频编码器20使用帧内预测产生PU的预测性块,那么视频编码器20可基于与PU相关联的图片的经解码样本产生PU的预测性块。如果视频编码器20使用帧间预测产生PU的预测性块,那么视频编码器20可基于除与PU相关联的图片外的一或多个图片的经解码样本产生PU的预测性块。
在视频编码器20产生用于CU的一或多个PU的预测性明度块、预测性Cb块及预测性Cr块之后,视频编码器20可产生CU的明度残余块。CU的明度残余块中的每一样本指示CU的预测性明度块中的一者中的明度样本与CU的原始明度译码块中的对应样本之间的差异。另外,视频编码器20可产生用于CU的Cb残余块。CU的Cb残余块中的每一样本可指示CU的预测性Cb块中的一者中的Cb样本与CU的原始Cb译码块中的对应样本之间的差异。视频编码器20也可产生用于CU的Cr残余块。CU的Cr残余块中的每一样本可指示CU的预测性Cr块中的一者中的Cr样本与CU的原始Cr译码块中的对应样本之间的差异。
此外,视频编码器20可使用四分树分割以将CU的明度残余块、Cb残余块及Cr残余块分解为一或多个明度变换块、Cb变换块及Cr变换块。变换块其上应用相同变换的样本的矩形(例如,正方形或非正方形)块。CU的变换单元(TU)可包括明度样本的变换块、色度样本的两个对应变换块及用以对变换块样本进行变换的语法结构。因此,CU的每一TU可与明度变换块、Cb变换块及Cr变换块相关联。与TU相关联的明度变换块可为CU的明度残余块的子块。Cb变换块可为CU的Cb残余块的子块。Cr变换块可为CU的Cr残余块的子块。在单色图片或具有三个单独色彩平面的图片中,TU可包括单一变换块及用以对变换块的样本进行变换的语法结构。
视频编码器20可将一或多个变换应用到TU的明度变换块以产生用于TU的明度系数块。系数块可为变换系数的二维阵列。变换系数可为标量。视频编码器20可将一或多个变换应用到TU的Cb变换块以产生用于TU的Cb系数块。视频编码器20可将一或多个变换应用到TU的Cr变换块以产生用于TU的Cr系数块。
在产生系数块(例如,明度系数块、Cb系数块或Cr系数块)之后,视频编码器20可量化系数块。量化大体上指量化变换系数以可能减少用以表示变换系数的数据的量从而提供进一步压缩的过程。在视频编码器20量化系数块之后,视频编码器20可熵编码指示经量化变换系数的语法元素。举例来说,视频编码器20可对指示经量化的变换系数的语法元素执行上下文自适应二进制算术译码(CABAC)。
视频编码器20可输出包含形成经译码图片及相关联数据的表示的一连串位的位流。位流可包括一连串NAL单元。NAL单元为含有NAL单元中的数据类型的指示及含有所述数据的位组的语法结构,所述位组呈RBSP形式,视需要与模拟防止位穿插。NAL单元中的每一者包含NAL单元标头且囊封RBSP。NAL单元标头可包含指示NAL单元类型码的语法元素。通过NAL单元的NAL单元标头指定的NAL单元类型码指示NAL单元的类型。RBSP可为含有囊封于NAL单元内的整数数目个位组的语法结构。在一些情况下,RBSP包含零个位。
不同类型的NAL单元可囊封不同类型的RBSP。举例来说,第一类型的NAL单元可囊封用于PPS的RBSP,第二类型的NAL单元可囊封用于经译码图块的RBSP,第三类型的NAL单元可囊封用于SEI消息的RBSP,等等。囊封用于视频译码数据的RBSP(与用于参数集及SEI消息的RBSP相反)的NAL单元可被称作VCL NAL单元。
视频解码器30可接收由视频编码器20产生的位流。另外,视频解码器30可剖析位流以从位流获得语法元素。视频解码器30可至少部分地基于从位流获得的语法元素而重建构视频数据的图片。重建构视频数据的过程可大体上与由视频编码器20执行的过程互逆。另外,视频解码器30可反量化与当前CU的TU相关联的系数块。视频解码器30可对系数块执行反变换以重建构与当前CU的TU相关联的变换块。通过将用于当前CU的PU的预测性块的样本添加到当前CU的TU的变换块的对应样本,视频解码器30可重建构当前CU的译码块。通过重建构用于图片的每一CU的译码块,视频解码器30可重建构图片。
为增加包含于MPM候选列表中的帧内预测模式的多样性,本发明描述用于在MPM候选列表中包含来自邻近块的帧内预测模式的技术以及用于在MPM候选列表中包含默认及经导出候选的技术。本发明的技术可通过增加用以编码视频数据块的实际帧内预测模式将为最可能模式的概率而改良与发信号帧内预测模式相关联的译码效率。由于发信号最可能模式通常需要比发信号非最可能模式少的位,使用以编码视频数据块的实际帧内预测模式更加频繁地作为最可能模式可减小与发信号帧内预测模式相关联的发信号间接负担。
本发明中描述的技术可用以产生任何大小的MPM候选列表(在本文中一般被称作大小N)。在一些实例中,N可等于6,如当前在JVET中所预期,但也可使用用于N的其它较大或较小值。本发明的技术不限于N的任何特定值。
图2展示HEVC中所使用的帧内预测模式的实例。HEVC的35个帧内预测模式包含33个定向模式(在图2中用模式索引2到34展示)加两种被称作DC模式的无定向模式(图2中的模式索引1)及平面模式(图2中的模式索引0)。本发明的技术可应用于任何数目个用于帧内预测的定向模式。例如,如在HEVC中所使用的模式的数目可为35,或为63、66,或可为一些其它大于35的模式数目,如经预期用于HEVC的后续。所描述的技术可应用于例如仅一个亮度分量或仅一个色度分量的仅一个所选择的色彩分量的帧内预测模式译码,或可应用于全部可用色彩分量(明度及色度两者),或以任何其它组合应用。
根据本发明的技术,例如视频编码器20或视频解码器30的视频译码器可检查邻近块群组中的三个或多于三个邻近块以识别帧内预测模式以添加到用于当前块的MPM候选列表。如果使用帧内预测模式译码邻近块,那么视频译码器可添加用以译码邻近块的帧内预测模式到用于当前块的MPM候选列表。通过视频译码器检查的邻近块的位置可相对于当前块固定。例如,邻近块的位置可为左(L)块、上(A)块、左下(BL)块、右上(AR)块及/或左上(AL)块。也可使用其它邻近块。添加来自邻近块的帧内预测模式到MPM候选列表中的次序可为固定的或可变化的,例如所述次序可取决于当前块大小、块是否具有例如矩形或正方形的某一形状或基于上下文信息。
提供五个邻近位置作为实例,但在使用所描述的技术建构MPM候选列表中可考虑更少或更多邻近块。图3E中展示使用多于五个位置的实例。
邻近块的位置可由子块大小表示,例如4×4,意谓存储帧内预测模式信息的粒度。在另一实例中,帧内预测模式信息可为经每像素或针对例如8×8的较大块指定。如果次取样色度而与亮度分量比较(例如色彩格式为4:2:0),那么所述色度分量子块位置可为较小,例如2×2,其可对应于明度4×4。
在一些实例中,取决于邻近块大小,所述位置可属于同一块。例如,如果邻近块为16×16且当前经译码块为8×8,那么左上方及左方的位置可对应于同一16×16的邻近块,其中帧内预测模式信息在那些位置将为相同的。
邻近位置M的数目可等于MPM候选列表大小N,但可能较小或较大。在一个实例中,数目M可始终小于N以分配一些空间来将其它类型的帧内预测模式包含于MPM候选列表中。位置的数目可能取决于当前及/或邻近块的特征,例如块大小、块为正方形抑或矩形、长方形块是否为水平块(即,宽度大于高度)、高度及宽度之间的比率、高度及宽度的较大及较小值之间的比率或块是否为竖直定向的块(宽度小于高度)。位置的数目也可取决于邻近块的预测模式(例如,帧内或帧间)。
在另一实例中,将帧内预测模式添加到MPM候选列表中的邻近块位置及帧内预测模式次序可为不同的。例如,某些块的次序可不同且可取决于(例如)当前块大小、当前块为正方形抑或矩形、当前块为竖直定向的(宽度小于高度)抑或水平定向的(宽度大于高度)。
在另一实例中,所述位置及帧内预测模式次序可能取决于邻近块特征。所述特征(例如)可为具有邻近块大小的邻近块预测模式(帧内或帧间)、邻近块为正方形抑或矩形、邻近块是否为竖直定向的(宽度小于高度)、高度及宽度之间的比率、高度及宽度的较大及较小值之间的比率,或是否为水平定向(宽度大于高度)。
在另一实例中,邻近块相对于当前块的位置可与合并或高级运动向量预测(AMVP)帧间预测模式中相同。此统一可具有实施益处,因为相同函数可再用于帧间及帧内预测模式。
大体来说,视频译码器可从不同MPM类型产生MPM候选列表。所述不同类型可包含(但不限于)基于邻近的帧内预测模式、经导出帧内预测模式及默认帧内预测模式。基于邻近的帧内预测模式指示用于邻近块的帧内预测模式。默认帧内预测模式指不随邻近块变化的恒定帧内预测模式。所述默认帧内预测模式可为(例如)平面模式、DC模式、水平模式或竖直模式。经导出帧内预测模式指基于是基于邻近的帧内预测模式或默认帧内预测模式导出的帧内预测模式。例如,经导出帧内预测模式可为基于邻近的帧内预测模式±1、±2,等等。经导出帧内预测模式也可由另一现有的经导出帧内预测模式产生。经导出帧内预测模式可不为邻近块的实际帧内预测模式,而实际上可为从邻近块的实际帧内预测模式导出或以一些其它方式导出的帧内预测模式。
视频译码器可根据帧内预测模式类型添加帧内预测模式到MPM候选列表。作为一个实例,视频译码器可首先添加基于邻近的帧内预测模式,随后添加经导出模式,并接着添加默认模式。在另一实例中,视频译码器可以交错方式添加不同类型的帧内预测模式。例如,视频译码器可在添加特定数目个基于邻近的帧内预测模式到列表之后添加一或多个默认模式。例如,视频译码器可添加两种基于邻近的模式,随后两种默认模式,接着添加更多基于邻近的帧内预测模式。
图3A到3E展示邻近块的位置的实例,一些实例经展示,块可为矩形或正方形。图3C展示与合并/AMVP模式统一的实例。图3D展示关于较大数目的邻近位置的实例。也可使用一些于左方或上方上的中心位置(图式上未展示)。
现将描述MPM候选列表建构及经导出模式的方面。当基于邻近的帧内预测模式被视为包含于MPM候选列表中时,仅可向所述列表中添加独特帧内预测模式。例如,如果各邻近块具有已经添加到MPM候选列表的相同帧内预测模式,那么不向所述列表中再次添加此类模式。
视频译码器可仅添加特定数目(K)个基于邻近的帧内预测模式到大小为N的MPM候选列表。例如,可考虑M个邻近位置,但仅K(其可小于M)数目个基于邻近的帧内预测模式可添加到MPM候选列表。例如,视频译码器可以某一次序从某些位置添加基于邻近的帧内预测模式,且一旦经添加的邻近模式的数目已达到K个模式,视频译码器可阻止添加基于邻近的帧内预测模式到MPM候选列表。在一些实例中,K可表示独特模式的数目且未必为所考虑模式的数目。换句话说,如果考虑重复模式(例如,两个邻近块具有相同帧内预测模式),那么视频译码器可仅添加所述模式的一个实例到MPM候选列表。仅添加K个基于邻近的帧内预测模式到MPM候选列表可保留MPM候选列表中用于其它类型的模式(例如下文将更详细地描述的经导出帧内预测模式及/或默认帧内预测模式)的空间。
在视频译码器将来自邻近块的帧内预测模式添加到MPM候选列表之后,MPM候选列表可能仍不完整(模式的数目小于N),是因为例如一些模式为相同的且未添加到列表。然而,要求MPM候选列表必须始终为完整的,例如大小为N。
在此情况下,需要添加帧内预测模式到列表。那些其它模式可分类为两种类型:从已添加到MPM候选列表中的帧内预测模式导出的帧内预测模式及默认帧内预测模式。
经导出帧内预测模式为从已添加到MPM候选列表中的帧内预测模式导出的模式。例如,经导出帧内预测模式可为通过添加某一偏差到来自MPM候选列表的模式而获得的模式。所述偏差可为-+1、-+2等。所述偏差值可取决于如上文所解释的当前或邻近块特征。
当多于一个偏差值意欲用以导出帧内预测模式时,可以某一次序来应用所述偏差。所述次序可取决于(例如)块特征。例如,在开始时,将第一偏差应用于全部已添加到MPM候选列表中的帧内预测模式,随后将第二偏差值应用于已添加到MPM候选列表中的模式,等等。
在另一实例中,将全部偏差值应用于来自MPM候选列表的第一帧内预测模式,随后将全部偏差值应用于来自MPM候选列表的第二帧内预测模式,等等。
在另一实例中,在以上实例中,可用偏差集合替换偏差值。例如,偏差集合可由具有相同量值的偏差值组成。例如,-+1可为一个偏差集合,-+2可为第二偏差集合,等等。在另一实例中,偏差集合可由具有相同正负号的偏差值组成。例如,+1、+2……可为一个集合,而-1、-2……为第二集合。以上两个实例可经组合。在另一实例中,偏差集合可组合为来自全部可能偏差值的子集,其中子集(例如)可取决于所述偏差将应用于的帧内预测模式。例如,帧内预测模式可具有偏差值的某一子集,且另一帧内预测模式可具有可与第一子集不同的另一偏差值的子集。
可不将偏差值应用于某一帧内预测模式,例如不将偏差应用于例如DC、平面(PLANAR)或LM模式的非角模式,可不将偏差应用于经导出或默认帧内预测模式。
产生经导出模式的另一方法可为旋转的。例如,可通过使所述模式旋转某一角度而从基于邻近的帧内预测模式产生经旋转导出的模式。所述角度可为(例如)45、90或180度或任何其它值。例如,如果旋转角度等于90度且邻近模式为水平帧内预测模式,那么经导出模式可为竖直模式。作为另一实例,如果邻近模式为水平模式,那么经导出模式为竖直模式。可将同一技术应用于其它定向模式或旋转角度。
可将旋转仅应用于某些邻近模式,例如,可不将旋转应用于非角模式。在另一实例中,旋转用法可取决于上文所描述的当前或邻近块特征。例如,如果当前或邻近块具有矩形形状,那么旋转仅可应用于所述模式。
在一些实施中,可仅添加独特经导出模式到列表。因此,如果等于经导出帧内预测模式的帧内预测模式已添加到MPM候选列表,那么可不添加所述经导出模式到MPM候选列表。在一些实施中,可仅添加特定数目个经导出模式到MPM候选列表。所述数目可为固定的。在另一实例中,添加到所述列表中的经导出模式的数目可等于MPM候选列表大小N减去来自邻近块M的模式的数目。大体来说,可保持添加经导出模式直到MPM候选列表不完整为止。
在一些译码情境中,来自邻近块的帧内预测模式及经导出模式可能不足以完成MPM候选列表。在一个实例中,可存在译码情境,其中不存在可从邻近块获得的帧内预测模式,因为(例如)当前块位于图片边界处或全部邻近块经帧间译码。在此情况下,经导出模式可不为可用的。
为完成MPM候选列表,可添加默认帧内预测模式到所述列表。默认帧内预测模式的数目可能必须等于所需MPM候选列表大小,是因为整个MPM候选列表可由默认模式组成。然而,在已存在一些在MPM候选列表中经识别的模式的实例中,包含默认帧内预测模式可保证MPM候选列表为完整的。
默认模式可基本上为可能帧内预测模式的子集,且那些模式可为独特的。所选择用于默认模式的帧内预测模式可为固定的,或可取决于当前或邻近块特征。
在另一实例中,某些模式可始终以默认模式添加。此类模式可为(例如)平面、DC、竖直模式、水平模式、对角模式,例如,左方(从块的左上角到右下角)或右方(从块的右上角到左下角)的对角模式。默认模式及默认模式添加到MPM候选列表中的次序可为固定的或可取决于当前块的特征及/或邻近块的特征。
在一个实例中,默认模式列表可为平面、DC、竖直、水平、左对角、右对角。在另一实例中,默认模式列表可为平面、DC、竖直、水平、竖直减1、水平减1。对于色度分量,默认模式可为DM或LM模式。此外,一或多个经导出默认模式可在编码及解码期间保持及更新,默认模式可为先前经译码的块中最常使用的模式。可将经导出默认模式以当产生MPM候选列表时用经导出默认模式替换一或多个默认模式的方式应用。
在另一实例中,可通过应用上文所描述的用于获得经导出模式的偏差或旋转技术从较小模式列表导出用于完整默认模式列表。此外,可能要求默认模式列表应仅包含独特帧内预测模式。
在另一实例中,在某些邻近位置之前或在特定数目个基于邻近的帧内预测模式已包含于MPM候选列表之后可添加一些默认模式到所述列表,例如,在两个基于邻近的帧内预测模式之后添加一些默认帧内预测模式。
在一个实例中,添加可为独特、相等或不可用的左方及上方帧内预测模式到MPM候选列表,并接着添加例如平面或DC的非角默认模式到MPM候选列表。在添加默认模式到MPM候选列表中之后,添加根据邻近块次序的更多基于邻近的帧内预测模式到MPM候选列表。又,在一些实施中,仅添加独特模式到所述列表。添加模式的交错方式可取决于当前及邻近块特征。
现将描述用于MPM模式的上下文模型化的方面。如下文将参考图9及10更详细地解释,用于熵译码的上下文模型可影响通过熵译码程序达成的数据压缩。因此,上下文模型化可影响通过视频编码器达成的整体压缩。本发明描述用于选择上下文模型以用于发信号可改良整体视频压缩的帧内预测模式的技术。
如果待译码的当前帧内预测模式等于MPM模式中的一者,那么视频译码器可使用对应于MPM模式的经上下文译码的二进位发信号当前帧内预测。举例来说,待发信号的二进位可由二进制化定义,且二进制化可为例如一元、截断一元、固定二进制、哥伦布(Golomb)、指数哥伦布(Exponential Golomb)、莱斯(Rice)及任何其它二进制化的任何码字导出方案而无限制。可将二进制化应用于MPM索引,例如来自MPM候选列表某一位置处的MPM模式,所述当前帧内预测模式等于所述MPM模式。可以位流发信号此索引。二进制化表示中的每一二进位或特定数目个二进位可经上下文译码,所述上下文可根据MPM模式的分类导出。
例如,在一元或截断一元二进制化或类似二进制化中,每一二进位对应于来自MPM候选列表的每一模式,例如0表示当前模式不等于来自MPM候选列表的模式,且1表示当前模式等于MPM模式。接着,每一二进位或特定数目的第一二进位可经上下文译码,且上下文取决于对应的MPM模式分类。
作为一个实例,MPM候选列表可由{HOR,VER,PLANAR,DC,DIAG_LEFT,DIAG_RIGHT}模式组成。且使待译码的当前帧内预测模式等于平面模式,例如,MPM索引为2以发信号。如果二进制化为截断一元,那么二进制化码字为对应于索引2的001,最大值等于5。
001:0(对应于MPM0)0(对应于MPM1)1(对应于MPM2).
MPM0=HOR,MPM1=VER,MPM2=PLANAR,……
可见,每一二进位对应于来自列表的某一MPM模式,且导出二进位的上下文根据MPMi分类,在此实例中i=0..2。在此实例中,MPM0相关上下文可用于模式的水平集合,MPM1相关上下文可用于模式的竖直集合,且MPM2相关上下文可用于模式的非角集合。
MPM模式的分类可(例如)基于帧内预测模式为角模式抑或非角模式抑或根据例如竖直或水平集合的角方向。
在另一实例中,可将全部帧内预测模式分类为三个集合:非角、水平或竖直集合。竖直集合可为(例如)闭合到竖直方向的帧内预测模式,例如与竖直方向成-+45度角的模式,水平集合经类似地导出为与水平方向成-+45度角的模式。
图4展示MPM模式分类的实例(一个集合为水平集合、一个集合为竖直集合且一个集合为非角集合。对角模式(例如模式18,其包含模式2、34及另一实例中的类似模式)可分类为水平或竖直集合或可包含于分隔的对角集合中)。
在另一实例中,全部角方向可分成多于水平或竖直集合。例如,角模式可均一地分成一些数目的集合。每一帧内预测模式可分类为所述集合中的一者,例如分类为在某一角度范围内。在另一实例中,每一集合可仅包含一种帧内预测模式,且所述选择可为帧内模式特有的。
现将描述使用帧内预测模式分类及一般化为最可能模式向量(MPMV)的上下文模型化的方面。可将上文所描述的帧内预测模式分类应用于块的帧内预测模式且可用以发信号其它帧内相关的语法元素。其可用于在帧内预测模式经译码之后(即,当帧内预测模式在解码器处已知时)应用或发信号的任何方法或语法元素。
举例来说,分别定义待用于块中的帧内预测的预测及变换的类型的PDPC及/或NSST索引可基于帧内预测模式分类使用上下文模型化发信号。对于分类中的每一集合,可使用单独的上下文。
熵译码可利用待使用上文所描述的基于上下文的技术译码的元素之间的统计相依性。另一方法是基于组合数据及将数据一起译码。例如,代替使用仅预测模式(MPM)的列表,可产生相关帧内预测信息的向量,其被称作最可能模式向量(MPMV)。例如,MPMV中的元素可含有以下信息及索引
[预测模式、PDPC选择、NSST选择]
先前部分中描述的用于处理及译码MPM的技术可经扩展用于MPMV,且例如,单个二进制符号可指示向量中的全部元素是否等于MPMV列表中的一个条目。或者,一个二进制符号可指示所述元素中的至少两者是否相等,等等。
这些扩展对应于向量信息的替代二进制化,但在完全地译码另一类型的信息后,比受限于仅译码一种类型的信息的那些扩展更通用,因为其允许同时译码关于全部元素的部分信息。
在当前JEM中,将用于MPM索引译码的上下文分成3个群组,即平面及DC(非角集合)、水平集合(从左下到右上的对角方向的模式到对角模式(包括在内)),及竖直集合(从所述对角模式到右上到左下的对角方向)。可基于帧内MPM模式方向及/或当前块形状,及/或MPM候选列表中的MPM模式的数目改进上下文集合。
举例来说,如果帧内预测模式的总数大于HEVC中所使用的35个模式,例如67个模式,那么用于MPM索引的上下文可以上下文模型取决于距优选帧内预测模式的距离(例如竖直或水平方向)的方式分组,例如,如下表中所展示。
帧内预测模式 0、1 2到5 6到12 13到21 22到28 29到34
上下文模型索引 0 1 2 3 2 1
帧内预测模式 35到38 39到45 46到54 55到61 62到67
上下文模型索引 1 2 3 2 1
更大体来说,可根据特定MPM模式(具有特定MPM索引的模式)距默认或预选择帧内预测模式的距离(换句话说,当前MPM模式距默认模式多远)来指派用以译码MPM索引的上下文。那些默认模式可为(例如)水平、竖直、对角或任何其它方向。
图5为说明可实施本发明中所描述的技术的实例视频编码器20的框图。视频编码器20可执行视频图块内的视频块的帧内及帧间译码。帧内译码依赖于空间预测以减少或移除给定视频帧或图片内的视频中的空间冗余。帧间译码依赖于时间预测以减小或移除视频序列的邻近帧或图片内的视频中的时间冗余。帧内预测模式(I模式)可指若干基于空间的压缩模式中的任一者。
在图5的实例中,视频编码器20包含视频数据存储器40、预测处理单元41、经解码图片缓冲器(DPB)64、求和器50、变换处理单元52、量化单元54及熵编码单元56。预测处理单元41包含分割单元35、运动估计单元42、运动补偿单元44、帧内BC单元48及帧内预测处理单元46。为了视频块重建构,视频编码器20也包含反量化单元58、反变换处理单元60及求和器62。回路内滤波器(未描绘)可定位于求和器62与DPB 64之间。
在各种实例中,可向视频编码器20的固定或可编程硬件单元分派任务以执行本发明的技术。此外,在一些实例中,本发明的技术可在图5中所示的视频编码器20的所说明的固定或可编程硬件单元中的一或多者中被划分,但其它装置也可执行本发明的技术。
视频数据存储器40可存储待由视频编码器20的组件编码的视频数据。可(例如)从视频源18获得存储于视频数据存储器40中的视频数据。DPB 64为存储参考视频数据以供视频编码器20在(例如,以帧内或帧间译码模式,也被称作帧内或帧间预测译码模式)编码视频数据时使用的缓冲器。视频数据存储器40及DPB 64可由多种存储器装置中的任一者形成,例如动态随机存取存储器(DRAM),包含同步DRAM(SDRAM)、磁阻式RAM(MRAM)、电阻式RAM(RRAM)或其它类型的存储器装置。视频数据存储器40及DPB 64可由同一存储器装置或单独存储器装置提供。在各种实例中,视频数据存储器40可与视频编码器20的其它组件一起在芯片上,或相对于那些组件在芯片外。
如图5中所示,视频编码器20接收视频数据,且分割单元35将数据分割成视频块。此分割也可包含分割成图块、图案块或其它较大单元,以及(例如)根据LCU及CU的四分树结构的视频块分割。视频编码器20大体上说明编码待编码的视频图块内的视频块的组件。可将图块划分成多个视频块(且可能划分成被称作图案块的视频块集合)。预测处理单元41可针对当前视频块基于误差结果(例如,译码速率及失真位准)选择多个可能译码模式中的一者,例如,多个帧内译码模式中的一者或多个帧间译码模式中的一者。预测处理单元41可将所得经帧内或帧间译码块提供到求和器50以产生残余块数据并提供到求和器62以重建构经编码块以用作参考图片。
预测处理单元41内的帧内预测处理单元46可执行当前视频块相对于与待译码的当前块在相同帧或图块中的一或多个相邻块的帧内预测性译码以提供空间压缩。预测处理单元41内的运动估计单元42及运动补偿单元44执行当前视频块相对于一或多个参考图片中的一或多个预测性块的帧间预测性译码以提供时间压缩。
运动估计单元42可经配置以根据视频序列的预定图案来确定用于视频图块的帧间预测模式。预定图案可将序列中的视频图块指定为P图块或B图块。运动估计单元42及运动补偿单元44可高度集成,但出于概念目的而分开说明。由运动估计单元42执行的运动估计为产生运动向量的过程,所述运动向量估计视频块的运动。运动向量(例如)可指示当前视频帧或图片内的视频块的PU相对于参考图片内的预测性块的位移。帧内BC单元48可以类似于运动估计单元42确定运动向量来进行帧间预测的方式确定用于帧内BC译码的向量(例如,块向量),或可利用运动估计单元42确定所述块向量。
预测性块为就像素差来说被发现紧密地匹配待译码的视频块的PU的块,所述像素差可由绝对差和(SAD)、平方差和(SSD)或其它差度量确定。在一些实例中,视频编码器20可计算存储于DPB 64中的参考图片的次整数像素位置的值。举例来说,视频编码器20可内插参考图片的四分之一像素位置、八分之一像素位置或其它分数像素位置的值。因此,运动估计单元42可执行相对于全像素位置及分数像素位置的运动搜寻并输出具有分数像素精确度的运动向量。
运动估计单元42通过比较PU的位置与参考图片的预测性块的位置而计算经帧间译码图块中的视频块的PU的运动向量。参考图片可选自第一参考图片列表(列表0)或第二参考图片列表(列表1),所述参考图片列表中的每一者识别存储于DPB 64中的一或多个参考图片。运动估计单元42将所计算的运动向量发送到熵编码单元56及运动补偿单元44。
在一些实例中,帧内BC单元48可以类似于上文关于运动估计单元42及运动补偿单元44所描述的方式产生向量并提取预测性块,但其中预测性块与当前块在同一图片或帧中,且所述向量被称作块向量,与运动向量形成对照。在其它实例中,帧内BC单元48可使用运动估计单元42及运动补偿单元44以完整或部分地执行根据本文中所描述的技术的帧内BC预测的这些功能。在任一情况下,对于帧内BC,预测性块可为就像素差来说被发现紧密地匹配待译码的块的块,所述像素差可由绝对差和(SAD)、平方差和(SSD)或其它差度量确定,且所述块的识别可包含计算次整数像素位置的值。
由运动补偿单元44执行的运动补偿可涉及基于由运动估计确定的运动向量而提取或产生预测性块,可能执行内插达子像素精确度。在接收到当前视频块的PU的运动向量之后,运动补偿单元44可在参考图片列表中的一者中定位运动向量所指向的预测性块。视频编码器20通过从正经译码的当前视频块的像素值减去预测性块的像素值来形成残余视频块,从而形成像素差值。像素差值形成用于块的残余数据,且可包含明度差分量及色度差分量两者。求和器50表示执行此减法运算的一或多个组件。运动补偿单元44也可产生与视频块及视频图块相关联的语法元素以供视频解码器30在解码视频图块的视频块时使用。
不管预测性视频块是来自根据帧内BC预测的同一图片抑或根据帧间预测的不同图片,视频编码器20可通过从正经译码的当前视频块的像素值减去预测性块的像素值而形成像素差值来形成残余视频块。像素差值形成用于块的残余数据且可包含明度分量差及色度分量差两者。求和器50表示执行此减法运算的一或多个组件。帧内BC单元48及/或运动补偿单元44也可产生与视频块及视频图块相关联的语法元素以供由视频解码器(例如视频解码器30)在解码视频图块的视频块时使用。所述语法元素可包含(例如)定义用以识别预测性块的向量的语法元素、指示预测模式的任何旗标或关于本发明的技术所描述的任何其它语法。
帧内预测处理单元46可对当前块进行帧内预测,作为由运动估计单元42及运动补偿单元44执行的帧间预测或由帧内BC单元48执行的帧内BC预测的替代方案,如上文所描述。特定来说,帧内预测处理单元46可确定帧内预测模式(包含帧内BC模式)以用于对当前块进行编码。在一些实例中,帧内预测处理单元46可(例如)在单独编码遍次期间使用各种帧内预测模式来对当前块进行编码,且帧内预测处理单元46(或在一些实例中为模式选择单元)可从所测试模式选择适当帧内预测模式来使用。作为确定帧内预测模式的部分,帧内预测处理单元46可根据本发明的技术建构MPM候选列表。帧内预测处理单元可选择MPM候选列表中的帧内预测模式或不在MPM候选列表中的非最可能模式作为用于特定块的帧内预测模式。
帧内预测处理单元46可(例如)使用针对各种所测试帧内预测模式的速率-失真分析来计算速率-失真值,且在所测试模式间选择具有最佳速率-失真特性的帧内预测模式。速率-失真分析大体上确定经编码块与原始未经编码块(其经编码以产生经编码块)之间的失真(或误差)量,以及用以产生经编码块的位速率(即,位的数目)。帧内预测处理单元46可从各种经编码块的失真及速率计算比率以确定哪种帧内预测模式展现所述块的最佳速率-失真值。
在任何情况下,在选择用于块的帧内预测模式之后,帧内预测处理单元46可将指示用于块的所选帧内预测模式的信息提供到熵编码单元56。熵编码单元56可根据本发明的技术对指示所选帧内预测模式的信息进行编码。对于使用帧内预测模式编码的块,熵编码单元56可(例如)选择用于编码指示实际帧内预测模式是否为MPM候选列表中的模式的信息的一或多个上下文。
在预测处理单元41经由帧间预测抑或帧内预测产生当前视频块的预测性块之后,视频编码器20通过从当前视频块减去预测性块而形成残余视频块。残余块中的残余视频数据可包含于一或多个TU中且应用于变换处理单元52。变换处理单元52使用例如离散余弦变换(DCT)或概念上类似的变换的变换将残余视频数据变换为残余变换系数。变换处理单元52可将残余视频数据从像素域转换到变换域(例如,频域)。
变换处理单元52可将所得变换系数发送到量化单元54。量化单元54量化变换系数以进一步减小位速率。所述量化过程可减小与所述系数中的一些或所有相关联的位深度。可通过调整量化参数来修改量化程度。在一些实例中,量化单元54接着可执行对包含经量化的变换系数的矩阵的扫描。替代地,熵编码单元56可执行扫描。
在量化之后,熵编码单元56对经量化变换系数进行熵编码。举例来说,熵编码单元56可执行上下文自适应可变长度译码(CAVLC)、上下文自适应二进制算术译码(CABAC)、基于语法的上下文自适应二进制算术译码(SBAC)、概率区间分割熵(PIPE)译码或另一熵编码方法或技术。在由熵编码单元56进行熵编码之后,可将经编码位流传输到视频解码器30,或加以存档以供稍后由视频解码器30传输或检索。熵编码单元56也可对正经译码的当前视频图块的运动向量及其它语法元素进行熵编码。
反量化单元58及反变换处理单元60分别应用反量化及反变换以重建构像素域中的残余块,以供稍后用作用于其它视频块的预测的参考块。运动补偿单元44及/或帧内BC单元48可通过将残余块添加到参考图片列表中的一者内的参考图片中的一者的预测性块来计算参考块。运动补偿单元44及/或帧内BC单元48也可将一或多个内插滤波器应用到重建构残余块,以计算用于运动估计的次整数像素值。
求和器62将经重构建的残余块添加到由运动补偿单元44产生的运动补偿预测块以产生参考块以用于存储于DPB 64中。参考块可由帧内BC单元48、运动估计单元42及运动补偿单元44用作参考块以对后续视频帧或图片中的块进行帧间预测。
视频编码器20表示用于编码视频数据的装置的实例,所述装置经配置以确定视频数据的当前块是以帧内预测模式译码、添加第一邻近块的帧内预测模式到用于当前块的MPM候选列表、添加用于第二邻近块的帧内预测模式到MPM候选列表、添加用于第三邻近块的帧内预测模式到最可能模式列表,及产生识别用以编码视频数据的当前块的实际帧内预测模式的信息。第一邻近块、第二邻近块及第三邻近块可各自对应于左块、上块、左下块、右上块或左上块中的一者。
视频编码器20可以固定次序检查邻近块群组以确定来自邻近块群组的邻近块是否经帧内译码。视频编码器20可以固定次序添加用以编码来自邻近块群组的邻近块的帧内预测模式到MPM候选列表。视频编码器20可检查邻近块群组中的一或多个邻近块以确定一或多个邻近块是否经帧内译码。邻近块群组中的邻近块的最大数目可小于MPM候选列表的条目的最大数目。视频编码器20可添加用以编码一或多个邻近块的帧内预测模式到MPM候选列表中。
视频编码器20可检查邻近块群组中的一或多个邻近块以确定一或多个邻近块是否经帧内译码,且响应于来自邻近块群组的两个邻近块是使用同一帧内预测模式译码,仅将相同帧内预测模式的一个实例包含在MPM候选列表中。为仅将相同帧内预测模式的一个实例包含在MPM候选列表中,视频编码器20可不添加相同帧内预测模式的第二实例到MPM候选列表。为仅将相同帧内预测模式的一个实例包含在MPM候选列表中,视频编码器20可从MPM候选列表移除相同帧内预测模式的实例。
视频编码器20可检查邻近块群组中的一或多个邻近块以识别帧内预测模式以添加到MPM候选列表。为检查邻近区的群组中的一或多个邻近块以识别帧内预测模式以添加到MPM候选列表,视频编码器20可确定所述一或多个邻近块是否使用帧内预测模式译码。当邻近块使用帧内预测模式译码时,视频编码器20可添加用以编码邻近块的帧内预测模式到MPM候选列表。
视频编码器20可基于以下各项中的一或多者确定邻近块群组中的邻近块的数目:当前块的大小、当前块为正方形块抑或矩形块、当前块为水平块抑或竖直块或用以编码邻近块群组中的邻近块的预测模式。视频编码器20可基于以下各项中的一或多者确定邻近块群组中的邻近块的位置:当前块大小的大小、当前块为正方形块抑或矩形块、当前块为竖直定向抑或水平定向、邻近块的大小、邻近块为正方形块抑或矩形块,或邻近块为竖直定向抑或水平定向。视频编码器20可基于以下各项中的一或多者确定用于检查邻近块群组中的邻近块的次序:当前块大小的大小、当前块为正方形块抑或矩形块、当前块为竖直定向抑或水平定向、邻近块的大小、邻近块为正方形块抑或矩形块或邻近块为竖直定向抑或水平定向。
邻近块群组可为用于AMVP模式或合并模式中的一或两者的同一邻近块群组。为检查邻近块群组中的一或多个邻近块以识别帧内预测模式以添加到MPM候选列表,视频编码器20可使用用以检查用于AMVP模式或合并模式的一或两者的邻近块的同一次序来检查一或多个邻近块。
响应于来自一或多个邻近块的添加到MPM候选列表的帧内预测模式的数目超出阈值数目,视频编码器20可终止对邻近块群组中的一或多个邻近块的检查。所述阈值数目可小于邻近块群组中的邻近块的数目。所述阈值数目可小于包含于MPM候选列表中的帧内预测模式的最大数目。
视频编码器20可添加一或多个经导出帧内预测模式到MPM候选列表。视频编码器20可基于邻近块的帧内预测模式确定所述一或多个经导出帧内预测模式。为基于邻近块的帧内预测模式确定所述一或多个经导出帧内预测模式,视频编码器20可添加具有邻近块的帧内预测模式的模式索引加偏差的帧内预测模式到MPM候选列表。
为基于邻近块的帧内预测模式确定一或多个经导出帧内预测模式,视频编码器20可添加第一偏差至第一邻近块的帧内预测模式以确定第一经导出帧内预测模式,添加第二偏差到第一邻近块的帧内预测模式以确定第二经导出帧内预测模式,及添加第一经导出帧内预测模式及第二经导出帧内预测模式到MPM候选列表。为基于邻近块的帧内预测模式确定一或多个经导出帧内预测模式,视频编码器20可添加第一偏差到第一邻近块的帧内预测模式以确定第一经导出帧内预测模式,添加第二偏差到第二邻近块的帧内预测模式以确定第二经导出帧内预测模式,及添加第一经导出帧内预测模式及第二经导出帧内预测模式到MPM候选列表。
视频编码器20可基于当前块的特征或邻近块的特征中的一或两者确定所述偏差。为基于邻近块的帧内预测模式确定一或多个经导出帧内预测模式,视频编码器20可添加具有大于邻近块的帧内预测模式的模式索引的模式索引1的帧内预测模式到MPM候选列表。为基于邻近块的帧内预测模式确定一或多个经导出帧内预测模式,视频编码器20可添加具有大于邻近块的帧内预测模式的模式索引的模式索引2的帧内预测模式到MPM候选列表。为基于邻近块的帧内预测模式确定一或多个经导出帧内预测模式,视频编码器20可添加具有小于邻近块的帧内预测模式的模式索引的模式索引1的帧内预测模式到MPM候选列表。为基于邻近块的帧内预测模式确定一或多个经导出帧内预测模式,视频编码器20可添加具有小于邻近块的帧内预测模式的模式索引的模式索引2的帧内预测模式到MPM候选列表。
响应于两个经导出帧内预测模式为相同帧内预测模式,视频编码器20可仅将经导出帧内预测模式的一个实例包含在MPM候选列表中。为仅将经导出帧内预测模式的一个实例包含在MPM候选列表中,视频编码器20可不添加经导出帧内预测模式的第二实例到MPM候选列表。为仅将经导出帧内预测模式的一个实例包含在MPM候选列表中,视频编码器20可从MPM候选列表移除经导出帧内预测模式的实例。
响应于添加到MPM候选列表的经导出帧内预测模式的数目超出经导出帧内预测模式的阈值数目,视频编码器20可终止经导出帧内预测模式的添加。经导出帧内预测模式的阈值数目加包含于MPM候选列表中的基于邻近的帧内预测模式的数目可小于包含于MPM候选列表中的帧内预测模式的最大数目。
视频编码器20可添加一或多个默认候选者到MPM候选列表。视频编码器20可响应于可用的基于邻近的帧内预测模式及经导出帧内预测模式的数目小于包含于MPM候选列表中的帧内预测模式的最大数目而添加一或多个默认候选者到MPM候选列表。为添加一或多个默认候选者到MPM候选列表,视频编码器20可添加一或多个默认候选者到MPM候选列表直至达到MPM候选列表中的帧内预测模式的数目等于包含于MPM候选列表中帧内预测模式的最大数目为止。
视频编码器20可添加一或多个基于邻近的帧内预测模式到MPM候选列表,且在添加全部一或多个基于邻近的帧内预测模式到MPM候选列表之后,添加一或多个默认帧内预测模式为MPM候选列表。在添加全部一或多个基于邻近的帧内预测模式到MPM候选列表之后,视频编码器20可添加一或多个默认帧内预测模式到MPM候选列表。
视频编码器20可添加一或多个基于邻近的帧内预测模式到MPM候选列表,且在添加全部一或多个基于邻近的帧内预测模式到MPM候选列表之后,添加一或多个默认帧内预测模式到MPM候选列表。在添加全部一或多个基于邻近的帧内预测模式到MPM候选列表之后,视频编码器20可添加一或多个经导出帧内预测模式到MPM候选列表。在添加全部一或多个基于邻近的帧内预测模式到MPM候选列表之后,视频编码器20可添加一或多个默认帧内预测模式到MPM候选列表。在添加第一邻近块的帧内预测模式到用于当前块的MPM候选列表之后,视频编码器20可添加第一经导出候选者到MPM候选列表,且在添加第一经导出候选者到MPM候选列表之后,视频编码器20可添加用于第二邻近块的帧内预测模式到MPM候选列表。
在一些情况下,用以编码视频数据的当前块的实际帧内预测模式可为来自MPM候选列表的帧内预测模式。在一些情况下,用以编码视频数据的当前块的实际帧内预测模式可为非最可能模式。
识别用以编码视频数据的当前块的实际帧内预测模式的信息可为经上下文译码的索引值,其识别MPM候选列表中的帧内预测模式中的一者,且视频编码器20可使用本发明中所描述的任何技术或任何其它技术编码所述经上下文译码的索引值。
视频编码器20还表示用于编码视频数据的装置的实例,所述装置经配置以检查邻近块群组中的三个或多于三个邻近块以识别帧内预测模式以添加到用于当前块的MPM候选列表及使用帧内预测模式编码当前块。视频编码器20可以固定次序检查邻近块群组以确定来自邻近块群组的邻近块是否经帧内译码。视频编码器20可以固定次序添加用以编码来自邻近块群组的邻近块的帧内预测模式到MPM候选列表。视频编码器20可检查邻近块群组中的三个或多于三个邻近块以确定所述三个或多于三个邻近块是否经帧内译码并添加用以编码所述三个或多于三个邻近块的帧内预测模式到MPM候选列表中。邻近块群组中的邻近块的最大数目小于MPM候选列表的条目的最大数目。
视频编码器20可检查邻近块群组中的三个或多于三个邻近块以确定所述三个或多于三个邻近块是否经帧内译码,并响应于来自邻近块群组的两个邻近块是使用同一帧内预测模式译码,仅将相同帧内预测模式的一个实例包含在MPM候选列表中。为仅将相同帧内预测模式的一个实例包含在MPM候选列表中,视频编码器20可不添加相同帧内预测模式的第二实例到MPM候选列表。为仅将相同帧内预测模式的一个实例包含在MPM候选列表中,视频编码器20可从MPM候选列表移除相同帧内预测模式的实例。
为检查邻近块群组中的三个或多于三个邻近块以识别帧内预测模式以添加到MPM候选列表,视频编码器20可确定所述三个或多于三个邻近块是否使用帧内预测模式译码。当邻近块使用帧内预测模式译码时,视频编码器20可添加用以编码邻近块的帧内预测模式到MPM候选列表。
视频编码器20可基于以下中的三者或多于三者确定邻近块群组中的邻近块的数目:当前块的大小、当前块为正方形块抑或矩形块、当前块是否为水平块或竖直块或用以编码邻近块群组中的邻近块的预测模式。视频编码器20可基于以下各项中的三者或多于三者确定邻近块群组中的邻近块的位置:当前块大小的大小、当前块为正方形块抑或矩形块、当前块为竖直定向抑或水平定向、邻近块的大小、邻近块为正方形块抑或矩形块或邻近块为竖直定向抑或水平定向。
视频编码器20可基于以下各项中的一或多者确定用于检查邻近块群组中的邻近块的次序:当前块大小的大小、当前块为正方形块抑或矩形块、当前块为竖直定向抑或水平定向、邻近块的大小、邻近块为正方形块抑或矩形块或邻近块为竖直定向抑或水平定向。
邻近块群组可对应于用于AMVP模式或合并模式中的一或两者的同一邻近块群组。为检查邻近块群组中的三个或多于三个邻近块以识别帧内预测模式以添加到MPM候选列表,视频编码器20可使用用以检查用于AMVP模式或合并模式中的一或两者的邻近块的同一次序来检查三个或多于三个邻近块。
响应于来自三个或多于三个邻近块的添加到MPM候选列表的帧内预测模式的数目超出阈值数目,视频编码器20可终止对邻近块群组中的三个或多于三个邻近块的检查。所述阈值数目可小于邻近块群组中的邻近块的数目。所述阈值数目可小于包含于MPM候选列表中的帧内预测模式的最大数目。
视频编码器20可添加一或多个经导出帧内预测模式到MPM候选列表。视频编码器20可基于邻近块的帧内预测模式确定三个或多于三个经导出帧内预测模式。为基于邻近块的帧内预测模式确定三个或多于三个经导出帧内预测模式,视频编码器20可添加具有邻近块的帧内预测模式的模式索引加偏差的帧内预测模式到MPM候选列表。视频编码器20可基于当前块的特征或邻近块的特征中的一或两者确定所述偏差。
为基于邻近块的帧内预测模式确定三个或多于三个经导出帧内预测模式,视频编码器20可添加具有大于邻近块的帧内预测模式的模式索引的模式索引1的帧内预测模式到MPM候选列表。为基于邻近块的帧内预测模式确定三个或多于三个经导出帧内预测模式,视频编码器20可添加具有大于邻近块的帧内预测模式的模式索引的模式索引2的帧内预测模式到MPM候选列表。为基于邻近块的帧内预测模式确定三个或多于三个经导出帧内预测模式,视频编码器20可添加具有小于邻近块的帧内预测模式的模式索引的模式索引1的帧内预测模式到MPM候选列表。为基于邻近块的帧内预测模式确定三个或多于三个经导出帧内预测模式,视频编码器20可添加具有小于邻近块的帧内预测模式的模式索引的模式索引2的帧内预测模式到MPM候选列表。
响应于两个经导出帧内预测模式为相同帧内预测模式,视频编码器20可仅将经导出帧内预测模式的一个实例包含在MPM候选列表中。为仅将经导出帧内预测模式的一个实例包含在MPM候选列表中,视频编码器20可不添加经导出帧内预测模式的第二实例到MPM候选列表。为仅将经导出帧内预测模式的一个实例包含在MPM候选列表中,视频编码器20可从MPM候选列表移除经导出帧内预测模式的实例。
响应于添加到MPM候选列表的经导出帧内预测模式的数目超出经导出帧内预测模式的阈值数目,视频编码器20可终止经导出帧内预测模式的添加。经导出帧内预测模式的阈值数目加包含于MPM候选列表中的基于邻近的帧内预测模式的数目可小于包含于MPM候选列表中的帧内预测模式的最大数目。
视频编码器20可添加一或多个默认候选者到MPM候选列表。视频编码器20可响应于可用的基于邻近的帧内预测模式及经导出帧内预测模式的数目小于包含于MPM候选列表中的帧内预测模式的最大数目而添加一或多个默认候选者到MPM候选列表。为添加一或多个默认候选者到MPM候选列表,视频编码器20可添加一或多个默认候选者到MPM候选列表直至达到MPM候选列表中的帧内预测模式的数目等于包含于MPM候选列表中帧内预测模式的最大数目为止。
视频编码器20可产生识别用以编码视频数据的当前块的实际帧内预测模式的信息。用以编码视频数据的当前块的实际帧内预测模式可为最可能模式或可为非最可能模式。如果所述际帧内预测模式为最可能模式,那么识别用以编码视频数据的当前块的实际帧内预测模式的信息可包含识别MPM候选列表中的帧内预测模式中的一者的经上下文译码的索引值,且视频编码器20可使用任何本发明中所描述的技术或使用其它技术来编码经上下文译码的索引值。
视频编码器20也表示用于编码视频数据的装置的实例,所述装置经配置以产生用于当前块的MPM候选列表、确定用于编码当前块的实际帧内预测模式、响应于实际帧内预测模式为包含于最可能列表中的帧内预测模式,对识别包含于MPM候选列表中的实际帧内预测模式的索引值进行上下文编码。为对识别包含于MPM候选列表中的实际帧内预测模式的索引值进行上下文编码,视频编码器20可确定与实际帧内预测模式相关联的索引值,二进制化与实际帧内预测模式相关联的索引值以确定二进制化码字,将二进制化索引值映射到二进位,并对与二进制化码字相关联的每一二进位进行上下文编码。
二进制化码字可为一元译码码字、截断一元码字、固定二进制码字、哥伦布译码码字、指数哥伦布译码码字或莱斯译码码字中的一者。二进制化码字的每一二进位可对应于MPM候选列表中的最可能模式中的一者。
视频编码器20可基于对应于每一二进位的最可能模式的分类确定用于每一二进位的上下文。针对对应于第一最可能模式的第一二进位,视频编码器20可基于第一最可能模式是否为水平模式、第一最可能模式是否为竖直模式、第一最可能模式是否为对角模式或第一最可能模式是否为非角模式来确定用于第一二进位的上下文。所述上下文可进一步用于解码非帧内预测相关语法元素。可使用本发明中所描述的任何技术或其它技术来确定用于当前块的MPM候选列表。
图6为说明可实施用于本发明中所描述的技术的实例视频解码器30的框图。在图6的实例中,视频解码器30包含视频数据存储器79、熵解码单元80、预测处理单元81、反量化单元86、反变换处理单元88、求和器90及DPB 92。预测处理单元81包含帧内BC单元85、运动补偿单元82及帧内预测处理单元84。在一些实例中,视频解码器30可执行与关于来自图5的视频编码器20所描述的编码遍次大体上互逆的解码遍次。
在各种实例中,可向视频解码器30的单元分派任务以执行本发明的技术。又,在一些实例中,本发明的技术可在视频解码器30的单元中的一或多者中进行划分。举例来说,帧内BC单元85可单独地或与视频解码器30的其它单元(例如运动补偿单元82、帧内预测处理单元84及熵解码单元80)组合而执行本发明的技术。在一些实例中,视频解码器30可不包含帧内BC单元85,且帧内BC单元85的功能性可由预测处理单元81的其它组件(例如运动补偿单元82)执行。
视频数据存储器79可存储待由视频解码器30的组件解码的视频数据,例如经编码视频位流。可(例如)从存储装置32、从本地视频源(例如,摄像机)经由视频数据的有线或无线网络通信或通过存取物理数据存储媒体而获得存储于视频数据存储器79中的视频数据。视频数据存储器79可形成存储来自经编码视频位流的经编码视频数据的经译码图片缓冲器(CPB)。DPB 92存储参考视频数据以供由视频解码器30在(例如,以帧内或帧间译码模式,也被称作帧内或帧间预测译码模式)解码视频数据时使用。视频数据存储器79及DPB 92可由多种存储器装置中的任一者形成。例如动态随机存取存储器(DRAM),包含同步DRAM(SDRAM)、磁阻式RAM(MRAM)、电阻式RAM(RRAM)或其它类型的存储器装置。视频数据存储器79及DPB 92可由同一存储器装置或单独存储器装置提供。在各种实例中,视频数据存储器79可与视频解码器30的其它组件一起在芯片上,或相对于那些组件在芯片外。
在解码过程期间,视频解码器30从视频编码器20接收表示经编码视频图块的视频块及相关联语法元素的经编码视频位流。视频解码器30的熵解码单元80对位流进行熵解码以产生经量化系数、运动向量及其它语法元素。熵解码单元80将运动向量及其它语法元素转送到预测处理单元81。视频解码器30可在视频图块层级及/或视频块层级接收语法元素。
当视频图块经译码为经帧内译码(I)图块或用于其它类型的图块中的经帧内译码块时,预测处理单元81的帧内预测处理单元84可基于发信号的帧内预测模式及来自当前帧或图片的先前解码块的数据产生用于当前视频图块的视频块的预测数据。帧内预测处理单元84可经配置以实施本发明的用于执行帧内预测的技术。更具体来说,帧内预测处理单元84可经配置以根据本文所描述的MPM候选列表建构技术产生MPM候选列表。当视频帧经译码为经帧间译码(即,B或P)图块时,预测处理单元81的运动补偿单元82基于从熵解码单元80接收的运动向量及其它语法元素产生当前视频图块的视频块的预测性块。预测性块可从参考图片列表中的一者内的参考图片中的一者产生。视频解码器30可基于存储于DPB 92中的参考图片使用默认建构技术而建构参考帧列表(列表0及列表1)。
在其它实例中,当视频块根据本文中所描述的帧内BC模式进行译码时,预测处理单元81的帧内BC单元85基于从熵解码单元80所接收的块向量及其它语法元素产生当前视频块的预测性块。预测性块可位于与由视频编码器20定义且从DPB 92检索的当前视频块相同的图片内的经重建构区域内。
运动补偿单元82及/或帧内BC单元85可通过剖析运动向量及其它语法元素确定用于当前视频图块的视频块的预测信息,并使用所述预测信息产生用于正经解码的当前视频块的预测性块。举例来说,运动补偿单元82使用所接收语法元素中的一些以确定用以对视频图块的视频块进行译码的预测模式(例如,帧内预测或帧间预测)、帧间预测图块类型(例如,B图块或P图块)、用于图块的参考图片列表中的一或多者的建构信息、用于图块的每一经帧间编码的视频块的运动向量、用于图块的每一经帧间译码的视频块的帧间预测状态及用以对当前视频图块中的视频块进行解码的其它信息。
类似地,帧内BC单元85可使用所接收语法元素中的一些(例如,旗标)以确定当前视频块为使用帧内BC模式进行预测,指示图片中的何等视频块位于经重建构区域内且应存储于DPB 92中的建构信息、用于图块的每一经帧内BC预测的视频块的块向量、用于图块的每一经帧内BC预测视频块的帧内BC预测状态及用以对当前视频图块中的视频块进行解码的其它信息。
运动补偿单元82也可执行基于内插滤波器的内插。运动补偿单元82可使用如由视频编码器20在视频块的编码期间使用的内插滤波器,以计算参考块的次整数像素的内插值。在此情况下,运动补偿单元82可从所接收的语法元素确定由视频编码器20使用的内插滤波器,且使用所述内插滤波器以产生预测性块。视频解码器30可经配置以解码以合并模式及/或AMVP模式译码的块,在此情况下,预测处理单元81可经配置以组译通过视频编码器20所组译的相同候选列表。举例来说,预测处理单元81也可执行上文关于图6及7所描述的技术。
反量化单元86反量化(即,解量化)提供于位流中并由熵解码单元80解码的经量化变换系数。反量化过程可包含使用通过视频编码器20针对视频图块中的每一视频块计算的量化参数,以确定量化程度及同样确定应所述应用的反量化的程度。反变换处理单元88将反变换(例如,反DCT、反整数变换或概念上类似的反变换过程)应用于变换系数以便在像素域中产生残余块。
在运动补偿单元82或帧内BC单元85基于向量及其它语法元素而产生用于当前视频块的预测性块之后,视频解码器30通过将来自反变换处理单元88的残余块与由运动补偿单元82及帧内BC单元85所产生的对应预测性块求和来形成经解码视频块。求和器90表示执行此求和运算以产生经重建构视频块的一或多个组件。
求和器90表示执行此求和运算的一或多个组件。回路内滤波器(未描绘)可定位于求和器90与DPB 92之间。接着将给定帧或图片中的经解码视频块存储于DPB 92中,所述DPB92存储用于后续运动补偿的参考图片。DPB 92或与DPB 92分离的存储器装置也可存储经解码视频,以供稍后在显示装置(例如,图1的显示装置34)上呈现。
视频解码器30表示用于解码视频数据的装置的实例,所述装置经配置以确定视频数据的当前块是使用帧内预测模式译码;添加第一邻近块的帧内预测模式到用于当前块的MPM候选列表;添加用于第二邻近块的帧内预测模式到MPM候选列表;添加用于第三邻近块的帧内预测模式到最可能模式列表;及使用帧内预测解码视频数据的当前块。第一邻近块、第二邻近块及第三邻近块可各自对应于左块、上块、左下块、右上块或左上块中的一者。
视频解码器30可(例如)经配置而以固定次序检查邻近块群组以确定来自邻近块群组的邻近块是否经帧内译码。视频解码器30可以固定次序添加用以编码来自邻近块群组的邻近块的帧内预测模式到MPM候选列表中。视频解码器30可检查邻近块群组中的一或多个邻近块以确定所述一或多个邻近块是否经帧内译码并添加用以编码所述一或多个邻近块的帧内预测模式到MPM候选列表中。邻近块群组中的邻近块的最大数目可小于MPM候选列表的条目的最大数目。
视频解码器30可(例如)检查邻近块群组中的一或多个邻近块以确定所述一或多个邻近块是否经帧内译码,且响应于来自邻近块群组的两个邻近块使用同一帧内预测模式译码,仅将相同帧内预测模式的一个实例包含在MPM候选列表中。为仅将相同帧内预测模式的一个实例包含在MPM候选列表中,视频解码器30可不添加相同帧内预测模式的第二实例到MPM候选列表,或为仅将相同帧内预测模式的一个实例包含在MPM候选列表中,视频解码器30可从MPM候选列表移除相同帧内预测模式的实例。
视频解码器30可检查邻近块群组中的一或多个邻近块以识别帧内预测模式以添加到MPM候选列表。为检查邻近块群组中的一或多个邻近块以识别帧内预测模式以添加到MPM候选列表,视频解码器30可确定所述一或多个邻近块是否使用帧内预测模式译码。当邻近块是使用帧内预测模式译码时,视频解码器30可添加用以编码邻近块的帧内预测模式到MPM候选列表。
为确定邻近块群组中的邻近块的数目,视频解码器30可基于以下各项中的一或多者确定邻近块群组中的邻近块的数目:当前块的大小、当前块为正方形块抑或矩形块、当前块是否为水平块或竖直块或用以编码邻近块群组的邻近块的预测模式。视频解码器30可基于以下各项中的一或多者确定邻近块群组中的邻近块的位置:当前块大小的大小、当前块为正方形块抑或矩形块、当前块为竖直定向抑或水平定向、邻近块的大小、邻近块为正方形块抑或矩形块或邻近块为竖直定向抑或水平定向。视频解码器30可基于以下各项中的一或多者确定用于检查邻近块群组中的邻近块的次序:当前块大小的大小、当前块为正方形块抑或矩形块、当前块为竖直定向抑或水平定向、邻近块的大小、邻近块为正方形块抑或矩形块或邻近块为竖直定向抑或水平定向。
邻近块群组可对应于用于AMVP模式或合并模式中的一或两者的同一邻近块群组。为检查邻近块群组中的一或多种邻近块以识别帧内预测模式以添加到MPM候选列表,视频解码器30可使用用以检查用于AMVP模式或合并模式中的一或两者的邻近块的同一次序来检查一或多个邻近块。
响应于来自一或多个邻近块的添加到MPM候选列表中的帧内预测模式的数目超出阈值数目,视频解码器30可终止对邻近块群组中的一或多个邻近块的检查。阈值数目可(例如)小于邻近块群组中的邻近块的数目。阈值数目可(例如)小于包含于MPM候选列表中的帧内预测模式的最大数目。
视频解码器30可添加一或多个经导出帧内预测模式到MPM候选列表。视频解码器30可基于邻近块的帧内预测模式确定所述一或多个经导出帧内预测模式。为基于邻近块的帧内预测模式确定所述一或多个经导出帧内预测模式,视频解码器30可添加具有邻近块的帧内预测模式的模式索引加偏差的帧内预测模式到MPM候选列表。为基于邻近块的帧内预测模式确定一或多个经导出帧内预测模式,视频解码器30可添加第一偏差到第一邻近块的帧内预测模式以确定第一经导出帧内预测模式,添加第二偏差到第一邻近块的帧内预测模式以确定第二经导出帧内预测模式,及添加第一经导出帧内预测模式及第二经导出帧内预测模式到MPM候选列表。为基于邻近块的帧内预测模式确定一或多个经导出帧内预测模式,视频解码器30可添加第一偏差到第一邻近块的帧内预测模式以确定第一经导出帧内预测模式,添加第二偏差到第二邻近块的帧内预测模式以确定第二经导出帧内预测模式,及添加第一经导出帧内预测模式及第二经导出帧内预测模式到MPM候选列表。
视频解码器30可基于当前块的特征或邻近块的特征中的一或两者确定所述偏差。为基于邻近块的帧内预测模式确定一或多个经导出帧内预测模式,视频解码器30可添加具有大于邻近块的帧内预测模式的模式索引的模式索引1的帧内预测模式到MPM候选列表。为基于邻近块的帧内预测模式确定一或多个经导出帧内预测模式,视频解码器30可添加具有大于邻近块的帧内预测模式的模式索引的模式索引2的帧内预测模式到MPM候选列表。为基于邻近块的帧内预测模式确定一或多个经导出帧内预测模式,视频解码器30可添加具有小于邻近块的帧内预测模式的模式索引的模式索引1的帧内预测模式到MPM候选列表。为基于邻近块的帧内预测模式确定一或多个经导出帧内预测模式,视频解码器30可添加具有小于邻近块的帧内预测模式的模式索引的模式索引2的帧内预测模式到MPM候选列表。
响应于两个经导出帧内预测模式为相同帧内预测模式,视频解码器30可仅将经导出帧内预测模式的一个实例包含于MPM候选列表中。为仅将经导出帧内预测模式的一个实例包含在MPM候选列表中,视频解码器30可不添加经导出帧内预测模式的第二实例到MPM候选列表。为仅将经导出帧内预测模式的一个实例包含于MPM候选列表中,视频解码器30可从MPM候选列表移除经导出帧内预测模式的实例。
响应于添加到MPM候选列表的经导出帧内预测模式的数目超出经导出帧内预测模式的阈值数目,视频解码器30可终止经导出帧内预测模式的添加。经导出帧内预测模式的阈值数目加包含于MPM候选列表中的基于邻近的帧内预测模式的数目可小于包含于MPM候选列表中的帧内预测模式的最大数目。
视频解码器30可添加一或多个默认候选者到MPM候选列表。视频解码器30可响应于可用的基于邻近的帧内预测模式及经导出帧内预测模式的数目小于包含于MPM候选列表中的帧内预测模式的最大数目而添加一或多个默认候选者至MPM候选列表。为添加一或多个默认候选者到MPM候选列表,视频解码器30可添加一或多个默认候选者到MPM候选列表直至达到MPM候选列表中的帧内预测模式的数目等于包含于MPM候选列表中的帧内预测模式的最大数目为止。
视频解码器30可添加一或多个基于邻近的帧内预测模式到MPM候选列表,且在添加全部所述一或多个基于邻近的帧内预测模式到MPM候选列表之后,添加一或多个默认帧内预测模式到MPM候选列表。在添加全部所述一或多个基于邻近的帧内预测模式到MPM候选列表之后,视频解码器30可添加一或多个默认帧内预测模式到MPM候选列表。
视频解码器30可添加一或多个基于邻近的帧内预测模式到MPM候选列表,且在添加全部所述一或多个基于邻近的帧内预测模式到MPM候选列表之后,添加一或多个默认帧内预测模式到MPM候选列表。在添加全部一或多个基于邻近的帧内预测模式到MPM候选列表之后,视频解码器30可添加一或多个经导出帧内预测模式到MPM候选列表。在添加全部所述一或多个基于邻近的帧内预测模式到MPM候选列表之后,视频解码器30可添加一或多个默认帧内预测模式到MPM候选列表。
在添加第一邻近块的帧内预测模式到用于当前块的MPM候选列表之后,视频解码器30可添加第一经导出候选者到MPM候选列表,且在添加第一经导出候选者到MPM候选列表之后,添加用于第二邻近块的帧内预测模式到MPM候选列表。
在一些情况中,为使用帧内预测模式解码视频数据的当前块,视频解码器30可使用来自MPM候选列表的帧内预测模式。在其它情况中,为使用帧内预测模式解码视频数据的当前块,视频解码器30可使用为非最可能模式的帧内预测模式。在一些情况中,视频解码器30可接收识别MPM候选列表中的帧内预测模式中的一者的经上下文译码的索引值及使用本发明中所描述的技术或其它技术解码经上下文译码的索引值。
视频解码器30也表示用于解码视频数据的装置的实例,所述装置经配置以检查邻近块群组中的三个或多于三个邻近块以识别帧内预测模式以添加到用于当前块的MPM候选列表及使用帧内预测模式解码当前块。视频解码器30可以固定次序检查邻近块群组以确定来自邻近块群组的邻近块是否经帧内译码。视频解码器30可以固定次序添加用以编码来自邻近块群组的邻近块的帧内预测模式到MPM候选列表。
视频解码器30可检查邻近块群组中的三个或多于三个邻近块以确定所述三个或多于三个邻近块是否经帧内译码。邻近块群组中的邻近块的最大数目可小于用于MPM候选列表的条目的最大数目。视频解码器30可添加用以编码三个或多于三个邻近块的帧内预测模式到MPM候选列表中。
视频解码器30可检查邻近块群组中的三个或多于三个邻近块以确定所述三个或多于三个邻近块是否经帧内译码,并响应于来自邻近块群组的两个邻近块是使用同一帧内预测模式译码,仅将相同帧内预测模式的一个实例包含在MPM候选列表中。为仅将相同帧内预测模式的一个实例包含于MPM候选列表中,视频解码器30可不添加相同帧内预测模式的第二实例到MPM候选列表。为仅将相同帧内预测模式的一个实例包含于MPM候选列表中,视频解码器30可从MPM候选列表移除相同帧内预测模式的实例。
为检查邻近块群组中的三个或多于三个邻近块以识别帧内预测模式以添加到MPM候选列表,视频解码器30可确定所述三个或多于三个邻近块是否使用帧内预测模式译码。当邻近块是使用帧内预测模式译码时,视频解码器30可添加用以编码邻近块的帧内预测模式到MPM候选列表。
视频解码器30可基于以下各项中的三者或多于三者确定邻近块群组中的邻近块的数目:当前块的大小、当前块为正方形块抑或矩形块、当前块为水平块抑或竖直块或用以编码邻近块群组的邻近块的预测模式。视频解码器30可基于以下各项中的三者或多于三者确定邻近块群组中的邻近块的位置:当前块大小的大小、当前块为正方形块抑或矩形块、当前块为竖直定向抑或水平定向、邻近块的大小、邻近块为正方形块抑或矩形块或邻近块为竖直定向抑或水平定向。视频解码器30可基于以下各项中的一或多者确定用于检查邻近块群组中的邻近块的次序:当前块大小的大小、当前块为正方形块抑或矩形块、当前块为竖直定向抑或水平定向、邻近块的大小、邻近块为正方形块抑或矩形块或邻近块为竖直定向抑或水平定向。
邻近块群组可为用于AMVP模式或合并模式中的一或两者的同一邻近块群组。为检查邻近块群组中的三个或多于三个邻近块以识别帧内预测模式以添加到MPM候选列表,视频解码器30可使用用以检查用于AMVP模式或合并模式中的一或两者的邻近块的同一次序来检查三个或多于三个邻近块。
响应于来自三个或多于三个邻近块的添加到MPM候选列表的帧内预测模式的数目超出阈值数目,视频解码器30可终止对邻近块群组中的三个或多于三个邻近块的检查。所述阈值数目可小于邻近块群组中的邻近块的数目。所述阈值数目可小于包含于MPM候选列表中的帧内预测模式的最大数目。
视频解码器30可添加一或多个经导出帧内预测模式到MPM候选列表。视频解码器30可基于邻近块的帧内预测模式确定三个或多于三个经导出帧内预测模式。为基于邻近块的帧内预测模式确定所述三个或多于三个经导出帧内预测模式,视频解码器30可添加具有邻近块的帧内预测模式的模式索引加偏差的帧内预测模式到MPM候选列表。视频解码器30可基于当前块的特征或邻近块的特征中的一或两者确定所述偏差。
为基于邻近块的帧内预测模式确定三个或多于三个经导出帧内预测模式,视频解码器30可添加具有大于邻近块的帧内预测模式的模式索引的模式索引1的帧内预测模式到MPM候选列表。为基于邻近块的帧内预测模式确定三个或多于三个经导出帧内预测模式,视频解码器30可添加具有大于邻近块的帧内预测模式的模式索引的模式索引2的帧内预测模式到MPM候选列表。为基于邻近块的帧内预测模式确定三个或多于三个经导出帧内预测模式,视频解码器30可添加具有小于邻近块的帧内预测模式的模式索引的模式索引1的帧内预测模式到MPM候选列表。为基于邻近块的帧内预测模式确定三个或多于三个经导出帧内预测模式,视频解码器30可添加具有小于邻近块的帧内预测模式的模式索引的模式索引2的帧内预测模式到MPM候选列表。
响应于两个经导出帧内预测模式为相同帧内预测模式,视频解码器30可仅将经导出帧内预测模式的一个实例包含于MPM候选列表中。为仅将经导出帧内预测模式的一个实例包含于MPM候选列表中,视频解码器30可不添加经导出帧内预测模式的第二实例到MPM候选列表。为仅将经导出帧内预测模式的一个实例包含于MPM候选列表中,视频解码器30可从MPM候选列表移除经导出帧内预测模式的实例。
响应于添加到MPM候选列表的经导出帧内预测模式的数目超出经导出帧内预测模式的阈值数目,视频解码器30可终止经导出帧内预测模式的添加。经导出帧内预测模式的阈值数目加包含于MPM候选列表中的基于邻近的帧内预测模式的数目可小于包含于MPM候选列表中的帧内预测模式的最大数目。
视频解码器30可添加一或多个默认候选者到MPM候选列表。视频解码器30可响应于可用的基于邻近的帧内预测模式及经导出帧内预测模式的数目小于包含于MPM候选列表中的帧内预测模式的最大数目而添加一或多个默认候选者到MPM候选列表。为添加一或多个默认候选者到MPM候选列表,视频解码器30可添加一或多个默认候选者到MPM候选列表直至达到MPM候选列表中的帧内预测模式的数目等于包含于MPM候选列表中的帧内预测模式的最大数目为止。
在一些情况中,为使用帧内预测模式解码视频数据的当前块,视频解码器30可使用为非最可能模式的帧内预测模式。在一些情况中,视频解码器30可接收识别MPM候选列表中的帧内预测模式中的一者的经上下文译码的索引值并使用本发明中所描述的任何技术或不同技术解码经上下文译码的索引值。
视频解码器30也表示用于解码视频数据的装置的实例,所述装置经配置以产生用于当前块的MPM候选列表、接收识别包含于MPM候选列表中的帧内预测模式的经上下文译码的索引值、确定用于解码经上下文译码的索引值的上下文,及使用经确定的上下文对经上下文译码的索引值进行上下文解码以确定帧内预测模式。可使用本发明中所描述的技术中的任一者及/或使用本发明中未描述的其它技术建构MPM候选列表。基于经确定的上下文值,视频解码器30可映射经上下文译码的索引值到二进位以确定包含所述索引值并对应于来自MPM候选列表的帧内预测模式的二进制化码字。
二进制化码字可为一元译码码字、截断一元码字、固定二进制码字、哥伦布译码码字及指数哥伦布译码码字或哥伦布-莱斯译码码字中的任一者。二进制化码字的每一二进位可经上下文译码。二进制化码字的每一二进位可对应于MPM候选列表中的最可能模式中的一者。
视频解码器30可基于对应于每一二进位的最可能模式的分类确定用于每一二进位的上下文。针对对应于第一最可能模式的第一二进位,视频解码器30可基于第一最可能模式是否为水平模式、第一最可能模式是否为竖直模式、第一最可能模式是否为对角模式或第一最可能模式是否为非角模式来确定用于第一二进位的上下文。所述上下文可进一步用于解码非帧内预测相关的语法元素。
图7A及7B展示在二进位n处的CABAC过程的实例。在图7A的实例100中,在给定某一上下文状态(σ)情况下,在二进位n处,在二进位2处的范围包含由LPS的概率(pσ)给定的RangeMPS及RangeLPS。实例100展示当二进位n的值等于MPS时在二进位n+1处的范围的更新。在此实例中,低点保持不变,但在二进位n+1处的范围的值经缩减到在二进位n处的RangeMPS的值。图7B的实例102展示当二进位n的值不等于MPS(即,等于LPS)时在二进位n+1处的范围的更新。在此实例中,移动低点到在二进位n处的RangeLPS的下限值。此外,在二进位n+1处的范围的值经缩减到在二进位n处的RangeLPS的值。
在HEVC视频译码过程的一个实例中,用9个位表达范围且用10个位表达低点。存在以充足精度维持范围值及低点值的再归一化过程。每当范围小于256,即发生再归一化。因此,在再归一化之后所述范围始终相等或大于256。取决于范围及低点的值,BAC将“0”或“1”输出到位流,或更新内部变量(被称作BO:突出位)以保留用于未来输出。图8展示取决于范围的BAC输出的实例。例如,当范围及低点超过某一阈值(例如,512)时,输出“1”到位流。当范围及低点小于某一阈值(例如,512)时,输出“0”到位流。当范围及低点在某些阈值之间时,不输出任何值到位流。替代地,递增BO值且编码下一二进位。
在H.264/AVC的CABAC上下文模型化及在HEVC的一些实例中,存在128个状态。存在64个可为从0到63的可能LPS概率(通过状态σ指示)。每一MPS可为零或一。因此,128个状态为64个状态概率乘以MPS的2个可能值(0或1)。因此,所述状态可用7个位索引。
为减少导出LPS范围(rangeLPSσ)的计算,预先计算全部情况的结果且以查找表形式在H.264/AVC及HEVC的一些提议中存储为近似值。因此,可在无任何乘法运算的情况下通过使用简单表查找来获得LPS范围。对于一些装置或应用来说避免乘法运算可为至关重要的,此是由于此操作可引起多种硬件架构中的显著潜时。
可使用4列预先计算的LPS范围表而非乘法运算。将范围划分为四个片段。可通过问题(范围>>6)&3导出片段索引。实际上,通过从实际范围移位及丢弃位导出所述片段索引。下表1展示可能范围及其对应索引。
表1-范围索引
范围 256-319 320-383 384-447 448-511
(范围>>6)&3 0 1 2 3
LPS范围表接着具有64个条目(每一概率状态有一者)乘以4(每一范围索引有一者)。每一条目为LPS范围,即,将范围乘以LPS概率的值。下表2中展示此表的一部分的实例。表2描绘概率状态9到12。在HEVC的一项提议中,概率状态的范围可为0到63。
表2-RangeLPS
在每一片段(即,范围值)中,每一概率状态σ的LPS范围为预定义的。换句话说,概率状态σ的LPS范围经量化为四个值(即,每一范围索引有一个值)。在给定点处使用的特定的LPS范围取决于范围属于哪一片段。表中所使用的可能的LPS范围的数目为表列数(即,可能的LPS范围值的数目)与LPS范围精度之间的折衷。大体来说,更多列产生LPS范围值的更少量化误差,且也增加对用以存储表的更多存储器的需求。更少列增加量化误差,且也减少存储表所需的存储器。
如上文所述,每一LPS概率状态具有对应概率。每一状态的概率如下导出:
pσ=αpσ-1
其中状态σ为0到63。常数α表示在每一上下文状态之间变化的概率的量。在一个实例中,α=0.9493,或,更精确地,α=(0.01875/0.5)1/63。在状态σ=0处的概率等于0.5(即,p0=1/2)。即,在上下文状态0处,LPS及MPS为同等可能的。通过使先前状态乘以α而导出在每一连续状态处的概率。因而,发生在上下文状态α=1处的LPS的概率为p0*0.9493(0.5*0.9493=0.47465)。因而,随着状态α的索引增大,LPS的发生概率变小。
CABAC为自适应性的,因为概率状态经更新以遵循发信号统计(即,先前经译码二进位的值)。更新过程是如下。对于给定概率状态,更新取决于状态索引及经识别为LPS或MPS的经编码符号的值。作为更新过程的结果,新的可能性状态经导出,其由潜在经修改LPS可能性估计及(必要时)经修改MPS值构成。
在二进位值等于MPS的情况下,给定状态索引可递增1。此适用于除了MPS在状态索引62处出现之外的全部状态,其中LPS概率已经在其最小值处(或等效地,达到最大MPS概率)。在此情况下,状态索引62保持固定,直到LPS可见或最末二进位值经编码(状态63用于最末二进位值的特殊情况)。当LPS出现时,通过以特定量递减状态索引来改变状态索引,如以下方程式中所展示。大体来说,此规则适用于具有以下异常的LPS每次出现时。假定已在具有索引σ=0的状态处编码LPS,所述索引对应于等概率情况,那么状态索引保持固定,但将切换MPS值使得LPS及MPS的值将被互换。在所有其它情况下,不管哪一符号已经编码,MPS值将未更改。LPS概率的转变法则的导出是基于给定LPS概率pold与其经更新的对应体pnew之间的以下关系:
pnew=max(αpold,p62)若MPS出现
pnew=(1-α)+αpold若LPS出现
关于CABAC中的概率估计过程的实务实施,重要的是应注意,可通过至多两个各自具有6位无正负号整数值的63个条目的表实现所有转变规则。在一些实例中,可用单个表TransIdxLPS确定状态转变,在已观测到LPS的情况下,所述单个表针对给定状态索引σ确定新的经更新的状态索引TransIdxLPS[σ]。可通过使状态索引仅(饱和)添加固定值1,得到经更新状态索引min(σ+1,62),从而获得MPS驱动转变。下表3为部分TransIdxLPS表的实例。
表3-TransIdxLPS
概率状态(σ) 新状态TransIdxLPS[σ]
9 6
10 8
11 8
12 8
先前BAC方法(例如,H.264/AVC中所使用的BAC方法)的一个问题为针对低分辨率视频(即,共同中间格式(CIF)及四分之一CIF(QCIF)视频)调整表RangeLPS及TransIdxLPS。当前,大量视频内容为高清晰度(HD),且在一些情况中,超过HD。HD或超过HD分辨率的视频内容具有与用以开发H.264/AVC的10年的QCIF序列不同的统计。
因而,来自H.264/AVC的表RangeLPS及TransIdxLPS可以过快方式引起状态之间的调适。即,尤其当LPS出现时,概率状态之间的转变对于HD视频的更平滑、更高分辨率内容可能过大。因此,根据习知技术使用的概率模型用于HD及超HD内容时不准确。此外,因为HD视频内容包含像素值的较大范围,H.264/AVC表未包含足够条目以顾及可出现于HD内容中的更多极端值。
因而,存在对于待经修改成顾及此新内容的特征的RangeLPS及TransIdxLPS表的需要。此也暗示BAC应在至少两个方面中不同。一个差异为BAC过程应使用允许更慢调适过程的表。另一差异为BAC过程应顾及更多极端情况(即,偏斜概率)。
可通过仅包含更多概率状态及范围修改当前RangeLPS及TransIdxLPS表以达成这些目标。然而,此方案引发表的大小的实质性增加。可通过使用与当前所使用的参数α(例如,α=0.9493)相比更接近1的参数α来达成更慢调适。然而,使用α的较大值使得概率更缓慢地趋于0,及因而,需要更多状态。此外,为达成更慢调适,如果最低可能概率比当前所使用的最低概率低得多,那么可为有益的。因而,可能需要甚至更多状态以达到彼极低概率值。
鉴于上述问题,本发明提出修改BAC以实现更慢调适及更多偏斜概率同时保持处于实用层级的表大小(例如,RangeLPS及TransIdxLPS表)的技术。换句话说,本发明描述达成更慢调适及更多极端概率(即,更接近0及1的概率)同时使用相对较小大小的表的技术。
本发明中所描述的技术可使用更多概率状态,例如,比具有H.264/AVC或HEVC的BAC中所使用的更多的概率状态。在此情况下,TransIdxLPS表可获得更慢调适及较低概率。在实例中,本发明中所描述的技术可使用128个概率状态而非64个。此使表TransIdxLPS增加64个条目(即,128个条目而非64个)。此增加允许更慢调适及较低最小概率。作为一个实例,通过设定参数α=0.9689,邻近概率之间的差异变得较小。另外,最低最小概率降到0.009,其约为H.264/AVC情况的二分之一(即,0.01875)。状态及α值的其它数目也为可能的,但大体来说,状态的数目可增加且α的值可与α=0.9493的H.264/AVC情况相比更接近1。
另一可经修改以改良HD或超HD译码的参数为参数p0。p0的值大体上指示用于LPS的最大概率。考虑此概率的原因为具有较低p0意谓着最小概率也减小。在习知BAC过程中,p0的值设定为0.5。本发明提出允许用于p0的其它值。当发生MPS/LPS调换时,具有低于0.5的p0的其它值允许在状态0处更平滑转变。在实例中,p0可等于0.493,但也可使用许多其它实例。
通常,每一概率状态具有其在RangeLPS表中的自有条目。表大小可表示为:
#概率状态×#经量化范围索引
其为用于HEVC的一些提议中的64×4=256位组。由于状态的数目将在本发明的实例中增加(在以上实例中加倍),RangeLPS表大小可为128×4=512位组。然而,为避免RangeLPS表大小的此增加,本发明进一步提出映射概率状态索引到较低大小(即,少数索引)以索引RangeLPS大小。换句话说,本发明提出从范围计算过程解耦状态转变过程。此意谓在当前实例中存在用于范围计算的状态的映射。在一个特定实例中,本发明提出视频编码器20及/或视频解码器30藉其经配置以映射指示经确定的概率状态的索引到多个分组索引中的一者(例如,用于RangeLPS表的分组索引)的过程,其中分组索引中的至少一者表示多个概率状态中的至少两者。因而,RangeLPS表(或其它BAC表)可使用比存在概率状态的情况更好的索引。
在本发明的实例中,概率状态数目可除以二以产生新索引以用作RangeLPS表的条目。在此情况下,减少128个概率状态到64个条目。因此,RangeLPS表可保持如在H.264/AVC中所使用的当前大小。因此,代替使用概率状态σ以索引在范围LPS表中的条目,本发明中所描述的技术采用(σ>>1),即,状态σ除以二并降值舍位为较低整数以用作RangeLPS表中的分组索引。如果需要用于给定实施的RangeLPS表较小或如果状态的数目较大(例如,256个概率状态),所述除法可为除以较大数目。在此上下文中,每一分组索引表示两个概率状态。在本发明的其它实例中,分组索引可表示两个或多于两个概率状态。
根据最佳熵观点,通过使用除法或右位移位运算分组用于RangeLPS表的状态可为有益的,但可并非始终为最佳技术。最佳分组可取决于若干因素,其包含状态的数目及除其它之外的参数α。最合乎需要的(及可能最佳)分组可不为类似位移位运算的直接运算。大体来说,可用表从概率状态的总数到概率状态的减少的数目(即,分组状态)描述所述分组。在另一实例中,本发明提出使用此种类的表。此方法将以其它存储器为代价来提高性能(与除法或右移位相比)。因而,此实例为存储器与性能之间的折衷,有助于线性映射实例的较好性能(即,除法或右移位)。
因此,尽管可使用概率状态到RangeLPS表中的条目的线性映射,但可能需要提供非线性映射。例如,可根据对数映射来映射所述概率状态。在一些实例中,可使用分段线性映射技术达成对数映射。大体来说,可使用例如预计算映射表的表定义此类映射。
大体来说,在一些实例中,本发明中所描述的技术可通过用于熵译码视频数据的方法或装置执行。所述方法可包含在二进制算术译码过程中确定符号的概率状态,其中状态概率包括多个概率状态中的一者,及映射指示经确定的概率状态的索引到多个分组索引中的一者,其中分组索引中的至少一者表示多个概率状态中的至少两者,且其中分组索引中的每一者指向用于表中的最低概率符号的范围。
在一些实例中,概率状态的数目可超过64。例如,概率状态的数目可为128。在一些实例中,用作RangeLPS表中的输入的分组索引的数目为64。详细来说,概率状态的数目可为128及用作RangeLPS表中的输入的分组索引的数目可为64。可基于分组索引(例如,根据基于概率状态索引的表或根据基于所述索引的数学运算)译码符号。经确定的概率状态根据表或根据数学运算映射到多个索引中的一者。所述映射可为线性或非线性的。例如,可根据除以二的运算执行所述映射。在一些实例中,映射可为对数映射。在一些实例中,分段线性映射可用于定义对数映射。在一些实例中,用于LPS的最大概率的值p0可小于0.5。
本发明中所描述的技术可(例如)在视频编码器、视频解码器或组合式视频编码器解码器(CODEC)内执行。特定来说,此类技术可在视频编码器的熵编码单元及/或视频解码器的熵解码单元中执行。所述技术可(例如)在CABAC过程内执行,所述CABAC过程可经配置以支持视频译码,例如根据HEVC标准的方面的视频译码。熵编码及解码单元可以互逆或相反方式应用译码过程(例如)以编码或解码例如与残余视频数据相关联的经量化变换系数、运动向量信息、语法元素及可用于视频编码及/或视频解码过程的其它类型的信息的多种视频数据中的任一者。
图9为可经配置以执行根据本发明的技术的CABAC的实例熵编码单元56的框图。输入语法元素118到熵编码单元56中。如果所述语法元素已经为二进制值语法元素(即,仅具有0及1的值的语法元素),那么可跳过二进制化的步骤。如果所述语法元素为非二进制值语法元素(例如,由多个位表示的语法元素,例如变换系数水平),通过二进制化器120二进制化非二进制值语法元素。二进制化器120执行非二进制值语法元素到二进制决策序列的映射。这些二进制决策通常被称作“二进位”。举例来说,对于变换系数水平,可将位准的值分解为连续二进位,每一二进位指示系数水平的绝对值是否大于某一值。举例来说,二进位0(有时被称作有效旗标)指示变换系数水平的绝对值是否大于0。二进位1指示变换系数水平的绝对值是否大于1,等等。可针对每一非二进制值语法元素产生唯一映射。
由二进制化器120产生的每一二进位经馈入到熵编码单元56的二进制算术译码侧。即,对于非二进制值语法元素的预定集合,每一二进位类型(例如,二进位0)在下一二进位类型(例如,二进位1)的前经译码。可以常规模式或旁路模式执行译码。在旁路模式中,旁路译码引擎126使用固定概率模型(例如,使用哥伦布-莱斯或指数哥伦布译码)执行算术译码。旁路模式通常用于更可预测语法元素。
以规则模式进行译码涉及执行CABAC。在给定先前经译码二进位的值而二进位的值的概率为可预测的情况下,规则模式CABAC用于译码二进位值。通过上下文建模器122确定二进位为LPS的概率。上下文建模器122输出二进位值及上下文模型(例如,概率状态σ)。上下文模型可为用于一连串二进位的初始上下文模型,或可基于先前已译码二进位的经译码值而确定。如上文所描述,上下文建模器可基于先前经译码二进位为MPS抑或LPS而更新状态。
在通过上下文建模器122确定上下文模型及概率状态σ之后,规则译码引擎124对二进位值执行BAC。根据本发明的技术,规则译码引擎124使用包含超过64个概率状态σ的TransIdxLPS表130执行BAC。在一个实例中,概率状态的数目为128。当先前二进位(二进位n)为LPS时,使用TransIdxLPS确定哪个概率状态用于下一二进位(二进位n+1)。规则译码引擎124也可使用RangeLPS表128以在给定特定概率状态σ的情况下确定LPS的范围值。然而,根据本发明的技术,将概率状态索引σ映射到用于RangeLPS表中的分组索引,而非使用TransIdxLPS表130的全部可能概率状态σ。即,RangeLPS表128中的每一索引可表示概率状态的总数中的两者或多于两者。概率状态索引σ到分组索引的映射可为线性(例如,通过除以二),或可为非线性的(例如,对数函数或映射表)。
在本发明的其它实例中,可通过设定参数α大于0.9493使得连续概率状态之间的差异较小。在一个实例中,α=0.9689。在本发明的另一实例中,LPS发生的最高概率(p0)可设定为小于0.5。在一个实例中,p0可等于0.493。
根据本发明的一或多种技术,与使用用以更新二进制算术译码过程中的概率状态的变量的相同值(例如,窗口大小、比例因子(α)及概率更新速度中的一或多者)相反,熵编码单元56可使用变量的不同值用于不同上下文模型及/或不同语法元素。举例来说,熵编码单元56可针对多个上下文模型的上下文模型确定用以更新二进制算术译码过程中的概率状态的变量的值,且基于所确定的值更新概率状态。
返回到图4,在一些情况中,视频编码器20的熵编码单元56或另一单元可经配置以执行除熵译码之外的其它译码功能。举例来说,熵编码单元56可经配置以确定用于CU及PU的经译码块型样(CBP)值。又,在一些状况下,熵编码单元56可执行系数的延行长度译码。另外,熵编码单元56或其它处理单元也可译码其它数据,例如量化矩阵的值。
如上文所论述,反量化单元58及反变换处理单元60分别应用反量化及反变换以重建构像素域中的残余块(例如,供稍后用作参考块)。运动补偿单元44可通过将残余块添加到DPB 64的帧中的一者的预测性块来计算参考块。运动补偿单元44也可将一或多个内插滤波器应用到经重建构的残余块以计算在运动估计中使用的次整数像素值。求和器62将经重建构的残余块添加到由运动补偿单元44产生的经运动补偿的预测块以产生经重建构的视频块以用于存储于DPB 64中。经重建构的视频块可由运动估计单元42及运动补偿单元44用作参考块以帧间译码后续视频帧中的块。
图10为可经配置以执行根据本发明的技术的CABAC的实例熵解码单元80的框图。图10的熵解码单元80以与图5中所描述的熵编码单元56的方式相逆的方式执行CABAC。输入来自位流218的经译码位到熵解码单元80中。基于经译码位是使用旁路模式抑或规则模式经熵译码而将经译码位馈入到上下文建模器220或旁路译码引擎222。如果经译码位以旁路模式译码,那么旁路解码引擎将使用哥伦布-莱斯或指数哥伦布解码(例如)以检索二进制值语法元素或非二进制语法元素的二进位。
如果经译码位以规则模式译码,那么上下文建模器220可确定经译码位的概率模型,且规则解码引擎224可解码所述经译码位以产生非二进制值语法元素的二进位(或语法元素自身(在语法元素为二进制值时))。在通过上下文建模器220确定上下文模型及概率状态σ之后,规则解码引擎224对二进位值执行BAC。根据本发明的技术,规则解码引擎224使用包含超过64个概率状态σ的TransIdxLPS表228执行BAC。在一个实例中,概率状态的数目为128,但可与本发明的技术一致而定义其它数目的概率状态。当先前二进位(二进位n)为LPS时,使用TransIdxLPS确定哪个概率状态用于下一二进位(二进位n+1)。规则解码引擎224也可使用RangeLPS表226以在给定特定概率状态σ的情况下确定LPS的范围值。然而,根据本发明的技术,将概率状态索引σ映射到用于RangeLPS表226中的分组索引,而非使用TransIdxLPS表228的全部可能概率状态σ。即,RangeLPS表226中的每一索引可表示概率状态的总数中的两者或多于两者。概率状态索引σ到分组索引的映射可为线性的(例如,通过除以二),或可为非线性的(例如,对数函数或映射表)。
在本发明的其它实例中,可通过设定参数α大于0.9493使得连续概率状态之间的差异较小。在一个实例中,α=0.9689。在本发明的另一实例中,LPS发生的最高概率(p0)可设定为小于0.5。在一个实例中,p0可等于0.493。
在通过规则解码引擎224解码二进位之后,逆向二进制化器230可执行将二进位逆转换为非二进制值语法元素的值的逆向映射。
图11为说明用于根据本发明的技术建构MPM候选列表的技术的流程图。可通过视频解码器30或视频编码器20执行图11的技术且将参考通用视频译码器描述所述技术。在确定视频数据的当前块是使用帧内预测模式译码之后,视频译码器根据图11的技术建构MPM候选列表。在图11的实例中,视频译码器考虑两个邻近块(302)。如果两个邻近块是使用帧内预测模式译码,那么视频译码器添加第一邻近块的帧内预测模式到用于当前块的MPM候选列表并添加用于第二邻近块的帧内预测模式到MPM候选列表。如果第一或第二邻近块并非是使用帧内预测模式译码,那么邻近块不具有用于视频译码器以添加到MPM候选列表的相关联的帧内预测模式。如果所述两个邻近块是使用相同帧内预测模式译码,那么视频译码器可仅添加帧内预测模式的一个实例到MPM候选列表。
在考虑第一邻近块及第二邻近块的帧内预测模式之后,视频译码器考虑一或多个默认候选者(304)。默认候选者可(例如)包含平面模式及DC模式中的一或两者。如果因为例如默认模式为第一或第二邻近块的帧内预测模式,默认模式已经包含于MPM候选列表中,那么视频译码器可不添加帧内预测模式的另一实例到MPM候选列表。
在考虑默认帧内预测模式之后,视频译码器考虑一或多个其它邻近块候选者(306)。如果其它邻近块是使用帧内预测模式译码,那么视频译码器添加其它邻近块的彼帧内预测模式到用于当前块的MPM候选列表。如果其它邻近块并非是使用帧内预测模式译码,那么相关联的邻近块不具有用于视频译码器以添加到MPM候选列表的相关联的帧内预测模式。如果其它邻近候选者是使用已包含于MPM候选列表中的帧内预测模式译码,那么视频译码器可不添加彼帧内预测模式的另一实例到MPM候选列表。
如果在考虑所有其它邻近候选者之后,MPM候选列表中的条目的数目等于阈值数目M(308,是),那么视频译码器终止MPM候选列表建构过程。如果在考虑所有其它邻近候选者之后,MPM候选列表中的条目的数目小于M(308,否),那么视频译码器考虑经导出候选者(310)。如果在考虑经导出候选者之后,MPM候选列表中的条目的数目等于阈值数目M(312,是),那么视频译码器终止MPM候选列表建构过程。如果在考虑经导出候选者之后,MPM候选列表中的条目的数目小于M(312,否)之后,那么视频译码器考虑另一经导出候选者(310)。视频译码器考虑经导出候选者直到MPM候选列表中的条目的数目等于M为止。在一些情况中,在考虑所有可能经导出候选者之后,即使MPM候选列表中的条目的数目小于M,视频译码器也可终止MPM候选列表建构过程。
视频译码器可基于邻近块的帧内预测模式确定一或多个经导出帧内预测模式。例如,为基于邻近块的帧内预测模式确定一或多个经导出帧内预测模式,视频译码器可添加具有邻近块的帧内预测模式的模式索引加偏差的帧内预测模式到MPM候选列表。所述偏差可(例如)等于-2、-1、1、2中的一者或一些其它值。
当考虑邻近块候选者时,视频译码器可以固定次序考虑邻近块候选者以确定来自邻近块群组的邻近块是否经帧内译码及以固定次序添加用以编码来自邻近块群组的邻近块的帧内预测模式到MPM候选列表中。视频译码器可(例如)使用用以检查用于合并模式的邻近块的同一次序来检查所述一或多个邻近块。
图12为说明根据本发明的技术的编码视频数据块的技术的流程图。将参考视频编码器20来描述图12的技术,但图12的技术不限于任何特定类型的视频编码器。在图12的实例中,视频编码器20确定视频数据的当前块是使用帧内预测模式译码(320)。视频编码器20产生MPM候选列表(322)。视频编码器20可(例如)使用参考图11所描述的技术或本发明中所描述的任何其它技术产生MPM候选列表。视频编码器20使用MPM候选列表确定帧内预测模式(324)。视频编码器20使用帧内预测模式编码视频数据的当前块(326)。用以编码当前块的帧内预测模式可为最可能模式(即,包含于MPM候选列表中的模式)或可为非最可能模式(即,未包含于MPM候选列表中的模式)。
图13为说明根据本发明的技术的解码视频数据块的技术的流程图。将参考视频解码器30来描述图13的技术,但图13的技术不限于任何特定类型的视频解码器。在图13的实例中,视频解码器30确定视频数据的当前块是使用帧内预测模式译码(330)。视频解码器30产生MPM候选列表(332)。视频解码器30可(例如)使用参考图11所描述的技术或本发明中所描述的任何其它技术产生MPM候选列表。视频解码器30使用MPM候选列表确定帧内预测模式(334)。视频解码器30使用帧内预测模式解码视频数据的当前块(336)。用以解码当前块的帧内预测模式可为最可能模式(即,包含于MPM候选列表中的模式)或可为非最可能模式(即,未包含于MPM候选列表中的模式)。
视频解码器30可(例如)通过确定帧内预测模式是否为MPM候选列表中的模式中的一者或帧内预测模式是否为并非MPM候选列表中的模式,使用MPM候选列表确定帧内预测模式。在一些译码情境中,为使用帧内预测模式解码视频数据的当前块,视频解码器30可(例如)接收帧内预测模式并非包含于MPM候选列表中的帧内预测模式的指示并接收指示帧内预测模式的其它语法。在一些译码情境中,为使用帧内预测模式解码视频数据的当前块,视频解码器30可(例如)接收识别包含于MPM候选列表中的帧内预测模式的经上下文译码的索引值,确定用于解码经上下文译码的索引值的上下文;及使用经确定的上下文对经上下文译码的索引值进行上下文解码以确定帧内预测模式。基于所述经确定的上下文值,视频解码器30可映射经上下文译码的索引值到二进位以确定包括索引值的二进制化码字,其中所述码字对应于来自MPM候选列表的帧内预测模式。二进制化码字可(例如)为截断一元码字。在一些实例中,二进制化码字的每一二进位经上下文译码。二进制化码字的每一二进位可对应于MPM候选列表中的最可能模式中的一者。
视频解码器30可基于对应于每一二进位的最可能模式的分类确定用于每一二进位的上下文。作为一个实例,针对对应于第一最可能模式的第一二进位,视频解码器30可基于第一最可能模式是否为水平模式,第一最可能模式是否为竖直模式或第一最可能模式是否为非角模式来确定用于第一二进位的上下文。
在一或多个实例中,所描述的功能可以硬件、软件、固件或其任何组合实施。如果以软件实施,那么所述功能可作为一或多个指令或程序代码而存储于计算机可读媒体上或经由计算机可读媒体传输,且由基于硬件的处理单元执行。计算机可读媒体可包含计算机可读存储媒体,其对应于有形媒体,例如数据存储媒体或通信媒体,包含例如根据通信协议促进将计算机程序从一处传送到另一处的任何媒体。以此方式,计算机可读媒体大体上可对应于(1)非暂时性的有形计算机可读存储媒体,或(2)例如信号或载波的通信媒体。数据存储媒体可为可通过一或多个计算机或一或多个处理器存取以检索指令、程序代码及/或数据结构以用于实施本发明中所描述的技术的任何可用媒体。计算机程序产品可包含计算机可读媒体。
藉助于实例而非限制,此类计算机可读存储媒体可包括RAM、ROM、EEPROM、CD-ROM或其它光盘存储装置、磁盘存储装置或其它磁性存储装置、快闪存储器或可用以存储呈指令或数据结构形式的所要程序代码且可由计算机存取的任何其它媒体。又,任何连接适当地被称为计算机可读媒体。举例来说,如果使用同轴缆线、光纤缆线、双绞线、数字订户线(DSL)或例如红外线、无线电及微波的无线技术从网站、服务器或其它远端源传输指令,那么同轴缆线、光纤缆线、双绞线、DSL或例如红外线、无线电及微波的无线技术包含于媒体的定义中。然而,应理解,计算机可读存储媒体及数据存储媒体不包含连接、载波、信号或其它暂时性媒体,而实情为有关非暂时性有形存储媒体。如本文所使用,磁盘及光盘包含紧密光盘(CD)、激光光盘、光学光盘、数字多功能光盘(DVD)、软盘及蓝光光盘,其中磁盘通常以磁性方式再生数据,而光盘用激光以光学方式再生数据。上文各者的组合也应包含于计算机可读媒体的范畴内。
可由例如一或多个数字信号处理器(DSP)、通用微处理器、专用集成电路(ASIC)、现场可编程逻辑阵列(FPGA)或其它等效集成式或离散逻辑电路的一或多个处理器来执行指令。因此,如本文所使用的术语“处理器”可指前述结构或适用于实施本文中所描述的技术的任一其它结构中的任一者。另外,在一些方面中,本文中所描述的功能性可提供于经配置用于编码及解码的专用硬件及/或软件模组内,或并入组合式编解码器中。又,所述技术可完全实施于一或多个电路或逻辑元件中。
本发明的技术可在广泛多种装置或设备中实施,所述装置或设备包含无线手持机、集成电路(IC)或一组IC(例如,芯片组)。在本发明中描述各种组件、模组或单元,以强调经配置以执行所揭示技术的装置的功能方面,但未必需要由不同硬件单元来实现。确切来说,如上文所描述,可将各种单元组合于编解码器硬件单元中,或通过互操作性硬件单元(包含如上文所描述的一或多个处理器)的集合结合合适的软件及/或固件来提供所述单元。
已描述各种实例。这些及其它实例是在以下权利要求书的范畴内。

Claims (72)

1.一种用于解码视频数据的方法,所述方法包括:
确定视频数据的当前块是使用帧内预测模式译码;
添加所述当前块的第一邻近块的帧内预测模式到用于所述当前块的最可能模式候选列表;
添加用于所述当前块的第二邻近块的帧内预测模式到用于所述当前块的所述最可能模式候选列表;
添加用于所述当前块的第三邻近块的帧内预测模式到用于所述当前块的所述最可能模式候选列表;
使用所述最可能模式候选列表确定帧内预测模式;及
使用所述帧内预测模式解码视频数据的所述当前块。
2.根据权利要求1所述的方法,其中所述第一邻近块、所述第二邻近块及所述第三邻近块各自对应于相对于所述当前块的左邻近块、上邻近块、左下邻近块、右上邻近块或左上邻近块中的一者。
3.根据权利要求1所述的方法,其进一步包括:
在添加所述第一邻近块及所述第二邻近块的所述帧内预测模式到所述最可能模式候选列表之后及在添加所述第三邻近块的所述帧内预测模式到所述最可能模式候选列表之前,添加一或多个默认候选者到所述最可能模式候选列表。
4.根据权利要求3所述的方法,其中所述一或多个默认模式包括平面模式及DC模式中的一或两者。
5.根据权利要求1所述的方法,其进一步包括:
添加一或多个经导出帧内预测模式到所述最可能模式候选列表中。
6.根据权利要求5所述的方法,其进一步包括:
基于邻近块的帧内预测模式确定所述一或多个经导出帧内预测模式。
7.根据权利要求6所述的方法,其中所述一或多个经导出帧内预测模式包括具有所述邻近块的所述帧内预测模式的模式索引加偏差的帧内预测模式。
8.根据权利要求7所述的方法,其中所述偏差等于-2、-1、1或2中的一者。
9.根据权利要求5所述的方法,其进一步包括:
响应于两个经导出帧内预测模式为相同帧内预测模式,仅将所述两个经导出帧内预测模式的一个实例包含在所述最可能模式候选列表中。
10.根据权利要求1所述的方法,其中确定所述帧内预测模式包括:
接收所述帧内预测模式并非包含于所述最可能模式候选列表中的帧内预测模式的指示;
接收指示所述帧内预测模式的其它语法。
11.根据权利要求1所述的方法,其中确定所述帧内预测模式包括:
接收识别包含于所述最可能模式候选列表中的帧内预测模式的经上下文译码的索引值;
确定用于解码所述经上下文译码的索引值的上下文;
使用所述经确定的上下文对所述经上下文译码的索引值进行上下文解码;及
基于所述索引值确定所述帧内预测模式。
12.根据权利要求11所述的方法,其进一步包括:
基于所述经确定的上下文,将所述经上下文译码的索引值映射到二进位,以确定包括所述索引值的二进制化码字,其中所述二进制化码字对应于来自所述最可能模式候选列表的帧内预测模式。
13.根据权利要求12所述的方法,其中所述二进制化码字包括截断一元码字。
14.根据权利要求12所述的方法,其中所述二进制化码字的每一二进位经上下文译码。
15.根据权利要求12所述的方法,其中所述二进制化码字的每一二进位对应于所述最可能模式候选列表中的所述最可能模式中的一者。
16.根据权利要求12所述的方法,其进一步包括:
基于对应于每一二进位的所述最可能模式的分类确定用于每一二进位的所述上下文。
17.根据权利要求16所述的方法,其进一步包括:
针对对应于第一最可能模式的第一二进位,基于以下各者确定用于所述第一二进位的上下文:
所述第一最可能模式是否属于模式的水平集合;
所述第一最可能模式是否属于模式的竖直集合;或
所述第一最可能模式是否属于模式的非角集合。
18.根据权利要求16所述的方法,其进一步包括:
针对对应于第一最可能模式的第一二进位,基于以下各者确定用于所述第一二进位的上下文:
从所述第一最可能模式到水平模式的距离;或
从所述第一最可能模式到竖直模式的距离。
19.根据权利要求1所述的方法,其进一步包括:
以固定次序检查邻近块群组以确定来自所述邻近块群组的邻近块是否经帧内译码,其中所述邻近块群组包括所述第一邻近块、所述第二邻近块、所述第三邻近块及至少一个其它邻近块;及
以所述固定次序添加用以编码来自所述邻近块群组的邻近块的帧内预测模式到所述最可能模式候选列表中。
20.根据权利要求19所述的方法,其进一步包括:
响应于来自所述邻近块群组的两个邻近块是使用相同帧内预测模式译码,仅将所述相同帧内预测模式的一个实例包含在所述最可能模式候选列表中。
21.根据权利要求19所述的方法,其中检查所述邻近块群组的所述一或多个邻近块包括使用用以检查用于合并模式的邻近块的相同次序来检查所述一或多个邻近块。
22.根据权利要求19所述的方法,其进一步包括:
响应于添加用以编码来自所述邻近块群组的邻近块的帧内预测模式到所述最可能模式候选列表中而引起所述最可能模式候选列表中的帧内预测模式的数目超出阈值数目,终止对所述邻近块群组中的一或多个邻近块的所述检查。
23.一种用于解码视频数据的装置,所述装置包括:
存储器,其经配置以存储所述视频数据;
一或多个处理器,其经配置以:
确定所述视频数据的当前块是使用帧内预测模式译码;
添加所述当前块的第一邻近块的帧内预测模式到用于所述当前块的最可能模式候选列表;
添加用于所述当前块的第二邻近块的帧内预测模式到用于所述当前块的所述最可能模式候选列表;
添加用于所述当前块的第三邻近块的帧内预测模式到用于所述当前块的所述最可能模式候选列表;
使用所述最可能模式候选列表确定帧内预测模式;及
使用所述帧内预测模式解码所述当前块。
24.根据权利要求23所述的装置,其中所述第一邻近块、所述第二邻近块及所述第三邻近块各自对应于相对于所述当前块的左邻近块、上邻近块、左下邻近块、右上邻近块或左上邻近块中的一者。
25.根据权利要求23所述的装置,其中所述一或多个处理器经配置以:
在添加所述第一邻近块及所述第二邻近块的所述帧内预测模式到所述最可能模式候选列表之后及在添加所述第三邻近块的所述帧内预测模式到所述最可能模式候选列表之前,添加一或多个默认候选者到所述最可能模式候选列表。
26.根据权利要求25所述的装置,其中所述一或多个默认候选者包括平面模式及DC模式中的一或两者。
27.根据权利要求23所述的装置,其中所述一或多个处理器经配置以:
添加一或多个经导出帧内预测模式到所述最可能模式候选列表。
28.根据权利要求27所述的装置,其中所述一或多个处理器经配置以:
基于邻近块的帧内预测模式确定所述一或多个经导出帧内预测模式。
29.根据权利要求23所述的装置,其中所述一或多个经导出帧内预测模式包括具有所述邻近块的所述帧内预测模式的模式索引加偏差的帧内预测模式。
30.根据权利要求29所述的装置,其中所述偏差等于-2、-1、1或2中的一者。
31.根据权利要求27所述的装置,其中所述一或多个处理器经配置以:
响应于两个经导出帧内预测模式为相同帧内预测模式,仅将所述两个经导出帧内预测模式的一个实例包含在所述最可能模式候选列表中。
32.根据权利要求23所述的装置,其中为确定所述帧内预测模式,所述一或多个处理器经配置以:
接收所述帧内预测模式并非包含于所述最可能模式候选列表中的帧内预测模式的指示;
接收指示所述帧内预测模式的其它语法。
33.根据权利要求23所述的装置,其中为确定所述帧内预测模式,所述一或多个处理器经配置以:
接收识别包含于所述最可能模式候选列表中的帧内预测模式的经上下文译码的索引值;
确定用于解码所述经上下文译码的索引值的上下文;
使用所述经确定的上下文对所述经上下文译码的索引值进行上下文解码;及
基于所述索引值确定所述帧内预测模式。
34.根据权利要求33所述的装置,其中所述一或多个处理器经配置以:
基于所述经确定的上下文,将所述经上下文译码的索引值映射到二进位,以确定包括所述索引值的二进制化码字,其中所述二进制化码字对应于来自所述最可能模式候选列表的帧内预测模式。
35.根据权利要求34所述的装置,其中所述二进制化码字包括截断一元码字。
36.根据权利要求34所述的装置,其中所述二进制化码字的每一二进位经上下文译码。
37.根据权利要求34所述的装置,其中所述二进制化码字的每一二进位对应于所述最可能模式候选列表中的所述最可能模式中的一者。
38.根据权利要求34所述的装置,其中所述一或多个处理器经配置以基于对应于每一二进位的所述最可能模式的分类确定用于每一二进位的所述上下文。
39.根据权利要求38所述的装置,其中所述一或多个处理器经配置以:
针对对应于第一最可能模式的第一二进位,基于以下各者确定用于所述第一二进位的上下文:
所述第一最可能模式是否属于模式的水平集合;
所述第一最可能模式是否属于模式的竖直集合;或
所述第一最可能模式是否属于模式的非角集合。
40.根据权利要求38所述的装置,其中所述一或多个处理器经配置以:
针对对应于第一最可能模式的第一二进位,基于以下各者确定用于所述第一二进位的上下文:
从所述第一最可能模式到水平模式的距离;或
从所述第一最可能模式到竖直模式的距离。
41.根据权利要求23所述的装置,其中所述一或多个处理器经配置以:
以固定次序检查邻近块群组以确定来自所述邻近块群组的邻近块是否经帧内译码,其中所述邻近块群组包括所述第一邻近块、所述第二邻近块、所述第三邻近块及至少一个其它邻近块;及
以所述固定次序添加用以编码来自所述邻近块群组的邻近块的帧内预测模式到所述最可能模式候选列表中。
42.根据权利要求41所述的装置,其中所述一或多个处理器经配置以:
响应于来自所述邻近块群组的两个邻近块是使用相同帧内预测模式译码,仅将所述相同帧内预测模式的一个实例包含在所述最可能模式候选列表中。
43.根据权利要求42所述的装置,其中为检查所述邻近块群组中的所述一或多个邻近块,所述一或多个处理器经配置以使用用以检查用于合并模式的邻近块的相同次序来检查所述一或多个邻近块。
44.根据权利要求43所述的装置,其中所述一或多个处理器经配置以:
响应于添加用以编码来自所述邻近块群组的邻近块的帧内预测模式到所述最可能模式候选列表中而引起所述最可能模式候选列表中的帧内预测模式的数目超出阈值数目,终止对所述邻近块群组中的一或多个邻近块的所述检查。
45.根据权利要求23所述的装置,其中所述装置包括无线通信装置,其进一步包括经配置以接收经编码视频数据的接收器。
46.根据权利要求45所述的装置,其中所述无线通信装置包括电话手持机,且其中所述接收器经配置以根据无线通信标准解调制包括所述经编码视频数据的信号。
47.一种用于编码视频数据的方法,所述方法包括:
确定视频数据的当前块是使用帧内预测模式译码;
添加所述当前块的第一邻近块的帧内预测模式到用于所述当前块的最可能模式候选列表;
添加用于所述当前块的第二邻近块的帧内预测模式到用于所述当前块的所述最可能模式候选列表;
添加用于所述当前块的第三邻近块的帧内预测模式到用于所述当前块的所述最可能模式候选列表;
使用所述最可能模式候选列表确定帧内预测模式;及
使用所述帧内预测模式编码视频数据的所述当前块。
48.根据权利要求47所述的方法,其进一步包括:
在添加所述第一邻近块及所述第二邻近块的所述帧内预测模式到所述最可能模式候选列表之后及在添加所述第三邻近块的所述帧内预测模式到所述最可能模式候选列表之前,添加一或多个默认候选者到所述最可能模式候选列表。
49.根据权利要求47所述的方法,其进一步包括:
添加一或多个经导出帧内预测模式到所述最可能模式候选列表中。
50.根据权利要求47所述的方法,其中使用帧内预测模式编码视频数据的所述当前块包括:
产生所述帧内预测模式并非包含于所述最可能模式候选列表中的帧内预测模式的指示,以包含于包括所述视频数据的位流中;
产生指示所述帧内预测模式的其它语法,以包含于包括所述视频数据的所述位流中。
51.根据权利要求47所述的方法,其中使用帧内预测模式编码视频数据的所述当前块包括:
确定所述帧内预测模式为包含于所述最可能模式候选列表中的帧内预测模式;
确定对应于包含于所述最可能模式候选列表中的所述帧内预测模式的索引值;
确定用于编码所述索引值的上下文;
使用所述经确定的上下文对所述索引值进行上下文编码。
52.根据权利要求51所述的方法,其进一步包括:
基于所述经确定的上下文,将所述经上下文译码的索引值映射到二进位,以确定包括所述索引值的二进制化码字,其中所述二进制化码字对应于来自所述最可能模式候选列表的帧内预测模式。
53.根据权利要求52所述的方法,其中所述二进制化码字包括截断一元码字。
54.根据权利要求52所述的方法,其中所述二进制化码字的每一二进位经上下文译码。
55.根据权利要求52所述的方法,其中所述二进制化码字的每一二进位对应于所述最可能模式候选列表中的所述最可能模式中的一者。
56.根据权利要求52所述的方法,其进一步包括:
基于对应于每一二进位的所述最可能模式的分类确定用于每一二进位的所述上下文。
57.根据权利要求56所述的方法,其进一步包括:
针对对应于第一最可能模式的第一二进位,基于以下各者确定用于所述第一二进位的上下文:
所述第一最可能模式是否属于模式的水平集合;
所述第一最可能模式是否属于模式的竖直集合;或
所述第一最可能模式是否属于模式的非角集合。
58.根据权利要求56所述的方法,其进一步包括:
针对对应于第一最可能模式的第一二进位,基于以下各者确定用于所述第一二进位的上下文:
从所述第一最可能模式到水平模式的距离;或
从所述第一最可能模式到竖直模式的距离。
59.根据权利要求47所述的方法,其进一步包括:
以固定次序检查邻近块群组以确定来自所述邻近块群组的邻近块是否经帧内译码,其中所述邻近块群组包括所述第一邻近块、所述第二邻近块、所述第三邻近块及至少一个其它邻近块;及
以所述固定次序添加用以编码来自所述邻近块群组的邻近块的帧内预测模式到所述最可能模式候选列表中。
60.一种用于编码视频数据的装置,所述装置包含:
存储器,其经配置以存储所述视频数据;
一或多个处理器,其经配置以:
确定视频数据的当前块是使用帧内预测模式译码;
添加所述当前块的第一邻近块的帧内预测模式到用于所述当前块的最可能模式候选列表;
添加用于所述当前块的第二邻近块的帧内预测模式到用于所述当前块的所述最可能模式候选列表;
添加用于所述当前块的第三邻近块的帧内预测模式到用于所述当前块的所述最可能模式候选列表;
使用所述最可能模式候选列表确定帧内预测模式;及
使用所述帧内预测模式编码视频数据的所述当前块。
61.根据权利要求60所述的装置,其中所述一或多个处理器经配置以:
在添加所述第一邻近块及所述第二邻近块的所述帧内预测模式到所述最可能模式候选列表之后及在添加所述第三邻近块的所述帧内预测模式到所述最可能模式候选列表之前,添加一或多个默认候选者到所述最可能模式候选列表。
62.根据权利要求60所述的装置,其中所述一或多个处理器经配置以:
添加一或多个经导出帧内预测模式到所述最可能模式候选列表。
63.根据权利要求60所述的装置,其中为使用帧内预测模式编码视频数据的所述当前块,所述一或多个处理器经配置以:
产生所述帧内预测模式并非包含于所述最可能模式候选列表中的帧内预测模式的指示,以包含于包括所述视频数据的位流中;
产生指示所述帧内预测模式的其它语法,以包含于包括所述视频数据的所述位流中。
64.根据权利要求60所述的装置,其中为使用帧内预测模式编码视频数据的所述当前块,所述一或多个处理器经配置以:
确定所述帧内预测模式为包含于所述最可能模式候选列表中的帧内预测模式;
确定对应于包含于所述最可能模式候选列表中的所述帧内预测模式的索引值;
确定用于编码所述索引值的上下文;
使用所述经确定的上下文对所述索引值进行上下文编码。
65.根据权利要求64所述的装置,其中所述一或多个处理器经配置以:
基于所述经确定的上下文,将所述经上下文译码的索引值映射到二进位,以确定包括所述索引值的二进制化码字,其中所述二进制化码字对应于来自所述最可能模式候选列表的帧内预测模式。
66.根据权利要求65所述的装置,其中所述二进制化码字包括截断一元码字。
67.根据权利要求65所述的装置,其中所述二进制化码字的每一二进位经上下文译码。
68.根据权利要求65所述的装置,其中所述二进制化码字的每一二进位对应于所述最可能模式候选列表中的所述最可能模式中的一者。
69.根据权利要求65所述的装置,其中所述一或多个处理器经配置以:
基于对应于每一二进位的所述最可能模式的分类确定用于每一二进位的所述上下文。
70.根据权利要求69所述的装置,其中所述一或多个处理器经配置以:
针对对应于第一最可能模式的第一二进位,基于以下各者确定用于所述第一二进位的上下文:
所述第一最可能模式是否属于模式的水平集合;
所述第一最可能模式是否属于模式的竖直集合;或
所述第一最可能模式是否属于模式的非角集合。
71.根据权利要求70所述的装置,其中所述一或多个处理器经配置以:
针对对应于第一最可能模式的第一二进位,基于以下各者确定用于所述第一二进位的上下文:
从所述第一最可能模式到水平模式的距离;或
从所述第一最可能模式到竖直模式的距离。
72.根据权利要求60所述的装置,其中所述一或多个处理器经配置以:
以固定次序检查邻近块群组以确定来自所述邻近块群组的邻近块是否经帧内译码,其中所述邻近块群组包括所述第一邻近块、所述第二邻近块、所述第三邻近块及至少一个其它邻近块;及
以所述固定次序添加用以编码来自所述邻近块群组的邻近块的帧内预测模式到所述最可能模式候选列表中。
CN201780028534.7A 2016-05-13 2017-05-10 发送基于邻域的帧内预测模式信令方法和装置 Active CN109196869B (zh)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US201662336414P 2016-05-13 2016-05-13
US62/336,414 2016-05-13
US201662404128P 2016-10-04 2016-10-04
US62/404,128 2016-10-04
US15/590,261 2017-05-09
US15/590,261 US10547854B2 (en) 2016-05-13 2017-05-09 Neighbor based signaling of intra prediction modes
PCT/US2017/031924 WO2017196957A1 (en) 2016-05-13 2017-05-10 Neighbor based signaling of intra prediction modes

Publications (2)

Publication Number Publication Date
CN109196869A true CN109196869A (zh) 2019-01-11
CN109196869B CN109196869B (zh) 2021-11-02

Family

ID=58745423

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780028534.7A Active CN109196869B (zh) 2016-05-13 2017-05-10 发送基于邻域的帧内预测模式信令方法和装置

Country Status (9)

Country Link
US (2) US10547854B2 (zh)
EP (2) EP4145833A1 (zh)
JP (1) JP6998888B2 (zh)
KR (2) KR20230030052A (zh)
CN (1) CN109196869B (zh)
BR (1) BR112018073282A2 (zh)
CA (1) CA3020516A1 (zh)
TW (1) TWI775754B (zh)
WO (1) WO2017196957A1 (zh)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110166772A (zh) * 2019-03-12 2019-08-23 浙江大华技术股份有限公司 帧内预测模式的编解码方法、装置、设备和可读存储介质
CN110557645A (zh) * 2019-09-24 2019-12-10 腾讯科技(深圳)有限公司 帧内预测模式的解码方法、编码方法、装置及设备
CN112073729A (zh) * 2019-06-11 2020-12-11 北京三星通信技术研究有限公司 模型更新方法、装置、电子设备及计算机可读存储介质
WO2021023151A1 (en) * 2019-08-03 2021-02-11 Beijing Bytedance Network Technology Co., Ltd. Position based mode derivation in reduced secondary transforms for video
CN113424532A (zh) * 2019-03-21 2021-09-21 腾讯美国有限责任公司 视频编解码方法和装置
CN113678436A (zh) * 2019-04-12 2021-11-19 北京字节跳动网络技术有限公司 基于矩阵的帧内预测的最可能模式列表构造
CN113796077A (zh) * 2019-05-10 2021-12-14 联发科技股份有限公司 视频编解码之亮度mpm列表导出的方法及装置
WO2022095918A1 (en) * 2020-11-05 2022-05-12 FG Innovation Company Limited Device and method for coding video data
CN114501000A (zh) * 2019-04-10 2022-05-13 北京达佳互联信息技术有限公司 用于视频编码的方法和电子装置
US11575901B2 (en) 2019-08-17 2023-02-07 Beijing Bytedance Network Technology Co., Ltd. Context modeling of side information for reduced secondary transforms in video
US11575940B2 (en) 2019-05-10 2023-02-07 Beijing Bytedance Network Technology Co., Ltd. Context modeling of reduced secondary transforms in video
US11805275B2 (en) 2019-06-05 2023-10-31 Beijing Bytedance Network Technology Co., Ltd Context determination for matrix-based intra prediction
US11924469B2 (en) 2019-06-07 2024-03-05 Beijing Bytedance Network Technology Co., Ltd. Conditional signaling of reduced secondary transform in video bitstreams
US11943444B2 (en) 2019-05-31 2024-03-26 Beijing Bytedance Network Technology Co., Ltd. Restricted upsampling process in matrix-based intra prediction

Families Citing this family (80)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10218976B2 (en) 2016-03-02 2019-02-26 MatrixView, Inc. Quantization matrices for compression of video
US10182244B2 (en) 2016-03-02 2019-01-15 MatrixView, Inc. Fast encoding loss metric
CN109076241B (zh) * 2016-05-04 2023-06-23 微软技术许可有限责任公司 利用样本值的非相邻参考线进行帧内图片预测
US10547854B2 (en) 2016-05-13 2020-01-28 Qualcomm Incorporated Neighbor based signaling of intra prediction modes
US10506228B2 (en) 2016-10-04 2019-12-10 Qualcomm Incorporated Variable number of intra modes for video coding
US20180103251A1 (en) * 2016-10-07 2018-04-12 Industrial Technology Research Institute Method for selecting prediction mode of intra prediction, video encoding device and image processing apparatus
KR20180039324A (ko) * 2016-10-10 2018-04-18 디지털인사이트 주식회사 정방형 또는 직방형 블록의 화면 내 예측모드 정보 추출 방법 및 장치
CA3070444A1 (en) * 2017-07-24 2019-01-31 Arris Enterprises Llc Intra mode jvet coding
US11044471B2 (en) * 2017-07-28 2021-06-22 Electronics And Telecommunications Research Institute Image processing method, and image encoding/decoding method and device which use same
EP3711294A4 (en) * 2017-11-17 2021-07-28 Fg Innovation Company Limited DEVICE AND METHOD FOR CODING VIDEO DATA ON THE BASIS OF AN ADAPTED INTRAMODUS LIST
WO2019107927A1 (ko) * 2017-11-28 2019-06-06 한국전자통신연구원 양방향 인트라 예측 방법 및 장치
CN111989923A (zh) 2018-01-30 2020-11-24 松下电器(美国)知识产权公司 编码装置、解码装置、编码方法和解码方法
US10652534B2 (en) * 2018-03-08 2020-05-12 Tencent America LLC Methods and apparatus for directional intra prediction in video compression
US10771781B2 (en) * 2018-03-12 2020-09-08 Electronics And Telecommunications Research Institute Method and apparatus for deriving intra prediction mode
EP4216550A1 (en) * 2018-03-28 2023-07-26 FG Innovation Company Limited Device and method for coding video data in multiple reference line prediction
CN111971963A (zh) * 2018-03-29 2020-11-20 华为技术有限公司 图像编码和解码、图像编码器以及图像解码器
CN116527899A (zh) * 2018-04-01 2023-08-01 Oppo广东移动通信有限公司 使用帧内预测的图像编码/解码方法和装置
CN117834857A (zh) 2018-04-24 2024-04-05 三星电子株式会社 视频编码方法和装置以及视频解码方法和装置
EP3562158A1 (en) * 2018-04-27 2019-10-30 InterDigital VC Holdings, Inc. Method and apparatus for combined intra prediction modes
US20210250579A1 (en) * 2018-06-20 2021-08-12 Realnetworks, Inc. Intra-picture prediction in video coding systems and methods
WO2019243539A1 (en) * 2018-06-21 2019-12-26 Telefonaktiebolaget Lm Ericsson (Publ) Tile partitions with sub-tiles in video coding
WO2019245342A1 (ko) * 2018-06-21 2019-12-26 주식회사 케이티 비디오 신호 처리 방법 및 장치
TWI744661B (zh) 2018-06-29 2021-11-01 大陸商北京字節跳動網絡技術有限公司 要根據模式檢查的查找表中的運動候選的數量
CN110662052B (zh) 2018-06-29 2022-07-08 北京字节跳动网络技术有限公司 更新查找表(lut)的条件
KR20210025537A (ko) 2018-06-29 2021-03-09 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 하나 또는 다수의 룩업 테이블들을 사용하여 이전에 코딩된 모션 정보를 순서대로 저장하고 이를 사용하여 후속 블록들을 코딩하는 개념
KR20240005239A (ko) 2018-06-29 2024-01-11 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 Lut와 amvp 사이의 상호작용
CN110662056B (zh) 2018-06-29 2022-06-07 北京字节跳动网络技术有限公司 哪个查找表需要更新或不更新
CN114885173A (zh) 2018-06-29 2022-08-09 抖音视界(北京)有限公司 Lut中的运动候选的检查顺序
CN114845108A (zh) 2018-06-29 2022-08-02 抖音视界(北京)有限公司 查找表的更新:fifo、约束的fifo
BR112020024142A2 (pt) 2018-06-29 2021-03-02 Beijing Bytedance Network Technology Co., Ltd. método para processamento de vídeo, aparelho para codificação de dados de vídeo, meio de armazenamento e meio de gravação legíveis por computador não transitório
TW202021344A (zh) * 2018-07-01 2020-06-01 大陸商北京字節跳動網絡技術有限公司 依賴形狀的幀內編碼
TWI731364B (zh) 2018-07-02 2021-06-21 大陸商北京字節跳動網絡技術有限公司 Hmvp+非相鄰運動
KR20200005480A (ko) * 2018-07-06 2020-01-15 한국전자통신연구원 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체
US10701358B2 (en) * 2018-07-09 2020-06-30 Tencent America LLC Mode dependent primary and secondary transforms
KR20200006932A (ko) * 2018-07-11 2020-01-21 인텔렉추얼디스커버리 주식회사 화면내 예측 기반의 비디오 코딩 방법 및 장치
WO2020013480A1 (ko) * 2018-07-11 2020-01-16 엘지전자 주식회사 인트라 예측 모드를 코딩하는 방법 및 그 장치
CN112567741A (zh) * 2018-07-13 2021-03-26 Lg电子株式会社 图像编码系统中使用帧内预测信息的图像解码方法和装置
CA3103651A1 (en) * 2018-07-14 2020-01-23 Lg Electronics Inc. Image decoding method using intra prediction related information in image coding system and apparatus therefor
WO2020017786A1 (ko) * 2018-07-14 2020-01-23 엘지전자 주식회사 영상 코딩 시스템에서 인트라 예측 정보를 포함한 영상 정보 기반 영상 디코딩 방법 및 그 장치
US11509890B2 (en) * 2018-07-24 2022-11-22 Hfi Innovation Inc. Methods and apparatus for entropy coding and decoding aspects of video data
CN108881905B (zh) * 2018-08-04 2021-08-31 福州大学 基于概率的帧内编码器优化方法
JP7039731B2 (ja) * 2018-09-03 2022-03-22 ホアウェイ・テクノロジーズ・カンパニー・リミテッド イントラ予測のための方法及び装置
WO2020050678A1 (ko) * 2018-09-06 2020-03-12 엘지전자 주식회사 Mpm 리스트를 사용하는 인트라 예측 기반 영상 코딩 방법 및 그 장치
GB2590310B (en) 2018-09-12 2023-03-22 Beijing Bytedance Network Tech Co Ltd Conditions for starting checking HMVP candidates depend on total number minus K
CN112640453B (zh) 2018-09-13 2023-03-10 华为技术有限公司 帧内预测的方法和装置
US10771778B2 (en) 2018-09-14 2020-09-08 Tencent America LLC Method and device for MPM list generation for multi-line intra prediction
CN110933412B (zh) * 2018-09-19 2023-07-25 北京字节跳动网络技术有限公司 用于帧内块复制的基于历史的运动矢量预测值
EP3844964A4 (en) 2018-09-19 2021-11-03 Huawei Technologies Co., Ltd. METHOD AND DEVICE FOR PREDICTING THE MOST LIKELY INTRA-MODES
CA3113370A1 (en) * 2018-09-21 2020-03-26 Huawei Technologies Co., Ltd. Intra prediction mode derivation based on neighboring blocks
WO2020056779A1 (en) * 2018-09-22 2020-03-26 Hangzhou Hikvision Digital Technology Co., Ltd Adaptive construction of most probable modes candidate list for video data encoding and decoding
CN110944198B (zh) * 2018-09-24 2023-12-12 北京字节跳动网络技术有限公司 色度模式帧内编码
US11516506B2 (en) * 2018-10-05 2022-11-29 Lg Electronics Inc. Method and apparatus for processing image service
WO2020073911A1 (en) * 2018-10-09 2020-04-16 Huawei Technologies Co., Ltd. Devices and methods for image and video coding
KR20200041801A (ko) * 2018-10-12 2020-04-22 인텔렉추얼디스커버리 주식회사 영상 부호화/복호화 방법 및 장치
US11509891B2 (en) * 2018-11-04 2022-11-22 Lg Electronics Inc. Intra prediction method and apparatus in image coding system
CN113475071A (zh) 2018-12-20 2021-10-01 弗劳恩霍夫应用研究促进协会 使用具有邻近样本缩减的线性或者仿射变换的内预测
WO2020135206A1 (en) * 2018-12-29 2020-07-02 Zhejiang Dahua Technology Co., Ltd. Systems and methods for intra prediction
KR20240010576A (ko) 2019-01-10 2024-01-23 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 Lut 업데이트의 호출
WO2020143824A1 (en) 2019-01-13 2020-07-16 Beijing Bytedance Network Technology Co., Ltd. Interaction between lut and shared merge list
WO2020147773A1 (en) 2019-01-16 2020-07-23 Beijing Bytedance Network Technology Co., Ltd. Inserting order of motion candidates in lut
WO2020151807A1 (en) 2019-01-22 2020-07-30 Huawei Technologies Co., Ltd. Slot antenna and electronic device comprising said slot antenna
JP7197720B2 (ja) 2019-02-24 2022-12-27 北京字節跳動網絡技術有限公司 パレットモードの使用の指示の独立した符号化
GB2582023A (en) * 2019-03-08 2020-09-09 British Broadcasting Corp Method of signalling in a video codec
US20220174270A1 (en) * 2019-03-12 2022-06-02 Lg Electronics Inc. Method and device for configuring mpm list
US11405638B2 (en) * 2019-03-17 2022-08-02 Tencent America LLC Method and apparatus for video coding by determining intra prediction direction based on coded information of neighboring blocks
CN113812149B (zh) * 2019-03-22 2024-04-12 Lg电子株式会社 图像编译系统中的图像解码方法和设备以及图像编码方法和设备
CN113615193A (zh) 2019-03-22 2021-11-05 北京字节跳动网络技术有限公司 Merge列表构建和其他工具之间的交互
ES2966479T3 (es) 2019-03-23 2024-04-22 Huawei Tech Co Ltd Un codificador, un decodificador y métodos correspondientes para la intrapredicción
KR20210126765A (ko) * 2019-03-23 2021-10-20 엘지전자 주식회사 영상 코딩 시스템에서의 인트라 예측 기반 영상 코딩
US11134257B2 (en) * 2019-04-04 2021-09-28 Tencent America LLC Simplified signaling method for affine linear weighted intra prediction mode
US20220224891A1 (en) * 2019-05-10 2022-07-14 Mediatek Inc. Method and Apparatus of Chroma Direct Mode Generation for Video Coding
CN114128269A (zh) * 2019-06-14 2022-03-01 弗劳恩霍夫应用研究促进协会 内预测模式的编码
CA3147923A1 (en) * 2019-07-20 2021-01-28 Beijing Bytedance Network Technology Co., Ltd. Quantization process for palette mode
JP7359936B2 (ja) 2019-07-20 2023-10-11 北京字節跳動網絡技術有限公司 パレットモードの使用の指示の条件依存符号化
CN114145013B (zh) 2019-07-23 2023-11-14 北京字节跳动网络技术有限公司 调色板模式编解码的模式确定
US11375220B2 (en) 2019-11-27 2022-06-28 Tencent America LLC Method and apparatus for video decoding using a nominal directional mode and an angular offset
US11330266B2 (en) * 2020-05-18 2022-05-10 Tencent America LLC Signaling method for chroma intra prediction mode
US11206428B1 (en) 2020-07-14 2021-12-21 Tencent America LLC Method and apparatus for frequency-dependent joint component secondary transform
US20230112074A1 (en) * 2021-10-08 2023-04-13 Tencent America LLC Mpm list construction
WO2023202557A1 (en) * 2022-04-19 2023-10-26 Mediatek Inc. Method and apparatus of decoder side intra mode derivation based most probable modes list construction in video coding system

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101605255A (zh) * 2008-06-12 2009-12-16 华为技术有限公司 一种视频编解码的方法及装置
WO2012119569A1 (zh) * 2011-03-10 2012-09-13 华为技术有限公司 预测模式的编解码方法、编解码设备及网络系统
WO2012171463A1 (en) * 2011-06-17 2012-12-20 Mediatek Inc. Method and apparatus for coding of intra prediction mode
CN102918844A (zh) * 2010-05-30 2013-02-06 Lg电子株式会社 增强的帧内预测模式信令
CN103229507A (zh) * 2010-11-25 2013-07-31 Lg电子株式会社 使用信号通知图像信息的方法和使用该方法来解码图像信息的方法
CN103765892A (zh) * 2011-06-28 2014-04-30 三星电子株式会社 使用帧内预测对视频编码的方法和设备及对视频解码的方法和设备
CN103959775A (zh) * 2011-11-04 2014-07-30 高通股份有限公司 帧内模式视频译码
CN103959789A (zh) * 2011-10-07 2014-07-30 株式会社泛泰 利用候选帧内预测模式对帧内预测模式编码/解码的方法和设备
US9344728B2 (en) * 2011-11-04 2016-05-17 Infobridge Pte. Ltd. Method of generating reconstructed block

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7386048B2 (en) * 2002-05-28 2008-06-10 Sharp Laboratories Of America, Inc. Methods and systems for image intra-prediction mode organization
KR101527085B1 (ko) * 2009-06-30 2015-06-10 한국전자통신연구원 인트라 부호화/복호화 방법 및 장치
US8923395B2 (en) 2010-10-01 2014-12-30 Qualcomm Incorporated Video coding using intra-prediction
CN104811718A (zh) 2010-10-26 2015-07-29 数码士控股有限公司 自适应帧内预测编码和解码方法
EP2661880A4 (en) 2011-01-07 2016-06-29 Mediatek Singapore Pte Ltd METHOD AND DEVICE FOR IMPROVED CODING OF INTRA-LUMA PREDICTION MODE
CN103314588B (zh) 2011-01-07 2016-05-11 联发科技(新加坡)私人有限公司 编码方法与装置以及解码方法与装置
JP5781313B2 (ja) * 2011-01-12 2015-09-16 株式会社Nttドコモ 画像予測符号化方法、画像予測符号化装置、画像予測符号化プログラム、画像予測復号方法、画像予測復号装置及び画像予測復号プログラム
US9532058B2 (en) 2011-06-03 2016-12-27 Qualcomm Incorporated Intra prediction mode coding with directional partitions
US9654785B2 (en) * 2011-06-09 2017-05-16 Qualcomm Incorporated Enhanced intra-prediction mode signaling for video coding using neighboring mode
PT2773118T (pt) * 2011-10-24 2020-09-25 Innotive Ltd Método e aparelho para descodificação de imagens
CN108174205A (zh) * 2011-12-05 2018-06-15 Lg 电子株式会社 帧内预测的方法和设备
US20130163664A1 (en) 2011-12-22 2013-06-27 Qualcomm Incorporated Unified partition mode table for intra-mode coding
WO2014054267A1 (ja) 2012-10-01 2014-04-10 パナソニック株式会社 画像符号化装置及び画像符号化方法
US10306229B2 (en) 2015-01-26 2019-05-28 Qualcomm Incorporated Enhanced multiple transforms for prediction residual
US10681379B2 (en) 2015-09-29 2020-06-09 Qualcomm Incorporated Non-separable secondary transform for video coding with reorganizing
US10425648B2 (en) 2015-09-29 2019-09-24 Qualcomm Incorporated Video intra-prediction using position-dependent prediction combination for video coding
US10547854B2 (en) 2016-05-13 2020-01-28 Qualcomm Incorporated Neighbor based signaling of intra prediction modes
US10506228B2 (en) 2016-10-04 2019-12-10 Qualcomm Incorporated Variable number of intra modes for video coding

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101605255A (zh) * 2008-06-12 2009-12-16 华为技术有限公司 一种视频编解码的方法及装置
CN102918844A (zh) * 2010-05-30 2013-02-06 Lg电子株式会社 增强的帧内预测模式信令
CN103229507A (zh) * 2010-11-25 2013-07-31 Lg电子株式会社 使用信号通知图像信息的方法和使用该方法来解码图像信息的方法
WO2012119569A1 (zh) * 2011-03-10 2012-09-13 华为技术有限公司 预测模式的编解码方法、编解码设备及网络系统
CN102685474A (zh) * 2011-03-10 2012-09-19 华为技术有限公司 预测模式的编解码方法、编解码设备及网络系统
WO2012171463A1 (en) * 2011-06-17 2012-12-20 Mediatek Inc. Method and apparatus for coding of intra prediction mode
CN103765892A (zh) * 2011-06-28 2014-04-30 三星电子株式会社 使用帧内预测对视频编码的方法和设备及对视频解码的方法和设备
CN103959789A (zh) * 2011-10-07 2014-07-30 株式会社泛泰 利用候选帧内预测模式对帧内预测模式编码/解码的方法和设备
CN103959775A (zh) * 2011-11-04 2014-07-30 高通股份有限公司 帧内模式视频译码
US9344728B2 (en) * 2011-11-04 2016-05-17 Infobridge Pte. Ltd. Method of generating reconstructed block

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JIANLE CHEN ET AL: "《Joint Video Exploration Team(JVET) of IUT-T SG 16 WP 3 and IOS/IEC JTC 1/SC 29/WG 11 JVET-B1001》", 26 February 2016 *
MOHANMED GOLAM SARWER; Q.M.JONATHAN WU: "《Effective Video Coding for Multimedia Applications》", 26 April 2011 *

Cited By (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110166772A (zh) * 2019-03-12 2019-08-23 浙江大华技术股份有限公司 帧内预测模式的编解码方法、装置、设备和可读存储介质
CN113424532B (zh) * 2019-03-21 2024-04-05 腾讯美国有限责任公司 视频编解码方法、装置和存储介质
CN113424532A (zh) * 2019-03-21 2021-09-21 腾讯美国有限责任公司 视频编解码方法和装置
CN114501000A (zh) * 2019-04-10 2022-05-13 北京达佳互联信息技术有限公司 用于视频编码的方法和电子装置
CN114501000B (zh) * 2019-04-10 2022-11-22 北京达佳互联信息技术有限公司 用于视频编码的方法和电子装置
US11831877B2 (en) 2019-04-12 2023-11-28 Beijing Bytedance Network Technology Co., Ltd Calculation in matrix-based intra prediction
CN113678436B (zh) * 2019-04-12 2023-11-24 北京字节跳动网络技术有限公司 基于矩阵的帧内预测的最可能模式列表构造
CN113678436A (zh) * 2019-04-12 2021-11-19 北京字节跳动网络技术有限公司 基于矩阵的帧内预测的最可能模式列表构造
US11611779B2 (en) 2019-05-10 2023-03-21 Beijing Bytedance Network Technology Co., Ltd. Multiple secondary transform matrices for video processing
CN113796077B (zh) * 2019-05-10 2023-12-26 寰发股份有限公司 视频编解码之亮度mpm列表导出的方法及装置
US11956421B2 (en) 2019-05-10 2024-04-09 Hfi Innovation Inc. Method and apparatus of luma most probable mode list derivation for video coding
US11575940B2 (en) 2019-05-10 2023-02-07 Beijing Bytedance Network Technology Co., Ltd. Context modeling of reduced secondary transforms in video
CN113796077A (zh) * 2019-05-10 2021-12-14 联发科技股份有限公司 视频编解码之亮度mpm列表导出的方法及装置
US11622131B2 (en) 2019-05-10 2023-04-04 Beijing Bytedance Network Technology Co., Ltd. Luma based secondary transform matrix selection for video processing
US11943444B2 (en) 2019-05-31 2024-03-26 Beijing Bytedance Network Technology Co., Ltd. Restricted upsampling process in matrix-based intra prediction
US11805275B2 (en) 2019-06-05 2023-10-31 Beijing Bytedance Network Technology Co., Ltd Context determination for matrix-based intra prediction
US11924469B2 (en) 2019-06-07 2024-03-05 Beijing Bytedance Network Technology Co., Ltd. Conditional signaling of reduced secondary transform in video bitstreams
CN112073729A (zh) * 2019-06-11 2020-12-11 北京三星通信技术研究有限公司 模型更新方法、装置、电子设备及计算机可读存储介质
CN112073729B (zh) * 2019-06-11 2024-04-05 北京三星通信技术研究有限公司 模型更新方法、装置、电子设备及计算机可读存储介质
WO2021023151A1 (en) * 2019-08-03 2021-02-11 Beijing Bytedance Network Technology Co., Ltd. Position based mode derivation in reduced secondary transforms for video
US11638008B2 (en) 2019-08-03 2023-04-25 Beijing Bytedance Network Technology Co., Ltd. Selection of matrices for reduced secondary transform in video coding
US11882274B2 (en) 2019-08-03 2024-01-23 Beijing Bytedance Network Technology Co., Ltd Position based mode derivation in reduced secondary transforms for video
US11575901B2 (en) 2019-08-17 2023-02-07 Beijing Bytedance Network Technology Co., Ltd. Context modeling of side information for reduced secondary transforms in video
US11968367B2 (en) 2019-08-17 2024-04-23 Beijing Bytedance Network Technology Co., Ltd. Context modeling of side information for reduced secondary transforms in video
CN110557645A (zh) * 2019-09-24 2019-12-10 腾讯科技(深圳)有限公司 帧内预测模式的解码方法、编码方法、装置及设备
WO2022095918A1 (en) * 2020-11-05 2022-05-12 FG Innovation Company Limited Device and method for coding video data

Also Published As

Publication number Publication date
KR20230030052A (ko) 2023-03-03
TWI775754B (zh) 2022-09-01
JP2019515580A (ja) 2019-06-06
CA3020516A1 (en) 2017-11-16
EP4145833A1 (en) 2023-03-08
US20200195935A1 (en) 2020-06-18
US11082703B2 (en) 2021-08-03
KR102578959B1 (ko) 2023-09-14
TW201740728A (zh) 2017-11-16
WO2017196957A1 (en) 2017-11-16
US20170332084A1 (en) 2017-11-16
EP3456056A1 (en) 2019-03-20
JP6998888B2 (ja) 2022-01-18
KR20190007427A (ko) 2019-01-22
BR112018073282A2 (pt) 2019-02-19
CN109196869B (zh) 2021-11-02
US10547854B2 (en) 2020-01-28

Similar Documents

Publication Publication Date Title
CN109196869A (zh) 帧内预测模式的基于邻近的发信号
CN109716771A (zh) 用于视频译码的线性模型色度帧内预测
CN106105206B (zh) 用于使用置零系数的低复杂度正变换的系统和方法
CN105379266B (zh) 停用帧内预测滤波
CN106105201B (zh) 使用像素距离的解块滤波
CN105393536B (zh) 使用位移向量从预测性块的帧内预测
CN104247421B (zh) 用于系数扫描的系数群及系数译码
CN105493507B (zh) 用于帧内块复制的残余预测
CN109716774A (zh) 用于视频译码的可变数目的帧内模式
CN108781282A (zh) 在视频译码中以单独亮度-色度框架将亮度信息用于色度预测
CN104067524B (zh) 具有精简的初始化值集合的上下文自适应熵译码
CN109691102A (zh) 跨分量滤波器
CN108353167A (zh) 译码视频数据的正负号信息
CN104396247B (zh) 用于视频译码的基于lcu的自适应环路滤波的方法和装置
CN103959779B (zh) 在视频译码中用于自适应环路滤波和样本自适应偏移的基于最大译码单元(lcu)或分区的语法
CN110100436A (zh) 使用导出色度模式译码视频数据
CN110024393A (zh) 用于视频译码的低复杂度符号预测
CN103636225B (zh) 用信号发送用于叶层级译码单元的子集的变换系数的语法元素
CN108605126A (zh) 从用于视频译码的固定滤波器预测滤波器系数
CN109644275A (zh) 用于视频译码的树型译码
CN110100439A (zh) 用于视频译码的帧内预测技术
CN108141608A (zh) 针对视频译码使用与位置相关的预测组合的改进视频帧内预测
CN108464001A (zh) 用于视频译码的多类型树框架
CN108028932A (zh) 用于视频译码的调色板预测初始化及合并
CN106664425A (zh) 视频译码中的跨分量预测

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant