CN103404144A - 视频译码中的经量化脉码调制 - Google Patents

视频译码中的经量化脉码调制 Download PDF

Info

Publication number
CN103404144A
CN103404144A CN2012800116666A CN201280011666A CN103404144A CN 103404144 A CN103404144 A CN 103404144A CN 2012800116666 A CN2012800116666 A CN 2012800116666A CN 201280011666 A CN201280011666 A CN 201280011666A CN 103404144 A CN103404144 A CN 103404144A
Authority
CN
China
Prior art keywords
video data
video
decoding
quantization step
block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2012800116666A
Other languages
English (en)
Other versions
CN103404144B (zh
Inventor
霍埃尔·索赖·罗哈斯
马尔塔·卡切维奇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of CN103404144A publication Critical patent/CN103404144A/zh
Application granted granted Critical
Publication of CN103404144B publication Critical patent/CN103404144B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock

Abstract

经量化PCM模式包含对样本进行量化以便将失真添加到经译码视频的步骤。以此方式,用经量化PCM译码的视频块显得比已用例如帧间预测译码或帧内预测译码等其它有损压缩技术译码的邻近视频块更均匀。视频编码器首先可在对经量化样本进行PCM译码之前通过量化步长对输入视频样本进行量化。可在经编码视频位流中将此量化步长用信号发出到解码器。视频解码器可接收包含经量化的经PCM译码视频样本的经编码视频位流。首先使用脉码解调来对这些样本进行解码,且接着通过用以对视频进行编码的相同量化步长来进行反量化。所述视频解码器可从所述经编码视频位流中的输出位深度提取此量化步长。

Description

视频译码中的经量化脉码调制
本申请案主张2011年3月4日申请的第61/449,413号美国临时申请案的权益,所述临时申请案特此以其全文引用的方式并入本文中。
技术领域
本发明涉及视频译码,且更确切来说,涉及用于视频数据的经量化脉码调制(PCM)的技术。
背景技术
数字视频能力可并入到广泛范围的装置中,所述装置包含数字电视、数字直播系统、无线广播系统、个人数字助理(PDA)、膝上型或桌上型计算机、数码相机、数字记录装置、数字媒体播放器、视频游戏装置、视频游戏控制台、蜂窝式或卫星无线电电话、视频远程电话会议装置,等等。数字视频装置实施视频压缩技术以更有效地发射、接收和存储数字视频信息,所述视频压缩技术例如以下各者中描述的那些技术:由MPEG-2、MPEG-4、ITU-T H.263、ITU-T H.264/MPEG-4第10部分(高级视频译码(AVC))定义的标准、当前在开发中的高效率视频译码(HEVC)标准,和此类标准的扩展。
视频压缩技术包含空间预测和/或时间预测,以减少或移除视频序列中所固有的冗余。对于基于块的视频译码,可将一视频帧或切片分割成若干块。可进一步分割每一块。帧内译码(I)帧或切片中的块使用相对于同一帧或切片中的相邻块中的参考样本的空间预测来编码。帧间译码(P或B)帧或切片中的块可使用相对于同一帧或切片中的相邻块中的参考样本的空间预测或相对于其它参考帧中的参考样本的时间预测。空间或时间预测产生用于待译码的块的预测性块。残余数据表示待译码的原始块与预测性块之间的像素差。
帧间译码块根据指向形成预测性块的参考样本块的运动向量和指示经译码块与预测性块之间的差的残余数据来编码。帧内译码块根据帧内译码模式和残余数据来编码。为进一步压缩,可将残余数据从像素域变换到变换域,从而产生残余变换系数,接着可对残余变换系数进行量化。可按特定次序扫描最初布置成二维阵列的经量化变换系数以产生用于熵译码的变换系数的一维向量。
发明内容
一股来说,本发明描述用于使用经量化脉码调制(PCM)进行视频译码的装置和方法。经量化PCM包含对视频样本进行量化以使得在一些情况下可将失真添加到经译码视频的步骤。以此方式,用经量化PCM来译码的视频块显得比已用例如帧间预测译码或帧内预测译码等其它有损压缩技术来译码的邻近视频块更均匀。
举例来说,视频编码器首先可在对经量化样本进行PCM译码之前通过量化步长对输入视频样本进行量化。量化步长通常将失真添加到视频,且界定经量化的经PCM译码样本的输出位深度。可在经编码视频位流中将此量化步长和/或输出位深度用信号发出到解码器。作为一个实例,可包含输出位深度的指示作为经编码位流的序列标头中的4位语法元素。
作为另一实例,视频解码器可接收包含经量化经PCM译码视频样本的经编码视频位流。此类样本首先使用脉码解调来解码,且接着通过用以对视频进行编码的相同量化步长来进行反量化。作为一个实例,视频解码器可从经编码视频位流提取此量化步长。
在一个实例中,本发明描述一种用于对视频数据进行译码的方法,其包括:使用经量化脉码调制根据输出位深度对视频数据块的样本进行译码。经量化脉码调制包含根据界定量化的量以产生输出位深度的量化步长来对视频数据块的样本进行量化,且对经量化样本进行脉码调制。本发明还描述一种用于对视频数据进行解码的方法,其包括:使用脉码解调来对经译码视频数据块的样本进行解码;以及根据量化步长对经解码样本进行反量化。
在另一实例中,本发明描述一种经配置以对视频数据进行译码的设备。所述设备包含视频编码单元,其经配置以使用经量化脉码调制根据输出位深度对视频数据块的样本进行译码。视频译码单元包含:量化单元,其经配置以根据界定量化的量以产生输出位深度的量化步长来对视频数据块的样本进行量化;以及调制单元,其经配置以使用脉码调制来对经量化样本进行译码。本发明还描述一种经配置以对视频数据进行解码的设备。所述设备包含视频解码单元,其经配置以根据输出位深度对已用经量化脉码调制编码的经译码视频数据块的样本进行解码。视频解码单元包含:解调单元,其经配置以使用脉码解调来对经译码视频数据块的样本进行解码;以及反量化单元,其经配置以根据量化步长来对经解码样本进行反量化。
在另一实例中,本发明描述一种包括计算机可读存储媒体的计算机程序产品,所述计算机可读存储媒体上存储有若干指令,所述指令在执行时致使用于对视频进行译码的装置的处理器使用经量化脉码调制根据输出位深度对视频数据块的样本进行译码。用以使用经量化脉码调制来对视频数据块的样本进行译码的指令包含用以根据界定量化的量以产生输出位深度的量化步长来对视频数据块的样本进行量化且用以对经量化样本进行脉码调制的指令。本发明还描述一种用以对视频数据进行解码的计算机程序产品,所述计算机程序产品包含用以根据输出位深度对已用经量化脉码调制编码的经译码视频数据块的样本进行解码的指令。用以对视频数据块的样本进行解码的指令包含用以使用脉码解调来对经译码视频数据块的样本进行解码且用以根据量化步长来对经解码样本进行反量化的指令。
在随附图式及下文描述中阐述本发明的一个或一个以上实施例的细节。从描述和图式,以及从权利要求书将明白本发明的其它特征、目标和优势。
附图说明
图1是说明实例视频编码和解码系统的框图。
图2是说明实例视频编码器的框图。
图3是说明视频编码器的实例经量化PCM单元的框图。
图4描绘具有序列标头的实例经编码视频位流。
图5是说明实例视频解码器的框图。
图6是说明视频解码器的实例经量化PCM解码单元的框图。
图7是说明实例编码过程的流程图。
图8是说明实例解码过程的流程图。
具体实施方式
数字视频装置实施视频压缩技术以更有效地发射和接收数字视频信息。视频压缩可应用空间(即,帧内)预测和/或时间(即,帧间)预测技术来减少或移除视频序列中固有的冗余。
对于根据高效视频译码(HEVC)标准的视频译码,可将视频帧分割为译码单元、预测单元和变换单元。译码单元通常指代充当为视频压缩而应用各种译码工具的基本单元的图像区域。译码单元通常为正方形形状,且可被认为类似于例如在例如ITU-T H.264等其它视频译码标准下的所谓的宏块。译码单元可根据四分树分割方案而分割为越来越小的译码单元。
为了实现较好译码效率,译码单元可具有取决于视频内容的可变大小。另外,译码单元可分裂为较小的块以用于预测或变换。确切来说,每一译码单元可进一步分割为预测单元和变换单元。预测单元可被认为类似于在其它视频译码标准下的所谓的宏块分割区。变换单元指代应用变换以产生变换系数的残余数据块。
译码单元通常具有表示为Y的一个明度分量和表示为U和V的两个色度分量。取决于视频取样格式,U和V分量的大小就样本数目而言可与Y分量的大小相同或不同。
为了对块(例如,视频数据的预测单元)进行译码,首先导出块的预测子。可通过帧内(I)预测(即,空间预测)或帧间(P或B)预测(即,时间预测)来导出预测子。因此,一些预测单元可使用相对于同一帧中的相邻参考块的空间预测来进行帧内译码(I),且其它预测单元可相对于其它帧中的参考块来进行帧间译码(P或B)。
在识别预测子后,计算原始视频数据块与其预测子之间的差。此差还被称作预测残余,且指代待译码的块中的像素与参考块(即,预测子)之间的像素差。为了实现较好压缩,预测残余通常(例如)使用离散余弦变换(DCT)、整数变换、卡洛南-洛伊(K-L)变换或其它变换来变换。
变换将空间域中的像素差值转换成变换域(例如,频域)中的变换系数。变换系数通常布置成用于每一变换单元的二维(2-D)阵列。为进一步压缩,变换系数可经量化。熵译码器接着将熵译码(各自为上下文自适应性可变长度译码(CAVLC)、上下文自适应性二进制算术译码(CABAC)等等)应用于经量化变换系数。
在使用上文所描述的技术的一些情况下,有可能视频编码器充当数据扩展器而非数据压缩器。尽管编码器通常实现大多数视频内容的极好压缩,但含有变换域中的非典型内容的视频帧的经隔离部分可产生大量的经编码数据。因此,对于某视频内容,编码器可不满足压缩视频数据的目标,而是可产生过量数据。对于这些情况,视频编码器可通过应用脉码调制(PCM)译码而非预测性译码来改进总视频压缩。PCM译码通常为无损译码过程,其对视频数据的个别样本进行编码而无基于预测的压缩。
作为实例,MPEG-2视频译码标准指定可针对视频数据的经编码宏块产生的经译码位的数目的上限。上限通过指定所获得且接着经处理以用于宏块解码的数据的特定量而有助于解码器设计。超过此上限的译码位的产生将与MPEG-2解码器设计不一致。
在由ITU-T H.264/MPEG-4AVC标准(下文中为H.264)指定的帧内PCM模式中,编码器发射宏块的样本值而不进行预测、变换译码和熵译码。即,在宏块的帧内PCM模式中,编码器简单地使用(例如)每样本8位来对宏块的区域中的像素值进行编码。编码器产生经PCM编码的像素值作为原始字节值。帧内PCM模式允许编码器将每一宏块的位的数目调整到预定值或预定值以下而无复杂计算。
H.264中的帧内PCM模式译码的使用由宏块模式语法元素指示。当使用帧内PCM模式译码时,发射每一相关联的宏块的样本值而不进行预测、变换译码和熵译码。注意,当熵译码为上下文自适应性二进制算术译码(CABAC)时,终止二进制算术译码(BAC)且在发射样本值之前进行初始化。
HEVC的当前模型并无与H.264中的帧内PCM相当的工具。一个问题在于HEVC的特性不同于H.264的特性。在H.264中,数据量限于宏块层级,宏块层级具有16×16像素的大小。相对比地,HEVC具有多达64×64像素或可能更大的译码单元和预测单元。因此,限制每单元的数据量的约束在HEVC中比针对H.264的情况要高,以便满足实践中可见的一些网络要求。
H.264中的帧内PCM模式的另一问题在于其为无损的。在无损译码的情况下,经编码数据具有在解码器侧处的理想重建。因此,完全无失真的宏块可在原本有损的经编码帧中出现。此情形归因于无损数据与邻近有损数据之间的视觉差异而可为视觉上震撼的或至少视觉上显而易见的。
HEVC的又一问题在于其可支持8位、10位、12位或甚至更大位深度的内容。因此,具有每样本12位的64×64译码单元(或更大)的发信号可产生PCM模式的不合需要的量的数据。
本发明引入经量化PCM模式的概念以供在视频译码过程(例如,根据H.264和HEVC标准定义的视频译码过程)中使用。在经量化PCM模式中,视频编码器在应用PCM译码之前对输入像素的块进行量化。类似地,当已使用经量化PCM模式来对视频数据进行译码时,视频解码器将首先对经译码视频数据进行脉冲解调,且接着应用反量化。译码单元(HEVC)、预测单元(HEVC)、变换单元(HEVC)、宏块(H.264)和分割区(H.264)在本发明中通常将被称作块。
经量化PCM模式可支持两个目标。第一,经量化PCM译码可准许编码器指定关于不同情形(例如,不同层级、配置文件、帧速率、量化参数(QP)、分辨率等等)下的译码单元的最大数据量的灵活限制。在无此限制的情况下,PCM译码可涵盖块的可用译码位的层级。此灵活性可通过应用上下文特定量化步长以便控制输出位深度及因此的针对经PCM译码视频数据而产生的最大数据量来实现。第二,通过将损失引入到PCM过程中,经量化PCM译码可以直接方式减少或消除包含有损和无损部分两者的视频帧的不合需要的视觉外观。
图1是说明根据本发明的实例的实例视频编码和解码系统10的框图,视频编码和解码系统10可经配置以利用用于经量化脉码调制/解调的技术。如图1中所示,系统10包含源装置12,其经由通信信道16将经编码视频发射到目的地装置14。经编码视频还可存储在存储媒体34或文件服务器36上,且可在需要时由目的地装置14存取。源装置12和目的地装置14可包括广泛多种装置中的任一者,包含桌上型计算机、笔记本(即,膝上型)计算机、平板计算机、机顶盒、例如所谓的智能电话等电话手持机、电视、相机、显示装置、数字媒体播放器、视频游戏控制台等等。在许多情况下,此类装置可经配备用于无线通信。因此,通信信道16可包括无线信道、有线信道,或适于传输经编码视频数据的无线与有线信道的组合。类似地,文件服务器36可由目的地装置14通过任何标准数据连接(包含因特网连接)加以存取。此可包含无线信道(例如,Wi-Fi连接)、有线连接(例如,DSL、电缆调制解调器,等),或适于存取存储在文件服务器上的经编码视频数据的无线信道与有线连接两者的组合。
根据本发明的实例的用于经量化脉码调制/解调的技术可应用于视频译码以支持多种多媒体应用中的任一者,所述多媒体应用例如空中电视广播、有线电视传输、卫星电视传输、流式视频传输(例如,经由因特网)、用于存储在数据存储媒体上的数字视频的编码、存储在数据存储媒体上的数字视频的解码,或其它应用。在一些实例中,系统10可经配置以支持单向或双向视频传输以支持例如视频流式传输、视频回放、视频广播和/或视频电话等应用。
在图1的实例中,源装置12包含视频源18、视频编码器20、调制器/解调器22和发射器24。在源装置12中,视频源18可包含例如以下各者等源:视频俘获装置,例如摄像机;含有先前俘获的视频的视频存档;用以从视频内容提供者接收视频的视频馈送接口;和/或用于产生计算机图形数据作为源视频的计算机图形系统,或此类源的组合。作为一个实例,如果视频源18为摄像机,那么源装置12和目的地装置14可形成所谓的相机电话或视频电话。然而,本发明中所描述的技术一股可适用于视频译码,且可应用于无线和/或有线应用。
可由视频编码器20来对经俘获的、经预先俘获的或计算机产生的视频进行编码。经编码的视频信息可由调制解调器22根据通信标准(例如,无线通信协议)来调制,且经由发射器24而发射到目的地装置14。调制解调器22可包含各种混频器、滤波器、放大器或经设计以用于信号调制的其它组件。发射器24可包含经设计以用于发射数据的电路,包含放大器、滤波器和一个或一个以上天线。
由视频编码器20编码的经俘获、经预先俘获或计算机产生的视频还可存储在存储媒体34或文件服务器36上以供稍后消耗。存储媒体34可包含蓝光光盘、DVD、CD-ROM、闪存存储器,或用于存储经编码视频的任何其它合适数字存储媒体。存储在存储媒体34上的经编码视频可接着由目的地装置14存取以进行解码并回放。
文件服务器36可为能够存储经编码视频并将所述经编码视频传输到目的地装置14的任何类型的服务器。实例文件服务器包含web服务器(例如,用于网站)、FTP服务器、网络附接存储(NAS)装置、本地磁盘驱动器,或能够存储经编码视频数据并将经编码视频数据传输到目的地装置的任何其它类型的装置。经编码视频数据从文件服务器36的传输可为流式传输、下载传输,或两者的组合。文件服务器36可由目的地装置14通过任何标准数据连接(包含因特网连接)加以存取。此可包含无线信道(例如,Wi-Fi连接)、有线连接(例如,DSL、电缆调制解调器、以太网、USB,等),或适于存取存储在文件服务器上的经编码视频数据的无线信道与有线连接两者的组合。
在图1的实例中,目的地装置14包含接收器26、调制解调器28、视频解码器30和显示装置32。目的地装置14的接收器26经由信道16接收信息,且调制解调器28对所述信息进行解调以产生用于视频解码器30的经解调的位流。经由信道16传达的信息可包含由视频编码器20产生以供由视频解码器30用于对视频数据进行解码的多种语法信息。此语法还可与存储在存储媒体34或文件服务器36上的经编码视频数据包含在一起。视频编码器20和视频解码器30中的每一者可形成能够对视频数据进行编码或解码的相应编码器-解码器(编解码器(CODEC))的部分。
显示装置32可与目的地装置14集成或在目的地装置14外部。在一些实例中,目的地装置14可包含集成式显示装置,且还经配置以与外部显示装置介接。在其它实例中,目的地装置14可为显示装置。一股来说,显示装置32向用户显示经解码的视频数据,且可包括多种显示装置中的任一者,例如液晶显示器(LCD)、等离子体显示器、有机发光二极管(OLED)显示器或另一类型的显示装置。
在图1的实例中,通信信道16可包括任何无线或有线通信媒体,例如,射频(RF)频谱或一个或一个以上物理传输线,或无线和有线媒体的任何组合。通信信道16可形成例如局域网、广域网或例如因特网等全球网络的基于包的网络的部分。通信信道16通常表示用于将视频数据从源装置12传输到目的地装置14的任何合适的通信媒体或不同通信媒体的集合,包含有线或无线媒体的任何合适组合。通信信道16可包含可用于促进从源装置12到目的地装置14的通信的路由器、交换器、基站或任何其它设备。
视频编码器20和视频解码器30可根据例如当前在开发中的高效视频译码(HEVC)标准等视频压缩标准操作,且可符合HEVC测试模型(HM)。或者,视频编码器20和视频解码器30可根据其它专有或工业标准操作,所述标准例如或者被称作MPEG-4第10部分(高级视频译码(AVC))的ITU-T H.264标准,或此类标准的扩展。然而,本发明的技术不限于任何特定译码标准。其它实例包含MPEG-2和ITU-T H.263。
尽管图1中未展示,但在一些方面中,视频编码器20和视频解码器30可各自与音频编码器和解码器集成,且可包含适当的多路复用器-多路分用器(MUX-DEMUX)单元或其它硬件及软件,以处置对共同数据流或单独数据流中的音频与视频两者的编码。如果适用,那么在一些实例中,MUX-DEMUX单元可符合ITU H.223多路复用器协议或例如用户数据报协议(UDP)等其它协议。
视频编码器20和视频解码器30各自可实施为例如一个或一个以上微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑、软件、硬件、固件或其任何组合的多种合适编码器电路中的任一者。当所述技术部分地以软件实施时,装置可将用于所述软件的指令存储在合适的非暂时性计算机可读媒体中,且使用一个或一个以上处理器执行硬件中的指令以执行本发明的技术。视频编码器20和视频解码器30中的每一者可包含在一个或一个以上编码器或解码器中,其中任一者可作为经组合的编码器/解码器(CODEC)的部分集成在相应装置中。
视频编码器20可实施本发明的技术中的任一者或全部以在视频编码过程中使用经量化PCM模式。同样,视频解码器30可实施这些技术中的任一者或全部以在视频解码过程中使用经量化PCM模式。如本文中所描述的视频译码器可指代视频编码器或视频解码器。类似地,视频编码器和视频解码器可分别被称作视频编码单元和视频解码单元。同样,视频译码可指代视频编码或视频解码。
图2是说明视频编码器20的实例的框图,视频编码器20可在视频译码过程中使用用于经量化PCM模式的技术,如本发明中所描述。将出于说明的目的在HEVC译码的上下文中描述视频编码器20,但不限制本发明的可获益于经量化PCM模式的其它译码标准或方法。除经量化PCM视频译码之外,视频编码器20还可执行视频帧内的译码单元的帧内和帧间译码。
帧内译码依赖于空间预测以减少或移除给定视频帧内的视频中的空间冗余。帧间译码依赖于时间预测以减少或移除视频序列的当前帧与先前经译码帧之间的时间冗余。帧内模式(I模式)可指代若干基于空间的视频压缩模式中的任一者。例如单向预测(P模式)或双向预测(B模式)等帧间模式可指代若干基于时间的视频压缩模式中的任一者。
如图2中所示,视频编码器20接收待编码的视频帧内的当前视频块。在图2的实例中,视频编码器20包含运动补偿单元44、运动估计单元42、帧内预测单元46、经量化PCM单元47、参考帧缓冲器64、求和器50、变换单元52、变换量化单元54和熵译码单元56。图2中所说明的变换单元52为将实际变换应用于残余数据块的单元,且不应与还可被称作CU的变换单元(TU)的变换系数块相混淆。对于视频块重建,视频编码器20还包含变换反量化单元58、反变换单元60和求和器62。还可包含解块滤波器(图2中未展示)以对块边界进行滤波,以从经重建的视频移除成块假影。在需要时,解块滤波器通常将对求和器62的输出进行滤波。
在编码过程期间,视频编码器20接收待译码的视频帧或切片。帧或切片可划分成多个视频块,例如最大译码单元(LCU)。运动估计单元42和运动补偿单元44相对于一个或一个以上参考帧中的一个或一个以上块对所接收视频块执行帧间预测性译码,以提供时间压缩。帧内预测单元46可相对于与待译码的块相同的帧或切片中的一个或一个以上相邻块对所接收视频块执行帧内预测性译码,以提供空间压缩。经量化PCM单元47根据本发明的技术对输入视频块执行经量化PCM译码。
模式选择单元40可例如基于每一模式的误差(即,失真)和/或压缩结果选择译码模式、帧内、帧间或经量化PCM中的一者。如果选择帧间或帧内模式,那么模式选择单元40将所得经帧内或帧间译码块提供到求和器50以产生残余块数据,以及提供到求和器62以重建经编码块以供在参考帧中使用。可将一些视频帧指明为I帧,其中I帧中的所有块在帧内预测模式下进行编码。在一些情况下,帧内预测单元46可例如在由运动估计单元42执行的运动搜索未产生足够的块预测时对P或B帧中的块执行帧内预测编码。
运动估计单元42与运动补偿单元44可高度集成,但出于概念上的目的而分开予以说明。运动估计是产生估计视频块的运动的运动向量的过程。举例来说,运动向量可指示当前帧中的预测单元相对于参考帧的参考样本的位移。参考样本可为经发现在像素差方面密切地匹配包含经译码的PU的CU的部分的块,像素差可通过绝对差总和(SAD)、平方差总和(SSD)或其它差异度量来确定。由运动补偿单元44执行的运动补偿可涉及基于由运动估计确定的运动向量来提取或产生预测单元的值。
运动估计单元42通过比较预测单元与存储在参考帧缓冲器64中的参考帧的参考样本来计算经帧间译码帧的预测单元的运动向量。在一些实例中,视频编码器20可计算存储在参考帧缓冲器64中的参考帧的子整数像素位置的值。举例来说,视频编码器20可计算四分之一像素位置、八分之一像素位置或参考帧的其它分数像素位置的值。因此,运动估计单元42可执行相对于全像素位置和分数像素位置的运动搜索,且输出具有分数像素精度的运动向量。运动估计单元42将所计算运动向量发送到熵译码单元56和运动补偿单元44。由运动向量识别的参考帧的部分可被称作参考样本。运动补偿单元44可例如通过检索由PU的运动向量识别的参考样本来计算当前CU的预测单元的预测值。
作为由运动估计单元42和运动补偿单元44执行的帧间预测译码的替代,帧内预测单元46可对所接收块执行帧内预测编码。在假定块的从左到右从上到下编码次序的情况下,帧内预测单元46可相对于相邻的先前经译码块(例如,在当前块的上方、右上方、左上方或左方的块)来对所接收块进行编码。帧内预测单元46可经配置以具有多种不同帧内预测模式。举例来说,帧内预测单元46可经配置以具有基于经编码的CU的大小的特定数目个定向预测模式,例如33个定向预测模式。
帧内预测单元46可通过(例如)计算各种帧内预测模式的误差值以及选择产生最低误差值的模式来选择帧内预测模式。定向预测模式可包含用于组合空间上相邻像素的值以及应用经组合的值以形成PU的预测性块的一个或一个以上像素的功能。一旦已计算PU中的所有像素位置的值,帧内预测单元46便可基于PU与预测性块之间的像素差计算预测模式的误差值。帧内预测单元46可继续测试帧内预测模式直到发现产生可接受误差值的帧内预测模式为止。帧内预测单元46接着可将PU发送到求和器50。
视频编码器20通过从经译码的原始视频块减去由运动补偿单元44或帧内预测单元46计算的预测数据来形成残余块。求和器50表示执行此减法运算的一个或一个以上组件。残余块可对应于像素差值的二维矩阵,其中残余块中的值的数目与对应于残余块的PU中的像素的数目相同。残余块中的值可对应于PU中与待译码的原始块中的同位置像素的值之间的差,即误差。所述差可取决于经译码的块的类型而为色度或明度差。
变换单元52可从残余块形成一个或一个以上变换单元(TU)。变换单元52将例如离散余弦变换(DCT)、定向变换或概念上类似的变换等变换应用到TU,从而产生包括变换系数的视频块。变换单元52可将所得变换系数发送到变换量化单元54。变换量化单元54接着可对变换系数进行量化。熵编码单元56接着可根据指定扫描次序执行矩阵中的经量化变换系数的扫描以产生一维阵列。本发明将熵译码单元56描述为执行扫描。然而,应理解,在其它实例中,例如变换量化单元54等其它处理单元可执行扫描。熵编码单元56接着对变换系数的1D阵列进行熵编码以产生经熵译码位流。
熵编码单元56可将例如CAVLC或CABAC等熵译码应用于经扫描的系数。另外,熵译码单元56可对运动向量(MV)信息以及可用于在视频解码器30处对视频数据进行解码的多种语法元素中的任一者进行编码。视频解码器30可使用这些语法元素来重建经编码视频数据。在由熵译码单元56进行熵译码之后,可将所得经编码视频传输到另一装置(例如视频解码器30)或存档以供稍后传输或检索。
变换反量化单元58和反变换单元60分别应用反量化和反变换以在像素域中重建残余块,例如以供稍后用作参考块。运动补偿单元44可通过将残余块加到参考帧缓冲器64的帧中的一者的预测性块来计算参考块。运动补偿单元44还可将一个或一个以上内插滤波器应用到经重建的残余块以计算子整数像素值以供用于运动估计中。求和器62将经重建的残余块加到由运动补偿单元44产生的经运动补偿的预测块,以产生经重建的视频块供存储在参考帧缓冲器64中。经重建的视频块可由运动估计单元42和运动补偿单元44用作用于对后续视频帧中的块进行帧间译码的参考块。
经量化PCM单元47在选择经量化PCM模式时从模式选择单元40接收视频块(例如,译码单元)。如上文所描述,可在确定其它译码模式(例如,帧内预测译码或帧间预测译码)将充当视频帧的一个或一个以上译码单元的数据扩展器而非数据压缩器时选择经量化PCM模式。举例来说,模式选择单元40可测试关于块的各种译码模式,且确定模式是否满足所要速率失真度量。如果测试指示某一译码模式产生待分配的过量的译码位以实现所要最大量的失真,那么模式选择单元40可选择经量化PCM模式。因此,胜于对视频块执行预测技术,如上文所描述,编码器将使用经量化PCM单元47来对块的每一样本(即,像素)执行经量化PCM译码过程,且将在视频数据的经编码位流中传输那些经量化的经PCM译码的块。
可在经编码视频位流中将PCM译码的使用用信号发出到视频解码器。可在预测单元层级用信号发出PCM旗标(pcm_flag)以指示使用PCM译码。如果预测模式为帧内,分割区大小为2N×2N,且块大小大于或等于最小PCM块大小,那么用信号发出pcm_flag。注意,如果pcm_flag等于1,那么可在位流中用信号发出若干0位以用于填充直到下一字节的开始为止(例如,以便具有字节对准)。可在序列参数集(SPS)中用信号发出关于PCM译码的额外语法元素。举例来说,语法元素指示像素的明度和色度分量两者(例如,pcm_bit_depth_luma_minus 1和pcm_bit_depth_chroma_minus1)的PCM位深度(或量化步长)。
图3展示根据本发明的一个方面的经量化PCM单元47的框图。如上文所提及,本发明呈现用于将经量化PCM译码应用于视频数据块中的视频样本(即,像素)的技术。经量化PCM译码可通过在PCM译码之前引入量化步长来实现。在此上下文中,量化为在某一位深度m(例如,由10个位表示的像素数据)处的输入值借以映射到具有较小位深度n(例如,6个位)的输出值的压缩过程。因此,输入位深度m大于输出位深度n。此过程将固有地涉及对输入值中的一些输入值舍入,且因此,将损失引入到压缩中。
如图3中所示,视频样本由经量化PCM单元47接收且首先由量化单元49进行量化。在此情况下,视频样本的量化界定经量化的经PCM译码视频的最终输出位深度。应理解,此“像素域”量化(即,用以界定位深度)可用以对像素的输入值进行量化,且不同于“变换域”量化参数(QP),所述“变换域”量化参数(QP)通常用以例如通过图2中所示的变换量化单元54来对残余变换系数进行量化。输入样本可通过量化单元49使用此像素域量化步长以界定输出位深度来量化。如将参看图5到图6更详细地论述,解码器可使用量化步长和舍入偏移来对经译码样本进行反量化。舍入偏移可由编码器在位流中指定,或经强加以正好为量化步长的一半(或量化步长的某一其它指定分数)。
量化步长选择单元53可经配置以选择量化步长。或者,量化步长单元49可经配置以使用预定量化步长。预定量化步长可存储在量化步长选择存储器55中。量化步长选择单元53可基于多种准则中的任一者选择量化步长,所述准则包含待通过经量化PCM过程译码的视频数据块的特性或空间上靠近待通过经量化PCM过程译码的视频数据块的视频数据块的特性。
举例来说,可选择量化步长以产生满足给定块所准许的数据的最大量的经编码视频数据。较高量化步长及因此的较小输出位深度将产生较低数据大小的经量化的经PCM译码数据。相反地,较低量化步长及因此的较大输出位深度将产生较高数据大小的经量化的经PCM译码数据。因此,量化步长可为界定输出位深度的可选择参数。量化步长可呈输出位深度自身的格式,或可指示为用以执行量化的右移的数目,所述量化接着产生在某一输出位深度处的经量化的经PCM译码视频样本。如下文将更详细解释,可在经编码位流中指示输出位深度和/或量化步长,使得解码器可接收量化步长和/或输出位深度,且对经译码位流中的PCM视频数据进行解码。
作为另一实例,可选择量化步长以减小经PCM译码视频数据与由空间上附近块中的预测性译码产生的有损数据之间的外观差异。确切来说,可选择量化步长,使得由经PCM译码视频数据呈现的失真量类似于由经预测性译码的视频数据呈现的失真量。对于经预测性译码的视频数据,失真量可由编码器20显式地确定或例如基于由变换量化单元54使用的量化参数(QP)来估计。
可由量化步长选择单元53使用以选择量化步长的其它准则包含帧空间分辨率、相关译码单元的量化(QP)、相关译码单元的译码结构、帧速率、帧类型(例如,帧内(I)或帧间(P或B)帧)、输入数据、内部数据或输出数据的位深度、特定视频应用或编码相关视频序列的层级或配置文件。
PCM块的所要质量与特定帧的整体质量有关。帧的质量(例如,帧类型,位深度)越好,PCM模式所需要的质量越高。又,如果分辨率极大,且PCM块小,那么与相反的情况相比,存在小得多的视觉冲击。作为一个实例,用于视频会议应用的视频与DVD的视频相比较通常具有较低质量的PCM。又,视频会议中存在减少在PCM中所花费的位的极大需求。考虑这些准则的组合与考虑单一准则相比较可产生较好的结果。
在这些实例中的每一者中,可基于由量化步长选择单元53执行的算法来选择量化步长。作为另一实例,适于不同上下文情形的多个预定量化步长可存储在可由量化步长选择单元53存取的量化步长选择存储器55中。
在一实例中,量化单元49可通过简单地将输入数据右移来对视频样本执行量化。实际上,右移量化过程减少输入样本(即,像素)中的每一者的最低有效位。在此实例中,可由量化步长选择单元53向量化单元49给出作为指示右移量的整数的量化步长。举例来说,将输入数据右移2与将输入数据除以4相同。在8位像素输入的情况下,将输入数据右移2将暗示最大数据量,其降低了75%,即,从每样本8个位到每样本6个位。在另一实例中,在应用右移之前,将偏移加到像素值。在另一实例中,由量化单元49执行的量化(或右移)可基于输入视频样本的位深度。输入视频样本的位深度越大,其可以在无显而易见假影的情况下进行量化的程度就越大。因此,量化步长选择单元53可经配置以针对10位输入数据选择比针对8位输入数据的量化步长大的量化步长。
在量化之后,脉码调制单元51对经量化视频样本进行脉码调制。H.264的常规帧内PCM模式简单地使未压缩到经编码位流中的像素的数字值通过。因此,H.264的帧内PCM为无损的。根据本发明,脉码调制单元51在量化(即,有损压缩的形式)之后对视频样本的数字值进行调制。因此,由量化步长选择单元53选择的量化步长界定由脉码调制单元译码的视频样本的输出位深度。如上文所陈述,在一些情况下,量化步长可呈输出位深度自身的格式,或可指示为界定输出位深度的右移的数目。
输出位深度、舍入偏移和/或量化步长可由编码器在经编码位流中作为语法元素用信号发出。在此上下文中,在经编码位流中用信号发出语法元素不需要将这些元素从编码器实时传输到解码器,而是意谓将这些语法元素编码到位流中,且使得其可被解码器以任何方式存取。此情形可包含实时传输(例如,在视频会议中)以及在计算机可读媒体上存储经编码位流以供未来由解码器使用(例如,在流式传输、下载、磁盘存取、卡存取、DVD、蓝光等中)。如上文所提及,量化步长可指示输出位深度自身或可表示经执行以对输入视频样本进行量化的右移的数目。输出位深度或量化步长可用信号发出到解码器以便解码器应用适当过程来对经编码数据进行解码。
在一实例中,量化步长可为在所有情况下由编码器和解码器两者使用的预定值。在另一实例中,如上文所论述,量化步长选择单元53可基于输入视频块和/或周围视频块的特性确定量化步长。解码器可基于由编码器使用以选择量化步长的相同特性推断出经量化的经PCM译码视频数据的量化步长的某一值。
作为另一实例,可在经编码位流中将输出位深度和/或量化步长用信号发出到解码器。另外,舍入偏移可由编码器在位流中指定,或可经预定为量化步长的一半(或量化步长的某一其它指定分数)。用信号发出输出位深度、舍入偏移和/或量化步长的一种方式为通过对指示经量化PCM样本的位深度的语法元素进行编码。图3将量化步长选择单元53描绘为对经编码位流中的选定量化步长进行编码。然而,此过程可由量化单元49、脉码调制单元51或经量化PCM单元47或编码器20的另一单元来实现。
在另一实例中,可在序列标头、序列参数集层级(例如,图像参数集层级),在切片层级或在经编码位流中的其它语法层级发送语法元素。图4描绘具有序列标头的实例经编码视频位流。序列标头67包含指示经量化的经PCM编码视频的输出位深度的位深度语法元素65。作为一个实例,位深度语法元素65可为指示从1到16个位的位深度减少或扩展的4位语法元素。应注意,可选择任何长度语法元素以指示输出位深度。在图4中的实例中,语法元素65指示经编码样本的输出位深度,且因此,指示在解码器处所遵循的过程。还可在序列参数集(SPS)、图像参数集(PPS)或切片标头中用信号发出语法元素。
在另一实例中,可在序列标头处、在帧标头处或紧接在用信号发出译码单元、预测单元或块的PCM模式之后由编码器将量化步长自身(例如,右移的数目)用信号发出到解码器。当用信号发出帧中已选择经量化PCM模式的第一块的PCM模式时,编码器可在位流中用信号发出量化步长。帧中的经量化PCM模式块的其余部分将假定与帧中的第一PCM模式块的用信号发出的量化步长相同的量化步长。
在另一实例中,帧中所遇到的后续经量化PCM模式块可用信号发出用于所述块的量化步长距基线量化步长的增量。在一些实例中,基线量化可为用于使用经量化PCM模式的先前块中的量化步长。在此实例中,基线量化步长将为使用经量化PCM的第一块的在位流中用信号发出的第一量化步长。接着,可将帧中的后续PCM模式块中的每一者的量化步长作为相对于先前用信号发出的量化步长的增量值用信号发出。
因此,帧或切片中的每一PCM模式块可具有个别地基于块显式地用信号发出的量化步长,共享帧或切片中的第一PCM模式块的最初用信号发出的相同量化步长,或具有通过相对于帧或切片中的第一PCM模式块的最初用信号发出的量化步长的增量用信号发出的量化步长。
应注意,尽管为便于说明而展示为单独功能单元,但量化单元49、脉码调制单元51、量化步长选择单元53和量化步长选择存储器55的结构和功能性可彼此高度集成。
图5为说明对经编码视频序列进行解码的视频解码器30的实例的框图。在图5的实例中,视频解码器30包含熵解码单元70、经量化PCM解码单元71、运动补偿单元72、帧内预测单元74、反变换量化单元76、反变换单元78、参考帧缓冲器82和求和器80。视频解码器30在一些实例中可执行通常与关于参看图2所描述的视频编码器20所描述的编码遍次互逆的解码遍次。运动补偿单元72可基于从熵解码单元70接收的运动向量产生预测数据。帧内预测单元74可基于来自当前帧的先前经解码块的用信号发出的帧内预测模式和数据产生当前帧的当前块的预测数据。
在一些实例中,熵解码单元70(或反变换量化单元76)可使用镜像处理由视频编码器20的熵编码单元56(或变换量化单元54)使用的扫描次序的扫描来扫描所接收值。尽管可在反变换量化单元76中执行系数的扫描,但将出于说明的目的而将扫描描述为由熵解码单元70执行。另外,尽管为便于说明而展示为单独功能单元,但熵解码单元70、反变换量化单元76和视频解码器30的其它单元的结构和功能性可彼此高度集成。
熵解码单元70可经配置以应用扫描次序以将变换系数的1D向量转换成变换系数的2D阵列。熵解码单元70使用扫描次序的反向来将1D向量扫描成2D阵列。由熵解码单元70产生的变换系数的2D阵列可经量化,且可一股地匹配由视频编码器20的熵编码单元56扫描的变换系数的2D阵列以产生变换系数的1D向量。
反变换量化单元76对在位流中提供且由熵解码单元70解码的经量化的变化系数进行反量化(即,解量化)。反量化过程可包含例如类似于针对HEVC而提议或由H.264解码标准定义的过程的常规过程。反量化过程可包含使用由视频编码器20针对译码单元计算的量化参数来确定量化的程度以及(同样)应该应用的反量化的程度。反变换量化单元76可在将系数从1D向量转换成2D阵列之前或之后对变换系数进行反量化。
反变换单元78应用反变换(例如,反DCT、反整数变换、反KLT、反旋转变换、反定向变换或另一反变换)。在一些实例中,反变换单元78可基于来自视频编码器20的发信号或通过从例如块大小、译码模式等一个或一个以上译码特性推断出变换来确定反变换。在一些实例中,反变换单元78可基于包含当前块的最大译码单元的四分树的根节点处的用信号发出的变换确定应用于当前块的变换。在一些实例中,反变换单元78可应用级联反变换。
运动补偿单元72产生经运动补偿的块,可能执行基于内插滤波器的内插。待用于具有子像素精度的运动估计的内插滤波器的识别符可包含在语法元素中。运动补偿单元72可使用如由视频编码器20在视频块的编码期间使用的内插滤波器来计算参考块的子整数像素的内插值。运动补偿单元72可根据所接收的语法信息来确定由视频编码器20使用的内插滤波器且使用所述内插滤波器来产生预测性块。
运动补偿单元72和帧内预测单元74在HEVC实例中可使用以下各者中的一些:用以确定用以对经编码视频序列的帧进行编码的最大译码单元的大小的语法信息(例如,由四分树提供)、描述经编码视频序列的帧的每一译码单元如何分裂(及同样如何分裂子译码单元)的分裂信息、指示每一分裂如何进行编码的模式(例如,帧内或帧间预测和用于帧内预测的帧内预测编码模式)、用于每一经帧间编码预测单元的一个或一个以上参考帧(和/或含有用于参考帧的识别符的参考列表)和用以对经编码视频序列进行解码的其它信息。
求和器80将残余块与由运动补偿单元72或帧内预测单元74产生的对应预测块组合以形成经解码块。在需要时,还可应用解块滤波器以对经解码块进行滤波,以便移除成块假影。经解码视频块接着存储在参考帧缓冲器82中,参考帧缓冲器82提供用于后续运动补偿的参考块且还产生用于呈现在显示装置(例如,图1的显示装置32)上的经解码视频。
经量化PCM解码单元71经配置以在经量化PCM模式由编码器20使用时对经编码视频进行解码。经量化PCM解码单元71首先对经编码视频进行脉码解调。接下来,经量化PCM解码单元71使用用于编码过程中的相同量化步长和舍入偏移来对经脉码解调视频进行反量化。量化步长可在经编码视频位流中直接用信号发出,或可从在经编码视频位流中用信号发出的输出位深度推断出。
图6展示说明经量化PCM解码单元71的实例的框图。经量化PCM解码单元可包含脉码解调单元73、反量化步长单元75、量化步长选择单元77和量化步长选择存储器79。应注意,尽管为便于说明而展示为单独功能单元,但脉码解调单元73、反量化步长单元75、量化步长选择单元77和量化步长选择存储器79的结构和功能性可彼此高度集成。
最初,脉码解调单元73对经量化的经PCM编码视频进行脉码解调。此步骤基本上与由编码器应用的脉码调制相反。接下来,反量化单元75使用用以对视频进行编码的相同量化步长以及舍入偏移来对经解调视频进行反量化。
量化步长选择单元77可从经编码位流检索指示输出位深度和/或量化步长的语法元素。作为一个实例,如图4中所示,输出位深度可作为指示从1到16个位的位深度减少或扩展的4位语法元素用信号发出。在另一实例中,可显式地而非间接地用信号发出输出位深度。或者,解码器可基于由编码器使用以选择量化步长的相同准则或视频特性来推断PCM样本的量化步长的某一值,所述准则或视频特性例如帧空间分辨率、相关译码单元的量化(QP)、相关译码单元的译码结构、或帧类型(例如,帧内(I)或帧间(P或B)帧)、输入数据、内部数据或输出数据的位深度、特定视频应用或编码视频序列的层级或配置文件。作为另一实例,量化步长选择单元77可简单地存取存储在量化步长选择存储器79中的预定量化步长。
在给定用信号发出、预定或经推断的量化步长的情况下,反量化单元75可使用量化步长和用信号发出、经推断或预定的舍入偏移来执行反量化。为了执行反量化,反量化单元75可简单地将位(即,等于用于编码器中的右移的数目的左移的数目)加到经解调样本,且应用选定舍入偏移以产生经解码视频。
图7是说明实例编码过程的流程图。方法100根据上文参看图2到图4所描述的经量化PCM译码过程来对视频块进行编码。在方法100中,视频编码器20选择量化步长来界定输出位深度(120)。基于此输出位深度,视频编码器20执行经量化PCM编码(121)。经量化PCM编码的第一步骤为根据选定量化步长对视频数据块的样本进行量化(122)。步骤122可包含通过执行视频数据块的样本的数个右移来对视频数据块的样本进行量化,其中右移的数目基于量化步长。接下来,视频编码器20对经量化样本进行脉码调制(124)。作为可选步骤,视频编码器20还可产生输出位深度的指示,且在经编码视频位流中用信号发出所述指示(126)。
如上文所论述,输出位深度为可界定参数。就此而言,输出位深度可通过选择用于量化过程的量化步长来界定。量化步长可为预定值或可基于视频数据的一个或一个以上特性来选择。作为另一实例,可选择量化步长以减小经PCM译码视频数据与由预测性译码产生的有损数据之间的外观差异。确切来说,可选择量化步长,使得由经PCM译码视频数据呈现的失真量类似于由经预测性译码的视频数据呈现的失真量。对于经预测性译码的视频数据,失真量可显式地确定或例如基于由变换量化单元54使用的量化参数(QP)来估计。可用以选择量化步长的其它准则和特性包含帧空间分辨率、相关译码单元的量化(QP)、相关译码单元的译码结构、帧速率、帧类型(例如,帧内(I)或帧间(P或B)帧)、输入数据、内部数据或输出数据的位深度、特定视频应用或对相关视频序列进行编码的层级或配置文件。量化步长可对于多个视频数据块为共同的,或可针对每一个别视频数据块进行选择。
步骤126可产生输出位深度和/或量化步长自身的指示,且在经编码视频数据的位流中用信号发出所述指示。输出位深度和/或量化步长的指示允许解码器将量化过程反向。确切来说,可在序列标头中作为指示从1到16个位的位深度减少或扩展的4位语法元素用信号发出输出位深度。另外,步骤126还可在视频位流中用信号发出舍入偏移以向解码器指示如何执行反量化过程。如果个别量化步长用于不同视频数据块,那么编码器20可将个别量化步长表示为相对于基本量化步长的增量值。
图8是说明实例解码过程的流程图。方法150根据上文参看图5和图6所描述的经量化PCM解码过程来对视频块进行解码。在方法150中,视频解码器30首先确定量化步长(160)。接下来,视频解码器执行经量化PCM解码过程161。经量化PCM解码过程包含用脉码解调来对经编码视频块进行解码(162)。接下来,使用所确定量化步长和舍入偏移,视频解码器30对经解调视频块进行反量化。
在步骤160中,可通过使用预先选定值,通过在输出位流中接收输出位深度和/或量化步长的指示,或以与在编码过程中选择量化步长的方式相同的方式从视频数据自身的特性来确定量化步长。
在一个或一个以上实例中,本发明中所描述的功能可以硬件、软件、固件或其任一组合来实施。如果以软件来实施,那么功能可由执行呈计算机可读指令或代码形式的软件的基于硬件的处理单元(例如,一个或一个以上处理器)执行。这些指令或代码可存储在计算机可读媒体上或经由计算机可读媒体传输,且由基于硬件的处理单元执行。计算机可读媒体可包含对应于例如数据存储媒体等有形的非暂时性媒体的计算机可读存储媒体,或包含促进计算机程序例如根据通信协议从一处传送到另一处的任何媒体的通信媒体。以此方式,计算机可读媒体通常可对应于(1)非暂时性的有形计算机可读存储媒体,或(2)例如信号或载波等通信媒体。数据存储媒体可为可由一个或一个以上计算机或者一个或一个以上处理器存取以检索用于实施本发明中描述的技术的指令、代码和/或数据结构的任何可用媒体。计算机程序产品可包含计算机可读媒体。
举例来说且并非限制,这些计算机可读存储媒体可包括RAM、ROM、EEPROM、闪存存储器、CD-ROM或包含光盘存储装置、磁盘存储装置或其它磁性存储装置的任何其它固态、光学或磁性数据存储媒体,或可用来以指令或数据结构的形式存储所要程序代码且可由计算机存取的任何其它媒体。而且,可恰当地将任何连接称作计算机可读媒体。举例来说,如果使用同轴电缆、光纤缆线、双绞线、数字订户线(DSL)或例如红外线、无线电及微波等无线技术从网站、服务器或其它远程源传输指令,则同轴电缆、光纤缆线、双绞线、DSL或例如红外线、无线电及微波等无线技术包含在媒体的定义中。然而,应理解,有形计算机可读存储媒体和数据存储媒体不包含连接、载波、信号或其它瞬时媒体,而是针对非瞬时有形存储媒体。如本文中所使用,磁盘及光盘包含压缩光盘(CD)、激光光盘、光学光盘、数字多功能光盘(DVD)、软磁盘及蓝光光盘,其中磁盘通常以磁性方式再生数据,而光盘使用激光以光学方式再生数据。上文的组合也应包含在计算机可读媒体的范围内。
可由例如一个或一个以上数字信号处理器(DSP)、通用微处理器、专用集成电路(ASIC)、现场可编程逻辑阵列(FPGA)或其它等效集成或离散逻辑电路等一个或一个以上处理器来执行指令。因此,如本文中所使用的术语“处理器”可指上述结构或适合于实施本文中所描述的技术的任何其它结构中的任一者。另外,在一些方面中,本文描述的功能性可提供于经配置以用于编码和解码的专用硬件和/或软件模块内,或并入在组合式编解码器中。而且,可将所述技术完全实施于一个或一个以上电路或逻辑元件中。
本发明的技术可由广泛多种装置或设备执行,所述装置或设备包含桌上型计算机、笔记本(即,膝上型)计算机、平板计算机、机顶盒、例如所谓的智能电话等电话手持机、电视、相机、显示装置、数字媒体播放器、视频游戏控制台等等。在许多情况下,这些装置可经配备用于无线通信。另外,此类技术可由集成电路(IC)或一组IC(例如,芯片组)来实施。经配置以执行本发明的技术的装置可包含上文所提及的装置中的任一者,且在一些情况下,可为视频编码器或视频解码器,或可由硬件、软件和固件的组合形成的组合式视频编码器-解码器(即,视频CODEC)。本发明中可描述各种组件、模块或单元以强调经配置以执行所揭示技术的装置的功能方面,但未必需要通过不同硬件单元来实现。而是,如上所述,各种单元可组合于编解码器硬件单元中或由互操作硬件单元(包含如上所述的一个或一个以上处理器)的集合结合合适软件和/或固件来提供。
已描述本发明的各种实施例。这些和其它实施例在所附权利要求书的范围内。

Claims (48)

1.一种用于对视频数据进行译码的方法,所述方法包括:
使用经量化脉码调制根据输出位深度对视频数据块的样本进行译码。
2.根据权利要求1所述的方法,其中使用经量化脉码调制根据输出位深度对所述视频数据块的样本进行译码包括:
根据界定量化的量以产生所述输出位深度的量化步长来对所述视频数据块的所述样本进行量化;以及
对所述经量化样本进行脉码调制。
3.根据权利要求2所述的方法,其中所述输出位深度为可界定参数。
4.根据权利要求3所述的方法,其进一步包括:
选择用于所述经量化样本的所述量化步长以界定所述输出位深度。
5.根据权利要求4所述的方法,其中选择所述量化步长包括基于所述视频数据的一个或一个以上特性来选择所述量化步长。
6.根据权利要求2所述的方法,其中根据量化步长来对所述视频数据块的所述样本进行量化包括所述视频数据块的所述样本的数个右移,其中右移的数目基于所述量化步长。
7.根据权利要求1所述的方法,其中使用经量化脉码调制来对视频数据块的样本进行译码包括:
根据共同量化步长来对多个视频数据块的样本进行量化;以及
对所述多个视频数据块中的所述经量化样本进行脉码调制。
8.根据权利要求1所述的方法,其中使用经量化脉码调制来对视频数据块的样本进行译码包括:
根据第一量化步长来对第一视频数据块的样本进行量化;
根据不同于所述第一量化步长的第二量化步长来对第二视频数据块的样本进行量化;以及
对所述第一视频数据块和所述第二视频数据块中的所述经量化样本进行脉码调制。
9.根据权利要求8所述的方法,其进一步包括:
将所述第一量化步长和所述第二量化步长表示为相对于基本量化步长的增量值。
10.根据权利要求1所述的方法,其进一步包括:
产生所述输出位深度的指示,且将所述指示包含在经编码位流中。
11.根据权利要求10所述的方法,其进一步包括:
将所述输出位深度的所述指示包含在序列标头中作为语法元素。
12.根据权利要求10所述的方法,其进一步包括:
将舍入偏移的指示包含在包含所述经译码视频数据块的经编码位流中。
13.一种用于对经译码视频数据块进行解码的方法,所述方法包括:
根据输出位深度对已用经量化脉码调制编码的所述经译码视频数据块的样本进行解码。
14.根据权利要求13所述的方法,其中根据输出位深度对视频数据块的样本进行解码包括:
使用脉码解调来对所述经译码视频数据块的所述样本进行解码;以及
根据量化步长来对所述经解码样本进行反量化。
15.根据权利要求14所述的方法,其中所述量化步长基于所述输出位深度。
16.根据权利要求15所述的方法,其中对所述经解码样本进行反量化包括:
根据所述量化步长和舍入偏移来对所述经解码样本进行反量化。
17.根据权利要求16所述的方法,其进一步包括:
从包含所述经译码视频数据块的经编码位流接收所述输出位深度、所述量化步长和所述舍入偏移中的至少一者。
18.根据权利要求14所述的方法,其进一步包括:
基于所述经译码视频数据块的一个或一个以上特性来确定所述量化步长。
19.一种设备,其经配置以对视频数据进行译码,所述设备包括:
视频编码单元,其经配置以使用经量化脉码调制根据输出位深度对视频数据块的样本进行译码。
20.根据权利要求19所述的设备,其中所述视频编码单元包括:
量化单元,其经配置以根据界定量化的量以产生所述输出位深度的量化步长来对所述视频数据块的所述样本进行量化;以及
调制单元,其经配置以使用脉码调制对所述经量化样本进行译码。
21.根据权利要求20所述的设备,其中所述输出位深度为可界定参数。
22.根据权利要求21所述的设备,其中所述视频译码单元经进一步配置以选择用于所述经量化样本的所述量化步长来界定所述输出位深度。
23.根据权利要求22所述的设备,其中所述视频编码单元经配置以基于所述视频数据的一个或一个以上特性来选择所述量化步长。
24.根据权利要求20所述的设备,其中所述量化单元经配置以使用所述视频数据块的所述样本的数个右移来对所述视频数据块的所述样本进行量化,其中右移的数目基于所述量化步长。
25.根据权利要求19所述的设备,其中所述视频编码单元包括:
量化单元,其经配置以根据共同量化步长来对多个视频数据块的样本进行量化;以及
调制单元,其经配置以在所述多个视频数据块中使用脉码调制来对所述经量化样本进行译码。
26.根据权利要求19所述的设备,其中所述视频编码单元包括:
量化单元,其经配置以根据第一量化步长对第一视频数据块的样本进行量化,以及根据不同于所述第一量化步长的第二量化步长来对第二视频数据块的样本进行量化;以及
调制单元,其经配置以使用脉码调制来对在所述第一视频数据块和所述第二视频数据块中的所述经量化样本进行译码。
27.根据权利要求26所述的设备,其中所述视频编码单元经进一步配置以将所述第一量化步长和所述第二量化步长表示为相对于基本量化步长的增量值。
28.根据权利要求19所述的设备,其中所述视频编码单元经进一步配置以产生所述输出位深度的指示且将所述指示包含在经编码位流中。
29.根据权利要求28所述的设备,其中所述视频编码单元经进一步配置以将所述输出位深度的所述指示包含在序列标头中作为语法元素。
30.根据权利要求28所述的设备,其中所述视频编码单元经进一步配置以将舍入偏移的指示包含在包含所述经译码视频数据块的经编码位流中。
31.一种设备,其经配置以对经译码视频数据块进行解码,所述设备包括:
视频解码单元,其经配置以根据输出位深度对已用经量化脉码调制编码的所述经译码视频数据块的样本进行解码。
32.根据权利要求31所述的设备,其中所述视频解码单元包括:
解调单元,其经配置以使用脉码解调来对所述经译码视频数据块的所述样本进行解码;以及
反量化单元,其经配置以根据量化步长来对所述经解码样本进行反量化。
33.根据权利要求32所述的设备,其中所述量化步长基于所述输出位深度。
34.根据权利要求33所述的设备,其中所述反量化单元经进一步配置以根据所述量化
步长和舍入偏移来对所述经解码样本进行反量化。
35.根据权利要求34所述的设备,其中所述视频解码单元经进一步配置以从包含所述
经译码视频数据块的经编码位流接收所述输出位深度、所述量化步长和所述舍入偏移中的至少一者。
36.根据权利要求32所述的设备,其中所述视频解码单元经进一步配置以基于所述经译码视频数据块的一个或一个以上特性来确定所述量化步长。
37.一种设备,其经配置以对视频数据进行译码,所述设备包括:
用于根据界定量化的量以产生输出位深度的量化步长来对视频数据块的样本进行量化的装置;以及
用于对所述经量化样本进行脉码调制的装置。
38.根据权利要求37所述的设备,其进一步包括:
用于产生所述输出位深度的指示且将所述输出位深度的所述指示包含在序列标头中作为元素的装置。
39.一种设备,其经配置以对经译码视频数据块进行解码,所述设备包括:
用于使用脉码解调来对所述经译码视频数据块的样本进行解码的装置;以及
用于根据量化步长来对所述经解码样本进行反量化的装置。
40.根据权利要求39所述的设备,其中所述量化步长基于输出位深度。
41.根据权利要求39所述的设备,其进一步包括:
用于从包含所述经译码视频数据块的经编码位流接收所述输出位深度、所述量化步长和舍入偏移中的至少一者的装置。
42.一种包括计算机可读存储媒体的计算机程序产品,所述计算机可读存储媒体上存储有若干指令,所述指令在执行时致使用于对视频进行译码的装置的处理器:
使用经量化脉码调制根据输出位深度对视频数据块的样本进行译码。
43.根据权利要求42所述的计算机程序产品,其中用以使用经量化脉码调制根据输出位深度对视频数据块的样本进行译码的所述指令包括用以进行以下操作的指令:
根据界定量化的量以产生所述输出位深度的量化步长来对所述视频数据块的所述样本进行量化;以及
对所述经量化样本进行脉码调制。
44.根据权利要求42所述的计算机程序产品,其进一步致使处理器:
产生所述输出位深度的指示且将所述输出位深度的所述指示包含在序列标头中作为语法元素。
45.一种包括计算机可读存储媒体的计算机程序产品,所述计算机可读存储媒体上存储有若干指令,所述指令在执行时致使用于对经译码视频数据块进行解码的装置的处理器:
根据输出位深度对已用经量化脉码调制编码的所述经译码视频数据块的样本进行解码。
46.根据权利要求45所述的计算机程序产品,其中用以根据输出位深度对视频数据块的样本进行解码的所述指令包括用以进行以下操作的指令:
使用脉码解调来对所述经译码视频数据块的所述样本进行解码;以及
根据量化步长来对所述经解码样本进行反量化。
47.根据权利要求45所述的计算机程序产品,其中所述量化步长基于所述输出位深度。
48.根据权利要求45所述的计算机程序产品,其进一步致使处理器:
从包含所述经译码视频数据块的经编码位流接收所述输出位深度、所述量化步长和舍入偏移中的至少一者。
CN201280011666.6A 2011-03-04 2012-02-01 视频译码中的经量化脉码调制 Active CN103404144B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201161449413P 2011-03-04 2011-03-04
US61/449,413 2011-03-04
US13/362,928 2012-01-31
US13/362,928 US10200689B2 (en) 2011-03-04 2012-01-31 Quantized pulse code modulation in video coding
PCT/US2012/023497 WO2012121820A1 (en) 2011-03-04 2012-02-01 Quantized pulse code modulation in video coding

Publications (2)

Publication Number Publication Date
CN103404144A true CN103404144A (zh) 2013-11-20
CN103404144B CN103404144B (zh) 2017-08-29

Family

ID=46753282

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201280011666.6A Active CN103404144B (zh) 2011-03-04 2012-02-01 视频译码中的经量化脉码调制

Country Status (19)

Country Link
US (1) US10200689B2 (zh)
EP (1) EP2681914B1 (zh)
JP (1) JP5722468B2 (zh)
KR (1) KR101732767B1 (zh)
CN (1) CN103404144B (zh)
AU (1) AU2012226301B2 (zh)
BR (1) BR112013022516B1 (zh)
CA (1) CA2828556C (zh)
DK (1) DK2681914T3 (zh)
ES (1) ES2692183T3 (zh)
HU (1) HUE039796T2 (zh)
IL (1) IL227926A (zh)
MX (1) MX2013010148A (zh)
MY (1) MY164711A (zh)
RU (1) RU2578724C2 (zh)
SG (1) SG192741A1 (zh)
SI (1) SI2681914T1 (zh)
UA (1) UA109312C2 (zh)
WO (1) WO2012121820A1 (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105556943A (zh) * 2013-09-20 2016-05-04 Vid拓展公司 提供3d查找表编码以用于色域可伸缩性的系统和方法
CN105847758A (zh) * 2016-05-18 2016-08-10 深圳市神州龙资讯服务有限公司 一种高清航拍图片高速实时传输方法
CN106134196A (zh) * 2014-03-21 2016-11-16 高通股份有限公司 在视频译码中用于帧内块复制的搜索区域确定
CN107211139A (zh) * 2015-01-30 2017-09-26 高通股份有限公司 用于调色板译码的译码转义像素
CN108028936A (zh) * 2015-09-21 2018-05-11 高通股份有限公司 视频译码中成分的范围调整的固定点实施
WO2020056763A1 (en) * 2018-09-21 2020-03-26 Alibaba Group Holding Limited Adaptive coding of video coding units based on coding block type
CN113162731A (zh) * 2021-05-26 2021-07-23 中南大学 混合数模广播通信方法

Families Citing this family (47)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8548057B2 (en) 2011-01-25 2013-10-01 Microsoft Corporation Video coding redundancy reduction
EP2685719B1 (en) * 2011-03-09 2019-10-30 Panasonic Intellectual Property Corporation of America Video image decoding device
CN103430548B (zh) * 2011-03-09 2017-10-24 松下电器(美国)知识产权公司 运动图像编码装置及运动图像编码方法
JP6234920B2 (ja) * 2011-05-10 2017-11-22 コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. ハイダイナミックレンジ画像信号生成及び処理
US20120320972A1 (en) * 2011-06-16 2012-12-20 Samsung Electronics Co., Ltd. Apparatus and method for low-complexity optimal transform selection
US9774851B2 (en) * 2011-11-03 2017-09-26 Sun Patent Trust Quantization parameter for blocks coded in the PCM mode
US9706200B2 (en) 2012-06-18 2017-07-11 Qualcomm Incorporated Unification of signaling lossless coding mode and pulse code modulation (PCM) mode in video coding
US9749645B2 (en) 2012-06-22 2017-08-29 Microsoft Technology Licensing, Llc Coded-block-flag coding and derivation
CA2869710C (en) * 2012-06-26 2018-01-09 Nec Corporation Video encoding device, video decoding device, video encoding method, video decoding method, and program
JPWO2015034061A1 (ja) * 2013-09-06 2017-03-02 三菱電機株式会社 動画像符号化装置、動画像トランスコード装置、動画像符号化方法、動画像トランスコード方法及び動画像ストリーム伝送システム
CN110572662B (zh) * 2013-10-07 2024-03-08 Vid拓展公司 用于多层视频编码的组合可分级性处理
WO2015057438A1 (en) * 2013-10-14 2015-04-23 Mediatek Singapore Pte. Ltd. Method of residue differential pulse-code modulation for hevc range extension
US9892084B2 (en) 2013-12-10 2018-02-13 Apple Inc. Methods and apparatus for virtual channel allocation via a high speed bus interface
US10459674B2 (en) * 2013-12-10 2019-10-29 Apple Inc. Apparatus and methods for packing and transporting raw data
US9830289B2 (en) 2014-09-16 2017-11-28 Apple Inc. Methods and apparatus for aggregating packet transfer over a virtual bus interface
US9798377B2 (en) 2014-10-08 2017-10-24 Apple Inc. Methods and apparatus for recovering errors with an inter-processor communication link between independently operable processors
US9749636B2 (en) * 2014-10-24 2017-08-29 Intel Corporation Dynamic on screen display using a compressed video stream
US9544069B2 (en) 2014-11-21 2017-01-10 Apple Inc. Methods and apparatus for link training, initialization and management via a high speed bus interface
US9716889B2 (en) * 2014-12-09 2017-07-25 Sony Corporation Intra and inter-color prediction for Bayer image coding
US10042794B2 (en) 2015-06-12 2018-08-07 Apple Inc. Methods and apparatus for synchronizing uplink and downlink transactions on an inter-device communication link
US10085214B2 (en) 2016-01-27 2018-09-25 Apple Inc. Apparatus and methods for wake-limiting with an inter-device communication link
US10558580B2 (en) 2016-02-29 2020-02-11 Apple Inc. Methods and apparatus for loading firmware on demand
US10191859B2 (en) 2016-03-31 2019-01-29 Apple Inc. Memory access protection apparatus and methods for memory mapped access between independently operable processors
US10523867B2 (en) 2016-06-10 2019-12-31 Apple Inc. Methods and apparatus for multi-lane mapping, link training and lower power modes for a high speed bus interface
US10551902B2 (en) 2016-11-10 2020-02-04 Apple Inc. Methods and apparatus for providing access to peripheral sub-system registers
US10775871B2 (en) 2016-11-10 2020-09-15 Apple Inc. Methods and apparatus for providing individualized power control for peripheral sub-systems
US10346226B2 (en) 2017-08-07 2019-07-09 Time Warner Cable Enterprises Llc Methods and apparatus for transmitting time sensitive data over a tunneled bus interface
US10331612B1 (en) 2018-01-09 2019-06-25 Apple Inc. Methods and apparatus for reduced-latency data transmission with an inter-processor communication link between independently operable processors
US11792307B2 (en) 2018-03-28 2023-10-17 Apple Inc. Methods and apparatus for single entity buffer pool management
US11381514B2 (en) 2018-05-07 2022-07-05 Apple Inc. Methods and apparatus for early delivery of data link layer packets
US10430352B1 (en) 2018-05-18 2019-10-01 Apple Inc. Methods and apparatus for reduced overhead data transfer with a shared ring buffer
US10585699B2 (en) 2018-07-30 2020-03-10 Apple Inc. Methods and apparatus for verifying completion of groups of data transactions between processors
US10719376B2 (en) 2018-08-24 2020-07-21 Apple Inc. Methods and apparatus for multiplexing data flows via a single data structure
US10846224B2 (en) 2018-08-24 2020-11-24 Apple Inc. Methods and apparatus for control of a jointly shared memory-mapped region
CN113728642B (zh) * 2019-04-24 2024-04-02 字节跳动有限公司 编解码视频的量化残差差分脉冲编解码调制表示
KR20220002292A (ko) 2019-05-01 2022-01-06 바이트댄스 아이엔씨 양자화된 잔차 차동 펄스 코드 변조 코딩을 사용하는 인트라 코딩된 비디오
CN117615130A (zh) 2019-05-02 2024-02-27 字节跳动有限公司 基于编解码树结构类型的编解码模式
US11829303B2 (en) 2019-09-26 2023-11-28 Apple Inc. Methods and apparatus for device driver operation in non-kernel space
US11558348B2 (en) 2019-09-26 2023-01-17 Apple Inc. Methods and apparatus for emerging use case support in user space networking
GB2589066B (en) * 2019-10-24 2023-06-28 Advanced Risc Mach Ltd Encoding data arrays
US11606302B2 (en) 2020-06-12 2023-03-14 Apple Inc. Methods and apparatus for flow-based batching and processing
US11775359B2 (en) 2020-09-11 2023-10-03 Apple Inc. Methods and apparatuses for cross-layer processing
US11954540B2 (en) 2020-09-14 2024-04-09 Apple Inc. Methods and apparatus for thread-level execution in non-kernel space
US11799986B2 (en) 2020-09-22 2023-10-24 Apple Inc. Methods and apparatus for thread level execution in non-kernel space
US11818353B2 (en) * 2021-05-13 2023-11-14 Qualcomm Incorporated Reduced complexity transforms for high bit-depth video coding
US11876719B2 (en) 2021-07-26 2024-01-16 Apple Inc. Systems and methods for managing transmission control protocol (TCP) acknowledgements
US11882051B2 (en) 2021-07-26 2024-01-23 Apple Inc. Systems and methods for managing transmission control protocol (TCP) acknowledgements

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1246246A (zh) * 1996-12-17 2000-03-01 汤姆森消费电子有限公司 图象处理系统中的象素块压缩设备
US7143432B1 (en) * 1999-10-01 2006-11-28 Vidiator Enterprises Inc. System for transforming streaming video data
CN1937776A (zh) * 2005-08-26 2007-03-28 三星电子株式会社 图像压缩装置及方法
US20080226183A1 (en) * 2007-03-16 2008-09-18 Shawmin Lei DPCM with Adaptive Range and PCM Escape Mode
GB2463974A (en) * 2008-10-01 2010-04-07 Peter Graham Craven Improved lossy coding of signals
US20100296577A1 (en) * 2009-05-25 2010-11-25 Mstar Semiconductor, Inc. Inverse Quantization Processing Method and Device

Family Cites Families (48)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5150432A (en) 1990-03-26 1992-09-22 Kabushiki Kaisha Toshiba Apparatus for encoding/decoding video signals to improve quality of a specific region
JP2507204B2 (ja) 1991-08-30 1996-06-12 松下電器産業株式会社 映像信号符号化装置
JP3749752B2 (ja) 1995-03-24 2006-03-01 アイティーティー・マニュファクチャリング・エンタープライジズ・インコーポレーテッド ブロック適応型差分パルスコード変調システム
US5777679A (en) 1996-03-15 1998-07-07 International Business Machines Corporation Video decoder including polyphase fir horizontal filter
US6031575A (en) 1996-03-22 2000-02-29 Sony Corporation Method and apparatus for encoding an image signal, method and apparatus for decoding an image signal, and recording medium
JP3748088B2 (ja) 1996-07-17 2006-02-22 ソニー株式会社 画像処理装置および方法、並びに学習装置および方法
JP3263807B2 (ja) 1996-09-09 2002-03-11 ソニー株式会社 画像符号化装置および画像符号化方法
KR100303685B1 (ko) 1996-09-30 2001-09-24 송문섭 영상 예측부호화 장치 및 그 방법
ID22836A (id) 1997-12-22 1999-12-09 Koninkl Philips Electronics Nv Peletakan data tambahan di dalam suatu sinyal yang diberi kode
GB2364843A (en) 2000-07-14 2002-02-06 Sony Uk Ltd Data encoding based on data quantity and data quality
US7058677B1 (en) 2001-07-17 2006-06-06 Vixs, Inc. Method and apparatus for selectible quantization in an encoder
FI114071B (fi) 2003-01-13 2004-07-30 Nokia Corp Kuvien käsitteleminen rajoitetulla bittimäärällä
JP4509104B2 (ja) 2003-03-03 2010-07-21 エージェンシー・フォア・サイエンス・テクノロジー・アンド・リサーチ 高度動画像符号化におけるイントラ予測のための高速モード決定アルゴリズム
US7403561B2 (en) 2003-04-04 2008-07-22 Avid Technology, Inc. Fixed bit rate, intraframe compression and decompression of video
DE102004035939A1 (de) * 2003-07-25 2005-02-24 Sennheiser Electronic Gmbh & Co Kg Verfahren und Vorrichtung zur Digitalisierung sowie zur Datenkomprimierung analoger Signale
US8045614B2 (en) 2005-05-11 2011-10-25 Dolby Laboratories Licensing Corporation Quantization control for variable bit depth
EP1605706A2 (en) 2004-06-09 2005-12-14 Broadcom Corporation Advanced video coding (AVC) intra prediction scheme
US20060227871A1 (en) * 2005-03-31 2006-10-12 Madhukar Budagavi Video thumbnail method
US7634727B2 (en) 2005-04-26 2009-12-15 Microsoft Corporation System for abstracting audio-video codecs
US20070110151A1 (en) 2005-11-14 2007-05-17 Ess Technology, Inc. System and method for video frame buffer compression
PT2950544T (pt) * 2006-01-09 2019-07-10 Hans Georg Musmann Codificação adaptativa do erro de predição em codificação de vídeo híbrida
JP5396711B2 (ja) 2006-02-09 2014-01-22 日本電気株式会社 動画像復号装置、動画像復号方法及びプログラム
WO2007104266A1 (en) 2006-03-16 2007-09-20 Huawei Technologies Co., Ltd. Method and apparatus for realizing adaptive quantization in encoding process
US8208545B2 (en) 2006-06-01 2012-06-26 Electronics And Telecommunications Research Institute Method and apparatus for video coding on pixel-wise prediction
JP4555257B2 (ja) 2006-06-06 2010-09-29 パナソニック株式会社 画像符号化装置
US8611418B2 (en) 2006-11-30 2013-12-17 Lsi Corporation Decoding a progressive JPEG bitstream as a sequentially-predicted hybrid video bitstream
WO2008072592A1 (ja) * 2006-12-14 2008-06-19 Nec Corporation 映像符号化方法、映像符号化装置および映像符号化プログラム
EP2149262A4 (en) 2007-04-25 2010-09-01 Lg Electronics Inc METHOD AND DEVICE FOR DECODING / CODING A VIDEO SIGNAL
CA2692782C (en) 2007-07-17 2013-09-24 Nippon Telegraph And Telephone Corporation Video encoding apparatus and method, video encoding program, and storage medium which stores the program
EP2183922A4 (en) 2007-08-16 2011-04-27 Nokia Corp METHOD AND APPARATUSES FOR ENCODING AND DECODING AN IMAGE
CN101933331B (zh) 2007-09-06 2014-04-09 日本电气株式会社 视频编码装置、视频编码方法、视频解码方法
US20090074315A1 (en) 2007-09-19 2009-03-19 Himax Technologies Limited Method of image compression and device thereof
WO2009044744A1 (ja) 2007-10-01 2009-04-09 Sharp Kabushiki Kaisha 画像符号化装置、画像符号化方法、画像符復号化システム
US8406314B2 (en) 2007-11-28 2013-03-26 Sharp Laboratories Of America, Inc. Two-dimensional DPCM with PCM escape mode
TW201006251A (en) 2008-07-30 2010-02-01 Etron Technology Inc Symbol-sharing differential pulse code modulator/demodulator, multiple differential pulse code modulator/demodulator, image encoding/decoding system and method thereof
KR20100079121A (ko) * 2008-12-30 2010-07-08 주식회사 동부하이텍 이미지 인코더 및 이미지 인코딩 방법
CA2751785C (en) 2009-02-13 2016-04-05 Research In Motion Limited Adaptive quantization with balanced pixel-domain distortion distribution in image processing
WO2010091505A1 (en) 2009-02-13 2010-08-19 Research In Motion Limited Modified entropy encoding for images and videos
KR101196920B1 (ko) 2009-04-08 2012-11-05 한국전자통신연구원 적응적 비트 심도 감소를 통한 부호화와 복호화 방법 및 그 장치
US8848788B2 (en) * 2009-05-16 2014-09-30 Thomson Licensing Method and apparatus for joint quantization parameter adjustment
US9152875B2 (en) 2009-06-11 2015-10-06 Texas Instruments Incorporated Preserving text quality in video encoding
JP2011029998A (ja) 2009-07-27 2011-02-10 Sony Corp 画像記録装置、画像記録方法、及びプログラム
US8588801B2 (en) * 2009-08-21 2013-11-19 Qualcomm Incorporated Multi-point equalization framework for coordinated multi-point transmission
US9154798B2 (en) * 2009-09-14 2015-10-06 Thomson Licensing Methods and apparatus for efficient video encoding and decoding of intra prediction mode
CN102893606B (zh) * 2010-05-14 2018-02-02 汤姆森特许公司 帧内编码将像素指定给各组的块的方法和装置
US20110292247A1 (en) * 2010-05-27 2011-12-01 Sony Corporation Image compression method with random access capability
CN105430405B (zh) 2010-07-13 2018-11-02 日本电气株式会社 视频解码装置、视频解码方法以及程序
CN107094258B (zh) 2011-02-22 2020-02-14 太阳专利托管公司 图像解码方法及图像解码装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1246246A (zh) * 1996-12-17 2000-03-01 汤姆森消费电子有限公司 图象处理系统中的象素块压缩设备
US7143432B1 (en) * 1999-10-01 2006-11-28 Vidiator Enterprises Inc. System for transforming streaming video data
CN1937776A (zh) * 2005-08-26 2007-03-28 三星电子株式会社 图像压缩装置及方法
US20080226183A1 (en) * 2007-03-16 2008-09-18 Shawmin Lei DPCM with Adaptive Range and PCM Escape Mode
GB2463974A (en) * 2008-10-01 2010-04-07 Peter Graham Craven Improved lossy coding of signals
US20100296577A1 (en) * 2009-05-25 2010-11-25 Mstar Semiconductor, Inc. Inverse Quantization Processing Method and Device

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
KEIICHI CHONO,KENTA SENZAKI,HIROFUMI AOKI,ETC: "《Pulse code modulation mode for HEVC》", 《JCT-VC 4TH MEETING: DAEGU, KOREA》, 28 January 2011 (2011-01-28) *
RESEARCH DISCLOSURE: "《Algorithm for adaptive block transform》", 《THE INDUSTRY STANDARD DISCLOSURE PUBLICATION SERVICE》, vol. 416, no. 44, 10 December 1998 (1998-12-10) *

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105556943B (zh) * 2013-09-20 2019-03-29 Vid拓展公司 提供3d查找表编码以用于色域可伸缩性的系统和方法
CN105556943A (zh) * 2013-09-20 2016-05-04 Vid拓展公司 提供3d查找表编码以用于色域可伸缩性的系统和方法
US9955174B2 (en) 2013-09-20 2018-04-24 Vid Scale, Inc. Systems and methods for providing 3D look-up table coding for color gamut scalability
US10390029B2 (en) 2013-09-20 2019-08-20 Vid Scale, Inc. Systems and methods for providing 3D look-up table coding for color gamut scalability
US10477232B2 (en) 2014-03-21 2019-11-12 Qualcomm Incorporated Search region determination for intra block copy in video coding
CN106134196A (zh) * 2014-03-21 2016-11-16 高通股份有限公司 在视频译码中用于帧内块复制的搜索区域确定
CN107211139A (zh) * 2015-01-30 2017-09-26 高通股份有限公司 用于调色板译码的译码转义像素
CN107211139B (zh) * 2015-01-30 2020-06-16 高通股份有限公司 用于译码视频数据的方法、装置和计算机可读存储媒体
CN108028936A (zh) * 2015-09-21 2018-05-11 高通股份有限公司 视频译码中成分的范围调整的固定点实施
CN105847758A (zh) * 2016-05-18 2016-08-10 深圳市神州龙资讯服务有限公司 一种高清航拍图片高速实时传输方法
WO2020056763A1 (en) * 2018-09-21 2020-03-26 Alibaba Group Holding Limited Adaptive coding of video coding units based on coding block type
CN113162731A (zh) * 2021-05-26 2021-07-23 中南大学 混合数模广播通信方法
CN113162731B (zh) * 2021-05-26 2022-09-16 中南大学 混合数模广播通信方法

Also Published As

Publication number Publication date
MX2013010148A (es) 2013-10-01
DK2681914T3 (en) 2018-11-12
US20120224640A1 (en) 2012-09-06
IL227926A0 (en) 2013-09-30
CA2828556C (en) 2017-09-12
CA2828556A1 (en) 2012-09-13
CN103404144B (zh) 2017-08-29
SI2681914T1 (sl) 2018-10-30
ES2692183T3 (es) 2018-11-30
BR112013022516A2 (pt) 2016-12-06
JP5722468B2 (ja) 2015-05-20
RU2013144556A (ru) 2015-04-10
RU2578724C2 (ru) 2016-03-27
AU2012226301B2 (en) 2015-11-05
KR101732767B1 (ko) 2017-05-04
EP2681914B1 (en) 2018-07-25
EP2681914A1 (en) 2014-01-08
UA109312C2 (uk) 2015-08-10
JP2014511649A (ja) 2014-05-15
BR112013022516B1 (pt) 2022-04-19
HUE039796T2 (hu) 2019-02-28
AU2012226301A1 (en) 2013-09-12
IL227926A (en) 2016-04-21
WO2012121820A1 (en) 2012-09-13
SG192741A1 (en) 2013-09-30
MY164711A (en) 2018-01-30
US10200689B2 (en) 2019-02-05
KR20130129459A (ko) 2013-11-28

Similar Documents

Publication Publication Date Title
CN103404144A (zh) 视频译码中的经量化脉码调制
JP6396439B2 (ja) 残差差分パルスコード変調(dpcm)拡張ならびに変換スキップ、回転、および走査との調和
JP5960309B2 (ja) マッピングされた変換と走査モードとを使用するビデオコード化
US9699472B2 (en) Restriction of prediction units in B slices to uni-directional inter prediction
JP5922245B2 (ja) クロマ成分のための適応ループフィルタ処理
CN103190147B (zh) 用于视频译码的语法元素的联合译码方法及设备
JP5922244B2 (ja) ビデオコーディングにおいて適応ループフィルタとマージされたサンプル適応オフセット
CN103299620B (zh) 在视频译码中使用最可能扫描次序对用于视频块的扫描次序信息进行有效译码
JP5866453B2 (ja) イントラモードコーディングにおける参照モード選択
CN104012096A (zh) 执行视频译码的运动向量预测
CN104221374A (zh) 在视频译码中分群经旁路译码语法元素
CN103535033A (zh) 用于样本自适应偏移的偏移类型及系数信令方法
CN103609123A (zh) 统一合并模式和自适应运动向量预测模式候选者选择
CN104255035A (zh) 视讯译码中的量化参数(qp)译码
CN103797801A (zh) 视频译码中的非正方形变换单元和预测单元
CN105191307A (zh) 在视频译码过程中用于系数级别译码的莱斯参数更新
CN103348677A (zh) 像素层级自适应帧内平滑化
CN103609118A (zh) 用于视频译码的并行化友好合并候选者
CN103959779A (zh) 在视频译码中用于自适应环路滤波和样本自适应偏移的基于最大译码单元(lcu)或分区的语法
CN104067524A (zh) 具有精简的初始化值集合的上下文自适应熵译码
CN103947207A (zh) 用于图片分割方案的统一设计
CN103493488A (zh) 用于视频译码的变换系数的译码
CN103891279A (zh) 用于帧内预测译码的最大概率变换
CN104221378A (zh) 在视频译码中用于量化矩阵的均匀粒度
CN103636223A (zh) 用于视频译码的多区扫描次序

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1188662

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1188662

Country of ref document: HK