CN105659606B - 用于视频和图像编码和解码的方法、系统和介质 - Google Patents
用于视频和图像编码和解码的方法、系统和介质 Download PDFInfo
- Publication number
- CN105659606B CN105659606B CN201380080237.9A CN201380080237A CN105659606B CN 105659606 B CN105659606 B CN 105659606B CN 201380080237 A CN201380080237 A CN 201380080237A CN 105659606 B CN105659606 B CN 105659606B
- Authority
- CN
- China
- Prior art keywords
- value
- index
- index value
- prediction
- coding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 69
- 238000012545 processing Methods 0.000 claims abstract description 22
- 238000005538 encapsulation Methods 0.000 claims description 109
- 238000003860 storage Methods 0.000 claims description 31
- 238000013139 quantization Methods 0.000 claims description 29
- 239000003086 colorant Substances 0.000 claims description 8
- 230000009466 transformation Effects 0.000 abstract description 40
- 238000013507 mapping Methods 0.000 abstract description 28
- 230000011664 signaling Effects 0.000 abstract description 24
- 230000004048 modification Effects 0.000 abstract description 11
- 238000012986 modification Methods 0.000 abstract description 11
- 238000005516 engineering process Methods 0.000 description 30
- 230000033001 locomotion Effects 0.000 description 29
- 238000004891 communication Methods 0.000 description 21
- 239000000872 buffer Substances 0.000 description 20
- 230000008569 process Effects 0.000 description 16
- 230000008859 change Effects 0.000 description 15
- 238000010586 diagram Methods 0.000 description 12
- 238000001914 filtration Methods 0.000 description 10
- 238000007689 inspection Methods 0.000 description 10
- 230000006835 compression Effects 0.000 description 7
- 238000007906 compression Methods 0.000 description 7
- 230000001419 dependent effect Effects 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 230000003044 adaptive effect Effects 0.000 description 4
- 230000011218 segmentation Effects 0.000 description 4
- 241000023320 Luma <angiosperm> Species 0.000 description 3
- OSWPMRLSEDHDFF-UHFFFAOYSA-N methyl salicylate Chemical compound COC(=O)C1=CC=CC=C1O OSWPMRLSEDHDFF-UHFFFAOYSA-N 0.000 description 3
- 230000000750 progressive effect Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 230000003139 buffering effect Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000006837 decompression Effects 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 238000012805 post-processing Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 241000208340 Araliaceae Species 0.000 description 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 1
- 235000003140 Panax quinquefolius Nutrition 0.000 description 1
- 206010052428 Wound Diseases 0.000 description 1
- 208000027418 Wounds and injury Diseases 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000000151 deposition Methods 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000001035 drying Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 238000013213 extrapolation Methods 0.000 description 1
- 238000005194 fractionation Methods 0.000 description 1
- 235000008434 ginseng Nutrition 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000000153 supplemental effect Effects 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/593—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
- H04N19/126—Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/11—Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/154—Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/18—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Color Television Systems (AREA)
Abstract
在编码和/或解码期间基础颜色索引图(“BCIM”)模式的使用中的创新通过减少为支持BCIM模式所做的修改的数量简化了实现和/或改善了BCIM模式的编码效率。例如,一些创新涉及重用被适配用于变换系数的句法结构来代替信令BCIM模式中的索引图的元素。其它创新涉及BCIM模式中的索引值的映射或BCIM模式中的索引图的元素的预测。又一些其它创新涉及BCIM模式中的例外值的处理。
Description
背景
工程师使用压缩(也叫做源编码或源编码)来降低数字视频的比特率。压 缩通过将视频信息转换成较低比特率的形式来降低存储和传送该信息的成本。 解压(也被称为解码)从压缩的形式中重构一种版本的原始信息。“编解码器” 是编码器/解码器系统。
在过去的二十年中,已采用了各种视频编解码器标准,包括ITU-T H.261、 H.262(MPEG-2或ISO/IEC 13818-2)、H.263和H.264(MPEG-4 AVC或ISO/IEC 14496-10)标准、MPEG-1(ISO/IEC 11172-2)和MPEG-4视觉(ISO/IEC 14496-2) 标准以及SMPTE 421M标准。最近,HEVC标准(ITU-T H.265或ISO/IEC 23008-2)已被批准。当前,正在开发(例如,针对可缩放视频编码/解码、针 对在样本比特深度或色度采样率方面具有较高保真度的视频的编码/解码、或针 对多视图编码/解码的)HEVC标准的扩展。视频编解码器标准通常定义针对经 编码的视频位流的句法的选项,从而详述当在编码和解码时使用特定特征时该 位流中的参数。在许多情况下,视频编解码器标准还提供关于解码器应当执行 以在解码时取得一致的结果的解码操作的细节。除了编解码器标准外,各种专 用编解码器格式定义针对经编码的视频位流的句法的其他选项以及相应的解 码操作。
在基础颜色索引图(“BCIM”)模式中,视频编码器使用表示基础颜色的索引值来编码样本值。索引值中的每一个与各样本值之中的一不同值(“基础颜色”)相关联。例如,如果8x8块在该块的64个样本值中具有4个不同的值,则编码器向那4个基础颜色分派4个不同的索引值。在编码期间,样本值被用对应的索引值取代。编码器编码并信令索引值到基础颜色的映射(“基础颜色表”)以及用于表示样本值的索引值的布置的数据(“索引图”)。解码器接收并解码索引值到基础颜色的映射。使用该映射,解码器用基础颜色取 代索引图中的索引值来获得原始样本值。
BCIM模式在编码某些“人工”创建的视频内容(诸如屏幕捕捉内容)时 可能是有帮助的。屏幕捕捉内容通常包括与自然视频相比使用很少的不同样本 值的重复结构(例如,图形、文本字符)。这提供了BCIM改善性能的机会。
用于HEVC标准以及在HEVC标准的一些参考软件中的实现的BCIM模 式的当前设置具有几个问题。例如,BCIM要求许多新句法元素和句法结构以 用于基础颜色映射和索引图,这使实现变得复杂。而且,用于编码/解码基础颜 色映射和索引图的方法使用不像在HEVC标准中已经包括的那些工具的工具, 这同样使实现变得复杂。而且,基础颜色表和索引图的编码是低效的。
概述
概述而言,详细描述提出了基础颜色索引图(“BCIM”)模式中的创新。 例如,一些创新涉及重用针对非BCIM模式中的变换系数以及针对BCIM模式 中的索引图的元素的句法结构。这可减少为支持BCIM模式所做的修改的数量。 其它创新涉及用于映射索引值或预测索引图的元素的策略,这可改善BCIM模 式的编码效率。又一些其它创新涉及BCIM模式中的例外值的处理。
针对基础颜色索引图模式的创新可以被实现为方法的一部分、被适配成执 行该方法的计算系统的一部分或存储用于使计算系统执行该方法的计算机可 执行指令的有形计算机可读介质的一部分。各创新可以结合地或分开地使用。
参考附图阅读以下详细描述,将更清楚本发明的前述和其他目标、特征 和优点。
附图简述
图1是其中可实现所描述的一些实施例的示例计算系统的示图。
图2a和2b是其中可实现所描述的一些实施例的示例网络环境的示图。
图3是结合其可实现所描述的一些实施例的示例编码器系统的示图。
图4是结合其可实现所描述的一些实施例的示例解码器系统的示图。
图5a和5b是示出结合其可实现所描述的一些实施例的示例视频编码器的 示图。
图6是示出结合其可实现所描述的一些实施例的示例视频解码器的示图。
图7是解说图片的块的基础颜色索引图模式的图表。
图8和9分别是解说当同一系数编码句法结构可被用于信令索引图的元素 或变换系数时编码和解码期间的示例过程流的图示。
图10和11分别是解说用于使用选择性地表示索引图的元素或变换系数的 系数编码句法结构的编码和解码的一般化技术。
图12是用于使用选择性地表示索引图的元素或变换系数的系数编码句法 结构的解码的示例技术的流程图。
图13是解说将索引值映射到封装索引值,以及将封装索引值映射回索引 值的图表。
图14和15分别是解说在编码和解码期间用于基础颜色的索引值的映射的 一般化技术的流程图。
图16和17是解说在编码期间使用减法运算以及在解码期间使用加法运算 的索引图的元素的预测的图表。
图18是解说在编码期间使用XOR运算来预测索引图的元素以及在解码期 间使用XOR运算来相应地重构该元素的图表。
图19和20分别是解说在编码和解码期间用于索引图的元素的预测的一般 化技术的流程图。
图21a和21b分别是解说在编码和解码期间BCIM模式的例外值和索引值 的处理的图表。
图22和23分别是解说在BCIM模式中使用索引值和例外值来编码和解码 的一般化技术的流程图。
图24是解说用于在BCIM模式中使用索引值和例外值的示例技术的流程 图。
详细描述
此详细描述呈现了在编码和/或解码器期间对基础颜色索引图(“BCIM”)模 式的使用的创新。具体而言,本详细描述呈现了用于在BCIM模式中重用句法 结构(该句法结构被适配成用于变换系数来取代信令索引图的元素的数据)、 在BCIM模式中映射索引值、在BCIM模式中预测索引图的元素并处理例外值的 创新。这些创新中的一些创新通过减少为支持BCIM模式所做的修改的数量而 简化了实现。其它创新改善了BCIM模式的编码效率。
虽然在此所述的操作是被适当描述为由视频编码器或视频解码器来执行, 但在许多情况中,所述操作可以由另一类型的媒体处理工具(例如图像编码器、 图像解码器)来执行。
本文中描述的一些创新是参考专用于HEVC标准的句法元素和操作来示 出的。例如,对HEVC标准的草稿版本JCTVC-N1005——即2013年7月的“高 效视频编码(HEVC)范围扩展文本规范:第4稿作出参考。”本文中描述的各 创新还可以被实现为针对其它标准或格式。
更一般地,本文中描述的各示例的各种替代是可能的。例如,本文中描述 的一些方法可以通过改变描述的方法动作的顺序、通过拆分、重复或忽略某些 方法动作等来更改。所公开的技术的各方面能够被组合地或分开地使用。不同 的实施例使用所描述的创新中的一个或多个。本文中描述的一些创新解决了背 景中指出的一个或多个问题。通常,所给出的技术/工具并不解决所有这些问题。
I.示例计算系统
图1示出了其中可实现几个所描述的创新的合适计算系统(100)的概括 示例。计算系统(100)并不旨对使用范围或功能提出任何限制,因为这些创 新可以在不同的通用或专用计算系统中实现。
参考图1,计算系统(100)包括一个或多个处理单元(110、115)和存储 器(120、125)。处理单元(110、115)执行计算机可执行指令。处理单元可 以是通用中央处理单元(“CPU”)、专用集成电路(“ASIC”)中的处理器或任 何其它类型的处理器。在多处理系统中,多个处理单元执行计算机可执行指令 以提高处理能力。例如,图1示出中央处理单元(110)以及图形处理单元或 协处理单元(115)。有形存储器(120、125)可以是(诸)处理单元可访问 的易失性存储器(例如,寄存器、高速缓存、RAM)、非易失性存储器(例如, ROM、EEPROM、闪存等)或这两者的某一组合。存储器(120,125)存储实现 针对BCIM模式的一个或多个创新的软件(180),该软件用适用于由(诸)处 理单元执行的计算机可执行指令的形式。
计算系统可具有附加的特征。例如,计算系统(100)包括存储(140)、 一个或多个输入设备(150)、一个或多个输出设备(160)以及一个或多个通 信连接(170)。诸如总线、控制器或网络之类的互连机制(未示出)将计算 系统(100)的各组件互连。通常,操作系统软件(未示出)为在计算系统(100) 中执行的其它软件提供操作环境,并协调计算系统(100)的各组件的活动。
有形存储(140)可以是可移动或不可移动的,并包括磁盘、磁带或磁带 盒、CD-ROM、DVD或可用于储存信息并可在计算系统(100)内访问的任何 其他介质。存储(140)存储实现针对BCIM模式的一个或多个创新的软件(180) 的指令。
(诸)输入设备(150)可以是触摸输入设备(诸如键盘、鼠标、笔或跟 踪球)、语音输入设备、扫描设备或向计算系统(100)提供输入的另一设备。 对于视频,(诸)输入设备(150)可以是相机、视频卡、TV调谐卡、或接受 模拟或数字形式的视频输入的类似设备、或将视频样本读到计算系统(100) 中的CD-ROM或CD-RW。(诸)输出设备(160)可以是显示器、打印机、 扬声器、CD刻录机或提供来自计算系统(100)的输出的另一设备。
(诸)通信连接(170)允许通过通信介质与另一计算实体通信。通信介 质传达诸如计算机可执行指令、音频或视频输入或输出、或已调制数据信号中 的其他数据之类的信息。已调制数据信号是使其一个或多个特征以在信号中编 码信息的方式设置或改变的信号。作为示例而非限制,通信介质可以使用电的、 光学的、RF或其它载体。
各创新可以在计算机可读介质的一般上下文中描述。计算机可读介质是可 在计算环境内访问的任何可用有形介质。作为示例而非局限,对于计算系统 (100),计算机可读介质包括存储器(120、125)、存储(140)、和以上任 意的组合。
各创新可在计算机可执行指令(诸如包括在程序模块中的在目标现实或虚 拟处理器上在计算系统中执行的那些计算机可执行指令)的一般上下文中描 述。一般而言,程序模块包括执行特定任务或实现特定抽象数据类型的例程、 程序、库、对象、类、组件、数据结构等。如各实施例中所描述的,这些程序 模块的功能可以被组合,或者在这些程序模块之间拆分。针对各程序模块的计 算机可执行指令可以在本地或分布式计算系统中执行。
术语“系统”和“设备”在此被互换地使用。除非上下文明确指示,否则,术 语并不暗示对计算系统或计算设备的类型的任何限制。一般说来,计算系统或 计算设备可以是本地的或分布式的,并且可以包括具有实现本文中描述的功能 的软件的专用硬件和/或通用硬件的任意组合。
所公开的方法还可使用被配置成执行所公开的方法中的任一者的专用计 算硬件来实现。例如,所公开的方法可以由被专门设计或配置成实现所公开的 方法中的任一者的集成电路(例如,诸如ASIC数字信号处理单元(“DSP”) 之类的ASIC、图像处理单元(“GPU”)、或诸如场可编程门阵列(“FPGA”) 之类的可编程逻辑器件(“PLD”))来实现。
为了呈现起见,本详细描述使用了如“确定”和“使用”等术语来描述计算系 统中的计算机操作。这些术语是对由计算机执行的操作的高级抽象,且不应与 人类所执行的动作混淆。对应于这些术语的实际的计算机操作取决于实现而不 同。
II.示例网络环境
图2a和2b示出了包括视频编码器(220)和视频解码器(270)的示例网 络环境(201,202)。编码器(220)和解码器(270)使用合适的通信协议通 过网络(250)连接。网络(250)可包括因特网或另一计算机网络。
在图2a所示的网络环境(201)中,每个实时通信(“RTC”)工具(210) 都包括用于双向通信的编码器(220)和解码器(270)两者。给定的编码器(220) 可以产生符合HEVC标准、SMPTE 421M标准、ISO/IEC 14496-10标准(也称 为H.264或AVC)、另一标准、或专用格式的变型或扩展的输出,使得相应 的解码器(270)接受来自编码器(220)的经编码的数据。双向通信可以是视 频会议、视频电话呼叫或其它双方通信场景的部分。虽然,图2a中的网络环境 (201)包括两个实时通信工具(210),但网络环境(201)可改为包括参与 多方通信的三个或更多个实时通信工具(210)。
实时通信工具(210)管理编码器(220)做出的编码。图3示出可以被包 括在实时通信工具(210)中的示例编码器系统(300)。替换地,实时通信工 具(210)使用另一编码器系统。实时通信工具(210)还管理解码器(270) 做出的解码。图4示出可以被包括在实时通信工具(210)中的示例解码器系 统(400)。替换地,实时通信工具(210)使用另一解码器系统。
在图2b中示出的网络环境(202)中,编码工具(212)包括编码供递送 给多个回放工具(214)的视频的编码器(220),此多个回放工具(214)包 括解码器(270)。单向通信可被提供用于视频监视系统、web相机监视系统、 远程桌面会议演示或在其中编码视频并将视频从一个位置发送到一个或多个 其它位置的其它场景。虽然在图2b中的网络环境(202)包括两个回放工具 (214),但该网络环境(202)可以包括更多或更少的回放工具(214)。一 般来说,回放工具(214)与编码工具(212)通信以确定回放工具(214)要 接收的视频流。回放工具(214)接收该流、缓冲所接收的经编码的数据达合 适的时间段并开始解码和回放。
图3示出可以被包括在编码工具(212)中的示例编码器系统(300)。替 换地,编码工具(212)使用另一编码器系统。编码工具(212)还可以包括用 于管理与一个或多个回放工具(214)的连接的服务器侧控制器逻辑。图4示 出可以被包括在回放工具(214)中的示例解码器系统(400)。替换地,回放 工具(214)使用另一解码器系统。回放工具(214)还可以包括用于管理与一 个或多个编码工具(212)的连接的客户机侧控制器逻辑。
III.示例编码器系统
图3是结合其可实现所描述的一些实施例的示例编码器系统(300)的框 图。编码器系统(300)可以是能够用多种编码模式中的任一者(诸如用于实 时通信的低等待时间编码模式、转码模式和针对来自文件或流的媒体回放的常 规编码模式)操作的通用编码工具,或它可以是适用于一种这样的编码模式的 专用编码工具。编码器系统(300)可以被实现为操作系统模块、应用库的部 分、独立的应用。总体上,编码器系统(300)从视频源(310)接收源视频帧 序列(311)并产生经编码的数据作为到信道(390)的输出。输出到信道的经编码的数据可包括使用BCIM模式来编码的内容。
视频源(310)可以是相机、调谐卡、存储介质、或其它数字视频源。视 频源(310)以例如每秒30帧的帧速率产生视频帧序列。如本文中所使用的, 术语“帧”一般指代源、经编码的或经重构的图像数据。对于逐行扫描视频,帧 是逐行扫描视频帧。对于隔行视频,在各示例实施例中,隔行视频帧可以在编 码之前被去隔行。替换地,两个示例性隔行视频场被编码成经隔行的视频帧或 分开的场。除了指示逐行扫描视频帧之外,术语“帧”或“图片”可以指示单个非 成对的视频场、互补的成对视频场、表示在给定时间的视频对象的视频对象平 面、或较大图像中的感兴趣区域。视频对象平面或区域可以是包括场景的多个 对象或区域的较大图像的一部分。
抵达的源帧(311)被存储在包括多个帧缓冲区存储区域(321、322、…、 32n)的源帧临时存储器存储区域(320)中。帧缓冲区(321、322等)在源 帧存储区域(320)中保持一个源帧。在一个或多个源帧(311)已被存储在帧缓 冲器(321,322等)中后,帧选择器(330)周期性地从源帧存储区域(320)中选择一 个体源帧。帧选择器(330)选择帧以供输入到编码器(340)的次序可不同于视 频源(310)产生这些帧的次序,例如帧可在次序上领先,以促成时间上向后的预 测。在编码器(340)之前,编码器系统(300)可包括预处理器(未示出), 该预处理器在编码之前执行对选中的帧(331)的预处理(例如滤波)。预处 理还可包括到供编码的到主要和次要分量的色彩空间转换。通常,在编码之前, 视频已被转换成诸如YUV的色彩空间,其中亮度(Y)分量的样本值表示明亮 度或强度值,而色度(U,V)分量的样本值表示色差值。色度样本值可以被子 采样到较低的色度采样率(例如用于YUV 4:2:0格式),或者色度样本值可以 具有与亮度样本值相同的分辨率(例如用于YUV 4:4:4格式)。或者,视频可 用另一格式(例如,RGB 4:4:4格式)来编码。
编码器(340)编码选中的帧(331)以产生经编码的帧(341)并且还产 生存储器管理控制操作(“MMCO”)信号(342)或参考图片集(“RPS”)信息。 如果当前帧不是已被编码的第一帧,则在执行其编码处理时,编码器(340) 可以使用已经被存储在经解码帧的临时存储器存储区域(360)中的一个或多 个先前被编码/解码的帧(369)。这样的存储的经解码帧(369)被用作用于当 前源帧(331)的内容的帧间预测的参考帧。一般来说,编码器(340)包括执 行编码任务的多个编码模块,编码任务为诸如分割成小块(tile)、帧内预测估 计和预测、运动估计和补偿、频率变换、量化和熵编码。由编码器(340)执 行的确切操作可以取决于压缩格式而变化。输出的经编码数据的格式可以是 HEVC格式、Windows媒体视频格式、VC-1格式、MPEG-x格式(例如,MPEG-1、 MPEG-2或MPEG-4)、H.26x格式(例如,H.261、H.262、H.263或H.264) 或其它格式的变型或扩展。
编码器(340)可以将帧分割成相同尺寸或不同尺寸的多个小块。例如, 编码器(340)沿小块行和小块列来拆分帧,这些小块行和小块列利用帧边界 定义在该帧内的小块的水平和垂直边界,其中每个小块是矩形区域。小块通常 被用于改善针对并行处理的选项。帧还可以被组织成一个或多个片,其中一个 片可以是整个帧或该帧的区域。片可以独立于帧中的其它片编码,这改善了错 误复原性。出于编码和解码的目的,片或小块的内容被进一步分割成块或其它 样本值集。
对于根据HEVC标准的句法来说,编码器将帧(或片或小块)的内容拆分 成编码树单元。编码树单元(“CTU”)包括被组织为亮度编码树块(“CTB”) 的亮度样本值,并且对应的色度样本值被组织为两个色度CTB。CTU(及其 CTB)的尺寸由编码器来选择,并且可例如为64x64、32x32或16x16个样本值。 CTU包括一个或多个编码单元。编码单元(“CU”)具有亮度编码块(“CB”) 和两个对应的色度CB。例如,具有64x64亮度CTB和两个64x64色度CTB(YUV4:4:4格式)的CTU可以被拆分成4个CU,其中每个CU包括一32x32亮度 CB和两个32x32色度CB,并且每个CU可能被进一步拆分成更小的CU。或 者,作为另一示例,具有64x64亮度CTB和两个32x32色度CTB(YUV 4:2:0 格式)的CTU可以被拆分成4个CU,其中每个CU包括一32x32亮度CB和 两个16x16色度CB,并且每个CU可能被进一步拆分成更小的CU。CU的最 小允许尺寸(例如8×8、16×16)可被信号化在位流中。
通常,CU具有诸如帧间或帧内之类的预测模式。出于信号化预测信息(例 如预测模式细节等)和/或预测处理的目的,CU包括一个或多个预测单元。预 测单元(“PU”)具有亮度预测块(“PB”)和两个对应的色度PB。对于帧内预 测的CU,PU与CU具有相同的尺寸,除非CU具有最小尺寸(例如8x8)。 在该情况下,CU可被拆分成四个较小的PU(例如,如果最小CU尺寸为8x8, 则PU为4x4),或者PU可具有最小CU尺寸,如CU的句法元素所指示的。 出于残留编码/解码的目的,CU还具有一个或多个变换单元,其中变换单元 (“TU”)具有一变换块(“TB”)和两个色度TB。在帧内预测的CU中的PU可以 包含单个TU(尺寸与PU相同)或多个TU。如本文中所使用的,术语“块”可 以指示CB、PB、TB或某些其它样本值集,这取决于上下文。编码器决定如何 将视频分割成CTU、CU、PU、TU等。
回到图3,编码器根据来自源帧(331)中的其它、先前重构的样本值的预 测来表示该帧(331)内编码的块。对于块的空间内预测,图片内估计器估计 相邻的经重构的样本值到该块的外插。帧内预测估计器可以输出经熵编码的预 测信息(例如帧内空间预测的预测模式(方向))。帧内预测预测器应用预 测信息来确定帧内预测值。对于BCIM模式,编码器用块的各样本值中针对基 础颜色的索引值来表示帧内编码的块,其使用用于索引值的基础颜色表以及使 用索引图的元素。编码器还可表示BCIM模式块中的例外值,而不使用索引值, 如下所述。
编码器(340)依据来自参考帧的预测来表示源帧(331)的帧间编码的预测 的块。运动估计器估计块相对于一个或多个参考帧(369)的运动。当使用多 个参考帧时,这多个参考帧可来自不同的时间方向或相同的时间方向。经运动 补偿的预测参考区域是(诸)参考帧中用于生成当前帧中的样本块的经运动补 偿的预测值的样本区域。运动估计器输出诸如运动向量信息之类被熵编码的运 动信息。运动补偿器将运动向量应用于参考帧(369)以确定经运动补偿的预 测值。
在非BCIM模式中,编码器确定在块的预测值(帧内或帧间)和对应的原 始值之间的差值(如果有的话)。这些预测残留值将进一步使用频率变换、量 化和熵编码来编码。例如,编码器(340)为图片、小块、片和/或视频的其它 部分设置量化参数(“QP”)的值,并相应地量化变换系数。在BCIM模式中, 编码器跳过该变换和量化操作(除了在处理例外值时的某些量化操作外)。
编码器(340)的熵编码器压缩经量化的变换系数值以及某些辅助信息(例如 运动向量信息、QP值、模式决策、参数选择)。具体地,熵编码器可使用系 数编码句法结构来压缩针对索引图的各元素的数据。典型的熵编码技术包括指 数-Golomb编码、算术编码、差分编码、Huffman编码、行程长度编码、可变 长度到可变长度(“V2V”)编码、可变长度到固定长度(“V2F”)编码、LZ编码、 词典编码、概率区间划分熵编码(“PIPE”)和上述编码的组合。熵编码器可针对 不同种类的信息使用不同的编码技术,并可从特定编码技术内的多个代码表中 进行选择。
经编码的帧(341)和MMCO/RPS信息(342)通过解码过程仿真器(350) 来处理。解码过程仿真器(350)实现了解码器的一些功能,例如对任务进行 解码以重构参考帧。解码过程仿真器(350)使用MMCO/RPS信息(342)来 确定给定的经编码帧(341)是否需要被重构并被存储以供在对要编码的后续 帧的帧间预测中用作参考帧。如果MMCO/RPS信息(342)指示经编码的帧(341) 需要被存储,则解码过程仿真器(350)对将由解码器进行的解码处理进行建 模,该解码器接收经编码的帧(341)并产生相应的经解码的帧(351)。通过 这么做,当编码器(340)已经使用已被存储在经解码帧存储区域(360)中的 经解码的帧(369)时,解码过程仿真器(350)还使用来自存储区域(360) 的经解码的帧(369)作为解码处理的一部分。
经解码帧临时存储器存储区域(360)包括多个帧缓冲存储区域(361、 362、…、36n)。解码过程仿真器(350)使用MMCO/RPS信息(342)来管 理存储区域(360)中的内容,以便标识出具有编码器(340)不再需要将其用 作参考帧的帧的任何帧缓冲器(361、362等)。在对解码处理进行建模之后,解 码过程仿真器(350)在帧缓冲区(361、362等)中存储已经以此方式标识出 的新解码的帧(351)。
经编码的帧(341)和MMCO/RPS信息(342)被缓冲在临时的经编码数 据区域(370)中。被聚集在经编码数据区域(370)中的经编码数据包含一个 或多个图片的经编码数据作为基本经编码视频位流的句法的一部分。在经编码 数据区域(370)中被聚集的经编码数据还可包括与经编码的视频数据相关的 媒体元数据(例如作为一个或多个补充增强信息(“SEI”)消息或视频可用 性信息(“VUI”)消息中的一个或多个参数)。
来自临时的经编码数据区域(370)的经聚集的数据(371)由信道编码器 (380)处理。信道编码器(380)可以(例如根据诸如ISO/IEC 13818-1的媒 体流复用格式)来分组化经聚集的数据以供作为媒体流来传输,在这种情况中, 信道编码器(380)可以添加句法元素作为媒体传输流的句法的一部分。或者, 信道编码器(380)可以(例如根据诸如ISO/IEC14496-12的媒体容器格式) 组织经聚集的数据以供作为文件来存储,在这种情况中,信道编码器(380) 可以添加句法元素作为媒体存储文件的句法的一部分。或者,更一般地,信道编码器(380)可以实现一个或多个媒体系统复用协议或传输协议,在这种情 况中,信道编码器(380)可以添加句法元素作为(诸)协议的句法的一部分。 信道编码器(380)将输出提供给信道(390),该信道(390)表示存储、通 信连接或该输出的另一信道。
IV.示例解码器系统
图4是结合其可实现所描述的一些实施例的示例解码器系统(400)的框 图。解码器系统(400)可以是能够在多种解码模式(例如针对实时通信的低 等待时间解码模式以及针对来自文件或流中的媒体回放的常规解码模式)中的 任一者操作的通用解码工具,或它可以是适用于一种这样的解码模式的专用解 码工具。解码器系统(400)可以被实现为操作系统模块、应用库的一部分或 独立的应用。总体上,解码器系统(400)从信道(410)接收经编码的数据并 产生经重构的帧作为针对输出目的地(490)的输出。经编码数据可包括使用BCIM模式编码的内容。
解码器系统(400)包括信道(410),该信道(410)可以表示存储、通 信连接或针对作为输入的经编码数据的另一信道。信道(410)产生已经被信 道编码的经编码数据。信道解码器(420)可以处理经编码的数据。例如,信 道解码器(420)可以(例如根据诸如ISO/IEC13818-1的媒体流复用格式)来 去分组化已被聚集以供作为媒体流来传输的数据,在这种情况中,信道解码器 (420)可以解析所添加的作为媒体传输流的句法的一部分的句法元素。或者, 信道解码器(420)可以(例如根据诸如ISO/IEC 14496-12的媒体容器格式) 来将已被聚集以供作为文件来存储的经编码的视频数据分开,在这种情况中, 信道解码器(420)可以解析所添加的作为媒体存储文件的句法的一部分的句 法元素。或者,更一般地,信道解码器(420)可以实现一个或多个媒体系统 去复用协议或传输协议,在这种情况中,信道解码器(420)可以解析所添加 的作为(诸)协议的句法的一部分的句法元素。
从信道解码器(420)输出的经编码的数据(421)被存储在临时的经编码数 据区域(430)中,直到已经接收到足够数量的这样的数据。经编码的数据(421) 包括经编码的帧(431)和MMCO/RPS信息(432)。在经编码数据区域(430) 中的经编码数据(421)包含一个或多个图片的经编码数据作为基本编码的视 频比特流的句法的一部分。在经编码数据区域(430)中的经编码数据(421) 还可包括与经编码的视频数据相关的媒体元数据(例如作为一个或多个SEI消 息或VUI消息中的一个或多个参数)。
一般来说,经编码数据区域(430)临时存储经编码数据(421),直到这样 的经编码数据(421)被解码器(450)使用。此时,经编码帧(431)和MMCO/RPS 信息(432)的经编码数据被从经编码数据区域(430)传输到解码器(450)。 当解码继续时,新的经编码数据被添加到经编码数据区域(430)并且保留在 经编码数据区域(430)中的最旧的经编码数据被传输到解码器(450)。
解码器(450)周期性地解码经编码帧(431)以产生相应的经解码帧(451)。 在适当时,当执行其解码处理时,解码器(450)可以将一个或多个先前解码 的帧(469)用作帧间预测的参考帧。解码器(450)从经解码帧临时存储器存 储区域(460)中读取这样的先前解码的帧(469)。通常,解码器(450)包 括执行诸如熵解码、逆量化、逆频率变换、帧内预测、运动补偿和小块合并之 类的解码任务的多个解码模块。由解码器(450)执行的确切操作可以取决于 压缩格式而变化。
例如,解码器(450)接收经压缩的帧或帧序列的经编码数据,并产生包 括经解码的帧(451)的输出。在解码器(450)中,缓冲器接收针对经压缩的帧 的经编码数据,并在适当时,使得接收到的经编码数据对熵解码器可用。熵解 码器对经熵编码的量化数据以及经熵编码的辅助信息进行熵解码,通常应用编 码器中执行的熵编码的逆来进行熵解码。运动补偿器将运动信息应用于一个或 多个参考帧以形成针对正被重构的帧的任何帧间编码块的经运动补偿的预测 值。帧内预测模块可以在空间上从邻近的、先前重构的样本值中空间地预测当 前块的样本值。对于BCIM模式,解码器用块的各样本值中针对基础颜色的索 引值重构帧内编码的块,其使用用于索引值的基础颜色表以及使用索引图的元 素。
在非BCIM模式中,解码器(450)还重构预测残留值。逆量化器对经熵解 码的数据进行逆量化。例如,解码器(450)基于比特流中的句法元素来设置 图片、小块、片和/或其它视频部分的QP值,并相应地对变换系数进行逆量化。 逆频率变换器将经量化的频域数据转换成空间域信息。在BCIM模式中,解码 器跳过逆量化和逆频率变换操作(除了在解码例外值时的某些逆量化操作外)。 对于帧间预测的块,解码器(450)将经重构的预测残留值与经运动补偿的预 测组合。解码器(450)可以类似地将预测残留值与来自帧内预测的预测组合。 视频解码器(450)中的运动补偿环路包括用于平滑经解码的帧(451)中的块边 界行和/或列上的间断的自适应去块滤波器。
经解码帧临时存储器存储区域(460)包括多个帧缓冲区存储区域(461、 462、…、46n)。经解码帧存储区域(460)是经解码图片缓冲区的一个示例。 解码器(450)使用MMCO/PS信息(432)来标识该解码器可将经解码帧(451) 存储在其中的帧缓冲器(461、462等)。解码器(450)将经解码的帧(451) 存储在那个帧缓冲器中。
输出序列发生器(480)使用MMCO/RPS信息(432)来标识按输出次序 将产生的下一帧何时可在经解码帧存储区域(460)中获得。当按输出次序将 产生的下一帧(481)可在经解码帧存储区域(460)中获得时,输出序列发生 器(480)读取该下一帧并将其输出到输出目的地(490)(例如显示器)。一 般来说,输出序列发生器(480)将帧从经解码帧存储区域(460)中输出的次 序可以与解码器(450)解码这些帧的次序不同。
V.示例视频编码器
图5a和5b是可结合其实现所描述的一些实施例的通用视频编码器(500) 的框图。编码器(500)接收包括当前图片的视频图片序列作为输入视频信号 (505)并在经编码视频位流(595)中产生经编码的数据作为输出。
编码器(500)是基于块的并使用取决于实现的块格式。块还可在不同的 阶段上被进一步细分,例如在预测、频率变换和/或熵编码阶段。例如,图片可 以被划分成64x64块、32x32块或16x16块,这些块随后可以被划分成更小的 样本值块以用于编码和解码。在针对HEVC标准的编码的实现中,编码器将图 片分割成CTU(CTB)、CU(CB)、PU(PB)和TU(TB)。
编码器(500)使用图片内编码和/或图片间编码来压缩图片。编码器(500) 的许多组件被用于图片内编码和图片间编码两者。由这些组件执行的确切操作 可取决于所压缩的信息的类型而变化。
小块化模块(510)可选地将图片分割成相同尺寸或不同尺寸的多个小块。 例如,小块化模块(510)沿小块行和小块列来拆分图片,所述小块行和小块 列利用图片边界定义在图片内的小块的水平和垂直边界,其中每个小块是矩形 区域。小块化模块(510)可随后将这些小块分组成一个或多个小块集合,其 中一小块集合是这些小块中的一个或多个的群组。
通用编码控件(520)接收输入视频信号(505)的图片以及来自编码器(500) 的各个模块的反馈(未示出)。整体上,通用编码控件(520)将控制信号(未 示出)提供给其它模块(例如小块化模块(510)、变换器/缩放器/量化器(530)、 缩放器/逆变换器(535)、图片内估计器(540)、运动估计器(550)以及帧 内/帧间切换)以设置和改变编码期间的编码参数。具体地,通用编码控件(520) 可以判定在编码期间是否和如何使用BCIM模式。通用编码控件(520)还可以 估计编码期间的中间结果,例如执行速率-失真分析来估计。通用编码控件(520) 产生指示在编码期间所做出的决定的通用控制数据(522),使得对应的解码 器可以作出一致的决定。通用控制数据(522)被提供给头部格式化器/熵编码 器(590)。
如果使用图片间预测来预测当前的图片,运动估计器(550)相对于一个 或多个参考图片估计输入视频信号(505)的当前图片的样本值的块的运动。经解 码的图片缓冲器(570)缓冲一个或多个经重构的先前编码的图片以供用作参 考图片。当使用多个参考图片时,这多个参考图片可以来自不同的时间方向或 相同的时间方向。运动估计器(550)产生诸如运动向量数据和参考图片选择 数据之类的辅助信息运动数据(552)。运动数据(552)被提供给头部格式化器/ 熵编码器(590)以及运动补偿器(555)。
运动补偿器(555)将运动向量应用于来自经解码图片缓冲器(570)的(诸)经 重构的参考图片。运动补偿器(555)产生针对当前图片的经运动补偿的预测。
在编码器(500)内的分开的路径中,图片内估计器(540)确定如何执行 对输入视频信号(505)的当前图片的样本值块的图片内预测。当前图片可全 部或部分使用图片内编码来编码。对于空间内预测,使用当前图片的重构(538) 的值,图片内估计器(540)确定如何从当前图片的邻近的、先前重构的样本 值中空间地预测当前图片的当前块的样本值。
对于BCIM模式,编码器(500)用块的各样本值中针对基础颜色的索引 值来表示帧内编码的块,其使用用于索引值的索引图以及使用索引图的元素。
帧内预测估计器(540)产生辅助信息帧内预测数据(542),诸如指示帧内预测 是使用空间预测还是BCIM模式的信息(例如,每帧内块或特定预测模式方向 的每帧内块的旗标值)、(针对帧内空间预测的)预测模式方向。帧内预测数 据(542)被提供给头部格式化器/熵编码器(590)以及图片内预测器(545)。 根据帧内预测数据(542),图片内预测器(545)从当前图片的邻近的先前重 构的样本值中在空间上预测当前图片的当前块的样本值,或重构BCM模式块的 样本值。
在非BCM模式中,帧内/帧间切换选择经运动补偿的预测或图片内预测的值 以供用作给定块的预测(558)。在非BCIM模式中,预测(558)的块和输入视 频信号(505)的原始当前图片的对应部分之间的差异(如果有的话)提供残留值 (518)。在当前图片的重构期间,经重构的残留值与预测(558)组合来从视频 信号(505)中产生对原始内容的重构(538)。然而,在有损压缩中,还是从 视频信号(505)中丢失了一些信息。
在变换器/缩放器/量化器(530)中,对于非BCIM模式,频率变换器将空 间域视频信息转换为频域(即频谱、变换)数据。对于基于块的视频编码,频 率变换器将离散余弦变换(“DCT”)、其整数近似、或另一类型的前向块变换应 用于预测残留数据的块(或者在预测(558)为空的情况下,应用于样本值数据), 从而产生频率变换系数的块。编码器(500)可能还能够指示这样的变换步骤 被省略了。缩放器/量化器对变换系数进行缩放和量化。例如,量化器将用步骤 尺寸将非统一的标量量化应用于频域数据,该步骤尺寸在逐帧的基础、逐小块 的基础、逐片的基础、逐块的基础、或其它基础上变化。经量化的变换系数数 据(532)被提供给头部格式化器/熵编码器(590)。
在缩放器/逆变换器(535)中,对于非BCIM模式,缩放器/逆量化器对经 量化的变换系数执行逆缩放和逆量化。逆频率变换器执行逆频率变换,从而产 生经重构的预测残留值或样本值的块。编码器(500)将经重构的残留值与预 测(558)的值(例如,经运动补偿的预测值、图片内预测值)组合以形成重 构(538)。
对于图片内预测,重构(538)的值可以被馈送回图片内估计器(540)和 图片内预测器(545)。同样,重构(538)的值可以被用于对后续图片的经运 动补偿的预测。重构(538)的值可被进一步滤波。对于视频信号(505)的给 定图片,滤波控件(560)确定如何对重构(538)的值执行去块滤波和样本自适 应偏移(“SAO”)滤波。滤波控件(560)生成滤波控制数据(562),它被 提供给头部格式化器/熵编码器(590)和合并器/(诸)滤波器(565)。
在合并器/(诸)滤波器(565)中,编码器(500)将来自不同小块的内容 合并到图片的经重构版本中。编码器(500)根据滤波器控制数据(562)选择 性地执行去块滤波和SAO滤波,以便自适应地平滑各帧中的各边界上的间断。 取决于编码器(500)的设置,小块边界可以被选择性地滤波或根本不被滤波, 并且编码器(500)可以在经编码的位流内提供指示是否应用这样的滤波的句 法。经解码的图片缓冲器(570)缓冲经重构的当前图片以供在后续的经运动 补偿的预测中使用。
头部格式化器/熵编码器(590)格式化和/或熵编码通用控制数据(522)、 经量化的变换系数数据(532)、帧内预测数据(542)和打包的索引值、运动 数据(552)以及滤波器控制数据(562)。例如,头部格式化器/熵编码器(590) 将上下文自适应二进制算法编码(“CABAC”)用于对系数编码句法结构的各 句法元素进行熵编码。
头部格式化器/熵编码器(590)在经编码的视频位流(595)中提供经编码 的数据。经编码的视频比特流(595)的格式可以是HEVC格式、Windows媒体视 频格式、VC-1格式、MPEG-x格式(例如,MPEG-1、MPEG-2或MPEG-4)、 H.26x格式(例如,H.261、H.262、H.263或H.264)或其它格式的变型或扩展。
取决于所需的压缩的实现和类型,编码器的模块可被添加、省略、拆分成 多个模块、与其它模块组合、和/或用相似的模块来替代。在替换实施例中,具 有不同模块和/或其它配置的模块的编码器执行一个或多个所描述的技术。编码 器的具体实施例通常使用编码器(500)的变型或补充版本。所示的编码器(500) 内的各模块之间的关系指示了信息在编码器中的一般流动;为简明起见,未示 出其它关系。
VI.示例视频解码器
图6是结合其可实现所描述的一些实施例的通用解码器(600)的框图。 解码器(600)接收经编码的视频比特流(605)中的经编码的数据并产生包括 经重构视频(695)的图片的输出。经编码的视频比特流(605)的格式可以是 HEVC格式、Windows媒体视频格式、VC-1格式、MPEG-x格式(例如,MPEG-1、 MPEG-2或MPEG-4)、H.26x格式(例如,H.261、H.262、H.263或H.264) 或其它格式的变型或扩展。
解码器(600)是基于块的并使用取决于实现的块格式。块可以在不同的 阶段被进一步细分。例如,图片可以被划分成64x64块、32x32块或16x16块, 这些块随后可以被划分成更小的样本值块。在针对HEVC标准的解码实现中, 将图片分割成CTU(CTB)、CU(CB)、PU(PB)和TU(TB)。
解码器(600)使用图片内解码和/或图片间解码来对图片进行解压缩。解 码器(600)的许多组件被用于图片内解码和图片间解码这两者。由这些组件 执行的确切操作可以取决于正被解压缩的信息的类型而变化。
缓冲器接收经编码的视频比特流(605)中的经编码数据,并使得接收到 的经编码数据可用于解析器/熵解码器(610)。解析器/熵解码器(610)通常 应用在编码器(500)中执行的熵编码的逆(例如上下文自适应二进制算术解 码)对经熵编码的数据进行熵解码。例如,解析器/熵解码器(610)将上下文 自适应二进制算法解码用于对系数编码句法结构中的各句法元素进行熵解码。” 作为解析和熵解码的结果,解析器/熵解码器(610)产生通用控制数据(622)、 经量化的变换系数数据(632)、帧内预测数据(642)和打包的索引值、运动数据(652)以及滤波器控制数据(662)。
通用解码控件(620)接收通用控制数据(622)并将控制信号(未示出) 提供给其它模块(例如缩放器/逆变换器(635)、图片内预测器(645)、运动 补偿器(655)以及帧内/帧间切换)以设置和改变解码期间的解码参数。
如果当前图片是使用图片间预测来预测的,则运动补偿器(655)接收运 动数据(652),诸如运动向量数据和参考图片选择数据。运动补偿器(655)将 运动向量应用于来自经解码图片缓冲器(670)的(诸)经重构的参考图片。运动 补偿器(655)产生针对当前图片中的帧间编码块的运动补偿的预测。经解码图片 缓冲器(670)存储一个或多个先前重构的图片以供用作参考图片。
在解码器(600)内的分开路径中,帧内预测预测器(645)接收帧内预测 数据(642),诸如指示帧内预测是使用空间预测还是BCIM模式的信息(例如, 每帧内块或特定预测模式方向的每帧内块的旗标值)、(针对帧内空间预测的) 预测模式方向。对于帧内空间内预测,根据预测模式数据使用当前图片的重构 (638)的值,图片内预测器(645)从当前图片的相邻的、先前重构的样本值 中空间地预测当前图片的当前块的样本值。对于BCIM模式,解码器用块的各 样本值中针对基础颜色的索引值重构帧内编码的块,其使用用于索引值的基础 颜色表以及使用索引图的元素。
在非BCIM模式中,帧内/帧间切换选择经运动补偿的预测或图片内预测的 值以供用作给定块的预测(658)。例如,当遵循HEVC句法时,可以基于为 图片中的CU编码的句法元素来控制帧内/帧间切换,该CU可以包括帧内预测 的CU和帧间预测的CU。解码器(600)将预测(658)与重构的残留值组合 以产生来自视频信号的内容的重构(638)。
为了重构残留值,对于非BCIM模式,缩放器/逆变换器(635)接收并处理 经量化的变换系数数据(632)。在缩放器/逆变换器(635)中,缩放器/逆量 化器对经量化的变换系数执行逆缩放和逆量化。逆频率变换器执行逆频率变 换,从而产生经重构的预测残留值或样本值的块。例如,逆频率变换器将逆块 变换应用到频率变换系数,从而产生样本值数据或预测残留数据。逆频率变换 可以是逆DCT、其整数近似或另一种类型的逆频率变换。
对于图片内预测,重构(638)的值可以被馈送回图片内预测器(645)。 对于图片间预测,重构(638)的值可以被进一步滤波。在合并器/(诸)滤波 器(665)中,解码器(600)将来自不同小块的内容合并到图片的经重构版本 中。解码器(600)根据滤波器控制数据(662)和滤波自适应规则来执行去块 滤波和SAO滤波,以便自适应地平滑各帧中的各边界上的间断。小块边界可 以被选择性地滤波或根本不滤波,这取决于解码器(600)的设置或经编码的 比特流数据内的句法指示。经解码的图片缓冲器(670)缓冲经重构的当前图 片以供在后续的经运动补偿的预测中使用。
解码器(600)还可包括后处理去块滤波器。后处理去块滤波器可选地平 滑经重构图片中的间断。其他滤波(诸如去振铃滤波)还可作为后处理滤波的 一部分被应用。
取决于所希望的解压缩的实现和类型,解码器的模块可以被添加、省略、 拆分成多个模块、与其他模块组合和/或用类似的模块来替代。在替换实施例中, 具有不同模块和/或其它配置的模块的解码器执行一个或多个所描述的技术。解 码器的具体实施例通常使用解码器(600)的变型或补充版本。所示的解码器 (600)内的模块之间的关系指示信息在解码器中的一般流动;为简明起见, 未示出其它关系。
VII.对于基础颜色索引图模式的创新。
本节提出对于基础颜色索引图(“BCIM”)模式的各种创新。一些创新 涉及重用系数编码句法结构用于BCIM模式中的变换系数或索引图数据,而其 它创新涉及BCIM模式中的索引值的映射或预测。又一些其它创新涉及BCIM 模式中的例外值的处理。这些创新能促成在速率-失真性能和/或编码和解码的 计算效率方面更有效的BCIM模式。具体地,使用BCIM模式可在编码诸如屏 幕捕捉内容之类的某种“人工”创建的视频内容时改善速率-失真性能。屏幕捕捉 内容典型地包括重复的结构(例如图形、文本字符),其为帧内BC预测提供 了改善性能的机会。屏幕捕捉内容通常用具有高色度采样分辨率的格式(例如 YUV 4:4:4或RGB 4:4:4)来编码,但是它也可以用具有较低的色度采样分辨率 (例如YUV 4:2:0)的格式来编码。
A.基础颜色索引图模式-介绍。
在BCIM模式中,视频编码器或图像编码器使用表示基础颜色的索引值来 编码样本值。索引值中的每一个与样本值中的一不同值(“基础颜色”)相关 联。在编码期间,用对应的索引值来取代样本值。编码器编码并信令索引值以 及对应的基础颜色的表格(“基础颜色表”)以及表示样本值的索引值的布置 (“索引图(index map)”)。视频解码器或图像解码器接收并解码索引值 和对应的基础颜色的表格。使用该基础颜色表,解码器用原始样本值的基础颜 色取代索引图的索引值。
图7示出具有维度i,j的二维布置中的样本值s的块(710),其中0≤ i≤7且0≤j≤7。在图7中,样本值s表示屏幕捕捉内容的强度或亮度 值。样本值s包括唯一值和强模式的区段。块(710)包括样本值26,85,41,127, 168和200。
编码器创建将索引值分配到对应的基础颜色的基础颜色表(720)。在图7 的示例中,索引值0被分配到样本值200,索引值1被分配到样本值168,如 此等等。编码器可根据其在图片中出现的可能性来将索引值分配到基础颜色, 以使得更常见的样本值具有更低的索引值且更不常见的样本值具有更高的索 引值,这通常导致在用更少的位来表示更低的索引值时更高效的编码。替换地, 编码器可根据当块被扫描时的出现次序来将索引值分配到基础颜色,其依赖于 后面的进程(诸如预测)来利用索引图的索引值中的冗余性。基础颜色表(720) 可被实现为查找表或其它数据结构。
图7示出块(730),其中用对应的索引值n来取代样本值s。用索引值取 代样本值的过程是无损的。替换地,在有损压缩变型中,如果精确匹配不可用, 则样本值可用表示最靠近该样本值的基础颜色的索引值来取代。这可减小基础 颜色表(720)的大小但是也引入了可感知的失真。下面描述处理没有用索引 值表示的样本值(所谓的例外值)的另一方式。
编码器编码并输出基础颜色表(720)以及具有表示索引值n的块(730) 的元素的索引图。例如,编码器使用系数编码句法结构来表示块(730)的元 素,如下所述。作为编码的一部分,块(730)的索引值n可被用进一步的映 射操作和/或预测来处理。
在解码期间,解码器接收并解码基础颜色表(720)和用于索引图的数据。 例如,解码器从系数编码句法结构解码块(730)的元素,如下所述。作为解 码的一部分,块(730)的索引值n可被用进一步的映射操作和/或预测来处理。 解码器随后使用基础颜色表(720)来逆转映射过程,如在图7中所示的。
在图7的示例中,编码器创建针对8x8块的样本值的基础颜色表(720)。 替换地,该块具有另一大小(例如,4x4,16x16,32x32或64x64)。更一般而 言,该块为m x n块,其中m和n可具有相等的值或具有不同的值。或者,该 编码器可创建针对切片、小块、完整图片、图片组、或视频序列的样本值的基 础颜色映射。
B.重用系数编码句法结构。
在一些示例实现中,视频编码器或图像编码器使用通常用于信令转换系数 信息以取代信令BCIM模式数据的句法结构。具体而言,编码器重用系数编码 句法结构来信令BCIM模式中的索引图信息。
图8示出在编码期间此方法的过程流(800)。编码器接收空间域值(810) 的块。空间域值(810)可以是样本值。或者,空间域值(810)可以是在图片 间预测或图片内预测之后的预测残留。编码器可在BCIM模式和非BCIM两种模 式中使用相同的系数编码句法结构,在BCIM模式中应用编码操作或在非BCIM 模式中应用操作。
对于BCIM模式,编码器将空间域值(810)(例如,样本值)映射到(812) 索引值(830),从而用对应的索引值(830)来取代空间域值(810)。编码 器进一步将索引值映射(832)到针对索引图的封装索引值(840),如在下一 节中描述的。BCIM模式中的映射操作(812、832)不包括量化或变换操作(在 一些实现中,除了对例外值的编码之外)。编码器编码(842)基础颜色表和 索引图的元素,从而使用系数编码句法结构(890)来信令索引图的封装索引 值(840)。
对于非BCIM模式,编码器向空间域值(810)(例如,残留值)应用(814) 频率变换,从而产生变换系数(860),该编码器量化(862)该变换系数。替 换地,跳过该变换和/或量化。经量化的变换系数(870)随后被使用系数编码 句法结构(890)来编码。
在遵循HEVC句法的一些示例实现中,系数编码句法结构是残留编码 (residual_coding)句法结构。例如,参见JCTVC-N1005的7.3.8.11和7.4.9.11 节。在BCIM模式中,编码器处理索引图的元素(例如,索引值、封装索引值、 索引残留值、或封装索引残留值,如下所述),就像它们是经量化的变换系数 一样。具体而言,编码器信令该块中的最后一个非零系数的位置,该块可以是 4x4块、8x8块、16x16块或32x32块。对于该块中的值的每个4x4组,编码器 信令指示该4x4组是否具有至少一个非零系数的旗标。对于具有至少一个非零 系数的4x4组,编码器信令指示哪些系数具有非零值的旗标,随后信令具有非 零值的系数的等级信息和(在大多数情况下)符号信息。编码器使用CABAC来 编码残留编码句法结构的各元素。替换地,使用另一系数编码句法结构。例如, 可使用遵循H.264标准、VC-1标准或另一标准或私有格式的句法的系数编码句 法结构。
图9示出在解码期间此方法的过程流(900)。解码器接收系数编码句法 结构(990)。解码器可在BCIM模式和非BCIM两种模式中使用相同的系数编 码句法结构,在BCIM模式中应用操作或在非BCIM模式中应用操作。
对于BCIM模式,解码器解码(942)基础颜色表并且使用系数编码句法结 构(990)也解码(942)索引图的元素。这产生索引图的封装索引值(940)。 解码器将封装索引值(940)映射(932)到例如索引图的索引值(930),如 在下一节中描述的。编码器随后将索引值(930)映射(912)到块的空间域值 (910)(例如,样本值)。BCIM模式中的映射操作(912、932)不包括逆量 化或逆变换操作(在一些实现中,除了对例外值的解码之外)。
对于非BCIM模式,解码器解码(972)已使用系数编码句法结构(990) 信令的经量化的变换系数(970)。解码器可逆量化(962)经量化的变换系数, 随后应用(914)逆频率变换来重构空间域值(910)(例如,预测残留)。替 换地,跳过逆量化和/或逆变换。解码器随后可执行图片间预测或图片内预测 (未示出)并将经重构的残留值与预测的值组合(未示出)。
图10示出用于使用系数编码句法结构来选择性地表示索引图的元素或变 换系数的编码的一般化技术(1000)。该技术(1000)可由编码器(如参考图 3或图5a和5b描述的编码器)或由另一编码器来执行。
编码器编码(1010)数据,使用块的系数编码句法结构来选择性地表示块 的索引图的元素或块的变换系数。例如,如果系数编码结构被用于非BCIM模 式中的变换系数,则编码器(a)计算块的残留值,(b)对残留值执行频率变换以 生成变换系数,(c)量化变换系数,以及(d)将所得到的值编码在系数编码句法 结构中。或者,如果系数编码结构被用于BCIM模式中的索引图,则编码器(a) 将块的样本值映射到索引值,索引值中的每一个表示一基础颜色,(b)将索引 值映射到封装索引值或封装索引残留值,以及(c)将所得到的值编码在系数编 码句法结构中。
对于BCIM模式,索引图可包括该块的封装索引值,其中封装索引值中的 每一个是表示基础颜色且被封装到该系数编码句法结构中的索引值。或者,索 引图可包括该块的封装索引残留值,其中封装索引残留值中的每一个表示基础 颜色且被封装到该系数编码句法结构中。封装索引残留值可以是基于索引值和 预测的索引值之间的差的索引残留值,或封装索引残留值可以基于封装索引值 和预测的封装索引值之间的差。索引图还可包括不表示任何基础颜色的一个或 多个例外值,其可如下所述地被处理。
编码器输出(1020)经编码数据。例如,对于遵循HEVC句法的实现,经 编码数据可包括索引图的元素或变换系数的残留编码句法结构。替换地,以某 一其它方式来格式化经编码数据。编码器可针对另一块重复该技术(1000)。
图11示出用于使用选择性地表示索引图的元素或变换系数的系数编码句 法结构的解码的一般化技术(1100)。该技术(1100)可由如参考图4或图6 描述的解码器或由另一解码器来执行。
解码器接收(1110)经编码数据。例如,对于遵循HEVC句法的实现,经 编码数据可包括索引图的元素或变换系数的残留编码句法结构。替换地,以某 一其它方式来格式化经编码数据。
解码器解码(1120)该经编码数据,使用块的系数编码句法结构,该系数 编码句法结构选择性地表示块的索引图的元素或块的变换系数。例如,如果系 数编码结构被用于非BCIM模式中的变换系数,则解码器(a)从系数编码句法结 构解码变换系数的值,(b)逆量化该变换系数,(c)对变换系数执行逆频率变换 来生成该块的残留值,以及(d)将残留值与预测值组合来重构该块的样本值。 或者,如果系数编码结构被用于BCIM模式中的索引图,则解码器(a)从系数编 码句法结构解码索引图的值,(b)将封装索引值或封装索引残留值映射到索引 值,索引值中的每一个表示一基础颜色,以及(c)将该索引值映射到该块的样 本值。
对于BCIM模式,索引图可包括该块的封装索引值,其中封装索引值中的 每一个是表示基础颜色且被封装到该系数编码句法结构中的索引值。或者,索 引图可包括该块的封装索引残留值,其中封装索引残留值中的每一个表示基础 颜色且被封装到该系数编码句法结构中。封装索引残留值可以是基于索引值和 预测的索引值之间的差的索引残留值,或封装索引残留值可以基于封装索引值 和预测的封装索引值之间的差。索引图还可包括不表示任何基础颜色的一个或 多个例外值,其可如下所述地被处理。
解码器可针对另一块重复该技术(1100)。
图12示出用于使用选择性地表示索引图的元素或变换系数的系数编码句 法结构的解码的更具体的示例技术(1200)。该技术(1200)可由如参考图4 或图6描述的解码器或由另一解码器来执行。
解码器接收(1210)块的系数编码句法结构。例如,对于在遵循HEVC句 法的实现,系数编码句法结构是残留编码句法结构。替换地,按某种其它方式 来组织系数编码句法结构。
解码器检查(1220)该块的模式是否是BCIM。例如,解码器检查该块的一 个或多个句法元素的值。对于遵循HEVC句法的实现,该(一个或多个)句法 元素指示该块是否是可针对PU信令的BCIM模式块。替换地,该(一个或多个) 句法元素被针对CU、CB、PB、TU或TB信令。
如果该块是BCIM块,则解码器从该块的系数编码结构中解码(1240)索 引图的元素。否则,解码器从该块的系数编码句法结构中解码(1230)变换系 数。例如,解码器执行如参考图9或11所述的操作。
解码器检查(1250)是否继续下一块。如果继续,则解码器接收(1210) 下一块的系数编码句法结构。
C.将索引值映射到封装索引值。
为了就像索引值是变换系数那样来信令索引值,编码器将索引值n映射到 封装索引值npacked。在解码期间,解码器将封装索引值npacked映射回索引值n。 编码器和解码器在索引值n和封装索引值npacked之间映射时可遵循若干策略。
例如,编码器可简单地使用索引值作为封装索引值。即,在编码期间npacked=n,且在解码期间n=npacked。除了其简单性之外,此方法的一个优点在于: 封装索引值npacked的符号值可从信令的经编码数据中省略,因为封装索引值总 是非负的。
作为第二示例方法,编码器可将索引值n映射到封装索引值npacked,如下:
如果n%2为0,则npacked=-(n/2);以及
否则,npacked=(n+1)/2。
其中%表示取模(MOD)运算符,以使得当x除以y时,x%y是余数,而/ 表示除法,其中结果向0截断。该解码器可将封装索引值npacked映射回索引值 n,如下:
如果npackedis≤0,则n=-2*npacked;以及
否则,n=2*npacked-1。
图13示出,根据此方法,将索引值映射到封装索引值,以及将封装索引 值映射回索引值。在编码期间块(1310)中的索引值n被映射到块(1310)中 的封装索引值npacked,且在解码期间被映射回块(1310)中的索引值n。范围从 0…5的索引值被映射到范围从-2…3的封装索引值,以及反过来。
在第二示例方法的变型中,编码器可将偶数索引值映射为非负数,并将奇 数映射到负值,而解码器逆转该映射。对于编码期间的映射:
如果n%2为0,则npacked=-(n/2);以及
否则,npacked=-(n+1)/2。
在解码时:
如果npacked为≥0,则n=2*npacked;以及
否则,n=-2*npacked-1。
作为第三示例方法,不同颜色分量(例如,YUV 4:4:4格式的视频的亮度和 色饱和度分量)的索引值可被映射到像素的单一封装索引值。例如,亮度样本 被映射到亮度索引值ny,而两个对应的色饱和度样本被映射到两个色饱和度索 引值nu和nv。索引值ny,nu和nv随后被映射到单一封装索引值。如果用来表示 索引值ny,nu和nv中的每一个的位数为nbits,则单一封装索引值npacked,combined (具有3*nbits个位)可如下确定:
npacked,combined=ny<<(2*nbits)+nu<<nbits+nv.
其中<<表示向左移位运算。为了解码,索引值ny,nu和nv可使用位掩码运 算和移位运算来重构,以标识封装索引值npacked,combined的适当位的值,如下:
ny=npacked,combined>>(2*nbits)
nu=(npacked,combined>>nbits)&((1<<nbits)-1)
nv=npacked,combined&((1<<nbits)-1)
其中>>表示向右移位运算,而&表示按位“与(AND)”运算。在编码期间在 映射操作中索引值ny,nu和nv的排序可被改变,伴随在解码期间对映射操作的 相应改变。而且,索引值ny,nu和nv可具有不同的位数,伴随对编码和解码期 间的映射操作的相应改变。
替换地,如果对于Y分量存在county个基础颜色,对于U分量存在countu个基础颜色,且对于V分量存在countv个基础颜色,则单一封装索引值可被如 下确定:
npacked,combined=nv*(county*countu)+nu*county+ny.
对于解码,索引值ny,nu和nv可被如下地重构:
ny=npacked,combined%county
nu=(npacked,combined/county)%countu
nv=npacked,combined/(county*countu)
其中/表示除法,其中结果向零截断。同样,索引值ny,nu和nv的排序可被 改变,伴随对所使用的计数变量的相应改变。
替换地,编码器和解码器在索引值n和封装索引值npacked之间映射时使用 不同方法。
图14解说了用于在编码期间映射基础颜色的索引值的技术(1400)。该 技术(1400)可由如参考图3或图5a和5b描述的编码器或由另一编码器来执 行。
编码器(1410)将样本值映射到基础颜色的索引值。例如,编码器使用如 上所述的基础颜色表来将亮度或色饱和度样本值映射到索引值。
编码器随后将索引值映射(1420)到用于系数编码句法结构的封装索引值 的至少一部分。例如,编码器基于该索引值来设置封装索引值,例如,如在上 面所述的第一映射方法中。或者,作为另一示例,如果该索引值为偶数,则编 码器基于索引值除以2来设置封装索引值,但是否则该编码器基于该索引值加 1随后除以2(例如,如在上述第二映射方法中)来设置封装索引值。或者, 作为另一示例,编码器使用该索引值来设置封装索引值的一部分,如在上述第 三映射方法中,其中封装索引值是基于亮度索引值和多个色饱和度索引值来设 置的。
编码器随后可基于封装索引值和预测的封装索引值来确定封装索引残留 值,如下所述。或者,被映射到封装索引残留值的索引值可以是索引残留值。
编码器检查(1430)是否继续下一样本值。如果是,则编码器将下一样本 值映射(1410)到下一索引值。编码器可按照光栅扫描图案前进遍历块的各样 本值。或者,对于第三方法,编码器可将亮度块和色饱和度块中的对应位置的 样本值映射到索引值,随后将那些索引值映射到封装索引值。
图15解说了用于在解码期间映射基础颜色的索引值的技术(1500)。该 技术(1500)可由如参考图4或图6描述的解码器或由另一解码器来执行。
解码器将系数编码句法结构的封装索引值的至少一部分映射(1510)到基 础颜色的索引值。
例如,解码器基于封装索引值来设置该索引值,例如,如在上面所述的第 一映射方法中。或者,作为另一示例,如果封装索引值具有与零的给定关系, 则解码器基于封装索引值乘以2来设置索引值,但是否则该解码器基于该封装 索引值乘以2减1(例如,如在上述第二映射方法中)来设置索引值。或者, 作为另一示例,解码器使用该封装索引值的一部分来设置该索引值,例如,如 在上述第三映射方法中,其中亮度索引值和多个色饱和度索引值是基于封装索 引值来设置的。
解码器将索引值映射(1520)到样本值。例如,解码器使用如上所述的基 础颜色表来将亮度或色饱和度索引值映射到样本值。
在映射操作之前,解码器可预测给定封装索引值,随后将封装索引残留值 和预测的封装索引值相组合以重构该封装索引值。或者,被重构的索引值可以 是索引残留值。
解码器检查(1530)是否继续下一索引值。如果是,则解码器将该系数编 码句法结构的封装索引值的至少一部分映射(1510)到基础颜色的下一索引值。 解码器器可按照光栅扫描图案前进遍历块的各索引值。或者,对于第三方法, 解码器可将封装索引值映射到亮度块和色饱和度块中的对应位置的多个索引 值,随后将那些索引值映射到样本值。
D.索引图的元素的预测。
编码器和解码器也可使用索引图的元素的预测。当预测工作良好时,许多 索引残留值(或封装索引残留值)具有值0。预测改善了典型熵编码模式中的 编码效率,因为更接近0的值被使用更少的位来编码。
图16示出了具有维度i,j的索引值n的块(1610),其中0≤i≤7且0≤j ≤7。替换地,预测被应用到另一大小的块(例如4x4,16x16或32x32)。在编 码期间,编码器在逐个索引值的基础上从一个或多个相邻索引值来预测给定索 引值n(i,j)。预测的方向可以是水平、垂直、右下方向的对角、或某个其它方 向。在图16中,例如,预测的方向是垂直,从而产生索引残留值nresid的块(1630)。 索引值n(i,j)被使用同一列中的前一索引值n(i,j-1)来预测。索引残留值简单地 为这两个值之间的差。nresid(i,j)=n(i,j)-n(i,j-1)。类似地,对于水平预测,索 引残留值是该索引值和作为所预测的索引值的其左侧的相邻索引值之间的差: nresid(i,j)=n(i,j)-n(i-1,j)。对于在45度向下角度的对角预测,索引残留值可 被计算为nresid(i,j)=n(i,j)-(n(i,j-1)+n(i-1,j))>>1,或可被计算为nresid(i,j)=n(i,j)-n(i-1,j-1)。其它对角方向上的预测可简单地取决于预测的角度来混合相邻索 引值。为了块的边处的预测(例如i<0和/或j<0),相邻索引值可具有值0 或被赋予一默认值(例如,索引值的数字除以2)。在解码期间,解码器确定 相同的预测的索引值(取决于预测的方向)并将预测的索引值与索引残留值相 组合。对于垂直预测,n(i,j)=nresid(i,j)+n(i,j-1)。对于水平预测,n(i,j)=nresid(i, j)+n(i-1,j)。对于在45度向下角度的对角预测,n(i,j)=nresid(i,j)+(n(i,j-1)+ n(i-1,j))>>1或n(i,j)=nresid(i,j)+n(i-1,j-1)。其它对角方向上的预测可简单地 取决于预测的角度来混合相邻索引值。
在图16中,在索引值被映射到封装索引值之前应用预测。替换地,在索 引值被映射到封装索引值之后应用预测。
图17示出了具有维度i,j的封装索引值n的块(1710),其中0≤i≤7且 0≤j≤7。替换地,预测被应用到另一大小的块(例如4x4,16x16或32x32)。 在编码期间,编码器在逐个封装索引值的基础上从一个或多个相邻封装索引值 预测给定封装索引值npacked(i,j)。预测的方向可以是水平、垂直、右下方向的对 角、或某个其它方向。在图17中,例如,预测的方向是垂直,从而产生封装 索引残留值npacked,resid的块(1730)。封装索引值npacked(i,j)被使用同一列中的 前一封装索引值npacked(i,j-1)来预测。封装索引残留值简单地为这两个值之间的 差。npacked,resid(i,j)=npacked(i,j)-npacked(i,j-1)。类似地,对于水平预测,封装索引残留值是该封装索引值和作为所预测的索引值的其左侧的相邻封装索引值 之间的差:npacked,resid(i,j)=npacked(i,j)-npacked(i-1,j)。对于在45度向下角度的 对角预测,封装索引残留值可被计算为npacked,resid(i,j)=npacked(i,j)-(npacked(i, j-1)+npacked(i-1,j))>>1,或可被计算为npacked,resid(i,j)=npacked(i,j)-npacked(i-1, j-1)。其它对角方向上的预测可简单地取决于预测的角度来混合相邻封装索引 值。为了块的边处的预测(例如i<0和/或j<0),相邻封装索引值可具有值 0或被赋予一默认值。在解码期间,解码器确定相同的预测的封装索引值(取 决于预测的方向)并将预测的封装索引值与封装索引残留值相组合。对于垂直 预测,npacked(i,j)=npacked,resid(i,j)+npacked(i,j-1)。对于水平预测,npacked(i,j)=npacked,resid(i,j)+npacked(i-1,j)。对于在45度向下角度的对角预测,npacked(i,j)=npacked,resid(i,j)+(npacked(i,j-1)+npacked(i-1,j))>>1或npacked(i,j)=npacked,resid(i,j)+npacked(i-1,j-1)。其它对角方向上的预测可简单地取决于预测的角度来混合相邻 封装索引值。
在前一预测示例中,减法运算在编码期间被使用,而加法运算在解码期间 被使用。替换地,编码器和解码器可在预测中使用按位异或(XOR)运算。
在预测封装索引值时,编码器将封装索引残留值确定为封装索引值XOR 其预测的封装索引值。在预测索引值时,编码器将索引残留值确定为索引值 XOR其预测的索引值。残留值被信令给解码器。预测的值可取决于预测的方向 (例如,水平、垂直、对角)。
在预测封装索引值时,解码器将封装索引残留值确定为其封装索引残留值 XOR预测的封装索引值。在预测索引值时,解码器将索引值确定为其索引残留 值XOR其预测的索引值。同样,预测的值可取决于预测的方向(例如,水平、 垂直、对角)。
图18解说了在编码和解码期间使用XOR运算的预测。封装索引值为7, 且预测的封装索引值(基于一个或多个相邻封装索引值)为6。在编码期间, 编码器确定封装索引残留值为1:00000001=00000111XOR 00000110。在解码 期间,解码器根据封装索引残留值和预测的封装索引值来重构封装索引值7: 00000111=00000001XOR 00000110。
取代被应用至一值,预测的值和残留值,的所有位,预测运算(不管是减 法、XOR还是其它)可被应用到位的子集。例如,XOR运算可被应用到索引 值和其预测的索引值的最低p位。假定pmask为(1<<p)-1。编码器确定索引残留 值nresid(i,j)=(n(i,j)>>p<<p)+(npredicted(i,j)&pmask)XOR(n(i,j)&pmask),其中 npredicted(i,j)可以是n(i,j-1)或者n(i-1,j)或取决于预测方向的某个其它预测的值。 残留值被信令给解码器。解码器确定索引值n(i,j)=(nresid(i,j)>>p<<p)+(nresid(i, j)&pmask)XOR(npredicted(i,j)&pmask)。相同的运算可被应用至预测的封装索引 值。在部分位上的运算可被应用至这些值的若干最低有效位、若干最高有效位 或中间位。经受预测运算的位可以是连续或不连续的。
在遵循HEVC句法的实现中,编码器和解码器可重用正常被用来预测残留 值来取代预测索引图的元素的编码工具。具体而言,当不向残留值应用变换时 (但是可以或可以不应用量化),编码器和解码器可使用该工具来根据相邻残 留值预测残留值。用于信令其使用的编码工具和句法也可被应用至索引图的元 素。
图19示出了用于在编码期间预测索引图的元素的技术(1900)。该技术 (1900)可由如参考图3或图5a和5b描述的编码器或由另一编码器来执行。
编码器编码(1910)数据,具体而言,使用预测来编码块的索引图的元素。 例如,当索引图包括索引残留值时,编码器预测表示基础颜色的索引值,随后 基于该索引值和预测的索引值来确定索引残留值。或者,当索引图包括封装索 引残留值时,编码器预测封装索引值(其中该封装索引值是表示基础颜色且被 封装到系数编码句法结构中的索引值),随后基于封装索引值和预测的封装索 引值来确定封装索引残留值。带预测的编码可包括在所述值的所有位上或在所 述值的部分位上的减法运算、XOR运算或其它运算。
编码器输出(1920)经编码数据。编码器检查(1930)是否继续下一块。 如果是,则编码器通过编码(1910)下一块的索引图的元素来继续。
图20示出了用于在解码期间预测索引图的元素的技术(2000)。该技术 (2000)可由如参考图4或图6描述的解码器或由另一解码器来执行。
解码器接收(2010)经编码数据并解码(2020)该经编码数据。具体而言,解 码器使用预测来解码块的索引图的元素。例如,当索引图包括索引残留值时, 解码器预测表示基础颜色的索引值,随后组合索引残留值和预测的索引值。或 者,当索引图包括封装索引残留值时,解码器预测封装索引值(其中该封装索 引值是表示基础颜色且被封装到系数编码句法结构中的索引值),随后组合封 装索引残留值和预测的封装索引值。带预测的解码可包括在所述值的所有位上 或在所述值的部分位上的加法运算、XOR运算或其它运算。
解码器检查(2030)是否继续下一块。如果是,则解码器通过接收(2010) 下一块的经编码数据来继续。
E.例外值的处理。
当BCIM模式被使用时,在基础颜色表中,编码器和解码器可向在块中使 用的每个不同样本值分配索引值。在一些情况下,这可导致不足以信令的基础 颜色表,尤其是在一些索引值被极不频繁地使用时。当特定基础颜色在块中极 少出现时,可能不值得向该基础颜色分配索引值。
在一些示例实现中,编码器和解码器可使用若干方法中的任何方法来处理 在块中极少出现的基础颜色。具有这些稀少基础颜色之一的“例外”值不被使 用索引值来编码或解码。
在一个方法中,当编码器标识一例外值时,编码器确定基础颜色表中用索 引值表示的最接近的基础颜色。编码器使用该最接近的基础颜色的索引值来表 示该例外值。解码器将该例外值作为与该基础颜色表中与该索引值相关联的样 本值来重构。此方法是一种类型的有损压缩,且在一些情况下,可能导致严重 的失真。
在另一方法中,编码器将例外值直接信令为样本值,所述样本值可被量化。 例如,编码器确定对基础颜色表而言可能的最高封装索引值h,其取决于用于 映射的方法。当npacked=n时,值h是npacked的最高值。当n的奇数值被根据 npacked=(n+1)/2映射时,值h同样是npacked的最高值。
编码器将例外值表示为e=s/q+h+1,其中q是量化参数,而/表示除法,其 向着0截断。如果不应用量化,q=1,则除法运算可被跳过。在解码器侧,如 果封装索引值npacked小于或等于h,则解码器使用映射操作和基础颜色表来根 据封装索引值npacked解码样本值s,如以上所述。然而,如果封装索引值大于h, 则封装索引值实际上是例外值e,且样本值被重构为s”=(e-h-1)*q。
图21a和21b分别解说了在编码和解码期间对BCIM模式的例外值和索引 值的处理(2100)。在图21a中,样本值s的块(2110)包括用基础颜色的索 引值表示的一些样本值:85,41,200,168,127,26。这些值被使用图21a中示出 的基础颜色表在BCIM模式中编码。
块(2110)还包括在该块中不频繁地出现且因此没有用基础颜色的索引值 来表示的两个样本值。这两个例外—179和28—被使用量化参数q(其中在图 21a和21b中q=4)和最高封装索引值h(其中在图21a和21b中h=3)来编 码。h的值取决于索引值的范围。q的值在各块、各切片、各小块、各图片等 之间可改变。如在封装索引值和例外值e的块(2130)中所示,样本值179被 编码为例外值49=(181/4)+3+1,且样本值29被编码为例外值11=(29/4)+3 +1。
如图21b中所示,在解码期间,大于3的任何封装索引值被作为例外值处 理。例外值49被重构为样本值180=(49-3-1)*4,且例外值11被重构为样本 值28=(11-3-1)*4。块(2150)中的大部分值被使用图21b中示出的映射运 算和基础颜色表在BCIM模式中解码。
图22示出用于在BCIM模式中使用索引值和例外值来编码的一般化技术 (2200)。该技术(2200)可由如参考图3或图5a和5b描述的编码器或由另 一编码器来执行。
编码器使用各自表示基础颜色的一个或多个索引值以及不表示任何基础 颜色的一个或多个例外值来编码(2210)块的数据。例如,编码器使用如上所 述的封装索引值或封装索引残留值来编码块的一些样本值。编码器还将一些样 本值编码为例外值。例如,编码器使用量化参数和最高封装索引值来用例外值 取代样本值。
编码器输出(2220)经编码数据。编码器检查(2230)是否继续下一块。 如果是,则编码器通过编码(2210)下一块的数据来继续。
图23示出用于在BCIM模式中使用索引值和例外值来解码的技术(2300)。 该技术(2300)可由如参考图4或图6描述的解码器或由另一解码器来执行。
解码器接收(2310)经编码数据并解码(2320)该经编码数据。具体而言, 解码器解码一个或多个索引值,每个索引值表示一基础颜色。该一个或多个索 引值可以是封装索引值或封装索引残留值。解码器还解码不表示任何基础颜色 的一个或多个例外值。例如,对于所述例外值之一,解码器使用例外值、量化 参数和最高封装索引值来重构样本值。
解码器检查(2330)是否继续下一块。如果是,则解码器通过接收(2310) 下一块的经编码数据来继续。
图24示出用于在BCIM模式块的解码期间使用索引值和例外值的更具体的 技术(2400)。该技术(2400)可由如参考图4或图6描述的解码器或由另一 解码器来执行。
对于块的封装索引值,解码器检查(2520)该值是否超出一阈值。例如, 该阈值是封装索引值的最高可能值。如果封装索引值超出该阈值,则解码器将 该值作为例外值处理(2540)。否则,解码器使用映射操作和基础颜色表来处 理(2530)该值。解码器随后检查(2550)是否继续该块中的下一值。如果是, 则解码器检查(2520)如何解码下一值。
在前述示例中,阈值基于最高封装索引残留值。替换地,当封装索引值残 留值被使用时,阈值基于最高的可能的封装索引残留值,该最高的可能的封装 索引残留值取决于封装索引值和其预测的封装索引值之间的最大的可能的差。
鉴于可应用所公开的本发明的原理的许多可能的实施例,应当认识到,所 示实施例仅是本发明的优选示例,并且不应认为是限制本发明的范围。相反, 本发明的范围由后续的权利要求来界定。我们要求作为我们的发明保护落入这 些权利要求范围和精神内的所有内容。
Claims (22)
1.一种包括一个或多个处理单元和存储器的计算设备,其中所述计算设备实现视频或图像的编码器,所述编码器被配置成执行操作,所述操作包括:
使用图片内压缩来编码图片的单元的数据,所述单元包括一个或多个块,其中所述编码使用基础颜色表和索引图,所述基础颜色表将一个或多个索引值分配到一个或多个相应的基础颜色,所述索引图包括所述一个或多个索引值中的至少一个索引值,并且所述索引图进一步包括一个或多个例外值,所述一个或多个例外值不表示所述基础颜色表中的所述一个或多个相应的基础颜色中的任何基础颜色;以及
输出所述编码数据。
2.如权利要求1所述的计算设备,其特征在于,所述编码包括,针对所述一个或多个例外值中的一个例外值:
使用量化参数来编码样本值。
3.如权利要求1所述的计算设备,其特征在于,所述一个或多个索引值是封装索引值或封装索引残留值。
4.如权利要求1所述的计算设备,其特征在于,所述编码包括,针对所述一个或多个例外值中的一个例外值,使用索引值中的最高可能值来指定所述例外值。
5.如权利要求1所述的计算设备,其特征在于,所述单元是编码单元,且其中所述编码单元具有帧内预测的预测模式。
6.如权利要求5所述的计算设备,其特征在于,所述编码数据包括旗标值,所述旗标值指示所述帧内预测是使用空间预测还是基础颜色索引图模式。
7.如权利要求1所述的计算设备,其特征在于,所述编码包括使用邻近的索引值来预测所述索引图中的给定索引值。
8.如权利要求7所述的计算设备,其特征在于,所述编码包括,所述邻近的索引值高于所述索引图中的所述给定索引值。
9.一种在具有视频解码器或图像解码器的计算设备中的方法,该方法包括:
接收图片的单元的经编码数据,所述单元已被使用图片内压缩编码,所述单元包括一个或多个块;以及
解码所述经编码数据,其中所述解码使用基础颜色表和索引图,所述基础颜色表将一个或多个索引值分配到一个或多个相应的基础颜色,所述索引图包括所述一个或多个索引值中的至少一个索引值,且所述索引图进一步包括一个或多个例外值,所述一个或多个例外值不表示所述基础颜色表中的所述一个或多个相应的基础颜色中的任何基础颜色。
10.如权利要求9所述的方法,其特征在于,所述解码包括,针对所述一个或多个例外值中的一个例外值:
使用量化参数来重构样本值。
11.如权利要求9所述的方法,其特征在于,所述一个或多个索引值是封装索引值或封装索引残留值。
12.如权利要求9所述的方法,其特征在于,针对所述一个或多个例外值中的一个例外值,索引值中的最高可能值指定所述例外值。
13.如权利要求9所述的方法,其特征在于,所述单元是编码单元,且其中所述编码单元具有帧内预测的预测模式。
14.如权利要求13所述的方法,其特征在于,所述经编码数据包括旗标值,所述旗标值指示所述帧内预测是使用空间预测还是基础颜色索引图模式。
15.如权利要求9所述的方法,其特征在于,所述解码包括使用邻近的索引值来预测所述索引图中的给定索引值。
16.如权利要求15所述的方法,其特征在于,所述邻近的索引值高于所述索引图中的所述给定索引值。
17.一种在具有视频解码器或图像解码器的计算设备中的系统,该系统包括:
用于接收图片的单元的经编码数据的装置,所述单元已被使用图片内压缩编码,所述单元包括一个或多个块;以及
用于解码所述经编码数据的装置,其中所述解码使用基础颜色表和索引图,所述基础颜色表将一个或多个索引值分配到一个或多个相应的基础颜色,所述索引图包括所述一个或多个索引值中的至少一个索引值,且所述索引图进一步包括一个或多个例外值,所述一个或多个例外值不表示所述基础颜色表中的所述一个或多个相应的基础颜色中的任何基础颜色。
18.如权利要求17所述的系统,其特征在于,用于解码的装置包括,针对所述一个或多个例外值中的一个例外值:
用于使用所量化参数来重构样本值的装置。
19.如权利要求17所述的系统,其特征在于,针对所述一个或多个例外值中的一个例外值,索引值中的最高可能值指定所述例外值。
20.如权利要求17所述的系统,其特征在于,所述单元是编码单元,且其中所述编码单元具有帧内预测的预测模式,且其中所述经编码数据包括旗标值,所述旗标值指示所述帧内预测是使用空间预测还是基础颜色索引图模式。
21.如权利要求17所述的系统,其特征在于,用于解码的装置包括用于使用邻近的索引值来预测所述索引图中的给定索引值的装置,且其中所述邻近的索引值高于所述索引图中的所述给定索引值。
22.一种具有指令的计算机可读存储介质,当所述指令被执行时使得机器执行如权利要求9-16中任一权利要求所述的方法。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/CN2013/085166 WO2015054812A1 (en) | 2013-10-14 | 2013-10-14 | Features of base color index map mode for video and image coding and decoding |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105659606A CN105659606A (zh) | 2016-06-08 |
CN105659606B true CN105659606B (zh) | 2019-06-18 |
Family
ID=52827519
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201380080237.9A Active CN105659606B (zh) | 2013-10-14 | 2013-10-14 | 用于视频和图像编码和解码的方法、系统和介质 |
Country Status (11)
Country | Link |
---|---|
US (4) | US10506254B2 (zh) |
EP (2) | EP3058740B1 (zh) |
JP (1) | JP6336058B2 (zh) |
KR (2) | KR102318785B1 (zh) |
CN (1) | CN105659606B (zh) |
AU (1) | AU2013403225B2 (zh) |
BR (1) | BR112016008044A8 (zh) |
CA (1) | CA2925183C (zh) |
MX (1) | MX368934B (zh) |
RU (1) | RU2666635C2 (zh) |
WO (1) | WO2015054812A1 (zh) |
Families Citing this family (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6336058B2 (ja) | 2013-10-14 | 2018-06-06 | マイクロソフト テクノロジー ライセンシング,エルエルシー | ビデオ及び画像符号化及び復号のためのベースカラーインデックスマップモードの機能 |
WO2015054811A1 (en) | 2013-10-14 | 2015-04-23 | Microsoft Corporation | Features of intra block copy prediction mode for video and image coding and decoding |
WO2015054813A1 (en) | 2013-10-14 | 2015-04-23 | Microsoft Technology Licensing, Llc | Encoder-side options for intra block copy prediction mode for video and image coding |
US10291827B2 (en) * | 2013-11-22 | 2019-05-14 | Futurewei Technologies, Inc. | Advanced screen content coding solution |
BR112016015080A2 (pt) | 2014-01-03 | 2017-08-08 | Microsoft Technology Licensing Llc | Predição de vetor de bloco em codificação / decodificação de vídeo e imagem |
US10390034B2 (en) | 2014-01-03 | 2019-08-20 | Microsoft Technology Licensing, Llc | Innovations in block vector prediction and estimation of reconstructed sample values within an overlap area |
US11284103B2 (en) | 2014-01-17 | 2022-03-22 | Microsoft Technology Licensing, Llc | Intra block copy prediction with asymmetric partitions and encoder-side search patterns, search ranges and approaches to partitioning |
US10542274B2 (en) | 2014-02-21 | 2020-01-21 | Microsoft Technology Licensing, Llc | Dictionary encoding and decoding of screen content |
US10638143B2 (en) | 2014-03-21 | 2020-04-28 | Futurewei Technologies, Inc. | Advanced screen content coding with improved color table and index map coding methods |
CN105100814B (zh) | 2014-05-06 | 2020-07-14 | 同济大学 | 图像编码、解码方法及装置 |
US10091512B2 (en) | 2014-05-23 | 2018-10-02 | Futurewei Technologies, Inc. | Advanced screen content coding with improved palette table and index map coding methods |
EP3158734A1 (en) | 2014-06-19 | 2017-04-26 | Microsoft Technology Licensing, LLC | Unified intra block copy and inter prediction modes |
EP3138288B1 (en) * | 2014-06-20 | 2020-12-23 | HFI Innovation Inc. | Method and apparatus of binarization and context-adaptive coding for syntax in video coding |
EP3917146A1 (en) | 2014-09-30 | 2021-12-01 | Microsoft Technology Licensing, LLC | Rules for intra-picture prediction modes when wavefront parallel processing is enabled |
US10659783B2 (en) | 2015-06-09 | 2020-05-19 | Microsoft Technology Licensing, Llc | Robust encoding/decoding of escape-coded pixels in palette mode |
US10986349B2 (en) | 2017-12-29 | 2021-04-20 | Microsoft Technology Licensing, Llc | Constraints on locations of reference blocks for intra block copy prediction |
US10491897B2 (en) * | 2018-04-13 | 2019-11-26 | Google Llc | Spatially adaptive quantization-aware deblocking filter |
CN108632630B (zh) * | 2018-05-28 | 2020-03-31 | 中国科学技术大学 | 一种结合位运算和概率预测的二值图像编码方法 |
MX2021003854A (es) * | 2018-10-01 | 2021-05-27 | Op Solutions Llc | Métodos y sistemas de partición exponencial. |
US20200367209A1 (en) * | 2019-05-16 | 2020-11-19 | Mediatek Singapore Pte. Ltd. | HARQ Offset And Reduced Bi-Field Size In DAI Signaling For Compact DCI In Mobile Communications |
WO2020244661A1 (en) | 2019-06-06 | 2020-12-10 | Beijing Bytedance Network Technology Co., Ltd. | Implicit selection of transform candidates |
CN112118449B (zh) * | 2019-06-21 | 2022-03-25 | 腾讯科技(深圳)有限公司 | 一种图像压缩与解压缩的方法及装置 |
CN112969074B (zh) * | 2021-02-01 | 2021-11-16 | 西南交通大学 | 一种应用于静态霍夫曼表的全并行频数排序生成方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101816177A (zh) * | 2007-09-13 | 2010-08-25 | 微软公司 | 文本图像编码 |
US8036271B2 (en) * | 2004-02-24 | 2011-10-11 | Lsi Corporation | Method and apparatus for determining a second picture for temporal direct-mode block prediction |
CN102223541A (zh) * | 2011-07-14 | 2011-10-19 | 北京工业大学 | 一种混合图像的编码方法 |
WO2012146320A1 (en) * | 2011-04-29 | 2012-11-01 | Telefonaktiebolaget L M Ericsson (Publ) | Encoder, decoder and methods thereof for texture compression |
Family Cites Families (241)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2114404B (en) | 1982-01-28 | 1986-07-02 | British Broadcasting Corp | Generating a colour video signal representative of a stored picture |
JPH087553B2 (ja) | 1988-10-27 | 1996-01-29 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 色画像量子化方法及び装置 |
US5706290A (en) | 1994-12-15 | 1998-01-06 | Shaw; Venson | Method and apparatus including system architecture for multimedia communication |
US8505108B2 (en) | 1993-11-18 | 2013-08-06 | Digimarc Corporation | Authentication using a digital watermark |
US5508942A (en) | 1993-11-24 | 1996-04-16 | Intel Corporation | Intra/inter decision rules for encoding and decoding video signals |
US5999189A (en) | 1995-08-04 | 1999-12-07 | Microsoft Corporation | Image compression to reduce pixel and texture memory requirements in a real-time image generator |
US6389162B2 (en) | 1996-02-15 | 2002-05-14 | Canon Kabushiki Kaisha | Image processing apparatus and method and medium |
CA2368456C (en) | 1999-04-02 | 2009-01-20 | Matsushita Electric Industrial Co., Ltd. | Optical disc, recording device and reproducing device |
JP2001251507A (ja) | 2000-03-03 | 2001-09-14 | Fujitsu Ltd | 画像処理装置 |
US6701012B1 (en) | 2000-07-24 | 2004-03-02 | Sharp Laboratories Of America, Inc. | Out-of-layer pixel generation for a decomposed-image layer |
US6748116B1 (en) | 2000-08-22 | 2004-06-08 | Airzip, Inc. | Apparatus and method for compressing and decompressing image files |
DE10049571C1 (de) | 2000-10-06 | 2002-06-13 | Siemens Ag | Verfahren und Anordnung zum Übertragen eines Vektors |
US7023924B1 (en) | 2000-12-28 | 2006-04-04 | Emc Corporation | Method of pausing an MPEG coded video stream |
US6853755B2 (en) | 2001-03-28 | 2005-02-08 | Sharp Laboratories Of America, Inc. | Method and apparatus for adaptive compression of scanned documents |
EP1433121A4 (en) | 2001-09-12 | 2007-03-21 | Bonet Jeremy S De | TRANSFORMATION TO INCREASE THE COMPRESSIBILITY OF IMAGES WITH A MINIMUM OF VISUAL DISTORTION BASED ON LEMPEL-ZIV METHODS |
US6934679B2 (en) | 2002-03-07 | 2005-08-23 | Microsoft Corporation | Error resilient scalable audio coding |
US7120196B2 (en) | 2002-04-29 | 2006-10-10 | Ess Technology, Inc. | Intra-prediction using intra-macroblock motion compensation |
PT1467491E (pt) | 2002-05-02 | 2007-03-30 | Fraunhofer Ges Forschung | Codificação aritmética de coeficientes de transformação |
US7289674B2 (en) | 2002-06-11 | 2007-10-30 | Nokia Corporation | Spatial prediction based intra coding |
US7016547B1 (en) | 2002-06-28 | 2006-03-21 | Microsoft Corporation | Adaptive entropy encoding/decoding for screen capture content |
US7085420B2 (en) | 2002-06-28 | 2006-08-01 | Microsoft Corporation | Text detection in continuous tone image segments |
US7072512B2 (en) | 2002-07-23 | 2006-07-04 | Microsoft Corporation | Segmentation of digital video and images into continuous tone and palettized regions |
DE10301362B4 (de) | 2003-01-16 | 2005-06-09 | GEMAC-Gesellschaft für Mikroelektronikanwendung Chemnitz mbH | Blockdatenkompressionssystem, bestehend aus einer Kompressionseinrichtung und einer Dekompressionseinrichtung, und Verfahren zur schnellen Blockdatenkompression mit Multi-Byte-Suche |
US7373005B2 (en) | 2003-04-10 | 2008-05-13 | Micron Technology, Inc. | Compression system for integrated sensor devices |
WO2005022919A1 (en) | 2003-08-26 | 2005-03-10 | Thomson Licensing S.A. | Method and apparatus for decoding hybrid intra-inter coded blocks |
US7317839B2 (en) | 2003-09-07 | 2008-01-08 | Microsoft Corporation | Chroma motion vector derivation for interlaced forward-predicted fields |
US7724827B2 (en) | 2003-09-07 | 2010-05-25 | Microsoft Corporation | Multi-layer run level encoding and decoding |
US8472792B2 (en) | 2003-12-08 | 2013-06-25 | Divx, Llc | Multimedia distribution system |
US7519274B2 (en) | 2003-12-08 | 2009-04-14 | Divx, Inc. | File format for multiple track digital data |
KR101044934B1 (ko) | 2003-12-18 | 2011-06-28 | 삼성전자주식회사 | 움직임 벡터 추정방법 및 부호화 모드 결정방법 |
EP1665133A4 (en) | 2004-01-20 | 2009-05-13 | Panasonic Corp | IMAGE ENCODING METHOD, IMAGE DECODING METHOD, IMAGE ENCODING APPARATUS, IMAGE DECODING APPARATUS, AND CORRESPONDING PROGRAM |
US8116374B2 (en) | 2004-05-07 | 2012-02-14 | Broadcom Corporation | Method and system for generating a transform size syntax element for video decoding |
JP4418762B2 (ja) | 2004-05-07 | 2010-02-24 | キヤノン株式会社 | 画像符号化装置及び画像復号装置及びそれらの制御方法、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体 |
JP4699460B2 (ja) | 2004-07-20 | 2011-06-08 | クゥアルコム・インコーポレイテッド | 時間的なビデオ圧縮における運動ベクトル予測のための方法および装置 |
US7720154B2 (en) | 2004-11-12 | 2010-05-18 | Industrial Technology Research Institute | System and method for fast variable-size motion estimation |
JP2006140758A (ja) | 2004-11-12 | 2006-06-01 | Toshiba Corp | 動画像符号化方法、動画像符号化装置および動画像符号化プログラム |
US20060282855A1 (en) | 2005-05-05 | 2006-12-14 | Digital Display Innovations, Llc | Multiple remote display system |
KR100716999B1 (ko) | 2005-06-03 | 2007-05-10 | 삼성전자주식회사 | 영상의 대칭성을 이용한 인트라 예측 방법, 이를 이용한영상의 복호화, 부호화 방법 및 장치 |
KR101211665B1 (ko) | 2005-08-12 | 2012-12-12 | 삼성전자주식회사 | 영상의 인트라 예측 부호화, 복호화 방법 및 장치 |
JP2007053561A (ja) | 2005-08-17 | 2007-03-01 | Matsushita Electric Ind Co Ltd | 画像符号化装置および画像符号化方法 |
WO2007021227A1 (en) | 2005-08-19 | 2007-02-22 | Telefonaktiebolaget Lm Ericsson (Publ) | Texture compression based on two hues with modified brightness |
US7986844B2 (en) | 2005-11-22 | 2011-07-26 | Intel Corporation | Optimized video compression using hashing function |
US7956930B2 (en) | 2006-01-06 | 2011-06-07 | Microsoft Corporation | Resampling and picture resizing operations for multi-resolution video coding and decoding |
US8792555B2 (en) | 2006-01-31 | 2014-07-29 | Qualcomm Incorporated | Methods and systems for resizing multimedia content |
CN101026761B (zh) | 2006-02-17 | 2010-05-12 | 中国科学院自动化研究所 | 一种具有最小误差的快速变尺寸块匹配的运动估计方法 |
US7668382B2 (en) | 2006-02-24 | 2010-02-23 | Microsoft Corporation | Block-based fast image compression |
US7616816B2 (en) | 2006-03-20 | 2009-11-10 | Sarnoff Corporation | System and method for mission-driven visual information retrieval and organization |
EP2011342B1 (en) | 2006-04-14 | 2017-06-28 | Nxp B.V. | Motion estimation at image borders |
US7965861B2 (en) | 2006-04-26 | 2011-06-21 | The Board Of Regents Of The University Of Texas System | Methods and systems for digital image security |
WO2008004940A1 (en) | 2006-07-07 | 2008-01-10 | Telefonaktiebolaget Lm Ericsson (Publ) | Video data management |
US8472527B2 (en) | 2006-09-13 | 2013-06-25 | Texas Instruments Incorporated | Hierarchical motion estimation using original frame for sub-sampled reference |
FR2906433B1 (fr) | 2006-09-22 | 2009-02-27 | Canon Kk | Procedes et dispositifs de codage et de decodage d'images, programme d'ordinateur les mettant en oeuvre et support d'informaton permettant de les mettre en oeuvre |
CN102833544A (zh) | 2006-09-22 | 2012-12-19 | 汤姆森许可贸易公司 | 多通道视频编码和解码的方法及装置 |
US20080084924A1 (en) | 2006-10-05 | 2008-04-10 | Donald Martin Monro | Matching pursuits basis selection design |
US8170101B2 (en) | 2006-10-27 | 2012-05-01 | Sharp Laboratories Of America, Inc. | Methods and systems for low-complexity data compression |
US8218641B2 (en) | 2006-10-31 | 2012-07-10 | Sony Computer Entertainment Inc. | Picture encoding using same-picture reference for pixel reconstruction |
US7907783B2 (en) | 2007-01-24 | 2011-03-15 | Samsung Electronics Co., Ltd. | Apparatus and method of matching symbols in a text image coding and decoding system |
CN100527842C (zh) | 2007-01-26 | 2009-08-12 | 清华大学 | 基于背景的运动估计编码方法 |
US8031937B2 (en) | 2007-04-04 | 2011-10-04 | Telefonaktiebolaget Lm Ericsson (Publ) | Frame buffer compression and decompression method for graphics rendering |
CN101420606A (zh) | 2007-10-23 | 2009-04-29 | 青岛海信电器股份有限公司 | 图像处理方法和装置 |
KR101365444B1 (ko) | 2007-11-19 | 2014-02-21 | 삼성전자주식회사 | 영상의 해상도의 조정을 통하여 동영상을 효율적으로부호화/복호화하는 방법 및 장치 |
JP2009147807A (ja) | 2007-12-17 | 2009-07-02 | Fujifilm Corp | 画像処理装置 |
CN101232619B (zh) | 2008-01-25 | 2011-05-11 | 浙江大学 | 嵌入帧内编码块的视频编码方法 |
TWI375472B (en) | 2008-02-04 | 2012-10-21 | Ind Tech Res Inst | Intra prediction method for luma block of video |
JP2009260473A (ja) | 2008-04-14 | 2009-11-05 | Canon Inc | 色処理方法及び装置、プログラム、記録媒体 |
JP2010035137A (ja) | 2008-07-01 | 2010-02-12 | Sony Corp | 画像処理装置および方法、並びにプログラム |
US9445121B2 (en) | 2008-08-04 | 2016-09-13 | Dolby Laboratories Licensing Corporation | Overlapped block disparity estimation and compensation architecture |
US8213503B2 (en) | 2008-09-05 | 2012-07-03 | Microsoft Corporation | Skip modes for inter-layer residual video coding and decoding |
US8385404B2 (en) | 2008-09-11 | 2013-02-26 | Google Inc. | System and method for video encoding using constructed reference frame |
US8254704B2 (en) | 2008-10-30 | 2012-08-28 | Microsoft Corporation | Remote computing platforms providing high-fidelity display and interactivity for clients |
US8180165B2 (en) | 2008-12-19 | 2012-05-15 | Microsoft Corp. | Accelerated screen codec |
TW201028018A (en) | 2009-01-07 | 2010-07-16 | Ind Tech Res Inst | Encoder, decoder, encoding method and decoding method |
CA2750735C (en) | 2009-02-02 | 2018-09-18 | Calgary Scientific Inc. | Image data transmission |
RU2420021C2 (ru) | 2009-03-24 | 2011-05-27 | Корпорация "САМСУНГ ЭЛЕКТРОНИКС Ко., Лтд." | Способ сжатия изображений и видеопоследовательностей |
WO2010149554A1 (en) | 2009-06-22 | 2010-12-29 | Thomson Licensing | Process for matching pursuit based coding of video data for a sequence of images |
CN101626512A (zh) | 2009-08-11 | 2010-01-13 | 北京交通大学 | 一种基于相关性优化准则的多描述视频编码方法及装置 |
JP5321426B2 (ja) | 2009-11-26 | 2013-10-23 | 株式会社Jvcケンウッド | 画像符号化装置、画像復号化装置、画像符号化方法、及び画像復号化方法 |
KR101623124B1 (ko) | 2009-12-03 | 2016-05-24 | 에스케이 텔레콤주식회사 | 비디오 인코딩 장치 및 그 인코딩 방법, 비디오 디코딩 장치 및 그 디코딩 방법, 및 거기에 이용되는 방향적 인트라 예측방법 |
US20110194613A1 (en) | 2010-02-11 | 2011-08-11 | Qualcomm Incorporated | Video coding with large macroblocks |
ES2713173T3 (es) | 2010-03-31 | 2019-05-20 | Orange | Procedimientos y dispositivos de codificación y de decodificación de una secuencia de imágenes que implementan una predicción por compensación de movimiento anticipado, y programa de ordenador correspondiente |
US8644375B2 (en) | 2010-04-09 | 2014-02-04 | Sharp Laboratories Of America, Inc. | Methods and systems for intra prediction |
US8619857B2 (en) | 2010-04-09 | 2013-12-31 | Sharp Laboratories Of America, Inc. | Methods and systems for intra prediction |
KR101997462B1 (ko) | 2010-04-09 | 2019-07-08 | 엘지전자 주식회사 | 비디오 데이터 처리 방법 및 장치 |
KR20110123651A (ko) | 2010-05-07 | 2011-11-15 | 한국전자통신연구원 | 생략 부호화를 이용한 영상 부호화 및 복호화 장치 및 그 방법 |
KR101484281B1 (ko) | 2010-07-09 | 2015-01-21 | 삼성전자주식회사 | 블록 병합을 이용한 비디오 부호화 방법 및 그 장치, 블록 병합을 이용한 비디오 복호화 방법 및 그 장치 |
PL3232666T3 (pl) | 2010-07-14 | 2019-08-30 | Ntt Docomo, Inc. | Predykcja wewnątrzramkowa o niskiej złożoności dla kodowania wideo |
CN106851320B (zh) | 2010-11-04 | 2020-06-02 | Ge视频压缩有限责任公司 | 数字存储介质、解码比特流的方法 |
KR101756442B1 (ko) | 2010-11-29 | 2017-07-11 | 에스케이텔레콤 주식회사 | 인트라예측모드의 중복성을 최소화하기 위한 영상 부호화/복호화 방법 및 장치 |
US9167252B2 (en) | 2010-12-01 | 2015-10-20 | Texas Instruments Incorporated | Quantization matrix compression in video coding |
US20120163457A1 (en) | 2010-12-28 | 2012-06-28 | Viktor Wahadaniah | Moving picture decoding method, moving picture coding method, moving picture decoding apparatus, moving picture coding apparatus, and moving picture coding and decoding apparatus |
US8767835B2 (en) | 2010-12-28 | 2014-07-01 | Mitsubishi Electric Research Laboratories, Inc. | Method for coding videos using dictionaries |
US8913662B2 (en) | 2011-01-06 | 2014-12-16 | Qualcomm Incorporated | Indicating intra-prediction mode selection for video coding using CABAC |
KR20120080122A (ko) | 2011-01-06 | 2012-07-16 | 삼성전자주식회사 | 경쟁 기반의 다시점 비디오 부호화/복호화 장치 및 방법 |
JP5809292B2 (ja) | 2011-01-14 | 2015-11-10 | ジーイー ビデオ コンプレッション エルエルシー | エントロピー符号化および復号化スキーム |
US9532066B2 (en) | 2011-01-21 | 2016-12-27 | Qualcomm Incorporated | Motion vector prediction |
US9319716B2 (en) | 2011-01-27 | 2016-04-19 | Qualcomm Incorporated | Performing motion vector prediction for video coding |
US9288501B2 (en) | 2011-03-08 | 2016-03-15 | Qualcomm Incorporated | Motion vector predictors (MVPs) for bi-predictive inter mode in video coding |
ES2715704T3 (es) | 2011-03-09 | 2019-06-05 | Nec Corp | Dispositivo de decodificación de vídeo, método de decodificación de vídeo y programa de decodificación de vídeo |
EP3139611A1 (en) | 2011-03-14 | 2017-03-08 | HFI Innovation Inc. | Method and apparatus for deriving temporal motion vector prediction |
US8693547B2 (en) | 2011-04-06 | 2014-04-08 | Google Inc. | Apparatus and method for coding using motion vector segmentation |
US20120281760A1 (en) | 2011-05-04 | 2012-11-08 | Hyung Joon Kim | Iterative Grid-Pattern Motion Search |
CN102137263B (zh) | 2011-05-09 | 2013-07-03 | 松日数码发展(深圳)有限公司 | 基于cnm关键帧分类的分布式视频编码及解码方法 |
US20120294353A1 (en) | 2011-05-16 | 2012-11-22 | Mediatek Inc. | Apparatus and Method of Sample Adaptive Offset for Luma and Chroma Components |
CN102238391B (zh) | 2011-05-25 | 2016-12-07 | 深圳市云宙多媒体技术有限公司 | 一种预测编码方法、装置 |
US9565428B2 (en) | 2011-06-20 | 2017-02-07 | Mediatek Singapore Pte. Ltd. | Method and apparatus of chroma intra prediction with reduced line memory |
EP3223523A1 (en) | 2011-06-24 | 2017-09-27 | HFI Innovation Inc. | Method and apparatus for removing redundancy in motion vector predictors |
BR112013030347B1 (pt) | 2011-06-27 | 2022-06-28 | Sun Patent Trust | Método de decodificação de imagem, método de codificação de imagem, aparelho de decodificação de imagem, aparelho de codificação de imagem e aparelho de codificação e de decodificação de imagem |
JP6265414B2 (ja) | 2011-06-28 | 2018-01-24 | 日本電気株式会社 | 映像符号化装置及び映像復号装置 |
WO2013003823A1 (en) | 2011-06-30 | 2013-01-03 | Huawei Technologies, Co., Ltd. | Lossless coding and associated signaling methods for compound video |
US9060173B2 (en) | 2011-06-30 | 2015-06-16 | Sharp Kabushiki Kaisha | Context initialization based on decoder picture buffer |
EP2705668A1 (en) | 2011-07-12 | 2014-03-12 | Huawei Technologies Co., Ltd | Pixel-based intra prediction for coding in hevc |
CN103748877B (zh) | 2011-08-17 | 2017-05-10 | 联发科技(新加坡)私人有限公司 | 帧内预测方法和装置 |
MX365013B (es) | 2011-08-29 | 2019-05-20 | Ibex Pt Holdings Co Ltd | Metodo para generar un bloque de prediccion en modo de prediccion de vector de movimiento avanzada (amvp). |
US8804816B2 (en) * | 2011-08-30 | 2014-08-12 | Microsoft Corporation | Video encoding enhancements |
US9578336B2 (en) | 2011-08-31 | 2017-02-21 | Texas Instruments Incorporated | Hybrid video and graphics system with automatic content detection process, and other circuits, processes, and systems |
US9484952B2 (en) | 2011-11-03 | 2016-11-01 | Qualcomm Incorporated | Context state and probability initialization for context adaptive entropy coding |
US10390046B2 (en) | 2011-11-07 | 2019-08-20 | Qualcomm Incorporated | Coding significant coefficient information in transform skip mode |
BR112014012351A2 (pt) | 2011-11-08 | 2017-05-30 | Motorola Mobility Llc | dispositivos e métodos para codificação e/ou de sinalização de deslocamento adaptado de amostra |
WO2013070974A2 (en) | 2011-11-08 | 2013-05-16 | General Instrument Corporation | Method of determining binary codewords for transform coefficients |
CN103931197B (zh) | 2011-11-08 | 2018-01-23 | 谷歌技术控股有限责任公司 | 确定用于变换系数的二进制码字的方法 |
US20130121417A1 (en) | 2011-11-16 | 2013-05-16 | Qualcomm Incorporated | Constrained reference picture sets in wave front parallel processing of video data |
US9883203B2 (en) | 2011-11-18 | 2018-01-30 | Qualcomm Incorporated | Adaptive overlapped block motion compensation |
WO2013072484A1 (en) | 2011-11-18 | 2013-05-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Multi-view coding with efficient residual handling |
US9350996B2 (en) | 2011-12-20 | 2016-05-24 | Google Technology Holdings LLC | Method and apparatus for last coefficient indexing for high efficiency video coding |
US20130163664A1 (en) | 2011-12-22 | 2013-06-27 | Qualcomm Incorporated | Unified partition mode table for intra-mode coding |
US9762904B2 (en) | 2011-12-22 | 2017-09-12 | Qualcomm Incorporated | Performing motion vector prediction for video coding |
US9900615B2 (en) | 2011-12-28 | 2018-02-20 | Microsoft Technology Licensing, Llc | Representative motion information for temporal motion prediction in video encoding and decoding |
WO2013102293A1 (en) | 2012-01-04 | 2013-07-11 | Mediatek Singapore Pte. Ltd. | Improvements of luma-based chroma intra prediction |
US9451252B2 (en) | 2012-01-14 | 2016-09-20 | Qualcomm Incorporated | Coding parameter sets and NAL unit headers for video coding |
US9332259B2 (en) | 2012-01-18 | 2016-05-03 | Qualcomm Incorporated | Indication of use of wavefront parallel processing in video coding |
JP2013150173A (ja) | 2012-01-19 | 2013-08-01 | Sony Corp | 画像処理装置および方法 |
US20130188718A1 (en) | 2012-01-20 | 2013-07-25 | Qualcomm Incorporated | Motion prediction in svc without including a temporally neighboring block motion vector in a candidate list |
SG10201606621XA (en) | 2012-01-20 | 2016-09-29 | Ge Video Compression Llc | Coding Concept Allowing Parallel Processing, Transport Demultiplexer and Video Bitstream |
JP2013150215A (ja) | 2012-01-20 | 2013-08-01 | Fujitsu Ltd | 動画像復号装置、動画像符号化装置、動画像復号方法、動画像符号化方法、動画像復号プログラム及び動画像符号化プログラム |
US9210438B2 (en) | 2012-01-20 | 2015-12-08 | Sony Corporation | Logical intra mode naming in HEVC video coding |
US10244246B2 (en) | 2012-02-02 | 2019-03-26 | Texas Instruments Incorporated | Sub-pictures for pixel rate balancing on multi-core platforms |
WO2013128010A2 (en) | 2012-03-02 | 2013-09-06 | Canon Kabushiki Kaisha | Method and devices for encoding a sequence of images into a scalable video bit-stream, and decoding a corresponding scalable video bit-stream |
US8737824B1 (en) | 2012-03-09 | 2014-05-27 | Google Inc. | Adaptively encoding a media stream with compound prediction |
US9503720B2 (en) | 2012-03-16 | 2016-11-22 | Qualcomm Incorporated | Motion vector coding and bi-prediction in HEVC and its extensions |
CA2868448A1 (en) | 2012-03-26 | 2013-10-03 | Euclid Discoveries, Llc | Context based video encoding and decoding |
US20130258052A1 (en) | 2012-03-28 | 2013-10-03 | Qualcomm Incorporated | Inter-view residual prediction in 3d video coding |
US10129540B2 (en) | 2012-04-10 | 2018-11-13 | Texas Instruments Incorporated | Reduced complexity coefficient transmission for adaptive loop filtering (ALF) in video coding |
US9838684B2 (en) | 2012-04-11 | 2017-12-05 | Qualcomm Incorporated | Wavefront parallel processing for video coding |
US20130272409A1 (en) | 2012-04-12 | 2013-10-17 | Qualcomm Incorporated | Bandwidth reduction in video coding through applying the same reference index |
SG11201405038RA (en) | 2012-04-24 | 2014-09-26 | Mediatek Inc | Method and apparatus of motion vector derivation for 3d video coding |
GB2501535A (en) | 2012-04-26 | 2013-10-30 | Sony Corp | Chrominance Processing in High Efficiency Video Codecs |
US9521410B2 (en) | 2012-04-26 | 2016-12-13 | Qualcomm Incorporated | Quantization parameter (QP) coding in video coding |
US20130294524A1 (en) | 2012-05-04 | 2013-11-07 | Qualcomm Incorporated | Transform skipping and lossless coding unification |
US20150326859A1 (en) | 2012-06-28 | 2015-11-12 | Nec Corporation | Video quantization-parameter encoding method, video quantization-parameter decoding method, device, and program |
CN102752595B (zh) | 2012-06-29 | 2014-07-09 | 香港应用科技研究院有限公司 | 用于深度图编码和解码的混合型跳过模式 |
US9621905B2 (en) | 2012-06-29 | 2017-04-11 | Qualcomm Incorporated | Tiles and wavefront parallel processing |
US9591302B2 (en) | 2012-07-02 | 2017-03-07 | Microsoft Technology Licensing, Llc | Use of chroma quantization parameter offsets in deblocking |
US9414054B2 (en) | 2012-07-02 | 2016-08-09 | Microsoft Technology Licensing, Llc | Control and use of chroma quantization parameter values |
US9602827B2 (en) | 2012-07-02 | 2017-03-21 | Qualcomm Incorporated | Video parameter set including an offset syntax element |
US9264713B2 (en) | 2012-07-11 | 2016-02-16 | Qualcomm Incorporated | Rotation of prediction residual blocks in video coding with transform skipping |
US8754792B2 (en) | 2012-07-14 | 2014-06-17 | Sigma Designs, Inc. | System and method for fixed rate entropy coded scalar quantization |
US9467692B2 (en) | 2012-08-31 | 2016-10-11 | Qualcomm Incorporated | Intra prediction improvements for scalable video coding |
US20140071235A1 (en) | 2012-09-13 | 2014-03-13 | Qualcomm Incorporated | Inter-view motion prediction for 3d video |
KR102160372B1 (ko) | 2012-09-26 | 2020-09-28 | 벨로스 미디어 인터내셔널 리미티드 | 화상 복호 방법, 화상 부호화 방법, 화상 복호 장치, 화상 부호화 장치 및 화상 부호화 복호 장치 |
US9998755B2 (en) | 2012-10-03 | 2018-06-12 | Mediatek Inc. | Method and apparatus for motion information inheritance in three-dimensional video coding |
US9615090B2 (en) | 2012-12-28 | 2017-04-04 | Qualcomm Incorporated | Parsing syntax elements in three-dimensional video coding |
US9826244B2 (en) | 2013-01-08 | 2017-11-21 | Qualcomm Incorporated | Device and method for scalable coding of video information based on high efficiency video coding |
US9762882B2 (en) | 2013-01-11 | 2017-09-12 | Hfi Innovation Inc. | Method and apparatus for efficient coding of depth lookup table |
US9800857B2 (en) | 2013-03-08 | 2017-10-24 | Qualcomm Incorporated | Inter-view residual prediction in multi-view or 3-dimensional video coding |
US9516306B2 (en) | 2013-03-27 | 2016-12-06 | Qualcomm Incorporated | Depth coding modes signaling of depth data for 3D-HEVC |
US11259020B2 (en) * | 2013-04-05 | 2022-02-22 | Qualcomm Incorporated | Determining palettes in palette-based video coding |
US10904551B2 (en) | 2013-04-05 | 2021-01-26 | Texas Instruments Incorporated | Video coding using intra block copy |
CN103237226B (zh) | 2013-04-07 | 2016-08-03 | 宁波大学 | 一种立体视频宏块丢失错误隐藏方法 |
WO2014166104A1 (en) | 2013-04-12 | 2014-10-16 | Mediatek Singapore Pte. Ltd. | Removal of parsing dependency for illumination compensation |
US9609336B2 (en) | 2013-04-16 | 2017-03-28 | Fastvdo Llc | Adaptive coding, transmission and efficient display of multimedia (acted) |
CN103281538B (zh) | 2013-06-06 | 2016-01-13 | 上海交通大学 | 基于滚动哈希和块级别帧内预测的帧内编码方法 |
US9787989B2 (en) | 2013-06-11 | 2017-10-10 | Blackberry Limited | Intra-coding mode-dependent quantization tuning |
CN111800641B (zh) | 2013-06-13 | 2023-08-25 | 上海天荷电子信息有限公司 | 同模式采用不同种类重构像素的图像编码解码方法和装置 |
KR20160021222A (ko) | 2013-06-18 | 2016-02-24 | 브이아이디 스케일, 인크. | Hevc 확장을 위한 계층간 파라미터 집합 |
US10015515B2 (en) | 2013-06-21 | 2018-07-03 | Qualcomm Incorporated | Intra prediction from a predictive block |
US9128680B2 (en) * | 2013-06-27 | 2015-09-08 | Cal-Comp Electronics & Communications Company Limited | Casing structure and electronic device using the same |
GB2516422A (en) | 2013-07-09 | 2015-01-28 | Sony Corp | Data encoding and decoding |
US20150016533A1 (en) | 2013-07-12 | 2015-01-15 | Qualcomm Incorporated | Intra motion compensation extensions |
US9558567B2 (en) | 2013-07-12 | 2017-01-31 | Qualcomm Incorporated | Palette prediction in palette-based video coding |
US9756347B2 (en) * | 2013-07-23 | 2017-09-05 | Futurewei Technologies, Inc. | Screen content coding systems and methods |
CN112383780B (zh) | 2013-08-16 | 2023-05-02 | 上海天荷电子信息有限公司 | 点匹配参考集和索引来回扫描串匹配的编解码方法和装置 |
CN103428498A (zh) | 2013-08-21 | 2013-12-04 | 江苏新瑞峰信息科技有限公司 | 一种无损图像压缩系统 |
US10313682B2 (en) | 2013-08-26 | 2019-06-04 | Qualcomm Incorporated | Determining regions when performing intra block copying |
WO2015032350A1 (zh) | 2013-09-07 | 2015-03-12 | 同济大学 | 一种使用块匹配的图像压缩方法和装置 |
US20150071357A1 (en) | 2013-09-12 | 2015-03-12 | Qualcomm Incorporated | Partial intra block copying for video coding |
AU2013228045A1 (en) | 2013-09-13 | 2015-04-02 | Canon Kabushiki Kaisha | Method, apparatus and system for encoding and decoding video data |
WO2015054811A1 (en) | 2013-10-14 | 2015-04-23 | Microsoft Corporation | Features of intra block copy prediction mode for video and image coding and decoding |
WO2015054813A1 (en) | 2013-10-14 | 2015-04-23 | Microsoft Technology Licensing, Llc | Encoder-side options for intra block copy prediction mode for video and image coding |
JP6336058B2 (ja) | 2013-10-14 | 2018-06-06 | マイクロソフト テクノロジー ライセンシング,エルエルシー | ビデオ及び画像符号化及び復号のためのベースカラーインデックスマップモードの機能 |
US20150110181A1 (en) | 2013-10-18 | 2015-04-23 | Samsung Electronics Co., Ltd. | Methods for palette prediction and intra block copy padding |
US10291827B2 (en) | 2013-11-22 | 2019-05-14 | Futurewei Technologies, Inc. | Advanced screen content coding solution |
KR101897378B1 (ko) | 2013-12-10 | 2018-09-10 | 캐논 가부시끼가이샤 | 팔레트 코딩 모드에서 팔레트를 인코딩 또는 디코딩하기 위한 방법 및 장치 |
US10419774B2 (en) | 2013-12-10 | 2019-09-17 | Canon Kabushiki Kaisha | Palette mode in HEVC |
BR112016012417B1 (pt) | 2013-12-18 | 2023-04-11 | Hfi Innovation Inc | Método e aparelho para inicialização e gerenciamento de paleta |
WO2015091879A2 (en) | 2013-12-19 | 2015-06-25 | Canon Kabushiki Kaisha | Improved encoding process using a palette mode |
GB2521606A (en) | 2013-12-20 | 2015-07-01 | Canon Kk | Method and apparatus for transition encoding in video coding and decoding |
KR20160102067A (ko) | 2013-12-30 | 2016-08-26 | 퀄컴 인코포레이티드 | 3d 비디오 코딩에서의 델타 dc 잔차 코딩의 단순화 |
US10362333B2 (en) * | 2014-01-02 | 2019-07-23 | Qualcomm Incorporated | Color index coding for palette-based video coding |
KR101951083B1 (ko) | 2014-01-02 | 2019-05-10 | 브이아이디 스케일, 인크. | 스크린 컨텐츠 코딩을 위한 2차원 팔레트 코딩 |
US10390034B2 (en) | 2014-01-03 | 2019-08-20 | Microsoft Technology Licensing, Llc | Innovations in block vector prediction and estimation of reconstructed sample values within an overlap area |
BR112016015080A2 (pt) | 2014-01-03 | 2017-08-08 | Microsoft Technology Licensing Llc | Predição de vetor de bloco em codificação / decodificação de vídeo e imagem |
US9883197B2 (en) | 2014-01-09 | 2018-01-30 | Qualcomm Incorporated | Intra prediction of chroma blocks using the same vector |
US11284103B2 (en) | 2014-01-17 | 2022-03-22 | Microsoft Technology Licensing, Llc | Intra block copy prediction with asymmetric partitions and encoder-side search patterns, search ranges and approaches to partitioning |
GB2522844A (en) | 2014-01-29 | 2015-08-12 | Sony Corp | Data encoding and decoding |
US9699468B2 (en) | 2014-02-10 | 2017-07-04 | Microsoft Technology Licensing, Llc | Adaptive screen and video coding scheme |
US20150237356A1 (en) | 2014-02-18 | 2015-08-20 | Microsoft Corporation | Host encoder for hardware-accelerated video encoding |
US10542274B2 (en) | 2014-02-21 | 2020-01-21 | Microsoft Technology Licensing, Llc | Dictionary encoding and decoding of screen content |
CN105393537B (zh) | 2014-03-04 | 2019-08-27 | 微软技术许可有限责任公司 | 用于基于散列的块匹配的散列表构建和可用性检查 |
MX361228B (es) | 2014-03-04 | 2018-11-29 | Microsoft Technology Licensing Llc | Inversión de bloque y modo de omisión en predicción de intracopia de bloque. |
US20150262404A1 (en) | 2014-03-13 | 2015-09-17 | Huawei Technologies Co., Ltd. | Screen Content And Mixed Content Coding |
CN106464869B (zh) | 2014-03-14 | 2019-07-19 | 寰发股份有限公司 | 调色板表初始化和管理的方法 |
JP6328262B2 (ja) | 2014-03-14 | 2018-05-23 | 寰發股▲ふん▼有限公司HFI Innovation Inc. | パレットスタッフィングによるカラーインデックスコーディング方法 |
US10237575B2 (en) | 2014-03-14 | 2019-03-19 | Vid Scale, Inc. | Palette coding for screen content coding |
CN106105227B (zh) | 2014-03-16 | 2019-12-24 | Vid拓展公司 | 用于无损视频译码的信令的方法和设备 |
JP2017513358A (ja) | 2014-03-17 | 2017-05-25 | ノキア テクノロジーズ オサケユイチア | ビデオのエンコーディングおよびデコーディングのための方法およびテクノロジー機器 |
US20150264348A1 (en) | 2014-03-17 | 2015-09-17 | Qualcomm Incorporated | Dictionary coding of video content |
US10477232B2 (en) | 2014-03-21 | 2019-11-12 | Qualcomm Incorporated | Search region determination for intra block copy in video coding |
US9654806B2 (en) | 2014-03-26 | 2017-05-16 | Qualcomm Incorporated | Determining palette size, palette entries and filtering of palette coded blocks in video coding |
CN103957412B (zh) | 2014-05-06 | 2017-04-12 | 北京大学 | 一种针对屏幕视频帧间残差的基础色索引映射算法 |
CN106471805A (zh) | 2014-05-09 | 2017-03-01 | 诺基亚技术有限公司 | 用于使用调色板编码进行视频编码和解码的方法和技术设备 |
US10750198B2 (en) | 2014-05-22 | 2020-08-18 | Qualcomm Incorporated | Maximum palette parameters in palette-based video coding |
US10038915B2 (en) | 2014-05-22 | 2018-07-31 | Qualcomm Incorporated | Escape sample coding in palette-based video coding |
US10264285B2 (en) | 2014-05-22 | 2019-04-16 | Qualcomm Incorporated | Coding runs in palette-based video coding |
US10382749B2 (en) | 2014-05-23 | 2019-08-13 | Qualcomm Incorporated | Coding run values based on palette index in palette-based video coding |
US11323733B2 (en) | 2014-05-23 | 2022-05-03 | Qualcomm Incorporated | Predictor palette initialization in palette-based video coding |
US10291940B2 (en) | 2014-05-23 | 2019-05-14 | Qualcomm Incorporated | Coding runs with escape in palette-based video coding |
AU2014202921B2 (en) | 2014-05-29 | 2017-02-02 | Canon Kabushiki Kaisha | Method, apparatus and system for de-blocking a block of video samples |
WO2015184605A1 (en) | 2014-06-04 | 2015-12-10 | Mediatek Singapore Pte. Ltd. | Depth coding compatible with arbitrary bit-depth |
US9924175B2 (en) | 2014-06-11 | 2018-03-20 | Qualcomm Incorporated | Determining application of deblocking filtering to palette coded blocks in video coding |
US10136141B2 (en) | 2014-06-11 | 2018-11-20 | Qualcomm Incorporated | Determining quantization parameter (QP) values and delta QP values for palette coded blocks in video coding |
EP3158734A1 (en) | 2014-06-19 | 2017-04-26 | Microsoft Technology Licensing, LLC | Unified intra block copy and inter prediction modes |
JP2017522839A (ja) | 2014-06-20 | 2017-08-10 | シャープ株式会社 | 整合パレット符号化 |
US20150381994A1 (en) | 2014-06-27 | 2015-12-31 | Futurewei Technologies, Inc. | Advanced screen content coding with improved palette table and index map coding methods |
US10412387B2 (en) | 2014-08-22 | 2019-09-10 | Qualcomm Incorporated | Unified intra-block copy and inter-prediction |
AU2014216056A1 (en) | 2014-08-25 | 2016-03-10 | Canon Kabushiki Kaisha | Method, apparatus and system for predicting a block of video samples |
EP3917146A1 (en) | 2014-09-30 | 2021-12-01 | Microsoft Technology Licensing, LLC | Rules for intra-picture prediction modes when wavefront parallel processing is enabled |
US20160112713A1 (en) | 2014-10-20 | 2016-04-21 | Google Inc. | Mapping spherical image to 2d representations |
US9591325B2 (en) | 2015-01-27 | 2017-03-07 | Microsoft Technology Licensing, Llc | Special case handling for merged chroma blocks in intra block copy prediction mode |
WO2016172314A1 (en) | 2015-04-21 | 2016-10-27 | Vid Scale, Inc. | Artistic intent based video coding |
US10659783B2 (en) | 2015-06-09 | 2020-05-19 | Microsoft Technology Licensing, Llc | Robust encoding/decoding of escape-coded pixels in palette mode |
US10062181B1 (en) | 2015-07-30 | 2018-08-28 | Teradici Corporation | Method and apparatus for rasterizing and encoding vector graphics |
-
2013
- 2013-10-14 JP JP2016522740A patent/JP6336058B2/ja active Active
- 2013-10-14 US US15/025,134 patent/US10506254B2/en active Active
- 2013-10-14 WO PCT/CN2013/085166 patent/WO2015054812A1/en active Application Filing
- 2013-10-14 RU RU2016114272A patent/RU2666635C2/ru active
- 2013-10-14 CN CN201380080237.9A patent/CN105659606B/zh active Active
- 2013-10-14 EP EP13895646.1A patent/EP3058740B1/en active Active
- 2013-10-14 EP EP20177289.4A patent/EP3720132A1/en active Pending
- 2013-10-14 CA CA2925183A patent/CA2925183C/en active Active
- 2013-10-14 KR KR1020217020291A patent/KR102318785B1/ko active IP Right Grant
- 2013-10-14 KR KR1020167010998A patent/KR102275639B1/ko active IP Right Grant
- 2013-10-14 MX MX2016004707A patent/MX368934B/es active IP Right Grant
- 2013-10-14 BR BR112016008044A patent/BR112016008044A8/pt not_active Application Discontinuation
- 2013-10-14 AU AU2013403225A patent/AU2013403225B2/en active Active
-
2019
- 2019-11-13 US US16/683,065 patent/US10652576B2/en active Active
-
2020
- 2020-03-24 US US16/828,799 patent/US11252437B2/en active Active
-
2022
- 2022-01-10 US US17/572,152 patent/US12096024B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8036271B2 (en) * | 2004-02-24 | 2011-10-11 | Lsi Corporation | Method and apparatus for determining a second picture for temporal direct-mode block prediction |
CN101816177A (zh) * | 2007-09-13 | 2010-08-25 | 微软公司 | 文本图像编码 |
WO2012146320A1 (en) * | 2011-04-29 | 2012-11-01 | Telefonaktiebolaget L M Ericsson (Publ) | Encoder, decoder and methods thereof for texture compression |
CN102223541A (zh) * | 2011-07-14 | 2011-10-19 | 北京工业大学 | 一种混合图像的编码方法 |
Also Published As
Publication number | Publication date |
---|---|
US20200084472A1 (en) | 2020-03-12 |
EP3058740B1 (en) | 2020-06-03 |
EP3058740A4 (en) | 2017-05-17 |
US10506254B2 (en) | 2019-12-10 |
KR20160070771A (ko) | 2016-06-20 |
US20220132163A1 (en) | 2022-04-28 |
MX2016004707A (es) | 2016-07-18 |
KR102318785B1 (ko) | 2021-10-27 |
US10652576B2 (en) | 2020-05-12 |
JP2016541144A (ja) | 2016-12-28 |
US11252437B2 (en) | 2022-02-15 |
US20160277760A1 (en) | 2016-09-22 |
US12096024B2 (en) | 2024-09-17 |
CA2925183C (en) | 2020-03-10 |
CA2925183A1 (en) | 2015-04-23 |
EP3720132A1 (en) | 2020-10-07 |
RU2666635C2 (ru) | 2018-09-11 |
EP3058740A1 (en) | 2016-08-24 |
RU2016114272A (ru) | 2017-10-18 |
KR20210083403A (ko) | 2021-07-06 |
KR102275639B1 (ko) | 2021-07-08 |
AU2013403225A1 (en) | 2016-04-07 |
JP6336058B2 (ja) | 2018-06-06 |
AU2013403225B2 (en) | 2018-06-14 |
MX368934B (es) | 2019-10-22 |
CN105659606A (zh) | 2016-06-08 |
BR112016008044A8 (pt) | 2020-03-17 |
US20200228834A1 (en) | 2020-07-16 |
WO2015054812A1 (en) | 2015-04-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105659606B (zh) | 用于视频和图像编码和解码的方法、系统和介质 | |
CN105230023B (zh) | 色彩空间、色彩采样率和/或比特深度的自适应切换 | |
CN105874791B (zh) | 在对重叠区域内的经重构样本值的块向量预测和估计方面的创新 | |
CN105765974B (zh) | 用于视频和图像编码和解码的帧内块复制预测模式的特征 | |
CN105264888B (zh) | 用于对色彩空间、色彩采样率和/或比特深度自适应切换的编码策略 | |
CN105960802B (zh) | 切换色彩空间时对编码和解码的调整 | |
CN105684441B (zh) | 视频和图像编码中的基于散列的块匹配 | |
CN105432082B (zh) | 用于兴趣区编码的运动约束图块集合 | |
CN105874795B (zh) | 在波前并行处理被启用时对图片内预测模式的规则 | |
CN105493505B (zh) | 统一的帧内块复制和帧间预测模式 | |
CN105659602B (zh) | 用于视频和图像编码的帧内块复制预测模式的编码器侧选项 | |
CN105900420B (zh) | 选择运动向量精度 | |
CN105393537B (zh) | 用于基于散列的块匹配的散列表构建和可用性检查 | |
CN105359531B (zh) | 用于针对屏幕内容编码的编码器侧判定的方法和系统 | |
CN105432077B (zh) | 在切换色彩空间时调整量化/缩放和逆量化/缩放 | |
CN105027570B (zh) | 用来简化视频拼接的缓冲信息的语法和语义 | |
CN105230021B (zh) | 屏幕内容的词典编码和解码 | |
CN109076241A (zh) | 利用样本值的非相邻参考线进行帧内图片预测 | |
CN107439013A (zh) | 用于高动态范围和宽色域视频译码的动态范围调整 | |
SA515360220B1 (ar) | علامة كتلة مشفرة لتشفير نسق عينة 4:2:2 في تشفير فيديو | |
CN105917650A (zh) | 视频和图像编码/解码中的块向量预测 | |
KR20210063485A (ko) | 인트라 블록 카피 예측에서의 스킵 모드 및 블록 플립핑 | |
CN118828013A (zh) | 视频编码方法、视频编码器、介质以及处理视频比特流的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |