CN101553869A - 用于进行有效压缩的动态量化器结构 - Google Patents
用于进行有效压缩的动态量化器结构 Download PDFInfo
- Publication number
- CN101553869A CN101553869A CNA2007800411399A CN200780041139A CN101553869A CN 101553869 A CN101553869 A CN 101553869A CN A2007800411399 A CNA2007800411399 A CN A2007800411399A CN 200780041139 A CN200780041139 A CN 200780041139A CN 101553869 A CN101553869 A CN 101553869A
- Authority
- CN
- China
- Prior art keywords
- data
- quantizer
- input signal
- configuration
- binary format
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000007906 compression Methods 0.000 title abstract description 15
- 230000006835 compression Effects 0.000 title abstract description 15
- 238000000034 method Methods 0.000 claims abstract description 33
- 238000013139 quantization Methods 0.000 claims description 37
- 238000012545 processing Methods 0.000 claims description 11
- 238000011002 quantification Methods 0.000 claims description 4
- 230000001419 dependent effect Effects 0.000 claims 10
- 238000004590 computer program Methods 0.000 claims 3
- 238000004364 calculation method Methods 0.000 claims 1
- 230000005540 biological transmission Effects 0.000 description 9
- 238000004891 communication Methods 0.000 description 9
- 230000008901 benefit Effects 0.000 description 3
- 238000013144 data compression Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000008672 reprogramming Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000003467 diminishing effect Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
- H04N19/126—Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
介绍一种提供在运行时间期间可配置的动态量化器结构的方法和系统。量化器配置和数据以二进制格式被存储。该动态量化器数据被表示为比特流,并且该比特流接着被用作语音编码器的初始化(或重新初始化/重新配置)期间的另外的输入。配置报头充分规定针对每个量化参数的动态量化器的结构和配置,并且该动态量化器数据和配置被充分且动态地分配到该语音编码器存储器中。这使得能够容易地重新配置与对于不同情形的各种量化器结构相关联的编码解码器。动态量化器结构的使用继而增强了输入信号的压缩效率。该动态量化器结构也可以被应用于允许有损压缩的其他压缩应用。
Description
技术领域
本发明通常涉及数据压缩。更具体地,本发明涉及用于使用在数据压缩应用中的动态且可配置的量化器结构。
背景技术
本申请要求于2006年11月6日申请的美国临时专利申请号60/857,013的优先权,其内容在此通过参考被全面合并。
本节意在提供在权利要求书中叙述的本发明的背景或环境。此处的描述可以包括可能被追溯的概念,但是这些概念在之前不一定已经被想到或追溯。因此,除非在此另有明示,否则本节所述对于本申请的说明书和权利要求书来说不是其现有技术,并且不因包括在本节中而承认是现有技术。
量化(quantization)通常指的是数字信号处理中的处理,其中,一个连续的数值范围被离散符号或整数值的较小集合相近似。量化的一个普通用途是在有损数据压缩中。使用量化的有损压缩系统的例子是联合图像专家组(JPEG)图像压缩。在JPEG编码期间,表示图像的数据用离散余弦变换来处理。图像数据被量化并被进行熵编码。通过使用量化,被变换的图像数据值的精度减少,并且因此表示该图像所需要的比特数可能减少。例如,能够以可接受的质量用每像素少于3比特的JPEG来表示图像,其中,在JPEG压缩之前一般需要每像素24比特来表示一个图像。
有损压缩的另一个普通的例子是用语音信号的数字传输看出。传统上,数字传输的语音信号涉及用模数转换器对模拟语音波形进行抽样、语音压缩(即,编码)、传输、语音解压缩(即,解码)、数模变换,以及在耳机或扩音器中播放。如JPEG压缩的语音压缩可用来减少用于表示语音信号的比特数。
已知为编码解码器的语音压缩系统使用不同算法对原始语音进行编码,同时尝试保持高质量的重建语音。传统上,输入语音信号或其参数表示被压缩并且使用量化器被量化。量化如上所述指的是这样一种处理,即在特定范围内将诸如包括语音信号的不同语音参数之类的输入映射到一个公值。换言之,语音编码涉及使用一组参数来形成语音的替换表示,其中,对对应的(一个或多个)参数矢量和/或标量值执行量化。不同范围中的输入被映射到不同的公值。量化分割在表示输入语音信号的实数集合内定义了多个邻接的、不相重叠的数值范围。使用码本来告诉量化器将哪个公值分配给落入每个分割范围内的输入,其中,码本的每个公值通常被称为码字。
量化器自身可以被认为包括分别用于量化和解量化的编码器和解码器,其中,编码器接收输入信号并输出其相关联码字的索引。可以用各种方法来识别将与该输入信号相关联的正确码字。在接收到一个或多个索引后,解码器就将它们转换成对应的码字,其中,将码字作为表示原始输入信号的量化值输出。
这些语音压缩技术导致降低了用来传输语音信号的带宽数值。然而,如上所述,量化器及其码本传统上按照它们的结构和大小已被固定,例如,使用于移动环境中的当前语音编码器使用在建立处理期间存储在存储器中的固定码本。而且,大多数语音编码器二进制及其量化器被存储在移动设备的ROM存储器中。因此,当前的语音编码器事实上并不灵活,而更新量化器变成了一个困难的任务。
发明内容
本发明的各个实施方式允许以二进制格式存储量化器配置和数据,其中,二进制格式的数据继而在语音编码器的初始化(或重新初始化/重新配置)期间被用作另外的输入。二进制数据中包括的配置报头针对每个量化参数充分规定了动态量化器的结构和配置,并且动态量化器数据及各自的配置以动态方式被完全分配到语音编码器存储器中。
根据本发明的各个实施方式配置的动态量化器结构可以用这样一种方式变得更加灵活,即动态量化器可以对于不同的类型输入数据使用不同的处理方法和/或系统。另外,可以根据遇到的语音数据的类型来使用若干种不同的预测性的和/或无记忆的量化器模式,而这些不同的预测性的和/或无记忆的量化器模式可以和不同类型的预测器一起使用。最后,子量化器数据可以是唯一的,或者在不同的量化器之间被共享,而子量化器自身可以包括具有一级或多级的码本。
用本发明的各个实施方式,在除了实际的二进制格式的数据之外,还可以在存储码本数据的应用中将语音编码器的输出质量最大化,并且量化器的运行时间更新也变得可能。另外,每个参数的量化器及其各自的子量化器都可以独立更新。可以使用不同的预测性和/或非预测性模式,并且码本的更新没有被固定到任何建立配置之中。无需对设备的闪速存储器重新编程,就可以启动对于基于ROM的编码解码器的更新,并且可下载的编码解码器更新也是可能的。
本发明的这些及其他优点和特征,连同其操作的组织和方式,将从结合附图的下列详细说明中变得明显,其中,下述若干附图中类似的元件具有类似的标记。
附图说明
图1示出了用于结合本发明使用的通用多媒体通信系统;
图2是可被用于本发明实施中的移动电话的透视图;
图3是图2的移动电话的电话电路的示意表示;
图4是根据该本发明的一个实施方式的数据结构表示;以及
图5说明了根据本发明各个实施方式的动态量化器的更新处理。
具体实施方式
图1示出了用于与本发明一起使用的通用多媒体通信系统。如图1中所示,数据源100用模拟的、未压缩数字的或者压缩的数字格式或者这些格式的任何组合来提供源信号。编码器110将源信号编码成编码媒体比特流。编码器110可以能够对多个媒体类型如语音、音频和视频进行编码,或者可能需要多个编码器110以对不同媒体类型的源信号进行编码。编码器110也可以获得合成产生的输入,比如图形和文字,或者它可以能够产生合成媒体的编码比特流。在下文中,仅考虑对一个媒体类型的一个编码媒体比特流的处理以简化描述。然而应当注意:实时广播服务通常包括数个流(通常至少一个音频、视频和文字字幕流)。也应当注意:该系统可以包括多个编码器,但是在下文中仅考虑一个编码器110以简化描述而不失一般性
将编码媒体比特流传送到储存器120。储存器120可以包括用以存储编码媒体比特流的任一类型的海量存储器。储存器120中的编码媒体比特流的格式可以是基本自给比特流格式,或者一个或者多个编码媒体比特流可以封装到容器文件中。一些系统“现场”操作、即省略储存器并且将编码媒体比特流从编码器110直接地传送到发送器130。编码媒体比特流然后按照需要传送到也称为服务器的发送器130。传送中所使用的格式可以是基本自给(elementaryself-contained)比特流格式、分组流格式,或者一个或者多个编码媒体比特流可以封装到容器文件中。编码器110、储存器120和发送器130可以驻留于同一物理设备中,或者它们可以包含于分开的设备中。编码器110和发送器130可以用现场实时内容来操作,在该情况下编码媒体比特流通常未被持久地存储而是被缓存于内容编码器110中和/或发送器130中一段短时间以缓解处理延迟、传送延迟和/编码媒体比特速率中的变化。
发送器130使用通信协议栈来发送编码媒体比特流。该栈可以包括但不限于实时传送协议(RTP)、用户数据报协议(UDP)和互联网协议(IP)。当通信协议栈是面向分组时,发送器130将编码媒体比特流封装成分组。例如,当使用RTP时,发送器130根据RTP净荷格式将编码媒体比特流封装成RTP分组。通常,各媒体类型具有专用RTP净荷格式。应当再次注意:系统可以包含多个发送器130,但是以下描述为求简化仅考虑一个发送器130。
发送器130可以或者可以不通过通信网络连接到网关140。网关140可以执行不同类型的功能,比如将根据一个通信协议栈的分组流转译成另一通信协议栈、合并和分流数据流、以及根据下行链路和/或接收器能力来操控数据流,比如根据主导下行链路网络条件来控制转发流的比特速率。网关140的例子包括多点会议控制单元(MCU)、电路交换与分组交换视频电话之间的网关、蜂窝一键通(PoC)服务器、数字视频广播手持(DVB-H)系统中的IP封装器或者将广播传输本地转发到归属无线网络的机顶盒。当使用RTP时,网关140被称为RTP混合器并且充当RTP连接的端点。
该系统包括通常能够接收发送的信号、将该信号解调和解封装成为编码媒体比特流的一个或者多个接收器150。编码媒体比特流通常进一步由解码器160处理,该解码器的输出是一个或者多个未压缩媒体流。最后,呈现器(renderer)170例如可以用扬声器或者显示器来再现未压缩媒体比特流。接收器150、解码器160和呈现器170可以驻留于相同物理设备中,或者它们可以包含于单独设备中。
本发明的通信设备可以使用各种传输技术来通信,这些传输技术包括但不限于码分多址(CDMA)、全球移动通信系统(GSM)、通用移动电信系统(UMTS)、时分多址(TDMA)、频分多址(FDMA)、传输控制协议/互联网协议(TCP/IP)、短消息收发服务(SMS)、多媒体消息收发服务(MMS)、电子邮件、即时消息收发服务(IMS)、蓝牙、IEEE 802.11等。通信设备可以使用各种介质来通信,这些介质包括但不限于无线电、红外线、激光、线缆连接等。
图2和图3示出了本发明可以实施于其中的一个有代表性的移动设备12。然而应当理解本发明并非意欲局限于一个特定类型的移动设备12或者其它电子设备。图2和图3中所示的一些或者所有特征可以并入到可以在图1中所示的任何或者所有设备中。
图2和图3的移动设备12包括壳30、形式为液晶显示器的显示器32、小键盘34、麦克风36、耳机38、电池40、红外端口42、天线44、根据本发明一个实施例的形式为UICC的智能卡46、读卡器48、无线电接口电路52、编码解码器电路54、控制器56和存储器58。独立电路和单元都是本领域中、例如Nokia移动设备范围中公知的类型。
本发明的各个实施方式提供了在运行时间期间为动态且可配置的量化器结构。这使得能够针对不同情形容易地重新配置与各种量化器结构相关联的编码解码器。动态量化器结构的使用继而增强了输入信号的压缩效率。本发明的各种实施方式可被用于语音压缩和合成解决方案中,以用于以有效率的方式使编码解码器适用于不同的文本到语音的话音。然而,应当指出动态量化器结构可以被应用于允许有损压缩的其他压缩应用。
根据本发明的各个实施方式配置的量化器结构以这样的方式变得灵活:1)量化器可以对不同类型的输入数据使用不同的处理方法和/或系统;2)可以根据遇到的语音数据的类型来使用若干不同的预测性的和/或无记忆的量化器模式。应当指出,这些不同的预测性的和/或无记忆的量化器模式可以和不同类型的预测器一起使用;3)子量化器数据可以是唯一的,或者可以在不同的量化器之间共享;以及4)子量化器可以包括具有一级或多级/部分的码本。应当指出,尽管此处使用的是广义上的术语″码本″,然而多个可能的预测器可以被分配给任何给定的码本。
动态量化器数据以二进制格式表示。二进制格式在语音编码器的初始化进程期间被用作附加数据。另外,如有需要,动态量化器数据可以在语音编码器的运行时间处理期间被更新。量化器配置作为具体配置报头被存储,该报头可以在以二进制格式的实际的码本数据之前。可替换地,诸如码本数据之类的其他数据可以在量化器配置之前,或者这些数据可以交织。配置报头针对配置中包括的每个量化参数规定了量化器结构以及配置。
动态量化器数据和配置被充分且动态地分配到语音编码器存储器中。这能够得到下列好处:(1)语音编码器可以具有初始码本配置,即缺省配置;(2)动态量化器配置不需要包括用于所有相关参数的码本;(3)每个子量化器可以通过再装载有关数据而被逐一更新;以及(4)每个参数可以使用相同的码本和/或预测器以用于单个存储器实例内的不同分段类型,其中,术语“分段(segment)类型”指的是不同类型输入数据的不同操作模式。应当指出,不同的分段类型取决于正在被量化和/或正在被处理的特定语音类型。
根据该本发明的一个实施方式对数据进行组织的例子在图4中被示出。如上所讨论的那样,语音编码器可以具有初始码本(CB)配置数据400。配置报头包括用于每个语音参数的不同的信息片,每个信息片包括用于每个参数的包含标志。如上所述,每个参数都可以使用相同的码本,即参数CB数据410,以用于具有单个存储器实例的不同分段类型。因此,用于所有分段类型标志的公共码本也包括在配置报头中。另外,指向分段类型CB数据420的分段类型包含标志也被包括。对于每个分段类型,其中包括了与非预测性CB数据430相关联的若干非预测性模式以及与预测性CB数据450相关联的若干预测性模式。对于每个非预测性模式,包括与CB级数据440相关联的若干级。对于每一级,其中包括单位为比特的级大小。而且,预测性CB数据450与CB级数据460、CB预测器数据470以及CB均值数据480相关联。
还在图4中示出的二进制格式存储配置报头,并且其在动态量化器初始化开始的时候被分析。在分析动态量化器配置之后,可以从二进制格式化数据读取实际的量化器数据并将其放入一个正确的存储器结构中。
应当指出,只要在可预见到的变体中保持某些原则,即动态量化器的使用,量化器以二进制格式表示,并且该二进制格式由配置数据以及将被更新的量化器数据二者(必要时包括预测器数据)组成,则可以变化本发明的各个实施方式的具体细节(例如,实际的文件格式)。
图5说明了根据本发明的各个实施方式的动态量化器的更新处理。应当指出,如图4中那样,CB指的是码本(包括可能的预测器),N表示实例的数量。在500处,码本配置报头被加载到语音编码器中。在510处,分析码本配置报头以提取CB配置数据。在520处使用CB配置数据加载CB通用数据。在530处加载参数CB数据。在540处确定是否包括任何(一个或多个)参数。如果未包括,则处理回到530。如果在540处包括(一个或多个)参数,则在550处加载分段类型CB数据。在560处判断是否包括(一个或多个)分段类型。如果不包括(一个或多个)分段类型,则处理回到550。如果包括(一个或多个)分段类型,则处理继续到570,在570处加载非预测性的CB数据。针对N个中的每个识别的非预测性模式实例重复非预测性CB数据的加载。在580处加载预测性CB数据。如在570处,针对N个中的每个预测模式实例加载预测性CB数据。在590处,处理完成并退出。
本发明的各个实施方式提供了超过传统的量化器结构的各种优点。语音编码器输出质量在除了实际的二进制格式化数据之外还存储码本数据的应用中(例如,在文本-语音应用中)得到最大化。如上所指出,量化器的运行时间更新被实现。另外,每个参数的量化器,以及每个参数的子量化器都可以独立更新。当码本的加载不被固定到任何建立配置中时,可以使用不同的预测性和/或非预测性的码本模式。无需对装置的闪速存储器进行重新编程就可实现用于基于ROM编码解码器的更新。最后,可下载的编码解码器更新也被实现。
本发明在方法步骤的一般环境中被描述,所述方法步骤可以由包括在网络环境中由计算机执行的计算机可执行指令(诸如程序代码)的程序产品在一个实施方式中实现。通常,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。计算机可执行指令、相关联的数据结构,以及程序模块表示用于执行此处公开的方法步骤的程序代码。这类可执行指令或相关联的数据结构的特定序列表示用于实现这类步骤中描述的功能的对应行动的例子。
本发明的软件实施可以用具有以实现各个步骤的基于规则的逻辑及其他逻辑的标准编程技术来实现。
为了说明和描述的目的已经给出了本发明的前述实施方式的描述。这不意味着穷举或是将本发明限制到公开的精确形式,并且按照上述教导,修改和变化是可能的,或者可以从本发明的实践中获取。这些实施方式是为了解释本发明的原理及其实际应用而被选择并描述,以便使本领域技术人员能够在各种实施方式中使用本发明并且将其用于适于所考虑的特定使用的不同修改。
Claims (40)
1.一种编码具有多个参数的输入信号的方法,包括:
以二进制格式存储数据,其中,所述数据表示量化器配置报头,而所述二进制格式包括在编码器的初始化期间使用的附加数据;
接收所述输入信号;以及
根据与每个参数相关联的量化器配置报头内规定的量化器数据量化所述输入信号的每个参数。
2.根据权利要求1所述的方法,其中,所述量化器配置报头先于以所述二进制格式的码本数据。
3.根据权利要求1或2所述的方法,其中,所述量化器数据涉及针对所述输入信号的每个量化参数的动态量化器结构和配置。
4.根据权利要求1-3中任意一个的方法,其中,所述量化器数据包括预测器数据。
5.根据权利要求1或2所述的方法,其中,所述量化器数据涉及针对所述输入信号的量化参数中的至少一个的动态量化器结构和配置。
6.根据权利要求1-5中任意一个的方法,其中,所述编码器部分地包括缺省的码本配置。
7.根据权利要求1-6中任意一个的方法,其中,所述量化器数据包括下列中的至少一个:
用于所述输入信号的至少一个参数的至少一个码本、以及所述量化器配置报头。
8.根据权利要求1所述的方法,其中,在用于所述输入信号的至少一个参数内的至少一个分段类型的量化期间访问公共码本。
9.根据权利要求1所述的方法,其中,对于每个参数,所述量化器配置报头包括:
包含标志、用于所有分段类型标志的公共码本、分段类型包含标志、用于每个分段类型的若干非预测性模式和若干预测模式、用于每个非预测性模式和预测模式的若干级、以及针对每一级以比特为单位的级大小。
10.根据权利要求1-9中任意一个的方法,其中,当所述编码器正在操作时,所述量化器数据可以是至少一个被更新的并且可以被独立地更新。
11.一种包含在计算机可读介质上的计算机程序产品,包括被配置用于执行权利要求1-10中任意一个的处理的计算机代码。
12.一种被配置用于编码具有多个参数的输入信号的设备,包括:
处理器;以及
存储单元,其可操作地连接到所述处理器并且包括:
用于以二进制格式存储数据的计算机代码,其中,所述数据表示量化器配置报头,而所述二进制格式包括在编码器的初始化期间使用的附加数据;
用于接收所述输入信号的计算机代码;以及
用于根据与每个参数相关联的量化器配置报头内规定的量化器数据量化所述输入信号的每个参数的计算机代码。
13.根据权利要求12的设备,其中,所述量化器数据涉及针对所述输入信号每个量化参数的动态量化器结构和配置。
14.根据权利要求12的设备,其中,所述量化器数据涉及针对所述输入信号中的至少一个量化参数的动态量化器结构和配置。
15.一种解码二进制格式化数据的方法,包括:
接收作为在编码器的初始化期间使用的附加数据的所述二进制格式化数据,其中,所述二进制格式化数据包括这样的数据,即所述数据包括具有多个参数和量化器配置报头的量化输入信号数据;
分析所述量化器配置报头以提取与所述量化输入信号数据的每个量化参数相关联的量化器数据;以及
访问与所述量化器数据相关联的至少一个码本以输出表示原始输入信号数据的每个量化参数。
16.根据权利要求15所述的方法,其中,所述数据先于二进制格式化数据中的码本数据。
17.根据权利要求15或16所述的方法,其中,所述码本数据由至少两个参数共享。
18.根据权利要求15-17中任意一个的方法,其中,所述量化器数据涉及针对所述输入信号每个量化参数的动态量化器结构和配置。
19.根据权利要求15-17中任意一个的方法,其中,所述量化器数据涉及针对所述输入信号中的至少一个量化参数的动态量化器结构和配置。
20.根据权利要求15-19中任意一个的方法,其中,所述编码器部分地包括缺省的码本配置。
21.根据权利要求15-20中任意一个的方法,其中,所述量化器数据包括下列中的至少一个:
用于所述输入信号的至少一个参数的至少一个码本、以及所述量化器配置报头。
22.根据权利要求15所述的方法,其中,在用于所述输入信号的至少一个参数内的至少一个分段类型的量化期间访问公共码本。
23.根据权利要求15所述的方法,其中,对于每个参数,所述量化器配置报头包括:
包含标志、用于所有分段类型标志的公共码本、分段类型包含标志、用于每个分段类型的若干非预测性模式和若干预测模式、用于每个非预测性模式的若干级、以及针对每一级以比特为单位的级大小。
24.根据权利要求15所述的方法,其中,当所述编码器正在操作时,所述量化器数据可以是至少一个被更新的并且可以独立地更新。
25.一种包含在计算机可读介质上的计算机程序产品,包括被配置用于执行权利要求15-24中任意一个的处理的计算机代码。
26.一种被配置用于解码二进制格式化数据的设备,包括:
处理器;以及
存储单元,其可操作地连接到所述处理器并且包括:
用于接收作为在编码器初始化期间使用的附加数据的所述二进制格式化数据的计算机代码,其中,所述二进制格式化数据包括这样的数据,即所述数据包括具有多个参数和量化器配置报头的量化输入信号数据;
用于分析所述量化器配置报头以提取与所述量化输入信号数据的每个量化参数相关联的量化器数据的计算机代码;以及
用于访问与所述量化器数据相关联的至少一个码本以输出表示原始输入信号数据的每个量化参数的计算机代码。
27.根据权利要求26的设备,其中,所述量化器数据涉及针对所述输入信号每个量化参数的动态量化器结构和配置。
28.根据权利要求26的设备,其中,所述量化器数据涉及针对所述输入信号中的至少一个量化参数的动态量化器结构和配置。
29.一种用于编码具有多个参数的输入信号的编码装置,包括:
用于以二进制格式存储数据的装置,其中,所述数据表示量化器配置报头,而所述二进制格式包括在编码器的初始化期间使用的附加数据;
用于接收所述输入信号的装置;以及
用于根据与每个参数相关联的量化器配置报头内规定的量化器数据量化所述输入信号的每个参数的装置。
30.根据权利要求29的编码器装置,其中,所述量化器数据涉及针对所述输入信号中的至少一个量化参数的动态量化器结构和配置。
31.一种用于解码二进制格式化数据的解码装置,包括:
用于接收作为在编码器初始化期间使用的附加数据的所述二进制格式化数据的装置,其中,所述二进制格式化数据包括这样的数据,即所述数据包括具有多个参数和量化器配置报头的量化输入信号数据;
用于分析所述量化器配置报头以提取与所述量化输入信号数据的每个量化参数相关联的量化器数据的装置;以及
用于访问与所述量化器数据相关联的至少一个码本以输出表示原始输入信号数据的每个量化参数的装置。
32.根据权利要求31的解码装置,其中,所述量化器数据涉及针对输入信号中的至少一个量化参数的动态量化器结构和配置。
33.一种解码二进制格式化数据的方法,包括:
读取所述二进制格式化数据,所述二进制格式化数据包括至少一个量化器配置报头;
分析所述量化器配置报头以提取量化器配置数据;
根据所述二进制格式化数据更新相关量化器;以及
用所述更新的相关量化器执行解量化。
34.根据权利要求33所述的方法,其中,所述二进制格式化数据涉及针对输入信号每个量化参数的相关量化器的动态结构以及配置。
35.根据权利要求33所述的方法,其中,所述二进制格式化数据涉及针对输入信号的至少一个量化参数的相关量化器的动态结构以及配置。
36.一种包含在计算机可读介质上的计算机程序产品,包括被配置用于执行权利要求33-35中任意一个的处理的计算机代码。
37.一种设备,包括:
处理器;以及
存储单元,其可操作地连接到所述处理器并且包括:
被配置用于读取用于解码的二进制格式化数据的计算机代码,所述二进制格式化数据包括至少一个量化器配置报头;
被配置用于分析所述量化器配置报头以提取量化器配置数据的计算机代码;
被配置用于根据所述二进制格式化数据更新相关量化器的计算机编码器;以及
被配置用于用所述更新的相关量化器执行解量化的计算机编码器。
38.根据权利要求37的设备,其中,所述二进制格式化数据涉及针对输入信号的至少一个量化参数的所述相关量化器的动态结构以及配置。
39.一种用于解码二进制格式化数据的解码装置,包括:
用于读取所述二进制格式化数据的装置,所述二进制格式化数据包括至少一个量化器配置报头;
用于分析所述量化器配置报头以提取量化器配置数据的装置;
用于根据所述二进制格式化数据更新相关量化器的装置;以及
用于用所述更新的相关量化器来执行解量化的装置。
40.根据权利要求39的解码装置,其中,所述二进制格式化数据涉及针对输入信号的至少一个量化参数的所述相关量化器的动态结构以及配置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US85701306P | 2006-11-06 | 2006-11-06 | |
US60/857,013 | 2006-11-06 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101553869A true CN101553869A (zh) | 2009-10-07 |
Family
ID=39364220
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA2007800411399A Pending CN101553869A (zh) | 2006-11-06 | 2007-09-07 | 用于进行有效压缩的动态量化器结构 |
Country Status (5)
Country | Link |
---|---|
US (1) | US8086057B2 (zh) |
EP (1) | EP2089879A4 (zh) |
KR (1) | KR101086515B1 (zh) |
CN (1) | CN101553869A (zh) |
WO (1) | WO2008056280A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105023021A (zh) * | 2015-07-09 | 2015-11-04 | 厦门理工学院 | 一种基于主方向模板的特征匹配方法 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA1333420C (en) * | 1988-02-29 | 1994-12-06 | Tokumichi Murakami | Vector quantizer |
FI974244A (fi) * | 1997-11-14 | 1999-05-15 | Nokia Mobile Phones Ltd | Kuvan kompressointimenetelmä |
US6625323B2 (en) * | 1998-09-25 | 2003-09-23 | Eastman Kodak Company | Method for compressing and decompressing digital having text |
US6446037B1 (en) * | 1999-08-09 | 2002-09-03 | Dolby Laboratories Licensing Corporation | Scalable coding method for high quality audio |
US6757648B2 (en) * | 2001-06-28 | 2004-06-29 | Microsoft Corporation | Techniques for quantization of spectral data in transcoding |
EP2278807B1 (en) * | 2001-11-27 | 2012-07-18 | Samsung Electronics Co., Ltd. | Apparatus for decoding a bitstrom with an orientation interpolator |
US7809204B2 (en) * | 2002-10-18 | 2010-10-05 | Samsung Electronics Co., Ltd. | Method and apparatus for encoding and decoding key value data of coordinate interpolator |
JP4146444B2 (ja) | 2005-03-16 | 2008-09-10 | 株式会社東芝 | 動画像符号化の方法及び装置 |
-
2007
- 2007-09-07 CN CNA2007800411399A patent/CN101553869A/zh active Pending
- 2007-09-07 EP EP07826294A patent/EP2089879A4/en not_active Ceased
- 2007-09-07 WO PCT/IB2007/053601 patent/WO2008056280A1/en active Application Filing
- 2007-09-07 KR KR1020097011646A patent/KR101086515B1/ko not_active IP Right Cessation
- 2007-09-14 US US11/855,778 patent/US8086057B2/en not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105023021A (zh) * | 2015-07-09 | 2015-11-04 | 厦门理工学院 | 一种基于主方向模板的特征匹配方法 |
Also Published As
Publication number | Publication date |
---|---|
WO2008056280A1 (en) | 2008-05-15 |
US8086057B2 (en) | 2011-12-27 |
EP2089879A1 (en) | 2009-08-19 |
US20080107348A1 (en) | 2008-05-08 |
KR20090082461A (ko) | 2009-07-30 |
KR101086515B1 (ko) | 2011-11-23 |
EP2089879A4 (en) | 2010-12-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11039144B2 (en) | Method and apparatus for image coding and decoding through inter-prediction | |
TWI452908B (zh) | 用於視訊編碼及解碼之系統及方法 | |
JP4903195B2 (ja) | ビデオデータを効果的に符号化及び復号する方法,デバイス及びシステム | |
CN101578866B (zh) | 利用参考画面标记和参考画面列表对可缩放视频位流进行编解码的方法及装置 | |
CN101755458B (zh) | 可缩放视频编码方法和装置以及可缩放视频解码方法和装置 | |
US8098736B2 (en) | Variable length coding method and variable length decoding method | |
KR20090133126A (ko) | 모션 벡터 예측을 위한 방법 및 시스템 | |
US20100011012A1 (en) | Selective Compression Based on Data Type and Client Capability | |
US8576097B2 (en) | Coding using a mapping between a syntax element and a code word | |
KR100931912B1 (ko) | 스케일러블 비디오 코딩에서 fgs 식별 | |
EP3477949B1 (en) | Picture decoding method and device using division information of a coding tree unit | |
CN102144256B (zh) | 用于针对矢量量化器的快速最近邻搜索的方法和设备 | |
US9425822B2 (en) | Simplified range and context update for multimedia context-adaptive binary arithmetic coding design | |
CN101553869A (zh) | 用于进行有效压缩的动态量化器结构 | |
CN1316748C (zh) | 使用请求-应答通信模式用于数据压缩的通信系统和方法 | |
CN113170137A (zh) | 降低本地邻域的使用的残差译码 | |
WO2021209907A1 (en) | High level syntax and carriage for compressed representation of neural networks | |
JPH1051779A (ja) | 符号化復号化装置 | |
JP3145908B2 (ja) | データ復号装置及びデータ符号化装置 | |
KR100706427B1 (ko) | 다단계 이미지 수신 기능을 가지는 무선통신 단말기 및 그방법과 콘텐츠 전송 장치에서의 다단계 이미지 송신 방법 | |
JP3263582B2 (ja) | 符号化/復号化装置 | |
CN113905233B (zh) | 基于音频视频编码标准的熵解码方法、可读介质及其电子设备 | |
KR100937590B1 (ko) | 다중 품질 서비스 영상 콘텐츠 제공 시스템 및 그것의업그레이드 방법 | |
CN116405675A (zh) | 编码方法、装置、设备及存储介质 | |
CN116193113A (zh) | 数据解压和压缩方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C12 | Rejection of a patent application after its publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20091007 |