CN104041054A - 编码设备及编码方法、解码设备及解码方法以及程序 - Google Patents
编码设备及编码方法、解码设备及解码方法以及程序 Download PDFInfo
- Publication number
- CN104041054A CN104041054A CN201380005187.8A CN201380005187A CN104041054A CN 104041054 A CN104041054 A CN 104041054A CN 201380005187 A CN201380005187 A CN 201380005187A CN 104041054 A CN104041054 A CN 104041054A
- Authority
- CN
- China
- Prior art keywords
- unit
- signal
- code book
- occurrence
- probability
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 24
- 238000001228 spectrum Methods 0.000 claims abstract description 144
- 238000012545 processing Methods 0.000 claims description 41
- 230000003213 activating effect Effects 0.000 claims description 4
- 230000003750 conditioning effect Effects 0.000 claims description 4
- 230000003247 decreasing effect Effects 0.000 claims description 3
- 238000005516 engineering process Methods 0.000 abstract description 33
- 238000013139 quantization Methods 0.000 abstract description 30
- 238000010606 normalization Methods 0.000 description 131
- 238000006243 chemical reaction Methods 0.000 description 26
- 238000010586 diagram Methods 0.000 description 20
- 230000003595 spectral effect Effects 0.000 description 20
- 230000008569 process Effects 0.000 description 6
- 230000004044 response Effects 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 238000009434 installation Methods 0.000 description 3
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005538 encapsulation Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/035—Scalar quantisation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/038—Vector quantisation, e.g. TwinVQ audio
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/40—Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code
- H03M7/4031—Fixed length to variable length coding
- H03M7/4037—Prefix coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
- H04N19/15—Data rate or code amount at the encoder output by monitoring actual compressed data size at the memory before deciding storage at the transmission buffer
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/48—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using compressed domain processing techniques other than decoding, e.g. modification of transform coefficients, variable length coding [VLC] data or run-length data
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/91—Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/0017—Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本技术涉及编码设备及编码方法、解码设备及解码方法、以及程序,利用其,通过将编码目标的指定量化值的频率限制为0,在执行组合了霍夫曼编码和多维编码的编码时,可以提高编码效率。限制单元将归一化的频谱(NS)的指定量化值的频率限制为0。编码单元基于码本,关于除了与时间信号(T)对应的用于学习的时间信号的指定量化值之外的多个量化值中的每个量化值,对限制单元限制的归一化的频谱(NS)的量化值(Q3)进行编码,在所述用于学习的时间信号中指定量化值的频率被限制为0,根据所述码本来分配可变长度编码,其中频率越低,编码长度越长。作为示例,本技术可以应用于编码设备。
Description
技术领域
本技术涉及编码器及编码方法、解码器及解码方法以及程序。特别地,本技术涉及以下编码器及编码方法、解码器及解码方法以及程序:当进行利用霍夫曼编码和多维编码的组合的编码时,通过其,能够通过将编码目标的预定量化值的出现概率限制为0来改善编码效率。
背景技术
为了压缩和扩展听觉数字数据和视觉数字数据,设计了并且在实际中使用了各种编码器和解码器。听觉数据的标准压缩方案的示例包括运动图片专家组音频层3(MP3),视觉数据的标准压缩方案的示例包括联合图像专家组(JPEG)。
此外,霍夫曼编码是代表性的编码方法。在霍夫曼编码中,例如,获知编码目标的每个量化值的出现概率,并且使用下述码本来进行编码:关于出现概率不为0的量化值中的每个量化值,通过根据出现概率而分配具有代码长度的可变长度代码来准备该码本。
此时,随着量化值的出现概率增大而分配代码长度较短的可变长度代码,并且,随着量化值的出现概率减小而分配代码长度较长的可变长度代码,从而使得与将固定长度代码分配给全部量化值的情况相比较能够改善编码效率。
此外,也可以通过多维化(multidimensionalize)量化值来改善编码效率。例如,当将数字数据量化为-1、0以及+1这3个值时,关于量化值进行固定长度编码所使用的比特数量是2个比特。因此,当单独地编码4个量化值时,进行编码所使用的比特数量是8(=2×4)个比特。就此而言,当将4个量化值多维化并且编码为整体时,编码单元中的量化值的图案(pattern)的数量是81(=34),并且进行编码所使用的比特数量是7个比特。
此外,所理解的是,通过组合霍夫曼编码和多维编码能够实现更高效的编码。然而,随着多维编码的维数增加,码本变得更大。
此外,在利用霍夫曼编码和多维编码的组合的编码中,通过研究编码单元中的全部量化值为0的情况下的编码,还设计了进一步改善编码效率的方法(例如,参照PTL 1)。
引用列表
专利文献
PTL 1:日本未审查专利申请公开第2001-82878号
发明内容
技术问题
然而,在利用霍夫曼编码和多维编码的组合的编码中,没有考虑到将编码目标的预定量化值的出现概率限制为0以改善编码效率。
已经考虑到这个情况实现了本技术,并且当进行利用霍夫曼编码和多维编码的组合的编码时,能够通过将编码目标的预定量化值的出现概率限制为0来改善编码效率。
问题的解决方案
根据本技术的第一方面的编码器包括:限制单元,该限制单元将信号的预定量化值的出现概率限制为0;以及编码单元,该编码单元基于限制码本,关于由所述限制单元限制的所述信号的所述量化值进行编码,所述限制码本是具有可变长度代码的码本,所述可变长度代码是关于除了与所述信号对应的用于学习的信号的预定量化值之外的多个量化值中的每个量化值而分配的,并且随着所述出现概率减小,所述可变长度代码的代码长度更长,所述用于学习的信号的所述预定量化值的所述出现概率被限制为0。
根据本技术的第一方面的编码方法和程序对应于根据本技术的第一方面的编码器。
在本技术的第一方面中,将信号的预定量化值的出现概率限制为0,并且基于限制码本,对所述限制单元限制的所述信号的所述量化值进行编码,所述限制码本是具有可变长度代码的码本,所述可变长度代码是关于除了与所述信号对应的用于学习的信号的预定量化值之外的多个量化值中的每个量化值而分配的,并且随着所述出现概率减小,所述可变长度代码的代码长度更长,所述用于学习的信号的所述预定量化值的所述出现概率被限制为0。
根据本技术的第二方面的解码器包括:接收单元,该接收单元接收作为编码目标的信号的量化值,在所述信号中,预定量化值的出现概率被限制为0,并且量化值基于限制码本而编码的,所述限制码本是具有可变长度代码的码本,所述可变长度代码是关于除了与所述信号对应的用于学习的信号的预定量化值之外的多个量化值中的每个量化值而分配的,并且随着所述出现概率减小,所述可变长度代码的代码长度更长,所述用于学习的信号的所述预定量化值的所述出现概率被限制为0;以及解码单元,该解码单元基于所述限制码本,关于由所述接收单元接收的量化值进行解码。
根据本技术的第二方面的解码方法和程序对应于根据本技术的第二方面的解码器。
在本技术的第二方面中,接收作为编码目标的信号的预定量化值,在所述信号中,预定量化值的出现概率被限制为0,并且量化值是基于限制码本而编码的,所述限制码本是具有可变长度代码的码本,所述可变长度代码是关于除了与所述信号对应的用于学习的信号的预定量化值之外的多个量化值中的每个量化值而分配的,并且随着所述出现概率减小,所述可变长度代码的代码长度更长,所述用于学习的信号的所述预定量化值的所述出现概率被限制为0;并且,基于所述限制码本来解码所接收的量化值。
根据第一方面的编码器和根据第二方面的解码器可以是独立的设备,并且可以是构成一个设备的内部块。
发明的有益效果
根据本技术的第一方面,当进行利用霍夫曼编码和多维编码的组合的编码时,可以通过将编码目标的预定量化值的出现概率限制为0来改善编码效率。
此外,根据本技术的第二方面,可以对于下述代码进行解码:在该代码中当进行利用霍夫曼编码和多维编码的组合的编码时,通过将编码目标的预定量化值的出现概率限制为0来改善编码效率。
附图说明
[图1]图1是示出了作为本技术的前提(premise)的编码器的第一配置示例的框图。
[图2]图2是示出了作为本技术的前提的解码器的第一配置示例的框图。
[图3]图3是示出了作为本技术的前提的学习设备(learning device)的第一配置示例的框图。
[图4]图4是示出了作为量化值Q’(量化值Q)获取的值的示例的图。
[图5]图5是示出了在码本CB中分配的可变长度代码的示例的图。
[图6]图6是用于描述图3的学习设备的准备处理的流程图。
[图7]图7是示出了作为本技术的前提的编码器的第二配置示例的框图。
[图8]图8是示出了作为本技术的前提的解码器的第二配置示例的框图。
[图9]图9是示出了作为本技术的前提的学习设备的第二配置示例的框图。
[图10]图10是示出了在码本CB1中分配的可变长度代码的示例的图。
[图11]图11是示出了在码本CB2中分配的可变长度代码的示例的图。
[图12]图12是示出了根据本技术所应用到的编码器的实施方式的配置示例的框图。
[图13]图13是示出了作为量化值Q3获取的值的示例的图。
[图14]图14是示出了在码本CB3中分配的可变长度代码的示例的图。
[图15]图15是用于描述图12的编码器的编码处理的流程图。
[图16]图16是示出了与图1或图7的编码器所编码的量化值对应的归一化的频谱的图。
[图17]图17是示出了与图12的编码器所编码的量化值对应的归一化的频谱的图。
[图18]图18是示出了根据本技术所应用到的解码器的实施方式的配置示例的框图。
[图19]图19是用于描述图18的解码器的解码处理的流程图。
[图20]图20是示出了用于学习码本CB和码本CB3的学习设备的配置示例的框图。
[图21]图21是用于描述图20的学习设备的准备处理的流程图。
[图22]图22是示出了计算机硬件的配置示例的框图。
具体实施方式
<本发明的前提>
[作为本发明的前提的编码器的第一配置示例]
图1是示出了作为本技术的前提的编码器的第一配置示例的框图。
图1的编码器10包括频谱转换单元11、归一化单元12、量化单元13、编码单元14、输出单元15以及码本存储单元16。编码器10对于输入听觉数据的时间信号T进行利用霍夫曼编码和多维编码的组合的编码。
具体地,编码器10的频谱转换单元11对于从外部输入的时间信号T进行时间-频率转换,并且将时间信号T转换成频谱S。频谱转换单元11将频谱S提供给归一化单元12。
归一化单元12根据从频谱转换单元11提供的频谱S,针对每个预定频带确定示出了频谱S的包络的归一化系数F,并且将归一化系数F提供给输出单元15。此外,归一化单元12通过使用归一化系数F,针对预定频带中的每个预定频带来归一化频谱S,并且将因此获得的归一化的频谱NS提供给量化单元13。
量化单元13基于量化信息W来量化从归一化单元12提供的归一化的频谱NS,并且将因此获得的量化值Q提供给编码单元14,该量化信息W示出了量化比特的数量作为量化精度。此时,量化单元13获取响应于量化值Q而从编码单元14反馈的比特数量N,并且调整量化信息W使得比特数量N是预定值。量化单元13将调整之后的量化信息W提供给输出单元15。
编码单元14对于从量化单元13提供的量化值Q进行可变长度编码。具体地,编码单元14通过将量化值Q提供给码本存储单元16,来从码本存储单元16获取与量化值Q对应的可变长度代码H,作为编码结果。
此外,编码单元14通过将可变长度代码H的比特数量NH、量化信息W的比特数量NW以及归一化系数F的比特数量NF相加,来计算作为比特数量N的值,并且将该值提供给量化单元13。因此,量化单元13调整量化信息W使得比特数量N小于或等于值NQ,该值NQ被确定作为代码串B的比特数量。当比特数量N小于或等于值NQ时,编码单元14将与量化值Q对应的可变长度代码H提供给输出单元15作为编码结果。
输出单元15复用来自归一化单元12的归一化系数F、来自量化单元13的量化信息W、以及来自编码单元14的可变长度代码H,并且输出因此获得的代码串B。
码本存储单元16存储由学习设备(后面描述)学习的码本CB,在该码本CB中作为量化值Q获取的值与可变长度代码彼此相关联。当从编码单元14提供量化值Q时,码本存储单元16读出码本CB中与量化值Q相关联的可变长度代码H,并且将可变长度代码H提供给编码单元14。
[作为本发明的前提的解码器的第一配置示例]
图2是示出了对于从图1的编码器10输出的代码串B进行解码的解码器的配置示例的框图。
图2的解码器30包括接收单元31、解码单元32、反量化单元33、反归一化单元34、反向频谱转换单元35以及码本存储单元36。
解码器30的接收单元31接收从图1的编码器10输出的代码串B。接收单元31将代码串B分解成可变长度代码H,量化信息W以及归一化系数F。接收单元31将可变长度代码H提供给解码单元32,将量化信息W提供给反量化单元33,并且将归一化系数F提供给反归一化单元34。
解码单元32对于从接收单元31提供的可变长度代码H进行解码。具体地,解码单元32将可变长度代码H提供给码本存储单元36,从而获取与可变长度代码H对应的量化值Q作为解码结果。解码单元32将量化值Q提供给反量化单元33作为解码结果。
反量化单元33基于从接收单元31提供的量化信息W来反向量化从解码单元32提供的量化值Q,从而获得归一化的频谱NS。反量化单元33将归一化的频谱NS提供给反归一化单元34。
反归一化单元34通过使用从接收单元31提供的归一化系数F,针对预定频带中的每个预定频带来反向归一化从反量化单元33提供的归一化的频谱NS,并且将因此获得的频率频谱S提供给反向频谱转换单元35。
反向频谱转换单元35对于从反归一化单元34提供的频率频谱S进行频率-时间转换,并且输出因此获得的时间信号T。
码本存储单元36存储与存储在码本存储单元16中的码本CB相同的码本CB。当从解码单元32提供可变长度代码H时,码本存储单元36读出码本CB中与可变长度代码H相关联的量化值Q,并且将量化值Q提供给解码单元32。
此外,解码器30的归一化的频谱NS、频率频谱S以及时间信号T包括根据量化的误差,并且因此不完全与编码器10的归一化的频谱NS、频率频谱S以及时间信号T一致。
[作为本发明的前提的学习设备的第一配置示例]
图3是示出了用于学习存储在图1的码本存储单元16和图2的码本存储单元36中的码本CB的学习设备的配置示例的框图。
图3的学习设备50包括频谱转换单元51、归一化单元52、量化单元53、编码单元54、出现概率计算单元55以及霍夫曼代码创建单元56。
将与作为编码目标输入到图1的编码器10的时间信号T对应的用于学习的时间信号T’输入到学习设备50的频谱转换单元51。类似于图1的频谱转换单元11,频谱转换单元51对于用于学习的时间信号T’进行时间-频率转换,并且将时间信号T’转换成频谱S’。频谱转换单元51将频谱S’提供给归一化单元52。
类似于归一化单元12,归一化单元52根据从频谱转换单元51提供的频谱S’,针对预定频带中的每个预定频带来确定频谱S’的归一化系数F’。此外,归一化单元12通过使用归一化系数F’,针对预定频带中的每个预定频带来归一化频谱S’,并且将因此获得的归一化的频谱NS’提供给量化单元53。
类似于量化单元13,量化单元53基于量化信息W’来量化从归一化单元52提供的归一化的频谱NS’,并且将因此获得的量化值Q’提供给编码单元54。此时,类似于量化单元13,量化单元53获取响应于量化值Q’而从编码单元54反馈的比特数量N’,并且调整量化信息W’使得比特数量N’是预定值。量化单元53将最终的量化值Q’提供给出现概率计算单元55。
编码单元54对于从量化单元53提供的量化值Q’进行固定长度编码。编码单元54通过将固定长度代码的比特数量NH’、量化信息W’的比特数量NW’、以及归一化系数F’的比特数量NF’相加,来计算作为比特数量N’的值,并且将该值提供给量化单元53。据此,量化单元53调整量化信息W’使得比特数量N’小于或等于与设定代码串的比特率对应的值。当准备了与编码方案(例如MP3、高级音频编码(AAC)或自适应变换听觉编码(ATRAC))对应的码本CB时,代码串的比特率大约为128kbps,在该比特率能够确保足够的听觉质量。
出现概率计算单元55基于从量化单元53提供的量化值Q’,将作为量化值Q’(量化值Q)获取的值设定作为条目(entry),并且针对每个条目来计数出现的次数。出现概率计算单元55将针对全部时间信号T’的每个条目的出现次数提供给霍夫曼代码创建单元56,作为每个条目的出现概率P。
霍夫曼代码创建单元56基于从出现概率计算单元55提供的每个条目的出现概率P来分配可变长度代码,对于量化值(其是每个条目)随着出现概率P减小,该可变长度代码的代码长度较长。霍夫曼代码创建单元56准备其中各量化值与分配给量化值的可变长度代码彼此相关联的码本CB。码本CB存储在码本存储单元16和码本存储单元36中。
[对码本CB的描述]
图4是示出了作为量化值Q’(量化值Q)获取的值的示例的图。
在图4的示例中,编码是2维的,并且将作为编码目标的两个频谱的各个量化值Q’(量化值Q)分别设定为A和B。此外,在图4的示例中,已获取的量化值A和量化值B的值分别是-1、0以及+1这3个值。
在这种情况下,已获取的量化值(A,B)的组合是(1,1)、(1,-1)、(1,0)、(-1,1)、(-1,-1)、(-1,0)、(0,1)、(0,-1)以及(0,0)。也就是说,条目的数量是图4中示出的(1)至(9)这9(=32)个。
图5是示出了在码本CB中分配给图4的条目(1)至条目(9)中的每个条目的可变长度代码的示例的图。
此外,在图5的示例中,出现概率的高低按照条目(1)、条目(2)、条目(3)、条目(4)、条目(5)、条目(6)、条目(7)、条目(8)以及条目(9)的顺序。
在这种情况下,如图5所示,例如,将2个比特的代码“01”分配给条目(1)的量化值,并且将2个比特的代码“10”分配给条目(2)的量化值。此外,将3个比特的代码“001”分配给条目(3)的量化值,并且将3个比特的代码“110”分配给条目(4)的量化值。
此外,将4个比特的代码“0000”分配给条目(5)的量化值,将4个比特的代码“0001”分配给条目(6)的量化值,并且将4个比特的代码“1110”分配给条目(7)的量化值。此外,将5个比特的代码“11110”分配给条目(8)的量化值,并且将5个比特的代码“11111”分配给条目(9)的量化值。
如上所述,在图5的码本CB中,将5个比特的代码分配给出现概率为最低的量化值,并且将2个比特的代码分配给出现概率为最高的量化值。就此而言,当对于量化值Q’(量化值Q)进行二维固定长度编码时,固定长度代码的比特数量总是4个比特,以4个比特能够示出9个图案。因此,当基于图5的码本CB来进行可变长度编码时,与进行固定长度编码的情况相比较可以改善编码效率。
[对学习设备的处理的描述]
图6是用于描述图3的学习设备50的准备处理的流程图。
在图6的步骤S11中,学习设备50进行与编码有关的设定。具体地,例如,学习设备50的编码单元54将编码模式设定为固定长度编码模式。此外,量化单元53将代码串的比特率设定为预定值(例如,128kbps)。
在步骤S12中,学习设备50的频谱转换单元51对于从外部输入的用于学习的时间信号T’进行时间-频率转换,并且将时间信号T’转换成频谱S’。频谱转换单元51将频谱S’提供给归一化单元52。
在步骤S13中,归一化单元52根据从频谱转换单元51提供的频谱S’,针对每个预定频带来确定频谱S’的归一化系数F,并且通过使用归一化系数F来归一化频谱S’。归一化单元52将因此获得的归一化的频谱NS’提供给量化单元53。
在步骤S14中,量化单元53基于量化信息W’来量化从归一化单元52提供的归一化的频谱NS’,并且将因此获得的量化值Q’提供给编码单元54。
在步骤S15中,编码单元54对于从量化单元53提供的量化值Q’进行固定长度编码。编码单元54通过将固定长度代码的比特数量NH’、量化信息W’的比特数量NW’、以及归一化系数F’的比特的数量NF’相加,来计算作为比特数量N’的值,并且将该值提供给量化单元53。
在步骤S16中,量化单元53确定比特数量N’是否小于或等于与设定代码串的比特率对应的值。在步骤S16中,当比特数量N’不是小于或等于与设定代码串的比特率对应的值时,量化单元53改变量化信息W’。然后,处理返回到步骤S14,并且重复步骤S14至步骤S16的处理,直到比特数量N’小于或等于与设定代码串的比特率对应的值为止。
另一方面,在步骤S16中,当比特数量N’小于或等于与设定代码串的比特率对应的值时,量化单元53将量化值Q’提供给出现概率计算单元55。
然后,在步骤S17中,出现概率计算单元55基于从量化单元53提供的量化值Q’,将作为量化值Q’(量化值Q)获取的值设定为条目,并且针对每个条目来计数出现的次数。
在步骤S18中,学习设备50确定是否对于整个时间信号T’计数了针对每个条目的出现次数。在步骤S18中,当还没有对于整个时间信号T’计数了针对每个条目的出现次数时,处理返回到步骤S12,并且重复步骤S12至步骤S18的处理。
另一方面,在步骤S18中,当对于整个时间信号T’计数了针对每个条目的出现次数时,出现概率计算单元55将对于整个时间信号T’的针对每个条目的出现次数提供给霍夫曼代码创建单元56,作为每个条目的出现概率P。
然后,在步骤S19中,霍夫曼代码创建单元56基于从出现概率计算单元55提供的每个条目的出现概率P来分配下述可变长度代码:对于量化值(其是每个条目)随着出现概率P减小,该可变长度代码的代码长度较长。
在步骤S20中,霍夫曼代码创建单元56准备其中各量化值与分配给量化值的可变长度代码彼此相关联的码本CB。码本CB存储在码本存储单元16和码本存储单元36中。
学习设备50能够通过使用许多听觉时间信号作为用于学习的时间信号T’,来学习更精确的出现概率。因此,可以准备更合适的码本。
[作为本发明的前提的编码器的第二配置示例]
图7是示出了作为本技术的前提的编码器的第二配置示例的框图。
在图7示出的配置中,将相同的附图标记应用于与图1中的配置相同的配置。将适当地省略对其的重复描述。
图7的编码器70的配置与图1中的配置的不同之处在于设置了编码单元71、输出单元72、码本存储单元73以及码本存储单元74而不是编码单元14、输出单元15以及码本存储单元16。编码器70通过选择性地使用两种类型的码本来进行编码。
具体地,编码器70的编码单元71对于从量化单元13提供的量化值Q进行编码。更具体地,编码单元71将量化值Q提供给码本存储单元73,从而从码本存储单元73获取与量化值Q对应的可变长度代码H1。此外,编码单元71将量化值Q提供给码本存储单元74,从而从码本存储单元74获取与量化值Q对应的可变长度代码H2。
编码单元71将可变长度代码H1和可变长度代码H2中的具有小的比特数量的可变长度代码设定为编码结果。类似于图1的编码单元14,编码单元71基于编码结果的比特数量等,将比特数量N提供给量化单元13。当比特数量N小于或等于值NQ时,编码单元71将作为与量化值Q对应的编码结果的可变长度代码H1或可变长度代码H2提供给输出单元72。此外,编码单元71将码本信息C作为在编码中使用的码本提供给输出单元72,该码本信息C示出了与被选择为编码结果的可变长度代码H1或可变长度代码H2对应的码本。
输出单元72复用来自归一化单元12的归一化系数F、来自量化单元13的量化信息W、以及来自编码单元71的可变长度代码H1或可变长度代码H2以及码本信息C,并且输出因此获得的代码串B’。
码本存储单元73存储码本CB1,在该码本CB1中作为量化值Q获取的值与可变长度代码彼此相关联,并且由学习设备(后面描述)通过使用用于学习的预定时间信号来学习该码本CB1。当从编码单元71提供量化值Q时,码本存储单元73读出码本CB1中与量化值Q相关联的可变长度代码H1,并且将可变长度代码H1提供给编码单元71。
码本存储单元74存储码本CB2,在码本CB2中作为量化值Q获取的值与可变长度代码彼此相关联,并且由学习设备(后面描述)通过使用与在准备码本CB1中所使用的用于学习的时间信号不同的用于学习的时间信号来学习该码本CB2。当从编码单元71提供量化值Q时,码本存储单元74读出码本CB2中与量化值Q相关联的可变长度代码H2,并且将可变长度代码H2提供给编码单元71。
[作为本发明的前提的解码器的第二配置示例]
图8是示出了用于解码从图7的编码器70输出的代码串B’的解码器的配置示例的框图。
在图8示出的配置中,将相同的附图标记应用于与图2中的配置相同的配置。将适当地省略对其的重复描述。
图8的解码器90的配置与图2中的配置的不同之处在于设置了接收单元91、解码单元92、码本存储单元93以及码本存储单元94,而不是接收单元31、解码单元32以及码本存储单元36。
解码器90的接收单元91接收从图7的编码器70输出的代码串B’。接收单元91将代码串B’分解成可变长度代码H1或可变长度代码H2、码本信息C、量化信息W以及归一化系数F。接收单元91将可变长度代码H1或可变长度代码H2以及码本信息C提供给解码单元92,将量化信息W提供给反量化单元33,并且将归一化系数F提供给反归一化单元34。
解码单元92基于从接收单元91提供的码本信息C对于从接收单元91提供的可变长度代码H1或可变长度代码H2进行解码。具体地,解码单元92选择用于存储由码本信息C示出的码本CB1的码本存储单元93或者用于存储由码本信息C示出的码本CB2的码本存储单元94。解码单元92通过将可变长度代码H1提供给所选择的码本存储单元93来获取与可变长度代码H1对应的量化值Q,或者通过将可变长度代码H2提供给所选择的码本存储单元94来获取与可变长度代码H2对应的量化值Q。解码单元92将所获取的量化值Q提供给反量化单元33作为解码结果。
码本存储单元93存储与存储在图7的码本存储单元73中的码本CB1相同的码本CB1。当从解码单元92提供可变长度代码H1时,码本存储单元93读出码本CB1中与可变长度代码H1相关联的量化值Q,并且将量化值Q提供给解码单元92。
码本存储单元94存储与存储在码本存储单元74中的码本CB2相同的码本CB2。当从解码单元92提供可变长度代码H2时,码本存储单元94读出码本CB2中与可变长度代码H2相关联的量化值Q,并且将量化值Q提供给解码单元92。
此外,解码器90的归一化频谱NS、频率频谱S以及时间信号T包括根据量化的误差,并且因此不完全与编码器70的归一化频谱NS、频率频谱S以及时间信号T一致。
[作为本发明的前提的学习设备的第二配置示例]
图9是示出了用于学习存储在图7的码本存储单元73和图8的码本存储单元93中的码本CB1,并且用于学习存储在码本存储单元74和码本存储单元94中的码本CB2的学习设备的配置示例的框图。
图9的学习设备110包括频谱转换单元111、归一化单元112、量化单元113、编码单元114、出现概率计算单元115以及霍夫曼代码创建单元116。将与作为编码目标输入到图7的编码器70中的时间信号T对应的两种类型的用于学习的时间信号T1’和T2’输入到学习设备110。例如,时间信号T1’和时间信号T2’是每个条目的出现概率的分布彼此不同的时间信号。
除了处理的目标不是时间信号T’而是时间信号T1’和时间信号T2’之外,学习设备110的频谱转换单元111、归一化单元112、量化单元113、编码单元114、出现概率计算单元115以及霍夫曼代码创建单元116的处理与图3的频谱转换单元51、归一化单元52、量化单元53、编码单元54、出现概率计算单元55以及霍夫曼代码创建单元56的处理相同。
具体地,在频谱转换单元111中,将时间信号T1’和时间信号T2’转换成频谱S1’和频谱S2’;在归一化单元112中,创建归一化的频谱NS1’和归一化的频谱NS2’;并且在量化单元113中,创建量化值Q1’和量化值Q2’。然后,在编码单元114中,对于量化值Q1’和量化值Q2’进行固定长度编码,并且在量化单元113中,调整量化信息W1’和量化信息W2’。
出现概率计算单元115基于量化值Q1’,将作为量化值Q’(量化值Q)获取的值设定为条目,并且针对每个条目来计数出现的次数。然后,出现概率计算单元115将全部时间信号T1’的针对每个条目的出现次数设定为每个条目的出现概率P1’,以提供给霍夫曼代码创建单元116。
此外,由于对量化值Q2’应用相同的处理,出现概率计算单元115针对每个条目来计数出现的次数,并且将全部时间信号T2’的针对每个条目的出现次数设定为每个条目的出现概率P2’,以提供给霍夫曼代码创建单元116。
霍夫曼代码创建单元116基于从出现概率计算单元115提供的每个条目的出现概率P1’来分配可变长度代码,并且准备码本CB1,关于量化值(其是每个条目)随着出现概率P1’减小,该可变长度代码的代码长度较长。码本CB1存储在图7的码本存储单元73和图8的码本存储单元93中。
此外,由于对从出现概率计算单元115提供的每个条目的出现概率P2’应用相同的处理,霍夫曼代码创建单元116分配可变长度代码,并且准备码本CB2,关于量化值(其是每个条目)随着出现概率P2’减小,该可变长度代码的代码长度较长。码本CB2存储在图7的码本存储单元74和图8的码本存储单元94中。
此外,学习设备110可以并行地进行对于时间信号T1’的处理和对于时间信号T2’的处理,或者可以以时移的方式(temporally shifted manner)来进行处理。
[对码本CB1和码本CB2的描述]
图10是示出了在码本CB1中分配给图4的条目(1)至条目(9)中的每个条目的可变长度代码的示例的图,图11是示出了在码本CB2中分配给图4的条目(1)至条目(9)中的每个条目的可变长度代码的示例的图。
此外,在图10的示例中,条目(1)至条目(8)的出现概率基本上彼此相同,并且条目(9)的出现概率与其他条目的出现概率相比是低的。
在这种情况下,如图10所示,例如,将3个比特的代码“000”、“001”、“010”、“011”、“100”、“101”以及“110”分别分配给条目(1)至条目(7)的量化值。此外,将4个比特的代码“1110”分配给条目(8)的量化值,并且将4个比特的代码“1110”分配给条目(9)的量化值。
因此,在图10的码本CB1中,将4个比特的代码分配给包括出现概率最低的量化值的两个量化值,并且将3个比特的代码分配给出现概率最高的量化值。因此,当基于图10的码本CB1进行可变长度编码时,与进行代码的比特数量总是4个比特的固定长度编码的情况相比可以改善编码效率。
此外,在图11的示例中,出现概率的高低按照条目(1)、条目(2)、条目(3)以及条目(4)的顺序,并且条目(5)至条目(9)的出现概率基本上彼此相同,并且显著低于条目(4)的出现概率。
在这种情况下,如图11所示,例如,将1个比特的代码“0”分配给条目(1)的量化值,并且将2个比特的代码“10”分配给条目(2)的量化值。此外,将3个比特的代码“110”分配给条目(3)的量化值,并且将4个比特的代码“1110”分配给条目(4)的量化值。
此外,将6个比特的代码“111100”分配给条目(5)的量化值,将6个比特的代码“111101”分配给条目(6)的量化值,并且将6个比特的代码“111110”分配给条目(7)的量化值。此外,将7个比特的代码“1111110”分配给条目(8)的量化值,并且将7个比特的代码“1111111”分配给条目(9)的量化值。
因此,在图11的码本CB2中,将7个比特的代码长度的代码分配给出现概率最低的两个量化值,并且将1个比特的代码长度的代码分配给出现概率最高的量化值。因此,当基于码本CB2进行可变长度编码时,与进行代码的比特数量总是4个比特的固定长度编码的情况相比可以改善编码效率。
如图10和图11所示,根据每个条目的出现概率的分布,应用于每个条目的代码长度是不同的。因此,学习设备110通过使用每个条目的出现概率的分布彼此不同的时间信号T1’和时间信号T2’来单独地准备码本CB1和码本CB2,从而根据时间信号T1’和时间信号T2’来提供合适的码本。结果是,编码器70可以根据与时间信号T对应的时间信号T1’或时间信号T2’来选择性地使用合适的码本,并且对于时间信号T进行编码,从而使得能够改善编码效率。
码本的数量不限于2个,并且不可能准备无限数量的码本,所以考虑编码效率和实用性来确定码本的数量。
<第一实施方式>
[根据编码器的第一实施方式的配置示例]
图12是示出了根据本技术所应用于的编码器的第一实施方式的配置示例的框图。
在图12示出的配置中,将相同的附图标记应用于与图1中的配置相同的配置。将适当地省略对其的重复描述。
图12的编码器130的配置与图1中的配置的不同之处在于设置了编码单元132和输出单元133,而不是编码单元14和输出单元15,并且新设置了限制单元131和码本存储单元134。当代码串B”的比特率小于预定值时,编码器130通过将预定量化值的出现概率限制为0来进行编码。
具体地,当代码串B”的比特率小于预定值时,编码器130的限制单元131将由归一化单元12获得的针对每个预定频带的归一化频谱NS当中的、非重要频带的归一化频谱NS的预定量化值的出现概率限制为0。
更具体地,基于针对每个预定频带的归一化频谱NS(频谱组)的水平(level)的最大值,当该最大值小于预定值时,限制单元131确定该频带是不重要的。另一方面,当该最大值大于或等于预定值时,限制单元131确定该频带是重要的。
然后,限制单元131将非重要频带的归一化频谱NS的水平保持在针对编码的每个维数一个或多个归一化频谱NS的比率,并且将剩余设定为0。也就是说,以针对编码的每个维数一个或多个归一化频谱NS的比率来激活非重要频带的归一化频谱NS,不激活剩余。此外,要被激活的归一化频谱例如是按照水平的递减顺序的、针对编码的每个维数的归一化频谱当中的一个或多个归一化频谱。限制单元131在限制归一化频谱NS3的出现概率之后将归一化频谱NS3提供给量化单元13。
另一方面,当代码串B”的比特率大于或等于预定值时,限制单元131直接将由归一化单元12获得的针对每个预定频带的归一化频谱NS提供给量化单元13。此外,限制单元131将表示出现概率是否被限制的限制信息CI提供给编码单元132和输出单元133。
编码单元132对于从量化单元13提供的归一化频谱NS的量化值Q或归一化频谱NS3的量化值Q3进行编码。具体地,当从限制单元131提供的限制信息CI表示没有限制出现概率时,编码单元71将量化值Q提供给码本存储单元16,从而获取与来自码本存储单元73的量化值Q对应的可变长度代码H。此外,当限制信息CI表示限制了出现概率时,编码单元132将量化值Q3提供给码本存储单元134,从而获取与来自码本存储单元134的量化值Q3对应的可变长度代码H3。
类似于图1的编码单元14,编码单元132基于可变长度代码H的比特数量等将比特数量N提供给量化单元13,或者基于可变长度代码H3的比特数量等将比特数量N3提供给量化单元13。当比特数量N小于或等于值NQ时,编码单元132将可变长度代码H提供给输出单元133,并且当比特数量N3小于或等于值NQ时,编码单元132将可变长度代码H3提供给输出单元133。
输出单元133复用来自归一化单元12的归一化系数F、来自量化单元13的归一化频谱NS的量化信息W或归一化频谱NS3的量化信息W3、来自限制单元131的限制信息CI、以及来自编码单元132的可变长度代码H或可变长度代码H3,并且输出因此获得的代码串B”。
码本存储单元134存储码本CB3(限制码本),在该码本CB3中作为量化值Q3获取的值与可变长度代码彼此相关联,并且由学习设备(后面描述)通过将用于学习的预定时间信号的预定量化值的出现概率限制为0来学习该码本CB3。当从编码单元132提供量化值Q3时,码本存储单元134读出码本CB3中与量化值Q3相关联的可变长度代码H3,并且将可变长度代码H3提供给编码单元132。
[对码本CB3的描述]
图13是示出了作为量化值Q3获取的值的示例的图。
在图13的示例中,与图4的情况类似地,编码是2维的,并且将作为编码目标的两个频谱的各个量化值Q3分别设定为A和B。此外,在图13的示例中,与图4的情况类似地,已获取的量化值A和量化值B的值分别是-1、0以及+1这三个值。
在这种情况下,当限制单元131保持与量化值A和量化值B对应的归一化频谱中的任何一个归一化频谱的水平,并且另一归一化频谱的水平为0时,量化值A和量化值B中的任何一个量化值必然变为0。因此,已获取的量化值(A,B)的组合是(1,0)、(-1,0)、(0,1)、(0,-1)以及(0,0),并且将(1,1)、(1,-1)、(-1,1)以及(-1,-1)的出现概率限制为0。也就是说,量化值A和量化值B的条目是条目(5)至(9)这5个条目。
此外,当量化值(A,B)的组合是(0,0)时,编码器130可以不进行编码。在这种情况下,量化值A和量化值B的条目是条目(5)至(8)这4个条目。
图14是示出了在码本CB3中分配给图13的条目(5)至条目(9)中的每个条目的可变长度代码的示例的图。
此外,在图14的示例中,条目(5)至条目(8)的出现概率基本上彼此相同,并且条目(9)的出现概率低于其他出现概率。
在这种情况下,如图14所示,例如,将2个比特的代码“00”、“01”以及“10”分别分配给条目(5)至条目(7)的量化值,并且将3个比特的代码“110”分配给条目(8)的量化值。此外,将3个比特的代码“111”分配给条目(9)的量化值。
如上所述,在图14的码本CB3中,将3个比特的代码分配给包括出现概率最低的量化值的两个量化值,并且将2个比特的代码分配给出现概率最高的量化值。就此而言,当对于量化值Q3进行二维固定长度编码时,固定长度代码的比特数量总是3个比特,以3个比特能够示出5个图案。因此,当基于图14的码本CB3进行可变长度编码时,与进行固定长度编码的情况相比可以改善编码效率。
此外,由于与图10的码本相比,图14的码本中的条目的数量小,所以与图10的码本相比,要分配给每个量化值的可变长度代码的代码长度短。具体地,在图14的码本中,分配给包括出现概率最低的量化值的两个量化值的代码长度为3个比特,但是在图10的码本中,代码长度为4个比特。此外,在图14的码本中,分配给出现概率最高的量化值的代码长度为2个比特,但是在图10的码本中,代码长度为3个比特。因此,当通过限制单元131限制出现概率时,可以改善编码效率。
[对编码器的处理的描述]
图15是用于描述图12的编码器130的编码处理的流程图。
在图15的步骤S31中,编码器130的频谱转换单元11对于从外部输入的时间信号T进行时间-频率转换,并且将时间信号T转换成频谱S。频谱转换单元11将频谱S提供给归一化单元12。
在步骤S32中,归一化单元12根据从频谱转换单元11提供的频谱S,针对每个预定频带来确定频谱S的归一化系数F,并且通过使用归一化系数F来归一化频谱S。然后,归一化单元12将因此获得的归一化频谱NS提供给限制单元131,并且将归一化系数F提供给输出单元133。
在步骤S33中,限制单元131确定预设的代码串B”的比特率是否低于预定值。在步骤S33中,当代码串B”的比特率低于预定值时,在步骤S34中,限制单元131将表示出现概率被限制的限制信息CI提供给输出单元133。
在步骤S35中,限制单元131将从归一化单元12提供的针对每个预定频带的归一化频谱NS当中的非重要频带的归一化频谱NS的预定量化值的出现概率限制为0。然后,限制单元131在限制归一化频谱NS3的出现概率之后,将归一化频谱NS3提供给量化单元13。
在步骤S36中,量化单元13基于量化信息W3来量化从限制单元131提供的归一化频谱NS3,并且将因此获得的量化值Q3提供给编码单元132。此时,量化单元13获取响应于量化值Q3而从编码单元132反馈的比特数量N3,并且调整量化信息W3,使得比特数量N3是预定值。量化单元13将调整之后的量化信息W3提供给输出单元133。
在步骤S37中,编码单元132基于存储在码本存储单元134中的码本CB3对于从量化单元13提供的量化值Q3进行编码。然后,编码单元132基于因此获得的可变长度代码H3的比特数量等,将比特数量N3提供给量化单元13,并且当比特数量N3小于或等于值NQ时将可变长度代码H3提供给输出单元133。
另一方面,在步骤S33中,当代码串B”的比特率不小于预定值,也就是说,代码串B”的比特率大于或等于预定值时,处理前进到步骤S38。在步骤S38中,限制单元131将表示没有限制出现概率的限制信息CI提供给输出单元133。此外,限制单元131直接将从归一化单元12提供的针对每个预定频带的归一化频谱NS提供给量化单元13。
在步骤S39中,量化单元13基于量化信息W来量化从限制单元131提供的归一化频谱NS,并且将因此获得的量化值Q提供给编码单元132。此时,量化单元13获取响应于量化值Q而从编码单元132反馈的比特数量N,并且调整量化信息W,使得比特数量N是预定值。量化单元13将调整之后的量化信息W提供给输出单元133。
在步骤S40中,编码单元132基于存储在码本存储单元16中的码本CB对于从量化单元13提供的量化值Q进行编码。然后,编码单元132基于因此获得的可变长度代码H的比特数量等,将比特数量N提供给量化单元13,并且当比特数量N小于或等于值NQ时将可变长度代码H提供给输出单元133。
在步骤S41中,输出单元133复用来自归一化单元12的归一化系数F、来自量化单元13的量化信息W或量化信息W3、来自限制单元131的限制信息CI、以及来自编码单元14的可变长度代码H或可变长度代码H3。输出单元133输出因此获得的代码串B”。
[对本发明的效果的描述]
图16是示出了与图1的编码器10或图7的编码器70所编码的量化值对应的归一化频谱的图,以及图17是示出了与图12的编码器130所编码的量化值对应的归一化频谱的图。
此外,在图16和图17中,代码串的比特率是低于预定值(例如,128kbps)的16kbps、64kbps、32kbps等。此外,在图16和图17的图表中,横轴表示归一化频谱的频谱号,并且纵轴表示增益和噪声基底(noisefloor),该增益是针对归一化频谱的每个预定频带的最高水平。
如图16的A或图16的C所示,在图1的编码器10或图7的编码器70中,当全部频带的增益相对小时,对于预定频带的归一化频谱的量化值进行可变长度编码。
然而,如图16的B所示,当预定频带的增益相对大时,由于代码串的不足的比特率,与要进行可变长度编码的量化值对应的频带被减小,并且噪声基底的水平根据量化精度的降低而增大。
此外,当图16的A或图16的C的状态,以及图16的B的状态交替发生时,与要进行可变长度编码的量化值对应的频带被改变,并且听众感受到相当不舒服的噪声水平。
就此而言,在图17的编码器130中,如在图17的A至图17的C中示出的,确定出与归一化频谱对应的频带中的每个频带是否是重要的,并且仅对于非重要频带的归一化频谱来限制量化值的出现概率。
因此,如通过图17的向上方向的箭头所示的,降低了非重要频带的归一化频谱的量化精度,并且增大了噪声基底的水平,但是改善了归一化频谱的量化值的编码效率。
因此,如通过图17的向下方向的箭头所示的,可以通过根据编码效率的改善而生成的冗余比特来改善重要频带的归一化频谱的量化精度,从而使得能够减小归一化频谱的噪声基底的水平。结果是,可以改善重要频带的听觉质量。
此外,如图17的B所示,当预定频带的增益相对大时,可以通过根据编码效率的改善而生成的冗余比特,对于正常频带的归一化频谱的量化值进行可变长度编码。结果是,与要进行可变长度编码的量化值对应的频带不被改变,从而防止听众感受到相当不舒服的噪声水平。
如上所示,编码器130将归一化频谱NS的预定量化值的出现概率限制为0,并且基于码本CB3对于限制之后的归一化频谱NS3的量化值Q3进行编码,从而使得能够改善编码效率。
此外,编码器130首先可以基于码本CB(非限制码本)在不进行限制的情况下进行编码,并且当由于减小与作为编码目标的量化值对应的频带的需求增大,此时的比特数量N变得更大时,在限制的情况下再次进行编码,从而将结果设定为最终的编码结果,而不是确定是否基于代码串B”的比特率来限制出现概率。
[根据解码器的第一实施方式的配置示例]
图18是示出了用于解码从图12的编码器130输出的代码串B”的解码器的配置示例的框图。
在图18示出的配置中,将相同的附图标记应用于与图2中的配置相同的配置。将适当地省略对其的重复描述。
图18的解码器150的配置与图2中的配置的不同之处在于设置了接收单元151和解码单元152,而不是接收单元31和解码单元32,并且新设置了码本存储单元153。
解码器150的接收单元151接收从图12的编码器130输出的代码串B”。接收单元151将代码串B”分解成可变长度代码H或可变长度代码H3、限制信息CI、量化信息W或量化信息W3、以及归一化系数F。接收单元151将可变长度代码H或可变长度代码H3以及限制信息CI提供给解码单元152,将量化信息W或量化信息W3提供给反量化单元33,并且将归一化系数F提供给反归一化单元34。
解码单元152基于从接收单元151提供的限制信息CI对于可变长度代码H或可变长度代码H3进行解码。具体地,当限制信息CI是表示没有进行限制的信息时,解码单元152将可变长度代码H提供给码本存储单元36,从而获取与可变长度代码H对应的量化值Q作为解码结果。另一方面,当限制信息CI是表示进行了限制的信息时,解码单元152将可变长度代码H3提供给码本存储单元153,从而获取与可变长度代码H3对应的量化值Q3作为解码结果。解码单元152将作为解码结果的量化值Q或量化值Q3提供给反量化单元33。
码本存储单元153存储与存储在图12的码本存储单元134中的码本CB3相同的码本CB3。当从解码单元152提供可变长度代码H3时,码本存储单元153读出码本CB3中与可变长度代码H3相关联的量化值Q3,并且将量化值Q3提供给解码单元152。
此外,作为量化值Q或量化值Q3的反量化结果的归一化频谱NS、作为归一化频谱NS的反量化结果的频率频谱S、以及作为解码器150的频率频谱S的频率-时间转换结果的时间信号T包括根据量化的误差,并且因此不完全与编码器130的归一化频谱NS、频率频谱S以及时间信号T一致。
[对解码器的处理的描述]
图19是用于描述图18的解码器150的解码处理的流程图。
在图19的步骤S50中,解码器150的接收单元151接收从图12的编码器130输出的代码串B”。
在步骤S51中,接收单元151将代码串B”分解成可变长度代码H或可变长度代码H3、限制信息CI、量化信息W或量化信息W3、以及归一化系数F。接收单元151将可变长度代码H或可变长度代码H3以及限制信息CI提供给解码单元152,将量化信息W或量化信息W3提供给反量化单元33,并且将归一化系数F提供给反归一化单元34。
在步骤S52中,解码单元152确定从接收单元151提供的限制信息CI是否表示进行了限制。
在步骤S52中,当限制信息CI表示进行了限制时,在步骤S53中,解码单元152基于存储在码本存储单元153中的码本CB3对于可变长度代码H3进行解码。解码单元152将作为解码结果的量化值Q3提供给反量化单元33,并且处理前进到步骤S55。
另一方面,在步骤S52中,当限制信息CI没有表示进行了限制时,在步骤S54中,解码单元152基于存储在码本存储单元36中的码本CB对于可变长度代码H进行解码。解码单元152将作为解码结果的量化值Q提供给反量化单元33,并且处理前进到步骤S55。
在步骤S55中,反量化单元33基于从接收单元151提供的量化信息W来反向量化从解码单元152提供的量化值Q,或者反量化单元33基于从接收单元151提供的量化信息W3来反向量化从解码单元152提供的量化值Q3。反量化单元33将作为反量化结果获得的归一化频谱NS提供给反归一化单元34。
在步骤S56中,反归一化单元34通过使用从接收单元151提供的归一化系数F,针对每个预定频带来反向归一化从反量化单元33提供的归一化频谱NS,并且将因此获得的频率频谱S提供给反向频谱转换单元35。
在步骤S57中,反向频谱转换单元35对于从反归一化单元34提供的频率频谱S进行频率-时间转换,并且将结果输出作为时间信号T。
如上所述,由于解码器150基于码本CB3对于可变长度代码H3进行解码,所以可以对于可变长度代码H3进行解码,在该可变长度代码H3中,通过将归一化频谱NS的预定量化值的出现概率限制为0来改善编码效率。
[学习设备的配置示例]
图20是示出了用于学习码本CB和码本CB3的学习设备的配置示例的框图。
在图20示出的配置中,将相同的附图标记应用于与图3中的配置相同的配置。将适当地省略对其的重复描述。
图20的学习设备170的配置与图3中的配置的不同之处在于设置了量化单元172、编码单元173、出现概率计算单元174以及霍夫曼代码创建单元175,而不是量化单元53、编码单元54、出现概率计算单元55以及霍夫曼代码创建单元56,并且新设置了限制单元171。
学习设备170的限制单元171直接将由归一化单元52获得的针对每个预定频带的归一化频谱NS’提供给量化单元172。此外,类似于图12的限制单元131,限制单元171将由归一化单元52获得的针对每个预定频带的归一化频谱NS’当中的非重要频带的归一化频谱NS’的预定量化值的出现概率限制为0。然后,限制单元171将限制之后的归一化频谱NS3’提供给量化单元172。
类似于图3的量化单元53,量化单元172基于量化信息W’来量化从限制单元171提供的归一化频谱NS’,并且将因此获得的量化值Q’提供给编码单元173。此时,类似于量化单元53,量化单元172获取响应于量化值Q’而从编码单元173反馈的比特数量N’,并且调整量化信息W’,使得比特数量N’是预定值。量化单元172将最终的量化值Q’提供给出现概率计算单元174。
此外,由于相同处理应用于归一化频谱NS3’,量化单元172基于量化信息W3’来量化归一化频谱NS3’,并且将因此获得的量化值Q3’提供给编码单元173。此时,量化单元172获取响应于量化值Q3’而从编码单元173反馈的比特数量N3’,并且调整量化信息W3’,使得比特数量N3’是预定值。量化单元172将最终的量化值Q3’提供给出现概率计算单元174。
编码单元173对于从量化单元172提供的量化值Q’和量化值Q3’进行固定长度编码。编码单元173通过将量化值Q’的固定长度代码的比特数量NH’、量化信息W’的比特数量NW’、以及归一化系数F’的比特数量NF’相加,来计算作为比特数量N’的值,并且将该值提供给量化单元172。类似地,编码单元173通过将量化值Q3’的固定长度代码的比特数量NH3’、量化信息W3’的比特数量NW3’、以及比特数量NF’相加,来计算作为比特数量N3’的值,并且将该值提供给量化单元172。
因此,量化单元172调整量化信息W’,使得比特数量N’小于或等于与设定代码串的比特率对应的值,并且调整量化信息W3’,使得比特数量N3’小于或等于与设定代码串的比特率对应的值。
出现概率计算单元174基于从量化单元172提供的量化值Q’,将作为量化值Q’(量化值Q)获取的值设定为条目,并且针对每个条目来计数出现的次数。出现概率计算单元174将全部时间信号T’的针对每个条目的出现次数提供给霍夫曼代码创建单元175,作为每个条目的出现概率P。
此外,出现概率计算单元174基于从量化单元172提供的量化值Q3’,将作为量化值Q3’(量化值Q3)获取的值设定为条目,并且针对每个条目来计数出现的次数。出现概率计算单元174将全部时间信号T’的针对每个条目的出现次数提供给霍夫曼代码创建单元175,作为每个条目的出现概率P3。此外,如图13中所描述的,与出现概率P3对应的条目的数量小于与出现概率P对应的条目的数量。
霍夫曼代码创建单元175基于从出现概率计算单元174提供的每个条目的出现概率P来分配可变长度代码,关于量化值(其是每个条目)随着出现概率P减小,该可变长度代码的代码长度较长。霍夫曼代码创建单元175准备其中各量化值与分配给量化值的可变长度代码彼此相关联的码本CB。码本CB存储在图12的码本存储单元16和图18的码本存储单元36中。
此外,霍夫曼代码创建单元175基于从出现概率计算单元174提供的每个条目的出现概率P3来分配可变长度代码,关于量化值(其是每个条目)随着出现概率P3减小,该可变长度代码的代码长度较长。霍夫曼代码创建单元175准备其中各量化值与分配给量化值的可变长度代码彼此相关联的码本CB3。码本CB3是与码本CB相比条目数量较小的码本,并且码本CB3存储在图12的码本存储单元134和图18的码本存储单元153中。
[对学习设备的处理的描述]
由于除了将由归一化单元52获得的归一化频谱NS’通过限制单元171提供给量化单元172之外,图20的学习设备170的码本CB的准备处理与图6的准备处理相类似,所以仅描述码本CB3的准备处理。
图21是用于描述学习设备170的码本CB3的准备处理的流程图。
由于图21的步骤S71至步骤S73的处理与图6的步骤S11至步骤S13的处理相类似,所以将省略对其的描述。
在步骤S74中,限制单元171将从归一化单元52提供的针对每个预定频带的归一化频谱NS’当中的非重要频带的归一化频谱NS’的预定量化值的出现概率限制为0。然后,限制单元171将限制之后的归一化频谱NS3’提供给量化单元172。
在步骤S75中,量化单元172基于量化信息W3’来量化从限制单元171提供的归一化频谱NS3’,并且将因此获得的量化值Q3’提供给编码单元173。
在步骤S76中,编码单元173对于从量化单元172提供的量化值Q3’进行固定长度编码。编码单元173通过将固定长度代码的比特数量NH3’、量化信息W3’的比特数量NW3’、以及归一化系数F3’的比特数量NF3’相加,来计算作为比特数量N3’的值,并且将该值提供给量化单元172。
在步骤S77中,确定比特数量N3’是否小于或等于与设定代码串的比特率对应的值。在步骤S77中,当比特数量N3’不是小于或等于与设定代码串的比特率对应的值时,量化单元172改变量化信息W3’。然后,处理返回到步骤S75,并且重复步骤S75至步骤S77的处理,直到比特数量N3’小于或等于与设定代码串的比特率对应的值为止。
另一方面,在步骤S77中,当比特数量N3’小于或等于与设定代码串的比特率对应的值时,量化单元172将量化值Q3’提供给出现概率计算单元174。
然后,在步骤S78中,出现概率计算单元174基于从量化单元172提供的量化值Q3’,将作为量化值Q3’(量化值Q3)获取的值设定为条目,并且针对每个条目来计数出现的次数。
在步骤S79中,学习设备170确定是否对于全部时间信号T’计数了针对每个条目的出现次数。在步骤S79中,当还没有对于全部时间信号T’来计数针对每个条目的出现次数时,处理返回到步骤S72,并且重复步骤S72至步骤S79的处理。
另一方面,在步骤S79中,当对于全部时间信号T’计数了针对每个条目的出现次数时,出现概率计算单元174将对于全部时间信号T’的针对每个条目的出现次数提供给霍夫曼代码创建单元175,作为每个条目的出现概率P3。
然后,在步骤S80中,霍夫曼代码创建单元175基于从出现概率计算单元174提供的每个条目的出现概率P3来分配可变长度代码,关于量化值(其是每个条目)随着出现概率P3减小,该可变长度代码的代码长度较长。
在步骤S81中,霍夫曼代码创建单元175准备其中各量化值与分配给量化值的可变长度代码彼此相关联的码本CB3。码本CB3存储在码本存储单元134(图12)和码本存储单元153(图18)中。
此外,在学习码本CB3中所使用的用于学习的时间信号和在学习码本CB中所使用的用于学习的时间信号可以彼此不同。
此外,也可以将本技术应用于处理目标是除了听觉信号之外的信号的编码器或解码器。
[对本发明所应用于的计算机的描述]
能够通过硬件并且能够通过软件来执行上述一系列处理。当通过软件来执行一系列处理时,构成软件的程序安装在计算机中。这里,计算机的示例包括其中结合了专用硬件的计算机、通过安装各种程序使得能够执行各种功能的计算机,例如通用个人计算机等。
图22是示出了通过程序来执行上述一系列处理的计算机的硬件的配置示例的框图。
在计算机中,中央处理单元(CPU)201、只读存储器(ROM)202以及随机存取存储器(RAM)203通过总线204彼此连接。
总线204进一步与输入输出接口205连接。输入输出接口205与输入单元206、输出单元207、存储单元208、通信单元209以及驱动器210连接。
输入单元206包括键盘、鼠标、麦克风等。输出单元207包括显示器、扬声器等。存储单元208包括硬盘、非易失性存储器等。通信单元209包括网络接口等。驱动器210对可移动介质211(例如磁盘、光盘、磁光盘或半导体存储器)进行驱动。
在如上所述配置的计算机中,CPU 201通过输入输出接口205和总线204来加载并执行例如存储在存储单元208和RAM 203中的程序,从而进行上述一系列处理。
例如,由计算机(CPU 201)执行的程序例如能够通过被记录在作为封装介质等的可移动介质211中来提供。此外,能够经由有线传输介质或无线传输介质(例如局域网、因特网以及数字卫星广播)来提供程序。
在计算机中,能够通过经由输入输出接口205将可移动介质211安装在驱动器210上,来将程序安装在存储单元208中。此外,能够经由有线传输介质或无线传输介质由通信单元209来接收程序,并且能够在存储单元208中安装程序。此外,能够在ROM 202或存储单元208中预先安装程序。
此外,由计算机执行的程序可以是根据本文描述的步骤以时间次序来执行处理的程序,或者可以是并行地或者在必要定时处(例如调用的定时处)进行处理的程序。
此外,本技术的实施方式不限于上述实施方式,并且在不偏离本技术的主旨的范围内可以不同地改变本技术的实施方式。
例如,本技术可以具有云计算的配置,在云计算中一个功能被划分并且由多个设备经由网络来共同地处理。
此外,不仅能够通过一个设备而且能够通过多个设备来进行在上述流程图中描述的各步骤,通过该多个设备来划分步骤。
此外,当多个处理被包括在一个步骤中时,不仅能够通过一个设备而且能够通过多个设备来进行包括在一个步骤中的多个处理,通过该多个设备来划分处理。
此外,能够如下地配置本技术。
(1)一种编码器,包括:
限制单元,所述限制单元将信号的预定量化值的出现概率限制为0;以及
编码单元,所述编码单元基于限制码本,关于由所述限制单元限制的所述信号的所述量化值进行编码,所述限制码本是具有可变长度代码的码本,所述可变长度代码是关于除了与所述信号对应的用于学习的信号的预定量化值之外的多个量化值中的每个量化值而分配的,并且随着所述出现概率减小,所述可变长度代码的代码长度更长,所述用于学习的信号的所述预定量化值的所述出现概率被限制为0。
(2)根据(1)所述的编码器,还包括:
输出单元,所述输出单元输出由所述编码单元作为编码结果获得的代码,
其中,当所述信号的比特率小于预定值时,所述限制单元将所述信号的所述预定量化值的所述出现概率限制为0,以及
所述输出单元输出所述代码,以及表示所述限制单元是否进行限制的限制信息。
(3)根据(1)所述的编码器,还包括:
输出单元,所述输出单元输出由所述编码单元作为编码结果获得的代码,
其中,所述编码单元基于非限制码本,关于没有被所述限制单元限制的所述信号的所述量化值进行编码,所述非限制码本是具有可变长度代码的码本,所述可变长度代码是关于所述用于学习的信号的多个预定量化值中的每个量化值而分配的,并且随着所述出现概率减小,所述可变长度代码的代码长度更长,所述用于学习的信号的所述预定量化值的所述出现概率不被限制,
当没有被所述限制单元限制并且经历所述编码单元的编码的所述信号的所述量化值的所述代码为大的量值时,所述限制单元将所述信号的所述预定量化值的所述出现概率限制为0,
所述编码单元基于所述限制码本,关于由所述限制单元限制的所述信号的所述量化值进行编码,并且将为此获得的所述代码设定为最终代码,以及
所述输出单元输出所述最终代码,以及表示所述限制单元是否进行限制的限制信息。
(4)根据(1)所述的编码器,还包括:
输出单元,所述输出单元输出由所述编码单元作为编码结果获得的代码,
其中,当所述信号的频谱组的水平小于预定值时,所述限制单元将所述信号的所述频谱组的所述预定量化值的所述出现概率限制为0,以及
所述输出单元输出所述代码以及表示所述限制单元是否进行限制的限制信息。
(5)根据(1)至(4)中任一项所述的编码器,
其中,所述限制单元通过激活所述信号的所述频谱组中的预定频谱并且不激活剩余频谱,来将所述信号的所述频谱组的所述预定量化值的所述出现概率限制为0。
(6)根据(5)所述的编码器,
其中,所述限制单元通过将剩余频谱的水平设定为0来不激活所述剩余频谱。
(7)根据(5)所述的编码器,
其中,所述预定频谱是所述频谱组的频谱当中的、按照水平的递减顺序的一个或更多个频谱。
(8)一种编码方法,包括:
限制步骤,其中,编码器将信号的预定量化值的出现概率限制为0;以及
编码步骤,其中,所述编码器基于限制码本,关于通过所述限制步骤的处理限制的所述信号的所述量化值进行编码,所述限制码本是具有可变长度代码的码本,所述可变长度代码是关于除了与所述信号对应的用于学习的信号的预定量化值之外的多个量化值中的每个量化值而分配的,并且随着所述出现概率减小,所述可变长度代码的代码长度更长,所述用于学习的信号的所述预定量化值的所述出现概率被限制为0。
(9)一种程序,所述程序用于使计算机用作为:
限制单元,所述限制单元将信号的预定量化值的出现概率限制为0;以及
编码单元,所述编码单元基于限制码本,关于由所述限制单元限制的所述信号的所述量化值进行编码,所述限制码本是具有可变长度代码的码本,所述可变长度代码是关于除了与所述信号对应的用于学习的信号的预定量化值之外的多个量化值中的每个量化值而分配的,并且随着所述出现概率减小,所述可变长度代码的代码长度更长,所述用于学习的信号的所述预定量化值的所述出现概率被限制为0。
(10)一种解码器,包括:
接收单元,所述接收单元接收作为编码目标的信号的量化值,所述信号的预定量化值的出现概率被限制为0,并且所述量化值是基于限制码本而编码的,所述限制码本是具有可变长度代码的码本,所述可变长度代码是关于除了与所述信号对应的用于学习的信号的预定量化值之外的多个量化值中的每个量化值而分配的,并且随着所述出现概率减小,所述可变长度代码的代码长度更长,所述用于学习的信号的所述预定量化值的所述出现概率被限制为0;以及
解码单元,所述解码单元基于所述限制码本,关于由所述接收单元接收的所述量化值进行解码。
(11)根据(10)所述的解码器,
其中,所述接收单元接收所述信号的所述量化值,以及表示是否进行了限制的限制信息,所述信号的所述预定量化值的所述出现概率被限制为0并且所述量化值是基于所述限制码本而编码的,以及
当所述限制信息表示进行了所述限制时,所述解码单元基于所述限制码本,关于由所述接收单元接收的所述量化值进行所述解码。
(12)一种解码方法,包括:
接收步骤,其中,解码器接收作为编码目标的信号的量化值,所述信号的预定量化值的出现概率被限制为0,并且所述量化值是基于限制码本而编码的,所述限制码本是具有可变长度代码的码本,所述可变长度代码是关于除了与所述信号对应的用于学习的信号的预定量化值之外的多个量化值中的每个量化值而分配的,并且随着所述出现概率减小,所述可变长度代码的代码长度更长,所述用于学习的信号的所述预定量化值的所述出现概率被限制为0;以及
解码步骤,其中,所述解码器基于所述限制码本,关于通过所述接收步骤的处理接收的所述量化值进行解码。
(13)一种程序,所述程序用于使计算机用作为:
接收单元,所述接收单元接收作为编码目标的信号的量化值,所述信号的预定量化值的出现概率被限制为0,并且所述量化值是基于限制码本而编码的,所述限制码本是具有可变长度代码的码本,所述可变长度代码是关于除了与所述信号对应的用于学习的信号的预定量化值之外的多个量化值中的每个量化值而分配的,并且随着所述出现概率减小,所述可变长度代码的代码长度更长,所述用于学习的信号的所述预定量化值的所述出现概率被限制为0;以及
解码单元,所述解码单元基于所述限制码本,关于由所述接收单元接收的所述量化值进行解码。
附图标记列表
130 编码器,131 限制单元,132 编码单元,133 输出单元,150 解码器,151 接收单元,152 解码单元。
Claims (13)
1.一种编码器,包括:
限制单元,所述限制单元将信号的预定量化值的出现概率限制为0;以及
编码单元,所述编码单元基于限制码本,关于由所述限制单元限制的所述信号的所述量化值进行编码,所述限制码本是具有可变长度代码的码本,所述可变长度代码是关于除了与所述信号对应的用于学习的信号的预定量化值之外的多个量化值中的每个量化值而分配的,并且随着所述出现概率减小,所述可变长度代码的代码长度更长,所述用于学习的信号的所述预定量化值的所述出现概率被限制为0。
2.根据权利要求1所述的编码器,还包括:
输出单元,所述输出单元输出由所述编码单元作为编码结果获得的代码,
其中,当所述信号的比特率小于预定值时,所述限制单元将所述信号的所述预定量化值的所述出现概率限制为0,以及
所述输出单元输出所述代码,以及表示所述限制单元是否进行限制的限制信息。
3.根据权利要求1所述的编码器,还包括:
输出单元,所述输出单元输出由所述编码单元作为编码结果获得的代码,
其中,所述编码单元基于非限制码本,关于没有被所述限制单元限制的所述信号的所述量化值进行编码,所述非限制码本是具有可变长度代码的码本,所述可变长度代码是关于所述用于学习的信号的多个预定量化值中的每个量化值而分配的,并且随着所述出现概率减小,所述可变长度代码的代码长度更长,其中所述用于学习的信号的所述预定量化值的所述出现概率不被限制,
当没有被所述限制单元限制并且经历所述编码单元的编码的所述信号的所述量化值的所述代码为大的量值时,所述限制单元将所述信号的所述预定量化值的所述出现概率限制为0,
所述编码单元基于所述限制码本,关于由所述限制单元限制的所述信号的所述量化值进行编码,并且将为此获得的所述代码设定为最终代码,以及
所述输出单元输出所述最终代码,以及表示所述限制单元是否进行限制的限制信息。
4.根据权利要求1所述的编码器,还包括:
输出单元,所述输出单元输出由所述编码单元作为编码结果获得的代码,
其中,当所述信号的频谱组的水平小于预定值时,所述限制单元将所述信号的所述频谱组的所述预定量化值的所述出现概率限制为0,以及
所述输出单元输出所述代码以及表示所述限制单元是否进行限制的限制信息。
5.根据权利要求1所述的编码器,
其中,所述限制单元通过激活所述信号的所述频谱组中的预定频谱并且不激活剩余频谱,来将所述信号的所述频谱组的所述预定量化值的所述出现概率限制为0。
6.根据权利要求5所述的编码器,
其中,所述限制单元通过将剩余频谱的水平设定为0来不激活所述剩余频谱。
7.根据权利要求5所述的编码器,
其中,所述预定频谱是所述频谱组的频谱当中的、按照水平的递减顺序的一个或更多个频谱。
8.一种编码方法,包括:
限制步骤,其中,编码器将信号的预定量化值的出现概率限制为0;以及
编码步骤,其中,所述编码器基于限制码本,关于通过所述限制步骤的处理限制的所述信号的所述量化值进行编码,所述限制码本是具有可变长度代码的码本,所述可变长度代码是关于除了与所述信号对应的用于学习的信号的预定量化值之外的多个量化值中的每个量化值而分配的,并且随着所述出现概率减小,所述可变长度代码的代码长度更长,所述用于学习的信号的所述预定量化值的所述出现概率被限制为0。
9.一种程序,所述程序用于使计算机用作为:
限制单元,所述限制单元将信号的预定量化值的出现概率限制为0;以及
编码单元,所述编码单元基于限制码本,关于由所述限制单元限制的所述信号的所述量化值进行编码,所述限制码本是具有可变长度代码的码本,所述可变长度代码是关于除了与所述信号对应的用于学习的信号的预定量化值之外的多个量化值中的每个量化值而分配的,并且随着所述出现概率减小,所述可变长度代码的代码长度更长,所述用于学习的信号的所述预定量化值的所述出现概率被限制为0。
10.一种解码器,包括:
接收单元,所述接收单元接收作为编码目标的信号的量化值,所述信号的预定量化值的出现概率被限制为0,并且所述量化值是基于限制码本而编码的,所述限制码本是具有可变长度代码的码本,所述可变长度代码是关于除了与所述信号对应的用于学习的信号的预定量化值之外的多个量化值中的每个量化值而分配的,并且随着所述出现概率减小,所述可变长度代码的代码长度更长,所述用于学习的信号的所述预定量化值的所述出现概率被限制为0;以及
解码单元,所述解码单元基于所述限制码本,关于由所述接收单元接收的所述量化值进行解码。
11.根据权利要求10所述的解码器,
其中,所述接收单元接收所述信号的所述量化值,以及表示是否进行了限制的限制信息,所述信号的所述预定量化值的所述出现概率被限制为0并且所述量化值是基于所述限制码本而编码的,以及
当所述限制信息表示进行了所述限制时,所述解码单元基于所述限制码本,关于由所述接收单元接收的所述量化值进行所述解码。
12.一种解码方法,包括:
接收步骤,其中,解码器接收作为编码目标的信号的量化值,所述信号的预定量化值的出现概率被限制为0,并且所述量化值是基于限制码本而编码的,所述限制码本是具有可变长度代码的码本,所述可变长度代码是关于除了与所述信号对应的用于学习的信号的预定量化值之外的多个量化值中的每个量化值而分配的,并且随着所述出现概率减小,所述可变长度代码的代码长度更长,所述用于学习的信号的所述预定量化值的所述出现概率被限制为0;以及
解码步骤,其中,所述解码器基于所述限制码本,关于通过所述接收步骤的处理接收的所述量化值进行解码。
13.一种程序,所述程序用于使计算机用作为:
接收单元,所述接收单元接收作为编码目标的信号的量化值,所述信号的预定量化值的出现概率被限制为0,并且所述量化值是基于限制码本而编码的,所述限制码本是具有可变长度代码的码本,所述可变长度代码是关于除了与所述信号对应的用于学习的信号的预定量化值之外的多个量化值中的每个量化值而分配的,并且随着所述出现概率减小,所述可变长度代码的代码长度更长,所述用于学习的信号的所述预定量化值的所述出现概率被限制为0;以及
解码单元,所述解码单元基于所述限制码本,关于由所述接收单元接收的所述量化值进行解码。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012006972 | 2012-01-17 | ||
JP2012-006972 | 2012-01-17 | ||
PCT/JP2013/050208 WO2013108685A1 (ja) | 2012-01-17 | 2013-01-09 | 符号化装置および符号化方法、復号装置および復号方法、プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
CN104041054A true CN104041054A (zh) | 2014-09-10 |
Family
ID=48799111
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201380005187.8A Pending CN104041054A (zh) | 2012-01-17 | 2013-01-09 | 编码设备及编码方法、解码设备及解码方法以及程序 |
Country Status (4)
Country | Link |
---|---|
US (3) | US9754599B2 (zh) |
JP (2) | JP5846220B2 (zh) |
CN (1) | CN104041054A (zh) |
WO (1) | WO2013108685A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112400203A (zh) * | 2018-06-21 | 2021-02-23 | 索尼公司 | 编码设备、编码方法、解码设备、解码方法、以及程序 |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6822121B2 (ja) * | 2016-12-19 | 2021-01-27 | ソニー株式会社 | 画像処理装置、画像処理方法及びプログラム |
JP7115353B2 (ja) * | 2019-02-14 | 2022-08-09 | 株式会社Jvcケンウッド | 処理装置、処理方法、再生方法、及びプログラム |
CN113838453B (zh) * | 2021-08-17 | 2022-06-28 | 北京百度网讯科技有限公司 | 语音处理方法、装置、设备和计算机存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1132334A (ja) * | 1997-07-14 | 1999-02-02 | Oki Electric Ind Co Ltd | 画像符号化復号化装置及びその方法 |
CN1397137A (zh) * | 2000-10-19 | 2003-02-12 | 索尼公司 | 数据处理装置 |
US20090161697A1 (en) * | 2007-12-19 | 2009-06-25 | General Instrument Corporation | Method and System for Interleaving Video and Data for Transmission over a Network at a Selected Bit Rate |
CN102045562A (zh) * | 2009-10-09 | 2011-05-04 | 索尼公司 | 编码设备、解码设备、信息处理系统、编码方法和程序 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05110450A (ja) * | 1991-10-18 | 1993-04-30 | Canon Inc | 符号生成装置 |
JPH07212243A (ja) * | 1994-01-13 | 1995-08-11 | Fuji Photo Film Co Ltd | 可変長符号の符号化方法およびその装置 |
JPH11215508A (ja) * | 1998-01-27 | 1999-08-06 | Sanyo Electric Co Ltd | 符号発生量制御方法およびその方法を用いた符号化装置 |
JP2001082878A (ja) | 1999-09-13 | 2001-03-30 | Tsunehisa Matsuoka | 被乾燥処理物の乾燥処理方法 |
JP2003233397A (ja) * | 2002-02-12 | 2003-08-22 | Victor Co Of Japan Ltd | オーディオ符号化装置、オーディオ符号化プログラム及びオーディオ符号化データ伝送装置 |
JP3900000B2 (ja) * | 2002-05-07 | 2007-03-28 | ソニー株式会社 | 符号化方法及び装置、復号方法及び装置、並びにプログラム |
CN100493199C (zh) * | 2003-06-16 | 2009-05-27 | 松下电器产业株式会社 | 编码装置、编码方法和码本 |
JP5304504B2 (ja) * | 2009-07-17 | 2013-10-02 | ソニー株式会社 | 信号符号化装置、信号復号装置、信号処理システム、これらにおける処理方法およびプログラム |
-
2013
- 2013-01-09 WO PCT/JP2013/050208 patent/WO2013108685A1/ja active Application Filing
- 2013-01-09 JP JP2013554270A patent/JP5846220B2/ja active Active
- 2013-01-09 CN CN201380005187.8A patent/CN104041054A/zh active Pending
- 2013-01-09 US US14/363,456 patent/US9754599B2/en active Active
-
2015
- 2015-11-18 JP JP2015225889A patent/JP6032509B2/ja active Active
-
2017
- 2017-08-18 US US15/680,332 patent/US10255925B2/en active Active
-
2019
- 2019-01-15 US US16/248,281 patent/US10607618B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1132334A (ja) * | 1997-07-14 | 1999-02-02 | Oki Electric Ind Co Ltd | 画像符号化復号化装置及びその方法 |
CN1397137A (zh) * | 2000-10-19 | 2003-02-12 | 索尼公司 | 数据处理装置 |
US20090161697A1 (en) * | 2007-12-19 | 2009-06-25 | General Instrument Corporation | Method and System for Interleaving Video and Data for Transmission over a Network at a Selected Bit Rate |
CN102045562A (zh) * | 2009-10-09 | 2011-05-04 | 索尼公司 | 编码设备、解码设备、信息处理系统、编码方法和程序 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112400203A (zh) * | 2018-06-21 | 2021-02-23 | 索尼公司 | 编码设备、编码方法、解码设备、解码方法、以及程序 |
Also Published As
Publication number | Publication date |
---|---|
US10255925B2 (en) | 2019-04-09 |
JP6032509B2 (ja) | 2016-11-30 |
WO2013108685A1 (ja) | 2013-07-25 |
US20140334540A1 (en) | 2014-11-13 |
JP5846220B2 (ja) | 2016-01-20 |
US9754599B2 (en) | 2017-09-05 |
US10607618B2 (en) | 2020-03-31 |
US20190164559A1 (en) | 2019-05-30 |
JPWO2013108685A1 (ja) | 2015-05-11 |
JP2016054523A (ja) | 2016-04-14 |
US20170345434A1 (en) | 2017-11-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4224021B2 (ja) | 信号のマルチレートによる格子ベクトル量子化の方法とシステム | |
US8207875B2 (en) | Encoder that optimizes bit allocation for information sub-parts | |
US7978101B2 (en) | Encoder and decoder using arithmetic stage to compress code space that is not fully utilized | |
CA2327627C (en) | Process for processing at least one coded binary audio flux organized into frames | |
AU2009267477B2 (en) | Method for encoding a symbol, method for decoding a symbol, method for transmitting a symbol from a transmitter to a receiver, encoder, decoder and system for transmitting a symbol from a transmitter to a receiver | |
JP4548348B2 (ja) | 音声符号化装置及び音声符号化方法 | |
JP4390208B2 (ja) | 音声を可変レートで符号化および復号する方法 | |
US10607618B2 (en) | Encoder and encoding method, decoder and decoding method, and program | |
US8237594B2 (en) | Encoding apparatus, decoding apparatus, information processing system, and computer-readable storage medium | |
KR101143792B1 (ko) | 신호 부호화 장치 및 방법, 및 신호 복호 장치 및 방법 | |
WO2007114290A1 (ja) | ベクトル量子化装置、ベクトル逆量子化装置、ベクトル量子化方法及びベクトル逆量子化方法 | |
JP4163680B2 (ja) | コードワードインデックスに対してパラメータ値のマッピングを行うための適応型方法およびシステム | |
CN106409300B (zh) | 用于信号处理的方法和装置 | |
CN107431492A (zh) | 压缩编码设备、压缩编码方法、解码设备、解码方法和程序 | |
JP2004309921A (ja) | 符号化装置、符号化方法及びプログラム | |
KR20170089982A (ko) | 신호 인코딩 및 디코딩 방법 및 장치 | |
WO2011021238A1 (ja) | レート制御装置、レート制御方法及びレート制御プログラム | |
JP2007293254A (ja) | 量子化装置、逆量子化装置、音声音響符号化装置、音声音響復号装置、量子化方法、および逆量子化方法 | |
JP5188913B2 (ja) | 量子化装置、量子化方法、逆量子化装置、逆量子化方法、音声音響符号化装置および音声音響復号装置 | |
JP2008289085A (ja) | 復号方法、復号器、復号装置、符号化方法、符号化器、プログラムおよび記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20140910 |
|
WD01 | Invention patent application deemed withdrawn after publication |