CN103765510B - 编码装置和方法、解码装置和方法 - Google Patents
编码装置和方法、解码装置和方法 Download PDFInfo
- Publication number
- CN103765510B CN103765510B CN201280040029.1A CN201280040029A CN103765510B CN 103765510 B CN103765510 B CN 103765510B CN 201280040029 A CN201280040029 A CN 201280040029A CN 103765510 B CN103765510 B CN 103765510B
- Authority
- CN
- China
- Prior art keywords
- interval
- frequency
- frame
- successive frame
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 181
- 230000011218 segmentation Effects 0.000 claims abstract description 22
- 238000012545 processing Methods 0.000 claims description 60
- 238000011156 evaluation Methods 0.000 claims 1
- 238000005516 engineering process Methods 0.000 abstract description 21
- 238000000926 separation method Methods 0.000 abstract 1
- 238000000638 solvent extraction Methods 0.000 description 41
- 230000001186 cumulative effect Effects 0.000 description 14
- 230000005236 sound signal Effects 0.000 description 14
- 101100281682 Danio rerio fsta gene Proteins 0.000 description 10
- 230000033228 biological regulation Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 9
- 238000009825 accumulation Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 229940075591 dalay Drugs 0.000 description 3
- 238000002372 labelling Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 230000007850 degeneration Effects 0.000 description 2
- 230000003111 delayed effect Effects 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 101100171060 Caenorhabditis elegans div-1 gene Proteins 0.000 description 1
- 241001647280 Pareques acuminatus Species 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005538 encapsulation Methods 0.000 description 1
- 238000007667 floating Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
- G10L19/265—Pre-filtering, e.g. high frequency emphasis prior to encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/21—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本技术涉及能够以较低代码量获得高质量音频的编码装置和方法、解码装置和方法以及程序。基于构成输入信号的多个子带的子带信号,区间数确定特征量计算电路计算用于确定将要处理的区间分割成连续帧区间的分割数的区间数确定特征量,所述连续帧区间包括已选择相同估计系数的帧。准高频子带功率差计算电路基于区间数确定特征量来确定要处理的区间中的连续帧区间的数目,针对每个连续帧区间选择用于通过估计确定输入信号的高频分量的估计系数,并生成包含用于获得估计系数的系数索引的数据。高频编码电路对获得的数据进行编码,并且生成高频编码数据。本技术可应用于编码装置。
Description
技术领域
本技术涉及一种编码装置和编码方法、解码装置和解码方法以及程序,更具体地涉及被配置成以较少编码量获得高质量音频的编码装置和编码方法、解码装置和解码方法以及程序。
背景技术
一种对音频信号进行编码的方法包括HE-AAC(高效MPEG(运动图像专家组)4AAC(高级音频编码)(ISO标准/IEC 14496-3)、AAC(MPEG2AAC)(ISO标准/IEC 13818-7)等。
例如,作为对音频信号进行编码的方法,已经提出了如下方法:其中,输出通过对低频分量进行编码而获得的低频编码信息以及根据低频分量和高频分量生成的用于获得高频分量的估计值的高频编码信息,作为通过对音频信号进行编码而获得的代码(例如参见专利文献1)。在该方法中,高频编码信息包含计算高频分量的估计值所需要的信息,诸如标定因子、幅值调节系数和谱残差,以用于获得高频分量。
当对代码进行解码时,对低频编码信息进行解码而获得的低频分量和通过基于对高频编码信息进行解码而获得的信息来估计高频分量获得的高频分量被组合,以再现音频信号。
在这类编码方法中,仅用于获得高频分量的估计值的信息被编码作为关于高频信号分量的信息,因此可以改善编码效率同时抑制声音质量的退化。
引用列表
专利文献
专利文献1:WO 2006/049205A
发明内容
本发明要解决的问题
然而,在上述技术中,虽然可以获得高质量音频作为对代码进行解码的结果,但是应该针对音频信号的每个处理单位生成用于计算高频分量的估计值的信息,这不能确定高频编码信息的编码量充分小。
鉴于以上方面实现了本技术,以使得能够以较少编码量获得高质量音频。
问题的解决方案
根据本技术的第一方面的编码装置包括:子带分割单元,被配置成生成输入信号的低频侧的子带的低频子带信号和输入信号的高频侧的子带的高频子带信号;准高频子带功率计算单元,被配置成基于低频子带信号和预定估计系数来计算准高频子带功率,所述准高频子带功率是高频子带信号的高频子带功率的估计值;特征量计算单元,被配置成基于低频子带信号或高频子带信号中的至少之一来计算区间数确定特征量;确定单元,被配置成基于区间数确定特征量来确定在包括输入信号的多个帧的处理目标区间中的连续帧区间的数目,所述连续帧区间包括这样的帧,针对所述帧,选择相同的估计系数;选择单元,被配置成在通过基于所确定的连续帧区间的数目分割处理目标区间而获得的每个连续帧区间中,基于准高频子带功率和高频子带功率来从多个估计系数中选择构成连续帧区间的帧的估计系数;生成单元,被配置成生成下述数据:所述数据用于获得在构成处理目标区间的每个连续帧区间的帧中选择的估计系数;低频编码单元,被配置成对输入信号的低频信号进行编码以生成低频编码数据;以及复用单元,被配置成对所述数据和低频编码数据进行复用以生成输出代码串。
区间数确定特征量可以被定义为指示高频子带功率之和的特征量。
区间数确定特征量可以被定义为指示高频子带功率之和的时间变化的特征量。
区间数确定特征量可以被定义为指示所述输入信号的频率概况(frequency profile)的特征量。
区间数确定特征量可以被定义为多个特征量的线性和或非线性和。
编码装置还包括评估值和计算单元,该评估值和计算单元被配置成基于指示针对每个估计系数计算的、帧中的准高频子带功率与高频子带功率之间的误差的评估值,针对每个估计系数来计算构成连续帧区间的每个帧 的评估值之和。选择单元可以基于针对每个估计系数计算的评估值之和来选择连续帧区间的帧的估计系数。
通过用所确定的连续帧区间的数目来均等地分割处理目标区间而获得的每个区间可以被定义为连续帧区间。
选择单元可以基于针对在用所确定的连续帧区间的数目分割处理目标区间时能够取得的处理目标区间的分割的每个组合的评估值之和,来选择连续帧区间的帧的估计系数;从组合之中识别使得构成处理目标区间的所有帧的所选择的估计系数的评估值之和最小化的组合;以及将每个帧中选择的估计系数定义为所识别的组合中的对应帧的估计系数。
编码装置还包括被配置成对所述数据进行编码以生成高频编码数据的高频编码单元。复用单元可以通过将高频编码数据和低频编码数据进行复用而生成输出代码串。
确定单元还可以基于所确定的连续帧区间的数目来计算处理目标区间的高频编码数据的编码量,并且低频编码单元可以以下述编码量对低频信号进行编码:所述编码量是根据预先针对处理目标区间确定的编码量和所计算的高频编码数据的编码量而确定的。
根据本技术的第一方面的编码方法或程序包括步骤:生成输入信号的低频侧的子带的低频子带信号和输入信号的高频侧的子带的高频子带信号;基于低频子带信号和预定估计系数来计算准高频子带功率,所述准高频子带功率是高频子带信号的高频子带功率的估计值;基于低频子带信号或高频子带信号中的至少之一来计算区间数确定特征量;基于区间数确定特征量来确定在包括所述输入信号的多个帧的处理目标区间中的连续帧区间的数目,所述连续帧区间包括这样的帧,针对所述帧,选择相同的估计系数;在通过基于所确定的连续帧区间的数目分割处理目标区间而获得的每个连续帧区间中,基于所述准高频子带功率和所述高频子带功率来从多个估计系数中选择构成所述连续帧区间的帧的估计系数;生成下述数据:所述数据用于获得在构成处理目标区间的每个连续帧区间的帧中选择的估计系数;通过对输入信号的低频信号进行编码来生成低频编码数据;以及通过对所述数据和低频编码数据进行复用来生成输出代码串。
根据本技术的第一方面,生成输入信号的低频侧的子带的低频子带信号和输入信号的高频侧的子带的高频子带信号,基于低频子带信号和预定估计系数来计算准高频子带功率,所述准高频子带功率是高频子带信号的 高频子带功率的估计值,基于低频子带信号或高频子带信号中的至少之一来计算区间数确定特征量,基于区间数确定特征量来确定在包括输入信号的多个帧的处理目标区间中的连续帧区间的数目,所述连续帧区间包括这样的帧,针对所述帧,选择相同的估计系数,在通过基于所确定的连续帧区间的数目分割处理目标区间而获得的每个连续帧区间中,基于准高频子带功率和高频子带功率来从多个估计系数中选择构成连续帧区间的帧的估计系数,生成用于获得在构成处理目标区间的每个连续帧区间的帧中选择的估计系数的数据,通过对输入信号的低频信号进行编码来生成低频编码数据,并通过对所述数据和低频编码数据进行复用来生成输出代码串。
根据本技术的第二方面的解码装置包括:解复用单元,被配置成将输入代码串解复用成用于获得在构成处理目标区间的每个连续帧区间的帧中选择的估计系数的数据、以及通过对输入信号的低频信号进行编码而获得的低频编码数据,所述数据是基于下述操作的结果而生成的:基于输入信号的低频子带信号和预定估计系数来计算输入信号的高频子带信号的高频子带功率的估计值;基于从输入信号中提取的区间数确定特征量来确定在包括输入信号的多个帧的处理目标区间中的连续帧区间的数目,所述连续帧区间包括这样的帧,针对所述帧,选择相同的估计系数;以及在通过基于所确定的连续帧区间的数目分割处理目标区间而获得的每个连续帧区间中,基于估计值和高频子带功率来从多个估计系数中选择构成连续帧区间的帧的估计系数;低频解码单元,被配置成对低频编码数据进行解码以生成低频信号;高频信号生成单元,被配置成基于从所述数据获得的估计系数和根据解码获得的低频信号来生成高频信号;以及组合单元,被配置成基于高频信号和根据解码获得的低频信号来生成输出信号。
解码装置还包括:高频解码单元,被配置成对所述数据进行解码以获得估计系数。
基于指示针对每个估计系数计算的、帧中的估计值与高频子带功率之间的误差的评估值,可以针对每个估计系数来计算构成连续帧区间的每个帧的评估值之和,并且基于针对每个估计系数计算的评估值之和,可以选择连续帧区间的帧的估计系数。
通过用所确定的连续帧区间的数目均等地分割处理目标区间而获得的每个区间可以被定义为连续帧区间。
基于针对在用所确定的连续帧区间的数目分割处理目标区间时能够 取得的处理目标区间的分割的每个组合的评估值之和,可以选择连续帧区间的帧的估计系数;从组合之中可以识别使得构成处理目标区间的所有帧的所选择的估计系数的评估值之和最小化的组合;以及将每个帧中选择的估计系数可以被定义为所识别的组合中的对应帧的估计系数。
根据本技术的第二方面的解码方法或程序包括步骤:将输入代码串解复用成用于获得在构成处理目标区间的每个连续帧区间的帧中选择的估计系数的数据、以及通过对输入信号的低频信号进行编码而获得的低频编码数据,所述数据是基于下述操作的结果而生成的:基于输入信号的低频子带信号和预定估计系数来计算输入信号的高频子带信号的高频子带功率的估计值;基于从输入信号中提取的区间数确定特征量来确定在包括输入信号的多个帧的处理目标区间中的连续帧区间的数目,所述连续帧区间包括这样的帧,针对所述帧,选择相同的估计系数;以及在通过基于所确定的连续帧区间的数目分割处理目标区间而获得的每个连续帧区间中,基于估计值和高频子带功率来从多个估计系数中选择构成连续帧区间的帧的估计系数;通过对低频编码数据进行解码来生成低频信号;基于从所述数据获得的估计系数和根据解码获得的低频信号来生成高频信号;以及基于高频信号和根据解码获得的低频信号来生成输出信号。
根据本技术的第二方面,将输入代码串解复用成用于获得在构成处理目标区间的每个连续帧区间的帧中选择的估计系数的数据、以及通过对输入信号的低频信号进行编码而获得的低频编码数据,所述数据是基于下述操作的结果而生成的:基于输入信号的低频子带信号和预定估计系数来计算输入信号的高频子带信号的高频子带功率的估计值;基于从输入信号中提取的区间数确定特征量来确定在包括所述输入信号的多个帧的处理目标区间中的连续帧区间的数目,所述连续帧区间包括这样的帧,针对所述帧,选择相同的估计系数;以及在通过基于所确定的连续帧区间的数目分割处理目标区间而获得的每个连续帧区间中,基于估计值和高频子带功率来从多个估计系数中选择构成连续帧区间的帧的估计系数;通过对低频编码数据进行解码来生成低频信号;基于从所述数据获得的估计系数和根据解码获得的低频信号来生成高频信号;以及基于高频信号和根据解码获得的低频信号来生成输出信号。
本发明的效果
根据本技术的第一和第二方面,能够以较少编码量获得高质量音频。
附图说明
图1是示出输入信号的子带的示意图。
图2是示出通过可变长度系统进行高频分量的编码的示意图。
图3是示出通过固定长度系统进行高频分量的编码的示意图。
图4是示出根据本技术的编码装置的配置示例的框图。
图5是编码处理的流程图。
图6是示出解码装置的配置示例的框图。
图7是编码处理的流程图。
图8是编码处理的流程图。
图9是编码处理的流程图。
图10是编码处理的流程图。
图11是编码处理的流程图。
图12是示出编码装置的另一配置示例的框图。
图13是编码处理的流程图。
图14是示出计算机的配置示例的框图。
具体实施方式
下面参照附图详细描述本技术的示例性实施例。
<本技术的概述>
[关于输入信号的编码]
本技术是通过接收例如音频信号(诸如音乐信号)作为输入信号来执行输入信号的编码。
在执行输入信号的编码的编码装置中,如图1所示,输入信号在编码时被分割成均具有预定带宽的多个频带(下文中为“子带”)的子带信号。在图1中,竖轴表示输入信号的每个频率的功率,而横轴表示输入信号的频率。在该图中,曲线C11表示输入信号的每个频率分量的功率,而竖直方向上的虚线表示每个子带的边界位置。
当输入信号被分割成子带的子带信号时,通过预定编码系统对输入信 号的频率分量当中的等于或低于预设频率的低频侧的分量进行编码,以生成低频编码数据。
在图1所示的示例中,具有等于或低于具有用于识别每个子带的索引sb的子带sb的上限频率的频率的子带被定义为输入信号的低频分量,具有高于子带sb的上限频率的频率的子带被定义为输入信号的高频分量。
当获得低频编码数据时,基于输入信号的低频分量和高频分量生成用于再现高频分量的每个子带的子带信号的信息,并且通过预定编码系统以适当方式对信息进行编码以生成高频编码数据。
具体地,根据包括在低频侧具有最高频率且在频率方向上连续布置的子带sb-3至子带sb的四个子带的分量、以及包括在高频侧连续布置的子带sb+1至子带eb的(eb-(sb+1)+1)个子带的分量,来生成高频编码数据。
子带sb+1是与子带sb邻接的位于最低频侧的高频子带,而子带eb是在连续布置的子带sb+1至子带eb中具有最高频率的子带。
通过对高频分量进行编码而获得的高频编码数据是用于通过估计生成高频侧的子带ib(其中sb+1≤ib≤eb)的子带信号的信息,并且高频编码数据包括用于获得用于估计每个子带信号的估计系数的系数索引。
也就是,在子带ib的子带信号的估计中,采用与低频侧的每个子带kb(其中sb–3≤kb≤sb)的子带的功率相乘的系数Aib(kb)以及包括作为常数项的系数Bib的估计系数。高频编码数据中包括的系数索引是用于获得包含每个子带ib的系数Aib(kb)的估计系数和系数Bib的集合的信息,例如,用于识别估计系数的集合的信息。
当以上述方式获得低频编码数据和高频编码数据时,将低频编码数据和高频编码数据复用以生成输出代码串,然后输出该输出代码串。
以此方式,通过将用于获得估计系数的系数索引包括在高频编码数据中,与包括标度因子(scale factor)、幅值调节系数等以计算每个帧的高频分量的情况相比,可以大大减少高频编码数据的编码量。
此外,接收输出代码串的解码装置通过对低频编码数据进行解码而获得包括低频侧的每个子带的子带信号的解码低频信号,并通过估计从解码低频信号以及通过对高频编码数据进行解码而获得的信息来生成高频侧的每个子带的子带信号。以这种方式获得的输出信号是通过对编码输入信号进行解码而获得的信号。
[关于输出代码串]
在输入信号的编码中,针对要处理的帧,从针对输入信号的对应于预定时间长度的每个区间(即针对每个帧)预先准备的多个估计系数之中选择适当的估计系数。
在编码装置中,通过将系数索引在时间方向上改变的时间信息和改变的系数索引的值包括在高频编码数据中,而不将每个帧的系数索引按原样包括在高频编码数据中,来实现编码量的进一步减少。
具体地,当输入信号是不存在每个频率分量在时间方向上的改变的稳态信号时,所选择的估计系数(即其系数索引)通常在时间方向上连续继续下去。因此,为了减少高频编码数据中包括的系数索引在时间方向上的信息量,当执行输入信号的较高频率分量的编码时,适当地切换可变长度系统和固定长度系统。
[关于可变长度系统]
下面描述通过可变长度系统和固定长度系统进行的高频分量的编码。
当对高频分量进行编码时,针对预先确定的预定帧长度的区间在可变长度系统与固定长度系统之间执行切换。例如,在以下描述中,每隔16帧在可变长度系统与固定长度系统之间执行切换,并且输入信号的16帧的区间可以被称作处理目标区间。也就是,在编码装置中,以作为处理目标区间的16帧为单位将输出代码串输出。
首先,描述可变长度系统。在通过可变长度系统进行的高频分量的编码中,包括系统标志、系数索引、区间信息和数目信息的数据被编码并作为高频编码数据输出。
系统标志是指示用于生成高频编码数据的系统的信息,即指示在对高频分量进行编码时在可变长度系统与固定长度系统之间选择哪个系统的信息。
区间信息是指示包括处理目标区间中所包括的连续帧并针对其选择相同系数索引的区间(下文中为“连续帧区间”)的长度的信息。数目信息是指示处理目标区间中所包括的连续帧区间的数目的信息。
例如,在可变长度系统中,如图2所示,从位置FST1到位置FSE1的16帧的区间被定义为一个处理目标区间。在图2中,水平方向表示时间,而一个方块表示一帧。此外,指示帧的方块中的数值表示用于识别为 帧选择的估计系数的系数索引的值。
在通过可变长度系统进行高频分量的编码时,首先,处理目标区间被分割成连续帧区间,每个连续帧区间包括选择相同系数索引的连续帧。也就是,分别选择不同系数索引的彼此邻接的帧之间的边界位置被定义为连续帧区间之间的边界位置。
在本示例中,处理目标区间被分割成三个区间,包括从位置FST1到位置FC1的区间、从位置FC1到位置FC2的区间以及从位置FC2到位置FSE1的区间。例如,在从位置FST1到位置FC1的连续帧区间中,在每个帧中选择相同系数索引“2”。
当处理目标区间以上述方式被分割成连续帧区间时,生成下述数据:该数据包括指示连续帧区间的数目的数目信息、在每个连续帧区间中选择的系数索引、指示每个连续帧区间的长度的区间信息以及处理目标区间中的系统标志。
在这种情况下,处理目标区间被分割成三个连续帧区间,指示连续帧区间的数目“3”的信息被定义为数目信息。在图2中,数目信息被表示为“num_length=3”。
例如,处理目标区间中的第一连续帧区间的区间信息被表示为以连续帧区间中的帧为单位的长度“5”,并且在图2中被表示为“length0=5”。此外,每条区间信息被配置成识别从处理目标区间的头开始的连续帧区间的顺序。换言之,在区间信息中,还包括用于识别处理目标区间中的连续帧区间的位置的信息。
当生成包括用于处理目标区间的数目信息、系数索引、区间信息和系统标志的数据时,该数据被编码并输出作为高频编码数据。在这种情况下,当针对多个帧连续选择相同系数索引时,不需要针对每个帧传送系数索引,减少要传送的输出代码串的数据量,结果,可以更高效地执行编码和解码。
[关于固定长度系统]
下面描述通过固定长度系统进行的高频分量的编码。
在固定长度系统中,如图3所示,包括16个帧的处理目标区间被均等地分割成具有预定数目的帧的区间(下文中为“固定长度区间”)。在图3中,水平方向表示时间,而一个方块表示一帧。此外,指示帧的方块中的数值表示用于识别为帧选择的估计系数的系数索引的值。此外,在图3 中,对与图2所示的部分相对应的部分赋予相同的附图标记,并且省略其描述。
在固定长度系统中,处理目标区间被分割成多个固定长度区间。在这种情况下,确定固定长度区间的长度以使得在固定长度区间中的每个帧中选择的系数索引相同并且使固定长度区间的长度最大化。
在图3所示的示例中,固定长度区间的长度(下文中简化为“固定长度”)为4帧,并且处理目标区间被均等地分割成四个固定长度区间。也就是,处理目标区间被分割成从位置FST1到位置FC21的区间、从位置FC21到位置FC22的区间、从位置FC22到位置FC23的区间以及从位置FC23到位置FSE1的区间。这些固定长度区间中的系数索引在处理目标区间的头处从固定长度区间开始按顺序被表示为“1”、“2”、“2”和“3”。
当处理目标区间以上述方式被分割成多个固定长度区间时,生成包括处理目标区间中的指示固定长度区间的固定长度的固定长度索引、系数索引、切换标志和系统标志的数据。
切换标志是指示固定长度区间之间的边界位置的信息,即在预定固定长度区间的最后一帧与紧挨着该预定固定长度区间的固定长度区间的第一帧之间是否改变系数索引。例如,当在从处理目标区间的头开始的第(i+1)固定长度区间与第(i+2)固定长度区间之间的边界位置处改变系数索引时,第i(i=0,1,2,...)个切换标志gridflg_i被设置为“1”,当不改变系数索引时,第i(i=0,1,2,...)个切换标志gridflg_i被设置为“0”。
在图3所示的示例中,因为第一固定长度区间的系数索引“1”与第二固定长度区间的系数索引“2”不同,所以在处理目标区间的第一固定长度区间的边界位置(位置FC21)处的切换标志gridflg_0被设置为“1”。此外,因为第二固定长度区间的系数索引“2”与第三固定长度区间的系数索引“2”相同,所以在位置FC22处的切换标志gridflg_1被设置为“0”。
此外,固定长度索引的值被设置为根据固定长度而获得的值。具体地,例如,固定长度索引length_id被设置为满足固定长度fixed_length=16/2length_id的值。在图3所示的示例中,因为固定长度fixed_length=4,所以固定长度索引length_id=2。
当处理目标区间被分割成固定长度区间并且生成包括固定长度索引、系数索引、切换标志和系统标志的数据时,该数据被编码并输出作为高频编码数据。
在图3所示的示例中,包括位置FC21至位置FC23处的切换标志gridflg_0=1、gridflg_1=0和gridflg_2=1,固定长度索引length_id=2,固定长度区间的系数索引“1”、“2”和“3”以及指示固定长度系统的系统标志的数据被编码并输出作为高频编码数据。
固定长度区间之间的边界位置处的切换标志被配置成识别从处理目标区间的头开始边界位置处的切换标志的顺序。换言之,在切换标志中,包括用于识别处理目标区间中的固定长度区间的边界位置的信息。
此外,按照选择系数索引的顺序,即按照布置固定长度区间的顺序来布置高频编码数据中所包括的系数索引。例如,在图3所示的示例中,按照系数索引“1”、“2”和“3”的顺序布置固定长度区间,并且这些系数索引包括在该数据中。
虽然在图3所示的示例中从处理目标区间的头开始第二固定长度区间和第三固定长度区间的系数索引为“2”,但是构成了仅一个系数索引“2”包括在处理目标区间中。当连续固定长度区间的系数索引相同时,即当连续固定长度区间之间的边界位置处的切换标志为“0”时,仅一个系数索引包括在高频编码数据中,而不是将针对相应的固定长度区间的数目的相同的系数索引包括在高频编码数据中。
以这种方式,当根据包括固定长度索引、系数索引、切换标志和系统标志的数据生成高频编码数据时,不需要针对每个帧传送系数索引,因此可以减少要传送的输出代码串的数据量。结果,可以更高效地执行编码和解码。
[关于连续帧区间的数目]
在对输入信号进行编码时,基于输入信号的每个子带的子带信号来确定构成处理目标区间的连续帧区间的最优数目,基于所确定的连续帧区间的数目来选择每个帧的系数索引(估计系数)。例如,基于根据高频侧的子带的子带功率而确定的特征量(在下文中为“区间数确定特征量”)来确定构成处理目标区间的连续帧区间的最优数目。
以这种方式,通过基于指示高频分量的特征的区间数确定特征量来确定构成处理目标区间的连续帧区间的数目,可以防止为每个帧选择的系数索引在时间方向上多于必要地变化。
结果,处理目标区间的高频编码数据中所包括的系数索引的数目等可以被抑制为必要最低限度,因此可以进一步减少高频编码数据的编码量。
此外,由于诸如估计误差的高频分量的特征取决于估计系数,因此,如果系数索引在时间方向上多于必要地变化,则在通过解码获得的音频信号中生成解码前输入信号中不存在的非自然频率包络的时间变化,其在听觉上使声音质量退化。这种声音质量的退化在具有高频分量的较少时间变化的稳态音频信号中是显著的。
然而,如果在适当地确定构成处理目标区间的连续帧区间的数目之后选择每个帧的系数索引,则可以防止系数索引多于必要地变化。结果,可以抑制通过解码获得的音频的高频分量的非自然时间变化,因此可以提高声音质量。
<第一实施例>
[编码装置的示例结构]
下面描述上述用于对输入信号进行编码的编码技术的示例性实施例。首先,描述用于执行输入信号的编码的编码装置的配置。图4是示出了编码装置的配置示例的框图。
编码装置11包括低通滤波器31、低频编码电路32、子带分割电路33、特征量计算电路34、准高频子带功率计算电路35、区间数确定特征量计算电路36、准高频子带功率差计算电路37、高频编码电路38、以及复用电路39。在编码装置11中,要编码的输入信号被提供给低通滤波器31和子带分割电路33。
低通滤波器31利用预定截止频率对提供的输入信号进行滤波,并且将处于比截止频率更低的频率区域的所获得的信号(下文中为“低频信号”)提供给低频编码电路32和子带分割电路33。
低频编码电路32对从低通滤波器31提供的低频信号进行编码,并将所获得的低频编码数据提供给复用电路39。
子带分割电路33将从低通滤波器31提供的低频信号均等地分割成多个子带的子带信号(下文中为“低频子带信号”),并将所获得的低频子带信号提供给特征量计算电路34和区间数确定特征量计算电路36。低频子带信号是在输入信号的低频侧的子带的信号。
此外,子带分割电路33将所提供的输入信号均等地分割成多个子带的子带信号,并将通过分割获得的子带信号之中的高频侧的预定频带中所包括的子带的子带信号提供给区间数确定特征量计算电路36和准高频子带功率差计算电路37。在下文中,从子带分割电路33提供给区间数确定 特征量计算电路36和准高频子带功率差计算电路37的子带的子带信号还被称作高频子带信号。
特征量计算电路34基于从子带分割电路33提供的低频子带信号来计算特征量,并将所计算的特征量提供给准高频子带功率计算电路35。
准高频子带功率计算电路35基于从特征量计算电路34提供的特征量来计算高频子带信号的功率的估计值(下文中还被称为“准高频子带功率”),并将所计算的准高频子带功率提供给准高频子带功率差计算电路37。通过统计学习获得的估计系数的多个集合被记录在准高频子带功率计算电路35中,并且基于估计系数和特征量来计算准高频子带功率。
区间数确定特征量计算电路36基于从子带分割电路33提供的低频子带信号和高频子带信号来计算区间数确定特征量,并将所计算的区间数确定特征量提供给准高频子带功率差计算电路37。
准高频子带功率差计算电路37针对每个帧选择指示适于估计帧的高频分量的估计系数的系数索引。准高频子带功率差计算电路37包括确定单元51、评估值和计算单元52、选择单元53和生成单元54。
确定单元51基于从区间数确定特征量计算电路36提供的区间数确定特征量来确定构成处理目标区间的连续帧区间的数目。
准高频子带功率差计算电路37基于从子带分割电路33提供的高频子带信号的功率(下文中还被称作“高频子带功率”)以及从准高频子带功率计算电路35提供的准高频子带功率来针对每个帧计算每个估计系数的评估值。该评估值是指示输入信号的实际高频分量与通过使用估计系数估计的高频分量之间的误差的值。
评估值和计算单元52基于确定单元51所确定的连续帧区间的数目和每个帧的评估值来计算连续帧的评估值之和。选择单元53基于评估值和计算单元52所计算的评估值之和来选择每个帧的系数索引。
生成单元54基于输入信号的处理目标区间的每个帧中的系数索引的选择结果来在可变长度系统与固定长度系统之间执行切换,通过所选择的系统生成用于获得高频编码数据的数据,并且将所生成的数据提供给高频编码电路38。
高频编码电路38对从准高频子带功率差计算电路37提供的数据进行编码,并将所获得的高频编码数据提供给复用电路39。复用电路39将来自低频编码电路32的低频编码数据和来自高频编码电路38的高频编码数 据复用,并输出复用的数据作为输出代码串。
[编码处理的描述]
图4所示的编码装置11被提供输入信号,在被指示对输入信号进行编码时执行编码处理,并将输出代码串输出到解码装置。下面参照图5所示的流程图描述通过编码装置11进行的编码处理。针对每个预设数目的帧,即每个处理目标区间,执行该编码处理。
在步骤S11,低通滤波器31通过使用低通滤波器利用预定截止频率对所提供的要处理的帧的输入信号进行滤波,并且将所获得的低频信号提供给低频编码电路32和子带分割电路33。
在步骤S12,低频编码电路32对从低通滤波器31提供的低频信号进行编码,并且将所获得的低频编码数据提供给复用电路39。
在步骤S13,子带分割电路33将输入信号和低频信号均等地分割成均具有预定带宽的多个子带信号。
也就是,子带分割电路33将输入信号分割成多个子带的子带信号,并将通过分割获得的高频侧的子带sb+1至子带eb的子带信号提供给区间数确定特征量计算电路36和准高频子带功率差计算电路37。
此外,子带分割电路33将来自低通滤波器31的低频信号分割成多个子带的子带信号,并将通过分割获得的低频侧的子带sb-3至子带sb的子带信号提供给特征量计算电路34和区间数确定特征量计算电路36。
在步骤S14,区间数确定特征量计算电路36基于从子带分割电路33提供的低频子带信号和高频子带信号来计算区间数确定特征量,并将所计算的区间数确定特征量提供给准高频子带功率差计算电路37。
例如,区间数确定特征量计算电路36通过计算以下等式(1)来计算作为要处理的帧J的估计带宽的子带功率和powerhigh(J),即高频侧的子带的子带信号的功率的和。
[数学公式1]
在等式(1)中,powerlin(ib,J)指示帧J的子带ib(其中sb+1≤ib≤eb)的子带信号的样本的样本值的均方根值。因此,通过取得针对高频侧的每 个子带获得的均方根值powerlin(ib,J)的和的对数来获得子带功率和powerhigh(J)。
以上述方式获得的子带功率和powerhigh(J)指示输入信号的高频侧的子带的高频子带功率的和。随着每个子带的功率和增大,子带功率和powerhigh(J)的值增大。也就是,随着输入信号的高频分量的功率整体上增大,子带功率和powerhigh(J)也增大。
在步骤S15,特征量计算电路34基于从子带分割电路33提供的低频子带信号来计算特征量,并将所计算的特征量提供给准高频子带功率计算电路35。
例如,计算每个低频子带信号的功率作为特征量。在下文中,具体地,低频子带信号的功率也被称作低频子带功率。此外,每个子带信号(诸如低频子带信号和高频子带信号)的功率还被适当地称作子带功率。
具体地,特征量计算电路34通过计算以下等式(2)来计算以分贝表示的、要处理的帧J的子带ib(其中sb-3≤ib≤sb)的子带功率power(ib,J)。
[数学公式2]
在等式(2)中,x(ib,n)指示子带ib的子带信号的值(样本的样本值),而x(ib,n)中的n指示离散时间的索引。此外,等式(2)中的FSIZE指示构成一帧的子带信号的样本的数目。
因此,通过取得构成帧J的低频子带信号的每个样本的样本值的均方根值的对数来计算帧J的低频子带功率power(ib,J)。在下文中,考虑在特征量计算电路34中把低频子带功率计算为特征量。
在步骤S16,准高频子带功率计算电路35基于作为特征量从特征量计算电路34提供的低频子带功率以及针对预先记录的每个估计系数的所记录的估计系数来计算准高频子带功率。
例如,当预先准备具有从1至K(其中2≤K)的系数索引的K个估计系数的集合时,针对K个估计系数的集合计算每个子带的准高频子带功率。
具体地,准高频子带功率计算电路35通过计算以下等式(3)来计算要处理的帧J的高频侧的每个子带的准高频子带功率powerest(ib,J)(其中sb+1≤ib≤eb)。
[数学公式3]
在等式(3)中,系数Aib(kb)和系数Bib指示为高频侧的子带ib准备的估计系数的集合。也就是,系数Aib(kb)是与子带kb(其中sb-3≤kb≤sb)的低频子带功率power(kb,J)相乘的系数,并且系数Bib是在线性耦合低频子带功率时使用的常数项。
因此,通过将低频侧的每个子带的低频子带功率与针对每个子带的系数Aib(kb)相乘并将系数Bib相加到与该系数相乘的低频子带功率的和,来获得高频侧的子带ib的准高频子带功率powerest(ib,J)。
在针对估计系数的每个集合计算高频侧的每个子带的准高频子带功率时,准高频子带功率计算电路35将所计算的准高频子带功率提供给准高频子带功率差计算电路37。
在步骤S17,准高频子带功率差计算电路37针对通过系数索引id识别的估计系数的全部集合,来计算使用要处理的帧J的评估值Res(id,J)。
具体地,准高频子带功率差计算电路37通过使用从子带分割电路33提供的每个子带的高频子带信号来执行与上述等式(2)相似的计算,并计算帧J中的高频子带功率power(ib,J)。
当获得高频子带功率power(ib,J)时,准高频子带功率差计算电路37通过计算以下等式(4)来计算残差均方根值Resstd(id,J)。
[数学公式4]
也就是,针对高频侧的每个子带ib(其中sb+1≤ib≤eb)获得帧J的高 频子带功率power(ib,J)与准高频子带功率powerest(ib,id,J)之间的差,并将差的均方根值定义为残差均方根值Resstd(id,J)。
准高频子带功率powerest(ib,id,J)指示针对帧J中具有系数索引id的估计系数获得的子带ib的准高频子带功率。
随后,准高频子带功率差计算电路37通过计算以下等式(5)来计算残差最大值Resmax(id,J)。
[数学公式5]
Resmax(id,J)=maxib{|power(ib,J)-powerest(ib,id,J)|}
…(5)
在等式(5)中,maxib{|power(ib,J)-powerest(ib,id,J)|}指示每个子带ib的高频子带功率power(ib,J)与准高频子带功率powerest(ib,id,J)之间的差的绝对值的最大值。因此,帧J中的高频子带功率power(ib,J)与准高频子带功率powerest(ib,id,J)之间的差的绝对值的最大值被定义为残差最大值Resmax(id,J)。
此外,准高频子带功率差计算电路37通过计算以下等式(6)来计算残差平均值Resave(id,J)。
[数学公式6]
也就是,针对高频侧的每个子带ib,获得帧J的高频子带功率power(ib,J)与准高频子带功率powerest(ib,id,J)之间的差,并获得差的和。通过使所获得的差的和除以高频侧的子带(eb-sb)的数目而获得的值的绝对值被定义为残差平均值Resave(id,J)。残差平均值Resave(id,J)指示考虑到符号的每个子带的估计误差的平均值的大小。
此外,当获得了残差均方根值Resstd(id,J)、残差最大值Resmax(id,J)和残差平均值Resave(id,J)时,准高频子带功率差计算电路37通过计算以下等式(7)来计算最终评估值Res(id,J)。
[数学公式7]
Res(id,J)=Wstd×Resstd(id,J)+Wmax×Resmax(id,J)+Wave×Resave(id,J)
…(7)
也就是,以加权的方式将残差均方根值Resstd(id,J)、残差最大值Resmax(id,J)和残差平均值Resave(id,J)相加,并且将加权相加的结果定义为最终评估值Res(id,J)。在等式(7)中,Wstd、Wmax和Wave是预先确定的权重,例如,Wstd=1,Wmax=0.5以及Wave=0.5。
准高频子带功率差计算电路37通过针对每K个估计系数(即每K个系数索引id)执行上述处理来计算评估值Res(id,J)。
以上述方式获得的评估值Res(id,J)指示根据实际输入信号计算的高频子带功率与通过使用具有系数索引id的估计系数计算的准高频子带功率之间的相似度。也就是,其指示高频分量的估计误差的大小。
以这种方式,随着评估值Res(id,J)减小,通过使用估计系数的计算获得更接近实际输入信号的高频分量的信号。
在步骤S18,准高频子带功率差计算电路37确定是否已针对预定帧长度执行处理。也就是,准高频子带功率差计算电路37确定是否已针对构成处理目标区间的所有帧计算区间数确定特征量和评估值。
在步骤S18,当确定尚未针对预定帧长度执行处理时,处理返回到步骤S11,并且重复上述处理。也就是,尚未处理的处理目标区间的帧被设置为下一处理目标帧,并且计算帧的区间数确定特征量和评估值。
另一方面,在步骤S18,当确定已针对预定帧长度执行处理时,处理移至步骤S19。
在步骤S19,确定单元51基于从区间数确定特征量计算电路36提供的、构成处理目标区间的每个帧的区间数确定特征量来确定构成处理目标区间的连续帧区间的数目。
具体地,确定单元51根据构成处理目标区间的每个帧的区间数确定特征量来获得区间数确定特征量的代表值。例如,每个帧的区间数确定特征量的最大值,即最大的区间数确定特征量被定义为代表值。
随后,确定单元51通过将所获得的代表值与预先确定的阈值进行比较来确定连续帧区间的数目。例如,当代表值等于或大于100时,连续帧区间的数目被设置为16,当代表值等于或大于80且小于100时,连续帧区间的数目被设置为8,当代表值等于或大于60且小于80时,连续帧区 间的数目被设置为4。此外,当代表值等于或大于40且小于60时,连续帧区间的数目被设置为2,当代表值小于40时,连续帧区间的数目被设置为1。
在确定连续帧区间的数目时与阈值进行比较的区间数确定特征量(代表值)指示高频子带功率的和。在诸如输入信号的音频信号中,高频侧的子带功率的和大的区间相比子带功率小的区间具有声学上更好被人耳识别(更清楚地听到)的高频分量,因此在解码时,需要执行解码以使得通过估计获得更接近原始信号的信号。
当区间数确定特征量的代表值大时,确定单元51增加连续帧区间的数目,以使得可以在解码侧估计每个帧的高频分量。利用该配置,可以提高通过解码获得的音频信号的清晰度(articulation),并因此可以声学上改进声音质量。
另一方面,当代表值小时,高频分量的功率小,因此,即使通过估计系数的高频分量的估计准确度相对低,也几乎不能识别通过解码获得的音频的声音质量的声学退化。因此,当代表值小时,确定单元51减少连续帧区间的数目,从而减少高频编码数据的编码量,而不使声音质量退化。
在步骤S20,评估值和计算单元52通过使用针对每个帧的每个系数索引(估计系数集合)计算的评估值,来针对每个系数索引计算构成连续帧区间的帧的评估值的和。
例如,假设在步骤S19所确定的连续帧区间的数目为ndiv,并且处理目标区间包括16个帧。在这种情况下,例如,评估值和计算单元52将处理目标区间均等地分割成ndiv个区间,并且将每个所获得的区间设置为连续帧区间。在这种情况下,每个连续帧区间包括16/ndiv个连续帧。
此外,评估值和计算单元52通过计算以下等式(8)针对每个系数索引来计算评估值和Ressum(id,igp),评估值和Ressum(id,igp)是构成每个连续帧区间的帧的评估值的和。
[数学公式8]
在等式(8)中,igp是用于识别处理目标区间中的连续帧区间的索引, 并且Res(id,ifr)指示针对系数索引id获得的、构成连续帧区间的帧ifr的评估值Res(id,ifr)。
因此,通过计算构成连续帧区间的具有相同系数索引id的每个帧的评估值的和,来计算针对连续帧区间的系数索引id的评估值和Ressum(id,igp)。
在步骤S21,选择单元53基于针对每个连续帧区间的每个系数索引获得的评估值和来选择每个帧的系数索引。
随着每个帧的评估值Res(id,J)的值减小,通过使用估计系数的计算获得更接近实际高频分量的信号,因此,随着在系数索引中评估值和Ressum(id,igp)减小,可以认为系数索引适于连续帧区间。
选择单元53从多个系数索引之中选择使得针对连续帧区间获得的评估值和Ressum(id,igp)最小化的系数索引,作为构成连续帧区间的每个帧的系数索引。因此,在连续帧区间中,在每个帧中选择相同系数索引。
以此方式,选择单元53针对构成处理目标区间的每个连续帧区间选择构成连续帧区间的帧的系数索引。
当基于针对每个连续帧区间的评估值和选择系数索引时,在一些情况下,可以在彼此邻接的连续帧区间中选择相同系数索引。在这种情况下,编码装置11处理选择相同系数索引并被连续布置的连续帧区间,以作为单个连续帧区间。
在步骤S22,生成单元54确定是否使用固定长度系统作为用于生成高频编码数据的系统。
也就是,生成单元54基于处理目标区间中的每个帧的系数索引的选择结果,来将固定长度系统生成的高频编码数据与可变长度系统生成的高频编码数据进行比较。当固定长度系统的高频编码数据的编码量小于可变长度系统的高频编码数据的编码量时,生成单元54确定使用固定长度系统。
在步骤S22,当确定使用固定长度系统时,处理移至步骤S23。在步骤S23,生成单元54生成包括指示选择了固定长度系统的系统标志、固定长度索引、系数索引和切换标志的数据,并将生成的数据提供给高频编码电路38。
例如,在图3所示的示例中,生成单元54将固定长度设置为4帧, 并将从位置FST1到位置FSE1的处理目标区间分割成4个固定长度区间。生成单元54然后生成包括固定长度索引“2”,系数索引“1”、“2”和“3”,切换标志“1”、“0”和“1”以及系统标志的数据。
虽然在图3所示的示例中从处理目标区间的头开始的第二固定长度区间和第三固定长度区间的系数索引为“2”,但是由于这些固定长度区间被连续布置,所以从生成单元54输出的数据仅包括一个系数索引“2”。
在步骤S24,高频编码电路38对从生成单元54提供的包括系统标志、固定长度索引、系数索引和切换标志的数据进行编码,以生成高频编码数据。
例如,关于系统标志、固定长度索引、系数索引和切换标志之中的全部信息或部分信息适当地执行熵编码等。此外,包括系统标志、固定长度索引等的数据也可以按原样用作高频编码数据。
高频编码电路38将生成的高频编码数据提供给复用电路39,并且然后处理移至步骤S27。
另一方面,在步骤S22,当确定不使用固定长度系统时,即当确定使用可变长度系统时,处理移至步骤S25。在步骤S25,生成单元54生成包括指示选择了可变长度系统的系统标志、系数索引、区间信息和数目信息的数据,并将生成的数据提供给高频编码电路38。
例如,在图2所示的示例中,从位置FST1到位置FSE1的处理目标区间被分割成三个连续帧区间。生成单元54生成这样的数据,该数据包括指示选择了可变长度系统的系统标志、指示连续帧区间的数目为“3”的数目信息“num_length=3”、指示每个连续帧区间的长度的区间信息“length0=5”和“length1=7、以及连续帧区间的系数索引“2”、“5”和“1”。
每个连续帧区间的系数索引与区间信息相关联,以使得可以针对系数索引识别出连续帧区间。此外,在图2所示的示例中,可以根据处理目标区间的头和后续连续帧区间的区间信息来识别构成处理目标区间的最后的连续帧区间的帧的数目,因此对于最后的连续帧区间没有生成区间信息。
在步骤S26,高频编码电路38对从生成单元54提供的包括系统标志、系数索引、区间信息和数目信息的数据进行编码,以生成高频编码数据。
例如,在步骤S26,关于系统标志、系数索引、区间信息和数目信息 之中的全部信息或部分信息执行熵编码等。高频编码数据可以是任何信息,只要可以根据该信息获得估计系数,例如包括系统标志、系数索引、区间信息和数目信息的数据可以按原样用作高频编码数据。
高频编码电路38将生成的高频编码数据提供给复用电路39,然后处理移至步骤S27。
当在步骤S24或步骤S26生成高频编码数据时,在步骤S27,复用电路39将从低频编码电路32提供的低频编码数据和从高频编码电路38提供的高频编码数据复用。复用电路39然后输出通过复用获得的输出代码串,从而结束编码处理。
以此方式,编码装置11基于从输入信号获得的子带信号来计算区间数确定特征量,并在根据区间数确定特征量确定连续帧区间的数目时计算每个连续帧区间的评估值和,并选择每个帧的系数索引。编码装置11然后对包括所选择的系数索引的数据进行编码,以生成高频编码数据。
结果,相比于按原样对用于高频分量的估计操作的数据(诸如标定因子)进行编码的情况,通过经由对包括系数索引的数据进行编码来生成高频编码数据,可以减少高频编码数据的编码量。
此外,通过基于区间数确定特征量来确定连续帧区间的数目,可以防止系数索引关于时间方向多于必要地变化,使得可以提高通过解码获得的音频的声学声音质量,同时可以减少输出代码串的编码量。这使得能够提高输入信号的编码效率。
此外,通过选择每个连续帧区间的系数索引,可以针对每个连续帧区间获得更适合的估计系数的系数索引。具体地,通过均等地设置构成处理目标区间的每个连续帧区间的长度,可以减少运算量,因此,能够以加快方式选择系数索引。
[解码装置的配置]
下面描述解码装置,解码装置接收从编码装置11输出的输出代码串并执行输出代码串的解码。
例如,如图6所示配置这样的解码装置。
解码装置81包括解复用电路91、低频解码电路92、子带分割电路93、特征量计算电路94、高频解码电路95、解码高频子带功率计算电路96、解码高频信号生成电路97、以及组合电路98。
解复用电路91采用从编码装置11接收的输出代码串作为输入代码串,并将输入代码串解复用成高频编码数据和低频编码数据。此外,解复用电路91将根据解复用获得的低频编码数据提供给低频解码电路92并将通过解复用获得的高频编码数据提供给高频解码电路95。
低频解码电路92将来自解复用电路91的低频编码数据进行解码,并将所获得的输入信号的解码低频信号提供给子带分割电路93和组合电路98。
子带分割电路93将来自低频解码电路92的解码低频信号均等地分割成均具有预定带宽的多个低频子带信号,并将所获得的低频子带信号提供给特征量计算电路94和解码高频信号生成电路97。
特征量计算电路94基于来自子带分割电路93的低频子带信号来计算低频侧的每个子带的低频子带功率作为特征量,并将所计算的低频子带功率提供给解码高频子带功率计算电路96。
高频解码电路95对来自解复用电路91的高频编码数据进行解码,并将作为解码的结果获得的数据以及通过数据中所包括的系数索引识别的估计系数提供给解码高频子带功率计算电路96。也就是,高频解码电路95在其中彼此相关联地预先存储有多个系数索引和通过系数索引识别的估计系数,输出对应于高频编码数据中包括的系数索引的估计系数。
解码高频子带功率计算电路96基于来自高频解码电路95的数据和估计系数以及来自特征量计算电路94的低频子带功率来针对每个帧计算解码高频子带功率,解码高频子带功率是高频侧的每个子带的子带功率的估计值。例如,执行与上述等式(3)相同的运算以计算解码高频子带功率。解码高频子带功率计算电路96将所计算的每个子带的解码高频子带功率提供给解码高频信号生成电路97。
解码高频信号生成电路97基于来自子带分割电路93的低频子带信号和来自解码高频子带功率计算电路96的解码高频子带功率来生成解码高频信号,并将生成的解码高频信号提供给组合电路98。
具体地,解码高频信号生成电路97计算低频子带信号的低频子带功率,并根据解码高频子带功率与低频子带功率之比来执行低频子带信号的幅值调制。此外,解码高频信号生成电路97通过执行幅值调制后的低频子带信号的频率调制来生成高频侧的每个子带的解码高频子带信号。以上述方式获得的解码高频子带信号是输入信号的高频侧的每个子带的高频 子带信号的估计值。解码高频信号生成电路97将包括所获得的每个子带的解码高频子带信号的解码高频信号提供给组合电路98。
组合电路98将来自低频解码电路92的解码低频信号和来自解码高频信号生成电路97的解码高频信号进行组合,并输出组合的信号作为输出信号。该输出信号是通过对包括高频分量和低频分量的编码输入信号进行解码而获得的信号。
<变型示例1>
[编码处理的描述]
虽然上面描述了获得高频子带功率的和作为区间数确定特征量的情况,但是指示高频子带功率的和的时间变化的特征量也可以用作区间数确定特征量。
作为指示高频子带功率的和的时间变化的特征量,例如指示高频子带功率增加了多少的特征量(即指示攻击特性(attack property)的特征量)可以被定义为区间数确定特征量。
在这种情况下,编码装置11执行例如图7所示的编码处理。下面参照图7所示的流程图描述编码装置11进行的编码处理。
步骤S51至步骤S53的处理与图5所示的步骤S11至步骤S13的处理相似,因此省略其描述。
在步骤S54,区间数确定特征量计算电路36基于从子带分割电路33提供的高频子带信号来计算指示攻击特性的区间数确定特征量,并将所计算的区间数确定特征量提供给准高频子带功率差计算电路37。
例如,区间数确定特征量计算电路36通过计算上述等式(1)来计算处理目标帧J的高频子带信号的子带功率和powerhigh(J)。
此外,区间数确定特征量计算电路36基于包括要处理的帧J的最后(L+1)个帧的子带功率来计算以下等式(9),并计算特征量powerattack(J)作为指示攻击特性的区间数确定特征量。在这种情况下,例如,L=16。
[数学公式9]
powerattack(J)=powerhigh(J)MIN{powerhigh(J),powerhigh(J-1),...,powerhigh(J-L)}
…(9)
在等式(9)中,MIN{powerhigh(J),powerhigh(J-1),...powerhigh(J-L)}指示 用于输出子带功率和powerhigh(J)至子带功率和powerhigh(J-L)之中的最小值的函数。因此,特征量powerattack(J)是通过计算要处理的帧J的子带功率和powerhigh(J)与包括要处理的帧J的最后(L+1)个帧的子带功率的最小值之间的差而获得的。
以上述方式获得的特征量powerattack(J)指示子带功率和在时间方向上的上升速度,即增大速度,因此,随着特征量powerattack(J)增大,高频分量的攻击特性的强度增加。
在区间数确定特征量计算电路36将所计算的特征量powerattack(J)提供给准高频子带功率差计算电路37之后,执行步骤S55至步骤S67的处理,从而编码处理结束。
由于这些处理与图5所示的步骤S15至步骤S27的处理相似,所以省略其描述。在步骤S59,确定单元51通过将被计算为区间数确定特征量的指示攻击特性的特征量powerattack(J)的代表值与阈值进行比较,来确定构成处理目标区间的连续帧区间的数目。
具体地,例如,处理目标区间中的每个帧的区间数确定特征量的最大值被定义为代表值,当代表值等于或大于40时,连续帧区间的数目被设置为16,当代表值等于或大于30且等于或小于40时,连续帧区间的数目被设置为8。此外,当代表值等于或大于20且等于或小于30时,连续帧区间的数目被设置为4,当代表值等于或大于10且等于或小于20时,连续帧区间的数目被设置为2,并且当代表值小于10时,连续帧区间的数目被设置为1。
例如,区间数确定特征量大且攻击特性强的区间是子带功率和的时间变化大的区间。也就是,在该区间中最优估计系数在时间方向上的变化大。因此,确定单元51增加区间数确定特征量的代表值大的区间中的连续帧区间的数目,使得可以通过解码侧的估计获得更接近原始信号的高频子带信号。利用该配置,可以提高通过解码获得的音频信号的清晰度,因此可以声学上改进声音质量。
与之相比,确定单元51通过减少代表值小的区间中的连续帧区间的数目来减少高频编码数据的编码量,而不会使声音质量退化。
以此方式,甚至在使用指示攻击特性的区间数确定特征量的情况下,可以提高通过解码获得的音频的声学声音质量,同时可以减少输出代码串的编码量,以使得可以提高输入信号的编码效率。
<变型示例2>
[编码处理的描述]
替选地,指示衰减特性的特征量也可以用作指示高频子带功率的和的时间变化的区间数确定特征量。
在这种情况下,编码装置11执行例如图8所示的编码处理。下面将参照图8所示的流程图描述编码装置11进行的编码处理。步骤S91至步骤S93的处理与图5所示的步骤S11至步骤S13的处理相似,因此省略其描述。
在步骤S94,区间数确定特征量计算电路36基于从子带分割电路33提供的高频子带信号来计算指示衰减特性的区间数确定特征量,并将所计算的区间数确定特征量提供给准高频子带功率差计算电路37。
例如,区间数确定特征量计算电路36通过计算上述等式(1)来计算处理目标帧J的高频子带信号的子带功率和powerhigh(J)。
此外,区间数确定特征量计算电路36基于针对包括要处理的帧J的最后(M+1)个帧的子带功率和来计算以下等式(10),并计算特征量powerdecay(J)作为指示衰减特性的区间数确定特征量。在这种情况下,例如,M=16。
[数学公式10]
powerdecay(J)=MAX{powerhigh(J),powerhigh(J-1),...,powerhigh(J-M)}-powerhigh(J)
…(10)
在等式(10)中,MAX{powerhigh(J),powerhigh(J-1),...,powerhigh(J-M)}指示用于输出子带功率和powerhigh(J)至子带功率和powerhigh(J-M)之中的最大值的函数。因此,特征量powerdecay(J)是通过计算包括要处理的帧J的最后(M+1)个帧的子带功率的最大值与要处理的帧J的子带功率和之间的差而获得的。
以上述方式获得的特征量powerdecay(J)指示子带功率和在时间方向上的降落速度,即下降速度,因此,随着特征量powerdecay(J)增大,高频分量的衰减特性的强度增加。
在区间数确定特征量计算电路36将所计算的特征量powerdecay(J)提供给准高频子带功率差计算电路37之后,执行步骤S95至步骤S107的处理,从而编码处理结束。
由于这些处理与图5所示的步骤S15至步骤S27的处理相似,所以省略其描述。在步骤S99,确定单元51通过将被计算为区间数确定特征量的指示衰减特性的特征量powerdecay(J)的代表值与阈值进行比较,来确定构成处理目标区间的连续帧区间的数目。
具体地,例如,处理目标区间中的每个帧的区间数确定特征量的最大值被定义为代表值,当代表值等于或大于40时,连续帧区间的数目被设置为16,当代表值等于或大于30且等于或小于40时,连续帧区间的数目被设置为8。此外,当代表值等于或大于20且等于或小于30时,连续帧区间的数目被设置为4,当代表值等于或大于10且等于或小于20时,连续帧区间的数目被设置为2,并且当代表值小于10时,连续帧区间的数目被设置为1。
例如,区间数确定特征量大且衰减特性强的区间是子带功率和的时间变化大的区间。因此,以与指示攻击特性的区间数确定特征量的情况相似的方式,确定单元51增加区间数确定特征量的代表值大的区间中的连续帧区间的数目。利用该配置,可以提高通过解码获得的音频的声学声音质量,同时可以减少输出代码串的编码量,使得可以提高输入信号的编码效率。
<变型示例3>
[编码处理的描述]
替选地,也可以使用指示输入信号的频率概况的特征量作为区间数确定特征量。
在这种情况下,编码装置11执行例如图9所示的编码处理。下面将关于图9所示的流程图描述编码装置11进行的编码处理。步骤S131至步骤S133的处理与图5所示的步骤S11至步骤S13的处理相似,因此省略其描述。
在步骤S134,区间数确定特征量计算电路36基于从子带分割电路33提供的高频子带信号来计算指示频率概况的区间数确定特征量,并将所计算的区间数确定特征量提供给准高频子带功率差计算电路37。
例如,区间数确定特征量计算电路36通过计算上述等式(1)来计算处理目标帧J的高频子带信号的子带功率和powerhigh(J)。
此外,区间数确定特征量计算电路36通过计算以下等式(11)来计算特征量powertilt(J)作为指示频率概况的区间数确定特征量。
[数学公式11]
在等式(11)中,Σpowerlin(ib,J)指示低频侧的子带ib(其中0≤ib≤sb)的子带信号的每个样本的样本值的均方根值的和。
因此,通过从高频子带功率和powerhigh(J)中减去下述值来获得要处理的帧J中的特征量powertilt(J):所述值是通过取得低频侧的子带的子带信号的样本的均方根值的和(即低频子带功率和)的对数而获得的。也就是,通过获得低频子带功率与高频子带功率之间的差来计算特征量powertilt(J)。
以上述方式获得的特征量powertilt(J)指示要处理的帧J中的要估计的高频子带功率和关于低频子带功率之比。因此,随着特征量powertilt(J)的值增大,在帧J中,高频侧关于低频侧的相对功率增加。
在区间数确定特征量计算电路36将所计算的特征量powertilt(J)提供给准高频子带功率差计算电路37之后,执行步骤S135至步骤S147的处理,从而编码处理结束。
由于这些处理与图5所示的步骤S15至步骤S27的处理相似,所以省略其描述。在步骤S139,确定单元51通过将被计算为区间数确定特征量的指示频率概况的特征量powertilt(J)的代表值与阈值进行比较,来确定构成处理目标区间的连续帧区间的数目。
具体地,例如,处理目标区间中的每个帧的区间数确定特征量的最大值被定义为代表值,当代表值等于或大于40时,连续帧区间的数目被设置为16,当代表值等于或大于30且等于或小于40时,连续帧区间的数目被设置为8。此外,当代表值等于或大于20且等于或小于30时,连续帧区间的数目被设置为4,当代表值等于或大于10且等于或小于20时,连续帧区间的数目被设置为2,并且当代表值小于10时,连续帧区间的数目被设置为1。
例如,当输入信号的要处理的帧是人的语音的辅音部分或乐器的钗钹部分(high-hat part)时,高频子带功率和大于低频子带功率和。也就是,作为区间数确定特征量的特征量powertilt(J)的值增加。
在输入信号的这种类型的帧中,由于高频编码而产生的声音质量的退化变得相对显著。因此,当区间数确定特征量的代表值大时,确定单元51增加连续帧区间的数目,使得可以通过解码侧的估计获得更接近原始信号的高频子带信号。利用该配置,可以提高通过解码获得的音频信号的清晰度,因此可以声学上改进声音质量。
与之相比,确定单元51通过减少代表值小的区间中的连续帧区间的数目来减少高频编码数据的编码量,而不会使声音质量退化。
以此方式,甚至在使用指示频率概况的区间数确定特征量的情况下,可以提高通过解码获得的音频的声学声音质量,同时可以减少输出代码串的编码量,使得可以提高输入信号的编码效率。
<变型示例4>
[编码处理的描述]
替选地,上述包括子带功率和、指示攻击特性或衰减特性的特征量、指示频率概况的特征量的多个特征量中的任何特征量的线性和也可以用作区间数确定特征量。
在这种情况下,编码装置11执行例如图10所示的编码处理。下面将参照图10所示的流程图描述编码装置11进行的编码处理。步骤S171至步骤S173的处理与图5所示的步骤S11至步骤S13的处理相似,因此省略其描述。
在步骤S174,区间数确定特征量计算电路36基于从子带分割电路33提供的低频子带信号和高频子带信号来计算多个特征量,并通过获得特征量的线性和来计算区间数确定特征量。
例如,区间数确定特征量计算电路36通过计算上述等式(1)、等式(9)、等式(10)和等式(11)来计算子带功率和powerhigh(J)、特征量powerattack(J)、特征量powerdecay(J)和特征量powertilt(J)。
此外,区间数确定特征量计算电路36通过计算以下等式(12),经由获得子带功率和powerhigh(J)和诸如特征量powerattack(J)的特征量的线性和来计算特征量feature(J)。
[数学公式12]
feature(J)=Whigh×powerhigh(J)+Wattack×powerattack(J)
+Wdecay×powerdecay(J)+Wtilt×powertilt(J)
…(12)
在等式(12)中,Whigh、Wattack、Wdecay和Wtilt是分别要与子带功率和powerhigh(J)、特征量powerattack(J)、特征量powerdecay(J)和特征量powertilt(J)相乘的权重,它们例如是Whigh=1,Wattack=3,Wdecay=3和Wtilt=3。
随着高频子带功率和增大,随着子带功率的时间变化增大或随着高频子带功率关于低频子带功率增大,以上述方式获得的特征量feature(J)的值增大。替选地,可以计算多个特征量的非线性和作为区间数确定特征量。
在区间数确定特征量计算电路36将作为区间数确定特征量被计算的特征量feature(J)提供给准高频子带功率差计算电路37之后,执行步骤S175至步骤S187的处理,从而编码处理结束。
由于这些处理与图5所示的步骤S15至步骤S27的处理相似,所以省略其描述。在步骤S179,确定单元51通过将特征量feature(J)的代表值与阈值进行比较来确定构成处理目标区间的连续帧区间的数目。
具体地,例如,当处理目标区间中的帧的区间数确定特征量的最大值被定义为代表值并且代表值等于或大于460时,连续帧区间的数目被设置为16,当代表值等于或大于350且等于或小于460时,连续帧区间的数目被设置为8。此外,当代表值等于或大于240且等于或小于350时,连续帧区间的数目被设置为4,当代表值等于或大于130且等于或小于240时,连续帧区间的数目被设置为2,并且当代表值小于130时,连续帧区间的数目被设置为1。
甚至在使用特征量feature(J)作为区间数确定特征量的情况下,可以提高通过解码获得的音频的声学声音质量,同时可以通过增加连续帧区间的数目来减少输出代码串的编码量,因为区间包括较大的区间数确定特征量。这使得能够提高输入信号的编码效率。
<第二实施例>
[编码处理的描述]
虽然上面描述了处理目标区间被分割成具有相同区间长度的多个连续帧区间,但是构成处理目标区间的连续帧可以被配置成具有彼此不同的 长度。适当地将连续帧区间的长度设置为彼此不同,可以更适当地选择每个帧的系数索引,因此可以进一步提高通过解码获得的音频的声音质量。
当将连续帧区间的长度设置为彼此不同时,编码装置11执行图11所示的编码处理。下面参照图11所示的流程图描述编码装置11进行的编码处理。步骤S211至步骤S219的处理与图5所示的步骤S11至步骤S19的处理相似,因此省略其描述。
在步骤S220,评估值和计算单元52通过使用针对每个帧的每个系数索引(估计系数的集合)计算的评估值来针对每个系数索引计算构成连续帧区间的帧的评估值的和。
例如,假设在步骤S219所确定的连续帧区间的数目为ndiv,评估值和计算单元52将处理目标区间分割成任意长度的ndiv个连续帧区间。在这种情况下,连续帧区间的长度可以彼此相同或不同。
具体地,当连续帧区间的数目ndiv为3时,例如,图2所示的处理目标区间被分割成三个区间,包括从位置FST1到位置FC1的区间、从位置FC1到位置FC2的区间、以及从位置FC2到位置FSE1的区间。这三个区间中的每个区间于是被定义为连续帧区间。
当处理目标区间被分割成连续帧区间时,评估值和计算单元52通过执行上述等式(8)的计算来针对每个系数索引计算构成连续帧区间的帧的评估值和Ressum(id,igp)。
例如,对于图2所示的从位置FST1到位置FC1的区间,针对每个系数索引计算构成区间的帧的评估值的和。类似地,对于从位置FC1到位置FC2的区间以及从位置FC2到位置FSE1的区间,针对每个系数索引计算评估值的和。
利用该配置,针对构成处理目标区间的每个连续帧区间的每个系数索引,获得连续帧区间的评估值和Ressum(id,igp)。
评估值和计算单元52针对在将处理目标区间分割成ndiv个连续帧区间时可以取得的每个分割组合,关于每个系数索引来计算处理目标区间的每个连续帧区间的评估值和。例如,图2所示的示例示出了在处理目标区间被分割成三个连续帧区间的情况下的分割组合。
在步骤S221,选择单元53基于针对处理目标区间的每个分割组合而获得的每个系数索引的连续帧区间的评估值和来选择每个帧的索引系数。
具体地,选择单元53针对处理目标区间的每个分割组合来选择组合的每个连续帧区间的系数索引。也就是,选择单元53从多个系数索引之中选择使针对连续帧区间获得的评估值和最小化的系数索引,作为连续帧区间的系数索引。
此外,选择单元53针对处理目标区间的分割组合获得在每个连续帧区间中选择的系数索引的评估值和的和。
例如,在图2所示的示例中,假设针对从位置FST1到位置FC1的区间、从位置FC1到位置FC2的区间、以及从位置FC2到位置FSE1的区间分别选择系数索引“2”、“5”和“1”。
在这种情况下,从位置FST1到位置FC1的区间的系数索引“2”的评估值和、从位置FC1到位置FC2的区间的系数索引“5”的评估值和以及从位置FC2到位置FSE1的区间的系数索引“1”的评估值和之和被获得。
当针对处理目标区间的预定分割组合关于每个帧选择系数索引时,以上述方式获得的评估值和可以被认为是每个帧的系数索引的评估值的和。因此,考虑到整个处理目标区间,使评估值和之和最小化的分割组合变为使得针对每个帧选择最优系数索引的组合。
当针对处理目标区间的每个分割组合获得评估值和之和时,选择单元53识别出使评估值和之和最小化的组合。选择单元53然后将识别到的组合的每个连续帧区间设置为最终的连续帧区间,并选择连续帧区间中所选择的系数索引作为构成连续帧区间的每个帧的最终的系数索引。
在以上述方式针对每个连续帧区间选择构成连续帧区间的帧的系数索引之后,执行步骤S222至步骤S227的处理,从而编码处理结束。这些处理与图5所示的步骤S22至步骤S27的处理相似,因此省略其描述。
以此方式,编码装置11计算区间数确定特征量,根据区间数确定特征量来确定连续帧区间的数目,针对连续帧区间的每个组合来计算连续帧区间的评估值和之和,并从评估值和之和选择每个帧的系数索引。
通过针对连续帧区间的每个组合计算连续帧区间的评估值和之和并确定连续帧区间的最优组合和每个连续帧区间的系数索引,可以在解码时以高准确度估计高频分量。结果,可以提高通过解码获得的音频的声学声音质量,同时可以减少输出代码串的编码量,因此可以提高输入信号的编码效率。
虽然在图11所示的步骤S214描述了计算子带功率和powerhigh(J)作为区间数确定特征量的情况,但是也可以计算其它特征量作为区间数确定特征量。例如,可以获得特征量powerattack(J)、特征量powerdecay(J)、特征量powertilt(J)、特征量feature(J)等作为区间数确定特征量。
<第三实施例>
[编码装置的示例结构]
当本技术应用于考虑到输入信号的高频编码数据的编码量而对低频分量进行编码的情况时,可以以加快方式更简单地执行编码。当在对低频分量进行编码时考虑到高频编码数据的编码量时,例如,可以如图12所示配置编码装置。
图12所示的编码装置131以包括多个帧(例如16帧)的处理目标区间为单位对作为音频信号的输入信号进行编码,并输出作为编码的结果获得的输出代码串。下面描述了编码装置131通过可变长度系统生成高频编码数据的情况作为示例。然而,在编码装置131中,不执行可变长度系统与固定长度系统之间的切换,因此系统标志未包括在高频编码数据中。
编码装置131包括子带分割电路141、高频编码量计算电路142、低通滤波器143、低频编码电路144、低频解码电路145、子带分割电路146、延迟电路147、延迟电路148、延迟电路149、高频编码电路150、编码量调节电路151、编码量临时累积电路152、延迟电路153、以及复用电路154。
子带分割电路141将输入信号分割成多个子带信号,将所获得的低频子带信号提供给高频编码量计算电路142,并将高频子带信号提供给高频编码量计算电路142和延迟电路149。
高频编码量计算电路142基于从子带分割电路141提供的低频子带信号和高频子带信号,来计算通过对输入信号的高频分量进行编码而获得的高频编码数据的编码量(下文中为“高频编码量”)。
高频编码量计算电路142包括特征量计算单元161,其基于低频子带信号或高频子带信号中的至少一个来计算区间数确定特征量。此外,高频编码量计算电路142基于区间数确定特征量来确定连续帧区间的数目,并根据连续帧区间的数目来计算高频编码量。
高频编码量计算电路142将连续帧区间的数目提供给延迟电路148,并将高频编码量提供给低频编码电路144和延迟电路148。
低通滤波器143对所提供的输入信号进行滤波,并将作为滤波的结果获得的低频信号(其是输入信号的低频分量)提供给低频编码电路144。
低频编码电路144对来自低通滤波器143的低频信号进行编码,以使得通过对低频信号进行编码获得的低频编码数据的编码量等于或小于下述编码量:该编码量是通过从可以用于输入信号的处理目标区间的编码量减去从高频编码量计算电路142提供的高频编码量而获得的。低频编码电路144将通过对低频信号进行编码而获得的低频编码数据提供给低频解码单元145和延迟电路153。
低频解码电路145对从低频编码电路144提供的低频编码数据进行解码,并将作为解码的结果获得的解码低频信号提供给子带分割电路146。子带分割电路146将从低频解码电路145提供的解码低频信号分割成低频侧的多个子带的子带信号(下文中为“解码低频子带信号”),并将解码低频子带信号提供给延迟电路147。解码低频子带信号的子带的频带分别与低频子带信号的子带的频带相同。
延迟电路147将来自子带分割电路146的解码低频子带信号延迟,并将延迟的解码低频子带信号提供给高频编码电路150。延迟电路148使来自高频编码量计算电路142的高频编码量以及连续帧区间的数目延迟了预定时段,并将延迟的信号提供给高频编码电路150。延迟电路149将来自子带分割电路141的高频子带信号延迟,并将延迟的高频子带信号提供给高频编码电路150。
高频编码电路150基于从来自延迟电路147的解码低频子带信号获得的特征量以及来自延迟电路148的连续帧区间的数目,来对用于通过估计获得来自延迟电路149的高频子带信号的功率的信息进行编码,使得编码量等于或小于来自延迟电路148的高频编码量。
高频编码电路150包括计算单元162和选择单元163。计算单元162针对指示估计系数的每个系数索引计算高频侧的每个子带的评估值,选择单元163基于计算单元162计算的评估值来选择每个帧的系数索引。
此外,高频编码电路150将通过对包括系数索引的数据进行编码而获得的高频编码数据提供给复用电路154,并将高频编码数据的高频编码量提供给编码量调节电路151。
当通过高频编码电路150获得的实际高频编码量小于通过延迟电路148获得的高频编码量计算电路142的高频编码量时,编码量调节电路151 将剩余编码量提供给编码量临时累积电路152。编码量临时累积电路152累积剩余编码量。适当地请求该剩余编码量用于下一处理目标区间和后续处理目标区间。
延迟电路153将低频编码电路144获得的低频编码数据延迟预定时段,并将延迟的信号提供给复用电路154。复用电路154将来自延迟电路153的低频编码数据和来自高频编码电路150的高频编码数据复用,并输出作为复用的结果获得的输出代码串。
[编码处理的描述]
下面描述编码装置131的操作。当输入信号被提供给编码装置131并指示输入信号的编码时,编码装置131执行编码处理以对输入信号进行编码。
下面参照图13所示的流程图描述编码装置131进行的编码处理。以输入信号的处理目标区间为单位(例如,16帧)执行该编码处理。
在步骤S251,子带分割电路141将所提供的输入信号均等地分割成具有预定带宽的多个子带信号。所获得的子带信号之中的低频侧的特定范围内的子带信号被定义为低频子带信号,高频侧的特定范围内的子带信号被定义为高频子带信号。
子带分割电路141将通过子带分割获得的低频子带信号提供给高频编码量计算电路142,并将高频子带信号提供给高频编码量计算电路142和延迟电路149。
例如,根据输入信号的特性、比特率等在编码装置131侧设置高频子带信号的子带的范围。此外,低频子带信号的子带范围被设置为包括预定数目子带的频带,其中与高频子带信号的最低频子带紧挨着的低频侧的子带被设置为低频子带信号的最高频子带。
考虑在编码装置131与解码装置侧之间低频子带信号和高频子带信号的子带范围相同。
在步骤S252,高频编码量计算电路142的特征量计算单元161基于从子带分割电路141提供的低频子带信号或高频子带信号中的至少一个来计算区间数确定特征量。
例如,特征量计算单元161通过计算上述等式(9)来计算指示高频区的攻击特性的特征量powerattack(J)作为区间数确定特征量。针对构成处理 目标区间的每个帧计算区间数确定特征量。
此外,也可以计算子带功率和powerhigh(J)、特征量powerdecay(J)、特征量powertilt(J)、特征量feature(J)、多个特征量的非线性和等,作为区间数确定特征量。
在步骤S253,高频编码量计算电路142基于处理目标区间的每个帧的区间数确定特征量来确定连续帧区间的数目。
例如,高频编码量计算电路142将处理目标区间的每个帧的区间数确定特征量的最大值设置为区间数确定特征量的代表值,并通过将代表值与预定阈值进行比较来确定连续帧区间的数目。
具体地,例如,当代表值等于或大于40时,连续帧区间的数目被设置为16,并当代表值等于或大于30且等于或小于40时,连续帧区间的数目被设置为8。此外,当代表值等于或大于20且等于或小于30时,连续帧区间的数目被设置为4,当代表值等于或大于10且等于或小于20时,连续帧区间的数目被设置为2,并且当代表值小于10时,连续帧区间的数目被设置为1。
在步骤S254,高频编码量计算电路142基于所确定的连续帧区间的数目来计算高频编码数据的高频编码量。
在编码装置131中,由于高频编码数据是通过可变长度系统生成的,所以高频编码数据包括数目信息、区间信息和系数索引。
由于现在确定构成处理目标区间的连续帧区间的数目,当连续帧区间的数目为nDiv时,高频编码数据包括一条数目信息、(nDiv-1)条区间信息和nDiv个系数索引。
区间信息被设置为(nDiv-1)个,这是因为预先确定处理目标区间的长度,并且如果已知(nDiv-1)个连续帧区间的长度,则可以识别余下的一个连续帧区间的长度。
因此,可以根据(描述数目信息的比特数)+(nDiv-1)×(描述一条区间信息的比特数)+(nDiv)×(描述一个系数索引的比特数)来获得高频编码数据的编码量。
以此方式,在编码装置131中,甚至在实际上没有对输入信号的高频分量进行编码的情况下能够以较少的运算量获得高频编码数据的高频编码量,能够以加快方式开始低频分量的编码。
也就是,在过去的处理中,在确定高频编码数据所需要的编码量时,除非计算输入信号的低频子带功率和高频子带功率并针对每个帧选择系数索引,否则不可以获得必要的编码量。与之相比,编码装置131仅计算区间数确定特征量,由此能够以加快方式以较少的运算确定高频编码量。
虽然在步骤S254作为示例描述了通过可变长度系统生成高频编码数据的情况,但是即使在通过固定长度系统生成高频编码数据的情况下,也可以基于连续帧区间的数目计算高频编码量。
当通过固定长度系统生成高频编码数据时,高频编码数据包括固定长度索引、切换标志、以及系数索引。
在这种情况下,如从图3可见,高频编码数据包括一个固定长度索引、(nDiv-1)个切换标志、以及nDiv个系数索引。因此,可以根据(描述固定长度索引的比特数)+(nDiv-1)×(描述一个切换标志的比特数)+(nDiv)×(描述一个系数索引的比特数)获得高频编码数据的编码量。
当计算高频编码量时,高频编码量计算电路142将所计算的高频编码量提供给低频编码电路144和延迟电路148,并将连续帧区间的数目提供给延迟电路148。
在步骤S255,低通滤波器143利用低通滤波器对所提供的输入信号进行滤波,并将作为滤波结果获得的低频信号提供给低频编码电路144。虽然在滤波处理中使用的低通滤波器的截止频率可以被设置为任意频率,但是在本实施例中,截止频率被设置为对应于上述低频子带信号的最高频。
在步骤S256,低频编码电路144对来自低通滤波器143的低频信号进行编码,使得低频编码数据的编码量等于或小于低频编码量,并将作为编码结果获得的低频编码数据提供给低频解码电路145和延迟电路153。
这里提到的低频编码量是作为低频编码数据的目标的编码量。低频编码电路144通过以下操作来计算低频编码量:从预先确定的可用于整个处理目标区间的编码量减去从高频编码量计算电路142提供的高频编码量,并将编码量临时累积电路152中累积的剩余编码量与该减法的结果相加。
当通过实际上对低频信号进行编码获得的低频编码数据的编码量小于低频编码量时,低频编码电路144将低频编码数据的实际编码量和低频编码量提供给编码量调节电路151。
编码量调节电路151将通过从自低频编码电路144提供的低频编码量 减去低频编码数据的实际编码量而获得的编码量提供给编码量临时累积电路152,以将编码量相加到剩余编码量。利用该操作,在编码量临时累积电路152中记录的剩余编码量被更新。
另一方面,当低频编码数据的实际编码量与低频编码量相匹配时,编码量调节电路151使得编码量临时累积电路152以剩余编码量的零增量执行剩余编码量的更新。
在步骤S257,低频解码电路145对从低频编码电路144提供的低频编码数据进行解码,并将通过解码获得的解码低频信号提供给子带分割电路146。在编码装置131中,可以采用各种方法作为对低频信号进行编码和解码的编码方法,例如,可以采用ACELP(代数码激励线性预测)、AAC(高级音频编码)等。
在步骤S258,子带分割电路146将从低频解码电路145提供的解码低频信号分割成多个子带的解码低频子带信号,并将解码低频子带信号提供给延迟电路147。子带分割中的每个子带的最低和最高频率被认为与子带分割电路141在步骤S251执行的子带分割中的每个子带的最低和最高频率相同。也就是,解码低频子带信号的每个子带的频带被认为与低频子带信号的每个子带的频带相同。
在步骤S259,延迟电路147将从子带分割电路146提供的解码低频子带信号延迟了特定时间样本,并将延迟的信号提供给高频编码电路150。延迟电路148和延迟电路149延迟连续帧区间的数目、高频编码量和高频子带信号,并将延迟的信号提供给高频编码电路150。
延迟电路147或延迟电路148处的延迟量使高频子带信号、高频编码量和解码低频子带信号同步,并需要通过低频或高频编码方法被设置为适当值。根据编码方法的配置,每个延迟电路的延迟量可以被设置为零。延迟电路153的功能与延迟电路147的功能相似,因此省略其描述。
在步骤S260,高频编码电路150基于来自延迟电路147的解码低频子带信号、来自延迟电路148的连续帧区间的数目、以及来自延迟电路149的高频子带信号,来对输入信号的高频分量进行编码以使得编码量等于或小于来自延迟电路148的高频编码量。
例如,计算单元162通过基于解码低频子带信号执行与上述等式(2)相似的运算来计算每个低频子带的低频子带功率power(ib,J),并通过执行相似运算来计算来自高频子带信号的每个高频子带的高频子带功率。此 外,计算单元162基于低频子带功率和预先记录的估计系数的集合,通过执行等式(3)的运算来计算每个高频子带的准高频子带功率。
计算单元162基于高频子带功率和准高频子带功率,执行上述等式(4)至等式(7)的运算来计算每个帧的评估值Res(id,J)。针对指示在低频子带功率的计算中使用的估计系数的集合的每个系数索引来执行评估值Res(id,J)的计算。
此外,计算单元162将处理目标区间均等地分割成通过连续帧区间的数目指示的区间的数目,并将每个分割区间定义为连续帧区间。计算单元162使用关于每个帧针对每个系数索引计算的评估值,通过计算上述等式(8)来针对每个系数索引计算评估和Ressum(id,igp)。
此外,选择单元163基于关于每个连续帧区间针对每个系数索引获得的评估值和,通过执行与图5所示的步骤S21的处理相似的处理来选择每个帧的系数索引。也就是,选择使得针对连续帧集合获得的评估值和Ressum(id,igp)最小化的系数索引,作为构成连续帧区间的每个帧的系数索引。
可以在彼此邻接的连续帧区间选择相同的系数索引,并且在这种情况下,选择相同的系数索引且被连续布置的连续帧区间最后被认为是一个连续帧区间。
当选择每个帧的系数索引时,高频编码电路150通过执行与图5所示的步骤S25和步骤S26的处理相似的处理来对包括区间信息、数目信息和系数索引的数据进行编码,以生成高频编码数据。
以上述方式获得的高频编码数据的编码量总是等于或小于高频编码量。例如,当针对连续布置的连续帧区间选择相同的系数索引时,连续帧区间的最终数目小于通过高频编码量计算电路142获得的连续帧区间的数目。在这种情况下,不仅高频编码数据中包括的系数索引的数目小于通过高频编码量计算电路142获得的连续帧区间的数目,而且区间信息的条数减少。
因此,在这种情况下,高频编码数据的实际编码量小于通过高频编码量计算电路142获得的高频编码量。
另一方面,当针对连续布置的连续帧区间没有选择相同的系数索引时,连续帧区间的数目与高频编码量计算电路142获得的连续帧区间的数目相匹配,因此高频编码数据的实际编码量还与高频编码数据相匹配。
虽然在步骤S260描述了处理目标区间被均等地分割成连续帧区间的情况,但是处理目标区间也可以被分割成任意长度的多个连续帧区间。
在这种情况下,在步骤S260,在计算每个帧的评估值Res(id,J)之后,执行与图11所示的步骤S220和步骤S221的处理相似的处理,使得选择每个帧的系数索引。此后,对包括所选择的系数索引、固定长度索引和切换标志的数据进行编码,以生成高频编码数据。
在步骤S261,高频编码电路150确定通过编码获得的高频编码数据的编码量是否小于在步骤S254计算的高频编码量。
在步骤S261,当确定高频编码数据的编码量不小于高频编码量时,即当高频编码数据的编码量与高频编码量相匹配时,没有生成符号的正或负变化,因此处理移至步骤S265。在这种情况下,高频编码电路150将通过高频编码获得的高频编码数据提供给复用电路154。
另一方面,在步骤S261,当确定高频编码数据的编码量小于高频编码量时,在步骤S262,编码量调节电路151在编码量临时累积电路152中累积高频编码数据的编码量和高频编码量之间的差。也就是,高频编码数据的编码量与高频编码量之间的差的编码量被相加到在编码量临时累积电路152中累积的剩余编码量,使得剩余编码量更新。上述编码量临时累积电路152还以比特解析器的名称用在AAC中,以执行要处理的帧之间的编码量的调节。
在步骤S263,编码量调节电路151确定编码量临时累积电路152中累积的剩余编码量是否达到预定上限。
例如,在编码量临时累积电路152中,预先确定可以被认为是剩余编码量的编码量的上限(下文中为“上限编码量”)。当在步骤S262开始的在编码量临时累积电路152中对高频编码数据的编码量与高频编码量之间的差进行累积时剩余编码量达到上限编码量时,在步骤S263编码量调节电路151确定剩余编码量达到上限。
在步骤S263,当确定剩余编码量没有达到上限时,高频编码数据的编码量与高频编码量之间的全部差被相加到剩余编码量,使得剩余编码量更新。此后,高频编码电路150将通过高频编码获得的高频编码数据提供给复用电路154,并且处理移至步骤S265。
另一方面,当在步骤S263确定剩余编码量达到上限时,在步骤S264,高频编码电路150关于高频编码数据重置为零。
当在高频编码数据的编码量与高频编码量之间的差相加到剩余编码量的情况下剩余编码量达到上限时,被留下而没有相加到剩余编码量的、高频编码数据的编码量与高频编码量之间的差的编码量未被处理。该未处理的编码量不能相加到剩余编码量,因此高频编码电路150针对该未处理的编码量将标记“0”添加到高频编码数据的末端,使得未处理的编码量明显是用于生成高频编码数据。在解码时,在输入信号的解码中不使用相加到高频编码数据的末端的标记“0”。
当执行将标记“0”添加到高频编码数据的末端的重置时,高频编码电路150将重置后的高频编码数据提供给复用电路154,并且处理移至步骤S265。
当在步骤S261确定高频编码数据的编码量不小于高频编码量时,当在步骤S263确定剩余编码量没有达到上限时,或当在步骤S264执行重置时,执行步骤S265的处理。
也就是,在步骤S265,复用电路154通过将来自延迟电路153的低频编码数据和来自高频编码电路150的高频编码数据复用来生成输出代码串,并输出该输出代码串。在这种情况下,复用电路154将低频编码数据和高频编码数据与指示低频侧的输入信号的上子带和下子带的索引一起复用。通过以此方式输出该输出代码串,编码处理结束。
如上所述,编码装置131通过根据高频和低频子带信号计算连续帧区间的数目来计算高频编码数据,以根据高频编码量确定的编码量对低频信号进行编码,并基于通过对低频编码数据进行解码获得的解码低频信号和高频编码量来对高频分量进行编码。
以此方式,通过根据连续帧区间的数目计算高频编码量,可以在不执行高频分量的编码的情况下获得高频编码所需要的编码量。因此,与常规方法相比,当通过选择每个帧的系数索引所需要的运算来计算高频编码量时,可以减少运算量。此外,考虑到输入信号的特征,可以比常规方法更适当地确定高频编码数据的比特使用量(编码量)。
此外,上述编码技术可以应用于例如作为音频编码系统等之一的AC-3(ATSC A/52“数字音频压缩标准(AC-3)”)。
在AC-3中,音频信号的一帧包括多个块,关于在每个块是否按原样使用紧接在前的块中频率转换之后的系数的浮点表示中的指数部分的值的信息包括在比特流中。
在这种情况下,共用一帧中的相同的指数部分的值的连续块集合被称作连续块区间。在通常的AC-3系统的编码装置中,当帧中要编码的输入信号处于稳态时,即具有较少时间变化的信号,一帧包括大量连续帧区间。
通过应用上面描述的本技术适当地确定这样的连续块区间的数目,可以以必要最低限度的连续块区间,即必要最低限度的比特使用量,高效地执行编码。
上述系列处理可以通过硬件执行或可以通过软件执行。当该系列处理通过软件执行时,从嵌入专用硬件中的计算机中的、被配置成通过安装各种程序执行各种功能的通用个人计算机等中的程序记录介质安装构成软件的程序。
图14是示出通过执行程序实现上述系列处理的计算机的硬件的配置示例的框图。
在计算机中,CPU(中央处理单元)301、ROM(只读存储器)302和RAM(随机存取存储器)303经由总线304彼此相连。
输入/输出接口305还连接到总线304。包括键盘、鼠标、麦克风等的输入单元306,包括扬声器等的输出单元307,包括硬盘、非易失性存储器等的记录单元308,包括网络接口等的通信单元309,用于驱动可拆卸介质311(诸如磁盘、光盘、磁光盘或半导体存储器)的驱动器310连接到输入/输出接口305。
在以上述方式配置的计算机中,例如,CPU301经由输入/输出接口305和总线304将记录单元308中记录的程序加载到RAM303中,并执行加载程序,通过该加载程序,执行上述系列处理。
计算机(CPU301)执行的程序可以通过例如记录在磁盘(包括软盘)、光盘(CD-ROM(致密盘-只读存储器)、DVD(数字多功能盘)等)、磁光盘或包括半导体存储器的作为封装介质的可拆卸介质311中来提供,或经由诸如局域网、因特网、数字卫星广播等有线介质或无线介质来提供。
程序可以通过将可拆卸介质311安装在驱动器310上而经由输入/输出接口305安装在记录单元308中。此外,程序可以经由有线或无线传输介质由通信单元309接收并安装在记录单元308中。替选地,程序可以被预先安装在ROM302或记录单元308中。
计算机要执行的程序可以是用于根据本说明书中描述的顺序以时间次序执行操作的程序,或可以是用于并行地执行操作或在必要时(诸如在 存在调用时)执行操作的程序。
此外,本技术的实施例不限于上述实施例,但是可以在不背离本技术的总发明构思的精神或范围的情况下进行各种修改。
此外,本技术还可以通过以下配置来实现。
[1]一种编码装置,包括:
子带分割单元,被配置成生成输入信号的低频侧的子带的低频子带信号和所述输入信号的高频侧的子带的高频子带信号;
准高频子带功率计算单元,被配置成基于所述低频子带信号和预定估计系数来计算准高频子带功率,所述准高频子带功率是所述高频子带信号的高频子带功率的估计值;
特征量计算单元,被配置成基于所述低频子带信号或所述高频子带信号中的至少之一来计算区间数确定特征量;
确定单元,被配置成基于所述区间数确定特征量来确定在包括所述输入信号的多个帧的处理目标区间中的连续帧区间的数目,所述连续帧区间包括下述帧:针对所述帧,选择相同的估计系数;
选择单元,被配置成在通过基于所确定的连续帧区间的数目分割所述处理目标区间而获得的每个连续帧区间中,基于所述准高频子带功率和所述高频子带功率来从多个估计系数中选择构成所述连续帧区间的帧的估计系数;
生成单元,被配置成生成下述数据:所述数据用于获得在构成所述处理目标区间的每个所述连续帧区间的帧中选择的所述估计系数;
低频编码单元,被配置成对所述输入信号的低频信号进行编码以生成低频编码数据;以及
复用单元,被配置成对所述数据和所述低频编码数据进行复用以生成输出代码串。
[2]根据[1]所述的编码装置,其中所述区间数确定特征量包括指示所述高频子带功率之和的特征量。
[3]根据[1]所述的编码装置,其中所述区间数确定特征量包括指示所述高频子带功率之和的时间变化的特征量。
[4]根据[1]所述的编码装置,其中所述区间数确定特征量包括指示所 述输入信号的频率概况的特征量。
[5]根据[1]所述的编码装置,其中所述区间数确定特征量包括多个特征量的线性和或非线性和。
[6]根据[1]至[5]中任一项所述的编码装置,还包括:评估值和计算单元,被配置成基于指示针对每个所述估计系数计算的、帧中的所述准高频子带功率与所述高频子带功率之间的误差的评估值,针对每个所述估计系数来计算构成所述连续帧区间的每个帧的所述评估值之和,其中
所述选择单元被配置成基于针对每个所述估计系数计算的所述评估值之和来选择所述连续帧区间的帧的估计系数。
[7]根据[6]所述的编码装置,其中通过用所确定的连续帧区间的数目来均等地分割所述处理目标区间而获得的每个区间被定义为所述连续帧区间。
[8]根据[6]所述的编码装置,其中,所述选择单元被配置成:基于针对在用所确定的连续帧区间的数目分割所述处理目标区间时能够取得的所述处理目标区间的分割的每个组合的所述评估值之和,来选择所述连续帧区间的帧的估计系数;从所述组合之中识别使得构成所述处理目标区间的所有帧的所选择的估计系数的所述评估值之和最小化的组合;以及将每个帧中选择的所述估计系数定义为所识别的组合中的对应帧的估计系数。
[9]根据[1]至[8]中任一项所述的编码装置,还包括:高频编码单元,被配置成对所述数据进行编码以生成高频编码数据,其中
所述复用单元被配置成通过将所述高频编码数据和所述低频编码数据进行复用而生成所述输出代码串。
[10]根据[9]所述的编码装置,其中
所述确定单元被配置成还基于所确定的连续帧区间的数目来计算所述处理目标区间的高频编码数据的编码量,并且
所述低频编码单元被配置成以下述编码量对所述低频信号进行编码:所述编码量是根据预先针对所述处理目标区间确定的编码量和所计算的高频编码数据的编码量而确定的。
[11]一种编码方法,包括步骤:
生成输入信号的低频侧的子带的低频子带信号和所述输入信号的高频侧的子带的高频子带信号;
基于所述低频子带信号和预定估计系数来计算准高频子带功率,所述准高频子带功率是所述高频子带信号的高频子带功率的估计值;
基于所述低频子带信号或所述高频子带信号中的至少之一来计算区间数确定特征量;
基于所述区间数确定特征量来确定在包括所述输入信号的多个帧的处理目标区间中的连续帧区间的数目,所述连续帧区间包括下述帧:针对所述帧,选择相同的估计系数;
在通过基于所确定的连续帧区间的数目分割所述处理目标区间而获得的每个连续帧区间中,基于所述准高频子带功率和所述高频子带功率来从多个估计系数中选择构成所述连续帧区间的帧的估计系数;
生成下述数据:所述数据用于获得在构成所述处理目标区间的每个所述连续帧区间的帧中选择的所述估计系数;
通过对所述输入信号的低频信号进行编码来生成低频编码数据;以及
通过对所述数据和所述低频编码数据进行复用来生成输出代码串。
[12]一种程序,被配置成使计算机执行步骤:
生成输入信号的低频侧的子带的低频子带信号和所述输入信号的高频侧的子带的高频子带信号;
基于所述低频子带信号和预定估计系数来计算准高频子带功率,所述准高频子带功率是所述高频子带信号的高频子带功率的估计值;
基于所述低频子带信号或所述高频子带信号中的至少之一来计算区间数确定特征量;
基于所述区间数确定特征量来确定在包括所述输入信号的多个帧的处理目标区间中的连续帧区间的数目,所述连续帧区间包括下述帧:针对所述帧,选择相同的估计系数;
在通过基于所确定的连续帧区间的数目分割所述处理目标区间而获得的每个连续帧区间中,基于所述准高频子带功率和所述高频子带功率来从多个估计系数中选择构成所述连续帧区间的帧的估计系数;
生成下述数据:所述数据用于获得在构成所述处理目标区间的每个所述连续帧区间的帧中选择的所述估计系数;
通过对所述输入信号的低频信号进行编码来生成低频编码数据;以及
通过对所述数据和所述低频编码数据进行复用来生成输出代码串。
[13]一种解码装置,包括:
解复用单元,被配置成将输入代码串解复用成用于获得在构成处理目标区间的每个连续帧区间的帧中选择的估计系数的数据、以及通过对输入信号的低频信号进行编码而获得的低频编码数据,所述数据是基于下述操作的结果而生成的:基于输入信号的低频子带信号和预定估计系数来计算所述输入信号的高频子带信号的高频子带功率的估计值;基于从所述输入信号中提取的区间数确定特征量来确定在包括所述输入信号的多个帧的处理目标区间中的连续帧区间的数目,所述连续帧区间包括这样的帧,针对所述帧,选择相同的估计系数;以及在通过基于所确定的连续帧区间的数目分割所述处理目标区间而获得的每个所述连续帧区间中,基于所述估计值和所述高频子带功率来从多个估计系数中选择构成所述连续帧区间的帧的估计系数;
低频解码单元,被配置成对所述低频编码数据进行解码以生成低频信号;
高频信号生成单元,被配置成基于从所述数据获得的所述估计系数和从所述解码获得的所述低频信号来生成高频信号;以及
组合单元,被配置成基于所述高频信号和从所述解码获得的所述低频信号来生成输出信号。
[14]根据[13]所述的解码装置,还包括:高频解码单元,被配置成对所述数据进行解码以获得所述估计系数。
[15]根据[13]或[14]所述的解码装置,其中
基于指示针对每个所述估计系数计算的、所述帧中的所述估计值与所述高频子带功率之间的误差的评估值,针对每个所述估计系数来计算构成所述连续帧区间的每个帧的所述评估值之和,并且
基于针对每个所述估计系数计算的所述评估值之和,选择所述连续帧区间的帧的估计系数。
[16]根据[15]所述的解码装置,其中,通过用所确定的连续帧区间的数目均等地分割所述处理目标区间而获得的每个区间被定义为所述连续帧区间。
[17]根据[15]所述的解码装置,其中
基于针对在用所确定的连续帧区间的数目分割所述处理目标区间时能够取得的所述处理目标区间的分割的每个组合的所述评估值之和,来选择所述连续帧区间的帧的估计系数;
从所述组合之中识别使得构成所述处理目标区间的所有帧的所选择的估计系数的所述评估值之和最小化的组合;以及
将每个帧中选择的所述估计系数定义为所识别的组合中的对应帧的估计系数。
[18]一种解码方法,包括步骤:
将输入代码串解复用成用于获得在构成处理目标区间的每个连续帧区间的帧中选择的估计系数的数据、以及通过对输入信号的低频信号进行编码而获得的低频编码数据,所述数据是基于下述操作的结果而生成的:基于输入信号的低频子带信号和预定估计系数来计算所述输入信号的高频子带信号的高频子带功率的估计值;基于从所述输入信号中提取的区间数确定特征量来确定在包括所述输入信号的多个帧的处理目标区间中的连续帧区间的数目,所述连续帧区间包括这样的帧,针对所述帧,选择相同的估计系数;以及在通过基于所确定的连续帧区间的数目分割所述处理目标区间而获得的每个所述连续帧区间中,基于所述估计值和所述高频子带功率来从多个估计系数中选择构成所述连续帧区间的帧的估计系数;
通过对所述低频编码数据进行解码来生成低频信号;
基于从所述数据获得的所述估计系数和从所述解码获得的所述低频信号来生成高频信号;以及
基于所述高频信号和从所述解码获得的所述低频信号来生成输出信号。
[19]一种程序,被配置成使计算机执行步骤:
将输入代码串解复用成用于获得在构成处理目标区间的每个连续帧区间的帧中选择的估计系数的数据、以及通过对输入信号的低频信号进行编码而获得的低频编码数据,所述数据是基于下述操作的结果而生成的:基于输入信号的低频子带信号和预定估计系数来计算所述输入信号的高频子带信号的高频子带功率的估计值;基于从所述输入信号中提取的区间数确定特征量来确定在包括所述输入信号的多个帧的处理目标区间中的连续帧区间的数目,所述连续帧区间包括这样的帧,针对所述帧,选择相同的估计系数;以及在通过基于所确定的连续帧区间的数目分割所述处理 目标区间而获得的每个所述连续帧区间中,基于所述估计值和所述高频子带功率来从多个估计系数中选择构成所述连续帧区间的帧的估计系数;
通过对所述低频编码数据进行解码来生成低频信号;
基于从所述数据获得的所述估计系数和从所述解码获得的所述低频信号来生成高频信号;以及
基于所述高频信号和从所述解码获得的所述低频信号来生成输出信号。
附图标记列表
11 编码装置、32 低频编码电路、33 子带分割电路、34 特征量计算电路、35 准高频子带功率计算电路、36 区间数确定特征量计算电路、37 准高频子带功率差计算电路、38 高频编码电路、39 复用电路、51 确定单元、52 评估值计算单元、53 选择单元、54 生成单元
Claims (17)
1.一种编码装置,包括:
子带分割单元,被配置成生成输入信号的低频侧的子带的低频子带信号和所述输入信号的高频侧的子带的高频子带信号;
准高频子带功率计算单元,被配置成基于所述低频子带信号和预定估计系数来计算准高频子带功率,所述准高频子带功率是所述高频子带信号的高频子带功率的估计值;
特征量计算单元,被配置成基于所述低频子带信号或所述高频子带信号中的至少之一来计算区间数确定特征量;
确定单元,被配置成基于所述区间数确定特征量来确定在包括所述输入信号的多个帧的处理目标区间中的连续帧区间的数目,所述连续帧区间包括下述帧:针对所述帧,选择相同的估计系数;
选择单元,被配置成在通过基于所确定的连续帧区间的数目分割所述处理目标区间而获得的每个连续帧区间中,基于所述准高频子带功率和所述高频子带功率来从多个估计系数中选择构成所述连续帧区间的帧的估计系数;
生成单元,被配置成生成下述数据:所述数据用于获得在构成所述处理目标区间的每个所述连续帧区间的帧中选择的所述估计系数;
低频编码单元,被配置成对所述输入信号的低频信号进行编码以生成低频编码数据;以及
复用单元,被配置成对所述数据和所述低频编码数据进行复用以生成输出代码串。
2.根据权利要求1所述的编码装置,其中所述区间数确定特征量包括指示所述高频子带功率之和的特征量。
3.根据权利要求1所述的编码装置,其中所述区间数确定特征量包括指示所述高频子带功率之和的时间变化的特征量。
4.根据权利要求1所述的编码装置,其中所述区间数确定特征量包括指示所述输入信号的频率概况的特征量。
5.根据权利要求1所述的编码装置,其中所述区间数确定特征量包括多个特征量的线性和或非线性和。
6.根据权利要求1所述的编码装置,还包括:评估值和计算单元,被配置成基于指示针对每个所述估计系数计算的、帧中的所述准高频子带功率与所述高频子带功率之间的误差的评估值,针对每个所述估计系数来计算构成所述连续帧区间的每个帧的所述评估值之和,其中
所述选择单元被配置成基于针对每个所述估计系数计算的所述评估值之和来选择所述连续帧区间的帧的估计系数。
7.根据权利要求6所述的编码装置,其中通过用所确定的连续帧区间的数目来均等地分割所述处理目标区间而获得的每个区间被定义为所述连续帧区间。
8.根据权利要求6所述的编码装置,其中,所述选择单元被配置成:基于针对在用所确定的连续帧区间的数目分割所述处理目标区间时能够取得的所述处理目标区间的分割的每个组合的所述评估值之和,来选择所述连续帧区间的帧的估计系数;从所述组合之中识别使得构成所述处理目标区间的所有帧的所选择的估计系数的所述评估值之和最小化的组合;以及将每个帧中选择的所述估计系数定义为所识别的组合中的对应帧的估计系数。
9.根据权利要求1所述的编码装置,还包括:高频编码单元,被配置成对所述数据进行编码以生成高频编码数据,其中
所述复用单元被配置成通过将所述高频编码数据和所述低频编码数据进行复用而生成所述输出代码串。
10.根据权利要求9所述的编码装置,其中
所述确定单元被配置成还基于所确定的连续帧区间的数目来计算所述处理目标区间的高频编码数据的编码量,并且
所述低频编码单元被配置成以下述编码量对所述低频信号进行编码:所述编码量是根据预先针对所述处理目标区间确定的编码量和所计算的高频编码数据的编码量而确定的。
11.一种编码方法,包括步骤:
生成输入信号的低频侧的子带的低频子带信号和所述输入信号的高频侧的子带的高频子带信号;
基于所述低频子带信号和预定估计系数来计算准高频子带功率,所述准高频子带功率是所述高频子带信号的高频子带功率的估计值;
基于所述低频子带信号或所述高频子带信号中的至少之一来计算区间数确定特征量;
基于所述区间数确定特征量来确定在包括所述输入信号的多个帧的处理目标区间中的连续帧区间的数目,所述连续帧区间包括下述帧:针对所述帧,选择相同的估计系数;
在通过基于所确定的连续帧区间的数目分割所述处理目标区间而获得的每个连续帧区间中,基于所述准高频子带功率和所述高频子带功率来从多个估计系数中选择构成所述连续帧区间的帧的估计系数;
生成下述数据:所述数据用于获得在构成所述处理目标区间的每个所述连续帧区间的帧中选择的所述估计系数;
通过对所述输入信号的低频信号进行编码来生成低频编码数据;以及
通过对所述数据和所述低频编码数据进行复用来生成输出代码串。
12.一种解码装置,包括:
解复用单元,被配置成将输入代码串解复用成用于获得在构成处理目标区间的每个连续帧区间的帧中选择的估计系数的数据、以及通过对输入信号的低频信号进行编码而获得的低频编码数据,所述数据是基于下述操作的结果而生成的:基于输入信号的低频子带信号和预定估计系数来计算所述输入信号的高频子带信号的高频子带功率的估计值;基于从所述输入信号中提取的区间数确定特征量来确定在包括所述输入信号的多个帧的处理目标区间中的连续帧区间的数目,所述连续帧区间包括这样的帧,针对所述帧,选择相同的估计系数;以及在通过基于所确定的连续帧区间的数目分割所述处理目标区间而获得的每个所述连续帧区间中,基于所述估计值和所述高频子带功率来从多个估计系数中选择构成所述连续帧区间的帧的估计系数;
低频解码单元,被配置成对所述低频编码数据进行解码以生成低频信号;
高频信号生成单元,被配置成基于从所述数据获得的所述估计系数和从所述解码获得的所述低频信号来生成高频信号;以及
组合单元,被配置成基于所述高频信号和从所述解码获得的所述低频信号来生成输出信号。
13.根据权利要求12所述的解码装置,还包括:高频解码单元,被配置成对所述数据进行解码以获得所述估计系数。
14.根据权利要求13所述的解码装置,其中
基于指示针对每个所述估计系数计算的、所述帧中的所述估计值与所述高频子带功率之间的误差的评估值,针对每个所述估计系数来计算构成所述连续帧区间的每个帧的所述评估值之和,并且
基于针对每个所述估计系数计算的所述评估值之和,选择所述连续帧区间的帧的估计系数。
15.根据权利要求14所述的解码装置,其中,通过用所确定的连续帧区间的数目均等地分割所述处理目标区间而获得的每个区间被定义为所述连续帧区间。
16.根据权利要求14所述的解码装置,其中
基于针对在用所确定的连续帧区间的数目分割所述处理目标区间时能够取得的所述处理目标区间的分割的每个组合的所述评估值之和,来选择所述连续帧区间的帧的估计系数;
从所述组合之中识别使得构成所述处理目标区间的所有帧的所选择的估计系数的所述评估值之和最小化的组合;以及
将每个帧中选择的所述估计系数定义为所识别的组合中的对应帧的估计系数。
17.一种解码方法,包括步骤:
将输入代码串解复用成用于获得在构成处理目标区间的每个连续帧区间的帧中选择的估计系数的数据、以及通过对输入信号的低频信号进行编码而获得的低频编码数据,所述数据是基于下述操作的结果而生成的:基于输入信号的低频子带信号和预定估计系数来计算所述输入信号的高频子带信号的高频子带功率的估计值;基于从所述输入信号中提取的区间数确定特征量来确定在包括所述输入信号的多个帧的处理目标区间中的连续帧区间的数目,所述连续帧区间包括这样的帧,针对所述帧,选择相同的估计系数;以及在通过基于所确定的连续帧区间的数目分割所述处理目标区间而获得的每个所述连续帧区间中,基于所述估计值和所述高频子带功率来从多个估计系数中选择构成所述连续帧区间的帧的估计系数;
通过对所述低频编码数据进行解码来生成低频信号;
基于从所述数据获得的所述估计系数和从所述解码获得的所述低频信号来生成高频信号;以及
基于所述高频信号和从所述解码获得的所述低频信号来生成输出信号。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011-182449 | 2011-08-24 | ||
JP2011182449A JP6037156B2 (ja) | 2011-08-24 | 2011-08-24 | 符号化装置および方法、並びにプログラム |
PCT/JP2012/070683 WO2013027630A1 (ja) | 2011-08-24 | 2012-08-14 | 符号化装置および方法、復号装置および方法、並びにプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103765510A CN103765510A (zh) | 2014-04-30 |
CN103765510B true CN103765510B (zh) | 2016-08-17 |
Family
ID=47746377
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201280040029.1A Expired - Fee Related CN103765510B (zh) | 2011-08-24 | 2012-08-14 | 编码装置和方法、解码装置和方法 |
Country Status (12)
Country | Link |
---|---|
US (1) | US9842603B2 (zh) |
EP (1) | EP2750131A4 (zh) |
JP (1) | JP6037156B2 (zh) |
KR (1) | KR20140050050A (zh) |
CN (1) | CN103765510B (zh) |
AU (1) | AU2012297804B2 (zh) |
BR (1) | BR112014003672A2 (zh) |
CA (1) | CA2840788A1 (zh) |
MX (1) | MX2014001871A (zh) |
RU (1) | RU2586011C2 (zh) |
WO (1) | WO2013027630A1 (zh) |
ZA (1) | ZA201401181B (zh) |
Families Citing this family (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5754899B2 (ja) | 2009-10-07 | 2015-07-29 | ソニー株式会社 | 復号装置および方法、並びにプログラム |
JP5850216B2 (ja) | 2010-04-13 | 2016-02-03 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
JP5652658B2 (ja) | 2010-04-13 | 2015-01-14 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
JP5609737B2 (ja) | 2010-04-13 | 2014-10-22 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
JP6075743B2 (ja) | 2010-08-03 | 2017-02-08 | ソニー株式会社 | 信号処理装置および方法、並びにプログラム |
JP5707842B2 (ja) | 2010-10-15 | 2015-04-30 | ソニー株式会社 | 符号化装置および方法、復号装置および方法、並びにプログラム |
JP5743137B2 (ja) | 2011-01-14 | 2015-07-01 | ソニー株式会社 | 信号処理装置および方法、並びにプログラム |
JP5704397B2 (ja) | 2011-03-31 | 2015-04-22 | ソニー株式会社 | 符号化装置および方法、並びにプログラム |
JP5975243B2 (ja) * | 2011-08-24 | 2016-08-23 | ソニー株式会社 | 符号化装置および方法、並びにプログラム |
JP5942358B2 (ja) | 2011-08-24 | 2016-06-29 | ソニー株式会社 | 符号化装置および方法、復号装置および方法、並びにプログラム |
EP2631906A1 (en) * | 2012-02-27 | 2013-08-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Phase coherence control for harmonic signals in perceptual audio codecs |
BR112014004127A2 (pt) | 2012-07-02 | 2017-04-04 | Sony Corp | dispositivo e método de decodificação, programa, e, dispositivo e método de codificação |
WO2014168777A1 (en) * | 2013-04-10 | 2014-10-16 | Dolby Laboratories Licensing Corporation | Speech dereverberation methods, devices and systems |
EP2830061A1 (en) * | 2013-07-22 | 2015-01-28 | Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping |
TWI557726B (zh) * | 2013-08-29 | 2016-11-11 | 杜比國際公司 | 用於決定音頻信號的高頻帶信號的主比例因子頻帶表之系統和方法 |
EP3291233B1 (en) | 2013-09-12 | 2019-10-16 | Dolby International AB | Time-alignment of qmf based processing data |
US9875746B2 (en) | 2013-09-19 | 2018-01-23 | Sony Corporation | Encoding device and method, decoding device and method, and program |
AU2014371411A1 (en) | 2013-12-27 | 2016-06-23 | Sony Corporation | Decoding device, method, and program |
CN109963338B (zh) * | 2017-12-25 | 2023-07-21 | 成都鼎桥通信技术有限公司 | 一种特殊的lte-fdd小区中上行载波的调度方法和系统 |
CN110989983B (zh) * | 2019-11-28 | 2022-11-29 | 深圳航天智慧城市系统技术研究院有限公司 | 一种零编码的应用软件快速构建系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007333785A (ja) * | 2006-06-12 | 2007-12-27 | Matsushita Electric Ind Co Ltd | オーディオ信号符号化装置およびオーディオ信号符号化方法 |
CN101178898A (zh) * | 2006-11-09 | 2008-05-14 | 索尼株式会社 | 频带扩展装置及方法、播放装置、方法、程序及记录介质 |
JP2010079275A (ja) * | 2008-08-29 | 2010-04-08 | Sony Corp | 周波数帯域拡大装置及び方法、符号化装置及び方法、復号化装置及び方法、並びにプログラム |
JP2010288404A (ja) * | 2009-06-15 | 2010-12-24 | Fujitsu Telecom Networks Ltd | 可変電源装置とモータ駆動制御装置とそれらの保護回路動作方法 |
WO2011043227A1 (ja) * | 2009-10-07 | 2011-04-14 | ソニー株式会社 | 波数帯域拡大装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
Family Cites Families (33)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ZA9510509B (en) * | 1994-12-23 | 1996-05-30 | Qualcomm Inc | Dual-mode digital FM communication system |
SE512719C2 (sv) | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
DE60133562T2 (de) * | 2000-08-18 | 2009-05-28 | Samsung Electronics Co., Ltd., Suwon | Kanalcodierungs-decodierungsvorrichtung und -verfahren für ein cdma-mobilkommunikationssystem |
WO2005111568A1 (ja) | 2004-05-14 | 2005-11-24 | Matsushita Electric Industrial Co., Ltd. | 符号化装置、復号化装置、およびこれらの方法 |
RU2404506C2 (ru) | 2004-11-05 | 2010-11-20 | Панасоник Корпорэйшн | Устройство масштабируемого декодирования и устройство масштабируемого кодирования |
JP4899359B2 (ja) | 2005-07-11 | 2012-03-21 | ソニー株式会社 | 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体 |
KR100813259B1 (ko) | 2005-07-13 | 2008-03-13 | 삼성전자주식회사 | 입력신호의 계층적 부호화/복호화 장치 및 방법 |
CN101120584B (zh) * | 2005-11-18 | 2011-04-20 | 索尼株式会社 | 编码装置和方法、解码装置和方法、以及传输系统 |
JP2007178529A (ja) * | 2005-12-27 | 2007-07-12 | Matsushita Electric Ind Co Ltd | 符号化オーディオ信号再生装置及び符号化オーディオ信号再生方法 |
KR101355376B1 (ko) | 2007-04-30 | 2014-01-23 | 삼성전자주식회사 | 고주파수 영역 부호화 및 복호화 방법 및 장치 |
EP2294770B1 (en) | 2008-06-20 | 2013-08-07 | Rambus, Inc. | Frequency responsive bus coding |
JP5203077B2 (ja) * | 2008-07-14 | 2013-06-05 | 株式会社エヌ・ティ・ティ・ドコモ | 音声符号化装置及び方法、音声復号化装置及び方法、並びに、音声帯域拡張装置及び方法 |
GB2466201B (en) | 2008-12-10 | 2012-07-11 | Skype Ltd | Regeneration of wideband speech |
GB0822537D0 (en) | 2008-12-10 | 2009-01-14 | Skype Ltd | Regeneration of wideband speech |
WO2011121782A1 (ja) | 2010-03-31 | 2011-10-06 | 富士通株式会社 | 帯域拡張装置および帯域拡張方法 |
JP5850216B2 (ja) | 2010-04-13 | 2016-02-03 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
JP5609737B2 (ja) | 2010-04-13 | 2014-10-22 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
JP5652658B2 (ja) | 2010-04-13 | 2015-01-14 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
US8560330B2 (en) | 2010-07-19 | 2013-10-15 | Futurewei Technologies, Inc. | Energy envelope perceptual correction for high band coding |
US9047875B2 (en) | 2010-07-19 | 2015-06-02 | Futurewei Technologies, Inc. | Spectrum flatness control for bandwidth extension |
JP6075743B2 (ja) | 2010-08-03 | 2017-02-08 | ソニー株式会社 | 信号処理装置および方法、並びにプログラム |
JP5707842B2 (ja) | 2010-10-15 | 2015-04-30 | ソニー株式会社 | 符号化装置および方法、復号装置および方法、並びにプログラム |
JP5743137B2 (ja) | 2011-01-14 | 2015-07-01 | ソニー株式会社 | 信号処理装置および方法、並びにプログラム |
JP5704397B2 (ja) | 2011-03-31 | 2015-04-22 | ソニー株式会社 | 符号化装置および方法、並びにプログラム |
US9240191B2 (en) * | 2011-04-28 | 2016-01-19 | Telefonaktiebolaget L M Ericsson (Publ) | Frame based audio signal classification |
JP5975243B2 (ja) | 2011-08-24 | 2016-08-23 | ソニー株式会社 | 符号化装置および方法、並びにプログラム |
JP5942358B2 (ja) | 2011-08-24 | 2016-06-29 | ソニー株式会社 | 符号化装置および方法、復号装置および方法、並びにプログラム |
JP5845760B2 (ja) | 2011-09-15 | 2016-01-20 | ソニー株式会社 | 音声処理装置および方法、並びにプログラム |
US20150088528A1 (en) | 2012-04-13 | 2015-03-26 | Sony Corporation | Decoding apparatus and method, audio signal processing apparatus and method, and program |
JP5997592B2 (ja) | 2012-04-27 | 2016-09-28 | 株式会社Nttドコモ | 音声復号装置 |
CA2843223A1 (en) | 2012-07-02 | 2014-01-09 | Sony Corporation | Decoding device, decoding method, encoding device, encoding method, and program |
BR112014004127A2 (pt) | 2012-07-02 | 2017-04-04 | Sony Corp | dispositivo e método de decodificação, programa, e, dispositivo e método de codificação |
JP2014123011A (ja) | 2012-12-21 | 2014-07-03 | Sony Corp | 雑音検出装置および方法、並びに、プログラム |
-
2011
- 2011-08-24 JP JP2011182449A patent/JP6037156B2/ja not_active Expired - Fee Related
-
2012
- 2012-08-14 CA CA2840788A patent/CA2840788A1/en not_active Abandoned
- 2012-08-14 KR KR1020147003607A patent/KR20140050050A/ko not_active Application Discontinuation
- 2012-08-14 AU AU2012297804A patent/AU2012297804B2/en not_active Ceased
- 2012-08-14 EP EP12825849.8A patent/EP2750131A4/en not_active Ceased
- 2012-08-14 BR BR112014003672A patent/BR112014003672A2/pt not_active Application Discontinuation
- 2012-08-14 CN CN201280040029.1A patent/CN103765510B/zh not_active Expired - Fee Related
- 2012-08-14 MX MX2014001871A patent/MX2014001871A/es active IP Right Grant
- 2012-08-14 WO PCT/JP2012/070683 patent/WO2013027630A1/ja active Application Filing
- 2012-08-14 US US14/236,350 patent/US9842603B2/en active Active
- 2012-08-14 RU RU2014105814/08A patent/RU2586011C2/ru not_active IP Right Cessation
-
2014
- 2014-02-17 ZA ZA2014/01181A patent/ZA201401181B/en unknown
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007333785A (ja) * | 2006-06-12 | 2007-12-27 | Matsushita Electric Ind Co Ltd | オーディオ信号符号化装置およびオーディオ信号符号化方法 |
CN101178898A (zh) * | 2006-11-09 | 2008-05-14 | 索尼株式会社 | 频带扩展装置及方法、播放装置、方法、程序及记录介质 |
JP2010079275A (ja) * | 2008-08-29 | 2010-04-08 | Sony Corp | 周波数帯域拡大装置及び方法、符号化装置及び方法、復号化装置及び方法、並びにプログラム |
JP2010288404A (ja) * | 2009-06-15 | 2010-12-24 | Fujitsu Telecom Networks Ltd | 可変電源装置とモータ駆動制御装置とそれらの保護回路動作方法 |
WO2011043227A1 (ja) * | 2009-10-07 | 2011-04-14 | ソニー株式会社 | 波数帯域拡大装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
Also Published As
Publication number | Publication date |
---|---|
WO2013027630A1 (ja) | 2013-02-28 |
CA2840788A1 (en) | 2013-02-24 |
RU2586011C2 (ru) | 2016-06-10 |
US20140200899A1 (en) | 2014-07-17 |
JP2013044922A (ja) | 2013-03-04 |
MX2014001871A (es) | 2014-05-30 |
AU2012297804B2 (en) | 2016-12-01 |
EP2750131A1 (en) | 2014-07-02 |
ZA201401181B (en) | 2014-09-25 |
US9842603B2 (en) | 2017-12-12 |
BR112014003672A2 (pt) | 2017-03-01 |
EP2750131A4 (en) | 2015-04-22 |
RU2014105814A (ru) | 2015-08-27 |
KR20140050050A (ko) | 2014-04-28 |
CN103765510A (zh) | 2014-04-30 |
AU2012297804A1 (en) | 2014-02-06 |
JP6037156B2 (ja) | 2016-11-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103765510B (zh) | 编码装置和方法、解码装置和方法 | |
KR101975066B1 (ko) | 신호 처리 장치 및 방법, 및 컴퓨터 판독가능 기록 매체 | |
CN101903945B (zh) | 编码装置、解码装置以及编码方法 | |
CN102089817B (zh) | 用于计算频谱包络数目的装置与方法 | |
RU2439720C1 (ru) | Способ и устройство для обработки звукового сигнала | |
KR100949232B1 (ko) | 인코딩 장치, 디코딩 장치 및 그 방법 | |
RU2452042C1 (ru) | Способ и устройство для обработки аудиосигнала | |
KR102015233B1 (ko) | 복호 장치 및 복호 방법 | |
RU2455709C2 (ru) | Способ и устройство для обработки аудиосигнала | |
KR102110727B1 (ko) | 복호 장치 및 방법, 및 기록 매체 | |
JP5942358B2 (ja) | 符号化装置および方法、復号装置および方法、並びにプログラム | |
JP5975243B2 (ja) | 符号化装置および方法、並びにプログラム | |
EP0858067B1 (en) | Multichannel acoustic signal coding and decoding methods and coding and decoding devices using the same | |
EP2693430B1 (en) | Encoding apparatus and method, and program | |
JP2009534713A (ja) | 低減ビットレートを有するデジタル音声データを符号化するための装置および方法 | |
EP1441330B1 (en) | Method of encoding and/or decoding digital audio using time-frequency correlation and apparatus performing the method | |
JP2007333785A (ja) | オーディオ信号符号化装置およびオーディオ信号符号化方法 | |
US20090063158A1 (en) | Efficient audio coding using signal properties | |
EP1858007B1 (en) | Signal processing method, signal processing apparatus and recording medium | |
RU2414009C2 (ru) | Устройство и способ для кодирования и декодирования сигнала | |
KR20110106779A (ko) | 오디오 신호 처리 방법 및 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20160817 Termination date: 20200814 |
|
CF01 | Termination of patent right due to non-payment of annual fee |