CN101261834A - 编码装置及编码方法 - Google Patents
编码装置及编码方法 Download PDFInfo
- Publication number
- CN101261834A CN101261834A CNA200810085644XA CN200810085644A CN101261834A CN 101261834 A CN101261834 A CN 101261834A CN A200810085644X A CNA200810085644X A CN A200810085644XA CN 200810085644 A CN200810085644 A CN 200810085644A CN 101261834 A CN101261834 A CN 101261834A
- Authority
- CN
- China
- Prior art keywords
- average
- performance number
- power value
- low
- frequency power
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/083—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being an excitation gain
Abstract
本发明提供了一种编码装置及编码方法。当在低分辨率模式下创建SBR数据时,该编码装置将通过SBR方法进行编码的输入音频数据的高频分量划分为高频带和低频带,并且计算平均高频功率值和平均低频功率值,该平均高频功率值表示音频数据的高频带中的功率的平均值,该平均低频功率值表示音频数据的低频带中的功率的平均值。接着,该编码装置将平均高频功率值和平均低频功率值进行比较,选择这两者中的较小的平均功率值。接着,该编码装置对要通过SBR方法进行编码的信号的高频分量的功率进行校正,以使其等于所选择的平均功率值。
Description
技术领域
本发明涉及一种编码装置和编码方法,其通过复用第一编码数据和第二编码数据来输出音频信号,该第一编码数据是通过使用第一编码方法对该音频信号的低频分量进行编码而获得的,该第二编码数据是通过使用第二编码方法对该音频信号的高频分量进行编码而获得的。更具体地说,本发明涉及一种编码装置和编码方法,其使得即使在低分辨率模式下也能够对音频信号的高频分量适当地进行编码。
背景技术
运动图像专家组阶段2(MPEG-2)高效高级音频编码(下文中称为“HE-AAC”)方法是一种广泛用于对诸如语音和音乐的音频数据进行编码的方法。在HE-AAC方法中,音频信号的低频分量通过AAC进行编码,而高频分量通过谱带复制(SBR)进行编码。
图8是用于说明该HE-AAC方法的示意图。通过SBR方法编码的数据包括表示要从低频分量(其通过AAC方法编码)复制高频分量的位置的位置数据、表示高频分量的功率的校正的参数、以及与不能从低频分量复制的分量相关的数据。与其它编码方法相比,通过使用HE-AAC方法进行编码,可以更大程度地压缩数据量(volume),在通过AAC方法进行编码时,其组合了低频分量和高频分量。通过AAC方法编码的数据在下文中被称为AAC数据,通过SBR方法编码的数据将被称为SBR数据。
下面描述一种传统的编码装置,该编码装置通过HE-AAC方法对输入音频数据进行编码。图9是该传统编码装置的功能框图。编码装置10包括SBR编码器11、下抽样单元12、AAC编码器13,以及复用单元14。
SBR编码器11通过SBR方法对输入音频数据进行编码,并将编码的SBR数据输出到复用单元14。在对音频数据进行编码之前,SBR编码器11根据由管理员预先制定的标准,来确定在高分辨率模式下还是在低分辨率模式下对音频数据进行编码,并根据确定的结果对音频数据进行编码。
图10是用于说明高分辨率模式和低分辨率模式的示意图。图10的上部分是用于说明高分辨率模式的示意图。在高分辨率模式下,将要通过SBR方法进行编码的输入音频数据的频带(下文中称为“SBR编码带”)划分成多个块(例如,两个块),并且在对块进行量化和创建SBR数据之前,各个块的功率达到最终平衡。
图10的下部分是用于说明低分辨率模式的示意图。在低分辨率模式下,SBR编码带的整个范围的功率达到最终平衡,并在创建SBR数据之前对块进行量化。通过在高分辨率模式下进行编码,可以精确地对音频数据的高频分量进行编码,而通过在低分辨率模式下进行编码,可以减小高频分量的数据量。
返回到图9,下抽样单元12提取输入音频数据的低频分量,将所提取的低频分量输出到AAC编码器13。该AAC编码器13基于从下抽样单元12接收到的低频分量来创建AAC数据,并将该AAC数据输出到复用单元14。
复用单元14对由SBR编码器11输出的SBR数据和由AAC编码器13输出的AAC数据进行复用(组合),并输出该经复用的数据(HE-AAC位流)。这样,传统编码装置10通过SBR编码器11、下抽样单元12、AAC编码器13以及复用单元14对输入音频数据进行编码。
日本专利申请特开No.2005-338637中公开了一种方法,其中在量化之前和之后对每一个子带的平均功率进行比较,如果它们不同,则调整比例因子(指数),以使量化后的归一化功率近似于量化前的归一化功率。
然而,在现有技术中,当为了减小高频分量的数据量(SBR编码带中的输入音频数据的分量),而在低分辨率模式下对输入音频数据的高频分量进行编码时,没有实现对高频分量的适当编码。
未对高频分量进行适当编码的原因是,如图10所示,如果在高频分量的高频端处的功率突然下降时在低分辨率模式下对整个高频范围进行编码,则对整个高频范围进行平衡,从而在高频端处的功率超出了原始音频数据的功率。
换句话说,必要的是,即使当在低分辨率模式下对高频分量进行编码时,也能够对输入音频数据的高频分量进行适当编码。
发明内容
本发明的一个目的是至少部分地解决传统技术中的问题。
根据本发明的一个方面,一种编码装置通过使用第一编码方法对信号的低频分量进行编码来创建第一编码数据,并通过使用第二编码方法对信号的高频分量进行编码来创建第二编码数据,并对该第一编码数据和该第二编码数据进行复用,以输出经复用的编码数据。该编码装置包括:计算单元,该计算单元将要通过第二编码方法编码的信号的高频分量划分成高频带和低频带,并计算高频功率值和低频功率值,该高频功率值表示高频带中的信号的功率值,该低频功率值表示低频带中的信号的功率值;以及校正单元,该校正单元对该高频功率值和该低频功率值进行比较,并基于比较的结果来校正要通过第二编码方法编码的信号的高频分量的功率值。
根据本发明的另一方面,在编码装置中使用一种编码方法,该编码装置通过使用第一编码方法对信号的低频分量进行编码来创建第一编码数据,并通过使用第二编码方法对信号的高频分量进行编码来创建第二编码数据,并对该第一编码数据和该第二编码数据进行复用,以输出经复用的编码数据。该编码方法包括以下步骤:将要通过第二编码方法编码的信号的高频分量划分成高频带和低频带;计算高频功率值和低频功率值,该高频功率值表示高频带中的信号的功率值,该低频功率值表示低频带中的信号的功率值;对该高频功率值和该低频功率值进行比较;以及基于比较的结果来校正要通过第二编码方法编码的信号的高频分量的功率值。
通过结合附图阅读本发明的当前优选实施方式的以下详细描述,将更好地理解本发明的上述及其它目的、特征、优点以及技术和工业上的重要性。
附图说明
图1是用于说明根据本发明第一实施方式的编码装置的显著特征的示意图;
图2是根据第一实施方式的编码装置的功能框图;
图3是HE-AAC数据的示意图;
图4是在低分辨率模式下的时间分辨率和频率分辨率的示意表示;
图5是在高分辨率模式下的时间分辨率和频率分辨率的示意表示;
图6是由根据第一实施方式的编码装置执行的处理的流程图;
图7是包含两个包络(envelope)的帧的示意表示;
图8是用于说明HE-AAC方法的示意图;
图9是传统编码装置的功能框图;以及
图10是用于说明高分辨率模式和低分辨率模式的示意图。
具体实施方式
下面参照附图描述根据本发明的编码装置和编码方法的示例性实施方式。
首先描述根据本发明第一实施方式的编码装置的显著特征。图1是用于说明根据第一实施方式的编码装置的显著特征的示意图。根据第一实施方式的编码装置首先通过使用AAC编码方法对输入音频信号(语音或音乐)的低频分量进行编码来创建高级音频编码(AAC)数据,并通过使用SBR方法对输入音频数据的高频分量进行编码来创建谱带复制(SBR)数据,然后在输出该AAC数据和SBR数据之前对它们进行复用。当在低分辨率模式下创建SBR数据(参见现有技术的描述)时,该编码装置将输入音频数据的高频分量划分为高频带和低频带,如图1所示,并计算高频带中的音频数据的平均高频功率值和低频带中的音频数据的平均低频功率值。
该编码装置随后对该平均高频功率值和该平均低频功率值进行比较,并选择该平均高频功率值和该平均低频功率值中的较小的一个。该编码装置随后对要使用SBR方法进行编码的高频分量的功率进行校正,以使其等于所选择的平均功率值。
在图1所示的示例中,平均高频功率值由“pow2”表示,平均低频功率值由“pow1”表示。如果平均高频功率值“pow2”和平均低频功率值“pow1”之间的差大于或等于阈值,并且另外,该平均高频功率值“pow2”小于该平均低频功率值“pow1”,则该编码装置将要使用SBR方法进行编码的输入音频数据的高频分量的功率校正为“pow2”。该编码装置随后对该经校正的输入音频数据的高频分量进行量化,并创建SBR数据。
这样,当在低分辨率模式下创建SBR数据时,根据该第一实施方式的编码装置首先对该平均高频功率值和该平均低频功率值进行比较,并通过将该输入音频数据的功率校正为该平均高频功率值和该平均低频功率值中的较小的一个来创建SBR数据。因此,可以对该输入音频数据的高频分量适当地进行编码。具体地说,在诸如语音数据的音频数据中,可以避免辅音“s”上的不自然的重音。
下面描述根据该第一实施方式的编码装置的构造。图2是根据该第一实施方式的编码装置的功能框图。如图2所示,编码装置100包括下抽样单元110、AAC编码器111、SBR编码器120,以及HE-AAC数据创建单元130。
下抽样单元110提取从未示出的输入装置输入的音频信号的低频分量,并将所提取的低频分量(下文中称为“低频分量数据”)输出到AAC编码器111中。例如,如果该输入音频信号的频率是A赫兹,则该下抽样单元110以抽样频率A/2赫兹进行抽样,以提取该音频信号的低频分量。
该AAC编码器111采用AAC编码方法对从下抽样单元110接收到的低频分量数据进行编码,创建AAC数据,并将该AAC数据输出到HE-AAC数据创建单元130。
SBR编码器120采用SBR方法对从未示出的输入装置输入的音频信号进行编码,以创建SBR数据,并且将该SBR数据输出到HE-AAC数据创建单元130。
HE-AAC数据创建单元130基于从AAC编码器111接收到的AAC数据和从SBR编码器120接收到的SBR数据来创建HE-AAC数据。图3是HE-AAC数据的示意图。该HE-AAC数据包括ADTS头部、AAC数据、包括用于SBR数据的控制数据的SBR头部,以及SBR数据。
下面描述SBR编码器120的构造。如图2所示,SBR编码器120包括过滤库(filter bank)121、网格生成单元122、开关123、辅助数据计算单元124、辅助数据量化单元125、低频功率计算单元126a、高频功率计算单元126b、功率计算单元126c、功率校正单元127、功率量化单元128,以及复用单元129。
当从输入装置中接收到音频数据时,过滤库121对该音频数据的频谱属性(其根据时间和音频数据的频率而变化)进行分析,将该音频数据转换成时间/频率信号,该时间/频率信号表示输入音频数据的频率、时间和频谱(功率)之间的关系。过滤库121随后将该时间/频率信号输出到网格生成单元122,辅助数据计算单元124,以及低频功率计算单元126a和高频功率计算单元126b,或者功率计算单元126c,这些单元都连接到开关123。
网格生成单元122基于从过滤库121接收到的时间/频率信号,确定在高分辨率模式还是在低分辨率模式下对SBR数据进行编码。
假设该编码装置100的管理员预设了标准,网格生成单元122基于该标准确定在高分辨率模式下还是在低分辨率模式下对SBR数据进行编码。例如,可以将网格生成单元122设置为:如果时间/频率信号的最大功率值和最小功率值之间的差大于一基准值(即,如果由于频率/时间的变化而导致的功率变化很大),则确定在高分辨率模式下对SBR数据进行编码,而如果时间/频率信号的最大功率值和最小功率值之间的差在该基准值内(即,如果由于频率/时间的变化而导致的功率变化不大),则确定在低分辨率模式下对SBR数据进行编码。
网格生成单元122将该确定的结果(即,表示要在高分辨率模式下还是在低分辨率模式下进行编码的数据,下文中称为“分辨率数据”)输出到辅助数据计算单元124,并根据该确定的结果切换开关123。
换句话说,如果该确定的结果表示要在低分辨率模式下对SBR数据进行编码,则网格生成单元122改变开关123的位置,以使过滤库121和低频功率计算单元126a及高频功率计算单元126b连接(在图2中,网格生成单元122将开关123改变到上部位置)。
如果该确定的结果表示要在高分辨率模式下对SBR数据进行编码,则网格生成单元122改变开关123的位置,以使过滤库121和功率计算单元126c连接(在图2中,网格生成单元122将开关123改变到下部位置)。
辅助计算单元124从过滤库121接收时间/频率信号,并从网格生成单元122接收分辨率数据,并且基于时间/频率信号和分辨率数据来创建辅助数据。该辅助数据包括高频分量的位置数据、调整由功率量化单元128进行量化的功率所需的参数。辅助数据计算单元124将辅助数据输出到辅助数据量化单元125。
辅助数据量化单元125对从辅助数据计算单元124接收的辅助数据进行量化,并将该经量化的辅助数据输出到复用单元129中。
下面描述在网格生成单元122选择了低分辨率模式的情况下,SBR编码器120执行的处理。如果网格生成单元122选择了低分辨率模式,则过滤库121将时间/频率信号经由开关123输出到低频功率计算单元126a和高频功率计算单元126b。
图4是在低分辨率模式下的时间分辨率和频率分辨率的示意表示。在低分辨率模式下,频率分辨率降低(在图4中,没有沿频率轴划分时间/频率信号),通过沿时间轴划分时间/频率信号,来创建预定持续时间的块。
在将时间/频率信号划分为多个块之后,低频功率计算单元126a为图4中示出的每一个块计算通过SBR方法进行编码的频带(下文中称为“SBR编码带”)当中的低频(5kHz到10kHz的范围内)的平均功率(下文这称为“低频功率P_low”),并将计算出的低频功率P_low输出到功率校正单元127。
在将时间/频率信号划分为多个块之后,低频功率计算单元126a为图4中示出的每一个块计算通过SBR方法进行编码的频带(下文中称为“SBR编码带”)中的频率当中的高频(10kHz到15kHz的范围内)的平均功率(下文中称为“高频功率P_high”),并将计算出的高频功率P_high输出到功率校正单元127。
功率校正单元127对低频功率P_low和高频功率P_high进行比较,将两者中的较小的一个作为SBR编码带的平均功率P_ave,并将该平均功率P_ave输出到功率量化单元128。换句话说,如果低频功率P_low小于高频功率P_high,则功率校正单元127将低频功率P_low作为平均功率P_ave,如果高频功率P_high小于低频功率P_low,则将高频功率P_high作为平均功率P_ave,如果低频功率P_low等于高频功率P_hihg,则将低频功率P_low(高频功率P_high)作为平均功率P_ave。
功率量化单元128对从功率校正单元127或功率计算单元126c接收的平均功率P_ave进行量化,并将该经量化的平均功率P_ave输出到复用单元129。
下面描述在网格生成单元122选择了高分辨率模式的情况下,SBR编码器120执行的处理。如果网格生成单元122选择了高分辨率模式,则过滤库121将时间/频率信号经由开关123输出到功率计算单元126c。
图5是在高分辨率模式下的时间分辨率和频率分辨率的示意表示。在高分辨率模式下,频率分辨率增大(在图5中,沿频率轴划分时间/频率信号),并通过沿时间轴划分时间/频率信号,来创建预定持续时间的多个块。
功率计算单元126c为图5中示出的每一个块计算平均功率P_ave,并将计算出的平均功率P_ave输出到功率量化单元128。在高分辨率模式下,按照传统方法计算出平均功率P_ave,并且不校正该功率。
复用单元129通过组合从功率量化单元128接收到的平均功率P_ave、从网格生成单元122接收到的分辨率数据、以及从辅助数据量化单元125接收到的辅助数据,来创建SBR数据,并将该SBR数据输出到HE-AAC数据创建单元130。
接下来描述根据第一实施方式的编码装置100的处理过程。图6是由根据第一实施方式的编码装置100执行的处理的流程图。当从输入装置接收到音频数据(步骤S101)时,编码装置100的下抽样单元110对音频数据执行下抽样,并创建低频分量数据(S102),并且AAC编码器111根据低频分量数据来创建AAC数据(步骤S103)。
过滤库121将音频数据转换成时间/频率信号(步骤S104)。网格生成单元122确定是否在低分辨率模式下进行编码,并将分辨率数据输出到复用单元129(步骤S105)。如果在高分辨率(高分辨率模式)下进行编码(在步骤S106中为否),则功率计算单元126c根据时间/频率信号计算整个SBR带的平均功率P_ave(步骤S107),并前进到后面描述的步骤S112。
如果在低分辨率(低分辨率模式)下进行编码(在步骤S106中为是),则网格生成单元122将时间/频率信号划分成低频带和高频带(步骤S108)。低频功率计算单元126a计算时间/频率信号的低频功率P_low(步骤S109),并且高频功率计算单元126b计算时间/频率信号的高频功率P_high(步骤S110)。
功率校正单元127比较低频功率P_low和高频功率P_high,并将两者中的较小的一个设置成平均功率P_ave(步骤S111)。功率量化单元128对从功率校正单元127或功率计算单元126c接收到的平均功率P_ave进行量化,并将经量化的平均功率P_ave输出到复用单元129中(步骤S112)。
辅助数据计算单元124创建并输出辅助数据到辅助数据量化单元125。辅助数据量化单元125对辅助数据进行量化,并将经量化的辅助数据输出到复用单元129(步骤S113)。复用单元129根据平均功率P_ave数据和辅助数据创建SBR数据(步骤S114)。
HE-AAC数据创建单元130对AAC数据和SBR数据进行复用,并创建HE-AAC数据(步骤S115),并且输出HE-AAC数据(步骤S116)。
这样,通过由功率校正单元127比较低频功率P_low和高频功率P_high,并将两者中的较小的一个设置为平均功率P_ave,可以消除音频数据的高频分量的不自然的重音。
这样,当在低分辨率模式下对SBR数据进行编码时,根据第一实施方式的编码装置100将音频数据的高频分量划分成高频带和低频带,并计算平均高频功率值和平均低频功率值,该平均高频功率值表示音频数据的高频带中的功率的平均值,该平均低频功率值表示音频数据的低频带中的功率的平均值。接着,编码装置100比较该平均高频功率值和该平均低频功率值,选择两者中的较小的一个。然后,编码装置100对通过SBR编码方法进行编码的信号的高频分量的功率进行校正,以使其等于所选择的平均功率值。因此,在诸如语音数据的音频数据中,可以避免辅音“s”上的不自然的重音。
根据第一实施方式的编码装置100的功率校正单元127比较低频功率P_low和高频功率P_high,并将两者中的较小的一个设置为整个SBR带的平均功率P_ave。然而,功率校正单元127可以被构造为将通过使高频功率P_high衰减预定百分比(例如90%)而获得的值设置为平均功率P_ave,或者另选的是,将使低频功率P_low放大通过预定百分比(例如90%)而获得的值设置为平均功率P_ave。
本发明允许进行各种修改。下面描述本发明的第二实施方式。
在SBR方法中,当在低分辨率模式下确定一个帧的功率值时,可以确定一对或多对功率值。一对功率值被称为包络(在第一实施方式中,一个帧包括一个包络)。即使一个帧包含多个包络,第一实施方式中描述的方法也可以应用于在低分辨率模式下执行SBR编码带的优化编码。根据第二实施方式的编码装置的构造与第一实施方式中的编码装置相同,仅是由功率校正单元127执行的处理与第一实施方式不同。因此,这里仅描述由功率校正单元127执行的处理。图7是包含两个包络的帧的示意表示。
第一包络的低频功率和高频功率分别由P_low(1)和P_high(1)表示,第二包络的低频功率和高频功率分别由P_low(2)和P_high(2)表示。在低分辨率模式下,功率校正单元127对每一个包络进行功率校正(在高分辨率模式下,与第一实施方式一样,即使一个帧包含多个包络,也不执行功率校正)。
对于第一包络,如果低频功率P_low(1)小于高频功率P_high(1),则功率校正单元127将低频功率P_low(1)作为平均功率P_ave(1),如果高频功率P_high(1)小于低频功率P_low(1),则将高频功率P_high(1)作为平均功率P_ave(1),并且如果低频功率P_low(1)等于高频功率P_high(1),则将低频功率P_low(1)(高频功率P_high(1))作为平均功率P_ave(1)。
对于第二包络,如果低频功率P_low(2)小于高频功率P_high(2),则功率校正单元127将低频功率P_low(2)作为平均功率P_ave(2),如果高频功率P_high(2)小于低频功率P_low(2),则将高频功率P_high(2)作为平均功率P_ave(2),并且如果低频功率P_low(2)等于高频功率P_high(2),则将低频功率P_low(2)(高频功率P_high(2))作为平均功率P_ave(2)。
接着,功率校正单元127将第一包络的平均功率P_ave(1)和第二包络的平均功率P_ave(2)输出到功率量化单元128。
这样,在根据第二实施方式的编码装置中,即使一个帧包含多个包络,功率校正单元127也对高频功率和低频功率进行比较,来确定每个包络的平均功率。因此,可以执行对音频数据的高频分量的优化编码。
在第二实施方式中,一个帧包含两个包络。然而,一个帧可以包含两个以上的包络。可以通过上面描述的方法对每个包络的功率进行校正,以对音频数据的高频分量进行优化编码。
虽然为了完整并清楚的公开而参照特定实施方式对本发明进行了描述,但是所附权利要求并不因此而受限,所附权利要求应该被解释为涵盖本领域技术人员所可以想到的落入在此阐述的基本教导的范围内的所有修改和另选结构。
可以采用公知方法全部或部分地人工执行这些实施方式中所说明的所有自动处理。类似地,可以采用公知方法全部或部分地自动执行这些实施方式中所说明的所有人工处理。
除非另外指定,说明书和附图中提到的处理过程、控制过程、特定名称、数据(包括各种参数)可以根据需要进行改变。
所示装置的组成单元仅是概念上的,不必在物理上类似于附图所示出的结构。例如,该装置不必具有所示的结构。可以根据负载或如何使用该装置,而在功能或物理上对作为整体或部分的该装置进行分解或集成。
根据本发明的实施方式,可以避免高频分量的较高频带的功率上的不自然的重音,并且可以实现信号的适当编码。
根据本发明的实施方式,即使设置了低频分辨率,也可以对信号进行适当编码。
根据本发明的实施方式,即使在一个帧中有多个高频分量,也可以对每个高频分量进行适当编码。
虽然为了完整并清楚的公开而参照特定实施方式对本发明进行了描述,但是所附权利要求并不因此而受限,所附权利要求应该被解释为涵盖本领域技术人员所可以想到的落入在此阐述的基本教导的范围内的所有修改和另选结构。
Claims (10)
1、一种编码装置,该编码装置通过使用第一编码方法对信号的低频分量进行编码来创建第一编码数据,通过使用第二编码方法对信号的高频分量进行编码来创建第二编码数据,并对所述第一编码数据和所述第二编码数据进行复用,以输出经复用的编码数据,所述编码装置包括:
计算单元,该计算单元将通过所述第二编码方法进行编码的信号的高频分量划分为高频带和低频带,并计算高频功率值和低频功率值,该高频功率值表示所述高频带中的信号的功率值,该低频功率值表示所述低频带中的信号的功率值;以及
校正单元,该校正单元将所述高频功率值和所述低频功率值进行比较,并基于比较的结果对要通过所述第二编码方法进行编码的信号的高频分量的功率值进行校正。
2、根据权利要求1所述的编码装置,其中,所述计算单元计算平均高频功率值和平均低频功率值,该平均高频功率值表示所述高频带中的信号的平均功率值,该平均低频功率值表示所述低频带中的信号的平均功率值,并且所述校正单元选择所述平均高频功率值和所述平均低频功率值中的较小的平均功率值,并对要通过所述第二编码方法进行编码的信号的高频分量的功率值进行校正,以使该高频分量的功率值等于所选择的平均功率值。
3、根据权利要求1所述的编码装置,其中,所述计算单元计算平均高频功率值和平均低频功率值,该平均高频功率值表示所述高频带中的信号的平均功率值,该平均低频功率值表示所述低频带中的信号的平均功率值,并且所述校正单元对要通过所述第二编码方法进行编码的信号的高频分量的功率值进行校正,以使该高频分量的功率值等于通过使该高频功率值衰减预定百分比而获得的功率值。
4、根据权利要求1所述的编码装置,其中,所述计算单元计算平均低频功率值,该平均低频功率值表示所述低频带中的信号的平均功率值,并且所述校正单元对要通过所述第二编码方法进行编码的信号的高频分量的功率值进行校正,以使该高频分量的功率值等于使该高频功率值放大预定百分比而获得的功率值。
5、根据权利要求1所述的编码装置,其中,当要通过第二编码方法进行编码的信号中有多个高频分量时,所述校正单元基于所述比较的结果单独地对每一个高频分量的功率值进行校正。
6、一种在编码装置中使用的编码方法,该编码装置通过使用第一编码方法对信号的低频分量进行编码来创建第一编码数据,通过使用第二编码方法对信号的高频分量进行编码来创建第二编码数据,并对所述第一编码数据和所述第二编码数据进行复用,以输出经复用的编码数据,该编码方法包括以下步骤:
将要通过所述第二编码方法进行编码的信号的高频分量划分为高频带和低频带;
计算高频功率值和低频功率值,该高频功率值表示所述高频带中的信号的功率值,该低频功率值表示所述低频带中的信号的功率值;
比较所述高频功率值和所述低频功率值;以及
基于比较的结果,对要通过所述第二编码方法进行编码的信号的高频分量的功率值进行校正。
7、根据权利要求6所述的编码方法,其中,所述计算步骤包括:计算平均高频功率值和平均低频功率值,该平均高频功率值表示所述高频带中的信号的平均功率值,该平均低频功率值表示所述低频带中的信号的平均功率值,并且
所述校正步骤包括:选择所述平均高频功率值和所述平均低频功率值中的较小的平均功率值,并对要通过所述第二编码方法进行编码的信号的高频分量的功率值进行校正,以使该高频分量的功率值等于所选择的平均功率值。
8、根据权利要求6所述的编码方法,其中,所述计算步骤包括:计算平均高频功率值和平均低频功率值,该平均高频功率值表示所述高频带中的信号的平均功率值,该平均低频功率值表示所述低频带中的信号的平均功率值,并且
所述校正步骤包括:对要通过所述第二编码方法进行编码的信号的高频分量的功率值进行校正,以使该高频分量的功率值等于使该高频功率值衰减预定百分比而获得的功率值。
9、根据权利要求6所述的编码方法,其中,所述计算步骤包括计算平均低频功率值,该平均低频功率值表示所述低频带中的信号的平均功率值,并且
所述校正步骤包括:对要通过所述第二编码方法进行编码的信号的高频分量的功率值进行校正,以使该高频分量的功率值等于使该高频功率值放大预定百分比而获得的功率值。
10、根据权利要求6所述的编码方法,其中,当在要通过所述第二编码方法进行编码的信号中有多个高频分量时,所述校正步骤包括:基于所述比较的结果单独地对每一个高频分量的功率值进行校正。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007060933A JP4984983B2 (ja) | 2007-03-09 | 2007-03-09 | 符号化装置および符号化方法 |
JP2007060933 | 2007-03-09 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101261834A true CN101261834A (zh) | 2008-09-10 |
Family
ID=39493271
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA200810085644XA Pending CN101261834A (zh) | 2007-03-09 | 2008-03-06 | 编码装置及编码方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US8073050B2 (zh) |
EP (1) | EP1968046A1 (zh) |
JP (1) | JP4984983B2 (zh) |
KR (1) | KR20080082901A (zh) |
CN (1) | CN101261834A (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010127617A1 (en) * | 2009-05-05 | 2010-11-11 | Huawei Technologies Co., Ltd. | Methods for receiving digital audio signal using processor and correcting lost data in digital audio signal |
CN103168425A (zh) * | 2010-09-10 | 2013-06-19 | 高通股份有限公司 | 用于对信号进行低复杂度压缩的方法和装置 |
CN103928031A (zh) * | 2013-01-15 | 2014-07-16 | 华为技术有限公司 | 编码方法、解码方法、编码装置和解码装置 |
WO2015196835A1 (zh) * | 2014-06-26 | 2015-12-30 | 华为技术有限公司 | 编解码方法、装置及系统 |
CN105229736A (zh) * | 2013-01-29 | 2016-01-06 | 弗劳恩霍夫应用研究促进协会 | 用于选择第一编码算法与第二编码算法中的一个的装置及方法 |
CN107068159A (zh) * | 2012-04-27 | 2017-08-18 | 株式会社Ntt都科摩 | 声音解码装置 |
CN113938805A (zh) * | 2020-07-14 | 2022-01-14 | 广州汽车集团股份有限公司 | 一种低音音质的量化方法及装置 |
Families Citing this family (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101355376B1 (ko) * | 2007-04-30 | 2014-01-23 | 삼성전자주식회사 | 고주파수 영역 부호화 및 복호화 방법 및 장치 |
KR101373004B1 (ko) * | 2007-10-30 | 2014-03-26 | 삼성전자주식회사 | 고주파수 신호 부호화 및 복호화 장치 및 방법 |
US9177569B2 (en) | 2007-10-30 | 2015-11-03 | Samsung Electronics Co., Ltd. | Apparatus, medium and method to encode and decode high frequency signal |
JP5267362B2 (ja) | 2009-07-03 | 2013-08-21 | 富士通株式会社 | オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラムならびに映像伝送装置 |
JP5793675B2 (ja) * | 2009-07-31 | 2015-10-14 | パナソニックIpマネジメント株式会社 | 符号化装置および復号装置 |
JP5754899B2 (ja) | 2009-10-07 | 2015-07-29 | ソニー株式会社 | 復号装置および方法、並びにプログラム |
ES2656668T3 (es) * | 2009-10-21 | 2018-02-28 | Dolby International Ab | Sobremuestreo en un banco de filtros de reemisor combinado |
JP5333257B2 (ja) | 2010-01-20 | 2013-11-06 | 富士通株式会社 | 符号化装置、符号化システムおよび符号化方法 |
JP5850216B2 (ja) | 2010-04-13 | 2016-02-03 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
WO2011132368A1 (ja) * | 2010-04-19 | 2011-10-27 | パナソニック株式会社 | 符号化装置、復号装置、符号化方法及び復号方法 |
JP5533502B2 (ja) * | 2010-09-28 | 2014-06-25 | 富士通株式会社 | オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム |
JP5707842B2 (ja) | 2010-10-15 | 2015-04-30 | ソニー株式会社 | 符号化装置および方法、復号装置および方法、並びにプログラム |
ES2966665T3 (es) * | 2010-11-22 | 2024-04-23 | Ntt Docomo Inc | Dispositivo y método de codificación de audio |
JP5609591B2 (ja) | 2010-11-30 | 2014-10-22 | 富士通株式会社 | オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム |
JP5633431B2 (ja) | 2011-03-02 | 2014-12-03 | 富士通株式会社 | オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム |
JP5704397B2 (ja) * | 2011-03-31 | 2015-04-22 | ソニー株式会社 | 符号化装置および方法、並びにプログラム |
CN102800317B (zh) * | 2011-05-25 | 2014-09-17 | 华为技术有限公司 | 信号分类方法及设备、编解码方法及设备 |
JP5737077B2 (ja) | 2011-08-30 | 2015-06-17 | 富士通株式会社 | オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム |
JP5799824B2 (ja) | 2012-01-18 | 2015-10-28 | 富士通株式会社 | オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム |
JP5949270B2 (ja) | 2012-07-24 | 2016-07-06 | 富士通株式会社 | オーディオ復号装置、オーディオ復号方法、オーディオ復号用コンピュータプログラム |
JP6179122B2 (ja) | 2013-02-20 | 2017-08-16 | 富士通株式会社 | オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化プログラム |
CN104981870B (zh) * | 2013-02-22 | 2018-03-20 | 三菱电机株式会社 | 声音增强装置 |
CN105531762B (zh) | 2013-09-19 | 2019-10-01 | 索尼公司 | 编码装置和方法、解码装置和方法以及程序 |
JP6303435B2 (ja) | 2013-11-22 | 2018-04-04 | 富士通株式会社 | オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化用プログラム、オーディオ復号装置 |
KR20230042410A (ko) | 2013-12-27 | 2023-03-28 | 소니그룹주식회사 | 복호화 장치 및 방법, 및 프로그램 |
US9837089B2 (en) * | 2015-06-18 | 2017-12-05 | Qualcomm Incorporated | High-band signal generation |
US10847170B2 (en) | 2015-06-18 | 2020-11-24 | Qualcomm Incorporated | Device and method for generating a high-band signal from non-linearly processed sub-ranges |
EP3288031A1 (en) * | 2016-08-23 | 2018-02-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding an audio signal using a compensation value |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2586260B2 (ja) * | 1991-10-22 | 1997-02-26 | 三菱電機株式会社 | 適応的ブロッキング画像符号化装置 |
JP3131542B2 (ja) * | 1993-11-25 | 2001-02-05 | シャープ株式会社 | 符号化復号化装置 |
EP0878790A1 (en) | 1997-05-15 | 1998-11-18 | Hewlett-Packard Company | Voice coding system and method |
US6978236B1 (en) * | 1999-10-01 | 2005-12-20 | Coding Technologies Ab | Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching |
EP1314739A1 (en) * | 2001-11-22 | 2003-05-28 | Bayer Ag | Process for renaturation of recombinant, disulfide containing proteins at high protein concentrations in the presence of amines |
EP1470550B1 (en) * | 2002-01-30 | 2008-09-03 | Matsushita Electric Industrial Co., Ltd. | Audio encoding and decoding device and methods thereof |
ES2259158T3 (es) * | 2002-09-19 | 2006-09-16 | Matsushita Electric Industrial Co., Ltd. | Metodo y aparato decodificador audio. |
WO2005036527A1 (ja) * | 2003-10-07 | 2005-04-21 | Matsushita Electric Industrial Co., Ltd. | スペクトル包絡線符号化のための時間境界及び周波数分解能の決定方法 |
KR100996080B1 (ko) * | 2003-11-19 | 2010-11-22 | 삼성전자주식회사 | 직교 주파수 분할 다중 방식을 사용하는 통신 시스템에서적응적 변조 및 코딩 제어 장치 및 방법 |
JP4168976B2 (ja) * | 2004-05-28 | 2008-10-22 | ソニー株式会社 | オーディオ信号符号化装置及び方法 |
US7630902B2 (en) * | 2004-09-17 | 2009-12-08 | Digital Rise Technology Co., Ltd. | Apparatus and methods for digital audio coding using codebook application ranges |
EP2107557A3 (en) * | 2005-01-14 | 2010-08-25 | Panasonic Corporation | Scalable decoding apparatus and method |
-
2007
- 2007-03-09 JP JP2007060933A patent/JP4984983B2/ja not_active Expired - Fee Related
-
2008
- 2008-02-12 US US12/068,833 patent/US8073050B2/en not_active Expired - Fee Related
- 2008-02-15 EP EP08002888A patent/EP1968046A1/en not_active Withdrawn
- 2008-02-25 KR KR1020080016889A patent/KR20080082901A/ko not_active Application Discontinuation
- 2008-03-06 CN CNA200810085644XA patent/CN101261834A/zh active Pending
Cited By (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8718804B2 (en) | 2009-05-05 | 2014-05-06 | Huawei Technologies Co., Ltd. | System and method for correcting for lost data in a digital audio signal |
WO2010127617A1 (en) * | 2009-05-05 | 2010-11-11 | Huawei Technologies Co., Ltd. | Methods for receiving digital audio signal using processor and correcting lost data in digital audio signal |
US9356731B2 (en) | 2010-09-10 | 2016-05-31 | Qualcomm Incorporated | Method and apparatus for low complexity compression of signals employing differential operation for transient segment detection |
CN103168425A (zh) * | 2010-09-10 | 2013-06-19 | 高通股份有限公司 | 用于对信号进行低复杂度压缩的方法和装置 |
CN103168425B (zh) * | 2010-09-10 | 2019-05-07 | 高通股份有限公司 | 用于对信号进行低复杂度压缩的方法和装置 |
CN107068159A (zh) * | 2012-04-27 | 2017-08-18 | 株式会社Ntt都科摩 | 声音解码装置 |
WO2014110895A1 (zh) * | 2013-01-15 | 2014-07-24 | 华为技术有限公司 | 编码方法、解码方法、编码装置和解码装置 |
US10770085B2 (en) | 2013-01-15 | 2020-09-08 | Huawei Technologies Co., Ltd. | Encoding method, decoding method, encoding apparatus, and decoding apparatus |
CN103928031B (zh) * | 2013-01-15 | 2016-03-30 | 华为技术有限公司 | 编码方法、解码方法、编码装置和解码装置 |
CN105551497A (zh) * | 2013-01-15 | 2016-05-04 | 华为技术有限公司 | 编码方法、解码方法、编码装置和解码装置 |
US11430456B2 (en) | 2013-01-15 | 2022-08-30 | Huawei Technologies Co., Ltd. | Encoding method, decoding method, encoding apparatus, and decoding apparatus |
US11869520B2 (en) | 2013-01-15 | 2024-01-09 | Huawei Technologies Co., Ltd. | Encoding method, decoding method, encoding apparatus, and decoding apparatus |
CN105551497B (zh) * | 2013-01-15 | 2019-03-19 | 华为技术有限公司 | 编码方法、解码方法、编码装置和解码装置 |
US9761235B2 (en) | 2013-01-15 | 2017-09-12 | Huawei Technologies Co., Ltd. | Encoding method, decoding method, encoding apparatus, and decoding apparatus |
CN103928031A (zh) * | 2013-01-15 | 2014-07-16 | 华为技术有限公司 | 编码方法、解码方法、编码装置和解码装置 |
US10210880B2 (en) | 2013-01-15 | 2019-02-19 | Huawei Technologies Co., Ltd. | Encoding method, decoding method, encoding apparatus, and decoding apparatus |
US10622000B2 (en) | 2013-01-29 | 2020-04-14 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for selecting one of a first encoding algorithm and a second encoding algorithm |
CN105229736B (zh) * | 2013-01-29 | 2019-07-19 | 弗劳恩霍夫应用研究促进协会 | 用于选择第一编码算法与第二编码算法中的一个的装置及方法 |
CN105229736A (zh) * | 2013-01-29 | 2016-01-06 | 弗劳恩霍夫应用研究促进协会 | 用于选择第一编码算法与第二编码算法中的一个的装置及方法 |
US11521631B2 (en) | 2013-01-29 | 2022-12-06 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for selecting one of a first encoding algorithm and a second encoding algorithm |
US11908485B2 (en) | 2013-01-29 | 2024-02-20 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for selecting one of a first encoding algorithm and a second encoding algorithm |
US9779747B2 (en) | 2014-06-26 | 2017-10-03 | Huawei Technologies Co., Ltd. | Coding/decoding method, apparatus, and system for audio signal |
US10339945B2 (en) | 2014-06-26 | 2019-07-02 | Huawei Technologies Co., Ltd. | Coding/decoding method, apparatus, and system for audio signal |
US10614822B2 (en) | 2014-06-26 | 2020-04-07 | Huawei Technologies Co., Ltd. | Coding/decoding method, apparatus, and system for audio signal |
CN105225671B (zh) * | 2014-06-26 | 2016-10-26 | 华为技术有限公司 | 编解码方法、装置及系统 |
CN105225671A (zh) * | 2014-06-26 | 2016-01-06 | 华为技术有限公司 | 编解码方法、装置及系统 |
WO2015196835A1 (zh) * | 2014-06-26 | 2015-12-30 | 华为技术有限公司 | 编解码方法、装置及系统 |
CN113938805A (zh) * | 2020-07-14 | 2022-01-14 | 广州汽车集团股份有限公司 | 一种低音音质的量化方法及装置 |
CN113938805B (zh) * | 2020-07-14 | 2024-04-23 | 广州汽车集团股份有限公司 | 一种低音音质的量化方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
US20080219344A1 (en) | 2008-09-11 |
JP4984983B2 (ja) | 2012-07-25 |
EP1968046A1 (en) | 2008-09-10 |
JP2008224902A (ja) | 2008-09-25 |
KR20080082901A (ko) | 2008-09-12 |
US8073050B2 (en) | 2011-12-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101261834A (zh) | 编码装置及编码方法 | |
DE60024123T2 (de) | Lpc-harmonischer sprachkodierer mit überrahmenformat | |
US8296159B2 (en) | Apparatus and a method for calculating a number of spectral envelopes | |
KR100551862B1 (ko) | 고주파 복원 방법을 이용하는 코딩 시스템의 성능 향상방법 및 시스템 | |
CN101089951B (zh) | 频带扩展编码方法及装置和解码方法及装置 | |
KR101120911B1 (ko) | 음성신호 복호화 장치 및 음성신호 부호화 장치 | |
CN109461452B (zh) | 解码具有增强的频谱带复制元数据的音频位流 | |
KR101797033B1 (ko) | 부호화 모드를 이용한 음성신호의 부호화/복호화 장치 및 방법 | |
DE60133757T2 (de) | Verfahren und vorrichtung zur kodierung von stimmloser sprache | |
EP1160770A3 (en) | Perceptual coding of audio signals using separated irrelevancy reduction and redundancy reduction | |
CN105280190B (zh) | 带宽扩展编码和解码方法以及装置 | |
CN102522092A (zh) | 一种基于g.711.1的语音带宽扩展的装置和方法 | |
JP4281131B2 (ja) | 信号符号化装置及び方法、並びに信号復号装置及び方法 | |
JP5379871B2 (ja) | オーディオ符号化のための量子化 | |
JP4516345B2 (ja) | 音声符号化情報処理装置および音声符号化情報処理プログラム | |
WO2008072524A1 (ja) | オーディオ信号符号化方法及び復号化方法 | |
KR101798084B1 (ko) | 부호화 모드를 이용한 음성신호의 부호화/복호화 장치 및 방법 | |
JP2002026736A (ja) | オーディオ信号符号化方法及びその装置 | |
JP2008203739A (ja) | オーディオビットレート変換方法および装置 | |
JP2005004119A (ja) | 音響信号符号化装置及び音響信号復号化装置 | |
KR101770301B1 (ko) | 부호화 모드를 이용한 음성신호의 부호화/복호화 장치 및 방법 | |
JP2003271199A (ja) | オーディオ信号の符号化方法及び符号化装置 | |
Lee et al. | Wideband Speech Coding Algorithm with Application of Discrete Wavelet Transform to Upper Band |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Open date: 20080910 |