CN102089816B - 音频信号合成器及音频信号编码器 - Google Patents

音频信号合成器及音频信号编码器 Download PDF

Info

Publication number
CN102089816B
CN102089816B CN2009801270950A CN200980127095A CN102089816B CN 102089816 B CN102089816 B CN 102089816B CN 2009801270950 A CN2009801270950 A CN 2009801270950A CN 200980127095 A CN200980127095 A CN 200980127095A CN 102089816 B CN102089816 B CN 102089816B
Authority
CN
China
Prior art keywords
signal
patch
frequency band
sound signal
frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN2009801270950A
Other languages
English (en)
Other versions
CN102089816A (zh
Inventor
弗雷德里克·纳格尔
萨沙·迪施
尼古拉斯·里特尔博谢
马克斯·诺伊恩多夫
伯恩哈特·格里尔
乌尔里克·克雷默
史蒂芬·韦伯尼克
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=41120013&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=CN102089816(B) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Publication of CN102089816A publication Critical patent/CN102089816A/zh
Application granted granted Critical
Publication of CN102089816B publication Critical patent/CN102089816B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction

Abstract

根据本发明的第一方面,音频信号合成器产生具有第一频带及源于该第一频带的第二合成频带的合成音频信号。音频信号合成器包含补丁生成器、频谱转换器、原始信号处理器及组合器。补丁生成器执行至少两个不同修补算法,其中每一个修补算法使用具有第一频带中信号分量的音频信号产生具有第二合成频带中信号分量的原始信号。补丁生成器适于响应第一时间部分的控制信息选择至少两个不同修补算法中的一个且响应不同于第一时间部分的第二时间部分的控制信息选择该至少两个不同修补算法中的另一个以获得对应于第一时间部分及第二时间部分的该原始信号。频谱转换器将原始信号转换为原始信号频谱表示。原始信号处理器响应频谱域频谱带复制参数处理原始信号频谱表示以获得已调整的原始信号频谱表示。组合器将具有第一频带中的信号分量的音频信号或源于该音频信号的信号与已调整的原始信号频谱表示或与源于已调整的原始信号频谱表示的另一信号相组合以获得合成音频信号。

Description

音频信号合成器及音频信号编码器
本发明涉及用于产生合成音频信号的音频信号合成器、音频信号编码器及包含已编码音频信号的数据流。
自然的音频编码及语音编码是音频信号编译码的两个主要类别。自然的音频编码器通常用于在中等比特率下的音乐或任意信号且大体上提供宽音频频宽。语音编码器基本上限于语音再现且可在极低比特率下使用。宽带语音在窄带语音上提供主要的主观质量改良。通过增加该频宽不仅改良了语音的自然性,而且改良了扬声器的辨识及可懂性。因而宽带语音编码在下一代的电话系统中将是一个重要的课题。而且,由于多媒体领域的极大发展,音乐及其它非语音信号通过电话系统的高质量的传输及储存及对于例如无线电/电视(TV)传输或其它广播系统上的传输均为期望的功能。
为了大量地减小比特率,源编码可使用分带感知音频编译码器来执行。此等自然音频编译码在该信号中采用感知不相关及统计冗余。关于所给定的比特率限制,仅单单利用上述是不足的,取样率会被减小。通常也降低合成电平的量,允许偶尔可听见的量化失真,且通过两个或更多个声道的联合立体声编码或参数编码使立体声场退化。此等方法的过多使用导致恼人的感知下降。为了改良编码性能,诸如频谱带复制(SBR)的频带扩展方法作为用以在HFR(高频重建)式编译码中产生高频信号的有效方法。
在复制高频信号过程中,一种特定的转换可施加于例如低频信号,然后将转换的信号接着作为高频信号予以插入。此过程还被称为修补且可使用不同的转换。MPEG-4音频标准对所有音频信号仅使用一种修补算法。因此,其缺乏使修补适应不同的信号或编码方案的灵活性。
另一方面,MPEG-4标准提供对再生高频带的复杂处理,其中采用许多重要的SBR参数。此等重要的SBR参数是频谱包络的数据、用于增加至再生频谱部分的噪声基底的数据、使再生高频之音调适应原始高频之音调的反相滤波工具的信息及额外的频谱带复制处理数据(诸如缺漏谐波的数据)等。在滤波器组域内对由连续带通信号的修补所提供的复制的频谱的既定处理被证实可有效地提供高质量且在关于处理功率、内存需求及功率需求的合理资源下可实施。
另一方面,当发生已修补信号的另一处理时,修补发生在同一滤波器组中,以便在修补操作与该修补操作的结果的另一处理之间具有强烈关系。因而,在此组合的方法中,不同修补算法的实施是有问题的。
WO 98/57436揭露了用于与频谱包络调整相组合的频谱带复制中的变换方法。
WO 02/052545教导了信号可被分类为似脉冲列或非似脉冲列,且基于此分类提供一种自适应切换的变换器。该变换器平行地执行两个修补算法,且混合单元依据该分类(脉冲列或非脉冲列),组合两个已修补的信号。响应包络及控制数据,在包络调整滤波器组中执行该变换器之间的实际切换或混合包络。另外,对于似脉冲列组信号,该基带信号转换至滤波器组域内,执行频率变换操作且对该频率变换结果的包络进行调整。这是结合修补/进一步处理的方法。对于似非脉冲列信号,提供频域变换器(FD变换器)且该频域变换器的结果接着被转换为该滤波器组域,在此过程中执行该包络调整。因而,一方面具有结合修补/进一步处理的方法,且在另一方面具有位于供该包络调整发生的该滤波器组外的频域变换器的灵活性及实施的可能性均是存在问题的。
本发明的一个目的是提供一种提高质量且允许有效实施的合成器。
此目的通过根据权利要求1的合成器、根据权利要求9的编码器、根据权利要求13的合成音频信号的生成方法以及权利要求14提供的数据流的生成方法来实现。
本发明基于下列发现:一方面修补操作,另一方面对修补操作输出的进一步处理必须完全地在独立域中执行的发现。一方面这对在补丁生成器内优化不同修补算法提供了灵活性,及另一方面对无论采用基础修补算法总是使用同一包络调整提供了灵活性。因而,在频谱域(在其中发生包络调整)之外任何已修补信号允许不同修补算法灵活应用于完全地独立于后续SBR的进一步处理修补的不同的信号部分,且设计者不必考虑来自包络调整的修补算法的细节,并且不必考虑对于特定包络调整的修补算法的细节。相反地,频谱带复制的不同分量,即一方面修补操作及另一方面对于该修补结果的进一步处理可相互独立地予以执行。这意味着在整个频谱带复制中,修补算法分别予以执行,结果是对修补及剩余SBR操作可相互独立地优化,且因而对于未来的修补算法等是灵活的,修补算法可简单地予以应用而不用改变在频谱域中(其中未发生任何修补)所执行的对于修补结果的进一步处理的任何参数。
因为其允许将不同的修补算法容易地应用于信号部分,以便基带信号的每一个信号部分由以最佳方式适于此信号部分的修补算法来进行修补,所以本发明提供了提高的质量。另外,仍可使用操作于滤波器组中且既定及已经存在于诸如MPEG-4HE-AAC的许多应用中的直接、有效且高质量的包络调整工具。同过将修补算法与进一步的处理分离,以便没有修补算法应用于供修补结果的进一步处理执行的滤波器组域中,既定的修补结果的进一步处理可应用于所有可利用的修补算法中。然而,可选择地,修补也可在滤波器组及其它域中予以执行。
另外,因为对于低阶的应用可使用要求较少资源的修补算法,而对于高阶的应用可使用要求较多资源的修补算法,这产生更好的音频质量,所以此特征提供了可缩放性。可选择地,该等修补算法可保持相同,但该修补结果的进一步处理的复杂性可适于不同的需要。例如,对于低阶的应用,可用频谱包络调整的降低的频率分辨率,而对于高阶的应用,可用提供更好质量的更精密频率分辨率,特别在移动装置中,但也需要增加内存、处理器及电力消耗的资源。因为该修补工具不依赖于频谱包络调整工具,且反之亦然,所以所有这些可不牵扯相对应的其它工具而予以完成。相反地,该修补产生与通过藉由诸如滤波器组转换为频谱表示的已修补的原始数据的处理的分离已证实为最佳的特征。
根据本发明的第一方面,音频信号合成器产生具有第一频带及源于该第一频带的第二合成频带的合成音频信号。音频信号合成器包含补丁生成器、频谱转换器、原始信号处理器及组合器。补丁生成器执行至少两个不同的修补算法,其中每一个修补算法使用具有第一频带中的信号分量的音频信号产生具有第二合成频带中的信号分量的原始信号。该补丁生成器适于响应第一时间部分的控制信息选择至少两个不同修补算法中的一个且响应不同于该第一时间部分的第二时间部分的控制信息选择至少两个不同修补算法中的另一个,以获得该第一及该第二时间部分的原始信号。该频谱转换器将原始信号转换为原始信号频谱表示。原始信号处理器响应频谱域频谱带复制参数处理原始信号频谱表示以获得已调整的原始信号频谱表示。组合器将具有第一频带中的信号分量的音频信号或源于音频信号的信号与已调整的原始信号频谱表示或与源于该已调整的原始信号频谱表示的另一信号相组合以获得该合成音频信号。
在另一实施例中,将音频信号合成器配置成至少两个修补算法因为在第一频带中的频率下音频信号的信号分量被修补为第二频带中的目标频率且目标频率对于两个修补算法有所不同而相互不同。补丁生成器可更适于对于两个修补算法均在时域中的操作。
根据本发明的另一方面,音频信号编码器由音频信号产生包含在第一频带中音频信号的分量、控制信息及频谱带复制参数的数据流。音频信号编码器包含频率选择滤波器、生成器及控制信息生成器。频率选择滤波器产生在第一频带中音频信号的分量。生成器由在第二频带中该音频信号的分量产生频谱带复制参数。控制信息生成器产生控制信息,控制信息从第一或第二不同修补算法中识别优选修补算法。每一个修补算法使用在第一频带中音频信号的分量产生具有在第二复制频带中的信号分量的原始信号。
根据本发明的又一方面,在连接于计算机的传输在线传输的音频信号比特流,包含在第一频带中的已编码的音频信号、控制信息及该等频谱带复制参数。
因而,本发明涉及用于在频谱带复制中不同修补算法之间的切换的方法,其中所使用的修补算法在编码器端依据该编码器所做出的决策而定,且在译码器端依据该比特流中所传输的信息而定。通过使用频谱带复制(SBR),高频分量的产生可例如通过将QMF滤波器组(QMF=正交镜像滤波器)中的低频信号分量复制到高频带上来完成。此复制也可称为修补且根据本发明的实施例,此修补也可由在时域中操作的可选择的方法来替代或补充。可选择的修补算法的范例是:
(1)上取样(例如通过频谱的镜像);
(2)相位声码器;
(3)非线性失真;
(4)在QMF域中通过改变QMF频带次序镜像频谱;
(5)模型驱动(特别地对于语音);及
(6)调变。
可选择的修补算法也可在编码器中执行,以获得由例如SBR工具所使用的如噪声填充、反相滤波、遗漏谐波等的该等频谱带复制参数。根据实施例,在补丁生成器内的修补算法被替代而仍使用剩余的频谱带复制工具。
修补算法的具体选择依据所施予的音频信号而定。例如,相位声码器极度地改变语音信号的特征,因而该相位声码器不对例如语音或类语音信号提供适当的修补算法。因此,依据音频信号类型,补丁生成器从用于产生高频带的修补的不同可能性中选择修补算法。例如,补丁生成器可在现有的SBR工具(QMF频带的复制)与相位声码器或任何其它修补算法的间切换。
因而,与传统的SBR实施(例如实施于MPEG-4中)不同,本发明的实施例使用用于产生高频信号的补丁生成器。该补丁生成器不仅可操作在频率中,而且可操作在时域中且如下执行修补算法:镜像和/或上取样和/或相位声码器和/或非线性失真。频谱带复制是否在频域或在时域中完成,依据具体信号(即其为信号可适应的)而定,下面将详细解释。
频谱带复制依赖于此事实:对于许多目的,仅传输在核心频带内的音频信号且在译码器中产生在较高频带中的信号分量是足够的。因为例如对于语音及音乐,高频率分量通常与在核心频带中的低频带分量具有相关性,所以产生的音频信号将仍维持高的感知质量。因而,通过使用产生遗漏高频分量的适当的修补算法,可能获得高感知质量的音频信号。同时,因为仅在核心频带内的音频信号被压缩编码且传输至译码器,所以较高频带的参数驱动产生导致该比特率显著降低以编码音频信号。对于剩余的频率分量,仅传输在产生原始高频带信号的估计的过程中控制译码器的控制信息及频谱带复制参数。所以,严格来说,这一过程包括三个层面:(i)参数HF带的估计(SBR参数的计算),(ii)产生原始修补(实际修补)及(iii)提供进一步处理(例如噪声基底调整)。
核心频带可由交越频率来定义,其定义了该频带内的临界值,且最高至到临界值,执行音频信号的编码。核心编码器编码在由交越频率所限制的核心频带内的音频信号。开始于交越频率,信号分量将由频谱带复制产生。在使用用于频谱带复制的是传统方法中,通常发生一些信号在核心编码器的交越频率处包含不必要的缺陷。
通过使用本发明的实施例,可能确定出避免上述缺陷或至少以不具有感知影响的方式修改这些缺陷的修补算法。例如,通过使用镜像作为时域中的修补算法,该频谱带复制相似于AMR-WB+内的频带扩展(BWE)(扩展自适应多率宽带编译码)予以执行。此外,依据该信号改变修补算法的机率提供了例如对于语音及音乐使用不同的频带扩展的机率。但是对于不能明确地识别的如音乐或语音(即混合信号)的信号,该修补算法可在短时间区段内改变。例如,对于任何给定的时间区段,优选的修补算法可用于修补。此优选的修补算法可由编码器确定,编码器可例如将每一个经处理的结构的输入资料修补结果与原始音频信号进行比较。这显著地改良了由音频信号合成器所产生的生成音频信号的感知质量。
本发明的另一优点在于将补丁生成器与可包含标准SBR工具的原始信号处理器分离。由于此分离,可使用可包含反相滤波、增加噪声基底或遗漏谐波或其它的常用SBR工具。因而,标准的SBR工具仍可使用而该修补可灵活性地予以调整。此外,因为标准的SBR工具在频域中使用,将补丁生成器与SBR工具分离,所以允许修补在频域中或在时域中计算。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明将通过举例说明来予以描述。参照下面的详细描述,以及参照附加图式,本发明的特征将更容易予以理解及明白,其中:
图1为根据本发明实施例音频信号处理的流程框图;
图2为根据本发明实施例的补丁生成器的结构图;
图3为组合器在时域操作的流程框图;
图4a至4d示出了不同修补算法的示例;
图5a至5b示出了相位声码器及通过复制的修补;
图6a至6d为处理编码音频流以输出PCM取样的流程框图;及
图7a至7c为根据本发明另一实施例的音频编码器的结构图。
发明的详细描述
下面的实施例仅是对用于改良例如与音频译码器一同使用的频谱带复制的本发明的原理的说明性描述。应理解的是在此所描述的安排及细节的修改及变化对于本领域技术人员而言是清楚的。因而,其不打算由通过在此对实施例的描述及解释所呈现的特定细节而被限制。
图1示出了用于产生具有第一频带及源于第一频带的第二复制的频带的合成音频信号105的音频信号合成器。音频合成器包含用于执行至少两个不同修补算法的补丁生成器110,其中每一个修补算法使用具有在第一频带中的信号分量的音频信号105产生具有在第二复制的频带中的信号分量的原始信号115。补丁生成器110适于响应第一时间部分的控制信息112选择至少两个不同修补算法中的一个,且响应不同于第一时间部分的第二时间部分的控制信息112选择至少两个不同修补算法中的另一个,以获得第一时间部分及第二时间部分下的原始信号115。音频信号合成器进一步包含用于将原始信号115转换为包含具有在第一子带、第二子带等中的分量的原始频谱表示125的频谱转换器120。音频信号合成器进一步包含用于根据频谱域频谱带复制参数132处理原始频谱表示125以获得已调整的原始信号频谱表示135的原始信号处理器130。音频信号合成器进一步包含用于将具有第一频带中的信号分量的音频信号105或源于音频信号105的信号与已调整的原始信号频谱表示135或与源于已调整的原始信号频谱表示135的另一信号相组合以获得合成音频信号145的组合器140。
在另一些实施例中,组合器140适于使用作为源于音频信号105的信号的原始信号频谱表示125。由组合器所使用之源于音频信号的信号也可是由诸如分析滤波器组的时间/频谱转换器所处理的音频信号或由操作于时域中或频谱域中的补丁生成器所产生的低频带信号或延迟的音频信号或通过上取样操作处理过的音频信号以便将被组合的信号具有相同的基本取样率。
在又一实施例中,音频信号合成器进一步包含用于分析具有第一频带201中的信号分量的音频信号105的特征且用以提供识别第一修补算法或第二修补算法的控制信息112的分析器。
在另一些实施例中,分析器适于识别具有声音程度的时间部分的非谐波修补算法或音频信号105中的可区别时间部分的谐波修补算法。
在又一些实施例中,音频信号105与元数据一起编码为数据流,且其中补丁生成器110适于从数据流中的元数据中获得控制信息112。
在又一些实施例中,频谱转换器120包含分析滤波器组或至少两个不同修补算法包含声码器算法或上取样修补算法或非线性失真修补算法或复制算法。
在又一些实施例中,原始信号处理器130适于执行频谱带的能量调整或在频谱带的反相滤波或用以将噪声基底增加至频谱带中或用以将遗漏谐波增加至频谱带中。
图2为包含接收控制信息112及音频信号105的控制器及修补装置113的补丁生成器110的更详细的框图。控制器111适于选择基于控制信息112的修补算法。补丁生成器110包含执行第一算法1的第一修补装置113a、执行第二修补算法2的第二修补装置113b等。大体上,补丁生成器110包含与有用的修补算法一样多的修补装置113。例如,补丁生成器110可包含二、三、四或多于四个的修补装置113。在控制器111已基于控制信息112选择修补装置113之一之后,控制器111将音频信号105传输至修补装置113中的一个,以执行修补算法且输出包含复制的频带202、203中的信号分量的原始信号115。
图3为组合器140的更详细的框图,其中组合器140包含合成滤波器组141、延迟器143及加法器147。已调整的原始信号135输入至由已调整的原始信号135(例如在频谱表示中)产生在时域135t内的已调整的原始信号(时域原始信号)的合成滤波器组141中。基带音频信号105输入至延迟器143中,延迟器143适于藉由一定时段来延迟基带信号105且输出延迟的基带信号105d。延迟的基带信号105d及时域已调整的原始信号135t由加法器147相加,产生由组合器140输出的合成音频信号145。在延迟器143中的延迟依据音频信号合成器的处理算法而定,以实现时域已调整的原始信号135t与延迟的基带信号105d将对应于同一时间(同步)。
图4a至4d示出了由补丁生成器110中的修补装置113所使用的不同的修补算法。如以上所解释,修补算法产生在复制的频域中的已修补信号。在图4中所示的实施例中,第一频带201延伸至第二频带202(或第二复制频带)开始时的交越频率fmax,且第二频带202延伸至两倍的交越频率2*fmax。超过此频率,第三频带203(或第三复制的频带)开始。第一频带201可包含前述的核心频带。
在图4中,四个修补算法作为范例予以示出。在图4a中的第一修补算法包含镜像或上取样,第二修补算法包含复制或调制且显示于图4b中,第三修补算法包含一相位声码器且显示于图4c中,且包含失真的第四修补算法显示于图4d中。
执行图4a中的镜像以便第二频带202中的已修补信号通过在交越频率fmax处镜像第一频带201而获得。第三频域203中之已修补信号依次通过镜像在第二频带202中的信号而获得。因为第二频带202中的信号已经是镜像的信号,所以在第三频带203中的信号也可简单地通过将第一频带201中的音频信号105移位至第三频带203中而获得。
图4图所示的第二修补算法实施复制(或调制)信号。在此实施例中,第二频带202中的信号通过将第一频带201中的信号移位(复制)至第二频带202中而获得。类似地,第三频带203中的信号也可通过将第一频带201中的信号移位至第三频带203中而获得。
图4c示出了使用相位声码器作为修补算法的实施例。已修补信号由后续步骤产生,其中第一步产生两倍于最高频率2*fmax的信号分量且第二步产生三倍于最高频率3*fmax的信号分量等。相位声码器以系数n(n=2、3、4…)乘以取样频率而产生取样值在核心频带(第一频带201)的n倍频率范围的延展。
图4d示出了使用失真(例如通过将信号平方)的修补算法。失真可通过许多方式获得。一种简单的方式是平方信号电平以产生较高的频率分量。失真的另一种获取方法是通过剪辑(例如通过切断在某一临界值之上的信号)而获得。而且在这种情况下,将产生高频率分量。基本上现有的方法中任何失真处理都可用于此处。
图5a更详细地显示相位声码器的修补算法。如前所述,第一频带201再次延伸至第二频带202(其结束于例如两倍的最高频率2*fmax处)开始时的最高频率fmax(交越频率)。在第二频带202之后,第三频带203开始且可延伸至例如三倍的最高频率3*fmax。
为了描述简单,图5a显示音频信号105的具有八个频率线105a、105b、…、105h的频谱(电平P是频率f的函数)。从这八个线105a、105b、…、105h中,相位声码器通过根据所显示的箭头移位线而产生新信号。移位相对应于前述的乘法。详细来说,第一线105a移位至第二线105b,第二线移位至第四线等,以此类推,直至移位至第十六线(第二频域202中的最后一条线)的第八线105h。上述相对应于乘2。为了产生达三倍最高频率3*fmax的线,所有线的频率可与3相乘,即第一线105a移位至第三线105c,第二线105b移位至第六线等,以此类推,直到移位至第二十四线(第三频带203中的最后一条线)的第八线105h。显然地通过此相位声码器,线不再是等距的,但扩展至更高频率。
图5b更详细地示出了复制的修补过程。再次,电平P作为频率f的函数予以显示,其中八条线在第一频带201中,上述八条线被复制于第二频带202中且也被复制于第三频带203中。这一复制恰意味着第一频带201中的第一线105a也可成为第二频带202及第三频带203中的第一线。因此,复制频带202及203中的每一个的第一线都可由第一频带201中的同一线来复制。类似地,这也适于其它线。因此,整个频带被予以复制。
图4及图5示出的不同的修补算法可不同地应用于时域中或频域中且包含可用于不同应用中的不同优点或缺点。
例如,图4a示出了频域中的镜像。在时域中,镜像可通过由整数系数来增加取样率(其可通过在每一对现存取样之间插入额外的取样来完成)而予以执行。这些额外的取样不是从音频信号中获得,而是由系统引入且包含例如接近于或等于零的值。在最简单的情况下,如果仅将一个额外取样引入两个现存取样之间,那么实现加倍数量的取样意味着加倍的取样率。如果引入多于一个的另一些取样(例如以等距的方式),那么取样率将因而增加且因此频率频谱也增加。大体上,在每一、二个现存的取样之间的另一些取样的数量可是任何数目n(n=2、3、4…),其增加了取样率n倍。额外取样的插入产生在奈奎斯特频率(其在给定取样率下表示的最高频率)下对频谱的镜像。因而,基带频谱(第一频带中的频谱)的频域通过此方式被直接地镜像于下一频带中。可选择地,此镜像可与可允许的低通滤波和/或频谱成形相结合。
此修补算法的优点可概括如下。使用这一方法,与在频域中使用相似的方法相比更好地保留了信号时间结构。而且,藉由频谱镜像频率,接近于奈奎斯特频率的线被映射到也是接近于奈奎斯特频率的线。这是有优势的,因为在镜像上述频谱之后,镜像频域(即原始音频信号105的奈奎斯特频率)周围的区域在许多方面上很相似,例如关于频谱平坦度的性质、音调性质、累积或频率点的不同等。通过这一方法,频谱例如通过使用复制技术以更为适度的方式继续至下一频率带,其中完全源于原始频谱中的不同区域且因而显示极为不同特征的频率区域相互接近地结束。在复制中:第一取样再次成为复制的频带中的第一取样,然而在镜像中最后取样成为复制的频带中的第一取样。频谱更为柔和的连续性可依序降低由其它修补算法所产生的重建频谱的非连续特征所造成的感知假象。
最后,存在在例如较低频率区域(第一频带201)中包含大量谐波的信号。这些谐波在频谱中以局部高峰的形式出现。然而,在频谱的较高部分仅有极少的谐波存在,或换句话说,在频谱的较高部分中谐波的数量较少。通过简单地使用对频谱的复制,这将致使在具有大量谐波的频谱的较低部分中复制的信号被直接地复制到在原始信号中仅具有极少谐波的较高频率区域中。因此,原始信号及复制信号的较高频带中,关于谐波的数量极为不同,这是不期望的且应当避免。
镜像的修补算法也可应用于频域中(例如于QMF区域中),在这种情况下,频带的次序是相反的以便发生从后至前的重排序。此外,对于子带取样,必须形成复数共轭值以使每一取样的虚部改变符号。这产生在子带内频谱的反相。
此修补算法包含对于修补边界的高灵活性,因为频谱的镜像不一定在奈奎斯特频率下完成,而也可在任何子带边界下执行。
然而,在修补边沿处可能不会发生邻近QMF频带之间的频迭相消,这是可以或不可以容忍的。
通过扩展或使用相位声码器(参见图4c或图5a),频率结构以谐波形式被正确地延伸至高频域,因为基带201以频谱形式由一或多个相位音频编码器执行的偶数倍扩展,且因为基带201中的频谱分量与额外所产生的频谱分量相组合。
如果基带201已经通过例如仅使用极低的比特率强制地限制于频宽中,那么此修补算法是优选的。因此,较高频率分量的重建已经以一相对低的频率开始。在这种情况下,典型的交越频率小于大约5kHz(或更有甚者小于4kHz)。在这一区域中,人耳对由于谐波不正确定位而产生的不谐和音极为敏感。这可导致“非自然”音调的印象。此外,频谱接近地相间隔的音调(具有大于30Hz至300Hz的频谱距离)被感知为刺耳的音调。基带201的频率结构的谐波连续性避免了上述不正确及不愉悦的听觉印象。
在以复制方式的第三修补算法(参见图4c或图5b)中,频谱区域是以子带方式被复制到较高频率区或被复制到将被复制的频率区。而且复制依赖于观察,其对所有修补算法来说都是正确的,即较高频率信号的频谱性质在许多方面相似于基带信号的性质。相互仅有极少的偏差。此外,典型地,人耳在高频(典型地以大约5kHz开始)中,尤其对于不精确的频谱映射极为不敏感。事实上,大体上这是频谱带复制的主要关键点。特别地,复制包含其可容易且快速实施的优点。
因为频谱的复制可在任何子带边界下执行,所以此修补算法对于修补之边界也具有高灵活性。
最后,失真的修补算法(参见图4d)可包含通过剪辑、限制、平方等产生谐波。如果例如扩展信号在频谱上是非常稀疏的排列(例如在利用了上面所提及的相位声码器的修补算法之后),那么扩展频谱可选择地由失真信号额外地予以填补以避免不想要的频率空洞,这是可能的。
图6a至6d显示执行于音频译码器中的音频信号合成器的不同实施例。
在图6a图所示的实施例中,已编码的音频流345输入至比特流负载解格式器350中,其一方面分离出已编码的音频信号355且另一方面分离出额外信息375。已编码的音频信号335输入至例如产生在第一频带201中译码的音频信号105的AAC核心译码器360中。音频信号105输入至包含例如32个频带且产生在频域中的音频信号10532的分析32频带的QMF组370中。优选的是补丁生成器仅输出高频带信号作为原始信号且不输出低频带信号。另一方式是,如果补丁生成器110中的修补算法也产生低频带信号,优选的是对输入至SBR工具130a的输入信号进行高通滤波。
频域音频信号10532输入至在此实施例中产生频域(QMF域)修补的补丁生成器110中。产生的原始信号频谱表示125输入至可例如产生噪声基底、重建遗漏谐波或执行反相滤波的SBR工具130a中。
另一方面,额外信息375输入至比特流解析器380中,其分析额外信息以获得不同的子信息385且将它们输入例如提取出控制信息112及频谱带复制参数132的霍夫曼译码与反量化单元390中。控制信息112输入至SBR工具中,且频谱带复制参数132输入至SBR工具130a和包络调整器130b中。包络调整器130b可操作地调整所产生的修补的包络。因此,包络调整器130b产生已调整的原始信号135且将其输入至将已调整的原始信号135与频域中的音频信号10532相组合的合成QMF组140中。合成QMF组可包含例如64频带且通过组合两个信号(已调整的原始信号135及频域音频信号10532)产生合成音频信号145(例如PCM取样的输出,PCM=脉冲编码调变)。
此外,图6a显示可实施用于补丁生成器110的QMF频谱数据输出上的已知的频谱带复制方法的SBR工具130a。图6a示出了用于频域中的修补算法可对例如在频域内的频谱数据使用简单的镜像或复制(参见图4a及图4b)。
此通常结构与现有的译码器一致,但是实施例中由补丁生成器110替代了习知的补丁生成器,配置补丁生成器110以执行不同的用以改良音频信号的感知质量的可适性修补算法。此外,实施例也可使用在时域内的修补算法且不一定要是在图6a所显示的频域中的修复。
图6b示出了本发明的实施例,其中补丁生成器110可在频域内以及在时域内使用修补算法。图6b中的译码器同样包含比特流负载解格式器350、AAC核心译码器360、比特流解析器380及霍夫曼译码与反量化单元390。因而,在图6b所示的实施例中,已编码音频流345再次输入至一方面产生已编码音频信号355且将其与额外信息375分离的比特流负载解格式器350中,额外信息375然后由比特流解析器380解析以分离出输入至霍夫曼译码与反量化单元390中的不同信息385。另一方面,已编码音频信号355输入至AAC核心译码器360中。
现在,实施例区分出这两种情况:补丁生成器110在频域(以下以点信号线表示)内或在时域(以下以虚线信号线表示)内操作。
如果补丁生成器操作于时域中,那么AAC核心译码器360的输出输入至修复生成器110中(虚线音频信号105)且其输出被传输至分析滤波器组370。分析滤波器组370的输出是输入于SBR工具130a中(其是原始信号调整器130的一部分)以及合成QMF组140中的原始信号频谱表示125。
如果在另一方面,修补算法使用频域(如图6a所示),那么AAC核心译码器360的输出经由点线的音频信号105输入至分析QMF组360中,分析QMF组360依序产生频域音频信号10532且将音频信号10532传输至补丁生成器110及分析QMF组140(点线)。补丁生成器110再次产生原始信号表示125且将此信号传输至SBR工具130a。
因此,实施例使用点线(频域修补)执行第一处理模式或使用虚线(时域修补)执行第二处理模式,其中在其它功能组件之间所有实线均用于两个处理模式中。
补丁生成器的时间处理模式(虚线)优选的是补丁生成器的输出包括低频带信号及高频带信号,即补丁生成器的输出信号是由低频带信号及高频带信号组成的宽频带信号。低频带信号输入至合成QMF组140中且高频带信号输入于SBR工具130a中。上述频带的分离可在分析组370中执行,但也可以另一方式予以执行。另外,AAC译码器的输出信号可直接地输送至分析滤波器组370以便补丁生成器输出信号的低频带部分根本未予以使用且原始低频带部分用于组合器104中。
在频域处理模式中(点线),补丁生成器优选地仅输出高频带信号,且原始低频带信号直接地输送至分析滤波器组370从而输送至合成QMF组140。可选择地,补丁生成器也可产生全频带输出信号且将低频带信号输送至组合器104。
同样,霍夫曼译码与反量化单元390产生频谱带复制参数132及输入至补丁生成器110中的控制信息112。此外,频谱带复制参数132传输至包络调整器130b以及SBR工具130a。包络调整器130b的输出是在组合器140(合成QMF组)中与频谱带音频信号10532(对于频域修补而言)或与原始信号频谱代表125(对于时域修补而言)相组合以产生如前所述包含输出PCM取样的合成音频信号145的已调整原始信号135。
而且,在此实施例中,补丁生成器110使用修补算法之一(例如图4a至4d所示)以通过使用在第一频带201中的基带信号产生的在第二频带202中或在第三频带203中的音频信号。仅在第一频带201中取样的音频信号以编码的输出流345的形式编码为且遗漏取样通过使用频谱带复制方法而予以产生。
图6c示出了在时域中修补算法的一个实施例。对比于图6a,图6c所示的实施例因补丁生成器110及分析QMF组120的位置而不同。译码系统的所有的剩余组件与图6a所示的一致,因此在此省略了重复的描述。
补丁生成器110从AAC核心译码器360接收音频信号105,且执行在时域内的修补以产生输入至频谱转换器120(例如包含64频带的分析QMF组)中的原始信号115。有许多可能性的是,如果补丁生成器110通过在现存的取样之间引入额外的取样(例如接近于零值)来执行修补,那么由补丁生成器110所执行的在时域中的修补算法产生包含双倍取样率的原始信号115。频谱转换器120的输出是输入至原始信号调整器130的原始信号频谱代表125,原始信号调整器130如前所述一方面包含SBR工具130a,另一方面包含包络调整器130b。如前面实施例所示,包络调整器的输出包含在组合器140中在频域105f与音频信号相组合的已调整原始信号135,且组合器140如前所述又包含例如64频带的合成QMF组。
因此,主要的不同是,例如镜像执行于时域中且较高频率数据在信号115输入至分析滤波器组(64频带)120中之前已经予以重建,这意味着信号已经包含双倍取样率(在双率SBR中)。在此修补操作之后,可使用又包含反相滤波、增加噪声基底或增加遗漏谐波的常态SBR工具。虽然高频区域的重建发生在时域中,但是分析/合成执行于QMF域中以便剩余SBR机制仍可予以使用。
图6c的实施例中,补丁生成器优选地输出包含低频带信号及高频带信号(原始信号)的全频带信号。可选择地,补丁生成器仅输出例如由高通滤波而获得的高频带部分,且AAC核心译码器输出105直接地输送至QMF组120。
在又一实施例中,补丁生成器110包含时域输入接口和/或时域输出接口(时域接口),补丁生成器110中的处理可发生于诸如QMF域或诸如DFT、FFT、DCT、DST或任何其它频域的任何域中。接着,时域输入接口连接于时间/频率转换器或大体上连接于用于从时域转换为频谱表示的转换器。接着,频谱表示使用操作于频域数据上的至少两个不同修补算法来处理。可选择地,第一修补算法操作于频域中且第二修补算法操作于时域中。已修补的频域数据被转换回接着经由时域输出接口输入至频谱转换器120中的时域表示。在实施例中,其中在线信号115不包含全频带,而仅包含低频带,滤波优选地在将频谱信号转换于时域之前在频域中执行。
优选地,补丁生成器110中的频谱分辨率高于由频谱转换器120所获得的频谱分辨率。在本发明的一个实施例中,补丁生成器110中的频谱分辨率至少是谱转换器120中的频谱分辨率的两倍。
通过将由本实施例所实施的修补算法孤立于单独功能结构中,可以完全不依赖于SBR工具的使用而应用任何频谱复制方法。在可选择的实施中,也可能平行地将AAC译码器信号输入至32频带的分析滤波器组中,并通过时域中的修补产生高频分量。基带与已修补的信号将仅在QMF分析之后相组合。
图6d示出了这样一个实施例,其中修补执行于时域中。相似于图6c所示的实施例,而在此实施例中与图6a的不同包含补丁生成器110以及分析滤波器组的位置。特别地,AAC核心译码器360、比特流负载解格式器350以及比特流解析器308及霍夫曼译码与反量化单元390与图6a所示的实施例中的相同且在此再次省略重复的描述。
图6d所示的实施例分支出由译码器360所输出的音频信号105且将音频信号105输入至补丁生成器110以及分析32频带QMF组370中。分析32频带QMF组370(更进一步的转换器370)进一步产生原始信号频谱表示123。补丁生成器110又执行时域内的修补且产生输入至频谱转换器120(又可为包含64频带的分析QMF滤波器组)中的原始信号115。频谱转换器120产生在本实施例中包含第一频带201中的频率分量及第二或第三频带202、203中的复制频带的原始信号频谱表示125。而且,此实施例包含适于使分析滤波器组(32频带)370的输出与原始信号频谱表示125相加以获得组合的原始信号频谱表示126的加法器124。也可大体上配置加法器124是以将基带分量(在第一频带201中的分量)从原始信号频谱表示125中减去的组合器124。因此,配置加法器124以加反向信号或可选择地可包含可选择的反相器以使来自分析滤波器组(32频带)370的输出信号反相。
在基频带201中的频率分量被示范地减少之后,输出再次输入至频谱带复制工具130a中,产生的信号依次向前至包络调整器130b中。包络调整器130b再次产生在组合器140中与分析滤波器组(32频带)370的输出相组合以便组合器140将已修补频率分量(例如在第二及第三频带202、203中)与由分析滤波器组(32频带)370输出的基带分量相组合的已调整原始信号135。再次,组合器140可包含产生合成音频信号(包含例如输出PCM取样)的64频带的合成QMF滤波器组。
在图6d的实施例中,补丁生成器优选地输出包含低频带信号及高频带信号(原始信号)的全频带信号。可选择地,补丁生成器仅输出例如由高通滤波所获得的用于输送至频谱转换器120的频带部分,且如图6d所示直接将AAC输出输送至分析QMF组370。另外,因为此信号仅包含高频带,所以不需要减法器124且将频谱转换器120的输出直接输送至SBR工具130a。此外,分析QMF组370不需要输出至减法器124。
在又一实施例中,补丁生成器110包含时域输入接口和/或时域输出接口(时域接口),且补丁生成器110中的处理可发生于诸如QMF域或诸如DFT、FFT、DCT、MDCT、DST或任何其它频域的任何域中。接着,时域输入接口连接于时间/频率转换器或大体上连接于用于从时域转换为一频谱表示的转换器。接着,频谱表示使用操作于频域数据上的至少两个不同修补算法来处理。可选择地,第一修补算法操作于频域中且第二修补算法操作于时域中。已修补的频域数据被转换回接着经由时域输出接口输入于频谱转换器120中的时域表示。
优选地,补丁生成器110中的频谱分辨率高于由频谱转换器120所获得的频谱分辨率。在一个实施例中,补丁生成器110中的频谱分辨率至少是频谱转换器120中的频谱分辨率的两倍。
图6a至6d涵盖了译码器结构且特别地包含了在译码器结构内的补丁生成器110。为了使译码器及特别地补丁生成器110能够产生或复制较高的频率分量,编码器可将额外的信息传输至译码器,其中额外信息112一方面提供可例如用以决定修补算法的控制信息且此外提供将由频谱带复制工具130a所使用的频谱带复制参数132。
另一些实施例还包含用于产生具有第一频带及源于第一频带201的第二复制频带202的合成音频信号145的方法。方法包含执行至少两个不同的修补算法,将原始信号115转换为原始信号频谱表示125,处理原始信号频谱表示125。每一修补算法使用具有第一频带201中的信号分量的音频信号105产生具有第二复制频带202中的信号分量的原始信号115。修补被执行,以便至少两个修补算法中的一个响应第一时间部分的控制信息112而选定,且至少两个修补算法中的另一个响应不同于第一时间部分的第二时间部分的控制信息112而选定,以获得第一及第二时间部分的原始信号115。原始信号频谱表示125的处理根据频谱域频谱带复制参数132来执行以获得已调整的原始信号频谱表示135。最后,方法包含将具有第一频带201中的信号分量的音频信号105或源于音频信号105的信号与已调整的原始信号频谱表示135或与源于已调整的原始信号频谱表示135的另一信号相组合,以获得合成音频信号145。
图7a、7b及7c包含编码器的实施例。
图7a示出了编码音频信号305以产生依次输入于图6a至6d所示的译码器中的已编码音频信号345的编码器。图7a示出了编码器包含供音频信号305输入的低通滤波器310(或通用的频率可选的滤波器)及高通滤波器320。低通滤波器310分离第一频带201内的音频信号分量,然而高通滤波器320分离剩余的频率分量,例如第二频带202及另一些频带中的频率分量。因而,低通滤波器310产生低通滤波信号315且高通滤波器320输出高通滤波音频信号325。低通滤波音频信号315输入至可包含例如AAC编码器的音频编码器330中。
此外,低通滤波音频信号315输入至适于产生控制信息112以便依序由补丁生成器110所选定的优选修补算法可获识别的控制信息生成器340中。高通滤波音频信号325输入至频谱带数据生成器328中,频谱带数据生成器328产生一方面输入至修补选择器的频谱带参数132。而且,图7a的编码器包含接收来自音频编码器330的已编码音频信号、来自频谱带复制数据生成器328的频谱带复制参数132及来自控制信息生成器340的控制信息112的格式器343。
频谱带复制参数132可依据修补方法而定,即对于不同的修补算法,频谱带参数可不同或可相同,且可以不一定为所有的修补算法确定SBR参数132(下面图7c所示的实施例仅有一组SBR参数132需要予以计算)。因而,频谱带生成器328可为不同的修补算法产生不同的频谱带参数132且因而频谱带参数132可包含适于第一修补算法的第一SBR参数132a、适于第二修补算法的第二SBR参数132b、适于第三修补算法的第三SBR参数132c等。
图7b更详细地示出了控制信息生成器340的实施例。控制信息生成器340接收低通滤波信号315及SBR参数132。低通滤波信号315可输入至第一修补单元342a、第二修补单元342b及其它修补单元(图未示)中。修补单元342的数量可例如与由译码器中补丁生成器110可执行放入修补算法的数量相一致。修补单元342的输出包含第一修补单元342a的第一已修补的音频信号344a、第二修补单元342b的第二已修补的音频信号344b等。包含第二频带202中的原始分量的已修补音频信号344输入至频谱带复制工具346中。同样,频谱带复制工具346的数量可例如等于修补算法的数量或等于修补单元342的数量。频谱带复制参数132也输入至频谱带复制工具346(SBR工具)中,以便第一SBR工具方块346a接收第一SBR参数132a及第一已修补信号344a。第二SBR工具方块346b接收第二SBR参数132b及第二已修补信号344b。频谱带复制工具方块346在复制参数132的基础产生包含第二和/或第三频带202及203内的较高的频率分量的复制音频信号347。
最后,控制信息生成器340包含适于将原始音频信号305且特别地是音频信号305的较高频率分量与复制的音频信号347进行比较的比较单元。同样,比较可对每一修补算法执行以便第一比较单元348a将音频信号305与由第一SBR工具346a所输出的第一复制的音频信号347a进行比较。类似地,第二比较单元348b将音频信号305与来自第二SBR工具346b的第二复制的音频信号347b进行比较。比较单元348确定高频带中复制音频信号347与原始音频信号305的偏差,以便最后评估单元349可比较在原始音频信号305与使用不同修补算法的已修补音频信号347之间的偏差,且由此确定优选的修补算法或一些合适的或不合适的修补算法。控制信息112包含允许识别优选修补算法之一的信息。控制信息112可包含例如可在原始音频信号305与复制音频信号347之间之最小偏差的基础上予以确定的优选修补算法的识别号。可选择地,控制信息112可提供在音频信号305与已修补音频信号347之间达成充分一致的多个修补算法或修补算法的分级。评估可针对例如对感知质量而执行,以便复制音频信号347在理想的情况下人类无法区别于或接近无法区别于原始音频信号305。
图7c示出了编码器的另一实施例,其中同样,将音频信号305输入,但是也可选择地将元数据306输入于编码器中。原始音频信号305再次输入只低通滤波器310以及高通滤波器320中。低通滤波器310的输出再次输入至音频编码器330中且高通滤波器320的输出输入至SBR数据生成器328中。而且,编码器包含元数据处理单元309和/或其输出发送至控制信息生成器340的分析单元(或用于分析的装置)307。配置元数据处理单元309以根据合适的修补算法分析元数据306。分析单元307可例如确定音频信号305内瞬时的或脉冲群或非脉冲群段的数量及强度。基于元数据处理单元309的输出和/或分析工具307的输出,控制信息生成器340可再次确定优选的修补算法或产生修补算法的评比,且编码控制信息112内的此信息。格式器343再次将控制信息112、频谱带复制参数132以及已编码音频信号355组合在已编码音频流345内。
用于分析的装置307提供例如音频信号的特性且可适于识别对于具有声音程度的时间部分的非谐波信号分量或对于可区别时间部分的谐波信号分量。如果音频信号305是纯粹的语音或声音,那么声音的程度高,然而对于声音与例如音乐的混合,声音的程度较低。SBR参数132的计算可依赖于此特征及优选修补算法来执行。
又一实施例包含下述方法,其中方法产生包含在第一频带201中的音频信号205的分量、控制信息112及频谱带复制参数132的数据流345。方法包含对音频信号305频率选择滤波以产生在第一频带201中音频信号305的分量。方法进一步包含由在第二频带202中音频信号305的分量产生频谱带复制参数132。最后,方法包含产生从第一或第二不同修补算法中识别优选修补算法的控制信息112,其中每一修补算法使用在第一频带201中音频信号305的分量产生具有在第二复制的频带202中的信号分量的原始信号115。
虽然在图6a至6d中的一些实施例已予以特别地说明以便在低频带与已调整的高频带之间的组合在频域中执行,但是应注意的是组合也可在时域中执行。最后,核心译码器输出信号可用于(在用于补偿由于修补及调整所导致的处理延迟的必要的延迟级的输出)时域中,且在滤波器组域中受调整的高频带可转换回时域中成为不具有低频带部分而具有高频带部分的信号。在图6的实施例中,此信号将仅包含最高的32子带,且此信号至时域的转换产生时域高频带信号。接着,两个信号可例如通过逐取样相加组合于时域中以获得将予以数字/模拟转换且输送至扬声器的例如PCM取样作为输出信号。
虽然在装置的上下文中已对一些层面予以描述,但是要清楚的是此等层面也可表现相对应之方法的描述,其中结构或装置相对应于方法步骤或方法步骤的特征。相似地,方法步骤之上下文中所描述的层面也可表示对相对应的结构或项目或相对应的装置的特征的描述。
本发明提供的已编码音频信号或比特流可储存于数字储存媒体上或可传输至诸如无线传输媒体或诸如因特网之一的有线传输媒体的传输媒体上。
根据某些实施要求,本发明的实施例可实施于软件中或硬件中。实施可使用具有储存于其上的电气可读控制信号的例如软盘、DVD、CD、ROM、PROM、EPROM、EEPROM或快闪(FLASH)内存的数字储存媒体来实施,数字储存媒体与可规划计算机系统相协作(或能够协作)以便各个方法予以执行。
根据发明,一些实施例包含具有电气可读控制信号的数据载体,数据载体能够与可规划计算机系统相协作,以便在此所描述之方法之一予以执行。大体上,本发明的实施例可作为具有程序代码的计算机程序产品而予以实施,当计算机产品执行于计算机上时计算机码可操作地用于执行方法之一。程序代码可例如储存于机械可读载体中。其它实施例包含用于执行在此所描述之方法之一且储存于机械可读载体上的计算机程序。换句话说,说明性之方法的实施例从而是具有一计算机程序码之用于在计算机程序执行于计算机上时执行在此所描述之方法之一的计算机程序。从而说明性方法的又一实施例是包含储存于其上之用于执行在此所描述之方法之一的计算机程序的数据载体(或数字储存媒体或计算机可读媒体)。从而说明性方法的又一实施例是表示用于执行在此所描述之方法之一的计算机程序的数据流或序列信号。配置数据流或序列信号可例如以经由数据通讯连接(例如经由因特网)予以传输。又一实施例包含被配置以或适于执行在此所描述之方法的例如计算机或可规划逻辑装置的处理装置。又一实施例包含具有安装于其上之用于执行在此所描述之方法之一的计算机程序的计算机。在一些实施例中,可规划逻辑装置(例如场可规划门阵列)可用以执行在此所描述之方法的一些或所有功能。在一些实施例中,场可规划门阵列可与微处理器相协作以执行在此所描述之方法之一。大体上,方法优选地藉由任何硬件装置来执行。
上面所描述的实施例仅是对本发明之原理的说明。应理解的是在此所描述之安排及细节的修改及变化对于在该技艺中具有通常知识者是清楚的。因而,其仅打算由随后的申请专利范围的范围来限制而不打算由在此实施例之描述及解释所呈现的特定细节来限制。

Claims (12)

1.一种音频信号合成器,所述音频信号合成器用于产生具有第一频带(201)及源于所述第一频带(201)的第二合成频带(202)的合成音频信号(145),所述音频信号合成器包含:
补丁生成器(110),所述补丁生成器(110)用于执行至少两个不同的修补算法,其中每一修补算法使用具有所述第一频带(201)中的信号分量的音频信号(105)产生具有所述第二合成频带(202)中的信号分量的原始信号(115),且其中所述补丁生成器(110)适于响应于对于第一时间部分的控制信息(112)选择所述至少两个不同修补算法中的一个,且响应于对于不同于所述第一时间部分的第二时间部分的所述控制信息(112)选择所述至少两个不同修补算法的另一个,以获得频谱域外的对于所述第一和所述第二时间部分的所述原始信号(115);
频谱转换器(120),所述频谱转换器(120)用于将频谱域外的对于所述第一和所述第二时间部分的所述原始信号(115)转换至频谱域以获得对于所述第一和所述第二时间部分的原始信号频谱表示(125);
原始信号处理器(130),所述原始信号处理器(130)用于响应频谱域频谱带复制参数(132)处理对于所述第一和所述第二时间部分的原始信号频谱表示,以获得对于所述第一和所述第二时间部分的已调整的原始信号频谱表示(135);以及
组合器(140),所述组合器(140)用于将具有所述第一频带(201)中的信号分量的所述音频信号(105)或源于所述音频信号(105)的信号与所述已调整的原始信号频谱表示(135)或与源于所述已调整的原始信号频谱表示(135)的另一信号相组合,以获得所述合成音频信号(145)。
2.如权利要求1所述的音频信号合成器,其中,所述至少两个修补算法在下列方面彼此不同:在所述第一频带(201)中的频率下所述音频信号(105)的信号分量被修补为所述第二合成频带(202)中的目标频率,且对于所述至少两个不同的修补算法,所述目标频率不同。
3.如权利要求1所述的音频信号合成器,其中所述补丁生成器(110)适于对于两个修补算法均在时域中操作,或其中所述补丁生成器包含用于将时域信号转换为频谱表示的转换器、用于将所述频谱表示中的信号转换至时域的转换器、及时域输出接口,其中所述补丁生成器适于对于至少一个修补算法在所述频谱域中操作。
4.如权利要求1所述的音频信号合成器,其中所述补丁生成器(110)适于产生所述原始信号(115),以便所述原始信号(115)包括所述第一频带(201)中的另一些信号分量,且所述另一些信号分量具有大于输入至所述补丁生成器(110)的所述音频信号(105)的取样率的取样率,且其中所述频谱转换器适于将所述第二合成频带(202)中的信号分量及所述第一频带(201)中的另一些信号分量转换为所述原始信号频谱表示(125)。
5.如权利要求4所述的音频信号合成器,进一步包括另一个频谱转换器(370)及另一个组合器(124),所述另一个频谱转换器(370)适于将具有所述第一频带(201)中的信号分量的所述音频信号(105)转换为另一个原始信号频谱表示(123),且所述另一个组合器(124)适于将所述原始信号频谱表示(125)与所述另一个原始信号频谱表示(123)组合以获得组合的原始信号频谱表示(126),且其中所述原始信号处理器(130)适于处理所述组合的原始信号频谱表示。
6.如权利要求5所述的音频信号合成器,其中所述组合器(140)适于使用所述另一个原始信号频谱表示(123)作为源于所述音频信号(105)的信号。
7.如权利要求1所述的音频信号合成器,其中所述音频信号(105)及所述控制信息(112)被编码至数据流中,进一步包括解格式器,所述解格式器被配置为从所述数据流获得所述控制信息(112)。
8.如权利要求1所述的音频信号合成器,其中所述音频信号及所述频谱带复制参数(132)被编码至数据流中,且其中所述原始信号处理器(130)适于从所述数据流获得所述频谱带复制参数(132)。
9.一种音频信号编码器,所述音频信号编码器用于从音频信号(305)产生数据流(345),所述数据流(345)包括在第一频带(201)中的所述音频信号(305)的分量、控制信息(112)及频谱带复制参数(132),所述音频信号编码器包括:
频率选择滤波器(310),所述频率选择滤波器(310)用于产生所述第一频带(201)中的所述音频信号(305)的分量;
生成器,所述生成器用于从在第二频带(202)中的所述音频信号(305)的分量产生所述频谱带复制参数(132);
控制信息生成器(340),所述控制信息生成器(340)用于产生所述控制信息(112),所述控制信息(112)从第一修补算法和不同的第二修补算法中识别优选的修补算法,其中每一个修补算法使用所述第一频带(201)中的所述音频信号(305)的分量产生具有所述第二频带(202)中的信号分量的原始信号(115),
其中所述控制信息生成器(340)适于通过将所述音频信号(305)与已修补的音频信号(347)进行比较,以对于所述第一修补算法及所述第二修补算法识别优选的修补算法,其中通过响应于频谱带复制参数(132)利用频谱带复制工具(346)施加原始信号调整,从涉及所述第一修补算法及第二修补算法的不同原始信号(344)得出不同的已修补的音频信号(347)。
10.如权利要求9所述的音频信号编码器,进一步包括用于分析(307)所述音频信号(305)以提供所述音频信号特性的装置,所述用于分析(307)的装置适于确定所述音频信号305内瞬时的或脉冲群或非脉冲群段的数量及强度。
11.一种用于产生具有第一频带及源于所述第一频带的第二复制频带的合成音频信号的方法,包含以下步骤:
执行至少两个不同的修补算法,其中每一个修补算法使用具有所述第一频带(201)中的信号分量的音频信号(105)以产生具有所述第二复制频带(202)中的信号分量的原始信号(115),且其中执行所述修补以响应于对于第一时间部分的控制信息(112)选定所述至少两个不同修补算法中的一个,且响应于对于不同于所述第一时间部分的第二时间部分的所述控制信息(112)选定所述至少两个不同修补算法中的另一个,以获得频谱域外的对于所述第一时间部分及所述第二时间部分的所述原始信号(115);
将频谱域外的对于第一和第二时间部分的所述原始信号(115)转换至频谱域以获得对于第一和第二时间部分的原始信号频谱表示(125);
响应于频谱域频谱带复制参数(132)处理对于所述第一和第二时间部分的所述原始信号频谱表示(125)以获得对于所述第一和所述第二时间部分的已调整的原始信号频谱表示(135);以及
将具有所述第一频带(201)中的信号分量的所述音频信号(105)或源于所述音频信号(105)的信号与所述已调整的原始信号频谱表示(135)或与源于所述已调整的原始信号频谱表示(135)的另一信号相组合,以获得所述合成音频信号。
12.一种用于从音频信号(305)产生数据流的方法,所述数据流包括第一频带(201)中的音频信号的分量、控制信息及频谱带复制参数,所述方法包含以下步骤:
频率选择过滤所述音频信号(305)以产生所述第一频带(201)中的所述音频信号(305)的分量;
从第二频带(202)中的所述音频信号(305)的分量产生所述频谱带复制参数(132);
产生从第一修补算法和不同的第二修补算法识别优选修补算法的所述控制信息(112),其中每一个修补算法使用所述第一频带(201)中的所述音频信号(305)的分量以产生具有所述第二频带(202)中的信号分量的原始信号(115),
其中,通过将所述音频信号(305)与已修补的音频信号(347)进行比较,以对于所述第一修补算法及所述第二修补算法识别优选的修补算法,其中通过响应于频谱带复制参数(132)利用频谱带复制工具(346)施加原始信号调整,从涉及所述第一修补算法及第二修补算法的不同的原始信号(344)导出不同地修补的音频信号(347)。
CN2009801270950A 2008-07-11 2009-06-19 音频信号合成器及音频信号编码器 Active CN102089816B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US7983908P 2008-07-11 2008-07-11
US61/079,839 2008-07-11
US10382008P 2008-10-08 2008-10-08
US61/103,820 2008-10-08
PCT/EP2009/004451 WO2010003539A1 (en) 2008-07-11 2009-06-19 Audio signal synthesizer and audio signal encoder

Publications (2)

Publication Number Publication Date
CN102089816A CN102089816A (zh) 2011-06-08
CN102089816B true CN102089816B (zh) 2013-01-30

Family

ID=41120013

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009801270950A Active CN102089816B (zh) 2008-07-11 2009-06-19 音频信号合成器及音频信号编码器

Country Status (16)

Country Link
US (3) US8731948B2 (zh)
EP (1) EP2301026B1 (zh)
JP (1) JP5244971B2 (zh)
KR (1) KR101223835B1 (zh)
CN (1) CN102089816B (zh)
AR (1) AR072864A1 (zh)
AU (1) AU2009267525B2 (zh)
BR (1) BRPI0910792B1 (zh)
CA (1) CA2730198C (zh)
CO (1) CO6341675A2 (zh)
ES (1) ES2796552T3 (zh)
MX (1) MX2011000372A (zh)
RU (1) RU2491658C2 (zh)
TW (1) TWI441162B (zh)
WO (1) WO2010003539A1 (zh)
ZA (1) ZA201009208B (zh)

Families Citing this family (47)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
PL2346030T3 (pl) * 2008-07-11 2015-03-31 Fraunhofer Ges Forschung Koder audio, sposób kodowania sygnału audio oraz program komputerowy
BRPI0910792B1 (pt) 2008-07-11 2020-03-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. "sintetizador de sinal de áudio e codificador de sinal de áudio"
PL4053838T3 (pl) * 2008-12-15 2023-11-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Dekoder powiększania szerokości pasma audio, powiązany sposób oraz program komputerowy
RU2452044C1 (ru) 2009-04-02 2012-05-27 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Устройство, способ и носитель с программным кодом для генерирования представления сигнала с расширенным диапазоном частот на основе представления входного сигнала с использованием сочетания гармонического расширения диапазона частот и негармонического расширения диапазона частот
EP2239732A1 (en) 2009-04-09 2010-10-13 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Apparatus and method for generating a synthesis audio signal and for encoding an audio signal
CO6440537A2 (es) * 2009-04-09 2012-05-15 Fraunhofer Ges Forschung Aparato y metodo para generar una señal de audio de sintesis y para codificar una señal de audio
CN101566940B (zh) * 2009-05-25 2012-02-29 中兴通讯股份有限公司 实现无线数据终端通用串行总线音频传输的方法及装置
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
US9838784B2 (en) 2009-12-02 2017-12-05 Knowles Electronics, Llc Directional audio capture
EP2362376A3 (en) * 2010-02-26 2011-11-02 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Apparatus and method for modifying an audio signal using envelope shaping
JP5671823B2 (ja) * 2010-03-24 2015-02-18 株式会社Jvcケンウッド 高調波生成方法、高調波生成装置、及び、プログラム
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
PT2559029T (pt) * 2010-04-13 2019-05-23 Fraunhofer Gesellschaft Zur Foerderung Der Angewandten Wss E V Método e codificador e descodificador para reprodução sem lacunas de um sinal de áudio
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
US8798290B1 (en) 2010-04-21 2014-08-05 Audience, Inc. Systems and methods for adaptive signal equalization
US9558755B1 (en) 2010-05-20 2017-01-31 Knowles Electronics, Llc Noise suppression assisted automatic speech recognition
JP6075743B2 (ja) 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
RU2562384C2 (ru) 2010-10-06 2015-09-10 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Способ и устройство для обработки аудио сигнала и для обеспечения большей детализации во времени для комбинированного унифицированного кодека речи и аудио (usac)
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
CN103548077B (zh) 2011-05-19 2016-02-10 杜比实验室特许公司 参数化音频编译码方案的取证检测
DK2822262T3 (da) * 2011-08-17 2019-05-20 Ericsson Telefon Ab L M Mekanisme til dynamisk signalering af koderegenskaber
EP2777042B1 (en) * 2011-11-11 2019-08-14 Dolby International AB Upsampling using oversampled sbr
US9380320B2 (en) * 2012-02-10 2016-06-28 Broadcom Corporation Frequency domain sample adaptive offset (SAO)
US9212946B2 (en) * 2012-06-08 2015-12-15 General Electric Company Campbell diagram displays and methods and systems for implementing same
KR101920029B1 (ko) * 2012-08-03 2018-11-19 삼성전자주식회사 모바일 장치 및 제어방법
ES2549953T3 (es) * 2012-08-27 2015-11-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato y método para la reproducción de una señal de audio, aparato y método para la generación de una señal de audio codificada, programa de ordenador y señal de audio codificada
SG10201608613QA (en) * 2013-01-29 2016-12-29 Fraunhofer Ges Forschung Decoder For Generating A Frequency Enhanced Audio Signal, Method Of Decoding, Encoder For Generating An Encoded Signal And Method Of Encoding Using Compact Selection Side Information
US9060223B2 (en) * 2013-03-07 2015-06-16 Aphex, Llc Method and circuitry for processing audio signals
US9570083B2 (en) 2013-04-05 2017-02-14 Dolby International Ab Stereo audio encoder and decoder
MX343673B (es) 2013-04-05 2016-11-16 Dolby Int Ab Codificador y decodificador de audio.
EP2830063A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and computer program for decoding an encoded audio signal
EP2830047A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for low delay object metadata coding
JP6531649B2 (ja) 2013-09-19 2019-06-19 ソニー株式会社 符号化装置および方法、復号化装置および方法、並びにプログラム
RU2764260C2 (ru) 2013-12-27 2022-01-14 Сони Корпорейшн Устройство и способ декодирования
US20150350784A1 (en) * 2014-04-03 2015-12-03 Uma Satish Doshi Music adaptive speaker system and method
EP2963648A1 (en) * 2014-07-01 2016-01-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio processor and method for processing an audio signal using vertical phase correction
CN104143335B (zh) 2014-07-28 2017-02-01 华为技术有限公司 音频编码方法及相关装置
EP2980792A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating an enhanced signal using independent noise-filling
WO2016040885A1 (en) 2014-09-12 2016-03-17 Audience, Inc. Systems and methods for restoration of speech components
CN107210824A (zh) 2015-01-30 2017-09-26 美商楼氏电子有限公司 麦克风的环境切换
CN112002337A (zh) * 2015-03-03 2020-11-27 杜比实验室特许公司 用于对音频信号进行处理的方法、装置和设备
TWI693595B (zh) * 2015-03-13 2020-05-11 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
TWI693594B (zh) 2015-03-13 2020-05-11 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
JP6611042B2 (ja) * 2015-12-02 2019-11-27 パナソニックIpマネジメント株式会社 音声信号復号装置及び音声信号復号方法
AU2019258524B2 (en) 2018-04-25 2024-03-28 Dolby International Ab Integration of high frequency audio reconstruction techniques
CN114242089A (zh) 2018-04-25 2022-03-25 杜比国际公司 具有减少后处理延迟的高频重建技术的集成
GB202203733D0 (en) * 2022-03-17 2022-05-04 Samsung Electronics Co Ltd Patched multi-condition training for robust speech recognition

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1430777A (zh) * 2000-05-23 2003-07-16 编码技术瑞典股份公司 子带域中改进的频谱平移/折叠
CN1571993A (zh) * 2001-11-29 2005-01-26 编码技术股份公司 用于改善高频重建的方法

Family Cites Families (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
US5898605A (en) * 1997-07-17 1999-04-27 Smarandoiu; George Apparatus and method for simplified analog signal record and playback
US6782360B1 (en) * 1999-09-22 2004-08-24 Mindspeed Technologies, Inc. Gain quantization for a CELP speech coder
US6978236B1 (en) * 1999-10-01 2005-12-20 Coding Technologies Ab Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching
US7742927B2 (en) * 2000-04-18 2010-06-22 France Telecom Spectral enhancing method and device
SE0004818D0 (sv) * 2000-12-22 2000-12-22 Coding Technologies Sweden Ab Enhancing source coding systems by adaptive transposition
JP3864098B2 (ja) 2002-02-08 2006-12-27 日本電信電話株式会社 動画像符号化方法、動画像復号方法、及びこれらの方法の実行プログラムとこれらの実行プログラムを記録した記録媒体
JP2005533271A (ja) * 2002-07-16 2005-11-04 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオ符号化
ES2297083T3 (es) * 2002-09-04 2008-05-01 Microsoft Corporation Codificacion entropica por adaptacion de la codificacion entre modos por longitud de ejecucion y por nivel.
DE10252327A1 (de) 2002-11-11 2004-05-27 Siemens Ag Verfahren zur Erweiterung der Bandbreite eines schmalbandig gefilterten Sprachsignals, insbesondere eines von einem Telekommunikationsgerät gesendeten Sprachsignals
US20040138876A1 (en) * 2003-01-10 2004-07-15 Nokia Corporation Method and apparatus for artificial bandwidth expansion in speech processing
KR100917464B1 (ko) * 2003-03-07 2009-09-14 삼성전자주식회사 대역 확장 기법을 이용한 디지털 데이터의 부호화 방법,그 장치, 복호화 방법 및 그 장치
US7460990B2 (en) * 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
JP4241417B2 (ja) 2004-02-04 2009-03-18 日本ビクター株式会社 算術復号化装置、および算術復号化プログラム
RU2381571C2 (ru) 2004-03-12 2010-02-10 Нокиа Корпорейшн Синтезирование монофонического звукового сигнала на основе кодированного многоканального звукового сигнала
FI119533B (fi) * 2004-04-15 2008-12-15 Nokia Corp Audiosignaalien koodaus
EP1686564B1 (en) * 2005-01-31 2009-04-15 Harman Becker Automotive Systems GmbH Bandwidth extension of bandlimited acoustic signals
JP4438663B2 (ja) 2005-03-28 2010-03-24 日本ビクター株式会社 算術符号化装置及び算術符号化方法
KR100713366B1 (ko) * 2005-07-11 2007-05-04 삼성전자주식회사 모폴로지를 이용한 오디오 신호의 피치 정보 추출 방법 및그 장치
US7539612B2 (en) * 2005-07-15 2009-05-26 Microsoft Corporation Coding and decoding scale factor information
JP4211780B2 (ja) 2005-12-27 2009-01-21 三菱電機株式会社 デジタル信号符号化装置、デジタル信号復号装置、デジタル信号算術符号化方法、およびデジタル信号算術復号方法
US7953604B2 (en) * 2006-01-20 2011-05-31 Microsoft Corporation Shape and scale parameters for extended-band frequency coding
JP2007300455A (ja) 2006-05-01 2007-11-15 Victor Co Of Japan Ltd 算術符号化装置、および算術符号化装置におけるコンテキストテーブル初期化方法
US8010352B2 (en) * 2006-06-21 2011-08-30 Samsung Electronics Co., Ltd. Method and apparatus for adaptively encoding and decoding high frequency band
JP2008098751A (ja) 2006-10-06 2008-04-24 Matsushita Electric Ind Co Ltd 算術符号化装置及び算術復号化装置
US7912729B2 (en) * 2007-02-23 2011-03-22 Qnx Software Systems Co. High-frequency bandwidth extension in the time domain
US8015368B2 (en) * 2007-04-20 2011-09-06 Siport, Inc. Processor extensions for accelerating spectral band replication
BRPI0910792B1 (pt) 2008-07-11 2020-03-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. "sintetizador de sinal de áudio e codificador de sinal de áudio"
EP4224471A3 (en) 2008-07-11 2023-09-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and audio decoder

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1430777A (zh) * 2000-05-23 2003-07-16 编码技术瑞典股份公司 子带域中改进的频谱平移/折叠
CN1571993A (zh) * 2001-11-29 2005-01-26 编码技术股份公司 用于改善高频重建的方法

Also Published As

Publication number Publication date
EP2301026B1 (en) 2020-03-04
CN102089816A (zh) 2011-06-08
KR20110040817A (ko) 2011-04-20
CA2730198A1 (en) 2010-01-14
US10522168B2 (en) 2019-12-31
BRPI0910792A2 (pt) 2015-10-06
AR072864A1 (es) 2010-09-29
AU2009267525B2 (en) 2012-12-20
US10014000B2 (en) 2018-07-03
RU2011101616A (ru) 2012-07-27
WO2010003539A1 (en) 2010-01-14
AU2009267525A1 (en) 2010-01-14
MX2011000372A (es) 2011-05-19
JP5244971B2 (ja) 2013-07-24
EP2301026A1 (en) 2011-03-30
BRPI0910792B1 (pt) 2020-03-24
US20180350387A1 (en) 2018-12-06
US8731948B2 (en) 2014-05-20
TW201009807A (en) 2010-03-01
US20110173006A1 (en) 2011-07-14
CO6341675A2 (es) 2011-11-21
US20140222434A1 (en) 2014-08-07
ES2796552T3 (es) 2020-11-27
RU2491658C2 (ru) 2013-08-27
ZA201009208B (en) 2011-10-26
TWI441162B (zh) 2014-06-11
KR101223835B1 (ko) 2013-01-17
JP2011527447A (ja) 2011-10-27
CA2730198C (en) 2014-09-16

Similar Documents

Publication Publication Date Title
CN102089816B (zh) 音频信号合成器及音频信号编码器
RU2501097C2 (ru) Устройство и способ формирования синтезированного аудиосигнала и кодирования аудиосигнала
CN101933087B (zh) 用于音频信号带宽扩展的设备和方法
CN104221081B (zh) 带宽扩展音频信号的高频带扩展的生成
JP6992024B2 (ja) 独立したノイズ充填を用いた強化された信号を生成するための装置および方法
JP7297368B2 (ja) 周波数帯域拡張方法、装置、電子デバイスおよびコンピュータプログラム
JP2015092254A (ja) 帯域幅拡張のためのスペクトル平坦性制御
CN102592598B (zh) 用于恢复多通道音频信号的设备和方法
TW201419269A (zh) 用以再現音訊信號之裝置及方法、用以產生編碼音訊信號之裝置及方法、電腦程式、與編碼音訊信號
JP2012512437A (ja) オーディオエンコーダおよび帯域幅拡張デコーダ
KR102208915B1 (ko) 음성 복호 장치, 음성 부호화 장치, 음성 복호 방법, 음성 부호화 방법, 음성 복호 프로그램, 및 음성 부호화 프로그램
CN105280190A (zh) 带宽扩展编码和解码方法以及装置
CN102947882A (zh) 使用制导带宽扩展和盲带宽扩展生成宽带信号的装置、方法和计算机程序
MX2014010098A (es) Control de coherencia de fase para señales armonicas en codecs de audio perceptual.
Bhatt et al. A novel approach for artificial bandwidth extension of speech signals by LPC technique over proposed GSM FR NB coder using high band feature extraction and various extension of excitation methods
JP2004053940A (ja) オーディオ復号化装置およびオーディオ復号化方法
CN105261373B (zh) 用于带宽扩展编码的自适应栅格构造方法和装置
CN111210831A (zh) 基于频谱拉伸的带宽扩展音频编解码方法及装置
Chiang et al. Advances in Low Bit-Rate Audio Coding: A Digest of Selected Papers from Recent AES Conventions

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant