CN101336449B - 用于音频信号编码的方法和装置 - Google Patents

用于音频信号编码的方法和装置 Download PDF

Info

Publication number
CN101336449B
CN101336449B CN2006800521407A CN200680052140A CN101336449B CN 101336449 B CN101336449 B CN 101336449B CN 2006800521407 A CN2006800521407 A CN 2006800521407A CN 200680052140 A CN200680052140 A CN 200680052140A CN 101336449 B CN101336449 B CN 101336449B
Authority
CN
China
Prior art keywords
signal
audio
excitation
pumping signal
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2006800521407A
Other languages
English (en)
Other versions
CN101336449A (zh
Inventor
B·盖瑟
P·贾克斯
S·尚德尔
H·塔戴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Siemens AG
Unify GmbH and Co KG
Original Assignee
Siemens Enterprise Communications GmbH and Co KG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens Enterprise Communications GmbH and Co KG filed Critical Siemens Enterprise Communications GmbH and Co KG
Publication of CN101336449A publication Critical patent/CN101336449A/zh
Application granted granted Critical
Publication of CN101336449B publication Critical patent/CN101336449B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks

Abstract

作为激励采样系列形成激励信号(EXC)用以激励音频综合滤波器(ASYN)。在此将已形成的激励采样值时间上连续地存储在自适应码本(ACB)中。根据本发明设置连续生成随机采样值的噪声发生器(NOISE)。借助所输送的音频基频参数(PITCH)从自适应码本(ACB)中选择所存储的激励采样值的序列(EXC_P),其中通过所述音频基频参数(PITCH)预先规定要选择的序列(EXC_P)至当前时间基准的时间间隔。通过将所选择的序列(EXC_P)与包括噪声发生器的当前随机采样值的随机序列(EXC_N)相混合来形成激励信号(EXC)。

Description

用于音频信号编码的方法和装置
技术领域
本发明涉及用于音频信号编码的方法和装置。本发明尤其是涉及用于形成激励信号用以激励音频综合滤波器的方法和激励信号发生器,以及音频信号编码器和音频信号解码器。
背景技术
在许多现代通信系统中和尤其是在移动通信系统中,只有有限的传输带宽可供实时音频传输(例如语音或音乐传输)使用。为了通过具有有限带宽的传输线段、例如经由无线电网络以实时的方式传输尽可能多的音频或语音信号,因此常常规定,通过有实时或准实时能力的音频编码方法来压缩要传输的音频信号。
在这样的音频编码方法中,通常谋求尽可能减少要传输的数据量和因此减小传输速率,而不过于损害主观听觉印象或在语音传输时不过于损害清晰度。
音频信号的有效压缩也在音频信号的存储或存档方面是主要观点。
通过优化滤波器参数使要传输的音频信号逐时帧地与由音频综合滤波器所综合的音频信号相适应的编码方法证明为特别有效的。这样的处理方式常常也称为综合分析(Analysis-by-Synthesis)。在此,由优选同样要优化的激励信号来激励音频综合滤波器。滤波常常也称为共振峰综合(Formant-Synthese)。例如可以将所谓的LPC系数(LPC:线性预测编码(Linear Predictive Coding))和/或详细说明音频信号的频谱和/或时间包络的参数用作滤波器参数。于是逐时帧地向接收机传输所优化的滤波器参数以及详细说明激励信号的参数,以便在那里借助在接收机侧所设置的音频综合滤波器来形成综合音频信号,该综合音频信号在主观的听觉印象方面尽可能相似于初始的音频信号。
根据ITU-T建议G.729已知这种音频编码方法。借助在那里所说明的音频编码方法,可以将具有4kHz带宽的实时音频信号降低为8kbit/s的传输速率。根据G.729建议,借助所谓的自适应码本与所谓的固定码本共同作用来生成激励信号。在固定码本中,固定地存储有可借助码本索引调用的多个预定的激励信号序列。与此相反,在自适应码本中,存储有已经生成的激励信号序列。通过将来自自适应码本的序列与来自固定码本的序列相混合来生成激励信号的相应序列。为了优化激励信号,对于每一个时帧,在固定码本以及自适应码本中搜索允许使综合音频信号尽可能良好地与要传输的音频信号相适应的激励信号序列。最后将对来自固定码本和自适应码本的认为为最佳的序列的访问信息作为详细说明激励信号的参数向接收机传输。在接收机处使用这些参数用以借助接收机的固定码本和自适应码本来重构激励信号。
根据G.729建议对于每一时帧以实时方式要实施的对两个码本的搜索却引起要求昂贵处理器的巨大计算耗费。
除此之外,当前谋求用较高的带宽来综合要传输的音频信号用于改善听觉印象。在G.729建议的当今所讨论的扩展G.729EV中,尝试将音频带宽从4kHz扩展到8kHz。
可以如下来获得所综合的音频信号的这种带宽扩展,即由例如具有4kHz带宽的窄带激励信号来构建较高带宽(例如8kHz带宽)的适当激励信号,以便宽带地激励音频综合滤波器。在此方面探讨用于形成这种宽带激励信号的当今不同的处理方式。对此,通过在时域中对窄带激励信号乘方或通过移动或镜像窄带激励信号的频谱而产生扩展频带来生成宽带激励信号。但是通过所述的处理方式使激励信号的频谱非谐波地失真和/或在频谱中引起显著可听到的相位误差。
发明内容
本发明的任务是说明一种用于形成音频综合滤波器的激励信号的方法,该方法在音频信号传输时允许进一步减小传输速率和/或改善听觉印象以及减少用于音频编码所需要的计算耗费。此外,本发明的任务是说明一种用于执行本方法的激励信号发生器、以及音频信号编码器和音频信号解码器。
根据本发明的用于作为激励采样值系列形成激励信号用以激励音频综合滤波器的激励信号发生器,具有:a)用于时间上连续地存储已形成的激励采样值的自适应码本,b)用于连续生成随机采样值的噪声发生器,c)选择设备,用于输送音频基频参数以及用于根据预先规定要选择的序列至当前时间基准的时间间隔的音频基频参数来选择所存储的激励采样值的序列,d)内插器,其被构造使得:如果所述音频基频参数预先规定时间间隔,其中该时间间隔不是单独要生成的窄带激励信号的预先规定的采样间隔的整数倍,则根据音频基频参数将中间采样值插入到激励采样值之间和/或随机采样值之间,使得采样值的采样间隔小于窄带激励信号的采样间隔,由此激励信号相对于窄带激励信号具有扩展频带的附加的频率成分,以及e)与噪声发生器和自适应码本相耦合的混合设备,用于将所选择的序列与包括噪声发生器的当前随机采样值的随机序列相混合和用于输出由此所形成的激励信号。本发明还提供一种音频信号编码器,具有所述的激励信号发生器、由激励信号发生器要激励的音频综合滤波器、以及用于使由所激励的音频综合滤波器生成的综合音频信号与要传输的音频信号相适应的比较设备。替代地,本发明的音频信号解码器具有所述的激励信号发生器、和由激励信号发生器要激励的用于生成综合音频信号的音频综合滤波器。
在下文说明本发明的有利实施形式和改进方案。
在用于形成激励信号用以激励音频综合滤波器的本发明方法中,将激励信号形成为激励采样值系列。在此,将已经形成的激励采样值时间上连续地存储在自适应码本中。此外还设置噪声发生器,其中由所述噪声发生器连续生成随机采样值。借助所输送的音频基频参数,从自适应码本中选择所存储的激励采样值的序列,其中由所述音频基频参数预先规定要选择的序列至当前时间基准的时间间隔,如果所述音频基频参数预先规定时间间隔,其中该时间间隔不是单独要生成的窄带激励信号的预先规定的采样间隔的整数倍,则根据音频基频参数将中间采样值插入到激励采样值之间和/或随机采样值之间,使得采样值的采样间隔小于窄带激励信号的采样间隔,由此激励信号相对于窄带激励信号具有扩展频带的附加的频率成分。通过将所选择的序列与包括噪声发生器的当前随机采样值的随机序列相混合来形成激励信号。
通过将噪声发生器用作随机采样值的源,可以舍弃用于充填自适应码本的固定码本。与此对应地,不需要提供或传输用于选择预先规定的在固定码本中所存储的采样值序列的码本索引。由于在公知方法中固定码本用的这种码本索引占据要传输的音频数据的很大部分,所以通常可以通过本发明显著减小传输速率。相应地可以将所节省的传输带宽用于另外的目的或用于提高传输质量。
通过优选生成基本上白色的频谱平缓的噪声的噪声发生器,与借助仅含有固定预先规定的采样值序列的固定码本相比,通常可以更好地模拟在音频信号或语音信号中所含有的噪声分量。而通过与音频基频参数有关地从自适应码本中选择采样值序列可以良好地模拟音频或语音信号的谐波微观结构。
由于当然可以良好地将噪声发生器标定到不同的频段,所以可以以微小的耗费来实现带宽扩展。通过本发明还可以避免,在带宽扩展时编码剩余误差被传输到扩展频带中。
在对音频信号编码和解码时都可以有利地采用本发明。在音频信号编码器的情况下,可以通过本发明的激励信号发生器来激励音频综合滤波器,将该音频综合滤波器的输出音频信号与要传输的音频信号的相应的当前帧相比较。优选地为了不同地选择存储在自适应码本中的以前的激励采样值序列,执行当前帧的比较。通过相应的音频基频参数可以表达所述比较表明了最佳一致性的该采样值序列在自适应码本之内的时间位置,其中所述音频基频参数于是可以被传输给接收机。不需要对其它固定码本搜索以及附加地传输码本索引。
在音频信号解码器中,可以通过分别所接收的音频基频参数如此来控制本发明的激励信号发生器,使得本发明的激励信号发生器生成在谐波上对应于音频基频参数的激励信号,而不依赖于要附加传输的码本索引。通过如此所生成的激励信号可以激励音频综合滤波器,以便生成综合音频信号,该综合音频信号在听觉印象方面很相似于原始的音频信号。
因此在音频信号编码器的情况下必要的计算耗费和必要的传输速率都减少。在保持相同的传输速率时,通常可以相应地达到较高的传输质量和因此达到改善了的听觉印象。
在音频信号编码器和/或音频信号解码器情况下的音频综合滤波器例如可以作为LPC滤波器、Wiener FIR滤波器、作为用于形成音频信号的时间或频谱包络的滤波器、或作为这些滤波器的组合来实现。
本发明方法可以优选地通过信号处理器来实施。
按照本发明的有利实施形式,可以逐时帧地处理激励采样值和/或随机采样值,其中,所选择的序列的长度和/或随机序列的长度对应于时帧的预先规定的长度。
根据本发明的有利改进方案,对于音频基频参数预先规定了不是单独要生成的窄带激励信号的预先规定的采样间隔的整数倍的时间间隔的情况,可以规定,根据音频基频参数将中间采样值插入到激励采样值之间和/或随机采样值之间。优选如此来实现该插入,使得合成的采样值的采样间隔小于窄带激励信号的采样间隔。以此方式可以生成激励信号,该激励信号相对于例如在0-4kHz频段中的窄带激励信号具有例如4-8kHz的扩展频带的附加的频率成分。不同于通过公知的带宽扩展方法所生成的激励信号,如此生成的激励信号没有主要的非谐波失真。
根据本发明的另一实施形式,在混合时,可以根据第一强度参数放大所选择的序列和/或根据第二强度参数放大随机序列。优选地可以逐时帧地从要传输的音频信号中推导出第一和第二强度参数、以及音频基频参数并传输。
此外还可以以相对于单独要生成的窄带激励信号较小的采样间隔来形成激励信号,由此所述激励信号相对于窄带激励信号具有扩展频带的附加的频率成分。在此情况下,可以从原本设置用于生成窄带激励信号的音频综合参数中推导出音频基频参数以及第一和/或第二强度参数。与此类似,可以从要传输的音频信号的窄带分量中推导出音频基频参数以及第一和/或第二强度参数。
因而可以从窄带音频参数中推导出音频基频参数以及第一和/或第二强度参数,但是可应用于扩展频带。就这方面来说这是有利的,因为为了激励信号的带宽扩展,除了为生成窄带激励信号所设置的音频综合参数之外,不需要附加的音频综合参数。通常可以由诸如根据G.729建议的已有的窄带音频编解码器来提供为生成窄带激励信号所设置的音频综合参数。
在诸如根据G.729建议的公知的窄带传输方法中,常常与按照窄带激励信号的采样间隔相比更准确地确定音频基频参数。常常设置例如一半或三分之一采样间隔的精度。因此可以将针对窄带激励信号所设置的音频基频参数通常直接或基本上不改变地用于生成带宽扩展的激励信号。
分别通过采用预先规定的函数从相应的窄带强度参数中可以推导出第一和/或第二强度参数,以便在音频信号的扩展频带中相对于谐波分量来强调噪声分量。
优选可以将激励信号的归于扩展频带的分量与单独所生成的窄带激励信号相组合,以便生成例如在0至8kHz频段中的宽带激励信号用于激励音频综合滤波器。
附图说明
以下借助附图来详细阐述本发明的实施例。
在此分别以示意图的方式:
图1示出以不同的采样速率所采样的音频信号,
图2a和2b示出本发明激励信号发生器的不同实施形式,
图3示出从自适应码本中对采样值序列的选择过程的图解,和
图4示出音频信号解码器。
具体实施方式
图1示出以不同的示范性采样速率所采样的音频信号。在此,将各个采样值表示为点,所述点具有由垂直线所表示的不同的幅度。由在采样值之间的不同时间采样间隔来表示不同的采样速率。两个分图具有共同的时间轴T。
上面的分图表示以例如8kHz的采样速率所采样的音频信号。8kHz的采样速率对应于1/8000s的采样间隔DT1。按照基础的采样定理,通过以8kHz的采样速率所采样的采样值,可以示出基本上直至4kHz频率的音频信号。该频段以下称为窄带的。
下面的分图表示以16kHz的采样速率所采样的音频信号。根据相对于上面的分图加倍的采样速率,在下面的分图中的采样间隔DT2为采样间隔DT1的一半,即这里为1/16000s。通过以16kHz的采样速率所采样的采样值,可以示出基本上直至8kHz频率的音频信号。上述频段以下也称为宽带的。不言而喻,概念“窄带的”和“宽带的”不局限于仅示范性提到的频段,而是在概念“宽带的”应比概念“窄带的”指定更大的频段的这一方面,可以概括为任意的频段。
图2a和2b以示意图的方式展示了本发明激励信号发生器的不同实施形式。所示出的激励信号发生器分别包括噪声发生器NOISE、自适应码本ACB以及混合设备MIX作为功能组件。随机发生器NOISE用于以分别预先规定的采样间隔在时间上连续地生成随机采样值。对于在图2a和2b中所示出的两个实施形式例如假设,相应的噪声发生器NOISE以窄带采样速率、也就是例如8kHz生成随机采样值。在此情况下,将随机采样值理解为由噪声发生器随机地或准随机地在时间上连续生成的和尤其是不是预先规定的或从预先规定的值中所选择的采样值。尤其是与借助相应的激励信号发生器要编码或要解码的音频信号无关地生成随机采样值。因此为了运行噪声发生器NOISE,不需要像在根据现有技术的固定码本中那样输送或传送特定的访问参数。在这种固定码本中存储有固定预先规定的确定性的采样序列,其中为了逐时帧地调用所述采样序列,应连续输送码本索引,这通常要求传输带宽的很大分量。
由随机采样值所形成的噪声信号优选地具有基本上白色的或平缓的频谱。
以下首先考察激励信号发生器的在图2a中所示出的实施形式。那里所示出的激励信号发生器一般可以被用于音频和/或语音编码。噪声发生器NOISE以及自适应码本ACB都逐时帧地、即作为预先规定长度的含有采样值的时帧序列输出采样值。例如5ms长的时帧在例如8kHz的采样速率时相应地含有40个采样值。在16kHz的采样速率时,这样的时帧相应地含有80个采样值。
当噪声发生器NOISE连续生成随机序列EXC_N、即具有随机采样值的时帧时,自适应码本ACB则连续输出所存储的激励采样值的序列、即时帧EXC_P。将随机序列EXC_N和由自适应码本ACB所输出的序列EXC_P输送给混合设备MIX,也将用于随机序列EXC_N的电平控制的强度参数G_N以及用于来自自适应码本ACB的序列EXC_P的电平控制的强度参数G_P逐时帧地输送给所述混合设备MIX。在混合设备MIX中,将相应的随机序列EXC_N的随机采样值用相应的强度参数G_N和将由自适应码本ACB所输出的相应序列EXC_P用相应的强度参数G_P逐时帧地相乘、即放大。在图2a中通过配备有乘符号的圆圈表示相乘。通过混合设备MIX将根据强度参数G_N和G_P所放大的采样值序列逐时帧地相加,并以一系列激励采样值的形式将合成的总和信号作为激励信号EXC来输出。在图2a中通过配备有加符号的圆圈表示相加。输出所形成的激励信号EXC,并且与此并行地在时间上连续地存储在自适应码本ACB中。因此在某种程度上,将激励信号EXC从混合设备MIX的输出端向自适应码本ACB反馈。
在激励信号EXC方面,自适应码本ACB类似于移位寄存器那样起作用,其中激励信号EXC的当前所形成的序列被存储到该移位寄存器中,并在此在维持时间顺序的情况下将激励信号的以前形成的序列按顺序向后推移。
通过逐时帧地输送给自适应码本ACB的音频基频参数PITCH来控制所存储的激励采样值的序列EXC_P的输出。借助音频基频参数PITCH,从所存储的激励采样值中选择要由自适应码本ACB输出的序列EXP。借助自适应码本ACB的选择设备SEL来实现该选择。这样的音频基频参数PITCH在技术领域中常常也称为“基音迟延(pitchlag)”。
以下假设,在8kHz的窄带采样速率的情况下分别以窄带采样间隔、这里例如以1/8000s为单位来预先规定音频基频参数PITCH。通过音频基频参数PITCH分别逐时帧地详细说明要传输的或要同步化的音频信号的基频的周期。在例如根据G.729建议的现代音频编码方法中,常常用比与相应所采用的采样间隔相对应的较高的分辨率测量或提供音频信号的基频周期。精确到采样间隔的一部分的这种音频基频参数,因此也可以以采样间隔为单位来接受非整数的值。这种非整数的音频基频参数PITCH含有关于比原本与采样间隔相对应的较高的频率分量的信息。在例如按照G.729建议的公知的音频编码器的情况下这种较高的频率分量被过滤,而在本发明音频信号发生器的情况下可以以简单的方式使用关于较高的频率分量的信息用于改善音频综合质量。
图3示出借助输送给选择设备SEL的音频基频参数PITCH从自适应码本ACB中对采样值序列EXC_P的选择。图3展示了时间上连续地存储在自适应码本ACB中的激励采样值的片断。通过配备有垂直线的点来表示所存储的激励采样值,其中相应线的长度表示激励采样值的相应幅度。通过时间轴T显示时间过程。
在图3中,通过垂直线表示当前的时间基准T0,该垂直线说明在自适应码本中的位置,其中在自适应码本ACB中在所述位置处新存储激励信号的相应当前所形成的时帧。在此情况下,在时间上或逻辑上邻接于激励信号的直接先前所存放的时帧来实现该存储。出于清楚的原因,图3中的时帧仅包括四个采样值。显然的是,由图3所表明的关系概括为具有任意预先规定长度的时帧。
从自适应码本ACB中选择所存储的激励采样值的该序列EXC_P用于输出,其中该序列EXC_P的开始距当前时间基准T0具有对应于音频基频参数PITCH的时间间隔并且该序列EXC_P的长度相当于时帧的预先规定的长度。在此,从当前的时间基准T0开始,在时间上倒退地计算该时间间隔。要指明的是,所选择的序列EXC_P的开始不必落在时帧界线上,而是必要时在预先规定的界限之内可以落在任意的所存储的激励采样值上。
在图3中示范性地假设,通过以当前时帧所传送的音频基频参数PITCH来详细说明六个采样间隔的时间间隔。因此作为所选择的序列EXC_P,输出从最后第六个所存储的激励采样值直至最后第三个所存储的激励采样值(从当前时间基准T0算起)的时帧。在图3中,通过虚线所示的矩形表示所输出的时帧EXC_P。
在接通本发明激励信号发生器时,自适应码本ACB首先是空的,以便然后逐渐用所输出的激励信号EXC的所形成的激励采样值来充填。由于自适应码本ACB在开始时是空的,所以首先只通过噪声发生器NOISE作为唯一的信号源来馈送激励信号EXC。这意味着,首先用非周期性的随机采样值来充填自适应码本ACB。在该情形中,提出了可以如何借助自适应码本ACB获得周期性的信号成分的问题,因为仅仅提供非周期性的噪声发生器NOISE作为原始的信号源。实际上按照迄今的介绍,认为有必要除了自适应码本之外也设置固定码本,以便用所确定的存储在固定码本中的信号序列来充填自适应码本ACB。
但是根据本发明人的研究,这样的固定码本是不必要的。实际上也可以在无固定码本的情况下通过连续适当地从自适应码本ACB中选择采样值序列EXC_P来生成具有谐波微观结构的激励信号。为了说明所基于的作用原理考察以下情况:音频基频参数PITCH经过多个时帧后保持恒定。在这种情况下,从自适应码本ACB中多次相继地读出相对于T0具有相同时隙的时帧,与噪声发生器NOISE的随机序列EXC_N相混合,并作为激励信号EXC的当前时帧重新存储在当前的码本ACB中。在此,以距以前所输出的序列EXC_P的、由音频基频参数PITCH详细说明的间隔来存储当前的时帧。以此方式,在自适应码本ACB中逐渐形成周期性的信号分量,其中通过音频基频参数PITCH来确定所示信号分量的周期。在此,通过强度参数G_N和G_P来控制在整个激励信号EXC上的周期性分量。
由于采用噪声发生器NOISE代替固定码本,可以取消固定码本的码本索引的传输。以此方式可以显著减小用于传输音频信号的传输速率或带宽。通过采用噪声发生器NOISE,还可以尤其是在再现非谐波的或噪声式的音频分量时达到较好的听觉印象。
以下借助图2b阐述用于生成带宽扩展的激励信号EXC的本发明激励信号发生器的实施形式。用扩展了带宽扩展因数N的带宽来生成所输出的激励信号EXC。也在图2a中所采用的参考符号在图2b中保留其含义。
示范性地假设,带宽扩展因数N具有值2,并在8kHz的窄带采样速率时,要输出的激励信号EXC的采样速率相应地为Nx8kHz=16kHz。
噪声发生器NOIS以8kHz的窄带采样速率输出随机采样值,而自适应码本ACB和混合设备MIX采用16kHz的宽带采样速率。为了将噪声发生器NOISE的窄带采样速率与混合设备MIX的宽带采样速率相匹配,将内插器INT_N接入该混合设备MIX和噪声发生器NOISE之间。内插器INT_N接收由噪声发生器NOISE以窄带采样速率所输出的随机采样值,并在所述随机采样值的分别两个之间设置具有幅度0的中间采样值。对于带宽扩展因数N的另外的值,与此类似地在分别两个随机采样值之间插入分别具有幅度0的N-1个中间采样值。以此方式,将噪声发生器NOISE的窄带白色噪声频谱转换成宽带白色频谱。
假设以窄带采样间隔为单位来输送音频基频参数PITCH。还假设,以所述单位直至至少正好到分数1/N准确地、即这里正好直至1/2提供音频基频参数PITCH。非整数的音频基频参数PITCH含有关于在窄带频段之外的频率分量的信息。常常也通过pitch=p+p_frac/N来表示这种非整数的音频基频参数PITCH,其中p和p_frac是整数参数,其中p_frac=0,...,N-1。由于自适应码本ACB采用相对于窄带采样间隔平分的或由N均分的采样间隔,将音频基频参数PITCH首先用N来乘。于是将合成的积PITCH x N=pxN+p_frac用于选择所存储的采样值序列EXC_P,如已经与图3有关地所阐述的那样。
通过在图2b中所示出的激励信号发生器,可以以简单的方式生成带宽扩展的激励信号EXC,其中通过利用音频基频参数PITCH的分数分量,在扩展频带中可以更好地模拟所述带宽扩展的激励信号EXC的谐波微观结构。尤其是可以将窄带频段中的激励信号的谐波微观结构一致地和耐久地延续到扩展频带中。
在图4中示意性示出用于接收要传输的音频信号的本发明音频信号解码器。音频信号解码器包括音频综合滤波器ASYN,该音频综合滤波器ASYN通过例如在0至8kHz频段中的宽带激励信号S_EXC来激励,并通过滤波来生成综合音频信号SAS。将详细说明了要传输的音频信号的频谱包络的频谱参数F_ENV、以及详细说明了音频信号的时间包络的时间过程参数T_ENV输送给音频综合滤波器ASYN。音频综合滤波器ASYN借助所输送的参数F_ENV和T_ENV来形成要综合的音频信号SAS的频谱和时间包络。由要传输的音频信号的发送机逐时帧地确定参数F_ENV和T_ENV和将其向接收机或音频信号解码器传输。
将宽带激励信号S_EXC的生成划分到不同的层中,即这里为0至4kHz的窄带频段的层,和这里为4至8kHz的扩展频带的层。音频信号解码器为了生成窄带激励信号N_EXC(这里在0至4kHz的频段中)具有窄带激励信号发生器NBC,为了生成频率扩展的激励信号E-EXC(这里在4至8kHz频段中)具有用于扩展频带的根据图2b的激励信号发生器EBC。可以像在图2a中所示出的本发明的激励信号发生器那样或像例如根据G.729建议的装备有自适应和固定码本的常规激励信号发生器那样来构造窄带激励信号发生器NBC。
分别将音频基频参数PITCH以及强度参数G_N和G_P逐时帧地输送给窄带激励信号发生器NBC。也可以代替强度参数G_N和G_P而输送总和参数G_S+G_N和比例参数G_S/G_N或该比例参数G_S/G_N的倒数。
像结合图2b已经阐述的那样,音频基频参数PITCH是非整数的,并由pitch=p+p_frac/N来给出。按照在0至8kHz的宽带频段和0至4kHz的窄带频段之间的带宽比例,带宽扩展因数N示范性地具有值N=2。窄带激励信号发生器NBC根据所输送的参数PITCH、G_S和G_N生成窄带激励信号N_EXC。
将由窄带激励信号发生器NBC所采用的参数PITCH、G_S和G_N输送给根据图2b所构造的激励信号发生器EBC。当在激励信号发生器EBC的混合设备MIX中使用强度参数G_N和G_P用于控制电平之前,必要时通过预先规定的函数转化所述强度参数G_N和G_P。像在图2b中所示出的那样,将所输送的音频基频参数PITCH用N相乘,这里N=2,以便从激励信号发生器EBC的自适应码本中选择所存储的激励信号序列。像已经结合图2b所阐述的那样,激励信号发生器EBC借助所输送的参数PITCH、G_S和G_N生成激励信号EXC,所述激励信号EXC首先仍具有0至8kHz的带宽。由于激励信号发生器EBC在所示的音频信号解码器的情况下应只负责扩展频带,因此将激励信号EXC输送给高通滤波器HP。该高通滤波器HP基本上只让4至8kHz的扩展频带的频率通过,并输出频率扩展的激励信号E_EXC。将频率扩展的激励信号E_EXC与窄带激励信号N_EXC相组合,如在图4中由加符号所示的那样,以便形成宽带激励信号S_EXC。最后将后者输送给音频综合滤波器ASYN。
在本发明的音频信号解码器中,只需要音频参数PITCH、G_S和G_N,用于生成带宽扩展的激励信号E_EXC和因此用于生成宽带激励信号S_EXC,其中所述音频参数PITCH、G_S和G_N本来被传输用于生成窄带激励信号或由窄带激励信号发生器提供。因此可以以有利的方式从要传输的音频信号的窄带频段中或从窄带编解码器的参数中推导出音频参数PITCH、G_S和G_N,以便然后应用于要添加的扩展频带。为了生成宽带激励信号S_EXC,相对于窄带激励信号N_EXC的生成,不必传输附加的音频参数。此外,通过在激励信号发生器EBC和/或NBC中舍弃固定码本可以取消码本索引的附加传输。通过参数F_ENV和T_ENV可以传输关于在扩展频带中的音频结构的附加信息。
可以将在图4中所示出的音频信号解码器扩展成按照综合分析原理的音频信号编码器。在此,由比较设备将所综合的音频信号SAS与要编码的音频信号相比较,并通过改变音频综合参数PITCH、G_S、G_N、F_ENV和T_ENV来使所综合的音频信号与要编码的音频信号相适应。音频信号解码器和音频信号编码器的组合常常也称为编解码器。

Claims (10)

1.用于作为激励采样值系列形成激励信号用以激励音频综合滤波器的方法,其中
a)将已形成的激励采样值时间上连续地存储在自适应码本中,
b)由噪声发生器连续地生成随机采样值,
c)借助所输送的音频基频参数从自适应码本中选择所存储的激励采样值的序列,其中通过所述音频基频参数预先规定要选择的序列至当前时间基准的时间间隔,如果所述音频基频参数预先规定时间间隔,其中该时间间隔不是单独要生成的窄带激励信号的预先规定的采样间隔的整数倍,则根据音频基频参数将中间采样值插入到激励采样值之间和/或随机采样值之间,使得采样值的采样间隔小于窄带激励信号的采样间隔,由此激励信号相对于窄带激励信号具有扩展频带的附加的频率成分,和
d)通过将所选择的序列与包括噪声发生器的当前随机采样值的随机序列相混合来形成激励信号。
2.按照权利要求1的方法,其特征在于,逐时帧地处理激励采样值和/或随机采样值,并且
所选择的序列的长度和/或随机序列的长度对应于时帧的预先规定的长度。
3.按照权利要求1的方法,其特征在于,在混合时,根据第一强度参数放大所选择的序列和/或根据第二强度参数放大随机序列。
4.按照权利要求3的方法,其特征在于,以相对于单独要生成的窄带激励信号较小的采样间隔来形成激励信号,由此所述激励信号相对于窄带激励信号具有扩展频带的附加的频率成分,和
从为生成窄带激励信号所设置的音频综合参数中推导出音频基频参数以及第一强度参数和/或第二强度参数。
5.按照权利要求4的方法,其特征在于,将激励信号的归于扩展频带的分量与单独所生成的窄带激励信号相组合,以便生成宽带激励信号用以激励音频综合滤波器。
6.按照以上权利要求1-5之一的方法,其特征在于,由线性预测编码滤波器和/或通过形成频谱和/或时间包络来对激励信号滤波。
7.用于作为激励采样值系列形成激励信号用以激励音频综合滤波器的激励信号发生器,具有
a)用于时间上连续地存储已形成的激励采样值的自适应码本,
b)用于连续生成随机采样值的噪声发生器,
c)选择设备,用于输送音频基频参数以及用于根据预先规定要选择的序列至当前时间基准的时间间隔的音频基频参数来选择所存储的激励采样值的序列,
d)内插器,其被构造使得:如果所述音频基频参数预先规定时间间隔,其中该时间间隔不是单独要生成的窄带激励信号的预先规定的采样间隔的整数倍,则根据音频基频参数将中间采样值插入到激励采样值之间和/或随机采样值之间,使得采样值的采样间隔小于窄带激励信号的采样间隔,由此激励信号相对于窄带激励信号具有扩展频带的附加的频率成分,以及
e)与噪声发生器和自适应码本相耦合的混合设备,用于将所选择的序列与包括噪声发生器的当前随机采样值的随机序列相混合和用于输出由此所形成的激励信号。
8.按照权利要求7的激励信号发生器,其特征在于,通过用于将中间采样值插入随机采样值之间的内插器使噪声发生器与混合设备相耦合。
9.音频信号编码器,具有按照权利要求7或8所述的激励信号发生器、由激励信号发生器要激励的音频综合滤波器、以及用于使由所激励的音频综合滤波器生成的综合音频信号与要传输的音频信号相适应的比较设备。
10.音频信号解码器,具有按照权利要求7或8所述的激励信号发生器、和由激励信号发生器要激励的用于生成综合音频信号的音频综合滤波器。
CN2006800521407A 2006-01-31 2006-01-31 用于音频信号编码的方法和装置 Expired - Fee Related CN101336449B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/EP2006/000811 WO2007087823A1 (de) 2006-01-31 2006-01-31 Verfahren und anordnungen zur audiosignalkodierung

Publications (2)

Publication Number Publication Date
CN101336449A CN101336449A (zh) 2008-12-31
CN101336449B true CN101336449B (zh) 2011-10-19

Family

ID=36367705

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2006800521407A Expired - Fee Related CN101336449B (zh) 2006-01-31 2006-01-31 用于音频信号编码的方法和装置

Country Status (4)

Country Link
US (1) US8135584B2 (zh)
EP (1) EP1979899B1 (zh)
CN (1) CN101336449B (zh)
WO (1) WO2007087823A1 (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8135584B2 (en) * 2006-01-31 2012-03-13 Siemens Enterprise Communications Gmbh & Co. Kg Method and arrangements for coding audio signals
US8190440B2 (en) * 2008-02-29 2012-05-29 Broadcom Corporation Sub-band codec with native voice activity detection
EP2313986A1 (en) * 2008-08-13 2011-04-27 Nokia Siemens Networks Oy Method of generating a codebook
CN102714041B (zh) * 2009-11-19 2014-04-16 瑞典爱立信有限公司 改进的激励信号带宽扩展
FR2955187A1 (fr) * 2010-01-08 2011-07-15 Centre Nat Rech Scient Procede de decomposition d'un signal periodique anharmonique et programme d'ordinateur correspondant
CN104575507B (zh) * 2013-10-23 2018-06-01 中国移动通信集团公司 语音通信方法及装置
EP2963648A1 (en) 2014-07-01 2016-01-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio processor and method for processing an audio signal using vertical phase correction
US10200872B2 (en) * 2014-10-08 2019-02-05 Qualcomm Incorporated DC subcarrier handling in narrowband devices
DE102016119750B4 (de) * 2015-10-26 2022-01-13 Infineon Technologies Ag Vorrichtungen und Verfahren zur Mehrkanalabtastung
CN109003621B (zh) * 2018-09-06 2021-06-04 广州酷狗计算机科技有限公司 一种音频处理方法、装置及存储介质
CN113643682B (zh) * 2021-10-13 2022-07-15 展讯通信(上海)有限公司 降噪方法、芯片、芯片模组及设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0883107A1 (en) * 1996-11-07 1998-12-09 Matsushita Electric Industrial Co., Ltd Sound source vector generator, voice encoder, and voice decoder
CN1222996A (zh) * 1997-02-10 1999-07-14 皇家菲利浦电子有限公司 用于传输语音信号的传输系统
CN1297222A (zh) * 1999-09-29 2001-05-30 索尼公司 信息处理设备、方法和记录媒体

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5479559A (en) * 1993-05-28 1995-12-26 Motorola, Inc. Excitation synchronous time encoding vocoder and method
US6047254A (en) * 1996-05-15 2000-04-04 Advanced Micro Devices, Inc. System and method for determining a first formant analysis filter and prefiltering a speech signal for improved pitch estimation
US8135584B2 (en) * 2006-01-31 2012-03-13 Siemens Enterprise Communications Gmbh & Co. Kg Method and arrangements for coding audio signals

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0883107A1 (en) * 1996-11-07 1998-12-09 Matsushita Electric Industrial Co., Ltd Sound source vector generator, voice encoder, and voice decoder
CN1222996A (zh) * 1997-02-10 1999-07-14 皇家菲利浦电子有限公司 用于传输语音信号的传输系统
CN1297222A (zh) * 1999-09-29 2001-05-30 索尼公司 信息处理设备、方法和记录媒体

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Hongmei Ai et al.A 6.6kb/s CELP Speech Coder: High Performance for GSM Half-Rate System.《1994 International Symposium on Speech,Image Processing and Neural Networks》.1994,第555-558页. *
Jinho Choi.A Fast Determination of Stochastic Excitation without Codebook Search in CELP Coder.《IEEE TRANSACTIONS ON SPEECH AND AUDIO PROCESSING》.1995,第3卷(第6期),第473-480页. *
R. A. SALAMI.BINARY CODE EXCITED LINEAR PREDICTION (BCELP) : NEW APPROACH TO CELP CODING OF SPEECH WITHOUT CODEBOOKS.《ELECTRONICS LETTERS》.1989,第25卷(第6期),第401-403页. *

Also Published As

Publication number Publication date
US8135584B2 (en) 2012-03-13
EP1979899B1 (de) 2015-03-11
US20090012782A1 (en) 2009-01-08
WO2007087823A1 (de) 2007-08-09
CN101336449A (zh) 2008-12-31
EP1979899A1 (de) 2008-10-15

Similar Documents

Publication Publication Date Title
CN101336449B (zh) 用于音频信号编码的方法和装置
CN101336451B (zh) 音频信号编码的方法和装置
CN106462557B (zh) 重采样音频信号的方法、设备、编/解码器及存储介质
JP3936139B2 (ja) オーバーサンプリングされた合成広帯域信号の高周波数成分回復の方法および装置
US6694292B2 (en) Apparatus for encoding and apparatus for decoding speech and musical signals
KR100361236B1 (ko) 차분코딩원리를구현하는전송시스템
JP5192630B2 (ja) 符号化音響信号の知覚的に改善した増強
EP3899932B1 (en) Phase reconstruction in a speech decoder
FI118704B (fi) Menetelmä ja laite lähdekoodauksen tekemiseksi
FI119576B (fi) Puheenkäsittelylaite ja menetelmä puheen käsittelemiseksi, sekä digitaalinen radiopuhelin
JP2000516356A (ja) 可変ビットレート音声送信システム
EP3899931B1 (en) Phase quantization in a speech encoder
CN101960514A (zh) 信号分析控制系统及其方法、信号控制装置及其方法和程序
KR20170003596A (ko) 음성 정보를 갖는 개선된 프레임 손실 보정
JP4287840B2 (ja) 符号化装置
KR101737254B1 (ko) 오디오 신호, 디코더, 인코더, 시스템 및 컴퓨터 프로그램을 합성하기 위한 장치 및 방법
WO2005045808A1 (en) Harmonic noise weighting in digital speech coders
US7957978B2 (en) Method and terminal for encoding or decoding an analog signal
JP2009104169A (ja) 音声符号列の変換装置および変換方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20111019

Termination date: 20210131

CF01 Termination of patent right due to non-payment of annual fee