CN101506877A - 对宽带声码器的帧进行时间弯曲 - Google Patents
对宽带声码器的帧进行时间弯曲 Download PDFInfo
- Publication number
- CN101506877A CN101506877A CNA2007800308129A CN200780030812A CN101506877A CN 101506877 A CN101506877 A CN 101506877A CN A2007800308129 A CNA2007800308129 A CN A2007800308129A CN 200780030812 A CN200780030812 A CN 200780030812A CN 101506877 A CN101506877 A CN 101506877A
- Authority
- CN
- China
- Prior art keywords
- voice signal
- frequency band
- vocoder
- band voice
- high frequency
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 claims abstract description 55
- 238000005452 bending Methods 0.000 claims description 66
- 230000005284 excitation Effects 0.000 claims description 17
- 230000000737 periodic effect Effects 0.000 claims description 4
- 230000002596 correlated effect Effects 0.000 claims 1
- 230000006835 compression Effects 0.000 description 10
- 238000007906 compression Methods 0.000 description 10
- 238000005070 sampling Methods 0.000 description 8
- 230000005540 biological transmission Effects 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 230000001052 transient effect Effects 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 239000002131 composite material Substances 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 210000001260 vocal cord Anatomy 0.000 description 2
- 206010038743 Restlessness Diseases 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 239000006249 magnetic particle Substances 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/04—Time compression or expansion
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/003—Changing voice quality, e.g. pitch or formants
- G10L21/007—Changing voice quality, e.g. pitch or formants characterised by the process used
- G10L21/01—Correction of time axis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/087—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters using mixed excitation models, e.g. MELP, MBE, split band LPC or HVXC
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本发明揭示一种传送语音的方法,其包括:将残余低频带语音信号时间弯曲至所述残余低频带语音信号的经扩展或经压缩版本;将高频带语音信号时间弯曲至所述高频带语音信号的经扩展或经压缩版本;及合并所述经时间弯曲的低频带与高频带语音信号,以给出完整的经时间弯曲的语音信号。在所述低频带中,在对所述残余低频带信号进行时间弯曲之后合成所述残余低频带语音信号,而在所述高频带中,在对所述高频带语音信号进行时间弯曲之前合成未经弯曲的高频带信号。所述方法可进一步包括对语音段进行分类及对所述语音段进行编码。对所述语音段的所述编码可以是码激励线性预测、噪声激励线性预测或1/8帧(寂静)编码中的一者。
Description
技术领域
本发明大体来说涉及对声码器中的帧进行时间弯曲(即,扩展或压缩),且更特定而言涉及对宽带声码器中的帧进行时间弯曲。
背景技术
时间弯曲在包交换网络中具有若干应用,其中声码器包可不同步地到达。尽管时间弯曲可在声码器内部或外部执行,但在声码器中执行时间弯曲可提供若干优点,例如,经弯曲帧的质量更好且计算负载减小。
发明内容
本发明包括一种通过操纵语音信号来对语音帧进行时间弯曲的设备及方法。在一个方面中,揭示一种对第四代声码器(4GV)宽带声码器的码激励线性预测(CELP)及噪声激励线性预测(NELP)帧进行时间弯曲的方法。更具体来说,对于CELP帧,所述方法通过分别添加或删除音调周期以扩展或压缩语音来维持语音阶段。借助此方法,可在残余中(即在合成之前)对低频带信号进行时间弯曲,而可在合成之后在8kHz域中对高频带信号进行时间弯曲。所揭示的方法可应用于将CELP及/或NELP用于低频带且/或使用分频带技术以对低频带及高频带进行单独编码的任何宽带声码器。应注意,4GV宽带的标准名称为EVRC-C。
鉴于以上所述,本发明所揭示的特征大体来说涉及用于传送语音的一个或一个以上经改善系统、方法及/或设备。在一个实施例中,本发明包括一种传送语音的方法,其包括:将残余低频带语音信号时间弯曲至所述残余低频带语音信号的经扩展或经压缩版本;将高频带语音信号时间弯曲至所述高频语音信号的经扩展或经压缩版本;及合并所述经时间弯曲的低频带及高频带语音信号以给出完整的经时间弯曲的语音信号。在本发明一个方面中,所述残余低频带语音信号在所述残余低频带信号的时间弯曲后合成,而在高频带中,合成在高频带语音信号的时间弯曲之前执行。所述方法可进一步包括对语音段进行分类及对所述语音段进行编码。对所述语音段的编码可以是码激励线性预测、噪声激励线性预测或1/8(寂静)帧编码中的一者。所述低频带可表示高达约4kHz的频带,且所述高频带可表示从约3.5kHz到7kHz的频带。
在另一实施例中,揭示一种具有至少一个输入及至少一个输出的声码器,所述声码器包括:编码器,其包括滤波器,所述滤波器具有可操作地连接到所述声码器的输入的至少一个输入及至少一个输出;及解码器,其包括合成器,所述合成器具有可操作地连接到所述编码器的至少一个输出的至少一个输入及可操作地连接到所述声码器的至少一个输出的至少一个输出。在此实施例中,所述解码器包括存储器,其中所述解码器适于执行所述存储器中所存储的软件指令,所述软件指令包括:将残余低频带语音信号时间弯曲至所述残余低频带语音信号的经扩展或经压缩版本;将高频带语音信号时间弯曲至所述高频带语音信号的经扩展或经压缩版本;及合并所述经时间弯曲的低频带及高频带语音信号以给出完整的经时间弯曲的语音信号。所述合成器可包括:用于合成经时间弯曲的残余低频带语音信号的装置;及用于在对其进行时间弯曲之前合成所述高频带语音信号的装置。所述编码器包括存储器且可适于执行所述存储器中所存储的软件指令,所述指令包括:将语音段分类为1/8(寂静)帧、码激励线性预测或噪声激励线性预测。
根据以下详细说明、权利要求书及图式,本发明的其它适用范围将变得明显。然而,应了解,尽管所述详细说明及具体实例指示本发明的优选实施例,但其仅以图解说明的方式给出,因为所属领域的技术人员将明了归属于本发明精神及范围内的各种变化及修改。
附图说明
根据下文给出的详细说明、所附权利要求书及附图,可更加完整地理解本发明,其中:
图1为线性预测编码(LPC)声码器的方块图;
图2A为含有浊音语音的语音信号;
图2B为含有清音语音的语音信号;
图2C为含有瞬态语音的语音信号;
图3为图解说明对低频带及高频带的时间弯曲的方块图;
图4A描绘通过内插来确定音调延迟;
图4B描绘识别音调周期;
图5A表示呈音调周期形式的原始语音信号;
图5B表示使用重叠/添加来扩展的语音信号;且
图5C表示使用重叠/添加来压缩的语音信号。
具体实施方式
本文中使用“说明性”一词来意指“用作实例、示例、或图解说明”。本文中描述为“说明性”的任何实施例未必解释为比其它实施例更优选或有利。
时间弯曲在包交换网络中具有若干应用,其中声码器包可不同步地到达。尽管时间弯曲可在声码器内部或外部执行,但在声码器中执行时间弯曲可提供若干优点,例如,经弯曲帧的质量更好且计算负载减小。本文中所描述的技术可容易地应用于使用类似技术(例如,4GV-宽带,其标准名称为EVRC-C)来对话音数据进行声编码的其它声码器。
声码器功能性的说明
人类话音由两个分量构成。一个分量包括对音调敏感的基波,且另一个是对音调不敏感的固定谐波。所感知的声音的音调是耳朵对频率的响应,即,对于大多数实际用途来说,音调即是频率。谐波分量使个人话音具有独特的特性。其随声带及随声道实际形状而改变,且被称为共振峰。
人类话音可由数字信号s(n)10来表示(参见图1)。假定s(n)10是在典型谈话期间获得的数字语音信号,其包含不同的口声及寂静周期。可如图2A-2C中所示将语音信号s(n)10分成若干帧20。在一个方面中,以8kHz对s(n)10进行数字取样。在其它方面中,可以16kHz或32kHz或某一其它取样频率对s(n)10进行数字取样。
当前的编码方案通过移除语音中所固有的所有自然冗余(即,相关的元素)将数字化语音信号10压缩成低位速率信号。语音通常表现出由唇及舌头的机械动作而引起的短期冗余,且表现出由声带的颤动而引起的长期冗余。线性预测编码(LPC)通过移除所述冗余来对语音信号10进行滤波,从而产生残余语音信号。然后,其将所形成的残余信号模拟成白高斯(Gaussian)噪声。可通过对若干过去样本的和进行加权来预测语音波形的取样值,所述若干过去样本中的每一者均被线性预测系数所乘。因此,线性预测编码器通过传输滤波系数及量化噪声而非传输完整的带宽语音信号10来实现减小的位速率。
图1中图解说明LPC声码器70的一个实施例的方块图。LPC的功能是使有限持续时间内原始语音信号与所估计语音信号之间的平方差的和最小化。此可产生唯一一组预测系数,在正常情况下每一帧20地对所述预测系数进行估计。帧20通常为20ms长。时变数字滤波器75的转移函数可由下式给出:
其中预测系数可由ak表示且增益由G表示。
所述求和从k=1计算到k=p。如果使用LPC-10方法,则p=10。此意味着仅前10个系数被传输到LPC合成器80。最常用来计算所述系数的两种方法是(但不限于)协方差方法及自相关方法。
典型声码器产生20微秒持续时间的帧20,其中包含160个优选的8kHz速率下的样本或320个16kHz速率下的样本。此帧20的经时间弯曲压缩版本具有小于20微秒的持续时间,而经时间弯曲扩展版本则具有大于20微秒的持续时间。当在包交换网络上发送话音数据(其会将延迟抖动引入话音包的传输中)时,话音数据的时间弯曲具有显著优点。在此类网络中,可使用时间弯曲来减轻此延迟抖动的影响并产生看似“同步”的话音流。
本发明的实施例涉及一种用于通过操纵语音残余来对声码器70内的帧20进行时间弯曲的设备及方法。在一个实施例中,本方法及设备用于4GV宽带中。所揭示的实施例包括用来扩展/压缩使用码激励线性预测(CELP)或噪声激励线性预测(NELP)编码的不同类型的4GV宽带语音段的方法及设备或系统。
术语“声码器”70通常是指通过提取基于人类语音产生模型的参数来压缩浊音语音的装置。声码器70包含编码器204及解码器206。编码器204对传入语音进行分析并提取相关的参数。在一个实施例中,编码器包括滤波器75。解码器206使用其经由传输通道208从编码器204接收的参数来合成所述语音。在一个实施例中,所述解码器包括合成器80。语音信号10常常被划分成若干数据帧20并由声码器70进行块处理。
所属领域的技术人员应认识到,人类语音可以许多不同的方式来分类。三种常规语音分类为浊音、清音声音及瞬态语音。
图2A为浊音语音信号s(n)402。图2A显示浊音语音中一个可测量的普通性质,其被称为音调周期100。
图2B为清音语音信号s(n)404。清音语音信号404类似有色噪声。
图2C描绘瞬态语音信号s(n)406,即,既不是浊音也不是清音的语音。图2C中所示的瞬态语音406的实例可表示清音语音与浊音语音之间的s(n)过渡。这三种分类并非涵盖所有的情况。存在许多不同的语音分类,可根据本文中所描述的方法采用不同的语音分类来实现相当的结果。
4GV宽带声码器
第四代声码器(4GV)为在无线网络上的使用提供了吸引人的特征,此进一步描述于在2005年5月5日提出申请的名称为“通过修改残余对声码器内的帧进行时间弯曲(Time Warping Frames Inside the Vocoder by Modifying the Residual)”的序列号为11/123,467的共同待决的专利申请案中,所述专利申请案的整体内容以引用方式并入本文中。这些特征中的某些特征包含:在质量与位速率之间进行折衷的能力、当面对增加的包错误率(PER)时更为弹性的声编码、更好的擦除隐匿等。在本发明中,揭示使用分频带技术(即,低频带及高频带单独地被编码)对语音进行编码的4GV宽带声码器。
在一个实施例中,输入信号表示以16kHz取样的宽带语音。提供分析滤波器组,以产生以8kHz取样的窄频带(低频带)信号及以7kHz取样的高频带信号。此高频带信号表示所述输入信号中从约3.5kHz到约7kHz的频带,而低频带信号则表示高达约4kHz的频带,且最终的经重构宽带信号将在带宽上限制到约7kHz。应注意,低频带与高频带之间存在约为500Hz的重叠,从而允许所述频带之间更为渐进的过渡。
在一个方面中,使用窄频带EVRC-B语音编码器的经修改版本(其为具有20微秒帧大小的CELP编码器)来对所述窄频带信号进行编码。来自所述窄频带编码器的几个信号由高频带分析及合成所使用;这些信号为:(1)来自窄频带编码器的激励(即,量化残余)信号;(2)经量化的第一反射系数(作为窄频带信号的频谱倾斜的指示符);(3)经量化的自适应码本增益;及(4)经量化的音调滞后。
4GV宽带中所使用的经修改EVRC-B窄频带编码器对如下三种不同帧类型中的一种类型的每一帧话音数据进行编码:码激励线性预测(CELP);噪声激励线性预测(NELP);或寂静第1/8速率帧。
CELP用来对大多数的语音进行编码,其中包含周期性的语音及具有差周期性的语音。通常,由经修改EVRC-B窄频带编码器使用CELP对约75%的非寂静帧进行编码。
NELP用来对特性类似于噪声的语音进行编码。可通过在所述解码器处产生随机信号并向其施加适当的增益来重构此类语音段的类似于噪声的特性。
第1/8th速率帧用来对背景噪声进行编码,即,使用者不在谈话的周期。
时间弯曲4GV宽带帧
由于4GV宽带声码器对低频带及高频带单独地进行编码,因此在对所述帧进行时间弯曲时遵循同一原理。使用如上文提及的名称为“通过修改残余对声码器内的帧进行时间弯曲(Time Warping Frames Inside the Vocoder by Modifying the Residual)”的共同待决的专利申请案中所描述的类似技术来对所述低频带进行时间弯曲。
参照图3,其中显示应用于残余信号30的低频带弯曲32。在残余域中进行时间弯曲32的主要原因是:此可允许对经时间弯曲的残余信号应用LPC合成34。所述LPC系数在语音效果如何方面起到重要作用,且在弯曲32之后应用合成34可确保正确的LPC信息维持在所述信号中。如果在所述解码器之后完成时间弯曲,则另一方面,LPC合成已在时间弯曲之前执行。因此,所述弯曲程序可改变所述信号的LPC信息,尤其是在音调周期估计尚未极为准确的情况下。
当语音段为CELP时对残余信号的时间弯曲
为弯曲所述残余,所述解码器使用所述已编码帧中含有的音调延迟信息。所述音调延迟实际上是所述帧末尾处的音调延迟。此处应注意,即使在周期性帧中,所述音调延迟也会稍微地变化。可通过在最后一个帧末尾的音调延迟与当前帧末尾处的音调延迟之间进行内插来估计所述帧中任何点处的音调延迟。此显示于图4中。一旦已知所述帧中所有点处的音调延迟,即可将所述帧划分成若干音调周期。可使用所述帧中各个点处的音调延迟来确定音调周期的边界。
图4A显示如何将所述帧划分成其音调周期的实例。例如,第70号样本具有约为70的音调延迟且第142号样本具有约为72的音调延迟。因此,音调周期为从[1-70]及从[71-142]。此图解说明于图4B中。
一旦所述帧已被划分成若干音调周期,即可接着重叠/添加这些音调周期以增大/减小所述残余的大小。所述重叠/添加技术为已知技术,且图5A-5C显示如何使用其来扩展/压缩所述残余。
或者,如果需要扩展所述语音信号,则可重复所述音调周期。例如,在图5B中,可重复音调周期PP1(而不是与PP2重叠-添加)来产生额外的音调周期。
此外,可与产生所需量的扩展/压缩所需次数相同地完成音调周期的重叠/添加及/或重复。
参照图5A,图中显示由4个音调周期(PP)构成的原始语音信号。图5B显示可如何使用重叠/添加来扩展此语音信号。在图5B中,对音调周期PP2及PP1进行重叠/添加,以使PP2的影响继续减少而PP1的影响不断增加。图5C图解说明如何使用重叠/添加来压缩所述残余。
在音调周期不断变化的情形下,所述重叠-添加技术可需要合并两个长度不相等的音调周期。在此情形下,可通过在对两个音调周期进行重叠/添加之前对准其峰值来实现更好的合并。
最后,通过所述LPC合成发送所述经扩展/压缩残余。
一旦所述低频带被弯曲,即需要使用来自所述低频带的音调周期来弯曲所述高频带(即,以供扩展),添加由若干样本构成的音调周期,同时移除音调周期以进行压缩。
用于弯曲所述高频带的程序不同于所述低频带。返回参照图3,所述高频带并非在所述残余域中弯曲,而是,弯曲38在高频带样本的合成36之后完成。之所以如此是因为所述高频带以7kHz取样,而所述低频带以8kHz取样。因此,当所述取样速率如在所述高频带中那样为7kHz时,所述低频带(以8kHz取样)的音调周期可变为分数数目的样本。作为一实例,如果所述音调周期在低频带中为25,则在高频带的残余域中,此将需要从高频带的残余中添加/移除25*7/8=21.875个样本。很明显,由于无法产生分数数目的样本,因此在将高频带重新取样到8kHz之后对其进行弯曲38,这是在合成36之后的情形。
一旦所述低频带被弯曲32,则可将未经弯曲的低频带激励(由160个样本组成)传递到所述高频带解码器。使用此未经弯曲的低频带激励,所述高频带解码器产生140个7kHz的高频带样本。然后,通过合成滤波器36传递这140个样本并将其重新取样到8kHz,从而给出160个高频带样本。
然后,使用来自所述低频带的音调周期及用于弯曲低频带CELP语音段的重叠/添加技术对160个8kHz的样本进行时间弯曲38。
最后,添加或合并所述高频带及低频带以给出完整的经弯曲的信号。
当语音段为NELP时对残余信号的时间弯曲
对于NELP语音段,所述编码器仅对LPC信息及低频带的语音段的不同部分的增益进行编码。可采用各自为16个PCM样本的“段”对所述增益进行编码。因此,可将所述低频带表示为10个已编码的增益值(每16个语音样本具有一个增益值)。
所述解码器通过产生随机值来产生所述低频带残余信号,且然后对其施加相应的增益。在此情形下,不存在音调周期的概念,且同样,所述低频带扩展/压缩并非必须为音调周期的粒度。
为扩展/压缩经NELP编码的帧的低频带,所述解码器可产生多于/少于10的数目的段。在此情形下,所述低频带扩展/压缩是依照16个样本的倍数,从而导致N=16*n个样本,其中n为段的数目。在扩展的情况下,所述额外添加的段可采用由前10个段构成的某一函数的增益。作为一实例,所述额外段可采用第10段的增益。
或者,所述解码器可通过对若干组y个(而不是16个)样本施加10个已解码增益来扩展/压缩经NELP编码帧的低频带,以产生经扩展(y>16)或经压缩(y<16)的低频带残余。
然后,通过所述LPC合成发送所述经扩展/压缩残余,以产生所述低频带弯曲信号。
一旦所述低频带被弯曲,即将所述未弯曲的低频带激励(其由160个样本构成)传递到所述高频带解码器。使用此未经弯曲的低频带激励,所述高频带解码器产生140个7kHz的高频带样本。然后,通过合成滤波器传递这140个样本并将其重新取样到8kHz,从而给出160个高频带样本。
然后,以类似于CELP语音段的高频带弯曲的方式(即,使用重叠/添加)来对这160个8kHz的样本进行时间弯曲。当对NELP的高频带使用重叠/添加时,压缩/扩展的量与用于低频带的量相同。换句话说,假定用于重叠/添加方法的“重叠”为所述低频带中扩展/压缩的量。作为一实例,如果所述低频带在弯曲之后产生192个样本,则在重叠/添加方法中所使用的重叠周期为192-160=32个样本。
最后,添加所述高频带及低频带以给出完整的经弯曲的NELP语音段。
所属领域的技术人员将了解,可使用各种不同技术及技法中的任一者来表示信息及信号。例如,整个上述说明中可能提及的数据、指令、命令、信息、信号、位、符号及码片可由电压、电流、电磁波、磁场或磁粒子、光场或光粒子或其任何组合来表示。
所属领域的技术人员将进一步了解,结合本文所揭示实施例而描述的各种说明性逻辑块、模块、电路及算法步骤可实施为电子硬件、计算机软件或二者的组合。为清晰地图解说明硬件与软件的此可互换能力,上文就其功能性大体描述了各种说明性组件、块、模块、电路及步骤。此功能性实施为硬件还是软件取决于特定应用及施加在整个系统上的设计约束条件。所属领域的技术人员可针对每一特定应用以不同方式实施所描述的功能性,但不应将此类实施方案决定解释为导致背离本发明的范围。
结合本文中所揭示实施例所描述的各种说明性逻辑块、模块及电路可由如下装置来实施或执行:通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或其它可编程逻辑装置、离散门或晶体管逻辑、离散硬件组件或经设计以执行本文中所描述功能的其任何组合。通用处理器可以是微处理器,但另一选择为,所述处理器还可以是任何常规处理器、控制器、微控制器或状态机。处理器还可实施为计算装置的组合,例如,DSP与微处理器的组合、多个微处理器、一个或一个以上微处理器与DSP核心的联合,或任何其它此类配置。
结合本文中所揭示实施例所描述的方法或算法的步骤可直接实施在硬件中、由处理器执行的软件模块中或两者的组合中。软件模块可驻留在随机存取存储器(RAM)、快闪存储器、只读存储器(ROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)、寄存器、硬盘、可抽换式磁盘、CD-ROM或所属技术领域中已知的任何其它形式的存储媒体中。说明性存储媒体耦合到处理器,以使所述处理器可从所述存储媒体读取信息或将信息写入其中。在替代方案中,所述存储媒体可以是所述处理器的组成部分。所述处理器及存储媒体可驻留在ASIC中。所述ASIC则可驻留在用户终端中。在替代方案中,所述处理器及存储媒体可作为离散组件驻留在用户终端中。
提供上文对所揭示实施例的说明以使所属领域的技术人员均能够制作或使用本发明。所属领域的技术人员将易于明了对这些实施例的各种修改,且本文所界定的通用原理可在不背离本发明的精神或范围的情况下应用于其它实施例。因此,本发明不希望限定于本文所示实施例,而应赋予其与本文所揭示原理及新颖特征相一致的最宽广范围。
Claims (56)
1、一种传送语音的方法,其包括:
将残余低频带语音信号时间弯曲至所述残余低频带语音信号的经扩展或经压缩版本;
将高频带语音信号时间弯曲至所述高频带语音信号的经扩展或经压缩版本;及
合并所述经时间弯曲的低频带与高频带语音信号,以给出完整的经时间弯曲的语音信号。
2、如权利要求1所述的方法,其进一步包括合成所述经时间弯曲的残余低频带语音信号。
3、如权利要求2所述的方法,其进一步包括在对所述高频带语音信号进行时间弯曲之前对其进行合成。
4、如权利要求3所述的方法,其进一步包括:
对语音段进行分类;及
对所述语音段进行编码。
5、如权利要求4所述的方法,其中对所述语音段进行编码包括使用码激励线性预测、噪声激励线性预测或1/8帧编码。
6、如权利要求4所述的方法,其中所述编码为码激励线性预测编码。
7、如权利要求4所述的方法,其中所述编码为噪声激励线性预测编码。
8、如权利要求7所述的方法,其中所述编码包括将线性预测编码信息编码为语音帧的不同部分的增益。
9、如权利要求8所述的方法,其中针对若干组语音样本对所述增益进行编码。
10、如权利要求9所述的方法,其进一步包括通过产生随机值且接着将所述增益应用于所述随机值来产生残余低频带信号。
11、如权利要求9所述的方法,其进一步包括将所述线性预测编码信息表示为所述残余低频带语音信号的10个经编码增益值,其中每一经编码增益值表示16个语音样本。
12、如权利要求7所述的方法,其进一步包括从一未经弯曲的低频带激励信号中产生所述高频带语音信号的140个样本。
13、如权利要求7所述的方法,其中所述低频带语音信号的所述时间弯曲包括:产生较高/较低数目的样本,及将语音帧的若干部分的经解码增益的某一函数应用于所述残余且接着对其进行合成。
14、如权利要求13所述的方法,其中所述将所述语音帧的若干部分的经解码增益的某一函数应用于所述残余包括:当扩展所述低频带时,将最后一个语音段的增益应用于额外样本。
15、如权利要求7所述的方法,其中所述高频带语音信号的所述时间弯曲包括:
如果压缩所述高频带语音信号,则重叠/添加曾在所述低频带中压缩的相同数目的样本;及
如果扩展所述高频带语音信号,则重叠/添加曾在所述低频带中扩展的相同数目的样本。
16、如权利要求6所述的方法,其中所述残余低频带语音信号的所述时间弯曲包括:
估计至少一个音调周期;及
在接收所述残余低频带语音信号之后,添加或减去所述音调周期中的至少一者。
17、如权利要求16所述的方法,其中所述高频带语音信号的所述时间弯曲包括:
使用来自所述低频带语音信号的所述音调周期;
如果压缩所述高频带语音信号,则重叠/添加一个或一个以上音调周期;及
如果扩展所述高频带语音信号,则重叠/添加或重复一个或一个以上音调周期。
18、如权利要求6所述的方法,其中所述残余低频带语音信号的所述时间弯曲包括:
估计音调延迟;
将一语音帧划分成若干音调周期,其中使用所述语音帧中各个点处的所述音调延迟来确定所述音调周期的边界;
如果压缩所述残余低频带语音信号,则重叠/添加所述音调周期;及
如果扩展所述残余低频带语音信号,则重叠/添加或重复一个或一个以上音调周期。
19、如权利要求18所述的方法,其中所述高频带语音信号的所述时间弯曲包括:
使用来自所述低频带语音信号的所述音调周期;
如果压缩所述高频带语音信号,则重叠/添加所述音调周期;及
如果扩展所述高频带语音信号,则重叠/添加或重复一个或一个以上音调周期。
20、如权利要求18所述的方法,其中对所述音调延迟的所述估计包括在最后一个帧末尾的音调延迟与当前帧的末尾之间进行内插。
21、如权利要求18所述的方法,其中所述重叠/添加或重复所述音调周期中的一者或一者以上包括合并所述语音段。
22、如权利要求18所述的方法,其中所述如果扩展所述残余低频带语音信号则重叠/添加或重复所述音调周期中的一者或一者以上包括:添加由第一音调段与第二音调周期段形成的额外音调周期。
23、如权利要求21所述的方法,其进一步包括选择类似语音段,其中合并所述类似语音段。
24、如权利要求21所述的方法,其进一步包括使所述语音段相关,借此选择类似语音段。
25、如权利要求22所述的方法,其中所述添加由第一音调段与第二音调周期段形成的额外音调周期包括:添加所述第一及第二音调段,以使所述第一音调周期段的影响增大且所述第二音调周期段的影响减小。
26、如权利要求1所述的方法,其中所述低频带表示高达及包含4kHz的频带。
27、如权利要求1所述的方法,其中所述高频带表示从约3.5kHz到约7kHz的频带。
28、一种声码器,其具有至少一个输入及至少一个输出,所述声码器包括:
编码器,其包括滤波器,所述滤波器具有可操作地连接到所述声码器的所述输入的至少一个输入及至少一个输出;及
解码器,其包括合成器,所述合成器具有可操作地连接到所述编码器的所述至少一个输出的至少一个输入及可操作地连接到所述声码器的所述至少一个输出的至少一个输出。
29、如权利要求28所述的声码器,其中所述解码器包括:
存储器,其中所述解码器适于执行存储在所述存储器中的软件指令,所述软件指令包括:
将残余低频带语音信号时间弯曲至所述残余低频带语音信号的经扩展或经压缩版本;
将高频带语音信号时间弯曲至所述高频带语音信号的经扩展或经压缩版本;及
合并所述经时间弯曲的低频带与高频带语音信号,以给出完整的经时间弯曲的语音信号。
30、如权利要求29所述的声码器,其中所述合成器包括用于合成所述经时间弯曲的残余低频带语音信号的装置。
31、如权利要求30所述的声码器,其中所述合成器进一步包括用于在对所述高频带语音信号进行时间弯曲之前对其进行合成的装置。
32、如权利要求28所述的声码器,其中所述编码器包括存储器,且所述编码器适于执行存储在所述存储器中的软件指令,所述软件指令包括将语音段分类成1/8帧、码激励线性预测或噪声激励线性预测。
33、如权利要求31所述的声码器,其中所述编码器包括存储器,且所述编码器适于执行存储在所述存储器中的软件指令,所述软件指令包括使用码激励线性预测编码来对语音段进行编码。
34、如权利要求31所述的声码器,其中所述编码器包括存储器,且所述编码器适于执行存储在所述存储器中的软件指令,所述软件指令包括使用噪声激励线性预测编码来对语音段进行编码。
35、如权利要求34所述的声码器,其中所述使用噪声激励线性预测编码软件指令对所述语音段进行编码包括:将线性预测编码信息编码为语音段的不同部分的增益。
36、如权利要求35所述的声码器,其中针对若干组语音样本对所述增益进行编码。
37、如权利要求36所述的声码器,其中所述对所述残余低频带语音信号进行时间弯曲的指令进一步包括:通过产生随机值且接着将所述增益应用于所述随机值来产生残余低频带语音信号。
38、如权利要求36所述的声码器,其中所述对所述残余低频带语音信号进行时间弯曲的指令进一步包括:将所述线性预测编码信息表示为所述残余低频带语音信号的10个经编码增益值,其中每一经编码增益值表示16个语音样本。
39、如权利要求34所述的声码器,其进一步包括从一未经弯曲的低频带激励信号中产生所述高频带语音信号的140个样本。
40、如权利要求34所述的声码器,其中所述对所述低频带语音信号进行时间弯曲的软件指令包括:产生较高/较低数目的样本,及将语音帧的若干部分的经解码增益的某一函数应用于所述残余且接着对其进行合成。
41、如权利要求40所述的声码器,其中所述将所述语音帧的若干部分的经解码增益的某一函数应用于所述残余包括:当扩展所述低频带时,将最后一个语音段的增益应用于额外样本。
42、如权利要求33所述的声码器,其中所述对所述高频带语音信号进行时间弯曲的软件指令包括:
如果压缩所述高频带语音信号,则重叠/添加曾在所述低频带中压缩的相同数目的样本;及
如果扩展所述高频带语音信号,则重叠/添加曾在所述低频带中扩展的相同数目的样本。
43、如权利要求33所述的声码器,其中所述对所述残余低频带语音信号进行时间弯曲的软件指令包括:
估计至少一个音调周期;及
在接收所述残余低频带语音信号之后,添加或减去所述至少一个音调周期。
44、如权利要求43所述的声码器,其中所述对所述高频带语音信号进行时间弯曲的软件指令包括:
使用来自所述低频带语音信号的所述音调周期;
如果压缩所述高频带语音信号,则重叠/添加一个或一个以上音调周期;及
如果扩展所述高频带语音信号,则重叠/添加或重复一个或一个以上音调周期。
45、如权利要求33所述的声码器,其中所述对所述残余低频带语音信号进行时间弯曲的软件指令包括:
估计音调延迟;
将一语音帧划分成若干音调周期,其中使用所述语音帧中各个点处的所述音调延迟来确定所述音调周期的边界;
如果压缩所述残余语音信号,则重叠/添加所述音调周期;及
如果扩展所述残余语音信号,则重叠/添加或重复一个或一个以上音调周期。
46、如权利要求45所述的声码器,其中所述对所述高频带语音信号进行时间弯曲的软件指令包括:
使用来自所述低频带语音信号的所述音调周期;
如果压缩所述高频带语音信号,则重叠/添加所述音调周期;及
如果扩展所述高频带语音信号,则重叠/添加或重复一个或一个以上音调周期。
47、如权利要求45所述的声码器,其中所述如果压缩所述残余低频带语音信号则重叠/添加所述音调周期的指令包括:
将一输入样本序列分段成若干样本块;
以规则的时间间隔移除所述残余信号的段;
合并所述移除的段;及
用经合并的段来替换所述移除的段。
48、如权利要求45所述的声码器,其中所述估计所述音调延迟的指令包括:在最后一个帧的末尾的音调延迟与当前帧的末尾之间进行内插。
49、如权利要求45所述的声码器,其中所述重叠/添加或重复所述音调周期中的一者或一者以上的指令包括合并所述语音段。
50、如权利要求45所述的声码器,其中所述如果扩展所述残余低频带语音信号则重叠/添加或重复所述音调周期中的一者或一者以上的指令包括:添加由第一音调周期段与第二音调周期段形成的额外音调周期。
51、如权利要求47所述的声码器,其中所述合并所述移除的段的指令包括:增加第一音调周期段的影响并减少第二音调周期段的影响。
52、如权利要求49所述的声码器,其进一步包括选择类似语音段,其中合并所述类似语音段。
53、如权利要求49所述的声码器,其中所述对所述残余低频带语音信号进行时间弯曲的指令进一步包括使所述语音段相关,借此选择类似语音段。
54、如权利要求50所述的声码器,其中所述添加由所述第一与第二音调周期段形成的额外音调周期的指令包括:添加所述第一及第二音调周期段,以使所述第一音调周期段的影响增加且所述第二音调周期段的影响减少。
55、如权利要求29所述的声码器,其中所述低频带表示高达及包含4kHz的频带。
56、如权利要求29所述的声码器,其中所述高频带表示从约3.5kHz到约7kHz的频带。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US11/508,396 | 2006-08-22 | ||
US11/508,396 US8239190B2 (en) | 2006-08-22 | 2006-08-22 | Time-warping frames of wideband vocoder |
PCT/US2007/075284 WO2008024615A2 (en) | 2006-08-22 | 2007-08-06 | Time-warping frames of wideband vocoder |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101506877A true CN101506877A (zh) | 2009-08-12 |
CN101506877B CN101506877B (zh) | 2012-11-28 |
Family
ID=38926197
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2007800308129A Active CN101506877B (zh) | 2006-08-22 | 2007-08-06 | 对宽带声码器的帧进行时间弯曲 |
Country Status (10)
Country | Link |
---|---|
US (1) | US8239190B2 (zh) |
EP (1) | EP2059925A2 (zh) |
JP (1) | JP5006398B2 (zh) |
KR (1) | KR101058761B1 (zh) |
CN (1) | CN101506877B (zh) |
BR (1) | BRPI0715978A2 (zh) |
CA (1) | CA2659197C (zh) |
RU (1) | RU2414010C2 (zh) |
TW (1) | TWI340377B (zh) |
WO (1) | WO2008024615A2 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110415719A (zh) * | 2018-04-30 | 2019-11-05 | 西万拓私人有限公司 | 用于在音频信号中进行噪音抑制的方法 |
CN110634503A (zh) * | 2013-10-11 | 2019-12-31 | 高通股份有限公司 | 用于信号处理的方法和设备 |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7720677B2 (en) * | 2005-11-03 | 2010-05-18 | Coding Technologies Ab | Time warped modified transform coding of audio signals |
US9653088B2 (en) * | 2007-06-13 | 2017-05-16 | Qualcomm Incorporated | Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding |
CN100524462C (zh) | 2007-09-15 | 2009-08-05 | 华为技术有限公司 | 对高带信号进行帧错误隐藏的方法及装置 |
MX2010009932A (es) * | 2008-03-10 | 2010-11-30 | Fraunhofer Ges Forschung | Metodo y dispositivo para manipular una señal de audio que tiene un evento transitorio. |
US8768690B2 (en) | 2008-06-20 | 2014-07-01 | Qualcomm Incorporated | Coding scheme selection for low-bit-rate applications |
MY154452A (en) * | 2008-07-11 | 2015-06-15 | Fraunhofer Ges Forschung | An apparatus and a method for decoding an encoded audio signal |
ES2379761T3 (es) * | 2008-07-11 | 2012-05-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Proporcinar una señal de activación de distorsión de tiempo y codificar una señal de audio con la misma |
US8798776B2 (en) * | 2008-09-30 | 2014-08-05 | Dolby International Ab | Transcoding of audio metadata |
US8428938B2 (en) * | 2009-06-04 | 2013-04-23 | Qualcomm Incorporated | Systems and methods for reconstructing an erased speech frame |
JP5625076B2 (ja) * | 2010-03-10 | 2014-11-12 | フラウンホーファーゲゼルシャフトツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. | コーディングコンテキストのピッチ依存適合を用いた、オーディオ信号復号器、オーディオ信号符号化器、オーディオ信号を復号するための方法、オーディオ信号を符号化するための方法、およびコンピュータプログラム |
CN103098130B (zh) | 2010-10-06 | 2014-11-26 | 松下电器产业株式会社 | 编码装置、解码装置、编码方法以及解码方法 |
CN102201240B (zh) * | 2011-05-27 | 2012-10-03 | 中国科学院自动化研究所 | 基于逆滤波的谐波噪声激励模型声码器 |
JP6303340B2 (ja) * | 2013-08-30 | 2018-04-04 | 富士通株式会社 | 音声処理装置、音声処理方法及び音声処理用コンピュータプログラム |
TR201900472T4 (tr) * | 2014-04-24 | 2019-02-21 | Nippon Telegraph & Telephone | Frekans alanı parametre dizisi oluşturma metodu, kodlama metodu, kod çözme metodu, frekans alanı parametre dizisi oluşturma aparatı, kodlama aparatı, kod çözme aparatı, programı ve kayıt ortamı. |
ES2883848T3 (es) | 2014-05-01 | 2021-12-09 | Nippon Telegraph & Telephone | Codificador, descodificador, método de codificación, método de descodificación, programa de codificación, programa de descodificación y soporte de registro |
Family Cites Families (55)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2412987A1 (fr) * | 1977-12-23 | 1979-07-20 | Ibm France | Procede de compression de donnees relatives au signal vocal et dispositif mettant en oeuvre ledit procede |
US4570232A (en) * | 1981-12-21 | 1986-02-11 | Nippon Telegraph & Telephone Public Corporation | Speech recognition apparatus |
CA1204855A (en) * | 1982-03-23 | 1986-05-20 | Phillip J. Bloom | Method and apparatus for use in processing signals |
US5210820A (en) * | 1990-05-02 | 1993-05-11 | Broadcast Data Systems Limited Partnership | Signal recognition system and method |
JP3277398B2 (ja) * | 1992-04-15 | 2002-04-22 | ソニー株式会社 | 有声音判別方法 |
DE4324853C1 (de) | 1993-07-23 | 1994-09-22 | Siemens Ag | Spannungserzeugungsschaltung |
US5517595A (en) * | 1994-02-08 | 1996-05-14 | At&T Corp. | Decomposition in noise and periodic signal waveforms in waveform interpolation |
US5717823A (en) | 1994-04-14 | 1998-02-10 | Lucent Technologies Inc. | Speech-rate modification for linear-prediction based analysis-by-synthesis speech coders |
US5651371A (en) * | 1994-06-06 | 1997-07-29 | The University Of Washington | System and method for measuring acoustic reflectance |
US5787387A (en) * | 1994-07-11 | 1998-07-28 | Voxware, Inc. | Harmonic adaptive speech coding method and system |
US5598505A (en) * | 1994-09-30 | 1997-01-28 | Apple Computer, Inc. | Cepstral correction vector quantizer for speech recognition |
JP2976860B2 (ja) * | 1995-09-13 | 1999-11-10 | 松下電器産業株式会社 | 再生装置 |
EP0858650B1 (en) * | 1995-10-23 | 2003-08-13 | The Regents Of The University Of California | Control structure for sound synthesis |
TW321810B (zh) * | 1995-10-26 | 1997-12-01 | Sony Co Ltd | |
US5749073A (en) * | 1996-03-15 | 1998-05-05 | Interval Research Corporation | System for automatically morphing audio information |
US5828994A (en) * | 1996-06-05 | 1998-10-27 | Interval Research Corporation | Non-uniform time scale modification of recorded audio |
US6766300B1 (en) * | 1996-11-07 | 2004-07-20 | Creative Technology Ltd. | Method and apparatus for transient detection and non-distortion time scaling |
WO1999010719A1 (en) * | 1997-08-29 | 1999-03-04 | The Regents Of The University Of California | Method and apparatus for hybrid coding of speech at 4kbps |
US7072832B1 (en) * | 1998-08-24 | 2006-07-04 | Mindspeed Technologies, Inc. | System for speech encoding having an adaptive encoding arrangement |
US7272556B1 (en) * | 1998-09-23 | 2007-09-18 | Lucent Technologies Inc. | Scalable and embedded codec for speech and audio signals |
FR2786308B1 (fr) * | 1998-11-20 | 2001-02-09 | Sextant Avionique | Procede de reconnaissance vocale dans un signal acoustique bruite et systeme mettant en oeuvre ce procede |
US6691084B2 (en) * | 1998-12-21 | 2004-02-10 | Qualcomm Incorporated | Multiple mode variable rate speech coding |
US6456964B2 (en) * | 1998-12-21 | 2002-09-24 | Qualcomm, Incorporated | Encoding of periodic speech using prototype waveforms |
US7315815B1 (en) | 1999-09-22 | 2008-01-01 | Microsoft Corporation | LPC-harmonic vocoder with superframe structure |
US6842735B1 (en) * | 1999-12-17 | 2005-01-11 | Interval Research Corporation | Time-scale modification of data-compressed audio information |
JP2001255882A (ja) * | 2000-03-09 | 2001-09-21 | Sony Corp | 音声信号処理装置及びその信号処理方法 |
US6735563B1 (en) | 2000-07-13 | 2004-05-11 | Qualcomm, Inc. | Method and apparatus for constructing voice templates for a speaker-independent voice recognition system |
US6671669B1 (en) | 2000-07-18 | 2003-12-30 | Qualcomm Incorporated | combined engine system and method for voice recognition |
US6990453B2 (en) * | 2000-07-31 | 2006-01-24 | Landmark Digital Services Llc | System and methods for recognizing sound and music signals in high noise and distortion |
US6477502B1 (en) * | 2000-08-22 | 2002-11-05 | Qualcomm Incorporated | Method and apparatus for using non-symmetric speech coders to produce non-symmetric links in a wireless communication system |
US6754629B1 (en) | 2000-09-08 | 2004-06-22 | Qualcomm Incorporated | System and method for automatic voice recognition using mapping |
BR0107420A (pt) * | 2000-11-03 | 2002-10-08 | Koninkl Philips Electronics Nv | Processos de codificação de um sinal de entrada e de decodificação, sinal modificado modelado, meio de armazenagem, decodificador, reprodutor de áudio, e ,aparelho para codificação de sinais |
US7472059B2 (en) * | 2000-12-08 | 2008-12-30 | Qualcomm Incorporated | Method and apparatus for robust speech classification |
US20020133334A1 (en) * | 2001-02-02 | 2002-09-19 | Geert Coorman | Time scale modification of digitally sampled waveforms in the time domain |
US6999598B2 (en) * | 2001-03-23 | 2006-02-14 | Fuji Xerox Co., Ltd. | Systems and methods for embedding data by dimensional compression and expansion |
CA2365203A1 (en) | 2001-12-14 | 2003-06-14 | Voiceage Corporation | A signal modification method for efficient coding of speech signals |
US20030182106A1 (en) * | 2002-03-13 | 2003-09-25 | Spectral Design | Method and device for changing the temporal length and/or the tone pitch of a discrete audio signal |
US7254533B1 (en) * | 2002-10-17 | 2007-08-07 | Dilithium Networks Pty Ltd. | Method and apparatus for a thin CELP voice codec |
US7394833B2 (en) * | 2003-02-11 | 2008-07-01 | Nokia Corporation | Method and apparatus for reducing synchronization delay in packet switched voice terminals using speech decoder modification |
EP1604354A4 (en) * | 2003-03-15 | 2008-04-02 | Mindspeed Tech Inc | VOICE INDEX CONTROLS FOR CELP LANGUAGE CODING |
US7433815B2 (en) * | 2003-09-10 | 2008-10-07 | Dilithium Networks Pty Ltd. | Method and apparatus for voice transcoding between variable rate coders |
US7672838B1 (en) * | 2003-12-01 | 2010-03-02 | The Trustees Of Columbia University In The City Of New York | Systems and methods for speech recognition using frequency domain linear prediction polynomials to form temporal and spectral envelopes from frequency domain representations of signals |
US20050137730A1 (en) * | 2003-12-18 | 2005-06-23 | Steven Trautmann | Time-scale modification of audio using separated frequency bands |
CA2457988A1 (en) * | 2004-02-18 | 2005-08-18 | Voiceage Corporation | Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization |
US7710982B2 (en) | 2004-05-26 | 2010-05-04 | Nippon Telegraph And Telephone Corporation | Sound packet reproducing method, sound packet reproducing apparatus, sound packet reproducing program, and recording medium |
MY149811A (en) * | 2004-08-30 | 2013-10-14 | Qualcomm Inc | Method and apparatus for an adaptive de-jitter buffer |
US8085678B2 (en) * | 2004-10-13 | 2011-12-27 | Qualcomm Incorporated | Media (voice) playback (de-jitter) buffer adjustments based on air interface |
SG124307A1 (en) * | 2005-01-20 | 2006-08-30 | St Microelectronics Asia | Method and system for lost packet concealment in high quality audio streaming applications |
US8155965B2 (en) | 2005-03-11 | 2012-04-10 | Qualcomm Incorporated | Time warping frames inside the vocoder by modifying the residual |
US8355907B2 (en) | 2005-03-11 | 2013-01-15 | Qualcomm Incorporated | Method and apparatus for phase matching frames in vocoders |
EP1864281A1 (en) * | 2005-04-01 | 2007-12-12 | QUALCOMM Incorporated | Systems, methods, and apparatus for highband burst suppression |
US7945305B2 (en) * | 2005-04-14 | 2011-05-17 | The Board Of Trustees Of The University Of Illinois | Adaptive acquisition and reconstruction of dynamic MR images |
US7490036B2 (en) * | 2005-10-20 | 2009-02-10 | Motorola, Inc. | Adaptive equalizer for a coded speech signal |
US7720677B2 (en) * | 2005-11-03 | 2010-05-18 | Coding Technologies Ab | Time warped modified transform coding of audio signals |
CN100524462C (zh) * | 2007-09-15 | 2009-08-05 | 华为技术有限公司 | 对高带信号进行帧错误隐藏的方法及装置 |
-
2006
- 2006-08-22 US US11/508,396 patent/US8239190B2/en active Active
-
2007
- 2007-08-06 CN CN2007800308129A patent/CN101506877B/zh active Active
- 2007-08-06 RU RU2009110202/09A patent/RU2414010C2/ru active
- 2007-08-06 CA CA2659197A patent/CA2659197C/en active Active
- 2007-08-06 JP JP2009525687A patent/JP5006398B2/ja active Active
- 2007-08-06 WO PCT/US2007/075284 patent/WO2008024615A2/en active Application Filing
- 2007-08-06 BR BRPI0715978-1A patent/BRPI0715978A2/pt not_active Application Discontinuation
- 2007-08-06 EP EP07813815A patent/EP2059925A2/en not_active Withdrawn
- 2007-08-06 KR KR1020097005598A patent/KR101058761B1/ko active IP Right Grant
- 2007-08-13 TW TW096129874A patent/TWI340377B/zh not_active IP Right Cessation
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110634503A (zh) * | 2013-10-11 | 2019-12-31 | 高通股份有限公司 | 用于信号处理的方法和设备 |
CN110634503B (zh) * | 2013-10-11 | 2023-07-14 | 高通股份有限公司 | 用于信号处理的方法和设备 |
CN110415719A (zh) * | 2018-04-30 | 2019-11-05 | 西万拓私人有限公司 | 用于在音频信号中进行噪音抑制的方法 |
Also Published As
Publication number | Publication date |
---|---|
WO2008024615A3 (en) | 2008-04-17 |
CN101506877B (zh) | 2012-11-28 |
JP5006398B2 (ja) | 2012-08-22 |
BRPI0715978A2 (pt) | 2013-08-06 |
TW200822062A (en) | 2008-05-16 |
US8239190B2 (en) | 2012-08-07 |
WO2008024615A2 (en) | 2008-02-28 |
RU2414010C2 (ru) | 2011-03-10 |
CA2659197C (en) | 2013-06-25 |
RU2009110202A (ru) | 2010-10-27 |
US20080052065A1 (en) | 2008-02-28 |
TWI340377B (en) | 2011-04-11 |
EP2059925A2 (en) | 2009-05-20 |
CA2659197A1 (en) | 2008-02-28 |
KR20090053917A (ko) | 2009-05-28 |
KR101058761B1 (ko) | 2011-08-24 |
JP2010501896A (ja) | 2010-01-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101506877B (zh) | 对宽带声码器的帧进行时间弯曲 | |
RU2371784C2 (ru) | Изменение масштаба времени кадров в вокодере посредством изменения остатка | |
JP5373217B2 (ja) | 可変レートスピーチ符号化 | |
JP4824167B2 (ja) | 周期的スピーチコーディング | |
JP2010501896A5 (zh) | ||
EP1671317B1 (en) | A method and a device for source coding | |
CN101171626B (zh) | 通过修改残余对声码器内的帧进行时间扭曲 | |
JPH02160300A (ja) | 音声符号化方式 | |
Yaghmaie | Prototype waveform interpolation based low bit rate speech coding | |
Kwong et al. | Design and implementation of a parametric speech coder | |
Lukasiak | Techniques for low-rate scalable compression of speech signals | |
JPH08123493A (ja) | 符号励振線形予測音声符号化装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |