CN1295677C - 用于估算语音调制解调器中的模拟高频段信号的方法和系统 - Google Patents
用于估算语音调制解调器中的模拟高频段信号的方法和系统 Download PDFInfo
- Publication number
- CN1295677C CN1295677C CNB018175902A CN01817590A CN1295677C CN 1295677 C CN1295677 C CN 1295677C CN B018175902 A CNB018175902 A CN B018175902A CN 01817590 A CN01817590 A CN 01817590A CN 1295677 C CN1295677 C CN 1295677C
- Authority
- CN
- China
- Prior art keywords
- voice
- signal
- cycle
- coefficient
- input signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000000034 method Methods 0.000 title claims abstract description 45
- 230000000694 effects Effects 0.000 claims abstract description 17
- 230000008569 process Effects 0.000 claims abstract description 10
- 238000001914 filtration Methods 0.000 claims description 47
- 206010038743 Restlessness Diseases 0.000 claims description 35
- 238000012937 correction Methods 0.000 claims description 31
- 230000004044 response Effects 0.000 claims description 17
- 230000001172 regenerating effect Effects 0.000 claims description 5
- 230000003595 spectral effect Effects 0.000 claims description 5
- 238000001514 detection method Methods 0.000 claims 1
- 238000012544 monitoring process Methods 0.000 claims 1
- 238000005070 sampling Methods 0.000 description 19
- 230000005284 excitation Effects 0.000 description 17
- 238000001228 spectrum Methods 0.000 description 9
- 238000004422 calculation algorithm Methods 0.000 description 7
- 230000005540 biological transmission Effects 0.000 description 6
- 230000008859 change Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000001105 regulatory effect Effects 0.000 description 2
- 238000004088 simulation Methods 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000001915 proofreading effect Effects 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 230000008929 regeneration Effects 0.000 description 1
- 238000011069 regeneration method Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
- 210000001260 vocal cord Anatomy 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0364—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
Landscapes
- Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Abstract
一种用于编码和解码一个输入信号的方法和系统,其中在编码和解码处理中该输入信号被分成一个较高频段和一个较低频段,以及其中该较高频段的解码是通过使用随同从该较低频段得到的语音相关的参数的一个模拟信号来执行的。实际中,该模拟信号在较低和较高频段被转换到包括有色噪声的一个模拟宽频带信号之前被进行定标的。此外,话音活动信息用来确定该输入信号的语音周期和非语音周期。基于该话音活动信息,在语音周期和非语音周期,不同的加权系数被用来定标该模拟信号。
Description
技术领域
本发明一般涉及编码和解码综合语音的领域,特别涉及宽频带语音的这样的编码和解码。
背景技术
日前许多编码语音的方法是基于线性预测(LP)编码,其感性地直接从该语音信号的时间波形而不是从其频谱提取一个语音信号的主要特征(如被称为的频道声音编码器或被称为的共振峰声音编码器所进行的)。在LP编码中,首先分析(LP分析)一个语音波形,以确定引起语音信号并还引起一个传输函数的声道(Vocal track)激励的时变模式。接着一个解码器(在接收端,该编码语音信号是电信通信信号的情况下)使用通过模拟该声道的一个参数化系统传送该激励的综合器再生该原始语音。如发言者产生该语音信号那样,该声道模式的参数和该模式的激励两者被周期性地更新以适应在该发言者中出现的相应的变化。但是,在更新之间,即在任何说明间隔期间,该系统的激励和参数保持不变,并且用该模式执行的处理是一个线性时间无变度的处理。所有编码和解码(分布式)系统被称为编解码器。
在使用LP编码产生语音的一个编解码器中,该解码器需要提供三个输入的编码器:一个音调周期,如果该激励是有声(浊音)(voiced),一个增益系数和预测系数。(在某些编解码器中,例如,还提供该激励的特性,即它是否是有声(浊音)(voiced)的或无声(清音)(unvoiced)的,但是对于一种代数学的代码激励的线性预测(ACELP)编解码器一般是不需要的。)LP编码是预测的,原因在于在处理前向估算时,它基于施加该参数的话音波形(在一说明间隔期间)的实际输入段应用预测参数。
基本的LP编码和解码可以用来以相对低的数据率数字地传送语音,但是它产生综合的发声语音,这是由于使用了它的很简单的激励系统。一种所谓的代码激励的线性预测(CELP)编解码器是一种增强激励的编解码器。它是基于“残留”编码。该声道的模拟是借助于其参数在压缩的语音中被编码的数字滤波器。这些滤波器由一个信号驱动,即“被激励”,该信号表示原始发言者的声带的振动。音频语音信号的残留信号是(原始)音频语音信号,小于该数字滤波的音频语音信号。一个CELP编解码器编码该残留信号并使用它作为激励的基础,其中叫做“残留脉冲激励”。但是,在逐一取样(Sample-by-Sample)的基础上,CELP使用从一个预定波形模型组选择的一个波形模型来表示一个残留取样块。由该编码器确定的一个代码字提供到该解码器,该解码器接着使用该代码字选择一个残留序列来表示该原始的残留取样。
图1表示一个发射器/编码器系统的元件和一个接收器/解码器系统的元件。整个系统用作一个LP编解码器,并可以是一个CELP类型的编解码器。该发射器接收一个取样的语音信号s(n)并将其提供到对一个编解码器确定LP参数的分析器(反向滤波器和综合滤波器)。sq(n)是用来确定残留x(n)的反向滤波的信号。激励搜索模块为传输编码例如定量的或量化的误差xq(n)的残留x(n)和综合器参数两者,并将它们施加到引导到该接收器的一个通信频道。在接收器(解码系统)侧,一个解码器模块从传输的信号提取该综合器参数并将它们提供到一个综合器。该解码器模块还从该传输的信号确定定量的误差xq(n)。从该综合器的输出是同该定量误差xq(n)相组合的、用来产生表示原始语音信号s(n)的一个定量值sq(n)。
除了该误差xq(n)作为一个指数发送到表示适合用于近似误差(残留)x(n)的各种不同波形的一个代码簿中之外,发射器和接收器以类似方式使用一个CELP类型编解码器功能。
按奈奎斯特(Nyquist)理论,具有取样率Fs的一个语音信号能表示从0-0.5Fs的一个频段。现在,多数语音编解码器(编码器-解码器)使用8KHz的取样率。如果该取样率从8KHz增加,语音的逼真度将改进,因为能表示更高的频率。今天,该语音信号的取样率通常为8KIIz,但是开发的移动电话站将使用16KHz的取样率。按奈氏理论,16KHz的取样率能表示0-8KHz频段中的语音。被取样的语音接着由发射器用于通信,然后由接收器解码。使用16KHz的取样率取样的语音的语音编码被称为宽频带语音编码。
当语音的取样率增加时,编码复杂性也增加。用某些算法,当取样率增加时,编码的复杂性甚至能呈指数地增加。因此,在确定对宽频带语音编码的算法时,编码复杂性通常是一个限制因素。这是特别真实的,例如在移动电话站情况下,在那里功率损耗,可得到的处理功率,和存储器要求显著地影响算法的适用性。
有时在语音编码中,已知为抽取(decimation)的过程被用来降低该编码的复杂性。抽取将降低对一个序列的原始取样率到一个更低的取样率。这是已知的内插法的相反的过程。该抽取处理用一个低通滤波器滤波输入数据,然后用更低的取样率再取样该最后的被平滑的信号。内插法将增加对一个序列的原始取样率到更高的一个取样率。内插法将零插入该原始序列中,然后应用一个专门的低通滤波器用内插值去替换该零值。这样将增加取样数。
其他的现有技术宽频带语音编解码器通过使用子频段编码限制复杂性。在这样的一个子频段方法中,在编码一个宽频带信号前,它被分成两个信号,一个较低频段信号和一个较高频段信号。接着两个信号被单独编码。在该解码器中,在综合处理时,将重新组合该两个信号。在该编码算法的复杂性随取样率指数地增加的那些部分(例如搜索改革的代码簿),这样的一种方法将减小编码的复杂性。然而,在复杂性线性增加的部分,这样的一种方法不增加复杂性。
上面的子频段编码现有技术解决方案的编码复杂性可以通过忽略在该编码器中较高频段的分析和如图2中所示的通过在该解码器中用滤波的白噪声或滤波的伪随机噪声来取代它而进一步地被减小。较高频段的分析能被忽略乃是因为人类的听力对高频频段的相位响应是不灵敏的,而仅仅对幅度响应是灵敏的。另外的原因在于只有噪声类的无声音素在该较高频段中包含能量,而对于相位是重要的有声信号在该较高频段中没有多少能量。按这种近似,较高频段的频谱是用由该较低频段的LP滤波器形成的LP滤波器估算的。这样在传输频道上,没有该较高频率频段内容的信息传送,而较高频段LP综合滤波参数的形成是基于该较低频段。白噪声,一个模拟信号,被用作为对该较高频段滤波的一个源,而该噪声的能量是由该较低频段信号的特性来估算。因为对于该较低频段而言,编码器和解码器两者都识别激励,和长期预测器(LTP)以及固定的代码薄增量,所以有可能从这些参数来估算用于该较高频段的能量定标系数和LP综合滤波参数。按这种现有技术近似,宽频带白噪声的能量将均衡于较低频段激励的能量。因此,将计算该较低频段综合信号的倾斜。在该倾斜系数的计算中,最低频段被截止,而该均衡的宽频带白噪声信号被乘以倾斜系数。接着该宽频带噪声通过该LP滤波器滤波。最后该较低频段由该信号截上。由此,较高频段能量的定标是基于由能量定标器估算器较高频段能量定标系数,而该较高频段LP综合滤波是基于由一个LP滤波估算器提供的较高频段LP综合滤波参数,而不管该输入信号是否为语音或背景噪声。然而这种近似适合于仅包含语音的处理信号,当输入信号包含背景噪声,特别是在非语音周期期间将不起作用。
所需要的是一种包含背景噪声的输入信号的宽带语音编码的方法,其中与编码全宽带语音信号的复杂性相比,该方法将降低复杂性,不管使用的具体编码算法,在表示语音信号方面还提供基本相同的优等的精确度。
发明内容
本发明采用话音(voice)活动信息的优点区分一个输入信号的语音和非语音周期,以便当估算该输入信号的较高频段的能量定标系数和线性预测(LP)综合滤波参数时考虑该输入信号中背景噪声的影响。
因此,本发明的第一方面是语音编码方法用于编码和解码具有语音周期和非语音周期的输入信号,并且提供具有较高频率分量和较低频率分量的合成语音,该输入信号包括在语音周期中的第一信号和在非语音周期中的第二信号,该输入信号在编码期间被分成一个较高频段和一个较低频段,其中在该输入信号中的该较低频段的语音相关参数被用来处理一个模拟信号以提供该合成语音的该较高频率分量,所说方法包括步骤:基于表示该第一和第二信号的话音活动信息定标在该语音周期中的该模拟信号。
该方法进一步包括:
基于表示该第一信号的语音相关参数,定标和综合滤波在该语音周期中的该模拟信号;以及
基于表示该第二信号的语音相关参数,定标和综合滤波在该非语音周期中的该模拟信号,其中该第一信号包括一个语音信号,和该第二信号包括一个噪声信号。
最好,还基于由该综合的语音的较低频率分量计算的一个频谱倾斜系数定标和综合滤波在该语音周期中的该模拟信号。
最好,当该输入信号包括背景噪声时,基于该背景噪声的一个校正系数,进一步定标和综合滤波在该语音周期中的该模拟信号。
最好,基于该背景噪声的校正系数进一步定标和综合滤波在该非语音周期中的该模拟信号。
最好,话音活动信息用来指示该第一和第二信号周期。
本发明的第二方面是一个语音信号发射器和接收器系统,用于编码和解码具有语音周期和非语音周期的一个输入信号和提供具有较高频率分量和较低频率分量的合成语音,其中该输入信号在编码期间被分成一个较高频段和一个较低频段中,和其中该输入信号的较低频段的语音相关参数用来处理一个模拟信号以提供该合成语音的该较高频率分量,和其中该输入信号包括在该语音周期中的一第一信号和在该非语音周期中的一第二信号。该系统的特征在于:
一个解码器,用于接收该编码的输入信号和用于提供语音相关参数;
一能量标定估算器,响应该语音相关参数,用于提供一个能量定标系数以定标该模拟信号;
一个线性预测滤波估算器,响应该语音相关参数,用于综合滤波该模拟信号;以及
一个信息提供装置,用于提供关于该语音和非语音周期的信息,使得用于该语音周期和该非语音周期的能量定标系数分别基于表示该语音和非语音信号来估算。
最好,该信息提供机构能提供一第一加权校正系数用于该语音周期和一个不同的第二加权校正系数用于该非语音周期,以便基于该第一和第二加权校正系数允许该能量定标估算器提供能量标定系数。
最好,综合滤波在该语音周期和非语音周期中的该模拟信号也是分别基于该第一加权校正系数和该第二加权校正系数。
最好,该语音相关参数包括表示该第一信号的线性预测编码系数。
本发明的第三方面是一个用于合成语音的解码器,该合成语音具有来自编码的数据的较高频率分量和较低频率分量,该编码的数据指示具有语音周期和非语音周期的一个输入信号,该输入信号在该编码期间被分成一个较高频段和一个较低频段,其中该编码的数据包括在该输入信号中的该较低频段的语音参数,其被用来处理一个模拟信号,以便提供该合成语音的该较高频率分量,该解码器的特征在于:
一个能量定标估算器,响应该语音参数,用于提供第一能量定标系数以定标在该语音周期中的该模拟信号和第二能量定标系数以定标在该非语音周期中的该模拟信号;以及
一个综合滤波估算器,提供多个滤波参数以综合滤波该模拟信号。
最好,该解码器还包括一个装置,用于监视该语音周期和非语音周期以允许该能量定标估算器由此改变该能量定标系数。
本发明的第四方面是一个移动站,配置来接收一个包含表示一个输入信号的语音数据的编码的位流,该输入信号包括在语音周期中的第一信号以及在非语音周期中的第二信号,该输入信号在编码期间被分成一个较高频段和一个较低频段,其中该语音数据包括由在该第一信号中的该较低频段得到的语音相关参数,所说移动站包括:
第一装置,响应于该编码的位流,用于使用该语音相关参数解码该较低频段;
第二装置,响应于该编码的位流,用于由一个模拟信号再生该较高频段;
第三装置,响应于该语音数据,用于得到有关该语音和非语音周期的话音活动信息;以及
一个能量定标估算器,响应于该话音活动信息,用于提供第一能量定标系数和第二能量定标系数,以基于该语音周期和非语音周期定标该模拟信号。
该移动站还包括预测滤波估算器,响应该语音相关参数和语音周期信息,用于提供基于该第一信号的多个第一线性预测滤波参数和用于滤波该模拟信号的多个第二线性预测滤波参数。
本发明的第五方面是一个电信通信网络的元件,配置来接收包含表示来自一个移动站的一个输入信号的语音数据的编码的位流,该输入信号包括在语音周期中的第一信号以及在非语音周期中的第二信号,该输入信号被分成一个较高频段和一个较低频段,其中该语音数据包括从该输入信号中的该较低频段得到的语音相关参数,所说元件包括:
第一装置,用于使用该语音相关参数解码该较低频段;
第二装置,用于由一个模拟信号再生该较高频段;
第三装置,响应该语音数据,提供关于该语音和非语音周期的信息;
能量定标估算器,响应该语音周期信息,用于提供基于该第一信号的第一能量定标系数和基于该第二信号的第二能量定标系数用于定标该模拟信号。
该元件还包括预测滤波估算器,响应该语音相关参数和语音周期信息,用于提供基于该第一信号的多个第一线性预测滤波参数和用于滤波该模拟信号的多个第二线性预测滤波参数。
本发明的第六方面是一种对编码的数据进行解码的方法,该编码的数据表示具有语音周期和非语音周期的输入信号以提供合成语音,合成语音包括较高频率分量和较低频率分量,该输入信号在编码期间被分成一个较高频段和一个较低频段,其中编码的数据包括在该输入信号中的该较低频段的语音相关参数,所述语音相关参数被用来处理一个模拟信号以提供该合成语音的该较高频率分量,所说方法包括步骤:
提供第一能量定标系数以用于定标语音周期中的该模拟信号和提供第二能量定标系数以定标在非语音周期中的该模拟信号;
提供多个滤波参数以综合滤波该模拟信号。
根据结合图3-6阅读该说明书本发明将成为显而易见。
附图说明
图1是说明使用一个线性预测编码器和解码器的发射器和接收器的图解表示。
图2是说明现有技术的CELP语音编码器和解码器的图解表示,其中白噪声用作对较高频段滤波。
图3是说明按本发明的较高频段解码器的图解表示。
图4是说明按输入信号中噪声水平的加权计算的流程图。
图5是说明一个移动站的图解表示,该移动站包括按本发明的一个解码器。
图6是说明使用按本发明的一个解码器的电信通信网络的图解表示。
具体实施万式
如图3中所示,使用一个较高频段解码器10基于由类似于如图2中所示的由现有技术较高频段解码器采用的方法的较低频段解码器2产生的该较低频段参数102提供一个较高频段能量定标系数140和多个较高频段线性预测(LP)综合滤波参数142。如在图2中所示,在现有技术编解码器中,一个分样装置用来将该宽带输入信号改变到一个较低频段语音输入信号中,和一个较低频段编码器用来分析一个较低频段语音输入信号以提供多个编码的语音参数。包括一个线性预测编码(LPC)信号的编码的参数,关于该LP滤波器和激励的信息通过传输频道传送到使用一个语音解码器以再现该输入语音的一个接收端。在该解码器中,该较低频段语音信号由一个较低频段解码器综合。实际中,该综合的较低频段语音信号包括由一个LB分析-综合(Analysis-by-Synthesis)(A-b-S)模件(未示)提供的该较低频段激励exc(n)。接着,用内插法提供一个只在该较低频段中包含能量的综合的宽带语音信号到一个求和装置。关于在较高频段中再生该语音信号,该较高频段解码器包括一个能量定标器估算器,一个LP滤波估算器,一个定标模件,和一个较高频段LP综合滤波模件。如所示的那样,该能量定标器估算器提供一个较高频段定标系数,或增益,到该定标模件,而该LP滤波估算器提供一个LP滤波器矢量,或一组较高频段LP综合滤波参数。使用该能量定标系数,该标定模件定标如由该白噪声发生器提供的该模拟信号的能量到一个适当的电平。该较高频段LP综合滤波模件将适当定标的白色噪声转换到在该较低和较高两频段中包含有色噪声(colored noise)的一个模拟宽带信号。之后,一个高通滤波器被用来向该求和装置提供仅在该较高频段包含有色噪声的一个模拟宽带信号,以便在整个宽带中产生该综合的语音。
在本发明中,如图3中所示的,该白噪声,或该模拟信号e(n)也由一个白噪声振荡器4产生。然而在如图2中所示的现有技术的解码器中,较高频段的背景噪声是使用与估算该较高频段语音信号的相同的算法估算的。由于背景噪声的频谱通常比语音的频谱更平缓,所以在该综合的背景噪声条件下对于该较高频段而言现有技术方法产生很小的能量。按本发明,两组能量定标器估算器和两组LP滤波定标器用在该较高频段解码器10中。如图3所示,能量定标器估算器20和LP滤波器估算器22用于该语音周期,而能量定标器计算器30和LP滤波器估算器32用于非语音周期,所有基于由相同较低频段解码器2提供的该较低频段参数102。特别地,能量定标器估算器20假定信号是语音和由此估算该较高频段能量,而LP滤波估算器22设计来模拟一个语音信号。类似地,能量定标器估算器30假定信号是背景噪声和在该假定下估算该较高频段能量,而LP滤波估算器32设计来模拟一个背景噪声信号。因此该能量定标器估算器20用来提供用于语音周期的较高频段能量定标系数120到一个加权调节模件24,而该能量定标器30用来提供用于非语音周期的较高频段能量定标系数130到一个加权调节模件34。该LP滤波估算器22用来提供较高频段LP综合滤波参数122到用于该语音周期的一个加权调节模块26,和LP滤波估算器32用来提供较高频段LP综合滤波参数132到用于该非语音周期的一个加权调节模件36。一般地,该能量定标估算器30和该LP滤波估算器32假定该频谱是平缓的和该能量标定系数是大的,如果与由能量定标器估算器20和LP滤波估算器30所假定的相比较的话。如果信号包括语音和背景噪声两者,则使用两组估算器,但最终的估算是基于较高频段能量定标系数120,130的加权的平均和该较高频段LP综合滤波参数122,132的加权的平均。
为了改变在一个背景噪声和一个语音模式之间的较高频段参数估算算法的加权,基于该语音和背景噪声信号具有可分别的特性的事实,加权计算模件18使用话音活动信息106和解码的较低频段语音信号作为它的输入并且在非语音周期期间通过设置一个加权系数αn用于噪声处理和一个加权系数αs用于语音处理使用该输入来监视背景噪声的电平,这里,αn+αs=1。应指出话音活动信息106是由一个话音活动检测器(VAD,未示)提供的,在现有技术中是已知的。该话音活动信息106用来区分该解码的语音信号108的哪部分是来自该语音周期,而哪一部分是来自非语音周期。该背景噪声在语音暂停或非语音周期期间能进行监视。要指出的是,在该话音活动信息未在该传输频道上送到该解码器的情况下,有可能分析该解码的语音信号108以便区分该非语音周期和该语音周期。当存在检测的明显的背景噪声电平时,则如图4中所示的通过增加该加权校正系数an和减小该加权校正系数as,对于该背景噪声加权着重向着该较高频段发生。例如,该加权可按语音能量与噪声能量的实际比例(SNR)来进行。这样,对于语音周期,加权计算模件18对该语音周期提供一个加权校正系数116,或as到该加权调节模件24,26以及对于非语音周期提供一个不同的加权校正系数118,或an到该加权调节模件34,36。例如,通过分析在该非语音周期期间包含在信号102中的综合信号的功率可以求出该背景噪声的功率。通常,该功率电平十分稳定并能考虑成一个常数。因此,SNR是综合的语音信号的功率对背景噪声功率的对数值。借助该加权校正系数116和118,对于语音周期该加权调节模件24提供一个较高频段能量定标系数124,而对于非语音周期该加权调节模件34提供一个较高频段能量定标系数134到求和模件40。求和模件40提供一个较高频段能量定标系数140用于语音和非语音周期。同样地,对于该语音周期,加权调节模件26提供较高频段LP综合滤波参数126,而加权调节模件36提供较高频段LP综合滤波参数136到求和装置42。基于这些参数,该求和装置42提供较高频段LP综合滤波参数142用于该语音和非语音周期。如在图2中所示的,类似于现有技术较高频段编码器中的它们的对应物,一个定标模件50适当地定标如由白噪声发生器4所提供的该模拟信号104的能量,而一个较高频段LP综合滤波模件52在该较低的和较高的频段将该白噪声转换到包含有色噪声的一个模拟宽带信号152中。由参考数150指示具有能量被适当定标的该模拟信号。
实施本发明的一个方法是基于来自该能量定标器估算器20的较高频段能量定标系数120增加该较高频段的背景噪声能量。这样,该较高频段能量定标系数130能简化为该较高频段能量定标系数120乘以一个固定的校正系数Ccorr。例如,如果由该能量定标器估算器20使用的倾斜系数Ctilt是0.5,而校正系数Ccorr=2.0,则该求和的较高频段能量系数140,或αsum,能按下列等式计算:
αsum=αsctilt+αnctiltccorr (1)如果该加权校正系数116,或αs,对仅语音设置为1.0,对仅噪声为0.0,对具有低电平背景噪声的语音为0.8,和对具有高电平背景噪声的语音为0.5,则求和的较高频段能量系数αsum被给出为:
αsum=1.0×0.5+0.0×0.5×2.0=0.5(对仅语音)
αsum=0.0×0.5+1.0×0.5×2.0=1.0(对仅噪声)
αsum=0.8×0.5+0.2×0.5×2.0=0.6(对具有低背景噪声的语音)
αsum=0.5×0.5+0.5×0.5×2.0=0.75(对具有高背景噪声的语音)在图5中说明示例性实施。该简单过程可通过校正该较高频段的能量提高该综合语音的质量。在此使用校正系数Ccorr乃是因为背景噪声的频谱通常比语音的频谱更平缓。在语音周期中,该校正系数Ccorr的作用并不像在非语音周期中那样明显,这是由于Ctilt值低。在该情况下,如在现有技术中那样设计Ctilt值用于语音信号。
根据背景噪声的平缓性,有可能自适应地改变该倾斜系数。在一个语音信号中,倾斜定义为频域能量的一般斜率。一般地,一个倾斜系数是由较低频段综合信号计算的并和均衡宽带模拟信号相乘。该倾斜系数通过使用下列等式计算第一自相关系数γ进行估算:
r={sT(n)s(n-l)}/{sT(n)s(n)} (2)其中s(n)是综合语音信号。因此,估算的倾斜系数Ctilt由Ctilt=1.0-γ确定,其中0.2≤Ctilt≤1.0,和上标T指示一个矢量的移项。
也有可能由LPC激励exc(n)和该滤波的模拟信号e(n)估算该定标系数如下:
escaled=sqrt[{excT(n)exc(n)}/{eT(n)e(n)}]e(n) (3)该定标系数sqrt[{excT(n)exc(n)}/{eT(n)e(n)}]由参考数140指示,和定标的白噪声escaled由参考数150指示。LPC激励,滤波的模拟信号和倾斜系数能包含在信号102中。
应指出在语音周期的LPC激励exc(n)不同于在非语音周期。由于在语音周期中较低频段信号和较高频段信号之间的特性关系不同于非语音周期,所以希望通过将倾斜系数Ctilt乘校正系数Ccorr来增加较高频段的能量。在上述例中(图4),Ccorr选择为一个常数2.0。但应选择校正系数Ccorr使得0.1≤CtiltCcorr≤1.0。如果能量定标器估算器120的输出信号120是Ctilt,则能量定标器估算器130的输出信号130是CtiltCcorr。
当背景噪声不存在时,对噪声该LP滤波估算器32的一种实施是形成较高频段更平缓的频谱。能通过在形成的宽带LP滤波器之后附加一个加权滤波器
得到,这里
是该量化的LP滤波器和oβ1≥β2>1。例如,αsum=αsβ1+αnβ2Ccorr,其中
β1=0.5,β2=0.5(对仅语音)
β1=0.8,β2=0.5(对仅噪声)
β1=0.56,β2=0.46(对具有低背景噪声的语音)
β1=0.65,β2=0.40(对具有高背景噪声的语音)应指出当β1和β2之间的差越大时,频谱越平缓,而加权滤波器消除该LP滤波器的影响。
图5表示按本发明一示例性实施例的一个移动站200的方块图。该移动站包括装置的典型部件,例如麦克风201,键盘207,显示器206,耳机214,收/发开关208,天线209和控制单元205。此外,该图表示一个移动站的典型的发射和接收块。发射块204包括一个编码器221,用于编码语音信号。该发射块204还包括频道编码,辨认和调制要求的操作以及RF功能,为清楚起见在图5中未画出。接收块211还包括本发明的一个解码块220。解码块220包括一个像图3中所示的较高频段解码器10的较高频段解码器222。从麦克风201输入、在放大级202放大并在A/D转换器中数字化的信号被送到发射块204,典型地是送到由该发射块包括的语音编码装置。由该发射块调制和放大的经处理的发送信号通过收/发开关208送到天线209。从天线接收的信号通过该收/发开关208送到接收块211,其解调接收的信号并解码该辨认和该频道编码。最后的语音信号通过D/A转换器212送到一个放大器213并进而送到耳机214。控制单元205控制移动站200的操作,读出由用户从键盘207给出的控制命令和借助显示器206给出消息到该用户。
按本发明的较高频段解码器10也可以用在一个电信通信网络300中,例如一个普通的电话网络或移动站中,例如GSM网络。图6表示这种电信网络的一个方块图。例如,电信通信网络300可包括电话交换机或相应的切换系统360,电信网络的普通电话370,基站340,基站控制器350和其他控制装置355都与其相连接。移动站330可以通过基站340建立对该电信通信网络的连接。包括类似于图3中所示的较高频段解码器10的一个较高频段解码器322的解码块320例如可以特别有利地放置在基站340中。然而,例如该解码块320也可放置在基站控制器350或其他的控制或切换装置355中。如果移动站系统例如在该基站和该基站控制器之间使用分开的传输编码器用于将占该无线电频道优势的编码信号转换到在一个电信通信系统中传送的典型的64Kbit/s的信号和反过来也一样,则该解码块320也配置在这样的一个传输编码器中。一般包括较高频段解码器322的解码块320可以放置在电信通信网络300的任一元件中,该电信通信网络300将编码的数据流转换到一个未编码的数据流。解码块320解码和滤波从移动站330输入的编码的语音信号,之后该语音信号可按通常的方式传送为在该电信通信网络300中的自由传送的信号。
本发明可应用到CELP型语音编解码器并还适用于其他类型的语音编解码器。此外,如图3中所示,有可能使用在该解码器中,仅一个能量定标器估算器估算较高频段能量,或一个LP滤波器估算器模拟语音和背景噪声。
这样,虽然本发明已相对一个其最佳实施例作了描述,本专业技术人员将理解可以进行其形式和细节上的上述的和不同的其他的改变,省略和偏离而不脱离本发明的精神和范围。
Claims (37)
1.一种语音编码的方法,用于编码和解码一个具有语音周期和非语音周期的输入信号以提供具有较高频率分量和较低频率分量的合成语音,该输入信号包括在语音周期中的第一信号和在非语音周期中的第二信号,该输入信号在编码期间被分成一个较高频段和一个较低频段,其中在该输入信号中的该较低频段的语音相关参数被用来处理一个模拟信号以提供该合成语音的该较高频率分量,所说方法包括步骤:
基于表示该第一和第二信号的话音活动信息定标在该语音周期中的该模拟信号。
2.权利要求1的方法,进一步包括步骤:
基于表示该第一信号的该语音相关参数综合滤波在该语音周期中的模拟信号;以及
基于表示该第二信号的该语音相关参数综合滤波在该非语音周期中的模拟信号。
3.权利要求1的方法,其中该第一信号包括一个语音信号和该第二信号包括一噪声信号。
4.权利要求3的方法,其中该第一信号还包括该噪声信号。
5.权利要求1的方法,其中该语音周期和该非语音周期基于该输入信号由一个话音活动检测装置定义。
6.权利要求1的方法,其中该语音相关参数包括表示该第一信号的线性预测编码系数。
7.权利要求1的方法,其中在该语音周期中的该模拟信号的定标是进一步基于由该合成语音的该较低频率分量计算的一个频谱倾斜系数。
8.权利要求7的方法,其中该输入信号包括一个背景噪声,和其中在该语音周期中的该模拟信号的定标是进一步基于该背景噪声的一个校正系数。
9.权利要求8的方法,其中在非语音周期中的该模拟信号的定标是进一步基于该校正系数。
10.权利要求1的方法,其中至少通过抽取将该输入信号分成一个较高频段和一个较低频段。
11.权利要求10的方法,其中还通过滤波将该输入信号分成一个较高频段和一个较低频段。
12.一个语音信号发射器和接收器系统,用于编码和解码具有语音周期和非语音周期的一个输入信号以提供具有较高频率分量和较低频率分量的合成语音,该输入信号在编码期间被分成一个较高频段和一个较低频段,其中在该输入信号中的该较低频段的语音相关参数被用来处理一个模拟信号以提供该合成语音的该较高频率分量,所说系统包括:
一个解码器,用于接收该编码的输入信号和用于提供该语音相关参数;
一个能量定标估算器,响应于该语音相关参数,用于提供一个能量定标系数以定标该模拟信号;
一个线性预测滤波部件,响应于该语音相关参数以综合滤波该模拟信号;以及
信息提供装置,用于提供关于该语音和非语音周期的信息,使得用于该语音周期和该非语音周期的能量定标系数分别基于表示该语音和非语音信号的信息来估算。
13.权利要求12的系统,其中该信息提供装置基于该输入语音的话音活动信息监视该语音和非语音周期。
14.权利要求12的系统,其中该信息提供装置能为该语音周期提供一个第一加权校正系数和为非语音周期提供一个不同的第二加权校正系数,以便允许该能量定标估算器基于该第一和第二加权校正系数提供该能量定标系数。
15.权利要求14的系统,其中综合滤波在该语音周期和该非语音周期中的该模拟信号是分别基于该第一加权校正系数和该第二加权校正系数。
16.权利要求12的系统,其中该输入信号包括在该语音周期中的第一信号和在该非语音周期中的第二信号,和其中该第一信号包括一个语音信号和该第二信号包括一个噪声信号。
17.权利要求16的系统,其中该第一信号还包括该噪声信号。
18.权利要求12的系统,其中该语音相关参数包括表示该第一信号的线性预测编码系数。
19.权利要求12的系统,其中用于该语音周期的该能量定标系数也由该合成语音的该较低频率分量的频谱倾斜系数估算。
20.权利要求19的系统,其中该输入信号包括一个背景噪声,和其中用于该语音周期的该能量定标系数还由该背景噪声的一个校正系数估算。
21.权利要求20的系统,其中用于该非语音周期的能量定标系数进一步由该校正系数估算。
22.一个用于合成语音的解码器,该合成语音具有来自编码的数据的较高频率分量和较低频率分量,该编码的数据指示具有语音周期和非语音周期的一个输入信号,该输入信号在该编码期间被分成一个较高频段和一个较低频段,其中该编码的数据包括在该输入信号中的该较低频段的语音参数,其被用来处理一个模拟信号,以便提供该合成语音的该较高频率分量,所说解码器包括:
一个能量定标估算器,响应于该语音参数,用于提供一第一能量定标系数以定标在该语音周期中的该模拟信号,和第二能量定标系数用于定标在该非语音周期中的该模拟信号;以及
一个综合滤波部件,用于提供多个滤波参数以综合滤波该模拟信号。
23.权利要求22的解码器,还包括用于监视该语音周期和该非语音周期的装置。
24.权利要求22的解码器,其中该输入信号包括在语音周期中的第一信号和在非语音周期中的第二信号,其中该第一能量定标系数基于该第一信号估算,而第二能量定标系数基于该第二信号估算。
25.权利要求24的解码器,其中用于该语音周期和该非语音周期的滤波参数分别由该第一和第二信号估算。
26.权利要求24的解码器,其中该第一能量定标系数进一步基于该合成语音的该较低频率分量的频谱倾斜系数估算。
27.权利要求24的解码器,其中该第一信号包括背景噪声,和其中该第一能量定标系数进一步基于该背景噪声的一个校正系数估算。
28.权利要求27的解码器,其中该第二能量定标系数进一步由该校正系数估算。
29.一个移动站,配置来接收一个包含表示一个输入信号的语音数据的编码的位流,该输入信号包括在语音周期中的第一信号以及在非语音周期中的第二信号,该输入信号在编码期间被分成一个较高频段和一个较低频段,其中该语音数据包括由在该第一信号中的该较低频段得到的语音相关参数,所说移动站包括:
第一装置,响应于该编码的位流,用于使用该语音相关参数解码该较低频段;
第二装置,响应于该编码的位流,用于由一个模拟信号再生该较高频段;
第三装置,响应于该语音数据,用于得到有关该语音和非语音周期的话音活动信息;以及
一个能量定标估算器,响应于该话音活动信息,用于提供第一能量定标系数和第二能量定标系数,以基于该语音周期和非语音周期定标该模拟信号。
30.权利要求29的移动站,还包括:
一个预测滤波部件,响应于该语音相关参数和话音活动信息,用于提供基于该第一信号的多个第一线性预测滤波参数和用于滤波该模拟信号的多个第二线性预测滤波参数。
31.一个电信通信网络的元件,配置来接收包含表示来自一个移动站的一个输入信号的语音数据的编码的位流,该输入信号包括在语音周期中的第一信号以及在非语音周期中的第二信号,该输入信号被分成一个较高频段和一个较低频段,其中该语音数据包括从该输入信号中的该较低频段得到的语音相关参数,所说元件包括:
第一装置,用于使用该语音有关参数解码该较低频段;
第二装置,用于由一个模拟信号再生该较高频段;
第三装置,响应于该语音数据,用于提供有关该语音和非语音周期的信息;以及
一个能量定标估算器,响应于该语音周期信息,用于提供基于该第一信号的第一能量定标系数和基于第二信号的第二能量定标系数以定标该模拟信号。
32.权利要求31的元件,还包括:
一个预测滤波部件,响应于该语音相关参数和该语音周期信息,用于提供基于该第一信号的多个第一线性预测滤波参数和多个第二线性预测滤波参数以滤波该模拟信号。
33.一种对编码的数据进行解码的方法,该编码的数据表示具有语音周期和非语音周期的输入信号以提供合成语音,合成语音包括较高频率分量和较低频率分量,该输入信号在编码期间被分成一个较高频段和一个较低频段,其中编码的数据包括在该输入信号中的该较低频段的语音相关参数,所述语音相关参数被用来处理一个模拟信号以提供该合成语音的该较高频率分量,所说方法包括步骤:
提供第一能量定标系数以用于定标语音周期中的该模拟信号和提供第二能量定标系数以定标在非语音周期中的该模拟信号;
提供多个滤波参数以综合滤波该模拟信号。
34.权利要求33的方法,其中该输入信号包括在语音周期中的第一信号和在非语音周期中的第二信号,其中基于该第一信号估计第一能量定标系数,和基于第二信号估计第二能量定标系数。
35.权利要求34的方法,其中由该第一信号估计语音周期的滤波参数和由第二信号估计非语音周期的滤波参数。
36.权利要求34的方法,其中该第一能量定标系数进一步基于该合成语音的该较低频率分量的频谱倾斜系数来估算。
37.权利要求34的方法,其中该第一信号包括背景噪声,和其中该第一能量定标系数进一步基于该背景噪声的一个校正系数来估算。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US09/691,323 US6691085B1 (en) | 2000-10-18 | 2000-10-18 | Method and system for estimating artificial high band signal in speech codec using voice activity information |
US09/691,323 | 2000-10-18 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1484824A CN1484824A (zh) | 2004-03-24 |
CN1295677C true CN1295677C (zh) | 2007-01-17 |
Family
ID=24776068
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB018175902A Expired - Lifetime CN1295677C (zh) | 2000-10-18 | 2001-08-31 | 用于估算语音调制解调器中的模拟高频段信号的方法和系统 |
Country Status (15)
Country | Link |
---|---|
US (1) | US6691085B1 (zh) |
EP (2) | EP1328927B1 (zh) |
JP (2) | JP4302978B2 (zh) |
KR (1) | KR100544731B1 (zh) |
CN (1) | CN1295677C (zh) |
AT (1) | ATE362634T1 (zh) |
AU (1) | AU2001284327A1 (zh) |
BR (1) | BRPI0114706B1 (zh) |
CA (1) | CA2426001C (zh) |
DE (1) | DE60128479T2 (zh) |
DK (1) | DK1328927T3 (zh) |
ES (1) | ES2287150T3 (zh) |
PT (1) | PT1328927E (zh) |
WO (1) | WO2002033696A1 (zh) |
ZA (1) | ZA200302465B (zh) |
Families Citing this family (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1735927B (zh) * | 2003-01-09 | 2011-08-31 | 爱移通全球有限公司 | 用于高质量语音编码转换的方法和装置 |
KR100940531B1 (ko) | 2003-07-16 | 2010-02-10 | 삼성전자주식회사 | 광대역 음성 신호 압축 및 복원 장치와 그 방법 |
KR20050027179A (ko) * | 2003-09-13 | 2005-03-18 | 삼성전자주식회사 | 오디오 데이터 복원 방법 및 그 장치 |
WO2006025337A1 (ja) * | 2004-08-31 | 2006-03-09 | Matsushita Electric Industrial Co., Ltd. | ステレオ信号生成装置およびステレオ信号生成方法 |
KR100707174B1 (ko) | 2004-12-31 | 2007-04-13 | 삼성전자주식회사 | 광대역 음성 부호화 및 복호화 시스템에서 고대역 음성부호화 및 복호화 장치와 그 방법 |
DE602006009215D1 (de) * | 2005-01-14 | 2009-10-29 | Panasonic Corp | Audioumschaltungsvorrichtung und -methode |
US7813931B2 (en) * | 2005-04-20 | 2010-10-12 | QNX Software Systems, Co. | System for improving speech quality and intelligibility with bandwidth compression/expansion |
US8249861B2 (en) * | 2005-04-20 | 2012-08-21 | Qnx Software Systems Limited | High frequency compression integration |
US8086451B2 (en) * | 2005-04-20 | 2011-12-27 | Qnx Software Systems Co. | System for improving speech intelligibility through high frequency compression |
US7546237B2 (en) | 2005-12-23 | 2009-06-09 | Qnx Software Systems (Wavemakers), Inc. | Bandwidth extension of narrowband speech |
KR100653643B1 (ko) * | 2006-01-26 | 2006-12-05 | 삼성전자주식회사 | 하모닉과 비하모닉의 비율을 이용한 피치 검출 방법 및피치 검출 장치 |
DE602007013026D1 (de) * | 2006-04-27 | 2011-04-21 | Panasonic Corp | Audiocodierungseinrichtung, audiodecodierungseinrichtung und verfahren dafür |
JP4967618B2 (ja) * | 2006-11-24 | 2012-07-04 | 富士通株式会社 | 復号化装置および復号化方法 |
EP3629328A1 (en) * | 2007-03-05 | 2020-04-01 | Telefonaktiebolaget LM Ericsson (publ) | Method and arrangement for smoothing of stationary background noise |
CN100524462C (zh) * | 2007-09-15 | 2009-08-05 | 华为技术有限公司 | 对高带信号进行帧错误隐藏的方法及装置 |
CN100555414C (zh) * | 2007-11-02 | 2009-10-28 | 华为技术有限公司 | 一种dtx判决方法和装置 |
KR101444099B1 (ko) * | 2007-11-13 | 2014-09-26 | 삼성전자주식회사 | 음성 구간 검출 방법 및 장치 |
KR101235830B1 (ko) * | 2007-12-06 | 2013-02-21 | 한국전자통신연구원 | 음성코덱의 품질향상장치 및 그 방법 |
CN103187065B (zh) | 2011-12-30 | 2015-12-16 | 华为技术有限公司 | 音频数据的处理方法、装置和系统 |
JP5443547B2 (ja) * | 2012-06-27 | 2014-03-19 | 株式会社東芝 | 信号処理装置 |
ES2881672T3 (es) * | 2012-08-29 | 2021-11-30 | Nippon Telegraph & Telephone | Método de descodificación, aparato de descodificación, programa, y soporte de registro para ello |
CN105976830B (zh) | 2013-01-11 | 2019-09-20 | 华为技术有限公司 | 音频信号编码和解码方法、音频信号编码和解码装置 |
PT3121813T (pt) * | 2013-01-29 | 2020-06-17 | Fraunhofer Ges Forschung | Preenchimento de ruído sem informação lateral para codificadores do tipo celp |
US10978083B1 (en) * | 2019-11-13 | 2021-04-13 | Shure Acquisition Holdings, Inc. | Time domain spectral bandwidth replication |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2000025305A1 (en) * | 1998-10-27 | 2000-05-04 | Voiceage Corporation | High frequency content recovering method and device for over-sampled synthesized wideband signal |
EP1008984A2 (en) * | 1998-12-11 | 2000-06-14 | Sony Corporation | Windband speech synthesis from a narrowband speech signal |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5235669A (en) | 1990-06-29 | 1993-08-10 | At&T Laboratories | Low-delay code-excited linear-predictive coding of wideband speech at 32 kbits/sec |
JP2779886B2 (ja) * | 1992-10-05 | 1998-07-23 | 日本電信電話株式会社 | 広帯域音声信号復元方法 |
JPH08102687A (ja) * | 1994-09-29 | 1996-04-16 | Yamaha Corp | 音声送受信方式 |
JP2638522B2 (ja) * | 1994-11-01 | 1997-08-06 | 日本電気株式会社 | 音声符号化装置 |
FI980132A (fi) | 1998-01-21 | 1999-07-22 | Nokia Mobile Phones Ltd | Adaptoituva jälkisuodatin |
US6453289B1 (en) * | 1998-07-24 | 2002-09-17 | Hughes Electronics Corporation | Method of noise reduction for speech codecs |
JP2000181494A (ja) * | 1998-12-11 | 2000-06-30 | Sony Corp | 受信装置及び方法、通信装置及び方法 |
JP2000181495A (ja) * | 1998-12-11 | 2000-06-30 | Sony Corp | 受信装置及び方法、通信装置及び方法 |
JP4135240B2 (ja) * | 1998-12-14 | 2008-08-20 | ソニー株式会社 | 受信装置及び方法、通信装置及び方法 |
JP4135242B2 (ja) * | 1998-12-18 | 2008-08-20 | ソニー株式会社 | 受信装置及び方法、通信装置及び方法 |
JP2000206997A (ja) * | 1999-01-13 | 2000-07-28 | Sony Corp | 受信装置及び方法、通信装置及び方法 |
-
2000
- 2000-10-18 US US09/691,323 patent/US6691085B1/en not_active Expired - Lifetime
-
2001
- 2001-08-31 WO PCT/IB2001/001596 patent/WO2002033696A1/en active IP Right Grant
- 2001-08-31 AT AT01963303T patent/ATE362634T1/de not_active IP Right Cessation
- 2001-08-31 PT PT01963303T patent/PT1328927E/pt unknown
- 2001-08-31 BR BRPI0114706A patent/BRPI0114706B1/pt active IP Right Grant
- 2001-08-31 EP EP01963303A patent/EP1328927B1/en not_active Expired - Lifetime
- 2001-08-31 CN CNB018175902A patent/CN1295677C/zh not_active Expired - Lifetime
- 2001-08-31 DE DE60128479T patent/DE60128479T2/de not_active Expired - Lifetime
- 2001-08-31 DK DK01963303T patent/DK1328927T3/da active
- 2001-08-31 EP EP07100170A patent/EP1772856A1/en not_active Withdrawn
- 2001-08-31 CA CA002426001A patent/CA2426001C/en not_active Expired - Lifetime
- 2001-08-31 KR KR1020037005298A patent/KR100544731B1/ko active IP Right Grant
- 2001-08-31 AU AU2001284327A patent/AU2001284327A1/en not_active Abandoned
- 2001-08-31 JP JP2002537003A patent/JP4302978B2/ja not_active Expired - Lifetime
- 2001-08-31 ES ES01963303T patent/ES2287150T3/es not_active Expired - Lifetime
-
2003
- 2003-03-28 ZA ZA200302465A patent/ZA200302465B/en unknown
-
2008
- 2008-12-17 JP JP2008321598A patent/JP2009069856A/ja not_active Withdrawn
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2000025305A1 (en) * | 1998-10-27 | 2000-05-04 | Voiceage Corporation | High frequency content recovering method and device for over-sampled synthesized wideband signal |
EP1008984A2 (en) * | 1998-12-11 | 2000-06-14 | Sony Corporation | Windband speech synthesis from a narrowband speech signal |
Also Published As
Publication number | Publication date |
---|---|
CN1484824A (zh) | 2004-03-24 |
EP1772856A1 (en) | 2007-04-11 |
PT1328927E (pt) | 2007-06-14 |
ATE362634T1 (de) | 2007-06-15 |
BR0114706A (pt) | 2005-01-11 |
EP1328927B1 (en) | 2007-05-16 |
EP1328927A1 (en) | 2003-07-23 |
KR100544731B1 (ko) | 2006-01-23 |
CA2426001C (en) | 2006-04-25 |
JP4302978B2 (ja) | 2009-07-29 |
CA2426001A1 (en) | 2002-04-25 |
ES2287150T3 (es) | 2007-12-16 |
BRPI0114706B1 (pt) | 2016-03-01 |
WO2002033696B1 (en) | 2002-07-25 |
AU2001284327A1 (en) | 2002-04-29 |
JP2009069856A (ja) | 2009-04-02 |
DE60128479T2 (de) | 2008-02-14 |
US6691085B1 (en) | 2004-02-10 |
ZA200302465B (en) | 2004-08-13 |
JP2004537739A (ja) | 2004-12-16 |
KR20040005838A (ko) | 2004-01-16 |
DK1328927T3 (da) | 2007-07-16 |
WO2002033696A1 (en) | 2002-04-25 |
DE60128479D1 (de) | 2007-06-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1295677C (zh) | 用于估算语音调制解调器中的模拟高频段信号的方法和系统 | |
KR100805983B1 (ko) | 가변율 음성 코더에서 프레임 소거를 보상하는 방법 | |
EP2040253B1 (en) | Predictive dequantization of voiced speech | |
US6691084B2 (en) | Multiple mode variable rate speech coding | |
JP4166673B2 (ja) | 相互使用可能なボコーダ | |
KR20010024935A (ko) | 음성 코딩 | |
US6260017B1 (en) | Multipulse interpolative coding of transition speech frames | |
Gomez et al. | Recognition of coded speech transmitted over wireless channels | |
US20030055633A1 (en) | Method and device for coding speech in analysis-by-synthesis speech coders | |
KR100554164B1 (ko) | 서로 다른 celp 방식의 음성 코덱 간의 상호부호화장치 및 그 방법 | |
Rodrigues et al. | Harmonic coding at 8 kbits/sec |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C41 | Transfer of patent application or patent right or utility model | ||
TR01 | Transfer of patent right |
Effective date of registration: 20160122 Address after: Espoo, Finland Patentee after: Technology Co., Ltd. of Nokia Address before: Espoo, Finland Patentee before: Nokia Oyj |
|
CX01 | Expiry of patent term |
Granted publication date: 20070117 |
|
CX01 | Expiry of patent term |