CN1303586C - 使用共振峰增强对话的方法和装置 - Google Patents
使用共振峰增强对话的方法和装置 Download PDFInfo
- Publication number
- CN1303586C CN1303586C CNB2004100911129A CN200410091112A CN1303586C CN 1303586 C CN1303586 C CN 1303586C CN B2004100911129 A CNB2004100911129 A CN B2004100911129A CN 200410091112 A CN200410091112 A CN 200410091112A CN 1303586 C CN1303586 C CN 1303586C
- Authority
- CN
- China
- Prior art keywords
- coefficient
- input signal
- voice
- signal
- filter coefficient
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 26
- 230000002708 enhancing effect Effects 0.000 title abstract description 5
- 238000001228 spectrum Methods 0.000 claims abstract description 38
- 238000000605 extraction Methods 0.000 claims description 23
- 239000000284 extract Substances 0.000 claims description 11
- 230000001737 promoting effect Effects 0.000 claims description 7
- 230000003595 spectral effect Effects 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 claims description 3
- 238000001914 filtration Methods 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 9
- 230000014509 gene expression Effects 0.000 description 6
- 239000002131 composite material Substances 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000005728 strengthening Methods 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 206010038743 Restlessness Diseases 0.000 description 1
- 241001234523 Velamen Species 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 238000005086 pumping Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0364—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/15—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being formant information
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Electrophonic Musical Instruments (AREA)
- Telephone Function (AREA)
- Telephonic Communication Services (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
一种提升对话区域的共振峰而不改变声音区域的对话增强方法和装置,包括:基于来自输入信号的线性预测编码(LPC)来计算线谱对(LSP)系数;基于计算出的LSP系数确定输入信号中是否存在语音区域;和根据是否存在语音区域来从LSP系数中提取共振峰,并提升共振峰。
Description
本申请要求2003年11月21日在韩国知识产权局提交的第2003-82976号的韩国专利申请的优先权,该申请全部公开于此以资参考。
技术领域
本发明总体构思涉及对话增强系统,尤其涉及一种提升对话区域的共振峰而不改变声音区域的对话增强方法和装置。
背景技术
通常,对话增强系统提高由背景噪音所降低的对话的清晰度。传统的对话增强系统使用均衡器和消波电路以仅提高音量。然而,均衡器和消波电路将对话和背景噪音一起放大。
在授予klayman的题目为“公共演讲清晰系统”(public address intelligibilitysystem)的第5459813号的U.S专利中公开了一种传统对话增强系统。
如图1所示,该传统对话增强系统包括:语音/非语音(voice/unvoice)确定器90、频谱分析器42、压控放大器(VCA)单元50、合成单元60、和合成器108。
参照图1,语音/非语音确定器90使用低通滤波器来确定输入信号是语音信号还是非语音信号。频谱分析器42包括30个滤波器组并通过分析输入信号的频率分量来确定共振峰。VCA单元50根据由语音/非语音确定器90确定的语音/非语音信号通过将存储在增益表中的增益施加到共振峰来控制共振峰的振幅。合成单元60将其振幅由VCA单元50控制的共振峰的频率分量和其它波段合成。
由于传统的对话增强系统在频谱分析器42中使用许多滤波器组以分析频率,因此用于这种分析处理的计算量很大,并且由于共振峰的增益由VCA单元50控制,所以语音信号的包络变得扭曲。
发明内容
本发明总体构思在于提供一种对话增强方法和装置,以根据基于线谱对(LSP)系数的语音区域是否存在通过增强共振峰仅增强对话而不改变声音振幅。
本发明总体构思的另外的方面和优点将在下面的描述中部分提出,另外的部分,通过描述将是清楚的,或者通过实施本发明总体构思来了解。
通过提供这样一种对话增强方法,本发明总体构思的上述和/或其他方面和优点可基本实现,该方法包括:基于来自输入信号的线性预测编码(LPC)计算线谱对(LSP)系数;根据计算出的LSP系数来确定语音区域是否存在于输入信号中;和根据语音区域是否存在的确定从LSP系数中提取共振峰,并提升共振峰,其中,共振峰的提取包括:如果输入信号中存在语音区域,则使用线谱对系数确定共振峰的中心频率;在共振峰的中心频率生成具有提升电平的提升滤波器系数;和使用提升滤波器系数来提升输入信号的共振峰。
通过提供这样一种对话增强方法也可实现本发明总体构思的上述和/或其他方面和优点,该方法包括:合成左和右声道的输入信号;通过向下取样合成的信号基于LPC提取频谱参数;根据LSP系数的接近度来确定语音区域是否存在;根据语音区域是否存在的确定从LSP系数中提取多个共振峰;在多个共振峰的中心频率生成具有预定电平的多个波段的提升滤波器系数;和如果语音区域存在于左和右声道的输入信号中,则使用多个波段的提升滤波器系数将输入信号滤波。
通过提供这样一种对话增强装置,本发明总体构思的上述和/或其他方面和优点也可实现,该装置包括:提升滤波器系数提取器,用于通过基于来自输入信号的LPC计算LSP系数来提取多个共振峰,提取相应于多个共振峰的预定电平的提升滤波器系数,并基于LSP系数的接近度确定语音区域是否存在于输入信号中;和信号处理单元,用于根据语音区域是否存在的确定基于提升滤波器系数来增强语音区域的共振峰。
提升滤波器系数提取器可包括:向下取样器,用于以预定的倍数(multiplenumber)对输入信号进行向下取样;LPC提取器,用于从由向下取样器向下取样的信号中提取LPC系数;LSP转换器,用于将由LPC提取器提取的LPC系数转换为LSP系数;语音区域确定器,用于通过将由LSP转换器转换的LSP系数的接近度和阈值比较来确定语音区域是否存在;和提升滤波器系数生成器,用于从由LSP转换器转换的LSP系数计算多个共振峰的中心频率,并从多个共振峰的中心频率生成具有的相同的提升增益的提升滤波器系数。
附图说明
通过结合附图对实施例进行的下述描述,本发明总体构思的这些和/或其他方面和优点将会变得清楚和更易于理解,其中:
图1是传统的对话增强系统的框图;
图2是根据本发明总体构思的实施例的对话增强装置的框图;
图3是图2的信号合成器的框图;
图4是图2的提升滤波器系数提取器的框图;
图5是根据本发明总体构思的另一实施例的对话增强方法的流程图;
图6是用于p不连续频率的语音的频谱包络的曲线图;和
图7是经过图2的第一和第二处理单元的提升滤波器的语音的频谱包络的曲线图。
具体实施方式
现在将详细描述本发明总体构思的实施例,其例子表示在附图中,其中,相同的标号始终表示相同的部件。下面参照附图描述实施例以解释本发明总体构思。
图2是根据本发明总体构思的实施例的对话增强装置的框图。
参照图2,信号合成器210将经左和右声道输入的信号合成以生成合成信号。这里,左和右声道信号包括语音信号和背景噪声。
提升滤波器系数提取器220通过计算线谱对(LSP)系数和来自合成信号的线性预测编码(LPC)系数来提取共振峰,从共振峰中提取提升滤波器系数,基于LSP系数的接近度来确定输入信号中是否存在语音区域,并根据语音区域是否存在的确定通过提升输入信号来生成增强选择模式(模式选择信号)。
第一信号处理单元230包括具有4个由提升滤波器系数提取器220提取的提升滤波器系数被施加到其的波段的提升滤波器,并根据增强选择模式通过控制左输入信号来增强左输入信号以通过4波段的提升滤波器。
第二信号处理单元240包括具有4个由提升滤波器系数提取器220提取的提升滤波器系数被施加到其的波段的提升滤波器,并根据增强选择模式通过控制右输入信号来增强右输入信号以通过4波段的提升滤波器。
图3是图2的信号合成器210的框图。
参照图2和图3,与声学分量相比,对话分量均匀地存在于左和右声道中。因此,左和右声道的输入信号分别在第一乘法器310和第二乘法器320中被乘以0.5。然后,这些信号在加法器330中相加。
图4是图2的提升滤波器系数提取器220的框图。
参照图2至图4,对话分量在4KHz中具有主要频率分量。向下取样器420使用取样频率44.1KHz来执行合成信号的1/5向下取样。
LPC提取器430提取LPC系数以表达关于由向下取样器420向下取样的信号的语音分量的频谱包络。这里,在语音分量的频谱中的4KHz中存在4个共振峰。
LSP转换器440将由LPC提取器430提取的LPC系数转换为LSP系数。这里,2个LSP系数表示一个共振峰。此外,共振峰越尖和越高,则相应于2个LSP系数的LSP的间隙越窄。
语音区域确定器450通过将由LSP转换器440转换的LSP的间隙和阈值比较来确定语音区域是否存在。即,如果LSP间隙大于阈值,则语音区域确定器450确定不存在语音区域,并生成旁路(bypass)信号,如果LSP间隙小于阈值,则语音区域确定器450确定存在语音区域,并生成提升滤波模式信号(模式选择信号)。
提升滤波系数生成器460从由LSP转换器440转换的LSP系数计算第一、第二、第三、和第四共振峰的中心频率,并从自第一、第二、第三、和第四共振峰的中心频率生成具有提升增益的提升滤波器系数。
图5是根据本发明总体构思的另一个实施例的对话增强方法的流程图。
参照图2至图4,在操作510中,经左和右声道输入的信号被合成。这里,左和右声道信号分别包括中心信号。
因此,左(L)和右(R)声道信号可分别由L=Lt+Ct和R=Rt+Ct表示。这里,Lt是真L声道信号,Rt是真R声道信号,Ct是真中心分量。因此,合成的输入信号可被表示为Xinput=0.5*Lt+0.5*Rt+Ct。这里,Lt≠Rt。
当声音信号在频域中被表达时,大部分频率分量存在于6KHz中,并且几个频段占优势。语音共振峰可被应用于在频域中的占优势的波段。通常,在语音信号中发现4个共振峰。此外,这些共振峰位于每1KHz中。因此,第一、第二、第三、和第四共振峰存在于4KHz中。因此,在操作520中,使用取样频率44.1KHz的合成信号的1/5向下取样被执行以减少计算量。
在操作530中,使用LPC方法从向下取样的信号中提取LPC系数。这里,LPC方法作为使用具有全极点结构的数字滤波器将语音生成器官中的音轨(vocal tract)的特性建模的方法,被用于在假定语音信号在具有10-20ms的短区域(short zone)中是静止的情况下从语音信号的具有10-20ms的短区域预测数字滤波器的系数。这里,语音信号s(n)可由方程1来表示。
[方程1]
这里,ai是将音轨建模的线性滤波器系数,G是增益,u(n)是激励信号。
线性滤波器系数表示短区域语音信号的频率特性,更具体地讲,很好的表示关于作为有意义的声学特性的音轨的谐振频率(共振峰)的信息。
LPC系数采用例如使用自相关系数的Durbin方法在所示的方程2至方程8中被计算。
[方程2]
E0=r(0)
这里,E0是输入信号的能量,r(0)是自相关系数的第一个值。
[方程3]
这里,ki是第i反射系数(reflection coefficient),r(i)是第i自相关系数(autocorrelation coefficient)。因此,使用方程4和5计算线性滤波器系数。
[方程4]
αi (i)=ki
[方程5]
αj (i)=αj (i-1)-kiαi-j (i-1),1≤j≤i-1
[方程6]
Ei=(1-ki 2)E(i-1)
这里,预先使用方程7计算自相关系数r(m)。
[方程7]
这里,s(n)是语音信号。
最后,LPC系数可最终由方程8表示。
[方程8]
αm=LPC系数=αm (p),1≤m≤p
为了指示语音信号的频谱信息,在操作540中,基于LPC系数提取LSP系数。如图6所示,线谱对(LSP)指示用于p不连续频率的频谱包络。即,LSP通过使用基于线性预测的系数从LPC模型中被获得并被建议为通过Itakura-Saito LPC频谱距离的LPC系数的另一个表达类型。
如方程1所示,语音信号s(n)可被表示为滤波器传递函数H(z)=1/A(z),其执行语音结构的建模。这里,A(z)等于方程9。
[方程9]
A(z)=1+a1 z-1+....+ap z-p
这里,ap是第p级LPC系数。
可使用如方程10和11中所表示的A(z)来定义LSP。
[方程10]
P(z)=A(z)+Z-(p+1)A(z-1)
[方程11]
Q(z)=A(z)-Z-(p+1)A(z-1)
这两个定义的多项式P(z)和Q(z)的根被定义为LSP。
LSP系数可从LPC系数获得,并且LPC系数可从LSP系数获得。
[方程12]
方程12示出A(z)的根与P(z)和Q(z)的根紧密相关。即,通过收集2或3个LSP频率来表示共振峰频率。此外,共振峰的带宽可根据LSP的线对的接近度来被表达。即,参照图6,由实线和虚线之间的间隙指示的接近度越大表示具有越窄带宽和越大振幅的共振峰。
在操作550中,使用LSP系数来确定语音区域是否存在。在语音中,共振峰具有窄的带宽和大的振幅。因此,使用LSP的接近度来确定语音区域是否存在。即,如果LSP间隙小于阈值,则确定存在语音区域,如果LSP的间隙大于阈值,则确定不存在语音区域。
在操作560中,如果使用LSP的接近度确定不存在语音区域,则输入的立体声信号如在操作582中被旁路。
在操作560中,如果使用LSP的接近度确定存在语音区域,则提升语音共振峰的操作572、574、和576被随后执行。
即,如果确定在输入信号中存在语音区域,则在操作572中使用LSP系数来确定第一、第二、第三、和第四共振峰的中心频率。
在操作574中,使用第一、第二、第三、和第四共振峰的中心频率来获得具有提升电平的4波段的提升滤波系数。这里,共振峰的提升电平全部相同,从而语音信号的频谱包络不被改变。
在操作576中,输入的立体声信号如左或右声道信号经过提升滤波器系数被施加到其的4波段的提升滤波器。图7示出在第一、第二、第三、和第四共振峰波段710、720、730、和740具有相同提升增益的信号的LPC频谱。
最后,如图7所示,通过将输入的立体声信号经过4波段的提升滤波器该输入的立体声信号的语音区域被提高。
该发明总体构思也可实施为存储在计算机可读记录介质上的计算机可读代码。计算机可读记录介质是能够存储随后可由计算机系统读取的数据的任何数据存储设备。计算机可读存储介质的例子包括只读存储器(ROM)、随机存取存储器(RAM)、CD-ROM、磁带、软盘、光学数据存储设备、和载波(如通过网络的数据传输)。计算机可读记录介质也可被分布在连接在计算机系统上的网络中,从而计算机可读代码以分布的方式被存储和执行。
如上所述,根据本发明,通过使用LPC系数预测共振峰,语音检测/增强操作的计算量可被减少。此外,由于通过在语音信号的第一、第二、第三、和第四共振峰中设置预定增益,语音信号的包络没有被扭曲,因此,音质没有被改变。
尽管已表示和描述了本发明总体构思的一些实施例,但是本领域的技术人员应该理解,在不脱离由所附权利要求及其等同物所限定其范围的本发明总体构思的原理和精神的情况下,可以对这些实施例进行修改。
Claims (18)
1、一种对话增强方法,包括:
根据来自输入信号的线性预测编码计算线谱对系数;
根据计算的线谱对系数确定输入信号中是否存在一个或更多的语音区域;和
根据一个或更多语音区域是否存在的确定来从线谱对系数中提取一个或更多共振峰,并提升共振峰,
其中,共振峰的提取包括:
如果输入信号中存在语音区域,则使用线谱对系数确定共振峰的中心频率;
在共振峰的中心频率生成具有提升电平的提升滤波器系数;和
使用提升滤波器系数来提升输入信号的共振峰。
2、如权利要求1所述的方法,其中,线谱对系数的计算包括:
通过将线性预测编码模型应用到输入信号中来提取线性预测编码系数;和
使用预定的线性预测编码模型将线性预测编码系数转换为线谱对系数。
3、如权利要求1所述的方法,其中,语音区域是否存在的确定包括:如果线谱对间隙小于阈值,则确定输入信号是语音信号;如果线谱对间隙大于阈值则确定输入信号不是语音信号。
4、如权利要求1所述的方法,其中,对于每个共振峰,提升电平被设置为相同的幅度。
5、如权利要求1所述的方法,还包括:
如果输入信号不是语音信号,则防止共振峰被提升。
6、如权利要求1所述的方法,其中,线谱对系数的计算包括:
根据线谱对系数确定一个或更多共振峰的中心频率;和
根据中心频率提取将被用于提升共振峰的提升滤波器系数。
7、如权利要求1所述的方法,其中,共振峰的提升包括:
根据提升滤波器系数将共振峰提升相同的提升电平。
8、一种对话增强方法,包括:
合成左和右声道的输入信号以生成合成的信号;
通过对合成的信号向下取样基于线性预测编码来提取频谱参数;
根据线谱对间隙确定是否存在一个或更多语音区域;
根据是否存在一个或更多的语音区域来从相应于频谱参数的线谱对中提取一个或更多的共振峰;
在一个或更多共振峰的中心频率生成具有预定电平的多个波段的提升滤波器系数;和
如果在输入信号中存在一个或更多语音区域,则使用多个波段的提升滤波器系数将输入信号滤波。
9、一种对话增强装置,包括:
提升滤波器系数提取器,用于通过基于来自输入信号的线性预测编码计算线谱对系数来提取一个或更多共振峰,提取相应于一个或更多共振峰的预定电平的提升滤波器系数,并根据线谱对间隙确定输入信号中是否存在一个或更多语音区域;和
信号处理单元,用于根据语音区域是否存在的确定基于提升滤波器系数增强语音区域的一个或更多共振峰。
10、如权利要求9所述的装置,还包括:
信号合成器,用于将经左和右声道输入的输入信号合成并将合成的信号输出到提升滤波器系数提取器。
11、如权利要求9所述的装置,其中,提升滤波器系数提取器包括:
向下取样器,用于以预定的倍数对输入信号向下取样;
线性预测编码提取器,用于从由向下取样器向下取样的信号中提取线性预测编码系数;
线谱对转换器,用于将由线性预测编码提取器提取的线性预测编码系数转换为线谱对系数;
语音区域确定器,用于通过将线谱对间隙和阈值比较来确定是否存在语音区域;和
提升滤波器系数生成器,用于从自线谱对系数计算一个或更多共振峰的中心频率,并从一个或更多共振峰的中心频率生成具有预定的提升增益的提升滤波器系数。
12、如权利要求11所述的装置,其中,如果线谱对间隙大于阈值,则语音区域确定器通过确定输入信号不是语音信号生成旁路模式信号,如果线谱对间隙小于阈值,则语音区域确定器通过确定输入信号是语音信号生成提升滤波模式。
13、如权利要求9所述的装置,其中,输入信号处理单元包括4波段的提升滤波器,由提升滤波器系数提取器提取的提升滤波器系数被施加到所述4波段的提升滤波器。
14、如权利要求9所述装置,其中,输入信号包括左声道信号和右声道信号,信号处理单元包括用于根据确定和提升滤波器系数增强输入信号的左声道信号的第一信号处理单元,和用于根据确定和提升滤波器系数增强输入信号的右声道信号的第二信号处理单元。
15、如权利要求9所述的装置,其中,输入信号包括非语音区域,信号处理单元防止相应于非语音区域的输入信号被增强。
16、如权利要求9所述的装置,其中,提升滤波器系数具有相同的将被施加到一个或更多共振峰上的提升增益。
17、如权利要求9所述的装置,其中,信号处理单元包括多个提升滤波器,以将语音区域的一个或更多共振峰增强相同的电平。
18、如权利要求9所述的装置,其中,提升滤波器系数提取器根据线谱对系数确定一个或更多共振峰的中心频率,并根据一个或更多共振峰的中心频率提取提升滤波器系数。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR82976/2003 | 2003-11-21 | ||
KR1020030082976A KR20050049103A (ko) | 2003-11-21 | 2003-11-21 | 포만트 대역을 이용한 다이얼로그 인핸싱 방법 및 장치 |
KR82976/03 | 2003-11-21 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1619646A CN1619646A (zh) | 2005-05-25 |
CN1303586C true CN1303586C (zh) | 2007-03-07 |
Family
ID=34431806
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB2004100911129A Expired - Fee Related CN1303586C (zh) | 2003-11-21 | 2004-11-18 | 使用共振峰增强对话的方法和装置 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20050114119A1 (zh) |
EP (1) | EP1533791A3 (zh) |
JP (1) | JP2005157363A (zh) |
KR (1) | KR20050049103A (zh) |
CN (1) | CN1303586C (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101067929B (zh) * | 2007-06-05 | 2011-04-20 | 南京大学 | 使用共振峰增强提取话音共振峰轨迹的方法 |
CN103038825A (zh) * | 2011-08-05 | 2013-04-10 | 华为技术有限公司 | 语音增强方法和设备 |
CN106409287A (zh) * | 2016-12-12 | 2017-02-15 | 天津大学 | 提高肌肉萎缩或神经退行性病人语音可懂度装置和方法 |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101051464A (zh) | 2006-04-06 | 2007-10-10 | 株式会社东芝 | 说话人认证的注册和验证方法及装置 |
US8725499B2 (en) | 2006-07-31 | 2014-05-13 | Qualcomm Incorporated | Systems, methods, and apparatus for signal change detection |
CN101496095B (zh) * | 2006-07-31 | 2012-11-21 | 高通股份有限公司 | 用于信号变化检测的系统、方法及设备 |
CN103827965B (zh) * | 2011-07-29 | 2016-05-25 | Dts有限责任公司 | 自适应语音可理解性处理器 |
JP5590021B2 (ja) * | 2011-12-28 | 2014-09-17 | ヤマハ株式会社 | 音声明瞭化装置 |
CN102779527B (zh) * | 2012-08-07 | 2014-05-28 | 无锡成电科大科技发展有限公司 | 基于窗函数共振峰增强的语音增强方法 |
CN104995680B (zh) | 2013-04-05 | 2018-04-03 | 杜比实验室特许公司 | 使用高级频谱延拓降低量化噪声的压扩装置和方法 |
CN104143337B (zh) * | 2014-01-08 | 2015-12-09 | 腾讯科技(深圳)有限公司 | 一种提高音频信号音质的方法和装置 |
JP2015135267A (ja) * | 2014-01-17 | 2015-07-27 | 株式会社リコー | 電流センサ |
PL3201918T3 (pl) | 2014-10-02 | 2019-04-30 | Dolby Int Ab | Sposób dekodowania i dekoder do wzmacniania dialogu |
US11363147B2 (en) | 2018-09-25 | 2022-06-14 | Sorenson Ip Holdings, Llc | Receive-path signal gain operations |
CN109410971B (zh) * | 2018-11-13 | 2021-08-31 | 无锡冰河计算机科技发展有限公司 | 一种美化声音的方法和装置 |
CN111108552A (zh) * | 2019-12-24 | 2020-05-05 | 广州国音智能科技有限公司 | 一种声纹同一性鉴定方法和相关装置 |
CN114171035B (zh) * | 2020-09-11 | 2024-10-15 | 海能达通信股份有限公司 | 抗干扰方法及装置 |
CN112820277B (zh) * | 2021-01-06 | 2023-08-25 | 网易(杭州)网络有限公司 | 语音识别服务定制方法、介质、装置和计算设备 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1265217A (zh) * | 1997-07-02 | 2000-08-30 | 西莫克国际有限公司 | 在语音通信系统中语音增强的方法和装置 |
WO2002033693A1 (en) * | 2000-10-20 | 2002-04-25 | Telefonaktiebolaget Lm Ericsson (Publ) | Perceptually improved enhancement of encoded acoustic signals |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3180936A (en) * | 1960-12-01 | 1965-04-27 | Bell Telephone Labor Inc | Apparatus for suppressing noise and distortion in communication signals |
US4860360A (en) * | 1987-04-06 | 1989-08-22 | Gte Laboratories Incorporated | Method of evaluating speech |
JP2564821B2 (ja) * | 1987-04-20 | 1996-12-18 | 日本電気株式会社 | 音声判定検出装置 |
CA2056110C (en) * | 1991-03-27 | 1997-02-04 | Arnold I. Klayman | Public address intelligibility system |
ES2137355T3 (es) * | 1993-02-12 | 1999-12-16 | British Telecomm | Reduccion de ruido. |
FR2720850B1 (fr) * | 1994-06-03 | 1996-08-14 | Matra Communication | Procédé de codage de parole à prédiction linéaire. |
JPH09230896A (ja) * | 1996-02-28 | 1997-09-05 | Sony Corp | 音声合成装置 |
JP4308345B2 (ja) * | 1998-08-21 | 2009-08-05 | パナソニック株式会社 | マルチモード音声符号化装置及び復号化装置 |
US6463410B1 (en) * | 1998-10-13 | 2002-10-08 | Victor Company Of Japan, Ltd. | Audio signal processing apparatus |
US6505152B1 (en) * | 1999-09-03 | 2003-01-07 | Microsoft Corporation | Method and apparatus for using formant models in speech systems |
WO2001033548A1 (fr) * | 1999-10-29 | 2001-05-10 | Fujitsu Limited | Dispositif et procede de reglage du debit dans un systeme de codage de la parole a debit variable |
-
2003
- 2003-11-21 KR KR1020030082976A patent/KR20050049103A/ko not_active Application Discontinuation
-
2004
- 2004-11-08 US US10/982,827 patent/US20050114119A1/en not_active Abandoned
- 2004-11-18 CN CNB2004100911129A patent/CN1303586C/zh not_active Expired - Fee Related
- 2004-11-19 JP JP2004336538A patent/JP2005157363A/ja active Pending
- 2004-11-19 EP EP04105947A patent/EP1533791A3/en not_active Withdrawn
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1265217A (zh) * | 1997-07-02 | 2000-08-30 | 西莫克国际有限公司 | 在语音通信系统中语音增强的方法和装置 |
WO2002033693A1 (en) * | 2000-10-20 | 2002-04-25 | Telefonaktiebolaget Lm Ericsson (Publ) | Perceptually improved enhancement of encoded acoustic signals |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101067929B (zh) * | 2007-06-05 | 2011-04-20 | 南京大学 | 使用共振峰增强提取话音共振峰轨迹的方法 |
CN103038825A (zh) * | 2011-08-05 | 2013-04-10 | 华为技术有限公司 | 语音增强方法和设备 |
CN103038825B (zh) * | 2011-08-05 | 2014-04-30 | 华为技术有限公司 | 语音增强方法和设备 |
CN106409287A (zh) * | 2016-12-12 | 2017-02-15 | 天津大学 | 提高肌肉萎缩或神经退行性病人语音可懂度装置和方法 |
CN106409287B (zh) * | 2016-12-12 | 2019-12-13 | 天津大学 | 提高肌肉萎缩或神经退行性病人语音可懂度装置和方法 |
Also Published As
Publication number | Publication date |
---|---|
EP1533791A2 (en) | 2005-05-25 |
JP2005157363A (ja) | 2005-06-16 |
CN1619646A (zh) | 2005-05-25 |
EP1533791A3 (en) | 2008-04-23 |
US20050114119A1 (en) | 2005-05-26 |
KR20050049103A (ko) | 2005-05-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1303586C (zh) | 使用共振峰增强对话的方法和装置 | |
JP3321971B2 (ja) | 音声信号処理方法 | |
CN1272911C (zh) | 音频信号解码装置及音频信号编码装置 | |
CN1199151C (zh) | 语音编码器 | |
CN1159691A (zh) | 用于声频信号线性预测分析的方法 | |
CN1112671C (zh) | 综合分析语音编码器中噪声隐蔽电平适应性修改方法 | |
US8229738B2 (en) | Method for differentiated digital voice and music processing, noise filtering, creation of special effects and device for carrying out said method | |
CN101061535A (zh) | 用于人工扩展语音信号的带宽的方法和装置 | |
JP5602769B2 (ja) | 符号化装置、復号装置、符号化方法及び復号方法 | |
CN1152776A (zh) | 复制语言信号、解码语音、合成语音的方法和装置 | |
CN1909060A (zh) | 提取浊音/清音分类信息的方法和设备 | |
CN1658283A (zh) | 分离声源信号的方法和装置及用来检测间距的方法和装置 | |
CN1512488A (zh) | 在速率可变的声码器中选择编码速率的方法和装置 | |
CN1265217A (zh) | 在语音通信系统中语音增强的方法和装置 | |
CN1161750C (zh) | 语音编码译码方法和装置、电话装置、音调变换方法和介质 | |
KR20010024639A (ko) | 합성에 의한 분석에 기초한 인식을 이용한 피치 평가를위한 방법 및 장치 | |
WO2006051446A2 (en) | Method of signal encoding | |
CN1173690A (zh) | 识别浊音/清音的方法和装置及其语音编码方法 | |
CN1455390A (zh) | 估算声音编码器的谐波的装置和方法 | |
US6253171B1 (en) | Method of determining the voicing probability of speech signals | |
CN101030375A (zh) | 一种基于动态规划的基音周期提取方法 | |
US5812966A (en) | Pitch searching time reducing method for code excited linear prediction vocoder using line spectral pair | |
CN1214362C (zh) | 用于确定信号间相关系数和信号音高的设备和方法 | |
JP3612260B2 (ja) | 音声符号化方法及び装置並びに及び音声復号方法及び装置 | |
JPWO2003071522A1 (ja) | 固定音源ベクトルの生成方法及び固定音源符号帳 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C17 | Cessation of patent right | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20070307 Termination date: 20091218 |