CN1132153C - 改善增强语声的滤波器,用该滤波器的装置、系统和方法 - Google Patents
改善增强语声的滤波器,用该滤波器的装置、系统和方法 Download PDFInfo
- Publication number
- CN1132153C CN1132153C CN96108490A CN96108490A CN1132153C CN 1132153 C CN1132153 C CN 1132153C CN 96108490 A CN96108490 A CN 96108490A CN 96108490 A CN96108490 A CN 96108490A CN 1132153 C CN1132153 C CN 1132153C
- Authority
- CN
- China
- Prior art keywords
- spectrum information
- information
- wave filter
- improvement
- voice signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 89
- 238000012986 modification Methods 0.000 title abstract 3
- 230000004048 modification Effects 0.000 title abstract 3
- 230000003595 spectral effect Effects 0.000 claims abstract description 41
- 230000000694 effects Effects 0.000 claims abstract description 24
- 238000001228 spectrum Methods 0.000 claims description 204
- 230000006872 improvement Effects 0.000 claims description 80
- 238000006243 chemical reaction Methods 0.000 claims description 44
- 230000008859 change Effects 0.000 claims description 38
- 238000001914 filtration Methods 0.000 claims description 28
- 230000006870 function Effects 0.000 claims description 20
- 230000015572 biosynthetic process Effects 0.000 claims description 18
- 238000003786 synthesis reaction Methods 0.000 claims description 17
- 238000003860 storage Methods 0.000 claims description 16
- 230000002708 enhancing effect Effects 0.000 claims description 15
- 230000005540 biological transmission Effects 0.000 claims description 14
- 238000013519 translation Methods 0.000 claims description 8
- 230000009466 transformation Effects 0.000 claims description 7
- 230000006835 compression Effects 0.000 claims description 6
- 238000007906 compression Methods 0.000 claims description 6
- 230000004044 response Effects 0.000 claims description 3
- 230000001105 regulatory effect Effects 0.000 claims description 2
- 238000013461 design Methods 0.000 abstract description 13
- 230000001629 suppression Effects 0.000 abstract 1
- 238000012545 processing Methods 0.000 description 25
- 230000008901 benefit Effects 0.000 description 23
- 238000005516 engineering process Methods 0.000 description 14
- 230000008569 process Effects 0.000 description 14
- 230000000875 corresponding effect Effects 0.000 description 11
- 238000005520 cutting process Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 238000012546 transfer Methods 0.000 description 5
- 238000000605 extraction Methods 0.000 description 3
- 238000012797 qualification Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 230000006866 deterioration Effects 0.000 description 2
- 230000004069 differentiation Effects 0.000 description 2
- 238000006073 displacement reaction Methods 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 230000008030 elimination Effects 0.000 description 2
- 238000003379 elimination reaction Methods 0.000 description 2
- 238000009499 grossing Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 description 1
- 108010014172 Factor V Proteins 0.000 description 1
- 240000004859 Gamochaeta purpurea Species 0.000 description 1
- 244000287680 Garcinia dulcis Species 0.000 description 1
- 101150034459 Parpbp gene Proteins 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000003542 behavioural effect Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000003292 diminished effect Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 239000000178 monomer Substances 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 238000002161 passivation Methods 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 238000013341 scale-up Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000005728 strengthening Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Television Systems (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Noise Elimination (AREA)
- Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
- Electrically Operated Instructional Devices (AREA)
Abstract
一种改善增强语声的滤波器、用该滤波器的装置、系统和方法,对合成语声信号滤波产生改善的语声信号。由用多维矢量表示的频谱信息确定滤波器系数以与合成语声信号的频谱信息比较和根据频谱信息,能保证信号的主频特性增强。频谱信息可为LSP、PARCOR或LAR信息之一。由此提高了按声学要求抑制信号中量化噪声的语声改善滤波器的设计自由度和语声信号清晰度,可得到良好的主频增强效果,而不会在允许的频谱变化范围产生明显畸变。
Description
技术领域
本发明一般涉及一种利用具有比输入的语声信号的信息量要少的信息量的信息码来传输或存储语声信息的系统和方法。确切地说,本发明涉及一种用于从输入的语声信号中提取代表语声特征的各种特征数据,传输或存储该提取的数据,以及根据该传输和存储的特征数据合成出原来的语声信号。更具体地说,本发明涉及一种用于按声学要求抑制在经合成的语声信号中产生量化噪声的语声改善(用)滤波器。进而,本发明涉及一种用于提高信号质量(例如语声清晰度)的系统、方法和滤波器。更确切地说,本发明涉及一种语声增强器,其适用于改进由于模拟传输产生畸变的信号或由助听装置接收的信号的语声清晰度,以及适用于改进由扬声器输出广播节目的语声响亮度。
背景技术
在图28中以举例方式表示了一种语声分析/合成系统的结构。在这一示意图中的系统包含一分析单元100和合成单元200。分析单元100包括分析器101和编码器102,而合成单元200包括解码器201和合成器202。在某些应用场合,单元100和200彼此经过通讯通道连接,一个单元通常与另一个是远离的。在另外一些应用场合,单元100经过存储媒体向单元200传输信息,其中两个单元可以构成一个装置或两个分开的装置,分析器101从使用者提供的输入语声信号中提取包括代表输入的语声信号特征的频谱信息的特征数据组。由编码器102对提取的特征数据组进行编码,然后经过通讯通道或存储媒体提供到合成单元200,在其中由解码器201对经编码的特征数据组进行解码。合成器202用以根据经此解码的特征数据组来合成语声信号。具有这种结构的系统的一个优点是传输或存储的信号的信息量较低。这是由于传输或存储的信号即经编码的特征数据组与输入的语声信号相比包含的信息量较少。
在图29中表示了合成单元200的一种演变的方案。这种方案还包含一后置滤波器203,其用以根据经解码的特征数据组,对由合成器202产生的信号(下文称为合成的语声信号)进行预定的改善处理,因此产生改善的语声信号(下文称为改善的合成语声信号)。后置滤波器203在某些应用场合下,用于按声学要求抑制在合成的语声信号中包含的量化噪声,但在另外一些情况下,用于改进语声的质量例如语声的清晰度。在如下介绍中,这种类型的后置滤波器将被称为语声改善滤波器或语声增强滤波器。装有这种滤波器203的合成单元200适于在声音编码/解码系统或声音记录和响应系统中使用。
各种各样的滤波器可用作该滤波器203。综上所述,一种增强主频特征的类型的滤波器的优点是相当有效地抑制噪声和改进语声的质量。公开这种滤波器的已有技术可供参考的例如:
公开号为昭64-13200的日本专利公开文件(下文称为参考文件1);
公开号为平5-500573的日本专利公开文件(下文称为参考文件2);
公开号为平2-82710的日本专利公开文件(下文称为参考文件3);以及
日本声学会的春季会议上的会刊第1卷第257-258页(1994.3)″根据适用于带噪声通道的唛倒频谱分析的语声编码系统(下文称为参考文件4)。
在参考文件1和2中所述的滤波器用作在合成单元200中的语声改善滤波器203,其由分析单元100接收作为上述编码的特征数据组的线性预测码(LPCs)。在参考文件3中所述的滤波器用作在合成单元200中的语声改善滤波器203,其由分析单元100接收自相关系数作为上述特征数据组。最后在参考文献4中所述的滤波器用作在合成单元200中的语声改善滤波器203,其由分析单元100接收唛标度倒频谱式唛倒频谱作为上述特征数据组。
图29表示在参考文件1中公开的滤波器的示意结构。这种滤波器203除了接收由合成器202提供的合成语声信号以外,由解码器201接收解码的LPC。LPC在这里是指利用由图28中表示的分析器101进行线性预测编码所得到的α特征数据。线性预测编码是一种用于根据输入语声信号波形的采样值以及根据线性预测方法确定例如为模拟人的发声器官的8到12阶的滤波器的α特征数据式滤波器系数的方法。
图30中所示的滤波器203包括滤波器204和滤波器205,滤波器204用于对合成的语声信号进行滤波,以便产生半改善的合成语声信号,滤波器205用于对该半改善的合成语声信号进行滤波,以便产生改善的合成语声信号,滤波器204和205两者都利用各α特征数据作为它们的滤波器系数。应当注意,在滤波器204中所用的α特征数据不是由解码器201提供的α特征数据αi(其中i=1、2…p;p是一预定的阶),但α1i=αi/ν-i,是利用改善的系数ν通过对α特征数据αi进行改善得到的。按照相同的方式,用在滤波器205中的α特征数据是α2i=αi/η-1,是利用改善的系数η通过改善α特征数据αI得到的。利用改善的系数ν和η对α特征数据αi的改善处理是分别由LPC改善部分206和207执行的。
下面假设滤波器204和205分别实现传递函数H(Z)的分子和分母的功能,用以将合成的语声信号转变为改善的合成语声信号。换句话说,令滤波器204和205分别为LPC滤波器和反LPC滤波器。进而,利用α特征数据αi作为滤波器系数基本按照下式进行滤波: 其中z是一变换算子z。如上所述,由于在滤波器204和205中使用的滤波器系数分别是α1i=αi/ν-i,α2i=αi/η-i,滤波器204和205的传递函数分别用1/A(z/ν)和A(z/η)的形式来表示。因而,用于将合成的语声信号变为改善的合成语声信号的传递函数可以表达如下:
H(z)=A(z/η)/A(z/υ) …(2)
图31示意表示在参考文件(2)中公开的滤波器的结构。在这种滤波器203中,在LPC改善部分206中产生的α1i利用LPC/ACC变换部分208由LPC域变换为自相关域,以及利用ACC改善部分209在自相关域内部进行带宽扩展,以及根据Levinson递推(式)利用ACC/LPC变换部分210进行由自相关域向LPC域的变换。滤波器205接收以这种方式得到的α2i。虽然,在这个示意图中除去了在图30中表示的LPC改善部分207,该参考文件2还建议一种包括LPC改善部分207的结构,该部分207的输出α2i由LPC/ACC变换部分208、ACC改善部分209和ACC/LPC变换部分210再次进行改善。
图32表示在参考文件3中公开的滤波器的示意结构。这种滤波器203是这样构成的,即除了参考文件1所述的结构以外,还有ACC/LPC变换部分211和212。ACC/LPC变换部分211接收作为在解码的特征数据组中包括的频谱信息的自相关常数,并且然后将接收的自相关常数由自相关域转变为LPC域。ACC/LPC变换部分212接收的是由ACC/LPC变换部分211接收的自相关常数中的m阶(m<p)或小于m的阶的部分,然后将接收的自相关常数由自相关域变换为LPC域。LPC改善部分206和207分别以与参考文件1相同的方式对由ACC/LPC变换部分211和212产生的α特征数据进行改善。应该认识到在这种结构中作为输入提供的自相关常数可以是已由解码器201解码的一类(即由分析器101通过计算和由编码器102通过编码得到的自相关常数),或者可以是由解码器201或合成器202根据不同类型的在解码器201中解码的频谱参数已经计算的一类。
图33到35表示在参考文件1到3中公开的语声改善(或增强)滤波器的对数功率与频谱特性曲线关系图。在这些示意图中,A到D分别表示合成器202的特性、滤波器204的特性、滤波器205的反变换特性以及传递函数H(z)。例如在图30和33中,A代表1/A(z);B代表1/A(z/υ);C代表1/A(z/η);以及D代表H(z)=A(z/η)/A(z/υ)。从与参考文件1相关的表达式(2)以及从与参考文件1到3相关的图33到35可以明显看出,滤波器204的功能是作为一个增强合成语声信号的频谱主频的以及抑制该频谱的谷值的滤波器,而滤波器205是一个消除由滤波器204引起的频谱变化率的滤波器。可以看出,利用滤波器204增强或抑制的程度当υ变大时相应增加,当υ变小时将随之随低。在参考文件1中假设η和υ满足:0≤η≤υ<1。图33表示υ=0.8,η=0.5的一个实例,图34表示利用经过一个υ=0.8的1200赫的滞后窗口的带宽扩展处理的实例;图35是p=10,m=4,υ=0.95,η=0.95的一个实例。
由在图33和34之间进行比较,或在图33和35之间进行比较可以清楚地看出:在参考文件2和3中的语声改善(或增强)滤波器与在参考文件1中公开的滤波器相比较,利用滤波器205将能够提高消除频谱变化率的效果。即在参考文件1中公开的技术将不能使滤波器205完全消除由滤波器204引起的频谱变化率。此外由于随着时间的推移,频谱变化率变化,对于固定的高频频谱增强处理将难于消除频谱变化率,从而导致(响)亮度随时间变化。相反地,在对比文件2和3中公开的技术将使得能提高频谱峰谷结构的增强效果和使频谱变化率更平缓。这将使得能防止由滤波器203造成的(响)亮度及逼真度的恶化。
应当认识到,一方面在参考文件2和3中公开的技术对在参考文件1中公开的技术进行了改进优于后者,但在另一方面则不如。例如,虽然可能取决于分析单元100的结构或取决于系统遵循的模式,在参考文件2中公开的技术存在的缺欠是所形成的改善的合成语声信号经常包含特有的畸变。这是由于在自相关域内进行极强的频谱平滑滤波处理导致频谱在接近很强的主(振)频处产生明显的畸变所引起的。这可能导致改善的合成语声信号在质量上劣于在参考文件1中公开的技术。在参考文件3中公开的技术的情况下,由于降低了在自相关域中的滤波器的阶次,经常会带来不便,即主频的位置移动很大的程度,或者多个主频集中合并为一个。这样一种不稳定的频谱变化将引起改善的合成语声信号的失真。例如通过在图35中所表示的特性曲线B和C之间进行比较,能够看出这样一种现象,即在B中具有各主频中的最低频率的的主频移动到在C中的一个较低的频率,以及引起在中部产生两个主频合并在一起的现象。此外,由于这种原因随时间变化可能产生或者可能不产生明显的主频位移,从而导致所形成的改善的合成语声逼真方面是波动的。
参考文件1到3中公开的技术还包含的一个共同的问题是使设计具有低的自由度(在特性曲线的运算和控制方面的自由度)。例如在参考文件1中公开的技术的情况下,将难于在某一范围内只通过改变υ和η而很大程度改变滤波器203的特性,在这一范围内频谱变化率和它随时间的变化的问题不会很明显。在参考文件2中公开的技术的情况下,假如对ν和滞后窗口频率设置较大的可变范围,以便提高滤波器204的主频增强效果,那么上述畸变,即由于在自相关域内部的频谱平滑处理产生的畸变将变得更明显。因此,ν和滞后窗口频率的可变范围必须限制,以使滤波器203的特性不可能产生很大的变化。在参考文件3中公开的技术的情况下,由于采用滤波器阶次作为它的控制变量(是一个限定的整数值),特性变化的自由度自然被降低。
图36示意表示在参考文件4中公开的语声改善(或增强)滤波器203的结构。在这个图中的滤波器203与上述已有技术有很大的不同,在于其接收唛标定的倒频谱作为由解码器201解码的特征数据组中包括的频谱信息,以及在于通过对改善输入的唛标定的倒频谱得到的改善的唛标定的倒频谱进行滤波将合成的语声信号变换为改善的合成语声信号,用作为它的滤波器系数。即由滤波器213对合成的语声信号滤波,将由唛标定的倒频谱改善部分214产生的改善的唛标定的倒频谱用作为它的滤波器系数。更确切地说,唛标定的倒频谱改善部分214用0替换输入的唛标定的倒频谱中的一阶分量,以及将其余的分量乘以β,因此产生改进的唛标定的倒频谱。滤波器213利用这种改进的唛标定的倒频谱作为它的滤波器系数,以便对合成的语声信号滤波,并且提供所得到的信号作为它的以改善的合成语声信号形式的输出。顺便提一下,滤波器213被称为一个唛标定的对数式的频谱模拟(MLSA)滤波器,这是由于其采用改善的唛标定的倒频谱作为它的滤波器系数。
术语唛标定的倒频谱用在这里是指由分析器101通过对输入语声信号的对数频谱的正交变换计算的特征数据。对于参考文件1至3中的技术通常不可能被利用,因此其处于一个在其中语声信息被变换为用于传输或存储的唛标定的倒频谱的系统。即倒频谱特征数据例如唛标定的倒频谱向LPC域的变换将引起频谱的几何分布的畸变,这将需要通过对合成的语声信号的重新分析对LPC计算。此外,即使经此计算的LPC包含相对于通过对于原有的语声进行分析得到的LPC的畸变,也将不能保证这种良好的语声改善特性。相反,参考文件4中的方法能够避免这些畸变的产生。
反过来这意味着在参考文件4中公开的技术将面临连贯性不佳的问题,换句话说,不可能应用于设计用来通过利用与倒频谱特征数据不同的特征数据组来合成语声信号的系统上。典型的这类系统例如是利用诸如LPC、LSP(成对的线性频谱)以及PARCOR(局部自相关系数)的特征数据组的各种系统。由于LPC、LSP和PARCOR被经常用于语声编码/解码,使这一问题很严重。假如将利用唛标定的倒频谱作为其滤波器常数的语声改善滤波器装入接收LPS(作为其中一种特征数据)的合成单元200,那么如上所述,频谱的几何分布将由于从LPC域向唛标定的倒频谱域的转变而畸变。自然这种畸变通过对合成的语声信号重新分析再次计算唛标定的倒频谱能够被削弱到某种程度。尽管按照这种方式已经对唛标定的倒频谱进行了计算,然而,与由原有语声产生的唛标定的倒频谱相比较,其依然包含较多的畸变。因此并不具有预期的良好的语声改善特性。
发明内容
本发明的第一个目的是提供一种语声改善(或增强,在下文将省略)滤波器,其能在可允许的频谱变化率的范围内具有良好的主频增强效果。本发明的第二个目的是提供一种语声改善滤波器,其能在不会在主频结构中引起明显畸变程度的前提下保证良好的主频增强效果。本发明的第三个目的是提供一种语声改善滤波器,其能利用比现有技术的数量要少的结构装置,实现与现有技术相同的主频增强效果。本发明的第四个目的是提供一种语声改善滤波器,其能选择性地进行控制(响)亮度、减少处理程序步骤、改进清晰度等等。本发明的第五个方面是提供一种具有高度设计自由度的语声改善滤波器,能在与输入的频谱信号所属的域具有不同属性的域内不再需要验证稳定性。本发明的第六个目的是提供一种语声改善滤波器,其适用于由分析单元接收作为频谱信息的LSP、PARCOR、LAR(对数面积比)的合成单元。本发明的第七个目的提供一种语声改善滤波器,其能根据作为频谱信息输入的LSP、PARCOR、LAR等等在不需要任何频谱重新分析或特征数据变换的情况下保证具有良好的连贯性。本发明的第八个目的是通过利用能够实现上述第一到第七个目的的语声改善滤波器来实现一语声合成系统。
根据本发明的第一个方面,合成的语声信号经过具有由滤波器系数限定的传递函数的滤波器进行滤波,以便产生改善的合成语声信号。这种滤波器常数的产生是根据以多维矢量的形式代表的以及属于一预定的域和与输入的语声信号有关的频谱信息,并按照这样一种方式即根据上述频谱信息和与合成语声信号的频谱信息相比较,使改善的合成语声信号的主频特性被增强而产生的。可利用作为频谱信息的是LSP信息、PARCOR信息和LAR信息中的任何一种。由于LSP信息、PARCOR信息和LAR信息具有特定的特征,用于产生滤波器系数的运算可以按这样一种属性的运算,即与各维相关的计算与其余各维相关的计算无关的方式来进行。当利用LSP、PARCOR或LAR信息来产生滤波器系数时,无须将它们由LSP、PARCOR或LAR域变换到另一个域就能保证滤波器稳定性。应注意,例如在利用由LPC信息产生的滤波器系数的滤波器中,需要将滤波器系数由LPC域转变为另一个域,以便保证滤波器的稳定性。因而,根据本发明的第一个方面,与利用由LPC信息产生的滤波器系数的现有技术相比,本发明的滤波器不会造成不稳定,因而更易于设计语声改善处理或滤波器。此外,将这一方面应用到传输或存储LSP信息、PARCOR信息或LAR信息的系统将不需要任何频谱重新分析和特征数据变换,因此可以保证良好的连贯性。
在LPC域、LSP域和PARCOR域的其中任一个域内可以进行本发明中的滤波。换句话说,本发明中的滤波器系数可以属于LPC域、LSP域和PARCOR域中的任何一种。根据本发明的第二方面,频谱信息首先在其所属的一个域内进行改善,以便产生改善的频谱信息,然后将改善的频谱信息由该域变换到LPC域,以便产生滤波器系数,将因此得到滤波器系数用于在LPC域进行滤波。由于各种各样的改善系数可以应用于这种改善,本发明的这一方面,可以使得根据使用者要求的滤波特性(合成的语声信号改善特性)能够更自由地调制滤波器系数的综合。
根据本发明的第三个方面,对频谱信息进行改善,使之能够降低改善的合成语声信号的主频的各峰值。因此将使得能够在允许的频谱变化率的范围内得到良好的主频增强的效果以及在主频结构中不会引起任何明显程度的畸变的情况下得到良好的主频增强效果。
可认为是用于改善的第一方法是这样一种方法,其中与输入语声信号有关的频谱信息和属于同一域的参考信息根据改善的系数被按比例地分割。当频谱信息是LSP信息时,这种方法是可利用的。取决于设定参考信息的各种方法,这一方法将使得能够进行如下的改善,例如:用于将固定的频谱变化率赋予到改善的合成语声信号上的改善;用于将反映平均噪声频谱的频谱变化率赋予到改善的合成语声信号上的改善(即用于轻微增强不同于噪声频谱的语声频谱的改善);用于将改善的合成语声信号赋予到反映迄今频谱信息已经跟踪的经历的频谱变化率上的改善(即用于增强在语声频谱的变化量的改善)。这将使得能够有效地控制响亮度、降低信息处理步骤以及改进清晰度。这种方法还使得本发明的滤波器能够进一步提供其它辅助性的滤波处理的特性(例如固定的高频增强处理)。
可以认为是用于改善的第二方法是这样一种方法,其中对于与输入语声信号相关的多维构成的频谱信息中的每一个,利用改善的系数或利用改善的系数的乘方与频谱信号相乘。这种方法当频谱信息是PARCOR信息或LAR信息时是可使用的。这种方法还能保证上面列举的某些效果,例如减少处理,改进清晰度等。应当理解,当频谱信息是PARCOR信息时,本方法的采用为用改善的系数的乘方乘以频谱信息,而所述乘方取决于频谱信息的维数。
可认作为用于改善的第三方法是这样一种方法,其中在代表与输入的语声信号相关的频谱信息的多维之中相邻的维之间的距离被扩展。更确切地说,当相邻维之间的距离小于一参考距离时,该距离被扩展到参考距离之外,并且在此之后,所述距离相对于所有的各维均衡地收缩,以便保证频谱信息就其整体上的范围变得与扩展以前的范围一致。当频谱信息是LSP信息时,这种方法是可使用的。这种方法能够改善频谱信息,使得改善的合成语声信号的频谱变平,并且能保证上面列举的某些效果,例如在平滑频谱变化率中减少处理步骤和改进清晰度。此外,还可实现相对第一和第二方法减少处理步骤或部件。
还可看出,第一和第三改善方法可以彼此结合。在这种情况下,第一方法和第三方法可以选择性使用,或交替使用,两者可以结合使用。关于每种方法相对其它两种方法的优点以及三种方法之间的差别,对于本技术领域的熟练人员通过下面对各实施例的介绍将会是易于明了的。
第一到第三改善方法可以概括如下:首先形成一转换表,其存储关于与改善的频谱信息相关的输入的语声信号的频谱信息并且响应对频谱信息的提供产生改善的频谱信息;其次形成一中间网络,其利用记忆具有将频谱信息变换为改善的频谱信息的能力,以便通过关于输入的语声信号的频谱信息,能够产生改善的频谱信息。最好为若干彼此不相重叠以及通过对关于输入语声信号的频谱信息所属的域进行分类得到的范畴的其中之一提供该转换表和中间网络,或者通过转换用于每一范畴的系数来转换它们的作用的同时,将它们加以利用。这将使得通过范畴划分能够提供自适应的控制和降低在范畴边界处的畸变。对每一个范畴还可以利用与第一到第三方法不同的改善方法。
根据本发明的第四个方面,在LSP域和PARCOR域的其中之一内部进行滤波,在这样一个域内部改善关于输入的语声信号的频谱信息,这个域是该频谱信息所属的域,并且将形成的改善的频谱信息用作滤波器系数。这个方面将不再需要对与改善的频谱信息相关的域进行转换,从而使得能够利用较现有技术数量较少的构成元件得到基本上与现有技术相同的主频增强效果。
根据本发明的第五个方面,与合成的语声信号的主频相比,所进行的滤波使改善的合成语声信号的主频进一步增强。根据本发明的第六个方面,在第五个方面中,赋予到改善的合成语声信号的频谱变化率被抑制。
根据本发明的第七个方面,根据按多维矢量表示的和属于一预定域以及与输入的语声信号相关的频谱信息产生合成的语声信号,并且在此之后,根据该频谱信息进行包含上述各方面的处理。根据本发明的第八个方面,根据按照多维矢量表示的和属于一预定域的以及与输入的语声信号相关的第一频谱信息产生合成的语声信号,以及将第一频谱信息变换为属于一与迄今第一频谱信息所属域不同的一个域,然后,根据第二频谱信息进行包含上述各方面的处理。根据本发明的第九个方面,根据与输入的语声信号相关的和属于一预定域的以及由多维矢量代表的第一频谱信息产生合成的语声信号,以及分析合成的语声信号,以便产生第二频谱信息,然后根据第二频谱信息进行包含上述各方面的处理。
根据本发明的第十个方面,在进行包含第七到第九个方面的处理之前,将通过分析输入的语声信号产生频谱信息或第一频谱信息,以及将该频谱信息或第一频谱信息存储或传输。
附图说明
图1和图2是方块图,表示根据在本发明的各优选实施例中的根据LSP的实施例的语声改善滤波器的结构;
图3是一通过举例的方式表示语声分析/合成系统结构的方块图;
图4是表示LSP改善法的一实例的方块图;
图5是通过比例分割产生改善的LSP的方法的解释性示意图;
图6和图7是表示LSP改善法的实例的方块图;
图8是表示在本发明的各优选实施例中间的基于LSP实施例的对数功率与频谱特性曲线关系图,这些特性曲线是在采用在图1所示结构中通过比例分割产生改善的LSP的方法的情况下得到的;
图9是表示LSP改善法的实例的方块图;
图10是表示在本发明的优选实施例中间的根据LSP的实施例的对数功率与频谱特性曲线关系图,这些特性曲线是利用在图2所示结构中通过扩展在相邻维之间的距离产生改善的LSP的方法的情况下得到的;
图11、12、13、14、15和16是方块图,表示LSP改善法的一个实例;
图17和18是方块图,表示在本发明的各优选实施例中根据在LSP域内进行滤波的一个实施例的语声改善滤波器的结构;
图19是方块图,表示在本发明的各优选实施例中间根据一基于PARCOR的实施例的语声改善滤波器的结构;
图20是曲线图,表示在本发明的各优选实施例中的基于PARCOR实施例的对数功率与频谱特性曲线的关系;
图21和22是方块图,表示在本发明的各优选实施例中的根据在PARCOR域内进行滤波的一个实施例的语声改善滤波器的结构;
图23是一方块图,表示在本发明的各优选实施例中的根据一基于LAR的实施例的语声改善滤波器的结构;
图24是一曲线图,表示在本发明的各优选实施例中的基于LAR的实施例的对数功率与频率特性曲线的关系;
图25和26是方块图,表示在本发明的各优选实施例中的根据在LAR域或PARCOR域内进行滤波的实施例的语声改善滤波器的结构;
图27是方块图,表示在本发明的各优选实施例中的根据利用多个特征数据的实施例的语声改善滤波器的结构。
图28是方块图,通过举例的方式表示一语声分析/合成系统的结构;
图29是方块图,表示语声改善滤波器的使用方式;
图30、31和32是方块示意图,分别表示在参考文件1、2和3中公开的语声改善滤波器的结构;
图33、34和35是曲线图,分别表示在参考文件1、2和3中公开的语声改善滤波器的对数功率与频谱特性曲线的关系;
图36是方块图,表示在参考文件4中公开的语声改善滤波器的结构。
具体实施方式
下面参照附图介绍本发明的各实施例,其中与在图28到36中表示的现有技术相同和相应的构成元件使用相同的参考数码来标注,并且不再进一步解释。应指出,对于各个实施例为共同的构成元件也用相同的参考数码标注,并将不再重复解释。a)基于LSP的实施例
首先参阅图1和图2,其中表示在根据本发明的滤波器203的各优选实施例中的接收LSP作为在经解码的特征数据组中的频谱信息的两个实施例。在图1中所示的实施例包含LSP改善部分216和217以及LSP/LPC变换部分218和219,还有滤波器204和205。另外在图2中所示的实施例除了滤波器204以外还包含LSP改善部分216和LSP/LPC变换部分218。
这些实施例可以用在图30或3中所示的结构的合成单元200中。在利用解码器201能够输出作为特征数据组的一个成分的情况下,如图29所示,滤波器203可以直接接收来自解码器201的输出,而在利用不能输出作为特征数据组的一个成分的解码器201的情况下,来自解码器201的输出必须通过变换部分215变换到LSP域,然后提供到滤波器203,如图3所示。应当认识到变换部分215可以合并到解码器201或合成器202中。
LSP改善部分216和217由解码器201或变换部分215接收以多维矢量形式的LSPωi,并且按照预定的方法改善ωi,以便分别产生改善的LSPωhli和ωh2i。LSP/LPC变换部分218和219将ωh1i和ωh2i分别由LSP域变换为LPC域,以便产生改善的α特征数据α1i和α2i。滤波器204和205顺次地分别利用α1i和α2i作为它们各自的滤波器系数对合成的语声信号进行滤波。因此,滤波器205提供改善的合成语声信号作为它的输出。下面令滤波器204和205的传递函数分别为1/A1(z)和A2(z),然后可以给出图1中的滤波器203的传递函数如下:
H(z)=A2(z)/A1(z) …(3)以及可以给出图2中的滤波器203的传递函数如下:
H(z)=1/A1(z) …(4)
在本发明的基于LSP的实施例中,按照这种方式,作为其中一个特征数据接收的LSPωi被改善以及将改善的LSPωh1i(和ωh2i)由LSP域变换为LPC域,因此产生作为改善的α特征数据的滤波器系数α1i(和α2i)。因此得到的基于LSP的实施例的第一个优点是由于在LSP域内可以检查稳定性,因此易于验证和保证滤波器203是稳定的。更确切地说,众所周知,当LSPωi满足如下一系列的条件时利用LSPωi的滤波器是稳定的;该条件是:
0<ω1<ω2<…<ωp<π …(5)因此,只要采用满足方程(5)的LSP作为滤波器系数,对于相应的i可以独立地进行用于产生α1i和α2i的处理,不会使滤波器产生不稳定,因此,实现了滤波器设计的高度的自由度。例如,通过对于高阶的维的增强程度设定到相对大的数值,就可以实现一个能够增强语声高频分量的滤波器。相反,在利用α特征数据或自相关常数以便产生滤波器系数的情况下,由于利用根据这样一些特征数据的滤波器系数将难于验证和保证滤波器的稳定性,只有验证不会使滤波器产生不稳定的情况下才能利用该处理来产生α1i和α2i。因而,当采用基于α特征数据的或基于自相关的滤波器系数时,在不会使滤波器产生不稳定的情况下,可以不进行对于相应的i或通过调节沿频率轴的增强程度而进行的改善处理。
基于LSP的实施例的第二个优点是对于传输或存储作为频谱信息的LSP的系统有较高的适用性。特别是近年来已经开发的大多数语声编码/解码系统都力图利用LSP作为频谱信息。本发明的根据LSP的实施例易于应用到这些类型的语声编码/解码系统。即由于不需要重新分析频谱和对特征数据变换,对于这些类型的系统能够得到良好的连贯性,这与在参考文件4中公开的现有技术即根据输入的唛一标定的倒频谱确定滤波器系数是不相同的。
从上面的介绍可以明显看出,在本发明的基于LSP的实施例中的滤波器203的传递函数H(z)将取决于为了得到滤波器系数α1i和α2i进行的LSP改善操作和LSP/LPC变换操作的方式。对于LSP改善操作的一种优选方法首先是进行比例分割改善和其次是进行相邻的维对维的距离扩展。
比例分割改善方法首先是这样一种方法,即其中利用改善的系数υ,η(满足0≤υ≤η<1)作为比例分割比率,对ωi进行按比例的分割。当按图1中的结构执行这种方法时,LSP改善部分216和217每个具有包括如在图4中所示的比例分割操作部分220和变化率设定部分221。根据用于比例分割的如下表达式,该比例分割操作部分220产生ωh1i或ωh2i,其中:
ωh1i=ωi×(1-υ)+ωfi×υ或 …(6)
ωh2i=ωi×(1-η)+ωfi×η其中i=1、2…p。
设定部分221根据线性预测阶次P设定在比例分割操作部分220中的ωfi。应当认识到用在LSP改善部分216中的ωfi在数值上可以不同于部分207的ωfi。此外,通过比例分割对ωfi的改善可以适用于图2所示的结构。
比例分割的第一个优点是能保证改进的主频增强的效果。即当通过比例产生的ωh1i和ωh2i由LSP域变换为LPC域时,主频变得不鲜明,从而可以得到良好的主频增强效果。″主频变得不鲜明″在这里意指″主频的峰值变小了″,换句话说,″频谱特性曲线被平化,留下的频谱稍有峰一谷的结构″。
比例分割的第二个优点是保证按照使用者的需求对特性曲线进行设计的高度自由度,例如改变对每个频带的改善合成语声信号的程度。具体地说,通过设计ωfi(除了υ和η以外),可以改变滤波器203的特征,以便满足使用者的需求。这种设计的高度的自由度将产生这样一种效果,即在可允许的频谱变化率的范围内,可易于得到超过常规技术的较好主频增强效果。
要指出,有几种设定ωfi的方法。第一种方法是将表示平化的频谱的LSP设定为ωfi,按照这种方法实现的变化率设定部分221以这样一种方式设定ωfi,即根据如下的表达式,ωfi相邻的维对维的距离(ωfi-ωfi-1)导致形成如π/(p+1)所表示的某一数值,表达式为
ωfi=π×i/(p+1) …(7)图5概念性地表示作为一个实例的ωh1i的产生,当按照表达式(7)设定ωfi时,将进行利用比例分割操作的改进。要注意,这里假设p=10。这种方法具有的优点是在变化率设定部分221中它的功能的简化。
第二种方法是将表示固定的变化率的频谱的LSP设定为ωfi。按照这种方法实现的变化率设定部分221以这样一种方式设定ωfi,即ωfi相邻维对维的距离按照通过将与i无关的项δ(i)加到表达式(7)得到的如下表达式线性地上升或下降,该表达式为:
ωfi=π×i/(p+1)+δ(i) …(7a)在这种情况下,通过上面介绍和图5所示部分使本技术领域的熟练人员能够易于看出,怎样发生比例分割改善作用。这种首先具有的优点是由于可以将基本上固定的变化率赋予到滤波器203的特性(曲线上)通过设定ωi的比例系数使得能够控制(响)亮度。其次具有的优点是,由于这一滤波器203的传递函数H(z)可以包含固定的高频增强处理的特性(曲线)使得能够减少处理的操作步骤,而这增强处理可以与常规主频增强处理几乎同时地实施。第三具有的优点是,通过将δ(i)变为δ(ωi)以及对利用图4用虚线表示的它的功能方块图进行改善,能够将其用于限制(响)亮度变化。
第三种方法是对经过例如比例分割处理来改善代表平均噪声频谱的LSP得到的LSP设定作为ωfi。按照这样方法实施的变化率设定部分221,根据如下表达式根据比例分割比率υ′或η′,通过改善代表平均噪声频谱设定ωfi,如图6所示,该表达式为:
ωfi=ωi′×(1-υ′)+ωi′×υ′或
ωfi=ωi′×(1-η′)+ωi′×η′ …(7b)其中i=1,2,…p。这种方法的优点在于,由于能够多少增强语声频谱部分而不是噪声频谱部分,从而提高了清晰度。顺便说一下,通过在利用如在图6中所示的判别部分222已经判别为噪声周期的一个周期内的ωi经过平均运算部分223进行平均可以得到ωi′。此外最好使对ωi′进行设定的改善处理不要对改善的合成语声信号赋予太急剧的频谱变化。例如,假如使ωfi太不鲜明,将变得可以阻止在改善的合成语声信号中产生任何急剧的频谱变化。
第四种方法是对例如通过比例分割,在开始作用后一直到目前的周期过程内或在经过的预定周期内的一个平均值进行改善得到的LSP设定作为ωfi。如图7所示,利用这种方法实现的变化率设定部分221求出经过平均运算部分223的经过的LSPωi的平均值ωi′,以及根据这个ωi′和比例分割比率υ′或η′以及按照表达式(7b)设定ωfi。这种方法的优点是基于能够增强语声频谱中的变化来改进清晰度。此外,为了执行这一方法,最好考虑例如改善ωi′,以便对改善的合成语声信号不要赋予太急剧的频谱变化。
然后参阅图8,该图表示在图1中所示的滤波器203的对数功率对频谱特性曲线的关系,当根据表达式(6)和(7)改善ωi时,将出现所示关系。在该曲线图中,A、B、C和D分别代表合成器202的特性(=)1/A(z)、滤波器204的特性(=)1/A(z),滤波器205的逆变换特征(=)1/A2(z),以及滤波器203的传递函数H(z)=A2(z)/A1(z),其中υ=0.5和η=0.8。如这一曲线图所示,这一曲线图中的特性曲线D被平化,而与图33中的特性曲线D相比,则许可频谱具有一定程度的峰谷结构。在图8中按照这种方式与图33相比可以看出较好的主频增强效果。此外,这一曲线图中特性曲线D与图34中的特性曲线D相比对于频谱的峰谷结构具有较少的畸变。此外,这一曲线图中的特性曲线D不再存在于在图35中的特性曲线B和C已经观察到的两种现象,即在最低频率处的主频的位移和在中部的两个主频的合并体。为了得到类似的优点作为对比例分割处理的一种替换方案,可以采用具有在LSP域中使主频钝化的效果的其它处理方案。
本发明人已经将按照表达式(6)和(7)表示的方法由改善ωi的这一实施例的滤波器203产生的改善的合成语声与由早先介绍的先有技术的滤波器203产生的改善的合成语声进行比较。因此,已经指明,在抑制(响)亮度恶化方面这一实施例的语声改善滤波器具有超过先有技术的滤波器的优点,以及这一实施例不会产生任何独有的失真的语声或波动的音调。
如图9所示,作为LSP改善操作的第二优选实施例的相邻的维对维的距离扩展可以利用扩展部分224和均匀压缩部分225来执行。扩展部分224通过移动ωi产生Si,其中Si和ωi两者都属于LSP域,因此,相邻的维对维的距离Si-Si-1可以大于相邻的维对维的距离ωi-ωi-1(关于ωi-ωi-1,参阅图5)。均匀压缩部分225由Si求出ωh1i。应指出,确切地说,Si以及ωi都是一多维矢量。当按照图2中的结构执行这一方法时,均匀压缩部分225根据如下表达式求出ωh1i,该表达式为:
ωh1i=Si/Sp+1×π …(8)以及扩展部分224根据如下表达式求出Si,该表达式为:
Si=Si-1+max(ωi-ωi-1,th) …(9)其中i=1,2,…p+1
ωo=0,ωp+1=π,So=0
th:阈值
由上述表达式(8)和(9)可以明显看出,相邻的维对维的距离扩展是一种处理,用于由例如由表达式(9)右侧的第二项具体限定的ωi-ωi-1与th比较的结果,在第(i-1)维和第i维之间至少确定一个距离。这种处理使得与第(i+1)或较高维相关LSP一起向上位移一与th-(ωi-ωi-1)相对应的距离。此外,包含在表达式(8)的右侧中的因子π/Sp+1是一个用于响应于范围0到π的ωi和LSP的范围0至Sp+1的Si中的比率均匀压缩相应的维对维的距离的因子。应理解,本发明不应被限制于这一限定的表达式,其它限定的表达式也可以采用,只要它们代表用于扩展较小的相邻的维对维的距离的处理即可。此外,通过相邻的维对维的距离扩展得到ωi可以适用于图1所示的结构。这将使得能够进一步增加对滤波器203的特性(曲线)设计的自由度。
下面参阅图10,该图表示对数功率与频谱特性(曲线)的关系,将这一方法应用于图2中的滤波器203,可以出现这种关系。在这一曲线图中,A、B和C分别表示合成器202特性曲线(=)1/A(z),滤波器204(th=0.3)特性曲线(=)1/A1(z;th=0.3)以及滤波器204(th=0.4)特性曲线(=)1/A1(z;th=0.4)。由这一曲线图可以明显看出,这一方法使得这些特性曲线可以与仅存在滤波器204的图33和34相比较(换句话说,没有使用滤波器205或与之对应的任何构成元件)。这意味着,利用比已知的滤波器的阶次要低的滤波器能够实现良好的语声改善滤波器,以及利用较少数量的构成元件就能实现与常规滤波器基本相同的主频增强效果。此外,本发明按照声学将这一实施例中得到的改善的合成语声与用常规技术得到的进行比较。因此,已经表明使用这一实施例的语声改善滤波器将能保证音调质量绝不在已有滤波器之下。
两种改善方法即比例分割改善法和相邻的维对维的距离扩展法不是互相排它的,因此,它们可以综合使用。例如还可以考虑,LSP改善部分216和217中的一个执行比例分割,而另一个控制相邻的维对维的距离扩展。另外,如图11所示,可以采用这样一种结构,即其包括转换装置228和229,用于选择性地利用比例分割改善部分226,以便通过该比例分割改善ωi,以及包括相邻的维到维的距离扩展部分227,以便扩展LSP的相邻的维对维的距离。比例分割改善部分226可以具有在图4、6和7中所示的上述结构中的任何一种。另外,如图12所示,可以采用比例分割改善部分226和相邻的维对维距离扩展部分227串级相连的一种结构。通过利用具有用作比例分割改善部分226和相邻的维到维的距离扩展部分227的单体的LSP改善部分的结构,可以进一步提高滤波器203的特性(曲线)设计自由度,还可指明,在图12中所示的比例分割改善部分226和相邻的维对维距离扩展部分227的顺序可反转。自然,其它的处理方式可以与比例分隔改善和相邻的维到维距离扩展中的两者或任一个相结合。
此外,可以利用LSP改善部分216和217执行ωi自适应处理。可认为是使根据比例分割的ωi改善处理成为ωi自适应的方法例如是这样一种方法,在该方法中,一个ωi空间被分为若干个彼此不相重叠的子空间(下文称为范畴)以及其中对于每一个范畴,υ和η是准备的(或转换的)。在这种情况下,对于每一范畴可以提供LSP改善部分,例如对应于第一范畴为一LSP改善部分216-1(或217-1),对应于第二范畴为一LSP改善部分216-2(或217-2),…对应于第n范畴为一LSP改善部分216-N(或217-N)(参见图13)。另外,单一的LSP改善部分216(或217)可以和用于响应各范畴或i转换υ和η的改善的系数转换部分230一起准备(见图14)。ωi自适应处理具有的优点是实现灵活的处理,例如仅对于一指定的范畴,例如当主频的增强提高时会引起畸变的一个范畴,使主频增强程度被削弱。这将能保证滤波器203的特性曲线改进,使之均匀或畸变减少。应以识到,由于ωi是一多维矢量,这里所称的范畴一般是一多维矢量空间。
最好在LSP改善部分216和217中的ωi改善处理通过利用图15所示转化表231来实现。更确切地说,准备该用于使ωi和ωh1i或ωh2i相关的转化表231,以使LSP改善部分216或217当参照ωi时能够提供ωh1i或ωh2i作为它的输出。利用转化表231的优点在于降低处理时间。假如将一相对复杂的表达式用作一用于ωi改善处理的主要表达式,这一优点变得更显著。
可以利用中间网络232来在LSP改善部分216和217实施ωi改善处理,这个网络先前已经例如利用如在图16中所示的表达式(6)讨论的ωi改善特性说明过。利用中间网络232的第一个优点是减少处理时间。假如使用一个相对复杂的表达式作为用于ωi改善处理的原理表达式,这种优点将变得更加显著。利用中间网络232的第二个优点是存储器的容量可以降低,这是由于与利用转化表231的情况相比较,不需要存储该转化表231。
利用中间网络232的第三个优点是降低了畸变。例如,在图13、14中所示的ωi自适应实施例中,由于在范畴的边界之外的ωi的轻微变化引起的υ和η的急剧变化,在改善的或半改善的合成的语声信号中在范畴的边界处经常出现畸变。特别是当ωi空间的分割相对粗略时,畸变会变得更显著。在图15所示的转化表实施例中,像图13和14的实施例一样以相同的方式经常在表地址的边界处出现畸变。相反,在图16所示的中间网络实施例中,由于没有引起υ和η急剧变化的范畴,故不会产生畸变。
本发明的根据LSP的实施例并非试图限制进行LPC滤波和反LPC滤波的结构,还将允许利用与LPC不同的特征数据作为它的滤波器系数。例如,如图17和18所示,本发明可以利用LSP滤波器233(以及反LSP滤波器234)来实施,该滤波器利用ωh1i(和ωh2i)作为滤波器系数(当ωh1i是该系数时)。这种结构的优点在于,不再需要LSP/LPC变换部分218和219。b)根据PARCOR的实施例
参照图19,该图表示了输入PARCOR作为频谱信息的实施例。这个实施例除了LPC滤波器204和反LPC滤波器205以外,包含PARCOR改善部分235和236以及PARCOR/LPC变换部分237和238。PARCOR改善部分235由解码器201或变换部分215输入PARCORi作为频谱信息并改善这一i,产生改善的PARCORh1i。按照相同的方式,PARCOR改善部分236产生改善的PARCORh2i。PARCOR/LPC变换部分237将h1i由PARCOR域变换为LPC域,以便产生用于LPC滤波器204的滤波器系数α1i。PARCOR/LPC变换部分238还将h2i由PARCOR域变换为LPC域,以便产生用于反LPC滤波器205的滤波器系数α2i。
PARCOR改善部分235和236根据如下表达式,利用改善的(例如满足0≤η≤υ<1)系数υ和η,产生h1i和h2i,该表达式为:
h1i=i×υ(i×i)
h2i=i×η(i×i) …(10)其中i=1,2,…p。
进行这种改善能够使主频在PARCOR域平化。
因而,这一实施例将像上述根据LPC的实施例一样保证相同的特性曲线改进效果(例如主频增强效果,以及在判别这种增强程度的能力方面的改进)以及按照使用者的需求自由地控制/设定滤波器203的特性(曲线)。自然,本发明不应受表达式(10)的限制,可以采用在PARCOR域内使主频被平化的其它处理方式。此外,对于利用PARCOR或根据PARCOR产生的特征数据作为其滤波器系数的滤波器,由于稳定性条件是如下的简单表达式给定的,故相对易于验证和保证在PARCOR域的稳定性。该表达式为:
-1<i<1 …(11)
换句话说,只要满足表达式(11),利用根据PARCOR的滤波器系数的滤波器是稳定的。因此,根据这一实施例,提高了滤波器设计自由度的程度。例如,可以利用对于相应的i独立地改善PARCORi的处理作为一PARCOR改进处理。此外,由于不需要对频谱重新分析和特征数据变换,使用传输或存储作为频谱信息的PARCOR的系统将保证具有良好的连贯性。图20以曲线形式表示在图19中的滤波器203的对数功率对频谱特性(曲线)的关系。在这一图中,A、B、C和D分别表示合成器202特性曲线(=)1/A(z)、滤波器204特性曲线(=)1/A1(z),滤波器205反变转特曲线(=)1/A2(z),以及滤波器203特性曲线(=)A2(z)/A1(z),其中υ=0.98和η=0.9。通过在图20和33之间进行比较明显看出,这一实施例允许频谱峰谷结构某种程度上出现比在参考文件1所示的结构的峰谷变化更强。通过对改善的各合成语声的声学比较,本发明已经证实、使用这一实施例的滤波器203将肯定不会引起任何独有畸变的语声或任何波动的音调,并将保证良好的主频增强效果。
由本说明书所作的公开对于本技术领域的熟练人员将很明显:这一基于PARCOR的实施例的细节可以与根据LSP的实施例的同样方式构成。由本说明书所作的公开对于本技术领域的熟练人员也将易于理解,可以不用反LPC滤波和在图21中所示的与之相关的元件而采用如图22中所示的包括PARCOR滤波器239和利用改善的PARCORh1i和h2i(作为其滤波器系数)的反PARCOR滤波器240。c)根据LAR的实施例
在图23中表示了一个输入LAR作为频谱信息的实施例,这一实施例除了LPC滤波器204和反LPC滤波器205以外还包含LAR改善部分241和242以及LAR/LPC变换部分243和244。LAR改善部分241由解码器201或变换部分205输入作为频谱信息的LARψi,并且改善这一ψi,以便产生改善的LARψh1i。按照相同的方式,LAR改善部分242也产生改善的LARψh2i。LAR/LPC变换部分243将ψh1i由LAR域变换到LPC域,以便产生用于LPC滤波器204的滤波器系数α1i。LAR/LPC变换部分244将ψh2i由LAR域变换为LPC域,以便产生用于反LPC滤波器205的滤波器系数α2i。
按照如下的表达式,利用例如满足0≤η≤υ<1的改善的系数υ和η,LAR改善部分241和242分别产生ψh1i和ψh2i。该表达式为:
ψh1i=ψi×υi
ψh2i=ψi×ηi …(12)其中i=1,2,…p进行这种改善能使主频在PARCOR域内平化。
因而这一实施例将像上述根据LPC的实施例和根据PARCOR实施例一样具有相同的特性(曲线)改进效果(例如主频增强效果,调节所述增强程度的能力上的改进),以及按照使用者的需求由控制/设定滤波器203的特性(曲线)。自然本发明不应受表达式(12)的限制,能够在LAR域内使主频被平化的其它处理方案也可以采用。由于当使用根据LAR产生的滤波器系数时,能够验证和保证滤波器是稳定的,在这一实施例中的LAR改善处理不受滤波器稳定性方面的限制。此外,应用于传输或存储作为频谱信息的PARCOR的系统将保证良好的连贯性,这是由于对频谱重新分析和特征数据变换。
图24以曲线图方式表示在图23中的滤波器203的对数功率对频谱特性曲线的关系。在这一图上,A、B、C和D分别表示合成器202特性曲线(=)1/A(z)、滤波器204特性曲线(=)1/A1(z)、滤波器205反变换特性曲线(=)1/A2(z)以及滤波器203特性曲线(=)A2(z)/A1(z),其中υ=0.9,η=0.7。通过在图24和33之间进行比较表明,这一实施例允许频谱被平化而留下某种程度的频谱峰谷结构,从而导致与在参考文件1中公开的结构相比,具有更好的主频增强效果。此外,与图34比较,图24表示由频谱的峰谷结构包含的畸变较少。在图24中不再产生在中部两个主频合并体的现象,这一点由在图35的特性曲线B和C的比较将变得很明显。通过以声学方式比较改善的合成语声,本发明已经指明,使用这一实施例的滤波器203肯定不会引起任何独有畸变失真的语声和任何波动的音调,将能保证良好的主频增强效果。
根据本说明书的所作公开,对本技术领域的熟练人员很明显,基于LAR的这一实施例的细节可以由与基于LSP的实施例和基于PARCOR的实施例一样的方式构成。由本说明书的所作公开,对于本技术领域的熟练人员还将易于认识,可不使用反LPC滤波和在图26中所示的与其相关的构成元件,而采用包括PARCOR滤波器239和利用改善的LARψhi和ψh2i作为其滤波器系数的反PARCOR滤波器240。此外,为了将改善的LARψh1i和ψh2i由LAR域变换到PARCOR域,在图26中设有LAR/PARCOR变换部分246和247。由于一般LAR/PARCOR变换处理比LAR/LPC变换相对简单和容易,因此可以利用比LAR/LPC变换部分243和244处理步骤较少或使用较小的电路结构就能实现LAR/PARCOR变换部分246和247。因此根据图27的实施例,在比图23和25实施例要短的周期内产生滤波器系数α1i和α2i,由滤波器203进行的整个处理步骤会降低。d)补充
由本说明书所作的公开对于本技术领域的熟练人员将会易于认识到,可以对上述的根据LSP的实施例,根据PARCOR的实施例和根据LAR的实施例选择性地结合。由本说明书所作公开对于本技术领域的熟练人员还能易于认识到,可以将本发明的每一实施例与常规的根据LPC的装置相结合。这些不同的结合有助于实现按照其它方式不能实现的,特性设计具有高自由度的滤波器203。例如,如图27所示,滤波器204的滤波系统数α1i可以利用与参考文件1一样的方法来确定,而滤波器205的滤波系统α2i可以利用与基于PARCOR的实施例一样的方法来确定。这种结构将使滤波器203出现比图33的特性曲线D要小的频谱变化率,以及比图34的特性曲线D在主频的附近产生的畸变要少。
可以将另一个滤波器配置在滤波器203之前或之后,或与滤波器203并联,以便进行音调增强处理、高频增强处理、主频增强处理等等。
Claims (29)
1.一种滤波器,包含:
滤波装置,用于通过由滤波器系数限定的传递函数对合成的语声信号进行滤波,以便产生改善的合成语声信号;以及
滤波器系数产生装置,用于根据以多维矢量形式表示的以及属于一预定域的和与输入的语声信号相关的频谱信息,按照这样一种方式即根据所述频谱信息以及与所述合成的语声信号的频谱信息相比较增强所述改善的合成语声信号的主频特性的方式产生所述滤波器系数;
所述频谱信息是LSP信息、PARCOR信息和LAR信息中的任何一种。
2.根据权利要求1所述的滤波器,其中
所述的滤波器系数属于LPC域。
3.根据权利要求2所述的滤波器,其中
所述的滤波器系数产生装置包括:
改善装置,用于改善在所述预定域内的所述频谱信息,以便产生改善的频谱信息;以及
一装置,用于将所述改善的频谱信息由所述的预定域变换到LPC域,以便产生所述滤波器系数。
4.根据权利要求3所述的滤波器,其中
所述改善装置包括平化装置,用于改善所述频谱信息,以便降低所述改善的合成语声信号的主频峰值。
5.根据权利要求4所述的滤波器,其中
所述的频谱信息是LSP信息,以及其中
所述平化装置,包括比例分割装置,用于根据改善的系数,所述频谱信息和直接属于所述频谱信息所属的同一个域的参考信息,以便产生所述改善的频谱信息。
6.根据权利要求5所述的滤波器,其中
所述比例分割装置,对所述频谱信息和所述参考信息进行比例分割,以便将一固定的频谱变化率赋予到所述改善的合成语声信号上。
7.根据权利要求5所述的滤波器,其中
所述比例分割装置对所述频谱信息和所述参考信息进行比例分割,以便将反映平均噪声频谱的频谱变化率赋予到所述改善的合成语声信号上。
8.根据权利要求5所述的滤波器,其中
所述比例分割装置对所述频谱信息和所述参考信息进行比例分割,以便将反映所述频谱信息迄今已经跟踪的经历的频谱变化率赋予到所述改善的合成语声信号上。
9.根据权利要求4所述的滤波器,其中
所述频谱信息或者是PARCOR信息或者是LAR信息以及其中
所述平化装置包括一装置,用于对于构成所述频谱信息的多个维中的每一个,用改善的系数或所述改善的系数的乘方乘以所述频谱信息数据,以便产生所述改善的频谱信息。
10.根据权利要求9所述的滤波器,其中
所述的乘方与所述的维无关。
11.根据权利要求3所述的滤波器,其中
所述频谱信息是LSP信息,以及其中
所述改善装置包括距离扩展装置,用于扩展在表示所述频谱信息的若干维之中相邻的维之间的距离,以便产生所述改善的频谱信息。
12.根据权利要求11所述的滤波器,其中
所述距离扩展装置包括:
扩展装置,用于当所述各相邻维之间的距离小于参考距离时,将所述距离扩展于所述参考距离之外;
压缩装置,用于在利用所述扩展装置扩展在相邻的各维之间的所述距离之后,对于所有所述相邻各维均衡压缩所述各距离,以便保证所述频谱信息的范围就其整体变得与扩展之前的范围相一致。
13.根据权利要求3所述的滤波器,其中
所述的频谱信息是LSP信息,以及其中
所述改善装置包括:
比例分割装置,用于根据改善的系数、所述频谱信息以及属于所述频谱信息所属的直接相同域的参考信息进行比例分割;
距离扩展装置,用于扩展在表示所述频谱信息的若干维中间的相邻各维之间的距离;及
转换装置,用于选择性或者利用所述比例分割装置或者利用所述距离扩展装置来产生所述改进的频谱信息。
14.如权利要求3所述的滤波器,其中
所述的频谱信息是LSP信息,以及其中
所述改善装置包括:
比例分割装置,用于对所述频谱信息和属于与所述频谱信息所属的域直接相同的域的参考信息利用改善的系数进行比例;
距离扩展装置,用于对在表示所述频谱信息的若干维中间的各相邻的维之间距离进行扩展;以及
串级连接装置,用于以相互配合的方式利用所述比例分割装置和所述距离扩展装置,以便产生所述改善的频谱信息。
15.如权利要求3所述的滤波器,其中
所述改善装置包括一转化表,用于存储与所述改善的频谱信息相关的所述频谱信息,所述转化表响应于所述频谱信息的提供,产生需要产生的改善的频谱信息。
16.根据权利要求3所述的滤波器,其中
所述改善装置包括一中间网络,该网络通过记忆,具有将所述频谱信息变换为所述改善的频谱信息的能力,所述中间网络响应所述频谱信息的提供产生需要产生的改善的频谱信息。
17.根据权利要求3所述的滤波器,其中
所述改善装置包括:
若干规定范畴改善装置,每一个装置提供用于若干彼此不相重叠和通过对所述预定域进划分得到的范畴中的每一个范畴;
所述若干规定范畴装置,每个包括:
一装置,用于改善在一对应的范畴内的所述频谱信息;以及
一装置,用于将所述改善的频谱信息由所述预定域变换为LPC域,以便产生一滤波器系数。
18.根据权利要求3所述的滤波器,其中
所述改善装置包括:
一装置,用于根据改善的系数,改善在所述预定域内的所述频谱信息,以便产生改善的频谱信息;
一装置,用于将所述改善的频谱信息由从所述预定域变换为LPC域,以便产生所述滤波器系数;以及
一装置,用于根据这样一个范畴调节所述改善的系数,该范畴是在通过将所述预定域分割得到的且彼此不相重叠的所述若干范畴中间的所述频谱信息所属的那一个范畴。
19.根据权利要求1所述的滤波器,其中
所述滤波器系数属于LSP域和PARCOR域中的任一种。
20.根据权利要求19所述的滤波器,其中
所述滤波器系数产生装置包括:
改善装置,用于改善在所述预定域内的所述频谱信息,以便产生改善的频谱信息;以及
一装置,用于将所述改善的频谱信息作为所述滤波器系数提供到所述滤波装置。
21.根据权利要求1所述的滤波器,其中
所述滤波装置包括一合成式滤波器,用于实现所述传递函数的分母部分的作用,以便保证所述改善的合成语声信号的主频特性与所述合成的语声信号的主频特性相比得到增强。
22.根据权利要求21所述的滤波器,其中
所述滤波装置还包括反变换滤波器,用于抑制由所述合成式滤波器赋予到所到改善的合成语声信号上的频谱变化率。
23.一种语声合成装置,包括:
第一装置,用于根据以多维矢量表示的且属于一预定域的以及与输入的语声信号相关的频谱信息产生合成的语声信号;
第二装置,用于通过由滤波器系数限定的传递函数对所述合成的语声信号滤波,以产生改善的合成语声信号;以及
第三装置,用于根据所述频谱信息按这样一种方式产生所述滤波器系数,该方式即根据所述频谱信息和与所述合成的语声信号的频谱信息相比较使所述改善的合成语声信号的主频特性被增强;
所述频谱信息是LSP信息、PARCOR信息和LAR信息中的任一种。
24.根据权利要求23所述的语声合成装置,其中
所述频谱信息包含第一频谱信息和第二频谱信息;
所述第一装置根据所述第一频谱信息产生所述合成的语声信号;
所述第三装置根据所述第二频谱信息产生所述滤波器系数,以便根据该第二频谱信息以及与所述合成的语声信号的频谱信息相比较,保证所述主频特性被增强;
所述语声合成装置还包括:
第四装置,用于将所述第一频谱信息变换为属于与所述预定域不同的一个域的所述第二频谱信息。
25.根据权利要求23所述的语声合成装置,其中
所述频谱信息包含第一频谱信息和第二频谱信息;
所述第一装置根据所述第一频谱信息产生所述合成的语声信号;
所述第三装置根据所述第二频谱信息产生所述滤波系数,以便根据该第二频谱信息以及与所述合成的语声信号的频谱信息相比较,保证所述主频特性被增强;
所述语声合成装置还包括:
第五装置,用于分析所述合成的语声信号,以便产生所述第二频谱信息。
26.一种语声存储/传输系统,包括:
第六装置,用于分析输入的语声信号,以便产生以多维矢量的形式表示的且属于一预定域以及与所述输入的语声信号相关的频谱信息;
第七装置,用于存储或传输所述频谱信息;
第八装置,用于根据已经存储或传输的所述频谱信息产生合成的语声信号;
第九装置,用于通过由滤波器系数限定的传递函数对所述合成的语声信号滤波,以产生改善的合成语声信号;以及
第十装置,用于根据所述的频谱信息产生所述的所述滤波器系数,以便根据所述频谱信息以及与所述合成的语声信号的频谱信息相比较,保证使所述改善的合成语声信号的主频特性增强;
所述频谱信息是LSP信息、PARCOR信息以及LAR信息中的任一种。
27.根据权利要求26所述的语声存储/传输系统,其中
所述频谱信息包含第一频谱信息和第二频谱信息;
所述第六装置产生所述第一频谱信息;
所述第七装置存储或传输所述第一频谱信息;
所述第八装置根据已经存储或传输的所述第一频谱信息产生所述合成的语声信号;
所述第十装置根据所述第二频谱信息产生所述滤波器系数,以根据所述第二频谱信息以及与所述合成的语声信号的频谱信息相比较,保证所述主频特性被增强;
所述语声存储/传输系统还包括:
第十一装置,用于将所述第一频谱信息变换为属于与所述预定域不同的一个域的所述第二频谱信息。
28.根据权利要求26所述的语声存储/传输系统,其中
所述频谱信息包含第一频谱信息和第二频谱信息;
所述第六装置产生所述第一频谱信息;
所述第七装置存储或传输所述第一频谱信息;
所述第八装置根据已经存储或传输的所述第一频谱信息产生所述合成的语声信号;
所述第十装置根据所述第二频谱信息产生所述滤波器系数,以根据所述第二频谱信息以及与所述合成的语声信号的频谱信息相比较,保证所述主频特性被增强;
所述语声存储/传输系统还包括:
第十二装置,用于分析所述合成的语声信号,以便产生所述第二频谱信息。
29.一种语声改善方法,包含:
第一步骤,通过由滤波器系数限定的传递函数对合成的语声信号进行滤波,以便产生改善的合成语声信号;以及
第二步骤,根据由多维矢量表示的且属于一预定域的以及与所述合成的语声信号相关的频谱信息产生所述滤波器系数,以便根据所述频谱信息和与所述合成的语声信号的频谱信息相比较来保证所述频谱信息的主频特性部分被增强;所述第二步骤先于执行所述第一步骤;
所述频谱信息为LSP信息、PARCOR信息和LAR信息中的任一种。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP7114752A JP2993396B2 (ja) | 1995-05-12 | 1995-05-12 | 音声加工フィルタ及び音声合成装置 |
JP114752/95 | 1995-05-12 | ||
JP114752/1995 | 1995-05-12 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1148232A CN1148232A (zh) | 1997-04-23 |
CN1132153C true CN1132153C (zh) | 2003-12-24 |
Family
ID=14645799
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN96108490A Expired - Fee Related CN1132153C (zh) | 1995-05-12 | 1996-05-11 | 改善增强语声的滤波器,用该滤波器的装置、系统和方法 |
Country Status (11)
Country | Link |
---|---|
US (1) | US5822732A (zh) |
EP (1) | EP0742548B1 (zh) |
JP (1) | JP2993396B2 (zh) |
KR (1) | KR100197203B1 (zh) |
CN (1) | CN1132153C (zh) |
AR (1) | AR001928A1 (zh) |
CA (1) | CA2175617C (zh) |
CO (1) | CO4480730A1 (zh) |
DE (1) | DE69614752T2 (zh) |
NO (1) | NO311471B1 (zh) |
TW (1) | TW303451B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104704560A (zh) * | 2012-09-04 | 2015-06-10 | 纽昂斯通讯公司 | 共振峰依赖的语音信号增强 |
Families Citing this family (34)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09230896A (ja) * | 1996-02-28 | 1997-09-05 | Sony Corp | 音声合成装置 |
US7787647B2 (en) | 1997-01-13 | 2010-08-31 | Micro Ear Technology, Inc. | Portable system for programming hearing aids |
CN1135529C (zh) * | 1997-02-10 | 2004-01-21 | 皇家菲利浦电子有限公司 | 传送语音信号的通信网络 |
GB2336978B (en) * | 1997-07-02 | 2000-11-08 | Simoco Int Ltd | Method and apparatus for speech enhancement in a speech communication system |
US6182033B1 (en) | 1998-01-09 | 2001-01-30 | At&T Corp. | Modular approach to speech enhancement with an application to speech coding |
US7392180B1 (en) | 1998-01-09 | 2008-06-24 | At&T Corp. | System and method of coding sound signals using sound enhancement |
EP0929065A3 (en) * | 1998-01-09 | 1999-12-22 | AT&T Corp. | A modular approach to speech enhancement with an application to speech coding |
KR100269216B1 (ko) * | 1998-04-16 | 2000-10-16 | 윤종용 | 스펙트로-템포럴 자기상관을 사용한 피치결정시스템 및 방법 |
CA2396771A1 (en) | 2000-01-20 | 2001-07-26 | Starkey Laboratories, Inc. | Hearing aid systems |
US7283961B2 (en) * | 2000-08-09 | 2007-10-16 | Sony Corporation | High-quality speech synthesis device and method by classification and prediction processing of synthesized sound |
KR100819623B1 (ko) * | 2000-08-09 | 2008-04-04 | 소니 가부시끼 가이샤 | 음성 데이터의 처리 장치 및 처리 방법 |
JP2002055699A (ja) | 2000-08-10 | 2002-02-20 | Mitsubishi Electric Corp | 音声符号化装置および音声符号化方法 |
US20030028386A1 (en) * | 2001-04-02 | 2003-02-06 | Zinser Richard L. | Compressed domain universal transcoder |
JP4413480B2 (ja) | 2002-08-29 | 2010-02-10 | 富士通株式会社 | 音声処理装置及び移動通信端末装置 |
EP1557827B8 (en) * | 2002-10-31 | 2015-01-07 | Fujitsu Limited | Voice intensifier |
DE60330715D1 (de) * | 2003-05-01 | 2010-02-04 | Fujitsu Ltd | Sprachdecodierer, sprachdecodierungsverfahren, programm,aufzeichnungsmedium |
US7451082B2 (en) * | 2003-08-27 | 2008-11-11 | Texas Instruments Incorporated | Noise-resistant utterance detector |
WO2005106849A1 (en) * | 2004-04-14 | 2005-11-10 | Realnetworks, Inc. | Digital audio compression/decompression with reduced complexity linear predictor coefficients coding/de-coding |
KR100746680B1 (ko) * | 2005-02-18 | 2007-08-06 | 후지쯔 가부시끼가이샤 | 음성 강조 장치 |
BRPI0612579A2 (pt) | 2005-06-17 | 2012-01-03 | Matsushita Electric Ind Co Ltd | pàs-filtro, decodificador e mÉtodo de pàs-filtraÇço |
JP5228283B2 (ja) * | 2006-04-19 | 2013-07-03 | カシオ計算機株式会社 | 音声合成辞書構築装置、音声合成辞書構築方法、及び、プログラム |
EP1850328A1 (en) * | 2006-04-26 | 2007-10-31 | Honda Research Institute Europe GmbH | Enhancement and extraction of formants of voice signals |
CA2601662A1 (en) | 2006-09-18 | 2008-03-18 | Matthias Mullenborn | Wireless interface for programming hearing assistance devices |
JP4294724B2 (ja) * | 2007-08-10 | 2009-07-15 | パナソニック株式会社 | 音声分離装置、音声合成装置および声質変換装置 |
US8831936B2 (en) | 2008-05-29 | 2014-09-09 | Qualcomm Incorporated | Systems, methods, apparatus, and computer program products for speech signal processing using spectral contrast enhancement |
US8538749B2 (en) | 2008-07-18 | 2013-09-17 | Qualcomm Incorporated | Systems, methods, apparatus, and computer program products for enhanced intelligibility |
US9202456B2 (en) | 2009-04-23 | 2015-12-01 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for automatic control of active noise cancellation |
US9053697B2 (en) | 2010-06-01 | 2015-06-09 | Qualcomm Incorporated | Systems, methods, devices, apparatus, and computer program products for audio equalization |
CN101887719A (zh) * | 2010-06-30 | 2010-11-17 | 北京捷通华声语音技术有限公司 | 语音合成方法、系统及具有语音合成功能的移动终端设备 |
CN104143337B (zh) * | 2014-01-08 | 2015-12-09 | 腾讯科技(深圳)有限公司 | 一种提高音频信号音质的方法和装置 |
EP3136387B1 (en) | 2014-04-24 | 2018-12-12 | Nippon Telegraph and Telephone Corporation | Frequency domain parameter sequence generating method, encoding method, decoding method, frequency domain parameter sequence generating apparatus, encoding apparatus, decoding apparatus, program, and recording medium |
EP2980799A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for processing an audio signal using a harmonic post-filter |
CN108604452B (zh) * | 2016-02-15 | 2022-08-02 | 三菱电机株式会社 | 声音信号增强装置 |
JP6691169B2 (ja) * | 2018-06-06 | 2020-04-28 | 株式会社Nttドコモ | 音声信号処理方法及び音声信号処理装置 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5853352B2 (ja) * | 1979-10-03 | 1983-11-29 | 日本電信電話株式会社 | 音声合成器 |
US4969192A (en) * | 1987-04-06 | 1990-11-06 | Voicecraft, Inc. | Vector adaptive predictive coder for speech and audio |
JP2588004B2 (ja) * | 1988-09-19 | 1997-03-05 | 日本電信電話株式会社 | 後処理フィルタ |
JP3158434B2 (ja) * | 1989-10-17 | 2001-04-23 | モトローラ・インコーポレーテッド | 低減されたスペクトルひずみを有するポストフィルタを備えたデジタル音声デコーダ |
US5241650A (en) * | 1989-10-17 | 1993-08-31 | Motorola, Inc. | Digital speech decoder having a postfilter with reduced spectral distortion |
US5307441A (en) * | 1989-11-29 | 1994-04-26 | Comsat Corporation | Wear-toll quality 4.8 kbps speech codec |
JP2689739B2 (ja) * | 1990-03-01 | 1997-12-10 | 日本電気株式会社 | 秘話装置 |
US5187745A (en) * | 1991-06-27 | 1993-02-16 | Motorola, Inc. | Efficient codebook search for CELP vocoders |
FI95086C (fi) * | 1992-11-26 | 1995-12-11 | Nokia Mobile Phones Ltd | Menetelmä puhesignaalin tehokkaaksi koodaamiseksi |
US5504834A (en) * | 1993-05-28 | 1996-04-02 | Motrola, Inc. | Pitch epoch synchronous linear predictive coding vocoder and method |
-
1995
- 1995-05-12 JP JP7114752A patent/JP2993396B2/ja not_active Expired - Lifetime
-
1996
- 1996-02-29 TW TW085102394A patent/TW303451B/zh active
- 1996-05-02 US US08/643,087 patent/US5822732A/en not_active Expired - Fee Related
- 1996-05-02 CA CA002175617A patent/CA2175617C/en not_active Expired - Fee Related
- 1996-05-10 CO CO96023682A patent/CO4480730A1/es unknown
- 1996-05-10 EP EP96201607A patent/EP0742548B1/en not_active Expired - Lifetime
- 1996-05-10 DE DE69614752T patent/DE69614752T2/de not_active Expired - Fee Related
- 1996-05-10 KR KR1019960015305A patent/KR100197203B1/ko not_active IP Right Cessation
- 1996-05-10 NO NO19961894A patent/NO311471B1/no unknown
- 1996-05-11 CN CN96108490A patent/CN1132153C/zh not_active Expired - Fee Related
- 1996-05-13 AR AR33649296A patent/AR001928A1/es active IP Right Grant
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104704560A (zh) * | 2012-09-04 | 2015-06-10 | 纽昂斯通讯公司 | 共振峰依赖的语音信号增强 |
CN104704560B (zh) * | 2012-09-04 | 2018-06-05 | 纽昂斯通讯公司 | 共振峰依赖的语音信号增强 |
Also Published As
Publication number | Publication date |
---|---|
EP0742548A2 (en) | 1996-11-13 |
CA2175617C (en) | 2000-07-25 |
US5822732A (en) | 1998-10-13 |
JPH08305397A (ja) | 1996-11-22 |
NO961894L (no) | 1996-11-13 |
TW303451B (zh) | 1997-04-21 |
CN1148232A (zh) | 1997-04-23 |
KR960043570A (ko) | 1996-12-23 |
EP0742548B1 (en) | 2001-08-29 |
DE69614752T2 (de) | 2002-06-20 |
CO4480730A1 (es) | 1997-07-09 |
EP0742548A3 (en) | 1998-08-26 |
NO961894D0 (no) | 1996-05-10 |
DE69614752D1 (de) | 2001-10-04 |
AR001928A1 (es) | 1997-12-10 |
NO311471B1 (no) | 2001-11-26 |
JP2993396B2 (ja) | 1999-12-20 |
KR100197203B1 (ko) | 1999-06-15 |
MX9601755A (es) | 1997-07-31 |
CA2175617A1 (en) | 1996-11-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1132153C (zh) | 改善增强语声的滤波器,用该滤波器的装置、系统和方法 | |
CN1199151C (zh) | 语音编码器 | |
CN1271597C (zh) | 对声源信号进行编码/解码的方法和装置 | |
CN1159691A (zh) | 用于声频信号线性预测分析的方法 | |
CN1150516C (zh) | 语音编码方法和语音编码器 | |
CN1210689C (zh) | 子带域中改进的频谱平移/折叠的方法和设备 | |
CN1215459C (zh) | 声信号带宽扩展 | |
CN1092420C (zh) | 音频数据解码装置及音频数据编码解码系统 | |
CN1992533A (zh) | 信号编码设备和方法、信号译码设备和方法、程序及介质 | |
US6385576B2 (en) | Speech encoding/decoding method using reduced subframe pulse positions having density related to pitch | |
CN1750124A (zh) | 带限音频信号的带宽扩展 | |
JP3881946B2 (ja) | 音響符号化装置及び音響符号化方法 | |
CN101061535A (zh) | 用于人工扩展语音信号的带宽的方法和装置 | |
CN1659626A (zh) | 解码语音的音调增强的方法和装置 | |
CN1601912A (zh) | 用于提供数字音频信号的高质量扩展和压缩的系统和方法 | |
CN1795495A (zh) | 音频编码设备、音频解码设备、音频编码方法和音频解码方法 | |
CN1571993A (zh) | 用于改善高频重建的方法 | |
CN1816848A (zh) | 通过增加噪声改善解码音频的质量 | |
CN1265217A (zh) | 在语音通信系统中语音增强的方法和装置 | |
CN1193344C (zh) | 语音解码器和一种语音解码方法 | |
CN1692402A (zh) | 声音合成方法以及声音合成装置 | |
CN1303586C (zh) | 使用共振峰增强对话的方法和装置 | |
CN1050633A (zh) | 具有改进的子样求解长期预测器的数字化语言编码器 | |
CN1662960A (zh) | 使用解码信号的特征适配合成频谱分量的音频编码系统 | |
CN1193159A (zh) | 语音编码译码方法和装置、电话装置、音调变换方法和介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C06 | Publication | ||
PB01 | Publication | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C17 | Cessation of patent right | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20031224 |