JP2887286B2 - デジタル的にコード化されたスピーチを圧縮するたの方法における改良 - Google Patents
デジタル的にコード化されたスピーチを圧縮するたの方法における改良Info
- Publication number
- JP2887286B2 JP2887286B2 JP63084973A JP8497388A JP2887286B2 JP 2887286 B2 JP2887286 B2 JP 2887286B2 JP 63084973 A JP63084973 A JP 63084973A JP 8497388 A JP8497388 A JP 8497388A JP 2887286 B2 JP2887286 B2 JP 2887286B2
- Authority
- JP
- Japan
- Prior art keywords
- speech
- vector
- filter
- codebook
- pitch
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000000034 method Methods 0.000 title claims description 34
- 238000001914 filtration Methods 0.000 claims abstract description 31
- 230000003044 adaptive effect Effects 0.000 claims abstract description 23
- 238000004458 analytical method Methods 0.000 claims description 26
- 238000012545 processing Methods 0.000 claims description 15
- 230000005236 sound signal Effects 0.000 claims description 14
- 230000006870 function Effects 0.000 claims description 13
- 238000012546 transfer Methods 0.000 claims description 12
- 230000008569 process Effects 0.000 claims description 10
- 230000007774 longterm Effects 0.000 claims description 5
- 238000003672 processing method Methods 0.000 claims 1
- 239000013598 vector Substances 0.000 abstract description 144
- 230000004044 response Effects 0.000 abstract description 47
- 230000015572 biosynthetic process Effects 0.000 abstract description 33
- 238000003786 synthesis reaction Methods 0.000 abstract description 33
- 230000003595 spectral effect Effects 0.000 description 19
- 238000013139 quantization Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 5
- 230000009467 reduction Effects 0.000 description 5
- 238000001228 spectrum Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 230000000873 masking effect Effects 0.000 description 4
- 230000008447 perception Effects 0.000 description 4
- 230000002238 attenuated effect Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 230000002829 reductive effect Effects 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 230000003139 buffering effect Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000005284 excitation Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 238000007493 shaping process Methods 0.000 description 2
- 102100022907 Acrosin-binding protein Human genes 0.000 description 1
- 101000756551 Homo sapiens Acrosin-binding protein Proteins 0.000 description 1
- 206010021403 Illusion Diseases 0.000 description 1
- 239000008186 active pharmaceutical agent Substances 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000005094 computer simulation Methods 0.000 description 1
- 230000001143 conditioned effect Effects 0.000 description 1
- 238000013144 data compression Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 210000005069 ears Anatomy 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000007667 floating Methods 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 230000030279 gene silencing Effects 0.000 description 1
- 230000008450 motivation Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000001743 silencing effect Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 210000001260 vocal cord Anatomy 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/083—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being an excitation gain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0011—Long term prediction filters, i.e. pitch estimation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0013—Codebook search algorithms
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0013—Codebook search algorithms
- G10L2019/0014—Selection criteria for distances
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
【発明の詳細な説明】 [発明の背景] この発明は、伝達または記憶のためにデジタル的にコ
ード化されたスピーチまたはオーディオ信号を圧縮する
ための実時間コーダに関し、より特定的に、実時間ベク
トル適合予測コード化システムに関する。
ード化されたスピーチまたはオーディオ信号を圧縮する
ための実時間コーダに関し、より特定的に、実時間ベク
トル適合予測コード化システムに関する。
過去数年においては、スピーチコード化の多くの研究
は、16kb/sから150ビット/sへのビット速度に焦点を合
わせた。この範囲の最高限度において、中継品質(toll
quality)が、16kb/sにおいて、スケーラ量子化に基づ
く精巧な波形コーダによって達成され得ることが一般に
認められている。1984年ニュージャージー州イングルウ
ッド・クリフス、プレンティス−ホール・インコーポレ
ーテッドの、N・S・ジェイエンおよびP・ノールによ
る波形のデジタルコード化。他方の限度において、2400
ビット/sまたはそれ以下で動作する(線形予測コーダの
ような)コーダは、合成品質スピーチを与えるだけであ
る。これら2つの極端間の、特に、4.8kb/sと9.6kb/s間
のビット速度では、いずれの型のコーダも高品質スピー
チを得ることはできない。その理由の一部は、スケーラ
量子化が、1ビット/サンプルのビット速度でだめにな
る傾向があるからである。サンプルあたり1ビットの断
片で動作するその理論的最適性とその能力を介して、ベ
クトル量子化(VQ)は、9.6kb/s、または4.8kb/sでさえ
高品質スピーチを達成する可能性を提供する。J・マク
ホール、S・ルーカスおよびH・ギッシュの「スピーチ
コード化におけるベクトル量子化」IEEE会報第73巻第11
号1985年11月。
は、16kb/sから150ビット/sへのビット速度に焦点を合
わせた。この範囲の最高限度において、中継品質(toll
quality)が、16kb/sにおいて、スケーラ量子化に基づ
く精巧な波形コーダによって達成され得ることが一般に
認められている。1984年ニュージャージー州イングルウ
ッド・クリフス、プレンティス−ホール・インコーポレ
ーテッドの、N・S・ジェイエンおよびP・ノールによ
る波形のデジタルコード化。他方の限度において、2400
ビット/sまたはそれ以下で動作する(線形予測コーダの
ような)コーダは、合成品質スピーチを与えるだけであ
る。これら2つの極端間の、特に、4.8kb/sと9.6kb/s間
のビット速度では、いずれの型のコーダも高品質スピー
チを得ることはできない。その理由の一部は、スケーラ
量子化が、1ビット/サンプルのビット速度でだめにな
る傾向があるからである。サンプルあたり1ビットの断
片で動作するその理論的最適性とその能力を介して、ベ
クトル量子化(VQ)は、9.6kb/s、または4.8kb/sでさえ
高品質スピーチを達成する可能性を提供する。J・マク
ホール、S・ルーカスおよびH・ギッシュの「スピーチ
コード化におけるベクトル量子化」IEEE会報第73巻第11
号1985年11月。
ベクトル量子化(VQ)は、もし、ベクトル次元が十分
に大きければ、究極の速度−歪限度に任意に近い性能に
達し得る。1971年ニュージャージー州イングルウッドク
リフス、プレンティス−ホール・インコーポレーテッ
ド、T・バーガー「速度歪理論」。しかしながら、複雑
さの考慮のため、小さなベクトル次元のみが実際のシス
テムでは使用でき、不幸なことに、小さな時限を用いる
直接波形VQは、適切な性能を与えない。性能を改善する
1つの可能な方法は、VQを、スケーラコード化機構で成
功のうちに用いられてきた他のデータ圧縮技術と組合わ
せることである。
に大きければ、究極の速度−歪限度に任意に近い性能に
達し得る。1971年ニュージャージー州イングルウッドク
リフス、プレンティス−ホール・インコーポレーテッ
ド、T・バーガー「速度歪理論」。しかしながら、複雑
さの考慮のため、小さなベクトル次元のみが実際のシス
テムでは使用でき、不幸なことに、小さな時限を用いる
直接波形VQは、適切な性能を与えない。性能を改善する
1つの可能な方法は、VQを、スケーラコード化機構で成
功のうちに用いられてきた他のデータ圧縮技術と組合わ
せることである。
16kb/s以下のスピーチコード化において、もっとも成
功したスケーラコード化システムの1つは、アタルおよ
びシュローダーによって開発された適合性予測コード化
(APC)である[B・S・アタルとM・R・シュローダ
ーの「スピーチ信号の適合性予測コード化」ベル・シス
テム・テクニック・J.第49巻第1973−1986頁1970年10
月、B・S・アタルとM・R・シュローダーの「スピー
チ信号の予測コード化と主観的な誤差基準」IEEE会報、
音響学、スピーチ、信号処理、第ASSP−27巻第3号1979
年6月、およびB・S・アタルの「低ビット速度におけ
るスピーチの予測コード化」IEEE会報通信第COM−30巻
第4号1982年4月]。この発明、ベクトル適合性予測コ
ード化(VAPC)の発展に導くのは、VQとAPCの組合わせ
たパワーである。VQとAPCのこのような組合わせは、4.8
ないし9.6kb/s間のビット速度で高品質のスピーチを提
供し、スケーラコーダとVQコーダのギャップを埋めるで
あろう。
功したスケーラコード化システムの1つは、アタルおよ
びシュローダーによって開発された適合性予測コード化
(APC)である[B・S・アタルとM・R・シュローダ
ーの「スピーチ信号の適合性予測コード化」ベル・シス
テム・テクニック・J.第49巻第1973−1986頁1970年10
月、B・S・アタルとM・R・シュローダーの「スピー
チ信号の予測コード化と主観的な誤差基準」IEEE会報、
音響学、スピーチ、信号処理、第ASSP−27巻第3号1979
年6月、およびB・S・アタルの「低ビット速度におけ
るスピーチの予測コード化」IEEE会報通信第COM−30巻
第4号1982年4月]。この発明、ベクトル適合性予測コ
ード化(VAPC)の発展に導くのは、VQとAPCの組合わせ
たパワーである。VQとAPCのこのような組合わせは、4.8
ないし9.6kb/s間のビット速度で高品質のスピーチを提
供し、スケーラコーダとVQコーダのギャップを埋めるで
あろう。
APCの基本的な考えは、まず、適合性線形予測子を用
いるスピーチ波形の冗長を取り除き、それからスケーラ
量子化器を用いて予測残差を量子化することである。VA
PCにおいて、APCのスケーラ量子化器は、ベクトル量子
化器VQに取って代わられる。VQを用いる動機づけは二重
である。まず、隣接するスピーチサンプル相互間の線形
依存は本質的に線形予測で取り除かれるけれども、隣接
する予測残差サンプルは、VQに利用され得る非線形依存
性を未だ有しているかもしれない。第2に、VQは、サン
プルあたり1ビット以下の速度で動作し得る。これは、
スケーラ量子化器では達成できないが、低ビット速度で
スピーチをコード化するには必須である。
いるスピーチ波形の冗長を取り除き、それからスケーラ
量子化器を用いて予測残差を量子化することである。VA
PCにおいて、APCのスケーラ量子化器は、ベクトル量子
化器VQに取って代わられる。VQを用いる動機づけは二重
である。まず、隣接するスピーチサンプル相互間の線形
依存は本質的に線形予測で取り除かれるけれども、隣接
する予測残差サンプルは、VQに利用され得る非線形依存
性を未だ有しているかもしれない。第2に、VQは、サン
プルあたり1ビット以下の速度で動作し得る。これは、
スケーラ量子化器では達成できないが、低ビット速度で
スピーチをコード化するには必須である。
ベクトル適合性予測コーダ(VAPC)は、APCと、1985
年7月の、V・クーパーマンおよびA・ガーショの「16
kb/sにおけるスピーチのベクトル予測コード化」IEEE会
報、通信第COM−33巻第685−696頁で紹介された、ベク
トル予測コードから発展した。VAPCは、1985年3月テン
ピにおける音響学、スピーチ、信号処理の国際会議の会
報の「コード励起線形予測(CELP):非常に低いビット
速度における高品質スピーチ」における、M・R・シュ
ローダーとP・S・アタルのコード励起線形予測(CEL
P)と幾分似た特徴を含んでいるが、計算の複雑さはず
っと少ない。
年7月の、V・クーパーマンおよびA・ガーショの「16
kb/sにおけるスピーチのベクトル予測コード化」IEEE会
報、通信第COM−33巻第685−696頁で紹介された、ベク
トル予測コードから発展した。VAPCは、1985年3月テン
ピにおける音響学、スピーチ、信号処理の国際会議の会
報の「コード励起線形予測(CELP):非常に低いビット
速度における高品質スピーチ」における、M・R・シュ
ローダーとP・S・アタルのコード励起線形予測(CEL
P)と幾分似た特徴を含んでいるが、計算の複雑さはず
っと少ない。
コンピュータシミュレーションにおいて、VAPCは、9.
6kb/sで非常に良いスピーチ品質を与え、18dBの信号対
騒音比率(SNR)と16dBのセグメントのSNRに達する。4.
8kb/sにおいて、VAPCもかなり良いスピーチ品質を達成
し、SNRとセグメントのSNRは、それぞれ、約13dBと11.5
dBである。これらの結果を達成するために必要とされる
計算は、(1フロップ、浮動小数点演算は、1乗算、1
加算+その関連の索引づけとして定義される)1秒あた
り2ないし400万フロップのオーダにすぎず、今日の進
歩したデジタル信号化プロセッサチップの十分に能力範
囲内である。VAPCは、約4.8kb/sの予期されるビット速
度において素晴らしいスピーチ品質を達成するとして知
られ、しかし、その天文学的複雑さのために、現在は実
時間で実現されないが、CELPに代わる低い複雑さをもっ
たものとなるかもしれない。それは、そのコーダを実現
するために、1秒あたり4億フロップ以上を要求する。
スーパーコンピュータCRAY−1のCPU時間で、CELPは、
1秒のスピーチをコード化するために、CPU時間の125秒
必要とする。現在、4.8ないし9.6kb/sの範囲のコード化
速度で動作する、実時間、高品質スピーチコーダに対す
る大きな必要性がある。コード化速度のこの範囲におい
て、上記で述べられた2つのコーダ(APCとCELP)は、
高品質を達成することもできず、実現するには複雑すぎ
る。これに反して、ベクトル量子化(VQ)をAPCとCELP
双方の利点に結びつける、この発明は、実時間コード化
に対して十分に低い複雑さを伴って、高品質スピーチを
達成することができる。
6kb/sで非常に良いスピーチ品質を与え、18dBの信号対
騒音比率(SNR)と16dBのセグメントのSNRに達する。4.
8kb/sにおいて、VAPCもかなり良いスピーチ品質を達成
し、SNRとセグメントのSNRは、それぞれ、約13dBと11.5
dBである。これらの結果を達成するために必要とされる
計算は、(1フロップ、浮動小数点演算は、1乗算、1
加算+その関連の索引づけとして定義される)1秒あた
り2ないし400万フロップのオーダにすぎず、今日の進
歩したデジタル信号化プロセッサチップの十分に能力範
囲内である。VAPCは、約4.8kb/sの予期されるビット速
度において素晴らしいスピーチ品質を達成するとして知
られ、しかし、その天文学的複雑さのために、現在は実
時間で実現されないが、CELPに代わる低い複雑さをもっ
たものとなるかもしれない。それは、そのコーダを実現
するために、1秒あたり4億フロップ以上を要求する。
スーパーコンピュータCRAY−1のCPU時間で、CELPは、
1秒のスピーチをコード化するために、CPU時間の125秒
必要とする。現在、4.8ないし9.6kb/sの範囲のコード化
速度で動作する、実時間、高品質スピーチコーダに対す
る大きな必要性がある。コード化速度のこの範囲におい
て、上記で述べられた2つのコーダ(APCとCELP)は、
高品質を達成することもできず、実現するには複雑すぎ
る。これに反して、ベクトル量子化(VQ)をAPCとCELP
双方の利点に結びつける、この発明は、実時間コード化
に対して十分に低い複雑さを伴って、高品質スピーチを
達成することができる。
[発明の目的と要約] この発明の目的は、実時間で、アナログスピーチまた
はオーディオ波形を、記憶および/または伝達のために
圧縮されたビット流れにコード化することで、再生のた
めに波形を後で再構成することである。
はオーディオ波形を、記憶および/または伝達のために
圧縮されたビット流れにコード化することで、再生のた
めに波形を後で再構成することである。
もう1つの目的は、前記スピーチまたはオーディオ信
号の知覚品質を高めるために、コード化システムまたは
他の源の劣化によって生じた騒音によって乱された、ス
ピーチまたはオーディオ信号の適合性ポストフィルタ化
を提供することである。
号の知覚品質を高めるために、コード化システムまたは
他の源の劣化によって生じた騒音によって乱された、ス
ピーチまたはオーディオ信号の適合性ポストフィルタ化
を提供することである。
この発明の目的は、K個のスピーチサンプルの各ベク
トルを、時間変化の合成フィルタを励起するために、VQ
コードブックに記憶されたM個の固定ベクトルの各々を
用い、知覚的に意味のある歪の大きさを最少にする最良
合成化ベクトルを選ぶことにより、概算するシステムに
よって達成される。元のサンプル化されたスピーチは、
まずバッファされ、ベクトルとベクトルのフレームに分
類され、そこで、各フレームはN個のベクトルに分類さ
れ、各ベクトルはK個のスピーチサンプルを有してい
る。ピッチフィルタ化パラメータ(P)、線形予測計数
フィルタ化パラメータ(LPC)、知覚重みづけフィルタ
パラメータ(W)およびスピーチの連続するフレームの
各々に対する残差利得スケール因数(G)の予測分析
が、それから行なわれる。分析において決定されるパラ
メータは、知覚重みづけパラメータ以外は、フレームの
各入力ベクトルsnを処理するために、フレームごとに量
子化され、リセットされる。パラメータWに応答する知
覚重みづけフィルタは、コード化されたスピーチと元の
スピーチ間の知覚歪を最少にする、VPベクトルを選択す
るのを助けるために用いられる。量子化されないが、知
覚重みづけフィルタパラメータも、フレームごとにリセ
ットされる。
トルを、時間変化の合成フィルタを励起するために、VQ
コードブックに記憶されたM個の固定ベクトルの各々を
用い、知覚的に意味のある歪の大きさを最少にする最良
合成化ベクトルを選ぶことにより、概算するシステムに
よって達成される。元のサンプル化されたスピーチは、
まずバッファされ、ベクトルとベクトルのフレームに分
類され、そこで、各フレームはN個のベクトルに分類さ
れ、各ベクトルはK個のスピーチサンプルを有してい
る。ピッチフィルタ化パラメータ(P)、線形予測計数
フィルタ化パラメータ(LPC)、知覚重みづけフィルタ
パラメータ(W)およびスピーチの連続するフレームの
各々に対する残差利得スケール因数(G)の予測分析
が、それから行なわれる。分析において決定されるパラ
メータは、知覚重みづけパラメータ以外は、フレームの
各入力ベクトルsnを処理するために、フレームごとに量
子化され、リセットされる。パラメータWに応答する知
覚重みづけフィルタは、コード化されたスピーチと元の
スピーチ間の知覚歪を最少にする、VPベクトルを選択す
るのを助けるために用いられる。量子化されないが、知
覚重みづけフィルタパラメータも、フレームごとにリセ
ットされる。
各フレームがバッファされた後、上記の分析が各フレ
ームの最初において完成され、M個の零状態応答ベクト
ルが計算され、零状態応答コードブックに記憶される。
これらのM個の零状態応答ベクトルは、因数Gによって
制御されるスケールユニットの後の、カスケードされた
LPC合成フィルタと知覚重みづけフィルタのメモリを零
に設定し、量子化されたLPCフィルタパラメータと量子
化されない知覚重みづけフィルタパラメータで、各フィ
ルタを制御し、1つの予め定められ固定されたコードブ
ックベクトルを用いて一度にカスケードされたフィルタ
を励起することにより、得られる。各VQコードブックベ
クトルに対するカスケードされたフィルタの出力ベクト
ルは、それから対応のアドレスにストアされ、すなわ
ち、VQコードブックのと同じ、一時的零状態応答コード
ブックの索引が割当てられる。1フレーム内で各入力ス
ピーチベクトルsnをコード化する際に、そのベクトルの
予測されたピッチnは、そのフレームに対するパラメ
ータQG,QLPC,QPおよびQPPによって制御される、スケー
ルユニット、LPC合成フィルタおよびピッチ予測フィル
タを介して、索引コードとしてコード化された最後のベ
クトルを処理することにより、決定される。さらに、カ
スケードされたフィルタの零入力応答(前のベクトルの
励起からのリンギング)は、まずフィルタにセットされ
る。一旦、ピッチ予測ベクトルnが入力信号ベクトル
snから引かれ、差分ベクトルdnが知覚重みづけフィルタ
を介してフィルタされた差分ベクトルfnを生じるために
通過され、前記フィルタの零入力応答ベクトルが、知覚
重みづけフィルタ化された差分ベクトルfnから引かれ、
そして、結果として生じるベクトルvnが、最小差分Δま
たは歪を有する1つを捜して、M個の記憶された零状態
応答ベクトルの各々と比較される。
ームの最初において完成され、M個の零状態応答ベクト
ルが計算され、零状態応答コードブックに記憶される。
これらのM個の零状態応答ベクトルは、因数Gによって
制御されるスケールユニットの後の、カスケードされた
LPC合成フィルタと知覚重みづけフィルタのメモリを零
に設定し、量子化されたLPCフィルタパラメータと量子
化されない知覚重みづけフィルタパラメータで、各フィ
ルタを制御し、1つの予め定められ固定されたコードブ
ックベクトルを用いて一度にカスケードされたフィルタ
を励起することにより、得られる。各VQコードブックベ
クトルに対するカスケードされたフィルタの出力ベクト
ルは、それから対応のアドレスにストアされ、すなわ
ち、VQコードブックのと同じ、一時的零状態応答コード
ブックの索引が割当てられる。1フレーム内で各入力ス
ピーチベクトルsnをコード化する際に、そのベクトルの
予測されたピッチnは、そのフレームに対するパラメ
ータQG,QLPC,QPおよびQPPによって制御される、スケー
ルユニット、LPC合成フィルタおよびピッチ予測フィル
タを介して、索引コードとしてコード化された最後のベ
クトルを処理することにより、決定される。さらに、カ
スケードされたフィルタの零入力応答(前のベクトルの
励起からのリンギング)は、まずフィルタにセットされ
る。一旦、ピッチ予測ベクトルnが入力信号ベクトル
snから引かれ、差分ベクトルdnが知覚重みづけフィルタ
を介してフィルタされた差分ベクトルfnを生じるために
通過され、前記フィルタの零入力応答ベクトルが、知覚
重みづけフィルタ化された差分ベクトルfnから引かれ、
そして、結果として生じるベクトルvnが、最小差分Δま
たは歪を有する1つを捜して、M個の記憶された零状態
応答ベクトルの各々と比較される。
最小歪を生じる、すなわち、vnに最も近い、零状態応
答ベクトルの索引(アドレス)は、永久コードブックの
最良ベクトルを同定する。その索引(アドレス)は、そ
のベクトルの圧縮されたコードとして伝達され、最良整
合ベクトルを見つけるために、送信器と同一のVQコード
ブックを有する受信器によって用いられる。送信器にお
いて、その最良整合ベクトルは、次のスピーチベクトル
の評価値nを発生するために、LPC合成フィルタとピ
ッチ予測フィルタを励起するために、その索引の伝達時
において用いられる。その最良整合ベクトルは、また上
記したように、次のスピーチベクトルsnのためにそれを
設定するために、零入力応答フィルタを励起するために
用いられる。ベクトルのフレームに対する最良整合ベク
トルの索引は、永久コードブックと同一のコードブック
を送信器で用いて、フレームのベクトル索引をベクトル
に復号化する際に、受信器によって用いられるように、
ピッチ、ピッチ予測子およびコード化プロセスで用いら
れるLPC予測フィルタ化と利得を制御する、パラメータ
の索引からなる、「副次情報」と今後呼ばれる、フレー
ム分析情報と組合わされる。この副次情報は、マルチプ
レクサを介して、まず、続くVQ索引の各フレームに対し
て一度伝達されることが好ましいが、ベクトル索引のフ
レームをまず伝達し、それから副次情報を伝達すること
が可能であろう。なぜなら、ベクトル索引のそのフレー
ムは、両方の場合において、幾分かのバッファ化を必要
とするからであり、その差分が連続して送信されるスピ
ーチまたはオーディオフレームの最初において、初期の
遅延に幾分あるだけである。マルチプレクスされた索引
の結果として生じる流れは、通信チャネルを通ってデコ
ーダに伝達されるか、または後の復号化のために記憶さ
れる。
答ベクトルの索引(アドレス)は、永久コードブックの
最良ベクトルを同定する。その索引(アドレス)は、そ
のベクトルの圧縮されたコードとして伝達され、最良整
合ベクトルを見つけるために、送信器と同一のVQコード
ブックを有する受信器によって用いられる。送信器にお
いて、その最良整合ベクトルは、次のスピーチベクトル
の評価値nを発生するために、LPC合成フィルタとピ
ッチ予測フィルタを励起するために、その索引の伝達時
において用いられる。その最良整合ベクトルは、また上
記したように、次のスピーチベクトルsnのためにそれを
設定するために、零入力応答フィルタを励起するために
用いられる。ベクトルのフレームに対する最良整合ベク
トルの索引は、永久コードブックと同一のコードブック
を送信器で用いて、フレームのベクトル索引をベクトル
に復号化する際に、受信器によって用いられるように、
ピッチ、ピッチ予測子およびコード化プロセスで用いら
れるLPC予測フィルタ化と利得を制御する、パラメータ
の索引からなる、「副次情報」と今後呼ばれる、フレー
ム分析情報と組合わされる。この副次情報は、マルチプ
レクサを介して、まず、続くVQ索引の各フレームに対し
て一度伝達されることが好ましいが、ベクトル索引のフ
レームをまず伝達し、それから副次情報を伝達すること
が可能であろう。なぜなら、ベクトル索引のそのフレー
ムは、両方の場合において、幾分かのバッファ化を必要
とするからであり、その差分が連続して送信されるスピ
ーチまたはオーディオフレームの最初において、初期の
遅延に幾分あるだけである。マルチプレクスされた索引
の結果として生じる流れは、通信チャネルを通ってデコ
ーダに伝達されるか、または後の復号化のために記憶さ
れる。
デコーダにおいて、ビット流れは、続く索引から副次
情報を分離するために、まずディマルチプレクスされ
る。各索引は、対応のベクトルを重複のコードブックか
ら引出すために、受信器において用いられる。引出され
たベクトルは、利得索引を適切なスケール因数に変換す
るためにテーブルを用いて、利得パラメータによってま
ずスケールされ、それから、送信器の零状態応答コード
ブックを利用する最良整合索引を選択する際に用いられ
た同じ副次情報によって、制御されるカスケードされた
LPC合成およびピッチ合成フィルタを励起するために用
いられる。ピッチ合成フィルタの出力は、コード化され
たスピーチであり、それは知覚的に元のスピーチに近
い。利得情報以外の、すべての副次情報は、合成された
スピーチの品質を高めるために、適合性ポストフィルタ
で用いられる。このポストフィルタ化技術は、どんな声
またはオーディオ信号を高めるためにも用いられてよ
い。必要とされるのは、ポストフィルタを適合させるた
めに用いられるパラメータを作り出すための分析部分だ
けである。このポストフィルタ化技術においては、予め
定められた線形予測係数パラメータにより制御される短
期遅延フィルタ処理が行なわれる。この短期遅延フィル
タ処理は、2つの全極伝達関数の比からなる極−零伝達
関数を用いて行なわれる。また、極−零伝達関数の零は
対応の極よりも小さな半径を有している。
情報を分離するために、まずディマルチプレクスされ
る。各索引は、対応のベクトルを重複のコードブックか
ら引出すために、受信器において用いられる。引出され
たベクトルは、利得索引を適切なスケール因数に変換す
るためにテーブルを用いて、利得パラメータによってま
ずスケールされ、それから、送信器の零状態応答コード
ブックを利用する最良整合索引を選択する際に用いられ
た同じ副次情報によって、制御されるカスケードされた
LPC合成およびピッチ合成フィルタを励起するために用
いられる。ピッチ合成フィルタの出力は、コード化され
たスピーチであり、それは知覚的に元のスピーチに近
い。利得情報以外の、すべての副次情報は、合成された
スピーチの品質を高めるために、適合性ポストフィルタ
で用いられる。このポストフィルタ化技術は、どんな声
またはオーディオ信号を高めるためにも用いられてよ
い。必要とされるのは、ポストフィルタを適合させるた
めに用いられるパラメータを作り出すための分析部分だ
けである。このポストフィルタ化技術においては、予め
定められた線形予測係数パラメータにより制御される短
期遅延フィルタ処理が行なわれる。この短期遅延フィル
タ処理は、2つの全極伝達関数の比からなる極−零伝達
関数を用いて行なわれる。また、極−零伝達関数の零は
対応の極よりも小さな半径を有している。
可変フレーム速度コード化、迅速コードブック探索、
ピッチ予測とLPC予測のオーダの反転、および別の知覚
重みづけ技術の使用のような、この発明の他の修正およ
び変化が、当業者に生じるかもしれない。したがって、
本願発明を定義する請求の範囲は、それらの修正と変化
を包含することが企図される。
ピッチ予測とLPC予測のオーダの反転、および別の知覚
重みづけ技術の使用のような、この発明の他の修正およ
び変化が、当業者に生じるかもしれない。したがって、
本願発明を定義する請求の範囲は、それらの修正と変化
を包含することが企図される。
この発明の目的は、後で、スピーチまたはオーディオ
プログラムの再生時に、アナログスピーチまたはオーデ
ィオ波形の再構成のために、それらの波形を伝達および
/または記憶するためにコード化することであるが、今
後は、スピーチのみに言及がなされるが、説明され、請
求された発明は、オーディオ波形、またはサブバンドフ
ィルタ化されたスピーチまたはオーディオ波形にも適用
可能である。
プログラムの再生時に、アナログスピーチまたはオーデ
ィオ波形の再構成のために、それらの波形を伝達および
/または記憶するためにコード化することであるが、今
後は、スピーチのみに言及がなされるが、説明され、請
求された発明は、オーディオ波形、またはサブバンドフ
ィルタ化されたスピーチまたはオーディオ波形にも適用
可能である。
[好ましい実施例の説明] 実現の好ましい態様は、1つまたは2つのAT&T DSP3
2チップのようなプログラム可能デジタル信号プロセス
チップと、入力サンプル化、バッファ化およびマルチプ
レクス化のような装置に必要なメモリとコントローラの
ための付属チップを用いることを意図する。このシステ
ムはデジタルなので、サンプルとともにすっかり合成さ
れる。図示と説明の簡略化のために、合成論理は図面に
は示されない。また簡略化のために、1つの信号ベクト
ルがもう1つのから引かれる各点において、減算機能
が、丸の中の+符号によって示される加算器によって記
号で示される。引かれたベクトルは、入力において、−
の符号が付されている。実際には、減数の2の補数が形
成され、被減数に加えられる。しかしながら、好ましい
実現ではプログラム可能デジタル信号プロセッサが意図
されるが、一旦、必要な量が設計の初期のコストを正当
化すれば、この発明をデジタル信号プロセッサ専用の、
特殊の目的に実現するために、VLSI技術を用いる特別な
集積回路を設計し製作することも可能であろう。
2チップのようなプログラム可能デジタル信号プロセス
チップと、入力サンプル化、バッファ化およびマルチプ
レクス化のような装置に必要なメモリとコントローラの
ための付属チップを用いることを意図する。このシステ
ムはデジタルなので、サンプルとともにすっかり合成さ
れる。図示と説明の簡略化のために、合成論理は図面に
は示されない。また簡略化のために、1つの信号ベクト
ルがもう1つのから引かれる各点において、減算機能
が、丸の中の+符号によって示される加算器によって記
号で示される。引かれたベクトルは、入力において、−
の符号が付されている。実際には、減数の2の補数が形
成され、被減数に加えられる。しかしながら、好ましい
実現ではプログラム可能デジタル信号プロセッサが意図
されるが、一旦、必要な量が設計の初期のコストを正当
化すれば、この発明をデジタル信号プロセッサ専用の、
特殊の目的に実現するために、VLSI技術を用いる特別な
集積回路を設計し製作することも可能であろう。
第1a図を参照して、元のスピーチサンプルが、サンプ
ル化アナログ−デジタル変換器10からデジタル形式のsn
となって、分析プロセッサ11に受信され、プロセッサは
それらをベクトルあたりK個のサンプルのベクトルs
nに、フレームあたりN個のベクトルのフレームに分類
する。分析プロセッサは、次のフレームをコード化する
ために用いられるパラメータを計算するため、分析プロ
セッサは、1フレームのベクトル以上、たとえば、各ベ
クトルが20サンプルからなっており、フレームあたり8
ベクトルのフレームを2つ記憶する能力を有する、二重
バッファメモリにサンプルを記憶する。各フレームは1
つのバッファの外で処理されるので、入ってくる新しい
フレームは、他方のバッファに記憶され、そのためフレ
ームの処理が完成したとき、バッファされ、処理される
準備のできた新しいフレームがある。
ル化アナログ−デジタル変換器10からデジタル形式のsn
となって、分析プロセッサ11に受信され、プロセッサは
それらをベクトルあたりK個のサンプルのベクトルs
nに、フレームあたりN個のベクトルのフレームに分類
する。分析プロセッサは、次のフレームをコード化する
ために用いられるパラメータを計算するため、分析プロ
セッサは、1フレームのベクトル以上、たとえば、各ベ
クトルが20サンプルからなっており、フレームあたり8
ベクトルのフレームを2つ記憶する能力を有する、二重
バッファメモリにサンプルを記憶する。各フレームは1
つのバッファの外で処理されるので、入ってくる新しい
フレームは、他方のバッファに記憶され、そのためフレ
ームの処理が完成したとき、バッファされ、処理される
準備のできた新しいフレームがある。
分析プロセッサは、この発明の主題である、ベクトル
適合性予測コード化技術で用いられるフィルタのパラメ
ータを決定する。これらのパラメータは、ベクトル量子
化された(VQ)永久コードブック13と零状態応答(ZS
R)コードブック14の使用とともに発生されるベクトル
コードのフレームより丁度前に、マルチプレクサ12を介
して、副次情報として伝達される。副次情報は、フレー
ムの復号化されたベクトルを適切にフィルタするため
に、受信器を条件づける。分析プロセッサ11も、コード
化プロセスで用いられる他のパラメータを計算する。後
者は第1a図で破線で示され、知覚重みづけフィルタ18の
ためのW、LPC合成フィルタ15のための量子化されたLPC
予測子QLPC、ピッチ合成フィルタ16のための量子化され
たピッチQPとピッチ予測子QPPで示される、組のパラメ
ータからなる。スケールユニット17を制御するためのス
ケール因子Gも、分析プロセッサによって計算される。
副次情報として伝達される4つの量子化されたパラメー
タは、量子化されたピッチ索引、ピッチ予測子索引、LP
C予測子索引および利得索引として、量子化テーブルを
用いて、コード化される。分析プロセッサがこれらすべ
てのパラメータを計算する態様は、第3図を参照して説
明される。
適合性予測コード化技術で用いられるフィルタのパラメ
ータを決定する。これらのパラメータは、ベクトル量子
化された(VQ)永久コードブック13と零状態応答(ZS
R)コードブック14の使用とともに発生されるベクトル
コードのフレームより丁度前に、マルチプレクサ12を介
して、副次情報として伝達される。副次情報は、フレー
ムの復号化されたベクトルを適切にフィルタするため
に、受信器を条件づける。分析プロセッサ11も、コード
化プロセスで用いられる他のパラメータを計算する。後
者は第1a図で破線で示され、知覚重みづけフィルタ18の
ためのW、LPC合成フィルタ15のための量子化されたLPC
予測子QLPC、ピッチ合成フィルタ16のための量子化され
たピッチQPとピッチ予測子QPPで示される、組のパラメ
ータからなる。スケールユニット17を制御するためのス
ケール因子Gも、分析プロセッサによって計算される。
副次情報として伝達される4つの量子化されたパラメー
タは、量子化されたピッチ索引、ピッチ予測子索引、LP
C予測子索引および利得索引として、量子化テーブルを
用いて、コード化される。分析プロセッサがこれらすべ
てのパラメータを計算する態様は、第3図を参照して説
明される。
マルチプレクサ12は、副次情報を、それが入手可能に
なればすぐ伝達することが好ましい。それはコード化さ
れた入力ベクトルのフレームに続き得るかもしれない
が、それがなされている間、M個の零状態応答ベクトル
が、零状態応答(ZSR)コードブック14に対して、第2
図に図示される、送信器の、利得スケールユニット17、
LPC合成フィルタ15および知覚重みづけフィルタ18に対
応する(第1a図)、利得スケールユニット17′、LPC合
成フィルタ15′、および知覚重みづけフィルタ18′を介
して、VQコードブック13の各ベクトル、たとえば、128
のベクトルを処理する態様で計算される。連動した切換
スイッチS1とS2は、処理された各固定VQベクトルがZSR
コードブックの同じ索引(アドレス)のメモリ場所に記
憶されていることを表明するために示されている。
なればすぐ伝達することが好ましい。それはコード化さ
れた入力ベクトルのフレームに続き得るかもしれない
が、それがなされている間、M個の零状態応答ベクトル
が、零状態応答(ZSR)コードブック14に対して、第2
図に図示される、送信器の、利得スケールユニット17、
LPC合成フィルタ15および知覚重みづけフィルタ18に対
応する(第1a図)、利得スケールユニット17′、LPC合
成フィルタ15′、および知覚重みづけフィルタ18′を介
して、VQコードブック13の各ベクトル、たとえば、128
のベクトルを処理する態様で計算される。連動した切換
スイッチS1とS2は、処理された各固定VQベクトルがZSR
コードブックの同じ索引(アドレス)のメモリ場所に記
憶されていることを表明するために示されている。
各ベクトル処理の最初において、カスケードされたフ
ィルタ15′と18′の初期条件が零に設定される。これ
は、カスケードされたフィルタ15′と18′が行なうであ
ろうことをシミュレートし、前のベクトルはその対応の
VQコードブックから現われていない。すなわち、もし、
送信器の零入力応答フィルタ19の出力(第1a図)が、
(フレームの各ベクトルに対して伝達するために)VQコ
ード索引を計算する各段階で、そのように保持される
か、または記憶されれば、零状態応答出力を、ベクトル
fnから引くことによって、スピーチベクトルのコード化
を簡単にすることが可能である。換言すれば、M=128
とすれば、元のスピーチベクトルsnをコード化する際に
用いられるために、VQコードブックに永久的に記憶され
ている128の異なるベクトルがある。それから、この128
のVQベクトルのすべては、シーケンスで読出され、スケ
ールユニット17′、LPC合成フィルタ15′、および知覚
重みづけフィルタ18′を介して、各段階でそれらのフィ
ルタを再設定することにより、前のベクトルの入力の経
歴を伴わずに供給される。結果とし生じるフィルタ出力
ベクトルは、それから、零状態応答コードブックの対応
場所に記憶される。それから、ベクトルvnと零状態応答
ベクトルコードのすべてとの間の最良整合を見い出すこ
とによって、入力信号ベクトルsnをコード化する間に、
知覚主みづけフィルタから引出されたベクトルfnから、
前に選択されたVQベクトルの効果に対応する値を引くこ
とが必要である。それは、零入力応答フィルタ19を介し
て行なわれる。最良整合の索引(アドレス)は、ベクト
ルsnに対して伝達される圧縮されたベクトルコードとし
て用いられる。128の零状態応答ベクトルのうち、最良
整合、すなわち最小歪を提供する唯一のベクトルがある
であろう。それが、「ノルムを計算せよ」と名付けられ
てコンピュータ20によって決定されるように、零状態応
答コードブックの場所38にあると仮定する。アドレスレ
ジスタ20aは、索引38を記憶するであろう。そして、VQ
索引として第1b図に示されている受信器に伝達されるの
がその索引である。
ィルタ15′と18′の初期条件が零に設定される。これ
は、カスケードされたフィルタ15′と18′が行なうであ
ろうことをシミュレートし、前のベクトルはその対応の
VQコードブックから現われていない。すなわち、もし、
送信器の零入力応答フィルタ19の出力(第1a図)が、
(フレームの各ベクトルに対して伝達するために)VQコ
ード索引を計算する各段階で、そのように保持される
か、または記憶されれば、零状態応答出力を、ベクトル
fnから引くことによって、スピーチベクトルのコード化
を簡単にすることが可能である。換言すれば、M=128
とすれば、元のスピーチベクトルsnをコード化する際に
用いられるために、VQコードブックに永久的に記憶され
ている128の異なるベクトルがある。それから、この128
のVQベクトルのすべては、シーケンスで読出され、スケ
ールユニット17′、LPC合成フィルタ15′、および知覚
重みづけフィルタ18′を介して、各段階でそれらのフィ
ルタを再設定することにより、前のベクトルの入力の経
歴を伴わずに供給される。結果とし生じるフィルタ出力
ベクトルは、それから、零状態応答コードブックの対応
場所に記憶される。それから、ベクトルvnと零状態応答
ベクトルコードのすべてとの間の最良整合を見い出すこ
とによって、入力信号ベクトルsnをコード化する間に、
知覚主みづけフィルタから引出されたベクトルfnから、
前に選択されたVQベクトルの効果に対応する値を引くこ
とが必要である。それは、零入力応答フィルタ19を介し
て行なわれる。最良整合の索引(アドレス)は、ベクト
ルsnに対して伝達される圧縮されたベクトルコードとし
て用いられる。128の零状態応答ベクトルのうち、最良
整合、すなわち最小歪を提供する唯一のベクトルがある
であろう。それが、「ノルムを計算せよ」と名付けられ
てコンピュータ20によって決定されるように、零状態応
答コードブックの場所38にあると仮定する。アドレスレ
ジスタ20aは、索引38を記憶するであろう。そして、VQ
索引として第1b図に示されている受信器に伝達されるの
がその索引である。
受信器において、ディマルチプレクサ21は、送信器の
フィルタとスケールユニットに対応するのと同じパラメ
ータで受信器を条件づける、副次情報を分離する。受信
器は、パラメータ索引をパラメータ値に翻訳するため
に、デコーダ22を用いる。フレームの各連続するベクト
ルのVQ索引は、送信器の固定VQコードブック13と同一
の、VQコードブック23をアドレスする。LPC合成フィル
タ24、ピッチ合成フィルタ25およびスケールユニット26
は、零状態コードブック値を計算する際に用いられ、順
に、各入力ベクトルに対するコード化索引を選択するプ
ロセスで用いられた、同じパラメータで条件づけられ
る。コード化索引を見つけて伝達する各段階において、
零入力応答フィルタ19は、最良整合探索に用いられる零
入力応答を呈示するために、入力ベクトルfnから引かれ
るべき値を、VQベクトルから、伝達された索引の場所に
おいて計算する。
フィルタとスケールユニットに対応するのと同じパラメ
ータで受信器を条件づける、副次情報を分離する。受信
器は、パラメータ索引をパラメータ値に翻訳するため
に、デコーダ22を用いる。フレームの各連続するベクト
ルのVQ索引は、送信器の固定VQコードブック13と同一
の、VQコードブック23をアドレスする。LPC合成フィル
タ24、ピッチ合成フィルタ25およびスケールユニット26
は、零状態コードブック値を計算する際に用いられ、順
に、各入力ベクトルに対するコード化索引を選択するプ
ロセスで用いられた、同じパラメータで条件づけられ
る。コード化索引を見つけて伝達する各段階において、
零入力応答フィルタ19は、最良整合探索に用いられる零
入力応答を呈示するために、入力ベクトルfnから引かれ
るべき値を、VQベクトルから、伝達された索引の場所に
おいて計算する。
入力ベクトルsnに対する最良整合を決定するために用
いられ得る、様々な手順がある。最も単純なのは、各零
状態応答ベクトルコード出力とベクトルvn間の結果とし
て生じる歪を、その索引とともに記憶することである。
コードブック14に記憶される128のベクトルコードがあ
ると仮定すると、最良アドレスコンピュータ20に記憶さ
れる128の結果として生じる歪があるであろう。それか
ら、すべてが記憶された後で、最低歪値を求める探索が
コンピュータ20で行なわれる。その索引が、それからコ
ード化されたベクトルとして、マルチプレクサ12を介し
て受信器に、さらに、次の入力ベクトルsnの処理で用い
られる対応のVQベクトルを読むためのVQコードブックに
伝達される。
いられ得る、様々な手順がある。最も単純なのは、各零
状態応答ベクトルコード出力とベクトルvn間の結果とし
て生じる歪を、その索引とともに記憶することである。
コードブック14に記憶される128のベクトルコードがあ
ると仮定すると、最良アドレスコンピュータ20に記憶さ
れる128の結果として生じる歪があるであろう。それか
ら、すべてが記憶された後で、最低歪値を求める探索が
コンピュータ20で行なわれる。その索引が、それからコ
ード化されたベクトルとして、マルチプレクサ12を介し
て受信器に、さらに、次の入力ベクトルsnの処理で用い
られる対応のVQベクトルを読むためのVQコードブックに
伝達される。
要するに、VQコードブックは、2つの異なった段階で
用いられる(アクセスされる)ことが注目されるべきで
ある。第1は、各フレームの最初において、フレームに
よって決定された、LPC合成および知覚重みづけフィル
タパラメータを用いて、零状態応答コードブックに対す
るベクトルコードを計算すること、第2に、最良整合ベ
クトルの索引を探索中に、スケールユニット17を介し
て、フィルタ15および16を励起し、その間に、このよう
にして生じられた評価値nが入力ベクトルsnから引か
れることである。差分dnは、最良整合探索に用いられ
る。
用いられる(アクセスされる)ことが注目されるべきで
ある。第1は、各フレームの最初において、フレームに
よって決定された、LPC合成および知覚重みづけフィル
タパラメータを用いて、零状態応答コードブックに対す
るベクトルコードを計算すること、第2に、最良整合ベ
クトルの索引を探索中に、スケールユニット17を介し
て、フィルタ15および16を励起し、その間に、このよう
にして生じられた評価値nが入力ベクトルsnから引か
れることである。差分dnは、最良整合探索に用いられ
る。
各入力ベクトルsnに対する最良整合が見い出されるの
で、VQコードブックからの対応の予め定められた固定さ
れたベクトルが、フレームの次のベクトルに対する、零
入力応答フィルタ19を再設定するために用いられる。零
入力応答フィルタ19の機能は、そこで、VQコードブック
から以前に選択されたベクトルに対する、利得スケール
ユニット17′とフィルタ15′および18′の残差応答を見
つけることである。すなわち、選択されたベクトルは、
伝達されず、その索引のみが伝達される。受信器におい
て、その索引は、送信器のVQコードブック13に同一の、
VQコードブック23からの選択されたベクトルを読出すた
めに用いられる。
で、VQコードブックからの対応の予め定められた固定さ
れたベクトルが、フレームの次のベクトルに対する、零
入力応答フィルタ19を再設定するために用いられる。零
入力応答フィルタ19の機能は、そこで、VQコードブック
から以前に選択されたベクトルに対する、利得スケール
ユニット17′とフィルタ15′および18′の残差応答を見
つけることである。すなわち、選択されたベクトルは、
伝達されず、その索引のみが伝達される。受信器におい
て、その索引は、送信器のVQコードブック13に同一の、
VQコードブック23からの選択されたベクトルを読出すた
めに用いられる。
零入力応答フィルタ19は、ZSRコードブックを生じる
のに用いられるのと同じフィルタ化動作、すなわち第2
図に示される、利得G、LPC合成フィルタと重みづけフ
ィルタの組合わせである。一旦、最良コードブックベク
トル整合が決定されると、最良整合ベクトルが、入力と
してこのフィルタに与えられる(サンプルずつ、連続的
に)。入力スイッチsiが閉じられ、出力スイッチsoがこ
の時間開かれるので、第1のK個の出力サンプルは無視
される。(Kはベクトルの次元であり、典型的な値は20
である。)K個のすべてのサンプルが入力としてフィル
タに与えられるとすぐ、フィルタ入力スイッチsiは開か
れ、出力スイッチsoは閉じられる。ベクトルfnの次のK
個のサンプル、知覚重みづけフィルタの出力は、到着し
始め、ベクトルfnのサンプルから引かれる。このように
生じられた差分は、ZSRコードブック探索手続で用いら
れるために、静止レジスタで記憶されるベクトルvnを形
成する、1組のK個のサンプルである。ZSRコードブッ
ク探索手順において、ベクトルvnがZSRコードブックに
記憶される各ベクトルから引かれ、差分ベクトルΔが、
索引とともにコンピュータ20に供給され(または同じオ
ーダで記憶され)、それによって、ベクトルの索引をZS
Rコードブックの外に暗示する。コンピュータ20は、そ
れからどちらの差がより小さいか、すなわち、どちら
が、ベクトルvnと(入力ベクトルsnの1つのフレームに
対して)一時的に記憶された各ベクトル間の最良整合か
を決定する。その最良整合ベクトルの索引は、レジスタ
20aに記憶される。その索引は、ベクトルコードとして
伝達され、上記したように、そこに記憶されたベクトル
をスケールユニット17に読むために、VQコードブックに
アドレスするために用いられる。この探索プロセスは、
各ベクトルに対して、ZSRコードブックで繰返され、そ
れぞれ同じベクトルvnを用いる。それから、最良ベクト
ルが決定される。
のに用いられるのと同じフィルタ化動作、すなわち第2
図に示される、利得G、LPC合成フィルタと重みづけフ
ィルタの組合わせである。一旦、最良コードブックベク
トル整合が決定されると、最良整合ベクトルが、入力と
してこのフィルタに与えられる(サンプルずつ、連続的
に)。入力スイッチsiが閉じられ、出力スイッチsoがこ
の時間開かれるので、第1のK個の出力サンプルは無視
される。(Kはベクトルの次元であり、典型的な値は20
である。)K個のすべてのサンプルが入力としてフィル
タに与えられるとすぐ、フィルタ入力スイッチsiは開か
れ、出力スイッチsoは閉じられる。ベクトルfnの次のK
個のサンプル、知覚重みづけフィルタの出力は、到着し
始め、ベクトルfnのサンプルから引かれる。このように
生じられた差分は、ZSRコードブック探索手続で用いら
れるために、静止レジスタで記憶されるベクトルvnを形
成する、1組のK個のサンプルである。ZSRコードブッ
ク探索手順において、ベクトルvnがZSRコードブックに
記憶される各ベクトルから引かれ、差分ベクトルΔが、
索引とともにコンピュータ20に供給され(または同じオ
ーダで記憶され)、それによって、ベクトルの索引をZS
Rコードブックの外に暗示する。コンピュータ20は、そ
れからどちらの差がより小さいか、すなわち、どちら
が、ベクトルvnと(入力ベクトルsnの1つのフレームに
対して)一時的に記憶された各ベクトル間の最良整合か
を決定する。その最良整合ベクトルの索引は、レジスタ
20aに記憶される。その索引は、ベクトルコードとして
伝達され、上記したように、そこに記憶されたベクトル
をスケールユニット17に読むために、VQコードブックに
アドレスするために用いられる。この探索プロセスは、
各ベクトルに対して、ZSRコードブックで繰返され、そ
れぞれ同じベクトルvnを用いる。それから、最良ベクト
ルが決定される。
さて、第1b図を参照すると、次のことが注目されるべ
きである。すなわち、送信器のVQコードブック13を正確
に複写する、VQコードブック23の出力は、VQコードブッ
ク13にアドレスとして与えられた、最良整合索引から引
出されるベクトルと同一であり、利得ユニット26は送信
器の利得ユニット17と同一で、フィルタ24および25は、
受信器において、予測nよりは近似nがピッチ合成
フィルタ25の出力としてとられることを除いて、それぞ
れ、フィルタ15および16を正確に複写する。デジタルか
らアナログ形式に変換した後に、その結果は、非常に良
い品質で元のスピーチを再生する合成されたスピーチで
ある。
きである。すなわち、送信器のVQコードブック13を正確
に複写する、VQコードブック23の出力は、VQコードブッ
ク13にアドレスとして与えられた、最良整合索引から引
出されるベクトルと同一であり、利得ユニット26は送信
器の利得ユニット17と同一で、フィルタ24および25は、
受信器において、予測nよりは近似nがピッチ合成
フィルタ25の出力としてとられることを除いて、それぞ
れ、フィルタ15および16を正確に複写する。デジタルか
らアナログ形式に変換した後に、その結果は、非常に良
い品質で元のスピーチを再生する合成されたスピーチで
ある。
合成されたスピーチを、デジタルからアナログ形式に
変換する前に、適合性ポストフィルタ30を合成されたス
ピーチに適用することにより、知覚されるコード化され
た騒音が、フィルタされたスピーチに重大な歪を導入す
ることなく、非常に減じられるかもしれないことが見い
出された。第4図は、長期遅延フィルタ31と短期遅延フ
ィルタ32としての、適合性ポストフィルタの編成を図示
する。両方のフィルタは、それらで用いられているパラ
メータが、利得パラメータG以外は、副次情報として送
信器から受信されたものであるという点で適合性があ
る。適合性ポストフィルタ化の基本的な考えは、スペク
トル谷間領域のコード化されたスピーチの周波数構成要
素を減衰することである。低いビット速度において、か
なりの量の知覚されるコード化騒音は、その騒音をマス
クする強い共鳴がない、スペクトル谷間領域から来る。
ポストフィルタは、コード化された騒音をより知覚でき
ないものにするために、スペクトル谷間領域の騒音成分
を減衰する。しかしながら、このようなフィルタ化動作
は、スピーチスペクトルの形状に対する幾分かの歪を導
入することが避け難い。幸運にも、我々の耳は、スペク
トル谷間領域の歪に対してそれほど敏感ではない。それ
ゆえ、適合性ポストフィルタ化は、知覚されたスピーチ
におけるごくわずかな歪を導入するだけであるが、知覚
される雑音レベルを非常に減じる。適合性ポストフィル
タは、副次情報を決定するためのベクトルのフレームの
分析をさらに詳細に説明した後で、詳細に説明される。
変換する前に、適合性ポストフィルタ30を合成されたス
ピーチに適用することにより、知覚されるコード化され
た騒音が、フィルタされたスピーチに重大な歪を導入す
ることなく、非常に減じられるかもしれないことが見い
出された。第4図は、長期遅延フィルタ31と短期遅延フ
ィルタ32としての、適合性ポストフィルタの編成を図示
する。両方のフィルタは、それらで用いられているパラ
メータが、利得パラメータG以外は、副次情報として送
信器から受信されたものであるという点で適合性があ
る。適合性ポストフィルタ化の基本的な考えは、スペク
トル谷間領域のコード化されたスピーチの周波数構成要
素を減衰することである。低いビット速度において、か
なりの量の知覚されるコード化騒音は、その騒音をマス
クする強い共鳴がない、スペクトル谷間領域から来る。
ポストフィルタは、コード化された騒音をより知覚でき
ないものにするために、スペクトル谷間領域の騒音成分
を減衰する。しかしながら、このようなフィルタ化動作
は、スピーチスペクトルの形状に対する幾分かの歪を導
入することが避け難い。幸運にも、我々の耳は、スペク
トル谷間領域の歪に対してそれほど敏感ではない。それ
ゆえ、適合性ポストフィルタ化は、知覚されたスピーチ
におけるごくわずかな歪を導入するだけであるが、知覚
される雑音レベルを非常に減じる。適合性ポストフィル
タは、副次情報を決定するためのベクトルのフレームの
分析をさらに詳細に説明した後で、詳細に説明される。
第3図を参照すると、それは、第1a図のブロック11の
初期分析の組織を示す。入力スピーチサンプルsnは、ま
ず、たとえば、各ベクトルが20サンプルを有する、8ベ
クトルからなるフレームを1つ以上記憶することができ
る、バッファ40に記憶される。
初期分析の組織を示す。入力スピーチサンプルsnは、ま
ず、たとえば、各ベクトルが20サンプルを有する、8ベ
クトルからなるフレームを1つ以上記憶することができ
る、バッファ40に記憶される。
一旦、入力ベクトルsnのフレームが記憶されると、用
いられるべきパラメータと、副次情報とし伝達されるべ
きそれらの索引が、興味あるフレーム以上よりの情報と
ともに分析を行なうために、そのフレームから、および
少なくとも前のフレームの一部から決定される。分析
は、見られるように、ピッチ検出器41、ピッチ量子化器
42およびピッチ予測計数量子化器43を用いて行なわれ
る。「ピッチ」と言われるものは、入力信号の観察され
たいかなる周期性にも適用され、それは人間の声道のひ
だの振動に対応する「ピッチ」の古典的な使用に必ずし
も対応する必要はないかもしれない。スピーチの直接の
出力は、またピッチ予測計数量子化器43で用いられる。
量子化されたピッチ(QP)と量子化されたピッチ予測子
(QPP)は、ブロック44でピッチ予測残差を計算するた
めに、また、第1a図の予測子として用いられるピッチ合
成フィルタ16の制御パラメータとして用いられる。ピッ
チ索引とピッチ予測索引のみが、伝達されるビットの数
を最小にするために、副次情報に含まれる。受信器にお
いて、デコーダ22は、ピッチ合成フィルタ25に対応の制
御パラメータを生じるために、各索引を用いるであろ
う。
いられるべきパラメータと、副次情報とし伝達されるべ
きそれらの索引が、興味あるフレーム以上よりの情報と
ともに分析を行なうために、そのフレームから、および
少なくとも前のフレームの一部から決定される。分析
は、見られるように、ピッチ検出器41、ピッチ量子化器
42およびピッチ予測計数量子化器43を用いて行なわれ
る。「ピッチ」と言われるものは、入力信号の観察され
たいかなる周期性にも適用され、それは人間の声道のひ
だの振動に対応する「ピッチ」の古典的な使用に必ずし
も対応する必要はないかもしれない。スピーチの直接の
出力は、またピッチ予測計数量子化器43で用いられる。
量子化されたピッチ(QP)と量子化されたピッチ予測子
(QPP)は、ブロック44でピッチ予測残差を計算するた
めに、また、第1a図の予測子として用いられるピッチ合
成フィルタ16の制御パラメータとして用いられる。ピッ
チ索引とピッチ予測索引のみが、伝達されるビットの数
を最小にするために、副次情報に含まれる。受信器にお
いて、デコーダ22は、ピッチ合成フィルタ25に対応の制
御パラメータを生じるために、各索引を用いるであろ
う。
ピッチ予測残差は、ブロック46のLPC分析のために、
バッファ45に記憶される。LPC分析からのLPC予測子は、
ブロック47で量子化される。量子化されたLPC予測子の
索引は、副次情報の4つの部分の3番目として伝達さ
れ、その一方で、量子化されたLPC予測子は、LPC合成フ
ィルタ15の制御のために、パラメータとして、またブロ
ック48で、LPC予測残差の実効値を計算するために用い
られる。この値(量子化されない残差利得)は、それか
ら、第1a図のスケールユニット17で利得制御Gを提供す
るために、ブロック49で量子化される。量子化された残
差利得の索引は、伝達される副次情報の4番目の部分で
ある。
バッファ45に記憶される。LPC分析からのLPC予測子は、
ブロック47で量子化される。量子化されたLPC予測子の
索引は、副次情報の4つの部分の3番目として伝達さ
れ、その一方で、量子化されたLPC予測子は、LPC合成フ
ィルタ15の制御のために、パラメータとして、またブロ
ック48で、LPC予測残差の実効値を計算するために用い
られる。この値(量子化されない残差利得)は、それか
ら、第1a図のスケールユニット17で利得制御Gを提供す
るために、ブロック49で量子化される。量子化された残
差利得の索引は、伝達される副次情報の4番目の部分で
ある。
前述のことに加えて、分析部分は、知覚重みづけフィ
ルタ18(第1a図)の組のパラメータWがブロック51でそ
こから計算される、LPC予測子を作り出すために、ブロ
ック50でLPC分析を提供する。
ルタ18(第1a図)の組のパラメータWがブロック51でそ
こから計算される、LPC予測子を作り出すために、ブロ
ック50でLPC分析を提供する。
第1b図の適合性ポストフィルタ30は、第4図を参照し
て説明される。それは、カスケードされた、長期遅延フ
ィルタ31と短期遅延フィルタ32からなる。長期遅延フィ
ルタは、受信器で入手可能である、復号化されたピッチ
予測情報から引出される。それは、ピッチ調和周波数間
の周波数成分を減衰する。短期遅延フィルタは、LPC予
測情報から引出され、それはフォルマント周波数間の周
波数成分を減衰する。
て説明される。それは、カスケードされた、長期遅延フ
ィルタ31と短期遅延フィルタ32からなる。長期遅延フィ
ルタは、受信器で入手可能である、復号化されたピッチ
予測情報から引出される。それは、ピッチ調和周波数間
の周波数成分を減衰する。短期遅延フィルタは、LPC予
測情報から引出され、それはフォルマント周波数間の周
波数成分を減衰する。
M・R・シュローダー、B・S・アタルおよびJ・L
・ホールの「人間の耳のマスキング特性を利用すること
による、デジタルスピーチコーダの最適化」1979年12月
J.音響学学界Am.第66巻第6号第1647−1652頁によって
認められた、人間の聴覚認識の雑音マスキング効果が、
雑音スペクトル整形を用いることによってVAPCで利用さ
れる。しかしながら、雑音スペクトル整形において、或
る周波数の雑音成分を低くすることは、他の周波数にお
ける雑音成分を増加することによってのみ達成される。
[B・S・アタルとM・R・シュローダーの「スピーチ
信号の予測コード化と主観的な誤差基準」IEEE会報音響
学、スピーチおよび信号処理第ASSP−27巻第3号第247
−254頁、1979年6月]それゆえ、平均雑音レベルが非
常に高い、4800bpsの低いビット速度において、雑音を
あらゆる周波数でマスキングしきい値以下にすることは
たとえ不可能でなくても非常に難しい。スピーチフォル
マントは、知覚にとってはスペクトル谷間よりずっと重
要であるので、この発明の方策は、コード化の間、フォ
ルマント領域の雑音をできるだけ低く抑えることによっ
て、フォルマント情報を保つことである。もちろん、こ
の場合、スペクトル谷間における雑音成分がしきい値を
越すかもしれない。しかしながら、これらの雑音成分
が、ポストフィルタ32によって、後で減衰され得る。こ
のようなポストフィルタ化を行なうに際して、スペクト
ル谷間のスピーチ成分も、減衰されるであろう。幸運に
も、スペクトル谷間の強さに対する限度、または「やっ
と知覚できる差」は、大きくあり得る「J・L・フラナ
ガン、スピーチ分析、合成および知覚、アカデミック・
プレス、1972年ニューヨーク]。それゆえ、スペクトル
谷間の成分を減衰することによって、ポストフィルタ
は、スピーチ信号の最小限の歪のみを導入するが、実質
的な雑音削減を達成する。
・ホールの「人間の耳のマスキング特性を利用すること
による、デジタルスピーチコーダの最適化」1979年12月
J.音響学学界Am.第66巻第6号第1647−1652頁によって
認められた、人間の聴覚認識の雑音マスキング効果が、
雑音スペクトル整形を用いることによってVAPCで利用さ
れる。しかしながら、雑音スペクトル整形において、或
る周波数の雑音成分を低くすることは、他の周波数にお
ける雑音成分を増加することによってのみ達成される。
[B・S・アタルとM・R・シュローダーの「スピーチ
信号の予測コード化と主観的な誤差基準」IEEE会報音響
学、スピーチおよび信号処理第ASSP−27巻第3号第247
−254頁、1979年6月]それゆえ、平均雑音レベルが非
常に高い、4800bpsの低いビット速度において、雑音を
あらゆる周波数でマスキングしきい値以下にすることは
たとえ不可能でなくても非常に難しい。スピーチフォル
マントは、知覚にとってはスペクトル谷間よりずっと重
要であるので、この発明の方策は、コード化の間、フォ
ルマント領域の雑音をできるだけ低く抑えることによっ
て、フォルマント情報を保つことである。もちろん、こ
の場合、スペクトル谷間における雑音成分がしきい値を
越すかもしれない。しかしながら、これらの雑音成分
が、ポストフィルタ32によって、後で減衰され得る。こ
のようなポストフィルタ化を行なうに際して、スペクト
ル谷間のスピーチ成分も、減衰されるであろう。幸運に
も、スペクトル谷間の強さに対する限度、または「やっ
と知覚できる差」は、大きくあり得る「J・L・フラナ
ガン、スピーチ分析、合成および知覚、アカデミック・
プレス、1972年ニューヨーク]。それゆえ、スペクトル
谷間の成分を減衰することによって、ポストフィルタ
は、スピーチ信号の最小限の歪のみを導入するが、実質
的な雑音削減を達成する。
適合性ポストフィルタ化は、ADPCMコード化されたス
ピーチを高めるのに用いられて成功した。V・ラマモー
シィとJ・S・ジェイアンの「適合性ポストフィルタ化
によるADPCMスピーチの増進」AT&T Bell Labs Tech.J.
第1465−1475頁、1984年10月、およびN・S・ジェイア
ンとV・ラマモーシィの「16kb/s−ADPCMスピーチの適
合性ポストフィルタ化」(会報ICASSP第829−832頁、19
86年4月日本東京)を参照されたい。上記の、ラマモー
シィ等によって用いられたポストフィルタは、極と零を
原点に向かって半径方向に移動することにより、2極6
−0ADPCM合成フィルタから引出される。もし、この考え
が全極LPC合成フィルタ1/[1−(z)]に直接に拡
張されたなら、その結果は、対応のポストフィルタとし
て、I/[1−(z/α)]で、この場合0<α<1であ
る。このような全極ポストフィルタは実際に、知覚され
た雑音レベルを減じるが、十分な雑音削減は、フィルタ
化されたスピーチの厳しい消音化とともにのみ達成され
得る。これは、この全極ポストフィルタの周波数応答
が、一般に有声音のスピーチに対するローパススペクト
ル傾斜を有しているためである。
ピーチを高めるのに用いられて成功した。V・ラマモー
シィとJ・S・ジェイアンの「適合性ポストフィルタ化
によるADPCMスピーチの増進」AT&T Bell Labs Tech.J.
第1465−1475頁、1984年10月、およびN・S・ジェイア
ンとV・ラマモーシィの「16kb/s−ADPCMスピーチの適
合性ポストフィルタ化」(会報ICASSP第829−832頁、19
86年4月日本東京)を参照されたい。上記の、ラマモー
シィ等によって用いられたポストフィルタは、極と零を
原点に向かって半径方向に移動することにより、2極6
−0ADPCM合成フィルタから引出される。もし、この考え
が全極LPC合成フィルタ1/[1−(z)]に直接に拡
張されたなら、その結果は、対応のポストフィルタとし
て、I/[1−(z/α)]で、この場合0<α<1であ
る。このような全極ポストフィルタは実際に、知覚され
た雑音レベルを減じるが、十分な雑音削減は、フィルタ
化されたスピーチの厳しい消音化とともにのみ達成され
得る。これは、この全極ポストフィルタの周波数応答
が、一般に有声音のスピーチに対するローパススペクト
ル傾斜を有しているためである。
全極ポストフィルタ1/[1−(z/α)]のスペクト
ル傾斜は、極と同じ位相角を有するが、より小さい半径
の0を加えることによって、簡単に減じられ得る。結果
として生じる極−零ポストフィルタ32aの伝達関数は次
の形を有する。
ル傾斜は、極と同じ位相角を有するが、より小さい半径
の0を加えることによって、簡単に減じられ得る。結果
として生じる極−零ポストフィルタ32aの伝達関数は次
の形を有する。
ここにおいて、αおよびβは、さえずりを生じるほどに
非常に鋭く、雑音削減を達成しないほど非常に低いとい
うスペクトルピーク間の幾分かの兼ね合いを伴って、経
験的に決定される係数である。H(z)の周波数応答
は、次のように表現し得る。
非常に鋭く、雑音削減を達成しないほど非常に低いとい
うスペクトルピーク間の幾分かの兼ね合いを伴って、経
験的に決定される係数である。H(z)の周波数応答
は、次のように表現し得る。
それゆえ、対数メモリにおいて、極−零ポストフィルタ
の周波数応答H(z)は、単に、2つの全極ポストフィ
ルタの周波数応答相互間の差である。
の周波数応答H(z)は、単に、2つの全極ポストフィ
ルタの周波数応答相互間の差である。
αとβの典型的な値は、それぞれ、0.8と0.5である。
第5図より、α=0.8に対する応答は、フォルマントピ
ークとスペクトル傾斜の双方を有し、一方α=0.5の応
答は、スペクトル傾斜のみを有することが示される。す
なわち、等式2で、α=0.8およびβ=0.5の場合、β=
0.5の応答を、α=0.8の応答から引くことによって、ス
ペクトル傾斜を少なくとも部分的に取り除くことができ
る。結果として生じる周波数応答H(z)は、第6図の
上のプロットで示される。
第5図より、α=0.8に対する応答は、フォルマントピ
ークとスペクトル傾斜の双方を有し、一方α=0.5の応
答は、スペクトル傾斜のみを有することが示される。す
なわち、等式2で、α=0.8およびβ=0.5の場合、β=
0.5の応答を、α=0.8の応答から引くことによって、ス
ペクトル傾斜を少なくとも部分的に取り除くことができ
る。結果として生じる周波数応答H(z)は、第6図の
上のプロットで示される。
非公式の聞き取り試験において、消音効果は、分子項
[1−(z/β)]が、伝達関数H(z)に含まれた後
に、かなり減じられたことが見い出された。しかしなが
ら、フィルタ化されたスピーチは、スペクトル傾斜を補
償する項[1−(z/β)]を伴っても、わずかに依然
として消音化されたままである。さらに消音化効果を減
じるために、伝達関数[1−μz-1](ここにおいてμ
は典型的に0.5)を有する、第1のオーダのフィルタ32b
が加えられた。このようなフィルタは、わずかにハイパ
スされたスペクトル傾斜を提供し、そのため消音化を減
じるのに役立つ。この第1のオーダのフィルタは、H
(z)とともにカスケードされて用いられ、μ=0.5と
ともに組合わされた周波数応答は、第6図の下方のプロ
ットで示される。
[1−(z/β)]が、伝達関数H(z)に含まれた後
に、かなり減じられたことが見い出された。しかしなが
ら、フィルタ化されたスピーチは、スペクトル傾斜を補
償する項[1−(z/β)]を伴っても、わずかに依然
として消音化されたままである。さらに消音化効果を減
じるために、伝達関数[1−μz-1](ここにおいてμ
は典型的に0.5)を有する、第1のオーダのフィルタ32b
が加えられた。このようなフィルタは、わずかにハイパ
スされたスペクトル傾斜を提供し、そのため消音化を減
じるのに役立つ。この第1のオーダのフィルタは、H
(z)とともにカスケードされて用いられ、μ=0.5と
ともに組合わされた周波数応答は、第6図の下方のプロ
ットで示される。
基本的に説明された、短期遅延ポストフィルタ32は、
スピーチフォルマントを増幅し、インタフォルマント谷
間を減衰する。理想のポストフィルタ周波数応答を得る
ために、ピッチ調波を増幅し、調波相互間の谷間を減衰
しなければならない。このような周波数応答の特性は、
ピッチ予測子の情報を用いて、長期遅延ポストフィルタ
で達成され得る。
スピーチフォルマントを増幅し、インタフォルマント谷
間を減衰する。理想のポストフィルタ周波数応答を得る
ために、ピッチ調波を増幅し、調波相互間の谷間を減衰
しなければならない。このような周波数応答の特性は、
ピッチ予測子の情報を用いて、長期遅延ポストフィルタ
で達成され得る。
VAPCにおいて、我々は3タップピッチ予測子を用い
る。このようなピッチ予測子に対応するピッチ合成フィ
ルタは、安定であることが保証されない。このような合
成フィルタの極は、ユニットサークルの外側にあるかも
しれないので、極を原点に移動することは、安定したLP
C合成フィルタの場合と同じような効果を得ることがで
きないかもしれない。たとえ、3タップピッチ合成フィ
ルタが安定化されなくても、その周波数応答は不所望の
スペクトル傾斜を有しているかもしれない。すなわち、
ピッチ合成フィルタの3タップ重みをスケールダウンす
ることによって、長期遅延ポストフィルタを得ること
は、適切ではない。
る。このようなピッチ予測子に対応するピッチ合成フィ
ルタは、安定であることが保証されない。このような合
成フィルタの極は、ユニットサークルの外側にあるかも
しれないので、極を原点に移動することは、安定したLP
C合成フィルタの場合と同じような効果を得ることがで
きないかもしれない。たとえ、3タップピッチ合成フィ
ルタが安定化されなくても、その周波数応答は不所望の
スペクトル傾斜を有しているかもしれない。すなわち、
ピッチ合成フィルタの3タップ重みをスケールダウンす
ることによって、長期遅延ポストフィルタを得ること
は、適切ではない。
極および零双方を伴って、長期遅延ポストフィルタが
次のように選択され得る。
次のように選択され得る。
ここにおいて、pはピッチ分析によって決定され、C9は
適合性スケール因数である。
適合性スケール因数である。
単一の、または3タップピッチ予測子によって提供さ
れる情報が、値b2またはb1+b2+b3の和であると理解
し、γおよびλの因数は、以下の公式によって決定され
る。
れる情報が、値b2またはb1+b2+b3の和であると理解
し、γおよびλの因数は、以下の公式によって決定され
る。
γ=Cz f(x),λ=Cp f(x),0<Cz,Cp<1 (4) ここにおいて、 ここにおいて、Uthは経験的に定められたしきい値(典
型的に0.6)であり、xは、1タップ、または3タップ
ピッチ予測子が用いられるかどうかによって、b2または
b1+b2+b3のどちらかとなり得る。量子化された3タッ
プピッチ予測子が好ましいので、それゆえに、既にVAPC
受信器において入手可能となっているので、xはVAPCポ
ストフィルタ化において次のように選ばれる。
型的に0.6)であり、xは、1タップ、または3タップ
ピッチ予測子が用いられるかどうかによって、b2または
b1+b2+b3のどちらかとなり得る。量子化された3タッ
プピッチ予測子が好ましいので、それゆえに、既にVAPC
受信器において入手可能となっているので、xはVAPCポ
ストフィルタ化において次のように選ばれる。
他方、もし、ポストフィルタが騒がしいスピーチ入力
スピーチを高めるためにどこか他で用いられたら、別の
ピッチ分析が必要であり、xは単一の値b2として選ばれ
るかもしれない。なぜなら、1タップピッチ予測子で十
分だからである。(単一で使われたときの値b2は、単一
タップ予測子からの値を示し、それは実際は、b1とb3が
0に設定されたときの、3タップ予測子と同じであろ
う。) ゴールは、{y(n)}のパワーを、{s(n)}の
それと同じくらいにすることである。適切なスケール因
数は次のようにして選ばれる。
スピーチを高めるためにどこか他で用いられたら、別の
ピッチ分析が必要であり、xは単一の値b2として選ばれ
るかもしれない。なぜなら、1タップピッチ予測子で十
分だからである。(単一で使われたときの値b2は、単一
タップ予測子からの値を示し、それは実際は、b1とb3が
0に設定されたときの、3タップ予測子と同じであろ
う。) ゴールは、{y(n)}のパワーを、{s(n)}の
それと同じくらいにすることである。適切なスケール因
数は次のようにして選ばれる。
第1のオーダのフィルタ32bも、H(z)のスペクト
ル傾斜においてより好く変化をたどるために適合させら
れ得る。しかしながら、たとえμ=0.5の固定フィルタ
さえも十分満足できる結果を与えることが見い出され
た。μの固定値は、経験的に決められてよいであろう。
ル傾斜においてより好く変化をたどるために適合させら
れ得る。しかしながら、たとえμ=0.5の固定フィルタ
さえも十分満足できる結果を与えることが見い出され
た。μの固定値は、経験的に決められてよいであろう。
時折の大きな利得の逸脱を避けるために、自動利得制
御(AGC)が、適合性ポストフィルタの出力に加えられ
た。AGCの目的は、高められたスピーチを、フィルタ化
されない騒がしいスピーチと同じパワーを大体持つよう
にするようにスケールすることである。それには、スピ
ーチ入力s(n)で動作する利得(量)推定子33、ポス
トフィルタ化された出力r(n)で動作する利得(量)
推定子34および回路35を、スケール因数を2つの利得の
割合として計算するために含む。ポストフィルタ化され
た出力r(n)は、それからマルチプライヤ36でこの割
合によって乗算される。AGCは、そこでフィルタ化され
ないおよびフィルタ化されたスピーチのパワーを別々に
評価し、それから、2つの値の割合をスケール因数とし
て用いることによって達成される。フィルタ化されな
い、またはフィルタ化されたスピーチのサンプルのいず
れかのシーケンスを{s(n)}とすると、スピーチパ
ワーσ2(n)が以下の式を用いることによって評価さ
れる。
御(AGC)が、適合性ポストフィルタの出力に加えられ
た。AGCの目的は、高められたスピーチを、フィルタ化
されない騒がしいスピーチと同じパワーを大体持つよう
にするようにスケールすることである。それには、スピ
ーチ入力s(n)で動作する利得(量)推定子33、ポス
トフィルタ化された出力r(n)で動作する利得(量)
推定子34および回路35を、スケール因数を2つの利得の
割合として計算するために含む。ポストフィルタ化され
た出力r(n)は、それからマルチプライヤ36でこの割
合によって乗算される。AGCは、そこでフィルタ化され
ないおよびフィルタ化されたスピーチのパワーを別々に
評価し、それから、2つの値の割合をスケール因数とし
て用いることによって達成される。フィルタ化されな
い、またはフィルタ化されたスピーチのサンプルのいず
れかのシーケンスを{s(n)}とすると、スピーチパ
ワーσ2(n)が以下の式を用いることによって評価さ
れる。
σ2(n)=ζσ2(n−1)+(1−ζ)s2(n),0<ζ<1 (7) ζの適切な値は0.99である。
この部分で説明されたポストフィルタの複雑さは、VA
PCシステムの残り、または使われるかもしれない他のコ
ード化システムの全体の複雑さの小さな端数にすぎな
い。シミュレーションにおいて、このポストフィルタ
が、スピーチのほぼ無視できる歪を伴って、かなりの騒
音削減を達成する。可能性ある歪の影響をテストするた
めに、適合性ポストフィルタ化動作が、クリーンでコー
ド化されないスピーチに適用され、フィルタ化されない
元のと、そのフィルタ化されたものの音は本質的に同じ
で、このポストフィルタによって導入される歪は無視で
きることを示すことが見い出された。
PCシステムの残り、または使われるかもしれない他のコ
ード化システムの全体の複雑さの小さな端数にすぎな
い。シミュレーションにおいて、このポストフィルタ
が、スピーチのほぼ無視できる歪を伴って、かなりの騒
音削減を達成する。可能性ある歪の影響をテストするた
めに、適合性ポストフィルタ化動作が、クリーンでコー
ド化されないスピーチに適用され、フィルタ化されない
元のと、そのフィルタ化されたものの音は本質的に同じ
で、このポストフィルタによって導入される歪は無視で
きることを示すことが見い出された。
この新規なポストフィルタ化技術は、本願発明ととも
に用いられるために開発されたが、その応用はそれとと
もに用いるのに限定されないことが注目されるべきであ
る。事実、この技術は、あらゆる騒がしいデジタルスピ
ーチ信号の品質を高めるためだけでなく、パラメータを
決定するための、バッファと分析部分を提供される際
の、他のスピーチコーダの復号化されたスピーチを高め
るためにも用いられ得る。
に用いられるために開発されたが、その応用はそれとと
もに用いるのに限定されないことが注目されるべきであ
る。事実、この技術は、あらゆる騒がしいデジタルスピ
ーチ信号の品質を高めるためだけでなく、パラメータを
決定するための、バッファと分析部分を提供される際
の、他のスピーチコーダの復号化されたスピーチを高め
るためにも用いられ得る。
開示されたことは、商業的に入手可能なAT&T DSP32
デジタル処理チップを用いて、ソフトウェアとともに実
現されるであろうスピーチまたはオーディオのための実
時間ベクトル適合性予測コーダ(VAPC)である。チップ
の最も新しいものにおいて、このチップは1秒あたり60
0万の命令の処理能力を有している(MIPS)。実時間ス
ピーチコード化の実現を容易にするために、4800bpsのV
APCの単純化されたものが入手可能である。この単純化
されたものは、ずっと低い複雑さを有するが、全く複雑
なものと同じスピーチ品質をほぼ有している。
デジタル処理チップを用いて、ソフトウェアとともに実
現されるであろうスピーチまたはオーディオのための実
時間ベクトル適合性予測コーダ(VAPC)である。チップ
の最も新しいものにおいて、このチップは1秒あたり60
0万の命令の処理能力を有している(MIPS)。実時間ス
ピーチコード化の実現を容易にするために、4800bpsのV
APCの単純化されたものが入手可能である。この単純化
されたものは、ずっと低い複雑さを有するが、全く複雑
なものと同じスピーチ品質をほぼ有している。
実時間実現において、平均二乗誤差(MSE)歪を計算
する従来の差分二乗方策よりずっと効果的な、内積方策
は、ノルム(最小歪)を計算するために用いられる。テ
ストベクトルvとM個のZSRコードブックベクトル、
zj、j=1,2,…,M、j番目のMSE歪は、以下のように計
算され得る。
する従来の差分二乗方策よりずっと効果的な、内積方策
は、ノルム(最小歪)を計算するために用いられる。テ
ストベクトルvとM個のZSRコードブックベクトル、
zj、j=1,2,…,M、j番目のMSE歪は、以下のように計
算され得る。
各フレームの最初において、1/2 ‖Zj‖2を計算し記憶
することが可能である。DSP32プロセッサで、用いられ
る次元とコードブック寸法に対して、コードブック探索
の差分二乗方策は、実現するために約2.5MIPSを要求
し、一方内積方策は、約1.5MIPSを要求するのみであ
る。
することが可能である。DSP32プロセッサで、用いられ
る次元とコードブック寸法に対して、コードブック探索
の差分二乗方策は、実現するために約2.5MIPSを要求
し、一方内積方策は、約1.5MIPSを要求するのみであ
る。
VAPCの複雑さは、1秒あたり約300万の乗算−加算
と、データメモリの6kのワードのみである。しかしなが
ら、実現の総費用のため、単一のDSP32チップは、コー
ダを実現するには十分でなかった。それゆえ、2つのDS
P32チップが、VAPCを実現するために用いられた。250ns
というよりはむしろ、160nsの命令サイクル時間を有す
る、より速いDSP32チップが現在は入手可能で、1つのD
SP32チップのみを用いて、VAPCが実現され得ることが期
待される。
と、データメモリの6kのワードのみである。しかしなが
ら、実現の総費用のため、単一のDSP32チップは、コー
ダを実現するには十分でなかった。それゆえ、2つのDS
P32チップが、VAPCを実現するために用いられた。250ns
というよりはむしろ、160nsの命令サイクル時間を有す
る、より速いDSP32チップが現在は入手可能で、1つのD
SP32チップのみを用いて、VAPCが実現され得ることが期
待される。
【図面の簡単な説明】 第1a図は、この発明を実現化する、ベクトル適合性予測
コード化(VAPC)プロセッサのブロック図であり、第1b
図は、第1a図のシステムによって伝達されるコード化さ
れたスピーチのための受信器のブロック図である。 第2図は、第1a図のシステムの零状態応答コードブック
に対するベクトルの適合計算を図示する概略図である。 第3図は、第1a図のシステムの分析プロセッサのブロッ
ク図である。 第4図は、第1b図の適合性ポストフィルタのブロック図
である。 第5図は、LPCスペクトルと、αの異なった値の全極ポ
ストフィルタ の対応周波数応答を図示する。隣接するプロット間のオ
フセットは、20dBである。 第6図は、第5図で示されるLPCスペクトルに対応す
る、ポストフィルタ[1−μz-1][1−(z/β)]
/[1−(z/α)]の周波数応答を図示する。両方の
プロットにおいて、α=0.8とβ=0.5である。2つのプ
ロット間のオフセットは、20dBである。 図において、10は変換器、11は分析プロセッサ、12はマ
ルチプレクサ、13は永久コードブック、14は零状態応答
コードブック、15は分析フィルタ、16はピッチ合成フィ
ルタ、17はスケールユニット、18は知覚重みづけフィル
タ、19は零入力応答フィルタ、21はディマルチプレク
サ、22はデコーダ、23はVQコードブック、24はLPC合成
フィルタ、25はピッチ合成フィルタ、26はスケールユニ
ットである。
コード化(VAPC)プロセッサのブロック図であり、第1b
図は、第1a図のシステムによって伝達されるコード化さ
れたスピーチのための受信器のブロック図である。 第2図は、第1a図のシステムの零状態応答コードブック
に対するベクトルの適合計算を図示する概略図である。 第3図は、第1a図のシステムの分析プロセッサのブロッ
ク図である。 第4図は、第1b図の適合性ポストフィルタのブロック図
である。 第5図は、LPCスペクトルと、αの異なった値の全極ポ
ストフィルタ の対応周波数応答を図示する。隣接するプロット間のオ
フセットは、20dBである。 第6図は、第5図で示されるLPCスペクトルに対応す
る、ポストフィルタ[1−μz-1][1−(z/β)]
/[1−(z/α)]の周波数応答を図示する。両方の
プロットにおいて、α=0.8とβ=0.5である。2つのプ
ロット間のオフセットは、20dBである。 図において、10は変換器、11は分析プロセッサ、12はマ
ルチプレクサ、13は永久コードブック、14は零状態応答
コードブック、15は分析フィルタ、16はピッチ合成フィ
ルタ、17はスケールユニット、18は知覚重みづけフィル
タ、19は零入力応答フィルタ、21はディマルチプレク
サ、22はデコーダ、23はVQコードブック、24はLPC合成
フィルタ、25はピッチ合成フィルタ、26はスケールユニ
ットである。
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特公 昭59−12186(JP,B2) 特表 昭55−500402(JP,A) 特表 昭62−500138(JP,A)
Claims (9)
- 【請求項1】デジタル的に処理されたスピーチまたはオ
ーディオ信号を受信側で、短期遅延フィルタ処理するこ
とにより改善するための適応的フィルタ処理方法であっ
て、前記短期遅延フィルタ処理は、予め定められた線形
予測係数パラメータに従って行なわれるものであり、前
記短期遅延フィルタ処理は、同じ関数形を有する2つの
全極伝達関数の比からなりかつ零点と前記零点に対応す
る極を有する極−零伝達関数を用いることを特徴としか
つ前記零点および前記極各々が複素平面上で半径および
位相により表わされ、かつ前記零点が前記極よりも小さ
な半径を有することを特徴とする、適応的フィルタ処理
方法。 - 【請求項2】前記短期遅延フィルタ処理は、長期遅延フ
ィルタ処理に縦続して行なわれ、前記長期遅延フィルタ
処理は予め定められたピッチおよびピッチ予測子パラメ
ータに従って行なわれることを特徴とする、特許請求の
範囲第1項記載の適応的フィルタ処理方法。 - 【請求項3】前記短期遅延フィルタ処理に縦続接続され
る一次フィルタ処理をさらに含み、前記一次フィルタ処
理は、μ<1として、伝達関数1−μ・z-iを用いるこ
とを特徴とする、特許請求の範囲第1項または第2項記
載の適応的フィルタ処理方法。 - 【請求項4】前記パラメータは処理前のデジタルスピー
チまたはオーディオ信号の解析により送信側で予め定め
られかつ前記パラメータは前記受信側へ前記デジタル的
に処理されたスピーチまたはオーディオ信号と共に送信
されることを特徴とする、特許請求の範囲第1項または
第2項記載の適応的フィルタ処理方法。 - 【請求項5】前記パラメータは、前記受信側で、受信し
たデジタル的に処理されたスピーチまたはオーディオ信
号の解析を行なうことにより予め定められることを特徴
とする、特許請求の範囲第1項または第2項記載の適応
的フィルタ処理方法。 - 【請求項6】前記線形予測係数パラメータは処理前のデ
ジタルスピーチまたはオーディオ信号の解析により送信
側で予め定められ、かつ前記線形予測係数パラメータは
前記受信側へ送信されかつ前記ピッチおよびピッチ予測
子パラメータは前記デジタル的に処理されたスピーチま
たはオーディオ信号を受信側で受信してその受けたデジ
タル的に処理されたスピーチまたはオーディオ信号の解
析を行なうことにより受信器側で予め定められることを
特徴とする、特許請求の範囲第2項記載の適応的フィル
タ処理方法。 - 【請求項7】フィルタ処理後に前記デジタル的に処理さ
れた信号の自動利得制御を、フィルタ処理されたスピー
チまたはオーディオ信号の大きさに比例する値σ2
(n)と前記フィルタ処理前のスピーチまたはオーディ
オ信号の大きさに比例する値σ1(n)を計算すること
により行ない、かつフィルタ処理されたスピーチまたは
オーディオ信号の利得を前記σ1(n)対σ2(n)の
比により調整することを特徴とする、特許請求の範囲第
1項ないし第6項のいずれかに記載の適応的フィルタ処
理方法。 - 【請求項8】前記ポストフィルタ処理は、前記長期遅延
ポストフィルタのための伝達関数として、 Cg(1+γ・z-p)/(1−λ・z-p)の形の伝達関数を
用いて行なわれ、ここでCgは適応的スケーリング因子で
ありまた因子γおよびλは次式に従って決定され、 γ=Cz・f(x)、λ=Cp・f(x)、0<Cz、Cp<1 但し、f(x)は次式で表わされ、 x>1のとき;1 Uth≦x≦1のとき;x x<Uthのとき;0 であり、但しUthはしきい値を示し、またxは1タップ
または3タップピッチ予測子が用いられるかどうかに従
ってb2またはb1+b2+b3であることを特徴とする、特許
請求の範囲第2項記載の適応的フィルタ処理方法。 - 【請求項9】前記零点の位相と前記対応の極の位相は同
じである、特許請求の範囲第1項記載の適応的フィルタ
処理方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US035,615 | 1987-04-06 | ||
US07/035,615 US4969192A (en) | 1987-04-06 | 1987-04-06 | Vector adaptive predictive coder for speech and audio |
Publications (2)
Publication Number | Publication Date |
---|---|
JPS6413200A JPS6413200A (en) | 1989-01-18 |
JP2887286B2 true JP2887286B2 (ja) | 1999-04-26 |
Family
ID=21883771
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP63084973A Expired - Lifetime JP2887286B2 (ja) | 1987-04-06 | 1988-04-05 | デジタル的にコード化されたスピーチを圧縮するたの方法における改良 |
Country Status (6)
Country | Link |
---|---|
US (1) | US4969192A (ja) |
EP (2) | EP0294020A3 (ja) |
JP (1) | JP2887286B2 (ja) |
AU (1) | AU1387388A (ja) |
CA (1) | CA1336454C (ja) |
DE (1) | DE3856211T2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6941263B2 (en) | 2001-06-29 | 2005-09-06 | Microsoft Corporation | Frequency domain postfiltering for quality enhancement of coded speech |
Families Citing this family (145)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4899385A (en) * | 1987-06-26 | 1990-02-06 | American Telephone And Telegraph Company | Code excited linear predictive vocoder |
CA2002015C (en) * | 1988-12-30 | 1994-12-27 | Joseph Lindley Ii Hall | Perceptual coding of audio signals |
JPH0332228A (ja) * | 1989-06-29 | 1991-02-12 | Fujitsu Ltd | ゲイン―シェイプ・ベクトル量子化方式 |
US5263119A (en) * | 1989-06-29 | 1993-11-16 | Fujitsu Limited | Gain-shape vector quantization method and apparatus |
CA2021514C (en) * | 1989-09-01 | 1998-12-15 | Yair Shoham | Constrained-stochastic-excitation coding |
IL95753A (en) * | 1989-10-17 | 1994-11-11 | Motorola Inc | Digits a digital speech |
CA2066568A1 (en) * | 1989-10-17 | 1991-04-18 | Ira A. Gerson | Lpc based speech synthesis with adaptive pitch prefilter |
ATE177867T1 (de) * | 1989-10-17 | 1999-04-15 | Motorola Inc | Digitaler sprachdekodierer unter verwendung einer nachfilterung mit einer reduzierten spektralverzerrung |
US5307441A (en) * | 1989-11-29 | 1994-04-26 | Comsat Corporation | Wear-toll quality 4.8 kbps speech codec |
US5235669A (en) * | 1990-06-29 | 1993-08-10 | At&T Laboratories | Low-delay code-excited linear-predictive coding of wideband speech at 32 kbits/sec |
JPH06138896A (ja) * | 1991-05-31 | 1994-05-20 | Motorola Inc | 音声フレームを符号化するための装置および方法 |
DE69232202T2 (de) * | 1991-06-11 | 2002-07-25 | Qualcomm, Inc. | Vocoder mit veraendlicher bitrate |
JP3076086B2 (ja) * | 1991-06-28 | 2000-08-14 | シャープ株式会社 | 音声合成装置用ポストフィルタ |
US5233660A (en) * | 1991-09-10 | 1993-08-03 | At&T Bell Laboratories | Method and apparatus for low-delay celp speech coding and decoding |
US5339384A (en) * | 1992-02-18 | 1994-08-16 | At&T Bell Laboratories | Code-excited linear predictive coding with low delay for speech or audio signals |
US5327520A (en) * | 1992-06-04 | 1994-07-05 | At&T Bell Laboratories | Method of use of voice message coder/decoder |
FI95086C (fi) * | 1992-11-26 | 1995-12-11 | Nokia Mobile Phones Ltd | Menetelmä puhesignaalin tehokkaaksi koodaamiseksi |
IT1272418B (it) * | 1993-04-29 | 1997-06-23 | Alcatel Italia | Sistema per il trattamento di segnali affetti da errori di trasmissione |
FI96248C (fi) * | 1993-05-06 | 1996-05-27 | Nokia Mobile Phones Ltd | Menetelmä pitkän aikavälin synteesisuodattimen toteuttamiseksi sekä synteesisuodatin puhekoodereihin |
DE4315319C2 (de) * | 1993-05-07 | 2002-11-14 | Bosch Gmbh Robert | Verfahren zur Aufbereitung von Daten, insbesondere von codierten Sprachsignalparametern |
DE4315313C2 (de) * | 1993-05-07 | 2001-11-08 | Bosch Gmbh Robert | Vektorcodierverfahren insbesondere für Sprachsignale |
US5504834A (en) * | 1993-05-28 | 1996-04-02 | Motrola, Inc. | Pitch epoch synchronous linear predictive coding vocoder and method |
US5479559A (en) * | 1993-05-28 | 1995-12-26 | Motorola, Inc. | Excitation synchronous time encoding vocoder and method |
US5659659A (en) * | 1993-07-26 | 1997-08-19 | Alaris, Inc. | Speech compressor using trellis encoding and linear prediction |
JPH07160297A (ja) * | 1993-12-10 | 1995-06-23 | Nec Corp | 音声パラメータ符号化方式 |
JP3024468B2 (ja) * | 1993-12-10 | 2000-03-21 | 日本電気株式会社 | 音声復号装置 |
US5764698A (en) * | 1993-12-30 | 1998-06-09 | International Business Machines Corporation | Method and apparatus for efficient compression of high quality digital audio |
FR2715755B1 (fr) * | 1994-01-28 | 1996-04-12 | France Telecom | Procédé et dispositif de reconnaissance de la parole. |
CA2142391C (en) * | 1994-03-14 | 2001-05-29 | Juin-Hwey Chen | Computational complexity reduction during frame erasure or packet loss |
JP3321976B2 (ja) * | 1994-04-01 | 2002-09-09 | 富士通株式会社 | 信号処理装置および信号処理方法 |
JP2956473B2 (ja) * | 1994-04-21 | 1999-10-04 | 日本電気株式会社 | ベクトル量子化装置 |
US5544278A (en) * | 1994-04-29 | 1996-08-06 | Audio Codes Ltd. | Pitch post-filter |
US5602961A (en) * | 1994-05-31 | 1997-02-11 | Alaris, Inc. | Method and apparatus for speech compression using multi-mode code excited linear predictive coding |
JP2964879B2 (ja) * | 1994-08-22 | 1999-10-18 | 日本電気株式会社 | ポストフィルタ |
SE504010C2 (sv) * | 1995-02-08 | 1996-10-14 | Ericsson Telefon Ab L M | Förfarande och anordning för prediktiv kodning av tal- och datasignaler |
US5664053A (en) * | 1995-04-03 | 1997-09-02 | Universite De Sherbrooke | Predictive split-matrix quantization of spectral parameters for efficient coding of speech |
JP2993396B2 (ja) * | 1995-05-12 | 1999-12-20 | 三菱電機株式会社 | 音声加工フィルタ及び音声合成装置 |
FR2734389B1 (fr) * | 1995-05-17 | 1997-07-18 | Proust Stephane | Procede d'adaptation du niveau de masquage du bruit dans un codeur de parole a analyse par synthese utilisant un filtre de ponderation perceptuelle a court terme |
GB9512284D0 (en) * | 1995-06-16 | 1995-08-16 | Nokia Mobile Phones Ltd | Speech Synthesiser |
EP0763818B1 (en) * | 1995-09-14 | 2003-05-14 | Kabushiki Kaisha Toshiba | Formant emphasis method and formant emphasis filter device |
US5790759A (en) * | 1995-09-19 | 1998-08-04 | Lucent Technologies Inc. | Perceptual noise masking measure based on synthesis filter frequency response |
US5710863A (en) * | 1995-09-19 | 1998-01-20 | Chen; Juin-Hwey | Speech signal quantization using human auditory models in predictive coding systems |
JP3680380B2 (ja) * | 1995-10-26 | 2005-08-10 | ソニー株式会社 | 音声符号化方法及び装置 |
US5745872A (en) * | 1996-05-07 | 1998-04-28 | Texas Instruments Incorporated | Method and system for compensating speech signals using vector quantization codebook adaptation |
EP0814458B1 (en) * | 1996-06-19 | 2004-09-22 | Texas Instruments Incorporated | Improvements in or relating to speech coding |
EP0917709B1 (en) * | 1996-07-30 | 2000-06-07 | BRITISH TELECOMMUNICATIONS public limited company | Speech coding |
JP3357795B2 (ja) * | 1996-08-16 | 2002-12-16 | 株式会社東芝 | 音声符号化方法および装置 |
US5920853A (en) * | 1996-08-23 | 1999-07-06 | Rockwell International Corporation | Signal compression using index mapping technique for the sharing of quantization tables |
US7788092B2 (en) * | 1996-09-25 | 2010-08-31 | Qualcomm Incorporated | Method and apparatus for detecting bad data packets received by a mobile telephone using decoded speech parameters |
DE19643900C1 (de) * | 1996-10-30 | 1998-02-12 | Ericsson Telefon Ab L M | Nachfiltern von Hörsignalen, speziell von Sprachsignalen |
US5960389A (en) | 1996-11-15 | 1999-09-28 | Nokia Mobile Phones Limited | Methods for generating comfort noise during discontinuous transmission |
FI964975A (fi) * | 1996-12-12 | 1998-06-13 | Nokia Mobile Phones Ltd | Menetelmä ja laite puheen koodaamiseksi |
US6782365B1 (en) | 1996-12-20 | 2004-08-24 | Qwest Communications International Inc. | Graphic interface system and product for editing encoded audio data |
US6477496B1 (en) | 1996-12-20 | 2002-11-05 | Eliot M. Case | Signal synthesis by decoding subband scale factors from one audio signal and subband samples from different one |
US6516299B1 (en) | 1996-12-20 | 2003-02-04 | Qwest Communication International, Inc. | Method, system and product for modifying the dynamic range of encoded audio signals |
US5864820A (en) * | 1996-12-20 | 1999-01-26 | U S West, Inc. | Method, system and product for mixing of encoded audio signals |
US6463405B1 (en) | 1996-12-20 | 2002-10-08 | Eliot M. Case | Audiophile encoding of digital audio data using 2-bit polarity/magnitude indicator and 8-bit scale factor for each subband |
US5864813A (en) * | 1996-12-20 | 1999-01-26 | U S West, Inc. | Method, system and product for harmonic enhancement of encoded audio signals |
US5845251A (en) * | 1996-12-20 | 1998-12-01 | U S West, Inc. | Method, system and product for modifying the bandwidth of subband encoded audio data |
US5966687A (en) * | 1996-12-30 | 1999-10-12 | C-Cube Microsystems, Inc. | Vocal pitch corrector |
US6148282A (en) * | 1997-01-02 | 2000-11-14 | Texas Instruments Incorporated | Multimodal code-excited linear prediction (CELP) coder and method using peakiness measure |
US5832443A (en) * | 1997-02-25 | 1998-11-03 | Alaris, Inc. | Method and apparatus for adaptive audio compression and decompression |
FI114248B (fi) | 1997-03-14 | 2004-09-15 | Nokia Corp | Menetelmä ja laite audiokoodaukseen ja audiodekoodaukseen |
IL120788A (en) | 1997-05-06 | 2000-07-16 | Audiocodes Ltd | Systems and methods for encoding and decoding speech for lossy transmission networks |
FI113903B (fi) | 1997-05-07 | 2004-06-30 | Nokia Corp | Puheen koodaus |
GB2326572A (en) * | 1997-06-19 | 1998-12-23 | Softsound Limited | Low bit rate audio coder and decoder |
FI973873A (fi) | 1997-10-02 | 1999-04-03 | Nokia Mobile Phones Ltd | Puhekoodaus |
JP2001508197A (ja) * | 1997-10-31 | 2001-06-19 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | 構成信号にノイズを加算してlpc原理により符号化された音声のオーディオ再生のための方法及び装置 |
US6104994A (en) * | 1998-01-13 | 2000-08-15 | Conexant Systems, Inc. | Method for speech coding under background noise conditions |
FI980132A (fi) | 1998-01-21 | 1999-07-22 | Nokia Mobile Phones Ltd | Adaptoituva jälkisuodatin |
FI113571B (fi) | 1998-03-09 | 2004-05-14 | Nokia Corp | Puheenkoodaus |
US6453289B1 (en) | 1998-07-24 | 2002-09-17 | Hughes Electronics Corporation | Method of noise reduction for speech codecs |
US6330533B2 (en) * | 1998-08-24 | 2001-12-11 | Conexant Systems, Inc. | Speech encoder adaptively applying pitch preprocessing with warping of target signal |
US6188980B1 (en) * | 1998-08-24 | 2001-02-13 | Conexant Systems, Inc. | Synchronized encoder-decoder frame concealment using speech coding parameters including line spectral frequencies and filter coefficients |
US7072832B1 (en) | 1998-08-24 | 2006-07-04 | Mindspeed Technologies, Inc. | System for speech encoding having an adaptive encoding arrangement |
US6385573B1 (en) * | 1998-08-24 | 2002-05-07 | Conexant Systems, Inc. | Adaptive tilt compensation for synthesized speech residual |
US6275798B1 (en) | 1998-09-16 | 2001-08-14 | Telefonaktiebolaget L M Ericsson | Speech coding with improved background noise reproduction |
FR2783651A1 (fr) * | 1998-09-22 | 2000-03-24 | Koninkl Philips Electronics Nv | Dispositif et procede de filtrage d'un signal de parole, recepteur et systeme de communications telephonique |
GB2342829B (en) | 1998-10-13 | 2003-03-26 | Nokia Mobile Phones Ltd | Postfilter |
US6993480B1 (en) | 1998-11-03 | 2006-01-31 | Srs Labs, Inc. | Voice intelligibility enhancement system |
US6311154B1 (en) | 1998-12-30 | 2001-10-30 | Nokia Mobile Phones Limited | Adaptive windows for analysis-by-synthesis CELP-type speech coding |
IL129752A (en) * | 1999-05-04 | 2003-01-12 | Eci Telecom Ltd | Telecommunication method and system for using same |
JP2003533902A (ja) * | 1999-07-02 | 2003-11-11 | テラブス オペレーションズ,インコーポレイティド | 符号化されたドメインのエコーの制御 |
EP1959435B1 (en) * | 1999-08-23 | 2009-12-23 | Panasonic Corporation | Speech encoder |
US7315815B1 (en) | 1999-09-22 | 2008-01-01 | Microsoft Corporation | LPC-harmonic vocoder with superframe structure |
US6782360B1 (en) * | 1999-09-22 | 2004-08-24 | Mindspeed Technologies, Inc. | Gain quantization for a CELP speech coder |
US6842733B1 (en) | 2000-09-15 | 2005-01-11 | Mindspeed Technologies, Inc. | Signal processing system for filtering spectral content of a signal for speech coding |
US6850884B2 (en) * | 2000-09-15 | 2005-02-01 | Mindspeed Technologies, Inc. | Selection of coding parameters based on spectral content of a speech signal |
JP2002135122A (ja) * | 2000-10-19 | 2002-05-10 | Nec Corp | オーディオ信号符号化装置 |
US7171355B1 (en) | 2000-10-25 | 2007-01-30 | Broadcom Corporation | Method and apparatus for one-stage and two-stage noise feedback coding of speech and audio signals |
US7606703B2 (en) * | 2000-11-15 | 2009-10-20 | Texas Instruments Incorporated | Layered celp system and method with varying perceptual filter or short-term postfilter strengths |
US7110942B2 (en) * | 2001-08-14 | 2006-09-19 | Broadcom Corporation | Efficient excitation quantization in a noise feedback coding system using correlation techniques |
EP1301018A1 (en) * | 2001-10-02 | 2003-04-09 | Alcatel | Apparatus and method for modifying a digital signal in the coded domain |
US7512535B2 (en) * | 2001-10-03 | 2009-03-31 | Broadcom Corporation | Adaptive postfiltering methods and systems for decoding speech |
US7206740B2 (en) * | 2002-01-04 | 2007-04-17 | Broadcom Corporation | Efficient excitation quantization in noise feedback coding with general noise shaping |
US6751587B2 (en) | 2002-01-04 | 2004-06-15 | Broadcom Corporation | Efficient excitation quantization in noise feedback coding with general noise shaping |
CN100369111C (zh) * | 2002-10-31 | 2008-02-13 | 富士通株式会社 | 话音增强装置 |
US7318035B2 (en) * | 2003-05-08 | 2008-01-08 | Dolby Laboratories Licensing Corporation | Audio coding systems and methods using spectral component coupling and spectral component regeneration |
EP1709743A1 (fr) * | 2004-01-30 | 2006-10-11 | France Telecom S.A. | Quantification vectorielle en dimension et resolution variables |
US8473286B2 (en) * | 2004-02-26 | 2013-06-25 | Broadcom Corporation | Noise feedback coding system and method for providing generalized noise shaping within a simple filter structure |
US7668712B2 (en) * | 2004-03-31 | 2010-02-23 | Microsoft Corporation | Audio encoding and decoding with intra frames and adaptive forward error correction |
US7949520B2 (en) | 2004-10-26 | 2011-05-24 | QNX Software Sytems Co. | Adaptive filter pitch extraction |
US8306821B2 (en) * | 2004-10-26 | 2012-11-06 | Qnx Software Systems Limited | Sub-band periodic signal enhancement system |
US7716046B2 (en) * | 2004-10-26 | 2010-05-11 | Qnx Software Systems (Wavemakers), Inc. | Advanced periodic signal enhancement |
US7680652B2 (en) * | 2004-10-26 | 2010-03-16 | Qnx Software Systems (Wavemakers), Inc. | Periodic signal enhancement system |
US8543390B2 (en) | 2004-10-26 | 2013-09-24 | Qnx Software Systems Limited | Multi-channel periodic signal enhancement system |
US8170879B2 (en) * | 2004-10-26 | 2012-05-01 | Qnx Software Systems Limited | Periodic signal enhancement system |
US7610196B2 (en) * | 2004-10-26 | 2009-10-27 | Qnx Software Systems (Wavemakers), Inc. | Periodic signal enhancement system |
US20060215683A1 (en) * | 2005-03-28 | 2006-09-28 | Tellabs Operations, Inc. | Method and apparatus for voice quality enhancement |
US20060217970A1 (en) * | 2005-03-28 | 2006-09-28 | Tellabs Operations, Inc. | Method and apparatus for noise reduction |
US20060217972A1 (en) * | 2005-03-28 | 2006-09-28 | Tellabs Operations, Inc. | Method and apparatus for modifying an encoded signal |
US20060217983A1 (en) * | 2005-03-28 | 2006-09-28 | Tellabs Operations, Inc. | Method and apparatus for injecting comfort noise in a communications system |
US20060217988A1 (en) * | 2005-03-28 | 2006-09-28 | Tellabs Operations, Inc. | Method and apparatus for adaptive level control |
US7707034B2 (en) * | 2005-05-31 | 2010-04-27 | Microsoft Corporation | Audio codec post-filter |
US7831421B2 (en) * | 2005-05-31 | 2010-11-09 | Microsoft Corporation | Robust decoder |
US7177804B2 (en) * | 2005-05-31 | 2007-02-13 | Microsoft Corporation | Sub-band voice codec with multi-stage codebooks and redundant coding |
US8620644B2 (en) * | 2005-10-26 | 2013-12-31 | Qualcomm Incorporated | Encoder-assisted frame loss concealment techniques for audio coding |
US8050434B1 (en) | 2006-12-21 | 2011-11-01 | Srs Labs, Inc. | Multi-channel audio enhancement system |
JP2008170488A (ja) * | 2007-01-06 | 2008-07-24 | Yamaha Corp | 波形圧縮装置、波形伸長装置、プログラムおよび圧縮データの生産方法 |
US8850154B2 (en) | 2007-09-11 | 2014-09-30 | 2236008 Ontario Inc. | Processing system having memory partitioning |
US8904400B2 (en) | 2007-09-11 | 2014-12-02 | 2236008 Ontario Inc. | Processing system having a partitioning component for resource partitioning |
US8694310B2 (en) | 2007-09-17 | 2014-04-08 | Qnx Software Systems Limited | Remote control server protocol system |
US8209514B2 (en) | 2008-02-04 | 2012-06-26 | Qnx Software Systems Limited | Media processing system having resource partitioning |
KR101454867B1 (ko) | 2008-03-24 | 2014-10-28 | 삼성전자주식회사 | 오디오 신호 압축 방법 및 장치 |
CN101587711B (zh) * | 2008-05-23 | 2012-07-04 | 华为技术有限公司 | 基音后处理方法、滤波器以及基音后处理系统 |
JP4735711B2 (ja) * | 2008-12-17 | 2011-07-27 | ソニー株式会社 | 情報符号化装置 |
KR101113171B1 (ko) * | 2010-02-25 | 2012-02-15 | 김성진 | 흡착 장치 |
WO2012000882A1 (en) | 2010-07-02 | 2012-01-05 | Dolby International Ab | Selective bass post filter |
US9760566B2 (en) | 2011-03-31 | 2017-09-12 | Microsoft Technology Licensing, Llc | Augmented conversational understanding agent to identify conversation context between two humans and taking an agent action thereof |
US9842168B2 (en) | 2011-03-31 | 2017-12-12 | Microsoft Technology Licensing, Llc | Task driven user intents |
US9298287B2 (en) | 2011-03-31 | 2016-03-29 | Microsoft Technology Licensing, Llc | Combined activation for natural user interface systems |
US10642934B2 (en) | 2011-03-31 | 2020-05-05 | Microsoft Technology Licensing, Llc | Augmented conversational understanding architecture |
US9858343B2 (en) | 2011-03-31 | 2018-01-02 | Microsoft Technology Licensing Llc | Personalization of queries, conversations, and searches |
US9244984B2 (en) | 2011-03-31 | 2016-01-26 | Microsoft Technology Licensing, Llc | Location based conversational understanding |
US9454962B2 (en) * | 2011-05-12 | 2016-09-27 | Microsoft Technology Licensing, Llc | Sentence simplification for spoken language understanding |
US9064006B2 (en) | 2012-08-23 | 2015-06-23 | Microsoft Technology Licensing, Llc | Translating natural language utterances to keyword search queries |
US9294113B2 (en) * | 2011-07-05 | 2016-03-22 | Massachusetts Institute Of Technology | Energy-efficient time-stampless adaptive nonuniform sampling |
US9117455B2 (en) * | 2011-07-29 | 2015-08-25 | Dts Llc | Adaptive voice intelligibility processor |
CN103928031B (zh) | 2013-01-15 | 2016-03-30 | 华为技术有限公司 | 编码方法、解码方法、编码装置和解码装置 |
JP6248186B2 (ja) * | 2013-05-24 | 2017-12-13 | ドルビー・インターナショナル・アーベー | オーディオ・エンコードおよびデコード方法、対応するコンピュータ可読媒体ならびに対応するオーディオ・エンコーダおよびデコーダ |
EP2980796A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method and apparatus for processing an audio signal, audio decoder, and audio encoder |
EP2980798A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Harmonicity-dependent controlling of a harmonic filter tool |
JP6986868B2 (ja) * | 2017-06-19 | 2021-12-22 | キヤノン株式会社 | 画像符号化装置、画像復号装置、画像符号化方法、画像復号方法、プログラム |
KR101925217B1 (ko) * | 2017-06-20 | 2018-12-04 | 한국과학기술원 | 가창 표현 이식 시스템 |
CN114351807A (zh) * | 2022-01-12 | 2022-04-15 | 广东蓝水花智能电子有限公司 | 一种基于fmcw的智能马桶冲水方法及智能马桶系统 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4472832A (en) * | 1981-12-01 | 1984-09-18 | At&T Bell Laboratories | Digital speech coder |
US4475227A (en) * | 1982-04-14 | 1984-10-02 | At&T Bell Laboratories | Adaptive prediction |
JPS60124153U (ja) * | 1984-01-31 | 1985-08-21 | パイオニア株式会社 | デ−タ信号読取り装置 |
US4720861A (en) * | 1985-12-24 | 1988-01-19 | Itt Defense Communications A Division Of Itt Corporation | Digital speech coding circuit |
US4726037A (en) * | 1986-03-26 | 1988-02-16 | American Telephone And Telegraph Company, At&T Bell Laboratories | Predictive communication system filtering arrangement |
JPS62234435A (ja) * | 1986-04-04 | 1987-10-14 | Kokusai Denshin Denwa Co Ltd <Kdd> | 符号化音声の復号化方式 |
US4868867A (en) * | 1987-04-06 | 1989-09-19 | Voicecraft Inc. | Vector excitation speech or audio coder for transmission or storage |
-
1987
- 1987-04-06 US US07/035,615 patent/US4969192A/en not_active Expired - Lifetime
-
1988
- 1988-03-30 AU AU13873/88A patent/AU1387388A/en not_active Abandoned
- 1988-04-05 CA CA000563229A patent/CA1336454C/en not_active Expired - Lifetime
- 1988-04-05 JP JP63084973A patent/JP2887286B2/ja not_active Expired - Lifetime
- 1988-04-06 EP EP88303038A patent/EP0294020A3/en not_active Withdrawn
- 1988-04-06 EP EP92108904A patent/EP0503684B1/en not_active Expired - Lifetime
- 1988-04-06 DE DE3856211T patent/DE3856211T2/de not_active Expired - Lifetime
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6941263B2 (en) | 2001-06-29 | 2005-09-06 | Microsoft Corporation | Frequency domain postfiltering for quality enhancement of coded speech |
Also Published As
Publication number | Publication date |
---|---|
EP0503684A3 (en) | 1993-06-23 |
US4969192A (en) | 1990-11-06 |
JPS6413200A (en) | 1989-01-18 |
EP0294020A3 (en) | 1989-08-09 |
EP0503684A2 (en) | 1992-09-16 |
DE3856211D1 (de) | 1998-08-06 |
DE3856211T2 (de) | 1998-11-05 |
CA1336454C (en) | 1995-07-25 |
EP0503684B1 (en) | 1998-07-01 |
EP0294020A2 (en) | 1988-12-07 |
AU1387388A (en) | 1988-10-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2887286B2 (ja) | デジタル的にコード化されたスピーチを圧縮するたの方法における改良 | |
KR100421226B1 (ko) | 음성 주파수 신호의 선형예측 분석 코딩 및 디코딩방법과 그 응용 | |
Chen et al. | Real-time vector APC speech coding at 4800 bps with adaptive postfiltering | |
Chen et al. | Adaptive postfiltering for quality enhancement of coded speech | |
JP5412463B2 (ja) | 音声信号内の雑音様信号の存在に基づく音声パラメータの平滑化 | |
KR101039343B1 (ko) | 디코딩된 음성의 피치 증대를 위한 방법 및 장치 | |
JP3234609B2 (ja) | 32Kb/sワイドバンド音声の低遅延コード励起線型予測符号化 | |
AU700205B2 (en) | Improved adaptive codebook-based speech compression system | |
EP0731449B1 (en) | Method for the modification of LPC coefficients of acoustic signals | |
JP3490685B2 (ja) | 広帯域信号の符号化における適応帯域ピッチ探索のための方法および装置 | |
JP4662673B2 (ja) | 広帯域音声及びオーディオ信号復号器における利得平滑化 | |
Edler et al. | Audio coding using a psychoacoustic pre-and post-filter | |
JPH08328591A (ja) | 短期知覚重み付けフィルタを使用する合成分析音声コーダに雑音マスキングレベルを適応する方法 | |
JP3062226B2 (ja) | 条件付き確率的励起符号化法 | |
JPH10124094A (ja) | 音声分析方法、音声符号化方法および装置 | |
JPH04270398A (ja) | 音声符号化方式 | |
JP3248668B2 (ja) | ディジタルフィルタおよび音響符号化/復号化装置 | |
US20050192800A1 (en) | Noise feedback coding system and method for providing generalized noise shaping within a simple filter structure | |
JP3964144B2 (ja) | 入力信号をボコーディングする方法と装置 | |
RU2707144C2 (ru) | Аудиокодер и способ для кодирования аудиосигнала | |
WO1997031367A1 (en) | Multi-stage speech coder with transform coding of prediction residual signals with quantization by auditory models | |
JPH08160996A (ja) | 音声符号化装置 | |
Tseng | An analysis-by-synthesis linear predictive model for narrowband speech coding | |
Chen et al. | Vector adaptive predictive coder for speech and audio | |
JP3071800B2 (ja) | 適応ポストフィルタ |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090219 Year of fee payment: 10 |
|
EXPY | Cancellation because of completion of term | ||
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090219 Year of fee payment: 10 |