JP3430175B2 - スピーチ信号を高速符号化するための信号選択されたパルス振幅を備えた代数学的符号帳 - Google Patents
スピーチ信号を高速符号化するための信号選択されたパルス振幅を備えた代数学的符号帳Info
- Publication number
- JP3430175B2 JP3430175B2 JP52385296A JP52385296A JP3430175B2 JP 3430175 B2 JP3430175 B2 JP 3430175B2 JP 52385296 A JP52385296 A JP 52385296A JP 52385296 A JP52385296 A JP 52385296A JP 3430175 B2 JP3430175 B2 JP 3430175B2
- Authority
- JP
- Japan
- Prior art keywords
- amplitude
- pulse
- signal
- track
- speech signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 239000013598 vector Substances 0.000 claims abstract description 84
- 238000000034 method Methods 0.000 claims abstract description 37
- 230000005236 sound signal Effects 0.000 claims abstract description 33
- 230000004044 response Effects 0.000 claims abstract description 14
- 230000001413 cellular effect Effects 0.000 claims description 23
- 238000004891 communication Methods 0.000 claims description 15
- 230000010267 cellular communication Effects 0.000 claims description 11
- 230000005540 biological transmission Effects 0.000 claims description 6
- 230000002457 bidirectional effect Effects 0.000 claims description 4
- 238000010606 normalization Methods 0.000 claims description 4
- 230000001419 dependent effect Effects 0.000 claims description 3
- 238000010295 mobile communication Methods 0.000 claims description 2
- 238000012545 processing Methods 0.000 abstract description 2
- 230000006870 function Effects 0.000 description 27
- 238000011045 prefiltration Methods 0.000 description 11
- 230000007774 longterm Effects 0.000 description 9
- 239000011159 matrix material Substances 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 230000005284 excitation Effects 0.000 description 6
- 238000012546 transfer Methods 0.000 description 6
- 230000015572 biosynthetic process Effects 0.000 description 5
- 238000001914 filtration Methods 0.000 description 5
- 238000003786 synthesis reaction Methods 0.000 description 5
- 230000003044 adaptive effect Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 230000011664 signaling Effects 0.000 description 3
- 230000003595 spectral effect Effects 0.000 description 3
- 238000013461 design Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 230000002087 whitening effect Effects 0.000 description 2
- BDAGIHXWWSANSR-UHFFFAOYSA-M Formate Chemical group [O-]C=O BDAGIHXWWSANSR-UHFFFAOYSA-M 0.000 description 1
- 238000010420 art technique Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 238000007493 shaping process Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L13/00—Speech synthesis; Text to speech systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/10—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0004—Design or structure of the codebook
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0007—Codebook element generation
- G10L2019/0008—Algebraic codebooks
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0011—Long term prediction filters, i.e. pitch estimation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0013—Codebook search algorithms
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/06—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Mobile Radio Communication Systems (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Description
サウンド信号、特にスピーチ(音声)信号(これのみに
限定されず)をデジタル式に符号化するための改善され
た技術に関する。
効率的なデジタルスピーチ符号化技術への要求は、衛
星、地上モービル、デジタル無線すなわちパケットネッ
トワーク、音声記憶、音声応答および無線電話を通した
音声送信のような多数の用途で増大しつつある。
従来の最良の技術の1つとして、いわゆる符号励振線形
予測(CELP)技術がある。この技術によれば、スピーチ
信号はL個のサンプル(すなわちベクトル)のブロック
にサンプリングされ、ブロックとして処理される。ここ
で、Lは所定の数である。CELP技術は符号帳を利用して
いる。
と称されるL個のサンプル長さのシーケンスのインデッ
クスのついたセット(L個の異なる位置を決めるパルス
の組み合わせであり、この組み合わせのそれぞれの位置
p=1、2、…、Lに割り当てられたゼロ振幅パルスと
非ゼロ振幅パルスの双方から成る)である。この符号帳
は1〜Mまでの範囲のインデックスkを含み、ここでM
はある数のビットbで表示されることが多い符号帳のサ
イズを示す。 M=2b
ル)に記憶したり、または対応する符号ベクトル(例え
ば式)にインデックスを関連付けるための機構を参照で
きる。
ーチ信号のスペクトル特性をモデル化した時間可変フィ
ルタを通して、符号帳からの適当な符号ベクトルをフィ
ルタリングすることによって、スピーチサンプルの各ブ
ロックを構成する。符号化器側では符号帳からの候補符
号帳のすべてまたはサブセットに対して合成出力を計算
する(符号帳サーチ)。保留された符号ベクトルは知覚
的に重み付けされたひずみの尺度に従って、基の音声信
号に最も近い合成出力を発生する符号ベクトルとなる。
ある。これら符号帳の欠点は、かなりの物理的な記憶を
行わなければならないことが多いことにある。これらの
符号帳は確率論的、すなわちインデックスから関連する
符号帳へのパスは、乱数すなわち多数の音声トレーニン
グセットに使用された統計学的技術の結果であるルック
アップテーブルを必要とするという意味でランダムであ
る。このような確率論的符号帳のサイズは記憶量および
/またはサーチの複雑さによって制限される傾向があ
る。
的符号帳と対照すると、代数学的符号帳はランダムでは
なく、記憶装置を必要としない。代数学的符号帳はk番
目の符号帳のパルスの振幅および位置が物理的記憶装置
を全く必要としないか、または最小量しか必要としない
規則により、インデックスkから発生できるようになっ
ているインデックスのついた符号ベクトルのセットとな
っている。従って、代数学的符号帳のサイズは記憶条件
によって制限されず、代数学的符号帳は効率的なサーチ
を行うようにも設計できる。
号帳のサーチの複雑さを劇的に低減するための方法およ
び装置を提供することにあり、このような方法および装
置は大きなクラスの符号帳に適用可能である。 本発明の別の課題は、符号帳のサーチの複雑さを低減
する見地から、符号帳パルスの組み合わせのサブセット
をアプリオリに選択し、このサブセットに対しサーチす
べき組み合わせを保留できる方法および装置を提供する
ことにある。 更に別の課題は、サーチの複雑さを増すことなく符号
ベクトルの個々の非ゼロ振幅のパルスがq個の可能な振
幅のうちの少なくとも一つをとることができるようにす
ることにより、符号帳のサイズを大きくすることにあ
る。
置の組み合わせがL個の異なる位置を定義し、パルスの
組み合わせのそれぞれの位置P=1、2、....Lに割り
当てられたゼロ振幅および非ゼロ振幅パルスの双方を含
み、各非ゼロ振幅パルスがq個の可能な振幅のうちの少
なくともひとつをとるようになっており、パルスの振幅
/位置の組み合わせのセットから成る符号帳においてサ
ウンド信号を符号化する観点からサーチを実行する方法
であって、該方法が、 サウンド信号に関連し、パルスの振幅/位置の組み合
わせのサブセットを前記不合町から予め選択する工程
と、 サウンド信号を符号化する観点からパルスの振幅/位
置の組み合わせの前記サブセットのみをサーチする工程
とを備え、よって符号帳のパルスの振幅/位置の組み合
わせのサブセットのみをサーチしながら、サーチの複雑
性を低減する、符号帳においてサーチを実行する方法が
提供される。
可能な振幅のうちの有効な振幅を予め割り当てる関数S
をサウンド信号に関連して予め確定し、 サーチ工程は予め確定された関数に従う非ゼロ振幅の
パルスを有する前記符号帳のパルス振幅/位置の組み合
わせのみをサーチすることから成る。
わせがL個の異なる位置を定義し、パルスの組み合わせ
のそれぞれの位置p=1、2、・・・・Lに割り当てら
れたゼロ振幅および非ゼロ振幅パルスの双方を含み、各
非ゼロ振幅パルスがq個の可能な振幅のうちの少なくと
も1つをとるようになっており、パルスの振幅/位置の
組み合わせのセットから成る符号帳においてサウンド信
号を符号化する観点からサーチを実行するための装置で
あって、 サウンド信号に関連し、パルスの振幅/位置の組み合
わせのサブセットを前記符号帳から予め選択するための
手段と、 サウンド信号を符号化する観点からパルスの振幅/位
置の組み合わせの前記サブセットのみをサーチするため
の手段とを備え、よって符号帳のパルスの振幅/位置の
組み合わせのサブセットのみをサーチしながらサーチの
複雑性を低減する、符号帳においてサーチを実行するた
めの装置が提供される。
Lに前記q個の可能な振幅のうちの有効な振幅を予め割
り当てる関数Sをサウンド信号に関連して予め確定する
ための手段を備え、サーチ手段は予め確定された関数に
従う非ゼロ振幅のパルスを有する前記符号帳のパルス振
幅/位置の組み合わせのサーチに限定するための手段を
備える。
地理的エリアにサービスを行うためのセルラー通信シス
テムにおいて、 モービル携帯送信/受信ユニットと、 前記セル内にそれぞれ設置されたセルラー基地局と、 セルラー基地局との間の通信を制御するための手段
と、 1つのセル内に設置された各モービルユニットと前記
1つのセルのセルラー基地局との間で双方向に無線通信
するサブシステムとを備え、該双方向無線通信サブシス
テムが、モービルユニットおよびセルラー基地局の双方
において、(a)スピーチ信号を符号化するための手段
および符号化されたスピーチ信号を送信するための手段
とを含む送信機と、(b)符号化され送信されたスピー
チ信号を受信するための手段および符号化され受信され
たスピーチ信号を受信するための手段を含む受信機とを
備えたセルラー通信システムが提供される。
観点から符号帳においてサーチを実行するための装置を
備え、この符号帳はパルス振幅/位置の組み合わせのセ
ットから成り、各パルス振幅/位置の組み合わせがL個
の異なる位置を定義し、このパルスの組み合わせのそれ
ぞれの位置p=1、2、・・・・Lに割り当てられたゼ
ロ振幅パルスおよび非ゼロ振幅パルスの双方を含み、各
非ゼロ振幅パルスがq個の異なる振幅のうちの少なくと
も1つをとり、前記サーチ実行装置は、 スピーチ信号に関連し、パルスの振幅/位置の組み合
わせのサブセットを前記符号帳から予め選択するための
手段と、 スピーチ信号を符号化する観点からパルスの振幅/位
置の組み合わせの前記サブセットのみをサーチするため
の手段とを備え、よって符号帳のパルスの振幅/位置の
組み合わせのサブセットだけをサーチしながら、サーチ
の複雑性を低減し、 予め選択するための手段は位置p=1、2、・・・・
Lに前記q個の可能な振幅のうちの有効な振幅を予め割
り当てる関数Spをサウンド信号に関連して予め確定する
ための手段を備え、 サーチ手段が予め確定された関数に従う非ゼロ振幅の
パルスを有する前記符号帳のパルス振幅/位置の組み合
わせのサーチに限定するための手段を備える。 本発明の好ましい実施例によれば、q個の可能な振幅
のうちの1つを各位置pに有効な振幅として予め割り当
て、パルス振幅/位置の組み合わせの非ゼロ振幅パルス
の各々が前記非ゼロ振幅パルスの位置pに予め割り当て
られた振幅Spに等しい振幅を有する際に、予め確定され
た関数に従う。
つを予め割り当てる工程は、 後方フィルタリングされた目標信号Dおよびピッチ除
去残留信号R'を発生するようサウンド信号を処理する工
程と、 後方フィルタリングされた目標信号Dおよびピッチ除
去残留信号R'に応答して振幅予測ベクトルBを計算する
工程と、 前記位置pの各々に対し前記ベクトルBの振幅予測値
Bpを量子化し、前記位置pに対し選択すべき振幅を得る
工程とを備える。
た目標信号D を次の正規化されたフォームのピッチ除去残留信号R' に加算し、次のフォーム (ここでβは好ましくは0〜1の間にある値を有する固
定された定数である)の振幅予測ベクトルBを得る工程
を含む。
クタである)を使ってベクトルBのピーク値が正規化さ
れた振幅の予測値Bpを量子化する。 パルスの組み合わせの各々はN個の非ゼロ振幅のパル
スを含むことができ、更に少なくとも1つのN回インタ
ーリーブされた単一パルス順列符号に従って非ゼロ振幅
パルスの位置pを制限することが好ましい。
ループのうちの最も外側のループから最も内側のループ
へ別個のラインで表示され、pnが組み合わせのn番目の
非ゼロ振幅パルスの位置であり、U'(px、py)が位置p
のうちの位置pxに予め割り当てられた振幅 および位置pのうちの位置pyに予め割り当てられた振幅 に従属した関数である)に従って、N個のネスト状のル
ープにより計算されたデノミネータ αk 2 を有する所定の比を最大にする工程を含むことが好まし
い。上記計算において、次の不等式
ルタリングされた目標ベクトルDに関連したスレッショ
ルドである)が真である時に、N個のネスト状のループ
の少なくとも最も内側のループをスキップすることがで
きる。 添付図面を参照して、単なる例として示された本発明
の好ましい実施例の対の非限定的な説明を読めば、本発
明の課題、利点およびそれ以外の特徴がより明らかとな
ろう。
ストラクチャを示す。
デバイスをセルラー通信システムに応用することを非限
定的実施例として開示するが、これら方法およびデバイ
スはサウンド信号の符号化が必要とされる他の多くのタ
イプの通信システムでも同様な利点を発揮しながら使用
できるものであることを念頭におくべきである。
多数のより小規模のセルに分割することにより、広大な
地理的エリアにわたって遠隔通信サービスを提供してい
る。各セルは無線信号チャンネルおよびオーディオおよ
びデータチャンネルを提供するためにセルラー基地局2
(図5)を有する。セルラーベース局のカバーエリア
(セル)の範囲内の移動無線電話(モービル送信機/受
信機ユニット)をページングし、基地局のセルの内外の
他の無線電話または公衆交換電話ネットワーク(PSTN)
4のような他のネットワークの呼び出しをするのに、無
線信号化チャンネルが利用される。
ると無線電話3が位置するセルに対応するセルラー基地
局2によってオーディオまたはデータチャンネルがセッ
トアップされ、このオーディオまたはデータチャンネル
を通して基地局2と無線電話3との間の通話が行われ
る。無線電話3は信号化チャンネルを通して制御または
タイミング情報を受信することも可能であり、この間、
通話が進行する。
した場合、無線電話は通話中を新しいセル内の利用可能
なオーディオまたはデータチャンネルへその通話をハン
ドオーバーする。同様に、通話が進行しない場合、無線
電話が新しいセルに関連する基地局2にログオンするよ
うに、信号チャンネルを通して制御メッセージが送られ
る。このように、広大な地理的エリアにわたって移動通
信が可能となる。
PSTN4との間の通信中に、または第1セルにおける無線
電話3と第2セル内の無線電話3との間の通信中にセル
ラー基地局2と公衆交換電話ネットワーク4との間の通
信を制御するターミナル5を含む。
そのセルのセルラー基地局2との間の通信を確定するの
に双方向の無線通信サブシステムが必要である。かかる
双方向の無線通信システムは一般に、無線電話3とセル
ラー基地局2の双方にて(a)スピーチ信号を符号化
し、この符号化されたスピーチ信号をアンテナ例えば6
または7を通して送信するための送信機と、(b)同じ
アンテナ6または7を通して符号化され送信されたスピ
ーチ信号を受信し、符号化され受信されたスピーチ信号
を復号化するための受信機とを一般に含む。当業者には
周知のように、双方向無線通信システムを通して、すな
わち無線電話3と基地局2との間で、スピーチ信号を送
信するのに必要なバンド幅を狭くするのに、音声の符号
化が必要である。
を通してセルラー基地局2と無線電話3との間で、例え
ばスピーチ信号を双方向に送信するのに主観的な質とビ
ットレートとを良好に妥協させた効率的なデジタルスピ
ーチ符号化技術を提供することにある。図1は、このよ
うな効率的な技術を実行するのに適したデジタルスピー
チ符号化デバイスの略ブロック図である。図1のスピー
チ符号化デバイスは本発明に係わる振幅セレクタ112が
追加された米国の元の特許出願第07/927,528号の図1に
示されたものと同じ符号化デバイスとなっている。元の
米国特許出願第07/927,528号は、「代数学的符号に基づ
く効率的なスピーチの符号化をするためのダイナミック
符号帳」を発明の名称として1992年9月10日に出願され
たものである。
ク処理される。本発明はスピーチ信号への応用のみに限
定されるものではないと理解すべきである。他のタイプ
のサウンド信号の符号化も行うことができる。
チSのブロック(図1)はL個の連続するサンプルから
成る。CELP文献では、Lはサブフレーム長さと表示され
ており、一般に20〜80の間である。更にL個のサンプル
のブロックはL次元のベクトルと称される。符号化方法
の際に種々のL次元のベクトルが発生される。図1およ
び2に示されるこれらベクトルのリストのみならず、送
信されるパワーメータのリストも下記に示す。
クトル Ck イノベーション(雑音源)ベクトル(フィルタ
リングされた符号ベクトル)
入力) g 利得 STP (A(z)を定める)短期予測パラメータ LTP (ピッチ利得bおよびピッチ遅れTを定める)
長期予測パラメータ
信号)とサンプリングされた出力スピーチ信号(合成フ
ィルタ204の出力信号)との間で実行される種々の工程
を示す、図2のスピーチ復号化デバイスを説明すること
が好ましいと考える。
受信した二進情報より4つの異なるパラメータ、すなわ
ちインデックスkと、利得gと、短期予測パラメータST
Pと、長期予測パラメータLTPを抽出する。次の説明で述
べるように、これら4つのパラメータに基づき、スピー
チ信号の現在のL次元ベクトルSが合成される。
201と適応化プリフィルタ202から成るダイナミック符号
帳208と、増幅器206と、加算器207と、長期予測器203
と、合成フィルタ204とを含む。
ックスkに応答して符号ベクトルAkを発生する。
または長期予測パラメータLTPが供給される適応化プリ
フィルタ202により、符号ベクトルAkが処理され、出力
イノベーションベクトルCkが発生される。適応化プリフ
ィルタ202の目的はスピーチ信号の質を高めるよう、す
なわち人にとって耳障りな周波数によって生じる可聴ひ
ずみを低減するように、出力イノベーションベクトルCk
の周波数内容をダイナミックに制御することにある。適
応化プリフィルタ202の代表的な伝達関数F(z)は次
のように示される。
ントプリフィルタであり、このプリフィルタはフォーマ
ント領域を高め、特に5kbit/sより低い符号化レートで
極めて効果的に作動する。
たは現在または先のサブフレームからの量子化された長
期ピッチ予測パラメータに等しくしたピッチプリフィル
タである。Fb(z)はすべてのレートにおけるピッチ高
調波周波数を高めるのに極めて効果的であるので、F
(z)は一般に次のようなフォーマントプリフィルタと
組み合わされることが多いピッチプリフィルタを含む。 F(Z)=Fa(Z)Fb(Z)
号帳208からのイノベーションベクトルCkを最初にスケ
ーリングすることによって、サンプリングされた出力ス
ピーチ信号 を得る。次に加算器207は、フィードバックループ内に
設けられ、次のように定義された伝達関数B(z)を有
するLTPパラメータが供給された長期予測器203の出力E
(合成フィルタ204の信号励振長期予測成分)へスケー
リングされた波形gCkを加算する。 B(Z)=bz-T
たピッチ利得および遅延である。
よう、最後に受信されたLTPパラメータbおよびTに従
ったデンタル関数を有するフィルタである。この予測器
203はサンプルの適当なピッチ利得bおよび遅延時間T
を導入する、復号信号E+gCkは伝達関数1/A(z)(A
(z)は次の説明で定義する)を有する合成フィルタ20
4の信号励振を構成する。フィルタ204は最後に受信され
たSTPパラメータに従って正しいスペクトル整形を行
う。より詳細にはフィルタ204はスピーチの共振周波数
(フォーマント)をモデル化する。出力ブロック はサンプリングされ合成されたスピーチ信号であり、こ
のスピーチ信号は当業者に周知の技術に従って適当なエ
リアシング防止フィルタリングによりアナログ信号に変
換できる。
ある。上記米国特許出願第07/927,528号に開示された、
利点の多い方法は、少なくとも1つのN回インターリー
ブされた単一パルス順列符号を使用することから成る。
よって示される。本例ではL=40であり、40次元符号ベ
クトルの組は と称すN=5個の非ゼロ振幅パルスしか含まない。この
ようなより完全な表記方法では、pはサブフレーム内の
i番目のパルスの位置を表す(すなわちpiは0〜L−1
の範囲となる)。
と仮定する。すなわち p=0、5、10、15、20、25、30、35=0+8m1; m1=0、1・・・・7。
では、 と7つのゼロ振幅パルスは自由な順列にできる。これは
単一パルス順列符号である。次に、同じように残りのパ
ルスの位置を制限することにより(すなわちトラック#
2、トラック#4およびトラック#5を制限することに
よって、かかる5つの単一パルス順列符号をインターリ
ーブすることとする。
たがって、次の式を使用してmiをストレートフォワード
に多重化することによって、簡単な位置インデックスkp
を発生できる。
を発生できることを指摘したい。例えば最初の3つのパ
ルスが最初の3つのトラックの位置をそれぞれ占め、一
方、第4パルスがトラックを指定するために1ビットで
第4トラックまたは第5トラックのいずれかを占める場
合、4つのパルスしか使用できない。このようなデザイ
ンによって13ビットポジションの符号帳が生じる。
う理由から、すべての実際の目的のために非ゼロ振幅パ
ルスは固定した振幅をとっていた。パルス が可能なq個の振幅のうちの1つをとり得る場合、サー
チではqN個もの多くのパルス振幅の組み合わせを検討し
なければならない。例えば第1実施例の5つのパルスが
固定された振幅の代わりにq=4個の可能な振幅、例え
ば −1、+2、−2のうちの1つをとり得ることが認めら
れる場合、代数学的符号帳のサイズは15ビットから15+
(5×2)ビット=25ビットまでジャンプする。すなわ
ちサーチは1000倍複雑となる。
の振幅のパルスで極めて良好な性能を達成できるという
驚くべき事実を開示することにある。この解決案は、サ
ーチを符号ベクトルの限られたサブセットに限定するこ
とにある。のちの説明に述べるように、符号ベクトルを
選択する方法は入力スピーチ信号に関連する。
さを増すことなく、個々のパルスが異なる可能な振幅を
とり得ることができるようにすることにより、ダイナミ
ック代数学的符号帳208のサイズを増加できることにあ
る。
た図1の符号化システムにより、ブロックごとにサンプ
リングされたスピーチ信号Sを符号化する。これらモジ
ュールのほとんどの機能および作動は、元の米国特許出
願第07/927,528号の説明と変わっていない。従って、次
の説明は、各モジュールの機能および作動を少なくとも
簡単に説明するものであるが、元の米国特許出願第07/9
27,528号の開示に関連した新規事項について説明を集中
する。
り、スピーチ信号のL個のサンプルの各ブロックに対し
ては、短期予測(STP)パラメータと称される線形予測
コーディング(LPC)パラメータの一組を発生する。よ
り詳細には、アナライザ102はL個のサンプルの各ブロ
ックSのスペクトル特性をモデル化するものである。
る白色化フィルタ103により、L個のサンプルの入力ブ
ロックSを白色化する。
変数である。図1に示すように、白色化フィルタ103は
残留ベクトルRを発生する。 LTPパラメータ、すなわちピッチ遅れTおよびピッチ
利得gを計算し、量子化するのに、ピッチ抽出器104が
使用される。この抽出器104の初期状態は初期状態抽出
器110からの値FSにもセットされる。元の米国特許出願
第07/927,528号にはLTPパラメータを計算し、量子化す
るための詳細な手順が記載されており、この方法は当業
者に周知であると考えられるので、本明細書ではこれ以
上説明しないこととする。
を計算するためにフィルタ応答特性化器105(図1)にS
TPおよびLTPパラメータが供給される。このFRC情報はつ
ぎの3つの成分(ここでn=1、2、・・・・Lから成
る)。 ・f(n):F(z)の応答 F(z)は一般にピッチプリフィルタを含むことに留
意されたい。 ここでγは知覚的ファクターである。より一般的には
h(n)はプリフィルタF(z)と、知覚的重み付けフ
ィルタW(z)と、合成フィルタ1/A(z)とのカスケ
ードであるF(z)W(z)/A(z)のインパルス応答
である。ここで、F(z)および1/A(z)は図2の復
号器で使用されているのと同じフィルタである。
化:
を使用して新しいE成分を形成するために、過去の励振
信号(先のサブフレームのE+gCk)が供給される。
ら供給される値FSにセットされる。減算器121(図1)
によって計算されるピッチの除かれた残留ベクトルR'=
R−Eが知覚的フィルタ107に供給され、後方のフィル
タの出力で目標ベクトルXが得られる。図1に示される
ように、フィルタ107にSTPパラメータが印加され、これ
らパラメータに関してその伝達関数を変える。基本的に
はX=R'−P(ここでPは過去の励振からの呼び出し音
を含む長期予測パラメータ(LTP)の寄与分を表示す
る)である。次のマトリックス表示でΔに適用されるMS
E基準について説明できる。
Lのより低い三角テプリッツマトリックスである。h
(0)なる項はマトリックスの対角線を占め、h
(1)、h(2)、・・・・h(L−1)はそれぞれの
低い対角線を占める。 図1のフィルタ108により後方へのフィルタリングス
テップが実行される。利得gに関し、上記式の誘導値を
0にセットすると、次のような最適利得が生じる。
うになる。
を探すことである。‖X‖2は固定された値であるの
で、次の値を最大にすることにより同じインデックスを
見つけ出すことができる。
標ベクトルD=(XH)が計算される。この演算のための
後方フィルタリングの項は時間反転されたXのフィルタ
リングとして(XH)を解釈することから得られる。
幅セレクタ112しか加えられていない。この振幅セレク
タ112の機能は最適化コントローラ109によってサーチさ
れる符号ベクトルAkを最も見込みのある符号ベクトルAk
に保留し、符号ベクトルサーチの複雑さを低減すること
にある。これまでの説明で述べたように、各符号ベクト
ルAkはパルス振幅と位置との組み合わせ波形であり、こ
の波形はL個の異なる位置pを構成し、ゼロ振幅パルス
とこれら組み合わせのそれぞれの位置P=1、2、・・
・・Lに割り当てられた非ゼロ振幅パルスの双方を含
み、ここで各非ゼロ振幅パルスはq個の異なる可能な振
幅のうちの少なくとも1つをとる。
112の目的は符号ベクトル波形の位置pとパルス振幅の
q個の可能な値の間の関数Spを予め確定することにあ
る。符号帳サーチに先立ち、スピーチ信号に関する予め
確定された関数Spが発生される。より詳細には、この関
数を予め設定するにはスピーチ信号に関連し、波形の各
位置pにqの可能な振幅のうちの少なくとも1つを予め
割り当てることから成る(図3aのうちの工程301)。
割り当てるには、後方フィルタリングされた目標ベクト
ルDおよびピッチ除去残留ベクトルR'に応答して、振幅
予測ベクトルBを計算する。より詳細には、振幅予測ベ
クトルBは次のような正規化されたフォームの後方フィ
ルタリングされた目標ベクトルD および正規化されたフォームのピッチ除去残留ベクトル
R'
ムの振幅予測ベクトルB を得るように計算される。ここでβは1/2の代表的な値
を有する固定された定数である(βの値は代数学的符号
で使用される非ゼロ振幅パルスのパーセントに応じて0
と1との間に選択される)。
予測値Bpを量子化することによってその位置pに予め割
り当てるべき振幅Spが得られる。より詳細には、波形の
各位置pに対して次の式を使ってベクトルBのピーク値
が正規化された振幅予測値Bpが量子化される(図3bのサ
ブステップ301−2)。 ここで、Q(.)は量子化関数であり、
ァクタである。 q=2であり、すなわちパルスの振幅が2つの値だけ
しかとることができず 非ゼロ振幅パルスの密度N/Lが15%以下である重要な
特殊なケースでは、 βの値を0に等しくすることができ、振幅予測ベクト
ルBは単に後方フィルタリングされた目標ベクトルDに
減少し、よって Sp=sign(Dp) となる。
最良の符号ベクトルAkを選択することにある。選択基準
は各符号ベクトルAkに対して計算され、すべての符号ベ
クトルにわたって最大とすべき比として示される(ステ
ップ303)。
ルであり、ニューメレータは の平方であり、デノミネータは次のように表記できるエ
ネルギー項である。
は位置piにおけるパルスであり、他方のパルスは位置pj
におけるパルスである)に関連した相関性である。この
マトリックスはフィルタ応答特性化器105において上記
式に従って計算され、図1のブロック図内のFRCと称さ
れるパラメータの組内に含められる。
プ304)はそれぞれの値 の変わりにトリムライン状の表記法S(i)およびSS
(i、j)を使用する、図4に示されたN個のネスト状
のループを使用する。デノミネータ αk 2 の計算は最も時間のかかるプロセスである。図4の各ル
ープで実行される αk 2 に寄与する計算式は次のように最も外側のループから最
も内側のループへの別個のラインで書き表すことができ
る。
る。図4のN個のネスト状のループによってN個のイン
ターリーブされる単一パルス順列符号に従い、符号ベク
トルAkの非ゼロ振幅パルスを制限することが可能となる
ことに留意されたい。
数にN個の非ゼロ振幅パルスが従うようになっている符
号ベクトルに、サーチすべき符号ベクトルAkのサブセッ
トを制限することにより、サーチの複雑さを劇的に低減
できる。符号ベクトルAkのN個の非ゼロ振幅パルスの各
々が、非ゼロ振幅パルスの位置pに予め割り当てられた
振幅に等しい振幅を有する際、予め確定された関数に従
う。
j)のエントリーとを組み合わせ(図3aのステップ30
2)、次に、単位振幅の固定され、正とされたすべての
パルスS(i)と共に図4のN個のネスト状のループを
使用することにより、符号ベクトルのサブセットの上記
制限を実行する。従って、非ゼロパルスの振幅が代数学
的符号帳内のq個の可能な値のいずれかをとり得る場合
でも、サーチの複雑さは固定されたパルス振幅の場合ま
で低減される(ステップ303)。より正確には、フィル
タ応答特性化器105によって供給されるマトリックスU
(i、j)は、次の関係式に従い予め確定された関数と
組み合されるステップ302)。
る。すなわちSjは対応する振幅予測値の量子化後、個々
の位置iに対して選択された振幅である。 このような新しいマトリックスを用いると、次のよう
に最も外側のループから最もも内側のループへの別個の
ラインに高速アルゴリズムの各ループの計算式を書くこ
とができる。
あり、U'(px、py)は、位置pにおける位置pxに対して
予め割り当てられた振幅 および位置pにおける位置pyに予め割り当てられた振幅 に従属した関数である。 更にサーチの複雑さを低減するには、特に次の不等式
が真となる最も内側のループ(このループのみに限定さ
れるだけではない)をスキップできる(図3cを参照)。
ルタリングされた目標ベクトルDに関連したスレッショ
ルドである。
らの信号gCkおよび予測器106からの出力Eから加算器12
0(図1)によって計算される。STPパラメータに関し、
変化する伝達関数1/A(zγ-1)を備えた知覚的フィル
タによって構成された初期状態抽出器モジュール110
は、フィルタ107およびピッチ抽出器104における初期ス
テートとして使用するための最終フィルタステートFSを
得るためのみの目的で、残留信号Rから信号励振信号E
+gCkを減算する。
TPおよびSTPの組が適当なデジタルチャンネルフォーマ
ットに変換され、スピーチ信号のサンプルのブロックS
を符号化するための方法が完了する。
ついて説明したが、本発明の要旨から逸脱することな
く、添付した請求の範囲内においてこれら実施例を意図
的に変更できることは当然である。 [図面の簡単な説明]
を含むサウンド信号符号化装置の略ブロック図である。
図である。
速符号帳サーチのための基本演算のためのシーケンスで
ある。
振幅のうちの1つを予め割り当てるための演算のシーケ
ンスである。
ると見なされるときにいつも最も内側のループをスキッ
プするN個の埋め込みループサーチで行われる演算のシ
ーケンスである。
略図である。
ャを示す略ブロック図である。
Claims (22)
- 【請求項1】サウンド信号(S)の符号化中に前記サウ
ンド信号(S)から符号化に関連した信号(R',D)を抽
出し、 符号帳がパルスの振幅/位置の組み合わせ(Ak)のセッ
トから成り、 各パルスの振幅/位置の組み合わせ(Ak)がL個の異な
る位置(P)を定義し、パルスの組み合わせ(Ak)のそ
れぞれの位置p=1、2、・・・・Lに割り当てられた
ゼロ振幅および非ゼロ振幅パルス(Sp1,Sp2,Sp3,Sp4,S
p5)の双方を含み、 各非ゼロ振幅パルス(Sp1,Sp2,Sp3,Sp4,Sp5)がq個の
可能な振幅(Spi=+1、−1、+2、−2)のうちの
少なくとも1つをとるようになっており、サウンド信号
(S)の符号化に関連し前記符号帳においてサーチを実
行する方法であって、 前記符号帳サーチ実行方法が 各トラックのパルス位置が他のトラックのパルス位置
(p1,p2,p3,p4およびp5)とインターリーブされてい
る、パルス位置のトラックのセット(トラック#1,トラ
ック#2,トラック#3,トラック#4及びトラック#5)
に従って符号帳のうちの組み合わせ(Ak)の非ゼロ振幅
パルス(Sp1,Sp2,Sp3,Sp4,Sp5)の位置pを制限する工
程(303−1)と、 前記符号化に関連した信号の一部(R',D)に関連し、パ
ルスの振幅/位置の組み合わせ(Ak)のサブセットを前
記符号帳から予め選択する工程(301,302)と、 サウンド信号(S)を符号化するのに最適なパルスの振
幅/位置の組み合わせを見付けるために、パルスの振幅
/位置の組み合わせの前記サブセットのみをサーチする
工程(303)とを備え、よって符号帳のパルスの振幅/
位置の組み合わせ(Ak)のサブセットのみをサーチしな
がら、サーチの複雑性を低減し、 予め選択する前記工程(301,302)が位置p=1、2、
・・・・Lにq個の可能な振幅(Spi=+1、−1、+
2、−2)のうちの有効な振幅を予め割り当てる関数
(Sp)を符号化に関連する信号の前記部分(R'、D)に
関連して予め確定(301−1,301−2)し、前記サーチ工
程(303)が予め確定された関数(Sp)で各々が予め確
定されたのと同じ振幅を前記非ゼロ振幅パルスの位置p
に有する非ゼロ振幅のパルス(Sp1,Sp2,Sp3,Sp4,Sp5)
を有する前記符号帳のパルス振幅/位置の組み合わせ
(Ak)のみをサーチすることを含む、サウンド信号の符
号化に関連して符号帳においてサーチを実行する方法。 - 【請求項2】関数を予め確定する前記工程が前記予め確
定した関数(Sp)によりq個の可能な振幅(Spi=+
1、−1、+2、−2)のうちの1つを各位置pに有効
な振幅として予め割り当てる工程(301−1、301−2)
を含む請求項1記載の方法。 - 【請求項3】前記サウンド信号(S)の符号化中にサウ
ンド信号(S)から抽出された符号化に関連する信号の
前記部分(R',D)が、後方フィルタリングされた目標信
号Dとピッチ除去された残留信号R'とを含み、各位置p
にq個の可能な振幅のうちの1つを予め割り当てる工程
が、 後方フィルタリングされた目標信号Dおよびピッチ除去
された残留信号R'に応答して振幅予測ベクトルBを計算
する工程(301−1)と、 前記位置pの各々に対し前記ベクトルBの振幅予測値Bp
を量子化(301−2)し、前記位置pに対し選択すべき
振幅を得る工程とを備えた、請求項2記載の方法。 - 【請求項4】振幅予測ベクトルBを計算する工程が、 次の正規化されたフォームの後方フィルタリングされた
目標信号D を次の正規化されたフォームのピッチ除去された残留信
号R' に加算(301−1)し、次のフォーム (ここでβは固定された定数である)の振幅予測ベクト
ルBを得る工程を含む、請求項3記載の方法。 - 【請求項5】βが0と1との間にある値を有する固定さ
れた定数である、請求項4記載の方法。 - 【請求項6】前記位置pの各々に対し量子化する前記工
程が、次の式 (ここでデノミネータ は非ゼロ振幅パルスのピーク振幅を表示する正規化ファ
クタである)を使って前記ベクトルBのピーク値が正規
化された振幅の予測値Bpを量子化することを含む、請求
項3に記載の方法。 - 【請求項7】前記パルスの組み合わせ(Ak)の各々がN
個の非ゼロ振幅パルス(Sp1,Sp2,Sp3,Sp4,Sp5)を含
み、 トラックのセットがN個の非ゼロ振幅パルス(Sp1,Sp2,
Sp3,Sp4,Sp5)にそれぞれ関連したN個のトラック(ト
ラック#1,トラック#2,トラック#3,トラック#4及び
トラック#5)のパルス位置を含み、 各トラック(トラック#1,トラック#2,トラック#3,ト
ラック#4及びトラック#5)のパルス位置がN−1個
の他のトラックのパルス位置(p1,p2,p3,p4およびp5)
とインターリーブされており、 前記制限する工程が各非ゼロ振幅パルス(Sp1,Sp2,S3p,
Sp4,Sp5)のパルス位置を関連するトラックの位置に制
限する(303−1)ことを含む、請求項1に記載の方
法。 - 【請求項8】前記パルス振幅/位置の組み合わせ(Ak)
の各々がN個の非ゼロ振幅パルス(Sp1,Sp2,Sp3,Sp4,S
p5)を含み、前記サーチ工程(303)が次の式にしたが
って、 (ここで、各ループのための計算式はN個のネスト状の
ループのうちの最も外側のループから最も内側のループ
へ別個のラインで表示され、pnは組み合わせのn番目の
非ゼロ振幅パルスの位置であり、U'(px、py)が位置p
のうちの位置pxに予め割り当てられた振幅 および位置pのうちの位置pyに予め割り当てられた振幅 に従属した関数である)に従って、N個のネスト状のル
ープにより計算されたデノミネータ αk 2 を有する所定の比を最大にする工程を含む、請求項1に
記載の方法。 - 【請求項9】前記所定の比を最大にする工程が、 次の不等式 (ここで、 は位置pnに予め割り当てられた振幅であり、 は目標ベクトルDのpn番目の成分であり、TDは後方フィ
ルタリングされた目標ベクトルDに関連したスレッショ
ルドである)が真である時に、N個のネスト状のループ
の少なくとも最も内側のループをスキップする工程(30
3−2)を含む、請求項8記載の方法。 - 【請求項10】サウンド信号(S)の符号化中に前記サ
ウンド信号(S)から符号化に関連した信号(R'、D)
を抽出し、 符号帳がパルスの振幅/位置の組み合わせ(Ak)のセッ
トから成り、 各パルスの振幅/位置の組み合わせがL個の異なる位置
(p)を定義し、パルスの組み合わせのそれぞれの位置
p=1、2、・・・・Lに割り当てられたゼロ振幅およ
び非ゼロ振幅パルス(Sp1,Sp2,Sp3,Sp4,Sp5)の双方を
含み、 各非ゼロ振幅パルス(Sp1,Sp2,Sp3,S4p,Sp5)がq個の
可能な振幅(Spi=+1、−1、+2、−2)のうちの
少なくともひとつをとるようになっており、 サウンド信号の符号化に関連し前記符号帳においてサー
チを実行する装置であって、 前記符号帳サーチ実行装置が 各トラックのパルス位置が他のトラックのパルス位置
(p1、p2、p3、p4およびp5)とインターリーブされてい
る、パルス位置のトラック(トラック#1,トラック#2,
トラック#3,トラック#4及びトラック#5)のセット
に従って符号帳のうちの組み合わせ(Ak)の非ゼロ振幅
パルス(Sp1,S2p,Sp3,Sp4,Sp5)の位置pを制限(303−
1)する手段と、 前記符号化に関連した信号の一部(R'、D)に関連し、
パルスの振幅/位置の組み合わせ(Ak)のサブセットを
前記符号帳から予め選択する手段(301,302)と、 サウンド信号を符号化するのに最適なパルスの振幅/位
置の組み合わせを見つけ、パルスの振幅/位置の組み合
わせの前記サブセットのみをサーチする手段(303)と
を備え、よって符号帳のパルスの振幅/位置の組み合わ
せのサブセットのみをサーチしながら、サーチの複雑性
を低減し、 予め選択する前記手段(301,302)が位置p=1、2、
・・・・Lにq個の可能な振幅(Spi=+1、−1、+
2、−2)のうちの有効な振幅を予め割り当てる関数
(Sp)を符号化に関連する信号の前記部分(R'、D)に
関連して予め確定する手段(301−1、301−2)を有
し、前記サーチ手段が予め確保された関数(Sp)で各々
が予め確定されたのと同じ振幅を前記非ゼロ振幅パルス
の位置pに有する非ゼロ振幅のパルス(Sp1,Sp2,Sp3,S
p4,Sp5)を有する前記符号帳のパルス振幅/位置の組み
合わせ(Ak)にサーチを限定することを含む、サウンド
信号の符号化に関連して符号帳においてサーチを実行す
る装置。 - 【請求項11】関数を予め確定する手段が予め確定され
た関数(Sp)によって、q個の可能な振幅(Spi=+
1、−1、+2、−2)のうちの1つを有効振幅として
各位置pに予め割り当てる(301−1、301−2)ための
手段を備えたことを特徴とする請求項10記載の装置。 - 【請求項12】前記サウンド信号(S)の符号化中にサ
ウンド信号(S)から抽出された符号化に関連する信号
の前記部分(R'、D)が、後方フィルタリングされた目
標信号Dとピッチ除去された残留信号R'とを含み、各位
置pにq個の可能な振幅のうちの1つを予め割り当てる
ための手段が、 後方フィルタリングされた目標信号Dおよびピッチ除去
された残留信号R'に応答して振幅予測ベクトルBを計算
するための手段(301−1)と、 前記位置pの各々に対し前記ベクトルBの振幅予測値Bp
を量子化し(301−2)、前記位置pに対し選択すべき
振幅を得るための手段とを備えた、請求項11記載の装
置。 - 【請求項13】振幅予測ベクトルBを計算するための手
段が、 次の正規化されたフォームの後方フィルタリングされた
目標信号D を次の正規化されたフォームのピッチ除去された残留信
号R' に加算し(301−1)、次のフォーム (ここでβは固定された定数である)の振幅予測ベクト
ルB を得るための手段を含む、請求項12記載の装置。 - 【請求項14】βが0と1との間にある値を有する固定
された定数である、請求項13記載の装置。 - 【請求項15】前記量子化手段(301−2)が、前記位
置pの各々に対し、次の式 (ここでデノミネータ は非ゼロ振幅パルスのピーク振幅を表示する正規化ファ
クタである)を使用して前記ベクトルBのピーク値が正
規化された振幅の予測値Bpを量子化するための手段を含
む、請求項12に記載の装置。 - 【請求項16】前記パルスの組み合わせ(Ak)の各々が
N個の非ゼロ振幅パルス(Sp1,Sp2,Sp3,Sp4,Sp5)を含
み、 トラックのセットがN個の非ゼロ振幅パルスにそれぞれ
関連したN個のトラックのパルス位置(トラック#1,ト
ラック#2,トラック#3,トラック#4及びトラック#
5)を含み、 各トラックのパルス位置がN−1個の他のトラックのパ
ルス位置(p1、p2、p3、p4およびp5)とインターリーブ
されており、 前記制限する手段(303−1)が各非ゼロ振幅パルス(S
p1,Sp2,Sp3,Sp4,Sp5)のパルス位置を関連するトラック
の位置に制限することを含む、請求項10に記載の装置。 - 【請求項17】前記パルス振幅/位置の組み合わせの各
々がN個の非ゼロ振幅パルス(Sp1,Sp2,Sp3,Sp4,Sp5)
を含み、サーチ手段(303)がデノミネータ αk 2 を有する所定の比を最大にするための手段(303−4)
と、次の式 (ここで、各ループのための計算式はN個のネスト状の
ループのうちの最も外側のループから最も内側のループ
へ別個のラインで表示され、pnは組み合わせのn番目の
非ゼロ振幅パルスの位置であり、U'(px、py)は位置p
のうちの位置pxに予め割り当てられた振幅 および位置pのうちの位置pyに予め割り当てられた振幅 に従属した関数である)に従って、N個のネスト状のル
ープにより前記デノミネータ を計算するための手段とを含む、請求項10に記載の装
置。 - 【請求項18】デノミネータ αk 2 を計算するための前記手段が、次の不等式 (ここで、 は位置pnに予め割り当てられた振幅であり、 は目標ベクトルDのpn番目の成分であり、TDは後方フィ
ルタリングされた目標ベクトルDに関連したスレッショ
ルドである)が真である時に、N個のネスト状のループ
の少なくとも最も内側のループをスキップするための手
段(303−2)を含む、請求項17記載の装置。 - 【請求項19】複数のセルに分割された広大な地理的エ
リアにサービスを行うためのセルラー通信システムにお
いて、 モービル携帯送信/受信ユニット(3)と、 前記セル内にそれぞれ設置されたセルラー基地局(2)
と、 セルラー基地局(2)の間の通信を制御するための手段
(5)と、 1つのセル内に設置された各モービルユニット(3)と
前記1つのセルのセルラー基地局(2)との間で双方向
に無線通信するサブシステムとを備え、該双方向無線通
信サブシステムが、モービルユニット(3)およびセル
ラー基地局(2)の双方において、(a)スピーチ信号
を符号化するための手段および符号化されたスピーチ信
号を送信するための手段とを含む送信機と、(b)符号
化され送信されたスピーチ信号を受信するための手段お
よび符号化され受信されたスピーチ信号を受信するため
の手段を含む受信機とを備え、 前記スピーチ信号符号化手段がピーチ信号に応答し、ス
ピーチ信号符号化パラメータ(k、g,LTP,STP)の発生
するための手段(102,103,104,105,106,107,108,109,11
0,112,121)を含み、該スピーチ手段符号化パラメータ
発生手段が前記スピーチ手段符号化パラメータのうちの
少なくとも1つ(k)を発生するよう、符号帳にてサー
チを実行するための、請求項10〜18のいずれかに記載の
装置(109)を含み、前記スピーチ信号(S)が前記サ
ウンド信号を構成するセルラー通信システム。 - 【請求項20】(a)スピーチ信号を符号化するための
手段および符号化されたスピーチ信号を送信するための
手段を含む送信機と、(b)符号化され、送信されたス
ピーチ信号を受信するための手段および符号化され、受
信されたスピーチ信号を復号化するための手段を備えた
受信機とを含む、セルラーネットワーク要素(2)であ
って、 前記スピーチ信号符号化手段がスピーチ信号に応答し、
スピーチ信号符号化パラメータ(k、g、LTP,STP)を
発生するための手段(102,103,104,105,106,107,108,10
9,110,112,121)を含み、該スピーチ手段符号化パラメ
ータ発生手段が前記スピーチ手段符号化パラメータのう
ちの少なくとも1つ(k)を発生するよう、符号帳にて
サーチを実行するための、請求項10〜18のいずれかに記
載の装置(109)を含み、前記スピーチ信号(S)が前
記サウンド信号を構成するセルラーネットワーク要素
(2)。 - 【請求項21】(a)スピーチ信号を符号化するための
手段および符号化されたスピーチ信号を送信するための
手段を含む送信機と、(b)符号化され、送信されたス
ピーチ信号を受信するための手段および符号化され、受
信されたスピーチ信号を復号化するための手段を備えた
受信機とを含む、セルラーモービル送信/受信ユニット
(3)であって、 前記スピーチ信号符号化手段がスピーチ信号に応答し、
スピーチ信号符号化パラメータ(k、g、LTP,STP)を
発生するための手段(102,103,104,105,106,107,108,10
9,110,112,121)を含み、該スピーチ手段符号化パラメ
ータ発生手段が前記スピーチ手段符号化パラメータのう
ちの少なくとも1つ(k)を発生するよう、符号帳にて
サーチを実行するための、請求項10〜18のいずれかに記
載の装置(109)を含み、前記スピーチ信号(S)が前
記サウンド信号を構成するセルラーモービル送信/受信
ユニット(3)。 - 【請求項22】モービル送信/受信ユニット(3)と、
複数のセル内に位置するセルラー基地局(2)と、該セ
ルラー基地局(2)の間の通信を制御するための手段
(5)とを備え、複数のセルに分割された広い地理的エ
リアにサービスするためのセルラー通信システムにおい
て、 1つのセル内に設置された各モービルユニット(3)と
前記1つのセルのセルラー基地局(2)との間で双方向
に無線通信するサブシステムとを備え、該双方向無線通
信サブシステムが、モービルユニット(3)およびセル
ラー基地局(2)の双方において、(a)スピーチ信号
を符号化するための手段および符号化されたスピーチ信
号を送信するための手段とを含む送信機と、(b)符号
化され送信されたスピーチ信号を受信するための手段お
よび符号化され受信されたスピーチ信号を受信するため
の手段を含む受信機とを備え、 前記スピーチ信号符号化手段がスピーチ信号に応答し、
スピーチ信号符号化パラメータ(k、g、LTP,STP)を
発生するための手段(102,103,104,105,106,107,108,10
9,110,112,121)を含み、該スピーチ手段符号化パラメ
ータ発生手段が前記スピーチ手段符号化パラメータのう
ちの少なくとも1つ(k)を発生するよう、符号帳にて
サーチを実行するための、請求項10〜18のいずれかに記
載の装置を含み、前記スピーチ信号(S)が前記サウン
ド信号を構成するセルラー通信システム。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US38396895A | 1995-02-06 | 1995-02-06 | |
US08/383,968 | 1995-02-06 | ||
US08/508,801 | 1995-07-28 | ||
US08/508,801 US5754976A (en) | 1990-02-23 | 1995-07-28 | Algebraic codebook with signal-selected pulse amplitude/position combinations for fast coding of speech |
PCT/CA1996/000069 WO1996024925A1 (en) | 1995-02-06 | 1996-02-02 | Algebraic codebook with signal-selected pulse amplitudes for fast coding of speech |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003085959A Division JP4187556B2 (ja) | 1995-02-06 | 2003-03-26 | スピーチ信号を高速符号化するための信号選択されたパルス振幅を備えた代数学的符号帳 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH10513571A JPH10513571A (ja) | 1998-12-22 |
JP3430175B2 true JP3430175B2 (ja) | 2003-07-28 |
Family
ID=27010408
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP52385296A Expired - Lifetime JP3430175B2 (ja) | 1995-02-06 | 1996-02-02 | スピーチ信号を高速符号化するための信号選択されたパルス振幅を備えた代数学的符号帳 |
JP2003085959A Expired - Lifetime JP4187556B2 (ja) | 1995-02-06 | 2003-03-26 | スピーチ信号を高速符号化するための信号選択されたパルス振幅を備えた代数学的符号帳 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003085959A Expired - Lifetime JP4187556B2 (ja) | 1995-02-06 | 2003-03-26 | スピーチ信号を高速符号化するための信号選択されたパルス振幅を備えた代数学的符号帳 |
Country Status (26)
Country | Link |
---|---|
US (1) | US5754976A (ja) |
EP (2) | EP1225568B1 (ja) |
JP (2) | JP3430175B2 (ja) |
KR (2) | KR100388751B1 (ja) |
CN (2) | CN1198262C (ja) |
AR (1) | AR000871A1 (ja) |
AT (2) | ATE230888T1 (ja) |
AU (1) | AU708392C (ja) |
BR (1) | BR9607026A (ja) |
CA (1) | CA2210765C (ja) |
DE (1) | DE19604273C5 (ja) |
DK (2) | DK0808496T3 (ja) |
ES (1) | ES2112807B1 (ja) |
FI (2) | FI117994B (ja) |
FR (1) | FR2730336B1 (ja) |
GB (1) | GB2297671B (ja) |
HK (2) | HK1002492A1 (ja) |
IN (1) | IN187453B (ja) |
IT (1) | IT1305724B1 (ja) |
MX (1) | MX9705997A (ja) |
MY (2) | MY130529A (ja) |
NO (1) | NO318595B1 (ja) |
PT (1) | PT1225568E (ja) |
RU (1) | RU2142166C1 (ja) |
SE (1) | SE520553C2 (ja) |
WO (1) | WO1996024925A1 (ja) |
Families Citing this family (63)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
SE508788C2 (sv) * | 1995-04-12 | 1998-11-02 | Ericsson Telefon Ab L M | Förfarande att bestämma positionerna inom en talram för excitationspulser |
US5822724A (en) * | 1995-06-14 | 1998-10-13 | Nahumi; Dror | Optimized pulse location in codebook searching techniques for speech processing |
US6393391B1 (en) * | 1998-04-15 | 2002-05-21 | Nec Corporation | Speech coder for high quality at low bit rates |
TW317051B (ja) * | 1996-02-15 | 1997-10-01 | Philips Electronics Nv | |
JP3523649B2 (ja) * | 1997-03-12 | 2004-04-26 | 三菱電機株式会社 | 音声符号化装置、音声復号装置及び音声符号化復号装置、及び、音声符号化方法、音声復号方法及び音声符号化復号方法 |
FI114248B (fi) * | 1997-03-14 | 2004-09-15 | Nokia Corp | Menetelmä ja laite audiokoodaukseen ja audiodekoodaukseen |
CN1494055A (zh) * | 1997-12-24 | 2004-05-05 | ������������ʽ���� | 声音编码方法和声音译码方法以及声音编码装置和声音译码装置 |
US6385576B2 (en) * | 1997-12-24 | 2002-05-07 | Kabushiki Kaisha Toshiba | Speech encoding/decoding method using reduced subframe pulse positions having density related to pitch |
US5963897A (en) * | 1998-02-27 | 1999-10-05 | Lernout & Hauspie Speech Products N.V. | Apparatus and method for hybrid excited linear prediction speech encoding |
FI113571B (fi) | 1998-03-09 | 2004-05-14 | Nokia Corp | Puheenkoodaus |
JP3180762B2 (ja) * | 1998-05-11 | 2001-06-25 | 日本電気株式会社 | 音声符号化装置及び音声復号化装置 |
US6714907B2 (en) * | 1998-08-24 | 2004-03-30 | Mindspeed Technologies, Inc. | Codebook structure and search for speech coding |
WO2000016501A1 (en) * | 1998-09-11 | 2000-03-23 | Motorola Inc. | Method and apparatus for coding an information signal |
SE521225C2 (sv) * | 1998-09-16 | 2003-10-14 | Ericsson Telefon Ab L M | Förfarande och anordning för CELP-kodning/avkodning |
CA2252170A1 (en) | 1998-10-27 | 2000-04-27 | Bruno Bessette | A method and device for high quality coding of wideband speech and audio signals |
JP4173940B2 (ja) * | 1999-03-05 | 2008-10-29 | 松下電器産業株式会社 | 音声符号化装置及び音声符号化方法 |
US6295520B1 (en) | 1999-03-15 | 2001-09-25 | Tritech Microelectronics Ltd. | Multi-pulse synthesis simplification in analysis-by-synthesis coders |
JP2001075600A (ja) * | 1999-09-07 | 2001-03-23 | Mitsubishi Electric Corp | 音声符号化装置および音声復号化装置 |
US7272553B1 (en) * | 1999-09-08 | 2007-09-18 | 8X8, Inc. | Varying pulse amplitude multi-pulse analysis speech processor and method |
WO2001020595A1 (en) * | 1999-09-14 | 2001-03-22 | Fujitsu Limited | Voice encoder/decoder |
CA2290037A1 (en) | 1999-11-18 | 2001-05-18 | Voiceage Corporation | Gain-smoothing amplifier device and method in codecs for wideband speech and audio signals |
KR100576024B1 (ko) * | 2000-04-12 | 2006-05-02 | 삼성전자주식회사 | 에이켈프 음성 압축기의 코드북 검색 장치 및 방법 |
US6728669B1 (en) * | 2000-08-07 | 2004-04-27 | Lucent Technologies Inc. | Relative pulse position in celp vocoding |
US7363219B2 (en) * | 2000-09-22 | 2008-04-22 | Texas Instruments Incorporated | Hybrid speech coding and system |
CA2327041A1 (en) * | 2000-11-22 | 2002-05-22 | Voiceage Corporation | A method for indexing pulse positions and signs in algebraic codebooks for efficient coding of wideband signals |
KR100438175B1 (ko) * | 2001-10-23 | 2004-07-01 | 엘지전자 주식회사 | 코드북 검색방법 |
US7236928B2 (en) * | 2001-12-19 | 2007-06-26 | Ntt Docomo, Inc. | Joint optimization of speech excitation and filter parameters |
US7206740B2 (en) * | 2002-01-04 | 2007-04-17 | Broadcom Corporation | Efficient excitation quantization in noise feedback coding with general noise shaping |
JP2003255976A (ja) * | 2002-02-28 | 2003-09-10 | Nec Corp | 音声素片データベースの圧縮伸張を行なう音声合成装置及び方法 |
CA2388439A1 (en) * | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for efficient frame erasure concealment in linear predictive based speech codecs |
CA2392640A1 (en) * | 2002-07-05 | 2004-01-05 | Voiceage Corporation | A method and device for efficient in-based dim-and-burst signaling and half-rate max operation in variable bit-rate wideband speech coding for cdma wireless systems |
US7054807B2 (en) * | 2002-11-08 | 2006-05-30 | Motorola, Inc. | Optimizing encoder for efficiently determining analysis-by-synthesis codebook-related parameters |
KR100503414B1 (ko) * | 2002-11-14 | 2005-07-22 | 한국전자통신연구원 | 고정 코드북의 집중 검색 방법 및 장치 |
US7698132B2 (en) * | 2002-12-17 | 2010-04-13 | Qualcomm Incorporated | Sub-sampled excitation waveform codebooks |
US7249014B2 (en) * | 2003-03-13 | 2007-07-24 | Intel Corporation | Apparatus, methods and articles incorporating a fast algebraic codebook search technique |
WO2004090870A1 (ja) * | 2003-04-04 | 2004-10-21 | Kabushiki Kaisha Toshiba | 広帯域音声を符号化または復号化するための方法及び装置 |
EP1513137A1 (en) * | 2003-08-22 | 2005-03-09 | MicronasNIT LCC, Novi Sad Institute of Information Technologies | Speech processing system and method with multi-pulse excitation |
CN100416652C (zh) * | 2005-10-31 | 2008-09-03 | 连展科技(天津)有限公司 | 增强的amr编码器快速固定码本搜索方法 |
JP5159318B2 (ja) * | 2005-12-09 | 2013-03-06 | パナソニック株式会社 | 固定符号帳探索装置および固定符号帳探索方法 |
US8255207B2 (en) * | 2005-12-28 | 2012-08-28 | Voiceage Corporation | Method and device for efficient frame erasure concealment in speech codecs |
JP3981399B1 (ja) * | 2006-03-10 | 2007-09-26 | 松下電器産業株式会社 | 固定符号帳探索装置および固定符号帳探索方法 |
US20080120098A1 (en) * | 2006-11-21 | 2008-05-22 | Nokia Corporation | Complexity Adjustment for a Signal Encoder |
US8688437B2 (en) | 2006-12-26 | 2014-04-01 | Huawei Technologies Co., Ltd. | Packet loss concealment for speech coding |
CN101286321B (zh) * | 2006-12-26 | 2013-01-09 | 华为技术有限公司 | 双脉冲激励的线性测编码 |
EP2157573B1 (en) | 2007-04-29 | 2014-11-26 | Huawei Technologies Co., Ltd. | An encoding and decoding method |
CN100530357C (zh) * | 2007-07-11 | 2009-08-19 | 华为技术有限公司 | 固定码书搜索方法及搜索器 |
US8566106B2 (en) * | 2007-09-11 | 2013-10-22 | Voiceage Corporation | Method and device for fast algebraic codebook search in speech and audio coding |
CN100578619C (zh) * | 2007-11-05 | 2010-01-06 | 华为技术有限公司 | 编码方法和编码器 |
CN101903946B (zh) * | 2007-12-21 | 2012-09-26 | Nvoq股份有限公司 | 分布式听写/转录系统 |
US7889103B2 (en) * | 2008-03-13 | 2011-02-15 | Motorola Mobility, Inc. | Method and apparatus for low complexity combinatorial coding of signals |
DK2242045T3 (da) * | 2009-04-16 | 2012-09-24 | Univ Mons | Talesyntese og kodningsfremgangsmåder |
CN101931414B (zh) * | 2009-06-19 | 2013-04-24 | 华为技术有限公司 | 脉冲编码方法及装置、脉冲解码方法及装置 |
US8280729B2 (en) * | 2010-01-22 | 2012-10-02 | Research In Motion Limited | System and method for encoding and decoding pulse indices |
CN102299760B (zh) | 2010-06-24 | 2014-03-12 | 华为技术有限公司 | 脉冲编解码方法及脉冲编解码器 |
CN102623012B (zh) * | 2011-01-26 | 2014-08-20 | 华为技术有限公司 | 矢量联合编解码方法及编解码器 |
US9767822B2 (en) | 2011-02-07 | 2017-09-19 | Qualcomm Incorporated | Devices for encoding and decoding a watermarked signal |
US8880404B2 (en) * | 2011-02-07 | 2014-11-04 | Qualcomm Incorporated | Devices for adaptively encoding and decoding a watermarked signal |
US9767823B2 (en) | 2011-02-07 | 2017-09-19 | Qualcomm Incorporated | Devices for encoding and detecting a watermarked signal |
US9070356B2 (en) | 2012-04-04 | 2015-06-30 | Google Technology Holdings LLC | Method and apparatus for generating a candidate code-vector to code an informational signal |
US9263053B2 (en) | 2012-04-04 | 2016-02-16 | Google Technology Holdings LLC | Method and apparatus for generating a candidate code-vector to code an informational signal |
CN103456309B (zh) * | 2012-05-31 | 2016-04-20 | 展讯通信(上海)有限公司 | 语音编码器及其代数码表搜索方法和装置 |
US9728200B2 (en) * | 2013-01-29 | 2017-08-08 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for adaptive formant sharpening in linear prediction coding |
US20140334564A1 (en) * | 2013-05-09 | 2014-11-13 | Samsung Electronics Co., Ltd | Method and system for providing low-complexity hybrid precoding in wireless communication systems |
Family Cites Families (45)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4401855A (en) * | 1980-11-28 | 1983-08-30 | The Regents Of The University Of California | Apparatus for the linear predictive coding of human speech |
CA1164569A (en) * | 1981-03-17 | 1984-03-27 | Katsunobu Fushikida | System for extraction of pole/zero parameter values |
WO1983003917A1 (en) * | 1982-04-29 | 1983-11-10 | Massachusetts Institute Of Technology | Voice encoder and synthesizer |
US4625286A (en) * | 1982-05-03 | 1986-11-25 | Texas Instruments Incorporated | Time encoding of LPC roots |
US4520499A (en) * | 1982-06-25 | 1985-05-28 | Milton Bradley Company | Combination speech synthesis and recognition apparatus |
JPS5922165A (ja) * | 1982-07-28 | 1984-02-04 | Nippon Telegr & Teleph Corp <Ntt> | アドレス制御回路 |
DE3276651D1 (en) * | 1982-11-26 | 1987-07-30 | Ibm | Speech signal coding method and apparatus |
US4764963A (en) * | 1983-04-12 | 1988-08-16 | American Telephone And Telegraph Company, At&T Bell Laboratories | Speech pattern compression arrangement utilizing speech event identification |
US4667340A (en) * | 1983-04-13 | 1987-05-19 | Texas Instruments Incorporated | Voice messaging system with pitch-congruent baseband coding |
US4669120A (en) * | 1983-07-08 | 1987-05-26 | Nec Corporation | Low bit-rate speech coding with decision of a location of each exciting pulse of a train concurrently with optimum amplitudes of pulses |
DE3335358A1 (de) * | 1983-09-29 | 1985-04-11 | Siemens AG, 1000 Berlin und 8000 München | Verfahren zur bestimmung von sprachspektren fuer die automatische spracherkennung und sprachcodierung |
US4799261A (en) * | 1983-11-03 | 1989-01-17 | Texas Instruments Incorporated | Low data rate speech encoding employing syllable duration patterns |
CA1236922A (en) * | 1983-11-30 | 1988-05-17 | Paul Mermelstein | Method and apparatus for coding digital signals |
CA1223365A (en) * | 1984-02-02 | 1987-06-23 | Shigeru Ono | Method and apparatus for speech coding |
US4724535A (en) * | 1984-04-17 | 1988-02-09 | Nec Corporation | Low bit-rate pattern coding with recursive orthogonal decision of parameters |
US4680797A (en) * | 1984-06-26 | 1987-07-14 | The United States Of America As Represented By The Secretary Of The Air Force | Secure digital speech communication |
US4742550A (en) * | 1984-09-17 | 1988-05-03 | Motorola, Inc. | 4800 BPS interoperable relp system |
CA1252568A (en) * | 1984-12-24 | 1989-04-11 | Kazunori Ozawa | Low bit-rate pattern encoding and decoding capable of reducing an information transmission rate |
US4858115A (en) * | 1985-07-31 | 1989-08-15 | Unisys Corporation | Loop control mechanism for scientific processor |
IT1184023B (it) * | 1985-12-17 | 1987-10-22 | Cselt Centro Studi Lab Telecom | Procedimento e dispositivo per la codifica e decodifica del segnale vocale mediante analisi a sottobande e quantizzazione vettorariale con allocazione dinamica dei bit di codifica |
US4720861A (en) * | 1985-12-24 | 1988-01-19 | Itt Defense Communications A Division Of Itt Corporation | Digital speech coding circuit |
US4771465A (en) * | 1986-09-11 | 1988-09-13 | American Telephone And Telegraph Company, At&T Bell Laboratories | Digital speech sinusoidal vocoder with transmission of only subset of harmonics |
US4797926A (en) * | 1986-09-11 | 1989-01-10 | American Telephone And Telegraph Company, At&T Bell Laboratories | Digital speech vocoder |
US4873723A (en) * | 1986-09-18 | 1989-10-10 | Nec Corporation | Method and apparatus for multi-pulse speech coding |
US4797925A (en) * | 1986-09-26 | 1989-01-10 | Bell Communications Research, Inc. | Method for coding speech at low bit rates |
IT1195350B (it) * | 1986-10-21 | 1988-10-12 | Cselt Centro Studi Lab Telecom | Procedimento e dispositivo per la codifica e decodifica del segnale vocale mediante estrazione di para metri e tecniche di quantizzazione vettoriale |
US4868867A (en) * | 1987-04-06 | 1989-09-19 | Voicecraft Inc. | Vector excitation speech or audio coder for transmission or storage |
CA1337217C (en) * | 1987-08-28 | 1995-10-03 | Daniel Kenneth Freeman | Speech coding |
US4815134A (en) * | 1987-09-08 | 1989-03-21 | Texas Instruments Incorporated | Very low rate speech encoder and decoder |
IL84902A (en) * | 1987-12-21 | 1991-12-15 | D S P Group Israel Ltd | Digital autocorrelation system for detecting speech in noisy audio signal |
US4817157A (en) * | 1988-01-07 | 1989-03-28 | Motorola, Inc. | Digital speech coder having improved vector excitation source |
CA1321646C (en) * | 1988-05-20 | 1993-08-24 | Eisuke Hanada | Coded speech communication system having code books for synthesizing small-amplitude components |
US5008965A (en) * | 1988-07-11 | 1991-04-23 | Kinetic Concepts, Inc. | Fluidized bead bed |
IT1232084B (it) * | 1989-05-03 | 1992-01-23 | Cselt Centro Studi Lab Telecom | Sistema di codifica per segnali audio a banda allargata |
SE463691B (sv) * | 1989-05-11 | 1991-01-07 | Ericsson Telefon Ab L M | Foerfarande att utplacera excitationspulser foer en lineaerprediktiv kodare (lpc) som arbetar enligt multipulsprincipen |
US5097508A (en) * | 1989-08-31 | 1992-03-17 | Codex Corporation | Digital speech coder having improved long term lag parameter determination |
US5307441A (en) * | 1989-11-29 | 1994-04-26 | Comsat Corporation | Wear-toll quality 4.8 kbps speech codec |
CA2010830C (en) * | 1990-02-23 | 1996-06-25 | Jean-Pierre Adoul | Dynamic codebook for efficient speech coding based on algebraic codes |
US5144671A (en) * | 1990-03-15 | 1992-09-01 | Gte Laboratories Incorporated | Method for reducing the search complexity in analysis-by-synthesis coding |
US5293449A (en) * | 1990-11-23 | 1994-03-08 | Comsat Corporation | Analysis-by-synthesis 2,4 kbps linear predictive speech codec |
US5396576A (en) * | 1991-05-22 | 1995-03-07 | Nippon Telegraph And Telephone Corporation | Speech coding and decoding methods using adaptive and random code books |
US5233660A (en) * | 1991-09-10 | 1993-08-03 | At&T Bell Laboratories | Method and apparatus for low-delay celp speech coding and decoding |
JP3089769B2 (ja) * | 1991-12-03 | 2000-09-18 | 日本電気株式会社 | 音声符号化装置 |
US5457783A (en) * | 1992-08-07 | 1995-10-10 | Pacific Communication Sciences, Inc. | Adaptive speech coder having code excited linear prediction |
DE4315313C2 (de) * | 1993-05-07 | 2001-11-08 | Bosch Gmbh Robert | Vektorcodierverfahren insbesondere für Sprachsignale |
-
1995
- 1995-07-28 US US08/508,801 patent/US5754976A/en not_active Expired - Lifetime
-
1996
- 1996-01-27 MY MYPI20021290A patent/MY130529A/en unknown
- 1996-01-27 MY MYPI96000300A patent/MY119038A/en unknown
- 1996-02-02 MX MX9705997A patent/MX9705997A/es unknown
- 1996-02-02 EP EP02075797A patent/EP1225568B1/en not_active Expired - Lifetime
- 1996-02-02 KR KR1019970705372A patent/KR100388751B1/ko not_active IP Right Cessation
- 1996-02-02 IT IT1996UD000012A patent/IT1305724B1/it active
- 1996-02-02 EP EP96900816A patent/EP0808496B1/en not_active Expired - Lifetime
- 1996-02-02 BR BR9607026A patent/BR9607026A/pt not_active Application Discontinuation
- 1996-02-02 CA CA002210765A patent/CA2210765C/en not_active Expired - Lifetime
- 1996-02-02 CN CNB961930950A patent/CN1198262C/zh not_active Expired - Lifetime
- 1996-02-02 AT AT96900816T patent/ATE230888T1/de active
- 1996-02-02 PT PT02075797T patent/PT1225568E/pt unknown
- 1996-02-02 DK DK96900816T patent/DK0808496T3/da active
- 1996-02-02 RU RU97114804A patent/RU2142166C1/ru active
- 1996-02-02 WO PCT/CA1996/000069 patent/WO1996024925A1/en active IP Right Grant
- 1996-02-02 JP JP52385296A patent/JP3430175B2/ja not_active Expired - Lifetime
- 1996-02-02 AU AU44796/96A patent/AU708392C/en not_active Expired
- 1996-02-02 AT AT02075797T patent/ATE248423T1/de active
- 1996-02-02 DK DK02075797T patent/DK1225568T3/da active
- 1996-02-05 IN IN198CA1996 patent/IN187453B/en unknown
- 1996-02-05 AR ARP960101276A patent/AR000871A1/es unknown
- 1996-02-06 DE DE19604273A patent/DE19604273C5/de not_active Expired - Lifetime
- 1996-02-06 FR FR9601426A patent/FR2730336B1/fr not_active Expired - Lifetime
- 1996-02-06 SE SE9600437A patent/SE520553C2/sv not_active IP Right Cessation
- 1996-02-06 GB GB9602391A patent/GB2297671B/en not_active Expired - Lifetime
- 1996-08-15 ES ES09650025A patent/ES2112807B1/es not_active Expired - Fee Related
-
1997
- 1997-07-28 NO NO19973472A patent/NO318595B1/no not_active IP Right Cessation
- 1997-08-06 FI FI973241A patent/FI117994B/fi not_active IP Right Cessation
-
1998
- 1998-02-24 HK HK98101406A patent/HK1002492A1/xx not_active IP Right Cessation
-
2002
- 2002-02-18 FI FI20020320A patent/FI118396B/fi not_active IP Right Cessation
- 2002-03-21 CN CNB021079072A patent/CN1220178C/zh not_active Expired - Lifetime
- 2002-05-02 KR KR1020020024078A patent/KR100393910B1/ko not_active IP Right Cessation
-
2003
- 2003-03-26 JP JP2003085959A patent/JP4187556B2/ja not_active Expired - Lifetime
- 2003-10-13 HK HK03107310A patent/HK1055007A1/xx not_active IP Right Cessation
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3430175B2 (ja) | スピーチ信号を高速符号化するための信号選択されたパルス振幅を備えた代数学的符号帳 | |
KR100299408B1 (ko) | 음성의고속코딩을위한심도우선대수코드북검색 | |
US7280959B2 (en) | Indexing pulse positions and signs in algebraic codebooks for coding of wideband signals | |
US7774200B2 (en) | Method and apparatus for transmitting an encoded speech signal | |
AU2002221389A1 (en) | Indexing pulse positions and signs in algebraic codebooks for coding of wideband signals | |
US5727122A (en) | Code excitation linear predictive (CELP) encoder and decoder and code excitation linear predictive coding method | |
CA2210765E (en) | Algebraic codebook with signal-selected pulse amplitudes for fast coding of speech | |
CA2618002C (en) | Algebraic codebook with signal-selected pulse amplitudes for fast coding of speech | |
WO2000042601A1 (en) | A method and device for designing and searching large stochastic codebooks in low bit rate speech encoders | |
MXPA97005997A (en) | Algebraic coding book with amplitude signal deimpulse selected for a rapidacodification of | |
NO322594B1 (no) | Algebraisk kodebok med signalvalgte pulsamplituder for hurtig koding av tale |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080516 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090516 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100516 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100516 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110516 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130516 Year of fee payment: 10 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |