JP3430175B2 - スピーチ信号を高速符号化するための信号選択されたパルス振幅を備えた代数学的符号帳 - Google Patents

スピーチ信号を高速符号化するための信号選択されたパルス振幅を備えた代数学的符号帳

Info

Publication number
JP3430175B2
JP3430175B2 JP52385296A JP52385296A JP3430175B2 JP 3430175 B2 JP3430175 B2 JP 3430175B2 JP 52385296 A JP52385296 A JP 52385296A JP 52385296 A JP52385296 A JP 52385296A JP 3430175 B2 JP3430175 B2 JP 3430175B2
Authority
JP
Japan
Prior art keywords
amplitude
pulse
signal
track
speech signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP52385296A
Other languages
English (en)
Other versions
JPH10513571A (ja
Inventor
アデュール,ジーン−ピエール
ラフランム,クロード
Original Assignee
ユニバーシティ ド シャーブルック
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=27010408&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=JP3430175(B2) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by ユニバーシティ ド シャーブルック filed Critical ユニバーシティ ド シャーブルック
Publication of JPH10513571A publication Critical patent/JPH10513571A/ja
Application granted granted Critical
Publication of JP3430175B2 publication Critical patent/JP3430175B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0004Design or structure of the codebook
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0007Codebook element generation
    • G10L2019/0008Algebraic codebooks
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0011Long term prediction filters, i.e. pitch estimation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0013Codebook search algorithms
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/06Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Description

【発明の詳細な説明】
【0001】 本発明はサウンド信号を送信し、合成する観点から、
サウンド信号、特にスピーチ(音声)信号(これのみに
限定されず)をデジタル式に符号化するための改善され
た技術に関する。
【0002】 良好な主観的な質とビットレートとを妥協させながら
効率的なデジタルスピーチ符号化技術への要求は、衛
星、地上モービル、デジタル無線すなわちパケットネッ
トワーク、音声記憶、音声応答および無線電話を通した
音声送信のような多数の用途で増大しつつある。
【0003】 良好な質とビットレートとの妥協を図ることができる
従来の最良の技術の1つとして、いわゆる符号励振線形
予測(CELP)技術がある。この技術によれば、スピーチ
信号はL個のサンプル(すなわちベクトル)のブロック
にサンプリングされ、ブロックとして処理される。ここ
で、Lは所定の数である。CELP技術は符号帳を利用して
いる。
【0004】 CELP技術で用いられる符号帳はL次元の符号ベクトル
と称されるL個のサンプル長さのシーケンスのインデッ
クスのついたセット(L個の異なる位置を決めるパルス
の組み合わせであり、この組み合わせのそれぞれの位置
p=1、2、…、Lに割り当てられたゼロ振幅パルスと
非ゼロ振幅パルスの双方から成る)である。この符号帳
は1〜Mまでの範囲のインデックスkを含み、ここでM
はある数のビットbで表示されることが多い符号帳のサ
イズを示す。 M=2b
【0005】 符号帳は物理的なメモリ(例えばルックアップテーブ
ル)に記憶したり、または対応する符号ベクトル(例え
ば式)にインデックスを関連付けるための機構を参照で
きる。
【0006】 CELP技術によりスピーチ信号を合成するために、スピ
ーチ信号のスペクトル特性をモデル化した時間可変フィ
ルタを通して、符号帳からの適当な符号ベクトルをフィ
ルタリングすることによって、スピーチサンプルの各ブ
ロックを構成する。符号化器側では符号帳からの候補符
号帳のすべてまたはサブセットに対して合成出力を計算
する(符号帳サーチ)。保留された符号ベクトルは知覚
的に重み付けされたひずみの尺度に従って、基の音声信
号に最も近い合成出力を発生する符号ベクトルとなる。
【0007】 第1のタイプの符号帳はいわゆる確率論的な符号帳で
ある。これら符号帳の欠点は、かなりの物理的な記憶を
行わなければならないことが多いことにある。これらの
符号帳は確率論的、すなわちインデックスから関連する
符号帳へのパスは、乱数すなわち多数の音声トレーニン
グセットに使用された統計学的技術の結果であるルック
アップテーブルを必要とするという意味でランダムであ
る。このような確率論的符号帳のサイズは記憶量および
/またはサーチの複雑さによって制限される傾向があ
る。
【0008】 第2タイプの符号帳は代数学的符号帳である。確率論
的符号帳と対照すると、代数学的符号帳はランダムでは
なく、記憶装置を必要としない。代数学的符号帳はk番
目の符号帳のパルスの振幅および位置が物理的記憶装置
を全く必要としないか、または最小量しか必要としない
規則により、インデックスkから発生できるようになっ
ているインデックスのついた符号ベクトルのセットとな
っている。従って、代数学的符号帳のサイズは記憶条件
によって制限されず、代数学的符号帳は効率的なサーチ
を行うようにも設計できる。
【0009】 従って、本発明の課題はサウンド信号の符号化時に符
号帳のサーチの複雑さを劇的に低減するための方法およ
び装置を提供することにあり、このような方法および装
置は大きなクラスの符号帳に適用可能である。 本発明の別の課題は、符号帳のサーチの複雑さを低減
する見地から、符号帳パルスの組み合わせのサブセット
をアプリオリに選択し、このサブセットに対しサーチす
べき組み合わせを保留できる方法および装置を提供する
ことにある。 更に別の課題は、サーチの複雑さを増すことなく符号
ベクトルの個々の非ゼロ振幅のパルスがq個の可能な振
幅のうちの少なくとも一つをとることができるようにす
ることにより、符号帳のサイズを大きくすることにあ
る。
【0010】 より詳細には、本発明によれば、各パルスの振幅/位
置の組み合わせがL個の異なる位置を定義し、パルスの
組み合わせのそれぞれの位置P=1、2、....Lに割り
当てられたゼロ振幅および非ゼロ振幅パルスの双方を含
み、各非ゼロ振幅パルスがq個の可能な振幅のうちの少
なくともひとつをとるようになっており、パルスの振幅
/位置の組み合わせのセットから成る符号帳においてサ
ウンド信号を符号化する観点からサーチを実行する方法
であって、該方法が、 サウンド信号に関連し、パルスの振幅/位置の組み合
わせのサブセットを前記不合町から予め選択する工程
と、 サウンド信号を符号化する観点からパルスの振幅/位
置の組み合わせの前記サブセットのみをサーチする工程
とを備え、よって符号帳のパルスの振幅/位置の組み合
わせのサブセットのみをサーチしながら、サーチの複雑
性を低減する、符号帳においてサーチを実行する方法が
提供される。
【0011】 予め選択する工程は位置p=1、2、....Lにq個の
可能な振幅のうちの有効な振幅を予め割り当てる関数S
をサウンド信号に関連して予め確定し、 サーチ工程は予め確定された関数に従う非ゼロ振幅の
パルスを有する前記符号帳のパルス振幅/位置の組み合
わせのみをサーチすることから成る。
【0012】 更に本発明によれば、各パルスの振幅/位置の組み合
わせがL個の異なる位置を定義し、パルスの組み合わせ
のそれぞれの位置p=1、2、・・・・Lに割り当てら
れたゼロ振幅および非ゼロ振幅パルスの双方を含み、各
非ゼロ振幅パルスがq個の可能な振幅のうちの少なくと
も1つをとるようになっており、パルスの振幅/位置の
組み合わせのセットから成る符号帳においてサウンド信
号を符号化する観点からサーチを実行するための装置で
あって、 サウンド信号に関連し、パルスの振幅/位置の組み合
わせのサブセットを前記符号帳から予め選択するための
手段と、 サウンド信号を符号化する観点からパルスの振幅/位
置の組み合わせの前記サブセットのみをサーチするため
の手段とを備え、よって符号帳のパルスの振幅/位置の
組み合わせのサブセットのみをサーチしながらサーチの
複雑性を低減する、符号帳においてサーチを実行するた
めの装置が提供される。
【0013】 予め選択するための手段は位置p=1、2、・・・・
Lに前記q個の可能な振幅のうちの有効な振幅を予め割
り当てる関数Sをサウンド信号に関連して予め確定する
ための手段を備え、サーチ手段は予め確定された関数に
従う非ゼロ振幅のパルスを有する前記符号帳のパルス振
幅/位置の組み合わせのサーチに限定するための手段を
備える。
【0014】 更に本発明によれば、複数のセルに分割された広大な
地理的エリアにサービスを行うためのセルラー通信シス
テムにおいて、 モービル携帯送信/受信ユニットと、 前記セル内にそれぞれ設置されたセルラー基地局と、 セルラー基地局との間の通信を制御するための手段
と、 1つのセル内に設置された各モービルユニットと前記
1つのセルのセルラー基地局との間で双方向に無線通信
するサブシステムとを備え、該双方向無線通信サブシス
テムが、モービルユニットおよびセルラー基地局の双方
において、(a)スピーチ信号を符号化するための手段
および符号化されたスピーチ信号を送信するための手段
とを含む送信機と、(b)符号化され送信されたスピー
チ信号を受信するための手段および符号化され受信され
たスピーチ信号を受信するための手段を含む受信機とを
備えたセルラー通信システムが提供される。
【0015】 スピーチ信号符号化手段はスピーチ信号を符号化する
観点から符号帳においてサーチを実行するための装置を
備え、この符号帳はパルス振幅/位置の組み合わせのセ
ットから成り、各パルス振幅/位置の組み合わせがL個
の異なる位置を定義し、このパルスの組み合わせのそれ
ぞれの位置p=1、2、・・・・Lに割り当てられたゼ
ロ振幅パルスおよび非ゼロ振幅パルスの双方を含み、各
非ゼロ振幅パルスがq個の異なる振幅のうちの少なくと
も1つをとり、前記サーチ実行装置は、 スピーチ信号に関連し、パルスの振幅/位置の組み合
わせのサブセットを前記符号帳から予め選択するための
手段と、 スピーチ信号を符号化する観点からパルスの振幅/位
置の組み合わせの前記サブセットのみをサーチするため
の手段とを備え、よって符号帳のパルスの振幅/位置の
組み合わせのサブセットだけをサーチしながら、サーチ
の複雑性を低減し、 予め選択するための手段は位置p=1、2、・・・・
Lに前記q個の可能な振幅のうちの有効な振幅を予め割
り当てる関数Spをサウンド信号に関連して予め確定する
ための手段を備え、 サーチ手段が予め確定された関数に従う非ゼロ振幅の
パルスを有する前記符号帳のパルス振幅/位置の組み合
わせのサーチに限定するための手段を備える。 本発明の好ましい実施例によれば、q個の可能な振幅
のうちの1つを各位置pに有効な振幅として予め割り当
て、パルス振幅/位置の組み合わせの非ゼロ振幅パルス
の各々が前記非ゼロ振幅パルスの位置pに予め割り当て
られた振幅Spに等しい振幅を有する際に、予め確定され
た関数に従う。
【0016】 好ましくは、各位置pにq個の可能な振幅のうちの1
つを予め割り当てる工程は、 後方フィルタリングされた目標信号Dおよびピッチ除
去残留信号R'を発生するようサウンド信号を処理する工
程と、 後方フィルタリングされた目標信号Dおよびピッチ除
去残留信号R'に応答して振幅予測ベクトルBを計算する
工程と、 前記位置pの各々に対し前記ベクトルBの振幅予測値
Bpを量子化し、前記位置pに対し選択すべき振幅を得る
工程とを備える。
【0017】 好ましくは、振幅予測ベクトルBを計算する工程は、 次の正規化されたフォームの後方フィルタリングされ
た目標信号D を次の正規化されたフォームのピッチ除去残留信号R' に加算し、次のフォーム (ここでβは好ましくは0〜1の間にある値を有する固
定された定数である)の振幅予測ベクトルBを得る工程
を含む。
【0018】 本発明の更に好ましい実施例によれば、次の式 (ここでデノミネータ は非ゼロ振幅パルスのピーク振幅を表示する正規化ファ
クタである)を使ってベクトルBのピーク値が正規化さ
れた振幅の予測値Bpを量子化する。 パルスの組み合わせの各々はN個の非ゼロ振幅のパル
スを含むことができ、更に少なくとも1つのN回インタ
ーリーブされた単一パルス順列符号に従って非ゼロ振幅
パルスの位置pを制限することが好ましい。
【0019】 符号帳をサーチすることは次の式
【0020】 (ここで、各ループのための計算式がN個のネスト状の
ループのうちの最も外側のループから最も内側のループ
へ別個のラインで表示され、pnが組み合わせのn番目の
非ゼロ振幅パルスの位置であり、U'(px、py)が位置p
のうちの位置pxに予め割り当てられた振幅 および位置pのうちの位置pyに予め割り当てられた振幅 に従属した関数である)に従って、N個のネスト状のル
ープにより計算されたデノミネータ αk 2 を有する所定の比を最大にする工程を含むことが好まし
い。上記計算において、次の不等式
【0021】 (ここで、 は位置pnに予め割り当てられた振幅であり、 が目標ベクトルDのpn番目の成分であり、TDが後方フィ
ルタリングされた目標ベクトルDに関連したスレッショ
ルドである)が真である時に、N個のネスト状のループ
の少なくとも最も内側のループをスキップすることがで
きる。 添付図面を参照して、単なる例として示された本発明
の好ましい実施例の対の非限定的な説明を読めば、本発
明の課題、利点およびそれ以外の特徴がより明らかとな
ろう。
【0022】 図5は、代表的なセルラー通信システム1のインフラ
ストラクチャを示す。
【0023】 本明細書では、本発明に係わるサーチ実施方法および
デバイスをセルラー通信システムに応用することを非限
定的実施例として開示するが、これら方法およびデバイ
スはサウンド信号の符号化が必要とされる他の多くのタ
イプの通信システムでも同様な利点を発揮しながら使用
できるものであることを念頭におくべきである。
【0024】 セルラー通信システム例えば1では、広大なエリアを
多数のより小規模のセルに分割することにより、広大な
地理的エリアにわたって遠隔通信サービスを提供してい
る。各セルは無線信号チャンネルおよびオーディオおよ
びデータチャンネルを提供するためにセルラー基地局2
(図5)を有する。セルラーベース局のカバーエリア
(セル)の範囲内の移動無線電話(モービル送信機/受
信機ユニット)をページングし、基地局のセルの内外の
他の無線電話または公衆交換電話ネットワーク(PSTN)
4のような他のネットワークの呼び出しをするのに、無
線信号化チャンネルが利用される。
【0025】 無線電話3が一旦発呼または呼び出しの受信に成功す
ると無線電話3が位置するセルに対応するセルラー基地
局2によってオーディオまたはデータチャンネルがセッ
トアップされ、このオーディオまたはデータチャンネル
を通して基地局2と無線電話3との間の通話が行われ
る。無線電話3は信号化チャンネルを通して制御または
タイミング情報を受信することも可能であり、この間、
通話が進行する。
【0026】 通話中に無線電話3がセルから離れ、別のセルに進入
した場合、無線電話は通話中を新しいセル内の利用可能
なオーディオまたはデータチャンネルへその通話をハン
ドオーバーする。同様に、通話が進行しない場合、無線
電話が新しいセルに関連する基地局2にログオンするよ
うに、信号チャンネルを通して制御メッセージが送られ
る。このように、広大な地理的エリアにわたって移動通
信が可能となる。
【0027】 セルラー通信システム1は更に、例えば無線電話3と
PSTN4との間の通信中に、または第1セルにおける無線
電話3と第2セル内の無線電話3との間の通信中にセル
ラー基地局2と公衆交換電話ネットワーク4との間の通
信を制御するターミナル5を含む。
【0028】 当然ながら、1つのセル内に位置する各無線電話3と
そのセルのセルラー基地局2との間の通信を確定するの
に双方向の無線通信サブシステムが必要である。かかる
双方向の無線通信システムは一般に、無線電話3とセル
ラー基地局2の双方にて(a)スピーチ信号を符号化
し、この符号化されたスピーチ信号をアンテナ例えば6
または7を通して送信するための送信機と、(b)同じ
アンテナ6または7を通して符号化され送信されたスピ
ーチ信号を受信し、符号化され受信されたスピーチ信号
を復号化するための受信機とを一般に含む。当業者には
周知のように、双方向無線通信システムを通して、すな
わち無線電話3と基地局2との間で、スピーチ信号を送
信するのに必要なバンド幅を狭くするのに、音声の符号
化が必要である。
【0029】 本発明の目的は、オーディオまたはデータチャンネル
を通してセルラー基地局2と無線電話3との間で、例え
ばスピーチ信号を双方向に送信するのに主観的な質とビ
ットレートとを良好に妥協させた効率的なデジタルスピ
ーチ符号化技術を提供することにある。図1は、このよ
うな効率的な技術を実行するのに適したデジタルスピー
チ符号化デバイスの略ブロック図である。図1のスピー
チ符号化デバイスは本発明に係わる振幅セレクタ112が
追加された米国の元の特許出願第07/927,528号の図1に
示されたものと同じ符号化デバイスとなっている。元の
米国特許出願第07/927,528号は、「代数学的符号に基づ
く効率的なスピーチの符号化をするためのダイナミック
符号帳」を発明の名称として1992年9月10日に出願され
たものである。
【0030】 アナログスピーチ信号は、サンプリングされ、ブロッ
ク処理される。本発明はスピーチ信号への応用のみに限
定されるものではないと理解すべきである。他のタイプ
のサウンド信号の符号化も行うことができる。
【0031】 図示した実施例では、サンプリングされた入力スピー
チSのブロック(図1)はL個の連続するサンプルから
成る。CELP文献では、Lはサブフレーム長さと表示され
ており、一般に20〜80の間である。更にL個のサンプル
のブロックはL次元のベクトルと称される。符号化方法
の際に種々のL次元のベクトルが発生される。図1およ
び2に示されるこれらベクトルのリストのみならず、送
信されるパワーメータのリストも下記に示す。
【0032】 主要L次元ベクトルのリスト S 入力スピーチベクトル R' ピッチ除去残留ベクトル X 目標ベクトル D 後方フィルタリングされたターゲットベクトル Ak 代数学的符号帳からのインデックスkの符号ベ
クトル Ck イノベーション(雑音源)ベクトル(フィルタ
リングされた符号ベクトル)
【0033】 送信されるパラメータのリスト k 符号ベクトルインデックス(代数学的符号帳の
入力) g 利得 STP (A(z)を定める)短期予測パラメータ LTP (ピッチ利得bおよびピッチ遅れTを定める)
長期予測パラメータ
【0034】 復号化の原理 まずデジタル入力信号(デマルチプレクサ205の入力
信号)とサンプリングされた出力スピーチ信号(合成フ
ィルタ204の出力信号)との間で実行される種々の工程
を示す、図2のスピーチ復号化デバイスを説明すること
が好ましいと考える。
【0035】 デマルチプレクサ205はデジタル入力チャンネルから
受信した二進情報より4つの異なるパラメータ、すなわ
ちインデックスkと、利得gと、短期予測パラメータST
Pと、長期予測パラメータLTPを抽出する。次の説明で述
べるように、これら4つのパラメータに基づき、スピー
チ信号の現在のL次元ベクトルSが合成される。
【0036】 図2のスピーチ復号化デバイスは代数学的符号発生器
201と適応化プリフィルタ202から成るダイナミック符号
帳208と、増幅器206と、加算器207と、長期予測器203
と、合成フィルタ204とを含む。
【0037】 第1ステップでは、代数学的符号発生器201はインデ
ックスkに応答して符号ベクトルAkを発生する。
【0038】 第2ステップでは、短期予想パラメータSTPおよび/
または長期予測パラメータLTPが供給される適応化プリ
フィルタ202により、符号ベクトルAkが処理され、出力
イノベーションベクトルCkが発生される。適応化プリフ
ィルタ202の目的はスピーチ信号の質を高めるよう、す
なわち人にとって耳障りな周波数によって生じる可聴ひ
ずみを低減するように、出力イノベーションベクトルCk
の周波数内容をダイナミックに制御することにある。適
応化プリフィルタ202の代表的な伝達関数F(z)は次
のように示される。
【0039】 Fa(z)は0<γ<γ<1を定数とするフォーマ
ントプリフィルタであり、このプリフィルタはフォーマ
ント領域を高め、特に5kbit/sより低い符号化レートで
極めて効果的に作動する。
【0040】 Fb(z)はTを時間可変ピッチ遅れとし、boを定数ま
たは現在または先のサブフレームからの量子化された長
期ピッチ予測パラメータに等しくしたピッチプリフィル
タである。Fb(z)はすべてのレートにおけるピッチ高
調波周波数を高めるのに極めて効果的であるので、F
(z)は一般に次のようなフォーマントプリフィルタと
組み合わされることが多いピッチプリフィルタを含む。 F(Z)=Fa(Z)Fb(Z)
【0041】 CELP技術によれば、増幅器206を通した利得gだけ符
号帳208からのイノベーションベクトルCkを最初にスケ
ーリングすることによって、サンプリングされた出力ス
ピーチ信号 を得る。次に加算器207は、フィードバックループ内に
設けられ、次のように定義された伝達関数B(z)を有
するLTPパラメータが供給された長期予測器203の出力E
(合成フィルタ204の信号励振長期予測成分)へスケー
リングされた波形gCkを加算する。 B(Z)=bz-T
【0042】 ここで、bおよびTはそれぞれ上記のように定義され
たピッチ利得および遅延である。
【0043】 予測器203はスピーチのピッチ周期性をモデル化する
よう、最後に受信されたLTPパラメータbおよびTに従
ったデンタル関数を有するフィルタである。この予測器
203はサンプルの適当なピッチ利得bおよび遅延時間T
を導入する、復号信号E+gCkは伝達関数1/A(z)(A
(z)は次の説明で定義する)を有する合成フィルタ20
4の信号励振を構成する。フィルタ204は最後に受信され
たSTPパラメータに従って正しいスペクトル整形を行
う。より詳細にはフィルタ204はスピーチの共振周波数
(フォーマント)をモデル化する。出力ブロック はサンプリングされ合成されたスピーチ信号であり、こ
のスピーチ信号は当業者に周知の技術に従って適当なエ
リアシング防止フィルタリングによりアナログ信号に変
換できる。
【0044】 代数学的符号発生器201を設計するには多数の方法が
ある。上記米国特許出願第07/927,528号に開示された、
利点の多い方法は、少なくとも1つのN回インターリー
ブされた単一パルス順列符号を使用することから成る。
【0045】 このような概念は、簡単な代数学的符号発生器201に
よって示される。本例ではL=40であり、40次元符号ベ
クトルの組は と称すN=5個の非ゼロ振幅パルスしか含まない。この
ようなより完全な表記方法では、pはサブフレーム内の
i番目のパルスの位置を表す(すなわちpiは0〜L−1
の範囲となる)。
【0046】 パルス は次のような8つの可能な位置p1に限定されているもの
と仮定する。すなわち p=0、5、10、15、20、25、30、35=0+8m1; m1=0、1・・・・7。
【0047】 トラック#1と称すことができるこれら8つの位置内
では、 と7つのゼロ振幅パルスは自由な順列にできる。これは
単一パルス順列符号である。次に、同じように残りのパ
ルスの位置を制限することにより(すなわちトラック#
2、トラック#4およびトラック#5を制限することに
よって、かかる5つの単一パルス順列符号をインターリ
ーブすることとする。
【0048】 p1=0,5,10,15,20,25,30,35=0+8m1 p2=1,6,11,16,21,26,31,36=1+8m2 p3=2,7,12,17,22,27,32,37=2+8m3 p4=3,8,13,18,23,28,33,38=3+8m4 p5=4,9,14,19,24,29,34,39=4+8m5
【0049】 ここで整数mi=0、1、・・・・7は各パルス の位置piを完全に定義していることに留意されたい。し
たがって、次の式を使用してmiをストレートフォワード
に多重化することによって、簡単な位置インデックスkp
を発生できる。
【0050】 kp=4096m1+512m2+64m3+8m4+m5 上記パルストラックを使用することにより他の符号帳
を発生できることを指摘したい。例えば最初の3つのパ
ルスが最初の3つのトラックの位置をそれぞれ占め、一
方、第4パルスがトラックを指定するために1ビットで
第4トラックまたは第5トラックのいずれかを占める場
合、4つのパルスしか使用できない。このようなデザイ
ンによって13ビットポジションの符号帳が生じる。
【0051】 従来技術では、符号ベクトルサーチが複雑であるとい
う理由から、すべての実際の目的のために非ゼロ振幅パ
ルスは固定した振幅をとっていた。パルス が可能なq個の振幅のうちの1つをとり得る場合、サー
チではqN個もの多くのパルス振幅の組み合わせを検討し
なければならない。例えば第1実施例の5つのパルスが
固定された振幅の代わりにq=4個の可能な振幅、例え
−1、+2、−2のうちの1つをとり得ることが認めら
れる場合、代数学的符号帳のサイズは15ビットから15+
(5×2)ビット=25ビットまでジャンプする。すなわ
ちサーチは1000倍複雑となる。
【0052】 本発明の目的は、高額な費用を支払うことなく、q個
の振幅のパルスで極めて良好な性能を達成できるという
驚くべき事実を開示することにある。この解決案は、サ
ーチを符号ベクトルの限られたサブセットに限定するこ
とにある。のちの説明に述べるように、符号ベクトルを
選択する方法は入力スピーチ信号に関連する。
【0053】 本発明の実際の利点は、符号ベクトルのサーチの複雑
さを増すことなく、個々のパルスが異なる可能な振幅を
とり得ることができるようにすることにより、ダイナミ
ック代数学的符号帳208のサイズを増加できることにあ
る。
【0054】 符号化の原理 102〜112の番号の付いた11個のモジュールに分解され
た図1の符号化システムにより、ブロックごとにサンプ
リングされたスピーチ信号Sを符号化する。これらモジ
ュールのほとんどの機能および作動は、元の米国特許出
願第07/927,528号の説明と変わっていない。従って、次
の説明は、各モジュールの機能および作動を少なくとも
簡単に説明するものであるが、元の米国特許出願第07/9
27,528号の開示に関連した新規事項について説明を集中
する。
【0055】 LPCスペクトルアナライザ102を使って従来技術によ
り、スピーチ信号のL個のサンプルの各ブロックに対し
ては、短期予測(STP)パラメータと称される線形予測
コーディング(LPC)パラメータの一組を発生する。よ
り詳細には、アナライザ102はL個のサンプルの各ブロ
ックSのスペクトル特性をモデル化するものである。
【0056】 STPパラメータの現在値に基づく次の伝達関数を有す
る白色化フィルタ103により、L個のサンプルの入力ブ
ロックSを白色化する。
【0057】 ここで、ao=1であり、zはいわゆるz変換の通常の
変数である。図1に示すように、白色化フィルタ103は
残留ベクトルRを発生する。 LTPパラメータ、すなわちピッチ遅れTおよびピッチ
利得gを計算し、量子化するのに、ピッチ抽出器104が
使用される。この抽出器104の初期状態は初期状態抽出
器110からの値FSにもセットされる。元の米国特許出願
第07/927,528号にはLTPパラメータを計算し、量子化す
るための詳細な手順が記載されており、この方法は当業
者に周知であると考えられるので、本明細書ではこれ以
上説明しないこととする。
【0058】 後のステップで使用するためのフィルタ応答特性FRC
を計算するためにフィルタ応答特性化器105(図1)にS
TPおよびLTPパラメータが供給される。このFRC情報はつ
ぎの3つの成分(ここでn=1、2、・・・・Lから成
る)。 ・f(n):F(z)の応答 F(z)は一般にピッチプリフィルタを含むことに留
意されたい。 ここでγは知覚的ファクターである。より一般的には
h(n)はプリフィルタF(z)と、知覚的重み付けフ
ィルタW(z)と、合成フィルタ1/A(z)とのカスケ
ードであるF(z)W(z)/A(z)のインパルス応答
である。ここで、F(z)および1/A(z)は図2の復
号器で使用されているのと同じフィルタである。
【0059】 ・U(i、j):つぎの式に従ったh(n)の自動相関
化:
【0060】 長期予測器106には適当なピッチ遅れTおよび利得B
を使用して新しいE成分を形成するために、過去の励振
信号(先のサブフレームのE+gCk)が供給される。
【0061】 知覚的フィルタ107の初期状態は初期状態抽出器110か
ら供給される値FSにセットされる。減算器121(図1)
によって計算されるピッチの除かれた残留ベクトルR'=
R−Eが知覚的フィルタ107に供給され、後方のフィル
タの出力で目標ベクトルXが得られる。図1に示される
ように、フィルタ107にSTPパラメータが印加され、これ
らパラメータに関してその伝達関数を変える。基本的に
はX=R'−P(ここでPは過去の励振からの呼び出し音
を含む長期予測パラメータ(LTP)の寄与分を表示す
る)である。次のマトリックス表示でΔに適用されるMS
E基準について説明できる。
【0062】
【0063】 ここで、Hは次のようなh(n)から形成されるL×
Lのより低い三角テプリッツマトリックスである。h
(0)なる項はマトリックスの対角線を占め、h
(1)、h(2)、・・・・h(L−1)はそれぞれの
低い対角線を占める。 図1のフィルタ108により後方へのフィルタリングス
テップが実行される。利得gに関し、上記式の誘導値を
0にセットすると、次のような最適利得が生じる。
【0064】 gに対するこのような値を用いると、最小化は次のよ
うになる。
【0065】 この目的は、最小化を達成する特定のインデックスk
を探すことである。‖X‖は固定された値であるの
で、次の値を最大にすることにより同じインデックスを
見つけ出すことができる。
【0066】 ここで、D=(XH)であり、 である。 後方フィルタ108では後方にフィルタリングされた目
標ベクトルD=(XH)が計算される。この演算のための
後方フィルタリングの項は時間反転されたXのフィルタ
リングとして(XH)を解釈することから得られる。
【0067】 上記元の米国特許出願第07/927,528号の図1には、振
幅セレクタ112しか加えられていない。この振幅セレク
タ112の機能は最適化コントローラ109によってサーチさ
れる符号ベクトルAkを最も見込みのある符号ベクトルAk
に保留し、符号ベクトルサーチの複雑さを低減すること
にある。これまでの説明で述べたように、各符号ベクト
ルAkはパルス振幅と位置との組み合わせ波形であり、こ
の波形はL個の異なる位置pを構成し、ゼロ振幅パルス
とこれら組み合わせのそれぞれの位置P=1、2、・・
・・Lに割り当てられた非ゼロ振幅パルスの双方を含
み、ここで各非ゼロ振幅パルスはq個の異なる可能な振
幅のうちの少なくとも1つをとる。
【0068】 次に図3a、3bおよび3cを参照する。この振幅セレクタ
112の目的は符号ベクトル波形の位置pとパルス振幅の
q個の可能な値の間の関数Spを予め確定することにあ
る。符号帳サーチに先立ち、スピーチ信号に関する予め
確定された関数Spが発生される。より詳細には、この関
数を予め設定するにはスピーチ信号に関連し、波形の各
位置pにqの可能な振幅のうちの少なくとも1つを予め
割り当てることから成る(図3aのうちの工程301)。
【0069】 波形の各位置pに対しq個の振幅のうちの1つを予め
割り当てるには、後方フィルタリングされた目標ベクト
ルDおよびピッチ除去残留ベクトルR'に応答して、振幅
予測ベクトルBを計算する。より詳細には、振幅予測ベ
クトルBは次のような正規化されたフォームの後方フィ
ルタリングされた目標ベクトルD および正規化されたフォームのピッチ除去残留ベクトル
R'
【0070】 を加算(図3bのサブステップ301−1)し、次のフォー
ムの振幅予測ベクトルB を得るように計算される。ここでβは1/2の代表的な値
を有する固定された定数である(βの値は代数学的符号
で使用される非ゼロ振幅パルスのパーセントに応じて0
と1との間に選択される)。
【0071】 波形の各位置bに対してはベクトルBの対応する振幅
予測値Bpを量子化することによってその位置pに予め割
り当てるべき振幅Spが得られる。より詳細には、波形の
各位置pに対して次の式を使ってベクトルBのピーク値
が正規化された振幅予測値Bpが量子化される(図3bのサ
ブステップ301−2)。 ここで、Q(.)は量子化関数であり、
【0072】 は非ゼロ振幅パルスのピーク振幅を表示する正規化フ
ァクタである。 q=2であり、すなわちパルスの振幅が2つの値だけ
しかとることができず 非ゼロ振幅パルスの密度N/Lが15%以下である重要な
特殊なケースでは、 βの値を0に等しくすることができ、振幅予測ベクト
ルBは単に後方フィルタリングされた目標ベクトルDに
減少し、よって Sp=sign(Dp) となる。
【0073】 最適化コントローラ109の目的は代数学的符号帳から
最良の符号ベクトルAkを選択することにある。選択基準
は各符号ベクトルAkに対して計算され、すべての符号ベ
クトルにわたって最大とすべき比として示される(ステ
ップ303)。
【0074】 ここで、D=(XH)であり、 である。 Akはそれぞれの振幅 のN個の非ゼロ振幅パルスを有する代数学的符号ベクト
ルであり、ニューメレータは の平方であり、デノミネータは次のように表記できるエ
ネルギー項である。
【0075】 ここで、U(pi、pj)は2つの単位振幅パルス(1つ
は位置piにおけるパルスであり、他方のパルスは位置pj
におけるパルスである)に関連した相関性である。この
マトリックスはフィルタ応答特性化器105において上記
式に従って計算され、図1のブロック図内のFRCと称さ
れるパラメータの組内に含められる。
【0076】 このデノミネータを計算するための高速方法(ステッ
プ304)はそれぞれの値 の変わりにトリムライン状の表記法S(i)およびSS
(i、j)を使用する、図4に示されたN個のネスト状
のループを使用する。デノミネータ αk 2 の計算は最も時間のかかるプロセスである。図4の各ル
ープで実行される αk 2 に寄与する計算式は次のように最も外側のループから最
も内側のループへの別個のラインで書き表すことができ
る。
【0077】
【0078】 ここで、piはi番目の非ゼロ振幅パルスの位置であ
る。図4のN個のネスト状のループによってN個のイン
ターリーブされる単一パルス順列符号に従い、符号ベク
トルAkの非ゼロ振幅パルスを制限することが可能となる
ことに留意されたい。
【0079】 本発明では、図3aのステップ301で予め確定された関
数にN個の非ゼロ振幅パルスが従うようになっている符
号ベクトルに、サーチすべき符号ベクトルAkのサブセッ
トを制限することにより、サーチの複雑さを劇的に低減
できる。符号ベクトルAkのN個の非ゼロ振幅パルスの各
々が、非ゼロ振幅パルスの位置pに予め割り当てられた
振幅に等しい振幅を有する際、予め確定された関数に従
う。
【0080】 最初に予め確定された関数SpとマトリックスU(i、
j)のエントリーとを組み合わせ(図3aのステップ30
2)、次に、単位振幅の固定され、正とされたすべての
パルスS(i)と共に図4のN個のネスト状のループを
使用することにより、符号ベクトルのサブセットの上記
制限を実行する。従って、非ゼロパルスの振幅が代数学
的符号帳内のq個の可能な値のいずれかをとり得る場合
でも、サーチの複雑さは固定されたパルス振幅の場合ま
で低減される(ステップ303)。より正確には、フィル
タ応答特性化器105によって供給されるマトリックスU
(i、j)は、次の関係式に従い予め確定された関数と
組み合されるステップ302)。
【0081】 U′(i,j)=SiSjU(i,j) ここでSiは振幅セレクタ112の選択方法から得られ
る。すなわちSjは対応する振幅予測値の量子化後、個々
の位置iに対して選択された振幅である。 このような新しいマトリックスを用いると、次のよう
に最も外側のループから最もも内側のループへの別個の
ラインに高速アルゴリズムの各ループの計算式を書くこ
とができる。
【0082】
【0083】 ここでpxは波形のx番目の非ゼロ振幅パルスの位置で
あり、U'(px、py)は、位置pにおける位置pxに対して
予め割り当てられた振幅 および位置pにおける位置pyに予め割り当てられた振幅 に従属した関数である。 更にサーチの複雑さを低減するには、特に次の不等式
が真となる最も内側のループ(このループのみに限定さ
れるだけではない)をスキップできる(図3cを参照)。
【0084】 ここで は位置pnに予め割り当てられた振幅であり、 は目標ベクトルDのpn番目の成分であり、TDは後方フィ
ルタリングされた目標ベクトルDに関連したスレッショ
ルドである。
【0085】 グローバル信号励振信号E+gCkはコントローラ109か
らの信号gCkおよび予測器106からの出力Eから加算器12
0(図1)によって計算される。STPパラメータに関し、
変化する伝達関数1/A(zγ-1)を備えた知覚的フィル
タによって構成された初期状態抽出器モジュール110
は、フィルタ107およびピッチ抽出器104における初期ス
テートとして使用するための最終フィルタステートFSを
得るためのみの目的で、残留信号Rから信号励振信号E
+gCkを減算する。
【0086】 マルチプレクサ111により4つのパラメータk、g、L
TPおよびSTPの組が適当なデジタルチャンネルフォーマ
ットに変換され、スピーチ信号のサンプルのブロックS
を符号化するための方法が完了する。
【0087】 本発明の好ましい実施例を参照して、以下で本発明に
ついて説明したが、本発明の要旨から逸脱することな
く、添付した請求の範囲内においてこれら実施例を意図
的に変更できることは当然である。 [図面の簡単な説明]
【図1】 本発明に係わる振幅セレクタと最適化コントローラと
を含むサウンド信号符号化装置の略ブロック図である。
【図2】 図1の符号化装置に関連した復号化装置の略ブロック
図である。
【図3a】 信号選択されたパルス振幅に基づく、本発明による高
速符号帳サーチのための基本演算のためのシーケンスで
ある。
【図3b】 パルス振幅と位置との組み合わせの各位置pにq個の
振幅のうちの1つを予め割り当てるための演算のシーケ
ンスである。
【図3c】 ニューメレータ DAk T に対する第1のN−1個のパルスの寄与分が不充分であ
ると見なされるときにいつも最も内側のループをスキッ
プするN個の埋め込みループサーチで行われる演算のシ
ーケンスである。
【図4】 符号帳サーチで使用されるN個のネスト状のループの
略図である。
【図5】 代表的なセルラー通信システムのインフラストラクチ
ャを示す略ブロック図である。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 ラフランム,クロード カナダ国 ジェイ1ジェイ 2エス8 ケベック,シャーブルック,フェアウェ ル 390 (56)参考文献 特開 平6−195098(JP,A) 特開 平5−232996(JP,A) 特開 平4−75100(JP,A) 特開 平6−274199(JP,A) 特許3160852(JP,B2) 国際公開91/13432(WO,A1) (58)調査した分野(Int.Cl.7,DB名) G10L 19/10

Claims (22)

    (57)【特許請求の範囲】
  1. 【請求項1】サウンド信号(S)の符号化中に前記サウ
    ンド信号(S)から符号化に関連した信号(R',D)を抽
    出し、 符号帳がパルスの振幅/位置の組み合わせ(Ak)のセッ
    トから成り、 各パルスの振幅/位置の組み合わせ(Ak)がL個の異な
    る位置(P)を定義し、パルスの組み合わせ(Ak)のそ
    れぞれの位置p=1、2、・・・・Lに割り当てられた
    ゼロ振幅および非ゼロ振幅パルス(Sp1,Sp2,Sp3,Sp4,S
    p5)の双方を含み、 各非ゼロ振幅パルス(Sp1,Sp2,Sp3,Sp4,Sp5)がq個の
    可能な振幅(Spi=+1、−1、+2、−2)のうちの
    少なくとも1つをとるようになっており、サウンド信号
    (S)の符号化に関連し前記符号帳においてサーチを実
    行する方法であって、 前記符号帳サーチ実行方法が 各トラックのパルス位置が他のトラックのパルス位置
    (p1,p2,p3,p4およびp5)とインターリーブされてい
    る、パルス位置のトラックのセット(トラック#1,トラ
    ック#2,トラック#3,トラック#4及びトラック#5)
    に従って符号帳のうちの組み合わせ(Ak)の非ゼロ振幅
    パルス(Sp1,Sp2,Sp3,Sp4,Sp5)の位置pを制限する工
    程(303−1)と、 前記符号化に関連した信号の一部(R',D)に関連し、パ
    ルスの振幅/位置の組み合わせ(Ak)のサブセットを前
    記符号帳から予め選択する工程(301,302)と、 サウンド信号(S)を符号化するのに最適なパルスの振
    幅/位置の組み合わせを見付けるために、パルスの振幅
    /位置の組み合わせの前記サブセットのみをサーチする
    工程(303)とを備え、よって符号帳のパルスの振幅/
    位置の組み合わせ(Ak)のサブセットのみをサーチしな
    がら、サーチの複雑性を低減し、 予め選択する前記工程(301,302)が位置p=1、2、
    ・・・・Lにq個の可能な振幅(Spi=+1、−1、+
    2、−2)のうちの有効な振幅を予め割り当てる関数
    (Sp)を符号化に関連する信号の前記部分(R'、D)に
    関連して予め確定(301−1,301−2)し、前記サーチ工
    程(303)が予め確定された関数(Sp)で各々が予め確
    定されたのと同じ振幅を前記非ゼロ振幅パルスの位置p
    に有する非ゼロ振幅のパルス(Sp1,Sp2,Sp3,Sp4,Sp5
    を有する前記符号帳のパルス振幅/位置の組み合わせ
    (Ak)のみをサーチすることを含む、サウンド信号の符
    号化に関連して符号帳においてサーチを実行する方法。
  2. 【請求項2】関数を予め確定する前記工程が前記予め確
    定した関数(Sp)によりq個の可能な振幅(Spi=+
    1、−1、+2、−2)のうちの1つを各位置pに有効
    な振幅として予め割り当てる工程(301−1、301−2)
    を含む請求項1記載の方法。
  3. 【請求項3】前記サウンド信号(S)の符号化中にサウ
    ンド信号(S)から抽出された符号化に関連する信号の
    前記部分(R',D)が、後方フィルタリングされた目標信
    号Dとピッチ除去された残留信号R'とを含み、各位置p
    にq個の可能な振幅のうちの1つを予め割り当てる工程
    が、 後方フィルタリングされた目標信号Dおよびピッチ除去
    された残留信号R'に応答して振幅予測ベクトルBを計算
    する工程(301−1)と、 前記位置pの各々に対し前記ベクトルBの振幅予測値Bp
    を量子化(301−2)し、前記位置pに対し選択すべき
    振幅を得る工程とを備えた、請求項2記載の方法。
  4. 【請求項4】振幅予測ベクトルBを計算する工程が、 次の正規化されたフォームの後方フィルタリングされた
    目標信号D を次の正規化されたフォームのピッチ除去された残留信
    号R' に加算(301−1)し、次のフォーム (ここでβは固定された定数である)の振幅予測ベクト
    ルBを得る工程を含む、請求項3記載の方法。
  5. 【請求項5】βが0と1との間にある値を有する固定さ
    れた定数である、請求項4記載の方法。
  6. 【請求項6】前記位置pの各々に対し量子化する前記工
    程が、次の式 (ここでデノミネータ は非ゼロ振幅パルスのピーク振幅を表示する正規化ファ
    クタである)を使って前記ベクトルBのピーク値が正規
    化された振幅の予測値Bpを量子化することを含む、請求
    項3に記載の方法。
  7. 【請求項7】前記パルスの組み合わせ(Ak)の各々がN
    個の非ゼロ振幅パルス(Sp1,Sp2,Sp3,Sp4,Sp5)を含
    み、 トラックのセットがN個の非ゼロ振幅パルス(Sp1,Sp2,
    Sp3,Sp4,Sp5)にそれぞれ関連したN個のトラック(ト
    ラック#1,トラック#2,トラック#3,トラック#4及び
    トラック#5)のパルス位置を含み、 各トラック(トラック#1,トラック#2,トラック#3,ト
    ラック#4及びトラック#5)のパルス位置がN−1個
    の他のトラックのパルス位置(p1,p2,p3,p4およびp5)
    とインターリーブされており、 前記制限する工程が各非ゼロ振幅パルス(Sp1,Sp2,S3p,
    Sp4,Sp5)のパルス位置を関連するトラックの位置に制
    限する(303−1)ことを含む、請求項1に記載の方
    法。
  8. 【請求項8】前記パルス振幅/位置の組み合わせ(Ak
    の各々がN個の非ゼロ振幅パルス(Sp1,Sp2,Sp3,Sp4,S
    p5)を含み、前記サーチ工程(303)が次の式にしたが
    って、 (ここで、各ループのための計算式はN個のネスト状の
    ループのうちの最も外側のループから最も内側のループ
    へ別個のラインで表示され、pnは組み合わせのn番目の
    非ゼロ振幅パルスの位置であり、U'(px、py)が位置p
    のうちの位置pxに予め割り当てられた振幅 および位置pのうちの位置pyに予め割り当てられた振幅 に従属した関数である)に従って、N個のネスト状のル
    ープにより計算されたデノミネータ αk 2 を有する所定の比を最大にする工程を含む、請求項1に
    記載の方法。
  9. 【請求項9】前記所定の比を最大にする工程が、 次の不等式 (ここで、 は位置pnに予め割り当てられた振幅であり、 は目標ベクトルDのpn番目の成分であり、TDは後方フィ
    ルタリングされた目標ベクトルDに関連したスレッショ
    ルドである)が真である時に、N個のネスト状のループ
    の少なくとも最も内側のループをスキップする工程(30
    3−2)を含む、請求項8記載の方法。
  10. 【請求項10】サウンド信号(S)の符号化中に前記サ
    ウンド信号(S)から符号化に関連した信号(R'、D)
    を抽出し、 符号帳がパルスの振幅/位置の組み合わせ(Ak)のセッ
    トから成り、 各パルスの振幅/位置の組み合わせがL個の異なる位置
    (p)を定義し、パルスの組み合わせのそれぞれの位置
    p=1、2、・・・・Lに割り当てられたゼロ振幅およ
    び非ゼロ振幅パルス(Sp1,Sp2,Sp3,Sp4,Sp5)の双方を
    含み、 各非ゼロ振幅パルス(Sp1,Sp2,Sp3,S4p,Sp5)がq個の
    可能な振幅(Spi=+1、−1、+2、−2)のうちの
    少なくともひとつをとるようになっており、 サウンド信号の符号化に関連し前記符号帳においてサー
    チを実行する装置であって、 前記符号帳サーチ実行装置が 各トラックのパルス位置が他のトラックのパルス位置
    (p1、p2、p3、p4およびp5)とインターリーブされてい
    る、パルス位置のトラック(トラック#1,トラック#2,
    トラック#3,トラック#4及びトラック#5)のセット
    に従って符号帳のうちの組み合わせ(Ak)の非ゼロ振幅
    パルス(Sp1,S2p,Sp3,Sp4,Sp5)の位置pを制限(303−
    1)する手段と、 前記符号化に関連した信号の一部(R'、D)に関連し、
    パルスの振幅/位置の組み合わせ(Ak)のサブセットを
    前記符号帳から予め選択する手段(301,302)と、 サウンド信号を符号化するのに最適なパルスの振幅/位
    置の組み合わせを見つけ、パルスの振幅/位置の組み合
    わせの前記サブセットのみをサーチする手段(303)と
    を備え、よって符号帳のパルスの振幅/位置の組み合わ
    せのサブセットのみをサーチしながら、サーチの複雑性
    を低減し、 予め選択する前記手段(301,302)が位置p=1、2、
    ・・・・Lにq個の可能な振幅(Spi=+1、−1、+
    2、−2)のうちの有効な振幅を予め割り当てる関数
    (Sp)を符号化に関連する信号の前記部分(R'、D)に
    関連して予め確定する手段(301−1、301−2)を有
    し、前記サーチ手段が予め確保された関数(Sp)で各々
    が予め確定されたのと同じ振幅を前記非ゼロ振幅パルス
    の位置pに有する非ゼロ振幅のパルス(Sp1,Sp2,Sp3,S
    p4,Sp5)を有する前記符号帳のパルス振幅/位置の組み
    合わせ(Ak)にサーチを限定することを含む、サウンド
    信号の符号化に関連して符号帳においてサーチを実行す
    る装置。
  11. 【請求項11】関数を予め確定する手段が予め確定され
    た関数(Sp)によって、q個の可能な振幅(Spi=+
    1、−1、+2、−2)のうちの1つを有効振幅として
    各位置pに予め割り当てる(301−1、301−2)ための
    手段を備えたことを特徴とする請求項10記載の装置。
  12. 【請求項12】前記サウンド信号(S)の符号化中にサ
    ウンド信号(S)から抽出された符号化に関連する信号
    の前記部分(R'、D)が、後方フィルタリングされた目
    標信号Dとピッチ除去された残留信号R'とを含み、各位
    置pにq個の可能な振幅のうちの1つを予め割り当てる
    ための手段が、 後方フィルタリングされた目標信号Dおよびピッチ除去
    された残留信号R'に応答して振幅予測ベクトルBを計算
    するための手段(301−1)と、 前記位置pの各々に対し前記ベクトルBの振幅予測値Bp
    を量子化し(301−2)、前記位置pに対し選択すべき
    振幅を得るための手段とを備えた、請求項11記載の装
    置。
  13. 【請求項13】振幅予測ベクトルBを計算するための手
    段が、 次の正規化されたフォームの後方フィルタリングされた
    目標信号D を次の正規化されたフォームのピッチ除去された残留信
    号R' に加算し(301−1)、次のフォーム (ここでβは固定された定数である)の振幅予測ベクト
    ルB を得るための手段を含む、請求項12記載の装置。
  14. 【請求項14】βが0と1との間にある値を有する固定
    された定数である、請求項13記載の装置。
  15. 【請求項15】前記量子化手段(301−2)が、前記位
    置pの各々に対し、次の式 (ここでデノミネータ は非ゼロ振幅パルスのピーク振幅を表示する正規化ファ
    クタである)を使用して前記ベクトルBのピーク値が正
    規化された振幅の予測値Bpを量子化するための手段を含
    む、請求項12に記載の装置。
  16. 【請求項16】前記パルスの組み合わせ(Ak)の各々が
    N個の非ゼロ振幅パルス(Sp1,Sp2,Sp3,Sp4,Sp5)を含
    み、 トラックのセットがN個の非ゼロ振幅パルスにそれぞれ
    関連したN個のトラックのパルス位置(トラック#1,ト
    ラック#2,トラック#3,トラック#4及びトラック#
    5)を含み、 各トラックのパルス位置がN−1個の他のトラックのパ
    ルス位置(p1、p2、p3、p4およびp5)とインターリーブ
    されており、 前記制限する手段(303−1)が各非ゼロ振幅パルス(S
    p1,Sp2,Sp3,Sp4,Sp5)のパルス位置を関連するトラック
    の位置に制限することを含む、請求項10に記載の装置。
  17. 【請求項17】前記パルス振幅/位置の組み合わせの各
    々がN個の非ゼロ振幅パルス(Sp1,Sp2,Sp3,Sp4,Sp5
    を含み、サーチ手段(303)がデノミネータ αk 2 を有する所定の比を最大にするための手段(303−4)
    と、次の式 (ここで、各ループのための計算式はN個のネスト状の
    ループのうちの最も外側のループから最も内側のループ
    へ別個のラインで表示され、pnは組み合わせのn番目の
    非ゼロ振幅パルスの位置であり、U'(px、py)は位置p
    のうちの位置pxに予め割り当てられた振幅 および位置pのうちの位置pyに予め割り当てられた振幅 に従属した関数である)に従って、N個のネスト状のル
    ープにより前記デノミネータ を計算するための手段とを含む、請求項10に記載の装
    置。
  18. 【請求項18】デノミネータ αk 2 を計算するための前記手段が、次の不等式 (ここで、 は位置pnに予め割り当てられた振幅であり、 は目標ベクトルDのpn番目の成分であり、TDは後方フィ
    ルタリングされた目標ベクトルDに関連したスレッショ
    ルドである)が真である時に、N個のネスト状のループ
    の少なくとも最も内側のループをスキップするための手
    段(303−2)を含む、請求項17記載の装置。
  19. 【請求項19】複数のセルに分割された広大な地理的エ
    リアにサービスを行うためのセルラー通信システムにお
    いて、 モービル携帯送信/受信ユニット(3)と、 前記セル内にそれぞれ設置されたセルラー基地局(2)
    と、 セルラー基地局(2)の間の通信を制御するための手段
    (5)と、 1つのセル内に設置された各モービルユニット(3)と
    前記1つのセルのセルラー基地局(2)との間で双方向
    に無線通信するサブシステムとを備え、該双方向無線通
    信サブシステムが、モービルユニット(3)およびセル
    ラー基地局(2)の双方において、(a)スピーチ信号
    を符号化するための手段および符号化されたスピーチ信
    号を送信するための手段とを含む送信機と、(b)符号
    化され送信されたスピーチ信号を受信するための手段お
    よび符号化され受信されたスピーチ信号を受信するため
    の手段を含む受信機とを備え、 前記スピーチ信号符号化手段がピーチ信号に応答し、ス
    ピーチ信号符号化パラメータ(k、g,LTP,STP)の発生
    するための手段(102,103,104,105,106,107,108,109,11
    0,112,121)を含み、該スピーチ手段符号化パラメータ
    発生手段が前記スピーチ手段符号化パラメータのうちの
    少なくとも1つ(k)を発生するよう、符号帳にてサー
    チを実行するための、請求項10〜18のいずれかに記載の
    装置(109)を含み、前記スピーチ信号(S)が前記サ
    ウンド信号を構成するセルラー通信システム。
  20. 【請求項20】(a)スピーチ信号を符号化するための
    手段および符号化されたスピーチ信号を送信するための
    手段を含む送信機と、(b)符号化され、送信されたス
    ピーチ信号を受信するための手段および符号化され、受
    信されたスピーチ信号を復号化するための手段を備えた
    受信機とを含む、セルラーネットワーク要素(2)であ
    って、 前記スピーチ信号符号化手段がスピーチ信号に応答し、
    スピーチ信号符号化パラメータ(k、g、LTP,STP)を
    発生するための手段(102,103,104,105,106,107,108,10
    9,110,112,121)を含み、該スピーチ手段符号化パラメ
    ータ発生手段が前記スピーチ手段符号化パラメータのう
    ちの少なくとも1つ(k)を発生するよう、符号帳にて
    サーチを実行するための、請求項10〜18のいずれかに記
    載の装置(109)を含み、前記スピーチ信号(S)が前
    記サウンド信号を構成するセルラーネットワーク要素
    (2)。
  21. 【請求項21】(a)スピーチ信号を符号化するための
    手段および符号化されたスピーチ信号を送信するための
    手段を含む送信機と、(b)符号化され、送信されたス
    ピーチ信号を受信するための手段および符号化され、受
    信されたスピーチ信号を復号化するための手段を備えた
    受信機とを含む、セルラーモービル送信/受信ユニット
    (3)であって、 前記スピーチ信号符号化手段がスピーチ信号に応答し、
    スピーチ信号符号化パラメータ(k、g、LTP,STP)を
    発生するための手段(102,103,104,105,106,107,108,10
    9,110,112,121)を含み、該スピーチ手段符号化パラメ
    ータ発生手段が前記スピーチ手段符号化パラメータのう
    ちの少なくとも1つ(k)を発生するよう、符号帳にて
    サーチを実行するための、請求項10〜18のいずれかに記
    載の装置(109)を含み、前記スピーチ信号(S)が前
    記サウンド信号を構成するセルラーモービル送信/受信
    ユニット(3)。
  22. 【請求項22】モービル送信/受信ユニット(3)と、
    複数のセル内に位置するセルラー基地局(2)と、該セ
    ルラー基地局(2)の間の通信を制御するための手段
    (5)とを備え、複数のセルに分割された広い地理的エ
    リアにサービスするためのセルラー通信システムにおい
    て、 1つのセル内に設置された各モービルユニット(3)と
    前記1つのセルのセルラー基地局(2)との間で双方向
    に無線通信するサブシステムとを備え、該双方向無線通
    信サブシステムが、モービルユニット(3)およびセル
    ラー基地局(2)の双方において、(a)スピーチ信号
    を符号化するための手段および符号化されたスピーチ信
    号を送信するための手段とを含む送信機と、(b)符号
    化され送信されたスピーチ信号を受信するための手段お
    よび符号化され受信されたスピーチ信号を受信するため
    の手段を含む受信機とを備え、 前記スピーチ信号符号化手段がスピーチ信号に応答し、
    スピーチ信号符号化パラメータ(k、g、LTP,STP)を
    発生するための手段(102,103,104,105,106,107,108,10
    9,110,112,121)を含み、該スピーチ手段符号化パラメ
    ータ発生手段が前記スピーチ手段符号化パラメータのう
    ちの少なくとも1つ(k)を発生するよう、符号帳にて
    サーチを実行するための、請求項10〜18のいずれかに記
    載の装置を含み、前記スピーチ信号(S)が前記サウン
    ド信号を構成するセルラー通信システム。
JP52385296A 1995-02-06 1996-02-02 スピーチ信号を高速符号化するための信号選択されたパルス振幅を備えた代数学的符号帳 Expired - Lifetime JP3430175B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US38396895A 1995-02-06 1995-02-06
US08/383,968 1995-02-06
US08/508,801 1995-07-28
US08/508,801 US5754976A (en) 1990-02-23 1995-07-28 Algebraic codebook with signal-selected pulse amplitude/position combinations for fast coding of speech
PCT/CA1996/000069 WO1996024925A1 (en) 1995-02-06 1996-02-02 Algebraic codebook with signal-selected pulse amplitudes for fast coding of speech

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2003085959A Division JP4187556B2 (ja) 1995-02-06 2003-03-26 スピーチ信号を高速符号化するための信号選択されたパルス振幅を備えた代数学的符号帳

Publications (2)

Publication Number Publication Date
JPH10513571A JPH10513571A (ja) 1998-12-22
JP3430175B2 true JP3430175B2 (ja) 2003-07-28

Family

ID=27010408

Family Applications (2)

Application Number Title Priority Date Filing Date
JP52385296A Expired - Lifetime JP3430175B2 (ja) 1995-02-06 1996-02-02 スピーチ信号を高速符号化するための信号選択されたパルス振幅を備えた代数学的符号帳
JP2003085959A Expired - Lifetime JP4187556B2 (ja) 1995-02-06 2003-03-26 スピーチ信号を高速符号化するための信号選択されたパルス振幅を備えた代数学的符号帳

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2003085959A Expired - Lifetime JP4187556B2 (ja) 1995-02-06 2003-03-26 スピーチ信号を高速符号化するための信号選択されたパルス振幅を備えた代数学的符号帳

Country Status (26)

Country Link
US (1) US5754976A (ja)
EP (2) EP1225568B1 (ja)
JP (2) JP3430175B2 (ja)
KR (2) KR100388751B1 (ja)
CN (2) CN1198262C (ja)
AR (1) AR000871A1 (ja)
AT (2) ATE230888T1 (ja)
AU (1) AU708392C (ja)
BR (1) BR9607026A (ja)
CA (1) CA2210765C (ja)
DE (1) DE19604273C5 (ja)
DK (2) DK0808496T3 (ja)
ES (1) ES2112807B1 (ja)
FI (2) FI117994B (ja)
FR (1) FR2730336B1 (ja)
GB (1) GB2297671B (ja)
HK (2) HK1002492A1 (ja)
IN (1) IN187453B (ja)
IT (1) IT1305724B1 (ja)
MX (1) MX9705997A (ja)
MY (2) MY130529A (ja)
NO (1) NO318595B1 (ja)
PT (1) PT1225568E (ja)
RU (1) RU2142166C1 (ja)
SE (1) SE520553C2 (ja)
WO (1) WO1996024925A1 (ja)

Families Citing this family (63)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE508788C2 (sv) * 1995-04-12 1998-11-02 Ericsson Telefon Ab L M Förfarande att bestämma positionerna inom en talram för excitationspulser
US5822724A (en) * 1995-06-14 1998-10-13 Nahumi; Dror Optimized pulse location in codebook searching techniques for speech processing
US6393391B1 (en) * 1998-04-15 2002-05-21 Nec Corporation Speech coder for high quality at low bit rates
TW317051B (ja) * 1996-02-15 1997-10-01 Philips Electronics Nv
JP3523649B2 (ja) * 1997-03-12 2004-04-26 三菱電機株式会社 音声符号化装置、音声復号装置及び音声符号化復号装置、及び、音声符号化方法、音声復号方法及び音声符号化復号方法
FI114248B (fi) * 1997-03-14 2004-09-15 Nokia Corp Menetelmä ja laite audiokoodaukseen ja audiodekoodaukseen
CN1494055A (zh) * 1997-12-24 2004-05-05 ������������ʽ���� 声音编码方法和声音译码方法以及声音编码装置和声音译码装置
US6385576B2 (en) * 1997-12-24 2002-05-07 Kabushiki Kaisha Toshiba Speech encoding/decoding method using reduced subframe pulse positions having density related to pitch
US5963897A (en) * 1998-02-27 1999-10-05 Lernout & Hauspie Speech Products N.V. Apparatus and method for hybrid excited linear prediction speech encoding
FI113571B (fi) 1998-03-09 2004-05-14 Nokia Corp Puheenkoodaus
JP3180762B2 (ja) * 1998-05-11 2001-06-25 日本電気株式会社 音声符号化装置及び音声復号化装置
US6714907B2 (en) * 1998-08-24 2004-03-30 Mindspeed Technologies, Inc. Codebook structure and search for speech coding
WO2000016501A1 (en) * 1998-09-11 2000-03-23 Motorola Inc. Method and apparatus for coding an information signal
SE521225C2 (sv) * 1998-09-16 2003-10-14 Ericsson Telefon Ab L M Förfarande och anordning för CELP-kodning/avkodning
CA2252170A1 (en) 1998-10-27 2000-04-27 Bruno Bessette A method and device for high quality coding of wideband speech and audio signals
JP4173940B2 (ja) * 1999-03-05 2008-10-29 松下電器産業株式会社 音声符号化装置及び音声符号化方法
US6295520B1 (en) 1999-03-15 2001-09-25 Tritech Microelectronics Ltd. Multi-pulse synthesis simplification in analysis-by-synthesis coders
JP2001075600A (ja) * 1999-09-07 2001-03-23 Mitsubishi Electric Corp 音声符号化装置および音声復号化装置
US7272553B1 (en) * 1999-09-08 2007-09-18 8X8, Inc. Varying pulse amplitude multi-pulse analysis speech processor and method
WO2001020595A1 (en) * 1999-09-14 2001-03-22 Fujitsu Limited Voice encoder/decoder
CA2290037A1 (en) 1999-11-18 2001-05-18 Voiceage Corporation Gain-smoothing amplifier device and method in codecs for wideband speech and audio signals
KR100576024B1 (ko) * 2000-04-12 2006-05-02 삼성전자주식회사 에이켈프 음성 압축기의 코드북 검색 장치 및 방법
US6728669B1 (en) * 2000-08-07 2004-04-27 Lucent Technologies Inc. Relative pulse position in celp vocoding
US7363219B2 (en) * 2000-09-22 2008-04-22 Texas Instruments Incorporated Hybrid speech coding and system
CA2327041A1 (en) * 2000-11-22 2002-05-22 Voiceage Corporation A method for indexing pulse positions and signs in algebraic codebooks for efficient coding of wideband signals
KR100438175B1 (ko) * 2001-10-23 2004-07-01 엘지전자 주식회사 코드북 검색방법
US7236928B2 (en) * 2001-12-19 2007-06-26 Ntt Docomo, Inc. Joint optimization of speech excitation and filter parameters
US7206740B2 (en) * 2002-01-04 2007-04-17 Broadcom Corporation Efficient excitation quantization in noise feedback coding with general noise shaping
JP2003255976A (ja) * 2002-02-28 2003-09-10 Nec Corp 音声素片データベースの圧縮伸張を行なう音声合成装置及び方法
CA2388439A1 (en) * 2002-05-31 2003-11-30 Voiceage Corporation A method and device for efficient frame erasure concealment in linear predictive based speech codecs
CA2392640A1 (en) * 2002-07-05 2004-01-05 Voiceage Corporation A method and device for efficient in-based dim-and-burst signaling and half-rate max operation in variable bit-rate wideband speech coding for cdma wireless systems
US7054807B2 (en) * 2002-11-08 2006-05-30 Motorola, Inc. Optimizing encoder for efficiently determining analysis-by-synthesis codebook-related parameters
KR100503414B1 (ko) * 2002-11-14 2005-07-22 한국전자통신연구원 고정 코드북의 집중 검색 방법 및 장치
US7698132B2 (en) * 2002-12-17 2010-04-13 Qualcomm Incorporated Sub-sampled excitation waveform codebooks
US7249014B2 (en) * 2003-03-13 2007-07-24 Intel Corporation Apparatus, methods and articles incorporating a fast algebraic codebook search technique
WO2004090870A1 (ja) * 2003-04-04 2004-10-21 Kabushiki Kaisha Toshiba 広帯域音声を符号化または復号化するための方法及び装置
EP1513137A1 (en) * 2003-08-22 2005-03-09 MicronasNIT LCC, Novi Sad Institute of Information Technologies Speech processing system and method with multi-pulse excitation
CN100416652C (zh) * 2005-10-31 2008-09-03 连展科技(天津)有限公司 增强的amr编码器快速固定码本搜索方法
JP5159318B2 (ja) * 2005-12-09 2013-03-06 パナソニック株式会社 固定符号帳探索装置および固定符号帳探索方法
US8255207B2 (en) * 2005-12-28 2012-08-28 Voiceage Corporation Method and device for efficient frame erasure concealment in speech codecs
JP3981399B1 (ja) * 2006-03-10 2007-09-26 松下電器産業株式会社 固定符号帳探索装置および固定符号帳探索方法
US20080120098A1 (en) * 2006-11-21 2008-05-22 Nokia Corporation Complexity Adjustment for a Signal Encoder
US8688437B2 (en) 2006-12-26 2014-04-01 Huawei Technologies Co., Ltd. Packet loss concealment for speech coding
CN101286321B (zh) * 2006-12-26 2013-01-09 华为技术有限公司 双脉冲激励的线性测编码
EP2157573B1 (en) 2007-04-29 2014-11-26 Huawei Technologies Co., Ltd. An encoding and decoding method
CN100530357C (zh) * 2007-07-11 2009-08-19 华为技术有限公司 固定码书搜索方法及搜索器
US8566106B2 (en) * 2007-09-11 2013-10-22 Voiceage Corporation Method and device for fast algebraic codebook search in speech and audio coding
CN100578619C (zh) * 2007-11-05 2010-01-06 华为技术有限公司 编码方法和编码器
CN101903946B (zh) * 2007-12-21 2012-09-26 Nvoq股份有限公司 分布式听写/转录系统
US7889103B2 (en) * 2008-03-13 2011-02-15 Motorola Mobility, Inc. Method and apparatus for low complexity combinatorial coding of signals
DK2242045T3 (da) * 2009-04-16 2012-09-24 Univ Mons Talesyntese og kodningsfremgangsmåder
CN101931414B (zh) * 2009-06-19 2013-04-24 华为技术有限公司 脉冲编码方法及装置、脉冲解码方法及装置
US8280729B2 (en) * 2010-01-22 2012-10-02 Research In Motion Limited System and method for encoding and decoding pulse indices
CN102299760B (zh) 2010-06-24 2014-03-12 华为技术有限公司 脉冲编解码方法及脉冲编解码器
CN102623012B (zh) * 2011-01-26 2014-08-20 华为技术有限公司 矢量联合编解码方法及编解码器
US9767822B2 (en) 2011-02-07 2017-09-19 Qualcomm Incorporated Devices for encoding and decoding a watermarked signal
US8880404B2 (en) * 2011-02-07 2014-11-04 Qualcomm Incorporated Devices for adaptively encoding and decoding a watermarked signal
US9767823B2 (en) 2011-02-07 2017-09-19 Qualcomm Incorporated Devices for encoding and detecting a watermarked signal
US9070356B2 (en) 2012-04-04 2015-06-30 Google Technology Holdings LLC Method and apparatus for generating a candidate code-vector to code an informational signal
US9263053B2 (en) 2012-04-04 2016-02-16 Google Technology Holdings LLC Method and apparatus for generating a candidate code-vector to code an informational signal
CN103456309B (zh) * 2012-05-31 2016-04-20 展讯通信(上海)有限公司 语音编码器及其代数码表搜索方法和装置
US9728200B2 (en) * 2013-01-29 2017-08-08 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for adaptive formant sharpening in linear prediction coding
US20140334564A1 (en) * 2013-05-09 2014-11-13 Samsung Electronics Co., Ltd Method and system for providing low-complexity hybrid precoding in wireless communication systems

Family Cites Families (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4401855A (en) * 1980-11-28 1983-08-30 The Regents Of The University Of California Apparatus for the linear predictive coding of human speech
CA1164569A (en) * 1981-03-17 1984-03-27 Katsunobu Fushikida System for extraction of pole/zero parameter values
WO1983003917A1 (en) * 1982-04-29 1983-11-10 Massachusetts Institute Of Technology Voice encoder and synthesizer
US4625286A (en) * 1982-05-03 1986-11-25 Texas Instruments Incorporated Time encoding of LPC roots
US4520499A (en) * 1982-06-25 1985-05-28 Milton Bradley Company Combination speech synthesis and recognition apparatus
JPS5922165A (ja) * 1982-07-28 1984-02-04 Nippon Telegr & Teleph Corp <Ntt> アドレス制御回路
DE3276651D1 (en) * 1982-11-26 1987-07-30 Ibm Speech signal coding method and apparatus
US4764963A (en) * 1983-04-12 1988-08-16 American Telephone And Telegraph Company, At&T Bell Laboratories Speech pattern compression arrangement utilizing speech event identification
US4667340A (en) * 1983-04-13 1987-05-19 Texas Instruments Incorporated Voice messaging system with pitch-congruent baseband coding
US4669120A (en) * 1983-07-08 1987-05-26 Nec Corporation Low bit-rate speech coding with decision of a location of each exciting pulse of a train concurrently with optimum amplitudes of pulses
DE3335358A1 (de) * 1983-09-29 1985-04-11 Siemens AG, 1000 Berlin und 8000 München Verfahren zur bestimmung von sprachspektren fuer die automatische spracherkennung und sprachcodierung
US4799261A (en) * 1983-11-03 1989-01-17 Texas Instruments Incorporated Low data rate speech encoding employing syllable duration patterns
CA1236922A (en) * 1983-11-30 1988-05-17 Paul Mermelstein Method and apparatus for coding digital signals
CA1223365A (en) * 1984-02-02 1987-06-23 Shigeru Ono Method and apparatus for speech coding
US4724535A (en) * 1984-04-17 1988-02-09 Nec Corporation Low bit-rate pattern coding with recursive orthogonal decision of parameters
US4680797A (en) * 1984-06-26 1987-07-14 The United States Of America As Represented By The Secretary Of The Air Force Secure digital speech communication
US4742550A (en) * 1984-09-17 1988-05-03 Motorola, Inc. 4800 BPS interoperable relp system
CA1252568A (en) * 1984-12-24 1989-04-11 Kazunori Ozawa Low bit-rate pattern encoding and decoding capable of reducing an information transmission rate
US4858115A (en) * 1985-07-31 1989-08-15 Unisys Corporation Loop control mechanism for scientific processor
IT1184023B (it) * 1985-12-17 1987-10-22 Cselt Centro Studi Lab Telecom Procedimento e dispositivo per la codifica e decodifica del segnale vocale mediante analisi a sottobande e quantizzazione vettorariale con allocazione dinamica dei bit di codifica
US4720861A (en) * 1985-12-24 1988-01-19 Itt Defense Communications A Division Of Itt Corporation Digital speech coding circuit
US4771465A (en) * 1986-09-11 1988-09-13 American Telephone And Telegraph Company, At&T Bell Laboratories Digital speech sinusoidal vocoder with transmission of only subset of harmonics
US4797926A (en) * 1986-09-11 1989-01-10 American Telephone And Telegraph Company, At&T Bell Laboratories Digital speech vocoder
US4873723A (en) * 1986-09-18 1989-10-10 Nec Corporation Method and apparatus for multi-pulse speech coding
US4797925A (en) * 1986-09-26 1989-01-10 Bell Communications Research, Inc. Method for coding speech at low bit rates
IT1195350B (it) * 1986-10-21 1988-10-12 Cselt Centro Studi Lab Telecom Procedimento e dispositivo per la codifica e decodifica del segnale vocale mediante estrazione di para metri e tecniche di quantizzazione vettoriale
US4868867A (en) * 1987-04-06 1989-09-19 Voicecraft Inc. Vector excitation speech or audio coder for transmission or storage
CA1337217C (en) * 1987-08-28 1995-10-03 Daniel Kenneth Freeman Speech coding
US4815134A (en) * 1987-09-08 1989-03-21 Texas Instruments Incorporated Very low rate speech encoder and decoder
IL84902A (en) * 1987-12-21 1991-12-15 D S P Group Israel Ltd Digital autocorrelation system for detecting speech in noisy audio signal
US4817157A (en) * 1988-01-07 1989-03-28 Motorola, Inc. Digital speech coder having improved vector excitation source
CA1321646C (en) * 1988-05-20 1993-08-24 Eisuke Hanada Coded speech communication system having code books for synthesizing small-amplitude components
US5008965A (en) * 1988-07-11 1991-04-23 Kinetic Concepts, Inc. Fluidized bead bed
IT1232084B (it) * 1989-05-03 1992-01-23 Cselt Centro Studi Lab Telecom Sistema di codifica per segnali audio a banda allargata
SE463691B (sv) * 1989-05-11 1991-01-07 Ericsson Telefon Ab L M Foerfarande att utplacera excitationspulser foer en lineaerprediktiv kodare (lpc) som arbetar enligt multipulsprincipen
US5097508A (en) * 1989-08-31 1992-03-17 Codex Corporation Digital speech coder having improved long term lag parameter determination
US5307441A (en) * 1989-11-29 1994-04-26 Comsat Corporation Wear-toll quality 4.8 kbps speech codec
CA2010830C (en) * 1990-02-23 1996-06-25 Jean-Pierre Adoul Dynamic codebook for efficient speech coding based on algebraic codes
US5144671A (en) * 1990-03-15 1992-09-01 Gte Laboratories Incorporated Method for reducing the search complexity in analysis-by-synthesis coding
US5293449A (en) * 1990-11-23 1994-03-08 Comsat Corporation Analysis-by-synthesis 2,4 kbps linear predictive speech codec
US5396576A (en) * 1991-05-22 1995-03-07 Nippon Telegraph And Telephone Corporation Speech coding and decoding methods using adaptive and random code books
US5233660A (en) * 1991-09-10 1993-08-03 At&T Bell Laboratories Method and apparatus for low-delay celp speech coding and decoding
JP3089769B2 (ja) * 1991-12-03 2000-09-18 日本電気株式会社 音声符号化装置
US5457783A (en) * 1992-08-07 1995-10-10 Pacific Communication Sciences, Inc. Adaptive speech coder having code excited linear prediction
DE4315313C2 (de) * 1993-05-07 2001-11-08 Bosch Gmbh Robert Vektorcodierverfahren insbesondere für Sprachsignale

Also Published As

Publication number Publication date
MY119038A (en) 2005-03-31
CN1181150A (zh) 1998-05-06
EP0808496A1 (en) 1997-11-26
PT1225568E (pt) 2004-01-30
IT1305724B1 (it) 2001-05-15
HK1002492A1 (en) 1998-08-28
SE9600437D0 (sv) 1996-02-06
KR19980701975A (ko) 1998-06-25
US5754976A (en) 1998-05-19
ATE248423T1 (de) 2003-09-15
GB9602391D0 (en) 1996-04-03
DE19604273C2 (de) 2000-06-29
NO318595B1 (no) 2005-04-18
FI20020320A (fi) 2002-02-18
NO973472L (no) 1997-10-06
FR2730336A1 (fr) 1996-08-09
MX9705997A (es) 1997-11-29
EP1225568B1 (en) 2003-08-27
GB2297671B (en) 2000-01-19
FI118396B (fi) 2007-10-31
FI973241A (fi) 1997-10-06
WO1996024925A1 (en) 1996-08-15
NO973472D0 (no) 1997-07-28
CA2210765C (en) 2001-08-21
AR000871A1 (es) 1997-08-06
HK1055007A1 (en) 2003-12-19
GB2297671A (en) 1996-08-07
DE19604273C5 (de) 2004-05-27
EP0808496B1 (en) 2003-01-08
ES2112807B1 (es) 1999-04-16
KR100393910B1 (ko) 2003-08-02
ITUD960012A0 (it) 1996-02-02
AU4479696A (en) 1996-08-27
SE520553C2 (sv) 2003-07-22
DK0808496T3 (da) 2003-04-22
AU708392B2 (en) 1999-08-05
JP4187556B2 (ja) 2008-11-26
FI117994B (fi) 2007-05-15
MY130529A (en) 2007-06-29
CA2210765A1 (en) 1996-08-15
JP2003308100A (ja) 2003-10-31
CN1198262C (zh) 2005-04-20
IN187453B (ja) 2002-04-27
FR2730336B1 (fr) 1997-08-14
KR100388751B1 (ko) 2003-11-28
EP1225568A1 (en) 2002-07-24
ITUD960012A1 (it) 1997-08-02
ES2112807A1 (es) 1998-04-01
DE19604273A1 (de) 1996-08-29
CN1410970A (zh) 2003-04-16
ATE230888T1 (de) 2003-01-15
BR9607026A (pt) 1997-11-04
JPH10513571A (ja) 1998-12-22
DK1225568T3 (da) 2003-11-24
AU708392C (en) 2003-01-09
RU2142166C1 (ru) 1999-11-27
FI973241A0 (fi) 1997-08-06
CN1220178C (zh) 2005-09-21

Similar Documents

Publication Publication Date Title
JP3430175B2 (ja) スピーチ信号を高速符号化するための信号選択されたパルス振幅を備えた代数学的符号帳
KR100299408B1 (ko) 음성의고속코딩을위한심도우선대수코드북검색
US7280959B2 (en) Indexing pulse positions and signs in algebraic codebooks for coding of wideband signals
US7774200B2 (en) Method and apparatus for transmitting an encoded speech signal
AU2002221389A1 (en) Indexing pulse positions and signs in algebraic codebooks for coding of wideband signals
US5727122A (en) Code excitation linear predictive (CELP) encoder and decoder and code excitation linear predictive coding method
CA2210765E (en) Algebraic codebook with signal-selected pulse amplitudes for fast coding of speech
CA2618002C (en) Algebraic codebook with signal-selected pulse amplitudes for fast coding of speech
WO2000042601A1 (en) A method and device for designing and searching large stochastic codebooks in low bit rate speech encoders
MXPA97005997A (en) Algebraic coding book with amplitude signal deimpulse selected for a rapidacodification of
NO322594B1 (no) Algebraisk kodebok med signalvalgte pulsamplituder for hurtig koding av tale

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080516

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090516

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100516

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100516

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110516

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130516

Year of fee payment: 10

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term