JP3378238B2 - ソフト適応性特性を含む音声コーディング - Google Patents
ソフト適応性特性を含む音声コーディングInfo
- Publication number
- JP3378238B2 JP3378238B2 JP2000534999A JP2000534999A JP3378238B2 JP 3378238 B2 JP3378238 B2 JP 3378238B2 JP 2000534999 A JP2000534999 A JP 2000534999A JP 2000534999 A JP2000534999 A JP 2000534999A JP 3378238 B2 JP3378238 B2 JP 3378238B2
- Authority
- JP
- Japan
- Prior art keywords
- level
- voiced
- signal
- coding
- decoding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 230000003044 adaptive effect Effects 0.000 claims description 72
- 238000012986 modification Methods 0.000 claims description 72
- 230000004048 modification Effects 0.000 claims description 72
- 238000000034 method Methods 0.000 claims description 55
- 239000006185 dispersion Substances 0.000 claims description 36
- 238000007493 shaping process Methods 0.000 claims description 17
- 230000005236 sound signal Effects 0.000 claims description 16
- 238000012937 correction Methods 0.000 claims description 15
- 230000004044 response Effects 0.000 claims description 11
- 238000011156 evaluation Methods 0.000 claims description 5
- 238000012545 processing Methods 0.000 claims description 5
- 238000001914 filtration Methods 0.000 claims description 3
- 239000003795 chemical substances by application Substances 0.000 description 36
- 239000003607 modifier Substances 0.000 description 22
- 230000006978 adaptation Effects 0.000 description 11
- 230000015572 biosynthetic process Effects 0.000 description 6
- 239000000872 buffer Substances 0.000 description 6
- 230000015556 catabolic process Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 238000006731 degradation reaction Methods 0.000 description 4
- 238000001228 spectrum Methods 0.000 description 4
- 238000013459 approach Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 230000001413 cellular effect Effects 0.000 description 2
- 125000004122 cyclic group Chemical group 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000007670 refining Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 238000012797 qualification Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/002—Dynamic bit allocation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0007—Codebook element generation
- G10L2019/0008—Algebraic codebooks
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
し、特に、音声信号コーディングを音声信号の局所的特
性に適応させることに関する。
文節の局所的特性とは無関係に同じコーディング方法を
適用する。しかしながら、音声の局所的特性に従ってコ
ーディング方法を変更あるいは適用すれば、品質向上を
得ることができる。そのような適応方法は、一般に、所
与の音声文節の何らかの形式の分類に基づき、その分類
を使用して、いくつかのコーディングモード(マルチモ
ードコーディング)の中から1つを選択する。そのよう
な技術が特に役立つのは、背景ノイズがある場合で、そ
の自然な音再生を得るためには、音声信号に一般に適用
されるコーディングとは違ったコーディングアプローチ
が要求される。
それが柔軟でないことである。所与の音声文節の分類が
間違って、その結果として、その文節に不適切なコーデ
ィングモードを選択する危険がある。不適切なコーディ
ングモードは、典型的には、コード化して得られた音声
信号が非常に劣化される。このような分類を行うアプロ
ーチは、音声コーダの性能を制限するという不利があ
る。
られた技術は、閉ループモード判定を行う方法で、コー
ダはすべてのモードを試みて、何らかの基準によって、
その中から最適なものを判定する。これは、分類間違え
の問題をある程度軽減するが、そのようなやり方に対し
て、適切な基準を見つけるのが問題である。前記分類を
伴う方法においてもそうであるが、どのモードが選択さ
れたかを示す情報を送信することが必要になる(即ち、
送信側エンコーダから通信チャンネルを介して受信側デ
コーダへオーバヘッドビットを送る必要がある)。これ
は、実際には、コーディングモードの数を制限する。
ング又はデコーディング)を音声の局所的特性によって
変更又は適応化することができることが必要であり、そ
の際、前記従来の分類による劣化を伴ってはならず、ま
た選択された適用を記述するオーバヘッドビットの送信
を必要としてはならない。
コーディング又はデコーディング)は、柔軟性のない分
類やコード化された音声信号のひどい劣化なしに、ま
た、選択された適応化を記載するオーバヘッドビットの
送信を必要とせずに適応化が可能である。適応化(適
応)は、コーダ(エンコーダ又はデコーダ)にすでに存
在しているパラメータに基づくものであるので、適応を
記載する余分な情報を送信する必要がない。これによ
り、コーディング(エンコーディング又はデコーディン
グ)方法の無限の変更が可能となる完全にソフト的な適
応方式が可能となる。更に、適応は、信号のコーダ特性
に基づき、適応は、ある音声文節によってどれくらいう
まく基本コーディングアプローチが働くかによって行わ
れる。
示す。図1の装置は、例えば、セルラー電話のような無
線音声通信デバイスにおいて利用することができる。音
声エンコーディンング部11はその入力において非コー
ド化信号を受信し、その出力においてコード化された信
号を提供する。非コード化信号は、元の音声信号であ
る。音声エンコーディング部11は、ソフト的適応コン
トローラ19からの制御信号を受信する制御入力17を
備える。コントローラ19からの制御信号は、エンコー
ディング装置11によって行われたエンコーディング動
作がどの程度適応されるべきかを示す。コントローラ1
9は、非コード化信号の局所的音声特性の示す情報をエ
ンコーダ11から受け取るための入力18を備える。コ
ントローラ19は、18において受信された情報に応答
して、17において制御信号を提供する。
音声エンコーディング装置の例を示し、本発明によるエ
ンコーダとソフト的適応コントロールを備える。図1A
は、固定ゲイン形成部12と、適応ゲイン形成部14と
を備える符号励起線形予測符号化方式(Code Excited L
inear Prediction (CELP))音声エンコーダの該当部分
を示す。ソフト的な適応コントロールが、固定ゲイン形
成部12に備えられ、形成部12によって実現される固
定ゲイン形成コーディングのソフト的適応を可能にす
る。
グ装置の例をより詳細に示す。図2に示されるように、
図1Aの固定ゲイン形成コーディング部12は、固定コ
ードブック(fixed codebook)21と、ゲインマルチプ
ライア(gain multiplier)25と、コードモディファ
イア(code modifier)16とを備える。図1Aが示す
適応ゲイン形成コーディング部14は、適応コードブッ
ク(adaptive codebook)23とゲインマルチプライア
29とを備える。固定コードブック21に適用されるゲ
インFGと、適応コードブック23に適用されるゲイン
AGは、従来どおり、CELPエンコーダで生成され
る。特に、当業界で良く知られているように、従来のサ
ーチ方法は、合成フィルタ28の非コード化信号入力及
び出力に応答して行われる。このサーチ方法は、ゲイン
AGとFG,及びコードブック21と23への入力を提
供する。
ドブックゲインFGは、コントローラ19に入力され、
局所的音声特性を示す情報を提供する。特に、本発明
は、適応コードブックゲインAGが現在の音声文節の有
声レベル(即ち、ピッチ周期の強さ)を示すのにも使用
することができるということ、及び固定コードブックゲ
インFGが現在の音声文節の信号エネルギーを示すのに
も使用することができるということを認識している。従
来の8kHzサンプリング率で、例えば、40サンプル
から成る各ブロックが、従来の適応及び固定コードブッ
ク21及び23のそれぞれから5ミリ秒ごとにアクセス
される。固定コードブック21と適応コードブック23
とから現在アクセスされているサンプルの各ブロックに
よって表される音声文節に対し、AGは、音声レベル情
報を提供し、FGは信号エネルギー情報を提供する。
るゲインFGの適用の後、固定コードブック21からの
コード化された信号評価を受信する。次に、モディファ
イア16は、26において、加算回路27に対し、選択
的に修正されたコード化された信号評価を提供する。加
算回路27の他の入力は、従来のように、29における
適応コードブックゲインAGの適用の後で、適応コード
ブック23からのコード化された信号評価を受信する。
加算回路27の出力は、従来の合成フィルタ28を駆動
し、また、適応コードブック23にフィードバックされ
る。
ば、コーダは、適応コードブック成分を大々的に利用
し、音声文節は、音声音文節である確率が高く、それ
は、典型的には、コーディング処理の適応を殆どあるい
は全く伴わずにCELPコーダによって受け入れられる
ように処理される。AGがロウであれば、信号は無声音
音声又は背景ノイズであることが多い。このロウAGの
場合、モディファイア16は、比較的高いレベルのコー
ディング修正を提供するのが有利である。高い適応コー
ドブックゲインと低い適応コードブックゲインとの間の
範囲において、必要とされる修正の量は、低い適応コー
ドブックゲインに関連した比較的高いレベルの修正と、
高い適応コードブックゲインに関連した比較的低い修正
あるいは修正なしとの間にあることが好ましい。
をより詳細に示す。図3の例に示されるように、コント
ローラ19から17で受信される制御信号はスイッチ3
1及び33を動作させて、24で受信されるコード化信
号評価の所望の修正レベルを選択する。図3に示される
ように、修飾レベル0は、コード化信号評価を修正なし
に渡す。1つの実施の形態において、修正レベル1は、
比較的低いレベルの修正を提供し、修正レベル2は、修
正レベル1によって提供されるものより比較的高い修正
レベルを提供し、修正レベル1も2も、例えば、修正レ
ベルNによって提供されるより少ないコード修正を提供
する。このようにして、ソフト適応コントローラは、適
応コードブックゲイン(有声レベル情報)と固定コード
ブックゲイン(信号エネルギー情報)を使用して、どの
程度の(どのレベルの)修正をモディファイア16がコ
ード化信号評価に適用するかを選択する。このゲイン情
報は、コーダによってそのコーディング処理においてす
でに生成されているので、所望の有声レベルと信号エネ
ルギー情報を生成するのにオーバヘッドは必要ない。
ックゲインは、それぞれ、有声レベルと信号エネルギー
とに関する情報を提供するのに使用されるが、本発明の
ソフト適応制御技術がCELPコーダ以外の音声コーダ
に組み込まれる場合、その他の適当なパラメータが所望
の有声レベルと信号エネルギー情報(あるいは他の所望
の情報)を提供してもよい。
9の図2の実施の形態をより詳細に示すブロック図であ
る。各音声文節に対する適応コードブックゲインAG及
び固定コードブックゲインFGは、それぞれバッファ4
1及び42で受信され記憶される。バッファ41及び4
2を使用して、現在の音声文節のゲイン値のほかに所定
数の先行する音声文節のゲイン値も記憶する。バッファ
41及び42は、(音質)改良のためのロジック43に
接続される。改良用ロジック43の出力45は、コード
修正レベルマップ44に接続される。コード修正レベル
マップ44(例えば、一覧表)は、その出力49におい
て、コードモディファイア16によって実現されるべ
き、提案される新規レベルの修正を提供する。新規レベ
ルの修飾は新規レベルレジスタ46に記憶される。新規
レベルレジスタ46は、現在レベルレジスタ48に接続
され、ヒステリシスロジック47がレジスタ47及び4
8に接続される。現在レベルレジスタ48は、コードモ
ディファイア16の入力17へ所望の修正レベル情報を
提供する。次に、コードモディファイア16は、スイッ
チ31及び33を動作させて、現在レベルレジスタ48
によって示される修正レベルを提供する。
の構成及び動作について、図5のフローチャートを参照
しながら説明する。
適応コントローラの実施の形態によって行われるレベル
制御動作の例を示す。図5の50において、ソフト的適
応コントローラは、適応コードブックから取得されるサ
ンプルの最も新しいブロックに関連した適応コードブッ
クゲインAGの受信のために待機する。AGが受信され
た後、図4の改良用ロジック43は、51において、こ
の新規適応コードブックゲイン値がしきい値THAGより
大きいかどうかを決定する。もしそうでなければ、適応
コードブックゲイン値AGが56で使用されて、図5の
マップ44から新規レベル値が取得される。このよう
に、適応コードブックゲイン値がしきい値THAGを超え
なければ、図4の改良用ロジック43は適応コードブッ
クゲイン値を図4のコード修正レベルマップ44に渡
し、そのコード修正レベルマップ44において適応コー
ドブックゲイン値が使用されて、新規レベル値が取得さ
れる。
内の適応コードブックゲイン値が0という新規レベル値
にマップされ(従って図3のコードモディファイアにお
いてレベル0を選択し)、第2範囲内のゲイン値が1と
いう新規レベルにマップされ(従って図3のコーディン
グモディファイアにおいてレベル1を選択し)、第3範
囲内のゲイン値が2という新規レベル値にマップされ
(コードモディファイア16におけるレベル2修正の選
択に対応)、というように続く。各ゲイン値は、モディ
ファイア11が充分な修正レベルを有すれば、一義的新
規レベル値にマップすることができる。AG値に対する
修正レベルの割合が増大するにつれて、修正レベルの変
化がより微細になり(無限小に近づき)、このようし
て、AG変化に対する「ソフト的」適応を提供する。
がしきい値を超えると、図4の改良用ロジック43が固
定コードブックゲインバッファ42を調べ、しきい値を
超えるAG値がFG値の大きな増加に対応するかどうか
を決める。このFGの増加は、音声開始(speech onse
t)が生じていることを示す。52において開始(onse
t)が検出されると、56において、適応コードブック
ゲイン値がマップに適用される(図4の44を参照)。
ジック(図4の43を参照)は、第4図のバッファ41
に記憶された適応コードブックゲインの以前の値を考慮
する。ステップ51から、現在のAG値はしきい値を超
える値であるが、それにもかかわらず、54において、
しきい値を超える値がスプリアス値であるかどうかを決
めるため、53において先行するAG値が考慮される。
53において実行することのできる処理のタイプの例
は、平滑化動作、平均化動作、その他の形式のフィルタ
リング動作、あるいは単にしきい値THAGを超えなかっ
た先行するAG値の数を数える動作である。例えば、バ
ッファ41内のAG値のうち半分以上が値THAGを超え
なければ、ブロック54から「Y」の路線(スプリアス
AG値)が取り込まれ、改良用ロジック(図4の43)
が55において、AG値を下げる。前述のように、低い
AG値は、低いレベルの有声を示すので、低いAG値
は、結果的に比較的大きなコード化音声評価の修正とな
る、より高い新規レベル値にマッピングするのが好まし
い。尚、しきい値を超えるAG値は、52において開始
が検出されれば、先行するAG値を考慮することなし
に、受け入れられる。53及び54においてスプリアス
AG値が検出されなければ、しきい値を超えるAG値は
受け入れられ、56において、44をマッピングするの
に適用される。
のように、コーダにより使用される先行情報が使用でき
それを考慮することによって、高解像度の「ソフト的」
適応制御が可能となり、その適応制御においては、コー
ディング方法の無限の変更あるいは適応が可能となる。
ク(図4の47を参照)は新規レベル値(NL)を現在
レベル値(CL)と比較して、それらの値の差を得る。
58において、差DIFFがヒステリシスしきい値TH
Hを超えると、59において、ヒステリシスロジックは
新規レベル値を必要に応じてインクリメント又はデクリ
メントして、それを現在レベル値に近づける。その後、
新規レベル及び現在レベル値は、再度、57において比
較され、それらの間の差DIFFが求められる。その
後、58において、DIFFがヒステリシスしきい値を
超えるかどうか決められ、もしそうであれば、新規レベ
ル値は、再度、59において、現在レベル値に近づけら
れ、差DIFFが再度、57において、求められる。差
DIFFが58においてヒステリシスしきい値を超えな
いとわかると、60において、ヒステリシスロジック
(図4の47)は、新規レベル値が現在レベルレジスタ
48に書き込まれることを許容する。レジスタ48から
の現在レベル値は、図3のコードモディファイアの制御
入力17を切り替えるように接続され、それにより、所
望のレベルの修正が選択される。
ロジック47は、1つの音声文節から次の音声文節に修
正が変化することのできるレベルの数を制限する。しか
しながら、57乃至59のヒステリシス動作は、改良用
ロジックが音声開始が生じていると固定コードブックゲ
インバッファから判定すれば、判定ブロック61からバ
イパスされる。この場合、改良用ロジック43は、ヒス
テリシスロジック47(図4の制御ライン40を参照)
のヒステリシス動作を不能にする。これにより、新規レ
ベル値が直接的に現在レベルレジスタ48にロードされ
る。従って、音声開始がある場合、ヒステリシスは適用
されない。
御は、ビット送信オーバヘッドを必要としないので有利
である。なぜなら、AG及びFGは、非コード化信号の
特性に基づいてコーダ自身によって生成されるからであ
る。
グ処理に適用した例である。図20の構成は、例えば、
セルラー電話のような無線音声通信装置に利用すること
ができる。200の音声デコーディング装置は、その入
力において、コード化情報を受け取り、その出力におい
てデコードされた信号を提供する。デコーダ200の入
力において受信されたコード化情報は、例えば、図1の
コーダ11によって出力されたコード化信号の受信版
で、通信チャンネルを介してデコーダ200に送信され
たものである。本発明のソフト的適応コントロール19
は、前述の図1のエンコーダと同様に、デコーダ200
に適用される。
声デコーディング構成の例を示し、デコーダと本発明に
基づくソフト的適応コントロールとを備える。図20A
は、CELP音声デコーダの該当部分を示す。図20A
のCELPデコーディング装置は、図1Aに示されたC
ELPコーディング装置と同様であるが、固定及び適応
ゲイン形成コーディング部12及び14は、デコーダ入
力で受信されるコード化情報をデマルチプレクスするこ
とによって得られる(従来のように)のに対して、図1
Aエンコーダのそれらの部分への入力は、従来のサーチ
方法から得られることが異なる。これらのCELPエン
コーダとCELPデコーダとの間の関係は、当業者にと
っては明らかである。図20Aにおいて、図1Aにおけ
ると同様に、本発明のソフト的適応コントロール19
は、固定ゲイン形成コーディング部12に、図1Aにつ
いての説明と同様に適用される。
おいてより明確に見られるように、図21のデコーダ装
置における本発明のソフト的適応コントロール19の適
用は、図2のエンコーダ装置に実現された場合と同様で
ある。前述のように、固定及び適応コードブック21及
び23への入力は、受信されたコード化情報からデマル
チプレクスされる。ゲインデコーダ22は、また、従来
と同様に、デコーダで受信されたコード化情報からデマ
ルチプレクスされた入力信号を受信する。図2と図21
を比較すると明らかなように、本発明のソフト的適応コ
ントロールは、図2のエンコーダについて説明された方
法と同様に、図21のデコーダにおいて動作する。従っ
て、図2のエンコーダについての本発明のソフト的適応
コントロールの前述の説明(図3乃至5、及び対応の説
明を含む)は、同様に、図21のデコーダに適用するこ
とができることが分る。
de modifier)の修正レベルの1つを実現した例を示
す。図6の装置は、図2又は図21の固定コードブック
から受信されたコード化音声評価における希薄分散(spa
rseness)を減少させるために設計された反希薄分散フィ
ルタ(anti-sparseness filter)として特徴付けられ
る。希薄分散(sparseness)とは、例えば代数コードブ
ックのような固定コードブック21内の所与のコードブ
ックエントリのサンプルのうち少数のサンプルだけが非
ゼロサンプル値を持っているような状態を指す。この希
薄分散状態は、特に、音声圧縮をするために代数コード
ブックのビットレートが減少させられた場合に、よくお
きる。コードブックエントリにおいて非ゼロサンプルが
非常に少ない場合、その結果生じる希薄分散は、従来の
音声コーダのコード化音声信号において容易に実感され
る劣化となる。
薄分散問題を軽減するために設計されている。図6の反
希薄分散フィルタは、オールパスフィルタ(all-pass f
ilter)と関連するインパルスレスポンス(65)を有
する固定(例えば、代数)コードブック21から受信さ
れたコード化音声評価の巡回たたみ込み(circular con
volution)を行うコンボルバ(convolver)63を備え
る。図6の反希薄分散フィルタの動作例は図7乃至11
に示される。
サンプルがたった2個である図2(又は図21)のコー
ドブック21からのエントリの例を示す。この希薄分散
特性は、非ゼロサンプルの数を増加させることができれ
ば、減らすことができる。非ゼロサンプルの数を増加さ
せる方法の1つは、40個のサンプルのブロック全体に
エネルギーを分散させるのに適した特性を持つフィルタ
に、図10のコードブックエントリを適用することであ
る。図7及び図8は、それぞれ、図10のコードブック
エントリの40個のサンプル全体にエネルギーを適切に
分散させることのできるオールパスフィルタの強度と位
相(ラジアン)を示す。図7及び図8のフィルタは、高
周波数範囲の位相スペクトルを2と4kHzの間で変化
させ、一方、低周波数範囲を2kHz未満でわずかに変
化させる。
ールパスフィルタのインパルスレスポンスを示すグラフ
である。図6の反希薄分散フィルタは、図10のサンプ
ルブロック上に図9のインパルスの巡回たたみ込みを行
う。コードブックエントリは40個のサンプルのブロッ
クとしてコードブックから提供されるので、たたみ込み
動作はブロック単位で行われる。図10の各サンプル
は、たたみ込み動作において40個の中間乗算結果を生
成する。例えば、図10における位置7におけるサンプ
ルに注目すると、最初の34個の乗算結果は図11の結
果ブロックの位置7乃至40に割り当てられ、残りの6
個の乗算結果は、結果ブロックの位置1乃至6に割り当
てられるように、巡回たたみ込み動作によって「ラッピ
ング(wrapped arcund)」される。残りの図10のサンプ
ルのそれぞれによって生成された40個の中間乗算結果
は、同様に、図11の結果ブロック内の位置に割り当て
られた、サンプル1は、もちろん、ラッピングを必要と
しない。図11の結果ブロック内各位置について、そこ
に割り当てられた40個の中間乗算結果(図10のサン
プルごとに1つの乗算結果)が合計され、その合計は、
その位置のたたみ込み結果を示す。
に、巡回たたみ込みは、エネルギーがブロック全体に分
散されることによって、非ゼロサンプルの数を格段に増
加させ、それに応じて、希薄分散の量を減らすよう図1
0のブロックのフーリエスペクトルを変化させる。ブロ
ック単位の巡回たたみ込みを行うことによる効果は、図
2(又は図21)の合成フィルタ28によって平滑化す
ることができる。
プの反希薄分散フィルタの動作の別の例を示す。図12
及び図13のオールパスフィルタは、3kHz未満の位
相スペクトルを実質的に変化させることなく、3乃至4
kHzの位相スペクトルを変化させる。フィルタのイン
パルスレスポンスは図14に示されている。図16を参
照し、また図15が図10と同じサンプルブロックを示
していることを考慮すると、図12乃至図16に示され
た反希薄分散動作は、図11に示されたほどのエネルギ
ー分散を行わない。従って、図12乃至図16が定義す
る反希薄分散フィルタは、図7乃至図11に定義される
フィルタほどはコードブックエントリを修正しない。従
って、図7乃至図11のフィルタ及び図12乃至図16
のフィルタは、それぞれ、コード化音声評価の異なった
レベルの修正を定義する。再度、図2及び図3を参照す
ると、低いAG値は、適応コードブック成分が比較的小
さく、固定(例えば、代数)コードブック21から比較
的大きな貢献が得られることを示す。固定コードブック
エントリの前記希薄分散により、コントローラ19は、
図12乃至図16の反希薄分散フィルタよりも、図7乃
至図11の反希薄分散フィルタを選択する。なぜなら、
図7乃至図11のフィルタは、図12乃至図16のフィ
ルタより大きなサンプルブロックの修正を提供するから
である。適応コードブックゲインAGの値がより大きい
場合には、固定コードブックの貢献は比較的少なく、コ
ントローラ19は、例えば、より少ない反希薄分散の修
正を提供する図12乃至図16のフィルタを選択する。
局所的特性を利用して、その文節のコード化音声評価を
修正すべきか否か、また修正するとしたらどの程度修正
するかを決めることができるようにする。様々なレベル
の修正の例としては、修正がないこと、比較的高いエネ
ルギー分散特性をもった反希薄分散フィルタ、比較的低
いエネルギー分散特性をもった反希薄分散フィルタがあ
る。一般にCELPコーダにおいては、適応コードブッ
クゲインが高い場合、それは、比較的高い有声レベルを
示し、典型的には、殆ど、あるいは全く、修正が必要な
い。反対に、適応コードブックゲインが低い場合、典型
的には、実質的修正が有利であることを示す。反希薄分
散フィルタの特定の例において、高い適応コードブック
ゲイン値が低い固定コードブックゲイン値と結合されて
いる場合、固定コードブックの貢献(希薄分散の貢献)
は比較的小さく、従って反希薄分散フィルタからの修正
はあまり必要としない(例えば、図12乃至16)こと
を示す。反対に、より高い固定コードブックゲイン値が
より低い適応コードブックゲイン値と結合されている場
合、固定コードブックの貢献は比較的大きく、従って大
きい反希薄分散の修正を使用することを示す。(例え
ば、図7乃至図11の反希薄フィルタ)。前述のよう
に、本発明に基づくマルチーレベルコードモディファイ
アは、選択可能な修正のレベルを必要な数だけ使用する
ことができる。
グ装置及び図21のCELPデコーディング装置に代わ
る例を示し、特にソフト的適応コントロールを用いたマ
ルチレベル修正を適応コードブック出力に適用する例で
ある。
グ装置及び図21のCELPデコーディング装置に代わ
る例を示し、加算ゲートの出力で適用されるマルチレベ
ルコードモディファイアとソフト的適応コントローラと
を備える。
のCELPコーディング装置が、どのようにして、モデ
ィファイア16の上流に入力のある加算回路10から適
応コードブック23へフィードバックを提供するように
変更できるかを示す。
1を参照した上記実施の形態は、適当にプログラムされ
たデジタル信号プロセッサその他のデータプロセッサを
使用することによって簡単に実現することができ、ある
いは、そのような適当にプログラムされたデジタル信号
プロセッサその他のデータプロセッサを、それに結合さ
れた付加的外部回路と組み合わせて使用することによっ
ても実現することができる。
してきたが、これは、本発明の範囲を限定するものでは
なく、本発明は、様々な実施の形態で実現することがで
きる。 [図面の簡単な説明]
グ方式を示すブロック図である。
ァイアの詳細を示す。
例を示す。
フローチャートである。
けるモディファイアレベルの1つとして提供されること
のできる本発明に基づく反希薄分散フィルタを示す。
作を示す。
作を示す。
作を示す。
動作を示す。
動作を示す。
の動作であって、図7乃至11の反希薄分散フィルタよ
り相対的に低いレベルでの反希薄分散動作を示す。
の動作であって、図7乃至11の反希薄分散フィルタよ
り相対的に低いレベルでの反希薄分散動作を示す。
の動作であって、図7乃至11の反希薄分散フィルタよ
り相対的に低いレベルでの反希薄分散動作を示す。
の動作であって、図7乃至11の反希薄分散フィルタよ
り相対的に低いレベルでの反希薄分散動作を示す。
の動作であって、図7乃至11の反希薄分散フィルタよ
り相対的に低いレベルでの反希薄分散動作を示す。
該当部分を示す。
置の該当部分を示す。
グ装置に適用可能な変更を示す。
グ装置を示すブロック図である。
Claims (56)
- 【請求項1】 所定のコードブックを用いて、音声信号
のコード化表現を生成するための音声エンコーディング
装置であって、 前記音声信号を受信するための入力と、 前記音声信号の前記コード化表現を提供するための出力
と、 前記入力と前記出力との間に接続され、前記音声信号
に、前記コードブックを用いたコーディング動作を行う
と共に、制御信号に応じて前記コードブックからの出力
に希薄分散(sparseness)を減少させるようなコード修
正を適応的に行って、前記コード化表現を生成するため
のコーダと、 前記コーダに接続されたコントローラであって、前記コ
ーディング動作において現在及び過去に使用された情報
を記憶するメモリを有し、当該メモリに記憶された前記
現在及び過去に使用された情報に基づいて、前記コード
修正のための前記制御信号を生成して前記コーダに出力
する前記コントローラと を備えることを特徴とする音声エンコーディング装置。 - 【請求項2】 前記コーダは、コード修正なしを含む異
なるレベルのコード修正を行うことができ、 前記制御信号は、前記コード修正の修正レベルを示す ことを特徴とする請求項1に記載の音声エンコーディン
グ装置。 - 【請求項3】 前記コーディング動作において使用さ
れ、前記メモリに記憶される前記情報は、前記音声信号
の有声レベルを示す有声情報を含む ことを特徴とする請求項1に記載の音声エンコーディン
グ装置。 - 【請求項4】 前記コーディング動作は、適応ゲイン形
成コーディングを含み、 前記有声情報は、前記適応ゲイン形成コーディングと関
連するゲイン信号を含む ことを特徴とする請求項3に記載の音声エンコーディン
グ装置。 - 【請求項5】 前記コントローラは、さらに改良用ロジ
ックを有し、 当該改良用ロジックは、前記コントローラが前記メモリ
に記憶された現在の有声レベルを示す前記有声情報を使
用すべきかどうか判定するため、前記現在の有声レベル
が所定のしきい値を超えていれば当該現在の有声レベル
を過去の有声レベルに対して評価する ことを特徴とする請求項3に記載の音声エンコーディン
グ装置。 - 【請求項6】 前記コーディング動作において使用さ
れ、前記メモリに記憶される前記情報は、前記音声信号
の信号エネルギーを示す信号エネルギー情報を含む ことを特徴とする請求項1に記載の音声エンコーディン
グ装置。 - 【請求項7】 前記コーディング動作は、固定ゲイン形
成コーディングを含み、 前記信号エネルギー情報は、前記固定ゲイン形成コーデ
ィングに関連するゲイン信号を含む ことを特徴とする請求項6に記載の音声エンコーディン
グ装置。 - 【請求項8】 前記コーディング動作において使用さ
れ、前記メモリに記憶される前記情報は、前記音声信号
の有声レベルを示す有声情報も含む ことを特徴とする請求項6に記載の音声エンコーディン
グ装置。 - 【請求項9】 前記コントローラは、さらに改良用ロジ
ックを有し、 当該改良用ロジックは、前記コントローラが前記メモリ
に記憶された現在の有声レベルを示す前記有声情報を使
用すべきかどうかを判定するため、前記現在の有声レベ
ルが所定のしきい値を超えていれば現在の信号エネルギ
ーを過去の信号エネルギーに対して評価する ことを特徴とする請求項8に記載の音声エンコーディン
グ装置。 - 【請求項10】 前記コーディング動作は、線形予測コ
ーディングを行う ことを特徴とする請求項1に記載の音声エンコーディン
グ装置。 - 【請求項11】 前記コントローラは、さらに、前記コ
ーディング動作において現在使用されている前記情報に
基づいて、前記修正レベルを示すレベル情報を出力する
マップロジックを備える ことを特徴とする請求項2に記載の音声エンコーディン
グ装置。 - 【請求項12】 前記コントローラは、さらに、前記マ
ップロジックから出力された前記レベル情報が示す修正
レベルが前記コーディング動作において現在行われてい
るコード修正の修正レベルに対して所定値以上異なるか
判定するロジックを備える ことを特徴とする請求項11に記載の音声エンコーディ
ング装置。 - 【請求項13】 前記コーダは、前記コードブックとし
て代数コードブックを備え、前記コード修正として、前
記代数コードブックからの出力に対してインパルスレス
ポンスとの畳み込み処理を行う反希薄分散フィルタを備
える ことを特徴とする請求項1に記載の音声エンコーディン
グ装置。 - 【請求項14】 所定のコードブックを用いて、音声信
号のコード化表現を生成するための音声エンコーディン
グ方法であって、 前記音声信号を受信するステップと、 前記音声信号に、前記コードブックを用いたコーディン
グ動作を行うと共に、制御信号に応じて前記コードブッ
クからの出力に希薄分散(sparseness)を減少させるよ
うなコード修正を適応的に行って、前記コード化表現を
生成するコーディングステップと、 前記コーディング動作において現在及び過去に使用され
た情報をメモリに記憶し、前記現在及び過去に使用され
た前記情報に基づいて、前記コード修正のための前記制
御信号を生成するコントロールステップと を備えることを特徴とする音声エンコーディング方法。 - 【請求項15】 前記コーディングステップは、コード
修正なしを含む異なるレベルのコード修正を行うことが
でき、 前記制御信号は、前記コード修正の修正レベルを示す ことを特徴とする請求項14に記載の音声エンコーディ
ング方法。 - 【請求項16】 前記コーディング動作において使用さ
れ、前記メモリに記憶される前記情報は、前記音声信号
の有声レベルを示す有声情報を含む ことを特徴とする請求項14に記載の音声エンコーディ
ング方法。 - 【請求項17】 前記コーディングステップは、適応ゲ
イン形成コーディングを含み、 前記有声情報は、前記適応ゲイン形成コーディングと関
連するゲイン信号を含む ことを特徴とする請求項16に記載の音声エンコーディ
ング方法。 - 【請求項18】 前記コントロールステップは、前記有
声情報によって示される現在の有声レベルが所定のしき
い値を超えていれば、当該現在の有声レベルを過去の有
声レベルに対して評価するステップを含む ことを特徴とする請求項16に記載の音声エンコーディ
ング方法。 - 【請求項19】 前記コントロールステップは、さら
に、前記評価によって前記現在の有声レベルがスプリア
スであることが判明した場合、異なる有声レベルを示す
ように前記現在の有声レベルを示す前記有声情報を変更
するステップを含む ことを特徴とする請求項18に記載の音声エンコーディ
ング方法。 - 【請求項20】 前記異なる有声レベルは低い方の有声
レベルである ことを特徴とする請求項19に記載の音声エンコーディ
ング方法。 - 【請求項21】 前記コーディング動作において使用さ
れ、前記メモリに記憶される前記情報は、前記音声信号
における信号エネルギーを示す信号エネルギー情報を含
む ことを特徴とする請求項14に記載の音声エンコーディ
ング方法。 - 【請求項22】 前記コーディングステップは、固定ゲ
イン形成コーディングを含み、 前記信号エネルギー情報は前記固定ゲイン形成コーディ
ングに関連するゲイン信号を含む ことを特徴とする請求項21に記載の音声エンコーディ
ング方法。 - 【請求項23】 前記コーディング動作において使用さ
れ、前記メモリに記憶される前記情報は、前記音声信号
の有声レベルを示す有声情報を含む ことを特徴とする請求項21に記載の音声エンコーディ
ング方法。 - 【請求項24】 前記コントロールステップは、現在の
有声レベルを示す前記有声情報を使用すべきかどうか判
定するため、前記現在の有声レベルが所定のしきい値を
超えていれば現在の信号エネルギーを過去の信号エネル
ギーに対して評価するステップを含む ことを特徴とする請求項23に記載の音声エンコーディ
ング方法。 - 【請求項25】 前記コーディングステップは線形予測
コーディングを行う ことを特徴とする請求項14に記載の音声エンコーディ
ング方法。 - 【請求項26】 前記コントロールステップは、前記コ
ーディング動作において現在使用されている前記情報に
基づいて、前記修正レベルを示すレベル情報を生成する
と共に、前記レベル情報によって示される前記修正レベ
ルと前記コーディング動作において現在行われているコ
ード修正の修正レベルとの差を判定するステップを含む ことを特徴とする請求項15に記載の音声エンコーディ
ング方法。 - 【請求項27】 前記コントロールステップは、前記差
が所定のしきい値以上あれば、前記現在の修正レベルと
の差がより小さい別の修正レベルに変更するステップを
含む ことを特徴とする請求項26に記載の音声エンコーディ
ング方法。 - 【請求項28】 前記コーディングステップは、前記コ
ードブックとして代数コードブックを使用し、前記コー
ド修正として、前記代数コードブックからの出力に対し
てインパルスレスポンスとの畳み込み処理を行う反希薄
分散フィルタリングのステップを含む ことを特徴とする請求項14に記載の音声エンコーディ
ング方法。 - 【請求項29】 所定のコードブックを用いて、音声信
号のコード化表現からデコードされた音声信号を生成す
るするための音声デコーディング装置であって、 前記音声信号の前記コード化表現を受信するための入力
と、 前記デコードされた音声信号を提供するための出力と、 前記入力と前記出力との間に接続され、前記コード化表
現に、前記コードブックを用いたデコーディング動作を
行うと共に、制御信号に応じて前記コードブックからの
出力に希薄分散(sparseness)を減少させるようなコー
ド修正を適応的に行って、前記デコードされた音声信号
を生成するためのデコーダと、 前記デコーダに接続されたコントローラであって、前記
デコーディング動作において現在及び過去に使用された
情報を記憶するメモリを有し、当該メモリに記憶された
前記現在及び過去に使用された前記情報に基づいて、前
記コード修正のための前記制御信号を生成して前記デコ
ーダに出力する前記コントローラと を備えることを特徴とする音声デコーディング装置。 - 【請求項30】 前記デコーダは、コード修正なしを含
む異なるレベルのコード修正を行うことができ、 前記制御信号は、前記コード修正の修正レベルを示す ことを特徴とする請求項29に記載の音声デコーディン
グ装置。 - 【請求項31】 前記デコーディング動作に使用され、
前記メモリに記憶される前記情報は、前記音声信号の有
声レベルを示す有声情報を含む ことを特徴とする請求項29に記載の音声デコーディン
グ装置。 - 【請求項32】 前記デコーディング動作は、適応ゲイ
ン形成コーディングを含み、 前記有声情報は、前記適応ゲイン形成コーディングと関
連するゲイン信号を含む ことを特徴とする請求項31に記載の音声デコーディン
グ装置。 - 【請求項33】 前記コントローラは、さらに改良用ロ
ジックを有し、 当該改良用ロジックは、前記コントローラが前記メモリ
に記憶された現在の有声レベルを示す前記有声情報を使
用すべきかどうか判定するため、前記現在の有声レベル
が所定のしきい値を越えていれば当該現在の有声レベル
を過去の有声レベルに対して評価する ことを特徴とする請求項31に記載の音声デコーディン
グ装置。 - 【請求項34】 前記デコーディング動作において使用
され、前記メモリに記憶される前記情報は、前記音声信
号の信号エネルギーを示す信号エネルギー情報を含む ことを特徴とする請求項29に記載の音声デコーディン
グ装置。 - 【請求項35】 前記デコーディング動作は、固定ゲイ
ン形成コーディングを含み、 前記信号エネルギー情報は、前記固定ゲイン形成コーデ
ィングに関連するゲイン信号を含む ことを特徴とする請求項34に記載の音声デコーディン
グ装置。 - 【請求項36】 前記デコーディング動作において使用
され、前記メモリに記憶される前記情報は、前記音声信
号の有声レベルを示す有声情報を含む ことを特徴とする請求項34に記載の音声デコーディン
グ装置。 - 【請求項37】 前記コントローラは、さらに改良用ロ
ジックを有し、 当該改良用ロジックは、前記コントローラが前記メモリ
に記憶された現在の有声レベルを示す前記有声情報を使
用すべきかどうか判定するため、前記現在の有声レベル
が所定のしきい値を越えていれば現在の信号エネルギー
を過去の信号エネルギーに対して評価する ことを特徴とする請求項36に記載の音声デコーディン
グ装置。 - 【請求項38】 前記デコーディング動作は線形予測コ
ーディングを含む ことを特徴とする請求項29に記載の音声デコーディン
グ装置。 - 【請求項39】 前記コントローラは、さらに、前記デ
コーディング動作において現在使用されている前記情報
に基づいて、前記修正レベルを示すレベル情報を出力す
るマップロジックを備える ことを特徴とする請求項30に記載の音声デコーディン
グ装置。 - 【請求項40】 前記コントローラは、さらに、前記マ
ップロジックから出力された前記レベル情報が示す修正
レベルが前記デコーディング動作において現在行われて
いるコード修正の修正レベルに対して所定値以上異なる
か判定するロジックを備える ことを特徴とする請求項39に記載の音声デコーディン
グ装置。 - 【請求項41】 前記デコーダは、前記コードブックと
して代数コードブックを備え、前記コード修正として、
前記代数コードブックからの出力に対してインパルスレ
スポンスとの畳み込み処理を行う反希薄分散フィルタを
備える ことを特徴とする請求項29に記載の音声デコーディン
グ装置。 - 【請求項42】 所定のコードブックを用いて、音声信
号のコード化表現からデコードされた音声信号を生成す
るための音声デコーディング方法であって、 前記音声信号の前記コード化表現を受信するためのステ
ップと、 前記コード化表現に、前記コードブックを用いたデコー
ディング動作を行うと共に、制御信号に応じて前記コー
ドブックからの出力に希薄分散(sparseness)を減少さ
せるようなコード修正を適応的に行って、前記デコード
された音声信号を生成するためのデコーディングステッ
プと、 前記デコーディング動作において現在及び過去に使用さ
れた情報をメモリに記憶し、前記現在及び過去に使用さ
れた前記情報に基づいて、前記コード修正のための前記
制御信号を生成するコントロールステップと を備えることを特徴とする音声デコーディング方法。 - 【請求項43】 前記デコーディングステップは、コー
ド修正なしを含む異なるレベルのコード修正を行うこと
ができ、 前記制御信号は、前記コード修正の修正レベルを示す ことを特徴とする請求項42に記載の音声デコーディン
グ方法。 - 【請求項44】 前記デコーディング動作において使用
され、前記メモリに記憶される前記情報は、前記音声信
号の有声レベルを示す有声情報を含む ことを特徴とする請求項42に記載の音声デコーディン
グ方法。 - 【請求項45】 前記デコーディングステップは、適応
ゲイン形成コーディングを含み、 前記有声情報は、前記適応ゲイン形成コーディングと関
連するゲイン信号を含む ことを特徴とする請求項44に記載の音声デコーディン
グ方法。 - 【請求項46】 前記コントロールステップは、前記有
声情報によって示される現在の有声レベルが所定のしき
い値を超えていれば、当該現在の有声レベルを過去の有
声レベルに対して評価するステップを含む ことを特徴とする請求項44に記載の音声デコーディン
グ方法。 - 【請求項47】 前記コントロールステップは、さら
に、前記評価によって前記現在の有声レベルがスプリア
スであることが判明した場合、異なる有声レベルを示す
ように前記現在の有声レベルを示す前記有声情報を変更
するステップを含む ことを特徴とする請求項46に記載の音声デコーディン
グ方法。 - 【請求項48】 前記異なる有声レベルは低い方の有声
レベルである ことを特徴とする請求項47に記載の音声デコーディン
グ方法。 - 【請求項49】 前記デコーディング動作において使用
され、前記メモリに記憶される前記情報は、前記音声信
号における信号エネルギーを示す信号エネルギー情報を
含む ことを特徴とする請求項42に記載の音声デコーディン
グ方法。 - 【請求項50】 前記デコーディングステップは、固定
ゲイン形成コーディングを含み、 前記信号エネルギー情報は前記固定ゲイン形成コーディ
ングに関連するゲイン信号を含む ことを特徴とする請求項49に記載の音声デコーディン
グ方法。 - 【請求項51】 前記デコーディング動作において使用
され、前記メモリに記憶される前記情報は、前記音声信
号の有声レベルを示す有声情報を含む ことを特徴とする請求項49に記載の音声デコーディン
グ方法。 - 【請求項52】 前記コントロールステップは、現在の
有声レベルを示す前記有声情報を使用すべきかどうか判
定するため、前記現在の有声レベルが所定のしきい値を
超えていれば現在の信号エネルギーを過去の信号エネル
ギーに対して評価するステップを含む ことを特徴とする請求項51に記載の音声デコーディン
グ方法。 - 【請求項53】 前記デコーディングステップは線形予
測コーディングを行う ことを特徴とする請求項42に記載の音声デコーディン
グ方法。 - 【請求項54】 前記コントロールステップは、前記デ
コーディング動作において現在使用されている前記情報
に基づいて、前記修正レベルを示すレベル情報を生成す
ると共に、前記レベル情報によって示される前記修正レ
ベルと前記デコーディング動作において現在行われてい
るコード修正の修正レベルとの差を判定するステップを
含む ことを特徴とする請求項43に記載の音声デコーディン
グ方法。 - 【請求項55】 前記コントロールステップは、前記差
が所定のしきい値以上あれば、前記現在の修正レベルと
の差がより小さい別の修正レベルに変更するステップを
含む ことを特徴とする請求項54に記載の音声デコーディン
グ方法。 - 【請求項56】 前記デコーディングステップは、前記
コードブックとして代数コードブックを使用し、前記コ
ード修正として、前記代数コードブックからの出力に対
してインパルスレスポンスとの畳み込み処理を行う反希
薄分散フィルタリングのステップを含む ことを特徴とする請求項42に記載の音声デコーディン
グ方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US09/034,590 | 1998-03-04 | ||
US09/034,590 US6058359A (en) | 1998-03-04 | 1998-03-04 | Speech coding including soft adaptability feature |
PCT/SE1999/000302 WO1999045532A1 (en) | 1998-03-04 | 1999-03-02 | Speech coding including soft adaptability feature |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2002506242A JP2002506242A (ja) | 2002-02-26 |
JP3378238B2 true JP3378238B2 (ja) | 2003-02-17 |
Family
ID=21877362
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000534999A Expired - Lifetime JP3378238B2 (ja) | 1998-03-04 | 1999-03-02 | ソフト適応性特性を含む音声コーディング |
Country Status (8)
Country | Link |
---|---|
US (2) | US6058359A (ja) |
EP (2) | EP1267329B1 (ja) |
JP (1) | JP3378238B2 (ja) |
CN (2) | CN1183513C (ja) |
AU (1) | AU2756299A (ja) |
DE (2) | DE69902233T2 (ja) |
RU (1) | RU2239239C2 (ja) |
WO (1) | WO1999045532A1 (ja) |
Families Citing this family (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE69715478T2 (de) * | 1996-11-07 | 2003-01-09 | Matsushita Electric Ind Co Ltd | Verfahren und Vorrichtung zur CELP Sprachkodierung und -dekodierung |
US6058359A (en) * | 1998-03-04 | 2000-05-02 | Telefonaktiebolaget L M Ericsson | Speech coding including soft adaptability feature |
EP1760694A3 (en) * | 1997-10-22 | 2007-03-14 | Matsushita Electric Industrial Co., Ltd. | Multistage vector quantization for speech encoding |
DE69837822T2 (de) * | 1997-12-24 | 2008-01-31 | Mitsubishi Denki K.K. | Verfahren und Vorrichtung zur Dekodierung von Sprachsignalen |
US6131047A (en) | 1997-12-30 | 2000-10-10 | Ericsson Inc. | Radiotelephones having contact-sensitive user interfaces and methods of operating same |
US6301556B1 (en) * | 1998-03-04 | 2001-10-09 | Telefonaktiebolaget L M. Ericsson (Publ) | Reducing sparseness in coded speech signals |
US6249758B1 (en) * | 1998-06-30 | 2001-06-19 | Nortel Networks Limited | Apparatus and method for coding speech signals by making use of voice/unvoiced characteristics of the speech signals |
US7072832B1 (en) * | 1998-08-24 | 2006-07-04 | Mindspeed Technologies, Inc. | System for speech encoding having an adaptive encoding arrangement |
US6959274B1 (en) * | 1999-09-22 | 2005-10-25 | Mindspeed Technologies, Inc. | Fixed rate speech compression system and method |
US6782360B1 (en) * | 1999-09-22 | 2004-08-24 | Mindspeed Technologies, Inc. | Gain quantization for a CELP speech coder |
US6438518B1 (en) * | 1999-10-28 | 2002-08-20 | Qualcomm Incorporated | Method and apparatus for using coding scheme selection patterns in a predictive speech coder to reduce sensitivity to frame error conditions |
US7016835B2 (en) * | 1999-10-29 | 2006-03-21 | International Business Machines Corporation | Speech and signal digitization by using recognition metrics to select from multiple techniques |
DE10009444A1 (de) * | 2000-02-29 | 2001-09-06 | Philips Corp Intellectual Pty | Betriebsverfahren für ein Mobiltelefon |
US6678651B2 (en) * | 2000-09-15 | 2004-01-13 | Mindspeed Technologies, Inc. | Short-term enhancement in CELP speech coding |
US7567900B2 (en) * | 2003-06-11 | 2009-07-28 | Panasonic Corporation | Harmonic structure based acoustic speech interval detection method and device |
KR100546758B1 (ko) * | 2003-06-30 | 2006-01-26 | 한국전자통신연구원 | 음성의 상호부호화시 전송률 결정 장치 및 방법 |
US7668712B2 (en) * | 2004-03-31 | 2010-02-23 | Microsoft Corporation | Audio encoding and decoding with intra frames and adaptive forward error correction |
US7831421B2 (en) * | 2005-05-31 | 2010-11-09 | Microsoft Corporation | Robust decoder |
US7177804B2 (en) * | 2005-05-31 | 2007-02-13 | Microsoft Corporation | Sub-band voice codec with multi-stage codebooks and redundant coding |
US7707034B2 (en) * | 2005-05-31 | 2010-04-27 | Microsoft Corporation | Audio codec post-filter |
US20090094026A1 (en) * | 2007-10-03 | 2009-04-09 | Binshi Cao | Method of determining an estimated frame energy of a communication |
CN101719814B (zh) * | 2009-12-08 | 2013-03-27 | 华为终端有限公司 | 确定带内信令译码模式的方法及装置 |
EP2593937B1 (en) * | 2010-07-16 | 2015-11-11 | Telefonaktiebolaget LM Ericsson (publ) | Audio encoder and decoder and methods for encoding and decoding an audio signal |
BR112013033900B1 (pt) | 2011-06-30 | 2022-03-15 | Samsung Electronics Co., Ltd | Método para gerar um sinal estendido de largura de banda para decodificação de áudio |
CN105976824B (zh) | 2012-12-06 | 2021-06-08 | 华为技术有限公司 | 信号解码的方法和设备 |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5396576A (en) * | 1991-05-22 | 1995-03-07 | Nippon Telegraph And Telephone Corporation | Speech coding and decoding methods using adaptive and random code books |
JP3432822B2 (ja) * | 1991-06-11 | 2003-08-04 | クゥアルコム・インコーポレイテッド | 可変速度ボコーダ |
US5734789A (en) * | 1992-06-01 | 1998-03-31 | Hughes Electronics | Voiced, unvoiced or noise modes in a CELP vocoder |
US5495555A (en) * | 1992-06-01 | 1996-02-27 | Hughes Aircraft Company | High quality low bit rate celp-based speech codec |
CA2108623A1 (en) * | 1992-11-02 | 1994-05-03 | Yi-Sheng Wang | Adaptive pitch pulse enhancer and method for use in a codebook excited linear prediction (celp) search loop |
SE501305C2 (sv) * | 1993-05-26 | 1995-01-09 | Ericsson Telefon Ab L M | Förfarande och anordning för diskriminering mellan stationära och icke stationära signaler |
US5727122A (en) * | 1993-06-10 | 1998-03-10 | Oki Electric Industry Co., Ltd. | Code excitation linear predictive (CELP) encoder and decoder and code excitation linear predictive coding method |
EP0944037B1 (en) * | 1995-01-17 | 2001-10-10 | Nec Corporation | Speech encoder with features extracted from current and previous frames |
JPH08263099A (ja) * | 1995-03-23 | 1996-10-11 | Toshiba Corp | 符号化装置 |
US5692101A (en) * | 1995-11-20 | 1997-11-25 | Motorola, Inc. | Speech coding method and apparatus using mean squared error modifier for selected speech coder parameters using VSELP techniques |
WO1999010719A1 (en) * | 1997-08-29 | 1999-03-04 | The Regents Of The University Of California | Method and apparatus for hybrid coding of speech at 4kbps |
US6029125A (en) * | 1997-09-02 | 2000-02-22 | Telefonaktiebolaget L M Ericsson, (Publ) | Reducing sparseness in coded speech signals |
US6058359A (en) * | 1998-03-04 | 2000-05-02 | Telefonaktiebolaget L M Ericsson | Speech coding including soft adaptability feature |
US6173257B1 (en) * | 1998-08-24 | 2001-01-09 | Conexant Systems, Inc | Completed fixed codebook for speech encoder |
US6104992A (en) * | 1998-08-24 | 2000-08-15 | Conexant Systems, Inc. | Adaptive gain reduction to produce fixed codebook target signal |
US6188980B1 (en) * | 1998-08-24 | 2001-02-13 | Conexant Systems, Inc. | Synchronized encoder-decoder frame concealment using speech coding parameters including line spectral frequencies and filter coefficients |
-
1998
- 1998-03-04 US US09/034,590 patent/US6058359A/en not_active Expired - Lifetime
- 1998-08-25 RU RU2000108437A patent/RU2239239C2/ru active
-
1999
- 1999-03-02 CN CNB998036404A patent/CN1183513C/zh not_active Expired - Lifetime
- 1999-03-02 CN CNB2004100698240A patent/CN1262992C/zh not_active Expired - Lifetime
- 1999-03-02 JP JP2000534999A patent/JP3378238B2/ja not_active Expired - Lifetime
- 1999-03-02 AU AU27562/99A patent/AU2756299A/en not_active Abandoned
- 1999-03-02 WO PCT/SE1999/000302 patent/WO1999045532A1/en active Search and Examination
- 1999-03-02 DE DE69902233T patent/DE69902233T2/de not_active Expired - Lifetime
- 1999-03-02 EP EP02009385A patent/EP1267329B1/en not_active Expired - Lifetime
- 1999-03-02 EP EP99908047A patent/EP1058927B1/en not_active Expired - Lifetime
- 1999-03-02 DE DE69925515T patent/DE69925515T2/de not_active Expired - Lifetime
- 1999-12-22 US US09/469,258 patent/US6564183B1/en not_active Expired - Lifetime
Non-Patent Citations (2)
Title |
---|
Roar Hagen et al,Removal of Sparse−Excitation Artifacts In CELP,Proc.ICASSP98,1998年 5月,p.145−148 |
片岡章俊,守谷健弘,CELP方式に基づく8kbit/低遅延音声符号化,電子情報通信学会技術研究報告[音声],1992年 2月19日,SP91−119,p.9−16 |
Also Published As
Publication number | Publication date |
---|---|
EP1058927B1 (en) | 2002-07-24 |
EP1058927A1 (en) | 2000-12-13 |
EP1267329B1 (en) | 2005-05-25 |
US6564183B1 (en) | 2003-05-13 |
DE69925515D1 (de) | 2005-06-30 |
CN1262992C (zh) | 2006-07-05 |
CN1555047A (zh) | 2004-12-15 |
EP1267329A1 (en) | 2002-12-18 |
WO1999045532A1 (en) | 1999-09-10 |
CN1183513C (zh) | 2005-01-05 |
RU2239239C2 (ru) | 2004-10-27 |
DE69925515T2 (de) | 2006-02-09 |
CN1292913A (zh) | 2001-04-25 |
DE69902233D1 (de) | 2002-08-29 |
AU2756299A (en) | 1999-09-20 |
US6058359A (en) | 2000-05-02 |
JP2002506242A (ja) | 2002-02-26 |
DE69902233T2 (de) | 2003-01-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3378238B2 (ja) | ソフト適応性特性を含む音声コーディング | |
US6029128A (en) | Speech synthesizer | |
JP3432082B2 (ja) | フレーム消失の間のピッチ遅れ修正方法 | |
US10339946B2 (en) | Audio decoder and method for providing a decoded audio information using an error concealment modifying a time domain excitation signal | |
AU752229B2 (en) | Perceptual weighting device and method for efficient coding of wideband signals | |
EP1905000B1 (en) | Selectively using multiple entropy models in adaptive coding and decoding | |
US7693709B2 (en) | Reordering coefficients for waveform coding or decoding | |
JP5374418B2 (ja) | 音声符号化用適応符号帳ゲインの制御 | |
US20070016415A1 (en) | Prediction of spectral coefficients in waveform coding and decoding | |
JPH09120298A (ja) | フレーム消失の間の音声復号に使用する音声の有声/無声分類 | |
JPH09120299A (ja) | 適応コードブックに基づく音声圧縮システム | |
EP2491555A1 (en) | Multi-mode audio codec and celp coding adapted therefore | |
US5659659A (en) | Speech compressor using trellis encoding and linear prediction | |
JP3564144B2 (ja) | “前方”および“後方”lpc分析による音声周波数信号を符号化するための方法および装置 | |
JPH09120297A (ja) | フレーム消失の間のコードブック利得減衰 | |
KR20170003596A (ko) | 음성 정보를 갖는 개선된 프레임 손실 보정 | |
US11996110B2 (en) | Apparatus and method for synthesizing an audio signal, decoder, encoder, system and computer program | |
JP3219467B2 (ja) | 音声復号化方法 | |
JP3490325B2 (ja) | 音声信号符号化方法、復号方法およびその符号化器、復号器 | |
JP3099852B2 (ja) | 励振信号の利得量子化方法 | |
JP2700974B2 (ja) | 音声符号化法 | |
JP3270146B2 (ja) | 音声符号化装置 | |
KR20000013870A (ko) | 음성 부호화기에서 피치 예측을 이용한 오류 프레임 처리 방법및 그를 이용한 음성 부호화 방법 | |
JPH07248795A (ja) | 音声処理装置 | |
MXPA96002143A (en) | System for speech compression based on adaptable codigocifrado, better |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20021122 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081206 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091206 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101206 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101206 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111206 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111206 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121206 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131206 Year of fee payment: 11 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |