JP3378238B2 - ソフト適応性特性を含む音声コーディング - Google Patents

ソフト適応性特性を含む音声コーディング

Info

Publication number
JP3378238B2
JP3378238B2 JP2000534999A JP2000534999A JP3378238B2 JP 3378238 B2 JP3378238 B2 JP 3378238B2 JP 2000534999 A JP2000534999 A JP 2000534999A JP 2000534999 A JP2000534999 A JP 2000534999A JP 3378238 B2 JP3378238 B2 JP 3378238B2
Authority
JP
Japan
Prior art keywords
level
voiced
signal
coding
decoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2000534999A
Other languages
English (en)
Other versions
JP2002506242A (ja
Inventor
エクデン、エリク
ハーゲン、ロアル
Original Assignee
テレフオンアクチーボラゲツト エル エム エリクソン(パブル)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=21877362&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=JP3378238(B2) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by テレフオンアクチーボラゲツト エル エム エリクソン(パブル) filed Critical テレフオンアクチーボラゲツト エル エム エリクソン(パブル)
Publication of JP2002506242A publication Critical patent/JP2002506242A/ja
Application granted granted Critical
Publication of JP3378238B2 publication Critical patent/JP3378238B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/002Dynamic bit allocation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0007Codebook element generation
    • G10L2019/0008Algebraic codebooks

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【発明の詳細な説明】
【0001】(技術分野) 本発明は、広く、音声(スピーチ)コーディングに関
し、特に、音声信号コーディングを音声信号の局所的特
性に適応させることに関する。
【0002】(背景技術) 殆どの従来の音声コーダは、エンコードされるべき音声
文節の局所的特性とは無関係に同じコーディング方法を
適用する。しかしながら、音声の局所的特性に従ってコ
ーディング方法を変更あるいは適用すれば、品質向上を
得ることができる。そのような適応方法は、一般に、所
与の音声文節の何らかの形式の分類に基づき、その分類
を使用して、いくつかのコーディングモード(マルチモ
ードコーディング)の中から1つを選択する。そのよう
な技術が特に役立つのは、背景ノイズがある場合で、そ
の自然な音再生を得るためには、音声信号に一般に適用
されるコーディングとは違ったコーディングアプローチ
が要求される。
【0003】前記分類を利用した方法の1つの欠点は、
それが柔軟でないことである。所与の音声文節の分類が
間違って、その結果として、その文節に不適切なコーデ
ィングモードを選択する危険がある。不適切なコーディ
ングモードは、典型的には、コード化して得られた音声
信号が非常に劣化される。このような分類を行うアプロ
ーチは、音声コーダの性能を制限するという不利があ
る。
【0004】マルチモードコーディングにおけるよく知
られた技術は、閉ループモード判定を行う方法で、コー
ダはすべてのモードを試みて、何らかの基準によって、
その中から最適なものを判定する。これは、分類間違え
の問題をある程度軽減するが、そのようなやり方に対し
て、適切な基準を見つけるのが問題である。前記分類を
伴う方法においてもそうであるが、どのモードが選択さ
れたかを示す情報を送信することが必要になる(即ち、
送信側エンコーダから通信チャンネルを介して受信側デ
コーダへオーバヘッドビットを送る必要がある)。これ
は、実際には、コーディングモードの数を制限する。
【0005】従って、音声コーディング(エンコーディ
ング又はデコーディング)を音声の局所的特性によって
変更又は適応化することができることが必要であり、そ
の際、前記従来の分類による劣化を伴ってはならず、ま
た選択された適用を記述するオーバヘッドビットの送信
を必要としてはならない。
【0006】本発明によれば、音声コーディング(エン
コーディング又はデコーディング)は、柔軟性のない分
類やコード化された音声信号のひどい劣化なしに、ま
た、選択された適応化を記載するオーバヘッドビットの
送信を必要とせずに適応化が可能である。適応化(適
応)は、コーダ(エンコーダ又はデコーダ)にすでに存
在しているパラメータに基づくものであるので、適応を
記載する余分な情報を送信する必要がない。これによ
り、コーディング(エンコーディング又はデコーディン
グ)方法の無限の変更が可能となる完全にソフト的な適
応方式が可能となる。更に、適応は、信号のコーダ特性
に基づき、適応は、ある音声文節によってどれくらいう
まく基本コーディングアプローチが働くかによって行わ
れる。
【0007】(詳細な説明) 図1の例は、本発明の音声エンコーディングへの適用を
示す。図1の装置は、例えば、セルラー電話のような無
線音声通信デバイスにおいて利用することができる。音
声エンコーディンング部11はその入力において非コー
ド化信号を受信し、その出力においてコード化された信
号を提供する。非コード化信号は、元の音声信号であ
る。音声エンコーディング部11は、ソフト的適応コン
トローラ19からの制御信号を受信する制御入力17を
備える。コントローラ19からの制御信号は、エンコー
ディング装置11によって行われたエンコーディング動
作がどの程度適応されるべきかを示す。コントローラ1
9は、非コード化信号の局所的音声特性の示す情報をエ
ンコーダ11から受け取るための入力18を備える。コ
ントローラ19は、18において受信された情報に応答
して、17において制御信号を提供する。
【0008】図1Aは、図1に示された一般的タイプの
音声エンコーディング装置の例を示し、本発明によるエ
ンコーダとソフト的適応コントロールを備える。図1A
は、固定ゲイン形成部12と、適応ゲイン形成部14と
を備える符号励起線形予測符号化方式(Code Excited L
inear Prediction (CELP))音声エンコーダの該当部分
を示す。ソフト的な適応コントロールが、固定ゲイン形
成部12に備えられ、形成部12によって実現される固
定ゲイン形成コーディングのソフト的適応を可能にす
る。
【0009】図2は、図1AのCELPエンコーディン
グ装置の例をより詳細に示す。図2に示されるように、
図1Aの固定ゲイン形成コーディング部12は、固定コ
ードブック(fixed codebook)21と、ゲインマルチプ
ライア(gain multiplier)25と、コードモディファ
イア(code modifier)16とを備える。図1Aが示す
適応ゲイン形成コーディング部14は、適応コードブッ
ク(adaptive codebook)23とゲインマルチプライア
29とを備える。固定コードブック21に適用されるゲ
インFGと、適応コードブック23に適用されるゲイン
AGは、従来どおり、CELPエンコーダで生成され
る。特に、当業界で良く知られているように、従来のサ
ーチ方法は、合成フィルタ28の非コード化信号入力及
び出力に応答して行われる。このサーチ方法は、ゲイン
AGとFG,及びコードブック21と23への入力を提
供する。
【0010】適応コードブックゲインAG及び固定コー
ドブックゲインFGは、コントローラ19に入力され、
局所的音声特性を示す情報を提供する。特に、本発明
は、適応コードブックゲインAGが現在の音声文節の有
声レベル(即ち、ピッチ周期の強さ)を示すのにも使用
することができるということ、及び固定コードブックゲ
インFGが現在の音声文節の信号エネルギーを示すのに
も使用することができるということを認識している。従
来の8kHzサンプリング率で、例えば、40サンプル
から成る各ブロックが、従来の適応及び固定コードブッ
ク21及び23のそれぞれから5ミリ秒ごとにアクセス
される。固定コードブック21と適応コードブック23
とから現在アクセスされているサンプルの各ブロックに
よって表される音声文節に対し、AGは、音声レベル情
報を提供し、FGは信号エネルギー情報を提供する。
【0011】コードモディファイア16は、25におけ
るゲインFGの適用の後、固定コードブック21からの
コード化された信号評価を受信する。次に、モディファ
イア16は、26において、加算回路27に対し、選択
的に修正されたコード化された信号評価を提供する。加
算回路27の他の入力は、従来のように、29における
適応コードブックゲインAGの適用の後で、適応コード
ブック23からのコード化された信号評価を受信する。
加算回路27の出力は、従来の合成フィルタ28を駆動
し、また、適応コードブック23にフィードバックされ
る。
【0012】適応コードブックゲインAGがハイなら
ば、コーダは、適応コードブック成分を大々的に利用
し、音声文節は、音声音文節である確率が高く、それ
は、典型的には、コーディング処理の適応を殆どあるい
は全く伴わずにCELPコーダによって受け入れられる
ように処理される。AGがロウであれば、信号は無声音
音声又は背景ノイズであることが多い。このロウAGの
場合、モディファイア16は、比較的高いレベルのコー
ディング修正を提供するのが有利である。高い適応コー
ドブックゲインと低い適応コードブックゲインとの間の
範囲において、必要とされる修正の量は、低い適応コー
ドブックゲインに関連した比較的高いレベルの修正と、
高い適応コードブックゲインに関連した比較的低い修正
あるいは修正なしとの間にあることが好ましい。
【0013】図3は、図2のモードモディファイア16
をより詳細に示す。図3の例に示されるように、コント
ローラ19から17で受信される制御信号はスイッチ3
1及び33を動作させて、24で受信されるコード化信
号評価の所望の修正レベルを選択する。図3に示される
ように、修飾レベル0は、コード化信号評価を修正なし
に渡す。1つの実施の形態において、修正レベル1は、
比較的低いレベルの修正を提供し、修正レベル2は、修
正レベル1によって提供されるものより比較的高い修正
レベルを提供し、修正レベル1も2も、例えば、修正レ
ベルNによって提供されるより少ないコード修正を提供
する。このようにして、ソフト適応コントローラは、適
応コードブックゲイン(有声レベル情報)と固定コード
ブックゲイン(信号エネルギー情報)を使用して、どの
程度の(どのレベルの)修正をモディファイア16がコ
ード化信号評価に適用するかを選択する。このゲイン情
報は、コーダによってそのコーディング処理においてす
でに生成されているので、所望の有声レベルと信号エネ
ルギー情報を生成するのにオーバヘッドは必要ない。
【0014】適応コードブックゲイン及び固定コードブ
ックゲインは、それぞれ、有声レベルと信号エネルギー
とに関する情報を提供するのに使用されるが、本発明の
ソフト適応制御技術がCELPコーダ以外の音声コーダ
に組み込まれる場合、その他の適当なパラメータが所望
の有声レベルと信号エネルギー情報(あるいは他の所望
の情報)を提供してもよい。
【0015】図4の例は、ソフト的適応コントローラ1
9の図2の実施の形態をより詳細に示すブロック図であ
る。各音声文節に対する適応コードブックゲインAG及
び固定コードブックゲインFGは、それぞれバッファ4
1及び42で受信され記憶される。バッファ41及び4
2を使用して、現在の音声文節のゲイン値のほかに所定
数の先行する音声文節のゲイン値も記憶する。バッファ
41及び42は、(音質)改良のためのロジック43に
接続される。改良用ロジック43の出力45は、コード
修正レベルマップ44に接続される。コード修正レベル
マップ44(例えば、一覧表)は、その出力49におい
て、コードモディファイア16によって実現されるべ
き、提案される新規レベルの修正を提供する。新規レベ
ルの修飾は新規レベルレジスタ46に記憶される。新規
レベルレジスタ46は、現在レベルレジスタ48に接続
され、ヒステリシスロジック47がレジスタ47及び4
8に接続される。現在レベルレジスタ48は、コードモ
ディファイア16の入力17へ所望の修正レベル情報を
提供する。次に、コードモディファイア16は、スイッ
チ31及び33を動作させて、現在レベルレジスタ48
によって示される修正レベルを提供する。
【0016】図4のソフト的に適応されるコントローラ
の構成及び動作について、図5のフローチャートを参照
しながら説明する。
【0017】図5は、図2及び図4に示されるソフト的
適応コントローラの実施の形態によって行われるレベル
制御動作の例を示す。図5の50において、ソフト的適
応コントローラは、適応コードブックから取得されるサ
ンプルの最も新しいブロックに関連した適応コードブッ
クゲインAGの受信のために待機する。AGが受信され
た後、図4の改良用ロジック43は、51において、こ
の新規適応コードブックゲイン値がしきい値THAGより
大きいかどうかを決定する。もしそうでなければ、適応
コードブックゲイン値AGが56で使用されて、図5の
マップ44から新規レベル値が取得される。このよう
に、適応コードブックゲイン値がしきい値THAGを超え
なければ、図4の改良用ロジック43は適応コードブッ
クゲイン値を図4のコード修正レベルマップ44に渡
し、そのコード修正レベルマップ44において適応コー
ドブックゲイン値が使用されて、新規レベル値が取得さ
れる。
【0018】本発明の1実施の形態において、第1範囲
内の適応コードブックゲイン値が0という新規レベル値
にマップされ(従って図3のコードモディファイアにお
いてレベル0を選択し)、第2範囲内のゲイン値が1と
いう新規レベルにマップされ(従って図3のコーディン
グモディファイアにおいてレベル1を選択し)、第3範
囲内のゲイン値が2という新規レベル値にマップされ
(コードモディファイア16におけるレベル2修正の選
択に対応)、というように続く。各ゲイン値は、モディ
ファイア11が充分な修正レベルを有すれば、一義的新
規レベル値にマップすることができる。AG値に対する
修正レベルの割合が増大するにつれて、修正レベルの変
化がより微細になり(無限小に近づき)、このようし
て、AG変化に対する「ソフト的」適応を提供する。
【0019】51において、適応コードブックゲイン値
がしきい値を超えると、図4の改良用ロジック43が固
定コードブックゲインバッファ42を調べ、しきい値を
超えるAG値がFG値の大きな増加に対応するかどうか
を決める。このFGの増加は、音声開始(speech onse
t)が生じていることを示す。52において開始(onse
t)が検出されると、56において、適応コードブック
ゲイン値がマップに適用される(図4の44を参照)。
【0020】52において開始が示されると、改良用ロ
ジック(図4の43を参照)は、第4図のバッファ41
に記憶された適応コードブックゲインの以前の値を考慮
する。ステップ51から、現在のAG値はしきい値を超
える値であるが、それにもかかわらず、54において、
しきい値を超える値がスプリアス値であるかどうかを決
めるため、53において先行するAG値が考慮される。
53において実行することのできる処理のタイプの例
は、平滑化動作、平均化動作、その他の形式のフィルタ
リング動作、あるいは単にしきい値THAGを超えなかっ
た先行するAG値の数を数える動作である。例えば、バ
ッファ41内のAG値のうち半分以上が値THAGを超え
なければ、ブロック54から「Y」の路線(スプリアス
AG値)が取り込まれ、改良用ロジック(図4の43)
が55において、AG値を下げる。前述のように、低い
AG値は、低いレベルの有声を示すので、低いAG値
は、結果的に比較的大きなコード化音声評価の修正とな
る、より高い新規レベル値にマッピングするのが好まし
い。尚、しきい値を超えるAG値は、52において開始
が検出されれば、先行するAG値を考慮することなし
に、受け入れられる。53及び54においてスプリアス
AG値が検出されなければ、しきい値を超えるAG値は
受け入れられ、56において、44をマッピングするの
に適用される。
【0021】例えば図5の53乃至55におけるAG値
のように、コーダにより使用される先行情報が使用でき
それを考慮することによって、高解像度の「ソフト的」
適応制御が可能となり、その適応制御においては、コー
ディング方法の無限の変更あるいは適応が可能となる。
【0022】図5の57において、ヒステリシスロジッ
ク(図4の47を参照)は新規レベル値(NL)を現在
レベル値(CL)と比較して、それらの値の差を得る。
58において、差DIFFがヒステリシスしきい値TH
Hを超えると、59において、ヒステリシスロジックは
新規レベル値を必要に応じてインクリメント又はデクリ
メントして、それを現在レベル値に近づける。その後、
新規レベル及び現在レベル値は、再度、57において比
較され、それらの間の差DIFFが求められる。その
後、58において、DIFFがヒステリシスしきい値を
超えるかどうか決められ、もしそうであれば、新規レベ
ル値は、再度、59において、現在レベル値に近づけら
れ、差DIFFが再度、57において、求められる。差
DIFFが58においてヒステリシスしきい値を超えな
いとわかると、60において、ヒステリシスロジック
(図4の47)は、新規レベル値が現在レベルレジスタ
48に書き込まれることを許容する。レジスタ48から
の現在レベル値は、図3のコードモディファイアの制御
入力17を切り替えるように接続され、それにより、所
望のレベルの修正が選択される。
【0023】尚、前述からわかるように、ヒステリシス
ロジック47は、1つの音声文節から次の音声文節に修
正が変化することのできるレベルの数を制限する。しか
しながら、57乃至59のヒステリシス動作は、改良用
ロジックが音声開始が生じていると固定コードブックゲ
インバッファから判定すれば、判定ブロック61からバ
イパスされる。この場合、改良用ロジック43は、ヒス
テリシスロジック47(図4の制御ライン40を参照)
のヒステリシス動作を不能にする。これにより、新規レ
ベル値が直接的に現在レベルレジスタ48にロードされ
る。従って、音声開始がある場合、ヒステリシスは適用
されない。
【0024】前述のAG及びFGを使用した適応判定制
御は、ビット送信オーバヘッドを必要としないので有利
である。なぜなら、AG及びFGは、非コード化信号の
特性に基づいてコーダ自身によって生成されるからであ
る。
【0025】図20の例は、本発明を音声デコーディン
グ処理に適用した例である。図20の構成は、例えば、
セルラー電話のような無線音声通信装置に利用すること
ができる。200の音声デコーディング装置は、その入
力において、コード化情報を受け取り、その出力におい
てデコードされた信号を提供する。デコーダ200の入
力において受信されたコード化情報は、例えば、図1の
コーダ11によって出力されたコード化信号の受信版
で、通信チャンネルを介してデコーダ200に送信され
たものである。本発明のソフト的適応コントロール19
は、前述の図1のエンコーダと同様に、デコーダ200
に適用される。
【0026】図20Aは、図20に示されたタイプの音
声デコーディング構成の例を示し、デコーダと本発明に
基づくソフト的適応コントロールとを備える。図20A
は、CELP音声デコーダの該当部分を示す。図20A
のCELPデコーディング装置は、図1Aに示されたC
ELPコーディング装置と同様であるが、固定及び適応
ゲイン形成コーディング部12及び14は、デコーダ入
力で受信されるコード化情報をデマルチプレクスするこ
とによって得られる(従来のように)のに対して、図1
Aエンコーダのそれらの部分への入力は、従来のサーチ
方法から得られることが異なる。これらのCELPエン
コーダとCELPデコーダとの間の関係は、当業者にと
っては明らかである。図20Aにおいて、図1Aにおけ
ると同様に、本発明のソフト的適応コントロール19
は、固定ゲイン形成コーディング部12に、図1Aにつ
いての説明と同様に適用される。
【0027】図20Aの装置を詳細に示す図21の例に
おいてより明確に見られるように、図21のデコーダ装
置における本発明のソフト的適応コントロール19の適
用は、図2のエンコーダ装置に実現された場合と同様で
ある。前述のように、固定及び適応コードブック21及
び23への入力は、受信されたコード化情報からデマル
チプレクスされる。ゲインデコーダ22は、また、従来
と同様に、デコーダで受信されたコード化情報からデマ
ルチプレクスされた入力信号を受信する。図2と図21
を比較すると明らかなように、本発明のソフト的適応コ
ントロールは、図2のエンコーダについて説明された方
法と同様に、図21のデコーダにおいて動作する。従っ
て、図2のエンコーダについての本発明のソフト的適応
コントロールの前述の説明(図3乃至5、及び対応の説
明を含む)は、同様に、図21のデコーダに適用するこ
とができることが分る。
【0028】図6は、図3のコードモディファイア(co
de modifier)の修正レベルの1つを実現した例を示
す。図6の装置は、図2又は図21の固定コードブック
から受信されたコード化音声評価における希薄分散(spa
rseness)を減少させるために設計された反希薄分散フィ
ルタ(anti-sparseness filter)として特徴付けられ
る。希薄分散(sparseness)とは、例えば代数コードブ
ックのような固定コードブック21内の所与のコードブ
ックエントリのサンプルのうち少数のサンプルだけが非
ゼロサンプル値を持っているような状態を指す。この希
薄分散状態は、特に、音声圧縮をするために代数コード
ブックのビットレートが減少させられた場合に、よくお
きる。コードブックエントリにおいて非ゼロサンプルが
非常に少ない場合、その結果生じる希薄分散は、従来の
音声コーダのコード化音声信号において容易に実感され
る劣化となる。
【0029】図6に示された反希薄分散フィルタは、希
薄分散問題を軽減するために設計されている。図6の反
希薄分散フィルタは、オールパスフィルタ(all-pass f
ilter)と関連するインパルスレスポンス(65)を有
する固定(例えば、代数)コードブック21から受信さ
れたコード化音声評価の巡回たたみ込み(circular con
volution)を行うコンボルバ(convolver)63を備え
る。図6の反希薄分散フィルタの動作例は図7乃至11
に示される。
【0030】図10は、40個のサンプルのうち非ゼロ
サンプルがたった2個である図2(又は図21)のコー
ドブック21からのエントリの例を示す。この希薄分散
特性は、非ゼロサンプルの数を増加させることができれ
ば、減らすことができる。非ゼロサンプルの数を増加さ
せる方法の1つは、40個のサンプルのブロック全体に
エネルギーを分散させるのに適した特性を持つフィルタ
に、図10のコードブックエントリを適用することであ
る。図7及び図8は、それぞれ、図10のコードブック
エントリの40個のサンプル全体にエネルギーを適切に
分散させることのできるオールパスフィルタの強度と位
相(ラジアン)を示す。図7及び図8のフィルタは、高
周波数範囲の位相スペクトルを2と4kHzの間で変化
させ、一方、低周波数範囲を2kHz未満でわずかに変
化させる。
【0031】図9の例は、図7及び図8で定義されたオ
ールパスフィルタのインパルスレスポンスを示すグラフ
である。図6の反希薄分散フィルタは、図10のサンプ
ルブロック上に図9のインパルスの巡回たたみ込みを行
う。コードブックエントリは40個のサンプルのブロッ
クとしてコードブックから提供されるので、たたみ込み
動作はブロック単位で行われる。図10の各サンプル
は、たたみ込み動作において40個の中間乗算結果を生
成する。例えば、図10における位置7におけるサンプ
ルに注目すると、最初の34個の乗算結果は図11の結
果ブロックの位置7乃至40に割り当てられ、残りの6
個の乗算結果は、結果ブロックの位置1乃至6に割り当
てられるように、巡回たたみ込み動作によって「ラッピ
ング(wrapped arcund)」される。残りの図10のサンプ
ルのそれぞれによって生成された40個の中間乗算結果
は、同様に、図11の結果ブロック内の位置に割り当て
られた、サンプル1は、もちろん、ラッピングを必要と
しない。図11の結果ブロック内各位置について、そこ
に割り当てられた40個の中間乗算結果(図10のサン
プルごとに1つの乗算結果)が合計され、その合計は、
その位置のたたみ込み結果を示す。
【0032】図10及び図11を調べるとわかるよう
に、巡回たたみ込みは、エネルギーがブロック全体に分
散されることによって、非ゼロサンプルの数を格段に増
加させ、それに応じて、希薄分散の量を減らすよう図1
0のブロックのフーリエスペクトルを変化させる。ブロ
ック単位の巡回たたみ込みを行うことによる効果は、図
2(又は図21)の合成フィルタ28によって平滑化す
ることができる。
【0033】図12乃至図16は、図6に示されたタイ
プの反希薄分散フィルタの動作の別の例を示す。図12
及び図13のオールパスフィルタは、3kHz未満の位
相スペクトルを実質的に変化させることなく、3乃至4
kHzの位相スペクトルを変化させる。フィルタのイン
パルスレスポンスは図14に示されている。図16を参
照し、また図15が図10と同じサンプルブロックを示
していることを考慮すると、図12乃至図16に示され
た反希薄分散動作は、図11に示されたほどのエネルギ
ー分散を行わない。従って、図12乃至図16が定義す
る反希薄分散フィルタは、図7乃至図11に定義される
フィルタほどはコードブックエントリを修正しない。従
って、図7乃至図11のフィルタ及び図12乃至図16
のフィルタは、それぞれ、コード化音声評価の異なった
レベルの修正を定義する。再度、図2及び図3を参照す
ると、低いAG値は、適応コードブック成分が比較的小
さく、固定(例えば、代数)コードブック21から比較
的大きな貢献が得られることを示す。固定コードブック
エントリの前記希薄分散により、コントローラ19は、
図12乃至図16の反希薄分散フィルタよりも、図7乃
至図11の反希薄分散フィルタを選択する。なぜなら、
図7乃至図11のフィルタは、図12乃至図16のフィ
ルタより大きなサンプルブロックの修正を提供するから
である。適応コードブックゲインAGの値がより大きい
場合には、固定コードブックの貢献は比較的少なく、コ
ントローラ19は、例えば、より少ない反希薄分散の修
正を提供する図12乃至図16のフィルタを選択する。
【0034】このように、本発明は、所与の音声文節の
局所的特性を利用して、その文節のコード化音声評価を
修正すべきか否か、また修正するとしたらどの程度修正
するかを決めることができるようにする。様々なレベル
の修正の例としては、修正がないこと、比較的高いエネ
ルギー分散特性をもった反希薄分散フィルタ、比較的低
いエネルギー分散特性をもった反希薄分散フィルタがあ
る。一般にCELPコーダにおいては、適応コードブッ
クゲインが高い場合、それは、比較的高い有声レベルを
示し、典型的には、殆ど、あるいは全く、修正が必要な
い。反対に、適応コードブックゲインが低い場合、典型
的には、実質的修正が有利であることを示す。反希薄分
散フィルタの特定の例において、高い適応コードブック
ゲイン値が低い固定コードブックゲイン値と結合されて
いる場合、固定コードブックの貢献(希薄分散の貢献)
は比較的小さく、従って反希薄分散フィルタからの修正
はあまり必要としない(例えば、図12乃至16)こと
を示す。反対に、より高い固定コードブックゲイン値が
より低い適応コードブックゲイン値と結合されている場
合、固定コードブックの貢献は比較的大きく、従って大
きい反希薄分散の修正を使用することを示す。(例え
ば、図7乃至図11の反希薄フィルタ)。前述のよう
に、本発明に基づくマルチーレベルコードモディファイ
アは、選択可能な修正のレベルを必要な数だけ使用する
ことができる。
【0035】図17は、図2のCELPエンコーディン
グ装置及び図21のCELPデコーディング装置に代わ
る例を示し、特にソフト的適応コントロールを用いたマ
ルチレベル修正を適応コードブック出力に適用する例で
ある。
【0036】図18は、図2のCELPエンコーディン
グ装置及び図21のCELPデコーディング装置に代わ
る例を示し、加算ゲートの出力で適用されるマルチレベ
ルコードモディファイアとソフト的適応コントローラと
を備える。
【0037】図19の例は、図2、図17、及び図21
のCELPコーディング装置が、どのようにして、モデ
ィファイア16の上流に入力のある加算回路10から適
応コードブック23へフィードバックを提供するように
変更できるかを示す。
【0038】当業者には明らかなように、図1乃至図2
1を参照した上記実施の形態は、適当にプログラムされ
たデジタル信号プロセッサその他のデータプロセッサを
使用することによって簡単に実現することができ、ある
いは、そのような適当にプログラムされたデジタル信号
プロセッサその他のデータプロセッサを、それに結合さ
れた付加的外部回路と組み合わせて使用することによっ
ても実現することができる。
【0039】以上、本発明の実施の形態を例として説明
してきたが、これは、本発明の範囲を限定するものでは
なく、本発明は、様々な実施の形態で実現することがで
きる。 [図面の簡単な説明]
【図1】本発明によるソフト的適応音声エンコーディン
グ方式を示すブロック図である。
【図1A】図1の構成を詳細に示す。
【図2】図1Aの構成の詳細を示す。
【図3】図2及び図21のマルチレベルコードモディフ
ァイアの詳細を示す。
【図4】図2及び図21のソフト的適応コントローラの
例を示す。
【図5】図4のソフト的適応コントローラの動作を示す
フローチャートである。
【図6】図3のマルチレベルコードモディファイアにお
けるモディファイアレベルの1つとして提供されること
のできる本発明に基づく反希薄分散フィルタを示す。
【図7】図6に示された形式の反希薄分散フィルタの動
作を示す。
【図8】図6に示された形式の反希薄分散フィルタの動
作を示す。
【図9】図6に示された形式の反希薄分散フィルタの動
作を示す。
【図10】図6に示された形式の反希薄分散フィルタの
動作を示す。
【図11】図6に示された形式の反希薄分散フィルタの
動作を示す。
【図12】図6に示されたタイプの反希薄分散フィルタ
の動作であって、図7乃至11の反希薄分散フィルタよ
り相対的に低いレベルでの反希薄分散動作を示す。
【図13】図6に示されたタイプの反希薄分散フィルタ
の動作であって、図7乃至11の反希薄分散フィルタよ
り相対的に低いレベルでの反希薄分散動作を示す。
【図14】図6に示されたタイプの反希薄分散フィルタ
の動作であって、図7乃至11の反希薄分散フィルタよ
り相対的に低いレベルでの反希薄分散動作を示す。
【図15】図6に示されたタイプの反希薄分散フィルタ
の動作であって、図7乃至11の反希薄分散フィルタよ
り相対的に低いレベルでの反希薄分散動作を示す。
【図16】図6に示されたタイプの反希薄分散フィルタ
の動作であって、図7乃至11の反希薄分散フィルタよ
り相対的に低いレベルでの反希薄分散動作を示す。
【図17】本発明に基づく他の音声コーディング装置の
該当部分を示す。
【図18】本発明に基づく更に他の音声コーディング装
置の該当部分を示す。
【図19】図2、図17、及び図21の音声コーディン
グ装置に適用可能な変更を示す。
【図20】本発明に基づくソフト的適応音声コーディン
グ装置を示すブロック図である。
【図20A】図20の装置の詳細を示す。
【図21】図20Aの装置の更なる詳細を示す。
フロントページの続き (56)参考文献 特開 平1−237699(JP,A) 特開 平7−287600(JP,A) 片岡章俊,守谷健弘,CELP方式に 基づく8kbit/低遅延音声符号化, 電子情報通信学会技術研究報告[音声 ],1992年 2月19日,SP91−119, p.9−16 Roar Hagen et al, Removal of Sparse− Excitation Artifac ts In CELP,Proc.IC ASSP98,1998年 5月,p.145− 148 (58)調査した分野(Int.Cl.7,DB名) G10L 19/00 - 19/14 JICSTファイル(JOIS)

Claims (56)

    (57)【特許請求の範囲】
  1. 【請求項1】 所定のコードブックを用いて、音声信号
    のコード化表現を生成するための音声エンコーディング
    装置であって、 前記音声信号を受信するための入力と、 前記音声信号の前記コード化表現を提供するための出力
    と、 前記入力と前記出力との間に接続され、前記音声信号
    に、前記コードブックを用いたコーディング動作を行う
    と共に、制御信号に応じて前記コードブックからの出力
    に希薄分散(sparseness)を減少させるようなコード修
    正を適応的に行って、前記コード化表現を生成するため
    のコーダと、 前記コーダに接続されたコントローラであって、前記コ
    ーディング動作において現在及び過去に使用された情報
    を記憶するメモリを有し、当該メモリに記憶された前記
    現在及び過去に使用された情報に基づいて、前記コード
    修正のための前記制御信号を生成して前記コーダに出力
    する前記コントローラと を備えることを特徴とする音声エンコーディング装置。
  2. 【請求項2】 前記コーダは、コード修正なしを含む異
    なるレベルのコード修正を行うことができ、 前記制御信号は、前記コード修正の修正レベルを示す ことを特徴とする請求項1に記載の音声エンコーディン
    グ装置。
  3. 【請求項3】 前記コーディング動作において使用さ
    れ、前記メモリに記憶される前記情報は、前記音声信号
    の有声レベルを示す有声情報を含む ことを特徴とする請求項1に記載の音声エンコーディン
    グ装置。
  4. 【請求項4】 前記コーディング動作は、適応ゲイン形
    成コーディングを含み、 前記有声情報は、前記適応ゲイン形成コーディングと関
    連するゲイン信号を含む ことを特徴とする請求項3に記載の音声エンコーディン
    グ装置。
  5. 【請求項5】 前記コントローラは、さらに改良用ロジ
    ックを有し、 当該改良用ロジックは、前記コントローラが前記メモリ
    に記憶された現在の有声レベルを示す前記有声情報を使
    用すべきかどうか判定するため、前記現在の有声レベル
    が所定のしきい値を超えていれば当該現在の有声レベル
    を過去の有声レベルに対して評価する ことを特徴とする請求項3に記載の音声エンコーディン
    グ装置。
  6. 【請求項6】 前記コーディング動作において使用さ
    れ、前記メモリに記憶される前記情報は、前記音声信号
    の信号エネルギーを示す信号エネルギー情報を含む ことを特徴とする請求項1に記載の音声エンコーディン
    グ装置。
  7. 【請求項7】 前記コーディング動作は、固定ゲイン形
    成コーディングを含み、 前記信号エネルギー情報は、前記固定ゲイン形成コーデ
    ィングに関連するゲイン信号を含む ことを特徴とする請求項6に記載の音声エンコーディン
    グ装置。
  8. 【請求項8】 前記コーディング動作において使用さ
    れ、前記メモリに記憶される前記情報は、前記音声信号
    の有声レベルを示す有声情報も含む ことを特徴とする請求項6に記載の音声エンコーディン
    グ装置。
  9. 【請求項9】 前記コントローラは、さらに改良用ロジ
    ックを有し、 当該改良用ロジックは、前記コントローラが前記メモリ
    に記憶された現在の有声レベルを示す前記有声情報を使
    用すべきかどうかを判定するため、前記現在の有声レベ
    ルが所定のしきい値を超えていれば現在の信号エネルギ
    ーを過去の信号エネルギーに対して評価する ことを特徴とする請求項8に記載の音声エンコーディン
    グ装置。
  10. 【請求項10】 前記コーディング動作は、線形予測コ
    ーディングを行う ことを特徴とする請求項1に記載の音声エンコーディン
    グ装置。
  11. 【請求項11】 前記コントローラは、さらに、前記コ
    ーディング動作において現在使用されている前記情報に
    基づいて、前記修正レベルを示すレベル情報を出力する
    マップロジックを備える ことを特徴とする請求項2に記載の音声エンコーディン
    グ装置。
  12. 【請求項12】 前記コントローラは、さらに、前記マ
    ップロジックから出力された前記レベル情報が示す修正
    レベルが前記コーディング動作において現在行われてい
    るコード修正の修正レベルに対して所定値以上異なるか
    判定するロジックを備える ことを特徴とする請求項11に記載の音声エンコーディ
    ング装置。
  13. 【請求項13】 前記コーダは、前記コードブックとし
    て代数コードブックを備え、前記コード修正として、前
    記代数コードブックからの出力に対してインパルスレス
    ポンスとの畳み込み処理を行う反希薄分散フィルタを備
    える ことを特徴とする請求項1に記載の音声エンコーディン
    グ装置。
  14. 【請求項14】 所定のコードブックを用いて、音声信
    号のコード化表現を生成するための音声エンコーディン
    グ方法であって、 前記音声信号を受信するステップと、 前記音声信号に、前記コードブックを用いたコーディン
    グ動作を行うと共に、制御信号に応じて前記コードブッ
    クからの出力に希薄分散(sparseness)を減少させるよ
    うなコード修正を適応的に行って、前記コード化表現を
    生成するコーディングステップと、 前記コーディング動作において現在及び過去に使用され
    た情報をメモリに記憶し、前記現在及び過去に使用され
    た前記情報に基づいて、前記コード修正のための前記制
    御信号を生成するコントロールステップと を備えることを特徴とする音声エンコーディング方法。
  15. 【請求項15】 前記コーディングステップは、コード
    修正なしを含む異なるレベルのコード修正を行うことが
    でき、 前記制御信号は、前記コード修正の修正レベルを示す ことを特徴とする請求項14に記載の音声エンコーディ
    ング方法。
  16. 【請求項16】 前記コーディング動作において使用さ
    れ、前記メモリに記憶される前記情報は、前記音声信号
    の有声レベルを示す有声情報を含む ことを特徴とする請求項14に記載の音声エンコーディ
    ング方法。
  17. 【請求項17】 前記コーディングステップは、適応ゲ
    イン形成コーディングを含み、 前記有声情報は、前記適応ゲイン形成コーディングと関
    連するゲイン信号を含む ことを特徴とする請求項16に記載の音声エンコーディ
    ング方法。
  18. 【請求項18】 前記コントロールステップは、前記有
    声情報によって示される現在の有声レベルが所定のしき
    い値を超えていれば、当該現在の有声レベルを過去の有
    声レベルに対して評価するステップを含む ことを特徴とする請求項16に記載の音声エンコーディ
    ング方法。
  19. 【請求項19】 前記コントロールステップは、さら
    に、前記評価によって前記現在の有声レベルがスプリア
    スであることが判明した場合、異なる有声レベルを示す
    ように前記現在の有声レベルを示す前記有声情報を変更
    するステップを含む ことを特徴とする請求項18に記載の音声エンコーディ
    ング方法。
  20. 【請求項20】 前記異なる有声レベルは低い方の有声
    レベルである ことを特徴とする請求項19に記載の音声エンコーディ
    ング方法。
  21. 【請求項21】 前記コーディング動作において使用さ
    れ、前記メモリに記憶される前記情報は、前記音声信号
    における信号エネルギーを示す信号エネルギー情報を含
    む ことを特徴とする請求項14に記載の音声エンコーディ
    ング方法。
  22. 【請求項22】 前記コーディングステップは、固定ゲ
    イン形成コーディングを含み、 前記信号エネルギー情報は前記固定ゲイン形成コーディ
    ングに関連するゲイン信号を含む ことを特徴とする請求項21に記載の音声エンコーディ
    ング方法。
  23. 【請求項23】 前記コーディング動作において使用さ
    れ、前記メモリに記憶される前記情報は、前記音声信号
    の有声レベルを示す有声情報を含む ことを特徴とする請求項21に記載の音声エンコーディ
    ング方法。
  24. 【請求項24】 前記コントロールステップは、現在の
    有声レベルを示す前記有声情報を使用すべきかどうか判
    定するため、前記現在の有声レベルが所定のしきい値を
    超えていれば現在の信号エネルギーを過去の信号エネル
    ギーに対して評価するステップを含む ことを特徴とする請求項23に記載の音声エンコーディ
    ング方法。
  25. 【請求項25】 前記コーディングステップは線形予測
    コーディングを行う ことを特徴とする請求項14に記載の音声エンコーディ
    ング方法。
  26. 【請求項26】 前記コントロールステップは、前記コ
    ーディング動作において現在使用されている前記情報に
    基づいて、前記修正レベルを示すレベル情報を生成する
    と共に、前記レベル情報によって示される前記修正レベ
    ルと前記コーディング動作において現在行われているコ
    ード修正の修正レベルとの差を判定するステップを含む ことを特徴とする請求項15に記載の音声エンコーディ
    ング方法。
  27. 【請求項27】 前記コントロールステップは、前記差
    が所定のしきい値以上あれば、前記現在の修正レベルと
    の差がより小さい別の修正レベルに変更するステップを
    含む ことを特徴とする請求項26に記載の音声エンコーディ
    ング方法。
  28. 【請求項28】 前記コーディングステップは、前記コ
    ードブックとして代数コードブックを使用し、前記コー
    ド修正として、前記代数コードブックからの出力に対し
    てインパルスレスポンスとの畳み込み処理を行う反希薄
    分散フィルタリングのステップを含む ことを特徴とする請求項14に記載の音声エンコーディ
    ング方法。
  29. 【請求項29】 所定のコードブックを用いて、音声信
    号のコード化表現からデコードされた音声信号を生成す
    るするための音声デコーディング装置であって、 前記音声信号の前記コード化表現を受信するための入力
    と、 前記デコードされた音声信号を提供するための出力と、 前記入力と前記出力との間に接続され、前記コード化表
    現に、前記コードブックを用いたデコーディング動作を
    行うと共に、制御信号に応じて前記コードブックからの
    出力に希薄分散(sparseness)を減少させるようなコー
    ド修正を適応的に行って、前記デコードされた音声信号
    を生成するためのデコーダと、 前記デコーダに接続されたコントローラであって、前記
    デコーディング動作において現在及び過去に使用された
    情報を記憶するメモリを有し、当該メモリに記憶された
    前記現在及び過去に使用された前記情報に基づいて、前
    記コード修正のための前記制御信号を生成して前記デコ
    ーダに出力する前記コントローラと を備えることを特徴とする音声デコーディング装置。
  30. 【請求項30】 前記デコーダは、コード修正なしを含
    む異なるレベルのコード修正を行うことができ、 前記制御信号は、前記コード修正の修正レベルを示す ことを特徴とする請求項29に記載の音声デコーディン
    グ装置。
  31. 【請求項31】 前記デコーディング動作に使用され、
    前記メモリに記憶される前記情報は、前記音声信号の有
    声レベルを示す有声情報を含む ことを特徴とする請求項29に記載の音声デコーディン
    グ装置。
  32. 【請求項32】 前記デコーディング動作は、適応ゲイ
    ン形成コーディングを含み、 前記有声情報は、前記適応ゲイン形成コーディングと関
    連するゲイン信号を含む ことを特徴とする請求項31に記載の音声デコーディン
    グ装置。
  33. 【請求項33】 前記コントローラは、さらに改良用ロ
    ジックを有し、 当該改良用ロジックは、前記コントローラが前記メモリ
    に記憶された現在の有声レベルを示す前記有声情報を使
    用すべきかどうか判定するため、前記現在の有声レベル
    が所定のしきい値を越えていれば当該現在の有声レベル
    を過去の有声レベルに対して評価する ことを特徴とする請求項31に記載の音声デコーディン
    グ装置。
  34. 【請求項34】 前記デコーディング動作において使用
    され、前記メモリに記憶される前記情報は、前記音声信
    号の信号エネルギーを示す信号エネルギー情報を含む ことを特徴とする請求項29に記載の音声デコーディン
    グ装置。
  35. 【請求項35】 前記デコーディング動作は、固定ゲイ
    ン形成コーディングを含み、 前記信号エネルギー情報は、前記固定ゲイン形成コーデ
    ィングに関連するゲイン信号を含む ことを特徴とする請求項34に記載の音声デコーディン
    グ装置。
  36. 【請求項36】 前記デコーディング動作において使用
    され、前記メモリに記憶される前記情報は、前記音声信
    号の有声レベルを示す有声情報を含む ことを特徴とする請求項34に記載の音声デコーディン
    グ装置。
  37. 【請求項37】 前記コントローラは、さらに改良用ロ
    ジックを有し、 当該改良用ロジックは、前記コントローラが前記メモリ
    に記憶された現在の有声レベルを示す前記有声情報を使
    用すべきかどうか判定するため、前記現在の有声レベル
    が所定のしきい値を越えていれば現在の信号エネルギー
    を過去の信号エネルギーに対して評価する ことを特徴とする請求項36に記載の音声デコーディン
    グ装置。
  38. 【請求項38】 前記デコーディング動作は線形予測コ
    ーディングを含む ことを特徴とする請求項29に記載の音声デコーディン
    グ装置。
  39. 【請求項39】 前記コントローラは、さらに、前記デ
    コーディング動作において現在使用されている前記情報
    に基づいて、前記修正レベルを示すレベル情報を出力す
    るマップロジックを備える ことを特徴とする請求項30に記載の音声デコーディン
    グ装置。
  40. 【請求項40】 前記コントローラは、さらに、前記マ
    ップロジックから出力された前記レベル情報が示す修正
    レベルが前記デコーディング動作において現在行われて
    いるコード修正の修正レベルに対して所定値以上異なる
    か判定するロジックを備える ことを特徴とする請求項39に記載の音声デコーディン
    グ装置。
  41. 【請求項41】 前記デコーダは、前記コードブックと
    して代数コードブックを備え、前記コード修正として、
    前記代数コードブックからの出力に対してインパルスレ
    スポンスとの畳み込み処理を行う反希薄分散フィルタを
    備える ことを特徴とする請求項29に記載の音声デコーディン
    グ装置。
  42. 【請求項42】 所定のコードブックを用いて、音声信
    号のコード化表現からデコードされた音声信号を生成す
    るための音声デコーディング方法であって、 前記音声信号の前記コード化表現を受信するためのステ
    ップと、 前記コード化表現に、前記コードブックを用いたデコー
    ディング動作を行うと共に、制御信号に応じて前記コー
    ドブックからの出力に希薄分散(sparseness)を減少さ
    せるようなコード修正を適応的に行って、前記デコード
    された音声信号を生成するためのデコーディングステッ
    プと、 前記デコーディング動作において現在及び過去に使用さ
    れた情報をメモリに記憶し、前記現在及び過去に使用さ
    れた前記情報に基づいて、前記コード修正のための前記
    制御信号を生成するコントロールステップと を備えることを特徴とする音声デコーディング方法。
  43. 【請求項43】 前記デコーディングステップは、コー
    ド修正なしを含む異なるレベルのコード修正を行うこと
    ができ、 前記制御信号は、前記コード修正の修正レベルを示す ことを特徴とする請求項42に記載の音声デコーディン
    グ方法。
  44. 【請求項44】 前記デコーディング動作において使用
    され、前記メモリに記憶される前記情報は、前記音声信
    号の有声レベルを示す有声情報を含む ことを特徴とする請求項42に記載の音声デコーディン
    グ方法。
  45. 【請求項45】 前記デコーディングステップは、適応
    ゲイン形成コーディングを含み、 前記有声情報は、前記適応ゲイン形成コーディングと関
    連するゲイン信号を含む ことを特徴とする請求項44に記載の音声デコーディン
    グ方法。
  46. 【請求項46】 前記コントロールステップは、前記有
    声情報によって示される現在の有声レベルが所定のしき
    い値を超えていれば、当該現在の有声レベルを過去の有
    声レベルに対して評価するステップを含む ことを特徴とする請求項44に記載の音声デコーディン
    グ方法。
  47. 【請求項47】 前記コントロールステップは、さら
    に、前記評価によって前記現在の有声レベルがスプリア
    スであることが判明した場合、異なる有声レベルを示す
    ように前記現在の有声レベルを示す前記有声情報を変更
    するステップを含む ことを特徴とする請求項46に記載の音声デコーディン
    グ方法。
  48. 【請求項48】 前記異なる有声レベルは低い方の有声
    レベルである ことを特徴とする請求項47に記載の音声デコーディン
    グ方法。
  49. 【請求項49】 前記デコーディング動作において使用
    され、前記メモリに記憶される前記情報は、前記音声信
    号における信号エネルギーを示す信号エネルギー情報を
    含む ことを特徴とする請求項42に記載の音声デコーディン
    グ方法。
  50. 【請求項50】 前記デコーディングステップは、固定
    ゲイン形成コーディングを含み、 前記信号エネルギー情報は前記固定ゲイン形成コーディ
    ングに関連するゲイン信号を含む ことを特徴とする請求項49に記載の音声デコーディン
    グ方法。
  51. 【請求項51】 前記デコーディング動作において使用
    され、前記メモリに記憶される前記情報は、前記音声信
    号の有声レベルを示す有声情報を含む ことを特徴とする請求項49に記載の音声デコーディン
    グ方法。
  52. 【請求項52】 前記コントロールステップは、現在の
    有声レベルを示す前記有声情報を使用すべきかどうか判
    定するため、前記現在の有声レベルが所定のしきい値を
    超えていれば現在の信号エネルギーを過去の信号エネル
    ギーに対して評価するステップを含む ことを特徴とする請求項51に記載の音声デコーディン
    グ方法。
  53. 【請求項53】 前記デコーディングステップは線形予
    測コーディングを行う ことを特徴とする請求項42に記載の音声デコーディン
    グ方法。
  54. 【請求項54】 前記コントロールステップは、前記デ
    コーディング動作において現在使用されている前記情報
    に基づいて、前記修正レベルを示すレベル情報を生成す
    ると共に、前記レベル情報によって示される前記修正レ
    ベルと前記デコーディング動作において現在行われてい
    るコード修正の修正レベルとの差を判定するステップを
    含む ことを特徴とする請求項43に記載の音声デコーディン
    グ方法。
  55. 【請求項55】 前記コントロールステップは、前記差
    が所定のしきい値以上あれば、前記現在の修正レベルと
    の差がより小さい別の修正レベルに変更するステップを
    含む ことを特徴とする請求項54に記載の音声デコーディン
    グ方法。
  56. 【請求項56】 前記デコーディングステップは、前記
    コードブックとして代数コードブックを使用し、前記コ
    ード修正として、前記代数コードブックからの出力に対
    してインパルスレスポンスとの畳み込み処理を行う反希
    薄分散フィルタリングのステップを含む ことを特徴とする請求項42に記載の音声デコーディン
    グ方法。
JP2000534999A 1998-03-04 1999-03-02 ソフト適応性特性を含む音声コーディング Expired - Lifetime JP3378238B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US09/034,590 1998-03-04
US09/034,590 US6058359A (en) 1998-03-04 1998-03-04 Speech coding including soft adaptability feature
PCT/SE1999/000302 WO1999045532A1 (en) 1998-03-04 1999-03-02 Speech coding including soft adaptability feature

Publications (2)

Publication Number Publication Date
JP2002506242A JP2002506242A (ja) 2002-02-26
JP3378238B2 true JP3378238B2 (ja) 2003-02-17

Family

ID=21877362

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000534999A Expired - Lifetime JP3378238B2 (ja) 1998-03-04 1999-03-02 ソフト適応性特性を含む音声コーディング

Country Status (8)

Country Link
US (2) US6058359A (ja)
EP (2) EP1267329B1 (ja)
JP (1) JP3378238B2 (ja)
CN (2) CN1183513C (ja)
AU (1) AU2756299A (ja)
DE (2) DE69902233T2 (ja)
RU (1) RU2239239C2 (ja)
WO (1) WO1999045532A1 (ja)

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE69715478T2 (de) * 1996-11-07 2003-01-09 Matsushita Electric Ind Co Ltd Verfahren und Vorrichtung zur CELP Sprachkodierung und -dekodierung
US6058359A (en) * 1998-03-04 2000-05-02 Telefonaktiebolaget L M Ericsson Speech coding including soft adaptability feature
EP1760694A3 (en) * 1997-10-22 2007-03-14 Matsushita Electric Industrial Co., Ltd. Multistage vector quantization for speech encoding
DE69837822T2 (de) * 1997-12-24 2008-01-31 Mitsubishi Denki K.K. Verfahren und Vorrichtung zur Dekodierung von Sprachsignalen
US6131047A (en) 1997-12-30 2000-10-10 Ericsson Inc. Radiotelephones having contact-sensitive user interfaces and methods of operating same
US6301556B1 (en) * 1998-03-04 2001-10-09 Telefonaktiebolaget L M. Ericsson (Publ) Reducing sparseness in coded speech signals
US6249758B1 (en) * 1998-06-30 2001-06-19 Nortel Networks Limited Apparatus and method for coding speech signals by making use of voice/unvoiced characteristics of the speech signals
US7072832B1 (en) * 1998-08-24 2006-07-04 Mindspeed Technologies, Inc. System for speech encoding having an adaptive encoding arrangement
US6959274B1 (en) * 1999-09-22 2005-10-25 Mindspeed Technologies, Inc. Fixed rate speech compression system and method
US6782360B1 (en) * 1999-09-22 2004-08-24 Mindspeed Technologies, Inc. Gain quantization for a CELP speech coder
US6438518B1 (en) * 1999-10-28 2002-08-20 Qualcomm Incorporated Method and apparatus for using coding scheme selection patterns in a predictive speech coder to reduce sensitivity to frame error conditions
US7016835B2 (en) * 1999-10-29 2006-03-21 International Business Machines Corporation Speech and signal digitization by using recognition metrics to select from multiple techniques
DE10009444A1 (de) * 2000-02-29 2001-09-06 Philips Corp Intellectual Pty Betriebsverfahren für ein Mobiltelefon
US6678651B2 (en) * 2000-09-15 2004-01-13 Mindspeed Technologies, Inc. Short-term enhancement in CELP speech coding
US7567900B2 (en) * 2003-06-11 2009-07-28 Panasonic Corporation Harmonic structure based acoustic speech interval detection method and device
KR100546758B1 (ko) * 2003-06-30 2006-01-26 한국전자통신연구원 음성의 상호부호화시 전송률 결정 장치 및 방법
US7668712B2 (en) * 2004-03-31 2010-02-23 Microsoft Corporation Audio encoding and decoding with intra frames and adaptive forward error correction
US7831421B2 (en) * 2005-05-31 2010-11-09 Microsoft Corporation Robust decoder
US7177804B2 (en) * 2005-05-31 2007-02-13 Microsoft Corporation Sub-band voice codec with multi-stage codebooks and redundant coding
US7707034B2 (en) * 2005-05-31 2010-04-27 Microsoft Corporation Audio codec post-filter
US20090094026A1 (en) * 2007-10-03 2009-04-09 Binshi Cao Method of determining an estimated frame energy of a communication
CN101719814B (zh) * 2009-12-08 2013-03-27 华为终端有限公司 确定带内信令译码模式的方法及装置
EP2593937B1 (en) * 2010-07-16 2015-11-11 Telefonaktiebolaget LM Ericsson (publ) Audio encoder and decoder and methods for encoding and decoding an audio signal
BR112013033900B1 (pt) 2011-06-30 2022-03-15 Samsung Electronics Co., Ltd Método para gerar um sinal estendido de largura de banda para decodificação de áudio
CN105976824B (zh) 2012-12-06 2021-06-08 华为技术有限公司 信号解码的方法和设备

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5396576A (en) * 1991-05-22 1995-03-07 Nippon Telegraph And Telephone Corporation Speech coding and decoding methods using adaptive and random code books
JP3432822B2 (ja) * 1991-06-11 2003-08-04 クゥアルコム・インコーポレイテッド 可変速度ボコーダ
US5734789A (en) * 1992-06-01 1998-03-31 Hughes Electronics Voiced, unvoiced or noise modes in a CELP vocoder
US5495555A (en) * 1992-06-01 1996-02-27 Hughes Aircraft Company High quality low bit rate celp-based speech codec
CA2108623A1 (en) * 1992-11-02 1994-05-03 Yi-Sheng Wang Adaptive pitch pulse enhancer and method for use in a codebook excited linear prediction (celp) search loop
SE501305C2 (sv) * 1993-05-26 1995-01-09 Ericsson Telefon Ab L M Förfarande och anordning för diskriminering mellan stationära och icke stationära signaler
US5727122A (en) * 1993-06-10 1998-03-10 Oki Electric Industry Co., Ltd. Code excitation linear predictive (CELP) encoder and decoder and code excitation linear predictive coding method
EP0944037B1 (en) * 1995-01-17 2001-10-10 Nec Corporation Speech encoder with features extracted from current and previous frames
JPH08263099A (ja) * 1995-03-23 1996-10-11 Toshiba Corp 符号化装置
US5692101A (en) * 1995-11-20 1997-11-25 Motorola, Inc. Speech coding method and apparatus using mean squared error modifier for selected speech coder parameters using VSELP techniques
WO1999010719A1 (en) * 1997-08-29 1999-03-04 The Regents Of The University Of California Method and apparatus for hybrid coding of speech at 4kbps
US6029125A (en) * 1997-09-02 2000-02-22 Telefonaktiebolaget L M Ericsson, (Publ) Reducing sparseness in coded speech signals
US6058359A (en) * 1998-03-04 2000-05-02 Telefonaktiebolaget L M Ericsson Speech coding including soft adaptability feature
US6173257B1 (en) * 1998-08-24 2001-01-09 Conexant Systems, Inc Completed fixed codebook for speech encoder
US6104992A (en) * 1998-08-24 2000-08-15 Conexant Systems, Inc. Adaptive gain reduction to produce fixed codebook target signal
US6188980B1 (en) * 1998-08-24 2001-02-13 Conexant Systems, Inc. Synchronized encoder-decoder frame concealment using speech coding parameters including line spectral frequencies and filter coefficients

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Roar Hagen et al,Removal of Sparse−Excitation Artifacts In CELP,Proc.ICASSP98,1998年 5月,p.145−148
片岡章俊,守谷健弘,CELP方式に基づく8kbit/低遅延音声符号化,電子情報通信学会技術研究報告[音声],1992年 2月19日,SP91−119,p.9−16

Also Published As

Publication number Publication date
EP1058927B1 (en) 2002-07-24
EP1058927A1 (en) 2000-12-13
EP1267329B1 (en) 2005-05-25
US6564183B1 (en) 2003-05-13
DE69925515D1 (de) 2005-06-30
CN1262992C (zh) 2006-07-05
CN1555047A (zh) 2004-12-15
EP1267329A1 (en) 2002-12-18
WO1999045532A1 (en) 1999-09-10
CN1183513C (zh) 2005-01-05
RU2239239C2 (ru) 2004-10-27
DE69925515T2 (de) 2006-02-09
CN1292913A (zh) 2001-04-25
DE69902233D1 (de) 2002-08-29
AU2756299A (en) 1999-09-20
US6058359A (en) 2000-05-02
JP2002506242A (ja) 2002-02-26
DE69902233T2 (de) 2003-01-16

Similar Documents

Publication Publication Date Title
JP3378238B2 (ja) ソフト適応性特性を含む音声コーディング
US6029128A (en) Speech synthesizer
JP3432082B2 (ja) フレーム消失の間のピッチ遅れ修正方法
US10339946B2 (en) Audio decoder and method for providing a decoded audio information using an error concealment modifying a time domain excitation signal
AU752229B2 (en) Perceptual weighting device and method for efficient coding of wideband signals
EP1905000B1 (en) Selectively using multiple entropy models in adaptive coding and decoding
US7693709B2 (en) Reordering coefficients for waveform coding or decoding
JP5374418B2 (ja) 音声符号化用適応符号帳ゲインの制御
US20070016415A1 (en) Prediction of spectral coefficients in waveform coding and decoding
JPH09120298A (ja) フレーム消失の間の音声復号に使用する音声の有声/無声分類
JPH09120299A (ja) 適応コードブックに基づく音声圧縮システム
EP2491555A1 (en) Multi-mode audio codec and celp coding adapted therefore
US5659659A (en) Speech compressor using trellis encoding and linear prediction
JP3564144B2 (ja) “前方”および“後方”lpc分析による音声周波数信号を符号化するための方法および装置
JPH09120297A (ja) フレーム消失の間のコードブック利得減衰
KR20170003596A (ko) 음성 정보를 갖는 개선된 프레임 손실 보정
US11996110B2 (en) Apparatus and method for synthesizing an audio signal, decoder, encoder, system and computer program
JP3219467B2 (ja) 音声復号化方法
JP3490325B2 (ja) 音声信号符号化方法、復号方法およびその符号化器、復号器
JP3099852B2 (ja) 励振信号の利得量子化方法
JP2700974B2 (ja) 音声符号化法
JP3270146B2 (ja) 音声符号化装置
KR20000013870A (ko) 음성 부호화기에서 피치 예측을 이용한 오류 프레임 처리 방법및 그를 이용한 음성 부호화 방법
JPH07248795A (ja) 音声処理装置
MXPA96002143A (en) System for speech compression based on adaptable codigocifrado, better

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20021122

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081206

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091206

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101206

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101206

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111206

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111206

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121206

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131206

Year of fee payment: 11

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term