JP2001034300A - ボコーダの動作方法 - Google Patents

ボコーダの動作方法

Info

Publication number
JP2001034300A
JP2001034300A JP2000123010A JP2000123010A JP2001034300A JP 2001034300 A JP2001034300 A JP 2001034300A JP 2000123010 A JP2000123010 A JP 2000123010A JP 2000123010 A JP2000123010 A JP 2000123010A JP 2001034300 A JP2001034300 A JP 2001034300A
Authority
JP
Japan
Prior art keywords
signal
filter
frame
bit
vocoder
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Abandoned
Application number
JP2000123010A
Other languages
English (en)
Inventor
Engin Erzin
エリツィン エンジン
Michael C Recchoine
チャールズ レッキオン マイケル
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nokia of America Corp
Original Assignee
Lucent Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lucent Technologies Inc filed Critical Lucent Technologies Inc
Publication of JP2001034300A publication Critical patent/JP2001034300A/ja
Abandoned legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • H03M7/40Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code
    • H03M7/42Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code using table look-up for the coding or decoding process, e.g. using read-only memory
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0013Codebook search algorithms

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

(57)【要約】 【課題】 ビットフレーム内のビット位置の数が制限さ
れた状態で、信号フレーム(またはサブフレーム)の固
定コードブック応答をより正確に表現することができる
ボコーダ、およびそのようなボコーダの動作方法を実現
する。 【解決手段】 ボコーダ50は、信号フレームの残差信
号と比較するためのパルス列の複数のエントリを有する
固定コードブック52を有する。固定コードブック52
のエントリは、符号化される信号フレームに合わせて設
定される。ノイズ信号が、送信ボコーダ50に記憶され
る。符号化中、ノイズ信号は、信号フレームまたはサブ
フレームを特徴づける決定されたパラメータに依存する
フィルタリングにより整形される。整形されたノイズ信
号をしきい値フィルタに通してパルス列を得る。固定コ
ードブック応答は、パルス列のうち、信号フレームまた
はサブフレームの残差信号に最もよく一致する部分(エ
ントリ)として選択される。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、ボコーダに関し、
特に、ボコーダによって生成される固定コードブック応
答の表現に関する。
【0002】
【従来の技術】図1および図2に、従来技術による符号
励振線形予測(CELP)ボコーダの送信および受信ユ
ニットを示す。図1において、送信ユニットは第1ボコ
ーダ1である。第1ボコーダ1は、線形予測符号化(L
PC)フィルタ2を有する。LPCフィルタ2は、ジャ
ンクション(接合点)4を介して知覚荷重フィルタ3に
接続される。知覚荷重フィルタ3は、誤差最小化フィル
タ5に接続される。誤差最小化フィルタ5は、第1適応
コードブック6および第1固定コードブック7に接続さ
れる。第1適応コードブック6は、第1適応コードブッ
ク利得ユニット8に接続される。第1固定コードブック
7は、第1固定コードブック利得ユニット9に接続され
る。第1適応コードブック利得ユニット8および第1固
定コードブック利得ユニット9の出力はジャンクション
10で接続される。ジャンクション10はジャンクショ
ン4に接続される。
【0003】一般に、第1ボコーダ1は、ディジタル音
声入力の時間セグメントを順次分析する。各時間セグメ
ントを信号フレームという。ボコーダ1は、各信号フレ
ームを特徴づけるパラメータを推定する。これらのパラ
メータは、ビットパターンで表され、1つのビットフレ
ームにまとめられる。ビットフレームは、それが表す信
号フレームよりも高速に送信されることが可能であり、
より少ないメモリに記憶することが可能である。
【0004】次に、図1を参照して、公知のIS127
EVRC CDMA型符号器(ボコーダ1)の動作の
一般的な説明を行う。ボコーダ1の動作についてさらに
詳細には、ディジタル音声符号化に関する教科書に記載
されている。ボコーダ1はマルチレートボコーダであ
り、毎秒8キロビット(kbps)に対応するフルレー
トの動作と、4kbpsに対応するハーフレートの動作
がある。ディジタル音声入力は、20msecの信号フ
レームに分割される。各信号フレームはさらに、約6.
6msecの第1、第2、および第3のサブフレームに
分割される。
【0005】ボコーダ1がフルレートで動作するとき、
信号フレームはLPCフィルタ2を通る。LPCフィル
タ2は、信号フレーム全体を特徴づけるLPCパラメー
タを抽出し、そのLPCパラメータを、28ビットのL
PCビットの形で出力する。信号フレームは、LPCフ
ィルタを出て、ジャンクション4、知覚荷重フィルタ
3、および誤差最小化フィルタ5を通る。知覚荷重フィ
ルタ3および誤差最小化フィルタ5は、信号フレームか
らパラメータビットを抽出しないが、この信号フレーム
を後の処理のために準備する。
【0006】次に、信号フレームは、第1適応コードブ
ック6に入力される。第1適応コードブック6は、フレ
ーム全体のピッチを推定し、フレーム全体のピッチを特
徴づける7ビットのACBビットを出力する。次に、第
1適応コードブック利得ユニット8が、第1サブフレー
ム、第2サブフレーム、および第3サブフレームの適応
コードブック利得を推定する。3ビットのACBGビッ
トが、第1サブフレームの適応コードブック利得を推定
する。さらに3ビットのACBGビットが、第2サブフ
レームの適応コードブック利得を推定する。さらに3ビ
ットのACBGビットが、第3サブフレームの適応コー
ドブック利得を推定する。
【0007】次に、信号は、ジャンクション10、ジャ
ンクション4、知覚荷重フィルタ3、および誤差最小化
フィルタ5を通り、第1固定コードブック7に入力され
る。第1固定コードブック7は、第1サブフレーム、第
2サブフレーム、および第3サブフレームのランダムな
無声音特性を推定する。35ビットのFCBビットが、
第1サブフレームの固定コードブック応答を表す。さら
に35ビットのFCBビットが、第2サブフレームの固
定コードブック応答を表す。さらに35ビットのFCB
ビットが、第3サブフレームの固定コードブック応答を
表す。
【0008】次に、第1固定コードブック利得ユニット
9が、第1サブフレーム、第2サブフレーム、および第
3サブフレームの固定コードブック利得を推定する。5
ビットのFCBGビットが、第1サブフレームの固定コ
ードブック利得を推定する。さらに5ビットのFCBG
ビットが、第2サブフレームの固定コードブック利得を
推定する。さらに5ビットのFCBGビットが、第3サ
ブフレームの固定コードブック利得を推定する。
【0009】この時点で、すべてのビットパターン(L
PC、ACB、ACBG、FCB、FCBG)がビット
フレームにまとめられる。このビットフレーム(信号フ
レームを表す)は完全であり、合成のために第2ボコー
ダ11に送信するか、または、後で取り出すためにメモ
リに記憶することが可能である。上記のプロセスは、デ
ィジタル音声入力の各信号フレームについて順次繰り返
される。
【0010】図2に、ビットフレームを合成する第2ボ
コーダ11の復号セクションを示す。第2ボコーダ11
は、第2適応コードブック12、第2固定コードブック
13、第2適応コードブック利得ユニット14、第2固
定コードブック利得ユニット15、および合成フィルタ
16を有する。第2ボコーダ11は、LPCビット、A
CBGビット、ACBビット、FCBビット、およびF
CBGビットを受信する。これらのビットは、第2ボコ
ーダ11によって、当業者に周知のように、もとの信号
フレームの推定値を再構成するために使用される。
【0011】上記のようなさまざまなパラメータに割り
当てられるビットフレーム内のビット位置の総数は、8
kbpsのフルレートで動作するボコーダ1(IS12
7EVRC CDMA符号器)に関係する。要約する
と、ビットフレームは、28ビットのLPCビット、7
ビットのACBビット、3+3+3=9ビットのACB
Gビット、35+35+35=105ビットのFCBビ
ット、および5+5+5=15ビットのFCBGビット
を含む。従って、ビットフレーム内の全ビット数は16
4ビットとなる。
【0012】上記のように、ボコーダ1はマルチレート
ボコーダであり、ボコーダ1のハーフレートは4kbp
sである。ボコーダ1がハーフレートで動作するとき、
リアルタイムで、到来するディジタル音声入力に依然と
して追随しながら、サイズが164ビットのビットフレ
ームを送信することはもはや不可能である。その代わり
に、フレームサイズを縮小して約80ビット位置にしな
ければならない。
【0013】ボコーダ1(IS127 EVRC CD
MA符号器)がハーフレート(4kpbs)で動作する
とき、ビット位置は次のように割り当てられる。 LPCビット: 22 ACBビット: 7 ACBGビット: 3+3+3=9 FCBビット: 10+10+10=30 FCBGビット: 4+4+4=12 従って、ビットフレーム内の全ビット数は80ビットと
なる。わかるように、FCBビットが、ビットフレーム
のサイズ縮小の支配的な負担を被っている。
【0014】本発明は固定コードブックに関係するた
め、ボコーダ1における固定コードブック計算の動作に
ついて簡単にまとめる。フルレート(8kbps)で
は、フレームの固定コードブック応答を表すために割り
当てられる105ビット位置が、3個のサブフレームの
それぞれに8個の推定パルスを入れることができる。図
形的にこれを図3に示す。
【0015】図3において、第1信号ライン17は、推
定のために固定コードブック7に入力される第2残差信
号を表す。第1サブフレーム18は53個のサンプル点
に分割され、第2サブフレーム19も53個のサンプル
点に分割され、第3サブフレーム20は54個のサンプ
ル点に分割される。
【0016】信号ライン17上の第2残差信号の特性を
最もよく推定するために、正負のパルス21が、サンプ
ル点のうちの選択点に配置される。例えば、第2信号ラ
イン22は、第1信号ラインの第2残差信号を推定する
際の、パルス21の極性(正負)および配置を例示す
る。配置および極性は、サブフレーム18、19、20
のそれぞれに対するFCBビットによって特徴づけられ
るデータである。すなわち、各サブフレームに対して、
固定コードブック7は、第1信号ライン17の第2残差
信号を表すために8〜10個のパルス21の最良の配置
を推定し、そのサブフレームに対するFCBビットは、
パルス21の配置および極性を指定する。
【0017】第2ボコーダ11がFCBビットを受信す
ると、第1信号ライン17の第2残差信号の推定を行う
ために、正負のパルス21の配置に基づいてエンベロー
プ(包絡)23を数学的に構成することができる。図形
的には、これは第3信号ライン24に例示される。もち
ろん、各サブフレームのFCBGビットが、それぞれの
サブフレーム内のエンベロープ23の山および谷の振幅
に影響を及ぼし、エンベロープ23の山および谷の振幅
が第2残差信号内の実際の山および谷の平均振幅に一致
するようにされる。
【0018】ボコーダ1がフルレート(8kbps)で
動作するとき、固定コードブック応答に割り当てられ
る、ビットフレーム内の105ビット位置は、第2信号
ライン22および第3信号ライン24によって例示され
るように、サブフレームあたり8個のパルスの位置およ
び極性を表すことができる。ボコーダ1がハーフレート
(4kbps)で動作するとき、固定コードブック応答
に割り当てられる、フレーム内の30ビット位置は、サ
ブフレームあたり3個のパルスの位置および極性しか表
すことができない。
【0019】第4信号25は、ボコーダ1がハーフレー
トで動作するときの正負のパルス21′の配置と、パル
ス21′の配置に従って数学的に構成されるエンベロー
プ23′を例示する。明らかにわかるように、ハーフレ
ート動作中に得られるエンベロープ23′は、第1信号
ライン17の第2残差信号を近似していないし、またほ
とんど同様に、ボコーダ1がフルレートで動作するとき
に得られるエンベロープ23をも近似していない。
【0020】
【発明が解決しようとする課題】観察されるように、第
1ボコーダ1および第2ボコーダ11は、ビットフレー
ムの送信中に中ないし高ビットレート(例えば、4.8
kbps〜16kbps)を使用するときには、十分な
再生品質でディジタル音声を処理する。しかし、ビット
レートが(ハーフレートに対応する4kbpsのレート
のように)4.8kbpsを下回ると、合成される音声
の品質は大幅に悪化する。この悪い品質は主に、図3の
第4信号ライン25によって例示されるように、サブフ
レームの固定コードブック応答の不正確な表現によるも
のである。
【0021】不正確な表現は、すべてのサブフレームの
固定コードブック応答を表すためにビットフレーム内に
割り当てられるビット数が制限されている(例えば30
ビット)結果である。ビットレートが低いときにビット
フレームサイズを増大させることはできないため、従来
技術では、ビットフレーム内のビット位置の数が制限さ
れた状態で、信号フレーム(またはサブフレーム)の固
定コードブック応答をより正確に表現することができる
ボコーダ、およびそのようなボコーダの動作方法が必要
とされている。
【0022】
【課題を解決するための手段】本発明によるボコーダ
は、信号フレームまたはサブフレームの残差信号と比較
するためのパルス列の複数のエントリを有する固定コー
ドブックを有する。固定コードブックのエントリは、符
号化される信号フレームまたはサブフレームに合わせて
設定される。ノイズ信号が、送信ボコーダに記憶され
る。符号化中、ノイズ信号は、信号フレームまたはサブ
フレームを特徴づける決定されたパラメータに依存する
フィルタリングにより整形(シェーピング)される。整
形されたノイズ信号をしきい値フィルタに通してパルス
列を得る。固定コードブック応答は、パルス列のうち、
信号フレームまたはサブフレームの残差信号に最もよく
一致する部分(すなわちエントリ)として選択される。
この部分のインデックス付けされた位置が、ビットフレ
ーム内に含まれる固定コードブックビットとして指定さ
れる。同一のノイズ信号が、復号ボコーダにも記憶され
る。同じアクティブフィルタリングおよびしきい値フィ
ルタリングをこの同一のノイズ信号に適用して同じパル
ス列を得る。従って、ビットフレームの固定コードブッ
クビットは、合成中に使用される固定コードブック応答
を表すパルス列の正しい部分をインデックス付けするこ
とになる。
【0023】
【発明の実施の形態】図4に、本発明による送信側の第
1ボコーダ50を示す。ボコーダ50は、LPCフィル
タ2、知覚荷重フィルタ3、誤差最小化フィルタ5、第
1適応コードブック6、第1適応コードブック利得ユニ
ット8、および第1固定コードブック利得ユニット9を
有する。特に注目すべきなのは、本発明による、第1固
定コードブック整形ユニット51と、改良された第1固
定コードブック52である。第1固定コードブック整形
ユニット51は、第1固定コードブック52に接続さ
れ、LPCビット、ACBビット、およびACBGビッ
トを含む入力を受け取る。
【0024】第1ボコーダ50の動作方法は、固定コー
ドブック応答推定に関連するところを除いては、上記の
方法に対応する。第1サブフレーム18が推定されてい
るとき、3個のパルス21′の最良の配置を決定する代
わりに、第2残差信号(信号ライン17)は、複数の可
能パルス列と比較され、第2残差信号に最もよく一致す
るのはどのパルス列であるかが決定される。
【0025】図形的には、この比較は図5に示される。
与えられたサブフレームの固定コードブック応答を表す
ために10ビット位置が割り当てられるため、第1固定
コードブック52は、第2残差信号と比較するために1
024(210=1024)個の可能なパルス列を有する
ことになる。比較が行われ、最良一致列が決定される
と、最良一致列のアドレスがそのサブフレームに対する
FCBビットとみなされる。これについてさらに詳細に
以下で説明する。
【0026】1,024個だけの相異なるパルス列が第
1固定コードブック52によって比較されるため、これ
らの列を注意深く選択し、できるだけ近い一致が見出さ
れるようにすることが重要である。本発明によれば、与
えられたサブフレームの固定コードブック応答は、その
サブフレームを特徴づけるLPCビット、ACBビッ
ト、およびACBGビットとの対応関係を有することが
発見された。この発見に基づいて、本発明は、サブフレ
ームの固定コードブック応答の推定の前に、第1固定コ
ードブック52の可能な列を生成する第1固定コードブ
ック整形ユニット51を実現する。
【0027】次に、第1固定コードブック整形ユニット
51の動作について、図6および図7を参照して説明す
る。第1固定コードブック整形ユニット51は、信号ラ
イン53上に例示するような、一様分布ランダムノイズ
f(n)を記憶している。このランダムノイズf(n)
(例えば、ガウス分布ランダムノイズ)は、平坦なスペ
クトルを有する。ランダムノイズf(n)は、線形予測
(LP)荷重フィルタ54およびピッチ先鋭化フィルタ
55に通される。フィルタ54および55はアクティブ
フィルタである。すなわち、信号に対するコレラの作用
は入力により制御される。フィルタ54および55は、
ランダムノイズf(n)を修正して、信号ライン56上
に例示するような出力信号fs(n)を生成する。出力
信号fs(n)は、低減されたピークを有する。すなわ
ち、ランダムノイズf(n)は、LPCフィルタ2、第
1適応コードブック6、および第1適応コードブック利
得ユニット8によって決定されるパラメータに従って、
フィルタ54および55によりスペクトル整形されてい
る。
【0028】LP荷重フィルタ54およびピッチ先鋭化
フィルタ55の動作は、LPCビット、ACBビット、
およびACBGビットに関連する式によって支配され
る。式は、図6に示されている。A(z)は、LPCフ
ィルタ2の出力を表す。gaは、量子化されたACB利
得である。Pは、ピッチ遅延(適応コードブック6によ
り決定される)である。本質的に、LP荷重フィルタ5
4は、γ1倍およびγ2倍に極を広げる(ブロードニン
グ)。
【0029】LP荷重フィルタ54およびピッチ先鋭化
フィルタ55は、広く使用されているフィルタである。
これらのフィルタの式および動作特性は既知である。し
かし、本発明に開示されるような組合せでLP荷重フィ
ルタ54およびピッチ先鋭化フィルタ55を使用するこ
とはこれまで知られていない。LP荷重フィルタ54お
よびピッチ先鋭化フィルタ55についてさらに詳細に
は、この問題に関する教科書、例えば、W. B. Kleijn e
t al., "Speech Coding and Synthesis", Elsevier Pre
ss, 1995, pp.89-90、に記載されている。
【0030】ピッチ先鋭化フィルタ55の出力fs
(n)は、非線形しきい値フィルタ57を通され、信号
ライン58上に例示するような、パルス列P(n)を得
る。しきい値フィルタ57は、調整可能な上方しきい値
および下方しきい値を有する。これらのしきい値の間に
信号fs(n)が現れるとすべて0に等しくセットされ
る。所定期間上方しきい値より上に信号fs(n)が現
れると正パルス21″となり、同様に、所定期間下方し
きい値より下に信号fs(n)が現れると負パルス2
1″となる。
【0031】パルス21″のまばらさは、しきい値フィ
ルタ57の上方および下方しきい値の設定によって制御
することができる。例えば、これらのしきい値が互いに
近い(すなわち、0に近い)場合、多くのパルス21″
がパルス列P(n)に現れる。これらのしきい値が比較
的遠く離れている(すなわち、0から遠く離れている)
場合、非常に少ないパルス21″がパルス列P(n)に
現れることになる。本発明によれば、まばらさは、約8
5%〜93%の範囲に設定するのが好ましい。すなわ
ち、サンプルのうちの85%〜90%を0に等しくし、
サブフレームあたり4〜7個程度のパルスを残すのが好
ましい。
【0032】本発明が、図3に例示したように、サブフ
レームあたり53〜54個のサンプル固定コードブック
整形ユニット51に記憶されているランダムノイズf
(n)は54+1024=1078サンプルの間継続
し、6.7msecのサブフレームでは、これは約13
3msecの継続時間となる。可能な固定コードブック
応答は、パルス列P(n)の上をシフトされる、幅54
サンプルのウィンドウ(ベクトルともいう)によって決
定される。
【0033】ウィンドウのゼロの位置を参照符号60で
示す。ウィンドウ60の直上のパルス列は、第1固定コ
ードブック52(図5参照)によって、インデックス付
けされたエントリ(0)により表される。第1のシフト
されたウィンドウの配置を参照符号61で示す。ウィン
ドウ61の直上のパルス列は、第1固定コードブック5
2によって、インデックス付けされたエントリ(1)に
より表される。第2のシフトされたウィンドウの配置を
参照符号62で示す。ウィンドウ62の直上のパルス列
は、第1固定コードブック52によって、インデックス
付けされたエントリ(2)により表される。このウィン
ドウシフトプロセスは、インデックス付けされたエント
リ(1023)を表す最後のシフトされたウィンドウ6
3が第1固定コードブック52によって決定されるまで
繰り返される。
【0034】2156サンプル期間のランダムノイズf
(n)を有することも可能である。この場合、ウィンド
ウ(ベクトル)は、2サンプルの増分でシフトされ、固
定コードブックの1,024個の可能な列を得る。実
際、ランダムノイズの継続時間を延長し、ウィンドウの
増分ステップを増大させることによって、このパターン
をさらに続けることが可能である。
【0035】第1サブフレーム18に対する固定コード
ブック応答は、第1サブフレームの第2残差信号に最も
良く一致するパルス列であると決定される。このエント
リのインデックス(これは、パルス列P(n)に沿って
ウィンドウの位置をシフトさせた個数に等しい)は、第
1サブフレーム18に対するFCBビットとなる。次
に、第1固定コードブック52の新たなパルス列を形成
し、第2サブフレーム19の固定コードブック応答が決
定される。次に、再び第1固定コードブック52の新た
なパルス列を形成し、第3サブフレーム20の固定コー
ドブック応答が決定される。
【0036】なお、本発明の変形例として、第1固定コ
ードブック52の新たなパルス列を単に周期的に決定す
ることも可能である。例えば、新たなパルス列は、新た
なパルス列を、新たなサブフレームごとに(これはつま
り本発明の好ましい実施例である)ではなく、新たな信
号フレームごとにのみ形成することも可能である。ある
いは、1つおきの信号フレームごとに、新たなエントリ
を形成することなども可能である。固定コードブックの
パルス列の再形成を信号フレームごとや1つおきの信号
フレームごとに制限することにより、関連する計算は簡
略化される。さらに、固定コードブックのパルス列の再
使用は、固定コードブック応答を推定する際に通常は十
分な精度である。音声は、関連する短時間に大幅に変動
することはあまりないからである。
【0037】図8に、受信側の第2ボコーダ64の復号
セクションを示す。第2ボコーダ64は、第2適応コー
ドブック12、第2適応コードブック利得ユニット1
4、第2固定コードブック利得ユニット15、および合
成フィルタ16を有する。特に注目すべきなのは、本発
明による、第2固定コードブック整形ユニット65と、
改良された第2固定コードブック66である。
【0038】第2固定コードブック整形ユニット65の
動作は、第1ボコーダ50の第1固定コードブック整形
ユニット51と同一である。第2固定コードブック整形
ユニット65内には、図7の信号ライン53上に例示さ
れる、ランダムノイズf(n)と同一のコピーが記憶さ
れる。第2固定コードブック整形ユニット65は、同一
のアクティブフィルタ54および55を有するととも
に、第1固定コードブック整形ユニット51内のしきい
値フィルタ57の上方および下方しきい値に等しく設定
された上方および下方しきい値を有する同一のしきい値
フィルタ57を有する。従って、第2固定コードブック
整形ユニット65は、前に第1固定コードブック整形ユ
ニット51で生成されたパルス列P(n)と同一の、図
7の信号ライン58上に示した、1,078サンプルの
サンプル期間を有するパルス列P(n)を生成すること
ができる。
【0039】パルス列P(n)が生成されると、第2固
定コードブック66は、パルス列P(n)に沿って、F
CBビットによって表されるインデックスに等しい位置
の個数だけ、長さ54サンプルのウィンドウをシフトす
ることにより、固定コードブック応答を決定することが
できる。パルス列P(n)のうち、シフトされたウィン
ドウの直上にある部分は、第1ボコーダ50によって決
定された固定コードブック応答の正しい推定値である。
第2ボコーダによる信号フレームの合成のその他のすべ
ての点については、図2に示した従来技術の復号ボコー
ダ11と同様である。
【0040】なお、第2残差信号を推定するために利用
可能な、第1固定コードブック52内のパルス列エント
リは、それぞれ、4〜7個程度のパルスを含むことが可
能である。これは、従来技術においては第2残差信号の
サブフレーム推定値あたり3個のパルスであったことよ
りも大幅な改善である。この改善により、再生される音
声の品質における顕著な改善が実現される。
【0041】第1固定コードブック52において列あた
り4〜7個のパルスを配置することを可能にする本発明
の重要な1つの特徴は、パルス列P(n)(これからエ
ントリがとられる)が、モデル化される信号の他の決定
されたパラメータに従って構成されることである。本発
明によれば、LPCパラメータ、ACBパラメータ、お
よびACBGパラメータのような他の決定されたパラメ
ータは、予想される固定コードブック応答とある相関関
係を有する。従って、これらのパラメータを用いて、制
限されたサイズの固定コードブックに利用可能なパルス
列を整形することが可能であり、これにより、可能なパ
ルス列は、分析を行うときに第2残差信号に一致する可
能性が比較的高くなる。
【0042】仮に、4〜7個のパルスのパルス列が単に
ランダムに生成される場合には、制限されたサイズの固
定コードブック(1024個の可能な列)は、連続変化
する第2残差信号の大多数に一致する適当なパルス列を
提供するには統計的に不十分である。すなわち、102
4個の可能なパルス列のそれぞれが、列に沿ってランダ
ムに位置する4〜7個のパルスを有する場合、固定コー
ドブックによって決定される、第2残差信号への最良一
致パルス列の一致は悪くなる可能性が高く、そのフレー
ムまたはサブフレームに対して再生される音声は不正確
になる。
【0043】なお、注意すべき点であるが、第2ボコー
ダ64は、第1固定コードブック52によって使用され
るパルス列P(n)を再構成するために、別のデータを
受信する必要はないという点で有利である。パルス列P
(n)の再構成に用いられるLPCビット、ACBビッ
ト、およびACBGビットは、音声信号を再構成するた
めに第2ボコーダ64によって既に必要とされているた
め、別のデータはビットフレームに含まれない。
【0044】以上の説明および図面では、サブフレーム
内のサンプル点に位置するパルスに関して説明してい
る。直ちに明らかなように、このような説明は、数学的
演算および数式の単なる図形的表現である。この図形的
表現は、従来技術と本発明との相違点の説明を単純化す
るものである。実際には、固定コードブック52および
66、ならびに固定コードブック整形ユニット51およ
び65は、図形的表現の基礎となる数学的演算および数
式を処理する。
【0045】また、以上の記載では、本発明の第1固定
コードブック整形ユニット51および第2固定コードブ
ック整形ユニット65は、第1固定コードブック52お
よび第2固定コードブック66とは別個のコンポーネン
トとして説明した。別個としての説明は、本発明の説明
を単純化するためである。実際には、固定コードブック
整形ユニットおよび固定コードブックは、単一の物理コ
ンポーネントに組み込むことが可能である。さらに、そ
の他の点でも、ボコーダ50および64内の「ブラック
ボックス」コンポーネントを組み合わせて、1つの物理
コンポーネントが、例示したいくつかの「ブラックボッ
クス」コンポーネントの作業や動作を実行することが可
能である。例えば、荷重フィルタ54をピッチ先鋭化フ
ィルタ55およびしきい値フィルタ57と組み合わせて
単一のコンポーネントを形成し、説明のために別個に例
示した動作を実行することが可能である。
【0046】比較の目的で、従来技術としてIS127
EVRC CDMA符号器について説明したが、認識
されるように、本発明は、ボコーダで使用されるコンポ
ーネントやボコーダの動作にかかわらず、任意のボコー
ダの性能を改善するために使用可能である。さらに、本
発明は、低ビットレートで動作するときに、ボコーダの
性能を改善する際に特に有用であるが、認識されるよう
に、本発明は中ないし高ビットレートで動作するボコー
ダの推定値精度を改善するためにも使用可能である。
【0047】上記の説明で用いた特定の値は本発明を限
定するものと解釈してはならない。これらの特定の値
は、単に、本発明の一実施例の完全な理解を容易にする
ためのものである。認識されるように、本発明は、実施
例で特に用いた以外の値で動作するボコーダにも有益で
ある。例えば、信号フレームの継続時間は20msec
より長いことも短いことも可能である。信号フレームの
サブフレームの数は3個より多いことも少ないことも可
能であり、全くサブフレームがないことも可能である。
1つのサブフレームにおいて、53または54以外の任
意の個数のサンプルをとることが可能である。
【0048】
【発明の効果】以上述べたごとく、本発明によれば、ビ
ットフレーム内のビット位置の数が制限された状態で、
信号フレーム(またはサブフレーム)の固定コードブッ
ク応答をより正確に表現することができるボコーダ、お
よびそのようなボコーダの動作方法が実現される。
【図面の簡単な説明】
【図1】従来技術による送信ボコーダの図である。
【図2】従来技術によるボコーダの復号セクションの図
である。
【図3】従来技術による固定コードブック応答に関連す
るさまざまな信号の図である。
【図4】本発明による送信ボコーダの図である。
【図5】固定コードブック応答を決定するために第2残
差信号をさまざまなパルス列と比較する図である。
【図6】可能な固定コードブック応答のうちから選択す
るために使用される固定コードブック整形ユニットの図
である。
【図7】固定コードブック整形ユニットに関連するさま
ざまな信号の図である。
【図8】本発明によるボコーダの復号セクションの図で
ある。
【符号の説明】
1 第1ボコーダ 2 線形予測符号化(LPC)フィルタ 3 知覚荷重フィルタ 4 ジャンクション(接合点) 5 誤差最小化フィルタ 6 第1適応コードブック 7 第1固定コードブック 8 第1適応コードブック利得ユニット 9 第1固定コードブック利得ユニット 10 ジャンクション 11 第2ボコーダ 12 第2適応コードブック 13 第2固定コードブック 14 第2適応コードブック利得ユニット 15 第2固定コードブック利得ユニット 16 合成フィルタ 17 第1信号ライン 18 第1サブフレーム 19 第2サブフレーム 20 第3サブフレーム 21 パルス 22 第2信号ライン 23 エンベロープ 24 第3信号ライン 25 第4信号ライン 50 第1ボコーダ 51 第1固定コードブック整形ユニット 52 第1固定コードブック 53 信号ライン 54 線形予測(LP)荷重フィルタ 55 ピッチ先鋭化フィルタ 56 信号ライン 57 非線形しきい値フィルタ 58 信号ライン 60 ウィンドウ 61 ウィンドウ 62 ウィンドウ 63 ウィンドウ 64 第2ボコーダ 65 第2固定コードブック整形ユニット 66 第2固定コードブック
───────────────────────────────────────────────────── フロントページの続き (71)出願人 596077259 600 Mountain Avenue, Murray Hill, New Je rsey 07974−0636U.S.A. (72)発明者 エンジン エリツィン アメリカ合衆国、08820 ニュージャージ ー、エジソン、ヒドゥン バレー サイド 107 (72)発明者 マイケル チャールズ レッキオン アメリカ合衆国、07110 ニュージャージ ー、ナタリー、パサイック アベニュー 565

Claims (20)

    【特許請求の範囲】
  1. 【請求項1】 固定コードブック、所定信号、および少
    なくとも1つのパラメータ抽出ユニットを用意するステ
    ップと、 ボコーダによって処理される入力信号を受け取るステッ
    プと、 前記少なくとも1つのパラメータ抽出ユニットを用い
    て、前記入力信号を特徴づける少なくとも1つのパラメ
    ータを抽出するステップと、 前記少なくとも1つのパラメータにより前記所定信号を
    修正して修正信号を得る修正ステップと、 前記修正信号のうち、前記入力信号の少なくとも一部に
    対する固定コードブック応答を表す部分を決定するステ
    ップとを有することを特徴とする、ボコーダの動作方
    法。
  2. 【請求項2】 前記決定するステップは、 前記入力信号の少なくとも一部の残差信号を前記修正信
    号の複数の部分と比較するステップと、 前記複数の部分のうちのいずれが前記残差信号に最も良
    く一致するかを決定するステップとを有することを特徴
    とする請求項1に記載の方法。
  3. 【請求項3】 前記所定信号はガウシアンランダムノイ
    ズ信号であることを特徴とする請求項1に記載の方法。
  4. 【請求項4】 前記修正信号の部分のインデックス付け
    された位置が、ビットパターンにより特徴づけられ、前
    記入力信号を表すビットフレームに含まれることを特徴
    とする請求項1に記載の方法。
  5. 【請求項5】 前記方法は、知覚荷重フィルタを用意す
    るステップをさらに有し、 前記修正ステップは、前記所定信号を前記知覚荷重フィ
    ルタに通すステップを含むことを特徴とする請求項1に
    記載の方法。
  6. 【請求項6】 前記知覚荷重フィルタは、前記入力信号
    の少なくとも一部を特徴づける線形予測符号化出力によ
    って影響されるアクティブフィルタであることを特徴と
    する請求項5に記載の方法。
  7. 【請求項7】 前記方法は、ピッチ先鋭化フィルタを用
    意するステップをさらに有し、 前記修正ステップは、前記所定信号を前記ピッチ先鋭化
    フィルタに通すステップを含むことを特徴とする請求項
    1に記載の方法。
  8. 【請求項8】 前記ピッチ先鋭化フィルタは、前記入力
    信号の少なくとも一部をそれぞれ特徴づける適応コード
    ブック出力および適応コードブック利得出力によって影
    響されるアクティブフィルタであることを特徴とする請
    求項7に記載の方法。
  9. 【請求項9】 前記決定するステップの前に、前記修正
    信号をしきい値フィルタでフィルタリングするステップ
    をさらに有することを特徴とする請求項1に記載の方
    法。
  10. 【請求項10】 前記方法は、知覚荷重フィルタ、ピッ
    チ先鋭化フィルタ、およびしきい値フィルタを用意する
    ステップをさらに有し、 前記修正ステップは、前記所定信号を前記知覚荷重フィ
    ルタ、ピッチ先鋭化フィルタ、およびしきい値フィルタ
    に通すステップを含むことを特徴とする請求項1に記載
    の方法。
  11. 【請求項11】 前記少なくとも1つのパラメータ抽出
    ユニットは、線形予測符号化ユニットを含み、 前記少なくとも1つのパラメータは、線形予測符号化ビ
    ットによって表されることを特徴とする請求項1に記載
    の方法。
  12. 【請求項12】 前記少なくとも1つのパラメータ抽出
    ユニットは、適応コードブックユニットを含み、 前記少なくとも1つのパラメータは、適応コードブック
    ビットによって表されることを特徴とする請求項1に記
    載の方法。
  13. 【請求項13】 前記少なくとも1つのパラメータ抽出
    ユニットは、適応コードブック利得ユニットを含み、 前記少なくとも1つのパラメータは、適応コードブック
    利得ビットによって表されることを特徴とする請求項1
    に記載の方法。
  14. 【請求項14】 前記少なくとも1つのパラメータ抽出
    ユニットは、線形予測符号化ユニット、適応コードブッ
    クユニット、および適応コードブック利得ユニットを含
    み、 前記少なくとも1つのパラメータは、線形予測符号化ビ
    ット、適応コードブックビット、および適応コードブッ
    ク利得ビットによって表されることを特徴とする請求項
    1に記載の方法。
  15. 【請求項15】 ボコーダによって処理されるビットフ
    レームを受け取るステップと、 前記フレーム内の第1ビット群により所定信号を修正し
    て修正信号を得るステップと、 前記フレーム内の第2ビット群を用いて前記修正信号の
    部分をインデックス付けするステップと、 前記ビットフレームの少なくとも一部に対する固定コー
    ドブック応答を表す、インデックス付けされた部分を決
    定するステップとを有することを特徴とする、ボコーダ
    の動作方法。
  16. 【請求項16】 前記第1ビット群は、前記ビットフレ
    ームの少なくとも一部に対する線形予測符号化応答を表
    すことを特徴とする請求項15に記載の方法。
  17. 【請求項17】 前記第1ビット群は、前記ビットフレ
    ームの少なくとも一部に対する線形予測符号化応答、適
    応コードブック応答および適応コードブック利得応答を
    表すことを特徴とする請求項15に記載の方法。
  18. 【請求項18】 前記インデックス付けされた部分はパ
    ルス列であることを特徴とする請求項15に記載の方
    法。
  19. 【請求項19】 前記パルス列は、複数のゼロエントリ
    および複数のパルスエントリを有し、ゼロエントリのパ
    ルスエントリに対する比は85ないし95パーセントの
    範囲にあることを特徴とする請求項18に記載の方法。
  20. 【請求項20】 前記ビットフレームはサブフレームを
    含み、 前記インデックス付けされた部分は、ビットフレームの
    サブフレームのうちの1つに対する固定コードブック応
    答を表すことを特徴とする請求項15に記載の方法。
JP2000123010A 1999-04-28 2000-04-24 ボコーダの動作方法 Abandoned JP2001034300A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US09/300,314 US6449313B1 (en) 1999-04-28 1999-04-28 Shaped fixed codebook search for celp speech coding
US09/300314 1999-04-28

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2007074674A Division JP4690356B2 (ja) 1999-04-28 2007-03-22 ボコーダの動作方法

Publications (1)

Publication Number Publication Date
JP2001034300A true JP2001034300A (ja) 2001-02-09

Family

ID=23158589

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2000123010A Abandoned JP2001034300A (ja) 1999-04-28 2000-04-24 ボコーダの動作方法
JP2007074674A Expired - Fee Related JP4690356B2 (ja) 1999-04-28 2007-03-22 ボコーダの動作方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2007074674A Expired - Fee Related JP4690356B2 (ja) 1999-04-28 2007-03-22 ボコーダの動作方法

Country Status (9)

Country Link
US (1) US6449313B1 (ja)
EP (1) EP1049073B1 (ja)
JP (2) JP2001034300A (ja)
KR (1) KR100713566B1 (ja)
CN (1) CN1271925A (ja)
AU (1) AU2893900A (ja)
BR (1) BR0009621A (ja)
CA (1) CA2305972A1 (ja)
DE (1) DE60016305T2 (ja)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6574593B1 (en) * 1999-09-22 2003-06-03 Conexant Systems, Inc. Codebook tables for encoding and decoding
US7752039B2 (en) * 2004-11-03 2010-07-06 Nokia Corporation Method and device for low bit rate speech coding
US20070136054A1 (en) * 2005-12-08 2007-06-14 Hyun Woo Kim Apparatus and method of searching for fixed codebook in speech codecs based on CELP
JP5188990B2 (ja) * 2006-02-22 2013-04-24 フランス・テレコム Celp技術における、デジタルオーディオ信号の改善された符号化/復号化
US8004436B2 (en) * 2008-10-09 2011-08-23 Analog Devices, Inc. Dithering technique for reducing digital interference
KR101847213B1 (ko) * 2010-09-28 2018-04-11 한국전자통신연구원 쉐이핑 함수를 이용한 오디오 신호 디코딩 방법 및 장치
US9972325B2 (en) 2012-02-17 2018-05-15 Huawei Technologies Co., Ltd. System and method for mixed codebook excitation for speech coding
US9728200B2 (en) 2013-01-29 2017-08-08 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for adaptive formant sharpening in linear prediction coding
US9620134B2 (en) 2013-10-10 2017-04-11 Qualcomm Incorporated Gain shape estimation for improved tracking of high-band temporal characteristics
US10083708B2 (en) 2013-10-11 2018-09-25 Qualcomm Incorporated Estimation of mixing factors to generate high-band excitation signal
US10614816B2 (en) 2013-10-11 2020-04-07 Qualcomm Incorporated Systems and methods of communicating redundant frame information
US9384746B2 (en) 2013-10-14 2016-07-05 Qualcomm Incorporated Systems and methods of energy-scaled signal processing
US10163447B2 (en) 2013-12-16 2018-12-25 Qualcomm Incorporated High-band signal modeling

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0511799A (ja) * 1991-07-08 1993-01-22 Fujitsu Ltd 音声符号化方式
JP3338074B2 (ja) * 1991-12-06 2002-10-28 富士通株式会社 音声伝送方式
US5694519A (en) * 1992-02-18 1997-12-02 Lucent Technologies, Inc. Tunable post-filter for tandem coders
JP3232701B2 (ja) * 1992-10-15 2001-11-26 株式会社日立製作所 音声符号化方法
CA2108623A1 (en) * 1992-11-02 1994-05-03 Yi-Sheng Wang Adaptive pitch pulse enhancer and method for use in a codebook excited linear prediction (celp) search loop
JP2576690B2 (ja) * 1993-03-11 1997-01-29 日本電気株式会社 ディジタル携帯電話機
EP0654909A4 (en) * 1993-06-10 1997-09-10 Oki Electric Ind Co Ltd PREDICTIVE LINEAR ENCODER-ENCODER WITH CODES EXCITATION.
KR100419545B1 (ko) * 1994-10-06 2004-06-04 코닌클리케 필립스 일렉트로닉스 엔.브이. 다른코딩원리들을이용한전송시스템
JP3328080B2 (ja) * 1994-11-22 2002-09-24 沖電気工業株式会社 コード励振線形予測復号器
JPH08179796A (ja) * 1994-12-21 1996-07-12 Sony Corp 音声符号化方法
US6029125A (en) * 1997-09-02 2000-02-22 Telefonaktiebolaget L M Ericsson, (Publ) Reducing sparseness in coded speech signals
US6249758B1 (en) * 1998-06-30 2001-06-19 Nortel Networks Limited Apparatus and method for coding speech signals by making use of voice/unvoiced characteristics of the speech signals

Also Published As

Publication number Publication date
AU2893900A (en) 2000-11-02
DE60016305T2 (de) 2005-11-24
EP1049073A2 (en) 2000-11-02
KR100713566B1 (ko) 2007-05-03
BR0009621A (pt) 2002-04-23
KR20000077100A (ko) 2000-12-26
US6449313B1 (en) 2002-09-10
CN1271925A (zh) 2000-11-01
EP1049073B1 (en) 2004-12-01
DE60016305D1 (de) 2005-01-05
EP1049073A3 (en) 2003-03-26
JP4690356B2 (ja) 2011-06-01
CA2305972A1 (en) 2000-10-28
JP2007226252A (ja) 2007-09-06

Similar Documents

Publication Publication Date Title
JP4690356B2 (ja) ボコーダの動作方法
ES2380962T3 (es) Procedimiento y aparato para codificación de baja tasa de transmisión de bits de habla sorda de alto rendimiento
JP3204581B2 (ja) 合成による分析技術に基づいた音声符号器において励起ゲインを量子化する方法及び装置
JP3531780B2 (ja) 音声符号化方法および復号化方法
JP3618217B2 (ja) 音声のピッチ符号化方法及び音声のピッチ符号化装置並びに音声のピッチ符号化プログラムが記録された記録媒体
JPH0782360B2 (ja) 音声分析合成方法
JP3050978B2 (ja) 音声符号化方法
JPH05265495A (ja) 音声符号化装置並びにその分析器及び合成器
US7472056B2 (en) Transcoder for speech codecs of different CELP type and method therefor
US6292774B1 (en) Introduction into incomplete data frames of additional coefficients representing later in time frames of speech signal samples
JP2943983B1 (ja) 音響信号の符号化方法、復号方法、そのプログラム記録媒体、およびこれに用いる符号帳
JP3296411B2 (ja) 音声符号化方法および復号化方法
JP3552201B2 (ja) 音声符号化方法および装置
JP3047761B2 (ja) 音声符号化装置
JP2000298500A (ja) 音声符号化方法
JP3845316B2 (ja) 音声符号化装置及び音声復号装置
JP4179232B2 (ja) 音声符号化装置及び音声復号装置
JP3192999B2 (ja) 音声符号化方法および音声符号化方法
JP2658438B2 (ja) 音声符号化方法とその装置
CN101266798A (zh) 一种在语音解码器中进行增益平滑的方法及装置
JP3984021B2 (ja) 音声/音響信号の符号化方法及び電子装置
KR100587721B1 (ko) 음성전송시스템
JPH0291699A (ja) 音声符号化復号化方式
JPH05224698A (ja) ピッチサイクル波形を平滑化する方法及び装置
JPH043878B2 (ja)

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050906

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050928

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20051228

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20061122

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20080918

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20080924

A762 Written abandonment of application

Free format text: JAPANESE INTERMEDIATE CODE: A762

Effective date: 20081017