JP2001034300A - ボコーダの動作方法 - Google Patents
ボコーダの動作方法Info
- Publication number
- JP2001034300A JP2001034300A JP2000123010A JP2000123010A JP2001034300A JP 2001034300 A JP2001034300 A JP 2001034300A JP 2000123010 A JP2000123010 A JP 2000123010A JP 2000123010 A JP2000123010 A JP 2000123010A JP 2001034300 A JP2001034300 A JP 2001034300A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- filter
- frame
- bit
- vocoder
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Abandoned
Links
- 238000000034 method Methods 0.000 title claims abstract description 35
- 230000004044 response Effects 0.000 claims abstract description 37
- 238000001914 filtration Methods 0.000 claims abstract description 4
- 230000003044 adaptive effect Effects 0.000 claims description 36
- 238000000605 extraction Methods 0.000 claims 6
- 230000005540 biological transmission Effects 0.000 abstract description 4
- 230000001419 dependent effect Effects 0.000 abstract 1
- 238000007493 shaping process Methods 0.000 description 22
- 230000015572 biosynthetic process Effects 0.000 description 7
- 238000003786 synthesis reaction Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 230000006872 improvement Effects 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 206010008631 Cholera Diseases 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/40—Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code
- H03M7/42—Conversion to or from variable length codes, e.g. Shannon-Fano code, Huffman code, Morse code using table look-up for the coding or decoding process, e.g. using read-only memory
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0013—Codebook search algorithms
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Abstract
れた状態で、信号フレーム(またはサブフレーム)の固
定コードブック応答をより正確に表現することができる
ボコーダ、およびそのようなボコーダの動作方法を実現
する。 【解決手段】 ボコーダ50は、信号フレームの残差信
号と比較するためのパルス列の複数のエントリを有する
固定コードブック52を有する。固定コードブック52
のエントリは、符号化される信号フレームに合わせて設
定される。ノイズ信号が、送信ボコーダ50に記憶され
る。符号化中、ノイズ信号は、信号フレームまたはサブ
フレームを特徴づける決定されたパラメータに依存する
フィルタリングにより整形される。整形されたノイズ信
号をしきい値フィルタに通してパルス列を得る。固定コ
ードブック応答は、パルス列のうち、信号フレームまた
はサブフレームの残差信号に最もよく一致する部分(エ
ントリ)として選択される。
Description
特に、ボコーダによって生成される固定コードブック応
答の表現に関する。
励振線形予測(CELP)ボコーダの送信および受信ユ
ニットを示す。図1において、送信ユニットは第1ボコ
ーダ1である。第1ボコーダ1は、線形予測符号化(L
PC)フィルタ2を有する。LPCフィルタ2は、ジャ
ンクション(接合点)4を介して知覚荷重フィルタ3に
接続される。知覚荷重フィルタ3は、誤差最小化フィル
タ5に接続される。誤差最小化フィルタ5は、第1適応
コードブック6および第1固定コードブック7に接続さ
れる。第1適応コードブック6は、第1適応コードブッ
ク利得ユニット8に接続される。第1固定コードブック
7は、第1固定コードブック利得ユニット9に接続され
る。第1適応コードブック利得ユニット8および第1固
定コードブック利得ユニット9の出力はジャンクション
10で接続される。ジャンクション10はジャンクショ
ン4に接続される。
声入力の時間セグメントを順次分析する。各時間セグメ
ントを信号フレームという。ボコーダ1は、各信号フレ
ームを特徴づけるパラメータを推定する。これらのパラ
メータは、ビットパターンで表され、1つのビットフレ
ームにまとめられる。ビットフレームは、それが表す信
号フレームよりも高速に送信されることが可能であり、
より少ないメモリに記憶することが可能である。
EVRC CDMA型符号器(ボコーダ1)の動作の
一般的な説明を行う。ボコーダ1の動作についてさらに
詳細には、ディジタル音声符号化に関する教科書に記載
されている。ボコーダ1はマルチレートボコーダであ
り、毎秒8キロビット(kbps)に対応するフルレー
トの動作と、4kbpsに対応するハーフレートの動作
がある。ディジタル音声入力は、20msecの信号フ
レームに分割される。各信号フレームはさらに、約6.
6msecの第1、第2、および第3のサブフレームに
分割される。
信号フレームはLPCフィルタ2を通る。LPCフィル
タ2は、信号フレーム全体を特徴づけるLPCパラメー
タを抽出し、そのLPCパラメータを、28ビットのL
PCビットの形で出力する。信号フレームは、LPCフ
ィルタを出て、ジャンクション4、知覚荷重フィルタ
3、および誤差最小化フィルタ5を通る。知覚荷重フィ
ルタ3および誤差最小化フィルタ5は、信号フレームか
らパラメータビットを抽出しないが、この信号フレーム
を後の処理のために準備する。
ック6に入力される。第1適応コードブック6は、フレ
ーム全体のピッチを推定し、フレーム全体のピッチを特
徴づける7ビットのACBビットを出力する。次に、第
1適応コードブック利得ユニット8が、第1サブフレー
ム、第2サブフレーム、および第3サブフレームの適応
コードブック利得を推定する。3ビットのACBGビッ
トが、第1サブフレームの適応コードブック利得を推定
する。さらに3ビットのACBGビットが、第2サブフ
レームの適応コードブック利得を推定する。さらに3ビ
ットのACBGビットが、第3サブフレームの適応コー
ドブック利得を推定する。
ンクション4、知覚荷重フィルタ3、および誤差最小化
フィルタ5を通り、第1固定コードブック7に入力され
る。第1固定コードブック7は、第1サブフレーム、第
2サブフレーム、および第3サブフレームのランダムな
無声音特性を推定する。35ビットのFCBビットが、
第1サブフレームの固定コードブック応答を表す。さら
に35ビットのFCBビットが、第2サブフレームの固
定コードブック応答を表す。さらに35ビットのFCB
ビットが、第3サブフレームの固定コードブック応答を
表す。
9が、第1サブフレーム、第2サブフレーム、および第
3サブフレームの固定コードブック利得を推定する。5
ビットのFCBGビットが、第1サブフレームの固定コ
ードブック利得を推定する。さらに5ビットのFCBG
ビットが、第2サブフレームの固定コードブック利得を
推定する。さらに5ビットのFCBGビットが、第3サ
ブフレームの固定コードブック利得を推定する。
PC、ACB、ACBG、FCB、FCBG)がビット
フレームにまとめられる。このビットフレーム(信号フ
レームを表す)は完全であり、合成のために第2ボコー
ダ11に送信するか、または、後で取り出すためにメモ
リに記憶することが可能である。上記のプロセスは、デ
ィジタル音声入力の各信号フレームについて順次繰り返
される。
コーダ11の復号セクションを示す。第2ボコーダ11
は、第2適応コードブック12、第2固定コードブック
13、第2適応コードブック利得ユニット14、第2固
定コードブック利得ユニット15、および合成フィルタ
16を有する。第2ボコーダ11は、LPCビット、A
CBGビット、ACBビット、FCBビット、およびF
CBGビットを受信する。これらのビットは、第2ボコ
ーダ11によって、当業者に周知のように、もとの信号
フレームの推定値を再構成するために使用される。
当てられるビットフレーム内のビット位置の総数は、8
kbpsのフルレートで動作するボコーダ1(IS12
7EVRC CDMA符号器)に関係する。要約する
と、ビットフレームは、28ビットのLPCビット、7
ビットのACBビット、3+3+3=9ビットのACB
Gビット、35+35+35=105ビットのFCBビ
ット、および5+5+5=15ビットのFCBGビット
を含む。従って、ビットフレーム内の全ビット数は16
4ビットとなる。
ボコーダであり、ボコーダ1のハーフレートは4kbp
sである。ボコーダ1がハーフレートで動作するとき、
リアルタイムで、到来するディジタル音声入力に依然と
して追随しながら、サイズが164ビットのビットフレ
ームを送信することはもはや不可能である。その代わり
に、フレームサイズを縮小して約80ビット位置にしな
ければならない。
MA符号器)がハーフレート(4kpbs)で動作する
とき、ビット位置は次のように割り当てられる。 LPCビット: 22 ACBビット: 7 ACBGビット: 3+3+3=9 FCBビット: 10+10+10=30 FCBGビット: 4+4+4=12 従って、ビットフレーム内の全ビット数は80ビットと
なる。わかるように、FCBビットが、ビットフレーム
のサイズ縮小の支配的な負担を被っている。
め、ボコーダ1における固定コードブック計算の動作に
ついて簡単にまとめる。フルレート(8kbps)で
は、フレームの固定コードブック応答を表すために割り
当てられる105ビット位置が、3個のサブフレームの
それぞれに8個の推定パルスを入れることができる。図
形的にこれを図3に示す。
定のために固定コードブック7に入力される第2残差信
号を表す。第1サブフレーム18は53個のサンプル点
に分割され、第2サブフレーム19も53個のサンプル
点に分割され、第3サブフレーム20は54個のサンプ
ル点に分割される。
最もよく推定するために、正負のパルス21が、サンプ
ル点のうちの選択点に配置される。例えば、第2信号ラ
イン22は、第1信号ラインの第2残差信号を推定する
際の、パルス21の極性(正負)および配置を例示す
る。配置および極性は、サブフレーム18、19、20
のそれぞれに対するFCBビットによって特徴づけられ
るデータである。すなわち、各サブフレームに対して、
固定コードブック7は、第1信号ライン17の第2残差
信号を表すために8〜10個のパルス21の最良の配置
を推定し、そのサブフレームに対するFCBビットは、
パルス21の配置および極性を指定する。
ると、第1信号ライン17の第2残差信号の推定を行う
ために、正負のパルス21の配置に基づいてエンベロー
プ(包絡)23を数学的に構成することができる。図形
的には、これは第3信号ライン24に例示される。もち
ろん、各サブフレームのFCBGビットが、それぞれの
サブフレーム内のエンベロープ23の山および谷の振幅
に影響を及ぼし、エンベロープ23の山および谷の振幅
が第2残差信号内の実際の山および谷の平均振幅に一致
するようにされる。
動作するとき、固定コードブック応答に割り当てられ
る、ビットフレーム内の105ビット位置は、第2信号
ライン22および第3信号ライン24によって例示され
るように、サブフレームあたり8個のパルスの位置およ
び極性を表すことができる。ボコーダ1がハーフレート
(4kbps)で動作するとき、固定コードブック応答
に割り当てられる、フレーム内の30ビット位置は、サ
ブフレームあたり3個のパルスの位置および極性しか表
すことができない。
トで動作するときの正負のパルス21′の配置と、パル
ス21′の配置に従って数学的に構成されるエンベロー
プ23′を例示する。明らかにわかるように、ハーフレ
ート動作中に得られるエンベロープ23′は、第1信号
ライン17の第2残差信号を近似していないし、またほ
とんど同様に、ボコーダ1がフルレートで動作するとき
に得られるエンベロープ23をも近似していない。
1ボコーダ1および第2ボコーダ11は、ビットフレー
ムの送信中に中ないし高ビットレート(例えば、4.8
kbps〜16kbps)を使用するときには、十分な
再生品質でディジタル音声を処理する。しかし、ビット
レートが(ハーフレートに対応する4kbpsのレート
のように)4.8kbpsを下回ると、合成される音声
の品質は大幅に悪化する。この悪い品質は主に、図3の
第4信号ライン25によって例示されるように、サブフ
レームの固定コードブック応答の不正確な表現によるも
のである。
固定コードブック応答を表すためにビットフレーム内に
割り当てられるビット数が制限されている(例えば30
ビット)結果である。ビットレートが低いときにビット
フレームサイズを増大させることはできないため、従来
技術では、ビットフレーム内のビット位置の数が制限さ
れた状態で、信号フレーム(またはサブフレーム)の固
定コードブック応答をより正確に表現することができる
ボコーダ、およびそのようなボコーダの動作方法が必要
とされている。
は、信号フレームまたはサブフレームの残差信号と比較
するためのパルス列の複数のエントリを有する固定コー
ドブックを有する。固定コードブックのエントリは、符
号化される信号フレームまたはサブフレームに合わせて
設定される。ノイズ信号が、送信ボコーダに記憶され
る。符号化中、ノイズ信号は、信号フレームまたはサブ
フレームを特徴づける決定されたパラメータに依存する
フィルタリングにより整形(シェーピング)される。整
形されたノイズ信号をしきい値フィルタに通してパルス
列を得る。固定コードブック応答は、パルス列のうち、
信号フレームまたはサブフレームの残差信号に最もよく
一致する部分(すなわちエントリ)として選択される。
この部分のインデックス付けされた位置が、ビットフレ
ーム内に含まれる固定コードブックビットとして指定さ
れる。同一のノイズ信号が、復号ボコーダにも記憶され
る。同じアクティブフィルタリングおよびしきい値フィ
ルタリングをこの同一のノイズ信号に適用して同じパル
ス列を得る。従って、ビットフレームの固定コードブッ
クビットは、合成中に使用される固定コードブック応答
を表すパルス列の正しい部分をインデックス付けするこ
とになる。
1ボコーダ50を示す。ボコーダ50は、LPCフィル
タ2、知覚荷重フィルタ3、誤差最小化フィルタ5、第
1適応コードブック6、第1適応コードブック利得ユニ
ット8、および第1固定コードブック利得ユニット9を
有する。特に注目すべきなのは、本発明による、第1固
定コードブック整形ユニット51と、改良された第1固
定コードブック52である。第1固定コードブック整形
ユニット51は、第1固定コードブック52に接続さ
れ、LPCビット、ACBビット、およびACBGビッ
トを含む入力を受け取る。
ドブック応答推定に関連するところを除いては、上記の
方法に対応する。第1サブフレーム18が推定されてい
るとき、3個のパルス21′の最良の配置を決定する代
わりに、第2残差信号(信号ライン17)は、複数の可
能パルス列と比較され、第2残差信号に最もよく一致す
るのはどのパルス列であるかが決定される。
与えられたサブフレームの固定コードブック応答を表す
ために10ビット位置が割り当てられるため、第1固定
コードブック52は、第2残差信号と比較するために1
024(210=1024)個の可能なパルス列を有する
ことになる。比較が行われ、最良一致列が決定される
と、最良一致列のアドレスがそのサブフレームに対する
FCBビットとみなされる。これについてさらに詳細に
以下で説明する。
1固定コードブック52によって比較されるため、これ
らの列を注意深く選択し、できるだけ近い一致が見出さ
れるようにすることが重要である。本発明によれば、与
えられたサブフレームの固定コードブック応答は、その
サブフレームを特徴づけるLPCビット、ACBビッ
ト、およびACBGビットとの対応関係を有することが
発見された。この発見に基づいて、本発明は、サブフレ
ームの固定コードブック応答の推定の前に、第1固定コ
ードブック52の可能な列を生成する第1固定コードブ
ック整形ユニット51を実現する。
51の動作について、図6および図7を参照して説明す
る。第1固定コードブック整形ユニット51は、信号ラ
イン53上に例示するような、一様分布ランダムノイズ
f(n)を記憶している。このランダムノイズf(n)
(例えば、ガウス分布ランダムノイズ)は、平坦なスペ
クトルを有する。ランダムノイズf(n)は、線形予測
(LP)荷重フィルタ54およびピッチ先鋭化フィルタ
55に通される。フィルタ54および55はアクティブ
フィルタである。すなわち、信号に対するコレラの作用
は入力により制御される。フィルタ54および55は、
ランダムノイズf(n)を修正して、信号ライン56上
に例示するような出力信号fs(n)を生成する。出力
信号fs(n)は、低減されたピークを有する。すなわ
ち、ランダムノイズf(n)は、LPCフィルタ2、第
1適応コードブック6、および第1適応コードブック利
得ユニット8によって決定されるパラメータに従って、
フィルタ54および55によりスペクトル整形されてい
る。
フィルタ55の動作は、LPCビット、ACBビット、
およびACBGビットに関連する式によって支配され
る。式は、図6に示されている。A(z)は、LPCフ
ィルタ2の出力を表す。gaは、量子化されたACB利
得である。Pは、ピッチ遅延(適応コードブック6によ
り決定される)である。本質的に、LP荷重フィルタ5
4は、γ1倍およびγ2倍に極を広げる(ブロードニン
グ)。
フィルタ55は、広く使用されているフィルタである。
これらのフィルタの式および動作特性は既知である。し
かし、本発明に開示されるような組合せでLP荷重フィ
ルタ54およびピッチ先鋭化フィルタ55を使用するこ
とはこれまで知られていない。LP荷重フィルタ54お
よびピッチ先鋭化フィルタ55についてさらに詳細に
は、この問題に関する教科書、例えば、W. B. Kleijn e
t al., "Speech Coding and Synthesis", Elsevier Pre
ss, 1995, pp.89-90、に記載されている。
(n)は、非線形しきい値フィルタ57を通され、信号
ライン58上に例示するような、パルス列P(n)を得
る。しきい値フィルタ57は、調整可能な上方しきい値
および下方しきい値を有する。これらのしきい値の間に
信号fs(n)が現れるとすべて0に等しくセットされ
る。所定期間上方しきい値より上に信号fs(n)が現
れると正パルス21″となり、同様に、所定期間下方し
きい値より下に信号fs(n)が現れると負パルス2
1″となる。
ルタ57の上方および下方しきい値の設定によって制御
することができる。例えば、これらのしきい値が互いに
近い(すなわち、0に近い)場合、多くのパルス21″
がパルス列P(n)に現れる。これらのしきい値が比較
的遠く離れている(すなわち、0から遠く離れている)
場合、非常に少ないパルス21″がパルス列P(n)に
現れることになる。本発明によれば、まばらさは、約8
5%〜93%の範囲に設定するのが好ましい。すなわ
ち、サンプルのうちの85%〜90%を0に等しくし、
サブフレームあたり4〜7個程度のパルスを残すのが好
ましい。
レームあたり53〜54個のサンプル固定コードブック
整形ユニット51に記憶されているランダムノイズf
(n)は54+1024=1078サンプルの間継続
し、6.7msecのサブフレームでは、これは約13
3msecの継続時間となる。可能な固定コードブック
応答は、パルス列P(n)の上をシフトされる、幅54
サンプルのウィンドウ(ベクトルともいう)によって決
定される。
示す。ウィンドウ60の直上のパルス列は、第1固定コ
ードブック52(図5参照)によって、インデックス付
けされたエントリ(0)により表される。第1のシフト
されたウィンドウの配置を参照符号61で示す。ウィン
ドウ61の直上のパルス列は、第1固定コードブック5
2によって、インデックス付けされたエントリ(1)に
より表される。第2のシフトされたウィンドウの配置を
参照符号62で示す。ウィンドウ62の直上のパルス列
は、第1固定コードブック52によって、インデックス
付けされたエントリ(2)により表される。このウィン
ドウシフトプロセスは、インデックス付けされたエント
リ(1023)を表す最後のシフトされたウィンドウ6
3が第1固定コードブック52によって決定されるまで
繰り返される。
(n)を有することも可能である。この場合、ウィンド
ウ(ベクトル)は、2サンプルの増分でシフトされ、固
定コードブックの1,024個の可能な列を得る。実
際、ランダムノイズの継続時間を延長し、ウィンドウの
増分ステップを増大させることによって、このパターン
をさらに続けることが可能である。
ブック応答は、第1サブフレームの第2残差信号に最も
良く一致するパルス列であると決定される。このエント
リのインデックス(これは、パルス列P(n)に沿って
ウィンドウの位置をシフトさせた個数に等しい)は、第
1サブフレーム18に対するFCBビットとなる。次
に、第1固定コードブック52の新たなパルス列を形成
し、第2サブフレーム19の固定コードブック応答が決
定される。次に、再び第1固定コードブック52の新た
なパルス列を形成し、第3サブフレーム20の固定コー
ドブック応答が決定される。
ードブック52の新たなパルス列を単に周期的に決定す
ることも可能である。例えば、新たなパルス列は、新た
なパルス列を、新たなサブフレームごとに(これはつま
り本発明の好ましい実施例である)ではなく、新たな信
号フレームごとにのみ形成することも可能である。ある
いは、1つおきの信号フレームごとに、新たなエントリ
を形成することなども可能である。固定コードブックの
パルス列の再形成を信号フレームごとや1つおきの信号
フレームごとに制限することにより、関連する計算は簡
略化される。さらに、固定コードブックのパルス列の再
使用は、固定コードブック応答を推定する際に通常は十
分な精度である。音声は、関連する短時間に大幅に変動
することはあまりないからである。
セクションを示す。第2ボコーダ64は、第2適応コー
ドブック12、第2適応コードブック利得ユニット1
4、第2固定コードブック利得ユニット15、および合
成フィルタ16を有する。特に注目すべきなのは、本発
明による、第2固定コードブック整形ユニット65と、
改良された第2固定コードブック66である。
動作は、第1ボコーダ50の第1固定コードブック整形
ユニット51と同一である。第2固定コードブック整形
ユニット65内には、図7の信号ライン53上に例示さ
れる、ランダムノイズf(n)と同一のコピーが記憶さ
れる。第2固定コードブック整形ユニット65は、同一
のアクティブフィルタ54および55を有するととも
に、第1固定コードブック整形ユニット51内のしきい
値フィルタ57の上方および下方しきい値に等しく設定
された上方および下方しきい値を有する同一のしきい値
フィルタ57を有する。従って、第2固定コードブック
整形ユニット65は、前に第1固定コードブック整形ユ
ニット51で生成されたパルス列P(n)と同一の、図
7の信号ライン58上に示した、1,078サンプルの
サンプル期間を有するパルス列P(n)を生成すること
ができる。
定コードブック66は、パルス列P(n)に沿って、F
CBビットによって表されるインデックスに等しい位置
の個数だけ、長さ54サンプルのウィンドウをシフトす
ることにより、固定コードブック応答を決定することが
できる。パルス列P(n)のうち、シフトされたウィン
ドウの直上にある部分は、第1ボコーダ50によって決
定された固定コードブック応答の正しい推定値である。
第2ボコーダによる信号フレームの合成のその他のすべ
ての点については、図2に示した従来技術の復号ボコー
ダ11と同様である。
可能な、第1固定コードブック52内のパルス列エント
リは、それぞれ、4〜7個程度のパルスを含むことが可
能である。これは、従来技術においては第2残差信号の
サブフレーム推定値あたり3個のパルスであったことよ
りも大幅な改善である。この改善により、再生される音
声の品質における顕著な改善が実現される。
り4〜7個のパルスを配置することを可能にする本発明
の重要な1つの特徴は、パルス列P(n)(これからエ
ントリがとられる)が、モデル化される信号の他の決定
されたパラメータに従って構成されることである。本発
明によれば、LPCパラメータ、ACBパラメータ、お
よびACBGパラメータのような他の決定されたパラメ
ータは、予想される固定コードブック応答とある相関関
係を有する。従って、これらのパラメータを用いて、制
限されたサイズの固定コードブックに利用可能なパルス
列を整形することが可能であり、これにより、可能なパ
ルス列は、分析を行うときに第2残差信号に一致する可
能性が比較的高くなる。
ランダムに生成される場合には、制限されたサイズの固
定コードブック(1024個の可能な列)は、連続変化
する第2残差信号の大多数に一致する適当なパルス列を
提供するには統計的に不十分である。すなわち、102
4個の可能なパルス列のそれぞれが、列に沿ってランダ
ムに位置する4〜7個のパルスを有する場合、固定コー
ドブックによって決定される、第2残差信号への最良一
致パルス列の一致は悪くなる可能性が高く、そのフレー
ムまたはサブフレームに対して再生される音声は不正確
になる。
ダ64は、第1固定コードブック52によって使用され
るパルス列P(n)を再構成するために、別のデータを
受信する必要はないという点で有利である。パルス列P
(n)の再構成に用いられるLPCビット、ACBビッ
ト、およびACBGビットは、音声信号を再構成するた
めに第2ボコーダ64によって既に必要とされているた
め、別のデータはビットフレームに含まれない。
内のサンプル点に位置するパルスに関して説明してい
る。直ちに明らかなように、このような説明は、数学的
演算および数式の単なる図形的表現である。この図形的
表現は、従来技術と本発明との相違点の説明を単純化す
るものである。実際には、固定コードブック52および
66、ならびに固定コードブック整形ユニット51およ
び65は、図形的表現の基礎となる数学的演算および数
式を処理する。
コードブック整形ユニット51および第2固定コードブ
ック整形ユニット65は、第1固定コードブック52お
よび第2固定コードブック66とは別個のコンポーネン
トとして説明した。別個としての説明は、本発明の説明
を単純化するためである。実際には、固定コードブック
整形ユニットおよび固定コードブックは、単一の物理コ
ンポーネントに組み込むことが可能である。さらに、そ
の他の点でも、ボコーダ50および64内の「ブラック
ボックス」コンポーネントを組み合わせて、1つの物理
コンポーネントが、例示したいくつかの「ブラックボッ
クス」コンポーネントの作業や動作を実行することが可
能である。例えば、荷重フィルタ54をピッチ先鋭化フ
ィルタ55およびしきい値フィルタ57と組み合わせて
単一のコンポーネントを形成し、説明のために別個に例
示した動作を実行することが可能である。
EVRC CDMA符号器について説明したが、認識
されるように、本発明は、ボコーダで使用されるコンポ
ーネントやボコーダの動作にかかわらず、任意のボコー
ダの性能を改善するために使用可能である。さらに、本
発明は、低ビットレートで動作するときに、ボコーダの
性能を改善する際に特に有用であるが、認識されるよう
に、本発明は中ないし高ビットレートで動作するボコー
ダの推定値精度を改善するためにも使用可能である。
定するものと解釈してはならない。これらの特定の値
は、単に、本発明の一実施例の完全な理解を容易にする
ためのものである。認識されるように、本発明は、実施
例で特に用いた以外の値で動作するボコーダにも有益で
ある。例えば、信号フレームの継続時間は20msec
より長いことも短いことも可能である。信号フレームの
サブフレームの数は3個より多いことも少ないことも可
能であり、全くサブフレームがないことも可能である。
1つのサブフレームにおいて、53または54以外の任
意の個数のサンプルをとることが可能である。
ットフレーム内のビット位置の数が制限された状態で、
信号フレーム(またはサブフレーム)の固定コードブッ
ク応答をより正確に表現することができるボコーダ、お
よびそのようなボコーダの動作方法が実現される。
である。
るさまざまな信号の図である。
差信号をさまざまなパルス列と比較する図である。
るために使用される固定コードブック整形ユニットの図
である。
ざまな信号の図である。
ある。
Claims (20)
- 【請求項1】 固定コードブック、所定信号、および少
なくとも1つのパラメータ抽出ユニットを用意するステ
ップと、 ボコーダによって処理される入力信号を受け取るステッ
プと、 前記少なくとも1つのパラメータ抽出ユニットを用い
て、前記入力信号を特徴づける少なくとも1つのパラメ
ータを抽出するステップと、 前記少なくとも1つのパラメータにより前記所定信号を
修正して修正信号を得る修正ステップと、 前記修正信号のうち、前記入力信号の少なくとも一部に
対する固定コードブック応答を表す部分を決定するステ
ップとを有することを特徴とする、ボコーダの動作方
法。 - 【請求項2】 前記決定するステップは、 前記入力信号の少なくとも一部の残差信号を前記修正信
号の複数の部分と比較するステップと、 前記複数の部分のうちのいずれが前記残差信号に最も良
く一致するかを決定するステップとを有することを特徴
とする請求項1に記載の方法。 - 【請求項3】 前記所定信号はガウシアンランダムノイ
ズ信号であることを特徴とする請求項1に記載の方法。 - 【請求項4】 前記修正信号の部分のインデックス付け
された位置が、ビットパターンにより特徴づけられ、前
記入力信号を表すビットフレームに含まれることを特徴
とする請求項1に記載の方法。 - 【請求項5】 前記方法は、知覚荷重フィルタを用意す
るステップをさらに有し、 前記修正ステップは、前記所定信号を前記知覚荷重フィ
ルタに通すステップを含むことを特徴とする請求項1に
記載の方法。 - 【請求項6】 前記知覚荷重フィルタは、前記入力信号
の少なくとも一部を特徴づける線形予測符号化出力によ
って影響されるアクティブフィルタであることを特徴と
する請求項5に記載の方法。 - 【請求項7】 前記方法は、ピッチ先鋭化フィルタを用
意するステップをさらに有し、 前記修正ステップは、前記所定信号を前記ピッチ先鋭化
フィルタに通すステップを含むことを特徴とする請求項
1に記載の方法。 - 【請求項8】 前記ピッチ先鋭化フィルタは、前記入力
信号の少なくとも一部をそれぞれ特徴づける適応コード
ブック出力および適応コードブック利得出力によって影
響されるアクティブフィルタであることを特徴とする請
求項7に記載の方法。 - 【請求項9】 前記決定するステップの前に、前記修正
信号をしきい値フィルタでフィルタリングするステップ
をさらに有することを特徴とする請求項1に記載の方
法。 - 【請求項10】 前記方法は、知覚荷重フィルタ、ピッ
チ先鋭化フィルタ、およびしきい値フィルタを用意する
ステップをさらに有し、 前記修正ステップは、前記所定信号を前記知覚荷重フィ
ルタ、ピッチ先鋭化フィルタ、およびしきい値フィルタ
に通すステップを含むことを特徴とする請求項1に記載
の方法。 - 【請求項11】 前記少なくとも1つのパラメータ抽出
ユニットは、線形予測符号化ユニットを含み、 前記少なくとも1つのパラメータは、線形予測符号化ビ
ットによって表されることを特徴とする請求項1に記載
の方法。 - 【請求項12】 前記少なくとも1つのパラメータ抽出
ユニットは、適応コードブックユニットを含み、 前記少なくとも1つのパラメータは、適応コードブック
ビットによって表されることを特徴とする請求項1に記
載の方法。 - 【請求項13】 前記少なくとも1つのパラメータ抽出
ユニットは、適応コードブック利得ユニットを含み、 前記少なくとも1つのパラメータは、適応コードブック
利得ビットによって表されることを特徴とする請求項1
に記載の方法。 - 【請求項14】 前記少なくとも1つのパラメータ抽出
ユニットは、線形予測符号化ユニット、適応コードブッ
クユニット、および適応コードブック利得ユニットを含
み、 前記少なくとも1つのパラメータは、線形予測符号化ビ
ット、適応コードブックビット、および適応コードブッ
ク利得ビットによって表されることを特徴とする請求項
1に記載の方法。 - 【請求項15】 ボコーダによって処理されるビットフ
レームを受け取るステップと、 前記フレーム内の第1ビット群により所定信号を修正し
て修正信号を得るステップと、 前記フレーム内の第2ビット群を用いて前記修正信号の
部分をインデックス付けするステップと、 前記ビットフレームの少なくとも一部に対する固定コー
ドブック応答を表す、インデックス付けされた部分を決
定するステップとを有することを特徴とする、ボコーダ
の動作方法。 - 【請求項16】 前記第1ビット群は、前記ビットフレ
ームの少なくとも一部に対する線形予測符号化応答を表
すことを特徴とする請求項15に記載の方法。 - 【請求項17】 前記第1ビット群は、前記ビットフレ
ームの少なくとも一部に対する線形予測符号化応答、適
応コードブック応答および適応コードブック利得応答を
表すことを特徴とする請求項15に記載の方法。 - 【請求項18】 前記インデックス付けされた部分はパ
ルス列であることを特徴とする請求項15に記載の方
法。 - 【請求項19】 前記パルス列は、複数のゼロエントリ
および複数のパルスエントリを有し、ゼロエントリのパ
ルスエントリに対する比は85ないし95パーセントの
範囲にあることを特徴とする請求項18に記載の方法。 - 【請求項20】 前記ビットフレームはサブフレームを
含み、 前記インデックス付けされた部分は、ビットフレームの
サブフレームのうちの1つに対する固定コードブック応
答を表すことを特徴とする請求項15に記載の方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US09/300,314 US6449313B1 (en) | 1999-04-28 | 1999-04-28 | Shaped fixed codebook search for celp speech coding |
US09/300314 | 1999-04-28 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007074674A Division JP4690356B2 (ja) | 1999-04-28 | 2007-03-22 | ボコーダの動作方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2001034300A true JP2001034300A (ja) | 2001-02-09 |
Family
ID=23158589
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000123010A Abandoned JP2001034300A (ja) | 1999-04-28 | 2000-04-24 | ボコーダの動作方法 |
JP2007074674A Expired - Fee Related JP4690356B2 (ja) | 1999-04-28 | 2007-03-22 | ボコーダの動作方法 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007074674A Expired - Fee Related JP4690356B2 (ja) | 1999-04-28 | 2007-03-22 | ボコーダの動作方法 |
Country Status (9)
Country | Link |
---|---|
US (1) | US6449313B1 (ja) |
EP (1) | EP1049073B1 (ja) |
JP (2) | JP2001034300A (ja) |
KR (1) | KR100713566B1 (ja) |
CN (1) | CN1271925A (ja) |
AU (1) | AU2893900A (ja) |
BR (1) | BR0009621A (ja) |
CA (1) | CA2305972A1 (ja) |
DE (1) | DE60016305T2 (ja) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6574593B1 (en) * | 1999-09-22 | 2003-06-03 | Conexant Systems, Inc. | Codebook tables for encoding and decoding |
US7752039B2 (en) * | 2004-11-03 | 2010-07-06 | Nokia Corporation | Method and device for low bit rate speech coding |
US20070136054A1 (en) * | 2005-12-08 | 2007-06-14 | Hyun Woo Kim | Apparatus and method of searching for fixed codebook in speech codecs based on CELP |
JP5188990B2 (ja) * | 2006-02-22 | 2013-04-24 | フランス・テレコム | Celp技術における、デジタルオーディオ信号の改善された符号化/復号化 |
US8004436B2 (en) * | 2008-10-09 | 2011-08-23 | Analog Devices, Inc. | Dithering technique for reducing digital interference |
KR101847213B1 (ko) * | 2010-09-28 | 2018-04-11 | 한국전자통신연구원 | 쉐이핑 함수를 이용한 오디오 신호 디코딩 방법 및 장치 |
US9972325B2 (en) | 2012-02-17 | 2018-05-15 | Huawei Technologies Co., Ltd. | System and method for mixed codebook excitation for speech coding |
US9728200B2 (en) | 2013-01-29 | 2017-08-08 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for adaptive formant sharpening in linear prediction coding |
US9620134B2 (en) | 2013-10-10 | 2017-04-11 | Qualcomm Incorporated | Gain shape estimation for improved tracking of high-band temporal characteristics |
US10083708B2 (en) | 2013-10-11 | 2018-09-25 | Qualcomm Incorporated | Estimation of mixing factors to generate high-band excitation signal |
US10614816B2 (en) | 2013-10-11 | 2020-04-07 | Qualcomm Incorporated | Systems and methods of communicating redundant frame information |
US9384746B2 (en) | 2013-10-14 | 2016-07-05 | Qualcomm Incorporated | Systems and methods of energy-scaled signal processing |
US10163447B2 (en) | 2013-12-16 | 2018-12-25 | Qualcomm Incorporated | High-band signal modeling |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0511799A (ja) * | 1991-07-08 | 1993-01-22 | Fujitsu Ltd | 音声符号化方式 |
JP3338074B2 (ja) * | 1991-12-06 | 2002-10-28 | 富士通株式会社 | 音声伝送方式 |
US5694519A (en) * | 1992-02-18 | 1997-12-02 | Lucent Technologies, Inc. | Tunable post-filter for tandem coders |
JP3232701B2 (ja) * | 1992-10-15 | 2001-11-26 | 株式会社日立製作所 | 音声符号化方法 |
CA2108623A1 (en) * | 1992-11-02 | 1994-05-03 | Yi-Sheng Wang | Adaptive pitch pulse enhancer and method for use in a codebook excited linear prediction (celp) search loop |
JP2576690B2 (ja) * | 1993-03-11 | 1997-01-29 | 日本電気株式会社 | ディジタル携帯電話機 |
EP0654909A4 (en) * | 1993-06-10 | 1997-09-10 | Oki Electric Ind Co Ltd | PREDICTIVE LINEAR ENCODER-ENCODER WITH CODES EXCITATION. |
KR100419545B1 (ko) * | 1994-10-06 | 2004-06-04 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 다른코딩원리들을이용한전송시스템 |
JP3328080B2 (ja) * | 1994-11-22 | 2002-09-24 | 沖電気工業株式会社 | コード励振線形予測復号器 |
JPH08179796A (ja) * | 1994-12-21 | 1996-07-12 | Sony Corp | 音声符号化方法 |
US6029125A (en) * | 1997-09-02 | 2000-02-22 | Telefonaktiebolaget L M Ericsson, (Publ) | Reducing sparseness in coded speech signals |
US6249758B1 (en) * | 1998-06-30 | 2001-06-19 | Nortel Networks Limited | Apparatus and method for coding speech signals by making use of voice/unvoiced characteristics of the speech signals |
-
1999
- 1999-04-28 US US09/300,314 patent/US6449313B1/en not_active Expired - Lifetime
-
2000
- 2000-04-18 BR BR0009621-0A patent/BR0009621A/pt not_active Application Discontinuation
- 2000-04-19 CA CA002305972A patent/CA2305972A1/en not_active Abandoned
- 2000-04-20 DE DE60016305T patent/DE60016305T2/de not_active Expired - Lifetime
- 2000-04-20 AU AU28939/00A patent/AU2893900A/en not_active Abandoned
- 2000-04-20 EP EP00303361A patent/EP1049073B1/en not_active Expired - Lifetime
- 2000-04-24 JP JP2000123010A patent/JP2001034300A/ja not_active Abandoned
- 2000-04-27 CN CN00107074A patent/CN1271925A/zh active Pending
- 2000-04-27 KR KR1020000022493A patent/KR100713566B1/ko active IP Right Grant
-
2007
- 2007-03-22 JP JP2007074674A patent/JP4690356B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
AU2893900A (en) | 2000-11-02 |
DE60016305T2 (de) | 2005-11-24 |
EP1049073A2 (en) | 2000-11-02 |
KR100713566B1 (ko) | 2007-05-03 |
BR0009621A (pt) | 2002-04-23 |
KR20000077100A (ko) | 2000-12-26 |
US6449313B1 (en) | 2002-09-10 |
CN1271925A (zh) | 2000-11-01 |
EP1049073B1 (en) | 2004-12-01 |
DE60016305D1 (de) | 2005-01-05 |
EP1049073A3 (en) | 2003-03-26 |
JP4690356B2 (ja) | 2011-06-01 |
CA2305972A1 (en) | 2000-10-28 |
JP2007226252A (ja) | 2007-09-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4690356B2 (ja) | ボコーダの動作方法 | |
ES2380962T3 (es) | Procedimiento y aparato para codificación de baja tasa de transmisión de bits de habla sorda de alto rendimiento | |
JP3204581B2 (ja) | 合成による分析技術に基づいた音声符号器において励起ゲインを量子化する方法及び装置 | |
JP3531780B2 (ja) | 音声符号化方法および復号化方法 | |
JP3618217B2 (ja) | 音声のピッチ符号化方法及び音声のピッチ符号化装置並びに音声のピッチ符号化プログラムが記録された記録媒体 | |
JPH0782360B2 (ja) | 音声分析合成方法 | |
JP3050978B2 (ja) | 音声符号化方法 | |
JPH05265495A (ja) | 音声符号化装置並びにその分析器及び合成器 | |
US7472056B2 (en) | Transcoder for speech codecs of different CELP type and method therefor | |
US6292774B1 (en) | Introduction into incomplete data frames of additional coefficients representing later in time frames of speech signal samples | |
JP2943983B1 (ja) | 音響信号の符号化方法、復号方法、そのプログラム記録媒体、およびこれに用いる符号帳 | |
JP3296411B2 (ja) | 音声符号化方法および復号化方法 | |
JP3552201B2 (ja) | 音声符号化方法および装置 | |
JP3047761B2 (ja) | 音声符号化装置 | |
JP2000298500A (ja) | 音声符号化方法 | |
JP3845316B2 (ja) | 音声符号化装置及び音声復号装置 | |
JP4179232B2 (ja) | 音声符号化装置及び音声復号装置 | |
JP3192999B2 (ja) | 音声符号化方法および音声符号化方法 | |
JP2658438B2 (ja) | 音声符号化方法とその装置 | |
CN101266798A (zh) | 一种在语音解码器中进行增益平滑的方法及装置 | |
JP3984021B2 (ja) | 音声/音響信号の符号化方法及び電子装置 | |
KR100587721B1 (ko) | 음성전송시스템 | |
JPH0291699A (ja) | 音声符号化復号化方式 | |
JPH05224698A (ja) | ピッチサイクル波形を平滑化する方法及び装置 | |
JPH043878B2 (ja) |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20050906 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20050928 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20051228 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20061122 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20080918 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20080924 |
|
A762 | Written abandonment of application |
Free format text: JAPANESE INTERMEDIATE CODE: A762 Effective date: 20081017 |