JP3236592B2 - デジタル音声符号器において使用するための音声符号化方法 - Google Patents
デジタル音声符号器において使用するための音声符号化方法Info
- Publication number
- JP3236592B2 JP3236592B2 JP35934599A JP35934599A JP3236592B2 JP 3236592 B2 JP3236592 B2 JP 3236592B2 JP 35934599 A JP35934599 A JP 35934599A JP 35934599 A JP35934599 A JP 35934599A JP 3236592 B2 JP3236592 B2 JP 3236592B2
- Authority
- JP
- Japan
- Prior art keywords
- filter
- order
- generating
- vector
- coefficients
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000000034 method Methods 0.000 title claims description 52
- 239000013598 vector Substances 0.000 claims description 76
- 230000003595 spectral effect Effects 0.000 claims description 50
- 230000015572 biosynthetic process Effects 0.000 claims description 36
- 238000003786 synthesis reaction Methods 0.000 claims description 36
- 230000007774 longterm Effects 0.000 claims description 17
- 238000001914 filtration Methods 0.000 claims description 10
- 230000006870 function Effects 0.000 description 21
- 238000010586 diagram Methods 0.000 description 6
- 230000005236 sound signal Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 2
- 240000000224 Hippobroma longiflora Species 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000007493 shaping process Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Description
化に関し、かつより特定的には、音声符号器(spee
ch coder)において使用するためにスペクトル
ノイズ重み付けフィルタを発生する改良された方法に関
する。
cited linear prediction:C
ELP)は高品質の合成された音声を生成するために使
用される音声符号化技術である。この種の音声符号化
は、ベクトル駆動リニア予測(vector−exci
ted linear prediction)として
も知られており、数多くの音声通信および音声合成の用
途に使用されている。CELPは特に音声品質、データ
レート、サイズおよびコストが重要な事項であるデジタ
ル音声暗号化およびデジタル無線電話通信システムに適
用可能である。
信号の特性をモデル化する長期間(long−ter
m)(ピッチ)および短期間(short−term)
(フォルマント)予測器が1組の時変フィルタにおいて
導入されている。すなわち、長期間フィルタおよび短期
間フィルタである。該フィルタに対する駆動信号(ex
citation signal)は記憶されたイノベ
イション(innovation)シーケンス、または
コードベクトル、のコードブックから選択される。
は個々のコードベクトルを前記フィルタに印加して再生
された(reconstructed)音声信号を発生
する。該再生された音声信号は元の入力音声信号と比較
され、エラー信号を生成する。該エラー信号は次にそれ
を人間の聴覚に基づく応答を有するスペクトルノイズ重
み付けフィルタ(spectral noise we
ighting filter)を通すことにより重み
付けされる。最適の駆動信号は現在の音声のフレームに
対し最小のエネルギを有する重み付けされたエラー信号
を生成するコードベクトルを選択することにより決定さ
れる。
予測符号化パラメータが係数アナライザ(coeffi
cient analyzer)によって生成される。
該パラメータは典型的には長期間、短期間およびスペク
トルノイズ重み付けフィルタに対する係数を含む。
付けフィルタによるろ波動作は音声符号器の総合的な計
算機的複雑さのかなりの部分を構成し得るが、それはス
ペクトル的に重み付けされたエラー信号はイノベイショ
ンシーケンスのコードブックからの各々のコードベクト
ルに対して計算される必要があるからである。典型的に
は、スペクトルノイズ重み付けフィルタによって与えら
れる制御と該スペクトルノイズ重み付けフィルタによる
複雑さとの間のある妥協を行なう必要がある。重み付け
フィルタの複雑さの対応する増大なしに、スペクトルノ
イズ重み付けフィルタによって導入される周波数形成
(frequency shaping)の制御を増大
できる技術が得られれば音声符号化の分野の現状を進展
させるのに有用であろう。
ル音声符号化方法を含む。この方法はR次の(Rth−
order)フィルタにより複数のフィルタの周波数応
答をモデル化し、それによって複数フィルタの複雑さな
しに複数フィルタの制御を提供するフィルタを提供する
ことを含む。前記R次のフィルタは、どの実施例が行な
われるかに応じて、スペクトルノイズ重み付けフィル
タ、あるいは短期間予測フィルタ(short−ter
m predictor filter)とスペクトル
ノイズ重み付けフィルタとの組み合わせとして使用でき
る。短期間予測フィルタとスペクトルノイズ重み付けフ
ィルタとの組合わせはスペクトル的にノイズ重み付けさ
れたシンセシスフィルタと称される。一般に、前記方法
は単一のR次のフィルタによってL個のP次のフィルタ
の周波数応答をモデル化し、ここでR<LxPである。
好ましい実施例では、Lは2に等しい。以下の式は本発
明において使用される方法を示す。
の第1の実施例のブロック図である。分析されるべき音
響入力信号はマイクロホン102において音声符号器1
00に印加される。典型的には音声信号である、前記入
力信号は次にフィルタ104に供給される。フィルタ1
04は一般にバンドパスフィルタ特性を示す。しかしな
がら、もし前記音声の帯域幅がすでに適切であれば、フ
ィルタ104は直接的なワイヤ接続とすることができ
る。
108はフィルタ104から出力されるアナログ音声信
号152を一連のNのパルスサンプルに変換し、各々の
パルスサンプルの振幅は次に、技術的に知られているよ
うに、デジタル符号によって表現される。サンプルクロ
ック、SC、は前記A/Dコンバータ108のサンプリ
ングレートを決定する。好ましい実施例では、SCは8
kHzで動作する。前記サンプルクロックSCはクロッ
クモジュール112において前記フレームクロックFC
とともに発生される。
称される、A/D108のデジタル出力は係数アナライ
ザ110に供給される。この入力音声ベクトルs(n)
158は異なるフレーム、すなわち、時間長、で反復
的に得られ、その長さは前記フレームクロックFCによ
って決定される。
ア予測符号化(LPC)パラメータが係数アナライザ1
10によって生成される。短期間予測係数160(ST
P)、長期間予測係数162(LTP)、および駆動利
得係数166gがマルチプレクサ150に供給されかつ
音声シンセサイザによって使用するためにチャネルによ
って送信される。前記入力音声ベクトル、s(n)、1
58はまた減算器130に供給され、該減算器130の
機能は後に説明する。
is vector)格納ブロック114は1組のMの
基礎ベクトルVm(n)を含み、この場合1≦m≦Mで
あり、前記基礎ベクトルの各々はNのサンプルからな
り、この場合1≦n≦Nである。これらの基礎ベクトル
はコードブック発生器120によって1組の2Mの擬似
ランダム駆動ベクトルui(n)を発生するために使用
され、この場合0≦i≦2M−1である。前記Mの基礎
ベクトルの各々は一連のランダムホワイトガウスサンプ
ルからなるが、他の形式の基礎ベクトルも使用できる。
クトルui(n)を発生するために、Mの基礎ベクトル
Vm(n)および1組の2Mの駆動コードワードIiを
使用し、この場合0≦i≦2M−1である。本実施例に
おいては、各々のコードワードIiはその指数iに等し
く、すなわち、Ii=iである。もし前記駆動信号が前
記40サンプルの各々に対し毎サンプル0.25ビット
のレートで符号化されれば(したがってM=10)、1
024の駆動ベクトルを発生するために使用される10
の基礎ベクトルがあることになる。
し、入力音声ベクトルs(n)との比較のために再生さ
れた(recontructed)音声ベクトルs′i
(n)が発生される。ゲインブロック122は前記駆動
ベクトルui(n)を、前記フレームに対しては一定で
ある、駆動利得係数giによってスケーリングする。ス
ケーリングされた駆動信号giui(n) 168は長
期間予測フィルタ124および短期間予測フィルタ12
6によってろ波されて前記再生された音声ベクトルs′
i(n) 170を発生する。長期間予測フィルタ(L
ong term predictor filte
r)124は音声の周期性を導入するために長期間予測
係数162を使用し、かつ短期間予測フィルタ126は
スペクトル的なエンベロープを導入するために短期間予
測係数160を使用する。ブロック124および126
は実際にはそれらのそれぞれのフィードバック経路に長
期間予測器および短期間予測器を含む再帰フィルタ(r
ecursive filters)である。
再生された音声ベクトルs′i(n) 170は同じブ
ロックの入力音声ベクトルs(n) 158とこれら2
つの信号を減算器130において減算することにより比
較される。差分ベクトル(differnce vec
tor)ei(n) 172は元の音声のブロックと再
生された音声のブロックとの間の差を表わす。前記差分
ベクトルei(n)172は、係数アナライザ110に
よって発生される前記スペクトルノイズ重み付けフィル
タ係数164を使用して、前記スペクトルノイズ重み付
けフィルタ132によって重み付けされる。スペクトル
ノイズ重み付けは人間の耳にとって知覚的により重要で
ある周波数を強調し、かつ他の周波数を減衰する。スペ
クトルノイズ重み付けを行なうより効率的な方法が本発
明の主題である。
イズ重み付けされた差分ベクトルe′i(n) 174
のエネルギを計算し、かつこのエラー信号Ei 176
をコードブックサーチコントローラ140に供給する。
該コードブックサーチコントローラ140は現在の駆動
ベクトルui(n)に対するi番目のエラー信号を前の
エラー信号と比較して最小の重み付けされたエラーを生
成する駆動ベクトルを決定する。次に最小のエラーを有
するi番目の駆動ベクトルの符号(code)が最善の
駆動コードI 178として前記チャネルを介して出力
される。あるいは、サーチコントローラ140は、予め
規定されたエラーしきい値を満たすような、ある所定の
基準を有するエラー信号を提供する特定のコードワード
を決定することができる。
施例に従って行なわれる音声符号化動作の全体的なシー
ケンスを示すフローチャート200を含む。該プロセス
は201において開始される。機能ブロック203は図
1の説明に従って音声データを受信する。機能ブロック
205は短期間および長期間予測係数を決定する。これ
は図1の係数アナライザ110において行なわれる。短
期間および長期間予測係数を決定する方法は、B.S.
Atalによる、1982年4月の、「低いビットレー
トでの音声の予測符号化(Predictive Co
ding ofSpeech at Low Bit
Rates)」と題する、IEEETrans. Co
mmun. Vol.Com−30,pp.600−1
4の論文に見られる。前記短期間予測子(short
term predictor)、A(z)、は次式の
係数によって規定される。
び第2の組のフィルタを特徴付ける1組の暫定的なスペ
クトルノイズ重み付けフィルタ係数を発生する。該フィ
ルタは任意の次数のフィルタとすることができ、すなわ
ち前記第1のフィルタはF次(F−order)であ
り、かつ第2のフィルタはJ次のものとすることがで
き、この場合R<F+Jである。好ましい実施例は2つ
のJ次のフィルタを使用し、この場合JはPに等しい。
これらの係数を使用するフィルタは次の形式のものであ
る。
(z/α3) この場合
“ ̄”,“〜”などは文字の上部に配置すべきものであ
るが、電子出願に対処するためこれらの記号は文字の前
に配置している。
ィルタの縦続接続(cascade)である、^H
(z)は前記暫定的なスペクトルノイズ重み付けフィル
タとして定義される。前記暫定的なスペクトルノイズ重
み付けフィルタの係数は機能ブロック205において発
生される短期間予測係数に依存することに注目すべきで
ある。この暫定的なスペクトルノイズ重み付けフィル
タ、^H(z)、は過去において直接音声符号器の構成
に使用されてきた。
な複雑さを低減するため、^H(z)の周波数応答は単
一のR次のフィルタ^Hs(z)によってモデル化さ
れ、該フィルタは次の形式の組み合わされたスペクトル
ノイズ重み付けフィルタである。
ilter)として示されているが、^Hs(z)はま
たゼロフィルタ(zero filter)として設計
できることに注意を要する。機能ブロック209は前記
^Hs(z)フィルタの係数を発生する。組み合わされ
たスペクトルノイズ重み付けフィルタに対する係数を発
生するプロセスは図3に詳細に示されている。R次のオ
ールポールモデルは前記暫定的なスペクトルノイズ重み
付けフィルタよりも低い次数のものであり、これは計算
機的な処理の節約につながる。
音声データを受信したことに応答して駆動ベクトルを提
供する。機能ブロック213は該駆動ベクトルを長期間
124および短期間126予測フィルタを通してろ波す
る。
から出力されるろ波された駆動ベクトルを図1の説明に
従って受信された音声データと比較し差分ベクトルを形
成する。機能ブロック217は機能ブロック209にお
いて発生された組み合わされたスペクトルノイズ重み付
けフィルタ係数を使用して、前記差分ベクトルをろ波し
スペクトル的にノイズ重み付けされた差分ベクトルを形
成する。機能ブロック219は図1の説明に従ってスペ
クトル的にノイズ重み付けされた差分ベクトルのエネル
ギを計算しかつエラー信号を形成する。機能ブロック2
21は図1の説明に従ってエラー信号を使用して駆動符
号、I、を選択する。処理は223において終了する。
するために使用できる処理の詳細を示す処理フローチャ
ート300を示す。この処理は301で始まる。前記暫
定的なスペクトルノイズ重み付けフィルタ、^H
(z)、が与えられると、機能ブロック303はKのサ
ンプルに対し^H(z)のインパルス応答、^h
(n)、を発生し、ここで
{A(z/α2)}]A(z/α3) であり、この場合、
なわち、a1>0およびa2>0でa1≠a2であり、
あるいはa2>0およびa3>0でa2≠a3である。
機能ブロック305は前記インパルス応答^h(n)を
自己相関し、次の形式の自己相関を形成する。
びレビンソンの再帰(Levinson′s recu
rsion)を使用して、^Hs(z)の係数を計算
し、該^Hs(z)は次の形式の組み合わされたスペク
トルノイズ重み付けフィルタである。
の実施例の全体的なブロック図である。音声符号器40
0は以下に述べる差異を除き前記音声符号器100と同
じである。第1に、図1のスペクトルノイズ重み付けフ
ィルタ132が図4の減算器430に先行する2つのフ
ィルタによって置き換えられている。これら2つのフィ
ルタはスペクトル的にノイズ重み付けされたシンセシス
フィルタ1 468およびスペクトル的にノイズ重み付
けされたシンセシスフィルタ2 426である。以後、
これらのフィルタはそれぞれフィルタ1およびフィルタ
2と称する。フィルタ1 468およびフィルタ2 4
26は図1のスペクトルノイズ重み付けフィルタ132
と各々がスペクトルノイズ重み付けフィルタに加えて、
短期間シンセシスフィルタまたは重み付けされた短期間
シンセシスフィルタを含む点で異なっている。得られた
フィルタは総称的にスペクトル的にノイズ重み付けされ
たシンセシスフィルタと称される。特に、それは前記暫
定的なスペクトル的に重み付けされたシンセシスフィル
タとしてまたは組み合わされた(combined)ス
ペクトル的に重み付けされたシンセシスフィルタとして
構成することができる。フィルタ1 468には短期間
インバースフィルタ470が先行する。さらに、図1の
短期間予測器126は図4では省略されている。フィル
タ1およびフィルタ2はそれらの図4におけるそれぞれ
の位置を除き同じである。これらのフィルタの2つの特
定の構成は図6および図7に示されている。
458、フィルタ1の係数460、フィルタ2の係数4
62、長期間予測器係数464、および駆動ゲイン係数
g466を発生する。フィルタ1およびフィルタ2に対
する係数を発生する方法は図5に示されている。音声符
号器400は音声符号器100と同じ結果を生成するこ
とができ、一方必要な計算の数を低減できる可能性があ
る。従って、音声符号器400は音声符号器100より
好ましいかもしれない。音声符号器100および音声符
号器400の双方で同じ機能ブロックの説明は説明の効
率のため反復しない。
にノイズ重み付けされたシンセシスフィルタである、〜
Hs(z)に対する係数を発生する方法を示す処理のフ
ローチャートである。この処理は501で開始される。
機能ブロック503はP次の短期間予測器フィルタ、A
(z)、に対する係数を発生する。機能ブロック505
は次の形式の暫定的にスペクトル的にノイズ重み付けさ
れたシンセシスフィルタ、H(z)、に対する係数を発
生する。
(z/α2)}]A(z/α3) この場合、
509はフィルタ〜H(z)の周波数応答をモデル化す
る、R次の組み合わされたスペクトル的にノイズ重み付
けされたシンセシスフィルタ、〜Hs(z)、に対する
係数を発生する。該係数は前記〜H(z)のインパルス
応答、〜h(n)、を自己相関し、かつ該係数を検出す
るために再帰的(recursion)方法を使用する
ことによって発生される。好ましい実施例では当業者に
知られているものと想定されるレビンソンの再帰法(L
evinson′s recursion)を使用す
る。処理は511で終了する。
ンセシスフィルタ1 468および重み付けされたシン
セシスフィルタ2 426において使用することができ
るそれぞれ第1の構成および第2の構成を示す。
けされたシンセシスフィルタ2 426は暫定的なスペ
クトル的にノイズ重み付けされたシンセシスフィルタ〜
H(z)を含み、該フィルタは3つのフィルタ、すなわ
ちa1によって重み付けされた短期間シンセシスフィル
タA(z/a1) 611、a2によって重み付けされ
た短期間インバースフィルタ1/A(z/a2) 61
3、およびa3によって重み付けされた短期間シンセシ
スフィルタA(z/a3) 615の縦続接続であり、
ここで0≦a3≦a2≦a1≦1である。重み付けされ
たシンセシスフィルタ1 468、図6a、は重み付け
されたシンセシスフィルタ2 426と、それが短期間
インバースフィルタ1/A(z) 603によって先行
されかつ入力音声経路に配置されることを除き同じであ
る。〜H(z)はその場合フィルタ605,607,お
よび609の縦続接続である。
ル的にノイズ重み付けされたシンセシスフィルタ〜H
(z)468および426が単一の組み合わされたスペ
クトル的にノイズ重み付けされたシンセシスフィルタ〜
Hs(z)619および621によって置き換えられて
いる。〜Hs(z)は、図6aの、フィルタ605,6
07,および609の縦続接続、または等価的にはフィ
ルタ611,613,および615の縦続接続である、
〜H(z)の周波数応答をモデル化する。前記〜H
s(z)フィルタの係数を発生する方法の詳細は図5に
見ることができる。
あり、この場合a3=0である。重み付けされたシンセ
シスフィルタ2 426は暫定的なスペクトル的にノイ
ズ重み付けされたシンセシスフィルタ、〜H(z)、を
含み、このフィルタは2つのフィルタ、すなわち、a1
によって重み付けされた短期間シンセシスフィルタA
(z/a1) 729、およびa2によって重み付けさ
れる短期間インバースフィルタ1/A(z/a2) 7
31の縦続接続である。図7aの重み付けされたシンセ
シスフィルタ1 468はそれに先行して短期間インバ
ースフィルタ1/A(z) 703が配置され、かつ入
力音声経路に配置される点を除き、重み付けされたシン
セシスフィルタ2 426と同じである。〜H(z)は
その場合フィルタ725および727の縦続接続であ
る。
にノイズ重み付けされたシンセシスフィルタ〜H(z)
468および426、図7a、が単一の組み合わされた
スペクトル的にノイズ重み付けされたシンセシスフィル
タ〜Hs(z) 719および721に置き換えられて
いる。〜Hs(z)は、図7aの、フィルタ725およ
び727の縦続接続、または等価的にフィルタ729お
よび731の縦続接続である、〜H(z)の周波数応答
をモデル化する。〜Hs(z)のフィルタ係数を発生す
る方法の詳細は図5に見ることができる。
ルノイズ重み付けフィルタから組み合わされたスペクト
ルノイズ重み付けフィルタを発生することは、1つのR
次のフィルタの複雑さにより2またはそれ以上のJ次の
フィルタの制御を有する効率的なフィルタを生成する。
これにより音声符号器の対応する複雑さの増大なしによ
り効率の良いフィルタを提供できる。同様に、ここに開
示された形式の暫定的なスペクトル的にノイズ重み付け
されたシンセシスフィルタから前記組み合わされたスペ
クトル的にノイズ重み付けされたシンセシスフィルタを
発生することにより、1つのR次のフィルタへと組み合
わされた1つのP次のフィルタおよび1つまたはそれ以
上のJ次のフィルタの制御を有する効率的なフィルタの
生成が可能になる。このことにより音声符号器の対応す
る複雑さの増大なしにより効率的なフィルタが提供され
る。
ある。
化動作の全体的なシーケンスを示すプロセスフローチャ
ートである。
ズフィルタ係数を発生するシーケンスを示す処理フロー
チャートである。
ロック図である。
符号化動作の全体的なシーケンスを示す処理フローチャ
ートである。
けフィルタ構成を示すブロック図である。
けフィルタ構成を示すブロック図である。
Claims (13)
- 【請求項1】 デジタル音声符号器において使用するた
めの音声符号化方法であって、前記デジタル音声符号器
は組み合わされたスペクトル的にノイズ重み付けされた
フィルタ、^Hs(z)、およびP次の短期間フィル
タ、A(z)、を含み、前記方法は、 音声データを受信する段階、 前記受信された音声データに応じて駆動ベクトルを生成
する段階、 前記音声データおよび前記駆動ベクトルに応じて差分ベ
クトルを生成する段階、 P次のフィルタ、A(z)、のための係数を発生する段
階、 第1のF次のフィルタおよび第2のJ次のフィルタに対
する係数を含む暫定的なフィルタに対する係数を発生す
る段階であって、各々のフィルタは前記P次のフィルタ
に対する前記係数に依存するもの、 重み付けフィルタにおいて使用するために前記暫定的な
フィルタのR次のモデルに対する係数を発生する段階で
あって、R<F+Jであり、前記暫定的なフィルタは、 【数1】^H(z)=[1/{A(z/α2)}]A
(z/α3) の形式を有し、この場合、 【数2】0≦αn≦1、 および 【数3】 であるもの、前記暫定的なフィルタのR次のモデルに対
する係数を使用して前記デジタル音声符号器の差分ベク
トルをろ波し、ろ波された差分ベクトルを生成する段
階、前記ろ波された差分ベクトルに応じて駆動符号を選
択する段階、そして前記音声データのその後のデコード
のために前記駆動符号を伝送する段階、を具備するデジ
タル音声符号器において使用するための音声符号化方
法。 - 【請求項2】 前記R次のモデルを発生する段階はさら
に、 Kのサンプルに対して前記暫定的なフィルタ、^H
(z)、のインパルス応答、^h(n)、を発生する段
階、 前記インパルス応答、^h(n)、を自己相関して自己
相関、 【数4】 【数5】0≦i≦R;R<K を形成する段階、そして再帰的方法および前記自己相
関、Rhh(i)、を使用して前記R次のフィルタの係
数を計算する段階、 を具備する請求項1に記載の方法。 - 【請求項3】 前記再帰的方法はレビンソンの再帰方法
である、請求項1に記載の方法。 - 【請求項4】 デジタル音声符号器において使用するた
めの音声符号化方法であって、前記デジタル音声符号器
は組み合わされたスペクトルノイズ重み付けフィルタ、
^Hs(z)、およびP次の短期間フィルタ、A
(z)、を含み、前記方法は、 音声データを受信する段階、 前記音声データに応じて駆動ベクトルを生成する段階、 前記音声データおよび前記駆動ベクトルに応じて差分ベ
クトルを生成する段階、 【数6】^H(z)=[1/{A(z/α2)}]A
(z/α3) の形式の暫定的重み付けフィルタのための係数を発生す
る段階であって、この場合、 【数7】0≦αn≦1、 および 【数8】 であるもの、 Kのサンプルに対し前記暫定的な重み付けフィルタ、^
H(z)、のインパルス応答、^h(n)、を発生する
段階、 前記インパルス応答、^h(n)、を自己相関して、自
己相関、 【数9】 【数10】0≦i≦R;R<Kを形成する段階、 前記自己相関、Rhh(i)および再帰方法を使用し
て、 【数11】 の形式の、組み合わされたスペクトルノイズ重み付けフ
ィルタ、^Hs(z)、の係数を計算する段階、 前記組み合わされたスペクトルノイズ重み付けフィルタ
の係数を使用して前記デジタル音声符号器の差分ベクト
ルをろ波し、ろ波された差分ベクトルを形成する段階、 前記ろ波された差分ベクトルに応じて駆動符号を選択す
る段階、そして前記音声データのその後のデコードのた
めに前記駆動符号を伝送する段階、 を具備するデジタル音声符号器において使用するための
音声符号化方法。 - 【請求項5】 前記再帰的方法はレビンソンの再帰方法
である、請求項4に記載の方法。 - 【請求項6】 デジタル音声符号器において使用するた
めの音声符号化方法であって、前記デジタル音声符号器
は組み合わされたスペクトル的にノイズ重み付けされた
シンセシスフィルタ、〜Hs(z)、およびP次の短期
間フィルタ、A(z)、を含み、前記方法は、 音声データを受信する段階、 前記音声データに応じて駆動ベクトルを生成する段階、 前記音声データおよび前記駆動ベクトルに応じて差分ベ
クトルを生成する段階、 【数12】〜H(z)={A(z/α1)}[1/{A
(z/α2)}]A(z/α3) の形式の暫定的なスペクトル的にノイズ重み付けされた
シンセシスフィルタのための係数を発生する段階であっ
て、この場合、 【数13】0≦αn≦1、 そして 【数14】 であり、そして少なくとも2つの打ち消されない項があ
るもの、 Kのサンプルに対し、前記暫定的なスペクトル的にノイ
ズ重み付けされたシンセシスフィルタ、〜H(z)、の
インパルス応答、〜h(n)、を発生する段階、 前記インパルス応答、〜h(n)、を自己相関して、自
己相関、 【数15】 【数16】0≦i≦R;R<K を形成する段階、 前記自己相関、Rhh(i)、および再帰方法を使用し
て、 【数17】 の形式の組み合わされたスペクトル的にノイズ重み付け
されたシンセシスフィルタ、〜Hs(z)、の係数を計
算する段階、 前記組み合わされたスペクトル的にノイズ重み付けされ
たシンセシスフィルタの係数を使用して前記デジタル音
声符号器の差分ベクトルをろ波し、ろ波された差分ベク
トルを形成する段階、 前記ろ波された差分ベクトルに応じて駆動符号を選択す
る段階、そして前記音声データのその後のデコードのた
めに前記駆動符号を伝送する段階、 を具備するデジタル音声符号器において使用するための
音声符号化方法。 - 【請求項7】 前記P次のフィルタは短期間フィルタで
あり、前記F次のフィルタは前記J次のフィルタと同じ
次数であり、前記F次およびJ次のフィルタは打ち消さ
れない項を有し、かつ前記暫定的なフィルタは暫定的な
スペクトルノイズ重み付けフィルタである請求項2に記
載の方法。 - 【請求項8】 さらに、 前記受信する段階に応答して基礎ベクトルを提供する段
階、 を具備する請求項2に記載の方法。 - 【請求項9】 前記R次のオールポールモデルを発生す
る段階はさらに、 前記暫定スペクトルノイズ重み付けフィルタのインパル
ス応答を発生する段階、 前記インパルス応答を自己相関して、自己相関R
hh(i)を形成する段階、そして再帰的方法および前
記自己相関を使用して前記R次のオールポールフィルタ
の係数を計算する段階、 を具備する請求項8に記載の方法。 - 【請求項10】 音声符号化方法であって、 音声データを受信する段階、 組み合わされた短期間およびスペクトルノイズ重み付け
フィルタのためのフィルタ係数を発生する段階であっ
て、 P次の短期間フィルタを発生する段階、 各フィルタが前記P次の短期間フィルタに依存する、第
1のF次のフィルタおよび第2のJ次のフィルタを含む
暫定的なスペクトルノイズ重み付けフィルタを発生する
段階、そしてR<P+F+Jとした時、前記P次の短期
間フィルタおよび前記暫定的なスペクトルノイズ重み付
けフィルタを使用してR次のオールポールの組み合わさ
れた短期間およびスペクトルノイズ重み付けフィルタの
ための係数を発生する段階、を具備する前記段階、 前記受信された音声データをろ波し、ろ波された受信音
声データを生成する段階、 前記組み合わされた短期間およびスペクトルノイズ重み
付けフィルタを使用して基礎ベクトルをろ波し、ろ波さ
れたベクトルを形成する段階、 前記ろ波されたベクトルを前記ろ波された受信音声デー
タと比較して、差分ベクトルを形成する段階、 前記差分ベクトルのエネルギを計算して、エラー信号を
形成する段階、そして前記エラー信号を使用して、前記
受信された音声データを表わす、駆動符号、I、を選択
する段階、 を具備する音声符号化方法。 - 【請求項11】 前記R次のオールポールの組み合わさ
れた短期間およびスペクトルノイズ重み付けフィルタの
ための係数を発生する段階はさらに、 前記短期間フィルタおよび前記暫定的なスペクトルノイ
ズ重み付けフィルタのインパルス応答を発生する段階、 前記インパルス応答を自己相関して、自己相関R
hh(i)を形成する段階、そして再帰方法および前記
自己相関を使用して前記R次のオールポールフィルタの
係数を計算する段階、 を具備する、請求項10に記載の音声符号化方法。 - 【請求項12】 音声符号化方法であって、 音声データを受信する段階、 長期間およびP次の短期間予測器フィルタによって使用
するための短期間および長期間予測器係数を決定する段
階、 前記長期間予測器フィルタおよび前記短期間予測器フィ
ルタを使用して基礎ベクトルをろ波し、ろ波された基礎
ベクトルを形成する段階、 スペクトルノイズ重み付けフィルタのための係数を決定
する段階であって、 前記P次の短期間フィルタ係数に依存して、第1のF次
のフィルタおよび第2のJ次のフィルタを含む暫定スペ
クトルノイズ重み付けフィルタを発生する段階、および
R<F+Jとし、前記暫定スペクトルノイズ重み付けフ
ィルタのR次のオールポールモデルを使用してスペクト
ルノイズ重み付け係数を発生する段階、を具備する前記
スペクトルノイズ重み付けフィルタのための係数を決定
する段階、 前記ろ波された基礎ベクトルを前記受信された音声デー
タと比較し、差分ベクトルを形成する段階、 前記スペクトルノイズ重み付けフィルタ係数に依存する
フィルタを使用して前記差分ベクトルをろ波し、ろ波さ
れた差分ベクトルを形成する段階、 前記ろ波された差分ベクトルのエネルギを計算し、エラ
ー信号を形成する段階、そして前記エラー信号を使用し
て、前記受信された音声データを表わす、駆動符号、
I、を選択する段階、 を具備する音声符号化方法。 - 【請求項13】 前記R次のオールポールモデルを発生
する段階はさらに、 前記暫定スペクトルノイズ重み付けフィルタのインパル
ス応答を発生する段階、 前記インパルス応答を自己相関して、自己相関R
hh(i)を形成する段階、そして再帰的方法および前
記自己相関を使用して前記R次のオールポールフィルタ
の係数を計算する段階、 を具備する請求項12に記載の音声符号化方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US08/021,364 US5434947A (en) | 1993-02-23 | 1993-02-23 | Method for generating a spectral noise weighting filter for use in a speech coder |
US08/021364 | 1993-02-23 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP6518975A Division JP3070955B2 (ja) | 1993-02-23 | 1994-01-18 | 音声符号器において使用するためのスペクトルノイズ重み付けフィルタを発生する方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2000155597A JP2000155597A (ja) | 2000-06-06 |
JP3236592B2 true JP3236592B2 (ja) | 2001-12-10 |
Family
ID=21803778
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP6518975A Expired - Lifetime JP3070955B2 (ja) | 1993-02-23 | 1994-01-18 | 音声符号器において使用するためのスペクトルノイズ重み付けフィルタを発生する方法 |
JP35934599A Expired - Lifetime JP3236592B2 (ja) | 1993-02-23 | 1999-12-17 | デジタル音声符号器において使用するための音声符号化方法 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP6518975A Expired - Lifetime JP3070955B2 (ja) | 1993-02-23 | 1994-01-18 | 音声符号器において使用するためのスペクトルノイズ重み付けフィルタを発生する方法 |
Country Status (11)
Country | Link |
---|---|
US (2) | US5434947A (ja) |
JP (2) | JP3070955B2 (ja) |
CN (1) | CN1074846C (ja) |
AU (1) | AU669788B2 (ja) |
BR (1) | BR9404230A (ja) |
CA (1) | CA2132006C (ja) |
DE (2) | DE4491015C2 (ja) |
FR (1) | FR2702075B1 (ja) |
GB (1) | GB2280828B (ja) |
SE (1) | SE517793C2 (ja) |
WO (1) | WO1994019790A1 (ja) |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5708756A (en) * | 1995-02-24 | 1998-01-13 | Industrial Technology Research Institute | Low delay, middle bit rate speech coder |
EP0763818B1 (en) * | 1995-09-14 | 2003-05-14 | Kabushiki Kaisha Toshiba | Formant emphasis method and formant emphasis filter device |
US5963899A (en) * | 1996-08-07 | 1999-10-05 | U S West, Inc. | Method and system for region based filtering of speech |
US6098038A (en) * | 1996-09-27 | 2000-08-01 | Oregon Graduate Institute Of Science & Technology | Method and system for adaptive speech enhancement using frequency specific signal-to-noise ratio estimates |
US5924062A (en) * | 1997-07-01 | 1999-07-13 | Nokia Mobile Phones | ACLEP codec with modified autocorrelation matrix storage and search |
GB2352949A (en) * | 1999-08-02 | 2001-02-07 | Motorola Ltd | Speech coder for communications unit |
US6801931B1 (en) * | 2000-07-20 | 2004-10-05 | Ericsson Inc. | System and method for personalizing electronic mail messages by rendering the messages in the voice of a predetermined speaker |
SE521693C3 (sv) * | 2001-03-30 | 2004-02-04 | Ericsson Telefon Ab L M | En metod och anordning för brusundertryckning |
US7337110B2 (en) * | 2002-08-26 | 2008-02-26 | Motorola, Inc. | Structured VSELP codebook for low complexity search |
WO2004027754A1 (en) * | 2002-09-17 | 2004-04-01 | Koninklijke Philips Electronics N.V. | A method of synthesizing of an unvoiced speech signal |
EP1513137A1 (en) * | 2003-08-22 | 2005-03-09 | MicronasNIT LCC, Novi Sad Institute of Information Technologies | Speech processing system and method with multi-pulse excitation |
CA2596341C (en) * | 2005-01-31 | 2013-12-03 | Sonorit Aps | Method for concatenating frames in communication system |
US8725506B2 (en) * | 2010-06-30 | 2014-05-13 | Intel Corporation | Speech audio processing |
CA3160488C (en) | 2010-07-02 | 2023-09-05 | Dolby International Ab | Audio decoding with selective post filtering |
FR2977439A1 (fr) * | 2011-06-28 | 2013-01-04 | France Telecom | Fenetres de ponderation en codage/decodage par transformee avec recouvrement, optimisees en retard. |
JP6077166B2 (ja) * | 2016-07-10 | 2017-02-08 | 有限会社技研産業 | 放射線遮蔽材料及び放射線遮蔽建材 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
NL188189C (nl) * | 1979-04-04 | 1992-04-16 | Philips Nv | Werkwijze ter bepaling van stuursignalen voor besturing van polen van een louter-polen filter in een spraaksynthese-inrichting. |
US4401855A (en) * | 1980-11-28 | 1983-08-30 | The Regents Of The University Of California | Apparatus for the linear predictive coding of human speech |
JPH0738119B2 (ja) * | 1986-07-30 | 1995-04-26 | 日本電気株式会社 | 音声波形符号復号化装置 |
US5125030A (en) * | 1987-04-13 | 1992-06-23 | Kokusai Denshin Denwa Co., Ltd. | Speech signal coding/decoding system based on the type of speech signal |
US4817157A (en) * | 1988-01-07 | 1989-03-28 | Motorola, Inc. | Digital speech coder having improved vector excitation source |
CA2021514C (en) * | 1989-09-01 | 1998-12-15 | Yair Shoham | Constrained-stochastic-excitation coding |
JP2626223B2 (ja) * | 1990-09-26 | 1997-07-02 | 日本電気株式会社 | 音声符号化装置 |
JPH04207410A (ja) * | 1990-11-30 | 1992-07-29 | Canon Inc | デジタルフイルタ装置 |
JPH06138896A (ja) * | 1991-05-31 | 1994-05-20 | Motorola Inc | 音声フレームを符号化するための装置および方法 |
-
1993
- 1993-02-23 US US08/021,364 patent/US5434947A/en not_active Expired - Lifetime
-
1994
- 1994-01-18 GB GB9420077A patent/GB2280828B/en not_active Expired - Lifetime
- 1994-01-18 AU AU61255/94A patent/AU669788B2/en not_active Expired
- 1994-01-18 JP JP6518975A patent/JP3070955B2/ja not_active Expired - Lifetime
- 1994-01-18 CA CA002132006A patent/CA2132006C/en not_active Expired - Lifetime
- 1994-01-18 WO PCT/US1994/000724 patent/WO1994019790A1/en active Application Filing
- 1994-01-18 DE DE4491015A patent/DE4491015C2/de not_active Expired - Lifetime
- 1994-01-18 BR BR9404230A patent/BR9404230A/pt not_active IP Right Cessation
- 1994-01-18 DE DE4491015T patent/DE4491015T1/de active Pending
- 1994-02-09 FR FR9401450A patent/FR2702075B1/fr not_active Expired - Lifetime
- 1994-02-22 CN CN94102142A patent/CN1074846C/zh not_active Expired - Lifetime
- 1994-10-24 SE SE9403630A patent/SE517793C2/sv not_active IP Right Cessation
-
1995
- 1995-05-04 US US08/434,868 patent/US5570453A/en not_active Expired - Lifetime
-
1999
- 1999-12-17 JP JP35934599A patent/JP3236592B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
FR2702075A1 (fr) | 1994-09-02 |
CA2132006C (en) | 1998-04-28 |
CN1104010A (zh) | 1995-06-21 |
AU6125594A (en) | 1994-09-14 |
GB2280828B (en) | 1997-07-30 |
FR2702075B1 (fr) | 1996-04-26 |
SE517793C2 (sv) | 2002-07-16 |
CA2132006A1 (en) | 1994-09-01 |
JPH07506202A (ja) | 1995-07-06 |
US5570453A (en) | 1996-10-29 |
GB9420077D0 (en) | 1994-11-23 |
SE9403630D0 (sv) | 1994-10-24 |
JP3070955B2 (ja) | 2000-07-31 |
WO1994019790A1 (en) | 1994-09-01 |
DE4491015C2 (de) | 1996-10-24 |
AU669788B2 (en) | 1996-06-20 |
US5434947A (en) | 1995-07-18 |
BR9404230A (pt) | 1999-06-15 |
SE9403630L (sv) | 1994-12-21 |
GB2280828A (en) | 1995-02-08 |
DE4491015T1 (de) | 1995-09-21 |
JP2000155597A (ja) | 2000-06-06 |
CN1074846C (zh) | 2001-11-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP0409239B1 (en) | Speech coding/decoding method | |
JP4662673B2 (ja) | 広帯域音声及びオーディオ信号復号器における利得平滑化 | |
JP4550289B2 (ja) | Celp符号変換 | |
JP3236592B2 (ja) | デジタル音声符号器において使用するための音声符号化方法 | |
JPH1091194A (ja) | 音声復号化方法及び装置 | |
JPH09127991A (ja) | 音声符号化方法及び装置、音声復号化方法及び装置 | |
JPH09127996A (ja) | 音声復号化方法及び装置 | |
JPH10124092A (ja) | 音声符号化方法及び装置、並びに可聴信号符号化方法及び装置 | |
JP3357795B2 (ja) | 音声符号化方法および装置 | |
EP0390975B1 (en) | Encoder Device capable of improving the speech quality by a pair of pulse producing units | |
JP3248668B2 (ja) | ディジタルフィルタおよび音響符号化/復号化装置 | |
EP1103953B1 (en) | Method for concealing erased speech frames | |
JPH0944195A (ja) | 音声符号化装置 | |
JP3531780B2 (ja) | 音声符号化方法および復号化方法 | |
JP3905706B2 (ja) | 音声符号化装置、音声処理装置及び音声処理方法 | |
JP3583945B2 (ja) | 音声符号化方法 | |
JP3417362B2 (ja) | 音声信号復号方法及び音声信号符号化復号方法 | |
KR100341398B1 (ko) | 씨이엘피형 보코더의 코드북 검색 방법 | |
JP3510168B2 (ja) | 音声符号化方法及び音声復号化方法 | |
JP3192051B2 (ja) | 音声符号化装置 | |
JP2853170B2 (ja) | 音声符号化復号化方式 | |
JP3063087B2 (ja) | 音声符号化復号化装置及び音声符号化装置ならびに音声復号化装置 | |
JP3468862B2 (ja) | 音声符号化装置 | |
JP3520955B2 (ja) | 音響信号符号化法 | |
JP3274451B2 (ja) | 適応ポストフィルタ及び適応ポストフィルタリング方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20070928 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080928 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090928 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090928 Year of fee payment: 8 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: R3D03 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100928 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110928 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120928 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120928 Year of fee payment: 11 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120928 Year of fee payment: 11 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130928 Year of fee payment: 12 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |