JP3236592B2 - デジタル音声符号器において使用するための音声符号化方法 - Google Patents

デジタル音声符号器において使用するための音声符号化方法

Info

Publication number
JP3236592B2
JP3236592B2 JP35934599A JP35934599A JP3236592B2 JP 3236592 B2 JP3236592 B2 JP 3236592B2 JP 35934599 A JP35934599 A JP 35934599A JP 35934599 A JP35934599 A JP 35934599A JP 3236592 B2 JP3236592 B2 JP 3236592B2
Authority
JP
Japan
Prior art keywords
filter
order
generating
vector
coefficients
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP35934599A
Other languages
English (en)
Other versions
JP2000155597A (ja
Inventor
イラ・エイ・ジャーソン
マーク・エイ・ジャシウク
マシュー・エイ・ハートマン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Motorola Solutions Inc
Original Assignee
Motorola Solutions Inc
Motorola Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Motorola Solutions Inc, Motorola Inc filed Critical Motorola Solutions Inc
Publication of JP2000155597A publication Critical patent/JP2000155597A/ja
Application granted granted Critical
Publication of JP3236592B2 publication Critical patent/JP3236592B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は一般的には音声符号
化に関し、かつより特定的には、音声符号器(spee
ch coder)において使用するためにスペクトル
ノイズ重み付けフィルタを発生する改良された方法に関
する。
【0002】
【従来の技術】コード駆動リニア予測(code−ex
cited linear prediction:C
ELP)は高品質の合成された音声を生成するために使
用される音声符号化技術である。この種の音声符号化
は、ベクトル駆動リニア予測(vector−exci
ted linear prediction)として
も知られており、数多くの音声通信および音声合成の用
途に使用されている。CELPは特に音声品質、データ
レート、サイズおよびコストが重要な事項であるデジタ
ル音声暗号化およびデジタル無線電話通信システムに適
用可能である。
【0003】CELP音声符号器においては、入力音声
信号の特性をモデル化する長期間(long−ter
m)(ピッチ)および短期間(short−term)
(フォルマント)予測器が1組の時変フィルタにおいて
導入されている。すなわち、長期間フィルタおよび短期
間フィルタである。該フィルタに対する駆動信号(ex
citation signal)は記憶されたイノベ
イション(innovation)シーケンス、または
コードベクトル、のコードブックから選択される。
【0004】各々の音声のフレームに対し、音声符号器
は個々のコードベクトルを前記フィルタに印加して再生
された(reconstructed)音声信号を発生
する。該再生された音声信号は元の入力音声信号と比較
され、エラー信号を生成する。該エラー信号は次にそれ
を人間の聴覚に基づく応答を有するスペクトルノイズ重
み付けフィルタ(spectral noise we
ighting filter)を通すことにより重み
付けされる。最適の駆動信号は現在の音声のフレームに
対し最小のエネルギを有する重み付けされたエラー信号
を生成するコードベクトルを選択することにより決定さ
れる。
【0005】各々の音声フレームに対し、1組のリニア
予測符号化パラメータが係数アナライザ(coeffi
cient analyzer)によって生成される。
該パラメータは典型的には長期間、短期間およびスペク
トルノイズ重み付けフィルタに対する係数を含む。
【0006】
【発明が解決しようとする課題】スペクトルノイズ重み
付けフィルタによるろ波動作は音声符号器の総合的な計
算機的複雑さのかなりの部分を構成し得るが、それはス
ペクトル的に重み付けされたエラー信号はイノベイショ
ンシーケンスのコードブックからの各々のコードベクト
ルに対して計算される必要があるからである。典型的に
は、スペクトルノイズ重み付けフィルタによって与えら
れる制御と該スペクトルノイズ重み付けフィルタによる
複雑さとの間のある妥協を行なう必要がある。重み付け
フィルタの複雑さの対応する増大なしに、スペクトルノ
イズ重み付けフィルタによって導入される周波数形成
(frequency shaping)の制御を増大
できる技術が得られれば音声符号化の分野の現状を進展
させるのに有用であろう。
【0007】
【課題を解決するための手段】本明細書の開示はデジタ
ル音声符号化方法を含む。この方法はR次の(Rth−
order)フィルタにより複数のフィルタの周波数応
答をモデル化し、それによって複数フィルタの複雑さな
しに複数フィルタの制御を提供するフィルタを提供する
ことを含む。前記R次のフィルタは、どの実施例が行な
われるかに応じて、スペクトルノイズ重み付けフィル
タ、あるいは短期間予測フィルタ(short−ter
m predictor filter)とスペクトル
ノイズ重み付けフィルタとの組み合わせとして使用でき
る。短期間予測フィルタとスペクトルノイズ重み付けフ
ィルタとの組合わせはスペクトル的にノイズ重み付けさ
れたシンセシスフィルタと称される。一般に、前記方法
は単一のR次のフィルタによってL個のP次のフィルタ
の周波数応答をモデル化し、ここでR<LxPである。
好ましい実施例では、Lは2に等しい。以下の式は本発
明において使用される方法を示す。
【数18】 ここで
【数19】 および
【数20】1≧α≧α≧0 である。
【0008】
【発明の実施の形態】図1は本発明を用いた音声符号器
の第1の実施例のブロック図である。分析されるべき音
響入力信号はマイクロホン102において音声符号器1
00に印加される。典型的には音声信号である、前記入
力信号は次にフィルタ104に供給される。フィルタ1
04は一般にバンドパスフィルタ特性を示す。しかしな
がら、もし前記音声の帯域幅がすでに適切であれば、フ
ィルタ104は直接的なワイヤ接続とすることができ
る。
【0009】アナログ/デジタル(A/D)コンバータ
108はフィルタ104から出力されるアナログ音声信
号152を一連のNのパルスサンプルに変換し、各々の
パルスサンプルの振幅は次に、技術的に知られているよ
うに、デジタル符号によって表現される。サンプルクロ
ック、SC、は前記A/Dコンバータ108のサンプリ
ングレートを決定する。好ましい実施例では、SCは8
kHzで動作する。前記サンプルクロックSCはクロッ
クモジュール112において前記フレームクロックFC
とともに発生される。
【0010】入力音声ベクトル、s(n) 158、と
称される、A/D108のデジタル出力は係数アナライ
ザ110に供給される。この入力音声ベクトルs(n)
158は異なるフレーム、すなわち、時間長、で反復
的に得られ、その長さは前記フレームクロックFCによ
って決定される。
【0011】各々のブロックの音声に対し、1組のリニ
ア予測符号化(LPC)パラメータが係数アナライザ1
10によって生成される。短期間予測係数160(ST
P)、長期間予測係数162(LTP)、および駆動利
得係数166gがマルチプレクサ150に供給されかつ
音声シンセサイザによって使用するためにチャネルによ
って送信される。前記入力音声ベクトル、s(n)、1
58はまた減算器130に供給され、該減算器130の
機能は後に説明する。
【0012】基底ベクトルまたは基礎ベクトル(bas
is vector)格納ブロック114は1組のMの
基礎ベクトルV(n)を含み、この場合1≦m≦Mで
あり、前記基礎ベクトルの各々はNのサンプルからな
り、この場合1≦n≦Nである。これらの基礎ベクトル
はコードブック発生器120によって1組の2の擬似
ランダム駆動ベクトルu(n)を発生するために使用
され、この場合0≦i≦2−1である。前記Mの基礎
ベクトルの各々は一連のランダムホワイトガウスサンプ
ルからなるが、他の形式の基礎ベクトルも使用できる。
【0013】コードブック発生器120は2の駆動ベ
クトルu(n)を発生するために、Mの基礎ベクトル
(n)および1組の2の駆動コードワードI
使用し、この場合0≦i≦2−1である。本実施例に
おいては、各々のコードワードIはその指数iに等し
く、すなわち、I=iである。もし前記駆動信号が前
記40サンプルの各々に対し毎サンプル0.25ビット
のレートで符号化されれば(したがってM=10)、1
024の駆動ベクトルを発生するために使用される10
の基礎ベクトルがあることになる。
【0014】各々の個々の駆動ベクトルu(n)に対
し、入力音声ベクトルs(n)との比較のために再生さ
れた(recontructed)音声ベクトルs′
(n)が発生される。ゲインブロック122は前記駆動
ベクトルu(n)を、前記フレームに対しては一定で
ある、駆動利得係数gによってスケーリングする。ス
ケーリングされた駆動信号g(n) 168は長
期間予測フィルタ124および短期間予測フィルタ12
6によってろ波されて前記再生された音声ベクトルs′
(n) 170を発生する。長期間予測フィルタ(L
ong term predictor filte
r)124は音声の周期性を導入するために長期間予測
係数162を使用し、かつ短期間予測フィルタ126は
スペクトル的なエンベロープを導入するために短期間予
測係数160を使用する。ブロック124および126
は実際にはそれらのそれぞれのフィードバック経路に長
期間予測器および短期間予測器を含む再帰フィルタ(r
ecursive filters)である。
【0015】前記i番目の駆動コードベクトルに対する
再生された音声ベクトルs′(n) 170は同じブ
ロックの入力音声ベクトルs(n) 158とこれら2
つの信号を減算器130において減算することにより比
較される。差分ベクトル(differnce vec
tor)e(n) 172は元の音声のブロックと再
生された音声のブロックとの間の差を表わす。前記差分
ベクトルe(n)172は、係数アナライザ110に
よって発生される前記スペクトルノイズ重み付けフィル
タ係数164を使用して、前記スペクトルノイズ重み付
けフィルタ132によって重み付けされる。スペクトル
ノイズ重み付けは人間の耳にとって知覚的により重要で
ある周波数を強調し、かつ他の周波数を減衰する。スペ
クトルノイズ重み付けを行なうより効率的な方法が本発
明の主題である。
【0016】エネルギ計算機134はスペクトル的にノ
イズ重み付けされた差分ベクトルe′(n) 174
のエネルギを計算し、かつこのエラー信号E 176
をコードブックサーチコントローラ140に供給する。
該コードブックサーチコントローラ140は現在の駆動
ベクトルu(n)に対するi番目のエラー信号を前の
エラー信号と比較して最小の重み付けされたエラーを生
成する駆動ベクトルを決定する。次に最小のエラーを有
するi番目の駆動ベクトルの符号(code)が最善の
駆動コードI 178として前記チャネルを介して出力
される。あるいは、サーチコントローラ140は、予め
規定されたエラーしきい値を満たすような、ある所定の
基準を有するエラー信号を提供する特定のコードワード
を決定することができる。
【0017】図2は、図1に示された本発明の第1の実
施例に従って行なわれる音声符号化動作の全体的なシー
ケンスを示すフローチャート200を含む。該プロセス
は201において開始される。機能ブロック203は図
1の説明に従って音声データを受信する。機能ブロック
205は短期間および長期間予測係数を決定する。これ
は図1の係数アナライザ110において行なわれる。短
期間および長期間予測係数を決定する方法は、B.S.
Atalによる、1982年4月の、「低いビットレー
トでの音声の予測符号化(Predictive Co
ding ofSpeech at Low Bit
Rates)」と題する、IEEETrans. Co
mmun. Vol.Com−30,pp.600−1
4の論文に見られる。前記短期間予測子(short
term predictor)、A(z)、は次式の
係数によって規定される。
【数21】
【0018】機能ブロック207は少なくとも第1およ
び第2の組のフィルタを特徴付ける1組の暫定的なスペ
クトルノイズ重み付けフィルタ係数を発生する。該フィ
ルタは任意の次数のフィルタとすることができ、すなわ
ち前記第1のフィルタはF次(F−order)であ
り、かつ第2のフィルタはJ次のものとすることがで
き、この場合R<F+Jである。好ましい実施例は2つ
のJ次のフィルタを使用し、この場合JはPに等しい。
これらの係数を使用するフィルタは次の形式のものであ
る。
【数22】^H(z)=[1/{A(z/α)}]A
(z/α) この場合
【数23】1≧α≧α≧0 である。なお、本明細書においては、記号“^”,
“ ̄”,“”などは文字の上部に配置すべきものであ
るが、電子出願に対処するためこれらの記号は文字の前
に配置している。
【0019】少なくとも第1および第2の組のJ次のフ
ィルタの縦続接続(cascade)である、^H
(z)は前記暫定的なスペクトルノイズ重み付けフィル
タとして定義される。前記暫定的なスペクトルノイズ重
み付けフィルタの係数は機能ブロック205において発
生される短期間予測係数に依存することに注目すべきで
ある。この暫定的なスペクトルノイズ重み付けフィル
タ、^H(z)、は過去において直接音声符号器の構成
に使用されてきた。
【0020】スペクトルノイズ重み付けによる計算機的
な複雑さを低減するため、^H(z)の周波数応答は単
一のR次のフィルタ^H(z)によってモデル化さ
れ、該フィルタは次の形式の組み合わされたスペクトル
ノイズ重み付けフィルタである。
【数24】
【0021】^H(z)は極フィルタ(pole f
ilter)として示されているが、^H(z)はま
たゼロフィルタ(zero filter)として設計
できることに注意を要する。機能ブロック209は前記
^H(z)フィルタの係数を発生する。組み合わされ
たスペクトルノイズ重み付けフィルタに対する係数を発
生するプロセスは図3に詳細に示されている。R次のオ
ールポールモデルは前記暫定的なスペクトルノイズ重み
付けフィルタよりも低い次数のものであり、これは計算
機的な処理の節約につながる。
【0022】機能ブロック211は図1の説明に従って
音声データを受信したことに応答して駆動ベクトルを提
供する。機能ブロック213は該駆動ベクトルを長期間
124および短期間126予測フィルタを通してろ波す
る。
【0023】機能ブロック215は機能ブロック213
から出力されるろ波された駆動ベクトルを図1の説明に
従って受信された音声データと比較し差分ベクトルを形
成する。機能ブロック217は機能ブロック209にお
いて発生された組み合わされたスペクトルノイズ重み付
けフィルタ係数を使用して、前記差分ベクトルをろ波し
スペクトル的にノイズ重み付けされた差分ベクトルを形
成する。機能ブロック219は図1の説明に従ってスペ
クトル的にノイズ重み付けされた差分ベクトルのエネル
ギを計算しかつエラー信号を形成する。機能ブロック2
21は図1の説明に従ってエラー信号を使用して駆動符
号、I、を選択する。処理は223において終了する。
【0024】図3は、図2の機能ブロック209を実施
するために使用できる処理の詳細を示す処理フローチャ
ート300を示す。この処理は301で始まる。前記暫
定的なスペクトルノイズ重み付けフィルタ、^H
(z)、が与えられると、機能ブロック303はKのサ
ンプルに対し^H(z)のインパルス応答、^h
(n)、を発生し、ここで
【数25】^H(z)={A(z/α)}・[1/
{A(z/α)}]A(z/α) であり、この場合、
【数26】0≦α≦1
【数27】 であり、少なくとも2つの打ち消されない項がある。す
なわち、a>0およびa>0でa≠aであり、
あるいはa>0およびa>0でa≠aである。
機能ブロック305は前記インパルス応答^h(n)を
自己相関し、次の形式の自己相関を形成する。
【数28】
【数29】0≦i≦R;R<K
【0025】機能ブロック307は、前記自己相関およ
びレビンソンの再帰(Levinson′s recu
rsion)を使用して、^H(z)の係数を計算
し、該^H(z)は次の形式の組み合わされたスペク
トルノイズ重み付けフィルタである。
【数30】
【0026】図4は、本発明に係わる音声符号器の第2
の実施例の全体的なブロック図である。音声符号器40
0は以下に述べる差異を除き前記音声符号器100と同
じである。第1に、図1のスペクトルノイズ重み付けフ
ィルタ132が図4の減算器430に先行する2つのフ
ィルタによって置き換えられている。これら2つのフィ
ルタはスペクトル的にノイズ重み付けされたシンセシス
フィルタ1 468およびスペクトル的にノイズ重み付
けされたシンセシスフィルタ2 426である。以後、
これらのフィルタはそれぞれフィルタ1およびフィルタ
2と称する。フィルタ1 468およびフィルタ2 4
26は図1のスペクトルノイズ重み付けフィルタ132
と各々がスペクトルノイズ重み付けフィルタに加えて、
短期間シンセシスフィルタまたは重み付けされた短期間
シンセシスフィルタを含む点で異なっている。得られた
フィルタは総称的にスペクトル的にノイズ重み付けされ
たシンセシスフィルタと称される。特に、それは前記暫
定的なスペクトル的に重み付けされたシンセシスフィル
タとしてまたは組み合わされた(combined)ス
ペクトル的に重み付けされたシンセシスフィルタとして
構成することができる。フィルタ1 468には短期間
インバースフィルタ470が先行する。さらに、図1の
短期間予測器126は図4では省略されている。フィル
タ1およびフィルタ2はそれらの図4におけるそれぞれ
の位置を除き同じである。これらのフィルタの2つの特
定の構成は図6および図7に示されている。
【0027】係数アナライザ410は短期間予測器係数
458、フィルタ1の係数460、フィルタ2の係数4
62、長期間予測器係数464、および駆動ゲイン係数
g466を発生する。フィルタ1およびフィルタ2に対
する係数を発生する方法は図5に示されている。音声符
号器400は音声符号器100と同じ結果を生成するこ
とができ、一方必要な計算の数を低減できる可能性があ
る。従って、音声符号器400は音声符号器100より
好ましいかもしれない。音声符号器100および音声符
号器400の双方で同じ機能ブロックの説明は説明の効
率のため反復しない。
【0028】図5は、前記組み合わされたスペクトル的
にノイズ重み付けされたシンセシスフィルタである、
(z)に対する係数を発生する方法を示す処理のフ
ローチャートである。この処理は501で開始される。
機能ブロック503はP次の短期間予測器フィルタ、A
(z)、に対する係数を発生する。機能ブロック505
は次の形式の暫定的にスペクトル的にノイズ重み付けさ
れたシンセシスフィルタ、H(z)、に対する係数を発
生する。
【数31】H(z)={A(z/α)}[1/{A
(z/α)}]A(z/α) この場合、
【数32】0≦α≦1、 および
【数33】 である。前記H(z)が与えられると、機能ブロック
509はフィルタH(z)の周波数応答をモデル化す
る、R次の組み合わされたスペクトル的にノイズ重み付
けされたシンセシスフィルタ、(z)、に対する
係数を発生する。該係数は前記H(z)のインパルス
応答、h(n)、を自己相関し、かつ該係数を検出す
るために再帰的(recursion)方法を使用する
ことによって発生される。好ましい実施例では当業者に
知られているものと想定されるレビンソンの再帰法(L
evinson′s recursion)を使用す
る。処理は511で終了する。
【0029】図6および図7は図4の重み付けされたシ
ンセシスフィルタ1 468および重み付けされたシン
セシスフィルタ2 426において使用することができ
るそれぞれ第1の構成および第2の構成を示す。
【0030】構成1、図6a、においては、前記重み付
けされたシンセシスフィルタ2 426は暫定的なスペ
クトル的にノイズ重み付けされたシンセシスフィルタ
H(z)を含み、該フィルタは3つのフィルタ、すなわ
ちaによって重み付けされた短期間シンセシスフィル
タA(z/a) 611、aによって重み付けされ
た短期間インバースフィルタ1/A(z/a) 61
3、およびaによって重み付けされた短期間シンセシ
スフィルタA(z/a) 615の縦続接続であり、
ここで0≦a≦a≦a≦1である。重み付けされ
たシンセシスフィルタ1 468、図6a、は重み付け
されたシンセシスフィルタ2 426と、それが短期間
インバースフィルタ1/A(z) 603によって先行
されかつ入力音声経路に配置されることを除き同じであ
る。H(z)はその場合フィルタ605,607,お
よび609の縦続接続である。
【0031】図6bにおいては、前記暫定的なスペクト
ル的にノイズ重み付けされたシンセシスフィルタ
(z)468および426が単一の組み合わされたスペ
クトル的にノイズ重み付けされたシンセシスフィルタ
(z)619および621によって置き換えられて
いる。(z)は、図6aの、フィルタ605,6
07,および609の縦続接続、または等価的にはフィ
ルタ611,613,および615の縦続接続である、
H(z)の周波数応答をモデル化する。前記
(z)フィルタの係数を発生する方法の詳細は図5に
見ることができる。
【0032】構成2、図7a、は構成1の特別の場合で
あり、この場合a=0である。重み付けされたシンセ
シスフィルタ2 426は暫定的なスペクトル的にノイ
ズ重み付けされたシンセシスフィルタ、H(z)、を
含み、このフィルタは2つのフィルタ、すなわち、a
によって重み付けされた短期間シンセシスフィルタA
(z/a) 729、およびaによって重み付けさ
れる短期間インバースフィルタ1/A(z/a) 7
31の縦続接続である。図7aの重み付けされたシンセ
シスフィルタ1 468はそれに先行して短期間インバ
ースフィルタ1/A(z) 703が配置され、かつ入
力音声経路に配置される点を除き、重み付けされたシン
セシスフィルタ2 426と同じである。H(z)は
その場合フィルタ725および727の縦続接続であ
る。
【0033】図7bにおいては、暫定的なスペクトル的
にノイズ重み付けされたシンセシスフィルタH(z)
468および426、図7a、が単一の組み合わされた
スペクトル的にノイズ重み付けされたシンセシスフィル
(z) 719および721に置き換えられて
いる。(z)は、図7aの、フィルタ725およ
び727の縦続接続、または等価的にフィルタ729お
よび731の縦続接続である、H(z)の周波数応答
をモデル化する。(z)のフィルタ係数を発生す
る方法の詳細は図5に見ることができる。
【0034】
【発明の効果】ここに開示された形式の暫定的スペクト
ルノイズ重み付けフィルタから組み合わされたスペクト
ルノイズ重み付けフィルタを発生することは、1つのR
次のフィルタの複雑さにより2またはそれ以上のJ次の
フィルタの制御を有する効率的なフィルタを生成する。
これにより音声符号器の対応する複雑さの増大なしによ
り効率の良いフィルタを提供できる。同様に、ここに開
示された形式の暫定的なスペクトル的にノイズ重み付け
されたシンセシスフィルタから前記組み合わされたスペ
クトル的にノイズ重み付けされたシンセシスフィルタを
発生することにより、1つのR次のフィルタへと組み合
わされた1つのP次のフィルタおよび1つまたはそれ以
上のJ次のフィルタの制御を有する効率的なフィルタの
生成が可能になる。このことにより音声符号器の対応す
る複雑さの増大なしにより効率的なフィルタが提供され
る。
【図面の簡単な説明】
【図1】本発明が使用できる音声符号器のブロック図で
ある。
【図2】本発明の一実施例に従って行なわれる音声符号
化動作の全体的なシーケンスを示すプロセスフローチャ
ートである。
【図3】本発明に係わる組み合わされたスペクトルノイ
ズフィルタ係数を発生するシーケンスを示す処理フロー
チャートである。
【図4】本発明に係わる音声符号器の一実施例を示すブ
ロック図である。
【図5】本発明の一実施例にしたがって行なわれる音声
符号化動作の全体的なシーケンスを示す処理フローチャ
ートである。
【図6】本発明に係わる特定のスペクトルノイズ重み付
けフィルタ構成を示すブロック図である。
【図7】本発明に係わる特定のスペクトルノイズ重み付
けフィルタ構成を示すブロック図である。
【符号の説明】 100 音声符号器 102 マイクロホン 104 フィルタ 108 A/Dコンバータ 110 係数アナライザ 112 クロックモジュール 114 基礎ベクトル記憶装置 120 コードブック発生器 122 ゲインブロック 124 長時間予測器 126 短時間予測器 130 減算器 132 重み付けフィルタ 134 エネルギ計算機 140 コードブックサーチコントローラ 150 マルチプレクサ
───────────────────────────────────────────────────── フロントページの続き (72)発明者 マシュー・エイ・ハートマン アメリカ合衆国イリノイ州60194、シャ ンバーグ、ティベイ・プレイス 520 (56)参考文献 特開 昭63−184800(JP,A) 特公 平4−81199(JP,B2) 特表 平2−502135(JP,A) (58)調査した分野(Int.Cl.7,DB名) G10L 19/06 G10L 19/12

Claims (13)

    (57)【特許請求の範囲】
  1. 【請求項1】 デジタル音声符号器において使用するた
    めの音声符号化方法であって、前記デジタル音声符号器
    は組み合わされたスペクトル的にノイズ重み付けされた
    フィルタ、^H(z)、およびP次の短期間フィル
    タ、A(z)、を含み、前記方法は、 音声データを受信する段階、 前記受信された音声データに応じて駆動ベクトルを生成
    する段階、 前記音声データおよび前記駆動ベクトルに応じて差分ベ
    クトルを生成する段階、 P次のフィルタ、A(z)、のための係数を発生する段
    階、 第1のF次のフィルタおよび第2のJ次のフィルタに対
    する係数を含む暫定的なフィルタに対する係数を発生す
    る段階であって、各々のフィルタは前記P次のフィルタ
    に対する前記係数に依存するもの、 重み付けフィルタにおいて使用するために前記暫定的な
    フィルタのR次のモデルに対する係数を発生する段階で
    あって、R<F+Jであり、前記暫定的なフィルタは、 【数1】^H(z)=[1/{A(z/α)}]A
    (z/α) の形式を有し、この場合、 【数2】0≦α≦1、 および 【数3】 であるもの、前記暫定的なフィルタのR次のモデルに対
    する係数を使用して前記デジタル音声符号器の差分ベク
    トルをろ波し、ろ波された差分ベクトルを生成する段
    階、前記ろ波された差分ベクトルに応じて駆動符号を選
    択する段階、そして前記音声データのその後のデコード
    のために前記駆動符号を伝送する段階、を具備するデジ
    タル音声符号器において使用するための音声符号化方
    法。
  2. 【請求項2】 前記R次のモデルを発生する段階はさら
    に、 Kのサンプルに対して前記暫定的なフィルタ、^H
    (z)、のインパルス応答、^h(n)、を発生する段
    階、 前記インパルス応答、^h(n)、を自己相関して自己
    相関、 【数4】 【数5】0≦i≦R;R<K を形成する段階、そして再帰的方法および前記自己相
    関、Rhh(i)、を使用して前記R次のフィルタの係
    数を計算する段階、 を具備する請求項1に記載の方法。
  3. 【請求項3】 前記再帰的方法はレビンソンの再帰方法
    である、請求項1に記載の方法。
  4. 【請求項4】 デジタル音声符号器において使用するた
    めの音声符号化方法であって、前記デジタル音声符号器
    は組み合わされたスペクトルノイズ重み付けフィルタ、
    ^H(z)、およびP次の短期間フィルタ、A
    (z)、を含み、前記方法は、 音声データを受信する段階、 前記音声データに応じて駆動ベクトルを生成する段階、 前記音声データおよび前記駆動ベクトルに応じて差分ベ
    クトルを生成する段階、 【数6】^H(z)=[1/{A(z/α)}]A
    (z/α) の形式の暫定的重み付けフィルタのための係数を発生す
    る段階であって、この場合、 【数7】0≦α≦1、 および 【数8】 であるもの、 Kのサンプルに対し前記暫定的な重み付けフィルタ、^
    H(z)、のインパルス応答、^h(n)、を発生する
    段階、 前記インパルス応答、^h(n)、を自己相関して、自
    己相関、 【数9】 【数10】0≦i≦R;R<Kを形成する段階、 前記自己相関、Rhh(i)および再帰方法を使用し
    て、 【数11】 の形式の、組み合わされたスペクトルノイズ重み付けフ
    ィルタ、^H(z)、の係数を計算する段階、 前記組み合わされたスペクトルノイズ重み付けフィルタ
    の係数を使用して前記デジタル音声符号器の差分ベクト
    ルをろ波し、ろ波された差分ベクトルを形成する段階、 前記ろ波された差分ベクトルに応じて駆動符号を選択す
    る段階、そして前記音声データのその後のデコードのた
    めに前記駆動符号を伝送する段階、 を具備するデジタル音声符号器において使用するための
    音声符号化方法。
  5. 【請求項5】 前記再帰的方法はレビンソンの再帰方法
    である、請求項4に記載の方法。
  6. 【請求項6】 デジタル音声符号器において使用するた
    めの音声符号化方法であって、前記デジタル音声符号器
    は組み合わされたスペクトル的にノイズ重み付けされた
    シンセシスフィルタ、(z)、およびP次の短期
    間フィルタ、A(z)、を含み、前記方法は、 音声データを受信する段階、 前記音声データに応じて駆動ベクトルを生成する段階、 前記音声データおよび前記駆動ベクトルに応じて差分ベ
    クトルを生成する段階、 【数12】H(z)={A(z/α)}[1/{A
    (z/α)}]A(z/α) の形式の暫定的なスペクトル的にノイズ重み付けされた
    シンセシスフィルタのための係数を発生する段階であっ
    て、この場合、 【数13】0≦α≦1、 そして 【数14】 であり、そして少なくとも2つの打ち消されない項があ
    るもの、 Kのサンプルに対し、前記暫定的なスペクトル的にノイ
    ズ重み付けされたシンセシスフィルタ、H(z)、の
    インパルス応答、h(n)、を発生する段階、 前記インパルス応答、h(n)、を自己相関して、自
    己相関、 【数15】 【数16】0≦i≦R;R<K を形成する段階、 前記自己相関、Rhh(i)、および再帰方法を使用し
    て、 【数17】 の形式の組み合わされたスペクトル的にノイズ重み付け
    されたシンセシスフィルタ、(z)、の係数を計
    算する段階、 前記組み合わされたスペクトル的にノイズ重み付けされ
    たシンセシスフィルタの係数を使用して前記デジタル音
    声符号器の差分ベクトルをろ波し、ろ波された差分ベク
    トルを形成する段階、 前記ろ波された差分ベクトルに応じて駆動符号を選択す
    る段階、そして前記音声データのその後のデコードのた
    めに前記駆動符号を伝送する段階、 を具備するデジタル音声符号器において使用するための
    音声符号化方法。
  7. 【請求項7】 前記P次のフィルタは短期間フィルタで
    あり、前記F次のフィルタは前記J次のフィルタと同じ
    次数であり、前記F次およびJ次のフィルタは打ち消さ
    れない項を有し、かつ前記暫定的なフィルタは暫定的な
    スペクトルノイズ重み付けフィルタである請求項2に記
    載の方法。
  8. 【請求項8】 さらに、 前記受信する段階に応答して基礎ベクトルを提供する段
    階、 を具備する請求項2に記載の方法。
  9. 【請求項9】 前記R次のオールポールモデルを発生す
    る段階はさらに、 前記暫定スペクトルノイズ重み付けフィルタのインパル
    ス応答を発生する段階、 前記インパルス応答を自己相関して、自己相関R
    hh(i)を形成する段階、そして再帰的方法および前
    記自己相関を使用して前記R次のオールポールフィルタ
    の係数を計算する段階、 を具備する請求項8に記載の方法。
  10. 【請求項10】 音声符号化方法であって、 音声データを受信する段階、 組み合わされた短期間およびスペクトルノイズ重み付け
    フィルタのためのフィルタ係数を発生する段階であっ
    て、 P次の短期間フィルタを発生する段階、 各フィルタが前記P次の短期間フィルタに依存する、第
    1のF次のフィルタおよび第2のJ次のフィルタを含む
    暫定的なスペクトルノイズ重み付けフィルタを発生する
    段階、そしてR<P+F+Jとした時、前記P次の短期
    間フィルタおよび前記暫定的なスペクトルノイズ重み付
    けフィルタを使用してR次のオールポールの組み合わさ
    れた短期間およびスペクトルノイズ重み付けフィルタの
    ための係数を発生する段階、を具備する前記段階、 前記受信された音声データをろ波し、ろ波された受信音
    声データを生成する段階、 前記組み合わされた短期間およびスペクトルノイズ重み
    付けフィルタを使用して基礎ベクトルをろ波し、ろ波さ
    れたベクトルを形成する段階、 前記ろ波されたベクトルを前記ろ波された受信音声デー
    タと比較して、差分ベクトルを形成する段階、 前記差分ベクトルのエネルギを計算して、エラー信号を
    形成する段階、そして前記エラー信号を使用して、前記
    受信された音声データを表わす、駆動符号、I、を選択
    する段階、 を具備する音声符号化方法。
  11. 【請求項11】 前記R次のオールポールの組み合わさ
    れた短期間およびスペクトルノイズ重み付けフィルタの
    ための係数を発生する段階はさらに、 前記短期間フィルタおよび前記暫定的なスペクトルノイ
    ズ重み付けフィルタのインパルス応答を発生する段階、 前記インパルス応答を自己相関して、自己相関R
    hh(i)を形成する段階、そして再帰方法および前記
    自己相関を使用して前記R次のオールポールフィルタの
    係数を計算する段階、 を具備する、請求項10に記載の音声符号化方法。
  12. 【請求項12】 音声符号化方法であって、 音声データを受信する段階、 長期間およびP次の短期間予測器フィルタによって使用
    するための短期間および長期間予測器係数を決定する段
    階、 前記長期間予測器フィルタおよび前記短期間予測器フィ
    ルタを使用して基礎ベクトルをろ波し、ろ波された基礎
    ベクトルを形成する段階、 スペクトルノイズ重み付けフィルタのための係数を決定
    する段階であって、 前記P次の短期間フィルタ係数に依存して、第1のF次
    のフィルタおよび第2のJ次のフィルタを含む暫定スペ
    クトルノイズ重み付けフィルタを発生する段階、および
    R<F+Jとし、前記暫定スペクトルノイズ重み付けフ
    ィルタのR次のオールポールモデルを使用してスペクト
    ルノイズ重み付け係数を発生する段階、を具備する前記
    スペクトルノイズ重み付けフィルタのための係数を決定
    する段階、 前記ろ波された基礎ベクトルを前記受信された音声デー
    タと比較し、差分ベクトルを形成する段階、 前記スペクトルノイズ重み付けフィルタ係数に依存する
    フィルタを使用して前記差分ベクトルをろ波し、ろ波さ
    れた差分ベクトルを形成する段階、 前記ろ波された差分ベクトルのエネルギを計算し、エラ
    ー信号を形成する段階、そして前記エラー信号を使用し
    て、前記受信された音声データを表わす、駆動符号、
    I、を選択する段階、 を具備する音声符号化方法。
  13. 【請求項13】 前記R次のオールポールモデルを発生
    する段階はさらに、 前記暫定スペクトルノイズ重み付けフィルタのインパル
    ス応答を発生する段階、 前記インパルス応答を自己相関して、自己相関R
    hh(i)を形成する段階、そして再帰的方法および前
    記自己相関を使用して前記R次のオールポールフィルタ
    の係数を計算する段階、 を具備する請求項12に記載の音声符号化方法。
JP35934599A 1993-02-23 1999-12-17 デジタル音声符号器において使用するための音声符号化方法 Expired - Lifetime JP3236592B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US08/021364 1993-02-23
US08/021,364 US5434947A (en) 1993-02-23 1993-02-23 Method for generating a spectral noise weighting filter for use in a speech coder

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP6518975A Division JP3070955B2 (ja) 1993-02-23 1994-01-18 音声符号器において使用するためのスペクトルノイズ重み付けフィルタを発生する方法

Publications (2)

Publication Number Publication Date
JP2000155597A JP2000155597A (ja) 2000-06-06
JP3236592B2 true JP3236592B2 (ja) 2001-12-10

Family

ID=21803778

Family Applications (2)

Application Number Title Priority Date Filing Date
JP6518975A Expired - Lifetime JP3070955B2 (ja) 1993-02-23 1994-01-18 音声符号器において使用するためのスペクトルノイズ重み付けフィルタを発生する方法
JP35934599A Expired - Lifetime JP3236592B2 (ja) 1993-02-23 1999-12-17 デジタル音声符号器において使用するための音声符号化方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP6518975A Expired - Lifetime JP3070955B2 (ja) 1993-02-23 1994-01-18 音声符号器において使用するためのスペクトルノイズ重み付けフィルタを発生する方法

Country Status (11)

Country Link
US (2) US5434947A (ja)
JP (2) JP3070955B2 (ja)
CN (1) CN1074846C (ja)
AU (1) AU669788B2 (ja)
BR (1) BR9404230A (ja)
CA (1) CA2132006C (ja)
DE (2) DE4491015T1 (ja)
FR (1) FR2702075B1 (ja)
GB (1) GB2280828B (ja)
SE (1) SE517793C2 (ja)
WO (1) WO1994019790A1 (ja)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5708756A (en) * 1995-02-24 1998-01-13 Industrial Technology Research Institute Low delay, middle bit rate speech coder
DE69628103T2 (de) * 1995-09-14 2004-04-01 Kabushiki Kaisha Toshiba, Kawasaki Verfahren und Filter zur Hervorbebung von Formanten
US5963899A (en) * 1996-08-07 1999-10-05 U S West, Inc. Method and system for region based filtering of speech
US6098038A (en) * 1996-09-27 2000-08-01 Oregon Graduate Institute Of Science & Technology Method and system for adaptive speech enhancement using frequency specific signal-to-noise ratio estimates
US5924062A (en) * 1997-07-01 1999-07-13 Nokia Mobile Phones ACLEP codec with modified autocorrelation matrix storage and search
GB2352949A (en) * 1999-08-02 2001-02-07 Motorola Ltd Speech coder for communications unit
US6801931B1 (en) * 2000-07-20 2004-10-05 Ericsson Inc. System and method for personalizing electronic mail messages by rendering the messages in the voice of a predetermined speaker
SE521693C3 (sv) * 2001-03-30 2004-02-04 Ericsson Telefon Ab L M En metod och anordning för brusundertryckning
US7337110B2 (en) * 2002-08-26 2008-02-26 Motorola, Inc. Structured VSELP codebook for low complexity search
WO2004027754A1 (en) * 2002-09-17 2004-04-01 Koninklijke Philips Electronics N.V. A method of synthesizing of an unvoiced speech signal
EP1513137A1 (en) * 2003-08-22 2005-03-09 MicronasNIT LCC, Novi Sad Institute of Information Technologies Speech processing system and method with multi-pulse excitation
JP5420175B2 (ja) * 2005-01-31 2014-02-19 スカイプ 通信システムにおける隠蔽フレームの生成方法
US8725506B2 (en) * 2010-06-30 2014-05-13 Intel Corporation Speech audio processing
CN105355209B (zh) 2010-07-02 2020-02-14 杜比国际公司 音高增强后置滤波器
FR2977439A1 (fr) * 2011-06-28 2013-01-04 France Telecom Fenetres de ponderation en codage/decodage par transformee avec recouvrement, optimisees en retard.
JP6077166B2 (ja) * 2016-07-10 2017-02-08 有限会社技研産業 放射線遮蔽材料及び放射線遮蔽建材

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NL188189C (nl) * 1979-04-04 1992-04-16 Philips Nv Werkwijze ter bepaling van stuursignalen voor besturing van polen van een louter-polen filter in een spraaksynthese-inrichting.
US4401855A (en) * 1980-11-28 1983-08-30 The Regents Of The University Of California Apparatus for the linear predictive coding of human speech
JPH0738119B2 (ja) * 1986-07-30 1995-04-26 日本電気株式会社 音声波形符号復号化装置
US5125030A (en) * 1987-04-13 1992-06-23 Kokusai Denshin Denwa Co., Ltd. Speech signal coding/decoding system based on the type of speech signal
US4817157A (en) * 1988-01-07 1989-03-28 Motorola, Inc. Digital speech coder having improved vector excitation source
CA2021514C (en) * 1989-09-01 1998-12-15 Yair Shoham Constrained-stochastic-excitation coding
JP2626223B2 (ja) * 1990-09-26 1997-07-02 日本電気株式会社 音声符号化装置
JPH04207410A (ja) * 1990-11-30 1992-07-29 Canon Inc デジタルフイルタ装置
JPH06138896A (ja) * 1991-05-31 1994-05-20 Motorola Inc 音声フレームを符号化するための装置および方法

Also Published As

Publication number Publication date
CN1074846C (zh) 2001-11-14
BR9404230A (pt) 1999-06-15
AU669788B2 (en) 1996-06-20
JP3070955B2 (ja) 2000-07-31
GB9420077D0 (en) 1994-11-23
DE4491015T1 (de) 1995-09-21
SE9403630L (sv) 1994-12-21
US5434947A (en) 1995-07-18
SE9403630D0 (sv) 1994-10-24
CA2132006A1 (en) 1994-09-01
JPH07506202A (ja) 1995-07-06
US5570453A (en) 1996-10-29
CN1104010A (zh) 1995-06-21
SE517793C2 (sv) 2002-07-16
FR2702075B1 (fr) 1996-04-26
AU6125594A (en) 1994-09-14
CA2132006C (en) 1998-04-28
JP2000155597A (ja) 2000-06-06
WO1994019790A1 (en) 1994-09-01
GB2280828A (en) 1995-02-08
DE4491015C2 (de) 1996-10-24
FR2702075A1 (fr) 1994-09-02
GB2280828B (en) 1997-07-30

Similar Documents

Publication Publication Date Title
EP0409239B1 (en) Speech coding/decoding method
JP4662673B2 (ja) 広帯域音声及びオーディオ信号復号器における利得平滑化
JP4550289B2 (ja) Celp符号変換
JP3236592B2 (ja) デジタル音声符号器において使用するための音声符号化方法
JPH1091194A (ja) 音声復号化方法及び装置
JPH09127991A (ja) 音声符号化方法及び装置、音声復号化方法及び装置
JPH09127996A (ja) 音声復号化方法及び装置
JPH10124092A (ja) 音声符号化方法及び装置、並びに可聴信号符号化方法及び装置
JP3357795B2 (ja) 音声符号化方法および装置
EP0390975B1 (en) Encoder Device capable of improving the speech quality by a pair of pulse producing units
JP3248668B2 (ja) ディジタルフィルタおよび音響符号化/復号化装置
EP1103953B1 (en) Method for concealing erased speech frames
JPH0944195A (ja) 音声符号化装置
JP3531780B2 (ja) 音声符号化方法および復号化方法
JP3905706B2 (ja) 音声符号化装置、音声処理装置及び音声処理方法
JP3583945B2 (ja) 音声符号化方法
JP3417362B2 (ja) 音声信号復号方法及び音声信号符号化復号方法
KR100341398B1 (ko) 씨이엘피형 보코더의 코드북 검색 방법
JP3510168B2 (ja) 音声符号化方法及び音声復号化方法
JP3192051B2 (ja) 音声符号化装置
JP2853170B2 (ja) 音声符号化復号化方式
JP3063087B2 (ja) 音声符号化復号化装置及び音声符号化装置ならびに音声復号化装置
JP3468862B2 (ja) 音声符号化装置
JP3520955B2 (ja) 音響信号符号化法
JP3274451B2 (ja) 適応ポストフィルタ及び適応ポストフィルタリング方法

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070928

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080928

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090928

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090928

Year of fee payment: 8

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: R3D03

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100928

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110928

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120928

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120928

Year of fee payment: 11

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120928

Year of fee payment: 11

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130928

Year of fee payment: 12

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term