JPH09512645A

JPH09512645A - マルチパルス分析音声処理システムおよび方法

Info

Publication number: JPH09512645A
Application number: JP7528321A
Authority: JP
Inventors: ビアリック，レオン; フロメン，フェリックス
Original assignee: シャーマン，ジョナサンエドワード; オーディオコーズリミティド
Priority date: 1994-04-29
Filing date: 1995-04-27
Publication date: 1997-12-16
Anticipated expiration: 2015-07-24
Also published as: BR9507571A; CN1112672C; EP0784846A1; WO1995030222A1; RU2121172C1; CA2189142C; JP3068196B2; US5568588A; DE69521622T2; EP0784846A4; KR100257775B1; DE69521622D1; CA2189142A1; AU683750B2; EP0784846B1; CN1153566A; AU2394895A; MX9605179A; RU2121173C1

Abstract

(57)【要約】音声処理システムおよび方法が開示されている。本発明の１実施例においては、システムは目標ベクトル（２６）に作用する最大確度量子化マルチパルス分析ユニット（２１）を少なくとも含む。最大確度量子化マルチパルス分析ユニットはマルチパルスシーケンスに対する初期利得レベルを決定し、単一の利得のマルチパルス分析（ＭＰＡ）を、各々が異なる利得レベルで、多数回実行する。目標ベクトルを最も近く表しているパルスシーケンスは出力信号（３８）として与えられる。他の実施例においては、システムは少なくともパルストレインマルチパルス分析ユニットを含みその中で目標ベクトルはパルストレインのシリーズとしてモデル化されている。各パルストレインは複数の単一利得パルスを備え、その中で各パルスはそのパルストレイン内の前回のパルスからピッチ値距離だけ離れている。最大確度分析器とパルストレインを結合することも本発明の一部である。

Description

【発明の詳細な説明】マルチパルス分析音声処理システムおよび方法発明の分野本発明は概略的には音声処理システムに関し、特定的にはマルチパルス分析システムに関する。発明の背景音声信号処理はこの分野でよく知られており、格納のため又は送信のためにしばしば利用されて、入力音声信号を圧縮する。音声信号処理は典型的には入力音声信号をフレームに分割し、次いで各フレームを分析してその成分を判定することを含む。その成分は次いで格納又は送信される。典型的には、フレームアナライザは音声信号の短期特性と長期特性とを判定する。フレームアナライザは又音声信号の短期および長期成分、即ち、「貢献度」の１つ又は両方を判定できる。例えば、線形予測係数分析（ＬＰＣ）は短期特性および貢献度を与え、ピッチ分析および予測は長期特性と長期貢献度を与える。典型的には、長期および短期の予測貢献度の両方又はいずれかが入力フレームから差し引かれて、その形状が特徴付けられるべき目標ベクトルを残す。そのような特徴化は、Sadaoki Furui，Marcel Dekker，Inc.，New York，NY 1989 による書籍「Digital Speech Processing，Synthesis and Recognition」のセクション6.4.2 に詳細に記載されている、マルチパルス分析（ＭＰＡ）により生成できる。この書籍は参考のために本明細書に取り込まれる。ＭＰＡにおいては、多数のサンプルで形成されている目標ベクトルは、変化する位置および変化する符号（正および負）の複数の単一ゲインパルス（即ちスパイク）によりモデル化される。各パルスを選択するために、１つのパルスが各サンプル位置に配置されそのパルスをＬＰＣ係数により定義されたフィルタを通すことにより規定されるパルスの効果が決定される。目標ベクトルに最も近くマッチするパルスが選択されその効果が目標ベクトルから除去され、それにより新たな目標ベクトルを生成する。このプロセスは所定数のパルスが見出されるまで継続される。ＭＰＡ分析の結果は格納又は送信の目的のための、パルス位置と利得の量子化値の集合である。利得は典型的には決定された最初のパルスから決定される。この利得は次いで残りのパルスのために利用される。残念ながら、最初のパルスの利得値は必ずしも目標ベクトルの全体の利得値を示しておらず、したがって、目標ベクトルとの一致は必ずしも極めて正確ではない。発明の要旨したがって、本発明の目的は改良された音声処理システムを提供することである。本発明の１実施例においては、システムは短期アナライザと、目標ベクトル発生器と最大確度量子化（ＭＬＱ）マルチパルス分析ユニットとを含んでいる。短期アナライザは入力音声信号の短期特性を決定する。目標ベクトル発生器は少なくとも入力信号から目標ベクトルを生成する。ＭＬＱマルチパルス分析ユニットは得られた目標ベクトルに作用する。ＭＬＱマルチパルス分析ユニットは典型的にはマルチパルスシーケンスに対する最初の利得レベルを決定し、単一の利得のＭＰＡを各々異なる利得レベルで多数回実行する。利得レベルは最初の利得レベルの上と下の範囲内にある。結果的に得られるパルスは正又は負であり得る。他の最大確度の応用と同様に、結果の質は（この場合、目標ベクトルとパーセプチュアル・ウエイティング・フィルタを介して単一利得パルスシーケンスをフィルタリングすることにより生成された推定ベクトルとの間の差として定義されたエラーベクトルのエネルギーを最小化することにより）測定される。次いで、エラーベクトルのエネルギーとその対応する利得レベル（即ち、利得レベルの指標）を最小化するパルスシーケンスは、ＭＬＱマルチパルス分析ユニットの出力信号として与えられる。他の実施例においては、システムは長期アナライザを含み、ＭＬＱマルチパルス分析ユニットをパルストレインマルチパルス分析ユニットで置き換える。この実施例においては、パルストレインマルチパルス分析ユニットは長期アナライザからのピッチ距離を利用して、等しい振幅で、同じ符号で、各々がトレイン内の前のパルスからピッチ距離だけ離れているパルスを生成する。マルチパルス分析ユニットは次いで、目標ベクトルを最もよく表している、正と負のパルストレインを含むパルストレインのシーケンスを出力する。更に他の実施例においては、システムは前の２つの実施例の動作を結合するＭＬＱマルチパルス分析ユニットを含んでいる。換言すれば、利得の範囲が与えられ、各々に対して、パルストレインのシーケンスが見出される。目標ベクトルに最も近い一致を示すシーケンスが出力信号として与えられる。最後のさらなる実施例においては、最大確度の出力とパルストレインマルチパルス分析ユニットが比較され、目標ベクトルに最も近い一致を示すシーケンスが出力信号として与えられる。図面の簡単な説明本発明は図面と関係付けてなされる以下の詳細な記載からより完全に理解されるであろう。図において、図１は本発明の音声処理システムの第１の実施例のブロック図、図２は図１のＭＰ−ＭＬＱブロックの動作を示すフローチャート、図３Ａおよび３Ｂは図２の動作を理解するのに有益なグラフ図、図４Ａおよび４Ｂはパルストレインとパルストレインを用いるマルチパルス分析をそれぞれ記載するグラフ図、図５はパルストレインを用いる本発明の音声処理システムの第２の実施例を示すブロック図、図６は図５のパルストレインマルチパルス分析の動作を示すフローチャート、図７は図１および５のシステムの出力を比較する第３の実施例のブロック図である。好ましい実施例の詳細な記載ここで、本発明の第１の実施例を示す図１、２、３Ａおよび３Ｂを参照する。本発明の音声処理システムは少なくとも短期予測アナライザ１０と、長期予測アナライザ１２と、目標ベクトル発生器１３と最大確度量子化マルチパルス（ＭＰ −ＭＬＱ）ユニット１４とを含んでいる。短期予測アナライザ１０は、入力ライン１６上の多数のディジタル化された音声サンプルで形成された音声信号の入力フレームを受け取る。典型的には、フレーム当たり２４０個の音声サンプルがあり、そのフレームはしばしば複数のサブフレームに分離される。典型的には、４個のサブフレームがあり、各々は典型的には６０サンプルの長さである。入力フレームは元の音声信号又は処理されたバージョンの音声信号のフレームであり得る。短期予測アナライザ１０はまた、入力ライン１６上の入力フレームを受け取り、出力ライン１７上に入力フレームの短期特性を生成する。１実施例においては、アナライザ１０は線形予測分析を実行して、入力フレームを特徴付ける線形予測係数（ＬＰＣｓ）を生成する。本発明の目的のために、アナライザ１０は任意のタイプのＬＰＣ分析を実行することができる。例えば、ＬＰＣ分析は書籍「Digital Speech Processing，Syn thesis and Recognition」のチャプター6.4.2 に次のように記載されているようにして実行できる：ハミング窓がサブフレーム上に集中された１８０個のサンプルの窓に適用される。１０番のオーダのＬＰＣ係数が、ダービン回帰法(Durbin recursion method)を用いて生成される。この処理は各サブフレームに対して繰り返される。長期予測アナライザ１２は任意のタイプの長期予測器でよく、ライン１６上に受信される入力フレームに対して動作する。長期アナライザ１２は入力フレームの複数のサブフレームを分析して各サブフレーム内の音声のピッチ値を決定する。ここで、ピッチ値は、その後で音声信号がそれ自体をほぼ繰り返すサンプルの数として定義される。ピッチ値は典型的には２０と１４６の間の範囲であり、ここで２０は高ピッチ音で１４６は低ピッチ音を示す。例えば、２つのサブフレーム毎に、ピッチ推定は、サブフレームｓ（ｎ）の正規化された相互相関関数を最大化することにより、次のように決定できる：例えば、長期アナライザ１２は、相互相関Ｃｉを２つのサブフレームに対するピッチ値として最大化する指標ｉを選択する。長期アナライザ１２がピッチ値を決定すると、そのピッチ値は、出力ライン１８上に与えられたそのサブフレームのための長期予測情報を決定するために利用される。目標ベクトル発生器１３は長期アナライザ１２と短期アナライザ１０の出力信号と、遅延器１９を介して入力ライン１６上の入力フレームとを受け取る。これらの信号に応答して、目標ベクトル発生器１３は入力フレームの少なくともサブフレームから目標ベクトルを生成する。長期および短期情報は、所望であれは利用でき、又はそれらは無視できる。遅延器１９は、目標ベクトルに到着した入力フレームがアナライザ１０および１２の出力に対応することを確実化する。目標ベクトル発生器１３の出力ライン２６は、ＭＰ−ＭＬＱユニット１４に接続されており、目標ベクトル出力信号を伝播する。ＭＰ−ＭＬＱユニット１４は典型的には、アナライザ１０により生成された短期特性を伝播する出力ライン１７に接続されている。一般性を失うことなしに、ＭＰ−ＭＬＱユニット１４に対する目標ベクトルは任意の他の所望の方法で生成され得るということが理解されるであろう。本発明の第１の好ましい実施例によれば、ＭＰ−ＭＬＱユニット１４は初期パルス位置決定器２０と、利得範囲決定器２２と利得レベルセレクタ２４と、パルスシーケンス決定器２５と、目標ベクトル一致器２８とオプションのエンコーダ３０とを含んでいる。要素２０〜３０により遂行される特定の動作は図２に示されており以下に詳細に記載する。以下はユニット１４の動作の概略的記載である。初期パルス位置決定器２０は、目標ベクトル発生器１３と短期アナライザ１０の出力信号をそれぞれ出力ライン１７および２６を介して受け取る。それはマルチパルス分析技術にしたがって、最初のパルスのサンプル位置を決定する。利得範囲決定器２２はユニット２０の最初のパルス出力を受け取って、最初のパルスの振幅を決定し、決定された振幅の絶対値のまわりの量子化された利得レベルの範囲をも決定する。利得レベルセレクタ２４は利得範囲決定器２２により生成された利得範囲を受け取り、その利得範囲内で利得値を変化させる。出力ライン３２上のその出力は現在の利得レベルであり、それに対して単一の利得のパルスシーケンスが決定される。パルスシーケンス決定器２５は、ライン２６上の目標ベクトルを受け取り、ライン３２上の現在の利得レベルを受け取り、それから、以下に記載する目標ベクトルに一致するパルスシーケンス（正および負の両方のパルスを持つ）を決定する。このパルスシーケンスは現在の利得レベルを持つ正および負のパルスの連鎖である。目標ベクトル一致器２８は、決定器２５の出力ライン３４上のパルスシーケンス出力を受け取り、出力ライン２６上の目標ベクトルを受け取る。一致器２８は、最大確度タイプの基準を用いて一致の質を決定する。利得レベルにある範囲があるので、一致器２８は利得レベルセレクタ２４に制御を戻して次の利得レベルを選択する。この制御の戻りは矢印３６で示されている。各利得値に対して、一致器２８は一致の質を決定し、それが以前の一致よりも基準に対して小さい場合にのみその一致（利得指標およびパルスシーケンス）をセーブする。利得セレクタ２４が利得値のすべてを動かしたならば、一致器２８内の記憶装置内にある利得指標とパルスシーケンスは目標ベクトルに最も近い一致となる。一致器２８は次いで、格納されているパルスシーケンスと利得指標をオプションのエンコーダ３０に出力する。いくつかの利得レベルの各々に対してパルスシーケンスを決定することにより、ＭＰ−ＭＬＱユニット１４は目標ベクトルに最も近く一致するものを選択できるということが理解されるであろう。オプションのエンコーダ３０は、格納又は送信のために出力パルスシーケンスと利得指標を符号化する。ＭＰ−ＭＬＱユニット１４の特別な動作は図２に示されている。初期化ステップ４０で、ユニット１４は次の信号を発生する：ａ）として定義される短期特性ａｉから入力フレームに対するインパルス応答ｈ［ｎ］、ただしＰは短期特性でＮはサブフレーム内の音声サンプルの数である；ｂ）各サンプル位置１に対する、インパルス応答自己相関の次のような結果ｒｈｈ［ｌ］：そしてｃ）インパルス応答ｈ［ｎ］と目標ベクトルｔ［ｎ］の間の相互相関の次のような結果ｒｔｈ［ｌ］：インパルス応答はアナライザ１０からライン１７に沿って与えられる短期特性ａｉの関数であることが理解されるであろう。初期化ステップ４０で生成されたインパルス応答は前述したダービン(D urbin)ＬＰＣ分析に対応する。ＭＰ−ＭＬＱユニット１４はローカル基準ＬＣｋｊ［ｌ］を利用して、各サンプル位置１、各パルスｋおよび各利得レベルｊに対する量子化値を決定する。以下においてわかるように、ローカル基準のレベルはｋの値（即ち、すでに決定されたパルスの数）に依存している。ステップ４２で、最初のパルスの決定に対するローカル基準ＬＣ０，ｊ［ｌ］は、次のように相互相関ｒｔｈ［ｌ］に初期化される：ローカル基準に対する最大ローカル値もある負の値にセットされる。位置指標１も０に初期化される。ステップ４４〜５０で、最初のパルスｋ＝１の位置１が決定される。これを行うために、ローカル基準ＬＣ０，ｊ［ｌ］の絶対値は最大ローカル値と比較される（ステップ４４）。ＬＣ０，ｊ［ｌ］が大きければ、位置１は格納され、最大ローカル値はローカル基準ＬＣ０，ｊ［ｌ］の絶対値にセットされ（ステップ４６）、位置指標１は１だけ増大される（ステップ４８）。この動作はすべての位置１がレビューされるまで繰り返される。位置のすべてがレビューされた後に記憶装置内にあるサンプル位置ｌｏｐｔは選択されたサンプル位置ｌｏｐｔである。ステップ４０〜５０はパルス位置決定器２０により実行される。ステップ５２は利得範囲決定器２２により実行される。ステップ５２において、最大ローカル基準ＬＣ０，ｊ［ｌ］を生成した位置１の最大振幅Ａｍａｘは次のように生成される：ここで、ｌｏｐｔは最初のパルスの位置である。最大値Ａｍａｘは次いで利得レベルの所定の集合の１つにより近似化される。例えば、期待された振幅レベルが０．１〜２．０ユニットの範囲にある場合、利得レベルは０．１ユニット毎である。こうして、Ａｍａｘが０．７５６であれば、それは０．８に量子化される。ステップ５４〜５８は利得セレクタ２４により実行される。ステップ５４において、利得セレクタ２４は決定された利得レベルに関連した利得指標ｊと、利得指標ｊのまわりの利得指標の範囲とを決定する。利得レベルの範囲はＭＬＱＳＴＥＰＳの所定値に依存する任意の大きさでよい。ステップ５４で、利得セレクタ２４は利得指標を最小のものにセットする。前の例では、０．１は指標１を有しＭＬＱＳＴＥＰＳは３であろう。こうして、決定された利得指標は８でありその範囲は指標５〜１１の間である。ステップ５４はまた、１０¹³のような任意の大きい値に対して最小グローバル値をセットする。本発明においては、各利得指標に対して、最初のパルスはパルス位置決定器２０により（ステップ４４〜５０で）決定されたパルスの位置である。残りのパルスはサブフレーム内のどこにあってもよく、正又は負の利得値を持つことができる。ステップ５６において、利得セレクタ２４は最初のパルス位置とその振幅を格納する。ステップ５８で、現在のパルス指標ｋおよび利得指標ｊに対して、ローカル基準ＬＣｋ，ｊ［ｌ］が、典型的には式５にしたがって初期化される。パルスシーケンス決定器２５はステップ６０〜７４を実行する。ステップ６０で、決定器２５は最大ローカル値を、前と同様にある大きい値にセットし、位置指標を０にセットする。ステップ６２で、決定器２５はローカル基準を前回のパルスで、次のように更新する：ｊ＝利得指標ｋ＝パルス指標ｌ＝位置指標ステップ６４〜７０のループにおいて、パルスシーケンス決定器２５はステップ４４〜５０において実行されたのと同様の方法でパルスの位置を決定し、したがって、ここでは更なる記載はしない。ステップ７２で、決定器２４は選択されたパルスを格納し、ステップ７４で、パルス値を更新する。ステップ６２〜７４は各パルスに対して順次繰り返され、その結果はパルスシーケンス決定器２５のパルスシーケンス出力である。ステップ６２は見出された各パルスに対してローカル基準を更新することがわかる。図３Ａおよび３Ｂはパルスシーケンス決定器２５の異なるパルスシーケンス出力の２つの例を示す。図３Ａのシーケンスは利得指標が７で、図３Ｂのシーケンスは利得指標が８である。両シーケンスは同一のサンプル位置１０を有するが、パルスの残りは他の位置にある。パルスは正又は負であり得ることに着目される。ステップ７６で、目標ベクトル一致器２８は各利得レベルｊに対してグローバル基準ＧＣｊの値を決定する。グローバル基準ＧＣｊは任意の適当な基準でよく、典型的には最大確度タイプの基準である。例えば、グローバル基準は、目標ベクトルと、パーセプチュアル・ウエイティング・フィルタを通して単一利得パルスシーケンスをフィルタリングすることにより生成された推定ベクトルとの間の差として定義されるエラーベクトルにおけるエネルギーを測定することができる。そのような基準に対して、目標ベクトル一致器２８はパーセプチュアル・ウエイティング・フィルタを含んでいる。パルスシーケンスそれ自体は目標ベクトルと一致しないこと、パルスシーケンスは目標ベクトルと一致する関数を表わしていることが理解されるであろう。以下の式８ａ〜８ｅに与えるように、グローバル基準ＧＣｊは２つの要素、ｐｊおよびｄｊからなり、両者は、短期インパルス応答ｈ［ｎ］によりフィルタされた所与のレベルｊに対するパルスシーケンスである信号ｘｊ［ｎ］の関数である。ｐｊは目標ベクトルｔ［ｎ］とｘ［ｎ］の間の相互相関であり、ｄｊはｘｊ［ｎ］のエネルギーである。ステップ７８で、現在の利得指標ｊに対するグローバル基準ＧＣｊは現在の最小グローバル値と比較される。それが現在の最小グローバル値より小さいと、ステップ７８でチェックされるように、目標ベクトル一致器２８は利得指標およびその関連するパルスシーケンスを格納する（ステップ８０）。ステップ８２で、利得レベルセレクタ２４は利得指標を更新し、ステップ８４で利得レベルセレクタ２４はパルスシーケンスが利得レベルのすべてに対して決定されたかどうかをチェックする。もし決定されていれば、記憶装置内にあるパルスシーケンスおよび利得指標は、グローバル基準ＧＣｊにしたがって目標ベクトルと最も良く一致するものである。ステップ８６で、オプションのエンコーダ３０はパルスシーケンスと利得指標を、任意の符号化方法にしたがって、送信又は格納のために符号化する。所望であれば、目標ベクトルはｘｊｏｐｔ［ｎ］を用いて再構成できる。ここで、ｊｏｐｔはステップ８４から得られる利得指標である。本発明のＭＰ−ＭＬＱユニット１４が、出力信号として、少なくとも選択されたパルスシーケンスと利得レベルを与えるということが理解されるであろう。さて、パルストレインを利用する本発明の他の実施例を示している図４Ａ、４Ｂ、５および６を参照する。パルストレイン８３は図４Ａに示されている。それはピッチである距離Ｑだけ離れている一連のパルス８１を備えている。図５のシステムにおいて、目標ベクトルに最も近く一致するパルストレインのあるシーケンスが見出される。図４Ｂは、見出される３つのパルストレイン８３ａ，８３ｂおよび８３ｃのシーケンス例を示している。各パルストレイン８３は異なるサンプル位置で開始している。パルストレイン８３ａは最初であり、４個のパルスを備えている。パルストレイン８３ｂは後の位置で開始しており、３個のパルスを備えており、パルストレイン８３ｃは、より遅く開始しており、２つだけのパルスを備えている。図５のシステムは図１のシステムと類似しており、相違するところは、ａ）図１のパルス位置決定器２０およびパルスシーケンス決定器２５はパルストレイン位置決定器８８およびパルストレインシーケンス決定器８９で置き換えられていること、ｂ）９０とラベルされた、目標ベクトル一致器はパルスシーケンスではなくてパルストレインシーケンスについて作用すること、そしてｃ）決定器８８および８９は出力ライン１８に沿ってピッチ値Ｑを受け取ることである。さらに、出力３４および３８は、パルスのシーケンスではなくてパルストレインのシーケンスを表す信号を運ぶ出力ライン９２および９４で置き換えられている。パルストレイン決定器８８は、その決定器８８がパルスインパルス応答ｈ［ｎ］ではなくてパルストレインインパルス応答ｈＴ［ｎ］を利用することを除き、パルス決定器２０と同様に動作する。ｈＴ［ｎ］は：で定義される。ここで、Ｑはピッチ値である。理解されるように、遅い位置のパルストレインは典型的には殆どパルスを持たない。式３のパルストレインインパルス応答自己相関は：となり、各サンプル位置１に対して、インパルス応答ｈＴ［ｎ］と目標ベクトルｔ［ｎ］との間の相互相関ｒｔｈ［ｎ］は：となる。パルストレインシーケンス決定器８９はパルスシーケンス決定器２５と同様に動作するが、決定器８９はパルストレインシーケンスを生成する。目標ベクトル一致器９０は目標ベクトル一致器２８と同様に動作するが、一致器９０はｈ［ｎ］ではなくてパルストレインインパルス応答関数ｈＴ［ｎ］を利用する。こうして、式８ｄは：となる。パルストレインマルチパルス分析ユニット８６の特別の動作は図６に示されている。そのステップは図２に示されたものと同等であるが、式は個々のパルスにではなくパルストレインに作用する。こうして、式９において、パルストレインインパルス応答ｈＴ［ｎ］はＱステップ毎にパルスを持つものとして定義される。より遅い位置におけるパルストレインは典型的には殆どパルスを持たない。残りの式はそれらがインパルス応答ｈＴ［ｎ］に付いて作用することを除き同様である。所望であれば、利得範囲決定器２２により決定される利得範囲は唯一の利得指標を持つことができる。この実施例においては、パルストレインマルチパルス分析ユニット８６は、最初のパルストレインシーケンスの利得レベルを持つパルストレインシーケンスを決定する。この実施例においては、目標ベクトル一致器９０は動作せず、利得レベルセレクタ２４およびパルストレインシーケンス決定器８９の動作の繰り返しもない。目標ベクトル一致器２９および９０の出力は比較できることがさらに理解されるであろう。これは図７に示されており、これを参照する。一致器２９および９０の出力信号は、シーケンスとグローバル基準を表しているが、出力ライン３８および９４に沿って比較器１００に与えられる。比較器１００は一致器２８および９０からのグローバル基準ＧＣｊｏｐｔを比較して最低のものを選択する。結果的なシーケンス、パルス又はパルストレインを表す出力信号は出力ライン１０２に沿って与えられる。図１、５および７のシステムはディジタル信号処理チップ上に又はソフトウエア内で実現できることが理解されるであろう。１実施例においては、ソフトウエアはプログラム言語Ｃ₊₊で書かれ、他の実施例ではアセンブリ言語で書かれた。本発明は上に特定的に示され記載されたものに限定されないことは当業者に理解されるであろう。むしろ、本発明の範囲は以下の請求の範囲によってのみ規定される。

【手続補正書】特許法第１８４条の７第１項【提出日】１９９５年１０月２日【補正内容】１．入力ラインおよび出力ラインに接続されており、前記入力ライン上の入力音声信号に応答して、前記入力音声信号の短期特性を発生する短期アナライザと、少なくとも前記入力音声信号と、オプションとして前記短期特性とから目標ベクトルを生成する目標ベクトル発生器と、前記目標ベクトル発生器の出力ラインに接続されており、複数の、等しい振幅の複数のシーケンスと、可変符号で、可変スペースのパルスとを生成するマルチパルス分析器であって、前記シーケンスの各々は異なる振幅値を有し、各シーケンス内の前記パルスの各々は等しい振幅を有するが可変符号を有し、前記マルチパルス分析器は、最大確度基準にしたがって、最も近く前記目標ベクトルを表している、等しい振幅で、可変符号で、可変スペースのパルスのシーケンスに対応する信号を出力するものと、を備える音声処理システム。２．入力音声信号について線形予測係数分析を利用して短期特性を発生する短期アナライザを含む音声処理システムであって、前記入力音声信号と、オプションとして前記短期特性とから目標ベクトルを生成する目標ベクトル発生器と、前記目標ベクトルと前記短期特性とに基づいて、マルチパルス分析技術にしたがって最初のパルスの位置を決定する最初のパルス位置決定器と、前記最初のパルスの振幅と前記振幅の絶対値のまわりにグループ化された量子化された振幅レベルの範囲との両方を決定する振幅範囲決定器と、所定のステップの大きさにしたがって量子化された振幅レベルの前記範囲を通してステップさせる振幅レベルセレクタであって、各ステップで選択された量子化された振幅を出力するものと、前記選択された量子化振幅に基づいて、等しい振幅で、可変符号で、可変スペースの前記目標ベクトルに対応するパルスを生成するパルスシーケンス決定器と、等しい振幅で、可変符号で、可変スペースパルスの前記シーケンスと前記目標ベクトルとの間の一致の質に対応するエラーベクトルを決定し、前記選択された振幅の各々に対する前記エラーベクトルを決定し、最小エラーベクトルに対応する等しい振幅で、可変符号で、可変スペースパスルの前記シーケンスを出力する目標ベクトル一致器と、を具備する音声処理システム。３．等しい振幅で、可変符号で、可変スペースパルスの前記シーケンスの各々は同一のサンプル位置に配置されている、請求の範囲第２項記載のシステム。４．前記目標ベクトル一致器はグローバル基準決定器を含み、前記グローバル基準決定器は等しい振幅で、可変符号で、可変スペースパルスの前記シーケンスをフィルタリングするパーセプチュアル・ウエイティング・フィルタと前記エラーベクトル内のエネルギー量を決定する決定器とを含み、前記選択された量子化振幅の各々に対して、前記エラーベクトルは前記目標ベクトルと前記フィルタの出力との間の差として定義され、前記パーセプチュアル・ウエイティング・フィルタは短期特性に対応する特性を有するようにした、請求の範囲第２項記載のシステム。５．入力音声信号から線形予測係数分析を利用して短期特性を発生する短期アナライザを含み、入力音声信号から長期特性と音声のピッチ値を決定する長期アナライザを含む音声処理システムであって、少なくとも前記入力音声信号と、オプションとして前記短期特性とから目標ベクトルを生成する目標ベクトル発生器と、前記目標ベクトルと、前記短期特性と、前記ピッチ値とに基づいて、マルチパルス分析技術にしたがって最初のパルストレインの位置を決定する最初のパルストレイン位置決定器と、前記目標ベクトルに対応し、等しい振幅で、均一スペースパルスの複数の可変符号トレイン生成するパルストレインシーケンス決定器であって、前記トレイン内の前記パルスはピッチ値に対応するパルススペーシングを有し、各トレイン内の前記パルスは同一符号を有し、前記トレインの全ての前記パルスは同一の振幅レベルを有するようにしたものと、を具備する、音声処理システム。７．入力ラインおよび出力ラインに接続されており、前記入力ライン上の入力音声信号に応答して、前記入力音声信号の少なくともピッチ値を含む長期特性を発生する長期アナライザと、入力ラインおよび出力ラインに接続されており、前記入力ライン上の入力音声信号に応答して、前記入力音声信号の短期特性を発生する短期アナライザと、少なくとも前記入力音声信号と、オプションとして前記短期および長期特性とから目標ベクトルを生成する目標ベクトル発生器と、前記目標ベクトル発生器の出力ラインに接続されており、等しい振幅で均一スペースパルスの可変符号トレインの複数のシーケンスを発生するパルストレインマルチパルス分析器であって、各トレイン内の前記パルスは同一の符号を有し、パルスのトレインの前記シーケンスの各々は異なる振幅を有し、前記パルストレインマルチパルス分析器は、最大確度基準にしたがって前記目標ベクトルを最も近く表している、等しい振幅の、均一スペースパルスの複数のトレインに対応する信号を出力するものと、を備える音声処理システム。８．前記パルスのトレインの各々内の前記パルスの各々は前記ピッチ値により互いに離れている、請求の範囲第７項記載のシステム。９．前記トレインのシーケンスの各々の最初のトレインの最初のパルスは同一のサンプル位置に配置されている、請求の範囲第７項記載のシステム。１０．入力音声信号から線形予測係数分析を利用して短期特性を発生する短期アナライザを含み、入力音声信号から音声のピッチ値を含む長期特性を決定する長期アナライザを含む音声処理システムであって、前記入力音声信号と、オプションとして前記短期特性とから目標ベクトルを生成する目標ベクトル発生器と、前記目標ベクトルと、前記短期特性と、前記ピッチ値とに基づいて、マルチパルス分析技術にしたがって最初のパルストレインの位置を決定する最初のパルストレイン位置決定器と、前記最初のパルストレインの振幅と前記振幅の絶対値のまわりにグループ化された量子化された振幅レベルの範囲との両方を決定する振幅範囲決定器と、所定のステップの大きさにしたがって量子化された振幅レベルの前記範囲を通してステップさせる振幅レベルセレクタであって、各ステップで選択された量子化された振幅を出力するものと、前記選択された量子化振幅の各々に対して、前記目標ベクトルに対応し、等しい振幅で、均一スペースパルスの複数の可変符号トレイン生成するパルストレインシーケンス決定器であって、前記トレイン内の前記パルスはピッチ値に対応するパルススペーシングを有し、各トレイン内の前記パルスは同一符号を有し、パルスの各トレイン内の前記パルスは同一の振幅レベルを有し、前記等しい振幅は前記選択された量子化振幅に対応しているようにしたものと、等しい振幅で、均一スペースパルスの可変符号トレインの前記複数のシーケンスと前記目標ベクトルとの間の一致の質に対応するエラーベクトルを決定し、前記選択された量子化振幅の各々に対する前記エラーベクトルを決定し、最小エラーベクトルに対応する等しい振幅で、同一符号で、均一スペースパスルのトレインの前記シーケンスを出力する目標ベクトル一致器と、を具備する音声処理システム。１１．前記目標ベクトル一致器はグローバル基準決定器を含み、前記グローバル基準決定器は等しい振幅で、均一スペースのパルスの前記複数の可変符号トレイン符号をフィルタリングするパーセプチュアル・ウエイティング・フィルタと、前記エラーベクトル内のエネルギー量を決定する決定器とを含み、前記選択された量子化振幅の各々に対して、前記エラーベクトルは前記目標ベクトルと前記フィルタの出力との間の差として定義され、前記パーセプチュアル・ウエイティング・フィルタは短期特性に対応する特性を有するようにした、請求の範囲第１０項記載のシステム。１３．前記目標ベクトル発生器の出力ラインに接続されており、等しい振幅で、可変符号で、可変スペースのパルスの複数のシーケンスを生成するマルチパルス分析器であって、前記シーケンスの各々は異なる振幅値を有し、各シーケンス内の前記パルスの各々は等しい振幅を有するが可変符号を有し、前記マルチパルス分析器は、最大確度基準にしたがって、最も近く前記目標ベクトルを表している、等しい振幅で、可変符号で、可変スペースのパルスのシーケンスに対応する信号を出力するものを更に備えている、請求の範囲第７項記載のシステム。１４．入力音声信号の短期特性を決定し、少なくとも前記入力音声信号と、オプションとして前記短期特性とから、目標ベクトルを生成し、前記目標ベクトルと前記短期特性とに基づいて、マルチパルス分析技術にしたがって最初のパルスの位置を決定し、前記最初のパルスの振幅と前記振幅の絶対値のまわりにグループ化された量子化振幅レベルの範囲とを決定し、所定のステップサイズにしたがって量子化振幅レベルの範囲にわたってステップさせ、各ステップで選択された量子化振幅を出力し、前記選択された量子化振幅に基づいて、前記目標ベクトルに対応し、等しい振幅で、可変符号で可変スペースのパルスのシーケンスを生成し、前記等しい振幅で、可変符号で、可変スペースのパルスの各シーケンスを前記目標ベクトルと比較し、そして最大確度基準にしたがって、前記目標ベクトルを最も近く表している前記等しい振幅で、可変符号で、可変スペースのパルスの前記シーケンスを選択する、というステップを備える、音声処理方法。１５．等しい振幅で、可変符号で、可変スペースのパルスの前記シーケンスの各々の最初のパルスは同一のサンプル位置に配置される、請求の範囲第１４項記載の方法。１６．前記比較のステップは、等しい振幅で、可変符号で、可変スペースのパルスの前記シーケンスを、その特性が前記短期特性であるパーセプチュアル・ウエイティング・フィルタを介してフィルタリングし、そして各量子化振幅レベルに対して、エラーベクトル内のエネルギー量を前記目標ベクトルと前記フィルタの出力との間の差として決定する、というステップを含む、請求の範囲第１４項記載の方法。１８．入力音声信号の短期特性を決定し、前記入力音声信号の少なくともピッチ値を含む前記入力音声信号の長期特性を決定し、少なくとも前記入力音声信号と、オプションとして前記短期および長期特性とから、目標ベクトルを生成し、前記目標ベクトルと、前記短期特性と前記ピッチ値とに基づいて、マルチパルス分析技術にしたがって、最初のパルストレインの位置を決定し、そして前記目標ベクトルに対応する、等しい振幅で均一スペースのパルスの複数の可変符号トレインを生成し、前記トレイン内の前記パルスは前記ピッチ値に対応するパルススペースを有し、前記トレイン内の前記パルスは同一の振幅レベルを有し、各トレイン内の前記パルスは同一の符号を有するようにする、というステップを備える音声処理方法。２０．入力音声信号の短期特性を決定し、前記入力音声信号の少なくともピッチ値を含む前記入力音声信号の長期特性を決定し、少なくとも前記入力音声信号と、オプションとして前記短期および長期特性とから、目標ベクトルを生成し、前記目標ベクトルと、前記短期特性と前記ピッチ値とに基づいて、マルチパルス分析技術にしたがって、最初のパルストレインの位置を決定し、前記最初のパルスの振幅を前記振幅の絶対値のまわりにグループ化された量子化レベルの範囲との両方を決定し、所定のステップサイズにしたがって量子化振幅レベルの範囲にわたってステップさせ、各ステップで選択された量子化振幅を出力し、各選択された量子化振幅に対して、前記目標ベクトルに対応する等しい振幅で均一なスペースのパルスの複数の可変符号トレインを生成し、同一振幅を有する前記パルスのトレイン内の前記パルスは前記ピッチ値に対応するパルススペースを有し、前記振幅は選択された量子化振幅に対応し、各トレイン内のパルスは同一の符号を有するようにし、等しい振幅で、均一なスペースのパルスの前記複数の可変符号トレインを前記目標ベクトルと比較し、そして最大確度基準にしたがって、前記目標ベクトルを最も近く表している、等しい振幅で、均一なスペースのパルスの前記複数の可変符号トレインを選択する、というステップを備える音声処理方法。２２．パルスのトレインの前記各シーケンスの最初のパルスは同一のサンプル位置に配置される、請求の範囲第２０項記載の方法。

───────────────────────────────────────────────────── フロントページの続き (81)指定国ＥＰ(ＡＴ，ＢＥ，ＣＨ，ＤＥ，ＤＫ，ＥＳ，ＦＲ，ＧＢ，ＧＲ，ＩＥ，ＩＴ，ＬＵ，ＭＣ，ＮＬ，ＰＴ，ＳＥ)，ＯＡ(ＢＦ，ＢＪ，ＣＦ，ＣＧ，ＣＩ，ＣＭ，ＧＡ，ＧＮ，ＭＬ，ＭＲ，ＮＥ，ＳＮ，ＴＤ，ＴＧ)，ＡＰ(ＫＥ，ＭＷ，ＳＤ，ＳＺ，ＵＧ)，ＡＭ，ＡＴ，ＡＵ，ＢＢ，ＢＧ，ＢＲ，ＢＹ，ＣＡ，ＣＨ，ＣＮ，ＣＺ，ＤＥ，ＤＫ，ＥＥ，ＥＳ，ＦＩ，ＧＢ，ＧＥ，ＨＵ，ＩＳ，ＪＰ，ＫＥ，ＫＧ，ＫＰ，ＫＲ，ＫＺ，ＬＫ，ＬＲ，ＬＴ，ＬＵ，ＬＶ，ＭＤ，ＭＧ，ＭＮ，ＭＷ，ＭＸ，ＮＯ，ＮＺ，ＰＬ，ＰＴ，ＲＯ，ＲＵ，ＳＤ，ＳＥ，ＳＧ，ＳＩ，ＳＫ，ＴＪ，ＴＭ，ＴＴ，ＵＡ，ＵＧ，ＵＺ，ＶＮ

Claims

【特許請求の範囲】１．入力ラインおよび出力ラインに接続されており、前記入力ライン上の入力音声信号に応答して、前記入力音声信号の短期特性を発生する短期アナライザと、少なくとも前記入力音声信号から目標ベクトルを生成する目標ベクトル発生器と、前記目標ベクトル発生器の出力ラインに接続されており、各シリースが異なる利得値を有する単一利得のパルスの多数のシリーズを生成し、出力に、前記目標ベクトルを最も近く表している単一利得のシリーズを表す信号を与える最大確度マルチパルス分析器と、を備える音声処理システム。２．前記最大確度マルチパルス分析器は、前記目標ベクトルから利得の範囲を決定する利得範囲決定器と、各シリーズは利得レベルの前記範囲内の前記利得レベルの１つの対応している単一利得パルスの多数のシリーズを生成するパルスシーケンス決定器と、前記シリーズの各々を前記目標ベクトルと照合し、出力ラインに、前記目標ベクトルを最も近く表しているシリーズを表す信号を出力する目標ベクトル一致器と、を備える、請求の範囲第１項記載の音声処理システム。３．前記パルスの多数のシリーズの各々の最初のパルスは同一のサンプル位置にある、請求の範囲第１項記載のシステム。４．前記目標ベクトル一致器は、その特性が前記短期特性であり、パルスシーケンスをフィルタリングするパーセプチュアル・ウエイティング・フィルタを備えるグローバル基準決定器と、各利得レベルに対して、前記目標ベクトルと前記フィルタの出力との差として定義されたエラーベクトル内のエネルギー量を決定する決定器とを備える、請求の範囲第２項記載のシステム。５．前記利得範囲決定器は、最初のパルスの振幅を決定する手段と、前記振幅のまわりの利得レベルの範囲を決定する手段とを備える、請求の範囲第１項記載のシステム。６．入力ライン及び出力ラインに接続されており、前記入力ライン上の入力音声信号に応答して、少なくとも前記入力音声信号のピッチ距離を発生する長期アナライザと、少なくとも前記入力音声信号から目標ベクトルを発生する目標ベクトル発生器と、前記目標ベクトル発生器の出力ラインに接続されているパルストレインマルチパルス分析器であって、各パルストレインが単一利得パルスのシーケンスを備えるパルスシーケンスのシリーズを発生し、各々の単一利得パルスは前記シーケンス内の前回のパルスから前記ピッチ距離だけ離れているサンプル位置にあり、また、出力に、前記目標ベクトルを最も近く表す単一利得パルストレインのシリーズを表す信号を与えるものと、を備える音声処理システム。７．前記パルストレインのシリーズは異なる符号を有する、請求の範囲第６項記載のシステム。８．入力ライン及び出力ラインに接続されており、前記入力ライン上の入力音声信号に応答して、少なくとも前記入力音声信号のピッチ距離を発生する長期アナライザと、前記入力ラインおよび出力ラインに接続されており、前記入力ライン上の入力音声信号に応答して、前記入力音声信号の短期特性を発生する短期アナライザと、少なくとも前記入力音声信号から目標ベクトルを生成する目標ベクトル発生器と、前記目標ベクトル発生器の出力ラインに接続されており、各シリースが異なる利得値を有する単一利得のパルストレインの多数のシリーズを生成し、出力に、前記目標ベクトルを最も近く表している単一利得のパルストレインのシリーズを表す信号を与える最大確度パルストレインマルチパルス分析器と、を備える音声処理システム。９．各パルストレインは、各々が前記シーケンス内の前回のパルスから前記ピッチ距離だけ離れているサンプル位置にある単一利得パルスのシーケンスを備えている、請求の範囲第８項記載のシステム。１０．前記パルストレインの多数のシリーズの各々の最初のパルスは同一サンプル位置で開始する、請求の範囲第８項記載のシステム。１１．前記最大確度パルストレインマルチパルス分析器は、前記目標ベクトルから、利得の範囲を決定する利得範囲決定器と、各シリーズが前記利得レベルの範囲内の前記利得の１つに対応する単一利得パルストレインの多数のシリーズを発生するパルストレインシーケンス決定器と、前記シリーズの各々を前記目標ベクトルと照合し、出力ラインに、前記目標ベクトルを最も近く表しているシリーズを表す信号を出力する目標ベクトル一致器と、を備える、請求の範囲第８項記載の音声処理システム。１２．前記目標ベクトル一致器は、その特性が前記短期特性であり、パルスシーケンスをフィルタリングするパーセプチュアル・ウエイティング・フィルタを備えるフローバル基準決定器と、各利得レベルに対して、前記目標ベクトルと前記フィルタの出力との差として定義されたエラーベクトル内のエネルギー量を決定する決定器とを備える、請求の範囲第１１項記載のシステム。１３．前記利得範囲決定器は、最初のパルスの振幅を決定する手段と、前記振幅のまわりの利得レベルの範囲を決定する手段とを備える、請求の範囲第１１項記載のシステム。１４．前記目標ベクトル発生器の出力ラインに接続されており、各シリースが異なる利得値を有する単一利得のパルスの多数のシリーズを生成し、出力に、前記目標ベクトルを最も近く表している単一利得のシリーズを表す信号を与える最大確度マルチパルス分析器と、前記最大確度パルストレイン及び前記最大確度マルチパルス分析器の両方からの出力を受け取り、前記目標ベクトルに最もよく一致する出力を選択する比較器と、を備える請求の範囲第８項記載のシステム。１５．入力音声信号の短期間特性を決定し、少なくとも前記入力音声信号から、目標ベクトルを発生し、各々のシリーズが異なる利得レベルを有する、単一利得のパルスの多数のシリーズを発生し、前記シリーズの各々を前記目標ベクトルとマッチングし、前記目標ベクトルを最もよく表しているシリーズを選択する、というステップを備える音声処理方法。１６．パルスの前記多数のシリーズの各々の最初のパルスは同一位置にある、請求の範囲第１５項記載の方法。１７．前記マッチングのステップは、その特性が前記短期特性であるパーセプチュアル・ウエイティング・フィルタを介してパルストレインシーケンスをフィルタリングし、前記目標ベクトルと前記フィルタの出力との左として定義されるエラーベクトル内のエネルギー量を、各利得レベルに対して決定する、というステップを含む、請求の範囲第１５項記載の方法。１８．前記第２の発生ステップは最初のパルス位置の振幅を決定し、前記振幅のまわりの利得の範囲を決定するというステップを備える、請求の範囲第１５項記載の方法。１９．入力信号の少なくともピッチ距離を決定し、少なくとも前記入力信号から目標ベクトルを決定し、各パルストレインが単一利得パルスのシーケンスを備え、そのパルスの各々は前記シーケンス内前回のパルスから前記ピッチ距離だけはなれているサンプル位置にある、パルストレインのシリーズを発生する、というステップを備える音声処理方法。２０．前記パルストレインのシリーズは異なる符号を有する、請求の範囲第１９項記載の方法。２１．前記入力信号の短期特性を決定し、前記入力信号の少なくともピッチ距離を決定し、少なくとも前記入力信号から目標ベクトルを決定し、各シリーズが異なる利得レベルを有する単一利得パルストレインの多数のシリーズを発生し、前記シリースを前記目標ベクトルとマッチングし、前記目標ベクトルを最も近く表しているパルストレインシリーズを選択する、というステップを備える請求の範囲第１９項記載の方法。２２．各パルストレインは、各々が前記シーケンス内の前回のパルスから前記ピッチ距離だけ離れている位置にある複数の単一利得パルスを備える、請求の範囲第２１項記載の方法。２３．前記多数のパルスのシリーズの各々の最初のパルスは同一のサンプル位置にある、請求の範囲第２１項記載の方法。２４．前記発生の第２のステップは最初のパルストレイン位置の振幅を決定し、前記振幅のまわりの正及び負の利得の範囲を決定するというステップを備える、請求の範囲第２１項記載の方法。２５．各シリーズが異なる利得レベルを有する、単一利得パルスの多数のシリーズを発生し、前記シリーズの各々を前記目標ベクトルとマッチングし、前記目標ベクトルを最も近く表しているパルスシリーズを選択し、前記目標ベクトルを最も近く表しているパルスシリーズとパルストレインシリーズの１つを選択する、というステップを備えている請求の範囲第２１項記載の方法。