JPH09512645A - マルチパルス分析音声処理システムおよび方法 - Google Patents

マルチパルス分析音声処理システムおよび方法

Info

Publication number
JPH09512645A
JPH09512645A JP7528321A JP52832195A JPH09512645A JP H09512645 A JPH09512645 A JP H09512645A JP 7528321 A JP7528321 A JP 7528321A JP 52832195 A JP52832195 A JP 52832195A JP H09512645 A JPH09512645 A JP H09512645A
Authority
JP
Japan
Prior art keywords
pulse
target vector
gain
series
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP7528321A
Other languages
English (en)
Other versions
JP3068196B2 (ja
Inventor
ビアリック,レオン
フロメン,フェリックス
Original Assignee
シャーマン,ジョナサン エドワード
オーディオコーズ リミティド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by シャーマン,ジョナサン エドワード, オーディオコーズ リミティド filed Critical シャーマン,ジョナサン エドワード
Publication of JPH09512645A publication Critical patent/JPH09512645A/ja
Application granted granted Critical
Publication of JP3068196B2 publication Critical patent/JP3068196B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
    • G10L19/113Regular pulse excitation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Monitoring And Testing Of Transmission In General (AREA)

Abstract

(57)【要約】 音声処理システムおよび方法が開示されている。本発明の1実施例においては、システムは目標ベクトル(26)に作用する最大確度量子化マルチパルス分析ユニット(21)を少なくとも含む。最大確度量子化マルチパルス分析ユニットはマルチパルスシーケンスに対する初期利得レベルを決定し、単一の利得のマルチパルス分析(MPA)を、各々が異なる利得レベルで、多数回実行する。目標ベクトルを最も近く表しているパルスシーケンスは出力信号(38)として与えられる。他の実施例においては、システムは少なくともパルストレインマルチパルス分析ユニットを含みその中で目標ベクトルはパルストレインのシリーズとしてモデル化されている。各パルストレインは複数の単一利得パルスを備え、その中で各パルスはそのパルストレイン内の前回のパルスからピッチ値距離だけ離れている。最大確度分析器とパルストレインを結合することも本発明の一部である。

Description

【発明の詳細な説明】 マルチパルス分析音声処理システムおよび方法 発明の分野 本発明は概略的には音声処理システムに関し、特定的にはマルチパルス分析シ ステムに関する。 発明の背景 音声信号処理はこの分野でよく知られており、格納のため又は送信のためにし ばしば利用されて、入力音声信号を圧縮する。音声信号処理は典型的には入力音 声信号をフレームに分割し、次いで各フレームを分析してその成分を判定するこ とを含む。その成分は次いで格納又は送信される。 典型的には、フレームアナライザは音声信号の短期特性と長期特性とを判定す る。フレームアナライザは又音声信号の短期および長期成分、即ち、「貢献度」 の1つ又は両方を判定できる。例えば、線形予測係数分析(LPC)は短期特性 および貢献度を与え、ピッチ分析および予測は長期特性と長期貢献度を与える。 典型的には、長期および短期の予測貢献度の両方又はいずれかが入力フレーム から差し引かれて、その形状が特徴付けられるべき目標ベクトルを残す。そのよ うな特徴化は、Sadaoki Furui,Marcel Dekker,Inc.,New York,NY 1989 によ る書籍「Digital Speech Processing,Synthesis and Recognition」のセクショ ン6.4.2 に詳細に記載されている、マルチパルス分析(MPA)により生成でき る。この書籍は参考のために本明細書に取り込まれる。 MPAにおいては、多数のサンプルで形成されている目標ベクト ルは、変化する位置および変化する符号(正および負)の複数の単一ゲインパル ス(即ちスパイク)によりモデル化される。各パルスを選択するために、1つの パルスが各サンプル位置に配置されそのパルスをLPC係数により定義されたフ ィルタを通すことにより規定されるパルスの効果が決定される。目標ベクトルに 最も近くマッチするパルスが選択されその効果が目標ベクトルから除去され、そ れにより新たな目標ベクトルを生成する。このプロセスは所定数のパルスが見出 されるまで継続される。MPA分析の結果は格納又は送信の目的のための、パル ス位置と利得の量子化値の集合である。 利得は典型的には決定された最初のパルスから決定される。この利得は次いで 残りのパルスのために利用される。残念ながら、最初のパルスの利得値は必ずし も目標ベクトルの全体の利得値を示しておらず、したがって、目標ベクトルとの 一致は必ずしも極めて正確ではない。 発明の要旨 したがって、本発明の目的は改良された音声処理システムを提供することであ る。本発明の1実施例においては、システムは短期アナライザと、目標ベクトル 発生器と最大確度量子化(MLQ)マルチパルス分析ユニットとを含んでいる。 短期アナライザは入力音声信号の短期特性を決定する。目標ベクトル発生器は少 なくとも入力信号から目標ベクトルを生成する。MLQマルチパルス分析ユニッ トは得られた目標ベクトルに作用する。 MLQマルチパルス分析ユニットは典型的にはマルチパルスシーケンスに対す る最初の利得レベルを決定し、単一の利得のMPAを各々異なる利得レベルで多 数回実行する。利得レベルは最初の利得レベルの上と下の範囲内にある。結果的 に得られるパルスは正又は 負であり得る。 他の最大確度の応用と同様に、結果の質は(この場合、目標ベクトルとパーセ プチュアル・ウエイティング・フィルタを介して単一利得パルスシーケンスをフ ィルタリングすることにより生成された推定ベクトルとの間の差として定義され たエラーベクトルのエネルギーを最小化することにより)測定される。次いで、 エラーベクトルのエネルギーとその対応する利得レベル(即ち、利得レベルの指 標)を最小化するパルスシーケンスは、MLQマルチパルス分析ユニットの出力 信号として与えられる。 他の実施例においては、システムは長期アナライザを含み、MLQマルチパル ス分析ユニットをパルストレインマルチパルス分析ユニットで置き換える。この 実施例においては、パルストレインマルチパルス分析ユニットは長期アナライザ からのピッチ距離を利用して、等しい振幅で、同じ符号で、各々がトレイン内の 前のパルスからピッチ距離だけ離れているパルスを生成する。マルチパルス分析 ユニットは次いで、目標ベクトルを最もよく表している、正と負のパルストレイ ンを含むパルストレインのシーケンスを出力する。 更に他の実施例においては、システムは前の2つの実施例の動作を結合するM LQマルチパルス分析ユニットを含んでいる。換言すれば、利得の範囲が与えら れ、各々に対して、パルストレインのシーケンスが見出される。目標ベクトルに 最も近い一致を示すシーケンスが出力信号として与えられる。 最後のさらなる実施例においては、最大確度の出力とパルストレインマルチパ ルス分析ユニットが比較され、目標ベクトルに最も近い一致を示すシーケンスが 出力信号として与えられる。 図面の簡単な説明 本発明は図面と関係付けてなされる以下の詳細な記載からより完全に理解され るであろう。図において、 図1は本発明の音声処理システムの第1の実施例のブロック図、 図2は図1のMP−MLQブロックの動作を示すフローチャート、 図3Aおよび3Bは図2の動作を理解するのに有益なグラフ図、 図4Aおよび4Bはパルストレインとパルストレインを用いるマルチパルス分 析をそれぞれ記載するグラフ図、 図5はパルストレインを用いる本発明の音声処理システムの第2の実施例を示 すブロック図、 図6は図5のパルストレインマルチパルス分析の動作を示すフローチャート、 図7は図1および5のシステムの出力を比較する第3の実施例のブロック図で ある。 好ましい実施例の詳細な記載 ここで、本発明の第1の実施例を示す図1、2、3Aおよび3Bを参照する。 本発明の音声処理システムは少なくとも短期予測アナライザ10と、長期予測ア ナライザ12と、目標ベクトル発生器13と最大確度量子化マルチパルス(MP −MLQ)ユニット14とを含んでいる。 短期予測アナライザ10は、入力ライン16上の多数のディジタル化された音 声サンプルで形成された音声信号の入力フレームを受け取る。典型的には、フレ ーム当たり240個の音声サンプルがあり、そのフレームはしばしば複数のサブ フレームに分離される。典型的には、4個のサブフレームがあり、各々は典型的 には60サンプルの長さである。入力フレームは元の音声信号又は処理されたバ ージョンの音声信号のフレームであり得る。 短期予測アナライザ10はまた、入力ライン16上の入力フレームを受け取り 、出力ライン17上に入力フレームの短期特性を生成する。1実施例においては 、アナライザ10は線形予測分析を実行して、入力フレームを特徴付ける線形予 測係数(LPCs)を生成する。 本発明の目的のために、アナライザ10は任意のタイプのLPC分析を実行す ることができる。例えば、LPC分析は書籍「Digital Speech Processing,Syn thesis and Recognition」のチャプター6.4.2 に次のように記載されているよう にして実行できる:ハミング窓がサブフレーム上に集中された180個のサンプ ルの窓に適用される。10番のオーダのLPC係数が、ダービン回帰法(Durbin recursion method)を用いて生成される。この処理は各サブフレームに対して繰 り返される。 長期予測アナライザ12は任意のタイプの長期予測器でよく、ライン16上に 受信される入力フレームに対して動作する。長期アナライザ12は入力フレーム の複数のサブフレームを分析して各サブフレーム内の音声のピッチ値を決定する 。ここで、ピッチ値は、その後で音声信号がそれ自体をほぼ繰り返すサンプルの 数として定義される。ピッチ値は典型的には20と146の間の範囲であり、こ こで20は高ピッチ音で146は低ピッチ音を示す。 例えば、2つのサブフレーム毎に、ピッチ推定は、サブフレームs(n)の正 規化された相互相関関数を最大化することにより、次のように決定できる: 例えば、長期アナライザ12は、相互相関C iを2つのサブフレ ームに対するピッチ値として最大化する指標iを選択する。 長期アナライザ12がピッチ値を決定すると、そのピッチ値は、出力ライン1 8上に与えられたそのサブフレームのための長期予測情報を決定するために利用 される。 目標ベクトル発生器13は長期アナライザ12と短期アナライザ10の出力信 号と、遅延器19を介して入力ライン16上の入力フレームとを受け取る。これ らの信号に応答して、目標ベクトル発生器13は入力フレームの少なくともサブ フレームから目標ベクトルを生成する。長期および短期情報は、所望であれは利 用でき、又はそれらは無視できる。遅延器19は、目標ベクトルに到着した入力 フレームがアナライザ10および12の出力に対応することを確実化する。 目標ベクトル発生器13の出力ライン26は、MP−MLQユニット14に接 続されており、目標ベクトル出力信号を伝播する。MP−MLQユニット14は 典型的には、アナライザ10により生成された短期特性を伝播する出力ライン1 7に接続されている。 一般性を失うことなしに、MP−MLQユニット14に対する目標ベクトルは 任意の他の所望の方法で生成され得るということが理解されるであろう。 本発明の第1の好ましい実施例によれば、MP−MLQユニット14は初期パ ルス位置決定器20と、利得範囲決定器22と利得レベルセレクタ24と、パル スシーケンス決定器25と、目標ベクトル一致器28とオプションのエンコーダ 30とを含んでいる。要素20〜30により遂行される特定の動作は図2に示さ れており以下に詳細に記載する。以下はユニット14の動作の概略的記載である 。 初期パルス位置決定器20は、目標ベクトル発生器13と短期ア ナライザ10の出力信号をそれぞれ出力ライン17および26を介して受け取る 。それはマルチパルス分析技術にしたがって、最初のパルスのサンプル位置を決 定する。 利得範囲決定器22はユニット20の最初のパルス出力を受け取って、最初の パルスの振幅を決定し、決定された振幅の絶対値のまわりの量子化された利得レ ベルの範囲をも決定する。 利得レベルセレクタ24は利得範囲決定器22により生成された利得範囲を受 け取り、その利得範囲内で利得値を変化させる。出力ライン32上のその出力は 現在の利得レベルであり、それに対して単一の利得のパルスシーケンスが決定さ れる。 パルスシーケンス決定器25は、ライン26上の目標ベクトルを受け取り、ラ イン32上の現在の利得レベルを受け取り、それから、以下に記載する目標ベク トルに一致するパルスシーケンス(正および負の両方のパルスを持つ)を決定す る。このパルスシーケンスは現在の利得レベルを持つ正および負のパルスの連鎖 である。 目標ベクトル一致器28は、決定器25の出力ライン34上のパルスシーケン ス出力を受け取り、出力ライン26上の目標ベクトルを受け取る。一致器28は 、最大確度タイプの基準を用いて一致の質を決定する。 利得レベルにある範囲があるので、一致器28は利得レベルセレクタ24に制 御を戻して次の利得レベルを選択する。この制御の戻りは矢印36で示されてい る。 各利得値に対して、一致器28は一致の質を決定し、それが以前の一致よりも 基準に対して小さい場合にのみその一致(利得指標およびパルスシーケンス)を セーブする。 利得セレクタ24が利得値のすべてを動かしたならば、一致器28内の記憶装 置内にある利得指標とパルスシーケンスは目標ベクト ルに最も近い一致となる。一致器28は次いで、格納されているパルスシーケン スと利得指標をオプションのエンコーダ30に出力する。 いくつかの利得レベルの各々に対してパルスシーケンスを決定することにより 、MP−MLQユニット14は目標ベクトルに最も近く一致するものを選択でき るということが理解されるであろう。 オプションのエンコーダ30は、格納又は送信のために出力パルスシーケンス と利得指標を符号化する。 MP−MLQユニット14の特別な動作は図2に示されている。初期化ステッ プ40で、ユニット14は次の信号を発生する: a) として定義される短期特性a iから入力フレームに対するインパルス応答h[ n]、ただしPは短期特性でNはサブフレーム内の音声サンプルの数である; b)各サンプル位置1に対する、インパルス応答自己相関の次のような結果r hh[l]: そしてc)インパルス応答h[n]と目標ベクトルt[n]の間の相互相関の 次のような結果r th[l]: インパルス応答はアナライザ10からライン17に沿って与えられる短期特性 a iの関数であることが理解されるであろう。初期化ステップ40で生成され たインパルス応答は前述したダービン(D urbin)LPC分析に対応する。 MP−MLQユニット14はローカル基準LC kj[l]を利用して、各サ ンプル位置1、各パルスkおよび各利得レベルjに対する量子化値を決定する。 以下においてわかるように、ローカル基準のレベルはkの値(即ち、すでに決定 されたパルスの数)に依存している。 ステップ42で、最初のパルスの決定に対するローカル基準LC 0,j[l ]は、次のように相互相関r th[l]に初期化される: ローカル基準に対する最大ローカル値もある負の値にセットされる。位置指標1 も0に初期化される。 ステップ44〜50で、最初のパルスk=1の位置1が決定される。これを行 うために、ローカル基準LC 0,j[l]の絶対値は最大ローカル値と比較さ れる(ステップ44)。LC 0,j[l]が大きければ、位置1は格納され、 最大ローカル値はローカル基準LC 0,j[l]の絶対値にセットされ(ステ ップ46)、位置指標1は1だけ増大される(ステップ48)。この動作はすべ ての位置1がレビューされるまで繰り返される。位置のすべてがレビューされた 後に記憶装置内にあるサンプル位置l optは選択されたサンプル位置l o ptである。ステップ40〜50はパルス位置決定器20により実行される。 ステップ52は利得範囲決定器22により実行される。ステップ52において 、最大ローカル基準LC 0,j[l]を生成した位置1の最大振幅A max は次のように生成される: ここで、l optは最初のパルスの位置である。最大値A maxは次いで利 得レベルの所定の集合の1つにより近似化される。例えば、期待された振幅レベ ルが0.1〜2.0ユニットの範囲にある場合、利得レベルは0.1ユニット毎 である。こうして、A maxが0.756であれば、それは0.8に量子化さ れる。 ステップ54〜58は利得セレクタ24により実行される。ステップ54にお いて、利得セレクタ24は決定された利得レベルに関連した利得指標jと、利得 指標jのまわりの利得指標の範囲とを決定する。利得レベルの範囲はMLQ S TEPSの所定値に依存する任意の大きさでよい。ステップ54で、利得セレク タ24は利得指標を最小のものにセットする。前の例では、0.1は指標1を有 しMLQ STEPSは3であろう。こうして、決定された利得指標は8であり その範囲は指標5〜11の間である。ステップ54はまた、1013のような任意 の大きい値に対して最小グローバル値をセットする。 本発明においては、各利得指標に対して、最初のパルスはパルス位置決定器2 0により(ステップ44〜50で)決定されたパルスの位置である。残りのパル スはサブフレーム内のどこにあってもよく、正又は負の利得値を持つことができ る。ステップ56において、利得セレクタ24は最初のパルス位置とその振幅を 格納する。ステップ58で、現在のパルス指標kおよび利得指標jに対して、ロ ーカル基準LC k,j[l]が、典型的には式5にしたがって初期化される。 パルスシーケンス決定器25はステップ60〜74を実行する。ステップ60 で、決定器25は最大ローカル値を、前と同様にある 大きい値にセットし、位置指標を0にセットする。 ステップ62で、決定器25はローカル基準を前回のパルスで、次のように更 新する: j=利得指標 k=パルス指標 l=位置指標 ステップ64〜70のループにおいて、パルスシーケンス決定器25はステッ プ44〜50において実行されたのと同様の方法でパルスの位置を決定し、した がって、ここでは更なる記載はしない。ステップ72で、決定器24は選択され たパルスを格納し、ステップ74で、パルス値を更新する。ステップ62〜74 は各パルスに対して順次繰り返され、その結果はパルスシーケンス決定器25の パルスシーケンス出力である。ステップ62は見出された各パルスに対してロー カル基準を更新することがわかる。 図3Aおよび3Bはパルスシーケンス決定器25の異なるパルスシーケンス出 力の2つの例を示す。図3Aのシーケンスは利得指標が7で、図3Bのシーケン スは利得指標が8である。両シーケンスは同一のサンプル位置10を有するが、 パルスの残りは他の位置にある。パルスは正又は負であり得ることに着目される 。 ステップ76で、目標ベクトル一致器28は各利得レベルjに対してグローバ ル基準GC jの値を決定する。グローバル基準GC jは任意の適当な基準で よく、典型的には最大確度タイプの基準である。例えば、グローバル基準は、目 標ベクトルと、パーセプチュアル・ウエイティング・フィルタを通して単一利得 パルスシーケ ンスをフィルタリングすることにより生成された推定ベクトルとの間の差として 定義されるエラーベクトルにおけるエネルギーを測定することができる。そのよ うな基準に対して、目標ベクトル一致器28はパーセプチュアル・ウエイティン グ・フィルタを含んでいる。 パルスシーケンスそれ自体は目標ベクトルと一致しないこと、パルスシーケン スは目標ベクトルと一致する関数を表わしていることが理解されるであろう。 以下の式8a〜8eに与えるように、グローバル基準GC jは2つの要素、 p jおよびd jからなり、両者は、短期インパルス応答h[n]によりフィ ルタされた所与のレベルjに対するパルスシーケンスである信号x j[n]の 関数である。p jは目標ベクトルt[n]とx[n]の間の相互相関であり、 d jはx j[n]のエネルギーである。 ステップ78で、現在の利得指標jに対するグローバル基準GC jは現在の 最小グローバル値と比較される。それが現在の最小グローバル値より小さいと、 ステップ78でチェックされるように、目標ベクトル一致器28は利得指標およ びその関連するパルスシーケンスを格納する(ステップ80)。 ステップ82で、利得レベルセレクタ24は利得指標を更新し、ステップ84 で利得レベルセレクタ24はパルスシーケンスが利得 レベルのすべてに対して決定されたかどうかをチェックする。もし決定されてい れば、記憶装置内にあるパルスシーケンスおよび利得指標は、グローバル基準G C jにしたがって目標ベクトルと最も良く一致するものである。 ステップ86で、オプションのエンコーダ30はパルスシーケンスと利得指標 を、任意の符号化方法にしたがって、送信又は格納のために符号化する。所望で あれば、目標ベクトルはx jopt[n]を用いて再構成できる。ここで、j optはステップ84から得られる利得指標である。 本発明のMP−MLQユニット14が、出力信号として、少なくとも選択され たパルスシーケンスと利得レベルを与えるということが理解されるであろう。 さて、パルストレインを利用する本発明の他の実施例を示している図4A、4 B、5および6を参照する。パルストレイン83は図4Aに示されている。それ はピッチである距離Qだけ離れている一連のパルス81を備えている。 図5のシステムにおいて、目標ベクトルに最も近く一致するパルストレインの あるシーケンスが見出される。図4Bは、見出される3つのパルストレイン83 a,83bおよび83cのシーケンス例を示している。各パルストレイン83は 異なるサンプル位置で開始している。パルストレイン83aは最初であり、4個 のパルスを備えている。パルストレイン83bは後の位置で開始しており、3個 のパルスを備えており、パルストレイン83cは、より遅く開始しており、2つ だけのパルスを備えている。 図5のシステムは図1のシステムと類似しており、相違するところは、a)図 1のパルス位置決定器20およびパルスシーケンス決定器25はパルストレイン 位置決定器88およびパルストレインシ ーケンス決定器89で置き換えられていること、b)90とラベルされた、目標 ベクトル一致器はパルスシーケンスではなくてパルストレインシーケンスについ て作用すること、そしてc)決定器88および89は出力ライン18に沿ってピ ッチ値Qを受け取ることである。さらに、出力34および38は、パルスのシー ケンスではなくてパルストレインのシーケンスを表す信号を運ぶ出力ライン92 および94で置き換えられている。 パルストレイン決定器88は、その決定器88がパルスインパルス応答h[n ]ではなくてパルストレインインパルス応答h T[n]を利用することを除き 、パルス決定器20と同様に動作する。h T[n]は: で定義される。ここで、Qはピッチ値である。理解されるように、遅い位置のパ ルストレインは典型的には殆どパルスを持たない。 式3のパルストレインインパルス応答自己相関は: となり、各サンプル位置1に対して、インパルス応答h T[n]と目標ベクト ルt[n]との間の相互相関r th[n]は: となる。 パルストレインシーケンス決定器89はパルスシーケンス決定器25と同様に 動作するが、決定器89はパルストレインシーケンスを生成する。 目標ベクトル一致器90は目標ベクトル一致器28と同様に動作 するが、一致器90はh[n]ではなくてパルストレインインパルス応答関数h T[n]を利用する。こうして、式8dは: となる。 パルストレインマルチパルス分析ユニット86の特別の動作は図6に示されて いる。そのステップは図2に示されたものと同等であるが、式は個々のパルスに ではなくパルストレインに作用する。こうして、式9において、パルストレイン インパルス応答h T[n]はQステップ毎にパルスを持つものとして定義され る。より遅い位置におけるパルストレインは典型的には殆どパルスを持たない。 残りの式はそれらがインパルス応答h T[n]に付いて作用することを除き 同様である。 所望であれば、利得範囲決定器22により決定される利得範囲は唯一の利得指 標を持つことができる。この実施例においては、パルストレインマルチパルス分 析ユニット86は、最初のパルストレインシーケンスの利得レベルを持つパルス トレインシーケンスを決定する。この実施例においては、目標ベクトル一致器9 0は動作せず、利得レベルセレクタ24およびパルストレインシーケンス決定器 89の動作の繰り返しもない。 目標ベクトル一致器29および90の出力は比較できることがさらに理解され るであろう。これは図7に示されており、これを参照する。一致器29および9 0の出力信号は、シーケンスとグローバル基準を表しているが、出力ライン38 および94に沿って比較器100に与えられる。比較器100は一致器28およ び90からのグローバル基準GC joptを比較して最低のものを選択する。 結果的なシーケンス、パルス又はパルストレインを表す出力信号は 出力ライン102に沿って与えられる。 図1、5および7のシステムはディジタル信号処理チップ上に又はソフトウエ ア内で実現できることが理解されるであろう。1実施例においては、ソフトウエ アはプログラム言語C++で書かれ、他の実施例ではアセンブリ言語で書かれた。 本発明は上に特定的に示され記載されたものに限定されないことは当業者に理 解されるであろう。むしろ、本発明の範囲は以下の請求の範囲によってのみ規定 される。
【手続補正書】特許法第184条の7第1項 【提出日】1995年10月2日 【補正内容】 1.入力ラインおよび出力ラインに接続されており、前記入力ライン上の入力 音声信号に応答して、前記入力音声信号の短期特性を発生する短期アナライザと 、 少なくとも前記入力音声信号と、オプションとして前記短期特性とから目標ベ クトルを生成する目標ベクトル発生器と、 前記目標ベクトル発生器の出力ラインに接続されており、複数の、等しい振幅 の複数のシーケンスと、可変符号で、可変スペースのパルスとを生成するマルチ パルス分析器であって、前記シーケンスの各々は異なる振幅値を有し、各シーケ ンス内の前記パルスの各々は等しい振幅を有するが可変符号を有し、前記マルチ パルス分析器は、最大確度基準にしたがって、最も近く前記目標ベクトルを表し ている、等しい振幅で、可変符号で、可変スペースのパルスのシーケンスに対応 する信号を出力するものと、 を備える音声処理システム。 2.入力音声信号について線形予測係数分析を利用して短期特性を発生する短 期アナライザを含む音声処理システムであって、 前記入力音声信号と、オプションとして前記短期特性とから目標ベクトルを生 成する目標ベクトル発生器と、 前記目標ベクトルと前記短期特性とに基づいて、マルチパルス分析技術にした がって最初のパルスの位置を決定する最初のパルス位 置決定器と、 前記最初のパルスの振幅と前記振幅の絶対値のまわりにグループ化された量子 化された振幅レベルの範囲との両方を決定する振幅範囲決定器と、 所定のステップの大きさにしたがって量子化された振幅レベルの前記範囲を通 してステップさせる振幅レベルセレクタであって、各ステップで選択された量子 化された振幅を出力するものと、 前記選択された量子化振幅に基づいて、等しい振幅で、可変符号で、可変スペ ースの前記目標ベクトルに対応するパルスを生成するパルスシーケンス決定器と 、 等しい振幅で、可変符号で、可変スペースパルスの前記シーケンスと前記目標 ベクトルとの間の一致の質に対応するエラーベクトルを決定し、前記選択された 振幅の各々に対する前記エラーベクトルを決定し、最小エラーベクトルに対応す る等しい振幅で、可変符号で、可変スペースパスルの前記シーケンスを出力する 目標ベクトル一致器と、を具備する音声処理システム。 3.等しい振幅で、可変符号で、可変スペースパルスの前記シーケンスの各々 は同一のサンプル位置に配置されている、請求の範囲第2項記載のシステム。 4.前記目標ベクトル一致器はグローバル基準決定器を含み、前記グローバル 基準決定器は等しい振幅で、可変符号で、可変スペースパルスの前記シーケンス をフィルタリングするパーセプチュアル・ウエイティング・フィルタと前記エラ ーベクトル内のエネルギー量を決定する決定器とを含み、前記選択された量子化 振幅の各々に対して、前記エラーベクトルは前記目標ベクトルと前記フィルタの 出力との間の差として定義され、前記パーセプチュアル・ウエイティング・フィ ルタは短期特性に対応する特性を有するようにした、 請求の範囲第2項記載のシステム。 5.入力音声信号から線形予測係数分析を利用して短期特性を発生する短期ア ナライザを含み、入力音声信号から長期特性と音声のピッチ値を決定する長期ア ナライザを含む音声処理システムであって、 少なくとも前記入力音声信号と、オプションとして前記短期特性とから目標ベ クトルを生成する目標ベクトル発生器と、 前記目標ベクトルと、前記短期特性と、前記ピッチ値とに基づいて、マルチパ ルス分析技術にしたがって最初のパルストレインの位置を決定する最初のパルス トレイン位置決定器と、 前記目標ベクトルに対応し、等しい振幅で、均一スペースパルスの複数の可変 符号トレイン生成するパルストレインシーケンス決定器であって、前記トレイン 内の前記パルスはピッチ値に対応するパルススペーシングを有し、各トレイン内 の前記パルスは同一符号を有し、前記トレインの全ての前記パルスは同一の振幅 レベルを有するようにしたものと、 を具備する、音声処理システム。 7.入力ラインおよび出力ラインに接続されており、前記入力ライン上の入力 音声信号に応答して、前記入力音声信号の少なくともピッチ値を含む長期特性を 発生する長期アナライザと、 入力ラインおよび出力ラインに接続されており、前記入力ライン上の入力音声 信号に応答して、前記入力音声信号の短期特性を発生する短期アナライザと、 少なくとも前記入力音声信号と、オプションとして前記短期および長期特性と から目標ベクトルを生成する目標ベクトル発生器と、 前記目標ベクトル発生器の出力ラインに接続されており、等しい振幅で均一ス ペースパルスの可変符号トレインの複数のシーケンス を発生するパルストレインマルチパルス分析器であって、各トレイン内の前記パ ルスは同一の符号を有し、パルスのトレインの前記シーケンスの各々は異なる振 幅を有し、前記パルストレインマルチパルス分析器は、最大確度基準にしたがっ て前記目標ベクトルを最も近く表している、等しい振幅の、均一スペースパルス の複数のトレインに対応する信号を出力するものと、を備える音声処理システム 。 8.前記パルスのトレインの各々内の前記パルスの各々は前記ピッチ値により 互いに離れている、請求の範囲第7項記載のシステム。 9.前記トレインのシーケンスの各々の最初のトレインの最初のパルスは同一 のサンプル位置に配置されている、請求の範囲第7項記載のシステム。 10.入力音声信号から線形予測係数分析を利用して短期特性を発生する短期 アナライザを含み、入力音声信号から音声のピッチ値を含む長期特性を決定する 長期アナライザを含む音声処理システムであって、 前記入力音声信号と、オプションとして前記短期特性とから目標ベクトルを生 成する目標ベクトル発生器と、 前記目標ベクトルと、前記短期特性と、前記ピッチ値とに基づいて、マルチパ ルス分析技術にしたがって最初のパルストレインの位置を決定する最初のパルス トレイン位置決定器と、 前記最初のパルストレインの振幅と前記振幅の絶対値のまわりにグループ化さ れた量子化された振幅レベルの範囲との両方を決定する振幅範囲決定器と、 所定のステップの大きさにしたがって量子化された振幅レベルの前記範囲を通 してステップさせる振幅レベルセレクタであって、各 ステップで選択された量子化された振幅を出力するものと、 前記選択された量子化振幅の各々に対して、前記目標ベクトルに対応し、等し い振幅で、均一スペースパルスの複数の可変符号トレイン生成するパルストレイ ンシーケンス決定器であって、前記トレイン内の前記パルスはピッチ値に対応す るパルススペーシングを有し、各トレイン内の前記パルスは同一符号を有し、パ ルスの各トレイン内の前記パルスは同一の振幅レベルを有し、前記等しい振幅は 前記選択された量子化振幅に対応しているようにしたものと、 等しい振幅で、均一スペースパルスの可変符号トレインの前記複数のシーケン スと前記目標ベクトルとの間の一致の質に対応するエラーベクトルを決定し、前 記選択された量子化振幅の各々に対する前記エラーベクトルを決定し、最小エラ ーベクトルに対応する等しい振幅で、同一符号で、均一スペースパスルのトレイ ンの前記シーケンスを出力する目標ベクトル一致器と、を具備する音声処理シス テム。 11.前記目標ベクトル一致器はグローバル基準決定器を含み、前記グローバ ル基準決定器は等しい振幅で、均一スペースのパルスの前記複数の可変符号トレ イン符号をフィルタリングするパーセプチュアル・ウエイティング・フィルタと 、前記エラーベクトル内のエネルギー量を決定する決定器とを含み、前記選択さ れた量子化振幅の各々に対して、前記エラーベクトルは前記目標ベクトルと前記 フィルタの出力との間の差として定義され、前記パーセプチュアル・ウエイティ ング・フィルタは短期特性に対応する特性を有するようにした、請求の範囲第1 0項記載のシステム。 13.前記目標ベクトル発生器の出力ラインに接続されており、等しい振幅で 、可変符号で、可変スペースのパルスの複数のシーケンスを生成するマルチパル ス分析器であって、前記シーケンスの各 々は異なる振幅値を有し、各シーケンス内の前記パルスの各々は等しい振幅を有 するが可変符号を有し、前記マルチパルス分析器は、最大確度基準にしたがって 、最も近く前記目標ベクトルを表している、等しい振幅で、可変符号で、可変ス ペースのパルスのシーケンスに対応する信号を出力するものを更に備えている、 請求の範囲第7項記載のシステム。 14.入力音声信号の短期特性を決定し、 少なくとも前記入力音声信号と、オプションとして前記短期特性とから、目標 ベクトルを生成し、 前記目標ベクトルと前記短期特性とに基づいて、マルチパルス分析技術にした がって最初のパルスの位置を決定し、 前記最初のパルスの振幅と前記振幅の絶対値のまわりにグループ化された量子 化振幅レベルの範囲とを決定し、 所定のステップサイズにしたがって量子化振幅レベルの範囲にわたってステッ プさせ、各ステップで選択された量子化振幅を出力し、 前記選択された量子化振幅に基づいて、前記目標ベクトルに対応し、等しい振 幅で、可変符号で可変スペースのパルスのシーケンスを生成し、 前記等しい振幅で、可変符号で、可変スペースのパルスの各シーケンスを前記 目標ベクトルと比較し、そして 最大確度基準にしたがって、前記目標ベクトルを最も近く表している前記等し い振幅で、可変符号で、可変スペースのパルスの前記シーケンスを選択する、 というステップを備える、音声処理方法。 15.等しい振幅で、可変符号で、可変スペースのパルスの前記シーケンスの 各々の最初のパルスは同一のサンプル位置に配置され る、請求の範囲第14項記載の方法。 16.前記比較のステップは、 等しい振幅で、可変符号で、可変スペースのパルスの前記シーケンスを、その 特性が前記短期特性であるパーセプチュアル・ウエイティング・フィルタを介し てフィルタリングし、そして 各量子化振幅レベルに対して、エラーベクトル内のエネルギー量を前記目標ベ クトルと前記フィルタの出力との間の差として決定する、 というステップを含む、請求の範囲第14項記載の方法。 18.入力音声信号の短期特性を決定し、 前記入力音声信号の少なくともピッチ値を含む前記入力音声信号の長期特性を 決定し、 少なくとも前記入力音声信号と、オプションとして前記短期および長期特性と から、目標ベクトルを生成し、 前記目標ベクトルと、前記短期特性と前記ピッチ値とに基づいて、マルチパル ス分析技術にしたがって、最初のパルストレインの位置を決定し、そして 前記目標ベクトルに対応する、等しい振幅で均一スペースのパルスの複数の可 変符号トレインを生成し、前記トレイン内の前記パルスは前記ピッチ値に対応す るパルススペースを有し、前記トレイン内の前記パルスは同一の振幅レベルを有 し、各トレイン内の前記パルスは同一の符号を有するようにする、 というステップを備える音声処理方法。 20.入力音声信号の短期特性を決定し、 前記入力音声信号の少なくともピッチ値を含む前記入力音声信号の長期特性を 決定し、 少なくとも前記入力音声信号と、オプションとして前記短期およ び長期特性とから、目標ベクトルを生成し、 前記目標ベクトルと、前記短期特性と前記ピッチ値とに基づいて、マルチパル ス分析技術にしたがって、最初のパルストレインの位置を決定し、 前記最初のパルスの振幅を前記振幅の絶対値のまわりにグループ化された量子 化レベルの範囲との両方を決定し、 所定のステップサイズにしたがって量子化振幅レベルの範囲にわたってステッ プさせ、各ステップで選択された量子化振幅を出力し、 各選択された量子化振幅に対して、前記目標ベクトルに対応する等しい振幅で 均一なスペースのパルスの複数の可変符号トレインを生成し、同一振幅を有する 前記パルスのトレイン内の前記パルスは前記ピッチ値に対応するパルススペース を有し、前記振幅は選択された量子化振幅に対応し、各トレイン内のパルスは同 一の符号を有するようにし、 等しい振幅で、均一なスペースのパルスの前記複数の可変符号トレインを前記 目標ベクトルと比較し、そして 最大確度基準にしたがって、前記目標ベクトルを最も近く表している、等しい 振幅で、均一なスペースのパルスの前記複数の可変符号トレインを選択する、 というステップを備える音声処理方法。 22.パルスのトレインの前記各シーケンスの最初のパルスは同一のサンプル 位置に配置される、請求の範囲第20項記載の方法。
───────────────────────────────────────────────────── フロントページの続き (81)指定国 EP(AT,BE,CH,DE, DK,ES,FR,GB,GR,IE,IT,LU,M C,NL,PT,SE),OA(BF,BJ,CF,CG ,CI,CM,GA,GN,ML,MR,NE,SN, TD,TG),AP(KE,MW,SD,SZ,UG), AM,AT,AU,BB,BG,BR,BY,CA,C H,CN,CZ,DE,DK,EE,ES,FI,GB ,GE,HU,IS,JP,KE,KG,KP,KR, KZ,LK,LR,LT,LU,LV,MD,MG,M N,MW,MX,NO,NZ,PL,PT,RO,RU ,SD,SE,SG,SI,SK,TJ,TM,TT, UA,UG,UZ,VN

Claims (1)

  1. 【特許請求の範囲】 1.入力ラインおよび出力ラインに接続されており、前記入力ライン上の入力 音声信号に応答して、前記入力音声信号の短期特性を発生する短期アナライザと 、 少なくとも前記入力音声信号から目標ベクトルを生成する目標ベクトル発生器 と、 前記目標ベクトル発生器の出力ラインに接続されており、各シリースが異なる 利得値を有する単一利得のパルスの多数のシリーズを生成し、出力に、前記目標 ベクトルを最も近く表している単一利得のシリーズを表す信号を与える最大確度 マルチパルス分析器と、 を備える音声処理システム。 2.前記最大確度マルチパルス分析器は、 前記目標ベクトルから利得の範囲を決定する利得範囲決定器と、 各シリーズは利得レベルの前記範囲内の前記利得レベルの1つの対応している 単一利得パルスの多数のシリーズを生成するパルスシーケンス決定器と、 前記シリーズの各々を前記目標ベクトルと照合し、出力ラインに、前記目標ベ クトルを最も近く表しているシリーズを表す信号を出力する目標ベクトル一致器 と、 を備える、請求の範囲第1項記載の音声処理システム。 3.前記パルスの多数のシリーズの各々の最初のパルスは同一のサンプル位置 にある、請求の範囲第1項記載のシステム。 4.前記目標ベクトル一致器は、その特性が前記短期特性であり、パルスシー ケンスをフィルタリングするパーセプチュアル・ウエイティング・フィルタを備 えるグローバル基準決定器と、各利得レベルに対して、前記目標ベクトルと前記 フィルタの出力との差とし て定義されたエラーベクトル内のエネルギー量を決定する決定器とを備える、請 求の範囲第2項記載のシステム。 5.前記利得範囲決定器は、最初のパルスの振幅を決定する手段と、前記振幅 のまわりの利得レベルの範囲を決定する手段とを備える、請求の範囲第1項記載 のシステム。 6.入力ライン及び出力ラインに接続されており、前記入力ライン上の入力音 声信号に応答して、少なくとも前記入力音声信号のピッチ距離を発生する長期ア ナライザと、 少なくとも前記入力音声信号から目標ベクトルを発生する目標ベクトル発生器 と、 前記目標ベクトル発生器の出力ラインに接続されているパルストレインマルチ パルス分析器であって、各パルストレインが単一利得パルスのシーケンスを備え るパルスシーケンスのシリーズを発生し、各々の単一利得パルスは前記シーケン ス内の前回のパルスから前記ピッチ距離だけ離れているサンプル位置にあり、ま た、出力に、前記目標ベクトルを最も近く表す単一利得パルストレインのシリー ズを表す信号を与えるものと、 を備える音声処理システム。 7.前記パルストレインのシリーズは異なる符号を有する、請求の範囲第6項 記載のシステム。 8.入力ライン及び出力ラインに接続されており、前記入力ライン上の入力音 声信号に応答して、少なくとも前記入力音声信号のピッチ距離を発生する長期ア ナライザと、 前記入力ラインおよび出力ラインに接続されており、前記入力ライン上の入力 音声信号に応答して、前記入力音声信号の短期特性を発生する短期アナライザと 、 少なくとも前記入力音声信号から目標ベクトルを生成する目標ベ クトル発生器と、 前記目標ベクトル発生器の出力ラインに接続されており、各シリースが異なる 利得値を有する単一利得のパルストレインの多数のシリーズを生成し、出力に、 前記目標ベクトルを最も近く表している単一利得のパルストレインのシリーズを 表す信号を与える最大確度パルストレインマルチパルス分析器と、 を備える音声処理システム。 9.各パルストレインは、各々が前記シーケンス内の前回のパルスから前記ピ ッチ距離だけ離れているサンプル位置にある単一利得パルスのシーケンスを備え ている、請求の範囲第8項記載のシステム。 10.前記パルストレインの多数のシリーズの各々の最初のパルスは同一サン プル位置で開始する、請求の範囲第8項記載のシステム。 11.前記最大確度パルストレインマルチパルス分析器は、 前記目標ベクトルから、利得の範囲を決定する利得範囲決定器と、 各シリーズが前記利得レベルの範囲内の前記利得の1つに対応する単一利得パ ルストレインの多数のシリーズを発生するパルストレインシーケンス決定器と、 前記シリーズの各々を前記目標ベクトルと照合し、出力ラインに、前記目標ベ クトルを最も近く表しているシリーズを表す信号を出力する目標ベクトル一致器 と、 を備える、請求の範囲第8項記載の音声処理システム。 12.前記目標ベクトル一致器は、その特性が前記短期特性であり、パルスシ ーケンスをフィルタリングするパーセプチュアル・ウエイティング・フィルタを 備えるフローバル基準決定器と、各利得 レベルに対して、前記目標ベクトルと前記フィルタの出力との差として定義され たエラーベクトル内のエネルギー量を決定する決定器とを備える、請求の範囲第 11項記載のシステム。 13.前記利得範囲決定器は、最初のパルスの振幅を決定する手段と、前記振 幅のまわりの利得レベルの範囲を決定する手段とを備える、請求の範囲第11項 記載のシステム。 14. 前記目標ベクトル発生器の出力ラインに接続されており、各シリース が異なる利得値を有する単一利得のパルスの多数のシリーズを生成し、出力に、 前記目標ベクトルを最も近く表している単一利得のシリーズを表す信号を与える 最大確度マルチパルス分析器と、 前記最大確度パルストレイン及び前記最大確度マルチパルス分析器の両方から の出力を受け取り、前記目標ベクトルに最もよく一致する出力を選択する比較器 と、 を備える請求の範囲第8項記載のシステム。 15.入力音声信号の短期間特性を決定し、 少なくとも前記入力音声信号から、目標ベクトルを発生し、 各々のシリーズが異なる利得レベルを有する、単一利得のパルスの多数のシリ ーズを発生し、 前記シリーズの各々を前記目標ベクトルとマッチングし、 前記目標ベクトルを最もよく表しているシリーズを選択する、 というステップを備える音声処理方法。 16.パルスの前記多数のシリーズの各々の最初のパルスは同一位置にある、 請求の範囲第15項記載の方法。 17.前記マッチングのステップは、 その特性が前記短期特性であるパーセプチュアル・ウエイティング・フィルタ を介してパルストレインシーケンスをフィルタリング し、 前記目標ベクトルと前記フィルタの出力との左として定義されるエラーベクト ル内のエネルギー量を、各利得レベルに対して決定する、 というステップを含む、請求の範囲第15項記載の方法。 18.前記第2の発生ステップは最初のパルス位置の振幅を決定し、前記振幅 のまわりの利得の範囲を決定するというステップを備える、請求の範囲第15項 記載の方法。 19.入力信号の少なくともピッチ距離を決定し、 少なくとも前記入力信号から目標ベクトルを決定し、 各パルストレインが単一利得パルスのシーケンスを備え、そのパルスの各々は 前記シーケンス内前回のパルスから前記ピッチ距離だけはなれているサンプル位 置にある、パルストレインのシリーズを発生する、 というステップを備える音声処理方法。 20.前記パルストレインのシリーズは異なる符号を有する、請求の範囲第1 9項記載の方法。 21.前記入力信号の短期特性を決定し、 前記入力信号の少なくともピッチ距離を決定し、 少なくとも前記入力信号から目標ベクトルを決定し、 各シリーズが異なる利得レベルを有する単一利得パルストレインの多数のシリ ーズを発生し、 前記シリースを前記目標ベクトルとマッチングし、 前記目標ベクトルを最も近く表しているパルストレインシリーズを選択する、 というステップを備える請求の範囲第19項記載の方法。 22.各パルストレインは、各々が前記シーケンス内の前回のパ ルスから前記ピッチ距離だけ離れている位置にある複数の単一利得パルスを備え る、請求の範囲第21項記載の方法。 23.前記多数のパルスのシリーズの各々の最初のパルスは同一のサンプル位 置にある、請求の範囲第21項記載の方法。 24.前記発生の第2のステップは最初のパルストレイン位置の振幅を決定し 、前記振幅のまわりの正及び負の利得の範囲を決定するというステップを備える 、請求の範囲第21項記載の方法。 25.各シリーズが異なる利得レベルを有する、単一利得パルスの多数のシリ ーズを発生し、 前記シリーズの各々を前記目標ベクトルとマッチングし、 前記目標ベクトルを最も近く表しているパルスシリーズを選択し、 前記目標ベクトルを最も近く表しているパルスシリーズとパルストレインシリ ーズの1つを選択する、 というステップを備えている請求の範囲第21項記載の方法。
JP7528321A 1994-04-29 1995-04-27 マルチパルス分析音声処理システムおよび方法 Expired - Lifetime JP3068196B2 (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US236,764 1994-04-29
US08/236,764 US5568588A (en) 1994-04-29 1994-04-29 Multi-pulse analysis speech processing System and method
US08/236,764 1994-04-29
PCT/US1995/005014 WO1995030222A1 (en) 1994-04-29 1995-04-27 A multi-pulse analysis speech processing system and method

Publications (2)

Publication Number Publication Date
JPH09512645A true JPH09512645A (ja) 1997-12-16
JP3068196B2 JP3068196B2 (ja) 2000-07-24

Family

ID=22890857

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7528321A Expired - Lifetime JP3068196B2 (ja) 1994-04-29 1995-04-27 マルチパルス分析音声処理システムおよび方法

Country Status (11)

Country Link
US (1) US5568588A (ja)
EP (1) EP0784846B1 (ja)
JP (1) JP3068196B2 (ja)
KR (1) KR100257775B1 (ja)
CN (1) CN1112672C (ja)
AU (1) AU683750B2 (ja)
BR (1) BR9507571A (ja)
CA (1) CA2189142C (ja)
DE (1) DE69521622T2 (ja)
RU (2) RU2121173C1 (ja)
WO (1) WO1995030222A1 (ja)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3094908B2 (ja) * 1996-04-17 2000-10-03 日本電気株式会社 音声符号化装置
CA2213909C (en) * 1996-08-26 2002-01-22 Nec Corporation High quality speech coder at low bit rates
JP3147807B2 (ja) * 1997-03-21 2001-03-19 日本電気株式会社 信号符号化装置
US7272553B1 (en) 1999-09-08 2007-09-18 8X8, Inc. Varying pulse amplitude multi-pulse analysis speech processor and method
SE0004818D0 (sv) * 2000-12-22 2000-12-22 Coding Technologies Sweden Ab Enhancing source coding systems by adaptive transposition
US7493258B2 (en) * 2001-07-03 2009-02-17 Intel Corporation Method and apparatus for dynamic beam control in Viterbi search
EP1513137A1 (en) * 2003-08-22 2005-03-09 MicronasNIT LCC, Novi Sad Institute of Information Technologies Speech processing system and method with multi-pulse excitation
BRPI0808202A8 (pt) * 2007-03-02 2016-11-22 Panasonic Corp Dispositivo de codificação e método de codificação.
KR101525185B1 (ko) 2011-02-14 2015-06-02 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 트랜지언트 검출 및 품질 결과를 사용하여 일부분의 오디오 신호를 코딩하기 위한 장치 및 방법
BR112012029132B1 (pt) 2011-02-14 2021-10-05 Fraunhofer - Gesellschaft Zur Förderung Der Angewandten Forschung E.V Representação de sinal de informações utilizando transformada sobreposta
JP5849106B2 (ja) 2011-02-14 2016-01-27 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 低遅延の統合されたスピーチ及びオーディオ符号化におけるエラー隠しのための装置及び方法
JP5625126B2 (ja) 2011-02-14 2014-11-12 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン スペクトル領域ノイズ整形を使用する線形予測ベースコーディングスキーム
PL3239978T3 (pl) * 2011-02-14 2019-07-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Kodowanie i dekodowanie pozycji impulsów ścieżek sygnału audio
CA2827249C (en) 2011-02-14 2016-08-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for processing a decoded audio signal in a spectral domain
EP2980799A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for processing an audio signal using a harmonic post-filter
CN110660396A (zh) * 2018-06-13 2020-01-07 江苏德新科智能传感器研究院有限公司 一种基于mems的语言处理系统及其方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4710959A (en) * 1982-04-29 1987-12-01 Massachusetts Institute Of Technology Voice encoder and synthesizer
NL8500843A (nl) * 1985-03-22 1986-10-16 Koninkl Philips Electronics Nv Multipuls-excitatie lineair-predictieve spraakcoder.
US5007094A (en) * 1989-04-07 1991-04-09 Gte Products Corporation Multipulse excited pole-zero filtering approach for noise reduction
DE69029120T2 (de) * 1989-04-25 1997-04-30 Toshiba Kawasaki Kk Stimmenkodierer
US5060269A (en) * 1989-05-18 1991-10-22 General Electric Company Hybrid switched multi-pulse/stochastic speech coding technique
US5293449A (en) * 1990-11-23 1994-03-08 Comsat Corporation Analysis-by-synthesis 2,4 kbps linear predictive speech codec
CA2084323C (en) * 1991-12-03 1996-12-03 Tetsu Taguchi Speech signal encoding system capable of transmitting a speech signal at a low bit rate

Also Published As

Publication number Publication date
BR9507571A (pt) 1997-08-05
CN1112672C (zh) 2003-06-25
EP0784846A1 (en) 1997-07-23
WO1995030222A1 (en) 1995-11-09
RU2121172C1 (ru) 1998-10-27
CA2189142C (en) 2001-06-05
JP3068196B2 (ja) 2000-07-24
US5568588A (en) 1996-10-22
DE69521622T2 (de) 2003-07-10
EP0784846A4 (ja) 1997-07-30
KR100257775B1 (ko) 2000-06-01
DE69521622D1 (de) 2001-08-09
CA2189142A1 (en) 1995-11-09
AU683750B2 (en) 1997-11-20
EP0784846B1 (en) 2001-07-04
CN1153566A (zh) 1997-07-02
AU2394895A (en) 1995-11-29
MX9605179A (es) 1998-06-30
RU2121173C1 (ru) 1998-10-27

Similar Documents

Publication Publication Date Title
US6427135B1 (en) Method for encoding speech wherein pitch periods are changed based upon input speech signal
US7702503B2 (en) Voice model for speech processing based on ordered average ranks of spectral features
US6836761B1 (en) Voice converter for assimilation by frame synthesis with temporal alignment
US7257535B2 (en) Parametric speech codec for representing synthetic speech in the presence of background noise
US5749073A (en) System for automatically morphing audio information
US5187745A (en) Efficient codebook search for CELP vocoders
JPH09512645A (ja) マルチパルス分析音声処理システムおよび方法
US7792679B2 (en) Optimized multiple coding method
EP0745971A2 (en) Pitch lag estimation system using linear predictive coding residual
JPH06266390A (ja) 波形編集型音声合成装置
US7643988B2 (en) Method for analyzing fundamental frequency information and voice conversion method and system implementing said analysis method
US4720865A (en) Multi-pulse type vocoder
JP2000515992A (ja) 言語コーディング
Ozawa et al. A study on pulse search algorithms for multipulse excited speech coder realization
CN1886783A (zh) 音频编码
Verfaille et al. Adaptive digital audio effects
JPH08305396A (ja) 音声帯域拡大装置および音声帯域拡大方法
EP0713208B1 (en) Pitch lag estimation system
JP3490325B2 (ja) 音声信号符号化方法、復号方法およびその符号化器、復号器
JP3471889B2 (ja) 音声符号化方法及び装置
JP3192051B2 (ja) 音声符号化装置
JP3074703B2 (ja) マルチパルス符号化装置
JP3103108B2 (ja) 音声符号化装置
JP2560860B2 (ja) マルチパルス型音声符号化及び復号化装置
JPH11119799A (ja) 音声符号化方法および音声符号化装置

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090519

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090519

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100519

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110519

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120519

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130519

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130519

Year of fee payment: 13

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term