JPH08511110A - オーディオ信号の圧縮/解凍装置及び圧縮/解凍方法 - Google Patents

オーディオ信号の圧縮/解凍装置及び圧縮/解凍方法

Info

Publication number
JPH08511110A
JPH08511110A JP7515650A JP51565095A JPH08511110A JP H08511110 A JPH08511110 A JP H08511110A JP 7515650 A JP7515650 A JP 7515650A JP 51565095 A JP51565095 A JP 51565095A JP H08511110 A JPH08511110 A JP H08511110A
Authority
JP
Japan
Prior art keywords
signal
residual
excitation signal
audio signal
compression
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
JP7515650A
Other languages
English (en)
Inventor
ビアリック、レオン
Original Assignee
ディーエスピー・グループ・インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ディーエスピー・グループ・インコーポレイテッド filed Critical ディーエスピー・グループ・インコーポレイテッド
Publication of JPH08511110A publication Critical patent/JPH08511110A/ja
Ceased legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/09Long term prediction, i.e. removing periodical redundancies, e.g. by using adaptive codebook or pitch predictor

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 特別なハードウェアを必要としない、音声圧縮/解凍システム及び音声圧縮/解凍方法が開示されている。圧縮ユニットは、入力オーディオ信号(19)を、複数の変数として表し、ここでこの複数の変数は、残余励起パルス列(27)と、1組のスペクトル係数(A)と、1組のピッチ変数(B及びC)からなる。解凍ユニットは、ピッチ変数と残余励起パルス列を用いて、再構成された励起信号を発生する。解凍ユニットは更に、スペクトル係数を用いて、再構成された励起信号をフィルタリングして音声波形を形成する。圧縮ユニットは、短期予測器(22)と、2ステップ長期予測器(24)と、マルチパルスアナライザ(26)とを有する。

Description

【発明の詳細な説明】 オーディオ信号の圧縮/解凍装置及び圧縮/解凍方法産業上の利用分野 本発明は音声信号の処理装置及び処理方法に関する。発明の背景 音声信号は複雑であり、話された言葉の要素、イントネーションのピッチ、及 び話し手に固有の他の要素に分解される。音声信号に含まれるいくつかの情報を 損なわずに音声信号をデジタル化するには、概ね8kHzの高いサンプリング周 波数が必要となる。従って、わずか数秒間の音声信号は、多量のサンプル値を有 する。 音声信号の伝達及び記憶を容易にするために、これまで音声信号の圧縮に関す る多くの努力がなされてきた。しかし、圧縮された信号は、元の音声信号の情報 を保持しなければならず、さもなければ、解凍された音声信号が、その音声信号 の聞き手(人間または電子計算機)に理解できないものとなる。典型的には、音 声信号は、音声信号を分解し、記憶または転送に対して「適切な」部分のみを利 用することによって圧縮される。 音声信号の聞き手が、音声の命令を聞き取りかつ音声の命令に応答する電子計 算機の場合、再生及び分解の質は高くなければならず、さもなければ電子計算機 が命令を理解できず、誤った応答をすることになる。 質の高い分解が必要なめに、さまざまな解析方法が開発 されてきたが、その何れもが、高い圧縮率と高品質の再生との理想的な組み合わ せを提供するものではなかった。これらの各方法は、概ね8サンプル長から24 0サンプル長の信号のフレームを処理するものである。 これらの方法のうちのある方法は、フレームのスペクトルを線形予測係数(L PC)として発生させる線形予測分解法、フレーム内の音声信号のピッチを求め るピッチ推定法、多様な信号波形を符号化し、予め決められた信号波形の組み合 わせとしてフレームを定義するベクトル量子化法、及び予め決められた数のスパ イクを有する空信号としてフレームを定義し、どこにスパイクが存在するかを求 めかつスパイクの大きさをマルチパルス解析法である。これらの方法、及び一般 に広く用いられているその他の方法は、Sadaoki Furuiによる「D igital Speech Processing,Synthesis a nd Recognition」(Marcel Dekker Inc.アメ リカ合衆国ニューヨーク州ニューヨーク市、1989年)に記載されている。こ の引用文献及びこの引用文献に記載された内容は、ここで言及したことによって 本出願の一部とされたい。 多くの方法に於いて、フレームを記述するために用いられるデータポイントの 数が多いほど、より良好な分解が行われる。しかし、分解の結果得られた信号の 圧縮率は低い。 更に、上述された解析方法は、大量の計算処理を実施し なければならないので、リアルタイムでまたはリアルタイムに近い状態で実実施 するためは、デジタル信号プロセッサ(DSP)などの特別なハードウェアを用 いなければならない。このような必要性のために、音声認識装置及びデジタル音 声再生装置は高価なものとなる。発明の概要 本発明、特別なハードウェアを必要としない音声信号圧縮/解凍装置及び音声 信号圧縮/解凍方法を提供する。 従って、本発明の実施例に基づけば、この装置は、入力オーディオ信号を、複 数の変数で表表現するオーディオ信号圧縮ユニットと、ピッチ変数及び残余励起 パルス列を用いて再構成された励起信号を発生し、スペクトル係数を用いて再構 成された励起信号をフィルタリングして音声波形を発生する解凍ユニットとを有 する。変数は、残余励起パルス列、1組のスペクトル係数、及び1組のピッチ変 数からなる。 更に、本発明に基づけば、解凍ユニットは、(a)残差励起信号を記憶してい るファーストイン・ファーストアウト(FISO)バッファと、(b)ピッチ変 数を用いて、記憶された残差励起信号の一部から再構成された励起信号を再構成 し、少なくとも残余励起パルス列から形成された残余励起信号と再構成された励 起信号を線型的に組み合わせて残差励起信号を形成し、残差励起信号をFISO バッファへ供給するセレクタと、(c)スペクトル係数によっ て残差励起信号をフィルタリングして音声波形を発生するフィルタとを有する。 解凍ユニットは、再構成された励起信号をFISOバッファに供給するバッファ 制御ユニットを更に含む。解凍ユニットは、音声波形をフィルタリングする後フ ィルタを更に含む。 更に、本発明に基づけば、圧縮ユニットは、(a)入力オーディオ信号に応答 し、8個のスペクトル係数を求め、かつそれらのスペクトル係数を用いて残差信 号を発生して、入力オーディオ信号の短期的な相関性をフィルタリングによって 除去する短期予測器と、(b)残差信号に作用し、大まかな推定値と、2次補正 値によって形成されたピッチ変数とを求め、ピッチ変数を用いて残余信号を形成 し、残余信号の長期的な相関性をフィルタリングして除去する2ステップ長期予 測器とを有する。圧縮ユニットは、残余信号から残余励起パルス列を発生させる マルチパルスアナライザを更に有する。ある実施例では、マルチパルスアナライ ザは、残余励起パルス列を表すための7個のパルスと、1つのゲインとを発生す る。 更に、本発明に基づけば、圧縮ユニットは、スペクトル係数、大まかなピッチ 推定値、2次補正値、ゲイン、及び残余励起パルス列からなる変数を符号化して 出力する符号化手段を含み、解凍ユニットは、符号化された変数を復合化するデ コーダを有する。 本発明の第2の実施例に基づけば、音声信号圧縮/解凍 装置は、(a)入力オーディオ信号に接続され、残余励起パルス列出力ラインと 、スペクトル係数出力ラインと、ピッチ変数出力ラインとを有するオーディオ信 号圧縮ユニットと、(b)残余励起パルス列入力ラインと、スペクトル係数入力 ラインと、ピッチ変数入力ラインと、音声波形出力ラインとを有する解凍ユニッ トとを有する。 更に、本発明の第2の実施例に基づけば、解凍ユニットは、(a)残差励起信 号を記憶しているファーストイン・ファーストアウト(FISO)バッファと、 (b)ピッチ変数を用いて、記憶された残差励起信号の一部から再構成された励 起信号を再構成し、少なくとも残余励起パルス列から形成された残余励起信号と 、再構成された励起信号とを線形的に組み合わせて残差励起信号を形成し、残差 励起信号をFISOバッファに供給するセレクタと、(c)スペクトル係数によ って動作し、残余励起信号をフィルタリングして音声波形を出力するフィルタと を有する。 本発明の方法は、本発明に基づく装置の構成要素の動作を実行する。図面及び資料の簡単な説明 本発明は、以下の添付の図面に関する後述される詳細な説明からより十分に理 解及び評価される。 第1図は、本発明の好適な実施例に基づいて構成され動作する、音声信号圧縮 及び解凍装置のブロック図である。 第2図は、第1図の装置の一部を構成する線形予測器の 動作を表すフローチャートである。 第3A図は、音声入力信号を表すグラフである。 第3B図は、ノイズ形成後の音声信号を表すグラフである。 第3C図は、短期的相関性及び長期的相関性が除去された後の音声信号のグラ フである。 第3D図は、第3B図の信号をモデリングした励起信号のグラフである。 第4A図は、第1図の装置の一部を構成する履歴バッファの模式図である。 第4B図は、第1図の装置の一部を構成する長期ピッチ予測器の動作を表すフ ローチャートである。 第5図は、第1図の装置の一部を構成するマルチパルスアナライザの動作を例 示するフローチャートである。 資料Aは、本発明の装置のある例を表現したプログラムを表している。好適実施例の詳細な説明 第1図には、本発明の圧縮/解凍装置がブロック図によって表されている。 本発明は典型的には、音声信号を圧縮する圧縮ユニット10と、圧縮された信 号を再構成する解凍ユニット12とを有し、この両ユニットは、特別なハードウ ェアが加えられていないパーソナルコンピュータ(PC)に制御されて動作して いる。圧縮ユニット10は複数の音声信号解析ユ ニットを含み、これらの音声解析ユニットのほとんどは、公称値よりも長い実行 時間を必要とする。一方、解凍ユニット12は、わずかな音声信号再構成ユニッ トのみを含み、これらの音声信号構成ユニットの内の1つのユニットのみが公称 実行時間よりも長い実行時間を必要とする。従って、解凍ユニット12は、新た に特別なハードウェアを追加せずに、パーソナルコンピュータの制御の元でリア ルタイムで動作できる。 本発明の装置は、後に再構成するために音声信号を記憶する必要のあるシステ ムでの有用性が高い。例えば、本発明の装置は、音声にデジタル的に記憶された 文字または映像のブロックを加えるマルチメディアシステムで有用性が高い。こ れらのシステムに対して、音声信号を記憶するために要する時間は、重要ではあ るが、決定的なものではない。しかし、音声は再構成されて人間の耳に提供され なければならないので、再構成はリアルタイムに行われなければならない。 本発明の装置を簡単に説明する。圧縮ユニット10は概ね、フレーマ20と、 短期予測フィルタ22と、2ステップ長期予測器24と、マルチパルスアナライ ザ26とを有する。フレーマ20は、入力デジタル信号を各々が概ね240のサ ンプルからなる複数の大型フレームに分解する。短期予測フィルタ22は、各大 型フレームのスペクトルエンベロープを定義するスペクトル係数を求め、このス ペク トル係数を用いて、各フレームをフィルタリングするためのノイズ形成フィルタ を形成する。その結果、以下の説明で「残差」信号と呼ばれ信号23が形成され る。 2ステップ長期予測器24は、始めに残差信号を解析し、大型フレームの平均 ピッチの粗推定値を求めるる。予測器24は、次に概ね60サンプルからなるサ ブフレーム内の音声信号のスペクトルの詳細な構造をモデリングする長期予測値 を求める。その結果形成されたモデリングされた波形は、サブフレーム内の信号 から減算され、以下の説明で「残余」信号と呼ばれる信号27が形成される。 マルチパルスアナライザ26は、複数の位置及び複数の量子化された大きさの パルス列によって残余信号の形状の特性を表す。このパルス列は、以下の説明で 「残余励起」パルス列と呼ばれる。 長期予測器24はまた、残余励起パルス列と長期予測器とを用いて、以下の説 明で「残差」励起信号と呼ばれる励起信号29を求める。残差励起信号は、残差 信号をモデリングする。 スペクトル係数、ピッチ推定値、長期予測値、及びパルス列は、常にではない が、概ね、それらを求めたユニットによって符号化されており、この符号化され た値は、解凍ユニット12に供給される。以下に詳しく説明されるように、この 符号化された値は、入力音声信号のフレームの大きさを8から10で減算した値 を表している。 解凍ユニット12は、概ね、デコーダ20、セレクタ31、履歴バッファ32 、LPC合成性ユニット34及び後フィルタ36を有する。デコーダ30は、圧 縮ユニット10から供給された符号化された値を復合化し、以下により詳しく説 明されるように、関連するユニット31乃至36へ復合化されたデータを供給す る。 経過バッファ32は、現時点まで前の残差励起信号を記憶し、セレクタ31は 復合化されたピッチ推定値と長期予測値とを用いて、履歴バッファ32の残差励 起信号の関連する部分を選択する。 前の残差励起信号のうちの選択された部分が、復合化された残余励起パルス列 に加えられ、その結果得られた値が、新たな残差励起信号として履歴バッファ3 2に記憶される。新たな残差励起信号は更に、LPC合成ユニット34に供給さ れ、このLPC合成ユニット34は、復合化されたスペクトル係数を用いて、音 声波形を生み出す。次に、後フィルタ36が復合化されたスペクトル係数を用い て波形を歪ませ、人間の耳に適した入力音声信号を再生する。 解凍ユニット12がマイクロプロセッサの最小の実行時間で残差励起信号を構 成できるように、圧縮ユニット10が変数を発生させることが高く評価される。 本発明の圧縮/解凍装置の動作が、本発明の圧縮/解凍装置の動作を理解する ために有効な第1図及び第2図乃至第5図を参照して以下に詳しく説明される。 特に注意した 部分を除いて、使用された方法は、既に参照された「Digital Spee ch Processing,Synthesis and Recognit ion」に記載されている。 図には示されていないが、本発明の装置の動作の前に、音声信号は、通常のア ナログ/デジタル(A/D)変換器のような任意の適切な通常の音声デジタル化 装置を用いて受け取られ、かつサンプリングまたはデジタル化される。 デジタル化された音声信号は、フレーマ20によって大型フレームに区分され る。例えば、ある実施例では、240個のデジタル化されたサンプルが、1つの 信号大型フレームを構成する。 フレーマ20からの各大型フレームは、順番に短期予測器22を通過する。短 期予測器22の線形予測ユニット40は、各大型フレーム内の信号のスペクトル エンベロープを決定する。短期予測器22のノイズ形成器42は、線形予測ユニ ット40によって求められたスペクトル係数を用いて、大型フレーム内の信号を フィルタリングし、この信号のエネルギーの相関性を除去し、この信号のノイズ の効果を低減する。 第2図は、線形予測ユニット40によって実施される方法のある実施例を例示 している。初めに、線形予測過程50では、大型フレームのデジタル信号が処理 され、大型フレームのスペクトルエンベロープを表す8個の線形予測係 数(LPC)が求められる。この処理を行うために、初めに、ハミング(Ham ming)ウインドウが各大型フレームに適用され、その後にリッジ(Ridg e)回帰法を用いて9個の自動相関係数が算出される。自動相関係数は、二項ウ インドウによって変形され、その後、シュー(Schur)帰納ユニットによっ て処理され、8個の線形予測係数が求められる。 従来技術では、10個から12個の線形予測係数が計算され、8個の係数では 、スペクトルエンベロープを正確に表現できないと考えられていたことが注意さ れる。従って、本発明の従来技術は、より少数の正確なLPCモデルによっても との信号を表現できることを見いだせなかった。 過程52では、線形予測係数LPCは、対応するパーカー(Parkor)係 数Kに変換される。次に浮動小数点形式のパーカー係数Kは、非線形スカラー量 子化器によって量子化され(過程54)、量子化されたパーカー係数Qとなる。 それぞれのパーカー係数の重要度は異なるので、以下に示すように合計で31ビ ットのそれぞれ異なるビット数に量子化される。 フレーマ20からの各大型フレームは、順番に短期予測器22を通過する。短 期予測器22の線形予測ユニット40は、各大型フレーム内の信号のスペクトル エンベロープを決定する。短期予測器22のノイズ形成器42は、線形予測ユニ ット40によって求められたスペクトル係数を用 いて、大型フレーム内の信号をフィルタリングし、この信号のエネルギーの相関 性を除去し、この信号のノイズの効果を低減する。 第2図は、線形予測ユニット40によって実施される方法のある実施例を例示 している。初めに、線形予測過程50では、大型フレームのデジタル信号が処理 され、大型フレームのスペクトルエンベロープを表す8個の線形予測係数(LP C)が求められる。この処理を行うために、初めに、ハミングウインドウが各大 型フレームに適用され、その後にリッジ回帰法を用いて9個の自動相関係数が算 出される。自動相関係数は、二項ウインドウによって変形され、その後シュー帰 納ユニットによって処理され、8個の線形予測係数が求められる。 従来技術では、10個から12個の線形予測係数が計算され、8個の係数では 、スペクトルエンベロープを正確に表現できないと考えられていたことが注意さ れる。従って、本発明の従来技術は、より少数の正確なLPCモデルによっても との信号を表現できることを見いだせなかった。 過程52では、線形予測係数LPCは、対応するパーカー係数Kに変換される 。次に浮動小数点形式のパーカー係数Kは、非線形スカラー量子化器によって量 子化され(過程54)、量子化されたパーカー係数Qとなる。それぞれのパーカ ー係数の重要度は異なるので、以下に示すように合計で31ビットのそれぞれ異 なるビット数に量子化され る。 次に、量子化されたパーカー係数Qは解凍ユニット12に転送される。ここで 「転送」は、信号の伝達または記憶を意味する。 圧縮ユニット10は、解凍ユニット12と等しい係数によって動作することが 望まれるので、過程56及び過程58(逆量子化及び逆パーカー変換)で、量子 化されたパーカー係数QはLPC′係数に変換される。逆量子化によって、量子 化された係数Qの値のみが求められる。適切な逆パーカー変換は、ダービン・レ ビンソン(Durbin−Levinson)ステップアップ回帰法によって行 われる。 過程60では、帯域幅の拡張が行われる。帯域幅の拡張によって、線形予測係 数LPC′によって決定されるフィルタの極を複素単位円の中心に向かってわず かに移動をするように、線形予測係数LPC′がわずかに変更される。この過程 60によって、スペクトルエンベロープの鋭く不自然なピークが滑らかとなり、 より現実に近いスペクトルが表現される。 サブフレーム平滑過程(過程62)では、隣接する大型フレームのための係数 の集合LPC′の間の変化が大きくなる可能性があるので、後に各大型フレーム が分割されて形成される複数のサブフレームの各々に対して、係数LPC″の集 合が決定される。例えば、各大型フレームは、等しい長さの4個のサブフレーム に分割される。第3のサブフレーム及び第4のサブフレームに対して、係数LP C″が、これらのサブフレームが属する大型フレームの係数LPC′と等しいこ とがある。第1のサブフレーム及び第2のサブフレームに対しては、現大型フレ ームの係数LPC′と、前大型フレームの係数LPC′との加重平均を用いて、 内装された係数LPC″が求めらる。ここで現大型フレームの係数LPC′には 、前大型フレームの係数LPC′の2倍の重み付けがされている。 次に、内装された係数LPC″に、逆ダービン・レビンソン回帰法のような適 切な方法を用いて、安定性の試験が行われる。安定性の試験方法は、必ずしも過 程58で用い られた方法の逆の方法でなくてもよいということは高く評価される。安定性の試 験によって、係数LPC″の各々の係数が不安定でと判定された場合、そのサブ フレームに対しては、そのサブフレームが属する大型フレームの元の(即ち内装 されていない)係数LPC″が用いられる。 上述されたスペクトル係数と等しい線形予測係数LPC″は、次に、圧縮ユニ ット10及び解凍ユニット12のその他の構成要素によって用いられる。 ノイズ形成器42は、人間のオーディオ信号に対する知覚、特に音声信号に関 する特性を考慮したものであることが好ましい、。従って、ノイズ形成器42は 、過程62によって求められた係数LPC″を用いたフィルタからなる。このフ ィルタでは、ノイズ形成器42の出力が人間によって知覚されたとき、入力信号 のノイズが音声信号によって最大限に遮断されるように、係数LPC″が調節さ れている。 例えば、この目的のための適切なフィルタの伝達関数は、 (1−Σaiz-i)/(1−Σaiαi-i) (式1) で表現され、ここで加算はiが1から8について行われ、aiは係数LPC″で あり、αは、概ね0.8の値の重み係数であり、z-1は、現在のサンプルからi 番だけ前の入力デジタル音声信号のサンプルである。 ノイズ形成器42は、概ね、(式1)によって表された伝達関数に基づいて音 声信号をフィルタリングする。その 結果、残余信号23が得られ、この残余信号は「目標ベクトル」として2ステッ プ長期予測器24に供給される。ここで、便宜上、信号及びこの信号を伝達する 信号線には等しい符号が付されている。 多くのフレームからなる入力音声信号19と、その対応する残差信号23の例 が第3A図及び第3B図に例示されている。これらの図からわかるように、音声 信号は、複数の反復性のスパイク64を有する。第3B図の残差信号23の対応 するスパイク66は、より小さい振幅を有する。 スパイク64は、概ね周期的であり、スパイク64の周波数は、音声の「ピッ チ」と呼ばれている。以下の説明では、ピッチは、任意の2つのスパイク64の 間のサンプルの数として定義される。ピッチは、時間の経過によって変化するの で、連続して求められなければならない。低ピッチメイルに対応する最大のピッ チの値は、概ね146サンプル長である。高ピッチフィーメイルに対応する最小 のピッチの値は、概ね20サンプル長である。 2ステップ長期予測器24(第1図)は概ね、フレーマ70と、ピッチ算出器 72及びその関連する第1過程を実施するための第1履歴バッファ74と、二次 履歴ピッチ予測器(抽出器)76及び関連する第2過程を実施するための第2履 歴バッファ78とを含む。 以下により詳しく説明されるように、フレーマ70は、大型フレームを、各々 が60サンプル長を有する4個の等 しいサブフレームに分割する。ピッチ算出器72は、大型フレームのピッチを大 まかに算出し、算出した大まかなピッチ値を符号化して解凍ユニット12に出力 する。ピッチ値は限定された範囲内にあるので、各大まかなピッチ算出値にはイ ンデックスが与えられ、選択されたインデックスの値は符号値を有する。 各サブフレームに対して、ピッチ予測器76は、大まかなピッチ算出値の近傍 でサーチを行い、2ステップ長期予測器の遅れ及びゲインを決定する。次に、ピ ッチ予測器76は、サブフレームの目標ベクトルに最も整合する信号または波形 を発生する。ピッチの値の遅れ及びゲインは符号化されて、解凍ユニット12へ 出力され、整合した波形は減算器79によって目標ベクトルから減算される。短 期的相関性及び長期的相関性が取り除かれた残余信号27が形成され、マルチパ ルスアナライザ26に供給される。 より詳しく説明すると、ピッチ算出器72は以下のように動作する。第1の履 歴パッファ74は、ファーストイン・ファーストアウト(FIFO)バッファか らなり、このFIFOバッファは、例えば146サンプルの期待される最大のピ ッチ長を有する。バッファ74には、前大型フレームからの残差信号が記憶され ている。大型フレームの目標ベクトルは、半分に分割され、分割された各々のベ クトルは履歴バッファ74に記憶されたデータと相関性を有する。半分に分割さ れた各ベクトルに対して最も大きな相関 性を提供するオフセットが、半分に分割された各ベクトルに対する大まかなピッ チ算出値RPITCHとして定義される。正規化された相関法などの、ピッチを 求めるために用いられる適切な相関法をピッチ算出器72で使用する。ピッチ算 出器72は、2つの大まかなピッチ算出値RPITCHを(126種類の可能な ピッチ長をカバーする)2つの7ビット変数として符号化し、ピッチ予測器76 にRPITCHを供給する。 ピッチ予測器76は、目標ベクトル(残余信号23)を処理し、ここで、ピッ チ予測器76は始めの2つのサブフレームに対しては第1の大まかなピッチ算出 値を用い、次の2つのサブフレームに対しては第2の大まかなピッチ算出値を用 いる。 第2の履歴バッファ78は146個のサンプルのFIFOバッファからなり、 以下により詳しく説明するように、前サブフレームからの残差励起信号を記憶し ている。ピッチ予測器76は二次予測器であり、大まかなピッチ算出器RPIT CHに比べてより正確なピッチの表現を決定する。ピッチの正確な表現を求める ために、ピッチ予測器76はサブフレームを処理し、最大のシフトが2サンプル 値である各方向に沿って数サンプル値だけ大まかなピッチ予測値RPITCHを 拡張または収縮する。即ち、第4A図に示されているように、ピッチ予測器76 は、履歴バッファ78の入力側79からRPITCH+Sの位置にあるサンプ ル値から始まるサブフレームを取り出す。ここでSは−2から2の範囲で変化す る。その結果、第1の残差励起信号ASが形成される。 更に、サンプリングが正確ではないので、内装が行われ、かつ内装をおこなう ために、ASと等しい長さであって、履歴バッファから1サンプル分だけ以前に シフトした第2の残差励起信号BSだけが取り出される。これらの処理は、第4 B図に例示されたピッチ予測器76によって行われる方法の第1の過程即ち過程 80を形成する。より詳しく説明すれば、可能なシフト即ちSの各々に対して、 残差励起信号As及びBsが第2の履歴バッファ78から取り出され、その後、過 程82で、これらの残差励起信号は、係数LPC″を用いて、ノイズ形成フィル タによって別個にフィルタリングされ、フィルタされた励起信号As′及びBs′ が形成される。 ピッチ予測器76は、ピッチの正確な値を求めるだけでなく、予め決められた 内装係数ck及びdkが与えられた最も良好な内装を決定する。ここでKは0から Nの範囲内で変化し、Nは概ね25である。係数CK及びDKは音声信号の大量の サンプルを解析することによって概ね実験から決定される。 次に、過程84では、ある実施例では各々のフィルタリングされた励起信号の セット、即ちAs′とBs′が、内装係数の各セットと線形的に組み合わされて、 内装された信 号が形成される。この実施例では、各々の内装された信号は、cks′+dKs ′として定義される。内装信号の各々は、任意の適切な内装法によって、サブフ レームの目標ベクトルと別々に関連づけられ(過程86)、その結果が記憶され る。 過程88では、最も高い相関性を有する内装された信号が選択される。各々の サブフレームに対するシフトS及びインデックスKの値が転送されるために符号 化される(過程90)。この実施例では、符号化された信号はシフトSの5種類 の可能な大きさ(−2〜+2)と組み合わされた25種類のckとdkの可能な組 み合わせから選択された1つの組み合わせを表す7ビットのインデックスである 。 過程92では、選択された組み合わせが再生される。より詳しくは、「長期予 測」励起信号Eが以下の式のように求められる。 E=cks+dks (式2) 過程94では、励起信号Eが、係数LPC″を用いたノイズ形成フィルタによ ってフィルタリングされる。ここでは「整合したベクトル」として例示されてい る結果的に形成されたベクトルが、減算器79によって目標ベクトルから減算さ れ、残余信号72が求められる。第3B図の残差信号23に対するこの残余信号 27の例が第3C図に表されている。長期的相関性及び短期的相関性は、こうし て残余信号23から除去されたことが注目される。この結果、 前入力音声信号に存在した何れの要素とも異なる信号の要素のみが残り、従って この信号は「残余」信号と呼ばれる。 サブフレームの寸法以下の大まかなピッチ値に対しては、履歴バッファ78の 最後のRPITCH+S番目のサンプルは、データのサブフレームを形成しない ことに注意するべきである。この場合、履歴バッファから取り出されたサンプル は、データのサブフレームを形成するために必要な回数だけ繰り返される。 マルチパルスアナライザ26は、サブフレームの長さの残余信号27と最もよ く整合するマルチパルス励起信号を決定する。言い換えれば、残余信号27は、 各々がサブフレーム内の異なる位置で発生する複数のインパルス応答の合計とし てモデリングされる。 第5図は、マルチパルスアナライザ26の動作を例示している。残余信号27 のエネルギーは、サブフレーム内の各サンプルの値を自乗したものの合計によっ て過程100で決定される。エネルギーの値は、量子化されたゲインの値からな り、この実施例では4ビットのインデックスからなるこの量子化されたゲインの 値のインデックスが伝達される。次に、過程102では、(サブフレーム内の各 サンプルをゲイン値によって除算することによって)残余信号27を正規化する ためにゲインが用いられ、第1の目標ベクトルが形成される。この第1の目標ベ クトルは後の多くの過程で利用される。 過程104では、係数LPC″がインパルス応答信号を生み出すために用いら れ、ここで、このインパルス応答信号は、サブフレームの第1サンプルの位置に 配置されたディラックのデルタ関数に対する、係数LPC″から形成されたノイ ズ形成フィルタの応答である。 本発明に基づけば、過程106では、目標ベクトルは、適切な相関技術によっ て、大きさAMP1、AMP2、AMP3及びAMP4のうちの1つを有しかつ 任意の可能なサンプル点に配置されたパルスとの間に相関関係を与えられる。あ る実施例では、AMP1、AMP2、AMP3及びAMP4は、±0.25及び ±0.75の値を有する。各パルスは、選択されたサンプル点にシフトされかつ 選択された大きさを有するインパルス応答関数から形成されている。 過程108では、目標ベクトルと最もよく整合するパルスが選択され、その大 きさ及び位置が記憶される。過程110では、選択されたパルスの波形が形成さ れ、過程112では、選択されたパルスの波形が目標ベクトルから減算され、新 たな目標ベクトルが形成される。 過程106から過程112は、各サブフレームに対して複数回実施される。あ る実施例では、過程106から過程112は7回実施され、ここで3回の繰り返 しがサブフレームの下半分に配置されたパルスに対して実施され、残りの4回の 繰り返しがサブフレームの上半分に配置されたパ ルスに対して実施される。 その結果記憶された異なる大きさのパルス列は、残余励起パルス列を形成する 。最後に、過程114では、パルスの位置とパルスの大きさが符号化され、解凍 ユニット112に伝達される。ある実施例では、各パルスの4通りの可能な大き さを表すために2ビットが用いられ、サブフレームの上半分の4個のパルスの可 能な位置を表すために18ビットが用いられ、サブフレームの下半分の3個のパ ルスの可能な位置を表すために15ビットが用いられる。即ち、この実施例では 、7×2+18+15=47ビットが、サブフレーム毎に用いられ、残余励起パ ルス列を符号化する。 残余励起パルス列は、選択された位置にパルスを配置することによって、残余 励起信号として形成され、ここで、各パルスには対応する大きさ及びゲインが乗 算されている。次に、残余励起信号が加算器120(第1図)に供給され、ピッ チ予測器76によって形成された長期予測励起信号E(第4B図)に加算される 。その結果形成された残余励起信号29は、第3D図に例示されているように、 第2の履歴バッファ78に供給され、バッファ78に記憶されていたデータをシ フトし最も古いサブフレームをバッファから除去する。 各大型フレームは以下に示すように、277ビットに圧縮される。 量子化されたパーカー係数Qを表す31ビット、 大まかなピッチ値を表す7×2ビット、 シフトS及びインデックスKを表す7×4ビット、 ゲインを表す4×4ビット、 残余励起パルス列を表す47×4ビット。 各大型フレームが240サンプルからなり各サンプルが8ビットからなる入力 音声信号に対して、本発明は約8対1の圧縮率を表す。 解凍ユニット12のデコーダ30(第1図)は、符号化された変数を受け取り 、かつ復号化する。大まかなピッチ算出値及び正確なピッチ算出値と、ゲインと 、残余励起パルス列に対して、デコーダ30はルックアップテーブルの符号化さ れた値を検索する。ルックアップテーブルは、受け取られたインデックスと符号 化された値とを関連付けている。 パーカー係数Qに対して、符号化過程は、線形予測法の過程56から過程62 (第2図)を実施し、圧縮ユニット10で利用された係数と等しいスペクトル係 数LPC″を形成する。 解凍ユニット12の選択器31は、履歴バッファ32の入力端からRPITC H+S個のサンプルだけ離れた復号化されたサンプルから始めて、履歴バッファ 32(以下に説明されるように記憶されている)から第1の残差励起信号ASを 取り出す。履歴バッファ内で1サンプル分だけ早い位置にシフトされている第2 の残差励起信号BSもまた取り 出される。残差励起信号As及びBsは、ピッチ予測器76で選択された残差励起 信号と等しい。 セレクタ31は、復号化されたCK及びDKを用いて、上述された式2に定義さ れたように長期予測励起信号Eを形成する。加算器122(第1図)で、新たな 残差励起信号123が、長期予測励起信号Eと、選択された位置にパルスを配置 することによって形成された残余励起信号とを加えることによって生み出され、 ここで各パルスはその対応する大きさとゲインとが乗算されている。次に、残差 励起信号123は、LPC合成フィルタ34によってフィルタリングされ、この フィルタリングされた信号は更に後フィルタ36によってフィルタリングされる 。新たな残差励起信号123が履歴バッファ32の始めの部分に入力され、履歴 バッファ32に記憶されていたデータをシフトし、最も古いサブフレームを履歴 バッファ32から除去する。 LPC合成フィルタ34の伝達関数は、 1/(1+Σaiz-i) (式3) である。 後フィルタ36の伝達関数は、 (1+ΣaiGi-i(1−K1)/(1+Σaiβi-i) (式4) である。ここで、aiは係数LPC″であり、Gは概ね0.55であり、βは概 ね0.55であり、K1は第1パーカー係数である。 こうして、入力オーディオ信号を近似した再構成された信号がリアルタイムで 形成される。 資料Aは、本出願の一部をなすものであり、本発明の圧縮/解凍装置の例示的 なアセンブリ言語を表している。このアセンブリ語は、アメリカ合衆国インテル 社によって製造された80386マイクロプロセッサを備えたパーソナルコンピ ュータによって動作する。この装置は、より強力なマイクロプロセッサを備えた パーソナルコンピュータによっても動作する。 本発明が、これまで例示され説明された発明に限定されるものでないことは当 業者には明らかであろう。本発明の技術的視点は、添付の請求の範囲によって定 義される。
【手続補正書】特許法第184条の7第1項 【提出日】1995年6月30日 【補正内容】請求の範囲 1.オーディオ信号の圧縮/解凍装置であって、 入力オーディオ信号を、予め決められた複数の振幅から選択された制限された 振幅を各々が備えた残余励起パルス列からなる複数の変数と、1組のスペクトル 係数と、大まかなピッチ算出値と前記大まかなピッチ算出値の二次補正値とから なる1組のピッチ変数とに圧縮するオーディオ信号圧縮ユニットと、 前記ピッチ変数と前記残余励起パルス列とから残差励起信号を形成し、前記残 差励起信号を前記スペクトル係数によってフィルタリングし音声信号を形成する 解凍ユニットとを有することを特徴とするオーディオ信号圧縮/解凍装置。 2.前記解凍ユニットが、 残差励起信号を記憶するためのFIFO(ファーストイン・ファーストアウト )バッファと、 前記ピッチ変数をポインタとして用いて、前記記憶された残差励起信号の一部 を選択し、前記記憶された残差励起信号の前記一部から再構成された励起信号を 再構成し、前記再構成された励起信号と、少なくとも前記残余励起パルス列から 形成された残余励起信号とを線形的に組み合わせ残差励起信号を形成し、前記残 差励起信号を前記FIFOバッファに記憶するセレクタと、 その変数として前記スペクトル係数を有し、前記残差励 起信号をフィルタリングして前記音声波形を形成するフィルタとを有することを 特徴とする請求項1に記載のオーディオ信号の圧縮/解凍装置。 3.前記解凍ユニットが、前記音声波形をフィルタリングする後フィルタを更に 有することを特徴とする請求項1に記載のオーディオ信号の圧縮/解凍装置。 4.前記圧縮ユニットが、 前記入力オーディオ信号に応答し、その変数としてスペクトル係数を備えたフ ィルタを形成するべく8個のスペクトル係数を決定し、前記フィルタによって前 記入力オーディオ信号から短期的相関性をフィルタリングして除去し、残差信号 を形成する短期予測器と、 前記残差信号を受け取り、前記ピッチ変数を決定し、前記ピッチ変数を用いて 前記残差信号をフィルタリングして長期的相関性を除去し、残余信号を形成する 2ステップ長期予測器とを有することを特徴とする請求項1に記載のオーディオ 信号圧縮/解凍装置。 5.前記圧縮ユニットが、 前記残余信号から前記残余励起パルス列を形成するための振幅の限定されたマ ルチパルスアナライザを更に有することを特徴とする請求項4に記載のオーディ オ信号圧縮/解凍装置。 6.前記マルチパルスアナライザが、7個の振幅が制限されたパルスと、ゲイン とを形成し、前記残余励起パルス列 を表すことを特徴とする請求項5に記載のオーディオ信号圧縮/解凍装置。 7.前記圧縮ユニットが、 前記スペクトル係数と、前記大まかなピッチ算出値と、前記二次補正値と、前 記残余励起パルス列及びゲインとを、前記短期予測器と、前記2ステップ長期予 測器と、前記マルチパルスアナライザとから各々受け取り、かつ前記変数を符号 化する符号化手段を有し、 前記解凍ユニットが、 前記符号化された変数を解凍し前記変数から前記音声波形を形成する前に、前 記符号化された変数を復合化するデコーダを有することを特徴とする請求項5に 記載のオーディオ信号圧縮/解凍装置。 8.オーディオ信号解凍ユニットであって、 8個のスペクトル係数と、大まかなピッチ算出値と前記大まかなピッチ算出値 の二次補正値とからなる1組のピッチ変数と、振幅の制限された残余励起パルス 列とを受け取るための受容ユニットと、 残差励起信号を記憶するためのFIFO(ファーストイン・ファーストアウト )バッファと、 前記ピッチ変数をポインタとして用いて、前記記憶された残差励起信号の一部 を選択し、前記記憶された残差励起信号の前記一部から再構成された励起信号を 再構成し、前記再構成された励起信号と、少なくとも前記残余励起パル ス列から形成された残余励起信号とを線形的に組み合わせて、残差励起信号を形 成し、前記残差励起信号をFIFOバッファに記憶するためのセレクタと、 前記スペクトル係数によって、前記残差励起信号をフィルタリングして前記音 声波形を形成するフィルタとを有することを特徴とするオーディオ信号解凍ユニ ット。 9.前記解凍ユニットが、前記音声波形をフィルタリングする後フィルタを更に 有することを特徴とする請求項8に記載のオーディオ信号解凍ユニット。 10.オーディオ信号圧縮/解凍方法であって、 入力オーディオ信号を、予め決められた複数の振幅から選択された制限された 振幅を有する残余励起パルス列と、1組のスペクトル係数と、大まかなピッチ算 出値及び前記大まかなピッチ算出値の二次補正値とからなる1組のピッチ変数と からなる複数の変数に圧縮する過程と、 前記ピッチパラメータと、前記振幅の制限された残余励起パルス列とから残差 励起信号を形成する過程と、 前記スペクトル係数を用いて前記残差励起信号をフィルタリングし、音声波形 を形成する過程とを有することを特徴とするオーディオ信号圧縮/解凍方法。 11.前記残差励起信号を形成する過程が、 前記ピッチ変数をポインタとして用いて、記憶された残差励起信号の一部を選 択する過程と、 前記記憶された残差励起信号の前記一部から、再構成さ れた励起信号を再構成する過程と、 前記再構成された励起信号を、少なくとも前記残余励起パルス列から形成され た残余励起信号と線形的に組み合わせ、残差励起信号を形成する過程と、 前記残差励起信号を前記FIFOバッファに記憶する過程とを有することを特 徴とする請求項10に記載のオーディオ信号圧縮/解凍方法。 12.前記残差励起信号を前記FIFOバッファに伝達する過程を更に有するこ とを特徴とする請求項11に記載のオーディオ信号圧縮/解凍方法。 13.前記音声波形をフィルタリングする後フィルタリング過程を更に有するこ とを特徴とする請求項10に記載の音声信号圧縮/解凍方法。 14.前記圧縮過程が、 8個のスペクトル係数を決定する過程と、 その変数として前記スペクトル係数を備えたフィルタを形成する過程と、 前記フィルタを用いて前記入力オーディオ信号をフィルタリングして短期的な 相関性を除去し、残差信号を形成する過程と、 前記残差信号から前記ピッチ変数を決定する過程と、 前記ピッチ変数を用いて前記残差信号をフィルタリングして長期的な相関性を 除去し、残余信号を形成する過程とを有することを特徴とする請求項10に記載 のオーディオ 信号圧縮/解凍方法。 15.前記圧縮過程が、 振幅の制限されたマルチパルス解析を前記残余信号に対して実施し、前記残余 励起パルス列を形成するマルチパルス解析過程を更に有することを特徴とする請 求項14に記載のオーディオ信号圧縮/解凍方法。 16.前記マルチパルス解析過程が、前記残余励起パルス列の表現として、7個 のパルスとゲインとを形成することを特徴とする請求項15に記載のオーディオ 信号圧縮/解凍方法。 17.前記圧縮過程が、 前記スペクトルと、前記大まかなピッチ算出値と、前記二次補正値と、前記残 余励起パルス列及びゲインとを符号化する過程を有し、 前記残差励起信号を形成する過程が、前記符号化された変数を復号化する過程 を有することを特徴とする請求項14に記載のオーディオ信号圧縮/解凍方法。 18.オーディオ信号の圧縮/解凍装置であって、 入力オーディオ信号を受け取り、残余励起パルス列出力ラインと、スペクトル 係数出力ラインと、ピッチ変数出力ラインとを備え、前記入力オーディオ信号を 、複数のスペクトル係数と、大まかなピッチ算出値及び前記大まかなピッチ算出 値の二次補正値からなる複数のピッチ変数と、予め決められた複数の振幅から選 択された制限された振幅を 有する残余励起パルス列とに圧縮するオーディオ信号圧縮ユニットと、 残余励起パルス列入力ラインと、スペクトル係数入力ラインと、ピッチ変数入 力ラインと、音声波形出力ラインとを備え、前記ピッチ変数と、前記残余励起パ ルス列とから残差励起信号を形成し、前記残差励起信号を前記スペクトル係数に よってフィルタリングし、音声波形を形成する解凍ユニットとを有することを特 徴とするオーディオ信号圧縮/解凍装置。 19.前記解凍ユニットが、 残差励起信号を記憶するためのFIFO(ファーストイン・ファーストアウト )バッファと、 前記ピッチ変数に基づいて前記記憶された残差励起信号の一部を選択し、前記 記憶された残差励起信号の前記一部から前記再構成された励起信号を再構成し、 前記再構成された励起信号を、少なくとも前記残余励起パルス列から形成された 残余励起信号と線形的に組み合わせて、残差励起信号を形成し、前記残差励起信 号を前記FIFOバッファに記憶するセレクタと、 その変数として前記スペクトル係数を備え、前記残差励起信号をフィルタリン グして、前記音声波形を形成するフィルタとを有することを特徴とする請求項1 8に記載のオーディオ信号圧縮/解凍装置。 20.オーディオ信号圧縮/解凍装置であって、 入力オーディオ信号を、予め決められた複数の振幅から選択された制限された 振幅の残余励起パルス列と、1組のスペクトル係数と、1組のピッチ変数とから なる複数のパラメータに圧縮するオーディオ信号圧縮ユニットと、 前記ピッチ変数と、前記残余励起パルス列とから残差励起信号を形成し、前記 残差励起信号を前記スペクトル係数によってフィルタリングし、音声波形を形成 する解凍ユニットを有することを特徴とするオーディオ信号圧縮/解凍装置。 21.オーディオ信号圧縮/解凍装置であって、 残余励起パルス列と、1組のスペクトル係数と、大まかなピッチ算出値を有す る1組のピッチ変数とからなる複数の変数へ入力オーディオ信号を圧縮するため のオーディオ信号圧縮ユニットと、 前記ピッチ変数と、前記残余励起パルス列とから残差励起信号を形成し、前記 残差励起信号を前記スペクトル係数によってフィルタリングし、音声信号を形成 する解凍ユニットとを有することを特徴とするオーディオ信号圧縮/解凍装置。 22.振幅の制限されたマルチパルスアナライザであって、 入力信号のエネルギーを決定し、前記エネルギーのゲインを決定し、前記ゲイ ンで前記入力信号を正規化するエネルギー決定器と、 始めは前記正規化された入力信号と等しい目標ベクトル と、各パルスは全てのパルス位置に配置されかつ各パルス位置で制限された別個 の振幅を有する複数のパルスとに相関性を与え、前記目標ベクトルと最もよく整 合する前記パルスを選択し、前記目標ベクトルから前記パルスを除去し、新たな 目標ベクトルを形成するパルス決定器とを有することを特徴とする振幅の制限さ れたマルチパルスアナライザ。 23.振幅の制限されたマルチパルス解析を実施する方法であって、 入力信号のエネルギーを決定する決定過程と、 前記エネルギーからゲインを算出する算出過程と、 前記ゲインによって前記入力信号を正規化する正規化過程と、 始めに前記正規化された入力信号と等しい目標ベクトルと、各パルスは各パル ス位置に配置されかつ各位置で制限された複数の振幅を有する複数のパルスとに 相関性を与える相関性付与過程と、 前記目標ベクトルに最もよく整合した前記パルスを選択する選択過程と、 前記目標ベクトルから前記パルスを除去し、新たな目標ベクトルを形成する除 去過程と、 予め決められた回数だけ、前記相関性付与過程と、前記選択過程と、前記除去 過程とを繰り返す反復過程とを有することを特徴とする振幅の制限されたマルチ パルス解析を実施する方法。
───────────────────────────────────────────────────── フロントページの続き (81)指定国 EP(AT,BE,CH,DE, DK,ES,FR,GB,GR,IE,IT,LU,M C,NL,PT,SE),OA(BF,BJ,CF,CG ,CI,CM,GA,GN,ML,MR,NE,SN, TD,TG),AP(KE,MW,SD,SZ),AM, AT,AU,BB,BG,BR,BY,CA,CH,C N,CZ,DE,DK,EE,ES,FI,GB,GE ,HU,JP,KE,KG,KP,KR,KZ,LK, LT,LU,LV,MD,MG,MN,MW,NL,N O,NZ,PL,PT,RO,RU,SD,SE,SI ,SK,TJ,TT,UA,UZ,VN

Claims (1)

  1. 【特許請求の範囲】 1.オーディオ信号圧縮/解凍装置であって、 残余励起パルス列と、1組のスペクトル係数と、1組のピッチ変数とからなる 複数の変数によって入力オーディオ信号を表すオーディオ信号圧縮ユニットと、 前記ピッチ変数と、前記残余励起パルス列とを用いて、再構成された励起信号 を形成し、前記スペクトル係数を用いて前記再構成された励起信号をフィルタリ ングして音声波形を形成する解凍ユニットとを有することを特徴とするオーディ オ信号圧縮/解凍装置。 2.前記解凍ユニットが、 残差励起信号を記憶するFIFO(ファーストイン・ファーストアウト)バッ ファと、 前記ピッチ変数を用いて、前記記憶された残差励起信号の一部から前記再構成 された励起信号を再構成し、前記再構成された励起信号を、少なくとも前記残余 励起パルス列から形成された残余励起信号と線形的に組み合わせて、残差励起信 号を形成し、かつ前記残差励起信号を前記FIFOバッファに供給するセレクタ と、 前記スペクトル係数とよって動作して、前記残差励起信号をフィルタリングし て前記音声波形を形成するフィルタとを有することを特徴とする請求項1に記載 のオーディオ信号圧縮/解凍装置。 3.前記解凍ユニットが、前記再構成された励起信号を、 前記FIFOバッファに供給するためのバッファ制御ユニットを更に有すること を特徴とする請求項1に記載のオーディオ信号圧縮/解凍装置。 4.前記解凍ユニットが、前記音声波形をフィルタリングする後フィルタを更に 有することを特徴とする請求項1に記載のオーディオ信号圧縮/解凍装置。 5.前記圧縮ユニットが、 前記入力オーディオ信号に応答して、8個のスペクトル係数を決定し、前記ス ペクトル係数を用いて残差信号を発生して、前記入力オーディオ信号の短期的な 相関性を除去する短期予測器と、 前記残差信号に対して動作し、大まかな算出値及び二次補正値によって形成さ れた前記ピッチパラメータを決定し、前記ピッチパラメータを用いて残余信号を 形成して、前記残差信号の長期的な相関性を除去する2ステップ長期予測器とを 有することを特徴とする請求項1に記載のオーディオ信号圧縮/解凍装置。 6.前記圧縮ユニットが、前記残余信号から前記残余励起パルス列を形成するた めのマルチパルスアナライザを更に有することを特徴とする請求項5に記載のオ ーディオ信号圧縮/解凍装置。 7.前記マルチパルスアナライザが、前記残余励起パルス列を表現するための7 個のパルス及び1つのゲインを形成することを特徴とする請求項6に記載のオー ディオ信号圧 縮/解凍装置。 8.前記圧縮ユニットが、前記スペクトル係数と、大まかなピッチ算出値と、二 次補正値と、残余励起パルス列及びゲインとを符号化して求めた符号化された変 数を求める符号化手段を有し、 前記解凍ユニットが、前記符号化された変数を復号化する復号化器とを有する ことを特徴とする請求項8に記載のオーディオ信号圧縮/解凍装置。 9.オーディオ信号解凍ユニットであって、 8個のスペクトル係数と、複数のピッチ変数と、残余励起パルス列とを受け取 る受容ユニットと、 残差励起信号を記憶するFIFO(ファーストイン・ファーストアウト)バッ ファと、 前記ピッチ変数を用いて、前記記憶された残差励起信号の一部から再構成され た励起信号を再構成し、前記再構成された励起信号を、少なくとも前記残余励起 パルス列から形成された残余励起信号と線形的に組み合わせて、残差励起信号を 形成し、前記残差励起信号を前記FIFOバッファに供給するセレクタと、 前記スペクトル係数によって動作し、前記残差励起信号をフィルタリングして 前記音声波形を形成するフィルタとを有することを特徴とするオーディオ信号解 凍ユニット。 10.前記解凍ユニットが、前記音声波形をフィルタリングする後フィルタを更 に有することを特徴とする請求項9 に記載のオーディオ信号解凍ユニット。 11.オーディオ信号圧縮/解凍方法であって、 残余励起パルス列と、1組のスペクトル係数と、1組のピッチ変数とからなる 複数の変数で入力オーディオ信号を表す過程と、 前記ピッチ変数と、前記残余励起パルス列とを用いて、再構成された励起信号 を形成し、前記スペクトル係数を用いて前記再構成された励起信号をフィルタリ ングして音声波形を形成する過程とを有することを特徴とするオーディオ信号圧 縮/解凍方法。 12.前記音声波形を形成する過程が、 FIFOバッファに記憶された残差励起信号を取り出す過程と、 前記ピッチ変数を用いて、前記記憶された残差励起信号の一部から前記再構成 された励起信号を再構成し、前記再構成された励起信号と、少なくとも前記残余 励起パルス列から形成された残余励起信号とを線形的に組み合わせることによっ て残差励起信号を形成し、前記残差励起信号を前記FIFOバッファに供給する 過程と、 前記スペクトル係数を用いて前記残差信号をフィルタリングして音声波形を形 成する過程とを有することを特徴とする請求項11に記載のオーディオ信号圧縮 /解凍方法。 13.前記残差励起信号を前記FIFOバッファに伝達する過程を有することを 特徴とする請求項12に記載のオー ディオ信号圧縮/解凍方法。 14.前記残差励起信号をフィルタリングする後フィルタ過程を有することを特 徴とする請求項11に記載のオーディオ信号圧縮/解凍方法。 15.前記残差励起信号を供給する過程が、 前記入力信号から8個のスペクトル係数を求め、前記スペクトル係数を用いて 前記入力オーディオ信号の短期相関性をフィルタリングによって除去いて残差信 号を発生する過程と、 前記残差信号から、大まかな算出値と二次補正値とからなるピッチ変数を求め 、前記ピッチ変数を用いて前記残差信号の長期相関性をフィルタリングによって 除去して残余信号を形成する過程とを有することを特徴とする請求項11に記載 のオーディオ信号圧縮/解凍方法。 16.前記残差励起信号を供給する過程が、前記残余信号を解析して、前記残余 励起パルス列を形成するマルチパルス解析過程を更に有することを特徴とする請 求項15に記載のオーディオ信号圧縮/解凍方法。 17.前記マルチパルス解析過程が、前記残余励起パルス列の表現として、7個 のパルスとゲインとを形成することを特徴とする請求項16に記載のオーディオ 信号圧縮/解凍方法。 18.前記残差励起信号を供給する過程が、前記スペクトルと、前記大まかなピ ッチ算出値と、前記二次補正値と、 前記残余励起パルス列及びゲインとを符号化して供給する過程を有し、 前記解凍過程が、前記符号化された変数を復号化する過程を有することを特徴 とする請求項11に記載のオーディオ信号圧縮/解凍方法。 19.オーディオ信号圧縮/解凍装置であって、 入力オーディオ信号を供給され、かつ残余励起パルス列出力ラインと、スペク トル係数出力ラインと、ピッチ変数出力ラインとを有するオーディオ信号圧縮ユ ニットと、 残余励起パルス列入力ラインと、スペクトル係数入力ラインと、ピッチ変数入 力ラインと、音声波形出力ラインとを備えた解凍ユニットとを有することを特徴 とするオーディオ信号圧縮/解凍装置。 20.前記解凍ユニットが、 残差励起信号が記憶されているFIFO(ファーストイン・ファーストアウト )バッファと、 前記ピッチ変数を用いて、前記記憶された残差励起信号の一部から前記再構成 された励起信号を再構成し、前記再構成された励起信号を、前記残余励起パルス 列の少なくとも一部から形成された残余励起信号と線形的に組み合わせて残差励 起信号を形成し、前記残差励起信号を前記FIFOバッファに供給するセレクタ と、 前記スペクトル係数によって動作し、前記残差励起信号をフィルタリングして 前記音声波形を形成するフィルタと を有することを特徴とする請求項19に記載のオーディオ信号圧縮/解凍装置。
JP7515650A 1993-12-01 1994-12-01 オーディオ信号の圧縮/解凍装置及び圧縮/解凍方法 Ceased JPH08511110A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US08/160,530 US5673364A (en) 1993-12-01 1993-12-01 System and method for compression and decompression of audio signals
US160,530 1993-12-01
PCT/US1994/013288 WO1995015549A1 (en) 1993-12-01 1994-12-01 A system and method for compression and decompression of audio signals

Publications (1)

Publication Number Publication Date
JPH08511110A true JPH08511110A (ja) 1996-11-19

Family

ID=22577268

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7515650A Ceased JPH08511110A (ja) 1993-12-01 1994-12-01 オーディオ信号の圧縮/解凍装置及び圧縮/解凍方法

Country Status (6)

Country Link
US (1) US5673364A (ja)
EP (1) EP0681728A4 (ja)
JP (1) JPH08511110A (ja)
AU (1) AU1257295A (ja)
CA (1) CA2154881C (ja)
WO (1) WO1995015549A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6351490B1 (en) 1998-01-14 2002-02-26 Nec Corporation Voice coding apparatus, voice decoding apparatus, and voice coding and decoding system
JP2008546021A (ja) * 2005-05-31 2008-12-18 マイクロソフト コーポレーション マルチステージコードブックおよび冗長コーディング技術フィールドを有するサブバンド音声コーデック

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5822370A (en) * 1996-04-16 1998-10-13 Aura Systems, Inc. Compression/decompression for preservation of high fidelity speech quality at low bandwidth
US6148282A (en) * 1997-01-02 2000-11-14 Texas Instruments Incorporated Multimodal code-excited linear prediction (CELP) coder and method using peakiness measure
US6009387A (en) * 1997-03-20 1999-12-28 International Business Machines Corporation System and method of compression/decompressing a speech signal by using split vector quantization and scalar quantization
FR2808917B1 (fr) * 2000-05-09 2003-12-12 Thomson Csf Procede et dispositif de reconnaissance vocale dans des environnements a niveau de bruit fluctuant
US7949057B2 (en) * 2003-10-23 2011-05-24 Panasonic Corporation Spectrum coding apparatus, spectrum decoding apparatus, acoustic signal transmission apparatus, acoustic signal reception apparatus and methods thereof
US20070160154A1 (en) * 2005-03-28 2007-07-12 Sukkar Rafid A Method and apparatus for injecting comfort noise in a communications signal
US8417185B2 (en) * 2005-12-16 2013-04-09 Vocollect, Inc. Wireless headset and method for robust voice data communication
US7773767B2 (en) 2006-02-06 2010-08-10 Vocollect, Inc. Headset terminal with rear stability strap
US7885419B2 (en) * 2006-02-06 2011-02-08 Vocollect, Inc. Headset terminal with speech functionality
KR20090122143A (ko) * 2008-05-23 2009-11-26 엘지전자 주식회사 오디오 신호 처리 방법 및 장치
USD605629S1 (en) 2008-09-29 2009-12-08 Vocollect, Inc. Headset
US8160287B2 (en) 2009-05-22 2012-04-17 Vocollect, Inc. Headset with adjustable headband
US8438659B2 (en) 2009-11-05 2013-05-07 Vocollect, Inc. Portable computing device and headset interface
ES2827278T3 (es) 2014-04-17 2021-05-20 Voiceage Corp Método, dispositivo y memoria no transitoria legible por ordenador para codificación y decodificación predictiva linealde señales sonoras en la transición entre tramas que tienen diferentes tasas de muestreo

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4130729A (en) * 1977-09-19 1978-12-19 Scitronix Corporation Compressed speech system
JPS60116000A (ja) * 1983-11-28 1985-06-22 ケイディディ株式会社 音声符号化装置
NL8400728A (nl) * 1984-03-07 1985-10-01 Philips Nv Digitale spraakcoder met basisband residucodering.
NL8500843A (nl) * 1985-03-22 1986-10-16 Koninkl Philips Electronics Nv Multipuls-excitatie lineair-predictieve spraakcoder.
FR2579356B1 (fr) * 1985-03-22 1987-05-07 Cit Alcatel Procede de codage a faible debit de la parole a signal multi-impulsionnel d'excitation
EP0280827B1 (en) * 1987-03-05 1993-01-27 International Business Machines Corporation Pitch detection process and speech coder using said process
US4868867A (en) * 1987-04-06 1989-09-19 Voicecraft Inc. Vector excitation speech or audio coder for transmission or storage
US5125030A (en) * 1987-04-13 1992-06-23 Kokusai Denshin Denwa Co., Ltd. Speech signal coding/decoding system based on the type of speech signal
GB8829661D0 (en) * 1988-12-20 1989-02-15 Shaye Communications Ltd Duplex communications systems
US5060269A (en) * 1989-05-18 1991-10-22 General Electric Company Hybrid switched multi-pulse/stochastic speech coding technique
US5307441A (en) * 1989-11-29 1994-04-26 Comsat Corporation Wear-toll quality 4.8 kbps speech codec
US5371853A (en) * 1991-10-28 1994-12-06 University Of Maryland At College Park Method and system for CELP speech coding and codebook for use therewith

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6351490B1 (en) 1998-01-14 2002-02-26 Nec Corporation Voice coding apparatus, voice decoding apparatus, and voice coding and decoding system
JP2008546021A (ja) * 2005-05-31 2008-12-18 マイクロソフト コーポレーション マルチステージコードブックおよび冗長コーディング技術フィールドを有するサブバンド音声コーデック
JP2012141649A (ja) * 2005-05-31 2012-07-26 Microsoft Corp マルチステージコードブックおよび冗長コーディング技術フィールドを有するサブバンド音声コーデック

Also Published As

Publication number Publication date
CA2154881A1 (en) 1995-06-08
EP0681728A4 (en) 1997-12-17
US5673364A (en) 1997-09-30
EP0681728A1 (en) 1995-11-15
CA2154881C (en) 1999-02-02
AU1257295A (en) 1995-06-19
WO1995015549A1 (en) 1995-06-08

Similar Documents

Publication Publication Date Title
RU2436174C2 (ru) Аудиопроцессор и способ обработки звука с высококачественной коррекцией частоты основного тона (варианты)
JP3483958B2 (ja) 広帯域音声復元装置及び広帯域音声復元方法及び音声伝送システム及び音声伝送方法
JP4162933B2 (ja) 低ビットレートcelp符号化のための連続タイムワーピングに基づく信号の修正
US5067158A (en) Linear predictive residual representation via non-iterative spectral reconstruction
EP0673013B1 (en) Signal encoding and decoding system
JPH08511110A (ja) オーディオ信号の圧縮/解凍装置及び圧縮/解凍方法
JPH11249699A (ja) 音声パラメータの合同量子化
WO2004008437A2 (en) Audio coding
JP2000515992A (ja) 言語コーディング
JPH09127995A (ja) 信号復号化方法及び信号復号化装置
JP3297751B2 (ja) データ数変換方法、符号化装置及び復号化装置
JP2002366195A (ja) 音声符号化パラメータ符号化方法及び装置
JP2000132193A (ja) 信号符号化装置及び方法、並びに信号復号装置及び方法
JP3878254B2 (ja) 音声圧縮符号化方法および音声圧縮符号化装置
JPH05297895A (ja) 高能率符号化方法
JP3731575B2 (ja) 符号化装置及び復号装置
JPH0651800A (ja) データ数変換方法
JP2002099300A (ja) 音声符号化方法及び装置
JPH08129400A (ja) 音声符号化方式
JP3598111B2 (ja) 広帯域音声復元装置
JP3297750B2 (ja) 符号化方法
US20220277754A1 (en) Multi-lag format for audio coding
Ramadan Compressive sampling of speech signals
JPH1078797A (ja) 音響信号処理方法
JP3271966B2 (ja) 符号化装置及び符号化方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040420

A313 Final decision of rejection without a dissenting response from the applicant

Free format text: JAPANESE INTERMEDIATE CODE: A313

Effective date: 20040913

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20041019