JP2003533723A - オーディオ符号化 - Google Patents
オーディオ符号化Info
- Publication number
- JP2003533723A JP2003533723A JP2001584416A JP2001584416A JP2003533723A JP 2003533723 A JP2003533723 A JP 2003533723A JP 2001584416 A JP2001584416 A JP 2001584416A JP 2001584416 A JP2001584416 A JP 2001584416A JP 2003533723 A JP2003533723 A JP 2003533723A
- Authority
- JP
- Japan
- Prior art keywords
- audio signal
- autoregressive
- parameters
- moving average
- basic waveforms
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 230000005236 sound signal Effects 0.000 claims abstract description 52
- 238000000034 method Methods 0.000 claims abstract description 43
- 238000001228 spectrum Methods 0.000 claims abstract description 27
- 238000001914 filtration Methods 0.000 claims description 8
- 230000002194 synthesizing effect Effects 0.000 claims 2
- 230000006870 function Effects 0.000 description 33
- 241001123248 Arma Species 0.000 description 21
- 230000003595 spectral effect Effects 0.000 description 21
- 238000004891 communication Methods 0.000 description 6
- 238000012546 transfer Methods 0.000 description 5
- 230000015572 biosynthetic process Effects 0.000 description 4
- 238000013507 mapping Methods 0.000 description 4
- 238000000926 separation method Methods 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 238000012804 iterative process Methods 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 238000005192 partition Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000006073 displacement reaction Methods 0.000 description 2
- 238000009499 grossing Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000001052 transient effect Effects 0.000 description 2
- 125000002015 acyclic group Chemical group 0.000 description 1
- 238000005311 autocorrelation function Methods 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000001739 density measurement Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000010183 spectrum analysis Methods 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/012—Comfort noise or silence coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0364—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Complex Calculations (AREA)
Abstract
(57)【要約】
【課題】 有利な音声符号化を提供すること。
【解決手段】 音声信号(A)を符号化する方法(2)を提供する。そこでは、音声信号(A)中の複数の基本波形が決定され(200)、その複数の基本波形を音声信号(A)から減算する(21)ことによって、雑音成分(S)が、その音声信号(A)から得られ、その雑音成分(S)のスペクトルは、自己回帰および移動平均パラメータ(pi, qi)を決定することによって、モデル化され(22)、そして、その自己回帰および移動平均パラメータ(pi, qi)は、その複数の基本波形を表す波形パラメータ(Ci)と共に、符号化音声信号(A')中に含められる(23)。
Description
【0001】
本発明は、オーディオ符号化に関する。
【0002】
欧州特許出願WO97/28527は、背景雑音PSD(パワースペクトル密度)推定を決
定し、雑音のあるスピーチパラメータを決定し、そのスピーチパラメータから雑
音のあるスピーチPSD推定を決定し、その雑音のあるスピーチPSD推定から背景雑
音PSDを減算し、さらに、その改善されたスピーチPSD推定値から改善されたスピ
ーチパラメータを推定する、スピーチパラメータの改善法を開示している。強化
されたパラメータは、雑音を抑圧するために雑音のあるスピーチにフィルタリン
グをかけるために、またはスピーチ符号化におけるスピーチパラメータとして直
接使うことが出来る。このパラメータとPSD推定値は、自己回帰モデル化によっ
て得られる。本明細書においては、このような推定値は、統計的に一貫したもの
ではないが、スピーチ信号処理においては、これは、重大な問題ではないことに
、留意すべきである。
定し、雑音のあるスピーチパラメータを決定し、そのスピーチパラメータから雑
音のあるスピーチPSD推定を決定し、その雑音のあるスピーチPSD推定から背景雑
音PSDを減算し、さらに、その改善されたスピーチPSD推定値から改善されたスピ
ーチパラメータを推定する、スピーチパラメータの改善法を開示している。強化
されたパラメータは、雑音を抑圧するために雑音のあるスピーチにフィルタリン
グをかけるために、またはスピーチ符号化におけるスピーチパラメータとして直
接使うことが出来る。このパラメータとPSD推定値は、自己回帰モデル化によっ
て得られる。本明細書においては、このような推定値は、統計的に一貫したもの
ではないが、スピーチ信号処理においては、これは、重大な問題ではないことに
、留意すべきである。
【0003】
本発明の目的は、有利なオーディオ符号化を提供することである。この目的の
ために、本発明は、個々の請求項で定義されるような、オーディオ信号を符号化
する方法、符号化されたオーディオ信号を復号化する方法、オーディオ符号器、
オーディオプレーヤ、オーディオシステム、符号化されたオーディオ信号、およ
び記憶媒体を、提供する。有利な諸実施例は、従属請求項において既定される。
ために、本発明は、個々の請求項で定義されるような、オーディオ信号を符号化
する方法、符号化されたオーディオ信号を復号化する方法、オーディオ符号器、
オーディオプレーヤ、オーディオシステム、符号化されたオーディオ信号、およ
び記憶媒体を、提供する。有利な諸実施例は、従属請求項において既定される。
【0004】
本発明の第一の観点によれば、パラメトリックARMAモデル化が、オーディオ信
号中の雑音成分をモデル化するのに用いられ、その雑音成分は、オーディオ信号
から複数の基本波形を減算することによって得られる。オーディオ信号は、一般
には、音楽のようなオーディオを含むが、スピーチを含むことも可能である。本
発明による雑音成分のARMAモデル化には、さらに別の利点がある。それは、すな
わち、雑音成分の正確なモデル化に対し、完全ARまたはMAモデル化の場合に必要
となるパラメータより少ないパラメータで、同等の精度を実現することができる
ことである。パラメータが少ないということは、とりわけ、より良好な圧縮が得
られることを意味する。
号中の雑音成分をモデル化するのに用いられ、その雑音成分は、オーディオ信号
から複数の基本波形を減算することによって得られる。オーディオ信号は、一般
には、音楽のようなオーディオを含むが、スピーチを含むことも可能である。本
発明による雑音成分のARMAモデル化には、さらに別の利点がある。それは、すな
わち、雑音成分の正確なモデル化に対し、完全ARまたはMAモデル化の場合に必要
となるパラメータより少ないパラメータで、同等の精度を実現することができる
ことである。パラメータが少ないということは、とりわけ、より良好な圧縮が得
られることを意味する。
【0005】
本発明では、実時間実装に適したARMAモデル推定を用いる。本発明は、ARまた
はMAモデルが、パワースペクトル推定値についての情報を伝えるのに、必ずしも
十分に正確でない、またはその計算負荷が小さくないと言う認識に立っている。
対数目盛上で線形予測符号化(LPC)方法を使うと、関数の(全極モデル化の)ピ
ークは、通常、良好にモデル化されるが、谷は実際より小さく推定される。全ゼ
ロ型モデルでは、これと逆のことが、発生する。オーディオおよびスピーチ符号
化においては、対数目盛の方が、リニア目盛より、より適切である。したがって
、対数目盛上でのパワースペクトルへの良好な適合が、望ましい。本発明による
モデルは、複雑さと正確さの間のトレードオフをより良好にする。このモデルに
おける誤差は、対数目盛上で評価することができる。
はMAモデルが、パワースペクトル推定値についての情報を伝えるのに、必ずしも
十分に正確でない、またはその計算負荷が小さくないと言う認識に立っている。
対数目盛上で線形予測符号化(LPC)方法を使うと、関数の(全極モデル化の)ピ
ークは、通常、良好にモデル化されるが、谷は実際より小さく推定される。全ゼ
ロ型モデルでは、これと逆のことが、発生する。オーディオおよびスピーチ符号
化においては、対数目盛の方が、リニア目盛より、より適切である。したがって
、対数目盛上でのパワースペクトルへの良好な適合が、望ましい。本発明による
モデルは、複雑さと正確さの間のトレードオフをより良好にする。このモデルに
おける誤差は、対数目盛上で評価することができる。
【0006】
本発明の第一の実施例では、モデル化されるべきスペクトルは、第一の部分と
第二の部分とに分離され、ここにその第一の部分は、自己回帰パラメータを得る
ために、第一のモデルによってモデル化され、その第二の部分は、移動平均パラ
メータを得るために、第二のモデルによりモデル化される。複数の要素プロセス
の組合せによって、正確なARMAモデルが提供される。分離は、好ましくは、繰り
返し手順で実行される。本発明による方法では、非線形最適化問題を、省略する
ことが出来る。
第二の部分とに分離され、ここにその第一の部分は、自己回帰パラメータを得る
ために、第一のモデルによってモデル化され、その第二の部分は、移動平均パラ
メータを得るために、第二のモデルによりモデル化される。複数の要素プロセス
の組合せによって、正確なARMAモデルが提供される。分離は、好ましくは、繰り
返し手順で実行される。本発明による方法では、非線形最適化問題を、省略する
ことが出来る。
【0007】
本発明の好ましい実施例では、第二のモデル化演算は、目的とするスペクトル
の第二の部分の逆数について第一のモデル化演算を用いるステップを含む。本実
施例では、ただ一つのモデル化演算しか定義する必要がない。自己回帰パラメー
タは、スペクトルの第一の部分をモデル化することにより得られ、移動平均パラ
メータは、スペクトルの第二の部分の逆数を、同一のモデル化演算、すなわち、
第一のモデル化演算によって、モデル化することにより得られる。それほど好ま
れない方法であるが、第二の部分について移動平均パラメータを生成する第二の
モデル化演算を使い、自己回帰パラメータを得るために、スペクトルの第一の部
分の逆数について同一の第二のモデル化演算を使うことも、可能である。
の第二の部分の逆数について第一のモデル化演算を用いるステップを含む。本実
施例では、ただ一つのモデル化演算しか定義する必要がない。自己回帰パラメー
タは、スペクトルの第一の部分をモデル化することにより得られ、移動平均パラ
メータは、スペクトルの第二の部分の逆数を、同一のモデル化演算、すなわち、
第一のモデル化演算によって、モデル化することにより得られる。それほど好ま
れない方法であるが、第二の部分について移動平均パラメータを生成する第二の
モデル化演算を使い、自己回帰パラメータを得るために、スペクトルの第一の部
分の逆数について同一の第二のモデル化演算を使うことも、可能である。
【0008】
P. Stoica およびR.L. Moses著の「スペクトル解析入門」(New Jersey州、Pr
entice Hall社、1997年刊)の第101から108頁は、有理スペクトルをモデル化す
るためのパラメトリック方法を開示している。一般的に、移動平均(MA)信号は、
全ゼロ型フィルタを使って白色雑音をフィルタリングすることにより得られる。
この全ゼロ型構造のために、MAの次数を「十分大きく」選ばない限り、MA式を使
って、先鋭な複数ピークを有するスペクトルをモデル化することは、出来ない。
このことは、自己回帰型(AR)、すなわち、全極型の等式を使用して、かなり低い
モデル次数を使用することによって狭帯域スペクトルをモデル化できることと、
好対照をなす。MAモデルは、幅広のピークと鋭い零点によって特徴付けられるス
ペクトルに対して良好な近似を与える。アプリケーションにおいてこのようなス
ペクトルに遭遇する頻度は、狭帯域スペクトルの場合よりも小さいため、MA信号
モデルをスペクトル推定に使用することについての工学的な関心は、限られる。
これについての関心が限られる別の理由は、MAパラメータ推定問題が、基本的に
非線形問題であり、ARパラメータ推定問題よりも、解くのが著しく困難であるこ
とである。いずれの場合でも、MAおよびARMA推定問題における困難さの種類は、
全く同様のものである。
entice Hall社、1997年刊)の第101から108頁は、有理スペクトルをモデル化す
るためのパラメトリック方法を開示している。一般的に、移動平均(MA)信号は、
全ゼロ型フィルタを使って白色雑音をフィルタリングすることにより得られる。
この全ゼロ型構造のために、MAの次数を「十分大きく」選ばない限り、MA式を使
って、先鋭な複数ピークを有するスペクトルをモデル化することは、出来ない。
このことは、自己回帰型(AR)、すなわち、全極型の等式を使用して、かなり低い
モデル次数を使用することによって狭帯域スペクトルをモデル化できることと、
好対照をなす。MAモデルは、幅広のピークと鋭い零点によって特徴付けられるス
ペクトルに対して良好な近似を与える。アプリケーションにおいてこのようなス
ペクトルに遭遇する頻度は、狭帯域スペクトルの場合よりも小さいため、MA信号
モデルをスペクトル推定に使用することについての工学的な関心は、限られる。
これについての関心が限られる別の理由は、MAパラメータ推定問題が、基本的に
非線形問題であり、ARパラメータ推定問題よりも、解くのが著しく困難であるこ
とである。いずれの場合でも、MAおよびARMA推定問題における困難さの種類は、
全く同様のものである。
【0009】
先鋭な複数ピークと深い複数ゼロの両方を持ったスペクトルは、かなり小さい
次数のARまたはMA方程式のいずれによっても、モデル化することはできない。こ
れらの場合には、極-ゼロモデルとも呼ばれる、より一般的なARMAモデルが有効
である。しかしながら、ARMAパラメータ推定についての理論的および実際的な観
点から、まだ十分に確立されたアルゴリズムが存在しないために、ARMAスペクト
ル推定により正確な初期推定を得る可能性は低い。「理論的に最適なARMA推定方
法」は、大域収束性が保証されない繰り返し手順に基づいている。「実際的なAR
MA推定方法」は、計算が簡単であり、多くの場合信頼性が高いが、いくつかのケ
ースでは、その統計的な精度は、劣っているであろう。この従来技術では、まず
AR推定を行い、その後にMA推定を行う2段モデルが、開示されている。両者の方
法とも、ARMAモデル記述の極とゼロが、単位円近傍の複数位置に密接に位置して
いるようなケースでは、推定値は不正確でありかつ膨大な計算を必要とする。こ
のようなARMAモデルは、絶対値が1に近い複数の極とゼロがほぼ一致しており、
狭帯域信号に対応している。両者の方法とも、ゼロについての推定は、非線形最
適化問題に置き換えられる。
次数のARまたはMA方程式のいずれによっても、モデル化することはできない。こ
れらの場合には、極-ゼロモデルとも呼ばれる、より一般的なARMAモデルが有効
である。しかしながら、ARMAパラメータ推定についての理論的および実際的な観
点から、まだ十分に確立されたアルゴリズムが存在しないために、ARMAスペクト
ル推定により正確な初期推定を得る可能性は低い。「理論的に最適なARMA推定方
法」は、大域収束性が保証されない繰り返し手順に基づいている。「実際的なAR
MA推定方法」は、計算が簡単であり、多くの場合信頼性が高いが、いくつかのケ
ースでは、その統計的な精度は、劣っているであろう。この従来技術では、まず
AR推定を行い、その後にMA推定を行う2段モデルが、開示されている。両者の方
法とも、ARMAモデル記述の極とゼロが、単位円近傍の複数位置に密接に位置して
いるようなケースでは、推定値は不正確でありかつ膨大な計算を必要とする。こ
のようなARMAモデルは、絶対値が1に近い複数の極とゼロがほぼ一致しており、
狭帯域信号に対応している。両者の方法とも、ゼロについての推定は、非線形最
適化問題に置き換えられる。
【0010】
StoicaとMosesによる従来技術の方法では、行列の反転に大きな計算負荷が必
要となる。さらに、ARモデルの次数が、単位円に近いゼロに対しては高い必要で
ある点を除き、どの値に置かれるべきかが明確ではない。したがって、計算の複
雑さは、評価するのが難しい。本発明による方法では、大きな計算負荷は、分離
処理と周波数領域への変換への繰り返し処理に必要となる(StoicaとMosesは、
一次的に時間領域で計算を行う)。本発明は、単位円近傍の複数のゼロのケース
において、より良い結果を提供する。さらに、周波数領域に変換することにより
、計算を操作する可能性が開かれる。例えば、分離周波数は、推測的データまた
は測定データに基づいて決定することが出来る。別の利点は、以下に説明される
ように、ワーピングされた周波数データへの適用性である。リアルタイムのARMA
モデル化を保証するために、例えば、この技術分野で周知のウェルチによる平均
化ピリオドグラム法などの、周波数領域への高速変換を適用する必要がある。
要となる。さらに、ARモデルの次数が、単位円に近いゼロに対しては高い必要で
ある点を除き、どの値に置かれるべきかが明確ではない。したがって、計算の複
雑さは、評価するのが難しい。本発明による方法では、大きな計算負荷は、分離
処理と周波数領域への変換への繰り返し処理に必要となる(StoicaとMosesは、
一次的に時間領域で計算を行う)。本発明は、単位円近傍の複数のゼロのケース
において、より良い結果を提供する。さらに、周波数領域に変換することにより
、計算を操作する可能性が開かれる。例えば、分離周波数は、推測的データまた
は測定データに基づいて決定することが出来る。別の利点は、以下に説明される
ように、ワーピングされた周波数データへの適用性である。リアルタイムのARMA
モデル化を保証するために、例えば、この技術分野で周知のウェルチによる平均
化ピリオドグラム法などの、周波数領域への高速変換を適用する必要がある。
【0011】
自己回帰パラメータおよび移動平均パラメータは、複数の異なった方法で表す
ことができる、例えば、多項式、(利得係数を伴った)多項式のゼロ、反射係数
、または対数(領域)比である。オーディオ符号化アプリケーションにおいては
、自己回帰および移動平均パラメータの表示は、対数(領域)比で行われるのが
好ましい。本発明によるARMAモデル化で決定される自己回帰パラメータと移動平
均パラメータは、伝達されるフィルタパラメータを求めるために、結合される。
ことができる、例えば、多項式、(利得係数を伴った)多項式のゼロ、反射係数
、または対数(領域)比である。オーディオ符号化アプリケーションにおいては
、自己回帰および移動平均パラメータの表示は、対数(領域)比で行われるのが
好ましい。本発明によるARMAモデル化で決定される自己回帰パラメータと移動平
均パラメータは、伝達されるフィルタパラメータを求めるために、結合される。
【0012】
米国特許US-A5,943,429号は、フレームベースのデジタル通信システムにおけ
るスペクトル減算雑音抑圧方式を開示している。この方法は、非スピーチフレー
ムの背景雑音のパワースペクトル密度の推定と、スピーチフレームのパワースペ
クトル密度の推定値とに基づいたスペクトル減算関数によって実行される。それ
ぞれのスピーチフレームは、自由度の数を減少させるパラメトリックモデルによ
って近似される。それぞれのスピーチフレームのパワースペクトル密度の推定は
、近似的なパラメトリックモデルから推定される。この場合も、パラメトリック
モデルは、ARモデルである。
るスペクトル減算雑音抑圧方式を開示している。この方法は、非スピーチフレー
ムの背景雑音のパワースペクトル密度の推定と、スピーチフレームのパワースペ
クトル密度の推定値とに基づいたスペクトル減算関数によって実行される。それ
ぞれのスピーチフレームは、自由度の数を減少させるパラメトリックモデルによ
って近似される。それぞれのスピーチフレームのパワースペクトル密度の推定は
、近似的なパラメトリックモデルから推定される。この場合も、パラメトリック
モデルは、ARモデルである。
【0013】
米国特許US-A 4,188,667号は、ARMAフィルタと、このようなフィルタのパラメ
ータを求める方法とを開示している。この方法の第一のステップは、安定した純
粋な移動平均フィルタモデルの係数の打ち切り数列、すなわち、非巡回型濾波器
モデルのパラメータを求めるために、振幅の任意の選択された周波数スペクトル
について逆離散フーリエ変換を実行することを含んでいる。N+1項からなる係数
の打ち切り数列は、次に、ランダムの数列との間でコンボリューションが計算さ
れ、そのランダム数列に関連した出力を得る。次に、時間領域、収束パラメータ
同定が、所望の振幅-周波数および位相-周波数応答を有するモデルの、ほぼ最小
次数の自己回帰および移動平均パラメータを得るために、積分誤差関数ノルムが
最小になるように、時間領域の収束パラメータの識別が実行される。パラメータ
は、オフラインで識別される。この実施例の目的は、最小またはほぼ最小の安定
したARMAフィルタを提供することである。このパラメータは、バッチフィルタプ
ログラムにおいて決定される。
ータを求める方法とを開示している。この方法の第一のステップは、安定した純
粋な移動平均フィルタモデルの係数の打ち切り数列、すなわち、非巡回型濾波器
モデルのパラメータを求めるために、振幅の任意の選択された周波数スペクトル
について逆離散フーリエ変換を実行することを含んでいる。N+1項からなる係数
の打ち切り数列は、次に、ランダムの数列との間でコンボリューションが計算さ
れ、そのランダム数列に関連した出力を得る。次に、時間領域、収束パラメータ
同定が、所望の振幅-周波数および位相-周波数応答を有するモデルの、ほぼ最小
次数の自己回帰および移動平均パラメータを得るために、積分誤差関数ノルムが
最小になるように、時間領域の収束パラメータの識別が実行される。パラメータ
は、オフラインで識別される。この実施例の目的は、最小またはほぼ最小の安定
したARMAフィルタを提供することである。このパラメータは、バッチフィルタプ
ログラムにおいて決定される。
【0014】
一般に、パワースペクトル密度関数を推定することは、次の点で線形システム
を特性評価することとは異なる。すなわち、とりわけ、そのような特性評価では
、入力および出力信号が利用可能であってかつ使われるのに対し、パワースペク
トル密度関数を推定する際には、パワースペクトル密度関数しか利用可能ではな
い(関連する入力信号は利用不可)。
を特性評価することとは異なる。すなわち、とりわけ、そのような特性評価では
、入力および出力信号が利用可能であってかつ使われるのに対し、パワースペク
トル密度関数を推定する際には、パワースペクトル密度関数しか利用可能ではな
い(関連する入力信号は利用不可)。
【0015】
本発明の前述およびその他の観点は、以下に説明される実施例を参照して明確
にされるであろう。
にされるであろう。
【0016】
図面は、本発明を理解するのに必要な要素のみを示している。 本発明は、合
成ノイズ生成が採用されるオーディオ/スピーチ符号化方式に適用することが望
ましい。一般に、オーディオ信号は、フレーム−フレームベースで符号化される
。フレーム内のノイズのパワースペクトル密度関数(または場合によってはその
不均等なサンプリングされたバージョン)が推定され、特定のクラスのフィルタ
の一連の二乗振幅応答(squared amplitude responses)から関数の最適な近似が
求められる。本発明の一実施例においては、反復手順を使用して、ARおよびMAモ
デルをパワースペクトル密度に適合させるための複雑でない既存の技法に基づい
てARMAモデルを推定する。
成ノイズ生成が採用されるオーディオ/スピーチ符号化方式に適用することが望
ましい。一般に、オーディオ信号は、フレーム−フレームベースで符号化される
。フレーム内のノイズのパワースペクトル密度関数(または場合によってはその
不均等なサンプリングされたバージョン)が推定され、特定のクラスのフィルタ
の一連の二乗振幅応答(squared amplitude responses)から関数の最適な近似が
求められる。本発明の一実施例においては、反復手順を使用して、ARおよびMAモ
デルをパワースペクトル密度に適合させるための複雑でない既存の技法に基づい
てARMAモデルを推定する。
【0017】
図1は、本発明による一例としてのオーディオ符号器2を示す。オーディオ信号
Aは、マイクロホン、記憶媒体、ネットワークなどのオーディオソース1から得ら
れる。オーディオ信号Aは、オーディオ符号器2に入力される。オーディオ信号A
は、オーディオ符号器2内でフレーム−フレームベースでパラメトリックにモデ
ル化される。符号化ユニット20は、分析ユニット(AU) 200と合成ユニット(SU) 2
01を有する。AU 200は、オーディオ信号の分析を実行し、オーディオ信号Aにお
ける基本波形を決定する。さらに、AU 200は、基本波形を表すための波形パラメ
ータまたは係数Ciを生成する。波形パラメータCiは、合成された基本波形で構成
される再構築されたオーディオ信号を得るために、SU 201に供給される。この再
構築されたオーディオ信号は、減算器(subtractor) 21に供給され、元のオーデ
ィオ信号Aから減算される。減算された後の残りの信号Sは、オーディオ信号Aの
ノイズ成分とみなされる。望ましい実施例の場合、符号化ユニット20は、過渡的
なモデル化を実行する段と、モデル化された過渡的な成分の減算後に正弦波モデ
ル化をオーディオ信号に実行する段の2段を有する。
Aは、マイクロホン、記憶媒体、ネットワークなどのオーディオソース1から得ら
れる。オーディオ信号Aは、オーディオ符号器2に入力される。オーディオ信号A
は、オーディオ符号器2内でフレーム−フレームベースでパラメトリックにモデ
ル化される。符号化ユニット20は、分析ユニット(AU) 200と合成ユニット(SU) 2
01を有する。AU 200は、オーディオ信号の分析を実行し、オーディオ信号Aにお
ける基本波形を決定する。さらに、AU 200は、基本波形を表すための波形パラメ
ータまたは係数Ciを生成する。波形パラメータCiは、合成された基本波形で構成
される再構築されたオーディオ信号を得るために、SU 201に供給される。この再
構築されたオーディオ信号は、減算器(subtractor) 21に供給され、元のオーデ
ィオ信号Aから減算される。減算された後の残りの信号Sは、オーディオ信号Aの
ノイズ成分とみなされる。望ましい実施例の場合、符号化ユニット20は、過渡的
なモデル化を実行する段と、モデル化された過渡的な成分の減算後に正弦波モデ
ル化をオーディオ信号に実行する段の2段を有する。
【0018】
本発明の観点によると、オーディオ信号A内のノイズ成分Sのパワースペクトル
密度関数は、ARMAモデル化され、その結果、自動回帰パラメータpiと移動平均パ
ラメータqiが得られる。ノイズ成分Sのスペクトルは、フィルタパラメータ(pi,qi )を得るために、ノイズ分析器(NA) 22内で本発明に従ってモデル化される。パ
ラメータ(pi,qi)の推定は、フィルタリングした後の関数S(すなわち、H-1(S))
をスペクトル的にできるだけ平坦にする、すなわち、「周波数スペクトルを白色
化」する伝達関数H-1を有するNA 22内のフィルタのフィルタパラメータを決定す
ることによって実行される。復号器内で、符号器で使用されるフィルタと逆の伝
達関数Hを有するフィルタによって白色ノイズをフィルタリングすることによっ
て、ノイズ成分Sとほぼ同じ特性を有する再構築されたノイズ成分を生成するこ
とができる。この逆フィルタのフィルタリング演算は、ARMAパラメータpiとqiに
よって決定される。フィルタパラメータ(pi,qi)は、マルチプレクサ23に、符号
化されたオーディオ信号A'内の波形パラメータCiと共に含まれている。オーディ
オストリームA'は、オーディオ符号器から、ワイヤレス接続、またはデータバス
、記憶媒体とすることが出来る通信チャネル3を介してオーディオプレーヤーに
供給される。
密度関数は、ARMAモデル化され、その結果、自動回帰パラメータpiと移動平均パ
ラメータqiが得られる。ノイズ成分Sのスペクトルは、フィルタパラメータ(pi,qi )を得るために、ノイズ分析器(NA) 22内で本発明に従ってモデル化される。パ
ラメータ(pi,qi)の推定は、フィルタリングした後の関数S(すなわち、H-1(S))
をスペクトル的にできるだけ平坦にする、すなわち、「周波数スペクトルを白色
化」する伝達関数H-1を有するNA 22内のフィルタのフィルタパラメータを決定す
ることによって実行される。復号器内で、符号器で使用されるフィルタと逆の伝
達関数Hを有するフィルタによって白色ノイズをフィルタリングすることによっ
て、ノイズ成分Sとほぼ同じ特性を有する再構築されたノイズ成分を生成するこ
とができる。この逆フィルタのフィルタリング演算は、ARMAパラメータpiとqiに
よって決定される。フィルタパラメータ(pi,qi)は、マルチプレクサ23に、符号
化されたオーディオ信号A'内の波形パラメータCiと共に含まれている。オーディ
オストリームA'は、オーディオ符号器から、ワイヤレス接続、またはデータバス
、記憶媒体とすることが出来る通信チャネル3を介してオーディオプレーヤーに
供給される。
【0019】
本発明によるオーディオプレーヤー4を有する実施例が、図2に示されている。
オーディオ信号A'は、通信チャネル3から得られ、そして符号化されたオーディ
オ信号A'に含まれるパラメータ(pi ,qi)と波形パラメータCiを得るために、デマ
ルチプレクサ40内で逆多重化される。パラメータ(pi,qi)は、ノイズ合成器(NS)
41に供給される。NS41は、主に、伝達関数Hを有するフィルタである。白色ノイ
ズ信号yが、NS41に入力される。NS41のフィルタリング動作は、ARMAパラメータ(
pi,qi)によって決定される。符号器2で使用されるフィルタ(NA) 22と反対である
NS 41によって白色ノイズyをフィルタリングすることにより、元のオーディオ信
号Aの中のノイズ成分Sとほぼ同じ確率特性を有するノイズ成分S'が生成される。
ノイズ成分S'は、再構築されたオーディオ信号(A")を得るために、加算器43内で
、他の再構築された成分(例えば、合成ユニット(SU) 42から得られた成分)に
加算される。SU 42は、SU 201に類似する。再構築されたオーディオ信号A"は、
スピーカーなどとすることができる出力5に供給される。
オーディオ信号A'は、通信チャネル3から得られ、そして符号化されたオーディ
オ信号A'に含まれるパラメータ(pi ,qi)と波形パラメータCiを得るために、デマ
ルチプレクサ40内で逆多重化される。パラメータ(pi,qi)は、ノイズ合成器(NS)
41に供給される。NS41は、主に、伝達関数Hを有するフィルタである。白色ノイ
ズ信号yが、NS41に入力される。NS41のフィルタリング動作は、ARMAパラメータ(
pi,qi)によって決定される。符号器2で使用されるフィルタ(NA) 22と反対である
NS 41によって白色ノイズyをフィルタリングすることにより、元のオーディオ信
号Aの中のノイズ成分Sとほぼ同じ確率特性を有するノイズ成分S'が生成される。
ノイズ成分S'は、再構築されたオーディオ信号(A")を得るために、加算器43内で
、他の再構築された成分(例えば、合成ユニット(SU) 42から得られた成分)に
加算される。SU 42は、SU 201に類似する。再構築されたオーディオ信号A"は、
スピーカーなどとすることができる出力5に供給される。
【0020】
図3は、図1に示されているオーディオ符号器2と、図2に示されているオーディ
オプレーヤー4とを有する、本発明によるオーディオシステムを示す。このよう
なシステムは、再生機能と録音機能を提供する。通信チャネル3は、オーディオ
システムの一部でもよいが、オーディオシステム外である場合が多いであろう。
通信チャネル3が記憶媒体である場合には、記憶媒体は、システム内に固定して
も良いし、リムーバブルディスク、メモリスティック、テープなどとしても良い
。
オプレーヤー4とを有する、本発明によるオーディオシステムを示す。このよう
なシステムは、再生機能と録音機能を提供する。通信チャネル3は、オーディオ
システムの一部でもよいが、オーディオシステム外である場合が多いであろう。
通信チャネル3が記憶媒体である場合には、記憶媒体は、システム内に固定して
も良いし、リムーバブルディスク、メモリスティック、テープなどとしても良い
。
【0021】
以下に、Sのスペクトルのモデル化をより詳しく説明する。Sは、離散時間実数
値信号(discrete-time real valued signal)のパワースペクトル密度関数である
と仮定する。さらに、Sは、間隔I = (-p,p)で定義される実数値関数
である。Sは、min (S) > 0かつmax (S) < ∞、対称的であると仮定する。簡便の
ため、Sの対数平均は0に等しい、すなわち、
値信号(discrete-time real valued signal)のパワースペクトル密度関数である
と仮定する。さらに、Sは、間隔I = (-p,p)で定義される実数値関数
である。Sは、min (S) > 0かつmax (S) < ∞、対称的であると仮定する。簡便の
ため、Sの対数平均は0に等しい、すなわち、
【式1】
であると仮定する。対数目盛上で平均が0でない場合への拡張は、直接的に得ら
れるが、さまざまな方法で扱うことができる。留意すべき点として、Sは、適切
な補間と正規化によって、実際に測定されたパワースペクトル密度関数のサンプ
ルから導くことができる。
れるが、さまざまな方法で扱うことができる。留意すべき点として、Sは、適切
な補間と正規化によって、実際に測定されたパワースペクトル密度関数のサンプ
ルから導くことができる。
【0022】
Hを、
【式1−1】
かつ
【式1−2】
で
H = B/Aである有理伝達関数とする。ここで、piとqiは、それぞれ、伝達関数Hの
極と零点である。
極と零点である。
【式1−3】
の対数平均も0に等しいことは、留意すべきである。
【0023】
対象関数は、Hの絶対値の二乗によって近似され、すなわち
【式1−4】
となる。
【0024】
近似の正確さの測度が、以下によって導入される。
【式2】
基準(2)は、Sと
【式1−3】
の両方が、0に等しい対数平均を有するという事実から、
【式3】
と書き直すことができる。さらに、各θに対して
【式3−1】
であるなら、基準(2)は、
【式4】
であるときのJ'-1によって近似される。このことは、最適解の近傍においては基
準(2)と(4)が実質的に等しいことを意味する。
準(2)と(4)が実質的に等しいことを意味する。
【0025】
H =1/A(すなわち、B = 1)である場合、(4)は、LPC方式の一例であるFLP (Fo
rward Linear Prediction)に関連付けられることは、周知である。従って、多項
式Aは、Sに関連付けられた自己相関関数を計算(または少なくとも近似)し、そ
してウィーナー − ホップの方程式の解を求めることによって見出すことができ
る。このような手順の定性的な結果も、周知である。上に概略を示した手順は、
(対数目盛で測定または示されるとき)Sのピークに良好な近似を与えるが、Sの
谷については、通常、良好な適合を与えない。このことの結論として、パワース
ペクトル密度関数から全極モデルを推定するためには、標準手順が、利用可能で
ある。この手順は、(2)による最適解の近似を与え、かつ基本的にSのピークのモ
デル化に適している。
rward Linear Prediction)に関連付けられることは、周知である。従って、多項
式Aは、Sに関連付けられた自己相関関数を計算(または少なくとも近似)し、そ
してウィーナー − ホップの方程式の解を求めることによって見出すことができ
る。このような手順の定性的な結果も、周知である。上に概略を示した手順は、
(対数目盛で測定または示されるとき)Sのピークに良好な近似を与えるが、Sの
谷については、通常、良好な適合を与えない。このことの結論として、パワース
ペクトル密度関数から全極モデルを推定するためには、標準手順が、利用可能で
ある。この手順は、(2)による最適解の近似を与え、かつ基本的にSのピークのモ
デル化に適している。
【0026】
ここで留意すべき点は、ln Sのピークと谷は、符号が反対であることを除き、
本質的には同じ特性を有することである。ピークは正の変位であり、谷は負の変
位である。この結果、
本質的には同じ特性を有することである。ピークは正の変位であり、谷は負の変
位である。この結果、
【式4−1】
として、上に概略を示した全極モデルのための手順を使用することによって、全
零点モデルを推定することができる。この手順の結果から、Sの谷への良好な適
合を予測することができるが、Sのピークについては、不良または中程度の適合
しか得られない。
零点モデルを推定することができる。この手順の結果から、Sの谷への良好な適
合を予測することができるが、Sのピークについては、不良または中程度の適合
しか得られない。
【0027】
本発明の目的は、ピークと谷の両方についてSの良好な表現を提供することで
ある。本発明の一実施例においては、全極モデル化と全零点モデル化が以下の方
法で結合されているARMAモデルが提供される。Sは、S = SA/SBとして2つの部分
に分割される。SAからは、全極モデルが推定されて多項式Aが得られ、SBからは
、全零点モデルが推定されて多項式Bが得られる。結合
ある。本発明の一実施例においては、全極モデル化と全零点モデル化が以下の方
法で結合されているARMAモデルが提供される。Sは、S = SA/SBとして2つの部分
に分割される。SAからは、全極モデルが推定されて多項式Aが得られ、SBからは
、全零点モデルが推定されて多項式Bが得られる。結合
【4−2】
は、Sの近似と考えられる。
【0028】
本発明の望ましい観点によると、Sの分割は、反復プロセスにおいて実行され
る。この反復ステップをlとする。反復の各ステップにおいて、新しい分割SA,l
とSB,lが計算され、対応する推定AlとBlが計算される。最初、SAとSBにおけるS
の所定の区画が使用され、次に、正確にモデル化されていないSBの部分をSAに帰
し、この逆も行われる。反復方式の中のステップl-1において、Hl-1 = Bl-1/Al- 1 である。次に、部分関数
る。この反復ステップをlとする。反復の各ステップにおいて、新しい分割SA,l
とSB,lが計算され、対応する推定AlとBlが計算される。最初、SAとSBにおけるS
の所定の区画が使用され、次に、正確にモデル化されていないSBの部分をSAに帰
し、この逆も行われる。反復方式の中のステップl-1において、Hl-1 = Bl-1/Al- 1 である。次に、部分関数
【4−3】
と
【4−4】
が考察される。このようにして、全極モデルによって正確にモデル化できるこれ
らのSの部分が、SBへの貢献から除外される。同様に、Sの部分のうち、全零点フ
ィルタによって正確にモデル化できる部分は、SAから除外される。SA,lとSB,lか
ら、関数AlとBlが推定される。このようにして、前の反復で適切にモデル化でき
なかった部分が交換される。 次のステップにおいて、以下の4つの可能な結合を考察することが望ましい。
らのSの部分が、SBへの貢献から除外される。同様に、Sの部分のうち、全零点フ
ィルタによって正確にモデル化できる部分は、SAから除外される。SA,lとSB,lか
ら、関数AlとBlが推定される。このようにして、前の反復で適切にモデル化でき
なかった部分が交換される。 次のステップにおいて、以下の4つの可能な結合を考察することが望ましい。
【式4−5】
これらの4個の候補フィルタのSへの最適な適合は、誤差が最小のフィルタとして
定義される。該当するフィルタは、ステップlの最終結果である。Hl(従ってAl
とBlも)は、
定義される。該当するフィルタは、ステップlの最終結果である。Hl(従ってAl
とBlも)は、
【式5】
に従って、対数基準上で候補Gi(i=0、1、2、3)の最適関数として選択されるこ
とが望ましい。これから、手順は、
とが望ましい。これから、手順は、
【式5−1】
および
【式5−2】
として、ステップl+1に続く。
【0029】
停止手順には、例えば、反復の最大数、または現在の推定の十分な精度、1つ
のステップから別のステップに進んでも十分な改善が得られないなど、任意の一
般的な手順を使用することができる。
のステップから別のステップに進んでも十分な改善が得られないなど、任意の一
般的な手順を使用することができる。
【0030】
上記手順とわずかに異なる手順は、ARとMAのモデル化を交互に実行する。前の
ステップで、分子Bl-1の改善された推定が返された場合には、
ステップで、分子Bl-1の改善された推定が返された場合には、
【式5−3】
となり、そしてAlが計算される。Bl-1にBlを代入する。
前のステップで、分子Al-1の改善された推定が返された場合には、
【式5−4】
となり、Blが計算される。Al-1にAlを代入する。
AlとBlからHlが構築され、誤差(例えば、対数目盛上の平均二乗差)が評価され
る。
る。
【0031】
反復方式を初期化するための代替手段が多数ある。以下にいくつかの可能な方
法を示すが、これらに限定されるものではない。
法を示すが、これらに限定されるものではない。
【0032】
最初に、初期化の1つの単純な方法は、SA,0 = SかつSB,0 = 1、およびSA,0 =
1かつ1/SB,0 = Sとすることにより行われる。次に、A0とB0が計算される。これ
ら2つの初期推定から、(何らかの基準に従って)最良の適合が選択される。こ
のようにして、最初の推測は、全極モデルまたは全零点モデルのいずれかとなる
。
1かつ1/SB,0 = Sとすることにより行われる。次に、A0とB0が計算される。これ
ら2つの初期推定から、(何らかの基準に従って)最良の適合が選択される。こ
のようにして、最初の推測は、全極モデルまたは全零点モデルのいずれかとなる
。
【0033】
第二の方法として、
【式5−5】
によってSを均等な部分に分割することができる。
【0034】
第三の方法として、SAがピークを含み、SBが谷を含んでいる必要があることか
ら、好ましい分割は、平均対数のレベルを超える(例えば、0を超える)すべて
をSA,0に帰し、そのレベルより下のすべてをSB,0に帰すことである。この分割は
、全体的な対数平均において行うことができるが、局所的な対数平均においても
行うことができる。
ら、好ましい分割は、平均対数のレベルを超える(例えば、0を超える)すべて
をSA,0に帰し、そのレベルより下のすべてをSB,0に帰すことである。この分割は
、全体的な対数平均において行うことができるが、局所的な対数平均においても
行うことができる。
【0035】
第四の方法では、さらなる分離プロセスにより、対数目盛上のパワースペクト
ル密度関数において、単位円に近い極と零点が、それぞれはっきりしたピークと
谷を生み出すことが考察される。logSにおけるピークと谷が、それぞれ全極モデ
ルと全零点モデルによってより適切に扱われるという認識のもとに、データSが
分割される。 P = logS PA = logSA PB = logSB と定義する。
ル密度関数において、単位円に近い極と零点が、それぞれはっきりしたピークと
谷を生み出すことが考察される。logSにおけるピークと谷が、それぞれ全極モデ
ルと全零点モデルによってより適切に扱われるという認識のもとに、データSが
分割される。 P = logS PA = logSA PB = logSB と定義する。
【式5−6】
におけるマッピング関数mを考察する。このマッピング関数は、対数目盛上での
極と零点の挙動の対称性の点において、代表的には非減少、点対称のS字形関数
である。しかしながら、極モデル化またはゼロモデル化のいずれかにより大きい
重みを付加する効果を有する非対称関数も使用できる。一例としてのマッピング
関数mが、図4に示されている。 次の初期分割を考える。
極と零点の挙動の対称性の点において、代表的には非減少、点対称のS字形関数
である。しかしながら、極モデル化またはゼロモデル化のいずれかにより大きい
重みを付加する効果を有する非対称関数も使用できる。一例としてのマッピング
関数mが、図4に示されている。 次の初期分割を考える。
【式5−7】
このようにして、Pの正の偏移(ピーク)は、主にPAに帰され、その結果全極フ
ィルタによってモデル化される。Pの負の偏移(谷)は、ほとんどPBに帰され、
その結果全零点フィルタによってモデル化される。PAとPBからSAとSBが構築され
、次にA0とB0が計算される。Mには、(上述した2番目と3番目の初期化に類似す
る)2つの限定状態(limiting case)がある。 - m=0の場合、
ィルタによってモデル化される。Pの負の偏移(谷)は、ほとんどPBに帰され、
その結果全零点フィルタによってモデル化される。PAとPBからSAとSBが構築され
、次にA0とB0が計算される。Mには、(上述した2番目と3番目の初期化に類似す
る)2つの限定状態(limiting case)がある。 - m=0の場合、
【式5−8】
- mがsignum関数、すなわち
【式5−9】
の場合、
【式5−10】
となる。
【0036】
提案されているスペクトルモデル化は、ピークと谷のモデル化に非常に適して
いる。その理由は、これらが、基本的に、極と零点によって与えられる自由度に
よって生成されるパターンを構成するためである。この結果、この手順は平滑化
よりも異常値に敏感であり、異常値は近似に現れる。従って、入力データSを、
(周波数サンプルあたりの標準偏差と平均の小さな比率という意味において)正
確な推定とする必要があるか、またはSを、異常値の望ましくないモデル化を抑
制するために前処理(例、平滑化)する必要がある。この観察は、モデルにおけ
る自由度が、パワースペクトル密度関数が基づくデータ点の数に対して相対的に
大きい場合、特に当てはまる。
いる。その理由は、これらが、基本的に、極と零点によって与えられる自由度に
よって生成されるパターンを構成するためである。この結果、この手順は平滑化
よりも異常値に敏感であり、異常値は近似に現れる。従って、入力データSを、
(周波数サンプルあたりの標準偏差と平均の小さな比率という意味において)正
確な推定とする必要があるか、またはSを、異常値の望ましくないモデル化を抑
制するために前処理(例、平滑化)する必要がある。この観察は、モデルにおけ
る自由度が、パワースペクトル密度関数が基づくデータ点の数に対して相対的に
大きい場合、特に当てはまる。
【0037】
実際の最適化ステップAおよびBと選択基準の知識なしには、収束を確立するこ
とはできない。誤差が反復プロセスにおける各ステップごとに小さくなる保証は
ない。
とはできない。誤差が反復プロセスにおける各ステップごとに小さくなる保証は
ない。
【0038】
多くの場合、対数目盛の周波数軸上でパワースペクトル密度関数について良好
な近似を有することが望まれる。例えば、スペクトルへの適合の結果をボーデ(B
ode)のプロットの形式で視覚的に評価する方法は、一般に行われている。同様に
、オーディオ/スピーチアプリケーションの場合、望ましい目盛は、基本的に対
数目盛であるBarkまたはERB (Equivalent Rectangular Bandwidth)である。本発
明による方法は、周波数歪モデル化(frequency-warped modeling)に適している
。スペクトル密度測定値は、どのような周波数グリッド上でも計算できる。周波
数歪が一次オールパス(all-pass)セクションのそれに近い条件下では、これを、
ARMAモデルの次数を維持しながら再ラップさせることができる。
な近似を有することが望まれる。例えば、スペクトルへの適合の結果をボーデ(B
ode)のプロットの形式で視覚的に評価する方法は、一般に行われている。同様に
、オーディオ/スピーチアプリケーションの場合、望ましい目盛は、基本的に対
数目盛であるBarkまたはERB (Equivalent Rectangular Bandwidth)である。本発
明による方法は、周波数歪モデル化(frequency-warped modeling)に適している
。スペクトル密度測定値は、どのような周波数グリッド上でも計算できる。周波
数歪が一次オールパス(all-pass)セクションのそれに近い条件下では、これを、
ARMAモデルの次数を維持しながら再ラップさせることができる。
【0039】
上述した実施例は、本発明を制限するものではなく例示するものであり、当業
者は、添付される請求項の範囲から逸脱せずに多数の代替実施例を設計すること
ができるであろうことに、留意すべきである。請求項において、カッコに囲まれ
た参照記号は、請求項の範囲を限定するものとと解釈すべきではない。語「有す
る」は、請求項に述べられた要素または手順以外の存在を除外するものではない
。本発明は、いくつかの個別の要素を有するハードウェアによって、および適切
にプログラムされたコンピュータによって実施できる。いくつかの手段を列挙す
る装置の請求項において、これらの手段のいくつかは、全く同一のハードウェア
によって実施できる。相異なる従属請求項に記載されている方策は、それら対策
を有利に組み合わせて使用することを除外するものではない。
者は、添付される請求項の範囲から逸脱せずに多数の代替実施例を設計すること
ができるであろうことに、留意すべきである。請求項において、カッコに囲まれ
た参照記号は、請求項の範囲を限定するものとと解釈すべきではない。語「有す
る」は、請求項に述べられた要素または手順以外の存在を除外するものではない
。本発明は、いくつかの個別の要素を有するハードウェアによって、および適切
にプログラムされたコンピュータによって実施できる。いくつかの手段を列挙す
る装置の請求項において、これらの手段のいくつかは、全く同一のハードウェア
によって実施できる。相異なる従属請求項に記載されている方策は、それら対策
を有利に組み合わせて使用することを除外するものではない。
【0040】
以上をまとめると、本発明は、オーディオ信号を符号化する方法を提供するも
のであり、そこでは、オーディオ信号中の複数の基本波形が決定され、その複数
の基本波形をオーディオ信号から減算することによって、雑音成分が、そのオー
ディオ信号から得られ、その雑音成分のスペクトルは、自己回帰および移動平均
パラメータを決定することによってモデル化され、そしてその自己回帰および移
動平均パラメータは、その複数の基本波形を表す波形パラメータと共に、符号化
されたオーディオ信号中に含められる。
のであり、そこでは、オーディオ信号中の複数の基本波形が決定され、その複数
の基本波形をオーディオ信号から減算することによって、雑音成分が、そのオー
ディオ信号から得られ、その雑音成分のスペクトルは、自己回帰および移動平均
パラメータを決定することによってモデル化され、そしてその自己回帰および移
動平均パラメータは、その複数の基本波形を表す波形パラメータと共に、符号化
されたオーディオ信号中に含められる。
【図1】 本発明によるオーディオ符号器を有する図解的な実施例を示す。
【図2】 本発明によるオーディオプレーヤーを有する図解的な実施例を示す
。
。
【図3】 本発明によるオーディオシステムの図解的な実施例を示す。
【図4】 一例としてのマッピング関数mを示す。
1 オーディオソース
2 オーディオ符号器
3 通信チャネル
4 オーディオプレーヤー
5 出力
20 符号化ユニット
21 減算器
22 ノイズ分析器(NA)
23 マルチプレクサ
40 デマルチプレクサ
41 ノイズ合成器(NS)
42 合成ユニット(SU)
43 加算器
200 分析ユニット(AU)
201 合成ユニット(SU)
A オーディオ信号
A' 符号化されたオーディオ信号
A" 再構築されたオーディオ信号
Ci 係数
S' 再生されたノイズ成分
pi 自動回帰パラメータ
qi 移動平均パラメータ
y 白色ノイズ信号
─────────────────────────────────────────────────────
フロントページの続き
(72)発明者 ウーメン アーノルダス ダブリュ ジェ
ー
オランダ国 5656 アー アー アインド
ーフェン プロフホルストラーン 6
Fターム(参考) 5D045 DA20
5J064 AA01 BA16 BB07 BC08 BC11
BC16 BC18 BC25 BD01
Claims (7)
- 【請求項1】 オーディオ信号中の複数の基本波形を決定するステップと、 前記オーディオ信号から前記複数の基本波形を減算して前記オーディオ信号か
ら雑音成分を得るステップと、 自己回帰および移動平均パラメータを決定することによって、前記雑音成分の
スペクトルをモデル化するステップと、 前記自己回帰および前記移動平均パラメータと前記複数の基本波形を表す複数
の波形パラメータとを、符号化されたオーディオ信号中に含ませるステップと、
を含むオーディオ信号を符号化する方法。 - 【請求項2】 複数の基本波形を表す波形パラメータと、残留雑音成分のスペクトルを表す自
己回帰および移動平均パラメータとを含む、符号化されたオーディオ信号を受信
するステップと、 再生された雑音成分を得るために、白色雑音信号について、前記自己回帰パラ
メータと前記移動平均パラメータとによって決定されるフィルタリングを行うス
テップと、 前記波形パラメータに基づき複数の基本波形を合成するステップと、 復号されたオーディオ信号を得るために、前記再生された雑音成分を前記合成
された複数の基本波形に加算するステップと、 を含む符号化されたオーディオ信号を復号化する方法。 - 【請求項3】 オーディオ信号中の複数の基本波形を決定する手段と、 前記オーディオ信号から前記複数の基本波形を減算することによって、前記オ
ーディオ信号から雑音成分を求める手段と、 自己回帰および移動平均パラメータを決定することによって、前記雑音成分の
スペクトルをモデル化する手段と、 前記自己回帰および前記移動平均パラメータと前記複数の基本波形を表す波形
パラメータとを、符号化オーディオ信号中に含ませる手段と、 を含むオーディオ符号器。 - 【請求項4】 複数の基本波形を表す波形パラメータと雑音成分のスペクトルを表す自己回帰
および移動平均パラメータとを含む、符号化されたオーディオ信号を受信する手
段と、 再生された雑音成分を得るために、白色雑音信号について、前記自己回帰パラ
メータと前記移動平均パラメータとによって決定されるフィルタリングを行う手
段と、 前記波形パラメータに基づいて、複数の基本波形を合成する手段と、 復号化されたオーディオ信号を得るために、前記再生された雑音成分を前記合
成された複数の基本波形に加算する手段と、 を含むオーディオプレーヤ。 - 【請求項5】 請求項3に記載のオーディオ符号器と請求項4に記載のオーディオプレーヤとを
含むオーディオシステム。 - 【請求項6】 複数の基本波形を表す波形パラメータと、 残留雑音成分のスペクトルを表す自己回帰パラメータおよび移動平均パラメー
タと、を含む符号化されたオーディオ信号。 - 【請求項7】 符号化されたオーディオ信号が記憶されている請求項6に記載の記憶媒体。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/EP2000/004601 WO2001088904A1 (en) | 2000-05-17 | 2000-05-17 | Audio coding |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2003533723A true JP2003533723A (ja) | 2003-11-11 |
Family
ID=8163951
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001584416A Withdrawn JP2003533723A (ja) | 2000-05-17 | 2000-05-17 | オーディオ符号化 |
Country Status (6)
Country | Link |
---|---|
EP (1) | EP1295283A1 (ja) |
JP (1) | JP2003533723A (ja) |
KR (1) | KR100718483B1 (ja) |
CN (1) | CN1179325C (ja) |
MX (1) | MXPA02000518A (ja) |
WO (1) | WO2001088904A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101951992B1 (ko) * | 2016-04-19 | 2019-05-10 | 연세대학교 원주산학협력단 | 헤드폰 환경에서 주파수 워핑을 이용한 제약 최적화 기반의 낮은 차수의 유한 임펄스 응답 능동 소음 제어 필터 설계 방법 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS52125251A (en) * | 1976-02-23 | 1977-10-20 | Bio Communication Res | Electric filter and method of designing same |
US5721694A (en) * | 1994-05-10 | 1998-02-24 | Aura System, Inc. | Non-linear deterministic stochastic filtering method and system |
JP3568255B2 (ja) * | 1994-10-28 | 2004-09-22 | 富士通株式会社 | 音声符号化装置及びその方法 |
SE505156C2 (sv) * | 1995-01-30 | 1997-07-07 | Ericsson Telefon Ab L M | Förfarande för bullerundertryckning genom spektral subtraktion |
-
2000
- 2000-05-17 JP JP2001584416A patent/JP2003533723A/ja not_active Withdrawn
- 2000-05-17 WO PCT/EP2000/004601 patent/WO2001088904A1/en not_active Application Discontinuation
- 2000-05-17 MX MXPA02000518A patent/MXPA02000518A/es unknown
- 2000-05-17 CN CNB00810431XA patent/CN1179325C/zh not_active Expired - Fee Related
- 2000-05-17 KR KR1020027000640A patent/KR100718483B1/ko not_active IP Right Cessation
- 2000-05-17 EP EP00935085A patent/EP1295283A1/en not_active Withdrawn
Also Published As
Publication number | Publication date |
---|---|
EP1295283A1 (en) | 2003-03-26 |
CN1377500A (zh) | 2002-10-30 |
CN1179325C (zh) | 2004-12-08 |
WO2001088904A1 (en) | 2001-11-22 |
KR100718483B1 (ko) | 2007-05-16 |
KR20020019533A (ko) | 2002-03-12 |
MXPA02000518A (es) | 2002-07-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20060129389A1 (en) | Spectrum modeling | |
TWI470623B (zh) | 用以獲得描述信號之信號特性變異之參數的裝置、方法與電腦程式、以及用以時間捲曲編碼輸入音訊信號的時間捲曲音訊編碼器 | |
US8781819B2 (en) | Periodic signal processing method, periodic signal conversion method, periodic signal processing device, and periodic signal analysis method | |
KR101461774B1 (ko) | 대역폭 확장기 | |
JP3299277B2 (ja) | 音声符号化補間に基づく時変スペクトル分析 | |
WO1993004467A1 (en) | Audio analysis/synthesis system | |
JP5634959B2 (ja) | 雑音/残響除去装置とその方法とプログラム | |
JP2009210647A (ja) | 雑音除去装置、その方法、そのプログラム及び記録媒体 | |
WO2000048169A1 (en) | A method and apparatus for pre-processing speech signals prior to coding by transform-based speech coders | |
KR20240036029A (ko) | 장기 예측 및/또는 고조파 후치 필터링에 기초하여 예측 스펙트럼을 생성하기 위한 프로세서 | |
WO2003083833A1 (en) | Method for modeling speech harmonic magnitudes | |
US6990475B2 (en) | Digital signal processing method, learning method, apparatus thereof and program storage medium | |
JP2003533723A (ja) | オーディオ符号化 | |
KR20050007574A (ko) | 오디오 코딩 | |
JP2010044150A (ja) | 残響除去装置、残響除去方法、そのプログラムおよび記録媒体 | |
JP2002049397A (ja) | ディジタル信号処理方法、学習方法及びそれらの装置並びにプログラム格納媒体 | |
CN117935826B (zh) | 音频升采样方法、装置、设备及存储介质 | |
Srivastava | Fundamentals of linear prediction | |
Ramadan | Compressive sampling of speech signals | |
JP3186020B2 (ja) | 音響信号変換復号化方法 | |
JPH0736484A (ja) | 音響信号符号化装置 | |
Algazi et al. | Robust LPC analysis and synthesis using the KL transformation of acoustic subwords spectra | |
JPH113097A (ja) | 符号化音声信号品質評価方法及びこれに用いるデータベース | |
Yoo | Selective all-pole modeling of degraded speech using M-band decomposition | |
Alatwi et al. | A noise-robust linear prediction analysis for efficient speech coding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20070807 |