JP4446883B2 - オーディオ符号化 - Google Patents

オーディオ符号化 Download PDF

Info

Publication number
JP4446883B2
JP4446883B2 JP2004509924A JP2004509924A JP4446883B2 JP 4446883 B2 JP4446883 B2 JP 4446883B2 JP 2004509924 A JP2004509924 A JP 2004509924A JP 2004509924 A JP2004509924 A JP 2004509924A JP 4446883 B2 JP4446883 B2 JP 4446883B2
Authority
JP
Japan
Prior art keywords
indices
audio signal
sensitivity parameter
impulse response
order
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004509924A
Other languages
English (en)
Other versions
JP2005528646A (ja
Inventor
ブリンケル アルベルタス シー デン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips NV
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips NV, Koninklijke Philips Electronics NV filed Critical Koninklijke Philips NV
Publication of JP2005528646A publication Critical patent/JP2005528646A/ja
Application granted granted Critical
Publication of JP4446883B2 publication Critical patent/JP4446883B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/12Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being prediction coefficients

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Cereal-Derived Products (AREA)
  • Complex Calculations (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)

Description

本発明は、オーディオ(可聴)信号(audio signal)を符号化及び復号化することに関する。
線形予測符号化(LPC(linear predictive coding))が、オーディオ及び音声符号化においてしばしば使用されている。図1(a)は、従来のLPC型エンコーダ(LPC based encoder)のためのK次の有限インパルス応答(FIR(finite impulse response))型予測フィルタ10コンポーネントを示している。フィルタが、推定値(estimate)
Figure 0004446883
を、信号のK前サンプル(K previous samples of the signals)の一次結合(linear combination)から生成される所与の信号x(n)にもたらす。図1(a)の例において、x(n)及びr(n)
に関するフィルタの伝達関数(transfer function)F(z)
は、
Figure 0004446883
のように表され得る。
予測係数αは、いくつかの基準(criterion)、通常加重平均二乗誤差(weighted mean−squared error)に基づいて計算される。
推定値
Figure 0004446883
は今度は信号x(n)から減算されて、その結果残留信号(residual signal)r(n)がもたらされる。当該残留信号及び予測フィルタに対する情報、すなわち予測係数αは通常、より効率的な形態で記憶又は送信される。例えば、予測係数αは1セットの反射係数にマップ(map)されることが可能であり、これらは今度は対数領域比(ログエリアレシオ)(LAR(log area ratio))にマップされ得る。代わりに、予測係数αは、信号x(n)を表すビットストリームにおいて残留信号と共に符号化されることに先行してラインスペクトル周波数(LSF(line spectral frequency))に直接マップされ得る(量子化感度(quantisation sensitivity))を考慮して、LAR及びLSFドメインが好ましい)。代わりに逆正弦反射係数(ASRC(arcsine reflection coefficient))及びラインスペクトル対(LSP(Line Spectral Pair))のような表現(representation)が使用されてもよい。
図1(b)のデコーダにおいて、予測フィルタのための情報及び残留信号が、元の信号x(n)を再構成(reconstruct)(又は近似(approximate))するために使用される。図1から同様のメカニズムがエンコーダ及びデコーダにもたらされることは明らかである。しかしながら特に信号x(n)に対するビットストリームを符号化することに先行して量子化の間に信号にもたらされ得た歪(distortion)に関してデコーダの安定性を保証するためにフィルタF(z)が通常最小位相フィルタ(minimum−phase filter)になることを注意することは重要となる。すなわち伝達関数F(z)の全ての根(root)(極(pole)及びゼロ(zero))は単位円(unit circle)の内側に存在しなければならず、このことはFIRフィルタに対して保証するために通常実現可能である。
上記の種類のFIR型フィルタを使用することにより、エンコーダは聴覚プロセス(auditory process)のサイコアコースティック(音響心理学)モデル(psycho acoustic model)を考慮してチューニングされ得ない。
V.Voitishchuk氏他による“歪線形予測器の代替(Alternatives for Warped Linear Predictors)”(710乃至713頁、Proc.ProRISC Workshop CSSP、Veldhoven(NL)、2001年11月29乃至30日)、及びA.C.den Brinker氏他による“IIRフィルタを使用する線形予測構造体の安定性(Stability of Linear Predictive Structures using IIR filters)”(317乃至320頁、Proc.ProRISC Workshop CSSP、Veldhoven(NL)、2001年11月29乃至30日)において、無限インパルス応答(IIR(Infinite Impulse Response))型フィルタとしてより普通に考えられると共により関心のある周波数範囲(帯域)にエンコーダ/デコーダをチューニングするために使用されてもよいLaguerre及びKautz型フィルタが、図2(a)及び2(b)に示されるような形態で表され得る。
x(n)及びr(n)に関する図2(a)のフィルタに対する全伝達関数は
Figure 0004446883
となる。ここで、セットHは1セットの安定、因果性(causal)、線形、線形独立(linearly−independent)フィルタに属する伝達関数である。
セットHをLaguerreフィルタ、すなわち
Figure 0004446883
(ここで、λ∈(−1,1))として選択すると、全伝達Fは最小位相IIRフィルタ(minimum−phase IIR filter)となり得る。
λが実数且つ0よりも大きくなる場合、モデリングは、人間の耳がより敏感になるより低い周波数にシフトされ、λが0よりも小さくなる場合、モデリングはより高い周波数にシフトされる。λ=0の場合は、図1の従来例に対応している。
しかしながら、図2に示されている種類のフィルタに対する予測係数(prediction coefficient)を送信することに関する問題が存在する。すなわち、予測係数αのみに関連する多項式
Figure 0004446883
の根は最小位相フィルタをもたらし得ず、これによりこれらのパラメータの量子化の間にもたらされる雑音又は歪のためにデコーダにおける不安定性がもたらされ得る。
本発明によれば、請求項1に記載のオーディオ信号を符号化する方法がもたらされる。
本発明の好ましい実施例により、Laguerre型予測係数がFIRシステムの当該予測係数にマップされることを可能にする従来型LPC方式の拡張がもたらされ得る。それ故に従来型線形予測符号化技術(linear predictive coding technique)が、Laguerre予測係数を量子化及び送信又は記憶するために使用され得る。
本発明の実施例がこの場合添付図面を参照して記載されるであろう。
図2の概略図を使用して表されるLaguerre型フィルタの場合、全伝達関数F(z)は等式2と3との結合体として表され得る。すなわち
Figure 0004446883
となる。
前記係数が、例えばVoitishchuk氏他及びden Brinker氏によって開示されているようなデータ入力窓化方法(data−input windowing method)を使用して最適化される場合、伝達関数F(z)は最小位相システムになり得ることが知られている。
本発明の第一の実施例において、上記フィルタはK次の最小位相FIRフィルタにマップされるので、これらのLaguerre型予測係数は標準技術によって量子化され得ると共に送信され得る。
この場合本発明の第一の実施例によるエンコーダ14を示す図3(a)が参照される。エンコーダ14は、Voitishchuk氏他及びden Brinker氏によって開示されている種類のLaguerreフィルタコンポーネント16を含む。コンポーネント16は、フィルタの周波数感度を決定するλの値を備える。この値は、図3(b)のデコーダ22による後の使用のためにエンコーダによって生成されるビットストリーム50に符号化され得るか、又はさもなければλの値はデコーダ22によって知られ得る。
信号x(n)の場合、前記コンポーネントは1セットの予測係数αをもたらす。λの値と共にこれらの値は、図2(a)に示される態様で信号
Figure 0004446883
の推定値を生成するシンセサイザコンポーネント18に供給される。
しかしながら好ましい実施例において、予測係数αは変換コンポーネント20において変換される。コンポーネント20によって行われる変換は、上三角形Toeplitz行列(upper Triangular Toeplitz matrix)、すなわち
Figure 0004446883
の形態を使用して示される。ここで、αはLaguerre予測係数であり、
Figure 0004446883
となる。K+1係数c
は、
Figure 0004446883
でK次FIRフィルタの伝達関数G(ν)と関連付けられ得る。予測係数αが最小位相フィルタF(z)に属する場合、G(v)は最小位相FIRフィルタを表す。
図3(b)のデコーダ22において、逆変換(inverse transformation)が、順変換(forward transformation)コンポーネントによって生成される係数c...cについてコンポーネント24によって行われる。コンポーネント24に、エンコーダ14によって使用されるものと同じλがもたらされ、コンポーネント24によって行われる変換は上三角形Toeplitzの形態、すなわち
Figure 0004446883
を使用して示される。
この逆変換から、係数(c...c)は線形制約、すなわち
Figure 0004446883
を守っている(adhere)ことが理解されるであろう。パラメータcは、α...αk−1がc...cから
Figure 0004446883
のように再構成され得るため、冗長であるとみなされ得る。
エンコーダ14に戻ると、第一の実施例において、係数c...cは正規化(normalising)コンポーネント26に渡される。前記コンポーネントは係数c...cをcの値によって除算(divide)し、その結果1セットの係数d...dがもたらされる。しかしながら、係数c...cが今度は最小位相フィルタを表す場合、dの値は常に1であり、従って係数d...dは、伝達関数
Figure 0004446883
を備えるK次の最小位相FIRフィルタの予測係数に対応することが理解されるであろう。コンポーネント26において行われる正規化は、あるファクタによる全ての係数の単なる除算であるため、変換コンポーネント20及び正規化コンポーネント26の順序は変更させられ得る。すなわちまず正規化が行われ、それから変換が行われ得る。エンコーダにおいて、このことは、まず後述される対応する変更を伴うcの計算を必要とする。逆変換及び逆正規化(de−normalisation)の順序での同じ変更が後述されるデコーダにおいて行われ得ることも理解されるであろう。
正規化コンポーネント26は、係数d...dを、インデックスが異なると共に記号が反転されている場合以外に、係数が好ましくはLAR又はLSFパラメータに変換されると共に図1(a)のα係数の量子化に対して、対応する態様で量子化されるコンポーネント28に渡す。コンポーネント28は残留信号r(n)を受信し、これを適切に量子化し、その値を、信号x(n)を表すビットストリーム50を生成するマルチプレクシング(多重化)ユニット(multiplexing unit)30に渡す。それ故に、このビットストリームは、従来のFIRフィルタパラメータを含むビットストリームの場合と同じ形態で送信され得ることが理解されるであろう。代わりにビットストリームは、あるポイントにおいてλの値を含むようにわずかに修正されてもよいが、それ以外ではそれのフォーマットは変更される必要がない。
この場合図3(b)のデコーダ22にチューニングされるとき、ビットストリーム50はデマルチプレクシング(多重分離)ユニット(de−multiplexing unit)32によって復号化される。抽出された(引き出された)パラメータ(extracted parameter)は、残留信号r(n)及び正規化されたFIR型フィルタパラメータd...dを従来態様で生成する逆量子化コンポーネント(de−quantizing component)にもたらされる。
逆正規化コンポーネント36はまずcの値を決定するために使用される。等式5から、
Figure 0004446883
となることが理解され得るので、コンポーネント36は、エンコーダにおいて使用される値λがもたらされるとき等式
Figure 0004446883
を、cに対する値を決定するために使用し得る。等式7に対して、逆正規化コンポーネントにパラメータd...dのみがもたらされている間、d=1となることが仮定され得ることは注意されるべきである。従ってcが決定されると、残りの係数c...cはコンポーネント36によって
Figure 0004446883
となるように決定される。係数c...cは、逆正規化コンポーネント36によって上記の逆変換ユニット24にもたらされ、これにより、今度は図2(b)に示されているようにデコーダシンセサイザコンポーネント18’によって使用され得るLaguerreフィルタ予測係数αのセットがもたらされ、その結果推定された信号
Figure 0004446883
が生成される。これは、逆量子化器コンポーネント34によって供給される残留信号r(n)と結合され、その結果最終的に復号化された信号x(n)がもたらされる。
好ましい実施例のバリエーションが可能であることは理解されるであろう。例えば図4の本発明の第二の実施例において、Y.Tohkura氏、F.Itakura氏、及びS.Hashimoto氏による“PARCOR音声分析−合成におけるスペクトル平滑化技術(Spectral smoothing technique in PARCOR speech analysis−synthesis)”(IEEE会報、音響音声信号処理第26巻第587乃至596頁、1978年(IEEE Trans. Acoust. Speech Signal Process. vol.26, pp.587−596, 1978))に開示されているように、適応されたエンコーダ14’がピークブローデニング(ピーク拡大)(peak broadening)又は帯域幅延長(extension)/拡張(expansion)/拡大(widening)をもたらす。線形予測符号化におけるスペクトルピークブローデニングは、幾何級数的な減少数列(exponentially−decreasing sequence)でインパルス応答(予測係数)を乗算(multiply)することによってなされる。
本発明に関して、ピークブローデニングは、ピークブローデニングコンポーネント38を、第一の実施例の適応された正規化コンポーネント26’と変換コンポーネント20との間にインタポーズ(interpose)する(介在させる)ことによって実現される。
元のLaguerreフィルタ予測係数αの、係数c...cへの変換後、エンコーダはピークブローデニングが必要とされるかどうかを決定する。必要とされる場合、係数c...cはピークブローデニングコンポーネント38に渡される。これは、係数c...cをピークブローデニング応答で、例えば
Figure 0004446883
の形態で乗算する。前述のように線形制約は係数
Figure 0004446883
にもたらされることが必要とされる。従って、ピークブローデニングされたセットの係数が供給される場合、コンポーネント38又は26’の何れかが乗数(multiplier)c
Figure 0004446883
のように決定する。係数
Figure 0004446883
はこの乗数で
Figure 0004446883
のように除算されるので、もたらされる係数
Figure 0004446883
は等式5の制約を満足させる。正規化コンポーネント26’はそれから係数
Figure 0004446883
を正規化させることが可能であり、その結果、正規化型FIR係数(normalised type FIR coefficient)d...が前述のようにもたらされる。
ピークブローデニングが、最終的にピークブローデニング信号を読み出すデコーダ内で合成される信号に影響を及ぼし、ピークブローデニングがもたらされている場合、当該異なる残留信号r(n)がエンコーダ14’内で計算されるべきであることは理解されるであろう。
従って第二の実施例において、図2(b)のように、逆量子化器コンポーネント34に、コンポーネント28によって生成される量子化された信号がもたらされ、その結果、係数d...が、デコーダ内で生成され得るように正確にもたらされる。これらは今度はここでも図2(b)のコンポーネントに対応してコンポーネント36及び24によってそれぞれ逆正規化されると共に逆変換され、その結果、ピークブローデニングされた信号に対してデコーダ内で生成され得るように、1セットの予測係数
Figure 0004446883
が生成される。シンセサイザ18はそれから、ピークブローデニングがもたらされ得たかどうかに従って予測係数
Figure 0004446883
又はαを使用するか否かの何れかとなり、これを信号x(n)から減算(subtract)して、その結果、残留信号r(n)が生成される。
係数
Figure 0004446883
又は
Figure 0004446883
が逆変換コンポーネント24に直接もたらされている場合、同じ予測係数
Figure 0004446883
は上記のようにもたらされ得ないことが理解されるであろう。それにもかかわらず、このことはエンコーダ内のコンポーネント34及び36に対する必要性を除去せず、エンコーダが計算に関して制限される場合に許容され得る。
当該ピークブローデニングがビットストリームに復号化されるとき、もたらされる予測係数
Figure 0004446883
はスペクトルピークブローデニングされたLaguerre予測フィルタの係数となる。当該ピークブローデニングは周波数歪(ワープ)ドメイン(frequency warped domain)において行われている。このことは、エンコーダが実際サイコアコースティックに関連するスケールでピークブローデニングを行っていると共に、これによりピークブローデニング関数、例えばwが自身のサイコアコースティックな関数に基づいて選択され得ることを意味する。
第二の実施例のバリエーションにおいて、ピークブローデニングは、残留信号の生成のために必要とされる適切な変更を伴う係数c...ではなく係数d...にもたらされ得ることが理解されるであろう。
上記説明のように、元のオーディオ信号の最終的な推定値を生成するためにエンコーダ内で使用される予測係数はデコーダ内で使用される係数と同じになることを保証することが所望される。図5は、第一及び第二の実施例のエンコーダを含むエンコーダ14”のより汎用的な形態を示している。このエンコーダにおいて、送信、正規化、量子化、及び随意的なピークブローデニングのステップは、前述のようにコンポーネント20、26’、28、及び38/38’によってそれぞれ行われる(図5において、コンポーネント38/38’は、ピークブローデニングが38の前、又は38’の後の何れかに正規化を行い得ることを示している)。
しかしながらエンコーダの汎用的な形態において、残留信号を生成するためにエンコーダによって使用される予測係数が、デコーダにおいて使用される予測係数係数と正確に同じになることを保証する第二の実施例に示されるように、量子化された信号は逆量子化、逆正規化、及び逆変換コンポーネント24、26,及び24をそれぞれ通じてもたらされる。
発明が、第一の二つの実施例のように、信号
Figure 0004446883
を合成すると共にこれを信号x(n)から減算することによる残留信号r(n)の生成に限定されないことも図5から理解されるであろう。本発明の当該態様はより汎用的に、モデル化された態様の信号
Figure 0004446883
とその信号自身x(n)との間の差のインジケーションbを生成するために周波数感度パラメータ(frequency sensitizing parameter)λ、及びデコーダにおいて使用される予測係数を理想的に使用するエンコーダ18”を含むように考えられ得る。
デコーダ(図示略)において、対応するコンポーネントは、元のオーディオ信号の最終的な推定値を生成するためにこのインジケーションbを予測係数及び周波数感度パラメータλと結合させる。
図6は、図3(a)又は4に示されるようにエンコーダ14及び14’を含むオーディオ符号化器1と、図3(b)に示されるようにデコーダ22を含むオーディオプレーヤ3とを有する本発明によるオーディオシステムを示している。符号化されたオーディオストリーム50は、無線接続部、データバス、又は記憶媒体であってもよい通信チャネル2を介してオーディオ符号化器からオーディオプレーヤに供給される。通信チャネル2が記憶媒体である場合、当該記憶媒体は前記システムに固定されてもよく、取り外し可能なディスク、又はSONY社のメモリスティックTM(R)のような固形の記憶デバイス等であってもよい。通信チャネル2はオーディオシステムの一部であってもよいが、多くの場合オーディオシステムの外部にもたらされる。
本発明の保護範囲は上述の実施例に限定されるものではなく、当業者が特許請求の範囲からはずれることなく多くの代わりの実施例を設計することができることは注意されるべきである。請求項において、括弧の間に置かれる請求項の参照番号は、いずれも当該請求項の保護範囲を限定するものではない。単語“有する”は、請求項に記述される構成要素以外に構成要素又はステップの存在を排除するものではない。本発明は、いくつかの独特な構成要素によって、及び適切にプログラミングされたコンピュータによって実現可能である。いくつかの手段を列挙する装置の請求項において、いくつかのこれらの手段は、ハードウエアの一つ及び同じ構成要素によって具現化されることが可能である。ある手段が相互に異なる従属した請求項において再び引用されるという事実は、これらの手段の組み合わせが効果的に使われ得ないことを示すものではないということに過ぎない。
従来型線形予測構造体のためのエンコーダを示している。 従来型線形予測構造体のためのデコーダを示している。 代わりの線形予測方式のためのエンコーダを示している。 代わりの線形予測方式のためのデコーダを示している。 本発明の第一の実施例による線形予測方式のためのエンコーダを示している。 本発明の第一の実施例による線形予測方式のためデコーダを示している。 本発明の第二の実施例によるエンコーダを示している。 本発明の第一及び第二の実施例を含む通常のエンコーダを示している。 オーディオ符号化器及びオーディオプレーヤを有するシステムを示している。

Claims (12)

  1. オーディオ信号を符号化する方法であって、
    前記オーディオ信号に推定値をもたらすために周波数感度パラメータと一次結合され得る第一のセットのK次の無限インパルス応答フィルタ型指数をもたらすために前記感度パラメータに従って前記オーディオ信号をモデリングするステップと、
    有限インパルス応答フィルタ型指数と互換性のある第二のセットの指数をもたらすために前記感度パラメータの関数として前記第一又は第三のセットの指数を変換するステップと、
    前記第三のセットの指数をもたらすために前記第一又は前記第二のセットの指数を正規化するステップと、
    変換及び正規化されたセットのK次の指数の表現部を含む符号化されたオーディオストリームを生成するステップと
    を有する方法。
  2. 前記無限インパルス応答フィルタ型フィルタ指数は最小位相フィルタの要求仕様を満足し、前記有限インパルス応答フィルタ型指数は最小位相フィルタの要求仕様を満足する請求項1に記載の方法。
  3. 前記推定値を前記オーディオ信号から減算して残留信号をもたらし、前記生成するステップが、前記符号化されたオーディオストリームに前記残留信号を含ませるステップを含むステップ
    を更に有する請求項1に記載の方法。
  4. 前記モデリングするステップが、伝達関数
    Figure 0004446883
    を有するLaguerre型フィルタで前記オーディオ信号をモデリングするステップを有する請求項1に記載の方法。
  5. 前記変換ステップが、行列変換
    Figure 0004446883
    及び
    Figure 0004446883
    に従って前記Laguerreフィルタ係数を変換するステップを有する請求項4に記載の方法。
  6. 前記正規化するステップが、前記第二のセットのK+1次の指数を前記第二のセットの指数の一つで除算するステップと、前記第三のセットのK次の指数として前記除算されたセットの指数の剰余をもたらすステップとを有する請求項5に記載の方法。
  7. 前記生成するステップが、前記ビットストリームにおける前記周波数感度パラメータを含む請求項1に記載の方法。
  8. 前記セットのK+1次の指数をピークブローデニングするステップを更に有する請求項1に記載の方法。
  9. オーディオストリームを複号化する方法であって、
    有限インパルス応答フィルタ型指数と互換性のある第一のセットのK次の指数をもたらすためにオーディオ信号の表現部を含む符号化されたオーディオストリームを読み出すステップと、
    逆正規化指数をもたらすために前記第一のセットのK次の指数を周波数感度パラメータと結合するステップと、
    第二のセットの指数をもたらすために前記逆正規化指数の関数として前記第一又は第三の無限インパルス応答フィルタ型のセットの指数を逆正規化するステップと、
    前記第三のセットの指数をもたらすために前記感度パラメータの関数として前記第一又は前記第二のセットの指数を変換するステップと、
    前記周波数感度パラメータと1セットの逆正規化及び変換されたK次の指数との一次結合体として前記オーディオ信号を合成するステップと
    を有する方法。
  10. 前記オーディオ信号に推定値をもたらすために周波数感度パラメータと一次結合され得る第一のセットのK次の無限インパルス応答フィルタ型指数をもたらすために前記感度パラメータに従ってオーディオ信号をモデリングするための手段と、
    有限インパルス応答フィルタ型指数と互換性のある第二のセットの指数をもたらすために前記感度パラメータの関数として前記第一又は第三のセットの指数を変換するための手段と、
    前記第三のセットの指数をもたらすために前記第一又は前記第二のセットの指数を正規化するための手段と、
    変換及び正規化されたセットのK次の指数の表現部を含む符号化されたオーディオストリームを生成するための手段と
    を有するオーディオ符号化器。
  11. 有限インパルス応答フィルタ型指数と互換性のある第一のセットのK次の指数をもたらすためにオーディオ信号の表現部を含む符号化されたオーディオストリームを読み出すための手段と、
    逆正規化指数をもたらすために前記第一のセットのK次の指数を周波数感度パラメータと結合するための手段と、
    第二のセットの指数をもたらすために前記逆正規化指数の関数として前記第一又は第三の無限インパルス応答フィルタ型のセットの指数を逆正規化するための手段と、
    前記第三のセットの指数をもたらすために前記感度パラメータの関数として前記第一又は前記第二のセットの指数を変換するための手段と、
    前記周波数感度パラメータと1セットの逆正規化及び変換されたK次の指数との一次結合体として前記オーディオ信号を合成するための手段と
    を有するオーディオプレーヤ。
  12. 請求項10に記載のオーディオ符号化器と請求項11に記載のオーディオプレーヤとを有するオーディオシステム。
JP2004509924A 2002-05-30 2003-05-16 オーディオ符号化 Expired - Fee Related JP4446883B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP02077128 2002-05-30
PCT/IB2003/002044 WO2003102922A1 (en) 2002-05-30 2003-05-16 Audio coding

Publications (2)

Publication Number Publication Date
JP2005528646A JP2005528646A (ja) 2005-09-22
JP4446883B2 true JP4446883B2 (ja) 2010-04-07

Family

ID=29595018

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004509924A Expired - Fee Related JP4446883B2 (ja) 2002-05-30 2003-05-16 オーディオ符号化

Country Status (9)

Country Link
US (1) US20050228656A1 (ja)
EP (1) EP1514262B1 (ja)
JP (1) JP4446883B2 (ja)
KR (1) KR101038446B1 (ja)
CN (1) CN100343895C (ja)
AT (1) ATE336781T1 (ja)
AU (1) AU2003230132A1 (ja)
DE (1) DE60307634T2 (ja)
WO (1) WO2003102922A1 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1889256A2 (en) * 2005-05-25 2008-02-20 Koninklijke Philips Electronics N.V. Predictive encoding of a multi channel signal
DE102006022346B4 (de) * 2006-05-12 2008-02-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Informationssignalcodierung
TWI538000B (zh) 2012-05-10 2016-06-11 杜比實驗室特許公司 多階段過濾器,音頻編碼器,音頻解碼器,施行多階段過濾的方法,用以編碼音頻資料的方法,用以將編碼音頻資料解碼的方法,及用以處理編碼位元流的方法和裝置
CN104737463B (zh) * 2012-06-18 2018-03-16 瑞典爱立信有限公司 Mimo接收器中的预滤波
US9548056B2 (en) * 2012-12-19 2017-01-17 Dolby International Ab Signal adaptive FIR/IIR predictors for minimizing entropy
EP3098813B1 (en) * 2014-01-24 2018-12-12 Nippon Telegraph And Telephone Corporation Linear predictive analysis apparatus, method, program and recording medium
CN109188069B (zh) * 2018-08-29 2020-08-28 广东石油化工学院 一种用于负载开关事件检测的脉冲噪声滤除方法
CN118136042B (zh) * 2024-05-10 2024-07-23 四川湖山电器股份有限公司 基于iir频谱拟合的频谱优化方法、系统、终端及介质

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4493048A (en) * 1982-02-26 1985-01-08 Carnegie-Mellon University Systolic array apparatuses for matrix computations
US7423983B1 (en) * 1999-09-20 2008-09-09 Broadcom Corporation Voice and data exchange over a packet based network
JP2001134295A (ja) * 1999-08-23 2001-05-18 Sony Corp 符号化装置および符号化方法、記録装置および記録方法、送信装置および送信方法、復号化装置および符号化方法、再生装置および再生方法、並びに記録媒体
US6931373B1 (en) * 2001-02-13 2005-08-16 Hughes Electronics Corporation Prototype waveform phase modeling for a frequency domain interpolative speech codec system

Also Published As

Publication number Publication date
JP2005528646A (ja) 2005-09-22
KR101038446B1 (ko) 2011-06-01
US20050228656A1 (en) 2005-10-13
DE60307634D1 (de) 2006-09-28
EP1514262B1 (en) 2006-08-16
ATE336781T1 (de) 2006-09-15
CN1656537A (zh) 2005-08-17
WO2003102922A1 (en) 2003-12-11
EP1514262A1 (en) 2005-03-16
KR20050007574A (ko) 2005-01-19
DE60307634T2 (de) 2007-08-09
AU2003230132A1 (en) 2003-12-19
CN100343895C (zh) 2007-10-17

Similar Documents

Publication Publication Date Title
CN101925950B (zh) 音频编码器和解码器
US20070124139A1 (en) Method and apparatus for one-stage and two-stage noise feedback coding of speech and audio signals
US20070118370A1 (en) Methods and apparatuses for variable dimension vector quantization
JPS63113600A (ja) 音声信号の符号化及び復号化のための方法及び装置
JP4446883B2 (ja) オーディオ符号化
JP3248668B2 (ja) ディジタルフィルタおよび音響符号化/復号化装置
JP2002268686A (ja) 音声符号化装置及び音声復号化装置
JP3357829B2 (ja) 音声符号化/復号化方法
JP4359949B2 (ja) 信号符号化装置及び方法、並びに信号復号装置及び方法
JP4281131B2 (ja) 信号符号化装置及び方法、並びに信号復号装置及び方法
US9620139B2 (en) Adaptive linear predictive coding/decoding
JP4438280B2 (ja) トランスコーダ及び符号変換方法
JP4618823B2 (ja) 信号符号化装置及び方法
JP3481027B2 (ja) 音声符号化装置
JP3578933B2 (ja) 重み符号帳の作成方法及び符号帳設計時における学習時のma予測係数の初期値の設定方法並びに音響信号の符号化方法及びその復号方法並びに符号化プログラムが記憶されたコンピュータに読み取り可能な記憶媒体及び復号プログラムが記憶されたコンピュータに読み取り可能な記憶媒体
JP4489371B2 (ja) 合成音声を最適化する方法、音声合成フィルタを生成する方法、音声最適化方法及び音声最適化装置
EP1267327B1 (en) Optimization of model parameters in speech coding
den Brinker et al. Pure linear prediction
JP3552201B2 (ja) 音声符号化方法および装置
Srivastava Fundamentals of linear prediction
JP3192999B2 (ja) 音声符号化方法および音声符号化方法
JP3192051B2 (ja) 音声符号化装置
JPH0455899A (ja) 音声信号符号化方式
Yuan The weighted sum of the line spectrum pair for noisy speech
Eng et al. High Order LPC and Line Spectrum Pairs

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060515

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090903

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091127

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20091222

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100119

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130129

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4446883

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140129

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees