JP4803938B2 - オーディオ符号化用のラゲール関数 - Google Patents

オーディオ符号化用のラゲール関数 Download PDF

Info

Publication number
JP4803938B2
JP4803938B2 JP2001567585A JP2001567585A JP4803938B2 JP 4803938 B2 JP4803938 B2 JP 4803938B2 JP 2001567585 A JP2001567585 A JP 2001567585A JP 2001567585 A JP2001567585 A JP 2001567585A JP 4803938 B2 JP4803938 B2 JP 4803938B2
Authority
JP
Japan
Prior art keywords
shape
function
signal component
audio
transient
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2001567585A
Other languages
English (en)
Other versions
JP2003527632A5 (ja
JP2003527632A (ja
Inventor
アーノルダス ダヴリュー ジェイ オーメン
ブリンカー アルベルタス シー デン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips NV
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips NV, Koninklijke Philips Electronics NV filed Critical Koninklijke Philips NV
Publication of JP2003527632A publication Critical patent/JP2003527632A/ja
Publication of JP2003527632A5 publication Critical patent/JP2003527632A5/ja
Application granted granted Critical
Publication of JP4803938B2 publication Critical patent/JP4803938B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Cereal-Derived Products (AREA)
  • Stereophonic System (AREA)
  • Reverberation, Karaoke And Other Acoustics (AREA)

Description

【0001】
【技術分野】
本発明は、過渡信号成分が符号化されるようなオーディオ信号の符号化に関する。
【0002】
本発明は、更に、オーディオ信号の復号にも関する。
【0003】
また、本発明はオーディオコーダ、オーディオプレーヤ、オーディオシステム、オーディオストリーム及び記憶媒体にも関する。
【0004】
【背景技術】
ITC Fachbericht1998、第146号、第35〜40頁のPurnhagen及びEdlerによる“Objektbasieter Analyse/Synthese Audio Coder fur sehr niedrige Datenraten”なる論文は、オーディオ信号を低ビットレートで符号化する装置を開示している。モデルに基づく解析/合成装置が使用され、該装置においては入力信号が3つの部分:即ち単一正弦波、高調波音及び雑音、に分割される。該入力信号は、更に、32msの固定フレームに分割される。全てのブロック及び信号部分に関して、ソースモデルに基づきパラメータが抽出される。過渡信号部分の表現を改善するために、上記入力信号から包絡線関数α(t)が導出され、選択された正弦波に適用される。該包絡線関数は、図1に示すようなパラメータratk、rdec、tmaxにより決まる2つの線分からなる。
【0005】
【発明の開示】
本発明の1つの目的は、ビットレート及び知覚の点で有利なオーディオ符号化方法を提供することにある。この目的のため、本発明は、独立請求項に記載されたような符号化及び復号方法、オーディオコーダ、オーディオプレーヤ、オーディオシステム、オーディオストリーム並びに記憶媒体を提供する。有利な実施例は、従属請求項に記載されている。
【0006】
本発明の第1実施例は、前記オーディオ信号における過渡信号成分の位置を推定するステップと;該過渡信号成分が初期増加の後に徐々に減衰する場合に、該過渡信号成分に形状関数を整合させるステップであって、該形状関数が に略従う初期振る舞いと、該初期振る舞いの後のe −αt に略従う減衰的振る舞いとを有し、ここでtは時間であり、n及びαは当該形状関数の形を記述するパラメータである。本発明は、斯様な関数が過渡信号成分を良好に表す一方、該関数を少数のパラメータにより記述することができ、これはビットレート及び知覚品質の点で有利であるという洞察に基づいている。本発明は、過渡信号成分が持続信号成分とは別に符号化されるような実施例において特に有利である。何故なら、これらの実施例においては過渡信号成分の良好な表現が特に重要であるからである。
【0007】
本発明の他の特徴によれば、上記形状関数はラゲール関数であり、連続時間では、
【数1】
Figure 0004803938
により与えられ、ここでcはスケーリングパラメータ(1を取ることができる)である。特別な実施例においては、時間離散ラゲール関数が使用される。
【0008】
過渡信号成分は、電力(若しくは振幅)の急激な変化、又は波形パターンの急激な変化として知覚することができる。斯様な過渡信号成分の検出は、従来既知である。例えば、1998年9月ギリシャ、ロードスにおけるEUSIPCO-98信号処理IX、理論及び応用の論文集、第2345〜2348頁の、J. Kliewer及びA. Mertinによる“過渡信号セグメントの改善された表現を伴うオーディオサブバンド符号化”には、過渡検出機構が提案され、該機構はアタック開始位置の前後のエネルギレベルの差に基づいている。本発明による実用的な実施例においては、振幅レベルの急激な変化が考慮される。
【0009】
本発明の好ましい実施例においては、上記形状関数は一般化離散ラゲール関数である。メイクスナ(Meixner)及びメイクスナ様(Meixner-like)関数が、使用するのには現実的であり、驚くほど良好な結果を与える。斯様な関数は、Int. J. 回路理論応用、23、1995年、第237〜246頁の、A.C. den Brinkerによる“有利z変換を有するメイクスナ様関数”で議論されている。これらの形状関数のパラメータは簡単な方法で導出することができる。
【0010】
本発明の他の実施例においては、当該過渡信号成分が振幅のステップ状変化である場合、形状パラメータはステップ指示子を含む。上記ステップ状変化の後の信号は持続コーダにおいて有利に符号化される。
【0011】
本発明の他の好ましい実施例においては、過渡信号成分の位置は開始位置である。適応的フレーム化のために過渡信号成分の開始位置を与えるのが有利であり、該フレーム化においてはフレームは過渡信号成分の開始位置で始まる。該開始位置は上記形状関数と上記フレーム化との両方に使用され、結果として効率的な符号化が達成される。開始位置が与えられた場合、Edlerにより記載された実施例においては必要であったように、2つのパラメータを合成することにより開始位置を決定する必要はない。
【0012】
本発明の上記及び他の特徴は、以下に述べる実施例から明らかとなり、斯かる実施例を参照して解説されるであろう。
【0013】
尚、図面は本発明を理解するのに必要な構成要素のみを図示している。
【0014】
【発明を実施するための最良の形態】
図2は、本発明によるオーディオコーダ1を示し、入力オーディオ信号x(t)を得るための入力ユニット10を有している。該オーディオコーダ1は、上記入力信号を3つの成分、即ち過渡信号成分、持続決定的成分及び持続確率的成分に分離する。該オーディオコーダ1は、過渡コーダ11、正弦波コーダ13及び雑音コーダ14を有している。当該オーディオコーダは、任意選択的に、利得圧縮機構(GC)12を有している。
【0015】
本発明のこの有利な実施例においては、過渡符号化は持続符号化の前に実行される。これは、過渡信号成分が持続コーダでは効率的及び最適には符号化されないので、有利である。もし、持続コーダが過渡信号成分を符号化するために使用されると、多くの符号化努力が必要となる。例えば、過渡信号成分を持続正弦波のみで符号化することが困難であることは想像することができるであろう。従って、過渡信号成分を、符号化されるべきオーディオ信号から符号化前に削除することは、有利である。上記過渡コーダにおいて抽出される過渡開始位置は、持続コーダにおいて適応的セグメント化(適応的フレーム化)に使用され、その結果、持続符号化の性能が更に改善される。
【0016】
過渡コーダ11は、過渡検出器(TD)110と、過渡解析器(TA)111と、過渡合成器(TS)112とを有している。先ず、信号x(t)が過渡検出器110に入る。この検出器110は、過渡信号成分が存在するか、及びどの位置であるかを推定する。この情報は、過渡解析器111に供給される。この情報は、有利な信号に誘起されたセグメント化を得るために、正弦波コーダ13及び雑音コーダ14においても使用される。過渡信号成分の位置が決定された場合、過渡解析器111は、該過渡信号成分(の主要部分)を抽出するよう試みる。該解析器は形状関数を、好ましくは推定された開始位置で始まる信号セグメントと整合し、該形状関数の下の内容、例えば(少)数の正弦波成分を決定する。この情報は、過渡コードCに含まされる。該過渡コードCは過渡合成器112に供給される。合成された過渡信号成分は減算器16において前記入力信号x(t)から減算され、結果として信号xが得られる。GC12が削除された場合は、x=xとなる。信号xは正弦波コーダ13に供給されて、正弦波解析器(SA)130において解析され、該解析器は(決定的)正弦波成分を決定する。この情報は、正弦波コードCに含められる。該正弦波コードCから、正弦波合成器(SS)131により正弦波信号成分が再生される。この信号は、減算器17において正弦波コーダ13への入力xから減算され、結果として(大きな)過渡信号成分及び(主な)決定的正弦波成分を含まない残存信号xが得られる。従って、該残存信号xは主に雑音からなると推定される。該信号は、雑音解析器(NA)14においてERBスケールに従い電力内容が解析される。雑音解析器14は、雑音コードCを生成する。正弦波コーダ13におけるのと同様に、雑音解析器14も前記過渡信号成分の開始位置を新たな解析ブロックを開始する位置として使用することができる。正弦波解析器130及び雑音解析器14のセグメント寸法は必ずしも等しい必要はない。マルチプレクサ15においては、オーディオストリームASが構成され、該ストリームは上記コードC、C及びCを含んでいる。該オーディオストリームASは、例えばデータバス、アンテナ系又は記憶媒体等に供給される。
【0017】
以下においては、本発明による過渡信号成分の表現が議論される。この実施例において、過渡成分用コードCは、該形状の下のパラメータ的形状及び追加の主要な周波数成分(又は他の内容)、又はステップ状の変化を識別するコードの何れかからなる。本発明の好ましい実施例によれば、初期増加の後徐々に減衰している過渡現象用の形状関数は、好ましくは一般化離散ラゲール関数とする。他の型の過渡信号成分に対しては、他の関数を使用することができる。
【0018】
一般化離散ラゲール関数の一例は、メイクスナ(Meixner)関数である。離散零次メイクスナ関数g(t)は:
【数2】
Figure 0004803938
により与えられ、ここで、t=0,2,…であり、(b)t=b(b+1)…(b+t-1)はポクハンマ(Pochhammer)記号である。パラメータbは一般化の次数(b>0)を表し、当該関数の初期形状を決定する:小さなtに対しては大凡f∝t(b-1)/2。パラメータξは0<ξ<1の極を示し、大きなtに対する減衰を決定する。関数g(t)はtの全ての値に対して正の関数である。b=1に対して、離散ラゲール関数が求められる。更に、b=1に関しては、gのz変換はzでの有利関数であり、従って一次無限インパルス応答(IIR)フィルタのインパルス応答として実現することができる。bの他の全ての値に関しては、有利z変換は存在しない。関数g(t)は正規化エネルギ、即ち、
【数3】
Figure 0004803938
である。零次メイクスナ関数は:
【数4】
Figure 0004803938
により帰納的に作成することができる。
【0019】
本発明の他の実施例においては、メイクスナ様の関数が使用される。何故なら、それらは有利z変換を有しているからである。メイクスナ様の関数の一例が図3に示されている。離散零次メイクスナ様関数h(t)は、そのz変換:
【数5】
Figure 0004803938
により与えられ、ここでa=0,1,2,…であり、Cは:
【数6】
Figure 0004803938
により与えられ、ここでPは:
【数7】
Figure 0004803938
で与えられるa次のルジャンドル多項式である。パラメータaは一般化の次数(aは負でない整数である)を表し、ξは0<ξ<1の極である。パラメータaは当該関数の初期形状を決定する:小さなtに対してはf∝t。パラメータξは大きなtに対する減衰を決定する。関数hは、tの全ての値に対して正の関数であり、エネルギ正規化される。aの全ての値に対して、関数hは有利z変換を有し、(a+1次の)IIRフィルタのインパルス応答として実現することができる。
【0020】
関数h(t)は:
【数8】
Figure 0004803938
により、有限離散ラゲール系列で表すことができ、ここでφは離散ラゲール関数である(A.C. den Brinkerの論文参照)。Bは:
【数9】
Figure 0004803938
で与えられる。
【0021】
或る関数f(t)の一次及び二次のランニング中央モーメント(running central moments)は:
【数10】
Figure 0004803938
により定義され、ここでkは過渡信号成分の開始位置である。
【0022】
入力オーディオ信号のランニング中央モーメントT及びTの良好な推定を用いれば(式10及び式11において、f(t)=x(t)を取る)、形状パラメータを推定することができる。残念ながら、実データにおいては過渡信号成分には、通常、持続励起フェーズが後続し、ランニングモーメントの可能な測定を妨害する。図4は、入力オーディオ信号の一次及び二次ランニング中央モーメントを示している。ランニングモーメントは初期には推定開始位置から線形に増加し、後に飽和する傾向にあるように思われる。この曲線から形状パラメータは推定することはできるが、上記飽和はパラメータ抽出に望まれるほど明確ではないので、何れのkでT及びTの良好な推定が得られるか十分に明確ではない。本発明の有利な実施例においては、ランニングモーメントT及びTの初期増加における比が形状パラメータを推定するために使用される。この測定は、b(及び、零次メイクスナ関数の場合はa)を決定する場合に有利である。何故なら、bは当該形状の初期の振る舞いを決定するからである。ランニングモーメントT及びTの傾斜の間の比から、bに関する良好な推定が得られる。シミュレーション結果から、非常に良好な程度に傾斜T/傾斜Tなる比とパラメータbとの間に線形な関係が存在し、該関係はラゲール関数とは対照的に減衰パラメータξに僅かに依存することが分かった。記述として:
メイクスナに対しては: 傾斜T/傾斜T=b+1/2 (12)
メイクスナ様に対しては: 傾斜T/傾斜T=2a+3/2 (13)
を使用することができ(実験により導出)、ここでξ依存は無視された。k=kに対してT及びTは零であるので、傾斜T/傾斜Tは適切なkに対してT/Tにより近似することができる。
【0023】
形状の極ξは、下記の方法で推定することができる。二次多項式がランニング中央モーメント、例えばT、に適合される。この多項式は、観測時間TのTなる信号セグメントに、横ばいが明確に見えるように、即ち該多項式の明確な二次項がTに合うように、適合される。次に、二次多項式がその極大まで補外され、この値がTの飽和レベルであると仮定される。T及びbに関するこの値から、f(t)=g(t)で式2及び式10を用いることによりξが算出される。メイクスナ様関数に関しては、ξはT及びaに対する値から、f(t)=h(t)で式8〜式10を用いることにより算出される。
【0024】
減衰パラメータξの推定手順は下記の通りである。
Tの何らかの値で開始し、
二次多項式を0からTでデータに適合する、即ちt=[0,T]に対してT(t)≒c+ct+c、ここでc、c、cは適合係数である、
この多項式の二次項(quadratic term)がt=Tにおいて必須であるかをチェックする:T(T)<(1−ε)(c+cT)、ここでεはt=Tにおける上記二次項の相対貢献度を表す、
これが満たされた場合は、T(t)をその極大まで補外し、これをTと等式化する:T=c−c /4c
及びb(又はa)から減衰パラメータξを算出する。
メイクスナ様関数の場合は、形状パラメータaは好ましくは整数に丸められる。
【0025】
図5は、入力オーディオ信号から導出される形状関数の一例を示している。
【0026】
本発明にとり前処理は必須ではないが、形状の最初の近似を得るために、当該データのヒルベルト変換を実行する如きの、何らかの前処理を実行することができる。
【0027】
ランニングモーメントが飽和する値が大きい場合、即ちセグメント/フレーム長のオーダの場合、メイクスナ(様)形状は破棄される。当該過渡現象が振幅のステップ状の変化である場合、該過渡現象の位置は正弦波コーダ及び雑音コーダにおける適切なセグメント化のために保持される。
【0028】
開始位置及び過渡現象の形状が決定された後、当該形状の下の信号内容が推定される。当該形状の下で、(少)数の正弦波が推定される。これは、既知のように解析/合成単位の手順で実行される。正弦波を推定するために使用されるデータは、当該過渡現象は含むが如何なる結果としての持続応答も含まないように窓処理された(windowed)セグメントである。従って、上記解析/合成単位の方法に入る前に、当該データに時間窓が適用される。本質的に、考慮される信号は、上記開始位置から、形状がその極大の或る割合まで減少される何れかのサンプルまで延在する。窓処理されたデータは、例えば離散フーリエ変換(DFT)により、周波数ドメインに変換することができる。多分推定された過渡現象を越えて延びる低周波数成分を避けるために、周波数ドメインにおける窓も適用される。次に、最大応答が決定され、この最大応答に関連する周波数も決定される。推定された形状は、この周波数により変調され、当該データに対して、例えば音響心理学的モデル等の何らかの所定の規準に従って、又は最小自乗的に、最良の可能性のある適合がなされる。この推定された過渡セグメントは元の過渡現象から減算され、該手順は最大数の正弦波成分が超過されるまで、又は当該セグメントに如何なるエネルギも殆ど残存されなくなるまで、繰り返される。本質的に、過渡現象は変調されたメイクスナ関数の和により表される。実用的な実施例においては、6個の正弦波が推定される。潜在的内容が主に雑音を含む場合、雑音推定が使用されるか、又は任意の値が正弦波の周波数に関して付与される。
【0029】
過渡コードCは、過渡現象の開始位置と過渡現象の型とを含んでいる。メイクスナ(様)形状の場合における過渡現象用のコードは:
該過渡現象の位置;
形状がメイクスナ(様)関数であることの指示子;
形状パラメータb(又はa)及びξ;
変調条件:N周波数パラメータ及び正弦(余弦)変調された形状の振幅;
を含む。
【0030】
当該過渡現象が本質的に振幅レベルの急激な増加であり、開始位置の後の(比較的)短い期間、このレベルの明確な減衰がない場合、該過渡現象はメイクスナ(様)形状では符号化することはできない。その場合、上記開始位置は適切な信号セグメント化を得るために維持される。ステップ状過渡現象に関するコードは:
該過渡現象の開始位置;
ステップに関する指示子;
を含む。
【0031】
後続の持続符号化段(正弦波及び雑音)の性能は、当該信号のセグメント化において過渡位置を使用することにより改善される。正弦波コーダ及び雑音コーダは、検出された過渡現象の位置における新たなフレームで開始する。このようにして、静止しない振る舞いを呈するとして知られている、信号部分にわたる平均化を防止する。このことは、過渡セグメントの前のセグメントは短縮されるか、ずらされるか、又は前のフレームと連結されねばならないことを意味する。
【0032】
本発明によるオーディオコーダ1は、任意選択的に、持続コーダ13及び14の前に利得制御要素12を有する。持続コーダにとっては、振幅レベルの変動を防止するのが有利である。ステップ状過渡現象に関しては、この問題は過渡現象に従うセグメント化を用いることにより解決される。形状を用いて表される過渡現象に関しては、該問題は、入力信号から過渡現象を抽出することにより部分的に解決される。残存信号は依然として振幅レベルの大きな動的変化を含む可能性があり、多分、推定された形状に類似した形状である。該残存信号を平坦化するために、上記利得制御要素を使用することができる。圧縮レートは:
【数11】
Figure 0004803938
により定義され、ここでh(t)は推定される形状であり、dは圧縮レートを記述するパラメータである。上記利得制御要素は、過渡現象の後、静止フェーズが推定形状における最大の約0.2倍に達する振幅行程で発生すると仮定する。比rは:
【数12】
Figure 0004803938
により定義され、ここでMは残存信号の極大である。r>2の場合、圧縮レートパラメータdはrに等しく、それ以外では、dは零とされる。圧縮に関しては、dのみが伝送される必要がある。
【0033】
図6は、本発明によるオーディオプレーヤ3を示している。例えば図2によるエンコーダにより発生されたオーディオストリームAS’は、データバス、アンテナ系、又は記憶媒体等から得られる。該オーディオストリームAS’はデマルチプレクサ30においてデマルチプレクスされ、コードC’、C’及びC’を得る。これらコードは、過渡合成器31、正弦波合成器32及び雑音合成器33に各々供給される。過渡コードC’からは、過渡合成器31において過渡信号成分が算出される。該過渡コードが形状関数を示す場合は、受信されたパラメータに基づいて形状が計算される。更に、形状内容が、正弦波成分の周波数及び振幅に基づいて計算される。過渡コードC’がステップを示す場合は、過渡現象は計算されない。総過渡信号yは全ての過渡現象の和である。
【0034】
伸張パラメータdが使用される場合、即ちコーダ1において導出され、オーディオストリームAS’に含まれる場合は、伸張機構34が使用される。利得信号g(t)は1に初期化され、合計の振幅伸張係数が全ての異なる伸張係数の積として算出される。過渡現象がステップの場合は、振幅伸張係数は計算されない。
【0035】
2つの連続する過渡位置から、正弦波合成SS32及び雑音合成NS33に関するセグメント化が計算される。正弦波コードCが、所与のセグメント上の正弦波の和として記述される信号yを発生するために使用される。雑音コードCが雑音信号yを発生するために使用される。連続するセグメントは、例えば重なり加算法(overlap-add method)により加算される。
【0036】
合計信号y(t)は、正弦波信号yと雑音信号yとの和の振幅伸張gによる積と、過渡信号yとの和からなる。該オーディオプレーヤは、各信号の和をとるために2つの加算器36及び37を有している。上記合計信号は出力ユニット35に供給され、該ユニットは例えばスピーカである。
【0037】
図7は本発明によるオーディオシステムを示し、図2に示すようなオーディオコーダ1と、図6に示すようなオーディオプレーヤ3とを有している。斯様なシステムは、再生及び記録機能を提供する。オーディオストリームASは通信チャンネル2を介して上記オーディオコーダから上記オーディオプレーヤに供給され、該チャンネルは無線接続、データバス又は記憶媒体であり得る。通信チャンネル2が記憶媒体である場合、該記憶媒体は当該システム内に固定することができるか、又は着脱可能ディスク、メモリスティック等であり得る。通信チャンネル2は当該オーディオシステムの一部とすることもできるが、時には当該オーディオシステムの外部とすることもできる。
【0038】
尚、上述した実施例は本発明を制限するというよりは解説するものであり、当業者であれば添付請求項の範囲から逸脱することなく多くの他の実施例を設計することができるであろうことに注意すべきである。各請求項において、括弧内に配置された如何なる参照符号も当該請求項を限定するものとみなしてはならない。“有する”なる用語は、請求項に記載されたもの以外の他の要素及びステップの存在を排除するものではない。本発明は、幾つかの個別素子を有するハードウェアにより、及び適切にプログラムされたコンピュータにより構成することができる。幾つかの手段を列挙する装置請求項において、これらの手段の幾つかはハードウェアの1つの且つ同一の物により具現化することができる。或る手段が相互に異なる従属請求項に記載されるという事実のみでは、これらの手段の組合せが有利に使用することができないということを示すことにはならない。
【0039】
要約すると、本発明はオーディオ信号を符号化及び復号する方法であって、該オーディオ信号における過渡信号成分の位置を推定し、該過渡信号成分が初期増加の後に徐々に減衰する場合に該過渡信号成分に形状関数を整合させ、ここで該形状関数は略指数関数的な初期の振る舞いと略対数関数的な減衰の振る舞いとを有するものであり、更に、上記位置と上記形状関数を記述する形状パラメータとをオーディオストリームに含めるような各ステップを含む。
【図面の簡単な説明】
【図1】 図1は、既述した既知の包絡線関数を示す。
【図2】 図2は、本発明によるオーディオコーダの一実施例を示す。
【図3】 図3は、本発明による形状関数の一例を示す。
【図4】 図4は、入力オーディオ信号の一次及び二次のランニング中央モーメントのグラフを示す。
【図5】 図5は、入力オーディオ信号から導出された形状関数の一例を示す。
【図6】 図6は、本発明によるオーディオプレーヤの一実施例を示す。
【図7】 図7は、オーディオコーダ及びオーディオプレーヤを有するシステムを示す。

Claims (11)

  1. オーディオ信号を符号化する方法において、該方法が、
    検出器により、前記オーディオ信号における過渡信号成分の位置を推定するステップであって、前記過渡信号成分は初期増加の後に徐々に減衰する信号成分である、ステップと、
    解析器により、該過渡信号成分に形状関数を整合させるステップであって、tを時間とし、n及びαを前記形状関数を記述する形状パラメータとした場合に、該形状関数が実質的にtに従う初期の振る舞いと、実質的にe−αtに従う該初期の振る舞いの後の減衰の振る舞いとを有するようなステップと、
    合成器により、前記位置と、前記形状パラメータとをオーディオストリームに含めるステップと、
    を有していることを特徴とする方法。
  2. 請求項1に記載の方法において、前記形状関数がラゲール関数又は一般化離散ラゲール関数であることを特徴とする方法。
  3. 請求項2に記載の方法において、前記形状関数がメイクスナ関数又はメイクスナ様関数であることを特徴とする方法。
  4. 請求項2に記載の方法において、前記形状パラメータの少なくとも1つが、前記オーディオ信号のランニング一次及び二次モーメントの傾斜の比により決定されることを特徴とする方法。
  5. 請求項1に記載の方法において、前記形状パラメータは前記過渡信号成分が振幅のステップ状変化である場合にステップ指示子を含むことを特徴とする方法。
  6. 請求項1に記載の方法において、前記過渡信号成分の位置が開始位置であることを特徴とする方法。
  7. 請求項1に記載の方法において、該方法が、
    少なくとも1つの持続符号化段に供給される前記オーディオ信号の一部を、利得制御機構において前記形状関数を用いることにより平坦化するステップを、
    更に有していることを特徴とする方法。
  8. オーディオストリームを復号する方法において、該方法が、合成器により、
    受信された位置情報に基づく所与の位置において、初期増加の後に徐々に減衰する過渡信号成分を発生するステップと、
    受信された形状パラメータに基づいて該過渡信号成分の形状関数を計算するステップであって、tが時間であり、n及びαが前記形状パラメータである場合に、該形状関数が実質的にtに従う初期の振る舞いと、実質的にe−αtに従う該初期の振る舞いの後の減衰の振る舞いとを有するようなステップと、
    を有していることを特徴とする方法。
  9. オーディオ信号における、初期増加の後に徐々に減衰する過渡信号成分の位置を推定する手段と、
    過渡信号成分に形状関数を整合させる手段であって、tを時間とし、n及びαを前記形状関数を記述する形状パラメータとした場合に、該形状関数が実質的にtに従う初期の振る舞いと、実質的にe−αtに従う該初期の振る舞いの後の減衰の振る舞いとを有するような手段と、
    前記位置と、前記形状パラメータとをオーディオストリームに含める手段と、
    を有していることを特徴とするオーディオコーダ。
  10. 受信された位置情報に基づく所与の位置において、初期増加の後に徐々に減衰する過渡信号成分を発生する手段と、
    受信された形状パラメータに基づいて該過渡信号成分の形状関数を計算する手段であって、tが時間であり、n及びαが前記形状パラメータである場合に、該形状関数が実質的にtに従う初期の振る舞いと、実質的にe−αtに従う該初期の振る舞いの後の減衰の振る舞いとを有するような手段と、
    を有していることを特徴とするオーディオプレーヤ。
  11. 請求項9に記載のオーディオコーダと請求項10に記載のオーディオプレーヤとを有することを特徴とするオーディオシステム。
JP2001567585A 2000-03-15 2001-03-05 オーディオ符号化用のラゲール関数 Expired - Lifetime JP4803938B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP00200939.7 2000-03-15
EP00200939 2000-03-15
PCT/EP2001/002424 WO2001069593A1 (en) 2000-03-15 2001-03-05 Laguerre fonction for audio coding

Publications (3)

Publication Number Publication Date
JP2003527632A JP2003527632A (ja) 2003-09-16
JP2003527632A5 JP2003527632A5 (ja) 2008-04-24
JP4803938B2 true JP4803938B2 (ja) 2011-10-26

Family

ID=8171205

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001567585A Expired - Lifetime JP4803938B2 (ja) 2000-03-15 2001-03-05 オーディオ符号化用のラゲール関数

Country Status (9)

Country Link
US (2) US6925434B2 (ja)
EP (1) EP1190415B1 (ja)
JP (1) JP4803938B2 (ja)
KR (1) KR100780561B1 (ja)
CN (1) CN1154975C (ja)
AT (1) ATE369600T1 (ja)
DE (1) DE60129771T2 (ja)
ES (1) ES2292581T3 (ja)
WO (1) WO2001069593A1 (ja)

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1190415B1 (en) * 2000-03-15 2007-08-08 Koninklijke Philips Electronics N.V. Laguerre function for audio coding
ATE334556T1 (de) * 2001-04-18 2006-08-15 Koninkl Philips Electronics Nv Audiokodierung mit partieller enkryption
CN1237507C (zh) * 2001-06-08 2006-01-18 皇家菲利浦电子有限公司 音频信号的编辑
JP2005506582A (ja) * 2001-10-26 2005-03-03 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオコーダにおける正弦波パラメータのトラッキング
JP2005533271A (ja) 2002-07-16 2005-11-04 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオ符号化
KR101001170B1 (ko) 2002-07-16 2010-12-15 코닌클리케 필립스 일렉트로닉스 엔.브이. 오디오 코딩
SG108862A1 (en) * 2002-07-24 2005-02-28 St Microelectronics Asia Method and system for parametric characterization of transient audio signals
ATE381092T1 (de) 2002-11-29 2007-12-15 Koninkl Philips Electronics Nv Audiodekodierung
ATE425533T1 (de) * 2003-07-18 2009-03-15 Koninkl Philips Electronics Nv Audiocodierung mit niedriger bitrate
CN1846253B (zh) 2003-09-05 2010-06-16 皇家飞利浦电子股份有限公司 低比特率音频编码
WO2005024784A1 (en) * 2003-09-09 2005-03-17 Koninklijke Philips Electronics N.V. Encoding of transient audio signal components
US7725310B2 (en) 2003-10-13 2010-05-25 Koninklijke Philips Electronics N.V. Audio encoding
JP2007512572A (ja) * 2003-12-01 2007-05-17 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオ符号化
EP1914722B1 (en) 2004-03-01 2009-04-29 Dolby Laboratories Licensing Corporation Multichannel audio decoding
US7587313B2 (en) 2004-03-17 2009-09-08 Koninklijke Philips Electronics N.V. Audio coding
EP1756807B1 (en) * 2004-06-08 2007-11-14 Koninklijke Philips Electronics N.V. Audio encoding
JP4318119B2 (ja) * 2004-06-18 2009-08-19 国立大学法人京都大学 音響信号処理方法、音響信号処理装置、音響信号処理システム及びコンピュータプログラム
US20090070118A1 (en) * 2004-11-09 2009-03-12 Koninklijke Philips Electronics, N.V. Audio coding and decoding
US20090106030A1 (en) * 2004-11-09 2009-04-23 Koninklijke Philips Electronics, N.V. Method of signal encoding
CN101479790B (zh) * 2006-06-29 2012-05-23 Nxp股份有限公司 噪声合成
KR20080073925A (ko) * 2007-02-07 2008-08-12 삼성전자주식회사 파라메트릭 부호화된 오디오 신호를 복호화하는 방법 및장치
KR101317269B1 (ko) * 2007-06-07 2013-10-14 삼성전자주식회사 정현파 오디오 코딩 방법 및 장치, 그리고 정현파 오디오디코딩 방법 및 장치
KR20090008611A (ko) * 2007-07-18 2009-01-22 삼성전자주식회사 오디오 신호의 인코딩 방법 및 장치
KR101441897B1 (ko) * 2008-01-31 2014-09-23 삼성전자주식회사 잔차 신호 부호화 방법 및 장치와 잔차 신호 복호화 방법및 장치
US9111525B1 (en) * 2008-02-14 2015-08-18 Foundation for Research and Technology—Hellas (FORTH) Institute of Computer Science (ICS) Apparatuses, methods and systems for audio processing and transmission
CN101770776B (zh) * 2008-12-29 2011-06-08 华为技术有限公司 瞬态信号的编码方法和装置、解码方法和装置及处理系统
US9055374B2 (en) * 2009-06-24 2015-06-09 Arizona Board Of Regents For And On Behalf Of Arizona State University Method and system for determining an auditory pattern of an audio segment
CN102419977B (zh) * 2011-01-14 2013-10-02 展讯通信(上海)有限公司 瞬态音频信号的判别方法
EP3382700A1 (en) * 2017-03-31 2018-10-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for post-processing an audio signal using a transient location detection

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01165000A (ja) * 1987-12-21 1989-06-29 Sony Corp 音韻区間情報形成装置
JPH02226300A (ja) * 1989-02-28 1990-09-07 Sony Corp 音韻区間情報形成装置
JPH10282995A (ja) * 1997-04-01 1998-10-23 Matsushita Electric Ind Co Ltd 欠落音声補間符号化方法、欠落音声補間符号化装置、及び記録媒体
JP2001521648A (ja) * 1997-06-10 2001-11-06 コーディング テクノロジーズ スウェーデン アクチボラゲット スペクトル帯域複製を用いた原始コーディングの強化

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1986003873A1 (en) * 1984-12-20 1986-07-03 Gte Laboratories Incorporated Method and apparatus for encoding speech
DK46493D0 (da) * 1993-04-22 1993-04-22 Frank Uldall Leonhard Metode for signalbehandling til bestemmelse af transientforhold i auditive signaler
CA2168327C (en) 1995-01-30 2000-04-11 Shinichi Kikuchi A recording medium on which a data containing navigation data is recorded, a method and apparatus for reproducing a data according to navigationdata, a method and apparatus for recording a data containing navigation data on a recording medium.
JP3266819B2 (ja) * 1996-07-30 2002-03-18 株式会社エイ・ティ・アール人間情報通信研究所 周期信号変換方法、音変換方法および信号分析方法
GB2318029B (en) * 1996-10-01 2000-11-08 Nokia Mobile Phones Ltd Audio coding method and apparatus
DE19747132C2 (de) * 1997-10-24 2002-11-28 Fraunhofer Ges Forschung Verfahren und Vorrichtungen zum Codieren von Audiosignalen sowie Verfahren und Vorrichtungen zum Decodieren eines Bitstroms
DE69932861T2 (de) * 1999-10-30 2007-03-15 Stmicroelectronics Asia Pacific Pte Ltd. Verfahren zur kodierung eines audiosignals mit einem qualitätswert für bit-zuordnung
EP1190415B1 (en) * 2000-03-15 2007-08-08 Koninklijke Philips Electronics N.V. Laguerre function for audio coding

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01165000A (ja) * 1987-12-21 1989-06-29 Sony Corp 音韻区間情報形成装置
JPH02226300A (ja) * 1989-02-28 1990-09-07 Sony Corp 音韻区間情報形成装置
JPH10282995A (ja) * 1997-04-01 1998-10-23 Matsushita Electric Ind Co Ltd 欠落音声補間符号化方法、欠落音声補間符号化装置、及び記録媒体
JP2001521648A (ja) * 1997-06-10 2001-11-06 コーディング テクノロジーズ スウェーデン アクチボラゲット スペクトル帯域複製を用いた原始コーディングの強化

Also Published As

Publication number Publication date
US20050187760A1 (en) 2005-08-25
US20010032087A1 (en) 2001-10-18
KR20010113950A (ko) 2001-12-28
DE60129771D1 (de) 2007-09-20
DE60129771T2 (de) 2008-04-30
US7499852B2 (en) 2009-03-03
EP1190415B1 (en) 2007-08-08
US6925434B2 (en) 2005-08-02
CN1364290A (zh) 2002-08-14
EP1190415A1 (en) 2002-03-27
JP2003527632A (ja) 2003-09-16
CN1154975C (zh) 2004-06-23
ATE369600T1 (de) 2007-08-15
KR100780561B1 (ko) 2007-11-29
ES2292581T3 (es) 2008-03-16
WO2001069593A1 (en) 2001-09-20

Similar Documents

Publication Publication Date Title
JP4803938B2 (ja) オーディオ符号化用のラゲール関数
RU2585999C2 (ru) Генерирование шума в аудиокодеках
RU2586838C2 (ru) Аудиокодек, использующий синтез шума в течение неактивной фазы
JP3483958B2 (ja) 広帯域音声復元装置及び広帯域音声復元方法及び音声伝送システム及び音声伝送方法
KR101413967B1 (ko) 오디오 신호의 부호화 방법 및 복호화 방법, 및 그에 대한 기록 매체, 오디오 신호의 부호화 장치 및 복호화 장치
JP2011507050A (ja) オーディオ信号処理方法及び装置
JP2005531024A (ja) 圧縮されたマルチメディアコンテンツからのハッシュを生成する方法
JP6181773B2 (ja) Celp状コーダのためのサイド情報を用いないノイズ充填
US7197454B2 (en) Audio coding
JP4359499B2 (ja) オーディオ信号の編集
JP2953238B2 (ja) 音質主観評価予測方式
JP2798003B2 (ja) 音声帯域拡大装置および音声帯域拡大方法
KR101008529B1 (ko) 오디오 인코딩에서의 정현파 선택
Helen et al. Perceptually motivated parametric representation for harmonic sounds for data compression purposes
JP2006510937A (ja) オーディオ符号化における正弦波選択
Andersen et al. Importance and representation of phase in the sinusoidal model
JPH05232996A (ja) 音声符号化装置
US20060149539A1 (en) Method for separating a sound frame into sinusoidal components and residual noise
JP2003316398A (ja) 音響信号符号化方法、符号化器及びそのプログラム
KR100427053B1 (ko) 주파수공간 에너지를 이용한 유효구간 검출방법 및 이를이용한 반복재생 방법
Hernandez-Gomez et al. Short-time synthesis procedures in vector adaptive transform coding of speech
Brown Solid-State Liquid Chemical Sensor Testing Issues
Ramadan Compressive sampling of speech signals
Bucci et al. An objective test for speech codecs
Abrahamsson Compression of multi channel audio at low bit rates using the AMR-WB+ codec

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080304

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080304

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101202

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110302

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110712

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110809

R150 Certificate of patent or registration of utility model

Ref document number: 4803938

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140819

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term