JP4803938B2 - オーディオ符号化用のラゲール関数 - Google Patents
オーディオ符号化用のラゲール関数 Download PDFInfo
- Publication number
- JP4803938B2 JP4803938B2 JP2001567585A JP2001567585A JP4803938B2 JP 4803938 B2 JP4803938 B2 JP 4803938B2 JP 2001567585 A JP2001567585 A JP 2001567585A JP 2001567585 A JP2001567585 A JP 2001567585A JP 4803938 B2 JP4803938 B2 JP 4803938B2
- Authority
- JP
- Japan
- Prior art keywords
- shape
- function
- signal component
- audio
- transient
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 230000001052 transient effect Effects 0.000 claims abstract description 98
- 230000005236 sound signal Effects 0.000 claims abstract description 19
- 238000000034 method Methods 0.000 claims description 23
- 230000008859 change Effects 0.000 claims description 7
- 230000007246 mechanism Effects 0.000 claims description 4
- 238000013016 damping Methods 0.000 claims description 2
- 230000006870 function Effects 0.000 description 57
- 230000011218 segmentation Effects 0.000 description 7
- 230000004044 response Effects 0.000 description 6
- 238000003786 synthesis reaction Methods 0.000 description 6
- 230000015572 biosynthetic process Effects 0.000 description 5
- 230000006835 compression Effects 0.000 description 5
- 238000007906 compression Methods 0.000 description 5
- 230000003044 adaptive effect Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 230000006837 decompression Effects 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 3
- 238000009432 framing Methods 0.000 description 3
- 230000002085 persistent effect Effects 0.000 description 3
- 238000001514 detection method Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 230000002459 sustained effect Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000005526 G1 to G0 transition Effects 0.000 description 1
- 241000220010 Rhode Species 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Cereal-Derived Products (AREA)
- Stereophonic System (AREA)
- Reverberation, Karaoke And Other Acoustics (AREA)
Description
【技術分野】
本発明は、過渡信号成分が符号化されるようなオーディオ信号の符号化に関する。
【0002】
本発明は、更に、オーディオ信号の復号にも関する。
【0003】
また、本発明はオーディオコーダ、オーディオプレーヤ、オーディオシステム、オーディオストリーム及び記憶媒体にも関する。
【0004】
【背景技術】
ITC Fachbericht1998、第146号、第35〜40頁のPurnhagen及びEdlerによる“Objektbasieter Analyse/Synthese Audio Coder fur sehr niedrige Datenraten”なる論文は、オーディオ信号を低ビットレートで符号化する装置を開示している。モデルに基づく解析/合成装置が使用され、該装置においては入力信号が3つの部分:即ち単一正弦波、高調波音及び雑音、に分割される。該入力信号は、更に、32msの固定フレームに分割される。全てのブロック及び信号部分に関して、ソースモデルに基づきパラメータが抽出される。過渡信号部分の表現を改善するために、上記入力信号から包絡線関数α(t)が導出され、選択された正弦波に適用される。該包絡線関数は、図1に示すようなパラメータratk、rdec、tmaxにより決まる2つの線分からなる。
【0005】
【発明の開示】
本発明の1つの目的は、ビットレート及び知覚の点で有利なオーディオ符号化方法を提供することにある。この目的のため、本発明は、独立請求項に記載されたような符号化及び復号方法、オーディオコーダ、オーディオプレーヤ、オーディオシステム、オーディオストリーム並びに記憶媒体を提供する。有利な実施例は、従属請求項に記載されている。
【0006】
本発明の第1実施例は、前記オーディオ信号における過渡信号成分の位置を推定するステップと;該過渡信号成分が初期増加の後に徐々に減衰する場合に、該過渡信号成分に形状関数を整合させるステップであって、該形状関数がt n に略従う初期振る舞いと、該初期振る舞いの後のe −αt に略従う減衰的振る舞いとを有し、ここでtは時間であり、n及びαは当該形状関数の形を記述するパラメータである。本発明は、斯様な関数が過渡信号成分を良好に表す一方、該関数を少数のパラメータにより記述することができ、これはビットレート及び知覚品質の点で有利であるという洞察に基づいている。本発明は、過渡信号成分が持続信号成分とは別に符号化されるような実施例において特に有利である。何故なら、これらの実施例においては過渡信号成分の良好な表現が特に重要であるからである。
【0007】
本発明の他の特徴によれば、上記形状関数はラゲール関数であり、連続時間では、
【数1】
により与えられ、ここでcはスケーリングパラメータ(1を取ることができる)である。特別な実施例においては、時間離散ラゲール関数が使用される。
【0008】
過渡信号成分は、電力(若しくは振幅)の急激な変化、又は波形パターンの急激な変化として知覚することができる。斯様な過渡信号成分の検出は、従来既知である。例えば、1998年9月ギリシャ、ロードスにおけるEUSIPCO-98信号処理IX、理論及び応用の論文集、第2345〜2348頁の、J. Kliewer及びA. Mertinによる“過渡信号セグメントの改善された表現を伴うオーディオサブバンド符号化”には、過渡検出機構が提案され、該機構はアタック開始位置の前後のエネルギレベルの差に基づいている。本発明による実用的な実施例においては、振幅レベルの急激な変化が考慮される。
【0009】
本発明の好ましい実施例においては、上記形状関数は一般化離散ラゲール関数である。メイクスナ(Meixner)及びメイクスナ様(Meixner-like)関数が、使用するのには現実的であり、驚くほど良好な結果を与える。斯様な関数は、Int. J. 回路理論応用、23、1995年、第237〜246頁の、A.C. den Brinkerによる“有利z変換を有するメイクスナ様関数”で議論されている。これらの形状関数のパラメータは簡単な方法で導出することができる。
【0010】
本発明の他の実施例においては、当該過渡信号成分が振幅のステップ状変化である場合、形状パラメータはステップ指示子を含む。上記ステップ状変化の後の信号は持続コーダにおいて有利に符号化される。
【0011】
本発明の他の好ましい実施例においては、過渡信号成分の位置は開始位置である。適応的フレーム化のために過渡信号成分の開始位置を与えるのが有利であり、該フレーム化においてはフレームは過渡信号成分の開始位置で始まる。該開始位置は上記形状関数と上記フレーム化との両方に使用され、結果として効率的な符号化が達成される。開始位置が与えられた場合、Edlerにより記載された実施例においては必要であったように、2つのパラメータを合成することにより開始位置を決定する必要はない。
【0012】
本発明の上記及び他の特徴は、以下に述べる実施例から明らかとなり、斯かる実施例を参照して解説されるであろう。
【0013】
尚、図面は本発明を理解するのに必要な構成要素のみを図示している。
【0014】
【発明を実施するための最良の形態】
図2は、本発明によるオーディオコーダ1を示し、入力オーディオ信号x(t)を得るための入力ユニット10を有している。該オーディオコーダ1は、上記入力信号を3つの成分、即ち過渡信号成分、持続決定的成分及び持続確率的成分に分離する。該オーディオコーダ1は、過渡コーダ11、正弦波コーダ13及び雑音コーダ14を有している。当該オーディオコーダは、任意選択的に、利得圧縮機構(GC)12を有している。
【0015】
本発明のこの有利な実施例においては、過渡符号化は持続符号化の前に実行される。これは、過渡信号成分が持続コーダでは効率的及び最適には符号化されないので、有利である。もし、持続コーダが過渡信号成分を符号化するために使用されると、多くの符号化努力が必要となる。例えば、過渡信号成分を持続正弦波のみで符号化することが困難であることは想像することができるであろう。従って、過渡信号成分を、符号化されるべきオーディオ信号から符号化前に削除することは、有利である。上記過渡コーダにおいて抽出される過渡開始位置は、持続コーダにおいて適応的セグメント化(適応的フレーム化)に使用され、その結果、持続符号化の性能が更に改善される。
【0016】
過渡コーダ11は、過渡検出器(TD)110と、過渡解析器(TA)111と、過渡合成器(TS)112とを有している。先ず、信号x(t)が過渡検出器110に入る。この検出器110は、過渡信号成分が存在するか、及びどの位置であるかを推定する。この情報は、過渡解析器111に供給される。この情報は、有利な信号に誘起されたセグメント化を得るために、正弦波コーダ13及び雑音コーダ14においても使用される。過渡信号成分の位置が決定された場合、過渡解析器111は、該過渡信号成分(の主要部分)を抽出するよう試みる。該解析器は形状関数を、好ましくは推定された開始位置で始まる信号セグメントと整合し、該形状関数の下の内容、例えば(少)数の正弦波成分を決定する。この情報は、過渡コードCTに含まされる。該過渡コードCTは過渡合成器112に供給される。合成された過渡信号成分は減算器16において前記入力信号x(t)から減算され、結果として信号x1が得られる。GC12が削除された場合は、x1=x2となる。信号x2は正弦波コーダ13に供給されて、正弦波解析器(SA)130において解析され、該解析器は(決定的)正弦波成分を決定する。この情報は、正弦波コードCSに含められる。該正弦波コードCSから、正弦波合成器(SS)131により正弦波信号成分が再生される。この信号は、減算器17において正弦波コーダ13への入力x2から減算され、結果として(大きな)過渡信号成分及び(主な)決定的正弦波成分を含まない残存信号x3が得られる。従って、該残存信号x3は主に雑音からなると推定される。該信号は、雑音解析器(NA)14においてERBスケールに従い電力内容が解析される。雑音解析器14は、雑音コードCNを生成する。正弦波コーダ13におけるのと同様に、雑音解析器14も前記過渡信号成分の開始位置を新たな解析ブロックを開始する位置として使用することができる。正弦波解析器130及び雑音解析器14のセグメント寸法は必ずしも等しい必要はない。マルチプレクサ15においては、オーディオストリームASが構成され、該ストリームは上記コードCT、CS及びCNを含んでいる。該オーディオストリームASは、例えばデータバス、アンテナ系又は記憶媒体等に供給される。
【0017】
以下においては、本発明による過渡信号成分の表現が議論される。この実施例において、過渡成分用コードCTは、該形状の下のパラメータ的形状及び追加の主要な周波数成分(又は他の内容)、又はステップ状の変化を識別するコードの何れかからなる。本発明の好ましい実施例によれば、初期増加の後徐々に減衰している過渡現象用の形状関数は、好ましくは一般化離散ラゲール関数とする。他の型の過渡信号成分に対しては、他の関数を使用することができる。
【0018】
一般化離散ラゲール関数の一例は、メイクスナ(Meixner)関数である。離散零次メイクスナ関数g(t)は:
【数2】
により与えられ、ここで、t=0,2,…であり、(b)t=b(b+1)…(b+t-1)はポクハンマ(Pochhammer)記号である。パラメータbは一般化の次数(b>0)を表し、当該関数の初期形状を決定する:小さなtに対しては大凡f∝t(b-1)/2。パラメータξは0<ξ<1の極を示し、大きなtに対する減衰を決定する。関数g(t)はtの全ての値に対して正の関数である。b=1に対して、離散ラゲール関数が求められる。更に、b=1に関しては、gのz変換はzでの有利関数であり、従って一次無限インパルス応答(IIR)フィルタのインパルス応答として実現することができる。bの他の全ての値に関しては、有利z変換は存在しない。関数g(t)は正規化エネルギ、即ち、
【数3】
である。零次メイクスナ関数は:
【数4】
により帰納的に作成することができる。
【0019】
本発明の他の実施例においては、メイクスナ様の関数が使用される。何故なら、それらは有利z変換を有しているからである。メイクスナ様の関数の一例が図3に示されている。離散零次メイクスナ様関数h(t)は、そのz変換:
【数5】
により与えられ、ここでa=0,1,2,…であり、Caは:
【数6】
により与えられ、ここでPaは:
【数7】
で与えられるa次のルジャンドル多項式である。パラメータaは一般化の次数(aは負でない整数である)を表し、ξは0<ξ<1の極である。パラメータaは当該関数の初期形状を決定する:小さなtに対してはf∝ta。パラメータξは大きなtに対する減衰を決定する。関数hは、tの全ての値に対して正の関数であり、エネルギ正規化される。aの全ての値に対して、関数hは有利z変換を有し、(a+1次の)IIRフィルタのインパルス応答として実現することができる。
【0020】
関数h(t)は:
【数8】
により、有限離散ラゲール系列で表すことができ、ここでφmは離散ラゲール関数である(A.C. den Brinkerの論文参照)。Bmは:
【数9】
で与えられる。
【0021】
或る関数f(t)の一次及び二次のランニング中央モーメント(running central moments)は:
【数10】
により定義され、ここでk0は過渡信号成分の開始位置である。
【0022】
入力オーディオ信号のランニング中央モーメントT1及びT2の良好な推定を用いれば(式10及び式11において、f(t)=x(t)を取る)、形状パラメータを推定することができる。残念ながら、実データにおいては過渡信号成分には、通常、持続励起フェーズが後続し、ランニングモーメントの可能な測定を妨害する。図4は、入力オーディオ信号の一次及び二次ランニング中央モーメントを示している。ランニングモーメントは初期には推定開始位置から線形に増加し、後に飽和する傾向にあるように思われる。この曲線から形状パラメータは推定することはできるが、上記飽和はパラメータ抽出に望まれるほど明確ではないので、何れのkでT1及びT2の良好な推定が得られるか十分に明確ではない。本発明の有利な実施例においては、ランニングモーメントT1及びT2の初期増加における比が形状パラメータを推定するために使用される。この測定は、b(及び、零次メイクスナ関数の場合はa)を決定する場合に有利である。何故なら、bは当該形状の初期の振る舞いを決定するからである。ランニングモーメントT1及びT2の傾斜の間の比から、bに関する良好な推定が得られる。シミュレーション結果から、非常に良好な程度に傾斜T1/傾斜T2なる比とパラメータbとの間に線形な関係が存在し、該関係はラゲール関数とは対照的に減衰パラメータξに僅かに依存することが分かった。記述として:
メイクスナに対しては: 傾斜T1/傾斜T2=b+1/2 (12)
メイクスナ様に対しては: 傾斜T1/傾斜T2=2a+3/2 (13)
を使用することができ(実験により導出)、ここでξ依存は無視された。k=k0に対してT1及びT2は零であるので、傾斜T1/傾斜T2は適切なkに対してT1/T2により近似することができる。
【0023】
形状の極ξは、下記の方法で推定することができる。二次多項式がランニング中央モーメント、例えばT1、に適合される。この多項式は、観測時間TのT1なる信号セグメントに、横ばいが明確に見えるように、即ち該多項式の明確な二次項がTに合うように、適合される。次に、二次多項式がその極大まで補外され、この値がT1の飽和レベルであると仮定される。T1及びbに関するこの値から、f(t)=g(t)で式2及び式10を用いることによりξが算出される。メイクスナ様関数に関しては、ξはT1及びaに対する値から、f(t)=h(t)で式8〜式10を用いることにより算出される。
【0024】
減衰パラメータξの推定手順は下記の通りである。
Tの何らかの値で開始し、
二次多項式を0からTでデータに適合する、即ちt=[0,T]に対してT1(t)≒c0+c1t+c2t2、ここでc0、c1、c2は適合係数である、
この多項式の二次項(quadratic term)がt=Tにおいて必須であるかをチェックする:T1(T)<(1−ε)(c0+c1T)、ここでεはt=Tにおける上記二次項の相対貢献度を表す、
これが満たされた場合は、T1(t)をその極大まで補外し、これをT1と等式化する:T1=c0−c1 2/4c2、
T1及びb(又はa)から減衰パラメータξを算出する。
メイクスナ様関数の場合は、形状パラメータaは好ましくは整数に丸められる。
【0025】
図5は、入力オーディオ信号から導出される形状関数の一例を示している。
【0026】
本発明にとり前処理は必須ではないが、形状の最初の近似を得るために、当該データのヒルベルト変換を実行する如きの、何らかの前処理を実行することができる。
【0027】
ランニングモーメントが飽和する値が大きい場合、即ちセグメント/フレーム長のオーダの場合、メイクスナ(様)形状は破棄される。当該過渡現象が振幅のステップ状の変化である場合、該過渡現象の位置は正弦波コーダ及び雑音コーダにおける適切なセグメント化のために保持される。
【0028】
開始位置及び過渡現象の形状が決定された後、当該形状の下の信号内容が推定される。当該形状の下で、(少)数の正弦波が推定される。これは、既知のように解析/合成単位の手順で実行される。正弦波を推定するために使用されるデータは、当該過渡現象は含むが如何なる結果としての持続応答も含まないように窓処理された(windowed)セグメントである。従って、上記解析/合成単位の方法に入る前に、当該データに時間窓が適用される。本質的に、考慮される信号は、上記開始位置から、形状がその極大の或る割合まで減少される何れかのサンプルまで延在する。窓処理されたデータは、例えば離散フーリエ変換(DFT)により、周波数ドメインに変換することができる。多分推定された過渡現象を越えて延びる低周波数成分を避けるために、周波数ドメインにおける窓も適用される。次に、最大応答が決定され、この最大応答に関連する周波数も決定される。推定された形状は、この周波数により変調され、当該データに対して、例えば音響心理学的モデル等の何らかの所定の規準に従って、又は最小自乗的に、最良の可能性のある適合がなされる。この推定された過渡セグメントは元の過渡現象から減算され、該手順は最大数の正弦波成分が超過されるまで、又は当該セグメントに如何なるエネルギも殆ど残存されなくなるまで、繰り返される。本質的に、過渡現象は変調されたメイクスナ関数の和により表される。実用的な実施例においては、6個の正弦波が推定される。潜在的内容が主に雑音を含む場合、雑音推定が使用されるか、又は任意の値が正弦波の周波数に関して付与される。
【0029】
過渡コードCTは、過渡現象の開始位置と過渡現象の型とを含んでいる。メイクスナ(様)形状の場合における過渡現象用のコードは:
該過渡現象の位置;
形状がメイクスナ(様)関数であることの指示子;
形状パラメータb(又はa)及びξ;
変調条件:NF周波数パラメータ及び正弦(余弦)変調された形状の振幅;
を含む。
【0030】
当該過渡現象が本質的に振幅レベルの急激な増加であり、開始位置の後の(比較的)短い期間、このレベルの明確な減衰がない場合、該過渡現象はメイクスナ(様)形状では符号化することはできない。その場合、上記開始位置は適切な信号セグメント化を得るために維持される。ステップ状過渡現象に関するコードは:
該過渡現象の開始位置;
ステップに関する指示子;
を含む。
【0031】
後続の持続符号化段(正弦波及び雑音)の性能は、当該信号のセグメント化において過渡位置を使用することにより改善される。正弦波コーダ及び雑音コーダは、検出された過渡現象の位置における新たなフレームで開始する。このようにして、静止しない振る舞いを呈するとして知られている、信号部分にわたる平均化を防止する。このことは、過渡セグメントの前のセグメントは短縮されるか、ずらされるか、又は前のフレームと連結されねばならないことを意味する。
【0032】
本発明によるオーディオコーダ1は、任意選択的に、持続コーダ13及び14の前に利得制御要素12を有する。持続コーダにとっては、振幅レベルの変動を防止するのが有利である。ステップ状過渡現象に関しては、この問題は過渡現象に従うセグメント化を用いることにより解決される。形状を用いて表される過渡現象に関しては、該問題は、入力信号から過渡現象を抽出することにより部分的に解決される。残存信号は依然として振幅レベルの大きな動的変化を含む可能性があり、多分、推定された形状に類似した形状である。該残存信号を平坦化するために、上記利得制御要素を使用することができる。圧縮レートは:
【数11】
により定義され、ここでh(t)は推定される形状であり、dは圧縮レートを記述するパラメータである。上記利得制御要素は、過渡現象の後、静止フェーズが推定形状における最大の約0.2倍に達する振幅行程で発生すると仮定する。比rは:
【数12】
により定義され、ここでMrは残存信号の極大である。r>2の場合、圧縮レートパラメータdはrに等しく、それ以外では、dは零とされる。圧縮に関しては、dのみが伝送される必要がある。
【0033】
図6は、本発明によるオーディオプレーヤ3を示している。例えば図2によるエンコーダにより発生されたオーディオストリームAS’は、データバス、アンテナ系、又は記憶媒体等から得られる。該オーディオストリームAS’はデマルチプレクサ30においてデマルチプレクスされ、コードCT’、CS’及びCN’を得る。これらコードは、過渡合成器31、正弦波合成器32及び雑音合成器33に各々供給される。過渡コードCT’からは、過渡合成器31において過渡信号成分が算出される。該過渡コードが形状関数を示す場合は、受信されたパラメータに基づいて形状が計算される。更に、形状内容が、正弦波成分の周波数及び振幅に基づいて計算される。過渡コードCT’がステップを示す場合は、過渡現象は計算されない。総過渡信号yTは全ての過渡現象の和である。
【0034】
伸張パラメータdが使用される場合、即ちコーダ1において導出され、オーディオストリームAS’に含まれる場合は、伸張機構34が使用される。利得信号g(t)は1に初期化され、合計の振幅伸張係数が全ての異なる伸張係数の積として算出される。過渡現象がステップの場合は、振幅伸張係数は計算されない。
【0035】
2つの連続する過渡位置から、正弦波合成SS32及び雑音合成NS33に関するセグメント化が計算される。正弦波コードCSが、所与のセグメント上の正弦波の和として記述される信号ySを発生するために使用される。雑音コードCNが雑音信号yNを発生するために使用される。連続するセグメントは、例えば重なり加算法(overlap-add method)により加算される。
【0036】
合計信号y(t)は、正弦波信号ySと雑音信号yNとの和の振幅伸張gによる積と、過渡信号yTとの和からなる。該オーディオプレーヤは、各信号の和をとるために2つの加算器36及び37を有している。上記合計信号は出力ユニット35に供給され、該ユニットは例えばスピーカである。
【0037】
図7は本発明によるオーディオシステムを示し、図2に示すようなオーディオコーダ1と、図6に示すようなオーディオプレーヤ3とを有している。斯様なシステムは、再生及び記録機能を提供する。オーディオストリームASは通信チャンネル2を介して上記オーディオコーダから上記オーディオプレーヤに供給され、該チャンネルは無線接続、データバス又は記憶媒体であり得る。通信チャンネル2が記憶媒体である場合、該記憶媒体は当該システム内に固定することができるか、又は着脱可能ディスク、メモリスティック等であり得る。通信チャンネル2は当該オーディオシステムの一部とすることもできるが、時には当該オーディオシステムの外部とすることもできる。
【0038】
尚、上述した実施例は本発明を制限するというよりは解説するものであり、当業者であれば添付請求項の範囲から逸脱することなく多くの他の実施例を設計することができるであろうことに注意すべきである。各請求項において、括弧内に配置された如何なる参照符号も当該請求項を限定するものとみなしてはならない。“有する”なる用語は、請求項に記載されたもの以外の他の要素及びステップの存在を排除するものではない。本発明は、幾つかの個別素子を有するハードウェアにより、及び適切にプログラムされたコンピュータにより構成することができる。幾つかの手段を列挙する装置請求項において、これらの手段の幾つかはハードウェアの1つの且つ同一の物により具現化することができる。或る手段が相互に異なる従属請求項に記載されるという事実のみでは、これらの手段の組合せが有利に使用することができないということを示すことにはならない。
【0039】
要約すると、本発明はオーディオ信号を符号化及び復号する方法であって、該オーディオ信号における過渡信号成分の位置を推定し、該過渡信号成分が初期増加の後に徐々に減衰する場合に該過渡信号成分に形状関数を整合させ、ここで該形状関数は略指数関数的な初期の振る舞いと略対数関数的な減衰の振る舞いとを有するものであり、更に、上記位置と上記形状関数を記述する形状パラメータとをオーディオストリームに含めるような各ステップを含む。
【図面の簡単な説明】
【図1】 図1は、既述した既知の包絡線関数を示す。
【図2】 図2は、本発明によるオーディオコーダの一実施例を示す。
【図3】 図3は、本発明による形状関数の一例を示す。
【図4】 図4は、入力オーディオ信号の一次及び二次のランニング中央モーメントのグラフを示す。
【図5】 図5は、入力オーディオ信号から導出された形状関数の一例を示す。
【図6】 図6は、本発明によるオーディオプレーヤの一実施例を示す。
【図7】 図7は、オーディオコーダ及びオーディオプレーヤを有するシステムを示す。
Claims (11)
- オーディオ信号を符号化する方法において、該方法が、
検出器により、前記オーディオ信号における過渡信号成分の位置を推定するステップであって、前記過渡信号成分は初期増加の後に徐々に減衰する信号成分である、ステップと、
解析器により、該過渡信号成分に形状関数を整合させるステップであって、tを時間とし、n及びαを前記形状関数を記述する形状パラメータとした場合に、該形状関数が実質的にtnに従う初期の振る舞いと、実質的にe−αtに従う該初期の振る舞いの後の減衰の振る舞いとを有するようなステップと、
合成器により、前記位置と、前記形状パラメータとをオーディオストリームに含めるステップと、
を有していることを特徴とする方法。 - 請求項1に記載の方法において、前記形状関数がラゲール関数又は一般化離散ラゲール関数であることを特徴とする方法。
- 請求項2に記載の方法において、前記形状関数がメイクスナ関数又はメイクスナ様関数であることを特徴とする方法。
- 請求項2に記載の方法において、前記形状パラメータの少なくとも1つが、前記オーディオ信号のランニング一次及び二次モーメントの傾斜の比により決定されることを特徴とする方法。
- 請求項1に記載の方法において、前記形状パラメータは前記過渡信号成分が振幅のステップ状変化である場合にステップ指示子を含むことを特徴とする方法。
- 請求項1に記載の方法において、前記過渡信号成分の位置が開始位置であることを特徴とする方法。
- 請求項1に記載の方法において、該方法が、
少なくとも1つの持続符号化段に供給される前記オーディオ信号の一部を、利得制御機構において前記形状関数を用いることにより平坦化するステップを、
更に有していることを特徴とする方法。 - オーディオストリームを復号する方法において、該方法が、合成器により、
受信された位置情報に基づく所与の位置において、初期増加の後に徐々に減衰する過渡信号成分を発生するステップと、
受信された形状パラメータに基づいて該過渡信号成分の形状関数を計算するステップであって、tが時間であり、n及びαが前記形状パラメータである場合に、該形状関数が実質的にtnに従う初期の振る舞いと、実質的にe−αtに従う該初期の振る舞いの後の減衰の振る舞いとを有するようなステップと、
を有していることを特徴とする方法。 - オーディオ信号における、初期増加の後に徐々に減衰する過渡信号成分の位置を推定する手段と、
該過渡信号成分に形状関数を整合させる手段であって、tを時間とし、n及びαを前記形状関数を記述する形状パラメータとした場合に、該形状関数が実質的にtnに従う初期の振る舞いと、実質的にe−αtに従う該初期の振る舞いの後の減衰の振る舞いとを有するような手段と、
前記位置と、前記形状パラメータとをオーディオストリームに含める手段と、
を有していることを特徴とするオーディオコーダ。 - 受信された位置情報に基づく所与の位置において、初期増加の後に徐々に減衰する過渡信号成分を発生する手段と、
受信された形状パラメータに基づいて該過渡信号成分の形状関数を計算する手段であって、tが時間であり、n及びαが前記形状パラメータである場合に、該形状関数が実質的にtnに従う初期の振る舞いと、実質的にe−αtに従う該初期の振る舞いの後の減衰の振る舞いとを有するような手段と、
を有していることを特徴とするオーディオプレーヤ。 - 請求項9に記載のオーディオコーダと請求項10に記載のオーディオプレーヤとを有することを特徴とするオーディオシステム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP00200939.7 | 2000-03-15 | ||
EP00200939 | 2000-03-15 | ||
PCT/EP2001/002424 WO2001069593A1 (en) | 2000-03-15 | 2001-03-05 | Laguerre fonction for audio coding |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2003527632A JP2003527632A (ja) | 2003-09-16 |
JP2003527632A5 JP2003527632A5 (ja) | 2008-04-24 |
JP4803938B2 true JP4803938B2 (ja) | 2011-10-26 |
Family
ID=8171205
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001567585A Expired - Lifetime JP4803938B2 (ja) | 2000-03-15 | 2001-03-05 | オーディオ符号化用のラゲール関数 |
Country Status (9)
Country | Link |
---|---|
US (2) | US6925434B2 (ja) |
EP (1) | EP1190415B1 (ja) |
JP (1) | JP4803938B2 (ja) |
KR (1) | KR100780561B1 (ja) |
CN (1) | CN1154975C (ja) |
AT (1) | ATE369600T1 (ja) |
DE (1) | DE60129771T2 (ja) |
ES (1) | ES2292581T3 (ja) |
WO (1) | WO2001069593A1 (ja) |
Families Citing this family (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1190415B1 (en) * | 2000-03-15 | 2007-08-08 | Koninklijke Philips Electronics N.V. | Laguerre function for audio coding |
ATE334556T1 (de) * | 2001-04-18 | 2006-08-15 | Koninkl Philips Electronics Nv | Audiokodierung mit partieller enkryption |
CN1237507C (zh) * | 2001-06-08 | 2006-01-18 | 皇家菲利浦电子有限公司 | 音频信号的编辑 |
JP2005506582A (ja) * | 2001-10-26 | 2005-03-03 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | オーディオコーダにおける正弦波パラメータのトラッキング |
JP2005533271A (ja) | 2002-07-16 | 2005-11-04 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | オーディオ符号化 |
KR101001170B1 (ko) | 2002-07-16 | 2010-12-15 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 오디오 코딩 |
SG108862A1 (en) * | 2002-07-24 | 2005-02-28 | St Microelectronics Asia | Method and system for parametric characterization of transient audio signals |
ATE381092T1 (de) | 2002-11-29 | 2007-12-15 | Koninkl Philips Electronics Nv | Audiodekodierung |
ATE425533T1 (de) * | 2003-07-18 | 2009-03-15 | Koninkl Philips Electronics Nv | Audiocodierung mit niedriger bitrate |
CN1846253B (zh) | 2003-09-05 | 2010-06-16 | 皇家飞利浦电子股份有限公司 | 低比特率音频编码 |
WO2005024784A1 (en) * | 2003-09-09 | 2005-03-17 | Koninklijke Philips Electronics N.V. | Encoding of transient audio signal components |
US7725310B2 (en) | 2003-10-13 | 2010-05-25 | Koninklijke Philips Electronics N.V. | Audio encoding |
JP2007512572A (ja) * | 2003-12-01 | 2007-05-17 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | オーディオ符号化 |
EP1914722B1 (en) | 2004-03-01 | 2009-04-29 | Dolby Laboratories Licensing Corporation | Multichannel audio decoding |
US7587313B2 (en) | 2004-03-17 | 2009-09-08 | Koninklijke Philips Electronics N.V. | Audio coding |
EP1756807B1 (en) * | 2004-06-08 | 2007-11-14 | Koninklijke Philips Electronics N.V. | Audio encoding |
JP4318119B2 (ja) * | 2004-06-18 | 2009-08-19 | 国立大学法人京都大学 | 音響信号処理方法、音響信号処理装置、音響信号処理システム及びコンピュータプログラム |
US20090070118A1 (en) * | 2004-11-09 | 2009-03-12 | Koninklijke Philips Electronics, N.V. | Audio coding and decoding |
US20090106030A1 (en) * | 2004-11-09 | 2009-04-23 | Koninklijke Philips Electronics, N.V. | Method of signal encoding |
CN101479790B (zh) * | 2006-06-29 | 2012-05-23 | Nxp股份有限公司 | 噪声合成 |
KR20080073925A (ko) * | 2007-02-07 | 2008-08-12 | 삼성전자주식회사 | 파라메트릭 부호화된 오디오 신호를 복호화하는 방법 및장치 |
KR101317269B1 (ko) * | 2007-06-07 | 2013-10-14 | 삼성전자주식회사 | 정현파 오디오 코딩 방법 및 장치, 그리고 정현파 오디오디코딩 방법 및 장치 |
KR20090008611A (ko) * | 2007-07-18 | 2009-01-22 | 삼성전자주식회사 | 오디오 신호의 인코딩 방법 및 장치 |
KR101441897B1 (ko) * | 2008-01-31 | 2014-09-23 | 삼성전자주식회사 | 잔차 신호 부호화 방법 및 장치와 잔차 신호 복호화 방법및 장치 |
US9111525B1 (en) * | 2008-02-14 | 2015-08-18 | Foundation for Research and Technology—Hellas (FORTH) Institute of Computer Science (ICS) | Apparatuses, methods and systems for audio processing and transmission |
CN101770776B (zh) * | 2008-12-29 | 2011-06-08 | 华为技术有限公司 | 瞬态信号的编码方法和装置、解码方法和装置及处理系统 |
US9055374B2 (en) * | 2009-06-24 | 2015-06-09 | Arizona Board Of Regents For And On Behalf Of Arizona State University | Method and system for determining an auditory pattern of an audio segment |
CN102419977B (zh) * | 2011-01-14 | 2013-10-02 | 展讯通信(上海)有限公司 | 瞬态音频信号的判别方法 |
EP3382700A1 (en) * | 2017-03-31 | 2018-10-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for post-processing an audio signal using a transient location detection |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01165000A (ja) * | 1987-12-21 | 1989-06-29 | Sony Corp | 音韻区間情報形成装置 |
JPH02226300A (ja) * | 1989-02-28 | 1990-09-07 | Sony Corp | 音韻区間情報形成装置 |
JPH10282995A (ja) * | 1997-04-01 | 1998-10-23 | Matsushita Electric Ind Co Ltd | 欠落音声補間符号化方法、欠落音声補間符号化装置、及び記録媒体 |
JP2001521648A (ja) * | 1997-06-10 | 2001-11-06 | コーディング テクノロジーズ スウェーデン アクチボラゲット | スペクトル帯域複製を用いた原始コーディングの強化 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1986003873A1 (en) * | 1984-12-20 | 1986-07-03 | Gte Laboratories Incorporated | Method and apparatus for encoding speech |
DK46493D0 (da) * | 1993-04-22 | 1993-04-22 | Frank Uldall Leonhard | Metode for signalbehandling til bestemmelse af transientforhold i auditive signaler |
CA2168327C (en) | 1995-01-30 | 2000-04-11 | Shinichi Kikuchi | A recording medium on which a data containing navigation data is recorded, a method and apparatus for reproducing a data according to navigationdata, a method and apparatus for recording a data containing navigation data on a recording medium. |
JP3266819B2 (ja) * | 1996-07-30 | 2002-03-18 | 株式会社エイ・ティ・アール人間情報通信研究所 | 周期信号変換方法、音変換方法および信号分析方法 |
GB2318029B (en) * | 1996-10-01 | 2000-11-08 | Nokia Mobile Phones Ltd | Audio coding method and apparatus |
DE19747132C2 (de) * | 1997-10-24 | 2002-11-28 | Fraunhofer Ges Forschung | Verfahren und Vorrichtungen zum Codieren von Audiosignalen sowie Verfahren und Vorrichtungen zum Decodieren eines Bitstroms |
DE69932861T2 (de) * | 1999-10-30 | 2007-03-15 | Stmicroelectronics Asia Pacific Pte Ltd. | Verfahren zur kodierung eines audiosignals mit einem qualitätswert für bit-zuordnung |
EP1190415B1 (en) * | 2000-03-15 | 2007-08-08 | Koninklijke Philips Electronics N.V. | Laguerre function for audio coding |
-
2001
- 2001-03-05 EP EP01929398A patent/EP1190415B1/en not_active Expired - Lifetime
- 2001-03-05 ES ES01929398T patent/ES2292581T3/es not_active Expired - Lifetime
- 2001-03-05 AT AT01929398T patent/ATE369600T1/de not_active IP Right Cessation
- 2001-03-05 DE DE60129771T patent/DE60129771T2/de not_active Expired - Lifetime
- 2001-03-05 JP JP2001567585A patent/JP4803938B2/ja not_active Expired - Lifetime
- 2001-03-05 CN CNB018005152A patent/CN1154975C/zh not_active Expired - Lifetime
- 2001-03-05 WO PCT/EP2001/002424 patent/WO2001069593A1/en active IP Right Grant
- 2001-03-05 KR KR1020017014581A patent/KR100780561B1/ko active IP Right Grant
- 2001-03-12 US US09/804,022 patent/US6925434B2/en not_active Expired - Lifetime
-
2005
- 2005-04-27 US US11/115,465 patent/US7499852B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH01165000A (ja) * | 1987-12-21 | 1989-06-29 | Sony Corp | 音韻区間情報形成装置 |
JPH02226300A (ja) * | 1989-02-28 | 1990-09-07 | Sony Corp | 音韻区間情報形成装置 |
JPH10282995A (ja) * | 1997-04-01 | 1998-10-23 | Matsushita Electric Ind Co Ltd | 欠落音声補間符号化方法、欠落音声補間符号化装置、及び記録媒体 |
JP2001521648A (ja) * | 1997-06-10 | 2001-11-06 | コーディング テクノロジーズ スウェーデン アクチボラゲット | スペクトル帯域複製を用いた原始コーディングの強化 |
Also Published As
Publication number | Publication date |
---|---|
US20050187760A1 (en) | 2005-08-25 |
US20010032087A1 (en) | 2001-10-18 |
KR20010113950A (ko) | 2001-12-28 |
DE60129771D1 (de) | 2007-09-20 |
DE60129771T2 (de) | 2008-04-30 |
US7499852B2 (en) | 2009-03-03 |
EP1190415B1 (en) | 2007-08-08 |
US6925434B2 (en) | 2005-08-02 |
CN1364290A (zh) | 2002-08-14 |
EP1190415A1 (en) | 2002-03-27 |
JP2003527632A (ja) | 2003-09-16 |
CN1154975C (zh) | 2004-06-23 |
ATE369600T1 (de) | 2007-08-15 |
KR100780561B1 (ko) | 2007-11-29 |
ES2292581T3 (es) | 2008-03-16 |
WO2001069593A1 (en) | 2001-09-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4803938B2 (ja) | オーディオ符号化用のラゲール関数 | |
RU2585999C2 (ru) | Генерирование шума в аудиокодеках | |
RU2586838C2 (ru) | Аудиокодек, использующий синтез шума в течение неактивной фазы | |
JP3483958B2 (ja) | 広帯域音声復元装置及び広帯域音声復元方法及び音声伝送システム及び音声伝送方法 | |
KR101413967B1 (ko) | 오디오 신호의 부호화 방법 및 복호화 방법, 및 그에 대한 기록 매체, 오디오 신호의 부호화 장치 및 복호화 장치 | |
JP2011507050A (ja) | オーディオ信号処理方法及び装置 | |
JP2005531024A (ja) | 圧縮されたマルチメディアコンテンツからのハッシュを生成する方法 | |
JP6181773B2 (ja) | Celp状コーダのためのサイド情報を用いないノイズ充填 | |
US7197454B2 (en) | Audio coding | |
JP4359499B2 (ja) | オーディオ信号の編集 | |
JP2953238B2 (ja) | 音質主観評価予測方式 | |
JP2798003B2 (ja) | 音声帯域拡大装置および音声帯域拡大方法 | |
KR101008529B1 (ko) | 오디오 인코딩에서의 정현파 선택 | |
Helen et al. | Perceptually motivated parametric representation for harmonic sounds for data compression purposes | |
JP2006510937A (ja) | オーディオ符号化における正弦波選択 | |
Andersen et al. | Importance and representation of phase in the sinusoidal model | |
JPH05232996A (ja) | 音声符号化装置 | |
US20060149539A1 (en) | Method for separating a sound frame into sinusoidal components and residual noise | |
JP2003316398A (ja) | 音響信号符号化方法、符号化器及びそのプログラム | |
KR100427053B1 (ko) | 주파수공간 에너지를 이용한 유효구간 검출방법 및 이를이용한 반복재생 방법 | |
Hernandez-Gomez et al. | Short-time synthesis procedures in vector adaptive transform coding of speech | |
Brown | Solid-State Liquid Chemical Sensor Testing Issues | |
Ramadan | Compressive sampling of speech signals | |
Bucci et al. | An objective test for speech codecs | |
Abrahamsson | Compression of multi channel audio at low bit rates using the AMR-WB+ codec |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080304 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080304 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101202 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110302 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110712 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110809 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4803938 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140819 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |