JP2006524002A - オーディオ信号生成 - Google Patents

オーディオ信号生成 Download PDF

Info

Publication number
JP2006524002A
JP2006524002A JP2006506840A JP2006506840A JP2006524002A JP 2006524002 A JP2006524002 A JP 2006524002A JP 2006506840 A JP2006506840 A JP 2006506840A JP 2006506840 A JP2006506840 A JP 2006506840A JP 2006524002 A JP2006524002 A JP 2006524002A
Authority
JP
Japan
Prior art keywords
subband
audio signal
signal
input
delay
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006506840A
Other languages
English (en)
Other versions
JP4597967B2 (ja
Inventor
エリク ジー ピー スフエイエルス
ミッデリンク マルク ダヴリュ ティ クレイン
デ ケルクホフ レオン エム ファン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=33300980&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=JP2006524002(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Publication of JP2006524002A publication Critical patent/JP2006524002A/ja
Application granted granted Critical
Publication of JP4597967B2 publication Critical patent/JP4597967B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/007Two-channel systems in which the audio signals are in digital form
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Input Circuits Of Receivers And Coupling Of Receivers And Audio Equipment (AREA)
  • Stereo-Broadcasting Methods (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)

Abstract

出力オーディオ信号(L、R)が入力オーディオ信号に基づき生成される。該入力オーディオ信号は、複数の入力サブバンド信号(N)を有する。前記入力サブバンド信号は、複数の遅延されたサブバンド信号を得るため、複数の遅延ユニット(76)において遅延される。ここで、少なくとも1つの入力サブバンド信号が、より高い周波数の更なる入力サブバンド信号よりも大きく遅延される。また前記出力オーディオ信号は、前記入力オーディオ信号と前記複数の遅延されたサブバンド信号との組み合わせから導出される(77)。

Description

本発明は、入力オーディオ信号に基づく出力オーディオ信号の生成に関し、より詳細には、出力オーディオ信号を供給する機器に関する。
Erik Schuijers、Werner Oomen、Bert den Brinker及びJeroen Breebaartによる「Advances in Parametric Coding for High-Quality Audio」(前刷り5852、「114th AES Convention」、オランダ、アムステルダム、2003年3月22〜25日)は、ステレオ画像用の効率的なパラメトリック表現を利用したパラメトリック符号化方式を開示している。2つの入力信号が、1つのモノラルオーディオ信号にマージされる。知覚的に関連のある空間的な手掛かりが、明確にモデル化されている。前記マージされた信号は、モノラルのパラメトリックエンコーダを利用してエンコードされる。ステレオパラメータのチャネル間強度差(Interchannel Intensity Difference、IID)、チャネル間時間差(Interchannel Time Difference、ITD)及びチャネル間相互相関(Interchannel Cross-Correlation、ICC)が量子化され、エンコードされ、量子化されエンコードされたモノラルのオーディオ信号と共にビットストリームに多重化される。デコーダ側において、前記ビットストリームが、エンコードされたモノラル信号とステレオパラメータとに多重分離される。エンコードされたモノラルのオーディオ信号は、デコードされたモノラルのオーディオ信号m’を得るためにデコードされる(図1を参照)。モノラルの時間ドメイン信号から、最適な知覚的な非相関(de-correlation)を導出するフィルタD10を利用して、非相関信号(de-correlated signal)が算出される。モノラルの時間ドメイン信号m’及び非相関信号dは共に周波数ドメインに変換される。次いでパラメータ処理ユニット11において、周波数ドメインステレオ信号が、IID、ITD及びICCパラメータを用いて、それぞれスケーリング、位相変更及びミキシングによって処理され、デコードされたステレオの対l’及びr’が得られる。結果の周波数ドメイン表現は、時間ドメインに変換され戻される。
MPEG−4(ISO/IEC14496-3:2002)の「Proposed Draft Amendment(PDAM)2」のセクション5.4.6において、かような非相関信号は、所定のインパルス応答を用いてモノラル信号を畳み込み/フィルタリングすることにより得られる。
公開されていない欧州特許出願02077863.5(整理番号PHNL020639)は、かような非相関信号を導出するために、周波数依存の遅延を有する、例えば櫛型フィルタのようなオールパスフィルタの利用を記載している。高い周波数においては、比較的小さな遅延が利用され、粗い周波数分解能に帰着する。低い周波数においては、大きな遅延が櫛型フィルタの密な間隔に帰着する。フィルタリングが帯域制限フィルタと組み合わせられ、これにより1以上の周波数帯域に非相関を適用しても良い。
本発明の目的は、入力オーディオ信号に基づき、出力オーディオ信号を有利に生成することにある。この目的のため、本発明は、独立請求項に定義される装置、方法及び機器を提供する。有利な実施例は従属請求項において定義される。
本発明の第1の態様によれば、出力オーディオ信号が入力オーディオ信号に基づき生成され、前記入力オーディオ信号は複数の入力サブバンド信号を有し、前記入力サブバンド信号の少なくとも一部が複数の遅延されたサブバンド信号を得るために遅延され、入力サブバンド信号の少なくとも1つが、より高い周波数の更なる入力サブバンド信号よりも大きく遅延され、前記出力オーディオ信号が前記入力オーディオ信号と前記複数の遅延されたサブバンド信号との組み合わせから導出される。かようなサブバンドドメインにおける周波数依存の遅延を提供することにより、特にコアのデコーダが既にサブバンドフィルタバンクを含むようなオーディオデコーダにおいて、パラメトリックステレオが有利に実装されることができる。フィルタバンクはオーディオ符号化の分野において一般に利用されており、例えばMPEG−1/2のレイヤI、II及びIIIは全て32バンドのクリティカルサンプリングされた(critically sampled)サブバンドフィルタを利用する。前記複数の遅延されたサブバンド信号は、上述の非相関信号の同等物であるサブバンドドメインとして利用され得る。理想的な環境においては、前記複数の遅延されたサブバンド信号と前記入力オーディオ信号との間の相関はゼロである。しかしながら、実際的な実施例においては、前記相関は認容できるオーディオの品質については40%、中品質乃至高品質のオーディオについては10%、高オーディオ品質については2又は3%に達する。
本発明の実施例においては、前記出力オーディオ信号は複数の出力サブバンド信号を含む。前記複数の出力サブバンド信号を得るためサブバンドドメインにおいて前記遅延されたサブバンド信号と前記入力サブバンド信号とを組み合わせることは、このとき比較的に実装が容易である。実用的な実施例においては、時間ドメインの出力オーディオ信号が、合成サブバンドフィルタバンクにおける複数の出力サブバンド信号から合成される。
効率的な実装を得るため、複数の遅延ユニットが提供され、ここで遅延ユニットの数は、入力サブバンド信号の数よりも少なく、前記入力サブバンド信号はこの複数の遅延によって群に分割される。
最良のオーディオ品質は、前記複数の遅延ユニットにおける遅延が、高い周波数から低い周波数へと単調増加する実施例において得られる。
本発明の有利な実施例においては、複素フィルタバンクが利用され、該フィルタバンクは効果的に2分の1にオーバーサンプルされる。なぜなら、全ての実入力サンプルについて、実質的に実数と複素数との2つの値から成る複素出力サンプルが生成されるからである。このことは、MPEG−1及びMPEG−2のクリティカルサンプリングされたフィルタバンクが欠点として持つ、大きなエイリアジング成分を除去する。
出力オーディオ信号を生成する効率的な実施例においては、直交ミラーフィルタ(QMF)バンクが利用される。かようなフィルタバンクは、特にPer Ekstrandによる「Bandwidth extension of audio signals by spectral band replication」(「1st IEEE Benelux Workshop on Model based Processing and Coding of Audio」のプロシーディング (MCPA-2002)、53-58頁、ベルギー、Leuven、2002年11月15日)より知られている。図2は、かような複素QMF分析及び合成フィルタバンクのブロック図を示す。分析バンク30は、信号をN個の複素数値サブバンドに分割する。これらは内部的にN分の1にダウンサンプリングされる。様式化された周波数応答が図3に示される。合成QMFフィルタバンク31は、N個の複素サブバンド信号を入力としてとり、実数値のPCM出力信号を生成する。本発明者の洞察によれば、複素QMFフィルタバンクが利用される場合には、知覚的に「理想的な」状況に非常に近い非相関信号が生成されることができる。かような複素QMFフィルタバンクについては、MPEG−4 PDAM2、セクション5.4.6において利用されている畳み込みよりも効率的な実装が存在する。かような畳み込みは、計算負荷及びメモリ使用に比べて比較的高価である。更なる利点として、複素QMFフィルタバンクを利用することは、パラメトリックステレオとスペクトル帯域複製(SBR)との効率的な組み合わせをも可能とする。SBRの背後にある着想は、より高い周波数が、非常に少ない支援情報のみを利用して、より低い周波数から再構築されることができるということである。実際には、該再構築は、複素直交ミラーフィルタ(QMF)によって為される。効率的にサブバンドドメインにおける非相関信号に達するために、本発明の実施例は、サブバンドドメインにおいて周波数(又はサブバンドのインデクス)に依存する遅延を利用する。複素QMFフィルタバンクはクリティカルサンプリングされないため、エイリアジングを考慮するための余分の備えは必要とされない。更に、前記遅延は小さいため、本実施例の全体のRAM使用量は低い。Eksrandにより開示されたようなSBRデコーダにおいては、分析QMFバンクは32個の帯域のみから成るが、コアのデコーダはオーディオデコーダ全体に比べて半分のサンプリング周波数で動作するため、合成QMFバンクは64個の帯域から成ることに留意されたい。しかしながら、対応するエンコーダにおいては、周波数域全体をカバーするために、64帯域の分析QMFバンクが利用される。
整数個のサブバンドサンプルの遅延された信号を非相関信号として利用することは、時間ドメインのスミアリングを引き起こす。即ち、時間的な信号の配置が保存されない。このことは、過渡状態の前後で、即ち信号強度の変化が所定の閾値よりも大きい場合に、アーティファクトを引き起こし得る。信号強度は振幅、パワー等で測定されることができる。本発明の有利な実施例においては、過渡状態の前後におけるアーティファクトは、完全な遅延の代わりに部分的な遅延を利用することにより、過渡状態の前後における非相関信号を導出することにより軽減させられることができる。部分的な遅延とは、2つの連続するサブバンドサンプルの間の時間よりも小さい遅延であり、位相回転を利用することにより容易に実装されることができる。部分遅延から完全な遅延へ、又はその逆の遷移は、前記非相関信号における不連続に帰着し得る。かような不連続を防止するため、本発明の有利な実施例は、部分的に遅延した非相関信号を利用することから、完全に遅延された非相関信号へと戻すために、クロスフェード(cross-fade)を提供する。
本発明のこれらの及び他の態様は、以下に記載される実施例を参照しながら説明され明らかとなるであろう。
図は、本発明を理解するために必須な要素のみを示す。
以下、パラメトリックステレオを利用することにより、モノラルの入力オーディオ信号に基づきステレオの出力オーディオ信号を生成するための、本発明の有利な実施例が説明される。前記入力オーディオ信号は、複数の入力サブバンド信号を含む。前記複数の入力サブバンド信号は、低い周波数サブバンドに対して高い周波数サブバンドよりも大きい遅延を提供する複数の遅延ユニットにおいて遅延される。前記遅延されたサブバンド信号は、前記ステレオの出力信号の生成において必要とされる非相関信号のサブバンドドメインバージョンとして働く。
MPEG−4 PDAM2、セクション5.4.6においては、前記非相関信号は、位相特性φを最初に計算することによって得られる。φは、44.1kHzのサンプリング周波数に対して、
φ=πk(k−1)/K+φ (1)
に等しい。ここでφはπ/2の値を持ち、Kは256に等しく、k=0・・・256である。この位相応答関数より、逆FFTを利用して、フィルタのインパルス応答が算出される。該応答は線形な遅延に類似している。該遅延は、
d=K−(K/π)f (2)
により近似されることができる。ここでdはサンプルにおける遅延であり、fは周波数をラジアンで表す。
好ましくは、前記入力サブバンド信号は、複素QMF分析フィルタバンクにおいて得られる。該複素QMF分析フィルタバンクは、リモートのエンコーダに存在していても良いが、デコーダに存在していても良い。複素QMFフィルタバンクの出力はN分の1にダウンサンプリングされるため、各サブバンド内の遅延に所望の時間ドメインの遅延を正確にマッピングすることは可能ではない。上述した遅延関数(2)の丸められたバージョンを利用することにより、知覚的に優れた近似が得られる。例として、N=64個のサブバンドについて、各サブバンド内の遅延が図6に示される。該実装例については、前記非相関信号を形成するために、136個の複素数値のみが保存される必要がある。より高い周波数については、単一のサブバンドサンプルの遅延が利用されるが、上述の遅延関数は前記サンプリング周波数の半分で値0を示す。単一のサブバンドサンプルの遅延は、前記信号が最大限に非相関であることを確実にする。
図5は、本発明の実施例による、複数の遅延されたサブバンド信号を生成するための装置50のブロック図を示す。装置50はQMF分析フィルタバンク30とQMF合成フィルタバンク31との間のどこかに配置され、複数の遅延ユニット501、502、503及び504を有する。遅延ユニット501は、全てのサブバンドに対して、1単位の遅延を与える。高い周波数サブバンドの群、例えば帯域40乃至64は、更なる遅延なく、合成フィルタバンク31に供給される。比較的低い周波数のサブバンドの群、例えば帯域0乃至40は、遅延ユニット502において更に遅延される。該群の一部、例えば帯域0乃至24は、遅延ユニット503及び遅延ユニット504において更に遅延される(後者はサブバンド0乃至8に対してのみ)。このようにして、異なる遅延の典型的な量の4つの群が効果的に生成され、それぞれ1、2、3又は4単位の遅延を持つ。サブバンドのインデクスの関数としてサブバンドサンプルで表現された遅延が図6に示される。QMF分析フィルタバンク30は、通常オーディオエンコーダ中に存在するが、SBRについては、より小ないM個の帯域の分析QMFフィルタバンクがデコーダにおいても利用される。
図7は、本発明の実施例による、パラメトリックステレオツールとSBRとを組み合わせる、有利なオーディオデコーダ700を示す。ビットストリーム多重分離器70がエンコードされたオーディオビットストリームを受信し、SBRパラメータ、ステレオパラメータ、及びコアエンコードされたオーディオ信号を導出する。コアエンコードされたオーディオ信号は、コアデコーダ71を利用してデコードされる。該デコーダは、例えば標準的なMPEG−1レイヤIII(mp3)又はAACデコーダであっても良い。一般に、かようなデコーダは、出力サンプリング周波数の半分(f/2)で動作する。結果のコアデコードされたオーディオ信号は、M個のサブバンドの複素QMFフィルタバンク72に送られる。該フィルタバンク72は、M個の実入力サンプルにつきM個の複素サンプルを出力し、従って上述したように実質的に2分の1にオーバーサンプリングされる。高周波(HF)生成器73において、前記コアデコードされたオーディオ信号によってカバーされない、高い周波数のサブバンドN−Mが、M個のサブバンド(の特定の部分)を複製することにより生成される。高周波生成器73の出力は、低周波のM個のサブバンドと組み合わせられ、N個の複素サブバンド信号とされる。次いで、エンベロープ調節器74が、前記複製された高い周波数のサブバンド信号を所望のエンベロープに調節し、付加成分付加ユニット75が、SBRパラメータによって示される付加的な正弦波のノイズ成分を付加する。N個のサブバンド信号全体が、遅延されたサブバンド信号を生成するため、遅延ユニット76に供給される。遅延ユニット76は、図5において示された装置50と同等であっても良い。N個の遅延されたサブバンド信号及びN個の入力サブバンド信号は、ICCパラメータのようなステレオパラメータに依存して、結合ユニット77において処理され、第1の出力チャネルについてN個の出力サブバンド信号、及び第2の出力チャネルについてN個の出力サブバンド信号を導出する。前記第1の出力チャネルについてのN個の出力サブバンド信号は、N帯域複素QMF合成フィルタ78を通して送られ、左L用の第1のPCM出力信号を形成する。前記第2の出力チャネルについてのN個の出力サブバンド信号は、N帯域複素QMF合成フィルタ79を通して送られ、右R用の第1のPCM出力信号を形成する。実用的な実施例においては、N=64及びM=32である。
以上提示された方法は、静的な信号に対して十分に適している。しかしながら、非静的な、即ち過渡的な信号については、該方法を利用する場合に問題が生じる。このことは図8に示されている。図8は、前記出力オーディオ信号を導出するための基礎として、図5及び6の完全に遅延された非相関信号を利用して得られたカスタネット信号の1チャネルの結果を示す。一般に、例えばカスタネットのような、強い過渡状態を持つ信号においては、過渡状態の直後における左チャネルと右チャネルとの間の相関は比較的小さい。なぜなら前記信号は主に反響から成るからである。前記非相関信号は従って、非常に顕著に合成される。このことは、実際のカスタネットの過渡状態の直後の明らかなポストエコー(post-echo)に帰着する。時間ドメインにおけるポストマスキング(post-masking)によって、このことは第2の過渡状態としては知覚されないが、望ましくない音のカラーレーションを引き起こす。本発明の有利な実施例においては、部分的な遅延を利用することにより、過渡状態の前後において非相関信号を形成することによって、このアーティファクトが軽減される。かような部分的な遅延は、位相回転を効率的に利用することにより実装されることができる。更なる実施例においては、全体の非相関信号における不連続を防止するために、前記部分的に遅延された非相関信号即ち位相回転された信号は、時間と共に完全に遅延された非相関信号と(低速に)クロスフェードされる。
それ故、過渡位置から開始して、周波数依存の完全な遅延の代わりに元の信号の部分的に遅延された即ち位相回転されたバージョンを利用することが提案される。人間の聴覚系の時間的なポストマスキング特性のため、該非相関信号がどのように計算される必要があるかはそれ程重要ではない。従って、前記非相関信号は例えば、元の信号の各サブバンドにおいて90度の位相シフトを適用することにより得られても良い。
前記過渡状態からの前記非相関信号における不連続を防止するため、好ましくは完全に遅延された信号と前記位相回転された信号との間にクロスフェードが適用される。該クロスフェードは、以下のように実行されても良い:
hybrid[n]=m[n]ddelay[n]+(1−m[n])drotation[n]
ここでnは(サブバンド)サンプルのインデクス、m[n]は合成又はクロスフェード係数、ddelay[n]は周波数依存の内部遅延により形成された非相関(サブバンド)信号、drotation[n]は部分的な遅延又は位相回転により形成された非相関サブバンド信号、dhybrid[n]は結果のハイブリッドな非相関信号である。合成係数m[n]は、前記過渡状態の開始においてはゼロとなる。該係数は、一般に約20ms(約12msが遅延の長さ、約8msが過渡状態の長さ)に対応する時間の間、ゼロのままである。ゼロから1へのフェードインは、一般に約10乃至20msである。合成係数m[n]は線形又は区分線形であっても良いが、これに限定されるものではない。該合成係数m[n]は周波数依存であっても良いことは留意されたい。前記遅延は一般に高い周波数について短いため、高い周波数については、低い周波数についてよりも短いクロスフェードを持つことが知覚的に好ましい。
図11は、部分的な遅延を持つ部分的遅延ユニット110が、部分的に遅延されたサブバンド信号を得るために利用される、図7のオーディオデコーダを示す。遅延ユニット76は、周波数依存の遅延されたサブバンド信号を生成する。実際には、部分的遅延ユニット110は遅延ユニット76と並行して動作しても良いが、遅延ユニット76が動作している間は更なる遅延ユニット110をスイッチオフすること及びその逆も可能である。好ましくは、切り換えユニット111において、部分的に遅延されたサブバンド信号と周波数依存の遅延されたサブバンド信号との間で切り換えが実行される。切り換えユニット111は好ましくは上述したクロスフェード操作を実行するが、ハード的な切り換えも可能である。前記クロスフェード操作は、過渡状態の検出に依存する。過渡状態の検出は、好ましくは過渡状態検出器113において実行される。代替として、エンコーダにおいて、エンコードされたオーディオビットストリームに切り換えインジケータを含めることも可能である。この場合には、ビットストリーム多重分離器70が前記ビットストリームから前記切り換えインジケータを導出し、該切り換えインジケータを切り換えユニット111に供給し、切り換えユニット111において前記切り換えインジケータに依存して切り換えが実行される。
上述の実施例は本発明を限定するものではなく説明するものであって、当業者は添付された請求項の範囲から逸脱することなく多くの代替実施例を設計することが可能であろうことは留意されるべきである。請求項において、括弧の間に配置されたいずれの参照記号も、請求の範囲を制限するものとして解釈されるべきではない。「有する(comprising)」なる語は、請求項に列記されたもの以外の要素又はステップの存在を除外するものではない。本発明は、幾つかの別個の要素を有するハードウェアによって、及び適切にプログラムされたコンピュータによって実装されても良い。幾つかの手段を列挙する装置請求項において、これらの手段の幾つかは同一のハードウェアによって実施化されても良い。特定の手段が相互に異なる従属請求項に列挙されているという単なる事実は、これらの手段の組み合わせが有利に利用されることができないということを示すものではない。
パラメトリックステレオデコーダのブロック図を示す。 N帯域複素QMF分析(左)及び合成(右)フィルタバンクのブロック図を示す。 図2のN帯域QMFフィルタバンクの様式化された周波数応答を示す。 非相関信号を生成するためMPEG−4 PDAM2、セクション5.4.6において利用されるインパルス応答のスペクトログラムを示し、x軸は時間(サンプル)を示し、y軸は正規化された周波数を示す。 本発明の実施例による装置を示すブロック図を示す。 本発明の実施例による、サブバンドサンプルで表現された遅延をサブバンドのインデクスの関数として示す。 パラメトリックステレオをスペクトル帯域複製と組み合わせる、本発明の実施例による有利なオーディオデコーダを示す。 完全に遅延された非相関信号と合成することにより生じる、過渡状態の後のポストエコーの出現を示す。 合成係数の例を示し、値1は完全に遅延された非相関信号が利用されていることを示し、値0は部分的に遅延された非相関信号が利用されていることを示す。 図9の合成係数を利用する場合の結果の出力オーディオ信号を示す。 部分的な遅延を持つ更なる遅延ユニットが利用される、図7のオーディオデコーダを示す。

Claims (18)

  1. 入力オーディオ信号に基づき出力オーディオ信号を生成する装置であって、前記入力オーディオ信号は複数の入力サブバンド信号を有し、前記装置は、
    複数の遅延されたサブバンド信号を得るため、前記入力サブバンド信号の少なくとも一部を遅延させる複数の遅延ユニットを有し、少なくとも1つの入力サブバンド信号が、より高い周波数の更なる入力サブバンド信号よりも大きく遅延され、前記装置は更に、
    前記入力オーディオ信号と前記複数の遅延されたサブバンド信号との組み合わせから前記出力オーディオ信号を導出する結合ユニットを有する装置。
  2. 前記出力オーディオ信号は複数の出力サブバンド信号を含む、請求項1に記載の装置。
  3. 前記複数の出力サブバンド信号から、時間ドメイン出力オーディオ信号を合成するサブバンドフィルタバンクを更に有する、請求項2に記載の装置。
  4. 前記入力オーディオ信号はモノラルのオーディオ信号であり、前記出力オーディオ信号はステレオのオーディオ信号である、請求項1に記載の装置。
  5. 前記遅延ユニットの数は、前記入力サブバンド信号の数よりも少なく、前記入力サブバンド信号は、前記複数の遅延ユニットによって群に分割される、請求項1に記載の装置。
  6. 前記複数の遅延ユニットは、或るサブバンドサンプルを用いて比較的高い周波数のサブバンドの群を遅延させる第1の遅延ユニットと、少なくとも1つの更なるサブバンドサンプルを用いて比較的低い周波数サブバンドの群を遅延させる少なくとも1つの更なる遅延ユニットとを有する、請求項5に記載の装置。
  7. 前記遅延ユニットは、高い周波数から低い周波数へと単調増加する遅延を提供する、請求項1に記載の装置。
  8. 前記サブバンドフィルタバンクは、複素サブバンドフィルタバンクである、請求項1に記載の装置。
  9. 前記複素サブバンドフィルタバンクは、複素直交ミラーフィルタバンクである、請求項8に記載の装置。
  10. 前記出力オーディオ信号の第1のチャネルと第2のチャネルとの間の所望の相関を示す相関パラメータを得るための入力部を更に有し、
    前記結合ユニットは、前記相関パラメータに依存して、前記入力オーディオ信号と前記複数の遅延されたサブバンド信号とを組み合わせることにより、前記第1のチャネル及び前記第2のチャネルを得るように構成された、請求項1に記載の装置。
  11. 前記第1のチャネル及び前記第2のチャネルは、それぞれ複数の出力サブバンド信号を有し、前記装置は更に、それぞれ前記出力サブバンド信号に基づいて第1の時間ドメインチャネルと第2の時間ドメインチャネルとを生成する、前記結合ユニットの出力部に結合された2つの合成サブバンドフィルタバンクを有する、請求項10に記載の装置。
  12. 時間ドメインのコアオーディオ信号に基づき、M個のフィルタリングされたサブバンド信号を生成するための、M個のサブバンドの分析フィルタバンクと、
    前記M個のフィルタリングされたサブバンド信号から得られた高周波信号成分を生成する高周波生成器と、
    を更に有し、前記高周波信号成分はN−M個のサブバンド信号を持ち、ここでN>Mであり、前記N−M個のサブバンド信号は、M個のサブバンドのうちのいずれのサブバンドよりも高い周波数を持つサブバンド信号を含み、M個のフィルタリングされたサブバンドとN−M個のサブバンドとは、合わせて前記複数の入力サブバンド信号を形成する、請求項1に記載の装置。
  13. 前記複数の遅延ユニットは、整数個のサブバンドサンプルの遅延を用いて、前記入力サブバンド信号の少なくとも一部を遅延させるように構成され、少なくとも1つの入力サブバンド信号が、より高い周波数の更なる入力サブバンド信号よりも大きく遅延され、前記装置は更に、
    2つの連続するサブバンドサンプルの間の時間の一部である遅延であって、前記入力サブバンド信号の少なくとも一部の全てに対して一定であり得る遅延を用いて、前記入力サブバンド信号の少なくとも一部を遅延させる部分的遅延ユニットと、
    前記複数の遅延されたサブバンド信号を得るために、前記複数の遅延ユニットと前記部分的遅延ユニットとの間を切り換える切り換えユニットと、
    を有する、請求項1に記載の装置。
  14. 前記切り換えユニットは、前記複数の遅延の出力と前記部分的遅延の出力との間をクロスフェードにより切り換える、請求項13に記載の装置。
  15. 前記入力オーディオ信号の信号強度を検出する検出ユニットを更に有し、前記切り換え手段は、前記信号強度が所定の閾値を上回っている場合に前記部分的遅延に切り換え、前記信号強度が前記所定の閾値を下回っている場合に前記複数の遅延ユニットに切り換えるように構成された、請求項13に記載の装置。
  16. 前記入力オーディオ信号は切り換えインジケータを含み、前記切り換えユニットは、前記切り換えインジケータに依存して切り換えるように構成された、請求項13に記載の装置。
  17. 入力オーディオ信号に基づき出力オーディオ信号を提供する方法であって、前記入力オーディオ信号は複数の入力サブバンド信号を有し、前記方法は、
    複数の遅延されたサブバンド信号を得るため、前記入力サブバンド信号の少なくとも一部を遅延させるステップを有し、少なくとも1つの入力サブバンド信号が、より高い周波数の更なる入力サブバンド信号よりも大きく遅延され、前記方法は更に、
    前記入力オーディオ信号と前記複数の遅延されたサブバンド信号との組み合わせから前記出力オーディオ信号を導出するステップを有する方法。
  18. 出力オーディオ信号を供給する機器であって、
    エンコードされたオーディオ信号を得るための入力ユニットと、
    複数のサブバンド信号を含むデコードされた信号を得るため、前記エンコードされたオーディオ信号をデコードするデコーダと、
    前記デコードされた信号に基づき前記出力オーディオ信号を得るための、請求項1に記載の装置と、
    前記出力オーディオ信号を供給するための出力ユニットと、
    を有する機器。
JP2006506840A 2003-04-17 2004-04-14 オーディオ信号生成 Expired - Lifetime JP4597967B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP03076134 2003-04-17
EP03076280 2003-04-29
PCT/IB2004/050432 WO2004093494A1 (en) 2003-04-17 2004-04-14 Audio signal generation

Publications (2)

Publication Number Publication Date
JP2006524002A true JP2006524002A (ja) 2006-10-19
JP4597967B2 JP4597967B2 (ja) 2010-12-15

Family

ID=33300980

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006506840A Expired - Lifetime JP4597967B2 (ja) 2003-04-17 2004-04-14 オーディオ信号生成

Country Status (11)

Country Link
US (1) US20070038439A1 (ja)
EP (1) EP1621047B1 (ja)
JP (1) JP4597967B2 (ja)
KR (1) KR20050121733A (ja)
AT (1) ATE359687T1 (ja)
BR (1) BRPI0409327B1 (ja)
DE (1) DE602004005846T2 (ja)
ES (1) ES2282860T3 (ja)
PL (1) PL1621047T3 (ja)
RU (1) RU2005135648A (ja)
WO (1) WO2004093494A1 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009530916A (ja) * 2006-03-15 2009-08-27 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション サブフィルタを用いたバイノーラル表現
JP2013508760A (ja) * 2009-10-21 2013-03-07 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 反響装置およびオーディオ信号を反響させる方法

Families Citing this family (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE0301273D0 (sv) * 2003-04-30 2003-04-30 Coding Technologies Sweden Ab Advanced processing based on a complex-exponential-modulated filterbank and adaptive time signalling methods
US8090586B2 (en) * 2005-05-26 2012-01-03 Lg Electronics Inc. Method and apparatus for embedding spatial information and reproducing embedded signal for an audio signal
JP2009500656A (ja) * 2005-06-30 2009-01-08 エルジー エレクトロニクス インコーポレイティド オーディオ信号をエンコーディング及びデコーディングするための装置とその方法
US8185403B2 (en) * 2005-06-30 2012-05-22 Lg Electronics Inc. Method and apparatus for encoding and decoding an audio signal
WO2007004828A2 (en) * 2005-06-30 2007-01-11 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
EP1905008A2 (en) * 2005-07-06 2008-04-02 Koninklijke Philips Electronics N.V. Parametric multi-channel decoding
JP4859925B2 (ja) * 2005-08-30 2012-01-25 エルジー エレクトロニクス インコーポレイティド オーディオ信号デコーディング方法及びその装置
WO2007055463A1 (en) * 2005-08-30 2007-05-18 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
JP5173811B2 (ja) * 2005-08-30 2013-04-03 エルジー エレクトロニクス インコーポレイティド オーディオ信号デコーディング方法及びその装置
US7788107B2 (en) * 2005-08-30 2010-08-31 Lg Electronics Inc. Method for decoding an audio signal
EP1761110A1 (en) * 2005-09-02 2007-03-07 Ecole Polytechnique Fédérale de Lausanne Method to generate multi-channel audio signals from stereo signals
US7672379B2 (en) 2005-10-05 2010-03-02 Lg Electronics Inc. Audio signal processing, encoding, and decoding
CN101283250B (zh) * 2005-10-05 2013-12-04 Lg电子株式会社 信号处理的方法和装置以及编码和解码方法及其装置
US7696907B2 (en) * 2005-10-05 2010-04-13 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
KR100878828B1 (ko) 2005-10-05 2009-01-14 엘지전자 주식회사 신호 처리 방법 및 이의 장치, 그리고 인코딩 및 디코딩방법 및 이의 장치
US7751485B2 (en) * 2005-10-05 2010-07-06 Lg Electronics Inc. Signal processing using pilot based coding
US7646319B2 (en) * 2005-10-05 2010-01-12 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
US7653533B2 (en) * 2005-10-24 2010-01-26 Lg Electronics Inc. Removing time delays in signal paths
US7752053B2 (en) * 2006-01-13 2010-07-06 Lg Electronics Inc. Audio signal processing using pilot based coding
WO2008035949A1 (en) * 2006-09-22 2008-03-27 Samsung Electronics Co., Ltd. Method, medium, and system encoding and/or decoding audio signals by using bandwidth extension and stereo coding
AU2007300813B2 (en) 2006-09-29 2010-10-14 Lg Electronics Inc. Methods and apparatuses for encoding and decoding object-based audio signals
KR101434198B1 (ko) * 2006-11-17 2014-08-26 삼성전자주식회사 신호 복호화 방법
BRPI0711094A2 (pt) * 2006-11-24 2011-08-23 Lg Eletronics Inc método para codificação e decodificação de sinal de áudio baseado em objeto e aparelho deste
FR2911031B1 (fr) 2006-12-28 2009-04-10 Actimagine Soc Par Actions Sim Procede et dispositif de codage audio
FR2911020B1 (fr) * 2006-12-28 2009-05-01 Actimagine Soc Par Actions Sim Procede et dispositif de codage audio
KR101411900B1 (ko) * 2007-05-08 2014-06-26 삼성전자주식회사 오디오 신호의 부호화 및 복호화 방법 및 장치
GB2453117B (en) * 2007-09-25 2012-05-23 Motorola Mobility Inc Apparatus and method for encoding a multi channel audio signal
DE102007048973B4 (de) 2007-10-12 2010-11-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines Multikanalsignals mit einer Sprachsignalverarbeitung
RU2010125221A (ru) * 2007-11-21 2011-12-27 ЭлДжи ЭЛЕКТРОНИКС ИНК. (KR) Способ и устройство для обработки сигнала
KR100970446B1 (ko) * 2007-11-21 2010-07-16 한국전자통신연구원 주파수 확장을 위한 가변 잡음레벨 결정 장치 및 그 방법
CA2708861C (en) * 2007-12-18 2016-06-21 Lg Electronics Inc. A method and an apparatus for processing an audio signal
TWI413109B (zh) 2008-10-01 2013-10-21 Dolby Lab Licensing Corp 用於上混系統之解相關器
CN101751926B (zh) * 2008-12-10 2012-07-04 华为技术有限公司 信号编码、解码方法及装置、编解码系统
KR101712101B1 (ko) 2010-01-28 2017-03-03 삼성전자 주식회사 신호 처리 방법 및 장치
EP2581902A4 (en) 2010-06-14 2015-04-08 Panasonic Corp HYBRID AUDIO ENCODING DEVICE AND HYBRID AUDIO DECODING DEVICE
JP5714180B2 (ja) 2011-05-19 2015-05-07 ドルビー ラボラトリーズ ライセンシング コーポレイション パラメトリックオーディオコーディング方式の鑑識検出
CN102800317B (zh) * 2011-05-25 2014-09-17 华为技术有限公司 信号分类方法及设备、编解码方法及设备
ES2549953T3 (es) * 2012-08-27 2015-11-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato y método para la reproducción de una señal de audio, aparato y método para la generación de una señal de audio codificada, programa de ordenador y señal de audio codificada
US9875756B2 (en) * 2014-12-16 2018-01-23 Psyx Research, Inc. System and method for artifact masking

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5039501A (ja) * 1973-08-13 1975-04-11
US4039755A (en) * 1976-07-26 1977-08-02 Teledyne, Inc. Auditorium simulator economizes on delay line bandwidth
JPH09102742A (ja) * 1995-10-05 1997-04-15 Sony Corp 符号化方法および装置、復号化方法および装置、並びに記録媒体
JP2000501846A (ja) * 1995-12-01 2000-02-15 デジタル・シアター・システムズ・インコーポレーテッド 心理音響学的アダプティブ・ビット割り当てを用いたマルチ・チャネル予測サブバンド・コーダ

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4308424A (en) * 1980-04-14 1981-12-29 Bice Jr Robert G Simulated stereo from a monaural source sound reproduction system
US5235646A (en) * 1990-06-15 1993-08-10 Wilde Martin D Method and apparatus for creating de-correlated audio output signals and audio recordings made thereby
JP3127600B2 (ja) * 1992-09-11 2001-01-29 ソニー株式会社 ディジタル信号復号化装置及び方法
DE19632734A1 (de) * 1996-08-14 1998-02-19 Thomson Brandt Gmbh Verfahren und Vorrichtung zum Generieren eines Mehrton-Signals aus einem Mono-Signal
US6035045A (en) * 1996-10-22 2000-03-07 Kabushiki Kaisha Kawai Gakki Seisakusho Sound image localization method and apparatus, delay amount control apparatus, and sound image control apparatus with using delay amount control apparatus
TW369746B (en) * 1996-11-13 1999-09-11 Sanyo Electric Co Surround circuit
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
DE19900819A1 (de) * 1999-01-12 2000-07-13 Bosch Gmbh Robert Verfahren zum Dekodieren gestörter Funksignale von Mehrkanal-Audiosendungen
US7006636B2 (en) * 2002-05-24 2006-02-28 Agere Systems Inc. Coherence-based audio coding and synthesis

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5039501A (ja) * 1973-08-13 1975-04-11
US4039755A (en) * 1976-07-26 1977-08-02 Teledyne, Inc. Auditorium simulator economizes on delay line bandwidth
JPH09102742A (ja) * 1995-10-05 1997-04-15 Sony Corp 符号化方法および装置、復号化方法および装置、並びに記録媒体
JP2000501846A (ja) * 1995-12-01 2000-02-15 デジタル・シアター・システムズ・インコーポレーテッド 心理音響学的アダプティブ・ビット割り当てを用いたマルチ・チャネル予測サブバンド・コーダ

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009530916A (ja) * 2006-03-15 2009-08-27 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション サブフィルタを用いたバイノーラル表現
JP2013508760A (ja) * 2009-10-21 2013-03-07 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 反響装置およびオーディオ信号を反響させる方法
KR101409039B1 (ko) * 2009-10-21 2014-07-02 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 오디오 신호를 반향하기 위한 반향기 및 방법
JP2015064597A (ja) * 2009-10-21 2015-04-09 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 反響装置およびオーディオ信号を反響させる方法
US9245520B2 (en) 2009-10-21 2016-01-26 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Reverberator and method for reverberating an audio signal
US10043509B2 (en) 2009-10-21 2018-08-07 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandtem Forschung E.V. Reverberator and method for reverberating an audio signal

Also Published As

Publication number Publication date
KR20050121733A (ko) 2005-12-27
DE602004005846T2 (de) 2007-12-20
BRPI0409327B1 (pt) 2018-02-14
EP1621047B1 (en) 2007-04-11
BRPI0409327A (pt) 2006-04-25
PL1621047T3 (pl) 2007-09-28
WO2004093494A1 (en) 2004-10-28
ES2282860T3 (es) 2007-10-16
DE602004005846D1 (de) 2007-05-24
ATE359687T1 (de) 2007-05-15
EP1621047A1 (en) 2006-02-01
JP4597967B2 (ja) 2010-12-15
RU2005135648A (ru) 2006-03-20
US20070038439A1 (en) 2007-02-15

Similar Documents

Publication Publication Date Title
JP4597967B2 (ja) オーディオ信号生成
JP4834539B2 (ja) オーディオ信号合成
RU2705007C1 (ru) Устройство и способ для кодирования или декодирования многоканального сигнала с использованием сихронизации управления кадрами
KR101711312B1 (ko) 오디오 신호를 재생하기 위한 장치 및 방법, 코딩된 오디오 신호를 생성하기 위한 장치 및 방법, 컴퓨터 프로그램 및 코딩된 오디오 신호
RU2614573C2 (ru) Усовершенствованное стереофоническое кодирование на основе комбинации адаптивно выбираемого левого/правого или среднего/побочного стереофонического кодирования и параметрического стереофонического кодирования
JP5189979B2 (ja) 聴覚事象の関数としての空間的オーディオコーディングパラメータの制御
EP2405425B1 (en) Apparatus, method and computer program for upmixing a downmix audio signal using a phase value smoothing
Herre et al. The reference model architecture for MPEG spatial audio coding
JP4804532B2 (ja) 無相関信号の包絡線整形
RU2361288C2 (ru) Устройство и способ для формирования сигнала управления многоканальным синтезатором и устройство и способ многоканального синтеза
RU2625444C2 (ru) Система обработки аудио
Purnhagen Low complexity parametric stereo coding in MPEG-4
TWI483244B (zh) 用於將信號編碼/解碼之裝置與方法
KR101016982B1 (ko) 디코딩 장치
TWI415111B (zh) 空間解碼器單元、空間解碼器裝置、音訊系統、消費型電子裝置、產生一對雙耳輸出聲道之方法及電腦可讀媒體
US9479871B2 (en) Method, medium, and system synthesizing a stereo signal
TWI388224B (zh) 解相關信號的產生
JP4664431B2 (ja) アンビエンス信号を生成するための装置および方法
EP1683133A1 (en) Audio signal encoding or decoding
US8744088B2 (en) Method, medium, and apparatus decoding an input signal including compressed multi-channel signals as a mono or stereo signal into 2-channel binaural signals
RU2804032C1 (ru) Устройство обработки звуковых сигналов для кодирования стереофонического сигнала в сигнал битового потока и способ декодирования сигнала битового потока в стереофонический сигнал, осуществляемый с использованием устройства обработки звуковых сигналов
MX2008009565A (en) Apparatus and method for encoding/decoding signal

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070413

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090811

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100128

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100525

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20100716

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100824

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100922

R150 Certificate of patent or registration of utility model

Ref document number: 4597967

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131001

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250