JP2009533910A - アンビエンス信号を生成するための装置および方法 - Google Patents

アンビエンス信号を生成するための装置および方法 Download PDF

Info

Publication number
JP2009533910A
JP2009533910A JP2009504579A JP2009504579A JP2009533910A JP 2009533910 A JP2009533910 A JP 2009533910A JP 2009504579 A JP2009504579 A JP 2009504579A JP 2009504579 A JP2009504579 A JP 2009504579A JP 2009533910 A JP2009533910 A JP 2009533910A
Authority
JP
Japan
Prior art keywords
signal
implemented
transition period
transient
ambience
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009504579A
Other languages
English (en)
Other versions
JP4664431B2 (ja
Inventor
ユールゲン ヘレ
オリヴァー ヘルムート
シュテファン ガヤーズベアガー
アンドレーアス ワルサー
クリスティアン ヤンセン
Original Assignee
フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ filed Critical フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ
Publication of JP2009533910A publication Critical patent/JP2009533910A/ja
Application granted granted Critical
Publication of JP4664431B2 publication Critical patent/JP4664431B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 
    • H04S5/005Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation  of the pseudo five- or more-channel type, e.g. virtual surround
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/04Circuit arrangements, e.g. for selective connection of amplifier inputs/outputs to loudspeakers, for loudspeaker detection, or for adaptation of settings to personal preferences or hearing impairments

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Stereophonic System (AREA)

Abstract

過渡検出器は、過渡期を検出するために特別なラウドスピーカー信号がないラウドスピーカーを介して放たれるために適しているアンビエンス信号を生成するために提供される。合成信号生成器は、一方では過渡条件を他方では合成信号のための連続条件を満たす合成信号を生成する。そして、信号置換器は、サラウンドチャンネルのためのアンビエンス信号を得るために合成信号で検査信号の部分を置換する。
【選択図】図1

Description

本発明は、音声信号処理に関し、特に、特別なラウドスピーカー信号が送られないマルチチャンネルシナリオにおいてラウドスピーカーのためのアンビエンス信号を生成する概念に関する。
マルチチャンネルオーディオマテリアルは、人気が増加している。これは、多くのエンドユーザーが現在マルチチャンネル再生システムを所有しているという結果をもたらしている。これは、主に、DVDの人気が増加し、DVDの多くのユーザーが現在5.1マルチチャンネル装置を所有しているという事実によるものと考えられる。この種の再生システムは、一般に、ユーザーの前方に典型的に配置される3つのラウドスピーカーL(左)、C(中央)およびR(右)と、ユーザーの後方に配置される2つのラウドスピーカーLsおよびRsと、低周波効果チャンネルまたはサブウーファとも呼ばれる典型的に1つのLFEチャンネルとを含む。そのようなチャンネルシナリオは、図10および図11に示される。ユーザーに関してラウドスピーカーL、C、R、Ls、Rsの位置決めは、ユーザーが可能な限り最高の聴覚印象を受けるために、図10および図11に示されるように実行されるが、(図10および図11に示されない)LFEチャンネルの位置決めは、耳がそのような低周波で位置を特定することができないので、それほど重要ではなく、そのため、LFEチャンネルは、そのかなりの大きさによりかく乱効果を起こさない場所に配置することができる。
そのようなマルチチャンネルシステムは、図9に例示されるように2つのチャンネル再生である典型的なステレオ再生と比較していくつかの利点を生じる。
最適な中央聴覚位置の外側では、中央チャンネルのため、「フロントイメージ(front image)」とも呼ばれる前方の聴覚印象の安定性を改善する結果となる。このように、「スイートスポット(sweet−spot)」をより大きくする結果となり、「スイートスポット」は最適な聴覚位置を表している。
さらに、2つの後方のラウドスピーカーLsおよびRsのため、リスナーは、オーディオシーンを「深く探求すること(delving into)」の改善された感覚を得る。
それにもかかわらず、ユーザーの所有においてまたは一般的に利用することができる膨大な量のオーディオマテリアルがあり、それは、2つのチャンネル、すなわち左チャンネルおよび右チャンネルを有するだけであるステレオマテリアルとして存在するだけである。この種のステレオ曲の典型的なサウンドキャリアは、コンパクトディスクである。
5.1マルチチャンネル音声装置を介してそのようなステレオマテリアルを再生するために、国際電気通信連合に従って推奨される2つのオプションがある。
第1のオプションは、マルチチャンネル再生システムの左右のラウドスピーカーを介して、左右のチャンネルを再生することである。しかしながら、この解決策は、すでに存在している複数のラウドスピーカーが用いられない、すなわち存在している中央のラウドスピーカーおよび2つの後方のラウドスピーカーが有利なやり方で用いられないという点で不利である。
他のオプションは、マルチチャンネル信号を形成するために、2つのチャンネルを変換することである。これは、再生の間または特別な前処理によって行うことができ、例示のようにすでに存在している5.1再生システムの全ての6つのラウドスピーカーの有利な使用をさせ、ひいては、2チャンネルから5および/または6チャンネルへのアップミキシングがエラーなしで実行される場合に、改善された聴覚印象をもたらす。
第2のオプションのときに、すなわちマルチチャンネルシステムの全てのラウドスピーカーを用いることは、アップミキシングエラーが発生しない場合に、第1の解決策と比較して有利である。この種のアップミキシングエラーは、アンビエンス信号としても知られている後方のラウドスピーカーのための信号がエラーのないやり方で発生されない場合に、特に防ぐことができる。
このいわゆるアップミキシングプロセスを実行する方法は、キーワード「直接アンビエンス概念(direct ambience concept)」で知られている。直接音源は、それらが元の2チャンネルバージョンと同じ位置でユーザーによって知覚されるように、存在する3つの前方のチャンネルによって再生される。元の2チャンネルバージョンは、さまざまなドラム楽器の例を用いて図9に概略的に示される。
図10は、全ての元の音源、すなわちドラム楽器が3つの前方のラウドスピーカーL、CおよびRによって再生される概念のアップミックスバージョンを示し、そこにおいて、さらに特別なアンビエンス信号が2つの後方のラウドスピーカーによって出力される。このようにターム「直接音源(directed sound source)」は、ドラム楽器を用いて図9に概略的に例示されるように、例えば、ドラム楽器または他の楽器、あるいは一般的に、特別なオーディオオブジェクトのように、ディスクリートな音源から直接的に到来しているだけのトーンを表すために用いられる。例えば壁面反射によるようなさらなるサウンドも、そのような直接音源に存在しない。このシナリオにおいて、図10に2つの後方のラウドスピーカーLs、Rsによって放たれるサウンド信号は、元の記録に存在しまたは存在しないアンビエンス信号だけを含む。この種のアンビエンス信号は、単一の音源に属さないが、記録の室内音響の再生に貢献し、ひいては、リスナーによっていわゆる「深く探求すること」の感覚をもたらす。
「バンドの(in−the−band)」概念と呼ばれる他の概念は、図11において概略的に示される。あらゆるタイプのサウンド、すなわち直接音源およびアンビエンスタイプのトーンの全ては、リスナーの周囲に配置される。トーンの位置は、図11に例示されるように、その特性(直接音源またはアンビエンスタイプのトーン)から独立し、アルゴリズムの詳細設計にだけ依存する。このように、アップミックスアルゴリズムによって図11において2つの楽器1100および1102がリスナーに関して横に配置されると決定されるが、2つの楽器1104および1106はユーザーの前方に配置される。この結果は、2つの後方のラウドスピーカーLs、Rsが、同じ楽器が全てユーザーの前方に配置される図10の場合のように、アンビエンスタイプのトーンだけでなく、2つの楽器1100および1102の部分も含む。
専門家発表「C.アベンダノ(Avendano)およびJ.M.ヨット(Jot)の「マルチチャンネルオーディオミックスアップのためのステレオ信号からアンビエンスの抽出および合成(Ambience Extraction and Synthesis from Stereo Signals for Multichannel Audio Mixup)」、音響音声信号処理に関するIEEEインターナショナル会議、ICASSP02、フロリダ州、オーランド、2002年5月」は、ステレオ音声信号においてアンビエンス情報を認識しさらに抽出するための周波数ドメイン技術を開示している。この概念は、主にアンビエンス成分を含むステレオ信号において時間周波数領域を決定することを可能にする、インターチャンネルコヒーレンスおよび非線形マッピング機能を計算することに基づいている。そして、アンビエンス信号は、マルチチャンネル再生システムの後方のチャンネルまたは「サラウンド」チャンネルLs、Rs(図10および図11)を記憶するために合成されて用いられる。
専門家発表「R.イルワン(Irwan)およびロナルド M アーツ(Aarts)の「ステレオをマルチチャンネルサウンドに変換する方法(A method to convert stereo to multi−channel sound)」、AES第19回国際会議のプロシーディング、ドイツ、シュロス エルマウ、2001年6月21日〜24日、139−143頁」に、ステレオ信号をマルチチャンネル信号に変換するための方法が開示されている。サラウンドチャンネルのための信号は、相互相関技術を用いて計算される。主成分分析(PCA)は、主要な信号の方向を示しているベクトルを計算するために用いられる。そして、このベクトルは、3つの前方のチャンネルを生成するために、2チャンネル表現から3チャンネル表現にマップされる。
専門家発表「G.ソーロドル(Soulodre)の「アンビエンスに基づくアップミキシング(Ambience−Based Up−mixing)」、ワークショップ「サラウンドサウンドの空間符号化(Spatial Coding of Surround Sound):プログレスレポート」、第117回AESコンベンション、米国、カリファルニア州、サンフランシスコ、2004年」は、ステレオ信号からマルチチャネル信号を生成するシステムを開示している。信号は、いわゆる個々のソースストリームおよびアンビエンスストリームに分解される。これらのストリームに基づいて、いわゆる「エステティックスのプロセッサ(esthetics processor)」は、マルチチャンネル出力信号を合成する。
さまざまなやり方において知られている全ての技術は、元のステレオ信号からアンビエンス信号を抽出しようとするかまたはノイズおよび/またはさらなる情報からそれを合成しようと試みるが、そこにおいて、ステレオ信号にない情報が、アンビエンス信号を合成するために用いられる。しかしながら、結局、それはステレオ信号から情報を抽出しおよび/または情報を再生シナリオに送ることに関するすべてであり、その情報は明確に存在しないが、その理由は、典型的には2チャンネルステレオ信号だけ、さらに、おそらくは、さらなる情報および/またはメタ情報が利用できるからである。
その観点から、そのようなアンビエンス信号の抽出または部分抽出および部分合成は、ユーザーが前方からすなわち左チャンネル、中央チャンネルおよび右チャンネルから直接的に到来するように認識する音源からの情報がアンビエンスチャンネルに含まれた場合に、ユーザーがそれを邪魔なものであると感じるので、リスクを伴う問題である。このために、アンビエンス信号の生成は、ユーザーが邪魔なものであると感じるアーチファクトが生成されないことを確実にするために、非常に「守勢的(defensive)」なものとされる。アンビエンス信号を生成する場合にあまりに守勢的に作用する他の極端な場合は、抽出されるために非常にかすかであるかほとんど知覚できないアンビエンス信号であるか、または、アンビエンス信号は、ノイズだけを含むが、アンビエンス信号が聴覚の満足に非常にわずかに貢献するようにそれ以上特別な情報を含まず、この場合完全に実際に除かれる。
一方では、通常のノイズを超える情報を含むアンビエンス信号が生成されるが、そのアンビエンス信号が可聴アーチファクトをもたらさないこと、すなわち可聴性および情報コンテンツ間の適切な措置が維持されなければならないことは、アンビエンス信号を生成する場合に問題になる。
C.アベンダノ(Avendano)およびJ.M.ヨット(Jot)の「マルチチャンネルオーディオミックスアップのためのステレオ信号からアンビエンスの抽出および合成(Ambience Extraction and Synthesis from Stereo Signals for Multichannel Audio Mixup)」、音響音声信号処理に関するIEEEインターナショナル会議、ICASSP02、フロリダ州、オーランド、2002年5月 R.イルワン(Irwan)およびロナルド M アーツ(Aarts)の「ステレオをマルチチャンネルサウンドに変換する方法(A method to convert stereo to multi−channel sound)」、AES第19回国際会議のプロシーディング、ドイツ、シュロス エルマウ、2001年6月21日〜24日、139−143頁」 G.ソーロドル(Soulodre)の「アンビエンスに基づくアップミキシング(Ambience−Based Up−mixing)」、ワークショップ「サラウンドサウンドの空間符号化(Spatial Coding of Surround Sound):プログレスレポート」、第117回AESコンベンション、米国、カリファルニア州、サンフランシスコ、2004年
本発明の目的は、可聴アーチファクトが低減されるアンビエンス信号を生成するための概念を提供することである。
この目的は、請求項1に記載のアンビエンス信号を生成するための装置、請求項21に記載のアンビエンス信号を生成するための方法または請求項22に記載のコンピュータプログラムによって達成される。
本発明は、リスナーによってアンビエンス信号において最も負のものとして知覚されるアーチファクトが、彼または彼女が音源を前方から到来するものとして知覚しているけれども、後方のラウドスピーカーにおいて直接音源があると思っているリスナーをもたらしているアーチファクトであるという知見に基づく。直接音源を知覚するための特性は、過渡プロセス、すなわち、音のかすかな状態から大きい状態へまたは音の大きい状態からかすかな状態への変更閾値を超える(急速な)変化に関する、および/または、特別なバンドにおいて特に特定時間の範囲内のトップバンドにおいて変更閾値を超えるエネルギーにおいて(強い)増加に関する、時間信号における信号微細構造である。
この種の過渡プロセスは、例えば、楽器の開始またはドラム楽器をたたくことまたはゆっくり消えて行かないくて急に止められるトーンの終端である。リスナーは、本発明に従って、アンビエンスラウドスピーカーが、トランジェントを含んでいないかまたはトランジェントを強く減衰した創造的に生成されたアンビエンス信号を提供するように、アンビエンス信号から除去される直接音源の特性のような過渡プロセスを知覚する。
本発明によれば、アンビエンス信号においてトランジェントを抑制することがあまり大きな振幅変調をもたらさないことが確実にされる。振幅すなわちサウンド強度においてトランジェントがないすなわち過渡閾値よりも小さいが特定の変動閾値を超える変動は、そのような振幅変動がアンビエンス信号においてトランジェントの簡単な除去により結果としてなった場合に、ユーザーによって邪魔なものとして認められ、さらに、リスナーによってアーチファクトまたはエラーとして認められることが本発明によって見出された。
本発明によれば、検査信号において、過渡領域が検査信号に存在する過渡期が検出される。その後、合成信号生成器を用いて合成信号が過渡期に生成され、その生成器は、それが過渡領域において検査信号よりもフラットな時間的経過を有するように合成信号を生成するように実装され、合成信号生成器は、それが検査信号の前または後の部分の強度に関して所定の閾値よりも小さく異なるように合成信号を生成するようにさらに実装される。そして、生成された合成信号は、アンビエンス信号を得るために、過渡期において検査信号の代わりに信号置換器によって用いられる。
このように、2チャンネルステレオ入力信号からのアンビエンス信号タイプ信号の抽出は本発明によって改善され、または、例えば、すでに抽出された生のアンビエンス信号である存在している信号の後処理が実行される。第1の場合において、検査信号は、実際の2チャンネルステレオ信号および/または2チャンネル信号の1つのそれぞれのチャンネルであるが、第2の場合において、検査信号は、抽出されたアンビエンス信号または事前に合成されたアンビエンス信号である。このように、本発明の概念は、特に「直接アンビエンス概念(direct ambience concept)」としても示したアップミックス概念に役立つ。また、本発明の概念は、「バンドの(in−the−band)」概念のための利点があり、それは、この場合も、一方ではどんな邪魔になるアーチファクトも有しないが、他方ではユーザーがアンビエンス信号で得るところがある十分な情報をまだ含んでいる、改善されたアンビエンス信号をもたらす。
本発明のアンビエンス信号生成には、アンビエンス信号が直接音源からの関連部分を有しない結果があり、そこにおいて、特に、トランジェントが含まれないおよび/またはトランジェントが非常に強く減衰した形式でだけ含まれる。さもなければ、リスナーは、彼自身または彼女自身の後方で直接音源を知覚し、それは、典型的に前方から音源を知覚するだけであるユーザーの経験と対立する。
さらに、本発明の概念は、例えば、トランジェントが簡単に完全に除去される場合に得られる中断アンビエンスタイプトーンが、不快なものとしてまたはアップミックスプロセスにおいてエラーとしてユーザーによって知覚されるので、アンビエンス信号が連続非中断拡散トーン信号であることを確実にする。
本発明の好適な実施態様において、後方のチャンネルのためのアンビエンスタイプ信号は、直接アンビエンスタイプアップミックスプロセスを達成するために、ステレオ信号から抽出される。これを達成するために、無相関信号成分だけが例に用いられ、または、簡単な解決策として、元の左右のチャンネル間の差が単に用いられる。後方のチャンネルがこのように生成される場合、それらは、直接音源の過渡タイプ成分をしばしば含む。これらのトランジェントは、例えば音符の始まりまたは打楽器のパートのようなトーンでありえる。直接音源(それにはトランジェントが典型的に属する)がリスナーの前方に配置されるとともに、リスナーの後方にあるものとして知覚されるトランジェントが、直接音源の位置を特定することに負の影響を及ぼす。このように、直接音源は、元のものより広く思われ、または、さらに有害でさえあるユーザーの後方の独立した直接音源として知覚され、そこにおいて、両方の影響は、特に直接アンビエンス概念にとって非常に好ましくない。
本発明によれば、過渡期に制限された強度変動を許可するだけのことによって、これらの問題には、アンビエンスタイプ信号においてトランジェントを抑制することおよび残りの信号に関してこの抑制の影響を最小化すること、すなわち信号の連続性を維持することによって対処される。
本発明の好適な実施形態において、過渡期に生成される信号は、信号置換器によって用いられる前に、過渡期においてもともと存在する信号と混合され、それは、例えば、オーバーラップ処理によって達成される。その代わりにまたは付加的に、クロスフェージングは、過渡期の前の信号から過渡期における信号までクロスフェージング領域においてゆっくりクロスフェージングを実行するために、または、過渡期からそれをゆっくりフェードアウトするために、過渡期のエッジで不連続性を抑制しまたは少なくとも低減するように実行することができる。
特に、どんなトランジェントも検出されない場合に、過渡期から元の信号までのフェードアウトは、アーチファクトのない聴覚印象のために好ましいが、その理由は、アーチファクトによって損なわれない検査信号がある場合に、合成信号から元の検査信号への移行によってパチパチと音をたてたり同様の影響が生成されたりしないことが確実にされるからである。
本発明のさらなる好適な実施形態において、周波数ドメインにおいて過渡期における信号の操作は、スペクトル値のサインまたはさらに一般的に言えばスペクトル値のフェーズをランダム化することによって実行され、それは、必然的に、周波数ドメインにおいて操作されるこの信号の時間的微細構造の平滑化をもたらす。さらなるスペクトル処理は、スペクトル値の周波数に関して予測を作り、そして、予測スペクトル値を合成信号のスペクトル値として用いるが、その理由は、周波数に関する予測が対応する時間信号の平滑化をもたらすからである。
同時に維持しまたはわずかに影響を与えるだけの場合にトランジェントを抑制するためには、過渡期の強度を最大でも+/−50%だけ変えること、すなわち1つのブロックから次の1つのものまでスペクトル値の変動を制限することが好ましく、この制限は、全体的にすなわち全てのスペクトル値に対して同等に行われるか、選択的にすなわち特に大きい変動を含む特定のスペクトル値に対してだけ行われる。
本発明の好適な実施形態が添付図面を参照して以下に詳細に説明され、これらの図面としては:
図1は、アンビエンス信号を生成するための本発明のブロック回路図であり、
図2aは、非オーバーラップブロックを有するがクロスフェージング領域を有するブロック処理の概略図であり、
図2bは、オーバーラップブロックを有する合成信号生成の概略図であり、
図3は、図2aまたは図2bに用いられるフェードイン機能およびフェードアウト機能を有するクロスフェージングの特別な実施を示し、
図4は、周波数ドメインにおける処理を含む好適な実施のブロック回路図であり、
図5aは、周波数ドメイン処理の代わりの実施を示し、
図5bは、他の代わりの周波数ドメイン処理を示し、
図5cは、強度に基づく処理の好適な実施を示し、
図6は、合成信号においてトーン領域を維持するための実施を示し、
図7は、高周波数成分HFCに基づく好適な実施形態のブロック回路図であり、
図8は、直接サウンドチャンネルL、R、Cを生成するためのさらなる機能性を有する本発明の装置の好適な実施を示し、
図9は、ステレオ再生シナリオを示し、
図10は、全ての直接音源が前方のチャンネルによって再生されるマルチチャネル再生シナリオを示し、
図11は、音源が後方のチャンネルによっても再生されるマルチチャンネル再生シナリオを示す。
図1は、特別なラウドスピーカー信号が送られないラウドスピーカーを介して放たれるために適しているアンビエンス信号10を生成するための本発明の装置を示す。この種のラウドスピーカーは、図10および図11においてLsおよびRsで例示されるように、典型的に後方のラウドスピーカーまたはサラウンドラウドスピーカーである。
図1に示される装置は、検査信号が過渡領域を含む(図2において20で示される)過渡期を検出するための過渡検出器11を含む。過渡検出器のいくつかの実施がここで記載されているにもかかわらず、トランジェントを検出するためのその他の方法も、例えばMPEG−4オーディオコーダにおいて見られるように用いることができると指摘され、短いウインドウから長いウインドウへの切替えは、過渡検出に基づいて実行される。音声信号処理の他の分野においても、時間信号のエンベロープの速くて強い変動を検出することが可能である過渡検出器が用いられる。検出されるべき大きさの典型的なオーダーは、1ミリ秒の期間において、エンベロープの大きさの100%以上の変動に関するエンベロープの変動である。
過渡検出器11は、両方の条件すなわち一方では過渡条件および他方では連続条件を満たしている合成信号13を生成するために実装される合成信号生成器12に結合される。過渡条件は、合成信号が過渡領域において検査信号よりフラットな時間的経過を有するということであるが、連続条件は、過渡領域において合成信号の強度が検査信号の前または後の部分の強度から予め設定された閾値よりも小さくそれるということである。好ましくは、閾値は、相対的な閾値であって値=2.5であり、値=1.5でも好ましい。これは、過渡領域において信号の強度が、検査信号の前の非過渡部分または後の非過渡部分の強度の最大でも1.5倍または0.66倍であることを意味する。このように、トランジェント抑制が邪魔になる振幅変動および/または強度変動をもたらさないことが確実にされる。
閾値は、履歴値を用いて決定される80%以下の信頼区間によって実現することもできる。
本発明のために使用される強度尺度は、サンプルの2乗または1つのブロックのスペクトル値の2乗を加えることによって得られるエネルギー、または、時間的ブロック長を考慮して得ることができる電力尺度、または、重み付けまたは非重み付けのやり方でバンドにおいてスペクトル値の大きさを加える尺度でさえも含み、そこにおいて、強度を示しているこの特別な尺度は、加算が行われるバンドが検査信号のより高い周波数バンドである場合に、または、一般により高い周波数がより低い周波数と比較してより強く重み付けられまたは最終結果により強い影響力を有する場合に、高周波数成分と呼ばれる。
そして、合成信号生成器は、アンビエンス信号10を最終的に提供するために、元の検査信号の対応する領域の代わりに合成信号を用いる信号置換器14によって用いられる合成信号を生成する。信号置換器14は、図1に示すように、ライン13を介して合成信号とは別に、ライン15を介して検査信号を受信する。過渡検出器11は、入力ライン16を介して検査信号を受信し、さらに、ライン18を介して合成信号生成器12に提供される検査信号を用いて合成信号生成器12が合成信号を生成するために、出力ライン17を介して過渡情報を合成信号生成器12に提供する。
本発明の特別な実施形態において、図2aに示されるように非オーバーラップブロック処理、または、図2bに示されるようにオーバーラップブロック処理が用いられる。図2aの非オーバーラップブロック処理において、検査信号21は、好ましくは特別なブロック長を有する等長のブロックに分けられる。そして、過渡検出器は、過渡期20においてトランジェント22を検出する。このように、トランジェント22は、図2aの過渡期20にあり、その結果は、過渡検出器11が合成信号生成器12に通信するその出力ライン17を介して出力信号を提供し、それは合成信号を開始する。直接過渡期20の前および後のブロックは、クロスフェージング領域23においてクロスフェージングを除いてアンビエンス信号10の対応する部分を表す一方、過渡期20に対応する検査信号のブロックは、合成信号生成器によって合成され、そして、アンビエンス信号において検査信号の元のブロックの代わりに信号置換器14によって用いられる。
後述するように、好適な実施態様において、検査信号のブロックは処理され、それは周波数ドメインにおいて行われる。これは、ブロック境界で合成信号が検査信号において前のブロックの最後のサンプルであるサンプルからかなり異なるサンプル値を有する結果となる。起こり得るこの種のブロック境界アーチファクトを除去するために、図2aに示される実施形態において、例えば、生成される合成信号の最初のサンプルを、クロスフェージング機能に従って例えば図3におけるフェードイン機能に従って重み付けられる前のブロックの最後の10個のサンプルに加えることによって、過渡期の前のブロックから過渡期の合成信号までクロスフェージングを実行することは好ましい。同時に、前のブロックの最後のサンプルは、図3のフェードアウト機能に従って、クロスフェージングを提供するために過渡期においてフェードイン機能に従って重み付けられる合成されたブロックの、最初のサンプルまたは最初のサンプルの後のサンプルに加えられる。対応して、同じ方法は、後のクロスフェージング領域に、すなわち過渡期から通過してトランジェントによって影響されないアンビエンス信号のブロックに戻る場合に適用される。
この種のブロック境界アーチファクトをさらに低減するために、オーバーラップ処理は、図2bに示されるように好ましい。図2bに示される実施形態において、過渡検出器は、円付き数字(1)、(2)、(3)、(4)、(5)、(6)によって表されるブロック領域を検出する。トランジェントは、22で検出される。その結果、図2aと比較して、トランジェントがブロック4およびブロック5の両方において位置22で検出されるので、より長い過渡期20がある。このように、図1の合成信号生成器12は、ブロック4およびブロック5の両方に対して合成信号を生成する。3つの過渡期領域A、B、Cの前のブロックに対して、検査信号は、トランジェントを有しなく、ひいては、アンビエンス信号に運ばれる一方、領域A、B、Cは、図1の信号置換器14によって、合成信号生成器によって生成される部分A、B、Cで置換される。部分Aは、トランジェントによって影響されない検査信号のブロック3の後半を、ブロック4に対して発生される合成信号の前半に加えることによって生成される。過渡期20の第2の部分Bは、ブロック4に対して生成される合成信号の後半を、ブロック5に対して生成される合成信号の前半に加えることによって提供され、さらに、アンビエンス信号10の対応する部分として信号置換器によって置換される。過渡期20の第3の部分Cは、合成信号生成器によって生成されるブロック5の後半を、トランジェントによってもはや影響されないブロック6の前半に加えることによって提供され、さらに、信号置換器14によってアンビエンス信号に書き込まれる。
図3に示されるフェードアウト機能は、後でさらに詳細に論じる。このように、このフェードアウト機能は、非オーバーラップブロックを有するブロック処理の場合に非合成ブロックから合成されたブロックへのソフトブロック移行を提供し、さらに、合成されたブロックから非合成ブロックへ戻るソフトブロック移行をさらに提供するために用いることができる。その代わりに、対応するクロスフェード機能は、特に合成信号がある特定数のブロックによって生成される場合に、元の検査信号に再び戻るクロスフェードに用いることもできる。合成信号が、外挿のため、検査信号からかなりドリフトするという確率があるので、特定の場合において検査信号に急に後戻りすることは、可聴アーチファクトをもたらす。このように、どんなトランジェントも検出されないブロックに対して、最後の合成されたブロックの90%までおよび現在の検査ブロックの10%までからなる合成信号を生成することによって、図3のフェードイン/フェードアウト機能に従って遅いクロスフェージングを実行することは好ましい。次のブロックにおいて、比率は80%:20%に変えられ、特定数のブロックの後、合成信号は完全にフェードアウトされ、さらに、トランジェントによって影響されない現在の検査信号は完全に再びフェードインされる。
その後、合成信号生成器12の一部の好適な実施態様は、図4を参照して論じられる。このために、検査信号のブロックを表している時間信号は、変換または分析フィルタバンクを含む変換器40によって、周波数ドメイン表現またはサブバンド表現に変換される。それから、スペクトル係数の形式のスペクトル表現またはサブバンド信号は、41で示されるように、これがトランジェントが検出される時間信号のブロックである場合に、外挿されたスペクトル表現および/または外挿されたサブバンド信号に関する情報で置換される。その後、スペクトル表現は、可能な外挿によるさらなる情報を用い、基礎をなす信号の時間的経過が平滑化されるように、スペクトル値に影響する平滑器42に供給される。フィルタバンクの場合には、この平滑器42は、サブバンド信号の基礎をなしている信号の時間的経過が平滑化の前より平滑であるように、サブバンド信号に影響を与える。それから、ブロック43において、時間ドメインへの逆変換が実行され、そこにおいて、逆変換または合成フィルタバンクは、ステージ40の入力の時間信号より平滑な経過を有するが平滑化によって大幅に影響されないエネルギー量を有する時間信号44に、最終的に到達するように用いられる。さらに、平滑化された時間信号44のエネルギーが前の時間信号のエネルギーから閾値よりも大きく異ならないように、平滑化が実行される。
このように、本発明において、時間信号のエネルギーの全体のエネルギー操作が行われる。しかしながら、トランジェントだけは減衰されるが、トーンの部分は、連続しおよび/または過去から非過度信号を用いて予測によって過渡期において信号を合成することによって履歴から合成される。
しかしながら、エネルギーが、ランダム化の場合またはスペクトル予測においてのように、触れられない場合、より平滑な時間的経過が生成されるように、平滑化がブロックにわたってより均一に分配されるエネルギーをもたらすが、検査信号のサンプルのブロックのエネルギーを大幅に変えることがない。これは、ほとんどの場合に充分で、ユーザーが連続条件を常に満たしている検査信号を聞くことを確実にする。トランジェントがエネルギーにおいて相当な増加をもたらす場合にだけ、平滑化だけすなわちブロックにわたるエネルギーのより均一な分配である全ブロックの考慮は、もはや充分ではなく、制御信号クリッピングが実行される。
後方のチャンネルにおいて直接音源の位置を特定することを回避する周知の方法は、数ミリ秒間、後方のチャンネルを遅延させている。この解決策は、トランジェントを抑制する結果をもたらさないが、先行音効果を用いることによってトランジェントを「マスク」しようとする。先行音効果は、耳が音源をこの音源から最初に何かを聞くところであると仮定することであり、そこにおいて、この音源から聞こえるものは、非常によくより大きくてもよいかまたは異なった方向から到来してもよい。しかしながら、この解決策は、急激なトランジェントを有する非常に短いサウンドイベントがまだしばしば聞き取れ、それで、前方のラウドスピーカーおよび数ミリ秒後に後方のチャンネルによって、2度知覚され、不快な聴覚印象を引き起こしてしまうという不利な点がある。
例えばドルビープロロジックIIまたはロジック7(Dolby Pro Logic IIまたはLogic 7)のように市販のマトリクスデコーダは、マルチチャンネルサラウンドファイルにおいて前処理されていない2チャンネルステレオファイルをアップミキシングする能力のタスクのために直接設計されていないにもかかわらず、その能力を有する。これらのマトリクスデコーダは、しばしば後方のチャンネルにおいて過渡トーンを抑制することができず、トランジェントがないことおよび振幅および/または強度の連続性に対する要求を満たさない信号をもたらす。
しかしながら、トランジェントがあるチャンネル領域は、本発明によって検出され減衰される。しかしながら、これらの期間で全ての信号を単に減衰することは、アンビエンス信号の振幅変調をもたらし、不快なものとしてまたはアーチファクトとしてさえ知覚される。このように、これは、抽出されまたは処理されるアンビエンス信号の高品質な感覚を妨げる。この不快な振幅変調の影響を克服するために、本発明によるトランジェント抑制が、合成信号および/またはアンビエンス信号の連続性を妨げることなくできる。ここで、後方のチャンネルのためのマトリクスアップミキサによって達成されるように例えばアップミックスされた信号のような入力信号が用いられ、または、同様の特性および同様の応用分野を有する信号がトランジェントがあるかどうかを検出するために分析される。
トランジェントが検出される場合、現在処理されるブロックは、フラットな(トランジェントのない)時間的エンベロープを有する置換信号で置換される。この置換信号は、トランジェントのない前の信号部分によって生成され、若しくは、信号の時間的エンベロープおよび/または微細構造をよりフラットにする処理ステップによって現在処理されるブロックによって生成され、または、両方法の組合せによって生成される。
前の部分によって生成される置換信号は、例えば、信号の前のエネルギーレベルの外挿によって、または、信号の過渡領域のない前の信号部分をコピー/リピートすることによって生成される。
現在処理されるブロックに基づいて時間的微細構造または微細時間信号の「フラット化(flattening)」は、例えば、図5a、図5bまたは図5cを参照して後に説明される方法で実行することができる。
スペクトル係数の絶対値は、図5cに関連して後で説明されるように、外挿されたスペクトル係数またはその大きさの周囲に広がる制限された領域内でランダム化することができる。
その代わりにまたは付加的に、トランジェントがある処理されるブロックのスペクトル係数のフェーズおよび/またはサインは、ランダマイザ50によってランダム化することができる。このために、考慮される検査信号のブロックの短期スペクトルが生成され、得られる複素スペクトル値が、スペクトル値のフェーズをランダム化するために大きさおよびフェーズに従って計算される。+/−180度のフェーズを分解できるだけである、すなわち、正および負のサインを有するスペクトル値を提供できるだけである変換が用いられる場合、サインは、対応する時間信号のよりフラットな時間的経過のランダム化されたフェーズ/サインを有する短期スペクトルを得るためにランダム化される。
このアプローチは、この過渡領域の基礎をなしている基本波およびそれぞれの高調波のフェーズが特別な比率にある場合に、時間信号において急変が可能であるという事実に基づく。フェーズのランダム化が達成される場合、スペクトル値によってマップされる個々のサイン発振のフェーズの特別な相互作用がもはやそこにないので、平滑化される過渡領域をもたらす。
その代わりの実施は、周波数にわたって短期スペクトルの予測を実行するように実装される予測器51を用いて図5bに示される。そのような予測器は、J.ヘレ(Herre)、J.Dジョンストン(Johnston)の「高周波数分解能を有する分析/合成フィルタバンクを用いるシステムにおいて時間および周波数構造の開発」、第103回AESコンベンション、1997年、ニューヨーク、プレプリント4519に、説明されている。
また、関連した時間信号において過渡経過を有する短期スペクトルが生成される。典型的に、開ループ予測器を用いて、短期スペクトルの現在のスペクトル値は、前のまたは複数の前のスペクトル値によって予測され、そこにおいて、予測されたスペクトル値は、スペクトル残量値を得るために、実際のスペクトル値から減算される。周波数にわたる典型的な予測のスペクトル残量値は、関心があって、予測フィルタの係数とともに情報をもたらす値を表す一方、特定の予測フィルタは、創造的にプリセットされ、さらに、短期スペクトルのスペクトル値は、この予測フィルタを用いて予測されるスペクトル値で置換されるが、予測エラー信号がもはや用いられない。
しかしながら、得られる実際の不完全な予測スペクトル値は、元の短期スペクトルよりフラットな時間的経過を有するが、図1の合成信号生成器12に関連して示されるように、過渡条件および連続条件の両方が満たされるように、ほぼ同じエネルギー量をまだ有する。予測フィルタの好適な簡素な実施は、現在のスペクトルラインのための予測値としてより低いインデックスを有するスペクトルラインの値を用いることである。
通常、外挿された信号は、長期外挿アーチファクトを回避するために急に切替える代わりに、特定された時間の後に元の信号でクロスフェードすることができる。
さらに、図6を参照して説明されるように、検出器60によってトーン部分/バンドを検出し、さらに合成信号生成器によってそれに影響を与えないが、ブロック61において行われる時間ドメインへの変換(transforming)または変換(converting)の後に、よりフラットな時間的経過を有するがトーンバンドすなわちトランジェントのない部分をまだ含む時間信号を変化していない形式で得るために、それをミキサ/コンバイナ61においてトランジェントバンドの合成信号と組み合わせることは好ましい。
このように、例えば、スペクトルの部分にだけのトランジェントの期間の間に存在する入力信号において静止/トーンの周波数成分が検出され、さらに、過去の静止/トーンの信号成分の外挿および現在のブロックにおいて検出される静止/トーンの周波数成分を含む置換信号が生成される。
その後、潜在的なおよびもはや明確でない過渡検出器を用いる本発明の実施が図5cを参照して説明される。ブロックおよび前のブロックの強度を計算するための手段53が図5cに示される。処理された信号ブロックの強度の尺度は、例えば、エネルギー若しくは高周波数成分(HFC)、または、スペクトル値、時間サンプル、エネルギー、電力若しくは振幅に関連する信号の他の尺度に基づく他の尺度である。そして、強度が1つのブロックから次まで閾値を超えて増加するかどうかが手段54で判定される。これが事実の場合、処理されるブロックのスペクトル値は制限され、それらの強度が前の信号ブロックの強度を特定の相対的なまたは絶対的な閾値よりも大きく超えず、少なくともトランジェントの全体の支配が低減される。この制限は、制限を求める要求が検出され、すなわちトランジェントを潜在的に検出する場合に、スペクトル値を個々にまたは全体的に制限するように実施される手段55において実行される。個々の制限は、最大エネルギー増加までだけ増加しカットオフを超える、スペクトル値またはバンドのためのエネルギーおよびスペクトル値および/またはエネルギーバンドの増加を計算することである。
このようにスペクトル値を制限するための手段55は、個々にまたは全体的にスペクトル値を制限し、そこにおいて、個々の制限は、閾値を超えて増加しているスペクトル値だけが制限され、好ましくはこの閾値に制限されるが、非常に大きく増加していない他のスペクトル値は影響されない。しかしながら、その代わりに、2つの強い増加が決定される場合、同じ絶対的なまたは相対的な尺度で全てのスペクトル値を制限することは、特定の場合においてより有利でおよび計算煩雑性に関してより容易である。
さらに、それは、後処理のための手段56によって制限されたスペクトル値の後処理を実行することは好ましく、この後処理は、図5aに記載されているようにランダム化でも、図5bに記載されているように予測でもよい。また、最初はトランジェントが検出されるブロックでランダム化および/または予測処理が実行されるように、手段55および56による処理の順序は、逆にされていてもよく、そこにおいて、ブロック55における処理に従って強度限定だけが実行される。
図5cに関して、ブロックt/fが時間/周波数ドメイン変換57を表すと指摘され、そこにおいて、時間から周波数ドメインへの変換は、この場合スペクトル表現がサブバンド信号からなるが個々のスペクトル成分からならないように、分析フィルタバンクによるフィルタリングでもよい。
その後、本発明の特に好適な実施形態は、図7を参照して論じられる。過渡検出器は、図1に11で示されているように、この実施形態において、長期HFCを計算するための手段72の下流のあらゆるブロックに対して高周波数成分(HFC)を計算するための手段71を含む。そして、コンパレータ73は、トランジェントがあるかどうかを、または、トランジェントがある過渡期があるかどうかを検出する。特に、手段71は、元の左信号および元の右信号のあらゆるブロックに対して重み付けられた高周波数成分(HFC)を計算するように実装される。その代わりに、HFCは、あらゆる単一のチャンネルに対して計算することができる。HFCは、より低い周波数からより高い周波数への重み付けファクタの増加とともに、ブロックにおいて全ての周波数ラインの絶対値の重み付け合計である。HFCは、以下の通りに計算され、
HFC = sum(x(f)・w(f))
そこにおいて、X(f)は、特定の周波数のためのスペクトル係数であり、w(f)は、特定の周波数のための重み付けファクタである。
重み付けファクタがより低い周波数からより高い周波数へ増加する事実のため、HFC値において、より高い周波数成分におけるエネルギーがより低い周波数成分におけるエネルギーと比較して重み付けられることが確実にされる。より高いスペクトル成分におけるエネルギーは、より低いスペクトル成分におけるエネルギーよりトランジェントのためのよりよいインデックスである。実施において、全てのスペクトル成分は、HFCを計算するために用いることができる。その代わりに、HFCの計算は、HFCを計算する場合により低いスペクトル係数が役割を果たさないように、スペクトルの中央領域において概ねある閾値から始まって実行されてもよい。
さらに、HFC´とも呼ばれる長期HFC平均値は、少なくとも3つおよび好ましくは5つの前のブロックにわたって計算される。現在のブロックにおけるHFCが長期平均値HFC´から一定ファクタcより大きいファクタだけそれることが手段73において判定される場合、1.0以上の数字が一定ファクタcとして用いられ、トランジェントが検出される。閾値は、浮動平均値のタイプに依存する。浮動平均値は、履歴がより現在のブロックと比較してより強く重み付けられる平均値でありすなわちより遅い平均値であり、閾値は、履歴がより少ない度合で浮動平均値をエンターする場合においてより1に近い。ここで、閾値は、1からより遠くにある。
トランジェントが、手段73によって平均値を計算するための手段74に信号で送られるように検出される場合、例えば5つのブロックのように、定義された時間間隔にわたってあらゆる周波数ライン(スペクトル係数)過去の絶対値の平均値が計算される。さらに、外挿された絶対値のための予測信頼性区間Δmaxが計算される。外挿された絶対値は、この区間Δmax内でランダムに変動する。これを達成するために、図7において手段75で示される方程式による計算が実行される。RNは乱数を表し、Δmaxは信頼性区間を表し、SWは計算するための手段75によって計算されるようにスペクトル値であり、さらに、SWmはブロック74によって計算されるようにいくつかの前のブロックの平均値として生じるスペクトル値である。このように、手段75は、以下の方程式を評価するために実装される:
SW = SWm +RN・Δmax
検出されたトランジェントが長すぎる場合に起こり得る反復影響を回避するために、一定の時間間隔が、例えば、元の信号が再び到達されなければならない現在存在する合成信号の3つのブロックを通過したときに、外挿された値は、元の値でクロスフェードされる。しかしながら、過渡期が3つのブロックより短い場合、クロスフェージングを実行しないことが好ましく、その理由は、外挿された信号がまだ元の信号からあまり遠くにドリフトしなかったと仮定することができるからである。クロスフェージングは、合成信号を得るために、図7において76で示されるように、時間ドメインへの変換前にまたは好ましくは時間ドメインへの変換後に行われる。
一実施において、本発明の概念は、アンビエンス信号の抽出プロセスに組み込まれてもよく、または、本発明の処理の前に不要なトランジェントをまだ含むが既存のアンビエンス信号を用いて別の後処理ステップとして用いられてもよい。
本発明の処理ステップは、周波数ラインごとに周波数ドメインにおいて、または、サブバンドにおいて実行されてもよい。しかしながら、それらは、特定の周波数限界を典型的に超える周波数ドメインにおいてまたは時間ドメインにおいてだけ、または、時間ドメインおよび周波数ドメインの組合せにおいて、部分的に実行されてもよい。
図8は、アンビエンス信号を生成するための装置が左アンビエンスチャンネルの出力80および右アンビエンスチャンネルの出力81のためのアンビエンス信号を生成するように実装されるだけでない本発明の好適な実施形態を示す。さらに、本発明の装置は、図8に示されるように、左チャンネルL、右チャンネルR、中央チャンネルCおよび好ましくはLFEチャンネルのための信号を生成のためのアップミキサ82を含む。過渡検出器12、合成生成器14および信号置換器16の組合せとアップミキサ82との両方には、デコーダ84によって供給される。デコーダ84は、出力側でモノラル信号またはステレオ信号86を提供するためにビットストリーム85を受信し処理するように実装される。ビットストリームは、MP3ビットストリームまたはMP3ファイルであってもよく、または、それはAACファイルであってもよくまたはパラメータ的に符号化されたマルチチャンネル信号の表現であってもよい。このように、ビットストリーム85は、例えば、左チャンネル、右チャンネルおよび中央チャンネルのパラメータ表現であってもよく、そこにおいて、送信チャンネルと第2および第3のチャンネルのためのいくつかの頭出しとが含まれ、この処理はBCCマルチチャンネル処理から知られている。そして、デコーダ84は、モノラルまたはステレオ信号を提供するだけでなく、2つのサラウンドチャンネルLs、Rsに関するデータを含まないが3チャンネル信号でさえも提供するBCCデコーダである。一実施では、検査信号は、この場合にモノラル信号、ステレオ信号、または、マルチチャンネル信号でさえもあるが、それはサラウンドチャンネルLs、Rsのための特別なラウドスピーカー信号を含まない。
同じアンビエンス信号が両方のサラウンドチャンネルのために計算することができるか、または、特別な信号があらゆるサラウンドチャンネルのために計算することができると指摘される。最初の場合において、検査信号および/またはサラウンド信号は、例えば、左右のチャンネルの合計から導き出される。他の場合において、左のサラウンドチャンネルのためのアンビエンス信号は、例えば、左チャンネルから計算され、右のチャンネルのためのアンビエンス信号は右チャンネルから計算される。
状況によっては、本発明の方法は、ハードウェアまたはソフトウェアで実施することができる。この実施は、その方法が実行されるように、プログラム可能なコンピュータシステムと協働する、電子的に読み取ることができる制御信号を有するデジタル記憶媒体上、特にディスクまたはCD上で実行することができる。そのため、本発明は、一般に、コンピュータプログラム製品がコンピュータ上で実行される場合に、本発明の方法を実行するための機械で読み取り可能なキャリアに記憶されたプログラムコードを有するコンピュータプログラム製品にある。換言すれば、本発明は、コンピュータプログラムがコンピュータ上で実行される場合に、その方法を実行するためのプログラムコードを有するコンピュータプログラムとして実現することもできる。
図1は、アンビエンス信号を生成するための本発明のブロック回路図である。 図2aは、非オーバーラップブロックを有するがクロスフェージング領域を有するブロック処理の概略図である。 図2bは、オーバーラップブロックを有する合成信号生成の概略図である。 図3は、図2aまたは図2bに用いられるフェードイン機能およびフェードアウト機能を有するクロスフェージングの特別な実施を示す。 図4は、周波数ドメインにおける処理を含む好適な実施のブロック回路図である。 図5aは、周波数ドメイン処理の代わりの実施を示す。 図5bは、他の代わりの周波数ドメイン処理を示す。 図5cは、強度に基づく処理の好適な実施を示す。 図6は、合成信号においてトーン領域を維持するための実施を示す。 図7は、高周波数成分HFCに基づく好適な実施形態のブロック回路図である。 図8は、直接サウンドチャンネルL、R、Cを生成するためのさらなる機能性を有する本発明の装置の好適な実施を示す。 図9は、ステレオ再生シナリオを示す。 図10は、全ての直接音源が前方のチャンネルによって再生されるマルチチャネル再生シナリオを示す。 図11は、音源が後方のチャンネルによっても再生されるマルチチャンネル再生シナリオを示す。

Claims (22)

  1. 適切なラウドスピーカー信号がないラウドスピーカー(Ls、Rs)を介して放たれるために適しているアンビエンス信号を生成するための装置であって、
    検査信号が過渡領域(22)を含む過渡期(20)を検出するための過渡検出器(11)、
    前記過渡期(20)に対して合成信号を生成するための合成信号生成器(12)であって、前記合成信号生成器(12)は、前記過渡期(20)において前記検査信号よりもフラットな時間的経過と前記検査信号の前または後の部分の強度から所定の閾値よりも小さくそれる強度とを含む合成信号を生成するように実装される、合成信号生成器、および
    前記アンビエンス信号を得るために前記過渡期において前記検査信号を前記合成信号で置換するための信号置換器(14)を含む、装置。
  2. オーバーラップまたは非オーバーラップのやり方において時間離散サンプルの後のブロックを処理するためにブロック処理するように実装される、請求項1に記載の装置。
  3. 前記過渡検出器(11)は、ブロックの強度値が前または後の強度値から所定の過渡閾値よりも大きく異なる場合に、後のブロックに対して強度値を計算しさらに過渡期(20)を検出するように実装される、請求項2に記載の装置。
  4. 前記合成信号生成器(12)は、前記過渡期(20)においてブロックに対して、それらの強度が前または後のブロックの前記強度またはトランジェントから前記所定の閾値よりも小さく異なるように前記ブロックの短期スペクトルを表す複数のスペクトル値を、制限するように実装される、請求項3に記載の装置。
  5. 前記合成信号生成器(12)は、それらのフェーズまたはサインに関して前記過渡期(20)を含む前記ブロックの短期スペクトルを表す複合スペクトル値をランダム化するように実装される、請求項3または請求項4に記載の装置。
  6. 前記合成信号生成器(12)は、予測スペクトルを得るために周波数にわたって予測処理(51)を実行するように実装され、その関連する時間信号は、前記周波数にわたる前記予測処理の前にスペクトルに関連付けられる時間信号よりもフラットな時間的経過を含む、請求項3または請求項4に記載の装置。
  7. 前記過渡検出器(11)は、前記検査信号のブロックに対して高周波数成分を計算する(61)ように実装され、
    前記過渡検出器(11)は、重み付けられた高周波数(HF)成分をトランジェントなしで複数の前または後のブロックにわたって浮動平均値と比較する(73)ように実施され、
    前記過渡検出器(11)は、現在のブロックの前記HF成分が前記浮動平均値を閾値(c)よりも大きく超える場合に、ブロックに対してトランジェントを検出するように実装される、先行する請求項のいずれかに記載の装置。
  8. 前記過渡検出器は、前記浮動平均値の計算のタイプに応じて選択され、履歴が前記浮動平均値により強い影響を与えるものにより近く、さらに履歴が前記浮動平均値に比較的により小さい影響を与えるものからより遠い閾値を用いるように実装される、請求項7に記載の装置。
  9. 前記合成信号生成器は、複数のブロックの短期スペクトルのスペクトル値ごとに対して、平均値スペクトルを得るために前記複数のブロックの対応するスペクトル値を用いて平均値を計算し、
    スペクトル値に対して、スペクトル値に対して異なり最大偏差(Δmax)よりも小さい偏差を計算し、さらに
    処理スペクトルを得るために前記偏差および前記平均値スペクトル値を加えるように実装される、請求項7または請求項8に記載の装置。
  10. 前記合成信号生成器(12)は、前記過渡期の前または後に前記検査信号の信号部分から、その時間的経過を平滑化の後に前記過渡期において前記検査信号から、または、平滑化の後に前記検査信号の前記信号部分および前記検査信号の組合せから、前記合成信号を計算するように実施される、先行する請求項のいずれかに記載の装置。
  11. 前記合成信号生成器(12)は、前記過渡期の前または後に前記検査信号の信号部分をコピーするように実装される、請求項10に記載の装置。
  12. 前記合成信号生成器(12)は、所定のドメインにおいて、前記過渡期の外側で前記検査信号から導き出される外挿されたスペクトル値をランダム化するように実装される、請求項10に記載の装置。
  13. 前記合成信号生成器(12)は、前記過渡期が所定の時間よりも長い期間を有する場合に、前記所定の期間よりも後の時間に対して、合成信号値を前記検査信号の信号値に混合するように実装される、先行する請求項のいずれかに記載の装置。
  14. 前記信号置換器(14)は、クロスフェード機能に従って前記過渡期の前の部分から前記過渡期にクロスフェードし、または、クロスフェード機能に従って前記過渡期から前記過渡期の後の部分にクロスフェードするように実装される、先行する請求項のいずれかに記載の装置。
  15. 前記合成信号生成器(12)は、スペクトル値を有する前記合成信号の短期スペクトルを計算し(40、41、42)、
    前記短期スペクトルを、前記合成信号(44)を表す時間的表現に変換する(43)ように実装される、先行する請求項のいずれかに記載の装置。
  16. 前記合成信号生成器(12)は、サブバンド信号を有する前記合成信号の短期スペクトルを計算し(40、41、42)、さらに
    サブバンド信号を有する前記短期スペクトルを、前記合成信号を表す(43)時間的表現に変換するように実装される、先行する請求項のいずれかに記載の装置。
  17. 前記合成信号生成器(12)は、前記所定の閾値が2のファクタより小さいかそれに等しいように、前記合成信号を生成するように実装される、先行する請求項のいずれかに記載の装置。
  18. 前記合成信号生成器(12)は、全てのスペクトルに対してバンド選択プリセット閾値または単一の閾値を用いるように実装される、先行する請求項のいずれかに記載の装置。
  19. 前記検査信号を抽出するために左チャンネル信号および右チャンネル信号を処理するための抽出手段をさらに含む、先行する請求項のいずれかに記載の装置。
  20. 送られるステレオまたはモノラル信号から左チャンネル、右チャンネルおよびの中央チャンネルを生成するための2対3ミキサー(82)をさらに含み、さらに
    前記合成信号生成器(12)は、後方左チャンネルおよび後方右チャンネルに対して同じアンビエンス信号を提供し、または、前記後方左チャンネルおよび前記後方右チャンネルが前記アンビエンス信号の異なった拡大縮小されたバージョンを受信することができるように前記検査信号を拡大縮小し、または、2つのサラウンドチャンネルに対して2つの特別なアンビエンス信号を計算するように実装される、先行する請求項のいずれかに記載の装置。
  21. 適切なラウドスピーカー信号がないラウドスピーカー(Ls、Rs)を介して放たれるために適しているアンビエンス信号を生成するための方法であって、
    検査信号が過渡領域(22)を含む過渡期(20)を検出するステップ(11)、
    前記過渡期(20)に合成信号を生成するステップ(12)であって、合成信号生成器(12)は、前記過渡期(20)において前記検査信号よりもフラットな時間的経過と前記検査信号の前または後の部分の強度から所定の閾値よりも小さくそれる強度とを含む合成信号を生成するように実装される、ステップ、および
    前記アンビエンス信号を得るために前記過渡期(20)において前記検査信号を前記合成信号で置換するステップ(14)を含む、方法。
  22. コンピュータ上で実行されるときに、請求項21に記載の方法を実行するためのコンピュータプログラム。
JP2009504579A 2006-04-12 2007-01-30 アンビエンス信号を生成するための装置および方法 Active JP4664431B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US74471806P 2006-04-12 2006-04-12
DE102006017280A DE102006017280A1 (de) 2006-04-12 2006-04-12 Vorrichtung und Verfahren zum Erzeugen eines Umgebungssignals
PCT/EP2007/000791 WO2007118533A1 (de) 2006-04-12 2007-01-30 Vorrichtung und verfahren zum erzeugen eines umgebungssignals

Publications (2)

Publication Number Publication Date
JP2009533910A true JP2009533910A (ja) 2009-09-17
JP4664431B2 JP4664431B2 (ja) 2011-04-06

Family

ID=38514551

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009504579A Active JP4664431B2 (ja) 2006-04-12 2007-01-30 アンビエンス信号を生成するための装置および方法

Country Status (11)

Country Link
US (2) US8577482B2 (ja)
EP (3) EP2402942B1 (ja)
JP (1) JP4664431B2 (ja)
CN (1) CN101421779B (ja)
CA (1) CA2643862C (ja)
DE (1) DE102006017280A1 (ja)
ES (1) ES2604133T3 (ja)
HK (1) HK1124951A1 (ja)
PL (1) PL2402943T3 (ja)
WO (1) WO2007118533A1 (ja)
ZA (1) ZA200809604B (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011514987A (ja) * 2008-03-10 2011-05-12 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 瞬間的事象を有する音声信号の操作装置および操作方法
JP2017513052A (ja) * 2014-03-14 2017-05-25 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 周波数領域で信号を処理する装置および方法

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE602006012370D1 (de) * 2005-12-13 2010-04-01 Nxp Bv Einrichtung und verfahren zum verarbeiten eines audio-datenstroms
GB2437337A (en) * 2006-04-21 2007-10-24 Snell & Wilcox Ltd Measuring block artefacts in video data using an auto-correlation function
US8379868B2 (en) * 2006-05-17 2013-02-19 Creative Technology Ltd Spatial audio coding based on universal spatial cues
US8204237B2 (en) * 2006-05-17 2012-06-19 Creative Technology Ltd Adaptive primary-ambient decomposition of audio signals
JP2007316254A (ja) * 2006-05-24 2007-12-06 Sony Corp オーディオ信号補間方法及びオーディオ信号補間装置
PL2186090T3 (pl) * 2007-08-27 2017-06-30 Telefonaktiebolaget Lm Ericsson (Publ) Detektor stanów przejściowych i sposób wspierający kodowanie sygnału audio
DE102007048973B4 (de) 2007-10-12 2010-11-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen eines Multikanalsignals mit einer Sprachsignalverarbeitung
KR101271972B1 (ko) * 2008-12-11 2013-06-10 프라운호퍼-게젤샤프트 추르 푀르데룽 데어 안제반텐 포르슝 에 파우 다채널 오디오 신호를 생성하기 위한 장치
EP2214165A3 (en) * 2009-01-30 2010-09-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and computer program for manipulating an audio signal comprising a transient event
CN102157151B (zh) * 2010-02-11 2012-10-03 华为技术有限公司 一种多声道信号编码方法、解码方法、装置和系统
JP5307770B2 (ja) * 2010-07-09 2013-10-02 シャープ株式会社 音声信号処理装置、方法、プログラム、及び記録媒体
US8489391B2 (en) * 2010-08-05 2013-07-16 Stmicroelectronics Asia Pacific Pte., Ltd. Scalable hybrid auto coder for transient detection in advanced audio coding with spectral band replication
ES2664968T3 (es) * 2013-02-05 2018-04-24 Telefonaktiebolaget Lm Ericsson (Publ) Encubrimiento de pérdida de trama de audio
US9820073B1 (en) 2017-05-10 2017-11-14 Tls Corp. Extracting a common signal from multiple audio signals
CN112731519B (zh) * 2019-10-28 2024-06-25 中国石油天然气集团有限公司 确定颤动时间区间的方法和装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0715800A (ja) * 1993-06-21 1995-01-17 Toshiba Corp サラウンド回路
WO2005024784A1 (en) * 2003-09-09 2005-03-17 Koninklijke Philips Electronics N.V. Encoding of transient audio signal components
JP2005533271A (ja) * 2002-07-16 2005-11-04 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオ符号化

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4076969A (en) * 1975-04-07 1978-02-28 Singer & Singer Impulse noise reduction system
US4819269A (en) * 1987-07-21 1989-04-04 Hughes Aircraft Company Extended imaging split mode loudspeaker system
US5610986A (en) * 1994-03-07 1997-03-11 Miles; Michael T. Linear-matrix audio-imaging system and image analyzer
US5886276A (en) 1997-01-16 1999-03-23 The Board Of Trustees Of The Leland Stanford Junior University System and method for multiresolution scalable audio signal encoding
US7231060B2 (en) * 1997-08-26 2007-06-12 Color Kinetics Incorporated Systems and methods of generating control signals
US6928169B1 (en) * 1998-12-24 2005-08-09 Bose Corporation Audio signal processing
WO2002007481A2 (en) * 2000-07-19 2002-01-24 Koninklijke Philips Electronics N.V. Multi-channel stereo converter for deriving a stereo surround and/or audio centre signal
SG108862A1 (en) 2002-07-24 2005-02-28 St Microelectronics Asia Method and system for parametric characterization of transient audio signals
US7949522B2 (en) * 2003-02-21 2011-05-24 Qnx Software Systems Co. System for suppressing rain noise
US7353169B1 (en) * 2003-06-24 2008-04-01 Creative Technology Ltd. Transient detection and modification in audio signals
US7970144B1 (en) * 2003-12-17 2011-06-28 Creative Technology Ltd Extracting and modifying a panned source for enhancement and upmix of audio signals
SE0400997D0 (sv) * 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Efficient coding of multi-channel audio
US7876909B2 (en) * 2004-07-13 2011-01-25 Waves Audio Ltd. Efficient filter for artificial ambience

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0715800A (ja) * 1993-06-21 1995-01-17 Toshiba Corp サラウンド回路
JP2005533271A (ja) * 2002-07-16 2005-11-04 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オーディオ符号化
WO2005024784A1 (en) * 2003-09-09 2005-03-17 Koninklijke Philips Electronics N.V. Encoding of transient audio signal components

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JPN7010003040, Michael Goodwin et al., "Enhancement of Audio Signals Using Transient Detection and Modification", Audio Engineering Society Convention Paper 6255, 20041028, US, AES *
JPN7010003041, Carlos Avendano et al., "Ambience Extracation and Synthesis from Stereo Signals for Multi−Channel Audio Up−Mix", IEEE International Conference on Acoustics, Speech and Signal Processing − Proceedings.(ICASSP), 20020513, Vol. 2, pp. II/1957−II/1960, US, IEEE *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011514987A (ja) * 2008-03-10 2011-05-12 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 瞬間的事象を有する音声信号の操作装置および操作方法
JP2017513052A (ja) * 2014-03-14 2017-05-25 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 周波数領域で信号を処理する装置および方法
US10187741B2 (en) 2014-03-14 2019-01-22 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Device and method for processing a signal in the frequency domain
US10257640B2 (en) 2014-03-14 2019-04-09 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Device and method for processing a signal in the frequency domain

Also Published As

Publication number Publication date
US20120195434A1 (en) 2012-08-02
EP2402943A2 (de) 2012-01-04
EP2402943B1 (de) 2016-08-24
EP2402942B1 (de) 2016-06-01
EP2402943A3 (de) 2012-06-20
PL2402943T3 (pl) 2017-02-28
CA2643862C (en) 2014-12-16
EP2005421A1 (de) 2008-12-24
EP2402942A3 (de) 2012-05-23
US20070242833A1 (en) 2007-10-18
US9326085B2 (en) 2016-04-26
WO2007118533A1 (de) 2007-10-25
CN101421779B (zh) 2013-04-17
DE102006017280A1 (de) 2007-10-18
EP2402942A2 (de) 2012-01-04
EP2005421B1 (de) 2013-06-26
ES2604133T3 (es) 2017-03-03
JP4664431B2 (ja) 2011-04-06
HK1124951A1 (en) 2009-07-24
ZA200809604B (en) 2010-03-31
CN101421779A (zh) 2009-04-29
CA2643862A1 (en) 2007-10-25
US8577482B2 (en) 2013-11-05

Similar Documents

Publication Publication Date Title
JP4664431B2 (ja) アンビエンス信号を生成するための装置および方法
AU2006233504B2 (en) Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing
JP5149968B2 (ja) スピーチ信号処理を含むマルチチャンネル信号を生成するための装置および方法
AU2007308413B2 (en) Apparatus and method for generating an ambient signal from an audio signal, apparatus and method for deriving a multi-channel audio signal from an audio signal and computer program
RU2376726C2 (ru) Устройство и способ для формирования закодированного стереосигнала аудиочасти или потока данных аудио
CA2583146C (en) Diffuse sound envelope shaping for binaural cue coding schemes and the like
KR100913987B1 (ko) 다중-채널 출력 신호를 발생시키기 위한 다중-채널합성장치 및 방법
TWI396188B (zh) 依聆聽事件之函數控制空間音訊編碼參數的技術
CA2582485C (en) Individual channel shaping for bcc schemes and the like
CN110890101B (zh) 用于基于语音增强元数据进行解码的方法和设备
JP2012234192A (ja) オーディオソースのパラメトリックジョイント符号化

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100928

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101130

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20101221

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110106

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 4664431

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140114

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250