JP2010541350A - 周囲信号を抽出するための重み付け係数を取得する装置および方法における周囲信号を抽出する装置および方法、並びに、コンピュータプログラム - Google Patents
周囲信号を抽出するための重み付け係数を取得する装置および方法における周囲信号を抽出する装置および方法、並びに、コンピュータプログラム Download PDFInfo
- Publication number
- JP2010541350A JP2010541350A JP2010526171A JP2010526171A JP2010541350A JP 2010541350 A JP2010541350 A JP 2010541350A JP 2010526171 A JP2010526171 A JP 2010526171A JP 2010526171 A JP2010526171 A JP 2010526171A JP 2010541350 A JP2010541350 A JP 2010541350A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- ambient
- gain value
- audio signal
- input audio
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R5/00—Stereophonic arrangements
- H04R5/04—Circuit arrangements, e.g. for selective connection of amplifier inputs/outputs to loudspeakers, for loudspeaker detection, or for adaptation of settings to personal preferences or hearing impairments
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Stereophonic System (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
Abstract
ゲイン値決定部は、入力オーディオ信号の1つ以上の特徴を記述する1つ以上の定量的特徴値を取得し、ゲイン値が定量的値に定量的に依存するように、ゲイン値を1つ以上の定量的特徴値の関数として提供するように構成され、重み付けられたサブバンド信号のなかの周囲成分が非周囲成分を超えて強調されるようにゲイン値を決定するように構成される。
【選択図】図1
Description
1.イントロダクション
マルチチャンネル録音資料は、消費者の家庭環境においても、ますます普及してきている。これは主に、DVDの映画が、5.1マルチチャンネルサウンドを提供し、それ故に、家庭のユーザでさえ、しばしばマルチチャンネルオーディオを再生するオーディオ再生システムを設置するという事実に起因している。
・利点1:最適な(中心の)リスニングポジションを離れた場所でさえも正面像の安定性が改善される。中心チャンネルによって「スイートスポット」は拡大される。用語「スイートスポット」は、最適なサウンドインプレッションが知覚されるリスニングポジションの領域を意味する。
・利点2:「包み込まれた状態」および開放感の増強された体験は、後方チャンネルスピーカによって構築される。
(1)アップミックス処理をガイドする付加情報を持つアップミックス
付加情報は、入力信号のなかに特定の方法で「符号化」するか、または、付加的に記憶させることもできる。このコンセプトは、「ガイドアップミックス」としばしば呼ばれる。
(2)それに対して、マルチチャンネル信号がオーディオ信号からいかなる付加情報もなしに排他的に取得される「ブラインドアップミックス」
「直接音源」は、オリジナルの2チャンネルバージョンと同じ位置で知覚される方法で、3つの正面チャンネルによって再生される。用語「直接音源」は、1つの分離した音源(例えば、楽器)から単独かつ直接にやってくる音を、いかなる付加的な音、例えば壁からの反射によるものをほとんど有さずまたは全く有さずに記述するために用いられる。
「イン・ザ・バンド」‐コンセプトに従うと、あらゆる音、または少なくともいくつかの音(周囲音ばかりでなく直接音も)は、リスナーのすべてのまわりに配置することができる。音の位置は、その特性(すなわち、それが直接音か周囲音であるかどうか)からは独立し、アルゴリズムとそのパラメータ設定の特定のデザインにのみ依存する。図25は、「イン・ザ・バンド」‐コンセプトの音像を例示している。
2.1 モノラル録音のアップミックス
2.1.1 疑似ステレオ処理
いわゆる「疑似ステレオ」信号を生成する大部分の技術は、信号適応ではない。これは、いかなるモノラル信号も、コンテンツが何であろうとも同様に処理することを意味する。それらのシステムは、出力信号を非相関化するための単純なフィルタ構造および/または時間遅延によって、例えば1つのチャンネルの入力信号の2つのコピーを一対の相補的櫛形フィルタによって処理することによってしばしば機能する[Sch57]。この種のシステムの包括的な概要は、[Fal05]に見いだすことができる。
著者は、同じ音源に帰属し、それ故に一緒にパンされるべき信号成分(例えばスペクトルの時間‐周波数ビン)を識別するアルゴリズムを提案する[LMT07]。音源形成アルゴリズムは、ストリーム分離の原理(ゲシュタルト原理から導き出される):時間の連続性と、周波数の高調波関係と、振幅類似性を考慮する。音源は、クラスタリング法(教師なし学習)を用いて識別される。導き出された「時間‐周波数‐クラスタ」は、(a)対象の周波数範囲に関する情報、(b)音色類似性、を用いて、より大きなサウンドストリームに更に分類される。著者は、フロントエンドとして、正弦波モデリングアルゴリズム(すなわち、信号の正弦波成分の識別)の使用を報告している。
入力信号の時間‐周波数分布(TFD)は、例えば、短期間フーリエ変換によって演算される。直接信号成分のTFDの推定は、非負マトリクス因数分解の数値最適化法によって導き出される。周囲信号のTFDの推定は、入力信号のTFDと、直接信号のTFDの推定との差分(すなわち、近似の残差)を演算することによって取得される。周囲信号の時間信号の再合成は、入力信号の位相スペクトログラムを用いて実行される。付加的な後処理は、導き出されたマルチチャンネル信号のリスニング体験を改善するために、オプションとして適用される[UWHH07]。
ステレオサウンドシステムを用いた再生のためのモノラル信号のパノラマ化の方法は、[VZA06]に解説されている。処理は、STFTと、左右のチャンネル信号の再合成に用いられる周波数ビンの重み付けと、逆STFTとを組み込む。時間変化する重み付け係数は、入力信号のスペクトログラムからサブバンドにおいて演算される低レベルの特徴から導き出される。
2.2.1 マトリクスデコーダ
パッシブマトリクスデコーダは、入力チャンネル信号の時間不変線形結合を用いてマルチチャンネル信号を演算する。
IrwanとAartsは、信号をステレオからマルチチャンネルに変換する方法を提供する[IA01]。サラウンドチャンネルの信号は、相互相関法(演算負荷を減らすために、相関係数の反復推定が提案されている)を用いて算出される。
著者は、IrwanとAartsによる方法と比較される改良型アルゴリズムを提案する。元々提案された方法は、各サブバンドに適用される[LD05]。著者は、優位な信号のW排反直交性を仮定する。周波数分解は、疑似直角位相ミラーフィルタバンクまたはウェーブレットベースのオクターブフィルタバンクを用いて行われる。IrwanとAartsによる方法に対する更なる拡張は、(最初の)主成分の反復演算のための適応ステップサイズを用いることである。
AvendanoとJotは、ステレオオーディオ信号において周囲情報を識別し、抽出する周波数ドメイン法を提案している[AJ02]。
著者は、信号の自動類別によって制御することができる1からnへのアップミックスの方法を記述する[MPA+05]。この論文は、いくつかの誤りを含んでおり、それ故に著者は、論文に解説されていることと異なる目標を目指したのかもしれない。
類別処理は、教師付き学習アプローチ:オーディオ信号から低レベル特徴が抽出され、識別子がオーディオ信号を音楽、音声、またはその他の音の3つのクラスの1つに類別するために適用される、を用いる。
・最適特徴(差分オペレーションの組成物としての)
・取得された低レベル特徴の最適組合せ
・一組の利用可能な識別子からの最良識別子
・選択された識別子のための最良パラメータ設定
アップミックスは、リバーブとイコライズとを用いてなされる。信号が音声を含む場合は、イコライズは使用可能であり、リバーブは使用不可である。それ以外の場合は、イコライズは使用不可であり、リバーブは使用可能である。後方チャンネルにおける話し言葉の抑制を目指したいかなる専用処理も組み込まれない。
著者は、マルチチャンネルサウンドトラックを組み立てることを目指しているが、中心チャンネルをミュートすることによって、検出された音声は減衰される。
マルチチャンネル信号は、リバーブ、イコライズ、「アップミックスツール」(これは、ステレオ信号から5.1信号を生成するものであって、ステレオ信号はリバーブの出力であって「アップミックスツール」への入力である)、を用いて生成される。音楽、音声、他の全ての音には、異なるプリセットが用いられる。リバーブとイコライズを制御することによって、音声を中心チャンネルに保持し、すべてのチャンネルに音楽と他の音を有するマルチチャンネルのサウンドトラックが組み立てられる。
Soulodreは、ステレオ信号からマルチチャンネル信号を構築するシステムを提供する[Sou04]。信号は、いわゆる「個別ソースストリーム」と「周囲ストリーム」に分解される。これらのストリームに基づき、いわゆる「審美エンジン」がマルチチャンネル出力を合成する。分解と合成のステップの更なる技術詳細は与えられていない。
2.3.1 マルチチャンネルサラウンドフォーマット変換および一般化アップミックス
著者は、中間モノラルダウンミックスを用いた空間オーディオ符号化に基づく方法を記述し、中間ダウンミックスを有さない改良方法を紹介する。改良方法は、パッシブマトリクスアップミックスと、空間オーディオ符号化により知られた法則を含む。改良は、中間オーディオの増大したデータレートの代償として得られる[GJ07a]。
著者は、主成分分析(PCA)を用いた入力信号の主要(直接)信号と周囲信号への分離を提案する[GJ07b]。
図1は、入力オーディオ信号から周囲信号を抽出する装置のブロック構成図を示す。図1に示される装置は、全体として100で表される。装置100は、入力オーディオ信号110を受信し、入力オーディオ信号に基づいて少なくとも1つの重み付けられたサブバンド信号を提供し、重み付けられたサブバンド信号のなかの周囲成分が非周囲成分を超えて強調されるように構成される。装置100は、ゲイン値決定部120を備える。ゲイン値決定部120は、入力オーディオ信号110を受信し、入力オーディオ信号110に従って一連の時間変化する周囲信号ゲイン値122(簡単にゲイン値とも表される)を提供するように構成される。ゲイン値決定部120は、重み付け部130を備える。重み付け部130は、入力オーディオ信号の時間‐周波数ドメイン表現またはその少なくとも1つのサブバンド信号を受信するように構成される。サブバンド信号は、入力オーディオ信号の1つの周波数バンドまたは1つの周波数サブバンドを記述することができる。重み付け部130は、サブバンド信号132に従って、かつ、一連の時間変化する周囲信号のゲイン値122にも従って、重み付けられたサブバンド信号112を提供するように更に構成される。
ここで、図2を参照して、図1に示された装置100のオプションの拡張について述べる。図2は、入力オーディオ信号から周囲信号を抽出する装置の詳細なブロック構成図を示す。図2に示される装置は、全体として200で表される。
以下に、定量的特徴値決定部250、252、254に関するさまざまな詳細が記載される。
以下に、例えば、重み付け結合部260によって実行される定量的特徴値の重み付けに関するいくつかの詳細が記載される。
以下に、本発明に係る他の実施形態が記載される。図3は、入力オーディオ信号から周囲信号を抽出する装置の詳細なブロック構成図を示す。図3に示される装置は、全体として300で表される。
以下に、図4を参照して、装置300の可能な拡張を述べる。しかしながら、図4を参照して記載されるコンセプトは、図3に示される構成と独立して用いることもできる。
以下に、図5を参照してゲイン値決定部に関する詳細が記載される。図5は、ゲイン値決定部の詳細なブロック構成図を示す。図5に示されるゲイン値決定部は、全体として500で表される。ゲイン値決定部500は、例えば、本願明細書に記載されたゲイン値決定部120、220、320、420の機能を引き継ぐことができる。
ゲイン値決定部500は、(オプションの)非線形前処理部510を備える。非線形前処理部510は、1つ以上の入力オーディオ信号の表現を受信するように構成することができる。例えば、非線形前処理部510は、入力オーディオ信号の時間‐周波数ドメイン表現を受信するように構成することができる。しかしながら、いくつかの実施形態では、非線形前処理部510は、代わりにまたは加えて、入力オーディオ信号の時間ドメイン表現を受信するように構成することができる。いくつかの更なる実施形態では、非線形前処理部は、入力オーディオ信号の第1チャンネルの表現(例えば時間ドメイン表現または時間‐周波数ドメイン表現)と、入力オーディオ信号の第2チャンネルの表現とを受信するように構成することができる。非線形前処理部は、入力オーディオ信号の1つ以上のチャンネルの前処理された表現または前処理された表現の一部(例えば、スペクトル部分)を、少なくとも第1の定量的特徴値決定部520に対して提供するように更に構成することができる。さらに、非線形前処理部は、入力オーディオ信号(またはその部分)の他の前処理された表現を、第2の定量的特徴値決定部522に対して提供するように構成することができる。第1の定量的特徴値決定部520に対して提供される入力オーディオ信号の表現は、第2の定量的特徴値決定部522に対して提供される入力オーディオ信号の表現と同一でもよく、異なっていてもよい。
ゲイン値決定部500は、第1の定量的特徴値決定部520から第1の特徴値(または一連の第1の特徴値)を受信するように構成された第1の特徴値後処理部530を備える。さらに、第2の特徴値後処理部532は、第2の定量的特徴値決定部522から第2の定量的特徴値(または一連の第2の定量的特徴値)を受信するために、第2の定量的特徴値決定部522に連結することができる。第1の特徴値後処理部530と第2の特徴値後処理部532は、例えば、後処理されたそれぞれの定量的特徴値を提供するように構成することができる。
ゲイン値決定部500は、重み付け結合部540を更に備える。重み付け結合部540は、特徴値後処理部530、532から後処理された特徴値を受信し、それに基づいてゲイン値560(または一連のゲイン値)を提供するように構成される。ゲイン値560は、ゲイン値122、ゲイン値222、ゲイン値322、またはゲイン値422と等価でもよい。
以下において、入力オーディオ信号からの周囲信号と正面信号(「直接信号」とも称される)の両方の効率的な抽出に関して、いくつかの詳細が記載される。この目的のため、図6は、本発明に係る実施形態による重み付け部または重み付けユニットのブロック構成図を示す。図6に示される重み付け部または重み付けユニットは、全体として600で表される。
ここで、図7を参照して、例えば1つ以上の重み付けられたサブバンド信号112、212a〜212b、414に適用することができる後処理が記載される。
・選択減衰部730
・非線形圧縮部732
・遅延部734
・音色呈色補償部736
・過渡状態低減部738
・信号非相関化部740
さらに、周波数ドメイン後処理部816は、後処理部700の機能の1つ以上を実行するように構成することができる。周波数ドメイン後処理部860は、1つ以上の後処理された重み付けられたサブバンド信号864を提供するように構成することができる。周波数ドメイン後処理部860は、重み付けられたサブバンド信号862の1つ以上を個別に処理するように構成することができる。あるいは、周波数ドメイン後処理部860は、複数の重み付けられたサブバンド信号862を一緒に後処理するように構成することができる。回路部850は、複数の後処理された重み付けられたサブバンド信号864を受信し、それに基づいて後処理された時間ドメイン周囲信号872を提供するように構成された合成フィルタバンク870を更に備える。
図9は、特徴値を取得するための異なるコンセプトの図解表現を示す。図9の図解表現は、全体として900で表される。
以下に、他の実施形態による周囲抽出部が、図10、11、12を参照して記載される。
図10は、アップミックス処理のブロック図を示す。例えば、図10は、周囲信号抽出部のブロック構成図と解釈することができる。あるいは、図10は、入力オーディオ信号から周囲信号を抽出する方法のフローチャートと解釈することができる。
以下に、周囲抽出に関する詳細が、図11を参照して記載される。図11は、周囲信号の抽出と正面信号の抽出のための処理のブロック図を示す。図11に示されるブロック図は、周囲信号を抽出する装置のブロック構成図、または、周囲信号を抽出する方法のフローチャート表現とみなすことができる。
以下に、ゲイン演算処理が、図12の参照をして記載される。図12は、低レベル特徴抽出を用いた周囲信号抽出処理と正面信号抽出処理の、1つのサブバンドのためのゲイン演算処理のブロック図を示す。異なる低レベル特徴(例えば、LLF1からLLFnで表される)は、入力信号xから演算される。ゲイン係数(例えばgで表される)は、低レベル特徴の関数として、(例えば結合部を用いて)演算される。
以下に、複数の特徴を重み付けする重み付け係数を取得し、特徴値の重み付けられた結合としてゲイン値を取得するコンセプトが、記載されている。
図13は、重み付け係数を取得する装置のブロック構成図を示す。図13に示される装置は、全体として1300で表される。
図14は、本発明に係る実施形態による重み付け係数決定部のブロック構成図を示す。
以下に、重み付け係数決定部1330を実現するいくつかの特定の可能性が記載される。
図15bは、重み付け係数決定部の他の実現方法のブロック構成図を示す。図15bに示される重み付け決定部は、全体として1550で表される。
ここで、l=1,…,L
ここで、( )は、予測ゲイン値と重み付け特徴値ml,iによって取得されたゲイン値との差分ベクトルを示す。差分ベクトルのエントリーは、指標l=1…Lで表される異なる時間‐周波数ビンに関係づけることができる。|| ||は、数学的距離尺度、例えば数学的なベクトルノルムを示す。
図16は、本発明に係る実施形態による他の重み付け係数決定部のブロック構成図を示す。図16に示される重み付け係数決定部は、全体として1600で表される。
図17は、本発明に係る実施形態による重み付け係数を決定する装置のブロック構成図を示す。図17に示される装置は、図13に示された装置と類似する。したがって、同一の手段および信号は、同一の参照番号で表される。
以下に、係数決定信号1314を提供する異なるコンセプトが記載される。図18a、18b、19、20を参照して記載されるコンセプトは、信号の時間ドメイン表現と時間‐周波数ドメイン表現の両方に適用可能である。
図18bは、本発明に係る他の実施形態による係数決定信号生成部のブロック構成図を示す。図18bに示される係数決定信号生成部は、全体として1850で表される。
ここで、図19、20を参照して、予測ゲイン値情報を決定する他のアプローチについて述べる。図19は、本発明に係る実施形態による係数決定信号生成部のブロック構成図を示す。図19に示される係数決定信号生成部は、全体として1900で表される。
類似のコンセプトは、図20を参照して引き続いて記載される。図20は、本発明に係る実施形態による係数決定信号生成部のブロック構成図を示す。図20に示される係数決定信号生成部は、全体として2000で表される。
図21は、入力オーディオ信号を複数の周波数バンドを記述する複数のサブバンド信号に関して表した入力オーディオ信号の時間‐周波数ドメイン表現に基づいて、周囲信号を抽出する方法のフローチャートを示す。図21に示される方法は、全体として2100で表される。
図22は、入力オーディオ信号から周囲信号を抽出するゲイン値決定部をパラメータ化するための重み付け係数を取得する方法のフローチャートを示す。図22に示される方法は、全体として2200で表される。
発明の方法は、発明の方法の特定の実現方法の要求に応じて、ハードウェアまたはソフトウェアで実現することができる。実現方法は、電気的に読み取り可能な制御信号を有し、発明の方法が実行されるようにプログラム可能なコンピュータシステムと協働するデジタル記憶媒体、例えばフレキシブルディスク、DVD、CD、ROM、PROM、EPROM、EEPROMまたはフラッシュメモリーを用いて実行することができる。一般に、本発明は、それ故に、機械読み取り可能なキャリアに記憶されたプログラムコードであって、コンピュータプログラム製品がコンピュータ上で動作するときに発明の方法を実行するために作動可能であるプログラムコードを有するコンピュータプログラム製品である。言い換えれば、発明の方法は、それ故に、コンピュータプログラムがコンピュータ上で動作するときに発明の方法を実行するためのプログラムコードを有するコンピュータプログラムである。
3.1 問題の記載
実施形態による方法は、オーディオ信号のブラインドアップミックスに適した正面信号と周囲信号の抽出を目的とする。マルチチャンネルサラウンドサウンド信号は、正面チャンネルに正面信号を供給し、後方チャンネルに周囲信号を供給することによって、得ることができる。
(1)NMFを用いる方法(2.1.3を参照)
(2)左右の入力信号の相関に依存する時間‐周波数マスクを用いる方法(2.2.4を参照)
(3)PCAとマルチチャンネル入力信号を用いる方法(2.3.2を参照)
・低い複雑さ
・低い遅延
・ステレオ入力信号と同様に、モノラルおよびほとんどモノラルの入力信号に対して動作する
マルチチャンネルサラウンド信号(例えば、5.1または7.1フォーマット)は、入力信号から周囲信号と正面信号を抽出することによって取得される。周囲信号は、後方チャンネルに供給される。中心チャンネルは、スイートスポットを拡大するために用いられ、正面信号またはオリジナルの入力信号を再生する。他の正面チャンネルは、正面信号またはオリジナルの入力信号を再生する(すなわち、左側正面チャンネルは、オリジナルの左側正面信号またはオリジナルの左側正面信号の処理されたバージョンを再生する)。図10は、アップミックス処理のブロック図を示す。
・周囲音は直接音と比較してむしろ静かな音である
・周囲音は直接音より音色が少ない
・エネルギー特徴は信号成分の静かさを測定する
・音調特徴は信号成分のやかましさを測定する
ここで、Kは、特徴と、異なる特徴の重み付けに用いられたパラメータαi,βiの数である。
以下の章は、周囲らしい信号の品質を特徴づけることに適した特徴について記載する。一般に、特徴は、オーディオ信号(広帯域)または特定の周波数部分(すなわち、サブバンド)またはオーディオ信号のサブバンドのグループを特徴づける。サブバンドの特徴の演算は、フィルタバンクまたは時間‐周波数変換の使用を必要とする。
ここで使用された用語の「音調」は、「ノイズ対サウンドの音質を識別する特徴」を記述する。
以下の音調測定は、米国特許5,918,203[HEG+99]に記載されている。
上述した音調尺度は、入力信号のスペクトルを使用し、スペクトルの非平面性から音調の尺度を導き出す。音調尺度(それから、特徴値を導き出すことができる)は、そのスペクトルの代わりに入力時間信号の周期関数を用いて演算することもできる。周期関数は、信号とその遅延されたコピーの比較から導き出される。
以前の係数ビンXi-1とXi-2からの複素スペクトル係数Xiの予測を用いた音調推定は、ISO/IEC11172‐3 MPEG‐1音響心理学モデル2(レイヤー3が推奨される)に記載されている。
P(ω,τ)=X(ω,τ)−2X(ω,τ−1)+X(ω、τ―2) (15)
信号x[k](時間指標k)は、以前のサンプルから線形予測を用いて予測することができるが、予測誤差は、周期信号に対して小さく、ランダム信号に対して大きい。その結果として、予測誤差は信号の音調に反比例する。
エネルギー特徴は、サブバンド内の瞬時エネルギーを測る。特定の周波数バンドの周囲抽出のための重み付け係数は、周波数バンドのエネルギーコンテンツが高い、すなわち、特定の時間‐周波数タイルが直接信号成分に非常に近くなりそうなときに、低くなる。
M(ω,τ)=max([X(ω,τ−k) X(ω,τ+k)]) (16)
以下に、上述した特徴セットのオプションの拡張が記載される。
2つの信号は、それらができる限り異なるスケーリングと遅延によって等しい、すなわち位相差が一定である場合に、整合している。
2つの信号は、それらができる限り異なるスケーリングによって等しい場合に、相関している。
ここで、λは「忘却係数」である。この演算は、以下において「移動平均推定(MAE)」、fmae(z)と称される。
チャンネル間のレベル差(ICLD)に基づく特徴は、ステレオ画像(パノラマ)内の顕著な音源の位置を決定するために用いられる。ソースs[k]は、s[k]の振幅を以下のx1[k]とx2[k]において重み付けするために、パニング係数αを適用することによって特定の方向に振幅パンされる。
X1[k]=(1−α)s[k] (24)
X2[k]=αs[k] (25)
特徴グループ化は、特徴の更なる処理の演算負荷を低減し、および/または、特徴の時間経過を評価するという要求によって動機づけされる。
・分散または標準偏差
・フィルタリング(例えば、一次または高次の差分、重み付けられた平均値、または他の低域フィルタリング)
・フーリエ変換係数
以下において、オーディオ信号x[n]は、直接信号成分d[n]と周囲信号成分a[n]が加算的に含まれたたものと仮定する。
x[n]=d[n]+a[n] (29)
トレーニングの主要な論点は、レファレンス値RAD(m,k)の適切な選択である。我々は、次の2つのオプション(最初のオプションが好ましいが)を提案する。
(1)直射信号と周囲信号が別々に利用可能である信号から測定されたレファレンス値を用いる方法
(2)モノラル信号の処理からの基準値として、ステレオ信号から演算された相関ベースの特徴を用いる方法
このオプションは、支配的な直接信号成分と無視できる周囲信号成分(x[n]≒d[n])、例えば乾燥した環境で録音された信号、を有するオーディオ信号を必要とする。
ステレオ録音の左右のチャンネル間の相関に基づく特徴は、周囲抽出処理のための強力なキューを交付する。しかしながら、モノラル信号を処理するとき、これらのキューは利用可能でない。提案されたアプローチは、モノラル信号を処理することができる。
以下の章は、周囲信号の知覚品質の強化のための適当な後処理方法を記載する。
導き出された周囲信号(例えば、重み付けされたサブバンド信号によって表された)は、周囲成分のみならず、信号成分をも含む(すなわち、周囲信号と直接信号の分離は完全でない)。周囲信号は、その周囲と直接の比率、すなわち、周囲成分の量の直接成分に対する比率を強化するために後処理される。適用される後処理は、周囲音は直接音と比較してむしろ静かであるという知見によって動機づけされる。静かな音を保存しながら大きい音を減衰する簡単な方法は、非線形圧縮曲線をスペクトログラムの係数(例えば、重み付けられたサブバンド信号)に適用することである。
正面画像の安定性を改善するために、周囲信号に対して(例えば、正面信号または直接信号と比較して)、数ミリ秒(例えば14ms)の遅延が導入される。これは、2つの同一の音が、1つの音Aの開始が他の音Bの開始に関連して遅延され、両方が(リスナーに対して)異なる方向において提供されるように、提供された場合に発生する先行効果の結果である。遅延が適当な範囲内にある限り、音は、音Bが提供される方向からやってくると知覚される[LCYG99]。
サラウンドサウンド信号の音色呈色を最小化するために、周囲信号(例えば、重み付けられたサブバンド信号に関して表された)は、その長期間パワースペクトル密度(PSD)を入力信号に適応させるために、イコライズされる。これは、2段階の処理で実行される。
後方チャンネル信号への遅延の導入(7.2章を参照)は、過渡信号成分が存在する場合[WNR73]と、時間遅延が信号依存値(エコー閾値[LCYG99])を超える場合に、2つの分離した信号の知覚を呼び起こす。このエコーは、サラウンドサウンド信号または周囲信号の過渡信号成分を抑制することによって減衰することができる。付加的な正面画像の安定化は、後方チャンネルに位置決め可能な点源の出現が著しく低減されるので、過渡状態の抑制によって達成される。
左右の耳に到達する2つの信号間の相関は、音源と周囲の印象の知覚幅に影響を及ぼす。印象の開放感を改善するために、正面チャンネル信号間および/または後方チャンネル信号間(例えば、抽出された周囲信号に基づく2つの後方チャンネル信号間)のチャンネル間相関は減少される。
2つの非相関信号は、1つのチャンネルの入力信号の2つのコピーを一対の相補的櫛フィルタにより処理することによって取得される[Sch57]。
2つの非相関信号は、1つのチャンネルの入力信号の2つのコピーを一対の異なるオールパスフィルタにより処理することによって取得される。
2つの非相関信号は、1つのチャンネルの入力信号の2つのコピーを平坦な伝達関数を有する(すなわち、インパルス応答が白色スペクトルを有する)2つの異なるフィルタによってフィルタリングすることによって取得される。
hk=rk(b−ak) (19)
2つの非相関信号は、1つの入力チャンネル信号の2つのコピーをASPにより処理することによって取得される[VZA06](2.1.4章を参照)。後方チャンネル信号と正面チャンネル信号の非相関化のためのASPのアプリケーションは、[UWI07]に記載されている。
2つの非相関信号は、1つの入力チャンネル信号の2つのコピーをサブバンドに分解し(例えば、STFTのフィルタバンクを用いて)、サブバンド信号に対する異なる時間遅延を導入し、そして処理されたサブバンド信号から時間信号を再合成することによって取得される。
1からnへのアップミックスのための前の方法と比較して、本発明に係るいくつかの方法は、低い演算の複雑さである。
2からnへのアップミックスのための前の方法と比較して、本発明に係るいくつかの方法は、両方の入力チャンネル信号が同一(モノラル)であるかまたはほとんど同一であっても、うまく実行する。
発明に係るいくつかの方法は、入力チャンネルの数に依存せず、それ故に、入力チャンネルのいかなる構成にもよく適合する。本発明に係るいくつかの方法は、リスニングテストにおいて結果として生じるサラウンドサウンド信号を聞くときに、多くのリスナーにとって好ましい。
ASP: 適応スペクトルパノラマ化
NMF: 非負マトリクス因数分解
PCA: 主成分分析
PSD: パワースペクトル密度
STFT:短期間フーリエ変換
TFD: 時間‐周波数分布
[AJ02]Carlos Avendano,Jean-Marc Jot、マルチチャンネルオーディオアップミックスのためのステレオ信号からの周囲信号の抽出と合成、ICASSP議事録、2002
[AJ04]Carlos Avendano,Jean-Marc Jot、マルチチャンネルアップミックスの周波数ドメインアプローチ、英国オーディオ学会誌、52、2004
[dCK03]Alain de Cheveigne,Hideki Kawahara、 陰、話し言葉および音楽の基本周波数推定器、アメリカ音響学会誌、111(4)、1917‐1930、2003
[Dre00]R. Dressler、ドルビーサラウンドプロ・ロジック2デコーダ:解説書、ドルビー研究所報告、2000
[DT]DTS、DTS NEo:6マルチチャンネル、http://www.dts.com/media/uploads/pdfs/DTS%20Neo6%20Overview.pdf
[Fal05]C. Faller、再訪された疑似立体音響、第118回AES大会議事録、2005
[GJ07a]M. Goodwin,Jean-Marc Jot、マルチチャンネルサラウンドフォーマット変換および一般化されたアップミックス、第30回AES会議議事録、2007
[GJ07b]M. Goodwin,Jean-Marc Jot、空間オーディオf符号化と強調のための主要周囲信号の分解とベクトルベースの位置決め、ICASSP会報、2007
[HEG+99]J. Herre,E. Eberlein,B. Grill,K. Brandenburg,H. Gerhauser、米国特許5918203、1999
[IA01]R. Irwan,R. M. Aarts、ステレオからマルチチャンネルサウンドに変換する方法、第19回AES会議議事録、2001
[ISO93]ISO/MPEG,ISO/IEC11172‐3MPEG‐1、国際規格、1993
[Kar]Harman Kardon、ロジック7の解説、技術報告
[LCYG99]R. Y. Litovsky,H. S. Colburn,W. A. Yost,S. J. Guzman、先行音効果、JAES、1999
[LD05]Y. Li,P.F. Driessen、2から5チャンネルへのアップミックスの教師なし適応フィルタリングアプローチ、第119回AES大会議事録、2005
[LMT07]M. Lagrange,L.G. Martins,G. Tzanetakis、音源フォーメーションを用いたモノラルからステレオへの半自動アップミックス、第122回AES大会議事録、2007
[MPA+05]J. Monceaux,F. Pachet,F. Armadu,P. Roy,A. Zils、記述子ベースの空間化、第118回AES大会議事録、2005
[Sch04]G. Schmidt、液圧機関スペクトル重み付けに基づくrocessing スペクトル重み付けによる単一チャンネルノイズの抑圧、Eurasip会報、2004
[Sch57]M. Schroeder、単一信号を用いて得られた人工立体音響の効果、JAES、1957
[Sou04]G. Soulodre、周囲ベースのアップミックス、第117回AES大会のワークショップ、2004
[UWHH07]C. Uhle,A. Walther,O. Hellmuth,J. Herre、非負マトリクス因数分解を用いたモノラル録音からの周囲分離、第30回AES会議議事録、2007
[UWI07]C. Uhle,A. Walther,M. Ivertowski、1からnへのブラインドアップミックス、Audio Mostly、2007
[VZA06]V. Verfaille,U. Zolzer,D. Arfib、適応ディジタルオーディオ効果(A‐DAFx):サウンド変換の新分類、IEEEオーディオ・スピーチ・言語処理の会報、2006
[WNR73]H. Wallach,E.B. Newman,M.R. Rosenzweig、音響位置決めにおける優先効果、英国オーディオ学会誌、21、817‐826、1973
[WUD07]A. Walther,C. Uhle,S. Disch、マルチチャンネルアップミックスアルゴリズムにおける一時的抑制の使用、第122回AES大会議事録、2007
本発明に係る実施形態は、入力音声信号(110)を、複数の周波数バンドを記述する複数のサブバンド信号(132)に関して表した入力音声信号の時間-周波数ドメイン表現に基づいて周囲信号(112)を抽出する装置(100)を備える。装置は、入力オーディオ信号(110)に従って、入力オーディオ信号の時間-周波数ドメイン表現の所定の周波数バンドに対する一連の時間変化する周囲信号のゲイン値(122)を決定するように構成されたゲイン値決定部(112)を備える。装置は、また、時間‐周波数ドメイン表現の所定の周波数バンドを表したサブバンド信号(132)の1つを時間変化する周囲信号のゲイン値(122)によって重み付けし、重み付けられたサブバンド信号(112)を取得するように構成された重み付け部(130)を備える。ゲイン値決定部(120)は、入力オーディオ信号(110)の1つ以上の特徴または特性を記述する1つ以上の定量的特徴値を取得し、ゲイン値が定量的特徴値に定量的に依存するように、ゲイン値(122)を1つ以上の定量的特徴値の関数として提供し、入力オーディオ信号から周囲成分の微調整された抽出を可能とするように構成される。ゲイン値決定部(120)は、また、重み付けられたサブバンド信号(112)のなかの周囲成分が非周囲成分を超えて強調されるようにゲイン値を提供するように構成される。さらに、ゲイン値決定部(120)は、入力オーディオ信号の複数の異なる特徴または特性を記述する複数の異なる定量的特徴値を取得し、ゲイン値が定量的特徴値に定量的に依存するように、異なる定量的特徴値を結合し、一連の時間変化するゲイン値(122)を取得するように構成される。ゲイン値決定部は、また、異なる特徴値を、重み付け係数によって異なって重み付けするように構成される。さらにまた、ゲイン値決定部は、少なくとも、入力オーディオ信号の音調を記述する音調特徴値と、入力オーディオ信号のサブバンド内のエネルギーを記述するエネルギー特徴値とを結合し、ゲイン値を取得するように構成される。
装置100の一実施形態において、ゲイン値決定部は、所定の周波数バンドを表したサブバンド信号の周囲らしさを記述する少なくとも1つの定量的特徴値を取得するように構成される。
装置100の一実施形態において、ゲイン値決定部は、異なる定量的特徴値を非線形方法でスケーリングするように構成される。
装置100の一実施形態において、ゲイン値決定部は、単一のオーディオ信号チャンネルの特徴を記述する少なくとも1つの定量的単一チャンネル特徴値を取得し、単一チャンネル特徴値を用いてゲイン値を提供するように構成される。
装置100の一実施形態において、ゲイン値決定部は、単一のオーディオチャンネルに基づいてゲイン値を提供するように構成される。
装置100の一実施形態において、ゲイン値決定部は、入力オーディオ信号を複数の周波数バンドを含む周波数範囲にわたって記述するマルチバンド特徴値を取得するように構成される。
装置100の一実施形態において、ゲイン値決定部は、入力オーディオ信号を単一の周波数バンドを含む周波数範囲で記述する狭帯域特徴値を取得するように構成される。
装置100の一実施形態において、ゲイン値決定部は、入力オーディオ信号を時間‐周波数ドメイン表現の周波数バンドの全部を含む周波数範囲にわたって記述する広帯域特徴値を取得するように構成される。
装置100の一実施形態において、ゲイン値決定部は、異なるバンド幅を有する入力オーディオ信号の部分を記述する異なる特徴値を結合し、ゲイン値を取得するように構成される。
装置100の一実施形態において、ゲイン値決定部は、入力オーディオ信号の時間‐周波数ドメイン表現を非線形方法で前処理し、前処理された時間‐周波数ドメイン表現に基づいて定量的特徴値を取得するように構成される。
装置100の一実施形態において、ゲイン値決定部は、取得された特徴値を非線形方法で後処理し、特徴値の値の範囲を制限し、後処理された特徴値を取得するように構成される。
装置100の一実施形態において、ゲイン値決定部は、入力オーディオ信号の音調を記述する定量的特徴値を取得し、ゲイン値を決定するように構成される。
装置100の一実施形態において、ゲイン値決定部は、入力オーディオ信号の2つ以上のチャンネル間の関連性を記述する1つ以上の定量的チャンネル関連値を取得するように構成される。
装置100の一実施形態において、1つ以上の定量的チャンネル関連値のうちの1つは、入力オーディオ信号の2つのチャンネル間の相関性または整合性を記述する。
装置100の一実施形態において、1つ以上の定量的チャンネル関連値のうちの1つは、チャンネル間の短時間整合性を記述する。
装置100の一実施形態において、1つ以上の定量的チャンネル関連値のうちの1つは、入力オーディオ信号の2つ以上のチャンネルに基づいて音源の位置を記述する。
装置100の一実施形態において、1つ以上の定量的チャンネル関連値のうちの1つは、入力オーディオ信号の2つ以上のチャンネルの間のチャンネル間レベル差を記述する。
装置100の一実施形態において、ゲイン値決定部は、1つ以上の定量的チャンネル関連値のうちの1つとして、パニング指標を取得するように構成される。
装置100の一実施形態において、ゲイン値決定部は、所定の時間‐周波数ビンのスペクトル値差分とスペクトル値総計の間の比率を決定し、所定の時間‐周波数ビンのパニング指標を取得するように構成される。
装置100の一実施形態において、ゲイン値決定部は、入力オーディオ信号のスペクトルまたは入力オーディオ信号のスペクトルの一部のスペクトル重心を記述するスペクトル重心特徴値を取得するように構成される。
装置100の一実施形態において、ゲイン値決定部は、時間‐周波数ドメイン表現によって表された複数のサブバンド信号に従って、サブバンド信号の所定の1つを重み付けするためのゲイン値を提供するように構成される。
装置100の一実施形態において、重み付け部は、サブバンドのグループを共通の一連の時間変化するゲイン値によって重み付けするように構成される。
装置100の一実施形態において、装置は、重み付けられたサブバンド信号またはそれに基づく信号を後処理し、周囲‐直接比率を強化し、周囲‐直接比率が強化された後処理された信号を取得するように構成された信号後処理部を更に備える。信号後処理部は、重み付けられたサブバンド信号またはそれに基づく信号のなかの大きな音を静かな音を保存しながら減衰させ、後処理された信号を取得するように構成されるか、または、信号後処理部は、重み付けられたサブバンド信号またはそれに基づく信号に対して非線形圧縮を適用するように構成される。
装置100の一実施形態において、装置は、重み付けられたサブバンド信号またはそれに基づく信号を後処理し、後処理された信号を取得するように構成された信号後処理部を更に備え、信号後処理部は、重み付けられたサブバンド信号またはそれに基づく信号を2ミリ秒から70ミリ秒の範囲で遅延させ、重み付けられたサブバンド信号に基づいて正面信号と周囲信号の間の遅延を取得するように構成される。
装置100の一実施形態において、装置は、重み付けられたサブバンド信号またはそれに基づく信号を後処理し、後処理された信号を取得するように構成された信号後処理部を更に備え、後処理部は、重み付けられたサブバンド信号に基づく周囲信号表現に関して周波数依存イコライズを実行し、周囲信号表現の音色呈色に反対に作用するように構成される。
装置100の一実施形態において、後処理部は、重み付けられたサブバンド信号に基づく周囲信号表現に関して周波数依存イコライズを実行し、後処理された周囲信号表現としてイコライズされた周囲信号を取得するように構成され、後処理部は、イコライズされた周囲信号表現の長期間パワースペクトル密度を入力オーディオ信号に適応させるために周波数依存イコライズを実行するように構成される。
装置100の一実施形態において、装置は、重み付けられたサブバンド信号またはそれに基づく信号を後処理し、後処理された信号を取得するように構成された信号後処理部を更に備え、信号後処理部は、重み付けられたサブバンド信号またはそれに基づく信号の過渡状態を低減するように構成される。
装置100の一実施形態において、装置は、重み付けられたサブバンド信号またはそれに基づく信号を後処理し、後処理された信号を取得するように構成された信号後処理部を更に備え、後処理部は、重み付けられたサブバンド信号またはそれに基づく信号に基づいて、左側周囲信号と右側周囲信号を、左側周囲信号と右側周囲信号が少なくとも部分的に非相関化されるように取得するように構成される。
装置100の一実施形態において、装置は、入力オーディオ信号に基づいて正面信号をも提供するように構成され、重み付け部は、時間‐周波数ドメイン表現の所定の周波数バンドを表したサブバンド信号のうちの1つを時間変化する正面信号のゲイン値によって重み付けし、重み付けられた正面信号のサブバンド信号を取得するように構成され、重み付け部は、時間変化する正面信号のゲイン値が周囲信号のゲイン値の増加と共に減少するように構成される。
装置100の一実施形態において、重み付け部は、正面信号のゲイン値が周囲信号のゲイン値に対して相補的であるように時間変化する正面信号のゲイン値を提供するように構成される。
装置100の一実施形態において、装置は、周囲信号の時間ドメイン表現を、1つ以上の重み付けられたサブバンド信号に従って提供するように構成された時間‐周波数ドメインから時間ドメインへの変換部を備える。
装置100の一実施形態において、装置は、周囲信号をモノラル入力オーディオ信号に基づいて抽出するように構成される。
本発明に係る実施形態は、1つ以上の入力オーディオ信号に基づいて、少なくとも1つの周囲信号を含むマルチチャネルオーディオ信号を提供するマルチチャンネルオーディオ信号生成装置を備える。マルチチャンネルオーディオ信号生成装置は、入力オーディオ信号を複数の周波数バンドを記述する複数のサブバンド信号に関して表した入力オーディオ信号の時間‐周波数ドメイン表現に基づいて周囲信号を抽出するように構成された周囲信号抽出部1010を備える。周囲信号抽出部は、入力オーディオ信号に従って、入力オーディオ信号の時間‐周波数ドメイン表現の所定の周波数バンドに対する一連の時間変化する周囲信号のゲイン値を決定するように構成されたゲイン値決定部と、時間‐周波数ドメイン表現の所定の周波数バンドを表したサブバンド信号の1つを時間変化するゲイン値によって重み付けし、重み付けられたサブバンド信号を取得するように構成された重み付け部とを備える。ゲイン値決定部は、入力オーディオ信号の1つ以上の特徴または特性を記述する1つ以上の定量的特徴値を取得し、ゲイン値が定量的特徴値に定量的に依存するように、ゲイン値を1つ以上の定量的特徴値の関数として提供し、入力オーディオ信号から周囲成分の微調整された抽出を可能とするように構成される。ゲイン値決定部は、また、重み付けられたサブバンド信号のなかの周囲成分が非周囲成分を超えて強調されるようにゲイン値を提供するように構成される。さらに、ゲイン値決定部120は、入力オーディオ信号の複数の異なる特徴または特性を記述する複数の異なる定量的特徴値を取得し、ゲイン値が定量的特徴値に定量的に依存するように、異なる定量的特徴値を結合し、一連の時間変化するゲイン値122を取得するように構成される。ゲイン値決定部は、また、異なる特徴値を、重み付け係数によって異なって重み付けするように構成される。さらにまた、ゲイン値決定部は、少なくとも、入力オーディオ信号の音調を記述する音調特徴値と、入力オーディオ信号のサブバンド内のエネルギーを記述するエネルギー特徴値とを結合し、ゲイン値を取得するように構成される。マルチチャンネルオーディオ信号生成装置は、重み付けられたサブバンド信号に基づいて1つ以上の周囲信号を提供するように構成された周囲信号提供部1020を更に備える。
マルチチャンネルオーディオ信号生成装置の一実施形態において、マルチチャンネルオーディオ信号生成装置は、1つ以上の周囲信号を1つ以上の後方チャンネルオーディオ信号として提供するように構成される。
マルチチャンネルオーディオ信号生成装置の一実施形態において、マルチチャンネルオーディオ信号生成装置は、1つ以上の入力オーディオ信号に基づいて1つ以上の正面チャンネルオーディオ信号を提供するように構成される。
本発明に係る実施形態は、入力オーディオ信号から周囲信号を抽出するゲイン値決定部をパラメータ化するための重み付け係数を、係数決定入力オーディオ信号に基づいて取得する装置1300を備える。装置1300は、係数決定入力オーディオ信号の複数の異なる特徴または特性を記述する複数の異なる定量的特徴値1322,1324であって、少なくとも、入力オーディオ信号の音調を記述する音調特徴値と、入力オーディオ信号のサブバンド内のエネルギーを記述するエネルギー特徴値とを含む特徴値の、重み付け係数を用いた重み付け結合に基づいて取得されたゲイン値が、係数決定オーディオ信号に関連づけられた予測ゲイン値1316を近似するように、重み付け係数を決定し、予測ゲイン値が、係数決定入力オーディオ信号の複数の時間‐周波数ビンに対する、係数決定入力オーディオ信号のなかの周囲成分または非周囲成分の強度またはそれから導き出される情報を記述するように構成された重み付け係数決定部1330を備える。
装置1300の一実施形態において、装置は、無視できる周囲信号成分のみを含む基準オーディオ信号に基づいて係数決定信号を提供するように構成された係数決定信号生成部を備える。係数決定信号生成部は、基準オーディオ信号を周囲信号成分と結合し、係数決定信号を取得し、かつ、周囲信号成分、または、周囲信号成分と基準オーディオ信号の直接信号成分との関連性を記述する情報を重み付け係数決定部に提供し、予測ゲイン値を記述するように構成される。
装置1300の一実施形態において、係数決定信号生成部は、周囲信号成分を基準オーディオ信号に基づいて提供するように構成される人工周囲信号生成部を備える。
装置1300の一実施形態において、装置は、マルチチャンネル基準オーディオ信号に基づいて係数決定信号と予測ゲイン値を記述する情報を提供するように構成された係数決定信号生成部を備える。係数決定信号生成部は、マルチチャンネル基準オーディオ信号の2つ以上のチャンネル間の関連性を記述する情報を決定し、予測ゲイン値を記述する情報を提供するように構成される。
装置1300の一実施形態において、係数決定信号生成部は、マルチチャンネル基準オーディオ信号の2つ以上のチャンネル間の相関を記述する相関ベースの定量的特徴値を決定し、予測ゲイン値を記述する情報を提供するように構成される。
装置1300の一実施形態において、係数決定信号生成部は、マルチチャンネル基準オーディオ信号の1つのチャンネルを係数決定信号として提供するように構成される。
装置1300の一実施形態において、係数決定信号生成部は、マルチチャネル参照オーディオ信号の2つ以上のチャンネルを結合し、係数決定信号を取得するように構成される。
装置1300の一実施形態において、重み付け係数決定部は、重み付け係数を回帰法、類別法、またはニューラルネットを用いて決定するように構成され、係数決定信号はトレーニング信号として用いられ、予測ゲイン値は基準値として役立ち、係数が決定される。
本発明に係る実施形態の更なる詳細、作用および効果は、引き続いて記載される。
Claims (61)
- 入力音声信号を、複数の周波数バンドを記述する複数のサブバンド信号に関して表した入力音声信号の時間-周波数ドメイン表現に基づいて周囲信号を抽出する装置であって、
前記入力オーディオ信号に従って、前記入力オーディオ信号の時間-周波数ドメイン表現の所定の周波数バンドに対する一連の時間変化する周囲信号のゲイン値を決定するように構成されたゲイン値決定部と、
前記時間‐周波数ドメイン表現の前記所定の周波数バンドを表した前記サブバンド信号の1つを前記時間変化するゲイン値によって重み付けし、重み付けられたサブバンド信号を取得するように構成された重み付け部と、
を備え、
前記ゲイン値決定部は、前記入力オーディオ信号の1つ以上の特徴または特性を記述する1つ以上の定量的特徴値を取得し、前記ゲイン値が定量的特徴値に定量的に依存するように、前記ゲイン値を1つ以上の定量的特徴値の関数として提供するように構成され、
前記ゲイン値決定部は、前記重み付けられたサブバンド信号のなかの周囲成分が非周囲成分を超えて強調されるように前記ゲイン値を提供するように構成された、
周囲信号を抽出する装置。 - 前記ゲイン値決定部は、前記入力オーディオ信号の時間‐周波数ドメイン表現に基づいて、前記時間変化するゲイン値を決定するように構成された、請求項1に記載の周囲信号を抽出する装置。
- 前記ゲイン値決定部は、前記所定の周波数バンドを表したサブバンド信号の周囲らしさを記述する少なくとも1つの定量的特徴値を取得するように構成された、請求項1または2に記載の周囲信号を抽出する装置。
- 前記ゲイン値決定部は、前記入力オーディオ信号の複数の異なる特徴または特性を記述する複数の異なる定量的特徴値を取得し、前記異なる定量的特徴値を結合し、前記一連の時間変化するゲイン値を取得するように構成された、請求項1〜3のいずれかに記載の周囲信号を抽出する装置。
- 前記ゲイン値決定部は、前記異なる定量的特徴値を、重み付け係数によって異なって重み付けするように構成された、請求項4に記載の周囲信号を抽出する装置。
- 前記ゲイン値決定部は、前記異なる定量的特徴値を非線形方法でスケーリングするように構成された、請求項4または5に記載の周囲信号を抽出する装置。
- 前記ゲイン値決定部は、結合される異なる特徴の重みを調整するように構成された重み調整部を備える、請求項4〜7のいずれかに記載の周囲信号を抽出する装置。
- 前記ゲイン値決定部は、少なくとも、前記入力オーディオ信号の音調を記述する音調特徴値と、前記入力オーディオ信号のサブバンド内のエネルギーを記述するエネルギー特徴値とを結合し、前記ゲイン値を取得するように構成された、請求項4〜8のいずれかに記載の周囲信号を抽出する装置。
- 前記ゲイン値決定部は、少なくとも、前記音調特徴値と、前記エネルギー特徴値と、前記入力オーディオ信号のスペクトルまたは前記入力オーディオ信号のスペクトルの一部のスペクトル重心を記述するスペクトル重心特徴値とを結合し、前記ゲイン値を取得するように構成された、請求項9に記載の周囲信号を抽出する装置。
- 前記ゲイン値決定部は、単一のオーディオ信号チャンネルの特徴を記述する少なくとも1つの定量的単一チャンネル特徴値を取得し、前記単一チャンネル特徴値を用いて前記ゲイン値を提供するように構成された、請求項1〜10のいずれかに記載の周囲信号を抽出する装置。
- 前記ゲイン値決定部は、単一のオーディオチャンネルに基づいて前記ゲイン値を提供するように構成された、請求項1〜11のいずれかに記載の周囲信号を抽出する装置。
- 前記ゲイン値決定部は、前記入力オーディオ信号を複数の周波数バンドを含む周波数範囲にわたって記述するマルチバンド特徴値を取得するように構成された、請求項1〜12のいずれかに記載の周囲信号を抽出する装置。
- 前記ゲイン値決定部は、前記入力オーディオ信号を単一の周波数バンドを含む周波数範囲にわたって記述する狭帯域特徴値を取得するように構成された、請求項1〜13のいずれかに記載の周囲信号を抽出する装置。
- 前記ゲイン値決定部は、前記入力オーディオ信号を前記時間‐周波数ドメイン表現の周波数バンドの全部を含む周波数範囲にわたって記述する広帯域特徴値を取得するように構成された、請求項1〜14のいずれかに記載の周囲信号を抽出する装置。
- 前記ゲイン値決定部は、異なるバンド幅を有する前記入力オーディオ信号の部分を記述する異なる特徴値を結合し、前記ゲイン値を取得するように構成された、請求項1〜15のいずれかに記載の周囲信号を抽出する装置。
- 前記ゲイン値決定部は、前記入力オーディオ信号の時間‐周波数ドメイン表現を非線形方法で前処理し、前記前処理された時間‐周波数ドメイン表現に基づいて定量的特徴値を取得するように構成された、請求項1〜16のいずれかに記載の周囲信号を抽出する装置。
- 前記ゲイン値決定部は、前記取得された特徴値を非線形方法で後処理し、前記特徴値の値の範囲を制限し、後処理された特徴値を取得するように構成された、請求項1〜17のいずれかに記載の周囲信号を抽出する装置。
- 前記ゲイン値決定部は、前記時間‐周波数ドメイン表現の異なる時間‐周波数ビンに関連づけられた同一の特徴または特性を記述する複数の特徴値を結合し、結合された特徴値を取得するように構成された、請求項1〜18のいずれかに記載の周囲信号を抽出する装置。
- 前記ゲイン値決定部は、前記入力オーディオ信号の音調を記述する定量的特徴値を取得し、前記ゲイン値を決定するように構成された、請求項1〜19のいずれかに記載の周囲信号を抽出する装置。
- 前記ゲイン値決定部は、音調を記述する定量的特徴値として、
スペクトル平坦性尺度、
スペクトル波高係数、
前記入力オーディオ信号のスペクトルのコピーの異なる非線形処理を用いて取得された少なくとも2つのスペクトル値の比率、
前記入力信号のスペクトルのコピーの異なる非線形フィルタを用いて取得された少なくとも2つのスペクトル値の比率、
スペクトルピークの存在を示す値、
前記入力オーディオ信号と前記入力オーディオ信号の時間シフトされたバージョンの間の類似性を記述する類似性値、
前記時間‐周波数ドメイン表現の予測スペクトル係数と前記時間‐周波数ドメイン表現の実際のスペクトル係数の差分を記述する予測誤差値、
のいずれかを取得するように構成された、請求項20に記載の周囲信号を抽出する装置。 - 前記ゲイン値決定部は、前記入力オーディオ信号のサブバンド内のエネルギーを記述する少なくとも1つの定量的特徴値を取得し、前記ゲイン値を決定するように構成された、請求項1〜21のいずれかに記載の周囲信号を抽出する装置。
- 前記ゲイン値決定部は、前記時間‐周波数ドメイン表現の所定の時間‐周波数ビンの前記ゲイン値が前記所定の時間‐周波数ビンのエネルギーの増加、または、前記所定の時間‐周波数ビンの近傍内の時間‐周波数ビンのエネルギーの増加と共に減少するように、前記ゲイン値を決定するように構成された、請求項22に記載の周囲信号を抽出する装置。
- 前記ゲイン値決定部は、所定の時間‐周波数ビンのエネルギーと、前記所定の時間‐周波数ビンの予め定められた近傍の最大エネルギーまたは平均エネルギーを、分離した特徴として取り扱うように構成された、請求項22または23に記載の周囲信号を抽出する装置。
- 前記ゲイン値決定部は、前記所定の時間‐周波数ビンのエネルギーを記述する第1の定量的特徴値と、前記所定の時間‐周波数ビンの予め定められた近傍の最大エネルギーまたは平均エネルギーを記述する第2の定量的特徴値とを取得し、前記第1の定量的特徴値と前記第2の定量的特徴値を結合し、前記ゲイン値を取得するように構成された、請求項24に記載の周囲信号を抽出する装置。
- 前記ゲイン値決定部は、前記入力オーディオ信号の2つ以上のチャンネル間の関連性を記述する1つ以上の定量的チャンネル関連値を取得するように構成された、請求項1〜25のいずれかに記載の周囲信号を抽出する装置。
- 前記1つ以上の定量的チャンネル関連値のうちの1つは、前記入力オーディオ信号の2つのチャンネル間の相関性または整合性を記述する、請求項26に記載の周囲信号を抽出する装置。
- 前記1つ以上の定量的チャンネル関連値のうちの1つは、チャンネル間の短時間整合性を記述する、請求項26または27に記載の周囲信号を抽出する装置。
- 前記1つ以上の定量的チャンネル関連値のうちの1つは、前記入力オーディオ信号の2つ以上のチャンネルに基づいて音源の位置を記述する、請求項26〜28のいずれかに記載の周囲信号を抽出する装置。
- 前記1つ以上の定量的チャンネル関連値のうちの1つは、前記入力オーディオ信号の2つ以上のチャンネルの間のチャンネル間レベル差を記述する、請求項29に記載の周囲信号を抽出する装置。
- 前記ゲイン値決定部は、前記1つ以上の定量的チャンネル関連値のうちの1つとして、パニング指標を取得するように構成された、請求項26〜30のいずれかに記載の周囲信号を抽出する装置。
- 前記ゲイン値決定部は、所定の時間‐周波数ビンのスペクトル値差分とスペクトル値総計の間の比率を決定し、前記所定の時間‐周波数ビンのパニング指標を取得するように構成された、請求項31に記載の周囲信号を抽出する装置。
- 前記ゲイン値決定部は、前記入力オーディオ信号のスペクトルまたは前記入力オーディオ信号のスペクトルの一部のスペクトル重心を記述するスペクトル重心特徴値を取得するように構成された、請求項1〜32のいずれかに記載の周囲信号を抽出する装置。
- 前記ゲイン値決定部は、前記時間‐周波数ドメイン表現によって表された複数のサブバンド信号に従って、前記サブバンド信号の所定の1つを重み付けするためのゲイン値を提供するように構成された、請求項1〜33のいずれかに記載の周囲信号を抽出する装置。
- 前記重み付け部は、サブバンドのグループを共通の一連の時間変化するゲイン値によって重み付けするように構成された、請求項1〜34のいずれかに記載の周囲信号を抽出する装置。
- 前記重み付けられたサブバンド信号またはそれに基づく信号を後処理し、周囲‐直接比率を強化し、周囲‐直接比率が強化された後処理された信号を取得するように構成された信号後処理部を更に備える、請求項1〜35のいずれかに記載の周囲信号を抽出する装置。
- 前記信号後処理部は、前記重み付けられたサブバンド信号またはそれに基づく信号のなかの大きな音を静かな音を保存しながら減衰させ、前記後処理された信号を取得するように構成された、請求項36に記載の周囲信号を抽出する装置。
- 前記信号後処理部は、前記重み付けられたサブバンド信号またはそれに基づく信号に対して非線形圧縮を適用するように構成された、請求項36または37に記載の周囲信号を抽出する装置。
- 前記重み付けられたサブバンド信号またはそれに基づく信号を後処理し、後処理された信号を取得するように構成された信号後処理部を更に備え、
前記信号後処理部は、前記重み付けられたサブバンド信号またはそれに基づく信号を2ミリ秒から70ミリ秒の範囲で遅延させ、前記重み付けられたサブバンド信号に基づいて正面信号と周囲信号の間の遅延を取得するように構成された、
請求項1〜38のいずれかに記載の周囲信号を抽出する装置。 - 前記重み付けられたサブバンド信号またはそれに基づく信号を後処理し、後処理された信号を取得するように構成された信号後処理部を更に備え、
前記後処理部は、前記重み付けられたサブバンド信号に基づく周囲信号表現に関して周波数依存イコライズを実行し、前記周囲信号表現の音色呈色に反対に作用するように構成された、
請求項1〜39のいずれかに記載の周囲信号を抽出する装置。 - 前記後処理部は、前記重み付けられたサブバンド信号に基づく周囲信号表現に関して周波数依存イコライズを実行し、前記後処理された周囲信号表現としてイコライズされた周囲信号を取得するように構成され、
前記後処理部は、前記イコライズされた周囲信号表現の長期間パワースペクトル密度を前記入力オーディオ信号に適応させるために周波数依存イコライズを実行するように構成された、
請求項40に記載の周囲信号を抽出する装置。 - 前記重み付けられたサブバンド信号またはそれに基づく信号を後処理し、後処理された信号を取得するように構成された信号後処理部を更に備え、
前記信号後処理部は、前記重み付けられたサブバンド信号またはそれに基づく信号の過渡状態を低減するように構成された、
請求項1〜41のいずれかに記載の周囲信号を抽出する装置。 - 前記重み付けられたサブバンド信号またはそれに基づく信号を後処理し、後処理された信号を取得するように構成された信号後処理部を更に備え、
前記後処理部は、前記重み付けられたサブバンド信号またはそれに基づく信号に基づいて、左側周囲信号と右側周囲信号を、前記左側周囲信号と前記右側周囲信号が少なくとも部分的に非相関化されるように取得するように構成された、
請求項1〜42のいずれかに記載の周囲信号を抽出する装置。 - 前記入力オーディオ信号に基づいて正面信号をも提供するように構成され、
前記重み付け部は、前記時間‐周波数ドメイン表現の前記所定の周波数バンドを表したサブバンド信号のうちの1つを時間変化する正面信号のゲイン値によって重み付けし、重み付けられた正面信号のサブバンド信号を取得するように構成され、
前記重み付け部は、前記時間変化する正面信号のゲイン値が周囲信号のゲイン値の増加と共に減少するように構成された、
請求項1〜43のいずれかに記載の周囲信号を抽出する装置。 - 前記重み付け部は、前記正面信号のゲイン値が前記周囲信号のゲイン値に対して相補的であるように前記時間変化する正面信号のゲイン値を提供するように構成された、請求項44に記載の周囲信号を抽出する装置。
- 周囲信号の時間ドメイン表現を、前記1つ以上の重み付けられたサブバンド信号に従って提供するように構成された時間‐周波数ドメインから時間ドメインへの変換部を備える、請求項1〜45のいずれかに記載の周囲信号を抽出する装置。
- 前記周囲信号を、モノラル入力オーディオ信号に基づいて抽出するように構成された、請求項1〜46のいずれかに記載の周囲信号を抽出する装置。
- 1つ以上の入力オーディオ信号に基づいて、少なくとも1つの周囲信号を含むマルチチャンネルオーディオ信号を提供するマルチチャンネルオーディオ信号発生装置であって、
前記入力オーディオ信号を複数の周波数バンドを記述する複数のサブバンド信号に関して表した入力オーディオ信号の時間‐周波数ドメイン表現に基づいて周囲信号を抽出するように構成された周囲信号抽出部と、
重み付けられたサブバンド信号に基づいて1つ以上の周囲信号を提供するように構成された周囲信号提供部と、
を備え、
前記周囲信号抽出部は、
前記入力オーディオ信号に従って、前記入力オーディオ信号の時間‐周波数ドメイン表現の所定の周波数バンドに対する一連の時間変化する周囲信号のゲイン値を決定するように構成されたゲイン値決定部と、
前記時間‐周波数ドメイン表現の所定の周波数バンドを表したサブバンド信号の1つを前記時間変化するゲイン値によって重み付けし、重み付けられたサブバンド信号を取得するように構成された重み付け部と、を備え、
前記ゲイン値決定部は、前記入力オーディオ信号の1つ以上の特徴または特性を記述する1つ以上の定量的特徴値を取得し、前記ゲイン値が前記定量的特徴値に定量的に依存するように、前記ゲイン値を1つ以上の定量的特徴値の関数として提供するように構成され、
前記ゲイン値決定部は、前記重み付けられたサブバンド信号のなかの周囲成分が非周囲成分を超えて強調されるように前記ゲイン値を提供するように構成された、
マルチチャンネルオーディオ信号発生装置。 - 1つ以上の周囲信号を1つ以上の後方チャンネルオーディオ信号として提供するように構成された、請求項48に記載のマルチチャンネルオーディオ信号発生装置。
- 1つ以上の入力オーディオ信号に基づいて1つ以上の正面チャンネルオーディオ信号を提供するように構成された、請求項48または49に記載のマルチチャンネルオーディオ信号発生装置。
- 入力オーディオ信号から周囲信号を抽出するゲイン値決定部をパラメータ化するための重み付け係数を取得する装置であって、
係数決定入力オーディオ信号の複数の特徴または特性を記述する複数の定量的特徴値の、前記重み付け係数を用いた重み付け結合に基づいて取得されたゲイン値が、前記係数決定オーディオ信号に関連づけられた予測ゲイン値を近似するように、前記重み付け係数を決定するように構成された重み付け係数決定部を備える、
重み付け係数を取得する装置。 - 無視できる周囲信号成分のみを含む基準オーディオ信号に基づいて前記係数決定信号を提供するように構成された係数決定信号生成部を備え、
前記係数決定信号生成部は、前記基準オーディオ信号を周囲信号成分と結合し、前記係数決定信号を取得し、かつ、
前記周囲信号成分、または、前記周囲信号成分と前記基準オーディオ信号の直接信号成分との関連性を記述する情報を前記重み付け係数決定部に提供し、前記予測ゲイン値を記述するように構成された、請求項51に記載の重み付け係数を取得する装置。 - 前記係数決定信号生成生部は、前記周囲信号成分を前記基準オーディオ信号に基づいて提供するように構成された周囲信号生成部を備える、請求項52に記載の重み付け係数を取得する装置。
- マルチチャンネル基準オーディオ信号に基づいて前記係数決定信号と前記予測ゲイン値を記述する情報を提供するように構成された係数決定信号生成部を備え、
前記係数決定信号生成部は、前記マルチチャンネル基準オーディオ信号の2つ以上のチャンネル間の関連性を記述する情報を決定し、前記予測ゲイン値を記述する情報を提供するように構成された、請求項51〜53のいずれかに記載の重み付け係数を取得する装置。 - 前記係数決定信号生成部は、前記マルチチャンネル基準オーディオ信号の2つ以上のチャンネル間の相関を記述する相関ベースの定量的特徴値を決定し、前記予測ゲイン値を記述する情報を提供するように構成された、請求項54に記載の重み付け係数を取得する装置。
- 前記係数決定信号生成部は、前記マルチチャンネル基準オーディオ信号の1つのチャンネルを、前記係数決定信号として提供するように構成された、請求項54または55に記載の重み付け係数を取得する装置。
- 前記係数決定信号生成部は、前記マルチチャンネル基準オーディオ信号の2つ以上のチャンネルを結合し、前記係数決定信号を取得するように構成された、請求項54〜56のいずれかに記載の重み付け係数を取得する装置。
- 前記重み付け係数決定部は、前記重み付け係数を、回帰法、類別法、またはニューラルネットを用いて決定するように構成され、前記係数決定信号はトレーニング信号として用いられ、前記予測ゲイン値は基準値として役立ち、前記係数が決定される、請求項51〜57のいずれかに記載の重み付け係数を取得する装置。
- 入力オーディオ信号を複数の周波数バンドを記述する複数のサブバンド信号に関して表した入力オーディオ信号の時間‐周波数ドメイン表現に基づいて周囲信号を抽出する方法であって、
前記入力オーディオ信号の1つ以上の特徴または特性を記述する1つ以上の定量的特徴値を取得するステップと、
前記入力オーディオ信号の時間‐周波数ドメイン表現の所定の周波数バンドに対する一連の時間変化する周囲信号のゲイン値を、前記ゲイン値が定量的特徴値に定量的に依存するように、1つ以上の定量的特徴値の関数として決定するステップと、
前記時間‐周波数ドメイン表現の前記所定の周波数バンドを表したサブバンド信号を、前記時間変化するゲイン値によって重み付けするステップと、
を備える、周囲信号を抽出する方法。 - 入力オーディオ信号から周囲信号を抽出するためのゲイン値の決定をパラメータ化するための重み付け係数を取得する方法であって、
前記係数決定信号のなかに存在する周囲成分についての情報、または、周囲成分と非周囲成分の関連性を記述する情報がわかるように、係数決定信号を取得するステップと、
前記係数決定信号の複数の特徴または特性を記述する複数の定量的特徴値の、前記重み付け係数による重み付け結合に基づいて取得されたゲイン値が、前記係数決定信号に関連づけられた予測ゲイン値を近似するように、前記重み付け係数を決定するステップと、
を備える、重み付け係数を取得する方法。 - コンピュータプログラムがコンピュータ上で動作するときに、請求項59または60に記載された方法を実行する、コンピュータプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US97534007P | 2007-09-26 | 2007-09-26 | |
US60/975,340 | 2007-09-26 | ||
PCT/EP2008/002385 WO2009039897A1 (en) | 2007-09-26 | 2008-03-26 | Apparatus and method for extracting an ambient signal in an apparatus and method for obtaining weighting coefficients for extracting an ambient signal and computer program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010541350A true JP2010541350A (ja) | 2010-12-24 |
JP5284360B2 JP5284360B2 (ja) | 2013-09-11 |
Family
ID=39591266
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010526171A Active JP5284360B2 (ja) | 2007-09-26 | 2008-03-26 | 周囲信号を抽出するための重み付け係数を取得する装置および方法における周囲信号を抽出する装置および方法、並びに、コンピュータプログラム |
Country Status (8)
Country | Link |
---|---|
US (1) | US8588427B2 (ja) |
EP (1) | EP2210427B1 (ja) |
JP (1) | JP5284360B2 (ja) |
CN (1) | CN101816191B (ja) |
HK (1) | HK1146678A1 (ja) |
RU (1) | RU2472306C2 (ja) |
TW (1) | TWI426502B (ja) |
WO (1) | WO2009039897A1 (ja) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014523174A (ja) * | 2011-07-05 | 2014-09-08 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | スペクトル重みジェネレータを使用する周波数領域処理を用いてステレオ録音を分解するための方法および装置 |
JP2014527381A (ja) * | 2011-09-13 | 2014-10-09 | ディーティーエス・インコーポレイテッド | 直接−拡散分解方法 |
JPWO2013115297A1 (ja) * | 2012-02-03 | 2015-05-11 | パナソニックIpマネジメント株式会社 | サラウンド成分生成装置 |
JP2016048927A (ja) * | 2011-05-11 | 2016-04-07 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | 少なくとも2つの出力チャネルを有する出力信号を生成するための装置および方法 |
JP2017134284A (ja) * | 2016-01-28 | 2017-08-03 | 日本電信電話株式会社 | 音源分離装置、方法、及びプログラム |
KR101825949B1 (ko) * | 2015-10-06 | 2018-02-09 | 전자부품연구원 | 음원 분리를 포함하는 음원 위치 추정 장치 및 방법 |
JP2019152875A (ja) * | 2013-01-08 | 2019-09-12 | ドルビー・インターナショナル・アーベー | 臨界サンプリングされたフィルタバンクにおけるモデル・ベースの予測 |
Families Citing this family (96)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI297486B (en) * | 2006-09-29 | 2008-06-01 | Univ Nat Chiao Tung | Intelligent classification of sound signals with applicaation and method |
US8270625B2 (en) * | 2006-12-06 | 2012-09-18 | Brigham Young University | Secondary path modeling for active noise control |
US8315396B2 (en) * | 2008-07-17 | 2012-11-20 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for generating audio output signals using object based metadata |
EP2395504B1 (en) * | 2009-02-13 | 2013-09-18 | Huawei Technologies Co., Ltd. | Stereo encoding method and apparatus |
EP2237271B1 (en) | 2009-03-31 | 2021-01-20 | Cerence Operating Company | Method for determining a signal component for reducing noise in an input signal |
KR20100111499A (ko) * | 2009-04-07 | 2010-10-15 | 삼성전자주식회사 | 목적음 추출 장치 및 방법 |
US8705769B2 (en) * | 2009-05-20 | 2014-04-22 | Stmicroelectronics, Inc. | Two-to-three channel upmix for center channel derivation |
WO2010138309A1 (en) * | 2009-05-26 | 2010-12-02 | Dolby Laboratories Licensing Corporation | Audio signal dynamic equalization processing control |
WO2010138311A1 (en) * | 2009-05-26 | 2010-12-02 | Dolby Laboratories Licensing Corporation | Equalization profiles for dynamic equalization of audio data |
SG178081A1 (en) * | 2009-07-22 | 2012-03-29 | Stormingswiss Gmbh | Device and method for improving stereophonic or pseudo-stereophonic audio signals |
US20110078224A1 (en) * | 2009-09-30 | 2011-03-31 | Wilson Kevin W | Nonlinear Dimensionality Reduction of Spectrograms |
PL3998606T3 (pl) * | 2009-10-21 | 2023-03-06 | Dolby International Ab | Nadrpóbkowanie w połączonym banku filtrów modułu transpozycji |
KR101567461B1 (ko) * | 2009-11-16 | 2015-11-09 | 삼성전자주식회사 | 다채널 사운드 신호 생성 장치 |
EP2510515B1 (en) | 2009-12-07 | 2014-03-19 | Dolby Laboratories Licensing Corporation | Decoding of multichannel audio encoded bit streams using adaptive hybrid transformation |
EP2346028A1 (en) | 2009-12-17 | 2011-07-20 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | An apparatus and a method for converting a first parametric spatial audio signal into a second parametric spatial audio signal |
JP4709928B1 (ja) * | 2010-01-21 | 2011-06-29 | 株式会社東芝 | 音質補正装置及び音質補正方法 |
EP2543199B1 (en) * | 2010-03-02 | 2015-09-09 | Nokia Technologies Oy | Method and apparatus for upmixing a two-channel audio signal |
CN101916241B (zh) * | 2010-08-06 | 2012-05-23 | 北京理工大学 | 一种基于时频分布图的时变结构模态频率辨识方法 |
US8805653B2 (en) | 2010-08-11 | 2014-08-12 | Seiko Epson Corporation | Supervised nonnegative matrix factorization |
US8515879B2 (en) | 2010-08-11 | 2013-08-20 | Seiko Epson Corporation | Supervised nonnegative matrix factorization |
US8498949B2 (en) | 2010-08-11 | 2013-07-30 | Seiko Epson Corporation | Supervised nonnegative matrix factorization |
AT510359B1 (de) * | 2010-09-08 | 2015-05-15 | Akg Acoustics Gmbh | Verfahren zur akustischen signalverfolgung |
CN102469350A (zh) * | 2010-11-16 | 2012-05-23 | 北大方正集团有限公司 | 广告统计的方法、装置和系统 |
EP2458586A1 (en) * | 2010-11-24 | 2012-05-30 | Koninklijke Philips Electronics N.V. | System and method for producing an audio signal |
JP5817106B2 (ja) * | 2010-11-29 | 2015-11-18 | ヤマハ株式会社 | オーディオチャンネル拡張装置 |
EP2541542A1 (en) | 2011-06-27 | 2013-01-02 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for determining a measure for a perceived level of reverberation, audio processor and method for processing a signal |
US20120224711A1 (en) * | 2011-03-04 | 2012-09-06 | Qualcomm Incorporated | Method and apparatus for grouping client devices based on context similarity |
US8965756B2 (en) * | 2011-03-14 | 2015-02-24 | Adobe Systems Incorporated | Automatic equalization of coloration in speech recordings |
JP5893129B2 (ja) | 2011-04-18 | 2016-03-23 | ドルビー ラボラトリーズ ライセンシング コーポレイション | オーディオをアップミックスして3dオーディオを生成する方法とシステム |
US9307321B1 (en) | 2011-06-09 | 2016-04-05 | Audience, Inc. | Speaker distortion reduction |
US8503950B1 (en) * | 2011-08-02 | 2013-08-06 | Xilinx, Inc. | Circuit and method for crest factor reduction |
US8903722B2 (en) | 2011-08-29 | 2014-12-02 | Intel Mobile Communications GmbH | Noise reduction for dual-microphone communication devices |
US20130065213A1 (en) * | 2011-09-13 | 2013-03-14 | Harman International Industries, Incorporated | System and method for adapting audio content for karaoke presentations |
ITTO20120067A1 (it) * | 2012-01-26 | 2013-07-27 | Inst Rundfunktechnik Gmbh | Method and apparatus for conversion of a multi-channel audio signal into a two-channel audio signal. |
CN102523553B (zh) * | 2012-01-29 | 2014-02-19 | 昊迪移通(北京)技术有限公司 | 一种针对移动终端设备并基于声源内容的全息音频方法和装置 |
US9986356B2 (en) * | 2012-02-15 | 2018-05-29 | Harman International Industries, Incorporated | Audio surround processing system |
WO2013124445A2 (en) | 2012-02-23 | 2013-08-29 | Dolby International Ab | Methods and systems for efficient recovery of high frequency audio content |
JP2013205830A (ja) * | 2012-03-29 | 2013-10-07 | Sony Corp | トーン成分検出方法、トーン成分検出装置およびプログラム |
CN102629469B (zh) * | 2012-04-09 | 2014-07-16 | 南京大学 | 一种时频域混合自适应有源噪声控制算法 |
TWI485697B (zh) * | 2012-05-30 | 2015-05-21 | Univ Nat Central | Environmental sound recognition method |
WO2014035902A2 (en) * | 2012-08-31 | 2014-03-06 | Dolby Laboratories Licensing Corporation | Reflected and direct rendering of upmixed content to individually addressable drivers |
US10136239B1 (en) | 2012-09-26 | 2018-11-20 | Foundation For Research And Technology—Hellas (F.O.R.T.H.) | Capturing and reproducing spatial sound apparatuses, methods, and systems |
US10149048B1 (en) | 2012-09-26 | 2018-12-04 | Foundation for Research and Technology—Hellas (F.O.R.T.H.) Institute of Computer Science (I.C.S.) | Direction of arrival estimation and sound source enhancement in the presence of a reflective surface apparatuses, methods, and systems |
US9955277B1 (en) * | 2012-09-26 | 2018-04-24 | Foundation For Research And Technology-Hellas (F.O.R.T.H.) Institute Of Computer Science (I.C.S.) | Spatial sound characterization apparatuses, methods and systems |
US9549253B2 (en) | 2012-09-26 | 2017-01-17 | Foundation for Research and Technology—Hellas (FORTH) Institute of Computer Science (ICS) | Sound source localization and isolation apparatuses, methods and systems |
US9554203B1 (en) | 2012-09-26 | 2017-01-24 | Foundation for Research and Technolgy—Hellas (FORTH) Institute of Computer Science (ICS) | Sound source characterization apparatuses, methods and systems |
US20160210957A1 (en) | 2015-01-16 | 2016-07-21 | Foundation For Research And Technology - Hellas (Forth) | Foreground Signal Suppression Apparatuses, Methods, and Systems |
US10175335B1 (en) | 2012-09-26 | 2019-01-08 | Foundation For Research And Technology-Hellas (Forth) | Direction of arrival (DOA) estimation apparatuses, methods, and systems |
JP6054142B2 (ja) * | 2012-10-31 | 2016-12-27 | 株式会社東芝 | 信号処理装置、方法およびプログラム |
CN102984496B (zh) * | 2012-12-21 | 2015-08-19 | 华为技术有限公司 | 视频会议中的视音频信息的处理方法、装置及系统 |
US9344826B2 (en) * | 2013-03-04 | 2016-05-17 | Nokia Technologies Oy | Method and apparatus for communicating with audio signals having corresponding spatial characteristics |
BR112015021520B1 (pt) | 2013-03-05 | 2021-07-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V | Aparelho e método para criar um ou mais sinais do canal de saída de áudio dependendo de dois ou mais sinais do canal de entrada de áudio |
US9060223B2 (en) | 2013-03-07 | 2015-06-16 | Aphex, Llc | Method and circuitry for processing audio signals |
CN104240711B (zh) | 2013-06-18 | 2019-10-11 | 杜比实验室特许公司 | 用于生成自适应音频内容的方法、系统和装置 |
MY195412A (en) | 2013-07-22 | 2023-01-19 | Fraunhofer Ges Forschung | Multi-Channel Audio Decoder, Multi-Channel Audio Encoder, Methods, Computer Program and Encoded Audio Representation Using a Decorrelation of Rendered Audio Signals |
EP2830334A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Multi-channel audio decoder, multi-channel audio encoder, methods, computer program and encoded audio representation using a decorrelation of rendered audio signals |
EP2866227A1 (en) | 2013-10-22 | 2015-04-29 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method for decoding and encoding a downmix matrix, method for presenting audio content, encoder and decoder for a downmix matrix, audio encoder and audio decoder |
WO2015074719A1 (en) | 2013-11-25 | 2015-05-28 | Nokia Solutions And Networks Oy | Apparatus and method for communication with time-shifted subbands |
FR3017484A1 (fr) * | 2014-02-07 | 2015-08-14 | Orange | Extension amelioree de bande de frequence dans un decodeur de signaux audiofrequences |
CN105336332A (zh) * | 2014-07-17 | 2016-02-17 | 杜比实验室特许公司 | 分解音频信号 |
EP2980798A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Harmonicity-dependent controlling of a harmonic filter tool |
EP2980789A1 (en) * | 2014-07-30 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for enhancing an audio signal, sound enhancing system |
US9948173B1 (en) * | 2014-11-18 | 2018-04-17 | The Board Of Trustees Of The University Of Alabama | Systems and methods for short-time fourier transform spectrogram based and sinusoidality based control |
CN105828271B (zh) * | 2015-01-09 | 2019-07-05 | 南京青衿信息科技有限公司 | 一种将两个声道声音信号转换成三个声道信号的方法 |
CN105992120B (zh) * | 2015-02-09 | 2019-12-31 | 杜比实验室特许公司 | 音频信号的上混音 |
EP3275208B1 (en) | 2015-03-25 | 2019-12-25 | Dolby Laboratories Licensing Corporation | Sub-band mixing of multiple microphones |
US10559303B2 (en) * | 2015-05-26 | 2020-02-11 | Nuance Communications, Inc. | Methods and apparatus for reducing latency in speech recognition applications |
US9666192B2 (en) | 2015-05-26 | 2017-05-30 | Nuance Communications, Inc. | Methods and apparatus for reducing latency in speech recognition applications |
CN106817324B (zh) * | 2015-11-30 | 2020-09-11 | 腾讯科技(深圳)有限公司 | 频响校正方法及装置 |
TWI579836B (zh) * | 2016-01-15 | 2017-04-21 | Real - time music emotion recognition system | |
ES2830954T3 (es) | 2016-11-08 | 2021-06-07 | Fraunhofer Ges Forschung | Mezclador descendente y método para la mezcla descendente de al menos dos canales y codificador multicanal y decodificador multicanal |
EP3324406A1 (en) * | 2016-11-17 | 2018-05-23 | Fraunhofer Gesellschaft zur Förderung der Angewand | Apparatus and method for decomposing an audio signal using a variable threshold |
US11416742B2 (en) * | 2017-11-24 | 2022-08-16 | Electronics And Telecommunications Research Institute | Audio signal encoding method and apparatus and audio signal decoding method and apparatus using psychoacoustic-based weighted error function |
KR102418168B1 (ko) | 2017-11-29 | 2022-07-07 | 삼성전자 주식회사 | 오디오 신호 출력 장치 및 방법, 이를 이용한 디스플레이 장치 |
CN110033781B (zh) * | 2018-01-10 | 2021-06-01 | 盛微先进科技股份有限公司 | 音频处理方法、装置及非暂时性电脑可读媒体 |
EP3573058B1 (en) * | 2018-05-23 | 2021-02-24 | Harman Becker Automotive Systems GmbH | Dry sound and ambient sound separation |
WO2020046349A1 (en) | 2018-08-30 | 2020-03-05 | Hewlett-Packard Development Company, L.P. | Spatial characteristics of multi-channel source audio |
US10800409B2 (en) * | 2018-09-04 | 2020-10-13 | Caterpillar Paving Products Inc. | Systems and methods for operating a mobile machine using detected sounds |
US11902758B2 (en) | 2018-12-21 | 2024-02-13 | Gn Audio A/S | Method of compensating a processed audio signal |
KR102603621B1 (ko) | 2019-01-08 | 2023-11-16 | 엘지전자 주식회사 | 신호 처리 장치 및 이를 구비하는 영상표시장치 |
CN109616098B (zh) * | 2019-02-15 | 2022-04-01 | 嘉楠明芯(北京)科技有限公司 | 基于频域能量的语音端点检测方法和装置 |
DE112020001090T5 (de) * | 2019-03-05 | 2021-12-30 | Sony Group Corporation | Signalverarbeitungsvorrichtung, -verfahren und -programm |
WO2020211004A1 (zh) * | 2019-04-17 | 2020-10-22 | 深圳市大疆创新科技有限公司 | 音频信号处理方法、设备及存储介质 |
CN110413878B (zh) * | 2019-07-04 | 2022-04-15 | 五五海淘(上海)科技股份有限公司 | 基于自适应弹性网络的用户-商品偏好的预测装置和方法 |
CN111210802A (zh) * | 2020-01-08 | 2020-05-29 | 厦门亿联网络技术股份有限公司 | 一种生成混响语音数据的方法和系统 |
CN113593585A (zh) * | 2020-04-30 | 2021-11-02 | 华为技术有限公司 | 音频信号的比特分配方法和装置 |
CN111711918B (zh) * | 2020-05-25 | 2021-05-18 | 中国科学院声学研究所 | 一种多通道信号的相干声与环境声提取方法及系统 |
CN111669697B (zh) * | 2020-05-25 | 2021-05-18 | 中国科学院声学研究所 | 一种多通道信号的相干声与环境声提取方法及系统 |
CN112097765B (zh) * | 2020-09-22 | 2022-09-06 | 中国人民解放军海军航空大学 | 一种采用定常与时变前置角相结合的飞行器前置导引方法 |
US11694692B2 (en) | 2020-11-11 | 2023-07-04 | Bank Of America Corporation | Systems and methods for audio enhancement and conversion |
CA3205223A1 (en) * | 2020-12-15 | 2022-06-23 | Syng, Inc. | Systems and methods for audio upmixing |
CN112770227B (zh) * | 2020-12-30 | 2022-04-29 | 中国电影科学技术研究所 | 音频处理方法、装置、耳机和存储介质 |
CN112992190B (zh) * | 2021-02-02 | 2021-12-10 | 北京字跳网络技术有限公司 | 音频信号的处理方法、装置、电子设备和存储介质 |
CN114171053B (zh) * | 2021-12-20 | 2024-04-05 | Oppo广东移动通信有限公司 | 一种神经网络的训练方法、音频分离方法、装置及设备 |
TWI801217B (zh) * | 2022-04-25 | 2023-05-01 | 華碩電腦股份有限公司 | 訊號異常檢測系統及其方法 |
CN117153192B (zh) * | 2023-10-30 | 2024-02-20 | 科大讯飞(苏州)科技有限公司 | 音频增强方法、装置、电子设备和存储介质 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0212299A (ja) * | 1988-06-30 | 1990-01-17 | Toshiba Corp | 音場効果自動制御装置 |
JPH04296200A (ja) * | 1991-03-26 | 1992-10-20 | Mazda Motor Corp | 音響装置 |
JPH07123499A (ja) * | 1993-10-22 | 1995-05-12 | Victor Co Of Japan Ltd | 音響信号処理装置 |
JP2001069597A (ja) * | 1999-06-22 | 2001-03-16 | Yamaha Corp | 音声処理方法及び装置 |
JP2001222289A (ja) * | 2000-02-08 | 2001-08-17 | Yamaha Corp | 音響信号分析方法及び装置並びに音声信号処理方法及び装置 |
JP2002078100A (ja) * | 2000-09-05 | 2002-03-15 | Nippon Telegr & Teleph Corp <Ntt> | ステレオ音響信号処理方法及び装置並びにステレオ音響信号処理プログラムを記録した記録媒体 |
JP2003015684A (ja) * | 2001-05-21 | 2003-01-17 | Mitsubishi Electric Research Laboratories Inc | 1つの音源から生成される音響信号から特徴を抽出するための方法及び複数の音源から生成される音響信号から特徴を抽出するための方法 |
WO2005066927A1 (ja) * | 2004-01-09 | 2005-07-21 | Toudai Tlo, Ltd. | 多重音信号解析方法 |
JP2007135046A (ja) * | 2005-11-11 | 2007-05-31 | Sony Corp | 音声信号処理装置、音声信号処理方法、プログラム |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4748669A (en) * | 1986-03-27 | 1988-05-31 | Hughes Aircraft Company | Stereo enhancement system |
US5850453A (en) * | 1995-07-28 | 1998-12-15 | Srs Labs, Inc. | Acoustic correction apparatus |
JP3364825B2 (ja) * | 1996-05-29 | 2003-01-08 | 三菱電機株式会社 | 音声符号化装置および音声符号化復号化装置 |
US6321200B1 (en) * | 1999-07-02 | 2001-11-20 | Mitsubish Electric Research Laboratories, Inc | Method for extracting features from a mixture of signals |
EP1232495A2 (en) | 1999-10-28 | 2002-08-21 | AT&T Corp. | Neural networks for detection of phonetic features |
WO2001035389A1 (en) * | 1999-11-11 | 2001-05-17 | Koninklijke Philips Electronics N.V. | Tone features for speech recognition |
US7076071B2 (en) * | 2000-06-12 | 2006-07-11 | Robert A. Katz | Process for enhancing the existing ambience, imaging, depth, clarity and spaciousness of sound recordings |
US6876966B1 (en) | 2000-10-16 | 2005-04-05 | Microsoft Corporation | Pattern recognition training method and apparatus using inserted noise followed by noise reduction |
US7567675B2 (en) * | 2002-06-21 | 2009-07-28 | Audyssey Laboratories, Inc. | System and method for automatic multiple listener room acoustic correction with low filter orders |
WO2004002192A1 (en) | 2002-06-21 | 2003-12-31 | University Of Southern California | System and method for automatic room acoustic correction |
US7363221B2 (en) | 2003-08-19 | 2008-04-22 | Microsoft Corporation | Method of noise reduction using instantaneous signal-to-noise ratio as the principal quantity for optimal estimation |
US7412380B1 (en) * | 2003-12-17 | 2008-08-12 | Creative Technology Ltd. | Ambience extraction and modification for enhancement and upmix of audio signals |
EP1585112A1 (en) * | 2004-03-30 | 2005-10-12 | Dialog Semiconductor GmbH | Delay free noise suppression |
CN101151800B (zh) * | 2005-04-08 | 2012-03-28 | Nxp股份有限公司 | 处理音频数据的方法和装置、程序单元及计算机可读介质 |
US7590530B2 (en) | 2005-09-03 | 2009-09-15 | Gn Resound A/S | Method and apparatus for improved estimation of non-stationary noise for speech enhancement |
TW200819112A (en) | 2006-10-27 | 2008-05-01 | Sun-Hua Pao | noninvasive method to evaluate the new normalized arterial stiffness |
-
2008
- 2008-03-26 RU RU2010112892/08A patent/RU2472306C2/ru active
- 2008-03-26 EP EP20080734783 patent/EP2210427B1/en active Active
- 2008-03-26 US US12/055,787 patent/US8588427B2/en active Active
- 2008-03-26 JP JP2010526171A patent/JP5284360B2/ja active Active
- 2008-03-26 CN CN200880109021.XA patent/CN101816191B/zh active Active
- 2008-03-26 WO PCT/EP2008/002385 patent/WO2009039897A1/en active Application Filing
- 2008-09-26 TW TW097137242A patent/TWI426502B/zh active
-
2011
- 2011-01-25 HK HK11100758.9A patent/HK1146678A1/xx unknown
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0212299A (ja) * | 1988-06-30 | 1990-01-17 | Toshiba Corp | 音場効果自動制御装置 |
JPH04296200A (ja) * | 1991-03-26 | 1992-10-20 | Mazda Motor Corp | 音響装置 |
JPH07123499A (ja) * | 1993-10-22 | 1995-05-12 | Victor Co Of Japan Ltd | 音響信号処理装置 |
JP2001069597A (ja) * | 1999-06-22 | 2001-03-16 | Yamaha Corp | 音声処理方法及び装置 |
JP2001222289A (ja) * | 2000-02-08 | 2001-08-17 | Yamaha Corp | 音響信号分析方法及び装置並びに音声信号処理方法及び装置 |
JP2002078100A (ja) * | 2000-09-05 | 2002-03-15 | Nippon Telegr & Teleph Corp <Ntt> | ステレオ音響信号処理方法及び装置並びにステレオ音響信号処理プログラムを記録した記録媒体 |
JP2003015684A (ja) * | 2001-05-21 | 2003-01-17 | Mitsubishi Electric Research Laboratories Inc | 1つの音源から生成される音響信号から特徴を抽出するための方法及び複数の音源から生成される音響信号から特徴を抽出するための方法 |
WO2005066927A1 (ja) * | 2004-01-09 | 2005-07-21 | Toudai Tlo, Ltd. | 多重音信号解析方法 |
JP2007135046A (ja) * | 2005-11-11 | 2007-05-31 | Sony Corp | 音声信号処理装置、音声信号処理方法、プログラム |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016048927A (ja) * | 2011-05-11 | 2016-04-07 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | 少なくとも2つの出力チャネルを有する出力信号を生成するための装置および方法 |
US9729991B2 (en) | 2011-05-11 | 2017-08-08 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for generating an output signal employing a decomposer |
US9883307B2 (en) | 2011-07-05 | 2018-01-30 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Method and apparatus for decomposing a stereo recording using frequency-domain processing employing a spectral weights generator |
JP2014523174A (ja) * | 2011-07-05 | 2014-09-08 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | スペクトル重みジェネレータを使用する周波数領域処理を用いてステレオ録音を分解するための方法および装置 |
JP2014527381A (ja) * | 2011-09-13 | 2014-10-09 | ディーティーエス・インコーポレイテッド | 直接−拡散分解方法 |
JPWO2013115297A1 (ja) * | 2012-02-03 | 2015-05-11 | パナソニックIpマネジメント株式会社 | サラウンド成分生成装置 |
JP2019152875A (ja) * | 2013-01-08 | 2019-09-12 | ドルビー・インターナショナル・アーベー | 臨界サンプリングされたフィルタバンクにおけるモデル・ベースの予測 |
US10573330B2 (en) | 2013-01-08 | 2020-02-25 | Dolby International Ab | Model based prediction in a critically sampled filterbank |
US10971164B2 (en) | 2013-01-08 | 2021-04-06 | Dolby International Ab | Model based prediction in a critically sampled filterbank |
US11651777B2 (en) | 2013-01-08 | 2023-05-16 | Dolby International Ab | Model based prediction in a critically sampled filterbank |
US11915713B2 (en) | 2013-01-08 | 2024-02-27 | Dolby International Ab | Model based prediction in a critically sampled filterbank |
KR101825949B1 (ko) * | 2015-10-06 | 2018-02-09 | 전자부품연구원 | 음원 분리를 포함하는 음원 위치 추정 장치 및 방법 |
JP2017134284A (ja) * | 2016-01-28 | 2017-08-03 | 日本電信電話株式会社 | 音源分離装置、方法、及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
CN101816191A (zh) | 2010-08-25 |
US8588427B2 (en) | 2013-11-19 |
EP2210427B1 (en) | 2015-05-06 |
EP2210427A1 (en) | 2010-07-28 |
HK1146678A1 (en) | 2011-06-30 |
CN101816191B (zh) | 2014-09-17 |
US20090080666A1 (en) | 2009-03-26 |
JP5284360B2 (ja) | 2013-09-11 |
RU2472306C2 (ru) | 2013-01-10 |
RU2010112892A (ru) | 2011-10-10 |
WO2009039897A1 (en) | 2009-04-02 |
TW200915300A (en) | 2009-04-01 |
TWI426502B (zh) | 2014-02-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5284360B2 (ja) | 周囲信号を抽出するための重み付け係数を取得する装置および方法における周囲信号を抽出する装置および方法、並びに、コンピュータプログラム | |
US10685638B2 (en) | Audio scene apparatus | |
JP6637014B2 (ja) | 音声信号処理のためのマルチチャネル直接・環境分解のための装置及び方法 | |
KR101090565B1 (ko) | 오디오 신호로부터 주위 신호를 생성하는 장치 및 방법, 오디오 신호로부터 멀티-채널 오디오 신호를 도출하는 장치및 방법, 그리고 컴퓨터 프로그램 | |
CA2583146C (en) | Diffuse sound envelope shaping for binaural cue coding schemes and the like | |
US8731209B2 (en) | Device and method for generating a multi-channel signal including speech signal processing | |
US10242692B2 (en) | Audio coherence enhancement by controlling time variant weighting factors for decorrelated signals | |
US9424852B2 (en) | Determining the inter-channel time difference of a multi-channel audio signal | |
JP4664431B2 (ja) | アンビエンス信号を生成するための装置および方法 | |
JP5957446B2 (ja) | 音響処理システム及び方法 | |
KR101710544B1 (ko) | 스펙트럼 무게 발생기를 사용하는 주파수-영역 처리를 이용하는 스테레오 레코딩 분해를 위한 방법 및 장치 | |
EP2092790A1 (en) | Dropout concealment for a multi-channel arrangement | |
CN105284133A (zh) | 基于信号下混比进行中心信号缩放和立体声增强的设备和方法 | |
Uhle et al. | A supervised learning approach to ambience extraction from mono recordings for blind upmixing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20111124 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111129 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20120229 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20120307 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120529 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130108 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130404 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130430 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130529 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5284360 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |