JP2013514696A - 第1のパラメトリック空間オーディオ信号を第2のパラメトリック空間オーディオ信号に変換する装置および方法 - Google Patents

第1のパラメトリック空間オーディオ信号を第2のパラメトリック空間オーディオ信号に変換する装置および方法 Download PDF

Info

Publication number
JP2013514696A
JP2013514696A JP2012543696A JP2012543696A JP2013514696A JP 2013514696 A JP2013514696 A JP 2013514696A JP 2012543696 A JP2012543696 A JP 2012543696A JP 2012543696 A JP2012543696 A JP 2012543696A JP 2013514696 A JP2013514696 A JP 2013514696A
Authority
JP
Japan
Prior art keywords
parameter
diffusion
spatial audio
audio signal
listening
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2012543696A
Other languages
English (en)
Other versions
JP5426035B2 (ja
Inventor
リヒャルト シュルツ−アムリング
ファビアン キュッヒ
マルクス カリンガー
ガルド ジョヴァンニ デル
オリヴァー ティールガルト
ディルク メーネ
アヒム クンツ
Original Assignee
フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ filed Critical フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ
Publication of JP2013514696A publication Critical patent/JP2013514696A/ja
Application granted granted Critical
Publication of JP5426035B2 publication Critical patent/JP5426035B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/173Transcoding, i.e. converting between two coded representations avoiding cascaded coding-decoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/44Receiver circuitry for the reception of television signals according to analogue transmission standards
    • H04N5/60Receiver circuitry for the reception of television signals according to analogue transmission standards for the sound signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/78Television signal recording using magnetic recording
    • H04N5/782Television signal recording using magnetic recording on tape
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/302Electronic adaptation of stereophonic sound system to listener position or orientation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/007Two-channel systems in which the audio signals are in digital form
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/11Positioning of individual sound objects, e.g. moving airplane, within a sound field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/15Aspects of sound capture and related signal processing for recording or reproduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels

Abstract

空間オーディオシーンにおける第1の聴取位置または第1の聴取方向を示している第1のパラメトリック空間オーディオ信号(112、114)を、第2の聴取位置または第2の聴取方向を示している第2のパラメトリック空間オーディオ信号(212、214)に変換するための装置(300)であって、その装置は、第2のパラメトリック空間オーディオ信号(212、214)を得るために、第1の聴取位置または第1の聴取方向の変化に依存して、第1のパラメトリック空間オーディオ信号(112、114)を修正するように構成された空間オーディオ信号修正装置(301、302)であって、第2の聴取位置または第2の聴取方向は、変化によって変更された第1の聴取位置または第1の聴取方向に対応することを特徴とする空間オーディオ信号修正装置(301、302)を含むことを特徴とする装置。
【選択図】図2

Description

本発明は、オーディオ処理の分野、特に第1のパラメトリック空間オーディオ信号を第2のパラメトリック空間オーディオ信号に変換するためのパラメトリック空間オーディオ処理の分野に関する。
空間音響録音(spatial sound recording)は、再生側で聴取者が音像を知覚するように、複数のマイクロホンを用いて、音場を捉えることを目指している。空間音響録音のための標準のアプローチは、例えば、アンビソニックス(Ambisonics)において使用され、M.A.ガーゾン著の「Periphony(取り囲み音響):幅―高さサウンド再生」(オーディオ技術協会誌、21巻、No.1、ページ2〜10、1973年)によって説明されるB−フォーマット・マイクロホンなどの、単純なステレオマイクロホンまたは指向性マイクロホンのより精巧な組み合わせを使用する。一般に、これらの方法は、コインシデント・マイクロホン(coincident−microphone)テクニックと呼ばれる。
代わりの方法として、音場のパラメトリック表現に基づいた方法を適用することができ、それはパラメトリック空間オーディオ符号器と呼ばれる。これらの方法は、それは空間音響の知覚に関連する、対応する空間補助情報と共に、ダウンミックスオーディオ信号を決定する。例としては、以下では[DirAC]として参照される、プルキ,V.著の「空間音響再生およびステレオアップミキシングにおける方向性オーディオ符号化」(AES第128回国際コンフェレンスの予稿集、ページ251〜258、ピテ、スウェーデン、2006年6月30日〜7月2日)において説明されるような方向オーディオ符号化(Directional Audio Coding)(DirAC)、または、以下では[SAM]として参照される、ファーラー,C.著の「空間オーディオ符号器のためのマイクロホン・フロントエンド」(AES第125回国際コンフェレンスの予稿集、サンフランシスコ、2008年10月)において提案されたいわゆる空間オーディオマイクロホン(spatial audio microphones)(SAM)アプローチが挙げられる。空間キュー(cue)情報は、基本的に、音の到来方向(direction−of−arrival)(DOA)および周波数サブバンドにおける音場の拡散からなる。合成段階において、再生のための所望のスピーカ信号は、ダウンミックス信号およびパラメトリック補助情報に基づいて決定される。
換言すれば、ダウンミックス信号および対応する空間補助情報は、オーディオシーンが録音された時に使用された様々な音響源に関して、セットアップ、例えばマイクロホンの方向および/または位置によって、オーディオシーンを示す。
M.A.ガーゾン著、「Periphony(取り囲み音響):幅―高さサウンド再生」、オーディオ技術協会誌、21巻、No.1、ページ2〜10、1973年(M.A.Gerzon,"Periphony: Width−Height Sound Reproduction," J. Aud. Eng. Soc., Vol.21, No.1, pp2−10, 1973) プルキ,V.著、「空間音響再生およびステレオアップミキシングにおける方向性オーディオ符号化」、AES第128回国際コンフェレンスの予稿集、ページ251〜258、ピテ、スウェーデン、2006年6月30日〜7月2日(Pulkki,V., "Directional audio coding in spatial sound reproduction and stereo upmixing," in Proceedings of The AES 28th International Conference, pp. 251−258, Piteaa, Sweden, June 30 − July 2, 2006) ファーラー,C.著、「空間オーディオ符号器のためのマイクロホン・フロントエンド」、AES第125回国際コンフェレンスの予稿集、サンフランシスコ、2008年10月(Faller,C., "Microphone Front−Ends for Spatial Audio Coders", in Proceedings of the AES 125th International Convention, San Francisco, Oct. 2008) プルキ,V.著、「ベクトルベースの振幅パニングを使用した仮想音源位置決め」、オーディオ技術協会誌、45巻、ページ456〜466、1997年6月(Pulkki,V., "Virtual sound source positioning using vector base amplitude panning," J.Audio Eng.Soc., Vol.45, pp456−466, June 1997)
本発明の目的は、録音されたオーディオシーンの柔軟な適用のための構想を提供することである。
この目的は、請求項1に記載の装置、請求項17に記載の方法、および請求項18に記載のコンピュータプログラムによって解決される。
すべての上述した方法は、それらが再生側で音場をそれが録音位置で知覚されたように与えることを目指すという共通点がある。録音位置、すなわちマイクロホンの位置は、基準聴取位置とも呼ぶことができる。録音されたオーディオシーンの修正は、これらの周知の空間音響捕捉方法においては想定されない。
一方、視像の修正は、例えば、映像捕捉(video capturing)に関連して、共通に適用される。例えば、光学ズームは、カメラの仮想位置を変えるためにビデオカメラにおいて使用され、映像を異なる視点から撮影した印象を与える。これは、カメラ位置の平行移動によって説明される。他の単純なピクチャ修正は、その軸を中心にしたカメラの水平または垂直回転である。垂直回転は、パニングまたはチルティングとも呼ばれる。
本発明の実施形態は、視覚の動きに従って、聴取位置および/または方向を変えることも可能にする装置および方法を供給する。換言すれば、本発明は、それがマイクロホンの実際の物理的位置以外の仮想位置および/または方向で位置付けられるマイクロホン構成を使用して得られた録音に対応するように、聴取者が再生の間、知覚する音像を変えることを可能にする。こうすることによって、録音された音像は、対応する修正されたビデオ画像と整合されることができる。例えば、画像の特定の領域に対するビデオズームの効果は、矛盾のない方法で、録音された空間音像に適用されうる。本発明によれば、このことは、空間オーディオ符号器のパラメトリック領域において空間キュー・パラメータおよび/またはダウンミックス信号を適切に修正することによって達成される。
本発明の実施形態は、異なるマイクロホン設定、例えばオーディオ信号源に関する録音マイクロホンセットアップの異なる位置および/または方向によって空間オーディオシーンを録音する必要なく、一定の空間オーディオシーンの範囲内で聴取者の位置および/または方向を柔軟に変えることを可能にする。換言すれば、本発明の実施形態は、空間オーディオシーンが録音された時に、録音位置または聴取位置と異なる仮想聴取位置および/または仮想聴取方向を定めることを可能にする。
本発明の特定の実施形態は、変更された聴取位置および/または方向を反映するために、ダウンミックス信号、および/または、空間補助情報を適応させるために、1つまたはいくつかのダウンミックス信号、および/または、空間補助情報、例えば、到来方向(direction−of−arrival)および拡散を使用するだけである。換言すれば、これらの実施形態は、いかなる更なるセットアップ情報、例えば最初の録音位置に関する様々な音響源の幾何的情報も必要としない。
更なる本発明の実施形態は、更に、空間補助情報として、特定の空間オーディオフォーマットによるパラメトリック空間オーディオ信号、例えば到来方向および拡散を有するモノラルまたはステレオダウンミックス信号を受けて、制御信号、例えば、ズームまたは回転制御信号によってこのデータを変換して、同じ空間オーディオフォーマットで、すなわち、関連した到来方向および拡散パラメータを有するモノラルまたはステレオダウンミックス信号として、修正されたまたは変換されたデータを出力する。
特定の実施形態において、本発明の実施形態は、ビデオカメラまたは他のビデオソースと結合されて、例えば、オーディオ体験をビデオ体験に同期させて、例えば、ビデオズームが実行される場合には、音響ズームを実行するために、および/または、例えば、ビデオカメラが回転されて、マイクロホンがカメラに取り付けられていないので、マイクロホンがカメラとともに物理的に回転しない場合には、オーディオシーンの範囲内でオーディオ回転を実行するために、ビデオカメラによって供給されたズーム制御または回転制御信号によって、受信したまたは最初の空間オーディオデータを、修正された空間オーディオデータに修正する。
本発明の実施形態について、以下の図を使用して詳述する。
図1は、パラメトリック空間オーディオ符号器のブロック図を示す。 図2は、空間オーディオ符号器の空間オーディオ分析装置と空間オーディオ合成装置との間に結合された空間パラメータ修正ブロックの実施形態を伴った図1の空間オーディオ符号器を示す。 図3Aは、図2に対応しており、空間パラメータ修正ブロックの詳細な実施形態を示す。 図3Bは、図2に対応しており、空間パラメータ修正ブロックの更に詳細な実施形態を示す。 図4は、音響ズームの典型的な幾何学の概要を示す。 図5Aは、到来方向(DOA)マッピングのための方向マッピング関数fp(k,n,φ,d)の例を示す。 図5Bは、拡散マッピングのための拡散マッピング関数fd(k,n,φ,d)の例を示す。 図6は、ズーム比に依存した直接音成分の重み付けフィルタH1(k,n,φ,d)のための様々な利得窓を示す。 図7は、拡散成分のための重み付けフィルタH2(k,n,φ,d)のための典型的なサブカージオイドの窓を示す。
等しいかまたは同等である要素、または、等しいか同等の要素を有する機能は、等しいかまたは同等である参照番号によって、図の以下の説明において表される。
Figure 2013514696
以下に、空間パラメータの計算において含まれる、または、換言すれば、空間オーディオ分析装置100によって実行されるものとしての空間オーディオ分析のための基本的なステップについて、更に詳細に説明する。例えば、マイクロホン信号は、例えば、短時間フーリエ変換(STFT)またはその他のフィルタバンクも適用することによって、適切な時間/周波数表現において、処理される。分析段階において決定された空間補助情報は、分析された音場の直接および拡散音響の関係を示す、音響の到来の方向(DOA)に対応する尺度および音場の拡散の尺度を含む。
DirACにおいて、アクティブ・インテンシティ・ベクトルの反対方向として音響のDOAを決定することが提案されている。関連した音響情報は、デカルト座標系の軸と整合される双極子ピックアップ・パターンを供給しているマイクロホン構成によって得られた音圧および速度に対応するいわゆるB−フォーマット・マイクロホン入力から得られる。換言すれば、B−フォーマットは、4つの信号、すなわち、w(t)、x(t)、y(t)、およびz(t)から成る。第1のものは、全指向性マイクロホンで測定される圧力に対応するが、後者の3つは、デカルト座標系の3本の軸に向けられた8の字形ピックアップ・パターンを有するマイクロホンの信号である。信号x(t)、y(t)、およびz(t)は、それぞれ、x、yおよびzを向いた粒子速度ベクトルの成分に比例している。あるいは、SAMに提案されたアプローチは、音響のDOAを決定するために、ステレオマイクロホンの指向性パターンについての演繹的な知識を使用する。
DirACにおいて提案されるように、拡散尺度は、アクティブ音響インテンシティ(active sound intensity)を音場の全体のエネルギーと関連づけることによって得られることができる。代わりの方法として、SAMにおいて説明したような方法は、異なるマイクロホン信号間の可干渉性を評価することを提案する。拡散が、推定されたDOAのための一般の信頼性尺度とみなすこともできる点に留意する必要がある。一般性を失わずに、以下では、拡散性が[1、0]の範囲にあり、1の値が単に拡散音場を示し、0の値が直接音だけが存在するケースに対応すると仮定される。他の実施形態において、拡散のための他の範囲および値は、使用できる。
補助情報114を伴うダウンミックス信号112は、マイクロホン入力信号から計算される。それは、モノラルでありえるまたは複数のオーディオチャンネルを含むことがありえる。DirACの場合には、一般に、全指向性マイクロホンによって得られるような、音圧に対応するモノラルの信号だけが考慮される。SAMアプローチのために、2チャネルステレオ信号は、ダウンミックス信号として使用される。
Figure 2013514696
Figure 2013514696
Figure 2013514696
しかし、SAMにおいて、(1)と同じ信号モデルが適用されるが、直接および拡散音成分は、その代わりにステレオダウンミックス信号に基づいて計算される。
図2は、図1の典型的な環境において組み込まれた、すなわち、空間分析装置100および空間オーディオ合成装置200との間に組み込まれた本発明の実施形態のブロック図を示す。図1に基づいて説明されるように、最初のオーディオシーンは、異なるオーディオ音源と関連して位置および方向(指向性マイクロホンの場合)を特定しているマイクロホンの特定の録音セットアップによって録音される。N個のマイクロホンは、N個の物理的マイクロホン信号またはチャンネル信号を供給し、それらは、1つまたはいくつかのダウンミックス信号W112および空間補助情報114、例えば到来方向(DOA)φ114aおよび拡散Ψ114bを生成するために空間オーディオ分析装置100によって処理される。図1とは対照的に、これらの空間オーディオ信号112、114a、114bが、空間オーディオ合成装置200に直接供給されずに、空間オーディオシーンにおける第1の聴取位置および/または第1の聴取方向(この例においては、録音位置および録音方向)を示している第1のパラメトリック空間オーディオ信号112、114a、114bを、第2のパラメトリック空間オーディオ信号212、214a、214b、すなわち、第1の聴取位置および/または第1の聴取方向とは異なる第2の聴取位置および/または第2の聴取方向を示している修正されたダウンミックス信号Wmod212、修正された到来方向信号φmod214aおよび/または修正された拡散信号Ψmod214bに、変換するまたは修正するための装置によって修正される。修正された到来方向214aおよび修正された拡散214bは、修正された空間オーディオ情報214とも呼ばれる。装置300は、空間オーディオ信号修正装置または空間オーディオ信号修正ブロック300とも呼ばれる。図3Aの装置300は、例えば外部の、制御装置400によって供給された制御信号d402に依存している第1のパラメトリック空間オーディオ信号112、114を修正するように構成される。制御信号402は、例えば、ビデオカメラのズーム制御および/または回転制御装置400によって供給された、ズーム比dまたはズームパラメータdを定めているまたはそれ自体であるズーム制御信号、あるいは、回転制御信号402でありえる。特定の方向のズームおよび同方向の平行移動は、その特定の方向への仮想の動きを示しているちょうど2つの異なる方法(ズーム比によるズーム、絶対距離による、または、参照距離と関連する相対距離による平行移動)であることに留意されたい。従って、ズーム制御信号に関して本願明細書における説明は、対応して、平行移動制御信号に当てはまり、そして、その逆も同様である。そして、ズーム制御信号402も、平行移動制御信号に関連する。用語dは、一方で、制御信号402自体を示し、そして、他方で、制御信号に含まれた制御情報またはパラメータを示しうる。更なる実施形態において、制御パラメータdは、すでに制御信号402を示す。制御パラメータまたは制御情報dは、距離、ズーム比および/または回転角および/または回転方向でありえる。
図2から分かるように、装置300は、それが受けたパラメトリック空間オーディオ信号112、114と同じフォーマットのパラメトリック空間オーディオ信号212、214(ダウンミックス信号および関連補助情報/パラメータ)を供給するように構成される。従って、空間オーディオ合成装置200は、最初のまたは録音された空間オーディオ信号112、114と同様に、修正された空間オーディオ信号212、214を処理することが(修正なしで)できて、修正された空間オーディオシーンへの、換言すれば、他の場合は変化のない空間オーディオシーンの範囲内の修正された聴取位置および/または修正された聴取方向への音響体験を生成するために、それらをM個の物理スピーカ信号に変換する。
換言すれば、新規な装置または方法の実施形態のブロック略図は、図2に示される。図から分かるように、空間オーディオ符号器100の出力112、114は、音響捕捉のために使用された最初の位置において使用されたものとは異なる聴取位置に対応する空間オーディオ表現212、214を得るために、外部の制御情報402に基づいて修正される。より正確に言うと、ダウンミックス信号112および空間補助情報114は、適切に変えられる。修正ストラテジーは、カメラ400から直接に、または、カメラの実際の位置またはズームに関する情報を供給する他のユーザーインターフェース400からも得られることができる外部制御400により決定される。この実施形態において、そのアルゴリズムのタスクは、修正装置300が、光学ズームまたはカメラ回転が傍観者の観点を変えるのと同じ方法で、音響シーンの空間印象を変えることである。換言すれば、修正装置300は、ビデオズームまたはビデオ回転に対応する、対応音響ズームまたはオーディオ回転体験を提供するように構成される。
図3Aは、「音響ズーム装置」と呼ばれる装置300の実施形態のブロック図またはシステム概要を示す。図3Aの装置300の実施形態は、パラメータ修正装置301とダウンミックス修正装置302を含む。パラメータ修正装置301は、さらに、到来方向修正装置301aと拡散修正装置301bを含む。パラメータ修正装置301は、到来方向パラメータ114aを受けて、修正されたまたは第2の到来方向パラメータ214aを得るために、制御信号d402に依存して、第1のまたは受けた到来方向パラメータ114aを修正するように構成される。パラメータ修正装置301は、第1のまたは最初の拡散パラメータ114bを受けて、制御信号402に依存して、第2のまたは修正された拡散パラメータ214bを得るために、拡散修正装置301bにより拡散パラメータ114bを修正するように更に構成される。ダウンミックス修正装置302は、一つ以上のダウンミックス信号112を受けて、第1のまたは最初の到来方向パラメータ114a、第1のまたは最初の拡散パラメータ114bおよび/または制御信号402に依存して、第2または修正されたダウンミックス信号212を得るために、第1のまたは最初のダウンミックス信号112を修正するように構成される。
カメラがマイクロホン102とは独立して制御される場合、本発明の実施形態は、カメラ制御402によってオーディオシーンまたはオーディオ知覚の変化を合成させる可能性を供給する。加えて、カメラ400がズーミングなしで水平に回転するだけである場合、すなわち、ズーミング制御信号はないが回転制御信号のみが適用される場合、ダウンミックス信号112を修正せずに、その方向は、変化しうる。これは、図2および図3の「回転制御装置」によって説明される。
回転修正は、指向性の再マッピングまたは方向の再マッピングについてのセクションにおいて更に詳細に説明される。拡散およびダウンミックス修正についてのセクションは、平行移動またはズーミング応用例に関連がある。
本発明の実施形態は、例えば、まず回転修正、その後、平行移動若しくはズーム修正、またはその逆を実行することによって、回転修正および平行移動若しくはズーム修正を実行するように、または、対応する方向性マッピング関数を供給することによって、同時に両方を実行するように構成されうる。
音響ズーミング効果を得るために、聴取位置は、仮想的に変更される。そして、それは、適切に分析方向を再マッピングすることによってなされる。修正された音響シーンの正しい全体の印象を得るために、ダウンミックス信号は、再マップされた方向依存フィルタによって処理される。このフィルタは、例えば、より近い音響がレベルにおいて増加するように、利得を変える。その一方で、関心のない(out−of−interest)領域からの音響は、減衰させられうる。また、拡散は、例えば、新しい聴取位置のより近くに現れる音響が、以前よりも拡散が小さく再生される必要があるように、同じ仮定によってスケールされる。
以下に、装置300によって実行されたアルゴリズムまたは方法のより詳細な説明が与えられる。音響のズーム装置の概要が、図3Aで与えられる。まず、方向の再マッピングが説明され(ブロック301a、fp(k,n,φ,d))、そして、拡散修正(ブロック301b、fd(k,n,φ,d))のためのフィルタが示される。ブロック302は、ズーム制御および最初の空間パラメータに依存しているダウンミックス修正を説明する。
以下のセクションにおいて、方向の再マッピング、また、例えば、方向修正ブロック301aによって実行されるような到来方向パラメータの再マッピングは、説明される。
Figure 2013514696
一般性を失わずに、DOA再マッピングの例は、提示を簡単にするために、二次元の場合に関して与えられる(図4)。三次元のDOAの再マッピングは、同様の考慮によってなされる。
Figure 2013514696
図4において、上述のように、ズームパラメータdが最初の聴取位置Sと修正された聴取位置S2間の平行移動距離dとして表されるが、dはまた、倍率、例えば4倍または8倍ズームのような光学ズームでもありえる。特に、幅またはフィルタ制御に関して、dを倍率とみなし、距離とはみなさないことは、音響ズームの簡単な実施態様を可能にする。換言すれば、ズームパラメータdは、この場合、実質上の距離である、または少なくとも距離に比例する。
更に、本発明の実施形態はまた、上記のような「ズームイン」、例えば対象までの(例えば、位置Sから位置S2まで移動することによって図4の対象Aまでの)距離を縮めることの他もサポートするように構成され、同様に、「ズームアウト」、例えば対象までの(例えば、位置S2から位置Sまで移動することによって図4の対象Aまでの)距離を増加させることもサポートするように構成されうる点に留意する必要がある。この場合、聴取者の側面に位置した対象(例えば位置S2に関する対象B)は、聴取者が位置Sに移動するときに、聴取者の正面へ移動するので、説明されたようなズームインと比較して、逆の考慮が適用される。換言すれば、角度の大きさは(例えばβからαまで)低減される。
方向の再マッピングまたはベクトル変換は、到来方向修正装置301aによって実行される。図5Aは、図4に示されたシナリオのための到来方向のための(ズーム比dに依存している)模範としてのマッピング関数を示す。図5Aのダイヤグラムは、1から2の範囲のx軸上のズーム比およびy軸上の修正されたまたはマップされた角度βを示す。1のズーム比に関して、β=α、すなわち、最初の角度は、修正されない。参照符号512は、α=10°に関するマッピング関数fpに関連し、参照符号514は、α=30°に関するマッピング関数fpに関連し、参照符号516は、α=50°に関するマッピング関数fp(k,n,φ,d)に関連し、参照符号518は、α=70°に関するマッピング関数fp(k,n,φ,d)に関連し、参照符号520は、α=90°に関するマッピング関数fp(k,n,φ,d)に関連する。
本発明の実施形態は、kおよびnによって定義された全ての時間および周波数ビン値に関する同じマッピング関数fpを使用するように構成でき、または、異なる時間値および/または周波数ビンに関して異なるマッピング関数を使用しうる。
上記説明から明らかとなるように、フィルタfdの後についての考えは、それがズームイン方向(φ<|γ|)に関しては拡散を低下させ、焦点がはずれる方向(φ>|γ|)に関しては拡散を増加させるように、拡散ψを変えることである。
マップされた角度βの決定を単純化するために、修正装置301aの特定の実施形態は、方向だけを使用し、音響の到来方向を定めているすべての音源、例えばAおよびBが第1の聴取位置まで同じ距離を有する、例えば単位半径上に配置されると仮定するように構成される。
正面方向から来ている音響を再生するだけであるスピーカ・セットアップ、例えば典型的ステレオスピーカ・セットアップの場合、マッピング関数f()は、DOAが再マッピングされる最大角度が制限されるように、設計することができる。例えば、スピーカが±60°に位置決めされるとき、±60°の最大角度が選択される。このように、ズームが使用されるとき、全部の音響シーンは正面のままであり、広がるだけである。
Figure 2013514696
上述した説明から分かるように、回転の変化または差は、第1の参照または0°方向を定めている方向をそれぞれ最初に見ている第1の聴取方向(例えば観察者、聴取者の「鼻」の方向)から始まって得られる。聴取方向が変化するとき、参照または0°方向はそれに応じて変化する。従って、本発明の実施形態は、第2の方向パラメータがオーディオシーンにおける同じ「到来方向」を示すが新しい参照方向または座標系と関連しているように、新しい参照または0°方向によって、音響の最初の角度または到来方向、すなわち、第1の方向パラメータを変える。同様の考慮は平行移動またはズームに適用する。ここで、知覚された到来方向は、第1の聴取方向の平行移動またはズームイン方向によって変化する(図4参照)。
第1の方向パラメータ114aおよび第2の方向パラメータ214aは、二次元または三次元のベクトルでありえる。加えて、第1の方向パラメータ114aは、ベクトルでありえる。制御信号402は、回転角(例えば前述の例における20°)を定めている回転制御信号、および(前述の二次元例における右への)回転方向であり、そして、パラメータ修正装置301、301aは、第2の方向パラメータ、すなわち、第2のまたは修正されたベクトル214aを得るために、回転方向と逆方向の回転角(前述の例におけるβ=α−20°)だけベクトルを回転させるように構成される。
以下のセクションにおいて、例えば、拡散修正装置によって実行されたような拡散スケーリング301bが更に詳細に説明される。
拡散は、DOAに依存する窓によってスケールされる。ある実施形態において、拡散Ψ(k,n)の値は、ズームインされた方向に関しては減少し、その一方で、関心の外にある方向に関する拡散値は増加する。これは、音源が聴取位置の近くに置かれる場合、それらがより拡散されず知覚されるという観測に対応する。従って、例えば、最小ズーム比(例えばd=1)に関しては、拡散は、修正されない。カメラ像によってカバーされる視角の範囲は、拡散値が増減されるスケーリングのためのコントローラとしてみなされうる。
ズームイン方向(zoomed−in−derections)または関心のある方向(directions−of−interest)は、角度の中央範囲(central range)とも呼ばれ、第1のまたは最初の聴取方向、例えば最初の0°参照方向の中心に配置される関心のある角形の窓(angular window of interest)に関連する。角形の窓または中央範囲は、角形の窓の境界を定めている角度値γで決定される。角形の窓および角形の窓の幅は、負の境界角度−γおよび正の境界角度γによって定義できる。ここで、負の境界角度の大きさは、正の境界角度と異なりうる。他の好ましい実施形態において、負の境界角度および正の境界角度は、同じ大きさ(第1の聴取方向を中心とした対称窓または角度の中央範囲)を有する。境界角度の大きさは、角度幅とも呼ばれ、そして、(負の境界角度から正の境界角度まで)窓の幅は、全体の角度幅とも呼ばれる。
本発明の実施形態によれば、到来方向パラメータ、拡散パラメータ、および/または、直接または拡散成分は、最初の到来方向パラメータが関心のある窓内にあるかどうか、例えば第1の聴取位置と関連するDOA角度またはDOA角度の大きさが境界角度の大きさまたは角度幅γより小さいかどうか、または、最初の到来方向パラメータが関心のある窓の外にあるかどうか、例えばDOA角度または第1の聴取位置と関連するDOA角度の大きさが境界角度の大きさまたは角度幅γより大きいかどうかに、異なって依存して、修正されうる。これは、方向依存(direction−dependent)とも呼ばれ、そして、対応するフィルタ関数は、方向依存フィルタ関数と呼ばれる。ここで、角度幅または境界角度γは、対応するフィルタがパラメータの増加からパラメータの減少まで、あるいはその逆に、変化させる角度を定める。
拡散修正装置301bを参照して、拡散修正装置301bは、関数fd(k,n,φ,d)、または、時間/周波数インデックスk、n、最初の到来方向φおよびズームコントローラdに依存しているfdによって、拡散を修正するように構成される。図5Bは、フィルタ関数fdの実施形態を示す。フィルタfdは、拡散範囲、例えば範囲[0〜1]に合うように適合された、後に説明されるフィルタ関数H1の逆変換として実行されうる。図5Bは、マッピング関数またはフィルタfdを示す。ここで、x軸は、0から1までの範囲にある、最初のまたは第1の拡散ψを示し、図5Bにおいてψinと呼ばれ、そして、y軸は、第2のまたは修正された拡散ψmodを示し、同様に0から1の範囲である。ズームが使用されない(d=0)場合、フィルタfdは、全く拡散を変化させず、バイパス、すなわちψmod=ψinにそれぞれセットされる。参照符号552は、バイパスラインを表す。
最初の到来方向が角度幅γ内にある場合、拡散は減少する。最初の到来方向が角度幅γの外にある場合、拡散は増加する。図5Bは、fdのいくつかのプロトタイプ関数、すなわち、観察幅または角度幅γに依存している562、564、572および574を示す。図5Bに示される例において、角度幅は、γ1よりγ2が小さい、すなわちγ2<γ1である。このように、γ2は、γ1よりも高いズーム比dに対応する。
最初の到来方向φが、フィルタfdによるマッピングの後、最初の拡散値ψinまたはψと比較して、修正された拡散値ψmodの減少によって反映される角度幅γ内にある場合、バイパスライン552の下の領域は、修正された拡散値ψmodを定める。最初の到来方向φが、窓の外にある場合、バイパスライン552より上の領域は、修正された拡散値ψmodに最初の拡散ψのマッピングを示す。換言すれば、バイパスライン552より上の領域は、マッピングの後、拡散の増加を示す。他の好ましい実施形態では、角度幅γは、ズーム比dの増加とともに減少する。換言すれば、ズーム比dが高くなるほど、角度幅γは小さくなる。加えて、実施形態は、ズーム比dまたは平行移動情報が、フィルタ関数fdの角度幅γに影響するだけでなく、それが窓内にある場合に拡散が増加する角度またはファクタ、そして、それが角度幅γによって定義される窓の外にある場合に拡散ψが減少する角度またはファクタに影響するように、構成されうる。この種の実施形態は、図5Bに示される。ここで、角度幅γ1は、ズーム比d1に対応し、角度幅γ2は、ズーム比d2に対応する。ここで、d2は、d1より大きく、したがって、角度幅γ2は角度幅γ1より小さい。加えて、参照符号564により示され、より大きいズーム比d2に対応する関数fdは、最初の拡散値ψinを、より低いズーム比d1に対応する562によって示されたフィルタ関数fdより低い修正された拡散値ψmodにマップする。換言すれば、フィルタ関数の実施形態は、角度幅γが小さいほど大きく最初の拡散を減少させるように構成されうる。それに対応することが、逆の方法で、バイパスライン552より上の領域に当てはまる。換言すれば、フィルタ関数fdの実施形態は、最初の拡散ψinを、ズーム比dおよび角度幅γに依存している修正された拡散ψmodにマップするように構成されうる。または、ズーム比dが高いほど、角度幅γは小さい、および/または、窓の外の到来方向φのための拡散の増加は高くなる。
更なる実施形態において、同じ方向依存する窓またはフィルタ関数fd(k,n,φ,d)は、すべてのズーム比に適用される。しかしながら、より高い平行移動またはズーム比に関するより小さい角度幅を有する異なる方向依存する窓またはフィルタ関数の使用は、ユーザのオーディオ体験により良く整合して、より現実的なオーディオ知覚を供給する。異なるズーム比に関する異なるマッピング値(窓内の到来方向値φに関してズーム比の増加と共に拡散の減少が大きくなる、そして、到来方向値φが角度幅γの外にある場合に、高いズーム比に関して拡散値は増加するまたは高くなる)のアプリケーションは、現実的なオーディオ知覚を改善する。
以下では、例えば、ダウンミックス修正装置302によって実行されるようなダウンミックス修正の実施形態について、更に詳細に説明する。
ダウンミックス信号のためのフィルタは、出力信号の直接および拡散部分の利得を修正するために使用される。空間オーディオ符号器構想の直接的な結果として、スピーカ信号は、このように修正される。ズームインされた領域の音響は増幅され、その一方で、関心のない方向からの音響は、減衰させられうる。
ダウンミックス信号112が、方向オーディオ符号化(DirAC)または空間オーディオマイクロホン(SAM)のためのモノラルまたはステレオ信号でありえるので、以下では、修正の2つの異なる実施形態について説明する。
Figure 2013514696
ここで、S(k,n)は、ダウンミックス信号の直接音成分を示し、N(k,n)は、最初のダウンミックス信号における拡散音成分を示し、そして、kは、信号が示す時間インデックスまたは時刻を示し、そして、nは、一定の時刻kに信号の周波数ビンまたは周波数チャンネルを示す。
Figure 2013514696
両方のフィルタは、方向依存重み付け関数である。例えば、マイクロホンのカージオイド形のピックアップ・パターンは、この種の重み付け関数のための設計基準としてとられうる。
フィルタH1(k,n,φ,d)は、直接音がズームインされた領域の方向のために増幅され、他方向から来ている音響のレベルは減衰されるように、二乗余弦窓(raised cosine window)として実行できる。一般に、異なる窓形状は、直接および拡散音響成分にそれぞれ適用できる。
その窓によって実行された利得フィルタは、実際の平行移動またはズーム制御ファクタdによって制御できる。例えば、ズームは、焦点合せされた方向に関して等しい利得の幅および一般の利得の幅を制御する。異なる利得窓に関する例が、図6に与えられる。
図6は、重み付けフィルタH1(k,n,φ,d)のための異なる利得窓を示す。4つの異なる利得プロトタイプが示される。
1.実線:ズームは使用されない、利得はすべての方向に関して0dBである(612参照)。
2.破線:1.3のズーム比が適用される、窓幅は最大利得に関して210°の幅を有し、そして、最大利得は2.3dBである(614参照)。
3.点線:2.1のズーム比が適用される、最大利得のためのチャネル幅は140°まで減少する、そして、最大利得は3dBで、最小は−2.5dBである(616参照)。
4.一点短鎖線:ズーム比は2.8である、チャネル幅は最大利得に関して30°である、そして、利得は最大+3dBおよび最小−6dBに限定される(618参照)。
図6から分かるように、図6の0°によって示された第1の聴取方向は、異なるズーム比に依存する方向に依存する窓の中心を形成する。ここで、方向に依存する窓の所定の中央範囲または幅は、ズーム比が大きいほど、小さい。中央範囲または窓の境界は、利得が0dBである角度γによって定義される。図6は、同じ大きさを有する正および負の境界を有する対称窓を示す。
窓614は、最大利得に関して210°の幅を、そして、+/−130°の境界+/−γ2による260°の幅を有する。ここで、所定の中央領域内の直接成分は、増加し、そして、所定の中央領域の外の直接成分は、減少する(利得=0dB)。
窓616は、最大利得に関して140°の幅を、そして、+/−90°の境界+/−γ3による180°の幅を有する。ここで、所定の中央領域内の直接成分は、増加し、そして、所定の中央領域の外の直接成分は、減少する(負の利得−2.5dB)。
窓618は、最大利得に関して30°の幅を、そして、+/−30°の境界+/−γ4による60°の幅を有する。ここで、所定の中央領域内の直接成分は、増加し、そして、所定の中央領域の外の直接成分は、減少する(負の利得−6dB)。
従って、ある実施形態において、ズーム比dは、幅、すなわち、負および正の境界や全体の幅、およびプロトタイプ窓の利得を制御する。このように、窓は、幅および利得が最初の到来方向φに正しく適用されるようにすでに設計されうる。
出力信号の歪みを回避するために、最大利得は、制限される必要がある。窓の幅、またはここに示されたような厳密な形状は、ズーム比が利得窓のさまざまな態様をどのように制御するかについての図示例とみなされるべきである。他の実施態様は、さまざまな実施形態において使用されうる。
フィルタH2(k,n,φ,d)は、拡散尺度Ψ(k,n)がどのように修正されて、図7で示すようなサブカージオイドの窓としてどのように実行できるかの方法に類似して、ダウンミックス信号の拡散部分112aを修正するように使用される。この種の窓を適用することによって、関心のない方向からの拡散部分は、わずかに減衰させられるが、ズームインされた方向は、不変のまま、または、ほとんど不変のままである。図7は、サブカージオイドの窓を示し、それは、最初の到来方向φの最初の方向の−30°と30°の間の領域において拡散成分をほとんど不変に保つ、そして、最初の到来方向φの、偏差、すなわち、0°方向から始まる角度が高いほど拡散成分を減衰させる。換言すれば、ズームインされた領域のために、ダウンミックス信号の拡散信号成分は、不変のままである。これは、ズーム方向のより直接の音再生を生じさせる。マイクロホンが実質的に離れて置かれるので、すべての他方向から来る音響は、より拡散するようになされる。このように、それらの拡散部分は、最初のダウンミックス信号のそれらと比較して減らされる。明白なことに、所望の利得フィルタは、先に述べた二乗余弦窓を使用して設計することもできる。しかし、スケーリングが直接音修正の場合よりも明白でない点に留意されたい。更なる実施形態において、窓は、ズーム比に依存しうる。ここで、窓関数702のスロープは、ズーム比が高いほど、急である。
以下では、ステレオダウンミックス修正の実施形態、すなわち、ステレオダウンミックス信号Wの修正について説明される。
Figure 2013514696
さらにまた、信号S(k,n)は、直接音を示し、一方、Niは、i番目のマイクロホンのための拡散音を示す。(2)、(3)に類似して、直接および拡散音成分は、拡散尺度に基づいてダウンミックスチャネルから決定できる。利得係数cは、2つのダウンミックスチャネルと関連した異なる指向性パターンから生じる異なるステレオチャネルにおける直接音成分の異なるスケーリングに対応する。直接音のスケーリングファクタおよびDOAの関係に関する詳細は、SAMにおいて見つけることができる。このスケーリングが観察された音場の音響のDOAに依存するので、その値は、修正された仮想録音位置から生じるDOA再マッピングによって修正されなければならない。
Figure 2013514696
モノラルダウンミックスの場合に関して述べられたように、利得フィルタGij(k,n,φ,d)の計算は、対応する利得フィルタHi(k,n,φ,d)によって実行される。新しい仮想録音位置に対応するように、新しいステレオスケーリングファクタcmodは、修正されたDOAの関数として、決定される。
図2および図3Aを参照して、本発明の実施形態は、第2の聴取位置または第2の聴取方向を示している第2のパラメトリック空間オーディオ信号212、214に、空間オーディオシーンにおける第1の聴取位置または第1の聴取方向を示している第1のパラメトリック空間オーディオ信号112、114を変換するための装置300を供給する。第2の聴取位置または第2の聴取方向は、第1の聴取位置または第1の聴取方向とは異なる。その装置は、第2のパラメトリック空間オーディオ信号212、214を得るために、第1の聴取位置または第1の聴取方向の変更に依存している第1のパラメトリックの誤ったオーディオ信号112、114を修正するように構成された空間オーディオ信号修正装置301、302を含む。ここで、第2の聴取位置または第2の聴取方向は、その変化によって変更された第1の聴取位置または第1の聴取方向に対応する。
装置300の実施形態が、一つの補助情報だけ、例えば到来方向114aまたは拡散パラメータ114b、または、オーディオダウンミックス信号112だけ、または、上述した信号およびパラメータのいくつかまたはすべてを変換するように構成できる。
前述のように、方向オーディオ符号化(DirAC)を使用した実施形態において、アナログマイクロホン信号は、デジタル化されて、時間ごとまたはブロックkごとに、周波数表現を示しているマイクロホン信号のダウンミックスされた時間/周波数表現W(k,n)を供給するように処理される。そして、周波数またはスペクトル表現の各周波数ビンは、インデックスnによって示される。ダウンミックス信号112に加えて、空間オーディオ分析装置100は、周波数ビンnごとに、そして、時刻kごとに、方向パラメータまたは情報を供給している1つの単位ベクトルeDOA(方程式(4)を与える)を、時刻kごとに、そして、対応する時刻kに関する周波数ビンnごとに決定する。加えて、空間オーディオ分析装置100は、時刻kごとに、そして、周波数ビンnごとに、直接の音またはオーディオ成分の拡散の音またはオーディオ成分との間の関係を定めている拡散パラメータψを決定する。ここで、拡散成分は、例えば、2以上の音響源によって、および/または、音響源からのオーディオ信号の反射によって生じる。
DirACは、それが、オーディオシーン、例えば、オーディオ源、反射、マイクロホンおよび各聴取者の位置および方向を定めている空間オーディオ情報を、対応する1つの(モノラル)ダウンミックスオーディオ信号W(k,n)またはいくつかの(例えばステレオの)ダウンミックスオーディオ信号W1(k,n)およびW2(k,n)と関連した、1つの方向情報、すなわち、単位ベクトルeDOA(k,n)および0から1の間の1つの拡散値ψ(k,n)に低減させるので、非常に処理効率がよく、メモリ効率のよい符号化である。
従って、上述した方向オーディオ符号化(DirAC)を使用した実施形態は、時刻kごとおよび周波数ビンnごとに、対応するダウンミックス値W(k,n)をWmod(k,n)に、対応する到来方向パラメータ値e(k,n)を(φおよびφmodそれぞれによって示された図1〜図3における)emod(k,n)に、および/または、拡散パラメータ値ψ(k,n)をψmod(k,n)に修正するように構成される。
空間オーディオ信号修正装置は、例えばパラメータ修正装置301およびダウンミックス修正装置302を含むまたはそれにより形成される。好ましい実施形態によれば、パラメータ修正装置301は、修正された方向パラメータ214aを決定するために最初のパラメータ114aを処理するように、最初の方向パラメータφ、それぞれ114aに依存している拡散パラメータψを処理するために、最初の拡散パラメータψ、それぞれ114bを使用している方程式(2)および(3)を用いてダウンミックス信号112を分割するように、最初の方向パラメータφ、114aに依存している方向に依存するフィルタリングH1(k,n,φ,d)およびH2(k,n,φ,d)を適用するように構成される。前に説明されたように、これらの修正は、時刻kごとおよび周波数ビンnごとに、時刻kおよび周波数インスタントnごとに、各修正された信号および/またはパラメータを得るために実行される。
一実施形態によれば、装置300は、制御信号402、例えば回転制御信号またはズーム制御信号に依存して、第2のパラメトリック空間オーディオ信号の第2の方向パラメータ214aを得るために、第1のパラメトリック空間オーディオ信号の第1の方向パラメータ114aを修正するだけであるように構成される。聴取位置/方向の変更が回転だけを含み、平行移動またはズームは含まない場合、方向パラメータφ(k,n)114aの対応する修正またはシフトは、充分である。対応する拡散パラメータおよびダウンミックス信号成分は、第2のダウンミックス信号212が、第1のダウンミックス信号112に対応するように、そして、第2の拡散パラメータ214bは第1の拡散パラメータ114bに対応するように、修正されないままにされうる。
平行移動の変化の場合には、例えば、ズームが実行される場合、図5Aに示すような再マッピング関数による方向パラメータφ(k,n)114aの修正は、すでに音響体験を改善して、(拡散パラメータまたはダウンミックス信号を修正なしで)修正されないまたは最初のパラメトリック空間オーディオ信号と比較して、オーディオ信号と、例えば、ビデオ信号との間のより良い同期を提供する。
フィルタfpによって到来方向を適合させるまたは再マッピングすることを含むだけである上記2つの実施形態は、すでにズーミング効果のより良い印象を供給する。
他の実施形態によれば、装置300は、フィルタH1(k,n,φ,d)を適用するように構成される。換言すれば、この実施形態は、到来方向の再マッピングまたは拡散修正を実行しない。この実施形態は、例えば、ダウンミックス信号112から直接成分112aだけを決定するように、そして、直接の成分の方向依存して重み付けされたバージョンを生成するためにフィルタ関数H1を直接成分に適用させるように構成される。この種の実施形態は、直接成分の方向依存して重み付けされたバージョンを、修正されたダウンミックス信号Wmod212として使用するように、または、最初のダウンミックスW112から直接成分112bを決定して、直接成分の方向依存して重み付けされたバージョンと最初のまたは変化していない拡散成分112bを加算すること、または一般には組み合わせることによって、修正されたダウンミックス信号Wmod212を生成するように、更に構成されうる。しかし、音響ズーミングの改善された印象を得ることができ、到来方向が修正されないので、ズーム効果は制限される。
しかし、更なる実施形態において、フィルタH1(k,n,φ,d)およびH2(k,n,φ,d)は、両方とも適用されるが、到来方向の再マッピングまたは拡散修正は、実行されない。音響印象は、修正されないまたは最初のパラメトリック空間オーディオ信号112、114と比較して改善される。ズーミング印象はまた、拡散音が存在するが、到来方向φが修正されないので、なお制限される場合、直接成分にフィルタ関数H1(k,n,φ,d)だけを適用するよりも良い(H1(k,n,φ,d)だけを使用した上述の実施形態より良い)。
更なる実施形態において、フィルタfdだけが適用される、または、換言すれば、拡散成分ψだけが修正される。ズーミング効果は、ズームした領域(関心がある領域)の拡散が減少し、関心のないところの拡散値は増加するので、最初のパラメトリック空間オーディオ信号112、114と比較して、改善される。
更なる実施形態は、フィルタH1(k,n,φ,d)のみを適用することと組合せて、フィルタ関数fpによって、到来方向φを再マッピングすることを実行するように構成される。換言すれば、この種の実施形態は、フィルタ関数fdによる拡散修正を実行せず、第2のフィルタ関数H2(k,n,φ,d)を最初のダウンミックス信号W112の拡散成分に適用しない。この種の実施形態は、到来方向の再マッピングを適用しているだけよりも非常に良いズーム印象を供給する。
両方のフィルタ関数H1(k,n,φ,d)およびH2(k,n,φ,d)を使用したダウンミックス修正と組合せた関数fpによる到来方向再マッピングを適用している実施形態は、第1のフィルタ関数H1のみを適用することと組み合わせた到来方向の再マッピングを適用するだけよりさらに良いズーム印象を供給する。
関数fp、フィルタH1(k,n,φ,d)およびH2(k,n,φ,d)を使用したダウンミックス修正および関数fdを使用した拡散修正による到来方向再マッピングを適用することは、最高の音響のズーム実施態様を供給する。
到来方向だけを再マッピングする実施形態を振り返ると、加えて、更なる拡散パラメータ114bを修正することは、オーディオ体験を改善する、または、換言すれば、空間オーディオシーンの範囲内の変更位置に関して、音響体験の適合を改善する。従って、更なる実施形態において、装置300は、方向パラメータφ(k,n)および拡散パラメータψ(k,n)を修正するようにだけ構成されるが、ダウンミックス信号W(k,n)100を修正しないように構成されうる。
上記したような装置300の好ましい実施形態は、空間オーディオシーンの変更位置に関して、更にオーディオ体験さえ改善するためにダウンミックス信号W(k,n)を修正することも含む。
従って、第1の方向パラメータφ(k,n)114aがベクトルである実施形態において、パラメータ修正装置301は、第2の方向パラメータφmod(k,n)214aを得るために、回転制御信号によって定められた方向に逆方向の回転制御信号によって定められた角度によって、第1の方向パラメータをシフトするまたは修正するように構成される。
更なる実施形態において、パラメータ修正装置301は、第1の方向パラメータφ(k,n)およびズーム制御信号402によって定められたズーム比dまたは変化信号によって定められた別の平行移動制御情報に依存して第2の方向パラメータ214aを定めている(例えば、図5Aに示されるような)非線形のマッピング関数を使用して、第2の方向パラメータ214aを得るように構成される。
上述の通り、更なる実施形態において、パラメータ修正装置301は、第1の方向パラメータφ(k,n)114aに依存した第2の拡散パラメータψmod(k,n)214bを得るために、第1のパラメトリック空間オーディオ信号の第1の拡散パラメータψ(k,n)114bを修正するように構成されうる。パラメータ修正装置は、第1の方向パラメータφ(k,n)が所定の中央範囲内、例えば最初の参照方向のγ=+/−30°にある場合(図5B参照)に、第2の拡散パラメータψmod(k,n)を得るために、第1の拡散パラメータψ(k,n)を減少させるように、および/または、第1の方向パラメータφ(k,n)が所定の中央範囲外、例えば二次元の場合における0°の最初の参照方向から+γ=+30°および−γ=−30°により定められた中央範囲外にある場合に、第2の拡散パラメータψmod(k,n)を得るために、第1の拡散パラメータψ(k,n)を増加させるように構成された方向依存関数を使用して、第2の拡散パラメータψmod(k,n)を得るように更に構成されうる。
換言すれば、特定の実施形態において、パラメータ修正装置301、310bは、第1の方向パラメータ114aが、所定の二次元または三次元の中央範囲の中心を形成している第2のまたは変更された聴取方向を有する第2を有する第2の方向パラメータの所定の中央範囲内にある場合に、第2の拡散パラメータ214bを得るために、第1の拡散パラメータ114bを減少させるように、および/または、第1の方向パラメータ114aが所定の中央範囲外にある場合に、第2の拡散パラメータを得るために、第1の拡散パラメータ114bを増加させるように構成された方向依存関数を使用して、第2の拡散パラメータ214bを得るように構成される。第1のまたは最初の聴取方向は、第1の方向パラメータの所定の中央範囲の中心、例えば0°を定める。ここで、所定の中央範囲の正および負の境界は、第2の聴取方向が二次元であるか三次元のベクトルであるかとは独立した二次元(例えば水平)面(例えば+/−30°)にある正および負の角度γによって、または、三次元の第1の聴取方向中心の直円錐を定めている対応する角γ(例えば30°)によって定められる。更なる実施形態は、第1の聴取方向または第1の聴取方向を定めているベクトルに配置されるまたはそれを中心にした、対称および非対称の異なる所定の中央領域または窓を含みうる。
更なる実施形態において、方向依存関数fd(k,n,φ,d)は、変化信号、例えばズーム制御信号に依存する。ここで、所定の中央範囲、その中央範囲の負および正の境界(または一般に境界)を定めている値γは、平行移動変化が大きいほど、または、ズーム制御信号によって定められたズーム比が高いほど、小さい。
更なる実施形態において、空間オーディオ信号修正装置は、第1の方向パラメータφ(k,n)および第1の拡散パラメータψ(k,n)に依存した第2のパラメトリック空間オーディオ信号の第2のダウンミックス信号Wmod(k,n)を得るために、第1のパラメトリック空間オーディオ信号の第1のダウンミックスオーディオ信号W(k,n)を修正するように構成されたダウンミックス修正装置302を含む。ダウンミックス修正装置302の実施形態は、第1のダウンミックスオーディオ信号Wを、例えば、方程式(2)および(3)に基づいた第1の拡散パラメータψ(k,n)に依存している直接成分S(k,n)112aおよび拡散成分N(k,n)112bに分割するように構成されうる。
更なる実施形態において、ダウンミックス修正装置302は、直接成分の方向依存して重み付けされたバージョンを得るために、第1の方向に依存する関数H1(k,n,φ,d)を適用するように、および/または、拡散成分の方向依存して重み付けされたバージョンを得るために、第2の方向に依存する関数H2(k,n,φ,d)を拡散成分に適用するように構成される。ダウンミックス修正装置302は、更なる方向依存関数H1(k,n,φ,d)を直接成分に適用することによって、直接成分112aの方向依存して重み付けされたバージョンを生み出すように構成されうる。そして、その更なる方向依存関数は、第1の方向パラメータ114aが第1の方向パラメータの更に所定の中央範囲内にあるという場合に、直接成分112aを増加するように、および/または、第1の方向パラメータ114aが第2の方向パラメータの更なる所定の範囲の外にある場合に、直接成分112aを減少させるように、構成される。更なる実施形態においてさえ、ダウンミックス修正装置は、方向依存関数H2(k,n,φ,d)を拡散成分112bに適用することによって、拡散成分112bの方向依存して重み付けされたバージョンを生み出すように構成されうる。そして、その方向依存関数は、第1の方向パラメータ114aが第1の方向パラメータの所定の中央範囲内にある場合に、拡散成分を減少させるように、および/または、第1の方向パラメータ114aが第2の方向パラメータの所定の範囲の外にある場合に、拡散成分112bを増加させるように構成される。
他の実施形態において、ダウンミックス修正装置302は、直接の成分112aの方向依存して重み付けされたバージョンおよび拡散成分112bの方向依存して重み付けされたバージョンの組み合わせ、例えば和に基づく第2のダウンミックス信号212を得るように構成される。しかし、更なる実施形態は、修正されたダウンミックス信号212を得るために、2つの成分を合計することとは別のアルゴリズムを適用しうる。
上で説明したように、ダウンミックス修正装置302の実施形態は、2つの乗法子、すなわち(ψ)1/2および(1−ψ)1/2によって、拡散部分または成分112bおよび非拡散または直接の部分または成分112aに、ダウンミックス信号Wを分割して、フィルタ関数H1によって非拡散部分112aにフィルタをかけ、フィルタ関数H2によって拡散部分112bをフィルタにかけるように構成されうる。フィルタ関数H1またはH1(k,n,φ,d)は、時間/周波数インデックスk、n、最初の到来方向φおよびズームパラメータdに依存しうる。加えて、フィルタ関数H1は、拡散ψに依存しうる。フィルタ関数H2またはH2(k,n,φ,d)は、時間/周波数インデックスk、n、最初の到来方向φおよびズームパラメータdに依存しうる。加えて、フィルタ関数H2は、拡散ψに依存しうる。上で説明されたように、フィルタ関数H2は、到来方向φから独立して、図7に示されたようなサブカージオイドの窓として、または、単純な減衰率として、実行されることができる。
上記説明を参照すると、ズームパラメータdは、フィルタH1、H2およびモディファイヤーまたは関数fdおよびfpを制御するために使用されうる(図3A参照)。フィルタ関数H1およびfdに関して、ズームパラメータdは、適用された窓または中央領域の観察幅または角度幅γ(また、境界角度γとも呼ばれる)を制御することもできる。幅γは、例えばフィルタ関数が0dBを有する角度として、定められる(例えば図6の0dBの線を参照)。角度幅γおよび/または利得は、ズームパラメータdによって制御されうる。γに関する異なる値および異なる最大利得および最小利得の例は、図6に与えられる。
方向依存関数および重み付けが第1または最初の方向パラメータφに依存する(図3A参照)ことを特徴とする装置の実施形態が上で説明されたが、他の実施形態は、第2のまたは修正された拡散ψmodおよび/または第2のまたは修正された方向パラメータφmodに依存しているフィルタ関数H1およびH2の一方または両方を決定するように構成されうる。最初の方向パラメータφに対応し、(ズームインに関して)修正された方向パラメータφmodに対応する図4から決定できるように、ズーム比dが高いほど、対象Bが中心または正面の位置から、側面位置に、または、(図4に示されるよりさらに高いズーム比dの場合には)実質的に修正された位置の後ろの位置にさえ移動する。換言すれば、ズーム比dが高いほど、聴取者の前の領域にある位置を示している最初に小さい角度の大きさはより大きく増加する。ここで、より高い角度は、聴取者の横の領域の位置を示す。方向パラメータのこの修正は、図5Aに示すような関数を適用することによって考慮される。加えて、他のパラメータのための、そして、直接のおよび拡散成分のための方向に依存する窓または関数は、例えば図5Aに示すような到来方向または方向パラメータマッピングに対応する非線形な方法で、ズームdの増加と共に角度幅γを減少させることによって、最初の方向パラメータまたは角度の修正を考慮するように設計されうる。したがって、これらの方向に依存する窓または関数は、最初の方向パラメータが(例えば関数fpによる前もっての修正なしで)直接使用されるように、あるいは別な方法として、まず方向パラメータマッピングが実行されて、その後、修正された方向パラメータに基づいた方向に依存した重み付けfd、H1および/またはH2が同様の方法で実行されるように構成されうる。再度図4を参照すると、このように、最初の方向パラメータを直接参照する、示している方向依存関数fd、H1およびH2、または、修正された方向パラメータを参照する、示している方向依存関数fd、H1およびH2の両方とも可能である。
修正された方向パラメータを使用した実施形態は、最初の方向パラメータを使用している実施形態と同様に、異なるズーム比のための異なる角度幅および/または異なる利得を有する異なる窓、または、(方向パラメータが異なるズーム比を反映するためにすでにマップされているので)同じ角度幅および同じ利得を有する同じ窓、または同じ角度幅であるが利得が異なる窓を使用することができる。ここで、高いズーム比は、高い利得を生じさせる(図6の窓に類似)。
図3Bは、装置の更なる実施形態を示す。図3Bの空間オーディオ信号修正装置は、例えば、パラメータ修正装置301およびダウンミックス修正装置302を含む、またはそれらにより形成される。別の実施形態によれば、パラメータ修正装置301は、まず、修正された方向パラメータ214aを決定するために最初のパラメータ114aをまず処理し、次に、修正された方向パラメータφmodに依存した拡散パラメータψを処理し、図3Aに基づいて説明されたように、方程式(2)および(3)および最初の拡散パラメータψ、それぞれ114bを用いてダウンミックス信号112を分割し、修正された方向パラメータφmodを依存した方向依存フィルタリングH1およびH2を適用するように構成される。前に説明されるように、これらの修正は、時刻kおよび周波数インスタントnごとに、各修正された信号および/またはパラメータを得るために、時刻kおよび周波数ビンnごとに、実行される。
図3Bの装置300の他の別の実施形態によれば、パラメータ修正装置301は、修正された方向パラメータ214aを決定するために最初のパラメータ114aを処理し、最初の方向パラメータφまたは114aに依存した拡散パラメータψを処理し、修正された拡散パラメータψmodまたは214bを決定し、図3Aに基づいて説明されたように、方程式(2)および(3)および最初の拡散パラメータψを使用してダウンミックス信号112または114bを分割し、そして、修正された方向パラメータφmodまたは214aに方向依存するフィルタリングH1およびH2を適用するように構成される。
一実施形態によれば、図3Bの装置300は、制御信号402、例えば回転制御信号またはズーム制御信号に依存する第2のパラメトリック空間オーディオ信号の第2の方向パラメータ214aを得るために、第1のパラメトリック空間オーディオ信号の第1の方向パラメータ114aを変更するだけであるように構成される。聴取位置/方向の変更が回転だけを含み、平行移動またはズームを含まない場合、方向パラメータφ(k,n)114aの対応する修正またはシフトは充分である。対応する拡散パラメータおよびダウンミックス信号成分は、第2のダウンミックス信号212が第1のダウンミックス信号112に対応し、第2の拡散パラメータ214bが第1の拡散パラメータ114bに対応するように、修正されないままにされうる。
平行移動の変化、例えば、ズームが実行される場合、図5Aに示すように再マッピング関数による方向パラメータφ(k,n)114aの修正は、すでに音響体験を改善して、(拡散パラメータまたはダウンミックス信号を修正せずに)修正されていないまたは最初のパラメトリック空間オーディオ信号と比較して、オーディオ信号と、例えば、ビデオ信号との間のより良い同期を提供する。
更なる拡散パラメータ114bを修正することは、オーディオ体験を改善する、または、換言すれば、空間オーディオシーンの範囲内の変更位置に関して、音響体験の適合を改善する。従って、更なる実施形態において、装置300は、方向パラメータφ(k,n)および拡散パラメータψ(k,n)のみを修正するように構成され、後者は、修正された方向パラメータφmod(k,n)に依存し、ダウンミックス信号W(k,n)100を修正しない。
図3Bによる装置300の好ましい実施形態はまた、空間オーディオシーンの変更位置に関して更にオーディオ体験を改善するために、最初の拡散ψ(k,n)および修正された方向パラメータφmod(k,n)に依存して、ダウンミックス信号W(k,n)を変更することを含む。
従って、第1の方向パラメータφ(k,n)114aがベクトルである実施形態において、パラメータ修正装置301は、第2の方向パラメータφmod(k,n)214aを得るために、回転制御信号によって定められた方向に逆方向の回転制御信号によって定められた角度によって第1の方向パラメータをシフトするまたは修正するように構成される。
更なる実施形態において、パラメータ修正装置301は、ズーム制御信号402によって定められた第1の方向パラメータφ(k,n)およびズーム比dまたは変化信号によって定められた他の平行移動の制御情報に依存する第2の方向パラメータ214aを定めている(例えば、図5Aに示されるような)非線形マッピング関数を使用して第2の方向パラメータ214aを得るように構成される。
上述のように、更なる実施形態において、パラメータ修正装置301は、第2の方向パラメータφmod(k,n)214aに依存した第2の拡散パラメータψmod(k,n)214bを得るために、第1のパラメトリック空間オーディオ信号の第1の拡散パラメータψ(k,n)114bを変更するように構成されうる。パラメータ修正装置は、第2の方向パラメータφmod(k,n)が所定の中央範囲内、例えば、最初の0°方向を参照とした最初の参照方向の+/−30°内にある場合、第2の拡散パラメータψmod(k,n)を得るために、第1の拡散パラメータψ(k,n)を減少させるように、および/または、第2の方向パラメータφmod(k,n)が所定の中央範囲外、例えば、二次元の場合において0°の最初の参照方向から+30°および−30°により定められた中央範囲の外にある場合、第2の拡散パラメータψmod(k,n)を得るために、第1の拡散パラメータψ(k,n)を増加させるように構成された方向依存関数を使用して、第2の拡散パラメータψmod(k,n)を得るように構成される。
換言すれば、特定の実施形態において、パラメータ修正装置301、310bは、第2の方向パラメータ214aが所定の二次元または三次元の中央範囲の中心を形成している第1のまたは最初の聴取方向に関する第2の方向パラメータの所定の中央範囲内にある場合に、第2の拡散パラメータ214bを得るために、第1の拡散パラメータ114bを減少させるように、および/または、第2の方向パラメータ214aが所定の中央範囲の外にある場合に、第2の拡散パラメータを得るために、第1の拡散パラメータ114bを増加させるように構成された方向依存関数を使用して、第2の拡散パラメータ214bを得るように構成される。第1の聴取方向は、第2の方向パラメータの所定の中央範囲の中心、例えば0°を定める。ここで、所定の中央範囲の正および負の境界は、第1の聴取方向が二次元または三次元のベクトルであるかどうかと独立した二次元(例えば水平)面(例えば+/−30°)にある正および負の角度によって、または、三次元の第2の聴取方向中心の直円錐を定めている対応する角度(例えば30°)によって定められる。更なる実施形態は、第1の聴取方向または第1の聴取方向を定めているベクトル中心に配置される、対称および非対称の、異なる所定の中央領域を含みうる。
更なる実施形態において、方向依存関数fd(ψ)は、変化信号、例えば、ズーム制御信号に依存する。ここで、所定の中央範囲、中央範囲の負および正の境界(または一般に境界)を定めている各値は、平行移動変化が大きいほど、または、ズーム制御信号により定められたズーム比が高いほど、小さい。
更なる実施形態において、空間オーディオ信号修正装置は、第2の方向パラメータφmod(k,n)および第1の拡散パラメータψ(k,n)に依存した第2のパラメトリック空間オーディオ信号の第2のダウンミックス信号Wmod(k,n)を得るために、第1のパラメトリック空間オーディオ信号の第1のダウンミックスオーディオ信号W(k,n)を修正するように構成されたダウンミックス修正装置302を含む。ダウンミックス修正装置302の実施形態は、第1のダウンミックスオーディオ信号Wを、例えば、方程式(2)および(3)に基づいた第1の拡散パラメータψ(k,n)に依存している直接成分S(k,n)112aおよび拡散成分N(k,n)112bに分割するように構成されうる。
更なる実施形態において、ダウンミックス修正装置302は、直接成分の方向依存して重み付けされたバージョンを得るために第1の方向依存関数H1を適用するように、および/または、拡散成分の方向依存して重み付けされたバージョンを得るために、第2の方向依存関数H2を拡散成分に適用するように構成される。ダウンミックス修正装置302は、更なる方向依存関数H1を直接の成分に適用することによって、直接の成分112aの方向に依存して重み付けされたバージョンを生み出すように構成されうる。そして、その更なる方向依存関数は、第2の方向パラメータ214aが第2の方向パラメータの更に所定の範囲内にある場合に、直接成分112aを増加させるように、および/または、第2の方向パラメータ214aが第2の方向パラメータの更に所定の中央範囲外にある場合に、直接成分112aを減少させるように構成される。更なる実施形態において、ダウンミックス修正装置は、方向依存関数H2を拡散成分112bに適用することによって、拡散成分112bの方向依存して重み付けされたバージョンを生み出すように構成されうる。そして、その方向依存関数は、第2の方向パラメータ214aが第2の方向パラメータの所定の範囲内にある場合に、拡散成分112bを減少させるように、および/または、第2の方向パラメータ214aが第2の方向パラメータの所定の中央範囲外にある場合に、拡散成分112bを増加させるように構成される。
他の実施態様において、ダウンミックス修正装置302は、直接成分112aの方向依存して重み付けされたバージョンおよび拡散成分112bの方向依存して重み付けされたバージョンの組合せ、例えば和に基づいて、第2のダウンミックス信号を得るように構成される。しかし、更なる実施形態は、修正されたダウンミックス信号212を得るために、2つの成分を合計することとは別のアルゴリズムを適用しうる。
前に説明されたように、図3Bのダウンミックス修正装置302の実施形態は、2つの乗法子、すなわち(ψ)1/2および(1−ψ)1/2によって拡散の部分または成分112bおよび非拡散または直接の部分または成分112aに、ダウンミックス信号Wを分けて、フィルタ関数H1によって非拡散部分112aにフィルタをかけて、フィルタ関数H2によって拡散部分112bにフィルタをかけるように構成されうる。フィルタ関数H1またはH1(φ,ψ)は、時間/周波数インデックスk、n、修正された到来方向およびズームパラメータdに依存しうる。加えて、フィルタ関数H1は、拡散ψに依存しうる。フィルタ関数H2またはH2(φ,ψ)は、時間/周波数インデックスk、n、最初の到来方向φおよびズームパラメータdに依存していることがありえる。フィルタ関数H2またはH2(φ,ψ)は、加えて、拡散ψに依存しうる。前に説明されたように、フィルタ関数H2は、図7で示すようなサブカージオイドの窓として、または、修正された到来方向φmodから独立した単純な減衰率として実行されうる。
上記説明を参照すると、図3Bの実施形態においても同様に、ズームパラメータdは、フィルタH1、H2およびモディファイヤーまたは関数fdおよびfpを制御するために使用されうる。フィルタ関数H1およびfdに関して、ズームパラメータdはまた、適用された窓または中央領域の角度幅γ(また、境界角度γとも呼ばれる)を制御できる。幅γは、例えばフィルタ関数が(図6の0dBの線に類似して)0dBを有する角度として、定められる。角度幅γおよび/または利得は、ズームパラメータdによって制御されうる。一般に、図3Aの実施形態に関して与えられた説明が、同じ方法で、または、少なくとも類似した方法で図3Bの実施形態に適用される点に留意する必要がある。
以下に、本発明の実施形態が、知覚された音像をビデオカメラのズーム制御に合わせることによってジョイントビデオ/オーディオ再生の改善された体験に導く典型的なアプリケーションが説明される。
テレビ会議において、自動的にカメラを活発発言者(active speaker)に向けることは、最新の技術である。これは、通常、話者へのズーミングクロッサによって接続する。音響は、従来、ピクチャに整合されない。本発明の実施形態はまた、音響的に、活発発言者へのズーミングインの可能性を提供する。これは、ピクチャだけがフォーカスにおいて変化するだけでなく、音響も、注意の所望の変化に整合するので、全体の印象が遠隔ユーザにとってより現実的であるということだった。要するに、音響キューは、視覚キューに対応する。
例えば、家庭用娯楽機器のために、最新のビデオカメラは、サラウンドサウンドを録音できて、強力な光学ズームを備えている。しかしながら、録音された空間音響は、カメラの実際の位置、しかるに、カメラ自体に搭載されたマイクロホンの実際の位置に依存するだけであるので、光学ズームと録音された音響間の知覚的な同等の相互関係はない。クローズアップモードで撮影されたシーンの場合、本発明は、音像をそれに応じて調整することを可能にする。このことは、音響がピクチャとともにズームされるようなより自然で矛盾のない消費者体験につながる。
最初のマイクロホン信号がビデオとともに変化されずに録音され、更なる処理がなされなかった場合に、本発明はまた後処理段階において適用されうること言及される必要がある。最初のズーム長が分かっていなくても、本発明は、創造的なオーディオ−ヴィジュアル後処理ツールボックスにおいて使用されることができる。任意のズーム長は選択されえ、そして、音響のズームは、ピクチャを整合するために、ユーザに向けられうる。あるいは、ユーザは、自分自身の好ましい空間効果をつくることができる。いずれにせよ、最初のマイクロホン録音位置は、ユーザが定めた仮想録音位置に変えられる。
本発明の方法の特定の実施態様の要求事項に応じて、本発明の方法は、ハードウェアにおいて、または、ソフトウェアにおいて実行できる。その実施態様は、本発明の方法の実施形態が実行されるように、プログラミング可能な計算機システムと協動するその上に格納された電子的に読み込み可能な制御信号を有するデジタル記憶媒体、特に、ディスク、CD、DVDまたはブルーレイ・ディスクを使用して実行できる。通常、本発明の実施形態は、従って、機械で読み取り可能なキャリアに格納されたプログラムコードによってつくられたコンピュータプログラムである。そして、コンピュータプログラム製品がコンピュータ上で動作するときに、プログラムコードが本発明の方法を実行するように作動する。換言すれば、コンピュータプログラムがコンピュータ上で動作するときに、本発明の方法の実施形態は、従って、本発明の方法のうちの少なくとも1つを実行するためのプログラムコードを有するコンピュータプログラムである。
前述のことは、特にその特定の実施形態に関して、図と共に記載された。形態および詳細におけるさまざまな他の変形がその趣旨および範囲から逸脱することなく、なされうることは、当業者によって理解されるだろう。従って、さまざまな変形が本願明細書において開示され、続く請求項によって理解されるより広い構想から逸脱することなく、様々な実施形態を適応させる際になされることができると理解される。

Claims (18)

  1. 空間オーディオシーンにおける第1の聴取位置または第1の聴取方向を示している第1のパラメトリック空間オーディオ信号(112、114)を、第2の聴取位置または第2の聴取方向を示している第2のパラメトリック空間オーディオ信号(212、214)に変換するための装置(300)であって、前記装置は、
    前記第2のパラメトリック空間オーディオ信号(212、214)を得るために、前記第1の聴取位置または前記第1の聴取方向の変化に依存して、前記第1のパラメトリック空間オーディオ信号(112、114)を修正するように構成された空間オーディオ信号修正装置(301、302)であって、前記第2の聴取位置または前記第2の聴取方向は、前記変化によって変更された前記第1の聴取位置または前記第1の聴取方向に対応することを特徴とする空間オーディオ信号修正装置(301、302)を含むことを特徴とする、装置。
  2. 前記空間オーディオ信号修正装置(301、302)は、
    前記変化に対応している情報を供給している制御信号(402)に依存して、前記第2のパラメトリック空間オーディオ信号(212、214)の第2の方向パラメータ(214a)を得るために、前記第1のパラメトリック空間オーディオ信号(112、114)の第1の方向パラメータ(114a)を修正するように構成されたパラメータ修正装置(301、301a)を含むことを特徴とする、請求項1に記載の装置。
  3. 前記第1の方向パラメータ(114a)および前記第2の方向パラメータ(214a)は、二次元または三次元ベクトルであることを特徴とする、請求項2に記載の装置。
  4. 前記第1の方向パラメータ(114a)は、ベクトルであること、前記制御信号は、回転角および回転方向を定めている回転制御信号であること、および、前記パラメータ修正装置(301、301a)は、前記第2の方向パラメータ(214a)を得るために、前記回転方向と逆方向に、前記回転角だけ前記ベクトルを回転させるように構成されることを特徴とする、請求項2又は請求項3に記載の装置。
  5. 前記制御信号は、前記第1の聴取方向の平行移動(d)を定めている平行移動制御信号(402)であること、前記パラメータ修正装置(301、301a)は、前記第1の方向パラメータ(114a)、および前記制御信号によって定められた前記平行移動(d)に依存して、前記第2の方向パラメータを定めている非線形のマッピング関数(fp)を用いて、前記第2の方向パラメータ(214a)を得るように構成されることを特徴とする、請求項2〜請求項4のいずれか一項に記載の装置。
  6. 前記制御信号は、前記第1の聴取方向のズーム比(d)を定めているズーム制御信号(402)であること、前記パラメータ修正装置(301、301a)は、前記第1の方向パラメータ(114a)、および前記ズーム制御信号によって定められた前記ズーム比(d)に依存して、前記第2の方向パラメータを定めている非線形のマッピング関数(fp)を用いて、前記第2の方向パラメータ(214a)を得るように構成されることを特徴とする、請求項2〜請求項4のいずれか一項に記載の装置。
  7. 前記パラメータ修正装置(301、301b)は、前記第1の方向パラメータ(114a)に依存して、または、前記第2の方向パラメータ(214a)に依存して、前記第2のパラメトリック空間オーディオ信号の第2の拡散パラメータ(214b)を得るために、前記第1のパラメトリック空間オーディオ信号の第1の拡散パラメータ(114b)を修正するように構成されることを特徴とする、請求項2〜請求項6のいずれか一項に記載の装置。
  8. 前記パラメータ修正装置(301、310b)は、前記第1の方向パラメータ(114a)が、前記第1の方向パラメータの所定の中央範囲内にある場合に、前記第2の拡散パラメータ(214b)を得るために、前記第1の拡散パラメータ(114b)を減少させるように、および/または、前記第1の方向パラメータ(114a)が、前記所定の中央範囲の外にある場合に、前記第2の拡散パラメータを得るために、前記第1の拡散パラメータ(114b)を増加させるように適合された方向依存関数(fd)を使用して、前記第2の拡散パラメータ(214b)を得るように構成されること、または、
    前記パラメータ修正装置(301、310b)は、前記第2の方向パラメータ(214a)が、前記第2の方向パラメータの所定の中央範囲内にある場合に、前記第2の拡散パラメータ(214b)を得るために、前記第1の拡散パラメータ(114b)を減少させるように、および/または、前記第2の方向パラメータ(214a)が、前記所定の中央範囲の外にある場合に、前記第2の拡散パラメータを得るために、前記第1の拡散パラメータ(114b)を増加させるように適合された方向依存関数(fd)を使用して、前記第2の拡散パラメータ(214b)を得るように構成されることを特徴とする、請求項7に記載の装置。
  9. 前記制御信号は、前記第1の聴取方向の平行移動(d)を定めている平行移動制御信号(402)であること、前記方向依存関数は、前記平行移動に依存すること、および、前記所定の中央範囲は、前記平行移動制御信号によって定められた前記平行移動が大きいほど、小さいことを特徴とする、または、前記制御信号は、前記第1の聴取方向のズームを定めているズーム制御信号(402)であること、前記方向依存関数は、前記ズームに依存すること、および、前記所定の中央範囲は、前記ズーム制御信号によって定められたズーム比(d)が大きいほど、小さいことを特徴とする、請求項8に記載の装置。
  10. 前記空間オーディオ信号修正装置(300)は、
    前記第1の方向パラメータ(114a)および/または前記第1の拡散パラメータ(114b)に依存して、前記第2のパラメトリック空間オーディオ信号の第2のダウンミックス信号(212)を得るために、前記第1のパラメトリック空間オーディオ信号の第1のダウンミックスオーディオ信号(112)を修正するように構成されたダウンミックス修正装置(302)、または、
    前記第2の方向パラメータ(214a)および/または前記第1の拡散パラメータ(114b)に依存して、前記第2のパラメトリック空間オーディオ信号の前記第2のダウンミックス信号(212)を得るために、前記第1のパラメトリック空間オーディオ信号の前記第1のダウンミックスオーディオ信号(112)を修正するように構成されたダウンミックス修正装置(302)を含むことを特徴とする、請求項7〜請求項9のいずれか一項に記載の装置。
  11. 前記ダウンミックス修正装置(302)は、前記第1の拡散パラメータ(114b)に依存して、前記第1のダウンミックスオーディオ信号(112)から直接成分(112a)を、および/または、第1のダウンミックスオーディオ信号(112)から拡散成分(112b)を得るように構成されることを特徴とする、請求項10に記載の装置。
  12. Figure 2013514696
  13. 前記ダウンミックス修正装置(302)は、前記直接成分(112a)の方向依存して重み付けされたバージョン、前記拡散成分(112b)の方向依存して重み付けされたバージョンに基づいて、または、前記直接成分(112a)の前記方向依存して重み付けされたバージョンと前記拡散成分(112b)の前記方向依存して重み付けされたバージョンの組合せに基づいて、前記第2のダウンミックス信号(212)を得るように構成されることを特徴とする、請求項11又は請求項12に記載の装置。
  14. 前記ダウンミックス修正装置(302)は、前記直接成分に更なる方向依存関数(H1)を適用することによって、前記直接成分(112a)の前記方向依存して重み付けされたバージョンを生み出すように構成され、前記更なる方向依存関数は、前記第1の方向パラメータ(114a)が前記第1の方向パラメータの更なる所定の中央範囲内にある場合に、前記直接成分(112a)を増加させるように、および/または、前記第1の方向パラメータ(114a)が前記第1の方向パラメータの前記更なる所定の範囲の外にある場合に、前記直接成分(112a)を減少させるように構成されることを特徴とする、請求項13に記載の装置。
  15. 前記ダウンミックス修正装置は、方向依存関数(H2)を前記拡散成分(112b)に適用することによって、前記拡散成分(112b)の前記方向依存して重み付けされたバージョンを生み出すように構成され、
    前記方向依存関数は、前記第1の方向パラメータ(114a)が前記第1の方向パラメータの所定の中央範囲内にある場合に、前記拡散成分を減少させるように、および/または、前記第1の方向パラメータ(114a)が前記第1の方向パラメータの前記所定の範囲の外にある場合に、前記拡散成分(112b)を増加させるように構成されること、または、
    前記方向依存関数は、前記第2の方向パラメータ(214a)が前記第2の方向パラメータの所定の中央範囲内にある場合に、前記拡散成分を減少させるように、および/または、前記第2の方向パラメータ(214a)が前記第2の方向パラメータの前記所定の範囲の外にある場合に、前記拡散成分(112b)を増加させるように構成されることを特徴とする、請求項13又は請求項14に記載の装置。
  16. 請求項1〜請求項15のいずれか一項に記載の装置、および、
    前記装置がビデオカメラに接続されて、制御信号としてビデオ回転またはビデオズーム信号を受けるように構成される前記ビデオカメラを含むことを特徴とする、システム。
  17. 空間オーディオシーンにおける第1の聴取位置または第1の聴取方向を示している第1のパラメトリック空間オーディオ信号(112、114)を、第2の聴取位置または第2の聴取方向を示している第2のパラメトリック空間オーディオ信号(212、214)に変換する方法であって、前記方法は、
    前記第2のパラメトリック空間オーディオ信号を得るために、前記第1の聴取位置または前記第1の聴取方向の変化に依存して、前記第1のパラメトリック空間オーディオ信号を修正するステップであって、前記第2の聴取位置または前記第2の聴取方向が、前記変化によって変更された前記第1の聴取位置または前記第1の聴取方向に対応するステップを含むことを特徴とする、前記方法。
  18. プログラムがコンピュータ上で動作するときに、請求項17に記載の方法を実行するためのプログラムコードを有する前記コンピュータプログラム。
JP2012543696A 2009-12-17 2010-12-14 第1のパラメトリック空間オーディオ信号を第2のパラメトリック空間オーディオ信号に変換する装置および方法 Active JP5426035B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US28759609P 2009-12-17 2009-12-17
US61/287,596 2009-12-17
EP10156263.5 2010-03-11
EP10156263A EP2346028A1 (en) 2009-12-17 2010-03-11 An apparatus and a method for converting a first parametric spatial audio signal into a second parametric spatial audio signal
PCT/EP2010/069669 WO2011073210A1 (en) 2009-12-17 2010-12-14 An apparatus and a method for converting a first parametric spatial audio signal into a second parametric spatial audio signal

Publications (2)

Publication Number Publication Date
JP2013514696A true JP2013514696A (ja) 2013-04-25
JP5426035B2 JP5426035B2 (ja) 2014-02-26

Family

ID=43748019

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012543696A Active JP5426035B2 (ja) 2009-12-17 2010-12-14 第1のパラメトリック空間オーディオ信号を第2のパラメトリック空間オーディオ信号に変換する装置および方法

Country Status (15)

Country Link
US (1) US9196257B2 (ja)
EP (2) EP2346028A1 (ja)
JP (1) JP5426035B2 (ja)
KR (1) KR101431934B1 (ja)
CN (1) CN102859584B (ja)
AR (1) AR079517A1 (ja)
AU (1) AU2010332934B2 (ja)
BR (1) BR112012015018B1 (ja)
CA (1) CA2784862C (ja)
ES (1) ES2592217T3 (ja)
HK (1) HK1176733A1 (ja)
MX (1) MX2012006979A (ja)
RU (1) RU2586842C2 (ja)
TW (1) TWI523545B (ja)
WO (1) WO2011073210A1 (ja)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014523172A (ja) * 2011-06-30 2014-09-08 トムソン ライセンシング 高次Ambisonics表現に含まれるサウンドオブジェクトの相対位置を変更する方法と装置
JP2016502797A (ja) * 2012-11-15 2016-01-28 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 複数のパラメトリック・オーディオ・ストリームを発生するための装置及び方法、並びに複数のラウドスピーカ信号を発生するための装置及び方法
JP2017517947A (ja) * 2014-05-05 2017-06-29 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ インフォームド空間のフィルタリングに基づく矛盾しない音響場面再生のためのシステムおよび装置および方法
KR20190140913A (ko) * 2017-04-25 2019-12-20 소니 주식회사 신호 처리 장치 및 방법, 및 프로그램
JP2020527887A (ja) * 2017-07-14 2020-09-10 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 深度拡張DirAC技術またはその他の技術を使用して、拡張音場記述または修正音場記述を生成するための概念
JP2020527746A (ja) * 2017-07-14 2020-09-10 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン マルチポイント音場記述を使用して拡張音場記述または修正音場記述を生成するためのコンセプト
JP2021503628A (ja) * 2017-11-17 2021-02-12 フラウンホファー ゲセルシャフト ツール フェールデルンク ダー アンゲヴァンテン フォルシュンク エー.ファオ. 量子化とエントロピーコーディングとを使用して指向性オーディオコーディングパラメータを符号化または復号するための装置および方法
JP2021507558A (ja) * 2017-12-18 2021-02-22 ドルビー・インターナショナル・アーベー 仮想現実環境における聴取位置間のローカル遷移を扱う方法およびシステム
US11153704B2 (en) 2017-07-14 2021-10-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Concept for generating an enhanced sound-field description or a modified sound field description using a multi-layer description
JP2022536169A (ja) * 2019-06-11 2022-08-12 ノキア テクノロジーズ オサケユイチア 音場関連レンダリング
JP2022537513A (ja) * 2019-06-11 2022-08-26 ノキア テクノロジーズ オサケユイチア 音場関連レンダリング
JP2022547253A (ja) * 2019-07-08 2022-11-11 ディーティーエス・インコーポレイテッド 不一致視聴覚捕捉システム
KR102656969B1 (ko) 2019-07-08 2024-04-11 디티에스, 인코포레이티드 불일치 오디오 비주얼 캡쳐 시스템

Families Citing this family (64)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101619578B1 (ko) 2010-12-03 2016-05-18 프라운호퍼-게젤샤프트 츄어 푀르더룽 데어 안게반텐 포르슝에.파우. 기하학 기반의 공간 오디오 코딩을 위한 장치 및 방법
EP2727380B1 (en) * 2011-07-01 2020-03-11 Dolby Laboratories Licensing Corporation Upmixing object based audio
EP2600343A1 (en) * 2011-12-02 2013-06-05 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for merging geometry - based spatial audio coding streams
US9047863B2 (en) 2012-01-12 2015-06-02 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for criticality threshold control
WO2013108200A1 (en) * 2012-01-19 2013-07-25 Koninklijke Philips N.V. Spatial audio rendering and encoding
WO2013186593A1 (en) 2012-06-14 2013-12-19 Nokia Corporation Audio capture apparatus
CN104471641B (zh) 2012-07-19 2017-09-12 杜比国际公司 用于改善对多声道音频信号的呈现的方法和设备
WO2014052429A1 (en) 2012-09-27 2014-04-03 Dolby Laboratories Licensing Corporation Spatial multiplexing in a soundfield teleconferencing system
JP6031930B2 (ja) * 2012-10-02 2016-11-24 ソニー株式会社 音声処理装置および方法、プログラム並びに記録媒体
CN103021414B (zh) * 2012-12-04 2014-12-17 武汉大学 一种三维音频系统距离调制方法
EP2757559A1 (en) * 2013-01-22 2014-07-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for spatial audio object coding employing hidden objects for signal mixture manipulation
US10635383B2 (en) 2013-04-04 2020-04-28 Nokia Technologies Oy Visual audio processing apparatus
CN104244164A (zh) * 2013-06-18 2014-12-24 杜比实验室特许公司 生成环绕立体声声场
EP3933834A1 (en) 2013-07-05 2022-01-05 Dolby International AB Enhanced soundfield coding using parametric component generation
GB2521649B (en) 2013-12-27 2018-12-12 Nokia Technologies Oy Method, apparatus, computer program code and storage medium for processing audio signals
US9866986B2 (en) 2014-01-24 2018-01-09 Sony Corporation Audio speaker system with virtual music performance
JP6513703B2 (ja) 2014-05-13 2019-05-15 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 辺フェージング振幅パンニングのための装置および方法
WO2015178949A1 (en) * 2014-05-19 2015-11-26 Tiskerling Dynamics Llc Using the location of a near-end user in a video stream to adjust audio settings of a far-end system
MX2017006581A (es) 2014-11-28 2017-09-01 Sony Corp Dispositivo de transmision, metodo de transmision, dispositivo de recepcion, y metodo de recepcion.
US9602946B2 (en) 2014-12-19 2017-03-21 Nokia Technologies Oy Method and apparatus for providing virtual audio reproduction
WO2016123572A1 (en) * 2015-01-30 2016-08-04 Dts, Inc. System and method for capturing, encoding, distributing, and decoding immersive audio
US9924291B2 (en) * 2016-02-16 2018-03-20 Sony Corporation Distributed wireless speaker system
KR102617476B1 (ko) * 2016-02-29 2023-12-26 한국전자통신연구원 분리 음원을 합성하는 장치 및 방법
US9826330B2 (en) 2016-03-14 2017-11-21 Sony Corporation Gimbal-mounted linear ultrasonic speaker assembly
KR102561371B1 (ko) 2016-07-11 2023-08-01 삼성전자주식회사 디스플레이장치와, 기록매체
US9794724B1 (en) 2016-07-20 2017-10-17 Sony Corporation Ultrasonic speaker assembly using variable carrier frequency to establish third dimension sound locating
MC200185B1 (fr) 2016-09-16 2017-10-04 Coronal Audio Dispositif et procédé de captation et traitement d'un champ acoustique tridimensionnel
US10187740B2 (en) * 2016-09-23 2019-01-22 Apple Inc. Producing headphone driver signals in a digital audio signal processing binaural rendering environment
MC200186B1 (fr) 2016-09-30 2017-10-18 Coronal Encoding Procédé de conversion, d'encodage stéréophonique, de décodage et de transcodage d'un signal audio tridimensionnel
EP3340648B1 (en) 2016-12-23 2019-11-27 Nxp B.V. Processing audio signals
WO2018132385A1 (en) * 2017-01-12 2018-07-19 Pcms Holdings, Inc. Audio zooming in natural audio video content service
KR20180090022A (ko) * 2017-02-02 2018-08-10 한국전자통신연구원 다중 전방향 카메라 및 마이크 기반 가상현실 제공 방법 및 가상 현실 제공 방법을 수행하는 음향 신호 처리 장치 및 영상 신호 처리 장치
CN110463226B (zh) * 2017-03-14 2022-02-18 株式会社理光 声音记录设备,声音系统,声音记录方法和载体装置
WO2018180531A1 (ja) * 2017-03-28 2018-10-04 ソニー株式会社 情報処理装置、情報処理方法、およびプログラム
GB2561595A (en) * 2017-04-20 2018-10-24 Nokia Technologies Oy Ambience generation for spatial audio mixing featuring use of original and extended signal
GB2562518A (en) 2017-05-18 2018-11-21 Nokia Technologies Oy Spatial audio processing
US10299039B2 (en) 2017-06-02 2019-05-21 Apple Inc. Audio adaptation to room
GB2563635A (en) 2017-06-21 2018-12-26 Nokia Technologies Oy Recording and rendering audio signals
US11004567B2 (en) 2017-08-15 2021-05-11 Koko Home, Inc. System and method for processing wireless backscattered signal using artificial intelligence processing for activities of daily life
US10412482B2 (en) 2017-11-08 2019-09-10 Merry Electronics (Shenzhen) Co., Ltd. Loudspeaker apparatus
US11082662B2 (en) 2017-12-19 2021-08-03 Koninklijke Kpn N.V. Enhanced audiovisual multiuser communication
USD885366S1 (en) 2017-12-27 2020-05-26 Yandex Europe Ag Speaker device
RU2707149C2 (ru) * 2017-12-27 2019-11-22 Общество С Ограниченной Ответственностью "Яндекс" Устройство и способ модифицирования вывода аудиосигнала устройства
GB201800918D0 (en) 2018-01-19 2018-03-07 Nokia Technologies Oy Associated spatial audio playback
CN109492126B (zh) * 2018-11-02 2022-03-01 廊坊市森淼春食用菌有限公司 一种智能交互方法及装置
GB201818959D0 (en) 2018-11-21 2019-01-09 Nokia Technologies Oy Ambience audio representation and associated rendering
US10810850B2 (en) 2019-02-19 2020-10-20 Koko Home, Inc. System and method for state identity of a user and initiating feedback using multiple sources
GB2586586A (en) * 2019-08-16 2021-03-03 Nokia Technologies Oy Quantization of spatial audio direction parameters
GB2586461A (en) 2019-08-16 2021-02-24 Nokia Technologies Oy Quantization of spatial audio direction parameters
USD947152S1 (en) 2019-09-10 2022-03-29 Yandex Europe Ag Speaker device
GB2587335A (en) * 2019-09-17 2021-03-31 Nokia Technologies Oy Direction estimation enhancement for parametric spatial audio capture using broadband estimates
US11719804B2 (en) 2019-09-30 2023-08-08 Koko Home, Inc. System and method for determining user activities using artificial intelligence processing
EP3849202B1 (en) 2020-01-10 2023-02-08 Nokia Technologies Oy Audio and video processing
US11443737B2 (en) 2020-01-14 2022-09-13 Sony Corporation Audio video translation into multiple languages for respective listeners
US11240635B1 (en) * 2020-04-03 2022-02-01 Koko Home, Inc. System and method for processing using multi-core processors, signals, and AI processors from multiple sources to create a spatial map of selected region
US11184738B1 (en) 2020-04-10 2021-11-23 Koko Home, Inc. System and method for processing using multi core processors, signals, and AI processors from multiple sources to create a spatial heat map of selected region
WO2022020365A1 (en) * 2020-07-20 2022-01-27 Orbital Audio Laboratories, Inc. Multi-stage processing of audio signals to facilitate rendering of 3d audio via a plurality of playback devices
BR112023006087A2 (pt) * 2020-10-09 2023-05-09 Fraunhofer Ges Forschung Aparelho, método ou programa de computador para processar uma cena de áudio codificada usando um parâmetro de suavização
CA3194876A1 (en) * 2020-10-09 2022-04-14 Franz REUTELHUBER Apparatus, method, or computer program for processing an encoded audio scene using a bandwidth extension
MX2023003962A (es) * 2020-10-09 2023-05-25 Fraunhofer Ges Forschung Aparato, metodo, o programa de computadora para procesar una escena de audio codificada utilizando una conversion de parametros.
US20240064485A1 (en) * 2020-11-30 2024-02-22 The Regents Of The University Of California Systems and methods for sound-enhanced meeting platforms
CN115472170A (zh) * 2021-06-11 2022-12-13 华为技术有限公司 一种三维音频信号的处理方法和装置
GB2614254A (en) * 2021-12-22 2023-07-05 Nokia Technologies Oy Apparatus, methods and computer programs for generating spatial audio output
CN115086861B (zh) * 2022-07-20 2023-07-28 歌尔股份有限公司 音频处理方法、装置、设备及计算机可读存储介质

Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03114000A (ja) * 1989-09-27 1991-05-15 Nippon Telegr & Teleph Corp <Ntt> 音声再生方式
JPH07288899A (ja) * 1994-04-15 1995-10-31 Matsushita Electric Ind Co Ltd 音場再生装置
JPH07312712A (ja) * 1994-05-19 1995-11-28 Sanyo Electric Co Ltd ビデオカメラ及び再生装置
JPH09121400A (ja) * 1995-10-24 1997-05-06 Nippon Hoso Kyokai <Nhk> 奥行方向音響再生装置及び立体音響再生装置
JP2002207488A (ja) * 2001-01-01 2002-07-26 Junichi Kakumoto 音響と画像の臨場感を表現し伝達する方式
JP2003244800A (ja) * 2002-02-14 2003-08-29 Matsushita Electric Ind Co Ltd 音像定位装置
JP2003284196A (ja) * 2002-03-20 2003-10-03 Sony Corp 音像定位信号処理装置および音像定位信号処理方法
JP2004312355A (ja) * 2003-04-07 2004-11-04 Yamaha Corp 音場制御装置
JP2005311604A (ja) * 2004-04-20 2005-11-04 Sony Corp 情報処理装置及び情報処理装置に用いるプログラム
JP2006050241A (ja) * 2004-08-04 2006-02-16 Matsushita Electric Ind Co Ltd 復号化装置
JP2006074386A (ja) * 2004-09-01 2006-03-16 Fujitsu Ltd 立体音響再生方法、通信装置及びプログラム
JP2007201818A (ja) * 2006-01-26 2007-08-09 Sony Corp オーディオ信号処理装置、オーディオ信号処理方法及びオーディオ信号処理プログラム
JP2007533221A (ja) * 2004-04-16 2007-11-15 コーディング テクノロジーズ アクチボラゲット 低ビットレート用パラメトリック表現の生成方法
WO2008113428A1 (en) * 2007-03-21 2008-09-25 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method and apparatus for conversion between multi-channel audio formats
WO2009039897A1 (en) * 2007-09-26 2009-04-02 Fraunhofer - Gesellschaft Zur Förderung Der Angewandten Forschung E.V. Apparatus and method for extracting an ambient signal in an apparatus and method for obtaining weighting coefficients for extracting an ambient signal and computer program
JP2009524104A (ja) * 2006-01-19 2009-06-25 エルジー エレクトロニクス インコーポレイティド 信号デコーディング方法及び装置

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4984087A (en) * 1988-05-27 1991-01-08 Matsushita Electric Industrial Co., Ltd. Microphone apparatus for a video camera
GB2374507B (en) * 2001-01-29 2004-12-29 Hewlett Packard Co Audio user interface with audio cursor
SE527670C2 (sv) * 2003-12-19 2006-05-09 Ericsson Telefon Ab L M Naturtrogenhetsoptimerad kodning med variabel ramlängd
US20090299756A1 (en) 2004-03-01 2009-12-03 Dolby Laboratories Licensing Corporation Ratio of speech to non-speech audio such as for elderly or hearing-impaired listeners
SE0402650D0 (sv) 2004-11-02 2004-11-02 Coding Tech Ab Improved parametric stereo compatible coding of spatial audio
US7751572B2 (en) 2005-04-15 2010-07-06 Dolby International Ab Adaptive residual audio coding
TWI330992B (en) 2005-10-20 2010-09-21 Lg Electronics Inc Method for encoding and decoding multi-channel audio signal and apparatus thereof
BRPI0707969B1 (pt) 2006-02-21 2020-01-21 Koninklijke Philips Electonics N V codificador de áudio, decodificador de áudio, método de codificação de áudio, receptor para receber um sinal de áudio, transmissor, método para transmitir um fluxo de dados de saída de áudio, e produto de programa de computador
TW200742275A (en) 2006-03-21 2007-11-01 Dolby Lab Licensing Corp Low bit rate audio encoding and decoding in which multiple channels are represented by fewer channels and auxiliary information
KR101120909B1 (ko) * 2006-10-16 2012-02-27 프라운호퍼-게젤샤프트 츄어 푀르더룽 데어 안게반텐 포르슝에.파우. 멀티 채널 파라미터 변환 장치, 방법 및 컴퓨터로 판독가능한 매체
US20080298610A1 (en) * 2007-05-30 2008-12-04 Nokia Corporation Parameter Space Re-Panning for Spatial Audio
US8180062B2 (en) * 2007-05-30 2012-05-15 Nokia Corporation Spatial sound zooming
JP5752414B2 (ja) 2007-06-26 2015-07-22 コーニンクレッカ フィリップス エヌ ヴェ バイノーラル型オブジェクト指向オーディオデコーダ

Patent Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03114000A (ja) * 1989-09-27 1991-05-15 Nippon Telegr & Teleph Corp <Ntt> 音声再生方式
JPH07288899A (ja) * 1994-04-15 1995-10-31 Matsushita Electric Ind Co Ltd 音場再生装置
JPH07312712A (ja) * 1994-05-19 1995-11-28 Sanyo Electric Co Ltd ビデオカメラ及び再生装置
JPH09121400A (ja) * 1995-10-24 1997-05-06 Nippon Hoso Kyokai <Nhk> 奥行方向音響再生装置及び立体音響再生装置
JP2002207488A (ja) * 2001-01-01 2002-07-26 Junichi Kakumoto 音響と画像の臨場感を表現し伝達する方式
JP2003244800A (ja) * 2002-02-14 2003-08-29 Matsushita Electric Ind Co Ltd 音像定位装置
JP2003284196A (ja) * 2002-03-20 2003-10-03 Sony Corp 音像定位信号処理装置および音像定位信号処理方法
JP2004312355A (ja) * 2003-04-07 2004-11-04 Yamaha Corp 音場制御装置
JP2007533221A (ja) * 2004-04-16 2007-11-15 コーディング テクノロジーズ アクチボラゲット 低ビットレート用パラメトリック表現の生成方法
JP2005311604A (ja) * 2004-04-20 2005-11-04 Sony Corp 情報処理装置及び情報処理装置に用いるプログラム
JP2006050241A (ja) * 2004-08-04 2006-02-16 Matsushita Electric Ind Co Ltd 復号化装置
JP2006074386A (ja) * 2004-09-01 2006-03-16 Fujitsu Ltd 立体音響再生方法、通信装置及びプログラム
JP2009524104A (ja) * 2006-01-19 2009-06-25 エルジー エレクトロニクス インコーポレイティド 信号デコーディング方法及び装置
JP2007201818A (ja) * 2006-01-26 2007-08-09 Sony Corp オーディオ信号処理装置、オーディオ信号処理方法及びオーディオ信号処理プログラム
WO2008113428A1 (en) * 2007-03-21 2008-09-25 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method and apparatus for conversion between multi-channel audio formats
WO2009039897A1 (en) * 2007-09-26 2009-04-02 Fraunhofer - Gesellschaft Zur Förderung Der Angewandten Forschung E.V. Apparatus and method for extracting an ambient signal in an apparatus and method for obtaining weighting coefficients for extracting an ambient signal and computer program

Cited By (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014523172A (ja) * 2011-06-30 2014-09-08 トムソン ライセンシング 高次Ambisonics表現に含まれるサウンドオブジェクトの相対位置を変更する方法と装置
JP2016502797A (ja) * 2012-11-15 2016-01-28 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 複数のパラメトリック・オーディオ・ストリームを発生するための装置及び方法、並びに複数のラウドスピーカ信号を発生するための装置及び方法
US10313815B2 (en) 2012-11-15 2019-06-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating a plurality of parametric audio streams and apparatus and method for generating a plurality of loudspeaker signals
JP2017517947A (ja) * 2014-05-05 2017-06-29 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ インフォームド空間のフィルタリングに基づく矛盾しない音響場面再生のためのシステムおよび装置および方法
JP2017517948A (ja) * 2014-05-05 2017-06-29 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 適応性のある関数に基づく矛盾しない音響場面再生のためのシステムおよび装置および方法
US9936323B2 (en) 2014-05-05 2018-04-03 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. System, apparatus and method for consistent acoustic scene reproduction based on informed spatial filtering
US10015613B2 (en) 2014-05-05 2018-07-03 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. System, apparatus and method for consistent acoustic scene reproduction based on adaptive functions
JP7107305B2 (ja) 2017-04-25 2022-07-27 ソニーグループ株式会社 信号処理装置および方法、並びにプログラム
KR102506167B1 (ko) * 2017-04-25 2023-03-07 소니그룹주식회사 신호 처리 장치 및 방법, 및 프로그램
JP2022137213A (ja) * 2017-04-25 2022-09-21 ソニーグループ株式会社 信号処理装置および方法、並びにプログラム
KR20190140913A (ko) * 2017-04-25 2019-12-20 소니 주식회사 신호 처리 장치 및 방법, 및 프로그램
JP7388492B2 (ja) 2017-04-25 2023-11-29 ソニーグループ株式会社 信号処理装置および方法、並びにプログラム
JPWO2018198767A1 (ja) * 2017-04-25 2020-02-27 ソニー株式会社 信号処理装置および方法、並びにプログラム
US11153704B2 (en) 2017-07-14 2021-10-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Concept for generating an enhanced sound-field description or a modified sound field description using a multi-layer description
US11863962B2 (en) 2017-07-14 2024-01-02 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Concept for generating an enhanced sound-field description or a modified sound field description using a multi-layer description
US11950085B2 (en) 2017-07-14 2024-04-02 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Concept for generating an enhanced sound field description or a modified sound field description using a multi-point sound field description
JP2020527746A (ja) * 2017-07-14 2020-09-10 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン マルチポイント音場記述を使用して拡張音場記述または修正音場記述を生成するためのコンセプト
US11463834B2 (en) 2017-07-14 2022-10-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Concept for generating an enhanced sound field description or a modified sound field description using a multi-point sound field description
JP7119060B2 (ja) 2017-07-14 2022-08-16 フラウンホーファー-ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン マルチポイント音場記述を使用して拡張音場記述または修正音場記述を生成するためのコンセプト
US11477594B2 (en) 2017-07-14 2022-10-18 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Concept for generating an enhanced sound-field description or a modified sound field description using a depth-extended DirAC technique or other techniques
JP2020527887A (ja) * 2017-07-14 2020-09-10 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 深度拡張DirAC技術またはその他の技術を使用して、拡張音場記述または修正音場記述を生成するための概念
JP2022058577A (ja) * 2017-11-17 2022-04-12 フラウンホファー ゲセルシャフト ツール フェールデルンク ダー アンゲヴァンテン フォルシュンク エー.ファオ. 量子化とエントロピーコーディングとを使用して指向性オーディオコーディングパラメータを符号化または復号するための装置および方法
JP7175980B2 (ja) 2017-11-17 2022-11-21 フラウンホファー ゲセルシャフト ツール フェールデルンク ダー アンゲヴァンテン フォルシュンク エー.ファオ. 量子化とエントロピーコーディングとを使用して指向性オーディオコーディングパラメータを符号化または復号するための装置および方法
US11783843B2 (en) 2017-11-17 2023-10-10 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding or decoding directional audio coding parameters using different time/frequency resolutions
JP7372360B2 (ja) 2017-11-17 2023-10-31 フラウンホファー ゲセルシャフト ツール フェールデルンク ダー アンゲヴァンテン フォルシュンク エー.ファオ. 量子化とエントロピーコーディングとを使用して指向性オーディオコーディングパラメータを符号化または復号するための装置および方法
US11367454B2 (en) 2017-11-17 2022-06-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding or decoding directional audio coding parameters using quantization and entropy coding
JP2021503628A (ja) * 2017-11-17 2021-02-12 フラウンホファー ゲセルシャフト ツール フェールデルンク ダー アンゲヴァンテン フォルシュンク エー.ファオ. 量子化とエントロピーコーディングとを使用して指向性オーディオコーディングパラメータを符号化または復号するための装置および方法
JP2021507558A (ja) * 2017-12-18 2021-02-22 ドルビー・インターナショナル・アーベー 仮想現実環境における聴取位置間のローカル遷移を扱う方法およびシステム
JP7467340B2 (ja) 2017-12-18 2024-04-15 ドルビー・インターナショナル・アーベー 仮想現実環境における聴取位置間のローカル遷移を扱う方法およびシステム
JP2022537513A (ja) * 2019-06-11 2022-08-26 ノキア テクノロジーズ オサケユイチア 音場関連レンダリング
JP2022536169A (ja) * 2019-06-11 2022-08-12 ノキア テクノロジーズ オサケユイチア 音場関連レンダリング
JP2022547253A (ja) * 2019-07-08 2022-11-11 ディーティーエス・インコーポレイテッド 不一致視聴覚捕捉システム
KR102656969B1 (ko) 2019-07-08 2024-04-11 디티에스, 인코포레이티드 불일치 오디오 비주얼 캡쳐 시스템
US11962991B2 (en) 2019-07-08 2024-04-16 Dts, Inc. Non-coincident audio-visual capture system

Also Published As

Publication number Publication date
KR101431934B1 (ko) 2014-08-19
KR20120089369A (ko) 2012-08-09
HK1176733A1 (zh) 2013-08-02
ES2592217T3 (es) 2016-11-28
EP2502228B1 (en) 2016-06-22
AU2010332934A1 (en) 2012-07-26
CN102859584B (zh) 2015-11-25
US20130016842A1 (en) 2013-01-17
US9196257B2 (en) 2015-11-24
WO2011073210A1 (en) 2011-06-23
RU2586842C2 (ru) 2016-06-10
CN102859584A (zh) 2013-01-02
RU2012132354A (ru) 2014-01-27
AR079517A1 (es) 2012-02-01
CA2784862C (en) 2020-06-16
TWI523545B (zh) 2016-02-21
MX2012006979A (es) 2012-07-17
BR112012015018A2 (pt) 2022-05-17
JP5426035B2 (ja) 2014-02-26
TW201146026A (en) 2011-12-16
CA2784862A1 (en) 2011-06-23
AU2010332934B2 (en) 2015-02-19
EP2346028A1 (en) 2011-07-20
EP2502228A1 (en) 2012-09-26
BR112012015018B1 (pt) 2023-11-28

Similar Documents

Publication Publication Date Title
JP5426035B2 (ja) 第1のパラメトリック空間オーディオ信号を第2のパラメトリック空間オーディオ信号に変換する装置および方法
CN106664501B (zh) 基于所通知的空间滤波的一致声学场景再现的系统、装置和方法
KR101407200B1 (ko) 가상 소스와 연관된 오디오 신호를 위한 라우드스피커 배열의 라우드스피커들에 대한 구동 계수를 계산하는 장치 및 방법
US8509454B2 (en) Focusing on a portion of an audio scene for an audio signal
US11937068B2 (en) Apparatus and method for reproducing a spatially extended sound source or apparatus and method for generating a bitstream from a spatially extended sound source
KR20170106063A (ko) 오디오 신호 처리 방법 및 장치
KR102540642B1 (ko) 다중-층 묘사를 이용하여 증강된 음장 묘사 또는 수정된 음장 묘사를 생성하기 위한 개념
CN109314832A (zh) 音频信号处理方法和设备
CN100553372C (zh) 用于计算扬声器信号中成分的离散值的装置和方法
US20230096873A1 (en) Apparatus, methods and computer programs for enabling reproduction of spatial audio signals
KR20220038478A (ko) 공간 변환 도메인에서 음장 표현을 처리하기 위한 장치, 방법 또는 컴퓨터 프로그램
CN114270878A (zh) 声场相关渲染
KR20180024612A (ko) 오디오 신호 처리 방법 및 장치

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20131028

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20131106

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20131127

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 5426035

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250