JP6908718B2 - オーディオストリームに関連付けられた空間性の大きさを提供するための装置および方法 - Google Patents
オーディオストリームに関連付けられた空間性の大きさを提供するための装置および方法 Download PDFInfo
- Publication number
- JP6908718B2 JP6908718B2 JP2019548682A JP2019548682A JP6908718B2 JP 6908718 B2 JP6908718 B2 JP 6908718B2 JP 2019548682 A JP2019548682 A JP 2019548682A JP 2019548682 A JP2019548682 A JP 2019548682A JP 6908718 B2 JP6908718 B2 JP 6908718B2
- Authority
- JP
- Japan
- Prior art keywords
- audio
- audio stream
- spatial
- magnitude
- channels
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/002—Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R5/00—Stereophonic arrangements
- H04R5/04—Circuit arrangements, e.g. for selective connection of amplifier inputs/outputs to loudspeakers, for loudspeaker detection, or for adaptation of settings to personal preferences or hearing impairments
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S1/00—Two-channel systems
- H04S1/002—Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S1/00—Two-channel systems
- H04S1/007—Two-channel systems in which the audio signals are in digital form
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/01—Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/40—Visual indication of stereophonic sound image
Description
本発明の実施形態は、オーディオストリームに関連付けられた空間特性、すなわち空間性の大きさの評価に関する。
3D−ネスに焦点を当てた3D−オーディオコンテンツの評価は、特定のリスニングルームとすべてのコンテンツを聞く経験豊富なオーディオエンジニアを必要とする単調な作業である。
本発明の実施形態は、オーディオストリームを評価するための装置であって、オーディオストリームは、少なくとも2つの異なる空間層で再生されるオーディオチャネルを備える。2つの空間層は空間軸に沿って距離を開けて配置される。装置は、さらに、オーディオストリームに関連付けられた空間性の大きさを提供するようにオーディオストリームのオーディオチャネルを評価するように構成される。
以下において、本発明のより好ましい実施形態を、添付図面を参照して説明する。
図1は、本発明の実施形態による装置100のブロック図を示す。装置100は評価装置110を備える。
・高音の音源の知覚
・ローカライズ精度(方位角、仰角、距離)[9]
・動的なローカライズ精度(移動オブジェクトの場合)[9]
・巻き込み(音に覆われている感覚)[13,14,15]
・空間の明瞭さ(空間シーンをどれだけはっきりと認識できるか)[14,15]
・音源は異なる垂直層を移動し、例えば、ヒューという効果音は中間(または水平)層から上部層に移動する。
・音源は中間層と上部層で再生され、例えば、主音は中間層で知覚され、上から話しているときの音声セットまたは直接音は中間層で再生され、周囲音は上部層で再生される。
・中間層の左および上部層の左
・中間層の左サラウンドと上部層の左サラウンド
・中間層の中央と上部層の左
・…
可能なチャネルグループは次のとおりである。
・中間層および上部層
・中間層の左右と上部層の左右
・…
レベル分析段階220aは、上部層にレベルがあるかどうか、もしあればレベルが中間層に対してどれだけ高いかを監視することができる。重要な測定は、垂直音源のマスキング閾値である[18、19]。この分析段階では、中間層の信号のマスキング閾値が上部層によって大幅に超えた場合、またはその逆の場合にのみ、3D−ネスを検出できる。上部層で測定された信号(またはレベル)がない場合、またはその時点で対応する中間層の信号に対してレベルが低すぎる場合、3D−ネスメーターは低い3D−ネス値(例えば、レベル分析段階から取得した情報に基づいて)を報告する場合がある。
実施形態では、3D−ネスメーターを設定して、(i)上部層のレベルを中間層のマスキング閾値と比較する、(ii)中間層のレベルを上部層のマスキング閾値と比較するまたは(iii)指定されたすべての層を比較し、下位レベルの層のレベル(例えば、最低レベルの層)を対応する他の層と比較する。
実施形態では、相関段階220bを使用して、正規化された短期相互相関についてチャネルペアまたはチャネルグループを分析する。この測定は、2つの信号がどれほど似ているかを表し、時間の経過によるエネルギーの違いから導出される可能性がある。上部層信号の非常に高い類似性は、中間層信号の最も可能性の高い要素、または中間層信号全体が上部層にも供給されることを示す。これは、特定の知覚された包絡線またはわずかに上に移動したサウンドシーンを提供する場合がある。
実施形態では、パンニング段階220cは、異なる位置に異なる時間に現れるサウンド要素を探す。 動的なパンニングは、中間層の左前の位置から上層の右後の位置に飛ぶヘリコプターのように、空間を移動する信号によって特徴付けられる。信号に関しては、パンニングの動きにより、1つのチャネルまたはチャネルのグループから別のチャネルへのクロスフェードが発生する。そのようなクロスフェードが信号内で検出された場合、パンニング効果は3D−オーディオ効果(例えば、知覚された高い空間性)を生成する可能性がある。レベル分析段階からのレベル情報は、他の時定数でより詳細に処理される場合がある(例えば、平均化ウィンドウが長くなる)。
アップミキシングアルゴリズムは、サウンド処理で確立される。 通常、デコレーションと信号分離を使用して、より広く、より包み込み、より刺激的なサウンド再生を実現するために、使用するチャネルの数を増やす。
アップミックス検出段階220dは、所定の非相関が以前に適用された自動アップミックスの結果であり得るかどうかを調べる。したがって、相関段階のデータ(例えば220a)が使用される。さらに、信号を分析して、最も一般的なアップミックス方法から生じる可能性のあるアーチファクトと結果を見つけることができる。
自動アップミックスのヒントを見つけることができるかどうかは、後続のダウンミックスの可能性がサウンドカラーレーションを引き起こす可能性があるため、重要な情報になる可能性がある。 さらに、自動アップミックスは、芸術的に作成された3D−オーディオミックスに比べて価値が低いと見なされる可能性がある。したがって、オーディオストリームがアップミックスに基づいていると推定されている場合、取得された空間性の大きさから低い空間性が示されることがある。
本発明の実施形態の有用性を説明するために、3D−ネスメーターのいくつかの実際的な使用事例が提示される。
サウンドエンジニアは、特定の映画ミックスに3D−オーディオが含まれているかどうかを求められる。3D−ネスメーターがない場合、エンジニアはサウンドトラック全体を聴いて、関連する3D−効果が発生するかどうかを確認する必要がある。3D−ネスメーターがある場合、オーディオはオフラインで分析される。これは、リアルタイムよりもはるかに高速であることを意味し、3D−効果が発生するセクションがマークされる。
エンジニアは、映画のサウンドトラックで最も印象的な3D−オーディオセクションを見つけるよう求められる。3D−ネスメーターの結果を見ると、3D効果のあるスポットをすばやく見つけることができる。3D−ネスメーターで指摘されたセクションのみを聞く必要がある。
制作会社は、2つ可能性のあるタイトルのうち、どちらを追加の3D−オーディオトラックを有するブルーレイ(登録商標)用にリリースするかを決定する必要がある。3D−ネスメーターの結果は、どのタイトルが3D−オーディオ効果をより頻繁に使用しているかを示しており、経済的な判断の基礎となる。
3D−オーディオ製作がミキシングされる。所望の3D効果がとても強く、混乱する可能性がある場合に、3D−ネスメーターは、信号を監視し、ミキシングエンジニアに示すことができる。または、エンジニアが3D効果を作りたいと考えており、3D−ネスメーターが示すように、その効果は容易に知覚できるほど強くはない。
3Dオーディオミックスが配信され、クライアントは、ミックスが芸術的な意図を持つエンジニアによって作成されたものであるか、自動アップミックスのみであるかを調べたいと考えている。自動アップミキシングが適用されている場合、3D−ネスメーターが表示する場合がある。
[1] EBU. EBU TECH 3344: Practical guidelines for distribution systems in accordance with EBU R 128. Geneva, 2011.
[2] IRT. Technische Richtlinien - HDTV. Zur Herstellung von Fernsehproduktionen fur ARD, ZDF und ORF. Frankfurt a.M., 2011.
[3] ARTE. Allgemeine technische Richtlinien. ARTE, Kehl, 2013.
[4] Gerhard Spikofski and Siegfried Klar. Levelling and Loudness in Radio and Television Broadcasting. European Broadcast Union, Geneva, 2004.
[5] ITU. ITU-R BS.2054-2: Audio Levels and Loudness, volume 2. International Telecommunication Union, Geneva, 2011.
[6] Robin Gareus and Chris Goddard. Audio Signal Visualisation and Measurement. In International Computer Music and Sound & Music Computing Conference, Athens, 2014.
[7] B Mendiburu. 3D Movie Making - Stereoscopic Digital Cinema from Script to Screen. Focal Press, 2009.
[8] B. Mendiburu. 3D TV and 3D Cinema. Tools and Processes for Creative Stereoscopy. Focal Press, 2011.
[9] Andreas Silzle. 3D Audio Quality Evaluation: Theory and Practice. In International Conference on Spatial Audio, Erlangen, 2014. VDT.
[10] Nick Zacharov and Torben Holm Pedersen. Spatial sound attributes - development of a common lexicon. In AES 139th Convention, New York, 2015. Audio Engineering Society.
[11] Michael Schoeffler, Sarah Conrad, and Jurgen Herre. The Inuence of the Single / Multi-Channel-System on the Overall Listening Experience. In AES 55th Conference, Helsinki, 2014.
[12] Ulli Scuda. Comparison of Multichannel Surround Speaker Setups in 2D and 3D. In Malte Kob, editor, International Conference on Spatial Audio, Erlangen, 2014. VDT.
[13] R Sazdov, G Paine, and K Stevens. Perceptual Investigation into Envelopment, Spatial Clarity and Engulfment in Reproduced Multi-Channel Audio. In AES 31st Conference, London, 2007. Audio Engineering Society.
[14] R Sazdov. The effect of elevated loudspeakers on the perception of engulfment, and the effect of horizontal loudspeakers on the perception of envelopment. In ICSA 2011. VDT.
[15] Robert Sazdov. Envelopment vs. Engulfment: Multidimensional scaling on the effect of spectral content and spatial dimension within a three-dimensional loudspeaker setup. In International Conference on Spatial Audio, Graz, 2015. VdT.
[16] Torben Holm Pedersen and Nick Zacharov. The development of a Sound Wheel for Reproduced Sound. In AES 138th Convention, Warsaw, 2015. AES.
[17] AES. Technical Document AESTD1005.1.16-09: Audio Guidelines for Over the Top Television and Video Streaming. AES, New York, 2016.
[18] Hyunkook Lee. The Relationship between Interchannel Time and Level Differences in Vertical Sound Localisation and Masking. In AES 131st Convention, number Icld, pages 1-13, 2011.
[19] Hanne Stenzel, Ulli Scuda, and Hyunkook Lee. Localization and Masking Thresholds of Diagonally Positioned Sound Sources and Their Relationship to Interchannel Time and Level Differences. In International Conference on Spatial Audio, Erlangen, 2014. VDT.
Claims (22)
- オーディオストリームを評価するための装置(100、200、304)であって、
前記オーディオストリーム(105)は、少なくとも2つの異なる空間層(420、410)で再生されるオーディオチャネル(106、206、305)を備え、前記2つの空間層は空間軸に沿って距離を開けて配置されており、
前記装置は、前記オーディオストリームの前記オーディオチャネルを評価して、
前記オーディオストリームのオーディオチャネルの第1のセットと前記オーディオストリームのオーディオチャネルの第2のセットとの間の類似性の大きさに基づいてアップミックス原点の推定(220d´)を取得し、前記アップミックス原点の推定に基づいて空間性の大きさを決定すること
によって、前記オーディオストリームに関連付けられた空間性の大きさ(115、235)を提供するように構成される、装置。 - 前記装置は、前記オーディオストリームの前記オーディオチャネルがより少ないオーディオチャネルのオーディオストリームから導出されることを前記アップミックス原点の推定が示す場合、前記アップミックス原点の推定に基づいて前記空間性の大きさを低減するように構成される、請求項1に記載の装置。
- 前記装置は、前記空間性の大きさを前記アップミックス原点の推定を伴って出力するように構成される、請求項1または請求項2に記載の装置。
- 前記空間軸は水平方向に方向づけられる、または、前記空間軸は垂直方向に方向づけられる、請求項1ないし3のいずれかに記載の装置。
- 前記装置は、前記オーディオストリームのオーディオチャネルの第1のセットに基づいて第1のレベル情報を取得し、また前記オーディオストリームのオーディオチャネルの第2のセットに基づいて第2のレベル情報を取得するように構成され、
前記装置は、前記第1のレベル情報および前記第2のレベル情報に基づいて空間レベル情報(220a´)を決定し、また前記空間レベル情報に基づいて前記空間性の大きさを決定するように構成される、請求項1ないし4のいずれかに記載の装置。 - 前記オーディオストリームの前記オーディオチャネルの第1のセットは、前記オーディオストリームの前記オーディオチャネルの第2のセットから離れている、請求項5に記載の装置。
- 前記オーディオストリームの前記オーディオチャネルの第1のセットは1つ以上の第1の空間層においてラウドスピーカーで再生され、前記オーディオストリームの前記オーディオチャネルの第2のセットは1つ以上の第2の空間層においてラウドスピーカーで再生され、
前記1つ以上の第1の空間層および前記1つ以上の第2の空間層は空間的に離れている、請求項5または請求項6に記載の装置。 - オーディオストリームを評価するための装置(100、200、304)であって、
前記オーディオストリーム(105)は、少なくとも2つの異なる空間層(420、410)で再生されるオーディオチャネル(106、206、305)を備え、前記2つの空間層は空間軸に沿って距離を開けて配置されており、
前記装置は、前記オーディオストリームの前記オーディオチャネルを評価して、
前記オーディオストリームのオーディオチャネルの第1のセットに基づいて第1のレベル情報を取得し、また前記オーディオストリームのオーディオチャネルの第2のセットに基づいて第2のレベル情報を取得すること、および、
前記第1のレベル情報および前記第2のレベル情報に基づいて空間性の大きさを決定すること、
によって、前記オーディオストリームに関連付けられた空間性の大きさ(115、235)を提供するように構成され、
前記オーディオストリームの前記オーディオチャネルの第1のセットは1つ以上の第1の空間層においてラウドスピーカーで再生され、前記オーディオストリームの前記オーディオチャネルの第2のセットは1つ以上の第2の空間層においてラウドスピーカーで再生され、
前記1つ以上の第1の空間層および前記1つ以上の第2の空間層は空間的に離れていて、
前記装置は、前記オーディオチャネルの第1のセットのレベル情報に基づいてマスキング閾値を決定し、前記マスキング閾値を前記オーディオチャネルの第2のセットのレベル情報と比較するように構成され、
前記比較によって前記オーディオチャネルの第2のセットの前記レベル情報が前記マスキング閾値を超えていることが示された場合、前記装置は空間レベル情報を増強するように構成される、装置。 - 前記装置は、1つ以上の第1の空間層で再生する前記オーディオストリームのオーディオチャネルの第1のセットと、1つ以上の第2の空間層で再生する前記オーディオストリームのオーディオチャネルの第2のセットとの間の類似性の大きさ(220b´)を決定し、前記類似性の大きさに基づいて前記空間性の大きさを決定するように構成される、請求項1ないし請求項8のいずれかに記載の装置。
- 前記装置は、前記類似性の大きさが小さいほど、前記空間性の大きさが大きくなるように、前記空間性の大きさを決定するように構成される、請求項9に記載の装置。
- オーディオストリームを評価するための装置(100、200、304)であって、
前記オーディオストリーム(105)は、少なくとも2つの異なる空間層(420、410)で再生されるオーディオチャネル(106、206、305)を備え、前記2つの空間層は空間軸に沿って距離を開けて配置されており、
前記装置は、前記オーディオストリームの前記オーディオチャネルを評価して、
1つ以上の第1の空間層で再生する前記オーディオストリームのオーディオチャネルの第1のセットと、1つ以上の第2の空間層で再生する前記オーディオストリームのオーディオチャネルの第2のセットとの間の類似性の大きさ(220b´)を決定し、前記類似性の大きさに基づいて前記空間性の大きさを決定すること、
前記オーディオチャネルの第1のセットのレベル情報に基づいてマスキング閾値を決定し、前記マスキング閾値を前記オーディオチャネルの第2のセットのレベル情報と比較すること、および、
前記比較によって前記オーディオチャネルの第2のセットの前記レベル情報が前記マスキング閾値を超えていることが示され、且つ、前記類似性の大きさが前記第1のセットと前記第2のセットとの間の類似性が低いことを示す場合、前記空間性の大きさを増大すること、
によって、前記オーディオストリームに関連付けられた空間性の大きさ(115、235)を提供するように構成される、装置。 - オーディオストリームを評価するための装置(100、200、304)であって、
前記オーディオストリーム(105)は、少なくとも2つの異なる空間層(420、410)で再生されるオーディオチャネル(106、206、305)を備え、前記2つの空間層は空間軸に沿って距離を開けて配置されており、
前記装置は、前記オーディオストリームの前記オーディオチャネルを評価して、前記オーディオストリームに関連付けられた空間性の大きさ(115、235)を提供するように構成され、
前記装置は、前記オーディオチャネルへの音源のパンニングの時間的変動に関して前記オーディオストリームの前記オーディオチャネルを分析するように構成される、装置。 - オーディオストリームを評価するための装置(100、200、304)であって、
前記オーディオストリーム(105)は、少なくとも2つの異なる空間層(420、410)で再生されるオーディオチャネル(106、206、305)を備え、前記2つの空間層は空間軸に沿って距離を開けて配置されており、
前記装置は、前記オーディオストリームの前記オーディオチャネルを評価して、前記オーディオストリームに関連付けられた空間性の大きさ(115、235)を提供するように構成され、
前記装置は、
前記オーディオストリームの空間レベル情報、および/または、
前記オーディオストリームの類似性の大きさ、および/または、
前記オーディオストリームのパンニング情報、および/または、
前記オーディオストリームのアップミックス原点の推定
のうち少なくとも2つのパラメータの重み付け(230)に基づいて、前記空間性の大きさを提供するように構成される、装置。 - 前記装置は、前記空間性の大きさを視覚的に出力(320)するように構成される、請求項1ないし請求項13のいずれかに記載の装置。
- オーディオストリームを評価するための装置(100、200、304)であって、
前記オーディオストリーム(105)は、少なくとも2つの異なる空間層(420、410)で再生されるオーディオチャネル(106、206、305)を備え、前記2つの空間層は空間軸に沿って距離を開けて配置されており、
前記装置は、
前記オーディオストリームの前記オーディオチャネルを評価して、前記オーディオストリームに関連付けられた空間性の大きさ(115、235)を提供し、
前記空間性の大きさを視覚的に出力(320)するとともに、前記空間性の大きさをグラフ(310)として提供するように構成され、ここで前記グラフは、経時的な前記空間性の大きさに関する情報を提供するように構成され、前記グラフの時間軸は前記オーディオストリームに整合される、装置。 - 前記装置は、前記空間性の大きさを数値(320)として提供するように構成され、前記数値は前記オーディオストリーム全体を表わす、請求項1ないし請求項15の1つに記載の装置。
- 前記装置は、前記空間性の大きさをログファイル(330)に書き込むように構成される、請求項1ないし請求項16の1つに記載の装置。
- オーディオストリームを評価するための方法(500)であって、
前記オーディオストリームは、少なくとも2つの異なる空間層で再生されるオーディオチャネルを備え、前記2つの空間層は空間軸に沿って距離を開けて配置されており、前記方法は、
前記オーディオストリームのオーディオチャネルの第1のセットと前記オーディオストリームのオーディオチャネルの第2のセットとの間の類似性の大きさに基づいてアップミックス原点の推定(220d´)を取得して、
前記アップミックス原点の推定に基づいて前記空間性の大きさを決定すること
によって、前記オーディオストリームに関連付けられた空間性の大きさを提供するために前記オーディオストリームのオーディオチャネルを評価するステップ(510)を備える、方法。 - オーディオストリームを評価するための方法(500)であって、
前記オーディオストリームは、少なくとも2つの異なる空間層で再生されるオーディオチャネルを備え、前記2つの空間層は空間軸に沿って距離を開けて配置されており、前記方法は、
前記オーディオストリームのオーディオチャネルの第1のセットに基づいて第1のレベル情報を取得し、また前記オーディオストリームのオーディオチャネルの第2のセットに基づいて第2のレベル情報を取得すること、および
前記第1のレベル情報および前記第2のレベル情報に基づいて前記空間性の大きさを決定すること、
によって、前記オーディオストリームに関連付けられた空間性の大きさを提供するために前記オーディオストリームのオーディオチャネルを評価するステップ(510)を備え、
前記オーディオストリームの前記オーディオチャネルの第1のセットは1つ以上の第1の空間層においてラウドスピーカーで再生され、前記オーディオストリームの前記オーディオチャネルの第2のセットは1つ以上の第2の空間層においてラウドスピーカーで再生され、
前記1つ以上の第1の空間層および前記1つ以上の第2の空間層は空間的に離れていて、
前記方法はさらに、
前記オーディオチャネルの第1のセットのレベル情報に基づいてマスキング閾値を決定し、前記マスキング閾値を前記オーディオチャネルの第2のセットのレベル情報と比較するステップと、
前記比較によって前記オーディオチャネルの第2のセットの前記レベル情報が前記マスキング閾値を超えていることが示された場合、空間レベル情報を増強するステップと、
を含む、方法。 - オーディオストリームを評価するための方法(500)であって、
前記オーディオストリームは、少なくとも2つの異なる空間層で再生されるオーディオチャネルを備え、前記2つの空間層は空間軸に沿って距離を開けて配置されており、前記方法は、
1つ以上の第1の空間層で再生する前記オーディオストリームのオーディオチャネルの第1のセットと、1つ以上の第2の空間層で再生する前記オーディオストリームのオーディオチャネルの第2のセットとの間の類似性の大きさ(220b´)を決定し、前記類似性の大きさに基づいて前記空間性の大きさを決定すること、
前記オーディオチャネルの第1のセットのレベル情報に基づいてマスキング閾値を決定し、前記マスキング閾値を前記オーディオチャネルの第2のセットのレベル情報と比較すること、および
前記比較によって前記オーディオチャネルの第2のセットの前記レベル情報が前記マスキング閾値を超えていることが示され、且つ、前記類似性の大きさが前記第1のセットと前記第2のセットとの間の類似性が低いことを示す場合、前記空間性の大きさを増大すること
によって、前記オーディオストリームに関連付けられた空間性の大きさを提供するために前記オーディオストリームのオーディオチャネルを評価するステップ(510)を備える、方法。 - オーディオストリームを評価するための方法(500)であって、
前記オーディオストリームは、少なくとも2つの異なる空間層で再生されるオーディオチャネルを備え、前記2つの空間層は空間軸に沿って距離を開けて配置されており、前記方法は、
前記オーディオストリームに関連付けられた空間性の大きさを提供するために前記オーディオストリームのオーディオチャネルを評価するステップ(510)を備え、
前記空間性の大きさは、
前記オーディオストリームの空間レベル情報、および/または、
前記オーディオストリームの類似性の大きさ、および/または、
前記オーディオストリームのパンニング情報、および/または、
前記オーディオストリームのアップミックス原点の推定
のうち少なくとも2つのパラメータの重み付け(230)に基づいて、提供される、方法。 - コンピュータプログラムがコンピュータまたはマイクロコントローラ上で動作しているときに、請求項18ないし21のいずれかに記載する方法を実行するためのプログラムコードを有するコンピュータプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP17159903.8 | 2017-03-08 | ||
EP17159903.8A EP3373604B1 (en) | 2017-03-08 | 2017-03-08 | Apparatus and method for providing a measure of spatiality associated with an audio stream |
PCT/EP2018/055482 WO2018162487A1 (en) | 2017-03-08 | 2018-03-06 | Apparatus and method for providing a measure of spatiality associated with an audio stream |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020509429A JP2020509429A (ja) | 2020-03-26 |
JP6908718B2 true JP6908718B2 (ja) | 2021-07-28 |
Family
ID=58448278
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019548682A Active JP6908718B2 (ja) | 2017-03-08 | 2018-03-06 | オーディオストリームに関連付けられた空間性の大きさを提供するための装置および方法 |
Country Status (7)
Country | Link |
---|---|
US (1) | US10952003B2 (ja) |
EP (2) | EP3373604B1 (ja) |
JP (1) | JP6908718B2 (ja) |
CN (1) | CN110603820B (ja) |
BR (1) | BR112019018592A2 (ja) |
RU (1) | RU2762232C2 (ja) |
WO (1) | WO2018162487A1 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3929918A4 (en) * | 2019-02-19 | 2023-05-10 | Akita Prefectural University | ACOUSTIC SIGNAL CODING METHOD, ACOUSTIC SIGNAL DECODING METHOD, PROGRAM, CODING DEVICE, ACOUSTIC SYSTEM AND COMPLEXING DEVICE |
WO2022010453A1 (en) * | 2020-07-06 | 2022-01-13 | Hewlett-Packard Development Company, L.P. | Cancellation of spatial processing in headphones |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7257231B1 (en) * | 2002-06-04 | 2007-08-14 | Creative Technology Ltd. | Stream segregation for stereo signals |
JP5658483B2 (ja) * | 2010-05-26 | 2015-01-28 | 日本放送協会 | 臨場感推定装置およびそのプログラム |
CH703771A2 (de) | 2010-09-10 | 2012-03-15 | Stormingswiss Gmbh | Vorrichtung und Verfahren zur zeitlichen Auswertung und Optimierung von stereophonen oder pseudostereophonen Signalen. |
AR086774A1 (es) * | 2011-07-01 | 2014-01-22 | Dolby Lab Licensing Corp | Sistema y herramientas para autoria y representacion mejorada de audio tridimensional |
US10582330B2 (en) * | 2013-05-16 | 2020-03-03 | Koninklijke Philips N.V. | Audio processing apparatus and method therefor |
MX363414B (es) | 2014-12-12 | 2019-03-22 | Huawei Tech Co Ltd | Aparato de procesamiento de señal para mejorar un componente de voz dentro de una señal de audio multi-canal. |
CN114554387A (zh) * | 2015-02-06 | 2022-05-27 | 杜比实验室特许公司 | 用于自适应音频的混合型基于优先度的渲染系统和方法 |
DE102015104699A1 (de) | 2015-03-27 | 2016-09-29 | Hamburg Innovation Gmbh | Verfahren zur Analyse und Dekomposition von Stereoaudiosignalen |
EP3216234B1 (en) | 2015-04-24 | 2019-09-25 | Huawei Technologies Co., Ltd. | An audio signal processing apparatus and method for modifying a stereo image of a stereo signal |
-
2017
- 2017-03-08 EP EP17159903.8A patent/EP3373604B1/en active Active
-
2018
- 2018-03-06 CN CN201880030173.4A patent/CN110603820B/zh active Active
- 2018-03-06 RU RU2019131467A patent/RU2762232C2/ru active
- 2018-03-06 WO PCT/EP2018/055482 patent/WO2018162487A1/en active Search and Examination
- 2018-03-06 EP EP18707737.5A patent/EP3593544B1/en active Active
- 2018-03-06 BR BR112019018592A patent/BR112019018592A2/pt unknown
- 2018-03-06 JP JP2019548682A patent/JP6908718B2/ja active Active
-
2019
- 2019-09-03 US US16/558,787 patent/US10952003B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
RU2019131467A3 (ja) | 2021-04-08 |
RU2019131467A (ru) | 2021-04-08 |
JP2020509429A (ja) | 2020-03-26 |
EP3373604A1 (en) | 2018-09-12 |
EP3373604B1 (en) | 2021-09-01 |
CN110603820A (zh) | 2019-12-20 |
US10952003B2 (en) | 2021-03-16 |
EP3593544B1 (en) | 2023-05-17 |
BR112019018592A2 (pt) | 2020-04-07 |
US20200021934A1 (en) | 2020-01-16 |
EP3593544A1 (en) | 2020-01-15 |
RU2762232C2 (ru) | 2021-12-16 |
CN110603820B (zh) | 2021-12-31 |
WO2018162487A1 (en) | 2018-09-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Choisel et al. | Evaluation of multichannel reproduced sound: Scaling auditory attributes underlying listener preference | |
Schoeffler et al. | Evaluation of spatial/3D audio: Basic audio quality versus quality of experience | |
Bates et al. | Comparing Ambisonic Microphones–Part 1 | |
Mansbridge et al. | An autonomous system for multitrack stereo pan positioning | |
Pike et al. | An assessment of virtual surround sound systems for headphone listening of 5.1 multichannel audio | |
Alary et al. | Perceptual analysis of directional late reverberation | |
JP6908718B2 (ja) | オーディオストリームに関連付けられた空間性の大きさを提供するための装置および方法 | |
George et al. | Development and validation of an unintrusive model for predicting the sensation of envelopment arising from surround sound recordings | |
Conetta et al. | Spatial audio quality perception (part 1): impact of commonly encountered processes | |
Tom et al. | An automatic mixing system for multitrack spatialization for stereo based on unmasking and best panning practices | |
Pulkki et al. | Reproduction of reverberation with spatial impulse response rendering | |
Valente et al. | Comparing perceived auditory width to the visual image of a performing ensemble in contrasting bi-modal environments | |
Millns et al. | An investigation into spatial attributes of 360° microphone techniques for virtual reality | |
Rumsey | Spatial audio processing | |
Salmon et al. | The influence of the sound source on perceived differences between binaurally rendered sound spaces | |
Ois Salmon et al. | A Comparative Study of Multichannel Microphone Arrays Used in Classical Music Recording | |
Melchior et al. | A library of binaural room impulse responses and sound scenes for evaluation of spatial audio systems | |
Kamekawa et al. | Are full-range loudspeakers necessary for the top layer of Three-Dimensional audio? | |
Moiragias et al. | An Evaluation Method for Temporal Spatial Sound Attributes | |
Pike et al. | Plausibility of Parametric Spatial Audio Reproduction of B-format Room Impulse Responses over Headphones | |
Westphal et al. | A framework for reporting spatial attributes of sound sources | |
Kuusinen et al. | On studying auditory distance perception in concert halls with multichannel auralizations | |
Kelly et al. | A Perceptual Evaluation of Spatial Room Impulse Responses Captured Using Spaced Higher-Order Ambisonic Microphone Arrays | |
Kamekawa et al. | How much can the number of microphones for 3D audio recording be reduced while maintaining spatial impression? | |
Hirvonen et al. | Perceptually Motivated Bitrate Allocation for Object-Based Audio Using Opus Codec |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20191106 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200923 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20201217 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210323 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210601 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210701 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6908718 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |