JP7309876B2 - 拡散補償を用いたDirACベースの空間音声符号化に関する符号化、復号化、シーン処理および他の手順を行う装置、方法およびコンピュータプログラム - Google Patents
拡散補償を用いたDirACベースの空間音声符号化に関する符号化、復号化、シーン処理および他の手順を行う装置、方法およびコンピュータプログラム Download PDFInfo
- Publication number
- JP7309876B2 JP7309876B2 JP2021532191A JP2021532191A JP7309876B2 JP 7309876 B2 JP7309876 B2 JP 7309876B2 JP 2021532191 A JP2021532191 A JP 2021532191A JP 2021532191 A JP2021532191 A JP 2021532191A JP 7309876 B2 JP7309876 B2 JP 7309876B2
- Authority
- JP
- Japan
- Prior art keywords
- sound field
- components
- input signal
- component
- order
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 58
- 238000009792 diffusion process Methods 0.000 title claims description 39
- 238000004590 computer program Methods 0.000 title claims description 14
- 238000012545 processing Methods 0.000 title description 28
- 238000004458 analytical method Methods 0.000 claims description 19
- 230000007480 spreading Effects 0.000 claims description 16
- 238000002156 mixing Methods 0.000 claims description 13
- 230000001419 dependent effect Effects 0.000 claims description 4
- 239000000284 extract Substances 0.000 claims description 4
- 230000006835 compression Effects 0.000 claims description 2
- 238000007906 compression Methods 0.000 claims description 2
- 230000003247 decreasing effect Effects 0.000 claims 1
- 230000003595 spectral effect Effects 0.000 claims 1
- 230000015572 biosynthetic process Effects 0.000 description 28
- 238000003786 synthesis reaction Methods 0.000 description 28
- 230000006870 function Effects 0.000 description 14
- 230000005540 biological transmission Effects 0.000 description 13
- 238000005259 measurement Methods 0.000 description 10
- 238000004364 calculation method Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 7
- 238000010606 normalization Methods 0.000 description 7
- 230000008901 benefit Effects 0.000 description 5
- 238000013139 quantization Methods 0.000 description 5
- 230000002194 synthesizing effect Effects 0.000 description 5
- 238000012937 correction Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000003491 array Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- AZUYLZMQTIKGSC-UHFFFAOYSA-N 1-[6-[4-(5-chloro-6-methyl-1H-indazol-4-yl)-5-methyl-3-(1-methylindazol-5-yl)pyrazol-1-yl]-2-azaspiro[3.3]heptan-2-yl]prop-2-en-1-one Chemical compound ClC=1C(=C2C=NNC2=CC=1C)C=1C(=NN(C=1C)C1CC2(CN(C2)C(C=C)=O)C1)C=1C=C2C=NN(C2=CC=1)C AZUYLZMQTIKGSC-UHFFFAOYSA-N 0.000 description 1
- 238000012935 Averaging Methods 0.000 description 1
- 101100521334 Mus musculus Prom1 gene Proteins 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000015654 memory Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000006641 stabilisation Effects 0.000 description 1
- 238000011105 stabilization Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/307—Frequency adjustment, e.g. tone control
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/15—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being formant information
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/21—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/008—Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/01—Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/03—Application of parametric coding in stereophonic audio systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/11—Application of ambisonics in stereophonic audio systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/13—Application of wave-field synthesis in stereophonic audio systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Mathematical Physics (AREA)
- Stereophonic System (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
・ダウンミックス信号から抽出したK個の低次アンビソニックス成分を増幅することで、H次までの拡散音アンビソニックス成分をモデリングしないことによるエネルギー損失を補うことができる。
・ダウンミックス信号が非可逆符号化されている伝送アプリケーションでは、伝送されるダウンミックス信号が量子化誤差によって破壊されるが、ダウンミックス信号から抽出されたK個の低次アンビソニックス成分のエネルギー関係を制約することで、これを緩和することができる。
・DirAC内での簡素化された(より複雑でない)HOA合成。
°すべてのアンビソニックス成分を完全に合成することなく、より直接的な合成が可能。
°必要な脱相関器の数と、最終的な品質への影響の低減。
・伝送中のダウンミックス信号に導入される符号化アーチファクトの低減。
・品質と処理効率の最適なトレードオフを有するように、3つの異なる次元の処理を分離する。
・
続いて、上記の説明に一部または全部含まれているいくつかの発明的態様がまとめられており、これらは互いに独立して、または互いに組み合わせて、あるいは3つの態様から任意に選択された2つの態様のみを組み合わせた特定の組み合わせで使用することができる。
入力信号から拡散データを得るための入力信号分析器と、
前記入力信号から、各音場成分に直接成分と拡散成分を有する第1の音場成分グループの1つ以上の音場成分を生成し、前記入力信号から、直接成分のみを有する第2の音場成分グループを生成する音場成分生成器と、を備え、
前記音場成分生成器は、前記第1の音場成分グループを生成する際にエネルギー補償を行うように構成されており、前記エネルギー補償は、前記拡散データおよび前記第2の音場成分グループの数に応じて行うことを特徴とする音場記述生成装置。
入力信号から方位データおよび拡散データを取得する入力信号分析器と、
入力信号から導出された全方位成分の第1の振幅関連尺度を推定し、入力信号から導出された指向性成分の第2の振幅関連尺度を推定するための推定器と、を備え、
前記音場の音場成分を生成する音場成分生成器であって、前記音場成分生成器は、前記第1の振幅関連尺度、前記第2の振幅関連尺度、前記方位データおよび前記拡散データを用いて、前記指向性成分のエネルギー補償を行うように構成されている、音場成分生成装置。
入力信号を分析して方位データおよび拡散データを導出する入力信号分析器と、
前記入力信号から所定の次数およびモードまでの低次音記述を生成する低次成分生成器であって、前記入力信号をコピーするか、または前記入力信号のチャンネルを加重結合することにより、前記低次音記述を得るように構成されている低次成分生成器と、
前記所定の次数以上または前記所定の次数および前記所定のモード以上かつ前記第1の打ち切り次数以下の中次音記述を、前記方位データおよび前記拡散データを用いて、少なくとも1つの直接部分および少なくとも1つの拡散部分の合成を使用することにより生成し、前記中次音記述が指向性寄与および拡散寄与で構成されるようにするための中次成分生成器と、
前記高次音記述が直接寄与のみからなるように、拡散成分の合成を行わずに、少なくとも1つの直接部分の合成を用いて、前記第1の打ち切り次数以上の成分を有する高次音記述を生成する高次成分生成器と、を備えた装置。
前記低次音記述、前記中次音記述、または前記高次音記述が、直交する出力音場の音場成分を含み、2つの音記述が1つの同じ音場成分を含まないようにする、または
前記中次成分生成器は、前記低次成分生成器が使用しない下の成分または第1の打ち切り次元の成分を生成する、装置。
音場を表す1つまたは複数のオーディオチャンネルを有する入力ダウンミックス信号を受信するステップと、
前記音場を表す1つ以上の音の方位を受信または決定するステップと、
前記1つ以上の音方位を用いて、1つ以上の空間基底関数を評価するステップと、
入力されたダウンミックス信号チャンネルの第1の加重結合から、1つまたは複数の音場成分の第1のセットを導出するステップと、
入力ダウンミックス信号チャンネルの第2の重み付けされた結合と、1つまたは複数の評価された空間基底関数とから、1つ以上の直接音場成分の第2のセットを導出するステップと、
前記1つまたは複数の第1の音場成分のセットおよび1つまたは複数の第2の音場成分のセットを結合するステップと、を含む装置。
拡散値を受信または決定するステップと、
前記拡散値の関数として、1つ以上の拡散音成分を生成するステップと、
前記1つ以上の拡散音成分を、1つ以上の直接音場成分の第2のセットに結合するステップと、をさらに含む装置。
前記入力信号から拡散データを取得するステップと、
前記入力信号から、音場成分ごとに直接成分と拡散成分を有する第1の音場成分グループのうち、1つ以上の音場成分を生成し、前記入力信号から、直接成分のみを有する第2の音場成分グループを生成するステップと、を含み、
前記生成は、前記第1の音場成分グループを生成する際にエネルギー補償を行うことを含み、前記エネルギー補償は、前記拡散データと前記第2の音場成分グループの数に依存する方法。
入力信号から方位データおよび拡散データを取得するステップと、
前記入力信号から導出される全方位成分に対する第1の振幅関連尺度を推定し、前記入力信号から導出される指向性成分に対する第2の振幅関連尺度を推定するためのステップと、
前記音場の音場成分を生成するステップであって、前記音場成分生成器は、前記第1の振幅関連尺度、前記第2の振幅関連尺度、前記方位データおよび前記拡散データを用いて、前記指向性成分のエネルギー補償を行うように構成されているステップと、
を含む方法。
入力信号を分析して、方位データおよび拡散データを導出するステップと、
前記入力信号から所定の次元およびモードまでの低次音記述を生成するステップであって、前記低次音生成器は、前記入力信号をコピーするか、または前記入力信号のチャンネルの加重結合を行うことにより、前記低次音記述を導出するように構成されているステップと、
前記所定の次元以上、または前記所定の次元および前記所定のモード以上で高次以下の中次音記述を、前記方位データおよび前記拡散データを用いて、少なくとも1つの直接部分および少なくとも1つの拡散部分の合成を用いて生成し、前記中次音記述が直接寄与および拡散寄与からなるようにするステップと、
拡散成分の合成を行わずに、少なくとも1つの直接部分の合成を用いて、高次以上の成分を持つ高次音記述を生成し、高次音記述が直接寄与のみで構成されるようにするステップと、
を含む方法。
[1] V. Pulkki, M-V Laitinen, J Vilkamo, J Ahonen, T Lokki and T Pihlajamaki, "Directional audio coding - perception-based reproduction of spatial sound", International Workshop on the Principles and Application on Spatial Hearing, Nov. 2009, Zao; Miyagi, Japan.
[2] M. V. Laitinen and V. Pulkki, "Converting 5.1 audio recordings to B-format for directional audio coding reproduction," 2011 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), Prague, 2011, pp. 61-64
[3] R. K. Furness, "Ambisonics―An overview," in AES 8th International Conference, April 1990, pp. 181―189.
[4] C. Nachbar, F. Zotter, E. Deleflie, and A. Sontacchi, "AMBIX - A Suggested Ambisonics Format", Proceedings of the Ambisonics Symposium 2011
[5] "APPARATUS, METHOD OR COMPUTER PROGRAM FOR GENERATING A SOUND FIELD DESCRIPTION" (corresponding to WO 2017/157803 A1)
Claims (21)
- 1つ以上のチャンネルを含む入力信号から音場記述を生成する装置であって、前記装置は、
前記入力信号から拡散データを得るための入力信号分析器(600)と、
音場成分ごとに直接成分および拡散成分を有する第1の音場成分グループのうちの1つ以上の音場成分を前記入力信号から生成し、直接成分のみを有する第2の音場成分グループを前記入力信号から生成するための音場成分生成器(650)と、
を備え、
前記音場成分生成器(650)は前記第1の音場成分グループを生成する際にエネルギー補償を行うように構成され、前記エネルギー補償は、前記拡散データと、前記第2の音場成分グループにおける音場成分の数、前記第1の音場成分グループにおける拡散成分の数、前記第1の音場成分グループの音場成分の最大次数、および前記第2の音場成分グループの音場成分の最大次数のうちの少なくとも1つとに依存する、装置。
- 前記音場成分生成器(650)は、
前記第1の音場成分グループの音場成分についての基準信号を提供するための基準信号提供器(821)と、
前記基準信号から脱相関信号を生成するための脱相関器(823、824)であって、
前記第1の音場成分グループの前記直接成分は前記基準信号から導出され、前記第1の音場成分グループの前記拡散成分は前記脱相関信号から導出される、脱相関器(823、824)と、
前記入力信号分析器(600)により提供された到来方位データおよび拡散データのうちの少なくとも1つを用いて、前記直接成分および前記拡散成分を混合するためのミキサー(825)と
を備える、
中次成分生成器(820)を備える、請求項1に記載の装置。
- 前記入力信号は1つのモノラルチャンネルのみを含み、前記第1の音場成分グループの前記音場成分は1次以上の音場成分である、または前記入力信号は2つ以上のチャンネルを含み、前記第1の音場成分グループの音場成分は2次以上の音場成分である、請求項1または2に記載の装置。
- 前記入力信号はモノラル信号または少なくとも2つのチャンネルを含み、前記音場成分生成器(650)は、前記入力信号をコピーまたは取り込む、あるいは前記入力信号の前記チャンネルの加重結合を行うことによって低次音場成分を生成するための低次成分生成器(810)を備える、請求項1ないし3の1項に記載の装置。
- 前記入力信号は前記モノラル信号を含み、前記低次成分生成器(810)は、前記モノラル信号(813、814)を取り込むまたはコピーすることによって、0次アンビソニックス信号を生成するように構成される、または
前記入力信号は少なくとも2つのチャンネルを含み、前記低次成分生成器(810)は、前記2つのチャンネルを加算して0次アンビソニックス信号を生成し、前記2つのチャンネル(815)の差分に基づいて1次アンビソニックス信号を生成するように構成される、または
前記入力信号は3つまたは4つのチャンネルを持つ1次アンビソニックス信号を含み、前記低次成分生成器(810)は、前記入力信号(813、814)の前記3つまたは4つのチャンネルを取り込むまたはコピーすることによって1次アンビソニックス信号を生成するように構成される、または
前記入力信号は4つのチャンネルを有するAフォーマット信号を含み、前記低次成分生成器(810)は、前記4つのチャンネル(816)の加重線形結合を行うことによって、1次アンビソニックス信号を計算するように構成される、
請求項4に記載の装置。
- 前記音場成分生成器(650)は、前記第2の音場成分グループの前記音場成分を生成するための高次成分生成器(830)を備え、前記第2の音場成分グループの前記音場成分は、前記第1の音場成分グループの前記音場成分を生成するために使用される打ち切り次元よりも高い次元を有する、請求項1ないし5の1項に記載の装置。
- 前記音場成分生成器(650)は、前記第1の音場成分グループの前記エネルギー補償を行うためのエネルギー補償器(900)を備え、前記エネルギー補償器(900)は、前記拡散データ、前記第1の音場成分グループの前記最大次数、および前記第2の音場成分グループの前記最大次数を用いて補償ゲインを算出するため、または前記拡散データ、前記第1の音場成分グループにおける拡散成分の数、および前記第2の音場成分グループの前記最大次数を用いて、補償ゲインを算出するための補償ゲイン計算機(910、920)を備える、請求項1ないし6の1項に記載の装置。
- 前記補償ゲイン計算機(910、920)は、
前記第2の音場成分グループにおける音場成分の数が増加すると前記補償ゲインを増加させる、または
前記第1の音場成分グループの音場成分の最大次数が増加すると前記補償ゲインを減少させる、または
拡散データの増加に伴って前記補償ゲインを増加させる、または
前記第2の音場成分グループの音場成分の最大次数が増加すると前記補償ゲインを増加させる、または
前記第1の音場成分グループにおける拡散成分の数が増加すると前記補償ゲインを減少させる
ように構成される、請求項7または8に記載の装置。
- 前記補償ゲイン計算機(910、920)は、前記入力信号から導出される全方位成分についての第1のエネルギーまたは振幅関連尺度をさらに使用して、また前記入力信号、前記拡散データ、および前記入力信号から得られる指向性データから導出される指向性成分についての第2のエネルギーまたは振幅関連尺度を用いて、前記補償ゲインを算出するように構成される、請求項8または9に記載の装置。
- 前記補償ゲイン計算機(910、920)は、前記拡散データと、前記第2の音場成分グループにおける音場成分の数、前記第1の音場成分グループにおける拡散成分の数、前記第1の音場成分グループの音場成分の前記最大次数、および前記第2の音場成分グループの音場成分の前記最大次数のうちの少なくとも1つとに依存して、第1のゲイン係数を計算し、前記入力信号から導出された全方位成分についての第1の振幅またはエネルギー関連尺度、前記入力信号から導出された指向性成分についての第2のエネルギーまたは振幅関連尺度、前記指向性データおよび前記拡散データに依存して第2のゲイン係数(g s )を計算し、前記第1のゲイン係数および前記第2のゲイン係数を用いて前記補償ゲインを計算するように構成される、請求項8ないし10の1項に記載の装置。
- 前記補償ゲイン計算機(910、920)は、固定された最大閾値または固定された最小閾値での制限を用いて、または低いまたは高いゲイン係数を中程度のゲイン係数に向かって圧縮して前記補償ゲインを得るための圧縮関数を用いて、ゲイン係数操作を実行するように構成される、請求項7ないし11の1項に記載の装置。
- 前記エネルギー補償器(900)は、前記補償ゲインを前記第1の音場成分グループの少なくとも1つの音場成分に適用するための補償ゲインアプリケータを備える、請求項7ないし12の1項に記載の装置。
- 前記補償ゲインアプリケータは、前記補償ゲインを、前記第1の音場成分グループの各音場成分に、または前記第1の音場成分グループの拡散部分を有する1つ以上の音場成分のみに、または前記第1の音場成分グループの音場成分の拡散部分に適用するように構成される、請求項13に記載の装置。
- 前記入力信号分析器(600)は、前記入力信号に関連付けられたメタデータから前記拡散データを抽出する、または、2つ以上のチャンネルまたは成分を有する前記入力信号の信号分析(610、620)によって前記入力信号から前記拡散データを抽出するように構成される、請求項1ないし14の1項に記載の装置。
- 前記入力信号は、入力次元までの1つまたは2つの音場成分のみを含み、前記音場成分生成器(650)は、前記第1の音場成分グループの前記音場成分と前記第2の音場成分グループの前記音場成分とを結合して前記入力次元よりも高い出力次元までの音場記述を得るための音場成分結合器(430)を備える、請求項1ないし15の1項に記載の装置。
- 複数の異なる時間-周波数タイルについて、前記第1の音場成分グループおよび前記第2の音場成分グループの前記1つ以上の音場成分を生成するための分析フィルタバンク(400)であって、前記入力信号分析器(600)は、各時間-周波数タイルについて拡散データ項目を取得するように構成され、前記音場成分生成器(650)は、各時間-周波数タイルについて別々に前記エネルギー補償を実行するように構成される、分析フィルタバンク(400)をさらに備える、請求項1ないし16の1項に記載の装置。
- 前記第1の音場成分グループの前記1つ以上の音場成分および前記第2の音場成分グループの前記1つ以上の音場成分を使用して、前記入力信号から生成された前記音場記述のスペクトル領域表現または時間領域表現を生成するための高次デコーダ(440)をさらに備える、請求項1ないし17の1項に記載の装置。
- 前記第1の音場成分グループと前記第2の音場成分グループとが互いに直交している、または前記音場成分は直交基底関数の係数、空間基底関数の係数、球形または円形調和関数の係数、およびアンビソニックス係数のうちの少なくとも1つである、請求項1ないし18の1項に記載の装置。
- 1つ以上のチャンネルを備える入力信号から音場記述を生成する方法であって、
前記入力信号から拡散データを取得するステップと、
前記入力信号から、各音場成分に指向性成分と拡散成分を有する第1の音場成分グループの1つ以上の音場成分を生成し、また前記入力信号から、指向性成分のみを有する第2の音場成分グループを生成するステップと、
を含み、
前記生成するステップは、前記第1の音場成分グループを生成する際にエネルギー補償を行うステップを含み、前記エネルギー補償は前記拡散データと、前記第2の音場成分グループにおける音場成分の数、前記第1の音場成分グループにおける拡散成分の数、前記第1の音場成分グループの音場成分の最大次数、および前記第2の音場成分グループの音場成分の最大次数のうちの少なくとも1つとに依存する、方法。
- コンピュータまたはプロセッサ上で実行されるときに、請求項20の方法を実行するためのコンピュータプログラム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP18211064 | 2018-12-07 | ||
EP18211064.3 | 2018-12-07 | ||
PCT/EP2019/084053 WO2020115309A1 (en) | 2018-12-07 | 2019-12-06 | Apparatus, method and computer program for encoding, decoding, scene processing and other procedures related to dirac based spatial audio coding using diffuse compensation |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022518663A JP2022518663A (ja) | 2022-03-16 |
JP7309876B2 true JP7309876B2 (ja) | 2023-07-18 |
Family
ID=64870294
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021532191A Active JP7309876B2 (ja) | 2018-12-07 | 2019-12-06 | 拡散補償を用いたDirACベースの空間音声符号化に関する符号化、復号化、シーン処理および他の手順を行う装置、方法およびコンピュータプログラム |
JP2021532193A Active JP7311602B2 (ja) | 2018-12-07 | 2019-12-06 | 低次、中次、高次成分生成器を用いたDirACベースの空間音声符号化に関する符号化、復号化、シーン処理および他の手順を行う装置、方法およびコンピュータプログラム |
JP2021532192A Active JP7311601B2 (ja) | 2018-12-07 | 2019-12-06 | 直接成分補償を用いたDirACベースの空間音声符号化に関する符号化、復号化、シーン処理および他の手順を行う装置、方法およびコンピュータプログラム |
Family Applications After (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021532193A Active JP7311602B2 (ja) | 2018-12-07 | 2019-12-06 | 低次、中次、高次成分生成器を用いたDirACベースの空間音声符号化に関する符号化、復号化、シーン処理および他の手順を行う装置、方法およびコンピュータプログラム |
JP2021532192A Active JP7311601B2 (ja) | 2018-12-07 | 2019-12-06 | 直接成分補償を用いたDirACベースの空間音声符号化に関する符号化、復号化、シーン処理および他の手順を行う装置、方法およびコンピュータプログラム |
Country Status (17)
Country | Link |
---|---|
US (6) | US11937075B2 (ja) |
EP (4) | EP3891736B1 (ja) |
JP (3) | JP7309876B2 (ja) |
KR (5) | KR102599744B1 (ja) |
CN (6) | CN117975975A (ja) |
AU (3) | AU2019392876B2 (ja) |
BR (3) | BR112021010956A2 (ja) |
CA (3) | CA3122164C (ja) |
ES (3) | ES2969138T3 (ja) |
FI (2) | FI3891736T3 (ja) |
MX (3) | MX2021006563A (ja) |
PL (3) | PL3891734T3 (ja) |
PT (2) | PT3891736T (ja) |
SG (3) | SG11202105719RA (ja) |
TW (3) | TWI745795B (ja) |
WO (3) | WO2020115309A1 (ja) |
ZA (3) | ZA202103739B (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20230084244A (ko) | 2020-10-09 | 2023-06-12 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 대역폭 확장을 사용하여, 인코딩된 오디오 장면을 프로세싱하기 위한 장치, 방법, 또는 컴퓨터 프로그램 |
CN116438598A (zh) | 2020-10-09 | 2023-07-14 | 弗劳恩霍夫应用研究促进协会 | 使用参数平滑来处理编码音频场景的装置、方法或计算机程序 |
KR20230084251A (ko) | 2020-10-09 | 2023-06-12 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 파라미터 변환을 사용하여, 인코딩된 오디오 장면을 프로세싱하기 위한 장치, 방법, 또는 컴퓨터 프로그램 |
JP2024048967A (ja) * | 2022-09-28 | 2024-04-09 | パナソニックIpマネジメント株式会社 | 音場再現装置、音場再現方法及び音場再現システム |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017157803A1 (en) | 2016-03-15 | 2017-09-21 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method or computer program for generating a sound field description |
Family Cites Families (48)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7031474B1 (en) | 1999-10-04 | 2006-04-18 | Srs Labs, Inc. | Acoustic correction apparatus |
US7515719B2 (en) | 2001-03-27 | 2009-04-07 | Cambridge Mechatronics Limited | Method and apparatus to create a sound field |
ES2271654T3 (es) * | 2002-08-07 | 2007-04-16 | Dolby Laboratories Licensing Corporation | Conversion espacial de canales de audio. |
TWI313857B (en) | 2005-04-12 | 2009-08-21 | Coding Tech Ab | Apparatus for generating a parameter representation of a multi-channel signal and method for representing multi-channel audio signals |
US7974713B2 (en) | 2005-10-12 | 2011-07-05 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Temporal and spatial shaping of multi-channel audio signals |
DE102006050068B4 (de) * | 2006-10-24 | 2010-11-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Erzeugen eines Umgebungssignals aus einem Audiosignal, Vorrichtung und Verfahren zum Ableiten eines Mehrkanal-Audiosignals aus einem Audiosignal und Computerprogramm |
US8180062B2 (en) * | 2007-05-30 | 2012-05-15 | Nokia Corporation | Spatial sound zooming |
DE102008004674A1 (de) * | 2007-12-17 | 2009-06-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Signalaufnahme mit variabler Richtcharakteristik |
US8811621B2 (en) | 2008-05-23 | 2014-08-19 | Koninklijke Philips N.V. | Parametric stereo upmix apparatus, a parametric stereo decoder, a parametric stereo downmix apparatus, a parametric stereo encoder |
US8452019B1 (en) * | 2008-07-08 | 2013-05-28 | National Acquisition Sub, Inc. | Testing and calibration for audio processing system with noise cancelation based on selected nulls |
EP2249334A1 (en) * | 2009-05-08 | 2010-11-10 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio format transcoder |
SG177277A1 (en) | 2009-06-24 | 2012-02-28 | Fraunhofer Ges Forschung | Audio signal decoder, method for decoding an audio signal and computer program using cascaded audio object processing stages |
EP2510709A4 (en) * | 2009-12-10 | 2015-04-08 | Reality Ip Pty Ltd | IMPROVED MATRIX DECODER FOR SURROUND SOUND |
EP2647005B1 (en) | 2010-12-03 | 2017-08-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for geometry-based spatial audio coding |
EP2469741A1 (en) * | 2010-12-21 | 2012-06-27 | Thomson Licensing | Method and apparatus for encoding and decoding successive frames of an ambisonics representation of a 2- or 3-dimensional sound field |
WO2013141768A1 (en) * | 2012-03-22 | 2013-09-26 | Dirac Research Ab | Audio precompensation controller design using a variable set of support loudspeakers |
US9473870B2 (en) | 2012-07-16 | 2016-10-18 | Qualcomm Incorporated | Loudspeaker position compensation with 3D-audio hierarchical coding |
WO2014013070A1 (en) | 2012-07-19 | 2014-01-23 | Thomson Licensing | Method and device for improving the rendering of multi-channel audio signals |
US9460729B2 (en) | 2012-09-21 | 2016-10-04 | Dolby Laboratories Licensing Corporation | Layered approach to spatial audio coding |
US10136239B1 (en) * | 2012-09-26 | 2018-11-20 | Foundation For Research And Technology—Hellas (F.O.R.T.H.) | Capturing and reproducing spatial sound apparatuses, methods, and systems |
EP2782094A1 (en) * | 2013-03-22 | 2014-09-24 | Thomson Licensing | Method and apparatus for enhancing directivity of a 1st order Ambisonics signal |
EP2790419A1 (en) | 2013-04-12 | 2014-10-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for center signal scaling and stereophonic enhancement based on a signal-to-downmix ratio |
BR112015030103B1 (pt) * | 2013-05-29 | 2021-12-28 | Qualcomm Incorporated | Compressão de representações decomposta de campo sonoro |
US9716959B2 (en) | 2013-05-29 | 2017-07-25 | Qualcomm Incorporated | Compensating for error in decomposed representations of sound fields |
US9691406B2 (en) | 2013-06-05 | 2017-06-27 | Dolby Laboratories Licensing Corporation | Method for encoding audio signals, apparatus for encoding audio signals, method for decoding audio signals and apparatus for decoding audio signals |
GB2521649B (en) * | 2013-12-27 | 2018-12-12 | Nokia Technologies Oy | Method, apparatus, computer program code and storage medium for processing audio signals |
CN104768121A (zh) | 2014-01-03 | 2015-07-08 | 杜比实验室特许公司 | 响应于多通道音频通过使用至少一个反馈延迟网络产生双耳音频 |
US9922656B2 (en) | 2014-01-30 | 2018-03-20 | Qualcomm Incorporated | Transitioning of ambient higher-order ambisonic coefficients |
US9502045B2 (en) * | 2014-01-30 | 2016-11-22 | Qualcomm Incorporated | Coding independent frames of ambient higher-order ambisonic coefficients |
US10412522B2 (en) * | 2014-03-21 | 2019-09-10 | Qualcomm Incorporated | Inserting audio channels into descriptions of soundfields |
EP2922057A1 (en) | 2014-03-21 | 2015-09-23 | Thomson Licensing | Method for compressing a Higher Order Ambisonics (HOA) signal, method for decompressing a compressed HOA signal, apparatus for compressing a HOA signal, and apparatus for decompressing a compressed HOA signal |
EP2942982A1 (en) * | 2014-05-05 | 2015-11-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | System, apparatus and method for consistent acoustic scene reproduction based on informed spatial filtering |
US20150332682A1 (en) * | 2014-05-16 | 2015-11-19 | Qualcomm Incorporated | Spatial relation coding for higher order ambisonic coefficients |
US9847087B2 (en) * | 2014-05-16 | 2017-12-19 | Qualcomm Incorporated | Higher order ambisonics signal compression |
US9847088B2 (en) * | 2014-08-29 | 2017-12-19 | Qualcomm Incorporated | Intermediate compression for higher order ambisonic audio data |
EP3251116A4 (en) | 2015-01-30 | 2018-07-25 | DTS, Inc. | System and method for capturing, encoding, distributing, and decoding immersive audio |
EP3712553B1 (en) * | 2015-09-14 | 2024-03-20 | Thorlabs, Inc. | Apparatus and methods for one or more wavelength swept lasers and the detection of signals thereof |
WO2017085140A1 (en) * | 2015-11-17 | 2017-05-26 | Dolby International Ab | Method and apparatus for converting a channel-based 3d audio signal to an hoa audio signal |
EP3472832A4 (en) * | 2016-06-17 | 2020-03-11 | DTS, Inc. | DISTANCE-BASED PANORAMIC USING NEAR / FAR FIELD RENDERING |
EP3346726A1 (en) | 2017-01-04 | 2018-07-11 | Harman Becker Automotive Systems GmbH | Arrangements and methods for active noise cancelling |
US10332530B2 (en) * | 2017-01-27 | 2019-06-25 | Google Llc | Coding of a soundfield representation |
US20180333103A1 (en) * | 2017-05-18 | 2018-11-22 | One Health Group, LLC | Algorithmic Approach for Estimation of Respiration and Heart Rates |
SG11202000287RA (en) * | 2017-07-14 | 2020-02-27 | Fraunhofer Ges Forschung | Concept for generating an enhanced sound-field description or a modified sound field description using a depth-extended dirac technique or other techniques |
CA3134343A1 (en) * | 2017-10-04 | 2019-04-11 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus, method and computer program for encoding, decoding, scene processing and other procedures related to dirac based spatial audio coding |
TWM564300U (zh) * | 2018-05-04 | 2018-07-21 | 十銓科技股份有限公司 | 耳道式耳機 |
GB2575305A (en) * | 2018-07-05 | 2020-01-08 | Nokia Technologies Oy | Determination of spatial audio parameter encoding and associated decoding |
GB2576769A (en) * | 2018-08-31 | 2020-03-04 | Nokia Technologies Oy | Spatial parameter signalling |
EP3675522A1 (en) * | 2018-12-28 | 2020-07-01 | Sonion Nederland B.V. | Miniature speaker with essentially no acoustical leakage |
-
2019
- 2019-12-06 SG SG11202105719RA patent/SG11202105719RA/en unknown
- 2019-12-06 PT PT198130569T patent/PT3891736T/pt unknown
- 2019-12-06 CN CN202410183944.0A patent/CN117975975A/zh active Pending
- 2019-12-06 BR BR112021010956-0A patent/BR112021010956A2/pt unknown
- 2019-12-06 SG SG11202105712QA patent/SG11202105712QA/en unknown
- 2019-12-06 PL PL19813054.4T patent/PL3891734T3/pl unknown
- 2019-12-06 EP EP19813056.9A patent/EP3891736B1/en active Active
- 2019-12-06 ES ES19813055T patent/ES2969138T3/es active Active
- 2019-12-06 FI FIEP19813056.9T patent/FI3891736T3/fi active
- 2019-12-06 KR KR1020217020825A patent/KR102599744B1/ko active IP Right Grant
- 2019-12-06 PL PL19813055.1T patent/PL3891735T3/pl unknown
- 2019-12-06 CN CN202410184136.6A patent/CN117953905A/zh active Pending
- 2019-12-06 TW TW108144763A patent/TWI745795B/zh active
- 2019-12-06 CA CA3122164A patent/CA3122164C/en active Active
- 2019-12-06 CN CN202410002187.2A patent/CN117809663A/zh active Pending
- 2019-12-06 KR KR1020217020827A patent/KR20210102924A/ko active IP Right Grant
- 2019-12-06 CN CN201980091649.XA patent/CN113424257B/zh active Active
- 2019-12-06 AU AU2019392876A patent/AU2019392876B2/en active Active
- 2019-12-06 TW TW108144764A patent/TWI751457B/zh active
- 2019-12-06 BR BR112021010972-2A patent/BR112021010972A2/pt unknown
- 2019-12-06 JP JP2021532191A patent/JP7309876B2/ja active Active
- 2019-12-06 EP EP19813055.1A patent/EP3891735B1/en active Active
- 2019-12-06 KR KR1020237024910A patent/KR20230113413A/ko not_active Application Discontinuation
- 2019-12-06 TW TW108144765A patent/TWI747095B/zh active
- 2019-12-06 JP JP2021532193A patent/JP7311602B2/ja active Active
- 2019-12-06 WO PCT/EP2019/084053 patent/WO2020115309A1/en unknown
- 2019-12-06 WO PCT/EP2019/084056 patent/WO2020115311A1/en unknown
- 2019-12-06 AU AU2019394097A patent/AU2019394097B2/en active Active
- 2019-12-06 WO PCT/EP2019/084055 patent/WO2020115310A1/en unknown
- 2019-12-06 MX MX2021006563A patent/MX2021006563A/es unknown
- 2019-12-06 KR KR1020217020826A patent/KR102590816B1/ko active IP Right Grant
- 2019-12-06 SG SG11202105720RA patent/SG11202105720RA/en unknown
- 2019-12-06 JP JP2021532192A patent/JP7311601B2/ja active Active
- 2019-12-06 EP EP23150192.5A patent/EP4191580A1/en active Pending
- 2019-12-06 EP EP19813054.4A patent/EP3891734B1/en active Active
- 2019-12-06 AU AU2019392988A patent/AU2019392988B2/en active Active
- 2019-12-06 ES ES19813056T patent/ES2940286T3/es active Active
- 2019-12-06 PL PL19813056.9T patent/PL3891736T3/pl unknown
- 2019-12-06 PT PT198130544T patent/PT3891734T/pt unknown
- 2019-12-06 KR KR1020237024795A patent/KR20230112750A/ko not_active Application Discontinuation
- 2019-12-06 CN CN201980091619.9A patent/CN113454715B/zh active Active
- 2019-12-06 MX MX2021006565A patent/MX2021006565A/es unknown
- 2019-12-06 FI FIEP19813054.4T patent/FI3891734T3/fi active
- 2019-12-06 CN CN201980091648.5A patent/CN113439303B/zh active Active
- 2019-12-06 ES ES19813054T patent/ES2941268T3/es active Active
- 2019-12-06 MX MX2021006572A patent/MX2021006572A/es unknown
- 2019-12-06 CA CA3122168A patent/CA3122168C/en active Active
- 2019-12-06 BR BR112021010964-1A patent/BR112021010964A2/pt unknown
- 2019-12-06 CA CA3122170A patent/CA3122170C/en active Active
-
2021
- 2021-05-27 US US17/332,358 patent/US11937075B2/en active Active
- 2021-05-27 US US17/332,340 patent/US11856389B2/en active Active
- 2021-05-27 US US17/332,312 patent/US11838743B2/en active Active
- 2021-05-31 ZA ZA2021/03739A patent/ZA202103739B/en unknown
- 2021-05-31 ZA ZA2021/03738A patent/ZA202103738B/en unknown
- 2021-05-31 ZA ZA2021/03741A patent/ZA202103741B/en unknown
-
2023
- 2023-08-02 US US18/363,978 patent/US20230379652A1/en active Pending
- 2023-08-10 US US18/447,486 patent/US20230396949A1/en active Pending
- 2023-10-06 US US18/482,478 patent/US20240040330A1/en active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017157803A1 (en) | 2016-03-15 | 2017-09-21 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method or computer program for generating a sound field description |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7309876B2 (ja) | 拡散補償を用いたDirACベースの空間音声符号化に関する符号化、復号化、シーン処理および他の手順を行う装置、方法およびコンピュータプログラム | |
RU2772423C1 (ru) | Устройство, способ и компьютерная программа для кодирования, декодирования, обработки сцены и других процедур, связанных с пространственным аудиокодированием на основе dirac с использованием генераторов компонент низкого порядка, среднего порядка и высокого порядка | |
RU2782511C1 (ru) | Устройство, способ и компьютерная программа для кодирования, декодирования, обработки сцены и других процедур, связанных с пространственным аудиокодированием на основе dirac с использованием компенсации прямых компонент | |
RU2779415C1 (ru) | Устройство, способ и компьютерная программа для кодирования, декодирования, обработки сцены и других процедур, связанных с пространственным аудиокодированием на основе dirac с использованием диффузной компенсации |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210810 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220804 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220816 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20221114 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230216 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230606 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230705 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7309876 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |