JP6710768B2 - 音場データを処理するための装置および方法 - Google Patents

音場データを処理するための装置および方法 Download PDF

Info

Publication number
JP6710768B2
JP6710768B2 JP2018539099A JP2018539099A JP6710768B2 JP 6710768 B2 JP6710768 B2 JP 6710768B2 JP 2018539099 A JP2018539099 A JP 2018539099A JP 2018539099 A JP2018539099 A JP 2018539099A JP 6710768 B2 JP6710768 B2 JP 6710768B2
Authority
JP
Japan
Prior art keywords
sound field
field data
weighted
zone
bright
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018539099A
Other languages
English (en)
Other versions
JP2019507542A (ja
Inventor
パンジ・セティアワン
ウェンユ・ジン
Original Assignee
ホアウェイ・テクノロジーズ・カンパニー・リミテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ホアウェイ・テクノロジーズ・カンパニー・リミテッド filed Critical ホアウェイ・テクノロジーズ・カンパニー・リミテッド
Publication of JP2019507542A publication Critical patent/JP2019507542A/ja
Application granted granted Critical
Publication of JP6710768B2 publication Critical patent/JP6710768B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/302Electronic adaptation of stereophonic sound system to listener position or orientation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0012Smoothing of parameters of the decoder interpolation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/01Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/11Application of ambisonics in stereophonic audio systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/13Application of wave-field synthesis in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)
  • Stereophonic System (AREA)

Description

一般に、本発明は、オーディオ信号の処理および再現の分野に関する。より詳細には、本発明は、音場データを処理および再現するための装置および方法に関する。
空間の広範な領域にわたる空間マルチゾーン音場再現が、同時車載エンターテイメントシステム、展示会場のサラウンドサウンドシステム、共有オフィススペースにおけるパーソナルスピーカシステム、および騒々しい環境における静かなゾーン(quiet zone)などの、その様々な応用のために近年ますます注目されており、その目指すところは、音響障壁やヘッドフォンを使用しなくても、聞き手に個別の音環境を提供することである。一般に、音場は、例えば複数のスピーカによって放出される音響信号によって生じる、周囲圧力からの局所的な空気圧の変動、すなわち圧力変動を空間および時間の関数として表すと考えることができる。マルチゾーン音場は、1つ以上の音響学的に明るいゾーン(acoustically bright zone)と、場合によってはいくつかの音響学的に静かなゾーンと、を通常含み得る。
マルチゾーン音再現のいわゆる「非頑健性」問題が、Poletti,M.,”An investigation of 2D multizone surround sound system,”Proc.AES 125th Convention Audio Eng.Society,2008において、2つの選択された領域間における、音響学的に明るいゾーンの音よりもさらに大きな振幅を有する、極めてはっきりとした不要な音の形態で特定されている。実際には、マルチゾーン音場におけるそのような挙動は、これらの領域内の不快なユーザ体験につながる可能性がある。
従って、特に上述の「非頑健性」問題に対処する、音場データを処理するための改良された装置および方法が必要とされている。
Poletti,M.,"An investigation of 2D multizone surround sound system,"Proc.AES 125th Convention Audio Eng.Society,2008
本発明の目的は、特に、周知の装置および方法に固有の「非頑健性」問題に対処する、音場データを処理するための改良された装置を提供することである。
上記および他の目的は、独立請求項の主題によって達成される。さらなる実装形態は、従属請求項、明細書および図面から明らかである。
第1の態様によれば、本発明は、音場データを処理するための装置であって、音場データが、少なくとも1つの音響学的に明るいゾーンと少なくとも1つの音響学的に静かなゾーンとを含む空間再現領域内の音場を定義する、装置に関する。装置は、重み付けされた音場を定義する重み付けされた音場データを取得するために、空間的に連続的に変化する重み関数を音場データに適用し、空間的に連続的に変化する重み関数が、明るいゾーンおよび/または静かなゾーンの音場を強化するように構成される、ように構成されたアプリケータを備える。
音場を定義する音場データに対して、空間的に連続的に、すなわち滑らかに変化する重み関数を適用することにより、明るいゾーンおよび/または静かなゾーンの音場を強化することによって、周知のデバイスの妨げとなる「非頑健性問題」を解決することができる。
本明細書において、用語「音場データ」は、それが表す音の指向特性に関する情報を含む任意のデータを指すために使用される。音場データは、様々な異なるフォーマットで表現することができ、それぞれが、定義された数のオーディオチャネルを有し、かつ表現された音を再現するためには異なる解釈を必要とする。このようなフォーマットの例としては、ステレオ、5.1サラウンドサウンド、および音場の球面調和表現を使用する高次アンビソニック(HOA)フォーマットなどのフォーマットが挙げられる。
音場データによって定義される音場の空間再現領域は、複数の異なる形状を有することができる。一実装形態では、音場は、空間再現領域、明るいゾーンおよび静かなゾーンが、2次元平面内に置かれる、3次元または2次元であり得る。一実装形態では、明るいゾーンおよび静かなゾーンは、球形、円筒形または円形の形状を有し得る。他の形状も可能である。
上記のような第1の態様による装置の第1の可能な実装形態では、装置は、重み付けされた音場に関連する性能指標に基づいて音場データを圧縮するように構成された圧縮器をさらに備える。
このことにより、圧縮器によって適用される圧縮率を性能指標に適合させることができ、従って、重み付けされた音場データのサイズを縮小することができる。このことは、特に、例えば重み付けされた音場データの送信または格納のための圧縮が、例えば重み付けされた音場データを再現するための、圧縮された重み付けされた音場データの復元から時間および/または空間において分離される実装形態に有利である。
第1の態様の第1の実装形態による装置の第2の可能な実装形態では、重み付けされた音場に関連する性能指標が所定の性能指標閾値と異なる場合に、圧縮器が音場データを圧縮するように構成される。
例えば実際の聞き手を起用した指標に基づいて、所定の性能指標閾値を使用することによって、圧縮器は、圧縮率をいつ調整するかを効率的に決定できる。
第1の態様の第1または第2の実装形態による装置の第3の可能な実装形態では、重み付けされた音場に関連する性能指標は、重み付けされた音場の少なくとも1つの明るいゾーンと少なくとも1つの静かなゾーンとの間の音響学的コントラストである。
第1の態様の第3の実装形態による装置の第4の可能な実装形態では、重み付けされた音場の明るいゾーンと静かなゾーンとの間の音響学的コントラストは、明るいゾーンにおける重み付けされた音場の平均と、静かなゾーンにおける重み付けされた音場の平均との間の比に基づく。
第1の態様の第4の実装形態による装置の第5の可能な実装形態では、重み付けされた音場の明るいゾーンと静かなゾーンとの間の音響学的コントラストは、以下の式、すなわち、
Figure 0006710768
に基づき、ここで、ε(t)は、時間の関数としての音響学的コントラストを示し、S(x,t)は、空間および時間の関数として音場を定義する音場データを示し、w(x)は、空間的に連続的に変化する重み関数を示し、DbおよびDqは、それぞれ、明るい領域のサイズおよび静かな領域のサイズを示す。
上記のような第1の態様またはその第1から第5の実装形態のいずれか1つによる装置の第6の可能な実装形態では、空間的に連続的に変化する重み関数は、明るい領域および静かな領域の外側の空間再現領域の部分に対して、明るい領域および静かな領域における音場データに関連する音場を強化するように構成された、滑らかに変化する関数である。
上記のような第1の態様またはその第1から第6の実装形態のいずれか1つによる装置の第7の可能な実装形態では、空間的に連続的に変化する重み関数は、明るいゾーンの中心を中心とする第1の正規分布と、静かなゾーンの中心を中心とする第2の正規分布と、の線形結合である。
正規分布は、それぞれ、明るいゾーンおよび静かなゾーンの中心に対する聞き手の頭部のランダムな動きに対して、良好な近似を提供する。
一実装形態では、空間的に連続的に変化する重み関数は、以下の式、すなわち、
Figure 0006710768
によって定義でき、ここで、w(x)は、空間的に連続的に変化する重み関数を示し、0bは明るいゾーンの中心を示し、0qは静かなゾーンの中心を示し、a、b、σaおよびσbは所定の重み関数パラメータを示す。
上記のような第1の態様またはその第1から第7の実装形態のいずれか1つによる装置の第8の可能な実装形態では、音場データは、HOA Bフォーマットで符号化される。
上記のような第1の態様またはその第1から第8の実装形態のいずれか1つによる装置の第9の可能な実装形態では、装置は、空間的に連続的に変化する重み関数によって重み付けされる音場データを格納するように構成されたメモリをさらに備える。これは、エンコーダ側で行うこともデコーダ側で行うこともできる。
上記のような第1の態様またはその第1から第9の実装形態のいずれか1つによる装置の第10の可能な実装形態では、装置は、重み付けされた音場データに基づいて重み付けされた音場をレンダリングするように構成された、レンダラー、特に少なくとも1つのスピーカをさらに備える。
第2の態様によれば、本発明は、上記のような第1の態様またはその第1から第10の実装形態のいずれか1つによる音場データを処理するための装置と、音場再現装置であって、音場再現装置が、第1の態様による装置から重み付けされた音場データを受信するように構成され、かつ重み付けされた音場データに基づいて重み付けされた音場をレンダリングするように構成された、レンダラー、特に少なくとも1つのスピーカを備える、音場再現装置と、を備える、音場再現システムに関する。
上記のような第2の態様による音場再現システムの第1の可能な実装形態では、音場再現装置は、重み付けされた音場に基づいて性能指標を決定し、かつ重み付けされた音場に関連する決定された性能指標を、第1の態様による装置の圧縮器にフィードバックするように構成された、性能指標決定部をさらに備える。
第3の態様によれば、本発明は、音場データを処理するための方法であって、音場データが、少なくとも1つの明るいゾーンと少なくとも1つの静かなゾーンとを含む空間再現領域内の音場を定義する、方法に関する。本方法は、重み付けされた音場を定義する重み付けされた音場データを取得するために、空間的に連続的に変化する重み関数を音場データに適用するステップであって、空間的に連続的に変化する重み関数が、明るいゾーンおよび/または静かなゾーンの音場を強化するように構成される、ステップを含む。
第3の態様による方法の第1の可能な実装形態では、本方法は、重み付けされた音場に関連する性能指標に基づいて音場データを圧縮する、さらなるステップを含む。
第2の態様の第1の実装形態による方法の第2の可能な実装形態では、重み付けされた音場に関連する性能指標が所定の性能指標閾値と異なる場合に、音場データが圧縮される。
第2の態様の第1または第2の実装形態による方法の第3の可能な実装形態では、重み付けされた音場に関連する性能指標は、重み付けされた音場の少なくとも1つの明るいゾーンと少なくとも1つの静かなゾーンとの間の音響学的コントラストである。
第2の態様の第3の実装形態による方法の第4の可能な実装形態では、重み付けされた音場の明るいゾーンと静かなゾーンとの間の音響学的コントラストは、明るいゾーンにおける重み付けされた音場の平均と、静かなゾーンにおける重み付けされた音場の平均との間の比に基づく。
第2の態様の第4の実装形態による方法の第5の可能な実装形態では、重み付けされた音場の明るいゾーンと静かなゾーンとの間の音響学的コントラストは、以下の式、すなわち、
Figure 0006710768
に基づき、ここで、ε(t)は、時間の関数としての音響学的コントラストを示し、S(x,t)は、空間および時間の関数として音場を定義する音場データを示し、w(x)は、空間的に連続的に変化する重み関数を示し、DbおよびDqは、それぞれ、明るい領域のサイズおよび静かな領域のサイズを示す。
上記のような第2の態様またはその第1から第5の実装形態のいずれか1つによる方法の第6の可能な実装形態では、空間的に連続的に変化する重み関数は、明るい領域および静かな領域の外側の空間再現領域の部分に対して、明るい領域および静かな領域における音場データに関連する音場を強化するように構成された、滑らかに変化する関数である。
上記のような第2の態様またはその第1から第6の実装形態のいずれか1つによる方法の第7の可能な実装形態では、空間的に連続的に変化する重み関数は、明るいゾーンの中心を中心とする第1の正規分布と、静かなゾーンの中心を中心とする第2の正規分布と、の線形結合である。
一実装形態では、空間的に連続的に変化する重み関数は、以下の式、すなわち、
Figure 0006710768
によって定義でき、ここで、w(x)は、空間的に連続的に変化する重み関数を示し、0bは明るいゾーンの中心を示し、0qは静かなゾーンの中心を示し、a、b、σaおよびσbは所定の重み関数パラメータを示す。
上記のような第2の態様またはその第1から第7の実装形態のいずれか1つによる方法の第8の可能な実装形態では、音場データは、HOA Bフォーマットで符号化される。
上記のような第2の態様またはその第1から第8の実装形態のいずれか1つによる方法の第9の可能な実装形態では、本方法は、空間的に連続的に変化する重み関数によって重み付けされる音場データをメモリに格納する、さらなるステップを含む。
上記のような第2の態様またはその第1から第9の実装形態のいずれか1つによる方法の第10の可能な実装形態では、本方法は、重み付けされた音場データに基づいて重み付けされた音場をレンダリングする、さらなるステップを含む。
第4の態様によれば、本発明は、コンピュータ上で実行された場合に、本発明の第3の態様またはその実装形態のいずれか1つによる方法を実行するためのプログラムコードを含むコンピュータプログラムに関する。
本発明は、ハードウェアおよび/またはソフトウェアで実施することができる。
以下の図面を参照しながら、本発明のさらなる実施形態を説明する。
一実施形態による、音場データを処理するための装置の概略図を示す。 一実施形態による、音場データを処理するための方法の概略図を示す。 一実施形態による、音場データを処理するための装置を備える一実施形態による音場再現システムの概略図を示す。 図3に示す音場再現システムにおいて実施され得る複数の異なる圧縮技法に関する伝送ビットレートの関数としての平均音響学的コントラスト性能の依存度を説明する図を示す。 一実施形態による、音場データを処理するための装置の概略図を示す。 本発明の実施形態の異なる態様を説明する概略図を示す。 本発明の実施形態の異なる態様を説明する概略図を示す。
様々な図において、同一または少なくとも機能的に等価な特徴について、同一の参照符号が使用される。
以下の説明では、本開示の一部を形成し、かつ本発明を配置することができる特定の態様を例示として示す、添付の図面を参照する。本発明の範囲から逸脱することなく、他の態様を利用することができ、構造的または論理的変更を行うことができることを理解されたい。従って、本発明の範囲は添付の特許請求の範囲で定義されることから、以下の「発明を実施するための形態」は、限定的な意味で解釈されるべきではない。
例えば、説明される方法に関連する開示は、その方法を実行するように構成された対応する装置またはシステムに対しても当てはまり、逆もまた同様であることを理解されたい。例えば、特定の方法ステップが説明されている場合、対応する装置は、そのようなユニットが明示的に説明または図示されていなくても、説明された方法ステップを実行するようなユニットを含むことができる。さらに、特に断らない限り、本明細書で説明される様々な例示的な態様の特徴は、互いに組み合わされてもよいことを理解されたい。
図1は、音場データを処理するための装置100の概略図を示す。図1の右側に概略的に示すように、音場データは、少なくとも1つの明るいゾーン101aと少なくとも1つの静かなゾーン101bとを含む空間再現領域101内の音場を定義する。
本明細書において、用語「音場データ」は、それが表す音の指向特性に関する情報を含む任意のデータを指すために使用される。音場データは、様々な異なるフォーマットで表現することができ、それぞれが、定義された数のオーディオチャネルを有し、かつ表現された音を再現するためには異なる解釈を必要とする。このようなフォーマットの例としては、ステレオ、5.1サラウンドサウンド、および高次アンビソニック(HOA)フォーマット、特にHOA Bフォーマットなどのフォーマットが挙げられる。
音場データによって定義される音場の空間再現領域は、複数の異なる形状を有することができる。一実装形態では、音場は、空間再現領域、明るいゾーンおよび静かなゾーンが、2次元平面内に置かれる、3次元または2次元であり得る。一実装形態では、明るいゾーンおよび静かなゾーンは、球形、円筒形または円形の形状を有し得る。他の形状も可能である。
装置100は、重み付けされた音場を定義する重み付けされた音場データを取得するために、空間的に連続的に変化する重み関数を音場データに適用するように構成されたアプリケータ103を備える。空間的に連続的に変化する重み関数は、空間再現領域101の明るいゾーン101aおよび/または静かなゾーン101bの音場を強化するように構成される。
一実施形態では、装置100は、重み付けされた音場に関連する性能指標に基づいて音場データを圧縮するように構成された圧縮器105をさらに備える。
一実施形態では、重み付けされた音場に関連する性能指標が所定の性能指標閾値と異なる場合に、圧縮器105が音場データを圧縮するように構成される。
一実施形態では、重み付けされた音場に関連する性能指標は、重み付けされた音場の少なくとも1つの明るいゾーン101aと少なくとも1つの静かなゾーン101bとの間の音響学的コントラストである。
一実施形態では、明るいゾーン101aと静かなゾーン101bとの間の音響学的コントラストは、明るいゾーン101aにおける重み付けされた音場の平均と、静かなゾーン101bにおける重み付けされた音場の平均との間の比に基づく。
一実施形態では、明るいゾーン101aと静かなゾーン101bとの間の音響学的コントラストは、以下の式、すなわち、
Figure 0006710768
に基づき、ここで、ε(t)は、時間の関数としての音響学的コントラストを示し、S(x,t)は、空間および時間の関数として音場データに関連する音場を示し、w(x)は、空間的に連続的に変化する重み関数を示し、DbおよびDqは、それぞれ、明るい領域101aのサイズおよび静かな領域101bのサイズを示す。
一実施形態では、空間的に連続的に変化する重み関数は、明るい領域101aおよび静かな領域101bの外側の空間再現領域101の部分に対して、明るい領域101aおよび静かな領域101bにおける音場データに関連する音場を強化するように構成された、滑らかに変化する関数である。
一実施形態では、空間的に連続的に変化する重み関数は、明るいゾーン101aの中心を中心とする第1の正規分布と、静かなゾーン101bの中心を中心とする第2の正規分布と、の線形結合である。空間的に連続的に変化する重み関数のこの好ましい選択は、聞き手の頭部(耳)の位置が、聞き手の胴体の動きに起因して、明るい領域および/または静かな領域内で静止していることが実際には保証されないという発見に基づいている。むしろ、聞き手の頭部位置の分布は、それぞれ、明るいゾーンおよび静かなゾーンの中心までの距離のガウス分布関数としてモデル化することができる。よって、一実施形態では、空間的に連続的に変化する重み関数は、以下の式、すなわち、
Figure 0006710768
によって定義でき、ここで、w(x)は、空間的に連続的に変化する重み関数を示し、0bは明るいゾーンの中心を示し、0qは静かなゾーンの中心を示し、a、b、σaおよびσbは所定の重み関数パラメータを示す。
重み関数の上記の好ましい選択により、聞き手の頭部が明るいゾーンの中心(または同等に、静かなゾーンの中心)から半径r/2の円内に位置する確率は、68.3%である。重み関数のこの選択により、システムは、滑らかにかつ連続的に変化する重み関数の導入に起因して、より柔軟かつ効率的な方式で、異なるゾーンにわたって再現精度の重要度を分配する。聞き手の耳が現れる可能性が高い領域(例えば、明るいゾーンおよび静かなゾーンの中央の領域)は、より重点が置かれ、一部の領域では、明るいゾーンおよび静かなゾーンの外部での偽の音の発生を軽減するために、再現の努力が邪魔される場合がある(例えば、明るいゾーンおよび静かなゾーンの縁部)。
図2は、一実施形態による音場データを処理するための方法200の概略図を示しており、例えば、図1に示す空間再現領域101内の音場を定義する音場データは、音響学的に明るいゾーン101aと音響学的に静かなゾーン101bとを含む。
方法200は、重み付けされた音場を定義する重み付けされた音場データを取得するために、空間的に連続的に変化する重み関数、例えば上式(2)で定義された空間的に連続的に変化する重み関数を音場データに適用するステップであって、空間的に連続的に変化する重み関数が、明るいゾーン101aおよび/または静かなゾーン101bの音場を強化するように構成される、ステップ201を含む。
音場データを処理するための装置100および音場データを処理するための方法200のさらなる実装形態、実施形態および態様について以下に説明する。
図3は、一実施形態による音場データを処理するための装置100を備える一実施形態による音場再現システム300の概略図を示す。
図3に示す音場データを処理するための装置100の実施形態では、図1に示すアプリケータ103を「マルチゾーンHOAフォーマット変換器」103と呼び、図1に示す圧縮器105を「圧縮」と呼ぶ。アプリケータ103および圧縮器105に加えて、図3に示す音場データを処理するための装置100の実施形態は、元の、すなわち重み付けされていない音場データを取得するように構成された取得装置107を備える。一実施形態では、取得装置107は、32チャネルのEigenmike(登録商標)などの1つ以上のマイクロフォンを備えることができる。一実施形態では、取得装置107は、別のデバイスから、元の、すなわち重み付けされていない音場データを受信するように構成された通信インターフェイスであってもよい。
一実施形態では、取得装置107は、HOA Bフォーマットの元の、すなわち重み付けされていない音場データを、HOA Bフォーマットの音場データの球面/円調和領域への平面波分解を実行し、結果として音場データS(x,k)が得られ、ここで、xは位置ベクトルを表し、kは波数を表す、または同等に音場データS(x,t)が得られ、ここでtは時間を表す、ように構成されたHOAフォーマット変換器109に提供するように構成される。
図3に示す音場データを処理するための装置100の実施形態のHOAフォーマット変換器109は、音場データS(x,k)(または同等にS(x,t))をアプリケータ103に提供するように構成され、アプリケータ103は、既に上述したように、図8に示す実施形態では、「マルチゾーンHOAフォーマットコンバータ」103と呼ばれる。図1に示す実施形態の文脈で既に説明したように、アプリケータ103は、重み付けされた音場を定義する重み付けされた音場データを取得するために、空間的に連続的に変化する重み関数を、HOAフォーマット変換器109によって提供される音場データに適用するように構成される。アプリケータ103によって使用される空間的に連続的に変化する重み関数は、空間再現領域101の明るいゾーン101aおよび/または静かなゾーン101bの音場を強化するように構成される。一実施形態では、アプリケータ103は、HOA Bフォーマットの重み付けされた音場データとして重み付けされた音場データを提供するように構成される。図3で概略的に示したように、HOA Bフォーマットへのこの変換を実行できるようにするために、アプリケータ103は、明るいゾーンおよび/または静かなゾーンの位置などの、音場および重み関数に関するなんらかの情報を入力として必要とする。
図3に示す実施形態では、音場データを処理するための装置100は、アプリケータ103によって処理される、すなわち空間的に連続的に変化する重み関数によって重み付けされる音場データを格納するように構成された電子記憶装置またはメモリ111をさらに備える。従って、実施形態では、アプリケータ103は、HOAフォーマット変換器109または記憶装置111の一方または両方によって提供される音場データを処理するように構成することができる。
図3に示す実施形態では、アプリケータ103によって生成された重み付けされた音場データは、1つ以上の従来の圧縮技法を使用して、重み付けされた音場データを圧縮するように構成された圧縮器105に提供される。さらに詳細に後述するように、一実施形態では、圧縮器105は、図3に示す音場再現装置310から圧縮器105にフィードバックされる性能指標に基づいて、重み付けされた音場データを圧縮するためにその圧縮率を適応させるように構成される。
図3に示す実施形態では、音場データを処理するための装置100および音場再現装置310は、音場再現システム300の一部である。他の実施形態では、音場データを処理するための装置100および音場再現装置310は、空間および/または時間で分離されてもよい。例えば、音場データを処理するための装置100は、インターネットを介して、ウェブクライアントとして実装された音場再現装置310に圧縮された重み付けされた音場データを提供する、ウェブサーバとして実装できる。このようなシナリオでは、音場データを処理するための装置100は、エンコーダであると考えることができ、他方、音場再現装置310は、対応するデコーダであると考えることができる。
図3に示す実施形態では、音場再現装置310は、音場データを処理するための装置100によって提供される圧縮された重み付けされた音場データを復元するように構成された復元器312を備える。圧縮器105および復元器312が可逆圧縮技法を使用するように実装される場合、復元器312は、重み付けされた音場データを完全に復元することができる。さらに、音場再現装置310は、重み付けされた音場データに基づいて、重み付けされた音場をレンダリングする、すなわち再現するように構成されたレンダラー313を備える。一実施形態では、レンダラー313は、1つ以上の適切に配置されたトランスデューサ、特にスピーカを備えることができる。
最後に、図3に示す実施形態では、音場再現装置310は、重み付けされた音場に基づいて性能指標を決定するように構成された性能指標決定部315を備える。この目的のために、一実施形態では、性能指標決定部315は、レンダラー313によって再現された重み付けされた音場を測定するための1つ以上のマイクロフォン、例えば32チャネルのEigenmike(登録商標)と、測定された重み付けされた音場に基づいて、性能指標、例えば上式(1)で定義された性能指標を決定するように構成された処理ユニットと、を備えることができる。
一実施形態では、音場再現装置310は、性能指標決定部315によって決定された性能指標を装置100の圧縮器105にフィードバックするように構成される。一実施形態では、圧縮器105は、性能指標決定部315によって提供される性能指標に基づいてその圧縮率を調整するように構成される。例えば、一実施形態では、圧縮器105は、性能指標決定部315によって提供される性能指標が所定の性能指標閾値よりも大きいか否か、例えば明るい領域101aと静かな領域との間の音響学的コントラストが所定の最小音響学的コントラストよりも大きいか否かをチェックすることができ、大きい場合は、重み付けされた音場データに適用される圧縮率を高めることができる。
一実施形態では、圧縮器105は、図4に示す事前計算されたグラフに基づいて圧縮ストラテジを実施することができ、図4は、異なるバージョンのEVSおよび異なるバージョンのAACなどの複数の異なる圧縮技法について、伝送ビットレートの関数としての平均音響学的コントラスト性能の依存度を示している。例えば、一実施形態では、圧縮器105は、所与の以前に選択されたビットレートについて、性能指標決定部315によって提供された性能指標、すなわち平均音響学的コントラスト性能が、圧縮器105によって採用されたストラテジに関する図4に示す曲線を下回った場合には、圧縮率を増加させるように構成することができる。
図5は、音場データを処理するための装置100のさらなる実施形態の概略図を示す。図1に示す音場データを処理するための装置100の実施形態と同様に、図5に示す音場データを処理するための装置100のさらなる実施形態は、重み付けされた音場を定義する重み付けされた音場データを取得するために、空間的に連続的に変化する重み関数、例えば上式(2)で定義された空間的に連続的に変化する重み関数を音場データに適用し、空間的に連続的に変化する重み関数が、明るいゾーン101aおよび/または静かなゾーン101bにおける音場を強化するように構成される、ように構成された(図5において「マルチゾーンHOAフォーマット変換器」と呼ばれる)アプリケータ103を備える。図5に示す実施形態では、音場データは、空間的に連続的に変化する重み関数によって重み付けされる音場データを格納するように構成された、電子記憶装置またはメモリ111、例えばDVDプレーヤ、CDプレーヤまたはフラッシュメモリから得られる。一実施形態では、アプリケータ103は、HOA Bフォーマットの重み付けされた音場データとして重み付けされた音場データを提供するように構成される。図5で概略的に示したように、HOA Bフォーマットへのこの変換を実行できるようにするために、アプリケータ103は、明るいゾーンおよび/または静かなゾーンの位置などの、音場および重み関数に関するなんらかの情報を入力として必要とする。
図5に示す実施形態では、重み付けされた音場データは、重み付けされた音場データに基づいて重み付けされた音場をレンダリングする、すなわち再現するように構成されたレンダラー113にアプリケータ103から直接供給されるため、図5に示す装置100は、図1に示す装置の圧縮器105などの圧縮器を備えていない。
図6および図7は、非限定的な説明のための例の文脈における、本発明の実施形態の異なる態様を説明する概略図を示す。この説明のための例では、重み付けされた音場の明るいゾーンは、図6に示すように、平均的な人間の頭部のサイズよりも一般にはるかに大きい、直径が2*Ro(外側ゾーン)の円のサイズを有すると仮定する。既に上述したように、本発明の実施形態によれば、ビットレートの低減は、起こり得るユーザの動きが外側ゾーンの内側の直径2*Ri(内部ゾーン)の領域内であるなど、いくつかの基準に対応する滑らかな重み関数/モデルを有することによって達成することができる。
マルチゾーンの用途では、実際には、可能な限り外側ゾーンのサイズを大きくすることが望ましい。内側ゾーンによって示されるより小さい領域内の再現に焦点を当てることを選択する場合があるかもしれない。そうすると、マルチゾーン構成入力の変化に起因して、マルチゾーンHOA Bフォーマット信号のカバレッジおよび再処理の面積がより小さくなるためにシステムは劣るものになり、ユーザが内側ゾーンから遠ざかるにつれて望ましくない品質をもたらす。他方、本発明の実施形態は、図7に強調されているように、円滑な品質の移行を保証する。
いくつかの実装または実施形態のうちの1つのみに関連して、本開示の特定の特徴または態様を開示してきたかもしれないが、そのような特徴または態様は、任意の所与の用途または特定の用途に望ましく、かつ有利であり得るように、他の実装または実施形態の1つ以上の他の特徴または態様と組み合わせてもよい。さらに、用語「含む(include)」、「有する(have)」、「有する(with)」、またはこれらの他の変形が、「発明を実施するための形態」または「特許請求の範囲」において使用される限りにおいて、そのような用語は、用語「含む(comprise)」と同様に包括的であることが意図されている。また、用語「例示的な(exemplary)」、「例えば(for example)」および「例えば(e.g.)」は、最良または最適ではなく、単なる例として意図されている。「結合された(coupled)」および「接続された(connected)」という用語、ならびにこれらの派生語が使用されている場合もある。これらの用語は、2つの要素が、物理的もしくは電気的に直接接触しているのか、互いに直接接触していないのかにかかわらず、互いに協働または相互作用することを示すために使用されていることを理解されたい。
本明細書において特定の態様を図示および説明してきたが、図示および説明された特定の態様は、本開示の範囲から逸脱することなく、様々な別の実装および/または均等な実装で置き換えることができることを、当業者であれば理解するはずである。本出願は、本明細書で論じた特定の態様のあらゆる適合形態または変形を包含するように意図されている。
以下の特許請求の範囲内の要素は、対応する符号と共に特定の順序で記述されているが、特許請求の範囲の記述が、そうした要素の一部または全部を実施するための特定の順序を特段示唆しない限り、これらの要素は、特定の順序で実装されることに限定されることが必ずしも意図されていない。
上記の教示に照らせば、多くの代替、修正、および変形が当業者には明らかであるはずである。当然のことながら、当業者は、本明細書に記載されたものを超えて、本発明の多くの用途が存在することを容易に認識する。本発明を1つ以上の特定の実施形態に関連して説明してきたが、当業者であれば、本発明の範囲から逸脱することなく、これに多くの変更を行うことができることを認識する。従って、添付の特許請求の範囲内およびそれらの均等物の範囲内で、本発明は、本明細書において具体的に記載されたものとは別の方法で実施され得ることを理解されたい。
100 装置
101 空間再現領域
101a 明るいゾーン、明るい領域
101b 静かなゾーン、静かな領域
103 アプリケータ
105 圧縮器
107 取得装置
109 HOAフォーマット変換器
111 メモリ、記憶装置
113 レンダラー
200 方法
300 音場再現システム
310 音場再現装置
312 復元器
313 レンダラー
315 性能指標決定部

Claims (14)

  1. 音場データを処理するための装置であって、前記音場データが、少なくとも1つの明るいゾーンおよび少なくとも1つの静かなゾーンを含む空間再現領域内の音場を定義し、前記装置が、
    重み付けされた音場を定義する重み付けされた音場データを取得するために、空間的に連続的に変化する重み関数を前記音場データに適用し、前記空間的に連続的に変化する重み関数が、前記明るいゾーンおよび/または前記静かなゾーンの前記音場を強化するように構成される、ように構成されたアプリケータ
    を備え
    前記装置は、前記重み付けされた音場に関連する性能指標に基づいて前記音場データを圧縮するように構成された圧縮器をさらに備える、装置。
  2. 前記重み付けされた音場に関連する前記性能指標が所定の性能指標閾値と異なる場合に、前記圧縮器が前記音場データを圧縮するように構成される、請求項1に記載の装置。
  3. 前記重み付けされた音場に関連する前記性能指標は、前記重み付けされた音場の前記少なくとも1つの明るいゾーンと前記少なくとも1つの静かなゾーンとの間の音響学的コントラストである、請求項1または2に記載の装置。
  4. 前記明るいゾーンと前記静かなゾーンとの間の前記音響学的コントラストは、前記明るいゾーンにおける前記重み付けされた音場の平均と、前記静かなゾーンにおける前記重み付けされた音場の平均との間の比に基づく、請求項3に記載の装置。
  5. 前記明るいゾーンと前記静かなゾーンとの間の前記音響学的コントラストは、以下の式、すなわち、
    Figure 0006710768
    に基づき、ここで、ε(t)は、時間の関数としての前記音響学的コントラストを示し、S(x,t)は、空間および時間の関数として前記音場を定義する前記音場データを示し、w(x)は、前記空間的に連続的に変化する重み関数を示し、DbおよびDqは、それぞれ、前記明るい領域のサイズおよび前記静かな領域のサイズを示す、
    請求項3または4に記載の装置。
  6. 前記空間的に連続的に変化する重み関数は、前記明るい領域および前記静かな領域の外側の前記空間再現領域の部分に対して、前記明るい領域および前記静かな領域における前記音場データに関連する前記音場を強化するように構成された、滑らかに変化する関数である、請求項1から5のいずれか一項に記載の装置。
  7. 前記空間的に連続的に変化する重み関数は、前記明るいゾーンの中心を中心とする第1の正規分布と、前記静かなゾーンの中心を中心とする第2の正規分布と、の線形結合である、請求項1から6のいずれか一項に記載の装置。
  8. 前記音場データは、HOA Bフォーマットで符号化される、請求項1から7のいずれか一項に記載の装置。
  9. 前記装置は、前記空間的に連続的に変化する重み関数によって重み付けされる前記音場データを格納するように構成されたメモリをさらに備える、請求項1から8のいずれか一項に記載の装置。
  10. 前記装置は、前記重み付けされた音場データに基づいて前記重み付けされた音場をレンダリングするように構成された、レンダラー、特に少なくとも1つのスピーカをさらに備える、請求項1から9のいずれか一項に記載の装置。
  11. 請求項1から10のいずれか一項に記載の音場データを処理するための装置と、音場再現装置であって、前記音場再現装置が、前記装置から前記重み付けされた音場データを受信するように構成され、かつ前記重み付けされた音場データに基づいて前記重み付けされた音場をレンダリングするように構成された、レンダラー、特に少なくとも1つのスピーカを備える、音場再現装置と、を備える、音場再現システム。
  12. 前記音場再現装置は、前記重み付けされた音場に基づいて性能指標を決定し、かつ前記重み付けされた音場に関連する前記決定された性能指標を、前記装置の前記圧縮器にフィードバックするように構成された、性能指標決定部をさらに備える、請求項11に記載の音場再現システム。
  13. 音場データを処理するための方法であって、前記音場データが、少なくとも1つの明るいゾーンおよび少なくとも1つの静かなゾーンを含む空間再現領域内の音場を定義し、前記方法が、
    重み付けされた音場を定義する重み付けされた音場データを取得するために、空間的に連続的に変化する重み関数を前記音場データに適用するステップであって、前記空間的に連続的に変化する重み関数が、前記明るいゾーンおよび/または前記静かなゾーンの前記音場を強化するように構成される、ステップと、
    前記重み付けされた音場に関連する性能指標に基づいて前記音場データを圧縮するステップと
    を含む、方法。
  14. コンピュータ上で実行された場合に、請求項13に記載の方法を実行するためのプログラムコードを含むコンピュータプログラム。
JP2018539099A 2016-01-27 2016-01-27 音場データを処理するための装置および方法 Active JP6710768B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/EP2016/051677 WO2017129236A1 (en) 2016-01-27 2016-01-27 An apparatus, a method, and a computer program for processing soundfield data

Publications (2)

Publication Number Publication Date
JP2019507542A JP2019507542A (ja) 2019-03-14
JP6710768B2 true JP6710768B2 (ja) 2020-06-17

Family

ID=55236373

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018539099A Active JP6710768B2 (ja) 2016-01-27 2016-01-27 音場データを処理するための装置および方法

Country Status (6)

Country Link
US (1) US10433093B2 (ja)
EP (1) EP3398356B1 (ja)
JP (1) JP6710768B2 (ja)
KR (1) KR102091460B1 (ja)
CN (1) CN108476373B (ja)
WO (1) WO2017129236A1 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10944491B2 (en) * 2019-01-03 2021-03-09 Rohde & Schwarz Gmbh & Co. Kg Method and system for positioning a device under test within a test area
JP7285434B2 (ja) * 2019-08-08 2023-06-02 日本電信電話株式会社 スピーカアレイ、信号処理装置、信号処理方法および信号処理プログラム
JP7260821B2 (ja) * 2019-08-29 2023-04-19 日本電信電話株式会社 信号処理装置、信号処理方法および信号処理プログラム

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6069368B2 (ja) * 2012-03-14 2017-02-01 バング アンド オルフセン アクティーゼルスカブ 組み合わせ又はハイブリッド制御方法を適用する方法
WO2014082683A1 (en) * 2012-11-30 2014-06-05 Huawei Technologies Co., Ltd. Audio rendering system
EP2743922A1 (en) * 2012-12-12 2014-06-18 Thomson Licensing Method and apparatus for compressing and decompressing a higher order ambisonics representation for a sound field
CN103916730B (zh) * 2013-01-05 2017-03-08 中国科学院声学研究所 一种能够改善音质的声场聚焦方法及系统
CN103916810B (zh) * 2013-01-05 2016-03-02 中国科学院声学研究所 一种时域声能量对比控制方法和系统
CN104936125B (zh) * 2015-06-18 2017-07-21 三星电子(中国)研发中心 环绕立体声实现方法及装置

Also Published As

Publication number Publication date
CN108476373B (zh) 2020-11-17
US10433093B2 (en) 2019-10-01
EP3398356B1 (en) 2020-04-01
US20180376272A1 (en) 2018-12-27
WO2017129236A1 (en) 2017-08-03
CN108476373A (zh) 2018-08-31
KR102091460B1 (ko) 2020-03-20
JP2019507542A (ja) 2019-03-14
EP3398356A1 (en) 2018-11-07
KR20180101475A (ko) 2018-09-12

Similar Documents

Publication Publication Date Title
US9361898B2 (en) Three-dimensional sound compression and over-the-air-transmission during a call
US20230298600A1 (en) Audio encoding and decoding method and apparatus
EP4062404B1 (en) Priority-based soundfield coding for virtual reality audio
JP2023139188A (ja) 方向性音源のエンコードおよびデコードのための方法、装置およびシステム
US10433093B2 (en) Apparatus and method for processing soundfield data
EP4264964A1 (en) Vector field interpolation of multiple distributed streams for six degree of freedom applications
CN114067810A (zh) 音频信号渲染方法和装置
GB2589603A (en) Audio scene change signaling
JP7447798B2 (ja) 信号処理装置および方法、並びにプログラム
TW202305785A (zh) 三維音訊訊號編碼方法、裝置、編碼器和系統
CN115346537A (zh) 一种音频编码、解码方法及装置
TWI834163B (zh) 三維音頻訊號編碼方法、裝置和編碼器
KR20240012519A (ko) 3차원 오디오 신호를 처리하기 위한 방법 및 장치
WO2022242479A1 (zh) 三维音频信号编码方法、装置和编码器
CN114128312B (zh) 用于低频效果的音频渲染
WO2024212895A1 (zh) 场景音频信号的解码方法和装置
WO2024212639A1 (zh) 场景音频解码方法及电子设备
WO2024212894A1 (zh) 场景音频信号的解码方法和装置
WO2024212897A1 (zh) 场景音频信号的解码方法和装置
CN115376528A (zh) 三维音频信号编码方法、装置和编码器
JP2024517503A (ja) 三次元オーディオ信号コーディング方法および装置、ならびにエンコーダ
TW202425670A (zh) 場景音訊編碼方法及電子設備
TW202424960A (zh) 場景音訊解碼方法及電子設備

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180906

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180906

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20191017

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20191105

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200131

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200427

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200527

R150 Certificate of patent or registration of utility model

Ref document number: 6710768

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250