JP6710768B2

JP6710768B2 - 音場データを処理するための装置および方法

Info

Publication number: JP6710768B2
Application number: JP2018539099A
Authority: JP
Inventors: パンジ・セティアワン; ウェンユ・ジン
Original assignee: ホアウェイ・テクノロジーズ・カンパニー・リミテッド
Priority date: 2016-01-27
Filing date: 2016-01-27
Publication date: 2020-06-17
Anticipated expiration: 2036-01-27
Also published as: CN108476373B; US10433093B2; EP3398356B1; US20180376272A1; WO2017129236A1; CN108476373A; KR102091460B1; JP2019507542A; EP3398356A1; KR20180101475A

Description

一般に、本発明は、オーディオ信号の処理および再現の分野に関する。より詳細には、本発明は、音場データを処理および再現するための装置および方法に関する。

空間の広範な領域にわたる空間マルチゾーン音場再現が、同時車載エンターテイメントシステム、展示会場のサラウンドサウンドシステム、共有オフィススペースにおけるパーソナルスピーカシステム、および騒々しい環境における静かなゾーン（quiet zone）などの、その様々な応用のために近年ますます注目されており、その目指すところは、音響障壁やヘッドフォンを使用しなくても、聞き手に個別の音環境を提供することである。一般に、音場は、例えば複数のスピーカによって放出される音響信号によって生じる、周囲圧力からの局所的な空気圧の変動、すなわち圧力変動を空間および時間の関数として表すと考えることができる。マルチゾーン音場は、1つ以上の音響学的に明るいゾーン（acoustically bright zone）と、場合によってはいくつかの音響学的に静かなゾーンと、を通常含み得る。

マルチゾーン音再現のいわゆる「非頑健性」問題が、Poletti，M．，”An investigation of 2D multizone surround sound system，”Proc．AES 125th Convention Audio Eng．Society，2008において、2つの選択された領域間における、音響学的に明るいゾーンの音よりもさらに大きな振幅を有する、極めてはっきりとした不要な音の形態で特定されている。実際には、マルチゾーン音場におけるそのような挙動は、これらの領域内の不快なユーザ体験につながる可能性がある。

従って、特に上述の「非頑健性」問題に対処する、音場データを処理するための改良された装置および方法が必要とされている。

Poletti，M．，"An investigation of 2D multizone surround sound system，"Proc．AES 125th Convention Audio Eng．Society，2008

本発明の目的は、特に、周知の装置および方法に固有の「非頑健性」問題に対処する、音場データを処理するための改良された装置を提供することである。

上記および他の目的は、独立請求項の主題によって達成される。さらなる実装形態は、従属請求項、明細書および図面から明らかである。

第1の態様によれば、本発明は、音場データを処理するための装置であって、音場データが、少なくとも1つの音響学的に明るいゾーンと少なくとも1つの音響学的に静かなゾーンとを含む空間再現領域内の音場を定義する、装置に関する。装置は、重み付けされた音場を定義する重み付けされた音場データを取得するために、空間的に連続的に変化する重み関数を音場データに適用し、空間的に連続的に変化する重み関数が、明るいゾーンおよび／または静かなゾーンの音場を強化するように構成される、ように構成されたアプリケータを備える。

音場を定義する音場データに対して、空間的に連続的に、すなわち滑らかに変化する重み関数を適用することにより、明るいゾーンおよび／または静かなゾーンの音場を強化することによって、周知のデバイスの妨げとなる「非頑健性問題」を解決することができる。

本明細書において、用語「音場データ」は、それが表す音の指向特性に関する情報を含む任意のデータを指すために使用される。音場データは、様々な異なるフォーマットで表現することができ、それぞれが、定義された数のオーディオチャネルを有し、かつ表現された音を再現するためには異なる解釈を必要とする。このようなフォーマットの例としては、ステレオ、5．1サラウンドサウンド、および音場の球面調和表現を使用する高次アンビソニック（HOA）フォーマットなどのフォーマットが挙げられる。

音場データによって定義される音場の空間再現領域は、複数の異なる形状を有することができる。一実装形態では、音場は、空間再現領域、明るいゾーンおよび静かなゾーンが、2次元平面内に置かれる、3次元または2次元であり得る。一実装形態では、明るいゾーンおよび静かなゾーンは、球形、円筒形または円形の形状を有し得る。他の形状も可能である。

上記のような第1の態様による装置の第1の可能な実装形態では、装置は、重み付けされた音場に関連する性能指標に基づいて音場データを圧縮するように構成された圧縮器をさらに備える。

このことにより、圧縮器によって適用される圧縮率を性能指標に適合させることができ、従って、重み付けされた音場データのサイズを縮小することができる。このことは、特に、例えば重み付けされた音場データの送信または格納のための圧縮が、例えば重み付けされた音場データを再現するための、圧縮された重み付けされた音場データの復元から時間および／または空間において分離される実装形態に有利である。

第1の態様の第1の実装形態による装置の第2の可能な実装形態では、重み付けされた音場に関連する性能指標が所定の性能指標閾値と異なる場合に、圧縮器が音場データを圧縮するように構成される。

例えば実際の聞き手を起用した指標に基づいて、所定の性能指標閾値を使用することによって、圧縮器は、圧縮率をいつ調整するかを効率的に決定できる。

第1の態様の第1または第2の実装形態による装置の第3の可能な実装形態では、重み付けされた音場に関連する性能指標は、重み付けされた音場の少なくとも1つの明るいゾーンと少なくとも1つの静かなゾーンとの間の音響学的コントラストである。

第1の態様の第3の実装形態による装置の第4の可能な実装形態では、重み付けされた音場の明るいゾーンと静かなゾーンとの間の音響学的コントラストは、明るいゾーンにおける重み付けされた音場の平均と、静かなゾーンにおける重み付けされた音場の平均との間の比に基づく。

第1の態様の第4の実装形態による装置の第5の可能な実装形態では、重み付けされた音場の明るいゾーンと静かなゾーンとの間の音響学的コントラストは、以下の式、すなわち、

に基づき、ここで、ε（t）は、時間の関数としての音響学的コントラストを示し、S（x，t）は、空間および時間の関数として音場を定義する音場データを示し、w（x）は、空間的に連続的に変化する重み関数を示し、D_bおよびD_qは、それぞれ、明るい領域のサイズおよび静かな領域のサイズを示す。

上記のような第1の態様またはその第1から第5の実装形態のいずれか1つによる装置の第6の可能な実装形態では、空間的に連続的に変化する重み関数は、明るい領域および静かな領域の外側の空間再現領域の部分に対して、明るい領域および静かな領域における音場データに関連する音場を強化するように構成された、滑らかに変化する関数である。

上記のような第1の態様またはその第1から第6の実装形態のいずれか1つによる装置の第7の可能な実装形態では、空間的に連続的に変化する重み関数は、明るいゾーンの中心を中心とする第1の正規分布と、静かなゾーンの中心を中心とする第2の正規分布と、の線形結合である。

正規分布は、それぞれ、明るいゾーンおよび静かなゾーンの中心に対する聞き手の頭部のランダムな動きに対して、良好な近似を提供する。

一実装形態では、空間的に連続的に変化する重み関数は、以下の式、すなわち、

によって定義でき、ここで、w（x）は、空間的に連続的に変化する重み関数を示し、0_bは明るいゾーンの中心を示し、0_qは静かなゾーンの中心を示し、a、b、σ_aおよびσ_bは所定の重み関数パラメータを示す。

上記のような第1の態様またはその第1から第7の実装形態のいずれか1つによる装置の第8の可能な実装形態では、音場データは、HOA Bフォーマットで符号化される。

上記のような第1の態様またはその第1から第8の実装形態のいずれか1つによる装置の第9の可能な実装形態では、装置は、空間的に連続的に変化する重み関数によって重み付けされる音場データを格納するように構成されたメモリをさらに備える。これは、エンコーダ側で行うこともデコーダ側で行うこともできる。

上記のような第1の態様またはその第1から第9の実装形態のいずれか1つによる装置の第10の可能な実装形態では、装置は、重み付けされた音場データに基づいて重み付けされた音場をレンダリングするように構成された、レンダラー、特に少なくとも1つのスピーカをさらに備える。

第2の態様によれば、本発明は、上記のような第1の態様またはその第1から第10の実装形態のいずれか1つによる音場データを処理するための装置と、音場再現装置であって、音場再現装置が、第1の態様による装置から重み付けされた音場データを受信するように構成され、かつ重み付けされた音場データに基づいて重み付けされた音場をレンダリングするように構成された、レンダラー、特に少なくとも1つのスピーカを備える、音場再現装置と、を備える、音場再現システムに関する。

上記のような第2の態様による音場再現システムの第1の可能な実装形態では、音場再現装置は、重み付けされた音場に基づいて性能指標を決定し、かつ重み付けされた音場に関連する決定された性能指標を、第1の態様による装置の圧縮器にフィードバックするように構成された、性能指標決定部をさらに備える。

第3の態様によれば、本発明は、音場データを処理するための方法であって、音場データが、少なくとも1つの明るいゾーンと少なくとも1つの静かなゾーンとを含む空間再現領域内の音場を定義する、方法に関する。本方法は、重み付けされた音場を定義する重み付けされた音場データを取得するために、空間的に連続的に変化する重み関数を音場データに適用するステップであって、空間的に連続的に変化する重み関数が、明るいゾーンおよび／または静かなゾーンの音場を強化するように構成される、ステップを含む。

第3の態様による方法の第1の可能な実装形態では、本方法は、重み付けされた音場に関連する性能指標に基づいて音場データを圧縮する、さらなるステップを含む。

第2の態様の第1の実装形態による方法の第2の可能な実装形態では、重み付けされた音場に関連する性能指標が所定の性能指標閾値と異なる場合に、音場データが圧縮される。

第2の態様の第1または第2の実装形態による方法の第3の可能な実装形態では、重み付けされた音場に関連する性能指標は、重み付けされた音場の少なくとも1つの明るいゾーンと少なくとも1つの静かなゾーンとの間の音響学的コントラストである。

第2の態様の第3の実装形態による方法の第4の可能な実装形態では、重み付けされた音場の明るいゾーンと静かなゾーンとの間の音響学的コントラストは、明るいゾーンにおける重み付けされた音場の平均と、静かなゾーンにおける重み付けされた音場の平均との間の比に基づく。

第2の態様の第4の実装形態による方法の第5の可能な実装形態では、重み付けされた音場の明るいゾーンと静かなゾーンとの間の音響学的コントラストは、以下の式、すなわち、

上記のような第2の態様またはその第1から第5の実装形態のいずれか1つによる方法の第6の可能な実装形態では、空間的に連続的に変化する重み関数は、明るい領域および静かな領域の外側の空間再現領域の部分に対して、明るい領域および静かな領域における音場データに関連する音場を強化するように構成された、滑らかに変化する関数である。

上記のような第2の態様またはその第1から第6の実装形態のいずれか1つによる方法の第7の可能な実装形態では、空間的に連続的に変化する重み関数は、明るいゾーンの中心を中心とする第1の正規分布と、静かなゾーンの中心を中心とする第2の正規分布と、の線形結合である。

上記のような第2の態様またはその第1から第7の実装形態のいずれか1つによる方法の第8の可能な実装形態では、音場データは、HOA Bフォーマットで符号化される。

上記のような第2の態様またはその第1から第8の実装形態のいずれか1つによる方法の第9の可能な実装形態では、本方法は、空間的に連続的に変化する重み関数によって重み付けされる音場データをメモリに格納する、さらなるステップを含む。

上記のような第2の態様またはその第1から第9の実装形態のいずれか1つによる方法の第10の可能な実装形態では、本方法は、重み付けされた音場データに基づいて重み付けされた音場をレンダリングする、さらなるステップを含む。

第4の態様によれば、本発明は、コンピュータ上で実行された場合に、本発明の第3の態様またはその実装形態のいずれか1つによる方法を実行するためのプログラムコードを含むコンピュータプログラムに関する。

本発明は、ハードウェアおよび／またはソフトウェアで実施することができる。

以下の図面を参照しながら、本発明のさらなる実施形態を説明する。

一実施形態による、音場データを処理するための装置の概略図を示す。一実施形態による、音場データを処理するための方法の概略図を示す。一実施形態による、音場データを処理するための装置を備える一実施形態による音場再現システムの概略図を示す。図3に示す音場再現システムにおいて実施され得る複数の異なる圧縮技法に関する伝送ビットレートの関数としての平均音響学的コントラスト性能の依存度を説明する図を示す。一実施形態による、音場データを処理するための装置の概略図を示す。本発明の実施形態の異なる態様を説明する概略図を示す。本発明の実施形態の異なる態様を説明する概略図を示す。

様々な図において、同一または少なくとも機能的に等価な特徴について、同一の参照符号が使用される。

以下の説明では、本開示の一部を形成し、かつ本発明を配置することができる特定の態様を例示として示す、添付の図面を参照する。本発明の範囲から逸脱することなく、他の態様を利用することができ、構造的または論理的変更を行うことができることを理解されたい。従って、本発明の範囲は添付の特許請求の範囲で定義されることから、以下の「発明を実施するための形態」は、限定的な意味で解釈されるべきではない。

例えば、説明される方法に関連する開示は、その方法を実行するように構成された対応する装置またはシステムに対しても当てはまり、逆もまた同様であることを理解されたい。例えば、特定の方法ステップが説明されている場合、対応する装置は、そのようなユニットが明示的に説明または図示されていなくても、説明された方法ステップを実行するようなユニットを含むことができる。さらに、特に断らない限り、本明細書で説明される様々な例示的な態様の特徴は、互いに組み合わされてもよいことを理解されたい。

図1は、音場データを処理するための装置100の概略図を示す。図1の右側に概略的に示すように、音場データは、少なくとも1つの明るいゾーン101aと少なくとも1つの静かなゾーン101bとを含む空間再現領域101内の音場を定義する。

本明細書において、用語「音場データ」は、それが表す音の指向特性に関する情報を含む任意のデータを指すために使用される。音場データは、様々な異なるフォーマットで表現することができ、それぞれが、定義された数のオーディオチャネルを有し、かつ表現された音を再現するためには異なる解釈を必要とする。このようなフォーマットの例としては、ステレオ、5．1サラウンドサウンド、および高次アンビソニック（HOA）フォーマット、特にHOA Bフォーマットなどのフォーマットが挙げられる。

装置100は、重み付けされた音場を定義する重み付けされた音場データを取得するために、空間的に連続的に変化する重み関数を音場データに適用するように構成されたアプリケータ103を備える。空間的に連続的に変化する重み関数は、空間再現領域101の明るいゾーン101aおよび／または静かなゾーン101bの音場を強化するように構成される。

一実施形態では、装置100は、重み付けされた音場に関連する性能指標に基づいて音場データを圧縮するように構成された圧縮器105をさらに備える。

一実施形態では、重み付けされた音場に関連する性能指標が所定の性能指標閾値と異なる場合に、圧縮器105が音場データを圧縮するように構成される。

一実施形態では、重み付けされた音場に関連する性能指標は、重み付けされた音場の少なくとも1つの明るいゾーン101aと少なくとも1つの静かなゾーン101bとの間の音響学的コントラストである。

一実施形態では、明るいゾーン101aと静かなゾーン101bとの間の音響学的コントラストは、明るいゾーン101aにおける重み付けされた音場の平均と、静かなゾーン101bにおける重み付けされた音場の平均との間の比に基づく。

一実施形態では、明るいゾーン101aと静かなゾーン101bとの間の音響学的コントラストは、以下の式、すなわち、

に基づき、ここで、ε（t）は、時間の関数としての音響学的コントラストを示し、S（x，t）は、空間および時間の関数として音場データに関連する音場を示し、w（x）は、空間的に連続的に変化する重み関数を示し、D_bおよびD_qは、それぞれ、明るい領域101aのサイズおよび静かな領域101bのサイズを示す。

一実施形態では、空間的に連続的に変化する重み関数は、明るい領域101aおよび静かな領域101bの外側の空間再現領域101の部分に対して、明るい領域101aおよび静かな領域101bにおける音場データに関連する音場を強化するように構成された、滑らかに変化する関数である。

一実施形態では、空間的に連続的に変化する重み関数は、明るいゾーン101aの中心を中心とする第1の正規分布と、静かなゾーン101bの中心を中心とする第2の正規分布と、の線形結合である。空間的に連続的に変化する重み関数のこの好ましい選択は、聞き手の頭部（耳）の位置が、聞き手の胴体の動きに起因して、明るい領域および／または静かな領域内で静止していることが実際には保証されないという発見に基づいている。むしろ、聞き手の頭部位置の分布は、それぞれ、明るいゾーンおよび静かなゾーンの中心までの距離のガウス分布関数としてモデル化することができる。よって、一実施形態では、空間的に連続的に変化する重み関数は、以下の式、すなわち、

重み関数の上記の好ましい選択により、聞き手の頭部が明るいゾーンの中心（または同等に、静かなゾーンの中心）から半径r／2の円内に位置する確率は、68．3％である。重み関数のこの選択により、システムは、滑らかにかつ連続的に変化する重み関数の導入に起因して、より柔軟かつ効率的な方式で、異なるゾーンにわたって再現精度の重要度を分配する。聞き手の耳が現れる可能性が高い領域（例えば、明るいゾーンおよび静かなゾーンの中央の領域）は、より重点が置かれ、一部の領域では、明るいゾーンおよび静かなゾーンの外部での偽の音の発生を軽減するために、再現の努力が邪魔される場合がある（例えば、明るいゾーンおよび静かなゾーンの縁部）。

図2は、一実施形態による音場データを処理するための方法200の概略図を示しており、例えば、図1に示す空間再現領域101内の音場を定義する音場データは、音響学的に明るいゾーン101aと音響学的に静かなゾーン101bとを含む。

方法200は、重み付けされた音場を定義する重み付けされた音場データを取得するために、空間的に連続的に変化する重み関数、例えば上式（2）で定義された空間的に連続的に変化する重み関数を音場データに適用するステップであって、空間的に連続的に変化する重み関数が、明るいゾーン101aおよび／または静かなゾーン101bの音場を強化するように構成される、ステップ201を含む。

音場データを処理するための装置100および音場データを処理するための方法200のさらなる実装形態、実施形態および態様について以下に説明する。

図3は、一実施形態による音場データを処理するための装置100を備える一実施形態による音場再現システム300の概略図を示す。

図3に示す音場データを処理するための装置100の実施形態では、図1に示すアプリケータ103を「マルチゾーンHOAフォーマット変換器」103と呼び、図1に示す圧縮器105を「圧縮」と呼ぶ。アプリケータ103および圧縮器105に加えて、図3に示す音場データを処理するための装置100の実施形態は、元の、すなわち重み付けされていない音場データを取得するように構成された取得装置107を備える。一実施形態では、取得装置107は、32チャネルのEigenmike（登録商標）などの1つ以上のマイクロフォンを備えることができる。一実施形態では、取得装置107は、別のデバイスから、元の、すなわち重み付けされていない音場データを受信するように構成された通信インターフェイスであってもよい。

一実施形態では、取得装置107は、HOA Bフォーマットの元の、すなわち重み付けされていない音場データを、HOA Bフォーマットの音場データの球面／円調和領域への平面波分解を実行し、結果として音場データS（x，k）が得られ、ここで、xは位置ベクトルを表し、kは波数を表す、または同等に音場データS（x，t）が得られ、ここでtは時間を表す、ように構成されたHOAフォーマット変換器109に提供するように構成される。

図3に示す音場データを処理するための装置100の実施形態のHOAフォーマット変換器109は、音場データS（x，k）（または同等にS（x，t））をアプリケータ103に提供するように構成され、アプリケータ103は、既に上述したように、図8に示す実施形態では、「マルチゾーンHOAフォーマットコンバータ」103と呼ばれる。図1に示す実施形態の文脈で既に説明したように、アプリケータ103は、重み付けされた音場を定義する重み付けされた音場データを取得するために、空間的に連続的に変化する重み関数を、HOAフォーマット変換器109によって提供される音場データに適用するように構成される。アプリケータ103によって使用される空間的に連続的に変化する重み関数は、空間再現領域101の明るいゾーン101aおよび／または静かなゾーン101bの音場を強化するように構成される。一実施形態では、アプリケータ103は、HOA Bフォーマットの重み付けされた音場データとして重み付けされた音場データを提供するように構成される。図3で概略的に示したように、HOA Bフォーマットへのこの変換を実行できるようにするために、アプリケータ103は、明るいゾーンおよび／または静かなゾーンの位置などの、音場および重み関数に関するなんらかの情報を入力として必要とする。

図3に示す実施形態では、音場データを処理するための装置100は、アプリケータ103によって処理される、すなわち空間的に連続的に変化する重み関数によって重み付けされる音場データを格納するように構成された電子記憶装置またはメモリ111をさらに備える。従って、実施形態では、アプリケータ103は、HOAフォーマット変換器109または記憶装置111の一方または両方によって提供される音場データを処理するように構成することができる。

図3に示す実施形態では、アプリケータ103によって生成された重み付けされた音場データは、1つ以上の従来の圧縮技法を使用して、重み付けされた音場データを圧縮するように構成された圧縮器105に提供される。さらに詳細に後述するように、一実施形態では、圧縮器105は、図3に示す音場再現装置310から圧縮器105にフィードバックされる性能指標に基づいて、重み付けされた音場データを圧縮するためにその圧縮率を適応させるように構成される。

図3に示す実施形態では、音場データを処理するための装置100および音場再現装置310は、音場再現システム300の一部である。他の実施形態では、音場データを処理するための装置100および音場再現装置310は、空間および／または時間で分離されてもよい。例えば、音場データを処理するための装置100は、インターネットを介して、ウェブクライアントとして実装された音場再現装置310に圧縮された重み付けされた音場データを提供する、ウェブサーバとして実装できる。このようなシナリオでは、音場データを処理するための装置100は、エンコーダであると考えることができ、他方、音場再現装置310は、対応するデコーダであると考えることができる。

図3に示す実施形態では、音場再現装置310は、音場データを処理するための装置100によって提供される圧縮された重み付けされた音場データを復元するように構成された復元器312を備える。圧縮器105および復元器312が可逆圧縮技法を使用するように実装される場合、復元器312は、重み付けされた音場データを完全に復元することができる。さらに、音場再現装置310は、重み付けされた音場データに基づいて、重み付けされた音場をレンダリングする、すなわち再現するように構成されたレンダラー313を備える。一実施形態では、レンダラー313は、1つ以上の適切に配置されたトランスデューサ、特にスピーカを備えることができる。

最後に、図3に示す実施形態では、音場再現装置310は、重み付けされた音場に基づいて性能指標を決定するように構成された性能指標決定部315を備える。この目的のために、一実施形態では、性能指標決定部315は、レンダラー313によって再現された重み付けされた音場を測定するための1つ以上のマイクロフォン、例えば32チャネルのEigenmike（登録商標）と、測定された重み付けされた音場に基づいて、性能指標、例えば上式（1）で定義された性能指標を決定するように構成された処理ユニットと、を備えることができる。

一実施形態では、音場再現装置310は、性能指標決定部315によって決定された性能指標を装置100の圧縮器105にフィードバックするように構成される。一実施形態では、圧縮器105は、性能指標決定部315によって提供される性能指標に基づいてその圧縮率を調整するように構成される。例えば、一実施形態では、圧縮器105は、性能指標決定部315によって提供される性能指標が所定の性能指標閾値よりも大きいか否か、例えば明るい領域101aと静かな領域との間の音響学的コントラストが所定の最小音響学的コントラストよりも大きいか否かをチェックすることができ、大きい場合は、重み付けされた音場データに適用される圧縮率を高めることができる。

一実施形態では、圧縮器105は、図4に示す事前計算されたグラフに基づいて圧縮ストラテジを実施することができ、図4は、異なるバージョンのEVSおよび異なるバージョンのAACなどの複数の異なる圧縮技法について、伝送ビットレートの関数としての平均音響学的コントラスト性能の依存度を示している。例えば、一実施形態では、圧縮器105は、所与の以前に選択されたビットレートについて、性能指標決定部315によって提供された性能指標、すなわち平均音響学的コントラスト性能が、圧縮器105によって採用されたストラテジに関する図4に示す曲線を下回った場合には、圧縮率を増加させるように構成することができる。

図5は、音場データを処理するための装置100のさらなる実施形態の概略図を示す。図1に示す音場データを処理するための装置100の実施形態と同様に、図5に示す音場データを処理するための装置100のさらなる実施形態は、重み付けされた音場を定義する重み付けされた音場データを取得するために、空間的に連続的に変化する重み関数、例えば上式（2）で定義された空間的に連続的に変化する重み関数を音場データに適用し、空間的に連続的に変化する重み関数が、明るいゾーン101aおよび／または静かなゾーン101bにおける音場を強化するように構成される、ように構成された（図5において「マルチゾーンHOAフォーマット変換器」と呼ばれる）アプリケータ103を備える。図5に示す実施形態では、音場データは、空間的に連続的に変化する重み関数によって重み付けされる音場データを格納するように構成された、電子記憶装置またはメモリ111、例えばDVDプレーヤ、CDプレーヤまたはフラッシュメモリから得られる。一実施形態では、アプリケータ103は、HOA Bフォーマットの重み付けされた音場データとして重み付けされた音場データを提供するように構成される。図5で概略的に示したように、HOA Bフォーマットへのこの変換を実行できるようにするために、アプリケータ103は、明るいゾーンおよび／または静かなゾーンの位置などの、音場および重み関数に関するなんらかの情報を入力として必要とする。

図5に示す実施形態では、重み付けされた音場データは、重み付けされた音場データに基づいて重み付けされた音場をレンダリングする、すなわち再現するように構成されたレンダラー113にアプリケータ103から直接供給されるため、図5に示す装置100は、図1に示す装置の圧縮器105などの圧縮器を備えていない。

図6および図7は、非限定的な説明のための例の文脈における、本発明の実施形態の異なる態様を説明する概略図を示す。この説明のための例では、重み付けされた音場の明るいゾーンは、図6に示すように、平均的な人間の頭部のサイズよりも一般にはるかに大きい、直径が2＊Ro（外側ゾーン）の円のサイズを有すると仮定する。既に上述したように、本発明の実施形態によれば、ビットレートの低減は、起こり得るユーザの動きが外側ゾーンの内側の直径2＊Ri（内部ゾーン）の領域内であるなど、いくつかの基準に対応する滑らかな重み関数／モデルを有することによって達成することができる。

マルチゾーンの用途では、実際には、可能な限り外側ゾーンのサイズを大きくすることが望ましい。内側ゾーンによって示されるより小さい領域内の再現に焦点を当てることを選択する場合があるかもしれない。そうすると、マルチゾーン構成入力の変化に起因して、マルチゾーンHOA Bフォーマット信号のカバレッジおよび再処理の面積がより小さくなるためにシステムは劣るものになり、ユーザが内側ゾーンから遠ざかるにつれて望ましくない品質をもたらす。他方、本発明の実施形態は、図7に強調されているように、円滑な品質の移行を保証する。

いくつかの実装または実施形態のうちの1つのみに関連して、本開示の特定の特徴または態様を開示してきたかもしれないが、そのような特徴または態様は、任意の所与の用途または特定の用途に望ましく、かつ有利であり得るように、他の実装または実施形態の1つ以上の他の特徴または態様と組み合わせてもよい。さらに、用語「含む（include）」、「有する（have）」、「有する（with）」、またはこれらの他の変形が、「発明を実施するための形態」または「特許請求の範囲」において使用される限りにおいて、そのような用語は、用語「含む（comprise）」と同様に包括的であることが意図されている。また、用語「例示的な（exemplary）」、「例えば（for example）」および「例えば（e．g．）」は、最良または最適ではなく、単なる例として意図されている。「結合された（coupled）」および「接続された（connected）」という用語、ならびにこれらの派生語が使用されている場合もある。これらの用語は、2つの要素が、物理的もしくは電気的に直接接触しているのか、互いに直接接触していないのかにかかわらず、互いに協働または相互作用することを示すために使用されていることを理解されたい。

本明細書において特定の態様を図示および説明してきたが、図示および説明された特定の態様は、本開示の範囲から逸脱することなく、様々な別の実装および／または均等な実装で置き換えることができることを、当業者であれば理解するはずである。本出願は、本明細書で論じた特定の態様のあらゆる適合形態または変形を包含するように意図されている。

以下の特許請求の範囲内の要素は、対応する符号と共に特定の順序で記述されているが、特許請求の範囲の記述が、そうした要素の一部または全部を実施するための特定の順序を特段示唆しない限り、これらの要素は、特定の順序で実装されることに限定されることが必ずしも意図されていない。

上記の教示に照らせば、多くの代替、修正、および変形が当業者には明らかであるはずである。当然のことながら、当業者は、本明細書に記載されたものを超えて、本発明の多くの用途が存在することを容易に認識する。本発明を1つ以上の特定の実施形態に関連して説明してきたが、当業者であれば、本発明の範囲から逸脱することなく、これに多くの変更を行うことができることを認識する。従って、添付の特許請求の範囲内およびそれらの均等物の範囲内で、本発明は、本明細書において具体的に記載されたものとは別の方法で実施され得ることを理解されたい。

100 装置
101 空間再現領域
101a 明るいゾーン、明るい領域
101b 静かなゾーン、静かな領域
103 アプリケータ
105 圧縮器
107 取得装置
109 HOAフォーマット変換器
111 メモリ、記憶装置
113 レンダラー
200 方法
300 音場再現システム
310 音場再現装置
312 復元器
313 レンダラー
315 性能指標決定部

Claims

音場データを処理するための装置であって、前記音場データが、少なくとも1つの明るいゾーンおよび少なくとも1つの静かなゾーンを含む空間再現領域内の音場を定義し、前記装置が、
重み付けされた音場を定義する重み付けされた音場データを取得するために、空間的に連続的に変化する重み関数を前記音場データに適用し、前記空間的に連続的に変化する重み関数が、前記明るいゾーンおよび／または前記静かなゾーンの前記音場を強化するように構成される、ように構成されたアプリケータ
を備え、
前記装置は、前記重み付けされた音場に関連する性能指標に基づいて前記音場データを圧縮するように構成された圧縮器をさらに備える、装置。
前記重み付けされた音場に関連する前記性能指標が所定の性能指標閾値と異なる場合に、前記圧縮器が前記音場データを圧縮するように構成される、請求項1に記載の装置。
前記重み付けされた音場に関連する前記性能指標は、前記重み付けされた音場の前記少なくとも1つの明るいゾーンと前記少なくとも1つの静かなゾーンとの間の音響学的コントラストである、請求項1または2に記載の装置。
前記明るいゾーンと前記静かなゾーンとの間の前記音響学的コントラストは、前記明るいゾーンにおける前記重み付けされた音場の平均と、前記静かなゾーンにおける前記重み付けされた音場の平均との間の比に基づく、請求項3に記載の装置。
前記明るいゾーンと前記静かなゾーンとの間の前記音響学的コントラストは、以下の式、すなわち、

に基づき、ここで、ε（t）は、時間の関数としての前記音響学的コントラストを示し、S（x，t）は、空間および時間の関数として前記音場を定義する前記音場データを示し、w（x）は、前記空間的に連続的に変化する重み関数を示し、D_bおよびD_qは、それぞれ、前記明るい領域のサイズおよび前記静かな領域のサイズを示す、
請求項3または4に記載の装置。
前記空間的に連続的に変化する重み関数は、前記明るい領域および前記静かな領域の外側の前記空間再現領域の部分に対して、前記明るい領域および前記静かな領域における前記音場データに関連する前記音場を強化するように構成された、滑らかに変化する関数である、請求項1から5のいずれか一項に記載の装置。
前記空間的に連続的に変化する重み関数は、前記明るいゾーンの中心を中心とする第1の正規分布と、前記静かなゾーンの中心を中心とする第2の正規分布と、の線形結合である、請求項1から6のいずれか一項に記載の装置。
前記音場データは、HOA Bフォーマットで符号化される、請求項1から7のいずれか一項に記載の装置。
前記装置は、前記空間的に連続的に変化する重み関数によって重み付けされる前記音場データを格納するように構成されたメモリをさらに備える、請求項1から8のいずれか一項に記載の装置。
前記装置は、前記重み付けされた音場データに基づいて前記重み付けされた音場をレンダリングするように構成された、レンダラー、特に少なくとも1つのスピーカをさらに備える、請求項1から9のいずれか一項に記載の装置。
請求項1から10のいずれか一項に記載の音場データを処理するための装置と、音場再現装置であって、前記音場再現装置が、前記装置から前記重み付けされた音場データを受信するように構成され、かつ前記重み付けされた音場データに基づいて前記重み付けされた音場をレンダリングするように構成された、レンダラー、特に少なくとも1つのスピーカを備える、音場再現装置と、を備える、音場再現システム。
前記音場再現装置は、前記重み付けされた音場に基づいて性能指標を決定し、かつ前記重み付けされた音場に関連する前記決定された性能指標を、前記装置の前記圧縮器にフィードバックするように構成された、性能指標決定部をさらに備える、請求項11に記載の音場再現システム。
音場データを処理するための方法であって、前記音場データが、少なくとも1つの明るいゾーンおよび少なくとも1つの静かなゾーンを含む空間再現領域内の音場を定義し、前記方法が、
重み付けされた音場を定義する重み付けされた音場データを取得するために、空間的に連続的に変化する重み関数を前記音場データに適用するステップであって、前記空間的に連続的に変化する重み関数が、前記明るいゾーンおよび／または前記静かなゾーンの前記音場を強化するように構成される、ステップと、
前記重み付けされた音場に関連する性能指標に基づいて前記音場データを圧縮するステップと
を含む、方法。
コンピュータ上で実行された場合に、請求項13に記載の方法を実行するためのプログラムコードを含むコンピュータプログラム。