WO2023074009A1

WO2023074009A1 - 情報処理装置および方法、並びにプログラム

Info

Publication number: WO2023074009A1
Application number: PCT/JP2022/000355
Authority: WO
Inventors: 隆一難波; 徹知念; 実辻; 光行畠中; 弘幸本間; 康裕戸栗
Original assignee: ソニーグループ株式会社
Priority date: 2021-10-29
Filing date: 2022-01-07
Publication date: 2023-05-04

Abstract

本技術は、指向性データの伝送量を低減させることができるようにする情報処理装置および方法、並びにプログラムに関する。情報処理装置は、音源の指向性を表す指向性データをモデル化することにより得られたモデルデータを取得する取得部と、モデルデータに基づいて、指向性データを算出する算出部とを備える。本技術は情報処理装置に適用することができる。

Description

情報処理装置および方法、並びにプログラム

　本技術は、情報処理装置および方法、並びにプログラムに関し、特に、指向性データの伝送量を低減させることができるようにした情報処理装置および方法、並びにプログラムに関する。

　従来、音源の指向性を考慮することで、より臨場感の高いオーディオ再生を実現できることが知られている。

　例えば、オブジェクトのオーディオデータとともに、オブジェクトからの音の指向性を表す指向性データを用意すれば、オーディオデータと指向性データとを用いて、オブジェクトの指向特性に基づくオーディオ再生を行うことが可能である。

　また、指向性に関する技術として、例えば録音時においてユーザが指向性方向を任意に選択して録音でき、かつ再生時においてユーザが録音時の指向性方向とは別に所望の指向性の方向を選択して再生する技術が提案されている（例えば、特許文献１参照）。

特開２０２１－１００２０９号公報

　ところで、音源ごとに指向特性（指向性）は異なるため、コンテンツとして、オブジェクトのオーディオデータと、そのオブジェクトの指向性データとを提供する場合、音源の種別、すなわちオブジェクトの種別ごとに指向性データを用意する必要がある。また、より多くの方向および周波数について指向性に関する情報をもたせようとすると、指向性データのデータ量が多くなってしまう。

　そうすると、コンテンツの配信先に対する指向性データの伝送量が多くなってしまい、伝送遅延が発生したり、伝送レートが増大したりするおそれがある。

　本技術は、このような状況に鑑みてなされたものであり、指向性データの伝送量を低減させることができるようにするものである。

　本技術の第１の側面の情報処理装置は、音源の指向性を表す指向性データをモデル化することにより得られたモデルデータを取得する取得部と、前記モデルデータに基づいて、前記指向性データを算出する算出部とを備える。

　本技術の第１の側面の情報処理方法またはプログラムは、音源の指向性を表す指向性データをモデル化することにより得られたモデルデータを取得し、前記モデルデータに基づいて、前記指向性データを算出するステップを含む。

　本技術の第１の側面においては、音源の指向性を表す指向性データをモデル化することにより得られたモデルデータが取得され、前記モデルデータに基づいて、前記指向性データが算出される。

　本技術の第２の側面の情報処理装置は、音源の指向性を表す指向性データを、複数の分布からなる混合モデルによりモデル化するモデル化部と、前記モデル化により得られた、前記混合モデルを構成するモデルパラメータを含むモデルデータを生成するモデルデータ生成部とを備える。

　本技術の第２の側面の情報処理方法またはプログラムは、音源の指向性を表す指向性データを、複数の分布からなる混合モデルによりモデル化し、前記モデル化により得られた、前記混合モデルを構成するモデルパラメータを含むモデルデータを生成するステップを含む。

　本技術の第２の側面においては、音源の指向性を表す指向性データが、複数の分布からなる混合モデルによりモデル化され、前記モデル化により得られた、前記混合モデルを構成するモデルパラメータを含むモデルデータが生成される。

混合ガウス分布について説明する図である。 vMF分布とKent分布について説明する図である。指向性の例を示す図である。データポイントについて説明する図である。モデルデータの例を示す図である。バンドとビンの関係について説明する図である。指向性データのデータ量の低減例を示す図である。指向性データの残差について説明する図である。サーバの構成例を示す図である。符号化処理を説明するフローチャートである。情報処理装置の構成例を示す図である。指向性データ生成処理を説明するフローチャートである。出力オーディオデータ生成処理を説明するフローチャートである。差分情報の出現確率について説明する図である。モデルデータの例を示す図である。モデルデータの例を示す図である。ハフマン符号化テーブルの伝送について説明する図である。ハフマン符号化テーブルの例を示す図である。サーバの構成例を示す図である。指向性データ生成処理を説明するフローチャートである。指向性データ符号化部の構成例を示す図である。差分符号化部の構成例を示す図である。モデルデータ生成処理を説明するフローチャートである。分布モデル復号部の構成例を示す図である。コンピュータの構成例を示す図である。

　以下、図面を参照して、本技術を適用した実施の形態について説明する。

〈第１の実施の形態〉
〈本技術について〉
　本技術は、指向性データをモデル化することで、指向性データの伝送量を低減させることができるようにするものである。

　本技術では、例えばコンテンツとして、３D音源のオーディオデータと指向性データが提供される。

　具体的には、例えば３D音源として１または複数のオーディオオブジェクト（以下、単にオブジェクトと称する）の音が収音（収録）されて、各オブジェクトのオーディオデータが生成される。また、オブジェクトの種別、すなわち音源種別ごとに、オブジェクト（音源）の指向特性、すなわち指向性を表す指向性データが用意される。

　さらに、各オブジェクトのオーディオデータと、音源種別ごとの指向性データとがコンテンツのデータとして提供される。すなわち、オブジェクトのオーディオデータとあわせて指向性データが再生側の装置へと伝送される。そして、再生側では、コンテンツを構成するオーディオデータと指向性データとに基づいて、指向性データを考慮したオーディオ再生が行われる。

　指向性データは、例えばオブジェクトの音を複数のマイクロホンで収録することで得ることができる。なお、指向性データの収録は、オブジェクトのオーディオデータの収録と同時に行われてもよいし、オブジェクトのオーディオデータの収録とは異なるタイミングで行われてもよい。

　指向性データは、例えば音声や楽器、スピーカなどの音源種別ごとに用意される。また、指向性データは、例えば音源から見た各方向にある位置について、DCとなる周波数からナイキスト周波数までの全周波数帯域における対象周波数ごとに、音源からの音の振幅と位相の情報をもつデータである。

　例えば音源から見た方向は、音源位置から見た水平方向の角度、すなわち方位角と、音源位置から見た垂直方向の角度、すなわち仰角とにより表される。このとき、例えば方位角の範囲は０度乃至３６０度の範囲とされ、仰角の範囲は－９０度乃至＋９０度の範囲とされる。

　本技術では、このような指向性データを離散化および圧縮するにあたり、直接、データが圧縮されるのではなく、モデル化によるパラメトリック圧縮が行われる。

　なお、本技術では、モデル化の対象とされる指向性データは、収録等により得られた指向性データを適宜、離散化および正規化することにより得られたものとされる。

　以下では、モデル化の対象とされる指向性データは、複数の各データポイントにおける、音源の複数の離散的な各周波数の指向特性を示すゲイン（以下、指向性ゲインと称する）からなるものとして説明を行う。

　例えばデータポイントとなる位置は、音源位置を原点とする極座標系の座標（極座標）、すなわち音源位置から見た水平方向の位置を示す方位角と、音源位置から見た垂直方向の位置を示す仰角によって表すことができる。なお、データポイントの位置を表すのに音源位置からの距離（半径）が用いられるようにしてもよい。また、指向性ゲインは、データポイントにおける音源からの音の振幅（音圧）を正規化することにより得ることができる。

（音源の指向性データの記録方式について）
　音源種別ごとの指向性データの記録方式について説明する。

　本技術では、指向性データのモデル化には、平面上で定義される多変量／単変量のガウス分布に相当する、球面上のvMF(von Mises Fisher)分布、Kent分布、またはvMF分布とKent分布の少なくとも何れかからなる混合モデルが用いられる。

　なお、vMF分布やKent分布、混合モデルについては、例えば「John T. Kent (1982). The Fisher-Bingham Distribution on the Sphere」などに詳細に記載されている。

　まず、一般的な混合ガウス分布について説明する。

　例えば図１の矢印Q11に示す部分には、２次元のガウス分布が示されている。この例では、直線上に２つのガウス分布が存在している。すなわち、曲線L11は１つのガウス分布を示しており、曲線L12は他の１つのガウス分布を示している。

　また、曲線L13は、曲線L11に示すガウス分布と、曲線L12に示すガウス分布とを混合することにより得られる混合ガウス分布を示している。

　一方、図１における矢印Q12に示す部分には、平面上における３つの分布が示されている。このような平面上の複数の分布を混合することもできる。

　通常、混合ガウス分布は、平面上における確率密度分布（pdf(Probability Density Function)）を表現するのに利用される。所望のpdfを少ないモデルパラメータ、かつなるべく少ない混合数で表現することで情報量の削減が可能となる。

　本技術では、球表面上で定義されるガウス分布に相当するvMF分布やKent分布の混合モデルが用いられて、球表面上の指向性データ、すなわち指向性ゲインの形状（分布）がモデル化される。

　混合モデルは、１または複数のvMF分布により構成されてもよいし、１または複数のKent分布により構成されてもよいし、１以上のvMF分布と１以上のKent分布により構成されてもよい。つまり、混合モデルは、vMF分布とKent分布の少なくとも何れかを含む１または複数の分布により構成される。

　球表面の位置を示す位置ベクトル、すなわち直交座標系（デカルト座標系）の座標をｘとすると、位置ベクトルｘに対応するKent分布の値f(x)、すなわち位置ベクトルｘにより示される位置におけるKent分布の値f(x)は、次式（１）により表すことができる。

　なお、式（１）において、κはパラメータ集中度を示しており、βは楕円率を示している。また、γ_１はmean direction分布の中心を規定するベクトルを示しており、γ_２はmajor軸ベクトルを示しており、γ_３はminor軸ベクトルを示している。

　さらに、c(κ,β)は次式（２）に示す正規化定数である。なお、式（２）においてΓはガンマ関数を示しており、Ｉは第一種変形ベッセル関数を示している。

　また、位置ベクトルｘにより示される位置におけるvMF分布の値も式（１）と同様の式により表すことができる。そのような場合、式（１）における楕円率βの値は０とされる。

　図２にvMF分布とKent分布の例を示す。

　図２では、矢印Q21に示す部分にはvMF分布の例が示されている。特に、ベクトルV11は、式（１）に示したベクトルγ_１を表している。

　vMF分布は、楕円率β、major軸ベクトルγ_２、およびminor軸ベクトルγ_３をパラメータとしてもたず、球表面上において、ベクトルV11（ベクトルγ_１）により示される位置を中心として等方的に広がっていく円形状の分布となっている。すなわち、vMF分布（vMF分布モデル）を用いれば、円形状の分布を再現することができる。

　これに対して、矢印Q22に示す部分にはKent分布の例が示されている。特に、ベクトルV21乃至ベクトルV23は、式（１）に示したベクトルγ_１、major軸ベクトルγ_２、およびminor軸ベクトルγ_３を表している。

　Kent分布は、球表面上において、ベクトルV21（ベクトルγ_１）により示される位置を中心とし、球表面上のmajor軸ベクトルγ_２およびminor軸ベクトルγ_３を長軸および短軸とする楕円形状の分布となっている。すなわち、Kent分布（Kent分布モデル）を用いれば、楕円率β、major軸ベクトルγ_２、およびminor軸ベクトルγ_３により定まる楕円形状の分布を再現することができる。

　Kent分布は、楕円率βなどのパラメータにより楕円の形状を変化させることができるので自由度は高いが、パラメータ数はvMF分布よりも多くなってしまう。

　本技術では、vMF分布やKent分布を混合して得られる混合モデルが用いられて指向性データが表される（モデル化される）。

　例えば、式（１）における場合と同様の位置ベクトルｘにより示される位置における、Ｎ個のKent分布f(x;θ_i)を用いた混合モデルの出力値F(x;Θ)は、次式（３）により表すことができる。すなわち、混合モデルF(x;Θ)は、Ｎ個のKent分布f(x;θ_i)の重みづけ加算により表記することができる。

　なお、式（３）においてKent分布f(x;θ_i)は、上述の式（１）に示したものと同様であり、混合するＮ個のKent分布のうちのｉ番目のKent分布を示している。

　また、θ_iはKent分布f(x;θ_i)を構成するパラメータ、より詳細にはパラメータの集合であり、パラメータθ_iは、式（１）におけるパラメータ集中度κ、楕円率β、ベクトルγ_１、major軸ベクトルγ_２、およびminor軸ベクトルγ_３からなる。混合モデルF(x;Θ)のパラメータΘは、Ｎ個のKent分布f(x;θ_i)のパラメータθ_iの集合を表している。

　さらに式（３）において、φ_iはＮ個のKent分布を混合するときのｉ番目のKent分布f(x;θ_i)の重み（重み係数）を表しており、次式（４）に示すように、Ｎ個のKent分布f(x;θ_i)の重みφ_iの総和は１とされる。

　本技術で用いられる指向性データは、オブジェクトの周囲に配置された複数のマイクロホンからなるマイクアレイで収録（収音）を行うことにより得ることができる。

　一例として、トランペットの演奏音を収録すると、図３に示す指向性が観測される。特に、図中、左側には水平面、すなわち仰角が０度となる面における各周波数の指向性が示されており、図中、右側には正中面における各周波数の指向性が示されている。

　この例では、水平面および正中面の両方において、周波数（ピッチ）によって指向性の概形が変化し、低域側の周波数では指向性は小さいが、周波数が高くなるにつれて指向性が大きく（鋭く）なっていくことが分かる。例えば水平面では、8000Hzにおいて方向によっては最大で25dB程度の音圧差が生じている。

　ところで、モデル化対象となる指向性データでは、例えば図４に示すように音源位置を中心とする球表面上に複数のデータポイントが設けられる。図４の例では、１つの点が１つのデータポイントを表しており、球表面全体に多数のデータポイントが存在することが分かる。

　ここで、例えば方位角方向に２度の間隔（２度刻み）で、かつ仰角方向にも２度の間隔でデータポイントを設けるとすると、球表面全体には16022個のデータポイントが設けられることになる。また、そのような場合に、各データポイントについて19Hz乃至20kHzを対象とした512個のビン（周波数ビン）における指向性ゲイン（音圧）を伝送しようとすると、１音源の指向性データは約31MBとなる。

　このように、音源種別ごとの指向性データはデータサイズが大きいため、伝送量が多くなってしまう。

　また、音声にも母音と子音などがあり、楽器も演奏方法によって指向性が異なるなど、音源種別の多様性が非常に大きいため、音源種別ごとに指向性データを用意しようとすると、多数の指向性データが必要となる。

　これらのことから、指向性データの伝送量が多くなってしまうが、指向性データの伝送量の増加は伝送遅延の発生や伝送レートの増大の要因となる。そのため、場合によっては音源種別や周波数、オブジェクトと受聴者の向きなどに応じた指向性の再現ができなくなってしまうことがある。

　そこで、本技術では、上述のように混合モデルを用いて指向性データをモデル化することで、指向性データの伝送量を低減できるようにした。

〈モデルデータの例〉
　ここで、指向性データをモデル化することで得られるモデルデータの具体的な例について説明する。

　本技術では、指向性データの伝送時に、vMF分布やKent分布からなる混合モデルに基づく指向性データのモデル化が行われ、その結果得られた、混合モデルを構成するモデルパラメータ等を含むモデルデータが生成される。そして、そのモデルデータがコンテンツの再生側の装置へと伝送される。これにより、データサイズの大きいもとの指向性データの伝送が不要となる。換言すれば、指向性データの伝送時のデータ量（伝送量）を低減させることができる。

　ここで、num_sound_types_idで指定される１つの音源種別のモデルデータの例を図５示す。この例では１つの音源種別のモデルデータがdirectivityConfigとして記述されている。

　モデルデータには、データポイント数「num_point_indices」により示される数だけ、モデル化前のもとの指向性データにおけるデータポイントの位置を示す方位角「azimuth_table[i]」、仰角「elevation_table[i]」、および半径「distance[i]」が含まれている。

　データポイントの位置は、音源位置から見たデータポイントの水平方向の角度である方位角「azimuth_table[i]」、音源位置から見たデータポイントの垂直方向の角度である仰角「elevation_table[i]」、および音源位置からデータポイントまでの距離である半径「distance[i]」からなる、音源位置を原点とする極座標系の座標により表される。

　また、モデルデータには、周波数ポイント数「bin_count」と周波数「freq[i_bin]」が含まれている。モデル化前のもとの指向性データでは、対象となる周波数帯域全体が周波数ポイント数「bin_count」により示される数の周波数帯域（周波数）である周波数ビン、すなわちビン（bin）に分割され、それらのビンのうちのｉ番目のビンの中心周波数（Hz）が周波数「freq[i_bin]」とされる。

　したがって、モデル化前のもとの指向性データには、複数の各データポイントにおける１または複数の各ビン（周波数ビン）の指向性ゲインが含まれている。

　さらにモデルデータには、Kent分布やvMF分布に関するパラメータとして、モデル化するバンド数「band_count」、各バンドでの混合数「mix_count[i_band]」、各バンドに含まれるモデル化前のもとの指向性データのビン情報「bin_range_per_band[i_band]」が含まれている。

　例えばモデル化では、対象となる周波数帯域全体がバンド数「band_count」により示される数の周波数帯域であるバンド（band）に分割され、それらのバンドごとに指向性ゲインの分布が混合モデルにより表される。換言すれば、各バンドにおける指向性ゲインの分布を表す混合モデルを構成するモデルパラメータが推定される。なお、各バンド（band）により示される周波数帯域には、必ず１または複数のビンにより示される周波数、つまりビンの中心周波数「freq[i_bin]」が含まれている（属している）。

　混合数「mix_count[i_band]」は、ｉ番目のバンドの指向性ゲインの分布を表す混合モデルを構成する分布の数、すなわちKent分布やvMF分布の数を示しており、この混合数は式（３）におけるＮに対応する。

　指向性データのビン情報「bin_range_per_band[i_band]」は、ｉ番目のバンドに含まれている、モデル化前のもとの指向性データについてのビン（bin）を示す情報である。例えばビン情報は、ｉ番目のバンドに属す最も大きい周波数のビンを示すインデックス情報などとされる。ビン情報「bin_range_per_band[i_band]」を参照すれば、モデル化前のもとの指向性データについてのビン（周波数ビン）が、モデル化後のどのバンドに含まれているかを特定することができる。

　また、モデルデータには、Kent分布やvMF分布に関するパラメータとして、各バンドについて、混合モデルを構成する分布（Kent分布またはvMF分布）ごとに、上述した重みφ_i、パラメータ集中度κ、およびベクトルγ_１が含まれている。

　この例では、「weight[i_band][i_mix]」および「kappa[i_band][i_mix]」が「i_band」により示されるｉ番目のバンドについての「i_mix」により示される分布の重みφ_iおよびパラメータ集中度κを示している。

　また、「gamma1[i_band][ i_mix][x]」および「gamma1[i_band][ i_mix][y]」は、ｉ番目のバンド「i_band」についての「i_mix」により示される分布のベクトルγ_１を構成するX成分（X座標）およびY成分（Y座標）を示している。

　モデルデータには、混合モデルを構成するｉ番目のバンド「i_band」についての「i_mix」により示される分布がKent分布とvMF分布の何れの分布であるかを示す選択フラグ「dist_flag」が含まれている。

　選択フラグ「dist_flag」の値「１」は分布がKent分布であることを示しており、選択フラグ「dist_flag」の値「０」は分布がvMF分布であることを示している。

　選択フラグ「dist_flag」の値が「１」である場合、モデルデータには上述した楕円率β、major軸ベクトルγ_２、およびminor軸ベクトルγ_３が含まれている。

　「beta[i_band][i_mix]」は「i_band」により示されるｉ番目のバンドについての「i_mix」により示される分布（Kent分布）の楕円率βを示している。また、「gamma2[i_band][i_mix][x]」および「gamma2[i_band][i_mix][y]」は、ｉ番目のバンド「i_band」についての「i_mix」により示される分布（Kent分布）のmajor軸ベクトルγ_２を構成するX成分（X座標）およびY成分（Y座標）を示している。

　同様に、「gamma3[i_band][i_mix][x]」および「gamma3[i_band][i_mix][y]」は、ｉ番目のバンド「i_band」についての「i_mix」により示される分布（Kent分布）のminor軸ベクトルγ_３を構成するX成分（X座標）およびY成分（Y座標）を示している。

　モデルデータには、各ビンにおける指向性データ、より詳細には指向性ゲインのダイナミックレンジを示すスケールファクタ「scale_factor[i_bin]」と、各ビンにおける指向性データ（指向性ゲイン）のオフセット値、すなわち最小値「offset[i_bin]」も含まれている。

　以下では、モデルデータに含まれている楕円率β、パラメータ集中度κ、重みφ_i、ベクトルγ_１、major軸ベクトルγ_２、minor軸ベクトルγ_３、スケールファクタ、および最小値（オフセット値）からなるパラメータ集合をモデルパラメータとも称することとする。

　モデルデータには、データポイントにおける、モデル化前のもとの指向性データの値（指向性ゲイン）と、モデル化により得られた混合モデルにより示される指向性データの値（指向性ゲイン）との差分を示す差分情報「diff_data[i_point]」も含まれている。換言すれば、差分情報は、データポイントにおける、モデル化前の指向性データと、モデル化後の指向性データとの差分を示す情報である。

　なお、差分情報が格納されるか否かを選択できるようにしてもよい。また、モデルデータに格納される「diff_data[i_point]」は、ハフマン符号化された差分情報であってもよい。

　再生側（復号側）の装置では、例えば図５に示した構成（フォーマット）のモデルデータに基づいて、各データポイントにおける混合モデルの出力値F(x;Θ)、すなわち指向性ゲインが算出される。

　モデル化前のもとの指向性データの各ビンは、指向性データの形状の類似性を考慮して決定されるモデル化時のバンド数「band_count」により記述される数のバンド（band）のうちの何れかのバンドに属す。

　また、各ビンとバンドの対応関係は、ビン情報「bin_range_per_band[i_band]」により記述され、そのビン情報として、バンドに属す最も大きい周波数のビンを示すインデックス情報である最大インデックスが書き込まれている。

　この場合、例えば図６に示すように各バンドに属すビンの数はバンドごとに異なっていてもよい。

　この例では、最も周波数が低い最初のバンド０（band0）には２つのビン０（bin0）とビン１が属しており、次のバンド１には１つのビン２が属しており、さらにその次のバンド２には２つのビン３とビン４が属している。

　したがって、バンド０のビン情報「bin_range_per_band[i_band]」の値は、ビン１を示す値「１」、すなわち「bin_range_per_band[0]＝1」とされる。同様に、バンド１のビン情報の値は「２」、すなわち「bin_range_per_band[1]＝2」とされ、バンド２のビン情報の値は「４」、すなわち「bin_range_per_band[2]＝4」とされる。

　モデルデータにはモデルパラメータが含まれているため、そのモデルパラメータから各バンドについての混合モデルF’(x;Θ)を得ることができる。ここで、混合モデルF’(x;Θ)は、式（３）に示したビンごとの混合モデルF(x;Θ)に対応する。

　モデル化前の指向性データは、各データポイントのビンごとに指向性ゲインの値を有している。そのため、モデルパラメータから得られるバンドごとの混合モデルF’(x;Θ)、より詳細には混合モデルの出力値F’(x;Θ)を、もとのビンごとの混合モデルF(x;Θ)に変換する必要がある。

　そこで、再生側（復号側）の装置では、バンドごとの混合モデルF’(x;Θ)と、ビンごとのスケールファクタ「scale_factor[i_bin]」と、ビンごとの最小値「offset[i_bin]」とに基づいて、データポイントにおけるビンごとの混合モデルの出力値F(x;Θ)が算出される。

　すなわち、F(x;Θ)＝F’(x;Θ)×scale_factor[i_bin]＋offset[i_bin]が計算される。この計算では、バンドごとの混合モデルの出力値F’(x;Θ)が各ビンのダイナミックレンジに合わせて補正される。

　さらに、差分圧縮を併用している場合、すなわちモデルデータにデータポイントごとの差分情報「diff_data[i_point]」が含まれている場合には、計算により得られた出力値F(x;Θ)に差分情報が加算され、最終的な出力値F(x;Θ)とされる。

　以上の計算により、モデルデータから、モデル化前のもとの指向性データが復元されたことになる。なお、再生側では、各データポイントとなる位置や各ビンの周波数は、モデルデータに格納されている方位角「azimuth_table[i]」、仰角「elevation_table[i]」、半径「distance[i]」、および周波数「freq[i_bin]」から特定することが可能である。

　実際に、モデルデータが図５に示した構成となるように指向性データをモデル化したときのモデルデータのデータ量を図７に示す。

　この例では、モデル化前のもとの指向性データにおけるデータポイント数は2522個であり、ビン数は２９個となっている。また、モデル化時には、バンド数「band_count」が「３」とされ、vMF分布（楕円率β、major軸ベクトルγ_２、minor軸ベクトルγ_３なし）からなる混合モデルでのモデル化が行われている。

　図７のモデル化では、モデル化前はデータ量が306KBであったもとの指向性データが、データ量が0.85KBのモデルパラメータに変換されており、データ量が約1/360に圧縮されていることが分かる。

　また、図５の例では、必要に応じてモデルデータに差分情報が含まれており、適宜、差分情報が用いられて指向性データの復元が行われる。

　すなわち、例えば聴覚心理の観点で差分が知覚できる場合には、本技術のモデル化と合わせて差分符号化が併用され、知覚不可能な程度まで指向性データが復元される。

　例えば図８の矢印Q41に示す指向性データが対象とされてモデル化が行われたとする。なお、図８において各球表面における色の濃淡は指向性ゲインの大きさを示している。

　この例では、矢印Q41に示す指向性データをモデル化した結果、矢印Q42に示す混合モデル、より詳細には混合モデルにより表される指向性データが得られたとする。

　なお、矢印Q42に示す部分において、球表面に描かれた複数の各直線は上述のベクトルγ_１を表している。例えばベクトルV51は１つのベクトルγ_１を表している。

　このような矢印Q41に示す指向性データと、矢印Q42に示す混合モデルとが得られた場合、それらの指向性データと混合モデルとの差分を求めると、矢印Q43に示す残差のデータが差分情報として得られる。

　図５に示した例では、矢印Q43に示す残差のデータの各データポイントにおける値（残差）が差分情報「diff_data[i_point]」としてモデルデータに格納される。

　なお、指向性の表現方式でHOA（Higher Order Ambisonics）と呼ばれる方式が存在する。HOAでは、振幅だけでなく位相の情報も記録できるという利点があるが、指向性の形状が複雑になるほど高次の項が必要となりデータ量が多くなる。また、HOAでは係数が発散してしまうため、使用することのできない禁止周波数も存在する。

　指向性は、一般的に高域の方が、より形状が複雑になり凸度が高くなる。また、高域では位相の情報の利用価値が相対的に低下する。そのため、指向性データのデータ量を低減させる場合に、HOAを利用するよりも、本技術のように混合分布モデルによりモデル化する方式を採用することのメリットが大きい。なお、低域では指向性の形状が比較的緩やかで、位相を記録することにより回折、干渉等の物理現象を再現できるため、低域ではHOAを利用し、高域では混合分布モデルによりモデル化する方式を利用するようにしてもよい。

　ところで、モデルデータを再生側（復号側）に伝送した場合、そのモデルデータに基づき生成（復元）される指向性データ（振幅データ）では、特定の離散周波数ポイント、すなわち特定のビンにおいてのみ指向性ゲインが存在する。換言すれば、指向性ゲインが存在しない周波数があるため、モデルデータから生成された指向性データをそのまま用いたのではレンダリング処理ができない場合がある。

　また、データポイントも離散的に配置されているため、ユーザの視点位置（受聴位置）やオブジェクトが移動して、それらのユーザとオブジェクトの位置関係が変化すると、レンダリング処理に利用する指向性データのデータポイントも変化する。そのような場合に、互いに隣接するデータポイント間の間隔が広いとglitch（波形不連続）が発生してしまう。

　そこで、指向性データに対して周波数方向や時間方向の補間処理を行うことで、より多くの周波数（ビン）や方向（データポイント）について指向性ゲインが得られるようにしてもよい。

　例えば周波数方向の補間処理として、得ようとする特定周波数近傍の複数の周波数を示すビンの指向性ゲインを用いた１次補間処理や２次補間処理などを行うことが考えられる。

　また、例えば時間方向の補間処理として、得ようとする方向（位置）近傍の複数のデータポイントにおけるビンごとの指向性ゲインを用いた、方位角方向や仰角方向の双一次補間処理などを行うことが考えられる。

　なお、オーディオデータのフレーム長（サンプル数／フレーム）、混合モデルでの混合数や選択するモデル（分布）、データポイント数などの各種のパラメータ等により、指向性データのモデル化時の計算量と音質への影響が変化する（トレードオフ）。

　すなわち、例えばオーディオデータの１フレームごとにユーザ（受聴者）やオブジェクトの位置と向きが変化する場合、時間方向の補間処理を行うことで、波形不連続の発生を抑制し、より高品質なオーディオ再生を実現することができる。

　また、例えば再生側で、より高精度な指向性データを得るために混合モデルの混合数を増やすかや、vMF分布よりもパラメータ数は多いが、より表現能力の高いKent分布を使用するかなどを適切に決定することで、計算量と音質のバランスを調整することができる。

　さらに、コンテンツの制作者等は、例えば音源（オブジェクト）の指向性の形状に応じて、指向性データのデータポイント数を増やすか、または再生時の補間処理によりデータポイント数の少なさに対処するかなどを決定することもできる。

　その他、モデル化（符号化）の対象となるもとの指向性データと、混合モデル、すなわちモデル化後の指向性データとの誤差（差分）を示す差分情報をハフマン符号化などの任意の符号化方式により符号化し、伝送してもよい。

　また、例えば周波数方向の補間処理や時間方向の補間処理など、指向性データの利用方式（レンダリング方式）や、差分情報等の各種の情報を使用するか否かをフラグ等により切り替えることができるようにしてもよい。

　例えばフラグにより、低リソース再生機器向け等の低精度用のパラメータと、高リソース再生機器向け等の高精度用のパラメータとの切り替え、すなわちパラメータ精度の切り替えを行うことができるようにしてもよい。そのような場合、例えば再生機器のリソースやコンテンツ配信時のネットワーク環境などに応じてパラメータが切り替えられる。

　なお、以上においては本技術を指向性データに適用する例について説明したが、その他、本技術は、映像におけるテスクチャデータ、例えばvolumetric点群データに対する色や、透明度情報などにも適用可能である。

　さらに、本技術では、例えば微細構造の再現が重要な場合には、コンテンツの制作者等がマニュアル（手動）で混合モデルの混合数の追加や、モデルパラメータ等の各種のパラメータの調整を行うことができるようにしてもよい。

〈サーバの構成例〉
　図９は、本技術を適用したサーバの構成例を示す図である。

　図９に示すサーバ１１は、例えばコンピュータなどからなる情報処理装置であり、コンテンツの配信を行う。

　例えばコンテンツは、１または複数の各オブジェクトのオーディオデータ（オブジェクトオーディオデータ）と、音源種別ごとに用意された、音源（オブジェクト）の指向性、すなわち指向特性を表す指向性データとから構成される。

　このようなコンテンツは、例えば３Ｄ音源の音とともに指向性データをマイクロホンアレイ等により収録することで得ることができる。また、コンテンツにオーディオデータに対応する映像データが含まれていてもよい。

　サーバ１１は、モデル化部２１、モデルデータ生成部２２、オーディオデータ符号化部２３、および出力部２４を有している。

　モデル化部２１は、入力された各音源種別の指向性データをモデル化し、その結果得られたモデルパラメータや差分情報をモデルデータ生成部２２に供給する。

　モデルデータ生成部２２は、モデル化部２１から供給されたモデルパラメータや差分情報に基づいてモデルデータを生成し、出力部２４に供給する。

　オーディオデータ符号化部２３は、入力された各オブジェクトのオーディオデータを符号化し、その結果得られた符号化オーディオデータを出力部２４に供給する。

　出力部２４は、モデルデータ生成部２２から供給されたモデルデータと、オーディオデータ符号化部２３から供給された符号化オーディオデータとを多重化することで符号化ビットストリームを生成し、出力する。

　なお、ここでは説明を簡単にするため、モデルデータと符号化オーディオデータとが同時に出力される例について説明するが、これらのモデルデータと符号化オーディオデータは個別に生成され、互いに異なるタイミングで出力されるようにしてもよい。また、モデルデータと符号化オーディオデータは、互いに異なる装置により生成されてもよい。

〈符号化処理の説明〉
　次に、サーバ１１の動作について説明する。すなわち、以下、図１０のフローチャートを参照して、サーバ１１による符号化処理について説明する。

　ステップＳ１１においてモデル化部２１は、入力された各音源種別の指向性データをモデル化し、その結果得られたモデルパラメータや差分情報をモデルデータ生成部２２に供給する。

　例えばモデル化部２１は、指向性データを上述した式（３）に示した、複数の分布からなる混合モデルで表す（表現する）ことで、指向性データをモデル化する。

　これにより、式（３）に示した混合モデルを構成するパラメータ集中度κや、楕円率β、重みφ_ｉ、ベクトルγ_１、major軸ベクトルγ_２、minor軸ベクトルγ_３、スケールファクタ、最小値がモデルパラメータとして得られる。

　また、モデル化部２１は、モデル化前のもとの指向性データに関する情報として、データポイント数やデータポイントの位置、周波数ポイント数、ビンの中心周波数を示す情報などを生成する。

　さらに、例えばモデル化部２１は、モデル化された指向性データ、すなわち混合モデルで表された指向性データと、モデル化前のもとの指向性データとの残差（差分）を差分情報として生成する。

　なお、差分情報は、例えば混合モデルで表された指向性データと、もとの指向性データとの残差が所定値以上であるなど、特定の条件が満たされる場合や、コンテンツの制作者等により差分情報の生成が指示された場合などに生成されるようにしてもよい。

　モデル化部２１は、このようにして得られたモデルパラメータや、モデル化前のもとの指向性データに関する情報、差分情報をモデルデータ生成部２２に供給する。

　ステップＳ１２においてモデルデータ生成部２２は、モデル化部２１から供給されたモデルパラメータや、モデル化前のもとの指向性データに関する情報、差分情報をパッキングすることでモデルデータを生成し、出力部２４に供給する。

　このとき、モデルデータ生成部２２は、例えば差分情報をハフマン符号化し、その結果得られた符号化後の差分情報（以下、差分符号データとも称する）やモデルパラメータ等をパッキングすることで、図５に示したフォーマットのモデルデータを生成する。なお、モデルパラメータやモデルデータの符号化が行われるようにしてもよい。

　ステップＳ１３においてオーディオデータ符号化部２３は、入力された各オブジェクトのオーディオデータを符号化し、その結果得られた符号化オーディオデータを出力部２４に供給する。

　なお、各オブジェクトのオーディオデータに対してメタデータがあるときには、オーディオデータ符号化部２３は、各オブジェクト（オーディオデータ）のメタデータも符号化し、その結果得られた符号化メタデータを出力部２４に供給する。

　例えばメタデータには、そのオブジェクトの３次元空間における絶対的な位置を示すオブジェクト位置情報や、３次元空間におけるオブジェクトの向きを示すオブジェクト方向情報、オブジェクト（音源）の種別を示す音源種別情報などが含まれている。

　ステップＳ１４において出力部２４は、モデルデータ生成部２２から供給されたモデルデータと、オーディオデータ符号化部２３から供給された符号化オーディオデータとを多重化して符号化ビットストリームを生成し、出力する。なお、オブジェクトにメタデータがあるときには、出力部２４は、モデルデータ、符号化オーディオデータ、および符号化メタデータを含む符号化ビットストリームを生成する。

　例えば出力部２４は、図示せぬクライアントとして機能する情報処理装置に符号化ビットストリームを送信する。符号化ビットストリームが送信されると、符号化処理は終了する。

　以上のようにしてサーバ１１は、指向性データをモデル化し、その結果得られたモデルパラメータや差分情報が含まれる符号化ビットストリームを出力する。このようにすることで、クライアントへと伝送する指向性データのデータ量、すなわち指向性データの伝送量を低減させることができる。これにより、伝送遅延の発生や伝送レートの増大を抑制することができる。

〈情報処理装置の構成例〉
　サーバ１１から出力された符号化ビットストリームを取得し、コンテンツの音を再生するための出力オーディオデータを生成する情報処理装置は、例えば図１１に示すように構成される。図１１に示す情報処理装置５１は、例えばパーソナルコンピュータやスマートフォン、タブレット、ゲーム機器などからなる。

　情報処理装置５１は、取得部６１、分布モデル復号部６２、オーディオデータ復号部６３、およびレンダリング処理部６４を有している。

　取得部６１は、サーバ１１から出力された符号化ビットストリームを取得するとともに、符号化ビットストリームからモデルデータおよび符号化オーディオデータを抽出する。取得部６１は、モデルデータを分布モデル復号部６２に供給するとともに、符号化オーディオデータをオーディオデータ復号部６３に供給する。

　分布モデル復号部６２は、モデルデータから指向性データを算出する。分布モデル復号部６２は、アンパッキング部８１、指向性データ算出部８２、差分情報復号部８３、加算部８４、および周波数補間処理部８５を有している。

　アンパッキング部８１は、取得部６１から供給されたモデルデータのアンパッキングを行うことで、モデルデータからモデルパラメータやモデル化前のもとの指向性データに関する情報、差分符号データを抽出する。また、アンパッキング部８１は、モデルパラメータやモデル化前のもとの指向性データに関する情報を指向性データ算出部８２に供給し、差分符号データを差分情報復号部８３に供給する。

　指向性データ算出部８２は、アンパッキング部８１から供給されたモデルパラメータやモデル化前のもとの指向性データに関する情報に基づいて指向性データを算出（復元）し、加算部８４に供給する。なお、以下、指向性データ算出部８２によりモデルパラメータに基づき算出（復元）された指向性データを概形指向性データとも称する。

　差分情報復号部８３は、アンパッキング部８１から供給された差分符号データに対して、ハフマン符号化に対応する方式での復号を行い、その結果得られた差分情報を指向性データ残差として加算部８４に供給する。

　加算部８４は、指向性データ算出部８２から供給された概形指向性データと、差分情報復号部８３から供給された指向性データ残差（差分情報）とを加算することで、よりもとの指向性データに近い指向性データを生成し、周波数補間処理部８５に供給する。

　周波数補間処理部８５は、加算部８４から供給された指向性データに対して周波数方向の補間処理を行い、その結果得られた指向性データをレンダリング処理部６４に供給する。

　オーディオデータ復号部６３は、取得部６１から供給された符号化オーディオデータに対する復号を行い、その結果得られた各オブジェクトのオーディオデータをレンダリング処理部６４に供給する。

　また、符号化ビットストリームに符号化メタデータが含まれている場合、オーディオデータ復号部６３は、取得部６１から供給された符号化メタデータを復号し、その結果得られたメタデータをレンダリング処理部６４に供給する。

　レンダリング処理部６４は、周波数補間処理部８５から供給された指向性データと、オーディオデータ復号部６３から供給されたオーディオデータとに基づいて出力オーディオデータを生成する。

　レンダリング処理部６４は、指向性データ保持部８６、HRTF（Head Related Transfer Function）データ保持部８７、時間補間処理部８８、指向性畳み込み部８９、およびHRTF畳み込み部９０を有している。

　指向性データ保持部８６およびHRTFデータ保持部８７には、ユーザ等の指定やセンサ等による測定などに応じて、視点位置情報、受聴者方向情報、オブジェクト位置情報、およびオブジェクト方向情報が供給される。

　例えば視点位置情報は、コンテンツを視聴するユーザ（受聴者）の３次元空間における視点位置（受聴位置）を示す情報であり、受聴者方向情報は、３次元空間における、コンテンツを視聴するユーザの顔の向きを示す情報である。

　また、符号化ビットストリームに符号化メタデータが含まれている場合、オブジェクト位置情報およびオブジェクト方向情報は、符号化メタデータの復号により得られたメタデータから抽出され、指向性データ保持部８６とHRTFデータ保持部８７に供給される。

　その他、指向性データ保持部８６には、メタデータから抽出されるなどして得られた音源種別情報も供給され、HRTFデータ保持部８７には、適宜、コンテンツを視聴するユーザを示すユーザIDが供給される。

　指向性データ保持部８６は、周波数補間処理部８５から供給された指向性データを保持する。また、指向性データ保持部８６は、保持している指向性データのなかから、供給された視点位置情報、受聴者方向情報、オブジェクト位置情報、オブジェクト方向情報、および音源種別情報に応じた指向性データを読み出して時間補間処理部８８に供給する。

　HRTFデータ保持部８７は、ユーザIDにより示される各ユーザについて、ユーザ（受聴者）から見た複数の方向ごとにHRTFを保持している。

　HRTFデータ保持部８７は、保持しているHRTFのなかから、供給された視点位置情報、受聴者方向情報、オブジェクト位置情報、オブジェクト方向情報、およびユーザIDに応じたHRTFを読み出してHRTF畳み込み部９０に供給する。

　時間補間処理部８８は、指向性データ保持部８６から供給された指向性データに対して、時間方向の補間処理を行い、その結果得られた指向性データを指向性畳み込み部８９に供給する。

　指向性畳み込み部８９は、オーディオデータ復号部６３から供給されたオーディオデータと、時間補間処理部８８から供給された指向性データとを畳み込み、その結果得られたオーディオデータをHRTF畳み込み部９０に供給する。指向性データの畳み込みにより、オーディオデータに対して、オブジェクト（音源）が有する指向特性が付加される。

　HRTF畳み込み部９０は、指向性畳み込み部８９から供給されたオーディオデータ、すなわち指向性データが畳み込まれたオーディオデータと、HRTFデータ保持部８７から供給されたHRTFとを畳み込み、その結果得られたオーディオデータを出力オーディオデータとして出力する。HRTFの畳み込みにより、ユーザ（受聴者）から見たオブジェクトの位置に、そのオブジェクトの音が定位する出力オーディオデータを得ることができる。

〈指向性データ生成処理の説明〉
　次に、情報処理装置５１の動作について説明する。

　まず、情報処理装置５１が各音源種別の指向性データを生成するときに行われる指向性データ生成処理について説明する。すなわち、以下、図１２のフローチャートを参照して、情報処理装置５１による指向性データ生成処理について説明する。

　この指向性データ生成処理は、サーバ１１から送信されてきた符号化ビットストリームを取得部６１が受信し、取得部６１が符号化ビットストリームから抽出したモデルデータをアンパッキング部８１に供給すると開始される。

　ステップＳ５１においてアンパッキング部８１は、取得部６１から供給されたモデルデータのアンパッキングを行い、モデルデータから抽出したモデルパラメータやモデル化前のもとの指向性データに関する情報を指向性データ算出部８２に供給する。

　ステップＳ５２において指向性データ算出部８２は、アンパッキング部８１から供給されたモデルパラメータやモデル化前のもとの指向性データに関する情報に基づいて、概形指向性データを算出（生成）し、加算部８４に供給する。

　例えば指向性データ算出部８２は、モデルパラメータにより得られる各バンドの混合モデルF’(x;Θ)と、ビンごとのスケールファクタ「scale_factor[i_bin]」と、ビンごとの最小値「offset[i_bin]」とに基づいて、データポイントにおけるビンごとの混合モデルの出力値F(x;Θ)を算出する。これにより、各データポイントにおけるビンごとの指向性ゲイン（振幅データ）からなる概形指向性データが得られる。

　ステップＳ５３においてアンパッキング部８１は、取得部６１から供給されたモデルデータに差分符号データが含まれているか否か、すなわち差分符号データがあるか否かを判定する。

　ステップＳ５３において差分符号データが含まれていると判定された場合、アンパッキング部８１は、モデルデータから差分符号データを抽出して差分情報復号部８３に供給し、その後、処理はステップＳ５４へと進む。

　ステップＳ５４において差分情報復号部８３は、アンパッキング部８１から供給された差分符号データに対する復号を行い、その結果得られた指向性データ残差（差分情報）を加算部８４に供給する。

　ステップＳ５５において加算部８４は、指向性データ算出部８２から供給された概形指向性データに、差分情報復号部８３から供給された指向性データ残差を加算する。

　加算部８４は、加算により得られた指向性データを周波数補間処理部８５に供給し、その後、処理はステップＳ５６へと進む。

　これに対して、ステップＳ５３において差分符号データが含まれていないと判定された場合、ステップＳ５４およびステップＳ５５の処理はスキップされ、その後、処理はステップＳ５６へと進む。この場合、加算部８４は、指向性データ算出部８２から供給された概形指向性データを、そのまま復元された指向性データとして周波数補間処理部８５に供給する。

　ステップＳ５３において差分符号データが含まれていないと判定されたか、またはステップＳ５５の処理が行われると、ステップＳ５６の処理が行われる。

　ステップＳ５６において周波数補間処理部８５は、加算部８４から供給された指向性データに対して周波数方向の補間処理を行い、補間処理により得られた指向性データを指向性データ保持部８６に供給して保持させる。

　例えばオブジェクトのオーディオデータが周波数領域のデータであり、オーディオデータが複数の周波数ビンごとに周波数成分値を有しているとする。そのような場合、周波数方向の補間処理では、例えば指向性データが、オーディオデータが周波数成分値を有する全周波数ビンについて指向性ゲインを有するように、必要なビンの指向性ゲインを算出する補間処理が行われる。

　具体的には、例えば周波数補間処理部８５は、指向性データにおける所定のデータポイントの複数のビン（周波数）の指向性ゲインに基づく補間処理を行うことで、もとの指向性データには存在していなかった、同じデータポイントにおける新たな周波数（ビン）の指向性ゲインを算出する。このような周波数方向の補間処理により、より多くの周波数における指向性ゲインを含む指向性データを得ることができる。

　周波数方向の補間処理が行われ、指向性データ保持部８６に補間処理後の指向性データが保持されると、指向性データ生成処理は終了する。

　以上のようにして情報処理装置５１は、モデルデータに基づいて指向性データを算出する。このようにすることで、伝送される指向性データのデータ量、すなわち指向性データの伝送量を低減させることができる。これにより、伝送遅延の発生や伝送レートの増大を抑制することができる。

〈出力オーディオデータ生成処理の説明〉
　続いて、図１３のフローチャートを参照して、情報処理装置５１により行われる出力オーディオデータ生成処理について説明する。この出力オーディオデータ生成処理は、図１２を参照して説明した指向性データ生成処理が行われた後の任意のタイミングで行われる。

　ステップＳ８１においてオーディオデータ復号部６３は、取得部６１から供給された符号化オーディオデータの復号を行い、その結果得られたオーディオデータを指向性畳み込み部８９に供給する。例えば復号により、周波数領域のオーディオデータが得られる。

　なお、取得部６１から符号化メタデータが供給された場合、オーディオデータ復号部６３は、符号化メタデータを復号し、その結果得られたメタデータに含まれているオブジェクト位置情報、オブジェクト方向情報、音源種別情報を、適宜、指向性データ保持部８６やHRTFデータ保持部８７に供給する。

　また、指向性データ保持部８６は、供給された視点位置情報、受聴者方向情報、オブジェクト位置情報、オブジェクト方向情報、および音源種別情報に応じた指向性データを時間補間処理部８８に供給する。

　例えば指向性データ保持部８６は、視点位置情報、受聴者方向情報、オブジェクト位置情報、およびオブジェクト方向情報から、３次元空間におけるオブジェクトとユーザの視点位置（受聴位置）の関係を特定し、その特定結果に応じたデータポイントを特定する。

　一例として、例えばオブジェクトから視点位置へと向かう方向を視点位置方向とすると、混合モデルの中心から見て視点位置方向にある、混合モデルの球表面上の位置が対象データポイント位置として特定される。なお、対象データポイント位置に実際のデータポイントがない場合もある。

　指向性データ保持部８６は、音源種別情報により示される音源種別の指向性データから、特定された対象データポイント位置近傍にある複数のデータポイントにおける各ビンの指向性ゲインを抽出する。

　そして指向性データ保持部８６は、抽出した複数のデータポイントにおける各ビンの指向性ゲインからなるデータを、オブジェクトとユーザ（受聴者）の位置や方向の関係に応じた指向性データとして時間補間処理部８８に供給する。

　さらに、HRTFデータ保持部８７は、供給された視点位置情報、受聴者方向情報、オブジェクト位置情報、オブジェクト方向情報、およびユーザIDに応じたHRTFをHRTF畳み込み部９０に供給する。

　具体的には、例えばHRTFデータ保持部８７は、視点位置情報、受聴者方向情報、オブジェクト位置情報、およびオブジェクト方向情報に基づき、受聴者（ユーザ）から見たオブジェクトの相対的な方向をオブジェクト方向として特定する。そしてHRTFデータ保持部８７は、ユーザIDに対応する各方向のHRTFのうち、オブジェクト方向に対応する方向のHRTFをHRTF畳み込み部９０に供給する。

　ステップＳ８２において時間補間処理部８８は、指向性データ保持部８６から供給された指向性データに対して時間方向の補間処理を行い、その結果得られた指向性データを指向性畳み込み部８９に供給する。

　例えば時間補間処理部８８は、指向性データに含まれる複数のデータポイントにおける各ビンの指向性ゲインに基づいて、上述の対象データポイント位置における各ビンの指向性ゲインを補間処理により算出する。すなわち、もとのデータポイントとは異なる新たなデータポイント（対象データポイント位置）における指向性ゲインが補間処理により算出される。

　時間補間処理部８８は、対象データポイント位置における各ビンの指向性ゲインからなるデータを、時間方向の補間処理により得られた指向性データとして指向性畳み込み部８９に供給する。

　ステップＳ８３において指向性畳み込み部８９は、オーディオデータ復号部６３から供給されたオーディオデータと、時間補間処理部８８から供給された指向性データとを畳み込み、その結果得られたオーディオデータをHRTF畳み込み部９０に供給する。

　ステップＳ８４においてHRTF畳み込み部９０は、指向性畳み込み部８９から供給されたオーディオデータと、HRTFデータ保持部８７から供給されたHRTFとを畳み込み、その結果得られた出力オーディオデータを出力する。

　ステップＳ８５において情報処理装置５１は、処理を終了するか否かを判定する。

　例えば取得部６１からオーディオデータ復号部６３に新たなフレームの符号化オーディオデータが供給された場合、ステップＳ８５において処理を終了しないと判定される。これに対して、例えば取得部６１からオーディオデータ復号部６３に新たなフレームの符号化オーディオデータが供給されず、コンテンツの全フレームの出力オーディオデータが生成された場合、ステップＳ８５において処理を終了すると判定される。

　ステップＳ８５において、まだ処理を終了しないと判定された場合、その後、処理はステップＳ８１に戻り、上述した処理が繰り返し行われる。

　これに対して、ステップＳ８５において処理を終了すると判定された場合、情報処理装置５１は各部の動作を終了させ、出力オーディオデータ生成処理は終了する。

　以上のようにして情報処理装置５１は、適切な指向性データとHRTFを選択し、それらの指向性データとHRTFをオーディオデータに畳み込んで出力オーディオデータとする。このようにすることで、オブジェクト（音源）の指向特性や、オブジェクトと受聴者の位置や向きの関係を考慮して、より臨場感のある高品質なオーディオ再生を実現することができる。

〈第２の実施の形態〉
〈差分情報の符号化について〉
　ところで、指向性データは、音源種別ごとや周波数帯域ごとに異なる指向性形状を有している。

　また、サーバ１１では、モデル化前の指向性データと、モデル化後の指向性データとの差分を示す差分情報が適宜生成される。上述の例では、差分情報がハフマン符号化などの符号化方式で符号化され、差分符号データが得られると説明した。

　Kent分布やvMF分布によるモデル化だけでなく、差分情報の符号化についても音源種別や周波数帯域に応じて適切な符号化を行えるようにサーバ１１側、すなわちエンコーダ側で差分情報の符号化手法を選択できるようにしてもよい。

　ここでは、例として差分情報がハフマン符号化される場合について説明する。

　ハフマン符号化では、例えば図１４に示すように、符号化の対象となる１つの指向性データから得られた複数のビンごとの差分情報に基づき出現確率の分布（確率密度分布）が生成される。

　なお、図１４において横軸は差分情報の値（dB値）を示しており、縦軸は差分情報の各値の出現確率を示している。

　例えば、指向性データの全データポイントにおける全てのビン（周波数）が対象とされ、それらの各ビンの差分情報からヒストグラムを生成することで、差分情報の各値の出現確率が求められる。なお、出現確率の分布（確率密度分布）は、ビンごとに求められてもよいし、特定の周波数帯域に含まれるビンが対象とされて求められてもよいし、全ビンが対象とされて求められてもよく、それらの何れかを選択可能であってもよい。

　サーバ１１では、このような差分情報の出現確率に基づいて、予め用意された複数のハフマン符号化テーブルのなかから適切な１つのハフマン符号化テーブルが選択されるか、または１つの新規のハフマン符号化テーブルが生成される。

　指向性データの全データポイントにおける全てのビン（周波数）が対象とされ、それらの全てのビンに対して１つのハフマン符号化テーブルが選択または生成されてもよいし、１または複数のビンごとに１つのハフマン符号化テーブルが選択または生成されてもよい。

　このようにして選択または生成されたハフマン符号化テーブルが用いられて差分情報のハフマン符号化が行われる。

　ハフマン符号化テーブルは、符号化前のデータ、すなわち差分情報と、符号化により得られるハフマンコード（符号データ）との対応を示す、符号化前のデータをハフマンコードへと変換するためのテーブルである。

　また、差分情報をハフマン符号化することで得られる差分符号データの復号時には、ハフマン符号化テーブルに対応する逆引テーブルが用いられる。

　逆引テーブルは、ハフマンコード（符号データ）と復号後のデータとの対応を示す、ハフマンコードを復号後のデータへと変換するためのテーブルである。この逆引テーブルは、ハフマン符号化テーブルから生成することができる。

　差分情報をハフマン符号化する場合には、予めサーバ１１（エンコーダ）と情報処理装置５１（デコーダ）の双方でハフマン符号化テーブルを保持している状態となるようにしてもよい。そのような場合、サーバ１１から情報処理装置５１に対して、差分情報のハフマン符号化に用いたハフマン符号化テーブルを示すＩＤ情報が通知される。

　また、サーバ１１がハフマン符号化テーブルまたは逆引テーブルを符号化ビットストリームに格納し、情報処理装置５１へと伝送するようにしてもよい。

　特に、逆引テーブルのサイズ（データ量）は大きいので、サーバ１１から情報処理装置５１へとハフマン符号化テーブルを伝送しておき、情報処理装置５１が復号時等にハフマン符号化テーブルに基づき逆引テーブルを生成するようにしてもよい。

　また、出現確率の分布（確率密度分布）では、出現確率（出現頻度）が低い差分情報の値と出現確率が高い差分情報の値がある。そこで、例えば差分情報の取り得る値の範囲として±3dBの範囲など、出現確率の高い差分情報の値を含む狭いダイナミックレンジのデータに対応する範囲を対象範囲とし、その対象範囲のみを対象としたハフマン符号化テーブルを用いるようにしてもよい。

　そのような場合、対象範囲外の値の差分情報、すなわち出現確率の低いイレギュラーな値の差分情報については、差分情報をそのままモデルデータに格納するようにしてもよい。換言すれば、差分情報がそのまま差分符号データとして扱われる。

　以上のようにして、差分情報の確率密度分布に応じて、高効率となるハフマン符号化テーブルを選択したり生成したりし、どのようなハフマン符号化テーブルを利用するかに関する情報等を符号化ビットストリームに記述することで、効率よく差分情報を符号化および伝送することができる。

　また、差分情報を符号化するにあたっては、１または複数の方式を組み合わせて用いることで、さらにダイナミックレンジを小さくし、符号化効率を向上させることができる。特に、複数の方式を組み合わせることで、多段差分符号化を実現することができる。

　例えば多段差分符号化では、空間隣接差分方式、周波数間差分方式、および複素差分方式のうちの少なくとも２以上を組み合わせて符号化を行うことが考えられる。

　また、例えば多段差分符号化の有無や方式を示すmodeがモデルデータにおいてenc_mode等として記録される。このとき、例えば下位4bitに多段差分符号化の方式を記録し、上位4bitに対象が実数または複素数の何れであるかを記録した場合、以下のような情報がモデルデータに格納される。

（対象データが実数）
　0x00：多段差分符号化無し
　0x01：空間隣接差分方式
　0x02：周波数間差分方式
　0x03：空間隣接差分方式＋周波数間差分方式
（対象データが複素数）
　0x1*：下位ビットは対象データ実数の場合と同じ

　空間隣接差分方式は、処理対象のデータポイントの差分情報の符号化を行うときに、その処理対象のデータポイントにおける差分情報と、処理対象のデータポイントの近傍にある他のデータポイントにおける差分情報との差分が空間差分情報として求められる。例えば、互いに隣接するデータポイント間の差分情報の差分が空間差分情報として求められる。そして、得られた空間差分情報がハフマン符号化されて差分符号データとされる。

　空間隣接差分方式では、指向性データにおける空間的に近い位置（データポイント）のデータ、すなわち指向性ゲインや差分情報は、近い値を取りやすいという性質が利用されている。

　周波数間差分方式は、処理対象のビン（周波数）の差分情報の符号化を行うときに、その処理対象のビンにおける差分情報と、処理対象のビンに隣接するビンなどの近傍の周波数である他のビンにおける差分情報との差分が周波数間差分情報として求められる。そして、得られた周波数間差分情報がハフマン符号化されて差分符号データとされる。

　周波数間差分方式では、近い周波数（ビン）のデータ、すなわち指向性ゲインや差分情報は、近い値を取りやすいという性質が利用されている。

　例えば空間隣接差分方式と周波数間差分方式を組み合わせて用いる場合には、互いに近接するビン間の空間差分情報の差分が周波数間差分情報として求められ、その周波数間差分情報がハフマン符号化されるか、または互いに近接するデータポイント間の周波数間差分情報の差分が空間差分情報として求められ、その空間差分情報がハフマン符号化される。

　複素差分方式は、指向性データが上述した振幅に関する情報だけでなく、位相に関する情報も有する場合に用いられる。

　例えば指向性データが振幅と位相に関する情報を有する場合、それらの振幅と位相に関する情報、つまり指向性ゲインは複素数により表現される。すなわち、指向性データは、データポイントごとに、各ビンについての振幅と位相を示す複素数のデータ（以下、複素指向性ゲインとも称する）を有することになり、差分情報も複素数のデータとなる。

　複素差分方式では、複素数により表現される差分情報の実部と虚部がそれぞれ独立（個別）にハフマン符号化されるか、または実部と虚部からなる２次元データ（複素指向性ゲイン）に対するハフマン符号化が行われる。なお、複素差分方式では、実部と虚部のそれぞれに対して個別にハフマン符号化を行うか、または２次元データに対するハフマン符号化を行うかを選択できるようにしてもよい。

　以下では、空間隣接差分方式、周波数間差分方式、および複素差分方式のうちの少なくとも１以上を組み合わせて符号化する各方式や、差分情報をそのままハフマン符号化する方式を１つの差分符号化方式または差分符号化モードとも称することとする。特に、差分情報をそのままハフマン符号化する差分符号化方式は、差分を用いる符号化、すなわち差分符号化を行わない方式であるといえる。

　例えばサーバ１１は、差分情報等に基づいて、複数の差分符号化方式（差分符号化モード）のなかから最も効率の高いものを選択し、その選択した差分符号化方式で差分情報のハフマン符号化を行う。

　具体的には、例えば各差分符号化方式における差分符号データの符号量（データ量）が差分情報に基づく演算により求められ、差分符号化方式のなかから最も符号量が少ないものが、最も効率の高いものとして選択されるようにしてもよい。

　その他、例えば指向性データの音源種別や、無響室等の指向性データの収録時の環境などに基づいて、適切な差分符号化方式が選択されるようにしてもよい。

〈指向性データの表現方式について〉
　以上においては、主に指向性データがKent分布やvMF分布からなる混合モデル（混合分布モデル）によりモデル化される例について説明した。

　また、例えば低域、つまり低い周波数のビンではHOAにより指向性データをモデル化して位相に関する情報も記録し、位相の重要度が相対的に低い高域、つまり高い周波数のビンではKent分布やvMF分布からなる混合モデルにより指向性データをモデル化してもよいと説明した。この場合、例えば1.5kHz乃至2kHzの近傍の所定の周波数で混合モデルによるモデル化とHOAによるモデル化とを切り替えることが考えられる。例えばオーディオコーデック等で位相の情報を利用しないIntensity stereoが上記の帯域以上で用いられている。このようにHOAと混合モデルを組み合わせる手法は、例えばホイッスルやトランペットなど、鋭い正面指向性を持つ場合に有効と考えられる。

　なお、これに限らず、周波数帯域ごと、すなわちビンやバンドごとに、または全周波数帯域で共通して、HOA方式、混合方式、複素混合方式、および差分方式のうちの少なくとも１以上の方式を組み合わせてモデルデータを生成するようにしてもよい。そのような場合、例えばHOA方式や混合方式などの互いに異なる１または複数の方式により指向性データがモデル化され、その結果得られたモデルパラメータ等を含むモデルデータが生成される。

　HOA方式は、各データポイントのビンごとの複素指向性ゲインからなる指向性データを、HOAを利用してモデル化する方式である。すなわち、HOA方式は指向性データを球面調和関数展開によりモデル化する方式である。

　具体的には、HOA方式では指向性データに対して球面調和関数展開が行われ、その結果、各次元の球面調和関数についての係数である球面調和係数がモデルパラメータとして得られる。これらの各次元の球面調和係数から、HOAによるモデル化後の複素指向性ゲインからなる指向性データを得ることができる。

　上述のように、HOA方式でのモデル化では、位相を含めた表現が可能であるが、微細な表現を行うためには球面調和関数展開の次数を上げる、すなわち高次の項まで球面調和係数を求める必要があり、そのような場合にはモデルデータのデータ量が多くなってしまう。特にHOA方式でのモデル化では、特定の方位（方向）のみ振幅や位相の分布の微細な表現を行うことができない。

　逆に、低次の項のみ球面調和係数を求める場合には、比較的緩やかな振幅や位相の変化のみを記述可能となる。

　混合方式は、上述したKent分布やvMF分布からなる混合モデルによりモデル化を行う方式である。混合方式では、音源から見た特定の方位（方向）、すなわちデータポイントの位置において変化の激しい指向性ゲインの形状を記述可能である。

　複素混合方式は、複素指向性ゲインからなる指向性データ、すなわち振幅と位相のデータを、複素数に対応した混合分布（混合モデル）を用いてモデル化する方式である。

　複素混合方式の例として、例えば以下に示す２つの方法によるモデル化が考えられる。

　まず、１つ目の方法として、複素指向性ゲインの実部と虚部のそれぞれ、または複素指向性ゲインから求まる振幅と位相角のそれぞれを独立に実数を対象とした確率密度分布の混合モデルで記述することによりモデル化を行う方法が考えられる。

　２つ目の方法として、複素数に対応した複素Bingham分布混合モデルや、複素watson分布混合モデル等を用いて指向性データ（複素指向性ゲインの分布）を記述することによりモデル化を行う方法が考えられる。

　この場合、例えば指向性データが１または複数の複素Bingham分布からなる混合モデルや、１または複数の複素watson分布からなる混合モデルによりモデル化され、その結果、混合方式における場合と同様のモデルパラメータが得られる。このようにして得られたモデルパラメータから、複素混合方式でのモデル化後の複素指向性ゲインからなる指向性データを得ることができる。

　一例として対象とする複素数データの分布をそのまま複素Bingham分布で記述する場合、以下の式（５）に示す形式で記述が行われる。すなわち、複素Bingham分布の値f(z)は次式（５）により表される。

　式（５）における複素数ベクトルｚは、Kent分布やvMF分布における球表面の位置ベクトルｘに対応し、ｚ*はその複素共役となる。複素行列Ａは位置、急峻さ、方向、形状を示すｋ×ｋ次元の行列であり、正規化係数C(A)は次式（６）の通りである。

　ここでａ_ｊの定義は以下の式（７）の通りである。λ_ｊは複素行列Ａの固有値であり、λ_１＜λ_２＜λ_３＜…λ_ｋである。

　１または複数の複素Bingham分布からなる混合モデル、すなわち複素Bingham混合モデルにおける混合数および重みは、上述のKent分布やvMF分布からなる混合モデルの定式化と共通である。Ｎ個の複素Bingham分布f(z;θ_i)を用いた混合モデルの値F(x;Θ)は以下の式（８）の通り、重みづけ記述が可能である。なお、式（９）に示すように重みの総和は１であり、Θは全パラメータ集合、θ_iは各複素Bingham分布のパラメータ集合（複素Bingham分布を構成するパラメータ）、φ_iはそれぞれの複素Bingham分布に対する重みを表している。

　差分方式は、差分を利用してモデルデータを生成する方式である。

　例えばHOA方式や混合方式などの１または複数の他の方式と差分方式とを組み合わせてモデルデータを生成する場合、差分方式では、モデル化前の指向性データと、１または複数の他の方式によるモデル化後の指向性データとの差分を示す差分情報が、上述の任意の差分符号化方式により符号化され、その結果得られた差分符号データがモデルデータに格納される。なお、差分方式により求められた指向性データの差分がHOA方式等によりモデル化されてもよい。

　差分方式では、例えば差分情報について空間上の位置間（データポイント間）の差分と周波数間（ビン間またはバンド間）の差分の少なくとも何れかが求められ、その結果得られた差分がハフマン符号化されて差分符号データとされる。このとき、ハフマン符号化の対象となる差分情報の差分が複素数である場合には、その差分の実部と虚部のそれぞれが個別にハフマン符号化されてもよいし、複素数がそのままハフマン符号化されてもよいし、差分から求まる振幅成分と位相成分のそれぞれが個別にハフマン符号化されてもよい。

　これに対して、差分方式のみが用いられて、すなわち差分方式単独でモデルデータが生成される場合、上述の任意の差分符号化方式と同様にして指向性データに対する符号化（ハフマン符号化）が行われる。

　このとき、空間隣接差分方式と周波数間差分方式のうちの少なくとも１つを含む、空間隣接差分方式、周波数間差分方式、および複素差分方式のうちの少なくとも１以上の方式が用いられる。すなわち、空間上の位置間（データポイント間）や周波数間（ビン間またはバンド間）における指向性ゲインの差分が求められ、その差分がハフマン符号化される。なお、差分が複素数で表現されるときには、差分の実部と虚部のそれぞれが個別にハフマン符号化されてもよいし、差分（複素数）がハフマン符号化されてもよい。また、差分から求まる振幅成分と位相成分のそれぞれが個別にハフマン符号化されてもよい。

　さらに、差分方式により得られた差分に対するハフマン符号化により得られたハフマンコードからなるデータ（以下、符号化指向性データとも称する）が含まれるモデルデータが生成される。この場合、指向性データの残差は生じないので、モデルデータに差分符号データは含まれていない。

　なお、差分方式では、可逆圧縮が可能であるが、データ次第で圧縮率が変動する。また、空間隣接差分方式や周波数間差分方式などの複数の方式を組み合わせて多段の差分を求める、すなわち差分を求める処理を複数回行う場合には、１次元のデータの場合とは異なり、差分符号データや符号化指向性データをモデルデータに格納する際のデータ順の定義が必要となり、このデータ順によって圧縮率が変動する。

　指向性データからモデルデータを生成するにあたっては、指向性データのビンごとやバンドごとの指向性ゲインの平均値、すなわち平均指向特性をモデル化することも考えられる。そのような場合、差分情報は、平均指向特性にオフセットとスケールファクタを適用し、ダイナミックレンジを合わせてから計算される。

　以上のようにHOA方式や混合方式、複素混合方式、差分方式を組み合わせてモデルデータを生成する場合、モデルデータを生成する方式として主に以下に示す５つの方式への類型化が考えられる。

　ここでいう５つの方式とは、帯域ハイブリッド方式、加算ハイブリッド方式、乗算ハイブリッド方式、球面調和係数モデル化方式、および組み合わせハイブリッド方式である。以下、各方式について説明する。

（帯域ハイブリッド方式）
　帯域ハイブリッド方式は、周波数帯域ごと、すなわちビンごとやバンドごとにHOA方式、混合方式、複素混合方式、および差分方式のうちの何れの方式を用いてモデルデータを生成するかを切り替える方式である。この場合、例えば低域では複素指向性ゲインでの記録が行われ、高域では実数の指向性ゲインでの記録が行われるようにしてもよい。

　具体的な例として、例えば低域側のバンドではHOA方式でのモデル化が行われ、高域側のバンドでは混合方式でのモデル化が行われるなど、バンド（周波数帯域）ごとに異なる方式で指向性データのモデル化が行われるようにすることができる。

　また、例えば低域側のバンドでは複素Bingham分布等による複素混合方式でのモデル化が行われ、高域側のバンドでは混合方式でのモデル化が行われるようにしてもよい。

（加算ハイブリッド方式）
　加算ハイブリッド方式では、モデル化後の指向性データとの差分を示す差分情報が、さらにモデル化されたり、差分方式により符号化されたりする。

　加算ハイブリッド方式の具体的な例として、例えば以下に示す方式（AH1）乃至方式（AH4）などが考えられる。特に、以下に示す例では左側に記述されている方式から順番に処理が実行されていく。

　方式（AH1）：混合方式＋差分方式
　方式（AH2）：HOA方式（低次）＋混合方式
　方式（AH3）：HOA方式（低次）＋差分方式
　方式（AH4）：HOA方式（低次）＋混合方式＋差分方式

　方式（AH1）では、まず指向性データが混合方式でモデル化される。次に、モデル化前の指向性データと、混合方式でのモデル化後の指向性データとの差分を示す差分情報が差分方式により符号化され、差分符号データが生成される。

　そして、混合方式でのモデル化により得られたモデルパラメータと、差分符号データとが含まれるモデルデータが生成される。

　方式（AH2）では、まず指向性データがHOA方式でモデル化される。特に、HOA方式でのモデル化では、低次の項までの球面調和関数展開が行われる。次に、モデル化前の指向性データと、HOA方式でのモデル化後の指向性データとの差分を示す差分情報が、さらに混合方式でモデル化される。

　そして、HOA方式でのモデル化により得られたモデルパラメータと、混合方式での差分情報のモデル化により得られたモデルパラメータとが含まれるモデルデータが生成される。

　方式（AH3）では、方式（AH2）における場合と同様に、HOA方式で低次の項までのモデル化が行われ、その後、HOA方式でのモデル化について得られる差分情報が差分方式により符号化され、差分符号データが生成される。

　そして、HOA方式でのモデル化により得られたモデルパラメータと、差分符号データとが含まれるモデルデータが生成される。

　方式（AH4）では、方式（AH2）における場合と同様に、HOA方式で低次の項までのモデル化後、さらに混合方式での差分情報のモデル化が行われる。

　次にHOA方式でのモデル化について得られた差分情報と、混合方式でのモデル化後の差分情報との差分を示す差分情報が差分方式により符号化され、差分符号データが生成される。換言すれば、HOA方式および混合方式の組み合わせによりモデル化されたモデル化後の指向性データと、モデル化前の指向性データとの差分を示す差分情報が差分方式により符号化され、差分符号データが生成される。

　そして、HOA方式でのモデル化により得られたモデルパラメータと、混合方式での差分情報のモデル化により得られたモデルパラメータと、差分符号データとが含まれるモデルデータが生成される。

　以下では、所定の方式での指向性データのモデル化後に、さらにモデル化対象とされる差分情報と、差分方式での符号化対象とされる差分情報とを区別するため、モデル化対象とされる差分情報を、特に中間差分情報とも称することとする。

　例えば方式（AH4）では、HOA方式でのモデル化により得られる差分情報が中間差分情報であり、この中間差分情報が混合方式でモデル化される。そして、その後、もとの中間差分情報と、混合方式でのモデル化後の中間差分情報との差分を示す差分情報が差分方式により符号化される。

　以上の方式（AH1）乃至方式（AH4）のうち、方式（AH2）では復号側においてもとの指向性データと完全に一致するものを得ることができないが、方式（AH1）、方式（AH3）、および方式（AH4）ではもとの指向性データと完全に一致するものが得られる。

　また、加算ハイブリッド方式ではなく、指向性データが単独の方式でモデル化または符号化されるようにしてもよい。すなわち、例えばHOA方式、混合方式、および差分方式のうちの何れか１つの方式のみで指向性データがモデル化または符号化され、その結果得られたモデルパラメータまたは符号化指向性データが含まれるモデルデータが生成されるようにしてもよい。

（乗算ハイブリッド方式）
　乗算ハイブリッド方式では、所定の方式で指向性データがモデル化され、モデル化後の指向性データと、モデル化前の指向性データとの比（商）がさらに所定の方式とは異なる他の方式でモデル化される。

　乗算ハイブリッド方式の具体的な例として、例えば以下に示す方式（MH1）および方式（MH2）などが考えられる。

　方式（MH1）：HOA方式（低次）×振幅変調（混合方式）
　方式（MH2）：HOA方式（低次）×振幅位相変調（混合方式）

　方式（MH1）では、まず指向性データがHOA方式でモデル化される。特に、HOA方式でのモデル化では、低次の項までの球面調和関数展開が行われる。

　次に、モデル化前の指向性データを、HOA方式でのモデル化後の指向性データで除算して得られる値（以下、振幅変調情報とも称する）が、さらに混合方式でモデル化される。このとき、例えば振幅変調情報を構成する複素数（複素指向性ゲイン）の絶対値（振幅成分）が混合方式でのモデル化の対象とされてもよいし、モデル化前後の指向性データの振幅成分の比が振幅変調情報とされてもよい。そして、HOA方式でのモデル化により得られたモデルパラメータと、混合方式での振幅変調情報のモデル化により得られたモデルパラメータとが含まれるモデルデータが生成される。

　復号時には、HOA方式についてのモデルパラメータから算出された指向性データに対して、混合方式についてのモデルパラメータから算出された振幅変調情報が乗算されて、最終的な指向性データが算出される。

　このような方式（MH1）では、HOA方式での低次の項までのモデル化では表現しきれない、高域の方位（音源からの方向）に応じた細かい振幅の揺れを示す振幅変調情報が混合方式でモデル化されてモデルデータに記録（格納）される。そして復号時には、HOA方式についてのモデルパラメータから算出された指向性データに対して、振幅変調情報により変調がかけられ、より誤差の少ない指向性データが求められる。

　方式（MH2）では、方式（MH1）における場合と同様に、指向性データに対してHOA方式での低次の項までのモデル化が行われる。

　次に、モデル化前の指向性データを、HOA方式でのモデル化後の指向性データで除算して得られる値（以下、振幅位相変調情報とも称する）が、さらに混合方式でモデル化される。このとき、例えば振幅位相変調情報を構成する複素数（複素指向性ゲイン）の実部と虚部や振幅成分と位相成分が混合方式でのモデル化の対象とされる。なお、振幅位相変調情報が複素混合方式によりモデル化されてもよい。そして、HOA方式でのモデル化により得られたモデルパラメータと、混合方式での振幅位相変調情報のモデル化により得られたモデルパラメータとが含まれるモデルデータが生成される。

　復号時には、HOA方式についてのモデルパラメータから算出された指向性データに対して、混合方式についてのモデルパラメータから算出された振幅位相変調情報が乗算されて、最終的な指向性データが算出される。

　このような方式（MH2）では、HOA方式での低次の項までのモデル化では表現しきれない、方位（音源からの方向）に応じた高域の位相の回転変化を示す振幅位相変調情報が混合方式でモデル化されてモデルデータに記録（格納）される。そして復号時には、HOA方式についてのモデルパラメータから算出された指向性データに対して、振幅位相変調情報により変調がかけられ、より誤差の少ない指向性データが求められる。

　乗算ハイブリッド方式や他の方式において、複素数により表現される指向性ゲイン（複素指向性ゲイン）や中間差分情報をモデル化する場合、複素数の実部と虚部とでそれぞれ異なるまたは同じ方式により独立（個別）にモデル化が行われてもよい。例えば実部が混合方式によりモデル化され、虚部も混合方式によりモデル化されてもよい。

　同様に、振幅成分と位相成分がそれぞれ独立（個別）に任意の方式によりモデル化されてもよいし、複素数のデータが複素混合方式によりモデル化されてもよい。

（球面調和係数モデル化方式）
　球面調和係数モデル化方式では、指向性データがHOA方式でモデル化され、その結果得られたモデルパラメータ、すなわち球面調和係数がさらに混合方式でモデル化され、その結果得られたモデルパラメータがモデルデータに格納される。

　したがって、球面調和係数モデル化方式では、指向性データがHOA方式と混合方式の二段階でモデル化されるということができる。復号時には、まず混合方式についてのモデルパラメータに基づいて球面調和係数が算出され、さらに球面調和係数に基づいて指向性データ（概形指向性データ）が算出される。

　その他、例えばモデルパラメータとしての球面調和係数の実部と虚部のそれぞれ、またはモデルパラメータから求まる振幅成分と位相成分のそれぞれが個別（独立）に混合方式などの任意の方式でモデル化されるようにしてもよい。また、球面調和係数が複素混合方式、すなわち１または複数の複素Bingham分布等によりモデル化されてもよい。

（組み合わせハイブリッド方式）
　組み合わせハイブリッド方式では、上述した帯域ハイブリッド方式、加算ハイブリッド方式、乗算ハイブリッド方式、および球面調和係数モデル化方式のうちの少なくとも２以上のものの組み合わせが用いられてモデルデータが生成される。

　また、例えばHOA方式や混合方式など、モデルデータの生成に用いられた１または複数の方式の組み合わせを示す情報がモデルデータに格納されるようにしてもよい。そのような場合、サーバ１１側においてモデルデータの生成に用いる１または複数の方式の組み合わせを適切に選択したり切り替えたりすることができる。

　以上のようにして指向性データがモデル化される場合、モデルデータは、例えば図１５および図１６に示す構成とされる。なお、図１６には図１５に示した部分に続く部分が示されている。また、図１５および図１６において図５に示した場合と対応する部分については、その説明は適宜省略する。

　図１５および図１６に示す例は、num_sound_types_idで指定される１種類の音源の指向性情報（指向性データ）をdirectivityConfigとして記述した例となっている。特にここでは、ハイブリッド方式を実現する一例としてvMF分布とKent分布、差分データ（差分情報）が存在する場合のSyntaxが示されており、各情報のビット数はあくまで一例である。

　図１５および図１６に示すモデルデータは、基本的には図５に示したモデルデータと同じデータから構成されているが、図１５および図１６の例と図５の例とでは、それらのデータのうちのいくつかのデータのビット数とデータ構成が異なっている。

　具体的には、図１５および図１６に示す例においては、方位角「azimuth_table[i]」および仰角「elevation_table[i]」が１６ビットのunsigned shortとされている。

　また、バンド数「band_count」および混合数「mix_count[i_band]」が８ビットのunsigned charとされており、選択フラグ「dist_flag」が１ビットのboolとされている。

　さらに、この例ではモデルデータには、差分情報の符号化に用いられたハイブリッドのモード（差分符号化モード（差分符号化方式））のＩＤ、すなわち差分符号化モード情報を示す「mode」が含まれている。また、モデルデータには差分情報の符号化に用いられたハフマン符号化テーブルを示すインデックス「table_index」も含まれている。

　さらにモデルデータには、1.0dBごとの量子化などの量子化ステップサイズを示す「int db_resolution」が含まれている。例えば「int db_resolution」について、値「0」は量子化なしを示しており、値「1」は0.01dBを示しており、値「2」は0.2dBを示しており、値「3」は0.4dBを示しており、値「256」は25.6dBを示している。

　その他、モデルデータには、各ビンについて、データポイントごとに差分情報をハフマン符号化することで得られたハフマンコード（ハフマン符号）、すなわち差分符号データである「diff_data[i_bin][i_point]」も格納されている。

　また、サーバ１１から情報処理装置５１には、モデルデータに格納されるか、またはモデルデータとは別に図１７に示す構成の情報が伝送される。図１７に示す情報には、ハフマン符号化テーブルまたは逆引きテーブルが含まれている。

　図１７に示す例では、「diff_mode_count」は差分符号化方式の総数を示す情報であり、この総数「diff_mode_count」の分だけ「int_nbits_res_data」が格納されている。

　この「int_nbits_res_data」は、ハフマンコードの最大ビット数、すなわちハフマンコードの最大語長を示す情報であり、例えば1.0dBきざみの場合には７ビットなどとされ、0dBから128dBまでの範囲を表現することができる。

　「element_count」はハフマン符号化テーブルまたは逆引きテーブルの要素数を示す情報であり、その要素数分だけ要素である「Huff_dec_table[i_element]」が格納されている。特に、この例では「Huff_dec_table[i_element]」は、逆引きテーブルの要素となっている。

　また、ハフマン符号化テーブルは、例えば図１８に示すようになる。すなわち、図１８は、ハフマン符号化テーブルの具体的な一例を示している。

　例えば、具体的な例として図１６においてint db_resolution＝1dBとした場合、以下のように符号化が行われる。

　0：0dB
　10：+1dB
　11：+2dB

　element_count＝4;
　int_nbits_res_data＝2;// huffman decodeテーブル(indexからdataを得る逆引きテーブル)の最大語長
　Huff＿dec_table[4]＝｛0,0,1,2｝;

　Huff_dec_tableは最大語長2bitの場合の逆引きテーブルとなる。
　0：0dB
　1：0dB
　2：1dB
　3：2dB

　また、復号時には、以下の手順で処理が行われる。
　（１）最大語長でbitstreamからビット列を取得
　（２）ビット列をi_element（huffman codeを最大語長で記録したものと等価）としてhuff_dec_tableを参照
　（３）i_elementの要素が復元されたデータを得る
　（４）上記データをdb_resolutionを元に復元し、dB値を得る
　なお、復元にはオフセット値が必要である。

　また、元データの音圧（dB値）は、Db＝Huff_dec_table[code] * db_resolutionにより得ることができる。

〈サーバの構成例〉
　サーバ１１において、１または複数の方式を組み合わせてのモデルデータの生成や差分符号化モードでの差分情報の符号化が行われる場合、例えばサーバ１１は図１９に示すように構成される。

　なお、図１９において図９における場合と対応する部分には同一の符号を付してあり、その説明は適宜、省略する。

　図１９に示すサーバ１１は、コンピュータなどからなる情報処理装置であり、図９における場合と同様に符号化装置として機能する。

　サーバ１１は、指向性データ符号化部２０１、オーディオデータ符号化部２３、および出力部２４を有している。

　指向性データ符号化部２０１は、供給された指向性データに基づいてモデルデータを生成する。指向性データ符号化部２０１は、モデルパラメータ推定部２１１、残差算出部２１２、符号化方式選択部２１３、ハフマン符号化部２１４、およびモデルデータ生成部２１５を有している。

　特に、この例ではモデルパラメータ推定部２１１および残差算出部２１２が図９のモデル化部２１に対応し、符号化方式選択部２１３乃至モデルデータ生成部２１５が図９のモデルデータ生成部２２に対応する。

　モデルパラメータ推定部２１１は、供給された処理対象の指向性データをHOA方式や混合方式など、少なくとも１以上の方式によりモデル化し、その結果得られた方式ごとのモデルパラメータを残差算出部２１２およびモデルデータ生成部２１５に供給する。

　残差算出部２１２は、供給された処理対象の指向性データと、モデルパラメータ推定部２１１から供給されたモデルパラメータとに基づいて差分情報を算出し、符号化方式選択部２１３およびハフマン符号化部２１４に供給する。

　符号化方式選択部２１３は、供給された処理対象の指向性データと、残差算出部２１２から供給された差分情報とに基づいて、差分情報をハフマン符号化するときの差分符号化モードとハフマン符号化テーブルを選択し、その選択結果を示す符号化モード情報をハフマン符号化部２１４およびモデルデータ生成部２１５に供給する。

　符号化モード情報は、選択された差分符号化モード（差分符号化方式）を示す差分符号化モード情報と、選択されたハフマン符号化テーブルを示すテーブルインデックス情報とからなる。なお、符号化方式選択部２１３での符号化モード情報の生成にあたっては、差分情報のみが用いられるようにしてもよい。

　ハフマン符号化部２１４は、符号化方式選択部２１３から供給された符号化モード情報に基づいて、残差算出部２１２から供給された差分情報をハフマン符号化し、その結果得られた差分符号データをモデルデータ生成部２１５に供給する。

　モデルデータ生成部２１５は、モデルパラメータ推定部２１１から供給された方式ごとのモデルパラメータと、ハフマン符号化部２１４から供給された差分符号データと、符号化方式選択部２１３から供給された符号化モード情報とを含むモデルデータを生成し、出力部２４に供給する。なお、差分情報の符号化が行われない場合には、モデルデータには差分符号データは含まれない。また、より詳細には、モデルデータには、上述した指向性データに関する情報も格納される。その他、指向性データのモデル化に用いられた方式を示す情報がモデルデータに格納されてもよい。

　サーバ１１が図１９に示した構成とされる場合においても、サーバ１１では図１０を参照して説明した符号化処理が行われる。但し、ステップＳ１１およびステップＳ１２では、より詳細には、以下において説明する処理が行われる。

　すなわち、ステップＳ１１では、モデルパラメータ推定部２１１において少なくとも１以上の方式により、供給された処理対象の指向性データのモデル化が行われるとともに、残差算出部２１２において必要に応じて差分情報が算出される。

　換言すれば、例えばHOA方式や混合方式、複素混合方式、差分方式などが必要に応じて組み合わせられ、これにより上述の帯域ハイブリッド方式や、加算ハイブリッド方式、乗算ハイブリッド方式、球面調和係数モデル化方式、組み合わせハイブリッド方式などによりモデルパラメータと差分情報が算出される。

　また、ステップＳ１２では符号化方式選択部２１３における差分符号化モードとハフマン符号化テーブルの選択、およびハフマン符号化部２１４におけるハフマン符号化が必要に応じて行われるとともに、モデルデータ生成部２１５によるモデルデータの生成が行われる。

　具体的には、例えば加算ハイブリッド方式の方式（AH4）によりモデルパラメータが算出される場合、まずモデルパラメータ推定部２１１は、指向性データをHOA方式でモデル化し、その結果、モデルパラメータとしての球面調和係数を得る。

　また、モデルパラメータ推定部２１１は、HOA方式によるモデル化後の指向性データと、モデル化前の指向性データとの差分を中間差分情報として求めるとともに、中間差分情報を混合方式によりモデル化する。混合方式による中間差分情報のモデル化によって、パラメータ集中度κや楕円率β、重みφ_ｉ、ベクトルγ_１、major軸ベクトルγ_２、minor軸ベクトルγ_３、スケールファクタ、最小値がモデルパラメータとして得られる。

　モデルパラメータ推定部２１１は、HOA方式による指向性データのモデル化により得られたモデルパラメータと、混合方式による中間差分情報のモデル化により得られたモデルパラメータとを残差算出部２１２およびモデルデータ生成部２１５に供給する。

　すると、残差算出部２１２は、モデルパラメータ推定部２１１から供給されたモデルパラメータと、供給された指向性データとに基づいて差分情報を生成する。この差分情報は、HOA方式および混合方式の組み合わせによりモデル化されたモデル化後の指向性データと、モデル化前の指向性データとの残差である。

　また、ハフマン符号化部２１４は、符号化方式選択部２１３から供給された符号化モード情報に従って、残差算出部２１２から供給された差分情報を必要に応じてハフマン符号化する。

　このとき、差分符号化モード情報により示される方式で処理が行われる。すなわち、例えば空間隣接差分方式、周波数間差分方式、および複素差分方式のうちの１以上の方式により差分情報がハフマン符号化されたり、差分情報に対するハフマン符号化が行われなかったりする。

　例えば空間隣接差分方式によりハフマン符号化が行われる場合、ハフマン符号化部２１４は、互いに隣接するデータポイント間における差分情報の差分を空間差分情報として求め、その空間差分情報をハフマン符号化することで差分符号データを生成する。

　モデルデータ生成部２１５は、モデルパラメータ推定部２１１から供給された、HOA方式のモデルパラメータおよび混合方式のモデルパラメータと、符号化方式選択部２１３から供給された符号化モード情報とを含むモデルデータを生成する。特に、差分情報のハフマン符号化が行われた場合には、モデルデータ生成部２１５は、ハフマン符号化部２１４から供給された差分符号データもモデルデータに格納する。

　なお、差分方式単独でモデルデータが生成される場合、モデルパラメータ推定部２１１は、供給された指向性データに基づいて、空間隣接差分方式と周波数間差分方式のうちの少なくとも１以上の方式により指向性データの差分（以下、差分指向性データとも称する）を求める。この差分指向性データは、データポイント間やビン間における指向性データ、すなわち指向性ゲインの差分である。

　この場合、符号化方式選択部２１３は、残差算出部２１２を介してモデルパラメータ推定部２１１から供給された差分指向性データに基づいて符号化モード情報を生成する。また、ハフマン符号化部２１４は、符号化方式選択部２１３から供給された符号化モード情報に基づいて、残差算出部２１２を介してモデルパラメータ推定部２１１から供給された差分指向性データを指定された差分符号化方式によりハフマン符号化し、符号化指向性データを生成する。

　そしてモデルデータ生成部２１５は、ハフマン符号化部２１４から供給された符号化指向性データと、符号化方式選択部２１３から供給された符号化モード情報とを含むモデルデータを生成し、出力部２４に供給する。

〈指向性データ生成処理の説明〉
　図１９に示した構成のサーバ１１から符号化ビットストリームの供給を受けた情報処理装置５１は、例えば図２０に示す指向性データ生成処理を行うとともに、その後、任意のタイミングで図１３を参照して説明した出力オーディオデータ生成処理を行う。

　以下、図２０のフローチャートを参照して、復号装置として機能する情報処理装置５１により行われる指向性データ生成処理について説明する。

　なお、ステップＳ１１１では図１２のステップＳ５１の処理と同様の処理が行われる。すなわち、ステップＳ１１１ではアンパッキング部８１は、モデルデータのアンパッキングを行い、モデルパラメータやモデル化前のもとの指向性データに関する情報、差分符号データなどをモデルデータから抽出する。

　ステップＳ１１２においてアンパッキング部８１は、アンパッキングにより抽出された方式ごとのモデルパラメータのなかに、まだ指向性データ算出部８２に供給していないモデルパラメータがあるか否かを判定する。

　ステップＳ１１２においてモデルパラメータがあると判定された場合、アンパッキング部８１は、まだ指向性データ算出部８２に供給していない、すなわちまだ処理を行っていないモデルパラメータを指向性データ算出部８２に供給し、処理はステップＳ１１３へと進む。

　ステップＳ１１３において指向性データ算出部８２は、アンパッキング部８１から供給された１つの方式のモデルパラメータに基づいて、モデルパラメータに基づくデータを算出する。

　例えばステップＳ１１３では、HOA方式や混合方式など、方式ごとのモデルパラメータに基づいて、モデル化後の指向性データを構成する指向性ゲインや中間差分情報、振幅変調情報、振幅位相変調情報などがモデルパラメータに基づくデータとして算出される。

　ステップＳ１１３の処理が行われると、その後、処理はステップＳ１１２に戻り、上述した処理が繰り返し行われる。

　また、ステップＳ１１２において、指向性データ算出部８２に供給していないモデルパラメータがないと判定された場合、その後、処理はステップＳ１１４へと進む。

　ステップＳ１１４においてアンパッキング部８１は、取得部６１から供給されたモデルデータに差分符号データが含まれているか否か、すなわち差分符号データがあるか否かを判定する。

　ステップＳ１１４において差分符号データが含まれていると判定された場合、アンパッキング部８１は、モデルデータから抽出した符号化モード情報および差分符号データを差分情報復号部８３に供給し、その後、処理はステップＳ１１５へと進む。

　ステップＳ１１５において差分情報復号部８３は、アンパッキング部８１から出力された符号化モード情報および差分符号データを取得する。

　ステップＳ１１６において差分情報復号部８３は、取得した符号化モード情報に基づいて差分符号データの復号を行い、その結果得られた差分情報（指向性データ残差）を加算部８４に供給する。

　例えば符号化モード情報に含まれている差分符号化モード情報によって、空間隣接差分方式による符号化が行われていることが特定されたとする。

　そのような場合、差分情報復号部８３は、符号化モード情報に含まれているテーブルインデックス情報により特定される逆引テーブルを用いて、アンパッキング部８１から供給された差分符号データに対する復号を行い、各データポイントの空間差分情報を得る。

　そして差分情報復号部８３は、処理対象のデータポイントの空間差分情報に、そのデータポイントの近傍にある復号済みの他のデータポイントの差分情報を加算することで、処理対象のデータポイントの差分情報を求める。

　ステップＳ１１６の処理が行われたか、またはステップＳ１１４において差分符号データがないと判定された場合、その後、ステップＳ１１７の処理が行われる。

　ステップＳ１１７において指向性データ算出部８２および加算部８４は、指向性データを算出する。

　すなわち、指向性データ算出部８２は、１または複数回行われたステップＳ１１３の処理により得られたデータに基づいて概形指向性データを算出し、加算部８４に供給する。

　具体的な例として、例えばサーバ１１側において、加算ハイブリッド方式の方式（AH4）によりモデルパラメータが算出されたとする。

　そのような場合、１回目のステップＳ１１３の処理では、HOA方式のモデルパラメータに基づいてモデル化後の指向性データ（概形指向性データ）が算出される。また、２回目のステップＳ１１３の処理では、混合方式のモデルパラメータに基づいてモデル化後の中間差分情報が算出される。

　そこで、指向性データ算出部８２は、概形指向性データに中間差分情報を加算することで、すなわち各データポイントにおけるビンごとの指向性ゲインに、各データポイントにおけるビンごとの中間差分情報を加算することで、最終的な概形指向性データを求める。

　加算部８４は、このようにして指向性データ算出部８２で得られた最終的な概形指向性データに、差分情報復号部８３から供給された差分情報（指向性データ残差）を加算することで指向性データを算出し、周波数補間処理部８５に供給する。なお、差分情報がない場合には、最終的な概形指向性データがそのまま指向性データとされる。

　また、例えばサーバ１１側において、乗算ハイブリッド方式の方式（MH1）によりモデルパラメータが算出されたとする。

　そのような場合、１回目のステップＳ１１３の処理では、HOA方式のモデルパラメータに基づいてモデル化後の指向性データ（概形指向性データ）が算出される。また、２回目のステップＳ１１３の処理では、混合方式のモデルパラメータに基づいてモデル化後の振幅変調情報が算出される。

　そこで、指向性データ算出部８２は、概形指向性データに振幅変調情報を乗算することで、すなわち各データポイントにおけるビンごとの指向性ゲインに、各データポイントにおけるビンごとの振幅変調情報を乗算することで、最終的な指向性データを求める。この場合、ステップＳ１１５およびステップＳ１１６の処理は行われず、差分情報がないので、指向性データ算出部８２で得られた指向性データがそのまま加算部８４を介して周波数補間処理部８５に供給される。

　なお、例えばサーバ１１側において差分方式単独でモデルデータが生成されることもある。そのような場合、ステップＳ１１３の処理は行われず、ステップＳ１１５およびステップＳ１１６において差分情報復号部８３により符号化指向性データの復号が行われる。

　すなわち、差分情報復号部８３は、符号化モード情報に含まれているテーブルインデックス情報により特定される逆引テーブルを用いて、アンパッキング部８１から供給された符号化指向性データに対する復号を行い、差分指向性データを得る。

　そしてステップＳ１１７では、差分情報復号部８３は、差分指向性データを構成する各データポイントのビンごとの値（差分）に基づいて、指向性データを算出する。

　具体的には、例えばサーバ１１側において、空間隣接差分方式により差分指向性データが算出されている場合、差分情報復号部８３は、処理対象のデータポイントのビンごとの値（差分）に、そのデータポイントの近傍にある復元済みの他のデータポイントの同じビンの指向性ゲインを加算することで、処理対象のデータポイントのビンごとの指向性ゲインを求める。

　また、例えばサーバ１１側において、周波数間差分方式により差分指向性データが算出されている場合、差分情報復号部８３は、データポイントの処理対象のビンの値（差分）に、同じデータポイントにおける処理対象のビンの近傍にある復元済みの他のビンの指向性ゲインを加算することで、処理対象のビンの指向性ゲインを求める。

　このように、符号化指向性データがモデルデータに格納されるようにする場合であっても、指向性データの伝送量を低減させることができる。

　ステップＳ１１７の処理が行われ、指向性データが算出されると、その後、ステップＳ１１８の処理が行われて指向性データ生成処理は終了するが、ステップＳ１１８の処理は図１２のステップＳ５６の処理と同様であるので、その説明は省略する。

　以上のようにして情報処理装置５１は、モデルデータに基づいて指向性データを算出する。このようにすることで指向性データの伝送量を低減させることができる。これにより、伝送遅延の発生や伝送レートの増大を抑制することができる。

〈加算ハイブリッド方式の具体例〉
〈指向性データ符号化部の構成例〉
　ところで、サーバ１１において固定的に加算ハイブリッド方式でモデルデータが生成される場合、図１９に示したサーバ１１における指向性データ符号化部２０１の構成は、例えば図２１に示す構成とすることができる。なお、図２１において図１９における場合と対応する部分には同一の符号を付してあり、その説明は適宜省略する。

　図２１の例では、指向性データ符号化部２０１は、モデルパラメータ推定部２４１、演算部２４２、モデルパラメータ推定部２４３、演算部２４４、差分符号化部２４５、およびモデルデータ生成部２１５を有している。

　モデルパラメータ推定部２４１乃至演算部２４４は、図１９のモデルパラメータ推定部２１１に対応している。

　モデルパラメータ推定部２４１は、供給された処理対象の指向性データを混合方式によりモデル化し、その結果得られたモデルパラメータをモデルデータ生成部２１５に供給するとともに、混合方式によるモデル化後の指向性データを演算部２４２に供給する。

　演算部２４２は、供給された処理対象の指向性データから、モデルパラメータ推定部２４１から供給されたモデル化後の指向性データを減算する（差分を求める）ことで中間差分情報を算出し、モデルパラメータ推定部２４３および演算部２４４に供給する。

　モデルパラメータ推定部２４３は、演算部２４２から供給された中間差分情報をHOA方式によりモデル化し、その結果得られたモデルパラメータをモデルデータ生成部２１５に供給するとともに、HOA方式によるモデル化後の中間差分情報を演算部２４４に供給する。

　演算部２４４は、演算部２４２から供給された中間差分情報から、モデルパラメータ推定部２４３から供給されたモデル化後の中間差分情報を減算する（差分を求める）ことで差分情報を算出し、差分符号化部２４５に供給する。

　差分符号化部２４５は、演算部２４４から供給された差分情報と、適宜、供給される処理対象の指向性データ等とに基づいて、符号化モード情報および差分符号データを生成し、モデルデータ生成部２１５に供給する。

　なお、ここではモデルパラメータ推定部２４１において混合方式によるモデル化を行い、モデルパラメータ推定部２４３においてHOA方式によるモデル化を行う例について説明した。

　しかし、これに限らず、モデルパラメータ推定部２４１やモデルパラメータ推定部２４３においてどのような方式でモデル化が行われるようにしてもよい。例えば、モデルパラメータ推定部２４１においてHOA方式によるモデル化が行われ、モデルパラメータ推定部２４３において混合方式によるモデル化が行われてもよい。

〈差分符号化部の構成例〉
　また、差分符号化部２４５は、例えば図２２に示す構成とすることができる。なお、図２２において図１９における場合と対応する部分には同一の符号を付してあり、その説明は適宜省略する。

　図２２の例では、差分符号化部２４５は残差算出部２１２、符号化方式選択部２１３、多段差分処理部２７１、およびハフマン符号化部２１４を有している。

　残差算出部２１２は、供給された処理対象の指向性データと、モデルパラメータ推定部２４１およびモデルパラメータ推定部２４３から供給されたモデル化後の指向性データおよび中間差分情報とに基づいて差分情報を算出し、符号化方式選択部２１３および多段差分処理部２７１に供給する。

　多段差分処理部２７１は、残差算出部２１２からの差分情報、または演算部２４４からの差分情報のうちの何れかに基づいて、符号化方式選択部２１３から供給される符号化モード情報により示される差分符号化モードで多段差分情報を生成する。

　例えば差分符号化モードとして、空間隣接差分方式でハフマン符号化が行われる場合には空間差分情報が多段差分情報として得られ、差分符号化モードとして、周波数間差分方式でハフマン符号化が行われる場合には周波数間差分情報が多段差分情報として得られる。同様に、差分符号化モードとして、空間隣接差分方式と周波数間差分方式でハフマン符号化が行われる場合には、空間差分情報や周波数間差分情報を求めることで得られるハフマン符号化の対象となる情報が多段差分情報となる。

　多段差分処理部２７１は、得られた多段差分情報を符号化方式選択部２１３およびハフマン符号化部２１４に供給する。

　符号化方式選択部２１３は、供給された処理対象の指向性データと、残差算出部２１２または演算部２４４から供給された差分情報と、多段差分処理部２７１から供給された多段差分情報とに基づいて符号化モード情報を生成し、多段差分処理部２７１、ハフマン符号化部２１４、およびモデルデータ生成部２１５に供給する。

　ハフマン符号化部２１４は、符号化方式選択部２１３から供給された符号化モード情報に基づいて、多段差分処理部２７１から供給された多段差分情報をハフマン符号化し、その結果得られた差分符号データをモデルデータ生成部２１５に供給する。

〈モデルデータ生成処理の説明〉
　指向性データ符号化部２０１が図２１に示した構成とされる場合、指向性データ符号化部２０１では、図１０のステップＳ１１およびステップＳ１２に対応する処理として、図２３に示すモデルデータ生成処理が行われる。

　すなわち、ステップＳ１５１においてモデルパラメータ推定部２４１は、供給された処理対象の指向性データに対して混合方式によるモデル化を行う。

　モデルパラメータ推定部２４１は、モデル化により得られたモデルパラメータをモデルデータ生成部２１５に供給するとともに、混合方式によるモデル化後の指向性データを演算部２４２に供給する。

　ステップＳ１５２において演算部２４２は、供給された処理対象の指向性データと、モデルパラメータ推定部２４１から供給されたモデル化後の指向性データとに基づいて中間差分情報を算出し、モデルパラメータ推定部２４３および演算部２４４に供給する。

　ステップＳ１５３においてモデルパラメータ推定部２４３は、演算部２４２から供給された中間差分情報に対してHOA方式によるモデル化を行う。

　モデルパラメータ推定部２４３は、モデル化により得られたモデルパラメータをモデルデータ生成部２１５に供給するとともに、HOA方式によるモデル化後の中間差分情報を演算部２４４に供給する。

　ステップＳ１５４において演算部２４４は、演算部２４２から供給された中間差分情報と、モデルパラメータ推定部２４３から供給されたモデル化後の中間差分情報とに基づいて差分情報を算出し、差分符号化部２４５に供給する。

　ステップＳ１５５において差分符号化部２４５は、演算部２４４から供給された差分情報に基づいて差分符号化を行う。

　すなわち、例えば差分符号化部２４５の符号化方式選択部２１３は、供給された処理対象の指向性データと、演算部２４４から供給された差分情報と、前フレーム等の前回の処理で多段差分処理部２７１から供給された多段差分情報とに基づいて符号化モード情報を生成し、多段差分処理部２７１、ハフマン符号化部２１４、およびモデルデータ生成部２１５に供給する。なお、符号化方式選択部２１３が残差算出部２１２から供給された差分情報を用いて符号化モード情報を生成してもよい。

　また、多段差分処理部２７１は、例えば演算部２４４から供給された差分情報と、符号化方式選択部２１３から供給される符号化モード情報とに基づいて多段差分情報を生成し、符号化方式選択部２１３およびハフマン符号化部２１４に供給する。

　ステップＳ１５６においてモデルデータ生成部２１５は、パッキングを行うことでモデルデータを生成し、出力部２４に供給する。

　具体的には、モデルデータ生成部２１５は、モデルパラメータ推定部２４１からの混合方式のモデルパラメータ、モデルパラメータ推定部２４３からのHOA方式のモデルパラメータ、符号化方式選択部２１３からの符号化モード情報、およびハフマン符号化部２１４からの差分符号データを含むモデルデータを生成する。このようにしてモデルデータが生成されると、モデルデータ生成処理は終了する。

　以上のようにして指向性データ符号化部２０１は、加算ハイブリッド方式によりモデルデータを生成する。このようにすることで、指向性データの伝送量を低減させ、伝送遅延の発生や伝送レートの増大を抑制することができる。

〈分布モデル復号部の構成例〉
　また、指向性データ符号化部２０１が図２１に示した構成とされる場合、情報処理装置５１の分布モデル復号部６２は、例えば図２４に示す構成とされる。なお、図２４において図１１における場合と対応する部分には同一の符号を付してあり、その説明は適宜省略する。

　図２４に示す分布モデル復号部６２は、アンパッキング部８１、計算部３０１、計算部３０２、差分情報復号部８３、演算部３０３、演算部３０４、および周波数補間処理部８５を有している。この例では計算部３０１および計算部３０２が図１１に示した指向性データ算出部８２に対応する。

　計算部３０１は、アンパッキング部８１から供給される混合方式のモデルパラメータに基づいて、混合方式によるモデル化後の指向性データ（概形指向性データ）を算出し、演算部３０４に供給する。計算部３０２は、アンパッキング部８１から供給されるHOA方式のモデルパラメータに基づいて、HOA方式によるモデル化後の中間差分情報を算出し、演算部３０３に供給する。

　差分情報復号部８３は、アンパッキング部８１から供給される符号化モード情報および差分符号データに基づいて差分情報（指向性データ残差）を算出し、演算部３０３に供給する。演算部３０３は、差分情報復号部８３から供給された差分情報と、計算部３０２から供給された中間差分情報とを加算（合成）し、その加算結果（差分情報）を演算部３０４に供給する。

　演算部３０４は、計算部３０１から供給された指向性データ（概形指向性データ）と、演算部３０３から供給された加算結果（差分情報）とを加算し、その結果得られた指向性データを周波数補間処理部８５に供給する。

　分布モデル復号部６２が図２４に示す構成とされる場合、上述した図２０の指向性データ生成処理における１回目のステップＳ１１３では計算部３０１により指向性データ（概形指向性データ）が算出される。また、２回目のステップＳ１１３では計算部３０２により中間差分情報が算出される。

　そして、差分情報復号部８３によりステップＳ１１５およびステップＳ１１６の処理が行われて差分情報が生成され、ステップＳ１１７では演算部３０３および演算部３０４により加算処理が行われ、指向性データが生成される。

〈コンピュータの構成例〉
　ところで、上述した一連の処理は、ハードウェアにより実行することもできるし、ソフトウェアにより実行することもできる。一連の処理をソフトウェアにより実行する場合には、そのソフトウェアを構成するプログラムが、コンピュータにインストールされる。ここで、コンピュータには、専用のハードウェアに組み込まれているコンピュータや、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどが含まれる。

　図２５は、上述した一連の処理をプログラムにより実行するコンピュータのハードウェアの構成例を示すブロック図である。

　コンピュータにおいて、CPU（Central Processing Unit）５０１，ROM（Read Only Memory）５０２，RAM（Random Access Memory）５０３は、バス５０４により相互に接続されている。

　バス５０４には、さらに、入出力インターフェース５０５が接続されている。入出力インターフェース５０５には、入力部５０６、出力部５０７、記録部５０８、通信部５０９、及びドライブ５１０が接続されている。

　入力部５０６は、キーボード、マウス、マイクロホン、撮像素子などよりなる。出力部５０７は、ディスプレイ、スピーカなどよりなる。記録部５０８は、ハードディスクや不揮発性のメモリなどよりなる。通信部５０９は、ネットワークインターフェースなどよりなる。ドライブ５１０は、磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリなどのリムーバブル記録媒体５１１を駆動する。

　以上のように構成されるコンピュータでは、CPU５０１が、例えば、記録部５０８に記録されているプログラムを、入出力インターフェース５０５及びバス５０４を介して、RAM５０３にロードして実行することにより、上述した一連の処理が行われる。

　コンピュータ（CPU５０１）が実行するプログラムは、例えば、パッケージメディア等としてのリムーバブル記録媒体５１１に記録して提供することができる。また、プログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供することができる。

　コンピュータでは、プログラムは、リムーバブル記録媒体５１１をドライブ５１０に装着することにより、入出力インターフェース５０５を介して、記録部５０８にインストールすることができる。また、プログラムは、有線または無線の伝送媒体を介して、通信部５０９で受信し、記録部５０８にインストールすることができる。その他、プログラムは、ROM５０２や記録部５０８に、あらかじめインストールしておくことができる。

　なお、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。

　また、本技術の実施の形態は、上述した実施の形態に限定されるものではなく、本技術の要旨を逸脱しない範囲において種々の変更が可能である。

　例えば、本技術は、１つの機能をネットワークを介して複数の装置で分担、共同して処理するクラウドコンピューティングの構成をとることができる。

　また、上述のフローチャートで説明した各ステップは、１つの装置で実行する他、複数の装置で分担して実行することができる。

　さらに、１つのステップに複数の処理が含まれる場合には、その１つのステップに含まれる複数の処理は、１つの装置で実行する他、複数の装置で分担して実行することができる。

　さらに、本技術は、以下の構成とすることも可能である。

（１）
　音源の指向性を表す指向性データをモデル化することにより得られたモデルデータを取得する取得部と、
　前記モデルデータに基づいて、前記指向性データを算出する算出部と
　を備える情報処理装置。
（２）
　前記モデルデータには、前記指向性データを１または複数の分布からなる混合モデルによりモデル化することで得られた、前記混合モデルを構成するモデルパラメータが含まれている
　（１）に記載の情報処理装置。
（３）
　前記１または複数の分布は、vMF分布とKent分布の少なくとも何れかを含む
　（２）に記載の情報処理装置。
（４）
　前記指向性データは、複数の各周波数ビンの指向性ゲインを含み、
　前記モデルデータには、１または複数の前記周波数ビンを含む周波数帯域であるバンドごとに、前記指向性ゲインの分布を表す前記混合モデルを構成する前記モデルパラメータが含まれている
　（２）または（３）に記載の情報処理装置。
（５）
　前記モデルデータには、前記周波数ビンにおける前記指向性ゲインのダイナミックレンジを示すスケールファクタと、前記周波数ビンにおける前記指向性ゲインの最小値とが含まれている
　（４）に記載の情報処理装置。
（６）
　前記モデルデータには、モデル化前の前記指向性データと、モデル化後の前記指向性データとの差分を示す差分情報が含まれており、
　前記算出部により算出された前記指向性データに、前記差分情報を加算する加算部をさらに備える
　（１）乃至（５）の何れか一項に記載の情報処理装置。
（７）
　前記差分情報は、ハフマン符号化されている
　（６）に記載の情報処理装置。
（８）
　前記指向性データは、複数の各周波数ビンの指向性ゲインを含み、
　前記算出部により算出された前記指向性データに基づいて補間処理を行うことで、新たな前記周波数ビンの前記指向性ゲインを算出する補間処理部をさらに備える
　（１）乃至（７）の何れか一項に記載の情報処理装置。
（９）
　前記指向性データは、複数の各データポイントにおける指向性ゲインを含み、
　前記算出部により算出された前記指向性データに基づいて補間処理を行うことで、新たな前記データポイントにおける前記指向性ゲインを算出する補間処理部をさらに備える
　（１）乃至（８）の何れか一項に記載の情報処理装置。
（１０）
　前記指向性データとオーディオデータとを畳み込む指向性畳み込み部をさらに備える
　（１）乃至（９）の何れか一項に記載の情報処理装置。
（１１）
　前記指向性データが畳み込まれた前記オーディオデータと、HRTFとを畳み込むHRTF畳み込み部をさらに備える
　（１０）に記載の情報処理装置。
（１２）
　前記１または複数の分布は、複素Bingham分布または複素watson分布を含む
　（２）に記載の情報処理装置。
（１３）
　前記モデルデータには、前記指向性データを球面調和関数展開によりモデル化することで得られた球面調和係数がモデルパラメータとして含まれている
　（１）に記載の情報処理装置。
（１４）
　前記モデルデータには、互いに異なる１または複数の方式により前記指向性データをモデル化することで得られたモデルパラメータが含まれている
　（１）に記載の情報処理装置。
（１５）
　前記方式は、１または複数の分布からなる混合モデルによりモデル化する方式、および球面調和関数展開によりモデル化する方式のうちの少なくとも何れかを含む
　（１４）に記載の情報処理装置。
（１６）
　前記モデルデータには、前記１または複数の方式によるモデル化後の前記指向性データと、モデル化前の前記指向性データとの差分を示す差分情報がさらに含まれている
　（１４）または（１５）に記載の情報処理装置。
（１７）
　前記差分情報は、ハフマン符号化されている
　（１６）に記載の情報処理装置。
（１８）
　前記差分情報の実部と虚部のそれぞれが個別にハフマン符号化されている
　（１７）に記載の情報処理装置。
（１９）
　前記モデルデータには、前記１または複数の方式によるモデル化後の前記指向性データと、モデル化前の前記指向性データとの差分を示す差分情報の空間上の位置間および周波数間のうちの少なくとも何れかの差分をハフマン符号化することで得られた差分符号データが含まれている
　（１４）または（１５）に記載の情報処理装置。
（２０）
　前記モデルデータには、前記差分情報の差分の実部と虚部のそれぞれを個別にハフマン符号化することで得られた前記差分符号データが含まれている
　（１９）に記載の情報処理装置。
（２１）
　前記モデルデータには、前記指向性データを所定の方式によりモデル化することで得られた前記モデルパラメータ、および前記所定の方式によるモデル化後の前記指向性データとモデル化前の前記指向性データとの差分を、前記所定の方式とは異なる方式によりモデル化することで得られた他のモデルパラメータが含まれている
　（１４）または（１５）に記載の情報処理装置。
（２２）
　前記モデルデータには、前記指向性データを所定の方式によりモデル化することで得られた前記モデルパラメータ、および前記所定の方式によるモデル化後の前記指向性データとモデル化前の前記指向性データとの比を、前記所定の方式とは異なる方式によりモデル化することで得られた他のモデルパラメータが含まれている
　（１４）または（１５）に記載の情報処理装置。
（２３）
　前記モデルデータには、前記指向性データをモデル化することで得られた前記モデルパラメータをさらにモデル化することで得られたモデルパラメータが含まれている
　（１４）または（１５）に記載の情報処理装置。
（２４）
　前記モデルデータには、周波数帯域ごとに異なる方式で前記指向性データをモデル化することで得られた前記モデルパラメータが含まれている
　（１４）乃至（２３）の何れか一項に記載の情報処理装置。
（２５）
　情報処理装置が、
　音源の指向性を表す指向性データをモデル化することにより得られたモデルデータを取得し、
　前記モデルデータに基づいて、前記指向性データを算出する
　情報処理方法。
（２６）
　音源の指向性を表す指向性データをモデル化することにより得られたモデルデータを取得し、
　前記モデルデータに基づいて、前記指向性データを算出する
　処理をコンピュータに実行させるプログラム。
（２７）
　音源の指向性を表す指向性データを、１または複数の分布からなる混合モデルによりモデル化するモデル化部と、
　前記モデル化により得られた、前記混合モデルを構成するモデルパラメータを含むモデルデータを生成するモデルデータ生成部と
　を備える情報処理装置。
（２８）
　情報処理装置が、
　音源の指向性を表す指向性データを、１または複数の分布からなる混合モデルによりモデル化し、
　前記モデル化により得られた、前記混合モデルを構成するモデルパラメータを含むモデルデータを生成する
　情報処理方法。
（２９）
　音源の指向性を表す指向性データを、１または複数の分布からなる混合モデルによりモデル化し、
　前記モデル化により得られた、前記混合モデルを構成するモデルパラメータを含むモデルデータを生成する
　処理をコンピュータに実行させるプログラム。
（３０）
　音源の指向性を表す指向性データであって、複数の各データポイントにおける複数の各周波数ビンの指向性ゲインからなる指向性データに対して、前記指向性ゲインの前記データポイント間および前記周波数ビン間のうちの少なくとも何れかの差分を求めることにより得られた差分指向性データを取得する取得部と、
　前記差分指向性データに基づいて、前記指向性データを算出する算出部と
　を備える情報処理装置。
（３１）
　前記差分指向性データは、ハフマン符号化されており、
　前記算出部は、ハフマン符号化された前記差分指向性データの復号を行う
　（３０）に記載の情報処理装置。
（３２）
　前記差分指向性データの実部と虚部のそれぞれが個別にハフマン符号化されている
　（３１）に記載の情報処理装置。
（３３）
　情報処理装置が、
　音源の指向性を表す指向性データであって、複数の各データポイントにおける複数の各周波数ビンの指向性ゲインからなる指向性データに対して、前記指向性ゲインの前記データポイント間および前記周波数ビン間のうちの少なくとも何れかの差分を求めることにより得られた差分指向性データを取得し、
　前記差分指向性データに基づいて、前記指向性データを算出する
　情報処理方法。
（３４）
　音源の指向性を表す指向性データであって、複数の各データポイントにおける複数の各周波数ビンの指向性ゲインからなる指向性データに対して、前記指向性ゲインの前記データポイント間および前記周波数ビン間のうちの少なくとも何れかの差分を求めることにより得られた差分指向性データを取得し、
　前記差分指向性データに基づいて、前記指向性データを算出する
　処理をコンピュータに実行させるプログラム。

　１１　サーバ，　２１　モデル化部，　２２　モデルデータ生成部，　２３　オーディオデータ符号化部，　５１　情報処理装置，　６１　取得部，　６２　分布モデル復号部，　６３　オーディオデータ復号部，　６４　レンダリング処理部，　８２　指向性データ算出部，　８３　差分情報復号部，　８４　加算部，　８５　周波数補間処理部，　８８　時間補間処理部，　８９　指向性畳み込み部，　９０　HRTF畳み込み部

Claims

　音源の指向性を表す指向性データをモデル化することにより得られたモデルデータを取得する取得部と、
　前記モデルデータに基づいて、前記指向性データを算出する算出部と
　を備える情報処理装置。
　前記モデルデータには、前記指向性データを１または複数の分布からなる混合モデルによりモデル化することで得られた、前記混合モデルを構成するモデルパラメータが含まれている
　請求項１に記載の情報処理装置。
　前記１または複数の分布は、vMF分布とKent分布の少なくとも何れかを含む
　請求項２に記載の情報処理装置。
　前記指向性データは、複数の各周波数ビンの指向性ゲインを含み、
　前記モデルデータには、１または複数の前記周波数ビンを含む周波数帯域であるバンドごとに、前記指向性ゲインの分布を表す前記混合モデルを構成する前記モデルパラメータが含まれている
　請求項２に記載の情報処理装置。
　前記モデルデータには、前記周波数ビンにおける前記指向性ゲインのダイナミックレンジを示すスケールファクタと、前記周波数ビンにおける前記指向性ゲインの最小値とが含まれている
　請求項４に記載の情報処理装置。
　前記モデルデータには、モデル化前の前記指向性データと、モデル化後の前記指向性データとの差分を示す差分情報が含まれており、
　前記算出部により算出された前記指向性データに、前記差分情報を加算する加算部をさらに備える
　請求項１に記載の情報処理装置。
　前記差分情報は、ハフマン符号化されている
　請求項６に記載の情報処理装置。
　前記指向性データは、複数の各周波数ビンの指向性ゲインを含み、
　前記算出部により算出された前記指向性データに基づいて補間処理を行うことで、新たな前記周波数ビンの前記指向性ゲインを算出する補間処理部をさらに備える
　請求項１に記載の情報処理装置。
　前記指向性データは、複数の各データポイントにおける指向性ゲインを含み、
　前記算出部により算出された前記指向性データに基づいて補間処理を行うことで、新たな前記データポイントにおける前記指向性ゲインを算出する補間処理部をさらに備える
　請求項１に記載の情報処理装置。
　前記指向性データとオーディオデータとを畳み込む指向性畳み込み部をさらに備える
　請求項１に記載の情報処理装置。
　前記指向性データが畳み込まれた前記オーディオデータと、HRTFとを畳み込むHRTF畳み込み部をさらに備える
　請求項１０に記載の情報処理装置。
　前記１または複数の分布は、複素Bingham分布または複素watson分布を含む
　請求項２に記載の情報処理装置。
　前記モデルデータには、前記指向性データを球面調和関数展開によりモデル化することで得られた球面調和係数がモデルパラメータとして含まれている
　請求項１に記載の情報処理装置。
　前記モデルデータには、互いに異なる１または複数の方式により前記指向性データをモデル化することで得られたモデルパラメータが含まれている
　請求項１に記載の情報処理装置。
　前記方式は、１または複数の分布からなる混合モデルによりモデル化する方式、および球面調和関数展開によりモデル化する方式のうちの少なくとも何れかを含む
　請求項１４に記載の情報処理装置。
　前記モデルデータには、前記１または複数の方式によるモデル化後の前記指向性データと、モデル化前の前記指向性データとの差分を示す差分情報がさらに含まれている
　請求項１４に記載の情報処理装置。
　前記差分情報は、ハフマン符号化されている
　請求項１６に記載の情報処理装置。
　前記差分情報の実部と虚部のそれぞれが個別にハフマン符号化されている
　請求項１７に記載の情報処理装置。
　前記モデルデータには、前記１または複数の方式によるモデル化後の前記指向性データと、モデル化前の前記指向性データとの差分を示す差分情報の空間上の位置間および周波数間のうちの少なくとも何れかの差分をハフマン符号化することで得られた差分符号データが含まれている
　請求項１４に記載の情報処理装置。
　前記モデルデータには、前記差分情報の差分の実部と虚部のそれぞれを個別にハフマン符号化することで得られた前記差分符号データが含まれている
　請求項１９に記載の情報処理装置。
　前記モデルデータには、前記指向性データを所定の方式によりモデル化することで得られた前記モデルパラメータ、および前記所定の方式によるモデル化後の前記指向性データとモデル化前の前記指向性データとの差分を、前記所定の方式とは異なる方式によりモデル化することで得られた他のモデルパラメータが含まれている
　請求項１４に記載の情報処理装置。
　前記モデルデータには、前記指向性データを所定の方式によりモデル化することで得られた前記モデルパラメータ、および前記所定の方式によるモデル化後の前記指向性データとモデル化前の前記指向性データとの比を、前記所定の方式とは異なる方式によりモデル化することで得られた他のモデルパラメータが含まれている
　請求項１４に記載の情報処理装置。
　前記モデルデータには、前記指向性データをモデル化することで得られた前記モデルパラメータをさらにモデル化することで得られたモデルパラメータが含まれている
　請求項１４に記載の情報処理装置。
　前記モデルデータには、周波数帯域ごとに異なる方式で前記指向性データをモデル化することで得られた前記モデルパラメータが含まれている
　請求項１４に記載の情報処理装置。
　情報処理装置が、
　音源の指向性を表す指向性データをモデル化することにより得られたモデルデータを取得し、
　前記モデルデータに基づいて、前記指向性データを算出する
　情報処理方法。
　音源の指向性を表す指向性データをモデル化することにより得られたモデルデータを取得し、
　前記モデルデータに基づいて、前記指向性データを算出する
　処理をコンピュータに実行させるプログラム。
　音源の指向性を表す指向性データを、１または複数の分布からなる混合モデルによりモデル化するモデル化部と、
　前記モデル化により得られた、前記混合モデルを構成するモデルパラメータを含むモデルデータを生成するモデルデータ生成部と
　を備える情報処理装置。
　情報処理装置が、
　音源の指向性を表す指向性データを、１または複数の分布からなる混合モデルによりモデル化し、
　前記モデル化により得られた、前記混合モデルを構成するモデルパラメータを含むモデルデータを生成する
　情報処理方法。
　音源の指向性を表す指向性データを、１または複数の分布からなる混合モデルによりモデル化し、
　前記モデル化により得られた、前記混合モデルを構成するモデルパラメータを含むモデルデータを生成する
　処理をコンピュータに実行させるプログラム。
　音源の指向性を表す指向性データであって、複数の各データポイントにおける複数の各周波数ビンの指向性ゲインからなる指向性データに対して、前記指向性ゲインの前記データポイント間および前記周波数ビン間のうちの少なくとも何れかの差分を求めることにより得られた差分指向性データを取得する取得部と、
　前記差分指向性データに基づいて、前記指向性データを算出する算出部と
　を備える情報処理装置。
　前記差分指向性データは、ハフマン符号化されており、
　前記算出部は、ハフマン符号化された前記差分指向性データの復号を行う
　請求項３０に記載の情報処理装置。
　前記差分指向性データの実部と虚部のそれぞれが個別にハフマン符号化されている
　請求項３１に記載の情報処理装置。
　情報処理装置が、
　音源の指向性を表す指向性データであって、複数の各データポイントにおける複数の各周波数ビンの指向性ゲインからなる指向性データに対して、前記指向性ゲインの前記データポイント間および前記周波数ビン間のうちの少なくとも何れかの差分を求めることにより得られた差分指向性データを取得し、
　前記差分指向性データに基づいて、前記指向性データを算出する
　情報処理方法。
　音源の指向性を表す指向性データであって、複数の各データポイントにおける複数の各周波数ビンの指向性ゲインからなる指向性データに対して、前記指向性ゲインの前記データポイント間および前記周波数ビン間のうちの少なくとも何れかの差分を求めることにより得られた差分指向性データを取得し、
　前記差分指向性データに基づいて、前記指向性データを算出する
　処理をコンピュータに実行させるプログラム。