WO2023074800A1

WO2023074800A1 - 情報処理装置および方法、並びにプログラム

Info

Publication number: WO2023074800A1
Application number: PCT/JP2022/040170
Authority: WO
Inventors: 隆一難波; 徹知念; 実辻; 光行畠中; 弘幸本間; 康裕戸栗
Original assignee: ソニーグループ株式会社
Priority date: 2021-10-29
Filing date: 2022-10-27
Publication date: 2023-05-04
Also published as: WO2023074039A1; AU2022375400A1; TW202325040A

Abstract

本技術は、指向性データの伝送量を低減させることができるようにする情報処理装置および方法、並びにプログラムに関する。情報処理装置は、音源の指向性を表す指向性データをモデル化することにより得られたモデルデータを取得する取得部と、モデルデータに基づいて、指向性データを算出する算出部とを備える。本技術は情報処理装置に適用することができる。

Description

情報処理装置および方法、並びにプログラム

　本技術は、情報処理装置および方法、並びにプログラムに関し、特に、指向性データの伝送量を低減させることができるようにした情報処理装置および方法、並びにプログラムに関する。

　従来、音源の指向性を考慮することで、より臨場感の高いオーディオ再生を実現できることが知られている。

　例えば、オブジェクトのオーディオデータとともに、オブジェクトからの音の指向性を表す指向性データを用意すれば、オーディオデータと指向性データとを用いて、オブジェクトの指向特性に基づくオーディオ再生を行うことが可能である。

　また、指向性に関する技術として、例えば録音時においてユーザが指向性方向を任意に選択して録音でき、かつ再生時においてユーザが録音時の指向性方向とは別に所望の指向性の方向を選択して再生する技術が提案されている（例えば、特許文献１参照）。

特開２０２１－１００２０９号公報

　ところで、音源ごとに指向特性（指向性）は異なるため、コンテンツとして、オブジェクトのオーディオデータと、そのオブジェクトの指向性データとを提供する場合、音源の種別、すなわちオブジェクトの種別ごとに指向性データを用意する必要がある。また、より多くの方向および周波数について指向性に関する情報をもたせようとすると、指向性データのデータ量が多くなってしまう。

　そうすると、コンテンツの配信先に対する指向性データの伝送量が多くなってしまい、伝送遅延が発生したり、伝送レートが増大したりするおそれがある。

　本技術は、このような状況に鑑みてなされたものであり、指向性データの伝送量を低減させることができるようにするものである。

　本技術の第１の側面の情報処理装置は、音源の指向性を表す指向性データをモデル化することにより得られたモデルデータを取得する取得部と、前記モデルデータに基づいて、前記指向性データを算出する算出部とを備える。

　本技術の第１の側面の情報処理方法またはプログラムは、音源の指向性を表す指向性データをモデル化することにより得られたモデルデータを取得し、前記モデルデータに基づいて、前記指向性データを算出するステップを含む。

　本技術の第１の側面においては、音源の指向性を表す指向性データをモデル化することにより得られたモデルデータが取得され、前記モデルデータに基づいて、前記指向性データが算出される。

　本技術の第２の側面の情報処理装置は、音源の指向性を表す指向性データを、複数の分布からなる混合モデルによりモデル化するモデル化部と、前記モデル化により得られた、前記混合モデルを構成するモデルパラメータを含むモデルデータを生成するモデルデータ生成部とを備える。

　本技術の第２の側面の情報処理方法またはプログラムは、音源の指向性を表す指向性データを、複数の分布からなる混合モデルによりモデル化し、前記モデル化により得られた、前記混合モデルを構成するモデルパラメータを含むモデルデータを生成するステップを含む。

　本技術の第２の側面においては、音源の指向性を表す指向性データが、複数の分布からなる混合モデルによりモデル化され、前記モデル化により得られた、前記混合モデルを構成するモデルパラメータを含むモデルデータが生成される。

混合ガウス分布について説明する図である。 vMF分布とKent分布について説明する図である。指向性の例を示す図である。データポイントについて説明する図である。モデルデータの例を示す図である。バンドとビンの関係について説明する図である。指向性データのデータ量の低減例を示す図である。指向性データの残差について説明する図である。サーバの構成例を示す図である。符号化処理を説明するフローチャートである。情報処理装置の構成例を示す図である。指向性データ生成処理を説明するフローチャートである。出力オーディオデータ生成処理を説明するフローチャートである。差分情報の出現確率について説明する図である。モデルデータの例を示す図である。モデルデータの例を示す図である。ハフマン符号化テーブルの伝送について説明する図である。ハフマン符号化テーブルの例を示す図である。サーバの構成例を示す図である。指向性データ生成処理を説明するフローチャートである。指向性データ符号化部の構成例を示す図である。差分符号化部の構成例を示す図である。モデルデータ生成処理を説明するフローチャートである。分布モデル復号部の構成例を示す図である。モデルデータの例を示す図である。データポイントの配置例を示す図である。データポイントの記述例を示す図である。各ビンのスケールファクタの例を示す図である。各ビンの最小値の例を示す図である。モデルデータの例を示す図である。 SymmetricDir()のSyntax例を示す図である。回転操作について説明する図である。対称操作について説明する図である。 NonSymmetricDir()のSyntax例を示す図である。モデルデータの例を示す図である。各ビンの混合モデルの出力値の算出に用いる重みの例を示す図である。モデルデータの例を示す図である。 NonSymmetricDir()のSyntax例を示す図である。 LeftRightLineSymmetricDir()のSyntax例を示す図である。重みに応じた分布について説明する図である。コンピュータの構成例を示す図である。

　以下、図面を参照して、本技術を適用した実施の形態について説明する。

〈第１の実施の形態〉
〈本技術について〉
　本技術は、指向性データをモデル化することで、指向性データの伝送量を低減させることができるようにするものである。

　本技術では、例えばコンテンツとして、３D音源のオーディオデータと指向性データが提供される。

　具体的には、例えば３D音源として１または複数のオーディオオブジェクト（以下、単にオブジェクトと称する）の音が収音（収録）されて、各オブジェクトのオーディオデータが生成される。また、オブジェクトの種別、すなわち音源種別ごとに、オブジェクト（音源）の指向特性、すなわち指向性を表す指向性データが用意される。

　さらに、各オブジェクトのオーディオデータと、音源種別ごとの指向性データとがコンテンツのデータとして提供される。すなわち、オブジェクトのオーディオデータとあわせて指向性データが再生側の装置へと伝送される。そして、再生側では、コンテンツを構成するオーディオデータと指向性データとに基づいて、指向性データを考慮したオーディオ再生が行われる。

　指向性データは、例えばオブジェクトの音を複数のマイクロホンで収録することで得ることができる。なお、指向性データの収録は、オブジェクトのオーディオデータの収録と同時に行われてもよいし、オブジェクトのオーディオデータの収録とは異なるタイミングで行われてもよい。

　指向性データは、例えば音声や楽器、スピーカなどの音源種別ごとに用意される。また、指向性データは、例えば音源から見た各方向にある位置について、DCとなる周波数からナイキスト周波数までの全周波数帯域における対象周波数ごとに、音源からの音の振幅と位相の情報をもつデータである。

　例えば音源から見た方向は、音源位置から見た水平方向の角度、すなわち方位角と、音源位置から見た垂直方向の角度、すなわち仰角とにより表される。このとき、例えば方位角の範囲は０度乃至３６０度の範囲とされ、仰角の範囲は－９０度乃至＋９０度の範囲とされる。

　本技術では、このような指向性データを離散化および圧縮するにあたり、直接、データが圧縮されるのではなく、モデル化によるパラメトリック圧縮が行われる。

　なお、本技術では、モデル化の対象とされる指向性データは、収録等により得られた指向性データを適宜、離散化および正規化することにより得られたものとされる。

　以下では、モデル化の対象とされる指向性データは、複数の各データポイントにおける、音源の複数の離散的な各周波数の指向特性を示すゲイン（以下、指向性ゲインと称する）からなるものとして説明を行う。

　例えばデータポイントとなる位置は、音源位置を原点とする極座標系の座標（極座標）、すなわち音源位置から見た水平方向の位置を示す方位角と、音源位置から見た垂直方向の位置を示す仰角によって表すことができる。なお、データポイントの位置を表すのに音源位置からの距離（半径）が用いられるようにしてもよい。また、指向性ゲインは、データポイントにおける音源からの音の振幅（音圧）を正規化することにより得ることができる。

（音源の指向性データの記録方式について）
　音源種別ごとの指向性データの記録方式について説明する。

　本技術では、指向性データのモデル化には、平面上で定義される多変量／単変量のガウス分布に相当する、球面上のvMF(von Mises Fisher)分布、Kent分布、またはvMF分布とKent分布の少なくとも何れかからなる混合モデルが用いられる。

　なお、vMF分布やKent分布、混合モデルについては、例えば「John T. Kent (1982). The Fisher-Bingham Distribution on the Sphere」などに詳細に記載されている。

　まず、一般的な混合ガウス分布について説明する。

　例えば図１の矢印Q11に示す部分には、２次元のガウス分布が示されている。この例では、直線上に２つのガウス分布が存在している。すなわち、曲線L11は１つのガウス分布を示しており、曲線L12は他の１つのガウス分布を示している。

　また、曲線L13は、曲線L11に示すガウス分布と、曲線L12に示すガウス分布とを混合することにより得られる混合ガウス分布を示している。

　一方、図１における矢印Q12に示す部分には、平面上における３つの分布が示されている。このような平面上の複数の分布を混合することもできる。

　通常、混合ガウス分布は、平面上における確率密度分布（pdf(Probability Density Function)）を表現するのに利用される。所望のpdfを少ないモデルパラメータ、かつなるべく少ない混合数で表現することで情報量の削減が可能となる。

　本技術では、球表面上で定義されるガウス分布に相当するvMF分布やKent分布の混合モデルが用いられて、球表面上の指向性データ、すなわち指向性ゲインの形状（分布）がモデル化される。

　混合モデルは、１または複数のvMF分布により構成されてもよいし、１または複数のKent分布により構成されてもよいし、１以上のvMF分布と１以上のKent分布により構成されてもよい。つまり、混合モデルは、vMF分布とKent分布の少なくとも何れかを含む１または複数の分布により構成される。

　球表面の位置を示す位置ベクトル、すなわち直交座標系（デカルト座標系）の座標をｘとすると、位置ベクトルｘに対応するKent分布の値f(x)、すなわち位置ベクトルｘにより示される位置におけるKent分布の値f(x)は、次式（１）により表すことができる。

　なお、式（１）において、κはパラメータ集中度を示しており、βは楕円率を示している。また、γ_１はmean direction分布の中心を規定するベクトルを示しており、γ_２はmajor軸ベクトルを示しており、γ_３はminor軸ベクトルを示している。

　さらに、c(κ,β)は次式（２）に示す正規化定数である。なお、式（２）においてΓはガンマ関数を示しており、Ｉは第一種変形ベッセル関数を示している。

　また、位置ベクトルｘにより示される位置におけるvMF分布の値も式（１）と同様の式により表すことができる。そのような場合、式（１）における楕円率βの値は０とされる。

　図２にvMF分布とKent分布の例を示す。

　図２では、矢印Q21に示す部分にはvMF分布の例が示されている。特に、ベクトルV11は、式（１）に示したベクトルγ_１を表している。

　vMF分布は、楕円率β、major軸ベクトルγ_２、およびminor軸ベクトルγ_３をパラメータとしてもたず、球表面上において、ベクトルV11（ベクトルγ_１）により示される位置を中心として等方的に広がっていく円形状の分布となっている。すなわち、vMF分布（vMF分布モデル）を用いれば、円形状の分布を再現することができる。

　これに対して、矢印Q22に示す部分にはKent分布の例が示されている。特に、ベクトルV21乃至ベクトルV23は、式（１）に示したベクトルγ_１、major軸ベクトルγ_２、およびminor軸ベクトルγ_３を表している。

　Kent分布は、球表面上において、ベクトルV21（ベクトルγ_１）により示される位置を中心とし、球表面上のmajor軸ベクトルγ_２およびminor軸ベクトルγ_３を長軸および短軸とする楕円形状の分布となっている。すなわち、Kent分布（Kent分布モデル）を用いれば、楕円率β、major軸ベクトルγ_２、およびminor軸ベクトルγ_３により定まる楕円形状の分布を再現することができる。

　Kent分布は、楕円率βなどのパラメータにより楕円の形状を変化させることができるので自由度は高いが、パラメータ数はvMF分布よりも多くなってしまう。

　本技術では、vMF分布やKent分布を混合して得られる混合モデルが用いられて指向性データが表される（モデル化される）。

　例えば、式（１）における場合と同様の位置ベクトルｘにより示される位置における、Ｎ個のKent分布f(x;θ_i)を用いた混合モデルの出力値F(x;Θ)は、次式（３）により表すことができる。すなわち、混合モデルF(x;Θ)は、Ｎ個のKent分布f(x;θ_i)の重みづけ加算により表記することができる。

　なお、式（３）においてKent分布f(x;θ_i)は、上述の式（１）に示したものと同様であり、混合するＮ個のKent分布のうちのｉ番目のKent分布を示している。

　また、θ_iはKent分布f(x;θ_i)を構成するパラメータ、より詳細にはパラメータの集合であり、パラメータθ_iは、式（１）におけるパラメータ集中度κ、楕円率β、ベクトルγ_１、major軸ベクトルγ_２、およびminor軸ベクトルγ_３からなる。混合モデルF(x;Θ)のパラメータΘは、Ｎ個のKent分布f(x;θ_i)のパラメータθ_iの集合を表している。

　さらに式（３）において、φ_iはＮ個のKent分布を混合するときのｉ番目のKent分布f(x;θ_i)の重み（重み係数）を表しており、次式（４）に示すように、Ｎ個のKent分布f(x;θ_i)の重みφ_iの総和は１とされる。

　本技術で用いられる指向性データは、オブジェクトの周囲に配置された複数のマイクロホンからなるマイクアレイで収録（収音）を行うことにより得ることができる。

　一例として、トランペットの演奏音を収録すると、図３に示す指向性が観測される。特に、図中、左側には水平面、すなわち仰角が０度となる面における各周波数の指向性が示されており、図中、右側には正中面における各周波数の指向性が示されている。

　この例では、水平面および正中面の両方において、周波数（ピッチ）によって指向性の概形が変化し、低域側の周波数では指向性は小さいが、周波数が高くなるにつれて指向性が大きく（鋭く）なっていくことが分かる。例えば水平面では、8000Hzにおいて方向によっては最大で25dB程度の音圧差が生じている。

　ところで、モデル化対象となる指向性データでは、例えば図４に示すように音源位置を中心とする球表面上に複数のデータポイントが設けられる。図４の例では、１つの点が１つのデータポイントを表しており、球表面全体に多数のデータポイントが存在することが分かる。

　ここで、例えば方位角方向に２度の間隔（２度刻み）で、かつ仰角方向にも２度の間隔でデータポイントを設けるとすると、球表面全体には16022個のデータポイントが設けられることになる。また、そのような場合に、各データポイントについて19Hz乃至20kHzを対象とした512個のビン（周波数ビン）における指向性ゲイン（音圧）を伝送しようとすると、１音源の指向性データは約31MBとなる。

　このように、音源種別ごとの指向性データはデータサイズが大きいため、伝送量が多くなってしまう。

　また、音声にも母音と子音などがあり、楽器も演奏方法によって指向性が異なるなど、音源種別の多様性が非常に大きいため、音源種別ごとに指向性データを用意しようとすると、多数の指向性データが必要となる。

　これらのことから、指向性データの伝送量が多くなってしまうが、指向性データの伝送量の増加は伝送遅延の発生や伝送レートの増大の要因となる。そのため、場合によっては音源種別や周波数、オブジェクトと受聴者の向きなどに応じた指向性の再現ができなくなってしまうことがある。

　そこで、本技術では、上述のように混合モデルを用いて指向性データをモデル化することで、指向性データの伝送量を低減できるようにした。

〈モデルデータの例〉
　ここで、指向性データをモデル化することで得られるモデルデータの具体的な例について説明する。

　本技術では、指向性データの伝送時に、vMF分布やKent分布からなる混合モデルに基づく指向性データのモデル化が行われ、その結果得られた、混合モデルを構成するモデルパラメータ等を含むモデルデータが生成される。そして、そのモデルデータがコンテンツの再生側の装置へと伝送される。これにより、データサイズの大きいもとの指向性データの伝送が不要となる。換言すれば、指向性データの伝送時のデータ量（伝送量）を低減させることができる。

　ここで、num_sound_types_idで指定される１つの音源種別のモデルデータの例を図５に示す。この例では１つの音源種別のモデルデータがdirectivityConfigとして記述されている。

　モデルデータには、データポイント数「num_point_indices」により示される数だけ、モデル化前のもとの指向性データにおけるデータポイントの位置を示す方位角「azimuth_table[i]」、仰角「elevation_table[i]」、および半径「distance[i]」が含まれている。

　データポイントの位置は、音源位置から見たデータポイントの水平方向の角度である方位角「azimuth_table[i]」、音源位置から見たデータポイントの垂直方向の角度である仰角「elevation_table[i]」、および音源位置からデータポイントまでの距離である半径「distance[i]」からなる、音源位置を原点とする極座標系の座標により表される。

　また、モデルデータには、周波数ポイント数「bin_count」と周波数「freq[i_bin]」が含まれている。モデル化前のもとの指向性データでは、対象となる周波数帯域全体が周波数ポイント数「bin_count」により示される数の周波数帯域（周波数）である周波数ビン、すなわちビン（bin）に分割され、それらのビンのうちのｉ番目のビンの中心周波数（Hz）が周波数「freq[i_bin]」とされる。

　したがって、モデル化前のもとの指向性データには、複数の各データポイントにおける１または複数の各ビン（周波数ビン）の指向性ゲインが含まれている。

　さらにモデルデータには、Kent分布やvMF分布に関するパラメータとして、モデル化するバンド数「band_count」、各バンドでの混合数「mix_count[i_band]」、各バンドに含まれるモデル化前のもとの指向性データのビン情報「bin_range_per_band[i_band]」が含まれている。

　例えばモデル化では、対象となる周波数帯域全体がバンド数「band_count」により示される数の周波数帯域であるバンド（band）に分割され、それらのバンドごとに指向性ゲインの分布が混合モデルにより表される。換言すれば、各バンドにおける指向性ゲインの分布を表す混合モデルを構成するモデルパラメータが推定される。なお、各バンド（band）により示される周波数帯域には、必ず１または複数のビンにより示される周波数、つまりビンの中心周波数「freq[i_bin]」が含まれている（属している）。

　混合数「mix_count[i_band]」は、ｉ番目のバンドの指向性ゲインの分布を表す混合モデルを構成する分布の数、すなわちKent分布やvMF分布の数を示しており、この混合数は式（３）におけるＮに対応する。

　指向性データのビン情報「bin_range_per_band[i_band]」は、ｉ番目のバンドに含まれている、モデル化前のもとの指向性データについてのビン（bin）を示す情報である。例えばビン情報は、ｉ番目のバンドに属す最も大きい周波数のビンを示すインデックス情報などとされる。ビン情報「bin_range_per_band[i_band]」を参照すれば、モデル化前のもとの指向性データについてのビン（周波数ビン）が、モデル化後のどのバンドに含まれているかを特定することができる。

　また、モデルデータには、Kent分布やvMF分布に関するパラメータとして、各バンドについて、混合モデルを構成する分布（Kent分布またはvMF分布）ごとに、上述した重みφ_i、パラメータ集中度κ、およびベクトルγ_１が含まれている。

　この例では、「weight[i_band][i_mix]」および「kappa[i_band][i_mix]」が「i_band」により示されるｉ番目のバンドについての「i_mix」により示される分布の重みφ_iおよびパラメータ集中度κを示している。

　また、「gamma1[i_band][i_mix][x]」および「gamma1[i_band][ i_mix][y]」は、ｉ番目のバンド「i_band」についての「i_mix」により示される分布のベクトルγ_１を構成するX成分（X座標）およびY成分（Y座標）を示している。

　モデルデータには、混合モデルを構成するｉ番目のバンド「i_band」についての「i_mix」により示される分布がKent分布とvMF分布の何れの分布であるかを示す選択フラグ「dist_flag」が含まれている。

　選択フラグ「dist_flag」の値「１」は分布がKent分布であることを示しており、選択フラグ「dist_flag」の値「０」は分布がvMF分布であることを示している。

　選択フラグ「dist_flag」の値が「１」である場合、モデルデータには上述した楕円率β、major軸ベクトルγ_２、およびminor軸ベクトルγ_３が含まれている。

　「beta[i_band][i_mix]」は「i_band」により示されるｉ番目のバンドについての「i_mix」により示される分布（Kent分布）の楕円率βを示している。また、「gamma2[i_band][i_mix][x]」および「gamma2[i_band][i_mix][y]」は、ｉ番目のバンド「i_band」についての「i_mix」により示される分布（Kent分布）のmajor軸ベクトルγ_２を構成するX成分（X座標）およびY成分（Y座標）を示している。

　同様に、「gamma3[i_band][i_mix][x]」および「gamma3[i_band][i_mix][y]」は、ｉ番目のバンド「i_band」についての「i_mix」により示される分布（Kent分布）のminor軸ベクトルγ_３を構成するX成分（X座標）およびY成分（Y座標）を示している。

　モデルデータには、各ビンにおける指向性データ、より詳細には指向性ゲインのダイナミックレンジを示すスケールファクタ「scale_factor[i_bin]」と、各ビンにおける指向性データ（指向性ゲイン）のオフセット値、すなわち最小値「offset[i_bin]」も含まれている。

　以下では、モデルデータに含まれている楕円率β、パラメータ集中度κ、重みφ_i、ベクトルγ_１、major軸ベクトルγ_２、minor軸ベクトルγ_３、スケールファクタ、および最小値（オフセット値）からなるパラメータ集合をモデルパラメータとも称することとする。

　モデルデータには、データポイントにおける、モデル化前のもとの指向性データの値（指向性ゲイン）と、モデル化により得られた混合モデルにより示される指向性データの値（指向性ゲイン）との差分を示す差分情報「diff_data[i_point]」も含まれている。換言すれば、差分情報は、データポイントにおける、モデル化前の指向性データと、モデル化後の指向性データとの差分を示す情報である。

　なお、差分情報が格納されるか否かを選択できるようにしてもよい。また、モデルデータに格納される「diff_data[i_point]」は、ハフマン符号化された差分情報であってもよい。

　再生側（復号側）の装置では、例えば図５に示した構成（フォーマット）のモデルデータに基づいて、各データポイントにおける混合モデルの出力値F(x;Θ)、すなわち指向性ゲインが算出される。

　モデル化前のもとの指向性データの各ビンは、指向性データの形状の類似性を考慮して決定されるモデル化時のバンド数「band_count」により記述される数のバンド（band）のうちの何れかのバンドに属す。

　また、各ビンとバンドの対応関係は、ビン情報「bin_range_per_band[i_band]」により記述され、そのビン情報として、バンドに属す最も大きい周波数のビンを示すインデックス情報である最大インデックスが書き込まれている。

　この場合、例えば図６に示すように各バンドに属すビンの数はバンドごとに異なっていてもよい。

　この例では、最も周波数が低い最初のバンド０（band0）には２つのビン０（bin0）とビン１が属しており、次のバンド１には１つのビン２が属しており、さらにその次のバンド２には２つのビン３とビン４が属している。

　したがって、バンド０のビン情報「bin_range_per_band[i_band]」の値は、ビン１を示す値「１」、すなわち「bin_range_per_band[0]＝1」とされる。同様に、バンド１のビン情報の値は「２」、すなわち「bin_range_per_band[1]＝2」とされ、バンド２のビン情報の値は「４」、すなわち「bin_range_per_band[2]＝4」とされる。

　モデルデータにはモデルパラメータが含まれているため、そのモデルパラメータから各バンドについての混合モデルF’(x;Θ)を得ることができる。ここで、混合モデルF’(x;Θ)は、式（３）に示したビンごとの混合モデルF(x;Θ)に対応する。

　モデル化前の指向性データは、各データポイントのビンごとに指向性ゲインの値を有している。そのため、モデルパラメータから得られるバンドごとの混合モデルF’(x;Θ)、より詳細には混合モデルの出力値F’(x;Θ)を、もとのビンごとの混合モデルF(x;Θ)に変換する必要がある。

　そこで、再生側（復号側）の装置では、バンドごとの混合モデルF’(x;Θ)と、ビンごとのスケールファクタ「scale_factor[i_bin]」と、ビンごとの最小値「offset[i_bin]」とに基づいて、データポイントにおけるビンごとの混合モデルの出力値F(x;Θ)が算出される。

　すなわち、F(x;Θ)＝F’(x;Θ)×scale_factor[i_bin]＋offset[i_bin]が計算される。この計算では、バンドごとの混合モデルの出力値F’(x;Θ)が各ビンのダイナミックレンジに合わせて補正される。

　さらに、差分圧縮を併用している場合、すなわちモデルデータにデータポイントごとの差分情報「diff_data[i_point]」が含まれている場合には、計算により得られた出力値F(x;Θ)に差分情報が加算され、最終的な出力値F(x;Θ)とされる。

　以上の計算により、モデルデータから、モデル化前のもとの指向性データが復元されたことになる。なお、再生側では、各データポイントとなる位置や各ビンの周波数は、モデルデータに格納されている方位角「azimuth_table[i]」、仰角「elevation_table[i]」、半径「distance[i]」、および周波数「freq[i_bin]」から特定することが可能である。

　実際に、モデルデータが図５に示した構成となるように指向性データをモデル化したときのモデルデータのデータ量を図７に示す。

　この例では、モデル化前のもとの指向性データにおけるデータポイント数は2522個であり、ビン数は２９個となっている。また、モデル化時には、バンド数「band_count」が「３」とされ、vMF分布（楕円率β、major軸ベクトルγ_２、minor軸ベクトルγ_３なし）からなる混合モデルでのモデル化が行われている。

　図７のモデル化では、モデル化前はデータ量が306KBであったもとの指向性データが、データ量が0.85KBのモデルパラメータに変換されており、データ量が約1/360に圧縮されていることが分かる。

　また、図５の例では、必要に応じてモデルデータに差分情報が含まれており、適宜、差分情報が用いられて指向性データの復元が行われる。

　すなわち、例えば聴覚心理の観点で差分が知覚できる場合には、本技術のモデル化と合わせて差分符号化が併用され、知覚不可能な程度まで指向性データが復元される。

　例えば図８の矢印Q41に示す指向性データが対象とされてモデル化が行われたとする。なお、図８において各球表面における色の濃淡は指向性ゲインの大きさを示している。

　この例では、矢印Q41に示す指向性データをモデル化した結果、矢印Q42に示す混合モデル、より詳細には混合モデルにより表される指向性データが得られたとする。

　なお、矢印Q42に示す部分において、球表面に描かれた複数の各直線は上述のベクトルγ_１を表している。例えばベクトルV51は１つのベクトルγ_１を表している。

　このような矢印Q41に示す指向性データと、矢印Q42に示す混合モデルとが得られた場合、それらの指向性データと混合モデルとの差分を求めると、矢印Q43に示す残差のデータが差分情報として得られる。

　図５に示した例では、矢印Q43に示す残差のデータの各データポイントにおける値（残差）が差分情報「diff_data[i_point]」としてモデルデータに格納される。

　なお、指向性の表現方式でHOA（Higher Order Ambisonics）と呼ばれる方式が存在する。HOAでは、振幅だけでなく位相の情報も記録できるという利点があるが、指向性の形状が複雑になるほど高次の項が必要となりデータ量が多くなる。また、HOAでは係数が発散してしまうため、使用することのできない禁止周波数も存在する。

　指向性は、一般的に高域の方が、より形状が複雑になり凸度が高くなる。また、高域では位相の情報の利用価値が相対的に低下する。そのため、指向性データのデータ量を低減させる場合に、HOAを利用するよりも、本技術のように混合分布モデルによりモデル化する方式を採用することのメリットが大きい。なお、低域では指向性の形状が比較的緩やかで、位相を記録することにより回折、干渉等の物理現象を再現できるため、低域ではHOAを利用し、高域では混合分布モデルによりモデル化する方式を利用するようにしてもよい。

　ところで、モデルデータを再生側（復号側）に伝送した場合、そのモデルデータに基づき生成（復元）される指向性データ（振幅データ）では、特定の離散周波数ポイント、すなわち特定のビンにおいてのみ指向性ゲインが存在する。換言すれば、指向性ゲインが存在しない周波数があるため、モデルデータから生成された指向性データをそのまま用いたのではレンダリング処理ができない場合がある。

　また、データポイントも離散的に配置されているため、ユーザの視点位置（受聴位置）やオブジェクトが移動して、それらのユーザとオブジェクトの位置関係が変化すると、レンダリング処理に利用する指向性データのデータポイントも変化する。そのような場合に、互いに隣接するデータポイント間の間隔が広いとglitch（波形不連続）が発生してしまう。

　そこで、指向性データに対して周波数方向や時間方向の補間処理を行うことで、より多くの周波数（ビン）や方向（データポイント）について指向性ゲインが得られるようにしてもよい。

　例えば周波数方向の補間処理として、得ようとする特定周波数近傍の複数の周波数を示すビンの指向性ゲインを用いた１次補間処理や２次補間処理などを行うことが考えられる。

　また、例えば時間方向の補間処理として、得ようとする方向（位置）近傍の複数のデータポイントにおけるビンごとの指向性ゲインを用いた、方位角方向や仰角方向の双一次補間処理などを行うことが考えられる。

　なお、オーディオデータのフレーム長（サンプル数／フレーム）、混合モデルでの混合数や選択するモデル（分布）、データポイント数などの各種のパラメータ等により、指向性データのモデル化時の計算量と音質への影響が変化する（トレードオフ）。

　すなわち、例えばオーディオデータの１フレームごとにユーザ（受聴者）やオブジェクトの位置と向きが変化する場合、時間方向の補間処理を行うことで、波形不連続の発生を抑制し、より高品質なオーディオ再生を実現することができる。

　また、例えば再生側で、より高精度な指向性データを得るために混合モデルの混合数を増やすかや、vMF分布よりもパラメータ数は多いが、より表現能力の高いKent分布を使用するかなどを適切に決定することで、計算量と音質のバランスを調整することができる。

　さらに、コンテンツの制作者等は、例えば音源（オブジェクト）の指向性の形状に応じて、指向性データのデータポイント数を増やすか、または再生時の補間処理によりデータポイント数の少なさに対処するかなどを決定することもできる。

　その他、モデル化（符号化）の対象となるもとの指向性データと、混合モデル、すなわちモデル化後の指向性データとの誤差（差分）を示す差分情報をハフマン符号化などの任意の符号化方式により符号化し、伝送してもよい。

　また、例えば周波数方向の補間処理や時間方向の補間処理など、指向性データの利用方式（レンダリング方式）や、差分情報等の各種の情報を使用するか否かをフラグ等により切り替えることができるようにしてもよい。

　例えばフラグにより、低リソース再生機器向け等の低精度用のパラメータと、高リソース再生機器向け等の高精度用のパラメータとの切り替え、すなわちパラメータ精度の切り替えを行うことができるようにしてもよい。そのような場合、例えば再生機器のリソースやコンテンツ配信時のネットワーク環境などに応じてパラメータが切り替えられる。

　なお、以上においては本技術を指向性データに適用する例について説明したが、その他、本技術は、映像におけるテスクチャデータ、例えばvolumetric点群データに対する色や、透明度情報などにも適用可能である。

　さらに、本技術では、例えば微細構造の再現が重要な場合には、コンテンツの制作者等がマニュアル（手動）で混合モデルの混合数の追加や、モデルパラメータ等の各種のパラメータの調整を行うことができるようにしてもよい。

〈サーバの構成例〉
　図９は、本技術を適用したサーバの構成例を示す図である。

　図９に示すサーバ１１は、例えばコンピュータなどからなる情報処理装置であり、コンテンツの配信を行う。

　例えばコンテンツは、１または複数の各オブジェクトのオーディオデータ（オブジェクトオーディオデータ）と、音源種別ごとに用意された、音源（オブジェクト）の指向性、すなわち指向特性を表す指向性データとから構成される。

　このようなコンテンツは、例えば３Ｄ音源の音とともに指向性データをマイクロホンアレイ等により収録することで得ることができる。また、コンテンツにオーディオデータに対応する映像データが含まれていてもよい。

　サーバ１１は、モデル化部２１、モデルデータ生成部２２、オーディオデータ符号化部２３、および出力部２４を有している。

　モデル化部２１は、入力された各音源種別の指向性データをモデル化し、その結果得られたモデルパラメータや差分情報をモデルデータ生成部２２に供給する。

　モデルデータ生成部２２は、モデル化部２１から供給されたモデルパラメータや差分情報に基づいてモデルデータを生成し、出力部２４に供給する。

　オーディオデータ符号化部２３は、入力された各オブジェクトのオーディオデータを符号化し、その結果得られた符号化オーディオデータを出力部２４に供給する。

　出力部２４は、モデルデータ生成部２２から供給されたモデルデータと、オーディオデータ符号化部２３から供給された符号化オーディオデータとを多重化することで符号化ビットストリームを生成し、出力する。

　なお、ここでは説明を簡単にするため、モデルデータと符号化オーディオデータとが同時に出力される例について説明するが、これらのモデルデータと符号化オーディオデータは個別に生成され、互いに異なるタイミングで出力されるようにしてもよい。また、モデルデータと符号化オーディオデータは、互いに異なる装置により生成されてもよい。

〈符号化処理の説明〉
　次に、サーバ１１の動作について説明する。すなわち、以下、図１０のフローチャートを参照して、サーバ１１による符号化処理について説明する。

　ステップＳ１１においてモデル化部２１は、入力された各音源種別の指向性データをモデル化し、その結果得られたモデルパラメータや差分情報をモデルデータ生成部２２に供給する。

　例えばモデル化部２１は、指向性データを上述した式（３）に示した、複数の分布からなる混合モデルで表す（表現する）ことで、指向性データをモデル化する。

　これにより、式（３）に示した混合モデルを構成するパラメータ集中度κや、楕円率β、重みφ_ｉ、ベクトルγ_１、major軸ベクトルγ_２、minor軸ベクトルγ_３、スケールファクタ、最小値がモデルパラメータとして得られる。

　また、モデル化部２１は、モデル化前のもとの指向性データに関する情報として、データポイント数やデータポイントの位置、周波数ポイント数、ビンの中心周波数を示す情報などを生成する。

　さらに、例えばモデル化部２１は、モデル化された指向性データ、すなわち混合モデルで表された指向性データと、モデル化前のもとの指向性データとの残差（差分）を差分情報として生成する。

　なお、差分情報は、例えば混合モデルで表された指向性データと、もとの指向性データとの残差が所定値以上であるなど、特定の条件が満たされる場合や、コンテンツの制作者等により差分情報の生成が指示された場合などに生成されるようにしてもよい。

　モデル化部２１は、このようにして得られたモデルパラメータや、モデル化前のもとの指向性データに関する情報、差分情報をモデルデータ生成部２２に供給する。

　ステップＳ１２においてモデルデータ生成部２２は、モデル化部２１から供給されたモデルパラメータや、モデル化前のもとの指向性データに関する情報、差分情報をパッキングすることでモデルデータを生成し、出力部２４に供給する。

　このとき、モデルデータ生成部２２は、例えば差分情報をハフマン符号化し、その結果得られた符号化後の差分情報（以下、差分符号データとも称する）やモデルパラメータ等をパッキングすることで、図５に示したフォーマットのモデルデータを生成する。なお、モデルパラメータやモデルデータの符号化が行われるようにしてもよい。

　ステップＳ１３においてオーディオデータ符号化部２３は、入力された各オブジェクトのオーディオデータを符号化し、その結果得られた符号化オーディオデータを出力部２４に供給する。

　なお、各オブジェクトのオーディオデータに対してメタデータがあるときには、オーディオデータ符号化部２３は、各オブジェクト（オーディオデータ）のメタデータも符号化し、その結果得られた符号化メタデータを出力部２４に供給する。

　例えばメタデータには、そのオブジェクトの３次元空間における絶対的な位置を示すオブジェクト位置情報や、３次元空間におけるオブジェクトの向きを示すオブジェクト方向情報、オブジェクト（音源）の種別を示す音源種別情報などが含まれている。

　ステップＳ１４において出力部２４は、モデルデータ生成部２２から供給されたモデルデータと、オーディオデータ符号化部２３から供給された符号化オーディオデータとを多重化して符号化ビットストリームを生成し、出力する。なお、オブジェクトにメタデータがあるときには、出力部２４は、モデルデータ、符号化オーディオデータ、および符号化メタデータを含む符号化ビットストリームを生成する。

　例えば出力部２４は、図示せぬクライアントとして機能する情報処理装置に符号化ビットストリームを送信する。符号化ビットストリームが送信されると、符号化処理は終了する。

　以上のようにしてサーバ１１は、指向性データをモデル化し、その結果得られたモデルパラメータや差分情報が含まれる符号化ビットストリームを出力する。このようにすることで、クライアントへと伝送する指向性データのデータ量、すなわち指向性データの伝送量を低減させることができる。これにより、伝送遅延の発生や伝送レートの増大を抑制することができる。

〈情報処理装置の構成例〉
　サーバ１１から出力された符号化ビットストリームを取得し、コンテンツの音を再生するための出力オーディオデータを生成する情報処理装置は、例えば図１１に示すように構成される。図１１に示す情報処理装置５１は、例えばパーソナルコンピュータやスマートフォン、タブレット、ゲーム機器などからなる。

　情報処理装置５１は、取得部６１、分布モデル復号部６２、オーディオデータ復号部６３、およびレンダリング処理部６４を有している。

　取得部６１は、サーバ１１から出力された符号化ビットストリームを取得するとともに、符号化ビットストリームからモデルデータおよび符号化オーディオデータを抽出する。取得部６１は、モデルデータを分布モデル復号部６２に供給するとともに、符号化オーディオデータをオーディオデータ復号部６３に供給する。

　分布モデル復号部６２は、モデルデータから指向性データを算出する。分布モデル復号部６２は、アンパッキング部８１、指向性データ算出部８２、差分情報復号部８３、加算部８４、および周波数補間処理部８５を有している。

　アンパッキング部８１は、取得部６１から供給されたモデルデータのアンパッキングを行うことで、モデルデータからモデルパラメータやモデル化前のもとの指向性データに関する情報、差分符号データを抽出する。また、アンパッキング部８１は、モデルパラメータやモデル化前のもとの指向性データに関する情報を指向性データ算出部８２に供給し、差分符号データを差分情報復号部８３に供給する。

　指向性データ算出部８２は、アンパッキング部８１から供給されたモデルパラメータやモデル化前のもとの指向性データに関する情報に基づいて指向性データを算出（復元）し、加算部８４に供給する。なお、以下、指向性データ算出部８２によりモデルパラメータに基づき算出（復元）された指向性データを概形指向性データとも称する。

　差分情報復号部８３は、アンパッキング部８１から供給された差分符号データに対して、ハフマン符号化に対応する方式での復号を行い、その結果得られた差分情報を指向性データ残差として加算部８４に供給する。

　加算部８４は、指向性データ算出部８２から供給された概形指向性データと、差分情報復号部８３から供給された指向性データ残差（差分情報）とを加算することで、よりもとの指向性データに近い指向性データを生成し、周波数補間処理部８５に供給する。

　周波数補間処理部８５は、加算部８４から供給された指向性データに対して周波数方向の補間処理を行い、その結果得られた指向性データをレンダリング処理部６４に供給する。

　オーディオデータ復号部６３は、取得部６１から供給された符号化オーディオデータに対する復号を行い、その結果得られた各オブジェクトのオーディオデータをレンダリング処理部６４に供給する。

　また、符号化ビットストリームに符号化メタデータが含まれている場合、オーディオデータ復号部６３は、取得部６１から供給された符号化メタデータを復号し、その結果得られたメタデータをレンダリング処理部６４に供給する。

　レンダリング処理部６４は、周波数補間処理部８５から供給された指向性データと、オーディオデータ復号部６３から供給されたオーディオデータとに基づいて出力オーディオデータを生成する。

　レンダリング処理部６４は、指向性データ保持部８６、HRTF（Head Related Transfer Function）データ保持部８７、時間補間処理部８８、指向性畳み込み部８９、およびHRTF畳み込み部９０を有している。

　指向性データ保持部８６およびHRTFデータ保持部８７には、ユーザ等の指定やセンサ等による測定などに応じて、視点位置情報、受聴者方向情報、オブジェクト位置情報、およびオブジェクト方向情報が供給される。

　例えば視点位置情報は、コンテンツを視聴するユーザ（受聴者）の３次元空間における視点位置（受聴位置）を示す情報であり、受聴者方向情報は、３次元空間における、コンテンツを視聴するユーザの顔の向きを示す情報である。

　また、符号化ビットストリームに符号化メタデータが含まれている場合、オブジェクト位置情報およびオブジェクト方向情報は、符号化メタデータの復号により得られたメタデータから抽出され、指向性データ保持部８６とHRTFデータ保持部８７に供給される。

　その他、指向性データ保持部８６には、メタデータから抽出されるなどして得られた音源種別情報も供給され、HRTFデータ保持部８７には、適宜、コンテンツを視聴するユーザを示すユーザIDが供給される。

　指向性データ保持部８６は、周波数補間処理部８５から供給された指向性データを保持する。また、指向性データ保持部８６は、保持している指向性データのなかから、供給された視点位置情報、受聴者方向情報、オブジェクト位置情報、オブジェクト方向情報、および音源種別情報に応じた指向性データを読み出して時間補間処理部８８に供給する。

　HRTFデータ保持部８７は、ユーザIDにより示される各ユーザについて、ユーザ（受聴者）から見た複数の方向ごとにHRTFを保持している。

　HRTFデータ保持部８７は、保持しているHRTFのなかから、供給された視点位置情報、受聴者方向情報、オブジェクト位置情報、オブジェクト方向情報、およびユーザIDに応じたHRTFを読み出してHRTF畳み込み部９０に供給する。

　時間補間処理部８８は、指向性データ保持部８６から供給された指向性データに対して、時間方向の補間処理を行い、その結果得られた指向性データを指向性畳み込み部８９に供給する。

　指向性畳み込み部８９は、オーディオデータ復号部６３から供給されたオーディオデータと、時間補間処理部８８から供給された指向性データとを畳み込み、その結果得られたオーディオデータをHRTF畳み込み部９０に供給する。指向性データの畳み込みにより、オーディオデータに対して、オブジェクト（音源）が有する指向特性が付加される。

　HRTF畳み込み部９０は、指向性畳み込み部８９から供給されたオーディオデータ、すなわち指向性データが畳み込まれたオーディオデータと、HRTFデータ保持部８７から供給されたHRTFとを畳み込み、その結果得られたオーディオデータを出力オーディオデータとして出力する。HRTFの畳み込みにより、ユーザ（受聴者）から見たオブジェクトの位置に、そのオブジェクトの音が定位する出力オーディオデータを得ることができる。

〈指向性データ生成処理の説明〉
　次に、情報処理装置５１の動作について説明する。

　まず、情報処理装置５１が各音源種別の指向性データを生成するときに行われる指向性データ生成処理について説明する。すなわち、以下、図１２のフローチャートを参照して、情報処理装置５１による指向性データ生成処理について説明する。

　この指向性データ生成処理は、サーバ１１から送信されてきた符号化ビットストリームを取得部６１が受信し、取得部６１が符号化ビットストリームから抽出したモデルデータをアンパッキング部８１に供給すると開始される。

　ステップＳ５１においてアンパッキング部８１は、取得部６１から供給されたモデルデータのアンパッキングを行い、モデルデータから抽出したモデルパラメータやモデル化前のもとの指向性データに関する情報を指向性データ算出部８２に供給する。

　ステップＳ５２において指向性データ算出部８２は、アンパッキング部８１から供給されたモデルパラメータやモデル化前のもとの指向性データに関する情報に基づいて、概形指向性データを算出（生成）し、加算部８４に供給する。

　例えば指向性データ算出部８２は、モデルパラメータにより得られる各バンドの混合モデルF’(x;Θ)と、ビンごとのスケールファクタ「scale_factor[i_bin]」と、ビンごとの最小値「offset[i_bin]」とに基づいて、データポイントにおけるビンごとの混合モデルの出力値F(x;Θ)を算出する。これにより、各データポイントにおけるビンごとの指向性ゲイン（振幅データ）からなる概形指向性データが得られる。

　ステップＳ５３においてアンパッキング部８１は、取得部６１から供給されたモデルデータに差分符号データが含まれているか否か、すなわち差分符号データがあるか否かを判定する。

　ステップＳ５３において差分符号データが含まれていると判定された場合、アンパッキング部８１は、モデルデータから差分符号データを抽出して差分情報復号部８３に供給し、その後、処理はステップＳ５４へと進む。

　ステップＳ５４において差分情報復号部８３は、アンパッキング部８１から供給された差分符号データに対する復号を行い、その結果得られた指向性データ残差（差分情報）を加算部８４に供給する。

　ステップＳ５５において加算部８４は、指向性データ算出部８２から供給された概形指向性データに、差分情報復号部８３から供給された指向性データ残差を加算する。

　加算部８４は、加算により得られた指向性データを周波数補間処理部８５に供給し、その後、処理はステップＳ５６へと進む。

　これに対して、ステップＳ５３において差分符号データが含まれていないと判定された場合、ステップＳ５４およびステップＳ５５の処理はスキップされ、その後、処理はステップＳ５６へと進む。この場合、加算部８４は、指向性データ算出部８２から供給された概形指向性データを、そのまま復元された指向性データとして周波数補間処理部８５に供給する。

　ステップＳ５３において差分符号データが含まれていないと判定されたか、またはステップＳ５５の処理が行われると、ステップＳ５６の処理が行われる。

　ステップＳ５６において周波数補間処理部８５は、加算部８４から供給された指向性データに対して周波数方向の補間処理を行い、補間処理により得られた指向性データを指向性データ保持部８６に供給して保持させる。

　例えばオブジェクトのオーディオデータが周波数領域のデータであり、オーディオデータが複数の周波数ビンごとに周波数成分値を有しているとする。そのような場合、周波数方向の補間処理では、例えば指向性データが、オーディオデータが周波数成分値を有する全周波数ビンについて指向性ゲインを有するように、必要なビンの指向性ゲインを算出する補間処理が行われる。

　具体的には、例えば周波数補間処理部８５は、指向性データにおける所定のデータポイントの複数のビン（周波数）の指向性ゲインに基づく補間処理を行うことで、もとの指向性データには存在していなかった、同じデータポイントにおける新たな周波数（ビン）の指向性ゲインを算出する。このような周波数方向の補間処理により、より多くの周波数における指向性ゲインを含む指向性データを得ることができる。

　周波数方向の補間処理が行われ、指向性データ保持部８６に補間処理後の指向性データが保持されると、指向性データ生成処理は終了する。

　以上のようにして情報処理装置５１は、モデルデータに基づいて指向性データを算出する。このようにすることで、伝送される指向性データのデータ量、すなわち指向性データの伝送量を低減させることができる。これにより、伝送遅延の発生や伝送レートの増大を抑制することができる。

〈出力オーディオデータ生成処理の説明〉
　続いて、図１３のフローチャートを参照して、情報処理装置５１により行われる出力オーディオデータ生成処理について説明する。この出力オーディオデータ生成処理は、図１２を参照して説明した指向性データ生成処理が行われた後の任意のタイミングで行われる。

　ステップＳ８１においてオーディオデータ復号部６３は、取得部６１から供給された符号化オーディオデータの復号を行い、その結果得られたオーディオデータを指向性畳み込み部８９に供給する。例えば復号により、周波数領域のオーディオデータが得られる。

　なお、取得部６１から符号化メタデータが供給された場合、オーディオデータ復号部６３は、符号化メタデータを復号し、その結果得られたメタデータに含まれているオブジェクト位置情報、オブジェクト方向情報、音源種別情報を、適宜、指向性データ保持部８６やHRTFデータ保持部８７に供給する。

　また、指向性データ保持部８６は、供給された視点位置情報、受聴者方向情報、オブジェクト位置情報、オブジェクト方向情報、および音源種別情報に応じた指向性データを時間補間処理部８８に供給する。

　例えば指向性データ保持部８６は、視点位置情報、受聴者方向情報、オブジェクト位置情報、およびオブジェクト方向情報から、３次元空間におけるオブジェクトとユーザの視点位置（受聴位置）の関係を特定し、その特定結果に応じたデータポイントを特定する。

　一例として、例えばオブジェクトから視点位置へと向かう方向を視点位置方向とすると、混合モデルの中心から見て視点位置方向にある、混合モデルの球表面上の位置が対象データポイント位置として特定される。なお、対象データポイント位置に実際のデータポイントがない場合もある。

　指向性データ保持部８６は、音源種別情報により示される音源種別の指向性データから、特定された対象データポイント位置近傍にある複数のデータポイントにおける各ビンの指向性ゲインを抽出する。

　そして指向性データ保持部８６は、抽出した複数のデータポイントにおける各ビンの指向性ゲインからなるデータを、オブジェクトとユーザ（受聴者）の位置や方向の関係に応じた指向性データとして時間補間処理部８８に供給する。

　さらに、HRTFデータ保持部８７は、供給された視点位置情報、受聴者方向情報、オブジェクト位置情報、オブジェクト方向情報、およびユーザIDに応じたHRTFをHRTF畳み込み部９０に供給する。

　具体的には、例えばHRTFデータ保持部８７は、視点位置情報、受聴者方向情報、オブジェクト位置情報、およびオブジェクト方向情報に基づき、受聴者（ユーザ）から見たオブジェクトの相対的な方向をオブジェクト方向として特定する。そしてHRTFデータ保持部８７は、ユーザIDに対応する各方向のHRTFのうち、オブジェクト方向に対応する方向のHRTFをHRTF畳み込み部９０に供給する。

　ステップＳ８２において時間補間処理部８８は、指向性データ保持部８６から供給された指向性データに対して時間方向の補間処理を行い、その結果得られた指向性データを指向性畳み込み部８９に供給する。

　例えば時間補間処理部８８は、指向性データに含まれる複数のデータポイントにおける各ビンの指向性ゲインに基づいて、上述の対象データポイント位置における各ビンの指向性ゲインを補間処理により算出する。すなわち、もとのデータポイントとは異なる新たなデータポイント（対象データポイント位置）における指向性ゲインが補間処理により算出される。

　時間補間処理部８８は、対象データポイント位置における各ビンの指向性ゲインからなるデータを、時間方向の補間処理により得られた指向性データとして指向性畳み込み部８９に供給する。

　ステップＳ８３において指向性畳み込み部８９は、オーディオデータ復号部６３から供給されたオーディオデータと、時間補間処理部８８から供給された指向性データとを畳み込み、その結果得られたオーディオデータをHRTF畳み込み部９０に供給する。

　ステップＳ８４においてHRTF畳み込み部９０は、指向性畳み込み部８９から供給されたオーディオデータと、HRTFデータ保持部８７から供給されたHRTFとを畳み込み、その結果得られた出力オーディオデータを出力する。

　ステップＳ８５において情報処理装置５１は、処理を終了するか否かを判定する。

　例えば取得部６１からオーディオデータ復号部６３に新たなフレームの符号化オーディオデータが供給された場合、ステップＳ８５において処理を終了しないと判定される。これに対して、例えば取得部６１からオーディオデータ復号部６３に新たなフレームの符号化オーディオデータが供給されず、コンテンツの全フレームの出力オーディオデータが生成された場合、ステップＳ８５において処理を終了すると判定される。

　ステップＳ８５において、まだ処理を終了しないと判定された場合、その後、処理はステップＳ８１に戻り、上述した処理が繰り返し行われる。

　これに対して、ステップＳ８５において処理を終了すると判定された場合、情報処理装置５１は各部の動作を終了させ、出力オーディオデータ生成処理は終了する。

　以上のようにして情報処理装置５１は、適切な指向性データとHRTFを選択し、それらの指向性データとHRTFをオーディオデータに畳み込んで出力オーディオデータとする。このようにすることで、オブジェクト（音源）の指向特性や、オブジェクトと受聴者の位置や向きの関係を考慮して、より臨場感のある高品質なオーディオ再生を実現することができる。

〈第２の実施の形態〉
〈差分情報の符号化について〉
　ところで、指向性データは、音源種別ごとや周波数帯域ごとに異なる指向性形状を有している。

　また、サーバ１１では、モデル化前の指向性データと、モデル化後の指向性データとの差分を示す差分情報が適宜生成される。上述の例では、差分情報がハフマン符号化などの符号化方式で符号化され、差分符号データが得られると説明した。

　Kent分布やvMF分布によるモデル化だけでなく、差分情報の符号化についても音源種別や周波数帯域に応じて適切な符号化を行えるようにサーバ１１側、すなわちエンコーダ側で差分情報の符号化手法を選択できるようにしてもよい。

　ここでは、例として差分情報がハフマン符号化される場合について説明する。

　ハフマン符号化では、例えば図１４に示すように、符号化の対象となる１つの指向性データから得られた複数のビンごとの差分情報に基づき出現確率の分布（確率密度分布）が生成される。

　なお、図１４において横軸は差分情報の値（dB値）を示しており、縦軸は差分情報の各値の出現確率を示している。

　例えば、指向性データの全データポイントにおける全てのビン（周波数）が対象とされ、それらの各ビンの差分情報からヒストグラムを生成することで、差分情報の各値の出現確率が求められる。なお、出現確率の分布（確率密度分布）は、ビンごとに求められてもよいし、特定の周波数帯域に含まれるビンが対象とされて求められてもよいし、全ビンが対象とされて求められてもよく、それらの何れかを選択可能であってもよい。

　サーバ１１では、このような差分情報の出現確率に基づいて、予め用意された複数のハフマン符号化テーブルのなかから適切な１つのハフマン符号化テーブルが選択されるか、または１つの新規のハフマン符号化テーブルが生成される。

　指向性データの全データポイントにおける全てのビン（周波数）が対象とされ、それらの全てのビンに対して１つのハフマン符号化テーブルが選択または生成されてもよいし、１または複数のビンごとに１つのハフマン符号化テーブルが選択または生成されてもよい。

　このようにして選択または生成されたハフマン符号化テーブルが用いられて差分情報のハフマン符号化が行われる。

　ハフマン符号化テーブルは、符号化前のデータ、すなわち差分情報と、符号化により得られるハフマンコード（符号データ）との対応を示す、符号化前のデータをハフマンコードへと変換するためのテーブルである。

　また、差分情報をハフマン符号化することで得られる差分符号データの復号時には、ハフマン符号化テーブルに対応する逆引テーブルが用いられる。

　逆引テーブルは、ハフマンコード（符号データ）と復号後のデータとの対応を示す、ハフマンコードを復号後のデータへと変換するためのテーブルである。この逆引テーブルは、ハフマン符号化テーブルから生成することができる。

　差分情報をハフマン符号化する場合には、予めサーバ１１（エンコーダ）と情報処理装置５１（デコーダ）の双方でハフマン符号化テーブルを保持している状態となるようにしてもよい。そのような場合、サーバ１１から情報処理装置５１に対して、差分情報のハフマン符号化に用いたハフマン符号化テーブルを示すＩＤ情報が通知される。

　また、サーバ１１がハフマン符号化テーブルまたは逆引テーブルを符号化ビットストリームに格納し、情報処理装置５１へと伝送するようにしてもよい。

　特に、逆引テーブルのサイズ（データ量）は大きいので、サーバ１１から情報処理装置５１へとハフマン符号化テーブルを伝送しておき、情報処理装置５１が復号時等にハフマン符号化テーブルに基づき逆引テーブルを生成するようにしてもよい。

　また、出現確率の分布（確率密度分布）では、出現確率（出現頻度）が低い差分情報の値と出現確率が高い差分情報の値がある。そこで、例えば差分情報の取り得る値の範囲として±3dBの範囲など、出現確率の高い差分情報の値を含む狭いダイナミックレンジのデータに対応する範囲を対象範囲とし、その対象範囲のみを対象としたハフマン符号化テーブルを用いるようにしてもよい。

　そのような場合、対象範囲外の値の差分情報、すなわち出現確率の低いイレギュラーな値の差分情報については、差分情報をそのままモデルデータに格納するようにしてもよい。換言すれば、差分情報がそのまま差分符号データとして扱われる。

　以上のようにして、差分情報の確率密度分布に応じて、高効率となるハフマン符号化テーブルを選択したり生成したりし、どのようなハフマン符号化テーブルを利用するかに関する情報等を符号化ビットストリームに記述することで、効率よく差分情報を符号化および伝送することができる。

　また、差分情報を符号化するにあたっては、１または複数の方式を組み合わせて用いることで、さらにダイナミックレンジを小さくし、符号化効率を向上させることができる。特に、複数の方式を組み合わせることで、多段差分符号化を実現することができる。

　例えば多段差分符号化では、空間隣接差分方式、周波数間差分方式、および複素差分方式のうちの少なくとも２以上を組み合わせて符号化を行うことが考えられる。

　また、例えば多段差分符号化の有無や方式を示すmodeがモデルデータにおいてenc_mode等として記録される。このとき、例えば下位4bitに多段差分符号化の方式を記録し、上位4bitに対象が実数または複素数の何れであるかを記録した場合、以下のような情報がモデルデータに格納される。

（対象データが実数）
　0x00：多段差分符号化無し
　0x01：空間隣接差分方式
　0x02：周波数間差分方式
　0x03：空間隣接差分方式＋周波数間差分方式
（対象データが複素数）
　0x1*：下位ビットは対象データ実数の場合と同じ

　空間隣接差分方式は、処理対象のデータポイントの差分情報の符号化を行うときに、その処理対象のデータポイントにおける差分情報と、処理対象のデータポイントの近傍にある他のデータポイントにおける差分情報との差分が空間差分情報として求められる。例えば、互いに隣接するデータポイント間の差分情報の差分が空間差分情報として求められる。そして、得られた空間差分情報がハフマン符号化されて差分符号データとされる。

　空間隣接差分方式では、指向性データにおける空間的に近い位置（データポイント）のデータ、すなわち指向性ゲインや差分情報は、近い値を取りやすいという性質が利用されている。

　周波数間差分方式は、処理対象のビン（周波数）の差分情報の符号化を行うときに、その処理対象のビンにおける差分情報と、処理対象のビンに隣接するビンなどの近傍の周波数である他のビンにおける差分情報との差分が周波数間差分情報として求められる。そして、得られた周波数間差分情報がハフマン符号化されて差分符号データとされる。

　周波数間差分方式では、近い周波数（ビン）のデータ、すなわち指向性ゲインや差分情報は、近い値を取りやすいという性質が利用されている。

　例えば空間隣接差分方式と周波数間差分方式を組み合わせて用いる場合には、互いに近接するビン間の空間差分情報の差分が周波数間差分情報として求められ、その周波数間差分情報がハフマン符号化されるか、または互いに近接するデータポイント間の周波数間差分情報の差分が空間差分情報として求められ、その空間差分情報がハフマン符号化される。

　複素差分方式は、指向性データが上述した振幅に関する情報だけでなく、位相に関する情報も有する場合に用いられる。

　例えば指向性データが振幅と位相に関する情報を有する場合、それらの振幅と位相に関する情報、つまり指向性ゲインは複素数により表現される。すなわち、指向性データは、データポイントごとに、各ビンについての振幅と位相を示す複素数のデータ（以下、複素指向性ゲインとも称する）を有することになり、差分情報も複素数のデータとなる。

　複素差分方式では、複素数により表現される差分情報の実部と虚部がそれぞれ独立（個別）にハフマン符号化されるか、または実部と虚部からなる２次元データ（複素指向性ゲイン）に対するハフマン符号化が行われる。なお、複素差分方式では、実部と虚部のそれぞれに対して個別にハフマン符号化を行うか、または２次元データに対するハフマン符号化を行うかを選択できるようにしてもよい。

　以下では、空間隣接差分方式、周波数間差分方式、および複素差分方式のうちの少なくとも１以上を組み合わせて符号化する各方式や、差分情報をそのままハフマン符号化する方式を１つの差分符号化方式または差分符号化モードとも称することとする。特に、差分情報をそのままハフマン符号化する差分符号化方式は、差分を用いる符号化、すなわち差分符号化を行わない方式であるといえる。

　例えばサーバ１１は、差分情報等に基づいて、複数の差分符号化方式（差分符号化モード）のなかから最も効率の高いものを選択し、その選択した差分符号化方式で差分情報のハフマン符号化を行う。

　具体的には、例えば各差分符号化方式における差分符号データの符号量（データ量）が差分情報に基づく演算により求められ、差分符号化方式のなかから最も符号量が少ないものが、最も効率の高いものとして選択されるようにしてもよい。

　その他、例えば指向性データの音源種別や、無響室等の指向性データの収録時の環境などに基づいて、適切な差分符号化方式が選択されるようにしてもよい。

〈指向性データの表現方式について〉
　以上においては、主に指向性データがKent分布やvMF分布からなる混合モデル（混合分布モデル）によりモデル化される例について説明した。

　また、例えば低域、つまり低い周波数のビンではHOAにより指向性データをモデル化して位相に関する情報も記録し、位相の重要度が相対的に低い高域、つまり高い周波数のビンではKent分布やvMF分布からなる混合モデルにより指向性データをモデル化してもよいと説明した。この場合、例えば1.5kHz乃至2kHzの近傍の所定の周波数で混合モデルによるモデル化とHOAによるモデル化とを切り替えることが考えられる。例えばオーディオコーデック等で位相の情報を利用しないIntensity stereoが上記の帯域以上で用いられている。このようにHOAと混合モデルを組み合わせる手法は、例えばホイッスルやトランペットなど、鋭い正面指向性を持つ場合に有効と考えられる。

　なお、これに限らず、周波数帯域ごと、すなわちビンやバンドごとに、または全周波数帯域で共通して、HOA方式、混合方式、複素混合方式、および差分方式のうちの少なくとも１以上の方式を組み合わせてモデルデータを生成するようにしてもよい。そのような場合、例えばHOA方式や混合方式などの互いに異なる１または複数の方式により指向性データがモデル化され、その結果得られたモデルパラメータ等を含むモデルデータが生成される。

　HOA方式は、各データポイントのビンごとの複素指向性ゲインからなる指向性データを、HOAを利用してモデル化する方式である。すなわち、HOA方式は指向性データを球面調和関数展開によりモデル化する方式である。

　具体的には、HOA方式では指向性データに対して球面調和関数展開が行われ、その結果、各次元の球面調和関数についての係数である球面調和係数がモデルパラメータとして得られる。これらの各次元の球面調和係数から、HOAによるモデル化後の複素指向性ゲインからなる指向性データを得ることができる。

　上述のように、HOA方式でのモデル化では、位相を含めた表現が可能であるが、微細な表現を行うためには球面調和関数展開の次数を上げる、すなわち高次の項まで球面調和係数を求める必要があり、そのような場合にはモデルデータのデータ量が多くなってしまう。特にHOA方式でのモデル化では、特定の方位（方向）のみ振幅や位相の分布の微細な表現を行うことができない。

　逆に、低次の項のみ球面調和係数を求める場合には、比較的緩やかな振幅や位相の変化のみを記述可能となる。

　混合方式は、上述したKent分布やvMF分布からなる混合モデルによりモデル化を行う方式である。混合方式では、音源から見た特定の方位（方向）、すなわちデータポイントの位置において変化の激しい指向性ゲインの形状を記述可能である。

　複素混合方式は、複素指向性ゲインからなる指向性データ、すなわち振幅と位相のデータを、複素数に対応した混合分布（混合モデル）を用いてモデル化する方式である。

　複素混合方式の例として、例えば以下に示す２つの方法によるモデル化が考えられる。

　まず、１つ目の方法として、複素指向性ゲインの実部と虚部のそれぞれ、または複素指向性ゲインから求まる振幅と位相角のそれぞれを独立に実数を対象とした確率密度分布の混合モデルで記述することによりモデル化を行う方法が考えられる。

　２つ目の方法として、複素数に対応した複素Bingham分布混合モデルや、複素watson分布混合モデル等を用いて指向性データ（複素指向性ゲインの分布）を記述することによりモデル化を行う方法が考えられる。

　この場合、例えば指向性データが１または複数の複素Bingham分布からなる混合モデルや、１または複数の複素watson分布からなる混合モデルによりモデル化され、その結果、混合方式における場合と同様のモデルパラメータが得られる。このようにして得られたモデルパラメータから、複素混合方式でのモデル化後の複素指向性ゲインからなる指向性データを得ることができる。

　一例として対象とする複素数データの分布をそのまま複素Bingham分布で記述する場合、以下の式（５）に示す形式で記述が行われる。すなわち、複素Bingham分布の値f(z)は次式（５）により表される。

　式（５）における複素数ベクトルｚは、Kent分布やvMF分布における球表面の位置ベクトルｘに対応し、ｚ*はその複素共役となる。複素行列Ａは位置、急峻さ、方向、形状を示すｋ×ｋ次元の行列であり、正規化係数C(A)は次式（６）の通りである。

　ここでａ_ｊの定義は以下の式（７）の通りである。λ_ｊは複素行列Ａの固有値であり、λ_１＜λ_２＜λ_３＜…λ_ｋである。

　１または複数の複素Bingham分布からなる混合モデル、すなわち複素Bingham混合モデルにおける混合数および重みは、上述のKent分布やvMF分布からなる混合モデルの定式化と共通である。Ｎ個の複素Bingham分布f(z;θ_i)を用いた混合モデルの値F(x;Θ)は以下の式（８）の通り、重みづけ記述が可能である。なお、式（９）に示すように重みの総和は１であり、Θは全パラメータ集合、θ_iは各複素Bingham分布のパラメータ集合（複素Bingham分布を構成するパラメータ）、φ_iはそれぞれの複素Bingham分布に対する重みを表している。

　差分方式は、差分を利用してモデルデータを生成する方式である。

　例えばHOA方式や混合方式などの１または複数の他の方式と差分方式とを組み合わせてモデルデータを生成する場合、差分方式では、モデル化前の指向性データと、１または複数の他の方式によるモデル化後の指向性データとの差分を示す差分情報が、上述の任意の差分符号化方式により符号化され、その結果得られた差分符号データがモデルデータに格納される。なお、差分方式により求められた指向性データの差分がHOA方式等によりモデル化されてもよい。

　差分方式では、例えば差分情報について空間上の位置間（データポイント間）の差分と周波数間（ビン間またはバンド間）の差分の少なくとも何れかが求められ、その結果得られた差分がハフマン符号化されて差分符号データとされる。このとき、ハフマン符号化の対象となる差分情報の差分が複素数である場合には、その差分の実部と虚部のそれぞれが個別にハフマン符号化されてもよいし、複素数がそのままハフマン符号化されてもよいし、差分から求まる振幅成分と位相成分のそれぞれが個別にハフマン符号化されてもよい。

　これに対して、差分方式のみが用いられて、すなわち差分方式単独でモデルデータが生成される場合、上述の任意の差分符号化方式と同様にして指向性データに対する符号化（ハフマン符号化）が行われる。

　このとき、空間隣接差分方式と周波数間差分方式のうちの少なくとも１つを含む、空間隣接差分方式、周波数間差分方式、および複素差分方式のうちの少なくとも１以上の方式が用いられる。すなわち、空間上の位置間（データポイント間）や周波数間（ビン間またはバンド間）における指向性ゲインの差分が求められ、その差分がハフマン符号化される。なお、差分が複素数で表現されるときには、差分の実部と虚部のそれぞれが個別にハフマン符号化されてもよいし、差分（複素数）がハフマン符号化されてもよい。また、差分から求まる振幅成分と位相成分のそれぞれが個別にハフマン符号化されてもよい。

　さらに、差分方式により得られた差分に対するハフマン符号化により得られたハフマンコードからなるデータ（以下、符号化指向性データとも称する）が含まれるモデルデータが生成される。この場合、指向性データの残差は生じないので、モデルデータに差分符号データは含まれていない。

　なお、差分方式では、可逆圧縮が可能であるが、データ次第で圧縮率が変動する。また、空間隣接差分方式や周波数間差分方式などの複数の方式を組み合わせて多段の差分を求める、すなわち差分を求める処理を複数回行う場合には、１次元のデータの場合とは異なり、差分符号データや符号化指向性データをモデルデータに格納する際のデータ順の定義が必要となり、このデータ順によって圧縮率が変動する。

　指向性データからモデルデータを生成するにあたっては、指向性データのビンごとやバンドごとの指向性ゲインの平均値、すなわち平均指向特性をモデル化することも考えられる。そのような場合、差分情報は、平均指向特性にオフセットとスケールファクタを適用し、ダイナミックレンジを合わせてから計算される。

　以上のようにHOA方式や混合方式、複素混合方式、差分方式を組み合わせてモデルデータを生成する場合、モデルデータを生成する方式として主に以下に示す５つの方式への類型化が考えられる。

　ここでいう５つの方式とは、帯域ハイブリッド方式、加算ハイブリッド方式、乗算ハイブリッド方式、球面調和係数モデル化方式、および組み合わせハイブリッド方式である。以下、各方式について説明する。

（帯域ハイブリッド方式）
　帯域ハイブリッド方式は、周波数帯域ごと、すなわちビンごとやバンドごとにHOA方式、混合方式、複素混合方式、および差分方式のうちの何れの方式を用いてモデルデータを生成するかを切り替える方式である。この場合、例えば低域では複素指向性ゲインでの記録が行われ、高域では実数の指向性ゲインでの記録が行われるようにしてもよい。

　具体的な例として、例えば低域側のバンドではHOA方式でのモデル化が行われ、高域側のバンドでは混合方式でのモデル化が行われるなど、バンド（周波数帯域）ごとに異なる方式で指向性データのモデル化が行われるようにすることができる。

　また、例えば低域側のバンドでは複素Bingham分布等による複素混合方式でのモデル化が行われ、高域側のバンドでは混合方式でのモデル化が行われるようにしてもよい。

（加算ハイブリッド方式）
　加算ハイブリッド方式では、モデル化後の指向性データとの差分を示す差分情報が、さらにモデル化されたり、差分方式により符号化されたりする。

　加算ハイブリッド方式の具体的な例として、例えば以下に示す方式（AH1）乃至方式（AH4）などが考えられる。特に、以下に示す例では左側に記述されている方式から順番に処理が実行されていく。

　方式（AH1）：混合方式＋差分方式
　方式（AH2）：HOA方式（低次）＋混合方式
　方式（AH3）：HOA方式（低次）＋差分方式
　方式（AH4）：HOA方式（低次）＋混合方式＋差分方式

　方式（AH1）では、まず指向性データが混合方式でモデル化される。次に、モデル化前の指向性データと、混合方式でのモデル化後の指向性データとの差分を示す差分情報が差分方式により符号化され、差分符号データが生成される。

　そして、混合方式でのモデル化により得られたモデルパラメータと、差分符号データとが含まれるモデルデータが生成される。

　方式（AH2）では、まず指向性データがHOA方式でモデル化される。特に、HOA方式でのモデル化では、低次の項までの球面調和関数展開が行われる。次に、モデル化前の指向性データと、HOA方式でのモデル化後の指向性データとの差分を示す差分情報が、さらに混合方式でモデル化される。

　そして、HOA方式でのモデル化により得られたモデルパラメータと、混合方式での差分情報のモデル化により得られたモデルパラメータとが含まれるモデルデータが生成される。

　方式（AH3）では、方式（AH2）における場合と同様に、HOA方式で低次の項までのモデル化が行われ、その後、HOA方式でのモデル化について得られる差分情報が差分方式により符号化され、差分符号データが生成される。

　そして、HOA方式でのモデル化により得られたモデルパラメータと、差分符号データとが含まれるモデルデータが生成される。

　方式（AH4）では、方式（AH2）における場合と同様に、HOA方式で低次の項までのモデル化後、さらに混合方式での差分情報のモデル化が行われる。

　次にHOA方式でのモデル化について得られた差分情報と、混合方式でのモデル化後の差分情報との差分を示す差分情報が差分方式により符号化され、差分符号データが生成される。換言すれば、HOA方式および混合方式の組み合わせによりモデル化されたモデル化後の指向性データと、モデル化前の指向性データとの差分を示す差分情報が差分方式により符号化され、差分符号データが生成される。

　そして、HOA方式でのモデル化により得られたモデルパラメータと、混合方式での差分情報のモデル化により得られたモデルパラメータと、差分符号データとが含まれるモデルデータが生成される。

　以下では、所定の方式での指向性データのモデル化後に、さらにモデル化対象とされる差分情報と、差分方式での符号化対象とされる差分情報とを区別するため、モデル化対象とされる差分情報を、特に中間差分情報とも称することとする。

　例えば方式（AH4）では、HOA方式でのモデル化により得られる差分情報が中間差分情報であり、この中間差分情報が混合方式でモデル化される。そして、その後、もとの中間差分情報と、混合方式でのモデル化後の中間差分情報との差分を示す差分情報が差分方式により符号化される。

　以上の方式（AH1）乃至方式（AH4）のうち、方式（AH2）では復号側においてもとの指向性データと完全に一致するものを得ることができないが、方式（AH1）、方式（AH3）、および方式（AH4）ではもとの指向性データと完全に一致するものが得られる。

　また、加算ハイブリッド方式ではなく、指向性データが単独の方式でモデル化または符号化されるようにしてもよい。すなわち、例えばHOA方式、混合方式、および差分方式のうちの何れか１つの方式のみで指向性データがモデル化または符号化され、その結果得られたモデルパラメータまたは符号化指向性データが含まれるモデルデータが生成されるようにしてもよい。

（乗算ハイブリッド方式）
　乗算ハイブリッド方式では、所定の方式で指向性データがモデル化され、モデル化後の指向性データと、モデル化前の指向性データとの比（商）がさらに所定の方式とは異なる他の方式でモデル化される。

　乗算ハイブリッド方式の具体的な例として、例えば以下に示す方式（MH1）および方式（MH2）などが考えられる。

　方式（MH1）：HOA方式（低次）×振幅変調（混合方式）
　方式（MH2）：HOA方式（低次）×振幅位相変調（混合方式）

　方式（MH1）では、まず指向性データがHOA方式でモデル化される。特に、HOA方式でのモデル化では、低次の項までの球面調和関数展開が行われる。

　次に、モデル化前の指向性データを、HOA方式でのモデル化後の指向性データで除算して得られる値（以下、振幅変調情報とも称する）が、さらに混合方式でモデル化される。このとき、例えば振幅変調情報を構成する複素数（複素指向性ゲイン）の絶対値（振幅成分）が混合方式でのモデル化の対象とされてもよいし、モデル化前後の指向性データの振幅成分の比が振幅変調情報とされてもよい。そして、HOA方式でのモデル化により得られたモデルパラメータと、混合方式での振幅変調情報のモデル化により得られたモデルパラメータとが含まれるモデルデータが生成される。

　復号時には、HOA方式についてのモデルパラメータから算出された指向性データに対して、混合方式についてのモデルパラメータから算出された振幅変調情報が乗算されて、最終的な指向性データが算出される。

　このような方式（MH1）では、HOA方式での低次の項までのモデル化では表現しきれない、高域の方位（音源からの方向）に応じた細かい振幅の揺れを示す振幅変調情報が混合方式でモデル化されてモデルデータに記録（格納）される。そして復号時には、HOA方式についてのモデルパラメータから算出された指向性データに対して、振幅変調情報により変調がかけられ、より誤差の少ない指向性データが求められる。

　方式（MH2）では、方式（MH1）における場合と同様に、指向性データに対してHOA方式での低次の項までのモデル化が行われる。

　次に、モデル化前の指向性データを、HOA方式でのモデル化後の指向性データで除算して得られる値（以下、振幅位相変調情報とも称する）が、さらに混合方式でモデル化される。このとき、例えば振幅位相変調情報を構成する複素数（複素指向性ゲイン）の実部と虚部や振幅成分と位相成分が混合方式でのモデル化の対象とされる。なお、振幅位相変調情報が複素混合方式によりモデル化されてもよい。そして、HOA方式でのモデル化により得られたモデルパラメータと、混合方式での振幅位相変調情報のモデル化により得られたモデルパラメータとが含まれるモデルデータが生成される。

　復号時には、HOA方式についてのモデルパラメータから算出された指向性データに対して、混合方式についてのモデルパラメータから算出された振幅位相変調情報が乗算されて、最終的な指向性データが算出される。

　このような方式（MH2）では、HOA方式での低次の項までのモデル化では表現しきれない、方位（音源からの方向）に応じた高域の位相の回転変化を示す振幅位相変調情報が混合方式でモデル化されてモデルデータに記録（格納）される。そして復号時には、HOA方式についてのモデルパラメータから算出された指向性データに対して、振幅位相変調情報により変調がかけられ、より誤差の少ない指向性データが求められる。

　乗算ハイブリッド方式や他の方式において、複素数により表現される指向性ゲイン（複素指向性ゲイン）や中間差分情報をモデル化する場合、複素数の実部と虚部とでそれぞれ異なるまたは同じ方式により独立（個別）にモデル化が行われてもよい。例えば実部が混合方式によりモデル化され、虚部も混合方式によりモデル化されてもよい。

　同様に、振幅成分と位相成分がそれぞれ独立（個別）に任意の方式によりモデル化されてもよいし、複素数のデータが複素混合方式によりモデル化されてもよい。

（球面調和係数モデル化方式）
　球面調和係数モデル化方式では、指向性データがHOA方式でモデル化され、その結果得られたモデルパラメータ、すなわち球面調和係数がさらに混合方式でモデル化され、その結果得られたモデルパラメータがモデルデータに格納される。

　したがって、球面調和係数モデル化方式では、指向性データがHOA方式と混合方式の二段階でモデル化されるということができる。復号時には、まず混合方式についてのモデルパラメータに基づいて球面調和係数が算出され、さらに球面調和係数に基づいて指向性データ（概形指向性データ）が算出される。

　その他、例えばモデルパラメータとしての球面調和係数の実部と虚部のそれぞれ、またはモデルパラメータから求まる振幅成分と位相成分のそれぞれが個別（独立）に混合方式などの任意の方式でモデル化されるようにしてもよい。また、球面調和係数が複素混合方式、すなわち１または複数の複素Bingham分布等によりモデル化されてもよい。

（組み合わせハイブリッド方式）
　組み合わせハイブリッド方式では、上述した帯域ハイブリッド方式、加算ハイブリッド方式、乗算ハイブリッド方式、および球面調和係数モデル化方式のうちの少なくとも２以上のものの組み合わせが用いられてモデルデータが生成される。

　また、例えばHOA方式や混合方式など、モデルデータの生成に用いられた１または複数の方式の組み合わせを示す情報がモデルデータに格納されるようにしてもよい。そのような場合、サーバ１１側においてモデルデータの生成に用いる１または複数の方式の組み合わせを適切に選択したり切り替えたりすることができる。

　以上のようにして指向性データがモデル化される場合、モデルデータは、例えば図１５および図１６に示す構成とされる。なお、図１６には図１５に示した部分に続く部分が示されている。また、図１５および図１６において図５に示した場合と対応する部分については、その説明は適宜省略する。

　図１５および図１６に示す例は、num_sound_types_idで指定される１種類の音源の指向性情報（指向性データ）をdirectivityConfigとして記述した例となっている。特にここでは、ハイブリッド方式を実現する一例としてvMF分布とKent分布、差分データ（差分情報）が存在する場合のSyntaxが示されており、各情報のビット数はあくまで一例である。

　図１５および図１６に示すモデルデータは、基本的には図５に示したモデルデータと同じデータから構成されているが、図１５および図１６の例と図５の例とでは、それらのデータのうちのいくつかのデータのビット数とデータ構成が異なっている。

　具体的には、図１５および図１６に示す例においては、方位角「azimuth_table[i]」および仰角「elevation_table[i]」が１６ビットのunsigned shortとされている。

　また、バンド数「band_count」および混合数「mix_count[i_band]」が８ビットのunsigned charとされており、選択フラグ「dist_flag」が１ビットのboolとされている。

　さらに、この例ではモデルデータには、差分情報の符号化に用いられたハイブリッドのモード（差分符号化モード（差分符号化方式））のＩＤ、すなわち差分符号化モード情報を示す「mode」が含まれている。また、モデルデータには差分情報の符号化に用いられたハフマン符号化テーブルを示すインデックス「table_index」も含まれている。

　さらにモデルデータには、1.0dBごとの量子化などの量子化ステップサイズを示す「int db_resolution」が含まれている。例えば「int db_resolution」について、値「0」は量子化なしを示しており、値「1」は0.01dBを示しており、値「2」は0.2dBを示しており、値「3」は0.4dBを示しており、値「256」は25.6dBを示している。

　その他、モデルデータには、各ビンについて、データポイントごとに差分情報をハフマン符号化することで得られたハフマンコード（ハフマン符号）、すなわち差分符号データである「diff_data[i_bin][i_point]」も格納されている。

　また、サーバ１１から情報処理装置５１には、モデルデータに格納されるか、またはモデルデータとは別に図１７に示す構成の情報が伝送される。図１７に示す情報には、ハフマン符号化テーブルまたは逆引きテーブルが含まれている。

　図１７に示す例では、「diff_mode_count」は差分符号化方式の総数を示す情報であり、この総数「diff_mode_count」の分だけ「int_nbits_res_data」が格納されている。

　この「int_nbits_res_data」は、ハフマンコードの最大ビット数、すなわちハフマンコードの最大語長を示す情報であり、例えば1.0dBきざみの場合には７ビットなどとされ、0dBから128dBまでの範囲を表現することができる。

　「element_count」はハフマン符号化テーブルまたは逆引きテーブルの要素数を示す情報であり、その要素数分だけ要素である「Huff_dec_table[i_element]」が格納されている。特に、この例では「Huff_dec_table[i_element]」は、逆引きテーブルの要素となっている。

　また、ハフマン符号化テーブルは、例えば図１８に示すようになる。すなわち、図１８は、ハフマン符号化テーブルの具体的な一例を示している。

　例えば、具体的な例として図１６においてint db_resolution＝1dBとした場合、以下のように符号化が行われる。

　0：0dB
　10：+1dB
　11：+2dB

　element_count＝4;
　int_nbits_res_data＝2;// huffman decodeテーブル(indexからdataを得る逆引きテーブル)の最大語長
　Huff＿dec_table[4]＝｛0,0,1,2｝;

　Huff_dec_tableは最大語長2bitの場合の逆引きテーブルとなる。
　0：0dB
　1：0dB
　2：1dB
　3：2dB

　また、復号時には、以下の手順で処理が行われる。
　（１）最大語長でbitstreamからビット列を取得
　（２）ビット列をi_element（huffman codeを最大語長で記録したものと等価）としてhuff_dec_tableを参照
　（３）i_elementの要素が復元されたデータを得る
　（４）上記データをdb_resolutionを元に復元し、dB値を得る
　なお、復元にはオフセット値が必要である。

　また、元データの音圧（dB値）は、Db＝Huff_dec_table[code] * db_resolutionにより得ることができる。

〈サーバの構成例〉
　サーバ１１において、１または複数の方式を組み合わせてのモデルデータの生成や差分符号化モードでの差分情報の符号化が行われる場合、例えばサーバ１１は図１９に示すように構成される。

　なお、図１９において図９における場合と対応する部分には同一の符号を付してあり、その説明は適宜、省略する。

　図１９に示すサーバ１１は、コンピュータなどからなる情報処理装置であり、図９における場合と同様に符号化装置として機能する。

　サーバ１１は、指向性データ符号化部２０１、オーディオデータ符号化部２３、および出力部２４を有している。

　指向性データ符号化部２０１は、供給された指向性データに基づいてモデルデータを生成する。指向性データ符号化部２０１は、モデルパラメータ推定部２１１、残差算出部２１２、符号化方式選択部２１３、ハフマン符号化部２１４、およびモデルデータ生成部２１５を有している。

　特に、この例ではモデルパラメータ推定部２１１および残差算出部２１２が図９のモデル化部２１に対応し、符号化方式選択部２１３乃至モデルデータ生成部２１５が図９のモデルデータ生成部２２に対応する。

　モデルパラメータ推定部２１１は、供給された処理対象の指向性データをHOA方式や混合方式など、少なくとも１以上の方式によりモデル化し、その結果得られた方式ごとのモデルパラメータを残差算出部２１２およびモデルデータ生成部２１５に供給する。

　残差算出部２１２は、供給された処理対象の指向性データと、モデルパラメータ推定部２１１から供給されたモデルパラメータとに基づいて差分情報を算出し、符号化方式選択部２１３およびハフマン符号化部２１４に供給する。

　符号化方式選択部２１３は、供給された処理対象の指向性データと、残差算出部２１２から供給された差分情報とに基づいて、差分情報をハフマン符号化するときの差分符号化モードとハフマン符号化テーブルを選択し、その選択結果を示す符号化モード情報をハフマン符号化部２１４およびモデルデータ生成部２１５に供給する。

　符号化モード情報は、選択された差分符号化モード（差分符号化方式）を示す差分符号化モード情報と、選択されたハフマン符号化テーブルを示すテーブルインデックス情報とからなる。なお、符号化方式選択部２１３での符号化モード情報の生成にあたっては、差分情報のみが用いられるようにしてもよい。

　ハフマン符号化部２１４は、符号化方式選択部２１３から供給された符号化モード情報に基づいて、残差算出部２１２から供給された差分情報をハフマン符号化し、その結果得られた差分符号データをモデルデータ生成部２１５に供給する。

　モデルデータ生成部２１５は、モデルパラメータ推定部２１１から供給された方式ごとのモデルパラメータと、ハフマン符号化部２１４から供給された差分符号データと、符号化方式選択部２１３から供給された符号化モード情報とを含むモデルデータを生成し、出力部２４に供給する。なお、差分情報の符号化が行われない場合には、モデルデータには差分符号データは含まれない。また、より詳細には、モデルデータには、上述した指向性データに関する情報も格納される。その他、指向性データのモデル化に用いられた方式を示す情報がモデルデータに格納されてもよい。

　サーバ１１が図１９に示した構成とされる場合においても、サーバ１１では図１０を参照して説明した符号化処理が行われる。但し、ステップＳ１１およびステップＳ１２では、より詳細には、以下において説明する処理が行われる。

　すなわち、ステップＳ１１では、モデルパラメータ推定部２１１において少なくとも１以上の方式により、供給された処理対象の指向性データのモデル化が行われるとともに、残差算出部２１２において必要に応じて差分情報が算出される。

　換言すれば、例えばHOA方式や混合方式、複素混合方式、差分方式などが必要に応じて組み合わせられ、これにより上述の帯域ハイブリッド方式や、加算ハイブリッド方式、乗算ハイブリッド方式、球面調和係数モデル化方式、組み合わせハイブリッド方式などによりモデルパラメータと差分情報が算出される。

　また、ステップＳ１２では符号化方式選択部２１３における差分符号化モードとハフマン符号化テーブルの選択、およびハフマン符号化部２１４におけるハフマン符号化が必要に応じて行われるとともに、モデルデータ生成部２１５によるモデルデータの生成が行われる。

　具体的には、例えば加算ハイブリッド方式の方式（AH4）によりモデルパラメータが算出される場合、まずモデルパラメータ推定部２１１は、指向性データをHOA方式でモデル化し、その結果、モデルパラメータとしての球面調和係数を得る。

　また、モデルパラメータ推定部２１１は、HOA方式によるモデル化後の指向性データと、モデル化前の指向性データとの差分を中間差分情報として求めるとともに、中間差分情報を混合方式によりモデル化する。混合方式による中間差分情報のモデル化によって、パラメータ集中度κや楕円率β、重みφ_ｉ、ベクトルγ_１、major軸ベクトルγ_２、minor軸ベクトルγ_３、スケールファクタ、最小値がモデルパラメータとして得られる。

　モデルパラメータ推定部２１１は、HOA方式による指向性データのモデル化により得られたモデルパラメータと、混合方式による中間差分情報のモデル化により得られたモデルパラメータとを残差算出部２１２およびモデルデータ生成部２１５に供給する。

　すると、残差算出部２１２は、モデルパラメータ推定部２１１から供給されたモデルパラメータと、供給された指向性データとに基づいて差分情報を生成する。この差分情報は、HOA方式および混合方式の組み合わせによりモデル化されたモデル化後の指向性データと、モデル化前の指向性データとの残差である。

　また、ハフマン符号化部２１４は、符号化方式選択部２１３から供給された符号化モード情報に従って、残差算出部２１２から供給された差分情報を必要に応じてハフマン符号化する。

　このとき、差分符号化モード情報により示される方式で処理が行われる。すなわち、例えば空間隣接差分方式、周波数間差分方式、および複素差分方式のうちの１以上の方式により差分情報がハフマン符号化されたり、差分情報に対するハフマン符号化が行われなかったりする。

　例えば空間隣接差分方式によりハフマン符号化が行われる場合、ハフマン符号化部２１４は、互いに隣接するデータポイント間における差分情報の差分を空間差分情報として求め、その空間差分情報をハフマン符号化することで差分符号データを生成する。

　モデルデータ生成部２１５は、モデルパラメータ推定部２１１から供給された、HOA方式のモデルパラメータおよび混合方式のモデルパラメータと、符号化方式選択部２１３から供給された符号化モード情報とを含むモデルデータを生成する。特に、差分情報のハフマン符号化が行われた場合には、モデルデータ生成部２１５は、ハフマン符号化部２１４から供給された差分符号データもモデルデータに格納する。

　なお、差分方式単独でモデルデータが生成される場合、モデルパラメータ推定部２１１は、供給された指向性データに基づいて、空間隣接差分方式と周波数間差分方式のうちの少なくとも１以上の方式により指向性データの差分（以下、差分指向性データとも称する）を求める。この差分指向性データは、データポイント間やビン間における指向性データ、すなわち指向性ゲインの差分である。

　この場合、符号化方式選択部２１３は、残差算出部２１２を介してモデルパラメータ推定部２１１から供給された差分指向性データに基づいて符号化モード情報を生成する。また、ハフマン符号化部２１４は、符号化方式選択部２１３から供給された符号化モード情報に基づいて、残差算出部２１２を介してモデルパラメータ推定部２１１から供給された差分指向性データを指定された差分符号化方式によりハフマン符号化し、符号化指向性データを生成する。

　そしてモデルデータ生成部２１５は、ハフマン符号化部２１４から供給された符号化指向性データと、符号化方式選択部２１３から供給された符号化モード情報とを含むモデルデータを生成し、出力部２４に供給する。

〈指向性データ生成処理の説明〉
　図１９に示した構成のサーバ１１から符号化ビットストリームの供給を受けた情報処理装置５１は、例えば図２０に示す指向性データ生成処理を行うとともに、その後、任意のタイミングで図１３を参照して説明した出力オーディオデータ生成処理を行う。

　以下、図２０のフローチャートを参照して、復号装置として機能する情報処理装置５１により行われる指向性データ生成処理について説明する。

　なお、ステップＳ１１１では図１２のステップＳ５１の処理と同様の処理が行われる。すなわち、ステップＳ１１１ではアンパッキング部８１は、モデルデータのアンパッキングを行い、モデルパラメータやモデル化前のもとの指向性データに関する情報、差分符号データなどをモデルデータから抽出する。

　ステップＳ１１２においてアンパッキング部８１は、アンパッキングにより抽出された方式ごとのモデルパラメータのなかに、まだ指向性データ算出部８２に供給していないモデルパラメータがあるか否かを判定する。

　ステップＳ１１２においてモデルパラメータがあると判定された場合、アンパッキング部８１は、まだ指向性データ算出部８２に供給していない、すなわちまだ処理を行っていないモデルパラメータを指向性データ算出部８２に供給し、処理はステップＳ１１３へと進む。

　ステップＳ１１３において指向性データ算出部８２は、アンパッキング部８１から供給された１つの方式のモデルパラメータに基づいて、モデルパラメータに基づくデータを算出する。

　例えばステップＳ１１３では、HOA方式や混合方式など、方式ごとのモデルパラメータに基づいて、モデル化後の指向性データを構成する指向性ゲインや中間差分情報、振幅変調情報、振幅位相変調情報などがモデルパラメータに基づくデータとして算出される。

　ステップＳ１１３の処理が行われると、その後、処理はステップＳ１１２に戻り、上述した処理が繰り返し行われる。

　また、ステップＳ１１２において、指向性データ算出部８２に供給していないモデルパラメータがないと判定された場合、その後、処理はステップＳ１１４へと進む。

　ステップＳ１１４においてアンパッキング部８１は、取得部６１から供給されたモデルデータに差分符号データが含まれているか否か、すなわち差分符号データがあるか否かを判定する。

　ステップＳ１１４において差分符号データが含まれていると判定された場合、アンパッキング部８１は、モデルデータから抽出した符号化モード情報および差分符号データを差分情報復号部８３に供給し、その後、処理はステップＳ１１５へと進む。

　ステップＳ１１５において差分情報復号部８３は、アンパッキング部８１から出力された符号化モード情報および差分符号データを取得する。

　ステップＳ１１６において差分情報復号部８３は、取得した符号化モード情報に基づいて差分符号データの復号を行い、その結果得られた差分情報（指向性データ残差）を加算部８４に供給する。

　例えば符号化モード情報に含まれている差分符号化モード情報によって、空間隣接差分方式による符号化が行われていることが特定されたとする。

　そのような場合、差分情報復号部８３は、符号化モード情報に含まれているテーブルインデックス情報により特定される逆引テーブルを用いて、アンパッキング部８１から供給された差分符号データに対する復号を行い、各データポイントの空間差分情報を得る。

　そして差分情報復号部８３は、処理対象のデータポイントの空間差分情報に、そのデータポイントの近傍にある復号済みの他のデータポイントの差分情報を加算することで、処理対象のデータポイントの差分情報を求める。

　ステップＳ１１６の処理が行われたか、またはステップＳ１１４において差分符号データがないと判定された場合、その後、ステップＳ１１７の処理が行われる。

　ステップＳ１１７において指向性データ算出部８２および加算部８４は、指向性データを算出する。

　すなわち、指向性データ算出部８２は、１または複数回行われたステップＳ１１３の処理により得られたデータに基づいて概形指向性データを算出し、加算部８４に供給する。

　具体的な例として、例えばサーバ１１側において、加算ハイブリッド方式の方式（AH4）によりモデルパラメータが算出されたとする。

　そのような場合、１回目のステップＳ１１３の処理では、HOA方式のモデルパラメータに基づいてモデル化後の指向性データ（概形指向性データ）が算出される。また、２回目のステップＳ１１３の処理では、混合方式のモデルパラメータに基づいてモデル化後の中間差分情報が算出される。

　そこで、指向性データ算出部８２は、概形指向性データに中間差分情報を加算することで、すなわち各データポイントにおけるビンごとの指向性ゲインに、各データポイントにおけるビンごとの中間差分情報を加算することで、最終的な概形指向性データを求める。

　加算部８４は、このようにして指向性データ算出部８２で得られた最終的な概形指向性データに、差分情報復号部８３から供給された差分情報（指向性データ残差）を加算することで指向性データを算出し、周波数補間処理部８５に供給する。なお、差分情報がない場合には、最終的な概形指向性データがそのまま指向性データとされる。

　また、例えばサーバ１１側において、乗算ハイブリッド方式の方式（MH1）によりモデルパラメータが算出されたとする。

　そのような場合、１回目のステップＳ１１３の処理では、HOA方式のモデルパラメータに基づいてモデル化後の指向性データ（概形指向性データ）が算出される。また、２回目のステップＳ１１３の処理では、混合方式のモデルパラメータに基づいてモデル化後の振幅変調情報が算出される。

　そこで、指向性データ算出部８２は、概形指向性データに振幅変調情報を乗算することで、すなわち各データポイントにおけるビンごとの指向性ゲインに、各データポイントにおけるビンごとの振幅変調情報を乗算することで、最終的な指向性データを求める。この場合、ステップＳ１１５およびステップＳ１１６の処理は行われず、差分情報がないので、指向性データ算出部８２で得られた指向性データがそのまま加算部８４を介して周波数補間処理部８５に供給される。

　なお、例えばサーバ１１側において差分方式単独でモデルデータが生成されることもある。そのような場合、ステップＳ１１３の処理は行われず、ステップＳ１１５およびステップＳ１１６において差分情報復号部８３により符号化指向性データの復号が行われる。

　すなわち、差分情報復号部８３は、符号化モード情報に含まれているテーブルインデックス情報により特定される逆引テーブルを用いて、アンパッキング部８１から供給された符号化指向性データに対する復号を行い、差分指向性データを得る。

　そしてステップＳ１１７では、差分情報復号部８３は、差分指向性データを構成する各データポイントのビンごとの値（差分）に基づいて、指向性データを算出する。

　具体的には、例えばサーバ１１側において、空間隣接差分方式により差分指向性データが算出されている場合、差分情報復号部８３は、処理対象のデータポイントのビンごとの値（差分）に、そのデータポイントの近傍にある復元済みの他のデータポイントの同じビンの指向性ゲインを加算することで、処理対象のデータポイントのビンごとの指向性ゲインを求める。

　また、例えばサーバ１１側において、周波数間差分方式により差分指向性データが算出されている場合、差分情報復号部８３は、データポイントの処理対象のビンの値（差分）に、同じデータポイントにおける処理対象のビンの近傍にある復元済みの他のビンの指向性ゲインを加算することで、処理対象のビンの指向性ゲインを求める。

　このように、符号化指向性データがモデルデータに格納されるようにする場合であっても、指向性データの伝送量を低減させることができる。

　ステップＳ１１７の処理が行われ、指向性データが算出されると、その後、ステップＳ１１８の処理が行われて指向性データ生成処理は終了するが、ステップＳ１１８の処理は図１２のステップＳ５６の処理と同様であるので、その説明は省略する。

　以上のようにして情報処理装置５１は、モデルデータに基づいて指向性データを算出する。このようにすることで指向性データの伝送量を低減させることができる。これにより、伝送遅延の発生や伝送レートの増大を抑制することができる。

〈加算ハイブリッド方式の具体例〉
〈指向性データ符号化部の構成例〉
　ところで、サーバ１１において固定的に加算ハイブリッド方式でモデルデータが生成される場合、図１９に示したサーバ１１における指向性データ符号化部２０１の構成は、例えば図２１に示す構成とすることができる。なお、図２１において図１９における場合と対応する部分には同一の符号を付してあり、その説明は適宜省略する。

　図２１の例では、指向性データ符号化部２０１は、モデルパラメータ推定部２４１、演算部２４２、モデルパラメータ推定部２４３、演算部２４４、差分符号化部２４５、およびモデルデータ生成部２１５を有している。

　モデルパラメータ推定部２４１乃至演算部２４４は、図１９のモデルパラメータ推定部２１１に対応している。

　モデルパラメータ推定部２４１は、供給された処理対象の指向性データを混合方式によりモデル化し、その結果得られたモデルパラメータをモデルデータ生成部２１５に供給するとともに、混合方式によるモデル化後の指向性データを演算部２４２に供給する。

　演算部２４２は、供給された処理対象の指向性データから、モデルパラメータ推定部２４１から供給されたモデル化後の指向性データを減算する（差分を求める）ことで中間差分情報を算出し、モデルパラメータ推定部２４３および演算部２４４に供給する。

　モデルパラメータ推定部２４３は、演算部２４２から供給された中間差分情報をHOA方式によりモデル化し、その結果得られたモデルパラメータをモデルデータ生成部２１５に供給するとともに、HOA方式によるモデル化後の中間差分情報を演算部２４４に供給する。

　演算部２４４は、演算部２４２から供給された中間差分情報から、モデルパラメータ推定部２４３から供給されたモデル化後の中間差分情報を減算する（差分を求める）ことで差分情報を算出し、差分符号化部２４５に供給する。

　差分符号化部２４５は、演算部２４４から供給された差分情報と、適宜、供給される処理対象の指向性データ等とに基づいて、符号化モード情報および差分符号データを生成し、モデルデータ生成部２１５に供給する。

　なお、ここではモデルパラメータ推定部２４１において混合方式によるモデル化を行い、モデルパラメータ推定部２４３においてHOA方式によるモデル化を行う例について説明した。

　しかし、これに限らず、モデルパラメータ推定部２４１やモデルパラメータ推定部２４３においてどのような方式でモデル化が行われるようにしてもよい。例えば、モデルパラメータ推定部２４１においてHOA方式によるモデル化が行われ、モデルパラメータ推定部２４３において混合方式によるモデル化が行われてもよい。

〈差分符号化部の構成例〉
　また、差分符号化部２４５は、例えば図２２に示す構成とすることができる。なお、図２２において図１９における場合と対応する部分には同一の符号を付してあり、その説明は適宜省略する。

　図２２の例では、差分符号化部２４５は残差算出部２１２、符号化方式選択部２１３、多段差分処理部２７１、およびハフマン符号化部２１４を有している。

　残差算出部２１２は、供給された処理対象の指向性データと、モデルパラメータ推定部２４１およびモデルパラメータ推定部２４３から供給されたモデル化後の指向性データおよび中間差分情報とに基づいて差分情報を算出し、符号化方式選択部２１３および多段差分処理部２７１に供給する。

　多段差分処理部２７１は、残差算出部２１２からの差分情報、または演算部２４４からの差分情報のうちの何れかに基づいて、符号化方式選択部２１３から供給される符号化モード情報により示される差分符号化モードで多段差分情報を生成する。

　例えば差分符号化モードとして、空間隣接差分方式でハフマン符号化が行われる場合には空間差分情報が多段差分情報として得られ、差分符号化モードとして、周波数間差分方式でハフマン符号化が行われる場合には周波数間差分情報が多段差分情報として得られる。同様に、差分符号化モードとして、空間隣接差分方式と周波数間差分方式でハフマン符号化が行われる場合には、空間差分情報や周波数間差分情報を求めることで得られるハフマン符号化の対象となる情報が多段差分情報となる。

　多段差分処理部２７１は、得られた多段差分情報を符号化方式選択部２１３およびハフマン符号化部２１４に供給する。

　符号化方式選択部２１３は、供給された処理対象の指向性データと、残差算出部２１２または演算部２４４から供給された差分情報と、多段差分処理部２７１から供給された多段差分情報とに基づいて符号化モード情報を生成し、多段差分処理部２７１、ハフマン符号化部２１４、およびモデルデータ生成部２１５に供給する。

　ハフマン符号化部２１４は、符号化方式選択部２１３から供給された符号化モード情報に基づいて、多段差分処理部２７１から供給された多段差分情報をハフマン符号化し、その結果得られた差分符号データをモデルデータ生成部２１５に供給する。

〈モデルデータ生成処理の説明〉
　指向性データ符号化部２０１が図２１に示した構成とされる場合、指向性データ符号化部２０１では、図１０のステップＳ１１およびステップＳ１２に対応する処理として、図２３に示すモデルデータ生成処理が行われる。

　すなわち、ステップＳ１５１においてモデルパラメータ推定部２４１は、供給された処理対象の指向性データに対して混合方式によるモデル化を行う。

　モデルパラメータ推定部２４１は、モデル化により得られたモデルパラメータをモデルデータ生成部２１５に供給するとともに、混合方式によるモデル化後の指向性データを演算部２４２に供給する。

　ステップＳ１５２において演算部２４２は、供給された処理対象の指向性データと、モデルパラメータ推定部２４１から供給されたモデル化後の指向性データとに基づいて中間差分情報を算出し、モデルパラメータ推定部２４３および演算部２４４に供給する。

　ステップＳ１５３においてモデルパラメータ推定部２４３は、演算部２４２から供給された中間差分情報に対してHOA方式によるモデル化を行う。

　モデルパラメータ推定部２４３は、モデル化により得られたモデルパラメータをモデルデータ生成部２１５に供給するとともに、HOA方式によるモデル化後の中間差分情報を演算部２４４に供給する。

　ステップＳ１５４において演算部２４４は、演算部２４２から供給された中間差分情報と、モデルパラメータ推定部２４３から供給されたモデル化後の中間差分情報とに基づいて差分情報を算出し、差分符号化部２４５に供給する。

　ステップＳ１５５において差分符号化部２４５は、演算部２４４から供給された差分情報に基づいて差分符号化を行う。

　すなわち、例えば差分符号化部２４５の符号化方式選択部２１３は、供給された処理対象の指向性データと、演算部２４４から供給された差分情報と、前フレーム等の前回の処理で多段差分処理部２７１から供給された多段差分情報とに基づいて符号化モード情報を生成し、多段差分処理部２７１、ハフマン符号化部２１４、およびモデルデータ生成部２１５に供給する。なお、符号化方式選択部２１３が残差算出部２１２から供給された差分情報を用いて符号化モード情報を生成してもよい。

　また、多段差分処理部２７１は、例えば演算部２４４から供給された差分情報と、符号化方式選択部２１３から供給される符号化モード情報とに基づいて多段差分情報を生成し、符号化方式選択部２１３およびハフマン符号化部２１４に供給する。

　ステップＳ１５６においてモデルデータ生成部２１５は、パッキングを行うことでモデルデータを生成し、出力部２４に供給する。

　具体的には、モデルデータ生成部２１５は、モデルパラメータ推定部２４１からの混合方式のモデルパラメータ、モデルパラメータ推定部２４３からのHOA方式のモデルパラメータ、符号化方式選択部２１３からの符号化モード情報、およびハフマン符号化部２１４からの差分符号データを含むモデルデータを生成する。このようにしてモデルデータが生成されると、モデルデータ生成処理は終了する。

　以上のようにして指向性データ符号化部２０１は、加算ハイブリッド方式によりモデルデータを生成する。このようにすることで、指向性データの伝送量を低減させ、伝送遅延の発生や伝送レートの増大を抑制することができる。

〈分布モデル復号部の構成例〉
　また、指向性データ符号化部２０１が図２１に示した構成とされる場合、情報処理装置５１の分布モデル復号部６２は、例えば図２４に示す構成とされる。なお、図２４において図１１における場合と対応する部分には同一の符号を付してあり、その説明は適宜省略する。

　図２４に示す分布モデル復号部６２は、アンパッキング部８１、計算部３０１、計算部３０２、差分情報復号部８３、演算部３０３、演算部３０４、および周波数補間処理部８５を有している。この例では計算部３０１および計算部３０２が図１１に示した指向性データ算出部８２に対応する。

　計算部３０１は、アンパッキング部８１から供給される混合方式のモデルパラメータに基づいて、混合方式によるモデル化後の指向性データ（概形指向性データ）を算出し、演算部３０４に供給する。計算部３０２は、アンパッキング部８１から供給されるHOA方式のモデルパラメータに基づいて、HOA方式によるモデル化後の中間差分情報を算出し、演算部３０３に供給する。

　差分情報復号部８３は、アンパッキング部８１から供給される符号化モード情報および差分符号データに基づいて差分情報（指向性データ残差）を算出し、演算部３０３に供給する。演算部３０３は、差分情報復号部８３から供給された差分情報と、計算部３０２から供給された中間差分情報とを加算（合成）し、その加算結果（差分情報）を演算部３０４に供給する。

　演算部３０４は、計算部３０１から供給された指向性データ（概形指向性データ）と、演算部３０３から供給された加算結果（差分情報）とを加算し、その結果得られた指向性データを周波数補間処理部８５に供給する。

　分布モデル復号部６２が図２４に示す構成とされる場合、上述した図２０の指向性データ生成処理における１回目のステップＳ１１３では計算部３０１により指向性データ（概形指向性データ）が算出される。また、２回目のステップＳ１１３では計算部３０２により中間差分情報が算出される。

　そして、差分情報復号部８３によりステップＳ１１５およびステップＳ１１６の処理が行われて差分情報が生成され、ステップＳ１１７では演算部３０３および演算部３０４により加算処理が行われ、指向性データが生成される。

〈データポイントの配置について〉
　ところで、上述したモデルデータの構成は、図５に示した構成や、図１５および図１６に示した構成に限らず、図２５に示す構成とすることもできる。

　なお、図２５において図５に示した場合と対応する部分については、その説明は適宜省略する。図２５においてbslbfはbit string、left bit first、すなわち左ビットが先頭であることを示している。また、uimsbfはunsigned integer most significant bit first、すなわち最上位ビットが先頭である符号無し整数を示している。

　図２５に示すモデルデータには、周波数ビンの数を示す周波数ポイント数「bin_count」が含まれており、その周波数ポイント数「bin_count」の分だけ、周波数ビンの中心の周波数「bin_freq[i]」が格納されている。

　また、バンド数「band_count」の分だけ、各バンドにおける混合モデルを構成する分布の数を示す混合数「mix_count[j]」と、バンドに含まれているビンを示すビン情報「bin_range_per_band[j]」とが格納されている。

　さらに、各バンドについて、混合数「mix_count[k]」の分だけ、モデルパラメータとしてのパラメータ集中度κ、重みφ_i、およびベクトルγ_１と、選択フラグ「dist_flag」とが格納されている。

　この例では、「kappa[j][k]」はパラメータ集中度κを示しており、「weight[j][k]」は重みφ_iを示している。また、「gamma_x[j][k]」、「gamma_y[j][k]」、および「gamma_z[j][k]」は、ベクトルγ_１を構成するX成分（X座標）、Y成分（Y座標）、およびZ成分（Z座標）を示している。

　選択フラグ「dist_flag」が「１」である場合、すなわち分布がKent分布である場合には、さらに楕円率β、major軸ベクトルγ_２、およびminor軸ベクトルγ_３が格納されている。

　ここでは、「beta[j][k]」は楕円率βを示しており、「gamma2_x[j][k]」、「gamma2_y[j][k]」、および「gamma2_z[j][k]」は、major軸ベクトルγ_２を構成するX成分、Y成分、およびZ成分を示している。「gamma3_x[j][k]」、「gamma3_y[j][k]」、および「gamma3_z[j][k]」は、minor軸ベクトルγ_３を構成するX成分、Y成分、およびZ成分を示している。

　モデルデータには、周波数ポイント数「bin_count」の分だけ、指向性ゲインのダイナミックレンジを示すスケールファクタ「scale_factor[i]」と、各ビンにおける指向性データのオフセット値、すなわち最小値「offset[i]」も含まれている。

　その他、モデルデータには、各データポイントの位置を特定するための情報も含まれている。

　上述した指向性の記録手法においては、元データ（もとの指向性データ）で定義されていたデータポイントにおける指向性データの値、すなわち指向性ゲインをなるべく正確に復元することを前提としたものとなっている。

　情報処理装置５１においては、レンダリング処理を行う際に、復号された指向性データが利用される。しかし、この場合に必要となるのは、もとの指向性データで記述されていたデータポイントにおける値（指向性ゲイン）とは限らず、レンダリング処理時に利用される位置（方位）における指向性ゲインである。

　そのため、例えば球表面上の緯度、経度を等間隔で分割した格子点にデータ（指向性ゲイン）、すなわちデータポイントを配置するようなデータ配置（以下、碁盤目データ配置と称する）だけでなく、様々なデータ配置で指向性データを記録する必要がある。換言すれば、データポイントの座標情報を可能な限り効率良く記録するためのSyntaxが必要である。

　指向性データにおけるデータポイントの配置方式として、例えば以下の方式（配置）が考えられる。

　・碁盤目データ配置
　・一様データ配置
　・非一様データ配置

　ここでいう一様データ配置とは、例えば図２６に示すように音源位置を中心とする球表面上に複数のデータポイントが一様に配置されるデータ配置である。換言すれば、一様データ配置では、球表面上のどの領域においても一定の密度でデータポイントが配置される。

　図２６の例では、球表面上の各点がデータポイントを表しており、音源位置から見てどの方位においても一定の密度でデータポイントが配置されている、すなわち一定の密度で指向性ゲイン（指向性データ）が記録されることが分かる。

　このような一様データ配置による指向性データの記録は、音源から見た受聴者（ユーザ）の方向が時間とともにまんべんなく変化する場合などに特に有効である。

　また、非一様データ配置とは、音源位置を中心とする球表面上に複数のデータポイントが非一様に配置されるデータ配置である。換言すれば、非一様データ配置では、球表面上の領域ごとに異なる密度でデータポイントが配置される。したがって、碁盤目データ配置は、非一様データ配置の１つの配置例であるということができるが、以下では、非一様データ配置には、碁盤目データ配置は含まれないこととして説明を続ける。

　非一様データ配置の具体的な例として、例えば音源位置を中心とする球表面上における、聴感上重要な音源の正面方位に対応する領域や、位置関係としてユーザの視点と音源が近づく可能性の高い方位に対応する領域にデータポイントを高密度に配置することが考えられる。また、非一様データ配置では、指向性ゲインが大きい領域にデータポイントを高密度に配置することも考えられる。

　非一様データ配置の他の例として、音源位置を中心とする球表面上における、全体として指向性ゲインの変化量の大きい部位（領域）や重要な領域にデータポイント、すなわち指向性ゲインを密に配置し、重要度が低い領域にはデータポイントを粗く配置することも考えられる。

　以上の碁盤目データ配置、一様データ配置、および非一様データ配置の何れにおいても、指向性データの優先度等を決定するにあたり、オブジェクトの優先度と連携させることなどが考えられる。例えば、指向性データの優先度が、その指向性データが活用されるコンテンツにおけるオブジェクトの音源種別の優先度に基づき決定されるようにしてもよい。

　オブジェクトの優先度との連携の例として、例えばコンテンツにおいて複数のオブジェクトが存在する場合に、音楽のコンテンツであれば、ボーカルに対応するオブジェクトの優先度が高くなるようにすることが考えられる。

　また、例えば音楽コンテンツにおけるボーカルや、映画コンテンツにおける音声など、優先度の高い音源種別、つまり優先度の高いオブジェクト音源がある場合には、その音源種別の指向性データの記述に対して、より多くのビットが配分されるようにすることが考えられる。すなわち、より優先度の高い音源種別の指向性データでは、より多くのデータポイントが設けられ、高精細に指向性データが記録されるようにすることが考えられる。

　以上のようなデータ配置でデータポイントの配置位置等を記録する場合、図２５に示した情報を含むモデルデータに、例えば図２７に示す情報をさらに記述するようにしてもよい。すなわち、図２７は、各データポイントの位置を特定するための情報等の記述形式（Syntax）の例を示している。

　なお、ここでは、音源位置（音源中心）から各データポイントまでの距離は一定であるものとする。すなわち、各データポイントが音源位置を中心とする球の表面上に配置される例について説明する。しかし、これに限らず、音源位置からデータポイントまでの距離がデータポイントごとに異なるようにしてもよい。

　図２７の例では、「position_type」は、データポイントの配置形式（配置方式）、すなわち座標記録方式を示す情報である。

　例えばデータポイントの配置が碁盤目データ配置である場合には、座標記録方式「position_type」の値は「0x000」とされる。

　また、例えばデータポイントの配置が一様データ配置である場合には、座標記録方式「position_type」の値は「0x001」とされ、データポイントの配置が非一様データ配置である場合には、座標記録方式「position_type」の値は「0x010」とされる。

　「priority_index」は、指向性データの優先度、より詳細には指向性データの優先度を示す優先度情報である。例えば指向性データは、オブジェクトの種別ごと、すなわち音源種別ごとに用意されるため、優先度情報は、音源（オブジェクト）の種別ごとの指向性データの優先度を示しているといえる。この優先度は時間とともに変化してもよい。

　具体的には、例えば優先度「priority_index」の値が「0x000」である場合、すなわち優先度を示す値が最小である場合、指向性データの優先度が最大であることを示している。ここでは、指向性データの優先度が高いほど、優先度を示す値が小さくなる。

　また、指向性データの優先度が最大である場合には、例えばその指向性データについては、復号側である情報処理装置５１において空間解像度を落とすことなく、モデル化前（符号化前）の全てのデータポイントが復元（復号）されるようにしてもよい。

　すなわち、情報処理装置５１、より詳細には分布モデル復号部６２では、モデルデータに基づいて、モデル化前における場合と同位置および同数のデータポイントを有する指向性データが算出されるようにしてもよい。その他、例えば指向性データの優先度に応じて、指向性データを構成するデータポイントの密度（数）が決定されてもよい。

　さらに、この例では座標記録方式「position_type」の値に応じて、データポイントの配置位置（座標）を特定するための情報が記述されている。

　具体的には、座標記録方式「position_type」の値が「0x000」である場合、すなわち碁盤目データ配置である場合には、方位角方向間隔「azimuth_interval」および仰角方向間隔「elevation_interval」が記述されている（格納されている）。

　方位角方向間隔「azimuth_interval」は、球表面上における、方位角方向に互いに隣接するデータポイントの間の方位角方向の間隔を示す角度（方位角の差分）を示している。

　仰角方向間隔「elevation_interval」は、球表面上における、仰角方向に互いに隣接するデータポイントの間の仰角方向の間隔を示す角度（仰角の差分）を示している。

　また、碁盤目データ配置では、情報処理装置５１側において、例えば音源位置から見た正面方向の位置など、基準となる少なくとも１つの位置がデータポイントの配置位置として既知となっている。したがって、これらの方位角方向間隔および仰角方向間隔と、予め定められた基準となる位置とから、全てのデータポイントの位置を特定することができる。

　座標記録方式「position_type」の値が「0x001」である場合、すなわち一様データ配置である場合には、球表面上に一様に分布する（配置される）データポイントの数を示すデータポイント数「uniform_dist_point_count」が記述されている（格納されている）。

　一様データ配置では、例えば情報処理装置５１側において、データポイント数ごとに各データポイントの配置位置が既知となっており、データポイント数から、全てのデータポイントの位置を特定することができる。

　座標記録方式「position_type」の値が「0x010」である場合、すなわち非一様データ配置である場合には、必須データポイント数「num_mandatory_point」とともに、その必須データポイント数分だけ、必須データポイントの位置を示す方位角データ「azimuth_table[i]」および仰角データ「elevation_table[i]」が記述されている（格納されている）。

　さらに、座標記録方式「position_type」の値が「0x010」である場合、データポイントの配置の解像度、換言すればデータポイントの配置密度を示すデータポイント配置用解像度「gain_resolution」も記述されている（格納されている）。例えばデータポイント配置用解像度「gain_resolution」は、データ（指向性ゲイン）の変動量を示すデシベル値などとされる。

　非一様配置では、データポイント配置用解像度「gain_resolution」により示される指向性ゲインの変動量ごとにデータポイントが設定される。すなわち、データポイント配置用解像度に応じて、復号で得られる指向性データにおけるデータポイントの数が変化する。

　具体的には、非一様配置では、データポイント配置用解像度によらず、必ず存在する（配置される）データポイント、つまり復号時に必ず復元されるデータポイントが必須データポイントとされている。そして、その必須データポイントの数を示す必須データポイント数「num_mandatory_point」が記述されている。

　また、方位角データ「azimuth_table[i]」および仰角データ「elevation_table[i]」は、それぞれ必須データポイントの方位角方向および仰角方向の位置（座標）を示す方位角および仰角とされる。

　したがって、復号側においては、これらの方位角データ「azimuth_table[i]」および仰角データ「elevation_table[i]」によって、各必須データポイントの配置位置を特定することができる。なお、方位角データや仰角データは、必須データポイントの配置位置を特定可能な情報であれば座標、すなわち方位角や仰角に限らず、方位角や仰角を得ることができるインデックスなど、他のどのような情報であってもよい。

　非一様配置では、各必須データポイントの配置位置が特定されると、指向性データにおける必須データポイント以外のデータポイントの配置位置が、必須データポイントの配置位置と、データポイント配置用解像度「gain_resolution」とに基づき特定される。

　具体的には、まずモデルデータ、より詳細にはモデルパラメータに基づき、ビンごとの混合モデルF(x;Θ)が求められる。この混合モデルF(x;Θ)により音源位置を囲む球表面上の任意の位置における指向性ゲインの値が得られる。

　次に、混合モデルF(x;Θ)と、必須データポイントの位置と、データポイント配置用解像度とに基づき、球表面上に必須データポイントではないデータポイント（以下、非必須データポイントとも称する）が配置される。

　非必須データポイントの位置は、混合モデルF(x;Θ)により示される指向性ゲインの値が、球表面上における必須データポイントにおける指向性ゲインの値から、例えば3dBなど、データポイント配置用解像度により示される変動量だけ変化した値となる位置とされる。

　したがって、例えばデータポイント配置用解像度により示される変動量が+3dBであり、任意の１つの必須データポイントにおける指向性ゲインの値が48dBであった場合には、球表面上における指向性ゲインが51dBとなる位置に非必須データポイントが配置される。

　このとき、球表面上の指向性ゲインの値が、既に設定された非必須データポイントにおける指向性ゲインの値から、データポイント配置用解像度により示される変動量だけ変化した値となる位置に、さらに他の非必須データポイントが設定されるようにしてもよい。すなわち、必須データポイントに対して、データポイント配置用解像度により示される変動量分の間隔で非必須データポイントが配置されるようにしてもよい。

　その他、例えばデータポイント配置用解像度に応じた数の非必須データポイントが、方位角方向や仰角方向に互いに隣接する必須データポイントの間に等間隔で配置されるようにしてもよい。

　以上のようにすることで、非一様配置における指向性データを構成する全データポイントの配置位置、すなわち全ての必須データポイントおよび非必須データポイントの配置位置が特定されたことになる。

　このように非一様配置では、復号側で得られる指向性データの非必須データポイントの配置位置や数が、データポイント配置用解像度「gain_resolution」によって変動する。

　以上の例では、データポイントの配置形式（座標記録方式）が碁盤目データ配置、一様データ配置、および非一様データ配置の何れの形式である場合でも、復号側（情報処理装置５１）において、優先度「priority_index」の値に応じて指向性データの空間解像度、すなわちデータポイントの数を調整することができる。この場合、各配置形式において、優先度「priority_index」の値に応じてデータポイントの数が変化する。

　具体的には、例えば碁盤目データ配置では、方位角方向間隔「azimuth_interval」や仰角方向間隔「elevation_interval」を大きくすることで、指向性データの空間解像度を低減させることが可能である。

　また、一様データ配置では、データポイント数「uniform_dist_point_count」を小さくすることで、指向性データの空間解像度を低減させることが可能である。

　同様に、非一様データ配置では、データポイント配置用解像度「gain_resolution」を大きくすることで、指向性データの空間解像度を低減させることが可能である。

　指向性データの空間解像度、すなわち復号により得られる指向性データのデータ量の調整方法として、例えば優先度「priority_index」の値を、方位角方向間隔「azimuth_interval」や仰角方向間隔「elevation_interval」に乗算する方法が考えられる。

　また、指向性データの空間解像度の調整方法として、例えば優先度「priority_index」の値の逆数をデータポイント数「uniform_dist_point_count」に乗算する方法や、優先度「priority_index」の値をデータポイント配置用解像度「gain_resolution」に乗算する方法なども考えられる。

　このようにすることで、情報処理装置５１では、適切な空間解像度の指向性データを得ることができる。すなわち、指向性データの空間解像度（データポイントの数）を適切に調整することができる。

　なお、図５や図１５および図１６に示したモデルデータにおいても、各データポイントの位置を特定するための情報として、データポイントごとの方位角や仰角などに代えて、図２７に示した構成の情報（以下、データポイント位置情報とも称する）が格納されるようにしてもよい。

　モデルデータに図２７に示す構成のデータポイント位置情報が含まれている場合、図１０を参照して説明した符号化処理のステップＳ１２では、モデルデータ生成部２２は、図２５および図２７に示した各情報が含まれるモデルデータを生成する。すなわち、データポイント位置情報が含まれるモデルデータが生成される。

　なお、サーバ１１が図１９に示した構成とされる場合においても、モデルデータ生成部２１５によりデータポイント位置情報が含まれるモデルデータが生成されるようにしてもよい。

　また、モデルデータの生成時において、差分情報など、データポイントごとの情報が求められる場合には、復号後の指向性データのデータポイント、すなわちデータポイント位置情報により特定されるデータポイントごとに差分情報などの各情報が算出される。

　さらに、モデルデータにデータポイント位置情報が含まれている場合、図１２を参照して説明した指向性データ生成処理のステップＳ５２では、指向性データ算出部８２は、データポイント位置情報も用いて指向性データを生成する。

　すなわち、指向性データ算出部８２は、モデルデータに含まれているデータポイント位置情報に基づき、データポイントの配置形式（座標記録方式）を特定するとともに、指向性データにおける各データポイントの配置位置を特定する。このとき、指向性データ算出部８２は、必要に応じて指向性データの優先度情報も用いてデータポイントの配置位置を特定する。

　また、指向性データ算出部８２は、モデルパラメータ等から算出された各バンドの混合モデルF’(x;Θ)と、各データポイントの配置位置の特定結果と、ビンごとのスケールファクタと、ビンごとの最小値とに基づいて、データポイントにおけるビンごとの混合モデルの出力値F(x;Θ)を算出する。これにより、各データポイントにおけるビンごとの指向性ゲインからなる概形指向性データが得られる。

　同様に、モデルデータにデータポイント位置情報が含まれている場合、図２０を参照して説明した指向性データ生成処理においても、ステップＳ１１３やステップＳ１１６、ステップＳ１１７において、データポイントの配置位置の特定結果が適宜、利用される。

　ところで、以上においては、差分符号化の方式として空間隣接差分方式や周波数間差分方式について説明した。

　例えば周波数間差分方式では、隣接するビン間、すなわち隣接する周波数間における差分情報や指向性ゲインの差分が求められる。

　このような周波数間差分方式では、指向性データにおいて、隣接する周波数（ビン）間では指向性ゲインの値が近い、すなわち指向性データの形状が近いという性質が利用されている。

　同様に、空間隣接差分方式では、隣接するデータポイント間、すなわち隣接する位置間における差分情報や指向性ゲインの差分が求められる。

　このような空間隣接差分方式では、指向性データにおいて、空間的に近い位置の間では指向性ゲインの差分が小さいという性質が利用されている。すなわち、指向性データにおいて、球表面上の指向性ゲインは連続的に変化することが多く、位置（方位）が近いと指向性ゲインの値も近くなるという性質が利用されている。

　一般的に、例えばSOFA（Spatially Oriented Format for Acoustics）形式のファイルなど、指向性やHRTF（頭部伝達関数）を記録する場合には、球表面上にデータが定義されており、以下のような方式でデータポイントが記録されることが多い。

　for elev in elevation
　　　for azi in azimuth
　　　　data_point(azi, elev)
　　　end
　end

　具体的には、例えば球表面における同一緯度上、すなわち緯度に対応する円周上において、その円周に沿って互いに隣接する経度の位置にデータポイントが配置されていく。このとき、円周を一周するように、例えば等間隔でデータポイントが配置される。

　そして、処理対象の緯度についてデータポイントが設けられると、その後においては、順次、緯度の値を変更させながら、その緯度に対応する円周上の各経度の位置にデータポイントを配置していくことで、球表面上にデータポイントが設けられる。

　このようにすることで、碁盤目データ配置等の方式の指向性データが得られる。このような碁盤目データ配置においては、南極や北極などの極の周辺におけるデータ密度、すなわちデータポイントの密度が高くなる。

　しかし、上述のように実際に指向性データ（指向性ゲイン）を記録するにあたっては、指向性ゲインの変化を高精細に記録する必要のある重要な方位でデータ（データポイント）が密となるか、または全体として均一（一様な分布）となるようなデータ分布で指向性データを記録することが望ましい。ここでいう重要な方位とは、例えば正面方向等やレンダリング時によく利用される方向、指向性ゲインの値が大きい位置の方向などである。

　また、実際に指向性データの収録を考えた場合、収録の都合により水平面のデータは密に、極周辺は疎に収録されることも考えられる。

　そこで、以下のようにソート（並び替え）を行って差分符号化を行うようにしてもよい。

　（手法DE1）：所定の基準でデータポイントをソートした順で差分符号化
　（手法DE2）：指向性ゲインのデシベル値を昇順または降順でソートして差分符号化
　（手法DE3）：優先度の高い方位から順にソートして差分符号化

　手法DE1では、碁盤目データ配置や一様データ配置、非一様データ配置などのデータ配置に対して予め定められた順番にデータポイント、すなわちデータポイントにおける差分情報や指向性ゲインがソートされる（並び替えられる）。そして、ソート後の互いに隣接するデータポイント間で差分情報や指向性ゲインの差分が求められる。この場合、復号側、つまり情報処理装置５１側においては、ソートの順番は既知となっている。

　手法DE2では、データポイントが、それらのデータポイントにおける差分情報や指向性ゲインなどの差分の計算対象となる値（デシベル値（dB値））の昇順または降順でソートされる。このとき、昇順と降順の何れでソートを行うかは、予め定められているようにすればよい。

　また、昇順または降順でソートが行われると、ソート後の互いに隣接するデータポイント間で差分情報や指向性ゲインの差分が求められる。このようにすることで、データポイント間における差分情報や指向性ゲインの差分をより小さくすることができる。

　なお、手法DE2では、復号側（情報処理装置５１側）においてソートの順番を特定することができるように、ソート後のデータポイントの並び順を示す情報がモデルデータに格納される。例えば、図２７に示したデータポイント位置情報に、ソート後のデータポイントの並び順を示す情報が格納されるようにしてもよい。

　また、ソート後のデータポイントの並び順を示す情報は、例えば各データポイントを示すインデックスをソート順に並べて得られる情報など、どのようなものであってもよい。

　手法DE3では、音源位置から見た各方位（方向）のうち、正面の方位や指向性ゲインが大きい方位など、優先度の高い方位にあるデータポイントから順番に各データポイントがソートされ、ソート後の互いに隣接するデータポイント間で差分情報や指向性ゲインの差分が求められる。これにより、差分符号化された差分情報等のデータ量を所定ビット数内に収めることができる。

　手法DE3においても手法DE2における場合と同様に、ソート後のデータポイントの並び順を示す情報がモデルデータに格納される。

　これらの手法DE1乃至手法DE3では、データポイント間の差分を求める例について説明したが、差分の計算は、データポイント間とビン間のうちの少なくとも何れかについて行われるようにすればよい。

　したがって、例えば手法DE1乃至手法DE3の各手法において、データポイントの位置だけでなく、周波数、つまりビンも考慮して並び替えを行うようにしてもよい。

　そのような場合、例えば手法DE1では、予め定められたデータポイントや周波数（ビン）の順番で差分情報や指向性ゲインがソートされ、ソート後の互いに隣接する差分情報や指向性ゲインの差分、すなわちデータポイント間やビン間での差分が求められる。なお、予め定められた順番にソートが行われた後、データポイント間とビン間の両方で差分が求められてもよいし、ビン間でのみ差分が求められてもよい。

　また、例えば手法DE2においては、同一ビンや同一データポイントなどを対象として、昇順または降順にソートされた差分情報や指向性ゲインについて、互いに隣接する差分情報や指向性ゲインの差分、つまりデータポイント間やビン間での差分が求められるようにすることができる。

　同様に、手法DE3では、データポイントや周波数（ビン）の優先度に応じて、各データポイントのビンでの差分情報や指向性データがソートされ、ソート後の互いに隣接する差分情報や指向性ゲインの差分、つまりデータポイント間やビン間での差分が求められるようにすることができる。換言すれば、この例では、データポイントやビンが優先度の順にソートされる。

　なお、以上の何れかの手法によりソートを行う場合、同じ周波数のビンのみや、所定の周波数帯域に属す複数のビンのみ、同じデータポイントまたは互いに隣接する複数のデータポイントにおけるビンのみをソート対象とするなど、１または複数のビンやデータポイントからなるグループごとにソートが行われるようにしてもよい。

　また、モデルデータ内など、符号化ビットストリーム内の各変数（情報）をテーブル化し、テーブル化後の変数の値を示すインデックスのみを伝送してもよい。

　すなわち、以上において説明した例では、モデルデータ等において、モデルパラメータなどの各種の変数値は、例えば以下のような方式でSyntaxが記述されていた。

　・Syntax内の変数値を浮動小数点フォーマットで記録
　・9bit（0から1までの間の値を512段階で表現）や11bit等の整数フォーマットでダイナミックレンジと必要な解像度に応じて値を割り当て

　ここで、変数値を記録する浮動小数点フォーマットでは、変数値としてfloat（32bit）のフォーマット内で任意の値をとることが可能である。

　これに対して、実際にさらなるビット数削減のために以下のような方式でSyntaxが記述されるようにしてもよい。

　すなわち、記述対象の変数値（パラメータ）が特定の値をとることが多いか、または特定の値で代表できる場合には、実際に使用する値、つまり記述する変数値がテーブル化される。そして、モデルデータなどの符号化ビットストリーム内、つまりSyntax内には、テーブル化により得られたインデックスのみが記述される。

　この場合、テーブル自体は符号化ビットストリームとは別に復号側に伝送される。このようにすることで、少ないビット数で変数値を記述し、符号化ビットストリームのデータ量（伝送量）を低減させることができる。

　具体的な例として、例えば変数値のうちの0.0乃至0.1の範囲のみや、0.9乃至1.0の範囲のみなど、変数値のとり得る値のうちの一部の範囲のみをテーブル化することなどが考えられる。

　そのような場合、例えば0.0乃至0.1の範囲など、テーブル化対象となる範囲内の離散的な各値（変数値）に対して、それらの値を示すインデックスが定められる。そして、実際の変数値がテーブル化対象となる範囲内の値である場合には、その実際の変数値に対応するインデックスがモデルデータ内等に格納されて伝送される。

　これに対して、実際の変数値がテーブル化対象となる範囲外の値である場合には、その実際の変数値がモデルデータ内等に格納されて伝送される。

　さらに、上述のスケールファクタ「scale_factor[i]」やオフセット値、すなわち最小値「offset[i]」をパラメトリック表現（圧縮表現）することも考えられる。

　以上においては、各ビンのスケールファクタ「scale_factor[i]」と最小値「offset[i]」を用いて、以下のようにしてビンごとの混合モデルF(x;Θ)が求められると説明した。

　For i_bin in bin
　　F(x;Θ)＝F’(x;Θ)×scale_factor[i]＋offset[i]
　End

　ここで、F’(x;Θ)はバンドごとの混合モデルの出力値である。

　また、スケールファクタ「scale_factor[i]」は、vMF分布やKent分布の総和（モデルデータ総和）、すなわち混合モデルF’(x;Θ)の各データポイントにおける値（指向性ゲイン）の総和と、インデックスiにより示されるビン、すなわちi番目のビンにおけるモデル化前のもと（オリジナル）の指向性データの各データポイントにおける値の総和との比率である。このスケールファクタは、ダイナミックレンジを表すフロート値である。

　なお、モデルデータ総和は、球表面で定義される値（指向性ゲイン）の総和であり、理想的には１となるが、実際には離散化されているため、１とはならない。また、モデル化前のもとの指向性データは、dBスケールのデータであり、スケールファクタの算出時には正の方向にオフセットされる。

　最小値「offset[i]」は、i番目のビンにおけるモデル化前のもと（オリジナル）の指向性データ、すなわち指向性ゲインの最小値（dB値）であり、フロート値で表現されている。

　このようなスケールファクタと最小値を用いた演算により、混合モデルの出力値を各ビンのダイナミックレンジに合わせて補正、復元することができる。

　この場合、ビン数分のスケールファクタと最小値が必要となり、指向性データの周波数解像度を高精細にすると、スケールファクタと最小値の記録に必要な情報量、すなわちビット数がビン数に比例して多くなってしまう。

　そこで、スケールファクタと最小値をパラメトリック表現することで、スケールファクタと最小値の記録に必要な情報量（ビット数）を低減させるようにしてもよい。

　例えば、一例として６個の各音源種別の指向性データについてのスケールファクタおよび最小値（オフセット値）として、図２８および図２９に示す値が得られる。

　図２８は、６個の各音源種別のスケールファクタを示している。なお、図２８では、縦軸は無次元の比率であるスケールファクタの値を示しており、横軸はビンのインデックスiを示している。

　この例では、音源種別によって、隣接するビン間でスケールファクタが大きく変動していたり、隣接するビン間でスケールファクタの変動が少なかったりしている。

　図２９は、６個の各音源種別の最小値（オフセット値）を示している。なお、図２９では、縦軸はdB値である最小値（オフセット値）を示しており、横軸はビンのインデックスiを示している。

　最小値においても、スケールファクタにおける場合と同様に、音源種別によって、隣接するビン間で最小値が大きく変動していたり、変動が少なかったりすることが分かる。

　このように、音源種別によって隣接周波数間（隣接ビン間）においてスケールファクタや最小値の変動の大きさが大きく異なる。

　そのため、スケールファクタや最小値をモデル化、すなわちパラメトリック表現するにあたり、少ないパラメータでモデル化が可能な場合と、パラメータ数が多くなってしまう場合とがあり得る。

　そこで、例えばモデルデータ生成部２２やモデルデータ生成部２１５は、ビン間の変動が大きく、スケールファクタまたは最小値のパラメトリック表現により符号化効率を改善できない場合には、各ビンのスケールファクタまたは最小値をそのままモデルデータに格納（記述）する。

　これに対して、モデルデータ生成部２２やモデルデータ生成部２１５は、ビン間の変動が小さく、符号化効率を改善できる場合には、スケールファクタまたは最小値をパラメトリック化してモデルデータに格納（記述）する。

　パラメトリック化（パラメトリック表現）の一例として、例えば関数近似によるカーブフィッティングなどが挙げられる。

　そのような場合、モデルデータ生成部２２やモデルデータ生成部２１５は、カーブフィッティングなどにより、各ビンのスケールファクタまたは最小値を表すグラフに対応する近似関数を得るための関数近似パラメータを生成する。そして、モデルデータ生成部２２やモデルデータ生成部２１５は、各ビンのスケールファクタまたは最小値に代えて、関数近似パラメータをモデルデータに格納する。

　復号側においては、指向性データ算出部８２や計算部３０１は、関数近似パラメータと、ビンのインデックスiとに基づき、近似関数から各ビンにおけるスケールファクタまたは最小値を求め、モデルパラメータとして用いる。

　このようにすることで、全ビンのスケールファクタや最小値をモデルデータ内に格納する必要があったのが、関数近似パラメータだけを記述すればよくなり、データ量を圧縮することができる。なお、関数近似として、線形関数やｎ次関数（ｎ≧２）による近似、多項式近似など、任意の近似を行うことが可能である。

　また、スケールファクタや最小値のダイナミックレンジが大きい場合には、関数近似の前処理として、スケールファクタや最小値の対数をとる処理や、スケールファクタや最小値を非線形関数により変換する処理などを行うことでダイナミックレンジを圧縮するようにしてもよい。

　その他、以上においては、HOA方式や混合方式、複素混合方式、差分方式を組み合わせてモデルデータを生成する場合の方式の例として、帯域ハイブリッド方式、加算ハイブリッド方式、乗算ハイブリッド方式、球面調和係数モデル化方式、組み合わせハイブリッド方式について説明した。

　しかし、これに限らず、他の組み合わせによりモデルデータを生成することも勿論可能である。

　例えば音源位置から見た方位ごと、すなわちデータポイントごとや、複数のデータポイントからなる領域ごとに、上述のHOA方式や混合方式、複素混合方式、差分方式、帯域ハイブリッド方式、加算ハイブリッド方式などの任意の方式を切り替えてモデルデータを生成するようにしてもよい。

　指向性データにおいては水平面のデータ、すなわち赤道上のデータ（指向性ゲイン）の使用頻度は高く、逆に極付近のデータの使用頻度は低い可能性が高い。そのため、領域ごとに方式を切り替えることで、適切にモデルデータのビット数を削減することができる。なお、ここでいう水平面とは、音源位置から見た緯度、すなわち仰角（elevation）が０度となる複数の各位置を含む平面である。

　具体的な例として、例えばHOA方式と、混合方式、より詳細にはvMF分布によりモデル化する方式とを組み合わせることなどが考えられる。このとき、例えばHOA方式での球面調和関数展開の次数を１次とし、領域（方位）ごとにHOA方式と混合方式を組み合わせて用いるか、混合方式のみとするかを切り換えるようにしてもよい。

　また、領域ごとにHOA方式での球面調和関数展開の次数を変えてモデルデータを生成することも考えられる。さらに、領域ごとにHOA方式と、混合方式およびHOA方式を組み合わせた方式とを切り替え、かつ領域ごとにHOA方式での球面調和関数展開の次数も変化させることも考えられる。

　その他、水平面付近のデータポイントについては、球面調和関数展開ではなく、円調和関数展開により指向性データをモデル化する方式を用いて高精細に記録し、水平面付近以外のデータポイントについては他の任意の方式により指向性ゲインを疎に記録することも考えられる。

〈第３の実施の形態〉
〈データの対称性の活用について〉
　ところで、指向性データには、元の音源の形状に応じて対称性が存在する場合がある。

　例えば音源としてのスピーカの形状は左右対称であり、スピーカの指向性データも対称となるが、スピーカにツイータ、ウーファが存在する場合には、それらのツイータとウーファの再生帯域が異なるため、指向性データは上下方向については対称とならない。

　また、正１２面体スピーカ等も商用化されており、正１２面体スピーカでは１２方向に対して対称性が成立する。また、立方体形状のフルレンジスピーカであれば、左右対称だけでなく、上下対称も成立する場合がある。一方、人間も外形は左右対称な形状をしており、左右対称がある程度成立するが、上下は頭部、胴体、脚部と対称でない形状をしており、指向性は上下対称とはならない。

　これらのことから、指向性データに対称性がある場合に、その対称性を活用することで伝送データ量を削減することが可能である。

　そのような場合、モデルデータのSyntaxは、例えば図３０に示すようになる。

　図３０に示すモデルデータには、ビンの数を示す周波数ポイント数「bin_count」が含まれており、周波数ポイント数「bin_count」の分だけ、ビンの中心の周波数「bin_freq[i]」が格納されている。

　また、バンド数「band_count」も格納されており、バンド数「band_count」の分だけ、すなわちバンドごとに指向性データの対称性の利用に関する対称性情報「use_symmetry」が格納されている。

　例えば対称性情報「use_symmetry」の値「４」、「３」、「２」、「１」、および「０」は、それぞれ上下左右対称操作を行うこと、左右対称操作を行うこと、上下対称操作を行うこと、任意の対称、回転を活用すること、および何れの対称、回転の操作も行わないことを示している。

　特に対称性情報「use_symmetry」の値が「０」である場合には、指向性データは、全方位の指向性ゲインが上述のvMF分布やKent分布等からなるモデル、すなわち混合モデル等により記述される。また、対称性情報「use_symmetry」の値「５」乃至「７」はreservedとされている。

　モデルデータには、対称性情報「use_symmetry」の値に応じて、回転操作または対称操作のための操作関連情報が格納されている。

　対称性情報「use_symmetry」の値が「４」である場合、モデルデータには、上下左右対称操作のための操作関連情報「LeftRightVerticalLineSymmetricDir()」が記述されている。対称性情報「use_symmetry」の値が「３」である場合、モデルデータには、左右対称操作のための操作関連情報「LeftRightLineSymmetricDir()」が記述されている。

　また、対称性情報「use_symmetry」の値が「２」である場合、モデルデータには、上下対称操作のための操作関連情報「VerticalLineSymmetricDir()」が記述されている。

　対称性情報「use_symmetry」の値が「１」である場合、モデルデータには、任意の対称または回転の操作のための操作関連情報「SymmetricDir()」が記述されている。

　対称性情報「use_symmetry」の値が「０」である場合、モデルデータには、何れの操作も行われず、指向性データを得るための情報「NonSymmetricDir()」が記述されている。

　図３１は、「SymmetricDir()」のSyntaxを示している。

　この例では、モデルデータの「SymmetricDir()」には、図２５における場合と同様に、混合数「mix_count[j]」およびビン情報「bin_range_per_band[j]」と、モデルパラメータとしての「kappa[j][k]」、「weight[j][k]」、「gamma_x[j][k]」、「gamma_y[j][k]」、および「gamma_z[j][k]」と、選択フラグ「dist_flag[j][k]」とが格納されている。

　また、選択フラグ「dist_flag[j][k]」の値に応じて、モデルパラメータとしての「beta[j][k]」、「gamma2_x[j][k]」、「gamma2_y[j][k]」、「gamma2_z[j][k]」、「gamma3_x[j][k]」、「gamma3_y[j][k]」、および「gamma3_z[j][k]」も格納されている。

　さらに、「SymmetricDir()」には、操作回数情報「sym_operation_count」および操作フラグ「sym_operation_flag」が格納されている。

　操作回数情報「sym_operation_count」は、vMF分布やKent分布などの１つの分布（分布モデル）に対して、回転してコピーする操作である回転操作、または対称位置にコピーする操作である対称操作を行う回数を示す情報である。

　操作フラグ「sym_operation_flag」は、回転操作と対称操作のうちの何れの操作を行うかを示すフラグ情報である。例えば操作フラグ「sym_operation_flag」の値が「１」である場合、回転操作を行うことを示しており、値が「０」である場合、対称操作を行うことを示している。

　特に、ここでは操作回数情報「sym_operation_count」により示される回数分だけ、操作フラグ「sym_operation_flag」が含まれており、その操作フラグの値に応じて、操作に必要な情報が格納されている。

　すなわち、操作フラグ「sym_operation_flag」の値が「１」である場合、回転操作に必要となる回転軸方位角「sym_azi」、回転軸仰角「sym_elev」、および回転角「sym_rotation」が格納されている。

　ここで、回転軸方位角「sym_azi」および回転軸仰角「sym_elev」は、回転操作を行うときの音源位置から見た回転軸の向きを示す方位角および仰角である。すなわち、これらの回転軸方位角および回転軸仰角により回転軸が定まる。また、回転角「sym_rotation」は、回転操作において回転軸を中心（軸）として回転させるときの角度である。

　また、操作フラグ「sym_operation_flag」の値が「１」でない場合、すなわち操作フラグの値が「０」である場合、音源位置から見た対称操作に必要となる球断面、すなわち対称面の向きを示すヨー角「sym_yaw」、ピッチ角「sym_pitch」、およびロール角「sym_roll」が格納されている。すなわち、これらのヨー角、ピッチ角、およびロール角により対称面が定まる。

　したがって、例えば操作回数情報「sym_operation_count」の値が「２」である場合、２つの各操作フラグ「sym_operation_flag」により示される操作が行われることになる。すなわち、回転操作や対称操作が２回行われることになる。

　さらに、「SymmetricDir()」には、図２５における場合と同様に、周波数ポイント数「bin_count」の分だけ、スケールファクタ「scale_factor[i]」と最小値「offset[i]」も格納されている。

　ここで、図３２および図３３を参照して、回転操作と対称操作について説明する。なお、図３２および図３３に示す例では、Kent分布について回転操作や対称操作が行われる例となっている。

　図３２は、Kent分布について回転操作を行う例を示している。

　この例では、球SP11上における指向性ゲインがKent分布により表現され、ベクトルV81乃至ベクトルV83は、Kent分布のベクトルγ_１、major軸ベクトルγ_２、およびminor軸ベクトルγ_３を表している。

　これらのベクトルV81乃至ベクトルV83は、モデルデータに格納されているモデルパラメータ、すなわち「gamma_x[j][k]」乃至「gamma_z[j][k]」や「gamma2_x[j][k]」乃至「gamma2_z[j][k]」によって求まるものである。

　回転操作が行われる場合、情報処理装置５１の指向性データ算出部８２は、モデルデータから読み出した回転軸方位角「sym_azi」および回転軸仰角「sym_elev」に基づき、回転軸RS11を求める。

　指向性データ算出部８２は、ベクトルV81乃至ベクトルV83を用いてKent分布f(x;θ_i)を求める。

　また、指向性データ算出部８２は、ベクトルV'81乃至ベクトルV'83を用いてKent分布f(x;θ_i)を求める。

　ここでベクトルV'81乃至ベクトルV'83は、回転軸RS11を軸として、モデルデータに格納されている回転角「sym_rotation」だけ、ベクトルV81乃至ベクトルV83を回転させることで得られる回転後のベクトルである。

　この場合、ベクトルV'81乃至ベクトルV'83がKent分布のベクトルγ_１、major軸ベクトルγ_２、およびminor軸ベクトルγ_３として用いられることになる。

　したがって、この例では指向性データ算出部８２は、回転軸方位角等に基づいてKent分布のベクトルγ_１などのモデルパラメータに対する回転操作を行うことで、回転されたモデルパラメータを算出する。そして指向性データ算出部８２は、回転前のモデルパラメータと、回転された（回転後の）モデルパラメータとのそれぞれに基づいてKent分布を求め、求められたそれらのKent分布を用いて混合モデル、すなわち指向性データ（指向性ゲイン）を算出する。換言すれば、回転操作前のモデルパラメータから求められたKent分布と、回転操作後のモデルパラメータから求められたKent分布とから合成により１つの分布が求められ、その分布が用いられて混合モデルが求められる。なお、２つのKent分布をそのまま混合モデルの算出に用いてもよいし、右半分や左半分など、それらの２つの各Kent分布の一部の領域のみを混合モデルの算出に用いてもよい。このことは回転操作の場合だけでなく、対称操作の場合でも同様である。

　図３３はKent分布について対称操作を行う例を示している。なお、図３３において図３２における場合と対応する部分には同一の符号を付してあり、その説明は適宜省略する。

　この例では、指向性データ算出部８２は、モデルデータから読み出したヨー角「sym_yaw」、ピッチ角「sym_pitch」、およびロール角「sym_roll」に基づき、対称面となる球SP11の断面SF11を求める。この断面SF11は、球SP11の中心（音源位置）を含む平面となっている。

　また、指向性データ算出部８２は、ベクトルV''81乃至ベクトルV''83を用いてKent分布f(x;θ_i)を求める。

　ここでベクトルV''81乃至ベクトルV''83は、断面SF11を対称面としてベクトルV81乃至ベクトルV83を折り返す（対称移動させる）ことにより得られるベクトルである。すなわち、ベクトルV''81乃至ベクトルV''83とベクトルV81乃至ベクトルV83とは、断面SF11に関して対称（面対称）となっている。

　指向性データ算出部８２では、ベクトルV''81乃至ベクトルV''83がKent分布のベクトルγ_１、major軸ベクトルγ_２、およびminor軸ベクトルγ_３として用いられる。

　したがって、この例では指向性データ算出部８２は、ヨー角等に基づいてKent分布のベクトルγ_１などのモデルパラメータに対する対称操作を行うことで、対称移動（対称操作）されたモデルパラメータを算出する。そして指向性データ算出部８２は、対称移動前のモデルパラメータと、対称移動された（対称移動後の）モデルパラメータとのそれぞれに基づいてKent分布を求め、求められたそれらのKent分布等から指向性データ（指向性ゲイン）を算出する。

　また、図３０に示したモデルデータにおける、指向性データを得るための情報「NonSymmetricDir()」のSyntax例を図３４に示す。

　図３４に示す例では、図２５における場合と同様に、混合数「mix_count[j]」およびビン情報「bin_range_per_band[j]」と、モデルパラメータとしての「kappa[j][k]」、「weight[j][k]」、「gamma_x[j][k]」、「gamma_y[j][k]」、および「gamma_z[j][k]」と、選択フラグ「dist_flag[j][k]」とが格納されている。

　さらに、周波数ポイント数「bin_count」の分だけ、スケールファクタ「scale_factor[i]」と最小値「offset[i]」も格納されている。

　この例では、回転操作や対称操作が行われないため、モデルデータには、全ての分布を構成するモデルパラメータが記述されている。

　また、操作関連情報「LeftRightVerticalLineSymmetricDir()」、「LeftRightLineSymmetricDir()」、および「VerticalLineSymmetricDir()」のデータ形式（Syntax）は、図３４に示した「NonSymmetricDir()」と同じとされる。

　但し、これらの「LeftRightVerticalLineSymmetricDir()」、「LeftRightLineSymmetricDir()」、または「VerticalLineSymmetricDir()」が格納されている場合、すなわち対称性情報「use_symmetry」の値が「４」、「３」、または「２」である場合、指向性データ算出部８２は、指向性データの復号時に対称操作を行う。

　具体的には、対称性情報「use_symmetry」の値が「３」である場合、指向性データ算出部８２は、モデルデータに記述されているモデルパラメータに対応する分布について、正面正中面に対して左右対称操作を行い、新たなvMF分布やKent分布を得る。

　この場合に行われる左右対称操作は、音源から見た正面正中面（正中面）を図３３に示した断面SF11とする対称操作である。換言すれば、正中面を断面SF11として図３３を参照して説明した対称操作を行うことで左右対称操作が実現される。この場合、左右対称操作前のモデルパラメータから得られる分布と、左右対称操作後のモデルパラメータから得られる分布とを合成すれば、音源から見て左右対称な１つの分布が得られることになる。

　また、対称性情報「use_symmetry」の値が「２」である場合、指向性データ算出部８２は、モデルデータに記述されているモデルパラメータに対応する分布について、正面水平面に対して上下対称操作を行い、新たなvMF分布やKent分布を得る。

　この場合に行われる上下対称操作は、音源から見た正面水平面（水平面）を図３３に示した断面SF11とする対称操作である。換言すれば、水平面を断面SF11として図３３を参照して説明した対称操作を行うことで上下対称操作が実現される。この場合、上下対称操作前のモデルパラメータから得られる分布と、上下対称操作後のモデルパラメータから得られる分布とを合成すれば、音源から見て上下対称な１つの分布が得られることになる。

　さらに、対称性情報「use_symmetry」の値が「４」である場合、指向性データ算出部８２は、モデルデータに記述されているモデルパラメータに対応する分布について、正面に対して上下左右対称操作を行い、新たな分布を得る。ここで、上下左右対称操作とは、操作対象となる分布に対して上下対称操作および左右対称操作を行うことで、上下左右に対称な分布を得る操作である。なお、左右対称操作や上下対称操作を含む対称操作を行ったvMF分布やKent分布は、復号時（復元時）に指向性データが定義される球表面全域にわたって有効となる。また、操作対象の分布または操作により得られた分布において境界が定義され、その境界において指向性ゲインが不連続となるようにしてもよい。

〈第４の実施の形態〉
〈バンド間のクロスフェードについて〉
　以上においては、指向性データを周波数帯域ごと、すなわちバンドごとにモデル化してデータ量を削減する手法について説明した。

　しかし、指向性データ、すなわち指向性ゲインが周波数に応じて徐々に変動していく場合があり、そのような場合にはモデル化したデータのクロスフェードが有効であると考えられる。

　図３５にクロスフェードを行う場合におけるモデルデータのSyntax例を示す。

　図３５に示す例は、図２５に示した各情報に加えて、さらにクロスフェードフラグ「fade_flag」および上限ビンインデックス「bin_range_per_band_fadein[j]」が格納されている（含まれている）。

　特に、この例ではバンド数「band_count」の分だけ、各バンドにおけるクロスフェードフラグ「fade_flag」が格納されている。

　クロスフェードフラグ「fade_flag」は、ビンごとの混合モデルF(x;Θ)を算出するにあたり、互いに隣接するバンド間のクロスフェード、すなわちバンドごとの混合モデルF’(x;Θ)の重み付き加算を行うか否かを示すフラグ情報である。

　例えばクロスフェードフラグ「fade_flag」の値が「１」である場合、バンド間のクロスフェードが行われ、値が「０」である場合、バンド間のクロスフェードは行われない。なお、バンド間のクロスフェードは、２番目以上のバンドにおいて利用される。

　また、クロスフェードフラグ「fade_flag」の値が「１」である場合には、上限ビンインデックス「bin_range_per_band_fadein[j]」が格納されている。

　上限ビンインデックス「bin_range_per_band_fadein[j]」は、バンド間のクロスフェードが行われる上限ビン、すなわちバンド間のクロスフェードが行われるバンド内のビンのうちの最も周波数が高いビンを示すインデックスである。

　バンド間のクロスフェードでは、指向性データ算出部８２は、所定のバンドについて求めた混合モデルの出力値F’(x;Θ)と、その所定のバンドに隣接する他のバンドについて求めた混合モデルの出力値F’(x;Θ)とを重み付き加算する。

　そして指向性データ算出部８２は、重み付き加算により得られた出力値にスケールファクタを乗算し、さらにその乗算結果に最小値（オフセット値）を加算して得られる値を、他のバンド内の対象となるビンにおける混合モデルの出力値F(x;Θ)とする。

　この場合、クロスフェードの対象となるのは他のバンド内の最も周波数の低いビンから、他のバンドにおける上限ビンインデックス「bin_range_per_band_fadein[j]」により示される上限ビンまでの各ビンであり、その他のビンではクロスフェードは行われない。クロスフェードが行われないビンでは、そのビンが属すバンドにおける混合モデルの出力値F’(x;Θ)とスケールファクタと最小値とから混合モデルの出力値F(x;Θ)が求められる。

　したがって、バンド間のクロスフェードが行われる場合、指向性データ（指向性ゲイン）の算出においては、スケールファクタと最小値の適用前に、隣接するバンド間の復元された混合モデルの出力値の重み付け和（重み付き加算値）を最終的なバンドの混合モデルの出力値とする手順が追加となる。

　図３６にバンド間のクロスフェードの概念図を示す。

　図３６では、縦軸はクロスフェード時に用いられる重みを示しており、横軸は周波数を示している。また、ここではバンド数が３である場合が例として示されている。

　図中、左側にはバンド間のクロスフェードが行われない場合における重み付き加算時の重みが示されている。

　直線L51乃至直線L53は、各ビンの混合モデルの出力値F(x;Θ)の算出に用いられる、バンド「bin_range_per_band[0]」乃至バンド「bin_range_per_band[2]」の各バンドの混合モデルの出力値F’(x;Θ)の重みを示している。

　特に、この例では、直線L51乃至直線L53の周波数方向の範囲は互いに重なっておらず、各ビン（周波数）についてのバンドごとの混合モデルの出力値F’(x;Θ)の重みが１となっている。したがって、実質的にバンド間のクロスフェードが行われないことが分かる。

　これに対して、図中、右側にはバンド間のクロスフェードが行われる場合における重み付き加算時の重みが示されている。

　折れ線L61乃至折れ線L63は、各ビンの混合モデルの出力値F(x;Θ)の算出に用いられる、バンド「bin_range_per_band[0]」乃至バンド「bin_range_per_band[2]」の各バンドの混合モデルの出力値F’(x;Θ)の重みを示している。

　この例では、例えばバンド「bin_range_per_band[0]」についての混合モデルの出力値F’(x;Θ)の重みを示す折れ線L61の右側の端は、バンド「bin_range_per_band[0]」の範囲外の周波数の位置にある。

　特に、折れ線L61の右側の端部分の周波数（ビン）は、バンド「bin_range_per_band[0]」に隣接するバンド「bin_range_per_band[1]」内にあるビンとなっており、このビンが上限ビン「bin_range_per_band_fadein[1]」となっている。

　したがって、例えばバンド「bin_range_per_band[1]」内の各ビンのうち、最も周波数が低いビンから上限ビン「bin_range_per_band_fadein[1]」までの間にある各ビンについては、バンド間のクロスフェードが行われて各ビンの混合モデルの出力値F(x;Θ)が求められることが分かる。この場合、各ビンにおいて、混合モデルの出力値F(x;Θ)の算出に用いられる重みの総和は１となるように重みが算出される。

　これに対して、バンド「bin_range_per_band[1]」内の各ビンのうち、上限ビンより周波数が高い各ビンについては、折れ線L62により示される重みの値が１となっており、これらのビンではバンド間のクロスフェードは行われないことが分かる。

　バンド間のクロスフェードが行われる場合、所定のビン「i_bin」についてのより周波数が低い側のバンド「i_band-1」の混合モデルの出力値の重みmodel_weight_{i_band-1}[i_bin]は、次式（１０）により得ることができる。

　また、所定のビン「i_bin」についてのより周波数が高い側のバンド「i_band」の混合モデルの出力値の重みmodel_weight_{i_band}[i_bin]は、次式（１１）により得ることができる。

　さらに、これらの重みと、ビン「i_bin」についてのバンド「i_band+j-1」の混合モデルの出力値F_{i_band+j-1}(x)とに基づいて、以下の式（１２）を計算することで、ビン「i_bin」についての混合モデルの出力値F_{i_bin}(x)を得ることができる。

　なお、式（１２）においてscale_factor[i_bin]およびoffset[i_bin]は、ビン「i_bin」のスケールファクタおよび最小値（オフセット値）を示している。

　指向性データ算出部８２は、式（１２）を計算することで、各ビンの混合モデルの出力値、すなわち各データポイントのビンごとの指向性ゲインを算出する。このようにすることで、モデルデータのデータ量を削減することができる。

〈第５の実施の形態〉
〈データの対称性の活用について〉
　第３の実施の形態においては、データの対称性の活用について説明した。

　このような対称性を活用して伝送データ量を削減する場合、上述した指向性データの上下や左右の対称性だけでなく、前後方向の対称性を活用したり、前後方向と上下方向や左右方向の対称性を組み合わせて活用したりすることも可能である。

　そのような場合、モデルデータのSyntaxは、例えば図３７に示すようになる。

　図３７に示すモデルデータには、ビンの数を示す周波数ポイント数「bin_count」が含まれており、周波数ポイント数「bin_count」の分だけ、ビンの中心の周波数「bin_freq[i]」が格納されている。

　また、モデルデータにはバンド数「band_count」も格納されており、バンド数「band_count」の分だけ、すなわちバンドごとに指向性データの対称性の利用に関する対称性情報「use_symmetry[j]」と混合数「mix_count[j]」とビン情報「bin_range_per_band[j]」が格納されている。

　対称性情報「use_symmetry[j]」は、図３０に示した対称性情報「use_symmetry」と同様のものであるが、この例では対称性情報「use_symmetry[j]」の値「５」乃至「７」は後述するようにreservedとはされずに使用される。

　また、混合数「mix_count[j]」およびビン情報「bin_range_per_band[j]」は、図３１に示したものと同様のものであり、バンドの混合モデルを構成する分布の数、およびモデル化前のもとの指向性データについてのビン（bin）を示す情報である。

　図３０に示した例では、操作関連情報等ごとに混合数「mix_count[j]」およびビン情報「bin_range_per_band[j]」が格納されていた。しかし、それらの混合数とビン情報は同じものであるので、図３７の例ではモデルデータにおける操作関連情報外の部分に混合数とビン情報が格納されている。

　図３７の例ではバンドごとの対称性情報「use_symmetry[j]」の値は、「０」乃至「７」の何れかの値とされる。

　対称性情報「use_symmetry[j]」の値「４」、「３」、「２」、「１」、および「０」は、図３０の例と同様に、上下左右対称操作を行うこと、左右対称操作を行うこと、上下対称操作を行うこと、任意の対称、回転を活用すること、および何れの対称、回転の操作も行わないことを示している。

　対称性情報「use_symmetry[j]」の値「７」、「６」、および「５」は、上下前後対称操作を行うこと、前後左右対称操作を行うこと、および前後対称操作を行うことを示している。

　バンド数「band_count」が０より大きい場合（ｊ＞０）、モデルデータには各バンドにおけるクロスフェードフラグ「fade_flag」が格納されている。

　このクロスフェードフラグ「fade_flag」は、図３５を参照して説明したものと同じものである。すなわち、クロスフェードフラグ「fade_flag」の値が「１」である場合、バンド間のクロスフェードが行われ、値が「０」である場合、バンド間のクロスフェードは行われない。

　また、クロスフェードフラグ「fade_flag」の値が「１」である場合、モデルデータにはバンドについての上限ビンインデックス「bin_range_per_band_fadein[j]」が格納されている。

　その他、モデルデータには、スタートビン「start_bin」が格納されている。

　モデル化前のもとの指向性データでは、周波数「bin_freq[i]」により示されるビンのうち、周波数が低いビンについては実質的にデータが含まれていないことがある。つまり、周波数の低いビンの指向性ゲインが０であることもある。

　スタートビン「start_bin」は、周波数「bin_freq[i]」により示されるビンのうち、０ではない指向性ゲインがデータとして含まれている最も周波数の低いビンを示す情報である。

　また、モデルデータには、対称性情報「use_symmetry[j]」の値に応じて、回転操作または対称操作のための操作関連情報が格納されている。

　対称性情報「use_symmetry[j]」の値が「７」である場合、モデルデータには、上下前後対称操作のための操作関連情報「FrontBackVerticalSymmetricDir()」が記述されている。対称性情報「use_symmetry[j]」の値が「６」である場合、モデルデータには、前後左右対称操作のための操作関連情報「FrontBackLeftRightSymmetricDir()」が記述されている。

　また、対称性情報「use_symmetry[j]」の値が「５」である場合、モデルデータには、前後対称操作のための操作関連情報「FrontBackSymmetricDir()」が記述されている。

　対称性情報「use_symmetry[j]」の値が「４」である場合、モデルデータには操作関連情報「LeftRightVerticalLineSymmetricDir()」が記述されている。対称性情報「use_symmetry[j]」の値が「３」である場合、モデルデータには操作関連情報「LeftRightLineSymmetricDir()」が記述されている。

　また、対称性情報「use_symmetry[j]」の値が「２」である場合、モデルデータには操作関連情報「VerticalLineSymmetricDir()」が記述されている。

　対称性情報「use_symmetry[j]」の値が「１」である場合、モデルデータには操作関連情報「SymmetricDir()」が記述されている。対称性情報「use_symmetry[j]」の値が「０」である場合、モデルデータには情報「NonSymmetricDir()」が記述されている。

　さらにモデルデータには、ダイナミックレンジに関する情報「DynamicRangeForDir()」が記述されている。

　この情報「DynamicRangeForDir()」には、中心の周波数がスタートビン「start_bin」により示されるビンの中心の周波数以上である各ビンについて、スケールファクタ「scale_factor[i]」と最小値「offset[i]」が格納されている。

　図３７に示したモデルデータにおける、指向性データを得るための情報「NonSymmetricDir()」のSyntax例を図３８に示す。

　図３８に示す例では、混合数「mix_count[k]」の分だけ、モデルパラメータとしての「kappa[j][k]」、「weight[j][k]」、「gamma_azi[j][k]」、および「gamma_elev[j][k]」と、選択フラグ「dist_flag[j][k]」とが格納されている。

　ここで、「gamma_azi[j][k]」および「gamma_elev[j][k]」は、ベクトルγ_１の方向を示す水平方向角度（方位角）および垂直方向角度（仰角）を示している。

　図３４の例では、「gamma_x[j][k]」、「gamma_y[j][k]」、および「gamma_z[j][k]」によりベクトルγ_１が表現されていたが、図３８では方位角および仰角によりベクトルγ_１が表現されている。

　また、選択フラグ「dist_flag[j][k]」の値に応じて、モデルパラメータとしての「beta[j][k]」および「gamma1_azi[j][k]」も格納されている。

　「gamma1_azi[j][k]」は、ベクトルγ_１から見たときのmajor軸ベクトルγ_２やminor軸ベクトルγ_３の相対的な方向を示す水平方向の角度（回転角度）である。

　すなわち、この例ではベクトルγ_１と角度「gamma1_azi[j][k]」とから、major軸ベクトルγ_２およびminor軸ベクトルγ_３を得ることができる。

　図３９は、操作関連情報「LeftRightLineSymmetricDir()」のSyntax例を示している。

　この例では、図３８の「NonSymmetricDir()」における場合と同様に、混合数「mix_count[k]」の分だけ、モデルパラメータとしての「kappa[j][k]」、「weight[j][k]」、「gamma_azi[j][k]」、および「gamma_elev[j][k]」と、選択フラグ「dist_flag[j][k]」とが格納されている。

　さらに操作関連情報「LeftRightLineSymmetricDir()」には、混合数「mix_count[k]」の分だけ、バンドにおける指向性ゲインの分布を表す混合モデルを構成するKent分布やvMF分布などの分布（混合）ごとの「sym_flag[k]」が格納されている。

　「sym_flag[k]」は、対象となる分布について、対称や回転などの操作を行うか否かを示すフラグ情報である。例えばフラグ情報「sym_flag[k]」の値「00」は、対称や回転といった操作を行わないことを示しており、フラグ情報「sym_flag[k]」の値「01」は、対称操作を行うことを示している。

　したがって、例えば操作関連情報「LeftRightLineSymmetricDir()」に格納されている所定の分布のフラグ情報「sym_flag[k]」の値が「01」である場合、その分布について左右対称操作が行われる。

　モデルデータにおける操作関連情報「FrontBackVerticalSymmetricDir()」、「FrontBackLeftRightSymmetricDir()」、「FrontBackSymmetricDir()」、「LeftRightVerticalLineSymmetricDir()」、「VerticalLineSymmetricDir()」、および「SymmetricDir()」のデータ形式（Syntax）は、図３９の「LeftRightLineSymmetricDir()」と同様とされる。

　この場合、各操作関連情報内のフラグ情報「sym_flag[k]」は、それらの操作関連情報に対応した操作を行うか否かを示すフラグ情報とされる。

　具体的には、例えば操作関連情報「VerticalLineSymmetricDir()」に格納された所定の分布（混合）のフラグ情報「sym_flag[k]」の値が「01」である場合には、その分布について上下対称操作が行われる。

　また、例えば操作関連情報「SymmetricDir()」には、図３９に示した操作関連情報「LeftRightLineSymmetricDir()」に格納されている各情報に加えて、さらにフラグ情報「sym_flag[k]」の値に応じて、回転操作や対称操作に必要となる情報も格納される。

　具体的には、例えば図３１を参照して説明した回転軸方位角「sym_azi」、回転軸仰角「sym_elev」、および回転角「sym_rotation」や、ヨー角「sym_yaw」、ピッチ角「sym_pitch」、およびロール角「sym_roll」が適宜、操作関連情報に格納される。そして、フラグ情報「sym_flag[k]」の値に応じて、混合モデルを構成する分布ごとに回転操作や対称操作が行われる。この場合、フラグ情報「sym_flag[k]」の値により、回転操作のみや対称操作のみ、回転操作と対称操作の両方など、実行させる操作の組み合わせを指定することができる。

　なお、操作関連情報「SymmetricDir()」の構成を、図３１に示した例と同様の構成とし、操作回数情報「sym_operation_count」と操作フラグ「sym_operation_flag」により回転操作や対称操作の実行の有無を規定するようにしてもよい。

　さらに、モデルデータに操作関連情報「FrontBackVerticalSymmetricDir()」、「FrontBackLeftRightSymmetricDir()」、または「FrontBackSymmetricDir()」が格納されている場合、すなわち対称性情報「use_symmetry[j]」の値が「７」、「６」、または「５」である場合、指向性データ算出部８２は、指向性データの復号時に対称操作を行う。

　具体的には、対称性情報「use_symmetry[j]」の値が「７」である場合、指向性データ算出部８２は、フラグ情報「sym_flag[k]」の値が「01」である分布について上下前後対称操作を行い、新たな分布を得る。

　そして、指向性データ算出部８２は、その新たな分布等から指向性データ（指向性ゲイン）を算出する。また、その後、バンドごとのクロスフェードフラグ「fade_flag」の値に応じて、適宜、バンド間のクロスフェードも行われる。

　ここで、上下前後対称操作とは、操作対象となる分布に対して上下対称操作および前後対称操作を行うことで、上下前後に対称な分布を得る操作である。

　この場合に行われる上下対称操作は、音源から見た正面水平面（水平面）を図３３に示した断面SF11とする対称操作である。換言すれば、水平面を断面SF11として図３３を参照して説明した対称操作を行うことで上下対称操作が実現される。

　また、前後対称操作は、音源から見た正面正中面（正中面）を水平方向に９０度だけ回転させて得られる面を図３３に示した断面SF11とする対称操作である。換言すれば、正面正中面を水平方向に９０度だけ回転させて得られた面を断面SF11として図３３を参照して説明した対称操作を行うことで前後対称操作が実現される。

　対称性情報「use_symmetry[j]」の値が「６」である場合、指向性データ算出部８２は、フラグ情報「sym_flag[k]」の値が「01」である分布について前後左右対称操作を行って新たな分布を得るとともに、得られた分布を用いて指向性データを算出する。

　前後左右対称操作とは、操作対象となる分布に対して前後対称操作および左右対称操作を行うことで、前後左右に対称な分布を得る操作である。この場合に行われる左右対称操作は、音源から見た正面正中面（正中面）を図３３に示した断面SF11とする対称操作である。

　さらに、例えば対称性情報「use_symmetry[j]」の値が「５」である場合、指向性データ算出部８２は、フラグ情報「sym_flag[k]」の値が「01」である分布について前後対称操作を行って新たな分布を得るとともに、得られた分布を用いて指向性データを算出する。

　なお、左右対称操作や上下対称操作、前後対称操作を含む対称操作を行ったvMF分布やKent分布などの分布は、復号時（復元時）に指向性データが定義される球表面全域にわたって有効となる。また、操作対象の分布または操作により得られた分布において境界が定義され、その境界において指向性ゲインが不連続となるようにしてもよい。

　その他、第５の実施の形態においては、バンドごとの対称性情報「use_symmetry[j]」で規定した対称や回転の操作について、バンドの混合モデルを構成するKent分布等の分布（混合）ごとに実際に対称や回転の操作を行うか否かをフラグ情報「sym_flag[k]」により規定している。

　しかし、これに限らず、バンドの混合モデルを構成するKent分布等の分布（混合）ごとに、実行する対称や回転の操作を規定できるようにしてもよい。

　そのような場合、例えば分布ごとに、適宜、1bitの対称性情報「use_symmetry」と3bitのフラグ情報「sym_flag[k]」をモデルデータの操作関連情報等に格納し、各分布について行う操作を規定することが考えられる。

　この例では、例えば1bitの対称性情報「use_symmetry」は、対称や回転などの操作を行うか否かを示すフラグ情報とされる。

　具体的には、例えば対称性情報「use_symmetry」の値が「１」である場合、対称や回転などの操作が行われ、対称性情報「use_symmetry」の値が「０」である場合、対称や回転などの操作が行われないようにされる。

　また、対称性情報「use_symmetry」の値が「０」である場合には、対象となる分布については対称や回転の操作は行われないので、操作関連情報等にはその分布についてのフラグ情報「sym_flag[k]」は格納されない。

　これに対して、対称性情報「use_symmetry」の値が「１」である場合には、対象となる分布については対称や回転の操作が行われるので、操作関連情報等にはその分布についてのフラグ情報「sym_flag[k]」が格納される。

　そして、指向性データ算出部８２では、フラグ情報「sym_flag[k]」の値に応じた操作が行われ、新たな分布が求められる。

　このとき、フラグ情報「sym_flag[k]」の値「０」、「１」、「２」、「３」、「４」、「５」、「６」、および「７」に対して、例えば操作なし、任意の対称、回転の操作、上下対称操作、左右対称操作、上下左右対称操作、前後対称操作、前後左右対称操作、および上下前後対称操作を割り当てるようにしてもよい。

〈その他〉
　ところで、図１２のステップＳ５２や図２０のステップＳ１１７など、概形指向性データ（指向性データ）の算出時においては、指向性データ算出部８２は、モデルパラメータに基づいて各バンドの混合モデルF’(x;Θ)を算出する。

　このとき、指向性データ算出部８２は、モデルパラメータから得られるKent分布やvMF分布、複素Bingham分布などといった、混合モデルを構成する複数の分布を、それらの分布の重みφ_i、すなわち上述のweight[j][k]やweight[i_band][i_mix]を用いて重み付き加算することで混合モデルF’(x;Θ)（指向性データ）を算出する。

　各分布の重みφ_iの値は、混合モデルを構成する複数の分布の重みφ_iの総和が１となるように定められるが、各重みφ_iの値は正の値であってもよいし、負の値であってもよい。

　例えばいくつかの分布の重みφ_iを負の値とすることで、フィルタにおけるバンドパスとバンドリジェクトフィルタの関係と同様に、混合モデルに急峻なピークだけでなくディップも設けることができるようになる。

　例えば、混合モデルを構成するKent分布やvMF分布などの１つの分布の重みφ_iを正の値とした場合、その分布に重みφ_iを乗算すると、重みφ_iの乗算後の分布は、例えば図４０の矢印Q101に示すようになる。

　なお、図４０において横方向は、球表面上で定義されるKent分布等の分布における球表面上の所定の方向を示しており、縦方向は分布の各位置における値、すなわち指向性ゲインを示している。

　矢印Q101に示す例では、重みφ_i乗算後の分布には図中、上に凸のピークがあることが分かる。

　これに対して、混合モデルを構成するKent分布やvMF分布などの１つの分布の重みφ_iを負の値とした場合、その分布に重みφ_iを乗算すると、重みφ_i乗算後の分布は、例えば矢印Q102に示すようになる。この例では、重みφ_i乗算後の分布には図中、下に凸のディップがあることが分かる。

　したがって、バンドについての混合モデルを構成する全分布の重みφ_iの総和が１となるという条件で、適宜、負の値を含む各分布の重みφ_iを定めれば、より自由度を高くし、より多様な形状の混合モデルを表現することができるようになる。

　このように、任意の分布の重みφ_iを負の値とする場合であっても、全分布の重みφ_iの総和が１（1.0）となるように設定すれば、一般性が失われることはない。

　また、重みφ_iの値として負の値もとることができるようにする場合、例えば図２５や図３１、図３４などにおける重みφ_iとしての10bitの重みweight[j][k]のうちの上位1bitが符号bitとして使用されることになる。このことは、例えば図５における重みweight[i_band][i_mix]においても同様である。

〈コンピュータの構成例〉
　ところで、上述した一連の処理は、ハードウェアにより実行することもできるし、ソフトウェアにより実行することもできる。一連の処理をソフトウェアにより実行する場合には、そのソフトウェアを構成するプログラムが、コンピュータにインストールされる。ここで、コンピュータには、専用のハードウェアに組み込まれているコンピュータや、各種のプログラムをインストールすることで、各種の機能を実行することが可能な、例えば汎用のパーソナルコンピュータなどが含まれる。

　図４１は、上述した一連の処理をプログラムにより実行するコンピュータのハードウェアの構成例を示すブロック図である。

　コンピュータにおいて、CPU（Central Processing Unit）５０１，ROM（Read Only Memory）５０２，RAM（Random Access Memory）５０３は、バス５０４により相互に接続されている。

　バス５０４には、さらに、入出力インターフェース５０５が接続されている。入出力インターフェース５０５には、入力部５０６、出力部５０７、記録部５０８、通信部５０９、及びドライブ５１０が接続されている。

　入力部５０６は、キーボード、マウス、マイクロホン、撮像素子などよりなる。出力部５０７は、ディスプレイ、スピーカなどよりなる。記録部５０８は、ハードディスクや不揮発性のメモリなどよりなる。通信部５０９は、ネットワークインターフェースなどよりなる。ドライブ５１０は、磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリなどのリムーバブル記録媒体５１１を駆動する。

　以上のように構成されるコンピュータでは、CPU５０１が、例えば、記録部５０８に記録されているプログラムを、入出力インターフェース５０５及びバス５０４を介して、RAM５０３にロードして実行することにより、上述した一連の処理が行われる。

　コンピュータ（CPU５０１）が実行するプログラムは、例えば、パッケージメディア等としてのリムーバブル記録媒体５１１に記録して提供することができる。また、プログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供することができる。

　コンピュータでは、プログラムは、リムーバブル記録媒体５１１をドライブ５１０に装着することにより、入出力インターフェース５０５を介して、記録部５０８にインストールすることができる。また、プログラムは、有線または無線の伝送媒体を介して、通信部５０９で受信し、記録部５０８にインストールすることができる。その他、プログラムは、ROM５０２や記録部５０８に、あらかじめインストールしておくことができる。

　なお、コンピュータが実行するプログラムは、本明細書で説明する順序に沿って時系列に処理が行われるプログラムであっても良いし、並列に、あるいは呼び出しが行われたとき等の必要なタイミングで処理が行われるプログラムであっても良い。

　また、本技術の実施の形態は、上述した実施の形態に限定されるものではなく、本技術の要旨を逸脱しない範囲において種々の変更が可能である。

　例えば、本技術は、１つの機能をネットワークを介して複数の装置で分担、共同して処理するクラウドコンピューティングの構成をとることができる。

　また、上述のフローチャートで説明した各ステップは、１つの装置で実行する他、複数の装置で分担して実行することができる。

　さらに、１つのステップに複数の処理が含まれる場合には、その１つのステップに含まれる複数の処理は、１つの装置で実行する他、複数の装置で分担して実行することができる。

　さらに、本技術は、以下の構成とすることも可能である。

（１）
　音源の指向性を表す指向性データをモデル化することにより得られたモデルデータを取得する取得部と、
　前記モデルデータに基づいて、前記指向性データを算出する算出部と
　を備える情報処理装置。
（２）
　前記モデルデータには、前記指向性データを１または複数の分布からなる混合モデルによりモデル化することで得られた、前記混合モデルを構成するモデルパラメータが含まれている
　（１）に記載の情報処理装置。
（３）
　前記１または複数の分布は、vMF分布とKent分布の少なくとも何れかを含む
　（２）に記載の情報処理装置。
（４）
　前記指向性データは、複数の各周波数ビンの指向性ゲインを含み、
　前記モデルデータには、１または複数の前記周波数ビンを含む周波数帯域であるバンドごとに、前記指向性ゲインの分布を表す前記混合モデルを構成する前記モデルパラメータが含まれている
　（２）または（３）に記載の情報処理装置。
（５）
　前記モデルデータには、前記周波数ビンにおける前記指向性ゲインのダイナミックレンジを示すスケールファクタと、前記周波数ビンにおける前記指向性ゲインの最小値とが含まれている
　（４）に記載の情報処理装置。
（６）
　前記モデルデータには、モデル化前の前記指向性データと、モデル化後の前記指向性データとの差分を示す差分情報が含まれており、
　前記算出部により算出された前記指向性データに、前記差分情報を加算する加算部をさらに備える
　（１）乃至（５）の何れか一項に記載の情報処理装置。
（７）
　前記差分情報は、ハフマン符号化されている
　（６）に記載の情報処理装置。
（８）
　前記指向性データは、複数の各周波数ビンの指向性ゲインを含み、
　前記算出部により算出された前記指向性データに基づいて補間処理を行うことで、新たな前記周波数ビンの前記指向性ゲインを算出する補間処理部をさらに備える
　（１）乃至（７）の何れか一項に記載の情報処理装置。
（９）
　前記指向性データは、複数の各データポイントにおける指向性ゲインを含み、
　前記算出部により算出された前記指向性データに基づいて補間処理を行うことで、新たな前記データポイントにおける前記指向性ゲインを算出する補間処理部をさらに備える
　（１）乃至（８）の何れか一項に記載の情報処理装置。
（１０）
　前記指向性データとオーディオデータとを畳み込む指向性畳み込み部をさらに備える
　（１）乃至（９）の何れか一項に記載の情報処理装置。
（１１）
　前記指向性データが畳み込まれた前記オーディオデータと、HRTFとを畳み込むHRTF畳み込み部をさらに備える
　（１０）に記載の情報処理装置。
（１２）
　前記１または複数の分布は、複素Bingham分布または複素watson分布を含む
　（２）に記載の情報処理装置。
（１３）
　前記モデルデータには、前記指向性データを球面調和関数展開によりモデル化することで得られた球面調和係数がモデルパラメータとして含まれている
　（１）に記載の情報処理装置。
（１４）
　前記モデルデータには、互いに異なる１または複数の方式により前記指向性データをモデル化することで得られたモデルパラメータが含まれている
　（１）に記載の情報処理装置。
（１５）
　前記方式は、１または複数の分布からなる混合モデルによりモデル化する方式、および球面調和関数展開によりモデル化する方式のうちの少なくとも何れかを含む
　（１４）に記載の情報処理装置。
（１６）
　前記モデルデータには、前記１または複数の方式によるモデル化後の前記指向性データと、モデル化前の前記指向性データとの差分を示す差分情報がさらに含まれている
　（１４）または（１５）に記載の情報処理装置。
（１７）
　前記差分情報は、ハフマン符号化されている
　（１６）に記載の情報処理装置。
（１８）
　前記差分情報の実部と虚部のそれぞれが個別にハフマン符号化されている
　（１７）に記載の情報処理装置。
（１９）
　前記モデルデータには、前記１または複数の方式によるモデル化後の前記指向性データと、モデル化前の前記指向性データとの差分を示す差分情報の空間上の位置間および周波数間のうちの少なくとも何れかの差分をハフマン符号化することで得られた差分符号データが含まれている
　（１４）または（１５）に記載の情報処理装置。
（２０）
　前記モデルデータには、前記差分情報の差分の実部と虚部のそれぞれを個別にハフマン符号化することで得られた前記差分符号データが含まれている
　（１９）に記載の情報処理装置。
（２１）
　前記モデルデータには、前記指向性データを所定の方式によりモデル化することで得られた前記モデルパラメータ、および前記所定の方式によるモデル化後の前記指向性データとモデル化前の前記指向性データとの差分を、前記所定の方式とは異なる方式によりモデル化することで得られた他のモデルパラメータが含まれている
　（１４）または（１５）に記載の情報処理装置。
（２２）
　前記モデルデータには、前記指向性データを所定の方式によりモデル化することで得られた前記モデルパラメータ、および前記所定の方式によるモデル化後の前記指向性データとモデル化前の前記指向性データとの比を、前記所定の方式とは異なる方式によりモデル化することで得られた他のモデルパラメータが含まれている
　（１４）または（１５）に記載の情報処理装置。
（２３）
　前記モデルデータには、前記指向性データをモデル化することで得られた前記モデルパラメータをさらにモデル化することで得られたモデルパラメータが含まれている
　（１４）または（１５）に記載の情報処理装置。
（２４）
　前記モデルデータには、周波数帯域ごとに異なる方式で前記指向性データをモデル化することで得られた前記モデルパラメータが含まれている
　（１４）乃至（２３）の何れか一項に記載の情報処理装置。
（２５）
　前記指向性データは、複数の各データポイントにおける指向性ゲインを含み、
　前記モデルデータには、前記データポイントの配置方式を示す情報、および前記データポイントの配置位置を特定するための情報が含まれている
　（１）乃至（２４）の何れか一項に記載の情報処理装置。
（２６）
　前記モデルデータには、前記音源の種別ごとの前記指向性データの優先度を示す優先度情報が含まれている
　（２５）に記載の情報処理装置。
（２７）
　前記データポイントの数は前記優先度に応じて変化し、
　前記算出部は、前記優先度情報を用いて前記データポイントの配置位置を特定する
　（２６）に記載の情報処理装置。
（２８）
　前記指向性データは、複数の各データポイントにおける周波数ビンごとの指向性ゲインを含み、
　前記モデルデータには、前記差分情報の並び替え後における、前記１または複数の方式によるモデル化後の前記指向性データの前記指向性ゲインと、モデル化前の前記指向性データの前記指向性ゲインとの差分を示す前記差分情報の前記データポイント間および前記周波数ビン間のうちの少なくとも何れかの差分の前記差分符号データが含まれている
　（１９）に記載の情報処理装置。
（２９）
　前記並び替えは、予め定められた順、前記データポイント若しくは前記周波数ビンの優先度の順、前記差分情報の昇順、または前記差分情報の降順への並び替えである
　（２８）に記載の情報処理装置。
（３０）
　前記モデルデータには、各前記周波数ビンにおける前記指向性ゲインのダイナミックレンジを示すスケールファクタと、各前記周波数ビンにおける前記指向性ゲインの最小値との少なくとも何れかをパラメトリック化して得られたパラメータが含まれている
　（４）に記載の情報処理装置。
（３１）
　前記モデルデータには、回転操作または対称操作のための操作関連情報が含まれており、
　前記算出部は、前記操作関連情報に基づいて、前記モデルパラメータに対する前記回転操作または前記対象操作を行うことで、回転または対称移動された前記モデルパラメータを算出するとともに、前記回転または対称移動された前記モデルパラメータにより得られる前記分布を用いて前記指向性データを算出する
　（２）乃至（５）の何れか一項に記載の情報処理装置。
（３２）
　前記算出部は、所定の前記バンドの前記混合モデルの出力値と、前記所定の前記バンドに隣接する他の前記バンドの前記混合モデルの出力値とを重み付き加算することで、所定の前記周波数ビンの前記指向性ゲインを算出する
　（４）または（５）に記載の情報処理装置。
（３３）
　前記算出部は、前記モデルパラメータから得られる複数の前記分布を、負の値を含む重みを用いて重み付き加算することで前記指向性データを算出する
　（２）乃至（５）の何れか一項に記載の情報処理装置。
（３４）
　情報処理装置が、
　音源の指向性を表す指向性データをモデル化することにより得られたモデルデータを取得し、
　前記モデルデータに基づいて、前記指向性データを算出する
　情報処理方法。
（３５）
　音源の指向性を表す指向性データをモデル化することにより得られたモデルデータを取得し、
　前記モデルデータに基づいて、前記指向性データを算出する
　処理をコンピュータに実行させるプログラム。
（３６）
　音源の指向性を表す指向性データを、１または複数の分布からなる混合モデルによりモデル化するモデル化部と、
　前記モデル化により得られた、前記混合モデルを構成するモデルパラメータを含むモデルデータを生成するモデルデータ生成部と
　を備える情報処理装置。
（３７）
　情報処理装置が、
　音源の指向性を表す指向性データを、１または複数の分布からなる混合モデルによりモデル化し、
　前記モデル化により得られた、前記混合モデルを構成するモデルパラメータを含むモデルデータを生成する
　情報処理方法。
（３８）
　音源の指向性を表す指向性データを、１または複数の分布からなる混合モデルによりモデル化し、
　前記モデル化により得られた、前記混合モデルを構成するモデルパラメータを含むモデルデータを生成する
　処理をコンピュータに実行させるプログラム。
（３９）
　音源の指向性を表す指向性データであって、複数の各データポイントにおける複数の各周波数ビンの指向性ゲインからなる指向性データに対して、前記指向性ゲインの前記データポイント間および前記周波数ビン間のうちの少なくとも何れかの差分を求めることにより得られた差分指向性データを取得する取得部と、
　前記差分指向性データに基づいて、前記指向性データを算出する算出部と
　を備える情報処理装置。
（４０）
　前記差分指向性データは、ハフマン符号化されており、
　前記算出部は、ハフマン符号化された前記差分指向性データの復号を行う
　（３９）に記載の情報処理装置。
（４１）
　前記差分指向性データの実部と虚部のそれぞれが個別にハフマン符号化されている
　（４０）に記載の情報処理装置。
（４２）
　前記差分指向性データは、前記指向性ゲインの並び替え後における、前記データポイント間および前記周波数ビン間のうちの少なくとも何れかの前記差分を求めることにより得られたものである
　（３９）乃至（４１）の何れか一項に記載の情報処理装置。
（４３）
　前記並び替えは、予め定められた順、前記データポイント若しくは前記周波数ビンの優先度の順、前記指向性ゲインの昇順、または前記指向性ゲインの降順への並び替えである　（４２）に記載の情報処理装置。
（４４）
　情報処理装置が、
　音源の指向性を表す指向性データであって、複数の各データポイントにおける複数の各周波数ビンの指向性ゲインからなる指向性データに対して、前記指向性ゲインの前記データポイント間および前記周波数ビン間のうちの少なくとも何れかの差分を求めることにより得られた差分指向性データを取得し、
　前記差分指向性データに基づいて、前記指向性データを算出する
　情報処理方法。
（４５）
　音源の指向性を表す指向性データであって、複数の各データポイントにおける複数の各周波数ビンの指向性ゲインからなる指向性データに対して、前記指向性ゲインの前記データポイント間および前記周波数ビン間のうちの少なくとも何れかの差分を求めることにより得られた差分指向性データを取得し、
　前記差分指向性データに基づいて、前記指向性データを算出する
　処理をコンピュータに実行させるプログラム。

　１１　サーバ，　２１　モデル化部，　２２　モデルデータ生成部，　２３　オーディオデータ符号化部，　５１　情報処理装置，　６１　取得部，　６２　分布モデル復号部，　６３　オーディオデータ復号部，　６４　レンダリング処理部，　８２　指向性データ算出部，　８３　差分情報復号部，　８４　加算部，　８５　周波数補間処理部，　８８　時間補間処理部，　８９　指向性畳み込み部，　９０　HRTF畳み込み部

Claims

　音源の指向性を表す指向性データをモデル化することにより得られたモデルデータを取得する取得部と、
　前記モデルデータに基づいて、前記指向性データを算出する算出部と
　を備える情報処理装置。
　前記モデルデータには、前記指向性データを１または複数の分布からなる混合モデルによりモデル化することで得られた、前記混合モデルを構成するモデルパラメータが含まれている
　請求項１に記載の情報処理装置。
　前記１または複数の分布は、vMF分布とKent分布の少なくとも何れかを含む
　請求項２に記載の情報処理装置。
　前記指向性データは、複数の各周波数ビンの指向性ゲインを含み、
　前記モデルデータには、１または複数の前記周波数ビンを含む周波数帯域であるバンドごとに、前記指向性ゲインの分布を表す前記混合モデルを構成する前記モデルパラメータが含まれている
　請求項２に記載の情報処理装置。
　前記モデルデータには、前記周波数ビンにおける前記指向性ゲインのダイナミックレンジを示すスケールファクタと、前記周波数ビンにおける前記指向性ゲインの最小値とが含まれている
　請求項４に記載の情報処理装置。
　前記モデルデータには、モデル化前の前記指向性データと、モデル化後の前記指向性データとの差分を示す差分情報が含まれており、
　前記算出部により算出された前記指向性データに、前記差分情報を加算する加算部をさらに備える
　請求項１に記載の情報処理装置。
　前記差分情報は、ハフマン符号化されている
　請求項６に記載の情報処理装置。
　前記指向性データは、複数の各周波数ビンの指向性ゲインを含み、
　前記算出部により算出された前記指向性データに基づいて補間処理を行うことで、新たな前記周波数ビンの前記指向性ゲインを算出する補間処理部をさらに備える
　請求項１に記載の情報処理装置。
　前記指向性データは、複数の各データポイントにおける指向性ゲインを含み、
　前記算出部により算出された前記指向性データに基づいて補間処理を行うことで、新たな前記データポイントにおける前記指向性ゲインを算出する補間処理部をさらに備える
　請求項１に記載の情報処理装置。
　前記指向性データとオーディオデータとを畳み込む指向性畳み込み部をさらに備える
　請求項１に記載の情報処理装置。
　前記指向性データが畳み込まれた前記オーディオデータと、HRTFとを畳み込むHRTF畳み込み部をさらに備える
　請求項１０に記載の情報処理装置。
　前記１または複数の分布は、複素Bingham分布または複素watson分布を含む
　請求項２に記載の情報処理装置。
　前記モデルデータには、前記指向性データを球面調和関数展開によりモデル化することで得られた球面調和係数がモデルパラメータとして含まれている
　請求項１に記載の情報処理装置。
　前記モデルデータには、互いに異なる１または複数の方式により前記指向性データをモデル化することで得られたモデルパラメータが含まれている
　請求項１に記載の情報処理装置。
　前記方式は、１または複数の分布からなる混合モデルによりモデル化する方式、および球面調和関数展開によりモデル化する方式のうちの少なくとも何れかを含む
　請求項１４に記載の情報処理装置。
　前記モデルデータには、前記１または複数の方式によるモデル化後の前記指向性データと、モデル化前の前記指向性データとの差分を示す差分情報がさらに含まれている
　請求項１４に記載の情報処理装置。
　前記差分情報は、ハフマン符号化されている
　請求項１６に記載の情報処理装置。
　前記差分情報の実部と虚部のそれぞれが個別にハフマン符号化されている
　請求項１７に記載の情報処理装置。
　前記モデルデータには、前記１または複数の方式によるモデル化後の前記指向性データと、モデル化前の前記指向性データとの差分を示す差分情報の空間上の位置間および周波数間のうちの少なくとも何れかの差分をハフマン符号化することで得られた差分符号データが含まれている
　請求項１４に記載の情報処理装置。
　前記モデルデータには、前記差分情報の差分の実部と虚部のそれぞれを個別にハフマン符号化することで得られた前記差分符号データが含まれている
　請求項１９に記載の情報処理装置。
　前記モデルデータには、前記指向性データを所定の方式によりモデル化することで得られた前記モデルパラメータ、および前記所定の方式によるモデル化後の前記指向性データとモデル化前の前記指向性データとの差分を、前記所定の方式とは異なる方式によりモデル化することで得られた他のモデルパラメータが含まれている
　請求項１４に記載の情報処理装置。
　前記モデルデータには、前記指向性データを所定の方式によりモデル化することで得られた前記モデルパラメータ、および前記所定の方式によるモデル化後の前記指向性データとモデル化前の前記指向性データとの比を、前記所定の方式とは異なる方式によりモデル化することで得られた他のモデルパラメータが含まれている
　請求項１４に記載の情報処理装置。
　前記モデルデータには、前記指向性データをモデル化することで得られた前記モデルパラメータをさらにモデル化することで得られたモデルパラメータが含まれている
　請求項１４に記載の情報処理装置。
　前記モデルデータには、周波数帯域ごとに異なる方式で前記指向性データをモデル化することで得られた前記モデルパラメータが含まれている
　請求項１４に記載の情報処理装置。
　前記指向性データは、複数の各データポイントにおける指向性ゲインを含み、
　前記モデルデータには、前記データポイントの配置方式を示す情報、および前記データポイントの配置位置を特定するための情報が含まれている
　請求項１に記載の情報処理装置。
　前記モデルデータには、前記音源の種別ごとの前記指向性データの優先度を示す優先度情報が含まれている
　請求項２５に記載の情報処理装置。
　前記データポイントの数は前記優先度に応じて変化し、
　前記算出部は、前記優先度情報を用いて前記データポイントの配置位置を特定する
　請求項２６に記載の情報処理装置。
　前記指向性データは、複数の各データポイントにおける周波数ビンごとの指向性ゲインを含み、
　前記モデルデータには、前記差分情報の並び替え後における、前記１または複数の方式によるモデル化後の前記指向性データの前記指向性ゲインと、モデル化前の前記指向性データの前記指向性ゲインとの差分を示す前記差分情報の前記データポイント間および前記周波数ビン間のうちの少なくとも何れかの差分の前記差分符号データが含まれている
　請求項１９に記載の情報処理装置。
　前記並び替えは、予め定められた順、前記データポイント若しくは前記周波数ビンの優先度の順、前記差分情報の昇順、または前記差分情報の降順への並び替えである
　請求項２８に記載の情報処理装置。
　前記モデルデータには、各前記周波数ビンにおける前記指向性ゲインのダイナミックレンジを示すスケールファクタと、各前記周波数ビンにおける前記指向性ゲインの最小値との少なくとも何れかをパラメトリック化して得られたパラメータが含まれている
　請求項４に記載の情報処理装置。
　前記モデルデータには、回転操作または対称操作のための操作関連情報が含まれており、
　前記算出部は、前記操作関連情報に基づいて、前記モデルパラメータに対する前記回転操作または前記対象操作を行うことで、回転または対称移動された前記モデルパラメータを算出するとともに、前記回転または対称移動された前記モデルパラメータにより得られる前記分布を用いて前記指向性データを算出する
　請求項２に記載の情報処理装置。
　前記算出部は、所定の前記バンドの前記混合モデルの出力値と、前記所定の前記バンドに隣接する他の前記バンドの前記混合モデルの出力値とを重み付き加算することで、所定の前記周波数ビンの前記指向性ゲインを算出する
　請求項４に記載の情報処理装置。
　前記算出部は、前記モデルパラメータから得られる複数の前記分布を、負の値を含む重みを用いて重み付き加算することで前記指向性データを算出する
　請求項２に記載の情報処理装置。
　情報処理装置が、
　音源の指向性を表す指向性データをモデル化することにより得られたモデルデータを取得し、
　前記モデルデータに基づいて、前記指向性データを算出する
　情報処理方法。
　音源の指向性を表す指向性データをモデル化することにより得られたモデルデータを取得し、
　前記モデルデータに基づいて、前記指向性データを算出する
　処理をコンピュータに実行させるプログラム。
　音源の指向性を表す指向性データを、１または複数の分布からなる混合モデルによりモデル化するモデル化部と、
　前記モデル化により得られた、前記混合モデルを構成するモデルパラメータを含むモデルデータを生成するモデルデータ生成部と
　を備える情報処理装置。
　情報処理装置が、
　音源の指向性を表す指向性データを、１または複数の分布からなる混合モデルによりモデル化し、
　前記モデル化により得られた、前記混合モデルを構成するモデルパラメータを含むモデルデータを生成する
　情報処理方法。
　音源の指向性を表す指向性データを、１または複数の分布からなる混合モデルによりモデル化し、
　前記モデル化により得られた、前記混合モデルを構成するモデルパラメータを含むモデルデータを生成する
　処理をコンピュータに実行させるプログラム。
　音源の指向性を表す指向性データであって、複数の各データポイントにおける複数の各周波数ビンの指向性ゲインからなる指向性データに対して、前記指向性ゲインの前記データポイント間および前記周波数ビン間のうちの少なくとも何れかの差分を求めることにより得られた差分指向性データを取得する取得部と、
　前記差分指向性データに基づいて、前記指向性データを算出する算出部と
　を備える情報処理装置。
　前記差分指向性データは、ハフマン符号化されており、
　前記算出部は、ハフマン符号化された前記差分指向性データの復号を行う
　請求項３９に記載の情報処理装置。
　前記差分指向性データの実部と虚部のそれぞれが個別にハフマン符号化されている
　請求項４０に記載の情報処理装置。
　前記差分指向性データは、前記指向性ゲインの並び替え後における、前記データポイント間および前記周波数ビン間のうちの少なくとも何れかの前記差分を求めることにより得られたものである
　請求項３９に記載の情報処理装置。
　前記並び替えは、予め定められた順、前記データポイント若しくは前記周波数ビンの優先度の順、前記指向性ゲインの昇順、または前記指向性ゲインの降順への並び替えである
　請求項４２に記載の情報処理装置。
　情報処理装置が、
　音源の指向性を表す指向性データであって、複数の各データポイントにおける複数の各周波数ビンの指向性ゲインからなる指向性データに対して、前記指向性ゲインの前記データポイント間および前記周波数ビン間のうちの少なくとも何れかの差分を求めることにより得られた差分指向性データを取得し、
　前記差分指向性データに基づいて、前記指向性データを算出する
　情報処理方法。
　音源の指向性を表す指向性データであって、複数の各データポイントにおける複数の各周波数ビンの指向性ゲインからなる指向性データに対して、前記指向性ゲインの前記データポイント間および前記周波数ビン間のうちの少なくとも何れかの差分を求めることにより得られた差分指向性データを取得し、
　前記差分指向性データに基づいて、前記指向性データを算出する
　処理をコンピュータに実行させるプログラム。