WO2014199536A1

WO2014199536A1 - オーディオ再生装置及びその方法

Info

Publication number: WO2014199536A1
Application number: PCT/JP2014/000868
Authority: WO
Inventors: 宮阪　修二; 一任阿部; アータントラン; ヨンウィシム; ゾンシャンリュー
Original assignee: パナソニック株式会社
Priority date: 2013-06-10
Filing date: 2014-02-19
Publication date: 2014-12-18
Also published as: JP6022685B2; CN106961645A; CN105264914A; US20160088393A1; JPWO2014199536A1; CN106961647B; CN105264914B; CN106961647A; US9788120B2; CN106961645B

Abstract

オーディオ信号とその音像を定位させる３次元空間における位置を示す再生位置情報とを含むオーディオオブジェクトを再生するオーディオ再生装置（１１０）であって、少なくとも１体のスピーカアレー（１０６）と、再生位置情報を、スピーカアレー（１０６）の位置を基準とした２次元座標軸上の位置情報である修正再生位置情報に変換する変換部（１０２）と、修正再生位置情報に応じてオーディオオブジェクトに含まれるオーディオ信号の音像を定位させる処理をする信号処理部（１０５）とを備える。

Description

オーディオ再生装置及びその方法

　本開示は、オーディオオブジェクトを、スピーカアレーを用いて再生する装置及びその方法に関する。特に、定位させる音像の３次元空間における位置を示す再生位置情報を含むオーディオオブジェクトを再生する装置及びその方法に関する。

　近年、デジタルテレビ放送受信機やＤＶＤプレーヤで５．１ｃｈのオーディオコンテンツを再生するものが多く開発、商品化されている。５．１ｃｈとは、前方左右チャネルと前方センターチャネル、およびサラウンドチャネルを左右に配置したチャネル設定である。さらに近年のブルーレイ（Ｂｌｕ－ｒａｙ（登録商標））プレーヤでは、バックサラウンドに左右のチャネルを追加した７．１ｃｈ構成のものもある。

　一方、画像の更なる大画面化、高精細化に伴い、オーディオの立体音響化の研究も盛んに行われている。たとえば、２２．２ｃｈのスピーカ配置を前提とした立体音響の研究が行われている。図１４は、現在、ＮＨＫ（日本放送協会）で研究開発が行われている２２．２ｃｈのオーディオ再生におけるスピーカ配置を示している。従来の２次元平面上（図１４では中段にあたる）にだけスピーカを配置したものと異なり、足元（下段）や天井（上段）にもスピーカを配置した３次元の構成となっている（非特許文献１）。

　また、映画館を３次元音響で特徴付ける取り組みも盛んに行われている（非特許文献２）。この場合も、スピーカを天井にも配置する３Ｄ（３次元）の構成となっている。また、コンテンツはオーディオオブジェクトとして符号化されている。オーディオオブジェクトとは、定位させる音像の３次元空間における位置を示す再生位置情報を伴ったオーディオ信号である。たとえば、音源（音像）がどの位置に定位しているかを（ｘ、ｙ、ｚ）の３軸で表した再生位置情報と、当該音源のオーディオ信号とを組みとして符号化した信号である。

　たとえば、弾丸や飛行機や飛んでいる鳥の鳴き声などをオーディオオブジェクト化する場合、時間とともに、再生位置情報が示す位置を時々刻々と遷移させる。この場合、再生位置情報は、遷移する方向を表すベクトル情報であってもよい。もちろん、ある特定の位置で発生した爆発音などの場合、再生位置情報は一定となる。

　このように、３次元にスピーカを配置することを前提として、再生位置情報を伴ったオーディオ信号を再生する研究開発がおこなわれているが、実際のホームユースやパーソナルユースでは、３次元にスピーカを配置することができない場合が多い。

　一方、スピーカを自由に配置できない環境化で、できるだけ臨場感の高いオーディオ再生を可能とする技術として、ＨＲＴＦ（頭部伝達関数；Ｈｅａｄ　Ｒｅｌａｔｅｄ　Ｔｒａｎｓｆｅｒ　Ｆｕｎｃｔｉｏｎ）、波面合成、ビームフォームなどの研究開発が行われている。

　ＨＲＴＦは、人の頭部周辺の音の伝播特性を模擬する伝達関数である。音がどちらの方向から聴こえているかという知覚は、ＨＲＴＦに影響されるといわれており、図１５に示したように、主に、両耳間の音圧差、両耳間に到達する音波の時間差によって影響される。逆にいえば、それを信号処理で人工的に制御することで、音が聞こえてくる方向を制御できる。詳しくは、非特許文献３で説明されている。また、前後及び上下方向の定位に関わる手がかりは、ＨＲＴＦの振幅スペクトルに含まれているといわれている。詳しくは特許文献１で説明されている。

　波面合成の基本的な動作原理は図１６の（ａ）に示される通りである。本来、音波は音源を中心とした同心円上に拡散するので（音源の位置にスピーカを配置しない限り）自然な音波を空間に生成することはできないが、複数のスピーカを列状に配置（つまり、スピーカアレーを形成）し、適切に音圧及び位相を制御することで、さも音源から音波が拡散しているかのような同心円状の波形の一部を空間上に生成できる。詳しくは、非特許文献４に説明されている。

　ビームフォームの基本的な動作原理は図１６の（ｂ）に示される通りである。波面合成と同様に、ビームフォームでも、スピーカアレーを用い、適切に音圧及び位相を制御することで、特定の位置の音圧レベルをその周囲より高くすることができる。それによって、さもその位置に音源が存在するかのような状態を再現できる。詳しくは、非特許文献５に説明されている。

国際公開第２００６／０３０６９２号

Ｆｉｒｓｔ　ｐｕｂｌｉｓｈｅｄ　ｉｎ　ＳＭＰＴＥ　Ｔｅｃｈｎｉｃａｌ　Ｃｏｎｆｅｒｅｎｃｅ　Ｐｕｂｌｉｃａｔｉｏｎ　ｉｎ　Ｏｃｔｏｂｅｒ　２００７Ｄｏｌｂｙ　Ａｔｍｏｓ　Ｃｉｎｅｍａ　Ｔｅｃｈｎｉｃａｌ　ＧｕｉｄｅｌｉｎｅｓＡｕｄｉｏ　Ｅｎｇ　Ｓｏｃ，Ｖｏｌ　４９，Ｎｏ　４，２００１　Ａｐｒｉｌ　Ｉｎｔｒｏｄｕｃｔｉｏｎ　ｔｏ　Ｈｅａｄ－Ｒｅｌａｔｅｄ　Ｔｒａｎｓｆｅｒ　Ｆｕｎｃｔｉｏｎｓ　（ＨＲＴＦｓ）：　Ｒｅｐｒｅｓｅｎｔａｔｉｏｎｓ　ｏｆ　ＨＲＴＦｓ　ｉｎ　Ｔｉｍｅ，Ｆｒｅｑｕｅｎｃｙ，ａｎｄ　ＳｐａｃｅＡｕｄｉｏ　Ｓｉｇｎａｌ　Ｐｒｏｃｅｓｓｉｎｇ　ｆｏｒ　Ｎｅｘｔ－Ｇｅｎｅｒａｔｉｏｎ　Ｍｕｌｔｉｍｅｄｉａ　Ｃｏｍｍｕｎｉｃａｔｉｏｎ　Ｓｙｓｔｅｍｓ，ｐｐ．３２３－３４２，Ｙ．Ａ．Ｈｕａｎｇ，Ｊ．Ｂｅｎｅｓｔｙ，Ｋｌｕｗｅｒ，Ｊａｎ．　２００４ＡＥＳ　１２７ｔｈ　Ｃｏｎｖｅｎｔｉｏｎ，Ｎｅｗ　Ｙｏｒｋ　ＮＹ，ＵＳＡ，２００９　Ｏｃｔｏｂｅｒ　９-１２　Ｐｈｙｓｉｃａｌ　ａｎｄ　Ｐｅｒｃｅｐｔｕａｌ　Ｐｒｏｐｅｒｔｉｅｓ　ｏｆ　Ｆｏｃｕｓｅｄ　Ｓｏｕｒｃｅｓ　ｉｎ　Ｗａｖｅ　Ｆｉｅｌｄ　Ｓｙｎｔｈｅｓｉｓ

　しかしながら、上記に示した２２．２ｃｈのような、天井にもスピーカを配置するような構成を、実際のホームユースやパーソナルユースで実現することは難しいという課題がある。

　スピーカを自由に配置できない場合でも音の臨場感を高める方法として、ＨＲＴＦ、波面合成、ビームフォームがあるが、ＨＲＴＦは、音の聴こえてくる方向を制御する方法として優れているが、知覚上そのように聴こえるように制御しているに過ぎず、実際の物理的な波面を再現しているわけではないので、受聴者と音源との距離感を再現することができない。逆に波面合成及びビームフォームは、実際の物理的な波面を再現できるので受聴者と音源との距離感を再現することができるが、受聴者の後方に音源を生成することはできない。これは、スピーカアレーから出力された音波が音像を結ぶ前に音波が受聴者に聴覚に達してしまうからである。

　また、上記従来のいずれの技術も、スピーカが配置されている２次元平面上で音を制御する技術であるので、オーディオオブジェクトに含まれる再生位置情報が３次元の空間情報として表現されている場合、再生位置情報を反映した信号処理ができない。

　本開示は、このような従来の課題に鑑みてなされたものであって、スピーカを自由に配置できない空間であっても、３次元の再生位置情報を含むオーディオオブジェクトを高い臨場感で再生できるオーディオ再生装置及びその方法を提供することを目的とする。

　上記の課題を解決するために、一実施形態に係るオーディオ再生装置は、オーディオ信号と前記オーディオ信号の音像を定位させる３次元空間における位置を示す再生位置情報とを含むオーディオオブジェクトを再生するオーディオ再生装置であって、音響信号を音響振動に変換する少なくとも１体のスピーカアレーと、前記再生位置情報を、前記スピーカアレーの位置を基準とした２次元座標軸上の位置情報である修正再生位置情報に変換する変換部と、前記修正再生位置情報に応じて前記オーディオオブジェクトに含まれる前記オーディオ信号の音像を定位させる処理をする信号処理部とを備える。

　これによれば、オーディオオブジェクトに含まれる３次元の再生位置情報がスピーカアレーの位置を基準とした２次元座標軸上の修正再生位置情報に変換され、修正後の修正再生位置情報に応じて音像が定位されるので、スピーカ配置に制約がある場合でも、オーディオオブジェクトを高い臨場感で再生できる。

　ここで、前記スピーカアレーを構成するスピーカ素子の並び方向をＸ軸、前記Ｘ軸と直交し、かつ、前記スピーカアレーが設置されている面である設置面と水平な方向をＹ軸、及び、前記Ｘ軸と直交し、かつ、前記設置面と垂直な方向をＺ軸としたとき、前記修正再生位置情報は、前記Ｘ軸と前記Ｙ軸とで構成された座標軸上の位置を指し、前記再生位置情報で特定される位置が（ｘ、ｙ、ｚ）であるとき、前記修正再生位置情報は前記ｘ、ｙに応じた値であってもよい。

　これによれば、再生位置情報で特定される位置が（ｘ、ｙ、ｚ）であるときに修正再生位置情報が前記ｘ、ｙに応じた値となるので、３次元にスピーカを配置できない空間であっても３次元の再生位置情報を含むオーディオオブジェクトを高い臨場感で再生できる。

　また、前記２次元座標におけるＹ座標では、前記スピーカアレーの背面方向がマイナス座標、前記スピーカアレーの前面方向がプラス座標であり、前記２次元座標におけるＸ座標では、前記スピーカアレーの中央から左右にそれぞれマイナス座標、プラス座標であるとき、前記修正再生位置情報の値は、前記ｘ、ｙの少なくとも一方に所定の値を乗じた値であってもよい。

　これによれば、修正再生位置情報の値は前記ｘ、ｙに所定の値を乗じた値となるので、感じられる空間の広さを仮想的に変えることができる。

　また、前記修正再生位置情報のｘ座標値は、前記スピーカアレーの幅に制限されてもよい。

　これによれば、修正再生位置情報のｘ座標値は前記スピーカアレーの幅に制限される値となるので、スピーカアレーの性能に適した信号処理ができる。

　また、前記信号処理部は、前記２次元座標軸上の位置に音像を構成するビームフォーム部であってもよい。

　これによれば、ビームフォーム部によって、目的の位置に強い音響振動が生成されるので、さもそこに音源が存在するかのような音場を生成することができる。

　また、前記２次元座標におけるＹ座標では、前記スピーカアレーの背面方向がマイナス座標、前記スピーカアレーの前面方向がプラス座標であり、前記信号処理部は、前記修正再生位置情報のｙ座標値が負の値である場合、Ｈｕｙｇｅｎｓの定理を利用した信号処理で波面合成してもよい。

　これによれば、修正再生位置情報のｙ座標値が負の値である場合、Ｈｕｙｇｅｎｓの定理を利用した信号処理で波面合成されるので、定位させる音像の目的位置がスピーカの背面であった場合でも、さもそこに音源が存在するかのような音場を生成することができる。

　また、前記修正再生位置情報は、前記スピーカアレーから出力される音響を受聴する受聴者の位置から見た前記再生位置情報が示す位置への方向角と、前記受聴者の位置から前記再生位置情報が示す位置までの距離とによって前記２次元座標軸上の位置を示してもよい。

　これによれば、修正再生位置情報は、受聴者の位置から見た再生位置情報が示す位置への方向角と、受聴者の位置から再生位置情報が示す位置までの距離とによって２次元座標軸上の位置を示すので、受聴者から聴いてどの方向どの距離に音源が存在するかを制御することができる。

　また、前記信号処理部は、ＨＲＴＦ（Ｈｅａｄ　Ｒｅｌａｔｅｄ　Ｔｒａｎｓｆｅｒ　Ｆｕｎｃｔｉｏｎ）を用いて前記音像を定位させる処理をし、前記ＨＲＴＦは、前記修正再生位置情報が示す位置の方向から音が聞こえるように設定されてもよい。

　これによれば、修正再生位置情報が示す位置の方向から音が聞こえるように設定されＨＲＴＦを用いて音像を定位させる処理を行われるので、受聴者から聴いたときの音源への方向を反映した再生ができる。

　また、前記信号処理部は、前記受聴者の位置と前記修正再生位置情報が示す位置との距離に応じて音量を調整してもよい。

　これによれば、受聴者の位置と修正再生位置情報が示す位置との距離に応じて音量が調整されるので、受聴者から聴いたときの音源への距離を反映した再生ができる。

　また、前記信号処理部は、前記修正再生位置情報が示す位置に応じて信号処理方式を変更してもよい。

　これによれば、修正再生位置情報が示す位置に応じて信号処理方式が変更されるので、目標の再生位置に応じた最適な信号処理方式を選択することができる。

　また、前記スピーカアレーを構成するスピーカ素子の並び方向をＸ軸、前記Ｘ軸と直交し、かつ、前記スピーカアレーが設置されている面である設置面と水平な方向をＹ軸、及び、前記Ｘ軸と直交し、かつ、前記設置面と垂直な方向をＺ軸とし、前記Ｙ軸における位置を示すＹ座標では、前記スピーカアレーの背面方向がマイナス座標、前記スピーカアレーの前面方向がプラス座標であり、前記信号処理部は、前記修正再生位置情報のｙ座標値が負の値である場合、Ｈｕｙｇｅｎｓの定理を利用した信号処理で波面合成し、前記修正再生位置情報のｙ座標値が受聴者の位置より前の正の値である場合、ビームフォームを利用した信号処理で音像を生成し、前記修正再生位置情報のｙ座標値が受聴者の位置より後ろの正の値である場合、ＨＲＴＦを利用した信号処理で音像を定位させてもよい。

　これによれば、修正再生位置情報のｙ座標値が負の値である場合、Ｈｕｙｇｅｎｓの定理を利用した信号処理で波面合成が行われ、修正再生位置情報のｙ座標値が受聴者の位置より前の正の値である場合、ビームフォームを利用した信号処理で音像が生成され、修正再生位置情報のｙ座標値が受聴者の位置より後ろの正の値である場合、ＨＲＴＦを利用した信号処理で音像が定位されるので、受聴者の位置より前方については目標の位置にあたかも音源があるかのような音響振動が生成され、受聴者の位置より後方についても知覚的にあたかもその方向から音が聞こえてくるような再生ができる。

　また、前記オーディオ再生装置は、少なくとも２体のスピーカアレーを備え、前記少なくとも２体のスピーカアレーが少なくとも２つの２次元座標を構成し、前記少なくとも２体のスピーカアレーのうちの一つのスピーカアレーを構成するスピーカ素子の並び方向をＸ軸、前記Ｘ軸と直交し、かつ、前記一つのスピーカアレーが設置されている面である設置面と水平な方向をＹ軸、及び、前記Ｘ軸と直交し、かつ、前記設置面と垂直な方向をＺ軸とし、前記再生位置情報で特定される位置が（ｘ、ｙ、ｚ）であるとき、前記信号処理部は、前記ｚの値に応じて前記少なくとも２体のスピーカアレーを制御してもよいし、前記２つの２次元座標が平行しているとき、前記信号処理部は、前記ｚの値が予め定められた値よりも大きい場合は、前記設置面に対して上側の２次元座標を構成しているスピーカアレーの音量を大きくし、前記ｚの値が予め定められた値よりも小さい場合は、前記設置面に対して下側の２次元座標を構成しているスピーカアレーの音量を大きくしてもよいし、前記２つの２次元座標が直交しているとき、前記信号処理部は、前記ｚの値が予め定められた値よりも大きい場合は、前記設置面に対して垂直の２次元座標を構成しているスピーカアレーを構成するスピーカ素子のうち、予め定められた位置よりも上方のスピーカ素子の音量を大きくし、前記ｚの値が予め定められた値よりも小さい場合は、前記設置面に対して垂直の２次元座標を構成しているスピーカアレーを構成するスピーカ素子のうち、予め定められた位置よりも下方のスピーカ素子の音量を大きくしてもよい。

　これによれば、オーディオ再生装置には、少なくとも２体のスピーカアレーを備えられ、再生位置情報で特定される位置（ｘ、ｙ、ｚ）のｚの値に応じて少なくとも２体のスピーカアレーが制御されるので、再生位置情報の高さ情報も制御でき、３次元の再生位置情報を含むオーディオオブジェクトが高い臨場感で再生される。

　また、オーディオ信号と前記オーディオ信号の音像を定位させる３次元空間における位置を示す再生位置情報とを含むオーディオオブジェクトを再生するオーディオ再生装置であって、前記オーディオオブジェクトは、所定の時間間隔ごとの前記オーディオ信号と前記再生位置情報とを含むオーディオフレームから構成され、前記オーディオ再生装置は、前記再生位置情報が欠落している場合には、過去に再生したオーディオフレームに含まれていた再生位置情報を、前記再生位置情報が欠落したオーディオフレームの再生位置情報として用いることで、前記オーディオオブジェクトに含まれるオーディオフレームを再生してもよい。

　これによれば、再生位置情報が欠落している場合には、過去に再生したオーディオフレームに含まれていた再生位置情報がオーディオフレームの再生位置情報として用いられるので、再生位置情報が欠落している場合でも、自然な音場再生ができる、或いは、オーディオオブジェクトが動いていないときに当該オーディオオブジェクトを記録あるいは伝送する際の情報量を減らすことができる。

　なお、上記課題を達成する他の形態として、上記のようなオーディオ再生装置だけでなく、オーディオ再生方法、オーディオ再生方法を実行するプログラム、そのプログラムが記録されたＤＶＤ等のコンピュータ読み取り可能な記録媒体であってもよい。

　本実施の形態に係るオーディオ再生装置及びその方法によれば、スピーカを自由に配置できない空間であっても、３次元の再生位置情報を含むオーディオオブジェクトを高い臨場感で再生できる。

図１は、実施の形態におけるオーディオ再生装置の構成を示す図である。図２は、オーディオオブジェクトの構成を示す図である。図３は、スピーカアレーの形状の一例を示す図である。図４Ａは、スピーカアレーと２次元座標軸との関係を示す図である。図４Ｂは、別の形態のスピーカアレーと２次元座標軸との関係を示す図である。図５は、３次元の再生位置情報と修正再生位置情報（ｘ，ｙ）との関係を示す図である。図６は、３次元の再生位置情報と修正再生位置情報（方向，距離）との関係を示す図である。図７は、修正再生位置情報と信号処理方式との関係を示す図である。図８は、本実施の形態のオーディオ再生装置の主要な動作を示すフローチャートである。図９は、本実施の形態のオーディオ再生装置の動作のうち、オーディオフレームに含まれる再生位置情報の取り扱いに関する動作を示すフローチャートである。図１０は、オーディオオブジェクトの位置と信号処理方式との関係を示す図である。図１１は、オーディオオブジェクトが頭上を通過する場合の信号処理方式を示す図である。図１２は、２つのスピーカアレーを用いた、実施の形態のバリエーションを示す図である。図１３は、３つのスピーカアレーを用いた、実施の形態のバリエーションを示す図である。図１４は、従来技術における２２．２ｃｈのスピーカ配置の一例を示す図である。図１５は、従来技術におけるＨＲＴＦの原理を示す図である。図１６は、従来技術における波面合成及びビームフォームの原理を示す図である。

　以下、オーディオ再生装置及びその方法の実施の形態について図面を参照しながら説明する。

　なお、以下で説明する実施の形態は、いずれも好ましい一具体例を示すものである。以下の実施の形態で示される数値、形状、構成要素、構成要素の配置位置及び接続形態、動作順序などは、一例であり、本開示を限定する主旨ではない。また、以下の実施の形態における構成要素のうち、本開示の最上位概念を示す独立請求項に記載されていない構成要素については、より好ましい形態を構成する任意の構成要素として説明される。

　図１は本実施の形態におけるオーディオ再生装置１１０の構成を示す図である。このオーディオ再生装置１１０は、オーディオ信号（ここでは、オーディオ符号化信号）とそのオーディオ信号の音像を定位させる３次元空間における位置を示す再生位置情報とを含むオーディオオブジェクトを再生するオーディオ再生装置であって、オーディオオブジェクト分離部１００、設定部１０１、変換部１０２、選択部１０３、復号化部１０４、信号処理部１０５、及び、スピーカアレー１０６を備える。

　図１において、オーディオオブジェクト分離部１００は、再生位置情報とオーディオ符号化信号とからなるオーディオオブジェクトから、再生位置情報とオーディオ符号化信号とを分離する処理部である。

　設定部１０１は、スピーカアレー１０６が設置されている位置に応じて仮想的に２次元座標軸（つまり、スピーカアレー１０６の位置を基準とした２次元座標軸）を設定する処理部である。

　変換部１０２は、オーディオオブジェクト分離部１００で分離された再生位置情報を、設定部１０１で設定された２次元座標軸上の位置情報（２次元情報）である修正再生位置情報に変換する処理部である。

　選択部１０３は、変換部１０２で生成された修正再生位置情報と、設定部１０１で設定された２次元座標軸と、スピーカアレー１０６から出力される音響を受聴する受聴者の位置（あるいは、このオーディオ再生装置１１０が予定している受聴位置）とから、信号処理部１０５で採用すべき信号処理方式を選択する処理部である。

　復号化部１０４は、オーディオオブジェクト分離部１００で分離されたオーディオ符号化信号を復号化し、オーディオ信号（音響信号）を生成する処理部である。

　信号処理部１０５は、変換部１０２での変換で得られた修正再生位置に応じて、復号化部１０４での復号化で得られたオーディオ信号の音像を定位させる処理をする処理部であり、ここでは、選択部１０３で選択された信号処理方式で処理を行う。

　スピーカアレー１０６は、前記信号処理部からの出力信号（音響信号）を音響振動に変換する少なくとも１体のスピーカアレー（列状に並べられた複数のスピーカ素子の集まり）である。

　なお、オーディオオブジェクト分離部１００、設定部１０１、変換部１０２、選択部１０３、復号化部１０４、信号処理部１０５は、典型的には、半導体集積回路等の電子回路によってハードウェア的に実現されるが、ＣＰＵ、ＲＯＭ及びＲＡＭ等を備えるコンピュータで実行されるプログラムによってソフトウェア的に実現されてもよい。

　以上のように構成された本実施の形態におけるオーディオ再生装置１１０の動作について以下説明する。

　まず、オーディオオブジェクト分離部１００は、再生位置情報とオーディオ符号化信号とからなるオーディオオブジェクトを再生位置情報とオーディオ符号化信号とに分離する。オーディオオブジェクトは、たとえば、図２に示すような構成をもっている。すなわち、オーディオオブジェクトは、オーディオ符号化信号と当該オーディオ符号化信号の音像を定位させる３次元空間における位置を示す再生位置情報との組である。それらの情報（オーディオ符号化信号及び再生位置情報）が所定の時間間隔のオーディオフレーム単位で符号化されてオーディオオブジェクトを構成している。ここで再生位置情報は、天井にもスピーカを配置することを前提にしている３次元情報（３次元空間における位置を示す情報）である。なお、再生位置情報は、必ずしも全てのオーディオフレーム単位で挿入されている必要はなく、それが欠落しているオーディオフレームでは、オーディオオブジェクト分離部１００によって、過去に再生したオーディオフレームに含まれていた再生位置情報が用いられる。このような再生位置情報の再利用は、オーディオ再生装置１１０が備える記憶部を利用することで実現できる。

　さて、オーディオオブジェクト分離部１００では、図２に示したようなオーディオオブジェクトから再生位置情報とオーディオ符号化信号とを取り出す。

　一方、設定部１０１は、スピーカアレー１０６が設置されている位置に応じて仮想的に２次元座標軸を設定する。スピーカアレー１０６の概観は、例えば図３に示される通りである。すなわち、複数のスピーカ素子を並べたものである。設定部１０１は、図４Ａに示すように、スピーカアレー１０６が設置されている位置に応じて仮想的に２次元座標軸（スピーカアレーの位置を基準とした２次元座標軸）を設定する。ここでは、設定部１０１は、スピーカアレー１０６を構成するスピーカ素子の並び方向をＸ軸、Ｘ軸と直交し、かつ、スピーカアレー１０６が設置されている面である設置面と水平な方向をＹ軸とするＸＹ面を２次元座標軸として設定する。なお、Ｙ軸における位置を示すＹ座標では、スピーカアレー１０６の背面方向がマイナス座標、スピーカアレー１０６の前面方向がプラス座標であり、Ｘ軸におけるＸ座標では、スピーカアレー１０６の中央から左右にそれぞれマイナス座標、プラス座標に設定される。なお、スピーカアレーは直線状に配置されている必要はなく、例えば図４Ｂに示すように、アーチ状配置されていてもよい。図４Ｂでは個々のスピーカユニット（スピーカ素子）はいずれも正面を向いているように描かれているが、必ずしもその必要はなく、個々のスピーカユニット（スピーカ素子）が放射状に向くように角度が調整されて配置されていてもよい。

　次に、変換部１０２は、上記３次元の再生位置情報を２次元情報である修正再生位置情報に変換する。本実施の形態では、図４Ａ及び図４Ｂに示したようなＸ軸及びＹ軸からなる２次元座標が設定されているので、もともと、再生位置情報は、当該Ｘ軸及びＹ軸からなる２次元座標（つまり、設置面）に直交するＺ軸を有する３次元座標での位置にマッピングされている。いま、マッピング後の当該再生位置情報が示す位置を（ｘ１，ｙ１，ｚ１）とする。変換部１０２は、この位置情報を２次元の位置情報に変換し修正再生位置情報を生成する。

　３次元の再生位置情報から２次元の修正再生位置情報への変換は、例えば図５に示したような方法でおこなわれる。ここでは、オーディオオブジェクト１のように、オーディオオブジェクト１の再生位置情報が示す位置を（ｘ１，ｙ１，ｚ１）とすると、それに対応する修正再生位置情報が示す位置は、（ｘ１，ｙ１）となる。なお、修正再生位置情報が示す位置は、オーディオオブジェクト２のように、再生位置情報が示す位置（ｘ２，ｙ２，ｚ２）に対応するものの、必ずしもＸ座標値及びＹ座標値と同じ位置（ｘ２，ｙ２）でなくてもよい。例えば、図５に示している修正再生位置情報２が示す位置（ｘ２，ｙ２＊α）のように、１以上の値α（所定値）をＸ座標値及びＹ座標値の少なくとも一方に乗じることで、実際に再生位置情報で指示されている値より大きな値にしてより広い音響空間を演出してもよい。この例では、Ｙ軸方向の値が誇張されるので、奥行き方向の空間が拡大したかのような音響効果が期待できる。逆にＸ軸座標は、スピーカアレー１０６の幅の制約に応じて１より小さい値β（所定値）を乗じてもよい（図５には図示していない。）。つまり、Ｘ座標値は、スピーカアレー１０６の幅に制限されてもよい（スピーカアレー１０６の幅の範囲内の値であってもよい）。

　３次元の再生位置情報を２次元の修正再生位置情報に変換する他の方法として、図６に示した方法でもよい。すなわち、修正再生位置情報として、受聴者からみたオーディオオブジェクト（再生位置情報が示す位置）の方向と距離の情報に変換するようにしてもよい。つまり、修正再生位置情報は、スピーカアレー１０６から出力される音響を受聴する受聴者の位置から見た再生位置情報が示す位置への方向角と、受聴者の位置から再生位置情報が示す位置までの距離と示す極座標であってもよい。オーディオオブジェクト１の例では、オーディオオブジェクト１の再生位置情報が（ｘ１、ｙ１、ｚ１）であるとき、受聴者の位置から見た位置（ｘ１、ｙ１、ｚ１）への方向角θ１と、受聴者の位置から位置（ｘ１、ｙ１、ｚ１）までの距離ｒ１とすると、それに対応する修正再生位置情報１が（θ１、ｒ１’）で表わされている。ここで、ｒ１’はｒ１に依存して定まる値である。また、オーディオオブジェクト２の例では、オーディオオブジェクト２の再生位置情報が（ｘ２、ｙ２、ｚ２）であるとき、受聴者の位置から見た位置（ｘ２、ｙ２、ｚ２）への方向角θ２と、受聴者の位置から位置（ｘ２、ｙ２、ｚ２）までの距離ｒ２とすると、それに対応する修正再生位置情報２が（θ２、ｒ２’）で表わされている。ここで、ｒ２’はｒ２に依存して定まる値である。これ（修正再生位置情報の極座標による表現）は、音像定位の方法としてＨＲＴＦを用いる場合、ＨＲＴＦのフィルタ係数は、受聴者からの方位の情報を手がかりにして設定されるので、信号処理を容易にさせる。

　なお、図６において、ｒ１’はｒ１に応じて決定されるが、θ１が０°に近いほどｒ１に近い値になり、θ１が９０°に近いほどｒ１より小さな値になるように制御してもよい。

　また、信号処理部１０５は、修正再生位置情報が示す位置の方向から音が聞こえるように設定されＨＲＴＦを用いて音像を定位させる処理をしてもよい。これにより、受聴者から聴いてどの方向どの距離に音源が存在するかを制御することができる。さらに、信号処理部１０５は、受聴者の位置と修正再生位置情報が示す位置との距離（ｒ１’、ｒ２’等）に応じて音量を調整してもよい。これにより、受聴者から聴いたときの音源への距離を反映した再生ができる。

　次に、選択部１０３は、変換部１０２で生成された修正再生位置情報と設定部１０１で設定された２次元座標軸と受聴者の位置（あるいは、このオーディオ再生装置１１０が予め定めている受聴位置）とから信号処理部１０５で採用すべき信号処理方式を選択する。図７にその一例を示した。例えば、オーディオオブジェクト１に対しては（修正再生位置情報のｙ座標値が受聴者の位置より前の正の値である場合）、修正再生位置情報１の位置にビームフォームで音像を合成する。これは、音源の再生位置が、スピーカアレー１０６の前方で、かつ、受聴者の前方の場合、ビームフォームによって音像を結ぶことが可能だからである。また、例えば、オーディオオブジェクト２に対しては（修正再生位置情報のｙ座標値が負の値である場合）、修正再生位置情報２の位置を音源としたＨｕｙｇｅｎｓの原理に基づいた波面合成を行う。これは、音源の再生位置が、スピーカアレー１０６の後方の場合、波面合成によってさもそこに音源が存在するかのような音響効果を作り出すことができるからである。また、例えば、オーディオオブジェクト３に対しては（修正再生位置情報のｙ座標値が受聴者の位置より後ろの正の値である場合）、修正再生位置情報３で示した方向（θ１）から音が聞こえているかのような音像定位を、ＨＲＦＴを用いて実現する。これは、音源の再生位置が、受聴者の後方の場合、ビームフォームや波面合成が効果を発揮しないので、ＨＲＦＴを用いる方法を選択する。ＨＲＴＦを用いた場合、方向は精度よく再現できるが、距離感は再現できないので、音源までの距離ｒ１に応じて音量を制御するなどしてもよい。

　さて、一方、オーディオオブジェクト分離部１００で分離されたオーディオ符号化信号は復号化部１０４でオーディオＰＣＭ信号に復号化される。これはオーディオ符号化信号のコーデック方式におけるデコーダを用いればよい。

　このようにして復号化されたオーディオＰＣＭ信号は、信号処理部１０５において、選択部１０３によって選択された信号処理方式で処理される。つまり、信号処理部１０５は、修正再生位置情報のｙ座標値が負の値である場合、Ｈｕｙｇｅｎｓの定理を利用した信号処理で波面合成し、修正再生位置情報のｙ座標値が受聴者の位置より前の正の値である場合、ビームフォームを利用した信号処理で音像を生成し、修正再生位置情報のｙ座標値が受聴者の位置より後ろの正の値である場合、ＨＲＴＦを利用した信号処理で音像を定位させる。

　なお、本実施の形態では、信号処理方式は、ビームフォーム、波面合成、及び、ＨＲＴＦのいずれかであるが、いずれの信号処理方式であっても、より具体的な実現方法としては、従来から用いられている信号処理方式をもちいればよい。

　最後に、スピーカアレー１０６は、信号処理部１０５からの出力信号（音響信号）を音響振動に変換する。

　図８は、本実施の形態のオーディオ再生装置１１０の主要な動作を示すフローチャートである。

　まず、オーディオオブジェクト分離部１００は、オーディオオブジェクトから３次元の再生位置情報とオーディオ符号化信号とを分離する（Ｓ１０）。

　続いて、変換部１０２は、オーディオオブジェクト分離部１００で分離された３次元の再生位置情報を、スピーカアレー１０６の位置を基準とした２次元座標軸上の位置情報（２次元情報）である修正再生位置情報に変換する（Ｓ１１）。

　次に、選択部１０３は、変換部１０２で生成された修正再生位置情報と、設定部１０１で設定された２次元座標軸と、スピーカアレー１０６から出力される音響を受聴する受聴者の位置（あるいは、このオーディオ再生装置１１０が予定している受聴位置）とから、信号処理部１０５で採用すべき信号処理方式を選択する（Ｓ１２）。

　最後に、信号処理部１０５は、変換部１０２での変換で得られた修正再生位置に応じて、オーディオオブジェクト分離部１００で分離され復号化部１０４で復号化されたオーディオ信号の音像を定位させる処理をする（Ｓ１３）。このとき、信号処理部１０５は、選択部１０３で選択された信号処理方式で処理を行う。

　これにより、オーディオオブジェクトに含まれる３次元の再生位置情報はスピーカアレーの位置を基準とした２次元座標軸上の修正再生位置情報に変換され、修正後の修正再生位置情報に応じて音像が定位されるので、スピーカ配置に制約がある場合でも、オーディオオブジェクトが高い臨場感で再生される。

　なお、図８では、主要な動作ステップとして、４つのステップＳ１０～Ｓ１３が示されたが、最低限のステップとしては、変換ステップＳ１１と信号処理ステップＳ１３とが実行されればよい。これら２つのステップによって、３次元の再生位置情報が２次元座標軸上の修正再生位置情報に変換されるので、スピーカを自由に配置できない空間であっても３次元の再生位置情報を含むオーディオオブジェクトが高い臨場感で再生され得る。

　また、逆に、本実施の形態のオーディオ再生装置１１０の動作として、図８に示されたステップＳ１０～Ｓ１３に加えて、設定部１０１の動作、及び、復号化部１０４の動作が追加されてもよい。

　図９は、本実施の形態のオーディオ再生装置１１０の動作のうち、オーディオフレームに含まれる再生位置情報の取り扱いに関する動作を示すフローチャートである。ここでは、オーディオオブジェクトに含まれるオーディオフレーム毎に行われる再生位置情報に関する動作が示されている。

　オーディオオブジェクト分離部１００は、処理対象のオーディオフレーム中に再生位置情報が欠落しているか否かを判断する（Ｓ２０）。

　その結果、再生位置情報が欠落していると判断された場合には（Ｓ２０でＹｅｓ）、オーディオオブジェクト分離部１００によって、過去に再生したオーディオフレームに含まれていた再生位置情報が、処理対象のオーディオフレームの再生位置情報として用いられ、その再生位置情報に従って（２次元の修正再生位置情報に変換等された後に）、信号処理部１０５で信号処理が行われる（Ｓ２１）。

　一方、再生位置情報が欠落していないと判断された場合には（Ｓ２０でＮｏ）、オーディオオブジェクト分離部１００によって、処理対象のオーディオフレームに含まれていた再生位置情報が分離され、その再生位置情報に従って（２次元の修正再生位置情報に変換等された後に）、信号処理部１０５で信号処理が行われる（Ｓ２２）。

　これにより、再生位置情報が欠落している場合であっても、過去に再生したオーディオフレームに含まれていた再生位置情報が用いられるので、自然な音場再生ができる、或いは、オーディオオブジェクトが動いていないときに当該オーディオオブジェクトを記録あるいは伝送する際の情報量を減らすことができる。

　なお、図８及び図９のフローチャート及びその変形例に係る手順は、その手順が記述されたプログラムとして実現され、プロセッサによって実行され得る。

　さて、本実施の形態では、修正再生位置情報に応じて３つの信号処理方式の中から１つの方法が選択された。図１０の（ａ）は、それを整理した図である。修正再生位置情報がスピーカアレーに後方である場合はＨｕｙｇｅｎｓの原理による波面合成、スピーカアレーの前方で受聴者の前方の場合はビームフォームによる方法、受聴者の後方の場合はＨＲＴＦによる方法が用いられる。図１０の（ｂ）は、オーディオオブジェクト（オーディオオブジェクトに含まれる再生位置情報が示す位置）が時間とともに移動した場合のそれぞれの境界線付近での信号処理方式を示している。例えば、修正再生位置情報がスピーカアレーのライン近傍の場合は、信号処理部１０５は、波面合成の方法による出力信号とビームフォームの方法による出力信号とを所定の割合で混合した信号を生成する。同様に受聴者近傍では、信号処理部１０５は、ビームフォームの方法による出力信号とＨＲＴＦの方法による出力信号とを所定の割合で混合した信号を生成する。

　また、本実施の形態では、修正再生位置情報に応じて３つの信号処理方式の中から１つの方法を選択されたが、ＨＲＴＦの方法は、修正再生位置情報がいずれの位置であっても選択されてもよい。それは、Ｈｕｙｇｅｎｓの原理による波面合成では、スピーカの前方に音像を定位させることができず、ビームフォームでは、スピーカの後方やリスナーの後方に音像を定位させることができないのに対し、ＨＲＴＦは、両耳間の位相差情報やレベル差情報、さらに頭部周辺の音響伝達特性を模擬することで、どのような制御も可能であるからである。図１１は、オーディオオブジェクト（オーディオオブジェクトに含まれる再生位置情報が示す位置）がリスナーの頭上を通過するような場合のＨＲＴＦが狙う位置情報の軌跡を示している。まさにオーディオオブジェクト（オーディオオブジェクトに含まれる再生位置情報が示す位置）がリスナーの頭上に差し掛かったときは、頭部の周囲を回りこむように制御する。そうすることによって、頭上周辺での臨場感を高めることができる。

　また、実施の形態では、Ｚ軸方向の制御について言及していないが、上下方向の定位に関わる手がかりは、頭部周辺の音響伝達関数の振幅スペクトルに含まれているという研究成果（特許文献１）を活用し、ＨＲＴＦにその要素を加えてもよい。

　また、Ｚ軸方向の制御については、スピーカアレーを複数用いることで、複数の平面を構成し、Ｚ軸方向を制御してもよい。図１２は２つのスピーカアレー１０６ａ及び１０６ｂを用いたバリエーション、図１３は３つのスピーカアレー１０６ａ～１０６ｃを用いたバリエーション、をそれぞれ示している。

　図１２及び図１３に示される例では、オーディオ再生装置は、少なくとも２体のスピーカアレーを備え、それら少なくとも２体のスピーカアレーが少なくとも２つの２次元座標を構成し、再生位置情報で特定される位置が（ｘ、ｙ、ｚ）であるとき、信号処理部１０５は、上記ｚの値に応じて少なくとも２体のスピーカアレーを制御する。具体的には、上記２つの２次元座標が平行しているとき、信号処理部１０５は、上記ｚの値が予め定められた値よりも大きい（あるいは、以上である）場合は、ＸＹ面（設置面）に対して上側の２次元座標を構成しているスピーカアレーの音量を大きくし、上記ｚの値が予め定められた値よりも小さい（あるいは、以下である）場合は、ＸＹ面（設置面）に対して下側の２次元座標を構成しているスピーカアレーの音量を大きくする。

　一方、上記２つの２次元座標が直交しているとき、信号処理部１０５は、上記ｚの値が予め定められた値よりも大きい（あるいは、以上である）場合は、ＸＹ面（設置面）に対して垂直の２次元座標を構成しているスピーカアレーを構成するスピーカ素子のうち、予め定められた位置よりも上方のスピーカ素子の音量を大きくし、上記ｚの値が予め定められた値よりも小さい（あるいは、以下である）場合は、ＸＹ面（設置面）に対して垂直の２次元座標を構成しているスピーカアレーを構成するスピーカ素子のうち、予め定められた位置よりも下方のスピーカ素子の音量を大きくする。

　このように、オーディオ再生装置１１０が少なくとも２体のスピーカアレーを備える場合には、再生位置情報で特定される位置（ｘ、ｙ、ｚ）のｚの値に応じてそれら少なくとも２体のスピーカアレーが制御されるので、再生位置情報の高さ情報も制御でき、３次元の再生位置情報を含むオーディオオブジェクトが高い臨場感で再生される。

　上記のように、本実施の形態におけるオーディオ再生装置１１０は、音響信号を音響振動に変換する少なくとも１体のスピーカアレー１０６と、３次元の再生位置情報をスピーカアレー１０６の位置を基準とした２次元座標軸上の位置情報（修正再生位置情報）に変換する変換部１０２と、修正再生位置に応じてオーディオオブジェクトの音像を定位させるように処理する信号処理部１０５とを備えることで、３次元の再生位置情報を伴ったオーディオオブジェクトを、天井スピーカを設置できない等のスピーカを自由に配置できない環境であっても、可能な限り良好な臨場感で再生することができることとなる。

　以上、本開示に係るオーディオ再生装置について、実施の形態に基づいて説明したが、本開示に係るオーディオ再生装置は、この実施の形態に限定されない。本開示の趣旨を逸脱しない限り、当業者が思いつく各種変形を本実施の形態に施したものや、異なる実施の形態における構成要素を組み合わせて構築される形態であってもよい。

　尚、本実施の形態では、設定部１０１を備えたが、スピーカアレーの設置位置があらかじめ確定している場合は設定部１０１が不要であることは言うまでもない。

　また、本実施の形態では、選択部１０３に受聴者位置情報を入力するようにしているが、受聴者の位置があらかじめ確定している、あるいは、受聴者の位置として本装置があらかじめ想定している位置が固定である場合は、それ（受聴者位置情報の入力）が不要であることは言うまでもない。

　あるいは、信号処理方式が固定の場合（たとえば常にＨＲＴＦで処理すると決まっている場合は）選択部１０３が不要であることは言うまでもない。

　また、本実施の形態では、復号化部１０４を備えたが、オーディオ符号化信号が単純なＰＣＭ信号である場合、つまり、オーディオオブジェクトに含まれるオーディオ信号が符号化されていない場合には、復号化部１０４が不要であることは言うまでもない。

　また、本実施の形態では、オーディオオブジェクト分離部１００が備えられたが、オーディオ信号と再生位置情報とが分離された構造のオーディオオブジェクトがオーディオ再生装置１１０に入力される場合には、オーディオオブジェクト分離部１００が不要であるのは言うまでもない。

　また、スピーカアレーはスピーカ素子が直線状に配置されたものでなくてもよく、例えばアーチ状（弧）であってもよい。またスピーカ素子の間隔は一定でなくてもよい。本開示では、スピーカアレーの形状について限定するものでない。

　本開示にかかるオーディオ再生装置は、スピーカアレーを備えるオーディオ再生装置として、特に、３次元にスピーカを配置できない空間であっても３次元の位置情報を含むオーディオオブジェクトを高い臨場感で再生できるので、幅広くオーディオ信号を再生する機器に利用できる。

　１００　オーディオオブジェクト分離部
　１０１　設定部
　１０２　変換部
　１０３　選択部
　１０４　復号化部
　１０５　信号処理部
　１０６、１０６ａ～１０６ｃ　スピーカアレー
　１１０　オーディオ再生装置

Claims

　オーディオ信号と前記オーディオ信号の音像を定位させる３次元空間における位置を示す再生位置情報とを含むオーディオオブジェクトを再生するオーディオ再生装置であって、
　音響信号を音響振動に変換する少なくとも１体のスピーカアレーと、
　前記再生位置情報を、前記スピーカアレーの位置を基準とした２次元座標軸上の位置情報である修正再生位置情報に変換する変換部と、
　前記修正再生位置情報に応じて前記オーディオオブジェクトに含まれる前記オーディオ信号の音像を定位させる処理をする信号処理部と、
　を備えるオーディオ再生装置。
　前記スピーカアレーを構成するスピーカ素子の並び方向をＸ軸、前記Ｘ軸と直交し、かつ、前記スピーカアレーが設置されている面である設置面と水平な方向をＹ軸、及び、前記Ｘ軸と直交し、かつ、前記設置面と垂直な方向をＺ軸としたとき、
　前記修正再生位置情報は、前記Ｘ軸と前記Ｙ軸とで構成された座標軸上の位置を指し、
　前記再生位置情報で特定される位置が（ｘ、ｙ、ｚ）であるとき、前記修正再生位置情報は前記ｘ、ｙに応じた値である
　請求項１記載のオーディオ再生装置。
　前記２次元座標におけるＹ座標では、前記スピーカアレーの背面方向がマイナス座標、前記スピーカアレーの前面方向がプラス座標であり、前記２次元座標におけるＸ座標では、前記スピーカアレーの中央から左右にそれぞれマイナス座標、プラス座標であるとき、前記修正再生位置情報の値は、前記ｘ、ｙの少なくとも一方に所定の値を乗じた値である
　請求項２記載のオーディオ再生装置。
　前記修正再生位置情報のｘ座標値は、前記スピーカアレーの幅に制限される
　請求項２又は３記載のオーディオ再生装置。
　前記信号処理部は、前記２次元座標軸上の位置に音像を構成するビームフォーム部である
　請求項１から４のいずれか１項に記載のオーディオ再生装置。
　前記２次元座標におけるＹ座標では、前記スピーカアレーの背面方向がマイナス座標、前記スピーカアレーの前面方向がプラス座標であり、
　前記信号処理部は、前記修正再生位置情報のｙ座標値が負の値である場合、Ｈｕｙｇｅｎｓの定理を利用した信号処理で波面合成する
　請求項２記載のオーディオ再生装置。
　前記修正再生位置情報は、前記スピーカアレーから出力される音響を受聴する受聴者の位置から見た前記再生位置情報が示す位置への方向角と、前記受聴者の位置から前記再生位置情報が示す位置までの距離とによって前記２次元座標軸上の位置を示す
　請求項１記載のオーディオ再生装置。
　前記信号処理部は、ＨＲＴＦ（Ｈｅａｄ　Ｒｅｌａｔｅｄ　Ｔｒａｎｓｆｅｒ　Ｆｕｎｃｔｉｏｎ）を用いて前記音像を定位させる処理をし、
　前記ＨＲＴＦは、前記修正再生位置情報が示す位置の方向から音が聞こえるように設定されている
　請求項７記載のオーディオ再生装置。
　前記信号処理部は、前記受聴者の位置と前記修正再生位置情報が示す位置との距離に応じて音量を調整する
　請求項８記載のオーディオ再生装置。
　前記信号処理部は、前記修正再生位置情報が示す位置に応じて信号処理方式を変更する
　請求項１記載のオーディオ再生装置。
　前記スピーカアレーを構成するスピーカ素子の並び方向をＸ軸、前記Ｘ軸と直交し、かつ、前記スピーカアレーが設置されている面である設置面と水平な方向をＹ軸、及び、前記Ｘ軸と直交し、かつ、前記設置面と垂直な方向をＺ軸とし、
　前記Ｙ軸における位置を示すＹ座標では、前記スピーカアレーの背面方向がマイナス座標、前記スピーカアレーの前面方向がプラス座標であり、
　前記信号処理部は、
　前記修正再生位置情報のｙ座標値が負の値である場合、Ｈｕｙｇｅｎｓの定理を利用した信号処理で波面合成し、
　前記修正再生位置情報のｙ座標値が受聴者の位置より前の正の値である場合、ビームフォームを利用した信号処理で音像を生成し、
　前記修正再生位置情報のｙ座標値が受聴者の位置より後ろの正の値である場合、ＨＲＴＦを利用した信号処理で音像を定位させる
　請求項１０記載のオーディオ再生装置。
　前記オーディオ再生装置は、少なくとも２体のスピーカアレーを備え、
　前記少なくとも２体のスピーカアレーが少なくとも２つの２次元座標を構成し、
　前記少なくとも２体のスピーカアレーのうちの一つのスピーカアレーを構成するスピーカ素子の並び方向をＸ軸、前記Ｘ軸と直交し、かつ、前記一つのスピーカアレーが設置されている面である設置面と水平な方向をＹ軸、及び、前記Ｘ軸と直交し、かつ、前記設置面と垂直な方向をＺ軸とし、前記再生位置情報で特定される位置が（ｘ、ｙ、ｚ）であるとき、
　前記信号処理部は、前記ｚの値に応じて前記少なくとも２体のスピーカアレーを制御する
　請求項１記載のオーディオ再生装置。
　前記２つの２次元座標が平行しているとき、前記信号処理部は、
　前記ｚの値が予め定められた値よりも大きい場合は、前記設置面に対して上側の２次元座標を構成しているスピーカアレーの音量を大きくし、
　前記ｚの値が予め定められた値よりも小さい場合は、前記設置面に対して下側の２次元座標を構成しているスピーカアレーの音量を大きくする
　請求項１２記載のオーディオ再生装置。
　前記２つの２次元座標が直交しているとき、前記信号処理部は、
　前記ｚの値が予め定められた値よりも大きい場合は、前記設置面に対して垂直の２次元座標を構成しているスピーカアレーを構成するスピーカ素子のうち、予め定められた位置よりも上方のスピーカ素子の音量を大きくし、
　前記ｚの値が予め定められた値よりも小さい場合は、前記設置面に対して垂直の２次元座標を構成しているスピーカアレーを構成するスピーカ素子のうち、予め定められた位置よりも下方のスピーカ素子の音量を大きくする
　請求項１２記載のオーディオ再生装置。
　オーディオ信号と前記オーディオ信号の音像を定位させる３次元空間における位置を示す再生位置情報とを含むオーディオオブジェクトを再生するオーディオ再生装置であって、
　前記オーディオオブジェクトは、所定の時間間隔ごとの前記オーディオ信号と前記再生位置情報とを含むオーディオフレームから構成され、
　前記オーディオ再生装置は、
　前記再生位置情報が欠落している場合には、過去に再生したオーディオフレームに含まれていた再生位置情報を、前記再生位置情報が欠落したオーディオフレームの再生位置情報として用いることで、前記オーディオオブジェクトに含まれるオーディオフレームを再生する
　オーディオ再生装置。
　オーディオ信号と前記オーディオ信号の音像を定位させる３次元空間における位置を示す再生位置情報とを含むオーディオオブジェクトを、スピーカアレーを用いて、再生するオーディオ再生方法であって、
　前記再生位置情報を、前記スピーカアレーの位置を基準とした２次元座標軸上の位置情報である修正再生位置情報に変換する変換ステップと、
　前記修正再生位置情報に応じて前記オーディオオブジェクトに含まれる前記オーディオ信号の音像を定位させる処理をする信号処理ステップとを含む
　オーディオ再生方法。
　オーディオ信号と前記オーディオ信号の音像を定位させる３次元空間における位置を示す再生位置情報とを含むオーディオオブジェクトを、スピーカアレーを用いて、再生するオーディオ再生方法であって、
　前記オーディオオブジェクトは、所定の時間間隔ごとの前記オーディオ信号と前記再生位置情報とを含むオーディオフレームから構成され、
　前記オーディオ再生方法は、
　前記再生位置情報が欠落している場合には、過去に再生したオーディオフレームに含まれていた再生位置情報を、前記再生位置情報が欠落したオーディオフレームの再生位置情報として用いることで、前記オーディオオブジェクトに含まれるオーディオフレームを再生するステップを含む
　オーディオ再生方法。