WO2017029793A1

WO2017029793A1 - 頭外定位処理装置、及びフィルタ選択方法

Info

Publication number: WO2017029793A1
Application number: PCT/JP2016/003675
Authority: WO
Inventors: 正也小西; 村田　寿子; 優美藤井
Original assignee: 株式会社Ｊｖｃケンウッド
Priority date: 2015-08-20
Filing date: 2016-08-09
Publication date: 2017-02-23
Also published as: JP6578813B2; US20180176709A1; JP2017041766A; US10412530B2

Abstract

本実施の形態にかかる頭外定位処理装置は、プリセットフィルタを選択するフィルタ選択部（１４）と、プリセットフィルタを用いて、頭外定位処理を行う頭外定位処理部（１２）と、テスト音源の信号をユーザに出力するヘッドホン（６）と、ユーザ入力を受け付ける入力部（１８）と、センサユニット（１６）と、センサユニット（１６）からの検出信号に基づいて、音像の定位位置の三次元座標を算出する三次元座標算出部（１７）と、プリセットフィルタ毎の三次元座標に基づいて、複数のプリセットフィルタの中からユーザ（１）に最適なフィルタを判定する判定部（１９）と、を備えたものである。

Description

頭外定位処理装置、及びフィルタ選択方法

　本発明は、頭外定位処理装置、及びフィルタ選択方法に関する。

　音場再生技術の一つとして、ヘッドホンで再生していながら、あたかもスピーカで再生しているかのような音場を生成する「頭外定位ヘッドホン技術」がある。頭外定位ヘッドホン技術では、例えば、聴取者の頭部伝達特性（前面に配置された２ｃｈの仮想スピーカから左右それぞれの耳までの空間伝達特性）および外耳道伝達特性（ヘッドホンの左右の振動板からそれぞれの外耳道内での伝達特性）を用いている。

　頭外定位再生においては、２チャンネル（以下、ｃｈと記載）のスピーカから発した測定信号（インパルス音等）を聴取者本人の耳に設置したマイクで録音する。そして、インパルス応答から頭部伝達特性を算出して、フィルタを作成する。作成したフィルタを２ｃｈの音楽信号に畳み込むことにより、頭外定位再生を実現することができる。

　図６に示すように、Ｌｃｈのスピーカ５ＬとＲｃｈのスピーカ５Ｒを備えたスピーカユニット５がインパルス応答測定に用いられる。スピーカユニット５は、ユーザ１の前方に設置される。ここで、Ｌｃｈのスピーカ５Ｌから左耳３Ｌに到達する信号をＬｓ、Ｒｃｈのスピーカ５Ｒから右耳３Ｒに到達する信号をＲｓ、Ｌｃｈのスピーカ５Ｌから頭部を回りこんで右耳３Ｒに到達する信号をＬｏ、Ｒｃｈのスピーカ５Ｒから頭部を回りこんで左耳３Ｌに到達する信号をＲｏとする。

　Ｌｃｈ、Ｒｃｈのスピーカ５Ｌ、５Ｒからインパルス信号を個別に発音し、左耳３Ｌ、右耳３Ｒに装着した左右のマイク２Ｌ、２Ｒによってインパルス応答（Ｌｓ、Ｌｏ、Ｒｏ、Ｒｓ）を測定する。この測定により、各伝達特性を得ることができる。得られた伝達特性を２ｃｈの音楽信号に畳み込むことにより、ヘッドホン再生でありながら、あたかもスピーカから再生されているかのような、頭外定位処理が実現できる。

特開２００２－２０９３００号公報

　しかしながら、実際の聴取環境によっては、測定用のスピーカを用意することができず、聴取者自身の頭部伝達特性を得ることができない場合がある。

　そこで、代替手段として、別の人、あるいはダミーヘッド等での測定により測定した頭部伝達特性を用いて、フィルタを作成することも可能である。しかしながら、頭部伝達特性は、個人の頭の形状や耳介の形状によって大きく変わることが知られている。したがって、他人の特性を用いた場合、頭外定位性能が著しく低下してしまう場合が多い。

　そのため、複数の異なるプリセットフィルタを予め用意したプリセット方式を用いることが好ましい。プリセット方式では、聴取者がそれぞれのプリセットフィルタで処理した音を聴きながら、最も自分に適したものを選択することができる。こうすることで、高い頭外定位性能を得ることができる。

　プリセット方式では、数多くのプリセットフィルタを用意することで、聴取者の特性に近いものを選択できる可能性が高くなる。しかしながら、プリセットフィルタの数が多くなるほど、それぞれの音像定位の差を聴覚によって判断しながら、最適なものを選択することが難しくなる。音像定位は「音がこの辺で鳴っている」というような空間的なイメージであるため、頭外定位を体験したことのない人ほどその傾向は顕著となる。また、音像定位は聴いている本人にしか知覚できないものであり、どこに定位しているかを外部から知ることは困難である。

　本実施形態は上記の点に鑑みなされたもので、予め用意された複数のプリセットフィルタの中から、ユーザに最適なフィルタを簡便に選択することができる頭外定位装置、及びフィルタ選択方法を提供することを目的とする。

　本実施形態の一態様にかかる頭外定位処理装置は、テスト音源を再生する音源再生部と、複数のプリセットフィルタから頭外定位処理に用いるプリセットフィルタを選択するフィルタ選択部と、前記フィルタ選択部によって選択されたプリセットフィルタを用いて、前記テスト音源の信号に対して頭外定位処理を行う頭外定位処理部と、前記頭外定位処理部にて頭外定位処理がなされた信号をユーザに出力するヘッドホンと、前記頭外定位処理による音像の定位位置を決定するためのユーザ入力を受け付ける入力部と、検出対象の位置情報を示す検出信号を生成するセンサユニットと、前記センサユニットからの検出信号に基づいて、前記定位位置の三次元座標を算出する三次元座標算出部と、前記プリセットフィルタ毎の前記定位位置の前記三次元座標に基づいて、前記複数のプリセットフィルタの中から前記ユーザに最適なフィルタを判定する判定部と、を備えたものである。

　本実施形態の一態様にかかるフィルタの選択方法は、複数のプリセットフィルタの中から頭外定位処理に用いるプリセットフィルタを選択し、選択された前記プリセットフィルタを用いて頭外定位処理されたテスト音源の信号をヘッドホンから再生し、前記テスト音源の音像の定位位置を決定するためのユーザ入力を受け付け、前記ユーザ入力によって決定された前記定位位置の位置情報を、センサユニットによって取得し、前記位置情報に基づいて、前記定位位置の三次元座標を算出し、前記プリセットフィルタ毎の前記音像の前記三次元座標に基づいて、前記複数のプリセットフィルタの中から最適なフィルタを選択するものである。

　本実施形態によれば、予め用意されたプリセットフィルタから、ユーザに最適なフィルタを簡便に選択することができる頭外定位装置、及びフィルタ選択方法を提供することができる。

本実施の形態に係る頭外定位処理装置を示すブロック図である。センサユニットが実装されたヘッドホンの構成を示す図である。本実施の形態１に係るフィルタ選択方法を示すフローチャートである。定位位置の三次元座標系を説明するための図である。本実施の形態１に係るフィルタ選択方法を示すフローチャートである。頭部伝達特性を測定する測定装置を示す図である。

　本実施の形態にかかる頭外定位処理装置、及びフィルタ選択方法の概要について説明する。

　頭外定位ヘッドホンにおいては、聴取者本人の頭部伝達特性を用いて処理を行うことにより、最も高い頭外定位性能を引き出すことができる。しかしながら、測定用スピーカが用意できない等の理由により、予め複数用意された他人の特性をもつプリセットフィルタ群の中から、最も本人に近い特性（フィルタ）を選択するプリセット方式が次善の策として考えられる。

　プリセット方式では、複数のプリセットフィルタで処理した音を順番に聴きながら聴取者本人が最適な組み合わせを選択する。しかしながら、それぞれのプリセットフィルタにおいて音像の定位位置を記憶しておくことが難しく、初心者には最適な組み合わせを選択することが困難である。

　そこで、本実施の形態では、それぞれのプリセットフィルタの音像の定位位置を、センサユニットが検出する。例えば、ユーザが指先にマーカーを装着する。そして、ユーザが知覚した音像の定位位置をマーカーで指し示す。センサユニットを用いてマーカーの位置を検出することにより、各プリセットフィルタの音像定位情報を数値化する。

　具体的には、それぞれのプリセットフィルタを用いて、音像定位が明確にわかるようなテスト音源（ホワイトノイズ等）を再生する。そして、ユーザが音像の定位位置を指もしくはマーカーなどで示す。ヘッドホンに設置したセンサを用いて、定位位置の三次元座標を測定する。

　処理装置は、複数のプリセットフィルタでの定位位置の三次元座標をそれぞれ記憶する。処理装置は、複数のプリセットフィルタに対応する三次元座標化したデータを分析する。処理装置は、分析結果に基づいて、最も頭外定位性能の高い組み合わせを決定する。こうすることにより、聴取者が自身に最適なプリセットフィルタ（以下、最適フィルタとする）を自分で選択することなく、自動的に最適な頭外定位性能が得られる。

　頭外定位性能の評価については、ユーザから音像の定位位置までの距離や、仮想スピーカから音像の定位位置までの距離を用いることができる。例えば、ユーザから最も遠くに音像定位するプリセットフィルタを、最適フィルタとして選択する。あるいは、仮想的なスピーカの最も近くに音像定位するプリセットフィルタを最適フィルタとすることができる。

　実施の形態１．
　本実施の形態にかかる頭外定位処理装置、及びフィルタ選択方法について、図１～図２を用いて説明する。図１は、頭外定位処理装置１００の構成を示すブロック図である。図２は、センサユニットが実装されたヘッドホンの構成を示す図である。

　図１に示すように頭外定位処理装置１００は、マーカー１５と、センサユニット１６と、ヘッドホン６と、処理装置１０と、を備えている。

　聴取者であるユーザ１は、ヘッドホン６を装着している。ヘッドホン６は、Ｌｃｈ信号とＲｃｈ信号をユーザ１に向けて出力することができる。また、図２に示すように、ユーザ１は、指７にマーカー１５を装着している。ヘッドホン６には、センサユニット１６が取り付けられている。センサユニット１６は、ユーザ１の指７に装着されたマーカー１５を検出する。

　ヘッドホン６は、バンドタイプのヘッドホンであり、左のハウジング６Ｌ、右のハウジング６Ｒ、及びヘッドバンド６Ｃを備えている。左のハウジング６Ｌは、ユーザ１の左耳にＬｃｈ信号を出力する。右のハウジング６Ｒは、ユーザ１の右耳にＲｃｈ信号を出力する。左右のハウジング６Ｌ、６Ｒは振動板等を有する出力ユニットを内蔵している。ヘッドバンド６Ｃは、円弧状に形成され、左のハウジング６Ｌと右のハウジング６Ｒとを連結している。ヘッドバンド６Ｃがユーザ１の頭部の上に乗せられる。これにより、左右のハウジング６Ｌ、６Ｒの間に、ユーザ１の頭部が挟まれる。左のハウジング６Ｌがユーザ１の左耳に装着され、右のハウジング６Ｒが右耳に装着される。

　ヘッドホン６には、センサユニット１６が設置されている。センサユニット１６には、複数のセンサ１６Ｌ１、１６Ｌ２、１６Ｃ、１６Ｒ２、１６Ｒ１を備えたセンサアレイを用いることができる。センサＬ１は、左のハウジング６Ｌに取り付けられている。センサ１６Ｒ１は、右のハウジング６Ｒに取り付けられている。センサ１６Ｌ２、センサ１６Ｃ、センサ１６Ｒ２はヘッドバンド６Ｃに取り付けられている。

　センサ１６Ｃは、ヘッドバンド６Ｃの中央に配置されている。センサ１６Ｌ２は、センサ１６Ｌ１とセンサ１６Ｃとの間に配置されている。センサ１６Ｒ２は、センサ１６Ｒ１とセンサ１６Ｃとの間に配置されている。このように、センサ１６Ｌ２、センサ１６Ｃ、センサ１６Ｒ２は、ヘッドバンド６Ｃに沿って、センサ１６Ｌ１とセンサ１６Ｒ１の間に配置されている。

　なお、図２では、センサユニット１６が５つのセンサ１６Ｌ１、１６Ｌ２、１６Ｃ、１６Ｒ２、１６Ｒ１を有する例について示しているが、センサの数、及び位置については特に限定されるものではない。複数のセンサがヘッドホン６の左右のハウジング６Ｌ、６Ｒ、またはヘッドバンド６Ｃに設置されていればよい。

　ここでは、センサ１６Ｌ１、１６Ｌ２、１６Ｃ、１６Ｒ２、１６Ｒ１が光学式センサであり、センサユニット１６は、マーカー１５を検出する。例えば、発光体を有するマーカー１５を用いる場合、センサ１６Ｌ１、１６Ｌ２、１６Ｃ、１６Ｒ２、１６Ｒ１は、マーカー１５から光を受光する受光素子を有している。そして、各センサ１６Ｌ１、１６Ｌ２、１６Ｃ、１６Ｒ２、１６Ｒ１のそれぞれに、マーカー１５からの光が到達する時間差によって、センサユニット１６は、マーカー１５の位置を検出する。

　あるいは、反射体を有するマーカー１５を用いる場合、各センサ１６Ｌ１、１６Ｌ２、１６Ｃ、１６Ｒ２、１６Ｒ１は、発光素子、及び受光素子を有している。そして、各センサ１６Ｌ１、１６Ｌ２、１６Ｃ、１６Ｒ２、１６Ｒ１の発光素子は、異なる周波数（波長）の光を発光する。マーカー１５で反射された反射光を各センサ１６Ｌ１、１６Ｌ２、１６Ｃ、１６Ｒ２、１６Ｒ１の受光素子がそれぞれの周波数の光を検出する。各センサ１６Ｌ１、１６Ｌ２、１６Ｃ、１６Ｒ２、１６Ｒ１の受光素子が光を検出した時間から、マーカー１５との位置関係を測定することができる。

　ヘッドホン６の左右のハウジング６Ｌ、６Ｒ、及びヘッドバンド６Ｃに円弧状に複数のセンサ１６Ｌ１、１６Ｌ２、１６Ｃ、１６Ｒ２、１６Ｒ１が設置されているため、センサユニット１６は、水平方向、鉛直方向、奥行き方向（前後方向）のマーカー位置を検出することができる。

　なお、マーカー１５の位置を検出する方法については特に限定されるものではない。例えば、各センサを光学式センサではなく、電磁式センサ等としてもよい。もちろん、センサユニット１６は、マーカー１５ではなく、ユーザ１の指などの位置を直接検出するようにしてもよい。この場合、ユーザ１がマーカー１５を装着しなくてもよい。また、センサユニット１６に設けられたセンサの一部又は全部は、ヘッドホン６以外に取り付けられていてもよい。また、ユーザ１の指７にセンサユニットを装着し、ヘッドホン６にマーカー１５を設置してもよい。そして、ユーザ１の指６に装着されたセンサユニットでヘッドホン６に設置されたマーカーの位置を検出する。

　処理装置１０は、パーソナルコンピュータなどの演算処理装置であり、プロセッサ、及びメモリ等を備えている。処理装置１０は、音源再生部１１、頭外定位処理部１２、ヘッドホン再生部１３、フィルタ選択部１４、三次元座標算出部１７、入力部１８、判定部１９、三次元座標記憶部２０を備えている。

　処理装置１０は、ユーザ１に最適なフィルタを選択するための処理を行う。処理装置１０の処理によって、最適フィルタを選択するための視聴テストが実行される。なお、処理装置１０は、物理的に単一な装置に限られるものではなく、一部の処理が異なる装置で行われてもよい。例えば、一部の処理がパソコンなどにより行われ、残りの処理がヘッドホン６に内蔵されたＤＳＰ(Digital Signal Processor)などにより行われてもよい。あるいは、三次元座標算出部１７がセンサユニット１６に設けられていてもよい。

　音源再生部１１は、テスト音源を再生する。テスト音源は、音像の定位位置がわかりやすい音源であることが好ましい。例えば、テスト音源としては、ホワイトノイズ等単一の音源を用いることができる。テスト音源は、Ｌｃｈ信号とＲｃｈ信号を含むステレオ信号である。音源再生部１１は再生した信号を頭外定位処理部１２に出力する。

　頭外定位処理部１２は、テスト音源の信号に対して頭外定位処理を行う。頭外定位処理部１２は、フィルタ選択部１４に記憶されているプリセットフィルタを読み出して、頭外定位処理を行う。例えば、頭外定位処理部１２は、頭部伝達特性のフィルタおよび外耳道伝達特性の逆フィルタを再生信号に畳み込む畳み込み演算を実行する。

　頭部伝達特性のフィルタは、聴取者本人のものではなく、予め用意された複数のプリセットフィルタの中からフィルタ選択部１４によって選択される。フィルタ選択部１４で選択されたプリセットフィルタが頭外定位処理部１２にセットされる。外耳道伝達特性は、ヘッドホンに内蔵したマイクで測定することもできるが、ダミーヘッド等で測定した固定値を使用することも可能である。なお、フィルタ選択部１４には左耳用と右耳用のプリセットフィルタがそれぞれ用意されている。

　ヘッドホン再生部１３は、頭外定位処理部１２で頭外定位処理が実行された再生信号をヘッドホン６に出力する。ヘッドホン６は、再生信号をユーザに出力する。このようにすることで、あたかもスピーカから再生されているかのような頭外定位音が、テスト音として、ヘッドホン６から再生される。

　フィルタ選択部１４には、ｎ個（ｎは２以上の整数）のプリセットフィルタが記憶されている。フィルタ選択部１４は、ｎ個のプリセットフィルタのうちの１つを選択して、頭外定位処理部１２に出力する。さらに、フィルタ選択部１４は１～ｎのプリセットフィルタを順番に切り替えて、頭外定位処理部１２に出力する。頭外定位処理部１２は、フィルタ選択部１４で選択されている１～ｎのプリセットフィルタを用いて、頭外定位処理を行う。フィルタ選択部１４におけるプリセットフィルタの選択はユーザ１が手動で切り替えてもよく、あるいは数秒毎に順番に自動で切り替えてもよい。なお、以下の説明では、プリセット数を８として説明するが、プリセット数は特に限定されるものではない。

　上記したように、センサユニット１６は、マーカー１５の位置を検出する。入力部１８は、頭外定位処理による音像の定位位置を決定するためのユーザ入力を受け付ける。入力部１８は、ユーザ入力を受け付けるボタンなどを有している。ボタンが押されたタイミングでのマーカー１５の位置が音像の定位位置となる。なお、入力部１８は、ボタンに限らず、キーボード、マウス、タッチパネル、レバーなどの他の入力機器であってもよい。さらには、マイクなどの音声入力によって、定位位置を決定するようにしてもよいし、マーカー１５が所定時間以上静止していることを検出した場合に定位位置を決定するようにしてもよい。

　例えば、ヘッドホン６で頭外定位処理された再生信号をユーザ１が受聴しているときに、ユーザ１がマーカー１５を付けた指７で音像の定位位置を指定する。すなわち、音像がどこに定位しているように聞こえているかをユーザ１がマーカー１５で指す。マーカー１５を音像の定位位置まで移動したら、ユーザ１が入力部１８のボタンを押す。これにより、音像の定位位置を決定することができる。

　三次元座標算出部１７は、センサユニット１６からの出力に基づいて、音像の定位位置の三次元座標を算出する。例えば、センサユニット１６は、マーカー１５の位置の検出結果に応じ、マーカー１５の位置情報を示す検出信号を生成し、三次元座標算出部１７に出力する。また、入力部１８は、ユーザ入力に応じた入力信号を三次元座標算出部１７に出力する。三次元座標算出部１７は、入力部１８による決定がなされたタイミングでのマーカー１５の３次元的な位置を、定位位置の三次元座標として算出する。このように、三次元座標算出部１７は、センサユニット１６からの検出信号に基づいて、マーカー１５の三次元座標を算出する。

　三次元座標算出部１７は、プリセットフィルタ毎に三次元座標を算出する。三次元座標算出部１７は、算出した三次元座標を判定部１９に出力する。判定部１９は、プリセットフィルタに算出された三次元座標を三次元座標記憶部２０に格納させる。三次元座標記憶部２０は、メモリなどを有しており、８個の三次元座標を記憶する。

　判定部１９は、三次元座標記憶部２０に記憶された複数の三次元座標に基づいて、最適フィルタを判定する。すなわち、判定部１９は、ユーザ１にとって最良の頭外定位性能を有するプリセットフィルタを最適フィルタとして決定する。実施の形態１では、判定部１９は、ユーザ１から最も遠く、左右に拡がる定位位置が得られるプリセットフィルタを最適フィルタとして判定している。

　このように、判定部１９は、複数のプリセットフィルタの中から最適フィルタを選択する。したがって、数多くのプリセット値の中から、ユーザ１本人にもっとも最適な頭部伝達特性を簡便に選択することができる。

　そして、実音源の再生では、頭外定位処理部１２は最適フィルタを用いて頭外定位処理を行う。そして、ヘッドホン６が、最適フィルタを用いて頭外定位処理がなされたＬｃｈ信号、Ｒｃｈ信号を再生する。なお、実音源の再生には、ＣＤ（Compact Disc）プレーヤなどから出力されるステレオ音楽信号が用いられる。これにより、適切なフィルタを用いて、頭外定位処理を実施することができる。ヘッドホン６を用いた場合でも、ユーザ１にとって最適な頭外定位特性を得ることができる。

　なお、実音源の再生と、テスト音源の再生は、同一の装置で行われるものに限られるものではなく、異なる装置で行われてもよい。例えば、頭外定位処理装置１００が選択した最適フィルタを、無線又は有線で、他の音楽プレーヤやヘッドホン６に送信する。他の音楽プレーヤやヘッドホン６が最適フィルタを記憶する。そして、他の音楽プレーヤ、又はヘッドホン６が最適フィルタを用いて、ステレオ音楽信号に対して頭外定位処理を行う。

　図３を用いて、実施の形態１にかかるフィルタ選択方法について説明する。図３は、頭外定位処理装置１００にて実施されるフィルタ選択方法を示すフローチャートである。なお、図３ではＬｃｈでの処理を示している。フィルタ選択部１４には左耳用と右耳用のプリセットフィルタがそれぞれ用意されている。ＬｃｈのフィルタとＲｃｈのフィルタとで別々に視聴テストが行われるが、ＬｃｈとＲｃｈの処理は同じであるため、Ｒｃｈの処理については、適宜説明を省略する。

　Ｌｃｈ選択動作を開始すると、ｎ＝１とする（ステップＳ１１）。ｎはプリセットフィルタの番号である。したがって、まず、１番目のプリセットフィルタに対する処理を行う。フィルタ選択部１４は、ｎがプリセット数より大きいか否かを判定する（ステップＳ１２）。ここでは、プリセット数が８であるため、ｎがプリセット数よりも小さくなっている（ステップＳ１２のＮＯ）。

　そして、音源再生部１１は、１番目のプリセットフィルタを用いて、テスト音を再生する（ステップＳ１３）。ここでは、頭外定位処理部１２が、１番目のプリセットフィルタを用いて、頭外定位処理を実行している。具体的には、頭外定位処理部１２は、テスト音源のステレオ信号に対して、Ｌｃｈ用のプリセットフィルタを用いて、頭外定位処理を実行する。そして、ヘッドホン再生部１３は、ヘッドホン６のハウジング６ＬからＬｃｈ信号をユーザ１に出力する。

　次に、ユーザ１がマーカー１５を付けた指を、音像が定位して聞こえる場所に移動させる（ステップＳ１４）。すなわち、ヘッドホン６により形成された音像の定位位置に、ユーザ１が指７を移動させる。そして、ユーザ１が音像とマーカー１５の位置が重なっているか否かを判定する（ステップＳ１５）。音像の定位位置とマーカー１５の位置があっていない場合（ステップＳ１５のＮＯ）、ステップＳ１４に戻って、ユーザ１がマーカー１５を付けた指７を音像定位している場所まで移動させる。

　ユーザ１によって指定された音像の定位位置とマーカー１５の位置が一致している場合（ステップＳ１５のＹＥＳ）、ユーザ１が決定ボタンを押下する（ステップＳ１６）。すなわち、ユーザ１が入力部１８を操作して、定位位置を決定する。これにより、入力部１８は、音像の定位位置を決定するための入力を受け付ける。

　入力部１８がボタン押下のユーザ入力を受け付けると、センサユニット１６がマーカー１５の位置情報を取得する（ステップＳ１７）。そして、三次元座標算出部１７が、センサユニット１６からの位置情報に基づいて、定位位置の三次元座標を算出する（ステップＳ１８）。すなわち、三次元座標算出部１７は、マーカー１５の三次元座標を定位位置の三次元座標として算出する。

　ここで、三次元座標算出部１７が算出する三次元座標について、図４を用いて説明する。図４では、ユーザ１から見て、左右方向をＸ軸、前後方向をＹ軸、上下方向をＺ軸とする三次元直交座標系を示している。具体的には、ユーザ１の右方向が＋Ｘ方向、左方向が－Ｘ方向、前方向が＋Ｙ方向、後ろ方向が－Ｙ方向、上方向が＋Ｚ方向、下方向が－Ｚ方向となっている。なお、三次元座標系の原点は、左右のハウジング６Ｌ、６Ｒの中間、すなわち、ユーザ１の頭部中心としている。

　ここで、三次元座標算出部１７は、Ｌｃｈの音像の３次元座標（ＸＬｎ，ＹＬｎ，ＺＬｎ）を求める。なお、ＸＬｎ，ＹＬｎ，ＺＬｎは、原点からの相対的なＸＹＺ座標であり、以下の通りとなる。
ＸＬｎ：ユーザ１からｎ番目のフィルタによるＬｃｈ音像へのＸ軸方向の相対座標
ＹＬｎ：ユーザ１からｎ番目のフィルタによるＬｃｈ音像へのＹ軸方向の相対座標
ＺＬｎ：ユーザ１からｎ番目のフィルタによるＬｃｈ音像へのＺ軸方向の相対座標

　本実施の形態では、三次元座標算出部１７が三次元座標（ＸＬｎ，ＹＬｎ，ＺＬｎ）を算出する。三次元座標算出部１７は、三次元座標（ＸＬｎ，ＹＬｎ，ＺＬｎ）を判定部１９に出力する。本実施の形態では、判定部１９が、ユーザ１から音像の定位位置までの距離ＤＬｎに基づいて、最適フィルタを判定している。具体的には、判定部１９は、得られる音像の定位位置がユーザ１から、より遠くにあり、かつより左右に拡がるものを最適フィルタとして判定している。さらに、音像の高さが耳の近傍にあるものを最適フィルタとしている。

　そのため、判定部１９は、ＺＬｎが所定の範囲内にあるか否かを判定する（ステップＳ１９）。すなわち、判定部１９は、音像の高さが耳の高さと同程度になっているか否かを判定する。耳からの音像の相対的な高さはＺＬｎで表される。一般的に、ステレオ音源の音像は耳と同じ高さにあることが望ましい。音像の高さＺＬｎが耳よりも高すぎる場合、あるいは低すぎる場合、２ｃｈの音像定位としては不自然な印象となる。

　したがって、ＺＬｎが所定の範囲内にない場合（ステップＳ１９のＮＯ）、ステップＳ２２に移行する。これにより、定位位置が高すぎるプリセットフィルタ、及び定位位置が低すぎるプリセットフィルタが選択対象から外れる。なお、高さのずれの範囲については、任意に設定することができるが、耳の高さからプラスマイナス２０ｃｍ程度の範囲とすることが望ましい。また、ステップＳ１９ではＺＬｎの値が所定の範囲内にあるか否かを判定したが、音像の上下方向の角度、すなわち、水平面からの角度（仰俯角）が、所定の範囲内にあるか否かを判定してもよい。

　ＺＬｎが所定の範囲内にある場合（ステップＳ１９のＹＥＳ）、判定部１９は、θＬｎが所定の範囲内か否かを判定する（ステップＳ２０）。すなわち、判定部１９は、音像の開き角が所定の範囲内であるか否かを判定する。ユーザ１の正面を０°としたときの音像定位の水平面内の角度θＬｎは以下の式（１）で表すことができる。
θＬｎ＝ｔａｎ^―１（ＹＬｎ／ＸＬｎ）・・・（１）

　θＬｎは水平面（ＸＹ平面）内におけるＹ軸からの角度になる。θＬｎが大きいと、ステレオ感を強く感じることができる。ただし、θＬｎがあまり大きくなり過ぎると、いわゆる中抜け状態となり、不自然な印象を招く。従って、－４５°≦θＬｎ≦２０°であることが望ましい。もちろん、開き角の範囲は、上記の値に限られるものではない。

　θＬｎが所定の範囲内にない場合（ステップＳ２０のＮＯ）、ステップＳ２２に移行する。これにより、Ｌｃｈの音像の開き角が大きすぎるプリセットフィルタ、及び小さすぎるプリセットフィルタが選択対象から外れる。

　θＬｎが所定の範囲内にある場合（ステップＳ２０のＹＥＳ）、音像までの距離ＤＬｎを三次元座標記憶部２０が記憶する（ステップＳ２１）。なお、距離ＤＬｎはユーザ１から音像までの距離であるため、以下の式（２）で表される。
ＤＬｎ＝（ＸＬｎ^２＋ＹＬｎ^２＋ＺＬｎ^２）^１／２　　　・・・（２）

　判定部１９によって算出された距離ＤＬｎを三次元座標記憶部２０が記憶する。そして、ｎ＝ｎ＋１とインクリメントする（ステップＳ２２）。ｎをインクリメントしたら、ステップＳ１２に戻る。そして、ｎがプリセット数に到達するまで、ステップＳ１２～ステップＳ２２までの処理を繰り返し行う。すなわち、２番目～８番目のプリセットフィルタに対して、ステップＳ１２からステップＳ２２までの処理を行う。

　ステップＳ１２において、ｎがプリセット数よりも大きくなったら（ステップＳ１２のＹＥＳ）、ステップＳ２３に移行する。プリセットされている全てのプリセットフィルタに対して、同様の処理を行い、距離ＤＬｎを算出する。ここで、ｎ＝８となっている。したがって、ステップＳ１９、Ｓ２０で選択対象外となるプリセットフィルタがないとすると、判定部１９は、８個の距離ＤＬ１～距離ＤＬ８を算出する。

　ｎがプリセット数を越えた場合（ステップＳ１２のＹＥＳ）、８個の距離ＤＬ１～距離ＤＬ８の中で値が最大のものを最適フィルタとして選択する（ステップＳ２３）。すなわち、判定部１９は、距離ＤＬｎが最大となるプリセットフィルタを最適フィルタとして選択する。このようにすることで、最も遠くに音像が定位しているプリセットフィルタを最適フィルタとして選択することができる。このように、判定部１９は、三次元座標記憶部２０に記憶されている距離ＤＬ１～距離ＤＬ８を比較して、最適フィルタを選択する。

　Ｌｃｈ用の最適フィルタの選択が終了したら、Ｒｃｈについても同様の処理を行う。Ｒｃｈの処理もＬｃｈの処理と同様である。Ｒｃｈの処理では、Ｒｃｈ用のプリセットフィルタを用いて、テスト音源のステレオ信号に対して、頭外定位処理が行われる。そして、ヘッドホン６のハウジング６ＲからＲｃｈ信号がユーザ１の右耳に出力される。

　Ｌｃｈと同様に、Ｒｃｈの音像に対して、三次元座標算出部１７が算出した三次元座標を（ＸＲｎ，ＹＲｎ，ＺＲｎ）とする。
ＸＲｎ：ユーザ１からｎ番目のフィルタによるＲｃｈ音像へのＸ軸方向の相対座標
ＹＲｎ：ユーザ１からｎ番目のフィルタによるＲｃｈ音像へのＹ軸方向の相対座標
ＺＲｎ：ユーザ１からｎ番目のフィルタによるＲｃｈ音像へのＺ軸方向の相対座標

　Ｒｃｈの場合、ステップＳ１９ではＺＲｎが所定の範囲内にあるか否かを判定する。また、ステップＳ２０では、θＲｎが所定の範囲内にあるか否かを判定する。ユーザ１の正面を０°としたときの音像定位の水平面内の角度θＲｎは以下の式（３）で表すことができる。
θＲｎ＝ｔａｎ^―１（ＹＲｎ／ＸＲｎ）・・・（３）

　なお、θＲｎは水平面（ＸＹ平面）内におけるＹ軸からの角度になる。Ｌｃｈと同様に、θＲｎが大きいと、ステレオ感を強く感じることができる。ただし、θＲｎがあまり大きくなり過ぎると、いわゆる中抜け状態となり、不自然な印象を招く。従って、２０°≦θＲｎ≦４５°であることが望ましい。もちろん、開き角の範囲は、上記の値に限られるものではない。なお、ＬｃｈとＲｃｈとで開き角の範囲は左右対称であってもよく、左右非対称であってもよい。

　Ｒｃｈの場合、ステップＳ２１では、距離ＤＲｎを記憶し、ステップＳ２３では距離ＤＲｎを比較することで最適フィルタを選択する。ユーザ１からＲｃｈの音像までの距離ＤＲｎは、以下の（４）式で表すことができる。
ＤＲｎ＝（ＸＲｎ^２＋ＹＲｎ^２＋ＺＲｎ^２）^１／２　　　・・・（４）

　上記したように、判定部１９は、プリセットフィルタ毎に算出された三次元座標を比較することで、最適フィルタを判定している。これにより、ユーザ１にとって最も頭外定位性能を高いプリセットフィルタを最適フィルタとして選択することができる。もちろん、ＬｃｈとＲｃｈの処理順番を逆にしてもよい。さらには、ＬｃｈのプリセットフィルタとＲｃｈのプリセットフィルタを交互に用いてもよい。

　本実施の形態では、ヘッドホン６に設置されたマーカー１５により音像の定位位置を検出している。そして、音像の定位位置の三次元座標に基づいて、最適フィルタを選択している。これにより、予め用意された複数のプリセットフィルタの中から、ユーザに最適なフィルタを簡便に選択することができる。判定部１９がプリセットフィルタ毎に算出された定位位置の三次元座標を比較して、最適フィルタを選択している。したがって、ユーザがプリセットフィルタ毎の音像の定位位置を比較することなく、最適フィルタを選択することができるようになる。よって、簡便に最適フィルタを選択することができる。

実施の形態２．
　本実施の形態では、判定部１９での処理が実施の形態１と異なっている。具体的には、本実施の形態では、プリセットフィルタ毎に算出された三次元座標を、予め設定された仮想スピーカの三次元座標と比較することで、最適フィルタを判定している。なお、判定部１９における処理以外の処理については、実施の形態１と同様であるため、適宜説明を省略する。例えば、実施の形態２における装置構成については、図１、図２で示した構成と同様の構成となっている。

　図５は、本実施の形態にかかる頭外定位処理装置１００で実施されるフィルタ選択方法を示すフローチャートである。なお、頭外定位処理装置１００での基本的処理は実施の形態１と同様であるため、適宜説明を省略する。例えば、ステップＳ３１～ステップＳ３８、Ｓ４０は、実施の形態１のステップＳ１１～Ｓ１８、Ｓ２２にそれぞれ対応しているため、説明を省略する。

　本実施の形態では、判定部１９が音像から仮想スピーカまでの距離ＤＬｓｐｎを算出している（ステップＳ３９）。仮想スピーカの三次元座標は、予め設定されている。Ｌｃｈの仮想スピーカの相対位置の三次元座標を（ＸＬｓｐ，ＹＬｓｐ，ＺＬｓｐ）とする。音像の相対位置の三次元座標は、実施の形態１で示したように、（ＸＬｎ、ＹＬｎ、ＺＬｎ）である。ｎ番目にプリセットフィルタによる音像と仮想スピーカとの距離ＤＬｓｐｎは以下の式（５）で表すことができる。
ＤＬｓｐｎ
＝｛（ＸＬｎ－ＸＬｓｐ）^２＋（ＹＬｎ－ＹＬｓｐ）^２＋（ＺＬｎ－ＺＬｓｐ）^２｝^１／２
　・・・（５）

　判定部１９が算出した距離ＤＬｓｐｎは、三次元座標記憶部２０に記憶される。そして、ｎ＝ｎ＋１とインクリメントして（ステップＳ４０）、次のプリセットフィルタについても同様の処理を実施する（ステップＳ３１～Ｓ３９）。ｎがプリセット数を越えるまで（ステップＳ３２のＹＥＳ）、ステップＳ３１～Ｓ３９を繰り返す。判定部１９は、プリセットフィルタ毎に距離ＤＬｓｐｎを算出する。ｎ＝８の場合、三次元座標記憶部２０は、８個の距離ＤＬｓｐ１～ＤＬｓｐ８を記憶する。

　そして、判定部１９は、距離ＤＬｓｐ１～距離ＤＬｓｐ８の中で値が最小となるプリセットフィルタを最適フィルタとして選択する。このように、本実施の形態では、判定部１９が仮想スピーカと最も近い位置に音像が定位するプリセットフィルタを最適フィルタとして選択している。

　Ｌｃｈの処理が終了したら、Ｒｃｈについても同じ処理を行う。Ｒｃｈの仮想スピーカの相対位置の三次元座標を（ＸＲｓｐ，ＹＲｓｐ，ＺＲｓｐ）とする。Ｒｃｈの音像の相対位置の三次元座標は、実施の形態１で示したように、（ＸＲｎ，ＹＲｎ，ＲＬｎ）である。ｎ番目にプリセットフィルタによる音像と仮想スピーカとの距離ＤＲｓｐｎは以下の式（６）で表すことができる。
ＤＲｓｐｎ
＝｛（ＸＲｎ－ＸＲｓｐ）^２＋（ＹＲｎ－ＹＲｓｐ）^２＋（ＺＲｎ－ＺＲｓｐ）^２｝^１／２
　・・・（６）

　判定部１９は、プリセットフィルタ毎に距離ＤＲｓｐｎを算出する。したがって、三次元座標記憶部２０は、ｎ個の距離ＤＲｓｐｎを記憶する。そして、判定部１９は、ｎ個の距離ＤＲｓｐｎの中で値が最小となるプリセットフィルタを最適フィルタとして選択する。本実施の形態では、判定部１９が仮想スピーカと最も近い位置に音像が定位するプリセットフィルタを最適フィルタとして選択している。このようにすることで、高い頭外定位性能で、音楽再生信号を再生することができる。仮想スピーカに近い位置に音像を定位することが可能になる。

実施の形態３
　実施の形態２では、予め設定された仮想スピーカの位置に近い音像を選択する方法を示したが、実施の形態３では、ユーザ１が任意に仮想スピーカの位置を設定している。そして、ユーザ１が設定した仮想スピーカの位置に最も近い音像となるプリセットフィルタを最適フィルタとして選択する。

　例えば、ユーザ１の好みによって、仮想スピーカの位置を変えることができる。例えば、仮想スピーカの左右の開き角をより大きくしたり、あるいはユーザ自身の頭からあまり遠くに音像が定位しないように設定したりすることも可能となる。したがって、ユーザ１が望む方向に音像を定位させることができる。

　プリセットフィルタの選択動作を行う前に、マーカー１５を装着した指を左右それぞれの定位させたい位置に置いた状態で位置決定ボタンを押す。こうすることで、ユーザ１が仮想スピーカの位置を設定することができる。すなわち、センサユニット１６からのマーカー１５の位置情報に基づいて、三次元座標算出部１７が仮想スピーカの三次元座標（ＸＬｓｐ，ＹＬｓｐ，ＺＬｓｐ）を算出する。そして、判定部１９が仮想スピーカの三次元座標を記憶する。

　その後、実施の形態２と同様に各プリセットのフィルタで処理されたテスト音源を聴きながら、その音像定位の位置をマーカーで示して記憶させ、仮想スピーカとの相対距離のもっとも近いものを、頭外定位性能のもっとも高いフィルタとして選択する。このようにすることで、ユーザ１の好みに応じた仮想スピーカの位置に音像を近づけることができる。

　上記信号処理のうちの一部又は全部は、コンピュータプログラムによって実行されてもよい。上述したプログラムは、様々なタイプの非一時的なコンピュータ可読媒体（ｎｏｎ－ｔｒａｎｓｉｔｏｒｙ　ｃｏｍｐｕｔｅｒ　ｒｅａｄａｂｌｅ　ｍｅｄｉｕｍ）を用いて格納され、コンピュータに供給することができる。非一時的なコンピュータ可読媒体は、様々なタイプの実体のある記録媒体（ｔａｎｇｉｂｌｅ　ｓｔｏｒａｇｅ　ｍｅｄｉｕｍ）を含む。非一時的なコンピュータ可読媒体の例は、磁気記録媒体（例えばフレキシブルディスク、磁気テープ、ハードディスクドライブ）、光磁気記録媒体（例えば光磁気ディスク）、ＣＤ－ＲＯＭ（Ｒｅａｄ　Ｏｎｌｙ　Ｍｅｍｏｒｙ）、ＣＤ－Ｒ、ＣＤ－Ｒ／Ｗ、半導体メモリ（例えば、マスクＲＯＭ、ＰＲＯＭ（Ｐｒｏｇｒａｍｍａｂｌｅ　ＲＯＭ)、ＥＰＲＯＭ（Ｅｒａｓａｂｌｅ　ＰＲＯＭ)、フラッシュＲＯＭ、ＲＡＭ（Ｒａｎｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ））を含む。また、プログラムは、様々なタイプの一時的なコンピュータ可読媒体（ｔｒａｎｓｉｔｏｒｙ　ｃｏｍｐｕｔｅｒ　ｒｅａｄａｂｌｅ　ｍｅｄｉｕｍ)によってコンピュータに供給されてもよい。一時的なコンピュータ可読媒体の例は、電気信号、光信号、及び電磁波を含む。一時的なコンピュータ可読媒体は、電線及び光ファイバ等の有線通信路、又は無線通信路を介して、プログラムをコンピュータに供給できる。

　以上、本発明者によってなされた発明を実施の形態に基づき具体的に説明したが、本発明は上記実施の形態に限られたものではなく、その要旨を逸脱しない範囲で種々変更可能であることは言うまでもない。

　この出願は、２０１５年８月２０日に出願された日本出願特願２０１５－１６２４０６を基礎とする優先権を主張し、その開示の全てをここに取り込む。

　本発明は、例えば、ヘッドホンを用いた頭外定位処理装置に好適である。

　１　ユーザ
　２　マイクユニット
　２Ｌ　左マイク
　２Ｒ　右マイク
　３Ｌ　左耳
　３Ｒ　右耳
　５　スピーカユニット
　５Ｌ　左スピーカ
　５Ｒ　右スピーカ
　６　ヘッドホン
　６Ｌ、６Ｒ　ハウジング
　６Ｃ　ヘッドバンド
　７　指
　１０　処理装置
　１１　音源再生部
　１２　頭外定位処理部
　１３　ヘッドホン再生部
　１４　フィルタ選択部
　１５　マーカー
　１６　センサユニット
　１６Ｌ１、１６Ｌ２、１６Ｃ、１６Ｒ２、１６Ｒ１　センサ
　１７　三次元座標算出部
　１８　入力部
　１９　判定部
　２０　三次元座標記憶部
　１００　頭外定位処理装置

Claims

　テスト音源を再生する音源再生部と、
　複数のプリセットフィルタから頭外定位処理に用いるプリセットフィルタを選択するフィルタ選択部と、
　前記フィルタ選択部によって選択されたプリセットフィルタを用いて、前記テスト音源の信号に対して頭外定位処理を行う頭外定位処理部と、
　前記頭外定位処理部にて頭外定位処理がなされた信号をユーザに出力するヘッドホンと、
　前記頭外定位処理による音像の定位位置を決定するためのユーザ入力を受け付ける入力部と、
　検出対象の位置情報を示す検出信号を生成するセンサユニットと、
　前記センサユニットからの検出信号に基づいて、前記定位位置の三次元座標を算出する三次元座標算出部と、
　前記プリセットフィルタ毎の前記定位位置の前記三次元座標に基づいて、前記複数のプリセットフィルタの中から前記ユーザに最適なフィルタを判定する判定部と、を備えた頭外定位処理装置。
　前記センサユニットは、前記ユーザが指に装着したマーカーを検出し、
　前記三次元座標算出部は、前記マーカーの位置情報に基づいて、前記定位位置の前記三次元座標を算出する請求項１に記載の頭外定位処理装置。
　前記センサユニットがヘッドホンに設置されている請求項１、又は２に記載の頭外定位処理装置。
　前記ヘッドホンは、
　左右のハウジングと、
　前記左右のハウジングを連結するヘッドバンドと、を備え、
　前記センサユニットは、前記左右のハウジング、または前記ヘッドバンドに設置された複数のセンサを備えている請求項３に記載の頭外定位処理装置。
　前記ユーザの指に装着された前記センサユニットが、前記ヘッドホンに設置されたマーカーを検出し、
　前記三次元座標算出部は、前記マーカーの位置情報に基づいて、前記定位位置の前記三次元座標を算出する請求項１に記載の頭外定位処理装置。
　前記判定部は、前記プリセットフィルタ毎の前記定位位置の三次元座標を用いて、前記ユーザと前記定位位置との距離を算出し、
　前記プリセットフィルタ毎の前記ユーザと前記定位位置との距離に基づいて、前記最適なフィルタを判定する請求項１～５のいずれか１項に記載の頭外定位処理装置。
　前記判定部は、前記プリセットフィルタ毎の前記定位位置の三次元座標と、予め設定された仮想スピーカの三次元座標とを用いて、前記仮想スピーカと前記定位位置との距離を算出し、
　前記プリセットフィルタ毎の前記仮想スピーカと前記定位位置との距離に基づいて、前記最適なフィルタを判定する請求項１～５のいずれか１項に記載の頭外定位処理装置。
　複数のプリセットフィルタの中から頭外定位処理に用いるプリセットフィルタを選択し、
　選択された前記プリセットフィルタを用いて頭外定位処理されたテスト音源の信号をヘッドホンから出力し、
　前記テスト音源の音像の定位位置を決定するためのユーザ入力を受け付け、
　前記ユーザ入力によって決定された前記定位位置の位置情報を、センサユニットによって取得し、
　前記位置情報に基づいて、前記定位位置の三次元座標を算出し、
　前記プリセットフィルタ毎の前記定位位置の前記三次元座標に基づいて、前記複数のプリセットフィルタの中から最適なフィルタを選択するフィルタ選択方法。
　前記センサユニットは、ユーザが指に装着したマーカーを検出し、
　前記マーカーの位置情報に基づいて、前記定位位置の前記三次元座標を算出する請求項８に記載のフィルタ選択方法。
　前記センサユニットがヘッドホンに設置されている請求項８、又は９に記載のフィルタ選択方法。
　前記ヘッドホンは、
　左右のハウジングと、
　前記左右のハウジングを連結するヘッドバンドと、を備え、
　前記センサユニットは、前記左右のハウジング、または前記ヘッドバンドに設置された複数のセンサを備えている請求項１０に記載のフィルタ選択方法。
　前記ユーザの指に装着された前記センサユニットが、前記ヘッドホンに設置されたマーカーを検出し、
　前記マーカーの位置情報に基づいて、前記定位位置の前記三次元座標を算出する請求項８に記載のフィルタ選択方法。
　前記プリセットフィルタ毎の前記定位位置の三次元座標を用いて、ユーザと前記定位位置との距離を算出し、
　前記プリセットフィルタ毎のユーザと前記定位位置との距離に基づいて、前記最適なフィルタを判定する請求項８～１２のいずれか１項に記載のフィルタ選択方法。
　前記プリセットフィルタ毎の前記定位位置の三次元座標と、予め設定された仮想スピーカの三次元座標とを用いて、前記仮想スピーカと前記定位位置との距離を算出し、
　前記プリセットフィルタ毎の前記仮想スピーカと前記定位位置との距離に基づいて、前記最適なフィルタを判定する請求項８～１２のいずれか１項に記載のフィルタ選択方法。