JP7472582B2

JP7472582B2 - 音声再生システムおよび頭部伝達関数選択方法

Info

Publication number: JP7472582B2
Application number: JP2020054235A
Authority: JP
Inventors: 和也粂原; 幸生多田; 光希有田
Original assignee: Yamaha Corp
Current assignee: Yamaha Corp
Priority date: 2020-03-25
Filing date: 2020-03-25
Publication date: 2024-04-23
Anticipated expiration: 2040-03-25
Also published as: US11252526B2; JP2021158427A; US20210306793A1

Description

この発明の一実施形態は、ユーザに対して所定方向に定位するように音声を放音する音響デバイスにおける頭部伝達関数の選択に関する。

近年、音響でＡＲ（拡張現実：ＡｕｇｍｅｎｔｅｄＲｅａｌｉｔｙ）を実現する技術が提案されている（例えば、特許文献１）。音響ＡＲでは、ユーザにヘッドホンなどの音響デバイスを装用させ、その音響デバイスで音声を再生する。音響ＡＲを実現するためには、決められた位置に音声を定位させることが必要である。音声を決められた定位位置に定位させる定位処理は、頭部伝達関数の畳み込みによって行われる。

頭部伝達関数とは、音源位置からユーザの両耳の外耳道までの音声の伝達関数である。具体的に言うと、頭部伝達関数は、音源位置で発生した音声がユーザの耳に到達するまでの間に、頭部形状、耳介形状などによりどのような周波数特性の変化を受けるかを表した関数である。音源位置からユーザの両耳に到来する音声は、ユーザの頭部形状や耳介形状などの影響を受けて、その到来方向特有の周波数特性となる。ユーザは、この特有の周波数特性を聞き分けて、音声の到来方向を判断している。したがって、ＡＲシステムが、音声を所定方向の頭部伝達関数を用いて加工して再生することにより、ユーザにさも所定方向から音声が聞こえてきたかのような感覚をもたせることができる。なお、音声の定位は、方向と距離で定義される定位位置で表されるが、説明を容易にするため、以下では、主として定位の方向について説明する。定位位置の距離感は、音量の調整等により比較的容易に付加することができる。

頭部伝達関数は、予め測定されたものが音響デバイスに記憶される。音響デバイスは、音声を再生するとき、この音声に頭部伝達関数を畳み込むことで定位方向特有の周波数特性を付与する。この音声は、ユーザが装用するヘッドホンなどでバイノーラル再生される。これにより、決められた定位方向から到来した音声と同じ周波数特性を持つ音声がユーザに対して再生されるため、ユーザは、この音声がさも定位方向から聴こえてくるかのような聴感で聴くことができる。

バイノーラル再生で音声を全方向に定位可能にするために、頭部伝達関数は、全方向のものが両耳分用意される。実際には、水平方向または垂直方向に所定角度ごとの頭部伝達関数がセットとして用意される。たとえば、水平方向３６０度（全周）、垂直方向０度から９０度（天頂）までの範囲で、１０度間隔で頭部伝達関数が用意される。なお、頭部伝達関数セットは、水平面内のみで垂直方向成分を持たない頭部伝達関数セットも含む。頭部伝達関数は、非特許文献１に示されるように、モデル（被験者）の両耳にマイクを挿入し、各音源方向で再生されたテスト音声をマイクで収音することによって測定される。

上に述べたように、頭部伝達関数は、全方向のものがセット（一揃い）として用意され、そのうち音声を定位させる１方向の頭部伝達関数が実際の音声の定位に用いられる。以下の説明で、セットの頭部伝達関数と１方向の頭部伝達関数とを区別する必要がある場合、それぞれ「頭部伝達関数セット」および「単一方向頭部伝達関数」と呼ぶこととする。

特開２０１７－１０３５９８号公報

松井健太郎、技研だよりNo.32「頭部伝達関数」［online］、2007年11月、ＮＨＫ放送技術研究所、［2020年3月5日検索］、インターネット＜URL： https://www.nhk.or.jp/strl/publica/giken_dayori/jp2/rd-0711.html＞

頭部伝達関数は、主としてユーザの頭部形状や耳介形状によって決定されるものであるため、音声の定位には、ユーザ本人について測定された頭部伝達関数を用いることが理想的である。しかし、ユーザごとに、非特許文献１に示したような設備を用いて、頭部伝達関数を測定することは極めて面倒であり、現実的でない。そこで、ユーザに似たモデルの頭部伝達関数を使用することが考えられるが、予め用意されている複数の頭部伝達関数のなかから適切な頭部伝達関数を選択することも容易ではない。

本発明の一実施形態に係る目的の一つは、音響デバイスにおいて、簡易な手順で適切な頭部伝達関数を選択できるようにすることにある。

本発明の一実施形態に係る音響デバイスは、ユーザが両耳に装用する放音部と、複数の頭部伝達関数を記憶した記憶部と、信号処理部と、制御部とを備える。信号処理部は、放音部から放音する音声信号を頭部伝達関数により処理する。制御部は、頭部伝達関数選択処理を実行する。制御部は、頭部伝達関数選択処理において以下の処理を実行する。制御部は、複数の頭部伝達関数から２以上の頭部伝達関数を候補関数として選択する。制御部は、選択した各候補関数について、所定のテスト音声を、所定の発音定位方向に定位するよう候補関数で処理して前記放音部から放音する。制御部は、選択した各候補関数について、放音部から放音されたテスト音声の、ユーザの聴覚上の定位方向である聴覚定位方向の入力を受け付ける。制御部は、選択した各候補関数について、発音定位方向と聴覚定位方向の差である定位差を算出する。制御部は、２以上の前記候補関数についての定位差に基づいて、ユーザに適用する頭部伝達関数を選択する。

本発明の一実施形態に係る頭部伝達関数選択方法では、信号処理部を備えたデバイスが、以下の処理を実行する。デバイスが、２以上の頭部伝達関数を候補関数として選択する。デバイスが、選択した各候補関数について、テスト音声を所定の発音定位方向に定位するよう候補関数で信号処理し、ユーザが両耳に装用する放音部から放音する。デバイスが、放音部から放音されたテスト音声のユーザの聴覚上の定位方向である聴覚定位方向の入力を受け付ける。デバイスが、発音定位方向と聴覚定位方向の差である定位差を算出して記憶する。デバイスが、２以上の前記候補関数についての定位差に基づいて、ユーザに適用する頭部伝達関数を選択する。

この発明によれば、簡易な手順で適切な頭部伝達関数を選択することが可能になる。

この発明が適用される音声再生システムの構成を示す図である。この発明が適用される携帯端末装置のブロック図である。この発明が適用されるヘッドホンのブロック図である。プロファイルテーブルの例を示す図である。選択ログの例を示す図である。頭部伝達関数選択処理を示すフローチャートである。

図１は、本発明が適用される音声再生システム１の構成図である。図２は、本発明が適用される携帯端末装置１０のブロック図である。図３は、本発明が適用されるヘッドホン２０のブロック図である。音声再生システム１は、携帯端末装置１０および音響デバイスであるヘッドホン２０を含む。図１は、ユーザＬが、携帯端末装置１０を手に持ち、ヘッドホン２０を両耳に装用した状態を示している。携帯端末装置１０は、例えば、スマートホン（多機能携帯電話）が用いられる。携帯端末装置１０とヘッドホン２０とは、Ｂｌｕｅｔｏｏｔｈ（登録商標）で接続（ペアリング）されており、相互に通信可能である。携帯端末装置１０とヘッドホン２０との接続は、Ｂｌｕｅｔｏｏｔｈに限定されず、他の無線通信規格または有線でもよい。携帯端末装置１０は、インターネットを含むネットワーク４を介してサーバ３と通信する。ヘッドホン２０は、２個のスピーカ２１Ｒ，２１Ｌとヘッドバンド２２とを組み合わせた、いわゆる耳掛け型である。ヘッドホン２０は、ヘッドバンド２２に３軸のジャイロセンサ（センサ）２３を有し、ユーザＬの頭部の向きをトラッキング可能である。なお、音響デバイスとして、ヘッドホン２０に代えてイヤホンを用いてもよい。サーバ３は、複数の音声再生システム１と通信し、音声再生システム１から収集した頭部伝達関数の選択ログなどを記憶する。また、サーバ３は、複数の頭部伝達関数を記憶しており、必要に応じて音声再生システム１に頭部伝達関数をダウンロードする。

音声再生システム１は、アプリケーションプログラム７０により、頭部伝達関数選択処理、および、コンテンツ再生処理を実行する。携帯端末装置１０では、制御部１００を含むハードウェア、および、アプリケーションプログラム７０が、協働することにより、候補選択手段、テスト音声放音手段、聴覚定位検出手段、定位差算出手段、および、関数決定手段として機能する。

音声再生システム１は、再生する音声をユーザＬに対して所定の方向に定位させる。この定位処理に頭部伝達関数が用いられる。頭部伝達関数は、音声の定位位置からユーザＬの耳に到達するまでの間に、頭部形状や耳介形状などによって受ける周波数特性の変化を表した関数である。

音声再生システム１は、複数の頭部伝達関数を予め記憶しており、その中からユーザＬに最も適したものを選択して音声の定位処理に用いる。記憶されている複数の伝達関数は、例えば、それぞれプロファイルの異なるモデル（被験者）から測定したものである。プロファイルとは、図４のプロファイルテーブル７４に示すように、頭部伝達関数を測定したモデルの人種、性別、年齢、頭部形状、耳介形状など、モデルについての頭部伝達関数の決定に影響を与えると考えられる情報である。以下、頭部伝達関数を測定したモデルのプロファイルを、単に、頭部伝達関数のプロファイルと呼ぶ。なお、頭部伝達関数は、複数の測定データの平均値を取る等して機械的に作り上げた伝達関数を使用しても良い。

頭部伝達関数選択処理においては以下の処理が実行される。ユーザＬが、ヘッドホン２０を装用した状態で、携帯端末装置１０に自身のプロファイルを入力する。音声再生システム１は、入力されたプロファイルに似たプロファイルを持つ頭部伝達関数を候補として選択する。候補として選択された頭部伝達関数は、候補関数と呼ばれる。候補関数は複数選択される。音声再生システム１は、選択した候補関数を用いてテスト音声を発生する。すなわち、携帯端末装置１０が、テスト音声を発生し、このテスト音声に所定の定位方向の頭部伝達関数を畳み込み演算する。この畳み込み演算によってテスト音声に付与された定位特性は、この候補関数のモデルに対して「所定の定位方向」に定位する特性であり、このテスト音声を聴くユーザＬに対するものではない。畳み込み演算によって付与された所定の定位方向は、発音定位方向と呼ばれる。

この畳み込み演算されたテスト音声が、ヘッドホン２０に出力され、ユーザＬに向けて放音される。候補関数を畳み込み演算されたテスト音声は、ユーザＬに対しても定位特性を有するため、発音定位方向と一致しなくても何らかの定位方向に定位する。この定位方向は聴覚定位方向と呼ばれる。

ユーザＬは、テスト音声を聴いて、聴覚的にどの方向に定位しているか、すなわち、聴覚定位方向をシステムに入力する。音声再生システム１は、発音定位方向と聴覚定位方向とのずれである定位差を測定して記録する。ずれは、角度差、ずれの方向などの情報である。

音声再生システム１は、選択した候補関数の全てについて上の処理を行い、各候補関数の定位差を測定する。そして、この定位差に基づき、複数の候補関数の中から、このユーザＬにとって最適な頭部伝達関数を決定する。この決定された頭部伝達関数がコンテンツ再生処理でコンテンツである音声データの定位に使用される。

コンテンツ再生処理では、音声再生システム１は、以下の処理を実行する。携帯端末装置１０が、ユーザＬの居る場所や時刻等を検出し、所定の場所、時刻になると、その場所、時刻に応じた音声を再生する。再生される音声は予め決められた方向に定位される。携帯端末装置１０は、ユーザＬの現在位置、ユーザＬの頭部の向き、および、音声の定位位置に基づいて、ユーザＬの頭部が向いている方向に対する音声の定位方向（相対定位方向）を算出する。携帯端末装置１０は、頭部伝達関数選択処理で決定された頭部伝達関数（セット）から相対定位方向に対応する角度の頭部伝達関数を読み出して信号処理部１０５にセットする。信号処理部１０５は、再生された音声信号に対して頭部伝達関数を畳み込む信号処理を行う。信号処理された音声信号は、ヘッドホン２０に送信される。ヘッドホン２０は、受信した音声をスピーカ２１Ｒ，２１Ｌから出力する。これにより、ユーザＬは、所定の方向から聞こえてくるような感覚で音声を聞くことができる。

図２を参照して携帯端末装置１０を詳細に説明する。携帯端末装置１０は、制御部１００、記憶部１０１、ネットワーク通信部１０２、ＧＰＳ測位部１０３、音声生成部１０４、信号処理部１０５、および、デバイス通信部１０６を有するスマートホンである。制御部１００は、ＣＰＵを含んでいる。記憶部１０１は、ＲＯＭ、ＲＡＭおよびフラッシュメモリを含んでいる。

記憶部１０１には、アプリケーションプログラム７０、音声データ７１、シナリオファイル７２、頭部伝達関数データベース７３、プロファイルテーブル７４、および、選択ログ７５が記憶されている。

アプリケーションプログラム７０は、この携帯端末装置１０およびヘッドホン２０を、本実施形態の音声再生システム１として機能させるためのプログラムである。音声データ７１は、頭部伝達関数の選択時に再生されるテスト音声、および、シナリオファイル７２に基づいて再生されるコンテンツとしての音声データを含んでいる。シナリオファイル７２は、コンテンツである音声データの再生イベントが記述されたファイルであり、コンテンツ再生処理で使用される。シナリオファイル７２には、イベントごとに、音声データの再生タイミング、再生される音声の定位位置、再生する音声データの識別情報が記載されている。

頭部伝達関数データベース７３には、複数の頭部伝達関数が記憶されている。各頭部伝達関数は、それぞれ異なるプロファイルのモデルで測定されたものである。プロファイルテーブル７４は、頭部伝達関数データベース７３に記憶されている各頭部伝達関数のプロファイルを記憶したテーブルである。頭部伝達関数選択処理において、ユーザＬが自身のプロファイルを入力すると、このプロファイルでプロファイルテーブル７４が参照され、似たプロファイルを有する頭部伝達関数が候補関数として選択される。

図４はプロファイルテーブル７４の例を示す図である。プロファイルテーブル７４には、頭部伝達関数データベース７３に記憶されている各頭部伝達関数の（モデルの）プロファイルがそれぞれ記憶される。プロファイルとして、この例では、人種、性別、年齢、頭部形状、耳介形状が記憶されている。「人種」は、東アジア（モンゴロイド）、白人（コーカソイド）、黒人（ネグロイド）など骨格の違いで分類されている。「性別」、「年齢」は、モデルおよびユーザＬの体格、体型を推定する指標である。「頭部形状」は、たとえば、丸形、四角形、逆三角形、五角形などの形状で表され、頭部伝達関数を決定する重要な要素である。「耳介形状」は、たとえば、丸形、四角型、三角形などの形状で表され、頭部伝達関数を決定する重要な要素である。図４の例では、以上のプロファイルで頭部伝達関数を分類しているが、プロファイルはこれに限定されない。例えば、モデルの身長、体重などをプロファイルの項目に入れてもよい。

頭部伝達関数選択処理において、ユーザＬは、自身のプロファイルとして、プロファイルテーブル７４に記載されている項目の全部または一部を入力する。音声再生システム１は、ユーザＬによって入力されたプロファイルと、プロファイルテーブル７４に記憶されている各頭部伝達関数のプロファイルとを比較し、一致するものが多いものなどを候補関数として選択する。この選択において、プロファイルの各項目を平等に扱ってもよく、影響の大きいと思われる項目の係数を大きくするなど、重み付けをしてもよい。また、プロファイルは、例えば携帯端末装置１０に予め設定されている情報、例えば、住んでいる地域または使用している言語等に基づいて選択してもよい。この場合、携帯端末装置１０は、予め設定されている各種の情報と、プロファイルと、を対応付けるテーブルを記憶部１０１に記憶しておく。携帯端末装置１０は、当該テーブルに基づいてプロファイルを選択することで、プロファイルの選択の精度を簡易に高めることができる。

図５は、選択ログ７５の例を示す図である。選択ログ７５には、頭部伝達関数選択処理の選択結果が記録される。すなわち、頭部伝達関数選択処理において、ユーザＬのユーザＩＤ、ユーザＬによって入力されたプロファイル、および、最終的にユーザＬに適用すべく選択された頭部伝達関数とが対応付けて記録される。選択ログ７５の内容は、定期的または不定期にサーバ３にアップロードされる。

ネットワーク通信部１０２は、ネットワーク４を介してサーバ３と通信する。制御部１００は、ネットワーク通信部１０２を用いて、サーバ３に選択ログ７５の内容をアップロードする。この実施形態では、頭部伝達関数データベース７３が、携帯端末装置１０の記憶部１０１に記憶されているが、サーバ３に記憶されていてもよい。この場合、携帯端末装置１０は、ユーザＬのプロファイルでプロファイルテーブル７４を参照して複数の候補関数（頭部伝達関数）を選択し、選択した頭部伝達関数をサーバ３からダウンロードすればよい。ＧＰＳ測位部１０３は、ＧＰＳ（Global Positioning System）衛星の信号を受信して、自身の正確な位置を測定する。

音声生成部１０４は、ヘッドホン２０に出力する音声を生成する。音声生成部１０４によって生成された音声信号は、信号処理部１０５に入力される。信号処理部１０５には、頭部伝達関数がセットされている。具体的には、信号処理部１０５は、ＦＩＲフィルタとして構成されており、頭部伝達関数を時間領域に変換した頭部インパルス応答がフィルタ係数としてセットされる。信号処理部１０５は、音声信号に頭部伝達関数（頭部インパルス応答）に畳み込むことにより、この音声が指定された方向から聴こえてくるような周波数特性に加工する。

デバイス通信部１０６は、Ｂｌｕｅｔｏｏｔｈ対応機器であるヘッドホン２０と通信する。デバイス通信部１０６は、ヘッドホン２０に対して音声信号の送信を行うとともに、ヘッドホン２０からジャイロセンサ２３の検出値を受信する。

図３のブロック図を参照して、ヘッドホン２０の構成を説明する。ヘッドホン２０は、スピーカ２１Ｌ，２１Ｒ、ジャイロセンサ２３、デバイス通信部２４、ＡＩＦ２５、ＤＡＣ２６Ｌ，２６Ｒ、アンプ２７Ｌ，２７Ｒを備えている。

デバイス通信部２４は、Ｂｌｕｅｔｏｏｔｈ対応機器である携帯端末装置１０（デバイス通信部１０６）と通信する。ＡＩＦ（ＡｕｄｉｏＩｎｔｅｒｆａｃｅ）２５は、携帯端末装置１０から受信した音声信号を左右チャンネル毎にＤＡＣ２６Ｌ，２６Ｒに送信する。ＤＡＣ（ＤｉｇｔａｌｔｏＡｎａｌｏｇＣｏｎｖｅｒｔｅｒ）２６Ｌ，２６Ｒは、ＡＩＦ２５から入力されたデジタル信号をアナログ信号に変換する。アンプ２７Ｌ，２７Ｒは、ＤＡＣ２６Ｌ，２６Ｒから入力されたアナログ信号を増幅してスピーカ２１Ｌ，２１Ｒに供給する。これにより、携帯端末装置１０から受信した音声信号は、音響としてスピーカ２１Ｌ，２１Ｒから放音される。上述したように、音声信号は、予め決められた位置に定位するよう信号処理されているため、ユーザＬが移動しても且つ頭部の向きを変えても、ユーザＬには同じ位置から発音しているように聞こえる。

図６のフローチャートを参照して、頭部伝達関数選択処理について説明する。この実施形態では、頭部伝達関数選択処理は、携帯端末装置１０の制御部１００によって実行される。図６において、ユーザＬが自身のプロファイルを入力する（Ｓ１１）。携帯端末装置１０は、入力されたユーザプロファイルでプロファイルテーブル７４を参照し、候補となる頭部伝達関数（候補関数）を複数選択する（Ｓ１２）。Ｓ１２で選択される候補関数の数は、ｍ個（ｎ＝１～ｍ）とする。

テストされる候補関数を示す引数ｎに１がセットされる（Ｓ１３）。テストでは、候補関数ｎを用いて定位されたテスト音声が、ユーザＬには、どの方向に聞こえるかが判定される。携帯端末装置１０は、テスト音声の定位方向（発音定位方向）を決定する（Ｓ１４）。テスト音声の定位方向は、予め一つの方向を決めておいてもよいが、ユーザＬの慣れを防ぐため、毎回異なる方向を決定すればよい。また、携帯端末装置１０が、テスト音声の定位方向を、決定した発音定位方向を中心にわずかに揺らせることにより、ユーザＬが定位方向を認識しやすくなる。発音定位方向を揺らせる処理は、信号処理部１０５にセットされた頭部インパルス応答の１または数個のフィルタ係数を、わずかに上下させることによって可能である。

携帯端末装置１０は、この定位方向の単一方向頭部伝達関数をｎ番目の候補関数セットから読み出して信号処理部１０５にセットする（Ｓ１５）。頭部伝達関数がセットされたのち、携帯端末装置１０は、テスト音声を発生する（Ｓ１６）。

テスト音声が発生されると、ユーザＬが、自身の聴覚上のテスト音声の定位方向（聴覚定位方向）を入力する（Ｓ１７）。ユーザＬによる聴覚定位方向の入力は、どのような方法であってもよい。たとえば、「ユーザＬが、手に持っている携帯端末装置１０を聴覚定位方向に向ける。」、「ユーザＬが、聴覚定位方向に頭を向け、ジャイロセンサ２３でその方向を検出する。」などの方法採用することができる。

候補関数はユーザＬ自身の頭部伝達関数ではないため、発音定位方向とユーザＬの聴覚定位方向には、ずれが生じることが考えられる。Ｓ１８では、そのずれである定位差を算出して記録する（Ｓ１８）。定位差として、ずれの大きさ（角度の絶対値）、ずれの方向（発音定位方向から聴覚定位方向への相対角度）などが記録される。

携帯端末装置１０は、候補関数１～ｍについて、Ｓ１４－Ｓ１８の処理を繰り返し実行する（Ｓ１９，Ｓ２０）。Ｓ１４－Ｓ１８の処理は、テスト発音を発生して発音定位方向とユーザＬの聴覚定位方向の定位差を測定する処理である。候補関数１～ｍの定位差を算出・記録したのち、この記録に基づいて、候補関数１～ｍのなかから最適な頭部伝達関数を決定する（Ｓ２１）。頭部伝達関数の決定方法は制限がないが、例えば、「角度差の最も小さいものを選択する。」、「水平方向の角度差が最も小さいものを選択する。」などの手法を採用することが可能である。そして、今回の選択結果をユーザＬのプロファイルとともに選択ログ７５に記録する（Ｓ２２）。

図６の頭部伝達関数選択処理において、ユーザＬからのプロファイルの入力がない場合、過去の選択ログ７５を参照して、以前に選択された頭部伝達関数を今回も選択するようにしてもよい。

以上詳述した実施形態から、以下のような態様が把握される。

一実施形態に係る音響デバイスは、ユーザが両耳に装用する放音部と、複数の頭部伝達関数を記憶した記憶部と、信号処理部と、制御部とを備える。信号処理部は、放音部から放音する音声信号を頭部伝達関数により処理する。制御部は、頭部伝達関数選択処理を実行する。制御部は、頭部伝達関数選択処理において以下の処理を実行する。制御部は、複数の頭部伝達関数から２以上の頭部伝達関数を候補関数として選択する。制御部は、選択した各候補関数について、所定のテスト音声を、所定の発音定位方向に定位するよう候補関数で処理して前記放音部から放音する。制御部は、選択した各候補関数について、放音部から放音されたテスト音声の、ユーザの聴覚上の定位方向である聴覚定位方向の入力を受け付ける。制御部は、選択した各候補関数について、発音定位方向と聴覚定位方向の差である定位差を算出する。制御部は、２以上の候補関数についての定位差に基づいて、ユーザに適用する頭部伝達関数を選択する。制御部は、例えば、定位差が所定の閾値を超える候補関数を選択する。

一態様においては、放音部が、ヘッドホンまたはイヤホンであってもよい。

一態様においては、制御部は、複数の候補関数から一つの頭部伝達関数を選択することに代えて、２または３以上の候補関数を選択してもよい。制御部は、選択したこれらの関数値を補間して作成した新たな頭部伝達関数をユーザに適用してもよい。

一態様においては、ユーザの頭部の向きを検出する方位検出部をさらに備えてもよい。制御部は、テスト音声を聴いたユーザが向いたときの方位検出部の検出方向を聴覚定位方向として取得してもよい。

一態様においては、音響デバイスが、オーディオ再生装置が有線または無線で接続された構成であってもよい。記憶部、信号処理部、および、制御部の一部または全部がオーディオ再生装置に設けられていてもよい。

一態様においては、オーディオ再生装置または放音部にネットワーク通信部を備えてもよい。記憶部および制御部の一部がネットワーク上のサーバに設けられていてもよい。

一態様において、制御部は、ユーザに適用するよう選択された候補関数の情報を、サーバに送信してもよい。サーバは、複数の音響デバイスから頭部伝達関数の選択情報を収集してもよい。

一態様においては、複数の頭部伝達関数として、異なる(various)プロファイルの頭部伝達関数が記憶されていてもよい。ユーザのプロファイルに近いプロファイルの頭部伝達関数が候補関数として選択されてもよい。

《変形例１》
上記実施形態では、携帯端末装置１０は、各候補関数について１回ずつテスト音声が発生されるようにしていた。各候補関数について、それぞれ別の発音定位方向で複数回ずつテスト音声が発生されるようにしてもよい。この場合、携帯端末装置１０は、同じ候補関数についてＳ１４－Ｓ１８の処理を複数回繰り返せばよい。

《変形例２》
上記実施形態では、携帯端末装置１０は、定位差に基づいて一つの候補関数を選択し、この候補関数（頭部伝達関数）をユーザＬに適用している。携帯端末装置１０が、定位差に基づいて複数の候補関数を選択し、これらの候補関数を補間してユーザに適用してもよい。

《変形例３》
上記実施形態では、本発明の音響デバイスが、携帯端末装置１０とヘッドホン２０との組み合わせで構成されていた。本発明の音響デバイスの全ての構成が、ヘッドホン２０に集約されていてもよい。

《変形例４》
本発明の音響デバイスの構成の一部が、ネットワーク上のサーバ３に存在していてもよい。たとえば、頭部伝達関数データベース７３がサーバ３に設けられ、プロファイルに基づいて選択された候補関数がサーバ３からダウンロードされてもよい。

《変形例５》
上記実施形態では、ユーザが入力したプロファイルに基づいて候補関数が選択される。ユーザが装用するヘッドホンが、カメラなどのセンサを備え、センサによってヘッドトラッキングデータ取得してもよい。システムは、ヘッドトラッキングデータに基づいてユーザの頭の形状を推定し、候補関数またはユーザに設定される頭部伝達関数を自動選択する。

１音声再生システム
１０携帯端末装置（スマートホン）
２０ヘッドホン
２１スピーカ
２３ジャイロセンサ
７０アプリケーションプログラム
７３頭部伝達関数データベース
７４プロファイルテーブル
７５選択ログ
１０１記憶部
１０５信号処理部

Claims

ユーザが両耳に装用する放音部と、
複数の頭部伝達関数を記憶した記憶部と、
前記放音部から放音する音声信号を前記頭部伝達関数により処理する信号処理部と、
頭部伝達関数選択処理を実行する制御部と、
を備えた音声再生システムであって、
前記制御部は、前記頭部伝達関数選択処理において、
ユーザのプロファイルを入力し、前記複数の頭部伝達関数から入力した前記プロファイルに対応する２以上の頭部伝達関数を候補関数として選択し、
選択した各候補関数について、
所定のテスト音声を、所定の定位方向である発音定位方向に定位するよう前記候補関数で処理して前記放音部から放音し、
前記放音部から放音された前記テスト音声の、前記ユーザの聴覚上の定位方向である聴覚定位方向を取得し、
前記発音定位方向と前記聴覚定位方向の差である定位差を算出し、
２以上の前記候補関数についての前記定位差に基づいて、前記ユーザに適用する頭部伝達関数を選択する
音声再生システム。
前記プロファイルは、前記ユーザの頭部形状または耳介形状の情報を含む請求項１に記載の音声再生システム。
前記制御部は、前記複数の候補関数から一つの頭部伝達関数を選択することに代えて、２または３以上の候補関数を選択し、選択された関数値を補間して作成した新たな頭部伝達関数を前記ユーザに適用する請求項１または請求項２に記載の音声再生システム。
前記ユーザの頭部の向きを検出する方位検出部をさらに備え、
前記制御部は、前記テスト音声を聴いたユーザが向いたときの前記方位検出部の検出方向を前記聴覚定位方向として取得する
請求項１乃至請求項３のいずれかに記載の音声再生システム。
オーディオ再生装置が有線または無線で接続され、前記記憶部、信号処理部、および、制御部の一部または全部が前記オーディオ再生装置に設けられている請求項１乃至請求項４のいずれかに記載の音声再生システム。
前記オーディオ再生装置は、ネットワーク通信部を備え、
前記記憶部および前記制御部の一部がネットワーク上のサーバに設けられている
請求項５に記載の音声再生システム。
前記放音部は、ネットワーク通信部を備え、
前記記憶部および前記制御部の一部がネットワーク上のサーバに設けられている
請求項１乃至請求項５のいずれかに記載の音声再生システム。
前記制御部は、前記ユーザに適用すべく選択された頭部伝達関数の情報を、前記サーバに送信する請求項６または請求項７に記載の音声再生システム。
前記候補関数として、入力した前記プロファイルに近いプロファイルに対応する２以上の頭部伝達関数が選択される
請求項１乃至請求項８のいずれかに記載の音声再生システム。
信号処理部を備えた装置が、
ユーザのプロファイルを入力し、複数の頭部伝達関数のうち、入力した前記プロファイルに対応する２以上の頭部伝達関数を候補関数として選択し、
選択した各候補関数について、所定のテスト音声を、所定の定位方向である発音定位方向に定位するよう前記候補関数で信号処理してユーザが両耳に装用する放音部から放音し、
前記放音部から放音された前記テスト音声の、前記ユーザの聴覚上の定位方向である聴覚定位方向を取得し、
前記発音定位方向と前記聴覚定位方向の差である定位差を算出し、
２以上の前記候補関数についての前記定位差に基づいて、前記ユーザに適用する頭部伝達関数を選択する
頭部伝達関数選択方法。
前記プロファイルは、前記ユーザの頭部形状または耳介形状の情報を含む請求項１０に記載の頭部伝達関数選択方法。
前記複数の候補関数から一つの頭部伝達関数を選択することに代えて、２または３以上の候補関数を選択し、選択された関数値を補間して作成した新たな頭部伝達関数を前記ユーザに適用する請求項１０または請求項１１に記載の頭部伝達関数選択方法。
前記ユーザの頭部の向きを検出し、
前記テスト音声を聴いたユーザが向いたとき検出された方向を前記聴覚定位方向として取得する
請求項１０乃至請求項１２のいずれかに記載の頭部伝達関数選択方法。
オーディオ再生装置を、有線または無線で接続し、
前記候補関数を選択する処理、前記テスト音声を前記候補関数で信号処理して放音する処理、前記聴覚定位方向の入力を受け付ける処理、前記定位差を算出する処理、および、前記ユーザに適用する頭部伝達関数を選択する処理、の一部または全部を前記オーディオ再生装置に実行させる
請求項１０乃至請求項１３のいずれかに記載の頭部伝達関数選択方法。
ネットワーク通信部を介してサーバと通信し、
前記候補関数を選択する処理、前記テスト音声を前記候補関数で信号処理して放音する処理、前記聴覚定位方向の入力を受け付ける処理、前記定位差を算出する処理、および、前記ユーザに適用する頭部伝達関数を選択する処理、の一部または全部を前記サーバに実行させる
請求項１０乃至請求項１４のいずれかに記載の頭部伝達関数選択方法。
前記ユーザに適用すべく選択された頭部伝達関数の情報を前記サーバに送信する請求項１５に記載の頭部伝達関数選択方法。
前記候補関数として、入力した前記プロファイルに近いプロファイルに対応する２以上の頭部伝達関数が選択される
請求項１０乃至請求項１６のいずれかに記載の頭部伝達関数選択方法。