JP6596896B2 - 頭部伝達関数選択装置、頭部伝達関数選択方法、頭部伝達関数選択プログラム、音声再生装置 - Google Patents

頭部伝達関数選択装置、頭部伝達関数選択方法、頭部伝達関数選択プログラム、音声再生装置 Download PDF

Info

Publication number
JP6596896B2
JP6596896B2 JP2015081483A JP2015081483A JP6596896B2 JP 6596896 B2 JP6596896 B2 JP 6596896B2 JP 2015081483 A JP2015081483 A JP 2015081483A JP 2015081483 A JP2015081483 A JP 2015081483A JP 6596896 B2 JP6596896 B2 JP 6596896B2
Authority
JP
Japan
Prior art keywords
head
transfer function
user
related transfer
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015081483A
Other languages
English (en)
Other versions
JP2016201723A (ja
Inventor
優美 藤井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
JVCKenwood Corp
Original Assignee
JVCKenwood Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by JVCKenwood Corp filed Critical JVCKenwood Corp
Priority to JP2015081483A priority Critical patent/JP6596896B2/ja
Priority to PCT/JP2016/052711 priority patent/WO2016167007A1/ja
Publication of JP2016201723A publication Critical patent/JP2016201723A/ja
Priority to US15/730,101 priority patent/US10142733B2/en
Application granted granted Critical
Publication of JP6596896B2 publication Critical patent/JP6596896B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/04Circuits for transducers, loudspeakers or microphones for correcting frequency response
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 
    • H04S5/02Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation  of the pseudo four-channel type, e.g. in which rear channel signals are derived from two-channel stereo signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/301Automatic calibration of stereophonic sound system, e.g. with test microphone
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/302Electronic adaptation of stereophonic sound system to listener position or orientation
    • H04S7/303Tracking of listener position or orientation
    • H04S7/304For headphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2499/00Aspects covered by H04R or H04S not otherwise provided for in their subgroups
    • H04R2499/10General applications
    • H04R2499/11Transducers incorporated or for use in hand-held devices, e.g. mobile phones, PDA's, camera's
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/01Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]

Description

本発明は、ユーザ自身の頭部伝達関数と近い頭部伝達関数を選択することができる頭部伝達関数選択装置、頭部伝達関数選択方法、頭部伝達関数選択プログラム、ユーザ自身の頭部伝達関数と近い頭部伝達関数を用いて音声信号を再生することができる音声再生装置に関する。
ヘッドホン(イヤホン)によって音声信号を再生して聴くと、音声が頭の中で鳴っているように感じる頭内定位という現象が起こりやすい。ダミーヘッドや他人の頭部による頭部伝達関数を用いて、音声が頭の外で鳴っているように頭外定位させる技術を用いれば、頭内定位の現象を低減させることができる。
特開2013−168924号公報 特表2013−524711号公報
頭部伝達関数は、頭部や耳介の形状によって特性が異なる。よって、ヘッドホンを装着して音声を聴くユーザ自身の頭部伝達関数を用いて音声を頭外定位させることが望ましい。しかしながら、自分自身の頭部伝達関数を日常生活の中で測定することは容易ではない。
本発明は、自分自身の頭部伝達関数に近似する頭部伝達関数を容易に選択することができる頭部伝達関数選択装置、頭部伝達関数選択方法、頭部伝達関数選択プログラムを提供することを目的とする。また、本発明は、自分自身の頭部伝達関数に近似する頭部伝達関数を用いて音声信号を再生することができる音声再生装置を提供することを目的とする。
本発明は、ユーザの顔の前方に位置させたスピーカから測定信号としての所定の音声を発生させた状態で、前記スピーカを垂直方向に円弧状に移動させて仰角として複数の角度に位置させたとき、前記ユーザの耳に装着したマイクロホンによって前記所定の音声を収音した音声信号に基づいて、前記複数の角度の位置における前記ユーザの複数の頭部インパルス応答を取得する測定部と、前記複数の頭部インパルス応答それぞれに対応する複数の周波数特性において特定の周波数の範囲に発生する局所的なピークの周波数を前記ユーザの頭部伝達関数の特徴量として抽出する特徴量抽出部と、前記特徴量抽出部によって抽出された特徴量に基づいて、複数の人それぞれの頭部伝達関数と頭部伝達関数の特徴量とを対応付けたデータベースからいずれかの頭部伝達関数を選択する特性選択部とを備える頭部伝達関数選択装置を提供する。
本発明は、ユーザの顔の前方に位置させたスピーカから測定信号としての所定の音声を発生させた状態で、前記スピーカを垂直方向に円弧状に移動させて仰角として複数の角度に位置させーザの耳に装着したマイクロホンによって前記所定の音声を収音した音声信号に基づいて、前記複数の角度の位置における前記ユーザの複数の頭部インパルス応答を取得し、前記複数の頭部インパルス応答それぞれに対応する複数の周波数特性において特定の周波数の範囲に発生する局所的なピークの周波数を前記ユーザの頭部伝達関数の特徴量として抽出し、抽出された特徴量に基づいて、複数の人それぞれの頭部伝達関数と頭部伝達関数の特徴量とを対応付けたデータベースからいずれかの頭部伝達関数を選択する部伝達関数選択方法を提供する。
本発明は、コンピュータに、ユーザの顔の前方に位置させたスピーカから測定信号としての所定の音声を発生させた状態で、前記スピーカを垂直方向に円弧状に移動させて仰角として複数の角度に位置させたとき、前記ユーザの耳に装着したマイクロホンによって前記所定の音声を収音した音声信号に基づいて、前記複数の角度の位置における前記ユーザの複数の頭部インパルス応答を取得するステップと、前記複数の頭部インパルス応答それぞれに対応する複数の周波数特性において特定の周波数の範囲に発生する局所的なピークの周波数を前記ユーザの頭部伝達関数の特徴量として抽出するステップと、抽出された特徴量に基づいて、複数の人それぞれの頭部伝達関数と頭部伝達関数の特徴量とを対応付けたデータベースからいずれかの頭部伝達関数を選択するステップとを実行させる頭部伝達関数選択プログラムを提供する。
本発明は、ユーザの顔の前方に位置させたスピーカから測定信号としての所定の音声を発生させた状態で、前記スピーカを垂直方向に円弧状に移動させて仰角として複数の角度に位置させたとき、前記ユーザの耳に装着したマイクロホンによって前記所定の音声を収音した音声信号に基づいて、前記複数の角度の位置における前記ユーザの複数の頭部インパルス応答を取得する測定部と、前記複数の頭部インパルス応答それぞれに対応する複数の周波数特性において特定の周波数の範囲に発生する局所的なピークの周波数を前記ユーザの頭部伝達関数の特徴量として抽出する特徴量抽出部と、前記特徴量抽出部によって抽出された特徴量に基づいて、複数の人それぞれの頭部伝達関数と頭部伝達関数の特徴量とを対応付けたデータベースからいずれかの頭部伝達関数を選択する特性選択部と、音声データに、前記特性選択部によって選択された頭部伝達関数を畳み込み演算して、前記音声データを再生する再生部とを備える音声再生装置を提供する。
本発明の頭部伝達関数選択装置、頭部伝達関数選択方法、頭部伝達関数選択プログラムによれば、自分自身の頭部伝達関数に近似する頭部伝達関数を容易に選択することができ、自分自身の特性に近い定位効果を容易に実現できる。本発明の音声再生装置によれば、自分自身の頭部伝達関数に近似する頭部伝達関数を用いて音声信号を再生することができる。
一実施形態の頭部伝達関数選択装置及び音声再生装置を示すブロック図である。 ユーザの頭部インパルス応答を測定する第1測定例を示すフローチャートである。 携帯端末を水平方向の角度0°、仰角0°である顔の正面に位置させた状態を示す模式図である。 携帯端末を仰角0°の位置から30°,60°に移動させる状態を示す模式図である。 第1測定例による測定パターンを示す図である。 無響室において測定信号の音声をスピーカより出力させて、水平方向の角度0°で仰角を変化させたときの頭部伝達関数を示す特性図である。 ユーザの頭部インパルス応答を測定する第2測定例を示すフローチャートである。 携帯端末を水平方向の角度−30°の位置から0°,30°に移動させる状態を示す模式図である。 第2測定例による測定パターンを示す図である。 ユーザの頭部インパルス応答を測定する第3測定例を示すフローチャートである。 第3測定例による測定パターンを示す図である。 第1〜第4測定例をまとめた図である。
以下、一実施形態の頭部伝達関数選択装置、頭部伝達関数選択方法、頭部伝達関数選択プログラム、音声再生装置について、添付図面を参照して説明する。
<頭部伝達関数選択装置及び音声再生装置の全体構成>
まず、図1を用いて、一実施形態の頭部伝達関数選択装置及び音声再生装置の全体構成を説明する。
図1において、汎用の携帯端末100は、頭部伝達関数選択装置及び音声再生装置として機能する。携帯端末100は、一例として、スマートフォン等の携帯電話であってもよい。
携帯端末100は、カメラ1と、加速度センサ2と、角速度センサ3とを備える。カメラ1と、加速度センサ2と、角速度センサ3とは、例えばCPUによって構成される制御部4に接続されている。制御部4は、測定部41と、特徴量抽出部42と、特性選択部43と、再生部44とを有する。
カメラ1が被写体を撮影した撮影信号は測定部41に入力され、測定部41より表示部10に供給されて表示される。ユーザが、図示していない操作部によって所定の操作をしたら、カメラ1は被写体を撮影して撮影信号を生成すればよい。
加速度センサ2が検出した加速度検出信号と、角速度センサ3が検出した携帯端末100の傾きや角度を示す角速度検出信号は測定部41に入力される。加速度センサ2及び角速度センサ3は、携帯端末100の電源が投入されている状態で常時動作していてもよい。
測定部41は、ユーザの頭部インパルス応答(HRIR)を測定するための所定の測定信号であるデジタル音声データを発生させることができる。ユーザが操作部によって所定の操作をしたら、測定部41はデジタル音声データをD/A変換器5に供給する。
D/A変換器5はデジタル音声データをアナログ音声信号に変換して、スピーカ6に供給する。スピーカ6は、携帯端末100に内蔵されているスピーカでよい。スピーカ6として、外付けのスピーカを用いてもよい。スピーカ6はモノラルスピーカであってもよく、ステレオスピーカであってもよい。
音声信号出力端子7には、ヘッドホン40が取り付けられることがある。ヘッドホン40の使い方については後述する。
マイクロホン接続端子8には、マイクロホン20が接続されている。マイクロホン20は、ユーザの耳介に装着できるイヤホン型のマイクロホンであることが好ましい。マイクロホン20は、モノラルのマイクロホンであってもよく、ステレオのマイクロホンであってもよい。本実施形態においては、マイクロホン20は、モノラルのマイクロホンであるとする。
後述するようにして、ユーザが携帯端末100を自分の顔の前方に位置させた状態でスピーカ6より音声を出力させたとき、マイクロホン20は音声を収音する。マイクロホン20より出力されたアナログ音声信号は、マイクロホン接続端子8を介してA/D変換器9に入力される。A/D変換器9は、アナログ音声信号をデジタル音声データに変換して、測定部41に供給する。
測定部41に入力されるデジタル音声データは、ユーザの頭部や耳介の形状によって異なるユーザ自身のHRIRを示す。
測定部41は、携帯端末100を後述する複数の位置に位置させたときのHRIRを取得して、記憶部11に一時的に記憶させる。記憶部11に記憶されたHRIRは、特徴量抽出部42に入力される。
特徴量抽出部42は、入力されたHRIRをフーリエ変換して頭部伝達関数(HRTF)を生成する。測定部41がHRIRをHRTFに変換して、記憶部11に記憶させてもよい。
特徴量抽出部42は、ユーザのHRTFが有する特徴量を取得する。特徴量の詳細については後述する。特徴量抽出部42が抽出した特徴量は、特性選択部43に入力される。
外部のサーバ30には、多数の人のそれぞれのHRTFと、後述するHRTFの特徴量とを対応付けたデータベース301が記憶されている。特性選択部43は、通信部12を介してサーバ30にアクセスし、データベース301より、特徴量抽出部42が抽出した特徴量に最も近似する特徴量を有するHRTFを選択する。
選択されたHRTFは、通信部12を介して特性選択部43に入力される。選択されたHRTFは、ユーザ自身のHRTFとほぼ同等のHRTFである。特性選択部43は、HRTFを再生部44に供給する。
携帯端末100が予めデータベース301を内蔵していてもよい。携帯端末100がサーバ30にアクセスしてデータベース301のデータを読み出し、記憶部11または図示していない他の記憶部にデータベース301と同様のデータを記憶させもよい。
再生部44には、音声信号入力端子13を介して、外部より、携帯端末100によって再生すべきデジタル音声データが入力される。再生部44に、携帯端末100に内蔵された記憶部に記憶されたデジタル音声データが入力されてもよい。外部よりアナログ音声信号が入力される場合には、A/D変換器9または他のA/D変換器によってデジタル音声データに変換して再生部44に供給すればよい。
再生部44は、デジタル音声データにHRTFを畳み込み演算するフィルタ441を有する。フィルタ441は、入力されたデジタル音声データに特性選択部43によって選択されたHRTFを畳み込み演算して、D/A変換器5に供給する。D/A変換器5は、再生部44より供給されたデジタル音声データをアナログ音声信号に変換する。
D/A変換器5より出力されたアナログ音声信号は、音声信号出力端子7を介してヘッドホン40に供給される。ヘッドホン40は、オーバヘッド型、インナイヤ型、カナル型等の任意のヘッドホンである。ヘッドホンには、イヤホンと称されているものも含まれる。ヘッドホン40とマイクロホン20とが一体的に構成されていてもよい。
ユーザは、ヘッドホン40を頭部または耳介に装着して、音声信号出力端子7より出力されたアナログ音声信号による音声を聴く。フィルタ441によってユーザ自身のHRTFとほぼ同等のHRTFが畳み込まれていることから、ユーザは、自分自身に適した状態で頭外定位した音声を聴くことができる。
また、ユーザは、左右の音声が後述する所定の角度方向から鳴っているような状態で音声を聴くことができる。
次に、ユーザのHRIRを測定するための具体的な測定例を順に説明する。
<第1測定例>
図2に示すフローチャートを用いて、第1測定例を説明する。図2に示すフローチャートまたは後述するフローチャートは、ユーザによる動作を示すステップと、携帯端末100で実行される処理を示すステップとを含む。
図2において、ユーザは、ステップS11にて、マイクロホン20を一方の耳に装着し、携帯端末100の仰角γを0°とし、水平方向の角度θとして0°の方向に位置させる。
具体的には、図3に示すように、ユーザは例えば左耳50Lにマイクロホン20を装着し、携帯端末100を頭部50(顔)の正面に位置させる。携帯端末100が顔の正面である状態を、水平方向の角度θが0°であるとする。
また、携帯端末100が所望の位置に正しく位置していることを確認するために、カメラ1で撮影した映像や、加速度センサ2、角速度センサ3を用いて、顔の位置が正面となるように、位置補正を行ってもよい。
図4に示すように、携帯端末100を頭部50の中心を中心として垂直方向に円弧状に移動させたときの垂直方向の角度を仰角γとする。ユーザが携帯端末100を左耳50Lまたは右耳50Rの高さに位置させた状態を、仰角γが0°であるとする。
図3及び図4に実線で示す携帯端末100の位置が、ステップS11による携帯端末100の設定位置である。
ユーザは、ステップS13にて、上述した測定信号の音声をスピーカ6より出力させた状態で、携帯端末100の仰角γを0°の位置から、30°,60°の位置へと移動させる。このとき、測定部41は、仰角γとして0°,30°,60°のHRIRを取得する。
測定部41には、カメラ1が被写体を撮影した撮影信号、加速度センサ2からの加速度検出信号、角速度センサ3からの角速度検出信号が入力される。よって、測定部41は、携帯端末100が、0°,30°,60°のそれぞれの仰角γに位置した時点でのHRIRを取得すればよい。
ユーザは、仰角γを厳密に気にする必要はなく、仰角γが0°から60°の範囲を含むように、携帯端末100を垂直方向に移動させればよい。このとき、カメラ1で撮影した映像と加速度センサ2、角速度センサ3の情報から、測定時の携帯端末100を移動させる軌道から外れたことを検出した場合、正しい軌道を表示部10に表示するなどの処理を行い、軌道を修正可能としてもよい。
次に、ユーザは、ステップS14にて、マイクロホン20をもう一方の耳に装着し、携帯端末100の仰角γを0°とし、水平方向の角度θとして0°の方向に位置させる。
ユーザは、ステップS16にて、測定信号の音声をスピーカ6より出力させた状態で、携帯端末100の仰角γを0°の位置から、30°,60°の位置へと移動させる。このとき、測定部41は、仰角γとして0°,30°,60°のHRIRを取得する。
第1測定例による測定パターンは、図5に示す測定パターンMP1である。なお、仰角γの0°,30°,60°は単なる例であり、他の角度でもよいし、仰角γの数は3つに限定されるものではない。仰角γの数は2つ以上とするのがよい。
特徴量抽出部42は、ステップS17にて、HRIRの特徴量を抽出する。特徴量抽出部42は、一例として、次のようにHRIRの特徴量を抽出すればよい。
図6において、実線で示す特性は、水平方向の角度θを0°、仰角γを0°として、無響室で、測定信号の音声をスピーカ6より出力させたときに測定したHRTFを示している。一点鎖線で示す特性は、水平方向の角度θを0°、仰角γを10°として、無響室で、測定信号の音声をスピーカ6より出力させたときに測定したHRTFを示している。
図6に示すようなHRTFは、個人の頭部形状や耳の形状により特性が異なる。マサチューセッツ工科大学や名古屋大学の板倉研究室らは、全方向における入射角度を測定したHRTFのデータベースをインターネットで公開している。
図6は、東北大学電子通信研究所先端音情報システム研究室(http://www.ais.riec.tohoku.ac.jp/lab/db-hrtf/index-j.html)らが公開している、無響室で測定したHRTFについて、ある特定の被験者における水平方向0°、仰角方向0°〜30°の測定データを取得し、図式化したものである。
破線で示す特性は、水平方向の角度θを0°、仰角γを20°として、無響室で、測定信号の音声をスピーカ6より出力させたときに測定したHRTFを示している。二点鎖線で示す特性は、水平方向の角度θを0°、仰角γを30°として、無響室で、測定信号の音声をスピーカ6より出力させたときに測定したHRTFを示している。
図6に示すように、周波数10kHz〜20kHzの局所的なピークP2の周波数は、仰角γが0°〜30°でほぼ同一である。ここでは図示していない仰角γが30°〜60°でも同様に、ピークP2の周波数はほぼ同一となる。
前述のデータベースを参照し、本発明者による他の被験者の測定データを検証し図式したところ、同一被験者においては、仰角γが0°から30°において、ピークP2の周波数は同一またはほぼ同一であるが、異なる被験者においては発生するピークP2は異なる周波数となることを確認した。このため、特徴量抽出部42は、ピークP2の周波数をユーザそれぞれのHRTFの特徴量の1つして抽出する。
特徴量抽出部42は、ピークP2の周波数に加えて、仰角γに応じたピークP2の振幅増減の変化量をHRTFの特徴量として抽出してもよい。
図5に示す測定パターンMP1によって測定したHRTFの特徴量を特徴量1と称することとする。データベース301には、多数の人のそれぞれのHRTFと少なくとも特徴量1とが対応付けられている。
図2に戻り、特性選択部43は、ステップS18にて、データベース301より、特徴量抽出部42が抽出した特徴量1に最も近似する特徴量を有するHRTFを選択し、HRTFを再生部44に設定して処理を終了させる。
HRTFは、一例として、左右の音声を仰角γで水平方向の角度±θ°の方向に定位させるHRTF(θ,0),HRTF(−θ,0)なるデータである。角度θ°は例えば30°である。
<第2測定例>
図7に示すフローチャートを用いて、第2測定例を説明する。図7において、ユーザは、ステップS21にて、マイクロホン20を一方の耳に装着し、携帯端末100の仰角γを0°とし、水平方向の所定の位置に位置させる。
具体的には、図8に示すように、ユーザは例えば左耳50Lにマイクロホン20を装着し、携帯端末100を頭部50(顔)の正面に対して例えば左側に位置させる。第2測定例においても、第1速定例と同様に、携帯端末100が所望の位置に正しく位置していることを確認するために、カメラ1で撮影した映像や、加速度センサ2、角速度センサ3を用いて、顔の位置が正面となるように、位置補正を行ってもよい。
ユーザは、ステップS22にて、測定信号の音声をスピーカ6より出力させた状態で、携帯端末100を頭部50の中心を中心として、図8に二点鎖線で示すように水平方向に円弧状に移動させる。このとき、測定部41は、水平方向の角度θとして−30°,30のHRIRを取得する。
ここでも、測定部41には、カメラ1が被写体を撮影した撮影信号、加速度センサ2からの加速度検出信号、角速度センサ3からの角速度検出信号が入力される。よって、測定部41は、携帯端末100が、−30°,30それぞれの水平方向の角度θに位置した時点でのHRIRを取得すればよい。
ユーザは、水平方向の角度θを厳密に気にする必要はなく、水平方向の角度θが−30°から30°の範囲を含むように、携帯端末100を水平方向に移動させればよい。
次に、ユーザは、ステップS23にて、測定信号の音声をスピーカ6より出力させた状態で、水平方向の角度θを0°とし、携帯端末100の仰角γを0°の位置から、30°,60°の位置へと移動させる。このとき、測定部41は、仰角γとして0°,30°,60°のHRIRを取得する。
引き続き、ユーザは、ステップS24にて、マイクロホン20をもう一方の耳に装着し、ステップS21と同様に、携帯端末100の仰角γを0°とし、水平方向の所定の位置に位置させる。
ユーザは、ステップS25にて、測定信号の音声をスピーカ6より出力させた状態で、携帯端末100を頭部50の中心を中心として水平方向に円弧状に移動させる。このとき、測定部41は、水平方向の角度θとして−30°,30のHRIRを取得する。
次に、ユーザは、ステップS26にて、測定信号の音声をスピーカ6より出力させた状態で、水平方向の角度θを0°とし、携帯端末100の仰角γを0°の位置から、30°,60°の位置へと移動させる。このとき、測定部41は、仰角γとして0°,30°,60°のHRIRを取得する。
第2測定例においても、第1測定例と同様に、カメラ1で撮影した映像と加速度センサ2、角速度センサ3の情報から、測定時の携帯端末100を移動させる軌道から外れたことを検出した場合、正しい軌道を表示部10に表示するなどの処理を行い、軌道を修正可能としてもよい。
第2測定例による測定パターンは、図9に示す測定パターンMP1及びMP2である。図7では、測定パターンMP2による測定の次に測定パターンMP1による測定としたが、順番は逆でもよい。
同様に、仰角γの0°,30°,60°は単なる例であり、他の角度でもよいし、仰角γの数は3つに限定されるものではない。仰角γの数は2つ以上とするのがよい。水平方向の角度θは−30°と30°に限定されない。
特徴量抽出部42は、ステップS27にて、HRTFの特徴量を抽出する。特徴量抽出部42は、一例として、次のようにHRIRの特徴量を抽出すればよい。
図9に示す測定パターンMP2における水平方向の角度θが−30°のときのピークP2の周波数を特徴量4と称し、30°のときのピークP2の周波数を特徴量5と称することとする。データベース301には、多数の人のそれぞれのHRTFと少なくとも特徴量1,4,5とが対応付けられている。
特徴量4,5には、図6における4kHz近傍のピークP1の周波数を特徴量として加えてもよい。人それぞれでピークP1の周波数も異なることから、ピークP1の周波数をユーザそれぞれのHRTFの特徴量の1つとすることができる。ピークP1の振幅値をHRIRの特徴量として加えてもよい。
図7に戻り、特性選択部43は、ステップS28にて、データベース301より、特徴量抽出部42が抽出した特徴量1,4,5に最も近似する特徴量を有するHRTFを選択し、HRTFを再生部44に設定して処理を終了させる。
HRTFの具体的なデータは第1測定例と同様であり、一例として、左右の音声を仰角γで水平方向の角度±θ°の方向に定位させるHRTF(θ,0),HRTF(−θ,0)なるデータである。角度θ°は例えば30°である。
<第3測定例>
図10に示すフローチャートを用いて、第3測定例を説明する。図10において、ユーザは、ステップS301にて、マイクロホン20を一方の耳に装着し、携帯端末100の仰角γを0°とし、水平方向の角度θとして−30°に位置させる。
図8に実線で示す携帯端末100の位置が、ステップS301による携帯端末100の設定位置である。第3測定例においても、第1速定例または第2測定例と同様に、携帯端末100が所望の位置に正しく位置していることを確認するために、カメラ1で撮影した映像や、加速度センサ2、角速度センサ3を用いて、顔の位置が正面となるように、位置補正を行ってもよい。
ユーザは、ステップS302にて、測定信号の音声をスピーカ6より出力させた状態で、携帯端末100を仰角方向に移動させる。このとき、測定部41は、仰角γとして0°,30°,60°のHRIRを取得する。
次に、ユーザは、ステップS303にて、携帯端末100の仰角γを0°とし、水平方向の角度θとして30°に位置させる。
ユーザは、ステップS304にて、測定信号の音声をスピーカ6より出力させた状態で、携帯端末100を仰角方向に移動させる。このとき、測定部41は、仰角γとして0°,30°,60°のHRIRを取得する。
引き続き、ユーザは、ステップS305にて、マイクロホン20をもう一方の耳に装着し、ステップS301と同様に、携帯端末100の仰角γを0°とし、水平方向の角度θとして−30°に位置させる。
ユーザは、ステップS306にて、測定信号の音声をスピーカ6より出力させた状態で、携帯端末100を仰角方向に移動させる。このとき、測定部41は、仰角γとして0°,30°,60°のHRIRを取得する。
次に、ユーザは、ステップS307にて、携帯端末100の仰角γを0°とし、水平方向の角度θとして30°に位置させる。
ユーザは、ステップS308にて、測定信号の音声をスピーカ6より出力させた状態で、携帯端末100を仰角方向に移動させる。このとき、測定部41は、仰角γとして0°,30°,60°のHRIRを取得する。
第3測定例においても、第1測定例または第2測定例と同様に、カメラ1で撮影した映像と加速度センサ2、角速度センサ3の情報から、測定時の携帯端末100を移動させる軌道から外れたことを検出した場合、正しい軌道を表示部10に表示するなどの処理を行い、軌道を修正可能としてもよい。
第3測定例による測定パターンは、図11に示す測定パターンMP3及びMP4である。図10では、測定パターンMP3による測定の次に測定パターンMP4による測定としたが、順番は逆でもよい。
同様に、仰角γの0°,30°,60°は単なる例であり、他の角度でもよいし、仰角γの数は3つに限定されるものではない。仰角γの数は2つ以上とするのがよい。水平方向の角度θは−30°と30°に限定されない。
特徴量抽出部42は、ステップS309にて、HRTFの特徴量を抽出する。特徴量抽出部42は、一例として、次のようにHRIRの特徴量を抽出すればよい。
図11に示す測定パターンMP3における水平方向の角度θが−30°で仰角γを0°,30°,60°としたときのピークP2の周波数を特徴量2と称することとする。図11に示す測定パターンMP4における水平方向の角度θが30°で仰角γを0°,30°,60°としたときのピークP2の周波数を特徴量3と称することとする。
データベース301には、多数の人のそれぞれのHRTFと少なくとも特徴量2,3とが対応付けられている。
特徴量抽出部42は、ピークP2の周波数に加えて、仰角γに応じたピークP2の振幅増減の変化量をHRTFの特徴量として抽出してもよい。
図10に戻り、特性選択部43は、ステップS310にて、データベース301より、特徴量抽出部42が抽出した特徴量2,3に最も近似する特徴量を有するHRTFを選択し、HRTFを再生部44に設定して処理を終了させる。
HRTFの具体的なデータは第1測定例と同様であり、一例として、左右の音声を仰角γで水平方向の角度±θ°の方向に定位させるHRTF(θ,0),HRTF(−θ,0)なるデータである。角度θ°は例えば30°である。
なお、特性選択部43は、必ずしも、HRTF(θ,0),HRTF(−θ,0)のデータとして、データベース301に対で記憶されているデータを選択する必要はない。対で記憶されている、あるHRTF(θ,0),HRTF(−θ,0)のうちのHRTF(θ,0)と、別のHRTF(θ,0),HRTF(−θ,0)のうちのHRTF(−θ,0)とを組み合わせてもよい。
第3測定例では、図11に示す測定パターンMP3による特徴量2と、測定パターンMP4による特徴量3とを用いたが、これに第2測定例における特徴量4,5を加えてもよい。
<第4測定例>
ユーザが以上説明した測定パターンMP1〜MP4の全てを測定する第4測定例を行ってもよい。この場合、データベース301には、多数の人のそれぞれのHRTFと特徴量1〜5とが対応付けられている。
特性選択部43は、データベース301より、特徴量抽出部42が抽出した特徴量1〜5に最も近似する特徴量を有するHRTFを選択し、HRTFを再生部44に設定する。
以上説明した第1〜第4測定例をまとめると図12となる。図12に示すように、第1測定例では、HRTFを選択するために、水平方向の角度θを0°、仰角γを0°,30°,60°とした測定パターンMP1による特徴量1が用いられる。
第2測定例では、HRTFを選択するために、水平方向の角度θを0°、仰角γを0°,30°,60°とした測定パターンMP1による特徴量1と、水平方向の角度θを−30°,30°、仰角γを0°とした測定パターンMP2による特徴量4,5とが用いられる。
第3測定例では、HRTFを選択するために、水平方向の角度θを−30°、仰角γを0°,30°,60°とした測定パターンMP3による特徴量2と、水平方向の角度θを30°、仰角γを0°,30°,60°とした測定パターンMP4による特徴量3とが用いられる。
第4測定例では、HRTFを選択するために、測定パターンMP1〜MP4による特徴量1〜5が用いられる。
測定パターンが多い方が特徴量を抽出しやすい。よって、第1測定例よりも第2,第3測定例の方が好ましく、第4測定例が最も好ましい。但し、測定パターンが多くなるほど測定が煩雑となる。
以上説明したように、本実施形態の頭部伝達関数選択装置は、測定部41と、特徴量抽出部42と、特性選択部43とを備える。
測定部41は、スピーカ6から測定信号としての所定の音声を発生させた状態で、ユーザの耳に装着したマイクロホン20によって収音した音声信号に基づいて、ユーザの頭部インパルス応答を取得する。
特徴量抽出部42は、頭部インパルス応答に対応する周波数特性の特徴量を抽出する。特性選択部43は、特徴量抽出部42によって抽出された特徴量に基づいて、複数の人それぞれの頭部伝達関数と頭部伝達関数の特徴量とを対応付けたデータベース301からいずれかの頭部伝達関数を選択する。
スピーカ6(携帯端末100)をユーザの顔の正面に位置させた状態を、水平方向の角度θが0°、仰角γが0°であるとする。測定部41は、スピーカ6を、角度θが0°または正もしくは負の所定の角度θに位置させた状態で、スピーカ6を、垂直方向に円弧状に移動させて仰角γとして複数の角度に位置させたときの複数の頭部インパルス応答を取得するのがよい。
特徴量抽出部42は、複数の頭部インパルス応答に対応する周波数特性に基づいて特徴量を抽出するのがよい。
測定部41は、さらに、スピーカ6を、仰角γを0°として、角度θが正及び負の所定の角度θに位置させたときの複数の頭部インパルス応答を取得してもよい。
本実施形態の頭部伝達関数選択方法は、スピーカ6によって測定信号としての所定の音声を発生させ、所定の音声をユーザの耳に装着したマイクロホン20によって収音した音声信号に基づいて、ユーザの頭部インパルス応答を取得する。
そして、本実施形態の頭部伝達関数選択方法は、頭部インパルス応答に対応する周波数特性の特徴量を抽出し、抽出された特徴量に基づいて、複数の人それぞれの頭部伝達関数と頭部伝達関数の特徴量とを対応付けたデータベースからいずれかの頭部伝達関数を選択する。
本実施形態の頭部伝達関数選択装置及び頭部伝達関数選択方法によれば、自分自身の頭部伝達関数に近似する頭部伝達関数を容易に選択することができる。
測定部41と、特徴量抽出部42と、特性選択部43の部分を、コンピュータプログラム(頭部伝達関数選択プログラム)で構成することも可能である。再生部44の部分も、コンピュータプログラムで構成してもよい。
本実施形態の頭部伝達関数選択プログラムは、コンピュータに、スピーカ6から測定信号としての所定の音声を発生させた状態で、ユーザの耳に装着したマイクロホン20によって収音した音声信号に基づいて、ユーザの頭部インパルス応答を取得するステップを実行させる。
本実施形態の頭部伝達関数選択プログラムは、コンピュータに、頭部インパルス応答に対応する周波数特性の特徴量を抽出するステップを実行させる。
本実施形態の頭部伝達関数選択プログラムは、コンピュータに、抽出された特徴量に基づいて、複数の人それぞれの頭部伝達関数と頭部伝達関数の特徴量とを対応付けたデータベース301からいずれかの頭部伝達関数を選択するステップを実行させる。
本実施形態の頭部伝達関数選択プログラムによれば、自分自身の頭部伝達関数に近似する頭部伝達関数を容易に選択することができ、自分自身の特性に近い定位効果を容易に実現できる。
本実施形態の音声再生装置は、本実施形態の頭部伝達関数選択装置と、音声データに、特性選択部43によって選択された頭部伝達関数を畳み込み演算して、音声データを再生する再生部44とを備える。よって、本実施形態の音声再生装置によれば、自分自身の頭部伝達関数に近似する頭部伝達関数を用いて音声信号を再生することができる。
本発明は以上説明した本実施形態に限定されるものではなく、本発明の要旨を逸脱しない範囲において種々変更可能である。本実施形態の頭部伝達関数選択装置を構成するに際し、ハードウェアとソフトウェアとの使い分けは任意である。
6 スピーカ
20 マイクロホン
30 サーバ
41 測定部
42 特徴量抽出部
43 特性選択部
44 再生部
301 データベース
441 フィルタ

Claims (6)

  1. ユーザの顔の前方に位置させたスピーカから測定信号としての所定の音声を発生させた状態で、前記スピーカを垂直方向に円弧状に移動させて仰角として複数の角度に位置させたとき、前記ユーザの耳に装着したマイクロホンによって前記所定の音声を収音した音声信号に基づいて、前記複数の角度の位置における前記ユーザの複数の頭部インパルス応答を取得する測定部と、
    前記複数の頭部インパルス応答それぞれに対応する複数の周波数特性において特定の周波数の範囲に発生する局所的なピークの周波数を前記ユーザの頭部伝達関数の特徴量として抽出する特徴量抽出部と、
    前記特徴量抽出部によって抽出された特徴量に基づいて、複数の人それぞれの頭部伝達関数と頭部伝達関数の特徴量とを対応付けたデータベースからいずれかの頭部伝達関数を選択する特性選択部と、
    を備える頭部伝達関数選択装置。
  2. 前記測定部は、前記スピーカを前記ユーザの顔の正面に位置させた状態を、水平方向の角度θが0°、仰角γが0°であるとしたとき、前記スピーカを、角度θが0°または正もしくは負の所定の角度θに位置させた状態で、前記スピーカを、垂直方向に円弧状に移動させて仰角γとして複数の角度に位置させたときの複数の頭部インパルス応答を取得し、
    前記特徴量抽出部は、前記複数の頭部インパルス応答に対応する周波数特性に基づいて特徴量を抽出する
    求項1記載の頭部伝達関数選択装置。
  3. 前記測定部は、さらに、前記スピーカを、仰角γを0°として、角度θが正及び負の所定の角度θに位置させたときの複数の頭部インパルス応答を取得する請求項2記載の頭部伝達関数選択装置。
  4. ユーザの顔の前方に位置させたスピーカから測定信号としての所定の音声を発生させた状態で、前記スピーカを垂直方向に円弧状に移動させて仰角として複数の角度に位置させ
    ーザの耳に装着したマイクロホンによって前記所定の音声を収音した音声信号に基づいて、前記複数の角度の位置における前記ユーザの複数の頭部インパルス応答を取得し、
    前記複数の頭部インパルス応答それぞれに対応する複数の周波数特性において特定の周波数の範囲に発生する局所的なピークの周波数を前記ユーザの頭部伝達関数の特徴量として抽出し、
    抽出された特徴量に基づいて、複数の人それぞれの頭部伝達関数と頭部伝達関数の特徴量とを対応付けたデータベースからいずれかの頭部伝達関数を選択する
    部伝達関数選択方法。
  5. コンピュータに、
    ユーザの顔の前方に位置させたスピーカから測定信号としての所定の音声を発生させた状態で、前記スピーカを垂直方向に円弧状に移動させて仰角として複数の角度に位置させたとき、前記ユーザの耳に装着したマイクロホンによって前記所定の音声を収音した音声信号に基づいて、前記複数の角度の位置における前記ユーザの複数の頭部インパルス応答を取得するステップと、
    前記複数の頭部インパルス応答それぞれに対応する複数の周波数特性において特定の周波数の範囲に発生する局所的なピークの周波数を前記ユーザの頭部伝達関数の特徴量として抽出するステップと、
    抽出された特徴量に基づいて、複数の人それぞれの頭部伝達関数と頭部伝達関数の特徴量とを対応付けたデータベースからいずれかの頭部伝達関数を選択するステップと、
    を実行させる頭部伝達関数選択プログラム。
  6. ユーザの顔の前方に位置させたスピーカから測定信号としての所定の音声を発生させた状態で、前記スピーカを垂直方向に円弧状に移動させて仰角として複数の角度に位置させたとき、前記ユーザの耳に装着したマイクロホンによって前記所定の音声を収音した音声信号に基づいて、前記複数の角度の位置における前記ユーザの複数の頭部インパルス応答を取得する測定部と、
    前記複数の頭部インパルス応答それぞれに対応する複数の周波数特性において特定の周波数の範囲に発生する局所的なピークの周波数を前記ユーザの頭部伝達関数の特徴量として抽出する特徴量抽出部と、
    前記特徴量抽出部によって抽出された特徴量に基づいて、複数の人それぞれの頭部伝達関数と頭部伝達関数の特徴量とを対応付けたデータベースからいずれかの頭部伝達関数を選択する特性選択部と、
    音声データに、前記特性選択部によって選択された頭部伝達関数を畳み込み演算して、前記音声データを再生する再生部と、
    を備える音声再生装置。
JP2015081483A 2015-04-13 2015-04-13 頭部伝達関数選択装置、頭部伝達関数選択方法、頭部伝達関数選択プログラム、音声再生装置 Active JP6596896B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2015081483A JP6596896B2 (ja) 2015-04-13 2015-04-13 頭部伝達関数選択装置、頭部伝達関数選択方法、頭部伝達関数選択プログラム、音声再生装置
PCT/JP2016/052711 WO2016167007A1 (ja) 2015-04-13 2016-01-29 頭部伝達関数選択装置、頭部伝達関数選択方法、頭部伝達関数選択プログラム、音声再生装置
US15/730,101 US10142733B2 (en) 2015-04-13 2017-10-11 Head-related transfer function selection device, head-related transfer function selection method, head-related transfer function selection program, and sound reproduction device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015081483A JP6596896B2 (ja) 2015-04-13 2015-04-13 頭部伝達関数選択装置、頭部伝達関数選択方法、頭部伝達関数選択プログラム、音声再生装置

Publications (2)

Publication Number Publication Date
JP2016201723A JP2016201723A (ja) 2016-12-01
JP6596896B2 true JP6596896B2 (ja) 2019-10-30

Family

ID=57125902

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015081483A Active JP6596896B2 (ja) 2015-04-13 2015-04-13 頭部伝達関数選択装置、頭部伝達関数選択方法、頭部伝達関数選択プログラム、音声再生装置

Country Status (3)

Country Link
US (1) US10142733B2 (ja)
JP (1) JP6596896B2 (ja)
WO (1) WO2016167007A1 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9591427B1 (en) * 2016-02-20 2017-03-07 Philip Scott Lyren Capturing audio impulse responses of a person with a smartphone
JP6791001B2 (ja) * 2017-05-10 2020-11-25 株式会社Jvcケンウッド 頭外定位フィルタ決定システム、頭外定位フィルタ決定装置、頭外定位決定方法、及びプログラム
JP6988321B2 (ja) * 2017-09-27 2022-01-05 株式会社Jvcケンウッド 信号処理装置、信号処理方法、及びプログラム
JP7347424B2 (ja) 2018-07-24 2023-09-20 ソニーグループ株式会社 測定装置及び測定システム
US11337021B2 (en) 2020-05-22 2022-05-17 Chiba Institute Of Technology Head-related transfer function generator, head-related transfer function generation program, and head-related transfer function generation method
CN112492446B (zh) * 2020-12-08 2023-03-14 北京声加科技有限公司 利用入耳式耳机实现信号均衡的方法及处理器
CN115460526B (zh) * 2022-11-11 2023-03-28 荣耀终端有限公司 一种听力模型的确定方法、电子设备及系统

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5742689A (en) * 1996-01-04 1998-04-21 Virtual Listening Systems, Inc. Method and device for processing a multichannel signal for use with a headphone
GB2351213B (en) * 1999-05-29 2003-08-27 Central Research Lab Ltd A method of modifying one or more original head related transfer functions
FR2880755A1 (fr) * 2005-01-10 2006-07-14 France Telecom Procede et dispositif d'individualisation de hrtfs par modelisation
FR2958825B1 (fr) 2010-04-12 2016-04-01 Arkamys Procede de selection de filtres hrtf perceptivement optimale dans une base de donnees a partir de parametres morphologiques
US9030545B2 (en) 2011-12-30 2015-05-12 GNR Resound A/S Systems and methods for determining head related transfer functions
JP6018485B2 (ja) * 2012-11-15 2016-11-02 日本放送協会 頭部伝達関数選択装置、音響再生装置
US9426589B2 (en) * 2013-07-04 2016-08-23 Gn Resound A/S Determination of individual HRTFs

Also Published As

Publication number Publication date
US20180048959A1 (en) 2018-02-15
WO2016167007A1 (ja) 2016-10-20
US10142733B2 (en) 2018-11-27
JP2016201723A (ja) 2016-12-01

Similar Documents

Publication Publication Date Title
JP6596896B2 (ja) 頭部伝達関数選択装置、頭部伝達関数選択方法、頭部伝達関数選択プログラム、音声再生装置
EP3424229B1 (en) Systems and methods for spatial audio adjustment
US10003905B1 (en) Personalized end user head-related transfer function (HRTV) finite impulse response (FIR) filter
CN108141684A (zh) 声音输出设备、声音生成方法以及程序
JP6791001B2 (ja) 頭外定位フィルタ決定システム、頭外定位フィルタ決定装置、頭外定位決定方法、及びプログラム
CN108353244A (zh) 差分头部追踪装置
US9769585B1 (en) Positioning surround sound for virtual acoustic presence
US10142760B1 (en) Audio processing mechanism with personalized frequency response filter and personalized head-related transfer function (HRTF)
US11297427B2 (en) Processing device, processing method, and program for processing sound pickup signals
JP2017161775A (ja) 測定装置、フィルタ生成装置、測定方法、及びフィルタ生成方法
US10419870B1 (en) Applying audio technologies for the interactive gaming environment
JP6658026B2 (ja) フィルタ生成装置、フィルタ生成方法、及び音像定位処理方法
JP2018152834A (ja) 仮想聴覚環境において音声信号出力を制御する方法及び装置
JP7404736B2 (ja) 頭外定位フィルタ決定システム、頭外定位フィルタ決定方法、及びプログラム
JP7395906B2 (ja) ヘッドホン、頭外定位フィルタ決定装置、及び頭外定位フィルタ決定方法
US11937072B2 (en) Headphones, out-of-head localization filter determination device, out-of-head localization filter determination system, out-of-head localization filter determination method, and program
JP7472582B2 (ja) 音声再生システムおよび頭部伝達関数選択方法
JP6500664B2 (ja) 音場再生装置、音場再生方法、及びプログラム
RU2721571C1 (ru) Способ приема, отображения и воспроизведения данных и информации
US11451907B2 (en) Techniques combining plural head-related transfer function (HRTF) spheres to place audio objects
EP3944640A1 (en) Out-of-head localization filter determination system, out-of-head localization filter determination method, and computer readable medium
KR102534802B1 (ko) 멀티-채널 바이노럴 기록 및 동적 재생
JP2022185840A (ja) 頭外定位処理装置、及び頭外定位処理方法
JP2019061108A (ja) 信号処理装置、信号処理方法、及びプログラム
KR20150081541A (ko) 사용자의 머리전달함수 기반 음향 조절 방법 및 장치

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180131

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190115

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190314

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190903

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190916

R150 Certificate of patent or registration of utility model

Ref document number: 6596896

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150