JP2021052315A - Out-of-head localization filter determination system, out-of-head localization processing device, out-of-head localization filter determination device, out-of-head localization filter determination method, and program - Google Patents
Out-of-head localization filter determination system, out-of-head localization processing device, out-of-head localization filter determination device, out-of-head localization filter determination method, and program Download PDFInfo
- Publication number
- JP2021052315A JP2021052315A JP2019174232A JP2019174232A JP2021052315A JP 2021052315 A JP2021052315 A JP 2021052315A JP 2019174232 A JP2019174232 A JP 2019174232A JP 2019174232 A JP2019174232 A JP 2019174232A JP 2021052315 A JP2021052315 A JP 2021052315A
- Authority
- JP
- Japan
- Prior art keywords
- unit
- data
- preset data
- user
- feature amount
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S1/00—Two-channel systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
Abstract
Description
本発明は、頭外定位フィルタ決定システム、頭外定位処理装置、頭外定位フィルタ決定装置、頭外定位フィルタ決定方法、及びプログラムに関する。 The present invention relates to an out-of-head localization filter determination system, an out-of-head localization processing device, an out-of-head localization filter determination device, an out-of-head localization filter determination method, and a program.
音像定位技術として、ヘッドホンを用いて受聴者の頭部の外側に音像を定位させる頭外定位技術がある。頭外定位技術では、ヘッドホンから耳までの特性をキャンセルし、ステレオスピーカから耳までの4本の特性を与えることにより、音像を頭外に定位させている。 As a sound image localization technique, there is an out-of-head localization technique in which a sound image is localized on the outside of the listener's head using headphones. In the out-of-head localization technology, the sound image is localized out of the head by canceling the characteristics from the headphones to the ears and giving four characteristics from the stereo speakers to the ears.
頭外定位再生においては、2チャンネル(以下、chと記載)のスピーカから発した測定信号(インパルス音等)を聴取者本人(ユーザ)の耳に設置したマイクロフォン(以下、マイクとする)で録音する。そして、インパルス応答で得られた収音信号に基づいて、処理装置がフィルタを作成する。作成したフィルタを2chのオーディオ信号に畳み込むことにより、頭外定位再生を実現することができる。 In out-of-head localization playback, measurement signals (impulse sounds, etc.) emitted from two-channel (hereinafter referred to as ch) speakers are recorded with a microphone (hereinafter referred to as a microphone) installed in the listener's (user's) ear. To do. Then, the processing device creates a filter based on the sound pick-up signal obtained by the impulse response. By convolving the created filter into a 2ch audio signal, out-of-head localization reproduction can be realized.
さらに、ヘッドホンから耳までの特性をキャンセルするためのフィルタを生成するために、ヘッドホンから耳元乃至鼓膜までの特性(外耳道伝達関数ECTF、外耳道伝達特性とも言う)を聴取者本人の耳に設置したマイクで測定する。 Furthermore, in order to generate a filter for canceling the characteristics from the headphones to the ear, a microphone in which the characteristics from the headphones to the ear to the eardrum (also called the external auditory canal transfer function ECTF or external auditory canal transfer characteristic) is installed in the listener's own ear Measure with.
特許文献1には、頭外音像定位フィルタを用いた両耳聴装置が開示されている。この装置では、多数の人間のあらかじめ測定された空間伝達関数を人間の聴覚特性に対応する特徴パラメータベクトルに変換している。そして、装置は、クラスタリングを行って少数に集約したデータを用いている。さらに、装置は、予め測定された空間伝達関数と、実耳ヘッドホン逆伝達関数を人間の身体的寸法によりクラスタリングを行っている。そして、各クラスタの重心に最も近い人間のデータを用いている。
特許文献2には、ヘッドホンとマイクユニットとを備えた頭外定位フィルタ決定装置が開示されている。特許文献1では、サーバ装置が、音源から被測定者の耳までの空間音響伝達特性に関する第1のプリセットデータと、被測定者の耳の外耳道伝達特性に関する第2のプリセットデータとを対応付けて記憶している。ユーザ端末が、ユーザの外耳道伝達特性に関する測定データを測定している。ユーザ端末が測定データに基づくユーザデータをサーバ装置に送信している。サーバ装置は、ユーザデータを複数の第2のプリセットデータと比較している。具体的には、ユーザと被測定者の外耳道伝達特性に基づく特徴量同士を比較している。サーバ装置は、比較結果に基づいて、第1のプリセットデータを抽出している。
しかしながら、特許文献1の装置では、身体的寸法によりクラスタリングを行っているため、ユーザ個人の身体的寸法を計測する必要がある。また、クラスタリングを適切に行うことができないおそれがある。この場合、ユーザに適した頭外音像定位フィルタを用いることができないという課題がある。
However, in the device of
また、特許文献2では、ユーザと被測定者の外耳道伝達特性に基づく特徴量同士を比較している。具体的には、特徴量の類似度を算出して、相関の高い被測定者の第1のプリセットデータを抽出している。特徴量は、2kHz〜20kHzの周波数振幅特性となっている。類似度が高い被測定者の外耳道伝達特性に対応する空間音響伝達特性を抽出して、ユーザの空間音響フィルタとしている。
Further, in
特許文献2のように、ユーザの外耳道伝達特性から空間音響伝達フィルタを用いる処理を行う場合、適切かつ迅速に処理を行うことが望まれる。しかしながら、特許文献2では、2kHz〜20kHzの周波数振幅特性を特徴量としているため、データ量の削減が困難である。多くの被測定者に関するプリセットデータがある場合、処理時間が長くなるという課題がある。
When performing a process using a spatial acoustic transmission filter based on the external auditory canal transmission characteristics of the user as in
本実施形態は上記の点に鑑みなされたものであり、適切かつ迅速に処理を行うことができる頭外定位フィルタ決定システム、頭外定位処理装置、頭外定位フィルタ決定装置、頭外定位フィルタ決定方法、及びプログラムを提供することを目的とする。 This embodiment has been made in view of the above points, and can perform an appropriate and quick process of an out-of-head localization filter determination system, an out-of-head localization processing device, an out-of-head localization filter determination device, and an out-of-head localization filter determination. The purpose is to provide methods and programs.
本実施の形態にかかる頭外定位フィルタ決定システムは、ユーザに装着され、前記ユーザの耳に向けて音を出力する出力ユニットと、前記ユーザの耳に装着され、前記出力ユニットから出力された音を収音するマイクユニットと、前記出力ユニットに対して測定信号を出力するとともに、前記マイクユニットから出力された収音信号を測定する測定処理装置と、前記測定処理装置と通信可能なサーバ装置と、を備えた頭外定位フィルタ決定システムであって、前記サーバ装置は、音源から被測定者の耳までの空間音響伝達特性に関する第1のプリセットデータと、前記被測定者の耳の外耳道伝達特性の特徴量に関する第2のプリセットデータと、を対応付けて記憶するデータ格納部であって、複数の被測定者に対して取得された複数の前記第1及び第2のプリセットデータを記憶するデータ格納部を備え、前記頭外定位フィルタ決定システムは、前記マイクユニットで収音された収音信号を周波数変換して、周波数特性を求める周波数変換部と、前記周波数特性を平滑化する平滑化部と、平滑化された前記周波数特性のピーク及びノッチを求め、前記ピーク及びノッチに基づいて前記周波数特性の特徴量をユーザ特徴量として抽出する特徴量抽出部と、前記ユーザ特徴量に基づいて、前記データ格納部に格納されている複数の第2のプリセットデータのうちの一部の第2のプリセットデータを抽出するデータ抽出部と、前記ユーザ特徴量と、抽出された前記第2のプリセットデータとを比較する比較部と、比較結果に基づいて、複数の前記第1のプリセットデータの中から第1のプリセットデータを選択する選択部と、を備えている。 The out-of-head localization filter determination system according to the present embodiment is attached to an output unit that is attached to the user and outputs sound toward the user's ear, and a sound that is attached to the user's ear and is output from the output unit. A microphone unit that collects sound, a measurement processing device that outputs a measurement signal to the output unit and measures the sound collection signal output from the microphone unit, and a server device that can communicate with the measurement processing device. The server device is an out-of-head localization filter determination system comprising, the first preset data regarding the spatial acoustic transmission characteristics from the sound source to the subject's ear, and the external auditory canal transmission characteristics of the subject's ear. A data storage unit that stores the second preset data related to the feature amount in association with each other, and stores a plurality of the first and second preset data acquired for a plurality of subjects. The out-of-head localization filter determination system including a storage unit includes a frequency conversion unit that frequency-converts the sound collection signal picked up by the microphone unit to obtain frequency characteristics, and a smoothing unit that smoothes the frequency characteristics. A feature amount extraction unit that obtains a smoothed peak and notch of the frequency characteristic and extracts the feature amount of the frequency characteristic as a user feature amount based on the peak and notch, and a feature amount extraction unit based on the user feature amount. A data extraction unit that extracts a part of the second preset data among the plurality of second preset data stored in the data storage unit, the user feature amount, and the extracted second preset data. It is provided with a comparison unit for comparing with and a selection unit for selecting the first preset data from the plurality of first preset data based on the comparison result.
本実施の形態にかかる頭外定位処理装置は、出力ユニットから出力された測定信号をマイクユニットで収音することで取得される収音信号を周波数変換して、周波数特性を求める周波数変換部と、前記周波数特性を平滑化する平滑化部と、平滑化された前記周波数特性のピーク及びノッチを求め、前記ピーク及びノッチに基づいて前記周波数特性の特徴量をユーザ特徴量として抽出する特徴量抽出部と、前記ユーザ特徴量に類似する特徴量に対応付けられた空間音響伝達特性に基づいて、空間音響フィルタを設定する空間音響フィルタ設定部と、前記収音信号に基づいて、前記出力ユニットの特性をキャンセルする逆フィルタを算出する逆フィルタ算出部と、を備えている。 The out-of-head localization processing device according to the present embodiment includes a frequency conversion unit that obtains frequency characteristics by frequency-converting a sound-collecting signal acquired by collecting the measurement signal output from the output unit with the microphone unit. , A smoothing unit for smoothing the frequency characteristics, and the peaks and notches of the smoothed frequency characteristics are obtained, and the feature amount of the frequency characteristics is extracted as a user feature amount based on the peaks and notches. A space acoustic filter setting unit that sets a spatial acoustic filter based on a unit, a spatial acoustic transmission characteristic associated with a feature amount similar to the user feature amount, and an output unit of the output unit based on the sound pick-up signal. It is provided with an inverse filter calculation unit that calculates an inverse filter that cancels the characteristics.
本実施の形態にかかる頭外定位フィルタ決定装置は、音源から被測定者の耳までの空間音響伝達特性に関する第1のプリセットデータと、前記被測定者の耳の外耳道伝達特性の特徴量に関する第2のプリセットデータと、を対応付けて記憶するデータ格納部であって、複数の被測定者に対して取得された複数の前記第1及び第2のプリセットデータを記憶するデータ格納部と、ユーザ特徴量に基づいて、前記データ格納部に格納されている複数の第2のプリセットデータのうちの一部の第2のプリセットデータを抽出するデータ抽出部と、前記ユーザ特徴量と、前記第2のプリセットデータの特徴量とを比較する比較部と、比較結果に基づいて、複数の前記第1のプリセットデータの中から第1のプリセットデータを選択する選択部と、を備え、前記外耳道伝達特性の周波数特性が平滑化され、平滑化された前記周波数特性のピーク及びノッチに基づいて前記特徴量が抽出されている。 The extrahead localization filter determining device according to the present embodiment has the first preset data regarding the spatial acoustic transmission characteristics from the sound source to the subject's ear, and the first preset data regarding the characteristics of the external auditory canal transmission characteristics of the subject's ear. A data storage unit that stores two preset data in association with each other, and a data storage unit that stores a plurality of the first and second preset data acquired for a plurality of subjects, and a user. A data extraction unit that extracts a part of the second preset data among a plurality of second preset data stored in the data storage unit based on the feature amount, the user feature amount, and the second preset data. The external auditory canal transmission characteristic is provided with a comparison unit for comparing the feature amount of the preset data of the above and a selection unit for selecting the first preset data from the plurality of first preset data based on the comparison result. The frequency characteristics of the above are smoothed, and the feature amount is extracted based on the peaks and notches of the smoothed frequency characteristics.
本実施の形態にかかる頭外定位フィルタ決定方法は、ユーザに装着され、前記ユーザの耳に向けて音を出力する出力ユニットと、前記ユーザの耳に装着され、前記出力ユニットから出力された音を収音するマイクを有するマイクユニットと、を用いて、前記ユーザに対する頭外定位フィルタを決定する頭外定位フィルタ決定方法であって、前記マイクユニットで収音された収音信号を周波数変換して、周波数特性を求めるステップと、前記周波数特性を平滑化するステップと、平滑化された前記周波数特性のピーク及びノッチを求め、前記ピーク及びノッチに基づいて前記周波数特性の特徴量をユーザ特徴量として抽出するステップと、前記ユーザ特徴量に基づいて、データ格納部に格納されている複数の第2のプリセットデータのうちの一部の第2のプリセットデータを抽出するステップと、前記ユーザ特徴量と、抽出された前記第2のプリセットデータとを比較するステップと、比較結果に基づいて、複数の第1のプリセットデータの中から第1のプリセットデータを選択するステップと、を含む。 The method for determining an out-of-head localization filter according to the present embodiment includes an output unit that is attached to the user and outputs a sound toward the user's ear, and a sound that is attached to the user's ear and is output from the output unit. This is an out-of-head localization filter determination method for determining an out-of-head localization filter for the user by using a microphone unit having a microphone for collecting sound, and frequency-converting the sound collection signal collected by the microphone unit. The step of obtaining the frequency characteristic, the step of smoothing the frequency characteristic, the peak and the notch of the smoothed frequency characteristic are obtained, and the feature amount of the frequency characteristic is calculated as the user feature amount based on the peak and the notch. A step of extracting a part of the second preset data among a plurality of second preset data stored in the data storage unit based on the user feature amount, and the user feature amount. A step of comparing the extracted second preset data with the extracted second preset data, and a step of selecting the first preset data from the plurality of first preset data based on the comparison result.
本実施の形態にかかるプログラムは、ユーザに装着され、前記ユーザの耳に向けて音を出力する出力ユニットと、前記ユーザの耳に装着され、前記出力ユニットから出力された音を収音するマイクを有するマイクユニットと、を用いて、前記ユーザに対する頭外定位フィルタを決定する頭外定位フィルタ決定方法をコンピュータに実行させるためのプログラムであって、前記頭外定位フィルタ決定方法は、前記マイクユニットで収音された収音信号を周波数変換して、周波数特性を求めるステップと、前記周波数特性を平滑化するステップと、平滑化された前記周波数特性のピーク及びノッチを求め、前記ピーク及びノッチに基づいて前記周波数特性の特徴量をユーザ特徴量として抽出するステップと、前記ユーザ特徴量に基づいて、データ格納部に格納されている複数の第2のプリセットデータのうちの一部の第2のプリセットデータを抽出するステップと、前記ユーザ特徴量と、抽出された前記第2のプリセットデータとを比較するステップと、比較結果に基づいて、複数の第1のプリセットデータの中から第1のプリセットデータを選択するステップと、を含む。 The program according to the present embodiment includes an output unit that is attached to the user and outputs sound toward the user's ear, and a microphone that is attached to the user's ear and collects the sound output from the output unit. This is a program for causing a computer to execute an out-of-head localization filter determination method for determining an out-of-head localization filter for the user by using a microphone unit having the above, and the out-of-head localization filter determination method is the microphone unit. The step of frequency-converting the sound pick-up signal picked up in (1) to obtain the frequency characteristic, the step of smoothing the frequency characteristic, and the peak and notch of the smoothed frequency characteristic are obtained, and the peak and the notch are used. Based on the step of extracting the feature amount of the frequency characteristic as the user feature amount, and the second of a part of the plurality of second preset data stored in the data storage unit based on the user feature amount. A step of extracting preset data, a step of comparing the user feature amount with the extracted second preset data, and a first preset from a plurality of first preset data based on the comparison result. Includes steps to select data.
本実施形態によれば、適切かつ迅速に処理を行うことができる頭外定位フィルタ決定システム、頭外定位処理装置、頭外定位フィルタ決定装置、頭外定位フィルタ決定方法、及びプログラムを提供することができる。 According to the present embodiment, an out-of-head localization filter determination system, an out-of-head localization processing device, an out-of-head localization filter determination device, an out-of-head localization filter determination method, and a program capable of performing processing appropriately and quickly are provided. Can be done.
(概要)
まず、音像定位処理の概要について説明する。ここでは、音像定位処理装置の一例である頭外定位処理について説明する。本実施形態にかかる頭外定位処理は、空間音響伝達特性と外耳道伝達特性を用いて頭外定位処理を行うものである。空間音響伝達特性は、スピーカなどの音源から外耳道までの伝達特性である。外耳道伝達特性は、外耳道入口から鼓膜までの伝達特性である。本実施形態では、ヘッドホンを装着した状態での外耳道伝達特性を測定し、その測定データを用いて頭外定位処理を実現している。
(Overview)
First, the outline of the sound image localization process will be described. Here, the out-of-head localization processing, which is an example of the sound image localization processing apparatus, will be described. The extra-head localization process according to the present embodiment is to perform the extra-head localization process using the spatial acoustic transmission characteristic and the external auditory canal transmission characteristic. The spatial acoustic transmission characteristic is a transmission characteristic from a sound source such as a speaker to the ear canal. The ear canal transmission characteristic is the transmission characteristic from the ear canal entrance to the eardrum. In the present embodiment, the external auditory canal transmission characteristic is measured while the headphones are worn, and the extra-head localization process is realized by using the measurement data.
本実施の形態にかかる頭外定位処理は、パーソナルコンピュータ(PC)、スマートホン、タブレット端末などのユーザ端末で実行される。ユーザ端末は、プロセッサ等の処理手段、メモリやハードディスクなどの記憶手段、液晶モニタ等の表示手段、タッチパネル、ボタン、キーボード、マウスなどの入力手段を有する情報処理装置である。ユーザ端末は、データを送受信する通信機能を有している。さらに、ユーザ端末には、ヘッドホン又はイヤホンを有する出力手段(出力ユニット)が接続される。 The out-of-head localization process according to this embodiment is executed on a user terminal such as a personal computer (PC), a smart phone, or a tablet terminal. A user terminal is an information processing device having a processing means such as a processor, a storage means such as a memory or a hard disk, a display means such as a liquid crystal monitor, and an input means such as a touch panel, a button, a keyboard, and a mouse. The user terminal has a communication function for transmitting and receiving data. Further, an output means (output unit) having headphones or earphones is connected to the user terminal.
高い定位効果を得るには、ユーザ本人の特性を測定して頭外定位フィルタを生成する必要がある。ユーザ個人の空間音響伝達特性は、スピーカ等の音響機材や室内の音響特性が整えられたリスニングルームで行われることが一般的である。すなわち、ユーザがリスニングルームに行くか、ユーザの自宅などにリスニングルームを準備する必要がある。このため、ユーザ個人の空間音響伝達特性を適切に測定することができない場合がある。 In order to obtain a high localization effect, it is necessary to measure the characteristics of the user himself / herself and generate an out-of-head localization filter. The spatial acoustic transmission characteristics of an individual user are generally performed in a listening room in which acoustic equipment such as a speaker or indoor acoustic characteristics are arranged. That is, it is necessary for the user to go to the listening room or prepare a listening room at the user's home or the like. Therefore, it may not be possible to appropriately measure the spatial acoustic transmission characteristics of the individual user.
また、ユーザの自宅などにスピーカを設置してリスニングルームを準備した場合でも、左右非対称にスピーカが設置されている場合や、部屋の音響環境が音楽聴取に最適でない場合がある。このような場合、自宅で適切な空間音響伝達特性を測定することは大変困難である。 Further, even when a speaker is installed at the user's home or the like to prepare a listening room, the speaker may be installed asymmetrically or the acoustic environment of the room may not be optimal for listening to music. In such cases, it is very difficult to measure appropriate spatial acoustic transmission characteristics at home.
一方、ユーザ個人の外耳道伝達特性の測定は、マイクユニット、及びヘッドホンを装着した状態で行われる。すなわち、ユーザがマイクユニット、及びヘッドホンを装着していれば、外耳道伝達特性を測定することができる。ユーザがリスニングルームに行く必要や、ユーザの家に大がかりなリスニングルームを準備する必要がない。また、外耳道伝達特性を測定するための測定信号の発生や、収音信号の記録などはスマートホンやPCなどのユーザ端末を用いて、行うことができる。 On the other hand, the measurement of the external auditory canal transmission characteristic of an individual user is performed with the microphone unit and headphones attached. That is, if the user wears a microphone unit and headphones, the external auditory canal transmission characteristic can be measured. There is no need for the user to go to the listening room or set up a large listening room in the user's home. Further, the generation of the measurement signal for measuring the external auditory canal transmission characteristic, the recording of the sound collection signal, and the like can be performed by using a user terminal such as a smart phone or a PC.
このように、ユーザ個人に対して、空間音響伝達特性の測定を実施することが困難である場合がある。そこで、本実施の形態にかかる頭外定位処理システムは、外耳道伝達特性の測定結果に基づいて、空間音響伝達特性に応じたフィルタを決定している。すなわち、ユーザ個人の外耳道伝達特性の測定結果に基づいて、ユーザに適した頭外定位処理フィルタを決定している。 As described above, it may be difficult to measure the spatial acoustic transmission characteristics for an individual user. Therefore, in the extrahead localization processing system according to the present embodiment, the filter according to the spatial acoustic transmission characteristic is determined based on the measurement result of the external auditory canal transmission characteristic. That is, an extracranial localization processing filter suitable for the user is determined based on the measurement result of the external auditory canal transmission characteristic of the individual user.
具体的には、頭外定位処理システムは、ユーザ端末と、サーバ装置とを備えている。ユーザ以外の複数の被測定者に対して事前に測定された空間音響伝達特性及び外耳道伝達特性をサーバ装置が格納しておく。すなわち、ユーザ端末とは異なる測定装置を用いて、音源としてスピーカを用いた空間音響伝達特性の測定(以下、第1の事前測定とも称する)と、ヘッドホンを用いた外耳道伝達特性の測定(第2の事前測定とも称する)を、行う。第1の事前測定及び第2の事前測定は、ユーザ以外の被測定者に対して実施される。 Specifically, the out-of-head localization processing system includes a user terminal and a server device. The server device stores the spatial acoustic transmission characteristics and the external auditory canal transmission characteristics measured in advance for a plurality of subjects other than the user. That is, measurement of spatial acoustic transmission characteristics using a speaker as a sound source (hereinafter, also referred to as first pre-measurement) using a measuring device different from the user terminal, and measurement of external auditory canal transmission characteristics using headphones (second). (Also referred to as pre-measurement of). The first pre-measurement and the second pre-measurement are performed on a person to be measured other than the user.
サーバ装置は、第1の事前測定の結果に応じた第1のプリセットデータと、第2の事前測定の結果に応じた第2のプリセットデータとを格納している。複数の被測定者に対して第1及び第2の事前測定を行うことで、複数の第1のプリセットデータと、複数の第2のプリセットデータとが取得される。空間音響伝達特性に関する第1のプリセットデータと、外耳道伝達特性に関する第2のプリセットデータとを、サーバ装置が、被測定者毎に対応付けて記憶する。サーバ装置は、データベースに、複数の第1のプリセットデータと、複数の第2のプリセットデータとを格納している。 The server device stores the first preset data according to the result of the first pre-measurement and the second preset data according to the result of the second pre-measurement. By performing the first and second pre-measurements on the plurality of subjects, the plurality of first preset data and the plurality of second preset data are acquired. The server device stores the first preset data regarding the spatial acoustic transmission characteristic and the second preset data regarding the external auditory canal transmission characteristic in association with each other for each person to be measured. The server device stores a plurality of first preset data and a plurality of second preset data in the database.
さらに、頭外定位処理を実行するユーザ個人に対しては、ユーザ端末を用いて、外耳道伝達特性のみを測定する(以下、ユーザ測定とする)。ユーザ測定は、第2の事前測定と同様に、音源としてヘッドホンを用いた測定である。ユーザ端末は、外耳道伝達特性に関する測定データを取得する。そして、ユーザ端末は、測定データに基づくユーザデータをサーバ装置に送信する。サーバ装置は、ユーザデータを複数の第2のプリセットデータとそれぞれ比較する。サーバ装置は、比較結果に基づいて、複数の第2のプリセットデータの中からユーザデータとの相関が高い第2のプリセットデータを決定する。 Further, for the individual user who executes the out-of-head localization process, only the external auditory canal transmission characteristic is measured by using the user terminal (hereinafter referred to as user measurement). The user measurement is a measurement using headphones as a sound source, as in the second pre-measurement. The user terminal acquires measurement data regarding the external auditory canal transmission characteristic. Then, the user terminal transmits the user data based on the measurement data to the server device. The server device compares the user data with the plurality of second preset data, respectively. The server device determines the second preset data having a high correlation with the user data from the plurality of second preset data based on the comparison result.
そして、サーバ装置は、相関の高い第2のプリセットデータに対応付けられた第1のプリセットデータを読み出す。すなわち、サーバ装置は、比較結果に基づいて、複数の第1のプリセットデータの中から、ユーザ個人に適した第1のプリセットデータを抽出する。サーバ装置は、抽出した第1のプリセットデータをユーザ端末に送信する。そして、ユーザ端末は、第1のプリセットデータに基づくフィルタと、ユーザ測定に基づく逆フィルタとを用いて、頭外定位処理を行う。 Then, the server device reads out the first preset data associated with the second preset data having a high correlation. That is, the server device extracts the first preset data suitable for the individual user from the plurality of first preset data based on the comparison result. The server device transmits the extracted first preset data to the user terminal. Then, the user terminal performs the out-of-head localization process by using the filter based on the first preset data and the inverse filter based on the user measurement.
実施の形態1.
(頭外定位処理装置)
まず、本実施の形態にかかる音場再生装置の一例である頭外定位処理装置100を図1に示す。図1は、頭外定位処理装置100のブロック図である。頭外定位処理装置100は、ヘッドホン43を装着するユーザUに対して音場を再生する。そのため、頭外定位処理装置100は、LchとRchのステレオ入力信号XL、XRについて、音像定位処理を行う。LchとRchのステレオ入力信号XL、XRは、CD(Compact Disc)プレイヤーなどから出力されるアナログのオーディオ再生信号、又は、mp3(MPEG Audio Layer-3)等のデジタルオーディオデータである。なお、頭外定位処理装置100は、物理的に単一な装置に限られるものではなく、一部の処理が異なる装置で行われてもよい。例えば、一部の処理がPCなどにより行われ、残りの処理がヘッドホン43に内蔵されたDSP(Digital Signal Processor)などにより行われてもよい。
(Out-of-head localization processing device)
First, FIG. 1 shows an out-of-head
頭外定位処理装置100は、頭外定位処理部10、フィルタ部41、フィルタ部42、及びヘッドホン43を備えている。頭外定位処理部10、フィルタ部41、及びフィルタ部42はプロセッサにより実現可能である。
The out-of-head
頭外定位処理部10は、畳み込み演算部11〜12、21〜22、及び加算器24、25を備えている。畳み込み演算部11〜12、21〜22は、空間音響伝達特性を用いた畳み込み処理を行う。頭外定位処理部10には、CDプレイヤーなどからのステレオ入力信号XL、XRが入力される。頭外定位処理部10には、空間音響伝達特性が設定されている。頭外定位処理部10は、各chのステレオ入力信号XL、XRに対し、空間音響伝達特性のフィルタ(以下、空間音響フィルタとも称する)を畳み込む。空間音響伝達特性は被測定者の頭部や耳介で測定した頭部伝達関数HRTFでもよいし、ダミーヘッドまたは第三者の頭部伝達関数であってもよい。
The out-of-head
4つの空間音響伝達特性Hls、Hlo、Hro、Hrsを1セットとしたものを空間音響伝達関数とする。畳み込み演算部11、12、21、22で畳み込みに用いられるデータが空間音響フィルタとなる。空間音響伝達特性Hls、Hlo、Hro、Hrsのそれぞれは、後述する測定装置を用いて測定されている。
The spatial acoustic transfer function is a set of four spatial acoustic transfer characteristics Hls, Hlo, Hro, and Hrs. The data used for convolution by the
そして、畳み込み演算部11は、Lchのステレオ入力信号XLに対して空間音響伝達特性Hlsに応じた空間音響フィルタを畳み込む。畳み込み演算部11は、畳み込み演算データを加算器24に出力する。畳み込み演算部21は、Rchのステレオ入力信号XRに対して空間音響伝達特性Hroに応じた空間音響フィルタを畳み込む。畳み込み演算部21は、畳み込み演算データを加算器24に出力する。加算器24は2つの畳み込み演算データを加算して、フィルタ部41に出力する。
Then, the
畳み込み演算部12は、Lchのステレオ入力信号XLに対して空間音響伝達特性Hloに応じた空間音響フィルタを畳み込む。畳み込み演算部12は、畳み込み演算データを、加算器25に出力する。畳み込み演算部22は、Rchのステレオ入力信号XRに対して空間音響伝達特性Hrsに応じた空間音響フィルタを畳み込む。畳み込み演算部22は、畳み込み演算データを、加算器25に出力する。加算器25は2つの畳み込み演算データを加算して、フィルタ部42に出力する。
The convolution calculation unit 12 convolves a spatial acoustic filter corresponding to the spatial acoustic transmission characteristic Hlo with respect to the Lch stereo input signal XL. The convolution calculation unit 12 outputs the convolution calculation data to the
フィルタ部41、42にはヘッドホン特性(ヘッドホンの再生ユニットとマイク間の特性)をキャンセルする逆フィルタが設定されている。そして、頭外定位処理部10での処理が施された再生信号(畳み込み演算信号)に逆フィルタを畳み込む。フィルタ部41で加算器24からのLch信号に対して、逆フィルタを畳み込む。同様に、フィルタ部42は加算器25からのRch信号に対して逆フィルタを畳み込む。逆フィルタは、ヘッドホン43を装着した場合に、ヘッドホンユニットからマイクまでの特性をキャンセルする。マイクは、外耳道入口から鼓膜までの間ならばどこに配置してもよい。逆フィルタは、ユーザU本人の特性の測定結果から算出されている。
Inverse filters that cancel the headphone characteristics (characteristics between the headphone playback unit and the microphone) are set in the
フィルタ部41は、補正されたLch信号をヘッドホン43の左ユニット43Lに出力する。フィルタ部42は、補正されたRch信号をヘッドホン43の右ユニット43Rに出力する。ユーザUは、ヘッドホン43を装着している。ヘッドホン43は、Lch信号とRch信号をユーザUに向けて出力する。これにより、ユーザUの頭外に定位された音像を再生することができる。
The filter unit 41 outputs the corrected Lch signal to the
このように、頭外定位処理装置100は、空間音響伝達特性Hls、Hlo、Hro、Hrsに応じた空間音響フィルタと、ヘッドホン特性の逆フィルタを用いて、頭外定位処理を行っている。以下の説明において、空間音響伝達特性Hls、Hlo、Hro、Hrsに応じた空間音響フィルタと、ヘッドホン特性の逆フィルタとをまとめて頭外定位処理フィルタとする。2chのステレオ再生信号の場合、頭外定位フィルタは、4つの空間音響フィルタと、2つの逆フィルタとから構成されている。そして、頭外定位処理装置100は、ステレオ再生信号に対して合計6個の頭外定位フィルタを用いて畳み込み演算処理を行うことで、頭外定位処理を実行する。
As described above, the out-of-head
(空間音響伝達特性の測定装置)
図2を用いて、空間音響伝達特性Hls、Hlo、Hro、Hrsを測定する測定装置200について説明する。図2は、被測定者1に対して第1の事前測定を行うための測定構成を模式的に示す図である。
(Measuring device for spatial acoustic transmission characteristics)
The measuring
図2に示すように、測定装置200は、ステレオスピーカ5とマイクユニット2を有している。ステレオスピーカ5が測定環境に設置されている。測定環境は、ユーザUの自宅の部屋やオーディオシステムの販売店舗やショールーム等でもよい。測定環境は、スピーカや音響の整ったリスニングルームであることが好ましい。
As shown in FIG. 2, the measuring
本実施の形態では、測定装置200の測定処理装置201が、空間音響フィルタを適切に生成するための演算処理を行っている。測定処理装置201は、例えば、CDプレイヤー等の音楽プレイヤーなどを有している。測定処理装置201は、パーソナルコンピュータ(PC)、タブレット端末、スマートホン等であってもよい。また、測定処理装置201は、サーバ装置自体であってもよい。
In the present embodiment, the
測定処理装置201は、メモリ、及びプロセッサを備えている。メモリは、処理プログラムや各種パラメータや測定データなどを記憶している。プロセッサは、メモリに格納された処理プログラムを実行する。プロセッサが処理プログラムを実行することで、各処理が実行される。プロセッサは、例えば、CPU(Central Processing Unit)、FPGA(Field-Programmable Gate Array)、DSP(Digital Signal Processor),ASIC(Application Specific Integrated Circuit)、又は、GPU(Graphics Processing Unit)等であってもよい。
The
ステレオスピーカ5は、左スピーカ5Lと右スピーカ5Rを備えている。例えば、被測定者1の前方に左スピーカ5Lと右スピーカ5Rが設置されている。左スピーカ5Lと右スピーカ5Rは、インパルス応答測定を行うためのインパルス音等を出力する。以下、本実施の形態では、音源となるスピーカの数を2(ステレオスピーカ)として説明するが、測定に用いる音源の数は2に限らず、1以上であればよい。すなわち、1chのモノラル、または、5.1ch、7.1ch等の、いわゆるマルチチャンネル環境においても同様に、本実施の形態を適用することができる。
The stereo speaker 5 includes a
マイクユニット2は、左のマイク2Lと右のマイク2Rを有するステレオマイクである。左のマイク2Lは、被測定者1の左耳9Lに設置され、右のマイク2Rは、被測定者1の右耳9Rに設置されている。具体的には、左耳9L、右耳9Rの外耳道入口から鼓膜までの位置にマイク2L、2Rを設置することが好ましい。マイク2L、2Rは、ステレオスピーカ5から出力された測定信号を収音して、収音信号を取得する。マイク2L、2Rは収音信号を測定処理装置201に出力する。被測定者1は、人でもよく、ダミーヘッドでもよい。すなわち、本実施形態において、被測定者1は人だけでなく、ダミーヘッドを含む概念である。
The
上記のように、左スピーカ5L、右スピーカ5Rで出力されたインパルス音をマイク2L、2Rで測定することでインパルス応答が測定される。測定処理装置201は、インパルス応答測定により取得した収音信号をメモリなどに記憶する。これにより、左スピーカ5Lと左マイク2Lとの間の空間音響伝達特性Hls、左スピーカ5Lと右マイク2Rとの間の空間音響伝達特性Hlo、右スピーカ5Rと左マイク2Lとの間の空間音響伝達特性Hro、右スピーカ5Rと右マイク2Rとの間の空間音響伝達特性Hrsが測定される。すなわち、左スピーカ5Lから出力された測定信号を左マイク2Lが収音することで、空間音響伝達特性Hlsが取得される。左スピーカ5Lから出力された測定信号を右マイク2Rが収音することで、空間音響伝達特性Hloが取得される。右スピーカ5Rから出力された測定信号を左マイク2Lが収音することで、空間音響伝達特性Hroが取得される。右スピーカ5Rから出力された測定信号を右マイク2Rが収音することで、空間音響伝達特性Hrsが取得される。
As described above, the impulse response is measured by measuring the impulse sound output by the
また、測定装置200は、収音信号に基づいて、左右のスピーカ5L、5Rから左右のマイク2L、2Rまでの空間音響伝達特性Hls、Hlo、Hro、Hrsに応じた空間音響フィルタを生成してもよい。例えば、測定処理装置201は、空間音響伝達特性Hls、Hlo、Hro、Hrsを所定のフィルタ長で切り出す。測定処理装置201は、測定した空間音響伝達特性Hls、Hlo、Hro、Hrsを補正してもよい。
Further, the measuring
このようにすることで、測定処理装置201は、頭外定位処理装置100の畳み込み演算に用いられる空間音響フィルタを生成する。図1で示したように、頭外定位処理装置100が、左右のスピーカ5L、5Rと左右のマイク2L、2Rとの間の空間音響伝達特性Hls、Hlo、Hro、Hrsに応じた空間音響フィルタを用いて頭外定位処理を行う。すなわち、空間音響フィルタをオーディオ再生信号に畳み込むことにより、頭外定位処理を行う。
By doing so, the
測定処理装置201は、空間音響伝達特性Hls、Hlo、Hro、Hrsのそれぞれに対応する収音信号に対して同様の処理を実施している。すなわち、空間音響伝達特性Hls、Hlo、Hro、Hrsに対応する4つの収音信号に対して、それぞれ同様の処理が実施される。これにより、空間音響伝達特性Hls、Hlo、Hro、Hrsに対応する空間音響フィルタをそれぞれ生成することができる。
The
(外耳道伝達特性の測定)
次に、外耳道伝達特性を測定するための測定装置200について、図3を用いて説明する。図3は、被測定者1に対して第2の事前測定を行うための構成を示している。
(Measurement of ear canal transmission characteristics)
Next, the measuring
測定処理装置201には、マイクユニット2と、ヘッドホン43と、が接続されている。マイクユニット2は、左マイク2Lと、右マイク2Rとを備えている。左マイク2Lは、被測定者1の左耳9Lに装着される。右マイク2Rは、被測定者1の右耳9Rに装着される。測定処理装置201、及びマイクユニット2は、図2の測定処理装置201、及びマイクユニット2と同じものでもよく、異なるものでもよい。
The
ヘッドホン43は、ヘッドホンバンド43Bと、左ユニット43Lと、右ユニット43Rとを、有している。ヘッドホンバンド43Bは、左ユニット43Lと右ユニット43Rとを連結する。左ユニット43Lは被測定者1の左耳9Lに向かって音を出力する。右ユニット43Rは被測定者1の右耳9Rに向かって音を出力する。ヘッドホン43は密閉型、開放型、半開放型、または半密閉型等、ヘッドホンの種類を問わない。ヘッドホン43は、ヘッドホン43が装着された状態で、マイクユニット2が被測定者1に装着される。すなわち、左マイク2L、右マイク2Rが装着された左耳9L、右耳9Rにヘッドホン43の左ユニット43L、右ユニット43Rがそれぞれ装着される。ヘッドホンバンド43Bは、左ユニット43Lと右ユニット43Rとをそれぞれ左耳9L、右耳9Rに押し付ける付勢力を発生する。
The
左マイク2Lは、ヘッドホン43の左ユニット43Lから出力された音を収音する。右マイク2Rは、ヘッドホン43の右ユニット43Rから出力された音を収音する。左マイク2L、及び右マイク2Rのマイク部は、外耳孔近傍の収音位置に配置される。左マイク2L、及び右マイク2Rは、ヘッドホン43に干渉しないように構成されている。すなわち、左マイク2L、及び右マイク2Rは左耳9L、右耳9Rの適切な位置に配置された状態で、被測定者1がヘッドホン43を装着することができる。なお、左マイク2L、及び右マイク2Rは、それぞれヘッドホン43の左ユニット43L、及び右ユニット43Rに内蔵されていてもよく、ヘッドホン43と別個に設けられていても良い。
The
測定処理装置201は、左マイク2L、及び右マイク2Rに対して測定信号を出力する。これにより、左マイク2L、及び右マイク2Rはインパルス音などを発生する。具体的には、左ユニット43Lから出力されたインパルス音を左マイク2Lで測定する。右ユニット43Rから出力されたインパルス音を右マイク2Rで測定する。このようにすることで、インパルス応答測定が実施される。
The
測定処理装置201は、インパルス応答測定に基づく収音信号をメモリなどに記憶する。これにより、左ユニット43Lと左マイク2Lとの間の伝達特性(すなわち、左耳の外耳道伝達特性)と、右ユニット43Rと右マイク2Rとの間の伝達特性(すなわち、右耳の外耳道伝達特性)が取得される。ここで、左マイク2Lが取得した左耳の外耳道伝達特性の測定データを測定データECTFLとし、右マイク2Rが取得した右耳の外耳道伝達特性の測定データを測定データECTFRとする。
The
測定処理装置201は、測定データECTFL、ECTFRをそれぞれ記憶するメモリなどを有している。なお、測定処理装置201は、外耳道伝達特性又は空間音響伝達特性を測定するための測定信号として、インパルス信号やTSP(Time Stretched Pulse)信号等を発生する。測定信号はインパルス音等の測定音を含んでいる。
The
図2、図3で示した測定装置200によって、複数の被測定者1の外耳道伝達特性、及び空間音響伝達特性を測定する。本実施の形態では、図2の測定構成による第1の事前測定を複数の被測定者1に対して実施する。同様に、図3の測定構成による第2の事前測定を複数の被測定者1に対して実施する。これにより、被測定者1毎に、外耳道伝達特性、及び空間音響伝達特性が測定される。
The external auditory canal transmission characteristics and the spatial acoustic transmission characteristics of the plurality of
(頭外定位フィルタ決定システム)
次に、本実施の形態にかかる頭外定位フィルタ決定システム500について、図4を用いて説明する。図4は、頭外定位フィルタ決定システム500の全体構成を示す図である。頭外定位フィルタ決定システム500は、頭外定位処理装置100と、サーバ装置300と、を備えている。
(Out-of-head localization filter determination system)
Next, the out-of-head localization
頭外定位処理装置100とサーバ装置300とは、ネットワーク400を介して接続されている。ネットワーク400は、例えば、インターネットや携帯電話通信網などの公衆ネットワークなどである。頭外定位処理装置100とサーバ装置300とは無線又は有線により通信可能になっている。なお、頭外定位処理装置100とサーバ装置300とは一体の装置であってもよい。
The out-of-head
頭外定位処理装置100は、図1で示したように、頭外定位処理された再生信号をユーザUに出力するユーザ端末となる。さらに、頭外定位処理装置100は、ユーザUの外耳道伝達特性の測定を行う。そのため、頭外定位処理装置100には、マイクユニット2とヘッドホン43とが接続されている。頭外定位処理装置100は、図3の測定装置200と同様に、マイクユニット2と、ヘッドホン43とを用いたインパルス応答測定を行う。なお、マイクユニット2、及びヘッドホン43とBlueTooth(登録商標)などにより無線接続されていてもよい。
As shown in FIG. 1, the out-of-head
頭外定位処理装置100は、特性取得部111、周波数変換部112,平滑化部113、特徴量抽出部114と、逆フィルタ算出部115と、フィルタ設定部116と、送信部121と、受信部122を備えている。なお、頭外定位処理装置100とサーバ装置300とが一体の装置である場合、該装置は受信部122に代えてユーザデータを取得する取得部を備えていてもよい。
The out-of-head
特性取得部111は、ユーザ測定を行うため、インパルス音となる測定信号をヘッドホン43に出力する。ヘッドホン43が出力したインパルス音をマイクユニット2が収音する。マイクユニット2は収音信号を特性取得部111に出力する。なお、インパルス応答測定については、図3の説明と同様であるため、適宜説明を省略する。すなわち、頭外定位処理装置100が、図3の測定処理装置201と同様の機能を有している。頭外定位処理装置100と、マイクユニット2と、ヘッドホン43とがユーザ測定を行う。特性取得部111は、収音信号に対して、A/D変換や同期加算処理などを行ってもよい。
The
特性取得部111は、外耳道伝達特性に関する測定データを取得する。特性取得部111は、インパルス応答測定等を行うために、図3の測定処理装置201と同様の機能を有している。測定データは、ユーザUの左耳9Lの外耳道伝達特性に関する測定データと、右耳9Rの外耳道伝達特性に関する測定データとを含んでいる。ここで、時間領域の外耳道伝達特性をf(t)とする。
The
以下、図4と共に、図5を参照して外耳道伝達特性の特徴量を求める処理について説明する。図5は、特徴量を抽出する処理を示すフローチャートである。 Hereinafter, the process of obtaining the feature amount of the external auditory canal transmission characteristic will be described with reference to FIG. FIG. 5 is a flowchart showing a process of extracting a feature amount.
周波数変換部112が、外耳道伝達特性f(t)を周波数変換する(S11)。例えば、周波数変換部112が、時間領域の外耳道伝達特性に対して離散フーリエ変換を行うことで、周波数振幅特性及び周波数位相特性を算出する。また、周波数変換部112は、離散フーリエ変換に限らず、離散コサイン変換などにより、周波数振幅特性及び周波数位相特性を算出してもよい。周波数振幅特性の代わりに、周波数パワー特性が用いられていてもよい。周波数変換で得られた周波数振幅特性をF(f)とする。
The
平滑化部113が、周波数振幅特性F(f)を平滑化する(S12)。平滑化手法としては、ケプストラム分析、単純移動平均、Savitzky-Golayフィルタ、平滑化スプライン、などを用いることができる。平滑化された周波数振幅特性を平滑化特性SF(f)とする。
The smoothing
特徴量抽出部114が、平滑化特性SF(f)のピーク及びノッチを検出し、特徴量を抽出する(S13)。具体的には、平滑化特性SF(f)の傾きに基づいて、ピーク及びノッチを検出する。平滑化特性SF(f)の極大値がピークとなり、極小値がノッチとなる。図6は、平滑化特性を模式的に示す図である。ここでは、平滑化特性に3つのピークと2つのノッチが含まれている例を示す。
The feature
最も低い周波数のピークを1番目のピークP[1]とし、最も低い周波数のノッチを1番目のノッチN[1]とする。同様に周波数が低い側から順番に、2番目のピークP[2]、2番目のノッチN[2]、3番目のピークP[3]とする。ピーク、及びノッチをP[l]、N[l]として一般化する。lは1以上の整数であり、ピーク及びノッチの番号を示す。 The peak with the lowest frequency is referred to as the first peak P [1], and the notch with the lowest frequency is referred to as the first notch N [1]. Similarly, the second peak P [2], the second notch N [2], and the third peak P [3] are set in order from the lower frequency side. Peaks and notches are generalized as P [l], N [l]. l is an integer of 1 or more and indicates a peak and notch number.
特徴量抽出部114は、ピーク周波数、ピーク周波数での振幅(利得)、ノッチ周波数、ノッチ周波数での振幅(利得)を特徴量として抽出する。なお、ピーク周波数での振幅、及びノッチ周波数での振幅の値を、それぞれピーク値、及びノッチ値とする。P[1]〜P[3]のピーク周波数をそれぞれfp1〜fp3とし、ピーク値をgp1〜gp3とする。N[1]〜N[2]のノッチ周波数をそれぞれnp1〜np2とし、ノッチ値をnp1〜np2とする。ピーク値、及びノッチ値は、平滑前の周波数振幅特性F(f)の振幅値とするが、平滑化特性SF(f)の振幅値であってもよい。もちろん、周波数パワー特性の場合は、ピーク値、及びノッチ値はパワー値となる。
The feature
ピークP[1]は(gp1,fp1)の2次元ベクトルで示される。同様に、ピークP[2]、P[3]はそれぞれ(gp2,fp2)、(gp3,fp3)の2次元ベクトルで示される。ノッチN[1]、N[2]はそれぞれ(gn1,fn1)、(gn2,fn2)の2次元ベクトルで示される。 The peak P [1] is represented by a two-dimensional vector of (gp1, fp1). Similarly, peaks P [2] and P [3] are represented by two-dimensional vectors of (gp2, fp2) and (gp3, fp3), respectively. Notches N [1] and N [2] are represented by two-dimensional vectors of (gn1, fn1) and (gn2, fn2), respectively.
全てのピーク及びノッチの周波数、及び振幅値を特徴量として抽出する。特徴量抽出部114が抽出した特徴量は、特徴ベクトルとして示される。特徴ベクトルは、ピーク数とノッチ数との和に応じた次元となっている。具体的には、ピーク数をl_max、ノッチ数をm_maxとすると、特徴ベクトルの次元数は、[2×(l_max+m_max)]となる。例えば、ピークの数が3つ、ノッチの数が2つの場合、特徴量のベクトルは、(fp1、gp1、fn1、gn1、fp2、gp2、fn2、gn2、fp3、gp3)の10次元となる。このように、特徴量抽出部114は、外耳道伝達特性の特徴量を抽出する。特徴量抽出部114は、左右の外耳道伝達特性の特徴量をそれぞれ抽出する。
All peak and notch frequencies and amplitude values are extracted as features. The feature amount extracted by the feature
なお、特徴量抽出部114がピーク及びノッチを求める帯域は全周波数帯域であってもよく、一部の周波数帯域であってもよい。例えば、平滑化特性において、4kHz以上の周波数帯域におけるピークとノッチを求めてもよい。
The band for which the feature
送信部121は、特徴量抽出部114が抽出した特徴量をユーザデータとして、サーバ装置300に送信する。ユーザデータは外耳道伝達特性に関するデータである。具体的には、ユーザデータは、ユーザの外耳道伝達特性の特徴量を含んでいる。ユーザの外耳道伝達特性の特徴量をユーザ特徴量hpL_U、hpR_Uとする。ユーザ特徴量hpL_Uはユーザの左耳の外耳道伝達特性の特徴量であり、ユーザ特徴量hpR_Uはユーザの左耳の外耳道伝達特性の特徴量である。
The
逆フィルタ算出部115は外耳道伝達特性f(t)に基づいて、逆フィルタを算出する。例えば、逆フィルタ算出部115は、外耳道伝達特性f(t)の周波数振幅特性F(f)や周波数位相特性を補正する。逆フィルタ算出部115は、逆離散フーリエ変換により、周波数特性と位相特性とを用いて時間信号を算出する。逆フィルタ算出部115は、時間信号を所定のフィルタ長で切り出すことで、逆フィルタを算出する。頭外定位処理装置100は、逆フィルタをメモリなどに格納する。
The inverse
上記のように、逆フィルタはヘッドホン特性(ヘッドホンの再生ユニットとマイク間の特性)をキャンセルするフィルタである。頭外定位処理装置100は、逆フィルタ算出部115が算出した左右の逆フィルタを記憶する。なお、逆フィルタの算出方法については、公知の手法を用いることができるため、詳細な説明を省略する。逆フィルタ算出部115は、左耳の外耳道伝達特性に基づいて、左の逆フィルタLinvを生成する。逆フィルタ算出部115は、右耳の外耳道伝達特性に基づいて、右の逆フィルタRinvを生成する。
As described above, the inverse filter is a filter that cancels the headphone characteristics (characteristics between the headphone playback unit and the microphone). The out-of-head
なお、頭外定位処理装置100が上記の処理を行っているが、一部又は全ての処理は、サーバ装置300で行われていてもよい。例えば、頭外定位処理装置100が測定した外耳道伝達特性f(t)をサーバ装置300に送信して、サーバ装置300が、周波数変換、平滑化、特徴量抽出の処理を行ってもよい。周波数変換、平滑化、特徴量抽出の処理は、サーバ装置300及び頭外定位処理装置100のいずれで行われてもよい。さらには、頭外定位処理装置100又はサーバ装置300以外の装置が一部の処理を行ってもよい。
Although the out-of-head
サーバ装置300について説明する。サーバ装置300は、受信部301と、データ抽出部302と、データ格納部303と、比較部304と、選択部305と、送信部306とを備えている。
The
受信部301は、頭外定位処理装置100から送信されたユーザデータを受信する。ユーザデータはユーザ特徴量hpL_U、hpR_Uを含んでいる。データ抽出部302は、ユーザ特徴量に基づいて、データ格納部303に格納されているプリセットデータの一部を抽出する。
The receiving
データ格納部303は、事前測定で測定された複数の被測定者に関するデータをプリセットデータとして格納するデータベースである。データベースは、複数の記憶装置に分散されていてもよい。図7を参照して、データ格納部303に格納されているデータについて、説明する。図7は、データ格納部303に格納されているデータを示す表である。
The
データ格納部303は、被測定者の左右の耳毎にプリセットデータを格納している。具体的には、データ格納部303は、被測定者ID、耳の左右、特徴量、空間音響伝達特性1、及び空間音響伝達特性2が1行に並んだテーブル形式となっている。なお、図7に示すデータ形式は一例であり、テーブル形式ではなく、各パラメータのオブジェクトをタグ等で関連付けて保持するデータ形式等を採用してもよい。
The
データ格納部303には、1人の被測定者Aに対して、2つのデータセットが格納されている。すなわち、データ格納部303は、被測定者Aの左耳に関するデータセットと、被測定者Aの右耳に関するデータセットが格納されている。
Two data sets are stored in the
1つのデータセットには、被測定者ID、耳の左右、特徴量、空間音響伝達特性1、及び空間音響伝達特性2が含まれている。特徴量は、図3に示す測定装置200による第2の事前測定に基づくデータである。特徴量は、外耳孔よりも前にある第1の位置からマイク2L、2Rまでの外耳道伝達特性から抽出されている。具体的には、被測定者1の外耳道伝達特性に対して、図5の処理を施すことで、特徴量が抽出される。ユーザの特徴量と、被測定者の特徴量は、それぞれの外耳道伝達特性に対して同様の処理を施すことで、抽出される。
One data set includes the subject ID, the left and right ears, the feature amount, the spatial
被測定者Aの左耳の特徴量は、特徴量hpL_Aと示し、被測定者Aの右耳の特徴量は、特徴量hpR_Aと示している。被測定者Bの左耳の特徴量は、特徴量hpL_Bと示し、被測定者Bの右耳の特徴量は、特徴量hpR_Bと示している。 The feature amount of the left ear of the subject A is shown as the feature amount hpL_A, and the feature amount of the right ear of the subject A is shown as the feature amount hpR_A. The feature amount of the left ear of the subject B is shown as the feature amount hpL_B, and the feature amount of the right ear of the subject B is shown as the feature amount hpR_B.
空間音響伝達特性1、及び空間音響伝達特性2は、図2に示す測定装置200による第1の事前測定に基づくデータである。被測定者Aの左耳の場合、空間音響伝達特性1はHls_Aとなり、空間音響伝達特性2は、Hro_Aとなる。被測定者Aの右耳の場合、空間音響伝達特性1はHrs_Aとなり、空間音響伝達特性2は、Hlo_Aとなる。このように、1つの耳に関する2つの空間音響伝達特性がペアとなっている。被測定者Bの左耳については、Hls_BとHro_Bがペアとなり、被測定者Bの右耳については、Hrs_BとHlo_Bがペアとなっている。空間音響伝達特性1、及び空間音響伝達特性2は、フィルタ長で切り出された後のデータでもよく、フィルタ長で切り出される前のデータでもよい。
The spatial
被測定者Aの左耳については、特徴量hpL_Aと、空間音響伝達特性Hls_Aと、空間音響伝達特性Hro_Aとが対応付けられて、1つのデータセットとなっている。同様に、被測定者Aの右耳については、特徴量hpR_Aと、空間音響伝達特性Hrs_Aと、空間音響伝達特性Hlo_Aとが対応付けられて、1つのデータセットとなっている。同様に、被測定者Bの左耳については、特徴量hpL_Bと、空間音響伝達特性Hls_Bと、空間音響伝達特性Hro_Bとが対応付けられて、1つのデータセットとなっている。同様に、被測定者Bの右耳については、特徴量hpR_Bと、空間音響伝達特性Hrs_Bと、空間音響伝達特性Hlo_Bとが対応付けて、1つのデータセットとなっている。 For the left ear of the subject A, the feature amount hpL_A, the spatial acoustic transmission characteristic Hls_A, and the spatial acoustic transmission characteristic Hro_A are associated with each other to form one data set. Similarly, for the right ear of the subject A, the feature amount hpR_A, the spatial acoustic transmission characteristic Hrs_A, and the spatial acoustic transmission characteristic Hlo_A are associated with each other to form one data set. Similarly, for the left ear of the subject B, the feature amount hpL_B, the spatial acoustic transmission characteristic Hls_B, and the spatial acoustic transmission characteristic Hro_B are associated with each other to form one data set. Similarly, for the right ear of the subject B, the feature amount hpR_B, the spatial acoustic transmission characteristic Hrs_B, and the spatial acoustic transmission characteristic Hlo_B are associated with each other to form one data set.
なお、空間音響伝達特性1、2のペアを第1のプリセットデータとする。すなわち、1つのデータセットを構成する空間音響伝達特性1、及び空間音響伝達特性2を第1のプリセットデータとする。1つのデータセットを構成する特徴量を第2のプリセットデータとする。1つのデータセットは、第1のプリセットデータ、及び第2のプリセットデータを含んでいる。そして、データ格納部303は、第1のプリセットデータと第2のプリセットデータとを被測定者の左右の耳毎に対応付けて記憶している。
The pair of spatial
ここで、n(nは2以上の整数)人の被測定者1に対して、第1及び第2の事前測定が予め行われているとする。この場合、データ格納部303には、両耳分である2n個のデータセットが格納されている。
Here, it is assumed that the first and second pre-measurements are performed in advance for n (n is an integer of 2 or more)
図8を用いて、第2のプリセットデータを詳細に説明する。図8は、第2のプリセットデータを示す表である。被測定者1の左右の耳毎に、特徴量が含まれている。特徴量は、上記の通り、ピーク値、ピーク周波数、ノッチ値、及びノッチ周波数を含んでいる。GP1、FP1は、1番目のピークのピーク値、及びピーク周波数である。GN1、FG1は、1番目のノッチのノッチ値、及びノッチ周波数である。なお、図8では、2番目以降のピーク、及びノッチに関するデータを省略している。さらに、第2のプリセットデータは、平滑化特性のピーク数とノッチ数を含んでいてもよい。
The second preset data will be described in detail with reference to FIG. FIG. 8 is a table showing the second preset data. A feature amount is included for each of the left and right ears of the
また、被測定者1毎にピーク数またはノッチ数が異なる。また、同じ被測定者1であっても、左右の耳で、ピーク数またはノッチ数が異なることがある。よって、データセット毎に、特徴量として含まれるデータ数が異なる。なお、ピーク数とノッチ数は、全周波数帯域におけるピークとノッチの数でもよく、一部の周波数帯域における数でもよい。例えば、所定の周波数以上の帯域におけるピークとノッチを特徴量としてもよい。所定の周波数は、例えば、2kHz〜4kHzの範囲にある周波数である。
In addition, the number of peaks or the number of notches is different for each person to be measured. Further, even in the
データ抽出部302は、ピーク数及びノッチ数が一致する第2のプリセットデータを探索する。そして、データ抽出部302は、ピーク数及びノッチ数が一致する第2のプリセットデータを抽出する。データ抽出部302は、データ格納部303に格納されているデータセットの中から、ピーク数及びノッチ数が一致する第2のプリセットデータを抽出する。
The
例えば、図6では、ピーク数が3で、ノッチ数が2である。よって、図8に示すテーブルにおいて、ID_Aの被測定者の左耳と、ID_Bの被測定者の右耳で、ピーク数とノッチ数が一致する。データ抽出部302は、ID_Aの被測定者1の左耳の特徴量hpL_A、ID_Bの被測定者1の右耳の特徴量hpR_Bを抽出する。データ抽出部302が抽出したデータを抽出データとする。
For example, in FIG. 6, the number of peaks is 3 and the number of notches is 2. Therefore, in the table shown in FIG. 8, the number of peaks and the number of notches match between the left ear of the person to be measured with ID_A and the right ear of the person to be measured with ID_B. The
比較部304は、抽出データ(例えば、特徴量hpL_A、特徴量hpL_A)と、ユーザデータ(例えば、ユーザ特徴量hpL_U)とを比較して、類似度を求める。比較部304は、抽出データの中で、ユーザデータに最も類似する第2のプリセットデータを求める。比較部304は、比較結果を選択部305に出力する。選択部305は、ユーザデータに最も類似する第2のプリセットデータに対応する第1のプリセットデータを選択する。第1のプリセットデータは、上記の通り、空間音響伝達特性1、及び空間音響伝達特性2を含んでいる。
The
例えば、ユーザ特徴量hpL_Uに最も類似する特徴量がID_Aの被測定者1の左耳の特徴量hpL_Aであるとする。選択部305は、特徴量hpL_Aに対応する空間音響伝達特性Hls_A、Hro_Aを選択する。選択部305で選択された特性を選択特性とし、選択特性のデータを選択データとする。選択データは1つのデータセットに含まれる第1のプリセットデータである。選択データは空間音響伝達特性のペアを含んでいる。
For example, it is assumed that the feature amount most similar to the user feature amount hpL_U is the feature amount hpL_A of the left ear of the subject 1 with ID_A. The
データ抽出部302、比較部304、及び選択部305は、左右のユーザ特徴量に対して、それぞれ同様の処理を行う。ユーザの左耳のユーザ特徴量hpL_Uについて、空間音響伝達特性のペア(例えば、Hls_A,Hro_A)が選択データとなる。同様に、ユーザの右耳のユーザ特徴量hpR_Uについて、空間音響伝達特性のペアが選択データとなる。選択部305は、ユーザのそれぞれの耳に対して、選択データを選択する。
The
そして、送信部306は、選択データ(第1のプリセットデータ)を頭外定位処理装置100に送信する。送信部306は、選択された第1のプリセットデータに対して、通信規格に応じた処理(例えば、変調処理)を行って、送信する。送信部306は、ユーザの左右の耳に関して、それぞれ空間音響伝達特性のペアを選択データとして送信する。
Then, the
このように、データ抽出部302は、ピーク及びノッチに基づいて、データ格納部303に格納されたデータセットの中から、一部のデータセットを抽出する。比較部304は、抽出されたデータセットの第2のプリセットデータをユーザデータと比較する。そして、選択部305は、第2のプリセットデータとユーザデータとの比較結果に基づいて、ユーザに適した第1のプリセットデータを選択する。
In this way, the
受信部122は、送信部306から送信された選択データ(第1のプリセットデータ)を受信する。受信部122は、受信した第1のプリセットデータに対して、通信規格に応じた処理(例えば、復調処理)を行う。受信部122は、左耳に関する第1のプリセットデータとして、空間音響伝達特性のペアを受信する。受信部122は、右耳に関する第1のプリセットデータとして、空間音響伝達特性のペアを受信する。
The receiving
そして、フィルタ設定部116は、第1のプリセットデータに基づいて、空間音響フィルタを設定する。例えば、空間音響伝達特性のペアに含まれる空間音響伝達特性Hls_AがユーザUの空間音響伝達特性Hlsとなり、空間音響伝達特性Hro_AがユーザUの空間音響伝達特性Hroとなる。同様に、選択データである第1のプリセットデータに含まれる空間音響伝達特性のペアが、ユーザUの空間音響伝達特性Hlo,Hrsとなる。ユーザUの空間音響伝達特性Hlo、及びHrsは、図7の空間音響伝達特性1のデータから選ばれる。ユーザUの空間音響伝達特性Hlo及びHroは、図7の空間音響伝達特性2のデータから選ばれる。
Then, the
なお、第1のプリセットデータがフィルタ長で切り出した後のデータである場合、フィルタ設定部116が第1のプリセットデータをそのまま、空間音響フィルタとして設定する。例えば、空間音響伝達特性Hls_AがユーザUの空間音響伝達特性Hlsとなる。第1のプリセットデータがフィルタ長で切り出される前のデータである場合、フィルタ設定部116が空間音響伝達特性をフィルタ長に切り出す処理を行う。
When the first preset data is the data after being cut out by the filter length, the
頭外定位処理装置100は、頭外定位フィルタをメモリなどに格納する。フィルタ設定部116は、空間音響フィルタを図1の畳み込み演算部11、12、21、22に設定する。また、フィルタ設定部116は、逆フィルタ算出部115が算出した逆フィルタをフィルタ部41,フィルタ部42に設定する。頭外定位処理装置100は、図1に示したように、4つの空間音響伝達特性Hls、Hlo、Hro、Hrsに応じた空間音響フィルタと、逆フィルタとを用いて、演算処理を行う。頭外定位処理装置100は、4つの空間音響フィルタと、2つの逆フィルタとを用いて、ステレオ入力信号に上記の畳み込み演算処理等を行う。
The out-of-head
このように、データ格納部303が、被測定者1毎に第1のプリセットデータと、第2のプリセットデータを対応付けて格納している。第1のプリセットデータは被測定者1の空間音響伝達特性に関するデータである。第2のプリセットデータは、被測定者1の外耳道伝達特性に関するデータである。具体的には、第2のプリセットデータは、被測定者1の外耳道伝達特性の特徴量を含んでいる。
In this way, the
比較部304はユーザデータを、第2のプリセットデータと比較する。ユーザデータは、ユーザ測定で得られた外耳道伝達特性に関するユーザ特徴量を含んでいる。比較部304は、特徴量の類似度を求めている。比較部304は、特徴量の類似度を求めている。そして、比較部304は、ユーザの外耳道伝達特性と類似する被測定者1と、耳の左右とを決定する。
The
選択部305は、決定された被測定者と耳の左右とに対応する第1のプリセットデータを読み出す。そして、送信部306は、選択された第1のプリセットデータを頭外定位処理装置100に送信している。ユーザ端末である頭外定位処理装置100は、第1のプリセットデータに基づく空間音響フィルタと、測定データに基づく逆フィルタとを用いて、頭外定位処理を行う。
The
このようにすることで、ユーザUが空間音響伝達特性を測定しなくても、適切なフィルタを決定することができる。よって、ユーザがリスニングルームなどに行く必要や、ユーザの家にスピーカなどを設置する必要がなくなる。ユーザ測定はヘッドホン装着状態で実施される。すなわち、ユーザUがヘッドホンとマイクとを装着していれば、ユーザ個人の外耳道伝達特性を測定することができる。よって、簡便な方法で、定位効果の高い頭外定位を実現できる。なお、ユーザ測定と、頭外定位受聴に用いられるヘッドホン43は同じタイプのものであることが好ましい。
By doing so, it is possible to determine an appropriate filter without the user U measuring the spatial acoustic transmission characteristics. Therefore, it is not necessary for the user to go to the listening room or the like, or to install a speaker or the like in the user's house. User measurement is performed with headphones on. That is, if the user U wears the headphones and the microphone, the external auditory canal transmission characteristics of the individual user can be measured. Therefore, an out-of-head localization with a high localization effect can be realized by a simple method. It is preferable that the
さらに、ユーザデータと第2のプリセットデータが周波数振幅特性のピーク及びノッチに基づく特徴量となっている。これにより、処理するデータ量を削減することができる。特に、ピーク周波数、ピーク値、ノッチ周波数、及びノッチ値が特徴量として抽出されている。これにより、データ格納部303が、多数の被測定者のプリセットデータを格納している場合でも、少ないデータ量で適切にマッチングを行うことができる。
Further, the user data and the second preset data are features based on the peaks and notches of the frequency amplitude characteristic. As a result, the amount of data to be processed can be reduced. In particular, the peak frequency, the peak value, the notch frequency, and the notch value are extracted as feature quantities. As a result, even when the
また、本実施形態にかかる方法では、多数のプリセット特性を聴く聴感テストを行う必要がない。よって、ユーザ負担を軽減することができ、利便性を向上することができる。そして、被測定者とユーザの特徴量を比較することで、特性が似ている被測定者を選ぶことができる。そして選ばれた被測定者の耳の第1のプリセットデータから音響伝達フィルタが生成されるため、高い頭外定位効果が期待できる。 Further, in the method according to the present embodiment, it is not necessary to perform an auditory test for listening to a large number of preset characteristics. Therefore, the burden on the user can be reduced and the convenience can be improved. Then, by comparing the feature quantities of the person to be measured and the user, it is possible to select a person to be measured having similar characteristics. Then, since the acoustic transmission filter is generated from the first preset data of the selected subject's ear, a high out-of-head localization effect can be expected.
次に、図9を用いて、類似度を求める処理について説明する。図9は類似度を求める処理の一例を示すフローチャートである。本実施の形態では、比較部304が、ベクトル間距離または相関係数を用いて、類似度を算出している。なお、比較部304は、ベクトル間距離と相関係数の双方を用いて類似度を算出してもよい。
Next, the process of obtaining the similarity will be described with reference to FIG. FIG. 9 is a flowchart showing an example of the process of obtaining the similarity. In the present embodiment, the
データ抽出部302が、評価範囲を算出する(S21)。評価範囲は、ピーク及びノッチを抽出する周波数帯域である。ここでは、4kHz以上の周波数帯域を評価範囲としている。4kHz以上の周波数帯域に、個人の特性が現れやすいからである。なお、評価範囲の下限値は4kHzに限られるものではなく、例えば2kHzであってもよい。評価範囲の上限値は、周波数変換により得られた周波数特性の最大周波数とすることができる。なお、予め評価範囲内のピーク及びノッチのみが抽出されている場合、S21は省略することができる。
The
データ抽出部302が、データ格納部303に格納されたプリセットデータの中からデータを抽出する(S22)。すなわち、データ抽出部302が、評価範囲においてピーク数とノッチ数が一致する第2のプリセットデータを抽出する。
The
次に、比較部304が、ユーザデータ、及び第2のプリセットデータを正規化及び尺度変換する。例えば、ユークリッド距離を求める場合、周波数と振幅値で評価範囲の値(単位)が異なる。このため、評価対象となる周波数帯域の最小周波数が0、最大周波数が1となるように、比較部304がピーク周波数とノッチ周波数を正規化する。振幅値では、評価対象の振幅値(ピーク値)の最大値が1となり、振幅値(ノッチ値)の最小値が0となるように、比較部304がピーク値、及びノッチ値を正規化する。例えば、図6に示す例において、横軸(周波数軸)上において、fp1〜fp3の範囲が0〜1となる。同様に、縦軸(振幅軸)上において、gn1〜gp3の範囲が0〜1となる。
Next, the
尺度変換は、対数軸において、離散的なスペクトルデータ(周波数振幅特性)が等間隔になるように包絡線データの尺度を変化する。周波数変換部で求められた周波数振幅特性は、周波数的に等間隔となっている。つまり、周波数振幅特性は、周波数線形軸において等間隔となっているため、周波数対数軸では非等間隔になっている。このため、周波数対数軸において周波数振幅特性のデータが等間隔になるように、補間処理を行う。 Scale conversion changes the scale of envelope data so that discrete spectral data (frequency amplitude characteristics) are evenly spaced on the logarithmic axis. The frequency amplitude characteristics obtained by the frequency converter are evenly spaced in terms of frequency. That is, since the frequency amplitude characteristics are evenly spaced on the frequency linear axis, they are not evenly spaced on the frequency logarithmic axis. Therefore, interpolation processing is performed so that the frequency amplitude characteristic data are evenly spaced on the frequency logarithmic axis.
周波数振幅特性において、対数軸上では、低周波数域になればなるほど隣接するデータ間隔は粗く、高周波数域になればなるほど隣接するデータ間隔は密になっている。そのため、比較部304は、データ間隔が粗い低周波数帯域のデータを補間する。具体的には、比較部304は、3次元スプライン補間等の補間処理を行うことで、対数軸において等間隔に配置された離散的な包絡線データを求める。尺度変換が行われた包絡線データを、尺度変換データとする。尺度変換データは、周波数と振幅値またはパワー値とが対応付けられているスペクトルとなる。
In the frequency amplitude characteristic, on the logarithmic axis, the lower the frequency range, the coarser the adjacent data spacing, and the higher the frequency range, the denser the adjacent data spacing. Therefore, the
対数尺度に変換する理由について説明する。一般的に人間の感覚量は対数に変換されていると言われている。そのため、聴こえる音の周波数も対数軸で考えることが重要になる。尺度変換することで、上記の感覚量においてデータが等間隔となるため、全ての周波数帯域でデータを等価に扱えるようになる。この結果、数学的な演算、周波数帯域の分割や重み付けが容易になり、安定した結果を得ることが可能になる。なお、比較部304は、対数尺度に限らず、人間の聴覚に近い尺度(聴覚尺度と称する)へ包絡線データを変換すればよい。聴覚尺度としては、対数尺度(Logスケール)、メル(mel)尺度、バーク(Bark)尺度、ERB(Equivalent Rectangular Bandwidth)尺度等で尺度変換をしてもよい。比較部304は、データ補間により、包絡線データを聴覚尺度で尺度変換する。例えば、比較部304は、聴覚尺度においてデータ間隔が粗い低周波数帯域のデータを補間することで、低周波数帯域のデータを密にする。聴覚尺度で等間隔なデータは、線形尺度(リニアスケール)では低周波数帯域が密、高周波数帯域が粗なデータとなる。このようにすることで、比較部304は、聴覚尺度で等間隔な尺度変換データを生成することができる。もちろん、尺度変換データは、聴覚尺度において、完全に等間隔なデータでなくてもよい。
The reason for converting to a logarithmic scale will be explained. It is generally said that human senses are converted to logarithms. Therefore, it is important to consider the frequency of the audible sound on the logarithmic axis. By performing the scale conversion, the data are evenly spaced in the above-mentioned sensory quantity, so that the data can be treated equivalently in all frequency bands. As a result, mathematical calculations, frequency band division and weighting become easy, and stable results can be obtained. The
S23、及びS25において、正規化、及び尺度変換は同じ処理でなくてもよい。例えば、距離を求める場合の尺度と、相関係数を求めるための尺度は異なっていてもよい。さらに、正規化、及び尺度変換の一方のみを行ってもよい。あるいは、正規化、及び尺度変換を省略してもよい。正規化と尺度変換の処理順序は、どちらを先に行ってもよく任意である。 In S23 and S25, normalization and scale conversion do not have to be the same process. For example, the scale for finding the distance and the scale for finding the correlation coefficient may be different. Furthermore, only one of normalization and scale conversion may be performed. Alternatively, normalization and scale conversion may be omitted. The processing order of normalization and scale conversion may be arbitrary, whichever comes first.
次に、比較部304は、特徴ベクトル間の距離を算出する(S24)。特徴ベクトル間の距離を求めるための処理について図10を用いて説明する。図10は、距離を求める処理を示すフローチャートである。ここでは、比較部304が、ユーザデータと第2のプリセットデータとについて、特徴ベクトルのユークリッド距離を求めている。まず、初期化のため、l=0、m=0、q=0とする(S31)。qはユークリッド距離を示す。
Next, the
比較部304は、l=l_maxであるか否かを判定する(S32)。l_maxは、ピーク数を示す整数である。l=l_maxではないと判定された場合(S32のNO)、q+=||AP[l]−BP[l]||とする(S33)。AP[l]は、ユーザデータにおけるl番目のピークを示す二次元ベクトルである。BP[l]は、第2のプリセットデータにおけるl番目のピークを示す二次元ベクトルである。比較部304は、l番目のピーク同士のピーク間のユークリッド距離を求める。
The
比較部304は、lをインクリメントする(S34)。そして、l=l_maxとなるまで、S32〜S34の処理を繰り返す。これにより、全てのピーク間の距離が求められる。つまり、qはピーク間の距離をl_max回だけ加算した値となる。l_max=3の場合、1番目のピーク同士のピーク間距離(第1のピーク間距離)と、2番目のピーク同士のピーク間距離(第2のピーク間距離)と、3番目のピーク同士のピーク間距離(第3のピーク間距離)が求められる。S33において、qは、第1〜第3のピーク間距離の総和となる。
The
l=l_maxと判定された場合(S32のYES)、比較部304は、m=m_maxであるか否かを判定する(S35)。m_maxは、ノッチ数を示す整数である。m=m_maxではない場合(S35のNO)、q+=||AN[m]−BN[m]||とする(S36)。AP[m]は、ユーザデータにおけるm番目のノッチを示す二次元ベクトルである。BP[m]は、第2のプリセットデータにおけるm番目のノッチを示す二次元ベクトルである。比較部304は、m番目のノッチ同士のノッチ間のユークリッド距離を求める。なお、上記の処理において、AP[l],AN[l]、及びBP[l]、BN[l]は、S23で正規化及び尺度変換が行われたデータとなっている。
When it is determined that l = l_max (YES in S32), the
比較部304は、mをインクリメントする(S37)。そして、m=m_maxとなるまで、S35〜S37の処理を繰り返す。これにより、全てのノッチ間の距離が求められる。つまり、qはl個のピーク間の距離と、m個のノッチ間の距離との総和となる。l_max=3、m_max=2の場合、qは、第1〜第3のピーク間距離と、第1〜第2のピーク間距離との総和となる。
The
そして、比較部304はq=q/(l_max+m_max)とする。これにより、qが、(l_max+m_max)個の距離の平均値となる。このようにして、特徴ベクトル間の距離を求めることができる。上記のように、ピーク数及びノッチ数が一致する第2のプリセットデータが抽出されているため、適切に特徴ベクトル間の距離を求めることができる。
Then, the
図9の説明に戻る。比較部304は、相関係数を算出する(S26)。図11を用いて、相関係数を求めるための処理について説明する。なお、以下の処理においてもAP[l]、AN[m]、BP[l]、BN[m]は、S25において、正規化及び尺度変換されたデータとなっている。
Returning to the description of FIG. The
比較部304は、特徴量のデータを補間する(S41)。図12に特徴量のデータを線形補間する例を示す。ここでは、ユーザデータが3つのピークAP[1]〜AP[3]と2つのノッチAN[1]〜AN[2]を有している。また、第2のプリセットデータが3つのピークBP[1]〜BP[3]と2つのノッチBN[1]〜BN[2]を有している。比較部304は、ピークとノッチとの間の振幅値を線形補間により算出する。もちろん、線形補間に限らず、スプライン補間などを用いてもよい。ユーザデータを補間したデータを補間データlinAF(f)とし、第2のプリセットデータを補間したデータを補間データlinBF(f)とする。
The
補間データを生成する理由について説明する。相関を見る2つのデータのピークとノッチの数が少ない場合がある。その場合、十分に2つの波形の類似性を評価することが困難となる。よって、ピークとノッチとの間のデータ(振幅値)を補間している。これにより、外耳道伝達特性の相関を精度良く求めることができる。 The reason for generating the interpolated data will be described. The number of peaks and notches in the two data looking for correlation may be small. In that case, it becomes difficult to sufficiently evaluate the similarity between the two waveforms. Therefore, the data (amplitude value) between the peak and the notch is interpolated. As a result, the correlation of the external auditory canal transmission characteristics can be obtained with high accuracy.
次に、比較部304が、補間データの評価範囲を算出する(S42)。例えば、補間後、評価する2つのデータの最大周波数が異なる場合がある。この場合は2つの最大周波数の小さい周波数までを周波数軸の評価範囲の最大値とする。図11に示す例においては、BP[3]のピーク周波数が、AP[3]のピーク周波数よりも大きい。よって、AP[3]のピーク周波数を最大周波数として、補間データlinAF(f)、linBF(f)を生成する。つまり、評価範囲の最大値は、AP[l_max]、AN[m_max]、BP[l_max]、BN[m_max]の周波数に基づいて設定される。
Next, the
AP[l_max]のピーク周波数がAN[m_max]のノッチ周波数より大きく、かつ、BP[l_max]のピーク周波数が、BN[m_max]のノッチ周波数よりも大きい場合、AP[l_max]のピーク周波数とBP[l_max]のピーク周波数の内、小さい方のピーク周波数を補間データの最大周波数とする。AP[l_max]のピーク周波数がAN[m_max]のノッチ周波数より小さく、かつ、BP[l_max]のピーク周波数が、BN[m_max]のノッチ周波数よりも小さい場合、AN[m_max]のノッチ周波数とBN[m_max]のノッチ周波数の内、小さい方のノッチ周波数を補間データの最大周波数とする。 When the peak frequency of AP [l_max] is larger than the notch frequency of AN [m_max] and the peak frequency of BP [l_max] is larger than the notch frequency of BN [m_max], the peak frequency of AP [l_max] and BP The smaller peak frequency among the peak frequencies of [l_max] is set as the maximum frequency of the interpolated data. When the peak frequency of AP [l_max] is smaller than the notch frequency of AN [m_max] and the peak frequency of BP [l_max] is smaller than the notch frequency of BN [m_max], the notch frequency of AN [m_max] and BN Of the notch frequencies of [m_max], the smaller notch frequency is set as the maximum frequency of the interpolation data.
周波数軸の評価範囲の最小値は個人特性が現れやすい4kHzとしてもよい。耳介特性の測定方法によって、個人特性が現れやすい周波数領域が異なることがあるため、周波数軸の評価範囲の最小値は4kHzである必要はない。S21において説明したように、最小値は2kHz〜4kHzの範囲とすることができる。S42で算出された評価範囲と、S21で算出された評価範囲は異なっていてもよく、同じであってもよい。 The minimum value of the evaluation range of the frequency axis may be 4 kHz at which personal characteristics are likely to appear. Since the frequency range in which personal characteristics are likely to appear may differ depending on the method for measuring the auricle characteristics, the minimum value of the evaluation range of the frequency axis does not need to be 4 kHz. As described in S21, the minimum value can be in the range of 2 kHz to 4 kHz. The evaluation range calculated in S42 and the evaluation range calculated in S21 may be different or the same.
そして、比較部304が相関係数を算出する(S43)。具体的には、比較部304は、評価範囲において、補間データlinAF(f)と補間データlinBF(f)の相関係数rを算出する。
Then, the
図9の説明に戻る。比較部304は、ユークリッド距離qと相関係数rとに基づいて類似度を算出する(S27)。ユークリッド距離qは値が小さいほど距離が近いこと、つまり特性が似ていることを示す。相関係数rは−1〜+1の間で値を取り、+1に近いほど似ていることを示す。よって、(1−r)の値が小さいほど、特性が類似していることとなる。比較部304は、類似度をq+(1−r)とする。あるいは、比較部304は、類似度をq*(1−r)としてもよい。さらには、比較部304は、qと(1−r)に重み付けを行ってもよい。例えば、比較部304は、重み付けのための係数をq及び(1−r)の少なくとも一方に乗じてもよい。
Returning to the description of FIG. The
比較部304は、S22で抽出された全てのデータに対して、ユーザ特性との類似度を算出する。つまり、比較部304は、ピーク数とノッチ数が等しい第2のプリセットデータのそれぞれに対して、ユーザデータとの類似度を算出する。そして、選択部305が、類似度が最も高い第2のプリセットデータに対応する第1のプリセットデータを選択する(S28)。本実施の形態では、相関係数と距離とに基づいて類似度を求めているため、ユーザに特性が似ている被測定者1を選ぶことができる。そして選ばれた被測定者の耳の第1のプリセットデータを選択部305が選択するため、高い頭外定位効果が期待できる。
The
なお、上記の説明では、相関係数と距離とに基づいて、類似度が求められているが、相関係数と距離のいずれか一方のみに基づいて、類似度が求められていてもよい。さらに、本実施の形態では、ピーク数とノッチ数とが一致する第2のプリセットデータのみを抽出しているため、特徴ベクトルの次元数を揃えることができる。これにより、ベクトル間距離を適切に算出することができ、より適切なマッチングを行うことができる。 In the above description, the similarity is determined based on the correlation coefficient and the distance, but the similarity may be determined based on only one of the correlation coefficient and the distance. Further, in the present embodiment, since only the second preset data in which the number of peaks and the number of notches match is extracted, the number of dimensions of the feature vector can be made uniform. As a result, the distance between the vectors can be calculated appropriately, and more appropriate matching can be performed.
また、上記の説明では、補間データlinAF(f)と補間データlinBF(f)の相関係数rを求めたが、比較部304は周波数振幅特性F(f)と補間データlinBF(f)との相関係数を求めてもよい。あるいは、比較部304は平滑化特性SF(f)と補間データlinBF(f)との相関係数を求めてもよい。この場合、頭外定位処理装置100が外耳道伝達特性f(t)、周波数振幅特性F(f)又は平滑化特性SF(f)をサーバ装置300に送信すればよい。また、周波数振幅特性F(f)又は平滑化特性SF(f)を求めるための処理の一部又は全部が、サーバ装置300で行われてもよい。
Further, in the above description, the correlation coefficient r between the interpolated data linAF (f) and the interpolated data linBF (f) was obtained, but the
変形例
変形例では、第2のプリセットデータをクラスタリングしている。図13は、ピーク数とノッチ数とに基づいてクラスタリングを行った例を説明するためのテーブルである。実施の形態1では、特徴ベクトル間の距離を求めるため、ピーク数及びノッチ数がユーザ特徴量と一致する第2のプリセットデータが抽出されている。したがって、ピーク数及びノッチ数に応じて、予め第2のプリセットデータをクラスタリングしておくことで、データ抽出の処理を迅速に行うことができる。例えば、ピーク数が3、ノッチ数が2の場合、データ抽出部302が、クラスタ330に含まれる第2のプリセットデータを抽出する。
Modification example In the modification example, the second preset data is clustered. FIG. 13 is a table for explaining an example in which clustering is performed based on the number of peaks and the number of notches. In the first embodiment, in order to obtain the distance between the feature vectors, the second preset data in which the number of peaks and the number of notches match the user feature amount is extracted. Therefore, by clustering the second preset data in advance according to the number of peaks and the number of notches, the data extraction process can be performed quickly. For example, when the number of peaks is 3 and the number of notches is 2, the
もちろん、ピーク数、及びノッチ数以外を用いて、第2のプリセットデータをクラスタ(グループ)に分けてもよい。例えば、特徴ベクトルに応じて、クラスタリングを行ってもよい。具体的には、k平均法等を用いて、クラスタリングを行うことができる。また、クラスタリングは、階層型クラスタリングであってもよく、非階層型クラスタリングであってもよい。また、各クラスタに十分な数の第2のプリセットデータ含まれるようにクラスタリングを行うことが好ましい。 Of course, the second preset data may be divided into clusters (groups) by using other than the number of peaks and the number of notches. For example, clustering may be performed according to the feature vector. Specifically, clustering can be performed using the k-means method or the like. Further, the clustering may be hierarchical clustering or non-hierarchical clustering. Further, it is preferable to perform clustering so that each cluster contains a sufficient number of second preset data.
データ抽出部302は、ユーザ特徴量が属するクラスタの第2のプリセットデータを抽出すればよい。データ格納部303では、複数の前記第2のプリセットデータが2以上のクラスタに分類されていればよい。データ抽出部302は、ユーザ特徴量が属するクラスタに含まれる第2のプリセットデータを抽出する。
The
頭外定位処理装置100、及び測定処理装置201が、測定結果に応じて、フィルタを適切に生成するための演算処理を行っている。頭外定位処理装置100、及び測定処理装置201は、パーソナルコンピュータ(PC)、タブレット端末、スマートホン等であり、メモリ、及びプロセッサを備えている。メモリは、処理プログラムや各種パラメータや測定データなどを記憶している。プロセッサは、メモリに格納された処理プログラムを実行する。プロセッサが処理プログラムを実行することで、各処理が実行される。プロセッサは、例えば、CPU(Central Processing Unit)、FPGA(Field-Programmable Gate Array)、DSP(Digital Signal Processor),ASIC(Application Specific Integrated Circuit)、又は、GPU(Graphics Processing Unit)等であってもよい。
The out-of-head
なお、図1,図2のブロック図のうち、一部のブロックを省略することが可能である。例えば、図2において、送信部121,送信部306、受信部122、及び受信部301は、他の装置に設けられていてもよい。さらに、複数の装置が分散して処理を行ってもよい。図5,図9のフローチャートのうち、一部,又は全部の処理については省略することが可能である。例えば、S23〜S27は、他の比較処理に置き換えることができる。つまり、S23〜S27以外の処理により、比較部304がユーザ特徴量と、第2のプリセットデータとを比較してもよい。
It is possible to omit some blocks from the block diagrams of FIGS. 1 and 2. For example, in FIG. 2, the transmitting
上記処理のうちの一部又は全部は、コンピュータプログラムによって実行されてもよい。上述したプログラムは、様々なタイプの非一時的なコンピュータ可読媒体(non−transitory computer readable medium)を用いて格納され、コンピュータに供給することができる。非一時的なコンピュータ可読媒体は、様々なタイプの実体のある記録媒体(tangible storage medium)を含む。非一時的なコンピュータ可読媒体の例は、磁気記録媒体(例えばフレキシブルディスク、磁気テープ、ハードディスクドライブ)、光磁気記録媒体(例えば光磁気ディスク)、CD−ROM(Read Only Memory)、CD−R、CD−R/W、半導体メモリ(例えば、マスクROM、PROM(Programmable ROM)、EPROM(Erasable PROM)、フラッシュROM、RAM(Random Access Memory))を含む。また、プログラムは、様々なタイプの一時的なコンピュータ可読媒体(transitory computer readable medium)によってコンピュータに供給されてもよい。一時的なコンピュータ可読媒体の例は、電気信号、光信号、及び電磁波を含む。一時的なコンピュータ可読媒体は、電線及び光ファイバ等の有線通信路、又は無線通信路を介して、プログラムをコンピュータに供給できる。 Part or all of the above processing may be executed by a computer program. The programs described above can be stored and supplied to a computer using various types of non-transitory computer readable media. Non-transient computer-readable media include various types of tangible storage media. Examples of non-temporary computer-readable media include magnetic recording media (eg, flexible disks, magnetic tapes, hard disk drives), magneto-optical recording media (eg, magneto-optical disks), CD-ROMs (Read Only Memory), CD-Rs, CD-R / W, semiconductor memory (for example, mask ROM, PROM (Programmable ROM), EPROM (Erasable PROM), flash ROM, RAM (Random Access Memory)) are included. The program may also be supplied to the computer by various types of temporary computer readable media. Examples of temporary computer-readable media include electrical, optical, and electromagnetic waves. The temporary computer-readable medium can supply the program to the computer via a wired communication path such as an electric wire and an optical fiber, or a wireless communication path.
以上、本発明者によってなされた発明を実施の形態に基づき具体的に説明したが、本発明は上記実施の形態に限られたものではなく、その要旨を逸脱しない範囲で種々変更可能であることは言うまでもない。 Although the invention made by the present inventor has been specifically described above based on the embodiment, the present invention is not limited to the above embodiment and can be variously modified without departing from the gist thereof. Needless to say.
U ユーザ
1 被測定者
2L 左マイク
2R 右マイク
5L 左スピーカ
5R 右スピーカ
9L 左耳
9R 右耳
10 頭外定位処理部
11 畳み込み演算部
12 畳み込み演算部
21 畳み込み演算部
22 畳み込み演算部
24 加算器
25 加算器
41 フィルタ部
42 フィルタ部
43 ヘッドホン
100 頭外定位処理装置
111 特性取得部
112 周波数変換部
113 平滑化部
114 特徴量抽出部
115 逆フィルタ算出部
116 フィルタ設定部
121 送信部
122 受信部
200 測定装置
201 測定処理装置
300 サーバ装置
301 受信部
302 データ抽出部
303 データ格納部
304 比較部
305 選択部
306 送信部
Claims (11)
前記ユーザの耳に装着され、前記出力ユニットから出力された音を収音するマイクユニットと、
前記出力ユニットに対して測定信号を出力するとともに、前記マイクユニットから出力された収音信号を測定する測定処理装置と、
前記測定処理装置と通信可能なサーバ装置と、を備えた頭外定位フィルタ決定システムであって、
前記サーバ装置は、
音源から被測定者の耳までの空間音響伝達特性に関する第1のプリセットデータと、前記被測定者の耳の外耳道伝達特性の特徴量に関する第2のプリセットデータと、を対応付けて記憶するデータ格納部であって、複数の被測定者に対して取得された複数の前記第1及び第2のプリセットデータを記憶するデータ格納部を備え、
前記頭外定位フィルタ決定システムは、
前記マイクユニットで収音された収音信号を周波数変換して、周波数特性を求める周波数変換部と、
前記周波数特性を平滑化する平滑化部と、
平滑化された前記周波数特性のピーク及びノッチを求め、前記ピーク及びノッチに基づいて前記周波数特性の特徴量をユーザ特徴量として抽出する特徴量抽出部と、
前記ユーザ特徴量に基づいて、前記データ格納部に格納されている複数の第2のプリセットデータのうちの一部の第2のプリセットデータを抽出するデータ抽出部と、
前記ユーザ特徴量と、抽出された前記第2のプリセットデータとを比較する比較部と、
比較結果に基づいて、複数の前記第1のプリセットデータの中から第1のプリセットデータを選択する選択部と、を備えた頭外定位フィルタ決定システム。 An output unit that is attached to the user and outputs sound toward the user's ear,
A microphone unit that is attached to the user's ear and collects the sound output from the output unit.
A measurement processing device that outputs a measurement signal to the output unit and measures a sound collection signal output from the microphone unit.
An out-of-head localization filter determination system including a server device capable of communicating with the measurement processing device.
The server device
Data storage in which the first preset data relating to the spatial acoustic transmission characteristics from the sound source to the ear of the person to be measured and the second preset data relating to the characteristics of the external auditory canal transmission characteristics of the ear of the person to be measured are associated and stored. The unit includes a data storage unit that stores a plurality of the first and second preset data acquired for a plurality of subjects.
The out-of-head localization filter determination system is
A frequency conversion unit that obtains frequency characteristics by frequency-converting the sound-collecting signal picked up by the microphone unit.
A smoothing unit that smoothes the frequency characteristics,
A feature amount extraction unit that obtains a smoothed peak and notch of the frequency characteristic and extracts the feature amount of the frequency characteristic as a user feature amount based on the peak and notch.
A data extraction unit that extracts a part of the second preset data among the plurality of second preset data stored in the data storage unit based on the user feature amount, and a data extraction unit.
A comparison unit that compares the user feature amount with the extracted second preset data,
An out-of-head localization filter determination system including a selection unit for selecting a first preset data from a plurality of the first preset data based on a comparison result.
所定の周波数帯域にある前記ピークのピーク周波数、及び前記ピーク周波数におけるピーク値を含み、かつ、前記所定の周波数帯域にある前記ノッチのノッチ周波数、及び前記ノッチ周波数におけるノッチ値を含んでいる請求項1〜3のいずれか1項に記載の頭外定位フィルタ決定システム。 The feature amount is
A claim that includes the peak frequency of the peak in a predetermined frequency band and the peak value at the peak frequency, and also includes the notch frequency of the notch in the predetermined frequency band and the notch value at the notch frequency. The out-of-head localization filter determination system according to any one of 1 to 3.
前記データ抽出部は、
前記ユーザ特徴量が属するクラスタに含まれる第2のプリセットデータを抽出する請求項1〜6のいずれか1項に記載の頭外定位フィルタ決定システム。 In the data storage unit, a plurality of the second preset data are classified into two or more clusters.
The data extraction unit
The out-of-head localization filter determination system according to any one of claims 1 to 6, wherein the second preset data included in the cluster to which the user feature amount belongs is extracted.
前記周波数特性を平滑化する平滑化部と、
平滑化された前記周波数特性のピーク及びノッチを求め、前記ピーク及びノッチに基づいて前記周波数特性の特徴量をユーザ特徴量として抽出する特徴量抽出部と、
前記ユーザ特徴量に類似する特徴量に対応付けられた空間音響伝達特性に基づいて、空間音響フィルタを設定する空間音響フィルタ設定部と、
前記収音信号に基づいて、前記出力ユニットの特性をキャンセルする逆フィルタを算出する逆フィルタ算出部と、を備えた頭外定位処理装置。 A frequency conversion unit that obtains frequency characteristics by frequency-converting the sound collection signal obtained by collecting the measurement signal output from the output unit with the microphone unit.
A smoothing unit that smoothes the frequency characteristics,
A feature amount extraction unit that obtains a smoothed peak and notch of the frequency characteristic and extracts the feature amount of the frequency characteristic as a user feature amount based on the peak and notch.
A spatial acoustic filter setting unit that sets a spatial acoustic filter based on a spatial acoustic transmission characteristic associated with a feature quantity similar to the user feature quantity.
An out-of-head localization processing device including an inverse filter calculation unit that calculates an inverse filter that cancels the characteristics of the output unit based on the sound pick-up signal.
ユーザ特徴量に基づいて、前記データ格納部に格納されている複数の第2のプリセットデータのうちの一部の第2のプリセットデータを抽出するデータ抽出部と、
前記ユーザ特徴量と、前記第2のプリセットデータの特徴量とを比較する比較部と、
比較結果に基づいて、複数の前記第1のプリセットデータの中から第1のプリセットデータを選択する選択部と、を備え、
前記外耳道伝達特性の周波数特性が平滑化され、平滑化された前記周波数特性のピーク及びノッチに基づいて前記特徴量が抽出されている、頭外定位フィルタ決定装置。 Data storage in which the first preset data relating to the spatial acoustic transmission characteristics from the sound source to the ear of the person to be measured and the second preset data relating to the characteristics of the external auditory canal transmission characteristics of the ear of the person to be measured are associated and stored. A data storage unit that stores a plurality of the first and second preset data acquired for a plurality of subjects, and a data storage unit.
A data extraction unit that extracts a part of the second preset data among the plurality of second preset data stored in the data storage unit based on the user feature amount, and a data extraction unit.
A comparison unit that compares the user feature amount with the feature amount of the second preset data,
A selection unit for selecting the first preset data from the plurality of first preset data based on the comparison result is provided.
An out-of-head localization filter determining device in which the frequency characteristic of the external auditory canal transmission characteristic is smoothed and the feature amount is extracted based on the smoothed peak and notch of the frequency characteristic.
前記ユーザの耳に装着され、前記出力ユニットから出力された音を収音するマイクを有するマイクユニットと、を用いて、前記ユーザに対する頭外定位フィルタを決定する頭外定位フィルタ決定方法であって、
前記マイクユニットで収音された収音信号を周波数変換して、周波数特性を求めるステップと、
前記周波数特性を平滑化するステップと、
平滑化された前記周波数特性のピーク及びノッチを求め、前記ピーク及びノッチに基づいて前記周波数特性の特徴量をユーザ特徴量として抽出するステップと、
前記ユーザ特徴量に基づいて、データ格納部に格納されている複数の第2のプリセットデータのうちの一部の第2のプリセットデータを抽出するステップと、
前記ユーザ特徴量と、抽出された前記第2のプリセットデータとを比較するステップと、
比較結果に基づいて、複数の第1のプリセットデータの中から第1のプリセットデータを選択するステップと、を含む頭外定位フィルタ決定方法。 An output unit that is attached to the user and outputs sound toward the user's ear,
It is an out-of-head localization filter determination method for determining an out-of-head localization filter for the user by using a microphone unit which is attached to the user's ear and has a microphone for collecting the sound output from the output unit. ,
The step of frequency-converting the sound pick-up signal picked up by the microphone unit to obtain the frequency characteristics, and
The step of smoothing the frequency characteristics and
A step of obtaining a smoothed peak and notch of the frequency characteristic and extracting the feature amount of the frequency characteristic as a user feature amount based on the peak and notch.
A step of extracting a part of the second preset data from the plurality of second preset data stored in the data storage unit based on the user feature amount, and a step of extracting the second preset data.
A step of comparing the user feature amount with the extracted second preset data,
An out-of-head localization filter determination method including a step of selecting a first preset data from a plurality of first preset data based on a comparison result.
前記ユーザの耳に装着され、前記出力ユニットから出力された音を収音するマイクを有するマイクユニットと、を用いて、前記ユーザに対する頭外定位フィルタを決定する頭外定位フィルタ決定方法をコンピュータに実行させるためのプログラムであって、
前記頭外定位フィルタ決定方法は、
前記マイクユニットで収音された収音信号を周波数変換して、周波数特性を求めるステップと、
前記周波数特性を平滑化するステップと、
平滑化された前記周波数特性のピーク及びノッチを求め、前記ピーク及びノッチに基づいて前記周波数特性の特徴量をユーザ特徴量として抽出するステップと、
前記ユーザ特徴量に基づいて、データ格納部に格納されている複数の第2のプリセットデータのうちの一部の第2のプリセットデータを抽出するステップと、
前記ユーザ特徴量と、抽出された前記第2のプリセットデータとを比較するステップと、
比較結果に基づいて、複数の第1のプリセットデータの中から第1のプリセットデータを選択するステップと、を含むプログラム。 An output unit that is attached to the user and outputs sound toward the user's ear,
A computer is provided with an out-of-head localization filter determination method for determining an out-of-head localization filter for the user by using a microphone unit that is attached to the user's ear and has a microphone that collects the sound output from the output unit. It ’s a program to run
The method for determining the out-of-head localization filter is
The step of frequency-converting the sound pick-up signal picked up by the microphone unit to obtain the frequency characteristics, and
The step of smoothing the frequency characteristics and
A step of obtaining a smoothed peak and notch of the frequency characteristic and extracting the feature amount of the frequency characteristic as a user feature amount based on the peak and notch.
A step of extracting a part of the second preset data from the plurality of second preset data stored in the data storage unit based on the user feature amount, and a step of extracting the second preset data.
A step of comparing the user feature amount with the extracted second preset data,
A program including a step of selecting a first preset data from a plurality of first preset data based on a comparison result.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019174232A JP2021052315A (en) | 2019-09-25 | 2019-09-25 | Out-of-head localization filter determination system, out-of-head localization processing device, out-of-head localization filter determination device, out-of-head localization filter determination method, and program |
PCT/JP2020/034157 WO2021059984A1 (en) | 2019-09-25 | 2020-09-09 | Out-of-head localization filter determination system, out-of-head localization processing device, out-of-head localization filter determination device, out-of-head localization filter determination method, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019174232A JP2021052315A (en) | 2019-09-25 | 2019-09-25 | Out-of-head localization filter determination system, out-of-head localization processing device, out-of-head localization filter determination device, out-of-head localization filter determination method, and program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2021052315A true JP2021052315A (en) | 2021-04-01 |
Family
ID=75156520
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019174232A Pending JP2021052315A (en) | 2019-09-25 | 2019-09-25 | Out-of-head localization filter determination system, out-of-head localization processing device, out-of-head localization filter determination device, out-of-head localization filter determination method, and program |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP2021052315A (en) |
WO (1) | WO2021059984A1 (en) |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6515720B2 (en) * | 2015-07-23 | 2019-05-22 | 株式会社Jvcケンウッド | Out-of-head localization processing device, out-of-head localization processing method, and program |
JP6790654B2 (en) * | 2016-09-23 | 2020-11-25 | 株式会社Jvcケンウッド | Filter generator, filter generator, and program |
JP6791001B2 (en) * | 2017-05-10 | 2020-11-25 | 株式会社Jvcケンウッド | Out-of-head localization filter determination system, out-of-head localization filter determination device, out-of-head localization determination method, and program |
-
2019
- 2019-09-25 JP JP2019174232A patent/JP2021052315A/en active Pending
-
2020
- 2020-09-09 WO PCT/JP2020/034157 patent/WO2021059984A1/en active Application Filing
Also Published As
Publication number | Publication date |
---|---|
WO2021059984A1 (en) | 2021-04-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6791001B2 (en) | Out-of-head localization filter determination system, out-of-head localization filter determination device, out-of-head localization determination method, and program | |
US11115743B2 (en) | Signal processing device, signal processing method, and program | |
JP6981330B2 (en) | Out-of-head localization processing device, out-of-head localization processing method, and program | |
JP6753329B2 (en) | Filter generation device and filter generation method | |
WO2021059984A1 (en) | Out-of-head localization filter determination system, out-of-head localization processing device, out-of-head localization filter determination device, out-of-head localization filter determination method, and program | |
WO2018155164A1 (en) | Filter generation device, filter generation method, and program | |
JP7435334B2 (en) | Extra-head localization filter determination system, extra-head localization filter determination method, and program | |
JP7447719B2 (en) | Extra-head localization filter generation system, processing device, extra-head localization filter generation method, and program | |
JP7404736B2 (en) | Extra-head localization filter determination system, extra-head localization filter determination method, and program | |
WO2021059983A1 (en) | Headphone, out-of-head localization filter determining device, out-of-head localization filter determining system, out-of-head localization filter determining method, and program | |
JP7395906B2 (en) | Headphones, extra-head localization filter determination device, and extra-head localization filter determination method | |
WO2021131337A1 (en) | Processing device, processing method, filter generation method, reproduction method, and program | |
JP7115353B2 (en) | Processing device, processing method, reproduction method, and program | |
JP6805879B2 (en) | Filter generator, filter generator, and program | |
US20210195327A1 (en) | Processing device, processing method, reproduction method, and program | |
JP2022185840A (en) | Out-of-head localization processing device and out-of-head localization processing method | |
JP6904197B2 (en) | Signal processing equipment, signal processing methods, and programs | |
JP2023024038A (en) | Processing device and processing method | |
CN115938376A (en) | Processing apparatus and processing method |