JP6805879B2 - Filter generator, filter generator, and program - Google Patents

Filter generator, filter generator, and program Download PDF

Info

Publication number
JP6805879B2
JP6805879B2 JP2017033204A JP2017033204A JP6805879B2 JP 6805879 B2 JP6805879 B2 JP 6805879B2 JP 2017033204 A JP2017033204 A JP 2017033204A JP 2017033204 A JP2017033204 A JP 2017033204A JP 6805879 B2 JP6805879 B2 JP 6805879B2
Authority
JP
Japan
Prior art keywords
signal
sound
filter
correction
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017033204A
Other languages
Japanese (ja)
Other versions
JP2018139345A (en
Inventor
村田 寿子
寿子 村田
敬洋 下条
敬洋 下条
優美 藤井
優美 藤井
邦明 高地
邦明 高地
正也 小西
正也 小西
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
JVCKenwood Corp
Original Assignee
JVCKenwood Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by JVCKenwood Corp filed Critical JVCKenwood Corp
Priority to JP2017033204A priority Critical patent/JP6805879B2/en
Priority to EP18756889.4A priority patent/EP3588987A4/en
Priority to CN201880011697.9A priority patent/CN110301142B/en
Priority to PCT/JP2018/003975 priority patent/WO2018155164A1/en
Publication of JP2018139345A publication Critical patent/JP2018139345A/en
Priority to US16/549,928 priority patent/US10805727B2/en
Application granted granted Critical
Publication of JP6805879B2 publication Critical patent/JP6805879B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Description

本発明は、フィルタ生成装置、フィルタ生成方法、及びプログラムに関する。 The present invention relates to a filter generator, a filter generator, and a program.

音像定位技術として、ヘッドホンを用いて受聴者の頭部の外側に音像を定位させる頭外定位技術がある。頭外定位技術では、ヘッドホンから耳までの特性をキャンセルし、ステレオスピーカから耳までの4本の特性を与えることにより、音像を頭外に定位させている。 As a sound image localization technique, there is an out-of-head localization technique in which a sound image is localized on the outside of the listener's head using headphones. In the out-of-head localization technology, the sound image is localized out of the head by canceling the characteristics from the headphones to the ears and giving four characteristics from the stereo speakers to the ears.

頭外定位再生においては、2チャンネル(以下、chと記載)のスピーカから発した測定信号(インパルス音等)を聴取者本人の耳に設置したマイクロフォン(以下、マイクとする)で録音する。そして、インパルス応答で得られた収音信号に基づいて、処理装置がフィルタを作成する。作成したフィルタを2chのオーディオ信号に畳み込むことにより、頭外定位再生を実現することができる。 In the out-of-head localization reproduction, the measurement signal (impulse sound, etc.) emitted from the speaker of 2 channels (hereinafter referred to as ch) is recorded by a microphone (hereinafter referred to as a microphone) installed in the listener's ear. Then, the processing device creates a filter based on the sound pick-up signal obtained by the impulse response. By convolving the created filter into a 2ch audio signal, out-of-head localization reproduction can be realized.

特許文献1には、個人化された室内インパルス応答のセットを取得する方法が開示されている。特許文献1では、聴取者の各耳の近くにマイクを設置している。そして、スピーカを駆動した時のインパルス音を、左右のマイクが録音する。 Patent Document 1 discloses a method of obtaining a set of personalized indoor impulse responses. In Patent Document 1, a microphone is installed near each ear of the listener. Then, the left and right microphones record the impulse sound when the speaker is driven.

特表2008−512015号公報Special Table 2008-512015

頭外定位処理して再生される音場の音質については、中域低域が不足している、センター定位の音が薄い、ボーカルが遠くへ奥まっている、など、いわゆる中抜けしている、と言われることがあった。 Regarding the sound quality of the sound field that is reproduced by out-of-head localization processing, the mid-range low range is insufficient, the center localization sound is faint, the vocals are deep, and so on. Was sometimes said.

この中抜けはスピーカの置き方と聴取者との位置関係によって起こる。Lchのスピーカから左耳までの距離と、Rchのスピーカから左耳までの距離の差が、半波長である周波数は逆相で合成されることになる。したがって、距離の差が半波長となる周波数では、音が小さく聴こえる。特にセンター定位の信号はLch、Rchに同相信号が含まれているので両耳の位置でそれぞれ打ち消しあう。また、このような打ち消しは、室内の反射の影響でも起こる。 This hollowing out is caused by the positional relationship between the speaker and the listener. Frequencies in which the difference between the distance from the Lch speaker to the left ear and the distance from the Rch speaker to the left ear are half wavelengths are synthesized in opposite phases. Therefore, at frequencies where the difference in distance is half a wavelength, the sound is heard quietly. In particular, since the center localization signal includes in-phase signals in Lch and Rch, they cancel each other out at the positions of both ears. Such cancellation also occurs due to the influence of indoor reflections.

通常、スピーカ再生を聴取している時、聴取者はじっとしているつもりでも絶えず頭部が動いており、この現象に気づきにくい。しかしながら、頭外定位処理の場合はある固定した位置での空間伝達関数が使用されるため、スピーカとの距離で決まる周波数は逆相で合成された音が提示されてしまう。 Normally, when listening to speaker playback, the listener is constantly moving his head even if he thinks he is still, and this phenomenon is hard to notice. However, in the case of the out-of-head localization process, since the spatial transfer function at a certain fixed position is used, the sound synthesized in the opposite phase is presented at the frequency determined by the distance from the speaker.

本発明は上記の点に鑑みなされたもので、適切なフィルタを生成することができるフィルタ生成装置、フィルタ生成方法、及びプログラムを提供することを目的とする。 The present invention has been made in view of the above points, and an object of the present invention is to provide a filter generation device, a filter generation method, and a program capable of generating an appropriate filter.

本発明にかかるフィルタ生成装置は、音源から出力された測定信号を収音して、収音信号を取得するマイクと、前記収音信号に基づいて、前記音源から前記マイクまでの伝達特性に応じたフィルタを生成する処理部と、を備え、前記処理部は、前記収音信号の境界サンプルよりも前のサンプルから第1のサンプル数の第1の信号を抽出する抽出部と、前記第1の信号に基づいて、前記音源からの直接音を含む第2の信号を前記第1のサンプル数よりも多い第2のサンプル数で生成する信号生成部と、前記第2の信号を周波数領域に変換して、スペクトルを生成する変換部と、所定の周波数以下の帯域における前記スペクトルの値を増加させて、補正スペクトルを生成する補正部と、前記補正スペクトルを時間領域に逆変換して、補正信号を生成する逆変換部と、前記収音信号と前記補正信号とを用いてフィルタを生成する生成部であって、前記境界サンプルよりも前のフィルタ値については、前記補正信号の値により生成し、前記境界サンプル以降かつ第2のサンプル数未満のフィルタ値については前記収音信号に前記補正信号を加算した加算値により生成する生成部と、を備えたものである。 The filter generation device according to the present invention has a microphone that picks up a measurement signal output from a sound source and acquires the sound pick-up signal, and based on the sound pick-up signal, it corresponds to a transmission characteristic from the sound source to the microphone. The processing unit includes a processing unit that generates a filter, and the processing unit includes an extraction unit that extracts a first signal having a first number of samples from a sample before the boundary sample of the sound collection signal, and the first signal. A signal generation unit that generates a second signal including a direct sound from the sound source with a number of second samples larger than the number of the first samples, and the second signal in the frequency region based on the signal of A conversion unit that converts and generates a spectrum, a correction unit that increases the value of the spectrum in a band below a predetermined frequency to generate a correction spectrum, and an inverse conversion of the correction spectrum into a time region for correction. An inverse conversion unit that generates a signal, and a generation unit that generates a filter using the sound collection signal and the correction signal, and a filter value before the boundary sample is generated by the value of the correction signal. The filter value after the boundary sample and less than the second number of samples is provided with a generation unit that is generated by an added value obtained by adding the correction signal to the sound pick-up signal.

本発明にかかるフィルタ生成方法は、音源から出力された測定信号をマイクで収音することで伝達特性に応じたフィルタを生成するフィルタ生成方法であって、前記マイクで収音信号を取得するステップと、前記収音信号の境界サンプルよりも前のサンプルから第1のサンプル数の第1の信号を抽出するステップと、前記第1の信号に基づいて、前記音源からの直接音を含む第2の信号を前記第1のサンプル数よりも多い第2のサンプル数で生成するステップと、前記第2の信号を周波数領域に変換して、スペクトルを生成するステップと、所定の周波数以下の帯域における前記スペクトルの値を増加させて、補正スペクトルを生成するステップと、前記補正スペクトルを時間領域に逆変換して、補正信号を生成するステップと、前記収音信号と前記補正信号とを用いてフィルタを生成するステップであって、前記境界サンプルよりも前のフィルタ値については、前記補正信号の値により生成し、前記境界サンプル以降かつ第2のサンプル数未満のフィルタ値については、前記収音信号に前記補正信号を加算した加算値により生成するステップと、を備えたものである。 The filter generation method according to the present invention is a filter generation method that generates a filter according to the transmission characteristics by collecting the measurement signal output from the sound source with a microphone, and is a step of acquiring the sound collection signal with the microphone. And the step of extracting the first signal of the first sample number from the sample before the boundary sample of the sound collection signal, and the second including the direct sound from the sound source based on the first signal. In a band of a predetermined frequency or less, a step of generating the signal of the above with a second number of samples larger than the number of the first samples, a step of converting the second signal into a frequency region to generate a spectrum, and a step of generating a spectrum. A step of increasing the value of the spectrum to generate a correction spectrum, a step of inversely converting the correction spectrum into a time region to generate a correction signal, and a filter using the sound collection signal and the correction signal. The filter value before the boundary sample is generated by the value of the correction signal, and the filter value after the boundary sample and less than the second sample number is the sound collection signal. It is provided with a step of generating by an added value obtained by adding the correction signal to the above.

本発明にかかるプログラムは、音源から出力された測定信号をマイクで収音することで伝達特性に応じたフィルタを生成するフィルタ生成方法をコンピュータに実行させるプログラムであって、前記フィルタ生成方法は、前記マイクで収音信号を取得するステップと、前記収音信号の境界サンプルよりも前のサンプルから第1のサンプル数の第1の信号を抽出するステップと、前記第1の信号に基づいて、前記音源からの直接音を含む第2の信号を前記第1のサンプル数よりも多い第2のサンプル数で生成するステップと、前記第2の信号を周波数領域に変換して、スペクトルを生成するステップと、所定の周波数以下の帯域における前記スペクトルの値を増加させて、補正スペクトルを生成するステップと、前記補正スペクトルを時間領域に逆変換して、補正信号を生成するステップと、前記収音信号と前記補正信号とを用いてフィルタを生成するステップであって、前記境界サンプルよりも前のフィルタ値については、前記補正信号の値により生成し、前記境界サンプル以降かつ第2のサンプル数未満のフィルタ値については、前記収音信号に前記補正信号を加算した加算値により生成するステップと、を備えたものである。 The program according to the present invention is a program for causing a computer to execute a filter generation method for generating a filter according to transmission characteristics by collecting a measurement signal output from a sound source with a microphone. Based on the step of acquiring the sound pick-up signal with the microphone, the step of extracting the first signal of the first sample number from the samples before the boundary sample of the sound pick-up signal, and the first signal. A step of generating a second signal including a direct sound from the sound source with a number of second samples larger than the number of the first samples, and a step of converting the second signal into a frequency region to generate a spectrum. A step, a step of increasing the value of the spectrum in a band below a predetermined frequency to generate a correction spectrum, a step of inversely converting the correction spectrum into a time region to generate a correction signal, and the sound collection. In the step of generating a filter using the signal and the correction signal, the filter value before the boundary sample is generated by the value of the correction signal, and is after the boundary sample and less than the second sample number. The filter value of is provided with a step of generating by an added value obtained by adding the correction signal to the sound collecting signal.

本発明によれば、適切なフィルタを生成することができるフィルタ生成装置、フィルタ生成方法、及びプログラムを提供することができる。 According to the present invention, it is possible to provide a filter generation device, a filter generation method, and a program capable of generating an appropriate filter.

本実施の形態に係る頭外定位処理装置を示すブロック図である。It is a block diagram which shows the out-of-head localization processing apparatus which concerns on this embodiment. フィルタを生成するフィルタ生成装置の構成を示す図である。It is a figure which shows the structure of the filter generator which generates a filter. フィルタ生成装置の構成を示す制御ブロック図である。It is a control block diagram which shows the structure of the filter generation apparatus. フィルタ生成方法を示すフローチャートである。It is a flowchart which shows the filter generation method. マイクで取得した収音信号を示す波形図である。It is a waveform diagram which shows the sound collection signal acquired by a microphone. 境界サンプルdを示すための、収音信号の拡大図である。It is an enlarged view of the sound pickup signal for showing the boundary sample d. 収音信号から抽出されたサンプルに基づいて生成された直接音信号を示す波形図である。It is a waveform diagram which shows the direct sound signal generated based on the sample extracted from a sound collection signal. 直接音信号の振幅スペクトルと補正後の振幅スペクトルとを示す図である。It is a figure which shows the amplitude spectrum of a direct sound signal and the amplitude spectrum after correction. 直接音信号と補正信号とを拡大して示す波形図である。It is a waveform diagram which shows the direct sound signal and the correction signal in an enlarged manner. 本実施の形態の処理により得られたフィルタを示す波形図である。It is a waveform figure which shows the filter obtained by the processing of this embodiment. 補正されたフィルタと補正されていないフィルタの周波数特性を示す図である。It is a figure which shows the frequency characteristic of the corrected filter and the uncorrected filter.

本実施の形態では、フィルタ生成装置がスピーカからマイクまでの伝達特性を測定している。そして、測定された伝達特性に基づいて、フィルタ生成装置がフィルタを生成している。 In this embodiment, the filter generator measures the transmission characteristics from the speaker to the microphone. Then, the filter generator generates a filter based on the measured transmission characteristics.

本実施の形態にかかるフィルタ生成装置で生成したフィルタを用いた音像定位処理の概要について説明する。ここでは、音像定位処理装置の一例である頭外定位処理について説明する。本実施形態にかかる頭外定位処理は、個人の空間音響伝達特性(空間音響伝達関数ともいう)と外耳道伝達特性(外耳道伝達関数ともいう)を用いて頭外定位処理を行うものである。外耳道伝達特性は、外耳道入口から鼓膜までの伝達特性である。本実施形態では、スピーカから聴取者の耳までの空間音響伝達特性、及びヘッドホンを装着した状態での外耳道伝達特性の逆特性を用いて頭外定位処理を実現している。 An outline of the sound image localization process using the filter generated by the filter generator according to the present embodiment will be described. Here, the out-of-head localization processing, which is an example of the sound image localization processing apparatus, will be described. The extra-head localization process according to the present embodiment is to perform the extra-head localization process using an individual's spatial acoustic transmission characteristic (also referred to as spatial acoustic transfer function) and external auditory canal transmission characteristic (also referred to as external auditory canal transfer function). The ear canal transmission characteristic is the transmission characteristic from the entrance of the ear canal to the eardrum. In the present embodiment, the extra-head localization process is realized by using the spatial acoustic transmission characteristic from the speaker to the listener's ear and the inverse characteristic of the external auditory canal transmission characteristic when the headphones are worn.

本実施の形態にかかる頭外定位処理装置は、パーソナルコンピュータ、スマートホン、タブレットPCなどの情報処理装置であり、プロセッサ等の処理手段、メモリやハードディスクなどの記憶手段、液晶モニタ等の表示手段、タッチパネル、ボタン、キーボード、マウスなどの入力手段、ヘッドホン又はイヤホンを有する出力手段を備えている。 The out-of-head localization processing device according to the present embodiment is an information processing device such as a personal computer, a smartphone, or a tablet PC, and is a processing means such as a processor, a storage means such as a memory or a hard disk, a display means such as a liquid crystal monitor, and the like. It is provided with input means such as a touch panel, buttons, keyboard and mouse, and output means having headphones or earphones.

実施の形態1.
本実施の形態にかかる音場再生装置の一例である頭外定位処理装置100を図1に示す。図1は、頭外定位処理装置のブロック図である。頭外定位処理装置100は、ヘッドホン43を装着するユーザUに対して音場を再生する。そのため、頭外定位処理装置100は、LchとRchのステレオ入力信号XL、XRについて、音像定位処理を行う。LchとRchのステレオ入力信号XL、XRは、CD(Compact Disc)プレイヤーなどから出力されるアナログのオーディオ再生信号、又は、mp3(MPEG Audio Layer-3)等のデジタルオーディオデータである。なお、頭外定位処理装置100は、物理的に単一な装置に限られるものではなく、一部の処理が異なる装置で行われてもよい。例えば、一部の処理がパソコンなどにより行われ、残りの処理がヘッドホン43に内蔵されたDSP(Digital Signal Processor)などにより行われてもよい。
Embodiment 1.
FIG. 1 shows an out-of-head localization processing device 100 which is an example of the sound field reproducing device according to the present embodiment. FIG. 1 is a block diagram of an out-of-head localization processing device. The out-of-head localization processing device 100 reproduces the sound field for the user U who wears the headphones 43. Therefore, the out-of-head localization processing device 100 performs sound image localization processing on the stereo input signals XL and XR of Lch and Rch. The stereo input signals XL and XR of Lch and Rch are analog audio reproduction signals output from a CD (Compact Disc) player or the like, or digital audio data such as mp3 (MPEG Audio Layer-3). The out-of-head localization processing device 100 is not limited to a physically single device, and some of the processing may be performed by different devices. For example, a part of the processing may be performed by a personal computer or the like, and the remaining processing may be performed by a DSP (Digital Signal Processor) built in the headphones 43 or the like.

頭外定位処理装置100は、頭外定位処理部10と、フィルタ部41、フィルタ部42、及びヘッドホン43を備えている。 The out-of-head localization processing device 100 includes an out-of-head localization processing unit 10, a filter unit 41, a filter unit 42, and headphones 43.

頭外定位処理部10は、畳み込み演算部11〜12、21〜22、及び加算器24、25を備えている。畳み込み演算部11〜12、21〜22は、空間音響伝達特性を用いた畳み込み処理を行う。頭外定位処理部10には、CDプレイヤーなどからのステレオ入力信号XL、XRが入力される。頭外定位処理部10には、空間音響伝達特性が設定されている。頭外定位処理部10は、各chのステレオ入力信号XL、XRに対し、空間音響伝達特性を畳み込む。空間音響伝達特性はユーザU本人の頭部や耳介で測定した頭部伝達関数HRTFでもよいし、ダミーヘッドまたは第三者の頭部伝達関数であってもよい。これらの伝達特性は、その場で測定してもよいし、予め用意してもよい。 The out-of-head localization processing unit 10 includes convolution calculation units 11 to 12, 21 to 22, and adders 24 and 25. The convolution calculation units 11 to 12 and 21 to 22 perform a convolution process using the spatial acoustic transmission characteristic. Stereo input signals XL and XR from a CD player or the like are input to the out-of-head localization processing unit 10. Spatial acoustic transmission characteristics are set in the out-of-head localization processing unit 10. The out-of-head localization processing unit 10 convolves the spatial acoustic transmission characteristics with respect to the stereo input signals XL and XR of each channel. The spatial acoustic transmission characteristic may be a head-related transfer function HRTF measured by the user U's own head or auricle, or may be a dummy head or a third-party head-related transfer function. These transmission characteristics may be measured on the spot or may be prepared in advance.

空間音響伝達特性は、4つの伝達特性Hls、Hlo、Hro、Hrsに応じたフィルタを有している。4つの伝達特性に応じたフィルタは、後述するフィルタ生成装置を用いて求めることができる。 The spatial acoustic transmission characteristic has four filters corresponding to the transmission characteristics Hls, Hlo, Hro, and Hrs. A filter corresponding to the four transfer characteristics can be obtained by using a filter generator described later.

そして、畳み込み演算部11は、Lchのステレオ入力信号XLに対して伝達特性Hlsに応じたフィルタを畳み込む。畳み込み演算部11は、畳み込み演算データを加算器24に出力する。畳み込み演算部21は、Rchのステレオ入力信号XRに対して伝達特性Hroに応じたフィルタを畳み込む。畳み込み演算部21は、畳み込み演算データを加算器24に出力する。加算器24は2つの畳み込み演算データを加算して、フィルタ部41に出力する。 Then, the convolution calculation unit 11 convolves the filter corresponding to the transmission characteristic Hls with respect to the stereo input signal XL of the Lch. The convolution calculation unit 11 outputs the convolution calculation data to the adder 24. The convolution calculation unit 21 convolves a filter corresponding to the transmission characteristic H with respect to the stereo input signal XR of Rch. The convolution calculation unit 21 outputs the convolution calculation data to the adder 24. The adder 24 adds two convolution calculation data and outputs the data to the filter unit 41.

畳み込み演算部12は、Lchのステレオ入力信号XLに対して伝達特性Hloに応じたフィルタを畳み込む。畳み込み演算部12は、畳み込み演算データを、加算器25に出力する。畳み込み演算部22は、Rchのステレオ入力信号XRに対して伝達特性Hrsに応じたフィルタを畳み込む。畳み込み演算部22は、畳み込み演算データを、加算器25に出力する。加算器25は2つの畳み込み演算データを加算して、フィルタ部42に出力する。 The convolution calculation unit 12 convolves a filter corresponding to the transmission characteristic Hlo with respect to the stereo input signal XL of the Lch. The convolution calculation unit 12 outputs the convolution calculation data to the adder 25. The convolution calculation unit 22 convolves a filter corresponding to the transmission characteristic Hrs with respect to the stereo input signal XR of Rch. The convolution calculation unit 22 outputs the convolution calculation data to the adder 25. The adder 25 adds two convolution calculation data and outputs the data to the filter unit 42.

フィルタ部41、42にはヘッドホン特性(ヘッドホンの再生ユニットとマイク間の特性)をキャンセルする逆フィルタが設定されている。そして、頭外定位処理部10での処理が施された再生信号に逆フィルタを畳み込む。フィルタ部41で加算器24からのLch信号に対して、逆フィルタを畳み込む。同様に、フィルタ部42は加算器25からのRch信号に対して逆フィルタを畳み込む。逆フィルタは、ヘッドホン43を装着した場合に、ヘッドホンユニットからマイクまでの特性をキャンセルする。マイクは、外耳道入口から鼓膜までの間ならばどこに配置してもよい。逆フィルタは、ユーザU本人の特性をその場で測定した結果から算出してもよいし、ダミーヘッド等の任意の外耳を用いて測定したヘッドホン特性から算出した逆フィルタを予め用意してもよい。 Inverse filters that cancel the headphone characteristics (characteristics between the headphone playback unit and the microphone) are set in the filter units 41 and 42. Then, the inverse filter is convolved in the reproduced signal processed by the out-of-head localization processing unit 10. The filter unit 41 convolves the inverse filter with respect to the Lch signal from the adder 24. Similarly, the filter unit 42 convolves the inverse filter with respect to the Rch signal from the adder 25. The reverse filter cancels the characteristics from the headphone unit to the microphone when the headphone 43 is attached. The microphone may be placed anywhere between the ear canal entrance and the eardrum. The inverse filter may be calculated from the result of measuring the characteristics of the user U himself / herself on the spot, or may prepare in advance an inverse filter calculated from the characteristics of headphones measured using an arbitrary outer ear such as a dummy head. ..

フィルタ部41は、補正されたLch信号をヘッドホン43の左ユニット43Lに出力する。フィルタ部42は、補正されたRch信号をヘッドホン43の右ユニット43Rに出力する。ユーザUは、ヘッドホン43を装着している。ヘッドホン43は、Lch信号とRch信号をユーザUに向けて出力する。これにより、ユーザUの頭外に定位された音像を再生することができる。 The filter unit 41 outputs the corrected Lch signal to the left unit 43L of the headphones 43. The filter unit 42 outputs the corrected Rch signal to the right unit 43R of the headphones 43. User U is wearing headphones 43. The headphone 43 outputs the Lch signal and the Rch signal toward the user U. As a result, the sound image localized outside the head of the user U can be reproduced.

(フィルタ生成装置)
図2を用いて、空間音響伝達特性(以下、伝達特性とする)を測定して、フィルタを生成するフィルタ生成装置について説明する。図2は、フィルタ生成装置200の測定構成を模式的に示す図である。なお、フィルタ生成装置200は、図1に示す頭外定位処理装置100と共通の装置であってもよい。あるいは、フィルタ生成装置200の一部又は全部が頭外定位処理装置100と異なる装置となっていてもよい。
(Filter generator)
A filter generation device that measures spatial acoustic transmission characteristics (hereinafter referred to as transmission characteristics) and generates a filter will be described with reference to FIG. FIG. 2 is a diagram schematically showing a measurement configuration of the filter generation device 200. The filter generation device 200 may be a device common to the out-of-head localization processing device 100 shown in FIG. Alternatively, a part or all of the filter generation device 200 may be a device different from the out-of-head localization processing device 100.

図2に示すように、フィルタ生成装置200は、ステレオスピーカ5とステレオマイク2を有している。ステレオスピーカ5が測定環境に設置されている。測定環境は、ユーザUの自宅の部屋やオーディオシステムの販売店舗やショールーム等でもよい。測定環境では、床面や壁面によって音の反射が生じる。 As shown in FIG. 2, the filter generation device 200 has a stereo speaker 5 and a stereo microphone 2. The stereo speaker 5 is installed in the measurement environment. The measurement environment may be the user U's home room, an audio system sales store, a showroom, or the like. In the measurement environment, sound is reflected by the floor and walls.

本実施の形態では、フィルタ生成装置200の処理装置(図2では不図示)が、伝達特性に応じたフィルタを適切に生成するための演算処理を行っている。処理装置は、例えば、CDプレイヤー等の音楽プレイヤーなどを有している。処理装置は、パーソナルコンピュータ(PC)、タブレット端末、スマートホン等であってもよい。 In the present embodiment, the processing device of the filter generation device 200 (not shown in FIG. 2) performs arithmetic processing for appropriately generating a filter according to the transmission characteristics. The processing device includes, for example, a music player such as a CD player. The processing device may be a personal computer (PC), a tablet terminal, a smart phone, or the like.

ステレオスピーカ5は、左スピーカ5Lと右スピーカ5Rを備えている。例えば、受聴者1の前方に左スピーカ5Lと右スピーカ5Rが設置されている。左スピーカ5Lと右スピーカ5Rは、インパルス応答測定を行うためのインパルス音等を出力する。以下、本実施の形態では、音源となるスピーカの数を2(ステレオスピーカ)として説明するが、測定に用いる音源の数は2に限らず、1以上であればよい。すなわち、1chのモノラル、または、5.1ch、7.1ch等の、いわゆるマルチチャンネル環境においても同様に、本実施の形態を適用することができる。 The stereo speaker 5 includes a left speaker 5L and a right speaker 5R. For example, a left speaker 5L and a right speaker 5R are installed in front of the listener 1. The left speaker 5L and the right speaker 5R output an impulse sound or the like for measuring an impulse response. Hereinafter, in the present embodiment, the number of speakers serving as sound sources will be described as 2 (stereo speakers), but the number of sound sources used for measurement is not limited to 2, and may be 1 or more. That is, the present embodiment can be similarly applied to a so-called multi-channel environment such as 1ch monaural or 5.1ch, 7.1ch, etc.

ステレオマイク2は、左のマイク2Lと右のマイク2Rを有している。左のマイク2Lは、受聴者1の左耳9Lに設置され、右のマイク2Rは、受聴者1の右耳9Rに設置されている。具体的には、左耳9L、右耳9Rの外耳道入口から鼓膜までの位置にマイク2L、2Rを設置することが好ましい。マイク2L、2Rは、ステレオスピーカ5から出力された測定信号を収音して、収音信号を取得する。マイク2L、2Rは収音信号を後述するフィルタ生成装置200に出力する。受聴者1は、人でもよく、ダミーヘッドでもよい。すなわち、本実施形態において、受聴者1は人だけでなく、ダミーヘッドを含む概念である。 The stereo microphone 2 has a left microphone 2L and a right microphone 2R. The left microphone 2L is installed in the left ear 9L of the listener 1, and the right microphone 2R is installed in the right ear 9R of the listener 1. Specifically, it is preferable to install microphones 2L and 2R at positions of the left ear 9L and the right ear 9R from the entrance of the ear canal to the eardrum. The microphones 2L and 2R pick up the measurement signal output from the stereo speaker 5 and acquire the sound pick-up signal. The microphones 2L and 2R output the sound pick-up signal to the filter generation device 200 described later. The listener 1 may be a person or a dummy head. That is, in the present embodiment, the listener 1 is a concept including not only a person but also a dummy head.

上記のように、左右のスピーカ5L、5Rで出力されたインパルス音をマイク2L、2Rで測定することでインパルス応答が測定される。フィルタ生成装置200は、インパルス応答測定に基づいて取得した収音信号をメモリなどに記憶する。これにより、左スピーカ5Lと左マイク2Lとの間の伝達特性Hls、左スピーカ5Lと右マイク2Rとの間の伝達特性Hlo、右スピーカ5Rと左マイク2Lとの間の伝達特性Hro、右スピーカ5Rと右マイク2Rとの間の伝達特性Hrsが測定される。すなわち、左スピーカ5Lから出力された測定信号を左マイク2Lが収音することで、伝達特性Hlsが取得される。左スピーカ5Lから出力された測定信号を右マイク2Rが収音することで、伝達特性Hloが取得される。右スピーカ5Rから出力された測定信号を左マイク2Lが収音することで、伝達特性Hroが取得される。右スピーカ5Rから出力された測定信号を右マイク2Rが収音することで、伝達特性Hrsが取得される。 As described above, the impulse response is measured by measuring the impulse sound output by the left and right speakers 5L and 5R with the microphones 2L and 2R. The filter generation device 200 stores the sound collection signal acquired based on the impulse response measurement in a memory or the like. As a result, the transmission characteristic Hls between the left speaker 5L and the left microphone 2L, the transmission characteristic Hlo between the left speaker 5L and the right microphone 2R, the transmission characteristic Hro between the right speaker 5R and the left microphone 2L, and the right speaker The transmission characteristic Hrs between the 5R and the right microphone 2R is measured. That is, the transmission characteristic Hls is acquired by the left microphone 2L collecting the measurement signal output from the left speaker 5L. The transmission characteristic Hlo is acquired by the right microphone 2R collecting the measurement signal output from the left speaker 5L. The transmission characteristic Hro is acquired by the left microphone 2L collecting the measurement signal output from the right speaker 5R. The transmission characteristic Hrs is acquired by the right microphone 2R collecting the measurement signal output from the right speaker 5R.

そして、フィルタ生成装置200は、収音信号に基づいて、左右のスピーカ5L、5Rから左右のマイク2L、2Rまでの伝達特性Hls、Hlo、Hro、Hrsに応じたフィルタを生成する。具体的には、フィルタ生成装置200は、伝達特性Hls、Hlo、Hro、Hrsを補正する。そして、フィルタ生成装置200は、補正された伝達特性Hls、Hlo、Hro、Hrsを所定のフィルタ長で切り出して、所定の演算処理を行う。このようにすることで、フィルタ生成装置200は、頭外定位処理装置100の畳み込み演算に用いられるフィルタとして生成する。図1で示したように、頭外定位処理装置100が、左右のスピーカ5L、5Rと左右のマイク2L、2Rとの間の伝達特性Hls、Hlo、Hro、Hrsに応じたフィルタを用いて頭外定位処理を行う。すなわち、伝達特性に応じたフィルタをオーディオ再生信号に畳み込むことにより、頭外定位処理を行う。 Then, the filter generation device 200 generates a filter according to the transmission characteristics Hls, Hlo, Hro, and Hrs from the left and right speakers 5L and 5R to the left and right microphones 2L and 2R based on the sound pick-up signal. Specifically, the filter generation device 200 corrects the transmission characteristics Hls, Hlo, Hro, and Hrs. Then, the filter generation device 200 cuts out the corrected transmission characteristics Hls, Hlo, Hro, and Hrs with a predetermined filter length, and performs a predetermined arithmetic process. By doing so, the filter generation device 200 generates the filter as a filter used for the convolution calculation of the out-of-head localization processing device 100. As shown in FIG. 1, the out-of-head localization processing device 100 uses a filter corresponding to the transmission characteristics Hls, Hlo, Hro, and Hrs between the left and right speakers 5L and 5R and the left and right microphones 2L and 2R. Perform external localization processing. That is, the out-of-head localization process is performed by convolving the filter according to the transmission characteristic into the audio reproduction signal.

さらに、測定環境において、スピーカ5L、5Rから測定信号を出力した場合、収音信号は直接音と反射音とを含む。直接音は、スピーカ5L、5Rから、マイク2L、2R(耳9L、9R)に直接到達する音である。すなわち、直接音は、スピーカ5L、5Rから、床面、又は壁面等で反射されずに、マイク2L、2Rに到達する音である。反射音は、スピーカ5L、5Rから出力された後、床面又は壁面等で反射されて、マイク2L、2Rに到達する音である。直接音は、反射音よりも早く耳に到達する。したがって、伝達特性Hls、Hlo、Hro、Hrsのそれぞれに対応する収音信号は直接音と反射音を含んでいる。そして、反射音が直接音の後に現れる。 Further, in the measurement environment, when the measurement signal is output from the speakers 5L and 5R, the sound pick-up signal includes a direct sound and a reflected sound. The direct sound is a sound that directly reaches the microphones 2L and 2R (ears 9L, 9R) from the speakers 5L and 5R. That is, the direct sound is the sound that reaches the microphones 2L and 2R from the speakers 5L and 5R without being reflected by the floor surface or the wall surface or the like. The reflected sound is a sound that is output from the speakers 5L and 5R, is reflected on the floor surface or the wall surface, and reaches the microphones 2L and 2R. Direct sound reaches the ear faster than reflected sound. Therefore, the sound pick-up signals corresponding to the transmission characteristics Hls, Hlo, Hro, and Hrs each include direct sound and reflected sound. Then, the reflected sound appears after the direct sound.

次に、フィルタ生成装置200の処理装置と、その処理について詳細に説明する。図3は、フィルタ生成装置200の処理装置210を示す制御ブロック図である。図4は、処理装置210での処理を示すフローチャートである。なお、フィルタ生成装置200は、伝達特性Hls、Hlo、Hro、Hrsのそれぞれに対応する収音信号に対して同様の処理を実施している。すなわち、図4に示される処理が、伝達特性Hls、Hlo、Hro、Hrsに対応する4つの収音信号に対して、それぞれ実施されている。これにより、伝達特性Hls、Hlo、Hro、Hrsに対応するフィルタを生成することができる。 Next, the processing apparatus of the filter generation apparatus 200 and the processing thereof will be described in detail. FIG. 3 is a control block diagram showing a processing device 210 of the filter generation device 200. FIG. 4 is a flowchart showing processing in the processing device 210. The filter generation device 200 performs the same processing on the sound pick-up signals corresponding to the transmission characteristics Hls, Hlo, Hro, and Hrs, respectively. That is, the processing shown in FIG. 4 is performed on each of the four sound pick-up signals corresponding to the transmission characteristics Hls, Hlo, Hro, and Hrs. This makes it possible to generate a filter corresponding to the transfer characteristics Hls, Hlo, Hro, and Hrs.

処理装置210は、測定信号生成部211、収音信号取得部212、境界設定部213、抽出部214、直接音信号生成部215、変換部216、補正部217、逆変換部218、及び生成部219を備えている。 The processing device 210 includes a measurement signal generation unit 211, a sound collection signal acquisition unit 212, a boundary setting unit 213, an extraction unit 214, a direct sound signal generation unit 215, a conversion unit 216, a correction unit 217, an inverse conversion unit 218, and a generation unit. It is equipped with 219.

測定信号生成部211は、D/A変換器やアンプなどを備えており、測定信号を生成する。測定信号生成部211は、生成した測定信号をステレオスピーカ5にそれぞれ出力する。左スピーカ5Lと右スピーカ5Rがそれぞれ伝達特性を測定するための測定信号を出力する。左スピーカ5Lによるインパルス応答測定と、右スピーカ5Rによるインパルス応答測定がそれぞれ行われる。なお、測定信号は、インパルス信号やTSP(Time Streched Pule)信号等であってもよい。測定信号はインパルス音等の測定音を含んでいる。 The measurement signal generation unit 211 includes a D / A converter, an amplifier, and the like, and generates a measurement signal. The measurement signal generation unit 211 outputs the generated measurement signals to the stereo speakers 5, respectively. The left speaker 5L and the right speaker 5R each output a measurement signal for measuring the transmission characteristics. Impulse response measurement by the left speaker 5L and impulse response measurement by the right speaker 5R are performed respectively. The measurement signal may be an impulse signal, a TSP (Time Streched Pure) signal, or the like. The measurement signal includes a measurement sound such as an impulse sound.

ステレオマイク2の左マイク2L、右マイク2Rがそれぞれ測定信号を収音し、収音信号を処理装置210に出力する。収音信号取得部212は、左マイク2L、右マイク2Rからの収音信号を取得する(S11)。なお、収音信号取得部212は、A/D変換器、及びアンプなどを有しており、左マイク2L、右マイク2Rからの収音信号をA/D変換、増幅などしてもよい。また、収音信号取得部212は、複数回の測定により得られた信号を同期加算してもよい。 The left microphone 2L and the right microphone 2R of the stereo microphone 2 each collect the measurement signal and output the sound collection signal to the processing device 210. The sound collection signal acquisition unit 212 acquires the sound collection signals from the left microphone 2L and the right microphone 2R (S11). The sound collection signal acquisition unit 212 includes an A / D converter, an amplifier, and the like, and the sound collection signals from the left microphone 2L and the right microphone 2R may be A / D converted and amplified. Further, the sound pick-up signal acquisition unit 212 may synchronously add the signals obtained by a plurality of measurements.

図5に収音信号の波形を示す。図5の横軸はサンプル番号に対応し、縦軸がマイクの振幅(例えば、出力電圧)となっている。サンプル番号は、時間に対応する整数であり、サンプル番号0のサンプルが最も早いタイミングでサンプリングされたデータ(サンプル)となっている。図5の収音信号は、サンプリング周波数FS=48kHzで取得されている。図5の収音信号のサンプル数は4096サンプルとなっている。収音信号はインパルス音の直接音、及び反射音を含んでいる。 FIG. 5 shows the waveform of the sound pick-up signal. The horizontal axis of FIG. 5 corresponds to the sample number, and the vertical axis is the amplitude of the microphone (for example, the output voltage). The sample number is an integer corresponding to time, and the sample of sample number 0 is the data (sample) sampled at the earliest timing. The sound pick-up signal of FIG. 5 is acquired at a sampling frequency of FS = 48 kHz. The number of samples of the sound pick-up signal in FIG. 5 is 4096 samples. The pick-up signal includes the direct sound of the impulse sound and the reflected sound.

境界設定部213は、収音信号の境界サンプルdを設定する(S12)。境界サンプルdは、スピーカ5L、5Rからの直接音と反射音との境界となるサンプルである。なお、境界サンプルdは直接音と反射音の境界に対応するサンプルの番号となり、dは0〜4096の整数を取る。上記の通り、直接音は、スピーカ5L、5Rから直接受聴者1の耳に到達する音であり、反射音はスピーカ5L、5Rから床面、又は壁面などで反射して受聴者1の耳2L、2Rに到達する音である。すなわち、境界サンプルdは、直接音と反射音との境界のサンプルに対応する。 The boundary setting unit 213 sets the boundary sample d of the sound pick-up signal (S12). The boundary sample d is a sample that serves as a boundary between the direct sound and the reflected sound from the speakers 5L and 5R. The boundary sample d is the sample number corresponding to the boundary between the direct sound and the reflected sound, and d is an integer of 0 to 4096. As described above, the direct sound is the sound that reaches the ear of the listener 1 directly from the speakers 5L and 5R, and the reflected sound is reflected from the speakers 5L and 5R on the floor or the wall surface and the ear 2L of the listener 1. It is a sound that reaches 2R. That is, the boundary sample d corresponds to the sample of the boundary between the direct sound and the reflected sound.

図6に、取得された収音信号と、境界サンプルdを示す。図6は、図5の一部(四角枠A)を拡大した波形図である。例えば、図6において、境界サンプルd=140となっている。 FIG. 6 shows the acquired sound pick-up signal and the boundary sample d. FIG. 6 is an enlarged waveform diagram of a part (square frame A) of FIG. For example, in FIG. 6, the boundary sample d = 140.

境界サンプルdの設定は、受聴者1が行うことができる。例えば、パソコンのディスプレイに収音信号の波形を表示し、受聴者1が境界サンプルdの位置をディスプレイ上で指定する。なお、境界サンプルdの設定は受聴者1以外の人が行ってもよい。あるいは、処理装置210が自動で境界サンプルdを設定してもよい。境界サンプルdを自動で設定する場合、収音信号の波形から、境界サンプルdを算出することができる。具体的には、境界設定部213が、ヒルベルト変換によって収音信号の包絡線を求める。そして、境界設定部213は、包絡線において、直接音の次に大きい音の直前(ゼロクロス付近)を境界サンプルとして、設定する。境界サンプルdより前の収音信号は、音源からのマイク2に直接到達する直接音を含んでいる。境界サンプルd以降の前記収音信号は、音源から放出された後、反射してマイク2に到達する反射音を含んでいる。 The boundary sample d can be set by the listener 1. For example, the waveform of the sound pick-up signal is displayed on the display of the personal computer, and the listener 1 specifies the position of the boundary sample d on the display. The boundary sample d may be set by a person other than the listener 1. Alternatively, the processing device 210 may automatically set the boundary sample d. When the boundary sample d is automatically set, the boundary sample d can be calculated from the waveform of the sound collection signal. Specifically, the boundary setting unit 213 obtains the envelope of the sound collection signal by the Hilbert transform. Then, the boundary setting unit 213 sets the envelope sample immediately before the next loudest sound (near the zero cross) as the boundary sample. The pick-up signal before the boundary sample d includes the direct sound that directly reaches the microphone 2 from the sound source. The sound pick-up signal after the boundary sample d includes a reflected sound that is emitted from the sound source and then reflected and reaches the microphone 2.

抽出部214は、収音信号から0〜(d−1)のサンプルを抽出する(S13)。具体的には、抽出部214は収音信号の境界サンプルよりも前のサンプルを抽出する。例えば、収音信号の0〜(d−1)サンプルまでのd個のサンプルを抽出する。ここでは、境界サンプルのサンプル番号d=140となっているため、抽出部214は、0〜139までの140個のサンプルを抽出する。抽出部214は、サンプル番号0以外のサンプルからサンプルを抽出してもよい。すなわち、抽出する先頭サンプルのサンプル番号sは0に限らず、0より大きい整数としてもよい。抽出部214は、サンプル番号s〜dまでのサンプルを抽出してもよい。なお、サンプル番号sは、0以上、かつ、d未満の整数である。以下、抽出部214で抽出されたサンプル数を第1のサンプル数とする。また、抽出部214で抽出された第1のサンプル数の信号を第1の信号とする。 The extraction unit 214 extracts samples 0 to (d-1) from the sound pick-up signal (S13). Specifically, the extraction unit 214 extracts a sample before the boundary sample of the sound pick-up signal. For example, d samples from 0 to (d-1) samples of the sound pick-up signal are extracted. Here, since the sample number d = 140 of the boundary sample, the extraction unit 214 extracts 140 samples from 0 to 139. The extraction unit 214 may extract a sample from a sample other than the sample number 0. That is, the sample number s of the first sample to be extracted is not limited to 0, and may be an integer larger than 0. The extraction unit 214 may extract samples from sample numbers s to d. The sample number s is an integer of 0 or more and less than d. Hereinafter, the number of samples extracted by the extraction unit 214 will be referred to as the first number of samples. Further, the signal of the first number of samples extracted by the extraction unit 214 is used as the first signal.

抽出部214で抽出された第1の信号に基づいて、直接音信号生成部215は直接音信号を生成する(S14)。直接音信号は、直接音を含んでおり、d個よりも多いサンプル数を有している。直接音信号のサンプル数を第2のサンプル数とし、具体的には、第2のサンプル数は、2048となっている。すなわち、第2のサンプル数は収音信号のサンプル数の半分となっている。ここで、0〜dまでのサンプルについては抽出したサンプルをそのまま用いる。そして、境界サンプルd以降のサンプルについては、固定値となっている。例えば、d〜2047のサンプルについては、全て0とする。したがって、第2のサンプル数は、第1のサンプル数よりも多くなっている。図7に直接音信号の波形を示す。図7では、境界サンプルd以降のサンプルの値は0で一定となっている。なお、直接音信号を第2の信号とも称する。 The direct sound signal generation unit 215 generates a direct sound signal based on the first signal extracted by the extraction unit 214 (S14). The direct sound signal includes the direct sound and has a sample number larger than d. The number of samples of the direct sound signal is the number of the second sample, and specifically, the number of the second sample is 2048. That is, the number of second samples is half the number of samples of the sound pick-up signal. Here, for the samples from 0 to d, the extracted samples are used as they are. The values are fixed for the samples after the boundary sample d. For example, all the samples d to 2047 are set to 0. Therefore, the number of the second sample is larger than the number of the first sample. FIG. 7 shows the waveform of the direct sound signal. In FIG. 7, the values of the samples after the boundary sample d are constant at 0. The direct sound signal is also referred to as a second signal.

なお、第2のサンプル数は2048となっているが、第2のサンプル数は2048に限られるものではない。サンプリング周波数FS=48kHzの場合、第2のサンプル数は256以上であることが好ましく、さらに低域周波数の精度を十分に取るため、第2のサンプル数は2048以上であることがより好ましい。また、直接音信号が5msec以上のデータ長となるように第2のサンプル数を設定することが好ましく、さらに20msec以上のデータ長となるように第2のサンプル数を設定することがより好ましい。 The number of the second sample is 2048, but the number of the second sample is not limited to 2048. When the sampling frequency FS = 48 kHz, the number of the second samples is preferably 256 or more, and the number of the second samples is more preferably 2048 or more in order to obtain sufficient accuracy of the low frequency range. Further, it is preferable to set the number of the second sample so that the direct sound signal has a data length of 5 msec or more, and it is more preferable to set the number of the second sample so that the data length is 20 msec or more.

変換部216は、FFT(高速フーリエ変換)により直接音信号からスペクトルを生成する(S15)。これにより、直接音信号の振幅スペクトルと、位相スペクトルが生成される。なお、振幅スペクトルの代わりにパワースペクトルを生成してもよい。パワースペクトルを用いる場合、後述するステップでは補正部217がパワースペクトルを補正する。なお、変換部216は、離散フーリエ変換や離散コサイン変換により、直接音信号を周波数領域のデータに変換してもよい。 The conversion unit 216 generates a spectrum from a direct sound signal by FFT (Fast Fourier Transform) (S15). As a result, the amplitude spectrum and the phase spectrum of the direct sound signal are generated. A power spectrum may be generated instead of the amplitude spectrum. When the power spectrum is used, the correction unit 217 corrects the power spectrum in the step described later. The conversion unit 216 may directly convert the sound signal into data in the frequency domain by the discrete Fourier transform or the discrete cosine transform.

次に、補正部217は、振幅スペクトルを補正する(S16)。具体的には、補正部217は、補正帯域における振幅値を増加するように、振幅スペクトルを補正する。なお、補正された振幅スペクトルを補正スペクトルとも称する。本実施の形態では、位相スペクトルは補正せず、振幅スペクトルのみを補正している。すなわち、補正部217は、位相スペクトルについては、補正せずにそのままとする。 Next, the correction unit 217 corrects the amplitude spectrum (S16). Specifically, the correction unit 217 corrects the amplitude spectrum so as to increase the amplitude value in the correction band. The corrected amplitude spectrum is also referred to as a corrected spectrum. In the present embodiment, the phase spectrum is not corrected and only the amplitude spectrum is corrected. That is, the correction unit 217 leaves the phase spectrum as it is without correcting it.

補正帯域は、所定の周波数(補正上限周波数)以下の帯域である。例えば、補正帯域は、最低周波数(1Hz)〜1000Hz以下の帯域である。もちろん、補正帯域は、この帯域に限定されるものではない。すなわち、補正上限周波数は適宜異なる値を設定することが可能である。 The correction band is a band below a predetermined frequency (correction upper limit frequency). For example, the correction band is a band from the lowest frequency (1 Hz) to 1000 Hz or less. Of course, the correction band is not limited to this band. That is, the correction upper limit frequency can be set to a different value as appropriate.

補正部217は、補正帯域におけるスペクトルの振幅値を補正レベルにする。ここでは、補正レベルが、800Hz〜1500Hzの振幅値の平均レベルとなっている。すなわち、補正部217は、800Hz〜1500Hzの振幅値の平均レベルを補正レベルとして算出する。そして、補正部217は、補正帯域における振幅スペクトルの振幅値を補正レベルに置き換える。したがって、補正振幅スペクトルにおいて、補正帯域における振幅値は一定値となっている。 The correction unit 217 sets the amplitude value of the spectrum in the correction band as the correction level. Here, the correction level is the average level of the amplitude values of 800 Hz to 1500 Hz. That is, the correction unit 217 calculates the average level of the amplitude values of 800 Hz to 1500 Hz as the correction level. Then, the correction unit 217 replaces the amplitude value of the amplitude spectrum in the correction band with the correction level. Therefore, in the correction amplitude spectrum, the amplitude value in the correction band is a constant value.

図8に、補正前の振幅スペクトルBと、補正後の振幅スペクトルCを示す。図8では、横軸が周波数[Hz]で、縦軸が振幅[dB]であり、対数表示となっている。補正後の振幅スペクトルは、1000Hz以下の補正帯域の振幅[dB]が一定となっている。また、補正部217は、位相スペクトルを補正せずにそのままとする。 FIG. 8 shows the amplitude spectrum B before correction and the amplitude spectrum C after correction. In FIG. 8, the horizontal axis is the frequency [Hz] and the vertical axis is the amplitude [dB], which is a logarithmic display. In the corrected amplitude spectrum, the amplitude [dB] of the correction band of 1000 Hz or less is constant. Further, the correction unit 217 leaves the phase spectrum as it is without correcting it.

なお、補正レベルを算出するための帯域を算出用帯域とする。算出用帯域は、第1の周波数から、第1の周波数よりも低い第2の周波数で規定される帯域である。したがって、算出用帯域は、第2の周波数から第1の周波数までの帯域となる。上記の例では、算出用帯域の第2の周波数を1500Hz、第1の周波数を800Hzとしている。もちろん、算出用帯域は800Hz〜1500Hzの帯域に限定されるものではない。すなわち、算出用帯域を規定する第1の周波数、及び第2の周波数は、1500Hz、及び800Hzに限られず、任意の周波数とすることができる。 The band for calculating the correction level is used as the calculation band. The calculation band is a band defined by a second frequency lower than the first frequency from the first frequency. Therefore, the calculation band is a band from the second frequency to the first frequency. In the above example, the second frequency of the calculation band is 1500 Hz, and the first frequency is 800 Hz. Of course, the calculation band is not limited to the band of 800 Hz to 1500 Hz. That is, the first frequency and the second frequency that define the calculation band are not limited to 1500 Hz and 800 Hz, and can be any frequency.

算出用帯域を規定する第1の周波数が、補正帯域を規定する上限周波数よりも高い周波数であることが好ましい。第1及び第2の周波数は伝達特性Hls、Hlo、Hro、Hrsの周波数特性を予め調べておき、決定した値を用いることができる。もちろん、振幅の平均レベルではない値を用いてもよい。第1及び第2の周波数を求める際に、周波数特性を表示し、中低域のディップを補正すべく推奨の周波数を示しても良い。 It is preferable that the first frequency that defines the calculation band is higher than the upper limit frequency that defines the correction band. For the first and second frequencies, the values determined by examining the frequency characteristics of the transmission characteristics Hls, Hlo, Hro, and Hrs in advance can be used. Of course, a value other than the average level of amplitude may be used. When determining the first and second frequencies, the frequency characteristics may be displayed and the recommended frequency may be indicated to correct the dip in the mid-low range.

補正部217は、算出用帯域の振幅値にもとづいて、補正レベルを算出する。また、補正帯域における補正レベルを算出用帯域における振幅値の平均値としたが、補正レベルは、振幅値の平均値に限られるものではない。例えば、補正レベルは、振幅値の重み付け平均であってもよい。また、補正帯域全体で一定になっていなくてもよい。すなわち、補正帯域における周波数に応じて、補正レベルが変わってもよい。 The correction unit 217 calculates the correction level based on the amplitude value of the calculation band. Further, although the correction level in the correction band is set as the average value of the amplitude values in the calculation band, the correction level is not limited to the average value of the amplitude values. For example, the correction level may be a weighted average of the amplitude values. Further, it does not have to be constant over the entire correction band. That is, the correction level may change according to the frequency in the correction band.

別の補正方法として、補正部217は、所定の周波数以上の周波数における平均振幅レベルと、所定の周波数より低い周波数における平均振幅レベルとが等しくなるように、所定の周波数より低い周波数の振幅レベルを一定レベルにしてもよく、また、周波数特性の概形を維持したまま振幅値方向に平行移動させてもよい。所定の周波数としては、補正上限周波数が挙げられる。 As another correction method, the correction unit 217 sets the amplitude level of the frequency lower than the predetermined frequency so that the average amplitude level at the frequency above the predetermined frequency is equal to the average amplitude level at the frequency lower than the predetermined frequency. It may be set to a constant level, or may be moved in parallel in the amplitude value direction while maintaining the general shape of the frequency characteristic. Examples of the predetermined frequency include a correction upper limit frequency.

さらに別の補正方法として、補正部217は、あらかじめスピーカ5L及びスピーカ5Rの周波数特性データを記憶しておき、所定の周波数以下の振幅レベルをスピーカ5L及びスピーカ5Rの周波数特性データに置き換えてもよい。また、補正部217は、あらかじめ人の左右の耳の幅(例えば約18cm)の剛球でシミュレーションした頭部伝達関数の低域の周波数特性データを記憶しておき、同様にして置き換えても良い。所定の周波数としては、補正上限周波数が挙げられる。 As yet another correction method, the correction unit 217 may store the frequency characteristic data of the speaker 5L and the speaker 5R in advance, and replace the amplitude level below the predetermined frequency with the frequency characteristic data of the speaker 5L and the speaker 5R. .. Further, the correction unit 217 may store the low frequency characteristic data of the head related transfer function simulated by a hard sphere having the width of the left and right ears of a person (for example, about 18 cm) in advance, and replace it in the same manner. Examples of the predetermined frequency include a correction upper limit frequency.

次に、逆変換部218が、IFFT(逆高速フーリエ変換)により、補正信号を生成する(S17)。すなわち、逆変換部218は、補正振幅スペクトルと位相スペクトルに離散フーリエ変換を施すことで、スペクトルデータが時間領域のデータとなる。逆変換部218は、逆離散フーリエ変換ではなく、逆離散コサイン変換等により、逆変換を行うことで、補正信号を生成してもよい。補正信号のサンプル数は、直接音信号と同じ2048となっている。図9に、直接音信号Dと補正信号Eとを拡大して示す波形図を示す。 Next, the inverse transform unit 218 generates a correction signal by IFFT (inverse fast Fourier transform) (S17). That is, the inverse transform unit 218 performs discrete Fourier transform on the corrected amplitude spectrum and the phase spectrum, so that the spectrum data becomes the data in the time domain. The inverse transform unit 218 may generate a correction signal by performing an inverse transform by an inverse discrete cosine transform or the like instead of the inverse discrete Fourier transform. The number of samples of the correction signal is 2048, which is the same as that of the direct sound signal. FIG. 9 shows an enlarged waveform diagram of the direct sound signal D and the correction signal E.

そして、生成部219が、収音信号と補正信号とを用いて、フィルタを生成する(S18)。具体的には、生成部219は、境界サンプルdまでのサンプルについては、補正信号に置き換える。境界サンプルd以降のサンプルについては、補正信号を収音信号に加算する。すなわち、生成部219は、境界サンプルdよりも前(0〜(d−1))のフィルタ値については、補正信号の値により生成する。境界サンプルd以降かつ第2のサンプル未満(d〜2047)のフィルタ値については、生成部219は収音信号に補正信号を加算した加算値により生成する。さらに、生成部219は、第2のサンプル数以上かつ収音信号のサンプル数未満のフィルタ値については、収音信号の値により生成する。 Then, the generation unit 219 generates a filter by using the sound collection signal and the correction signal (S18). Specifically, the generation unit 219 replaces the samples up to the boundary sample d with correction signals. For the samples after the boundary sample d, the correction signal is added to the sound collection signal. That is, the generation unit 219 generates the filter value before the boundary sample d (0 to (d-1)) based on the value of the correction signal. For the filter values after the boundary sample d and less than the second sample (d to 2047), the generation unit 219 generates the filter values by adding the correction signal to the sound pick-up signal. Further, the generation unit 219 generates the filter value of the second sample number or more and less than the sound collection signal sample number based on the sound collection signal value.

例えば、収音信号をM(n)とし、補正信号をE(n)とし、フィルタをF(n)とする。ここで、nはサンプル番号であり、0〜4095の整数となる。フィルタF(n)は以下の通りとなる
nが0以上、かつ、d未満の場合(0≦n<dの場合)
F(n)=E(n)
nがd以上、かつ、第2のサンプル数(ここでは2048)未満の場合(d≦n<第2のサンプル数の場合)
F(n)=M(n)+E(n)
nが第2のサンプル数以上、かつ、収音信号のサンプル数(ここでは4096)未満の場合(第2のサンプル数≦n<収音信号のサンプル数の場合)
F(n)=M(n)
For example, the sound pickup signal is M (n), the correction signal is E (n), and the filter is F (n). Here, n is a sample number, which is an integer of 0 to 4095. The filter F (n) is as follows when n is 0 or more and less than d (when 0 ≦ n <d).
F (n) = E (n)
When n is d or more and less than the number of second samples (2048 in this case) (when d ≦ n <number of second samples)
F (n) = M (n) + E (n)
When n is equal to or greater than the number of second samples and less than the number of sound collection signal samples (4096 in this case) (when the number of second samples ≤ n <number of sound collection signal samples)
F (n) = M (n)

なお、nが第2のサンプル以上の場合の補正信号E(n)の値を0と見なせば、nが第2のサンプル数以上、かつ、収音信号のサンプル数(ここでは4096)未満の場合についても、F(n)=M(n)+E(n)となる。つまり、nがd以上、かつ、収音信号のサンプル数(ここでは2048)未満の場合、F(n)=M(n)+E(n)ということもできる。図10にフィルタの波形図を示す。フィルタのサンプル数は4096となっている。 If the value of the correction signal E (n) when n is equal to or greater than the second sample is regarded as 0, n is equal to or greater than the number of second samples and less than the number of sound pickup signal samples (4096 in this case). Also in the case of, F (n) = M (n) + E (n). That is, when n is d or more and less than the number of sound collection signal samples (2048 in this case), it can be said that F (n) = M (n) + E (n). FIG. 10 shows a waveform diagram of the filter. The number of filter samples is 4096.

このようにして、生成部219が収音信号と補正信号とに基づいてフィルタ値を算出することで、フィルタを生成する。もちろん、収音信号と補正信号を単純に加算するのではなく、係数を乗じて加算してもよい。図11に、上記の処理で生成されたフィルタHと補正されていないフィルタGの周波数特性(振幅スペクトル)を示す。なお、補正されていないフィルタGは、図5に示した収音信号の周波数特性となる。 In this way, the generation unit 219 generates the filter by calculating the filter value based on the sound collection signal and the correction signal. Of course, instead of simply adding the sound collection signal and the correction signal, they may be added by multiplying them by a coefficient. FIG. 11 shows the frequency characteristics (amplitude spectrum) of the filter H generated by the above process and the uncorrected filter G. The uncorrected filter G has the frequency characteristics of the sound pick-up signal shown in FIG.

このように、伝達特性を補正することにより、センター音像がしっかり定位した音場、及び聴感上、中低域と高域のバランスが取れた周波数特性となる。すなわち、中低域である補正帯域の振幅を増強しているため、適切なフィルタを生成することができる。いわゆる中抜けが発生していない音場を再生することができる。また、受聴者1の頭部の、ある固定した位置での空間伝達関数が測定された場合であっても適切なフィルタを生成することができる。よって、音源から左右の耳までの距離の差が半波長となる周波数についても、適切なフィルタ値を得ることができる。よって、適切なフィルタを生成することができる。 By correcting the transmission characteristics in this way, the sound field in which the center sound image is firmly localized, and the frequency characteristics in which the mid-low range and the high range are well-balanced in terms of hearing are obtained. That is, since the amplitude of the correction band in the mid-low range is increased, an appropriate filter can be generated. It is possible to reproduce a sound field in which so-called hollows do not occur. Further, even when the spatial transfer function of the head of the listener 1 at a fixed position is measured, an appropriate filter can be generated. Therefore, an appropriate filter value can be obtained even for a frequency in which the difference in distance from the sound source to the left and right ears is a half wavelength. Therefore, an appropriate filter can be generated.

具体的には、抽出部214が境界サンプルdよりも前のサンプルを抽出している。すなわち、抽出部214が収音信号の直接音のみを抽出している。したがって、抽出部214で抽出されたサンプルが直接音のみを示すことになる。直接音信号生成部215が抽出されたサンプルに基づいて、直接音信号を生成している。境界サンプルdは、直接音と反射音の境界に対応するため、直接音信号から反射音を排除することができる。
さらに、直接音信号生成部215は、収音信号、及びフィルタの半分のサンプル数(2048サンプル)の直接音信号を生成している。直接音信号のサンプル数を多くすることで、低域でも精度良く補正することができる。また、直接音信号のサンプル数は、直接音信号が20msec以上となるサンプル数とすることが好ましい。なお、直接音信号のサンプル長は最大、収音信号(伝達関数Hls,Hlo、Hro、Hrs)と同じ長さとすることができる。
Specifically, the extraction unit 214 extracts a sample before the boundary sample d. That is, the extraction unit 214 extracts only the direct sound of the sound collection signal. Therefore, the sample extracted by the extraction unit 214 shows only the direct sound. The direct sound signal generation unit 215 generates a direct sound signal based on the extracted sample. Since the boundary sample d corresponds to the boundary between the direct sound and the reflected sound, the reflected sound can be excluded from the direct sound signal.
Further, the direct sound signal generation unit 215 generates a sound pick-up signal and a direct sound signal having half the number of samples (2048 samples) of the filter. By increasing the number of samples of the direct sound signal, it is possible to accurately correct even in the low frequency range. Further, the number of samples of the direct sound signal is preferably set to the number of samples in which the direct sound signal is 20 msec or more. The sample length of the direct sound signal can be the same as the maximum sound collecting signal (transfer functions Hls, Hlo, Hro, Hrs).

上記の処理が、伝達関数Hls,Hlo、Hro、Hrsに対応する4つの収音信号に対して実施される。なお、処理装置210は、物理的な単一な装置に限られるものではない。すなわち、処理装置210の一部の処理を他の装置で行うことも可能である。例えば、他の装置で測定した収音信号を用意しておき、処理装置210が、その収音信号を取得する。そして、処理装置210は、収音信号をメモリなどに格納するとともに、上記の処理を施す。 The above processing is performed on four pick-up signals corresponding to the transfer functions Hls, Hlo, Hro, and Hrs. The processing device 210 is not limited to a single physical device. That is, it is also possible to perform a part of the processing of the processing device 210 by another device. For example, a sound collection signal measured by another device is prepared, and the processing device 210 acquires the sound collection signal. Then, the processing device 210 stores the sound pick-up signal in a memory or the like, and performs the above processing.

上記処理のうちの一部又は全部は、コンピュータプログラムによって実行されてもよい。上述したプログラムは、様々なタイプの非一時的なコンピュータ可読媒体(non−transitory computer readable medium)を用いて格納され、コンピュータに供給することができる。非一時的なコンピュータ可読媒体は、様々なタイプの実体のある記録媒体(tangible storage medium)を含む。非一時的なコンピュータ可読媒体の例は、磁気記録媒体(例えばフレキシブルディスク、磁気テープ、ハードディスクドライブ)、光磁気記録媒体(例えば光磁気ディスク)、CD−ROM(Read Only Memory)、CD−R、CD−R/W、半導体メモリ(例えば、マスクROM、PROM(Programmable ROM)、EPROM(Erasable PROM)、フラッシュROM、RAM(Random Access Memory))を含む。また、プログラムは、様々なタイプの一時的なコンピュータ可読媒体(transitory computer readable medium)によってコンピュータに供給されてもよい。一時的なコンピュータ可読媒体の例は、電気信号、光信号、及び電磁波を含む。一時的なコンピュータ可読媒体は、電線及び光ファイバ等の有線通信路、又は無線通信路を介して、プログラムをコンピュータに供給できる。 Part or all of the above processing may be executed by a computer program. The programs described above can be stored and supplied to a computer using various types of non-transitory computer readable media. Non-transient computer-readable media include various types of tangible storage media (tangible storage media). Examples of non-temporary computer-readable media include magnetic recording media (eg, flexible disks, magnetic tapes, hard disk drives), magneto-optical recording media (eg, magneto-optical disks), CD-ROMs (Read Only Memory), CD-Rs, CD-R / W, semiconductor memory (for example, mask ROM, PROM (Programmable ROM), EPROM (Erasable PROM), flash ROM, RAM (Random Access Memory)) is included. The program may also be supplied to the computer by various types of temporary computer readable media (transitory computer readable media). Examples of temporary computer-readable media include electrical, optical, and electromagnetic waves. The temporary computer-readable medium can supply the program to the computer via a wired communication path such as an electric wire and an optical fiber, or a wireless communication path.

以上、本発明者によってなされた発明を実施の形態に基づき具体的に説明したが、本発明は上記実施の形態に限られたものではなく、その要旨を逸脱しない範囲で種々変更可能であることは言うまでもない。 Although the invention made by the present inventor has been specifically described above based on the embodiment, the present invention is not limited to the above embodiment and can be variously modified without departing from the gist thereof. Needless to say.

U ユーザ
1 受聴者
2L 左マイク
2R 右マイク
5L 左スピーカ
5R 右スピーカ
9L 左耳
9R 右耳
10 頭外定位処理部
11 畳み込み演算部
12 畳み込み演算部
21 畳み込み演算部
22 畳み込み演算部
24 加算器
25 加算器
41 フィルタ部
42 フィルタ部
43 ヘッドホン
100 頭外定位処理装置
200 フィルタ生成装置
210 処理装置
211 測定信号生成部
212 収音信号取得部
213 境界設定部
214 抽出部
215 直接音信号生成部
216 変換部
217 補正部
218 逆変換部
219 生成部
U User 1 Listener 2L Left microphone 2R Right microphone 5L Left speaker 5R Right speaker 9L Left ear 9R Right ear 10 Out-of-head localization processing unit 11 Folding calculation unit 12 Folding calculation unit 21 Folding calculation unit 22 Folding calculation unit 24 Adder 25 Addition Instrument 41 Filter unit 42 Filter unit 43 Headphones 100 Out-of-head localization processing device 200 Filter generation device 210 Processing device 211 Measurement signal generation unit 212 Sound collection signal acquisition unit 213 Boundary setting unit 214 Extraction unit 215 Direct sound signal generation unit 216 Conversion unit 217 Correction unit 218 Inverse conversion unit 219 Generation unit

Claims (5)

音源から出力された測定信号を収音して、収音信号を取得するマイクと、
前記収音信号に基づいて、前記音源から前記マイクまでの伝達特性に応じたフィルタを生成する処理部と、を備え、
前記処理部は、
前記収音信号の境界サンプルよりも前のサンプルから第1のサンプル数の第1の信号を抽出する抽出部と、
前記第1の信号に基づいて、前記音源からの直接音を含む第2の信号を前記第1のサンプル数よりも多い第2のサンプル数で生成する信号生成部と、
前記第2の信号を周波数領域に変換して、スペクトルを生成する変換部と、
所定の周波数以下の帯域における前記スペクトルの値を増加させて、補正スペクトルを生成する補正部と、
前記補正スペクトルを時間領域に逆変換して、補正信号を生成する逆変換部と、
前記収音信号と前記補正信号とを用いてフィルタを生成する生成部であって、前記境界サンプルよりも前のフィルタ値については、前記補正信号の値により生成し、前記境界サンプル以降かつ第2のサンプル数未満のフィルタ値については前記収音信号に前記補正信号を加算した加算値により生成する生成部と、を備えたフィルタ生成装置。
A microphone that collects the measurement signal output from the sound source and acquires the sound collection signal,
A processing unit that generates a filter according to the transmission characteristics from the sound source to the microphone based on the sound pick-up signal is provided.
The processing unit
An extraction unit that extracts the first signal of the first number of samples from the sample before the boundary sample of the sound collection signal, and
A signal generation unit that generates a second signal including a direct sound from the sound source with a second sample number larger than the first sample number based on the first signal.
A conversion unit that converts the second signal into a frequency domain to generate a spectrum, and
A correction unit that generates a correction spectrum by increasing the value of the spectrum in a band below a predetermined frequency.
An inverse conversion unit that generates a correction signal by inversely converting the correction spectrum into a time domain.
A generator that generates a filter using the sound pick-up signal and the correction signal, and the filter value before the boundary sample is generated by the value of the correction signal, and is after the boundary sample and the second. A filter generation device including a generation unit for generating a filter value less than the number of samples of the above by adding the correction signal to the sound collection signal.
前記境界サンプルより前の前記収音信号は、前記音源からの前記マイクに直接到達する直接音を含み、前記境界サンプル以降の前記収音信号は、前記音源から放出された後、反射して前記マイクに到達する反射音を含む請求項1に記載のフィルタ生成装置。 The sound pick-up signal before the boundary sample includes a direct sound directly reaching the microphone from the sound source, and the sound pick-up signal after the boundary sample is emitted from the sound source and then reflected and said. The filter generation device according to claim 1, which includes a reflected sound reaching a microphone. 前記補正部が補正する周波数帯域は、前記所定の周波数よりも高い第1の周波数と、前記第1の周波数よりも低い第2の周波数で規定されている請求項1、又は2に記載のフィルタ生成装置。 The filter according to claim 1 or 2, wherein the frequency band corrected by the correction unit is defined by a first frequency higher than the predetermined frequency and a second frequency lower than the first frequency. Generator. 音源から出力された測定信号をマイクで収音することで伝達特性に応じたフィルタを生成するフィルタ生成方法であって、
前記マイクで収音信号を取得するステップと、
前記収音信号の境界サンプルよりも前のサンプルから第1のサンプル数の第1の信号を抽出するステップと、
前記第1の信号に基づいて、前記音源からの直接音を含む第2の信号を前記第1のサンプル数よりも多い第2のサンプル数で生成するステップと、
前記第2の信号を周波数領域に変換して、スペクトルを生成するステップと、
所定の周波数以下の帯域における前記スペクトルの値を増加させて、補正スペクトルを生成するステップと、
前記補正スペクトルを時間領域に逆変換して、補正信号を生成するステップと、
前記収音信号と前記補正信号とを用いてフィルタを生成するステップであって、前記境界サンプルよりも前のフィルタ値については、前記補正信号の値により生成し、前記境界サンプル以降かつ第2のサンプル数未満のフィルタ値については、前記収音信号に前記補正信号を加算した加算値により生成するステップと、を備えたフィルタ生成方法。
It is a filter generation method that generates a filter according to the transmission characteristics by collecting the measurement signal output from the sound source with a microphone.
The step of acquiring the sound pick-up signal with the microphone and
A step of extracting the first signal of the first number of samples from the sample before the boundary sample of the sound pick-up signal, and
A step of generating a second signal including a direct sound from the sound source based on the first signal with a second sample number larger than the first sample number.
The step of converting the second signal into the frequency domain to generate a spectrum, and
A step of increasing the value of the spectrum in a band below a predetermined frequency to generate a correction spectrum, and
A step of inversely converting the correction spectrum into a time domain to generate a correction signal,
In the step of generating a filter using the sound pick-up signal and the correction signal, the filter value before the boundary sample is generated by the value of the correction signal, and is after the boundary sample and the second. A filter generation method including a step of generating a filter value less than the number of samples by an added value obtained by adding the correction signal to the sound pick-up signal.
音源から出力された測定信号をマイクで収音することで伝達特性に応じたフィルタを生成するフィルタ生成方法をコンピュータに実行させるプログラムであって、
前記フィルタ生成方法は、
前記マイクで収音信号を取得するステップと、
前記収音信号の境界サンプルよりも前のサンプルから第1のサンプル数の第1の信号を抽出するステップと、
前記第1の信号に基づいて、前記音源からの直接音を含む第2の信号を前記第1のサンプル数よりも多い第2のサンプル数で生成するステップと、
前記第2の信号を周波数領域に変換して、スペクトルを生成するステップと、
所定の周波数以下の帯域における前記スペクトルの値を増加させて、補正スペクトルを生成するステップと、
前記補正スペクトルを時間領域に逆変換して、補正信号を生成するステップと、
前記収音信号と前記補正信号とを用いてフィルタを生成するステップであって、前記境界サンプルよりも前のフィルタ値については、前記補正信号の値により生成し、前記境界サンプル以降かつ第2のサンプル数未満のフィルタ値については、前記収音信号に前記補正信号を加算した加算値により生成するステップと、を備えたプログラム。
A program that causes a computer to execute a filter generation method that generates a filter according to the transmission characteristics by collecting the measurement signal output from the sound source with a microphone.
The filter generation method is
The step of acquiring the sound pick-up signal with the microphone and
A step of extracting the first signal of the first number of samples from the sample before the boundary sample of the sound pick-up signal, and
A step of generating a second signal including a direct sound from the sound source based on the first signal with a second sample number larger than the first sample number.
The step of converting the second signal into the frequency domain to generate a spectrum, and
A step of increasing the value of the spectrum in a band below a predetermined frequency to generate a correction spectrum, and
A step of inversely converting the correction spectrum into a time domain to generate a correction signal,
In the step of generating a filter using the sound pick-up signal and the correction signal, the filter value before the boundary sample is generated by the value of the correction signal, and is after the boundary sample and is the second. A program including a step of generating a filter value less than the number of samples by an added value obtained by adding the correction signal to the sound pick-up signal.
JP2017033204A 2017-02-24 2017-02-24 Filter generator, filter generator, and program Active JP6805879B2 (en)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2017033204A JP6805879B2 (en) 2017-02-24 2017-02-24 Filter generator, filter generator, and program
EP18756889.4A EP3588987A4 (en) 2017-02-24 2018-02-06 Filter generation device, filter generation method, and program
CN201880011697.9A CN110301142B (en) 2017-02-24 2018-02-06 Filter generation device, filter generation method, and storage medium
PCT/JP2018/003975 WO2018155164A1 (en) 2017-02-24 2018-02-06 Filter generation device, filter generation method, and program
US16/549,928 US10805727B2 (en) 2017-02-24 2019-08-23 Filter generation device, filter generation method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017033204A JP6805879B2 (en) 2017-02-24 2017-02-24 Filter generator, filter generator, and program

Publications (2)

Publication Number Publication Date
JP2018139345A JP2018139345A (en) 2018-09-06
JP6805879B2 true JP6805879B2 (en) 2020-12-23

Family

ID=63451451

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017033204A Active JP6805879B2 (en) 2017-02-24 2017-02-24 Filter generator, filter generator, and program

Country Status (1)

Country Link
JP (1) JP6805879B2 (en)

Also Published As

Publication number Publication date
JP2018139345A (en) 2018-09-06

Similar Documents

Publication Publication Date Title
JP6790654B2 (en) Filter generator, filter generator, and program
US10264387B2 (en) Out-of-head localization processing apparatus and out-of-head localization processing method
JP6922603B2 (en) Signal processing equipment, signal processing methods, and programs
WO2017154378A1 (en) Measuring device, filter generating device, measuring method, and filter generating method
US10687144B2 (en) Filter generation device and filter generation method
US10805727B2 (en) Filter generation device, filter generation method, and program
JP6981330B2 (en) Out-of-head localization processing device, out-of-head localization processing method, and program
JP6866679B2 (en) Out-of-head localization processing device, out-of-head localization processing method, and out-of-head localization processing program
WO2017134711A1 (en) Filter generation apparatus, filter generation method, and sound image localization processing method
JP6805879B2 (en) Filter generator, filter generator, and program
JP2017028365A (en) Sound field reproduction device, sound field reproduction method, and program
WO2021131337A1 (en) Processing device, processing method, filter generation method, reproduction method, and program
JP7115353B2 (en) Processing device, processing method, reproduction method, and program
US20230040821A1 (en) Processing device and processing method
US20230114777A1 (en) Filter generation device and filter generation method
US11228837B2 (en) Processing device, processing method, reproduction method, and program
JP2023024038A (en) Processing device and processing method
JP2023047707A (en) Filter generation device and filter generation method
JP2023047706A (en) Filter generation device and filter generation method
JP2023024040A (en) Processing device and processing method

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190930

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20201104

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20201117

R150 Certificate of patent or registration of utility model

Ref document number: 6805879

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150