JP6592838B2 - Binaural signal generation apparatus, method, and program - Google Patents

Binaural signal generation apparatus, method, and program Download PDF

Info

Publication number
JP6592838B2
JP6592838B2 JP2015168545A JP2015168545A JP6592838B2 JP 6592838 B2 JP6592838 B2 JP 6592838B2 JP 2015168545 A JP2015168545 A JP 2015168545A JP 2015168545 A JP2015168545 A JP 2015168545A JP 6592838 B2 JP6592838 B2 JP 6592838B2
Authority
JP
Japan
Prior art keywords
spherical
speaker
signal
radius
array
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015168545A
Other languages
Japanese (ja)
Other versions
JP2017046256A (en
Inventor
圭吾 若山
英明 高田
翔一 小山
洋 猿渡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
University of Tokyo NUC
Original Assignee
Nippon Telegraph and Telephone Corp
University of Tokyo NUC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp, University of Tokyo NUC filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2015168545A priority Critical patent/JP6592838B2/en
Publication of JP2017046256A publication Critical patent/JP2017046256A/en
Application granted granted Critical
Publication of JP6592838B2 publication Critical patent/JP6592838B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

この発明は、ある音場に設置されたマイクロホンで音信号を収音し、その音信号を用いてその音場を再現する技術に関する。   The present invention relates to a technique for collecting a sound signal with a microphone installed in a certain sound field and reproducing the sound field using the sound signal.

複数のマイクロホンを用いて遠隔地の音場を仮想的に再現するためのバイノーラル信号を生成する技術として例えば非特許文献1に記載された技術が知られている。非特許文献1に記載された技術では、一方向に対して対応する1個の頭部伝達関数(Head Related Transfer Function:HRTF)を畳み込むことにより、バイノーラル信号を生成している。   As a technique for generating a binaural signal for virtually reproducing a remote sound field using a plurality of microphones, for example, a technique described in Non-Patent Document 1 is known. In the technique described in Non-Patent Document 1, a binaural signal is generated by convolving one head related transfer function (HRTF) corresponding to one direction.

平原達也, et al. , "頭部伝達関数の計測とバイノーラル再生にかかわる諸問題," 電子情報通信学会 基礎・境界ソサイエティ Fundamentals Review, vol. 2, no. 4, pp. 68-85, 2009.Tatsuya Hirahara, et al., "Problems related to measurement of head-related transfer functions and binaural reproduction," Fundamentals Review, IEICE Fundamentals / Boundary Society Fundamentals Review, vol. 2, no. 4, pp. 68-85, 2009.

非特許文献1に記載された技術では、頭部伝達関数が1個だけしか用いられていない。このため、生成されるバイノーラル信号の精度が必ずしも高くなかった。   In the technique described in Non-Patent Document 1, only one head-related transfer function is used. For this reason, the accuracy of the generated binaural signal is not necessarily high.

この発明の目的は、より精度の高いバイノーラル信号を生成するバイノーラル信号生成装置、方法及びプログラムを提供することである。   An object of the present invention is to provide a binaural signal generation apparatus, method, and program for generating a binaural signal with higher accuracy.

この発明の一態様によるバイノーラル信号生成装置は、円状に配置された円状スピーカアレーからの再生音に基づく複数の頭部伝達関数を考慮して所望音場と合成音場を一致させることで得られるフィルタと、円状に配置された円状マイクロホンアレーによる観測信号とを時空間方向に畳み込むことによりバイノーラル信号を生成するフィルタリング部を含み、jを虚数とし、kを波数とし、JA binaural signal generation device according to an aspect of the present invention matches a desired sound field with a synthesized sound field in consideration of a plurality of head-related transfer functions based on reproduced sounds from circular speaker arrays arranged in a circle. It includes a filtering unit that generates a binaural signal by convolving the obtained filter and a circular microphone array observation signal in a spatio-temporal direction, j is an imaginary number, k is a wave number, and J mm をm次のベッセル関数とし、HBe an m-order Bessel function and H mm (1)(1) 'をm次の第一種ハンケル関数H'M-th order Hankel function H mm (1)(1) の微分とし、聴者の何れか一方の耳の円筒座標系における位置を(RThe position of one of the listener's ears in the cylindrical coordinate system is expressed as (R LL , φ LL ,0)とし、~G, 0) and ~ G LL を円筒調和関数領域表現された頭部伝達関数とし、~Gを各スピーカの円筒調和関数領域表現された伝達関数とし、~Gは半径RIs the head-related transfer function expressed in the cylindrical harmonic function region, ~ G is the transfer function expressed in the cylindrical harmonic function region of each speaker, and ~ G is the radius R refref の円周上で測定されるとし、R, R mm を円状マイクロホンアレーの半径とし、RIs the radius of the circular microphone array and R ss を円状スピーカアレーの半径として、フィルタは、以下の式(A)又は式(B)により定義されるFWhere F is defined by the following equation (A) or (B) LL を逆フーリエ変換することにより得られるフィルタである。Is a filter obtained by inverse Fourier transform.

Figure 0006592838
Figure 0006592838
この発明の一態様によるバイノーラル信号生成装置は、球状に配置された球状スピーカアレーを考慮して所望音場と合成音場を一致させることで得られるフィルタと球状に配置された球状マイクロホンアレーによる観測信号とを時空間畳み込みすることにより信号を得るフィルタリング部と、得られた信号の球状スピーカアレーの各スピーカ位置に対応する時間信号と、球状スピーカアレーからの再生音に基づく複数の頭部伝達関数の球状スピーカアレーの各スピーカ位置に対応する時間信号とを時間方向に畳み込みしたものを球状スピーカアレーを構成するスピーカの数の分だけ足し合わせることにより時間領域のバイノーラル信号を生成する信号生成部と、を含み、jを虚数とし、kを波数とし、n,mを球面調和関数YThe binaural signal generation device according to one aspect of the present invention is an observation using a spherical microphone array arranged in a spherical shape with a filter obtained by matching a desired sound field and a synthesized sound field in consideration of a spherical speaker array arranged in a spherical shape. A filtering unit that obtains a signal by space-time convolution of the signal, a time signal corresponding to each speaker position of the spherical speaker array of the obtained signal, and a plurality of head-related transfer functions based on reproduced sound from the spherical speaker array A signal generator for generating a binaural signal in the time domain by adding together the time signals corresponding to the respective speaker positions of the spherical speaker array in the time direction by the number of speakers constituting the spherical speaker array. , J is an imaginary number, k is a wave number, and n and m are spherical harmonic functions Y nn mm の次数とし、球状スピーカアレーの球座標系における位置rAnd the position r of the spherical speaker array in the spherical coordinate system. ss をrR ss =(R= (R ss , θ ss , φ ss )とし、h) And h nn (1)(1) 'をn次の第一種球ハンケル関数h'N-th order first-class sphere Hankel function h nn (1)(1) の微分とし、~Gを球状スピーカアレーを構成するスピーカの円筒調和関数領域表現された伝達関数とし、~Gは半径R~ G is the transfer function expressed in the cylindrical harmonic function region of the speaker constituting the spherical speaker array, and ~ G is the radius R refref の円周上で測定されるとし、R, R mm を球状マイクロホンアレーの半径とし、RIs the radius of the spherical microphone array and R ss を球状スピーカアレーの半径として、フィルタは、以下の式(E)又は式(F)により定義されるFIs the radius of the spherical speaker array, and the filter is defined by the following formula (E) or formula (F). LL である。It is.
Figure 0006592838
Figure 0006592838

複数の頭部伝達関数を用いることにより、精度の高いバイノーラル信号を生成することができる。   By using a plurality of head-related transfer functions, a highly accurate binaural signal can be generated.

第一実施形態のバイノーラル信号生成装置の例を示す機能ブロック図。The functional block diagram which shows the example of the binaural signal generator of 1st embodiment. 第一実施形態のバイノーラル信号生成方法の例を示す流れ図。The flowchart which shows the example of the binaural signal generation method of 1st embodiment. 座標系を説明するための図。The figure for demonstrating a coordinate system. 第一実施形態のバイノーラル信号生成装置の例を示す機能ブロック図。The functional block diagram which shows the example of the binaural signal generator of 1st embodiment. 第一実施形態のバイノーラル信号生成方法の例を示す流れ図。The flowchart which shows the example of the binaural signal generation method of 1st embodiment.

以下、図面を参照してこの発明の実施形態を説明する。以下の説明において、テキスト中で使用する記号「~」「-」「^」等は、本来直前の文字の真上に記載されるべきものであるが、テキスト記法の制限により、当該文字の直後に記載する。式中においてはこれらの記号は本来の位置に記述している。また、ベクトルや行列の各要素単位で行われる処理は、特に断りが無い限り、そのベクトルやその行列の全ての要素に対して適用されるものとする。 Embodiments of the present invention will be described below with reference to the drawings. In the following explanation, the symbols “~”, “ - ”, “^”, etc. used in the text should be written directly above the previous character, but immediately after the character due to restrictions on the text notation. It describes. In the formula, these symbols are written in their original positions. Further, the processing performed for each element of a vector or matrix is applied to all elements of the vector or matrix unless otherwise specified.

[第一実施形態]
第一実施形態は、2次元に配置された円状マイクロホンアレーで収音した信号に基づいてバイノーラル信号を生成するバイノーラル信号生成装置及び方法に関する。まず、第一実施形態の技術的背景について説明する。
[First embodiment]
The first embodiment relates to a binaural signal generation apparatus and method for generating a binaural signal based on signals collected by a two-dimensionally arranged circular microphone array. First, the technical background of the first embodiment will be described.

<技術的背景>
半径Rsの円周上に3個以上のスピーカから構成される円状スピーカアレーを配置し、その円の中心に頭部が存在することを仮定する。スピーカ位置は円筒座標系(図3を参照のこと)でrs=(Rss,0)と書く。左耳および右耳の位置をそれぞれrL=(RLL,0),rR=(RRR,0)とし、時間周波数領域のHRTFをGL(rL-rs),GR(rR-rs)と書く。GL(rL-rs)とGR(rR-rs)は事前に測定し、既知であるとする。HRTFの測定は、スピーカアレーを用いてする必要は必ずしもなく、各方向から別々にHRTFを測定してもよい。なお、頭部形状をモデル化し、HRTFをシミュレーションして求めても構わない。以降、左耳の時間周波数領域信号PL(rL)についてのみ議論するが、右耳に関しても全く同じ議論が成り立つ。
<Technical background>
It is assumed that a circular speaker array composed of three or more speakers is arranged on the circumference of the radius R s and the head exists at the center of the circle. The speaker position is written as r s = (R s , φ s , 0) in a cylindrical coordinate system (see FIG. 3). The positions of the left and right ears are r L = (R L , φ L , 0) and r R = (R R , φ R , 0), respectively, and the HRTF in the time-frequency domain is set to G L (r L −r s ), G R (r R -r s ). G L (r L -r s ) and G R (r R -r s ) are measured in advance and are assumed to be known. It is not always necessary to measure the HRTF using a speaker array, and the HRTF may be measured separately from each direction. The head shape may be modeled and the HRTF may be obtained by simulation. Hereinafter, only the time frequency domain signal P L (r L ) of the left ear will be discussed, but the same argument holds for the right ear.

各スピーカ位置からの伝達関数に対して、信号D(rs)を畳み込むことで、左耳信号PL(rL)を合成することを考えると、PL(rL)は以下のように書ける。 Considering the synthesis of the left ear signal P L (r L ) by convolving the signal D (r s ) with the transfer function from each speaker position, P L (r L ) is I can write.

Figure 0006592838
Figure 0006592838

ここで、「~」を付けた変数は円筒調和関数領域表現であることを表し、mは円筒調和関数領域表現における次数である。また、jは虚数であり、eはネイピア数であり、πは円周率である。   Here, a variable with “˜” represents that the cylindrical harmonic function region is expressed, and m is an order in the cylindrical harmonic function region. Further, j is an imaginary number, e is a Napier number, and π is a circular ratio.

Figure 0006592838
Figure 0006592838

さて、D(・)は所望の音場Pdes(r)を合成するための駆動信号であればよい。 Now, D (•) may be a drive signal for synthesizing a desired sound field P des (r).

r=(r,φ,0)を半径Rsの円の内部領域における任意の位置とし、頭部がない状態で円周上のスピーカを用いて合成される音場をPsyn(r)とする。このとき、 Let r = (r, φ, 0) be an arbitrary position in the inner region of the circle with radius R s , and let P syn (r) be the sound field synthesized using a speaker on the circumference without a head. To do. At this time,

Figure 0006592838
Figure 0006592838

となる。ここで、G(r-rs)は各スピーカの伝達特性を表し、測定もしくは物理現象をモデル化(線音源としてモデル化した例を後述する。)することで得られる。なお、従来はHRTFを求める時点でスピーカ方向からの平面波伝搬を仮定して信号変換を定式化していたのに対し、ここででは点音源からの球面波伝搬を仮定して以下の定式化を行う。 It becomes. Here, G (rr s ) represents the transfer characteristic of each speaker, and is obtained by modeling a measurement or physical phenomenon (an example of modeling as a line sound source will be described later). In the past, signal conversion was formulated assuming plane wave propagation from the speaker direction at the time of obtaining HRTF, but here the following formulation is performed assuming spherical wave propagation from a point source. .

収音側では所望音場の円筒調和スペクトル~Pdes(r,m)=-Pdes(m)Jm(kr)が推定されているものとする。これはシミュレーションによって合成しても構わない。ここで、kは波数、Jmはm次のベッセル関数である。また、-Pdes(m)は所望音場の円筒調和関数展開の係数である。Psyn(r)とPdes(r) とが一致すればよいことから、 It is assumed that a cylindrical harmonic spectrum ~ P des (r, m) = P des (m) J m (kr) of the desired sound field is estimated on the sound collection side. This may be synthesized by simulation. Here, k is the wave number, and J m is the mth order Bessel function. Also, - P des (m) are the coefficients of the cylindrical harmonic expansion of the desired sound field. Since P syn (r) and P des (r) need to match,

Figure 0006592838
Figure 0006592838

となる。~G(r-Rs,m)を半径Rrefの円周上で測定することで取得する場合、 It becomes. When acquiring ~ G (rR s , m) on the circumference of radius R ref

Figure 0006592838
Figure 0006592838

となる。
したがって、式(1)に式(2)を代入することで、バイノーラル信号が得られる。
It becomes.
Therefore, a binaural signal can be obtained by substituting Equation (2) into Equation (1).

Figure 0006592838
Figure 0006592838

所望音場の円筒調和スペクトル~Pdes(r,m)=Pdes(m)Jm(kr)はいくつかの推定方法があるが、ここでは半径Rmの円筒形状の剛体のバッフル上に配置された円状マイクロホンアレーを用いることを考える。円状マイクロホンアレーは、3個以上のマイクロホンから構成される。ここで、バッフルは、マイクロホンやスピーカを取り付けるものを意味する。バッフルそのものの存在が、収音または再生の際の音の伝達関数に影響する。また、バッフルが剛体であるか吸音体であるかによって、所望音場の円筒調和スペクトルと観測信号の円筒調和スペクトルの関係式にも影響する。 Cylindrical harmonic spectrum of the desired sound field ~ P des (r, m) = P des (m) J m (kr) has several estimation methods, but here on a cylindrical rigid body baffle with radius R m Consider using an array of circular microphones. The circular microphone array is composed of three or more microphones. Here, a baffle means what attaches a microphone and a speaker. The presence of the baffle itself affects the sound transfer function during sound collection or playback. Further, depending on whether the baffle is a rigid body or a sound absorber, the relational expression between the cylindrical harmonic spectrum of the desired sound field and the cylindrical harmonic spectrum of the observation signal is also affected.

マイクロホンアレーによる観測信号の円筒調和スペクトルを~Prcv(Rm,m)とすれば、~Pdes(r,m)は以下のようになる。 Assuming that the cylindrical harmonic spectrum of the observation signal from the microphone array is ~ P rcv (R m , m), ~ P des (r, m) is as follows.

Figure 0006592838
Figure 0006592838

ここで、Hm (1)′はm次の第一種ハンケル関数Hm (1)の微分である。もう一つの例として、半径Rmの球状の剛体のバッフル上の半径Rmの円状マイクロホンアレーを用いることを考える。マイクロホンアレーによる観測信号の円筒調和スペクトルを~Prcv(Rm,m)とすれば、~Pdes(r,m)は以下のようになる。 Here, H m (1) ′ is a derivative of the m-th order first-class Hankel function H m (1) . As another example, consider the use of a circular microphone array of radius R m on the spherical rigid radius R m baffle. Assuming that the cylindrical harmonic spectrum of the observation signal from the microphone array is ~ P rcv (R m , m), ~ P des (r, m) is as follows.

Figure 0006592838
Figure 0006592838

なお、~Pdes(r,m)は、マイクロホンアレーの配置、バッフルの形状や性質(剛体、吸音体、空中に配置されているか等の性質)により、上記以外の式により定義されてもよい。 Note that ~ P des (r, m) may be defined by an expression other than the above, depending on the arrangement of the microphone array and the shape and properties of the baffle (properties such as rigid bodies, sound absorbers, and arrangement in the air). .

ここで、Pn mはルジャンドル陪関数である。式(4)を式(3)に代入すれば、 Here, P n m is the associated Legendre functions. Substituting equation (4) into equation (3),

Figure 0006592838
Figure 0006592838

となる。この式により、円状マイクロホンアレー信号から、以下で定義される時間周波数領域のフィルタの時空間畳み込みによって、バイノーラル信号を合成できることになる。 It becomes. From this equation, a binaural signal can be synthesized from a circular microphone array signal by spatiotemporal convolution of a filter in the time-frequency domain defined below.

Figure 0006592838
Figure 0006592838

正確に言えば、畳み込みではFLの逆フーリエ変換で求まる時空間領域のフィルタを用いる。すなわち、FLの逆フーリエ変換で求まる時空間領域のフィルタを用いて、円状マイクロホンアレーの観測信号に対し時空間領域の時空間畳み込みを行うことによって、バイノーラル信号を生成することができる。 Rather, a filter in the spatial domain when the determined by inverse Fourier transform of F L is the convolution. That is, using the filter when space region obtained by inverse Fourier transform of F L, by performing a convolution space when spatiotemporal contrast observation signals of the circular microphone array, it is possible to generate a binaural signal.

なお、次数mの時空間周波数領域のフィルタ係数~FL(m)を The filter coefficient ~ F L (m) in the spatio-temporal frequency domain of order m

Figure 0006592838
Figure 0006592838

で定義すれば、バイノーラル信号は次数mの時空間周波数領域のフィルタ係数~FL(m)と円状マイクロホンアレー信号で以下のように表すこともできる。 In other words, the binaural signal can be expressed by the filter coefficient ~ F L (m) in the spatio-temporal frequency domain of order m and the circular microphone array signal as follows.

Figure 0006592838
Figure 0006592838

式(5)は測定によって得られた~Gを用いることを仮定したものだったが、ここでは線音源としてモデル化した場合について考える。   Equation (5) was assumed to use ~ G obtained by measurement, but here we consider the case of modeling as a line source.

Figure 0006592838
Figure 0006592838

であることより、 Than

Figure 0006592838
Figure 0006592838

となる。ただし、実際のスピーカは線音源よりは点音源に近い特性を持っていることより、補正項として(2πj/k)1/2を乗じることが必要である。 It becomes. However, since an actual speaker has characteristics closer to a point sound source than a line sound source, it is necessary to multiply (2πj / k) 1/2 as a correction term.

なお、聴者の頭部の移動に対する追従は,収録側の円状マイクロホンアレーで取得した円筒調和スペクトルに対する処理によって実現可能である。単純な回転に対しては、単純な位相シフトを適用すればよい。回転角をφrotとして、位相シフトを適用した円筒調和スペクトル~Prot(Rm,m)は、 The follow-up to the movement of the listener's head can be realized by processing the cylindrical harmonic spectrum acquired by the circular microphone array on the recording side. For simple rotation, a simple phase shift may be applied. Cylindrical harmonic spectrum ~ P rot (R m , m) using a phase shift with the rotation angle as φ rot is

Figure 0006592838
Figure 0006592838

となる。
円状マイクロホンアレーの中心とは異なる位置を原点とした円筒調和スペクトルを推定することも可能である。例えば、位置(Rtt)における円筒調和スペクトル-Ptransは、
It becomes.
It is also possible to estimate a cylindrical harmonic spectrum with the origin at a position different from the center of the circular microphone array. For example, a cylindrical conditioning spectrum at position (R t, φ t) - P trans is

Figure 0006592838
Figure 0006592838

として得られる。複数の位置における円筒調和スペクトルが取得可能な場合には、最小二乗法による推定が可能となる。 As obtained. When cylindrical harmonic spectra at a plurality of positions can be acquired, estimation by the least square method is possible.

式(A)又は式(B)のフィルタを用いて、以下の式のように空間方向の畳み込みを行うことによりバイノーラル信号を生成してもよい。空間方向の畳み込みによりバイノーラル信号を生成する場合には、円状スピーカアレーを構成するスピーカの数=円状マイクロホンアレーを構成するマイクロホンの数と同じにする必要があるところ、NLはそのスピーカの数=マイクロホンの数である。φiはφLに対応する方向である。 A binaural signal may be generated by performing convolution in the spatial direction using the filter of Expression (A) or Expression (B) as shown in the following expression. The convolution in the spatial direction when generating a binaural signal, where there is a need to be the same as the number of microphones constituting the number = circular microphone array speaker that constitutes a circular speaker array, N L is the speaker Number = number of microphones. φ i is a direction corresponding to φ L.

Figure 0006592838
Figure 0006592838

<バイノーラル信号生成装置及び方法>
第一実施形態のバイノーラル信号生成装置は、図1に示すように、フィルタリング部1、フィルタ生成部2を備えている。バイノーラル信号生成装置が、図2に示すステップS1の処理を実行することによりバイノーラル信号生成方法が実現される。
<Binaural signal generation apparatus and method>
The binaural signal generation device according to the first embodiment includes a filtering unit 1 and a filter generation unit 2 as shown in FIG. The binaural signal generation apparatus implements the binaural signal generation method by executing the process of step S1 shown in FIG.

フィルタリング部1には、円状に配置された円状スピーカアレーからの再生音に基づく複数の頭部伝達関数を考慮して所望音場と合成音場を一致させることで得られるフィルタが入力される。   The filtering unit 1 receives a filter obtained by matching a desired sound field and a synthesized sound field in consideration of a plurality of head-related transfer functions based on reproduced sounds from circular speaker arrays arranged in a circle. The

このフィルタは、式(A)又は式(B)により定義されるフィルタを逆フーリエ変換することにより得られるフィルタである。このフィルタは、フィルタリング部1の処理に先立ってフィルタ生成部2により予め生成される。   This filter is a filter obtained by performing an inverse Fourier transform on a filter defined by Expression (A) or Expression (B). This filter is generated in advance by the filter generation unit 2 prior to the processing of the filtering unit 1.

Figure 0006592838
Figure 0006592838

また、フィルタリング部1には、円状に配置された円状マイクロホンアレーによる観測信号が入力される。   In addition, an observation signal from a circular microphone array arranged in a circle is input to the filtering unit 1.

フィルタリング部1は、入力されたフィルタと入力された観測信号とを時空間方向に畳み込むことによりバイノーラル信号を生成する(ステップS1)。   The filtering unit 1 generates a binaural signal by convolving the input filter and the input observation signal in the space-time direction (step S1).

上記のフィルタリング部1の処理は、一例に過ぎない。フィルタリング部1は、<技術的背景>の欄で説明した他のフィルタ処理や畳み込み処理によりバイノーラル信号を生成してもよい。   The processing of the filtering unit 1 is only an example. The filtering unit 1 may generate a binaural signal by the other filter processing or convolution processing described in the section <Technical background>.

すなわち、例えば、フィルタリング部1は、上記フィルタFLに代えて、FLの逆フーリエ変換で求まるフィルタを用いてフィルタリング処理を行ってもよい。 That is, for example, the filtering unit 1, instead of the filter F L, may be performed filtering processing using the filter which is obtained by inverse Fourier transform of F L.

また、例えば、フィルタリング部1は、~Prcv(Rm,m)を上記観測信号の円筒調和スペクトルとして、聴者がφrotだけ向きを変えた場合には、上記観測信号に代えて式(C)により定義される~Prcv(Rm,m)と上記フィルタを畳み込み、 Further, for example, when the listener changes the direction by φ rot using ~ P rcv (R m , m) as the cylindrical harmonic spectrum of the observed signal, the filtering unit 1 replaces the observed signal with the formula (C ) ~ P rcv (R m , m) defined by

Figure 0006592838
Figure 0006592838

聴者が位置(Rtt)に移動した場合には、上記観測信号に代えて式(D)により定義される-Ptrans(Rm,m)と上記フィルタとを畳み込んでもよい。 If the listener moves to the position (R t, φ t), instead of the the observed signal is defined by the formula (D) - P trans (R m, m) and may convolving the above filter.

Figure 0006592838
Figure 0006592838

このように、複数の頭部伝達関数を考慮することより、精度の高いバイノーラル信号を生成することができる。   Thus, by considering a plurality of head related transfer functions, a highly accurate binaural signal can be generated.

[第二実施形態]
第二実施形態は、3次元に配置された球状マイクロホンアレーで収音した信号に基づいてバイノーラル信号を生成するバイノーラル信号生成装置及び方法である。まず、第二実施形態の技術的背景について説明する。
[Second Embodiment]
The second embodiment is a binaural signal generation apparatus and method for generating a binaural signal based on signals collected by a spherical microphone array arranged three-dimensionally. First, the technical background of the second embodiment will be described.

<技術的背景>
半径Rsの球面上に3個以上のスピーカから構成される球状スピーカアレーを配置し、その中心に頭部が存在すると仮定する。スピーカ位置は球座標系でrs=(Rsss)と書く。左耳および右耳の位置をそれぞれrL=(RLLL),rR=(RRRR)とし、時間周波数領域のHRTFをGL(rL-rs),GR(rR-rs)と書く。GL(rL-rs)とGR(rR-rs)は事前に測定し、既知であるとする。HRTFの測定は、スピーカアレーを用いてする必要は必ずしもなく、各方向から別々にHRTFを測定してもよい。なお、頭部形状をモデル化し、HRTFをシミュレーションして求めても構わない。以降、左耳の時間周波数領域信号PL(rL)についてのみ議論するが、右耳に関しても全く同じ議論が成り立つ。
<Technical background>
It is assumed that a spherical speaker array composed of three or more speakers is arranged on a spherical surface with a radius R s and that a head exists at the center thereof. The speaker position is written as r s = (R s , θ s , φ s ) in a spherical coordinate system. The left and right ear positions are r L = (R L , θ L , φ L ) and r R = (R R , θ R , φ R ), respectively, and the HRTF in the time-frequency domain is set to G L (r L − r s ), G R (r R -r s ). G L (r L -r s ) and G R (r R -r s ) are measured in advance and are assumed to be known. It is not always necessary to measure the HRTF using a speaker array, and the HRTF may be measured separately from each direction. The head shape may be modeled and the HRTF may be obtained by simulation. Hereinafter, only the time frequency domain signal P L (r L ) of the left ear will be discussed, but the same argument holds for the right ear.

各スピーカ位置からの伝達関数に対して、信号D(rs)を畳み込むことで、左耳信号PL(rL)を合成することを考えると、PL(rL)は以下のように書ける。 Considering the synthesis of the left ear signal P L (r L ) by convolving the signal D (r s ) with the transfer function from each speaker position, P L (r L ) is I can write.

Figure 0006592838
Figure 0006592838

円状のアレーを用いる第一実施形態とは異なり、球状のアレーを用いる第二実施形態では、空間の畳み込みとしては記述できないことに注意する。   Note that, unlike the first embodiment using a circular array, the second embodiment using a spherical array cannot be described as a convolution of space.

さて、D(・)は所望の音場を合成するための駆動信号であればよい。r=(r,θ,φ)を内部領域における任意の位置とし、頭部がない状態で球面上のスピーカを用いて合成される音場をPsyn(r)とする。このとき、各スピーカの軸対称性を仮定すれば、η=(0,0,Rs)の北極位置をおいて、 Now, D (•) may be a drive signal for synthesizing a desired sound field. Let r = (r, θ, φ) be an arbitrary position in the inner region, and let P syn (r) be a sound field synthesized using a spherical speaker without a head. At this time, assuming the axial symmetry of each speaker, the north pole position of η = (0,0, R s )

Figure 0006592838
Figure 0006592838

となる。SO(3)は、3次の回転群(特殊直交群)である。ここで、G(r-rs)は各スピーカの伝達特性を表し、測定もしくはモデル化することで得られる。従来はHRTFを求める時点で音源からの平面波を仮定して信号変換を定式化していたのに対し、ここでは点音源からの球面波を仮定して以下の定式化を行う。Yn mは球面調和関数であり、nとmはその次数である。ここでは、「~」付きの変数は球面調和スペクトル領域を表すこととする。 It becomes. SO (3) is a third-order rotation group (special orthogonal group). Here, G (rr s ) represents the transfer characteristic of each speaker, and is obtained by measurement or modeling. In the past, signal conversion was formulated assuming a plane wave from a sound source at the time of obtaining HRTF, but here the following formulation is performed assuming a spherical wave from a point sound source. Y n m is a spherical harmonic function, and n and m are their orders. Here, the variable with “˜” represents the spherical harmonic spectrum region.

収音側では所望音場の球面調和スペクトル~Pdes(r,n,m)=-Pdes(n,m)jn(kr)が推定されているものとする。これは、シミュレーションによって合成しても構わない。Psyn(r)とPdes(r)とが一致すればよいことから、 It is assumed that the spherical harmonic spectrum ~ P des (r, n, m) = P des (n, m) j n (kr) of the desired sound field is estimated on the sound collection side. This may be synthesized by simulation. Since P syn (r) and P des (r) should match,

Figure 0006592838
Figure 0006592838

となる。jnはn次の第一種球ベッセル関数である。~G(r-Rs,n,0)を半径Rrefの球面上で測定することで取得する場合、 It becomes. j n is an nth-order first-order spherical Bessel function. When obtaining ~ G (rR s , n, 0) on a sphere with radius R ref

Figure 0006592838
Figure 0006592838

となる。
したがって、式(6)に式(7)を代入することで、バイノーラル信号が得られる。
It becomes.
Therefore, a binaural signal can be obtained by substituting Equation (7) into Equation (6).

Figure 0006592838
Figure 0006592838

所望音場の球面調和スペクトル~Pdes(r,n,m)=-Pdes(n,m)jn(kr)はいくつかの推定方法があるが、ここでは、半径Rmの球バッフル上に配置された球状マイクロホンアレーを用いることを考える。球状マイクロホンアレーは、3個以上のマイクロホンから構成される。 Desired sound field of spherical harmonic spectrum ~ P des (r, n, m) = - P des (n, m) j n (kr) is a number of estimation methods, here, the radius R m sphere baffle Consider using a spherical microphone array placed above. The spherical microphone array is composed of three or more microphones.

ここで、バッフルは、マイクロホンやスピーカを取り付けるものを意味する。バッフルそのものの存在が、収音または再生の際の音の伝達関数に影響する。また、バッフルが剛体であるか吸音体であるかによって、球面調和スペクトルと観測信号の球面調和スペクトルの関係式に影響する。   Here, a baffle means what attaches a microphone and a speaker. The presence of the baffle itself affects the sound transfer function during sound collection or playback. Further, depending on whether the baffle is a rigid body or a sound absorber, the relational expression between the spherical harmonic spectrum and the spherical harmonic spectrum of the observation signal is affected.

マイクロホンアレーによる観測信号の球面調和スペクトルを~Prcv(Rm,n,m)とすれば、~Pdes(r,n,m)は以下のようになる。hn (1)'は、n次の第一種ハンケル関数hn (1)の微分を意味する。 Assuming that the spherical harmonic spectrum of the observation signal from the microphone array is ~ P rcv (R m , n, m), ~ P des (r, n, m) is as follows. h n (1) ′ means a derivative of the n- th order first-class Hankel function h n (1) .

Figure 0006592838
Figure 0006592838

この式(8)に代入すれば、   Substituting into this equation (8),

Figure 0006592838
Figure 0006592838

となる。SはHRTFの測定に用いた球状スピーカアレーを構成するスピーカの集合である。円状アレーの場合と異なり、単一のフィルタ畳み込みでの信号変換はできないが、マイクロホンアレーの信号に対して以下の式(E)のフィルタを適用後、各HRTFとの畳み込みを、HRTFの測定に用いたスピーカの数の分だけ足しあわせた信号をバイノーラル信号とすれば良い。 It becomes. S is a set of speakers constituting the spherical speaker array used for HRTF measurement. Unlike a circular array, signal conversion with a single filter convolution is not possible, but after applying the filter of the following equation (E) to the microphone array signal, convolution with each HRTF is measured for HRTF. The binaural signal may be a signal obtained by adding the number of speakers used in the above.

すなわち、式(E)のフィルタと球状に配置された球状マイクロホンアレーによる観測信号とを時空間畳み込みすることにより信号を得て、得られた信号の球状スピーカアレーの各スピーカ位置に対応する時間信号と、球状スピーカアレーからの再生音に基づく複数の頭部伝達関数の球状スピーカアレーの各スピーカ位置に対応する時間信号とを時間方向に畳み込みしたものを球状スピーカアレーを構成するスピーカの数の分だけ足し合わせることにより時間領域のバイノーラル信号を生成する。   That is, a time signal corresponding to each speaker position of the spherical speaker array of the obtained signal is obtained by space-time convolution of the filter of equation (E) and the observation signal from the spherical microphone array arranged in a spherical shape. And the time signal corresponding to each speaker position of the spherical speaker array of a plurality of head-related transfer functions based on the reproduced sound from the spherical speaker array is the number of speakers constituting the spherical speaker array The binaural signal in the time domain is generated by adding together.

Figure 0006592838
Figure 0006592838

なお、次数n,mのフィルタ係数~FL(rs,n,m)を The filter coefficient ~ F L (r s , n, m) of order n, m

Figure 0006592838
Figure 0006592838

で定義すれば、バイノーラル信号は次数n,mのフィルタ係数と円状マイクロホンアレー信号で以下のように表される。 , The binaural signal is expressed as follows using a filter coefficient of order n and m and a circular microphone array signal.

Figure 0006592838
Figure 0006592838

式(F)は測定によって得られた~Gを用いることを仮定したものだったが、ここでは、点音源としてモデル化した場合について考える。   Equation (F) was assumed to use ~ G obtained by measurement, but here, consider the case of modeling as a point sound source.

Figure 0006592838
Figure 0006592838

であることより、 Than

Figure 0006592838
Figure 0006592838

となる。この式(F)のフィルタを式(E)のフィルタの代わりに用いてもよい。 It becomes. The filter of the formula (F) may be used instead of the filter of the formula (E).

<バイノーラル信号生成装置及び方法>
第二実施形態のバイノーラル信号生成装置は、図4に示すように、フィルタリング部1、フィルタ生成部2を備えている。バイノーラル信号生成装置が、図5に示す各ステップの処理を実行することによりバイノーラル信号生成方法が実現される。
<Binaural signal generation apparatus and method>
The binaural signal generation device of the second embodiment includes a filtering unit 1 and a filter generation unit 2 as shown in FIG. The binaural signal generation apparatus implements the binaural signal generation method by executing the process of each step shown in FIG.

フィルタリング部1には、球状に配置された球状スピーカアレーを考慮して所望音場と合成音場を一致させることで得られるフィルタが入力される。   The filtering unit 1 receives a filter obtained by matching a desired sound field and a synthesized sound field in consideration of a spherical speaker array arranged in a spherical shape.

このフィルタは、式(E)又は式(F)により定義されるフィルタである。このフィルタは、フィルタリング部1の処理に先立ってフィルタ生成部2により予め生成される。   This filter is a filter defined by Expression (E) or Expression (F). This filter is generated in advance by the filter generation unit 2 prior to the processing of the filtering unit 1.

Figure 0006592838
Figure 0006592838

また、フィルタリング部1には、球状に配置された円状マイクロホンアレーによる観測信号が入力される。   In addition, an observation signal from a circular microphone array arranged in a spherical shape is input to the filtering unit 1.

フィルタリング部1は、入力されたフィルタと入力された観測信号とを時空間畳み込みすることにより信号を得る。得られた信号は、信号生成部3に出力される。   The filtering unit 1 obtains a signal by performing space-time convolution of the input filter and the input observation signal. The obtained signal is output to the signal generator 3.

信号生成部3は、フィルタリング部1により得られた信号のHRTFを得るために用いた球状スピーカアレーの各スピーカ位置に対応する時間信号と、球状スピーカアレーからの再生音に基づく複数の頭部伝達関数の球状スピーカアレーの各スピーカ位置に対応する時間信号とを時間方向に畳み込みしたものを球状スピーカアレーを構成するスピーカの数の分だけ足し合わせることにより時間領域のバイノーラル信号を生成する。   The signal generation unit 3 transmits a plurality of head signals based on the time signal corresponding to each speaker position of the spherical speaker array used to obtain the HRTF of the signal obtained by the filtering unit 1 and the reproduced sound from the spherical speaker array. A binaural signal in the time domain is generated by adding up the time signal corresponding to each speaker position of the spherical speaker array of the function in the time direction and adding the result by the number of speakers constituting the spherical speaker array.

上記のフィルタリング部1の処理は、一例に過ぎない。フィルタリング部1は、<技術的背景>の欄で説明した他のフィルタ処理や畳み込み処理によりバイノーラル信号を生成してもよい。   The processing of the filtering unit 1 is only an example. The filtering unit 1 may generate a binaural signal by the other filter processing or convolution processing described in the section <Technical background>.

すなわち、例えば、フィルタリング部1は、~Prcv(Rm,m)を上記観測信号の球面調和スペクトルとして、式(9)により定義される処理を行うことによりバイノーラル信号を生成してもよい。 That is, for example, the filtering unit 1 may generate a binaural signal by performing the process defined by Equation (9) using ~ P rcv (R m , m) as the spherical harmonic spectrum of the observed signal.

このように、複数の頭部伝達関数を考慮することより、精度の高いバイノーラル信号を生成することができる。   Thus, by considering a plurality of head related transfer functions, a highly accurate binaural signal can be generated.

[関数]
上記の説明で用いた各関数について説明する。
[function]
Each function used in the above description will be described.

・を任意の実数として、n次の第一種ハンケル関数Hn (1)(・)及びn次のベッセル関数Jn(・)は、以下のように定義される。Γ(z)はガンマ関数であり、Yn(z)はノイマン関数である。 N is the first real Hankel function H n (1) (•) and n-order Bessel function J n (•) are defined as follows. Γ (z) is a gamma function, and Y n (z) is a Neumann function.

Figure 0006592838
Figure 0006592838

n次の第一種球ハンケル関数h(1) n(・)及びn次の球ベッセル関数jn(・)は、以下のように定義される。 The nth-order first-type sphere Hankel function h (1) n (•) and the nth-order sphere Bessel function j n (•) are defined as follows.

Figure 0006592838
Figure 0006592838

ルジャンドル陪関数Pm n(・)であり、以下のように定義される。Pn(・)はルジャンドル多項式を表す。 Legendre 陪 function P m n (•), defined as follows: P n (·) represents a Legendre polynomial.

Figure 0006592838
Figure 0006592838

球面調和関数Yn mは下記式により定義される。 The spherical harmonic function Y n m is defined by the following equation.

Figure 0006592838
Figure 0006592838

[変形例]
上記の時間周波数領域又は時空間周波数領域でのフィルタリング処理は、時空間領域で行ってもよい。すなわち、上記フィルタリング処理を、時間方向の畳み込みと空間方向の畳み込みでフィルタリングによりを行ってもよい。
[Modification]
The filtering process in the temporal frequency domain or the spatiotemporal frequency domain may be performed in the spatiotemporal domain. In other words, the filtering process may be performed by filtering using a temporal convolution and a spatial convolution.

バイノーラル信号生成装置は、コンピュータによって実現することができる。この場合、この装置の各部の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、この装置における各部がコンピュータ上で実現される。   The binaural signal generation device can be realized by a computer. In this case, the processing content of each part of this apparatus is described by a program. Then, by executing this program on a computer, each unit in this apparatus is realized on the computer.

この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、これらの装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。   The program describing the processing contents can be recorded on a computer-readable recording medium. In this embodiment, these apparatuses are configured by executing a predetermined program on a computer. However, at least a part of these processing contents may be realized by hardware.

この発明は、上述の実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。   The present invention is not limited to the above-described embodiment, and can be modified as appropriate without departing from the spirit of the present invention.

1 フィルタリング部
2 フィルタ生成部
3 信号生成部
1 Filtering Unit 2 Filter Generation Unit 3 Signal Generation Unit

Claims (6)

円状に配置された円状スピーカアレーからの再生音に基づく複数の頭部伝達関数を考慮して所望音場と合成音場を一致させることで得られるフィルタと、円状に配置された円状マイクロホンアレーによる観測信号とを時空間方向に畳み込むことによりバイノーラル信号を生成するフィルタリング部を含み、
jを虚数とし、kを波数とし、Jmをm次のベッセル関数とし、Hm (1)'をm次の第一種ハンケル関数Hm (1)の微分とし、聴者の何れか一方の耳の円筒座標系における位置を(RLL,0)とし、~GLを円筒調和関数領域表現された頭部伝達関数とし、~Gを各スピーカの円筒調和関数領域表現された伝達関数とし、~Gは半径Rrefの円周上で測定されるとし、Rmを上記円状マイクロホンアレーの半径とし、Rsを上記円状スピーカアレーの半径として、
上記フィルタは、以下の式(A)又は式(B)により定義されるFLを逆フーリエ変換することにより得られるフィルタである、
Figure 0006592838
バイノーラル信号生成装置。
A filter obtained by matching a desired sound field and a synthesized sound field in consideration of a plurality of head related transfer functions based on reproduced sound from a circular speaker array arranged in a circle, and a circle arranged in a circle Including a filtering unit that generates a binaural signal by convolving the observation signals from the cylindrical microphone array in a spatio-temporal direction,
j is an imaginary number, k is a wave number, J m is an m-order Bessel function, H m (1) 'is a derivative of the m-th order first-class Hankel function H m (1) , and one of the listeners The position of the ear in the cylindrical coordinate system is (R L , φ L , 0), ~ G L is the head related transfer function expressed in the cylindrical harmonic function area, and ~ G is the transfer expressed in the cylindrical harmonic function area of each speaker Where ~ G is measured on the circumference of radius R ref , R m is the radius of the circular microphone array, R s is the radius of the circular speaker array,
The filter is a filter obtained by inverse Fourier transform of F L which is defined by the following formula (A) or Formula (B),
Figure 0006592838
Binaural signal generator.
請求項1のバイノーラル信号生成装置において、
~Prcv(Rm,m)を上記観測信号の円筒調和スペクトルとして、
上記聴者がφrotだけ向きを変えた場合には、上記フィルタリング部は、上記観測信号に代えて以下の式(C)により定義される~Prot (Rm,m)と上記フィルタを畳み込み、
Figure 0006592838
上記聴者が位置(Rtt)に移動した場合には、上記フィルタリング部は、上記観測信号に代えて以下の式(D)により定義される-Ptrans(Rm,m)と上記フィルタとを畳み込む、
Figure 0006592838
バイノーラル信号生成装置。
The binaural signal generation device according to claim 1,
~ P rcv (R m , m) as the cylindrical harmonic spectrum of the observed signal
When the listener changes the direction by φ rot , the filtering unit convolves ~ P r ot (R m , m) defined by the following equation (C) with the filter instead of the observed signal. ,
Figure 0006592838
If the above listener moves to the position (R t, φ t), said filtering unit is defined by the formula (D) below in place of the observed signal - P trans (R m, m ) and the Convolve with filter,
Figure 0006592838
Binaural signal generator.
球状に配置された球状スピーカアレーを考慮して所望音場と合成音場を一致させることで得られるフィルタと球状に配置された球状マイクロホンアレーによる観測信号とを時空間畳み込みすることにより信号を得るフィルタリング部と、
上記得られた信号の上記球状スピーカアレーの各スピーカ位置に対応する時間信号と、上記球状スピーカアレーからの再生音に基づく複数の頭部伝達関数の上記球状スピーカアレーの各スピーカ位置に対応する時間信号とを時間方向に畳み込みしたものを上記球状スピーカアレーを構成するスピーカの数の分だけ足し合わせることにより時間領域のバイノーラル信号を生成する信号生成部と、
を含み、
jを虚数とし、kを波数とし、n,mを球面調和関数Y n m の次数とし、上記球状スピーカアレーの球座標系における位置r s をr s =(R s s s )とし、h n (1)'をn次の第一種球ハンケル関数h n (1)の微分とし、~Gを球状スピーカアレーを構成するスピーカの円筒調和関数領域表現された伝達関数とし、~Gは半径Rrefの円周上で測定されるとし、Rmを上記球状マイクロホンアレーの半径とし、Rsを上記球状スピーカアレーの半径として、
上記フィルタは、以下の式(E)又は式(F)により定義されるFLである、
Figure 0006592838
バイノーラル信号生成装置。
A signal is obtained by convolving the filter obtained by matching the desired sound field with the synthesized sound field in consideration of the spherical speaker array arranged in a spherical shape and the observation signal from the spherical microphone array arranged in a spherical shape. A filtering unit;
A time signal corresponding to each speaker position of the spherical speaker array of the obtained signal and a time corresponding to each speaker position of the spherical speaker array of a plurality of head-related transfer functions based on reproduced sound from the spherical speaker array A signal generation unit that generates a binaural signal in the time domain by adding the convolution of the signal in the time direction by the number of speakers constituting the spherical speaker array;
Including
j is an imaginary number, k is a wave number, n and m are the orders of the spherical harmonic function Y n m , and the position r s of the spherical speaker array in the spherical coordinate system is represented by r s = (R s , θ s , φ s ) , H n (1) 'is the derivative of the nth- order first-class spherical Hankel function h n (1) , ~ G is the transfer function expressed in the cylindrical harmonic function region of the speaker constituting the spherical speaker array, and ~ G is measured on the circumference of radius R ref , R m is the radius of the spherical microphone array, R s is the radius of the spherical speaker array,
The filter is F L which is defined by the following formula (E) or Formula (F),
Figure 0006592838
Binaural signal generator.
フィルタリング部が、円状に配置された円状スピーカアレーからの再生音に基づく複数の頭部伝達関数を考慮して所望音場と合成音場を一致させることで得られるフィルタと、円状に配置された円状マイクロホンアレーによる観測信号とを時空間方向に畳み込むことによりバイノーラル信号を生成するフィルタリングステップを含み、jを虚数とし、kを波数とし、Jmをm次のベッセル関数とし、Hm (1)'をm次の第一種ハンケル関数Hm (1)の微分とし、聴者の何れか一方の耳の円筒座標系における位置を(RLL,0)とし、~GLを円筒調和関数領域表現された頭部伝達関数とし、~Gを各スピーカの円筒調和関数領域表現された伝達関数とし、~Gは半径Rrefの円周上で測定されるとし、Rmを上記円状マイクロホンアレーの半径とし、Rsを上記円状スピーカアレーの半径として、
上記フィルタは、以下の式(A)又は式(B)により定義されるFLを逆フーリエ変換することにより得られるフィルタである、
Figure 0006592838
バイノーラル信号生成方法。
A filter obtained by matching a desired sound field and a synthesized sound field in consideration of a plurality of head-related transfer functions based on reproduced sound from circular speaker arrays arranged in a circular shape, and a circular shape; It includes a filtering step that generates a binaural signal by convolving the observation signals from the arranged circular microphone array in the spatio-temporal direction, where j is an imaginary number, k is a wave number, J m is an m-th order Bessel function, and H m and (1) 'the derivative of m-th order first kind Hankel function H m (1), and the position in the cylindrical coordinate system of one of the ears of the listener and (R L, φ L, 0 ), ~ G Let L be the head-related transfer function expressed in the cylindrical harmonic function area, ~ G be the transfer function expressed in the cylindrical harmonic function area of each speaker, ~ G be measured on the circumference of the radius R ref , R m was the radius of the circular microphone array, the circular Supikaa the R s As the radius of the over,
The filter is a filter obtained by inverse Fourier transform of F L which is defined by the following formula (A) or Formula (B),
Figure 0006592838
Binaural signal generation method.
フィルタリング部が、球状に配置された球状スピーカアレーを考慮して所望音場と合成音場を一致させることで得られるフィルタと球状に配置された球状マイクロホンアレーによる観測信号とを時空間畳み込みすることにより信号を得るフィルタリングステップと、
信号生成部が、上記得られた信号の上記球状スピーカアレーの各スピーカ位置に対応する時間信号と、上記球状に配置された球状スピーカアレーからの再生音に基づく複数の頭部伝達関数の上記球状スピーカアレーの各スピーカ位置に対応する時間信号とを時間方向に畳み込みしたものを上記球状スピーカアレーを構成するスピーカの数の分だけ足し合わせることにより時間領域のバイノーラル信号を生成する信号生成ステップと、
を含み、jを虚数とし、kを波数とし、n,mを球面調和関数Y n m の次数とし、上記球状スピーカアレーの球座標系における位置r s をr s =(R s s s )とし、h n (1)'をn次の第一種球ハンケル関数h n (1)の微分とし、~Gを球状スピーカアレーを構成するスピーカの円筒調和関数領域表現された伝達関数とし、~Gは半径Rrefの円周上で測定されるとし、Rmを上記球状マイクロホンアレーの半径とし、Rsを上記球状スピーカアレーの半径として、
上記フィルタは、以下の式(E)又は式(F)により定義されるFLである、
Figure 0006592838
バイノーラル信号生成方法。
Filtering space-time convolves the filter obtained by matching the desired sound field with the synthesized sound field in consideration of the spherical speaker array arranged in a spherical shape and the observation signal from the spherical microphone array arranged in a spherical shape. A filtering step to obtain a signal by
The signal generation unit includes the spherical signals of a plurality of head-related transfer functions based on time signals corresponding to the respective speaker positions of the spherical speaker array of the obtained signals and reproduced sounds from the spherical speaker arrays arranged in the spherical shape. A signal generation step of generating a binaural signal in the time domain by adding the time signal corresponding to each speaker position of the speaker array in the time direction and adding the amount corresponding to the number of speakers constituting the spherical speaker array;
Where j is an imaginary number, k is a wave number, n, m is the order of the spherical harmonic function Y n m , and the position r s of the spherical speaker array in the spherical coordinate system is expressed as r s = (R s , θ s , φ s ), h n (1) 'is the derivative of the nth- order first-class spherical Hankel function h n (1) , and ~ G is the transfer function expressed in the cylindrical harmonic function region of the speaker constituting the spherical speaker array And ~ G is measured on the circumference of radius R ref , R m is the radius of the spherical microphone array, and R s is the radius of the spherical speaker array,
The filter is F L which is defined by the following formula (E) or Formula (F),
Figure 0006592838
Binaural signal generation method.
請求項1から3の何れかに記載されたバイノーラル信号生成装置の各部としてコンピュータを機能させるためのプログラム。   A program for causing a computer to function as each unit of the binaural signal generation device according to any one of claims 1 to 3.
JP2015168545A 2015-08-28 2015-08-28 Binaural signal generation apparatus, method, and program Active JP6592838B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015168545A JP6592838B2 (en) 2015-08-28 2015-08-28 Binaural signal generation apparatus, method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015168545A JP6592838B2 (en) 2015-08-28 2015-08-28 Binaural signal generation apparatus, method, and program

Publications (2)

Publication Number Publication Date
JP2017046256A JP2017046256A (en) 2017-03-02
JP6592838B2 true JP6592838B2 (en) 2019-10-23

Family

ID=58212320

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015168545A Active JP6592838B2 (en) 2015-08-28 2015-08-28 Binaural signal generation apparatus, method, and program

Country Status (1)

Country Link
JP (1) JP6592838B2 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR3070103B1 (en) * 2017-08-10 2019-09-06 Antoine-Victor HURTADO-HUYSSEN SPATIALIZED SOUND RESTITUTION METHODS
CN112911462B (en) * 2021-01-13 2023-05-26 西北工业大学 Annular loudspeaker array directivity sound radiation design method

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7333622B2 (en) * 2002-10-18 2008-02-19 The Regents Of The University Of California Dynamic binaural sound capture and reproduction
JP2005333211A (en) * 2004-05-18 2005-12-02 Sony Corp Sound recording method, sound recording and reproducing method, sound recording apparatus, and sound reproducing apparatus
US9641951B2 (en) * 2011-08-10 2017-05-02 The Johns Hopkins University System and method for fast binaural rendering of complex acoustic scenes

Also Published As

Publication number Publication date
JP2017046256A (en) 2017-03-02

Similar Documents

Publication Publication Date Title
JP5773540B2 (en) Reconstructing the recorded sound field
WO2018008395A1 (en) Acoustic field formation device, method, and program
JP6485711B2 (en) Sound field reproduction apparatus and method, and program
WO2015076149A1 (en) Sound field re-creation device, method, and program
JP5734329B2 (en) Sound field recording / reproducing apparatus, method, and program
JP6834985B2 (en) Speech processing equipment and methods, and programs
JP6592838B2 (en) Binaural signal generation apparatus, method, and program
JP5986966B2 (en) Sound field recording / reproducing apparatus, method, and program
Salvador et al. Boundary matching filters for spherical microphone and loudspeaker arrays
JP6087760B2 (en) Sound field recording / reproducing apparatus, method, and program
JP5730921B2 (en) Sound field recording / reproducing apparatus, method, and program
Koyama Boundary integral approach to sound field transform and reproduction
JP5713964B2 (en) Sound field recording / reproducing apparatus, method, and program
JP5698279B2 (en) Sound field recording / reproducing apparatus, method, and program
Koyama et al. Sound field reproduction with weighted mode matching and infinite-dimensional harmonic analysis: An experimental evaluation
JP2021013063A (en) Audio signal processing device, audio signal processing method and audio signal processing program
WO2018211984A1 (en) Speaker array and signal processor
JP5741866B2 (en) Sound field recording / reproducing apparatus, method, and program
JP5698278B2 (en) Sound field recording / reproducing apparatus, method, and program
JP5713988B2 (en) Sound field recording / reproducing apparatus, method, and program
JP5734327B2 (en) Sound field recording / reproducing apparatus, method, and program
JP2017191980A (en) Sound field information parameter group generation device, method and program
Arend et al. Efficient binaural rendering of spherical microphone array data by linear filtering
JP5734328B2 (en) Sound field recording / reproducing apparatus, method, and program
JP5749221B2 (en) Sound field recording / reproducing apparatus, method, and program

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20150828

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170523

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20170523

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180507

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180605

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180731

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190108

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190301

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190903

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190905

R150 Certificate of patent or registration of utility model

Ref document number: 6592838

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250