JP6087760B2 - Sound field recording / reproducing apparatus, method, and program - Google Patents

Sound field recording / reproducing apparatus, method, and program Download PDF

Info

Publication number
JP6087760B2
JP6087760B2 JP2013156922A JP2013156922A JP6087760B2 JP 6087760 B2 JP6087760 B2 JP 6087760B2 JP 2013156922 A JP2013156922 A JP 2013156922A JP 2013156922 A JP2013156922 A JP 2013156922A JP 6087760 B2 JP6087760 B2 JP 6087760B2
Authority
JP
Japan
Prior art keywords
signal
sound field
spatial frequency
frequency modulation
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013156922A
Other languages
Japanese (ja)
Other versions
JP2015027046A (en
Inventor
翔一 小山
翔一 小山
祐介 日和▲崎▼
祐介 日和▲崎▼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2013156922A priority Critical patent/JP6087760B2/en
Publication of JP2015027046A publication Critical patent/JP2015027046A/en
Application granted granted Critical
Publication of JP6087760B2 publication Critical patent/JP6087760B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
  • Stereophonic System (AREA)
  • Circuit For Audible Band Transducer (AREA)

Description

この発明は、ある音場に設置されたマイクロホンで音信号を収音し、その音信号を用いてスピーカでその音場を再現する波面合成法(Wave Field Synthesis)の技術、アンビソニックス(Ambisonics)の技術に関する。   The present invention relates to a wave field synthesis technique (Ambisonics) that collects a sound signal with a microphone installed in a certain sound field and reproduces the sound field with a speaker using the sound signal. Related to technology.

波面合成法及びアンビソニックスは、複数のマイクロホン及び複数のスピーカを用いて、遠隔地の音場を仮想的に再現する技術である。そのような技術として例えば非特許文献1に記載された技術が知られている。遠隔コミュニケーションシステムなどの応用では、リアルタイムの収音・再現が必要になるため、一般的なマイクロホンアレーで収音した音圧を、一般的なスピーカアレーで出力するための音場再現信号へと一意に変換可能であることが必要となる。   The wavefront synthesis method and ambisonics are technologies that virtually reproduce a sound field in a remote place using a plurality of microphones and a plurality of speakers. As such a technique, for example, a technique described in Non-Patent Document 1 is known. In applications such as remote communication systems, real-time sound collection and reproduction is required, so the sound pressure collected by a general microphone array is unique to a sound field reproduction signal for output by a general speaker array. It must be convertible to

小山,古家,日和崎,羽田,”音場収音・再現のための時空間周波数領域信号変換法,” 2011年9月, pp. 635-636.Oyama, Furuya, Hiwazaki, Haneda, “Spatio-temporal frequency domain signal conversion for sound field collection and reproduction,” September 2011, pp. 635-636.

非特許文献1に記載された技術では、音場を同じ位置又は前後左右に平行移動した位置で再現することはできたが、音場を所定の角度で回転して再現することはできなかった。   In the technique described in Non-Patent Document 1, the sound field could be reproduced at the same position or a position translated in the front / rear and left / right directions, but the sound field could not be reproduced by rotating it at a predetermined angle. .

この発明の目的は、音場を所定の角度で回転して再現することができる音場収音再生装置、方法及びプログラムを提供することである。   An object of the present invention is to provide a sound field collecting and reproducing apparatus, method, and program capable of reproducing a sound field by rotating it at a predetermined angle.

上記の課題を解決するために、この発明の一実施形態による音場収音再生装置は、2個以上のマイクロホンを含むマイクロホンアレーで収音された信号から生成された周波数領域信号が所定の回転角で空間周波数シフトされた信号である空間周波数変調信号を生成する空間周波数変調部を含み、空間周波数変調信号から再生信号を得る。   In order to solve the above-described problem, a sound field sound collecting / reproducing apparatus according to an embodiment of the present invention rotates a frequency domain signal generated from a signal collected by a microphone array including two or more microphones with a predetermined rotation. It includes a spatial frequency modulation section that generates a spatial frequency modulation signal that is a signal that is spatially shifted by an angle, and obtains a reproduction signal from the spatial frequency modulation signal.

音場を所定の角度で回転して再現することができる。   The sound field can be reproduced by rotating it at a predetermined angle.

第一実施形態の音場収音再生装置の例を示す機能ブロック図。The functional block diagram which shows the example of the sound field sound collection reproducing | regenerating apparatus of 1st embodiment. 第一実施形態のマイクロホン及びスピーカの配置の例を説明するための図。The figure for demonstrating the example of arrangement | positioning of the microphone and speaker of 1st embodiment. 第二実施形態の音場収音再生装置の例を示す機能ブロック図。The functional block diagram which shows the example of the sound field sound collection reproducing | regenerating apparatus of 2nd embodiment. 第二実施形態のマイクロホン及びスピーカの配置の例を説明するための図。The figure for demonstrating the example of arrangement | positioning of the microphone and speaker of 2nd embodiment. 音場収音再生方法の例を示す流れ図。The flowchart which shows the example of the sound field sound collection reproduction | regeneration method.

以下、図面を参照してこの発明の実施形態を説明する。以下の説明において、テキスト中で使用する記号「~」等は、本来直前の文字の真上に記載されるべきものであるが、テキスト記法の制限により、当該文字の直後に記載する。式中においてはこれらの記号は本来の位置に記述している。また、ベクトルや行列の各要素単位で行われる処理は、特に断りが無い限り、そのベクトルやその行列の全ての要素に対して適用されるものとする。   Embodiments of the present invention will be described below with reference to the drawings. In the following description, the symbol “˜” and the like used in the text should be described immediately above the immediately preceding character, but are described immediately after the character due to restrictions on text notation. In the formula, these symbols are written in their original positions. Further, the processing performed for each element of a vector or matrix is applied to all elements of the vector or matrix unless otherwise specified.

[第一実施形態]
<マイクロホンアレー及びスピーカアレーの配置>
第一実施形態の音場収音再生装置及び方法は、図2に示すように、第一の空間のy=0,z=0の位置に直線状に配置されたNx個のマイクロホンで構成される一次元マイロホンアレーM1,M2,…,MNと、第一の空間とは異なる第二の空間のy=0,z=0の位置に直線状に配置されたNx個のスピーカで構成される一次元スピーカアレーS1,S2,…,SNとを用いて、音源Sで発生した音によって形成された第一の空間の音場を第二の空間で再現する。
[First embodiment]
<Arrangement of microphone array and speaker array>
As shown in FIG. 2, the sound field sound collecting and reproducing apparatus and method according to the first embodiment includes N x microphones arranged linearly at positions y = 0 and z = 0 in the first space. .., MN x and N x speakers arranged linearly at positions y = 0, z = 0 in a second space different from the first space. , SN x is used to reproduce the sound field of the first space formed by the sound generated by the sound source S in the second space.

この際、音場は所定の回転角だけ回転した状態で再現される。具体的には、図1に点線で例示された、所定の回転角だけ回転されたスピーカアレーS1,S2,…,SNにより音場が再現されたような知覚を与えることができる。 At this time, the sound field is reproduced in a state rotated by a predetermined rotation angle. Specifically, it is possible to provide exemplified by dotted lines in FIG. 1, the speaker array S1, is rotated by a predetermined rotation angle, S2, ..., the perception that the sound field is reproduced by the SN x.

第一実施形態は、後述する第二実施形態と比較すると、マイク数、スピーカ数及びチャネル数を少なくすることができるため、実装が比較的容易となる。   Compared with the second embodiment described later, the first embodiment can reduce the number of microphones, the number of speakers, and the number of channels, so that mounting is relatively easy.

Nxは2以上の整数である。この実施形態では、マイクロホンアレーM1,M2,…,MNを構成するマイクロホンの数とスピーカアレーS1,S2,…,SNを構成するスピーカの数は同じである。マイクロホンアレーM1,M2,…,MNを構成するマイクロホンMiは等間隔に配置されている。また、スピーカアレーS1,S2,…,SNを構成するスピーカも等間隔に配置されている。マイクロホンアレーM1,M2,…,MNの大きさと、スピーカアレーS1,S2,…,SNの大きさはほぼ同じである。各マイクロホンMiのマイクロホンアレーM1,M2,…,MNにおける位置は、その各マイクロホンMiに対応するスピーカSiのスピーカアレーS1,S2,…,SNにおける位置と同じであることが望ましいが、異なっていても良い。この位置が同じであれば、より忠実に音場の再生を行うことができる。 N x is an integer of 2 or more. In this embodiment, the microphone array M1, M2, ..., the number and the speaker array S1 of microphone constituting the MN x, S2, ..., the number of speakers constituting the SN x is the same. The microphones Mi constituting the microphone arrays M1, M2,..., MN x are arranged at equal intervals. Further, the speakers constituting the speaker arrays S1, S2,..., SN x are also arranged at equal intervals. Microphone array M1, M2, ..., and the size of MN x, speaker array S1, S2, ..., the magnitude of SN x is about the same. Microphone array M1, M2 of the microphone Mi, ..., position in MN x is speaker Si speaker array S1, S2 corresponding to the respective microphones Mi, ..., but it is desirable that the same as the position in the SN x, different May be. If this position is the same, the sound field can be reproduced more faithfully.

第一の空間のy=0,z=0の位置に配置されたマイクロホンアレーM1,M2,…,MNを構成するインデックスi[i=1,…,Nx]に対応するマイクロホンMiの位置をrm,i=(xm,i,0,0)と表わすことにする。 The position of the microphone Mi corresponding to the index i [i = 1,..., N x ] constituting the microphone arrays M1, M2,..., MN x arranged at the positions y = 0, z = 0 in the first space. Is expressed as r m, i = (x m, i , 0,0).

なお、第一の空間に配置されたマイクロホンの数と第二の空間に配置されたスピーカの数は異なっていてもよい。マイクロホンの数が、第二の空間に配置されたスピーカの数よりも多い場合には、再生信号を間引けばよい。一方、マイクロホンの数が、第二の空間に配置されたスピーカの数よりも少ない場合には、再生信号をチャネル間で平均を取るなどして補間を行えばよい。補間を行う方法は、例えば、線形補間やsinc補間などを適用することができる。   Note that the number of microphones arranged in the first space and the number of speakers arranged in the second space may be different. If the number of microphones is larger than the number of speakers arranged in the second space, the reproduction signal may be thinned out. On the other hand, when the number of microphones is smaller than the number of speakers arranged in the second space, the reproduction signal may be interpolated by taking an average between channels. As a method for performing the interpolation, for example, linear interpolation, sinc interpolation, or the like can be applied.

<音場収音再生装置>
第一実施形態の音場収音再生装置は、図1に示すように周波数変換部1、空間周波数変調部2、空間周波数変換部3、変換フィルタ部4、空間周波数逆変換部5、周波数逆変換部6及び窓関数部7を例えば含み、図F1に例示された各ステップの処理を行う。
<Sound field recording and playback device>
As shown in FIG. 1, the sound field sound collecting / reproducing apparatus of the first embodiment includes a frequency conversion unit 1, a spatial frequency modulation unit 2, a spatial frequency conversion unit 3, a conversion filter unit 4, a spatial frequency inverse conversion unit 5, and a frequency inverse unit. The conversion unit 6 and the window function unit 7 are included, for example, and the processing of each step illustrated in FIG. F1 is performed.

第一の空間に配置されたマイクロホンアレーM1,M2,…,MNは、第一の空間の音源Sで発せられた音を収音して時間領域の信号を生成する。生成された信号は、周波数変換部1に送られる。インデックスiに対応するrm,i=(xm,i,0,0)に位置するマイクロホンMiで収音された時間領域の時刻tの信号をpi(t)と表記する。 The microphone arrays M1, M2,..., MN x arranged in the first space pick up the sound emitted from the sound source S in the first space and generate a time domain signal. The generated signal is sent to the frequency converter 1. A signal at time t in the time domain picked up by the microphone Mi located at r m, i = (x m, i , 0,0) corresponding to the index i is denoted as p i (t).

<周波数変換部1>
周波数変換部1は、マイクロホンアレーM1,M2,…,MNで収音された信号pi(t)をフーリエ変換により周波数領域信号Pi(ω)に変換する(ステップS1)。生成された周波数領域信号Pi(ω)は、空間周波数変調部2に提供される。ωは周波数である。例えば、短時間離散フーリエ変換により周波数領域信号Pi(ω)が生成される。もちろん、他の既存の方法により周波数領域信号Pi(ω)を生成してもよい。また、オーバーラップアド等の方法を用いて周波数領域信号Pi(ω)を生成してもよい。入力信号が長い場合や、リアルタイム処理のように連続して信号が入力される場合には、例えば10msごとといったフレームごとに処理を行う。周波数領域信号Pi(ω)は、例えば以下のように定義される。関数expの引数の中のjは虚数単位である。
<Frequency conversion unit 1>
The frequency converter 1 converts the signal p i (t) collected by the microphone arrays M1, M2,..., MN x into a frequency domain signal P i (ω) by Fourier transform (step S1). The generated frequency domain signal P i (ω) is provided to the spatial frequency modulation unit 2. ω is a frequency. For example, the frequency domain signal P i (ω) is generated by short-time discrete Fourier transform. Of course, the frequency domain signal P i (ω) may be generated by other existing methods. Further, the frequency domain signal P i (ω) may be generated using a method such as overlap add. When the input signal is long or when the signal is continuously input as in real time processing, the processing is performed for each frame such as every 10 ms. For example, the frequency domain signal P i (ω) is defined as follows. J in the argument of the function exp is an imaginary unit.

Figure 0006087760
Figure 0006087760

<空間周波数変調部2>
空間周波数変調部2は、周波数領域信号Pi(ω)が所定の回転角で空間周波数シフトされた信号である空間周波数変調信号Pmod,i(ω)を生成する(ステップS2)。生成された空間周波数変調信号Pmod,i(ω)は、空間周波数変換部3に提供される。所定の回転角は、仰角方向の角度がθrotである回転角である。
<Spatial frequency modulation unit 2>
The spatial frequency modulation unit 2 generates a spatial frequency modulation signal P mod, i (ω) that is a signal obtained by shifting the frequency domain signal P i (ω) by a spatial frequency at a predetermined rotation angle (step S2). The generated spatial frequency modulation signal P mod, i (ω) is provided to the spatial frequency conversion unit 3. The predetermined rotation angle is a rotation angle whose angle in the elevation angle direction is θ rot .

空間周波数変調部2は、例えば下記式により定義される空間周波数変調信号Pmod,i(ω)を計算する。jは虚数単位であり、kは波数でありcを音速とするとk=ω/cである。 The spatial frequency modulation unit 2 calculates a spatial frequency modulation signal P mod, i (ω) defined by the following equation, for example. j is an imaginary unit, k is a wave number, and k = ω / c where c is the speed of sound.

Figure 0006087760
Figure 0006087760

このように、空間周波数変調部2は、2個以上のマイクロホンを含むマイクロホンアレーで収音された信号から生成された周波数領域信号が所定の回転角で空間周波数シフトされた信号である空間周波数変調信号を生成する。その後、音場収音再生装置は、以下のようにして、空間周波数変調信号から再生信号を得る。   As described above, the spatial frequency modulation unit 2 is a spatial frequency modulation which is a signal obtained by shifting a frequency domain signal generated from a signal collected by a microphone array including two or more microphones by a predetermined rotational angle. Generate a signal. Thereafter, the sound field sound collecting / reproducing apparatus obtains a reproduced signal from the spatial frequency modulation signal as follows.

<空間周波数変換部3>
空間周波数変換部3は、空間のフーリエ変換により周波数領域信号Pmod,i(ω)を時空間周波数領域信号P~n(ω)に変換する(ステップS3)。時空間周波数領域信号P~n(ω)は、周波数領域信号Pmod,i(ω)に由来するものである。時空間周波数領域信号P~n(ω)は、各ωごとに計算される。変換された時空間周波数領域信号P~n(ω)は、変換フィルタ部4に提供される。空間周波数変換部3は、具体的には下記式(1)により定義されるP~n(ω)を計算する。
<Spatial frequency converter 3>
The spatial frequency conversion unit 3 converts the frequency domain signal P mod, i (ω) into a spatio-temporal frequency domain signal P n (ω) by Fourier transform of space (step S3). Spatio-temporal frequency domain signal P ~ n (ω) is derived from the frequency domain signal P mod, the i (omega). The spatio-temporal frequency domain signal P n (ω) is calculated for each ω. The converted spatio-temporal frequency domain signal P n (ω) is provided to the conversion filter unit 4. Specifically, the spatial frequency conversion unit 3 calculates P n (ω) defined by the following equation (1).

Figure 0006087760
Figure 0006087760

kx,nはx軸方向の波数であり、nは波数kx,nのインデックスであり、波数とは、いわゆる空間周波数又は角度スペクトルのことである。上記式(1)は、時空間周波数領域への変換の一例であり、他の方法により空間のフーリエ変換を行ってもよい。 k x, n is a wave number in the x-axis direction, n is an index of the wave number k x, n , and the wave number is a so-called spatial frequency or angular spectrum. The above formula (1) is an example of conversion to the spatio-temporal frequency domain, and spatial Fourier transform may be performed by other methods.

<変換フィルタ部4>
変換フィルタ部4は、時空間周波数領域信号P~n(ω)に対して式(2)により定義されるフィルタF~n(ω)を適用してフィルタ処理後信号D~n(ω)を生成する(ステップS4)。生成されたフィルタ処理後信号D~n(ω)は、空間周波数逆変換部5に提供される。
<Conversion filter unit 4>
Conversion filter unit 4, the spatio-temporal frequency domain signal P ~ n (omega) by applying the equation (2) filters F ~ n defined by (omega) to the filter processed signal D ~ n the (omega) Generate (step S4). The generated post-filtering signal D n (ω) is provided to the spatial frequency inverse transform unit 5.

Figure 0006087760
Figure 0006087760

A(ω)は、周波数特性を調整するための所定の複素数である。例えば、A(ω)=1+0×j=1である。yrefは、スピーカアレーS1,S2,…,SNから振幅を一致させる位置までのy軸方向における距離である。言い換えれば、yrefは、振幅を一致させる位置ともいえる。 A (ω) is a predetermined complex number for adjusting the frequency characteristic. For example, A (ω) = 1 + 0 × j = 1. y ref is a speaker array S1, S2, ..., a distance in the y-axis direction from the SN x to a position to match the amplitude. In other words, y ref can be said to be a position where the amplitudes are matched.

また、wnはnに基づいて例えば以下のように定まる、エバネッセント波を減衰させるための所定の重みである。以下の式において、kcは、予め定められた値でありそれぞれkx,nのカットオフ値である。kcは、例えばエバネッセント波を抑制するような値に設定する。αxは、カットオフの滑らかさを決めるための予め定められた値であり例えば0.05である。もちろん、wnとして、他の重み関数を用いてもよい。 Also, w n is determined by, for example, in the following manner based on n, it is a predetermined weight to attenuate the evanescent wave. In the following equations, k c is a predetermined value and is a cutoff value of k x, n respectively. k c is set to a value that suppresses evanescent waves, for example. α x is a predetermined value for determining the smoothness of the cutoff, and is 0.05, for example. Of course, other weight functions may be used as w n .

Figure 0006087760
Figure 0006087760

・を任意の実数として、Hn (1)(・)はn次の第一種ハンケル関数である。したがって、H0 (1)(・)は0次の第一種ハンケル関数である。Hn (1)(・)は、以下のように定義される。Jn(・)はn次のベッセル関数であり、Γ(z)はガンマ関数であり、Yn(z)はノイマン関数である。 H n (1) (·) is an nth-order first-class Hankel function, where • is an arbitrary real number. Therefore, H 0 (1) (·) is a zeroth-order first-class Hankel function. H n (1) (•) is defined as follows. J n (•) is an nth-order Bessel function, Γ (z) is a gamma function, and Y n (z) is a Neumann function.

Figure 0006087760
Figure 0006087760

なお、変換フィルタ部4は、上記式(2)のフィルタF~n(ω)に代えて、式(3)により定義されるフィルタF~n(ω)を適用してフィルタ処理後信号D~n(ω)を生成してもよい。dx,dyは、再生する音場をそれぞれx軸方向及びy軸方向にシフトさせる量である。このフィルタF~n(ω)を適用すると、第二の空間において、音場をx軸方向にdxだけy軸方向にdyだけシフトして再現することができる。 The conversion filter unit 4, instead of the filter F ~ n (omega) of the above formula (2), Equation (3) applies a filter F ~ n (omega) which is defined by the filter processed signal D ~ n (ω) may be generated. d x and d y are amounts by which the sound field to be reproduced is shifted in the x-axis direction and the y-axis direction, respectively. Applying this filter F ~ n (ω), in the second space, the sound field can be reproduced shifted by d y in the y-axis direction by d x in the x-axis direction.

Figure 0006087760
Figure 0006087760

<空間周波数逆変換部5>
空間周波数逆変換部5は、フィルタ処理後信号D~n(ω)を空間の逆フーリエ変換により周波数領域信号Di(ω)に変換する(ステップS5)。変換された周波数領域信号Di(ω)は、周波数逆変換部6に提供される。空間周波数逆変換部5は、具体的には下記式(4)により定義される周波数領域信号Di(ω)を計算する。関数expの引数の中のjは虚数単位である。
<Spatial frequency inverse transform unit 5>
The spatial frequency inverse transform unit 5 transforms the filtered signal D˜n (ω) into the frequency domain signal D i (ω) by inverse Fourier transform of the space (step S5). The transformed frequency domain signal D i (ω) is provided to the frequency inverse transform unit 6. Specifically, the spatial frequency inverse transform unit 5 calculates a frequency domain signal D i (ω) defined by the following equation (4). J in the argument of the function exp is an imaginary unit.

Figure 0006087760
Figure 0006087760

<周波数逆変換部6>
周波数逆変換部6は、周波数領域信号Di(ω)を逆フーリエ変換により時間領域信号Pd i(t)に変換する(ステップS6)。逆フーリエ変換によりフレーム毎に得られた時間領域信号Pd i(t)は適宜シフトされて線形和が取られて、連続した時間領域信号となる。逆フーリエ変換は短時間離散逆フーリエ変換等の既存の方法を用いればよい。時間領域信号Pd i(t)は、窓関数部7に送られる。
<Inverse frequency converter 6>
The frequency inverse transform unit 6 transforms the frequency domain signal D i (ω) into a time domain signal P d i (t) by inverse Fourier transform (step S6). The time domain signal P d i (t) obtained for each frame by the inverse Fourier transform is appropriately shifted to obtain a linear sum to be a continuous time domain signal. For the inverse Fourier transform, an existing method such as a short-time discrete inverse Fourier transform may be used. The time domain signal P d i (t) is sent to the window function unit 7.

<窓関数部7>
窓関数部7は、時間領域信号Pd i(t)に窓関数を乗じて窓関数後時間領域信号di(t)を生成する(ステップS7)。窓関数後時間領域信号di(t)は、スピーカアレーS1,S2,…,SNに提供される。
<Window function part 7>
The window function unit 7 multiplies the time domain signal P d i (t) by the window function to generate a post-window function time domain signal d i (t) (step S7). Window function after a time-domain signal d i (t) is the speaker array S1, S2, ..., are provided in the SN x.

窓関数として、以下の式より定義されるいわゆるターキー(Tukey)窓関数wiを例えば用いる。Ntprは、テーパーを適用する点数であり1以上Nx以下の整数である。もちろん、他の窓関数を用いてもよい。 For example, a so-called Tukey window function w i defined by the following equation is used as the window function. N tpr is the number of points to which the taper is applied, and is an integer from 1 to N x . Of course, other window functions may be used.

Figure 0006087760
Figure 0006087760

スピーカアレーS1,S2,…,SNは、窓関数後時間領域信号di(t)に基づいて音を再生する。具体的には、i=1,…,Nxとして、スピーカSiが窓関数後時間領域信号di(t)に基づいて音を再生する。 The speaker arrays S1, S2,..., SN x reproduce sound based on the time domain signal d i (t) after the window function. Specifically, with i = 1,..., N x , the speaker Si reproduces sound based on the time domain signal d i (t) after the window function.

これにより、第一の空間のy=0,z=0の位置の波面を第二の空間のスピーカアレーS1,S2,…,SNで再現して、第一の空間の音場を第二の空間に再現することができる。 Thus, the first y = 0 of the space, z wavefront position = 0 in the second space speaker array S1, S2, ..., and reproduced in SN x, the sound field of the first space second Can be reproduced in the space.

この際、再現される信号の振幅は、yrefで表される直線上の位置で振幅が一致する。具体的には、図1に示すように、スピーカアレーS1,S2,…,SNからy軸方向にyrefだけ離れた位置にあり、スピーカアレーS1,S2,…,SNが配置されている直線と平行な直線上の位置で振幅が一致する。 At this time, the amplitude of the reproduced signal matches at a position on a straight line represented by y ref . Specifically, as shown in FIG. 1, the speaker array S1, S2, ..., in a position at a distance y ref from SN x to y-axis direction, the speaker array S1, S2, ..., and SN x is located The amplitude matches at a position on a straight line parallel to the straight line.

また、音場は所定の回転角だけ回転した状態で再現される。具体的には、図1に点線で示された、所定の回転角だけ回転されたスピーカアレーS1,S2,…,SNにより音場が再現されたような知覚を与えることができる。 In addition, the sound field is reproduced in a state rotated by a predetermined rotation angle. Specifically, it is possible to provide indicated by a dotted line in FIG. 1, the speaker array S1, it is rotated by a predetermined rotation angle, S2, ..., the perception that the sound field is reproduced by the SN x.

[第二実施形態]
<マイクロホンアレー及びスピーカアレーの配置>
第二実施形態の音場収音再生装置及び方法は、図3に示すように、第一の空間のy=0の位置に平面状に配置されたNx×Nz個のマイクロホンで構成される二次元マイクロホンアレーM1−1,M2−1,…,MN−Nと、第一の空間とは異なる第二の空間のy=0の位置に平面状に配置されたNx×Nz個のスピーカで構成される二次元スピーカアレーS1−1,S2−1,…,SN−Nとを用いて、音源Sで発生した音によって形成された第一の空間の音場を第二の空間で再現する。
[Second Embodiment]
<Arrangement of microphone array and speaker array>
As shown in FIG. 3, the sound field sound collecting / reproducing apparatus and method according to the second embodiment are configured by N x × N z microphones arranged in a plane at a position y = 0 in the first space. , MN x -N z and N x × N arranged in a plane at a position y = 0 in a second space different from the first space. Using the two-dimensional speaker arrays S1-1, S2-1,..., SN x -N z composed of z speakers, the sound field of the first space formed by the sound generated by the sound source S is obtained. Reproduce in the second space.

この際、音場は所定の回転角だけ回転した状態で再現される。具体的には、図1に点線で例示された、所定の回転角だけ回転されたスピーカアレーS1−1,S2−1,…,SN−Nにより音場が再現されたような知覚を与えることができる。 At this time, the sound field is reproduced in a state rotated by a predetermined rotation angle. Specifically, the perception that the sound field is reproduced by the speaker arrays S1-1, S2-1,..., SN x -N z rotated by a predetermined rotation angle, as exemplified by the dotted line in FIG. Can be given.

Nx,Nzは2以上の整数である。Nx及びNzは、同じ値でもよいし、互いに異なる値であってもよい。この実施形態では、マイクロホンアレーM1−1,M2−1,…,MN−Nを構成するマイクロホンの数とスピーカアレーS1−1,S2−1,…,SN−Nを構成するスピーカの数は同じである。マイクロホンアレーM1−1,M2−1,…,MN−Nを構成するマイクロホンMi−jは等間隔に配置されている。また、スピーカアレーS1−1,S2−1,…,SN−Nを構成するスピーカも等間隔に配置されている。マイクロホンアレーM1−1,M2−1,…,MN−Nの大きさと、スピーカアレーS1−1,S2−1,…,SN−Nの大きさはほぼ同じである。各マイクロホンMi−jのマイクロホンアレーM1−1,M2−1,…,MN−Nにおける位置は、その各マイクロホンMi−jに対応するスピーカSi−jのスピーカアレーS1−1,S2−1,…,SN−Nにおける位置と同じであることが望ましいが、異なっていてもよい。この位置が同じであれば、より忠実に音場の再生を行うことができる。 N x and N z are integers of 2 or more. N x and N z may be the same value or different values. In this embodiment, the microphone array M1-1, M2-1, ..., MN x the number and the speaker array microphones constituting the -N z S1-1, S2-1, ..., constituting the SN x -N z speaker The number of is the same. The microphones Mi-j constituting the microphone arrays M1-1, M2-1,..., MN x -N z are arranged at equal intervals. Further, the speakers constituting the speaker arrays S1-1, S2-1,..., SN x -N z are also arranged at equal intervals. Microphone array M1-1, M2-1, ..., and the size of MN x -N z, a speaker array S1-1, S2-1, ..., the magnitude of SN x -N z are approximately the same. Microphone array M1-1 of the microphones Mi-j, M2-1, ..., position in MN x -N z is the speaker Si-j of the speaker array S1-1 corresponding to the respective microphones Mi-j, S2-1 ,..., SN x −N z is desirably the same as the position, but may be different. If this position is the same, the sound field can be reproduced more faithfully.

第一の空間のy=0の位置に配置されたマイクロホンアレーM1−1,M2−1,…,MN−Nを構成するインデックス(i,j) [i=1,…,Nx,j=1,…,Nz]に対応するマイクロホンMi−jの位置をrm,ij=(xm,i,0,zm,j)と表わすことにする。 Indexes (i, j) constituting the microphone arrays M1-1, M2-1,..., MN x −N z arranged at the position of y = 0 in the first space [i = 1 ,. The position of the microphone Mi-j corresponding to j = 1,..., N z ] is represented as r m, ij = (x m, i , 0, z m, j ).

なお、第一の空間に配置されたマイクロホンの数と第二の空間に配置されたスピーカの数は異なっていてもよい。マイクロホンの数が、第二の空間に配置されたスピーカの数よりも多い場合には、再生信号を間引けばよい。一方、マイクロホンの数が、第二の空間に配置されたスピーカの数よりも少ない場合には、再生信号をチャネル間で平均を取るなどして補間を行えばよい。補間を行う方法は、例えば、線形補間やsinc補間などを適用することができる。   Note that the number of microphones arranged in the first space and the number of speakers arranged in the second space may be different. If the number of microphones is larger than the number of speakers arranged in the second space, the reproduction signal may be thinned out. On the other hand, when the number of microphones is smaller than the number of speakers arranged in the second space, the reproduction signal may be interpolated by taking an average between channels. As a method for performing the interpolation, for example, linear interpolation, sinc interpolation, or the like can be applied.

<音場収音再生装置>
第二実施形態の音場収音再生装置は、図1に示すように周波数変換部1、空間周波数変調部2、空間周波数変換部3、変換フィルタ部4、空間周波数逆変換部5、周波数逆変換部6及び窓関数部7を例えば含み、図F1に例示された各ステップの処理を行う。
<Sound field recording and playback device>
As shown in FIG. 1, the sound field sound collecting and reproducing apparatus according to the second embodiment includes a frequency conversion unit 1, a spatial frequency modulation unit 2, a spatial frequency conversion unit 3, a conversion filter unit 4, a spatial frequency inverse conversion unit 5, and a frequency inverse unit. The conversion unit 6 and the window function unit 7 are included, for example, and the processing of each step illustrated in FIG. F1 is performed.

第一の空間に配置されたマイクロホンアレーM1−1,M2−1,…,MN−Nは、第一の空間の音源Sで発せられた音を収音して時間領域の信号を生成する。生成された信号は、周波数変換部1に送られる。インデックスi,jに対応するrm,ij=(xm,i,0,zm,j)に位置するマイクロホンMi−jで収音された時間領域の時刻tの信号をpij(t)と表記する。 The microphone arrays M1-1, M2-1,..., MN x -N z arranged in the first space pick up sounds emitted from the sound source S in the first space and generate signals in the time domain. To do. The generated signal is sent to the frequency converter 1. A signal at time t in the time domain picked up by the microphone Mi-j located at r m, ij = (x m, i , 0, z m, j ) corresponding to the index i, j is represented by p ij (t) Is written.

<周波数変換部1>
周波数変換部1は、マイクロホンアレーM1−1,M2−1,…,MN−Nで収音された信号pij(t)をフーリエ変換により周波数領域信号Pij(ω)に変換する(ステップS1)。生成された周波数領域信号Pij(ω)は、空間周波数変調部2に提供される。ωは周波数である。例えば、短時間離散フーリエ変換により周波数領域信号Pij(ω)が生成される。もちろん、他の既存の方法により周波数領域信号Pij(ω)を生成してもよい。また、オーバーラップアド等の方法を用いて周波数領域信号Pij(ω)を生成してもよい。入力信号が長い場合や、リアルタイム処理のように連続して信号が入力される場合には、例えば10msごとといったフレームごとに処理を行う。周波数領域信号Pij(ω)は、例えば以下のように定義される。関数expの引数の中のjは虚数単位である。
<Frequency conversion unit 1>
The frequency converter 1 converts the signal p ij (t) collected by the microphone arrays M1-1, M2-1,..., MN x −N z into a frequency domain signal P ij (ω) by Fourier transform ( Step S1). The generated frequency domain signal P ij (ω) is provided to the spatial frequency modulation unit 2. ω is a frequency. For example, the frequency domain signal P ij (ω) is generated by short-time discrete Fourier transform. Of course, the frequency domain signal P ij (ω) may be generated by other existing methods. Further, the frequency domain signal P ij (ω) may be generated using a method such as overlap add. When the input signal is long or when the signal is continuously input as in real time processing, the processing is performed for each frame such as every 10 ms. For example, the frequency domain signal P ij (ω) is defined as follows. J in the argument of the function exp is an imaginary unit.

Figure 0006087760
Figure 0006087760

<空間周波数変調部2>
空間周波数変調部2は、周波数領域信号Pij(ω)が所定の回転角で空間周波数シフトされた信号である空間周波数変調信号Pmod,ij(ω)を生成する(ステップS2)。生成された空間周波数変調信号Pmod,ij(ω)は、空間周波数変換部3に提供される。所定の回転角は、方位角方向の角度がθrotであり仰角方向の角度がφrotである回転角である。
<Spatial frequency modulation unit 2>
The spatial frequency modulation unit 2 generates a spatial frequency modulation signal P mod, ij (ω) that is a signal obtained by shifting the frequency domain signal P ij (ω) by a spatial frequency by a predetermined rotation angle (step S2). The generated spatial frequency modulation signal P mod, ij (ω) is provided to the spatial frequency conversion unit 3. The predetermined rotation angle is a rotation angle in which the azimuth angle is θ rot and the elevation angle is φ rot .

空間周波数変調部2は、例えば下記式により定義される空間周波数変調信号Pmod,ij(ω)を計算する。関数expの引数の中のjは虚数単位である。kは波数でありcを音速とするとk=ω/cである。 The spatial frequency modulation unit 2 calculates a spatial frequency modulation signal P mod, ij (ω) defined by the following equation, for example. J in the argument of the function exp is an imaginary unit. k is the wave number, and k = ω / c where c is the speed of sound.

Figure 0006087760
Figure 0006087760

このように、空間周波数変調部2は、2個以上のマイクロホンを含むマイクロホンアレーで収音された信号から生成された周波数領域信号が所定の回転角で空間周波数シフトされた信号である空間周波数変調信号を生成する。その後、音場収音再生装置は、以下のようにして、空間周波数変調信号から再生信号を得る。   As described above, the spatial frequency modulation unit 2 is a spatial frequency modulation which is a signal obtained by shifting a frequency domain signal generated from a signal collected by a microphone array including two or more microphones by a predetermined rotational angle. Generate a signal. Thereafter, the sound field sound collecting / reproducing apparatus obtains a reproduced signal from the spatial frequency modulation signal as follows.

<空間周波数変換部3>
空間周波数変換部3は、空間のフーリエ変換により周波数領域信号Pmod,ij(ω)を時空間周波数領域信号P~nm(ω)に変換する(ステップS3)。時空間周波数領域信号P~nm(ω)は、周波数領域信号Pmod,ij(ω)に由来するものである。時空間周波数領域信号P~nm(ω)は、各ωごとに計算される。変換された時空間周波数領域信号P~nm(ω)は、変換フィルタ部4に提供される。空間周波数変換部3は、具体的には下記式(6)により定義されるP~nm(ω)を計算する。関数expの引数の中のjは虚数単位である。
<Spatial frequency converter 3>
Spatial frequency transformation unit 3, the frequency domain signal P mod by the Fourier transform of the spatial, ij (omega) is converted to the spatio-temporal frequency domain signal P ~ nm (ω) (Step S3). Spatio-temporal frequency domain signal P ~ nm (ω) are derived from the frequency domain signal P mod, the ij (ω). The spatio-temporal frequency domain signal P nm (ω) is calculated for each ω. The converted spatio-temporal frequency domain signal P nm (ω) is provided to the conversion filter unit 4. Specifically, the spatial frequency converter 3 calculates P˜nm (ω) defined by the following equation (6). J in the argument of the function exp is an imaginary unit.

Figure 0006087760
Figure 0006087760

kx,nはx軸方向の波数であり、nは波数kx,nのインデックスであり、kz,mはz軸方向の波数であり、mは波数kz,mのインデックスであり、波数とは、いわゆる空間周波数又は角度スペクトルのことである。上記式(6)は、時空間周波数領域への変換の一例であり、他の方法により空間のフーリエ変換を行ってもよい。 k x, n is the wave number in the x-axis direction, n is the index of the wave number k x, n , k z, m is the wave number in the z-axis direction, m is the index of the wave number k z, m , The wave number is a so-called spatial frequency or angular spectrum. The above equation (6) is an example of conversion to the spatio-temporal frequency domain, and spatial Fourier transform may be performed by other methods.

<変換フィルタ部4>
変換フィルタ部4は、時空間周波数領域信号P~nm(ω)に対して式(7)により定義されるフィルタF~nm(ω)を適用してフィルタ処理後信号D~nm(ω)を生成する(ステップS4)。生成されたフィルタ処理後信号D~nm(ω)は、空間周波数逆変換部5に提供される。
<Conversion filter unit 4>
Conversion filter unit 4, the spatio-temporal frequency domain signal P ~ nm filter F is defined for (omega) by Equation (7) ~ nm (ω) applied to filtering after signal D ~ nm to the (omega) Generate (step S4). The generated filtered signal D˜nm (ω) is provided to the spatial frequency inverse transform unit 5.

Figure 0006087760
Figure 0006087760

A(ω)は、周波数特性を調整するための所定の複素数である。例えば、A(ω)=1+0×j=1である。   A (ω) is a predetermined complex number for adjusting the frequency characteristic. For example, A (ω) = 1 + 0 × j = 1.

また、wnmはn,mに基づいて例えば以下のように定まる、エバネッセント波を減衰させるための所定の重みである。以下の式において、kcは、予め定められた値でありkx,n,kz,mのカットオフ値である。kcは、例えばエバネッセント波を抑制するような値に設定する。αxzは、カットオフの滑らかさを決めるための予め定められた値であり例えば0.05である。もちろん、wnmとして、他の重み関数を用いてもよい。 W nm is a predetermined weight for attenuating the evanescent wave, which is determined as follows based on n and m, for example. In the following equation, k c is a predetermined value and is a cutoff value of k x, n , k z, m . k c is set to a value that suppresses evanescent waves, for example. α x and α z are predetermined values for determining the smoothness of the cutoff, and are 0.05, for example. Of course, other weight functions may be used as w nm .

Figure 0006087760
Figure 0006087760

なお、変換フィルタ部4は、上記式(7)のフィルタF~nm(ω)に代えて、式(8)により定義されるフィルタF~nm(ω)を適用してフィルタ処理後信号D~nm(ω)を生成してもよい。dx,dy,dzは、再生する音場をそれぞれx軸方向、y軸方向及びz軸方向にシフトさせる量である。このフィルタF~nm(ω)を適用すると、第二の空間において、音場をx軸方向にdxだけy軸方向にdyだけz軸方向にdzだけシフトして再現することができる。 Note that the conversion filter unit 4 applies the filter F˜nm (ω) defined by the equation (8) instead of the filter F˜nm (ω) of the above equation (7) to apply the filtered signal D˜ nm (ω) may be generated. d x , d y , and d z are amounts by which the sound field to be reproduced is shifted in the x-axis direction, the y-axis direction, and the z-axis direction, respectively. Applying this filter F ~ nm (ω), can be first in a two-space, to reproduce the sound field shifted by d y in the z-axis direction by the y-axis direction d x in the x-axis direction by d z .

Figure 0006087760
Figure 0006087760

<空間周波数逆変換部5>
空間周波数逆変換部5は、フィルタ処理後信号D~nm(ω)を空間の逆フーリエ変換により周波数領域信号Dij(ω)に変換する(ステップS5)。変換された周波数領域信号Dij(ω)は、周波数逆変換部6に提供される。空間周波数逆変換部5は、具体的には下記式(9)により定義される周波数領域信号Dij(ω)を計算する。関数expの引数の中のjは虚数単位である。
<Spatial frequency inverse transform unit 5>
The spatial frequency inverse transform unit 5, converts the filtered signal after D ~ nm (ω) on the frequency domain signal D ij (omega) by inverse Fourier transform of the space (step S5). The converted frequency domain signal D ij (ω) is provided to the frequency inverse transform unit 6. Specifically, the spatial frequency inverse transform unit 5 calculates a frequency domain signal D ij (ω) defined by the following equation (9). J in the argument of the function exp is an imaginary unit.

Figure 0006087760
Figure 0006087760

<周波数逆変換部6>
周波数逆変換部6は、周波数領域信号Dij(ω)を逆フーリエ変換により時間領域信号Pd ij(t)に変換する(ステップS6)。逆フーリエ変換によりフレーム毎に得られた時間領域信号Pd ij(t)は適宜シフトされて線形和が取られて、連続した時間領域信号となる。逆フーリエ変換は短時間離散逆フーリエ変換等の既存の方法を用いればよい。時間領域信号Pd ij(t)は、窓関数部7に送られる。
<Inverse frequency converter 6>
The frequency inverse transform unit 6 transforms the frequency domain signal D ij (ω) to the time domain signal P d ij (t) by inverse Fourier transform (step S6). The time domain signal P d ij (t) obtained for each frame by the inverse Fourier transform is appropriately shifted to obtain a linear sum to be a continuous time domain signal. For the inverse Fourier transform, an existing method such as a short-time discrete inverse Fourier transform may be used. The time domain signal P d ij (t) is sent to the window function unit 7.

<窓関数部7>
窓関数部7は、時間領域信号Pd ij(t)に窓関数を乗じて窓関数後時間領域信号dij(t)を生成する(ステップS7)。窓関数後時間領域信号dij(t)は、スピーカアレーS1,S2,…,SNに提供される。
<Window function part 7>
The window function unit 7 multiplies the time domain signal P d ij (t) by the window function to generate a post-window function time domain signal d ij (t) (step S7). After the window function time domain signal d ij (t) is the speaker array S1, S2, ..., it is provided in the SN x.

窓関数として、以下の式より定義されるいわゆるターキー(Tukey)窓関数wijを例えば用いる。Ntprは、テーパーを適用する点数であり1以上Nx,Nz以下の整数である。もちろん、他の窓関数を用いてもよい。 For example, a so-called tukey window function w ij defined by the following equation is used as the window function. N tpr is the number of points to which the taper is applied, and is an integer of 1 or more and N x or N z . Of course, other window functions may be used.

Figure 0006087760
Figure 0006087760

スピーカアレーS1−1,S2−1,…,SN−Nは、窓関数後時間領域信号dij(t)に基づいて音を再生する。具体的には、i=1,…,Nx,j=1,…,Nzとして、スピーカSi−jが窓関数後時間領域信号dij(t)に基づいて音を再生する。 The speaker arrays S1-1, S2-1,..., SN x -N z reproduce sound based on the time domain signal dij (t) after the window function. Specifically, with i = 1,..., N x , j = 1,..., N z , the speaker Si-j reproduces the sound based on the post-window function time domain signal dij (t).

これにより、第一の空間のy=0の位置の波面を第二の空間のスピーカアレーS1−1,S2−1,…,SN−Nで再現して、第一の空間の音場を第二の空間に再現することができる。 Thereby, the wavefront of the position of y = 0 in the first space the second space of the speaker array S1-1, S2-1, ..., and reproduced in SN x -N z, the sound field of the first space Can be reproduced in the second space.

また、音場は所定の回転角だけ回転した状態で再現される。具体的には、図1に点線で示された、所定の回転角だけ回転されたスピーカアレーS1,S2,…,SNにより音場が再現されたような知覚を与えることができる。 In addition, the sound field is reproduced in a state rotated by a predetermined rotation angle. Specifically, it is possible to provide indicated by a dotted line in FIG. 1, the speaker array S1, it is rotated by a predetermined rotation angle, S2, ..., the perception that the sound field is reproduced by the SN x.

[変形例等]
フィルタは、収音が行われた音場を再現する信号に変換するための、再生信号が出力される2個以上のスピーカを含むスピーカアレーの配置に応じたフィルタであればどのようなフィルタであってもよい。第一実施形態及び第二実施形態で説明したフィルタは、一例である。
[Modifications, etc.]
Any filter can be used as long as it is a filter according to the arrangement of speaker arrays including two or more speakers from which a reproduction signal is output for converting the sound field where the sound is collected into a signal to be reproduced. There may be. The filters described in the first embodiment and the second embodiment are examples.

例えば、第一実施形態において、以下に示す式(10)又は式(11)で定義されるフィルタを用いてもよい。   For example, in the first embodiment, a filter defined by the following formula (10) or formula (11) may be used.

Figure 0006087760
Figure 0006087760

式(10)において、p,qは予め設定された次数とし、dp,qはスピーカアレーを構成する各スピーカの伝達特性を前記次数p,qで多重極展開した多重極係数である。例えばp,qの全てを1とする等、p,qのうち何れか1つ以上は0でない正値である。 In Equation (10), p and q are preset orders, and d p and q are multipole coefficients obtained by multipole expansion of the transfer characteristics of the speakers constituting the speaker array with the orders p and q. For example, one or more of p and q are positive values other than 0, such as setting all of p and q to 1.

H0 (2)は、n=0の第二種ハンケル関数である。第二種ハンケル関数Hn (2)は、第一種ベッセル関数Jn(x)及び第二種ベッセル関数Yn(x)を用いて、以下のように定義される。 H 0 (2) is a second kind Hankel function with n = 0. The second kind Hankel function H n (2) is defined as follows using the first kind Bessel function J n (x) and the second kind Bessel function Y n (x).

Figure 0006087760
Figure 0006087760

kρは次式により定義される。 k ρ is defined by the following equation.

Figure 0006087760
Figure 0006087760

Figure 0006087760
Figure 0006087760

式(11)において、G~2Dは、理想的な伝達特性を表す2次元自由空間グリーン関数をx軸方向に空間のフーリエ変換をした関数である。G~spは、音場が再現される空間のスピーカアレーの位置とその位置からyrefだけ離れた位置との間の予め測定された伝達特性をx軸方向に空間のフーリエ変換をした関数である。 In Expression (11), G to 2D are functions obtained by subjecting a two-dimensional free space Green function representing ideal transfer characteristics to a spatial Fourier transform in the x-axis direction. G ~ sp is a function obtained by performing a Fourier transform of the space in the x-axis direction on the pre-measured transfer characteristics between the position of the speaker array in the space where the sound field is reproduced and the position away from that position by yref. is there.

また、例えば、第二実施形態において、以下に示す式(12)又は式(13)で定義されるフィルタを用いてもよい。   Further, for example, in the second embodiment, a filter defined by the following formula (12) or formula (13) may be used.

Figure 0006087760
Figure 0006087760

式(12)において、p,q,sは予め設定された次数であり、dp,q,sはスピーカアレーを構成する各スピーカの伝達特性を前記次数p,q,sで多重極展開した多重極係数である。例えばp,q,sの全てを1とする等、p,q,sのうち何れか1つ以上は0でない正値である。 In Equation (12), p, q, and s are preset orders, and d p, q, and s are multipole expansions of the transfer characteristics of each speaker constituting the speaker array at the orders p, q, and s. Multipole coefficient. For example, one or more of p, q, and s are positive values that are not 0, such as setting all of p, q, and s to 1.

Figure 0006087760
Figure 0006087760

式(13)において、G~は、理想的な伝達特性を表す3次元自由空間グリーン関数をx軸方向及びz軸方向に空間のフーリエ変換をした関数である。G~spは、音場が再現される空間のスピーカアレーの位置とその位置からyrefだけ離れた位置との間の予め測定された伝達特性をx軸方向及びz軸方向に空間のフーリエ変換をした関数である。 In Expression (13), G˜ is a function obtained by subjecting a three-dimensional free space Green function representing ideal transfer characteristics to a spatial Fourier transform in the x-axis direction and the z-axis direction. G ~ sp is the Fourier transform of space in the x-axis and z-axis directions, measured in advance in the x-axis and z-axis directions, between the position of the speaker array in the space where the sound field is reproduced and the position away from that position by y ref It is a function that

第一の空間と第二の空間の位置は、図2,4に示したものに限定されない。第一の空間と第二の空間は、隣接していても互いに離れた位置にあってもよい。また、第一の空間と第二の空間の向きもどのようなものであってもよい。   The positions of the first space and the second space are not limited to those shown in FIGS. The first space and the second space may be adjacent to each other or separated from each other. Also, the orientation of the first space and the second space may be any.

窓関数部7による窓関数の処理は、どの段階で行ってもよいし、多段で行ってもよい。すなわち、窓関数部7は、マイクロホンアレーと周波数変換部1との間、周波数変換部1と空間周波数変調部2との間、空間周波数変調部2と空間周波数変換部3との間、空間周波数変換部3と変換フィルタ部4との間、変換フィルタ部4と空間周波数逆変換部5との間、空間周波数逆変換部5と周波数逆変換部6との間の少なくとも1つの間に備えられていてもよい。音場収音再生装置の各部は、その各部に入力される信号について窓関数の処理が行われた場合には、その入力される信号に代えて上記と同様にしてその窓関数の処理がされた後の信号に対して処理を行う。   The window function processing by the window function unit 7 may be performed at any stage or in multiple stages. That is, the window function unit 7 is connected between the microphone array and the frequency conversion unit 1, between the frequency conversion unit 1 and the spatial frequency modulation unit 2, between the spatial frequency modulation unit 2 and the spatial frequency conversion unit 3, and spatial frequency. It is provided between at least one between the conversion unit 3 and the conversion filter unit 4, between the conversion filter unit 4 and the spatial frequency inverse transform unit 5, and between the spatial frequency inverse transform unit 5 and the frequency inverse transform unit 6. It may be. When the window function processing is performed on the signal input to each section, each section of the sound field sound collecting / reproducing apparatus performs the window function processing in the same manner as described above instead of the input signal. The processed signal is processed.

音場収音再生装置は、空間周波数変調部2を含みさえすれば、他の部を備えていなくてもよい。言い換えれば、周波数変換部1、空間周波数変換部3、変換フィルタ部4、空間周波数逆変換部5、周波数逆変換部6及び窓関数部7は必須ではない。   As long as the sound field sound collecting / reproducing apparatus includes the spatial frequency modulation unit 2, it may not include other units. In other words, the frequency conversion unit 1, the spatial frequency conversion unit 3, the conversion filter unit 4, the spatial frequency reverse conversion unit 5, the frequency reverse conversion unit 6, and the window function unit 7 are not essential.

例えば、窓関数部7はなくてもよい。この場合、第一実施形態においてはi=1,…,NとしてスピーカSiが時間領域信号Pd i(t)に基づいて音を再生し、第二実施形態においてはi=1,…,N,j=1,…,NとしてスピーカSi−jが時間領域信号Pd ij(t)に基づいて音を再生する。 For example, the window function unit 7 may not be provided. In this case, in the first embodiment, i = 1,..., Nx , the speaker Si reproduces the sound based on the time domain signal Pd i (t), and in the second embodiment, i = 1,. The speaker Si-j reproduces the sound based on the time domain signal P d ij (t) as N x , j = 1,..., N z .

空間周波数変換部3及び空間周波数逆変換部5がない場合には、空間周波数変調信号が、変換フィルタ部4に提供される。変換フィルタ部4は、空間周波数変調信号に対してフィルタを適用して、フィルタ処理後信号を得る。フィルタ処理後信号は、周波数逆変換部6で時間領域信号に変換される。   When the spatial frequency conversion unit 3 and the spatial frequency inverse conversion unit 5 are not provided, a spatial frequency modulation signal is provided to the conversion filter unit 4. The conversion filter unit 4 applies a filter to the spatial frequency modulation signal to obtain a filtered signal. The filtered signal is converted into a time domain signal by the frequency inverse converter 6.

周波数変換部1の処理と空間周波数変調部2の処理と空間周波数変換部3の処理とを同時に行ってもよい。同様に、空間周波数逆変換部5の処理と周波数逆変換部6の処理とを同時に行ってもよい。また、空間周波数変換部3と空間周波数逆変換部5とを入れ替えてもよい。   The processing of the frequency conversion unit 1, the processing of the spatial frequency modulation unit 2, and the processing of the spatial frequency conversion unit 3 may be performed simultaneously. Similarly, the process of the spatial frequency inverse transform unit 5 and the process of the frequency inverse transform unit 6 may be performed simultaneously. Further, the spatial frequency conversion unit 3 and the spatial frequency inverse conversion unit 5 may be interchanged.

音場収音再生装置は、コンピュータによって実現することができる。この場合、この装置の各部の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、この装置における各部がコンピュータ上で実現される。   The sound field sound collecting / reproducing apparatus can be realized by a computer. In this case, the processing content of each part of this apparatus is described by a program. Then, by executing this program on a computer, each unit in this apparatus is realized on the computer.

この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、これらの装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。   The program describing the processing contents can be recorded on a computer-readable recording medium. In this embodiment, these apparatuses are configured by executing a predetermined program on a computer. However, at least a part of these processing contents may be realized by hardware.

この発明は、上述の実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。   The present invention is not limited to the above-described embodiment, and can be modified as appropriate without departing from the spirit of the present invention.

1 周波数変換部
2 空間周波数変調部
3 空間周波数変換部
4 変換フィルタ部
5 離散球面調和逆変換部
6 周波数逆変換部
7 窓関数部
DESCRIPTION OF SYMBOLS 1 Frequency conversion part 2 Spatial frequency modulation part 3 Spatial frequency conversion part 4 Conversion filter part 5 Discrete spherical harmonic inverse transformation part 6 Frequency inverse transformation part 7 Window function part

Claims (9)

2個以上のマイクロホンを含むマイクロホンアレーで収音された信号から生成された周波数領域信号が所定の回転角で空間周波数シフトされた信号である空間周波数変調信号を生成する空間周波数変調部を含み、
上記空間周波数変調信号から再生信号を得る音場収音再生装置。
A spatial frequency modulation unit that generates a spatial frequency modulation signal, which is a signal obtained by shifting a frequency domain signal generated from a signal collected by a microphone array including two or more microphones at a predetermined rotational angle, and
A sound field collecting and reproducing apparatus for obtaining a reproduction signal from the spatial frequency modulation signal.
請求項1の音場収音再生装置において、
上記収音が行われた音場を再現する信号に変換するための、上記再生信号が出力される2個以上のスピーカを含むスピーカアレーの配置に応じたフィルタを上記空間周波数変調信号又は上記空間周波数変調信号に由来する時空間周波数領域信号に適用してフィルタ処理後信号を生成する変換フィルタ部を更に含み、
上記空間周波数変調信号の代わりに上記フィルタ処理後信号から上記再生信号を得る音場収音再生装置。
The sound field collecting and reproducing device according to claim 1,
A filter corresponding to the arrangement of speaker arrays including two or more speakers from which the reproduction signal is output for converting the sound field where the sound is collected into a signal to be reproduced is used as the spatial frequency modulation signal or the space. Further including a transform filter unit that applies a spatiotemporal frequency domain signal derived from the frequency modulation signal to generate a filtered signal;
A sound field sound collecting / reproducing apparatus that obtains the reproduced signal from the filtered signal instead of the spatial frequency modulation signal.
請求項2の音場収音再生装置において、
上記マイクロホンアレーは直線状であり、上記スピーカアレーは直線状であり、上記スピーカアレーの配列方向をx軸方向とし、上記所定の回転角は仰角方向の角度がθrotである回転角であるとし、Pi(ω)を上記周波数領域信号とし、jを虚数単位とし、ωを周波数とし、cを音速とし、k=ω/cとし、上記マイクロホンアレーを構成するインデックスiに対応するマイクロホンの位置をrm,i=(xm,i,0,0)とし、Pmod,i(ω)を上記空間周波数変調信号として、
上記空間周波数変調部は、下記式により定義される空間周波数変調信号Pmod,i(ω)を計算する、
Figure 0006087760

音場収音再生装置。
The sound field collecting and reproducing apparatus according to claim 2 ,
The microphone array is linear, the speaker array is linear, the array direction of the speaker array is the x-axis direction, and the predetermined rotation angle is a rotation angle whose angle of elevation is θ rot. , P i (ω) is the frequency domain signal, j is an imaginary unit, ω is the frequency, c is the speed of sound, k = ω / c, and the position of the microphone corresponding to the index i constituting the microphone array R m, i = (x m, i , 0,0), P mod, i (ω) as the spatial frequency modulation signal,
The spatial frequency modulation unit calculates a spatial frequency modulation signal P mod, i (ω) defined by the following equation:
Figure 0006087760

Sound field recording and playback device.
請求項3の音場収音再生装置において、
kx,nをx軸方向の波数とし、nをそのインデックスとし、wnをnに基づいて定まる重みとし、A(ω)を所定の複素数とし、再生する音場をx軸方向及びy軸方向にシフトさせる量をそれぞれdx,dyとし、H0 (1)(・)を0次の第一種ハンケル関数とし、yrefを振幅を一致させる位置として、
上記変換フィルタ部は、下記の2個の式の一方により定義されるフィルタF~n(ω)を上記時空間周波数領域信号に適用してフィルタ処理後信号D~n(ω)を生成する、
Figure 0006087760

Figure 0006087760

音場収音再生装置。
The sound field collecting and reproducing device according to claim 3,
k x, n is the wave number in the x-axis direction, n is its index, w n is a weight determined based on n, A (ω) is a predetermined complex number, and the sound field to be reproduced is in the x-axis direction and the y-axis The amount of shift in the direction is dx, dy, H 0 (1) (・) is the 0th kind Hankel function, and y ref is the position where the amplitudes match,
The transform filter unit applies a filter F n (ω) defined by one of the following two expressions to the spatio-temporal frequency domain signal to generate a filtered signal D n (ω).
Figure 0006087760

Figure 0006087760

Sound field recording and playback device.
請求項2の音場収音再生装置において、
マイクロホンアレーはxz平面上に配置されているとし、上記所定の回転角は、方位角方向の角度がθrotであり仰角方向の角度がφrotである回転角であるとし、Pij(ω)を上記周波数領域信号とし、jを虚数単位とし、ωを周波数とし、cを音速とし、k=ω/cとし、上記マイクロホンアレーを構成するインデックスi,jに対応するマイクロホンの位置をrm,ij=(xm,i,0,zm,j)とし、Pmod,ij(ω)を上記空間周波数変調信号として、
上記空間周波数変調部は、下記式により定義される空間周波数変調信号Pmod,ij(ω)を計算する、
Figure 0006087760

音場収音再生装置。
The sound field collecting and reproducing apparatus according to claim 2 ,
The microphone array is arranged on the xz plane, and the predetermined rotation angle is a rotation angle in which the azimuth angle is θ rot and the elevation angle is φ rot , and P ij (ω) Is the frequency domain signal, j is an imaginary unit, ω is the frequency, c is the speed of sound, k = ω / c, and the position of the microphone corresponding to the index i, j constituting the microphone array is r m, ij = (x m, i , 0, z m, j ) and P mod, ij (ω) as the spatial frequency modulation signal,
The spatial frequency modulation unit calculates a spatial frequency modulation signal P mod, ij (ω) defined by the following equation:
Figure 0006087760

Sound field recording and playback device.
請求項5の音場収音再生装置において、
kx,nをx軸方向の波数とし、nをそのインデックスとし、kz,mをz軸方向の波数とし、mをそのインデックスとし、wnmをn,mに基づいて定まる重みとし、A(ω)を所定の複素数とし、再生する音場をx軸方向、y軸方向及びz軸方向にシフトさせる量をそれぞれdx,dy,dzとして、
上記変換フィルタ部は、下記の2個の式の一方により定義されるフィルタF~n(ω)を上記時空間周波数領域信号に適用してフィルタ処理後信号D~n(ω)を生成する、
Figure 0006087760

Figure 0006087760

音場収音再生装置。
The sound field collecting and reproducing apparatus according to claim 5,
k x, n is the wave number in the x-axis direction, n is its index, k z, m is the wave number in the z-axis direction, m is its index, w nm is a weight determined based on n, m, and A (ω) is a predetermined complex number, and the amounts by which the sound field to be reproduced is shifted in the x-axis direction, y-axis direction, and z-axis direction are dx, dy, and dz, respectively.
The transform filter unit applies a filter F n (ω) defined by one of the following two expressions to the spatio-temporal frequency domain signal to generate a filtered signal D n (ω).
Figure 0006087760

Figure 0006087760

Sound field recording and playback device.
請求項2から6の何れかの音場収音再生装置において、
空間のフーリエ変換により、上記空間周波数変調信号を上記時空間周波数領域信号に変換する空間周波数変換部と、
空間の逆フーリエ変換により、上記フィルタ処理後信号を周波数領域信号に変換する空間周波数逆変換部と、
上記周波数領域信号を逆フーリエ変換により時間領域信号である上記再生信号に変換する周波数逆変換部と、
を更に含む音場収音再生装置。
The sound field recording and reproducing device according to any one of claims 2 to 6,
A spatial frequency converter that converts the spatial frequency modulation signal into the spatio-temporal frequency domain signal by Fourier transform of the space;
A spatial frequency inverse transform unit for transforming the filtered signal into a frequency domain signal by inverse Fourier transform of space;
A frequency inverse transform unit for transforming the frequency domain signal into the reproduction signal that is a time domain signal by inverse Fourier transform;
A sound field collecting and reproducing apparatus further comprising:
空間周波数変調部が、2個以上のマイクロホンを含むマイクロホンアレーで収音された信号から生成された周波数領域信号が所定の回転角で空間周波数シフトされた信号である空間周波数変調信号を生成する空間周波数変調ステップを含み、
上記空間周波数変調信号から再生信号を得る音場収音再生方法。
A space in which a spatial frequency modulation unit generates a spatial frequency modulation signal, which is a signal obtained by shifting a frequency domain signal generated from a signal collected by a microphone array including two or more microphones at a predetermined rotation angle. Including a frequency modulation step;
A sound field collection and reproduction method for obtaining a reproduction signal from the spatial frequency modulation signal.
請求項1から7の何れかに記載された音場収音再生装置の各部としてコンピュータを機能させるための音場収音再生プログラム。   A sound field sound recording / reproducing program for causing a computer to function as each unit of the sound field sound collecting / reproducing apparatus according to claim 1.
JP2013156922A 2013-07-29 2013-07-29 Sound field recording / reproducing apparatus, method, and program Active JP6087760B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013156922A JP6087760B2 (en) 2013-07-29 2013-07-29 Sound field recording / reproducing apparatus, method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013156922A JP6087760B2 (en) 2013-07-29 2013-07-29 Sound field recording / reproducing apparatus, method, and program

Publications (2)

Publication Number Publication Date
JP2015027046A JP2015027046A (en) 2015-02-05
JP6087760B2 true JP6087760B2 (en) 2017-03-01

Family

ID=52491344

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013156922A Active JP6087760B2 (en) 2013-07-29 2013-07-29 Sound field recording / reproducing apparatus, method, and program

Country Status (1)

Country Link
JP (1) JP6087760B2 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3346728A4 (en) * 2015-09-03 2019-04-24 Sony Corporation Sound processing device and method, and program
EP3389285B1 (en) 2015-12-10 2021-05-05 Sony Corporation Speech processing device, method, and program

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3905364B2 (en) * 2001-11-30 2007-04-18 株式会社国際電気通信基礎技術研究所 Stereo sound image control device and ground side device in multi-ground communication system
JP5603307B2 (en) * 2011-08-29 2014-10-08 日本電信電話株式会社 Sound field recording / reproducing apparatus, method, and program
JP5583089B2 (en) * 2011-08-29 2014-09-03 日本電信電話株式会社 Sound field recording / reproducing apparatus, method, and program

Also Published As

Publication number Publication date
JP2015027046A (en) 2015-02-05

Similar Documents

Publication Publication Date Title
JP6508539B2 (en) Sound field collecting apparatus and method, sound field reproducing apparatus and method, and program
CN106797526B (en) Apparatus for processing audio, method and computer readable recording medium
JP5346322B2 (en) Sound field recording / reproducing apparatus, method, and program
JP5734329B2 (en) Sound field recording / reproducing apparatus, method, and program
JP6087760B2 (en) Sound field recording / reproducing apparatus, method, and program
JP5986966B2 (en) Sound field recording / reproducing apparatus, method, and program
JP5583089B2 (en) Sound field recording / reproducing apparatus, method, and program
JP5603307B2 (en) Sound field recording / reproducing apparatus, method, and program
JP2014150417A (en) Sound field sound collection playback system, method, and program
JP5713964B2 (en) Sound field recording / reproducing apparatus, method, and program
JP5628219B2 (en) Sound field recording / reproducing apparatus, method, and program
JP6592838B2 (en) Binaural signal generation apparatus, method, and program
JP5749221B2 (en) Sound field recording / reproducing apparatus, method, and program
JP5762478B2 (en) Noise suppression device, noise suppression method, and program thereof
JP5698164B2 (en) Sound field recording / reproducing apparatus, method, and program
JP5698279B2 (en) Sound field recording / reproducing apparatus, method, and program
JP5698278B2 (en) Sound field recording / reproducing apparatus, method, and program
JP5734327B2 (en) Sound field recording / reproducing apparatus, method, and program
JP5713988B2 (en) Sound field recording / reproducing apparatus, method, and program
JP5741866B2 (en) Sound field recording / reproducing apparatus, method, and program
JP5954713B2 (en) Sound field recording / reproducing apparatus, method, and program
JP5831910B2 (en) Sound field recording / reproducing apparatus, method, and program
JP2013255155A (en) Multichannel echo cancellation device and multichannel echo cancellation method and program
JP5831909B2 (en) Sound field recording / reproducing apparatus, method, and program
JP5826737B2 (en) Sound field recording / reproducing apparatus, method, and program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150811

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160715

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160802

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160822

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170131

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170202

R150 Certificate of patent or registration of utility model

Ref document number: 6087760

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150