JP6345633B2 - Sound field reproducing apparatus and method - Google Patents

Sound field reproducing apparatus and method Download PDF

Info

Publication number
JP6345633B2
JP6345633B2 JP2015151874A JP2015151874A JP6345633B2 JP 6345633 B2 JP6345633 B2 JP 6345633B2 JP 2015151874 A JP2015151874 A JP 2015151874A JP 2015151874 A JP2015151874 A JP 2015151874A JP 6345633 B2 JP6345633 B2 JP 6345633B2
Authority
JP
Japan
Prior art keywords
sound field
order
radiation
reproduction
sound
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015151874A
Other languages
Japanese (ja)
Other versions
JP2017034441A (en
Inventor
圭吾 若山
圭吾 若山
高田 英明
英明 高田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2015151874A priority Critical patent/JP6345633B2/en
Publication of JP2017034441A publication Critical patent/JP2017034441A/en
Application granted granted Critical
Publication of JP6345633B2 publication Critical patent/JP6345633B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
  • Stereophonic System (AREA)
  • Circuit For Audible Band Transducer (AREA)

Description

本発明は音場再生技術に関し、特に空間マルチゾーン音場再生技術に関する。   The present invention relates to a sound field reproduction technique, and more particularly to a spatial multi-zone sound field reproduction technique.

空間マルチゾーン音場再生とは、スピーカアレイを駆動することで、分離された空間に独立した複数の音場を再生する技術である(例えば、非特許文献1参照)。従来技術では、複数の領域で音場を再現するため、再現領域を取り囲むように無指向性スピーカを等間隔に円状に配置した円状スピーカアレイを用いている。   Spatial multi-zone sound field reproduction is a technique for reproducing a plurality of independent sound fields in a separated space by driving a speaker array (see, for example, Non-Patent Document 1). In the prior art, in order to reproduce a sound field in a plurality of areas, a circular speaker array in which omnidirectional speakers are arranged in a circle at equal intervals so as to surround the reproduction area is used.

Y. J. Wu, et al. “Spatial Multizone Soundfield Reproduction:Theory and Design,” Speech and Audio Processing, IEEE Transactions on 19.6 (2011): 1711-1720.Y. J. Wu, et al. “Spatial Multizone Soundfield Reproduction: Theory and Design,” Speech and Audio Processing, IEEE Transactions on 19.6 (2011): 1711-1720.

従来の円状スピーカアレイによって半径Rの円周内で波数kまで正確に音場を再現するには、2kR+1個以上の膨大な数のスピーカが必要となる。本発明の課題は、従来よりも少ない個数の音源で空間マルチゾーン音場再生を実現することである。   In order to accurately reproduce the sound field up to the wave number k within the circumference of the radius R by the conventional circular speaker array, a huge number of speakers of 2kR + 1 or more are required. An object of the present invention is to realize spatial multi-zone sound field reproduction with a smaller number of sound sources than in the prior art.

指向性パターンが異なる互いに独立な複数個の放射モードの何れかまたは前記複数個の放射モードの少なくとも一部の組み合わせからなる、再生パターンで音響信号を再生する所定個の高次音源を用いる。当該再生パターンは、音響信号の反響を利用して複数個の空間領域に所望の音場を生成するために放射モードのそれぞれの重みが制御されたものである。   A predetermined number of higher-order sound sources that reproduce an acoustic signal with a reproduction pattern, which is composed of any one of a plurality of independent radiation modes having different directivity patterns or a combination of at least a part of the plurality of radiation modes, are used. In the reproduction pattern, each weight of the radiation mode is controlled in order to generate a desired sound field in a plurality of spatial regions using the echo of the acoustic signal.

本発明では、放射モードのそれぞれの重みを制御しつつ反響を利用することで、従来よりも少ない個数の音源で空間マルチゾーン音場再生を実現できる。   In the present invention, spatial multi-zone sound field reproduction can be realized with a smaller number of sound sources than in the prior art by using echoes while controlling the respective weights of the radiation modes.

図1は実施形態の音場再生装置の構成を説明するための概念図である。FIG. 1 is a conceptual diagram for explaining the configuration of the sound field reproducing apparatus of the embodiment. 図2は実施形態の制御部を例示したブロック図である。FIG. 2 is a block diagram illustrating the control unit of the embodiment. 図3は定理1に関する幾何学図である。FIG. 3 is a geometric diagram relating to Theorem 1. 図4は実施形態の係数設定装置の構成を説明するための概念図である。FIG. 4 is a conceptual diagram for explaining the configuration of the coefficient setting device of the embodiment. 図5は実施形態の設定部を例示したブロック図である。FIG. 5 is a block diagram illustrating the setting unit of the embodiment.

以下、本発明の実施形態を説明する。
〔概要〕
反響環境下(残響環境下)に所定個の高次音源(higher order source)を配置する。各高次音源は、指向性パターンが異なる互いに独立な複数個の放射モードの何れかまたは複数個の放射モードの少なくとも一部の組み合わせ(線形和)からなる「再生パターン」で音響信号を再生する音源である。高次音源の例は高次スピーカ(higher order loudspeaker)である(例えば、参考文献1「M. Poletti, T. Betlehem, “Design of a prototype variable directivity loudspeaker for improved surround sound reproduction in rooms,” AES 52nd International Conference, Guildford, UK, 2013, September 2-4」等参照)。ここで、音響信号の反響を利用して複数個の空間領域に所望の音場を生成するために放射モードのそれぞれの重みが制御された「再生パターン」を用いることで、従来よりも少ない個数の音源で空間マルチゾーン音場再生を実現できる。すなわち、非特許文献1の式(20)および(21)等にあるように、非特許文献1では、各スピーカのフィルタ係数を制御して空間マルチゾーン音場再生を実現する。これに対し、本形態では高次音源の放射モードのそれぞれを制御する。放射モードを制御することにより、反響による鏡像の制御の自由度を向上でき、少ない個数の音源で空間マルチゾーン音場再生を実現できる。
Embodiments of the present invention will be described below.
〔Overview〕
A predetermined number of higher order sources are arranged in a reverberant environment (in a reverberant environment). Each higher-order sound source reproduces an acoustic signal with a “reproduction pattern” composed of any one of a plurality of independent radiation modes having different directivity patterns or a combination (linear sum) of at least a part of a plurality of radiation modes. It is a sound source. An example of a higher order sound source is a higher order loudspeaker (for example, reference 1 “M. Poletti, T. Betlehem,“ Design of a prototype variable directivity loudspeaker for improved surround sound reproduction in rooms, ”AES 52nd. International Conference, Guildford, UK, 2013, September 2-4 "). Here, by using the “reproduction pattern” in which the weight of each radiation mode is controlled in order to generate the desired sound field in a plurality of spatial regions using the echo of the acoustic signal, a smaller number than in the past It is possible to realize spatial multi-zone sound field playback with any sound source. That is, as shown in Equations (20) and (21) of Non-Patent Document 1, in Non-Patent Document 1, spatial multi-zone sound field reproduction is realized by controlling the filter coefficient of each speaker. On the other hand, in this embodiment, each of the radiation modes of the higher-order sound source is controlled. By controlling the radiation mode, it is possible to improve the degree of freedom of mirror image control due to reverberation and to realize spatial multi-zone sound field reproduction with a small number of sound sources.

「再生パターン」は、例えば、高次音源hs(u)の波数kでの放射モードm(ν)に対するフィルタ重みを

としたものである。ただし、hs(1),…,hs(L)がL個の高次音源を表し、Lが正整数(例えば、Lは2以上の整数)であり、m(1),…,m(2N+1)が2N+1個の放射モードを表し、Nが正整数であり(Nは1以上の整数)、u=1,…,Lであり、ν=1,…,2N+1である。Hνu(r,θ;k)が高次音源hs(u)から大域的な極座標(r,θ)までの放射モードm(ν)の波数kでの音響伝達関数であり、rが動径であり、θが偏角である。M(k)が正整数であり、m=−M(k),…,M(k)であり、αmνu(k)が音響伝達関数Hνu(r,θ;k)のmについての展開係数であり、A(k)がαmνu(k)を要素とする(2M(k)+1)×L’の行列であり、L’=L(2N+1)であり、

である。

であり、[・]は[・]の転置を表し、β (k)は所望の音場が生成された複数個の空間領域を含む領域の極座標(r,θ)での波数kの周波数領域信号S(r,θ;k)のmについての展開係数であり、g(k)がA(k)g(k)=β(k)の解または近似解である。
The “reproduction pattern” is, for example, the filter weight for the radiation mode m (ν) at the wave number k of the higher-order sound source hs (u).

It is what. Here, hs (1),..., Hs (L) represent L high-order sound sources, L is a positive integer (for example, L is an integer of 2 or more), and m (1),. V +1) represents 2N V +1 radiation modes, N V is a positive integer (N V is an integer of 1 or more), u = 1,..., L, ν = 1,..., 2N V +1 It is. H νu (r, θ; k) is an acoustic transfer function at the wave number k of the radiation mode m (ν) from the higher-order sound source hs (u) to the global polar coordinate (r, θ), and r is the radius And θ is a declination. M 0 (k) is a positive integer, m = −M 0 (k),..., M 0 (k), and α mνu (k) is m of the acoustic transfer function H νu (r, θ; k). A (k) is a (2M 0 (k) +1) × L ′ matrix with α mνu (k) as elements, and L ′ = L (2N V +1).

It is.

, And the represents a transpose of [·] T is [·], β d m ( k) is the wave number k in the polar region including a plurality of spatial regions where desired sound field is generated (r, theta) Of the frequency domain signal S d (r, θ; k) for m, and g (k) is a solution or an approximate solution of A (k) g (k) = β d (k).

αmνu(k)は音響伝達関数Hνu(r,θ;k)から得ることができ、Hνu(r,θ;k)は高次音源からの出力とマイクロホンでの集音結果から計算できる。しかしながら、環境によってはHνu(r,θ;k)の誤差が大きくなってしまう場合がある。この場合、

によってHνu(a,θ;k)をフィルタリングして

を得てもよい。これにより音響伝達関数の推定誤差の影響を低減できる。ただし、Hνu(a,θ;k)は大域的な極座標(a,θ)に配置されたマイクロホンMIC(q)(ただし、q=1,…,Q)での観測音響信号に基づいて得られる、高次音源hs(u)から極座標(a,θ)までの放射モードm(ν)の波数kでの音響伝達関数である。aは動径であり、θは偏角であり、

であり、iが虚数単位であり、H’(・)が次数mの第一種のハンケル関数の導関数であり、(・)*が(・)の複素共役を表し、λeqが等価正則化パラメータであり、|(・)|が(・)の絶対値を表す。
α mνu (k) can be obtained from the acoustic transfer function H νu (r, θ; k), and H νu (r, θ; k) can be calculated from the output from the higher-order sound source and the sound collection result of the microphone. . However, depending on the environment, the error of H νu (r, θ; k) may increase. in this case,

Filter H νu (a, θ q ; k) by

You may get Thereby, the influence of the estimation error of the acoustic transfer function can be reduced. However, H νu (a, θ q ; k) is based on the observed acoustic signal at the microphone MIC (q) (where q = 1,..., Q) arranged at the global polar coordinates (a, θ q ). Is an acoustic transfer function at a wave number k of the radiation mode m (ν) from the higher-order sound source hs (u) to the polar coordinates (a, θ q ). a is a moving radius, θ q is a declination,

, I is an imaginary unit, H ′ m (•) is a derivative of the first kind Hankel function of degree m, (•) * represents the complex conjugate of (•), and λ eq is equivalent It is a regularization parameter, and | (•) | represents the absolute value of (•).

〔第1実施形態〕
図面を参照して第1実施形態を説明する。
<構成>
図1に例示するように、本形態の音場再生装置1は、制御部11と、壁面13で囲まれた残響室(反響環境下)に配置されたL個の高次音源(高次スピーカ)12−u(ただし、u=1,…,L)とを有する。図2に例示するように、制御部11は記憶部111と重み取得部112とフィルタリング部113−uと駆動信号生成部114−uとを有する。制御部11は、例えば、CPU(central processing unit)等のプロセッサ(ハードウェア・プロセッサ)およびRAM(random-access memory)・ROM(read-only memory)等のメモリ等を備える汎用または専用のコンピュータが所定のプログラムを実行することで構成される。このコンピュータは1個のプロセッサやメモリを備えていてもよいし、複数個のプロセッサやメモリを備えていてもよい。このプログラムはコンピュータにインストールされてもよいし、予めROM等に記録されていてもよい。また、CPUのようにプログラムが読み込まれることで機能構成を実現する電子回路(circuitry)ではなく、プログラムを用いることなく処理機能を実現する電子回路を用いて一部またはすべての処理部が構成されてもよい。また、1個の装置を構成する電子回路が複数のCPUを含んでいてもよい。なお、図1および2はL=5の例であるが、これは本発明を限定しない。
[First Embodiment]
A first embodiment will be described with reference to the drawings.
<Configuration>
As illustrated in FIG. 1, the sound field reproducing apparatus 1 of this embodiment includes a control unit 11 and L high-order sound sources (high-order speakers) arranged in a reverberation room (in a reverberation environment) surrounded by a wall surface 13. ) 12-u (where u = 1,..., L). As illustrated in FIG. 2, the control unit 11 includes a storage unit 111, a weight acquisition unit 112, a filtering unit 113-u, and a drive signal generation unit 114-u. The control unit 11 is, for example, a general-purpose or dedicated computer that includes a processor (hardware processor) such as a CPU (central processing unit) and a memory such as random-access memory (RAM) and read-only memory (ROM). It is configured by executing a predetermined program. The computer may include a single processor and memory, or may include a plurality of processors and memory. This program may be installed in a computer, or may be recorded in a ROM or the like in advance. In addition, some or all of the processing units are configured using an electronic circuit that realizes a processing function without using a program, instead of an electronic circuit (circuitry) that realizes a functional configuration by reading a program like a CPU. May be. In addition, an electronic circuit constituting one device may include a plurality of CPUs. 1 and 2 are examples of L = 5, this does not limit the present invention.

≪幾何学配置≫
2次元の大域的(グローバル)な空間領域、および、互いにオーバーラップしないS個の2次元の局所的(ローカル)な所望の空間領域(円形領域)14−1,…,14−Sならびにそれらに対応する所望の音場を想定する。ただし、Sは2以上の整数である。s番目(ただし、s=1,…,S)の空間領域14−sの半径と原点をそれぞれR (s)とOで表現する。ここでOは大域的な原点Oに対する極座標(r(s0),θ(s0))に位置する。r(s0)およびθ(s0)はそれぞれ動径および偏角を表す。s番目の空間領域14−sの中にある任意の観測点の局所的な極座標を(R(s),Ω(s))と表現する。(R(s),Ω(s))は局所的な原点Oを中心とした極座標であり、R(s)およびΩ(s)はそれぞれ動径および偏角を表す。局所的な極座標(R(s),Ω(s))は、大域的な原点Oに対する極座標(r,θ)に位置する。rおよびθはそれぞれ動径および偏角を表す。すべての空間領域14−1,…,14−Sは、大域的な原点Oを中心とした半径R≧rの円形領域内に存在する。Rはすべての空間領域14−1,…,14−Sを内側に含む円形領域の半径である。L個の高次音源12−uは、大域的な原点Oから半径R≧Rの円周上に配置される。高次音源12−1,…,12−Lは等間隔で配置されてもよいし、等間隔で配置されなくてもよい。Lは正整数であり、例えばLは2以上の整数である。
≪Geometric arrangement≫
Two-dimensional global (global) spatial regions, and S two-dimensional local (circular) desired spatial regions (circular regions) 14-1,. Assume a corresponding desired sound field. However, S is an integer of 2 or more. The radius and origin of the s-th (where s = 1,..., S) space region 14-s are expressed by R z (s) and O s , respectively. Here, O s is located at polar coordinates (r (s0) , θ (s0) ) with respect to the global origin O. r (s0) and θ (s0) represent a radius vector and a declination angle, respectively. A local polar coordinate of an arbitrary observation point in the s-th spatial region 14-s is expressed as (R (s) , Ω (s) ). (R (s) , Ω (s) ) are polar coordinates centered on the local origin O s , and R (s) and Ω (s) represent the radial and declination, respectively. Local polar coordinates (R (s) , Ω (s) ) are located at polar coordinates (r, θ) with respect to the global origin O. r and θ represent a radius vector and a declination angle, respectively. All the spatial regions 14-1,..., 14-S are present in a circular region having a radius R P ≧ r with the global origin O as the center. R P is all the spatial regions 14-1, ..., the radius of the circular area including the 14-S inwards. L pieces of high-order tone 12-u are arranged on the circumference of a radius R S ≧ R P from global origin O. The higher order sound sources 12-1, ..., 12-L may be arranged at equal intervals or may not be arranged at equal intervals. L is a positive integer. For example, L is an integer of 2 or more.

≪所望の音場≫
2次元の空間領域14−sでの所望の音場を、xsource(s)=(rcosθ,rsinθに位置する2次元グリーン関数(2次元平面では点音源、3次元空間では線音源)に起因する音場と定義する。この音源を仮想音源と呼ぶ。ただし、局所的な原点Oに対する任意の極座標を(r,θ)と表記する。rおよびθはそれぞれ動径および偏角を表す。また(・)は(・)の転置を表す。すなわち、本形態の目的は高次音源12−1,…,12−Lを用い、xsource(s)に位置する仮想音源に起因する音場を空間領域14−sでの「所望の音場」として再現することである。空間領域14−sでの所望の音場を以下の時間周波数領域信号Sd(s)(xd(s);k)で表記する。

ただし、kは波数であり、iは虚数単位であり、||(・)||は(・)のノルムを表す。H(・)は次数nの第一種のハンケル関数である。xd(s)は空間領域14−sでの任意の観測点である。d(s)は空間領域14−sの所望の音場を表すインデックスである。xd(s)を局所的な原点Oに対する極座標で表すと(R(s),Ω(s))となり、大域的な原点Oに対する極座標で表すと(r,θ)となる。Sd(s)(xd(s);k)に係数S(k)を乗じることで任意の音響信号による音場を表現できる。
≪ Desired sound field≫
A desired sound field in the two-dimensional space region 14-s is expressed as a two-dimensional Green function (point source 3 in the two-dimensional plane, x source (s) = (r s cos θ s , r s sin θ s ) T It is defined as a sound field caused by a linear sound source in a dimensional space. This sound source is called a virtual sound source. However, an arbitrary polar coordinate with respect to the local origin O s is expressed as (r s , θ s ). r s and θ s represent a radius vector and a declination angle, respectively. (•) T represents transposition of (•). That is, the purpose of this embodiment is to use higher-order sound sources 12-1,..., 12-L, and the sound field caused by the virtual sound source located at x source (s) To reproduce. A desired sound field in the spatial domain 14-s is represented by the following time frequency domain signal S d (s) (x d (s) ; k).

However, k is a wave number, i is an imaginary unit, and || (•) || represents a norm of (•). H n (·) is a first type Hankel function of order n. xd (s) is an arbitrary observation point in the spatial region 14-s. d (s) is an index representing a desired sound field in the spatial region 14-s. When x d (s) is expressed in polar coordinates with respect to the local origin O s , it becomes (R (s) , Ω (s) ), and when expressed in polar coordinates with respect to the global origin O, it becomes (r, θ). By multiplying S d (s) (x d (s) ; k) by a coefficient S (k), a sound field by an arbitrary acoustic signal can be expressed.

≪所望の音場の円筒調和関数展開≫
d(s)を局所的な原点Oに対する極座標(R(s),Ω(s))で表す。この場合、空間領域14−sの所望の音場を表す時間周波数領域信号Sd(s)(R(s),Ω(s);k)は、円筒調和関数展開によって以下のように表現される。

ただし、J(・)は次数mのベッセル関数であり、α d(s)(k)はSd(s)(R(s),Ω(s);k)を一意に表現するためのmについての展開係数(音場係数)であり、eはネイピア数(自然対数の底)である。式(2)はフーリエ級数展開となっており、これによって任意の数の円筒波や平面波に由来する任意の2次元音場を表現できる。なお、「α d(s)(k)」の「d(s)」は「m」の真上に表記すべきであるが、記載表記の制約上、「α d(s)(k)」と表記する。その他の記号でも同様な表記を行う場合がある。
≪Cylinder harmonic function expansion of desired sound field≫
x d (s) is represented by polar coordinates (R (s) , Ω (s) ) with respect to the local origin O s . In this case, the time-frequency domain signal S d (s) (R (s) , Ω (s) ; k) representing the desired sound field in the spatial domain 14-s is expressed as follows by cylindrical harmonic function expansion. The

However, J m (•) is a Bessel function of degree m, and α m d (s) (k) uniquely represents S d (s) (R (s) , Ω (s) ; k). Expansion coefficient (sound field coefficient) for m, and e is the Napier number (the base of natural logarithm). Expression (2) is a Fourier series expansion, which can represent an arbitrary two-dimensional sound field derived from an arbitrary number of cylindrical waves and plane waves. In addition, “ d (s) ” of “α m d (s) (k)” should be written directly above “m”, but “α m d (s) (k” is restricted due to the limitation of the description. ) ”. The same notation may be used for other symbols.

式(2)は無限個の直交モードを持っている。しかしながら、ベッセル関数の性質とすべての音源が外側にある空間領域では音場は限定されるという事実により、この級数展開を有限個の直交モードによる展開で打ち切ることができる。この場合、Sd(s)(R(s),Ω(s);k)は以下のように近似できる。

ただし、M(k)は正の整数である。この場合、Sd(s)(R(s),Ω(s);k)は、少なくとも2M(k)+1個のモードで表現される。M(k)=ceil(keR (s)/2)の場合、打ち切り誤差は16.1%以下である。ただし、ceil(・)は(・)の天井関数である。
Equation (2) has an infinite number of orthogonal modes. However, due to the nature of the Bessel function and the fact that the sound field is limited in the spatial region where all sound sources are outside, this series expansion can be discontinued by a finite number of orthogonal modes. In this case, S d (s) (R (s) , Ω (s) ; k) can be approximated as follows.

However, M s (k) is a positive integer. In this case, S d (s) (R (s) , Ω (s) ; k) is expressed by at least 2M s (k) +1 modes. When M s (k) = ceil (keR z (s) / 2), the truncation error is 16.1% or less. However, ceil (•) is a ceiling function of (•).

≪等価なグローバル音場≫
上述したS個の空間領域14−1,・・・,S(マルチゾーン)の音場から構成される等価なグローバル音場を定義する。すなわち、複数の空間領域14−1,・・・,Sの音場の再現の問題を全域にわたるグローバルな所望の音場の再現に帰着させる。所望のグローバル音場を表す時間周波数領域信号S(r,θ;k)は、円筒調和関数展開によって以下のように近似される。

ただし、β (k)はS(r,θ;k)を一意に表現するためのmについての展開係数(音場係数)である。この場合、S(r,θ;k)は、少なくとも2M(k)+1個のモードで表現される。例えば、M(k)=ceil(keR/2)である。すべてのマルチゾーンが半径Rの円形領域内に収まる場合、M(k)によるモード制限ですべてのマルチゾーンで音場を再現するためには、
(k)≧(M(k)+M(k)+・・・+M(k)) (5)
を満たす必要がある。
≪Equivalent global sound field≫
An equivalent global sound field composed of the sound fields of the S spatial regions 14-1,..., S (multi-zone) described above is defined. That is, the sound field reproduction problem of the plurality of spatial regions 14-1,..., S is reduced to reproduction of a global desired sound field over the entire area. A time-frequency domain signal S d (r, θ; k) representing a desired global sound field is approximated by cylindrical harmonic function expansion as follows.

Here, β m d (k) is an expansion coefficient (sound field coefficient) for m for uniquely expressing S d (r, θ; k). In this case, S d (r, θ; k) is expressed by at least 2M 0 (k) +1 modes. For example, M 0 (k) = ceil (keR P / 2). If all multizone falls within a circular region of radius R P, in order to reproduce the sound field in all multi-zone mode limitation by M 0 (k) is
M 0 (k) ≧ (M 1 (k) + M 2 (k) +... + M S (k)) (5)
It is necessary to satisfy.

《空間調和係数変換》
音源の存在しない領域の中の音場を考える。図3のようにO,Oは、2つの座標系の原点であり、それらは同じ方向の軸を持っており、Oを既知の変換で移動させたものがOであるとする。Oを原点とする座標系での極座標(r(1),θ(1))を、Oを原点とする座標系での極座標で表すと(r(2),θ(2))となる。ここで、Oに対するOの極座標(r(12),θ(12))と表す。また{α (1)(k)},{α (2)(k)}が、それぞれ原点をO,Oとした2つの座標系における、音源の存在しない領域中の音場を一意に表現するためのmについての展開係数の集合であるとする。この場合、以下の定理1,2が成り立つ。
《Spatial harmonic coefficient conversion》
Consider a sound field in an area where no sound source exists. O 1, O 2 as shown in FIG. 3, is the origin of the two coordinate systems, they have the axis of the same direction, which moves the O 1 a known conversion is assumed to be O 2 . When the polar coordinates (r (1) , θ (1) ) in the coordinate system with O 1 as the origin are represented by the polar coordinates in the coordinate system with O 2 as the origin, (r (2) , θ (2) ) and Become. Here, the polar coordinates of O 2 with respect to O 1 (r (12) , θ (12) ) are represented. Also, {α m (1) (k)} and {α m (2) (k)} denote the sound field in the region where no sound source exists in the two coordinate systems with the origins as O 1 and O 2 , respectively. It is assumed that this is a set of expansion coefficients for m for uniquely expressing. In this case, the following theorems 1 and 2 hold.

[定理1]
α (1)(k)とα (2)(k)は以下によって関係付けられる。

ただし、

であり、「*」はモード次数mでの離散畳み込みを表している。なお、T (21)は原点OからOへの変換作用素を表しており、T (12)は原点OからOへの変換作用素を表している。
[Theorem 1]
α m (1) (k) and α m (2) (k) are related by:

However,

Where “*” represents discrete convolution at mode order m. T m (21) represents a conversion operator from the origin O 2 to O 1 , and T m (12) represents a conversion operator from the origin O 1 to O 2 .

[定理2]
に対するOの極座標を(r(21),θ(21))と表記し、

および空間調和係数変換(Spatial Harmonic Coefficient Translation)の定理を適用すると、以下の関係を導出できる。

ここで、T (0s)はOを原点とした大域的な座標系から、s番目の空間領域14−sのOを原点とした局所的な座標系への変換作用素である。
[Theorem 2]
The polar coordinates of O 1 with respect to O 2 are expressed as (r (21) , θ (21) ),

And applying the theorem of Spatial Harmonic Coefficient Translation, the following relation can be derived.

Here, T m (0s) is a conversion operator from a global coordinate system having O as the origin to a local coordinate system having O s in the sth spatial region 14- s as the origin.

《グローバル音場係数の探索》
α d(s)(k)からβ (k)への係数変換を行う。式(9)の畳み込みを線形和で書き下すと以下のようになる。

この式(10)をs=1,…,SについてS個書き下し、これら同時方程式を構成し、行列形式で表現すると以下のようになる。
α(k)=T(k)β(k) (11)
ただし、以下を満たす。
《Search for global sound field coefficient》
Coefficient conversion from α m d (s) (k) to β m d (k) is performed. The convolution of equation (9) is written as a linear sum as follows.

When this equation (10) is written down for S = 1,..., S, these simultaneous equations are constructed and expressed in matrix form as follows.
α d (k) = T (k) β d (k) (11)
However, the following is satisfied.

式(11)は以下のように変形できる。
β(k)=T(k)α(k) (14)
ただし、T(k)=[T(k)T(k)]−1T(k)はT(k)のムーア−ペローンズの擬似逆行列であり、(・)は(・)の複素共役転置を表す。最小二乗法などを用い、式(14)のβ(k)の解または近似解を求めることで、α d(s)(k)からβ (k)への係数変換を行うことができる。
Equation (11) can be modified as follows.
β d (k) = T (k) + α d (k) (14)
Where T (k) + = [T (k) H T (k)] −1 T (k) H is a Moore-Peron's pseudo-inverse matrix of T (k), and (·) H is (·) Represents the complex conjugate transpose of. Perform coefficient conversion from α m d (s) (k) to β m d (k) by obtaining a solution of β d (k) or an approximate solution of equation (14) using a least square method or the like. Can do.

《高次音源による残響室でのマルチゾーン音場再生》
残響室(反響環境下)に配置されたL個の高次音源12−1,…,12−Lによって空間マルチゾーンでの音場再生を行う。各高次音源12−sは、互いに独立した複数の指向性パターンを生成できる。2次元平面で考えると、次数Nの高次音源12−sは2N+1個の独立した放射モードを生成できる。それらは{einθ:n=−N,…,N}のの極応答を持つ位相モード、{1,cos(nθ)■,sin(nθ)■:n=1,…,N}の極応答を持つ振幅モード、あるいは、これらの極応答の線形和で表される。これらL個の高次音源12−1,…,12−Lによって生成される、入力信号S(k)=1における再現音場は、以下の時間周波数領域信号S(r,θ;k)で表記できる。

ここで、Gνu(k)は高次音源12−sの波数kの放射モード(radiation mode)m(ν)に適用されるフィルタ重みを表す。ただし、ν=1,…,2N+1は各放射モードに対応するインデックスである。Hνu(r,θ;k)は、高次音源12−sから極座標(r,θ)までの放射モードm(ν)での波数kの音響伝達関数である。
《Multi-zone sound field reproduction in reverberation room with high-order sound source》
Sound field reproduction in a spatial multi-zone is performed by L high-order sound sources 12-1, ..., 12-L arranged in a reverberation room (under reverberation environment). Each higher-order sound source 12-s can generate a plurality of directivity patterns independent of each other. Considering a two-dimensional plane, a higher-order sound source 12-s of order N V can generate 2N V +1 independent radiation modes. They {e inθ: n = -N V , ..., N V} -phase mode with a polar response of the, {1, cos (nθ) ■, sin (nθ) ■: n = 1, ..., N V} It is represented by an amplitude mode having a polar response of or a linear sum of these polar responses. The reproduced sound field in the input signal S (k) = 1 generated by these L high-order sound sources 12-1,..., 12-L is the following time frequency domain signal S (r, θ; k). Can be written.

Here, G νu (k) represents the filter weight applied to the radiation mode m (ν) of the wave number k of the higher-order sound source 12-s. However, ν = 1,..., 2N V +1 is an index corresponding to each radiation mode. H νu (r, θ; k) is an acoustic transfer function of wave number k in the radiation mode m (ν) from the higher-order sound source 12-s to the polar coordinates (r, θ).

《モードマッチング》
本形態では、所望の音場を円筒調和関数に分解し、所望の音場のモードに一致させるように高次音源12−1,…,12−Lのアクティブモード(m=−M(k),…,M(k)の範囲でのモード)を制御するモードマッチングを行う。具体的には、m=−M(k),…,M(k)の範囲で所望の音場のモードに一致させるようにGνu(k)(ただし、u=1,…,L)を調整する。モードマッチングのアプローチの利点は、高次音源12−1,…,12−Lの空間ナイキスト周波数までの制御領域で正確な音場再生が保証されるという点である。音場のアクティブモードを正確に再現するためには、自由度の数、すなわち、高次音源12−1,…,12−Lで提供される指向性パターンの数L’=L(2N+1)がアクティブモードの数(2M(k)+1)と等しいかそれ以上でないとならない。すなわち、L(2N+1)≧2M(k)+1であることが望ましい。
《Mode matching》
In this embodiment, the desired sound field is decomposed into a cylindrical harmonic function, and the active modes (m = −M 0 (k ),..., Mode matching for controlling the mode in the range of M 0 (k). Specifically, G ν u (k) (where u = 1,..., L so as to match the desired sound field mode within a range of m = −M 0 (k),..., M 0 (k). ). The advantage of the mode matching approach is that accurate sound field reproduction is guaranteed in the control region up to the spatial Nyquist frequency of the higher-order sound sources 12-1, ..., 12-L. In order to accurately reproduce the active mode of the sound field, the number of degrees of freedom, that is, the number of directivity patterns provided by the higher-order sound sources 12-1,..., 12-L L ′ = L (2N V +1 ) Must be equal to or greater than the number of active modes (2M 0 (k) +1). That is, it is desirable that L (2N V +1) ≧ 2M 0 (k) +1.

各高次音源12−sから極座標(r,θ)までの放射モードm(ν)での波数kの音響伝達関数は以下のように表現できる。

ここで、αmνu(k)は高次音源12−sの放射モードm(ν)での音響伝達関数Hνu(r,θ;k)のmについての展開係数である。
The acoustic transfer function of wave number k in the radiation mode m (ν) from each higher-order sound source 12-s to polar coordinates (r, θ) can be expressed as follows.

Here, α mνu (k) is an expansion coefficient for m of the acoustic transfer function H νu (r, θ; k) in the radiation mode m (ν) of the higher-order sound source 12-s.

式(4)(15)(16)より、以下の関係が導出できる。

ただし、m=−M(k),…,M(k)である。この方程式の集合を行列で表現すると以下のようになる。
A(k)g(k)=β(k) (18)
ただし、A(k)はαmνu(k)を要素とする(2M(k)+1)×L’の行列であり、

である。[(・)]ω,ιは行列(・)のω行ι列要素を表す。式(16)に示すように、実測によって音響伝達関数Hνu(r,θ;k)が得ることでA(k)を定めることができる。

である。[・]は[・]の転置を表し、β (k)は所望の音場が生成された複数個の空間領域を含む領域の極座標(r,θ)での波数kの周波数領域信号S(r,θ;k)のmについての展開係数である。式(3)(13)(14)に示すように、高次音源12−1,…,12−Lおよび空間領域14−1,…,14−Sの所望の音場を定めればβ(k)を定めることができる。g(k)はGνu(k)を要素とするベクトルであり、

である。[(・)]ωはベクトル(・)のω個目の要素を表す。
From the equations (4), (15) and (16), the following relationship can be derived.

However, m = −M 0 (k),..., M 0 (k). This set of equations can be expressed as a matrix as follows.
A (k) g (k) = β d (k) (18)
However, A (k) is a matrix of (2M 0 (k) +1) × L ′ having α mνu (k) as an element,

It is. [(•)] ω, ι represents the ω row ι column element of the matrix (•). As shown in Equation (16), A (k) can be determined by obtaining the acoustic transfer function H νu (r, θ; k) by actual measurement.

It is. [·] T represents transposition of [·], β d m (k) is a frequency region of wave number k in polar coordinates (r, θ) of a region including a plurality of spatial regions in which a desired sound field is generated This is the expansion coefficient for m of the signal S d (r, θ; k). As shown in equation (3) (13) (14), higher sound 12-1, ..., 12-L and the spatial regions 14-1, ..., be determined desired sound field 14-S beta d (K) can be defined. g (k) is a vector having G νu (k) as an element,

It is. [(•)] ω represents the ω-th element of the vector (•).

以上より、式(18)を解き、g(k)を求めることでモードマッチングを実現できる。本形態では、式(18)のg(k)の解または近似解を求める。A(k)g(k)とβ(k)との二乗誤差J(k)は、以下のように表記できる。

ただし、W(k)は[w(k)]M0(k)+m+1,M0(k)+m+1=w(k)(ただし、m=−M(k),…,M(k))で定義される(2M(k)+1)行(2M(k)+1)列の対角重み行列である。ただし、下付き添え字の「M0(k)」は「M(k)」を表す。また、

である。w(k)は制御領域に対するモードmの相対的なエネルギーの寄与の大きさを表している。二乗誤差J(k)の最小値(最小二乗誤差)に対応するg(k)は以下のようになる。

ただし、ηはティコノフの正則化パラメータであり、Iは(2M(k)+1)×(2M(k)+1)の単位行列である。式(20)の結果を式(18)のg(k)の解または近似解とする。
From the above, mode matching can be realized by solving equation (18) and obtaining g (k). In this embodiment, a solution or approximate solution of g (k) in Expression (18) is obtained. The square error J (k) between A (k) g (k) and β d (k) can be expressed as follows.

Where W (k) is [w m (k)] M0 (k) + m + 1, M0 (k) + m + 1 = w m (k) (where m = −M 0 (k),..., M 0 (k) ) Defined by (2M 0 (k) +1) rows (2M 0 (k) +1) columns. However, the subscript “M0 (k)” represents “M 0 (k)”. Also,

It is. w m (k) represents the magnitude of the relative energy contribution of mode m to the control region. G (k) corresponding to the minimum value of the square error J (k) (least square error) is as follows.

Here, η is a Tikhonov regularization parameter, and I is a unit matrix of (2M 0 (k) +1) × (2M 0 (k) +1). The result of equation (20) is taken as the solution or approximate solution of g (k) in equation (18).

<動作>
以上のように得られるg(k)は制御部11(図2)の記憶部111に格納される。また入力信号S(k)も記憶部111に格納される。重み取得部112は、記憶部111から読み込んだg(k)からGνu(k)を取得し、Gνu(k)をフィルタリング部113−uに送る(ただし、u=1,…,L)。フィルタリング部113−uは記憶部111から入力信号S(k)を読み込み、高次音源12−uの波数kでの放射モードm(ν)に対するフィルタ重みをGνu(k)とするフィルタを入力信号S(k)に適用し、出力信号Sνu(k)を得る。フィルタリング部113−uの処理は時間領域で行われてもよいし、時間周波数領域で行われてもよい。各高次音源12−uは、例えば、円筒形のバッフルの外周に等間隔で環状に配置されたD個のスピーカsp(χ)(ただしχ∈[0,D−1])による環状アレイによって構成できる(例えば、参考文献1)。この場合、高次音源12−uから放射モードm(ν)で放射を行う各スピーカsp(χ)の音響信号の重みは
u,χ=(1/D)e−iνφ(χ)
となる。ただし、χ∈[0,D−1]であり、φ(χ)は高次音源12−uをなする環状アレイの中心に対する二次元平面上での角度φ(χ)=2χπ/Dである。この例の場合、出力信号Sνu(k)は以下のようになる。
νu(k)=Gνu(k)Wu,χS(k)
<Operation>
G (k) obtained as described above is stored in the storage unit 111 of the control unit 11 (FIG. 2). The input signal S (k) is also stored in the storage unit 111. The weight acquisition unit 112 acquires G νu (k) from g (k) read from the storage unit 111, and sends G νu (k) to the filtering unit 113-u (where u = 1,..., L). . The filtering unit 113-u reads the input signal S (k) from the storage unit 111, and inputs a filter whose filter weight is G νu (k) for the radiation mode m (ν) at the wave number k of the higher-order sound source 12-u. Apply to the signal S (k) to obtain the output signal S νu (k). The processing of the filtering unit 113-u may be performed in the time domain or may be performed in the time frequency domain. Each higher-order sound source 12-u is formed by, for example, D u speakers sp u (χ) (provided that χ∈ [0, D u −1]) arranged annularly at equal intervals on the outer periphery of a cylindrical baffle. It can be constituted by an annular array (for example, Reference 1). In this case, the weight of the acoustic signal of each speaker sp u (χ) that radiates from the higher-order sound source 12-u in the radiation mode m (ν) is W u, χ = (1 / D u ) e −iνφ (χ)
It becomes. However, χ∈ [0, D u −1], and φ (χ) is an angle φ (χ) = 2χπ / D u on the two-dimensional plane with respect to the center of the annular array forming the higher-order sound source 12- u. It is. In this example, the output signal S νu (k) is as follows.
S νu (k) = G νu (k) W u, χ S (k)

出力信号Sνu(k)またはその組み合わせ(線形和)は駆動信号生成部114−1に送られ、駆動信号生成部114−1は出力信号Sνu(k)またはその組み合わせに対応する駆動信号S’νu(k)またはその組み合わせを生成して高次音源12−uに出力する。高次音源12−uは駆動信号S’νu(k)またはその組み合わせに応じた再生パターンの音響信号を放射する。これにより、所望の空間領域14−1,…,14−Sに所望の音場が生成され、空間マルチゾーン音場再生が実現される。本形態ではGνu(k)によって高次音源12−u(ただし、u=1,…,L)の放射モードm(ν)(ただし、ν=1,…,2N+1)のそれぞれを制御する。これにより、反響による鏡像の制御の自由度を向上でき、残響室で複数の領域に正確な音場を再現するために必要な次数Nの高次音源12−u(次数N)の個数Lを、非特許文献1に比べて最大N+1分の1にまで削減できる。 The output signal S νu (k) or a combination (linear sum) thereof is sent to the drive signal generation unit 114-1, and the drive signal generation unit 114-1 outputs the drive signal S corresponding to the output signal S νu (k) or a combination thereof. ' νu (k) or a combination thereof is generated and output to the higher-order sound source 12-u. The higher order sound source 12-u radiates an acoustic signal having a reproduction pattern corresponding to the drive signal S ′ νu (k) or a combination thereof. Thereby, a desired sound field is generated in the desired spatial region 14-1,..., 14-S, and spatial multi-zone sound field reproduction is realized. In this embodiment, each of the radiation modes m (ν) (where ν = 1,..., 2N V +1) of the higher-order sound source 12-u (where u = 1,..., L) is controlled by G νu (k). To do. This can improve the flexibility of the control of the mirror image due to reverberation, the number of high-order tone 12-u of order N V required to reproduce an accurate sound field into a plurality of regions in the reverberation room (order N V) L can be reduced to a maximum of N V + 1 / compared with Non-Patent Document 1.

〔第2実施形態〕
第1実施形態で説明したように、式(18)のg(k)の解または近似解を得るためには、A(k)を特定する必要があり、A(k)を正確に特定するためには、音響伝達関数Hνu(r,θ;k)を正確に測定する必要がある。音響伝達関数はHνu(r,θ;k)は高次音源12−uから放射された音響信号をマイクロホンアレイで観測することで計測可能である。しかしながら、音響伝達関数Hνu(r,θ;k)を精度良く計測することは容易ではない。マイクロホンのミスマッチ、センサーノイズ、空間エイリアジング、不完全なモード等価の各々が音響伝達関数の係数の誤差に寄与する。本形態では音響伝達関数の測定誤差の影響を低減させ、A(k)の精度を向上させる方法を説明する。
[Second Embodiment]
As described in the first embodiment, in order to obtain a solution or approximate solution of g (k) in Expression (18), A (k) needs to be specified, and A (k) is specified accurately. For this purpose, it is necessary to accurately measure the acoustic transfer function H νu (r, θ; k). The acoustic transfer function H νu (r, θ; k) can be measured by observing the acoustic signal radiated from the higher-order sound source 12-u with a microphone array. However, it is not easy to accurately measure the acoustic transfer function H νu (r, θ; k). Microphone mismatch, sensor noise, spatial aliasing, and imperfect mode equivalence each contribute to the error in the coefficients of the acoustic transfer function. In this embodiment, a method for reducing the influence of measurement error of the acoustic transfer function and improving the accuracy of A (k) will be described.

<構成>
図1に例示するように、本形態の係数設定装置2は、設定部21と、壁面13で囲まれた残響室(反響環境下)に配置されたL個の高次音源12−u(ただし、u=1,…,L)とマイクロホン24−q(ただし、q=1,…,Q)を有する。Qは正整数であり、例えばQ≧2である。図2に例示するように、設定部21は制御部211と音響伝達関数推定部212と係数算出部213とを有する。設定部21は、例えば、前述した汎用または専用のコンピュータが所定のプログラムを実行することで構成される。各マイクロホン24−qは、大域的な原点Oを中心とした半径a≦Rの円筒形の底面を持つバッフルに埋め込まれる。バッフルは硬い素材からできていてもよいし、やわらかい素材からできていてもよい。マイクロホン24−qは原点Oに対する極座標(a,θ)に配置される。なお、図4および5はL=5,Q=6の例であるが、これは本発明を限定しない。
<Configuration>
As illustrated in FIG. 1, the coefficient setting device 2 according to the present embodiment includes a setting unit 21 and L high-order sound sources 12-u (provided that the reverberation room is surrounded by a wall surface 13). , U = 1,..., L) and a microphone 24-q (where q = 1,..., Q). Q is a positive integer, for example, Q ≧ 2. As illustrated in FIG. 2, the setting unit 21 includes a control unit 211, an acoustic transfer function estimation unit 212, and a coefficient calculation unit 213. The setting unit 21 is configured by, for example, the above-described general-purpose or dedicated computer executing a predetermined program. Each microphone 24-q is embedded in the baffle with the cylindrical bottom surface of radius a ≦ R P around the global origin O. The baffle may be made of a hard material or a soft material. The microphone 24-q is arranged at polar coordinates (a, θ q ) with respect to the origin O. 4 and 5 are examples of L = 5 and Q = 6, this does not limit the present invention.

マイクロホン24−q(ただし、q=1,…,Q)での観測音響信号に基づいて得られる、高次音源12−uから極座標(a,θ)までの放射モードm(ν)の波数kでの音響伝達関数Hνu(a,θ;k)は以下のようになる。

ただし、H’(・)は次数mの第一種のハンケル関数の導関数(微分)である。ロンスキアン・リレーション(Wronskian relation)に基づき、式(21)は式(22)のように変形できる。

ここで

は前述の円筒部分でのモードの強さを表す。
The wave number of the radiation mode m (ν) from the higher-order sound source 12-u to the polar coordinates (a, θ q ) obtained based on the observed acoustic signal with the microphone 24-q (where q = 1,..., Q). The acoustic transfer function H νu (a, θ q ; k) at k is as follows.

Here, H ′ m (•) is a derivative (derivative) of the first kind Hankel function of order m. Based on the Wronskian relation, equation (21) can be transformed into equation (22).

here

Represents the strength of the mode in the cylindrical portion described above.

式(22)の両辺にe−imθを掛け、積分すると以下の関係が導出される。

さらに式(23)は以下のように変形できる。

ここでB −1(ka)はモード等価フィルタである。この表現では、十分な数Qのマイクロホン24−qによってアレイが構成されていることを前提としてエイリアジング誤差を無視している。マイクロホン24−1,…,24−Qからなる円状マイクロホンアレイにより測定できるHνu(a,θ;k)の最大モード次数M(k)はQにより上から押さえられM(k)≦(Q−1)/2となる。

ただし、λeqは等価正則化パラメータであり、|(・)|は(・)の絶対値を表す。この正則化はモード等価フィルタの最大ゲインを−(6+10log10λeq)dBに制限している。これにより、マイクロホンノイズの極端な増幅を防いでいる。
Multiplying both sides of equation (22) by e −imθ and integrating, the following relationship is derived.

Furthermore, equation (23) can be modified as follows.

Here, B m −1 (ka) is a mode equivalent filter. In this expression, aliasing errors are ignored on the assumption that an array is constituted by a sufficient number of microphones 24-q. The maximum mode order M 0 (k) of H νu (a, θ q ; k) that can be measured by a circular microphone array composed of microphones 24-1,..., 24-Q is suppressed from above by Q and M 0 (k) ≦ (Q−1) / 2.

However, λ eq is an equivalent regularization parameter, and | (•) | represents the absolute value of (•). This regularization limits the maximum gain of the mode equivalent filter to − (6 + 10 log 10 λ eq ) dB. As a result, extreme amplification of microphone noise is prevented.

<動作>
まず、音響伝達関数Hνu(a,θ;k)の測定を行う。Hνu(a,θ;k)を測定する場合、設定部21(図5)の制御部211は、駆動信号生成部114−uおよび音響伝達関数推定部212にモードm(ν)で波数kのテスト信号tνu(k)を送る。駆動信号生成部114−uは、テスト信号tνu(k)に対応する駆動信号t’νu(k)を生成して高次音源12−uに送る。高次音源12−uは駆動信号t’νu(k)に応じた音響信号を放射する。マイクロホン24−qで観測された観測信号は音響伝達関数推定部212に送られる。音響伝達関数推定部212は、テスト信号tνu(k)および観測信号を用いて音響伝達関数Hνu(a,θ;k)を計算して出力する。係数算出部213はHνu(a,θ;k)を入力とし、式(24)に従ってαmνu(k)を生成して出力する。出力されたαmνu(k)は第1実施形態で説明したA(k)の要素として利用される。
<Operation>
First, the acoustic transfer function H νu (a, θ q ; k) is measured. When measuring H νu (a, θ q ; k), the control unit 211 of the setting unit 21 (FIG. 5) sets the wave number in the mode m (ν) to the drive signal generation unit 114-u and the acoustic transfer function estimation unit 212. Send k test signals t νu (k). The drive signal generation unit 114-u generates a drive signal t ′ νu (k) corresponding to the test signal t νu (k) and sends it to the higher-order sound source 12-u. The higher order sound source 12-u emits an acoustic signal corresponding to the drive signal t ′ νu (k). The observation signal observed by the microphone 24-q is sent to the acoustic transfer function estimation unit 212. The acoustic transfer function estimation unit 212 calculates and outputs an acoustic transfer function H νu (a, θ q ; k) using the test signal t νu (k) and the observation signal. The coefficient calculation unit 213 receives H νu (a, θ q ; k) as input, generates α mνu (k) according to the equation (24), and outputs it. The output α mνu (k) is used as an element of A (k) described in the first embodiment.

本形態では、式(25)のモード等価フィルタB −1(ka)を用いることでマイクロホンノイズの極端な増幅を防ぎ、音響伝達関数Hνu(a,θ;k)の測定誤差の影響を低減させ、A(k)の精度を向上させることができる。 In the present embodiment, extreme amplification of microphone noise is prevented by using the mode equivalent filter B m −1 (ka) of Expression (25), and the influence of measurement error of the acoustic transfer function H νu (a, θ q ; k). And the accuracy of A (k) can be improved.

〔変形例等〕
なお、本発明は上述の実施の形態に限定されるものではない。例えば、上述の制御部や設定部の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。
[Modifications, etc.]
The present invention is not limited to the embodiment described above. For example, the processes of the control unit and the setting unit described above are not only executed in time series according to the description, but may also be executed in parallel or individually as required by the processing capability of the apparatus that executes the process. Needless to say, other modifications are possible without departing from the spirit of the present invention.

制御部や設定部の構成をコンピュータによって実現する場合、これらが有すべき機能の処理内容はプログラムによって記述される。このプログラムをコンピュータで実行することにより、それらの処理機能がコンピュータ上で実現される。この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体の例は、非一時的な(non-transitory)記録媒体である。このような記録媒体の例は、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等である。   When the configuration of the control unit and the setting unit is realized by a computer, the processing contents of the functions that these should have are described by a program. By executing this program on a computer, these processing functions are realized on the computer. The program describing the processing contents can be recorded on a computer-readable recording medium. An example of a computer-readable recording medium is a non-transitory recording medium. Examples of such a recording medium are a magnetic recording device, an optical disk, a magneto-optical recording medium, a semiconductor memory, and the like.

このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。   This program is distributed, for example, by selling, transferring, or lending a portable recording medium such as a DVD or CD-ROM in which the program is recorded. Furthermore, the program may be distributed by storing the program in a storage device of the server computer and transferring the program from the server computer to another computer via a network.

このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。処理の実行時、このコンピュータは、自己の記録装置に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。   A computer that executes such a program first stores, for example, a program recorded on a portable recording medium or a program transferred from a server computer in its own storage device. When executing the process, this computer reads a program stored in its own recording device and executes a process according to the read program. As another execution form of the program, the computer may read the program directly from the portable recording medium and execute processing according to the program, and each time the program is transferred from the server computer to the computer. The processing according to the received program may be executed sequentially. The above-described processing may be executed by a so-called ASP (Application Service Provider) type service that realizes a processing function only by an execution instruction and result acquisition without transferring a program from the server computer to the computer. Good.

上記実施形態では、コンピュータ上で所定のプログラムを実行させて本装置の処理機能が実現されたが、これらの処理機能の少なくとも一部がハードウェアで実現されてもよい。   In the above embodiment, the processing functions of the apparatus are realized by executing a predetermined program on a computer. However, at least a part of these processing functions may be realized by hardware.

1 音場再生装置
2 係数設定装置
1 Sound field reproduction device 2 Coefficient setting device

Claims (6)

指向性パターンが異なる互いに独立な複数個の放射モードの何れかまたは前記複数個の放射モードの少なくとも一部の組み合わせからなる、再生パターンで音響信号を再生する所定個の高次音源を有し、
前記再生パターンは、音響信号の反響を利用して複数個の空間領域に所望の音場を生成するために、前記放射モードのそれぞれの重みが制御されたものである、音場再生装置。
A predetermined number of higher-order sound sources for reproducing an acoustic signal in a reproduction pattern, comprising any one of a plurality of independent radiation modes having different directivity patterns or a combination of at least a part of the plurality of radiation modes,
The sound field reproducing apparatus, wherein the weight of each of the radiation modes is controlled so that the reproduction pattern generates a desired sound field in a plurality of spatial regions using the echo of an acoustic signal.
請求項1の音場再生装置であって、
前記所定個の高次音源がL個の前記高次音源hs(1),…,hs(L)であり、Lが正整数であり、前記複数個の放射モードが2N+1個の放射モードm(1),…,m(2N+1)であり、Nが正整数であり、u=1,…,Lであり、ν=1,…,2N+1であり、
νu(r,θ;k)が前記高次音源hs(u)から大域的な極座標(r,θ)までの放射モードm(ν)の波数kでの音響伝達関数であり、rが動径であり、θが偏角であり、M(k)が正整数であり、m=−M(k),…,M(k)であり、αmνu(k)が前記音響伝達関数Hνu(r,θ;k)のmについての展開係数であり、A(k)がαmνu(k)を要素とする(2M(k)+1)×L’の行列であり、L’=L(2N+1)であり、

であり、[・]は[・]の転置を表し、

であり、β (k)は前記所望の音場が生成された前記複数個の空間領域を含む領域の極座標(r,θ)での波数kの周波数領域信号S(r,θ;k)のmについての展開係数であり、g(k)がA(k)g(k)=β(k)の解または近似解であり、
前記再生パターンは、前記高次音源hs(u)の波数kでの放射モードm(ν)に対するフィルタ重みを

としたパターンである、音場再生装置。
The sound field reproducing apparatus according to claim 1,
The predetermined high-order sound sources are L high-order sound sources hs (1),..., Hs (L), L is a positive integer, and the plurality of radiation modes are 2N V +1 radiation modes. m (1), ..., m (2N V +1), N V is a positive integer, u = 1, ..., L, ν = 1, ..., 2N V +1,
H νu (r, θ; k) is an acoustic transfer function at the wave number k of the radiation mode m (ν) from the higher-order sound source hs (u) to the global polar coordinate (r, θ), and r , Θ is a declination, M 0 (k) is a positive integer, m = −M 0 (k),..., M 0 (k), and α mνu (k) is the acoustic transmission. The expansion coefficient of the function H νu (r, θ; k) with respect to m, and A (k) is a matrix of (2M 0 (k) +1) × L ′ with α mνu (k) as elements, and L '= L (2N V +1),

[•] T represents the transpose of [•]

Β d m (k) is a frequency domain signal S d (r, θ; wavenumber k) in polar coordinates (r, θ) of an area including the plurality of spatial areas in which the desired sound field is generated. k) is the expansion coefficient for m, and g (k) is a solution or approximate solution of A (k) g (k) = β d (k),
The reproduction pattern is a filter weight for the radiation mode m (ν) at the wave number k of the higher-order sound source hs (u).

The sound field reproduction device which is the pattern.
請求項2の音場再生装置であって、
νu(a,θ;k)が大域的な極座標(a,θ)に配置されたマイクロホンMIC(q)(ただし、q=1,…,Q)での観測音響信号に基づいて得られる前記高次音源hs(u)から前記極座標(a,θ)までの放射モードm(ν)の波数kでの音響伝達関数であり、aが動径であり、θが偏角であり、

であり、iが虚数単位であり、H’(・)が次数mの第一種のハンケル関数の導関数であり、

であり、(・)*が(・)の複素共役を表し、λeqが等価正則化パラメータであり、|(・)|が(・)の絶対値を表し、

である、音場再生装置。
The sound field reproducing device according to claim 2,
H νu (a, θ q ; k) is obtained based on the acoustic signal observed by the microphone MIC (q) (where q = 1,..., Q) arranged at the global polar coordinates (a, θ q ). Is an acoustic transfer function at a wave number k of the radiation mode m (ν) from the higher-order sound source hs (u) to the polar coordinates (a, θ q ), a is a radial, and θ q is a declination Yes,

I is an imaginary unit, H ′ m (·) is a derivative of the first-class Hankel function of degree m,

(•) * represents the complex conjugate of (•), λ eq is the equivalent regularization parameter, | (•) | represents the absolute value of (•),

A sound field reproduction device.
所定個の高次音源が、指向性パターンが異なる互いに独立な複数個の放射モードの何れかまたは前記複数個の放射モードの少なくとも一部の組み合わせからなる、再生パターンで音響信号を再生し、
前記再生パターンは、音響信号の反響を利用して複数個の空間領域に所望の音場を生成するために、前記放射モードのそれぞれの重みが制御されたものである、音場再生方法。
A predetermined number of high-order sound sources reproduces an acoustic signal with a reproduction pattern consisting of any one of a plurality of independent radiation modes having different directivity patterns or a combination of at least some of the plurality of radiation modes,
The sound reproduction method according to claim 1, wherein the weight of each of the radiation modes is controlled so that the reproduction pattern generates a desired sound field in a plurality of spatial regions using the echo of an acoustic signal.
請求項4の音場再生方法であって、
前記所定個の高次音源がL個の前記高次音源hs(1),…,hs(L)であり、Lが正整数であり、前記複数個の放射モードが2N+1個の放射モードm(1),…,m(2N+1)であり、Nが正整数であり、u=1,…,Lであり、ν=1,…,2N+1であり、
νu(r,θ;k)が前記高次音源hs(u)から大域的な極座標(r,θ)までの放射モードm(ν)の波数kでの音響伝達関数であり、rが動径であり、θが偏角であり、M(k)が正整数であり、m=−M(k),…,M(k)であり、αmνu(k)が前記音響伝達関数Hνu(r,θ;k)のmについての展開係数であり、A(k)がαmνu(k)を要素とする(2M(k)+1)×L’の行列であり、L’=L(2N+1)であり、

であり、[・]は[・]の転置を表し、

であり、β (k)は前記所望の音場が生成された前記複数個の空間領域を含む領域の極座標(r,θ)での波数kの周波数領域信号S(r,θ;k)のmについての展開係数であり、g(k)がA(k)g(k)=β(k)の解または近似解であり、
前記再生パターンは、前記高次音源hs(u)の波数kでの放射モードm(ν)に対するフィルタ重みを

としたパターンである、音場再生方法。
The sound field reproduction method according to claim 4,
The predetermined high-order sound sources are L high-order sound sources hs (1),..., Hs (L), L is a positive integer, and the plurality of radiation modes are 2N V +1 radiation modes. m (1), ..., m (2N V +1), N V is a positive integer, u = 1, ..., L, ν = 1, ..., 2N V +1,
H νu (r, θ; k) is an acoustic transfer function at the wave number k of the radiation mode m (ν) from the higher-order sound source hs (u) to the global polar coordinate (r, θ), and r , Θ is a declination, M 0 (k) is a positive integer, m = −M 0 (k),..., M 0 (k), and α mνu (k) is the acoustic transmission. The expansion coefficient of the function H νu (r, θ; k) with respect to m, and A (k) is a matrix of (2M 0 (k) +1) × L ′ with α mνu (k) as elements, and L '= L (2N V +1),

[•] T represents the transpose of [•]

Β d m (k) is a frequency domain signal S d (r, θ; wavenumber k) in polar coordinates (r, θ) of an area including the plurality of spatial areas in which the desired sound field is generated. k) is the expansion coefficient for m, and g (k) is a solution or approximate solution of A (k) g (k) = β d (k),
The reproduction pattern is a filter weight for the radiation mode m (ν) at the wave number k of the higher-order sound source hs (u).

The sound field reproduction method that is the pattern.
請求項5の音場再生方法であって、
νu(a,θ;k)が大域的な極座標(a,θ)に配置されたマイクロホンMIC(q)(ただし、q=1,…,Q)での観測音響信号に基づいて得られる前記高次音源hs(u)から前記極座標(a,θ)までの放射モードm(ν)の波数kでの音響伝達関数であり、aが動径であり、θが偏角であり、

であり、iが虚数単位であり、H’(・)が次数mの第一種のハンケル関数の導関数であり、

であり、(・)*が(・)の複素共役であり、λeqが等価正則化パラメータであり、|(・)|が(・)の絶対値を表し、

である、音場再生方法。
The sound field reproduction method according to claim 5,
H νu (a, θ q ; k) is obtained based on the acoustic signal observed by the microphone MIC (q) (where q = 1,..., Q) arranged at the global polar coordinates (a, θ q ). Is an acoustic transfer function at a wave number k of the radiation mode m (ν) from the higher-order sound source hs (u) to the polar coordinates (a, θ q ), a is a radial, and θ q is a declination Yes,

I is an imaginary unit, H ′ m (·) is a derivative of the first-class Hankel function of degree m,

(·) * Is the complex conjugate of (·), λ eq is the equivalent regularization parameter, | (·) | represents the absolute value of (·),

A sound field reproduction method.
JP2015151874A 2015-07-31 2015-07-31 Sound field reproducing apparatus and method Active JP6345633B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015151874A JP6345633B2 (en) 2015-07-31 2015-07-31 Sound field reproducing apparatus and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015151874A JP6345633B2 (en) 2015-07-31 2015-07-31 Sound field reproducing apparatus and method

Publications (2)

Publication Number Publication Date
JP2017034441A JP2017034441A (en) 2017-02-09
JP6345633B2 true JP6345633B2 (en) 2018-06-20

Family

ID=57989497

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015151874A Active JP6345633B2 (en) 2015-07-31 2015-07-31 Sound field reproducing apparatus and method

Country Status (1)

Country Link
JP (1) JP6345633B2 (en)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008001857A1 (en) * 2006-06-30 2008-01-03 Toa Corporation Spatial audio signal reproducing device and spatial audio signal reproducing method
NZ587483A (en) * 2010-08-20 2012-12-21 Ind Res Ltd Holophonic speaker system with filters that are pre-configured based on acoustic transfer functions
JP5417352B2 (en) * 2011-01-27 2014-02-12 株式会社東芝 Sound field control apparatus and method
JP5679304B2 (en) * 2011-02-15 2015-03-04 日本電信電話株式会社 Multipole loudspeaker group and arrangement method thereof, acoustic signal output device and method thereof, active noise control device and sound field reproduction device using the method, and method and program thereof

Also Published As

Publication number Publication date
JP2017034441A (en) 2017-02-09

Similar Documents

Publication Publication Date Title
CN102089634B (en) Reconstructing an acoustic field
JP6620140B2 (en) Method, computer-readable storage medium and apparatus for constructing a three-dimensional wave field representation of a three-dimensional wave field using a two-dimensional sensor array
Koyama et al. Optimizing source and sensor placement for sound field control: An overview
CN104584588B (en) The method and apparatus for audio playback is represented for rendering audio sound field
Foote Discriminating between the nearfield and the farfield of acoustic transducers
Zhang et al. Transient nearfield acoustic holography based on an interpolated time-domain equivalent source method
Yang et al. Functional delay and sum beamforming for three-dimensional acoustic source identification with solid spherical arrays
Landschoot et al. Model-based Bayesian direction of arrival analysis for sound sources using a spherical microphone array
Chardon et al. A blind dereverberation method for narrowband source localization
JP6106571B2 (en) Sound source position estimating apparatus, method and program
Caviedes-Nozal et al. A Bayesian spherical harmonics source radiation model for sound field control
JP6345634B2 (en) Sound field reproducing apparatus and method
JP6345633B2 (en) Sound field reproducing apparatus and method
WO2019167671A1 (en) Microphone array, recording device and method, and program
JP2018077139A (en) Sound field estimation device, sound field estimation method and program
JP2019050492A (en) Filter coefficient determining device, filter coefficient determining method, program, and acoustic system
Liu et al. Sound field reconstruction using multipole equivalent source model with un-fixed source locations
Bu et al. Parameterization of the three-dimensional room transfer function in horizontal plane
JP2019075616A (en) Sound field recording apparatus and sound field recording method
Zhu et al. An experimental study on transfer function estimation using acoustic modelling and singular value decomposition
JP6294805B2 (en) Sound collector
JP6228945B2 (en) Sound field reproduction apparatus, sound field reproduction method, and program
CN110637466B (en) Loudspeaker array and signal processing device
JP2017130899A (en) Sound field estimation device, method therefor and program
Sun et al. Secondary channel estimation in spatial active noise control systems using a single moving higher order microphone

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170829

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180511

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180522

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180523

R150 Certificate of patent or registration of utility model

Ref document number: 6345633

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150