JP4922211B2 - Acoustic signal converter, method and program thereof - Google Patents

Acoustic signal converter, method and program thereof Download PDF

Info

Publication number
JP4922211B2
JP4922211B2 JP2008057331A JP2008057331A JP4922211B2 JP 4922211 B2 JP4922211 B2 JP 4922211B2 JP 2008057331 A JP2008057331 A JP 2008057331A JP 2008057331 A JP2008057331 A JP 2008057331A JP 4922211 B2 JP4922211 B2 JP 4922211B2
Authority
JP
Japan
Prior art keywords
acoustic
signal
original
physical quantity
sound field
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2008057331A
Other languages
Japanese (ja)
Other versions
JP2009218655A (en
Inventor
彰男 安藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Japan Broadcasting Corp filed Critical Japan Broadcasting Corp
Priority to JP2008057331A priority Critical patent/JP4922211B2/en
Publication of JP2009218655A publication Critical patent/JP2009218655A/en
Application granted granted Critical
Publication of JP4922211B2 publication Critical patent/JP4922211B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Description

本発明は、あるチャンネル数に対応する音響信号を、そのチャンネル数と異なるチャンネル数に対応する音響信号に変換する音響信号換装置、その方法及びそのプログラムに関する。   The present invention relates to an acoustic signal conversion device that converts an acoustic signal corresponding to a certain number of channels into an acoustic signal corresponding to a number of channels different from the number of channels, a method thereof, and a program thereof.

従来から、5.1チャンネルサラウンドシステム用の音響信号を、2チャンネルステレオシステム用の音響信号に変換するダウンミックス法は、ITU−R(国際電気通信連合 無線通信部門)によって規格化されている(例えば、非特許文献1参照)。
また、この規格とは別に、ダウンミックスを行う発明が開示されている(例えば、特許文献1参照)。特許文献1に記載されたダウンミックス装置は、ダウンミックス前の音響信号から、3次元的な定位を正確に再現したダウンミックス後の音響信号を生成するものである。
Conventionally, a downmix method for converting an audio signal for a 5.1 channel surround system into an audio signal for a 2 channel stereo system has been standardized by the ITU-R (International Telecommunication Union Radiocommunication Division) ( For example, refer nonpatent literature 1).
In addition to this standard, an invention for downmixing is disclosed (for example, see Patent Document 1). The downmix device described in Patent Document 1 generates an acoustic signal after downmix that accurately reproduces a three-dimensional localization from an acoustic signal before downmix.

また、音響信号を3次元的にパンニングする発明も開示されている(例えば、特許文献2,3参照)。特許文献2に記載された3次元的パンニング装置は、スピーカの配置にかかわらず音響信号を3次元的にパンニングするものである。また、特許文献3に記載された3次元的パンニング装置は、音源の3次元的なパンニングを、複数のスピーカが放射する音響信号によって形成される音響のパンニングとして再生するものである。
特開2007−53624号公報 特開2007−194900号公報 特開2007−329746号公報 RECOMMENDATION ITU−R BS.775−2「MULTICHANNEL STEREOPHONIC SOUND SYSTEM WITH AND WITHOUT ACCOMPANYING PICTURE」
An invention for panning an acoustic signal three-dimensionally is also disclosed (see, for example, Patent Documents 2 and 3). The three-dimensional panning device described in Patent Document 2 pans an acoustic signal three-dimensionally regardless of the arrangement of speakers. In addition, the three-dimensional panning apparatus described in Patent Document 3 reproduces the three-dimensional panning of a sound source as an acoustic panning formed by acoustic signals radiated from a plurality of speakers.
JP 2007-53624 A JP 2007-194900 A JP 2007-329746 A RECOMMENDATION ITU-R BS. 775-2 “MULTICHANNEL STREOPHONIC SOUND SYSTEM WITH AND WITHOUT ACCOMPANYING PICTURE”

しかし、音響信号のチャンネル数を任意に変換すること、例えば、5.1チャンネルサラウンドシステム用の音響信号を、スーパーハイビジョン用の22.2チャンネル音響システム用の音響信号又はWFS(Wave Field Synthesis)等の波面合成音響システム用の音響信号に変換することは一般的でない。そこで、音響コンテンツの流通を促進するため、音響信号を送信又は収録するチャンネル数や音響信号を再生するチャンネル数を制限されることなく、音響信号のチャンネル数を任意に変換したいという要望がなされている。   However, it is possible to arbitrarily convert the number of channels of an acoustic signal, for example, an acoustic signal for a 5.1 channel surround system, an acoustic signal for a 22.2 channel acoustic system for Super Hi-Vision, or WFS (Wave Field Synthesis). It is not common to convert to an acoustic signal for a wavefront synthesis acoustic system. Therefore, in order to promote the distribution of audio content, there is a demand to arbitrarily convert the number of channels of the audio signal without limiting the number of channels for transmitting or recording the audio signal and the number of channels for reproducing the audio signal. Yes.

また、特許文献1〜3に記載の発明は、1点を示す受音点(通常、利用者の頭部付近)において、良好なリスニング環境となるように音響信号を変換している。このため、特許文献1〜3に記載の発明では、利用者が体を少し動かすだけで頭部が受音点から外れてしまうので、利用者の動きや、複数の利用者が同じ空間で同じ音楽を聴きたいときに対応できず、良好なリスニング環境を提供できていない問題がある。   In addition, the inventions described in Patent Documents 1 to 3 convert an acoustic signal so as to provide a good listening environment at a sound receiving point (usually near the user's head) indicating one point. For this reason, in the inventions described in Patent Documents 1 to 3, the user moves the body a little and the head moves away from the sound receiving point. Therefore, the movement of the user and a plurality of users are the same in the same space. There is a problem that it is not possible to respond to listening to music and a good listening environment cannot be provided.

本発明は、音響信号のチャンネル数を任意に変換できると共に、変換した音響信号を再生する際、良好なリスニング環境を提供できる音響信号変換装置、その方法及びそのプログラムを提供することを目的とする。   An object of the present invention is to provide an acoustic signal converter, a method thereof, and a program thereof that can arbitrarily convert the number of channels of an acoustic signal and provide a good listening environment when reproducing the converted acoustic signal. .

前記した課題を解決するため、請求項1に係る音響信号変換装置は、1以上のチャンネル数に対応する原音響信号を、原音響信号のチャンネル数と異なるチャンネル数に対応する再生音響信号に変換する音響信号変換装置であって、フーリエ変換手段と、原音場ベクトル生成手段と、音響信号変換手段と、再生音場ベクトル生成手段と、変換行列設定手段と、フーリエ逆変換手段と、を備える構成とした。   In order to solve the above-described problem, the acoustic signal conversion device according to claim 1 converts an original acoustic signal corresponding to one or more channels into a reproduced acoustic signal corresponding to a number of channels different from the number of channels of the original acoustic signal. An acoustic signal conversion device that includes Fourier transform means, original sound field vector generation means, acoustic signal conversion means, reproduction sound field vector generation means, conversion matrix setting means, and Fourier inverse transform means It was.

かかる構成において、音響信号変換装置は、フーリエ変換手段によって、入力された原音響信号を、原音響信号を再生する原音場での音響物理量を示す原音響物理量信号にフーリエ変換する。このように、原音響信号をフーリエ変換することで、音響信号変換装置は、原音場での音響物理量を扱うことができる。ここで、音響物理量は、音圧又は粒子速度の少なくとも一方を含む。また、音響信号変換装置は、原音場ベクトル生成手段によって、フーリエ変換手段がフーリエ変換した原音響物理量信号に基づいて、原音場での音響物理量を成分とする原音場ベクトルを生成する。   In such a configuration, the acoustic signal conversion device Fourier-transforms the input original acoustic signal into an original acoustic physical quantity signal indicating an acoustic physical quantity in the original sound field for reproducing the original acoustic signal by the Fourier transform means. Thus, the acoustic signal converter can handle the acoustic physical quantity in the original sound field by Fourier transforming the original acoustic signal. Here, the acoustic physical quantity includes at least one of sound pressure and particle velocity. In the acoustic signal conversion device, the original sound field vector generation means generates an original sound field vector whose component is an acoustic physical quantity in the original sound field, based on the original acoustic physical quantity signal Fourier-transformed by the Fourier transform means.

また、音響信号変換装置は、音響信号変換手段によって、フーリエ変換手段がフーリエ変換した原音響物理量信号を、所定の変換行列に基づいて、再生音響信号を再生する再生音場での音響物理量を示す再生音響物理量信号に変換する。このように、原音響物理量信号を変換することで、音響信号変換装置は、再生音場での音響物理量を扱うことができる。ここでは、音響信号変換装置は、再生音響物理量信号を得るために、初期値としての変換行列を用いる。   The acoustic signal conversion device indicates an acoustic physical quantity in a reproduction sound field for reproducing a reproduction acoustic signal based on a predetermined transformation matrix from the original acoustic physical quantity signal Fourier-transformed by the Fourier transformation means by the acoustic signal conversion means. Converts to a reproduced acoustic physical quantity signal. In this way, by converting the original acoustic physical quantity signal, the acoustic signal conversion device can handle the acoustic physical quantity in the reproduction sound field. Here, the acoustic signal converter uses a transformation matrix as an initial value in order to obtain a reproduced acoustic physical quantity signal.

また、音響信号変換装置は、再生音場ベクトル生成手段によって、音響信号変換手段が変換した再生音響物理量信号に基づいて、再生音場での音響物理量を成分とする再生音場ベクトルを生成する。また、音響信号変換装置は、変換行列設定手段によって、所定の受音領域において、原音場ベクトルと再生音場ベクトルとの二乗誤差が最小となる変換行列を設定する。ここで、受音領域は、利用者の数、利用者の頭部位置その他リスニング環境に応じて、その形状や大きさを任意に設定、例えば、縦0.4m×横0.4mの正方形である平面又は縦0.4m×横0.4m×高さ0.4の立方体である空間として設定する。   In the acoustic signal conversion device, the reproduction sound field vector generation unit generates a reproduction sound field vector having an acoustic physical quantity in the reproduction sound field as a component based on the reproduction acoustic physical quantity signal converted by the acoustic signal conversion unit. Further, the acoustic signal conversion apparatus sets a conversion matrix that minimizes the square error between the original sound field vector and the reproduced sound field vector in a predetermined sound receiving region by the conversion matrix setting unit. Here, the sound receiving area is arbitrarily set in shape and size according to the number of users, the user's head position, and other listening environments, for example, a square of 0.4 m in length and 0.4 m in width. It is set as a space which is a certain plane or a cube of 0.4 m length × 0.4 m width × 0.4 height.

また、音響信号変換装置は、音響信号変換手段によって、変換行列設定手段が設定した変換行列に基づいて、原音響物理量信号を再生音響物理量信号に再変換する。このように、原音響物理量信号を再変換することで、音響信号変換装置は、原音場での音響物理量と再生音場での音響物理量との二乗誤差を最小にすることができる。また、音響信号変換装置は、フーリエ逆変換手段によって、音響信号変換手段が変換した再生音響物理量信号を、再生音響信号にフーリエ逆変換する。これによって、音響信号変換装置は、原音響信号と略同じ又は可能な限り近似した再生音響信号を得ることができる。さらに、音響信号変換装置は、1点を示す受音点よりも広い受音領域に対応するため、利用者の動きや、複数の利用者が同じ空間で同じ音楽を聴きたいときにも対応できる。   The acoustic signal conversion apparatus reconverts the original acoustic physical quantity signal into the reproduced acoustic physical quantity signal based on the transformation matrix set by the transformation matrix setting means by the acoustic signal conversion means. Thus, by reconverting the original acoustic physical quantity signal, the acoustic signal conversion device can minimize the square error between the acoustic physical quantity in the original sound field and the acoustic physical quantity in the reproduced sound field. Further, the acoustic signal conversion device performs inverse Fourier transform of the reproduced acoustic physical quantity signal converted by the acoustic signal conversion unit into a reproduced acoustic signal by the inverse Fourier transform unit. Thereby, the acoustic signal converter can obtain a reproduced acoustic signal that is substantially the same as the original acoustic signal or as close as possible. Furthermore, since the acoustic signal converter corresponds to a sound receiving area wider than the sound receiving point indicating one point, it can cope with movements of users and when a plurality of users want to listen to the same music in the same space. .

請求項2に係る音響信号変換装置は、原音響信号のチャンネルに対応する原スピーカの位置と、再生音響信号のチャンネルに対応する再生スピーカの位置とを記憶する記憶手段、をさらに備え、変換行列設定手段が、再生スピーカが22.2チャンネル音響システムのように3次元に配置されている場合、記憶手段が記憶する原スピーカの位置と再生スピーカの位置とに基づいて、再生音場で隣接する3個以上の再生スピーカに囲まれる分割領域を求め、受音領域までの仮想線が分割領域を通過する原スピーカについて、原スピーカに対応する原音響信号のチャンネルを、3個以上の再生スピーカに対応する再生音響信号のチャンネルに割り当てる変換行列を設定することを特徴とする。
一方、再生スピーカが5.1チャンネルサラウンドシステムのように2次元に配置されている場合、変換行列設定手段は、2個以上の再生スピーカに囲まれる分割領域を用いても良い。
The acoustic signal conversion device according to claim 2 further includes storage means for storing the position of the original speaker corresponding to the channel of the original acoustic signal and the position of the reproduction speaker corresponding to the channel of the reproduced acoustic signal, and a conversion matrix. If the reproduction speaker is arranged three-dimensionally as in the 22.2 channel sound system, the setting means is adjacent in the reproduction sound field based on the position of the original speaker and the position of the reproduction speaker stored by the storage means. A divided area surrounded by three or more reproduction speakers is obtained, and for an original speaker in which a virtual line to the sound receiving area passes through the divided area, the channel of the original sound signal corresponding to the original speaker is set to three or more reproduction speakers. It is characterized in that a conversion matrix assigned to the channel of the corresponding reproduced sound signal is set.
On the other hand, when the reproduction speakers are two-dimensionally arranged as in the 5.1 channel surround system, the transformation matrix setting unit may use a divided area surrounded by two or more reproduction speakers.

かかる構成において、音響信号変換装置は、原音場でのあるチャンネルの音が聞こえる方向と、再生音場でそのチャンネルの音が聞こえる方向とが全く異なってしまう事態を防ぐことができる。   In such a configuration, the acoustic signal conversion device can prevent a situation in which the direction in which the sound of a channel in the original sound field is heard and the direction in which the sound of the channel is heard in the reproduction sound field are completely different.

請求項3に係る音響信号変換装置は、フーリエ変換手段が、原音響信号を、原音場での音響物理量として、スカラー量である原音場での音圧と3次元ベクトル量である原音場での粒子速度とを含む原音響物理量信号にフーリエ変換し、原音場ベクトル生成手段が、原音場での音圧と原音場での粒子速度とを成分とする4次元ベクトルである原音場ベクトルを生成し、音響信号変換手段が、原音響物理量信号を、再生音場での音響物理量として、スカラー量である再生音場での音圧と3次元ベクトル量である再生音場での粒子速度とを含む再生音響物理量信号に変換し、再生音場ベクトル生成手段が、再生音場での音圧と再生音場での粒子速度とを成分とする4次元ベクトルである再生音場ベクトルを生成することを特徴とする。   In the acoustic signal conversion device according to claim 3, the Fourier transform means uses the original sound signal as an acoustic physical quantity in the original sound field, the sound pressure in the original sound field as a scalar quantity, and the original sound field as a three-dimensional vector quantity. The original sound field vector generation means generates an original sound field vector that is a four-dimensional vector having the sound pressure in the original sound field and the particle velocity in the original sound field as components. The acoustic signal conversion means includes the original acoustic physical quantity signal as the acoustic physical quantity in the reproduced sound field, and includes the sound pressure in the reproduced sound field as a scalar quantity and the particle velocity in the reproduced sound field as a three-dimensional vector quantity. It is converted into a reproduction acoustic physical quantity signal, and the reproduction sound field vector generating means generates a reproduction sound field vector that is a four-dimensional vector having the sound pressure in the reproduction sound field and the particle velocity in the reproduction sound field as components. Features.

かかる構成において、音響信号変換装置は、原音場ベクトル及び再生音場ベクトルとして、音圧と粒子速度とを成分とする4次元ベクトルを扱うことができる。これによって、音響信号変換装置は、スカラー量である音圧を、3次元ベクトルに変換する必要がない。   In this configuration, the acoustic signal converter can handle a four-dimensional vector having sound pressure and particle velocity as components as the original sound field vector and the reproduced sound field vector. Thus, the acoustic signal conversion device does not need to convert the sound pressure, which is a scalar amount, into a three-dimensional vector.

また、前記した課題を解決するため、請求項4に係る音響信号変換方法は、1以上のチャンネル数に対応する原音響信号を、原音響信号のチャンネル数と異なるチャンネル数に対応する再生音響信号に変換する音響信号変換方法であって、フーリエ変換ステップと、原音場ベクトル生成ステップと、音響信号変換ステップと、再生音場ベクトル生成ステップと、変換行列設定ステップと、音響信号再変換ステップと、フーリエ逆変換ステップと、を備える構成とした。   In addition, in order to solve the above-described problem, the acoustic signal conversion method according to claim 4 uses an original acoustic signal corresponding to one or more channels as a reproduced acoustic signal corresponding to a number of channels different from the number of channels of the original acoustic signal. An acoustic signal conversion method for converting to a Fourier transform step, an original sound field vector generation step, an acoustic signal conversion step, a reproduction sound field vector generation step, a conversion matrix setting step, an acoustic signal reconversion step, And a Fourier inverse transform step.

また、前記した課題を解決するため、請求項5に係る音響信号変換プログラムは、1以上のチャンネル数に対応する原音響信号を、当該原音響信号のチャンネル数と異なるチャンネル数に対応する再生音響信号に変換するために、コンピュータを、フーリエ変換手段、原音場ベクトル生成手段、音響信号変換手段、再生音場ベクトル生成手段、変換行列設定手段、フーリエ逆変換手段、として機能させる構成とした。   In order to solve the above-described problem, an acoustic signal conversion program according to claim 5 is configured to reproduce an original sound signal corresponding to one or more channels with a reproduced sound corresponding to a number of channels different from the number of channels of the original sound signal. In order to convert the signal, the computer is configured to function as a Fourier transform unit, an original sound field vector generation unit, an acoustic signal conversion unit, a reproduction sound field vector generation unit, a transformation matrix setting unit, and a Fourier inverse transform unit.

本発明に係る音響信号変換装置、その方法及びそのプログラムによれば、以下のような優れた効果を奏する。
請求項1,4,5に係る発明によれば、原音響信号と略同じ又は可能な限り近似した再生音響信号を得ることができ、利用者の動きや、複数の利用者が同じ空間で同じ音楽を聴きたいときにも対応できるため、音響信号のチャンネル数を任意に変換できると共に、変換した再生音響信号を再生する際、良好なリスニング環境を提供することができる。
請求項2に係る発明によれば、原音場であるチャンネルの音が聞こえる方向と、再生音場でそのチャンネルの音が聞こえる方向とが全く異なってしまう事態を防げるため、リスニング環境をより良好にすることができる。
請求項3に係る発明によれば、スカラー量をそのまま扱うことができるため、音圧を3次元ベクトルに変換して扱う必要がない。
According to the acoustic signal conversion device, the method and the program thereof according to the present invention, the following excellent effects can be obtained.
According to the inventions according to claims 1, 4, and 5, it is possible to obtain a reproduced sound signal that is substantially the same as the original sound signal or as close as possible, and the movement of the user and a plurality of users are the same in the same space. Since it is possible to cope with listening to music, it is possible to arbitrarily convert the number of channels of the acoustic signal, and to provide a good listening environment when reproducing the converted reproduced acoustic signal.
According to the second aspect of the present invention, it is possible to prevent a situation in which the direction in which the sound of the channel that is the original sound field is heard from the direction in which the sound of the channel is heard in the reproduction sound field is completely different. can do.
According to the invention of claim 3, since the scalar quantity can be handled as it is, it is not necessary to convert the sound pressure into a three-dimensional vector.

以下、本発明の実施形態について、適宜図面を参照しながら詳細に説明する。なお、各実施形態において、同一の機能を有する手段及び同一の部材には同一の符号を付し、説明を省略した。   Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings as appropriate. In each embodiment, means having the same function and the same member are denoted by the same reference numerals, and description thereof is omitted.

[音響信号変換装置の概略]
まず、本発明に係る音響信号変換装置の概略について、簡単に説明する。
音圧は、音波が到達した際、空気圧の微小な変化量であり、スカラー量として与えられる。音の響きがさほど大きくない空間では、ある音源から所定の距離だけ離れた受音点の音圧のフーリエ変換は、式(1)で表される。
[Outline of acoustic signal converter]
First, the outline of the acoustic signal converter according to the present invention will be briefly described.
The sound pressure is a minute change in air pressure when a sound wave arrives, and is given as a scalar amount. In a space where the sound reverberation is not so large, the Fourier transform of the sound pressure at the sound receiving point that is separated from a certain sound source by a predetermined distance is expressed by Expression (1).

粒子速度は、音波が到達した際、流体(空気)が微小に振動する速度であり、3次元のベクトル量として与えられる。また、音波と同じ条件において、粒子速度のフーリエ変換は、式(2)で表される。   The particle velocity is a velocity at which the fluid (air) minutely vibrates when a sound wave arrives, and is given as a three-dimensional vector quantity. Further, under the same condition as that of the sound wave, the Fourier transform of the particle velocity is expressed by the equation (2).

従って、音圧と粒子速度との両者を制御して音響信号の変換を行う場合、音圧と、粒子速度のx,y,z軸方向(3次元方向)の各成分を要素とする4次元である音場ベクトルを生成し、音場ベクトルの二乗誤差が最小となるように変換すれば良い。つまり、本発明に係る音響信号変換装置は、音場ベクトルの二乗誤差が最小となる変換行列を求めるものである。なお、スピーカが複数の場合、受音点において、各スピーカの音場ベクトルを足し合わせることで、全スピーカで音を再生するときの音場ベクトルを得ることができる。   Therefore, when the sound signal is converted by controlling both the sound pressure and the particle velocity, the sound pressure and the four-dimensional components having the respective components of the particle velocity in the x, y, and z-axis directions (three-dimensional directions) as elements. Is generated so that the square error of the sound field vector is minimized. That is, the acoustic signal conversion apparatus according to the present invention obtains a conversion matrix that minimizes the square error of the sound field vector. When there are a plurality of speakers, the sound field vectors for reproducing the sound with all the speakers can be obtained by adding the sound field vectors of the speakers at the sound receiving point.

[音響信号変換装置の構成]
次に、図1を参照して、音響信号変換装置の構成について、詳細に説明する。図1は、本発明の実施形態に係る音響信号変換装置のブロック図である。音響信号変換装置1は、後記する各機能を実現するために、フーリエ変換手段10と、原音場ベクトル生成手段20と、音響信号変換手段30と、再生音場ベクトル生成手段40と、変換行列設定手段50と、フーリエ逆変換手段60と、記憶手段70と、を備える。
[Configuration of acoustic signal converter]
Next, the configuration of the acoustic signal conversion device will be described in detail with reference to FIG. FIG. 1 is a block diagram of an acoustic signal converter according to an embodiment of the present invention. The acoustic signal conversion apparatus 1 is configured to implement a Fourier transform unit 10, an original sound field vector generation unit 20, an acoustic signal conversion unit 30, a reproduction sound field vector generation unit 40, and a conversion matrix setting in order to realize each function described later. Means 50, inverse Fourier transform means 60, and storage means 70 are provided.

図1では、原音響信号をs(t)、原音響物理量信号をs(ω)、原音場ベクトルをΦ及び変換行列をWで示した。また、再生音響信号をq(t)、再生音響物理量信号をq(ω)及び再生音場ベクトルをΦで示した。ここで、原音響信号s(t)は、原音響信号のチャンネル数、例えば、5.1チャンネルサラウンドシステムに対応するものであれば、6チャンネル入力される(不図示)。また、再生音響信号q(t)は、再生音響信号のチャンネル数、例えば、22.2チャンネル音響システムに対応するものであれば、24チャンネル出力される(不図示)。 In FIG. 1, the original sound signal is indicated by s (t), the original sound physical quantity signal is indicated by s (ω), the original sound field vector is indicated by Φ, and the transformation matrix is indicated by W. Also, the playback sound signal q (t), showed playback sound physical quantity signal q (omega) and the reproduction sound field vector Φ in ~. Here, the original sound signal s (t) is input by 6 channels (not shown) if it corresponds to the number of channels of the original sound signal, for example, a 5.1 channel surround system. The reproduced sound signal q (t) is output in 24 channels (not shown) if the number corresponds to the number of channels of the reproduced sound signal, for example, 22.2 channel sound system.

フーリエ変換手段10は、入力された原音響信号を、原音響信号を再生する原音場での音響物理量を示す原音響物理量信号にフーリエ変換するものである。また、フーリエ変換手段10は、原音響信号を、原音場での音響物理量として、スカラー量である原音場での音圧と3次元ベクトル量である原音場での粒子速度とを含む原音響物理量信号にフーリエ変換する。   The Fourier transform means 10 performs a Fourier transform on the input original sound signal to an original sound physical quantity signal indicating an acoustic physical quantity in an original sound field for reproducing the original sound signal. Further, the Fourier transform means 10 uses the original acoustic signal as an acoustic physical quantity in the original sound field, and includes an original acoustic physical quantity including a sound pressure in the original sound field as a scalar quantity and a particle velocity in the original sound field as a three-dimensional vector quantity. Fourier transform the signal.

ここで、フーリエ変換手段10は、原音響信号を、式(3)を用いて、原音場での音圧にフーリエ変換する。   Here, the Fourier transform means 10 Fourier transforms the original sound signal to the sound pressure in the original sound field using Expression (3).

また、フーリエ変換手段10は、原音響信号を、式(4)を用いて、原音場での粒子速度にフーリエ変換する。   Further, the Fourier transform means 10 performs Fourier transform of the original sound signal to the particle velocity in the original sound field using Expression (4).

原音場ベクトル生成手段20は、フーリエ変換手段10がフーリエ変換した原音響物理量信号に基づいて、原音場での音響物理量を成分とする原音場ベクトルを生成するものである。また、原音場ベクトル生成手段20は、原音場での音圧と原音場での粒子速度とを成分とする4次元ベクトルである原音場ベクトルを生成する。   The original sound field vector generation means 20 generates an original sound field vector whose component is an acoustic physical quantity in the original sound field, based on the original acoustic physical quantity signal Fourier-transformed by the Fourier transform means 10. Further, the original sound field vector generation means 20 generates an original sound field vector which is a four-dimensional vector having the sound pressure in the original sound field and the particle velocity in the original sound field as components.

ここで、原音場ベクトル生成手段20は、式(5)で表される原音場ベクトルを生成する。   Here, the original sound field vector generation means 20 generates an original sound field vector represented by Expression (5).

音響信号変換手段30は、所定の変換行列に基づいて、フーリエ変換手段10がフーリエ変換した原音響物理量信号を、再生音響信号を再生する再生音場での音響物理量を示す再生音響物理量信号に変換するものである。また、音響信号変換手段30は、原音響物理量信号を、再生音場での音響物理量として、スカラー量である再生音場での音圧と3次元ベクトル量である再生音場での粒子速度とを含む再生音響物理量信号に変換する。   The acoustic signal conversion means 30 converts the original acoustic physical quantity signal Fourier-transformed by the Fourier transformation means 10 into a reproduced acoustic physical quantity signal indicating an acoustic physical quantity in a reproduction sound field for reproducing the reproduction acoustic signal based on a predetermined transformation matrix. To do. The acoustic signal conversion means 30 uses the original acoustic physical quantity signal as the acoustic physical quantity in the reproduced sound field, the sound pressure in the reproduced sound field as a scalar quantity, and the particle velocity in the reproduced sound field as a three-dimensional vector quantity. Is converted to a reproduced acoustic physical quantity signal.

このとき、原音響物理量信号を再生音響物理量信号に変換するために、変換行列が必要となる。しかし、音響信号変換装置1を初めて使用する場合や音響信号変換装置1を新たな音響システムに対応させる場合等、変換行列が設定されていない場合が考えられる。このため、初期値としての変換行列を記憶手段70に記憶させておき、音響信号変換手段30は、初期値としての変換行列を用いて、原音響物理量信号を再生音響物理量信号に変換する。そして、後記する変換行列設定手段50が、二乗誤差が最小となる変換行列を設定し、音響信号変換手段30は、この変換行列に基づいて、原音響物理量信号を再生音響物理量信号に再変換する。   At this time, a conversion matrix is required to convert the original acoustic physical quantity signal into the reproduced acoustic physical quantity signal. However, when the acoustic signal conversion device 1 is used for the first time, or when the acoustic signal conversion device 1 is made to correspond to a new acoustic system, there are cases where no conversion matrix is set. For this reason, a conversion matrix as an initial value is stored in the storage means 70, and the acoustic signal conversion means 30 converts the original acoustic physical quantity signal into a reproduced acoustic physical quantity signal using the conversion matrix as an initial value. Then, the conversion matrix setting means 50 described later sets a conversion matrix that minimizes the square error, and the acoustic signal conversion means 30 reconverts the original acoustic physical quantity signal into a reproduced acoustic physical quantity signal based on this transformation matrix. .

ここで、音響信号変換手段30は、原音響物理量信号を、式(6)を用いて、再生音場での音圧に変換する。   Here, the acoustic signal conversion means 30 converts the original acoustic physical quantity signal into a sound pressure in the reproduction sound field using Expression (6).

また、音響信号変換手段30は、原音響物理量信号を、式(7)を用いて、再生音場での粒子速度に変換する。   The acoustic signal conversion means 30 converts the original acoustic physical quantity signal into a particle velocity in the reproduction sound field using Expression (7).

以上より、音響信号変換手段30は、原音響物理量信号を、式(8)を用いて、再生音響物理量信号に変換する。   From the above, the acoustic signal conversion means 30 converts the original acoustic physical quantity signal into a reproduced acoustic physical quantity signal using Expression (8).

再生音場ベクトル生成手段40は、音響信号変換手段30が変換した再生音響物理量信号に基づいて、再生音場での音響物理量を成分とする再生音場ベクトルを生成するものである。また、再生音場ベクトル生成手段40は、再生音場での音圧と再生音場での粒子速度とを成分とする4次元ベクトルである再生音場ベクトルを生成する。ここで、再生音場ベクトル生成手段40は、式(9)で表される再生音場ベクトルを生成する。このとき、式(10)で表される定義を用いる。   The reproduction sound field vector generation unit 40 is configured to generate a reproduction sound field vector having an acoustic physical quantity in the reproduction sound field as a component based on the reproduction acoustic physical quantity signal converted by the acoustic signal conversion unit 30. The reproduction sound field vector generation means 40 generates a reproduction sound field vector that is a four-dimensional vector having the sound pressure in the reproduction sound field and the particle velocity in the reproduction sound field as components. Here, the reproduction sound field vector generation means 40 generates a reproduction sound field vector represented by Expression (9). At this time, the definition represented by Formula (10) is used.

ここで、音響物理量として、スカラー量である音圧のみを扱う場合、例えば、特許文献1〜3のように、スカラー量である音圧を3次元ベクトルに変換する必要がある。
一方、音響信号変換装置1は、音圧に加えて粒子速度を利用することにより、スカラー量である音圧をそのまま扱うことができ、このような変換を不要としている。
Here, when only the sound pressure that is a scalar quantity is handled as the acoustic physical quantity, for example, as in Patent Documents 1 to 3, it is necessary to convert the sound pressure that is the scalar quantity into a three-dimensional vector.
On the other hand, the acoustic signal conversion device 1 can handle the sound pressure as a scalar amount as it is by using the particle velocity in addition to the sound pressure, and makes such conversion unnecessary.

変換行列設定手段50は、所定の受音領域において、原音場ベクトルと再生音場ベクトルとの二乗誤差が最小となる変換行列を設定するものである。また、変換行列設定手段50は、領域分割して変換行列を設定することができるが、この具体例は、後記する。   The conversion matrix setting means 50 sets a conversion matrix that minimizes the square error between the original sound field vector and the reproduced sound field vector in a predetermined sound receiving area. Moreover, the conversion matrix setting means 50 can divide the area and set the conversion matrix. A specific example will be described later.

ここで、変換行列設定手段50は、式(11)で表される二乗誤差が最小となる変換行列を求める。   Here, the transformation matrix setting means 50 obtains a transformation matrix that minimizes the square error represented by the equation (11).

ここで、式(11)が原音響信号に依存するため、二乗誤差を算出する誤差関数を式(12)で定義する。そして、式(12)より、誤差関数が最小となる変換行列は、式(13)で表される。   Here, since equation (11) depends on the original sound signal, an error function for calculating the square error is defined by equation (12). From Equation (12), the transformation matrix that minimizes the error function is represented by Equation (13).

さらに、受音領域に対する誤差関数として、式(14)を定義する。つまり、式(14)では、ある1点(受音点)を受音領域内で移動させながら誤差関数を求めていることになる。以上より、変換行列設定手段50は、式(15)を用いて、誤差関数が最小となる変換行列を設定する。そして、前記したように、音響信号変換手段30が、この変換行列に基づいて、原音響物理量信号を再生音響物理量信号に再変換する。   Furthermore, Expression (14) is defined as an error function for the sound receiving area. That is, in Expression (14), the error function is obtained while moving a certain point (sound receiving point) within the sound receiving region. From the above, the transformation matrix setting means 50 sets the transformation matrix that minimizes the error function, using Equation (15). Then, as described above, the acoustic signal converting means 30 reconverts the original acoustic physical quantity signal into the reproduced acoustic physical quantity signal based on this conversion matrix.

フーリエ逆変換手段60は、音響信号変換手段30が変換した再生音響物理量信号を、再生音響信号にフーリエ逆変換するものである。ここでは、フーリエ逆変換手段60は、式(3)及び式(4)に対してのフーリエ逆変換を行う。   The inverse Fourier transform means 60 performs inverse Fourier transform of the reproduced acoustic physical quantity signal converted by the acoustic signal conversion means 30 into a reproduced acoustic signal. Here, the inverse Fourier transform means 60 performs inverse Fourier transform on the equations (3) and (4).

記憶手段70は、原音響信号のチャンネルに対応する原スピーカの位置と、再生音響信号のチャンネルに対応する再生スピーカの位置とを記憶するスピーカ座標記憶手段71を備える。また、記憶手段70は、原音響信号のチャンネルに対応する原スピーカの数と、再生音響信号のチャンネルに対応する再生スピーカの数とを記憶するスピーカ数記憶手段72と、受音領域の形状、大きさ及び音場内での受音領域の位置を記憶する受音領域記憶手段73とを備えても良い。   The storage means 70 includes speaker coordinate storage means 71 for storing the position of the original speaker corresponding to the channel of the original acoustic signal and the position of the reproduction speaker corresponding to the channel of the reproduced acoustic signal. The storage means 70 includes a speaker number storage means 72 for storing the number of original speakers corresponding to the channel of the original acoustic signal and the number of reproduction speakers corresponding to the channel of the reproduced acoustic signal, the shape of the sound receiving area, You may provide the sound receiving area memory | storage means 73 which memorize | stores the magnitude | size and the position of the sound receiving area in a sound field.

ここで、原スピーカの位置及び再生スピーカの位置は、任意の方法で特定することができる。例えば、これらの位置は、空間内のある点を基準とした相対的な3次元座標としても良い。また、屋外のコンサート会場に適用する場合には、スピーカの位置をGPS測位し、その座標としても良い。   Here, the position of the original speaker and the position of the reproduction speaker can be specified by an arbitrary method. For example, these positions may be three-dimensional coordinates relative to a certain point in the space. When applied to an outdoor concert venue, the position of the speaker may be measured by GPS and used as the coordinates.

音響信号変換装置1は、原スピーカの位置、再生スピーカの位置、原スピーカの数、再生スピーカ、受音領域その他必要な情報を入力するためのキーボード、マウス等の入力手段を備えても良い(不図示)。また、音響信号変換装置1は、原スピーカの位置等の情報を表示するためのディスプレイ等の表示手段を備えても良い。   The acoustic signal conversion device 1 may include input means such as a keyboard and a mouse for inputting the position of the original speaker, the position of the reproduction speaker, the number of original speakers, the reproduction speaker, the sound receiving area, and other necessary information ( Not shown). In addition, the acoustic signal conversion device 1 may include display means such as a display for displaying information such as the position of the original speaker.

なお、フーリエ変換手段10、原音場ベクトル生成手段20、音響信号変換手段30、再生音場ベクトル生成手段40、変換行列設定手段50及びフーリエ逆変換手段60は、例えば、CPU(Central Processing Unit)、ROM(Read Only Memory)及びRAM(Random Access Memory)で構成することができる。また、記憶手段70は、例えば、HDD(Hard Disk Drive)で構成することができる。   The Fourier transform unit 10, the original sound field vector generation unit 20, the acoustic signal conversion unit 30, the reproduction sound field vector generation unit 40, the transformation matrix setting unit 50, and the Fourier inverse transform unit 60 are, for example, a CPU (Central Processing Unit), A ROM (Read Only Memory) and a RAM (Random Access Memory) can be used. In addition, the storage unit 70 can be configured by, for example, an HDD (Hard Disk Drive).

[領域分割の具体例]
以下、領域分割の具体例について、詳細に説明する(適宜図1参照)。図2は、本発明における領域分割を説明するために、スピーカが配置された平面を上面視した説明図である。図2では、原スピーカを白丸で示し、再生スピーカを黒丸で示した。また、図2では、原スピーカを符号ξ(1)〜ξ(4)で示し、再生スピーカを符号ζ(1)〜ζ(7)で示し、受音領域を符号Lで示し、分割領域を符号Rで示し、受音領域Lと原スピーカを結ぶ仮想線を一点鎖線で示した。また、分割領域Rは、ハッチングで示した。なお、図2において、受音領域Lは、利用者の頭部を含む範囲で設定している。
[Specific examples of area division]
Hereinafter, a specific example of area division will be described in detail (see FIG. 1 as appropriate). FIG. 2 is an explanatory view in which a plane on which a speaker is arranged is viewed from the top in order to explain region division in the present invention. In FIG. 2, the original speaker is indicated by a white circle, and the reproduction speaker is indicated by a black circle. In FIG. 2, the original speaker is indicated by reference signs ξ (1) to ξ (4), the reproduction speaker is indicated by reference signs ζ (1) to ζ (7), the sound receiving area is indicated by reference sign L, and the divided areas are indicated. The virtual line which shows with the code | symbol R and connects the sound receiving area | region L and an original speaker was shown with the dashed-dotted line. Further, the divided region R is indicated by hatching. In FIG. 2, the sound receiving area L is set in a range including the user's head.

ここでは、音響信号変換装置1が10チャンネル(10個のスピーカ)に対応する原音響信号を領域分割し、7チャンネル(7個のスピーカ)に対応する再生音響信号に変換する例を示すが、説明のため、図2には、原スピーカのうち、4個のみを示した。   Here, an example is shown in which the acoustic signal conversion device 1 divides an original acoustic signal corresponding to 10 channels (10 speakers) and converts it into a reproduced acoustic signal corresponding to 7 channels (7 speakers). For illustration, only four of the original speakers are shown in FIG.

ここでは、変換行列設定手段50は、記憶手段70が記憶する再生スピーカの位置に基づいて、再生音場で隣接する再生スピーカに囲まれる分割領域Rを求める。ここでは、図2に示すように、分割領域Rは、再生スピーカζ(1)〜ζ(3)で囲まれる三角形状の範囲となる(再生音響信号q(ω)〜q(ω)に対応)。 Here, based on the position of the reproduction speaker stored in the storage unit 70, the transformation matrix setting unit 50 obtains the divided region R surrounded by the reproduction speakers adjacent in the reproduction sound field. Here, as shown in FIG. 2, the divided region R is a triangular range surrounded by the reproduction speakers ζ (1) to ζ (3) (reproduction acoustic signals q 1 (ω) to q 3 (ω)). Corresponding).

また、変換行列設定手段50は、記憶手段70が記憶する原スピーカの位置に基づいて、受音領域Lまでの仮想線が分割領域Rを通過する原スピーカを判別する。ここでは、図2に示すように、4個の原生スピーカξ(1)〜ξ(4)の仮想線が分割領域Rを通過する(原生音響信号s(ω)〜s(ω)に対応)。 Further, the transformation matrix setting unit 50 determines the original speaker through which the virtual line to the sound receiving region L passes through the divided region R based on the position of the original speaker stored in the storage unit 70. Here, as shown in FIG. 2, the imaginary lines of the four native speakers ξ (1) to ξ (4) pass through the divided region R (the original acoustic signals s 1 (ω) to s 4 (ω)). Correspondence).

そして、変換行列設定手段50は、受音領域Lまでの仮想線が分割領域Rを通過する原スピーカについて、原スピーカに対応する原音響信号のチャンネルを、3個以上の再生スピーカに対応する再生音響信号のチャンネルに割り当てる変換行列を設定する。ここでは、変換行列設定手段50は、4個の原生スピーカξ(1)〜ξ(4)に対応する原音響信号のチャンネルを、3個の再生スピーカζ(1)〜ζ(3)に対応する再生音響信号のチャンネルに割り当てる変換行列を設定する。   Then, the transformation matrix setting means 50 reproduces the channel of the original acoustic signal corresponding to the original speaker corresponding to the three or more reproduction speakers for the original speaker through which the virtual line up to the sound receiving region L passes through the divided region R. Sets the transformation matrix to be assigned to the acoustic signal channel. Here, the transformation matrix setting means 50 corresponds to the channels of the original acoustic signal corresponding to the four original speakers ξ (1) to ξ (4) to the three reproduction speakers ζ (1) to ζ (3). A conversion matrix assigned to the channel of the reproduced sound signal to be set is set.

このような領域分割は、式(16)で表される。式(16)において、変換行列の1行目が、原生音響信号s(ω)と再生音響信号q(ω)〜q(ω)との対応を示す要素w11,w21,w31以外を0となる。また、原生音響信号s(ω)〜s(ω)に対応する変換行列の2行目〜4行目についても、変換行列の1行目と同様である。そして、0以外の要素について、変換行列設定手段50は、二乗誤差を最小とする値を求め、変換行列を設定する。 Such area division is expressed by Expression (16). In Expression (16), the first row of the transformation matrix is an element w 11 , w 21 , w indicating the correspondence between the original acoustic signal s 1 (ω) and the reproduced acoustic signals q 1 (ω) to q 3 (ω). 0 except for 31 . Further, the second to fourth rows of the transformation matrix corresponding to the original acoustic signals s 2 (ω) to s 4 (ω) are the same as the first row of the transformation matrix. Then, for elements other than 0, the transformation matrix setting means 50 obtains a value that minimizes the square error, and sets the transformation matrix.

以上のように、最適化問題を領域分割して局所的に扱うことで、原音場でのあるチャンネルの音が聞こえる方向と、再生音場でそのチャンネルの音が聞こえる方向とが全く異なる事態を防ぐことができる。   As described above, the optimization problem is divided into regions and handled locally, so that the direction in which the sound of a channel in the original sound field can be heard and the direction in which the sound of that channel can be heard in the playback sound field are completely different. Can be prevented.

ここでは、3個の再生スピーカζ(1)〜ζ(3)で囲まれる分割領域Rについて説明したが、変換行列設定手段50は、他の再生スピーカで囲まれた分割領域に対して、前記した領域分割を行っても良い。さらに、変換行列設定手段50は、2個の再生スピーカに囲まれる分割領域又は4個以上の再生スピーカで囲まれる分割領域に対して、前記した領域分割を行っても良い。なお、2個の再生スピーカに囲まれる分割領域は、線状の領域となる。   Here, the divided area R surrounded by the three reproduction speakers ζ (1) to ζ (3) has been described. However, the transformation matrix setting unit 50 performs the above operation on the divided areas surrounded by other reproduction speakers. The divided regions may be performed. Further, the transformation matrix setting means 50 may perform the above-described area division on a divided area surrounded by two reproduction speakers or a divided area surrounded by four or more reproduction speakers. Note that the divided area surrounded by the two reproduction speakers is a linear area.

[音響信号変換装置の動作]
以下、音響信号変換装置の動作について、説明する(適宜図1参照)。図3は、図1の音響信号変換装置の動作を示すフローチャートである。
[Operation of acoustic signal converter]
Hereinafter, the operation of the acoustic signal converter will be described (see FIG. 1 as appropriate). FIG. 3 is a flowchart showing the operation of the acoustic signal converter of FIG.

音響信号変換装置1は、フーリエ変換手段10によって、入力された原音響信号を、原音響信号を再生する原音場での音響物理量を示す原音響物理量信号にフーリエ変換する(ステップS1)。また、音響信号変換装置1は、原音場ベクトル生成手段20によって、フーリエ変換手段10がフーリエ変換した原音響物理量信号に基づいて、原音場での音響物理量を成分とする原音場ベクトルを生成する(ステップS2)。   The acoustic signal converter 1 performs Fourier transform on the input original sound signal by the Fourier transform means 10 into an original sound physical quantity signal indicating an acoustic physical quantity in the original sound field for reproducing the original sound signal (step S1). In the acoustic signal conversion device 1, the original sound field vector generation means 20 generates an original sound field vector whose component is an acoustic physical quantity in the original sound field, based on the original sound physical quantity signal Fourier-transformed by the Fourier transform means 10. Step S2).

ステップS2に続き、音響信号変換装置1は、音響信号変換手段30によって、所定の変換行列に基づいて、フーリエ変換手段10がフーリエ変換した原音響物理量信号を、再生音響信号を再生する再生音場での音響物理量を示す再生音響物理量信号に変換する(ステップS3)。ステップS3では、音響信号変換装置1は、音響信号変換手段30によって、初期値としての変換行列を用いて、原音響物理量信号を再生音響物理量信号に変換する。   Following step S2, the acoustic signal conversion device 1 reproduces the reproduced acoustic signal from the original acoustic physical quantity signal Fourier-transformed by the Fourier transform unit 10 based on a predetermined transformation matrix by the acoustic signal conversion unit 30. Is converted into a reproduced acoustic physical quantity signal indicating the acoustic physical quantity at step S3. In step S <b> 3, the acoustic signal conversion device 1 converts the original acoustic physical quantity signal into a reproduced acoustic physical quantity signal by using the acoustic signal conversion unit 30 using the conversion matrix as an initial value.

ステップS3に続き、音響信号変換装置1は、再生音場ベクトル生成手段40によって、音響信号変換手段30が変換した再生音響物理量信号に基づいて、再生音場での音響物理量を成分とする再生音場ベクトルを生成する(ステップS4)。また、音響信号変換装置1は、変換行列設定手段50によって、所定の受音領域において、原音場ベクトルと再生音場ベクトルとの二乗誤差が最小となる変換行列を設定する(ステップS5)。ステップS5において、音響信号変換装置1は、変換行列設定手段50によって、前記した領域分割を行っても良い。   Subsequent to step S3, the acoustic signal conversion device 1 uses the reproduction sound field vector generation unit 40 to reproduce the reproduction sound having the component of the acoustic physical quantity in the reproduction sound field based on the reproduction acoustic physical quantity signal converted by the acoustic signal conversion unit 30. A field vector is generated (step S4). Further, the acoustic signal conversion device 1 sets the conversion matrix that minimizes the square error between the original sound field vector and the reproduced sound field vector in the predetermined sound receiving region by the conversion matrix setting means 50 (step S5). In step S <b> 5, the acoustic signal conversion device 1 may perform the above-described region division by the conversion matrix setting unit 50.

そして、ステップS5で設定した変換行列に基づいて、音響信号変換装置1は、音響信号変換手段30によって、原音響物理量信号を再生音響物理量信号に再変換する(ステップS6)。また、音響信号変換装置1は、フーリエ逆変換手段60によって、音響信号変換手段30が再変換した再生音響物理量信号を、再生音響信号にフーリエ逆変換する(ステップS7)。   Then, based on the conversion matrix set in step S5, the acoustic signal conversion device 1 reconverts the original acoustic physical quantity signal into a reproduced acoustic physical quantity signal by the acoustic signal conversion means 30 (step S6). Further, the acoustic signal conversion device 1 performs Fourier inverse transform on the reproduced acoustic physical quantity signal retransformed by the acoustic signal transforming unit 30 into the reproduced acoustic signal by the Fourier inverse transform unit 60 (step S7).

[音響信号の変換結果]
以下、音響信号変換装置による音響信号の変換結果について、従来技術と対比して説明する。図4は、22.2チャンネルの中間層における原音響信号の10チャンネル(スピーカと受音領域中心点又は受音点の距離が3m)を、5.1チャンネルサラウンドにおける再生音響信号の5チャンネル(スピーカと受音領域中心点又は受音点の距離が2m)に変換した場合の二乗誤差の上限を示すグラフ図であり、(a)は、従来技術における受音点で二乗誤差を最小とした場合のグラフであり、(b)は、本発明における受音領域で二乗誤差を最小とした最適化した場合のグラフである。また、図4では、縦軸は正規化した二乗誤差を示し、横軸がx−y平面内での位置を示す。
[Conversion result of acoustic signal]
Hereinafter, the conversion result of the acoustic signal by the acoustic signal conversion device will be described in comparison with the prior art. FIG. 4 shows 10 channels (distance between the speaker and the sound receiving area center point or the sound receiving point is 3 m) of the original sound signal in the intermediate layer of 22.2 channels, and 5 channels of the reproduced sound signal in 5.1 channel surround ( It is a graph which shows the upper limit of the square error when the distance between the speaker and the sound receiving area center point or the sound receiving point is converted to 2 m), and (a) is the least square error at the sound receiving point in the prior art. (B) is a graph in the case of optimization with the square error minimized in the sound receiving region in the present invention. In FIG. 4, the vertical axis represents the normalized square error, and the horizontal axis represents the position in the xy plane.

ここで、図4は、実験により得られた二乗誤差(式(12)参照)を正規化し、各受音点毎に示したものである。また、図4(a)では、x−y平面の原点を受音点に設定し、図4(b)では、x−y平面の原点を中心とする縦0.4m×横0.4mの受音領域を設定した。   Here, FIG. 4 normalizes the square error (see Equation (12)) obtained by experiment and shows it for each sound receiving point. Further, in FIG. 4A, the origin of the xy plane is set as the sound receiving point, and in FIG. 4B, the vertical 0.4 m × horizontal 0.4 m centered on the origin of the xy plane. The sound receiving area was set.

図4(a)では、平面の原点(受音点)の二乗誤差が小さいが、受音点の周囲の二乗誤差が大きくなっている。つまり、1点を示す受音点で二乗誤差を最小とした場合では、受音点の周囲が、良好なリスニング環境になっていないと考えられる。一方、図4(b)では、平面の原点及びその周囲でも二乗誤差が小さい。つまり、本発明のように受音領域で二乗誤差を最小とした場合では、平面の原点及びその周囲を含め、良好なリスニング環境となっていると考えられる。   In FIG. 4A, the square error at the origin (sound receiving point) on the plane is small, but the square error around the sound receiving point is large. That is, when the square error is minimized at the sound receiving point indicating one point, it is considered that the listening environment around the sound receiving point is not a good listening environment. On the other hand, in FIG. 4B, the square error is small even at and around the origin of the plane. That is, when the square error is minimized in the sound receiving area as in the present invention, it is considered that the listening environment is good including the origin of the plane and its surroundings.

なお、各実施形態では、本発明に係る音響信号変換装置を独立した装置として説明したが、本発明では、一般的なコンピュータを、前記した各手段として機能させるプログラムによって動作させることもできる。このプログラムは、通信回線を介して配布しても良く、CD−ROMやフラッシュメモリ等の記録媒体に書き込んで配布しても良い。   In each embodiment, the acoustic signal conversion device according to the present invention has been described as an independent device. However, in the present invention, a general computer can be operated by a program that functions as each of the above-described units. This program may be distributed via a communication line, or may be distributed by writing in a recording medium such as a CD-ROM or a flash memory.

なお、各実施形態では、音響物理量として、音圧と粒子速度とを制御する例を説明したが、本発明に係る音響信号変換装置は、音響物理量として、音圧又は粒子速度の何れか一方を制御しても良く、音圧と粒子速度との積である瞬時音響インテンシティや、瞬時音響インテンシティの時間平均である音響インテンシティ等の音響物理量を制御しても良い。   In each embodiment, an example of controlling sound pressure and particle velocity as an acoustic physical quantity has been described. However, the acoustic signal conversion device according to the present invention uses either sound pressure or particle velocity as an acoustic physical quantity. You may control, and you may control acoustic physical quantities, such as the instantaneous sound intensity which is a product of a sound pressure and a particle velocity, and the sound intensity which is a time average of an instantaneous sound intensity.

本発明の実施形態に係る音響信号変換装置のブロック図である。It is a block diagram of an acoustic signal converter concerning an embodiment of the present invention. 本発明における領域分割を説明するために、スピーカが配置された平面を上面視した説明図である。It is explanatory drawing which looked at the plane where the speaker was arrange | positioned in order to demonstrate the area | region division in this invention. 図1の音響信号変換装置の動作を示すフローチャートである。It is a flowchart which shows operation | movement of the acoustic signal converter of FIG. 22.2チャンネルの中間層における原音響信号の10チャンネルを、5.1チャンネルサラウンドにおける再生音響信号の5チャンネルに変換した場合の二乗誤差の上限を示すグラフ図であり、(a)は、従来技術における受音点で二乗誤差を最小とした場合のグラフであり、(b)は、本発明における受音領域で二乗誤差を最小とした最適化した場合のグラフである。It is a graph which shows the upper limit of the square error at the time of converting 10 channels of the original sound signal in the intermediate layer of 22.2 channels into 5 channels of the reproduction | regeneration sound signal in 5.1 channel surround, (a) is conventional. It is a graph when the square error is minimized at the sound reception point in the technology, and (b) is a graph when optimization is performed with the square error is minimized in the sound reception region in the present invention.

符号の説明Explanation of symbols

1 音響信号変換装置
10 フーリエ変換手段
20 原音場ベクトル生成手段
30 音響信号変換手段
40 再生音場ベクトル生成手段
50 変換行列設定手段
60 フーリエ逆変換手段
70 記憶手段
DESCRIPTION OF SYMBOLS 1 Acoustic signal converter 10 Fourier transform means 20 Original sound field vector generation means 30 Acoustic signal conversion means 40 Reproduction sound field vector generation means 50 Transformation matrix setting means 60 Fourier inverse transform means 70 Storage means

Claims (5)

1以上のチャンネル数に対応する原音響信号を、当該原音響信号のチャンネル数と異なるチャンネル数に対応する再生音響信号に変換する音響信号変換装置であって、
入力された前記原音響信号を、当該原音響信号を再生する原音場での音響物理量を示す原音響物理量信号にフーリエ変換するフーリエ変換手段と、
前記フーリエ変換手段がフーリエ変換した原音響物理量信号に基づいて、前記原音場での音響物理量を成分とする原音場ベクトルを生成する原音場ベクトル生成手段と、
前記フーリエ変換手段がフーリエ変換した原音響物理量信号を、所定の変換行列に基づいて、前記再生音響信号を再生する再生音場での音響物理量を示す再生音響物理量信号に変換する音響信号変換手段と、
前記音響信号変換手段が変換した再生音響物理量信号に基づいて、前記再生音場での音響物理量を成分とする再生音場ベクトルを生成する再生音場ベクトル生成手段と、
所定の受音領域において、前記原音場ベクトルと前記再生音場ベクトルとの二乗誤差が最小となる前記変換行列を設定する変換行列設定手段と、
前記音響信号変換手段が変換した再生音響物理量信号を、前記再生音響信号にフーリエ逆変換するフーリエ逆変換手段と、を備え、
前記音響信号変換手段は、前記変換行列設定手段が設定した変換行列に基づいて、前記原音響物理量信号を前記再生音響物理量信号に再変換することを特徴とする音響信号変換装置。
An acoustic signal conversion device that converts an original sound signal corresponding to one or more channels into a reproduced sound signal corresponding to a number of channels different from the number of channels of the original sound signal,
Fourier transform means for Fourier transforming the input original sound signal into an original sound physical quantity signal indicating an acoustic physical quantity in an original sound field for reproducing the original sound signal;
Based on the original acoustic physical quantity signal Fourier-transformed by the Fourier transform means, an original sound field vector generating means for generating an original sound field vector whose component is an acoustic physical quantity in the original sound field;
Acoustic signal conversion means for converting the original acoustic physical quantity signal Fourier-transformed by the Fourier transform means into a reproduced acoustic physical quantity signal indicating an acoustic physical quantity in a reproduced sound field for reproducing the reproduced acoustic signal based on a predetermined transformation matrix; ,
Based on the reproduced acoustic physical quantity signal converted by the acoustic signal converting means, a reproduced sound field vector generating means for generating a reproduced sound field vector having an acoustic physical quantity in the reproduced sound field as a component;
Transformation matrix setting means for setting the transformation matrix that minimizes a square error between the original sound field vector and the reproduced sound field vector in a predetermined sound receiving area;
A Fourier inverse transforming means for inversely transforming the reproduced acoustic physical quantity signal converted by the acoustic signal converting means into the reproduced acoustic signal;
The acoustic signal converter is characterized in that the acoustic signal converter reconverts the original acoustic physical quantity signal into the reproduced acoustic physical quantity signal based on the transformation matrix set by the transformation matrix setting means.
前記原音響信号のチャンネルに対応する原スピーカの位置と、前記再生音響信号のチャンネルに対応する再生スピーカの位置とを記憶する記憶手段、をさらに備え、
前記変換行列設定手段は、
前記記憶手段が記憶する原スピーカの位置と再生スピーカの位置とに基づいて、前記再生音場で隣接する2個以上の前記再生スピーカに囲まれる分割領域を求め、前記受音領域までの仮想線が当該分割領域を通過する前記原スピーカについて、当該原スピーカに対応する前記原音響信号のチャンネルを、前記2個以上の再生スピーカに対応する前記再生音響信号のチャンネルに割り当てる前記変換行列を設定することを特徴とする請求項1に記載の音響信号変換装置。
Storage means for storing the position of the original speaker corresponding to the channel of the original acoustic signal and the position of the reproduction speaker corresponding to the channel of the reproduced acoustic signal;
The transformation matrix setting means includes
Based on the position of the original speaker and the position of the reproduction speaker stored by the storage means, a divided area surrounded by the two or more reproduction speakers adjacent in the reproduction sound field is obtained, and a virtual line to the sound reception area is obtained. For the original speaker that passes through the divided region, the conversion matrix for assigning the channel of the original acoustic signal corresponding to the original speaker to the channel of the reproduced acoustic signal corresponding to the two or more reproduced speakers is set. The acoustic signal converter according to claim 1.
前記フーリエ変換手段は、前記原音響信号を、前記原音場での音響物理量として、スカラー量である前記原音場での音圧と3次元ベクトル量である前記原音場での粒子速度とを含む前記原音響物理量信号にフーリエ変換し、
前記原音場ベクトル生成手段は、前記原音場での音圧と前記原音場での粒子速度とを成分とする4次元ベクトルである前記原音場ベクトルを生成し、
前記音響信号変換手段は、前記原音響物理量信号を、前記再生音場での音響物理量として、スカラー量である前記再生音場での音圧と3次元ベクトル量である前記再生音場での粒子速度とを含む前記再生音響物理量信号に変換し、
前記再生音場ベクトル生成手段は、前記再生音場での音圧と前記再生音場での粒子速度とを成分とする4次元ベクトルである前記再生音場ベクトルを生成することを特徴とする請求項1又は2に記載の音響信号変換装置。
The Fourier transform means includes, as the acoustic physical quantity in the original sound field, the sound pressure in the original sound field that is a scalar quantity and the particle velocity in the original sound field that is a three-dimensional vector quantity. Fourier transform to the original acoustic physical quantity signal,
The original sound field vector generating means generates the original sound field vector which is a four-dimensional vector having sound pressure in the original sound field and particle velocity in the original sound field as components,
The acoustic signal conversion means uses the original acoustic physical quantity signal as the acoustic physical quantity in the reproduced sound field, and the sound pressure in the reproduced sound field as a scalar quantity and the particle in the reproduced sound field as a three-dimensional vector quantity. Converting to the reproduced acoustic physical quantity signal including velocity,
The reproduction sound field vector generation means generates the reproduction sound field vector which is a four-dimensional vector having sound pressure in the reproduction sound field and particle velocity in the reproduction sound field as components. Item 3. The acoustic signal converter according to Item 1 or 2.
1以上のチャンネル数に対応する原音響信号を、当該原音響信号のチャンネル数と異なるチャンネル数に対応する再生音響信号に変換する音響信号変換方法であって、
入力された前記原音響信号を、当該原音響信号を再生する原音場での音響物理量を示す原音響物理量信号にフーリエ変換するフーリエ変換ステップと、
前記フーリエ変換ステップでフーリエ変換した原音響物理量信号に基づいて、前記原音場での音響物理量を成分とする原音場ベクトルを生成する原音場ベクトル生成ステップと、
前記フーリエ変換ステップでフーリエ変換した原音響物理量信号を、所定の変換行列に基づいて、前記再生音響信号を再生する再生音場での音響物理量を示す再生音響物理量信号に変換する音響信号変換ステップと、
前記音響信号変換ステップで変換した再生音響物理量信号に基づいて、前記再生音場での音響物理量を成分とする再生音場ベクトルを生成する再生音場ベクトル生成ステップと、
所定の受音領域において、前記原音場ベクトルと前記再生音場ベクトルとの二乗誤差が最小となる前記変換行列を設定する変換行列設定ステップと、
前記変換行列設定ステップで設定した変換行列に基づいて、前記原音響物理量信号を前記再生音響物理量信号に再変換する音響信号再変換ステップと、
前記音響信号変換ステップで再変換した再生音響物理量信号を、前記再生音響信号にフーリエ逆変換するフーリエ逆変換ステップと、
を備えることを特徴とする音響信号変換方法。
An acoustic signal conversion method for converting an original sound signal corresponding to one or more channels into a reproduced sound signal corresponding to a number of channels different from the number of channels of the original sound signal,
A Fourier transform step of Fourier transforming the input original sound signal into an original sound physical quantity signal indicating an acoustic physical quantity in an original sound field for reproducing the original sound signal;
An original sound field vector generation step for generating an original sound field vector having an acoustic physical quantity in the original sound field as a component based on the original sound physical quantity signal Fourier-transformed in the Fourier transform step;
An acoustic signal conversion step of converting the original acoustic physical quantity signal Fourier-transformed in the Fourier transformation step into a reproduced acoustic physical quantity signal indicating an acoustic physical quantity in a reproduced sound field for reproducing the reproduced acoustic signal based on a predetermined transformation matrix; ,
Based on the reproduced acoustic physical quantity signal converted in the acoustic signal converting step, a reproduced sound field vector generating step for generating a reproduced sound field vector having an acoustic physical quantity in the reproduced sound field as a component;
A transformation matrix setting step for setting the transformation matrix that minimizes a square error between the original sound field vector and the reproduced sound field vector in a predetermined sound receiving region;
Based on the transformation matrix set in the transformation matrix setting step, an acoustic signal reconversion step for reconverting the original acoustic physical quantity signal into the reproduced acoustic physical quantity signal;
A Fourier inverse transform step for inversely transforming the reproduced acoustic physical quantity signal retransformed in the acoustic signal transforming step into the reproduced acoustic signal;
An acoustic signal conversion method comprising:
1以上のチャンネル数に対応する原音響信号を、当該原音響信号のチャンネル数と異なるチャンネル数に対応する再生音響信号に変換するために、コンピュータを、
入力された前記原音響信号を、当該原音響信号を再生する原音場での音響物理量を示す原音響物理量信号にフーリエ変換するフーリエ変換手段、
前記フーリエ変換手段がフーリエ変換した原音響物理量信号に基づいて、前記原音場での音響物理量を成分とする原音場ベクトルを生成する原音場ベクトル生成手段、
前記フーリエ変換手段がフーリエ変換した原音響物理量信号を、所定の変換行列に基づいて、前記再生音響信号を再生する再生音場での音響物理量を示す再生音響物理量信号に変換する音響信号変換手段、
前記音響信号変換手段が変換した再生音響物理量信号に基づいて、前記再生音場での音響物理量を成分とする再生音場ベクトルを生成する再生音場ベクトル生成手段、
所定の受音領域において、前記原音場ベクトルと前記再生音場ベクトルとの二乗誤差が最小となる前記変換行列を設定する変換行列設定手段、
前記音響信号変換手段が変換した再生音響物理量信号を、前記再生音響信号にフーリエ逆変換するフーリエ逆変換手段、として機能させ、
前記音響信号変換手段は、前記変換行列設定手段が設定した変換行列に基づいて、前記原音響物理量信号を前記再生音響物理量信号に再変換することを特徴とする音響信号変換プログラム。
In order to convert the original sound signal corresponding to the number of channels of 1 or more into a reproduced sound signal corresponding to the number of channels different from the number of channels of the original sound signal,
Fourier transform means for Fourier transforming the input original sound signal into an original sound physical quantity signal indicating an acoustic physical quantity in an original sound field for reproducing the original sound signal;
An original sound field vector generating means for generating an original sound field vector whose component is an acoustic physical quantity in the original sound field, based on the original sound physical quantity signal Fourier-transformed by the Fourier transform means;
An acoustic signal converting means for converting the original acoustic physical quantity signal Fourier-transformed by the Fourier transform means into a reproduced acoustic physical quantity signal indicating an acoustic physical quantity in a reproduction sound field for reproducing the reproduced acoustic signal based on a predetermined transformation matrix;
Based on the reproduced acoustic physical quantity signal converted by the acoustic signal converting means, a reproduced sound field vector generating means for generating a reproduced sound field vector having an acoustic physical quantity in the reproduced sound field as a component,
Conversion matrix setting means for setting the conversion matrix that minimizes a square error between the original sound field vector and the reproduced sound field vector in a predetermined sound receiving region;
The reproduced acoustic physical quantity signal converted by the acoustic signal converting means functions as inverse Fourier transform means for inversely transforming the reproduced acoustic signal into the reproduced acoustic signal,
The acoustic signal conversion means reconverts the original acoustic physical quantity signal into the reproduced acoustic physical quantity signal based on the transformation matrix set by the transformation matrix setting means.
JP2008057331A 2008-03-07 2008-03-07 Acoustic signal converter, method and program thereof Active JP4922211B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008057331A JP4922211B2 (en) 2008-03-07 2008-03-07 Acoustic signal converter, method and program thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008057331A JP4922211B2 (en) 2008-03-07 2008-03-07 Acoustic signal converter, method and program thereof

Publications (2)

Publication Number Publication Date
JP2009218655A JP2009218655A (en) 2009-09-24
JP4922211B2 true JP4922211B2 (en) 2012-04-25

Family

ID=41190139

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008057331A Active JP4922211B2 (en) 2008-03-07 2008-03-07 Acoustic signal converter, method and program thereof

Country Status (1)

Country Link
JP (1) JP4922211B2 (en)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2011231565B2 (en) 2010-03-26 2014-08-28 Dolby International Ab Method and device for decoding an audio soundfield representation for audio playback
JP5590951B2 (en) * 2010-04-12 2014-09-17 アルパイン株式会社 Sound field control apparatus and sound field control method
JP4810621B1 (en) * 2010-09-07 2011-11-09 シャープ株式会社 Audio signal conversion apparatus, method, program, and recording medium
EP2645748A1 (en) * 2012-03-28 2013-10-02 Thomson Licensing Method and apparatus for decoding stereo loudspeaker signals from a higher-order Ambisonics audio signal
CN102984642A (en) * 2012-12-18 2013-03-20 武汉大学 Three-dimensional translation method for five loudspeakers

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08130793A (en) * 1994-11-01 1996-05-21 Mitsubishi Electric Corp Acoustic reproducing device
JP4450764B2 (en) * 2005-04-12 2010-04-14 日本放送協会 Speaker device
JP4886242B2 (en) * 2005-08-18 2012-02-29 日本放送協会 Downmix device and downmix program
JP2007104060A (en) * 2005-09-30 2007-04-19 Matsushita Electric Ind Co Ltd Television receiver system with sound directivity control function
JP5010148B2 (en) * 2006-01-19 2012-08-29 日本放送協会 3D panning device
JP5010185B2 (en) * 2006-06-08 2012-08-29 日本放送協会 3D acoustic panning device
JP4928177B2 (en) * 2006-07-05 2012-05-09 日本放送協会 Sound image forming device

Also Published As

Publication number Publication date
JP2009218655A (en) 2009-09-24

Similar Documents

Publication Publication Date Title
JP7367785B2 (en) Audio processing device and method, and program
CN108370487B (en) Sound processing apparatus, method, and program
WO2018008395A1 (en) Acoustic field formation device, method, and program
JP5826996B2 (en) Acoustic signal conversion device and program thereof, and three-dimensional acoustic panning device and program thereof
EP3026936B1 (en) Information processing device and method, and program
JP4922211B2 (en) Acoustic signal converter, method and program thereof
JP2010252220A (en) Three-dimensional acoustic panning apparatus and program therefor
JP2017175356A (en) Acoustic processing apparatus and program
CN113891233A (en) Signal processing apparatus and method, and computer-readable storage medium
KR20220038478A (en) Apparatus, method or computer program for processing a sound field representation in a spatial transformation domain
JP5010148B2 (en) 3D panning device
WO2017119321A1 (en) Audio processing device and method, and program
Braasch A loudspeaker-based 3D sound projection using Virtual Microphone Control (ViMiC)
WO2017119320A1 (en) Audio processing device and method, and program
JP2018120007A (en) Voice signal converter, voice signal converting method and program
JP2019146086A (en) Acoustic processor and program
WO2018211984A1 (en) Speaker array and signal processor
JP7449184B2 (en) Sound field modeling device and program
Sladeczek et al. Object-Based Audio as Platform Technology in Vehicles
CN116193196A (en) Virtual surround sound rendering method, device, equipment and storage medium
CN115038029A (en) Rendering item processing method, device and equipment of audio renderer and storage medium

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100310

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111222

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120110

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120203

R150 Certificate of patent or registration of utility model

Ref document number: 4922211

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150210

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250