JP2008092411A - Audio signal generating device - Google Patents
Audio signal generating device Download PDFInfo
- Publication number
- JP2008092411A JP2008092411A JP2006272725A JP2006272725A JP2008092411A JP 2008092411 A JP2008092411 A JP 2008092411A JP 2006272725 A JP2006272725 A JP 2006272725A JP 2006272725 A JP2006272725 A JP 2006272725A JP 2008092411 A JP2008092411 A JP 2008092411A
- Authority
- JP
- Japan
- Prior art keywords
- frequency
- audio signal
- signal
- wave component
- sound
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
Description
本発明は、ステレオ信号を所定間隔の左右スピーカよりも狭い間隔に配置される狭間隔スピーカから発音させ、前記ステレオ音響信号を狭間隔スピーカよりも広い間隔の広がりを有する拡大ステレオ信号として生成する音響信号生成装置に関する。 The present invention generates a stereo signal from a narrow-spaced speaker arranged at a narrower interval than left and right speakers at a predetermined interval, and generates the stereo sound signal as an enlarged stereo signal having a wider interval than the narrow-spaced speaker. The present invention relates to a signal generation device.
最近になり、小型で高忠実度の音響信号を発音可能なスピーカも実用化されるようになり、小型でありながら臨場感が優れたステレオ再生装置も市場導入されるようになってきた。
一方、臨場感のあるステレオ再生を行うためには、通常は視聴者の前方に正三角形となる位置、即ち±30度の位置に左右スピーカの設置が想定されるが、視聴空間の制約のため狭い空間にスピーカを設置しなければならない場合もある。スピーカの設置角が小さい場合であっても所定のステレオ効果が得られるようにする。
Recently, small speakers capable of producing sound signals with high fidelity have come into practical use, and stereo reproduction devices that are small but have excellent realism have come into the market.
On the other hand, in order to perform stereo reproduction with a sense of presence, it is usually assumed that left and right speakers are installed at a position that becomes an equilateral triangle, that is, a position of ± 30 degrees in front of the viewer. In some cases, it is necessary to install a speaker in a narrow space. A predetermined stereo effect is obtained even when the installation angle of the speaker is small.
設置角の小さなスピーカ配置において、左右スピーカの配置される位置よりも外側に音源を定位させる拡大ステレオ音によりスピーカから発音させ、所望のステレオ効果を得ることができる。しかし、拡大ステレオ音による再生では、左右スピーカの中央に配置される中央音源も拡大されて再生されるため、拡大された中央音源は左右スピーカの中央位置に定位しなく、いわゆる中抜け音として再生されてしまう。スピーカの中央で歌われるボーカルの音源が周囲に分散された音として視聴されてしまう。左右スピーカの設置角が小さい場合であっても所望のステレオ効果が得られると共に、スピーカの中央に定位する音源は中抜けを伴わない音で再生できることは好ましい。 In a loudspeaker arrangement with a small installation angle, a desired stereo effect can be obtained by generating sound from the loudspeaker with an enlarged stereo sound that localizes the sound source outside the position where the left and right speakers are arranged. However, in playback with expanded stereo sound, the central sound source located in the center of the left and right speakers is also enlarged and played, so the enlarged central sound source is not localized at the center position of the left and right speakers, and is played back as a so-called hollow sound. Will be. The vocal sound source sung in the center of the speaker is viewed as a sound dispersed around. It is preferable that a desired stereo effect can be obtained even when the installation angle of the left and right speakers is small, and that the sound source localized at the center of the speaker can be reproduced with a sound without any hollows.
特許文献1には、入力信号がステレオかモノラルかによりステレオ感の拡大処理の効果を切り替えることにより、モノラル信号時の不自然感をなくすようにした音場再生装置が開示されている。入力信号がステレオ信号かモノラル信号かを判定回路により判定し、この結果によりFIRフィルタの出力信号と入力信号の加算の割合を変化させる。入力信号がステレオであればFIRフィルタの出力信号の方を大きく、入力信号がモノラルの場合はFIRフィルタの出力信号の方を小さくするよう加算器での加算の割合を制御することにより、入力信号がモノラルの場合の音像のボケや音質の劣化を目立たないようにした音場再生装置が開示されている。
しかしながら、特許文献1に開示されている音場再生装置では入力信号がステレオ信号か、又はモノラルに近い信号であるかによりステレオ感の拡大効果を可変させるようにしているのみであり、例えば伴奏用楽器がステレオ配置され、ボーカルが中央でモノラルに近いボケのない音で歌っている場合などでは伴奏用楽器がステレオ感の拡大効果により拡大されて再生されると共に、ボーカルも拡大効果を伴って再生されるため、ボーカル音の音像のボケや音質の劣化が目立つようになってしまう。特に、ステレオ信号を所定間隔の左右スピーカよりも狭い間隔に配置される狭間隔スピーカから発音させ、ステレオ信号を狭間隔スピーカよりも広い間隔の広がりを有する拡大ステレオ信号として生成する場合において、中央位置に定位させるボーカル音源に対しても拡大ステレオ音響信号の効果が与えられてしまい、再生用音響信号としてボケを伴わないボーカル音源と共に生成する音響信号生成装置を実現することはできなかった。
However, the sound field reproducing device disclosed in
そこで、本発明は、上記のような問題点を解消するためになされたもので、ステレオ信号を所定間隔の左右スピーカよりも狭い間隔に配置される狭間隔スピーカから発音させ、ステレオ信号を狭間隔スピーカよりも広い間隔の広がりを有する拡大ステレオ信号として生成すると共に、左右スピーカの中央に定位される中央音源のみは拡大ステレオ音響信号の効果を与えなく、中抜け感を伴わない再生用音響信号として生成を可能とする音響信号生成装置を提供することを目的とする。 Accordingly, the present invention has been made to solve the above-described problems. A stereo signal is generated by a narrowly spaced speaker arranged at a narrower interval than left and right speakers having a predetermined interval, and the stereo signal is narrowly spaced. It is generated as an enlarged stereo signal with a wider interval than the speakers, and only the central sound source localized at the center of the left and right speakers does not give the effect of the enlarged stereo sound signal, and as a playback acoustic signal without a sense of hollow It is an object of the present invention to provide an acoustic signal generation device that enables generation.
本願発明における第1の発明は、入力される左右2チャンネルのオーディオ信号を左右1組のスピーカにおいて再生した際に得られる音像定位位置よりも左右に拡大した位置に音像定位させる処理を前記入力されるオーディオ信号に対して行って得た拡大オーディオ信号を出力する音響信号生成装置において、前記入力される左右2チャンネルのオーディオ信号のそれぞれをフーリエ変換して所定周波数間隔ごとの各周波数の正弦波成分及び余弦波成分を得るFFT手段と、前記FFT手段より得られた各周波数毎の左チャンネルオーディオ信号の正弦波成分と右チャンネルオーディオ信号の正弦波成分とのレベルを比較しレベル差が所定の範囲にある周波数を1つのまとまりとした第1の周波数群を検出すると共に、前記FFT手段より得られた各周波数毎の左チャンネルオーディオ信号の余弦波成分と右チャンネルオーディオ信号の余弦波成分とのレベルを比較しレベル差が所定の範囲にある周波数を1つのまとまりとした第2の周波数群を検出する周波数群検出手段と、前記周波数群検出手段により検出された第1の周波数群の周波数及び第2の周波数群の周波数のうち共通な周波数を検出する周波数検出手段と、前記FFT手段により得られた各周波数の左チャンネルオーディオ信号の正弦波成分及び各周波数の右チャンネルオーディオ信号の正弦波成分のうち、前記周波数検出手段で検出された共通な周波数の正弦波成分同士を加算して加算正弦波成分を得ると共に、前記FFT手段により得られた各周波数の左チャンネルオーディオ信号の余弦波成分及び各周波数の右チャンネルオーディオ信号の余弦波成分のうち、前記周波数検出手段で検出された共通な周波数の余弦波成分同士を加算して加算余弦波成分を得る加算手段と、前記加算手段より得られた加算正弦波成分及び加算余弦波成分を逆フーリエ変換して加算オーディオ信号を得るIFFT手段と、前記左右に拡大した位置に音像定位させる処理を行った拡大オーディオ信号に、前記IFFT手段で得られた加算オーディオ信号を加算した信号を新たな拡大オーディオ信号として生成する信号生成手段と、を備えることを特徴とする音響信号生成装置を提供する。 According to a first aspect of the present invention, the processing for localizing a sound image to a position expanded to the left and right relative to the sound image localization position obtained when the input audio signals of two left and right channels are reproduced by a pair of left and right speakers is input. In an acoustic signal generating apparatus for outputting an enlarged audio signal obtained by performing an audio signal, a sine wave component of each frequency for each predetermined frequency interval by Fourier transforming each of the input left and right channel audio signals And the FFT means for obtaining the cosine wave component, and the level difference between the sine wave component of the left channel audio signal and the sine wave component of the right channel audio signal for each frequency obtained from the FFT means is compared and the level difference is within a predetermined range. Is detected from the FFT means, and a first frequency group having a single frequency group is detected. The second frequency group in which the levels of the cosine wave component of the left channel audio signal and the cosine wave component of the right channel audio signal for each frequency are compared and the frequencies having a level difference within a predetermined range are grouped together. The frequency group detecting means for detecting, the frequency detecting means for detecting a common frequency among the frequencies of the first frequency group and the frequency of the second frequency group detected by the frequency group detecting means, and the FFT means. Of the sine wave component of the left channel audio signal of each frequency and the sine wave component of the right channel audio signal of each frequency, the sine wave components of the common frequency detected by the frequency detection means are added together to add sine And a cosine wave component of the left channel audio signal of each frequency obtained by the FFT means and the right of each frequency. Among the cosine wave components of the channel audio signal, adding means for adding the cosine wave components of the common frequency detected by the frequency detecting means to obtain an added cosine wave component, and the addition sine obtained from the adding means IFFT means for obtaining an added audio signal by performing inverse Fourier transform on the wave component and the added cosine wave component, and the added audio signal obtained by the IFFT means to the enlarged audio signal subjected to the process of localizing the sound image to the position expanded to the left and right There is provided an acoustic signal generation device comprising: signal generation means for generating a signal obtained by adding signals as a new enlarged audio signal.
本発明によれば、入力される左右2チャンネルのオーディオ信号のそれぞれをフーリエ変換して所定周波数間隔ごとの各周波数の正弦波成分及び余弦波成分を得るFFT手段と、FFT手段より得られた各周波数毎の左チャンネルオーディオ信号の正弦波成分と右チャンネルオーディオ信号の正弦波成分とのレベルを比較しレベル差が所定の範囲にある周波数を1つのまとまりとした第1の周波数群を検出すると共に、FFT手段より得られた各周波数毎の左チャンネルオーディオ信号の余弦波成分と右チャンネルオーディオ信号の余弦波成分とのレベルを比較しレベル差が所定の範囲にある周波数を1つのまとまりとした第2の周波数群を検出する周波数群検出手段と、周波数群検出手段により検出された第1の周波数群の周波数及び第2の周波数群の周波数のうち共通な周波数を検出する周波数検出手段と、FFT手段により得られた各周波数の左チャンネルオーディオ信号の正弦波成分及び各周波数の右チャンネルオーディオ信号の正弦波成分のうち、周波数検出手段で検出された共通な周波数の正弦波成分同士を加算して加算正弦波成分を得ると共に、FFT手段により得られた各周波数の左チャンネルオーディオ信号の余弦波成分及び各周波数の右チャンネルオーディオ信号の余弦波成分のうち、周波数検出手段で検出された共通な周波数の余弦波成分同士を加算して加算余弦波成分を得る加算手段と、加算手段より得られた加算正弦波成分及び加算余弦波成分を逆フーリエ変換して加算オーディオ信号を得るIFFT手段と、左右に拡大した位置に音像定位させる処理を行った拡大オーディオ信号に、IFFT手段で得られた加算オーディオ信号を加算した信号を新たな拡大オーディオ信号として生成する信号生成手段とを備えるので、ステレオ信号を所定間隔の左右スピーカよりも狭い間隔に配置される狭間隔スピーカから発音させ、ステレオ信号を狭間隔スピーカよりも広い間隔の広がりを有する拡大ステレオ信号として生成すると共に、左右スピーカの中央に定位される中央音源のみは拡大ステレオ音響信号の効果を与えなく、中抜け感を伴わない再生用音響信号として生成することを可能とする音響信号生成装置を実現できる。 According to the present invention, the FFT means for obtaining the sine wave component and the cosine wave component of each frequency for each predetermined frequency interval by Fourier transforming each of the input left and right two-channel audio signals, and each obtained by the FFT means The levels of the sine wave component of the left channel audio signal and the sine wave component of the right channel audio signal for each frequency are compared to detect a first frequency group in which frequencies having a level difference within a predetermined range are grouped together. , The levels of the cosine wave component of the left channel audio signal and the cosine wave component of the right channel audio signal obtained for each frequency obtained by the FFT means are compared, and the frequencies whose level difference is within a predetermined range are defined as one unit. Frequency group detecting means for detecting two frequency groups, and the frequency of the first frequency group detected by the frequency group detecting means and the second frequency group The frequency detection means for detecting a common frequency among the frequencies of the frequency group, and the frequency of the sine wave component of the left channel audio signal of each frequency and the sine wave component of the right channel audio signal of each frequency obtained by the FFT means The sine wave components of the common frequency detected by the detecting means are added together to obtain an added sine wave component, and the cosine wave component of the left channel audio signal of each frequency and the right channel audio of each frequency obtained by the FFT means. Of the cosine wave components of the signal, an adding means for adding the cosine wave components of the common frequency detected by the frequency detecting means to obtain an added cosine wave component, and an added sine wave component and an added cosine obtained from the adding means IFFT means for obtaining an added audio signal by performing inverse Fourier transform on wave components, and processing for localizing a sound image at a position expanded left and right And a signal generation unit that generates a signal obtained by adding the added audio signal obtained by the IFFT unit to the expanded audio signal performed as a new expanded audio signal, so that the stereo signal is spaced at a narrower interval than the left and right speakers at a predetermined interval. Generates sound from the arranged narrow-speaker speakers and generates a stereo signal as an enlarged stereo signal with a wider interval than the narrow-speaker speaker, and only the central sound source localized at the center of the left and right speakers has the effect of the enlarged stereo sound signal Therefore, it is possible to realize an acoustic signal generation device that can generate a reproduction acoustic signal without a sense of hollowing out.
以下に本発明の実施例に係る音響信号生成装置について図1〜図6を用いて説明する。
図1は、本発明の実施に係る音響信号生成装置の構成例を示すブロック図である。図2は、本発明の実施に係る音響信号生成装置の音像定位拡大の動作を説明するための図である。図3は、本発明の実施に係る音響信号生成装置のトランスオーラル処理を説明するための図である。図4は、本発明の実施に係る音響信号生成装置の音像定位拡大処理器の構成例を示すブロック図である。図5は、本発明の実施に係る音響信号生成装置の動作例をフローチャートで示した図である。図6は、本発明の実施に係る音響信号生成装置の応用動作例をフローチャートで示した図である。
Hereinafter, an acoustic signal generation device according to an embodiment of the present invention will be described with reference to FIGS.
FIG. 1 is a block diagram illustrating a configuration example of an acoustic signal generation device according to an embodiment of the present invention. FIG. 2 is a diagram for explaining the sound image localization expansion operation of the acoustic signal generation device according to the embodiment of the present invention. FIG. 3 is a diagram for explaining transoral processing of the acoustic signal generation device according to the embodiment of the present invention. FIG. 4 is a block diagram illustrating a configuration example of the sound image localization expansion processor of the acoustic signal generation device according to the embodiment of the present invention. FIG. 5 is a flowchart illustrating an operation example of the acoustic signal generation device according to the embodiment of the present invention. FIG. 6 is a flowchart illustrating an application operation example of the acoustic signal generation device according to the embodiment of the present invention.
その音響信号生成装置は、ステレオ信号を所定間隔の左右スピーカよりも狭い間隔に配置される狭間隔スピーカから発音させ、ステレオ信号を狭間隔スピーカよりも広い間隔の広がりを有する拡大ステレオ信号として生成すると共に、左右スピーカの中央に定位される中央音源のみは拡大ステレオ音響信号の効果を与えなく、中抜け感を伴わない再生用音響信号として生成することを可能とする装置を実現するという目的を、入力される左右2チャンネルのオーディオ信号のそれぞれをフーリエ変換して所定周波数間隔ごとの各周波数の正弦波成分及び余弦波成分を得るFFT手段と、FFT手段より得られた各周波数毎の左チャンネルオーディオ信号の正弦波成分と右チャンネルオーディオ信号の正弦波成分とのレベルを比較しレベル差が所定の範囲にある周波数を1つのまとまりとした第1の周波数群を検出すると共に、FFT手段より得られた各周波数毎の左チャンネルオーディオ信号の余弦波成分と右チャンネルオーディオ信号の余弦波成分とのレベルを比較しレベル差が所定の範囲にある周波数を1つのまとまりとした第2の周波数群を検出する周波数群検出手段と、周波数群検出手段により検出された第1の周波数群の周波数及び第2の周波数群の周波数のうち共通な周波数を検出する周波数検出手段と、FFT手段により得られた各周波数の左チャンネルオーディオ信号の正弦波成分及び各周波数の右チャンネルオーディオ信号の正弦波成分のうち、周波数検出手段で検出された共通な周波数の正弦波成分同士を加算して加算正弦波成分を得ると共に、FFT手段により得られた各周波数の左チャンネルオーディオ信号の余弦波成分及び各周波数の右チャンネルオーディオ信号の余弦波成分のうち、周波数検出手段で検出された共通な周波数の余弦波成分同士を加算して加算余弦波成分を得る加算手段と、加算手段より得られた加算正弦波成分及び加算余弦波成分を逆フーリエ変換して加算オーディオ信号を得るIFFT手段と、左右に拡大した位置に音像定位させる処理を行った拡大オーディオ信号に、IFFT手段で得られた加算オーディオ信号を加算した信号を新たな拡大オーディオ信号として生成する信号生成手段とを備えるようにして実現した。 The acoustic signal generation device generates a stereo signal as an enlarged stereo signal having a wider interval than that of the narrow interval speaker by causing the stereo signal to sound from a narrow interval speaker arranged at a narrower interval than the left and right speakers at a predetermined interval. In addition, only the central sound source localized at the center of the left and right speakers does not give the effect of the enlarged stereo sound signal, and the object is to realize a device that can be generated as a reproduction sound signal without a sense of hollowing out, FFT means for obtaining a sine wave component and a cosine wave component of each frequency for each predetermined frequency interval by Fourier transforming each of the input left and right two-channel audio signals, and left channel audio for each frequency obtained from the FFT means The level difference between the sine wave component of the signal and the sine wave component of the right channel audio signal is compared. A first frequency group having a set of frequencies in a certain range is detected, and a cosine wave component of the left channel audio signal and a cosine wave component of the right channel audio signal for each frequency obtained by the FFT means Frequency group detecting means for detecting a second frequency group in which frequencies having a level difference within a predetermined range are grouped together, and the frequency of the first frequency group detected by the frequency group detecting means, A frequency detection means for detecting a common frequency among the frequencies of the second frequency group; a sine wave component of the left channel audio signal of each frequency and a sine wave component of the right channel audio signal of each frequency obtained by the FFT means; Among them, the sine wave components of the common frequency detected by the frequency detection means are added together to obtain an addition sine wave component, and the FFT means Among the obtained cosine wave components of the left channel audio signal of each frequency and the cosine wave components of the right channel audio signal of each frequency, add and add the cosine wave components of the common frequency detected by the frequency detection means. An adding means for obtaining a cosine wave component, an IFFT means for obtaining an added audio signal by performing inverse Fourier transform on the added sine wave component and the added cosine wave component obtained from the adding means, and a process for localizing the sound image to a position expanded left and right This is realized by including signal generation means for generating a signal obtained by adding the added audio signal obtained by the IFFT means to the performed enlarged audio signal as a new enlarged audio signal.
音響信号生成装置の構成について述べる。
図1に示す音響信号生成装置10は、音像定位拡大処理器11及びトランスオーラル再生処理器12よりなるステレオ音拡大処理部1と、FFT(Fast Fourier Transform:高速フーリエ変換器)21、22、振幅位相比較器23、中央成分判定器24、中央成分抽出器25、26、成分加算器27、IFFT(Inverse fast Fourier transform;逆高速フーリエ変換器)28、及び制御器29よりなるセンター音処理部2と、加算器3、4とより構成される。
図4に示す音響信号生成装置のはフィルタ111、112よりなる音像定位拡大処理器11と、フィルタ121、122、加算回路123、124、フィルタ125、及び126よりなるトランスオーラル再生処理器12とより構成される。
The configuration of the acoustic signal generation device will be described.
The acoustic
The acoustic signal generation apparatus shown in FIG. 4 includes a sound image localization expansion processor 11 including
音響信号生成装置の動作について述べる。
まず、音響信号生成装置10に入力される左右音響入力信号はステレオ音拡大処理部1及びセンター音処理部2に入力される。ステレオ音拡大処理部1の音像定位拡大処理器11は、左右音響入力信号を狭い間隔で配置される再生用スピーカから発音した際に、発音された音が通常の間隔で配置されるスピーカの位置から発音された音としてヘッドフォンを用いた場合に受聴されるように音像定位を拡大処理した拡大音響信号を生成する。トランスオーラル再生処理器12はヘッドフォン受聴用として生成された拡大音響信号をスピーカにより再生した場合に、視聴者はスピーカからの再生音がヘッドフォン受聴したと同様に視聴されるスピーカ再生信号として生成する。
The operation of the acoustic signal generator will be described.
First, the left and right sound input signals input to the sound
センター音処理部2は、入力される左右音響入力信号から中央に定位される音響信号のみをセンター音信号として取得する。加算器3はトランスオーラル再生処理器12でスピーカ再生信号として生成された左側の出力信号とセンター音処理部2で取得されたセンター音信号とを加算して出力する。同様にして、加算器4はスピーカ再生用信号として生成された右側の出力信号とセンター音号とを加算して出力する。音響信号生成装置10から出力される左右出力信号は、狭い間隔で配置されるスピーカから発した音が通常の間隔で配置されるスピーカの位置から発音される拡大音響信号として再生されると共に、左右音響入力信号により中央に定位される音源は拡大音響信号処理がなされなく、中央音源のボケや中抜け感を伴わない再生用音響信号として生成される音響信号生成装置10を実現している。
The center sound processing unit 2 acquires only the sound signal localized at the center from the input left and right sound input signals as the center sound signal. The adder 3 adds the left output signal generated as the speaker reproduction signal by the
次に、詳細に説明する。
図1に示すセンター音処理部2についてさらに述べる。
FFT21は、例えば44.1kHzで標本化され、ディジタル信号に変換されて入力される左音響入力信号を、例えば1024の標本点を窓区間として高速周波数変換処理を行う。左音響入力信号の正弦周波数成分、及び余弦周波数成分が得られる。FFT22は同様にして右音響入力信号の正弦周波数成分、及び余弦周波数成分を得る。振幅位相比較器23はFFT21及び22から出力される左右音響入力信号の正弦周波数成分、及び余弦周波数成分のそれぞれを比較し、比較して得られる正弦周波数成分、及び余弦周波数成分のそれぞれのレベル差を、分析して得られる周波数毎に出力する。中央成分判定器24は、分析して得られた周波数毎に左側音響入力信号の正弦周波数成分、及び余弦周波数成分と右側音響入力信号の正弦周波数成分、及び余弦周波数成分の相対応するそれぞれを比較し、同一周波数成分で正弦周波数成分、及び余弦周波数成分それぞれのレベル差が例えば3dB以下である周波数値を視聴用左右スピーカの中央に定位するセンター音信号であるとして判定する。
Next, this will be described in detail.
The center sound processing unit 2 shown in FIG. 1 will be further described.
The FFT 21 performs a high-speed frequency conversion process on the left sound input signal sampled at, for example, 44.1 kHz and converted into a digital signal, for example, using 1024 sampling points as window sections. A sine frequency component and a cosine frequency component of the left acoustic input signal are obtained. The
中央成分抽出器25はFFT21で周波数分析して得られた左音響入力信号を構成する周波数のうち、センター音信号であるとして判定された正弦周波数成分及び余弦周波数成分のそれぞれを取得する。中央成分抽出器26は、FFT22で周波数分析して得られた右音響入力信号を構成する周波数のうち、センター音信号であるとして判定された正弦周波数成分及び余弦周波数成分のそれぞれを取得する。成分加算器27は中央成分抽出器25及び26で取得された正弦周波数成分及び余弦周波数成分のそれぞれを加算する。IFFT28は、加算して得られた正弦周波数成分及び余弦周波数成分のそれぞれを、FFT21及び22の窓期間に相当する窓期間で逆高速フーリエ変換を行う。左右音響入力信号に含まれるセンター音信号のみが得られる。加算器3及び4のそれぞれは、トランスオーラル再生処理のなされた左右拡大音響信号に抽出されたセンター音信号を加算する。
The
音響信号生成装置10は、拡大処理された左右拡大音響信号と、抽出され拡大処理のなされないセンター音信号とを加算して得られた左右出力信号を出力する。センター音信号は拡大処理された信号と拡大処理のなされない信号の両者が出力されるため、拡大処理された周囲音と拡大処理のなされないセンター音とは融合された音として視聴される。センター音信号の拡大処理を弱めたり、あるいは拡大処理されたセンター音と拡大処理のなされないセンター音とのレベル比の調整は設計事項であり、センター音の音源の中抜けが少なく、且つ左右音とセンター音とが分離することなく視聴される適当な配分比を設定することになる。
制御器29は、上記の各回路ブロックの制御を行う。
The acoustic
The
なお、ここで、FFT21、22によるセンター音源の抽出を正弦周波数成分及び余弦周波数成分のそれぞれを用いて行うとして述べた。FFT21、22によるセンター音源の抽出は周波数成分のレベル、周波数成分の位相差を調べ、例えばレベル差が3dB程度であり、且つ位相差が例えば30度以内である場合にセンター音源であるとして抽出するようにしても良い。
Here, it has been described that the center sound source is extracted by the
音像定位拡大処理器11及びトランスオーラル再生処理器12での処理についてさらに述べる。
図2は、視聴者59の前面に、例えば開き角20度で配置される左右のスピーカ51、52から発音される音場を、標準的な開き角60度で配置される仮想スピーカ53、54から発音された音として視聴させるための音像定位拡大について示している。即ち、スピーカ51、52から発音される音が、仮想スピーカ53、54から発音された音として視聴者59に聞こえさせるようにする。その場合の左側仮想スピーカ53から発音されて視聴者59の左側の耳元に到達する音の伝達関数をhll、右側の耳元に到達する音の伝達関数をhlrとする。右側仮想スピーカ54から発音されて視聴者59の右側の耳元に到達する音の伝達関数をhrr、左側の耳元に到達する音の伝達関数をhrlとする。左右の仮想スピーカ53、54から再生する信号をxl(t)、xr(t)とするとき、左右の耳元に到達する信号fl(t)、fr(t)は次式で示される。
The processing in the sound image localization enlargement processor 11 and the
FIG. 2 shows, for example, sound fields generated from left and
図3を参照し、左右のスピーカ55、56から発音させ、式(1)の信号fl(t)、fr(t)を視聴者58の左右の耳元に到達させるためのトランスオーラル信号処理について述べる。
同図は、そのトランスオーラル再生処理を説明するための図であり、収録現場において人工頭57の左右の耳元で収音されるPl(t)、Pr(t)の音を、視聴者58の左右の耳元に生じさせる信号処理について説明している。
まず、人工頭57の左右の耳元で収音された信号Pl(t)、Pr(t)は再生現場に設置されるトランスオーラル再生処理器12に入力される。トランスオーラル再生処理器から出力される信号をl(t)、r(t)とし、信号l(t)、r(t)を左右のスピーカ55、56から発音させる。
Referring to FIG. 3, transoral signal processing for causing sound from left and
This figure is a diagram for explaining the transoral reproduction process. The sounds of P l (t) and P r (t) collected at the right and left ears of the
First, the signals P l (t) and P r (t) collected by the left and right ears of the
ここでスピーカ55から視聴者58の左右の耳元までの伝達関数をhLS(t)、hLO(t)とし、スピーカ56から視聴者58の右左の耳元までの伝達関数をhRS(t)、hRO(t)とし、視聴者58の左右の耳元に到達すべき音をPl(t)、Pr(t)とし、次式で表される。
式(2)の両辺をフーリエ変換し、行列の形で表すと式(3)が得られる。
ここで、システムのフィルタ行列をFとすると式(3)は次式で示される。
式(4)において、Fは式(3)中の4つの伝達関数行列式Hの逆行列である。このFで構成されたトランスオーラルシステムをフィードバック方式と呼ぶ。
行列Hはさらに次式の様に変形できる。以下、(t)を省いて記述する。
The matrix H can be further transformed as follows: Hereinafter, description will be made with (t) omitted.
式(5)を式(3)に代入し、両辺をHLSHRSで除す。
式(6)をフーリエ逆変換し、移項する。
図4を参照し、音像定位拡大処理器11及びトランスオーラル再生処理器12で行うフィルタ処理の特性について述べる。
音像定位拡大処理器11は式(1)に示した処理を行う回路ブロックであり、フィルタ111は入力される左側の信号xl(t)にhll(t)+hrl(t)の特性を与え、フィルタ112は入力される右側の信号xr(t)にhlr(t)+hrr(t)の特性を与える。
トランスオーラル再生処理器12は式(7)に示した処理を行う回路ブロックである。即ち、音像定位拡大処理器11から出力されるfl(t)、fr(t)をそのまま視聴者58に視聴させようとするものである。
fl(t)=Pl(t)、fr(t)=Pr(t)とさせるための信号処理を行う。
式(7)に示した特性はトランスオーラル再生処理器12に示すフィルタ121、122、125、126、加算回路(減算回路)123、及び124により得ることが出来る。
With reference to FIG. 4, the characteristics of the filter processing performed by the sound image localization enlargement processor 11 and the
The sound image localization enlargement processor 11 is a circuit block that performs the processing shown in Expression (1), and the filter 111 applies a characteristic of h ll (t) + h rl (t) to the input left signal x l (t). The
The
Signal processing is performed so that f l (t) = P l (t) and f r (t) = P r (t).
The characteristic shown in the equation (7) can be obtained by the
音像定位拡大処理器11及びトランスオーラル再生処理器12により、狭い間隔で配置される再生用スピーカを用い、再生音を通常の間隔で配置されるスピーカの位置から発音された音としてヘッドフォン受聴されるように音像定位を拡大処理して視聴できるものの、左右スピーカの中央に定位されるセンター音源も拡大音響信号処理されて視聴される。センター音処理部2は、センター音源を左右音響入力信号から抽出し、拡大音響信号処理を行うことなく再生させるためセンター音源の音像が必要以上に大きくなったり、中抜け音として視聴されるのを防止している。
The sound image localization enlargement processor 11 and the
図5を参照し、音響信号生成装置10の処理の流れについて説明する。
まず、S(ステップ)71で音響信号生成装置10には左右音響入力信号が入力される。S72で左右音響入力信号はステレオ音拡大処理部1とセンター音処理部2とに供給される。S73でステレオ音拡大処理部1は左右音響入力信号の音像定位拡大処理及びトランスオーラル再生処理を行い、拡大音響信号を生成する。S74でセンター音処理部2は左右音響入力信号をFFT処理し、振幅および位相情報、又は正弦波成分及び余弦波成分の成分情報を得る。S75で、FFT処理して得られた成分情報が左右の音響入力信号同士で同一である、即ちセンター音信号であるかが、左右に配置されるスピーカの近辺から再生される音響信号との比較において判定される。S76で、左右で似通った周波数及びレベル成分が検出される場合はセンター音信号であるとして判定される。そのセンター音成分が抽出される。S77で、抽出された中央成分はIFFTされ、センター音信号が得られる。
S78で、S73で拡大処理された入力信号と、S77で抽出されたセンター音信号とが加算される。S79で加算して得られる音響信号が出力信号として音響信号生成装置10から出力される。
With reference to FIG. 5, the process flow of the acoustic
First, in S (step) 71, the left and right sound input signals are input to the sound
In S78, the input signal expanded in S73 and the center sound signal extracted in S77 are added. The acoustic signal obtained by the addition in S79 is output from the acoustic
図6を参照し、音響信号生成装置10の応用処理の流れについて説明する。
図6に示す応用処理は、図5に示した処理に比し、入力信号からセンター音信号を抽出する処理方法で異なっている。図5に示したと同じ処理については同じ符号を付し説明を省く。
S81において、S75で判定して得られた左右音響信号の中央成分が存在する周波数特性から、中央成分のみを通過させるためのフィルタ特性を得る。S82で、得られたバンドパス特性を有するフィルタを実現する。そのフィルタは急峻な通過、遮断特性を有するイコライザ特性とも類似している。S83で、S72により供給された入力信号を、S82で実現された特性で通過させることによりセンター音信号を抽出する。S78以降は同様に動作し、音響信号が音響信号生成装置10から出力される。
With reference to FIG. 6, the flow of application processing of the acoustic
The application process shown in FIG. 6 differs from the process shown in FIG. 5 in the processing method for extracting the center sound signal from the input signal. The same processes as those shown in FIG. 5 are denoted by the same reference numerals and description thereof is omitted.
In S81, a filter characteristic for passing only the central component is obtained from the frequency characteristic in which the central component of the left and right acoustic signals obtained by the determination in S75 is present. In S82, a filter having the obtained bandpass characteristic is realized. The filter is also similar to an equalizer characteristic having a steep passage and cutoff characteristic. In S83, the center sound signal is extracted by passing the input signal supplied in S72 with the characteristics realized in S82. After S78, the operation is the same, and an acoustic signal is output from the acoustic
以上のように、本実施例で示した音響信号生成装置10によれば、入力される左右2チャンネルのオーディオ信号のそれぞれをフーリエ変換して所定周波数間隔ごとの各周波数の正弦波成分及び余弦波成分を得るFFT手段21、22と、FFT手段より得られた各周波数毎の左チャンネルオーディオ信号の正弦波成分と右チャンネルオーディオ信号の正弦波成分とのレベルを比較しレベル差が所定の範囲にある周波数を1つのまとまりとした第1の周波数群を検出すると共に、FFT手段より得られた各周波数毎の左チャンネルオーディオ信号の余弦波成分と右チャンネルオーディオ信号の余弦波成分とのレベルを比較しレベル差が所定の範囲にある周波数を1つのまとまりとした第2の周波数群を検出する周波数群検出手段23と、周波数群検出手段により検出された第1の周波数群の周波数及び第2の周波数群の周波数のうち共通な周波数を検出する周波数検出手段24と、FFT手段により得られた各周波数の左チャンネルオーディオ信号の正弦波成分及び各周波数の右チャンネルオーディオ信号の正弦波成分のうち、周波数検出手段で検出された共通な周波数の正弦波成分同士を加算して加算正弦波成分を得ると共に、FFT手段により得られた各周波数の左チャンネルオーディオ信号の余弦波成分及び各周波数の右チャンネルオーディオ信号の余弦波成分のうち、周波数検出手段で検出された共通な周波数の余弦波成分同士を加算して加算余弦波成分を得る加算手段27と、加算手段より得られた加算正弦波成分及び加算余弦波成分を逆フーリエ変換して加算オーディオ信号を得るIFFT手段28と、左右に拡大した位置に音像定位させる処理を行った拡大オーディオ信号に、IFFT手段で得られた加算オーディオ信号を加算した信号を新たな拡大オーディオ信号として生成する信号生成手段3、4とを備えるので、ステレオ信号を所定間隔の左右スピーカよりも狭い間隔に配置される狭間隔スピーカから発音させ、ステレオ信号を狭間隔スピーカよりも広い間隔の広がりを有する拡大ステレオ信号として生成すると共に、左右スピーカの中央に定位される中央音源のみは拡大ステレオ音響信号の効果を与えなく、中抜け感を伴わない再生用音響信号として生成することを可能とする音響信号生成装置を実現できる。
As described above, according to the acoustic
1 ステレオ音拡大処理部
2 センター音処理部
3、4 加算器
10 音響信号生成装置
11 音像定位拡大処理器
12 トランスオーラル再生処理器
21、22 FFT
23 振幅位相比較器
24 中央成分判定器
25、26 中央成分抽出器
27 成分加算器
28 IFFT
29 制御器
111、112、121、122、125、126 フィルタ
123、124 加算回路
DESCRIPTION OF
23 Amplitude /
29
Claims (1)
前記入力される左右2チャンネルのオーディオ信号のそれぞれをフーリエ変換して所定周波数間隔ごとの各周波数の正弦波成分及び余弦波成分を得るFFT手段と、
前記FFT手段より得られた各周波数毎の左チャンネルオーディオ信号の正弦波成分と右チャンネルオーディオ信号の正弦波成分とのレベルを比較しレベル差が所定の範囲にある周波数を1つのまとまりとした第1の周波数群を検出すると共に、前記FFT手段より得られた各周波数毎の左チャンネルオーディオ信号の余弦波成分と右チャンネルオーディオ信号の余弦波成分とのレベルを比較しレベル差が所定の範囲にある周波数を1つのまとまりとした第2の周波数群を検出する周波数群検出手段と、
前記周波数群検出手段により検出された第1の周波数群の周波数及び第2の周波数群の周波数のうち共通な周波数を検出する周波数検出手段と、
前記FFT手段により得られた各周波数の左チャンネルオーディオ信号の正弦波成分及び各周波数の右チャンネルオーディオ信号の正弦波成分のうち、前記周波数検出手段で検出された共通な周波数の正弦波成分同士を加算して加算正弦波成分を得ると共に、前記FFT手段により得られた各周波数の左チャンネルオーディオ信号の余弦波成分及び各周波数の右チャンネルオーディオ信号の余弦波成分のうち、前記周波数検出手段で検出された共通な周波数の余弦波成分同士を加算して加算余弦波成分を得る加算手段と、
前記加算手段より得られた加算正弦波成分及び加算余弦波成分を逆フーリエ変換して加算オーディオ信号を得るIFFT手段と、
前記左右に拡大した位置に音像定位させる処理を行った拡大オーディオ信号に、前記IFFT手段で得られた加算オーディオ信号を加算した信号を新たな拡大オーディオ信号として生成する信号生成手段と、
を備えることを特徴とする音響信号生成装置。 Obtained by performing sound image localization processing on the input audio signal to a position expanded to the left and right with respect to the sound image localization position obtained when the input left and right two-channel audio signals are reproduced by a pair of left and right speakers. In an acoustic signal generation device that outputs an enlarged audio signal,
FFT means for obtaining a sine wave component and a cosine wave component of each frequency for each predetermined frequency interval by Fourier transforming each of the input left and right two-channel audio signals;
The levels of the sine wave component of the left channel audio signal and the sine wave component of the right channel audio signal obtained for each frequency obtained from the FFT means are compared, and the frequencies having a level difference within a predetermined range are defined as one unit. 1 frequency group is detected, and the levels of the cosine wave component of the left channel audio signal and the cosine wave component of the right channel audio signal for each frequency obtained from the FFT means are compared, and the level difference is within a predetermined range. A frequency group detection means for detecting a second frequency group in which a certain frequency is a unit;
Frequency detection means for detecting a common frequency among the frequencies of the first frequency group and the second frequency group detected by the frequency group detection means;
Of the sine wave component of the left channel audio signal of each frequency and the sine wave component of the right channel audio signal of each frequency obtained by the FFT unit, sine wave components of the common frequency detected by the frequency detection unit are combined. Addition to obtain an addition sine wave component, and the frequency detection means detects the cosine wave component of the left channel audio signal of each frequency and the cosine wave component of the right channel audio signal of each frequency obtained by the FFT means. Adding means for adding the cosine wave components having the same common frequency to obtain an added cosine wave component;
IFFT means for obtaining an added audio signal by performing inverse Fourier transform on the added sine wave component and the added cosine wave component obtained from the adding means;
Signal generating means for generating, as a new enlarged audio signal, a signal obtained by adding the added audio signal obtained by the IFFT means to the enlarged audio signal subjected to the process of localizing the sound image at the position expanded to the left and right;
An acoustic signal generation device comprising:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006272725A JP2008092411A (en) | 2006-10-04 | 2006-10-04 | Audio signal generating device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006272725A JP2008092411A (en) | 2006-10-04 | 2006-10-04 | Audio signal generating device |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2008092411A true JP2008092411A (en) | 2008-04-17 |
Family
ID=39376044
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006272725A Pending JP2008092411A (en) | 2006-10-04 | 2006-10-04 | Audio signal generating device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2008092411A (en) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011061627A (en) * | 2009-09-11 | 2011-03-24 | Yamaha Corp | Acoustic processing apparatus |
JP2011199811A (en) * | 2010-03-24 | 2011-10-06 | Yamaha Corp | Acoustic processing apparatus |
JP2012060599A (en) * | 2010-09-13 | 2012-03-22 | Clarion Co Ltd | Acoustic processing apparatus |
JP2013527727A (en) * | 2010-06-02 | 2013-06-27 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | Sound processing system and method |
US9161148B2 (en) | 2011-09-09 | 2015-10-13 | Samsung Electronics Co., Ltd. | Signal processing apparatus and method for providing 3D sound effect |
JP2017168983A (en) * | 2016-03-15 | 2017-09-21 | ヤマハ株式会社 | Signal processing device and signal processing method |
-
2006
- 2006-10-04 JP JP2006272725A patent/JP2008092411A/en active Pending
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011061627A (en) * | 2009-09-11 | 2011-03-24 | Yamaha Corp | Acoustic processing apparatus |
JP2011199811A (en) * | 2010-03-24 | 2011-10-06 | Yamaha Corp | Acoustic processing apparatus |
JP2013527727A (en) * | 2010-06-02 | 2013-06-27 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | Sound processing system and method |
JP2012060599A (en) * | 2010-09-13 | 2012-03-22 | Clarion Co Ltd | Acoustic processing apparatus |
US9161148B2 (en) | 2011-09-09 | 2015-10-13 | Samsung Electronics Co., Ltd. | Signal processing apparatus and method for providing 3D sound effect |
JP2017168983A (en) * | 2016-03-15 | 2017-09-21 | ヤマハ株式会社 | Signal processing device and signal processing method |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5957446B2 (en) | Sound processing system and method | |
JP5944840B2 (en) | Stereo sound reproduction method and apparatus | |
EP1964438B1 (en) | Device for and method of processing an audio data stream | |
JP5865899B2 (en) | Stereo sound reproduction method and apparatus | |
JP5485693B2 (en) | Apparatus and method for processing audio signals | |
JP2010538572A (en) | Audio signal decoding method and apparatus | |
JP2008092411A (en) | Audio signal generating device | |
JP4480335B2 (en) | Multi-channel audio signal processing circuit, processing program, and playback apparatus | |
US20190289418A1 (en) | Method and apparatus for reproducing audio signal based on movement of user in virtual space | |
CN115226022A (en) | Content-based spatial remixing | |
JP2003523675A (en) | Multi-channel sound reproduction system for stereophonic sound signals | |
WO2022014326A1 (en) | Signal processing device, method, and program | |
JPH11113097A (en) | Audio system | |
KR100849030B1 (en) | 3D sound Reproduction Apparatus using Virtual Speaker Technique under Plural Channel Speaker Environments | |
KR100802339B1 (en) | 3D sound Reproduction Apparatus and Method using Virtual Speaker Technique under Stereo Speaker Environments | |
KR20100084332A (en) | 3d audio localization method and device and the recording media storing the program performing the said method | |
JPH0560100U (en) | Sound reproduction device | |
JP6355049B2 (en) | Acoustic signal processing method and acoustic signal processing apparatus | |
JP4616736B2 (en) | Sound collection and playback device | |
JP7332745B2 (en) | Speech processing method and speech processing device | |
Mickiewicz et al. | Spatialization of sound recordings using intensity impulse responses | |
JP2009278668A (en) | Processing circuit, processing program, and reproduction apparatus of two-channel sound signal | |
JP2017175417A (en) | Acoustic reproducing device | |
Maher | Single-ended spatial enhancement using a cross-coupled lattice equalizer | |
JP2009025025A (en) | Device for estimating sound-source direction and sound source separating device using the same, and method for estimating sound-source direction and sound source separating method using the same |