JP2007065497A - Signal processing apparatus - Google Patents
Signal processing apparatus Download PDFInfo
- Publication number
- JP2007065497A JP2007065497A JP2005253913A JP2005253913A JP2007065497A JP 2007065497 A JP2007065497 A JP 2007065497A JP 2005253913 A JP2005253913 A JP 2005253913A JP 2005253913 A JP2005253913 A JP 2005253913A JP 2007065497 A JP2007065497 A JP 2007065497A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- mixing
- unit
- processing
- filter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
Description
本発明は、複数の信号をダウンミックスした信号とそれをもとの信号に分離するための情報を符号化した符号化信号を復号化するための信号処理装置に関する。特に、信号間の位相差や、レベル比を符号化することによって少ない情報量でマルチチャネルの臨場感を符号化した符号化信号を復号化できるような技術に関する。 The present invention relates to a signal processing apparatus for decoding a signal obtained by down-mixing a plurality of signals and an encoded signal obtained by encoding information for separating the signal into the original signal. In particular, the present invention relates to a technique capable of decoding an encoded signal obtained by encoding multi-channel presence with a small amount of information by encoding a phase difference between signals and a level ratio.
近年、Spatial Codec(空間的符号化)といわれる技術開発が行われている。これは、非常に少ない情報量でマルチチャネルの臨場感を圧縮・符号化することを目的としており、例えば、既にデジタルテレビの音声方式として広く用いられているマルチチャネルコーデックであるAAC方式が、5.1ch当り512kbpsや、384kbpsというビットレートを要するのに対し、Spatial Codecでは、128kbpsや、64kbps、さらに48kbpsといった非常に少ないビットレートでマルチチャネル信号を圧縮・符号化することを目指している。そのための技術として、例えば、MPEGオーディオ方式で規格化されたParametric Coding for High Quality Audio(非特許文献1)がある。それによると、チャンネル間の位相差や、レベル比を符号化することによって少ない情報量で臨場感を圧縮符号化した信号を復号化する過程が述べられている。図5にその過程を示した。まず、入力信号Sは、もともとは2chの信号であったものをモノラル信号にダウンミックスしたものである。入力信号Sは、decorrelation と呼ばれる処理モジュールに入力され、出力信号Dを得る。decorrelationの処理過程は、非特許文献1の8.6.4.5.2節 Calculate decorrelated signal に詳しく述べられているので詳しい説明は省略するが、decorrelationは、大きく2つの処理で構成されている。1つ目は遅延の処理である。これは入力信号を予め定められた時間分遅延させる処理である。その後、前記遅延した信号は、All Pass Filterという処理に掛けられる。この処理は信号に残響成分(reverberation)を与える処理である。さて、そのようにして生成された信号Dと、前記入力信号Sとは、Mixingといわれる処理に掛けられる。この処理も、非特許文献1の8.6.4.6.2 Mixingに詳しく述べられているので詳しい説明は省略するが、前記2つの信号SとDとに、係数h11, h12, h21, h22が掛けられでそれぞれ合算され、出力のLch信号、Rch信号を得る。その式は図内に示したとおりである。ここで、係数h11, h12, h21, h22は、前記入力のモノラル信号をもとになった、もともとの2chの信号間のレベル比や、位相差によって決まる値であるが、それらレベル比や、位相差の情報から前記係数h11, h12, h21, h22を求めるこの求め方も非特許文献1に述べられているのでここでは省略する。
In recent years, a technology called Spatial Codec has been developed. This is for the purpose of compressing and encoding the presence of multi-channel with a very small amount of information. For example, the AAC system, which is a multi-channel codec that is already widely used as an audio system for digital television, is 5.1. While bit rates of 512 kbps and 384 kbps are required per channel, Spatial Codec aims to compress and encode multichannel signals at very low bit rates of 128 kbps, 64 kbps, and 48 kbps. As a technique for that purpose, for example, there is Parametric Coding for High Quality Audio (Non-patent Document 1) standardized by the MPEG audio system. According to this, a process is described in which a signal in which a sense of presence is compression-coded with a small amount of information is encoded by encoding a phase difference between channels or a level ratio. FIG. 5 shows the process. First, the input signal S is a signal obtained by downmixing what was originally a 2ch signal into a monaural signal. The input signal S is input to a processing module called decorrelation to obtain an output signal D. The decorrelation process is described in detail in Section 8.6.4.5.2 Calculate Decorrelated signal in
このような処理をすることによって、decorrelationにおける遅延の処理と残響成分の付加との効果で、モノラル化された信号から2chの信号を生成する際に、空間的な広がり間が与えられ、良好なステレオ信号が得られる。
しかしながら、上記のような方法には、以下のような課題がある。すなわち、入力の信号が非常に時間変動の激しいもので合った場合(例えば金属系の打楽器のアタックの瞬間などの場合)、前記decorrelationの処理内の、遅延と残響成分の付加との効果で、decorrelation後の信号はそのシャープさを失ってしまう。さらにそのdecorrelation後の信号が、後段のMixingの処理によって、入力の信号Sと合算されるので、結果として、出力信号は、入力信号のシャープさを失ってしまうこととなる。 However, the above method has the following problems. That is, when the input signal is matched with a signal with very severe time fluctuation (for example, at the moment of attack of a metallic percussion instrument), the delay and reverberation components in the decorrelation process are effective. The signal after decorrelation loses its sharpness. Further, since the signal after the decorrelation is added to the input signal S by the mixing process in the subsequent stage, as a result, the output signal loses the sharpness of the input signal.
また同様に、入力の信号の周波数成分が特定の周波数帯域に偏って存在する場合(例えば1種類の楽器の音色が連続的に続いているような場合)、本来、非常にしっかりとした定位の音像が結ばれるべきであるが、前記decorrelationの処理内の、遅延と残響成分の付加との効果で、decorrelation後の信号はそのしっかりとした定位の音像がぼやけてしまう。さらにそのdecorrelation後の信号が、後段のMixingの処理によって、入力の信号Sと合算されるので、結果として、出力信号の音像がぼやけてしまうこととなる。 Similarly, when the frequency component of the input signal is biased to a specific frequency band (for example, when the tone of one kind of instrument continues continuously), it is inherently very solid. Although a sound image should be formed, due to the effects of delay and addition of reverberation components in the decorrelation process, the sound image with a firm localization is blurred in the signal after decorrelation. Further, the signal after the decorrelation is added to the input signal S by the subsequent mixing process, and as a result, the sound image of the output signal is blurred.
また、生成される2chの信号は、モノラル化された信号からレベル比や、位相差の情報のみを手がかりに分離されたものであるので、その分離の性能は、不十分である場合も多い。 In addition, since the generated 2ch signal is separated from the monaural signal using only the level ratio and phase difference information as a clue, the separation performance is often insufficient.
本発明は、このような従来の問題点に鑑みてなされたものであって、
モノラル化された信号から2chの信号を生成する際に、空間的な広がり間が与えられ、良好なステレオ信号が得られると同時に、音の時間的変動のシャープさや、音像のしっかりとした定位も実現できる信号処理装置を提供することを目的とする。
The present invention has been made in view of such conventional problems,
When a 2ch signal is generated from a monaural signal, a spatial spread is given and a good stereo signal is obtained. At the same time, the sharpness of temporal fluctuation of sound and the localization of the sound image are fixed. An object of the present invention is to provide a signal processing apparatus that can be realized.
また、分離感の不足を補うようなる信号処理装置を提供することを目的とする。 Another object of the present invention is to provide a signal processing device that compensates for the lack of separation.
上記の課題を解決するため、請求項1記載の信号処理装置は、第1の信号と、前記第1の信号から生成した第2の信号とを、2通りの混合の度合で混合することで2つの信号を生成する信号処理装置であって、前記第1の信号から前記第2の信号を生成する生成手段と、前記混合の度合を決定する混合係数決定手段と、前記混合係数決定手段で決定された混合の度合に基づいて、前記第1の信号と前記第2の信号とを混合する混合手段と、を有し、前記生成手段は、前記第1の信号をN(N>0)単位時間遅延させる遅延手段と、前記遅延手段の出力信号を加工するフィルタ手段と、前記第1の信号を加工する加工手段と、を備え、前記生成手段は、前記フィルタ手段の出力信号と前記加工手段の出力信号とから前記第2の信号を生成することを特徴とするものである。
In order to solve the above-described problem, the signal processing device according to
請求項2記載の信号処理装置は、前記生成手段が、前記第1の信号の音響的特徴量に応じて、前記フィルタ手段の出力信号と前記加工手段の出力信号とから前記第2の信号を合成する合成手段を有し、前記音響的特徴量が、前記第1の信号が急峻に変動している場合大となる特徴量であることを特徴とするものである。 The signal processing apparatus according to claim 2, wherein the generation unit generates the second signal from an output signal of the filter unit and an output signal of the processing unit according to an acoustic feature amount of the first signal. And combining means for combining, wherein the acoustic feature quantity is a feature quantity that becomes large when the first signal is abruptly fluctuating.
請求項3記載の信号処理装置は、前記生成手段が、前記第1の信号の音響的特徴量に応じて、前記フィルタ手段の出力信号と前記加工手段の出力信号とから前記第2の信号を合成する合成手段を有し、前記音響的特徴量が、前記第1の信号が特定の周波数帯域に強いエネルギーが集中している場合大となる特徴量であることを特徴とするものである。 The signal processing apparatus according to claim 3, wherein the generation unit generates the second signal from an output signal of the filter unit and an output signal of the processing unit in accordance with an acoustic feature amount of the first signal. The acoustic feature amount is a feature amount that becomes large when strong energy is concentrated in a specific frequency band in the first signal.
請求項4記載の信号処理装置は、前記合成手段が、前記特徴量が小である場合は、前記フィルタ手段の出力信号を出力し、前記特徴量が大である場合は、前記加工手段の出力信号を出力することを特徴とするものである。
The signal processing apparatus according to
請求項5記載の信号処理装置は、前記合成手段が、前記フィルタ手段の出力信号と前記加工手段の出力信号とを混合する第2の混合手段を有し、前記特徴量が小である場合は、前記フィルタ手段の出力信号を多めに混合し、前記特徴量が大である場合は、前記加工手段の出力信号を多めに混合することを特徴とするものである。 The signal processing apparatus according to claim 5, wherein the combining unit includes a second mixing unit that mixes the output signal of the filter unit and the output signal of the processing unit, and the feature amount is small. The output signal of the filter means is mixed in a large amount, and when the feature amount is large, the output signal of the processing means is mixed in a large amount.
請求項6記載の信号処理装置は、前記加工手段が、第2のフィルタ手段を有し、前記第2のフィルタ手段は前期第1のフィルタ手段よりフィルタの次数が少ないことを特徴とするものである。
The signal processing apparatus according to
請求項7記載の信号処理装置は、前記加工手段が、第2の遅延手段を有し、前記第2の遅延手段は前記第1の遅延手段より遅延量が少ないことを特徴とするものである。 The signal processing apparatus according to claim 7, wherein the processing unit includes a second delay unit, and the second delay unit has a delay amount smaller than that of the first delay unit. .
請求項8記載の信号処理装置は、第3のフィルタ手段を備え、前記第3のフィルタ手段は、入力信号の位相を90度或いは‐90度回転させる処理であることを特徴とするものである。 The signal processing device according to claim 8 is provided with a third filter means, and the third filter means is a process for rotating the phase of the input signal by 90 degrees or -90 degrees. .
請求項9記載の信号処理装置は、前記生成手段が複数の周波数成分に対しそれぞれ独立に信号を処理することが出来るように構成されており、低い周波数帯域の信号に対しては前記フィルタ手段の信号を出力し、高い周波数帯域の信号に対しては前記加工手段の信号を出力することを特徴とするものである。 The signal processing device according to claim 9 is configured such that the generation unit can process a signal independently for each of a plurality of frequency components. A signal is output, and a signal of the processing means is output for a signal in a high frequency band.
請求項10記載の信号処理装置は、前記第1の信号は、2つの信号をダウンミックして得られた信号であり、前記混合係数決定手段は、前記もともとの2つの信号間のレベル比Lと位相差θとに応じて決まる値から、混合の度合を決定するものである。 The signal processing apparatus according to claim 10, wherein the first signal is a signal obtained by downmixing two signals, and the mixing coefficient determination unit is configured to output a level ratio L between the two original signals. The degree of mixing is determined from a value determined according to the phase difference θ.
請求項11記載の信号処理装置は、前記混合係数決定手段が、隣り合う2辺の成す角度が前記θで、長さの比が前記Lであるところの平行四辺形の前記θが当該平行四辺形の対角線によって分割されて得られる角度をA、Bとし、前記レベル比Lに応じて決まる値d1、d2とした時、d1*cos(A)、d1*sin(A)、d2*cos(-B)、d2*sin(-B)とをもとめ、前記混合手段は、前記第1の信号を複素数で表現したときの実数部をr1、虚数部をi1、前記第2の信号を複素数で表現したときの実数部をr2、虚数部をi2、としたとき、d1*cos(A)*r1+d1*sin(A)*r2 を1つ目の出力信号の実数部とし、d1*cos(A)*i1+d1*sin(A)*i2 を1つ目の出力信号の虚数部とし、d2*cos(-B)*r1+d2*sin(-B)*r2 を2つ目の出力信号の実数部とし、d2*cos(-B)*i1+d2*sin(-B)*i2 を2つ目の出力信号の虚数部とすることを特徴とするものである。
12. The signal processing apparatus according to
請求項12記載の信号処理装置は、前記混合係数決定手段が、前記d1、d2の値を、d1 = L/((1+2*L*cos(θ)+ L*L)^0.5 )、d2=1/((1+2*L*cos(θ)+L*L)^0.5)として求めることを特徴とするものである。 The signal processing apparatus according to claim 12, wherein the mixing coefficient determination unit sets the values of d1 and d2 to d1 = L / ((1 + 2 * L * cos (θ) + L * L) ^ 0.5), d2 = 1 / ((1 + 2 * L * cos (θ) + L * L) ^ 0.5).
請求項13記載の信号処理装置は、前記混合係数決定手段が、前記d1、d2の値を、d1=L/((1+L*L)^0.5)、d2=1/((1+L*L)^0.5)として求めることを特徴とするものである。 The signal processing apparatus according to claim 13, wherein the mixing coefficient determining means sets the values of d1 and d2 to d1 = L / ((1 + L * L) ^ 0.5), d2 = 1 / ((1 + L * L) ^ 0.5).
請求項14の信号処理装置は、前記音響的特徴量を符号化したデータを受信する特徴量受信手段を更に有し、前記生成手段は、前記音響的特徴量を符号化したデータに応じて、信号を生成することを特徴とするものである。 The signal processing device according to claim 14 further includes a feature amount receiving unit that receives data in which the acoustic feature amount is encoded, and the generation unit is configured to respond to the data in which the acoustic feature amount is encoded. A signal is generated.
請求項15の信号処理装置は、前記音響的特徴量を符号化したデータは1ビットのデータであり、前記生成手段は、当該データが真の場合は、前記加工手段の出力信号を出力し、偽の場合は前記フィルタ手段の出力信号を出力することを特徴とするものである。 The signal processing device according to claim 15, wherein the data obtained by encoding the acoustic feature amount is 1-bit data, and the generation unit outputs an output signal of the processing unit when the data is true, In the case of false, the output signal of the filter means is output.
請求項16記載の信号処理装置は、第1の信号と、前記第1の信号から生成した第2の信号とを、2通りの混合の度合で混合することで2つの信号を生成する信号処理装置であって、前記第1の信号から前記第2の信号を生成する生成手段と、前記混合の度合を決定する混合係数決定手段と、前記混合係数決定手段で決定された混合の度合に基づいて、前記第1の信号と前記第2の信号とを混合する混合手段と、前記混合手段から生成される2つの信号の再生音像を離れた位置に移動させるための信号処理を行う音像移動手段と、を有することを特徴とするものである。 17. The signal processing device according to claim 16, wherein the first signal and the second signal generated from the first signal are mixed in two degrees of mixing to generate two signals. An apparatus for generating the second signal from the first signal; a mixing coefficient determining means for determining the degree of mixing; and a mixing degree determined by the mixing coefficient determining means. Mixing means for mixing the first signal and the second signal, and sound image moving means for performing signal processing for moving the reproduced sound images of the two signals generated from the mixing means to positions separated from each other. It is characterized by having.
請求項17記載の信号処理装置は、前記音像移動手段は、前記混合手段から生成される2つの信号を受信し、当該信号を加工することによって2つの信号の再生音像を離れた位置に移動させることを特徴とするものである。 The signal processing device according to claim 17, wherein the sound image moving means receives two signals generated from the mixing means and processes the signals to move the reproduced sound images of the two signals to positions separated from each other. It is characterized by this.
請求項18記載の信号処理装置は、前記音像移動手段は、前記混合係数決定手段で決定された混合の度合を加工することによって、前記混合手段によって生成される2つの信号の再生音像が離れた位置に移動するようにすることを特徴とするものである。 19. The signal processing apparatus according to claim 18, wherein the sound image moving means processes the degree of mixing determined by the mixing coefficient determining means so that the reproduced sound images of the two signals generated by the mixing means are separated from each other. It is characterized by moving to a position.
請求項19記載の信号処理装置は、前記音像移動手段は、前記混合手段から生成される2つの信号のうち一方の信号に対し当該信号の再生音像を第1の方向に移動させるための信号処理を施す第1の処理手段と、他方の信号に対し当該信号の再生音像を前記第1の方向の逆の方向である第2の方向に移動させるための信号処理を施す第2の処理手段とを備えることを特徴とするものである。 20. The signal processing apparatus according to claim 19, wherein the sound image moving means moves the reproduced sound image of the signal in the first direction with respect to one of the two signals generated from the mixing means. And second processing means for performing signal processing for moving the reproduced sound image of the signal in a second direction that is opposite to the first direction with respect to the other signal. It is characterized by providing.
請求項20記載の信号処理装置は、前記第1の処理手段は、所定の周波数帯域の信号の振幅を変化させる処理を実施し、前記第2の処理手段は、前記周波数帯域と異なる周波数帯域の信号の振幅を変化させる処理を実施することを特徴とするものである。 The signal processing apparatus according to claim 20, wherein the first processing unit performs processing of changing an amplitude of a signal in a predetermined frequency band, and the second processing unit has a frequency band different from the frequency band. A process for changing the amplitude of the signal is performed.
請求項21記載の信号処理装置は、前記混合手段から生成される2つの信号が近似している場合は前記音像移動手段から生成される信号を出力し、そうでない場合は、前記混合手段から生成される信号を出力することを特徴とするものである。 The signal processing apparatus according to claim 21, wherein the two signals generated from the mixing unit are approximated to output a signal generated from the sound image moving unit, and otherwise, generated from the mixing unit. The output signal is output.
請求項1の発明によれば、モノラル信号からステレオ信号を生成する際、残響成分が有用な場合と不要な場合のどちらでも適切なステレオ信号を生成できることとなる。 According to the first aspect of the present invention, when a stereo signal is generated from a monaural signal, an appropriate stereo signal can be generated regardless of whether the reverberation component is useful or unnecessary.
請求項2の発明によれば、時間変動が急峻な入力信号に対して適切なステレオ信号を生成できることとなる。 According to the second aspect of the present invention, it is possible to generate an appropriate stereo signal for an input signal having a sharp time variation.
請求項3の発明によれば、周波数特性が急峻な入力信号に対して適切なステレオ信号を生成できることとなる。 According to the third aspect of the present invention, an appropriate stereo signal can be generated for an input signal having a sharp frequency characteristic.
請求項4の発明によれば、入力信号の状態に応じて、適切に切り替えることができることとなる。
According to the invention of
請求項5の発明によれば、入力信号の状態が、中間的な状態であっても、適切な信号を生成できることとなる。 According to the invention of claim 5, even if the state of the input signal is an intermediate state, an appropriate signal can be generated.
請求の6発明によれば、フィルタ次数の小さなフィルタによって適切な残響の信号を生成できることとなる。 According to the sixth aspect of the invention, an appropriate reverberant signal can be generated by a filter having a small filter order.
請求の7発明によれば、遅延量の小さな遅延手段によって適切な残響の信号を生成できることとなる。 According to the seventh aspect of the invention, an appropriate reverberation signal can be generated by the delay means having a small delay amount.
請求の8発明によれば、フィルタ遅延を伴わないフィルタによって適切な残響の信号を生成できることとなる。 According to the eighth aspect of the present invention, an appropriate reverberant signal can be generated by a filter without a filter delay.
請求の9発明によれば、周波数成分ごとに独立に残響成分を制御できることとなる。
請求の10発明によれば、混合の度合をレベル比と位相差情報とによって決定することができることとなる。
According to the ninth aspect of the invention, the reverberation component can be controlled independently for each frequency component.
According to the tenth aspect of the present invention, the degree of mixing can be determined by the level ratio and the phase difference information.
請求の11発明によれば、混合の度合をレベル比と位相差情報とによってもとめる際、位相の分配を数学的に正しく決定することができることとなる。 According to the eleventh aspect of the invention, when the degree of mixing is obtained from the level ratio and the phase difference information, the phase distribution can be determined mathematically and correctly.
請求の12発明によれば、混合の度合をレベル比と位相差情報とによってもとめる際、ゲインの分配を数学的に正しく決定することができることとなる。 According to the twelfth aspect of the present invention, when the degree of mixing is obtained from the level ratio and the phase difference information, the gain distribution can be determined mathematically and correctly.
請求の13発明によれば、混合の度合をレベル比と位相差情報とによってもとめる際、ゲインの分配を簡易的に決定することができることとなる。 According to the thirteenth aspect of the invention, when the degree of mixing is obtained from the level ratio and the phase difference information, the gain distribution can be easily determined.
請求の14発明によれば、残響成分が有用な場合か不要な場合かを判別する信号が予め符号化され与えられるので、容易に適切なステレオ信号を生成できることとなる。 According to the fourteenth aspect of the invention, since a signal for determining whether the reverberation component is useful or unnecessary is encoded and given in advance, an appropriate stereo signal can be easily generated.
請求の15発明によれば、残響成分が有用な場合か不要な場合かを判別する信号が1ビットであるので、単純な切り替えによって適切なステレオ信号を生成できることとなる。 According to the fifteenth aspect of the invention, since the signal for determining whether the reverberation component is useful or unnecessary is 1 bit, an appropriate stereo signal can be generated by simple switching.
請求の16、17の発明によれば、生成される2chの信号が、モノラル化された信号からレベル比や、位相差の情報のみを手がかりに分離されたものであることによる分離性能の不十分さを補うことができることとなる。 According to the sixteenth and seventeenth aspects of the invention, the separation performance is insufficient because the generated 2ch signal is separated from the monaural signal based on only the level ratio and phase difference information. You can make up for it.
請求の18発明によれば、混合手段の係数を変更するだけであるので、ほとんど演算量を増加させることなく、分離性能を高めることができることとなる。 According to the eighteenth aspect of the invention, since only the coefficient of the mixing means is changed, the separation performance can be improved with almost no increase in the calculation amount.
請求の19発明によれば、分離性能の不十分さを、双方の信号の音像をそれぞれ逆方向に移動させることによって補うことができることとなる。 According to the nineteenth aspect of the invention, the insufficient separation performance can be compensated by moving the sound images of both signals in opposite directions.
請求の20発明によれば、非常に少ない演算量で、分離性能の不十分さを補うことができることとなる。 According to the twentieth aspect of the invention, insufficient separation performance can be compensated with a very small amount of calculation.
請求の21発明によれば、分離性能が不十分になる場合のみ分離性能の不十分さを補うことができることとなる。 According to the twenty-first aspect of the present invention, insufficient separation performance can be compensated only when separation performance is insufficient.
(実施の形態1)
以下本発明の実施の形態1における信号処理装置について図面を参照しながら説明する。
図1は本実施の形態1における信号処理装置の構成を示す図である。本信号処理装置は、2つのオーディオ信号をダウンミックスした信号を符号化した第1の符号化信号と、前記2つのオーディオ信号間のレベル比Lに応じて決まる値を符号化した第2の符号化信号と、前記2つのオーディオ信号間の位相差θに応じて決まる値を符号化した第3の符号化信号と、からなるビットストリームをデコードする信号処理装置である。
(Embodiment 1)
Hereinafter, a signal processing apparatus according to
FIG. 1 is a diagram showing the configuration of the signal processing apparatus according to the first embodiment. The signal processing apparatus includes a first encoded signal obtained by encoding a signal obtained by down-mixing two audio signals, and a second code obtained by encoding a value determined according to the level ratio L between the two audio signals. And a third encoded signal obtained by encoding a value determined according to a phase difference θ between the two audio signals.
図1において、100は、前記第1の符号化信号を復号化し第1の信号を生成する復号化手段、101は、前記第1の信号から前記第2の信号を生成する生成手段、102は、前記第2の符号化信号と前記第3の符号化信号とから混合係数を決定する混合係数決定手段、103は、前記混合係数決定手段102で決定された混合の度合に基づいて、前記第1の信号と前記第2の信号とを混合する混合手段、104は、前記第1の信号をN(N>0)単位時間遅延させる遅延手段、105は、前記遅延手段104の出力信号を加工する第1のフィルタ手段、106は、前記遅延手段104の出力信号を加工する第2のフィルタ手段、107は、前記第1の信号の音響的特徴量を検出する特徴量検出手段、108は、前記音響的特徴量に応じて、前記第1のフィルタ手段105の出力信号と前記第2のフィルタ手段106の出力信号とから前記第2の信号を合成する合成手段、である。
In FIG. 1,
以上のように構成された信号処理装置の動作について以下説明する。
まず、前記復号化手段100で、前記第1の符号化信号を復号化し、第1の信号を生成する。ここで前記第1の符号化信号は、2つのオーディオ信号をダウンミックスしたモノラル信号を符号化したものであり、例えば、MPEG方式AAC規格のエンコーダで符号化されたものである。ここでは、このようなAAC規格の符号化信号を復号化して得られたPCM信号を複数の周波数帯域からなる周波数信号に変換するところまで、当該復号化手段100で行うものとする。以下の説明では、そのような複数の周波数帯域の信号のうちある特定の1つの帯域の信号に対する処理を説明する。
The operation of the signal processing apparatus configured as described above will be described below.
First, the
生成手段101では、前記第1の信号から第2の信号を生成するが、それは以下のようにして行う。すなわち、前記遅延手段104にて、まず、前記第1の信号をN(N>0)単位時間遅延させる。次に前記第1のフィルタ手段105にて、前記遅延手段104の出力信号にフィルタ処理を施す。例えばこの処理として、次数がP次のAll Pass Filterを実施する。All Pass Filterの処理は従来から知られているどのような方法でも良いが、例えば、前述の非特許文献1の8.6.4.5.2節の中で述べられているAll Pass Filterでよい。一方、前記第2のフィルタ手段106では、前記遅延手段104の出力信号に対し、次数がP次より少ないAll Pass Filterの処理を実施する。
The generation unit 101 generates a second signal from the first signal, and this is performed as follows. That is, the delay means 104 first delays the first signal by N (N> 0) unit time. Next, the first filter means 105 performs a filtering process on the output signal of the delay means 104. For example, as this process, an All Pass Filter whose degree is P order is performed. The All Pass Filter process may be performed by any conventionally known method. For example, the All Pass Filter described in Section 8.6.4.5.2 of
このようにして生成された前記第1のフィルタ手段105からの出力信号と前記第2のフィルタ手段106からの出力信号とは、前記合成手段108によって処理され、前記第2の信号が生成される。この過程は以下のようなものである。すなわち、前記特徴量検出手段107において、前記第1の信号の音響的特徴量を検出し、その特徴量に応じて、前記第1のフィルタ手段105からの出力信号と前記第2のフィルタ手段106からの出力信号とを混ぜ合わせる比率が決定される。
The output signal from the
例えば、前記音響的特徴量は、前記第1の信号が急峻に変動している場合大となる特徴量であり、前記合成手段は、前記音響的特徴量が小である場合は、前記第1のフィルタ手段105の出力信号を出力する、あるいは、前記第1のフィルタ手段105の出力信号を多めに、前記第2のフィルタ手段106の出力信号を少なめに混ぜ合わせて出力する。反対に、前記音響的特徴量が大である場合は、前記第2のフィルタ手段106の出力信号を出力する、あるいは、前記第1のフィルタ手段105の出力信号を少なめに、前記第2のフィルタ手段106の出力信号を多めに混ぜ合わせて出力する。
For example, the acoustic feature amount is a feature amount that becomes large when the first signal fluctuates sharply, and the synthesizing unit determines that the first feature is small when the acoustic feature amount is small. The output signal of the filter means 105 is output, or the output signal of the first filter means 105 is increased and the output signal of the second filter means 106 is mixed slightly and output. On the other hand, when the acoustic feature quantity is large, the output signal of the second filter means 106 is output, or the output signal of the first filter means 105 is reduced, and the second filter means A large amount of output signals from the
ここで、前記音響的特徴量は、前記第1の信号が特定の周波数帯域に強いエネルギーが集中している場合大となる特徴量であってもよい。あるいは、そのような特徴量の組み合わせであってもよい。 Here, the acoustic feature amount may be a feature amount that becomes large when strong energy is concentrated in a specific frequency band of the first signal. Alternatively, a combination of such feature amounts may be used.
ここで重要なことは、前記音響的特徴量が、音の時間的変動のシャープさや、音像のしっかりとした定位感を表す特徴量であるということである。なぜならば、前記フィルタ手段105は、次数がP次のAll Pass Filterであり、音に残響感を与えるフィルタであるので、そのような残響感が不要である場合、すなわち音の時間的変動のシャープさや、音像のしっかりとした定位感が必要な場合は、All Pass Filterの次数を少なくすることで残響感を減らす必要があるからである。 What is important here is that the acoustic feature amount is a feature amount that represents the sharpness of temporal variation in sound and the sense of localization of a sound image. This is because the filter means 105 is a P-th order All Pass Filter and gives a reverberation to the sound. Therefore, when such a reverberation is not necessary, that is, sharpness of the temporal variation of the sound. This is because, when a firm sense of localization of the sound image is required, it is necessary to reduce the reverberation by reducing the order of the All Pass Filter.
このような観点から言えば、前記生成手段101は、図2に示したような構成であってもよい。図2において、遅延手段104と、第1のフィルタ手段105と、合成手段108とは、図1に示したものと同じである。図2において、200は、前記第1の信号をn(N>n≧0)単位時間遅延させる第2の遅延手段である。201は、入力信号の位相を90度或いは‐90度回転させる第3のフィルタ手段である。
From this point of view, the generation unit 101 may have a configuration as shown in FIG. In FIG. 2, the delay means 104, the first filter means 105, and the synthesis means 108 are the same as those shown in FIG. In FIG. 2,
前記遅延手段104や前記フィルタ手段105は、音の空間的広がり感や残響感を与える効果があるが、それらが不要な場合、すなわち、音の時間的変動のシャープさや、音像のしっかりとした定位感が必要である場合、遅延の量を少なくしたり、残響の量を少なくしたりすることが必要である。そのような場合は、遅延量が前記遅延手段104より小さい前記第2の遅延手段200を用い、更に、残響感が少ない前記第3のフィルタを用いる。前記第2の遅延手段200の遅延量は0でもよい。すなわち前記第2の遅延手段200はなくてもよい。前記第3のフィルタ手段201は入力信号の位相を90度或いは‐90度回転させるものであるが、これは非常にすくない演算量で、入力信号と無相関でしかも遅延を伴なわない信号が生成できるので、入力信号と無相関でしかもシャープな信号を生成する手段として利便性が高い。ここで、生成される信号が入力信号(前記第1の信号)と無相関であることは非常に重要である。なぜならば、もし相関の高い信号であれば、後段の混合手段による処理によって第1の信号と混合される際に、単にモノラル的な音(ステレオ感のない音)になってしまうからである。
The delay means 104 and the filter means 105 have an effect of giving a sense of spatial spread and reverberation of the sound, but when they are unnecessary, that is, the sharpness of the temporal variation of the sound and the localization of the sound image. When feeling is needed, it is necessary to reduce the amount of delay or the amount of reverberation. In such a case, the
このようにして得られた前記フィルタ手段105からの出力信号と、前記第3のフィルタ手段201とは、前記合成手段108において、音響的特徴量に応じて合成されるがその方法は前述と同じでよい。このようにすることで、残響感や音の広がり感が不要な場合は、シャープで定位がしっかりとした音を生成することができる。
さて、このようにして、前記生成手段101で生成された第2の信号と前記第1の信号とは、混合手段103で混合されるが、その動作を以下説明する。
The output signal from the filter means 105 obtained in this way and the third filter means 201 are synthesized by the synthesis means 108 according to the acoustic feature quantity, but the method is the same as described above. It's okay. By doing so, a sharp and well-positioned sound can be generated when a feeling of reverberation or a feeling of sound spread is unnecessary.
Now, in this way, the second signal generated by the generating unit 101 and the first signal are mixed by the mixing unit 103. The operation will be described below.
まず、前記混合係数決定手段102で、前記第2の符号化信号と前記第3の符号化信号とから混合係数を決定する。前記第2の符号化信号は、もともとの2つのオーディオ信号間のレベル比Lに応じて決まる値を符号化したものであり、前記第3の符号化信号はもともとの2つのオーディオ信号間の位相差θに応じて決まる値を符号化したものである。このようなレベル比情報と位相差情報とから混合係数h11, h12, h21, h22を求める方法は、例えば、前述の非特許文献1の8.6.4.6.2 節Mixingに詳しく述べられているような方法でも良いが、以下のような方法でもよい。
First, the mixing coefficient determining means 102 determines a mixing coefficient from the second encoded signal and the third encoded signal. The second encoded signal is obtained by encoding a value determined according to the level ratio L between the two original audio signals, and the third encoded signal is a level between the two original audio signals. A value determined according to the phase difference θ is encoded. A method for obtaining the mixing coefficients h11, h12, h21, h22 from such level ratio information and phase difference information is described in detail in, for example, Section 8.6.4.6.2 Mixing of
すなわち、隣り合う2辺の成す角度が前記θで、長さの比が前記Lであるところの平行四辺形の前記θが当該平行四辺形の対角線によって分割されて得られる角度をA、Bとし、前記レベル比Lに応じて決まる値をd1、d2とした時、h11=d1*cos(A)、h21=d1*sin(A)、h12=d2*cos(-B)、h22=d2*sin(-B)、とする。上記において、d1、d2の値を、d1=L/((1+2*L*cos(θ)+L*L)^0.5)、d2=1/((1+2*L*cos(θ)+L*L)^0.5)とする。このようにすることによって、ダウンミックスされモノラル化された信号を、もともとの2つの信号の位相差とレベル比とに応じて、数学的に正確にもとの2つの信号に分離できるのである。その理由を図3に示した。隣り合う2辺の成す角度が前記θで、長さの比が前記Lであるところの平行四辺形XYZWにおいて、その対角線によって分割されて得られる角度YXZをA、角度WXZをBとした。対角線の長さXZは、数学的に((1+2*L*cos(θ)+L*L)^0.5として求められる。従って、上記d1とd2とは、d1=L/((1+2*L*cos(θ)+L*L)^0.5)、d2=1/((1+2*L*cos(θ)+L*L)^0.5)として求められる。 That is, the angles obtained by dividing the parallelogram θ where the angle between two adjacent sides is θ and the length ratio is the L by the diagonal of the parallelogram are A and B. When the values determined according to the level ratio L are d1 and d2, h11 = d1 * cos (A), h21 = d1 * sin (A), h12 = d2 * cos (−B), h22 = d2 * Let sin (-B). In the above, the values of d1 and d2 are as follows: d1 = L / ((1 + 2 * L * cos (θ) + L * L) ^ 0.5), d2 = 1 / ((1 + 2 * L * cos (θ ) + L * L) ^ 0.5). In this way, the downmixed and monaural signal can be mathematically and accurately separated into two signals according to the phase difference and level ratio of the original two signals. The reason is shown in FIG. In the parallelogram XYZW where the angle formed by two adjacent sides is θ and the length ratio is L, the angle YXZ obtained by dividing the parallelogram XYZW is A, and the angle WXZ is B. The diagonal length XZ is mathematically obtained as ((1 + 2 * L * cos (θ) + L * L) ^ 0.5. Therefore, the above d1 and d2 are d1 = L / ((1+ 2 * L * cos (θ) + L * L) ^ 0.5), d2 = 1 / ((1 + 2 * L * cos (θ) + L * L) ^ 0.5).
上記において、d1、d2の値を、簡易的にd1=L/((1+L*L)^0.5)、d2=1/((1+L*L)^0.5)として求めてもよい。 In the above, the values of d1 and d2 may be simply obtained as d1 = L / ((1 + L * L) ^ 0.5) and d2 = 1 / ((1 + L * L) ^ 0.5).
さて、このようにして、生成された混合係数h11,h21,h12,h22を用いて、前記第1の信号と前記第2の信号とが、混合手段103で混合される。その方法は以下の通りである。すなわち、前記第1の信号を複素数で表現したときの実数部をr1、虚数部をi1、前記第2の信号を複素数で表現したときの実数部をr2、虚数部をi2、としたとき、h11*r1+h21*r2を1つ目の出力信号の実数部とし、h11*i1+h21*i2を1つ目の出力信号の虚数部とし、h12*r1+h22*r2を2つ目の出力信号の実数部とし、h12*i1+h22*i2を2つ目の出力信号の虚数部とする。
以上のように本実施の形態によれば、第1の信号と、前記第1の信号から生成した第2の信号とを、2通りの混合の度合(h11とh21の組み合わせで混合する場合と、h12とh22の組み合わせで混合する場合の2通り)で混合することで2つの信号を生成する信号処理装置において、前記第1の信号から前記第2の信号を生成する生成手段と、前記混合の度合を決定する混合係数決定手段と、前記混合係数決定手段で決定された混合の度合に基づいて、前記第1の信号と前記第2の信号とを混合する混合手段と、を有し、前記生成手段は、前記第1の信号をN(N>0)単位時間遅延させる遅延手段と、前記遅延手段の出力信号を加工するAll Pass Filterと、前記第1の信号を加工する加工手段と、を備え、前記加工手段を、前記遅延手段とAll Pass Filterとのよって生成される信号より音の広がり感や残響感の少ない信号を生成するようにし、前記第1の信号が急峻に変動しているような信号であったり、特定の周波数帯域に強いエネルギーが集中している信号であったりした場合、前記第2の信号に前記加工手段の出力信号を多めに混ぜ合わせることによって、モノラル化された信号から2chの信号を生成する際に、空間的な広がり間が与えられ、良好なステレオ信号が得られると同時に、音の時間的変動のシャープさや、音像のしっかりとした定位も実現できることとなる。
The first signal and the second signal are mixed by the mixing unit 103 using the generated mixing coefficients h11, h21, h12, and h22. The method is as follows. That is, when the real part when the first signal is expressed by a complex number is r1, the imaginary part is i1, the real part when the second signal is expressed by a complex number is r2, and the imaginary part is i2, h11 * r1 + h21 * r2 is the real part of the first output signal, h11 * i1 + h21 * i2 is the imaginary part of the first output signal, and h12 * r1 + h22 * r2 is the real part of the second output signal , H12 * i1 + h22 * i2 is the imaginary part of the second output signal.
As described above, according to the present embodiment, the first signal and the second signal generated from the first signal are mixed in two degrees of mixing (in the combination of h11 and h21). In the signal processing device that generates two signals by mixing in a combination of h12 and h22), the generating means for generating the second signal from the first signal, and the mixing Mixing coefficient determining means for determining the degree of the above, and mixing means for mixing the first signal and the second signal based on the degree of mixing determined by the mixing coefficient determining means, The generating means includes delay means for delaying the first signal by N (N> 0) unit time, an All Pass Filter for processing an output signal of the delay means, and processing means for processing the first signal. The processing means includes the delay means and an All Pass Filter. Therefore, a signal with less sound spread or reverberation than the generated signal is generated, and the first signal is a signal that fluctuates sharply, or strong energy is concentrated in a specific frequency band. When the 2ch signal is generated from the monaural signal by mixing a large amount of the output signal of the processing means to the second signal, Thus, a good stereo signal can be obtained, and at the same time, the sharpness of temporal fluctuation of sound and the localization of sound image can be realized.
なお、本実施の形態では、音響的特徴量は、特徴量検出手段107によって検出されるものとしたが、必ずしもその必要はなく、音響的特徴量を予め符号化したデータを受信するようにしてもよい。その場合の構成図は、図6のようになる。図1と図6との違いは、特徴量検出手段107の代わりに、特徴量受信手段109を備えていることだけである。特徴量受信手段109は、第4の符号化信号として、入力信号の音響的特徴量を符号化したデータを受信する。例えば、第4の符号化信号は、特定の周波数帯域に強いエネルギーが集中している場合真となり、そうでない場合に偽となる符号化信号である。前記生成手段101は、第4の符号化信号が真である場合は、残響成分の少ない信号(すなわち遅延量の少ないあるいは遅延のない信号に対しフィルタタップ長の短いフィルタで処理された信号か、位相を90度回転させた信号)を生成し、そうでない場合は、残響成分の多い信号(すなわち遅延量の多い信号に対しフィルタタップ長の長いフィルタで処理した信号)を生成する。そうすることによって、符号化装置側で意図したとおりの処理が実施できるので、高音質な信号を生成できることとなる。この場合、合成手段108は、単にセレクタだけの機能で済むことは言うまでもない。
In the present embodiment, the acoustic feature quantity is detected by the feature
(実施の形態2)
以下本発明の実施の形態2における信号処理装置について図面を参照しながら説明する。本実施の形態2が、前記実施の形態1と大きくことなる点は、前記実施の形態1が、逐次入力される信号に応じて、第2の信号の生成の方法を逐次適応していたのに対して、本実施の形態2では、低域の周波数帯域の信号は音の残響感や広がり感に大きく寄与し、高域の周波数帯域の信号は音のシャープさに大きく寄与することを考慮し、低域と高域とで生成手段を変更するところである。
(Embodiment 2)
A signal processing apparatus according to Embodiment 2 of the present invention will be described below with reference to the drawings. The second embodiment is greatly different from the first embodiment in that the first embodiment sequentially adapts the method of generating the second signal according to the sequentially input signals. On the other hand, in the second embodiment, it is considered that the signal in the low frequency band greatly contributes to the reverberation and spread feeling of the sound, and the signal in the high frequency band greatly contributes to the sharpness of the sound. However, the generation means is changed between the low range and the high range.
図4は本実施の形態2における信号処理装置の構成を示す図である。本信号処理装置は、2つのオーディオ信号をダウンミックスした信号を符号化した第1の符号化信号と、前記2つのオーディオ信号間のレベル比Lに応じて決まる値を符号化した第2の符号化信号と、前記2つのオーディオ信号間の位相差θに応じて決まる値を符号化した第3の符号化信号と、からなるビットストリームをデコードする信号処理装置である。 FIG. 4 is a diagram showing the configuration of the signal processing apparatus according to the second embodiment. The signal processing apparatus includes a first encoded signal obtained by encoding a signal obtained by down-mixing two audio signals, and a second code obtained by encoding a value determined according to the level ratio L between the two audio signals. And a third encoded signal obtained by encoding a value determined according to a phase difference θ between the two audio signals.
図4において、400は、前記第1の符号化信号を復号化し第1の信号を生成する復号化手段、401は、前記第1の信号から前記第2の信号を生成する生成手段、402は、前記第2の符号化信号と前記第3の符号化信号とから混合係数を決定する混合係数決定手段、403は、前記混合係数決定手段402で決定された混合の度合に基づいて、前記第1の信号と前記第2の信号とを混合する混合手段、である。
In FIG. 4,
ここで、前記第1の信号は、複数の周波数帯域からなる周波数信号であり、前記生成手段401は、図4に示したように、それぞれの周波数帯域の信号を独立に処理して第2の信号を生成する。例えば、低域の周波数帯域の信号に対しては、遅延手段とフィルタ手段とによって信号を処理するが、高域の周波数帯域の信号に対しては、フィルタ手段のみによって信号を処理するように構成してもよい。また、低域の周波数帯域の信号に対する遅延量は、それより高域のものと比較して、同じか、それよりも大きい値となるようにしてもよい。また、低域の周波数帯域の信号に対するフィルタ手段のフィルタ次数は、それより高域のものと比較して、同じか、それよりも大きい値になるようにしてもよい。また、所定の帯域より高い帯域のフィルタ手段は、入力信号を90度か‐90度回転させる処理であってもよい。 Here, the first signal is a frequency signal composed of a plurality of frequency bands, and the generating means 401 independently processes the signals of the respective frequency bands as shown in FIG. Generate a signal. For example, a low frequency band signal is processed by a delay unit and a filter unit, but a high frequency band signal is processed only by a filter unit. May be. Further, the delay amount for the signal in the low frequency band may be the same or larger than that in the higher frequency signal. Further, the filter order of the filter means for the signal in the low frequency band may be the same or larger than that in the higher frequency band. Further, the filter means having a band higher than the predetermined band may be a process of rotating the input signal by 90 degrees or -90 degrees.
以上のように構成された信号処理装置の動作について以下説明する。
まず、前記復号化手段400で、前記第1の符号化信号を復号化し、第1の信号を生成する。ここで前記第1の符号化信号は、2つのオーディオ信号をダウンミックスしたモノラル信号を符号化したものであり、例えば、MPEG方式AAC規格のエンコーダで符号化されたものである。ここでは、このようなAAC規格の符号化信号を復号化して得られたPCM信号を複数の周波数帯域からなる周波数信号に変換するところまで、当該復号化手段400で行うものとする。生成手段401では、前記第1の信号から第2の信号を生成するが、それは以下のようにして行う。すなわち、前記第1の信号を構成する複数の周波数帯域のうち、低域の周波数帯域については、予め設定された値N単位時間だけ信号を遅延させ、そのようにして遅延させた信号に対し、次数がP次のAll Pass Filterの処理を実施する。ここで、All Pass Filterの処理は従来から知られているどのような方法でも良いが、例えば、前述の非特許文献1の8.6.4.5.2節の中で述べられているAll Pass Filterでよい。
The operation of the signal processing apparatus configured as described above will be described below.
First, the
また、上で述べた周波数帯域より高い周波数帯域の信号に対しては、前記Nと同じかそれより小さい値n(N≧n≧0)の時間単位分だけ信号を遅延させ、そのようにして遅延させた信号に対し、次数が前記Pと同じかそれより小さい値p(P≧p≧0)次のAll Pass Filterの処理を実施する。あるいは、All Pass Filterの処理でなく、入力信号を90度か‐90度回転させる処理であってもよい。 Further, for a signal in a frequency band higher than the frequency band described above, the signal is delayed by a time unit of a value n (N ≧ n ≧ 0) that is equal to or smaller than N, and so The delayed signal is subjected to an All Pass Filter process of the order p (P ≧ p ≧ 0) whose order is equal to or smaller than P. Alternatively, instead of the All Pass Filter process, a process of rotating the input signal by 90 degrees or -90 degrees may be used.
要するに、低い周波数帯域の信号ほど多くの遅延と長いフィルタタップ数のフィルタとで、音の広がり感と残響感を多く与え、高い周波数帯域の信号ほど少ない遅延と短いフィルタタップ数のフィルタとで、音の広がり感と残響感を少なくする。このようにする理由は、一般に、低域の周波数帯域の信号は音の残響感や広がり感に大きく寄与し、高域の周波数帯域の信号は音のシャープさに大きく寄与することを考慮したためである。勿論、細かい周波数帯域ごとに精密に聴覚の知覚特性を分析しその結果に基づいた場合、必ずしも上記のように、低域から高域にいくに従って短調に値が減少するという方法に限定されるべきではない。ここで重要なことは、各周波数帯域毎に独立に値が制御されるということである。 In short, the lower frequency band signal gives more delay and longer filter taps, and the higher frequency band signal gives less delay and shorter filter taps. Reduce the sense of sound spread and reverberation. The reason for doing this is that, in general, the signal in the low frequency band greatly contributes to the reverberation and spread of the sound, and the signal in the high frequency band greatly contributes to the sharpness of the sound. is there. Of course, when the perceptual characteristics of hearing are analyzed precisely for each fine frequency band and based on the result, it should be limited to a method in which the value decreases in a minor manner as it goes from low to high as described above. is not. What is important here is that the value is controlled independently for each frequency band.
さて、このようにして生成された第2の信号と、前記第1の信号とは、前記混合係数決定手段402で決定された混合係数を用いて、前記混合手段403で混合されるが、その動作は、前述の実施の形態1で示したものと同じでよい。 Now, the second signal generated in this way and the first signal are mixed by the mixing unit 403 using the mixing coefficient determined by the mixing coefficient determining unit 402. The operation may be the same as that shown in the first embodiment.
以上のように本実施の形態によれば、第1の信号と、前記第1の信号から生成した第2の信号とを、2通りの混合の度合(h11とh21の組み合わせで混合する場合と、h12とh22の組み合わせで混合する場合の2通り)で混合することで2つの信号を生成する信号処理装置において、前記第1の信号から前記第2の信号を生成する生成手段と、前記混合の度合を決定する混合係数決定手段と、前記混合係数決定手段で決定された混合の度合に基づいて、前記第1の信号と前記第2の信号とを混合する混合手段と、を有し、前記生成手段は、前記第1の信号のうち、低い周波数帯域の信号については、比較的大きな値N(N>0)単位時間遅延させる遅延手段と、比較的大きな値Pの次数を持つAll Pass Filterとで信号を生成し、前記第1の信号のうち、高い周波数帯域の信号については、比較的小さな値n単位時間遅延させる遅延手段と(或いは全然遅延させない)、比較的小さな値pの次数を持つAll Pass Filterと(或いは入力信号を90度或いは‐90度回転させるだけ)で信号を生成するようにすることによって、モノラル化された信号から2chの信号を生成する際に、空間的な広がり間が与えられ、良好なステレオ信号が得られると同時に、音の時間的変動のシャープさや、音像のしっかりとした定位も実現できることとなる。 As described above, according to the present embodiment, the first signal and the second signal generated from the first signal are mixed in two degrees of mixing (in the combination of h11 and h21). In the signal processing device that generates two signals by mixing in a combination of h12 and h22), the generating means for generating the second signal from the first signal, and the mixing Mixing coefficient determining means for determining the degree of the above, and mixing means for mixing the first signal and the second signal based on the degree of mixing determined by the mixing coefficient determining means, The generating means includes a delay means for delaying a relatively large value N (N> 0) unit time for a signal in a low frequency band of the first signal, and an All Pass having an order of a relatively large value P. A signal is generated with the filter, and the first signal is high. For a signal in the frequency band, a delay means for delaying a relatively small value n unit time (or not delaying it at all), an All Pass Filter having an order of a relatively small value p (or an input signal of 90 degrees or -90 degrees) When a 2ch signal is generated from a monaural signal, a spatial spread is given and a good stereo signal can be obtained at the same time. The sharpness of temporal fluctuations and the sound localization can be realized.
なお、実施の形態2では、入力信号の性質にかかわらず、各周波数帯域信号の処理の方法(遅延量とフィルタ次数)は固定としたが、勿論このように限定する必要はなく、入力信号に応じて適宜切り替えてもよい。例えば、周波数帯域T以下の周波数帯域は遅延とAll Pass Filterの処理を行い、Tより上の周波数帯域は遅延は0で、フィルタの処理は、入力信号を90度或いは‐90度回転させるだけの処理にするようにしておき、上記Tの値を、入力信号に応じて適宜切り替えてもよい。 In the second embodiment, the processing method (delay amount and filter order) of each frequency band signal is fixed regardless of the nature of the input signal. However, of course, it is not necessary to limit to this method. You may switch suitably according to it. For example, the frequency band below the frequency band T performs delay and All Pass Filter processing, the frequency band above T has zero delay, and the filter processing only rotates the input signal by 90 degrees or -90 degrees. The value of T may be appropriately switched according to the input signal.
(実施の形態3)
以下本発明の実施の形態3における信号処理装置について図面を参照しながら説明する。
(Embodiment 3)
Hereinafter, a signal processing apparatus according to Embodiment 3 of the present invention will be described with reference to the drawings.
図7は本実施の形態3における信号処理装置の構成を示す図である。図7において、700は復号化手段、701は生成手段、702は混合係数決定手段、703は混合手段、であり、実施の形態2における、復号化手段400、生成手段401、混合係数決定手段402、混合手段403、と同じものである。実施の形態2と異なる点は、混合手段703の後段に、音像移動手段704を配置している点である。
FIG. 7 is a diagram showing the configuration of the signal processing apparatus according to the third embodiment. In FIG. 7,
以上のように構成された信号処理装置の動作について以下説明する。
図7において、復号化手段700、生成手段701、混合係数決定手段702、混合手段703、の各動作は、実施の形態2で述べた動作をおなじであるので省略する。
The operation of the signal processing apparatus configured as described above will be described below.
In FIG. 7, the operations of the
混合手段703から生成された2つの信号は、音像移動手段704によって処理される。この処理は、所謂、頭部伝達関数を応用した処理であり、実際に配置されているスピーカで囲まれている空間よりも広い空間で音がなっているように感じさせる処理である。 The two signals generated from the mixing unit 703 are processed by the sound image moving unit 704. This process is a process that applies a so-called head-related transfer function, and is a process that makes it feel as if sound is being produced in a wider space than the space surrounded by the speakers that are actually arranged.
まず、最初に、そのような処理を行う趣旨について、図8、図9を用いて説明する。
そもそも本願が扱う信号処理は、元々は複数チャネルの信号であったものを少ないチャネルにダウンミックスした信号を、元々の複数チャネル間の位相差情報やレベル比情報のみからものと複数チャネルの信号に分離するものである。しかしながら、元々の複数チャネル間の位相差情報やレベル比情報のみでは、完全にはもとの状態に戻らず、もともとがステレオ信号であったものに対して、完全にはもとのステレオ信号に戻らず、ややモノラル的な信号となる。すなわち、2つのスピーカで生成される音像が、狭い間隔に配置されたスピーカから生成された音像のようになってしまう。図8はそのことを示しており、実線で描かれたスピーカが実際に配置されているスピーカであるにもかかわらず、点線で描かれたような狭い空間に配置されたスピーカから生成された音のように聞こえてしまう。
First, the purpose of performing such processing will be described with reference to FIGS.
In the first place, the signal processing handled by the present application is to convert a signal that was originally a multi-channel signal downmixed into a few channels into a multi-channel signal from only the phase difference information and level ratio information between the original multiple channels. To separate. However, the original phase difference information and level ratio information alone do not completely return to the original state, but the original stereo signal is completely different from the original stereo signal. The signal does not return and becomes a mono signal. That is, a sound image generated by two speakers becomes like a sound image generated from speakers arranged at a narrow interval. FIG. 8 shows this, and the sound generated from the speaker arranged in a narrow space as drawn by the dotted line, even though the speaker drawn by the solid line is actually arranged. It sounds like
そこで、音像を広げて聞かせる技術を導入することによって、もとのステレオ信号のイメージに近づけることが本願の趣旨である。 Therefore, the purpose of the present application is to bring the sound image closer to the original stereo signal image by introducing a technique for expanding the sound image.
図9は、4チャンネルの場合を示している。前方左チャネルの信号と後方左チャネルの信号とがダウンミックスされ、前方右チャネルの信号を後方右チャネルの信号とがダウンミックスされている場合、左右の分離は損なわれていないが、前後の分離が損なわれるので、前方チャネルのスピーカをさらに前方に配置し、後方チャネルのスピーカをさらに後方に配置したかのような音像を生成することで、損なわれた分離感を回復したいというのが本願のねらいである。 FIG. 9 shows the case of 4 channels. When the front left channel signal and the rear left channel signal are downmixed, and the front right channel signal and the rear right channel signal are downmixed, the left and right separation is not impaired, but the front and rear separation Therefore, it is desired to recover the sense of separation that has been lost by generating a sound image as if the speaker of the front channel is arranged further forward and the speaker of the rear channel is arranged further rearward. Aim.
さて、実施の形態3の動作の説明に戻る。
図10は、頭部伝達関数の考え方を示した図である。実際に配置されているスピーカの位置と異なる位置にスピーカが存在するように音像を定位させたい場合(図10におけるS、S'に音像を定位させたい場合)、音像を定位させたい位置から受聴者の耳までの音響伝達関数を忠実に再現し、音源信号に畳み込んで受聴者に提示することにより、所望の位置に音像を定位させることが可能であることが知られている。図10に示された曲線矢印の経路における伝達関数(Hl(f、φ)など)が頭部伝達関数である。
Now, the description returns to the operation of the third embodiment.
FIG. 10 is a diagram showing the concept of the head-related transfer function. When it is desired to localize the sound image so that the speaker is present at a position different from the position of the speaker actually arranged (when the sound image is localized at S and S ′ in FIG. 10), the sound image is received from the position where the sound image is to be localized. It is known that a sound image can be localized at a desired position by faithfully reproducing an acoustic transfer function up to a listener's ear, convoluted with a sound source signal, and presenting it to a listener. The transfer function (Hl (f, φ), etc.) in the path of the curved arrow shown in FIG. 10 is the head-related transfer function.
このような頭部伝達関数の振幅周波数特性における構造的特徴を示す図が図11、両耳間時間差および両耳間レベル差示す図が図12である。音像の前後および上下の定位にかかわる手がかりは、図11に示す頭部伝達関数の振幅周波数特性に含まれるピークとディップにあることが既に知られている。また、左右方向の定位にかかわる手がかりは、図12に示す頭部伝達関数の左右の時間差(ITD)やレベル差(ILD)にあることが既に知られている。(特願2005−161602参照)。 FIG. 11 is a diagram showing structural features in the amplitude frequency characteristics of such a head-related transfer function, and FIG. 12 is a diagram showing interaural time differences and interaural level differences. It is already known that the clues related to the localization before and after the sound image and the top and bottom are in the peak and dip included in the amplitude frequency characteristic of the head-related transfer function shown in FIG. Further, it is already known that a clue related to the localization in the left-right direction is the time difference (ITD) and level difference (ILD) on the left and right of the head-related transfer function shown in FIG. (See Japanese Patent Application 2005-161602).
このような特徴量をもった頭部伝達関数の処理を行うことが音像移動手段704の動作である。その中で、一例として、前後方法の音像の定位に関する処理を以下に述べる。
前述のように、音像の前後方向の定位にかかわる手がかりは、図11に示す頭部伝達関数の振幅周波数特性に含まれるピークとディップにあることが知られている。一方、図7に示した混合手段703は複数の周波数帯域信号を音像移動手段704に対して送出する。そこで、音像移動手段704では、図13に示すように、頭部伝達関数の振幅周波数特性に合致するように、混合手段703から入力される複数の周波数帯域信号の振幅レベルを夫々調整する。
It is the operation of the sound image moving means 704 to perform processing of the head-related transfer function having such a characteristic amount. As an example, processing relating to localization of the sound image in the front-rear method will be described below.
As described above, it is known that the clues related to the localization in the front-rear direction of the sound image are the peak and dip included in the amplitude frequency characteristic of the head-related transfer function shown in FIG. On the other hand, the mixing unit 703 shown in FIG. 7 sends a plurality of frequency band signals to the sound image moving unit 704. Therefore, as shown in FIG. 13, the sound image moving unit 704 adjusts the amplitude levels of the plurality of frequency band signals input from the mixing unit 703 so as to match the amplitude frequency characteristics of the head-related transfer function.
図13に示す曲線は、図11に示す頭部伝達関数の振幅周波数特性と同じものであり、斜線柄で示した四角形が、その周波数帯域信号を、その高さの分だけゲインを増加させることを示しており、格子柄で示した四角形が、その帯域信号を、その高さの分だけゲインを減少させることを示している。 The curve shown in FIG. 13 is the same as the amplitude frequency characteristic of the head-related transfer function shown in FIG. 11, and the square indicated by the oblique line pattern increases the gain of the frequency band signal by the height. A square indicated by a lattice pattern indicates that the gain of the band signal is reduced by the height.
ここでは、頭部伝達関数の振幅周波数特性を完全に模擬するように振幅レベルを調整する必要はなく、聴感上重要とされるいくつかのピークとディップだけを模擬すればよい。或いは、聴感上特に重要とされるいくつかのディップだけを模擬すればよい。そうすることによって、少ない演算量で効率的に音像の移動の処理が実現できる。
図14は、各周波数帯域信号の帯域幅が、ディップの幅に対して広い場合の例を示している。このような場合、当該帯域信号の振幅を一括して減少させると、ディップの形状を適切に表現できないので、当該周波数帯域の信号に対して、所定の周波数特性をもったフィルタを掛けることで、図14に示すようなディップを形成できる。例えば、F(z)=1+A*z-1+z-2 のフィルタのAの値を−2から2の間で適切に設定し、当該周波数帯域信号に当該フィルタ処理を施すことによって、当該周波数帯域内の所定の位置にディップを形成することができる。図14の赤い点線でしめした曲線がそれにあたる。
Here, it is not necessary to adjust the amplitude level so as to completely simulate the amplitude-frequency characteristic of the head-related transfer function, and only a few peaks and dips that are important for hearing can be simulated. Alternatively, only a few dips that are particularly important for hearing need be simulated. By doing so, the process of moving the sound image can be realized efficiently with a small amount of calculation.
FIG. 14 shows an example in which the bandwidth of each frequency band signal is wider than the width of the dip. In such a case, if the amplitude of the band signal is collectively reduced, the shape of the dip cannot be appropriately expressed, so by applying a filter having a predetermined frequency characteristic to the signal in the frequency band, A dip as shown in FIG. 14 can be formed. For example, by appropriately setting the value A of the filter of F (z) = 1 + A * z−1 + z−2 between −2 and 2, and applying the filter processing to the frequency band signal, A dip can be formed at a predetermined position. The curve shown by the red dotted line in FIG.
図13、図14を用いた音像移動手段の動作の説明では、特定のチャネルに対する頭部伝達関数の振幅周波数特性を効率的に実現する方法を述べたが、実際には、各チャネルごとに頭部伝達関数の処理を行い、所定の伝達関数の出力同士を加算することによって実際に音像を移動させる処理を行うが、それについては、広く知られている方法を用いればよい。特願2005−161602参照)。 In the explanation of the operation of the sound image moving means using FIGS. 13 and 14, the method for efficiently realizing the amplitude frequency characteristic of the head-related transfer function for a specific channel has been described. The processing of the partial transfer function is performed, and the processing of actually moving the sound image is performed by adding the outputs of the predetermined transfer functions. For this, a widely known method may be used. (See Japanese Patent Application No. 2005-161602).
また、もちろん、図13、図14に示した頭部伝達関数の振幅周波数特性が、音像を前方に移動させるものであったならば、もう一方のチャネルに対する頭部伝達関数の振幅周波数特性は音像を後方に移動させるものであれば、音響空間の広がり感が増すことは言うまでもない。 Of course, if the amplitude frequency characteristic of the head-related transfer function shown in FIGS. 13 and 14 is to move the sound image forward, the amplitude frequency characteristic of the head-related transfer function for the other channel is the sound image. Needless to say, if the sound is moved rearwardly, the feeling of expansion of the acoustic space is increased.
以上のように本実施の形態によれば、第1の信号と、前記第1の信号から生成した第2の信号とを、2通りの混合の度合(h11とh21の組み合わせで混合する場合と、h12とh22の組み合わせで混合する場合の2通り)で混合することで2つの信号を生成する信号処理装置において、前記第1の信号から前記第2の信号を生成する生成手段と、前記混合の度合を決定する混合係数決定手段と、前記混合係数決定手段で決定された混合の度合に基づいて、前記第1の信号と前記第2の信号とを混合する混合手段と、前記混合手段から生成される2つの信号の再生音像を離れた位置に移動させるための信号処理を行う音像移動手段と、を有することによって、モノラル化された信号から2chの信号を生成する際に、空間的な広がり間が与えられ、良好なステレオ信号が得られると同時に、音の時間的変動のシャープさや、音像のしっかりとした定位も実現できることとなり、しかも、チャネルの分離感がさらに向上することとなる。 As described above, according to the present embodiment, the first signal and the second signal generated from the first signal are mixed in two degrees of mixing (in the combination of h11 and h21). In the signal processing device that generates two signals by mixing in a combination of h12 and h22), the generating means for generating the second signal from the first signal, and the mixing A mixing coefficient determining means for determining the degree of the mixing means, a mixing means for mixing the first signal and the second signal based on the degree of mixing determined by the mixing coefficient determining means, and the mixing means And a sound image moving means for performing signal processing for moving the reproduced sound images of the two signals generated to separate positions, thereby generating a spatial signal when generating a 2ch signal from the monaural signal. Good spread and good At the same time stereo signal is obtained, sharp sheath temporal variation of the sound, becomes the localization can be realized with a solid sound image, moreover, so that the separation sense channel is further improved.
なお、本実施の形態では、音像移動手段として、混合手段からの出力の周波数帯域信号に対して、その振幅の大きさを変更することを開示したが、その場合、図15のような構成をとってもよい。図15に示された各手段は、図7のものと同じであるが、混合係数決定手段1502で決定された混合の度合を変更する混合係数変更手段1504を設け、当該混合係数変更手段1504において、図13に示したように、所定の周波数帯域に対して、その混合係数を予め増減させておくことによって、混合手段1503が、図7に示す混合手段703と全く同様の動作しかしないにもかかわらず、生成される2つの信号は、その分離性能が高まっているのである。 In the present embodiment, it has been disclosed that the amplitude of the frequency band signal output from the mixing unit is changed as the sound image moving unit. In this case, the configuration shown in FIG. It may be taken. Each unit shown in FIG. 15 is the same as that shown in FIG. 7, but a mixing coefficient changing unit 1504 for changing the degree of mixing determined by the mixing coefficient determining unit 1502 is provided. As shown in FIG. 13, the mixing means 1503 has the same operation as the mixing means 703 shown in FIG. 7 by increasing or decreasing the mixing coefficient in advance for a predetermined frequency band. Regardless, the two generated signals have increased separation performance.
なお、本実施の形態3では、生成手段701は、前記の実施の形態2で述べたものと同じであるとしたが、本実施の形態3で述べている発明の趣旨からいえば、生成手段701の動作は、どのようなものであってもよい。例えば、図5を用いて説明した従来の技術による、遅延器とAllPassFilterによって構成されているようなものでもよいし、実施の形態1で示した生成手段101(図1:内部の詳細は図2)のようなものであってもよい。また、図2内の第3のフィルタ手段201のみで構成されているようなものであってもよい。本実施の形態3で示している発明の趣旨は、生成される複数チャネルの信号が、モノラル化された信号からレベル比や位相差の情報を手がかりに分離されたものであることによる分離性能の不十分さを、音像移動手段704によって補うところにあるからである。 In the third embodiment, the generation unit 701 is the same as that described in the second embodiment. However, from the gist of the invention described in the third embodiment, the generation unit 701 The operation 701 may be any operation. For example, it may be configured by a delay device and an AllPassFilter according to the conventional technique described with reference to FIG. 5, or the generation means 101 shown in the first embodiment (FIG. 1: details of the inside are shown in FIG. ). Further, it may be configured by only the third filter means 201 in FIG. The gist of the invention shown in the third embodiment is that the generated multi-channel signal is separated from a monaural signal by using information on the level ratio and phase difference as clues. This is because the sound image moving means 704 compensates for the insufficiency.
また、前記音像移動手段704は、その機能が必要なときのみ動作するように制御してもよい。必要なときとは、分離される2つの信号が近似している場合である。特に、レベル比の情報が0dBかそれに近い値を示している場合、分離性能が悪くなるので、この様な場合は前記音像移動手段704を用いるようにし、そうでない場合は、用いないように制御してもよい。 Further, the sound image moving means 704 may be controlled so as to operate only when its function is necessary. When it is necessary is when the two signals to be separated are approximate. In particular, when the level ratio information indicates 0 dB or a value close thereto, the separation performance deteriorates. Therefore, in such a case, the sound image moving means 704 is used, and if not, the control is performed so that it is not used. May be.
本発明にかかる信号処理装置は、複数チャンネル間の位相差やレベル比を非常にすくないビット数で表現した符号化信号を、音響的特性を維持して復号できるので、低ビットレートでの音楽放送サービスや音楽配信サービス、及びその受信機器に応用できる。 The signal processing apparatus according to the present invention can decode an encoded signal that expresses a phase difference or level ratio between a plurality of channels with a bit number that is not very low, while maintaining acoustic characteristics, so that music broadcasting at a low bit rate can be performed. It can be applied to services, music distribution services, and receiving devices.
100 復号化手段
101 生成手段
102 混合係数決定手段
103 混合手段
104 遅延手段
105 第1のフィルタ手段
106 第2のフィルタ手段
107 特徴量検出手段
108 合成手段
200 第2の遅延手段
201 第3のフィルタ手段
400 復号化手段
401 生成手段
402 混合係数決定手段
403 混合手段
109 特徴量受信手段
700 復号化手段
701 生成手段
702 混合係数決定手段
703 混合手段
704 音像移動手段
1500 復号化手段
1501 生成手段
1502 混合係数決定手段
1503 混合手段
1504 混合係数変更手段(音像移動手段)
DESCRIPTION OF
Claims (21)
前記第1の信号から前記第2の信号を生成する生成手段と、
前記混合の度合を決定する混合係数決定手段と、
前記混合係数決定手段で決定された混合の度合に基づいて、前記第1の信号と前記第2の信号とを混合する混合手段と、を有し、
前記生成手段は、
前記第1の信号をN(N>0)単位時間遅延させる遅延手段と、
前記遅延手段の出力信号を加工するフィルタ手段と、
前記第1の信号を加工する加工手段と、を備え、
前記生成手段は、前記フィルタ手段の出力信号と前記加工手段の出力信号とから前記第2の信号を生成することを特徴とする信号処理装置。 A signal processing device that generates two signals by mixing a first signal and a second signal generated from the first signal at two degrees of mixing,
Generating means for generating the second signal from the first signal;
Mixing coefficient determining means for determining the degree of mixing;
Mixing means for mixing the first signal and the second signal based on the degree of mixing determined by the mixing coefficient determining means;
The generating means includes
Delay means for delaying the first signal by N (N> 0) unit time;
Filter means for processing the output signal of the delay means;
Processing means for processing the first signal,
The signal processing apparatus, wherein the generation unit generates the second signal from an output signal of the filter unit and an output signal of the processing unit.
前記混合係数決定手段は、前記もともとの2つの信号間のレベル比Lと位相差θとに応じて決まる値から、混合の度合を決定することを特徴とする請求項1から請求項9のいずれか1項に記載の信号処理装置。 The first signal is a signal obtained by downmixing two signals,
10. The mixing coefficient determining unit determines a degree of mixing from a value determined according to a level ratio L and a phase difference θ between the two original signals. The signal processing device according to claim 1.
d1*cos(A)*r1+d1*sin(A)*r2 を1つ目の出力信号の実数部とし、
d1*cos(A)*i1+d1*sin(A)*i2 を1つ目の出力信号の虚数部とし、
d2*cos(-B)*r1+d2*sin(-B)*r2 を2つ目の出力信号の実数部とし、
d2*cos(-B)*i1+d2*sin(-B)*i2 を2つ目の出力信号の虚数部と
することを特徴とする請求項1から請求項10のいずれか1項に記載の信号処理装置。 The mixing coefficient determining means is an angle obtained by dividing the parallelogram with the angle formed by the two adjacent sides being the θ and the length ratio being the L by the diagonal of the parallelogram. , A and B, and values d1 and d2 determined according to the level ratio L, d1 * cos (A), d1 * sin (A), d2 * cos (-B), d2 * sin (-B ), And the mixing means uses r1 as the real part when the first signal is expressed as a complex number, i1 as the imaginary part when the first signal is expressed as a complex number, and r2 as the real part when the second signal is expressed as a complex number. When the part is i2,
Let d1 * cos (A) * r1 + d1 * sin (A) * r2 be the real part of the first output signal,
Let d1 * cos (A) * i1 + d1 * sin (A) * i2 be the imaginary part of the first output signal,
Let d2 * cos (-B) * r1 + d2 * sin (-B) * r2 be the real part of the second output signal,
11. The signal according to claim 1, wherein d2 * cos (-B) * i1 + d2 * sin (-B) * i2 is an imaginary part of the second output signal. Processing equipment.
d1 = L/((1+2*L*cos(θ)+ L*L)^0.5 )、d2=1/((1+2*L*cos(θ)+L*L)^0.5)として求めることを特徴とする請求項1から請求項11のいずれか1項に記載の信号処理装置。 The mixing coefficient determining means calculates the values of d1 and d2.
d1 = L / ((1 + 2 * L * cos (θ) + L * L) ^ 0.5), d2 = 1 / ((1 + 2 * L * cos (θ) + L * L) ^ 0.5) The signal processing device according to claim 1, wherein the signal processing device is obtained.
前記第1の信号から前記第2の信号を生成する生成手段と、
前記混合の度合を決定する混合係数決定手段と、
前記混合係数決定手段で決定された混合の度合に基づいて、前記第1の信号と前記第2の信号とを混合する混合手段と、
前記混合手段から生成される2つの信号の再生音像を離れた位置に移動させるための処理を行う音像移動手段と、
を有することを特徴とする信号処理装置。 A signal processing device that generates two signals by mixing a first signal and a second signal generated from the first signal at two degrees of mixing,
Generating means for generating the second signal from the first signal;
Mixing coefficient determining means for determining the degree of mixing;
Mixing means for mixing the first signal and the second signal based on the degree of mixing determined by the mixing coefficient determining means;
Sound image moving means for performing processing for moving the reproduced sound images of the two signals generated from the mixing means to positions separated from each other;
A signal processing apparatus comprising:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005253913A JP2007065497A (en) | 2005-09-01 | 2005-09-01 | Signal processing apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005253913A JP2007065497A (en) | 2005-09-01 | 2005-09-01 | Signal processing apparatus |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2007065497A true JP2007065497A (en) | 2007-03-15 |
Family
ID=37927748
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005253913A Pending JP2007065497A (en) | 2005-09-01 | 2005-09-01 | Signal processing apparatus |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2007065497A (en) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009302666A (en) * | 2008-06-10 | 2009-12-24 | Yamaha Corp | Acoustic processor, speaker device, and acoustic processing method |
JP2010504715A (en) * | 2007-04-17 | 2010-02-12 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | Generate uncorrelated signal |
US11942098B2 (en) | 2016-11-23 | 2024-03-26 | Telefonaktiebolaget Lm Ericsson (Publ) | Method and apparatus for adaptive control of decorrelation filters |
-
2005
- 2005-09-01 JP JP2005253913A patent/JP2007065497A/en active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010504715A (en) * | 2007-04-17 | 2010-02-12 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | Generate uncorrelated signal |
JP2009302666A (en) * | 2008-06-10 | 2009-12-24 | Yamaha Corp | Acoustic processor, speaker device, and acoustic processing method |
US11942098B2 (en) | 2016-11-23 | 2024-03-26 | Telefonaktiebolaget Lm Ericsson (Publ) | Method and apparatus for adaptive control of decorrelation filters |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10652685B2 (en) | Method and apparatus for control of randering multiobject or multichannel audio signal using spatial cue | |
EP3692523B1 (en) | Apparatus, method and computer program for encoding, decoding, scene processing and other procedures related to dirac based spatial audio coding | |
JP4921365B2 (en) | Signal processing device | |
KR101703333B1 (en) | Audio providing apparatus and method thereof | |
CA2673624C (en) | Apparatus and method for multi-channel parameter transformation | |
JP2022518744A (en) | Devices and methods for encoding spatial audio representations, or devices and methods for decoding audio signals encoded using transport metadata, and related computer programs. | |
CN112567765B (en) | Spatial audio capture, transmission and reproduction | |
US20240089692A1 (en) | Spatial Audio Representation and Rendering | |
JP2007065497A (en) | Signal processing apparatus | |
WO2020152394A1 (en) | Audio representation and associated rendering | |
GB2582748A (en) | Sound field related rendering | |
US20230199417A1 (en) | Spatial Audio Representation and Rendering | |
JP2006050241A (en) | Decoder | |
WO2021250311A1 (en) | Spatial audio parameter encoding and associated decoding |