JP2014155075A - Sound source separation method, device and program - Google Patents
Sound source separation method, device and program Download PDFInfo
- Publication number
- JP2014155075A JP2014155075A JP2013023869A JP2013023869A JP2014155075A JP 2014155075 A JP2014155075 A JP 2014155075A JP 2013023869 A JP2013023869 A JP 2013023869A JP 2013023869 A JP2013023869 A JP 2013023869A JP 2014155075 A JP2014155075 A JP 2014155075A
- Authority
- JP
- Japan
- Prior art keywords
- amplitude
- pair
- sound wave
- sound source
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000926 separation method Methods 0.000 title claims abstract description 45
- 238000000034 method Methods 0.000 claims abstract description 16
- 238000001914 filtration Methods 0.000 claims abstract description 14
- 238000012546 transfer Methods 0.000 claims description 17
- 230000015572 biosynthetic process Effects 0.000 claims description 11
- 238000003786 synthesis reaction Methods 0.000 claims description 11
- 230000005540 biological transmission Effects 0.000 claims 1
- 239000002131 composite material Substances 0.000 abstract description 11
- 238000004458 analytical method Methods 0.000 abstract description 8
- 230000006870 function Effects 0.000 description 24
- 238000010586 diagram Methods 0.000 description 12
- 238000012545 processing Methods 0.000 description 12
- 238000012937 correction Methods 0.000 description 8
- 230000014509 gene expression Effects 0.000 description 7
- 238000006243 chemical reaction Methods 0.000 description 5
- 230000000875 corresponding effect Effects 0.000 description 4
- 101150117787 outL gene Proteins 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 230000003321 amplification Effects 0.000 description 2
- 230000002238 attenuated effect Effects 0.000 description 2
- 230000002708 enhancing effect Effects 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 230000001629 suppression Effects 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Landscapes
- Circuit For Audible Band Transducer (AREA)
Abstract
Description
本発明は、音波信号に基づき、任意の方向にある音源に向けて指向性を形成する音源分離方法、装置及びプログラムに関する。 The present invention relates to a sound source separation method, apparatus, and program for forming directivity toward a sound source in an arbitrary direction based on a sound wave signal.
目的音源の音波を精度よく分離し、雑音等の目的外音を抑制するには、一般的に、指向性マイクを用いたり、一定以上の間隔でそれらマイクロフォンを複数並べる必要があった。しかしながら、ICレコーダーのような小型の集音機器では、指向性マイクの搭載や間隔を広くとった複数マイクを用いた集音技術の適用は困難である。また、複数の音源から人工的にダウンミックス処理しておいた収録済みの音声について、これら集音技術を適用することによる精度の良い音源分離は困難である。 In order to accurately separate the sound waves of the target sound source and suppress undesired sounds such as noise, it is generally necessary to use a directional microphone or to arrange a plurality of these microphones at regular intervals. However, in a small sound collecting device such as an IC recorder, it is difficult to apply a sound collecting technique using a directional microphone and a plurality of microphones with wide intervals. In addition, it is difficult to accurately separate sound sources by applying these sound collection techniques to recorded sound that has been artificially downmixed from a plurality of sound sources.
そこで、音波の収録後、各マイクロフォンから出力される信号間の振幅差や位相差を解析し、解析結果に応じた信号処理を施すことで、目的音源を分離抽出する技術が多数提案されている。近年では、統計的解析、周波数解析、複素解析等が持ち出され、入力信号の波形構造の違いを検出し、その検出結果を音源分離処理に生かしている。 Therefore, many techniques have been proposed for separating and extracting the target sound source by analyzing the amplitude difference and phase difference between the signals output from each microphone after sound wave recording and applying signal processing according to the analysis result. . In recent years, statistical analysis, frequency analysis, complex analysis, and the like have been brought out to detect differences in the waveform structure of input signals, and use the detection results for sound source separation processing.
例えば、入力信号を時間軸から周波数軸に変換し、周波数ごとに位相の差分を算出し、この差分を基に目的音源から入力された音波周波数帯を特定し、その周波数帯の音波を強調するように信号処理している(特許文献1参照)。 For example, the input signal is converted from the time axis to the frequency axis, the phase difference is calculated for each frequency, the sound wave frequency band input from the target sound source is identified based on this difference, and the sound wave in that frequency band is emphasized Signal processing is performed as described above (see Patent Document 1).
また、信号処理では、近接配置された2個のマイクロフォンの入力信号に基づいて入力された音波が目的方向にあるかを判断し、2個の入力信号の位相差の差分を補正し、目的方向に存在する音を強調している(特許文献2参照)。2つの入力信号同士を互いに参照させ、得られた信号を利用して逐次フィルタを更新している(特許文献3参照)。 Further, in the signal processing, it is determined whether or not the sound wave input is in the target direction based on the input signals of the two microphones arranged close to each other, the difference in phase difference between the two input signals is corrected, and the target direction is corrected. Is emphasized (see Patent Document 2). Two input signals are referred to each other, and the filter is sequentially updated using the obtained signals (see Patent Document 3).
集音機器または集音機器を搭載する機器の小型化は、マイクロフォンの配置間隔の一層の近接化を伴い、そのため、信号間の振幅差や位相差は極小となり、これら振幅差や位相差の明瞭な特定に多大な労力が必要となっている。特に、遠方の音源からの信号においては、振幅差は極小となるため、振幅差や位相差の明確な特定は困難となっている。 The downsizing of sound collecting devices or devices equipped with sound collecting devices is accompanied by a further closer arrangement of microphones, and therefore the amplitude difference and phase difference between signals are minimized, and these amplitude differences and phase differences are clearly defined. A great deal of effort is required to identify these. In particular, in a signal from a distant sound source, the amplitude difference is minimal, so it is difficult to clearly identify the amplitude difference and the phase difference.
近年では、特許文献1乃至3のように、波形構造の周波数解析、複素解析、又は統計的解析を複雑高度化することで、マイクロフォンの近接化に対応している。しかしながら、これら解析の複雑高度化は、周波数領域に変換する場合のフレーム長の長大化、遅延器の多数配置、長いフィルタ長、長いフィルタ係数等を招いてしまう結果となり、演算処理能力の都合上、リアルタイムに指向性を形成することが困難となってきた。演算処理の負荷軽減を図るためにはマイクロフォンの数を増加させればよいが、機器の限られたスペースにより、マイクロフォンの離間距離は更に短くなってしまう。 In recent years, as disclosed in Patent Documents 1 to 3, the frequency analysis, complex analysis, or statistical analysis of the waveform structure is complicated and advanced to cope with the proximity of microphones. However, these complicated sophistication results in an increase in the frame length when converting to the frequency domain, a large number of delay devices, a long filter length, a long filter coefficient, etc. It has become difficult to form directivity in real time. The number of microphones may be increased in order to reduce the processing load, but the distance between the microphones is further shortened due to the limited space of the device.
本発明は、上記のような従来技術の問題点を解決するために成されたものであり、その目的は、任意の方向から到来する音を、複雑高度な解析を必要とせず、少ない演算量で強調又は抑圧して出力することができる音源分離方法、装置及びプログラムを提供することにある。 The present invention has been made to solve the above-described problems of the prior art, and its purpose is to reduce the amount of computation of a sound coming from an arbitrary direction without requiring complex and sophisticated analysis. It is an object to provide a sound source separation method, apparatus, and program that can be emphasized or suppressed with a sound source.
上記の目的を達成するために、実施形態の音源分離方法は、一対の音波信号に対して、特定方向に指向性を形成する音源分離方法であって、任意の数のフィルタと、その後段に設けられた任意の数の加算器とを用い、前記フィルタと加算器とにより、得られた前記一対の音波信号の振幅比を方向毎に固有な値とする振幅比設定ステップと、前記一対の音波信号についてその振幅を一定の割合で変更させるフィルタ処理を施し、当該一定の割合とは、特定の振幅比を同一に変更する振幅変更ステップと、前記振幅変更ステップを経た一対の音波信号の波形間の差分に応じて利得を決定する利得決定ステップと、前記利得を音波信号に乗じて出力する出力ステップと、を備えること、を特徴とする。 In order to achieve the above object, the sound source separation method of the embodiment is a sound source separation method that forms directivity in a specific direction with respect to a pair of sound wave signals, and includes an arbitrary number of filters and subsequent stages. An arbitrary number of adders provided, an amplitude ratio setting step in which the amplitude ratio of the pair of sound wave signals obtained by the filter and the adder is a unique value for each direction; and the pair of pairs Filtering is performed to change the amplitude of the sound wave signal at a constant ratio, and the fixed ratio is an amplitude change step for changing the specific amplitude ratio to be the same and a waveform of a pair of sound wave signals that have undergone the amplitude change step And a gain determining step for determining a gain according to the difference between them, and an output step for multiplying the sound wave signal by the gain and outputting it.
振幅比設定ステップでは、前記一対の音波信号の振幅を、方向によって固有の変化率で変化させると共に、同一方向に由来する振幅を、異なる変化率で変化させても良い。 In the amplitude ratio setting step, the amplitude of the pair of sound wave signals may be changed at a specific change rate depending on the direction, and the amplitude derived from the same direction may be changed at a different change rate.
前記変化率の比を示すポーラパターンは、前記一対の音波信号毎に異なるものであっても良い。 The polar pattern indicating the ratio of the change rates may be different for each pair of sound wave signals.
前記振幅の変化率は、強調または減衰を行う特定方向において、その変化率が、他の方向の振幅率と比較して大きいものであっても良い。 The change rate of the amplitude may be larger in a specific direction in which emphasis or attenuation is performed than the amplitude rate in other directions.
前記利得決定ステップは、前記振幅変更ステップを経た合成信号を、交換回路によって前記一対の合成信号を1サンプル毎に交互に入れ替えることで、一対の交換信号を生成する交換ステップと、前記交換信号の片方に係数mを乗じた上で、前記交換信号の誤差信号を生成する生成ステップと、前記誤差信号を含む係数mの漸化式を演算して係数mを1サンプル毎に更新する更新ステップと、逐次更新された係数mを前記一対の合成信号に乗じて出力する出力ステップと、を備えることもできる。 The gain determination step includes: an exchange step for generating a pair of exchange signals by alternately exchanging the pair of synthesized signals for each sample by an exchange circuit using the synthesized signal that has undergone the amplitude changing step; A generation step of generating an error signal of the exchange signal after multiplying one of them by a coefficient m, an update step of calculating a recurrence formula of the coefficient m including the error signal and updating the coefficient m for each sample; An output step of multiplying the pair of combined signals by the sequentially updated coefficient m and outputting the resultant signal.
前記一対の音波信号は、一対のマイクロフォンから入力された一対の音波信号であっても良い。 The pair of sound wave signals may be a pair of sound wave signals input from a pair of microphones.
前記一対の音波信号は、音源からマイクロフォンまでの系を模擬した場合の伝達係数により表わされた系が畳み込まれたものであっても良い。 The pair of sound wave signals may be a convolution of a system represented by a transfer coefficient when a system from a sound source to a microphone is simulated.
また、上記の目的を達成するために、実施形態の音源分離装置は、一対の音波信号に対して、特定方向に指向性を形成する音源分離装置であって、任意の数のフィルタと、その後段に設けられた任意の数の加算器と、前記一対の音波信号についてその振幅を一定の割合で変更させるフィルタ処理を施し、当該一定の割合とは、特定の振幅比を同一に変更する振幅変更部と、前記一対の音波信号の振幅比のうち特定振幅比を同一振幅に変更する振幅変更部と、前記振幅変更ステップを経た一対の音波信号の波形間の差分に応じて利得を決定する利得決定部と、前記利得を音波信号に乗じて出力する出力部と、を備えること、を特徴とする。 In order to achieve the above object, the sound source separation device according to the embodiment is a sound source separation device that forms directivity in a specific direction with respect to a pair of sound wave signals, and includes an arbitrary number of filters, and thereafter An arbitrary number of adders provided in a stage and a filtering process for changing the amplitude of the pair of sound wave signals at a certain ratio, and the certain ratio is an amplitude for changing a specific amplitude ratio to be the same. The gain is determined according to the difference between the changing unit, the amplitude changing unit that changes the specific amplitude ratio among the amplitude ratios of the pair of sound wave signals to the same amplitude, and the waveform of the pair of sound wave signals that have undergone the amplitude changing step. A gain determination unit; and an output unit that multiplies the sound wave signal by the gain and outputs the signal.
さらに、上記の目的を達成するために、実施形態の音源分離プログラムは、一対の音波信号に対して、特定方向に指向性を形成する音源分離プログラムであって、任意の数のフィルタと、その後段に設けられた任意の数の加算器と、を備えるコンピュータを、前記フィルタと加算器とにより、得られた前記一対の音波信号の振幅比を方向毎に固有な値とする振幅比設定手段と、前記一対の音波信号についてその振幅を一定の割合で変更させるフィルタ処理を施し、当該一定の割合とは、特定の振幅比を同一に変更する振幅変更手段と、前記振幅変更ステップを経た一対の音波信号の波形間の差分に応じて利得を決定する利得決定手段と、前記利得を音波信号に乗じて出力する出力手段と、して機能させることを特徴とする。 Furthermore, in order to achieve the above-described object, the sound source separation program according to the embodiment is a sound source separation program that forms directivity in a specific direction with respect to a pair of sound wave signals. An amplitude ratio setting means for setting a computer having an arbitrary number of adders provided in a stage to a unique value for each direction by using the filter and the adder, And applying a filtering process for changing the amplitude of the pair of sound wave signals at a constant ratio, the fixed ratio being an amplitude changing means for changing a specific amplitude ratio to be the same, and a pair having undergone the amplitude changing step. And a gain determining means for determining a gain according to a difference between waveforms of the sound wave signal and an output means for multiplying the sound wave signal by the gain and outputting the gain.
本発明によれば、信号間の振幅や差分を特定する煩雑な解析を必要とせずに、演算数を大幅に削減しながらも、任意の方向に対する指向性を精度よく強調できる。 According to the present invention, the directivity in an arbitrary direction can be accurately emphasized while greatly reducing the number of operations without requiring a complicated analysis for specifying the amplitude and difference between signals.
以下、本発明に係る音源分離方法及び装置の実施形態について図面を参照しつつ詳細に説明する。 Hereinafter, embodiments of a sound source separation method and apparatus according to the present invention will be described in detail with reference to the drawings.
(第1の実施形態)
(構成)
(First embodiment)
(Constitution)
図1は、音源分離装置の構成を示すブロック図である。図1に示すように、音源分離装置は、離間配置される一対のマイクロフォンM1、M2に接続されている。音源分離装置には、マイクロフォンM1、M2から音波信号InM1(k)と音波信号InM2(k)が入力され、音波信号InM1(k)と音波信号InM2(k)を信号処理して方向毎に固有の振幅比を有する一対の合成信号に合成される。音源分離装置は、一対の合成信号の特定方向の振幅比を強調することで、特定方向の音波を他方向から到来する音波と比して相対的に強調する。方向とは、マイクロフォンM1、M2との中点を基準とし、その中点に向かう音波の到来方向、言い換えると音源が配置される方向である。特定方向とは、目的音源の方向である。 FIG. 1 is a block diagram illustrating a configuration of a sound source separation device. As shown in FIG. 1, the sound source separation device is connected to a pair of microphones M1 and M2 that are spaced apart. The sound source separation device receives the sound wave signal InM1 (k) and the sound wave signal InM2 (k) from the microphones M1 and M2, and performs signal processing on the sound wave signal InM1 (k) and the sound wave signal InM2 (k) to be specific to each direction. Are combined into a pair of combined signals having an amplitude ratio of The sound source separation device emphasizes the relative amplitude of the sound wave in the specific direction as compared with the sound wave coming from the other direction by enhancing the amplitude ratio of the pair of synthesized signals in the specific direction. The direction is the arrival direction of the sound wave toward the midpoint with respect to the midpoint of the microphones M1 and M2, in other words, the direction in which the sound source is arranged. The specific direction is the direction of the target sound source.
この音源分離装置には、マイクロフォンM1、M2の後段に、振幅比設定部1が設けられる。この振幅比設定部1は、音波信号InM1(k)と音波信号InM2(k)とから合成信号InA(k)と合成信号InB(k)とを生成する。合成信号InA(k)は、音波信号InM1(k)の振幅を変化させた信号であり、合成信号InB(k)は、音波信号InM2(k)の振幅を変化させた信号である。この振幅比設定部1は、合成信号InA(k)と合成信号InB(k)が方向によって固有の振幅比を持つように、音波信号InM1(k)と音波信号InM2(k)とをそれぞれ信号処理する。
すなわち、振幅比設定部1は、音波信号InM1(k)と音波信号InM2(k)の振幅を、方向によって固有の変化率で変化させる。さらに、振幅比設定部1は、同一方向に由来する音波信号InM1(k)と音波信号InM2(k)の振幅を、異なる変化率で変化させる。換言すると、振幅比設定部1は、音波信号InM1(k)の振幅変化率を規定するポーラパターンと、音波信号InM2(k)の振幅変化率を規定するポーラパターンを有する。両ポーラパターンは、同一方向において規定する振幅変化率が異なる。さらに、両ポーラパターンが規定する振幅変化率の比は、方向毎に固有となっている。
このポーラパターンは、音波信号InM1(k)と音波信号InM2(k)を、フィルタH1〜H4と加算器1a、1bを通すことにより実現する。
In the sound source separation device, an amplitude ratio setting unit 1 is provided at the subsequent stage of the microphones M1 and M2. The amplitude ratio setting unit 1 generates a combined signal InA (k) and a combined signal InB (k) from the sound wave signal InM1 (k) and the sound wave signal InM2 (k). The synthesized signal InA (k) is a signal obtained by changing the amplitude of the sound wave signal InM1 (k), and the synthesized signal InB (k) is a signal obtained by changing the amplitude of the sound wave signal InM2 (k). The amplitude ratio setting unit 1 outputs the sound wave signal InM1 (k) and the sound wave signal InM2 (k) so that the combined signal InA (k) and the combined signal InB (k) have specific amplitude ratios depending on directions. To process.
That is, the amplitude ratio setting unit 1 changes the amplitudes of the sound wave signal InM1 (k) and the sound wave signal InM2 (k) at a specific change rate depending on the direction. Furthermore, the amplitude ratio setting unit 1 changes the amplitudes of the sound wave signal InM1 (k) and the sound wave signal InM2 (k) derived from the same direction at different change rates. In other words, the amplitude ratio setting unit 1 has a polar pattern that defines the amplitude change rate of the sound wave signal InM1 (k) and a polar pattern that defines the amplitude change rate of the sound wave signal InM2 (k). Both polar patterns differ in amplitude change rate defined in the same direction. Furthermore, the ratio of the amplitude change rate defined by both polar patterns is unique for each direction.
This polar pattern is realized by passing the sound wave signal InM1 (k) and the sound wave signal InM2 (k) through the filters H1 to H4 and the adders 1a and 1b.
振幅比設定部1は、合成信号InA(k)と合成信号InB(k)とを合成するために、フィルタH1〜H4と加算器1a、1bとを備える。フィルタH1〜H4は、伝達関数H1〜H4により、音波信号InM1(k)と音波信号InM2(k)をフィルタ処理するフィルタである。フィルタH1〜H4は、例えばFIRフィルタやIIRフィルタ等である。 The amplitude ratio setting unit 1 includes filters H1 to H4 and adders 1a and 1b in order to synthesize the synthesized signal InA (k) and the synthesized signal InB (k). The filters H1 to H4 are filters that filter the sound wave signal InM1 (k) and the sound wave signal InM2 (k) with the transfer functions H1 to H4. The filters H1 to H4 are, for example, FIR filters and IIR filters.
フィルタH1〜H4の伝達関数は、例えば、以下式(1)〜(4)で表される。
H1=X ・・・・(1)
H2=-(X*C195_2 ) / C195_1・・・・(2)
H3=-(X*C105_1 ) / C105_2・・・・(3)
H4=X ・・・・(4)
式中Xは、任意の一定遅延と振幅特性をもつ信号で、変換の基準となる伝達関数である。
C195_1は、195[deg]方向の音源からM1までの伝達関数。
C195_2は、195[deg]方向の音源からM2までの伝達関数。
C105_1は、105[deg]方向の音源からM1までの伝達関数。
C105_2は、105[deg]方向の音源からM2までの伝達関数。
The transfer functions of the filters H1 to H4 are represented by the following expressions (1) to (4), for example.
H1 = X (1)
H2 =-(X * C195_2) / C195_1 (2)
H3 =-(X * C105_1) / C105_2 (3)
H4 = X (4)
In the equation, X is a signal having an arbitrary constant delay and amplitude characteristic, and is a transfer function serving as a reference for conversion.
C195_1 is a transfer function from the sound source in the 195 [deg] direction to M1.
C195_2 is the transfer function from the sound source in the 195 [deg] direction to M2.
C105_1 is a transfer function from the sound source in the 105 [deg] direction to M1.
C105_2 is the transfer function from the sound source in the 105 [deg] direction to M2.
式(1)に示すように、音波信号InM1(k)は、フィルタH1を経て、変換の基準となる関数Xによりフィルタ処理される。
また、式(3)に示すように、音波信号InM2(k)は、フィルタH3を経ることで、音波信号InM1(k)とは、同位相で振幅の正負が反転した関係となる。フィルタH3は、105degの音源からのマイクM1までの伝達関数と、105degの音源からのマイクM2までの伝達関数の逆数を、変換の基準となる関数Xに乗じた値に、さらにマイナスをかけるものである。すなわち、このフィルタH3は、105deg方向の音源から発信された音波が、マイクロフォンM1、M2に到達したときに生じる信号の相違をマイクロフォンM2を基準とした割合を表している。このフィルタH3は、この割合をいずれの方向由来の音波信号InM2(k)に対しても乗じる。
そうすると、このフィルタH3を通った音波信号InM2(k)は、この音波信号InM2(k)が105deg方向の音源由来である場合、音波信号InM1(k)とは、同位相で同振幅を持ちつつも、正負が反転することになる。その他の方向の音源由来である場合には、マイクロフォンM1、M2に達した時に生じる信号の相違とは、ズレた割合が乗じられるため、音波信号InM1(k)と音波信号InM2(k)の振幅が一致しなくなり、そのズレは、105degから離れるに従って大きくなっていく。
As shown in the equation (1), the sound wave signal InM1 (k) is filtered by the function X serving as a reference for conversion through the filter H1.
Further, as shown in Expression (3), the sound wave signal InM2 (k) passes through the filter H3, so that the sound wave signal InM1 (k) has a relationship in which the positive and negative amplitudes are inverted in the same phase. The filter H3 multiplies the value obtained by multiplying the transfer function from the 105 deg sound source to the microphone M1 and the reciprocal of the transfer function from the 105 deg sound source to the microphone M2 by the function X serving as a conversion reference. It is. That is, this filter H3 represents the ratio of the difference in the signal generated when the sound wave transmitted from the sound source in the 105 deg direction reaches the microphones M1 and M2, based on the microphone M2. This filter H3 multiplies this ratio to the sound wave signal InM2 (k) derived from any direction.
Then, the sound wave signal InM2 (k) passed through the filter H3 has the same phase and the same amplitude as the sound wave signal InM1 (k) when the sound wave signal InM2 (k) is derived from a sound source in the 105 deg direction. However, the sign is reversed. When the sound source is derived from another direction, the difference between the signals generated when the microphones M1 and M2 are reached is multiplied by the ratio of deviation, so that the amplitude of the sound wave signal InM1 (k) and the sound wave signal InM2 (k) Are not matched, and the deviation increases as the distance from 105 deg increases.
振幅比設定部1では、音波信号InM1(k)をフィルタH1でフィルタ処理した信号と、音波信号InM2(k)をフィルタH3でフィルタ処理した信号とを加算器1aで合成し、合成信号InA(k)として出力するように構成される。合成信号InA(k)は、以下の(5)で表される。
合成信号InA(k) = M1*H1 + M2*H3・・・・(5)
音波信号InM1と、音波信号InM2は、フィルタH1とフィルタH3とにより、同位相で振幅の正負が反転した関係となる。式(5)においては、フィルタH1を経た音波信号InM1(k)から、105degからのズレ量に応じた割合で振幅を変更させた音波信号InM2(k)を減じる。そのため、105degにおいては近づけば近づくほど、相殺の程度が大きく、105deg方向から離れると、相殺の程度は小さくなる。つまり、105degを最低振幅として、105degから離れると、振幅を大きくした信号を出力する。
In the amplitude ratio setting unit 1, the signal obtained by filtering the sound wave signal InM1 (k) with the filter H1 and the signal obtained by filtering the sound wave signal InM2 (k) with the filter H3 are combined by the adder 1a, and the combined signal InA ( k). The combined signal InA (k) is expressed by the following (5).
Composite signal InA (k) = M1 * H1 + M2 * H3 (5)
The sound wave signal InM1 and the sound wave signal InM2 have a relationship in which the positive and negative amplitudes are inverted in the same phase by the filter H1 and the filter H3. In Expression (5), the sound wave signal InM2 (k) whose amplitude is changed is subtracted from the sound wave signal InM1 (k) that has passed through the filter H1 at a rate corresponding to the amount of deviation from 105 degrees. For this reason, the closer to 105 deg, the greater the degree of cancellation, and the further away from the 105 deg direction, the smaller the degree of cancellation. In other words, a signal having a larger amplitude is output when the distance from 105 deg is 105 deg as the minimum amplitude.
同様に、式(4)に示すように、音波信号InM2(k)は、フィルタH4を経て、変換の基準となる関数Xによりフィルタ処理される。また、式(2)に示すように、音波信号InM1(k)は、フィルタH2を経ることで、音波信号InM2(k)とは、同位相で振幅の正負が反転した関係となる。フィルタH2は、195degの音源からのマイクM2までの伝達関数と、195degの音源からのマイクM1までの伝達関数の逆数を、変換の基準となる関数Xに乗じた値に、さらにマイナスをかけるものである。すなわち、このフィルタH2は、195deg方向の音源から発信された音波が、マイクロフォンM1、M2に到達したときに生じる信号の相違をマイクロフォンM1を基準とした割合を表している。このフィルタH2は、この割合をいずれの方向由来の音波信号InM1(k)に対しても乗じる。 Similarly, as shown in Expression (4), the sound wave signal InM2 (k) passes through the filter H4 and is filtered by the function X serving as a reference for conversion. Further, as shown in Expression (2), the sound wave signal InM1 (k) passes through the filter H2, so that the sound wave signal InM2 (k) has a relationship in which the positive and negative amplitudes are inverted in the same phase. The filter H2 further multiplies the value obtained by multiplying the transfer function from the 195 deg sound source to the microphone M2 and the reciprocal of the transfer function from the 195 deg sound source to the microphone M1 by the function X serving as a conversion reference. It is. That is, this filter H2 represents the ratio of the difference in the signal generated when the sound wave transmitted from the sound source in the 195 deg direction reaches the microphones M1 and M2, based on the microphone M1. The filter H2 multiplies this ratio to the sound wave signal InM1 (k) derived from any direction.
振幅比設定部1では、音波信号InM1(k)をフィルタH2でフィルタ処理した信号と、音波信号InM2(k)をフィルタH4でフィルタ処理した信号とを加算器1bで合成し、合成信号InB(k)として出力するように構成される。合成信号InB(k)は、以下の(6)で表される。
合成信号InB(k) = M1*H2 + M2*H4・・・・(6)
音波信号InM1(k)と、音波信号InM2(k)は、フィルタH2とフィルタH4とにより、同位相で振幅の正負が反転した関係となる。式(6)においては、フィルタH4を経た音波信号InM2(k)から、195degからのズレ量に応じた割合で振幅を変更させた音波信号InM1(k)を減じる。そのため、195degにおいては近づけば近づくほど、相殺の程度が大きく、195deg方向から離れると、相殺の程度は小さくなる。つまり、195degを最低振幅として、195degから離れると、振幅を大きくした信号を出力する。
In the amplitude ratio setting unit 1, the signal obtained by filtering the sound wave signal InM1 (k) with the filter H2 and the signal obtained by filtering the sound wave signal InM2 (k) with the filter H4 are synthesized by the adder 1b, and the synthesized signal InB ( k). The combined signal InB (k) is expressed by the following (6).
Composite signal InB (k) = M1 * H2 + M2 * H4 (6)
The sound wave signal InM1 (k) and the sound wave signal InM2 (k) have a relationship in which the positive and negative amplitudes are inverted in the same phase by the filter H2 and the filter H4. In Expression (6), the sound wave signal InM1 (k) whose amplitude is changed is subtracted from the sound wave signal InM2 (k) that has passed through the filter H4 at a rate corresponding to the amount of deviation from 195 deg. For this reason, the closer to 195 deg, the greater the degree of cancellation, and the further away from the 195 deg direction, the smaller the degree of cancellation. In other words, a signal with an increased amplitude is output when the amplitude is 195 deg and the distance is away from 195 deg.
振幅比設定部1は、フィルタH1〜H4、及び加算器1a、1bにより、方向毎に固有な振幅比を有する合成信号InA(k)及び合成信号InB(k)を生成する。 The amplitude ratio setting unit 1 uses the filters H1 to H4 and the adders 1a and 1b to generate a combined signal InA (k) and a combined signal InB (k) having a specific amplitude ratio for each direction.
音源分離装置は、振幅比設定部1の後段に、合成信号InA(k)と合成信号InB(k)における特定方向の振幅比の信号を同一振幅に変更する振幅変更部2を備える。振幅変更部2では、合成信号InA(k)と合成信号InB(k)における特定方向の振幅比を同一振幅に揃える一方、特定方向以外の振幅比については、特定方向から逸れるほど振幅差を付けていく。振幅変更部2は、フィルタD1、フィルタT1を備える。 The sound source separation device includes an amplitude changing unit 2 that changes the signal of the amplitude ratio in a specific direction in the combined signal InA (k) and the combined signal InB (k) to the same amplitude, following the amplitude ratio setting unit 1. In the amplitude changing unit 2, the amplitude ratios in the specific direction in the combined signal InA (k) and the combined signal InB (k) are set to the same amplitude, while the amplitude ratio other than the specific direction is given an amplitude difference that deviates from the specific direction. To go. The amplitude changing unit 2 includes a filter D1 and a filter T1.
振幅変更部2では、合成信号InA(k)と合成信号InB(k)とをフィルタ処理することにより、合成信号InA(k)と合成信号InB(k)との特定方向の振幅比を同一にする。振幅変更部2は、合成信号InA(k)にフィルタ処理を施すフィルタD1と、合成信号InB(k)にフィルタ処理を施すフィルタT1とを備える。 The amplitude changing unit 2 filters the combined signal InA (k) and the combined signal InB (k), thereby making the amplitude ratio in a specific direction of the combined signal InA (k) and the combined signal InB (k) the same. To do. The amplitude changing unit 2 includes a filter D1 that performs filter processing on the combined signal InA (k), and a filter T1 that performs filter processing on the combined signal InB (k).
フィルタD1、T1の伝達関数D1、T1の一例としては、以下式(7)(8)で表される。
D1= 1 ・・・・(7)
T1= (c11*h2 +
c12*h4)/(c11*h1 + c12*h3)・・・・(8)
c11は、音源S1からマイクロフォンM1までの伝達関数。
c12は、音源S1からマイクロフォンM2までの伝達関数。
An example of the transfer functions D1 and T1 of the filters D1 and T1 is expressed by the following equations (7) and (8).
D1 = 1 (7)
T1 = (c11 * h2 +
c12 * h4) / (c11 * h1 + c12 * h3) (8)
c11 is a transfer function from the sound source S1 to the microphone M1.
c12 is a transfer function from the sound source S1 to the microphone M2.
この式(7)(8)を満たす伝達関数D1、T1により、合成信号InA(k)と合成信号InB(k)とにおける特定方向の振幅比を同一に変更する。 With the transfer functions D1 and T1 satisfying the expressions (7) and (8), the amplitude ratio in a specific direction in the combined signal InA (k) and the combined signal InB (k) is changed to be the same.
振幅変更部2を経た合成信号InA(k)及び合成信号InB(k)は、係数決定回路3と、合成回路4への経路とに分配される。本実施形態では、係数決定回路3で決定した係数m(k)に応じた利得gを合成回路4内で決定する。合成回路4では、その利得により、出力信号OutR(k)、出力信号OutL(k)を出力する。 The combined signal InA (k) and combined signal InB (k) that have passed through the amplitude changing unit 2 are distributed to the coefficient determination circuit 3 and the path to the combining circuit 4. In the present embodiment, the gain g corresponding to the coefficient m (k) determined by the coefficient determination circuit 3 is determined in the synthesis circuit 4. The synthesis circuit 4 outputs an output signal OutR (k) and an output signal OutL (k) based on the gain.
係数決定回路3は、図2に示すように、特性補正回路3a、交換回路3b、及びに係数更新回路3cが直列に接続された回路である。 As shown in FIG. 2, the coefficient determination circuit 3 is a circuit in which a characteristic correction circuit 3a, an exchange circuit 3b, and a coefficient update circuit 3c are connected in series.
特性補正回路3aは、周波数特性補正フィルタと位相特性補正回路とを有する。周波数特性補正フィルタは、所望周波数帯の音波信号を抽出する。位相特性補正回路は、音波信号InM1(k)と音波信号InM2(k)に対するマイクロフォンM1、M2の音響特性が与える影響を減少させる。 The characteristic correction circuit 3a includes a frequency characteristic correction filter and a phase characteristic correction circuit. The frequency characteristic correction filter extracts a sound wave signal in a desired frequency band. The phase characteristic correction circuit reduces the influence of the acoustic characteristics of the microphones M1 and M2 on the sound wave signal InM1 (k) and the sound wave signal InM2 (k).
交換回路3bは、合成信号InA(k)と合成信号InB(k)を1サンプルおきに交互に入れ替えて出力する。すなわち、交換信号InC(k)及び交換信号InD(k)のデータ列は、k=1、2、3、4・・・において、以下のようになる。
InC(k)={InA(1) InB(2) InA(3) InB(4)・・・}
InD(k)={InB(1) InA(2) InB(3) InA(4)・・・}
The exchange circuit 3b alternately outputs the synthesized signal InA (k) and the synthesized signal InB (k) every other sample. That is, the data strings of the exchange signal InC (k) and the exchange signal InD (k) are as follows when k = 1, 2, 3, 4,.
InC (k) = {InA (1) InB (2) InA (3) InB (4) ...}
InD (k) = {InB (1) InA (2) InB (3) InA (4) ...}
交換信号InC(k)及び交換信号InD(k)は、係数更新回路3cに入力される。この係数更新回路3cは、交換信号InC(k)と交換信号InD(k)との誤差を計算し、誤差に応じた係数m(k)を決定する。また、係数更新回路3cは、過去の係数m(k−1)を参照して逐次的に係数m(k)を更新する。 The exchange signal InC (k) and the exchange signal InD (k) are input to the coefficient update circuit 3c. The coefficient update circuit 3c calculates an error between the exchange signal InC (k) and the exchange signal InD (k) and determines a coefficient m (k) corresponding to the error. The coefficient updating circuit 3c sequentially updates the coefficient m (k) with reference to the past coefficient m (k-1).
同着の交換信号InA(k)と交換信号InB(k)の誤差信号e(k)を以下式(9)のように定義する。
An error signal e (k) between the exchange signal InA (k) and the exchange signal InB (k) is defined as the following equation (9).
係数更新回路3cは、誤差信号e(k)を係数m(k−1)の関数とし、誤差信号e(k)を含む係数m(k)の隣接二項間漸化式を演算することで、誤差信号e(k)が最小となる係数m(k)を探索する。係数更新回路3cは、この演算処理により、合成信号InA(k)と合成信号InB(k)とに特定方向の振幅差が生じていればいるほど、係数m(k)を減少させる方向で更新し、振幅差がなければ係数m(k)を1に近づけて出力する。 The coefficient update circuit 3c uses the error signal e (k) as a function of the coefficient m (k-1) and calculates a recurrence formula between adjacent binomials of the coefficient m (k) including the error signal e (k). The coefficient m (k) that minimizes the error signal e (k) is searched. The coefficient update circuit 3c is updated in a direction to decrease the coefficient m (k) as the amplitude difference in a specific direction is generated between the combined signal InA (k) and the combined signal InB (k) by this arithmetic processing. If there is no amplitude difference, the coefficient m (k) is output close to 1.
係数m(k)は、合成信号InA(k)及び合成信号InB(k)と共に、合成回路4に入力される。合成回路4は、合成信号InA(k)と合成信号InB(k)に対して、任意の比率で係数m(k)を乗じ、任意の比率で足し合わせて、その結果として出力信号OutL(k)と出力信号OutR(k)を出力する。 The coefficient m (k) is input to the synthesis circuit 4 together with the synthesis signal InA (k) and the synthesis signal InB (k). The synthesis circuit 4 multiplies the composite signal InA (k) and the composite signal InB (k) by a coefficient m (k) at an arbitrary ratio, adds them at an arbitrary ratio, and as a result, outputs the output signal OutL (k ) And an output signal OutR (k).
係数更新回路3cの一例を更に説明する。図3は、係数更新回路3の一例を示すブロック図である。図3に示すように、係数更新回路3cは、複数の積算器と加算器から構成され、隣接二項間漸化式を体現した回路であり、過去の係数m(k−1)を参照して係数m(k)を漸次更新するものである。長いタップ数を有する適応フィルタは排除されている。 An example of the coefficient update circuit 3c will be further described. FIG. 3 is a block diagram illustrating an example of the coefficient update circuit 3. As shown in FIG. 3, the coefficient update circuit 3c is composed of a plurality of accumulators and adders, and is a circuit that embodies a recurrence formula between adjacent binomials, and refers to a past coefficient m (k−1). The coefficient m (k) is gradually updated. Adaptive filters with long tap numbers are eliminated.
この係数更新回路3cにおいて、交換信号InD(k)を参照信号として用いて誤差信号e(k)を生成する。すなわち、交換信号InC(k)は、積算器5に入力される。積算器5は、交換信号InC(k)に対して1サンプル前の係数m(k−1)の−1倍を掛け合わせる。積算器5の出力側には、加算器6が接続されている。この加算器6には、積算器5から出力された信号と交換信号InD(k)とが入力され、これら信号を加算することで、瞬時誤差信号e(k)を得る。この演算処理による誤差信号e(k)は以下式(10)の通りである。
In the coefficient update circuit 3c, an error signal e (k) is generated using the exchange signal InD (k) as a reference signal. That is, the exchange signal InC (k) is input to the integrator 5. The accumulator 5 multiplies the exchange signal InC (k) by −1 times the coefficient m (k−1) one sample before. An adder 6 is connected to the output side of the integrator 5. The adder 6 receives the signal output from the integrator 5 and the exchange signal InD (k), and adds these signals to obtain an instantaneous error signal e (k). The error signal e (k) resulting from this arithmetic processing is as shown in the following equation (10).
誤差信号e(k)は、音波信号をμ倍する積算器7に入力される。係数μは、1未満のステップサイズパラメータである。積算器7の出力側には、積算器8が接続される。積算器8には、交換信号InC(k)と積算器を経た信号μe(k)とが入力される。この積算器8は、交換信号InC(k)と信号μe(k)とを乗じ、以下式(11)で表される瞬時二乗誤差の微分信号∂E(m)2/∂mを得る。
The error signal e (k) is input to the integrator 7 that multiplies the sound wave signal by μ. The coefficient μ is a step size parameter of less than 1. An integrator 8 is connected to the output side of the integrator 7. The accumulator 8 receives the exchange signal InC (k) and the signal μe (k) that has passed through the accumulator. The accumulator 8 multiplies the exchange signal InC (k) and the signal μe (k) to obtain a differential signal ∂E (m) 2 / ∂m of an instantaneous square error expressed by the following equation (11).
積算器8には加算器9が接続されている。加算器9は、以下式(12)を演算することで係数m(k)を完成させ、合成信号InA(k)と合成信号InB(k)とから出力信号OutL(k)とOutR(k)を生成する合成回路4に係数m(k)をセットする。
すなわち、加算器9は微分信号∂E(m)2/∂mに対して信号β・m(k−1)を加算することで係数m(k)を完成させる。
An adder 9 is connected to the integrator 8. The adder 9 completes the coefficient m (k) by calculating the following equation (12), and outputs the output signals OutL (k) and OutR (k) from the combined signal InA (k) and the combined signal InB (k). The coefficient m (k) is set in the synthesis circuit 4 that generates
That is, the adder 9 completes the coefficient m (k) by adding the signal β · m (k−1) to the differential signal ∂E (m) 2 / ∂m.
信号β・m(k−1)は、加算器9の出力側に1サンプル分だけ信号を遅延させる遅延器10と定数βを積算する積算器11とが接続されており、1サンプル前の信号処理により更新された係数m(k−1)に対して積算器11で定数βを乗じることにより生成される。 The signal β · m (k−1) is connected to the output side of the adder 9 by a delay unit 10 that delays the signal by one sample and an accumulator 11 that accumulates a constant β. The coefficient m (k−1) updated by the process is generated by multiplying the constant 11 by the integrator 11.
これにより、係数更新回路3では、以下の漸化式(13)の演算処理が実現し、係数m(k)を生成され、サンプリング毎に漸次更新していく。
As a result, the coefficient update circuit 3 realizes the calculation process of the following recurrence formula (13), generates the coefficient m (k), and updates it gradually for each sampling.
(作用)
(振幅比設定部の作用)
図4に、音源とマイクロフォンM1、M2との位置関係を示す。この位置関係を示すモデルは、x軸上に原点を中心にして4cm離したマイクロフォンM1、M2を設置している。原点から1.0mの距離に音源S1を配置している。音源S1は、y軸正方向を0deg、x軸正方向を90degとして角度で特定し、本実施形態では、50degの方向に配置するものとする。
(Function)
(Operation of amplitude ratio setting unit)
FIG. 4 shows the positional relationship between the sound source and the microphones M1 and M2. In the model indicating the positional relationship, microphones M1 and M2 separated by 4 cm from the origin are set on the x-axis. The sound source S1 is arranged at a distance of 1.0 m from the origin. The sound source S1 is specified by an angle with the y-axis positive direction being 0 deg and the x-axis positive direction being 90 deg. In this embodiment, the sound source S1 is arranged in the direction of 50 deg.
音源S1からの音波信号は、マイクロフォンM1、M2に入力する。このマイクロフォンM1、M2は、無指向性のマイクロフォンである。つまり、図5に示すように、マイクロフォンM1、M2は、円形のポーラパターンを有し、特定方向に対して指向性を有しない。そのため、360゜のいずれに存在する音源から、同一の音圧の音波信号を入力した際には、音波信号InM1(k)、InM2(k)の振幅には差が存在しない。 The sound wave signal from the sound source S1 is input to the microphones M1 and M2. The microphones M1 and M2 are omnidirectional microphones. That is, as shown in FIG. 5, the microphones M1 and M2 have a circular polar pattern and do not have directivity with respect to a specific direction. For this reason, when a sound wave signal having the same sound pressure is input from a sound source existing at 360 °, there is no difference in the amplitudes of the sound wave signals InM1 (k) and InM2 (k).
図6は、音波信号InM1(k)、InM2(k)の振幅比を示した図である。音波信号InM1(k)、InM2(k)の振幅にほとんど差がないため、音波信号InM1(k)、InM2(k)の振幅比は、270deg〜90degの範囲において、音波信号InM1(k)と音波信号InM2(k)の振幅の差は、かなり小さくなる。すなわち、音波信号InM1(k)と音波信号InM2(k)の振幅比は、1:1に近づく。 FIG. 6 is a diagram showing the amplitude ratio of the sound wave signals InM1 (k) and InM2 (k). Since there is almost no difference between the amplitudes of the sound wave signals InM1 (k) and InM2 (k), the amplitude ratio of the sound wave signals InM1 (k) and InM2 (k) is in the range of 270 deg to 90 deg with the sound wave signal InM1 (k). The difference in amplitude of the sound wave signal InM2 (k) is considerably small. That is, the amplitude ratio between the sound wave signal InM1 (k) and the sound wave signal InM2 (k) approaches 1: 1.
振幅比設定部1に入力した音波信号InM1(k)、InM2(k)は、フィルタH1〜H4及び加算器により、フィルタリング処理される。図7は、フィルタリング処理され、加算器1aから出力した合成信号InA(k)、加算器1bから出力した合成信号InB(k)とを示した図である。図7に示すように、フィルタリング処理された合成信号InA(k)、合成信号InB(k)は、それぞれ異なるポーラパターンを有する。そのため、合成信号InA(k)、合成信号InB(k)の振幅は、270deg〜90degにおいて異なる。 The sound wave signals InM1 (k) and InM2 (k) input to the amplitude ratio setting unit 1 are filtered by the filters H1 to H4 and the adder. FIG. 7 is a diagram showing the combined signal InA (k) output from the adder 1a after being filtered and the combined signal InB (k) output from the adder 1b. As shown in FIG. 7, the filtered combined signal InA (k) and combined signal InB (k) have different polar patterns. For this reason, the amplitudes of the combined signal InA (k) and the combined signal InB (k) differ between 270 deg and 90 deg.
図8は、合成信号InA(k)と合成信号InB(k)との振幅比を示した図である。図8に示すように、合成信号InA(k)と合成信号InB(k)との振幅比は、270deg〜15degの範囲で1.1〜8.1となる。この範囲において、振幅比は重複することはなく、振幅比は角度毎に固有の値となっている。
同様に、合成信号InA(k)と合成信号InB(k)との振幅比は、15deg〜90degの範囲で0.1〜8.1となる。この範囲において、振幅比は重複することはなく、振幅比は角度毎に固有の値となっている。
FIG. 8 is a diagram illustrating the amplitude ratio between the combined signal InA (k) and the combined signal InB (k). As shown in FIG. 8, the amplitude ratio between the combined signal InA (k) and the combined signal InB (k) is 1.1 to 8.1 in the range of 270 deg to 15 deg. In this range, the amplitude ratio does not overlap, and the amplitude ratio is a unique value for each angle.
Similarly, the amplitude ratio between the combined signal InA (k) and the combined signal InB (k) is 0.1 to 8.1 in the range of 15 deg to 90 deg. In this range, the amplitude ratio does not overlap, and the amplitude ratio is a unique value for each angle.
(振幅変更部の作用)
振幅変更部2では、合成信号InA(k)及び合成信号InBをフィルタT1,D1でフィルタ処理することにより振幅比を一定の割合で変更させ、特定方向の振幅比の信号を同一にする。例えば、特定方向である50deg方向の振幅比を1となるように、合成信号InB(k)を処理するフィルタT1の値を設定する。
この場合、フィルタT1により、50deg方向の振幅比は1となる。一方、50deg方向以外の振幅比は、50deg方向の振幅比と異なるため1にはならず、50deg方向の振幅比からの差に応じて、1から離れた値となる。図9は、図8の合成信号InA(k)と、合成信号InB(k)の振幅比において、特定方向30degの振幅比が1となるようにシフトしたグラフである。図9に示すように、15deg〜90degの範囲では、特定方向30degの振幅比を1にすることにより、他の方向の振幅比は、30degから離れるごとに、1より離れる。
(Operation of amplitude changer)
The amplitude changing unit 2 filters the combined signal InA (k) and the combined signal InB with the filters T1 and D1, thereby changing the amplitude ratio at a constant rate and making the signals of the amplitude ratio in a specific direction the same. For example, the value of the filter T1 for processing the combined signal InB (k) is set so that the amplitude ratio in the 50 deg direction, which is a specific direction, becomes 1.
In this case, the amplitude ratio in the 50 deg direction becomes 1 by the filter T1. On the other hand, the amplitude ratio in the direction other than the 50 deg direction is different from the amplitude ratio in the 50 deg direction and thus does not become 1, and becomes a value away from 1 depending on the difference from the amplitude ratio in the 50 deg direction. FIG. 9 is a graph in which the amplitude ratio of the synthesized signal InA (k) and the synthesized signal InB (k) in FIG. As shown in FIG. 9, in the range of 15 deg to 90 deg, by setting the amplitude ratio in the specific direction 30 deg to 1, the amplitude ratio in the other direction deviates from 1 every time it departs from 30 deg.
図10は、音波信号InM1(k)、InM2(k)の50deg方向の振幅差が無くなるように調整した場合の音波信号InM1(k)、InM2(k)のポーラパターンを示した図である。音波信号InM1(k)、InM2(k)のポーラパターンは、50degの方向で重なり合う。この場合、図12に示すように係数m(k)は、特定方向である50degに近ければ近いほど1に近い係数m(k)となる。 FIG. 10 is a diagram illustrating polar patterns of the sound wave signals InM1 (k) and InM2 (k) when the sound wave signals InM1 (k) and InM2 (k) are adjusted so that the amplitude difference in the 50 deg direction is eliminated. The polar patterns of the sound wave signals InM1 (k) and InM2 (k) overlap in the direction of 50 deg. In this case, as shown in FIG. 12, the coefficient m (k) becomes a coefficient m (k) closer to 1 as it is closer to 50 deg which is the specific direction.
一方、図11は、合成信号InA(k)、InB(k)の50deg方向の振幅差が無くなるように調整した場合の合成信号InA(k)、InB(k)のポーラパターンを示した図である。合成信号InA(k)、InB(k)のポーラパターンは、50degの方向で重なり合う。この場合、図13に示すように係数m(k)は、特定方向である50degに近ければ近いほど1に近い係数m(k)となる。特に、振幅比設定部1において、各方向の振幅差を強調することにより、50deg付近と、それ以外で係数m(k)の値に大きな差ができる。つまり、鋭い指向性が得られている。 On the other hand, FIG. 11 is a diagram showing polar patterns of the combined signals InA (k) and InB (k) when adjustment is made so that the amplitude difference in the 50 deg direction of the combined signals InA (k) and InB (k) is eliminated. is there. The polar patterns of the combined signals InA (k) and InB (k) overlap in the direction of 50 deg. In this case, as shown in FIG. 13, the coefficient m (k) becomes a coefficient m (k) that is closer to 1 as it is closer to 50 deg that is the specific direction. In particular, by enhancing the amplitude difference in each direction in the amplitude ratio setting unit 1, a large difference can be made in the value of the coefficient m (k) in the vicinity of 50 deg. That is, sharp directivity is obtained.
これにより、出力信号OutL(k)と出力信号OutR(k)には、音源の存在位置が50degの方向に近ければ近いほど、1に近い係数m(k)によって相対的に強調される利得が与えられる。一方、音源の存在位置が50degの方向から離れれば離れるほど、1未満の係数m(k)によって相対的に抑制される利得が与えられる。 As a result, the output signal OutL (k) and the output signal OutR (k) have a gain that is relatively emphasized by a coefficient m (k) closer to 1 as the sound source location is closer to the direction of 50 deg. Given. On the other hand, the further away the sound source location is from the direction of 50 deg, the more gain that is relatively suppressed by the coefficient m (k) less than 1.
(交換回路の作用)
次に、交換回路の意義について説明する。交換回路を経ることによって、係数更新回路は、以下の数式(14)を交互に演算する。
(Operation of exchange circuit)
Next, the significance of the exchange circuit will be described. By passing through the exchange circuit, the coefficient update circuit alternately calculates the following formula (14).
数式(14)において、信号の二乗の項は、ホワイトノイズ等の無相関成分を時間の経過とともに小さくなるように作用する。一方、その隣接項は、相関係数を逐次的に算出する以下の数式(15)の分子部分と同等であり、相関成分の影響を係数mに反映させていくこととなる。
In Equation (14), the square term of the signal acts to reduce the uncorrelated component such as white noise as time passes. On the other hand, the adjacent term is equivalent to the numerator part of the following formula (15) for sequentially calculating the correlation coefficient, and the influence of the correlation component is reflected on the coefficient m.
つまり、係数更新回路3cが合成信号InA(k)に対して合成信号InB(k)を近似させようとしたときには、合成信号InA(k)の無相関成分は増幅方向となり、合成信号InB(k)の無相関成分は抑制方向となる。また、合成信号InB(k)に対して合成信号InA(k)を近似させようとしたときには、合成信号InB(k)の無相関成分は増幅方向となり、合成信号InA(k)の無相関成分は抑制方向となる。 That is, when the coefficient update circuit 3c attempts to approximate the composite signal InB (k) to the composite signal InA (k), the uncorrelated component of the composite signal InA (k) becomes the amplification direction, and the composite signal InB (k ) Of the uncorrelated component is in the suppression direction. Further, when the synthesized signal InA (k) is approximated to the synthesized signal InB (k), the uncorrelated component of the synthesized signal InB (k) becomes the amplification direction, and the uncorrelated component of the synthesized signal InA (k). Is the direction of suppression.
そこで、係数更新回路3cの前に交換回路2を設置すると、合成信号InA(k)に対して合成信号InB(k)を近似させて同期加算しようとする働きと、合成信号InB(k)に対して合成信号InA(k)を近似させて同期加算しようとする働きとを交互に繰り返すこととなる。そのため、無相関成分を増幅及び抑制しようとする働きは、交互に打ち消し合うことになり、係数m(k)には相関成分の影響を濃く反映させていくことになる。 Therefore, when the switching circuit 2 is installed in front of the coefficient update circuit 3c, the synthesized signal InA (k) is approximated to the synthesized signal InB (k) to perform synchronous addition, and the synthesized signal InB (k) is added. On the other hand, the function of approximating the synthesized signal InA (k) and attempting to add synchronously is repeated alternately. Therefore, the function of amplifying and suppressing the uncorrelated component cancels out alternately, and the coefficient m (k) reflects the influence of the correlated component deeply.
尚、図14は、交換回路3bがある場合とない場合での係数m(k)の収束状態を示している。両収束状態は、共にセンター位置に音源を置き、マイクロフォンM1、M2で集音したものである。図14の曲線Fが示すように、交換回路3bがある場合には約1000回目に係数m(k)が1に収束したが、曲線Gが示すように、交換回路2がない場合には、係数m(k)を10000回更新しても未だ1に収束することはなく、その開きは10倍であった。すなわち、交換回路3bが存在する場合には、音源分離が速やかに完了することを示している。 FIG. 14 shows the convergence state of the coefficient m (k) with and without the exchange circuit 3b. In both the convergence states, a sound source is placed at the center position, and sounds are collected by the microphones M1 and M2. As shown by the curve F in FIG. 14, the coefficient m (k) converges to 1 about 1000 times when there is the exchange circuit 3b, but when there is no exchange circuit 2 as shown by the curve G, Even if the coefficient m (k) was updated 10,000 times, it still did not converge to 1, and the opening was 10 times. That is, when the exchange circuit 3b exists, it indicates that the sound source separation is completed quickly.
(効果)
以上のように、本実施形態に係る音源分離装置では、マイクロフォンM1、M2に入力される一対の音波信号InM1(k)、InM2(k)から、方向毎に固有な振幅比を有する合成信号InA(k)、及び合成信号InB(k)を合成する。そして、
合成信号InA(k)と合成信号InB(k)における特定方向の振幅比の信号を同一振幅に変更する。この同一振幅比を強調することで、特定方向の音波を他方向から到来する音波と比して相対的に強調するフィルタ処理を施す。そして、フィルタ処理の後、交換回路2に合成信号InA(k)、と合成信号InB(k)を1サンプル毎に交互に入れ替えることで、一対の交換信号InC(k)とInD(k)を生成し、この交換信号InC(k)とInD(k)の片方に係数mを乗じた上で、交換信号InC(k)とInD(k)の誤差信号を生成する。更に、誤差信号を含む係数mの漸化式を演算して係数mを1サンプル毎に更新する。最後に、逐次更新された係数mを一対の音波信号に乗じて出力する。
(effect)
As described above, in the sound source separation device according to the present embodiment, the combined signal InA having a unique amplitude ratio for each direction from the pair of sound wave signals InM1 (k) and InM2 (k) input to the microphones M1 and M2. (K) and the synthesized signal InB (k) are synthesized. And
A signal having an amplitude ratio in a specific direction in the combined signal InA (k) and the combined signal InB (k) is changed to the same amplitude. By emphasizing this same amplitude ratio, a filtering process is performed to emphasize the sound waves in a specific direction relative to the sound waves coming from other directions. Then, after the filtering process, the exchange signal 2 is alternately exchanged with the synthesized signal InA (k) and the synthesized signal InB (k) for each sample, whereby a pair of exchange signals InC (k) and InD (k) are obtained. Then, after multiplying one of the exchange signals InC (k) and InD (k) by a coefficient m, an error signal of the exchange signals InC (k) and InD (k) is produced. Further, the recurrence formula of the coefficient m including the error signal is calculated to update the coefficient m for each sample. Finally, the sequentially updated coefficient m is multiplied by a pair of sound wave signals and output.
例えば、1サンプル前に算出された過去の係数mの−1倍がセットされた積算器5に交換信号の片方を通し、積算器5を経た後に、一対の交換信号を加算する加算器6を通し、加算器6を経た後に、定数μがセットされた積算器7を通し、積算器7を経た後に、過去の係数mが乗算される前の片方の交換信号がセットされた積算器8を通し、積算器8を経た後に、1サンプル前に算出された過去の係数mがセットされた加算器9を通すことで、係数mを1サンプル毎に更新する。 For example, an adder 6 that adds one pair of exchange signals after passing one of the exchange signals through the integrator 5 in which −1 times the past coefficient m calculated one sample before is set. After passing through the adder 6, it passes through the integrator 7 in which the constant μ is set. After passing through the integrator 7, the integrator 8 in which one exchange signal before being multiplied by the past coefficient m is set. Then, after passing through the integrator 8, the coefficient m is updated for each sample by passing through the adder 9 in which the past coefficient m calculated one sample before is passed.
これにより、本実施形態の音源分離装置は、音源S1からの音波信号の振幅比に焦点をあて、煩雑な演算を回避でき、音波信号InM1(k)と音波信号InM2(k)との振幅差が極微小であっても、特定方向に指向性を形成することができる。 Thereby, the sound source separation device of the present embodiment focuses on the amplitude ratio of the sound wave signal from the sound source S1, can avoid complicated calculation, and the amplitude difference between the sound wave signal InM1 (k) and the sound wave signal InM2 (k). Even if is very small, directivity can be formed in a specific direction.
更に、その指向性を形成するためにタップ数の多いフィルタ等に依ることはなく、交換回路と漸化式を演算する一つの係数更新回路によって実現できる。従って、演算数を大幅に削減でき、最終的な遅延は数十マイクロ秒〜数ミリ秒以内におさめることが可能となる。 Furthermore, it does not depend on a filter having a large number of taps in order to form the directivity, and can be realized by an exchange circuit and a single coefficient update circuit that calculates a recurrence formula. Therefore, the number of operations can be greatly reduced, and the final delay can be suppressed within several tens of microseconds to several milliseconds.
合成信号InA(k)及び合成信号InB(k)は、方向毎の振幅比を個別な値となるような相関性を有していれば良く、それぞれの合成信号は、任意のポーラパターンを有している。ポーラパターンの一例としては、カーディオイド型、双指向性型、鋭指向性型のポーラパターンが挙げられる。さらに、合成信号InA(k)と合成信号InB(k)のポーラパターンが線対称であっても良い。また、合成信号InA(k)と合成信号InB(k)のポーラパターンが、それぞれ異なる形状を有するものでも良い。 The combined signal InA (k) and the combined signal InB (k) only need to have a correlation such that the amplitude ratio for each direction becomes an individual value, and each combined signal has an arbitrary polar pattern. doing. As an example of the polar pattern, a cardioid type, a bi-directional type, and an acute-directional type polar pattern can be cited. Furthermore, the polar pattern of the combined signal InA (k) and the combined signal InB (k) may be line symmetric. The polar patterns of the synthesized signal InA (k) and the synthesized signal InB (k) may have different shapes.
本実施形態では、図8に示すように、15degの振幅比が最大となるように、合成信号InA(k)と合成信号InB(k)の振幅を設定したが、振幅比が最大となる角度は任意の方向とすることができる。例えば、特定方向の指向性を高めたい場合は、その方向の振幅比が拡大するように設定することもできる。これにより、特定方向については、特に振幅比が拡大するため、後の利得決定に際して、更に、相対的に強調される利得が与えられる。さらに、振幅比を大きくするだけでなく、特定の角度の振幅比を強調するよう振幅比を設定しても良い。言い換えると、特定方向の振幅比を他の方向の振幅比と区別しやすいものとする。例えば、角度毎の振幅比をグラフにした場合には、特定方向の振幅比をピークとしたグラフとなり、そのピークは急峻となる。このように、特定方向とその他の方向の振幅比の差が大きければ、大きいほど指向性を強くすることができる。 In the present embodiment, as shown in FIG. 8, the amplitudes of the combined signal InA (k) and the combined signal InB (k) are set so that the amplitude ratio of 15 deg is maximized. Can be in any direction. For example, when it is desired to increase the directivity in a specific direction, the amplitude ratio in that direction can be set to increase. As a result, the amplitude ratio is particularly increased in the specific direction, so that a relatively emphasized gain is given when the gain is determined later. Furthermore, the amplitude ratio may be set not only to increase the amplitude ratio but also to emphasize the amplitude ratio at a specific angle. In other words, it is easy to distinguish the amplitude ratio in a specific direction from the amplitude ratio in other directions. For example, when the amplitude ratio for each angle is graphed, the graph has the amplitude ratio in a specific direction as a peak, and the peak is steep. Thus, the greater the difference in amplitude ratio between the specific direction and the other direction, the stronger the directivity can be.
一方、特定方向に対してマイナスの指向性、つまり特定方向の音を減衰させたい場合には、減衰させたい方向の振幅比を、他の振幅比と比較して小さいものとする。これにより、減衰させたい方向の振幅比と、他の方向の振幅比との差は、大きくなるため、後の利得決定回路において、他の方向の音を強調される利得gが与えられ、特定方向に対しては相対的に抑制される利得が与えられる。 On the other hand, when it is desired to attenuate a directivity that is negative with respect to a specific direction, that is, a sound in a specific direction, the amplitude ratio in the direction to be attenuated is set to be smaller than other amplitude ratios. As a result, the difference between the amplitude ratio in the direction to be attenuated and the amplitude ratio in the other direction becomes large, so that a gain g for emphasizing the sound in the other direction is given in a later gain determination circuit. A relatively suppressed gain is provided for the direction.
また、本実施形態では、270deg〜90degの範囲において、270deg〜15degの範囲と、15deg〜90degの範囲でそれぞれ方向毎に固有の振幅比として設定した。しかしながら、270deg〜90degの範囲で、方向毎に固有の振幅比として設定することもできる。さらに、0deg〜360degの範囲で、方向毎に固有の振幅比として設定しても良い。 In this embodiment, in the range of 270 deg to 90 deg, the specific amplitude ratio is set for each direction in the range of 270 deg to 15 deg and 15 deg to 90 deg. However, it can be set as a specific amplitude ratio for each direction in the range of 270 deg to 90 deg. Further, it may be set as a specific amplitude ratio for each direction in the range of 0 deg to 360 deg.
本実施形態では、係数決定回路3として、特性補正回路3a、交換回路3b、及びに係数更新回路3cが直列に接続された回路を使用したが、合成信号InA(k)と合成信号InB(k)の波形間の差分に応じて利得を決定する回路であれば、上記実施形態に限定することなく、他の回路や方法で実現可能である。 In the present embodiment, a circuit in which the characteristic correction circuit 3a, the exchange circuit 3b, and the coefficient update circuit 3c are connected in series is used as the coefficient determination circuit 3, but the combined signal InA (k) and the combined signal InB (k As long as it is a circuit that determines the gain according to the difference between the waveforms of (), it can be realized by other circuits and methods without being limited to the above embodiment.
本実施形態では、合成回路4において、合成信号InA(k)と合成信号InB(k)に対して、任意の比率で係数m(k)を乗じ、任意の比率で足し合わせて利得gを決定する。利得gの一例としては、以下の(1)〜(5)が挙げられる。
(1)そのままの係数m(k)。
(2)g=m(k)^2、g=m(k)^3のように、係数m(k)を指定数乗した値。
(3)g=m(k)+a、g=m(k)−aのように、係数m(k) に指定数を足した値。
(4)g=m(k)*bのように、係数m(k)に一定数bを掛け合わせた値。
(5)g=((m(k)+a)*b)^2のように、(2)〜(4)を組み合わせた値。
In the present embodiment, the combining circuit 4 multiplies the combined signal InA (k) and the combined signal InB (k) by a coefficient m (k) at an arbitrary ratio, and adds the arbitrary ratio to determine the gain g. To do. Examples of the gain g include the following (1) to (5).
(1) The coefficient m (k) as it is.
(2) A value obtained by multiplying a coefficient m (k) by a specified number, such as g = m (k) ^ 2 and g = m (k) ^ 3.
(3) A value obtained by adding a specified number to the coefficient m (k) such as g = m (k) + a and g = m (k) −a.
(4) A value obtained by multiplying the coefficient m (k) by a certain number b, such as g = m (k) * b.
(5) A value obtained by combining (2) to (4) as in g = ((m (k) + a) * b) ^ 2.
また、出力信号OutL(k)と出力信号OutR(k)は、以下の式(16)(17)のように合成することもできる。
出力信号outL=(InM1(k)+outL(k))*g
出力信号outR=(InM2(k)+outR(k))*g・・・・(16)
出力信号outL=outR=(outL+outR)*g+InM1(k)+InM2(k) ・・・・(17)
Further, the output signal OutL (k) and the output signal OutR (k) can be combined as in the following equations (16) and (17).
Output signal outL = (InM1 (k) + outL (k)) * g
Output signal outR = (InM2 (k) + outR (k)) * g (16)
Output signal outL = outR = (outL + outR) * g + InM1 (k) + InM2 (k) (17)
(その他の実施形態)
以上のように、本発明の実施形態を説明したが、この実施形態は、例として提示したものであり、発明の範囲を限定することを意図していない。これら新規な実施形態は、そのほかの様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
(Other embodiments)
As mentioned above, although embodiment of this invention was described, this embodiment is shown as an example and is not intending limiting the range of invention. These novel embodiments can be implemented in various other forms, and various omissions, replacements, and changes can be made without departing from the scope of the invention. These embodiments and modifications thereof are included in the scope and gist of the invention, and are included in the invention described in the claims and the equivalents thereof.
例えば、実施形態では、音源分離装置がICレコーダやPCや携帯端末等の収録機能を有する機器に搭載されることを前提に説明したが、その他のあらゆる音響機器に搭載することもでき、マイクロフォンに代えて、音波データを記憶したメモリから音波信号InM1及びInM2の提供を受けることができる。例えば、マイクロフォンからリアルタイムに入力された音波信号の他、音源分離装置に接続された一対のマイクロフォンで予め収録されて得られた音波信号、全く別の一対のマイクロフォンで予め収録されて得られた音波信号、コンピュータ等を用いて一対のマイクロフォンで収録された音波に見立てて擬似的に生成された音波信号に対して、特定方向に指向性を形成することを含む。 For example, in the embodiment, the sound source separation device has been described on the assumption that the sound source separation device is mounted on a device having a recording function such as an IC recorder, a PC, or a portable terminal. However, the sound source separation device can be mounted on any other audio device, Instead, the sound wave signals InM1 and InM2 can be received from the memory storing the sound wave data. For example, in addition to a sound wave signal input in real time from a microphone, a sound wave signal recorded in advance by a pair of microphones connected to a sound source separation device, a sound wave obtained in advance by a completely different pair of microphones This includes forming directivity in a specific direction with respect to a sound wave signal that is artificially generated by using a signal, a computer, or the like as a sound wave recorded by a pair of microphones.
また、図15に示すように、振幅比設定部1の後段に、合成信号の振幅比を測定する振幅比測定部12を設けることもできる。振幅比測定部12では、予め振幅比設定部1における方向毎の振幅率の比のデータを保持し、新たに入力した一対の音波信号の振幅比により、その音波信号の方向を測定する。
すなわち、予め音波信号InM1(k)及び音波信号InM2(k)が入力した際の振幅比設定部1における方向毎の振幅率の比のデータをメモリ内に記録する。その上で、入力する音波信号とInM1’(k)と音波信号InM2’(k)との合成信号InA’(k)と合成信号InB’(k)との振幅比を測定する。そして、測定した振幅比を、振幅比測定部12内のメモリ内に記憶する振幅比設定部1での音波信号InM1(k)及び音波信号InM2(k)の振幅変化率の比と比較する。
音波信号InM1(k)及び音波信号InM2(k)の振幅変化率の比は、方向毎に固有の値であるために、測定した合成信号InA’(k)と合成信号InB’(k)との振幅比と比較することで、音波信号とInM1’(k)と音波信号InM2’(k)を発生する音源の方向を知ることもできる。
As shown in FIG. 15, an amplitude ratio measuring unit 12 that measures the amplitude ratio of the combined signal can be provided at the subsequent stage of the amplitude ratio setting unit 1. The amplitude ratio measurement unit 12 stores in advance data of the ratio of the amplitude rate for each direction in the amplitude ratio setting unit 1 and measures the direction of the sound wave signal based on the amplitude ratio of a pair of newly input sound wave signals.
That is, the ratio data of the amplitude ratio for each direction in the amplitude ratio setting unit 1 when the sound wave signal InM1 (k) and the sound wave signal InM2 (k) are input in advance is recorded in the memory. Then, the amplitude ratio of the combined signal InA ′ (k) and the combined signal InB ′ (k) of the input sound wave signal, InM1 ′ (k) and the sound wave signal InM2 ′ (k) is measured. Then, the measured amplitude ratio is compared with the ratio of the amplitude change rate of the sound wave signal InM1 (k) and the sound wave signal InM2 (k) in the amplitude ratio setting unit 1 stored in the memory in the amplitude ratio measurement unit 12.
Since the ratio of the amplitude change rate of the sound wave signal InM1 (k) and the sound wave signal InM2 (k) is a unique value for each direction, the measured synthesized signal InA ′ (k) and synthesized signal InB ′ (k) , The direction of the sound source that generates the sound wave signal, InM1 ′ (k), and sound wave signal InM2 ′ (k) can also be known.
また、図16に示すように、係数更新回路は、交換信号の片方に係数mを乗じた上で、交換信号の誤差信号を生成し、この誤差信号を含む係数mの漸化式を演算して係数mを1サンプル毎に更新するようにすれば、上記実施形態に限定することなく、その他の態様で実現可能である。 Further, as shown in FIG. 16, the coefficient updating circuit multiplies one of the exchange signals by a coefficient m, generates an error signal of the exchange signal, and calculates a recurrence formula of the coefficient m including the error signal. If the coefficient m is updated for each sample, the present invention is not limited to the above embodiment and can be realized in other modes.
また、この音源分離装置は、CPUやDSPのソフトウェア処理として実現してもよいし、専用のデジタル回路で構成するようにしてもよい。ソフトウェア処理として実現する場合には、CPU、外部メモリ、RAMを備えるコンピュータにおいて、振幅比設定部1、振幅変更部2、係数決定回路3、合成回路4と同一の処理内容を記述したプログラムをROMやハードディスクやフラッシュメモリ等の外部メモリに記憶させ、RAMに適宜展開し、CPUで其のプログラムに従って演算を行うようにすればよい。 The sound source separation device may be realized as software processing of a CPU or DSP, or may be configured by a dedicated digital circuit. When implemented as software processing, in a computer having a CPU, external memory, and RAM, a program describing the same processing contents as the amplitude ratio setting unit 1, amplitude changing unit 2, coefficient determination circuit 3, and synthesis circuit 4 is read into ROM Or stored in an external memory such as a hard disk or a flash memory, appropriately expanded in a RAM, and the CPU may perform calculations according to the program.
1 振幅比設定部
1a 加算器
1b 加算器
2 振幅変更部
3 係数決定回路
3a 特性補正回路
3b 交換回路
3c 係数更新回路
4 合成回路
5 積算器
6 加算器
7 積算器
8 積算器
9 加算器
10 遅延器
11 積算器
12 振幅比測定部
DESCRIPTION OF SYMBOLS 1 Amplitude ratio setting part 1a Adder 1b Adder 2 Amplitude change part 3 Coefficient determination circuit 3a Characteristic correction circuit 3b Exchange circuit 3c Coefficient update circuit 4 Synthesis circuit 5 Accumulator 6 Adder 7 Accumulator 8 Accumulator 9 Adder 10 Delay 11 Accumulator 12 Amplitude ratio measurement unit
Claims (19)
任意の数のフィルタと、
その後段に設けられた任意の数の加算器とを用い、
前記フィルタと加算器とにより、得られた前記一対の音波信号の振幅比を方向毎に固有な値とする振幅比設定ステップと、
前記一対の音波信号についてその振幅を一定の割合で変更させるフィルタ処理を施し、当該一定の割合とは、特定方向における振幅比を同一に変更する振幅変更ステップと、
前記振幅変更ステップを経た一対の音波信号の波形間の差分に応じて利得を決定する利得決定ステップと、
前記利得を音波信号に乗じて出力する出力ステップと、
を備えること、
を特徴とする音源分離方法。 A sound source separation method for forming directivity in a specific direction with respect to a pair of sound wave signals,
Any number of filters,
Using an arbitrary number of adders provided in the subsequent stage,
An amplitude ratio setting step in which the amplitude ratio of the pair of sound wave signals obtained by the filter and the adder is a unique value for each direction;
Applying a filtering process for changing the amplitude of the pair of sound wave signals at a constant ratio, the fixed ratio is an amplitude changing step for changing the amplitude ratio in a specific direction to be the same,
A gain determining step for determining a gain according to a difference between waveforms of a pair of sound wave signals that have undergone the amplitude changing step;
An output step of multiplying the sound wave signal by the gain and outputting;
Providing
A sound source separation method characterized by the above.
前記一対の音波信号の振幅を、方向によって固有の変化率で変化させると共に、同一方向に由来する振幅を、異なる変化率で変化させる、
ことを特徴とする請求項1に記載の音源分離方法。 In the amplitude ratio setting step,
The amplitude of the pair of sound wave signals is changed at a specific rate of change depending on the direction, and the amplitude derived from the same direction is changed at a different rate of change.
The sound source separation method according to claim 1.
前記一対の音波信号毎に異なることを特徴とする請求項2に記載の音源分離方法。 The polar pattern indicating the ratio of the change rate is
The sound source separation method according to claim 2, wherein the sound source separation method is different for each pair of sound wave signals.
その変化率が、他の方向の振幅率と比較して大きいものであることを特徴とする請求項3に記載の音源分離方法。 The rate of change of the amplitude is in a specific direction for emphasis or attenuation.
4. The sound source separation method according to claim 3, wherein the rate of change is larger than the amplitude rate in other directions.
前記振幅変更ステップを経た合成信号を、交換回路によって前記一対の合成信号を1サンプル毎に交互に入れ替えることで、一対の交換信号を生成する交換ステップと、
前記交換信号の片方に係数mを乗じた上で、前記交換信号の誤差信号を生成する生成ステップと、
前記誤差信号を含む係数mの漸化式を演算して係数mを1サンプル毎に更新する更新ステップと、
逐次更新された係数mを前記一対の合成信号に乗じて出力する出力ステップと、
を備えること、
を特徴とする請求項4に記載の音源分離方法。 The gain determining step includes:
An exchange step for generating a pair of exchange signals by alternately exchanging the pair of synthesis signals for each sample by an exchange circuit for the synthesized signal that has undergone the amplitude changing step;
A step of generating an error signal of the exchange signal after multiplying one of the exchange signals by a coefficient m;
An update step of calculating a recurrence formula of the coefficient m including the error signal and updating the coefficient m every sample;
An output step of multiplying the pair of combined signals by the sequentially updated coefficient m and outputting the result;
Providing
The sound source separation method according to claim 4.
任意の数のフィルタと、
その後段に設けられた任意の数の加算器と、
前記一対の音波信号についてその振幅を一定の割合で変更させるフィルタ処理を施し、当該一定の割合とは、特定方向における振幅比を同一に変更する振幅変更部と、
前記一対の音波信号の振幅比のうち特定振幅比を同一振幅に変更する振幅変更部と、
前記振幅変更ステップを経た一対の音波信号の波形間の差分に応じて利得を決定する利得決定部と、
前記利得を音波信号に乗じて出力する出力部と、
を備えること、
を特徴とする音源分離装置。 A sound source separation device that forms directivity in a specific direction with respect to a pair of sound wave signals,
Any number of filters,
Any number of adders provided in the subsequent stage;
Applying a filtering process that changes the amplitude of the pair of sound wave signals at a constant rate, the fixed rate is an amplitude changing unit that changes the amplitude ratio in a specific direction to the same value,
An amplitude changing unit that changes a specific amplitude ratio to the same amplitude among the amplitude ratios of the pair of sound wave signals;
A gain determining unit that determines a gain according to a difference between waveforms of a pair of sound wave signals that have undergone the amplitude changing step;
An output unit that multiplies the sound wave signal by the gain and outputs it;
Providing
A sound source separation device characterized by the above.
前記一対の音波信号の振幅を、方向によって固有の変化率で変化させると共に、同一方向に由来する振幅を、異なる変化率で変化させる、ことを特徴とする請求項8に記載の音源分離装置。 In the amplitude ratio setting unit,
9. The sound source separation device according to claim 8, wherein the amplitude of the pair of sound wave signals is changed at a specific rate of change depending on the direction, and the amplitude derived from the same direction is changed at a different rate of change.
前記一対の音波信号毎に異なることを特徴とする請求項9に記載の音源分離装置。 The polar pattern indicating the ratio of the change rate is
The sound source separation device according to claim 9, wherein the sound source separation device is different for each pair of sound wave signals.
その変化率が、他の方向の振幅率と比較して大きいものであることを特徴とする請求項10に記載の音源分離装置。 The rate of change of the amplitude is in a specific direction for emphasis or attenuation.
The sound source separation device according to claim 10, wherein the rate of change is larger than the amplitude rate in the other direction.
前記振幅変更部を経た合成信号を、交換回路によって前記一対の合成信号を1サンプル毎に交互に入れ替えることで、一対の交換信号を生成する交換部と、
前記交換信号の片方に係数mを乗じた上で、前記交換信号の誤差信号を生成する生成部と、
前記誤差信号を含む係数mの漸化式を演算して係数mを1サンプル毎に更新する更新部と、
逐次更新された係数mを前記一対の音波信号に乗じて出力する出力部と、
を備えること、
を特徴とする請求項11に記載の音源分離装置。 The gain determining unit
An exchange unit that generates a pair of exchange signals by alternately exchanging the pair of synthesis signals for each sample by an exchange circuit with the synthesized signal that has passed through the amplitude changing unit;
A generator for generating an error signal of the exchange signal after multiplying one of the exchange signals by a coefficient m;
An updating unit that calculates a recurrence formula of the coefficient m including the error signal and updates the coefficient m for each sample;
An output unit for multiplying and outputting the pair of sound wave signals by the sequentially updated coefficient m;
Providing
The sound source separation device according to claim 11.
任意の数のフィルタと、
その後段に設けられた任意の数の加算器と、を備えるコンピュータを、
前記フィルタと加算器とにより、得られた前記一対の音波信号の振幅比を方向毎に固有な値とする振幅比設定手段と、
前記一対の音波信号についてその振幅を一定の割合で変更させるフィルタ処理を施し、当該一定の割合とは、特定方向における振幅比を同一に変更する振幅変更手段と、
前記振幅変更ステップを経た一対の音波信号の波形間の差分に応じて利得を決定する利得決定手段と、
前記利得を音波信号に乗じて出力する出力手段と、
して機能させることを特徴とする音源分離プログラム。 A sound source separation program that forms directivity in a specific direction with respect to a pair of sound wave signals,
Any number of filters,
A computer comprising any number of adders provided in the subsequent stage;
An amplitude ratio setting means for setting the amplitude ratio of the pair of sound wave signals obtained by the filter and the adder to a unique value for each direction;
Applying a filtering process to change the amplitude of the pair of sound wave signals at a constant ratio, the fixed ratio is an amplitude changing means for changing the amplitude ratio in a specific direction to be the same,
Gain determining means for determining a gain according to a difference between waveforms of a pair of sound wave signals that have undergone the amplitude changing step;
Output means for multiplying the sound wave signal by the gain and outputting;
A sound source separation program characterized by being made to function.
前記一対の音波信号毎に異なることを特徴とする請求項16に記載の音源分離プログラム。 The polar pattern indicating the ratio of the change rate is
The sound source separation program according to claim 16, wherein the sound source separation program is different for each pair of sound wave signals.
その変化率が、他の方向の振幅率と比較して大きいものであることを特徴とする請求項17に記載の音源分離プログラム。 The rate of change of the amplitude is in a specific direction for emphasis or attenuation.
The sound source separation program according to claim 17, wherein the rate of change is larger than the amplitude rate in the other direction.
前記交換信号の片方に係数mを乗じた上で、前記交換信号の誤差信号を生成し、
前記誤差信号を含む係数mの漸化式を演算して係数mを1サンプル毎に更新させ、
逐次更新された係数mを前記一対の合成信号に乗じて出力させる、
機能を実現することを特徴とする請求項18に記載の音源分離プログラム。 The synthesized signal that has undergone the amplitude changing step is generated by alternately exchanging the pair of synthesized signals for each sample by an exchange circuit,
After multiplying one of the exchange signals by a coefficient m, an error signal of the exchange signal is generated,
Calculating a recurrence formula of the coefficient m including the error signal to update the coefficient m every sample;
Multiplying the pair of synthesized signals by the sequentially updated coefficient m and outputting the result.
The sound source separation program according to claim 18, which realizes a function.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013023869A JP6128547B2 (en) | 2013-02-08 | 2013-02-08 | Sound source separation method, apparatus and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013023869A JP6128547B2 (en) | 2013-02-08 | 2013-02-08 | Sound source separation method, apparatus and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014155075A true JP2014155075A (en) | 2014-08-25 |
JP6128547B2 JP6128547B2 (en) | 2017-05-17 |
Family
ID=51576535
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013023869A Active JP6128547B2 (en) | 2013-02-08 | 2013-02-08 | Sound source separation method, apparatus and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6128547B2 (en) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0739000A (en) * | 1992-12-05 | 1995-02-07 | Kazumoto Suzuki | Selective extract method for sound wave in optional direction |
JP2008236287A (en) * | 2007-03-20 | 2008-10-02 | Sanyo Electric Co Ltd | Device and method for generating voice signal |
JP2011135119A (en) * | 2009-12-22 | 2011-07-07 | Yamaha Corp | Audio signal processing apparatus |
-
2013
- 2013-02-08 JP JP2013023869A patent/JP6128547B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0739000A (en) * | 1992-12-05 | 1995-02-07 | Kazumoto Suzuki | Selective extract method for sound wave in optional direction |
JP2008236287A (en) * | 2007-03-20 | 2008-10-02 | Sanyo Electric Co Ltd | Device and method for generating voice signal |
JP2011135119A (en) * | 2009-12-22 | 2011-07-07 | Yamaha Corp | Audio signal processing apparatus |
Also Published As
Publication number | Publication date |
---|---|
JP6128547B2 (en) | 2017-05-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4286637B2 (en) | Microphone device and playback device | |
US8611552B1 (en) | Direction-aware active noise cancellation system | |
JP5672770B2 (en) | Microphone array device and program executed by the microphone array device | |
RU2018119087A (en) | DEVICE AND METHOD FOR FORMING A FILTERED AUDIO SIGNAL REALIZING AN ANGLE RENDERIZATION | |
CN108293170B (en) | Method and apparatus for adaptive phase distortion free amplitude response equalization in beamforming applications | |
CN104661153A (en) | Earphone sound effect compensation method and device as well as earphone | |
KR102191736B1 (en) | Method and apparatus for speech enhancement with artificial neural network | |
US9538288B2 (en) | Sound field correction apparatus, control method thereof, and computer-readable storage medium | |
JP6226885B2 (en) | Sound source separation method, apparatus, and program | |
JP6371167B2 (en) | Reverberation suppression device | |
CN105103219A (en) | Noise reduction method | |
JP5140785B1 (en) | Directivity control method and apparatus | |
TW201312551A (en) | Speech enhancement method | |
JP6128547B2 (en) | Sound source separation method, apparatus and program | |
JP6025068B2 (en) | Sound processing apparatus and sound processing method | |
JP6065029B2 (en) | Sound collecting apparatus, program and method | |
KR101536650B1 (en) | A method for controlling voice signal and Device including the Same | |
JP5713933B2 (en) | Sound source distance measuring device, acoustic direct ratio estimating device, noise removing device, method and program thereof | |
CN114023307B (en) | Sound signal processing method, speech recognition method, electronic device, and storage medium | |
WO2021131346A1 (en) | Sound pick-up device, sound pick-up method and sound pick-up program | |
JP5246700B2 (en) | Hearing aid system | |
CN117037822A (en) | Method for realizing microphone data transmission synchronization of acoustic cascade equipment | |
JP6221463B2 (en) | Audio signal processing apparatus and program | |
KR20100025140A (en) | Method of voice source separation | |
KR20140077764A (en) | Method of recognizing sound based on time delay neural network using acoustic path modeling |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160115 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20161118 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170110 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170308 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170321 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170405 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6128547 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |