JP2022120750A - Method of separating signal waveform per incoming direction - Google Patents
Method of separating signal waveform per incoming direction Download PDFInfo
- Publication number
- JP2022120750A JP2022120750A JP2021056192A JP2021056192A JP2022120750A JP 2022120750 A JP2022120750 A JP 2022120750A JP 2021056192 A JP2021056192 A JP 2021056192A JP 2021056192 A JP2021056192 A JP 2021056192A JP 2022120750 A JP2022120750 A JP 2022120750A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- matrix
- source signal
- separation
- degree
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
Abstract
Description
本発明は、到来方向別に信号波形を分離する方法に係り、特に、源信号到来方向事前情報(源信号空間事前情報)に基づく分離信号算定方法及びフォンミーゼス・フィッシャー分布を混合モデルとして用いるクラスタリング方法に関する。 The present invention relates to a method for separating signal waveforms by direction of arrival, and in particular, a method for calculating separated signals based on source signal direction-of-arrival prior information (original signal space prior information) and a clustering method using von Mises-Fischer distribution as a mixture model. Regarding.
一般の道路環境において、車両のエンジン音やタイヤ転動音、道路橋においては、橋梁に車両が進入する衝撃により橋梁構造から発生するジョイント音や車両の走行により生じる桁のたわみ振動に伴う低周波音が問題となっている(非特許文献1)。特に橋梁構造から発生する低周波音は健康被害をもたらすとの報告があり(非特許文献2)、発生源を特定して対策を講じることが重要となる。又、住宅地においては、物の落下やファンの稼働音等による発生源を特定することが困難な不思議音が問題になっている。騒音や不思議音の発生源を調査するためには、数多くの観測データの中から問題となっている音を特定する必要があり、労力がかかる。この他にも工事騒音の予測等に役立てるために、スピーカから建設機械音を発生させ、複数のマイクロフォンアレイを用いて、音の到来方向を特定することで、機械別の騒音予測を行っている事例もあるが、方向特定のみに留まっている。方向別に音の周波数特性を算定して騒音の発生源を調査する時や、複数の環境音の中から問題となっている音を特定する時などにおいて、労力削減のために、人工知能を用いる場合、信号波形の特徴量が必要となる。この時、源信号の到来方向別の時間領域又は周波数領域での波形が得られれば、より高精度に対象とする音の特徴量を抽出することが可能になり、高精度な判定に繋がると考えられる。 In a general road environment, the engine noise and tire rolling noise of vehicles, and in road bridges, the joint noise generated from the bridge structure due to the impact of a vehicle entering the bridge, and the low frequency vibration caused by the bending vibration of the girder caused by the running of the vehicle. Wave sound is a problem (Non-Patent Document 1). In particular, it has been reported that low-frequency sound generated from bridge structures poses a health hazard (Non-Patent Document 2), and it is important to identify the source and take countermeasures. Also, in residential areas, strange noises such as falling objects and operating noises of fans, which are difficult to identify, have become a problem. In order to investigate the source of noise and strange sounds, it is necessary to identify the sound in question from a large amount of observation data, which takes a lot of labor. In addition to this, in order to help predict construction noise, etc., construction machine sounds are generated from speakers, and multiple microphone arrays are used to specify the direction of arrival of the sounds, thereby performing noise prediction for each machine. There are some cases, but they are limited to direction identification only. Artificial intelligence is used to reduce labor when investigating the source of noise by calculating the frequency characteristics of sound for each direction, and when identifying problematic sounds from among multiple environmental sounds. In this case, the feature quantity of the signal waveform is required. At this time, if waveforms in the time domain or frequency domain for each direction of arrival of the source signal can be obtained, it will be possible to extract the feature amount of the target sound with higher accuracy, leading to highly accurate judgment. Conceivable.
異常検知の分野では、観測された音の時間波形からパワースペクトルや波形形状の特徴量を抽出し、人工知能に入力することで、異常性を判定する手法が提案されている(非特許文献3)。この異常音検知手法は、機械の故障予測を初めとして、銃声や悲鳴,爆発音の検知による犯罪検出や道路における車の衝突やスリップ音の検知による事故検出など、様々な目的で用いられている(非特許文献4、5、6)。もし事前に方向別に波形を分離することができれば、人工知能に目的とする波形の特徴量とその方向頻度をより高精度に学習させることや学習データに基づいて、異常性を判定させることが可能になると考えられる。 In the field of anomaly detection, a method has been proposed to determine anomalies by extracting power spectra and waveform shape features from observed sound time waveforms and inputting them to artificial intelligence (Non-Patent Document 3). ). This abnormal sound detection method is used for various purposes, including machine failure prediction, crime detection by detecting gunshots, screams, and explosion sounds, and accident detection by detecting car crashes and slip sounds on roads. (Non-Patent Documents 4, 5, 6). If it is possible to separate waveforms by direction in advance, it is possible to have artificial intelligence learn the target waveform feature quantity and its direction frequency with higher accuracy, and to judge abnormalities based on the learning data. is considered to be
従来の騒音や異音の発生源調査には、ミュージック法(非特許文献7)等のサブスペース法がよく用いられてきた。例えばミュージック法は、複数の観測点で得られた信号の相関行列とセンサ配置から定まるステアリングベクトルの情報を基に方向別のMUSICスペクトルを求める手法である。しかし、MUSICスペクトルは方向別の相対的な音の大きさの比率を表しているため、各方向における到来波の強度比率を評価することはできるが、実際にセンサで観測された音の大きさや時間波形を求めることはできない。ミュージック法を用いて、複数の信号波形が混合した観測信号から分離波形の時系列データを得るには、源信号到来方向の情報から混合行列を推定し、その逆行列を分離行列として用いる必要がある。しかし、この方法では、源信号が互いに近接して存在する場合に混合行列が悪条件になるため、分離信号の算定精度が悪くなる。広帯域信号の分離波形を得る時にも、低周波数側において混合行列は悪条件になる。そのため、ミュージック法により推定した混合行列の逆行列を算定する方法では、全ての源信号が十分離れている状況において、解析対象周波数を狭帯域に限定した状態でしか、分離信号を得ることができない。 Subspace methods such as the music method (Non-Patent Document 7) have often been used in conventional noise and abnormal noise source investigations. For example, the music method is a method of obtaining the MUSIC spectrum for each direction based on the steering vector information determined from the correlation matrix of signals obtained at a plurality of observation points and the sensor arrangement. However, since the MUSIC spectrum expresses the ratio of relative sound levels in each direction, it is possible to evaluate the intensity ratio of incoming waves in each direction. A time waveform cannot be obtained. Using the music method to obtain time-series data of separated waveforms from observed signals in which multiple signal waveforms are mixed, it is necessary to estimate the mixing matrix from information on the direction of arrival of the source signal and use its inverse matrix as the separation matrix. be. However, in this method, the mixing matrix is ill-conditioned when the source signals exist close to each other, so the separation signal calculation accuracy is poor. Even when obtaining separated waveforms of wideband signals, the mixing matrix becomes ill-conditioned on the low frequency side. Therefore, in the method of calculating the inverse matrix of the mixing matrix estimated by the music method, separated signals can only be obtained in a situation where all the source signals are sufficiently separated and the frequency to be analyzed is limited to a narrow band. .
音楽信号や音声信号の分離においては、複数の混じり合った音の中から、目的音を抽出する手法や混合音信号を因子別に分離する手法が発展してきた。代表的な手法としては、独立成分分析、独立低ランク行列分析がある。これらの源信号分離手法は、源信号の統計的独立性を仮定して、信号分離を行う方法である。独立成分分析や独立低ランク行列分析を周波数領域で用いることにより分離行列を算定した場合でも、広帯域信号における低周波数側での分離信号の推定精度劣化は起きるが、その劣化の程度が、混合行列の逆行列を用いた時よりも少なくなる。そのため、源信号が近接して存在する場合や広帯域信号から分離信号を算定する場合においても適用可能となる。 In the separation of music signals and speech signals, a technique for extracting a target sound from a plurality of mixed sounds and a technique for separating mixed sound signals by factors have been developed. Typical methods include independent component analysis and independent low-rank matrix analysis. These source signal separation methods are methods of separating signals by assuming statistical independence of the source signals. Even when the separation matrix is calculated by using independent component analysis or independent low-rank matrix analysis in the frequency domain, the estimation accuracy of the separated signals on the low frequency side of the wideband signal deteriorates, but the degree of deterioration depends on the mixing matrix. less than when using the inverse of Therefore, it can be applied to the case where the source signals exist close to each other or to calculate the separated signal from the broadband signal.
独立成分分析では、源信号の確率分布形状を想定して分離信号を求めている。しかし、確率分布を厳密に定めることはできないため、信号分離結果には常に一定レベルの誤差が含まれる。又、源信号数が観測点数よりも多い場合、正しく信号分離できないという性質があり、目的音以外の複数のノイズが混入した場合、信号分離精度が悪くなるという課題がある。 In the independent component analysis, separated signals are obtained by assuming the probability distribution shape of the source signal. However, since the probability distribution cannot be strictly defined, the signal separation results always contain a certain level of error. Further, when the number of source signals is larger than the number of observation points, there is a property that signals cannot be separated correctly, and when a plurality of noises other than the target sound are mixed, there is a problem that the signal separation accuracy deteriorates.
独立成分分析や独立低ランク行列分析には、源信号の推定値が現れる順序を定めることができないというパーティミション問題があり、周波数領域で信号分離する時にパーティミションが起こると、分離信号に大きな誤差が生じるという課題がある。信号分離結果に誤差が含まれる場合、分離結果から得られる方向特徴量も誤差の影響を受けるため、その方向特徴量を用いて、パーティミション問題を解決することが困難になる。 Independent component analysis and independent low-rank matrix analysis have a partition problem that the order in which the estimated values of the source signal appear cannot be determined. There is a problem that If the signal separation result contains an error, the directional feature obtained from the separation result is also affected by the error, making it difficult to solve the partition problem using the directional feature.
源信号到来方向は、分離行列の逆行列である混合行列のテンソル成分を用いて、源信号位置からセンサ位置までの周波数伝達関数を算定し、周波数伝達関数から源信号のセンサ間位相差を推定することで算定する。そのため、分離行列の算定結果に誤差が含まれると、その影響を受けて源信号到来方向推定結果の精度が劣化する For the direction of arrival of the source signal, the tensor component of the mixing matrix, which is the inverse matrix of the separation matrix, is used to calculate the frequency transfer function from the source signal position to the sensor position, and the inter-sensor phase difference of the source signal is estimated from the frequency transfer function. Calculated by Therefore, if the calculation result of the separation matrix contains an error, the accuracy of the direction-of-arrival estimation result of the source signal deteriorates due to its influence.
このように分離行列の算定誤差は、周波数ビンごとの分離信号の誤差のみにとどまらず、信号基底ベクトルのクラスタ分析の誤差や源信号到来方向の算定誤差につながる。 In this way, the calculation error of the separation matrix is not limited to the error of the separated signals for each frequency bin, but also leads to the error of the cluster analysis of the signal basis vectors and the calculation error of the direction of arrival of the source signal.
独立成分分析を用いる場合、確率分布形状を厳密に定めることができれば、上記の課題は全て解決するが、未知の源信号の確率分布形状を厳密に定めることは困難であり、そのため独立成分分析による信号分離結果には一定レベルの誤差が含まれる結果となる。 When using independent component analysis, if the probability distribution shape can be determined strictly, all the above problems can be solved. The result of signal separation contains a certain level of error.
パーティミションの解決手法としてこれまで分離行列の指向性パターンを手掛かりにする方法(非特許文献8,9)や分離行列の逆行列の周波数間での連続性を利用する方法(非特許文献10)が提案されている。しかし、これらの方法では、周波数ごとに信号基底ベクトルが異なるため、広帯域信号における分離が困難になる。この問題を解決するために、分離行列の逆行列を源信号と観測点間の周波数伝達関数で近似することで、全周波数で一貫した源信号ラベルを構成する手法が提案されている(非特許文献11)。以上の方法では、観測データにノイズが混入するなどの要因で、分離行列(分離信号)に算定誤差が生じた時に、クラスタごとのに信号基底ベクトルもその影響を受けて算定誤差が生じるため、最適解にたどり着けないという問題がある。又、クラスタ算定時に信号基底ベクトルのクラスタごとの平均方向の初期値を定める必要があるが、従来のクラスタ算定方法では、算定結果が初期値に依存し、局所解に陥ることがあるという問題がある。この初期値依存性は、分離行列(分離信号)に算定誤差が生じた時に顕著に現れる。 As methods for solving partitions, there have been methods that use the directivity pattern of the separation matrix as a clue (Non-Patent Documents 8 and 9) and a method that uses the continuity between frequencies of the inverse matrix of the separation matrix (Non-Patent Document 10). is proposed. However, these methods have different signal basis vectors for different frequencies, making it difficult to separate broadband signals. To solve this problem, a method has been proposed to construct consistent source signal labels at all frequencies by approximating the inverse matrix of the separation matrix with the frequency transfer function between the source signal and the observation point (non-patent Reference 11). In the above method, when a calculation error occurs in the separation matrix (separation signal) due to factors such as noise in the observation data, the signal basis vectors for each cluster are also affected by the calculation error. There is a problem that the optimum solution cannot be reached. In addition, it is necessary to determine the initial value of the average direction for each cluster of signal basis vectors at the time of cluster calculation. be. This initial value dependence appears conspicuously when a calculation error occurs in the separation matrix (separated signal).
これまで独立成分分析は信号分離に活用されてきたが、信号分離後に高精度に源信号到来方向を推定する手法は確率されていない。その原因として分離行列に基づく信号の到来方向推定方法では、分離行列の算定結果に誤差が含まれる時にその影響を受けて源信号到来方向推定結果の精度が劣化することが考えられる。そのため、これまでは源信号到来方向にはミュージック法等のサブスペース法、信号分離には独立成分分析が用いられることが多かった。 Until now, independent component analysis has been utilized for signal separation, but a method for estimating the direction of arrival of the source signal with high accuracy after signal separation has not been established. A possible cause of this is that, in the signal arrival direction estimation method based on the separation matrix, the accuracy of the source signal arrival direction estimation result is degraded due to the influence of the error included in the separation matrix calculation result. Therefore, until now, the subspace method such as the music method has often been used for the direction of arrival of the source signal, and the independent component analysis has been used for the signal separation.
ミュージック法等のサブスペース法とカメラ映像を併せて用いた場合、源信号到来方向を高精度に推定できる。このような方法で事前に源信号の空間情報が得られている場合、この空間事前情報を積極的に用いると、センサ-源信号間の周波数伝達関数が求まる。この周波数伝達関数を用いて混合行列を求め、その逆行列により分離行列を算定できる。この分離行列を用いれば、理論上、空間事前情報を信号分離に利用すると、高精度に信号分離できることになる。しかし、源信号の解析対象周波数が広帯域にわたる場合や源信号位置が互いに近接している場合に、混合行列が悪条件となり、分離行列の算定精度が悪くなる。この課題を解決し、信号波形の空間事前情報を用いて、高精度に信号分離する方法は、現段階で確立されていない。 When the subspace method such as the music method and the camera image are used together, the direction of arrival of the source signal can be estimated with high accuracy. When the spatial information of the source signal is obtained in advance by such a method, the frequency transfer function between the sensor and the source signal can be obtained by actively using this spatial prior information. A mixing matrix is obtained using this frequency transfer function, and a separating matrix can be calculated from its inverse matrix. Theoretically, if this separation matrix is used and spatial prior information is used for signal separation, signals can be separated with high accuracy. However, when the analysis target frequencies of the source signals cover a wide band, or when the source signal positions are close to each other, the mixing matrix becomes a bad condition, and the separation matrix calculation accuracy deteriorates. At present, no method has been established to solve this problem and to perform signal separation with high accuracy using spatial prior information of signal waveforms.
本発明はこのような点に鑑みてなされたものであり、その目的は、分離信号と源信号到来方向を算定する到来方向別信号波形分離方法を提供することにある。 SUMMARY OF THE INVENTION The present invention has been made in view of these points, and its object is to provide a method for separating signal waveforms by direction of arrival for calculating the directions of arrival of separated signals and source signals.
複数の源信号が混在する環境において到来方向別に信号波形を分離し、源信号到来方向を推定することを目的とする。 The purpose is to separate the signal waveforms according to the direction of arrival in an environment where multiple source signals coexist, and to estimate the direction of arrival of the source signals.
上述した課題を解決し、高精度な信号分離と源信号到来方向推定を実現するために、本発明では、源信号空間事前情報(源信号到来方向事前情報)を用いて高精度に分離行列を算定することができる分離信号算定部と分離行列の算定誤差に影響されにくいクラスタリング部及び分離行列算定結果から源信号到来方向を推定する源信号到来方向算定部と算定精度が低い分離信号を補正する分離信号補正部を有することを特徴とする演算方法を提供することを目的とする。 In order to solve the above-described problems and achieve highly accurate signal separation and source signal arrival direction estimation, the present invention uses source signal space prior information (original signal arrival direction prior information) to create a separation matrix with high accuracy. A separated signal calculation section that can be calculated, a clustering section that is not easily affected by separation matrix calculation errors, and a source signal arrival direction calculation section that estimates the direction of arrival of the source signal from the separation matrix calculation result, and corrects separated signals with low calculation accuracy. It is an object of the present invention to provide a calculation method characterized by having a separation signal corrector.
本発明の方向別信号波形分離方法は、源信号到来方向が既知の周波数ビンにおいて、到来方向を事前情報として用いて分離行列算定精度を向上させることのできる分離信号算定部と、混合モデルとしてフォンミーゼス・フィッシャー分布を用いて、その確率密度関数を最大化することを目標として、信号基底ベクトルをクラスタリングするクラスタリング部と、周波数ビン・源信号ごとに分離行列(分離信号)の算定精度を評価し、周波数ビンごとの観測信号のパワースペクトル等の各周波数ビンの重要度指標と算定精度評価値を掛けた値を重み値として、全周波数ビンを対象に、周波数ビンごとの源信号到来方向の重み付き平均を取ることで、精度のよい方向推定結果を得ることのできる源信号到来方向算定部を有することを特徴とする。 The direction-specific signal waveform separation method of the present invention includes a separation signal calculation unit capable of improving the separation matrix calculation accuracy by using the direction of arrival as prior information in frequency bins where the direction of arrival of the source signal is known, Using the von Mises-Fisher distribution, with the goal of maximizing its probability density function, we evaluated the accuracy of the clustering unit that clusters the signal basis vectors and the calculation accuracy of the separation matrix (separation signal) for each frequency bin and source signal. , the value obtained by multiplying the importance index of each frequency bin such as the power spectrum of the observed signal for each frequency bin by the calculation accuracy evaluation value is used as a weight value, and the weight of the direction of arrival of the source signal for each frequency bin is obtained for all frequency bins. It is characterized by having a source signal direction-of-arrival direction calculation unit capable of obtaining a highly accurate direction estimation result by taking an average.
本特許の信号分離演算は、源信号の空間事前情報が得られている場合と得られていない場合とで、分離信号算定部で実施する演算をシステム内で選択的に変更し、空間事前情報が得られていない場合に、クラスタリング部及び源信号到来方向算定部及び分離信号補正部の演算を実施する。 In the signal separation calculation of this patent, the calculation performed by the separation signal calculation unit is selectively changed within the system depending on whether the spatial prior information of the source signal is obtained or not, and the spatial prior information is not obtained, the calculations of the clustering section, source signal direction-of-arrival calculating section, and separated signal correcting section are performed.
以下に図面を用いて、本発明に係る方向別信号分離演算の実施形態を説明する。図1は、到来方向別信号波形分離方法を実行する装置の概略図である。図1に示すように、本実施形態における方向別信号分離方法を実行するこの到来方向別信号波形分離装置では、マイク等を用いて信号を取得し、観測信号分離演算装置に信号データを送信する。観測信号分離演算装置では、観測信号から到来方向別の源信号波形とそれらの到来方向を推定する演算を実施し、その演算過程は、分離信号算定部、基底ベクトル算定部、クラスタリング部、源信号到来方向算定部、分離信号補正部より構成される観測信号分離演算装置で実施される演算により、源信号到来方向とそれに対応する源信号波形を得た後、その演算結果を汎用コンピュータ又は専用のソフトウェアを用いて表示する。 An embodiment of the direction-specific signal separation calculation according to the present invention will be described below with reference to the drawings. FIG. 1 is a schematic diagram of an apparatus for performing the direction-of-arrival signal waveform separation method. As shown in FIG. 1, in this direction-of-arrival signal waveform separation apparatus for executing the direction-specific signal separation method of the present embodiment, a signal is acquired using a microphone or the like, and signal data is transmitted to an observed signal separation arithmetic unit. . The observed signal separation calculation unit performs calculations for estimating the source signal waveforms for each direction of arrival and their directions of arrival from the observed signals. After obtaining the direction of arrival of the source signal and the corresponding source signal waveform by the calculations performed by the observed signal separation calculation device composed of the direction of arrival calculator and the separated signal corrector, the calculation results are transferred to a general-purpose computer or a dedicated device. Display using software.
図2は、本実施形態における方向別信号分離演算の中の観測信号分離演算装置で実行される演算フローである。図2に示すように、本実施形態における観測信号分離演算は、源信号の到来方向が事前にわかっている時とわかっていない時とで場合分けされる。源信号の到来方向が未知の時、分離信号算定部で観測信号を到来方向別の源信号波形へと分離し、基底ベクトル算定部で得られる波形特徴量をクラスタリング部でカテゴリ別に分類し、分離信号補正部で推定誤差の修正を行って源信号波形を推定すると同時に、源信号到来方向算定部でそれらの到来方向を推定する。源信号の空間情報が事前に得られている時は、分離信号算定部で源信号到来方向の事前情報を用いてより高精度に源信号を到来方向別に算定する。 FIG. 2 is a calculation flow executed by the observed signal separation calculation device in the direction-specific signal separation calculation in this embodiment. As shown in FIG. 2, the observation signal separation calculation in this embodiment is divided into cases when the direction of arrival of the source signal is known in advance and when it is not known. When the direction of arrival of the source signal is unknown, the separation signal calculator separates the observed signal into source signal waveforms for each direction of arrival. The signal corrector corrects the estimation error to estimate the source signal waveform, and at the same time, the source signal arrival direction calculator estimates their directions of arrival. When the spatial information of the source signals is obtained in advance, the separated signal calculating section calculates the source signals for each direction of arrival with higher accuracy using the prior information of the direction of arrival of the source signals.
〔信号波形取得部〕
信号波形取得部は2つ以上のマイクロフォンなどで構成される。信号波形を受信し、信号データを観測信号分離演算装置へ送る。[Signal Waveform Acquisition Unit]
The signal waveform acquisition unit is composed of two or more microphones or the like. It receives signal waveforms and sends signal data to an observed signal separation arithmetic unit.
〔観測信号分離演算装置における波形分離演算〕
以下に、観測信号分離演算装置で実施される波形分離演算の概要を示す。詳細は後ほど示す。[Waveform Separation Calculation in Observation Signal Separation Calculator]
An overview of the waveform separation calculation performed by the observation signal separation calculation device is given below. Details will be shown later.
〔分離信号算定部〕
受信センサで取得した波形データを周波数領域に変換し、続いて分離信号算定部にて分離行列を求める。分離行列の生成には、独立成分分析や独立低ランク行列分析などを用いる。これらの手法では、分離演算の出力の同時分布と周辺分布の積とのKL情報量を目的関数に設定し、目的関数が最小となるように、分離行列を更新して算定する。[Separation signal calculator]
The waveform data acquired by the receiving sensor is converted into the frequency domain, and then the separation matrix is obtained by the separation signal calculator. The separation matrix is generated using independent component analysis, independent low-rank matrix analysis, or the like. In these methods, the KL information amount of the product of the joint distribution and the marginal distribution of the output of the separation operation is set as the objective function, and the separation matrix is updated and calculated so as to minimize the objective function.
源信号の位置が目視で確認できる場合や事前に特定の周波数ビンに対してミュージック法等を適用して源信号到来方向を求めていた場合など、源信号到来方向が事前にわかっている場合もある。このように源信号到来方向が事前にわかっている時、事前情報を用いると高精度に源信号波形を推定することができる。源信号の空間事前情報が得られている場合の分離行列と分離信号の算定フローを図3に示す。まず源信号と観測センサ間の周波数伝達関数から得られる情報を用いて分離行列と源信号波形を概略的に算定する。図4には分離行列と源信号波形を概略的に推定する方法の一例をまとめていて、本特許の請求項2に記載の事項と対応する。概略的に算定した分離行列と源信号波形を用いて、分離行列と源信号波形を詳細推定する。この分離行列等の詳細推定方法は請求項3及び請求項4に記載の事項と対応する。以下で分離行列等の詳細推定方法を初めに説明する。 In some cases, the direction of arrival of the source signal is known in advance, such as when the position of the source signal can be visually confirmed, or when the direction of arrival of the source signal is obtained by applying the music method, etc. to a specific frequency bin in advance. be. Thus, when the source signal arrival direction is known in advance, the source signal waveform can be estimated with high accuracy by using the prior information. FIG. 3 shows the calculation flow of the separation matrix and separated signals when the spatial a priori information of the source signal is obtained. First, using the information obtained from the frequency transfer function between the source signal and the observed sensor, the separation matrix and the source signal waveform are roughly calculated. FIG. 4 summarizes an example of a method for roughly estimating the separation matrix and the source signal waveform, which corresponds to the matter described in
源信号到来方向が事前にわかっている場合に源信号を詳細推定する方法についてまとめる。混合信号から源信号波形を推定するための目的関数に対して、源信号到来方向の事前情報を制約条件として加えた値を新たに目的関数に設定し、この目的関数が最小となるように、分離行列を更新することで、高精度な信号分離を達成できる。混合信号から源信号波形を推定するための目的関数には、例えば分離演算の出力の同時分布と周辺分布の積とのKL情報量などがある。請求項3では源信号到来方向を事前情報とする制約条件の設定方法についてまとめている。源信号到来方向とセンサ配置位置が既知の時、式(9)を用いて、各センサから源信号までの周波数伝達関数を算定することができる。この周波数伝達関数をセンサ番号が行ベクトル、源信号番号が列ベクトルとなるように配置した行列は、混合行列といい、式(10)で定義される。混合行列が分離行列の逆行列であるという情報を制約条件として設定することが請求項3に記載の制約条件の特徴である。混合行列が分離行列の逆行列である時、分離行列と混合行列の積は、単位行列になる。このことは、同一の源信号番号を有する分離行列の行ベクトルと混合行列の列ベクトルの内積が1になり、異なる源信号番号を有する分離行列の行ベクトルと混合行列の列ベクトルの内積が0になることを意味する。そのため、式(41)に示す源信号到来方向に基づく制約条件では、上記の内積の値に対して制約をかけている。この分離行列の行ベクトルと混合行列の列ベクトルの内積に対する制約条件について請求項3では、記載している。グレーティングローブが可視領域に入らないようにするために、センサは、最小波長の半分以下となるように設置されるが、この条件を満たす時、混合行列は、傾向として低周波数になるほど悪条件になる。そのため、異なる源信号番号を有する分離行列の行ベクトルと混合行列の列ベクトルの内積が0になるという情報に基づく制約条件の強さを調整する。すなわち、混合行列が悪条件になるほど、源信号到来方向に基づく制約条件の強さが弱まるように、周波数ビンごとに係数を調整する。この係数の調整により、混合行列の信頼度が高い高周波数側において、分離行列と混合行列の積が、単位行列になるという源信号到来方向に基づく制約条件が重視される。この混合行列の信頼度は、センサ配置と信号の解析対称周波数帯域により異なるため、一概に低周波数で信頼度が落ちると断定することはできない。そのため、状況に応じて、混合行列の信頼度を評価し、式(42)の係数設定方法を変更することが望ましい。 This paper summarizes the method of estimating the source signal in detail when the direction of arrival of the source signal is known in advance. To the objective function for estimating the source signal waveform from the mixed signal, a value obtained by adding prior information of the source signal arrival direction as a constraint condition is newly set as the objective function, and this objective function is minimized by: By updating the separation matrix, highly accurate signal separation can be achieved. The objective function for estimating the source signal waveform from the mixed signal includes, for example, the KL information amount of the product of the joint distribution and marginal distribution of the output of the separation operation.
請求項3に記載の制約条件を用いるためには、源信号の分散の大きさを概略的に推定しておく必要がある。分散の推定方法は式(11)~式(36)にまとめている。周波数ビン・時間フレームごとの分散を推定するために、概略的に分離信号波形を求めた後、ウィナーマスクを用いて源信号の統計的分散を推定する。この概略的に分離信号波形を算定する方法が請求項2と対応し、具体的な算定手順は次のとおりである。源信号到来方向が既知の時、周波数伝達関数を列ベクトルに並べた混合行列が式(10)より求まる。この混合行列と観測信号が既知の条件において、分離信号の事後確率の対数尤度は、式(28)で表される。この事後確率を最大化する分離信号波形を式(29)に示すように、混合行列に正則化項を加えた行列の逆行列を観測信号に掛けることで算定する。請求項2では、周波数ビンfごとに分離信号の分散を定義して更新式を求めているが、源信号の分散は時間周波数点ごとに異なるとする表記σn(f,τ)や周波数ビン間で一定とする表記であるσn(τ)に変更することも可能で、そのような場合も本特許の請求範囲とする。請求項2に記載の分離信号算定方法は、それ自身で分離行列を算定し、算定結果を周波数領域又は時間領域で出力することも可能で、このような場合も本特許の請求範囲とする。In order to use the constraint of
源信号到来方向を事前情報として分離行列を算定する場合、その初期値の取り方が重要となる。源信号到来方向が既知の時、センサと源信号の位置関係から式(9)を用いて、周波数伝達関数を算定することができる。式(9)では、基準センサでの位相遅れを0となるようにして、基準センサを視点としているが、視点は任意の位置に設定してよい。この周波数伝達関数をセンサ番号が行ベクトル、源信号番号が列ベクトルとなるように配置することで、式(10)に示す混合行列が求まる。この混合行列を分離行列の初期値として、解探索を行うと効率的に最適解に至ることができる。又、源信号が互いに近接して存在する場合など、混合行列が悪条件の時は、目的関数に正則化項を加えてから混合行列のムーアペンローズの擬似逆行列を計算することで、安定した分離信号の解が得られる。この方法は、請求項2に記載の内容であり、式(32)を用いることで実現できる。目的関数を分離行列で偏微分して求まる目的関数の勾配降下方向に分離行列を繰り返し更新して最適解を探索する。このように、混合行列の逆行列又は目的関数に正則化項を加えた混合行列のムーアペンローズの擬似逆行列を分離行列の初期値として、分離行列を勾配法により繰り返し更新する手法を請求項4で記載している。 When the separation matrix is calculated using the direction of arrival of the source signal as a priori information, how to obtain the initial value is important. When the direction of arrival of the source signal is known, the frequency transfer function can be calculated using equation (9) from the positional relationship between the sensor and the source signal. In Equation (9), the phase delay at the reference sensor is set to 0 and the reference sensor is used as the viewpoint, but the viewpoint may be set at any position. By arranging this frequency transfer function so that the sensor number is a row vector and the source signal number is a column vector, the mixing matrix shown in Equation (10) is obtained. By using this mixing matrix as the initial value of the separation matrix and performing a solution search, the optimal solution can be reached efficiently. In addition, when the mixing matrix is ill-conditioned, such as when the source signals are close to each other, adding a regularization term to the objective function and then calculating the Moore-Penrose pseudo-inverse matrix of the mixing matrix stabilizes the A solution for the separated signals is obtained. This method is the content of
源信号到来方向を事前情報として分離行列を算定する場合、その初期値の取り方が重要となる。源信号到来方向が既知の時、センサと源信号の位置関係から式(9)を用いて、周波数伝達関数を算定することができる。式(9)では、基準センサでの位相遅れを0となるようにして、基準センサを視点としているが、視点は任意の位置に設定してよい。この周波数伝達関数をセンサ番号が行ベクトル、源信号番号が列ベクトルとなるように配置することで、式(10)に示す混合行列が求まる。この混合行列を分離行列の初期値として、解探索を行うと効率的に最適解に至ることができる。又、源信号が互いに近接して存在する場合など、混合行列が悪条件の時は、混合行列の2乗に正則化項を加えてから逆行列を計算することで、安定した分離信号の解が得られる。この方法は、請求項2に記載の内容であり、式(30)を用いることで実現できる。解の探索は目的関数を分離行列で偏微分して求まる勾配の降下方向に分離行列を繰り返し更新して行う。このように、混合行列の逆行列又は混合行列の2乗に正則化項を加えた行列の逆行列を分離行列の初期値として、分離行列を勾配法により繰り返し更新する手法を請求項4で記載している。 When the separation matrix is calculated using the direction of arrival of the source signal as a priori information, how to obtain the initial value is important. When the direction of arrival of the source signal is known, the frequency transfer function can be calculated using equation (9) from the positional relationship between the sensor and the source signal. In Equation (9), the phase delay at the reference sensor is set to 0 and the reference sensor is used as the viewpoint, but the viewpoint may be set at any position. By arranging this frequency transfer function so that the sensor number is a row vector and the source signal number is a column vector, the mixing matrix shown in Equation (10) is obtained. By using this mixing matrix as the initial value of the separation matrix and performing a solution search, the optimal solution can be reached efficiently. In addition, when the mixing matrix is ill-conditioned, such as when the source signals are close to each other, a stable separation signal solution can be obtained by adding a regularization term to the square of the mixing matrix and then calculating the inverse matrix. is obtained. This method is the content of
このように、制約条件を加えた目的関数の解空間は複雑化し、分離行列の更新が不安定化する傾向がある。そのため、請求項5に記載の方法で、解空間が複雑化した時に、安定的に分離行列を更新する方法を提案する。まず、分離行列の中を行ベクトルごと又は任意の範囲に区分けして、その1つ1つの範囲を行列ブロックと定義する。通常の独立成分分析では、分離行列の目的関数の勾配降下方向への更新量を学習率という定数パラメータを設定することで、予め決めておく。これに対して、提案方法では、行列ブロックごとに、分離行列の勾配降下方向への更新量を調整するために、学習率を更新する。そのために、式(47-1)と式(47-4)を用いて、行列ブロックごとに、現在のタイムステップまでの目的関数の勾配の2乗和の累積値と、分離行列の更新量の2乗和の累積値をそれぞれ算定する。現在のタイムステップにおける目的関数の勾配の2乗和の累積値と、1つ前のタイムステップにおける分離行列の更新量の2乗和の累積値を用いて、行列ブロックごとに、学習率を算定する。1つ前のタイムステップにおける分離行列の更新量に定数を掛けた値に対して、行列ブロックごとに求めた学習率を目的関数の勾配に掛けた値を加算することで、式(47-3)で、現在のタイムステップにおける分離行列の更新量を算定する。このように、式(47-1)と式(47-4)目的関数の勾配の二乗と分離行列更新量の二乗について移動平均をとり、それらの値を基に式(47-3)で勾配降下方向への更新量を調整するという一連の計算フローを繰り返すことで、最適な分離行列を求める。 In this way, the solution space of the objective function to which the constraint is added tends to be complicated, and the update of the separation matrix tends to be unstable. For this reason, we propose a method of stably updating the separation matrix when the solution space becomes complicated. First, the separation matrix is divided into row vectors or arbitrary ranges, and each range is defined as a matrix block. In normal independent component analysis, the update amount in the gradient descent direction of the objective function of the separation matrix is determined in advance by setting a constant parameter called learning rate. On the other hand, in the proposed method, the learning rate is updated for each matrix block in order to adjust the update amount of the separation matrix in the gradient descent direction. Therefore, using equations (47-1) and (47-4), for each matrix block, the cumulative value of the sum of squares of the gradients of the objective function up to the current time step and the update amount of the separation matrix are A cumulative value of the sum of squares is calculated respectively. Calculate the learning rate for each matrix block using the cumulative value of the sum of squares of the gradient of the objective function at the current time step and the cumulative value of the sum of squares of the update amount of the separation matrix at the previous time step. do. Formula (47-3 ) computes the update amount of the separation matrix at the current time step. In this way, the moving average is taken for the square of the gradient of the objective function of Equations (47-1) and (47-4) and the square of the separation matrix update amount, and based on these values, the gradient The optimum separation matrix is obtained by repeating a series of calculation flows for adjusting the update amount in the descending direction.
〔基底ベクトル算定部〕
分離行列を用いて波形データを分離する。又、分離行列又は信号における方向等の特徴量より基底ベクトルを算定する。[Base vector calculator]
A separation matrix is used to separate the waveform data. Also, a basis vector is calculated from a separation matrix or a feature amount such as direction in a signal.
〔クラスタリング部〕
基底ベクトルを同一の方向又は信号特徴量ごとにクラスタリングし、信号番号とクラスタ番号の対応付けを行う。クラスタごとに時間周波数点ごとの分離信号をまとめることで分離信号の時系列データを得る。[Clustering part]
The basis vectors are clustered in the same direction or for each signal feature amount, and the signal number and the cluster number are associated with each other. Time-series data of the separated signals are obtained by collecting the separated signals for each time-frequency point for each cluster.
まず、クラスタ算定で用いる概念や用語、変数の定義づけを行う。基底ベクトルの分布が独立なC個の確率密度関数の線形和で表される混合モデルを仮定する。本実施形態では、混合モデルの確率密度関数として、球面上の正規分布であり、方向データのみを持つ式(55)に示すフォンミーゼス・フィッシャー分布を使用する。C個の確率密度関数が有する未知パラメータの集まりをC個のモデルパラメータと定義し、c番目の分布に含まれるモデルパラメータの集まりを第cクラスタと呼ぶ。C個の確率密度関数の直列和で表される混合モデルにおいて、c番目の確率密度関数の重要度をクラスタの混合重みπc、全基底ベクトルの第cクラスタの平均方向μc周りのばらつきを方向集中度κcと定義する。又、周波数ビンf・源信号nの基底ベクトルが第cクラスタに所属する確率を帰属度ucn(f)と定義する。フォンミーゼス・フィッシャー分布の混合モデルでは、混合重みπc、方向集中度κc、平均方向μcの3種類がモデルパラメータと定義される。又、基底ベクトルのクラスタへの帰属度ucn(f)を用いて、各クラスタへの所属確率を表現する。この帰属度が補助関数と定義される。確率密度関数を対数化した値にモデルパラメータと補助関数に関する制約条件にラグランジュ乗数を掛けた値を加算して目的関数を設計する。この目的関数を最大化するモデルパラメータと補助関数の組み合わせが最適解となる。本実施形態では、目的関数を直接最大化する代わりに、補助関数とモデルパラメータの内、一方が既知という前提で固定して、他方に関して目的関数を最大化して、解を更新するステップを交互に繰り返すことで、目的関数が最大となる解を探索する。First, the concepts, terms, and variables used in cluster calculation are defined. Assume a mixed model in which the basis vector distribution is represented by a linear sum of C independent probability density functions. In this embodiment, the von Mises-Fischer distribution shown in Equation (55), which is a normal distribution on a sphere and has only directional data, is used as the probability density function of the mixture model. A group of unknown parameters possessed by C probability density functions is defined as C model parameters, and a group of model parameters included in the c-th distribution is called a c-th cluster. In a mixture model represented by a series sum of C probability density functions, the importance of the c-th probability density function is the mixture weight of the cluster π c , and the variation around the average direction μ c of the c-th cluster of all basis vectors is Define the degree of directional concentration κc . Also, the probability that the basis vector of frequency bin f and source signal n belongs to the c-th cluster is defined as the membership degree u cn (f). In the von Mises-Fischer distribution mixture model, three types of mixture weight π c , directional concentration κ c , and mean direction μ c are defined as model parameters. Also, the probability of belonging to each cluster is expressed using the degree of belonging to the cluster of basis vectors u cn (f). This degree of membership is defined as an auxiliary function. The objective function is designed by adding the logarithmized value of the probability density function to the value obtained by multiplying the constraint on the model parameters and the auxiliary function by the Lagrangian multiplier. The optimal solution is a combination of model parameters and auxiliary functions that maximizes this objective function. In this embodiment, instead of directly maximizing the objective function, we fix the assumption that one of the auxiliary function and the model parameters is known, maximize the objective function with respect to the other, and alternately update the solution. By iterating, the solution that maximizes the objective function is searched for.
図5及び図6は、基底ベクトルクラスタリングの計算フローである。本実施形態のクラスタ算定手順は、図5に示す初期クラスタリング部と図6に示すクラスタ決定部から成る。初期クラスタリング部では、補助関数(帰属度)を連続値として扱い、補助関数とモデルパラメータを交互に更新することで、目的関数が最大となる解を算定する。具体的な演算プロセスを説明する。補助関数とモデルパラメータの内、一方が既知という前提で固定して、他方に関して目的関数を偏微分して、解を更新するステップを交互に繰り返すことで、解を更新し、最適解を探索する。まずモデルパラメータが既知という条件の基で固定して、補助関数に関して目的関数を最大化することで、補助関数を更新する演算を実施する。次に補助関数が既知という条件の基で固定して、モデルパラメータを更新する演算を行う。これら2種類の演算を交互に繰り返すことで、最適解を探索する。モデルパラメータを更新する演算は、モデルパラメータの内、混合重みπc、平均方向μcに関してそれぞれ目的関数を偏微分して勾配がゼロとなる解を探索する演算と、方向集中度κcを近似式又は勾配法又は最尤推定法を用いて算定する演算により構成される。モデルパラメータの内、混合重みπcと平均方向μcを更新する演算を式(59)に示す。又、方向集中度を近似式と勾配法により算定する手順を式(60)~式(63)に示す。この方向集中度を求める演算方法は請求項8で記載されているため、後程詳しく述べる。方向集中度は、この他の近似式や最尤推定法を用いて算定することもできるが、請求項7に示すモデルパラメータの更新方法で混合重みと平均方向、帰属度を更新している場合は、請求項6に記載の範囲とする。式(58)~式(63)に示すモデルパラメータと補助変数の更新式は、基底ベクトルが周波数ビン・源信号の2次元構造を成す場合について示している。この周波数ビン・源信号の2次元構造のインデックスをもつ変数を更新する演算は、従来にはなかったパターンであり、新規性を主張できるポイントである。又、信号特徴量から求めた基底ベクトルをフォンミーゼス・フィッシャー分布によるクラスタ分析方法で同一源信号ごとにまとめるという試みはこれまでなされていない。更に各々の基底ベクトルに対して重みαn(f)を掛けて、基底ベクトルの重要度が互いに異なるケースに対応できるように拡張している点も従来にはない新たなクラスタ分析方法である。時間周波数点単位で信号特徴量等から基底ベクトルを求めてクラスタ分析する時は、式(58)~式(63)の更新式において、周波数ビンのインデックスを時間フレーム・周波数ビンへと拡張することで対応できる。そのため本特許の請求項6では主に、基底ベクトルが周波数ビン・源信号の2次元構造を成す場合と、時間フレーム・周波数ビン・源信号の3次元構造を成す場合との2パターンを想定している。5 and 6 are calculation flows of basis vector clustering. The cluster calculation procedure of this embodiment consists of an initial clustering section shown in FIG. 5 and a cluster determination section shown in FIG. The initial clustering unit treats the auxiliary function (degree of membership) as a continuous value, and alternately updates the auxiliary function and the model parameters to calculate the solution that maximizes the objective function. A specific calculation process will be described. Update the solution and search for the optimal solution by alternately repeating the steps of fixing one of the auxiliary function and model parameters as known, partially differentiating the objective function with respect to the other, and updating the solution. . First, the model parameters are fixed under the condition that they are known, and the objective function is maximized with respect to the auxiliary function, thereby executing an operation to update the auxiliary function. Next, the auxiliary function is fixed under the condition that it is known, and an operation is performed to update the model parameters. The optimum solution is searched for by alternately repeating these two kinds of calculations. The calculation for updating the model parameters includes the calculation for partially differentiating the objective function with respect to the mixture weight π c and the average direction μ c among the model parameters to search for a solution that makes the gradient zero, and the calculation for approximating the directional concentration κ c . It consists of a formula or an operation calculated using a gradient method or a maximum likelihood estimation method. Equation (59) shows the calculation for updating the mixture weight πc and the average direction μc among the model parameters. Also, the procedure for calculating the directional concentration degree by the approximation formula and the gradient method is shown in formulas (60) to (63). Since the calculation method for obtaining the directional concentration degree is described in claim 8, it will be described later in detail. The degree of concentration of directions can be calculated using other approximation formulas or maximum likelihood estimation methods. is within the scope of claim 6. Expressions (58) to (63) for updating the model parameters and auxiliary variables represent the case where the basis vectors form a two-dimensional structure of frequency bins and source signals. This operation of updating the variable with the index of the two-dimensional structure of the frequency bins and the source signal is a pattern that has not existed in the past, and is a point where novelty can be claimed. Also, no attempt has been made to collect basis vectors obtained from signal feature amounts for each same source signal by a cluster analysis method based on the von Mises-Fischer distribution. In addition, each basis vector is multiplied by a weight α n (f) to extend the method so that it can handle cases in which the importance of the basis vectors differs from each other. When cluster analysis is performed by obtaining base vectors from signal feature amounts and the like in units of time-frequency points, in the update formulas of formulas (58) to (63), the index of the frequency bin should be extended to the time frame/frequency bin. can be handled by Therefore, claim 6 of this patent mainly assumes two patterns: a case where basis vectors form a two-dimensional structure of frequency bins and source signals, and a case where basis vectors form a three-dimensional structure of time frames, frequency bins and source signals. ing.
これらの演算を繰り返すことで得られる初期クラスタリング部における最適解の内、モデルパラメータをクラスタ決定部の初期値に設定する。クラスタ決定部では、モデルパラメータの初期値を取得し、同じ周波数ビンに属する異なる源信号インデックスを有する基底ベクトルは、必ず異なるクラスタに属するという先見情報に基づく制約条件を設けながら、目的関数が最大となる解を探索する。クラスタ決定部では、目的関数が最大となる解を探索する際、補助関数(帰属度)を0又は1の離散値に限定する。すなわち、帰属度の算定において式(58)を用いず、代わりに、帰属度の値を0又は1の離散値に限定し、先見情報に基づく制約条件を設けながら、目的関数が最大となる帰属度の組み合わせを探索する。帰属度の組み合わせ探索において、総当たりで探索してもよいが、アルゴリズム1に示す集合分割の概念を用いると、解探索を効率化できる。このように、帰属度の値を0又は1に離散化した状態で、同じ周波数ビンに属する異なる源信号インデックスを有する基底ベクトルは、必ず異なるクラスタに属するという先見情報に基づく制約条件を設けながら、モデルパラメータと補助関数を交互更新する演算が本特許の請求項7と対応する。 Among the optimum solutions in the initial clustering section obtained by repeating these calculations, the model parameters are set to the initial values of the cluster determination section. In the cluster determination unit, the initial values of the model parameters are obtained, and while providing a constraint condition based on the foresight information that basis vectors with different source signal indices belonging to the same frequency bin always belong to different clusters, the objective function is determined to be the maximum. search for a solution. The cluster determination unit limits the auxiliary function (degree of membership) to discrete values of 0 or 1 when searching for a solution that maximizes the objective function. That is, instead of using equation (58) in calculating the degree of membership, the value of the degree of membership is limited to a discrete value of 0 or 1, and while setting constraints based on foresight information, the membership that maximizes the objective function Explore degree combinations. In the combination search of the degrees of membership, a brute-force search may be performed, but using the concept of set partitioning shown in Algorithm 1 makes the solution search more efficient. In this way, with the degree of membership discretized to 0 or 1, providing a constraint condition based on a priori information that basis vectors with different source signal indices belonging to the same frequency bin always belong to different clusters, An operation for alternately updating model parameters and auxiliary functions corresponds to claim 7 of this patent.
基底ベクトルクラスタリングにおいて方向集中度は、第1種変形ベッセル関数の中にも含まれているため、解析的には求まらない。そこで請求項8では、近似式と勾配法を用い、次の手順に従って、方向集中度を算定する方法を示している。まず式(58)により、階数の1つ異なる第1種変形ベッセル関数の比率を基底ベクトルと帰属度を用いて、概略的に算定する。この概略値に対して、階数の1つ異なる前記第1種変形ベッセル関数の比率を連分数に展開することで得られる式(61)又は式(63)の近似式を適用し、方向集中度の近似値を算定する。その後、方向集中度の近似値を階数の1つ異なる第1種変形ベッセル関数にそれぞれ代入して、階数の1つ異なる第1種変形ベッセル関数の比率の詳細値を算定する。第1種変形ベッセル関数の比率の詳細値を方向集中度の近似値で微分した値を式(61)又は式(63)により算定した後、第1種変形ベッセル関数の比率の詳細値と概略値の誤差を最小化することを目標として、ニュートン法を適用した式(62)により、方向集中度を更新する。更新した方向集中度を再度、階数の1つ異なる第1種変形ベッセル関数にそれぞれ代入して、階数の1つ異なる第1種変形ベッセル関数の比率の詳細値を更新する。更新した階数の1つ異なる第1種変形ベッセル関数の比率の詳細値を更新した方向集中度で微分した値を勾配とし、第1種変形ベッセル関数の比率の詳細値と概略値の誤差を最小化することを目標として、ニュートン法を適用することで求まる式(62)により、方向集中度を更新する。このニュートン法による方向集中度の更新演算を何度か繰り返すことで、精度良く方向集中度を推定できる。以上で述べた計算手順による方向集中度算定手順が本特許の請求項8に記載の内容と対応する。 In basis vector clustering, the degree of directional concentration is also included in the modified Bessel function of the first kind, so it cannot be obtained analytically. Therefore, in claim 8, a method of calculating the directional concentration degree using the approximation formula and the gradient method according to the following procedure is shown. First, the ratio of modified Bessel functions of the first kind with different ranks by one is roughly calculated using the basis vectors and the degree of membership according to the equation (58). To this approximate value, the approximation formula of formula (61) or formula (63) obtained by expanding the ratio of the modified Bessel function of the first kind different in rank by one to continued fractions is applied, and the direction concentration degree Calculate an approximation. After that, the approximate values of the directional concentration degrees are substituted into the modified Bessel functions of the first kind having different ranks by one, and the detailed values of the ratios of the modified Bessel functions of the first kind different in rank by one are calculated. After calculating the value obtained by differentiating the detailed value of the ratio of the modified Bessel function of the first kind by the approximate value of the degree of concentration of direction by the formula (61) or (63), the detailed value and the rough ratio of the modified Bessel function of the first kind With the goal of minimizing the error in the values, we update the directional convergence index according to equation (62) applying Newton's method. The updated directional convergence degrees are again substituted into the modified Bessel functions of the first kind that differ in rank by one, and the detailed values of the ratios of the modified Bessel functions of the first kind that differ in rank by one are updated. The gradient is the value obtained by differentiating the updated detailed value of the ratio of the modified Bessel function of the first kind with a different rank by one with the updated degree of directional concentration, and the error between the detailed value and the approximate value of the ratio of the modified Bessel function of the first kind is minimized. With the goal of achieving uniformity, the degree of directional concentration is updated by Equation (62) obtained by applying Newton's method. By repeating the update calculation of the directional concentration degree by the Newton method several times, the directional concentration degree can be estimated with high accuracy. The directional concentration degree calculation procedure according to the calculation procedure described above corresponds to the content of claim 8 of this patent.
このように、初期クラスタリング部及びクラスタ決定部における解の探索は、補助関数とモデルパラメータの内、一方が既知という前提で固定して、他方に関して最適な解を探索するステップを交互に繰り返す算定手順により行う。初期クラスタリング部の演算には、源信号数が多くなった等の理由で、補助関数とモデルパラメータの数が増えた時に、クラスタ決定部において、解が局所解に誤って収束するのを防ぐことができるという効果がある。但し、源信号数が少ない場合は乱数により、モデルパラメータの初期値を設定しても支障はなく、その場合は、クラスタ決定部の演算を単独で用いることもできる。これらの最適解探索過程において、方向集中度が第1種変形ベッセル関数の中に入り込んでいて算定に工夫を擁する。初期クラスタリング部では、方向集中度を全てのクラスタで一律とした近似式(63)を用いるのが望ましいのに対して、クラスタ決定部では、クラスタごとに方向集中度を定義した近似式(61)を用いるのが望ましい。 In this way, the search for solutions in the initial clustering section and the cluster determination section is a calculation procedure in which one of the auxiliary function and the model parameter is fixed on the assumption that one is known, and the step of searching for the optimum solution for the other is alternately repeated. done by In the calculation of the initial clustering part, when the number of auxiliary functions and model parameters increases due to the number of source signals, etc., the cluster determination part should prevent the solution from erroneously converging to a local solution. has the effect of being able to However, when the number of source signals is small, there is no problem even if the initial values of the model parameters are set by random numbers, and in that case, the calculation of the cluster determination section can be used alone. In these optimum solution search processes, the degree of concentration of directions is included in the modified Bessel function of the first kind, and the calculation requires some ingenuity. In the initial clustering unit, it is desirable to use the approximation formula (63) in which the directional concentration degree is uniform for all clusters. should be used.
〔源信号到来方向算定部〕
先ほどクラスタリングにより対応付けを行った信号番号とクラスタ番号の対応関係を用いて、各基底ベクトルから算定される信号の到来方向に対して、クラスタごとに全周波数ビンに対する重み付き平均を取ることで、全周波数点における源信号到来方向を得る。[Source signal direction-of-arrival calculation unit]
By taking a weighted average for all frequency bins for each cluster with respect to the direction of arrival of the signal calculated from each basis vector using the correspondence between the signal number and the cluster number that were previously associated by clustering, Obtain the direction of arrival of the source signal at all frequency points.
図7は、源信号到来方向算定の計算フローである。分離行列の逆行列を求め、その列ベクトルから式(8)を用いて、周波数ビン・源信号ごとの周波数伝達関数を求める。この源信号と観測点間の情報を含む周波数伝達関数の推定値とセンサの配置位置の情報から、センサ間の位相差に関する情報を基に導かれる式(74)を用いて、周波数ビン・源信号ごとの源信号到来方向を算定する。又、各周波数ビンにおける信号分離精度が低い信号の信号算定結果や源信号到来方向推定結果に及ぼす影響が少なくなるよう、式(71)により連続値マスクを算定する。信号番号とクラスタ番号の対応付け結果から式(75)によりマスク掛けした周波数ビン・源信号ごとの源信号到来方向の重み付き平均を求めることで、全周波数ビンにおける最終的な源信号到来方向を決定する。重み付き平均で用いる基底重みは、式(76)に示すように周波数ごとの観測値のパワースペクトルを指標とすることもできるが、どの周波数も同じ信頼度なら全て1とすることもできる。他にも基底重みとしては、信号部分空間の固有値の和を指標とすることもでき、この時近似的に反射せずに直接、観測点まで届いた到来波のパワーの総和をとっていることになる。 FIG. 7 is a calculation flow of source signal direction-of-arrival calculation. The inverse matrix of the separation matrix is obtained, and the frequency transfer function for each frequency bin and source signal is obtained from the column vector using Equation (8). From the estimated value of the frequency transfer function including the information between the source signal and the observation point and the information on the arrangement position of the sensor, using the equation (74) derived based on the information on the phase difference between the sensors, the frequency bin / source The direction of arrival of the source signal for each signal is calculated. Also, a continuous value mask is calculated by equation (71) so as to reduce the influence of signals with low signal separation accuracy in each frequency bin on the signal calculation result and source signal arrival direction estimation result. By obtaining the weighted average of the direction of arrival of the source signal for each frequency bin and source signal masked by Equation (75) from the result of associating the signal number and the cluster number, the final direction of arrival of the source signal in all frequency bins can be obtained. decide. The base weights used in weighted averaging can be indexed by the power spectrum of observed values for each frequency as shown in Equation (76), but can also be all 1 if all frequencies have the same reliability. Alternatively, the sum of the eigenvalues of the signal subspace can be used as an index for the base weight, and in this case, the sum of the power of the incoming waves that directly reach the observation point without being approximately reflected is taken. become.
〔分離信号出力部〕
信号波形分離部から源信号ごとに分離された信号情報を受け取り、波形の時系列データまたは周波数領域でのパワースペクトルの形式でモニターに表示する。表示した波形データは、消去若しくは保存をユーザの選択に応じて行う。又、源信号到来方向の推定結果を受け取り、事前にカメラで撮影した画像と重ね合わせることで、源信号到来方向をわかりやすく可視化する。分離波形データの表示や保存を行う装置及び源信号到来方向の推定結果を表示する装置には、汎用コンピュータを用いることもできるし、専用のハードウェアを用いることもできる。前者の場合には、汎用コンピュータのハードウェアとソフトウェアとが協働して構成される。[Separation signal output part]
The signal information separated for each source signal is received from the signal waveform separator and displayed on the monitor in the form of time-series data of waveforms or power spectra in the frequency domain. The displayed waveform data is erased or saved according to the user's selection. In addition, by receiving the estimation result of the direction of arrival of the source signal and superimposing it on the image captured by the camera in advance, the direction of arrival of the source signal can be visualized in an easy-to-understand manner. A general-purpose computer or dedicated hardware can be used for the device that displays and stores the separated waveform data and the device that displays the estimation result of the direction of arrival of the source signal. In the former case, general-purpose computer hardware and software are configured in cooperation.
以下に、本実施例における到来方向別源信号分離演算の具体的な演算手順を説明する。演算は、先ほど説明した通り、分離信号算定部、基底ベクトル算定部、クラスタリング部、源信号到来方向算定部に分かれており、算定プロセスごとに説明する。 A specific calculation procedure for the direction-of-arrival source signal separation calculation in this embodiment will be described below. As described above, the computation is divided into the separation signal calculation section, the basis vector calculation section, the clustering section, and the source signal arrival direction calculation section, and each calculation process will be described.
〔分離信号算定部〕
時間領域の源信号sn(t)、分離信号yn(t)、観測信号xm(t)の周波数領域での複素数成分をベクトル表現により次の式で表す。[Separation signal calculator]
Complex number components in the frequency domain of the source signal s n (t) in the time domain, the separated signal y n (t), and the observed signal x m (t) are represented by the following equations using vector representation.
時間領域の観測信号xm(τ)に対して窓の位置を少しずつ移動させながら、窓付きフーリエ変換を施し、時間周波数点ごとの観測データx(f,τ)を生成する。時間周波数点におけるx(f,τ)を分離行列により分離することで、源信号s(f,τ)の推定値である分離信号y(f,τ)を算定する。A windowed Fourier transform is applied to the observation signal x m (τ) in the time domain while gradually moving the position of the window to generate observation data x(f, τ) for each time-frequency point. Separating x(f, τ) at time-frequency points by the separation matrix yields the separated signal y(f, τ), which is an estimate of the source signal s(f, τ).
分離行列の算定方法としては、独立成分分析や独立低ランク行列分析など様々な方法を用いることができる。波形の事前情報がわからない時、例えば建物内での異音を対象とする場合や街中で騒音波形を方向別に取得したい場合は、独立成分分析が適している。一方、音楽信号や人の声のような低ランク構造をもつ音信号を方向別に分離する場合は、独立低ランク行列分析が適している。源信号到来方向に関する事前情報が得られていない場合においては、独立成分分析による分離行列の更新方法のみを示す。 Various methods such as independent component analysis and independent low-rank matrix analysis can be used to calculate the separation matrix. Independent component analysis is suitable when the prior information of the waveform is not known, for example, when dealing with abnormal noise in a building or when obtaining noise waveforms in different directions in a city. On the other hand, independent low-rank matrix analysis is suitable for separating sound signals with low-rank structures, such as music signals and human voices, by direction. Only the method of updating the separating matrix by independent component analysis is shown when prior information about the direction of arrival of the source signal is not obtained.
独立成分分析による分離行列は、目的信号の統計的な情報を元にした最適化手法を用いて求める。具体的には、式(3)で与えられる分離演算の出力の同時分布と周辺分布の積とのKL情報量を最小化する分離行列を、勾配法を用いて最急降下方向に解探索することで算定する。 A separation matrix by independent component analysis is obtained using an optimization method based on statistical information of the target signal. Specifically, the separation matrix that minimizes the KL information amount of the product of the joint distribution and the marginal distribution of the output of the separation operation given by Equation (3) is searched for in the steepest descent direction using the gradient method. Calculated by
源信号到来方向を得ることに特化した手法として、ミュージック法がある。もし、ミュージック法を適用できる条件が揃っていれば、ある特定の周波数ビンにおける源信号到来方向の組み合わせを知ることができる。又、物理的に源信号位置がわかっている時もある。このように、ある特定の周波数ビンにおいて、源信号到来方向が既知の時にその事前情報を利用することで、信号分離精度向上を図る手法を提案する。この手法を信号分離演算の中にオプションとして組み入れることで、システム内で選択的に用いることができるようにする。 There is a music method as a method specialized in obtaining the direction of arrival of the source signal. If the conditions for applying the music method are met, the combination of source signal arrival directions in a specific frequency bin can be known. Also, there are times when the source signal position is physically known. In this way, we propose a method of improving signal separation accuracy by using prior information when the direction of arrival of the source signal is known at a specific frequency bin. By incorporating this technique as an option in the signal separation operation, it can be selectively used in the system.
基準となるセンサの番号M′を観測点番号1~Mから選択する。以降、このセンサ番号を有するセンサを基準センサと称す。信号伝達モデルとして遠距離場モデルを仮定すると、観測点間での源信号からの距離の差はそれぞれの観測点と源信号との距離に比べて十分に小さいため、観測点間での到来波の振幅減衰の差は微小になり無視できる。このことを考慮して、源信号からセンサに到達するまでの減衰の影響を無視し、源信号と観測点との位置関係及び周波数ビンfにおける到来波の波長λ(f)をパラメータとして式(8)により周波数伝達関数を近似する。 A reference sensor number M' is selected from observation point numbers 1-M. A sensor having this sensor number is hereinafter referred to as a reference sensor. Assuming a far-field model as the signal transfer model, the difference in distance from the source signal between observation points is sufficiently small compared to the distance between each observation point and the source signal, so the arrival wave between observation points is The difference in amplitude attenuation of is very small and can be ignored. Considering this, the influence of attenuation from the source signal to the sensor is ignored, and the positional relationship between the source signal and the observation point and the wavelength λ(f) of the arriving wave at the frequency bin f are used as parameters in the equation ( 8) approximates the frequency transfer function.
N個の源信号の内、N’個の源信号到来方向が事前情報としてわかっている場合を考える。源信号到来方向が既知の時、センサ間の遅延差を基に式(9)により周波数伝達関数を算定する。センサM’を基準に空間事前情報が得られている源信号に対応する周波数伝達関数を縦方向に並べたM次元アレイマニフォールドベクトルを式(10-2)で定義する。混合系が線形時不変であり、時間周波数領域での複素瞬時混合で表現できると仮定すると、アレイマニフォールドベクトルを用いて、M×N’次元複素混合行列A(f)を式(10-1)で定義できる。 Consider a case in which the directions of arrival of N' source signals out of N source signals are known as a priori information. When the direction of arrival of the source signal is known, the frequency transfer function is calculated by equation (9) based on the delay difference between the sensors. Equation (10-2) defines an M-dimensional array manifold vector in which frequency transfer functions corresponding to source signals for which spatial prior information is obtained are arranged in the vertical direction with reference to sensor M'. Assuming that the mixing system is linearly time-invariant and can be represented by complex instantaneous mixing in the time-frequency domain, the array manifold vector is used to convert the M×N′-dimensional complex mixing matrix A(f) into Equation (10-1) can be defined by
もし源信号から各センサまでの周波数伝達関数を誤差なく算定できるならば、それらを基に作成した混合行列の逆行列を分離行列として分離信号を算定できる。しかし源信号到来方向の観測誤差が生じた時、混合行列は悪条件な方程式で成り立っているので、僅かな誤差が結果に大きな影響を与える。又、遠距離場においてセンサから源信号位置までの距離を正確に測定することは困難なので、信号振幅の減衰の影響を無視して式(9)により周波数伝達関数を基準センサからの相対値で近似している。そのため、混合行列の逆行列を用いると分離波形には必ず誤差が含まれることになる。 If the frequency transfer function from the source signal to each sensor can be calculated without error, the separated signals can be calculated by using the inverse matrix of the mixing matrix created based on them as the separating matrix. However, when there is an observation error in the direction of arrival of the source signal, the mixing matrix consists of ill-conditioned equations, so even a small error has a large effect on the result. Also, since it is difficult to accurately measure the distance from the sensor to the position of the source signal in the far field, the frequency transfer function can be expressed as a relative value from the reference sensor by equation (9), ignoring the effect of signal amplitude attenuation. approximate. Therefore, if the inverse matrix of the mixing matrix is used, the separated waveforms will always include errors.
まず初めに、N=N’すなわち全ての源源信号到来方向が事前にわかっている場合において、源信号の統計的分散を算定し、到来方向の情報に加えることで、分離信号を算定する方法をまとめる。 First of all, when N=N', that is, the direction of arrival of all source signals is known in advance, the statistical variance of the source signals is calculated and added to the direction of arrival information to calculate the separated signals. Summarize.
源信号到来方向が既知の時に、到来方向を事前情報として用いて、分離信号を簡易的に算定することを試みる。源信号が混合した状態で、観測信号としてセンサにて受信される場合を考える。この時、周波数領域での混合モデルは以下で表せる。 When the direction of arrival of the source signal is known, we attempt to simply calculate the separated signals using the direction of arrival as prior information. Consider the case where the source signals are mixed and received by the sensor as the observed signal. At this time, the mixture model in the frequency domain can be expressed as follows.
まず源信号の分散として式(12)に示す観測信号の相関行列の固有値から求めた値を用いる。源信号数が観測センサ数よりも多い過完備基底の条件では、固有値分解ができないため、源信号の分散構造に対する事前情報が得られない。そのような場合、源信号の分散は全て1とするとよい。雑音分散の初期値は、式(30)により求める。次に、式(29)と式(30)を交互に計算して、分離信号の値と雑音分散の値を交互に更新する。この交互演算を全周波数ビンにおける雑音の分散の変化が小さくなるまで行う。この交互演算が収束した時の分離信号がその事後確率を最大化する最適解となる。
First, the value obtained from the eigenvalue of the correlation matrix of the observed signal shown in Equation (12) is used as the variance of the source signal. Under the condition of an overcomplete basis in which the number of source signals is greater than the number of observed sensors, eigenvalue decomposition cannot be performed, and prior information on the distributed structure of the source signals cannot be obtained. In such a case, the variance of the source signal should be all unity. The initial value of the noise variance is obtained by Equation (30). Equations (29) and (30) are then alternately calculated to alternately update the value of the separated signal and the value of the noise variance. This alternating operation is performed until the change in noise variance in all frequency bins becomes small. The separated signal when this alternating operation converges becomes the optimum solution that maximizes the posterior probability.
更新が完了したら分離行列の逆行列に相当する次式により振幅補正を行う。これまで説明した演算による分離信号算定方法は、計算量が少なく高速である一方、源信号波形が実際よりも疎構造になる傾向がある。しかし、パワースペクトル形状の特徴をよく捉えることができる点や計算の簡易さを考慮すると、実用的と考えられる。 After the update is completed, amplitude correction is performed using the following equation, which corresponds to the inverse matrix of the separation matrix. The method of calculating separated signals by arithmetic operations described so far has a small amount of calculation and is fast, but the source signal waveform tends to have a sparse structure than it actually is. However, considering the fact that the characteristics of the power spectrum shape can be well captured and the simplicity of calculation, it is considered practical.
この他にも分離行列の概算的な求め方には様々な方法が考えられる。最も簡易な求め方は、到来方向が既知の源信号のみセンサ間の遅れが補償されるように、基準センサと源信号間での周波数伝達関数を求め、その周波数伝達関数を源信号ごとに並べたベクトルhn(f)の複素共役ベクトルを列ベクトルに並べた行列を分離行列とする方法である(式(33-1))。この方法は混合行列が悪条件で、逆行列が精度よく算定できない時や到来方向が既知の信号源数N’が全ての信号源数Nよりも少ない時に用いるとよい。又、混合行列のムーアペンローズの擬似逆行列を分離行列とする方法も考えられる(式(33-2))。この方法は、高周波数帯域などの混合行列の逆行列が精度よく算定できる時に用いるとよい。請求項4ではこれら分離行列の初期値の求め方についてまとめている。In addition to this, various methods are conceivable for roughly obtaining the separation matrix. The simplest method is to find the frequency transfer function between the reference sensor and the source signal so that the inter-sensor delay is compensated only for the source signal whose direction of arrival is known, and arrange the frequency transfer functions for each source signal. In this method, a matrix obtained by arranging the complex conjugate vectors of the vector h n (f) arranged in column vectors is used as a separating matrix (equation (33-1)). This method should be used when the mixing matrix is ill-conditioned and the inverse matrix cannot be accurately calculated, or when the number of signal sources N′ whose arrival directions are known is smaller than the total number of signal sources N. A method of using the Moore-Penrose pseudo-inverse matrix of the mixing matrix as the separating matrix is also conceivable (equation (33-2)). This method should be used when the inverse matrix of the mixing matrix can be accurately calculated for high frequency bands. Claim 4 summarizes how to obtain the initial values of these separation matrices.
Ipはp次元単位行列である。源信号が楽器音や音声のような明確な周波数構造をもつ場合、統計的分散を源信号到来方向の事前情報を正則化項として加えることで更新し、より精度よく分離行列と分離信号を算定することができる。その方法を以降、まとめる。まずこれまで示した概略算定方法により算定される分離行列を用いて、分離信号を算定する。分離信号がMNMF(非特許文献13)の信号源モデルに従うと仮定した場合、分離信号のパワースペクトルが期待値の意味で保存されるため、ウィナーマスクMn (G)(f,τ)は次の式で設計できる。I p is the p-dimensional identity matrix. When the source signal has a clear frequency structure such as an instrumental sound or voice, the statistical variance is updated by adding the prior information of the direction of arrival of the source signal as a regularization term, and the separation matrix and the separated signal are calculated more accurately. can do. The method is summarized below. First, separated signals are calculated using the separation matrix calculated by the rough calculation method shown so far. Assuming that the separated signals follow the signal source model of MNMF (Non-Patent Document 13), the power spectrum of the separated signals is preserved in the sense of the expected value, so the Wiener mask M n (G) (f, τ) is can be designed by the formula
源信号到来方向の事前情報を目的関数に制約条件として付加することで、信号分離を高精度に行う手法ついてまとめる。MNMFでは、源信号が多変量複素ガウス分布に従うと仮定した時の多チャネル観測信号の生成モデル(非特許文献13、非特許文献15)に基づく目的関数が用いられる。この目的関数は、ガウス分布に従う源信号分散及びセンサと源信号間の周波数伝達関数が既知の条件における源信号の事後確率と等価である。提案手法では、MNMFの目的関数に対して、空間相関行列をランク1行列で近似することで得られる目的関数LMNMFに、源信号到来方向に関する制約条件LS(W(f))を加えた目的関数LL(W(f))を定義する。このランク1行列で近似した目的関数LMNMFは独立低ランク行列分析(非特許文献14)で用いられている。This paper summarizes a technique for highly accurate signal separation by adding a priori information on the direction of arrival of the source signal as a constraint to the objective function. MNMF uses an objective function based on a multichannel observed signal generation model (Non-Patent Documents 13 and 15) assuming that the source signal follows a multivariate complex Gaussian distribution. This objective function is equivalent to the posterior probability of the source signal under the condition that the Gaussian distributed source signal variance and the frequency transfer function between the sensor and the source signal are known. In the proposed method, the objective function of the MNMF is obtained by approximating the spatial correlation matrix with a rank-1 matrix, and the constraint condition LS (W(f)) regarding the direction of arrival of the source signal is added to the objective function L MNMF . Define a function LL(W(f)). The objective function L MNMF approximated by this rank-1 matrix is used in independent low-rank matrix analysis (Non-Patent Document 14).
式(44)の正則化項を目的関数に加えると、解空間が複雑になり、自然勾配法による最急降下法に基づく分離行列の更新では、局所解に陥ったり、計算が不安定になって発散したりする。そこで、請求項5に記載の新たな分離行列更新手法を提案する。前回の分離行列の更新方向を慣性項として勾配降下方向に加えると共に、勾配降下方向への移動量を調整することで、急激な更新方向の変化を抑制し、分離行列の更新を安定化させることを試みる。分離行列は、行ベクトルなどの行列ブロックごとに更新する。式(37)に示す目的関数を分離行列の複素共役で偏微分した値の方向から勾配降下方向を求め、分離行列を更新する。行列をいくつかの行列ブロックに分解して、行列ブロックごとに解を更新する。以下、同一の源信号番号ごとに行列ブロックを区切った場合、すなわち行列ブロックとして分離行列の行ベクトルを定義する場合について考える。 Adding the regularization term of Equation (44) to the objective function complicates the solution space, and updating the separation matrix based on the steepest descent method by the natural gradient method may result in local solutions or unstable calculation. Diverge. Therefore, a new separation matrix update method according to claim 5 is proposed. By adding the previous update direction of the separation matrix as an inertia term to the direction of gradient descent and adjusting the amount of movement in the direction of gradient descent, abrupt changes in the direction of update are suppressed and the update of the separation matrix is stabilized. try. The separation matrix is updated for each matrix block such as row vector. The gradient descent direction is obtained from the direction of the value obtained by partially differentiating the objective function shown in Equation (37) with the complex conjugate of the separation matrix, and the separation matrix is updated. Decompose the matrix into several matrix blocks and update the solution for each matrix block. In the following, consider the case where the matrix blocks are partitioned by the same source signal number, that is, the case where the row vectors of the separation matrix are defined as matrix blocks.
局所解への誤った収束を防ぐために、行列ブロックごとに、目的関数の勾配に1つ前のタイムステップの分離行列の更新量を定数倍し、慣性項として加える。この慣性項により例えば、解の探索領域に深い谷があるようなケースでも容易に谷から脱出できるため、局所解に陥りづらくなる。さらに、計算の安定化を図るために、目的関数勾配と過去の分離行列更新量をそれぞれ二乗移動平均することで、学習率を調整する。具体的には、目的関数の勾配の二乗和を累積させた値が大きい時に更新量が小さくなり、小さい時に更新量が大きくなるように、さらに1つ前のタイムステップまでの分離行列の更新量の二乗和を累積させた値が大きい時に更新量が大きくなり、小さい時に更新量が小さくなるように調整する。このように分離行列の更新量を調整することは、独立成分分析で用いられる自然勾配法の更新式における学習率を解空間の形状に応じて自動で調整することと等価であり、計算の安定化に繋がる。具体的には、次の式で分離行列更新する。 In order to prevent erroneous convergence to a local solution, for each matrix block, the gradient of the objective function is multiplied by the update amount of the separation matrix at the previous time step and added as an inertia term. Due to this inertia term, for example, even in a case where there is a deep valley in the solution search area, it is possible to easily escape from the valley, making it difficult to fall into a local optimum. Furthermore, in order to stabilize the calculation, the learning rate is adjusted by taking the squared moving average of the objective function gradient and the past separation matrix update amount. Specifically, when the accumulated value of the sum of squares of the gradients of the objective function is large, the update amount is small, and when it is small, the update amount is large. When the accumulated sum of squares of is large, the update amount is large, and when it is small, the update amount is small. Adjusting the update amount of the separation matrix in this way is equivalent to automatically adjusting the learning rate in the update formula of the natural gradient method used in independent component analysis according to the shape of the solution space. lead to transformation. Specifically, the separation matrix is updated by the following formula.
分離行列の更新演算が収束したら、次に源信号の統計的分散を更新する。源信号の統計的分散σn(f,τ)の周波数スペクトルをtb(f)により近似し、その時変な励起パターンをγb(τ)を用いて再現する。源信号間のスペクトルのランクが大きく異なることを想定し、分割関数βnbを用いてB本の基底をN個の源信号に振り分けて、源信号分散を低ランク近似する。分離信号と源信号の統計的分散の誤差評価指標に板倉斎藤擬距離を用いた非負値行列因子分解(ISNMF)(非特許文献16)による分散の更新は、補助関数法に基づく次の乗算型更新式(非特許文献17)により行われる。After the separation matrix update operation has converged, the statistical variance of the source signal is then updated. The frequency spectrum of the source signal's statistical variance σ n (f, τ) is approximated by t b (f) and its time-varying excitation pattern is reconstructed with γ b (τ). Assuming that the ranks of the spectra between the source signals differ greatly, we divide the B bases into the N source signals using a partitioning function β nb to obtain a low-rank approximation of the source signal variance. The variance is updated by non-negative matrix factorization (ISNMF) (Non-Patent Document 16) using Itakura-Saito pseudorange as an error evaluation index of the statistical variance of the separated signal and the source signal. It is performed by an update formula (Non-Patent Document 17).
式(41)で求まる源信号空間情報に基づく正則化項の勾配と式(35)又は式(36)で求めた源信号分散の初期値を用いて、式(39)により目的関数の勾配を求める。源信号空間情報から式(33)により求まる分離行列を初期値として、式(47)により分離行列と分離信号を更新する。更新した分離行列と分離信号を用いて、式(39)と式(41)による目的関数勾配の算定と式(47)による分離行列更新を繰り返す。繰り返しインデックスlがL回に達したら分離行列の更新を終了し、源信号の統計的分散更新に移る。式(48)を用いて源信号の統計的分散を更新する。統計的分散は、初回更新時(cycle=1)には3回程度反復更新し、それ以降(cycle≧2)は、1回ずつ更新する。分離行列と統計的分散の更新という2段階の更新を交互に繰り返すことで、信号分離を行う。交互計算を何回繰り返すか事前に決めておいて、繰り返し計算が進むにつれて正則化項の値を小さくしていく。 Using the gradient of the regularization term based on the source signal spatial information obtained by Equation (41) and the initial value of the source signal variance obtained by Equation (35) or (36), the gradient of the objective function is calculated by Equation (39). Ask. Using the separation matrix obtained from the source signal space information by the equation (33) as an initial value, the separation matrix and the separated signals are updated by the equation (47). Using the updated separation matrix and separation signal, the calculation of the objective function gradient by Equations (39) and (41) and the update of the separation matrix by Equation (47) are repeated. When the iteration index l reaches L times, the update of the separation matrix is finished, and the update of the statistical variance of the source signal is started. Update the statistical variance of the source signal using equation (48). The statistical distribution is updated repeatedly about three times at the initial update (cycle=1), and updated once thereafter (cycle≧2). Signal separation is performed by alternately repeating a two-step update of the separation matrix and the update of the statistical variance. The number of iterations of alternating computation is determined in advance, and the value of the regularization term is decreased as the iteration progresses.
これまで説明したLMNMFに源信号空間事前情報に関する制約条件LS(W(f))を加えた目的関数LL(W(f))を最小化する分離行列の算定フローを以下にまとめる。
a.初期値設定
繰り返しインデックス(上付括弧文字)をcycle=1,l=1と初期化する。各インデックスの更新回数CYCLE及びLを予め決めておく。式(32)~式(36)により、それぞれ分離行列と源信号分散の初期値を設定する。分離行列更新パラメータを次の式で初期化する。
b.目的関数の勾配算定
分離信号と源信号分散及び式(41)で求まる源信号空間情報に基づく正則化項の勾配を用いて、式(39)により目的関数の勾配を求める。
c.分離行列の更新
式(47)で分離行列と分離信号を更新する。繰り返しインデックスlがL回に達していなければ、lを1つ増やしてステップbに戻る。lがL回に達したら、次の式で分離行列更新の際に用いる変数の初期値を設定し、繰り返しインデックスlを1に初期化して源信号分散の更新に移る。
d.源信号分散の更新
式(48)で源信号分散を更新する。初回更新時(cycle=1)には3回程度反復更新し、それ以降の更新時(cycle≧2)には、1回ずつ更新する。
e.収束判定
繰り返しインデックスcycleを1つ増やす。この時、cycle≦CYCLEならばステップbに戻る。The separation matrix calculation flow for minimizing the objective function LL(W(f)) obtained by adding the constraint condition LS(W(f)) regarding the source signal space prior information to the LMNMF described above is summarized below.
a. Initial value setting Initialize the repetition index (superscript parenthesis character) as cycle=1, l=1. The number of updates CYCLE and L of each index is determined in advance. Initial values of the separation matrix and the source signal variance are set by the equations (32) to (36), respectively. Initialize the separation matrix update parameters with the following formula.
b. Gradient Calculation of Objective Function The gradient of the objective function is determined by Equation (39) using the gradient of the regularization term based on the separation signal and source signal variance and the source signal spatial information determined by Equation (41).
c. Updating Separation Matrix The separation matrix and the separated signal are updated by Equation (47). If the iteration index l has not reached L times, increase l by one and return to step b. When l reaches L times, the initial values of the variables used in updating the separation matrix are set according to the following equation, the iteration index l is initialized to 1, and the source signal variance is updated.
d. Update Source Signal Variance Update the source signal variance with equation (48). At the time of the first update (cycle=1), the update is repeated about three times, and at the time of subsequent updates (cycle≧2), the update is performed once.
e. Convergence judgment Increase the repetition index cycle by one. At this time, if cycle≤CYCLE, the process returns to step b.
ステップcの分離行列更新に際して、交互反復回数cycleが総反復回数CYCLEの半分を超えて、正則化項が0になった後は、式(37)に示す目的関数が通常のMNMFと同じになり、その解空間が単純形状となる。そのため、正則化項が0になった後は、反復射影法(非特許文献18)を適用して高速かつ安定に分離行列を更新することも可能となる。このような場合でも正則化項が0になるまでの間に請求項3に記載の正則化項を目的関数に加えている場合や、請求項4に記載の分離行列初期値を用いている場合、請求項5に記載の分離行列更新方法を適用している場合は、本特許の請求範囲とみなす。 When updating the separation matrix in step c, after the number of alternate iterations cycle exceeds half of the total number of iterations CYCLE and the regularization term becomes 0, the objective function shown in Equation (37) becomes the same as the normal MNMF. , its solution space becomes a simple shape. Therefore, after the regularization term becomes 0, it becomes possible to update the separation matrix quickly and stably by applying the iterative projection method (Non-Patent Document 18). Even in such a case, when the regularization term according to
〔基底ベクトル算定部〕
源信号到来方向が既知でない場合、上記分離信号算定部により算定される分離信号の複素ベクトルy(f,τ)の振幅は一意に定まらず、不定性が残る。そのため、全ての周波数成分から逆フーリエ変換により時間領域の信号を再構成する際に、周波数ひずみが生じる。そこで分離行列の逆行列をW(f)に乗算することで、M’番目のセンサ対応する分離行列W(S)(f)を求める。[Base vector calculator]
If the direction of arrival of the source signal is not known, the amplitude of the complex vector y(f, τ) of the separated signal calculated by the separated signal calculator is not uniquely determined, and remains indefinite. Therefore, frequency distortion occurs when reconstructing a time domain signal from all frequency components by inverse Fourier transform. Therefore, by multiplying W(f) by the inverse matrix of the separation matrix, the separation matrix W (S) (f) corresponding to the M'-th sensor is obtained.
前項で算定した分離信号には、n番目の源信号インデックスを有する分離信号が必ずしもn番目の源信号に対応しないという交換の不定性という課題が存在する。周波数ビンごとの分離信号における交換の不定性を解決する方法としては、源信号の特徴量を用いて基底ベクトルを構成する手法と、分離行列に含まれる源信号到来方向の情報を用いて基底ベクトルを構成する手法とが考えられる。この内、後者の手法のみを示す。 The isolated signals calculated in the previous section suffer from the problem of commutation ambiguity that the isolated signal with the nth source signal index does not necessarily correspond to the nth source signal. As a method to solve the ambiguity of the exchange in separated signals for each frequency bin, there is a method of constructing basis vectors using the feature values of the source signals, and a method of constructing basis vectors using information on the direction of arrival of the source signals contained in the separation matrix. can be considered as a method of configuring Of these, only the latter method is shown.
〔クラスタリング部〕
第cクラスタにおける未知パラメータの集まりθc(以降、モデルパラメータと称する)が既知の基での、M次元基底ベクトルの条件付確率Pr(vn(f)|θc)を考える。この時、ベイズの定理より、第cクラスタの重要度を表す混合重みπcと基底ベクトルの信頼度を表す重みαn(f)を用いて、基底ベクトルが与えられた条件下でのモデルパラメータの条件付確率の重み付き対数尤度LCは次の式で定義される。[Clustering part]
Consider the conditional probability Pr(v n (f)|θ c ) of the M-dimensional basis vectors in the group where the set of unknown parameters θ c (hereinafter referred to as model parameters) in the c-th cluster is known. At this time, according to Bayes ' theorem , the model parameter The weighted log-likelihood LC of the conditional probability of is defined as follows.
以降、混合モデルとしてフォンミーゼス・フィッシャー分布を仮定して、式展開する。この時、確率密度関数は次の式で与えられる。 In the following, we assume the von Mises-Fischer distribution as a mixture model and expand the formula. At this time, the probability density function is given by the following equation.
混合重みと帰属度の変域を考慮しつつ、平均方向が規格化条件を満たすように制約を与えつつ、式(55)の右辺を最大化するために、次のような最適条件を定義する。 In order to maximize the right-hand side of Equation (55) while constraining the average direction to satisfy the normalization condition while considering the domain of mixture weights and degrees of membership, we define the following optimal conditions: .
式(57)の目的関数に3種類の等式制約をラグランジュ変数により課した後、帰属度ucn(f)で偏微分して極値を求めることで、式(58)を導出できる。Equation (58) can be derived by imposing three types of equality constraints on the objective function of Equation (57) using Lagrangian variables and then partially differentiating with the membership degree u cn (f) to obtain the extreme value.
基底ベクトルの方向集中度は、第1種変形ベッセル関数の中に入り込んでいるため、算定式として値を得ることはできない。そこで、階数の一つ異なる第1種変形ベッセル関数の比率を定義する。 Since the degree of directional concentration of basis vectors is included in the modified Bessel function of the first kind, the value cannot be obtained as a calculation formula. Therefore, the ratio of modified Bessel functions of the first kind with different orders is defined.
基底重みαn(f)は、基底ベクトルの信頼度に基づいて算定される値で様々な求め方が考えられるが、後程、式(71)で定義する連続値マスクMn(f)をそのまま基底重みとして、用いるのが最も簡便と考えられる。The base weight α n (f) is a value calculated based on the reliability of the base vector and can be obtained in various ways. It is considered to be the simplest to use it as a base weight.
源信号の数が未知の時、最適なクラスタ数を求めることで、源信号の数を推定する。最適なクラスタ数は、次の手順で決定する。まずクラスタ数Cを何パターンか設定して式(58)~式(63)の繰り返し計算によりクラスタ分析する。その結果を式(64)により評価し、評価指標EVを最小とするクラスタ数が最適であるとする。 When the number of source signals is unknown, the number of source signals is estimated by finding the optimal number of clusters. The optimal number of clusters is determined by the following procedure. First, several patterns of the number of clusters C are set, and cluster analysis is performed by repeated calculation of equations (58) to (63). The result is evaluated by equation (64), and the number of clusters that minimizes the evaluation index EV is assumed to be optimal.
式(58)~式(63)の更新式で得られる帰属度とモデルパラメータの算定結果を基に、同じ周波数ビンの異なる信号番号を有する基底ベクトル(分離信号)は同じクラスタに属さないという制約を加えながら、クラスタ分割を詳細に行う。従来、このクラスタ分割は評価値を設定し、その値が最良となる基底ベクトルの交換の組み合わせを総当たりで探索していた。しかし、この方法では、源信号の数が増えた時に、探索の組み合わせが多くなり、計算に時間がかかるという課題がある。そこで、最適解探索の範囲を限定することで、高速にクラスタリングする方法を提案する。源信号の数が多くなった時に、クラスタが局所解に収束するのを防ぐために、帰属度とモデルパラメータの初期値として式(58)~式(63)の更新式で得られる値を用いる。 Restriction that basis vectors (separated signals) having different signal numbers in the same frequency bin do not belong to the same cluster based on the calculation results of the degree of membership and the model parameters obtained by the update formulas of formulas (58) to (63). While adding , the cluster division is performed in detail. Conventionally, in this cluster division, an evaluation value is set, and a round-robin search is performed for a combination of base vector exchanges that gives the best value. However, this method has the problem that when the number of source signals increases, the number of search combinations increases and the calculation takes a long time. Therefore, we propose a high-speed clustering method by limiting the range of optimal solution search. In order to prevent clusters from converging to a local solution when the number of source signals increases, values obtained by updating formulas (58) to (63) are used as the initial values of the degree of membership and model parameters.
独立成分分析等による信号分離では、同じ周波数ビンの異なる信号番号を有する分離行列は同じクラスタに属さないという制約を仮定できるため、クラスタ数Cは常に源信号数N以上となる。又、帰属度を0又は1と2値化すると対数尤度下限値は帰属度が0の時に0となり、帰属度が1の時に値を持つ。そこで、帰属度が1の時の対数尤度下限値を式(65)により、部分対数尤度と定義する。部分対数尤度は、帰属度を補助変数として与える前の対数尤度と同じであり、各周波数ビンにおけるクラスタ・信号ごとの3次元テンソル構造となる。 In signal separation by independent component analysis or the like, it can be assumed that separation matrices having different signal numbers in the same frequency bin do not belong to the same cluster, so the number of clusters C is always greater than or equal to the number of source signals N. Also, when the degree of membership is binarized as 0 or 1, the log-likelihood lower limit value becomes 0 when the degree of membership is 0, and has a value when the degree of membership is 1. Therefore, the log-likelihood lower limit when the degree of membership is 1 is defined as the partial log-likelihood by Equation (65). The partial log-likelihood is the same as the log-likelihood before the degree of membership is given as an auxiliary variable, resulting in a three-dimensional tensor structure for each cluster/signal in each frequency bin.
部分対数尤度Lcn(f)を周波数ビンごとに大きい順に並べた集合をBL(f)、対応するクラスタ(式(68)の行)と源信号(式(68)の列)の番号の集合をそれぞれBC(f)及びBN(f)と定義し、それらの和集合をB(f)とおく。又、周波数ビンごとに、部分対数尤度、クラスタ番号、源信号番号の各集合要素の内、i番目の要素を集めた集合をBi(f)と定義する。以降、使用するその他の同じ集合に対しても同様の表記規則を用いる。
B L (f) is a set in which the partial logarithmic likelihood L cn (f) is arranged in descending order for each frequency bin, and the number of the corresponding cluster (row of equation (68)) and source signal (column of equation (68)) are defined as B C (f) and B N (f), respectively, and their union set is B(f). Also, for each frequency bin, a set of the i-th elements among the set elements of the partial logarithmic likelihood, cluster number, and source signal number is defined as B i (f). Similar conventions are used hereinafter for other identical sets used.
式(69)の集合構造を以降、B(f){b(f)}と短縮表記し、その他の集合にも同じ表記を適用する。最適解の条件を満たす要素すなわち部分対数尤度とそのクラスタ、信号番号を格納する集合をΩ(l){ω(l)}、条件を満たさない要素を格納する集合をΨ{ψ}を定義する。アルゴリズム内の記号φは空
The set structure of equation (69) is hereafter abbreviated as B(f){b(f)}, and the same notation applies to the other sets. Define Ω (l) {ω (l) } as the set that stores the elements that satisfy the conditions of the optimal solution, that is, the partial logarithmic likelihood and its cluster, and the signal number, and Ψ {ψ} as the set that stores the elements that do not satisfy the conditions. do. The symbol φ in the algorithm is empty
・アルゴリズム1
0.周波数インデックスを初期化する
1.繰り返しインデックスと最適解候補格納用集合を初期化し、探索開始解を登録する。
2.最適解でない要素の格納用集合Ψを初期化する。
3.集合B(f)の要素に対して、最適解条件を満たすものと満たさないものに分ける。
4.最適解条件を満たさない集合Ψ内の要素が過去の繰り返し計算で最適解集合Ωに含まれているか調べ、含まれている時は集合Ψから該当要素を削除する。
5.集合Ψが空集合ならば、ステップ7へ、そうでなければ、ステップ6へ進む。
6.空集合でない集合Ψの要素の内、要素番号が最小の要素が最適解条件を満たす集合の最初の要素Ω1に保存して、ステップ2へ戻る。
ステップ2へ戻る。
7.最適解条件を満たす集合Ωの内、評価値の最も高い集合を最適解として帰属度に反映する。
8.f<Fならステップ1へ戻る。f=Fなら繰り返し計算を終了する。・Algorithm 1
0. Initialize the frequency index
1. Initialize the iteration index and the set for storing optimal solution candidates, and register the search start solution.
2. Initialize the storage set Ψ of non-optimal elements.
3. The elements of the set B(f) are divided into those that satisfy the optimal solution condition and those that do not.
4. It is checked whether an element in the set Ψ that does not satisfy the optimum solution condition is included in the optimum solution set Ω in past repeated calculations, and if it is included, the corresponding element is deleted from the set Ψ.
5. If the set Ψ is an empty set, go to step 7, else go to step 6.
6. Among the elements of the non-empty set Ψ, the element with the smallest element number is stored in the first element Ω1 of the set that satisfies the optimum solution condition, and the process returns to step 2.
Return to step 2.
7. Among the sets Ω that satisfy the optimal solution conditions, the set with the highest evaluation value is reflected in the degree of membership as the optimal solution.
8. If f<F, return to step 1. If f=F, terminate the iterative calculation.
帰属度を0又は1と2値化した時に、対数尤度を最大化する最適なクラスタを生成する計算フローを以下にまとめる。初めに式(58)の帰属度の算定値を用いて、式(59)~式(63)を解くと、事後確率最大化条件を満たすモデルパラメータθcが求まる。モデルパラメータを用いて、部分対数尤度を算定し、対数尤度を最大化する部分対数尤度の組み合わせをアルゴリズム1により、探索する。この最適な組み合わせを帰属度に反映する。この計算を繰り返すことで、対数尤度を最大化する最適なクラスタの組み合わせが特定できる。具体的には、次の繰り返し計算を行う。The calculation flow for generating the optimal cluster that maximizes the logarithmic likelihood when the degree of membership is binarized as 0 or 1 is summarized below. First, by solving equations (59) to (63) using the calculated value of the degree of membership of equation (58), the model parameter θ c that satisfies the posterior probability maximization condition is obtained. Using the model parameters, the partial log-likelihoods are calculated, and Algorithm 1 searches for the combination of partial log-likelihoods that maximizes the log-likelihood. This optimal combination is reflected in the degree of membership. By repeating this calculation, the optimal combination of clusters that maximizes the log-likelihood can be identified. Specifically, the following iterative calculation is performed.
i) 変数集合θCの算定
帰属度が与えられた条件下で、対数尤度を増大させる変数集合θCを式(58)~式(63)により更新して、算定する。
ii)部分対数尤度の算定
変数集合θCより、各クラスタにおける周波数ビン・信号ごとの部分対数尤度Lci(f)を式(66)又は式(67)により算定する。
iii)帰属度の決定
部分対数尤度の算定結果に基づいて、対数尤度を最大化するように基底ベクトルをクラスタへ割り振る組み合わせをアルゴリズム1のステップ2~6により探索し、最適な割り振りの組み合わせから、アルゴリズム1のステップ7により帰属度を0又は1で求める。
iv)繰り返し計算過程において、0又は1で定義された帰属度又は平均方向の変化がなくなるまでi)~iii)の計算を繰り返す。i) Calculation of variable set θ C The variable set θ C that increases the logarithmic likelihood under the condition that the degree of membership is given is updated and calculated using equations (58) to (63).
ii) Calculation of Partial Log-Likelihood From the variable set θC , the partial log-likelihood L ci (f) for each frequency bin/signal in each cluster is calculated by Equation (66) or Equation (67).
iii) Determining the degree of membership Based on the calculation results of the partial log likelihood, search for a combination that allocates the basis vectors to the clusters so as to maximize the log likelihood by
iv) In the iterative calculation process, the calculations i) to iii) are repeated until there is no change in the degree of membership defined by 0 or 1 or the mean direction.
最適化により算定した分離行列には、ノイズ等による源信号波形の推定誤差や学習そのものがうまく進まなかったことによる誤差等の様々な推定誤差が含まれる可能性がある。そこで、分離行列の推定精度を評価し、信頼度の低い分離行列から算定された分離信号の影響を減らすために、連続値マスクMn(f)を定義する。連続値マスクの算定方法は、信号の分離環境やその目的に応じて異なるため、特に指定しないが、方向別に主となる信号データを得る時に有効な算定手順を例として示す。正しく算定された分離行列の逆行列は、源信号ごとの周波数伝達関数を列ベクトルに持つ混合行列と対応する。混合行列の列ベクトルには、白色化空間において互いに直交するという性質がある。この性質を利用して、分離行列が正しく算定されたかを判定する。初めに、分離行列の逆行列を白色化行列V(f)により、白色化空間に移行したN×N次元の行列G(f)を各周波数ビンにおいて算定する。白色化行列は、観測信号の相関行列E[x(f,τ)xH(f,τ)]の固有値と固有ベクトルから算定され、一般的に観測信号を白色化すなわち、全周波数帯にわたって一定とし、信号間で無相関化する時に用いられる。Separation matrices calculated by optimization may contain various estimation errors, such as estimation errors of source signal waveforms due to noise, etc., and errors due to unsuccessful learning itself. Therefore, a continuous value mask M n (f) is defined to evaluate the estimation accuracy of the separation matrix and reduce the influence of the separation signal calculated from the low-reliability separation matrix. The calculation method of the continuous value mask differs depending on the signal separation environment and its purpose, so it is not specified, but an effective calculation procedure for obtaining main signal data for each direction is shown as an example. The correctly calculated inverse matrix of the separation matrix corresponds to the mixing matrix having the frequency transfer function for each source signal as a column vector. The column vectors of the mixing matrix have the property that they are orthogonal to each other in the whitened space. This property is used to determine whether the separation matrix has been calculated correctly. First, the demultiplexing matrix is inverted by the whitening matrix V(f) to compute the N×N-dimensional matrix G(f) transferred to the whitening space at each frequency bin. The whitening matrix is calculated from the eigenvalues and eigenvectors of the correlation matrix E[x(f, τ)x H (f, τ)] of the observed signal. , is used when decorrelating between signals.
分離信号に0又は1で定義された帰属度を掛けてクラスタごとに加算し、1つの源信号を1つの行ベクトルにもつ分離信号yc (ICA)(f,τ)を算定する。The separated signals are multiplied by a degree of membership defined as 0 or 1 and summed clusterwise to compute the separated signal y c (ICA) (f, τ) with one source signal in one row vector.
分離信号yc (ICA)(f,τ)には、算定精度の低い分離信号が含まれており、このまま出力すると源信号推定結果の誤差が大きくなる。そこで源信号到来方向算定方法についてまとめた後、算定精度の低い分離信号の影響を低減させる方法をこの後、分離信号補正部で演算式としてまとめる。The separated signal y c (ICA) (f, τ) contains a separated signal with low calculation accuracy, and if it is output as it is, the error in the source signal estimation result will increase. Therefore, after summarizing the source signal direction-of-arrival calculation method, a method for reducing the influence of separated signals with low calculation accuracy is summarized as an arithmetic expression in the separated signal correction unit.
〔源信号到来方向算定部〕
まず、源信号到来方向ベクトルq^n(f)を、観測点座標ベクトルのMoore-Penrose疑似逆行列P+を用いて、推定する(非特許文献12)。式(74)において、基準センサの位置が源信号到来方向ベクトルの原点の位置すなわち視点となる。[Source signal direction-of-arrival calculation unit]
First, the source signal arrival direction vector q̂ n (f) is estimated using the Moore-Penrose pseudo-inverse matrix P + of the observation point coordinate vector (Non-Patent Document 12). In equation (74), the position of the reference sensor is the position of the origin of the direction-of-arrival vector of the source signal, that is, the viewpoint.
Mn(f)は、連続値マスクであり、周波数ビン・源信号ごとの分離行列の信頼度に基づいて設定する。上記算定部で掛けている連続値マスクは、背景ノイズのほとんどない場合など分離行列の信頼度が高い場合などは、省略することもできる。Wheight f)は周波数ビン・源信号ごとの源信号到来方向ベクトルの重みであり、どの周波数も同じ信頼度なら全て1となる。重みとして周波数ごとの観測値のパワースペクトルを指標とする時は式(76)で算定される。他にも重みとしては、信号部分空間の固有値の和を指標とすることもでき、近似的に直接、観測点まで届いた到来波のパワーの総和をとっていることになる。
M n (f) is a continuous value mask and is set based on the reliability of the separating matrix for each frequency bin and source signal. The continuous value mask multiplied by the calculation unit can be omitted when the separation matrix is highly reliable, such as when there is almost no background noise. Wheight f) is the weight of the direction-of-arrival vector of the source signal for each frequency bin and source signal, and is all 1 if all frequencies have the same reliability. When the power spectrum of the observed value for each frequency is used as the index as the weight, it is calculated by Equation (76). Alternatively, the sum of the eigenvalues of the signal subspace can be used as an index for the weight, which is approximately the sum of the powers of the incoming waves that reach the observation point directly.
〔分離信号補正部〕
[Separation signal corrector]
式(77)~式(81)に示す源信号到来方向から分離信号を算定する演算は、クラスタ数▲C▼と源信号数Nが同じ数の時、次の式で簡潔にまとめることができる。 When the number of clusters {C} and the number of source signals N are the same, the computation for calculating the separated signals from the direction of arrival of the source signals shown in Equations (77) to (81) can be summarized simply by the following equations. .
式(73)に示すICAによる分離信号算定結果と源信号到来方向に基づく分離信号算定結果を用いて、次式により、算定精度の低い分離信号の影響を軽減した分離信号y(MOD)(f,τ)を算定する。Using the separated signal calculation result by ICA shown in Equation (73) and the separated signal calculation result based on the direction of arrival of the source signal, the separated signal y (MOD) (f , τ).
源信号空間事前情報が得られている場合は式(50)の分離信号、得られていない場合は式(83)の分離信号を逆フーリエ変換し、窓関数を掛けて重ね合わせることで、分離信号の時間波形が得られる。 If the source signal spatial prior information is obtained, the separated signal of formula (50) is obtained, and if not obtained, the separated signal of formula (83) is subjected to inverse Fourier transform, multiplied by a window function, and overlapped to obtain separation A time waveform of the signal is obtained.
本発明は、以上の発明の実施の形態に限定されることなく、特許請求の範囲に記載された発明の範囲内で、種々の変更が可能であり、それらも本発明の範囲内に包含される。 The present invention is not limited to the embodiments of the invention described above, and various modifications are possible within the scope of the invention described in the claims, and these are also included in the scope of the invention. be.
本特許文面では、分離行列として、独立成分分析及び独立低ランク行列分析を用いた場合を記載しているが、その他の分離行列を用いた場合でも、本発明におけるクラスタリング方法又は源信号到来方向推定方法を用いた場合には、本発明の範囲に属するとみなす。 The text of this patent describes the case of using independent component analysis and independent low-rank matrix analysis as the separating matrix, but even when using other separating matrices, the clustering method or source signal arrival direction estimation in the present invention Any use of a method is considered to be within the scope of the present invention.
源信号波形の方法として、その源信号の統計的分散情報を人工知能に事前学習させ、高精度に信号分離を行うための手法として、独立深層学習行列分析が存在する。この方法では、分離行列を補助関数法に基づく反復射影法を用いて、更新している。しかし、独立深層学習行列分析には、事前に源信号の情報を一定レベルで得られないと、源信号の統計的分散情報を正しく学習できないという課題がある。源信号到来方向の情報を式(41)に示す制約条件として加えた式(37)の事前情報制約付加に基づく分離行列更新方法を、独立深層学習行列分析における反復射影法の代わりに用いることで、分離信号の事前情報が少ない状況でも高精度に源信号波形を推定することができるようになる。そのため独立深層学習行列分析(非特許文献19)においての適用も考えられる。このような場合でも、目的関数に源信号到来方向を事前情報とした制約条件を付加する場合において、当該制約条件が「同一の源信号番号を有する分離行列の行ベクトルと混合行列の列ベクトルの内積が1になり、異なる源信号番号を有する分離行列の行ベクトルと混合行列の列ベクトルの内積が0になる」という情報を含む場合など、請求項3に記載の事項と合致する場合は、本発明の範囲に属するとみなす。又、1つ前のタイムステップにおける分離行列の更新量に定数を掛けた値を慣性項として用いている場合や、行列ブロックごとに勾配降下方向への更新量すなわち学習率を前回までの分離行列の更新量や目的関数の勾配に応じて調整している場合など、請求項5に記載の事項と合致する場合は、本発明の範囲に属するとみなす。 As a method for source signal waveforms, there is independent deep learning matrix analysis as a method for making artificial intelligence pre-learn the statistical variance information of the source signal and performing signal separation with high accuracy. In this method, the separation matrix is updated using an iterative projection method based on the auxiliary function method. However, the independent deep learning matrix analysis has a problem that the statistical variance information of the source signal cannot be correctly learned unless the information of the source signal is obtained at a certain level in advance. By using the separation matrix update method based on prior information constraint addition of Equation (37) in which the information on the direction of arrival of the source signal is added as a constraint condition shown in Equation (41) instead of the iterative projection method in independent deep learning matrix analysis , it becomes possible to estimate the source signal waveform with high accuracy even when there is little prior information of the separated signal. Therefore, application in independent deep learning matrix analysis (Non-Patent Document 19) is also conceivable. Even in such a case, when adding a constraint with the direction of arrival of the source signal as a priori information to the objective function, the constraint is defined as "a row vector of the separation matrix and a column vector of the mixing matrix having the same source signal number. The inner product is 1, and the inner product of the row vector of the separation matrix and the column vector of the mixing matrix with different source signal numbers is 0." considered within the scope of the present invention. Also, when the value obtained by multiplying the update amount of the separation matrix at the previous time step by a constant is used as the inertia term, or the update amount in the gradient descent direction for each matrix block, that is, the learning rate, is used as the previous separation matrix When the items described in claim 5 are met, such as when adjusting according to the update amount of or the gradient of the objective function, it is considered to belong to the scope of the present invention.
源信号到来方向等の事前情報を制約条件とした分離行列更新方法を独立深層学習行列分析に応用する場合においても、演算の流れは、独立低ランク行列分析と同様であり、信号の統計的分散の更新方法が異なるだけである。基本的な演算の流れを以下に示す。 Even when applying the separation matrix update method with prior information such as the direction of arrival of the source signal as a constraint to the independent deep learning matrix analysis, the operation flow is the same as the independent low-rank matrix analysis, and the statistical variance of the signal The only difference is the update method. The basic operation flow is shown below.
図-5及び図-6の計算フローによるクラスタリング計算において、周波数ビンf・源信号nごとに基底ベクトルを生成しているが、例えば調波信号の分離において、基底ベクトルの生成時に、周波数ビンfを時間周波数点に置き換えてクラスタ分析を実施することも可能である。このような場合でもクラスタ分析に、フォンミーゼス・フィッシャー分布に基づく目的関数を設定し、式(57)に示す最適性条件の基でパラメータを更新している場合など、請求項6、請求項7又は請求項8に記載のクラスタリング方法と合致する場合は、本発明の範囲に属するとみなす。 In the clustering calculation according to the calculation flow of Figures 5 and 6, basis vectors are generated for each frequency bin f and source signal n. can also be replaced by time-frequency points to perform cluster analysis. Even in such a case, when cluster analysis is performed with an objective function based on the von Mises-Fischer distribution and the parameters are updated based on the optimality condition shown in Equation (57), claims 6 and 7 Or if it matches the clustering method of claim 8, it is considered to belong to the scope of the present invention.
請求項6~請求項8に記載の「クラスタリング部」で提案しているクラスタ分析計算は、ミュージック法(非特許文献7)による周波数ビンごとの源信号到来方向推定結果を解析対称周波数全域にわたって、クラスタリングする際に用いることもできる。その適用手法を以下に示す。 The cluster analysis calculation proposed in the "clustering unit" according to claims 6 to 8 is performed by estimating the direction of arrival of the source signal for each frequency bin by the music method (Non-Patent Document 7) over the entire analysis symmetric frequency range, It can also be used for clustering. The application method is shown below.
請求項6~請求項8に記載の「クラスタリング部」で提案しているクラスタ分析計算は、ミュージック法を拡張したKR積-圧縮ミュージック法(非特許文献20)による周波数ビンごとの源信号到来方向推定結果を解析対称周波数全域にわたって、クラスタリングする際に、用いることもできる。その適用手法を以下に示す。 The cluster analysis calculation proposed in the "clustering unit" according to claims 6 to 8 is based on the KR product-compressed music method (Non-Patent Document 20), which is an extension of the music method. It can also be used when clustering the estimation results over the entire analytically symmetrical frequency range. The application method is shown below.
観測信号の時間フレームごとのM×M次元の相関行列を用いて、N2×T次元のデータ行列Y~(f)を次の式で周波数ビンごとに定義する。Using the M×M-dimensional correlation matrix for each time frame of the observed signal, the N 2 ×T-dimensional data matrix Y ˜ (f) is defined for each frequency bin by the following equation.
水平角θと仰角Φを変えながら、式(85)により源信号到来方向と対応する周波数伝達関数を算定する。式(88)で算定されるミュージックスペクトルが局所的にピークになる時の水平角θと仰角Φを源信号到来方向として、源信号到来方向に対応する周波数ビンごとの基底ベクトルを式(13)により、源信号ごとに算定する。周波数ビンごとに、源信号到来方向別に算定された基底ベクトルに対して、本特許のクラスタリング部に記載の演算(式(58)~式(63))を適用すると、解析対称周波数全域にわたって、源信号インデックスnを対応付けることが可能となる。このような場合でも、クラスタ分析に、フォンミーゼス・フィッシャー分布に基づく目的関数を設定し、式(57)に示す最適性条件の基でパラメータを更新している場合など、請求項6、請求項7又は請求項8に記載のクラスタリング方法と合致する場合は、本発明の範囲に属するとみなす。 While changing the horizontal angle .theta. and the elevation angle .PHI. Assuming that the horizontal angle θ and the elevation angle Φ at which the music spectrum calculated by Equation (88) peaks locally is the source signal arrival direction, the basis vector for each frequency bin corresponding to the source signal arrival direction is given by Equation (13). is calculated for each source signal by Applying the calculations (Eqs. (58) to (63)) described in the clustering section of this patent to the basis vectors calculated for each frequency bin and for each direction of arrival of the source signal, the source It becomes possible to associate the signal index n. Even in such a case, in the cluster analysis, an objective function based on the von Mises-Fischer distribution is set, and the parameters are updated under the optimality condition shown in Equation (57). If it is consistent with the clustering method described in claim 7 or claim 8, it is considered to be within the scope of the present invention.
この他にも直交マッチング追跡などの圧縮センシングのアルゴリズムを単体で用いた場合や、KRミュージック法(非特許文献22)、圧縮ミュージック法(非特許文献23)を用いた場合にも、周波数ビンごとに、源信号到来方向が得られ、本特許で発明したクラスタリング演算を用いて、解析対称周波数全域にわたって、源信号インデックスnを対応付けることが可能となる。このような場合でも、クラスタ分析に、フォンミーゼス・フィッシャー分布に基づく目的関数を設定し、式(57)に示す最適性条件の基でパラメータを更新している場合など、請求項6、請求項7又は請求項8に記載のクラスタリング方法と合致する場合は、本発明の範囲に属するとみなす。 In addition, when using a compressed sensing algorithm such as orthogonal matching tracking alone, or when using the KR music method (Non-Patent Document 22) or the compressed music method (Non-Patent Document 23), each frequency bin Then, the direction of arrival of the source signal is obtained, and using the clustering operation invented in this patent, it is possible to associate the source signal index n over the entire analytical symmetric frequency range. Even in such a case, in the cluster analysis, an objective function based on the von Mises-Fischer distribution is set, and the parameters are updated under the optimality condition shown in Equation (57). If it is consistent with the clustering method described in claim 7 or claim 8, it is considered to be within the scope of the present invention.
式(58)~式(63)のクラスタリング計算は、調波構造を仮定した音声信号の分離に適用することもできる。以下、その適用手法を示す。 The clustering calculations of equations (58)-(63) can also be applied to the separation of speech signals assuming a harmonic structure. The application method is shown below.
1 信号取得部
2 信号波形分離部
3 計算結果表示部1
Claims (8)
前記観測信号をその到来方向別の前記源信号波形に分離すると共に、前記源信号の到来方向を推定する方向別信号波形分離方法であって、
前記観測信号を到来方向ごとの前記源信号へと分離する行列を分離行列と定義する場合において、前記分離行列を前記観測信号に掛けて前記源信号の推定値である分離信号を算定することを特徴とする分離信号算定部と、前記源信号の到来方向又は波形形状の特徴量をフォンミーゼス・フィッシャー分布に基づくクラスタ分析手法によりカテゴリ別に分類するクラスタリング部及び信号分離結果を基に前記源信号の到来方向を推定する源信号到来方向算定部を演算機能として有することを特徴とし、
複数の前記源信号の内、いくつかの空間事前情報(到来方向事前情報)が得られている場合においては、前記分離信号算定部で、前記観測信号及び前記空間事前情報を利用して前記源信号を到来方向別に分離する空間事前情報に基づく分離信号算定の演算を実行して、分離信号を算定し、
前記源信号の空間事前情報が得られていない場合においては、前記分離信号算定部で前記観測信号と前記源信号の分散に関する事前情報を基にして前記分離信号を算定した後に、前記クラスタリング部及び前記源信号到来方向算定部の演算を実施することを特徴とする、
信号波形分離方法。When defining the vibration of air or an object as a source signal, and defining a signal obtained by a microphone or a sensor in a state in which the source signals arriving from multiple directions are mixed as an observation signal,
A direction-specific signal waveform separation method for separating the observed signal into the source signal waveforms by direction of arrival and estimating the direction of arrival of the source signal,
In the case where a matrix for separating the observed signal into the source signals for each direction of arrival is defined as a separation matrix, the observed signal is multiplied by the separation matrix to calculate a separated signal that is an estimated value of the source signal. A separated signal calculation unit characterized by a feature, a clustering unit that classifies the feature amount of the direction of arrival or the waveform shape of the source signal into categories by a cluster analysis method based on the von Mises-Fischer distribution, and the source signal based on the signal separation result. characterized by having a source signal arrival direction calculation unit for estimating the arrival direction as a calculation function,
When several pieces of spatial a priori information (a priori information on directions of arrival) are obtained from among the plurality of source signals, the separated signal calculation unit uses the observed signals and the a priori spatial information to performing an operation of spatial prior information-based separated signal calculation to separate signals by direction of arrival to calculate separated signals;
When the spatial a priori information of the source signal is not obtained, after the separated signal calculation unit calculates the separated signals based on the a priori information on the variance of the observed signal and the source signal, the clustering unit and characterized by performing the calculation of the direction-of-arrival calculation unit for the source signal,
Signal waveform separation method.
前記分離信号算定方法は、前記源信号到来方向を事前情報として用いて、時間フレームτ、周波数ビンfごとの分離信号y(f,τ)を算定する方法であって、
センサ配置位置と前記源信号到来方向から、センサから前記源信号までの周波数伝達関数を算定し、
前記周波数伝達関数をセンサ番号が行ベクトル、前記源信号番号が列ベクトルとなるように配置した行列を混合行列A(f)と定義する場合、
前記混合行列とセンサでの前記観測信号x(f,τ)が既知という条件下での前記分離信号の確率密度(事後確率)を最大化することを目標として前記分離信号を算定することを特徴とし、
目的信号以外の雑音と前記分離信号の確率密度がガウス分布に従うと仮定することで前記雑音の分散σE(f)と前記分離信号の分散σn(f)との比率により算定される正則化項Σ(f)を前記混合行列の2乗に加えた行列AH(f)A(f)+Σ(f)の逆行列を算定し、
前記逆行列から式(92-2)により前記分離行列W(f)を算定し、式(92-1)により前記分離行列を前記観測信号に掛けることで、前記分離信号を算定することを特徴とする、
前記分離信号算定方法。
The separated signal calculation method is a method of calculating separated signals y (f, τ) for each time frame τ and frequency bin f using the direction of arrival of the source signal as prior information,
calculating a frequency transfer function from the sensor to the source signal from the sensor arrangement position and the source signal arrival direction;
When defining a matrix in which the frequency transfer function is arranged so that the sensor number is a row vector and the source signal number is a column vector as a mixing matrix A(f),
The separation signal is calculated with the goal of maximizing the probability density (posterior probability) of the separation signal under the condition that the mixing matrix and the observed signal x (f, τ) at the sensor are known. year,
Regularization calculated by the ratio of the variance σ E (f) of the noise and the variance σ n (f) of the separated signal by assuming that the probability density of noise other than the target signal and the separated signal follows a Gaussian distribution calculating the inverse matrix of the matrix AH (f)A(f)+Σ(f) obtained by adding the term Σ(f) to the square of the mixing matrix;
The separation matrix W (f) is calculated from the inverse matrix by formula (92-2), and the separated signal is calculated by multiplying the observed signal by the separation matrix by formula (92-1). to be
The separation signal calculation method.
前記分離行列は、前記源信号番号を行ベクトル、センサ番号を列ベクトルに有しており、
センサ配置位置と前記源信号到来方向から、センサから前記源信号までの周波数伝達関数を算定し、
前記周波数伝達関数をセンサ番号が行ベクトル、前記源信号番号が列ベクトルとなるように配置した行列を混合行列と定義する場合、
前記混合行列が前記分離行列の逆行列であるという情報を制約条件として設定することを特徴とし、
前記制約条件は、互いに同一の前記源信号番号を有する前記分離行列の行ベクトルと前記混合行列の列ベクトルとの内積が1になり、互いに異なる前記源信号番号を有する前記分離行列の行ベクトルと前記混合行列の列ベクトルの内積が0になるという情報を含むことを特徴とし、
前記制約条件を含む目的関数を最適化することで、前記分離行列を算定し、
前記分離行列を前記観測信号に掛けて前記分離信号を算定することを特徴とする、
前記分離信号を算定するための演算方法。A computing method for split signal estimation based on the spatial a priori information of claim 1, comprising:
The separation matrix has the source signal number as a row vector and the sensor number as a column vector,
calculating a frequency transfer function from the sensor to the source signal from the sensor arrangement position and the source signal arrival direction;
When defining a matrix in which the frequency transfer function is arranged so that the sensor number is a row vector and the source signal number is a column vector as a mixing matrix,
characterized by setting information that the mixing matrix is an inverse matrix of the separation matrix as a constraint,
The constraints are such that the inner product of the row vector of the separation matrix and the column vector of the mixing matrix having the same source signal number is 1, and the row vector of the separation matrix having the source signal number different from each other. characterized by including information that the inner product of the column vector of the mixing matrix is 0,
Calculating the separation matrix by optimizing the objective function including the constraint,
Calculating the separated signal by multiplying the observed signal by the separation matrix,
A computational method for calculating the separation signal.
正確な前記源信号波形を求めるための目的関数を最適化する前記分離行列を算定する過程において、
前記目的関数を前記分離行列で偏微分して勾配降下方向を算定し、
前記源信号到来方向の事前情報より概略的に算定される前記分離行列として、前記混合行列の逆行列又は前記混合行列をエルミート転置した行列をテンソル成分に持つ行列又は請求項2に記載の式(92-2)の行列を前記分離行列の初期値として用いて、
前記勾配降下方向に対して前記分離行列を繰り返し更新することで前記目的関数を最適化する前記分離行列を算定し、
前記分離行列を前記観測信号に掛けて前記分離信号を算定することを特徴とする、
前記分離信号を算定するための演算方法。A computing method for split signal estimation based on the spatial a priori information of claim 1, comprising:
In the process of calculating the separation matrix that optimizes the objective function for obtaining the accurate source signal waveform,
calculating a gradient descent direction by partially differentiating the objective function with the separation matrix;
As the separation matrix roughly calculated from the prior information of the direction of arrival of the source signal, a matrix having, as tensor components, an inverse matrix of the mixing matrix or a matrix obtained by Hermitian transposing the mixing matrix, or the formula according to claim 2 ( 92-2) using the matrix as the initial value of the separation matrix,
calculating the separation matrix that optimizes the objective function by iteratively updating the separation matrix for the gradient descent direction;
Calculating the separated signal by multiplying the observed signal by the separation matrix,
A computational method for calculating the separation signal.
正確な前記源信号波形を求めるための目的関数に基づいて前記分離行列を更新する際に、前記目的関数が複雑な解空間を有する場合において、局所解に陥ることなく安定的に前記分離行列の更新を行うための方法であって、
前記分離行列は、前記源信号番号を行ベクトル、センサ番号を列ベクトルに有しており、
前記分離行列を行ベクトルごとに分割した時のテンソルの集合又は任意の範囲で分割した時のテンソルの集合を行列ブロックと定義する場合、前記行列ブロックごとに更新量を調整して前記分離行列を更新することを特徴とし、
前記行列ブロックごとのテンソル成分の2乗和をその行列のブロック単位2乗和と定義し、
前記目的関数を前記分離行列で偏微分して求めた勾配を損失関数と定義し、
前記目的関数の勾配降下方向への更新量を調整するために、前記損失関数に掛ける係数を学習率と定義する場合、
前記損失関数の前記ブロック単位2乗和を求めて、1つ前のタイムステップまでの前記損失関数の前記ブロック単位2乗和の累積値に加算することで、現在のタイムステップにおける前記損失関数の前記ブロック単位2乗和の累積値を算定した後、
現在のタイムステップにおける前記損失関数の前記ブロック単位2乗和の累積値と、1つ前のタイムステップにおける前記分離行列の更新量の前記ブロック単位2乗和の累積値を用いて、前記行列ブロックごとに、前記学習率を算定し、
1つ前のタイムステップにおける前記分離行列の更新量に定数を掛けた値に対して、前記学習率を前記損失関数に掛けた値を加算することで、現在のタイムステップにおける前記分離行列の更新量を前記行列ブロックごとに算定した後、
前記分離行列の更新量の前記ブロック単位2乗和を求めて、1つ前のタイムステップにおける前記分離行列の更新量の前記ブロック単位2乗和の累積値に加算することで、現在のタイムステップにおける前記分離行列の更新量の前記ブロック単位2乗和の累積値を算定するという4段階の変数更新ステップに基づいて、
前記分離行列を更新する演算を何度も繰り返すことで、前記目的関数を最適化する前記分離行列を探索することを特徴とする、
前記分離行列の探索方法。A method of searching for the optimal separation matrix using the objective function including the constraint according to claim 3,
When updating the separation matrix based on the objective function for obtaining the accurate source signal waveform, when the objective function has a complicated solution space, the separation matrix is stably updated without falling into a local solution. A method for updating, comprising:
The separation matrix has the source signal number as a row vector and the sensor number as a column vector,
When a set of tensors obtained by dividing the separation matrix into row vectors or a set of tensors obtained by dividing the separation matrix by an arbitrary range is defined as a matrix block, the update amount is adjusted for each matrix block to divide the separation matrix. characterized by updating
defining the sum of squares of the tensor components for each block of the matrix as the block-wise sum of squares of the matrix;
A gradient obtained by partially differentiating the objective function with the separation matrix is defined as a loss function,
When defining a coefficient to be multiplied by the loss function as a learning rate in order to adjust the update amount in the gradient descent direction of the objective function,
Obtaining the block-wise sum of squares of the loss function and adding it to the cumulative value of the block-wise sum of squares of the loss function up to the previous time step, thereby obtaining the loss function at the current time step. After calculating the cumulative value of the block-wise sum of squares,
Using the accumulated value of the block-wise sum of squares of the loss function at the current time step and the accumulated value of the block-wise sum of squares of the update amount of the separation matrix at the previous time step, the matrix block Calculate the learning rate for each
Updating the separation matrix at the current time step by adding the value obtained by multiplying the loss function by the learning rate to the value obtained by multiplying the update amount of the separation matrix at the previous time step by a constant. After calculating the amount for each matrix block,
Obtaining the block-wise sum of squares of the update amount of the separation matrix and adding it to the accumulated value of the block-wise sum of squares of the update amount of the separation matrix at the previous time step, thereby obtaining Based on the four-stage variable update step of calculating the cumulative value of the block-wise sum of squares of the update amount of the separation matrix in
Searching for the separation matrix that optimizes the objective function by repeating the operation of updating the separation matrix many times,
A search method for the separating matrix.
複数の確率密度関数の線形和で表現される混合モデルにおける未知のパラメータの集まりをクラスタと定義する場合、
周波数ビン・前記源信号ごと又は時間フレーム・周波数ビン・前記源信号ごとに、前記源信号の到来方向又は波形形状の特徴量として信号基底ベクトルを算出し、
前記混合モデルの確率密度関数としてフォンミーゼス・フィッシャー分布を使用し、
前記混合モデルにおける前記信号基底ベクトルの前記クラスタへの帰属確率を帰属度と定義し、
前記クラスタごとの重要度を混合重みと定義し、前記信号基底ベクトルの前記クラスタごとの平均値を平均方向と定義し、前記平均方向周りの前記信号基底ベクトルのばらつき度合を方向集中度と定義する場合、
前記フォンミーゼス・フィッシャー分布の確率密度関数を最大化することを目標として、
前記混合重みと前記平均方向と前記方向集中度を固定して前記帰属度を更新する演算と前記帰属度を固定して前記混合重みと前記平均方向を更新すると共に、近似式又は勾配法又は最尤推定法を用いて、前記方向集中度を更新する演算を交互に繰り返すことで、最適な前記帰属度及び前記混合重みと前記平均方向と前記方向集中度を算定することを特徴とする、
クラスタリング演算方法。The computing method in the clustering unit according to claim 1,
When defining a cluster as a collection of unknown parameters in a mixture model represented by a linear sum of multiple probability density functions,
calculating a signal basis vector as a feature quantity of the direction of arrival or waveform shape of the source signal for each frequency bin/source signal or for each time frame/frequency bin/source signal;
using the von Mises-Fischer distribution as the probability density function of the mixture model,
Define the membership probability of the signal basis vector to the cluster in the mixture model as the degree of membership,
The degree of importance for each cluster is defined as a mixture weight, the average value of the signal basis vectors for each cluster is defined as an average direction, and the degree of variation of the signal basis vectors around the average direction is defined as a direction concentration degree. case,
With the goal of maximizing the probability density function of the von Mises-Fischer distribution,
An operation for fixing the mixture weight, the average direction, and the direction concentration degree to update the degree of membership, fixing the degree of membership and updating the mixture weight and the average direction, and Using a likelihood estimation method, by alternately repeating the calculation of updating the direction concentration degree, calculating the optimum degree of membership, the mixture weight, the average direction, and the direction concentration degree,
Clustering calculation method.
前記フォンミーゼス・フィッシャー分布の確率密度関数を最大化することを目標として、
同一の周波数ビン又は時間フレーム・周波数ビンに属する前記信号基底ベクトルが同一のクラスタには所属しないという制約条件を付与しつつ、前記混合重みと前記平均方向と前記方向集中度を固定して前記帰属度を0又は1のいずれかの値に更新する演算と、
前記帰属度を固定して前記混合重みと前記平均方向を更新すると共に近似式又は勾配法又は最尤推定法を用いて、前記方向集中度を更新する演算とを交互に繰り返すことで、最適な前記帰属度及び前記混合重みと前記平均方向と前記方向集中度を算定することを特徴とする、
クラスタリング演算方法。2. The calculation method in the clustering unit according to claim 1, which can be used when the value of the degree of membership is limited to a discrete value of 0 or 1,
With the goal of maximizing the probability density function of the von Mises-Fischer distribution,
While imposing a constraint that the signal basis vectors belonging to the same frequency bin or time frame/frequency bin do not belong to the same cluster, the attribution is performed by fixing the mixture weight, the average direction, and the direction concentration degree. an operation that updates the degree to either a value of 0 or 1;
Fixing the degree of membership, updating the mixture weight and the average direction, and using an approximation formula, a gradient method, or a maximum likelihood estimation method to alternately repeat the operation of updating the degree of concentration in the direction, Calculating the degree of membership, the mixture weight, the average direction and the degree of concentration in the direction,
Clustering calculation method.
前記方向集中度は、前記フォンミーゼス・フィッシャー分布の式中に含まれる第1種変形ベッセル関数I0.5M(κc)の中にも含まれており、
前記信号基底ベクトルvn(f)と前記信号基底ベクトルに対して、その重要度又は信頼度に基づいて設定した基底重みαn(f)及び前記帰属度ucn(f)より、階数の1つ異なる前記第1種変形ベッセル関数の比率の概略値である概略比率を式(93)又は式(94)を用いて算定し、
前記方向集中度を算定することを特徴とする、
クラスタリング演算における前記方向集中度算定方法。8. The clustering operation according to claim 6 or claim 7, wherein an operation method for calculating the degree of directional concentration κc or κ,
The degree of directional concentration is also included in the modified Bessel function of the first kind I 0.5M (κ c ) included in the von Mises-Fischer distribution formula,
Based on the signal basis vector v n (f) and the signal basis vector, the basis weight α n (f) set based on the degree of importance or reliability and the degree of membership u cn (f), the rank 1 Calculate an approximate ratio, which is an approximate value of the ratio of the two different modified Bessel functions of the first kind, using formula (93) or formula (94),
characterized by calculating the degree of directional concentration,
The method for calculating the degree of concentration of directions in a clustering operation.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021056192A JP2022120750A (en) | 2021-02-05 | 2021-02-05 | Method of separating signal waveform per incoming direction |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2021056192A JP2022120750A (en) | 2021-02-05 | 2021-02-05 | Method of separating signal waveform per incoming direction |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2022120750A true JP2022120750A (en) | 2022-08-18 |
Family
ID=82849215
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021056192A Pending JP2022120750A (en) | 2021-02-05 | 2021-02-05 | Method of separating signal waveform per incoming direction |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2022120750A (en) |
-
2021
- 2021-02-05 JP JP2021056192A patent/JP2022120750A/en active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9420368B2 (en) | Time-frequency directional processing of audio signals | |
Tichavsky et al. | Weight adjusted tensor method for blind separation of underdetermined mixtures of nonstationary sources | |
Pope et al. | Blind signal separation I. linear, instantaneous combinations: I. linear, instantaneous combinations | |
Duong et al. | Spatial location priors for Gaussian model based reverberant audio source separation | |
EP2232407B1 (en) | Method for separating mixed signals into a plurality of component signals | |
CN105580074B (en) | Signal processing system and method | |
Einizade et al. | A unified approach for simultaneous graph learning and blind separation of graph signal sources | |
Koldovský et al. | Performance analysis of source image estimators in blind source separation | |
Einizade et al. | Joint graph learning and blind separation of smooth graph signals using minimization of mutual information and Laplacian quadratic forms | |
CN113962265A (en) | Underdetermined blind source separation method and equipment based on structured sparse subspace clustering | |
Hoffmann et al. | Using information theoretic distance measures for solving the permutation problem of blind source separation of speech signals | |
Feng et al. | Bi-iterative algorithm for extracting independent components from array signals | |
Vaccaro | The role of subspace estimation in array signal processing | |
Casebeer et al. | Deep tensor factorization for spatially-aware scene decomposition | |
JP6973254B2 (en) | Signal analyzer, signal analysis method and signal analysis program | |
Kemiha et al. | Single-Channel Blind Source Separation using Adaptive Mode Separation-Based Wavelet Transform and Density-Based Clustering with Sparse Reconstruction | |
JP2022120750A (en) | Method of separating signal waveform per incoming direction | |
Fontaine et al. | Scalable source localization with multichannel α-stable distributions | |
Haasler et al. | Multi-frequency tracking via group-sparse optimal transport | |
Taştan et al. | Robust spectral clustering: A locality preserving feature mapping based on M-estimation | |
Gerstoft et al. | Parametric bootstrapping of array data with a generative adversarial network | |
Sari et al. | Texture defect detection using independent vector analysis in wavelet domain | |
Sadhu | Decentralized ambient system identification of structures | |
Taha et al. | A Null space approach for complete and over-complete blind source separation of autoregressive source signals | |
Prieto et al. | Blind source separation for time-variant mixing systems using piecewise linear approximations |