JP2007240779A - Time-series similarity scoring method - Google Patents
Time-series similarity scoring method Download PDFInfo
- Publication number
- JP2007240779A JP2007240779A JP2006061839A JP2006061839A JP2007240779A JP 2007240779 A JP2007240779 A JP 2007240779A JP 2006061839 A JP2006061839 A JP 2006061839A JP 2006061839 A JP2006061839 A JP 2006061839A JP 2007240779 A JP2007240779 A JP 2007240779A
- Authority
- JP
- Japan
- Prior art keywords
- time series
- complex
- distance
- complex frequencies
- pole
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
Description
本発明は、時系列解析において複数の時系列が与えられたとき、各時系列を生成するシステム間の類似度を評価する方法に関するものである。時系列は、電気信号や音声信号等をデジタル化し、計算機内部に(一時的にまたはパーマネントに)蓄えられたものを対象とする。 The present invention relates to a method for evaluating the degree of similarity between systems that generate each time series when a plurality of time series are given in the time series analysis. The time series is for digital signals such as electrical signals and audio signals that are stored inside the computer (temporarily or permanently).
時系列の類似度評価は一般的には難しい。時系列間の相互相関を取る方法や、図1に示すように、フーリエ変換を行って得られるパワースペクトルP1(f),P2(f)を用い、両者の差の積分 Time series similarity assessment is generally difficult. Using a method of taking a cross-correlation between time series or power spectra P 1 (f) and P 2 (f) obtained by performing Fourier transform as shown in FIG.
を用いる方法などがあるが、これらは時系列を構成する各周波数成分の位相変動や、時系列自身のレベル変動に弱いという問題がある。レベル変動に強い特徴抽出方法としては、ウェーブレット変換とメリン変換とを用いる方法が提案されている(特許文献1)が、イメージ情報として特徴が抽出されることから、類似度のスコアリングには不向きである。このほか、ホルマント周波数分布統計によるマッチングを行う方法が提案されている(特許文献2)が、これはマルバツ式の評価であり、類似度を点数付けして評価するものとはなっていない。 However, these methods have a problem that they are vulnerable to the phase fluctuation of each frequency component constituting the time series and the level fluctuation of the time series itself. As a feature extraction method that is resistant to level fluctuations, a method using wavelet transformation and Merin transformation has been proposed (Patent Document 1). However, since features are extracted as image information, they are not suitable for scoring similarity. It is. In addition to this, a method of performing matching based on formant frequency distribution statistics has been proposed (Patent Document 2), but this is a Marubat type evaluation and does not evaluate the similarity by scoring.
上記課題の解決に、極解析を行って得られる複素周波数を用いて時系列を特徴づけ、こうして得られた複素周波数間の距離を求めることによって類似度を評価することを最大の特徴とする。 In order to solve the above problem, the greatest feature is to characterize the time series using complex frequencies obtained by performing polar analysis and evaluate the similarity by obtaining the distance between the complex frequencies thus obtained.
複素周波数算出方法としては、全極モデルを用いる方法、零・極モデルを用いる方法、線形予測法を用いる方法の他、特許文献3(周波数解析方法および装置)記載の方法によって得られる複素周波数を用いる方法などがある。こうして得られる複素周波数の情報を用い、複素周波数間の距離を求めることによって類似度を評価する。 As a complex frequency calculation method, in addition to a method using an all-pole model, a method using a zero / pole model, a method using a linear prediction method, a complex frequency obtained by the method described in Patent Document 3 (frequency analysis method and apparatus) There are methods to use. Using the complex frequency information thus obtained, the similarity is evaluated by obtaining the distance between the complex frequencies.
上記の方法により、時系列の類似度を安定的に数値化して評価することができる。 By the above method, the time series similarity can be stably quantified and evaluated.
本発明は、図2に示すように、極解析を行って得られる複素周波数を用いて時系列を特徴づけ、こうして得られた複素周波数間の距離を求めることによって類似度を評価することを最大の特徴とする。図3は、時系列のスペクトル表現と複素周波数表現の対応関係を示している。以下、図面を参照しながら本発明の実施形態について詳細に説明する。 As shown in FIG. 2, the present invention maximizes the evaluation of similarity by characterizing a time series using complex frequencies obtained by performing polar analysis and obtaining the distance between the complex frequencies thus obtained. It is characterized by. FIG. 3 shows the correspondence between the time-series spectral representation and the complex frequency representation. Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.
図4を参照して、100は入力部、102は極解析部、104は複素周波数算出部、106は距離計算部、108はスコアリング部、110は出力部である。 4, 100 is an input unit, 102 is a polar analysis unit, 104 is a complex frequency calculation unit, 106 is a distance calculation unit, 108 is a scoring unit, and 110 is an output unit.
入力部100で時系列s1(t),s2(t)を取得し、サンプリング間隔Δtでサンプリングし、極解析部102で、全極モデル、零・極モデル、線形予測モデル等のモデルに従って極解析を行い、αnとβn”をパラメーターとする伝達関数
The time series s 1 (t) and s 2 (t) are acquired by the
のパラメーターαnとβn”を時系列s1(t),s2(t)のそれぞれに対して求め、パラメーターαnとβn”を決定する。ここで、全極モデル、線形予測モデルであれば、N”=0となり、βn”の次数が零であることから、βn”=0とする場合に対応するともいえる。例えば全極モデルを用いてパラメーターαnとβn’を求めるものとすれば、anをパラメーターとする次の式 Parameters α n and β n ″ are obtained for each of the time series s 1 (t) and s 2 (t), and parameters α n and β n ″ are determined. Here, in the case of an all-pole model or a linear prediction model, N ″ = 0 and the order of β n ″ is zero, so it can be said that this corresponds to the case where β n ″ = 0. Assuming for obtaining the parameters α n β n 'using the following formula to parameters of a n
により与えられるEを最小とするような係数an,n=1..Nの組を、連立方程式 Coefficients a n , n = 1. . N sets of simultaneous equations
を解くことによって得られるan,n=1..Nを用いて、αn=−anという関係により、パラメーターαnが求まる。Nは、距離算出に用いたい複素周波数の数に応じて4〜20程度の値とするのがよい。 A n , n = 1. . Using N, by relationship α n = -a n, the parameter alpha n is determined. N is preferably a value of about 4 to 20 depending on the number of complex frequencies to be used for distance calculation.
こうして得られるαnを用い、複素周波数算出部104で複素周波数f1,n=x1,n+iy1,n,f2,n=x2,n+iy2,n(n=1..N)を算出する。これらの複素周波数は、上記伝達関数の分母を因数分解して得られる式
Using the α n thus obtained, the complex
によって得られる。こうして得られる複素周波数f1,nとf2,nを用いて距離算出部106で距離
Obtained by. The
を求めるが、距離を求めるにあたり、複素周波数f1,nとf2,nの順番付けを、それぞれの実部の小さい方から順に並べるという形にするものとする。ここで、複素周波数f1,nとf2,nは、実部が負となるものを除外して並べてもよい。複素周波数f1,nとf2,nは、伝達関数の係数αnが実数である場合、必ず複素共役なペアを持つからである。mは2とするのが標準的である。距離算出部106で算出された距離Lを用い、スコアリング部108でスコアS=dexp(−cL)(c>0)を算出し、出力部110に渡す。ここで、スコアは、最高点を1とする場合はd=1とし、最高点を100とする場合にはd=100とするなどすればよい。cの値は、類似度の評価を甘くしたい場合には小さく、厳しくしたい場合は大きくすればよいが、通常はナイキスト周波数fNyの逆数を用いて、c=fNy −m程度にとるのがよい。
In order to obtain the distance , the ordering of the complex frequencies f 1, n and f 2, n is arranged in order from the smaller real part of each. Here, the complex frequencies f 1, n and f 2, n may be arranged excluding those having a negative real part. This is because the complex frequencies f 1, n and f 2, n always have complex conjugate pairs when the transfer function coefficient α n is a real number. It is standard that m is 2. Using the distance L calculated by the
図5を参照して、200は入力部、202は複素周波数算出部、204は距離算出部、206はスコアリング部、208は出力部である。
Referring to FIG. 5,
入力部200で時系列s1(t)とs2(t)を取得し、サンプリング間隔Δtでサンプリングし、複素周波数算出部202で特許文献3記載の方法に従って複素周波数f1,n=x1,n+iy1,n,f2,n=x2,n+iy2,n(n=1..N)を時系列s1(t)とs2(t)のそれぞれに対して算出する。こうして算出される複素周波数f1,nとf2,nを用いて距離算出部204で距離
The time series s 1 (t) and s 2 (t) are acquired by the
を算出するが、距離を算出するにあたり、複素周波数f1,nとf2,nの順番付けを、全ての可能な組み合わせ(順列組み合わせ)を用いてLを算出し、そうして得られるLのうち、最も小さなものを距離Lとして選ぶ。距離算出部204で算出された距離Lを用い、スコアリング部206でスコアS=dexp(−cL)(c>0)を算出し、出力部208に渡す。ここで、スコアは、最高点を1とする場合はd=1とし、最高点を100とする場合にはd=100とするなどすればよい。cの値は、類似度の評価を甘くしたい場合には小さく、厳しくしたい場合には大きくとればよいが、通常はナイキスト周波数fNyの逆数を用いてc=fNy −m程度にとるのがよい。
However, in calculating the distance , the ordering of the complex frequencies f 1, n and f 2, n is calculated using all possible combinations (permutation combinations), and the resulting L Among them, the smallest one is selected as the distance L. Using the distance L calculated by the
図6を参照して、300は入力部、302は極解析部、304複素周波数算出部、306は距離計算部、308はスコアリング部、310は出力部である。 6, 300 is an input unit, 302 is a polar analysis unit, 304 complex frequency calculation unit, 306 is a distance calculation unit, 308 is a scoring unit, and 310 is an output unit.
入力部300で時系列s1(t),s2(t)を取得し、サンプリング間隔Δtでサンプリングし、極解析部302で、全極モデル、零・極モデル、線形予測モデル等のモデルに従って極解析を行い、αnとβn”をパラメーターとする伝達関数
The time series s 1 (t) and s 2 (t) are acquired by the
を時系列s1(t),s2(t)のそれぞれに対して求める。ここで、全極モデル、線形予測モデルであれば、N”=0となる。例えば線形予測モデルを用いるものとすれば、Mを1以上の整数とし、次の式 For each of the time series s 1 (t) and s 2 (t). Here, in the case of an all-pole model or a linear prediction model, N ″ = 0. For example, if a linear prediction model is used, M is an integer of 1 or more, and
により与えられるEを最小とするような係数an,n=1..Nの組を、連立方程式 Coefficients a n , n = 1. . N sets of simultaneous equations
を解くことによって得る。こうして得られるαn=−anを用い、複素周波数算出部304で複素周波数f1,n=x1,n+iy1,n,f2,n=x2,n+iy2,n(n=1..N)を算出する。これらの複素周波数は、上記伝達関数の分母を因数分解して得られる式 Is obtained by solving With resulting alpha n = -a n this way, the complex frequency f 1 in the complex frequency calculator 304, n = x 1, n + iy 1, n, f 2, n = x 2, n + iy 2, n (n = 1. Calculate N). These complex frequencies are obtained by factoring the denominator of the transfer function.
によって得られる。こうして得られる複素周波数f1,nとf2,nのうち、以下の条件を満たすものを用いて距離算出部306で距離を求める。
(a)|x|>b|y|(b>0):複素周波数の実部が、その虚部のb倍より大きい
(b)|y|<b’(b’>0):複素周波数の虚部が、ある一定値b’より小さい
条件成立とみなす方法としては、(a)のみ、(b)のみ、(a)and(b)、(a)or(b)の4通りがある。b,b’の選び方としては、例えばbについては1とし、b’についてはナイキスト周波数を目安とする方法がある。
Obtained by. Among the complex frequencies f 1, n and f 2, n obtained in this way, the distance is calculated by the
(A) | x |> b | y | (b> 0): The real part of the complex frequency is larger than b times the imaginary part. (B) | y | <b ′ (b ′> 0): Complex frequency There are four ways to consider that the imaginary part of is less than a certain constant value b ′, (a) only, (b) only, (a) and (b), (a) or (b) . As a method of selecting b and b ′, for example, there is a method in which 1 is set for b and Nyquist frequency is set for b ′.
時系列s1(t),s2(t)とについて、上記の条件を満たす複素周波数の数をN1’,N2’と表記することにする。一般に両者は異なる値となるが、距離の算出には、両者の可能な全ての組み合わせを用い、対を作らない|N1’−N2’|個の複素周波数については、距離の計算に用いないものとして、N0=min(N1’,N2’)として、 For the time series s 1 (t) and s 2 (t), the number of complex frequencies satisfying the above condition will be expressed as N 1 ′ and N 2 ′. In general, the two values are different, but for the calculation of the distance, all possible combinations of the two are used, and | N 1 '-N 2 ' | N 0 = min (N 1 ′, N 2 ′)
を計算し、そのうち最も小さい値をとるものを、距離Lとして採用するものとする。距離算出部306で算出された距離Lを用い、スコアリング部308でS=dexp(−cL)(c>0)を算出し、出力部310に渡す。ここで、スコアは、最高点を1とする場合はd=1とし、最高点を100とする場合にはd=100とするなどすればよい。cの値は、類似度の評価を甘くしたい場合には小さく、厳しくしたい場合は大きくすればよいが、通常はナイキスト周波数fNyの逆数を用いてc=fNy −m程度にとるのがよい。
And the one having the smallest value is adopted as the distance L. Using the distance L calculated by the
100,200,300 入力部
102,302 極解析部
104,202,304 複素周波数算出部
106,204,306 距離算出部
108,206,308 スコアリング部
110,208,310 出力部
100, 200, 300
Claims (9)
The ordering of f 1, n , f 2, n ′ according to claim 1 is performed by all possible combinations, and the distance L between the time series obtained by the method according to claim 6 according to each combination. Among them, a time series similarity scoring method characterized by adopting the smallest one as the distance L between time series.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006061839A JP4728842B2 (en) | 2006-03-07 | 2006-03-07 | Time series similarity scoring method and apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006061839A JP4728842B2 (en) | 2006-03-07 | 2006-03-07 | Time series similarity scoring method and apparatus |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007240779A true JP2007240779A (en) | 2007-09-20 |
JP4728842B2 JP4728842B2 (en) | 2011-07-20 |
Family
ID=38586395
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006061839A Expired - Fee Related JP4728842B2 (en) | 2006-03-07 | 2006-03-07 | Time series similarity scoring method and apparatus |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4728842B2 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20190136518A (en) * | 2018-05-31 | 2019-12-10 | 주식회사 지오네트 | Performance Prediction System of Power Feed Water Heater by Applying Machine Learning and Path Classification |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6032100A (en) * | 1983-08-03 | 1985-02-19 | 日本電気株式会社 | Lsp type pattern matching vocoder |
JP2005249967A (en) * | 2004-03-02 | 2005-09-15 | Nippon Telegr & Teleph Corp <Ntt> | Method and apparatus for frequency analysis |
-
2006
- 2006-03-07 JP JP2006061839A patent/JP4728842B2/en not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6032100A (en) * | 1983-08-03 | 1985-02-19 | 日本電気株式会社 | Lsp type pattern matching vocoder |
JP2005249967A (en) * | 2004-03-02 | 2005-09-15 | Nippon Telegr & Teleph Corp <Ntt> | Method and apparatus for frequency analysis |
Non-Patent Citations (1)
Title |
---|
JPN6010059269, 古井貞煕, 電子・情報工学入門シリーズ2 音響・音声工学, 19920925, p.179〜182, JP, 株式会社近代科学社 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20190136518A (en) * | 2018-05-31 | 2019-12-10 | 주식회사 지오네트 | Performance Prediction System of Power Feed Water Heater by Applying Machine Learning and Path Classification |
KR102211821B1 (en) * | 2018-05-31 | 2021-02-10 | 권영민 | Performance Prediction System of Power Feed Water Heater by Applying Machine Learning and Path Classification |
Also Published As
Publication number | Publication date |
---|---|
JP4728842B2 (en) | 2011-07-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10418051B2 (en) | Indexing based on time-variant transforms of an audio signal's spectrogram | |
US20200097850A1 (en) | Machine learning apparatus and method based on multi-feature extraction and transfer learning, and leak detection apparatus using the same | |
US10019998B2 (en) | Detecting distorted audio signals based on audio fingerprinting | |
CN107103908B (en) | Polyphonic music polyphonic pitch height estimation method and application of pseudo bispectrum in polyphonic pitch estimation | |
CN109473091B (en) | Voice sample generation method and device | |
JP6723120B2 (en) | Acoustic processing device and acoustic processing method | |
CN111128211B (en) | Voice separation method and device | |
CN112750442B (en) | Crested mill population ecological system monitoring system with wavelet transformation and method thereof | |
JP2015118361A (en) | Information processing apparatus, information processing method, and program | |
JPWO2014168022A1 (en) | Signal processing apparatus, signal processing method, and signal processing program | |
US7996213B2 (en) | Method and apparatus for estimating degree of similarity between voices | |
Hoffmann et al. | Bass enhancement settings in portable devices based on music genre recognition | |
Van Balen et al. | Corpus Analysis Tools for Computational Hook Discovery. | |
CN106205637A (en) | Noise detection method and device for audio signal | |
Goldstein et al. | Guitar Music Transcription from Silent Video. | |
JP2012127699A5 (en) | ||
JP4728842B2 (en) | Time series similarity scoring method and apparatus | |
CN108847251A (en) | A kind of voice De-weight method, device, server and storage medium | |
JP5726790B2 (en) | Sound source separation device, sound source separation method, and program | |
CN110808067A (en) | Low signal-to-noise ratio sound event detection method based on binary multiband energy distribution | |
Xu et al. | Ships classification using deep neural network based on attention mechanism | |
CN114692836A (en) | Block chain assisted personnel negative emotion comprehensive evaluation method and system | |
JP6499095B2 (en) | Signal processing method, signal processing apparatus, and signal processing program | |
KR101621718B1 (en) | Method of harmonic percussive source separation using harmonicity and sparsity constraints | |
Volchkov et al. | Presentation and Analysis of Continuous Signals in the Space of Complex Exponential Models |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080130 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20100513 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20100513 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100726 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20100906 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20101015 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20101213 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110107 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110307 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110408 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110415 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140422 Year of fee payment: 3 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |