JP4542395B2 - 非定常時系列データ分類方法、装置、プログラム及びそのプログラムを記録した記録媒体 - Google Patents
非定常時系列データ分類方法、装置、プログラム及びそのプログラムを記録した記録媒体 Download PDFInfo
- Publication number
- JP4542395B2 JP4542395B2 JP2004245275A JP2004245275A JP4542395B2 JP 4542395 B2 JP4542395 B2 JP 4542395B2 JP 2004245275 A JP2004245275 A JP 2004245275A JP 2004245275 A JP2004245275 A JP 2004245275A JP 4542395 B2 JP4542395 B2 JP 4542395B2
- Authority
- JP
- Japan
- Prior art keywords
- series data
- function
- memory
- time series
- procedure
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
Keogh, E., Lin, J. and Truppel, W. (2003) "Clustering of time series subsequences is meaningless: implications for previous and future research", ICDM. Taniguchi, M. and Kakizawa, Y. (2000) Asymptotic Theory of Statistical Inference for Time Series, 477-534, Springer in statistics. springer-verlag New York.
すなわち、F0データは、有声音と無声音とから成り、この無声音を欠測値する時系列データとみなすことができる。ところが、従来の時系列分類は、データ全区間に対し定常性を仮定したスペクトル密度関数か、或いは局所定常性を仮定することによって得られた時変スペクトル密度関数間の測度により分類する手法が主流であり、欠測値を含む非定常時系列データに対するアプローチはなされていない。そのため、従来、F0パタンのような欠測値を含む非定常時系列データに客観的な測度に基づく統計解析を適用することはできず、F0パタンの分類は手作業で行うしかなかった。
すなわち、まず多項式回帰モデルを適用し、時系列データy(s) tの変動傾向を示すトレンド関数の推定関数T^(s)(t)をサンプルsごとに算出する。次に、この推定関数T^(s)(t)から判別関数を生成し、その判別関数を用いて推定関数T^(s)(t)のクラスター分析を行い、その分類結果を出力する。
T^(s)(t)=(1,t,t2,...,tp−1)・β^(s) LSE
によって行う。なお、この次数pはモデルy(s) t=T^(s)(t)+u(s) tの情報量基準AIC(s)(p)を最小値化する値である。また、判別関数は、好ましくは二群判別分析によって生成される。
〔本形態の原理〕
<基本的枠組み>
本形態の基本的枠組みは、1.音声の基本周波数(F0)データのような欠測値を含む時系列データに対して多項式回帰モデルを適用し、その変動パタンを示すトレンド関数を推定し、2.推定されたトレンド関数に対して2群判別分析を適用して判別関数を生成し、3.判別関数をもとに最近隣接法でパタンを分類することである。
F0データのような欠測値を含む時系列データに対し、
yt=T(t)+ut …(1)
という時系列回帰モデルを導入する。
ここで、{t}はサンプリング時刻を示す離散値であり、{yt}は各サンプリング時刻tにおける観測値を示す時系列データである。なお、各{yt}は、F0データのような欠測値を含む時系列データであり、あるサンプリング時刻tにおける時系列データは存在しない(欠測値)。例えば、欠測値の区間がサンプリング時刻t1<t≦t2の区間であった場合、式(1)は
yt=T(t)+ut ,t∈{1,2,...,t1}∪{t2+1,t2+2,...,n}…(2)
と記述される。なお、nはサンプリング時刻tの最大値である。
β≡(β0,β1,...,βp−1)T∈Rp
に対して、
T(t)=β0+β1t+...+βp−1tp−1
と表される。ここで、*Tは*の転置行列を示し、Rpはp次の実数を示す。また{≡}は左辺を右辺のように定義することを意味する。なお、トレンド関数は全区間(t={1,2,...,n})で定義される。
また、{ut}はノイズ値を示すノイズ項であり、定常過程とする。
T^(s)(t)=(1,t,t2,...,tp−1)・β^(s) LSE …(3)
求める。なお、この例における次数pの決定は、赤池情報量規準
AIC(s)(p)=−2log(最大対数尤度)+2(p+1)
を適用して行う(例えば、中溝高好 (1988)「信号解析とシステム同定」コロナ社 201-205.参照)。またsは各サンプルを示すパラメータであり、ここでいう「サンプル」とは、1つの観測結果に対応する時系列データ列を意味する。
式(1)で示された時系列データが、以下のような2つのカテゴリのどちらかに分類されると考える:
Π1:トレンド関数T1(t)をもつ式(1)のモデル
Π2:トレンド関数T2(t)をもつ式(1)のモデル
Πr:トレンド関数Tr(t)をもつ式(1)のモデル ,r={1,2,...,k}
また、その分類手順としては、すべてのr2(r1,r2∈r,r2≠r1)に対して、L(T^(s)(t):Tr2)>L(T^(s)(t):Tr1)という関係を満たすときに、その推定関数T^(s)(t)はカテゴリΠr1に属すると判断する。
<概要>
図1は、一部が欠測した観測値の時系列データの傾向を分類する非定常時系列データ分類方法を例示した図である。
本形態の方法では、前処理において各サンプルsのサンプリング時刻tに対応する時系列データy(s) tがメモリに格納されている。
分類処理が開始されると、まずこのメモリから時系列データy(s) tが読み込まれる(ステップS1)。そして、上述の多項式回帰モデルを適用して、この時系列データy(s) tのサンプルsごとの変動傾向を示すトレンド関数の推定関数T^(s)(t)=(1,t,t2,...,tp−1)・β^(s) LSEが生成される(ステップS2)。ここで、次数pは情報量基準AIC(s)(p)を最小値化するように決定され、回帰係数推定値β^(s) LSEは最小二乗法によって算出される。
次に、本形態における装置及び処理の詳細について説明する。
図2は、本形態における非定常時系列データ分類装置1全体の機能構成を例示したブロック図である。なお、本形態の非定常時系列データ分類装置1は、例えば、CPU(central processing unit)、RAM(Random Access Memory)、ROM(Read Only Memory)等がバスで接続されたノイマン型コンピュータに所定のプログラムを実行させることにより構築されるものである。また、図3は、図2における推定関数生成手段13の詳細構成を例示したブロック図であり、図4(a)は、次数選択手段14の詳細構成を例示したブロック図であり、図4(b)は、判別分析手段15の詳細構成を例示したブロック図である。なお各ブロック図中の矢印はデータの流れを示し、そのデータの出力元と出力先とが情報のやり取り可能に接続されていることを示しているが、制御手段11から出入りするデータの流れ及び接続に関する記載は省略してある。
以下、これらの図を用いて非定常時系列データ分類装置1の構成及び処理について説明する。
まず前処理として、サンプルs(s={1,2,...,smax})のサンプリング時刻tにおける時系列データy(s) tがメモリ12の観測データ領域12a(図2)に格納される。
この時系列データy(s) tは、一部が欠測した観測値の時系列データであり、例えば、マイクロホン等により観測した周波数領域の音声信号を短時間離散フーリエ変換等によって時間領域に変換し、その時間領域データの逆数をとること等によって生成されるF0データ等である。図7(a)はこのようなF0データを例示したグラフである。ここで、図7(a)のグラフの縦軸はlogF0/(F0の平均値)を示し、横軸はサンプリング時刻tを示している。図7(a)に例示するように、このF0データはt=410msec〜490msec付近で欠測している。なおF0データの場合、この欠測部分は無声音部分に相当する。
{yt;t=1,...,t1,t2+1,...,n} …(5)
というデータであり、各サンプリング時刻tとその時系列データy(s) tとが対応付けられて格納されている。また、欠測区間のサンプリング時刻t1+1≦t≦t2に対応する時系列データは存在せずnull値となっている。なお、yの下付き添え字の(t1)はt1を示し、(t2)はt2を示す。また、図7(b)はサンプリング時刻t1+1≦t≦t2の一箇所のみが欠測している場合の例であるが、複数箇所が欠測しているデータの場合も同様である。すなわち、時系列データが存在するサンプリング時刻tにその時系列データy(s) tが対応付けられて格納され、時系列データが存在しないサンプリング時刻tにはnull値が対応付けられる。なお、メモリ12の観測データ領域12aに格納されるサンプリング時刻tと時系列データy(s) tとの組をY(s) 0と表現する。
次に、前処理によってメモリ12観測データ領域12aに格納された時系列データy(s) tの分類処理について例示する。
まず、推定関数生成手段13(図2)が、多項式回帰モデルを適用し、メモリ12の観測データ領域12aに格納された時系列データy(s) tの変動傾向を示すトレンド関数の推定関数T^(s)(t)をサンプルsごとに算出する。本形態では、最小二乗法によって、時系列データy(s) tからトレンド関数の回帰係数推定値β^(s) LSEを算出し、T^(s)(t)=(1,t,t2,...,tp−1)・β^(s) LSEの演算によって推定関数T^(s)(t)を算出する。
次に、分離ベクトル生成手段13a(図3)が、メモリ12の観測データ領域12a(図2)にアクセスし、サンプルsの各サンプリング時刻tにおける時系列データy(s) tの列を読み出す。そして、分離ベクトル生成手段13aは、これを欠測値前後の時系列データ列である分離ベクトルSY(s) i(欠測値を含まない時系列データ)に分離する(ステップS13)。例えば、式(5)の例の場合、欠測区間はサンプリング時刻t1+1≦t≦t2の一箇所のみであり、この各サンプリング時刻tにおける時系列データy(s) tの列は、以下のような2つの分離ベクトルSY(s) 1,SY(s) 2に分離される。
SY(s) 1=(y1,y2,...,y(t1)),SY(s) 2=(y(t2)+1,y(t2)+2,...,yn) …(6)
このように生成された各分離ベクトルSY(s) iはベクトル結合手段13bに送られ、ベクトル結合手段13bは、これらの分離ベクトルSY(s) iを結合した結合ベクトルY(s)を生成する(ステップS14)。例えば、式(6)の例の場合、ベクトル結合手段13bは、結合ベクトル
Y(s)=(y1,y2,...,y(t1),y(t2)+1,y(t2)+2,...,yn) …(7)
を生成する。
また、行列生成手段13dが、メモリ12の観測データ領域12a(図2)にアクセスし、サンプルsに係る欠測値前後のサンプリング時刻tの列を読み出す。例えば、式(5)の例の場合、t=1,...,t1というサンプリング時刻列と、t=t2+1,...,nというサンプリング時刻列とが読み出される。さらに、行列生成手段13dはレジスタ11a(図2)からパラメータpを読み出す。これらを読み出した行列生成手段13dは、読み出した欠測値前後のサンプリング時刻列ごとに、このサンプリング時刻列を構成する各サンプリング時刻tに対応する従属変数(1,t,t2,…,tp−1)を行とする従属変数行列Z(s) iを生成する(ステップS16)。例えば、t=1,...,t1というサンプリング時刻列と、t=t2+1,...,nというサンプリング時刻列とが読み出されていた場合、行列生成手段13dは、以下のような従属変数行列Z(s) 1,Z(s) 2を生成する。
生成された結合行列Z(s)はさらに転置行列生成手段13fにも送られ、転置行列生成手段13fは、結合行列Z(s)の転置行列TZ(s)を生成し、レジスタ13gに格納する(ステップS18)。
β^(s) LSE=(Z(s)・TZ(s))−1・TZ(s)・TY(s) …(10)
を算出する(ステップS19)。例えば、式(7)〜(9)の例の場合、式(10)の右辺は、
β^(s) LSE={(Z(s) 1)T・Z(s) 1+(Z(s) 2)T・Z(s) 2}−1・{(Z(s) 1)T・(SY(s) 1)T+(Z(s) 2)T・(SY(s) 2)T} …(11)
となる。なお、式(10)の演算によって回帰係数の推定値が求まることは、例えば「中溝高好 (1988) “信号解析とシステム同定”コロナ社 10-11.」に記載されている。
T^(s)(t)=(1,t,t2,...,tp−1)・β^(s) LSE …(12)
を算出する(ステップS20)。なお、推定関数T^(s)(t)はすべてのサンプリング時刻t={1,2,.....,n}上の関数である。
算出された推定関数T^(s)(t)はパラメータpとともにメモリ12のテーブル領域12bに送られ、そこで相互に対応付けられて格納される。また、推定関数T^(s)(t)は次数選択手段14(図2)にも送られる。
次に次数選択手段14のノイズ項算出手段14a(図4(a))が、メモリ12の観測データ領域12a(図2)からサンプリング時刻t=t’に対応する時系列データy(s) t’を読み出し、これとこれに対応する推定関数T^(s)(t’)を用い、ノイズ項
u(s) t=y(s) t−T^(s)(t) …(13)
を算出してレジスタ14b(図4(a))に格納する(ステップS22)。
t’>nとなると、分散算出手段14c(図4(a))が、レジスタ14bからノイズ項u(s) t(t={1,2,...,n})を読み出し、これを用いてノイズ項u(s) tの分散σ(s) 2を算出する(ステップS25)。算出された分散σ(s) 2は最大対数尤度算出手段14dに送られ、最大対数尤度算出手段14dは、メモリ12の観測データ領域12aからサンプリング時刻tの最大値nを抽出する。そして、最大対数尤度算出手段14dは、これらtの最大値n及び分散σ(s) 2を用い、モデルy(s) t=T^(s)(t)+u(s) tの最大対数尤度
ML(s)=const−n・(lnσ(s) 2)/2 …(14)
を算出する(ステップS26)。なお「const」は定数を示す。算出された最大対数尤度ML(s)は情報量基準算出手段14eに送られ、情報量基準算出手段14eは、情報量基準
AIC(s)(p)=−2log(ML(s))+2(p+1) …(15)
を算出し、それをメモリ12のテーブル領域12b(図2)にパラメータpと対応付けて格納する(ステップS27)。
まず、欠測値の区間を示すサンプリング時刻t1,t2及び{ut}について以下のような仮定を設定する。
[仮定1]
(i)t1=[αn](0<α<1)、t2=[(1−γ)n](0<γ<1)そしてα+γ<1、ここで[・]はガウス記号を示す。
(ii){ut}は以下に定義される定常過程である。
ノイズ項からなる転置ベクトルU1=(u1,u2,...,u(t1))Tと、U2=(u(t2)+1,u(t2)+2,...,un)Tとを用いて、U≡(u1,u2,...,u(t1),u(t2)+1,u(t2)+2,...,un)T=(U1 T,U2 T)Tとする。
前述の式(10)(11)から回帰係数の推定値の誤差は、
β^(s) LSE-β=(Z(s)・TZ(s))-1・TZ(s)・U={(Z(s) 1)T・Z(s) 1+(Z(s) 2)T・Z(s) 2}-1・{(Z(s) 1)T・U1+(Z(s) 2)T・U2}
となる。また、Sn≡diag{s1,...,sp}が成り立つとする。ここで、Sj 2=z1j T・z1j+z2j T・z2jである。なお、以下の証明では、Z(s) 1 ,(Z(s) 1)T,Z(s) 2 ,(Z(s) 2)Tを、それぞれZ1 ,Z1',Z2 ,Z2'と表す。
次に本形態における非定常時系列データ分類手法が妥当であるかどうかを、モンテカルロシミュレーション実験(津田孝夫(1992)「モンテカルロ法とシミュレーション」培風館 参照)により検討する。
<シミュレーションに使用するサンプル>
このシミュレーションでは、実際の観測データを用いるのではなく、以下のように人工的に生成したサンプルを用いてデータ傾向の分類を行った。
・回帰係数β=(β0,β1,...,βp−1)T:−0.8から0.8の間の擬似乱数を採用
・トレンド関数:T(t)=β0+β1t+...+βp−1tp−1
(ただし、所定の値を超える項については、その値以下となるような補正を行った)
・ノイズ項ut:平均0、分散1の白色雑音系列を採用
・サンプリング点の数:n=100
・サンプルデータ値:yt=T(t)+ut
・欠測値の位置:任意に決定
・サンプル数:20
図8(a)は、このように生成された20個のサンプルを示したグラフである。なお、これらのグラフにおける横軸はサンプリング時刻tであり、縦軸はサンプルデータ値ytである。また、各グラフの上部に付された番号は各サンプルを示すパラメータsの値である。
このシミュレーションでは、図8(a)のサンプルに対し、前述した非定常時系列データ分類手法を適用する。
図8(b)は、図8(a)のサンプルに対し、本形態の非定常時系列データ分類手法を適用した場合に生成されるトレンド関数の推定関数T^(s)(t)(T^(s)(t) for AIC(s)(p)min)を示したグラフである。なお、これらのグラフにおける横軸はサンプリング時刻tであり、縦軸は推定関数T^(s)(t)の出力値である。また、各グラフの上部に付された番号はsの値である。
図9は、このように生成された樹形図である。なお、この図における横軸の数字は各サンプルを示すパラメータsの値を示し、縦軸は高さ(判別基準からの距離)を示している。
次に、本形態の手法の実データへの適用例を示す。
<実データ>
乳幼児音声データベースから、24ヶ月齢の子とその父母のF0データに対し、本形態のデータ分類手法を適用した。このデータベースは、5組の日本人の乳幼児とその両親の音声を長期的に収録したものである。乳幼児は東京近郊に生まれ育ち、その両親は標準語を日常語として話す。デジタルオーディオテープレコーダで、彼らの自宅で静かな環境の中、日常会話を録音した。その際、特別なタスクは設けていない。子の誕生から5年間に渡り、月に1から4時間程度の頻度でおこなった。そのデータベースは、音声ファイルに変換され、F0、発話の特性、時間などと共にデータベースに収められている。データベースに関する詳しい情報は、「Amano, S. , Nakatani, T. and Kondo, T. (2003) “Fundamental frequency analysis of longitudinal recording in a Japanese infant speech database”, In: Proceedings of ICPhS-2003, 1983-1986, Aug.」参照。
F0データを解析する際に問題となるのは、F0データの長さ、すなわち発話長に依存したデータ長は、当然発話ごとに異なる。そこで最も頻度が高い、すなわち最も頻度高く発話している発話長に相当するデータ長付近のデータを対象とすることにする。乳児、母親は300ms、600msのデータ長付近のデータを取り扱った。父親はデータ数が全体的に少ないため、200msから400msの間のデータ長を取り上げた。母親の発話のF0パタンを図10に示す。なお、図10の各グラフの上部にふされた数字は各サンプルを示すパラメータsの値である。このデータに対し、前述した多項式回帰モデルを適用し、トレンド関数の推定を行う。その後におこなう判別分析の際、データ長が揃っていることが望ましいので、トレンド関数の推定関数T^(s)(t)をリサンプリングし、データ長を揃えた。具体的には式(16)を計算する際、推定関数T^(s)(t)に対し、各発話を通して最大振幅と最小振幅の差で規格化した。また、判別関数の算出は、図10における3番目と22番目のサンプルに対応するトレンド関数の推定関数T^(3)(t),T^(22)(t)を判別基準T^(r)(t)とし、判別関数D^(s,3,22)(s={1,...,46})を算出した(式(16))。
以上説明した通り、本形態の手法により、F0データの変動傾向を特定のパタンに分類することに成功した。これにより、従来マニュアルで行われていたF0パタン分析を客観的な統計的測度に基づいて行うことが可能となった。
また、上述の構成をコンピュータによって実現する場合、上述の装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。
12 メモリ
13 推定関数生成手段
14 次数選択手段
15 判別分析手段
16 クラスター分析手段
Claims (8)
- コンピュータを、推定関数生成手段と、基準関数設定手段と、判別関数生成手段と、クラスター分析手段と、を有する非定常時系列データ分類装置として機能させて実行し、一部が欠測した観測値の時系列データの傾向を分類する非定常時系列データ分類方法であって、
サンプルsのサンプリング時刻tにおける上記時系列データy(s) tがメモリに格納されており、
上記推定関数生成手段が、ytをサンプリング時刻tにおける観測値を示す時系列データとし、*Tを*の転置とし、T(t)を時系列データytの変動傾向を示すトレンド関数T(t)=β0+β1t+...+βp−1tp−1とし、(β0,β1,...,βp−1)Tを回帰係数βとし、utをノイズ値とした場合における、多項式回帰モデルyt=T(t)+utに対し、メモリに格納された上記時系列データy(s) t のうち、欠測値以外の時系列データを結合して得られた欠測値を含まない時系列データy (s) t ’を適用し、yt=y (s) t ’とした場合における多項式回帰モデルyt=T(t)+utのトレンド関数T(t)の推定関数T^(s)(t)をサンプルsごとに算出し、算出した推定関数T^(s)(t)をメモリに格納する手順と、
上記基準関数設定手段が、メモリに格納されている上記推定関数T^(s)(t)から、2個以上の推定関数T^(s)(t)を選択し、選択した推定関数T^(s)(t)を判別基準T^(r)(t)(r∈s)としてメモリに格納する手順と、
上記判別関数生成手段が、メモリから2つの判別基準T^(r1)(t),T^(r2)(t)(r1,r2∈r、r1≠r2)を抽出し、上記推定関数T^(s)(t)に対する判別関数
(nはtの最大値)
を生成してメモリに格納する手順と、
上記クラスター分析手段が、メモリから上記判別関数D^(s,r1,r2)を抽出し、当該判別関数D^(s,r1,r2)を用い、メモリから読み出した上記推定関数T^(s)(t)のクラスター分析を行い、その分析結果を出力する手順と、
を実行する非定常時系列データ分類方法。 - 請求項1記載の非定常時系列データ分類方法であって、
上記推定関数T^(s)(t)を算出する手順は、
上記推定関数生成手段が、
最小二乗法によって、上記時系列データy(s) tから上記回帰係数βの推定値である回帰係数推定値β^(s) LSEを算出し、
T^(s)(t)=(1,t,t2,...,tp−1)・β^(s) LSE
の演算によって上記推定関数T^(s)(t)を算出する手順であり、
上記pは、モデルy(s) t=T^(s)(t)+u(s) tの情報量基準AIC(s)(p)を最小値化する値である、
ことを特徴とする非定常時系列データ分類方法。 - 請求項1又は2記載の非定常時系列データ分類方法であって、
上記推定関数生成手段は、分離ベクトル生成手段と、ベクトル結合手段と、転置ベクトル生成手段と、行列生成手段と、行列結合手段と、転置行列生成手段と、係数推定値算出手段と、係数乗算手段とを有し、
上記推定関数T^(s)(t)を算出する手順は、
上記分離ベクトル生成手段が、上記サンプルsごとの各時系列データy(s) tを、欠測値前後の時系列データ列である分離ベクトルSY(s) iに分離する手順と、
上記ベクトル結合手段が、上記分離ベクトルSY(s) iを結合した結合ベクトルY(s)を生成する手順と、
上記転置ベクトル生成手段が、上記結合ベクトルY(s)の転置ベクトルTY(s)を生成する手順と、
上記行列生成手段が、上記欠測値前後のサンプリング時刻列ごとに、従属変数(1,t,t2,…,tp−1)を行とする従属変数行列Z(s) iを生成する手順と、
上記行列結合手段が、上記従属変数行列Z(s) iを結合した結合行列Z(s)を生成する手順と、
上記転置行列生成手段が、上記結合行列Z(s)の転置行列TZ(s)を生成する手順と、
上記係数推定値算出手段が、上記トレンド関数の回帰係数推定値
β^(s) LSE=(Z(s)・TZ(s))−1・TZ(s)・TY(s)
を算出する手順と、
上記係数乗算手段が、上記推定関数
T^(s)(t)=(1,t,t2,...,tp−1)・β^(s) LSE
を算出する手順と、を有する、
ことを特徴とする非定常時系列データ分類方法。 - 請求項3記載の非定常時系列データ分類方法であって、
上記推定関数T^(s)(t)を算出する手順の後に行われる、
ノイズ項算出手段が、上記時系列データy(s) t及びこれに対応する上記推定関数T^(s)(t)を用い、ノイズ項u(s) t=y(s) t−T^(s)(t)を算出する手順と、
分散算出手段が、上記ノイズ項u(s) tの分散σ(s) 2を算出する手順と、
最大対数尤度算出手段が、tの最大値n及び上記分散σ(s) 2を用い、モデルy(s) t=T^(s)(t)+u(s) tの最大対数尤度
ML(s)=const−n・(ln σ(s) 2)/2
を算出する手順と、
情報量基準算出手段が、情報量基準AIC(s)(p)=−2log(ML(s))+2(p+1)を算出してメモリに格納する手順と、を有し、
上記従属変数行列Z(s) iを生成する手順から上記情報量基準AIC(s)(p)を算出してメモリに格納する手順までは、pの値を更新しながら所定回数繰り返され、
上記判別関数を生成する手順は、
上記情報量基準AIC(s)(p)を最小値化するpに対応する上記推定関数T^(s)(t)から判別関数を生成する手順である、
ことを特徴とする非定常時系列データ分類方法。 - 請求項1から4の何れかに記載の非定常時系列データ分類方法であって、
上記時系列データy(s) tは、
音声の基本周波数(F0)データである、
ことを特徴とする非定常時系列データ分類方法。 - 一部が欠測した観測値の時系列データの傾向を分類する非定常時系列データ分類装置であって、
サンプルsのサンプリング時刻tにおける上記時系列データy(s) tを格納するメモリと、
ytをサンプリング時刻tにおける観測値を示す時系列データとし、*Tを*の転置とし、T(t)を時系列データytの変動傾向を示すトレンド関数T(t)=β0+β1t+...+βp−1tp−1とし、(β0,β1,...,βp−1)Tを回帰係数βとし、utをノイズ値とした場合における、多項式回帰モデルyt=T(t)+utに対し、メモリに格納された上記時系列データy(s) t のうち、欠測値以外の時系列データを結合して得られた欠測値を含まない時系列データy (s) t ’を適用し、yt=y(s) t ’とした場合における多項式回帰モデルyt=T(t)+utのトレンド関数T(t)の推定関数T^(s)(t)をサンプルsごとに算出し、算出した推定関数T^(s)(t)をメモリに格納する推定関数生成手段と、
メモリに格納されている上記推定関数T^(s)(t)から、2個以上の推定関数T^(s)(t)を選択し、選択した推定関数T^(s)(t)を判別基準T^(r)(t)(r∈s)としてメモリに格納する基準関数設定手段と、
メモリから2つの判別基準T^(r1)(t),T^(r2)(t)(r1,r2∈r、r1≠r2)を抽出し、上記推定関数T^(s)(t)に対する判別関数
(nはtの最大値)
を生成してメモリに格納する判別関数生成手段と、
メモリから上記判別関数D^(s,r1,r2)を抽出し、当該判別関数D^(s,r1,r2)を用い、メモリから読み出した上記推定関数T^(s)(t)のクラスター分析を行い、その分析結果を出力するクラスター分析手段と、
を有することを特徴とする非定常時系列データ分類装置。 - 請求項1から5の何れかに記載の非定常時系列データ分類方法の各手順をコンピュータに実行させるためのプログラム。
- 請求項7記載のプログラムを格納したコンピュータ読取可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004245275A JP4542395B2 (ja) | 2004-08-25 | 2004-08-25 | 非定常時系列データ分類方法、装置、プログラム及びそのプログラムを記録した記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004245275A JP4542395B2 (ja) | 2004-08-25 | 2004-08-25 | 非定常時系列データ分類方法、装置、プログラム及びそのプログラムを記録した記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006064847A JP2006064847A (ja) | 2006-03-09 |
JP4542395B2 true JP4542395B2 (ja) | 2010-09-15 |
Family
ID=36111420
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004245275A Expired - Fee Related JP4542395B2 (ja) | 2004-08-25 | 2004-08-25 | 非定常時系列データ分類方法、装置、プログラム及びそのプログラムを記録した記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4542395B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5188300B2 (ja) * | 2008-07-14 | 2013-04-24 | 日本電信電話株式会社 | 基本周波数軌跡モデルパラメータ抽出装置、基本周波数軌跡モデルパラメータ抽出方法、プログラム及び記録媒体 |
CN116541784B (zh) * | 2023-07-04 | 2023-09-26 | 乐山师范学院 | 一种基于字典树和覆盖度的时间序列分类方法及装置 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003132214A (ja) * | 2001-10-25 | 2003-05-09 | Kenji Nishihara | 相場を構成する全要素の時間的推移のパターンを一覧表示した相場情報表示方法とその装置 |
-
2004
- 2004-08-25 JP JP2004245275A patent/JP4542395B2/ja not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003132214A (ja) * | 2001-10-25 | 2003-05-09 | Kenji Nishihara | 相場を構成する全要素の時間的推移のパターンを一覧表示した相場情報表示方法とその装置 |
Also Published As
Publication number | Publication date |
---|---|
JP2006064847A (ja) | 2006-03-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Dibazar et al. | Feature analysis for automatic detection of pathological speech | |
Iliev et al. | Spoken emotion recognition through optimum-path forest classification using glottal features | |
US20100332222A1 (en) | Intelligent classification method of vocal signal | |
Rashmi | Review of algorithms and applications in speech recognition system | |
JP2019101391A (ja) | 系列データ変換装置、学習装置、及びプログラム | |
Mousavi et al. | Persian classical music instrument recognition (PCMIR) using a novel Persian music database | |
Korvel et al. | Speech analytics based on machine learning | |
Nivetha | A survey on speech feature extraction and classification techniques | |
Lakshminarayanan et al. | A syllable-level probabilistic framework for bird species identification | |
Krishnaiah et al. | Automatic Music Mood Classification using Multi-class Support Vector Machine based on Hybrid Spectral Features. | |
JP4542395B2 (ja) | 非定常時系列データ分類方法、装置、プログラム及びそのプログラムを記録した記録媒体 | |
Guerrero-Turrubiates et al. | Guitar chords classification using uncertainty measurements of frequency bins | |
Paul et al. | A hybrid feature-extracted deep CNN with reduced parameters substitutes an End-to-End CNN for the recognition of spoken Bengali digits | |
Burlet | Guitar tablature transcription using a deep belief network | |
Tulics et al. | Possibilities for the automatic classification of functional and organic dysphonia | |
Sardar et al. | Speaker identification of whispering sound: effectiveness of timbral audio descriptors | |
CN112735442B (zh) | 一种具有音频分离声纹识别的湿地生态监测系统及其音频分离方法 | |
Shahriar et al. | On the Impact of Deep Learning and Feature Extraction for Arabic Audio Classification and Speaker Identification | |
WO2024038560A1 (ja) | 学習装置、推定装置、学習方法、及びプログラム | |
Arora et al. | Discriminative PLCA based polyphonic source identification | |
Khan et al. | Time warped continuous speech signal matching using Kalman filter | |
Kale et al. | Voice based biometric system feature extraction using mfcc and lpc technique | |
Canpolat | Novel approach to emotion recognition in voice: a convolutional neural network approach and grad-cam generation | |
Vetráb et al. | Aggregation Strategies of Wav2vec 2.0 Embeddings for Computational Paralinguistic Tasks | |
Dass | The Comparative Analysis of Speech Processing Techniques at Different Stages |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060719 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20060719 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20090119 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090210 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090330 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20091013 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091117 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100615 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100625 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130702 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |