JP4542395B2 - 非定常時系列データ分類方法、装置、プログラム及びそのプログラムを記録した記録媒体 - Google Patents

非定常時系列データ分類方法、装置、プログラム及びそのプログラムを記録した記録媒体 Download PDF

Info

Publication number
JP4542395B2
JP4542395B2 JP2004245275A JP2004245275A JP4542395B2 JP 4542395 B2 JP4542395 B2 JP 4542395B2 JP 2004245275 A JP2004245275 A JP 2004245275A JP 2004245275 A JP2004245275 A JP 2004245275A JP 4542395 B2 JP4542395 B2 JP 4542395B2
Authority
JP
Japan
Prior art keywords
series data
function
memory
time series
procedure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004245275A
Other languages
English (en)
Other versions
JP2006064847A (ja
Inventor
比呂子 加藤
正信 谷口
智広 中谷
成昭 天野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2004245275A priority Critical patent/JP4542395B2/ja
Publication of JP2006064847A publication Critical patent/JP2006064847A/ja
Application granted granted Critical
Publication of JP4542395B2 publication Critical patent/JP4542395B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、非定常な時系列データの分類を行う技術に係り、特に、音声基本周波数F0のような欠測値を含む非定常な時系列データを分析する方法、装置、プログラム及びそのプログラムを記録した記録媒体に関する。
発達心理学の分野では、親と子の音声の基本周波数(F0)パタンについて類似性を分類し、子の月齢増加に伴いパタン類似性がどのように変化するかという先行研究がある。音声のF0は、発話のイントネーションやアクセント等の韻律情報を含み、発声器官の発達、性差、加齢に伴い変化するため、その特性は人間の言語獲得のメカニズムを明らかにする情報を含んでいると考えられる。F0パタン解析はそれらの情報を抽出するために必要で、その分析過程の一環として、客観的なパタン分類手法が要求される。
一方、データの時系列分類の研究は様々な手法が提案されている。例えば、データマイニングでは、シーケンシャルな記号列や、欠測値のない時系列データに対して、全区間あるいは小区間ごとで時系列間の距離を計算して行うクラスタリング等が提案されている(例えば、非特許文献1参照。)。また、時系列解析の分野では、判別分析を基礎とした時系列分類がよく議論されている(例えば、非特許文献2参照。)。
Keogh, E., Lin, J. and Truppel, W. (2003) "Clustering of time series subsequences is meaningless: implications for previous and future research", ICDM. Taniguchi, M. and Kakizawa, Y. (2000) Asymptotic Theory of Statistical Inference for Time Series, 477-534, Springer in statistics. springer-verlag New York.
しかし、従来、F0パタンのような欠測値を含む非定常時系列データを客観的な測度に基づき分類する方法は開示されていなかった。
すなわち、F0データは、有声音と無声音とから成り、この無声音を欠測値する時系列データとみなすことができる。ところが、従来の時系列分類は、データ全区間に対し定常性を仮定したスペクトル密度関数か、或いは局所定常性を仮定することによって得られた時変スペクトル密度関数間の測度により分類する手法が主流であり、欠測値を含む非定常時系列データに対するアプローチはなされていない。そのため、従来、F0パタンのような欠測値を含む非定常時系列データに客観的な測度に基づく統計解析を適用することはできず、F0パタンの分類は手作業で行うしかなかった。
この発明はこのような点に鑑みてなされたものであり、欠測値を含む非定常時系列データを客観的な測度に基づき分類することが可能な技術を提供することを目的とする。
この発明では上記課題を解決するために、欠測値を含む時系列データの変動傾向をトレンド推定値として求めるために、多項式回帰モデルを適用する。
すなわち、まず多項式回帰モデルを適用し、時系列データy(s) の変動傾向を示すトレンド関数の推定関数T^(s)(t)をサンプルsごとに算出する。次に、この推定関数T^(s)(t)から判別関数を生成し、その判別関数を用いて推定関数T^(s)(t)のクラスター分析を行い、その分類結果を出力する。
ここで、好ましくは、推定関数T^(s)(t)の算出は、最小二乗法によって、時系列データy(s) からトレンド関数の回帰係数推定値β^(s) LSEを算出し、
T^(s)(t)=(1,t,t,...,tp−1)・β^(s) LSE
によって行う。なお、この次数pはモデルy(s) =T^(s)(t)+u(s) の情報量基準AIC(s)(p)を最小値化する値である。また、判別関数は、好ましくは二群判別分析によって生成される。
この発明では、多項式回帰モデルを適用して、欠測値を含む時系列データの変動傾向を示すトレンド関数の推定関数T^(s)(t)を算出し、この推定関数T^(s)(t)を用いてパタン分類を行うこととしたため、F0パタンのような欠測値を含む非定常時系列データを客観的な測度に基づき分類することが可能となる。
以下、この発明の実施の形態を説明する。なお、以下ではまず本形態の原理について説明を行った後、その装置及び処理について説明を行う。
〔本形態の原理〕
<基本的枠組み>
本形態の基本的枠組みは、1.音声の基本周波数(F0)データのような欠測値を含む時系列データに対して多項式回帰モデルを適用し、その変動パタンを示すトレンド関数を推定し、2.推定されたトレンド関数に対して2群判別分析を適用して判別関数を生成し、3.判別関数をもとに最近隣接法でパタンを分類することである。
<欠測値を含む時系列データに対する多項式回帰モデルの適用>
F0データのような欠測値を含む時系列データに対し、
=T(t)+u …(1)
という時系列回帰モデルを導入する。
ここで、{t}はサンプリング時刻を示す離散値であり、{y}は各サンプリング時刻tにおける観測値を示す時系列データである。なお、各{y}は、F0データのような欠測値を含む時系列データであり、あるサンプリング時刻tにおける時系列データは存在しない(欠測値)。例えば、欠測値の区間がサンプリング時刻t<t≦tの区間であった場合、式(1)は
=T(t)+u ,t∈{1,2,...,t}∪{t+1,t+2,...,n}…(2)
と記述される。なお、nはサンプリング時刻tの最大値である。
また{T(t)}は、時系列データの傾向を示すトレンド関数であり、回帰係数
β≡(β,β,...,βp−1∈R
に対して、
T(t)=β+βt+...+βp−1p−1
と表される。ここで、*は*の転置行列を示し、Rはp次の実数を示す。また{≡}は左辺を右辺のように定義することを意味する。なお、トレンド関数は全区間(t={1,2,...,n})で定義される。
また、{u}はノイズ値を示すノイズ項であり、定常過程とする。
本形態では、このように定義された時系列回帰モデルを用い、欠測値を有する時系列データから、回帰係数βの最小二乗推定値である回帰係数推定値β^(s) LSEを求め、全区間(t={1,2,...,n})におけるトレンド関数の推定関数
T^(s)(t)=(1,t,t,...,tp−1)・β^(s) LSE …(3)
求める。なお、この例における次数pの決定は、赤池情報量規準
AIC(s)(p)=−2log(最大対数尤度)+2(p+1)
を適用して行う(例えば、中溝高好 (1988)「信号解析とシステム同定」コロナ社 201-205.参照)。またsは各サンプルを示すパラメータであり、ここでいう「サンプル」とは、1つの観測結果に対応する時系列データ列を意味する。
<推定関数に対する2群判別分析の適用>
式(1)で示された時系列データが、以下のような2つのカテゴリのどちらかに分類されると考える:
Π:トレンド関数T(t)をもつ式(1)のモデル
Π:トレンド関数T(t)をもつ式(1)のモデル
そして、トレンド関数T(t)をもつ新しい観測値が得られた場合に、
Figure 0004542395
のような距離測度を基準にして分類することにする。実際の問題では、トレンド関数T(t)は未知である。そこで、式(3)で定義された推定関数T^(s)(t)を式(4)のT(t)に代入したものを距離測度とする。故に、分類手順では、L(T^(s)(t):T)>L(T^(s)(t):T)という関係を満たすときにカテゴリΠに属すると判断し、それ以外の場合にはカテゴリΠに属すると判断する。
また、上述した2カテゴリに分類する判別手法はシンプルであるが、これをkカテゴリの判別に拡張することができる。この場合、式(1)で示された時系列データが、以下のようなk個のカテゴリのいずれかに分類されると考える:
Π:トレンド関数T(t)をもつ式(1)のモデル ,r={1,2,...,k}
また、その分類手順としては、すべてのr(r,r∈r,r≠r)に対して、L(T^(s)(t):Tr2)>L(T^(s)(t):Tr1)という関係を満たすときに、その推定関数T^(s)(t)はカテゴリΠr1に属すると判断する。
〔装置及び処理〕
<概要>
図1は、一部が欠測した観測値の時系列データの傾向を分類する非定常時系列データ分類方法を例示した図である。
本形態の方法では、前処理において各サンプルsのサンプリング時刻tに対応する時系列データy(s) がメモリに格納されている。
分類処理が開始されると、まずこのメモリから時系列データy(s) が読み込まれる(ステップS1)。そして、上述の多項式回帰モデルを適用して、この時系列データy(s) のサンプルsごとの変動傾向を示すトレンド関数の推定関数T^(s)(t)=(1,t,t,...,tp−1)・β^(s) LSEが生成される(ステップS2)。ここで、次数pは情報量基準AIC(s)(p)を最小値化するように決定され、回帰係数推定値β^(s) LSEは最小二乗法によって算出される。
次に、生成された推定関数T^(s)(t)に二群判別分析を適用して判別関数が生成される(ステップS3)。この例の場合、二群判別分析の判別基準T^(r)(t)は、ステップS2で生成された推定関数T^(s)(t)から選択される。そして、生成された判別関数を用い、最近隣接法等により推定関数T^(s)(t)のクラスター分析が行われ(ステップS4)、その分析結果が出力される(ステップS5)。
<詳細>
次に、本形態における装置及び処理の詳細について説明する。
図2は、本形態における非定常時系列データ分類装置1全体の機能構成を例示したブロック図である。なお、本形態の非定常時系列データ分類装置1は、例えば、CPU(central processing unit)、RAM(Random Access Memory)、ROM(Read Only Memory)等がバスで接続されたノイマン型コンピュータに所定のプログラムを実行させることにより構築されるものである。また、図3は、図2における推定関数生成手段13の詳細構成を例示したブロック図であり、図4(a)は、次数選択手段14の詳細構成を例示したブロック図であり、図4(b)は、判別分析手段15の詳細構成を例示したブロック図である。なお各ブロック図中の矢印はデータの流れを示し、そのデータの出力元と出力先とが情報のやり取り可能に接続されていることを示しているが、制御手段11から出入りするデータの流れ及び接続に関する記載は省略してある。
また、図5及び図6は、制御手段11の制御のもと、非定常時系列データ分類装置1が実行するデータ分類処理を説明するための図である。
以下、これらの図を用いて非定常時系列データ分類装置1の構成及び処理について説明する。
<前処理>
まず前処理として、サンプルs(s={1,2,...,smax})のサンプリング時刻tにおける時系列データy(s) がメモリ12の観測データ領域12a(図2)に格納される。
この時系列データy(s) は、一部が欠測した観測値の時系列データであり、例えば、マイクロホン等により観測した周波数領域の音声信号を短時間離散フーリエ変換等によって時間領域に変換し、その時間領域データの逆数をとること等によって生成されるF0データ等である。図7(a)はこのようなF0データを例示したグラフである。ここで、図7(a)のグラフの縦軸はlogF0/(F0の平均値)を示し、横軸はサンプリング時刻tを示している。図7(a)に例示するように、このF0データはt=410msec〜490msec付近で欠測している。なおF0データの場合、この欠測部分は無声音部分に相当する。
図7(b)は、メモリ12の観測データ領域12aに格納される時系列データy(s) のデータ構造の例示である。この例の時系列データy(s) はサンプリング時刻t+1≦t≦tの区間が欠測した
{y;t=1,...,t,t+1,...,n} …(5)
というデータであり、各サンプリング時刻tとその時系列データy(s) とが対応付けられて格納されている。また、欠測区間のサンプリング時刻t+1≦t≦tに対応する時系列データは存在せずnull値となっている。なお、yの下付き添え字の(t1)はtを示し、(t2)はtを示す。また、図7(b)はサンプリング時刻t+1≦t≦tの一箇所のみが欠測している場合の例であるが、複数箇所が欠測しているデータの場合も同様である。すなわち、時系列データが存在するサンプリング時刻tにその時系列データy(s) が対応付けられて格納され、時系列データが存在しないサンプリング時刻tにはnull値が対応付けられる。なお、メモリ12の観測データ領域12aに格納されるサンプリング時刻tと時系列データy(s) との組をY(s) と表現する。
<データ分類処理>
次に、前処理によってメモリ12観測データ領域12aに格納された時系列データy(s) の分類処理について例示する。
まず、推定関数生成手段13(図2)が、多項式回帰モデルを適用し、メモリ12の観測データ領域12aに格納された時系列データy(s) の変動傾向を示すトレンド関数の推定関数T^(s)(t)をサンプルsごとに算出する。本形態では、最小二乗法によって、時系列データy(s) からトレンド関数の回帰係数推定値β^(s) LSEを算出し、T^(s)(t)=(1,t,t,...,tp−1)・β^(s) LSEの演算によって推定関数T^(s)(t)を算出する。
まず、制御手段11が、サンプルを特定するパラメータsに1を代入し(ステップS11)、次数を特定するパラメータpに1を代入する(ステップS12)。なお、これらの代入結果はレジスタ11a(図2)に格納される。
次に、分離ベクトル生成手段13a(図3)が、メモリ12の観測データ領域12a(図2)にアクセスし、サンプルsの各サンプリング時刻tにおける時系列データy(s) の列を読み出す。そして、分離ベクトル生成手段13aは、これを欠測値前後の時系列データ列である分離ベクトルSY(s) (欠測値を含まない時系列データ)に分離する(ステップS13)。例えば、式(5)の例の場合、欠測区間はサンプリング時刻t+1≦t≦tの一箇所のみであり、この各サンプリング時刻tにおける時系列データy(s) の列は、以下のような2つの分離ベクトルSY(s) ,SY(s) に分離される。
SY(s) =(y,y,...,y(t1)),SY(s) =(y(t2)+1,y(t2)+2,...,y) …(6)
なお、この例では、欠測区間が1箇所のみであるため2つの分離ベクトルSY(s) ,SY(s) に分離されるが、欠測区間がx箇所あった場合には、x+1個の分離ベクトルSY(s) (i={1,2,...,x+1})に分離されることになる。
このように生成された各分離ベクトルSY(s) はベクトル結合手段13bに送られ、ベクトル結合手段13bは、これらの分離ベクトルSY(s) を結合した結合ベクトルY(s)を生成する(ステップS14)。例えば、式(6)の例の場合、ベクトル結合手段13bは、結合ベクトル
(s)=(y,y,...,y(t1),y(t2)+1,y(t2)+2,...,y) …(7)
を生成する。
生成された結合ベクトルY(s)は、転置ベクトル生成手段13cに送られ、転置ベクトル生成手段13cは、この結合ベクトルY(s)の転置ベクトルTY(s)を生成して、レジスタ13gに格納する(ステップS15)。
また、行列生成手段13dが、メモリ12の観測データ領域12a(図2)にアクセスし、サンプルsに係る欠測値前後のサンプリング時刻tの列を読み出す。例えば、式(5)の例の場合、t=1,...,tというサンプリング時刻列と、t=t+1,...,nというサンプリング時刻列とが読み出される。さらに、行列生成手段13dはレジスタ11a(図2)からパラメータpを読み出す。これらを読み出した行列生成手段13dは、読み出した欠測値前後のサンプリング時刻列ごとに、このサンプリング時刻列を構成する各サンプリング時刻tに対応する従属変数(1,t,t,…,tp−1)を行とする従属変数行列Z(s) を生成する(ステップS16)。例えば、t=1,...,tというサンプリング時刻列と、t=t+1,...,nというサンプリング時刻列とが読み出されていた場合、行列生成手段13dは、以下のような従属変数行列Z(s) ,Z(s) を生成する。
Figure 0004542395
生成された従属変数行列Z(s) は行列結合手段13eに送られ、行列結合手段13eは、送られた従属変数行列Z(s) を列方向(縦)に結合した結合行列Z(s)を生成し、レジスタ13gに格納する(ステップS17)。例えば、式(8)の例の場合には、
Figure 0004542395
という結合行列が生成・格納される。
生成された結合行列Z(s)はさらに転置行列生成手段13fにも送られ、転置行列生成手段13fは、結合行列Z(s)の転置行列TZ(s)を生成し、レジスタ13gに格納する(ステップS18)。
次に、係数推定値算出手段13hが、レジスタ13gから転置ベクトルTY(s)、結合行列Z(s)、転置行列TZ(s)を読み出し、これらを用いてトレンド関数の回帰係数推定値
β^(s) LSE=(Z(s)・TZ(s)−1・TZ(s)・TY(s) …(10)
を算出する(ステップS19)。例えば、式(7)〜(9)の例の場合、式(10)の右辺は、
β^(s) LSE={(Z(s) ・Z(s) +(Z(s) ・Z(s) −1・{(Z(s) ・(SY(s) +(Z(s) ・(SY(s) } …(11)
となる。なお、式(10)の演算によって回帰係数の推定値が求まることは、例えば「中溝高好 (1988) “信号解析とシステム同定”コロナ社 10-11.」に記載されている。
算出された回帰係数推定値β^(s) LSEは係数乗算手段13iに送られ、係数乗算手段13iは、さらにレジスタ11a(図2)からパラメータpを読み出し、トレンド関数の推定関数
T^(s)(t)=(1,t,t,...,tp−1)・β^(s) LSE …(12)
を算出する(ステップS20)。なお、推定関数T^(s)(t)はすべてのサンプリング時刻t={1,2,.....,n}上の関数である。
算出された推定関数T^(s)(t)はパラメータpとともにメモリ12のテーブル領域12bに送られ、そこで相互に対応付けられて格納される。また、推定関数T^(s)(t)は次数選択手段14(図2)にも送られる。
次数選択手段14は、モデルy(s) =T^(s)(t)+u(s) の情報量基準AIC(s)(p)を最小値化する値を次数pとして選択する。すなわちまず、制御手段11においてサンプリング時刻tの1つを示すパラメータt’に1を代入し、このパラメータt’をレジスタ11aに格納する(ステップS21)。
次に次数選択手段14のノイズ項算出手段14a(図4(a))が、メモリ12の観測データ領域12a(図2)からサンプリング時刻t=t’に対応する時系列データy(s) t’を読み出し、これとこれに対応する推定関数T^(s)(t’)を用い、ノイズ項
(s) =y(s) −T^(s)(t) …(13)
を算出してレジスタ14b(図4(a))に格納する(ステップS22)。
次に制御手段11(図2)が、レジスタ11aからパラメータt’を読み出し、これに1を加算した値を新たなパラメータt’としてレジスタ11aに格納する(ステップS23)。次に、制御手段11は、レジスタ11aに格納され最新のt’がt’>nであるか否かを判断し、t’>nとなるまでステップS22〜24までの処理を繰り返す(ステップS24)。これは、サンプルsに関するすべてのサンプリング時刻tにおけるノイズ項u(s) を算出することに相当する。
t’>nとなると、分散算出手段14c(図4(a))が、レジスタ14bからノイズ項u(s) (t={1,2,...,n})を読み出し、これを用いてノイズ項u(s) の分散σ(s) を算出する(ステップS25)。算出された分散σ(s) は最大対数尤度算出手段14dに送られ、最大対数尤度算出手段14dは、メモリ12の観測データ領域12aからサンプリング時刻tの最大値nを抽出する。そして、最大対数尤度算出手段14dは、これらtの最大値n及び分散σ(s) を用い、モデルy(s) =T^(s)(t)+u(s) の最大対数尤度
ML(s)=const−n・(lnσ(s) )/2 …(14)
を算出する(ステップS26)。なお「const」は定数を示す。算出された最大対数尤度ML(s)は情報量基準算出手段14eに送られ、情報量基準算出手段14eは、情報量基準
AIC(s)(p)=−2log(ML(s))+2(p+1) …(15)
を算出し、それをメモリ12のテーブル領域12b(図2)にパラメータpと対応付けて格納する(ステップS27)。
次に、制御手段11は、レジスタ11aに格納されている最新のパラメータpを抽出し、抽出したパラメータpがpmax(定められたpの最大値)であるか否か判断し(ステップS28)、p=pmaxとなるまで、パラメータpに1を加えた値を新たなパラメータpとしてレジスタ11aに格納し(ステップS29)ステップS16に戻る処理を繰り返す。すなわち、従属変数行列Z(s) を生成する手順(ステップS16)から情報量基準AIC(s)(p)を算出してメモリに格納する手順(ステップS27)までは、パラメータpの値を更新しながら所定回数繰り返される。これはp={1,2,...,pmax}におけるすべての情報量基準AIC(s)(p)を算出することに相当する。なお、pmaxの値が小さすぎると正確な分類ができず、逆に大きすぎると演算速度が遅くなる。そのため、pmaxの値は例えば5〜6程度が望ましい。
その後、推定関数選択手段14f(図4(a))が、メモリ12のテーブル領域12b(図2)にアクセスし、公知の並び替えアルゴリズム等を用い、サンプルsに対するAIC(s)(p)の最小値を求める。そして、推定関数選択手段14fは、このAIC(s)(p)を最小値化するpに対応する推定関数T^(s)(t)(T^(s)(t) for AIC(s)(p)min)をメモリ12のテーブル領域12b(図2)から選択し、選択関数領域12cに格納する(ステップS30)。次に、制御手段11が、レジスタ11aに格納されている最新のパラメータsを抽出し、パラメータsがsmax(sの最大値であり、メモリ12の観測データ領域12aに格納されたサンプル数)であるか否か判断する(ステップS31)。そして、制御手段11は、s=smaxと判断するまで、レジスタ11aに格納されている最新のパラメータsに1を加算した値を新たなパラメータsとして(ステップS32)レジスタ11aに格納し、ステップS12に戻る処理を繰り返す。これは、すべてのサンプルについて、AIC(s)(p)を最小値化するpに対応する推定関数T^(s)(t)(T^(s)(t) for AIC(s)(p)min)を求めることに相当する。
ステップS31でパラメータs=smaxと判断されると、次に判別分析手段15が、それぞれのパラメータs={1,2,...,smax}に対する判別関数を生成する。なお、判別関数の生成は、例えば情報量基準AIC(p)を最小値化するpに対応する推定関数T^(s)(t)を用い、二群判別分析によって行われる。
この例ではまず、基準関数設定手段15a(図4(b))が、2個以上の判別基準T^(r)(t)(r∈s)を設定してレジスタ15bに格納する(ステップS33)。この例の場合、基準関数設定手段15aは、メモリ12の選択関数領域12cに格納されている推定関数T^(s)(t)(T^(s)(t) for AIC(s)(p)min)のいずれかを判別基準T^(r)(t)として抽出し、レジスタ15bに格納する。なお、ノイズ項u(s) が発散しない場合、判別基準のT^(r)(t)間の距離が離れていれば離れているほど誤分類確率が低くなるため、できるだけ相互に距離が離れた推定関数T^(s)(t)を判別基準T^(r)(t)として選択することが望ましい。ここでT^(s1)(t)とT^(s2)(t)との距離とは、
Figure 0004542395
を意味する。
[T^(r)(t)間の距離が離れているほど誤分類確率が低くなることの証明]
まず、欠測値の区間を示すサンプリング時刻t,t及び{u}について以下のような仮定を設定する。
[仮定1]
(i)t=[αn](0<α<1)、t=[(1−γ)n](0<γ<1)そしてα+γ<1、ここで[・]はガウス記号を示す。
(ii){u}は以下に定義される定常過程である。
Figure 0004542395
を満たす。
Figure 0004542395
のようなスペクトル密度関数を持つ0平均定常過程となる。
また、以下のような仮定を設定する。
[仮定2]
Figure 0004542395
[定理]
上述した仮定1、2が成立する場合、次の理由により次式が成立する。
Figure 0004542395
を基礎とした分類が基本的に良好であることと、その判別関数が漸近正規性をもつことを意味する。
[定理の証明]
ノイズ項からなる転置ベクトルU=(u,u,...,u(t1)と、U=(u(t2)+1,u(t2)+2,...,uとを用いて、U≡(u,u,...,u(t1),(t2)+1,u(t2)+2,...,u=(U ,U とする。
前述の式(10)(11)から回帰係数の推定値の誤差は、
β^(s) LSE-β=(Z(s)・TZ(s))-1・TZ(s)・U={(Z(s) 1)T・Z(s) 1+(Z(s) 2)T・Z(s) 2}-1・{(Z(s) 1)T・U1+(Z(s) 2)T・U2}
となる。また、S≡diag{s,...,s}が成り立つとする。ここで、Sj 2=z1j T・z1j+z2j T・z2jである。なお、以下の証明では、Z(s) 1 ,(Z(s) 1)T,Z(s) 2 ,(Z(s) 2)Tを、それぞれZ1 ,Z1',Z2 ,Z2'と表す。
Figure 0004542395
が成り立つとする。
式(16)と仮定1(i)から
Figure 0004542395
となる。また、式(17)と同様に、以下の式を得ることができる。
Figure 0004542395
の漸近分散行列を評価する。
まず、
Figure 0004542395
ここで式(18)から、p×p行列A={Ajk}のとき、n→∞でA→Aとなる。σ(j)=E{ut+1}とすると(E{*}は*の平均値を示す)、式(18)と「E J Hannan, "Multiple time series" ,New York, Wiley [1970] , p.216」に記載された定理8から、以下の式を示す事ができる。
Figure 0004542395
ということがいえる。これは時間差が開くとノイズ項の相関も落ちてくるということを意味する。
そして、これと式(18)から以下の関係が成り立つ。
Figure 0004542395
従って、式(21)を式(19)に代入し、p×p行列A={Ajk}のとき、n→∞でA→Aとなることと、式(20)とにより、
Figure 0004542395
が成り立つことが分かる。
さて、判別問題に戻って、
Figure 0004542395
が成り立つことがいえる。ここで、w=(1,t,t,...,tp−1であり、T(t),T(t)はそれぞれT^(1)(t),T^(2)(t)に相当し、*’は、*の転置行列を意味する。
ここで式(22)から
Figure 0004542395
についても同様に証明できる(「T^(r)(t)間の距離が離れているほど誤分類確率が低くなることの証明」終わり)。
次に、判別関数生成手段15cが、レジスタ15bから2つの判別基準T^(r1)(t),T^(r2)(t)(r1,r2∈r,r1≠r2)を抽出し、メモリ12の選択関数領域12cからいずれかのパラメータsに対する推定関数T^(s)(t)(T^(s)(t) for AIC(s)(p)min)を読み出し、判別関数
Figure 0004542395
を生成してメモリ12の判別関数領域12d(図2)に格納する(ステップS34)。なお、このステップS34の処理は、r1,r2∈r、r1≠r2を満たすr1,r2の組と、r1,r2以外のパラメータs={1,2,...,smax}との組み合わせすべてについて行われる。
その後、クラスター分析手段16が、メモリ12の判別関数領域12dから判別関数D^(s,r1,r2)を抽出し、それを用いて推定関数T^(s)(t)のクラスター分析を行う(ステップS35)。この例では、最近隣接クラスター分析(「統計学辞典」東洋経済新報社 p.385 参照)を適用してクラスター分析を行い、その分析結果を樹形型で出力する。
〔シミュレーションによる手法の妥当性の検討〕
次に本形態における非定常時系列データ分類手法が妥当であるかどうかを、モンテカルロシミュレーション実験(津田孝夫(1992)「モンテカルロ法とシミュレーション」培風館 参照)により検討する。
<シミュレーションに使用するサンプル>
このシミュレーションでは、実際の観測データを用いるのではなく、以下のように人工的に生成したサンプルを用いてデータ傾向の分類を行った。
・次数p:1から4の間の整数からランダムに決定(擬似乱数を用いて生成)
・回帰係数β=(β,β,...,βp−1:−0.8から0.8の間の擬似乱数を採用
・トレンド関数:T(t)=β+βt+...+βp−1p−1
(ただし、所定の値を超える項については、その値以下となるような補正を行った)
・ノイズ項u:平均0、分散1の白色雑音系列を採用
・サンプリング点の数:n=100
・サンプルデータ値:y=T(t)+u
・欠測値の位置:任意に決定
・サンプル数:20
図8(a)は、このように生成された20個のサンプルを示したグラフである。なお、これらのグラフにおける横軸はサンプリング時刻tであり、縦軸はサンプルデータ値yである。また、各グラフの上部に付された番号は各サンプルを示すパラメータsの値である。
<本形態の非定常時系列データ分類手法の適用>
このシミュレーションでは、図8(a)のサンプルに対し、前述した非定常時系列データ分類手法を適用する。
図8(b)は、図8(a)のサンプルに対し、本形態の非定常時系列データ分類手法を適用した場合に生成されるトレンド関数の推定関数T^(s)(t)(T^(s)(t) for AIC(s)(p)min)を示したグラフである。なお、これらのグラフにおける横軸はサンプリング時刻tであり、縦軸は推定関数T^(s)(t)の出力値である。また、各グラフの上部に付された番号はsの値である。
また、このシミュレーションでは、3番目と18番目のサンプルに対応するトレンド関数の推定関数T^(3)(t),T^(18)(t)を判別基準T^(r)(t)とし、判別関数D^(s,3,18)(s={1,...,20})を算出した(式(16))。そして、これらの判別関数D^(s,3,18)に対して、最近隣接クラスター分析を適用し、樹形図描かせた。
図9は、このように生成された樹形図である。なお、この図における横軸の数字は各サンプルを示すパラメータsの値を示し、縦軸は高さ(判別基準からの距離)を示している。
この図に示すように、この推定関数T^(s)(t)は、右下がり(falling)と右上がり(rising)との2つの大きなカテゴリに分かれた。また、右下がり(falling)は、さらに直線的な右下がり(C1)、若干凸に近いカーブ(C2)及び波打った形状(C3)に分かれ、右上がり(rising)は、さらに指数関数的な右上がり(C4)と、直線的な右上がり(C6)と、波打った形状(C5)と分かれた。この結果より、全体的にデータの変動傾向を示すパタンが類似したもの同士で分類されたことが分かる。これにより、本形態の手法が、統計的に妥当で、実データに適用し得る手法であることを確認ことができた。
〔実データへの本形態の適用〕
次に、本形態の手法の実データへの適用例を示す。
<実データ>
乳幼児音声データベースから、24ヶ月齢の子とその父母のF0データに対し、本形態のデータ分類手法を適用した。このデータベースは、5組の日本人の乳幼児とその両親の音声を長期的に収録したものである。乳幼児は東京近郊に生まれ育ち、その両親は標準語を日常語として話す。デジタルオーディオテープレコーダで、彼らの自宅で静かな環境の中、日常会話を録音した。その際、特別なタスクは設けていない。子の誕生から5年間に渡り、月に1から4時間程度の頻度でおこなった。そのデータベースは、音声ファイルに変換され、F0、発話の特性、時間などと共にデータベースに収められている。データベースに関する詳しい情報は、「Amano, S. , Nakatani, T. and Kondo, T. (2003) “Fundamental frequency analysis of longitudinal recording in a Japanese infant speech database”, In: Proceedings of ICPhS-2003, 1983-1986, Aug.」参照。
<データ解析>
F0データを解析する際に問題となるのは、F0データの長さ、すなわち発話長に依存したデータ長は、当然発話ごとに異なる。そこで最も頻度が高い、すなわち最も頻度高く発話している発話長に相当するデータ長付近のデータを対象とすることにする。乳児、母親は300ms、600msのデータ長付近のデータを取り扱った。父親はデータ数が全体的に少ないため、200msから400msの間のデータ長を取り上げた。母親の発話のF0パタンを図10に示す。なお、図10の各グラフの上部にふされた数字は各サンプルを示すパラメータsの値である。このデータに対し、前述した多項式回帰モデルを適用し、トレンド関数の推定を行う。その後におこなう判別分析の際、データ長が揃っていることが望ましいので、トレンド関数の推定関数T^(s)(t)をリサンプリングし、データ長を揃えた。具体的には式(16)を計算する際、推定関数T^(s)(t)に対し、各発話を通して最大振幅と最小振幅の差で規格化した。また、判別関数の算出は、図10における3番目と22番目のサンプルに対応するトレンド関数の推定関数T^(3)(t),T^(22)(t)を判別基準T^(r)(t)とし、判別関数D^(s,3,22)(s={1,...,46})を算出した(式(16))。
そして、これらの判別関数D^(s,3,22)に対して、最近隣接クラスター分析を適用し、樹形図描かせた。図11(a)は、このように生成された樹形図である。なお、この図の横軸は各サンプルに対応するパラメータsを示し、縦軸は高さを示す。図11(a)に示すように、本形態の手法を適用することにより、平坦、右下がり、右上がり、ベル型といった適切なF0の形状に分類することができた。また、図11(b)(c)は、それぞれ乳児、父親に関する分類結果を示した図である。
以上説明した通り、本形態の手法により、F0データの変動傾向を特定のパタンに分類することに成功した。これにより、従来マニュアルで行われていたF0パタン分析を客観的な統計的測度に基づいて行うことが可能となった。
なお、この発明は上述の実施の形態に限定されるものではない。例えば、上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。
また、上述の構成をコンピュータによって実現する場合、上述の装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよいが、具体的には、例えば、磁気記録装置として、ハードディスク装置、フレキシブルディスク、磁気テープ等を、光ディスクとして、DVD(Digital Versatile Disc)、DVD−RAM(Random Access Memory)、CD−ROM(Compact Disc Read Only Memory)、CD−R(Recordable)/RW(ReWritable)等を、光磁気記録媒体として、MO(Magneto-Optical disc)等を、半導体メモリとしてEEP−ROM(Electronically Erasable and Programmable-Read Only Memory)等を用いることができる。
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記録媒体に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。
また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、本装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。
本発明は、例えば、発達心理学で乳幼児音声を用いた言語獲得の変遷を分析する際に適用が可能である。更に、ロボットとの対話システムにおける、発話のイントネーション、文末表現のマッチング等認識に関連した分野に代表される、欠測値を含み平均値が推移する変動を示すデータの分類が要求される分野にも応用できる。
本形態の非定常時系列データ分類方法を例示した図。 本形態における非定常時系列データ分類装置全体の機能構成を例示したブロック図。 図2における推定関数生成手段の詳細構成を例示したブロック図。 (a)は、次数選択手段の詳細構成を例示したブロック図であり、(b)は、判別分析手段の詳細構成を例示したブロック図。 非定常時系列データ分類装置が実行するデータ分類処理を説明するための図。 非定常時系列データ分類装置が実行するデータ分類処理を説明するための図。 (a)はF0データを例示したグラフ。(b)は、メモリの観測データ領域に格納される時系列データy(s) のデータ構造の例示。 (a)は生成された20個のサンプルを示したグラフ。(b)は、(a)のサンプルに対し、本形態の非定常時系列データ分類手法を適用した場合に生成されるトレンド関数の推定関数T^(s)(t)を示したグラフ。 樹形図によるシミュレーションパタン分類結果を示した図。 母親の発話のF0パタンの例示。 (a)は樹形図による母親実データのパタン分類結果を示した図。(b)(c)は、それぞれ乳児、父親に関する分類結果を示した図。
符号の説明
1 非定常時系列データ分類装置
12 メモリ
13 推定関数生成手段
14 次数選択手段
15 判別分析手段
16 クラスター分析手段

Claims (8)

  1. コンピュータを、推定関数生成手段と、基準関数設定手段と、判別関数生成手段と、クラスター分析手段と、を有する非定常時系列データ分類装置として機能させて実行し、一部が欠測した観測値の時系列データの傾向を分類する非定常時系列データ分類方法であって、
    サンプルsのサンプリング時刻tにおける上記時系列データy(s) がメモリに格納されており、
    上記推定関数生成手段が、yをサンプリング時刻tにおける観測値を示す時系列データとし、*を*の転置とし、T(t)を時系列データyの変動傾向を示すトレンド関数T(t)=β+βt+...+βp−1p−1とし、(β,β,...,βp−1を回帰係数βとし、uをノイズ値とした場合における、多項式回帰モデルy=T(t)+uに対し、メモリに格納された上記時系列データy(s) のうち、欠測値以外の時系列データを結合して得られた欠測値を含まない時系列データy (s) を適用し、y (s) とした場合における多項式回帰モデルy=T(t)+uのトレンド関数T(t)の推定関数T^(s)(t)をサンプルsごとに算出し、算出した推定関数T^(s)(t)をメモリに格納する手順と、
    上記基準関数設定手段が、メモリに格納されている上記推定関数T^(s)(t)から、2個以上の推定関数T^(s)(t)を選択し、選択した推定関数T^(s)(t)を判別基準T^(r)(t)(r∈s)としてメモリに格納する手順と、
    上記判別関数生成手段が、メモリから2つの判別基準T^(r1)(t),T^(r2)(t)(r1,r2∈r、r1≠r2)を抽出し、上記推定関数T^(s)(t)に対する判別関数
    Figure 0004542395

    (nはtの最大値)
    を生成してメモリに格納する手順と、
    上記クラスター分析手段が、メモリから上記判別関数D^(s,r1,r2)を抽出し、当該判別関数D^(s,r1,r2)を用い、メモリから読み出した上記推定関数T^(s)(t)のクラスター分析を行い、その分析結果を出力する手順と、
    を実行する非定常時系列データ分類方法。
  2. 請求項1記載の非定常時系列データ分類方法であって、
    上記推定関数T^(s)(t)を算出する手順は、
    上記推定関数生成手段が、
    最小二乗法によって、上記時系列データy(s) から上記回帰係数βの推定値である回帰係数推定値β^(s) LSEを算出し、
    T^(s)(t)=(1,t,t,...,tp−1)・β^(s) LSE
    の演算によって上記推定関数T^(s)(t)を算出する手順であり、
    上記pは、モデルy(s) =T^(s)(t)+u(s) の情報量基準AIC(s)(p)を最小値化する値である、
    ことを特徴とする非定常時系列データ分類方法。
  3. 請求項1又は2記載の非定常時系列データ分類方法であって、
    上記推定関数生成手段は、分離ベクトル生成手段と、ベクトル結合手段と、転置ベクトル生成手段と、行列生成手段と、行列結合手段と、転置行列生成手段と、係数推定値算出手段と、係数乗算手段とを有し、
    上記推定関数T^(s)(t)を算出する手順は、
    上記分離ベクトル生成手段が、上記サンプルsごとの各時系列データy(s) を、欠測値前後の時系列データ列である分離ベクトルSY(s) に分離する手順と、
    上記ベクトル結合手段が、上記分離ベクトルSY(s) を結合した結合ベクトルY(s)を生成する手順と、
    上記転置ベクトル生成手段が、上記結合ベクトルY(s)の転置ベクトルTY(s)を生成する手順と、
    上記行列生成手段が、上記欠測値前後のサンプリング時刻列ごとに、従属変数(1,t,t,…,tp−1)を行とする従属変数行列Z(s) を生成する手順と、
    上記行列結合手段が、上記従属変数行列Z(s) を結合した結合行列Z(s)を生成する手順と、
    上記転置行列生成手段が、上記結合行列Z(s)の転置行列TZ(s)を生成する手順と、
    上記係数推定値算出手段が、上記トレンド関数の回帰係数推定値
    β^(s) LSE=(Z(s)・TZ(s)−1・TZ(s)・TY(s)
    を算出する手順と、
    上記係数乗算手段が、上記推定関数
    T^(s)(t)=(1,t,t,...,tp−1)・β^(s) LSE
    を算出する手順と、を有する、
    ことを特徴とする非定常時系列データ分類方法。
  4. 請求項3記載の非定常時系列データ分類方法であって、
    上記推定関数T^(s)(t)を算出する手順の後に行われる、
    ノイズ項算出手段が、上記時系列データy(s) 及びこれに対応する上記推定関数T^(s)(t)を用い、ノイズ項u(s) =y(s) −T^(s)(t)を算出する手順と、
    分散算出手段が、上記ノイズ項u(s) の分散σ(s) を算出する手順と、
    最大対数尤度算出手段が、tの最大値n及び上記分散σ(s) を用い、モデルy(s) =T^(s)(t)+u(s) の最大対数尤度
    ML(s)=const−n・(ln σ(s) )/2
    を算出する手順と、
    情報量基準算出手段が、情報量基準AIC(s)(p)=−2log(ML(s))+2(p+1)を算出してメモリに格納する手順と、を有し、
    上記従属変数行列Z(s) を生成する手順から上記情報量基準AIC(s)(p)を算出してメモリに格納する手順までは、pの値を更新しながら所定回数繰り返され、
    上記判別関数を生成する手順は、
    上記情報量基準AIC(s)(p)を最小値化するpに対応する上記推定関数T^(s)(t)から判別関数を生成する手順である、
    ことを特徴とする非定常時系列データ分類方法。
  5. 請求項1から4の何れかに記載の非定常時系列データ分類方法であって、
    上記時系列データy(s) は、
    音声の基本周波数(F0)データである、
    ことを特徴とする非定常時系列データ分類方法。
  6. 一部が欠測した観測値の時系列データの傾向を分類する非定常時系列データ分類装置であって、
    サンプルsのサンプリング時刻tにおける上記時系列データy(s) を格納するメモリと、
    をサンプリング時刻tにおける観測値を示す時系列データとし、*を*の転置とし、T(t)を時系列データyの変動傾向を示すトレンド関数T(t)=β+βt+...+βp−1p−1とし、(β,β,...,βp−1を回帰係数βとし、uをノイズ値とした場合における、多項式回帰モデルy=T(t)+uに対し、メモリに格納された上記時系列データy(s) のうち、欠測値以外の時系列データを結合して得られた欠測値を含まない時系列データy (s) を適用し、y=y(s) とした場合における多項式回帰モデルy=T(t)+uのトレンド関数T(t)の推定関数T^(s)(t)をサンプルsごとに算出し、算出した推定関数T^(s)(t)をメモリに格納する推定関数生成手段と、
    メモリに格納されている上記推定関数T^(s)(t)から、2個以上の推定関数T^(s)(t)を選択し、選択した推定関数T^(s)(t)を判別基準T^(r)(t)(r∈s)としてメモリに格納する基準関数設定手段と、
    メモリから2つの判別基準T^(r1)(t),T^(r2)(t)(r1,r2∈r、r1≠r2)を抽出し、上記推定関数T^(s)(t)に対する判別関数
    Figure 0004542395

    (nはtの最大値)
    を生成してメモリに格納する判別関数生成手段と、
    メモリから上記判別関数D^(s,r1,r2)を抽出し、当該判別関数D^(s,r1,r2)を用い、メモリから読み出した上記推定関数T^(s)(t)のクラスター分析を行い、その分析結果を出力するクラスター分析手段と、
    を有することを特徴とする非定常時系列データ分類装置。
  7. 請求項1から5の何れかに記載の非定常時系列データ分類方法の各手順をコンピュータに実行させるためのプログラム。
  8. 請求項7記載のプログラムを格納したコンピュータ読取可能な記録媒体。
JP2004245275A 2004-08-25 2004-08-25 非定常時系列データ分類方法、装置、プログラム及びそのプログラムを記録した記録媒体 Expired - Fee Related JP4542395B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004245275A JP4542395B2 (ja) 2004-08-25 2004-08-25 非定常時系列データ分類方法、装置、プログラム及びそのプログラムを記録した記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004245275A JP4542395B2 (ja) 2004-08-25 2004-08-25 非定常時系列データ分類方法、装置、プログラム及びそのプログラムを記録した記録媒体

Publications (2)

Publication Number Publication Date
JP2006064847A JP2006064847A (ja) 2006-03-09
JP4542395B2 true JP4542395B2 (ja) 2010-09-15

Family

ID=36111420

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004245275A Expired - Fee Related JP4542395B2 (ja) 2004-08-25 2004-08-25 非定常時系列データ分類方法、装置、プログラム及びそのプログラムを記録した記録媒体

Country Status (1)

Country Link
JP (1) JP4542395B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5188300B2 (ja) * 2008-07-14 2013-04-24 日本電信電話株式会社 基本周波数軌跡モデルパラメータ抽出装置、基本周波数軌跡モデルパラメータ抽出方法、プログラム及び記録媒体
CN116541784B (zh) * 2023-07-04 2023-09-26 乐山师范学院 一种基于字典树和覆盖度的时间序列分类方法及装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003132214A (ja) * 2001-10-25 2003-05-09 Kenji Nishihara 相場を構成する全要素の時間的推移のパターンを一覧表示した相場情報表示方法とその装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003132214A (ja) * 2001-10-25 2003-05-09 Kenji Nishihara 相場を構成する全要素の時間的推移のパターンを一覧表示した相場情報表示方法とその装置

Also Published As

Publication number Publication date
JP2006064847A (ja) 2006-03-09

Similar Documents

Publication Publication Date Title
Dibazar et al. Feature analysis for automatic detection of pathological speech
Iliev et al. Spoken emotion recognition through optimum-path forest classification using glottal features
US20100332222A1 (en) Intelligent classification method of vocal signal
Rashmi Review of algorithms and applications in speech recognition system
JP2019101391A (ja) 系列データ変換装置、学習装置、及びプログラム
Mousavi et al. Persian classical music instrument recognition (PCMIR) using a novel Persian music database
Korvel et al. Speech analytics based on machine learning
Nivetha A survey on speech feature extraction and classification techniques
Lakshminarayanan et al. A syllable-level probabilistic framework for bird species identification
Krishnaiah et al. Automatic Music Mood Classification using Multi-class Support Vector Machine based on Hybrid Spectral Features.
JP4542395B2 (ja) 非定常時系列データ分類方法、装置、プログラム及びそのプログラムを記録した記録媒体
Guerrero-Turrubiates et al. Guitar chords classification using uncertainty measurements of frequency bins
Paul et al. A hybrid feature-extracted deep CNN with reduced parameters substitutes an End-to-End CNN for the recognition of spoken Bengali digits
Burlet Guitar tablature transcription using a deep belief network
Tulics et al. Possibilities for the automatic classification of functional and organic dysphonia
Sardar et al. Speaker identification of whispering sound: effectiveness of timbral audio descriptors
CN112735442B (zh) 一种具有音频分离声纹识别的湿地生态监测系统及其音频分离方法
Shahriar et al. On the Impact of Deep Learning and Feature Extraction for Arabic Audio Classification and Speaker Identification
WO2024038560A1 (ja) 学習装置、推定装置、学習方法、及びプログラム
Arora et al. Discriminative PLCA based polyphonic source identification
Khan et al. Time warped continuous speech signal matching using Kalman filter
Kale et al. Voice based biometric system feature extraction using mfcc and lpc technique
Canpolat Novel approach to emotion recognition in voice: a convolutional neural network approach and grad-cam generation
Vetráb et al. Aggregation Strategies of Wav2vec 2.0 Embeddings for Computational Paralinguistic Tasks
Dass The Comparative Analysis of Speech Processing Techniques at Different Stages

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060719

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20060719

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090119

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090210

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090330

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091013

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091117

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100615

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100625

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130702

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees