JP2006243676A - 音響信号分析装置およびその方法、プログラム、記録媒体 - Google Patents

音響信号分析装置およびその方法、プログラム、記録媒体 Download PDF

Info

Publication number
JP2006243676A
JP2006243676A JP2005063162A JP2005063162A JP2006243676A JP 2006243676 A JP2006243676 A JP 2006243676A JP 2005063162 A JP2005063162 A JP 2005063162A JP 2005063162 A JP2005063162 A JP 2005063162A JP 2006243676 A JP2006243676 A JP 2006243676A
Authority
JP
Japan
Prior art keywords
value
scale parameter
acoustic signal
coefficient
model order
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005063162A
Other languages
English (en)
Other versions
JP4486527B2 (ja
JP2006243676A5 (ja
Inventor
Kentaro Ishizuka
健太郎 石塚
Hiroko Kato
比呂子 加藤
Tomohiro Nakatani
智広 中谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2005063162A priority Critical patent/JP4486527B2/ja
Publication of JP2006243676A publication Critical patent/JP2006243676A/ja
Publication of JP2006243676A5 publication Critical patent/JP2006243676A5/ja
Application granted granted Critical
Publication of JP4486527B2 publication Critical patent/JP4486527B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】 音響信号に適したExponential自己回帰モデルのパラメータを推定することで音響信号分析を行うこと。
【解決手段】 Exponential自己回帰モデルのスケールパラメータγの初期値γから、最小二乗誤差推定によって与えられるExponential自己回帰モデルの係数φ、係数πの値φ^、π^を求め、この係数φ、係数πの値φ^、π^からスケールパラメータγの値γ^を求め、このスケールパラメータγの値γ^から、最小二乗誤差推定によって係数φ、係数πの新たな値φ^、π^を求め、さらに、この係数φ^、係数π^から新たなスケールパラメータγの値γ^を求め、このγ^とγ^との差が所定の値以下になった場合のスケールパラメータの値と、その値を与えた係数φ^、係数π^の値を、Exponential自己回帰モデルのパラメータ推定値とする。
【選択図】 図1

Description

本発明は、音声信号や音楽信号などの音響信号を非線形自己回帰モデルによってモデル化する音響信号分析方法とその装置に関する。
従来、音声や楽音の符号化、雑音信号抑圧、残響除去、自動音声認識などにおいて、音響信号の特徴を捉えるための音響信号のモデル化手段として、線形予測分析に代表される自己回帰モデル(ARモデル:Autoregressive model)、自己回帰移動平均モデル(ARMAモデル:Autoregressive moving average model)、フーリエ解析などの調和解析が音響信号分析に利用されてきた(非特許文献1、非特許文献2参照)。これらのモデル化手段では、アナログ信号である音響信号を時系列でサンプリングした時系列離散音響信号を用いるのが一般的である。サンプル点数がn個の時系列離散音響信号の値をx(k)〔k=1、2、・・・、n〕で表すことにする。
例えば、従来のARモデルは、ある時点{t}における時系列離散音響信号の値x(t)を、その時点{t}よりも過去のp個の時点{t−1}、時点{t−2}、・・・、時点{t−p}における時系列離散音響信号の値x(t−1)、x(t−2)、・・・、x(t−p)のそれぞれに係数φ(i=1、・・・、p)による重み付けをしたものの総和と、正規白色雑音に従う観測誤差ε(t)との和によって予測するモデルとして式(1)によって表すことができる(なお、例えば係数φのいずれかが0である場合、厳密にはARモデルは過去p個の時系列離散音響信号の値に基づくものとは言えないが、このような場合も含めて、過去p個の時系列離散音響信号の値に基づくものであるとする。)。
Figure 2006243676
従来の音響信号分析技術においては、例えば、このARモデルの係数であるφをパラメータとして推定することにより、音響信号の特徴を捉える方法を採っていた。しかし、音声信号を始めとする自然界に存在する音響信号は、その振幅や基本周波数が時間の経過に従い不規則に変動する特性を持ち(非特許文献3参照)、このような音響信号の挙動は、本来、音響信号の定常性を前提とするARモデル・ARMAモデル・調和解析では十分なモデル化ができないという問題があった。
このような不規則な変動をする音響信号を予測するモデルとして、Exponential自己回帰モデルが提案されている(非特許文献4参照。なお、Exponential自己回帰モデルは、音響信号以外の時系列データなどについても適応可能なものであるが、この明細書では、音響信号について述べることにする。)。このExponential自己回帰モデルは、ある時点{t}における時系列離散音響信号の値x(t)を、この時点{t}よりも前の各時点{t−i}〔但しi=1、2、・・・、pとし、1≦pとする。ここでpは、Exponential自己回帰モデルの項数を決定するので、これをモデル次数という。〕における時系列離散音響信号の値x(t−i)のそれぞれに対して係数φを乗じたものの総和と、時点{t}よりも前の各時点{t−i}における時系列離散音響信号の値x(t−i)のそれぞれに対して、係数πおよび、スケールパラメータγ〔但し0≦γとする。〕と時点{t−1}における時系列離散音響信号の値x(t−1)の二乗との積を指数とする自然対数の底eのべき乗を乗じたものの総和と、正規白色雑音に従う観測誤差ε(t)との和によって予測するモデルであり、式(2)のように表すことができる(なお、例えば時点{t−2}における時系列離散音響信号の値x(t−2)の項の係数φおよび係数πが0である場合、厳密にはExponential自己回帰モデルは過去p個の時系列離散音響信号の値に基づくものとは言えないが、このような場合も含めて、過去p個の時系列離散音響信号の値に基づくものであるとする。)。
Figure 2006243676
従来の自己回帰モデル(ARモデル)との違いは、時系列離散音響信号の値x(t−i)の係数に時系列離散音響信号の値の変動に依存して値が変化するExponential項(πexp(−γx(t−1)))が導入されていることである。Exponential自己回帰モデルは、このExponential項の効果によって、不規則な変動を伴う非定常的な音響信号を効果的にモデル化することができる。
自然界に存在する音響信号は、上述のように多くの場合、非対称な振動特性を持ち、このような音響信号をモデル化するには、従来のARモデルを用いるよりも上述した非線形モデルを用いる方が適している。また、音声信号や音楽信号の多くの部分では、ほぼ周期的な信号がその周期や振幅が微細に振動しながら続く性質を持っており、このような音響信号のモデル化には非線形モデルの中でもExponential自己回帰モデルが適していると考えられる。
n個の時系列離散音響信号の値が与えられたときに、Exponential自己回帰モデルのパラメータに当たるモデル次数p、スケールパラメータγ、係数φ、係数πは、以下のようにして推定する。
まず、モデル次数pおよびスケールパラメータγの値の推定は、非線形モデルに関する赤池情報量基準AIC(p)を用いて、式(4)の条件を満たすような値p、γを選択することによる。ここでnはサンプリングされた音響信号のサンプル点の総数であり、mはモデル次数pの取りうる値の最大値(任意値)を表す。
Figure 2006243676
この推定には、事前に係数φ、係数πを決定しておく必要があるため、一意にAIC(p)の値を最小とするパラメータの組を求めるのは困難であり、数値的最適化を行った場合も局所解を避けることが難しい。
そこで具体的には、まず、モデル次数pおよびスケールパラメータγを任意のp(一般的には小さな値が好ましく、例えば1とする。)およびγ(一般的には、大きな値が好ましく適宜任意に設定する。)に固定し、その後、後述する最小二乗誤差推定方法によって最小二乗誤差推定値である係数φ^i0、係数π^i0(記号^は最尤推定量を表し、α^は、αの上に^が付くものとする。)を推定する。
次に、モデル次数pをpに固定したまま、スケールパラメータγを適宜γよりも少し小さい値γにして、この場合の最小二乗誤差推定値である係数φ^i1、係数π^i1を最小二乗誤差推定方法によって推定する。この操作をスケールパラメータγが十分に小さい値γになるまで繰り返すことで、モデル次数pがpの場合における、複数の(スケールパラメータγ、係数φ、係数π)の組(γ、φ^i0、π^i0、(γ、φ^i1、π^i1、・・・(γ、φ^iw、π^iwが得られる。
次に、モデル次数pをpよりも1つ大きい値pとして、上記と同様にして、複数の(スケールパラメータγ、係数φ、係数π)の組(γ、φ^i0、π^i0、(γ、φ^i1、π^i1、・・・(γ、φ^iw、π^iwが得られる。この操作をモデル次数pがその最大値mとなるまで繰り返す。この結果得られた(スケールパラメータγ、係数φ、係数π)の各組ごとに、スケールパラメータγ、係数φ、係数πの各値を固定して、赤池情報量規準AIC(p)の値が最小となるモデル次数pの値を求める。
この最小のモデル次数pと、この最小のモデル次数pを与えた(スケールパラメータγ、係数φ、係数π)の組との組み合わせを、Exponential自己回帰モデルのパラメータに当たるモデル次数p、スケールパラメータγ、係数φ、係数πの最尤推定量とするのである。
係数φ、係数πの最小二乗誤差推定値は、時系列離散音響信号の値x(k)〔k=1、2、・・・、n〕、モデル次数pの値、スケールパラメータγの値が既知ならば、行列α、X、Yを式(5)のように構成し、それを用いた正規方程式の解として得られる。なお、行列の右肩の文字Tは、転置行列であることを表す。
Figure 2006243676
式(5)のように行列α、X、Yを構成すると、係数φ、係数πの最小二乗誤差推定値であるφ^、π^を成分とする行列α^を次式の行列計算によって求めることができる。
Figure 2006243676
古井貞煕著、「音声情報処理」、森北出版株式会社、1998年 Hiroya Fujisaki and Mats Ljungqvist, "Estimation of voice source and vocal tract parameters based on ARMA analysis and a model for the glottal source waveform", Proceedings of the 12th International Conference on Acoustics, Speech, and Signal Processing, Vol.12, p.637-640,1987. Aoki,N.and Ifukube,T.,"Analysis and perception of spectral l/f characteristics of amplitude and period fluctuations in normal sustained vowels",Journal of the Acoustical Society America,Vol.106,p.423-433,1999. Haggan,V.and Ozaki,T.,"Modelling nonlinear random vibrations using an amplitude-dependent autoregressive time series model",Biometrika,Vol.68,p.189-196,1981
Exponential自己回帰モデルを音声信号などの音響信号に適用する場合のパラメータ推定は、上述したように、モデル次数pおよびスケールパラメータγを固定して係数φ、係数πを最小二乗誤差推定によって求めることを、各モデル次数pおよびスケールパラメータγの値に対して繰り返し、その結果、赤池情報量規準AIC(p)の値を最小にするモデル次数pと、このモデル次数pを与えたスケールパラメータγ、係数φ、係数πの最尤推定量の組を求めることによって行うものであった。
本発明は、Exponential自己回帰モデルのパラメータに当たるモデル次数p、スケールパラメータγ、係数φ、係数πの従来的推定とは異なる推定によって、一層、音響信号に適したExponential自己回帰モデルのモデル次数p、スケールパラメータγ、係数φ、係数πを推定することで音響信号分析を行う音響信号分析装置およびその方法、プログラム、記録媒体を提供することを目的とする。
本発明の音響信号分析装置は、上記の課題を解決するものとして、次のように構成される。即ち、ある時点{t}における時系列離散音響信号の値x(t)を、当該時点{t}よりも前の各時点{t−i}〔但しi=1、2、・・・、pとし、モデル次数pは自然数とする。〕における時系列離散音響信号の値x(t−i)のそれぞれに対して係数φを乗じたものの総和と、時点{t}よりも前の各時点{t−i}における時系列離散音響信号の値x(t−i)のそれぞれに対して、係数πおよび、スケールパラメータγ〔但し0≦γとする。〕と時点{t−1}における時系列離散音響信号の値x(t−1)の二乗との積を指数とする自然対数の底eのべき乗を乗じたものの総和と、正規白色雑音に従う観測誤差ε(t)との和によって表すExponential自己回帰モデル
Figure 2006243676
のモデル次数p、係数φ、係数πおよびスケールパラメータγを、n個〔但しnは、n>pを満たす整数とする。〕の時系列離散音響信号の値x(k)〔但しk=1、2、・・・、nとする。〕から推定することによって音響信号の分析を行う音響信号分析装置であって、n個の時系列離散音響信号の値x(k)と、モデル次数pと、判定閾値εとを記憶する記憶手段と、n個の時系列離散音響信号の値x(k)のうち、その絶対値が最大となる時系列離散音響信号の値に基づいて、スケールパラメータγの初期値γを設定して、これを出力するスケールパラメータ初期値設定手段と、スケールパラメータγ、モデル次数pおよびn個の時系列離散音響信号の値x(k)に基づいて、係数φおよび係数πの最小二乗誤差推定値φ^およびπ^を演算して、この演算結果を出力する係数最小二乗誤差推定値演算手段と、モデル次数pおよびn個の時系列離散音響信号の値x(k)並びに、係数最小二乗誤差推定値演算手段によって出力された最小二乗誤差推定値φ^およびπ^によって与えられるExponential自己回帰モデルに関する情報量規準の値が最小となるスケールパラメータγの値γ^を、0以上γ以下の範囲において探索して、この探索結果を出力するスケールパラメータ探索手段と、スケールパラメータ探索手段によって出力されたスケールパラメータγの値γ^とγ^との差が判定閾値ε以下であるか否かを判定して、この判定結果を出力するスケールパラメータ判定手段と、スケールパラメータ判定手段において判定閾値ε以下であると判定されたときの、スケールパラメータγの値γ^、並びにスケールパラメータ探索手段においてスケールパラメータγの値γ^を出力したときの最小二乗誤差推定値、または、スケールパラメータγの値γ^、並びにスケールパラメータ探索手段においてスケールパラメータγ^を出力したときの最小二乗誤差推定値の少なくともいずれか一方を、最尤推定量として出力する最尤推定量出力手段とを備えたことを特徴とするものである。
この構成とすることで、従来的推定に比較して、一層、音響信号に適したExponential自己回帰モデルのモデル次数p、スケールパラメータγ、係数φ、係数πの推定に基づく音響信号分析を行うことがきる。
また、上記音響信号分析装置は、係数最小二乗誤差推定値演算手段によって出力された最小二乗誤差推定値φ^およびπ^を係数とする2つの固有方程式
Figure 2006243676
の固有解λ、λ (但しλ はλの共役解を表し、λおよびλ をもって固有方程式(a)の全ての固有解を表す。なお、λは、λの上に−が付くものとする。)、λ、λ (但しλ はλの共役解を表し、λおよびλ をもって固有方程式(b)の全ての固有解を表す。)がそれぞれ
Figure 2006243676
を満たす範囲において、モデル次数pおよびn個の時系列離散音響信号の値x(k)並びに、係数最小二乗誤差推定値演算手段によって上記最小二乗誤差推定値φ^およびπ^が出力されたときのスケールパラメータγの値によって与えられるExponential自己回帰モデルに関する情報量規準の値が最小となる係数φおよび係数πの値φ^^およびπ^^を探索して、この探索結果を出力する極限周期係数探索手段を備え、スケールパラメータ探索手段が、モデル次数pおよびn個の時系列離散音響信号の値x(k)並びに、極限周期係数探索手段によって出力された係数φおよび係数πの値φ^^およびπ^^によって与えられるExponential自己回帰モデルに関する情報量規準の値が最小となるスケールパラメータγの値γ^を、0以上γ以下の範囲において探索して、この探索結果を出力することが可能であるものとしてもよい。
この構成によれば、一層、音響信号に適したExponential自己回帰モデルのモデル次数p、スケールパラメータγ、係数φ、係数πの推定に基づく音響分析が行える。
さらに、上記音響信号分析装置は、モデル次数pの取りえる範囲の両端値mおよびc〔但しmおよびcは、自然数とする。〕が記憶手段に記憶され、両端値mおよびcの範囲にあるモデル次数pの各値〔但し、この値は整数とする。〕について、最尤推定量出力手段で出力された最尤推定量によって与えられるExponential自己回帰モデルに関する情報量規準が最小となるモデル次数pの値p^を探索して、この探索結果を出力するモデル次数探索手段と、モデル次数探索手段において出力されたモデル次数pの値p^のうち最小の値p^^、並びにモデル次数探索手段においてモデル次数pの値p^^を出力したときの最尤推定量を出力する全最尤推定量出力手段とを備えたものとしてもよい。
この構成によれば、より一層、音響信号に適したExponential自己回帰モデルのモデル次数p、スケールパラメータγ、係数φ、係数πの推定に基づく音響分析が行える。
加えて、上記音響信号分析装置は、初期値設定因子ε(但し0<εとする。)が記憶手段に記憶され、スケールパラメータ初期値設定手段が、初期値設定因子εと、n個の時系列離散音響信号の値x(k)のうち、その二乗の値が最大となるときの値とに基づいて、スケールパラメータγの初期値γ
Figure 2006243676
を設定して出力するものであるとしてもよい。
本発明の音響信号分析方法は、上記の課題を解決するものとして、次のような方法とする。即ち、上記Exponential自己回帰モデル
Figure 2006243676
のモデル次数p、係数φ、係数πおよびスケールパラメータγを、予め与えられたn個〔但しnは、n>pを満たす整数とする。〕の時系列離散音響信号の値x(k)〔但しk=1、2、・・・、nとする。〕から推定することによって音響信号の分析を行う音響信号分析方法であって、モデル次数pを設定するモデル次数設定ステップと、n個の時系列離散音響信号の値x(k)のうち、その絶対値が最大となる時系列離散音響信号の値に基づいて、スケールパラメータγの初期値γを設定して出力するスケールパラメータ初期値設定ステップと、スケールパラメータγ並びに、モデル次数設定ステップで設定されたモデル次数pおよびn個の時系列離散音響信号の値x(k)に基づいて、係数φおよび係数πの最小二乗誤差推定値φ^およびπ^を演算して、この演算結果を出力する係数最小二乗誤差推定値演算ステップと、モデル次数設定ステップで設定されたモデル次数pおよびn個の時系列離散音響信号の値x(k)並びに、係数最小二乗誤差推定値演算ステップによって出力された最小二乗誤差推定値φ^およびπ^によって与えられるExponential自己回帰モデルに関する情報量規準の値が最小となるスケールパラメータγの値γ^を、0以上γ以下の範囲において探索して、この探索結果を出力するスケールパラメータ探索ステップと、スケールパラメータ探索ステップによって出力されたスケールパラメータγの値γ^とγ^との差が判定閾値ε以下であるか否かを判定して、この判定結果を出力するスケールパラメータ判定ステップと、スケールパラメータ判定ステップにおいて判定閾値ε以下であると判定されたときに、スケールパラメータγの値γ^、並びにスケールパラメータ探索ステップにおいてスケールパラメータγの値γ^を出力したときの最小二乗誤差推定値、または、スケールパラメータγの値γ^、並びにスケールパラメータ探索ステップにおいてスケールパラメータγの値γ^を出力したときの最小二乗誤差推定値の少なくともいずれか一方を、最尤推定量として出力する最尤推定量出力ステップとを有することを特徴とする。
この方法とすることで、従来的推定に比較して、一層、音響信号に適したExponential自己回帰モデルのモデル次数p、スケールパラメータγ、係数φ、係数πの推定に基づく音響信号分析を行うことがきる。
また、上記の音響信号分析方法は、係数最小二乗誤差推定値演算ステップによって出力された最小二乗誤差推定値φ^およびπ^を係数とする2つの固有方程式
Figure 2006243676
の固有解λ、λ (但しλ はλの共役解を表し、λおよびλ をもって固有方程式(c)の全ての固有解を表す。)、λ、λ (但しλ はλの共役解を表し、λおよびλ をもって固有方程式(d)の全ての固有解を表す。)がそれぞれ
Figure 2006243676
を満たす条件において、n個の時系列離散音響信号の値x(k)およびモデル次数設定ステップで設定されたモデル次数p並びに、係数最小二乗誤差推定値演算ステップによって上記最小二乗誤差推定値φ^およびπ^が出力されたときのスケールパラメータγの値によって与えられるExponential自己回帰モデルに関する情報量規準の値が最小となる係数φ^および係数π^の値φ^^およびπ^^を探索して、この探索結果を出力する極限周期係数探索ステップを有し、スケールパラメータ探索ステップが、n個の時系列離散音響信号の値x(k)およびモデル次数設定ステップで設定されたモデル次数p並びに、極限周期係数探索ステップによって出力された係数φ^および係数π^の値φ^^およびπ^^によって与えられるExponential自己回帰モデルに関する情報量規準の値が最小となるスケールパラメータγ^を、0以上γ以下の範囲において探索して、この探索結果を出力することが可能であるものとしてもよい。
この方法によれば、一層、音響信号に適したExponential自己回帰モデルのモデル次数p、スケールパラメータγ、係数φ、係数πの推定に基づく音響分析が行える。
さらに、上記の音響信号分析方法は、モデル次数pの取りえる範囲の両端値mおよびc〔但しmおよびcは、自然数とする。〕を設定するモデル次数範囲設定ステップと、モデル次数範囲設定ステップによって設定されたモデル次数pの範囲で、モデル次数設定ステップにおいて設定されたモデル次数pの各値〔但し、この値は整数とする。〕について、最尤推定量出力ステップによる最尤推定量の出力を行うモデル次数対応最尤推定量出力ステップと、モデル次数対応最尤推定量出力ステップにおいて出力された最尤推定量それぞれについて、当該最尤推定量によって与えられるExponential自己回帰モデルに関する情報量規準の値が最小となるモデル次数pの値p^を探索して、この探索結果を出力するモデル次数探索ステップと、モデル次数探索ステップにおいて出力されたモデル次数pの各値p^のうち最小の値p^^、並びにモデル次数探索ステップにおいてモデル次数pの値p^^を出力したときの最尤推定量を出力する全最尤推定量出力ステップとを有するとしてもよい。
この方法によれば、より一層、音響信号に適したExponential自己回帰モデルのモデル次数p、スケールパラメータγ、係数φ、係数πの推定に基づく音響分析が行える。
加えて、上記の音響信号分析方法は、スケールパラメータ初期値設定ステップが、初期値設定因子ε(但し0<εとする。)と、n個の時系列離散音響信号の値x(k)のうち、その二乗の値が最大となるときの値とに基づいて、スケールパラメータγの初期値γ
Figure 2006243676
を設定して出力するものであってもよい。
また、上記音響信号分析装置をコンピュータ上で機能させる音響信号分析プログラムによって、コンピュータを音響信号分析装置として作動処理させることができる。そして、この音響信号分析プログラムを記録した、コンピュータによって読み取り可能なプログラム記録媒体によって、他のコンピュータを音響信号分析装置として機能させることや、音響信号分析プログラムを流通させることなどが可能になる。
本発明の音響信号分析装置および方法によれば、従来的推定に比較して、一層、音響信号に適したExponential自己回帰モデルのモデル次数p、スケールパラメータγ、係数φ、係数πの推定に基づく音響信号分析を行うことができる。
<第1の実施形態>
まず、本発明の音響信号分析装置・方法の第1の実施形態を説明する。
図1は、第1の実施形態に係わる音響信号分析装置(1)のハードウェア構成を例示した構成ブロック図である。
図1に例示するように、音響信号分析装置(1)は、音響信号分析装置(1)に入力された時系列離散音響信号から所定の時間幅の時系列離散音響信号を切り出す波形切出部(10)、キーボードなどが接続可能な入力部(11)、液晶ディスプレイなどが接続可能な出力部(12)、音響信号分析装置(1)外部に通信可能な通信装置(例えば通信ケーブル)が接続可能な通信部(13)、CPU(Central Processing Unit)(14)、メモリであるRAM(15)、ROM(16)やハードディスクである外部記憶装置(17)並びにこれらの波形切出部(10)、入力部(11)、出力部(12)、通信部(13)、CPU(14)、RAM(15)、ROM(16)、外部記憶装置(17)間のデータのやり取りが可能なように接続するバス(18)を有している。また必要に応じて、音響信号分析装置(1)に、CD−ROMなどの記憶媒体を読み書きできる装置(ドライブ)などを設けるとしてもよい。
音響信号分析装置(1)の外部記憶装置(17)には、Exponential自己回帰モデルのモデル次数p、スケールパラメータγ、係数φ、係数πの最尤推定量を得るためのプログラムおよびこのプログラムの処理において必要となるデータなどが保存記憶されている。また、このプログラムの処理によって得られたデータなどを保存記憶するデータ格納領域(171)も確保されている。
より具体的には、外部記憶装置(17)には、スケールパラメータγの初期値を設定する指標である初期値設定因子εの値、スケールパラメータγの大小を判定する閾値である判定閾値εの値およびモデル次数pの取りえる範囲の両端値mおよびcの値が保存記憶されている。
また、外部記憶装置(17)には、Exponential自己回帰モデルのモデル次数p、スケールパラメータγ、係数φ、係数πの最尤推定量を得るためのプログラムとして、スケールパラメータ初期値設定プログラム(172)、係数最小二乗誤差推定値演算プログラム(173)、スケールパラメータ探索プログラム(174)、極限周期係数探索プログラム(175)、スケールパラメータ判定プログラム(176)、最尤推定量出力プログラム(177)、モデル次数探索プログラム(178)、全最尤推定量出力プログラム(179)およびこれらのプログラムの処理などを制御するための制御プログラム(図示しない)が保存記憶されている。これらのプログラムの処理によって得られるデータなどは、データ格納領域(171)に保存記憶される。
音響信号分析装置(1)では、外部記憶装置(17)に記憶されたプログラムとこのプログラムの処理に必要なデータが必要に応じてRAM(15)に呼び出されて、CPU(14)で処理されることによって、Exponential自己回帰モデルのモデル次数p、スケールパラメータγ、係数φ、係数πの最尤推定量を得るものとなっている。
そこで次に、図2および図3を参照して、音響信号分析装置(1)において、Exponential自己回帰モデルのモデル次数p、スケールパラメータγ、係数φおよび係数πの最尤推定量(これらをExponential自己回帰モデルのパラメータ推定値ということにする。)を得る演算処理の流れを順次説明する。
図2は、第1の実施形態に係わる音響信号分析装置(1)においてExponential自己回帰モデルのパラメータ推定値を得る処理機能を示す機能ブロック図である。
図3は、第1の実施形態に係わる音響信号分析装置(1)においてExponential自己回帰モデルのパラメータ推定値を得る処理を示すフローチャートである。
まず、音響信号分析装置(1)に音響信号が入力される。音響信号は、音声信号や音楽信号などを例とする、振幅や基本周波数が時間の経過に従い不規則に変動する特性(非定常性)を持つ音響信号である。勿論、定常性を持つ音響信号であってもよい。また、音響信号分析装置(1)に入力される音響信号は、所定のサンプリングレート(例えば16、000Hz)でサンプリングされて離散信号に変換された時系列音響信号である。サンプリングや量子化の方法は公知のものによればよい。
音響信号分析装置(1)に時系列離散音響信号が入力されると、波形切出部(10)において、入力された時系列離散音響信号から所定の時間幅の時系列離散音響信号を切り出す。
16、000Hzのサンプリングレートでサンプリングされた時系列離散音響信号を例に取ると、波形切出部(10)は、サンプリングされた時系列離散音響信号から例えば時間軸方向に10msずつ移動しながら、50msの時間長の時系列離散音響信号を切り出す。つまり、800サンプル点(16、000Hz×50ms)の時系列離散音響信号を、160サンプル点(16、000Hz×10ms)ずつ移動しながら切り出した時系列離散音響信号を波形切出部(10)の出力とするのである。波形切出部(10)において出力された所定の時間幅の時系列離散音響信号は、外部記憶装置(17)のデータ格納領域(171)に格納される。以下では、外部記憶装置(17)のデータ格納領域(171)に格納されたn個のサンプル点の時系列離散音響信号の値x(k)〔k=1、2、・・・、n〕について、Exponential自己回帰モデルのパラメータ推定値を得る処理を説明する(具体的には、上記の例の場合、800サンプル点の時系列離散音響信号が切り出された場合、nの値は800となる。)。
なお、時系列離散音響信号の値x(k)は、上述したように、時系列離散音響信号の入力を受けた波形切出部(10)によって出力されたものに限らず、予め外部記憶装置(17)に保存記憶されるものであってもよい。
まず、制御部(図示しない)の制御の下、外部記憶装置(17)からモデル次数pの取りえる範囲の両端値mおよびcの値を読み出し、これらの値をRAM(15)のモデル次数範囲格納領域(1501)に格納して、モデル次数pの取りえる範囲を設定する(S200)。
例えば具体例として、m=10、c=1とすると、後述するモデル次数pは1〜10までの整数値をとることが可能であることを意味する。
モデル次数pの取りえる範囲の両端値mおよびcの値は、予め外部記憶装置(17)に保存記憶される場合に限らず、音響信号分析装置(1)に入力されることによって設定されるとしてもよい。一般的に、モデル次数pの取りえる範囲の両端値mおよびcの値は任意の値とすることができるが、mの値は(便宜的にm>cとする。従ってmは、モデル次数pの取りえる最大値となる。)、時系列離散音響信号の値x(k)の総個数であるn以下の値である必要がある。なお、モデル次数pは、Exponential自己回帰モデルの項数におよそ一致するので、モデル次数pが取りえる最大値mを大きい値に設定すると、膨大な計算量を要求するExponential自己回帰モデルとなるので、音響信号の種類などから好ましい最大値mを設定するのが良い。
次に、モデル次数設定部(141)によって、モデル次数pの初期値pを設定する(S201)。
モデル次数設定部(141)は、制御部の制御の下、モデル次数範囲格納領域(1501)に格納されるモデル次数pの取りえる範囲を読み出して、その範囲の中から1つの値を選択し、これをモデル次数pの初期値pとして設定して、RAM(15)のモデル次数p格納領域(1502)に格納する。初期値pとしては、ステップS200で設定されたモデル次数pの取りえる範囲の中の値から選択されるが、この実施形態ではp=1(=c)とする。
なお、モデル次数設定部(141)は必須のものではなく、例えば、モデル次数範囲格納領域(1501)に格納されるモデル次数pの取りえる範囲の全ての値について後述の処理を実行するのであれば、制御部の制御の下、モデル次数pの各値について、後述の処理を実行すればよい。
次に、スケールパラメータ初期値設定部(142)によって、式(6)に基づき、スケールパラメータγの初期値γを設定する(S202)。
式(6)において、Max(・)は最大値を求める関数である。スケールパラメータ初期値設定部(142)は、制御部の制御の下、外部記憶装置(17)から読み出されてRAM(15)の時系列離散音響信号値x(k)格納領域(1503)に格納されている時系列離散音響信号の値x(k)を読み出し、その二乗値が最大となるときのその最大値Max(x(k))(但し1≦k≦nである。)を求め、次いで、外部記憶装置(17)から読み出されてRAM(15)の初期値設定因子ε格納領域(1504)に格納されている初期値設定因子εを読み出し、式(6)に基づいて、スケールパラメータγの初期値γの値を求めて、これをRAM(15)のスケールパラメータ初期値γ格納領域(1505)に格納する。
Figure 2006243676
音響信号のような、信号の振幅が大きな箇所において非線形性が小さくなるような信号の場合に、信号の振幅が最大の箇所においてExponential自己回帰モデルのExponential項の自然対数の底eのべき乗の値が最小となるように、初期値設定因子εは小さな値とするのが良いが、その値として好ましくは、1.0×10−3以下の値(つまり0.001以下の値)とするのが良い。特に、1.0×10−7以下の値(つまり0.0000001以下の値)とすることで、より好適なパラメータ推定値を得ることができる。
なお、スケールパラメータγの初期値γは、式(6)によってのみ定められるものではない。n個の時系列離散音響信号の値x(k)のうち、その絶対値が最大となる時系列離散音響信号の値に基づいて、スケールパラメータγの初期値γを設定すればよく、より具体的には、n個の時系列離散音響信号の値x(k)のうち、その絶対値が最大となる時系列離散音響信号の値に対して、スケールパラメータγの値が最小となるようにし、その最小値を初期値γとするのである。式(6)で求められる初期値γは、その一例である。
次に、係数最小二乗誤差推定値演算部(143)によって、行列αの各成分(係数φ、係数π)の最小二乗誤差推定値(係数φ^、係数π^)を成分として持つ行列α^を求める(S203)。
係数最小二乗誤差推定値演算部(143)は、制御部の制御の下、モデル次数p格納領域(1502)に格納されているモデル次数pの値(この段階ではp=p(初期値1)である。)、時系列離散音響信号値x(k)格納領域(1503)に格納されている時系列離散音響信号の値x(k)、スケールパラメータ初期値γ格納領域(1505)に格納されているスケールパラメータγの初期値γを読み出し、これらの値に基づいて式(7)のように構成される行列α、X、Yから、公知の最小二乗誤差推定方法(行列α、X、Yを用いた正規方程式の解)によって行列α^を求め、行列α^の成分である係数φ^、係数π^の値をRAM(15)のφ^、π^格納領域(1506)に格納する。
Figure 2006243676
行列αの各成分である係数φ、係数πの最小二乗誤差推定値φ^、π^を成分に持つ行列α^は、次式(8)の行列計算によって求められる。
Figure 2006243676
次に、スケールパラメータ探索部(144)によって、式(9)に基づき、スケールパラメータγの値γ^を求める(S204)。
式(9)において、argmin(・)は括弧内の関数の値が最小の値を取るパラメータを出力する関数である。スケールパラメータ探索部(144)は、制御部の制御の下、モデル次数p格納領域(1502)に格納されているモデル次数pの値(この段階ではp=p(初期値1)である。)、時系列離散音響信号値x(k)格納領域(1503)に格納されている時系列離散音響信号の値x(k)、スケールパラメータ初期値γ格納領域(1505)に格納されているスケールパラメータγの初期値γ、φ^、π^格納領域(1506)に格納されている係数φ^、係数π^の値を読み出し、0≦γ≦γの範囲内で、例えば勾配法(最急降下法やニュートン法など)などの数値的最適化によって、赤池情報量規準AIC(p)の値を最小とするスケールパラメータγの値γ^を求め、これをRAM(15)のγ^格納領域(1507)に格納する。
Figure 2006243676
赤池情報量規準AIC(p)は、上記式(4)の中に示すものである。なお、情報量規準としては、赤池情報量規準AIC(p)に限定されるものではなく、その他の情報量規準(例えば、BIC(Schwarz’s Bayesian Information Criterion)など)を用いるとしてもよい。
次に、係数最小二乗誤差推定値演算部(143)によって、行列αの各成分(係数φ、係数π)の最小二乗誤差推定値(係数φ^、係数π^)を成分として持つ行列α^を求める(S205)。
係数最小二乗誤差推定値演算部(143)は、制御部の制御の下、モデル次数p格納領域(1502)に格納されているモデル次数pの値(この段階ではp=p(初期値1)である。)、時系列離散音響信号値x(k)格納領域(1503)に格納されている時系列離散音響信号の値x(k)、γ^格納領域(1507)に格納されているスケールパラメータγの値γ^を読み出し、これらの値に基づいて式(10)のように構成される行列α、X、Yから、公知の最小二乗誤差推定方法(行列α、X、Yを用いた正規方程式の解)によって行列α^を求め、行列α^の要素である係数φ^、係数π^の値をRAM(15)のφ^、π^格納領域(1506)に格納する。
Figure 2006243676
行列αの各成分である係数φ、係数πの最小二乗誤差推定値φ^、π^を成分に持つ行列α^は、次式(11)の行列計算によって求められる。
Figure 2006243676
次に、極限周期係数探索部(145)によって、式(14)に基づき、係数φ、係数πの値φ^^およびπ^^を求める(S206)。
極限周期係数探索部(145)は、制御部の制御の下、モデル次数p格納領域(1502)に格納されているモデル次数pの値(この段階ではp=p(初期値1)である。)、時系列離散音響信号値x(k)格納領域(1503)に格納されている時系列離散音響信号の値x(k)、γ^格納領域(1507)に格納されているスケールパラメータγの値γ^、φ^、π^格納領域(1506)に格納されているステップS205で得られた係数φ^、係数π^の値を読み出し、この係数φ^、係数π^を係数とする式(12)の2つの固有方程式
Figure 2006243676
の固有解λ、λ (但しλ はλの共役解を表し、λおよびλ をもって式(12)の上段の固有方程式の全ての固有解を表す。つまり、例えばr個の固有解をλ01、λ02、・・・、λ0rとすると、このr個の固有解をλによって表すのである。その他も同様である。)、λ、λ (但しλ はλの共役解を表し、λおよびλ をもって式(12)の下段の固有方程式の全ての固有解を表す。)のそれぞれが、式(13)を満たす範囲で(例えば|λ>1は、上記の例でいえば、r個の固有解λ01、λ02、・・・、λ0rのそれぞれが、|λ01>1、|λ02>1、・・・、|λ0r>1であることを意味する。その他も同様である。)、
Figure 2006243676
赤池情報量規準AIC(p)を最小にする係数φ、係数πの値φ^^およびπ^^(φ^^は、φの上に^が2つ付くものとする。)の組を、例えば勾配法(最急降下法やニュートン法など)などの数値的最適化により求め、この係数φ^^、係数π^^の値をRAM(15)のφ^^、π^^格納領域(1508)に格納する。
Figure 2006243676
ステップS206は、ステップS205で得られた係数φ^、π^によるExponential自己回帰モデルが音声信号のような揺らぎを持った周期信号をより良くモデル化するためには、式(12)の固有方程式を解いて得られる解λ、λ 、λ、λ について、λ、λ が単位円よりも外側、λ、λ が単位円の内側にある条件(式(13)に相当する。)を満たすことが望ましいことに基づいた処理である(上記非特許文献4参照)。
次に、スケールパラメータ探索部(144)によって、式(15)に基づき、スケールパラメータγの値γ^を求める(S207)。
スケールパラメータ探索部(144)は、制御部の制御の下、モデル次数p格納領域(1502)に格納されているモデル次数pの値(この段階ではp=p(初期値1)である。)、時系列離散音響信号値x(k)格納領域(1503)に格納されている時系列離散音響信号の値x(k)、スケールパラメータ初期値γ格納領域(1505)に格納されているスケールパラメータγの初期値γ、φ^^、π^^格納領域(1508)に格納されている係数φ^^、係数π^^の値を読み出し、0≦γ≦γの範囲内で、例えば勾配法(最急降下法やニュートン法など)などの数値的最適化によって、赤池情報量規準AIC(p)の値を最小とするスケールパラメータγの値γ^を求め、これをRAM(15)のγ^格納領域(1509)に格納する。
Figure 2006243676
以上のように、スケールパラメータ探索部(144)はスケールパラメータγの値として、γ^とγ^を求めるものである。
次に、スケールパラメータ判定部(146)によって、γ^格納領域(1507)に格納されているスケールパラメータγの値γ^と、γ^格納領域(1509)に格納されているスケールパラメータγの値γ^と、外部記憶装置(17)から読み出されてRAM(15)の判定閾値ε格納領域(1510)に格納されている判定閾値εを読み出し、前記2つの値の差が、判定閾値ε以下であるかを判定し、その判定結果をRAM(15)の判定結果格納領域(1511)に格納する(S208)。制御部は、判定結果格納領域(1511)に格納されている判定結果に基づき、判定閾値ε以下ではないとの判定結果の場合には、ステップS207で得られたスケールパラメータγの値γ^をスケールパラメータγの値γ^としてγ^格納領域(1507)に格納し(S209)、このスケールパラメータγの値γ^に基づいて、再度ステップS205〜S207の処理を行うようにする。このような処理を、制御部の制御の下、スケールパラメータγの値γ^と、スケールパラメータγの値γ^との差が判定閾値ε以下であると判定されるまで繰り返す。
制御部は、判定結果格納領域(1511)に格納されている判定結果が、判定閾値ε以下であるとの判定結果の場合には、ステップS210以降の処理を実行するようにする。
ステップS210において、最尤推定量出力部(147)は、スケールパラメータ判定部(146)によって、スケールパラメータγの値γ^と、スケールパラメータγの値γ^との差が判定閾値ε以下であると判定されたときの、スケールパラメータγの値γ^をγ^格納領域(1509)から読み出して出力し、さらに、ステップS207において、このスケールパラメータγの値γ^を与えたときの係数φ、係数πの値φ^^、π^^をφ^^、π^^格納領域(1508)から読み出して出力し、これらの値を最尤推定量としてRAM(15)の最尤推定量格納領域(1512)に格納する。この最尤推定量は、モデル次数pが初期値p=1のときのものなので、便宜的に(γ^、φ^^、π^^p=1と表すことにする。
なお、上記ステップS210では、スケールパラメータγの値γ^をγ^格納領域(1509)から読み出して出力し、さらに、ステップS207において、このスケールパラメータγの値γ^を与えたときの係数φ、係数πの値φ^^、π^^をφ^^、π^^格納領域(1508)から読み出して出力し、これらの値を最尤推定量としてRAM(15)の最尤推定量格納領域(1512)に格納するとしたが、この形態に限定されるものではない。即ち、最尤推定量出力部(147)は、スケールパラメータ判定部(146)によって、スケールパラメータγの値γ^と、スケールパラメータγの値γ^との差が判定閾値ε以下であると判定されたときの、スケールパラメータγの値γ^をγ^格納領域(1507)から読み出して出力し、さらに、ステップS204(なお、ステップS209を経過した後ではステップS207である。)において、このスケールパラメータγの値γ^を与えたときの係数φ、係数πの値φ^、π^をφ^、π^格納領域(1506)から読み出して出力し、これらの値を最尤推定量としてRAM(15)の最尤推定量格納領域(1512)に格納するようにしてもよい。
また、ステップS208では、判定閾値ε以下であるか否かを判定するものとしたが、判定閾値ε未満であるか否かを判定するものとしてもよい。
続いて、図示しないモデル次数判定部において、モデル次数p格納領域(1502)に格納されているモデル次数(この段階ではp=p(初期値1)である。)を読み出し、さらにモデル次数範囲格納領域(1501)に格納されている最大値mを読み出し、これらの値が等しいか否かを判定する(S211)。等しくないと判定された場合には、制御部によって、モデル次数p格納領域(1502)から読み出したモデル次数の値に1を加えて、モデル次数p格納領域(1502)を上書き格納する(S212)(上書き格納とは、格納領域に格納されている値などを開放してから、新しく値などを格納することを意味する。)。
そして、制御部の制御の下に、ステップS211において、モデル次数p格納領域(1502)に格納されるモデル次数pの値と、モデル次数範囲格納領域(1501)に格納される最大値mの値とが等しいと判定されるまで、モデル次数p格納領域(1502)に格納されたモデル次数pの値に基づいて、ステップS203〜S212の処理を繰り返す(なお、上記の式(7)、式(8)、式(9)、式(10)、式(11)、式(12)、式(14)、式(15)における記号pの値は、モデル次数p格納領域(1502)に格納されるモデル次数pの値に置換される。)。この結果、最尤推定量格納領域(1512)には、モデル次数pの各値(p=1、2、・・・、m)に対する最尤推定量(γ^、φ^^、π^^p=1、(γ^、φ^^、π^^p=2、・・・、(γ^、φ^^、π^^p=mが格納されることになる。
ステップS211において、モデル次数p格納領域(1502)に格納されるモデル次数pの値と、モデル次数範囲格納領域(1501)に格納される最大値mの値とが等しいと判定された場合、制御部の制御の下に、ステップS213の処理の実行へと進む。
モデル次数探索部(148)は、最尤推定量格納領域(1512)に格納されるモデル次数pの各値(p=1、2、・・・、m)に対する最尤推定量(γ^、φ^^、π^^p=1、(γ^、φ^^、π^^p=2、・・・、(γ^、φ^^、π^^p=mを読み出し、各最尤推定量ごとに、最尤推定量によって与えられる赤池情報量規準AIC(p)の値を最小にするモデル次数pの値p^を求め、このp^をRAM(15)のp^格納領域(1513)に格納する(S213)。
続いて、全最尤推定量出力部(149)によって、p^格納領域(1513)に格納されるp^の値を読み出して、このうちの最小の値p^^を出力し、さらにステップS213においてp^^を与えた最尤推定量を最尤推定量格納領域(1512)から読み出して出力し、これらの値を全最尤推定量格納領域(1514)に格納する(S214)。なお、全最尤推定量格納領域(1514)に格納された全最尤推定量は、外部記憶装置(17)に保存記憶するとしてよい。
ステップS214で得られた全最尤推定量がExponential自己回帰モデルのパラメータ推定値であり、この全最尤推定量によってExponential自己回帰モデルは一意に決定される。そして、このExponential自己回帰モデルに基づいて音響信号の予測を行うなどの分析がなされる。
<第2の実施形態>
次に、本発明の音響信号分析装置・方法の第2の実施形態を説明する。
第2の実施形態における音響信号分析装置の構成は、上記第1の実施形態に係わる音響信号分析装置(1)のハードウェア構成と同様であるので説明を略する。なお、第2の実施形態においては、モデル次数探索プログラム(178)と全最尤推定量出力プログラム(179)は使用しないので、これらのプログラムを音響信号分析装置の外部記憶装置に保存記憶する必要はないが、仮に保存記憶していても実行しなければよいだけなので、上記第1の実施形態に係わる音響信号分析装置(1)のハードウェア構成と同様であるといえる。
図4は、第2の実施形態に係わる音響信号分析装置においてExponential自己回帰モデルのパラメータ推定値を得る処理機能を示す機能ブロック図である。
図5は、第2の実施形態に係わる音響信号分析装置においてExponential自己回帰モデルのパラメータ推定値を得る処理を示すフローチャートである。
なお、第1の実施形態と同様の構成要素などには同一の符号を当てて、その説明を省略する。
第1の実施形態と第2の実施形態との差異は、第1の実施形態では、初期値p=1から最大値mまでのモデル次数pについて最尤推定量を求めたが、第2の実施形態では、計算時間の短縮などの目的から、モデル次数pを適宜1つの値qに定め、この定められたモデル次数qに対する最尤推定量をもって、Exponential自己回帰モデルのパラメータ推定値とする点にある。即ち、上記第1の実施形態におけるステップS200、ステップS211〜S214を省略したのが、第2の実施形態に相当する。
モデル次数qは、音響信号分析装置の外部記憶装置に保存記憶されているとしても、あるいは、音響信号分析装置の入力部から入力されて与えられるとしてもよい。このモデル次数qは、例えば外部記憶装置から読み出されてRAMのモデル次数p格納領域に格納される。そして、このモデル次数p格納領域に格納されているモデル次数qが、スケールパラメータ探索部などによって適宜読み出されて、第1の実施形態で説明したステップS201〜S210の処理が行われ、その結果として、モデル次数qにおける最尤推定量(γ^、φ^^、π^^p=qが最尤推定量格納領域に格納され、これがExponential自己回帰モデルのパラメータ推定値となる。
<第3の実施形態>
次に、本発明の音響信号分析装置・方法の第3の実施形態を説明する。
第3の実施形態における音響信号分析装置の構成は、上記第1の実施形態に係わる音響信号分析装置(1)のハードウェア構成と同様であるので説明を略する。なお、第3の実施形態においては、極限周期次数探索プログラム(175)は使用しないので、これのプログラムを音響信号分析装置の外部記憶装置に保存記憶する必要はないが、仮に保存記憶していても実行しなければよいだけなので、上記第1の実施形態に係わる音響信号分析装置(1)のハードウェア構成と同様であるといえる。
図6は、第3の実施形態に係わる音響信号分析装置においてExponential自己回帰モデルのパラメータ推定値を得る処理機能を示す機能ブロック図である。
図7は、第3の実施形態に係わる音響信号分析装置においてExponential自己回帰モデルのパラメータ推定値を得る処理を示すフローチャートである。
なお、第1の実施形態と同様の構成要素などには同一の符号を当てて、その説明を省略する。
第1の実施形態と第3の実施形態との差異は、第1の実施形態では、ステップS206を処理したが、第3の実施形態では、計算時間の短縮などの目的から、ステップS206を処理しない点にある。
この場合、第3の実施形態のステップS207における係数φ、πの値φ^^、π^^は、第3の実施形態のステップS205で得られた係数φ^、π^の値によることになる。その他のステップにおける処理は全て第1の実施形態における処理と同様である。
<第4の実施形態>
次に、本発明の音響信号分析装置・方法の第4の実施形態を説明する。
第4の実施形態における音響信号分析装置の構成は、上記第1の実施形態に係わる音響信号分析装置(1)のハードウェア構成と同様であるので説明を略する。なお、第4の実施形態においては、極限周期次数探索プログラム(175)、モデル次数探索プログラム(178)および全最尤推定量出力プログラム(179)は使用しないので、これのプログラムを音響信号分析装置の外部記憶装置に保存記憶する必要はないが、仮に保存記憶していても実行しなければよいだけなので、上記第1の実施形態に係わる音響信号分析装置(1)のハードウェア構成と同様であるといえる。
図8は、第4の実施形態に係わる音響信号分析装置においてExponential自己回帰モデルのパラメータ推定値を得る処理機能を示す機能ブロック図である。
図9は、第4の実施形態に係わる音響信号分析装置においてExponential自己回帰モデルのパラメータ推定値を得る処理を示すフローチャートである。
なお、第1の実施形態と同様の構成要素などには同一の符号を当てて、その説明を省略する。
第1の実施形態と第4の実施形態との差異は、第1の実施形態では、初期値p=1から最大値mまでのモデル次数pについて最尤推定量を求め、かつ、ステップS206を処理したが、第3の実施形態では、計算時間の短縮などの目的から、ステップS206を処理せず、モデル次数pを適宜1つの値qに定め、この定められたモデル次数qに対する最尤推定量をもって、Exponential自己回帰モデルのパラメータ推定値とする点にある。
つまり、第4の実施形態は、第2の実施形態と第3の実施形態を兼ねるものであり、上記第2の実施形態および上記第3の実施形態でそれぞれ説明したことが、そのまま第4の実施形態に妥当する。
即ち、上記第1の実施形態におけるステップS200、ステップS206、ステップS211〜S214を省略したのが、第4の実施形態に相当するものであり、第4の実施形態のステップS207における係数φ、πの値φ^^、π^^は、第4の実施形態のステップS205で得られた係数φ^、π^の値によることとし、モデル次数p格納領域に格納されているモデル次数q(適宜1つに定められた値である。)が、スケールパラメータ探索部などによって適宜読み出されて、第1の実施形態で説明したステップS201〜S210の処理が行われ、その結果として、モデル次数qにおける最尤推定量(γ^、φ^^、π^^p=qが最尤推定量格納領域に格納され、これがExponential自己回帰モデルのパラメータ推定値となる。
本発明である音響信号分析装置・方法は上述の実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。また、上記音響信号分析装置・方法において説明した処理は、記載の順に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されるとしてもよい。例えば、第1の実施形態において、ステップS200およびS201の処理を、ステップS202の処理の後に実行することなどが可能である。
また、上記音響信号分析装置における処理機能をコンピュータによって実現する場合、音響信号分析装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記音響信号分析装置における処理機能がコンピュータ上で実現される。
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。具体的には、例えば、磁気記録装置として、ハードディスク装置、フレキシブルディスク、磁気テープ等を、光ディスクとして、DVD(Digital Versatile Disc)、DVD−RAM(Random Access Memory)、CD−ROM(Compact Disc Read Only Memory)、CD−R(Recordable)/RW(ReWritable)等を、光磁気記録媒体として、MO(Magneto-Optical disc)等を、半導体メモリとしてEEP−ROM(Electronically Erasable and Programmable-Read Only Memory)等を用いることができる。
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記録媒体に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。
また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、音響信号分析装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。
本発明者らは、実際の音声データを用いた場合における、本発明の音響信号分析装置・方法によって得られたパラメータ推定値に基づくExponential自己回帰モデルの予測性能の検証、および、他のExponential自己回帰モデルパラメータ推定手段を用いた場合との比較検証を行った。
使用した音声データは日本人話者1名によって発声された日本語5母音で、サンプリング周波数48kHz、量子化ビット数16ビットで離散サンプリングされたものをサンプリング周波数16kHzにダウンサンプリングしたものを用いた。その上で、それぞれ50ms分に相当する800サンプル点のデータを取り出してこれを用いた。これらの音声データを図4に示す。図4に示された信号はほぼ定常的な周期を持つ信号ではあるが、1周期ごとの周期長や振幅は必ずしも一定ではなく時間と共に変動している(揺らいでいる)ことが分かる。これは自然界に存在するほとんど全ての音響信号が持つ特性である。
これらの音声データに対し、本発明の音響信号分析装置・方法を用いて得られたパラメータ推定値に基づくExponential自己回帰モデルをもとに、実音声データにモデルを当てはめた場合の予測値を図5に示す(但し、この検証実験ではモデル次数pの値を30に固定して設定した。)。
図5に示すとおり、本発明の音響信号分析装置・方法によって得られたパラメータ推定値に基づくExponential自己回帰モデルが高い予測性能を示し、図4に示される元の音声データとほぼ同様の波形を得られることがわかる。
本発明の音響信号分析装置・方法によって得られたパラメータ推定値に基づくExponential自己回帰モデルによる予測精度を、離散的にスケールパラメータγを設定し最小のAIC(p)の値を与えるスケールパラメータγを選択する従来のパラメータ推定方法によって得られたパラメータ推定値に基づくExponential自己回帰モデルの予測精度と比較する。ここでのモデル次数は12とした。比較の基準としては平均予測誤差を用いた。この結果を図6に示す。図6に示すとおり、全ての音声データについて本発明の平均予測誤差が常に小さいか又は等しいことがわかり、本発明の音響信号分析装置・方法によって得られたパラメータ推定値に基づくExponential自己回帰モデルがより音声データのモデルとして適していることが示された。これは、本発明の音響信号分析装置・方法によって得られたパラメータ推定値に基づくExponential自己回帰モデルが、上記の音声データの揺らぎをより良くモデル化できていることを意味している。
また、赤池情報量規準(AIC(p))の値についても、上記の従来のパラメータ推定方法によって得られたパラメータ推定値に基づく赤池情報量規準(AIC(p))の値と、本発明の音響信号分析装置・方法によって得られたパラメータ推定値に基づく赤池情報量規準(AIC(p))の値とを比較した。これを図7に示す。図7に示すとおり、全ての音声データについて本発明の手法の方のAICの値が小さく、現実の音声データにより適応したモデル化が行えているのが分かる。
本発明の音響信号分析装置および方法は、音声や楽音の符号化、雑音信号抑圧、残響除去、自動音声認識などにおける音響信号分析に有用である。
第1の実施形態に係わる音響信号分析装置(1)のハードウェア構成を例示した構成ブロック図。 第1の実施形態に係わる音響信号分析装置(1)においてExponential自己回帰モデルのパラメータ推定値を得る処理機能を示す機能ブロック図。 第1の実施形態に係わる音響信号分析装置(1)においてExponential自己回帰モデルのパラメータ推定処理を示すフローチャート。 第2の実施形態に係わる音響信号分析装置においてExponential自己回帰モデルのパラメータ推定値を得る処理機能を示す機能ブロック図。 第2の実施形態に係わる音響信号分析装置においてExponential自己回帰モデルのパラメータ推定処理を示すフローチャート。 第3の実施形態に係わる音響信号分析装置においてExponential自己回帰モデルのパラメータ推定値を得る処理機能を示す機能ブロック図。 第3の実施形態に係わる音響信号分析装置においてExponential自己回帰モデルのパラメータ推定処理を示すフローチャート。 第4の実施形態に係わる音響信号分析装置においてExponential自己回帰モデルのパラメータ推定値を得る処理機能を示す機能ブロック図。 第4の実施形態に係わる音響信号分析装置においてExponential自己回帰モデルのパラメータ推定処理を示すフローチャート。 検証実験に用いた音声データの波形を示す図。 本発明の音響信号分析方法を用いて得られたパラメータ推定値に基づくExponential自己回帰モデルによる音声データの予測値を示す図。 本発明の音響信号分析方法を用いて得られたパラメータ推定値に基づくExponential自己回帰モデルと、従来方法によって得られたパラメータ推定値に基づくExponential自己回帰モデルとによる音声データの平均予測誤差の差を示す図。 本発明の音響信号分析方法を用いて得られたパラメータ推定値に基づくExponential自己回帰モデルと、従来方法によって得られたパラメータ推定値に基づくExponential自己回帰モデルとによる音声データに対する赤池情報量規準(AIC(p))の比較を示す図。
符号の説明
1 音響信号分析装置
142 スケールパラメータ初期値設定部
143 係数最小二乗誤差推定値演算部
144 スケールパラメータ探索部
145 極限周期係数探索部
146 スケールパラメータ判定部
147 最尤推定量出力部
148 モデル次数探索部
149 全最尤推定量出力部

Claims (10)

  1. ある時点{t}における時系列離散音響信号の値x(t)を、
    当該時点{t}よりも前の各時点{t−i}〔但しi=1、2、・・・、pとし、モデル次数pは自然数とする。〕における時系列離散音響信号の値x(t−i)のそれぞれに対して係数φを乗じたものの総和と、
    時点{t}よりも前の各時点{t−i}における時系列離散音響信号の値x(t−i)のそれぞれに対して、係数πおよび、スケールパラメータγ〔但し0≦γとする。〕と時点{t−1}における時系列離散音響信号の値x(t−1)の二乗との積を指数とする自然対数の底eのべき乗を乗じたものの総和と、
    正規白色雑音に従う観測誤差ε(t)と
    の和によって表すExponential自己回帰モデル
    Figure 2006243676
    のモデル次数p、係数φ、係数πおよびスケールパラメータγを、n個〔但しnは、n>pを満たす整数とする。〕の時系列離散音響信号の値x(k)〔但しk=1、2、・・・、nとする。〕から推定することによって音響信号の分析を行う音響信号分析装置であって、
    n個の時系列離散音響信号の値x(k)と、
    モデル次数pと、
    判定閾値ε
    を記憶する記憶手段と、
    n個の時系列離散音響信号の値x(k)のうち、その絶対値が最大となる時系列離散音響信号の値に基づいて、スケールパラメータγの初期値γを設定して、これを出力するスケールパラメータ初期値設定手段と、
    スケールパラメータγ、モデル次数pおよびn個の時系列離散音響信号の値x(k)に基づいて、係数φおよび係数πの最小二乗誤差推定値φ^およびπ^を演算して、この演算結果を出力する係数最小二乗誤差推定値演算手段と、
    モデル次数pおよびn個の時系列離散音響信号の値x(k)並びに、係数最小二乗誤差推定値演算手段によって出力された最小二乗誤差推定値φ^およびπ^によって与えられるExponential自己回帰モデルに関する情報量規準の値が最小となるスケールパラメータγの値γ^を、0以上γ以下の範囲において探索して、この探索結果を出力するスケールパラメータ探索手段と、
    スケールパラメータ探索手段によって出力されたスケールパラメータγの値γ^とγ^との差が判定閾値ε以下であるか否かを判定して、この判定結果を出力するスケールパラメータ判定手段と、
    スケールパラメータ判定手段において判定閾値ε以下であると判定されたときの、スケールパラメータγの値γ^、並びにスケールパラメータ探索手段においてスケールパラメータγの値γ^を出力したときの最小二乗誤差推定値、または、スケールパラメータγの値γ^、並びにスケールパラメータ探索手段においてスケールパラメータγ^を出力したときの最小二乗誤差推定値の少なくともいずれか一方を、最尤推定量として出力する最尤推定量出力手段と
    を備えたことを特徴とする音響信号分析装置。
  2. 係数最小二乗誤差推定値演算手段によって出力された最小二乗誤差推定値φ^およびπ^を係数とする2つの固有方程式
    Figure 2006243676
    の固有解λ、λ (但しλ はλの共役解を表し、λおよびλ をもって固有方程式(a)の全ての固有解を表す。)、λ、λ (但しλ はλの共役解を表し、λおよびλ をもって固有方程式(b)の全ての固有解を表す。)がそれぞれ
    Figure 2006243676
    を満たす範囲において、モデル次数pおよびn個の時系列離散音響信号の値x(k)並びに、係数最小二乗誤差推定値演算手段によって上記最小二乗誤差推定値φ^およびπ^が出力されたときのスケールパラメータγの値によって与えられるExponential自己回帰モデルに関する情報量規準の値が最小となる係数φおよび係数πの値φ^^およびπ^^を探索して、この探索結果を出力する極限周期係数探索手段を備え、
    スケールパラメータ探索手段が、
    モデル次数pおよびn個の時系列離散音響信号の値x(k)並びに、極限周期係数探索手段によって出力された係数φおよび係数πの値φ^^およびπ^^によって与えられるExponential自己回帰モデルに関する情報量規準の値が最小となるスケールパラメータγの値γ^を、0以上γ以下の範囲において探索して、この探索結果を出力することが可能である
    ことを特徴とする請求項1に記載の音響信号分析装置。
  3. モデル次数pの取りえる範囲の両端値mおよびc〔但しmおよびcは、自然数とする。〕が記憶手段に記憶され、
    両端値mおよびcの範囲にあるモデル次数pの各値〔但し、この値は整数とする。〕について、最尤推定量出力手段で出力された最尤推定量によって与えられるExponential自己回帰モデルに関する情報量規準の値が最小となるモデル次数pの値p^を探索して、この探索結果を出力するモデル次数探索手段と、
    モデル次数探索手段において出力されたモデル次数pの値p^のうち最小の値p^^、並びにモデル次数探索手段においてモデル次数pの値p^^を出力したときの最尤推定量を出力する全最尤推定量出力手段と
    を備えたことを特徴とする請求項1または請求項2に記載の音響信号分析装置。
  4. 初期値設定因子ε(但し0<εとする。)が記憶手段に記憶され、
    スケールパラメータ初期値設定手段が、
    初期値設定因子εと、n個の時系列離散音響信号の値x(k)のうち、その二乗の値が最大となるときの値とに基づいて、スケールパラメータγの初期値γ
    Figure 2006243676
    を設定して出力するものである
    ことを特徴とする請求項1から請求項3に記載の音響信号分析装置。
  5. ある時点{t}における時系列離散音響信号の値x(t)を、
    当該時点{t}よりも前の各時点{t−i}〔但しi=1、2、・・・、pとし、モデル次数pは自然数とする。〕における時系列離散音響信号の値x(t−i)のそれぞれに対して係数φを乗じたものの総和と、
    時点{t}よりも前の各時点{t−i}における時系列離散音響信号の値x(t−i)のそれぞれに対して、係数πおよび、スケールパラメータγ〔但し0≦γとする。〕と時点{t−1}における時系列離散音響信号の値x(t−1)の二乗との積を指数とする自然対数の底eのべき乗を乗じたものの総和と、
    正規白色雑音に従う観測誤差ε(t)と
    の和によって表すExponential自己回帰モデル
    Figure 2006243676
    のモデル次数p、係数φ、係数πおよびスケールパラメータγを、予め与えられたn個〔但しnは、n>pを満たす整数とする。〕の時系列離散音響信号の値x(k)〔但しk=1、2、・・・、nとする。〕から推定することによって音響信号の分析を行う音響信号分析方法であって、
    モデル次数pを設定するモデル次数設定ステップと、
    n個の時系列離散音響信号の値x(k)のうち、その絶対値が最大となる時系列離散音響信号の値に基づいて、スケールパラメータγの初期値γを設定して出力するスケールパラメータ初期値設定ステップと、
    スケールパラメータγ並びに、モデル次数設定ステップで設定されたモデル次数pおよびn個の時系列離散音響信号の値x(k)に基づいて、係数φおよび係数πの最小二乗誤差推定値φ^およびπ^を演算して、この演算結果を出力する係数最小二乗誤差推定値演算ステップと、
    モデル次数設定ステップで設定されたモデル次数pおよびn個の時系列離散音響信号の値x(k)並びに、係数最小二乗誤差推定値演算ステップによって出力された最小二乗誤差推定値φ^およびπ^によって与えられるExponential自己回帰モデルに関する情報量規準の値が最小となるスケールパラメータγの値γ^を、0以上γ以下の範囲において探索して、この探索結果を出力するスケールパラメータ探索ステップと、
    スケールパラメータ探索ステップによって出力されたスケールパラメータγの値γ^とγ^との差が判定閾値ε以下であるか否かを判定して、この判定結果を出力するスケールパラメータ判定ステップと、
    スケールパラメータ判定ステップにおいて判定閾値ε以下であると判定されたときに、スケールパラメータγの値γ^、並びにスケールパラメータ探索ステップにおいてスケールパラメータγの値γ^を出力したときの最小二乗誤差推定値、または、スケールパラメータγの値γ^、並びにスケールパラメータ探索ステップにおいてスケールパラメータγの値γ^を出力したときの最小二乗誤差推定値の少なくともいずれか一方を、最尤推定量として出力する最尤推定量出力ステップと
    を有することを特徴とする音響信号分析方法。
  6. 係数最小二乗誤差推定値演算ステップによって出力された最小二乗誤差推定値φ^およびπ^を係数とする2つの固有方程式
    Figure 2006243676

    の固有解λ、λ (但しλ はλの共役解を表し、λおよびλ をもって固有方程式(c)の全ての固有解を表す。)、λ、λ (但しλ はλの共役解を表し、λおよびλ をもって固有方程式(d)の全ての固有解を表す。)がそれぞれ
    Figure 2006243676
    を満たす条件において、n個の時系列離散音響信号の値x(k)およびモデル次数設定ステップで設定されたモデル次数p並びに、係数最小二乗誤差推定値演算ステップによって上記最小二乗誤差推定値φ^およびπ^が出力されたときのスケールパラメータγの値によって与えられるExponential自己回帰モデルに関する情報量規準の値が最小となる係数φ^および係数π^の値φ^^およびπ^^を探索して、この探索結果を出力する極限周期係数探索ステップを有し、
    スケールパラメータ探索ステップが、
    n個の時系列離散音響信号の値x(k)およびモデル次数設定ステップで設定されたモデル次数p並びに、極限周期係数探索ステップによって出力された係数φ^および係数π^の値φ^^およびπ^^によって与えられるExponential自己回帰モデルに関する情報量規準の値が最小となるスケールパラメータγ^を、0以上γ以下の範囲において探索して、この探索結果を出力することが可能である
    ことを特徴とする請求項5に記載の音響信号分析方法。
  7. モデル次数pの取りえる範囲の両端値mおよびc〔但しmおよびcは、自然数とする。〕を設定するモデル次数範囲設定ステップと、
    モデル次数範囲設定ステップによって設定されたモデル次数pの範囲で、モデル次数設定ステップにおいて設定されたモデル次数pの各値〔但し、この値は整数とする。〕について、最尤推定量出力ステップによる最尤推定量の出力を行うモデル次数対応最尤推定量出力ステップと、
    モデル次数対応最尤推定量出力ステップにおいて出力された最尤推定量それぞれについて、当該最尤推定量によって与えられるExponential自己回帰モデルに関する情報量規準の値が最小となるモデル次数pの値p^を探索して、この探索結果を出力するモデル次数探索ステップと、
    モデル次数探索ステップにおいて出力されたモデル次数pの各値p^のうち最小の値p^^、並びにモデル次数探索ステップにおいてモデル次数pの値p^^を出力したときの最尤推定量を出力する全最尤推定量出力ステップと
    を有することを特徴とする請求項5または請求項6に記載の音響信号分析方法。
  8. スケールパラメータ初期値設定ステップが、
    初期値設定因子ε(但し0<εとする。)と、n個の時系列離散音響信号の値x(k)のうち、その二乗の値が最大となるときの値とに基づいて、スケールパラメータγの初期値γ
    Figure 2006243676
    を設定して出力するものである
    ことを特徴とする請求項5から請求項7に記載の音響信号分析方法。
  9. 請求項1から請求項4に記載された音響信号分析装置としてコンピュータを機能させるための音響信号分析プログラム。
  10. 請求項9に記載の音響信号分析プログラムを記録した、コンピュータによって読み取り可能なプログラム記録媒体。
JP2005063162A 2005-03-07 2005-03-07 音響信号分析装置およびその方法、プログラム、記録媒体 Expired - Fee Related JP4486527B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005063162A JP4486527B2 (ja) 2005-03-07 2005-03-07 音響信号分析装置およびその方法、プログラム、記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005063162A JP4486527B2 (ja) 2005-03-07 2005-03-07 音響信号分析装置およびその方法、プログラム、記録媒体

Publications (3)

Publication Number Publication Date
JP2006243676A true JP2006243676A (ja) 2006-09-14
JP2006243676A5 JP2006243676A5 (ja) 2007-03-22
JP4486527B2 JP4486527B2 (ja) 2010-06-23

Family

ID=37050108

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005063162A Expired - Fee Related JP4486527B2 (ja) 2005-03-07 2005-03-07 音響信号分析装置およびその方法、プログラム、記録媒体

Country Status (1)

Country Link
JP (1) JP4486527B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009110578A1 (ja) * 2008-03-03 2009-09-11 日本電信電話株式会社 残響除去装置、残響除去方法、残響除去プログラム、および記録媒体
US7844452B2 (en) 2008-05-30 2010-11-30 Kabushiki Kaisha Toshiba Sound quality control apparatus, sound quality control method, and sound quality control program
US7856354B2 (en) 2008-05-30 2010-12-21 Kabushiki Kaisha Toshiba Voice/music determining apparatus, voice/music determination method, and voice/music determination program
JP2015519614A (ja) * 2012-06-18 2015-07-09 ゴーアテック インコーポレイテッドGoertek Inc シングルチャンネル音声残響除去方法及びその装置
CN110378031A (zh) * 2019-07-22 2019-10-25 季孔云 实时呼吸信号监测方法、装置、呼吸监测器及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CSNG200401749006, 西口 義朋 Yoshitomo NISHIGUCHI, "座標変換を用いたテンソル積展開による高次スペクトルのパラメトリック推定 Parametric Estimation of Hig", 電子情報通信学会論文誌 (J86−A) 第1号 THE TRANSACTIONS OF THE INSTITUTE OF ELECTRONICS,INF, 20030101, 第J86−A巻, JP, 社団法人電子情報通信学会 THE INSTITUTE OF ELECTRO *
JPN6010013871, 西口 義朋 Yoshitomo NISHIGUCHI, "座標変換を用いたテンソル積展開による高次スペクトルのパラメトリック推定 Parametric Estimation of Hig", 電子情報通信学会論文誌 (J86−A) 第1号 THE TRANSACTIONS OF THE INSTITUTE OF ELECTRONICS,INF, 20030101, 第J86−A巻, JP, 社団法人電子情報通信学会 THE INSTITUTE OF ELECTRO *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009110578A1 (ja) * 2008-03-03 2009-09-11 日本電信電話株式会社 残響除去装置、残響除去方法、残響除去プログラム、および記録媒体
CN102084667A (zh) * 2008-03-03 2011-06-01 日本电信电话株式会社 回响去除装置、回响去除方法、回响去除程序、以及记录介质
US8467538B2 (en) 2008-03-03 2013-06-18 Nippon Telegraph And Telephone Corporation Dereverberation apparatus, dereverberation method, dereverberation program, and recording medium
JP5227393B2 (ja) * 2008-03-03 2013-07-03 日本電信電話株式会社 残響除去装置、残響除去方法、残響除去プログラム、および記録媒体
US7844452B2 (en) 2008-05-30 2010-11-30 Kabushiki Kaisha Toshiba Sound quality control apparatus, sound quality control method, and sound quality control program
US7856354B2 (en) 2008-05-30 2010-12-21 Kabushiki Kaisha Toshiba Voice/music determining apparatus, voice/music determination method, and voice/music determination program
JP2015519614A (ja) * 2012-06-18 2015-07-09 ゴーアテック インコーポレイテッドGoertek Inc シングルチャンネル音声残響除去方法及びその装置
JP2017021385A (ja) * 2012-06-18 2017-01-26 ゴーアテック インコーポレイテッドGoertek Inc シングルチャンネル音声残響除去方法及びその装置
CN110378031A (zh) * 2019-07-22 2019-10-25 季孔云 实时呼吸信号监测方法、装置、呼吸监测器及存储介质
CN110378031B (zh) * 2019-07-22 2023-03-24 季孔云 实时呼吸信号监测方法、装置、呼吸监测器及存储介质

Also Published As

Publication number Publication date
JP4486527B2 (ja) 2010-06-23

Similar Documents

Publication Publication Date Title
JP5411936B2 (ja) 音声信号区間推定装置と音声信号区間推定方法及びそのプログラムと記録媒体
KR101029786B1 (ko) 감정 검출 방법, 감정 검출 장치, 그 방법을 실장한 감정 검출 프로그램 및 그 프로그램을 기록한 기록 매체
JP5218052B2 (ja) 言語モデル生成システム、言語モデル生成方法および言語モデル生成用プログラム
EP1394770A1 (en) Voice recognition apparatus and voice recognition method
JP4634969B2 (ja) 線形予測モデル次数決定装置、線形予測モデル次数決定方法、そのプログラムおよび記録媒体
JP4486527B2 (ja) 音響信号分析装置およびその方法、プログラム、記録媒体
JP4298672B2 (ja) 混合分布hmmの状態の出力確率計算方法および装置
JP6281211B2 (ja) 音響信号のアライメント装置、アライメント方法及びコンピュータプログラム
JP6216809B2 (ja) パラメータ調整システム、パラメータ調整方法、プログラム
JP4630183B2 (ja) 音声信号分析装置、音声信号分析方法及び音声信号分析プログラム
JP5815435B2 (ja) 音源位置判定装置、音源位置判定方法、プログラム
JP5191500B2 (ja) 雑音抑圧フィルタ算出方法と、その装置と、プログラム
JP4691050B2 (ja) Parcor係数算出方法、及びその装置とそのプログラムと、その記憶媒体
JP5914119B2 (ja) 音響モデル性能評価装置とその方法とプログラム
JP4691079B2 (ja) 音声信号区間推定装置、方法、プログラムおよびこれを記録した記録媒体
JP4729078B2 (ja) 音声認識装置とその方法と、プログラムとその記録媒体
JP4843646B2 (ja) 音声認識装置とその方法と、プログラムと記録媒体
JP5166195B2 (ja) 音響分析パラメータ生成方法とその装置と、プログラムと記録媒体
JP4653673B2 (ja) 信号判定装置、信号判定方法、信号判定プログラムおよび記録媒体
JP4690973B2 (ja) 信号区間推定装置、方法、プログラム及びその記録媒体
JP2007304515A (ja) オーディオ信号伸張圧縮方法及び装置
JP6234134B2 (ja) 音声合成装置
JP4242320B2 (ja) 音声認識方法、その装置およびプログラム、その記録媒体
JP2734828B2 (ja) 確率演算装置及び確率演算方法
JP6121313B2 (ja) ポーズ推定装置、方法、プログラム

Legal Events

Date Code Title Description
RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20070116

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070201

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070201

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100305

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100316

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100326

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130402

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140402

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees