JP4166405B2 - 駆動信号分析装置 - Google Patents
駆動信号分析装置 Download PDFInfo
- Publication number
- JP4166405B2 JP4166405B2 JP2000059861A JP2000059861A JP4166405B2 JP 4166405 B2 JP4166405 B2 JP 4166405B2 JP 2000059861 A JP2000059861 A JP 2000059861A JP 2000059861 A JP2000059861 A JP 2000059861A JP 4166405 B2 JP4166405 B2 JP 4166405B2
- Authority
- JP
- Japan
- Prior art keywords
- circuit
- equation
- group delay
- calculation circuit
- point
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
Description
【発明の属する技術分野】
本発明は、駆動信号分析装置に関するものである。
【0002】
【従来の技術】
音声など、信号のエネルギーが時間とともに変動するような信号は、エネルギーの供給源となる駆動による応答が集まったものと解釈することができる。このそれぞれの駆動による応答を波形から得られる情報に基づいて、一つ一つの駆動による応答に分離することが求められている。また、そうして選択されたそれぞれの応答について、その応答の原因となった駆動がどのようなものであるかを推定することも求められている。
【0003】
このような分離や推定は、例えば音声波形を1ピッチ毎に切出して編集することにより音声合成を行う波形編集合成方式において、適切な波形を切出すための鍵となる技術である。また、音声信号の振幅スペクトル成分に主に含まれる言語情報と、音声信号の駆動信号に主に含まれる感情等のパラ言語情報を精密に分離するための鍵となる分析技術である。しかし、これまでは、駆動による応答の適切な選択や応答の原因となった駆動の属性を合成に適した形で抽出する方法は無かった。
【0004】
例えば、駆動情報を取り出そうとする初期の試みの一つに数kHzという比較的高い中心周波数を有する帯域フィルタの出力の包絡の変動に基づいて駆動による応答を抽出しようという検討がある(T.V Ananthapadmauabha and B.Yegnanarayana,“Epoch extraction of voiced speech”IEEE Trans.Acoust.Speech,Signal Processing,Vol.ASSP−23,pp.562−570,1975)。この方法では、包絡の変動の選択に適当な閾値を設けることで、音声における声門閉止という高い周波数成分においてエネルギーが時間的に集中する現象を抽出している。しかし、閾値の設定は恣意的であり、また、合成に使うための駆動そのものの性質を記述する方法を有していない。
【0005】
音声合成という目的を明確にし、そのための駆動信号を求めようとする最近の提案に、合成と分析を繰返すことで逐次的に駆動信号の推定値を改良しようとするものがある(Wen Ding,Hideki Kasuya,Shuichi Adachi,“Simultaneous Estimation of Vocal Tract and voice Source Parameters Based on an ARX Model,”IEICE Trans.Info.and System,Vol.E78−D,No.6,pp.738−743,1995.)。しかし、この方法では、駆動信号のモデルとして自由度の少ないものを用いているため、現実の音声のように多様な発声に対しては、十分に近似できないことが生ずる。そのため、多様な発声の状況の全てにわたって高品質の音声合成を可能にするものではない。また、近似度を逐次的に改善する繰返し演算は計算量も多く、実時間処理を要求されるような応用には適していないという問題がある。
【0006】
最近の試みの中には、突発的な現象の抽出に適した性質を有するwaveletを用いて音声の駆動情報を抽出しようとするものがある(S.Kadambe,G.F.Boudreaux−Bartels,“Application of the wavelet transform for pitch detection of speech signals,”IEEE Trans.Information Theory,vol.38,No.2,pp.917−924,March 1992)。しかし、この方法においても、信号の中の特異性を有する時点が一点であれば精密な抽出はできるものの、実際の音声のように厳密には特異性を有する一点が存在せず、ある範囲にランダムに拡がっているような場合には、適切な位置が抽出されるかは明らかでは無い。また、そのような駆動現象の拡がりを表すパラメータを持たないため、高品質の音声合成を可能にする情報の抽出の手段としては有効では無い。
【0007】
このように、これまでの方法では、高品質の分析と加工および合成に適合した合理的な駆動信号の抽出方法は無かったといえる。
【0008】
【発明が解決しようとする課題】
音声をはじめとする音響信号の性質を表す場合、信号の原動力となる駆動情報とそれによって駆動される伝達特性の双方の記述が必要となる。しかし、これまでは高品位の再合成に適した駆動情報を音響信号の分析により求めることは困難であった。すなわち、これまで、分析と加工の双方に適合した合理的な駆動信号の抽出方法は無かった。
【0009】
本発明では、上記問題点を除去し、分析と加工の双方に適合した合理的な駆動信号の抽出を行うことができる駆動信号分析装置を提供することを目的とする。
【0010】
【課題を解決するための手段】
本発明は、上記目的を達成するために、
〔1〕駆動信号分析方法において、下記式(10)を用いて不動点としての駆動点の候補を抽出し、同時に、下記式(13)により、継続時間を求める第1のステップと、それぞれの前記駆動点において、下記式(18)を用いて最小位相インパルス応答に対応する群遅延を求める第2のステップと、前記第1のステップで求めた前記駆動点のそれぞれの候補における平均時刻と前記第2のステップで求めた前記最小位相インパルス応答に対する群遅延から、下記式(20)を用いて前記駆動点の位置を求め、下記式(21)を用いて駆動源の継続時間を求める第3のステップとを施し、駆動点の情報を抽出することを特徴とする。
【0011】
ここで、
式(10)は、
{t e }={u|〈t(u)〉=u,〔d〈t(u)〉〕/du<1}(ただし、uは時間窓の中心がある時刻を、t(u)はイベントの平均時刻を、t e はイベントの時刻をそれぞれ表している。)
式(13)は、
σ t (t e )=σ w √〔g(t e )/2〕(ただし、σ w は不動点における写像の傾斜と分析に用いた時間窓の標準偏差を、g(t e )は不動点における写像の傾斜を、σ t (t e )は継続時間をそれぞれ表している。)
式(18)は、
【0012】
【数9】
(ただし、τ m (ω,u)は群遅延、qはケフレンシーである。)
式(20)は、
【0013】
【数10】
【0014】
式(21)は、
【0015】
【数11】
【0016】
〔2〕駆動信号分析装置において、自乗回路(1)と、多段遅延回路(2)と、Gauss(ガウス)型加重回路(3)と、第1の総和部分(Σ)(4)と、第2の総和部分(Σ)(6)と、微分Gauss型加重回路(5)と、不動点検出回路(7)と、不動点位置(8)と、傾斜計算回路(9)と、拡がり変換回路(10)とを備えており、
前記自乗回路(1)と前記多段遅延回路(2)と前記Gauss型加重回路(3)と前記微分Gauss型加重回路(5)とにより、前記第2の総和部分(6)により下記式(3)の分子部分を計算し、前記第1の総和部分(4)により前記式(3)の分母部分を計算することにより、前記不動点検出回路(7)において平均時刻を計算し、下記式(10)によって不動点として駆動点の位置を求め、また、前記傾斜計算回路(9)において下記式(11)により定義される平均時間の導関数を上記で求めた駆動点の位置において求め、こうして求めた傾斜の値を前記拡がり変換回路(10)において下記式(14)により駆動点付近での信号の標準偏差(11)に変換し、前記駆動点の特徴量とすることを特徴とする。
【0017】
ここで、
式(3)は、
〈t(u)〉=〔∫t|x(t,u)| 2 dt〕/〔∫|x(t,u)| 2 dt〕(ただし、uは時間窓の中心がある時刻を、t(u)はイベントの平均時刻をそれぞれ表している。)
式(10)は、
{t e }={u|〈t(u)〉=u,〔d〈t(u)〉〕/du<1}(ただし、t e はイベントの時刻を表している。)
式(11)は、
【0018】
【数12】
(ただし、g(te)は不動点における写像の傾斜を表している。)
式(14)は、
σ s (t e )=σ w √{g(t e )/〔1−g(t e )〕}
(ただし、σ s (t e )はイベントのパラメータ、σ w は不動点における写像の傾斜と分析に用いた時間窓の標準偏差を表している。)
〔3〕駆動信号分析装置において、多段遅延回路(21)と、Gauss型加重回路(23)と、微分Gauss型加重回路(25)と、FFT(高速フーリエ変換)回路(2 4,26)と、パワースペクトル計算回路(27)と、群遅延計算回路(28)と、最小位相群遅延計算回路(29)と、補償済み群遅延計算回路(30)と、補償済み平均群遅延計算回路(31)と、不動点計算回路(32)と、群遅延標準偏差計算回路(34)とを備え、
前記多段遅延回路(21)と前記Gauss型加重回路(23)と前記微分Gauss型加重回路(25)と前記FFT(高速フーリエ変換)回路(24,26)により、下記式(23)の分母〔前記Gauss型加重回路(23)と前記FFT回路(24)利用〕と、分子〔前記微分Gauss型加重回路(25)と前記FFT回路(26)利用〕を計算し、前記群遅延計算回路(28)によって前記式(23)を実行して群遅延特性を求め、前記最小位相群遅延計算回路(29)では下記式(18)により前記パワースペクトル計算回路(27)により下記式(17)で求められる振幅スペクトルから複素ケプストラムを介して最小位相応答の位相成分を求め、その周波数成分により最小位相応答成分の群遅延特性を求め、前記補償済み群遅延計算回路(30)では、前記群遅延計算回路(28)で前記式(23)により求められた群遅延特性の実測値から前記最小位相群遅延計算回路(29)で求められた前記最小位相応答成分の群遅延特性を減算することで、受動的な伝達システムの影響を補償して駆動源だけに依存した補償済み群遅延特性を推定し、前記補償済み平均群遅延計算回路(31)では、こうして求めた補償済み群遅延特性を、前記パワースペクトル計算回路(27)により前記式(17)の自乗で求められるパワースペクトルを、加重として用いて下記式(20)によって定義される補償された平均時刻を求め、前記不動点計算回路(32)では、補償された平均時刻が0を上から下に横切る点として不動点位置(33)を求め、また、同時に、補償された群遅延の駆動点付近での標準偏差(35)を前記群遅延標準偏差計算回路(34)で計算し、駆動点の特徴量とすることを特徴とする。
【0019】
ここで、
式(17)は、
【0020】
【数13】
式(18)は、
【0021】
【数14】
式(20)は、
【0022】
【数15】
式(23)は、
【0023】
【数16】
本発明によれば、駆動情報を駆動の位置および様々な周波数領域における時間的拡がりとして表し、それらのパラメータを、適切に設計された一組のフィルタによって信号波形の自乗を処理することにより求めることのできる装置を提供する。
【0024】
さらに、信号波形の周波数スペクトルと群遅延特性の処理を加味することによって、未知の伝達特性による影響を自動的に補償でき、かつ、信号の中の信頼できる情報だけを選択的に利用することができる構成を明らかにしている。
【0025】
【発明の実施の形態】
以下、本発明の実施の形態について詳細に説明する。
【0026】
本発明は、駆動情報を駆動の位置および様々な周波数領域における時間的拡がりとして表し、それらのパラメータを、適切に設計された一組のフィルタによって信号波形の自乗を処理することにより求めることのできる装置を提供する。
【0027】
さらに、信号波形の周波数スペクトルと群遅延特性の処理を加味することによって、未知の伝達特性による影響を自動的に補償でき、かつ、信号の中の信頼できる情報だけを選択的に利用することができる構成を明らかにしている。
【0028】
以下、本発明の構成について順次に詳細に説明する。
(1−1)時間領域での表現
ある時間信号をs(t)としたとき、その平均時刻〈t〉と継続時間σt は以下のように表される(L.Cohen.Time−frequency analysis.Prentice Hall,Englewood Cliffs,NJ,1995参照)。
〈t〉=〔∫t|s(t)|2 dt〕/〔∫|s(t)|2 dt〕 …(1)
σ2 t =〔∫(t−〈t〉)2 |s(t)|2 dt〕/〔∫|s(t)|2 dt〕
…(2)
音声波形は複数のイベントを含むため、上記の量を意味のあるものとするためには、注目するイベントを時間窓等の操作によって予め分離しておくことが必要となる。
【0029】
ある時間窓w(t)によって、ある一つの声門閉止の周囲を切出せば、次式によって、イベントの平均時刻〈t(u)〉と継続時間σt (u)を求めることができる。
〈t(u)〉=〔∫t|x(t,u)|2 dt〕/〔∫|x(t,u)|2 dt
…(3)
σ2 t (u)=〔∫(t−〈t〉)2 |x(t,u)|2 dt〕/〔∫|x(t,u)|2 dt〕 …(4)
x(t,u)=w(t−u)s(t) …(5)
ここでuは、時間窓の中心がある時刻を表し、積分の範囲は(−∞,∞)である。なお、σt (u)は窓が掛けられた信号の見かけの継続時間である。
(1−1−1)窓の中心と平均時刻
ここで、以下の議論を簡単にするために次のようなガウス型の窓関数を用いる。
【0030】
【数17】
また、イベントの振幅包絡も次のようなガウス型を仮定する。
【0031】
【数18】
te はイベントの時刻を表す。
【0032】
すると、平均時刻は次のように表される。
【0033】
【数19】
ここでpw (u)=∫|x(t,u)|2 dtは、切り出された波形のエネルギーを表す。式(8)より|w(t−u)s(t)|は中心に対して対称となるので、平均時刻は指数部の導関数が0となる位置となり、次のように求められる。L(t)=−log|w(t−u)s(t)|2 とする。
【0034】
【数20】
このように、平均時刻は窓の中心の時刻とイベントの時刻の加重平均となる。イベントの継続時間が短ければ短いほどイベントの時刻の重みが増す。また、平均時刻がイベントの時刻と一致するのは、窓の中心がイベント位置に重なった時であることが分かる。したがって、イベントの時刻は、窓の中心の時刻から平均時刻への写像の不動点の中で以下の条件を満たすものから求められる。
{te }={u|〈t(u)〉=u,〔d〈t(u)〉〕/du<1} …(10)
(1−1−2)写像の傾斜と継続時間
ところで、上記式(9)より、上記の条件を満たす不動点における写像の傾斜g(te )は次式のように求められる。
【0035】
【数21】
この状態での波形の包絡は、不動点における写像の傾斜g(te )を用いて次のように表されることに注意する。
【0036】
【数22】
この式(12)を用いて継続時間を求めると、以下が得られる。
【0037】
σt (te )=σw √〔g(te )/2〕 …(13)
すなわち、不動点における写像の傾斜と分析に用いた時間窓の標準偏差σw を用いることにより、窓で切り出された信号の見かけの継続時間を表すことができることが分かる。また、次式によってイベントのパラメータであるσs (te )を求めることができる。
【0038】
σs (te )=σw √{g(te )/〔1−g(te )〕} …(14)
(1−2)周波数領域での表現
ここで、平均時刻と継続時間の周波数領域での表現(L.Cohen.Time−frequency analysis.Prentice Hall,Englewood Cliffs,NJ,1995)を利用し、窓を掛けた信号の平均時刻〈t(u)〉と継続時間σt (u)を群遅延tg (ω,u)=−ψ′(ω,u)を用いて表現する。ここで′はωに関する微分を表す。
〈t(u)〉=−∫ψ′(ω,u)|S(ω,u)|2 dω …(15)
σ2 t (u)=∫〔B′(ω,u)/B(ω,u)〕2 ・B2 (ω,u)dω +∫〔ψ′(ω,u)+〈t(u)〉)2 ・B2 (ω,u)dω …(16)
【0039】
【数23】
上記の式(16)の第一項は、スペクトルの振幅変動による継続時間への寄与分、第二項は、位相変動による寄与分を表す。B(ω,u)は、スペクトルの振幅成分を表す。
(1−2−1)最小位相応答の補償
上記の式(15)は、平均時刻が群遅延の加重平均であることを示している。すなわち、声門閉止に対応する不動点は、声道のインパルス応答の群遅延分だけ実際の声門の閉止時刻から遅れた位置に生ずることが分かる。声道のインパルス応答が因果律を満たしているのであれば、振幅スペクトルから例えば次のように複素ケプストラムC(q,u)を介して最小位相インパルス応答(A.Oppenheim and R.Schafer. Discrete−Time Signal Processing. Prentice Hall,Englewood Cliffs,NJ,1989参照)に対応する群遅延τm (ω,u)を計算することができる。
【0040】
【数24】
【0041】
【数25】
ここでqはケフレンシーである。この最小位相成分を用いて群遅延−ψ′(ω,u)を補償すれば、声道の影響を受ける前の駆動信号の群遅延特性を求めることができる。
【0042】
声道による群遅延を補償した平均時刻〈t*(u)〉(tの上に〜が付く)と位相変動による寄与分σ2 *P (u)(σの上に〜が付く)は次のように求められる。
【0043】
【数26】
【0044】
【数27】
声門閉止による駆動が高域ではインパルスで近似できるのであれば、声道の応答による群遅延を補償した位相変動による寄与分は、ほぼ0となる。なお、振幅成分を補償して平坦なスペクトルとすると第一項は0となる。これは逆フィルタ処理に外ならない。しかし、本発明は逆フィルタ処理を実際に行わずに声道の影響を受ける前の駆動信号の群遅延特性を求めるところに特徴がある。
(2)駆動情報の抽出手順
以上をまとめると、次の手続きによって駆動点の情報を抽出することができる。
【0045】
ステップ1 上記式(10)を用いて不動点として駆動点の候補を抽出する。同時に、上記式(13)により継続時間を求める。
ステップ2 それぞれの駆動点において、上記式(18)を用いて最小位相インパルス応答に対応する群遅延を求める。
【0046】
ステップ3 ステップ1で求めた駆動点のそれぞれの候補における平均時刻とステップ2で求めた最小位相インパルス応答に対応する群遅延から、上記式(20)を用いて駆動点の位置を求め、上記式(21)を用いて駆動源の継続時間を求める。
【0047】
以下では、実際の音声を例として、各ステップの具体的動作について説明する。
(2−1)実音声の分析例
男性の発声した日本語母音の連鎖「アイウエオ」を例にとって、分析の各ステップを説明する。音声の収録には圧力型マイク(Sony EMC−77S)を用い、22050Hz 16bitで標本化した。
【0048】
時間領域での不動点の抽出:図1に、時間窓の中心位置から平均時刻への写像を示す。図中の○印は抽出された不動点を示す。図の最上部に示した音声波形と比較すると、不動点は声門閉止の位置から少し遅れたところにあることが分かる。
【0049】
本発明の方法で用いている写像は、窓内のエネルギーで正規化された無次元の量であり、図中の125ms附近のようにレベルが低い場合も、163ms附近のようにレベルが高い場合も、同様に安定に求めることができる。通常のイベント検出で必要な閾値の設定は、本発明の方法では不要である。
【0050】
波形から求めたイベントの継続時間:図2に、それぞれ不動点について求めた継続時間を音声波形とともに示す。無声部分ではイベントの継続時間はほぼ窓長に一致し、有声部分では短くなっていることが分かる。
【0051】
最小位相成分の補償による駆動情報の抽出:図3に、スペクトルの振幅情報を用いて補正したイベント時刻と、イベントの駆動信号の継続時間を示す。ここでも無声部分のイベントの継続時間は窓長のあたりに存在することが分かる。有声部分については、継続時間が明らかに小さな値を示しており、駆動源が非常に短い時間に集中していることが分かる。
【0052】
修正されたイベント位置と駆動情報:図4に、修正されたイベント位置とイベントの鋭さを示す。イベントの鋭さη(u)を表す指標として以下の式で表されるものを用いた。
【0053】
【数28】
この指標が1となるのは、駆動源がインパルスの場合で最小位相の補償が完全に行われた場合である。また、駆動源が定常的なランダム雑音の場合には、この指標は0.3よりもやや少ない値の周辺に分布する。
【0054】
以下、本発明の具体的な信号分析装置の構成について説明する。
【0055】
図5は本発明の第1実施例を示す信号分析装置の構成図であり、特に、波形に基づく駆動情報の抽出装置の構成を示している。
【0056】
この図において、1は自乗回路、2は多段遅延回路、3はGauss(ガウス)型加重回路、4,6は総和部分(Σ)、5は微分Gauss型加重回路、7は不動点検出回路、8は不動点位置、9は傾斜計算回路、10は拡がり変換回路、11は標準偏差である。
【0057】
この図に示すように、自乗回路1、多段遅延回路2、Gauss型加重回路3、微分Gauss型加重回路5により、上の総和部分6により式(3)の分子部分を計算し、下の総和部分4により式(3)の分母部分を計算することにより、不動点検出回路7において平均時刻を計算し、式(10)によって不動点として駆動点の位置を求める。また、傾斜計算回路9において式(11)により定義される平均時間の導関数を上記で求めた駆動点の位置において求める。こうして求めた傾斜の値を拡がり変換回路10において式(14)により駆動点付近での信号の標準偏差11に変換し、駆動点の特徴量とする。
【0058】
本発明によれば、駆動情報を駆動の位置および様々な周波数領域における拡がりとして表し、それらのパラメータを、適切に設計された一組のフィルタによって信号波形の自乗を処理することにより求めることのできる装置を提供する。
【0059】
図6は本発明の第2実施例を示す信号分析装置の構成図であり、特に、周波数スペクトルの振幅成分と群遅延との関係を利用して精密な駆動時刻と本来の駆動信号の拡がりを表す継続時間を求める装置の構成を示している。
【0060】
本実施例は、信号波形の周波数スペクトルと群遅延特性の処理を加味することによって、未知の伝達特性による影響を自動的に補償でき、かつ、信号の中の信頼できる情報だけを選択的に利用することができる構成を明らかにしている。
【0061】
信号は多段遅延回路21、Gauss型加重回路23、微分Gauss型加重回路25とFFT(高速フーリエ変換)回路24,26により、式(23)の分母(Gauss型加重回路23とFFT回路24利用)と、分子(微分Gauss型加重回路25とFFT回路26利用)を計算し、群遅延計算回路28によって式(23)を実行して群遅延特性を求める。最小位相群遅延計算回路29では式(18)によりパワースペクトル計算回路27により式(17)で求められる振幅スペクトルから複素ケプストラムを介して最小位相応答の位相成分を求め、その周波数成分により最小位相応答成分の群遅延特性を求める。補償済み群遅延計算回路30では、群遅延計算回路28で式(23)により求められた群遅延特性の実測値から最小位相群遅延計算回路29で求められた最小位相応答成分の群遅延特性を減算することで、受動的な伝達システム(この場合は例えば声道の伝達特性等)の影響を補償して駆動源だけに依存した補償済み群遅延特性を推定する。補償済み平均群遅延計算回路31では、こうして求めた補償済み群遅延特性を、パワースペクトル計算回路27により式(17)の自乗で求められるパワースペクトルを、加重として用いて式(20)によって定義される補償された平均時刻を求める。不動点計算回路32では、補償された平均時刻が0を上から下に横切る点として不動点位置33を求める。また、同時に、補償された群遅延の駆動点付近での標準偏差35を群遅延標準偏差計算回路34で計算し、駆動点の特徴量とする。
【0062】
【数29】
なお、本発明は上記実施例に限定されるものではなく、本発明の趣旨に基づいて種々の変形が可能であり、これらを本発明の範囲から排除するものではない。
【0063】
【発明の効果】
以上、詳細に説明したように、本発明によれば、分析と加工の双方に適合した合理的な駆動信号の抽出を行うことができる。
【図面の簡単な説明】
【図1】 本発明に係る時間窓の中心位置から平均時刻への写像を示す図である。
【図2】 本発明に係るそれぞれ不動点について求めた継続時間を音声波形とともに示す図である。
【図3】 本発明に係るスペクトルの振幅情報を用いて補正したイベント時刻と、イベントの駆動信号の継続時間を示す図である。
【図4】 本発明に係る修正されたイベント位置とイベントの鋭さを示す図である。
【図5】 本発明の第1実施例を示す信号分析装置の構成図である。
【図6】 本発明の第2実施例を示す信号分析装置の構成図である。
【符号の説明】
1 自乗回路
2,21 多段遅延回路
3,23 Gauss(ガウス)型加重回路
4,6 総和部分(Σ)
5,25 微分Gauss型加重回路
7 不動点検出回路
8 不動点位置
9 傾斜計算回路
10 拡がり変換回路
11,35 標準偏差
24,26 FFT(高速フーリエ変換)回路
27 パワースペクトル計算回路
28 群遅延計算回路
29 最小位相群遅延計算回路
30 補償済み群遅延計算回路
31 補償済み平均群遅延計算回路
32 不動点計算回路
33 不動点位置
34 群遅延標準偏差計算回路
Claims (3)
- (a)下記式(10)を用いて不動点としての駆動点の候補を抽出し、同時に、下記式(13)により、継続時間を求める第1のステップと、
(b)それぞれの前記駆動点において、下記式(18)を用いて最小位相インパルス応答に対応する群遅延を求める第2のステップと、
(c)前記第1のステップで求めた前記駆動点のそれぞれの候補における平均時刻と前記第2のステップで求めた前記最小位相インパルス応答に対する群遅延から、下記式(20)を用いて前記駆動点の位置を求め、下記式(21)を用いて駆動源の継続時間を求める第3のステップとを施し、駆動点の情報を抽出することを特徴とする駆動信号分析方法。
ここで、
式(10)は、
{t e }={u|〈t(u)〉=u,〔d〈t(u)〉〕/du<1}(ただし、uは時間窓の中心がある時刻を、t(u)はイベントの平均時刻を、t e はイベントの時刻をそれぞれ表している。)
式(13)は、
σ t (t e )=σ w √〔g(t e )/2〕(ただし、σ w は不動点における写像の傾斜と分析に用いた時間窓の標準偏差を、g(t e )は不動点における写像の傾斜を、σ t (t e )は継続時間をそれぞれ表している。)
式(18)は、
式(20)は、
- 自乗回路(1)と、多段遅延回路(2)と、Gauss(ガウス)型加重回路(3)と、第1の総和部分(Σ)(4)と、第2の総和部分(Σ)(6)と、微分Gauss型加重回路(5)と、不動点検出回路(7)と、不動点位置(8)と、傾斜計算回路(9)と、拡がり変換回路(10)とを備えており、
前記自乗回路(1)と前記多段遅延回路(2)と前記Gauss型加重回路(3)と前記微分Gauss型加重回路(5)とにより、前記第2の総和部分(6)により下記式(3)の分子部分を計算し、前記第1の総和部分(4)により前記式(3)の分母部分を計算することにより、前記不動点検出回路(7)において平均時刻を計算し、下記式(10)によって不動点として駆動点の位置を求め、また、前記傾斜計算回路(9)において下記式(11)により定義される平均時間の導関数を上記で求めた駆動点の位置において求め、こうして求めた傾斜の値を前記拡がり変換回路(10)において下記式(14)により駆動点付近での信号の標準偏差(11)に変換し、前記駆動点の特徴量とすることを特徴とする駆動信号分析装置。
ここで、
式(3)は、
〈t(u)〉=〔∫t|x(t,u)| 2 dt〕/〔∫|x(t,u)| 2 dt〕(ただし、uは時間窓の中心がある時刻を、t(u)はイベントの平均時刻をそれぞれ表している。)
式(10)は、
{t e }={u|〈t(u)〉=u,〔d〈t(u)〉〕/du<1}(ただし、t e はイベントの時刻を表している。)
式(11)は、
式(14)は、
σ s (t e )=σ w √{g(t e )/〔1−g(t e )〕}
(ただし、σ s (t e )はイベントのパラメータ、σ w は不動点における写像の傾斜と分析に用いた時間窓の標準偏差を表している。) - 多段遅延回路(21)と、Gauss型加重回路(23)と、微分Gauss型加重回路(25)と、FFT(高速フーリエ変換)回路(24,26)と、パワースペクトル計算回路(27)と、群遅延計算回路(28)と、最小位相群遅延計算回路(29)と、補償済み群遅延計算回路(30)と、補償済み平均群遅延計算回路(31)と、不動点計算回路(32)と、群遅延標準偏差計算回路(34)とを備え、
前記多段遅延回路(21)と前記Gauss型加重回路(23)と前記微分Gauss型加重回路(25)と前記FFT(高速フーリエ変換)回路(24,26)により、下記式(23)の分母〔前記Gauss型加重回路(23)と前記FFT回路(24)利用〕と、分子〔前記微分Gauss型加重回路(25)と前記FFT回路(26)利用〕を計算し、前記群遅延計算回路(28)によって前記式(23)を実行して群遅延特性を求め、前記最小位相群遅延計算回路(29)では下記式(18)により前記パワースペクトル計算回路(27)により下記式(17)で求められる振幅スペクトルから複素ケプストラムを介して最小位相応答の位相成分を求め、その周波数成分により最小位相応答成分の群遅延特性を求め、前記補償済み群遅延計算回路(30)では、前記群遅延計算回路(28)で前記式(23)により求められた群遅延特性の実測値から前記最小位相群遅延計算回路(29)で求められた前記最小位相応答成分の群遅延特性を減算することで、受動的な伝達システムの影響を補償して駆動源だけに依存した補償済み群遅延特性を推定し、前記 補償済み平均群遅延計算回路(31)では、こうして求めた補償済み群遅延特性を、前記パワースペクトル計算回路(27)により前記式(17)の自乗で求められるパワースペクトルを、加重として用いて下記式(20)によって定義される補償された平均時刻を求め、前記不動点計算回路(32)では、補償された平均時刻が0を上から下に横切る点として不動点位置(33)を求め、また、同時に、補償された群遅延の駆動点付近での標準偏差(35)を前記群遅延標準偏差計算回路(34)で計算し、駆動点の特徴量とすることを特徴とする駆動信号分析装置。
ここで、
式(17)は、
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000059861A JP4166405B2 (ja) | 2000-03-06 | 2000-03-06 | 駆動信号分析装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000059861A JP4166405B2 (ja) | 2000-03-06 | 2000-03-06 | 駆動信号分析装置 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2001249674A JP2001249674A (ja) | 2001-09-14 |
JP2001249674A5 JP2001249674A5 (ja) | 2005-08-18 |
JP4166405B2 true JP4166405B2 (ja) | 2008-10-15 |
Family
ID=18580259
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000059861A Expired - Fee Related JP4166405B2 (ja) | 2000-03-06 | 2000-03-06 | 駆動信号分析装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4166405B2 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6092345B2 (ja) * | 2012-01-10 | 2017-03-08 | 株式会社東芝 | 音声特徴量抽出装置、音声特徴量抽出方法及び音声特徴量抽出プログラム |
JP2013164572A (ja) * | 2012-01-10 | 2013-08-22 | Toshiba Corp | 音声特徴量抽出装置、音声特徴量抽出方法及び音声特徴量抽出プログラム |
US9368103B2 (en) * | 2012-08-01 | 2016-06-14 | National Institute Of Advanced Industrial Science And Technology | Estimation system of spectral envelopes and group delays for sound analysis and synthesis, and audio signal synthesis system |
JP6344026B2 (ja) * | 2014-04-14 | 2018-06-20 | コニカミノルタ株式会社 | 超音波探触子及び超音波画像診断装置 |
CN114464208A (zh) | 2015-09-16 | 2022-05-10 | 株式会社东芝 | 语音处理装置、语音处理方法以及存储介质 |
-
2000
- 2000-03-06 JP JP2000059861A patent/JP4166405B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2001249674A (ja) | 2001-09-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8972255B2 (en) | Method and device for classifying background noise contained in an audio signal | |
CN103854646B (zh) | 一种实现数字音频自动分类的方法 | |
Yegnanarayana et al. | Extraction of vocal-tract system characteristics from speech signals | |
JP4177755B2 (ja) | 発話特徴抽出システム | |
US10614827B1 (en) | System and method for speech enhancement using dynamic noise profile estimation | |
CN111128213B (zh) | 一种分频段进行处理的噪声抑制方法及其系统 | |
Bayya et al. | Spectro-temporal analysis of speech signals using zero-time windowing and group delay function | |
JP4740609B2 (ja) | 有声音および無声音の検出装置、並びにその方法 | |
JPS5850360B2 (ja) | 音声認識装置における前処理方法 | |
EP1850328A1 (en) | Enhancement and extraction of formants of voice signals | |
JP2006079085A (ja) | 音声品質向上方法及び装置 | |
CN109473091A (zh) | 一种语音样本生成方法及装置 | |
JPH10133693A (ja) | 音声認識装置 | |
JP4166405B2 (ja) | 駆動信号分析装置 | |
CN112151066A (zh) | 基于声音特征识别的语言冲突监测方法、介质及设备 | |
CN111261192A (zh) | 一种基于lstm网络的音频检测方法、电子设备及存储介质 | |
Yegnanarayana et al. | Analysis of instantaneous f 0 contours from two speakers mixed signal using zero frequency filtering | |
Prakash et al. | Fourier-Bessel cepstral coefficients for robust speech recognition | |
JP2002507776A (ja) | 音声信号の過渡現象を解析するための信号処理方法 | |
JP2006215228A (ja) | 音声信号分析方法およびこの分析方法を実施する装置、この音声信号分析装置を用いた音声認識装置、この分析方法を実行するプログラムおよびその記憶媒体 | |
JP5752488B2 (ja) | 音声認識装置、音声認識方法、及び音声認識プログラム | |
Kumar et al. | Speech quality evaluation for different pitch detection algorithms in LPC speech analysis–synthesis system | |
Rahali et al. | Robust Features for Speech Recognition using Temporal Filtering Technique in the Presence of Impulsive Noise | |
JP4537821B2 (ja) | オーディオ信号分析方法、その方法を用いたオーディオ信号認識方法、オーディオ信号区間検出方法、それらの装置、プログラムおよびその記録媒体 | |
JP4313740B2 (ja) | 残響除去方法、プログラムおよび記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20031031 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20040129 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050128 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050128 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20070112 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070206 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070326 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080729 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080730 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110808 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |