JPH01251000A - 音声信号分析方法 - Google Patents

音声信号分析方法

Info

Publication number
JPH01251000A
JPH01251000A JP63047418A JP4741888A JPH01251000A JP H01251000 A JPH01251000 A JP H01251000A JP 63047418 A JP63047418 A JP 63047418A JP 4741888 A JP4741888 A JP 4741888A JP H01251000 A JPH01251000 A JP H01251000A
Authority
JP
Japan
Prior art keywords
pole
zero
residual signal
power spectrum
spectrum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP63047418A
Other languages
English (en)
Other versions
JP2898637B2 (ja
Inventor
Masami Akamine
政巳 赤嶺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP63047418A priority Critical patent/JP2898637B2/ja
Publication of JPH01251000A publication Critical patent/JPH01251000A/ja
Application granted granted Critical
Publication of JP2898637B2 publication Critical patent/JP2898637B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の目的〕 (産業上の利用分野) この発明は、音声信号を高能率に圧縮する符号化方式の
極零モデル分析方式に関する。
(従来の技術) 音声信号を線形予測に基づいて分析する方法が、音声の
符号化や分析・合成システム、認識などで広く用いられ
ている。この分析法は、音声の短時間スペクトルの包絡
を全極形のモデル(ARモデルとも言う。)で近似する
ものであり、スペクトルの極をよく近似する。しかし、
零点はうまく近似できない特質をもつ。実際の音声には
子音や鼻音のようにスペクトルに零点が存在するため、
音声信号を精度よく分析する場合には全極形のモデルで
は不十分であると考えられていた。
そこで、音声の短時間スペクトル包絡を極零形のモデル
(ARMAモテルとも言う。)で近似する方法がいくつ
か提案されている。たとえば「音声分析における極零モ
デルの次数の固定」(信学論(A)。
Vol、 J60−A、 Na4. PP423−42
4(1977−4))がある。
この方法は、短時間スペクトルを次に示す極零形の伝達
関数で近似するものである。
(ここで、a□とp:各々、極モデルのパラメータと次
数、b工とq:零モデルのパラメータと次数)この極零
形のモデルは現実の音声生成過程をよく表していると言
える。上記した文献の内容を、第9図に示すように構成
したとすると、入力された音声信号は、ます全極形モデ
ル(式(1)においてtg=o、i=1.2.  ・・
+q)による分析が行われる。具体的には、自己相関法
処理部101により、全極形モデルのパラメータa工(
i=1.2.  ・・。
p)が求められる。次に、音声信号は、全極形逆フィル
タ102に通され、スペクトルの極が除去された残差信
号となる。
次にパワースペクトル部10で残差信号のパワースペク
トルを求め逆数処理部104て逆数をとる。
このことにより、残差信号のスペクトルに残っていた零
点は極に置き換えられる。このため、逆フーリエ変換部
105により逆パワースペクトルの逆フーリエ変換が施
され1()られる自己相関係数に全極形モデルの分析法
を適用することかでき、零モデルのパラメータb、(に
1. +  21 ”’+  Q) を得ることができ
る。
しかしなからこの方法を実際の音声に適用する場合、大
きな問題点がある。これは、ピッチによるスペクl−ル
の微細構造により、零モデルパラメータの推定に大きな
誤りが生しることである。詳しく説明すると第101.
/Iの周波数8kHzのμ−PCMコーデックで入力し
た男性の音声信号のスペクトル、第11図の極子明後の
残差信号のスペクトルの一例を示す回から分かるように
、音声信号及び残差信号のスペクトルに音源のピッチに
」kづく微細構造が表われている。この微細構造の深い
谷が零点のように作用したり、真の零点を強調したりす
=3− る。例えば、第11図の残差信号のスペク1−ルのA点
に示すものがそれである。このような零点を偽りの零点
、又は強調された零点と呼ぶことにする。
このため、上述した従来の方法で分析すると、得られる
極零モデルの周波数特性は第12図に示すように音声信
号のスペクトル包絡とかけ離れたものとなる。
このように、従来の極零形モデルの分析法では、ピッチ
によるスペクトルの微細構造のため、零点の推定に誤り
を生じる問題点があり、全極形モデルと比べてもスペク
トル近似が悪くなる場合がある。この問題を解決する方
法として、残差信号のパワースペク1〜ルを2点平均に
より平滑化する方法が容易に考えられるが、ピッチ周期
は個人、特に男女の違いによって大きく異なり、また同
一人物の音声でも音韻によって変動する。このため、パ
ワースペクトルを単に平均化する方法では、パワースペ
クトルの平滑化が常に良好に行われると限らない。
(発明が解決しようとする課題) 」―述したように、従来の極零形モデルによる音声分析
法では、ピッチの影響により零点の抽出が精度良く行え
ず、得られるモデルのスペクトル近似が悪くなるという
問題がある。
本発明は、このような問題に鑑みてなされたものであり
、その目的は、ピッチに影響されず、又発声者や音韻に
依存せずに常に零点の抽出を精度良く行える極零形モデ
ルのパラメータ抽出法を、つまり極零モデル分析方式を
提供することにある。
〔発明の構成〕 (課題を解決するための手段) 本発明は、全極モデルの残差信号のパワースペク1〜ル
又は、そのパワースペク1〜ルの逆数を平滑化し、平滑
化されたパワースペクトルの逆数から逆フーリエ変換に
より自己相関係数を求め、求めた自己相関係数に全極モ
デルの分析法を適用することにより零点のパラメータを
抽出するものである。ただし、平滑化の度合いはピッチ
周期の値に応じて適応的に変化される。また、平滑化の
ためにフィルタを用いる場合は、用いら汎るフィルタは
零位相となる。
(作用) ます、入力信号を全極モデルにより分析し、全極モデル
のパラメータを抽出する。次に入力信号を全極形の逆フ
ィルタに通し、残差信号を得る。
残差信号のスペクトルは、極が除去されたものとなり、
次に、パワースペクトルの逆数が取られ、スペク1ヘル
の零点が極に変換される。このとき、スペクトルを平滑
化することにより、ピンチに基づく微細構造が平滑化さ
れる。ピッチによるスペクトルの微細構造の間隔は、ピ
ッチ周期の逆数に比例し、個人によって、又同一人物で
も音韻によって変化する。しかして本方式によれば、ス
ペク1〜ル平滑化の度合を、ピッチ周期に応じて適応的
に変えているので、発声者や音韻に依らず常に、スペク
1〜ルの平滑化を良好に行うことができ、微細構造によ
る偽の零点や強調され過ぎた零点を除去することができ
る。また、本方式では、平滑化に用いられるフィルタを
零位相とすることにより、フィルタの位相特性のためス
ペク1−ルの零点かずれる問題を防止している。この結
果、音声のスペク1ヘルを良好に近似する極零モデルを
得ることができる。
(実施例) 以下本発明に係る一実施例を図面を参照して詳述する。
第1図は、本発明の一実施例に係る極零予測分析方法の
ブロック図を示す。図において、音声信号は端子1に入
力され、極パラメータ推定部2に入力される。極パラメ
ータの推定方法としては、いくつか知られているが、例
えば文献「ディジタル音声処理」 (東海大学出版会)
に示される自己相関法を用いることができる。入力信号
は、次にこの極パラメータ推定部2で得られた極パラメ
ータをもつ全極形逆フィルタ3に入力される。ここでは
、次式に従って予測残差信号d(n)を計算し、出力す
る。
d (n) =S(n)−Σa1s(n−i ) −(
2)i=1 ここで、5(n)は入力信号系列、S、は全極モデルの
パラメータ、pは予測次数である。
次に、高速フーリエ変換(FFT)部4と2乗回路部5
により残差信号d(n)のパワースペクトルを求めると
共に、ピッチ分析処理部6により、ピッチ周期の抽出と
有声/無声の判定を行う。なお、FFT部4の代りに離
散フーリエ変換(DFT)を用いることもできる。また
、ピッチ分析の方法としては、例えば上記した文献「デ
ィジタル音声処理」に記載されている変形4・目間法を
用いることができる。
FFT部4と2乗回路部5によって求められた残差信号
のパワースペクトルは、スムージング回路部7に入力さ
れる。スムージング回路部7は、ピッチ分析処理部6に
より得られたピッチ周期と有声/無声の状態をパラメー
タとしてパワースペクトルを平滑化する。
第2図は、本発明の一実施例に係るスムージング回路部
の具体例を示すブロック図である。この回路の時定数、
すなわちインパルス応答が1/eになるサンプル数]゛
は T=−1/Q、n(α)       ・・  (3)
と表される。この時定数Tをピッチ周期の値に応じて適
応的に変化させる。ピッチ周期をTp〔サンプル〕、サ
ンプリング周波数を1S〔1□、、FFT又はDFTの
次数をNとすれば残差信号のパワースペクトルに現れる
ピッチによる微細構造の周期m〔サンプル〕は次式で記
述することができる。
従って、時定数Tをmに応して適応的に変化させるには
、 α−1/exp(〜b−)O −L と定めればよい。ただし、Lはスムージングを行う微細
構造の数を表すパラメータである。また、無音声の場合
、TPは得られないので、ピッチ分析処理部6が無声と
判定した場合には、Tpを予め適当に定めた値に設定す
る。さらに、第2図に示したフィルタによりパワースペ
クトルを平滑化する際、フィルタは零位相とする。零位
相とするには、例えば、パワースペクトルを前向きと後
向きに各々、フィルタリングし、各々得られる出力を平
均すればよい。残差信号のパワースペクトルをD(nc
。)、前向きにフィルタリングした場合のフィルタ出力
をD(nc。)f、 後向きにフィルタリングし場合の
フィルタ出力をD(nc、1)b とおくと、平滑化は
次のように記述される。
一 15(nc、、)−−(D(nco)f+5(nc。)
b)   −(8)n=o、1,2.−、N−1 一2π ω0−←          ・  (9)但し、D(
nc。)は平滑化されたパワースペクトルであり、Nは
FFT又はDFTの次数である。
第3図に平滑化された残差信号のスペクトルの例を示す
。但し、スペクトルは265点FFTにより求めた。
以十のスムージング回路により平滑化されたスペクトル
は、逆数回路部8によって、逆スペク1〜ルに変換され
る。この結果、残差信号スペク1〜ルの零点は極へ変換
される。逆スペク1〜ルは逆FFT処理部9により逆F
FTが施され、自己相関系列へと変換され、零予測パラ
メータ推定部10へ入力される。零予測パラメータ推定
部10は、入力した自己相関系列から、自己相関法を用
いて零予測パラメータを求める。全零形逆フィルタ11
は、全極形逆フィルタの残差信号を入力とし、零予測パ
ラメータ推定部10により求められた零予測パラメータ
を用いて予41すを行い予測残差信号e(n)を出力す
る。e(n)は次式に従い割算される。
ここで、b3は零予測パラメータ、Qは零予測の次数で
ある。
以」二の処理により、音声信号の極零予測分析が行われ
る。第4図に得られた極零モデルの周波数特性を示す。
第1図に示すスフ1−ジング回路部として、パワ一スペ
クトルのピークを検出し、検出したピーク間を2次曲線
で補間する方法によっても行うことができる。具体的に
は、3点のピークを通る2次方程式の係数を求め、2点
のピーク間をその2次曲線で補間する。この場合、ピッ
チ分析が要らなくなるので演算量が少なくなるという効
果がある。
第1図に示すスムージング回路部は、逆数回路の次に挿
入することもでき、この場合の実施例を第5図に示す。
また、周波数領域で行っている第1図、第5図のスムー
ジングは時間領域で行うこともできる。残差信号d(n
)のパワースペクトルの逆数をD’(nc。)、(n=
o、1.−N−1)第2図のディジタルフィルタのイン
パルス応答と伝達関数を各々h(n)、 H(nc。)
とおくと、スムージングは次式で表されるように周波数
領域でのフィルタリングによって行われる。
D(nc。)= ΣD’(nc、+。)h(n−i) 
 −−(11)i二〇 ω。=2π/N         ・・・・・(12)
ここで5(nc。)はスムージングされたパワースぺり
1−ルである。15(nc。)とD’ (nc。)の逆
フーリエ変換を各々y (n) 、γ′(n)とすれば
、フーリエ変換の性質から、式(11)は時間領域で次
式のように記述される。
Y (n)−γ’(n) ・H(nc。)     −
(13)すなわち、窓H(nc。)をかけるのと等しい
。このとき、H(nc。)をラグウィンドと呼73:。
H(nc(1)はピッチ周期に応じて適応的に変化する
第6図に、スフ1−ジングを時間領域で行う場合の一実
施例を示す。
また、第1図、第5図、第6図の実施例では、周波数領
域で零点の極への変換を行っているが、これを時間領域
で行うこともできる。極予測の残差信号d (n)の自
己相関系列をγ(n)、そのフーリエ変換であるパワー
スペクトルをD(nc。)とおくと、D(nc。)とそ
の逆数D’ (nc。)の間には次の関係がある。
D(nc。) ・D’(nc。)= 」−(14)フー
リエ変換の性質から、上式は時間領域で次のように表さ
れる。
y (n) −薗y (i) ・y ’ (n−i)−
δ(n−n。)、 no=O・−(15)j−0 自己相関係数はγ((1)についての対称であるのでこ
の式(15)は1行列の形で次のように書くことができ
る。
この方程式は、Levinsonアルゴリズムにより再
帰的に解くことができる。この方法は、例えば「ディジ
タル信号処理の理論1基礎・制御」 (コロナ社)に記
載されているものである。
時間領域で零点の変換とスムージングを行う場合の一実
施例を第7図と第8図に示す。これらの図において逆た
たみ込み回路部57,6.7は式(17)を計算するこ
とにより、式(15)をγ′(n)について解くもので
ある。
尚、第8図において、逆たたみ込み回路部67にかえて
ラフウィンドー66の出力を、FFTあるいはDFT処
理し、絶対値の2乗逆数(妻)を施しl・1 逆FFTあるいは逆DFT処理する方法もある。
この場合、演算景が逆たたみ込みによるものよりさらに
少なくなるという効果がある。
次に実音声に対する実験結果を以下に示す。
成人男女各1名の発声した1両」に対する分析結果を第
13図と第14図に示す。音声の入力は、サンプリング
周波数8 kHzのμmPCMコーデックで行い、前処
理は行っていない。分析の条件は、フレーム30m5 
(240サンプル)、分析長32m5(256サンプル
)、時間窓256サンプルのハミング窓、極の次数8、
零の次数8である。第13図(a)と第14図(a)は
、16次の全極モデルのスペクトルとスペクトル平滑化
を行わない場合の極零モデルのスペクトルとピッチ周期
適応の平滑化を行った場合の極零モデルのスペクトルを
比較したものである。これらの図から分かるように、平
滑化を行わない場合には、極零モデルのスペクトルに偽
の零点や強調された零点が現れ、スペクトルの近似が悪
くなっている。しかし、平滑化を行った場合には、スペ
クトルの零点もよく近似している。第13図(b)と第
14図(b)は、スペクトル平滑化の方法を比較したも
のである。男性音声に対しては、平滑化法の違いによる
スペクトル近似の良悪に大きな差はない。これは、実験
に用いた男の声のピッチによるスペクトル微細構造の間
隔が3点平均により平滑化できる程度だったことによる
ものと考えられる。女性音声に対しては、平均法のスペ
クトル近似が悪くなっている。これは、女性音声の場合
、微細構造の間隔が広くなって、平均法ではうまく平滑
化ができなかったことによる。これに対し、ピーク間線
形補間法は平滑化の範囲が微細構造の間隔に応じて変化
するので、平均法よりスペクトル近似が良い。表1に平
滑化法を変えた場合のセフメンタル予測ゲインGs+4
とセグメンタルSFMsegの逆数を示す。Gsegと
1 /SFMsegは各フレームにおける予測ゲインと
1 /SFMをdB領領域平均したものである。表1や
第13図、第14図から分かるように、スペクトル平滑
化法としてピッチ適応法を用いた極零モデルは、発声者
の性別に依らず常に入カスベクトルを良好に推定できる
表1 平滑化法をパラメータとした Gseg、、 (1/ S F M) seg。
以上示したように従来の方法には、有声音駆動音源の周
期性に基づくスペク1−ルの微細構造のため、全極モデ
ルの残差信号のスペクトルに偽の零点や強調された零点
が生じ、そのため零パラメータの推定を誤る問題があっ
た。この問題を解決する方法として残差信号のパワース
ペクトルを平滑化する方法を検討し、ピッチ周期に応じ
て時定数を適応的に変化させるフィルタにより残差信号
のパワースペクトルを周波数領域で平滑化し、その後、
逆スペクトル化し零パラメータを抽出する方法を提案し
た。この方法により、スペクトルの微細構造に影響され
ず、常にパラメータが誤りなく抽出できるようになった
。また、周波数領域で行っていたスペク1−ル平滑化と
逆スペクトル化の処理を時間領域で行う方法を明らかに
した。
提案した分析法を実音声に適用し、スペク1−ル □の
零点が良好に近似できていることを示した。
次に、上記実施例で示したものとは別の試みによるスペ
クトルと微細構造を除去する原理及び実施例を第15図
乃至第20図を用いて示す。
一般に知られているように有声音発生のメヵニズ11を
モデル化すると、第15図に示すように構成される。っ
まり声門信号としてのピッチパルスe(t)(ピッチr
p)が声道としてのフィルタH(ω)第18図(a)に
通されると音声信号s (t)が出力される。この場合
ピッチパルスe (t)の1周10j分の信号e++(
t)で駆動された音声信号はS。(1)である。
ピッチパルスの1周期分の信号を上記の如く[Eo(t
)とし、そのフーリエ変換を第17M(a)に示すよう
にEl、(ω)とおくと、e(t)のフーリエ変換E(
ω)は第17図(b)に示すようにE。(ω)を周波数
方向に2π/TPことに離散化したものとなる。このた
め、音声信号5(t)のスペクI−ルS(ω)も第18
図(C)に示されるように周波数方向に離散化(サンプ
リング)されたものとなり、これが一般に言われている
スペク1−ルの微細構造である。
1ピッチ周期分の信号e。(1)で駆動された場合の音
声信号を上記したようにS。(t)、 5o(t)を第
16図に示すように全横形逆フィルタ (1+A(ω)
)を有する全極モデルで分析した場合の残差信号をdo
(t)とおくと、dO(t)のスペクトルD。(ω)は
第19図に示すように、S(ω)から極が除かれ、零が
残ったものとなる。一方、実際の残差信号a(t) (
第16図)は、周期的なピッチパルスe (t)て駆動
されて出力された音声信号5(t)を分析した場合の残
差信号であるので、そのスペク1〜ルは第19図(b)
に示すようにり。(ω)を周波数方向にサンプリングし
たものとなる。
ここで、D、(ω)とD(ω)のフーリエ変換を第20
図(a)(b)に示すようにFD、、 (t) 、FD
(t)とおくと、FD(1)はFD、 (t)を周期T
Pの周期信号にしたものとなる。従って、D(ω)にカ
ッ1−オフ周波数Tp/2の理想ローパスフィルタをか
ければり。(ω)が復元でき、D(ω)からピッチによ
る微細構造を取り除くことができる。よって」−記した
第1図のスフ1−ジング処理部τとしてカッ1〜オフ周
波数Tp/2のローパスフィルタを用いればよい。
又、パワースペクトルの場合も同様であり、残差信号d
 (t)のパワースペクトル団(ω)12にカットオフ
周波数Tp/2のローパスフィルタをがければ10(ω
)12から微細構造を除去できる。ID(ω)I2にT
P/2の理想ローパスフィルタをかけることは。
時間領域では、残差信号の自己相関係数にTp/2の方
形窓をかけることと等価である。よって上記した第8図
のラフウィンド66としてTp/2の方形窓を用いれば
よい。
残差信号のパワースペクトルから、上記の方法により微
細構造を除去した後、パワースペクトル逆数変換、逆フ
ーリエ変換により得られる自己相関係数に自己相関法を
適用することにより零パラメータを得る。このことによ
って、ピッチに影響されず、常に零パラメータを精度良
く求めることができる。
なお、自己相関係数にTP/2の方形窓をかけた場合の
逆たたみ込みの処理は、次の行列方程式をLevins
onのアルゴリズムにより解くことになる。
(ただしM−Tp/2) 〔発明の効果〕 本発明によれば、ピッチによるスペク1−ルの微細構造
によって生じる零点の推定誤りを防止し、音声信号のス
ペクトルを良好に近似する極零モデルを得ることができ
る。
【図面の簡単な説明】
第1図はこの発明の一実施例に係る極零モデル分析方法
のブロック図、第2図は第1図の主要部であるスムージ
ング回路の一具体例を示すブロック図、第3図は平滑化
された残差信号のスペク1−ルの一例を示す図、第4図
は本発明の一実施例により得られた極零モデルの周波数
特性の一例を示す図、第5図〜第8図は本発明の他の実
施例に係る極零モデル分析方法のブロック図、第9図は
従来の極零モデル分析方法のブロック図、第10図は音
声信号のスペク1〜ルの一例を示す図、第11図は全極
形逆フイルタ出力である残差信号のスペク1〜ルの一例
を示す図、第12図は従来の方法で得られた極零モデル
の周波数特性の一例を示す図、第13図、第14図は実
音声に対する分析結果を示す図、第15図は有声発生の
モデルを示す図、第16図は極零分析モデルを示す図、
第17図は声門46号(ピッチパルス)のフーリエ変換
を示す図、第18図は1](ω)、So(ω)、S(ω
)の特性を示す図、第19図は1’to(ω)、D(ω
)のスペク1−ルを示す図、第20図はり、、(ω)、
D(ω)のフーリエ変換を示す図である。 1、.20,20,41,52,6]、100・入力端
子、2.31,42,53,62  極パラメータ推定
回路、3.32,43,54,63,102・全極形逆
フィルタ、4.33.44・FFT回路、 5.3’4
.45・・2乗回路、6.35,46,56.65  
ピッチ分析回路、7.37  スムージング回路、 8.36,47.10’l  逆数回路、9.38.4
8・逆FFT回路、 10.39,50,59.68  零パラメータ推定回
路、1.1..40,51,60,69,1.07・全
極形逆フィルタ、21.23  乗算器、    22
・加算器、24・−単位遅延回路、49,58.66・
ラグウィンド、55.64  自己相関係数計算器、 57 、67  逆たたみ込み回路、 −2:3− 1.01,106・自己相関法実行回路、103  パ
ワースペクトル計算器。 代理人 弁理士 則 近 憲 佑 同  松山光之

Claims (3)

    【特許請求の範囲】
  1. (1)入力信号に全極モデルによる分析を行うことによ
    り極のパラメータを得、前記入力信号の前記パラメータ
    をもつ全極形のフィルタを介することにより得られる残
    差信号のパワースペクトルを得、このパワースペクトル
    の逆数を逆フーリエ変換を施すことにより得られる自己
    相関係数に全極モデルによる分析を適用することによっ
    て零点のパラメータを求める極零モデル分析方式であっ
    て、前記残差信号のパワースペクトル又は、この逆数を
    周波数領域又は時間領域で平滑化することを特徴とする
    極零モデル分析方式。
  2. (2)残差信号のパワースペクトル又は、その逆数の平
    滑化は、入力信号又は、残差信号のピッチ周期の値によ
    って変化させることを特徴とする請求項1記載の極零モ
    デル分析方式。
  3. (3)平滑化に用いられるフィルタは、零位相であるこ
    とを特徴とする請求項1記載 の極零モデル分析方式。
JP63047418A 1987-12-10 1988-03-02 音声信号分析方法 Expired - Lifetime JP2898637B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63047418A JP2898637B2 (ja) 1987-12-10 1988-03-02 音声信号分析方法

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP31099287 1987-12-10
JP62-310992 1987-12-10
JP63047418A JP2898637B2 (ja) 1987-12-10 1988-03-02 音声信号分析方法

Publications (2)

Publication Number Publication Date
JPH01251000A true JPH01251000A (ja) 1989-10-05
JP2898637B2 JP2898637B2 (ja) 1999-06-02

Family

ID=26387575

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63047418A Expired - Lifetime JP2898637B2 (ja) 1987-12-10 1988-03-02 音声信号分析方法

Country Status (1)

Country Link
JP (1) JP2898637B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1999030315A1 (fr) * 1997-12-08 1999-06-17 Mitsubishi Denki Kabushiki Kaisha Procede et dispositif de traitement du signal sonore

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1999030315A1 (fr) * 1997-12-08 1999-06-17 Mitsubishi Denki Kabushiki Kaisha Procede et dispositif de traitement du signal sonore
US6526378B1 (en) 1997-12-08 2003-02-25 Mitsubishi Denki Kabushiki Kaisha Method and apparatus for processing sound signal

Also Published As

Publication number Publication date
JP2898637B2 (ja) 1999-06-02

Similar Documents

Publication Publication Date Title
US5590242A (en) Signal bias removal for robust telephone speech recognition
US6173258B1 (en) Method for reducing noise distortions in a speech recognition system
EP2151822A1 (en) Apparatus and method for processing and audio signal for speech enhancement using a feature extraction
JP4886715B2 (ja) 定常率算出装置、雑音レベル推定装置、雑音抑圧装置、それらの方法、プログラム及び記録媒体
JPH0612089A (ja) 音声認識方法
Gamit et al. Isolated words recognition using mfcc lpc and neural network
Alku et al. The linear predictive modeling of speech from higher-lag autocorrelation coefficients applied to noise-robust speaker recognition
CN115223583A (zh) 一种语音增强方法、装置、设备及介质
Katsir et al. Evaluation of a speech bandwidth extension algorithm based on vocal tract shape estimation
CN107919136B (zh) 一种基于高斯混合模型的数字语音采样频率估计方法
JP3270866B2 (ja) 雑音除去方法および雑音除去装置
JP2011150232A (ja) Lpc分析装置、lpc分析方法、音声分析合成装置、音声分析合成方法及びプログラム
JPH01251000A (ja) 音声信号分析方法
Shi et al. Least 1-norm pole-zero modeling with sparse deconvolution for speech analysis
Andrews et al. Robust pitch determination via SVD based cepstral methods
Ramabadran et al. The ETSI extended distributed speech recognition (DSR) standards: server-side speech reconstruction
JP2006215228A (ja) 音声信号分析方法およびこの分析方法を実施する装置、この音声信号分析装置を用いた音声認識装置、この分析方法を実行するプログラムおよびその記憶媒体
Zeremdini et al. Multi-pitch estimation based on multi-scale product analysis, improved comb filter and dynamic programming
Vijayan et al. Allpass modeling of phase spectrum of speech signals for formant tracking
Liu et al. LPCSE: Neural Speech Enhancement through Linear Predictive Coding
CN110634473A (zh) 一种基于mfcc的语音数字识别方法
Sreehari et al. Automatic short utterance speaker recognition using stationary wavelet coefficients of pitch synchronised LP residual
Techini et al. Robust front-end based on MVA and HEQ post-processing for Arabic speech recognition using hidden Markov model toolkit (HTK)
JPH01255000A (ja) 音声認識システムに使用されるテンプレートに雑音を選択的に付加するための装置及び方法
McCallum et al. Joint stochastic-deterministic wiener filtering with recursive Bayesian estimation of deterministic speech.

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term