JPS59131997A - 音声の有声・無声判定方法 - Google Patents
音声の有声・無声判定方法Info
- Publication number
- JPS59131997A JPS59131997A JP778383A JP778383A JPS59131997A JP S59131997 A JPS59131997 A JP S59131997A JP 778383 A JP778383 A JP 778383A JP 778383 A JP778383 A JP 778383A JP S59131997 A JPS59131997 A JP S59131997A
- Authority
- JP
- Japan
- Prior art keywords
- voiced
- unvoiced
- voice
- frequency
- sounds
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
産業上の利用分野
音声認識及び音声合成のだめの音声分析装置に利用され
る音声の有声・無声判定方法に関するものである。
る音声の有声・無声判定方法に関するものである。
従来例の構成とその問題点
従来のこの種の判定方法としては、音声信号の2ノ
〕 高域と低域のエネルギー差を用いる方式があげられる。
〕 高域と低域のエネルギー差を用いる方式があげられる。
これは、新美康永著「音声認識」(弁室出版、1979
年)に述べられている。
年)に述べられている。
この方式は、声帯音源の周波数スペクトルの概形は−1
2〜−184B10atの傾斜をしているため、有声音
では低い周波数のエネルギーが優勢となるのに対し、無
声音では高い周波数のエネルギーが優勢となることを利
用したものである。この方式の構成は第1図に示すよう
に、2種類の帯域通過濾波器(100〜9oOH2と3
700〜6000H2)と2つの整流器、そして比較器
で構成される。
2〜−184B10atの傾斜をしているため、有声音
では低い周波数のエネルギーが優勢となるのに対し、無
声音では高い周波数のエネルギーが優勢となることを利
用したものである。この方式の構成は第1図に示すよう
に、2種類の帯域通過濾波器(100〜9oOH2と3
700〜6000H2)と2つの整流器、そして比較器
で構成される。
以下、第1図に沿って従来例の方式を説明する。
マイク等より入力された音声信号は第1図の1及び2に
示す帯域濾波器に送られる。帯域濾波器1は低域成分(
1ooHz 〜s、ooHz )のみを通過させる帯域
濾波器、帯域濾波器2は高域成分(3600H2〜60
00H2)のみを通過させる帯域濾波器である。この帯
域濾波器1,2を通過した、音声信号の低域成分及び高
域成分は、それぞれ整流器3,4に送られ整流、平滑化
が施され、低域3tC−ジ 電圧、高域電圧に変換される。そして、低域及び高域の
2つの電圧は比較器5に送られ、低域電圧が高域電圧よ
り高ければ有声、逆に高域電圧が低域電圧より高ければ
無声と判定される。このように従来例における方式はハ
ードウェアで容易に実現することが出来る。
示す帯域濾波器に送られる。帯域濾波器1は低域成分(
1ooHz 〜s、ooHz )のみを通過させる帯域
濾波器、帯域濾波器2は高域成分(3600H2〜60
00H2)のみを通過させる帯域濾波器である。この帯
域濾波器1,2を通過した、音声信号の低域成分及び高
域成分は、それぞれ整流器3,4に送られ整流、平滑化
が施され、低域3tC−ジ 電圧、高域電圧に変換される。そして、低域及び高域の
2つの電圧は比較器5に送られ、低域電圧が高域電圧よ
り高ければ有声、逆に高域電圧が低域電圧より高ければ
無声と判定される。このように従来例における方式はハ
ードウェアで容易に実現することが出来る。
前記のような従来例の問題点の1つとして、低域のエネ
ルギーが優勢な環境騒音に弱いことがあげられる。無声
音のエネルギーは有声音に比べ低いだめ騒音の影響を受
けやすい。しかもその騒音が低域成分にエネルギーが集
中している場合は、高域エネルギーが低域エネルギーよ
り優勢であるという無声音の特徴が弱められてしまうた
め無声音の判定誤りが大きくなる。また、室内騒音のほ
とんどは低域エネルギーが優勢な騒音であるだめ、実際
の使用環境で十分高い精度を得ることがむずかしい。
ルギーが優勢な環境騒音に弱いことがあげられる。無声
音のエネルギーは有声音に比べ低いだめ騒音の影響を受
けやすい。しかもその騒音が低域成分にエネルギーが集
中している場合は、高域エネルギーが低域エネルギーよ
り優勢であるという無声音の特徴が弱められてしまうた
め無声音の判定誤りが大きくなる。また、室内騒音のほ
とんどは低域エネルギーが優勢な騒音であるだめ、実際
の使用環境で十分高い精度を得ることがむずかしい。
第2番目の問題点として、従来例では対応出来ない場合
が存在することである。例えば、電話回線を通った音声
信号の有声、無声判定を行なう場合、無声音のエネルギ
ーのピークは3500H2〜7000H2ぐらいである
のに対し、電話回線を通った音声信号の帯域は300H
1〜3000Hzぐらいしかない。そのため無声音の高
域エネルギーが優勢であるという特徴が使用出来なくな
り従来例を適応したとしても十分な精度は得られない。
が存在することである。例えば、電話回線を通った音声
信号の有声、無声判定を行なう場合、無声音のエネルギ
ーのピークは3500H2〜7000H2ぐらいである
のに対し、電話回線を通った音声信号の帯域は300H
1〜3000Hzぐらいしかない。そのため無声音の高
域エネルギーが優勢であるという特徴が使用出来なくな
り従来例を適応したとしても十分な精度は得られない。
このように高域周波数帯域が制限された音声信号に対し
ては従来例による方式では対応出来ない。
ては従来例による方式では対応出来ない。
発明の目的
本発明の目的は、従来例に見られる問題点を改善せんと
するもので、環境騒音の影響を受けにくく、シかも適応
出来る環境を拡大し、高い精度で有声・無声の判定が得
られる有声・無声判定方法を提供するものである。
するもので、環境騒音の影響を受けにくく、シかも適応
出来る環境を拡大し、高い精度で有声・無声の判定が得
られる有声・無声判定方法を提供するものである。
発明の構成
本発明は上記目的を達成するためになされたもので、音
声の有声音・無声音の平均的なスペクトル形状を表わす
二つの標準パターンを、あらかじめ用意しておき、入力
された音声信号のスペクトル形状と二つの標準パターン
との類似度により、6ページ 有声・無声の判定を行なうに際し、前記スペクトル形状
を表わすパラメータとしてLPCケプストラム係数を用
い、類似度の尺度としてマハラノビス距離を用いたこと
を特徴とする音声の有声・無声判定方法を提供するもの
である。
声の有声音・無声音の平均的なスペクトル形状を表わす
二つの標準パターンを、あらかじめ用意しておき、入力
された音声信号のスペクトル形状と二つの標準パターン
との類似度により、6ページ 有声・無声の判定を行なうに際し、前記スペクトル形状
を表わすパラメータとしてLPCケプストラム係数を用
い、類似度の尺度としてマハラノビス距離を用いたこと
を特徴とする音声の有声・無声判定方法を提供するもの
である。
実施例の説明
まず本発明の基本的な考え方について説明する。
従来例にみられる問題点は音声の有声・無声の特徴を示
す周波数スペクトル形状の相異のうち、特定の周波数帯
域でのエネルギーレベルの相異という一部の特徴しか利
用してないために生ずる。
す周波数スペクトル形状の相異のうち、特定の周波数帯
域でのエネルギーレベルの相異という一部の特徴しか利
用してないために生ずる。
したがって、有声音・無声音の周波数スペクトル上での
形状そのものの相異により識別するならば、一部の周波
数帯域に影響を与える騒音が入力されても、その影響は
少なく、高い識別率が得られる。本発明による方法は、
上述のような考えに基くもので、 ■ 有声区間及び無声区間が既知の多数の音声より得ら
れる有声音・無声音の平均的なスペクトル形状を表す二
つの標準パターンをあらかじめ61−ジ 作成しておく。
形状そのものの相異により識別するならば、一部の周波
数帯域に影響を与える騒音が入力されても、その影響は
少なく、高い識別率が得られる。本発明による方法は、
上述のような考えに基くもので、 ■ 有声区間及び無声区間が既知の多数の音声より得ら
れる有声音・無声音の平均的なスペクトル形状を表す二
つの標準パターンをあらかじめ61−ジ 作成しておく。
■ 有声・無声が未知の入力音声信号のスペクトル形状
を求める。
を求める。
■ 入力音声より得られたスペクトル形状と二つの標準
パターンとの類似度を求めどちらの標準パターンに類似
しているかにより、有声・無声を判定する。
パターンとの類似度を求めどちらの標準パターンに類似
しているかにより、有声・無声を判定する。
という方法である。そして、スペクトル形状を表わすパ
ラメータとして、LPCケプストラム係数を用い、類似
度の尺度としてマハラノピス距離を用いることを特徴と
した方法である。
ラメータとして、LPCケプストラム係数を用い、類似
度の尺度としてマハラノピス距離を用いることを特徴と
した方法である。
LPCケプヌトラム係数の性質及び算出方法はム、H,
Gray、Jr、and J、D、Markel:“D
istance maasuresfor 5peec
h processing’ IEI化AcouSt
、 、 5paach 。
Gray、Jr、and J、D、Markel:“D
istance maasuresfor 5peec
h processing’ IEI化AcouSt
、 、 5paach 。
8ignal Procaasing ASSP−24
−5(1976)に述べられている。LPCケブヌトラ
ム係数は、対数スペクトルの級数展開の係数である。そ
して、1次の係数は対数スペクトルの傾きに相当し、2
次以降の係数は対数スペクトル上の凹凸の形状を表わす
というように、対数スペクトルの形状を表71\−ジ わすパラメータである。しかも、このLPOケプストラ
ム係数は低次の係数はどスペクトル形状の大きな特徴を
表わすため、有声・無声というスペクトル形状に大きな
相異のあるものを区別する場合、スペクトルの微細構造
を表わす高次の項は必要でなく低次の項(実験によると
1〜6次程度)で十分であるためパラメータの数が少な
くてすむという利点がある。
−5(1976)に述べられている。LPCケブヌトラ
ム係数は、対数スペクトルの級数展開の係数である。そ
して、1次の係数は対数スペクトルの傾きに相当し、2
次以降の係数は対数スペクトル上の凹凸の形状を表わす
というように、対数スペクトルの形状を表71\−ジ わすパラメータである。しかも、このLPOケプストラ
ム係数は低次の係数はどスペクトル形状の大きな特徴を
表わすため、有声・無声というスペクトル形状に大きな
相異のあるものを区別する場合、スペクトルの微細構造
を表わす高次の項は必要でなく低次の項(実験によると
1〜6次程度)で十分であるためパラメータの数が少な
くてすむという利点がある。
マハラノビス距離は式0)に示すように冒 という共分
散行列の逆行列により重み付けが行なわれる距離である
。
散行列の逆行列により重み付けが行なわれる距離である
。
〒 外
D=[(C−#)W (ニー#) ] ・・・・
・・(1)〔添字−1は逆行列、Tは転置を示す〕式0
)においてCは有声・無声が未知の入力音声より得られ
るLPCケプヌトラム係数列である。
・・(1)〔添字−1は逆行列、Tは転置を示す〕式0
)においてCは有声・無声が未知の入力音声より得られ
るLPCケプヌトラム係数列である。
また、声及びW は標準パターンを構成するもので有声
あるいは無声の区間が既知である音声データより得られ
るLPCケプストラム係数の各係数のそれぞれの平均値
列及び共分散行列の逆行列である。本方法ではLPCケ
プストラム係数をパラメータとして用いているためLP
Gケプストラム係数の分散の小さい次数の項はど重みが
付けられた距離尺度となる。
あるいは無声の区間が既知である音声データより得られ
るLPCケプストラム係数の各係数のそれぞれの平均値
列及び共分散行列の逆行列である。本方法ではLPCケ
プストラム係数をパラメータとして用いているためLP
Gケプストラム係数の分散の小さい次数の項はど重みが
付けられた距離尺度となる。
すなわち、有声音間あるいは無声音間に共通したスペク
トル上の特徴を表わすLPCケプストラム係数の項はど
分散が小さくなるだめ重みが付けられるということにな
り、識別精度の高い距離尺度となる。
トル上の特徴を表わすLPCケプストラム係数の項はど
分散が小さくなるだめ重みが付けられるということにな
り、識別精度の高い距離尺度となる。
しだがって、パラメータとしてLPOケプストラム係数
を用い、マハラノビス距離により有声・無声の判定を行
なう方法は、パラメータ数が少なくてすむため演算量が
少なく、しかも高い識別精度が得られるという利点があ
る。
を用い、マハラノビス距離により有声・無声の判定を行
なう方法は、パラメータ数が少なくてすむため演算量が
少なく、しかも高い識別精度が得られるという利点があ
る。
このような考え方に基づく本発明の実施例の構成図を第
2図に示す。
2図に示す。
本実施例は入力音声信号をある一定区間長(例えば10
mB60毎)に分割し、その分割された区間の各々に
対し、有声・無声の判定を行にい、判定結果の時系列を
得るものである。そして、その結果は音声認識あるいけ
音声合成のだめの音声外9ベージ 折装置に送られ利用される。以下第2図にそって実施例
を説明する。
mB60毎)に分割し、その分割された区間の各々に
対し、有声・無声の判定を行にい、判定結果の時系列を
得るものである。そして、その結果は音声認識あるいけ
音声合成のだめの音声外9ベージ 折装置に送られ利用される。以下第2図にそって実施例
を説明する。
マイク等より入力される音声信号はム/D変換部6にお
いてデジタル信号の時系列に変換される。
いてデジタル信号の時系列に変換される。
デジタル信号に変換された音声信号は、一時記憶部7に
送られ一時的に格納される。格納されたデータは一定時
間間隔毎(例えば1 Q m860毎 )に一定数(例
えば10111860分)まとめて、I、PCケプスト
ラム算出部8に送られ、LPOケプヌトラム係数が算出
される。算出されたLPGケプストラム係数列はマノ・
マノビス距離算出部9に送られる。マハラノビス距離算
出部9では標準パターン記憶部10に格納されている有
声・無声の二つノ標準パターンと、I、PCケプストラ
ム係数算出部8より送られてきた入力音声のLPCケプ
ストラム係数列との距離を算出する。算出された二つの
距離、すなわち有声の標準パターンとの距離Dyと無声
の標準パターンとの距離I)Uは、判定部11に送られ
Dv < DU ならば入力音声は有声、逆にDv≧
DUならば入力音声は無声と判定され10ベージ る。
送られ一時的に格納される。格納されたデータは一定時
間間隔毎(例えば1 Q m860毎 )に一定数(例
えば10111860分)まとめて、I、PCケプスト
ラム算出部8に送られ、LPOケプヌトラム係数が算出
される。算出されたLPGケプストラム係数列はマノ・
マノビス距離算出部9に送られる。マハラノビス距離算
出部9では標準パターン記憶部10に格納されている有
声・無声の二つノ標準パターンと、I、PCケプストラ
ム係数算出部8より送られてきた入力音声のLPCケプ
ストラム係数列との距離を算出する。算出された二つの
距離、すなわち有声の標準パターンとの距離Dyと無声
の標準パターンとの距離I)Uは、判定部11に送られ
Dv < DU ならば入力音声は有声、逆にDv≧
DUならば入力音声は無声と判定され10ベージ る。
以上の処理は大きく三つに分けられ、ム/D変換部e
、LPCケプヌトラム係数算出部8そしてマハラノビス
距離算出部9においてそれぞれ並行して行なわれるため
、実時間で逐時有声・無声の判定結果を得ることが出来
る。
、LPCケプヌトラム係数算出部8そしてマハラノビス
距離算出部9においてそれぞれ並行して行なわれるため
、実時間で逐時有声・無声の判定結果を得ることが出来
る。
本実施例の利点は、有声・無声の判定を周波数スペクト
ル形状の相異により行なうだめ、精度の良い判定結果が
得られる。また、LPCケプストラム係数という少いパ
ラメータでスペクトル形状の特徴をよく表わすパラメー
タを用いているため、演算量が少なくてすみ、実時間で
処理が可能であることがあげられる。本実施例のもう−
っの利点として、有声・無声のスペクトル形状の相異を
標準パターンという形で持つため、電話回線を通った音
声等、使用環境が大きく変化しても標準パターンを変え
るだけで対処することが出来るというように、環境への
適応性が良いことがあげられる。
ル形状の相異により行なうだめ、精度の良い判定結果が
得られる。また、LPCケプストラム係数という少いパ
ラメータでスペクトル形状の特徴をよく表わすパラメー
タを用いているため、演算量が少なくてすみ、実時間で
処理が可能であることがあげられる。本実施例のもう−
っの利点として、有声・無声のスペクトル形状の相異を
標準パターンという形で持つため、電話回線を通った音
声等、使用環境が大きく変化しても標準パターンを変え
るだけで対処することが出来るというように、環境への
適応性が良いことがあげられる。
前記実施例について、あらかじめ、10IIIsec区
間毎(以下フレーム毎と記す)に目視による音11ペー
ジ 素ラベル付けが施されている音声データに対し適用した
結果、式(2)に示す有声・無声の識別率は、96.4
%という高い精度が得られた。
間毎(以下フレーム毎と記す)に目視による音11ペー
ジ 素ラベル付けが施されている音声データに対し適用した
結果、式(2)に示す有声・無声の識別率は、96.4
%という高い精度が得られた。
この結果は、男性10名、女性10名の計20名の話者
がそれぞれ1秒程度の単語を約2oO単語発声した大量
の音声データを用い、その音声データに対し、フレーム
毎に1次から5次までのI、PCケプヌトラム係数を算
出しマハラノビス距離によりフレーム毎に得られる有声
・無声の判定結果より算出したものである。
がそれぞれ1秒程度の単語を約2oO単語発声した大量
の音声データを用い、その音声データに対し、フレーム
毎に1次から5次までのI、PCケプヌトラム係数を算
出しマハラノビス距離によりフレーム毎に得られる有声
・無声の判定結果より算出したものである。
また、前記音声データのうち男性話者1名のデータにH
OTH雑音を信号雑音比が16dB程度になるように付
加したものを用いた場合、標準パターンは前記と同じも
のを用いても、識別率は0.3%程度しか低下しなかっ
た。
OTH雑音を信号雑音比が16dB程度になるように付
加したものを用いた場合、標準パターンは前記と同じも
のを用いても、識別率は0.3%程度しか低下しなかっ
た。
以上の結果、本実施例による音声の有声・無声判定は、
LP(ljケプストラム係数の1次から6次の係数とい
う少ないパラメータで高い識別率が得られ、しかも雑音
に強い方法であるという有効性が確かめられた。
LP(ljケプストラム係数の1次から6次の係数とい
う少ないパラメータで高い識別率が得られ、しかも雑音
に強い方法であるという有効性が確かめられた。
発明の効果
以上のように本発明は、音声の有声音・無声音の平均的
なスペクトル形状を表わす二つの標準パターンを予め用
意しておき、入力された音声信号のスペクトル形状と二
つの標準パターンとの類似度により、有声・無声の判定
を行なうに際し、前記スペクトル形状を表わすパラメー
タとしてLPOケプストラム係数を用い、類似度の尺度
としてマハラノビス距離を用いたもので、環境騒音の影
響を受けにくく、高精度で有声・無声の判定が得られる
利点を有する。
なスペクトル形状を表わす二つの標準パターンを予め用
意しておき、入力された音声信号のスペクトル形状と二
つの標準パターンとの類似度により、有声・無声の判定
を行なうに際し、前記スペクトル形状を表わすパラメー
タとしてLPOケプストラム係数を用い、類似度の尺度
としてマハラノビス距離を用いたもので、環境騒音の影
響を受けにくく、高精度で有声・無声の判定が得られる
利点を有する。
第1図は従来の有声・無声判定方法を示すブロック図、
第2図は本発明における有声・無声判定方法の実施例を
示すブロック図である。 1・・・・・・低域用帯域濾波器、2・・・・・・高域
用帯域源13ページ 波器、3.4・・・・・・整流器、5・・・・・・比較
器、6・・・・・・A/D 変換部、7・・・・・・一
時記憶部、8・・・・・・LPCケプストラム算出部、
9・・・・・・マハラノビス距離算出部、1o・・・・
・・有声・無声の標準パターン記憶部、11・・・・・
・判定部。 代理人の氏名 弁理士 中 尾 敏 男 ほか1名第1
図
第2図は本発明における有声・無声判定方法の実施例を
示すブロック図である。 1・・・・・・低域用帯域濾波器、2・・・・・・高域
用帯域源13ページ 波器、3.4・・・・・・整流器、5・・・・・・比較
器、6・・・・・・A/D 変換部、7・・・・・・一
時記憶部、8・・・・・・LPCケプストラム算出部、
9・・・・・・マハラノビス距離算出部、1o・・・・
・・有声・無声の標準パターン記憶部、11・・・・・
・判定部。 代理人の氏名 弁理士 中 尾 敏 男 ほか1名第1
図
Claims (1)
- 音声の有声音・無声音の平均的なスペクトル形状を表わ
す二つの標準パターンを あらかじめ用意しておき、人
力された音声信号のスペクトル形状と二つの標準パター
ンとの類似度により、有声・無声の判定を行ない、かつ
前記スペクトル形状を表わすパラメータとしてLPOケ
ブヌトラム係数を用い、類似度の尺度としてマハラノビ
ス距離を用いたことを特徴とする音声の有声・無声判定
方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP778383A JPS59131997A (ja) | 1983-01-19 | 1983-01-19 | 音声の有声・無声判定方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP778383A JPS59131997A (ja) | 1983-01-19 | 1983-01-19 | 音声の有声・無声判定方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS59131997A true JPS59131997A (ja) | 1984-07-28 |
Family
ID=11675268
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP778383A Pending JPS59131997A (ja) | 1983-01-19 | 1983-01-19 | 音声の有声・無声判定方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS59131997A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0763811A1 (en) | 1990-05-28 | 1997-03-19 | Matsushita Electric Industrial Co., Ltd. | Speech signal processing apparatus for detecting a speech signal from a noisy speech signal |
-
1983
- 1983-01-19 JP JP778383A patent/JPS59131997A/ja active Pending
Non-Patent Citations (1)
Title |
---|
IEEE TRANSACTIONS ON ACOUSTICS,SPEECH,AND SIGNAL PROCESSING=1976 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0763811A1 (en) | 1990-05-28 | 1997-03-19 | Matsushita Electric Industrial Co., Ltd. | Speech signal processing apparatus for detecting a speech signal from a noisy speech signal |
EP0763812A1 (en) | 1990-05-28 | 1997-03-19 | Matsushita Electric Industrial Co., Ltd. | Speech signal processing apparatus for detecting a speech signal from a noisy speech signal |
EP0763810A1 (en) | 1990-05-28 | 1997-03-19 | Matsushita Electric Industrial Co., Ltd. | Speech signal processing apparatus for detecting a speech signal from a noisy speech signal |
EP0763813A1 (en) | 1990-05-28 | 1997-03-19 | Matsushita Electric Industrial Co., Ltd. | Speech signal processing apparatus for detecting a speech signal from a noisy speech signal |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Rabiner et al. | A comparative performance study of several pitch detection algorithms | |
Shrawankar et al. | Techniques for feature extraction in speech recognition system: A comparative study | |
AU702852B2 (en) | Method and recognizer for recognizing a sampled sound signal in noise | |
JP3277398B2 (ja) | 有声音判別方法 | |
US20050060153A1 (en) | Method and appratus for speech characterization | |
KR20060044629A (ko) | 신경 회로망을 이용한 음성 신호 분리 시스템 및 방법과음성 신호 강화 시스템 | |
JPH0612089A (ja) | 音声認識方法 | |
JPS634200B2 (ja) | ||
US7013266B1 (en) | Method for determining speech quality by comparison of signal properties | |
US6470311B1 (en) | Method and apparatus for determining pitch synchronous frames | |
de-La-Calle-Silos et al. | Synchrony-based feature extraction for robust automatic speech recognition | |
Motlıcek | Feature extraction in speech coding and recognition | |
JP2002123298A (ja) | 信号符号化方法、装置及び信号符号化プログラムを記録した記録媒体 | |
JPS60200300A (ja) | 音声の始端・終端検出装置 | |
JPS59131997A (ja) | 音声の有声・無声判定方法 | |
JPS60114900A (ja) | 有音・無音判定法 | |
Alku et al. | Linear predictive method for improved spectral modeling of lower frequencies of speech with small prediction orders | |
Cheng et al. | Comparative performance study of several pitch detection algorithms | |
Mufungulwa et al. | Enhanced running spectrum analysis for robust speech recognition under adverse conditions: A case study on japanese speech | |
Borum et al. | Additive analysis/synthesis using analytically derived windows | |
JPS6054000A (ja) | 音声の有声・無声判定方法 | |
JPS6148898A (ja) | 音声の有声無声判定装置 | |
Chatterjee et al. | Auditory model based modified MFCC features | |
Wu et al. | Vocal tract simulation: Implementation of continuous variations of the length in a Kelly-Lochbaum model, effects of area function spatial sampling | |
JPH1097288A (ja) | 背景雑音除去装置及び音声認識装置 |