JPH0469800B2 - - Google Patents

Info

Publication number
JPH0469800B2
JPH0469800B2 JP58119327A JP11932783A JPH0469800B2 JP H0469800 B2 JPH0469800 B2 JP H0469800B2 JP 58119327 A JP58119327 A JP 58119327A JP 11932783 A JP11932783 A JP 11932783A JP H0469800 B2 JPH0469800 B2 JP H0469800B2
Authority
JP
Japan
Prior art keywords
analysis
time
feature
speech
phonemes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP58119327A
Other languages
English (en)
Other versions
JPS6011898A (ja
Inventor
Yoichi Takebayashi
Hidenori Shinoda
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Tokyo Shibaura Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tokyo Shibaura Electric Co Ltd filed Critical Tokyo Shibaura Electric Co Ltd
Priority to JP58119327A priority Critical patent/JPS6011898A/ja
Publication of JPS6011898A publication Critical patent/JPS6011898A/ja
Publication of JPH0469800B2 publication Critical patent/JPH0469800B2/ja
Granted legal-status Critical Current

Links

Description

【発明の詳細な説明】 〔発明の技術分野〕 本発明は入力音声の音素や単語等を高精度に認
識することのできる実用性の高い音声認識装置に
関する。
〔発明の技術的背景〕
近時、電子技術の進歩に伴つて種々の音声認識
装置が開発され、例えば特定話者を対象とした単
語音声認識では認識対象が数百単語程度であつて
も相当高い認識率が得られるようになつてきた。
また不特定話者を対象とする単語音声認識にあつ
ても、数十単語程度の認識が可能となつてきてい
る。
然し乍ら、大語彙単語や速読発声された音声を
認識対象とする場合、単語単位での学習や、認識
対象とする語彙の変更が困難である。この為、先
ず入力音声の構成要素である音節や音素レベルで
の認識処理を行い、しかるのち言語情報と単語辞
書を利用した認識処理を行う方式を採用すべきで
あると考えられている。このような方式を採用す
れば、音素を認識の基本単位とすることによつ
て、約20種類程度の音素認識結果を利用し、単語
音声のみならず連続発声された音声をも認識可能
となることが知られている。そして、このような
場合には、その認識性能が、音素の認識率に強く
依存することから、前述した音声の分析とその音
素認識を如何に精度良く、且つ効率良く行うかが
重要な課題となつている。
〔背景技術の問題点〕
ところで音声の構成要素である音素(音韻)
は、その発声機構の違いによつて種々に分類する
ことができる。即ち、音素は先ず母音と子音とに
大別される。そして、上記子音は、有声・無声、
調音位置、調音形式等によつて分類される。そし
て、上記音素のうち母音は定常的であり、且つ持
続時間が長いと云う性質を有する。また子音の持
続時間が短いと云う性質がある。例えば無声破裂
音(p,t,k)は音声変化が速く、且つ持続時
間が短い。そしてその特徴は破裂時点で現われる
と云う性質を有している。
然し乍ら、従来の音声認識にあつては、上述し
た各音素の性質を考慮することなしに、入力音声
を一定の分析時間長で、且つ一定の分析フレーム
周期で分析し、これによつて得られた特徴パラメ
ータを用いて認識処理を行つている。この為、母
音を認識するに際しては、その分析時間長が短い
ので離散的フーリエ変換等によるスペクトル分析
では周波数分解能が悪くなり、また声帯音源のピ
ツチ周波数の影響を受けて分析結果が不安定化
し、その誤認識が生じ易いと云う問題があつた。
一方、前述した無声破裂音(p,t,k)等の変
化の速い子音に関しては、分析時間長、およびそ
の分析フレーム長が長過ぎる為、分析によつて得
られた特徴パラメータから、上記子音の変化に関
する重要な情報が他の情報に埋もれてしまう不具
合があつた。
また音素認識を行うことなしに、単語全体のパ
ターン照合を利用する単語音声認識方式もある
が、認識対象とする語彙が増大すると、その認識
対象中に類似する単語が多くなる為、それらの識
別が困難になると云う問題があつた。またこのよ
うな認識方式にあつても、分析時間長およびその
分析フレーム周期を一定にして入力音声の特徴パ
ラメータを抽出しているので、単語音声特徴ベク
トルが不安定となつたり、或いは顕著な特徴が現
われ難いと云う不具合があつた。
〔発明の目的〕
本発明はこのような事情を考慮してなされたも
ので、その目的とするところは、入力音声を構成
する音素の特徴を効果的に利用して、簡易に且つ
高精度に音素や単語等を認識することのできる実
用性の高い音声認識装置を提供することにある。
〔発明の概要〕
本発明は分析時間長および分析フレーム周期を
それぞれ異ならせた複数の分析時間毎に入力音声
の特徴パラメータの時系列を求め、これらの特徴
パラメータの時系列の一部を音声特徴ベクトルと
して抽出してパターン照合による音声認識を行う
ようにしたものである。
即ち、入力音声に対して例えばデイジタル信号
処理によつて音声分析を行う場合、その分析時間
長Tと分析フレーム周期Fとを変化させた複数の
分析時間(T1,F1)(T2,F2)(T3,F3)〜毎
に、デイジタル帯域フイルタ群、離散的フーリエ
変換(DFT),ケプストラム分析、線形予測分析
(LPC)等によつて前記入力音声の特徴パラメー
タの時系列X1,X2,X3〜を求め、これらの特徴
パラメータの時系列X1,X2,X3〜の部分系列
P1i,P2i,P3i〜(i=1,2,3〜N)をその音
声特徴ベクトルとして抽出して、予め準備された
音声カテゴリ辞書との間で類似度、例えば距離や
尤度を計算して音素、音節、単語、文章等の入力
音声を認識するようにしたものである。尚、前記
特徴パラメータの時系列X1,X2,X3〜をアナロ
グ処理によつても求めることが可能なことは云う
までもない。
〔発明の効果〕
かくして本発明によれば、入力音声の特徴ベク
トルの時系列が分析時間長およびその分析フレー
ム周期を異ならせた複数の分析時間毎に求められ
るので、母音のような比較的安定で且つ定常的な
音素の認識に関しては分析時間長と分析フレーム
周期を長くした分析処理により求められた特徴パ
ラメータの時系列を特徴ベクトルとして用い、こ
れを効果的に、且つ精度良く認識することが可能
となる。また変化が速く、非定常的な性質を有す
る破裂性子音等の音素に関しては、分析時間長お
よび分析フレーム周期の短い分析で求められた特
徴パラメータの時系列を特徴ベクトルとして用い
ることによつて、これを簡易に、且つ高精度に認
識することが可能となる。このようにして、個個
の性質を考慮してそれぞれ認識された音素の情
報、つまり音素の時系列パターンと音声カテゴリ
辞書とをパターン照合することにより、ここに入
力音声を効果的に認識することが可能となる。
また上述したように分析時間を変化させて入力
音声の特徴パラメータの時系列を得るので、母音
の分析精度の向上を図り、母音を重視した認識が
可能となる。また子音の特徴を良く抽出すること
ができるので、子音の異なる類似単語間の識別を
容易ならしめる。従つて、異なる分析時間毎に求
められる複数種の特徴ベクトルを有効に利用し
て、簡易で精度の高い認識を行い得、実用上絶大
なる効果が奏せられる。つまり、音声を構成する
音素の性質を有効に利用した高精度な音声認識が
可能となる。
〔発明の実施例〕
以下、図面を参照して本発明の実施例につき説
明する。
第1図は音素を認識処理の基本単位とする実施
例装置の概略構成図である。入力音声は、分析時
間長および分析フレーム周期を異にする第1およ
び第2の分析回路1,2にそれぞれ入力され、そ
の定められた分析時間毎に分析されて特徴パラメ
ータが抽出される。これらの分析回路1,2は後
述する第2図乃至第5図に示す如く構成されるも
ので、前記入力音声に対して、デイジタル帯域フ
イルタ処理、離散的フーリエ変換処理、ケプスト
ラム分析処理、線形予測分析処理、アナログ帯域
フイルタ処理等を施して、該入力音声の特徴パラ
メータの時系列を求めるものである。これらの分
析回路1,2でそれぞれ求められた特徴パラメー
タの時系列は、音素特徴ベクトルメモリに一時的
に記憶されたのち、その一部が特徴ベクトルとし
て読出されて類似度計算回路3,4にそれぞれ与
えられる。類似度計算回路3は、前記分析回路1
で求められた例えば分析時間長が20mS、フレー
ム周期が10mSからなる長い分析時間における特
徴ベクトルから、音素辞書5との照合、つまり類
似度計算を行つて母音等の定常的で安定な性質を
有する音素を認識している。また他方の類似度計
算回路4は、前記分析回路2で例えば分析時間長
が10mS、フレーム周期が5mSからなる短い分析
時間毎に求められた特徴ベクトルから、音素辞書
6との照合により、つまり類似度計算によつて、
子音等の変化の速い音素の認識を行つている。そ
して、これらの類似度計算回路3,4にてそれぞ
れ求められた音素認識結果の時系列、即ち母音音
素パターンおよび子音音素パターンは、例えばそ
の類似度値を含む音素記号の列として音素パター
ンメモリ7に格納され、合成される。
しかるのち、音素パターンメモリ7に得られた
入力音声に対する音素パターンは照合回路8に与
えられ、例えば単語の標準音素パターンを登録し
てなる音声カテゴリ辞書9との間で類似度計算さ
れて、音声認識されるものとなつている。
即ち、本装置にあつては分析回路1において分
析時間長Tとそのフレーム周期Fとが長い分析時
間にて求められた入力音声の特徴パラメータの時
系列によつて、入力音声の定常的な性質を有する
母音等の音素が効果的に認識される。また分析時
間長Tとフレーム周期Fを短く設定した分析回路
2において、入力音声の変化に対して敏感な分析
により求めた特徴パラメータの時系列によつて、
入力音声の変化の速い子音等の音素を効果的に求
めることが可能となる。そして、これらのそれぞ
れ求められた母音および子音の音素の時系列から
なる音素パターンを用いて入力音声の全体を認識
するので、その認識精度を十分に高くすることが
可能となる。また上述した認識処理はシンプルで
あり、従つて実用的利点も大きい。
さて、前述した分析回路1,2は、例えば次の
ように構成することができる。第2図はデイジタ
ル帯域フイルタ群による周波数分析による特徴パ
ラメータの抽出を行う分析回路の構成図である。
この回路は、入力音声をA/D変換器11を介し
て例えば100μS毎にデイジタル信号変換し、これ
を並列的に設けられた複数の帯域フイルタ
(DBPF)12に入力して16チヤンネルの周波数
成分にそれぞれ分離する。しかるのち、これらの
各チヤンネル出力を2乗回路13に入力してその
パワーを求める。しかるのち、これらのパワー成
分を第1の低域フイルタ(LPF)14群、および
第2のLPF15群に入力してそれぞれ平滑化処理
し、その音素特徴パラメータを求めてメモリ1
6,17に格納する如く構成される。
ここで前記第1のLPF14群は、分析時間長
(積分時間)を24mSとし、フレーム周期8mS毎に
特徴パラメータxiを抽出するものであり、また第
2のLPF15群は、分析時間長を8mSとして、フ
レーム周期8mS毎に特徴パラメータyiを抽出する
ものとなつている。このようにして求められた特
徴パラメータxiの時系列が前記母音等の音素の認
識に用いられ、また特徴パラメータyiの時系列が
子音等の音素の認識に用いられる。
このような構成の分析回路によれば、その帯域
フイルタ12の構成を同じくし、或いは共通に用
いた上で、LPF14,15の平滑フレーム長
(積分時間)を変化させるだけで、時間長の異な
る特徴パラメータxi,yiを得ることができる。し
かもこの場合には、分析処理の計算量がさほど増
大することがなく、回路構成上経済的であり、実
用上有利である。また上記LPF14,15のフ
レーム周期を8mS,4mSと別個に定めることも効
果的である。
また分析回路1,2をアナログ帯域フイルタ群
を用いて構成する場合には、第3図に示すように
すればよい。即ち入力音声を16チヤンネルのアナ
ログ帯域フイルタ(BPF)21群を通したのち2
乗回路22群に入力してパワーを求める。しかるの
ち、その出力をアナログ低域フイルタLPF23,
24を介して波したのち、A/D変換器25,26
群を介してデイジタル変換してメモリ16,17
にその特徴パラメータxi,yiを格納するようにす
ればよい。この場合、前記LPF23の時定数を
例えば30mSと長く設定し、標本化周期を15mSと
するA/D変換器25を介してデイジタル変換し
て、母音等の音素の認識に適した特徴パラメータ
xiを得るようにする。そして、LPF24について
はその時定数を例えば10mSと短く設定し、A/
D変換器26の標本化周期を例えば5mSとするこ
とによつて、子音等の音素の認識に適した特徴パ
ラメータを得るようにすればよい。
このように分析回路を構成しても、BPF21
を共用できるもので、回路の大きさをさほど増大
させることなしに特徴パラメータ抽出性能の向上
を図ることができる。また経済的であり、効率的
である。また、本実施例は、スイツチドキヤパシ
ターフイルタを用いても実現できる。
また第4図はケプストラム分析処理を適用して
構成される分析回路の例を示すものである。この
場合にはA/D変換器11を介して入力された入
力音声を2系統に分け、例えば24mSのハニング
窓を設けた時間窓回路31と、12mSのハニング
窓を設けた時間窓回路32に供給する。しかるの
ち、これらの時間窓でそれぞれ切出された信号
を、離散的フーリエ変換器(DFT)33,34
に入力してスペクトル変換し、その出力を絶対値
回路35,36、および対数変換回路(LOG)
37,38を通したのち、離散的逆フーリエ変換
器(IDFT)39,40にてケプストラム変換す
る。これによつてIDFT39の出力に時間窓
24mSの信号に対するケプストラムが得られ、そ
の上位16個のケプストラムパラメータを音素特徴
パラメータciとして抽出する。またIDFT40に
は、時間窓12mSの信号に対するケプストラムが
得られ、その上位16個のケプストラムパラメータ
を音素特徴パラメータc′iとする。そして、これら
をメモリ16,17にそれぞれ格納し、上記特徴
パラメータciの時系列が母音等の音素認識に、ま
た特徴パラメータc′iの時系列が子音等の音素認識
に用いられる。このようにして、分析時間窓を変
えてケプストラム処理することによつても、母音
の特徴を反映した特徴パラメータciの時系列と、
子音の特徴を反映した特徴パラメータc′iに時系列
とをそれぞれ得ることができる。
また第5図は、先に説明したデイジタル帯域フ
イルタ群を用いた分析回路の変形例を示すもので
あり、LPF15の出力を所定数ずつ加算器
(ADD)18に入力し、その和を求めて4チヤン
ネルの特徴パラメータyiを求め、これをメモリ1
9に格納するようにしたものである。即ち、この
例は、母音等の定常的音素を認識する為の特徴パ
ラメータとして、フレーム数「1」とし、周波数
方向16次としたものを求めている。また変化の速
い子音等の音素を認識する為の特徴パラメータと
して、フレーム数を4フレームと長くし、周波数
方向には4次としたものを求めている。このよう
に、子音認識用の特徴パラメータの周波数分解能
を悪くしても、その特徴ベクトルは4フレームに
亘つて、変化に対して敏感なものとなつているの
で、子音等の認識に十分に供することが可能であ
る。また母音認識用の特徴パラメータは1フレー
ム分しか求められないが、その性質が定常的であ
ることから周波数分解能を十分高くしておくだけ
で十分にその目的が達成される。従つて、第2図
に示す回路よりも、その構成を大幅に簡略化し得
ると云う効果が奏せられる。また、本実施例の一
変形例として、LPF14を使用せずに、LPF1
5の出力を複数フレーム分加算してメモリ16に
転送することも可能である。
このように分析回路1,2はその一部を共用す
る等して、比較的簡単に構成することができる。
そして、この場合の分析時間長Tやフレーム周期
F等は、前述したLPFの時定数や時間窓の長さ、
A/D変換器のサンプリング速度等を変化させる
ことにより、簡易に変えることができる。そし
て、音素の性質に応じた特徴パラメータを簡易
に、且つ効果的に得ることができる。
以上、音素を認識処理に基本単位とする実施例
について説明したが、本発明は単語単位の照合を
行う音声認識装置としても実施することができ
る。第6図はその概略構成図であり、分析回路
1,2は前記第2図に示されるような16チヤンネ
ル型デイジタル帯域フイルタ群等によつて構成さ
れる。この場合、分析回路1では、例えば分析時
間長が30mS、フレーム周期が15mSの分析処理に
より、定常的な特徴パラメータの時系列が求めら
れる。また分析回路2では分析時間長が10mS、
フレーム周期が5mSの分析処理により、音声の変
化に敏感な特徴パラメータの時系列が求められ
る。このような特徴パラメータの時系列に対して
リサンプル回路41,42では、前記入力音声の
パワー情報から求められる音声の始端フレームか
ら終端フレームに亘つて等間隔にリサンプルし、
例えば周波数方向16次元、時間軸方向16次元の計
256次元の時間・周波数パターンを求めている。
これらの時間・周波数パターンが、単語特徴ベク
トルメモリ43,44にそれぞれ格納される。
これらの時間・周波数パターンは、それぞれの
分析処理時の分析時間長およびフレーム周期の異
なりによつて異つたものとなつている。そして、
ベクトルメモリ43に得られるパターンは、ベク
トルメモリ44に得られるパターンに比して時間
軸方向の分解能が悪く、所謂ボケたパターンとな
つているが、逆に安定なものとなつている。この
ようにして求められた時間・周波数パターンに対
して、類似度計算回路45,46では、単語辞書
47,48との間で類似度計算を行つて、その単
語類似度を求めている。尚、ここで用いられる類
似度計算法としては、複合類似度法や、マハラノ
ビス距離等の統計的尺度を用いることが有用であ
る。
しかるのち、これらの異なる特徴ベクトルを用
いて求められた各単語カテゴリに対する類似度値
と、類似度差とを用いて総合判定回路49によ
り、その単語が総合的に評価され、認識される。
尚、この場合、前記分析時間長とフレーム時間長
を長くして求めた安定な単語特徴ベクトルに基づ
いて得た類似度結果を、単語カテゴリに対する大
分類処理に使用し、また分析時間長とフレーム時
間長を短くした単語特徴ベクトルに基づいて得た
類似度結果を、類似単語間の識別に使用すること
が望ましい。また、本実施例の複数種の照合処理
は、階層的に行うことも可能である。
尚、この単語照合に用いる分析回路1,2とし
て、前述した第3図乃至第5図に示されるような
アナログ帯域フイルタ、ケプストラム分析、離散
的フーリエ変換等を用いた分析回路を採用するこ
とも勿論可能である。
以上説明したように本発明によれば、音声を構
成する音素が有する特徴を十分有効に利用して音
声を認識するので、高精度な認識結果を得ること
ができる。しかも、簡易な処理によつて効果的に
認識結果を得ることができ、その実用的利点は絶
大である。
尚、本発明は上記実施例に限定されるものでは
ない。例えば分析時間長とフレーム周期は、入力
音声の仕様に応じて定めればよいものであつて、
上記分析時間長とフレーム周期とによつて定めら
れる分析時間の数も複数であればよい。要するに
本発明はその要旨を逸脱しない範囲で種々変形し
て実施することができる。
【図面の簡単な説明】
第1図は本発明の一実施例の概略構成図、第2
図乃至第5図はそれぞれ分析回路の構成例を示す
図、第6図は本発明の別の実施例を示す概略構成
図である。 1,2……分析回路、3,4……類似度計算回
路、5,6……音素辞書、7……音素パターンメ
モリ、8……照合回路、9……音声カテゴリ辞
書、11……A/D変換器、12……DBPF、1
3……2乗回路、14,15……LPF、16,
17,19……特徴ベクトルメモリ、21……
BPF、22……2乗回路、23,24……LPF、
25,26……A/D変換器、31,32……時
間窓回路、33,34……DFT、35,36…
…絶対値回路、37,38……対数変換回路、3
9,40……IDFT、41,42……リサンプル
回路、43,44……単語特徴ベクトルメモリ、
45,46……類似度計算回路、47,48……
単語辞書、49……総合判定回路。

Claims (1)

  1. 【特許請求の範囲】 1 分析時間長および分析フレーム周期をそれぞ
    れ異ならせて定められた複数の分析時間毎に入力
    音声を分析して該入力音声の特徴パラメータの時
    系列をそれぞれ求める手段と、これらの各特徴パ
    ラメータの時系列の部分系列をそれぞれ音声特徴
    ベクトルとして抽出し、これらの各音声特徴ベク
    トルと予め登録された音声カテゴリ辞書とをそれ
    ぞれパターン照合する手段とを具備し、 分析時間長および分析フレーム周期を短く設定
    して分析された入力音声の特徴パラメータから求
    められた特徴ベクトルを変化の早い音素の認識に
    用いると共に、分析時間長および分析フレーム周
    期を長く設定して分析された入力音声の特徴パラ
    メータから求められた特徴ベクトルを変化の遅い
    音素の認識に用いることを特徴とする音声認識装
    置。 2 入力音声の特徴パラメータの時系列を得る手
    段は、上記入力音声を分析する一連の分析処理過
    程で得られる同一途中結果に対して異なるサンプ
    リング処理を施して、分析時間長および分析フレ
    ーム周期を異にする分析時間毎の特徴パラメータ
    の時系列をそれぞれ得るものである特許請求の範
    囲第1項記載の音声認識装置。
JP58119327A 1983-06-30 1983-06-30 音声認識装置 Granted JPS6011898A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58119327A JPS6011898A (ja) 1983-06-30 1983-06-30 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58119327A JPS6011898A (ja) 1983-06-30 1983-06-30 音声認識装置

Publications (2)

Publication Number Publication Date
JPS6011898A JPS6011898A (ja) 1985-01-22
JPH0469800B2 true JPH0469800B2 (ja) 1992-11-09

Family

ID=14758720

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58119327A Granted JPS6011898A (ja) 1983-06-30 1983-06-30 音声認識装置

Country Status (1)

Country Link
JP (1) JPS6011898A (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2520392B2 (ja) * 1985-11-20 1996-07-31 富士通株式会社 単語音声認識装置
JPH0756597B2 (ja) * 1986-07-08 1995-06-14 株式会社東芝 音声認識装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58130396A (ja) * 1982-01-29 1983-08-03 株式会社東芝 音声認識装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58130396A (ja) * 1982-01-29 1983-08-03 株式会社東芝 音声認識装置

Also Published As

Publication number Publication date
JPS6011898A (ja) 1985-01-22

Similar Documents

Publication Publication Date Title
Dhingra et al. Isolated speech recognition using MFCC and DTW
Bezoui et al. Feature extraction of some Quranic recitation using mel-frequency cepstral coeficients (MFCC)
WO2020029404A1 (zh) 语音处理方法及装置、计算机装置及可读存储介质
JPH036517B2 (ja)
JP2001166789A (ja) 初頭/末尾の音素類似度ベクトルによる中国語の音声認識方法及びその装置
Dissen et al. Formant Estimation and Tracking Using Deep Learning.
Priyadarshani et al. Dynamic time warping based speech recognition for isolated Sinhala words
Nivetha A survey on speech feature extraction and classification techniques
Hidayat et al. Speech recognition of KV-patterned Indonesian syllable using MFCC, wavelet and HMM
Ananthakrishna et al. Kannada word recognition system using HTK
Thalengala et al. Study of sub-word acoustical models for Kannada isolated word recognition system
JPS6138479B2 (ja)
Yavuz et al. A Phoneme-Based Approach for Eliminating Out-of-vocabulary Problem Turkish Speech Recognition Using Hidden Markov Model.
Pradhan et al. Excitation Source Features for Improving the Detection of Vowel Onset and Offset Points in a Speech Sequence.
JPH0469800B2 (ja)
Sharma et al. Speech recognition of Punjabi numerals using synergic HMM and DTW approach
Bansod et al. Speaker Recognition using Marathi (Varhadi) Language
Abdo et al. MFC peak based segmentation for continuous Arabic audio signal
Nwe et al. Myanmar language speech recognition with hybrid artificial neural network and hidden Markov model
Laleye et al. Automatic boundary detection based on entropy measures for text-independent syllable segmentation
Adam et al. Analysis of Momentous Fragmentary Formants in Talaqi-like Neoteric Assessment of Quran Recitation using MFCC Miniature Features of Quranic Syllables
Rahman et al. Development of isolated speech recognition system for bangla words
Patel et al. Analysis of natural and synthetic speech using Fujisaki model
Tom et al. A spatio-temporal pattern recognition approach to word recognition
Pawar et al. Emotion recognition from hindi speech using MFCC and sparse DTW