JPH01302295A - 単語位置検出方法及びその音素標準パターン作成方法 - Google Patents

単語位置検出方法及びその音素標準パターン作成方法

Info

Publication number
JPH01302295A
JPH01302295A JP63132401A JP13240188A JPH01302295A JP H01302295 A JPH01302295 A JP H01302295A JP 63132401 A JP63132401 A JP 63132401A JP 13240188 A JP13240188 A JP 13240188A JP H01302295 A JPH01302295 A JP H01302295A
Authority
JP
Japan
Prior art keywords
phoneme
word
pattern
standard
standard pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63132401A
Other languages
English (en)
Inventor
Michio Okada
美智男 岡田
Masanori Koda
好田 正紀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP63132401A priority Critical patent/JPH01302295A/ja
Publication of JPH01302295A publication Critical patent/JPH01302295A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、連続音声の認識装置などにおいて、特に連続
音声中から任意の単語や文節の検出を行うのに適した単
語位置検出方法及び、そこで用いる単語標準パターンを
音素パターンを連結し自動的に作成するための音素標準
パターンの作成方法に関する。
〔従来の技術〕
任意の文章などの連続音声の認識では、一般にあらかじ
めその連続音声中から単語や文節などの候補を検出して
おき、それらの候補列に言語的な処理を施して文を認識
する手法がとられる。従来。
この連続音声から単語や文節を検出する場合、各単語に
ついて孤立発声して得られる音声を周波数スペクトルや
その包絡形で表わした時系列信号として把握し、これと
入力された連続音声とを位置を順次変えながら照合して
いき、それぞれの時点での一致度を調べ、あらかじめ設
定されている値よりも一致度の高い時、その単語が存在
しているものと判断し、その位置を単語の検出位置とし
ていた(文献1:岡 健−:“連続DPを用いた連続単
語認識″9日本音響学会音声研究会資料、578−20
 (1978−06))。
〔発明が解決しようとする課題〕
ところで、任意の文章音声のLLI&の場合には、任意
の単語の有無を判断したり、あるいは任意の文節の有無
を判断する必要がある。これを従来の孤立発声して作成
した個々の単語の代表的な周波数スペク1〜ル包絡など
の特徴量時系列信号(以下、単語標準パターンと呼ぶ)
を用いる方法で実現しようとすると、あらかじめ全ての
単語や文節を発声しておく必要があり、単語標準パター
ンの学習に膨大な労力を必要とし現実的には不可能であ
る。
また、単語標準パターンを記憶しておくための容量も膨
大なものとなってしまう、さらに、連続して発声した文
の構成要素となっている単語のスペクトルと単独で発声
した場合の単語のスペク1−ルとは異なることが一般に
知られている。これは、連続音声を発声する際に、単語
が互いに隣合う単語の影響を受けるためと、連続音声を
発声する場合の方が母音の無声化や音声化などの音素の
変形を生じ易いためである。従って、入力音声について
その単語区間の時系列信号と、単語ごとに発声して求め
である基準時系列信号とは大きく異なってしまい、誤検
出を招く恐れが大きくなる。
これらの問題を回避する方法として、入力音声を構成す
る音素をあらかじめ何等かの方法によって認識しておき
、認識誤りを含んだ音素の記号系列と辞書に蓄えである
単語の音素記号とを連続的に照合し単語の検出を行う方
法がある(文献2:岡山、伊藤、牧野、城戸:パ構文駆
動型連続DP法による活用語のスポツティング″、電子
情報通信学会論文誌(D)、J 70−D、12. P
P2479.1987)。しかし、この方法では音素を
高精度に識別することが難しく、単語の検出精度は低い
本発明の目的は、検出精度を低下させることなく、容易
に大語當の単語や任意の文節を検出できるようにした単
語位置検出方法を提供することにある。
本発明の他の目的は、上記単語位置検出方法で用いる単
語標準パターンを自動的に作成するための音素標準パタ
ーンの作成方法を提供することにある。
〔課題を解決するための手段〕
上記目的を達成するため1本発明の単語位置検出方法は
、検出の対象とする単語や文節などの音素記号系列に従
って、音素環境ごとに用意した音素標準パターンを木構
造に連結して単語標準パターンの候補を複数個生成し、
入力された連続音声に対して、これらの単語標準パター
ンとの照合を行い、その単語の有無とその位置を検出す
ることを特徴とする。また、こ\で用いる音素標準パタ
ーンの作成は、入力連続音声の音素系列から単語標準パ
ターンを生成する手段を用いて、入力連続音声の標準パ
ターンを複数個生成し、これらの標準パターンを入力音
声と照合して音素境界を決定し、決定された音素境界か
ら得られた音素パターンを音素環境ごとに平均化するこ
とにより音素棚準パターンを更新し、これらの音素境界
の決定と音素標準パターンの更新を繰返し行って作成す
ることを特徴とする。
〔作 用〕
本発明は、個々の音素毎に学習して作成した音素区間の
代表的な特徴量時系列信号(これが音素標準パターンで
ある)を連結することにより、単語の検出に用いる単語
標準パターンを自動的に生成するようにしたもので、単
語ごとに孤立発声して単語標準パターンを登録する必要
がない。この際、先行あるいは後続する音素の影響(こ
れを音素環境による影響、あるいは調音結合による影響
と呼ぶ)によって、各々の音XIJR準パターンは大き
く変動するため、それらを連結しても、生成された単語
標準パターンは孤立発声して作成した一屯語標準パター
ンとは大きく隔たることがある。そこで、連結する音X
1標準パターンは先行あるいは後続する音素を考慮して
、これらの音素環境毎に設定した音素標準パターンを用
いる。さらに、この音素標準パターンは、連続音声から
自動的に抽出されたパターンを用い、かつ、様々な音素
の変形を考慮して単語標準パターンの候補を複数個生成
することにより、連続音声中の音素の変形にも対処でき
る。
〔実施例〕
以下、本発明の一実施例について図面により説明する。
初め、音素標準パターンの作成について説明する。第2
図は本発明による本音素標準パターン作成方法の一実施
例のブロック図で、21は音声入力端子、22は特徴パ
ラメータ抽出部、23は音素パターン検出部、24は音
素パターン蓄積部、25は音素パターン選択部、26は
音素パターン平均化部、27は音素標準パターン蓄積部
、28は連続音声標準パターン作成部、29は音素系列
入力端子、30は音形規則蓄積部、31は木構造展開部
、32は音声入力端子、33は特徴パラメータ抽出部、
34はパターン照合部、35は音素境界検出部、36は
音素標準パターン出力端子を示す。
音声入力端子21は例えばマイクロホン等に接続され、
初期の音素パターンを抽出するための単語の音声信号を
入力して特徴パラメータ抽出部22に供給する。こNで
、音素パターンとは、ある音素の音素区間における特徴
パラメータの時系列をさす。この音素パターンの複数個
について所定の手続きに従い平均化したものが音素標準
パターンとなる。
特徴パラメータ抽出部22は、音声入力端子11から供
給された音声信号についてスペクトルの特徴量(例えば
10+*secごとにおのおの24次のLPG相関係数
とLPGケプストラム係数)を抽出する。音素パターン
検出部23は、視察に基づいて音素境界を決定し、それ
ぞれの音素区間について特徴量の時系列を取出し、音素
パターン蓄積部24にその音素区間の特徴量時系列とf
素記号、前後の音素記号を供給する。音素境界とは音声
の特徴量の時系列信号の上で、個々の音素に対応する区
間の境界を示すもので、一般的な定義は明確ではなく、
一定の基準にしたがって視察により決められる。
音素パターン蓄積部24は、前記音素パターン検出部3
及び後述する音素境界検出部35からの、それぞれの音
素区間の特徴量時系列と音素記号、及び前後の音素記号
を記憶し、その記憶内容を適宜に次段の音素パターン選
択部25に出力するものである。
音素パターン選択部25は、先行および後続の音素記号
の情報により音素パターン蓄積部24から特定の音素環
境にある音素パターンを選択し、音素パターン平均化処
理部26に出力する。音素標準パターンは前後のすべて
の音素環境について作成されるが、音声入力端子21か
ら入力される音声の中に、前後のすべての音素環境にあ
る音素パターンを含ませることは難しい。そこで、この
音素パターン選択部25では、所望の音素環境にある音
素パターンが前記の音素パターン蓄積部24に含まれて
いる場合には、それらの音素パターンをすべて音素パタ
ーン平均化処理部26に出力する。また、必要とする音
素環境の音素パターンが音素パターン蓄積部24に含ま
れていない場合には、音素パターン蓄積部24の中に含
まれている音素パターンのうちで、所望の音素環境に最
も近いものを選択して代用する。この選択のために。
音素パターン選択部25に対し、音素環境の距離関係を
例えば第3図(a)、(b)に示すような横形図で先験
的に与えておく。第3図(a)は先行する音素環境の距
離関係を示す樹形図、第3図(b)は後続する音素環境
の距離関係を示す樹形図である。音素パターン選択部2
5は、所望する音素環境の音素パターンが得られない場
合、この樹形図上でその音素環境より1つ上位の音素環
境のグループに移り、そのグループ内に所望の音素環境
が含まれていれば、この音素環境のグループの音素パタ
ーンを選択する。それでも音素パターンが得られない場
合には、さらに1つ上位に移ることを、音素パターンが
得られるまで繰返す。
音素パターン平均化処理部26は、選択されたそれぞれ
の音素について、すべての音素環境ごとに、上記音素パ
ターン選択部25から出力される同一グループの音素環
境にある複数個の音素パターンを平均化し、セントロイ
ドの音素標準パターンを算出して、音素標準パターン蓄
積部7に出力する。尚、音素パターンが1個しか得られ
ない場合には、特にこの処理は行わない。平均化の方法
としては、例えば、複数個の音素パターンから平均パタ
ーン長を算出し、その平均パターン長に最も近い音素パ
ターンを抽出し、それを基準として、動的計画法(DP
@)により、非線形の時間軸整合を他の音素パターンと
の間で行い、フレーム毎に特微量の(こ2では例えばL
PG相関係数)の平均化を行う方法を用いる(文献3:
迫江、千葉:動的計画法を利用した音声の時間正規化に
基づく連続単語認識2日本音響学会誌、27.!L p
483.1971)。このようにして、各音素パターン
について可能なすべての音素環境毎に音素標準パターン
を1個ずつ算出する。
音素標準パターン蓄積部27は、音素パターン平均化処
理部26で得られた音素標準パターンを記憶し、その記
憶内容を適宜、連続音声標準パターン生成部28及び出
力端子36に出力するものである。
音声入力端子32は例えばマイクロホン等に接続され、
新たな音素パターンを抽出するための任意の連続音声の
信号を入力する。ニーで入力された音声は特徴パラメー
タ抽出部23で特微量の時系列が抽出された後、パター
ン照合部34に出力される。
入力端子29は音声入力端子32から入力される任意の
連続音声に対応する音素記号系列を入力するための入力
端子であり、入力された音素系列は木構造展開部31に
送られる。
木構造展開部31は、入力された音素系列から、音素の
変形と音素環境を考慮した音素列を木構造の形で生成し
、連続音声標準パターン生成部28に出力する。背形規
則蓄積部30では、例えば母音の無声化の規則、長音化
の規則等を記憶しておき、本構造展開部31において適
宜この規則が参照される。例えば、[東京駅から]とい
う文節に対応する音素記号系列/ toukjouek
ikara /が入力された場合には、木構造展開部3
1において第4図のような木構造が生成される。この例
では、2箇所の10u/は長音化する可能性があり、ま
た/に/に挾まれた/ i /は無音化する可能性があ
る。このような変形の可能性に対して、系列を木構造で
分岐させて表現する。この例では、8通りの系列が生成
される。音素標準パターンは音素環境毎に設定されてい
るために、背形現象はそれぞれのパターンに吸収される
ことが多いので、背形規則としては母音の無音化や長音
化などの最も基本的なものと同一の音素環境にあっても
、話者や発話速度によってその傾向が異なり、前後の音
素環境だけでは吸収できないものに限定する。例えば/
ni/や/wa/のようなスペクトル系列は、それぞれ
の音素への分離の易しいものと、話者や発声速度によっ
ては分前の難しいものがある。そこで、音素標準パター
ンとして、[nl、[il。
[nilなどのクラスを用意し、2つの可能性を持たせ
ておく。このような背形を考慮した単語の構造は一般に
ネットワークによって表現されるが。
こへでは′、連続DP法を用いる際に都合のよい木構造
で表現する。
連続音声標準パターン生成部28は、木構造展開部31
で生成された木構造にしたがって前後の音素環境に依存
した音素標準パターンを音素パターン蓄積部27から取
出し、入力端子29と連結して音声入力端子32に入力
される連続音声に対応する連続音声標準パターンを生成
し、そのパターンを構成する音素標準パターンの境界位
置と\もにパターン照合部34に出力する6 パタ一ン照合部34は、連続音声パターン生成部28か
ら生成された木構造をなす基準特徴量時系列と音声入力
端子32から入力された連続音声の特徴量時系列とが最
も合うように整合を行うものである。具体的には、一方
を基準として、両者が最も良く合うように他方の時間軸
を非線形に伸縮する。この方法としては、動的計画法に
よる最適化の手法を使用できることが知られている(文
献3)。木構造の標準パターン側を深さ優先探索の順序
で整合度を算出していき、整合度の最もよい系列を選択
し、その系列について最適DP経路を求め、音素境界検
出部35に出力する。
音素境界検出部35は、パターン照合部34で求められ
た最適DP経路に基づいて、連続音声標準パターン側の
音素標準パターンの境界を入力音声の特徴量時系列に対
応付けることにより、入力音声の特徴時系列の音素境界
を検出し、音素パターンとその音素境界、音素記号1前
後の音素環境を音素パターン蓄積部24に出力する。こ
\で、音素パターン蓄積部24では、さきに記憶してい
た音素パターンを更新し、新たに音素境界検出部35か
ら出力された音素パターンを記憶する。この更新を3,
4回繰返すことにより、はゾ最適な音素境界が得られる
。このようにして、出力端子36からは、最適化された
音素標準パターンが出力される。
次に、本発明における単語位置検出方法を説明する。第
1図は本発明の単語位置検出方法の一実施例のブロック
図で、1は音声入力端子、2は特徴パラメータ抽出部、
3は音素系列入力端子、4は木構造展開部、5は背形規
則蓄積部、6は音素標準パターン蓄積部、7は単語標準
パターン生成部、8はマツチング部、9は単語検出判定
部、10は閾値蓄積部、11は単語位置検出部、12は
出力端子である。
音声入力端子1は、たとえばマイクロホン等に接続され
、認識の対象となる未知の連続音声を入力する。入力さ
れた未知の連続音声は特徴パラメータ抽出部2において
特徴量時系列に変換された後、マツチング部8に送られ
る。特徴パラメータ抽出部2は第2図の22や33と同
じものである。
音素系列入力端子3は音声入力端子1から入力される連
続音声に対応し、検出を行おうとする単語、あるいは文
節の音素系列を入力するための入力端子である。こNで
入力された音素系列は木構造展開部4において、背形規
則M積部5で記憶されている背形規則を参照して木構造
の音素記号系列に展開され、単語標準パターン生成部7
に送られる。木構造展開部4と背形規則蓄積部5は第2
図の31.30と同じものである。
単語標準パターン生成部7は、木構造展開部3で第4図
の如く生成された木構造の音素記号系列と各々の音素記
号に付与されている音素環境の情報にしたがって1前後
の音素環境に依存した音素標準パターンを音素標準パタ
ーン蓄積部6(第2図の27と同じもの)から取出し、
連結して単語標準パターンを生成し、マツチング部8に
出力する。
マツチング部8では、音声入力端子1から入力された未
知の入力音声の特徴量時系列に対し、それと単語標準パ
ターンとを時間的に走査しながら整合させ、その整合度
の高い位置を捜す。この時間的に走査しながら整合をと
る場合にも、各々の時点において整合度が最も高くなる
ように一方の時間軸を適当に非線形に伸縮させ他方の時
間軸に合わせ、対応する時点の特徴量同士を比較するよ
うにする。具体的には、動的計画法による最適化手法の
1つである連続DP法が使えることが知られている(文
献1)、それぞれの位置で算出された整合度は単語検出
判定部9に送られる。
閾値蓄積部10は、単語検出を行うための整合度の閾値
を記憶している。単語検出判定部9では、マツチング部
8で算出された整合度の時系列の値と閾値蓄積部10で
記憶されている閾値との比較を行い、整合度の値が閾値
を越えていればそこに単語が存在していると判断し、閾
値を連続して越えている区間のうち、その値が最も大き
い位置を単語位置検出部11に送る。単語位置検出部2
3は、単語検出判定部9でその単語の存在が判断された
単語について、その位置を確定し、出力端子12に連続
音声から検出される単語の種類とその位置、及び整合度
を出力する。
本実施例において、初期の音素標準パターンを215単
語から学習し、その音素標準パターンに基づいて70単
文の連続音声から自動的に音素標準パターンを学習し、
この音素標準パターンを連結することにより、61個の
キーワードの単語標準パターンを生成し、この単語を東
京周辺交通網に関する30の質問応答文からなる連続音
声中から検出を行った所、第5図に示すような検出誤り
の評価が得られた。第5図は、61個のキーワードが延
べ96個含まれている30単文中から、96個のキーワ
ードがある検出率で検出できる閾値を設定した場合に、
付加誤りとなる単語数を算出したものである。この比較
として、従来の単語単位に発声して作成した同一のキー
ワードの単語擦を隼パターンを用いて、同じ条件で単語
検出を試みた結果、は望同程度の検出精度があることが
明らかとなった。すなわち、本発明の単語検量方法によ
れば、従来と方法と同程度の精度を保ちつN大語電の単
語や任意の文節の検出が行えることが分かる。
なお、本実施例では、連続音声中の単語を検出する例を
示したが、雑音音声中から特定の単語や文章を検出する
ことなどに用いても良い。
〔発明の効果〕
以上説明したように、本発明によれば、任意の入力され
た連続音声と、入力音声の音素系列から音素環境ごとに
用意した音Mmi!sパターンを連結して作成した複数
個の入力連続音声の標準パターンとを照合して、入力音
声を構成する音素の境界を決定し、これらの決定された
音素境界から音素パターンを得、それらを音素環境ごと
に平均化することにより、音素s準パターン更新し、さ
らにこれらの音素境界の決定と音素標準パターンの更新
を繰返すことにより音素標準パターンを学習し。
これらの音素環境ごとに用意した音素標準パターンを連
結することにより単語検出のための単語標準パターンを
自動的に生成するようにしたもので、大語當の単語や文
節の標準パターンを容易に生成でき、かつ、様々な音素
の変形を考慮した複数の標準パターンを生成できる。こ
れにより、任意の文章などの連続音声の認識に際し1個
々の単語を発声して登録する多大な労力と、標準パター
ンの記憶量を必要とせずに、かつ、検出率を低下させる
ことなく、大語常の単語の検出を行うことができる。
【図面の簡単な説明】
第1図は本発明の単語位置検出方法の一実施例のブロッ
ク図、第2図は本発明の単語位置検出方法で用いるN素
標準パターンを作成するためのブロック図、第3図は音
素環境の距離関係を示す樹形図、第4図は木構造に展開
した音素記号列とその音素環境の一例を示す図、第5図
は本発明の効果を従来の孤立発声した単語標準パターン
を作成した方法と比較して示した図である。 1・・音声入力端子、  2・・・特徴パラメータ抽出
部、 3・・・音素系列入力端子、 4・・・木構造展
開部、 5・・・背形規則蓄積部、 6・・・音素標準
パターン蓄積部、 7・・・単語標準パターン生成部、
 8・・・マツチング部、 9・・・単語検出判定部、
  10・・・閾値蓄積部、 11・・・単語位置検出
部、  12・・・出力端子。 第1遥 第2図 第3図 (久) (b) 第4図 (ejl(kk3(iaJ()cr)(cta3fii
’J第5図

Claims (2)

    【特許請求の範囲】
  1. (1)入力された音声中の特定の単語や文節などを検出
    する単語位置検出方法において、検出の対象とする単語
    や文節などの音素記号系列に従って、音素環境ごとに用
    意した音素標準パターンを連結して単語標準パターンの
    候補を複数個生成し、入力された連続音声に対して、こ
    れらの単語標準パターンとの照合を行い、その単語の有
    無を検出することを特徴とする単語位置検出方法。
  2. (2)入力連続音声の音素系列から該入力連続音声の標
    準パターンを複数個生成し、これらの標準パターンを入
    力音声と照合して音素境界を決定し、決定された音素境
    界から得られた音素パターンを音素環境ごとに平均化す
    ることにより音素標準パターンを更新し、これらの音素
    境界の決定と音素標準パターンの更新を繰返し行うこと
    により音素標準パターンを作成することを特徴とする請
    求項(1)記載の単語位置検出方法に用いる音素標準パ
    ターンの作成方法。
JP63132401A 1988-05-30 1988-05-30 単語位置検出方法及びその音素標準パターン作成方法 Pending JPH01302295A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63132401A JPH01302295A (ja) 1988-05-30 1988-05-30 単語位置検出方法及びその音素標準パターン作成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63132401A JPH01302295A (ja) 1988-05-30 1988-05-30 単語位置検出方法及びその音素標準パターン作成方法

Publications (1)

Publication Number Publication Date
JPH01302295A true JPH01302295A (ja) 1989-12-06

Family

ID=15080532

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63132401A Pending JPH01302295A (ja) 1988-05-30 1988-05-30 単語位置検出方法及びその音素標準パターン作成方法

Country Status (1)

Country Link
JP (1) JPH01302295A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8738378B2 (en) 2007-07-09 2014-05-27 Fujitsu Limited Speech recognizer, speech recognition method, and speech recognition program

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8738378B2 (en) 2007-07-09 2014-05-27 Fujitsu Limited Speech recognizer, speech recognition method, and speech recognition program

Similar Documents

Publication Publication Date Title
JP4543294B2 (ja) 音声認識装置および音声認識方法、並びに記録媒体
US5033087A (en) Method and apparatus for the automatic determination of phonological rules as for a continuous speech recognition system
US7529678B2 (en) Using a spoken utterance for disambiguation of spelling inputs into a speech recognition system
US6912499B1 (en) Method and apparatus for training a multilingual speech model set
WO2015118645A1 (ja) 音声検索装置および音声検索方法
JPH06110493A (ja) 音声モデルの構成方法及び音声認識装置
KR20000031935A (ko) 음성인식시스템에서의 발음사전 자동생성 방법
EP0562138A1 (en) Method and apparatus for the automatic generation of Markov models of new words to be added to a speech recognition vocabulary
KR100573870B1 (ko) 대화체 연속음성인식을 위한 의사형태소 기반다중발음사전 구축 방법 및 그 시스템과 이를 이용한대화체 음성인식 방법
JP4600706B2 (ja) 音声認識装置および音声認識方法、並びに記録媒体
Parikh et al. Gujarati speech recognition–A review
JPH08123469A (ja) 句境界確率計算装置および句境界確率利用連続音声認識装置
JPH01302295A (ja) 単語位置検出方法及びその音素標準パターン作成方法
JPH08248988A (ja) 音声認識方法
KR0173204B1 (ko) 한국어 변이음 집단화 수형도를 이용한 변이음 단위의 음성인식 방법
JP2980382B2 (ja) 話者適応音声認識方法および装置
JPH10232693A (ja) 音声認識装置
KR102405547B1 (ko) 딥러닝 기반의 발음 평가 시스템
JPH08314490A (ja) ワードスポッティング型音声認識方法と装置
Merad-Boudia et al. Arabic speech recognition for connected words using HTK: Triphones expanded to Gmm based Quran recognition
JP3369121B2 (ja) 音声認識方法および音声認識装置
KR20060062287A (ko) 문맥 요구형 화자 독립 인증 시스템 및 방법
JPH03223799A (ja) 分離しているワード、特に非常に大きい語いの認識方法と装置
JPH0534679B2 (ja)
JPH01227198A (ja) 音声認識装置の単語予備選択方式