JPH06266387A - 音声認識方式 - Google Patents

音声認識方式

Info

Publication number
JPH06266387A
JPH06266387A JP5052072A JP5207293A JPH06266387A JP H06266387 A JPH06266387 A JP H06266387A JP 5052072 A JP5052072 A JP 5052072A JP 5207293 A JP5207293 A JP 5207293A JP H06266387 A JPH06266387 A JP H06266387A
Authority
JP
Japan
Prior art keywords
vowel
recognition
voice
dictionary
vowels
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5052072A
Other languages
English (en)
Inventor
Akio Ando
彰男 安藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Nippon Hoso Kyokai NHK
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Hoso Kyokai NHK, Japan Broadcasting Corp filed Critical Nippon Hoso Kyokai NHK
Priority to JP5052072A priority Critical patent/JPH06266387A/ja
Publication of JPH06266387A publication Critical patent/JPH06266387A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 子音に較べて音響的な特徴のみに基づく認識
が比較的容易で、かつカテゴリ数も少ない母音部分から
照合を行ない、この結果に基づいて仮説数を制限するこ
とによって、誤認識の防止と、言語情報の効率的な利用
と、認識処理の並列化に基づく処理時間の短縮とを達成
する。 【構成】 音声信号が入力されたとき、この音声信号を
取り込んでデジタル化した後、このデジタル化処理によ
って得られた音声データに基づいて音響パラメータを抽
出するとともに、この音響パラメータに基づいて母音の
認識を行い、さらにこの認識結果に基づいて母音、子音
の順で辞書・文法格納部7を探索しながら、仮説を生成
して各仮説毎に子音のスコアを求めた後、これらの各ス
コアに基づいて文字の選択を行って文字列データを生成
する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は言語的拘束を用いて認識
を行なう音声認識方式に係わり、特に辞書や文法などの
言語的情報によって構成される仮説空間を探索しなが
ら、認識を行なう音声認識方式に関する。
【0002】[発明の概要]本発明は音韻の物理的特徴
を表現するパラメータを有し、認識精度を高めるために
言語的拘束を用いて認識を行なう音声認識方式におい
て、入力音声の先頭から順に得られる母音情報に基づい
て、予め用意した辞書や文法などの言語的情報により構
成される仮説空間を探索しながら、認識を行ない、これ
によって仮説数を制限し、言語情報の効率的な利用と、
認識処理の並列化に基づく処理時間の短縮とを達成する
ものである。
【0003】
【従来の技術】入力音声を認識する音声認識技術とし
て、従来、例えば北らの論文「HMM音韻認識と拡張L
R構文解析を用いた音声認識」(情報処理学会論文誌、
31巻3号、1990年3月)に示されているように、
各単語を表現する辞書と、それらの接続関係を規定する
文法(この場合は、拡張LR構文解析法)により、認識
対象となる仮説全体を表現しておき、入力音声の先頭か
ら音韻記号単位で表現された仮説との照合を行ないなが
ら認識を進める方法が知られている。
【0004】この場合、音韻記号と、実際の入力音声と
の対応を取るために、音韻単位のHMM(ヒドゥン・マ
ルコフ・モデル)が使用される。
【0005】
【発明が解決しようとする課題】しかしながら、上述し
た従来の音声認識方式においては、入力音声の先頭から
子音、母音の順でHMMなどを用いた照合を行なって仮
説を探索していくという手法で音声認識を行なっている
ので、辞書の登録単語数を増やしたり、扱うべき文を増
やすため、文法で記述された言語的範囲を広げたりする
と、扱うべき仮説数が増大して、処理に要する時間が増
大するのみならず、誤認識する可能性も高くなってしま
うという問題があった。
【0006】また、処理時間の問題は一般にビームサー
チと呼ばれる仮説数削減法によって対処されているが、
正しい候補を棄却しないために、保持する仮説の数を規
定するビーム幅を大きめに設定する必要があった。
【0007】本発明は上記の事情に鑑み、子音に較べて
音響的な特徴のみに基づく認識が比較的容易で、かつカ
テゴリ数も少ない母音部分から照合を行ない、その結果
に基づいて仮説数を制限することによって、誤認識の防
止と、言語情報の効率的な利用と、認識処理の並列化に
基づく処理時間の短縮とを達成することができる音声認
識方式を提供することを目的としている。
【0008】
【課題を解決するための手段】上記の目的を達成するた
めに本発明は、入力された音声を言語的拘束を用いて認
識する音声認識方式において、入力音声の先頭から音響
分析を行ないながら、逐次得られる母音の情報に基づい
て予め用意した辞書や文法などの言語的情報により構成
される仮説空間を探索して入力音声を認識することを特
徴としている。
【0009】
【作用】上記の構成において、入力音声の先頭から音響
分析を行ないながら、逐次得られる母音の情報に基づい
て仮説空間を探索して入力音声を認識することにより、
子音に較べて音響的な特徴のみに基づく認識が比較的容
易で、かつカテゴリ数も少ない母音部分からボトムアッ
プ的な認識を行ない、この結果に基づいて仮説数を制限
することによって、誤認識の防止と、言語情報の効率的
な利用と、認識処理の並列化に基づく処理時間の短縮と
を達成する。
【0010】
【実施例】
《実施例の構成説明》図1は本発明による音声認識方式
の一実施例を適用した音声認識システムの一例を示すブ
ロック図である。
【0011】この図に示す音声認識システムは、音響分
析部2と、母音標準パターン格納部3と、母音検出部4
と、子音HMM格納部5と、子音スコア計算部6と、辞
書・文法格納部7と、辞書探索部8とを備えており、音
声信号が入力されたとき、この音声信号を取り込んでデ
ジタル化した後、このデジタル化処理によって得られた
音声データに基づいて音響パラメータを抽出するととも
に、この音響パラメータに基づいて母音の認識を行い、
さらにこの認識結果に基づいて母音、子音の順で辞書・
文法格納部7を探索しながら、仮説を生成して各仮説毎
に子音のスコア(例えば、尤度)を求めた後、これらの
各スコアに基づいて文字の選択を行って文字列データを
生成する。
【0012】音響分析部2は、マイクロフォンによって
収音された音声信号が供給されたとき、これを取り込ん
で予め設定されているサンプリング周波数、例えば15
kHzのサンプリング周波数で、かつ量子化ビット数と
して16ビットでディジタル化して音声データを生成
し、さらに10msの時間窓を用いて10msずつずら
しながら前記音声データを切り出して音声区間を検出し
た後、長さ20msの時間窓を用いて5msずつずらし
ながら音声区間と判定された音声データをフレームに分
割し、この後各フレームの音声データに対して線形予測
分析と零交差波分析とを行って18次元のLPCケプス
トラム係数、零交差数、パワーなどの音響パラメータを
求め、この音響パラメータを母音検出部4と、子音スコ
ア計算部6とに供給する。
【0013】また、母音標準パターン格納部3は、実際
の入力音声中の母音部分から得られたLPCケプストラ
ム係数を用いて作成された母音標準パターン、すなわち
認識させたい人の声をあらかじめ集めて学習して得られ
た母音標準パターンや既に学習済みの他の話者の母音標
準パターンを利用して新しい話者に適応化させた母音標
準パターンが格納されており、前記母音検出部4からの
読出し指令に基づいて、格納している母音標準パターン
を前記母音検出部4に供給する。
【0014】母音検出部4は、前記音響分析部2から出
力される音響パラメータを取り込むとともに、この音響
パラメータと前記母音標準パターン格納部3に格納され
ている母音標準パターンとのユークリッド距離を計算
し、この計算結果に基づいて前記音声データ中の母音を
検出して入力音声の母音系列データを作成し、これを辞
書探索部8に供給する。
【0015】また、子音HMM格納部5は、予め学習済
みのHMM、すなわち認識させたい人の声を予め集めて
学習させたり、既に学習済みの他の話者のHMMを利用
し、新しい話者に適応化させりして作成されたHMMが
格納されており、前記子音スコア計算部6からの読出し
指令に基づいて、格納しているHMMを前記子音スコア
計算部6に供給する。
【0016】また、子音スコア計算部6は、音響分析部
2から出力される音響パラメータを取り込むとともに、
前記子音HMM格納部5に格納されているHMMを用い
て、辞書探索部8から出力される各仮説を採用した時
の、入力音声を構成する子音部分のスコア(例えば、尤
度)を求め、これを前記辞書探索部8に供給する。
【0017】また、辞書・文法格納部7は、木構造で表
現された文節用の辞書、例えば図2に示す辞書を図3に
示す如く母音と子音との順序を入れ替えた辞書と、文単
位の認識を行なうときに使用される文節間の接続を規定
するネットワーク、例えば放送における大相撲番組用字
幕スーパーのための認識処理では図4に示すネットワー
クとを格納しており、前記辞書探索部8から母音系列デ
ータが供給されたとき、この母音系列データに基づいて
汎用性の高い文節文法を用いて、記述されている各自立
語から構成可能な文節データを全て自動生成し、これを
辞書探索部8に供給する。
【0018】辞書探索部8は、母音検出部4から出力さ
れる母音系列データを取り込むとともに、この母音系列
データをキーとして辞書・文法格納部7を探索して前記
母音系列データを含む単語データあるいは文節データを
読み出し、これら単語データあるいは文節データに基づ
いて前記母音系列データ中の不確かな母音を他の母音と
入れ替えたり、削除したり、新たな母音挿入するなどし
て、いくつかの候補を仮説として生成し、これを子音ス
コア計算部6に供給する。そして、この子音スコア計算
部6から各仮説のスコアが出力されたとき、このスコア
と、前記母音検出部4から出力された母音系列データと
を統合し、各仮説と入力音声の近さを求め、最も近い仮
説から順に採用して文字列データを生成し、これを認識
結果として出力する。
【0019】《実施例の動作概要説明》まず、認識対象
となる音声が入力されると、音響分析部2によって入力
音声がA/D変換されて音声データにされるとともに、
この音声データの先頭から音響分析が行われ、同時に母
音標準パターンが使用されて母音の検出が行われる。
【0020】この場合、音響分析法としては、入力の周
波数構造を抽出できるものであれば、どのような方法を
採用しても良いが、本実施例では、切出し区間をずらし
ながら時間軸上である一定の長さの区間(この場合、各
切り出し区間はフレームと呼ばれる)を切り出し、各フ
レーム毎に対数パワースペクトル包絡のフーリエ変換を
行ない、この変換処理によってLPCケプストラム係数
を求めるLPCケプストラム分析を行い、これらのLP
Cケプストラム係数、零交差数、パワーなどの音響パラ
メータを求め、この音響パラメータを母音検出部4と、
子音スコア計算部6とに供給する。
【0021】そして、母音検出部4によって前記音響分
析部2から出力される各フレーム毎のLPCケプストラ
ム係数と、母音標準パターン格納部3に格納されている
母音標準パターンのLPCケプストラム係数のユークリ
ッド距離が計算され、この距離の最小値が予め設定され
ているしきい値より小さいとき、母音が存在すると判断
されてこの母音と、前記ユークリッド距離とがスコア
(尤度)として辞書探索部8に供給される。
【0022】これにより、辞書探索部8によって前記母
音検出部4で母音有りと判断された時点で、それ以降の
音響分析や母音検出と並行して辞書・文法格納部7の辞
書木が探索され、この探索処理によって検出された母音
部分の前に存在し得る子音が推定された後、推定された
子音が仮説として子音スコア計算部6に渡されてそのス
コアが計算される。
【0023】この場合、スコア計算としては、基本的に
どのような方法を用いても良いが、本実施例では、HM
Mを使用した尤度の形で求め、これを子音スコア計算部
6から辞書探索部8に渡す。
【0024】そして、この辞書探索部8によってこの子
音スコアと、母音に対するスコアとが統合されて、探索
済みの部分の音節数で正規化され、この仮説に対する途
中のスコアが計算される。
【0025】このとき、母音のスコアと、子音のスコア
との統合では、それまでに得られている母音および子音
の全てのスコアにつき、母音のスコアと子音のスコアの
認識に対する寄与が対等になるように重み付けが加えら
れている。
【0026】そして、このようにして得られた探索途中
の仮説と、そのスコアとが保持されながら、新たな母音
が検出される都度、各仮説毎に辞書木の探索が進められ
る。この際、母音の置換に対処するため、母音検出時に
複数の母音による探索が行われ、さらに母音の挿入に対
処するため、それ以前に得られた母音によって探索中の
仮説で新しい母音による探索を行なわないものも保持さ
れる。
【0027】また、このとき、仮説数の増大を防ぐた
め、必要に応じてビームサーチの手法が併用されるとと
もに、この手法を併用したときには、仮説数が予め設定
されている数を超えた場合、スコアの低いものから仮説
が削減されて、仮説数が一定の範囲内に保たれる。
【0028】以下、上述したように、音響分析、母音検
出、辞書探索および仮説評価という3つの処理が同時並
行的に進められ、入力された音声の最後の部分に至った
段階で、完全な文節あるいは文となってる仮説のみが認
識結果として出力される。
【0029】《実施例の動作詳細説明》次に、文節音声
認識の場合を例にとって、上述した動作における音響分
析部2、母音検出部4および辞書探索部8の詳細な動作
について説明する。
【0030】まず、音響分析部2では、図5のフローチ
ャートに示す如く認識対象となる音声が入力されると、
この入力音声が予め設定されているサンプリング周期、
例えば15kHz、予め設定されている量子化数、例え
ば16ビットでA/D変換されて音声データにされた後
(ステップST1)、10msの時間窓が10msずつ
ずらされながら、前記音声データが切り出され、そのパ
ワーと零交差数が求められて音声区間かどうかが判定さ
れる(ステップST2)。
【0031】この場合、音声区間かどうかが判定基準と
して、パワーに対し、音声区間の境界を見い出すための
しきい値T1と、このしきい値T1よりも大きい値に設
定される音声区間検出用のしきい値T2と、零交差数に
対するしきい値T3とが設定され、以下のような判定を
行なう(ステップST3)。
【0032】(1)求めたパワーがしきい値T2よりも
大きくなった場合には、音声区間と判定する。
【0033】(2)求めたパワーがしきい値T1以上あ
るいは零交差数がT3以上である場合には、まず過去の
時点に遡ってパワーがしきい値T1を下回ることなく、
または零交差数がしきい値T3を下回るこなく、パワー
がしきい値T2以上になる点を見出せたとき、音声区間
と判定し、これらの条件を満たさないときときには、音
声データの先読みを行なってそれ以降の時点で同様な点
を見出せたとき、音声区間と判定する。
【0034】(3)これら(1)、(2)を満たす点が
ないとき、音声区間でないと判定する。
【0035】この後、20msの時間窓が5msずつず
らされながら、上述したA/D変換処理で得られた音声
データが切り出されて、線形予測分析と、零交差分析と
が行われる(ステップST4)。
【0036】この場合、本実施例では、線形予測分析に
おける次数が18次にされ、プリエンファシス係数とし
て“1−0.95Z-1”が使用され、この線形予測分析
結果からLPCケプストラム係数が求められる。
【0037】そして、予め用意されたコードベクトル
(VQ)が使用されてベクトル量子化が行われて対応す
るコード番号が求められ、このVQコード番号が子音ス
コア計算部6に渡され、離散型HMMによって子音のス
コアを計算される際に使用される。
【0038】次いで、この処理で得られた18次元のL
PCケプストラム係数、零交差数、パワー、VQコード
番号などの音響パラメータが母音検出部4や子音スコア
計算部6に伝送される(ステップST5)。
【0039】また、上述した音声区間の判定処理におい
て(ステップST3)、音声区間でないと判定された場
合には、それ以前の部分までが音声区間であったなら
ば、音声区間が終了したと判定され(ステップST
6)、辞書探索部8に対し、音声区間が終了したことを
示す情報が伝送される(ステップST7)。
【0040】また、母音検出部4では、図6のフローチ
ャートに示す如く音響分析部2から送られてきた音響パ
ラメータが1フレーム分だけ読み込まれるとともに(ス
テップST10)、この音響パラメータのLPCケプス
トラム係数と、母音標準パターン格納部3に格納されて
いるLPCケプストラム係数で表現された母音標準パタ
ーンとのユークリッド距離が計算され、どの母音の標準
パターンとの距離が最小になるか調べられる。
【0041】そして、このユークリッド距離の値が予め
設定されているしきい値T4以下となる母音があると
き、これが現在のフレームに対応する母音と判定され、
またどの母音に対するユークリッド距離もしきい値T4
を超えているときには、現在のフレームに対する母音が
無いと判定される(ステップST11)。
【0042】次いで、前フレームに対応する母音が存在
し、現在のフレームに対応する母音が無い場合、もしく
は前フレームおよび現在のフレームに対応する母音が存
在するが、その母音が異なるときには、前フレームを母
音の終了点と判定する(ステップST12)。
【0043】そして、この母音終了点判定処理におい
て、母音の終了が検出されていれば(ステップST1
3)、前フレームから遡って、対応する母音が前フレー
ムと異なるフレームがあるかどうかチェックされ、この
フレームが検出されると、このフレームより1フレーム
後から前フレームまでが母音区間と判定される(ステッ
プST14)。
【0044】この後、この母音終了判定処理で決定され
た全区間にわたって、各母音毎に標準パターンと入力フ
レームとの平均最小距離(各母音毎の標準パターン数が
“1”の場合には平均距離)が求められる、この距離が
小さい順に、母音第1候補、母音第2候補というように
母音候補が決定される(ステップST15)。
【0045】そして、この処理が終了したとき、母音区
間情報および各母音候補が辞書探索部8に伝送される
(ステップST16)。
【0046】また、辞書探索部8では、図7のフローチ
ャートに示す如く初期状態の設定が行われて探索の途中
段階の情報を記憶しているメモリが全てリセットされる
とともに、仮説数が零にセットされる(ステップST2
0)。
【0047】この後、前記音響分析部2から送られてき
た音声区間終了情報が読み込まれて(ステップST2
1)、音声区間が終了したかどうかが判定される(ステ
ップST22)。
【0048】そして、音声区間が終了していないと判定
されれば、音響分析部2から送られてきた音響パラメー
タが読み込まれるとともに(ステップST23)、母音
検出部4から送られてきた母音に関する情報が読み込ま
れる(ステップST24)。
【0049】次いで、現在の状態が初期状態である場合
には、上述した読み込み処理で得られた母音に基づいて
辞書・文法格納部7に格納されている辞書木の先頭から
探索が行われ、この探索処理で得られた途中段階の各仮
説について母音の前に存在すべき子音の候補が子音スコ
ア計算部6に渡されて各子音候補毎にHMMを使用した
スコアが計算される。
【0050】また、現在の状態が初期状態でない場合に
は、前の段階で探索された辞書木上のノードから出発し
て、同様の探索と子音のスコア計算とが行われる。
【0051】そして、この探索処理が終了した後、前記
母音検出部4からの母音探索結果によって得られる母音
標準パターンと入力音声との平均距離と、前記子音スコ
ア計算部6の計算結果によって得られる子音のスコアと
に基づいて各仮説に対する途中段階のスコアが計算さ
れ、次に続く探索に備え、探索が終了した時点で辞書木
上のノードが各仮説毎に記憶される。また、探索の結
果、辞書木上の終端ノードに達したときには、メモリ上
の対応する領域にその仮説に関する探索が終了したこと
を示す終端フラグが立てられる(ステップST25)。
【0052】以下、母音検出部4によって得られた母音
第1候補、母音第2候補という順で、各母音候補毎に上
述した処理が行われる。
【0053】この場合、扱う母音の数はいくつでも良い
が、本実施例では、メモリ容量と、探索精度との関係か
ら“3”に設定している。
【0054】さらに、この辞書探索処理および評価処理
では、その他に、母音検出部4で母音でない部分が母音
として検出されてしまう誤りが起こり得るため、これに
対処する処理を行なう。
【0055】この処理では、連続n母音までの挿入に対
処するため、母音検出部4から送られてきた母音情報が
第n+1番目の場合に至るまで、その母音を第1母音と
した探索(辞書木の先頭からの探索)を行なう。また、
この処理で得られた母音によって途中段階の仮説からの
探索を行なう場合には、新たな母音により探索を進めた
仮説を得るだけでなく、n回前の探索における仮説をも
保持する。
【0056】この場合、挿入される母音の数nはいくつ
でも良いが、本実施例では、メモリ容量と、誤り発生頻
度の可能性との関係から“4”に設定している。
【0057】そして、上述した処理によって、それまで
の段階で得られた仮説から、終端フラグが立っていない
ものが除かれた後、スコアの最も高かったものから順
に、認識結果として出力される。
【0058】《実施例の効果》このようにこの実施例に
おいては、音声信号が入力されたとき、この音声信号を
取り込んでデジタル化した後、このデジタル化処理によ
って得られた音声データに基づいて音響パラメータを抽
出するとともに、この音響パラメータに基づいて母音の
認識を行い、さらにこの認識結果に基づいて母音、子音
の順で辞書・文法格納部7を探索しながら、仮説を生成
して各仮説毎に子音のスコアを求めた後、これらの各ス
コアに基づいて文字の選択を行って文字列データを生成
するようにしたので、子音に較べて音響的な特徴のみに
基づく認識が比較的容易で、かつカテゴリ数も少ない母
音部分から照合を行なうことができ、この結果に基づい
て仮説数を制限することによって、誤認識の防止と、言
語情報の効率的な利用と、認識処理の並列化に基づく処
理時間の短縮とを達成することができる。
【0059】この結果、この実施例によれば、今までに
ない高精度な音声認識を行なうことが期待できる。その
一例として、大相撲放送番組を想定してアナウンサーが
通常の発声速度で発声した94文節、計38文を図4に
示す文節間接続ネットワークを用いて文単位で認識する
実験を行なった。
【0060】このときの条件として、母音標準パターン
および子音HMMはATR(株式会社、国際電気通信基
礎研究所)が販売している音声データベースのうち、男
性6名分のものを用いて作成した。この場合、評価用音
声を発声した話者がこれら6名のうちに含まれていない
ため、音声認識としては、不特定話者認識となる。ま
た、認識に用いた辞書木は200語からなる各品詞毎の
辞書から文節間の接続を用いて作成した。
【0061】このとき、認識実験結果として、文節認識
率98%、文認識率95%を得ることができた。また、
第2の候補までに正解が含まれている割合として100
%の値を得ることができた。
【0062】この結果は、現在いくつかの研究機関で行
われている不特定連続音声認識の中でも、極めて優れた
値であり、これよって本発明の効果を実証することがで
きた。
【0063】また、上述した実施例においては、文節音
声認識に対する場合を例にとって本発明を説明したが、
文音声認識を行なう場合には、図4に示すような文節間
の接続を規定するネットワークや接続表あるいは文法な
どを用意し、辞書探索部8のステップST25で行われ
る辞書探索処理や評価処理で終端フラグが立ったとき、
この文節間の接続を考慮に入れながら、引き続き辞書木
の先頭ノードから探索が行われる。
【0064】また、母音標準パターンと、子音HMMを
特定の話者のデータから作成するか、大量の話者のデー
タから作成するかによって、特定話者認識や不特定話者
認識が行なえることは言うまでもない。
【0065】さらに、上述した実施例では、母音と子音
の順序が入れ替った木構造により言語的情報を表現した
が、本発明は任意の情報構造を用いて言語的情報を表現
した場合にも適用可能であることは言うまでもない。
【0066】
【発明の効果】以上説明したように本発明によれば、子
音に較べて音響的な特徴のみに基づく認識が比較的容易
で、かつカテゴリ数も少ない母音部分から照合を行な
い、この結果に基づいて仮説数を制限することによっ
て、誤認識の防止と、言語情報の効率的な利用と、認識
処理の並列化に基づく処理時間の短縮とを達成すること
ができる。
【図面の簡単な説明】
【図1】本発明による音声認識方式の一実施例を適用し
た音声認識システムの一例を示すブロック図である。
【図2】図1に示す辞書・文法格納部に格納される辞書
木の原形例を示す模式図である。
【図3】図1に示す辞書・文法格納部に格納される実際
の辞書木の一例を示す模式図である。
【図4】図1に示す辞書・文法格納部に格納される文節
間の接続規定用のネットワークの一例を示す模式図であ
る。
【図5】図1に示す音響分析部の詳細な動作例を示すフ
ローチャートである。
【図6】図1に示す母音検出部の詳細な動作例を示すフ
ローチャートである。
【図7】図1に示す辞書探索部の詳細な動作例を示すフ
ローチャートである。
【符号の説明】
2 音響分析部 3 母音標準パターン格納部 4 母音検出部 5 子音HMM格納部 6 子音スコア計算部 7 辞書・文法格納部 8 辞書探索部

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 入力された音声を言語的拘束を用いて認
    識する音声認識方式において、 入力音声の先頭から音響分析を行ないながら、逐次得ら
    れる母音の情報に基づいて適宜の情報構造により表現さ
    れた言語的情報を探索して入力音声を認識することを特
    徴とする音声認識方式。
JP5052072A 1993-03-12 1993-03-12 音声認識方式 Pending JPH06266387A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5052072A JPH06266387A (ja) 1993-03-12 1993-03-12 音声認識方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5052072A JPH06266387A (ja) 1993-03-12 1993-03-12 音声認識方式

Publications (1)

Publication Number Publication Date
JPH06266387A true JPH06266387A (ja) 1994-09-22

Family

ID=12904620

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5052072A Pending JPH06266387A (ja) 1993-03-12 1993-03-12 音声認識方式

Country Status (1)

Country Link
JP (1) JPH06266387A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8175868B2 (en) 2005-10-20 2012-05-08 Nec Corporation Voice judging system, voice judging method and program for voice judgment

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8175868B2 (en) 2005-10-20 2012-05-08 Nec Corporation Voice judging system, voice judging method and program for voice judgment

Similar Documents

Publication Publication Date Title
KR100486733B1 (ko) 음소 결합정보를 이용한 연속 음성인식방법 및 장치
US7162423B2 (en) Method and apparatus for generating and displaying N-Best alternatives in a speech recognition system
Chang et al. Large vocabulary Mandarin speech recognition with different approaches in modeling tones
JPH05265483A (ja) 複数の出力を与える音声認識法
US6502072B2 (en) Two-tier noise rejection in speech recognition
GuoDong et al. Interpolation of n-gram and mutual-information based trigger pair language models for Mandarin speech recognition
JPH0250198A (ja) 音声認識システム
US6963832B2 (en) Meaning token dictionary for automatic speech recognition
JP2005148342A (ja) 音声認識方法、この方法を実施する装置、プログラムおよび記録媒体
JP3444108B2 (ja) 音声認識装置
JP3364631B2 (ja) 統計的言語モデル生成装置及び音声認識装置
Decadt et al. Transcription of out-of-vocabulary words in large vocabulary speech recognition based on phoneme-to-grapheme conversion
Fu et al. A survey on Chinese speech recognition
JP2938865B1 (ja) 音声認識装置
JPH06266387A (ja) 音声認識方式
JPH1097293A (ja) 音声認識用単語辞書作成装置及び連続音声認識装置
WO2020096073A1 (ko) 빅 데이터를 이용한 최적의 언어 모델 생성 방법 및 이를 위한 장치
JP3727436B2 (ja) 音声原稿最適照合装置および方法
JP2008242059A (ja) 音声認識辞書作成装置および音声認識装置
Pandey et al. Fusion of spectral and prosodic information using combined error optimization for keyword spotting
JPH08314490A (ja) ワードスポッティング型音声認識方法と装置
JPH09212190A (ja) 音声認識装置及び文認識装置
JPH08123479A (ja) 連続音声認識装置
JPS63236098A (ja) ラベリングシステム
Wielgat Optimization of the selected parameters in HMM-based Polish speech recognition