JPH08221090A - 音声認識方法 - Google Patents

音声認識方法

Info

Publication number
JPH08221090A
JPH08221090A JP2637995A JP2637995A JPH08221090A JP H08221090 A JPH08221090 A JP H08221090A JP 2637995 A JP2637995 A JP 2637995A JP 2637995 A JP2637995 A JP 2637995A JP H08221090 A JPH08221090 A JP H08221090A
Authority
JP
Japan
Prior art keywords
duration
state
recognition method
history
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2637995A
Other languages
English (en)
Inventor
Takatoshi Sanehiro
貴敏 實廣
Shigeki Sagayama
茂樹 嵯峨山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2637995A priority Critical patent/JPH08221090A/ja
Publication of JPH08221090A publication Critical patent/JPH08221090A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 累積照合スコアの計算量を減らし、記憶量も
比較的小さく、隠れマルコフモデルにまたがった継続時
間長制御をする音声認識方法を提供する。 【構成】 隠れマルコフモデル自身を構成する確率分布
に対応づけられている状態と認識処理の途中情報を保持
して入力の終端において最終的な累積照合スコアがネッ
トワークのどこを通過してきたかを得る節点とより成る
隠れマルコフモデルのネットワークにより認識候補を表
現し、これら状態系列を統合し、認識処理時に隠れマル
コフモデルの照合スコアを各状態で計算し、計算された
累積照合スコアを隣接する状態または節点に伝播して行
く時に隠れマルコフモデルと組み合わせて他の情報をま
とめて伝播させ、各状態または節点からの遷移の時に認
識処理を進める音声認識方法。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、音声認識方法に関
し、特に、隠れマルコフモデルを使用し、Viterbi アル
ゴリズムを使用するフレーム同期で処理する音声認識方
法に関する。
【0002】
【従来の技術】従来、隠れマルコフモデルと組み合わせ
て他の情報をも使用して音声認識候補を表現して音声認
識をする場合、音声認識候補を木構造により広げて行く
仕方を実施してきた(例えば、言語モデルを用いる場
合、T.Kawabata,T.Hanazawa,K.Itoh and K.Shikano:“J
apanese Phonetic Typewriter Using HMM Phone Recogn
ition and Stochastic Phone-Sequence Modeling,”IEI
CE Trans.,E74(7),pp.1783-1787(1991))。しかし、こ
の仕方は、認識候補を隠れマルコフモデルのネットワー
クにより表現し、これら認識候補の状態系列を統合する
ことができるネットワークにおいて音声認識途中で実施
することはできない。また、木構造は、累積照合スコア
の計算が枝の数だけ多くなる問題がある。
【0003】更に、隠れマルコフモデルは一つの状態に
滞留する時間の情報が明確に反映されるものではない。
そのために、隠れマルコフモデルに基づいたフレーム同
期でViterbi アルゴリズムを使用する音声認識方法にお
いては、語彙の制約がない場合に挿入誤りが多く出現す
る。そこで、従来は、隠れマルコフモデルの時間的構造
を補うために、隠れマルコフモデルを構成する状態毎
に、或はモデル単位である音素毎に継続時間長制御を行
っていた。
【0004】
【発明が解決しようとする課題】この発明は、隠れマル
コフモデルによるネットワークを状態と節点により表現
し、このネットワーク上においてViterbi アルゴリズム
により各状態に生じる音声認識候補について認識処理に
必要な項目をすべて累積照合スコアと組にして伝播、処
理することにより、累積照合スコアの計算量を減らし、
記憶量も比較的小さく、隠れマルコフモデルにまたがっ
た継続時間長制御をすることができる音声認識方法を提
供するものである。
【0005】
【課題を解決するための手段】入力信号を特徴パラメー
タの系列に変換し、変換された特徴パラメータ系列につ
いて、1個もしくは複数個の認識候補に対して、隠れマ
ルコフモデルと特徴パラメータ系列とをそれぞれ分析フ
レーム単位で照合処理して、Viterbi アルゴリズムによ
り尤度の高い候補を認識結果とする音声認識方法におい
て、隠れマルコフモデル自身を構成する確率分布に対応
づけられている状態と認識処理の途中情報を保持して入
力の終端において最終的な累積照合スコアがネットワー
クのどこを通過してきたかを得る節点とより成る隠れマ
ルコフモデルのネットワークにより認識候補を表現し、
これら状態系列を統合し、認識処理時に隠れマルコフモ
デルの照合スコアを各状態で計算し、計算された累積照
合スコアを隣接する状態または節点に伝播して行く時に
隠れマルコフモデルと組み合わせて他の情報をまとめて
伝播させ、各状態または節点からの遷移の時に認識処理
を進める音声認識方法を構成した。
【0006】そして、各状態または節点は前々時刻の累
積照合スコアと前時刻の出現確率との間の積を保持し、
現時刻において遷移の計算時に遷移確率との間の積をと
って、前時刻の累積照合スコアを計算し、遷移してくる
経路の中で最大の累積照合スコアを残しておき、現時刻
に対する出現確率を計算し、累積照合スコアとその出現
確率との間の積を保持して、次時刻に使用する操作を繰
り返すことにより累積照合スコアの計算をする音声認識
方法を構成した。
【0007】また、各隠れマルコフモデルを構成する状
態の系列より長い状態系列でネットワークを構成し、認
識処理に必要な項目を伝播させ、この長い状態系列に対
する制御をする音声認識方法を構成した。更に、状態以
上の長さが音素、音節、単語、或は文節である音声認識
方法を構成した。
【0008】ここで、他の情報が状態遷移が生じた時刻
である場合に、これを累積照合スコアと共に伝播し、継
続時間長制御を行う音声認識方法を構成した。また、他
の情報がその状態に達するまでの音素、音節、単語、或
は文節の言語的履歴である場合に、これを累積照合スコ
アと共に伝播し、言語的履歴の連鎖確率を言語的制約と
して利用する音声認識方法を構成した。更に、他の情報
がその状態に達するまでの継続時間長の履歴である場合
に、これを累積照合スコアと共に伝播し、継続時間長の
履歴より現在の継続時間長を予測して継続時間長制御を
する音声認識方法を構成した。
【0009】また、他の情報を状態遷移が生じた時刻お
よびその状態に達するまでの音素、音節、単語、或は文
節の言語的履歴としてこれらの情報を累積照合スコアと
共に伝播し、継続時間長制御を行うと共に言語的履歴の
連鎖確率を言語的制約として利用する音声認識方法を構
成した。更に、他の情報を状態遷移が生じた時刻および
その状態に達するまでの継続時間長の履歴としてこれら
の情報を累積照合スコアと共に伝播し、継続時間長制御
をすると共に継続時間長の履歴より現在の継続時間長を
予測して継続時間長制御をする音声認識方法を構成し
た。
【0010】そして、他の情報をその状態に達するまで
の音素、音節、単語、或は文節の言語的履歴およびその
状態に達するまでの継続時間長の履歴としてこれらの情
報を累積照合スコアと共に伝播し、言語的履歴の連鎖確
率を言語的制約として利用すると共に継続時間長の履歴
より現在の継続時間長を予測して継続時間長制御をする
音声認識方法を構成した。
【0011】また、他の情報を状態遷移が生じた時刻、
その状態に達するまでの音素、音節、単語、或は文節の
言語的履歴およびその状態に達するまでの継続時間長の
履歴としてこれらの情報を累積照合スコアと共に伝播
し、継続時間長制御をすると共に言語的履歴の連鎖確率
を言語的制約として利用し、更に継続時間長の履歴より
現在の継続時間長を予測して継続時間長制御をする音声
認識方法を構成した。
【0012】
【実施例】この発明は、隠れマルコフモデル(「確率モ
デルによる音声認識」、中川 聖一、電子情報通信学会
編(1988)参照)を使用し、Viterbiアルゴリズム
を使用したフレーム同期で処理する音声認識方法に関す
る。そして、ここに言う音声は、楽器音、超音波その他
の音響信号に代表される時系列、或は、手書き文字を構
成する線素に代表される空間的特徴量系列、その他の特
徴パラメータ系列一般を含むものとする。
【0013】この発明の第1の実施例を図1を参照して
説明する。図1はこの発明における隠れマルコフモデル
のネットワークの一例を示す。図1に示される例は、
「平等」「病院」「病人」「描写」の4個の単語から成
るネットワークである。単語を対応する音素系列に変換
し、これら音素系列を更に対応する隠れマルコフモデル
に変換し、隠れマルコフモデルの状態系列のネットワー
クを構成する。図1における白丸は隠れマルコフモデル
自身を構成する状態を表し、黒丸はその状態系列を統合
する節点である。ここで、接点は、音声終端で最大スコ
アを持つ経路を後でたどるために、各時刻(フレーム)
で選択された経路の接続されている方向およびその節点
に到達する前に別の節点を通った時の時刻を各時刻に対
して保持しておく。このために、接点を通過する時刻を
累積照合スコアと同時に伝播させる必要がある。図1の
様に隠れマルコフモデルのネットワークを構成すれば、
例示される4個の単語間の共通する内容の部分「びょ
ー」は統合して累積照合スコアの大きいものだけを計算
すれがよく、計算量を減少することができる。そして、
状態と節点より成るネットワークを構成することによ
り、何れの状態も前の状態或は節点からのリンクを1本
だけ有すればよく、記憶量の比較的少ないネットワーク
を構成することができる。また、各累積照合スコアの遷
移に対応して、各節点にのみ時刻を残しておくことによ
り、音声の終端において認識結果を得ることができる。
【0014】Viterbiアルゴリズムは、状態遷移の際、
遷移してきた累積照合スコアと自己ループの累積照合ス
コアとを比較し、値の大きい方を残すアルゴリズムであ
る。各フレーム毎にこの処理を実施し、音声の終端にお
いては、各節点に残した時刻と接続情報を元に、最終的
なネットワーク上の最大スコアを持つ経路を得ることが
でき、この経路に対応する単語、文その他の出力用に対
応付けたものを認識結果とする。図2は隠れマルコフモ
デルの一部の定義を示す図であるが、この定義から、 Lj(t+1)= max{Li(t)bi(xt)aij,Lj(t)bj(xt)ajj} (1) 但し、Li(t)、Lj(t):時刻(分析フレーム)tにおける
累積照合スコア bi(xt)、bj(xt) :出現確率 aij、ajj :遷移確率 この計算を行う場合、遷移してきた累積照合スコア L
j(t+1)を計算するのに、度々、前の状態における出現確
率 bi(xt)、bj(xt)を得る必要がある。このオーバーヘ
ッドは、各状態に保持する値を工夫することにより回避
することができる。
【0015】ここで、 L* i(t)=Li(t)bi(xt) とおく
と、 Lj(t+1)= max{L* i(t)aij,L* j(t)ajj} (2) L* j(t+1)= max{L* i(t)aij,L* j(t)ajj}bj(t+1) (3) 即ち、図3に示される様に、L* j(t+1)を各状態に保持す
ることにすれば、遷移してきた累積照合スコアの大きい
方に、その状態の出現確率を乗算すればよいことにな
る。これにより、各状態の出現確率計算の度毎に前の状
態を見に行く必要はなくなる。但し、t=0 のとき L* 0
(0)=1、L* j(0)=0 (j≠0)であり、また、t=T、終了
時刻のとき、終端の節点Nについて遷移してくる累積尤
度を計算する必要がある。
【0016】 LN(T) = L* N-1aN(N-1) (4) この様に、効率的な累積照合スコアの計算を実現するこ
とができる。この発明の第2の実施例を図4を参照して
説明する。第2の実施例は、隠れマルコフモデルによる
標準パターンの他に情報として状態遷移の生じた時刻を
も使用し、継続時間長制御を行う例である。累積照合ス
コアと継続時間長制御を行う際に使用される状態遷移時
刻とを組にして伝播する。白丸は隠れマルコフモデルの
状態を表し、この状態を時間的に並べたものについて認
識処理の説明をする。状態間を結合する太い矢印はVite
rbiアルゴリズムにより生じる1つの経路を示す。破線
の間が継続時間長制御の単位、例えば音節、単語に対応
している。各時刻、各状態について隠れマルコフモデル
の累積照合スコアを持ち、更に継続時間長単位で遷移し
てきた時刻を保持し、これを伝播して行くと考える。先
ず、時刻t0 に前の継続時間長の単位から累積照合スコ
アが遷移してきたものとする。この時の累積照合スコア
P(t0) と共に遷移時刻t0を記憶する。次の時刻t1
時、この経路は同じ状態に留まり、累積照合スコアは P
(t1) に更新されるが、時刻はそのままt0 を保持す
る。これを継続時間長単位の最終状態まで続ける。図4
の経路は、時刻tn において継続時間長単位間の遷移が
生じるが、ここで、先ず、継続時間長γ=tn−t0を求
める。このγに対して継続時間長の出現確率を求め、こ
れを累積照合スコア P(tn) に反映させる。この時、経
路に保持する時刻をtn に更新し、以後、同様に伝播し
て行く。この様にして累積照合スコアと共に遷移時刻を
組にして伝播することにより、状態より長い系列を単位
とする継続時間長制御をすることができる。
【0017】図5は、この発明による音声認識装置のブ
ロック図である。1は入力端子、2は特徴抽出部であ
る。特徴抽出部2は、入力端子1から入力される音声を
ディジタル信号に変換し、更に、これを1フレーム例え
ば10ms毎に特徴パラメータに変換してその特徴量を
出力する。この特徴パラメータとしては、例えば、LP
Cケプストラム係数を採用することができる。
【0018】3はネットワーク探索部である。このネッ
トワーク探索部3においては、各フレームにおいて、先
ず、累積照合スコア計算部4から累積照合スコアを得
る。次いで、Viterbiアルゴリズムに基づいて、幾つか
の経路が交わる状態或は節点において累積照合スコアが
最大になる経路のみを残す。節点においては、選択され
た経路を後でたどることができる様に、前の節点からの
時刻とその節点に対する接続方向の情報を残す。これら
を音声の終端に達するまでフレーム毎に繰り返し、音声
終端においてはネットワーク上の最大累積照合スコアを
持つ経路を選択して認識結果を得る。
【0019】6は音素モデルであり、学習用音声データ
ベースから上述の特徴パラメータを使用して隠れマルコ
フモデルにより事前に作成しておく。5は音素照合部で
あり、特徴抽出部2の出力する音素の特徴量を音素モデ
ル6の対応する音素の特徴量と照合して照合スコアを出
力するところである。7は継続時間長照合部であり、特
徴量である継続時間長を対応する継続時間長モデル8の
特徴量により照合する。継続時間長照合部7が必要とす
る特徴量である継続時間長は、ネットワーク探索部3に
おいて累積照合スコアの計算時にネットワークの継続時
間長単位の最終状態毎に得られる。音節単位の継続時間
長であれば音節の最後の状態毎に得られる。
【0020】8は継続時間長モデルであり、継続時間長
単位毎に、例えば音節毎に継続時間長の分布をラベル付
けされた学習データから推定して事前に作成しておく。
ネットワーク探索部3において音声認識時に使用するネ
ットワークとしては、語彙を仮定しない場合は、音節単
位にネットワークを形成した音節ネットワークを使用す
る。促音および撥音に関して日本語に存在する並び、例
えば、促音は主に無声子音に接続するという様な条件を
満足する様に接続する。語彙を仮定した場合は、語彙に
依存したネットワークを作成し、これを使用する。ま
た、ネットワーク中の各状態に隠れマルコフモデルの状
態を、各音節の最終状態から次の音節への遷移に音節継
続時間長の分布を、それぞれ対応させておく。
【0021】ここで、この発明の音声認識装置は、認識
時には音声入力開始からネットワーク探索部3において
累積照合スコアおよび必要な情報の伝播を開始する。音
節ネットワーク上の前時刻(フレーム)までに累積照合
スコアが伝播してきた各状態において累積照合スコアを
計算する。この時、累積照合スコア計算部4へ照合要求
を出し、対応する音素の照合を音素モデル6を使用して
音素照合部5において照合する。即ち、特徴抽出部2に
音声入力が開始されると、特徴抽出部2は入力される音
声をディジタル信号に変換し、更に、これを1フレー
ム、例えば10ms毎に特徴パラメータに変換してその
特徴量を音素照合部5に出力する。音素照合部5におい
ては、特徴抽出部2の出力する音素の特徴量を音素モデ
ル6の対応する音素の特徴量と照合し、照合スコアを累
積照合スコア計算部4に出力する。累積照合スコア計算
部4は音素照合部5から出力された照合スコアをネット
ワーク探索部3に送り込む。ネットワーク探索部3にお
いては、Viterbiアルゴリズムに基づいて、図1に示さ
れる様な幾つかの経路が交わる状態或は節点において累
積照合スコアが最大になる経路のみを残す操作をする。
ここで、節点においては、選択された経路を後でたどる
ことができる様に、前の節点からの時刻とその節点に対
する接続方向の情報を残す。これらの操作を音声終端に
達するまでフレーム毎に繰り返し、音声終端においては
ネットワーク上の最大累積照合スコアを持つ経路を選択
して認識結果とする。
【0022】一方、音素照合部5における音素照合に対
応して、継続時間長照合部7において特徴量である継続
時間長を対応する継続時間長モデル8により照合し、採
用した継続時間長単位からの遷移に対する計算をする。
ところで、この特徴量である継続時間長は、ネットワー
ク探索部3において累積照合スコアの計算時にネットワ
ークの継続時間長単位の最終状態毎に得られる。音節単
位の継続時間長であれば音節の最後の状態毎に得られ
る。継続時間長を計測するために、図4により図示説明
される様に、次の音節へ遷移する時刻を保持し、累積照
合スコアとともに伝播させる。継続時間長単位の最終状
態から遷移するときに、現時刻tn と伝播してきた時刻
0 との差γ=tn −t0 をとり、これが継続時間長と
なる。
【0023】ここで、継続時間長モデル8は、継続時間
長単位毎に、例えば音節毎に継続時間長の分布をラベル
付けされた学習データから推定して事前に作成しておい
たものであり、認識時にはこの分布を確率密度関数とし
て使用し、音節の最終状態から次の音節の初期状態へ遷
移する時に音節継続時間長に対する確率を算出し、これ
を照合スコアとして累積照合スコア計算部4に返す。
【0024】音素照合部5および継続時間長照合部7そ
れぞれの照合スコアを累積照合スコア計算部4に返し、
ここにおいて照合スコアに重みづけその他の処理を施し
て累積照合スコアとした後、これをネットワーク探索部
3に返す。以上の処理を入力音声の終端まで繰り返した
後、ネットワークの終端において得られる最適なパスを
たどり、これを認識結果とする。
【0025】この様に、累積照合スコアと状態遷移時刻
とを組にして伝播させることにより状態より長い系列を
単位とする継続時間長制御をすることができる。この単
位として音節を使用することにより、より頑健な継続時
間長制御をすることができ、語彙の制約がない場合の挿
入誤りを効果的に防止することができる。 実施例3 隠れマルコフモデルによる標準パターンの他に、情報と
してそれまでの言語的履歴、例えば、現状態に到達する
までの音節の履歴を使用し、確率的な言語モデル、例え
ば音節連鎖確率により言語的制約をする場合について説
明する。実施例1における継続時間長制御のための遷移
時刻の伝播と同様に、各状態毎に生じる経路に対して累
積照合スコアと共に履歴を保持し、伝播する。言語的な
単位、例えば音節の終端において言語モデルによる尤度
を計算して累積照合スコアに反映した後、言語的履歴を
更新し、伝播する。これにより隠れマルコフモデルと確
率的言語モデルを同時に使用することができる。
【0026】実施例4 隠れマルコフモデルによる標準パターンの他に、情報と
してそれまでの継続時間長の履歴を使用し、現在の継続
時間長を予測して継続時間長制御をする場合について説
明する。実施例1における継続時間長制御のための時刻
の伝播と同様に各状態毎に生じる経路に対して累積照合
スコアと共に継続時間長の履歴を保持してこれを伝播す
る。継続時間長単位、例えば音節の終端において継続時
間長の計算と尤度を計算し、累積照合スコアに反映した
後、継続時間長の履歴を更新し、伝播する。これによ
り、隠れマルコフモデルと予測的な継続時間長制御をす
ることができる。
【0027】以上の通り、この発明は、隠れマルコフモ
デルによるネットワークを状態と節点により表現し、こ
のネットワーク上においてViterbi アルゴリズムにより
各状態に生じる音声認識候補について認識処理に必要な
項目をすべて累積照合スコアと組にして伝播、処理する
ことにより、累積照合スコアの計算量を減らし、記憶量
も比較的小さく、隠れマルコフモデルにまたがった継続
時間長制御をすることができる音声認識方法を構成する
ことができる。
【0028】そして、音声認識時に各状態に生じる累積
照合スコアそれぞれに継続時間長の単位により状態遷移
が起こった時の時刻を保持しておき、これを累積照合ス
コアと組にして伝播させて行くことにより隠れマルコフ
モデルにまたがった継続時間長制御をすることができ
る。次の継続時間長の単位からの遷移の時に、その単位
に留まった継続時間長を計算し、事前に用意した継続時
間長分布に対する尤度を得てこれを累積照合スコアに含
めることにより、継続時間長制御をすることができる。
これにより、日本語は音節単位でほぼ一定のリズムを持
つという特性を利用し、より頑健性のある音節単位の継
続時間長制御を行なって認識精度を改善することができ
る。同様に、言語の連鎖確率或は継続時間長を予測的に
使用する場合においても利用できる。
【0029】
【発明の効果】以上の通りであって、この発明は、隠れ
マルコフモデルのネットワークを状態と節点により表現
し、累積照合スコアと共に認識処理に必要な他の項目を
伝播させることにより、比較的に小さい記憶容量で認識
装置を構成することができると共に、累積照合スコアを
効率よく計算することができ、更に隠れマルコフモデル
を構成する状態の単位より長い状態系列の制御をする音
声認識方法を構成することができる。
【図面の簡単な説明】
【図1】ネットワークの実施例を説明する図。
【図2】隠れマルコフモデルの一部の定義を説明する
図。
【図3】状態、節点を使用するネットワークの効率的計
算の仕方を説明図。
【図4】継続時間長制御を用いた場合の処理方法の概念
を示す図。
【図5】音声認識装置実施例を示すブロック図。

Claims (11)

    【特許請求の範囲】
  1. 【請求項1】 入力信号を特徴パラメータの系列に変換
    し、変換された特徴パラメータ系列について、1個もし
    くは複数個の認識候補に対して、隠れマルコフモデルと
    特徴パラメータ系列とをそれぞれ分析フレーム単位で照
    合処理して、Viterbi アルゴリズムにより尤度の高い候
    補を認識結果とする音声認識方法において、 隠れマルコフモデル自身を構成する確率分布に対応づけ
    られている状態と認識処理の途中情報を保持して入力の
    終端において最終的な累積照合スコアがネットワークの
    どこを通過してきたかを得る節点とより成る隠れマルコ
    フモデルのネットワークにより認識候補を表現し、これ
    ら状態系列を統合し、認識処理時に隠れマルコフモデル
    の照合スコアを各状態で計算し、計算された累積照合ス
    コアを隣接する状態または節点に伝播して行く時に隠れ
    マルコフモデルと組み合わせて他の情報をまとめて伝播
    させ、各状態または節点からの遷移の時に認識処理を進
    めることを特徴とする音声認識方法。
  2. 【請求項2】 請求項1に記載される音声認識方法おい
    て、各状態または節点は前々時刻の累積照合スコアと前
    時刻の出現確率との間の積を保持し、現時刻において遷
    移の計算時に遷移確率との間の積をとって、前時刻の累
    積照合スコアを計算し、遷移してくる経路の中で最大の
    累積照合スコアを残しておき、現時刻に対する出現確率
    を計算し、累積照合スコアとその出現確率との間の積を
    保持して、次時刻に使用する操作を繰り返すことにより
    累積照合スコアの計算をするこを特徴とする音声認識方
    法。
  3. 【請求項3】 請求項1に記載される音声認識方法おい
    て、各隠れマルコフモデルを構成する状態の系列より長
    い状態系列でネットワークを構成し、認識処理に必要な
    項目を伝播させ、この長い状態系列に対する制御をする
    ことを特徴とする音声認識方法。
  4. 【請求項4】 請求項3に記載される音声認識方法おい
    て、状態以上の長さが音素、音節、単語、或は文節であ
    ることを特徴とする音声認識方法。
  5. 【請求項5】 請求項4に記載される音声認識方法おい
    て、他の情報が状態遷移が生じた時刻である場合に、こ
    れを累積照合スコアと共に伝播し、継続時間長制御を行
    うことを特徴とする音声認識方法。
  6. 【請求項6】 請求項4に記載される音声認識方法おい
    て、他の情報がその状態に達するまでの音素、音節、単
    語、或は文節の言語的履歴である場合に、これを累積照
    合スコアと共に伝播し、言語的履歴の連鎖確率を言語的
    制約として利用することを特徴とする音声認識方法。
  7. 【請求項7】 請求項4に記載される音声認識方法おい
    て、他の情報がその状態に達するまでの継続時間長の履
    歴である場合に、これを累積照合スコアと共に伝播し、
    継続時間長の履歴より現在の継続時間長を予測して継続
    時間長制御をすることを特徴とする音声認識方法。
  8. 【請求項8】 請求項4に記載される音声認識方法おい
    て、他の情報を状態遷移が生じた時刻およびその状態に
    達するまでの音素、音節、単語、或は文節の言語的履歴
    としてこれらの情報を累積照合スコアと共に伝播し、継
    続時間長制御を行うと共に言語的履歴の連鎖確率を言語
    的制約として利用することを特徴とする音声認識方法。
  9. 【請求項9】 請求項4に記載される音声認識方法おい
    て、他の情報を状態遷移が生じた時刻およびその状態に
    達するまでの継続時間長の履歴としてこれらの情報を累
    積照合スコアと共に伝播し、継続時間長制御をすると共
    に継続時間長の履歴より現在の継続時間長を予測して継
    続時間長制御をすることを特徴とする音声認識方法。
  10. 【請求項10】 請求項4に記載される音声認識方法お
    いて、他の情報をその状態に達するまでの音素、音節、
    単語、或は文節の言語的履歴およびその状態に達するま
    での継続時間長の履歴としてこれらの情報を累積照合ス
    コアと共に伝播し、言語的履歴の連鎖確率を言語的制約
    として利用すると共に継続時間長の履歴より現在の継続
    時間長を予測して継続時間長制御をすることを特徴とす
    る音声認識方法。
  11. 【請求項11】 請求項4に記載される音声認識方法お
    いて、他の情報を状態遷移が生じた時刻、その状態に達
    するまでの音素、音節、単語、或は文節の言語的履歴お
    よびその状態に達するまでの継続時間長の履歴としてこ
    れらの情報を累積照合スコアと共に伝播し、継続時間長
    制御をすると共に言語的履歴の連鎖確率を言語的制約と
    して利用し、更に継続時間長の履歴より現在の継続時間
    長を予測して継続時間長制御をすることを特徴とする音
    声認識方法。
JP2637995A 1995-02-15 1995-02-15 音声認識方法 Pending JPH08221090A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2637995A JPH08221090A (ja) 1995-02-15 1995-02-15 音声認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2637995A JPH08221090A (ja) 1995-02-15 1995-02-15 音声認識方法

Publications (1)

Publication Number Publication Date
JPH08221090A true JPH08221090A (ja) 1996-08-30

Family

ID=12191896

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2637995A Pending JPH08221090A (ja) 1995-02-15 1995-02-15 音声認識方法

Country Status (1)

Country Link
JP (1) JPH08221090A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100415217B1 (ko) * 1998-09-09 2004-01-16 아사히 가세이 가부시키가이샤 음성인식 장치
KR100446289B1 (ko) * 2000-10-13 2004-09-01 삼성전자주식회사 역 히든 마르코브 모델(ihmm)을 이용한 정보 탐색방법및 장치

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100415217B1 (ko) * 1998-09-09 2004-01-16 아사히 가세이 가부시키가이샤 음성인식 장치
KR100446289B1 (ko) * 2000-10-13 2004-09-01 삼성전자주식회사 역 히든 마르코브 모델(ihmm)을 이용한 정보 탐색방법및 장치

Similar Documents

Publication Publication Date Title
US5515475A (en) Speech recognition method using a two-pass search
CN111145729B (zh) 语音识别模型训练方法、系统、移动终端及存储介质
JPH0372998B2 (ja)
EP1209659B1 (en) Method and apparatus for text input utilizing speech recognition
JP2019159654A (ja) 時系列情報の学習システム、方法およびニューラルネットワークモデル
US11450320B2 (en) Dialogue system, dialogue processing method and electronic apparatus
JP3948260B2 (ja) テキスト入力方法及びその装置
JP2531227B2 (ja) 音声認識装置
KR100848148B1 (ko) 음절 단위의 음성 인식 장치, 음절 단위의 음성 인식을이용한 문자 입력 장치, 그 방법 및 기록 매체
JPH08221090A (ja) 音声認識方法
JPH0667698A (ja) 音声認識装置
JP2982689B2 (ja) 情報量基準を用いた標準パターン作成方式
JP3440840B2 (ja) 音声認識方法及びその装置
Konig et al. Supervised and unsupervised clustering of the speaker space for connectionist speech recognition
JP3532248B2 (ja) 学習音声パタンモデル使用音声認識装置
JP3535688B2 (ja) 音声認識方法
US7818172B2 (en) Voice recognition method and system based on the contexual modeling of voice units
JPH11311994A (ja) 情報処理装置および方法、並びに提供媒体
JP3368989B2 (ja) 音声認識方法
JP3873418B2 (ja) 音声スポッティング装置
JP2003022093A (ja) 音声認識方法および音声認識装置ならびに音声認識プログラム
JP2003022091A (ja) 音声認識方法および音声認識装置ならびに音声認識プログラム
JP3369121B2 (ja) 音声認識方法および音声認識装置
CN114038462A (zh) 一种语音业务处理方法、电子设备和计算机可读存储介质
Kai et al. Comparison of continuous speech recognition systems with unknown‐word processing for speech disfluencies