JP3533773B2 - 時系列パターン認識処理におけるリジェクト方法およびそれを実装した時系列パターン認識装置 - Google Patents

時系列パターン認識処理におけるリジェクト方法およびそれを実装した時系列パターン認識装置

Info

Publication number
JP3533773B2
JP3533773B2 JP21567495A JP21567495A JP3533773B2 JP 3533773 B2 JP3533773 B2 JP 3533773B2 JP 21567495 A JP21567495 A JP 21567495A JP 21567495 A JP21567495 A JP 21567495A JP 3533773 B2 JP3533773 B2 JP 3533773B2
Authority
JP
Japan
Prior art keywords
state
probability
network
voice
hmm
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP21567495A
Other languages
English (en)
Other versions
JPH0962292A (ja
Inventor
俊之 小高
明雄 天野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP21567495A priority Critical patent/JP3533773B2/ja
Publication of JPH0962292A publication Critical patent/JPH0962292A/ja
Application granted granted Critical
Publication of JP3533773B2 publication Critical patent/JP3533773B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、時系列パターン認識装
置に係り、特に、認識対象外のパターンが入力された場
合にそれを検出することができるリジェクト方法および
それを実装した時系列パターン認識装置に関するもので
ある。
【0002】なお、リジェクト方法あるいはリジェクシ
ョンとは、認識処理が「認識対象外データの入力」ある
いは「(確度の高い)認識結果の該当なし」等を認識結
果として出力する機能である。
【0003】
【従来の技術】一般に認識処理は、認識対象として予め
与えられている基準データのうち、入力データに一番類
似している基準データを認識結果として出力する。
【0004】音声、音楽、筆記文字、手話、ジェスチ
ャ、動画像、等は時系列パターンに変換し、これを例え
ば統計的な手法であるHMM(Hidden Markov Model)
を用いて、認識できる。これらの認識技術を様々な応用
システムに組み込み実用化するにあたっては、リジェク
ションが必須の機能である。なぜならば、例えば音声認
識応用システムの場合、利用者の発声内容を誤認識した
結果でシステムが誤動作を起こすよりも、リジェクショ
ンを組み込み、利用者に再発声を促すような仕組みを持
たせた方が使い勝手が良くなる。
【0005】リジェクションの実現方法として、確率値
に対して予め絶対的なしきい値を設けてリジェクション
を行うことが考えられる。しかし、認識結果が同じで
も、入力データの生成環境が異なればHMMで得られる
確率値自身も変動するので、絶対的なしきい値の設定は
困難である。
【0006】これに対して、確率値に相対的なしきい値
を設定するリジェクションがある。音声認識における例
としては、”渡辺他:音節認識を用いたゆう度補正によ
る未知語発話のリジェクション、電子情報通信学会論文
誌、Vol.J75−DーII、No.12、pp.2
002−2009”に示される方法がある。この方法
は、アプリケーションに関する認識対象の単語あるいは
文を表す第1のHMMネットワーク(標準パターンに相
当する)の照合を行い、さらにこの第1のネットワーク
とは別に、音節の並びに制約のない音節列を表す第2の
HMMネットワークに対する照合(音節タイプライタと
も言う)も行う。ここで、第2のHMMネットワーク照
合結果の確率値を相対的に参照することでリジェクショ
ンを実現する。
【0007】
【発明が解決しようとする課題】上記のような従来の時
系列パターン認識処理におけるリジェクト方法では、第
2のHMMネットワークの照合処理に伴う処理量および
処理に必要な記憶容量が増加してしまうという課題があ
った。計算量が増えれば、応答速度が遅くなる問題が生
じる。また、計算機資源が限られた環境では使用する記
憶容量をできる限り節約する必要がある。例えば携帯端
末の入力手段の1つとして音声認識等の応用を考えた場
合には、同レベルの機能が消費電力の観点からも計算量
や記憶容量をできる限り少なくすることが要求される。
【0008】本発明の目的は、オートマトン等を含む確
率モデルに基づく時系列パターンの認識処理において、
処理量及び記憶容量を増加させないリジェクト方法を提
供することにある。特に、オートマトンの一種であるH
MMを用いたリジェクト方法を提供する。
【0009】本発明の他の目的は、認識対象を表すHM
Mネットワークの照合処理以外に、処理量および記憶容
量を増加させないリジェクト方法およびそのリジェクト
方法を実装した時系列パターン認識装置を提供すること
にある。特に、認識対象外の音や音声入力、あるいは一
部が欠落した音声(無声化音声)の誤入力による誤動作
を防ぐリジェクト方法およびそのリジェクト方法を実装
した音声認識装置を提供する。
【0010】
【課題を解決するための手段】上記の目的を達成するた
めに本発明では、時系列入力パターンに対するHMMネ
ットワーク上の各状態の確率計算を終了した時点で、認
識対象を表すHMMネットワークで終端となりうる状態
のうち最大確率を持つ状態から得られる最適パスと、認
識対象を表すHMMネットワークで全状態のうち最大確
率を持つ状態を求め、該HMMネットワークの全状態の
うち最大確率を持つ状態が前記最適パス上の状態でない
場合にリジェクションと判定することで、認識対象外の
パターン入力を検出し、誤動作を防ぐリジェクト方法、
およびそのリジェクト方法を実装した時系列パターン認
識装置が提供される。
【0011】具体的な本発明の構成では、オートマトン
等を含む確率モデルに基づく時系列パターン認識処理に
おいて、時系列入力パターンに対する確率モデル上の各
状態の確率計算を終了した時点で、認識対象を表す確率
モデルで終端となりうる状態のうち最大確率を持つ状態
から得られる最適パスと、認識対象を表す確率モデルで
全状態のうち最大確率を持つ状態を求め、前記全状態の
うち最大確率を持つ状態が前記最適パス上の状態でない
場合にリジェクションと判定する。
【0012】また、本発明の他の構成ではオートマトン
等を含む確率モデルに基づく時系列パターン認識処理に
おいて、時系列入力パターンに対する確率モデル上の各
状態の確率計算を終了した時点で、認識対象を表す確率
モデルで終端となりうる状態のうち最大確率を持つ状態
と、認識対象を表す確率モデルで全状態のうち最大確率
を持つ状態を求め、前記2つの最大確率を持つ状態の確
率値を比較し、確率値の差が予め定めたしきい値より大
きい場合にリジェクションと判定する。
【0013】HMMを利用する際の具体的な構成では、
HMMに基づく時系列パターン認識処理において、時系
列入力パターンに対するHMMネットワーク上の各状態
の確率計算を終了した時点で、認識対象を表すHMMネ
ットワークで終端となりうる状態のうち最大確率を持つ
状態から得られる最適パスと、認識対象を表すHMMネ
ットワークで全状態のうち最大確率を持つ状態を求め、
前記全状態のうち最大確率を持つ状態が前記最適パス上
の状態でない場合にリジェクションと判定する。
【0014】HMMを利用する際の具体的な他の構成で
は、HMMに基づく時系列パターン認識処理において、
時系列入力パターンに対するHMMネットワーク上の各
状態の確率計算を終了した時点で、認識対象を表すHM
Mネットワークで終端となりうる状態のうち最大確率を
持つ状態と、認識対象を表すHMMネットワークで全状
態のうち最大確率を持つ状態を求め、前記2つの最大確
率を持つ状態の確率値を比較し、確率値の差が予め定め
たしきい値より大きい場合にリジェクションと判定す
る。
【0015】本発明の音声認識装置は、音声を電気信号
として取り込む音声入力手段と、該入力音声の特徴を時
系列パターンに変換して出力する音声分析手段と、認識
対象となる音声パターンを表すHMMネットワークを保
持する記憶手段と、該記憶手段に記憶されているHMM
ネットワークと前記時系列パターンとを照合してHMM
ネットワーク上の各状態の確率を計算する照合手段と、
前記HMMネットワークで終端となりうる状態のうち最
大確率を持つ状態から得られる最適パスを求める最適パ
ス算出手段と、前記HMMネットワークで全状態のうち
最大確率を持つ状態を求める最大尤度算出手段と、上記
最大確率を持つ状態が上記最適パス上の状態であるか否
かを判定し、上記最適パス上にない場合には「該当無
し」との認識結果を出力する判定手段を有する。
【0016】この判定手段は、上記最適パス確率を求め
て上記最大確率と比較し、該比較結果が所定の閾値より
大きい場合には「該当無し」との認識結果を出力する判
定手段としてもよい。
【0017】
【作用】本発明によれば、認識対象を表すHMMネット
ワークの照合処理のみで、認識対象外パターンの検出が
可能となるので、処理量および記憶容量をほとんど増加
させることなくリジェクションを実現できる。
【0018】
【実施例】以下、図を用いて本発明の実施例を説明す
る。なお、HMMによるパターン認識の詳細な説明は、
例えば”中川聖一:確率モデルによる音声認識、電子情
報通信学会、1988”等にあり、ここでは詳細は述べ
ない。また、本発明ではHMM等の認識単位モデルの種
類を限定しない。
【0019】図1は、本発明の処理手順の一実施例を示
すフローチャートである。図2は、HMMネットワーク
の一例を示す図である。
【0020】図1のフローチャートに基づいて本発明の
処理手順を説明する。まず、入力されるパターンに対し
て、HMMネットワーク上の確率を計算する(100
1)。入力パターンは時系列パターンで、例えばアルフ
ァベット等のシンボル列で表すと、「aaaabccc
cdd」のような時系列パターンになる。初期設定で
は、始端の状態(図2でSs)に確率1を与え、その他
の状態は確率0とする。その後は単位時間毎に、確率を
持つ状態(S1)が、アークで繋がれた状態(S2)に遷
移し、かつその時刻の入力シンボルが出現する確率を求
め、後の状態S2の新たな確率とする。最終時点では、
HMMネットワーク上で遷移の伝わった状態がそれぞれ
確率値を持つことになる。通常、この最終時点でHMM
ネットワーク上の終端となり得る状態(図2でSf1、S
f2、Sf3、…)のみの間でその確率の大小を比較し、そ
の中で一番確率の高い状態が求められ、そこに至ったH
MMネットワーク上のパスが認識結果の候補として選択
される(1002)。図2の例では、”ABC”であ
る。ここで求めた状態をSbestとし、選択されたパスを
Rbestとする。本発明では、さらに、HMMネットワー
ク上の全状態の中で一番確率の高い状態を求める(10
03)。ここで得られる状態をSmaxとする。次に状態
SmaxがパスRbest上の状態の1つであるか検査する
(1004)。ここで、もしSmaxがパスRbest上の状
態の1つであれば、Rbestに対応するパターン(”AB
C”)を認識結果として出力し(1005)、Smaxが
パスRbest上の状態でなければ、”該当なし”を認識結
果として出力する(1006)。”該当なし”を出力す
る機能がリジェクションである。
【0021】ここで、RbestとSmaxはそれぞれ同じ確
率を持ったパスあるいは状態が複数個ずつ求められるケ
ースもあり得るが、同様な考え方でSmaxがRbest上の
状態となる組み合わせがある場合その結果を出力し、な
い場合はリジェクションと判定すれば良い。
【0022】入力パターンが認識対象内のデータとして
非常に尤もらしい場合には、照合がうまく行われ、Sbe
stとSmaxは一致するはずである。ただし、認識対象外
の入力の場合は、必ずしもこれらが一致するとは限らな
い。これは、与えられたHMMネットワークの一部分
で、最大確率を持つ状態Smaxに至ったパスから入力さ
れた認識対象外の時系列パターンの認識結果が無理矢理
に近似解として求められることを意味している。HMM
ネットワークが大きければ大きいほど、そのネットワー
クの表現の広さから真の解に近い近似解が得られ易くな
り、認識対象外の入力の検出がしやすくなる。音声認識
装置の場合を例にとると、ネットワークが十分大きけれ
ば、1音節ずつ認識する音節認識した場合と十分近似し
た結果が得られることになる。また、認識対象外入力の
検出の場合と同様の原理で、息、咳、咳払い等の短い雑
音をリジェクトでき、さらに未知語もリジェクトでき
る。また、無声化音声などに対する音声区間検出処理の
ミスを検出できる。
【0023】なお、図1における1003と1004の
処理量は、入力パターンに対するHMMネットワークの
確率計算(1001)に比較すれば無視できるほど小さ
い。また、本方法では面倒なしきい値の設定が不要であ
るという特徴がある。
【0024】図3に、本発明による処理手順の他の実施
例を示す。本実施例は、先の実施例に対して、確率値に
しきい値を設定し、リジェクト判定する点が異なる。
【0025】図3のフローチャートに基づいて本発明の
処理手順を説明する。まず、入力されるパターンに対し
て、HMMネットワーク上の確率を計算する(200
1)。通常、この最終時点でHMMネットワーク上の終
端となり得る状態のみの間でその確率の大小を比較し、
その中で一番確率の高い状態が求められ、そこに至った
HMMネットワーク上のパスが認識結果の候補として選
択される(2002)。ここで求めた状態をSbestと
し、選択されたパスをRbestとする。ここまでは、図1
を使って説明した1つ目の実施例と同じである。さらに
Sbestでの確率をPbestとして保持する(2002)。
次に、HMMネットワーク上の全状態の中で一番高い確
率Pmaxを求める(2003)。次に、PmaxとPbestの
差を入力パターンの長さ(フレーム数Nとする)で割っ
て正規化した値を参照確率値(ΔP)として求める(2
004)。次にΔPと予め設定したしきい値(Pth)を
比較検査する(2005)。ここで、もしΔPがPthよ
りも小さければ、Pbestに対応するパターンを認識結果
として出力し(2006)、ΔPがPthよりも大きけれ
ば、”該当なし”を認識結果として出力する(200
6)。
【0026】図4は、本発明によるパターン認識装置の
構成を示すブロック図である。
【0027】図4において、HMMネットワーク格納手
段102は、認識対象を表現するHMMネットワークを
格納する。本発明では、HMMネットワーク格納手段1
02におけるHMMネットワークの格納方法は限定され
ない。照合手段101は、入力パターンが、前記HMM
のネットワークに表現されている個々のパターンとなる
確率を算出する。最適パス算出手段103は、照合手段
101から得られる確率のうち終端となり得る状態から
得られて、かつその中で最大の確率を求め、その確率を
持つ最適パスを求める。最大尤度状態算出手段104
は、照合手段から得られる全確率の中で最大の確率を求
め、その確率を持つ状態を求める。判定手段105は、
最適パス算出手段103から求められる最適パス上に最
大尤度状態算出手段104から求められる状態が存在し
ているかどうかを判定し、存在する場合は、最適パス算
出手段103から求められる最適パスで表現されるパタ
ーンを認識結果として出力し、存在しない場合は、リジ
ェクションを認識結果として出力する。
【0028】図5は、本発明に係る音声認識装置の一実
施例を示すブロック図である。
【0029】図5において、音声入力手段206は、マ
イクとアナログ−デジタル変換器からなり、空気振動で
ある音声波形を入力とし、一定のサンプリング周期でサ
ンプリングされた振幅値のデータ列を出力する。音声分
析手段207は、音声入力手段206の出力であるデー
タ列を一定時間間隔あるいは一定個数分ずつ分析処理
し、入力されたデータ列の特徴をいくつかのパラメータ
を含む特徴ベクトル列に変換して出力する。ここでの特
徴ベクトル列は、図1に関する説明の中でのシンボル列
に相当する。本発明は、この分析処理のパラメータの種
類を限定しない。例えば、LPCケプストラム係数や短
区間パワー値等を用いることができるが、その他のパラ
メータも含め詳細は”古井:音響・音声工学、近代科学
社、1992”等にある。続いて、HMMネットワーク
格納手段202は、認識対象(文あるいは単語)を表現
するHMMネットワークを格納する。本発明では、HM
Mネットワーク格納手段202におけるHMMネットワ
ークの格納方法は限定されない。照合手段201は、入
力パターンである前記特徴ベクトル列が、前記HMMの
ネットワークに表現されている個々のパターンとなる確
率を算出する。最適パス算出手段203は、照合手段2
01から得られる確率のうち終端となり得る状態から得
られて、かつその中で最大の確率を求め、その確率を持
つ最適パスを求める。最大尤度状態算出手段204は、
照合手段から得られる全確率の中で最大の確率を求め、
その確率を持つ状態を求める。判定手段205は、最適
パス算出手段203から求められる最適パス上に最大尤
度状態算出手段204から求められる状態が存在してい
るかどうかを判定し、存在する場合は、最適パス算出手
段203から求められる最適パスで表現されるパターン
を認識結果として出力し、存在しない場合は、リジェク
ションを認識結果として出力する。判定手段205にお
いては、図1とその説明に示すリジェクト方法を用いれ
ばよい。
【0030】また、判定手段205においては、第3図
に示したように、HMMネットワーク上の終端となりえ
る状態の確率の中で一番確率の高い状態の確率(Pbes
t)とHMMネットワーク上の全状態の中で一番高い確率
とを比較検査し、その差が所定の閾値よりも大きい場合
には「該当無し」を認識結果として出力してもよい。
【0031】
【発明の効果】本発明によれば、処理量および記憶容量
をほとんど増加させることなくリジェクションを実現で
きる効果が得られる。例えば、音声認識に応用した場合
は、息、咳、咳払い等の短い雑音をリジェクトでき、さ
らに未知語もリジェクトできる。また、無声化音声に対
する音声区間検出処理のミスを検出できる効果が得られ
る。したがって、本発明のリジェクション方法を実装し
た応用システムでは、利用者の誤入力や認識処理の誤認
識に起因するシステムの誤動作を防げる。
【0032】なお、本発明によるリジェクションは、H
MMネットワークが大規模になればなるほど任意の入力
パターンを表現でき、効果がでやすくなる。
【0033】
【図面の簡単な説明】
【図1】本発明の処理手順の一例を示すフローチャート
である。
【図2】本発明におけるHMMネットワークの一例を示
すブロック図である。
【図3】本発明の処理手順の他の例を示すフローチャー
トである。
【図4】本発明による時系列パターン認識装置の構成の
一実施例を示すブロック図である。
【図5】本発明による音声認識装置の構成の一実施例を
示すブロック図である。
【符号の説明】
101…照合手段、102…HMMネットワーク格納手
段、103…最適パス算出手段、104…最大尤度状態
算出手段、105…判定手段。
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平9−62290(JP,A) 渡辺, 塚田,音節認識を用いた尤度 補正による未知発話のリジェクション, 電子情報通信学会論文誌 D−II,日 本,1992年12月,Volume J75− D−II,Pages 2002−2009 小高, 天野,音声認識におけるリジ ェクト方式の検討,日本音響学会平成7 年度秋季研究発表会講演論文集,日本, 1995年 9月,3−2−5,Pages 115−116 (58)調査した分野(Int.Cl.7,DB名) G10L 15/00 - 15/28

Claims (6)

    (57)【特許請求の範囲】
  1. 【請求項1】率モデルに基づく時系列パターン認識処
    理において、 時系列入力パターンに対する確率モデル上の各状態の確
    率計算を終了した時点で、 認識対象を表す確率モデルで終端となりうる状態のうち
    最大確率を持つ状態から得られる最適パスと、前記認識
    対象を表す確率モデルで全状態のうち最大確率を持つ状
    態を求め、前記全状態のうち最大確率を持つ状態が前記
    最適パス上の状態でない場合にリジェクションと判定す
    ることを特徴とするリジェクト方法。
  2. 【請求項2】率モデルに基づく時系列パターン認識処
    理において、 時系列入力パターンに対する確率モデル上の各状態の確
    率計算を終了した時点で、認識対象を表す確率モデルで
    終端となりうる状態のうち最大確率を持つ状態と、前記
    認識対象を表す確率モデルで全状態のうち最大確率を持
    つ状態を求め、前記2つの最大確率を持つ状態の確率値
    を比較し、確率値の差が予め定めたしきい値より大きい
    場合にリジェクションと判定することを特徴とするリジ
    ェクト方法。
  3. 【請求項3】HMMに基づく時系列パターン認識処理に
    おいて、時系列入力パターンに対するHMMネットワー
    ク上の各状態の確率計算を終了した時点で、認識対象を
    表すHMMネットワークで終端となりうる状態のうち最
    大確率を持つ状態から得られる最適パスと、前記認識対
    象を表すHMMネットワークで全状態のうち最大確率を
    持つ状態を求め、前記全状態のうち最大確率を持つ状態
    が前記最適パス上の状態でない場合にリジェクションと
    判定することを特徴とするリジェクト方法。
  4. 【請求項4】HMMに基づく時系列パターン認識処理に
    おいて、時系列入力パターンに対するHMMネットワー
    ク上の各状態の確率計算を終了した時点で、認識対象を
    表すHMMネットワークで終端となりうる状態のうち最
    大確率を持つ状態と、前記認識対象を表すHMMネット
    ワークで全状態のうち最大確率を持つ状態を求め、前記
    2つの最大確率を持つ状態の確率値を比較し、確率値の
    差が予め定めたしきい値より大きい場合にリジェクショ
    ンと判定することを特徴とするリジェクト方法。
  5. 【請求項5】音声を電気信号として取り込む音声入力手
    段と、 該入力音声の特徴を時系列パターンに変換して出力する
    音声分析手段と、 認識対象となる音声パターンを表すHMMネットワーク
    を保持する記憶手段と、該記憶手段に記憶されているH
    MMネットワークと前記時系列パターンとを照合してH
    MMネットワーク上の各状態の確率を計算する照合手段
    と、 前記HMMネットワークで終端となりうる状態のうち最
    大確率を持つ状態から得られる最適パスを求める最適パ
    ス算出手段と、 前記HMMネットワークで全状態のうち最大確率を持つ
    状態を求める最大尤度算出手段と、上記最大確率を持つ
    状態が上記最適パス上の状態であるか否かを判定し、上
    記最適パス上にない場合には「該当無し」との認識結果
    を出力する判定手段を有することを特徴とする音声認識
    装置。
  6. 【請求項6】音声を電気信号として取り込む音声入力手
    段と、 該入力音声の特徴を時系列パターンに変換して出力する
    音声分析手段と、 認識対象となる音声パターンを表すHMMネットワーク
    を保持する記憶手段と、該記憶手段に記憶されているH
    MMネットワークと前記時系列パターンとを照合してH
    MMネットワーク上の各状態の確率を計算する照合手段
    と、 前記HMMネットワークで終端となりうる状態のうち最
    大確率を持つ状態から得られる最適パスを求める最適パ
    ス算出手段と、 前記HMMネットワークで全状態のうち最大確率を持つ
    状態を求める最大尤度算出手段と、上記最適パス確率を
    求めて上記最大確率と比較し、該比較結果が所定の閾値
    より大きい場合には「該当無し」との認識結果を出力す
    る判定手段を有することを特徴とする音声認識装置。
JP21567495A 1995-08-24 1995-08-24 時系列パターン認識処理におけるリジェクト方法およびそれを実装した時系列パターン認識装置 Expired - Fee Related JP3533773B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP21567495A JP3533773B2 (ja) 1995-08-24 1995-08-24 時系列パターン認識処理におけるリジェクト方法およびそれを実装した時系列パターン認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP21567495A JP3533773B2 (ja) 1995-08-24 1995-08-24 時系列パターン認識処理におけるリジェクト方法およびそれを実装した時系列パターン認識装置

Publications (2)

Publication Number Publication Date
JPH0962292A JPH0962292A (ja) 1997-03-07
JP3533773B2 true JP3533773B2 (ja) 2004-05-31

Family

ID=16676292

Family Applications (1)

Application Number Title Priority Date Filing Date
JP21567495A Expired - Fee Related JP3533773B2 (ja) 1995-08-24 1995-08-24 時系列パターン認識処理におけるリジェクト方法およびそれを実装した時系列パターン認識装置

Country Status (1)

Country Link
JP (1) JP3533773B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3826032B2 (ja) 2001-12-28 2006-09-27 株式会社東芝 音声認識装置、音声認識方法及び音声認識プログラム

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
小高, 天野,音声認識におけるリジェクト方式の検討,日本音響学会平成7年度秋季研究発表会講演論文集,日本,1995年 9月,3−2−5,Pages 115−116
渡辺, 塚田,音節認識を用いた尤度補正による未知発話のリジェクション,電子情報通信学会論文誌 D−II,日本,1992年12月,Volume J75−D−II,Pages 2002−2009

Also Published As

Publication number Publication date
JPH0962292A (ja) 1997-03-07

Similar Documents

Publication Publication Date Title
JP3284832B2 (ja) 音声認識対話処理方法および音声認識対話装置
US7805304B2 (en) Speech recognition apparatus for determining final word from recognition candidate word sequence corresponding to voice data
RU2393549C2 (ru) Способ и устройство для распознавания речи
CN103971685B (zh) 语音命令识别方法和系统
JP3826032B2 (ja) 音声認識装置、音声認識方法及び音声認識プログラム
EP2048655A1 (en) Context sensitive multi-stage speech recognition
US6662159B2 (en) Recognizing speech data using a state transition model
US7181395B1 (en) Methods and apparatus for automatic generation of multiple pronunciations from acoustic data
US6631348B1 (en) Dynamic speech recognition pattern switching for enhanced speech recognition accuracy
CN114155839A (zh) 一种语音端点检测方法、装置、设备及存储介质
JP3119510B2 (ja) 音声認識装置
US6823304B2 (en) Speech recognition apparatus and method performing speech recognition with feature parameter preceding lead voiced sound as feature parameter of lead consonant
JP2996019B2 (ja) 音声認識装置
JP3533773B2 (ja) 時系列パターン認識処理におけるリジェクト方法およびそれを実装した時系列パターン認識装置
US6157911A (en) Method and a system for substantially eliminating speech recognition error in detecting repetitive sound elements
KR20210052563A (ko) 문맥 기반의 음성인식 서비스를 제공하기 위한 방법 및 장치
KR20030042286A (ko) 잡음 환경에서의 음성신호 검출방법 및 그 장치
JP2000352993A (ja) 音声認識システム及びヒドン・マルコフ・モデルの学習方法
CN111429921B (zh) 声纹识别方法、系统、移动终端及存储介质
US6438521B1 (en) Speech recognition method and apparatus and computer-readable memory
JPH11202895A (ja) 音声認識システムと方法およびそのプログラムを記録した記録媒体
US20210398521A1 (en) Method and device for providing voice recognition service
JP3846500B2 (ja) 音声認識対話装置および音声認識対話処理方法
Kitaoka et al. Detection and recognition of correction utterance in spontaneously spoken dialog.
KR100677224B1 (ko) 안티워드 모델을 이용한 음성인식 방법

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040217

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040301

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090319

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees