JPH0632012B2 - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPH0632012B2
JPH0632012B2 JP60059880A JP5988085A JPH0632012B2 JP H0632012 B2 JPH0632012 B2 JP H0632012B2 JP 60059880 A JP60059880 A JP 60059880A JP 5988085 A JP5988085 A JP 5988085A JP H0632012 B2 JPH0632012 B2 JP H0632012B2
Authority
JP
Japan
Prior art keywords
phoneme
symbol
similarity
frame
phoneme symbol
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP60059880A
Other languages
English (en)
Other versions
JPS61219099A (ja
Inventor
輝彦 浮田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Tokyo Shibaura Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tokyo Shibaura Electric Co Ltd filed Critical Tokyo Shibaura Electric Co Ltd
Priority to JP60059880A priority Critical patent/JPH0632012B2/ja
Priority to DE8686302171T priority patent/DE3673857D1/de
Priority to EP86302171A priority patent/EP0200347B1/en
Publication of JPS61219099A publication Critical patent/JPS61219099A/ja
Priority to US07/546,709 priority patent/US4987596A/en
Publication of JPH0632012B2 publication Critical patent/JPH0632012B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)
  • Telephonic Communication Services (AREA)
  • Telephone Function (AREA)

Description

【発明の詳細な説明】 〔発明の技術分野〕 本発明は連続発声された入力音声を精度良く認識するこ
との出来る音声認識装置に関する。
〔発明の技術的背景とその問題点〕
音声の自動認識は、人間から機械への直接的な情報入力
を可能とするインターフェイス技術として非常に重要で
ある。この音声の自動認識は、例えば音素・音節等の言
語的記号の系列を連続発声してなる音声パターンを、離
散的な言語的記号に変換し、これらの各言語的記号をそ
れぞれ認識する過程として考えることが出来る。
ところでこの種の音声認識において認識単位を音韻とす
る方法は、音声認識の基礎研究として古くから行われて
いる。その方法は、入力音声波を音韻の単位に分割
(セグメンテーション)し、これらの各音韻の内容を判
定(ラベリング)するものと、入力音声波に一定時間
(音声分析のフレーム)毎に音韻ラベルを割当て、その
後音声ラベルの繋りを判定するものとに大別される。前
者は、音声パワーやスペクトル等の時間的な変化を利
用し、その音声内容の変化が大きい箇所を手掛りとして
音韻の境界を検出するものである。然し乍ら、上記音声
パワーやスペクトル等の時間的変化は、その発声速度や
発声態度等によって大きな影響を受け易い為、音声認識
の高精度化が望めなかった。
また、一定時間毎にラベリングを行う後者の方法にあ
っては、順次出力される音韻記号を如何にしてまとめる
かが大きな問題となる。この為、従来では思い付きの所
謂場当り的な規則を構成して上記問題に対処しているの
が実状であった。これ故、その認識処理過程が徒に複雑
化し、その割には認識精度の向上が望めないと云う不具
合を有していた。
〔発明の目的〕
本発明はこのような事情を考慮してなされたもので、そ
の目的とするところは、連続発声された入力音声を高精
度に認識するべく、上記入力音声を高精度に音韻単位に
分割し、且つそのラベル付けを行うことのできる実用性
の高い音声認識装置を提供することにある。
〔発明の概要〕
本発明は、入力音声を分析し一定時間毎に得られるフレ
ーム毎の特徴パラメータの系列について各音韻記号に対
する類似度を求め、これら類似度の系列に対し、各音韻
記号の継続時間長情報および各音韻記号間の接続可能情
報を用いることにより音韻として許される音韻系列の候
補を求め、これら条件を満たす音韻系列の中でその音韻
系列に対応した類似度の系列の類似度和が最も大きなも
のを選択し、認識結果を得ることを特徴とするもので、
さらに詳述すれば、入力音声を分析し一定時間のフレー
ム毎に特徴パラメータの系列を求め、これらフレーム毎
の特徴パラメータについて辞書登録された各音韻記号の
標準パターンに対する類似度を求め、そして、予め記憶
された各音韻記号の継続時間長の情報に従って現フレー
ム時点から各音韻記号の継続時間長だけ遡った時点のフ
レームを各音韻記号の開始位置としてその区間の類似度
和を各音韻記号毎に求めるとともに、予め記憶された各
音韻記号間の接続可能情報に従って各音韻記号に接続可
能な先行音韻記号の前記開始位置での最大の累積類似度
と前記類似度和とを各音韻記号毎に加算した累積類似度
を求めるようにして、各音韻記号毎に最大の累積類似
度、これを与える開始位置および先行音韻記号を夫々得
る処理を各フレーム毎に行い、こうして得られた結果に
対し入力音声の終了時点のフレームで最大の累積類似度
を有する音韻記号に対応した開始位置および先行音韻記
号を抽出し、当該開始位置のフレームで当該先行音韻記
号に対応した開始位置および先行音韻記号の抽出を繰り
返すことにより音韻系列に対応した類似度の系列の類似
度和が最も大きなものを認識結果として得るようにした
ことを特徴としている。
〔発明の効果〕
かくして本発明によれば、入力された音声を一定時間毎
に得られる各音韻記号に対する類似度に基づき継続時間
長および接続関係の情報に従って最適な音韻区分を求め
ることができ、入力音声を音韻記号系列化できることか
ら、連続音声の個々の言語的記号をそれぞれ精度よく認
識することができるようになる。
即ち一般的には、連続音声中の各音韻は、その典型的な
スペクトルパターンを持つフレームデータから順次後続
音韻へと変化していく。つまり各音韻は、その中心位置
を基準にしてみると、その音韻記号に対する類似度がそ
の中心に向けて徐々に大きくなり、また中心から離れる
に従って徐々に小さくなる。従ってこのような類似度の
動きの中から最大の類似度和を持つ音韻ラベル系列を求
めれば、その音韻区分を求めることができる。然し乍
ら、1フレームのスペクトルデータだけを捕えた場合、
偶然的に他の音韻に似ていることがある。また特に音韻
間の過渡部(音韻結合部)では、入力音声のスペクトル
がその典型的な音韻のスペクトルとは全く異なる場合が
ある。故に、上述した類似度の動きの中から最大の類似
度和を持つ音韻ラベル系列を求めるだけでは、その認識
処理に誤りが生じ易い。
この点本発明では、音韻の継続時間長および接続関係の
情報に従ってこれら条件を満たす音韻系列の候補を求
め、その音韻系列の候補の中で上述したようにその類似
度和から最適音韻区分を求めるので、連続音声の個々の
言語的記号をそれぞれ精度良く認識することが可能とな
る。
しかも語彙の制約や文法情報を全く用いることなしに、
音声の音韻記号を高精度に分割・認識するので、音声認
識処理における実用性が極めて高い等の多大なる効果が
奏せられる。
〔発明の実施例〕
以下、図面を参照して本発明の一実施例につき説明す
る。
尚、ここでは音韻記号として音素に例をとり説明する
が、音節を音韻記号として取扱うことも勿論可能であ
る。
第1図は実施例装置の概略構成図であり、第2図は実施
例装置における最適記号列計算部の処理シーケンスを示
す図である。連続発声して入力される音声は音響分析部
1に導かれ、所定の分析時間毎に音響分析されて特徴パ
ラメータ(フレーム)に変換される。この音響分析部1
は、スペクトル分析の手法として知られているような、
例えば複数の帯域通過フィルターからなるフィルターバ
ンクにより構成されるもので、その各チャネル出力値の
エネルギーを特徴パラメータとして計算している。そし
てこれらの各データは入力音声パターンとして該音響分
析部1内の入力パターンメモリ(図示せず)に記憶され
るようになっている。
類似度計算部2は、前記音響分析部1から前記所定の分
析時間間隔毎に出力されるスペクトルデータ(フレー
ム)に対して、音韻辞書3に予め登録された各音韻の標
準的パターンとの間で類似度をそれぞれ計算し、各音韻
記号としての類似度を求めている。この音韻記号の類似
度計算は、例えばパターンの変形の吸収能力の高い複合
類似度法を用いて行われる。この複合類似度を用いる場
合、前述したように音韻辞書3として各音韻のクラス毎
に互いに直交した数種のベクトルを各音韻の標準パター
ンとして持つ必要があるが、音素の種類は高々30種で
あるので、メモリ容量や処理時間の点での問題は無い。
また複合類似度でなくとも、パターン認識技術として周
知の統計的距離や、単純類似度、ユークリッド距離等を
用いることも可能である。但し、上記ユークリッド距離
等の距離を類似度の代りに用いる場合には、以下の説明
における最適記号列を求めるアルゴリズムの中で最大値
を求める操作を、全てその最小値を求める操作として置
換する必要がある。
類似度計算部2はこのようにして各フレームの音韻記号
に対する類似度を求め、例えば第3図のように各フレー
ム毎の類似度を出力することになる。尚、第3図は
「音;(オト)」なる音声を入力したときの音声パワー
の時間的変化と、各フレーム毎に音韻記号(a,i,
u,e,o,N,p,t……)に対してそれぞれ求めら
れた類似度とを示している。
最適記号列計算部4は、基本的には類似度記憶部5、最
大類似度系列計算部6、接続情報テーブル記憶部7、お
よび継続時間長テーブル記憶部8とを備えて構成され
る。そして前記類似度計算部2にて類似度計算された前
記第3図に示す如き類似度の情報から、音韻記号毎に定
まる継続時間長、および音韻記号の接続関係をそれぞれ
満たす音韻記号の系列を求め、その音韻記号系列の中で
類似度和が最大となる系列を選択し、これを出力してい
る。
即ち最適記号列計算部4は、その類似度記憶部5に前記
第3図に示す如き各フレーム毎に求められた音韻記号に
対する類似度をそれぞれ格納している。一方、前記接続
情報テーブル記憶部7には、各音韻に関して次に出現す
る音韻記号との間で接続可能か否かの情報がテーブルと
して格納されており、また接続時間長テーブル記憶部8
には各音韻記号が取り得る時間長の制限情報(上下限
値)が格納されている。最大類似度系列計算部6はこの
ような音韻記号に関する情報を入力し、前記類似度記憶
部5に格納された類似度の系列に対して、音韻記号とし
ての制限条件を判定し、基本的には不適切な音韻記号候
補を排除して入力音声を表現するに適切な音韻記号系列
の候補を見出だしている。概念的には第2図に示すよう
に、先ず前記類似度記憶部5から各フレーム毎に求めら
れた音韻に関する情報(音韻ラベル)とその類似度値の
情報を入力し(ステップa)、音韻毎に定まる継続時間
長の情報bを利用して不適切な音韻記号を排除する(ス
テップc)。また接続可能情報dを用いて、接続が不可
能な音韻記号の繋りを検出し、これを音韻記号の系列か
ら排除する。(ステップe)。そして残された音韻記号
を用いて、入力音声を表現する音韻記号系列の候補を求
め(ステップf)、これらの各音韻記号系列の候補をな
す類似度の系列、つまり音韻記号系列候補の各音韻毎に
ついてそれぞれ求められた類似度の系列の類似度和を求
め(ステップg)、その類似度和が最大となる類似度系
列の音韻記号系列を選択(ステップh)している。
この最適記号列計算部4の動作(処理)について更に詳
しく説明すると、最適記号列計算部4は、類似度記憶部
5に格納された第3図に示すような類似度の列に基づい
て、その音韻記号系列の中でその類似度の和が最大とな
る系列を入力音声を表現する最適な音韻記号系列である
として求めている。ここで類似度の和に最大化は、加算
関係で表現できるのであり、最大の類似度和のものを求
める効率の良い方法として、例えば動的計画法を利用す
ることが有用である。
第4図はその過程を説明する為の図である。今、各フレ
ームtに応じて得られる音韻記号p(1≦p≦P)に対
する類似度をS(t;p)とする。そして計算部6には
累積類似度の記憶領域T(t)と、ラベル名の記憶領域L
(t)、および最適な結果を求める為に用いられるポイン
タ記憶領域F(t)を用意する。尚、これらの各記憶領域
の初期値はそれぞれ零(0)に設定される。
ここで第tフレームについて考えると、前記継続時間長
の情報が各音韻記号pについて、その最大継続時間長L
max(p)、および最小長Lmin(p)として与えられるものと
すると、次のような処理が実行される。即ち、 t−Lmax(p)≦t′≦t−Lmin(p)1≦p≦P なるフレームt′、および音韻記号pについて、 を求める。この処理を全てのフレームt′、および各音
韻記号pについてそれぞれ実行してB(t′;p)をそ
れぞれ求め、そのなかの最大のものを選ぶ。このB
(t′;p)の最大値B(t′max;pmax)、およびそ
れを与えるt′maxとpmaxを前記各記憶領域T(t),L
(t),F(t)にそれぞれ格納する。
この処理を入力音声の区間の間だけ繰返すと、音声入力
が終了した時点(そのフレームをtendとする)で、最
大類似度和としてT(tend)が求まることになる。
最後に音韻記号の対応付けを行うべく、フレームkをt
endとして、L(k)が入力音声の最後の音韻、F(k)+1
がその開始位置、kがその終了位置として求めることが
できる。
続いて、フレームkにF(k)の値をセットして、順にk
=0になるまで繰返すと、音韻記号、その開始および終
了位置が順次逆順に求まることになる。
このようにして音韻記号が取り得る継続時間長の情報を
利用して、音韻記号の区切りが見出だされ、この区切り
によって結合された音韻記号の系列の中の、最大の類似
度和を得る音韻記号系列が見出だされることになる。
次に音韻間の接続関係について説明すると、接続関係と
は音韻記号の並びの可能性に関する情報として定義され
る。具体的には、例えば拗音(Y)の後には、母音(I)や
(E)は後続せず、また逆に半母音(W)の後には母音(A)し
か続かない等の音声学レベルの情報が接続関係の情報で
ある。これらは前述したように接続情報テーブル記憶部
7に、例えば第5図に示すようにテーブルの形で準備さ
れる。しかしこのような音韻接続の制限を満す最大類似
度和の音韻記号系列を得るべく、各音韻記号毎に記憶領
域T(p),L(t;p)を準備する。そして第5図に示すよう
に、前記B(t;p)の計算の代りにB(p)を用意して、全て
の(1≦p≦P)なる音韻記号pについて、音韻列“q
−p”が許されるときには B(q)=T(q)+S(t;p) を計算し、その他の場合には上記B(q)を零(0)として求
める。ここで、qは音韻記号の並びとしてpに先行でき
る音韻記号である。そして最大のB(q)を与えるqmaxを
検索し、これを前記記憶領域L(t;p)に記憶する。また
B(q max)は全ての音韻記号pについての処理が終了す
るまで、前記記憶領域T′(p)に一時的に格納する。こ
れを全てのpについて繰返した後、T(p)にT′(p)をセ
ットし、次のフレームに進む。その後、入力音声が終了
を以て、前記T(p)中の最大値を与えるpmaxを選ぶと、
その結果がL(t;pmax)で与えられ、ここに音韻記
号の継続条件を満し、且つその類似度和が最大となる音
韻記号系列が求められることになる。
しかしてこの音韻記号間の接続関係に関する制限処理
と、前述した継続時間長に関する制限処理とを組合せる
場合には、その中間結果を保持する領域として、T
(t;p),L(t;p),F(t;p)を用意する。
そして を前記音韻記号pを固定した状態で全てのフレームt′
について計算する。そして各フレームt′についての最
大値を求め、そのt′を記憶領域F(t;p)に、qを
記憶領域L(t;p)に、またB(t′;p)を記憶領
域T(t;p)にそれぞれ格納する。これらの手順を全
ての音韻記号pについて実行し、続いて全てのフレーム
tについて実行すれば、上記2つの条件を満足する音韻
記号系列の中のその類似度和が最大となる音韻記号の系
列が求められることになる。
第6図はこのような計算処理を行うルートの例を示すも
のである。第6図では、X点に至る類似度和を計算する
際のルートを示しており、図中各〇印で示されるポイン
トからの各ルートの類似度和を計算することになる。
このように本装置によれば、入力された音声を、一定時
間毎に計算される音韻記号の類似度に基づき、継続時間
長および接続関係の知識を導入して最適な区分を求め、
入力音声を音韻記号系列化することができる。故にその
実用的利点が極めて高く、連続音声の認識処理において
絶大なる効果を得ることができる。
尚、本発明は上述した実施例に限定されるものではな
い。例えば、ここでは音韻記号を音素として説明する
が、これは音節であっても同様の装置を構成することに
より、全く同じ効果が得られる。また良く知られた連続
DPマッチング等の方法により一定時間毎に得られる音
節の距離に付しても、上述した処理方式を同様に適用す
ることができ、実施例と同様な効果を期待することがで
きる。その他、本発明はその要旨を逸脱しない範囲で種
々変形して実施することができる。
【図面の簡単な説明】
第1図は本発明の一実施例装置を示す概略構成図、第2
図は実施例の処理概念を示す図、第3図は入力音声に対
する類似度系列の例を示す図、第4図は継続時間情報を
利用する方法の原理を示す図、第5図は音韻記号間の接
続可能情報を利用する方法の原理を示す図、第6図は継
続時間情報と接続関係を併用する場合の計算ルートの例
を示す図である。 1……音響分析部、2……類似度計算部、3……音韻辞
書、4……最適記号列計算部、5……類似度記憶部、6
……最大類似度系列計算部、7……接続情報テーブル記
憶部、8……継続時間長テーブル記憶部。
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 昭60−149097(JP,A) 特開 昭59−180597(JP,A) 特開 昭60−135999(JP,A) 特開 昭59−61897(JP,A) 特開 昭59−58493(JP,A) 特開 昭59−58492(JP,A) 特公 平1−30160(JP,B2) 米国特許4987596(US,A) 欧州特許出願公開200347(EP,A1)

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】入力音声を分析し一定時間のフレーム毎に
    特徴パラメータの系列を求める手段と、 辞書登録された各音韻記号の標準パターンに対しフレー
    ム毎に特徴パラメータの類似度を夫々計算する手段と、 各音韻記号の継続時間長および各音韻記号間の接続可能
    情報を予め記憶した手段と、 当該フレームの時点から各音韻記号の継続時間長だけ遡
    った時点のフレームを各音韻記号の開始位置としてその
    区間の類似度和を各音韻記号毎に求め、各音韻記号に接
    続可能な先行音韻記号の前記開始位置での最大の累積類
    似度と前記類似度和とを各音韻記号毎に加算した累積類
    似度を求め、各音韻記号毎に最大の累積類似度、これを
    与える開始位置および先行音韻記号を夫々記憶する処理
    をフレーム毎に行う手段と、 この手段の記憶内容において入力音声の終了時点のフレ
    ームで最大の累積類似度を有する音韻記号に対応した開
    始位置および先行音韻記号を抽出し、当該開始位置のフ
    レームで当該先行音韻記号に対応した開始位置および先
    行音韻記号の抽出を繰り返す手段とを具備したことを特
    徴とする音声認識装置。
JP60059880A 1985-03-25 1985-03-25 音声認識装置 Expired - Lifetime JPH0632012B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP60059880A JPH0632012B2 (ja) 1985-03-25 1985-03-25 音声認識装置
DE8686302171T DE3673857D1 (de) 1985-03-25 1986-03-25 Auf einem erworbenen wissensgut basierte einrichtung und verfahren zur automatischen spracherkennung.
EP86302171A EP0200347B1 (en) 1985-03-25 1986-03-25 Knowledge-guided automatic speech recognition apparatus and method
US07/546,709 US4987596A (en) 1985-03-25 1990-06-29 Knowledge-guided automatic speech recognition apparatus and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60059880A JPH0632012B2 (ja) 1985-03-25 1985-03-25 音声認識装置

Publications (2)

Publication Number Publication Date
JPS61219099A JPS61219099A (ja) 1986-09-29
JPH0632012B2 true JPH0632012B2 (ja) 1994-04-27

Family

ID=13125899

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60059880A Expired - Lifetime JPH0632012B2 (ja) 1985-03-25 1985-03-25 音声認識装置

Country Status (4)

Country Link
US (1) US4987596A (ja)
EP (1) EP0200347B1 (ja)
JP (1) JPH0632012B2 (ja)
DE (1) DE3673857D1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7225134B2 (en) 2000-06-20 2007-05-29 Sharp Kabushiki Kaisha Speech input communication system, user terminal and center system

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0632012B2 (ja) 1985-03-25 1994-04-27 株式会社東芝 音声認識装置
US5315689A (en) * 1988-05-27 1994-05-24 Kabushiki Kaisha Toshiba Speech recognition system having word-based and phoneme-based recognition means
DE4031421C2 (de) * 1989-10-05 1995-08-24 Ricoh Kk Musteranpassungssystem für eine Spracherkennungseinrichtung
US5293584A (en) * 1992-05-21 1994-03-08 International Business Machines Corporation Speech recognition system for natural language translation
FI97919C (fi) * 1992-06-05 1997-03-10 Nokia Mobile Phones Ltd Puheentunnistusmenetelmä ja -järjestelmä puheella ohjattavaa puhelinta varten
US5832434A (en) * 1995-05-26 1998-11-03 Apple Computer, Inc. Method and apparatus for automatic assignment of duration values for synthetic speech
US5822728A (en) * 1995-09-08 1998-10-13 Matsushita Electric Industrial Co., Ltd. Multistage word recognizer based on reliably detected phoneme similarity regions
US5684925A (en) * 1995-09-08 1997-11-04 Matsushita Electric Industrial Co., Ltd. Speech representation by feature-based word prototypes comprising phoneme targets having reliable high similarity
US5825977A (en) * 1995-09-08 1998-10-20 Morin; Philippe R. Word hypothesizer based on reliably detected phoneme similarity regions
FR2769118B1 (fr) 1997-09-29 1999-12-03 Matra Communication Procede de reconnaissance de parole
JP3252282B2 (ja) * 1998-12-17 2002-02-04 松下電器産業株式会社 シーンを検索する方法及びその装置
JP4604424B2 (ja) * 2001-08-07 2011-01-05 カシオ計算機株式会社 音声認識装置及び方法、並びにプログラム

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4987596A (en) 1985-03-25 1991-01-22 Kabushiki Kaisha Toshiba Knowledge-guided automatic speech recognition apparatus and method

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4761815A (en) * 1981-05-01 1988-08-02 Figgie International, Inc. Speech recognition system based on word state duration and/or weight
US4489434A (en) * 1981-10-05 1984-12-18 Exxon Corporation Speech recognition method and apparatus
US4489435A (en) * 1981-10-05 1984-12-18 Exxon Corporation Method and apparatus for continuous word string recognition
US4481593A (en) * 1981-10-05 1984-11-06 Exxon Corporation Continuous speech recognition
JPS58100195A (ja) * 1981-12-10 1983-06-14 日本電気株式会社 連続音声認識装置
US4587670A (en) * 1982-10-15 1986-05-06 At&T Bell Laboratories Hidden Markov model speech recognition arrangement
US4723290A (en) * 1983-05-16 1988-02-02 Kabushiki Kaisha Toshiba Speech recognition apparatus
US4718092A (en) * 1984-03-27 1988-01-05 Exxon Research And Engineering Company Speech recognition activation and deactivation method
US4713777A (en) * 1984-05-27 1987-12-15 Exxon Research And Engineering Company Speech recognition method having noise immunity
US4718094A (en) * 1984-11-19 1988-01-05 International Business Machines Corp. Speech recognition system

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4987596A (en) 1985-03-25 1991-01-22 Kabushiki Kaisha Toshiba Knowledge-guided automatic speech recognition apparatus and method

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7225134B2 (en) 2000-06-20 2007-05-29 Sharp Kabushiki Kaisha Speech input communication system, user terminal and center system

Also Published As

Publication number Publication date
US4987596A (en) 1991-01-22
JPS61219099A (ja) 1986-09-29
EP0200347A1 (en) 1986-11-05
EP0200347B1 (en) 1990-09-05
DE3673857D1 (de) 1990-10-11

Similar Documents

Publication Publication Date Title
EP0178509B1 (en) Dictionary learning system for speech recognition
EP0109190B1 (en) Monosyllable recognition apparatus
US20050021330A1 (en) Speech recognition apparatus capable of improving recognition rate regardless of average duration of phonemes
US6553342B1 (en) Tone based speech recognition
JPH02195400A (ja) 音声認識装置
JPWO2009025356A1 (ja) 音声認識装置および音声認識方法
JPH0632012B2 (ja) 音声認識装置
JPS63220298A (ja) 音声認識における単語候補削減装置
JPS6383799A (ja) 連続音声認識方式
Wagner Automatic labelling of continuous speech with a given phonetic transcription using dynamic programming algorithms
JP3428058B2 (ja) 音声認識装置
JP2001312293A (ja) 音声認識方法およびその装置、並びにコンピュータ読み取り可能な記憶媒体
JPH09292899A (ja) 音声認識装置
JPH1124693A (ja) 音声認識装置
JP2001005483A (ja) 単語音声認識方法及び単語音声認識装置
JP2757356B2 (ja) 単語音声認識方法および装置
JPH05303391A (ja) 音声認識装置
JPH0554678B2 (ja)
JP3818154B2 (ja) 音声認識方法
JP2721341B2 (ja) 音声認識方法
JP2615649B2 (ja) 単語音声認識装置
JPS62160499A (ja) 音声認識装置
JP2737122B2 (ja) 音声辞書作成装置
JPH09212190A (ja) 音声認識装置及び文認識装置
JPH06130993A (ja) セグメンテーション及び音素の大分類認識法

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term