JPH04242800A - 文法規則に基づいた照合値制約を用いた高性能音声認識方法並びに音声認識回路 - Google Patents

文法規則に基づいた照合値制約を用いた高性能音声認識方法並びに音声認識回路

Info

Publication number
JPH04242800A
JPH04242800A JP2409102A JP40910290A JPH04242800A JP H04242800 A JPH04242800 A JP H04242800A JP 2409102 A JP2409102 A JP 2409102A JP 40910290 A JP40910290 A JP 40910290A JP H04242800 A JPH04242800 A JP H04242800A
Authority
JP
Japan
Prior art keywords
word
circuit
speech recognition
grammar
voice recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2409102A
Other languages
English (en)
Other versions
JP3332939B2 (ja
Inventor
George R Doddington
ジョージ アール.ドッディントン
Charles T Hemphill
チャールズ ティー.ヘムフィル
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Texas Instruments Inc
Original Assignee
Texas Instruments Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Texas Instruments Inc filed Critical Texas Instruments Inc
Publication of JPH04242800A publication Critical patent/JPH04242800A/ja
Application granted granted Critical
Publication of JP3332939B2 publication Critical patent/JP3332939B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/183Speech classification or search using natural language modelling using context dependencies, e.g. language models
    • G10L15/19Grammatical context, e.g. disambiguation of the recognition hypotheses based on word sequence rules
    • G10L15/193Formal grammars, e.g. finite state automata, context free grammars or word networks
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/22Interactive procedures; Man-machine interfaces

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Machine Translation (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 【0001】 【産業上の利用分野】本発明は一般的に音声認識に係わ
り、更に詳細には文法に基づいた音声認識方法並びに音
声認識回路に関する。 【0002】 【従来の技術】音声認識は不完全な技術である。マイク
ロホン、音声のアクセント及び話し手の能力の違いを含
む多くの変数が有るため、今日音声認識を多くの応用分
野での要求を満足させ得るだけの信頼性をもって実施す
ることは不可能である。特に電話の分野に関しては、よ
り高性能な音声認識が必要とされている。 【0003】音声認識は、装置で認識できる単語を例え
ば十個の数字、0−9からなる小さな集合に制約する事
により強化する事が出来る。十個の数の集合に於いてさ
え、話し手に依存しない音声認識は相変わらず難しい問
題として残っている。 【0004】音声認識は最近は受付制御に適用されてき
ている。どの様な受付または入力制御装置に於いても、
二つの基本機能が使用者に用意されている:(1) 使
用者身元認定と(2) 使用者確認とである。使用者身
元認定機能は未知の使用者に対して、請求された認定を
与える。 音声認識装置を用いて使用者は彼の識別コードを音声入
力する。確認機能は使用者個人の属性、例えば使用者の
声の性質に基づいて実行される。従って身元認定と確認
の二つの機能は、同一の発声された音声を対象として実
施される。 【0005】音声認識/話し手確認能力からは二つの利
益が生じる。第一に、確認時間がかなり短縮される、な
ぜなら身元認定のために使用された音声データが確認の
ためにも使用されるので、確認のために必要な入力時間
を完全に除くことが出来る。第二に、音声入力以外を必
要としないので例えば両手が自由になるといったような
操作上の長所を有し、その結果確認用ターミナルを廉価
でかつ移動し易いものとする事が出来る。音声通信シス
テムに於いては、その他の補助検出または確認装置も取
り除くことが出来る。 【0006】発声された身元認定コードを使用した身元
認定機能を実現するためには、音声認識を用いなければ
ならない。音声認識では話された単語を、不連続な身元
認定コードに翻訳する。 【0007】使用に耐え得る装置を実現するためには、
入力装置の音声認識部は話し手に依存しないものでなけ
ればならない、すなわち、たとえ話し手が未登録の人で
あっても、話されたコードを単語に翻訳できなければな
らない。さらにより広い範囲で応用するためには、連続
した発声の中で単語を認識できなければならない、すな
わち、単語間で区切りの無い発声の中で単語を認識でき
なくてはならない。 【0008】従って工業分野の中で音声認識装置の性能
を改善する要求が高まってきている。 【0009】 【発明の目的と概要】本発明に依れば、音声認識方法並
びにそれを実行するための装置とが提供されていて、こ
れは基本的に従来技術に基づいた音声認識回路が有して
いた問題点を取り除いたりまたは、予め防止しているも
のである。 【0010】本発明に於いては、音声は話された単語の
順序から認識され、これらの単語はひとつまたはいくつ
かの照合値制約条件に一致したものである。 【0011】本発明のひとつの実施例では、言葉を文法
から仮定することにより、音声を話されたフレーズから
認識している。文法規則を観測された単語に適用するこ
とにより、翻訳結果は第一状態から、第二状態となる。 各々の状態が照合値の値を指示出来るように、その文法
は設計されている。 【0012】本発明に基づくこの実施例の提供する技術
的な長所は、照合値制約条件が文法規則に従って本来的
に与えられるので、計算を行う必要が無い点である。更
に本発明は、その性能を向上させるために任意の有限状
態文法音声認識装置と共に使用される。 【0013】別の実施例では、統一文法が制約条件を与
えるために使用されている。この実施例では制約条件を
実施するために必要な記憶装置が最少化されている。 【0014】 【実施例】本発明並びにその長所を更に完全に理解する
ために、添付図を参照して以下の説明を行う。本発明の
提供された実施例は、添付の図1から図3を参照するこ
とに依って更によく理解できるであろう、複数の図面で
使用される部品等に付いては同一の参照番号が付けられ
ている。 【0015】本発明の目的は従来の文法に基づいた音声
認識の文脈の中での音声認識の改善を以下の手段を用い
て行うことである:1)照合値制約条件を挿入すること
により、発声された音声に対する制約条件を導入するこ
と、および2)音声認識を制御するために照合値制約条
件が組み込まれた従来型文法を生成すること、である。 本発明は音声確認装置に関連して記述されているが、ど
の様な音声認識の応用分野にも適用できる。 【0016】図1は音声認識を使用した話し手確認の概
念を記述したブロック図である。流れ図10に於いて、
話されたコードはブロック12の中で未知の使用者から
受信される、すなわちその身元が確認されていない使用
者からのコードである。ブロック14では、要求のあっ
た身元が音声試料の中から導き出される。要求のあった
身元は、話されたコードを個々の単語に翻訳することに
依って決定されるが、これらの個々の単語は唯一の認識
コードを形成する。適切な身元コードが認定済み使用者
の組のひとつに応対している。ブロック16に於いて、
認識コードは対応する認定済み使用者の音声パターン上
の、予め記憶されているデータを呼び出すために使われ
ており、未知の人間の身元を確認している。確認作業は
、予め記憶されている音声データをブロック12で受信
した発声コードと比較して実行される。 【0017】身元登録するために、認定済み使用者は彼
の認識コードの一部となる唯一の成句を登録する。図示
する目的で、成句は0から9までの数で構成されている
ものと仮定しているが、もっともこの制約条件は本発明
に対して必要なものではない。例えば使用者に依って入
力されるこの成句は彼または彼女の電話番号または社会
保障番号であったりする。 【0018】照合値語を計算し成句に加算して、成句全
体が予め定められた照合値を形成するようにしている。 例えば、入力された成句が“0150”であり、装置内
の各々の(五桁)成句に対する、予め定められた照合値
が3を法として零に設定されているとすると、装置は下
記の式を満足するように照合値語として“0”を計算す
る。 【0019】 【数1】 ここでn=全成句中に含まれる単語の数。(例では5に
等しい) k=法。(例では3に等しい) di =第i番目の単語。 【0020】注意しておかねばならないのは、更に複雑
な照合値アルゴリズムを本発明で使用できることと、装
置はひとつの成句に対して複数の照合値を計算し得るこ
とである。一般的に好ましいのは、大きな法でしかも素
数を使用することが好ましい。例えば、“23”や“2
9”といった法が、一般的には好適である。 【0021】これとは別に、照合値制約条件に合致する
認識用成句を使用者を介在させる事なく選択することも
できる。 【0022】認定された使用者の認識コードである成句
は、使用者に依って話され型板として記憶されて話し手
の確認を行う際に用いられる。確認のための装置は、合
衆国特許申請第350,060号、ネイクその他、題名
「電話カード顧客の身元確認を可能とする音声確認回路
」1989年3月9日受付、に開示されており、これは
本明細書でも参照されている。 【0023】図2および図3には、本発明に基づく音声
認識装置の第一の実施例が示されている。図2は本発明
による音声認識過程の流れ図を示す。音声認識装置は各
々の話された認識コードに対して、同時にいくつかの仮
想成句を計算することを注意されたい。例えば、話され
た認識コードが“01500”の時、装置は通常いくつ
かの仮想成句を、使用者の認識コードの発音に応じて追
跡する。“01500”に加えて、装置は例えば“01
941”,“00942”,および“00501”を話
された成句の可能性が有るものとして追跡する。発明の
この特徴は図3に関連して示されている。 【0024】有限状態オートマトン(本明細書に於いて
、「文法」という語はオートマトンと文法の両方を示す
ものとして使われている)の中では、予め定められた数
の状態が定義されている。これはグラフ的に図3に示さ
れており、ここでは初期状態(S00)と、(S50)
を含んで14個の可能な状態が示されている。観測され
た単語に基づいて規則の集合がひとつの状態(「源」状
態)からもうひとつの状態(「行き先」状態)への遷移
を決定する。 【0025】図2に於いて、初期状態、S00はブロッ
ク20で活性化される。ブロック24で単語が仮定され
て、話された認識コードはブロック26でサンプリング
される。この様な単語を仮定するための装置のひとつは
、合衆国特許申請第312,835号、ヘンフィルその
他、題名「確率論的統一文法のための図表意味分析装置
」1989年2月21日受付、に開示されており、これ
は本明細書でも参照されているが、これ以外の装置も同
様に使用できる。 【0026】判定ブロック28では、単語がサンプル音
声から観測されたか否か、すなわち仮定が終了したか否
かの判断が行われる。もしも判定ブロック28で単語が
観測されると、次に有限状態オートマトン遷移が適用さ
れて、ブロック30で観測された単語に基づいて行き先
状態が決定される。各々の観測された単語には点数が与
えられていて、サンプリングされた音声との相関度を示
している。仮に二つの仮定成句がそれぞれ同一の状態を
活性化すると、より高い点数を有する成句が残され低い
点数の成句は除去される。状態の活性化または状態点数
の更新が終了した後、ブロック24および26での単語
の仮定および音声のサンプリングは、発声された音声の
終わりまで継続される。判定ブロック32では、完全な
文章が認識されたか否かの判断が行われる。図3に更に
詳細に示されるように、照合値制約条件に合致する文章
のみが有限状態オートマトンの元では有効である。照合
値制約条件に合致しないものはブロック24では決して
仮定されない。仮に複数の仮定文章が判定ブロック32
の中で作り出された場合は、一番高い点数を有する文章
がブロック36で受け付けられる。 【0027】図3は図2の流れ図の動作を描いた状態図
を示しているが、単語境界の不確実性は無視している。 図3は3を法とした照合値を使用し、四つの成句“01
500”,“01941”,“00942”,および“
00501”が仮定された例を示している。状態S00
は初期状態を表わしている。単語位置“1”で“0”が
第一番目に観測された単語として決定されている。この
時点では“0”あることが十分にはっきりしていたので
、それ以外の単語は観測されていない。有限状態オート
マトン遷移では、S00から仮定される単語が“0”の
場合はS10(第一番目の添え字は単語位置を、第二番
目の添え字は照合値を表わしている)への遷移を引き起
こす。従って成句の単語位置“1”に於ける照合値は、
特別な計算を必要とする事なく有限状態オートマトンで
決定される。単語位置“1”から単語位置“2”にいく
場合には二つの単語“0”および“1”が観測されてい
る;最初に観測された単語(“0”)はS10からS2
0への遷移を、また二番目に観測された単語はS10か
らS21への遷移を引き起こしている。単語位置“2”
から単語位置“3”では二つの単語“9”および“5”
が観測されている。“9”が観測された結果はS20か
らS30への遷移およびS21からS31への遷移とな
る。“5”が観測された結果はS20からS32への遷
移およびS21からS30への遷移となる。 【0028】単語位置3から単語位置4では、S30か
らは“4”が観測されるとS41への遷移をする。S3
1からは“4”が観測されるとその結果S31からS4
2への遷移となる。S30からは“0”が観測されると
その結果S30からS40への遷移となる。S32から
は“0”が観測されるとその結果S32からS42への
遷移となる。 【0029】この時点で観測された結果は、同じ状態遷
移先を有する二つの状態S31およびS32が存在する
ことになる。より高い得点を有する成句が選ばれて仮定
作業を継続し、弱い得点のものは除かれる。 【0030】単語位置4から5の時点では、“0”が観
測されている。S40のみが完全な文章となる、すなわ
ちS50への遷移を引き起こす。それ以外の活性状態S
41およびS42から有限状態文法規則を用いてS50
に遷移するためには、それぞれ2,5,および8または
1,4,および7が観測される必要がある。故に、唯一
の仮定成句のみが文章に対する有限状態文法規則に合致
し、従って照合値制約条件に本質的に合致する。 【0031】本発明の別の実施例では統一文法を使用し
ており、これは「論理変数」を加算して文脈が文法規則
の一部から規則の残り部分の後続の処理に対して影響出
来るようにしたものである。照合値を使用し五桁の数に
制約条件を与える統一文法の例を、プロログプログラミ
ング言語の限定節文法方言(Definite Cla
use Grammar dialect )を使用し
て以下に示す:【数2】number(CHK)−−→
digit(D1),{chk (D1,CHK1)}
,digit(D2),{Sum2 is CHK1 
+ D2, chk(Sum2,CHK2)}, digit(D3),{Sum3 is CHK2 +
 D3, chk(Sum3,CHK3)}, digit(D4),{Sum4 is CHK3 +
 D4, chk(Sum4,CHK )}, digit(CHK ).    digit (0) −−→ [zero].digi
t (0) −−→ [oh].digit (1) 
−−→ [one]. digit (2) −−→ 
[two]. digit (3) −−→ [thr
ee]. digit (4) −−→ [four]
.digit (5) −−→ [five].dig
it (6) −−→ [six]. digit (
7) −−→ [seven]. digit (8)
 −−→ [eight]. digit (9) −
−→ [nine].chk (Sum, CHK):
 − CHK is Sum mod 3. 【0032】プ
ログラム内の規則は完全な照合値文法を構成している;
照合値の法とは独立である。これらの規則は認識過程の
間拡張されて、特定の発声に対して必要な元の有限状態
オートマトンの部分集合を完全にカバーするまで拡張さ
れる。規則は「例示化」と呼ばれる機構で拡張される。 例えば、第一規則の変数D1は数字“0”−“9”のい
ずれかを例示化している。次にD1の例示化された値は
述部(括弧の中に示されている)を満足しなければなら
ない、すなわちchk(D1,CHK1)、ここでch
k(Sum,CHK)はCHKをSum  mod3に
等しいものとして定義している。故に変数D1が“0”
に等しい場合は述部は0である(0  mod  3=
0のため)。故にCHK1は0に等しい。 【0033】各々の桁に対して、仮にそれらが同一の中
間照合値を有する場合は、別々の規則での仮定を併合で
きる。例示化の各々の残存している集合に対するSum
4変数からの最終照合値は、最終桁と比較されて照合値
制約条件と合致するか否かの決定がなされる。先の例を
この文法にしたがって追いかけることは、理解の助けと
なる。 【0034】統一文法を使用することに依る技術的な長
所は、文脈のコード化を効率的に行えることであり、こ
の結果必要な記憶容量が少なくて済むことである。記憶
容量は減少されるのではあるが、処理中に計算を実行す
る必要は生じる。この計算は有限状態オートマトンを使
用した場合には不用のものである。 【0035】本発明はその他の文法、例えば文脈自由文
法等と共にも使用できることを注意されたい。また本発
明は任意の単語の集合に対しても使用でき、数字のみに
限定する必要もないことを注意されたい。文法規則は、
その規則が照合値を具体的に表わすように単語の任意の
集合に適用できる。 【0036】本発明の特定の応用として、複数の単語で
構成された話された成句からの音声認識を実行するため
の回路が具備されており、これは話された成句から単語
を仮定するための回路と、文法規則を適用し仮定された
単語に応じて源状態から行き先状態への遷移を、照合値
が行き先状態から決まるように、決定するための回路と
で構成されている。加えて各々の有効な成句は複数の数
で構成されている。さらに、各々の状態は連続して仮定
された単語で構成されている仮定された成句内の単語位
置と、仮定された成句に対する照合値とに関連付けられ
ている。仮定回路は各々の話された成句に対して複数の
成句を仮定するように動作でき、さらにこの様な回路は
各々の仮定された単語に対する確率を計算するための回
路と、各々の仮定可能な成句に対する確率を計算するた
めの回路とを有する。加えてこの様な回路はさらに、共
通の行き先状態を有する仮定可能成句の確率を比較する
ための回路を有する。 【0037】本発明を詳細に説明したが、種々の変更、
代用および改造が添付の請求項で定められた発明の精神
および範囲から逸脱する事なく実施でき得ることは理解
されよう。 【0038】以上の説明に関して更に以下の項を開示す
る。 【0039】(1)   音声認識方法であって:認識
された単語の順序をひとつまたは複数の照合値制約条件
に合致させ;そして前記照合値制約条件を組み込まれた
文法に基づいて音声認識の制御を行う、という手順で構
成されていることを特徴とする前記音声認識方法。 【0040】(2)   第1項記載の方法に於て、前
記制御手順が:話された成句から仮定された成句を形成
するための単語仮定手順;仮定された成句に対して照合
値制約条件を当てはめるように動作可能な前記文法規則
を、前記仮定された単語に適用する手順とで構成されて
いることを特徴とする前記音声認識方法。 【0041】(3)   第2項記載の方法に於て前記
適用する手順が、第一状態と前記仮定された単語とに関
連する文法規則を第二状態が決定されるとように適用す
る手順を有し、前記第二状態が照合値を表わすことを特
徴とする前記音声認識方法。 【0042】(4)   第1項記載の方法に於て前記
制御手段が、前記照合値制約条件を組み込まれた有限状
態オートマトンを用いて音声認識を制御する手順で構成
されていることを特徴とする前記音声認識方法。 【0043】(5)   第1項記載の方法に於て前記
制御手段が、前記照合値制約条件を組み込まれた統一文
法を用いて音声認識を制御する手順で構成されているこ
とを特徴とする前記音声認識方法。 【0044】(6)   音声認識回路に於て:認識さ
れた単語の順序をひとつまたは複数の照合値制約条件に
合致させるための回路と;そして前記照合値制約条件を
組み込まれた文法に基づいて音声認識の制御を行うため
の回路、とで構成されていることを特徴とする前記音声
認識回路。 【0045】(7)   第6項記載の回路に於て、前
記制御回路が:話された成句から単語を仮定するための
回路;および仮定された成句に対して照合値制約条件を
当てはめるように動作可能な前記文法規則を、前記仮定
された単語に適用するための回路とで構成されているこ
とを特徴とする前記音声認識回路。 【0046】(8)   第7項記載の回路に於て、前
記単語を仮定するための回路が、数字を仮定するための
回路で構成されていることを特徴とする前記音声認識回
路。 【0047】(9)   第7項記載の回路に於て前記
適用するための回路が、第一状態と観測された単語とに
関連する文法規則を第二状態が決定されるように適用す
るための回路を有し、前記第二状態が照合値を表わすこ
とを特徴とする前記音声認識回路。 【0048】(10)  第7項記載の回路に於て更に
各々の仮定された単語に対する確率を計算するための回
路を有することを特徴とする前記音声認識回路。 【0049】(11)  第6項記載の回路に於て前記
制御回路が、前記照合値制約条件を組み込まれた有限状
態文法を用いて音声認識を制御する回路で構成されてい
ることを特徴とする前記音声認識回路。 【0050】(12)  第6項記載の回路に於て前記
制御回路が、前記制約条件を組み込まれた統一文法を用
いて音声認識を制御する回路で構成されていることを特
徴とする前記音声認識回路。 【0051】(13)  文法に基づいた装置の中で、
複数の単語から構成された話された成句から音声認識を
行うための方法に於て:第一状態を活性化し;話された
成句から単語を仮定し;そして第一状態と観測された単
語とに関連する文法規則を第二状態が決定されるように
適用する手順を有し、前記第二状態が照合値を表わすこ
とを特徴とする前記音声認識方法。 【0052】(14)  第2項または第13項記載の
方法に於て、各々の仮定された単語が数字で構成されて
いることを特徴とする前記音声認識方法。 【0053】(15)  第13項記載の方法に於て、
さらに:単語を仮定し、そして次の単語位置および前記
仮定された単語とに関連する状態を決定するために関連
する文法規則を適用する手順とを有することを特徴とす
る前記音声認識方法。 【0054】(16)  第13項記載の方法に於て、
さらに:前記話された成句から連続した仮定された単語
で構成される成句を仮定し;そして前記連続した仮定さ
れた単語の各々に対して文法規則を適用して、後続の単
語位置に関連する後続状態を決定し、各々の後続状態が
照合値の値を示していることを特徴とする前記音声認識
方法。 【0055】(17)  第2項または第13項記載の
方法に於て、各々の仮定された単語に対する確率を計算
するための手順を有することを特徴とする前記音声認識
方法。 【0056】(18)  第15項記載の方法に於て、
各々の仮定された成句に対する確率を計算するための手
順を有することを特徴とする前記音声認識方法。 【0057】(19)  第18項記載の方法に於て更
に、文法規則を適用した後で前記決定された後続の状態
の各々を活性化するための手順をゆうすることを特徴と
する前記音声認識方法。 【0058】(20)  第19項記載の方法に於て更
に、決定された状態が既に別の仮定された成句で活性化
されていた場合には仮定された成句の確率を比較するた
めの手順を有することを特徴とする前記音声認識方法。 【0059】(21)  第13項記載の方法に於て、
前記文法規則が有限状態オートマトン遷移で構成されて
いることを特徴とする前記音声認識方法。 【0060】(22)  第13項記載の方法に於て、
前記文法規則が統一文法規則で構成されていることを特
徴とする前記音声認識方法。
【図面の簡単な説明】
【図1】音声確認装置の全体を記述したブロック図;

図2】本発明による音声認識を記述した流れ図;
【図3
】各々の単語位置に於ける、照合値のネットワーク実施
例を記述した状態図。
【符号の説明】
24  単語 30  文法

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】  音声認識方法であって:認識された単
    語の順序をひとつまたは複数の照合値制約条件に合致さ
    せ;そして前記照合値制約条件を組み込まれた文法に基
    づいて音声認識の制御を行う、という手順で構成されて
    いることを特徴とする前記音声認識方法。
  2. 【請求項2】  音声認識回路に於て:認識された単語
    の順序をひとつまたは複数の照合値制約条件に合致させ
    るための回路と;そして前記照合値制約条件を組み込ま
    れた文法に基づいて音声認識の制御を行うための回路、
    とで構成されていることを特徴とする前記音声認識回路
JP40910290A 1989-12-29 1990-12-28 文法規則に基づいた照合値制約を用いた高性能音声認識方法並びに音声認識回路 Expired - Fee Related JP3332939B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US458860 1989-12-29
US07/458,860 US5222187A (en) 1989-12-29 1989-12-29 Grammar-based checksum constraints for high performance speech recognition circuit

Publications (2)

Publication Number Publication Date
JPH04242800A true JPH04242800A (ja) 1992-08-31
JP3332939B2 JP3332939B2 (ja) 2002-10-07

Family

ID=23822380

Family Applications (1)

Application Number Title Priority Date Filing Date
JP40910290A Expired - Fee Related JP3332939B2 (ja) 1989-12-29 1990-12-28 文法規則に基づいた照合値制約を用いた高性能音声認識方法並びに音声認識回路

Country Status (4)

Country Link
US (1) US5222187A (ja)
EP (1) EP0435580B1 (ja)
JP (1) JP3332939B2 (ja)
DE (1) DE69033051T2 (ja)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19501599C1 (de) * 1995-01-20 1996-05-02 Daimler Benz Ag Verfahren zur Spracherkennung
US5870706A (en) * 1996-04-10 1999-02-09 Lucent Technologies, Inc. Method and apparatus for an improved language recognition system
US5878385A (en) * 1996-09-16 1999-03-02 Ergo Linguistic Technologies Method and apparatus for universal parsing of language
US6003002A (en) * 1997-01-02 1999-12-14 Texas Instruments Incorporated Method and system of adapting speech recognition models to speaker environment
US6456974B1 (en) * 1997-01-06 2002-09-24 Texas Instruments Incorporated System and method for adding speech recognition capabilities to java
US6049768A (en) * 1997-11-03 2000-04-11 A T & T Corp Speech recognition system with implicit checksum
US6499013B1 (en) * 1998-09-09 2002-12-24 One Voice Technologies, Inc. Interactive user interface using speech recognition and natural language processing
US6922669B2 (en) * 1998-12-29 2005-07-26 Koninklijke Philips Electronics N.V. Knowledge-based strategies applied to N-best lists in automatic speech recognition systems
EP1134703A1 (en) * 2000-03-14 2001-09-19 BRITISH TELECOMMUNICATIONS public limited company Secure services
US20030023431A1 (en) * 2001-07-26 2003-01-30 Marc Neuberger Method and system for augmenting grammars in distributed voice browsing
US7852993B2 (en) * 2003-08-11 2010-12-14 Microsoft Corporation Speech recognition enhanced caller identification
US20060004574A1 (en) * 2004-06-30 2006-01-05 Microsoft Corporation Semantic based validation information in a language model to detect recognition errors and improve dialog performance
US20060031071A1 (en) * 2004-08-03 2006-02-09 Sony Corporation System and method for automatically implementing a finite state automaton for speech recognition
US8731925B2 (en) * 2006-12-22 2014-05-20 Nuance Communications, Inc. Solution that integrates voice enrollment with other types of recognition operations performed by a speech recognition engine using a layered grammar stack

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3976973A (en) * 1974-01-07 1976-08-24 Recognition Equipment Incorporated Horizontal scan vertical simulation character reading
JPS58132298A (ja) * 1982-02-01 1983-08-06 日本電気株式会社 窓制限付パタンマツチング装置
JPS6077280A (ja) * 1983-10-04 1985-05-01 Nec Corp パタ−ンマツチング装置
US4882757A (en) * 1986-04-25 1989-11-21 Texas Instruments Incorporated Speech recognition system
GB8625468D0 (en) * 1986-10-24 1987-04-15 Smiths Industries Plc Speech recognition apparatus
US4984178A (en) * 1989-02-21 1991-01-08 Texas Instruments Incorporated Chart parser for stochastic unification grammar

Also Published As

Publication number Publication date
DE69033051T2 (de) 1999-08-05
JP3332939B2 (ja) 2002-10-07
EP0435580B1 (en) 1999-04-14
US5222187A (en) 1993-06-22
EP0435580A3 (en) 1993-08-25
DE69033051D1 (de) 1999-05-20
EP0435580A2 (en) 1991-07-03

Similar Documents

Publication Publication Date Title
US8050925B2 (en) Recognizing the numeric language in natural spoken dialogue
ES2278763T3 (es) Sistema y procedimiento de reconocimiento de voz con una pluralidad de motores de reconocimiento.
US5754978A (en) Speech recognition system
US5832063A (en) Methods and apparatus for performing speaker independent recognition of commands in parallel with speaker dependent recognition of names, words or phrases
EP1575030B1 (en) New-word pronunciation learning using a pronunciation graph
US7912721B2 (en) System and method for automatic speech recognition
JP2000122691A (ja) 綴り字読み式音声発話の自動認識方法
JPH04242800A (ja) 文法規則に基づいた照合値制約を用いた高性能音声認識方法並びに音声認識回路
Li et al. Verbal information verification
US11450320B2 (en) Dialogue system, dialogue processing method and electronic apparatus
JPH09230887A (ja) 発声音に関する話者の検証を行うためのシステム及び方法
JP2000221990A (ja) 音声認識装置
JPH1173195A (ja) 話者の申し出識別を認証する方法
US20030009331A1 (en) Grammars for speech recognition
US7031923B1 (en) Verbal utterance rejection using a labeller with grammatical constraints
EP1111587B1 (en) Speech recognition device implementing a syntactic permutation rule
EP1213706B1 (en) Method for online adaptation of pronunciation dictionaries
JPH1173196A (ja) 話者の申し出識別を認証する方法
EP1160767B1 (en) Speech recognition with contextual hypothesis probabilities
JPH06161488A (ja) 音声認識装置
Sudoh et al. Post-dialogue confidence scoring for unsupervised statistical language model training
JP3936827B2 (ja) 音声認識装置および方法
JP3936919B2 (ja) 音声キーワード認識装置
JP3291073B2 (ja) 音声認識方式
JP3544740B2 (ja) 連続音声認識方式

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070726

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080726

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080726

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090726

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees