JPH0566794A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPH0566794A
JPH0566794A JP3230141A JP23014191A JPH0566794A JP H0566794 A JPH0566794 A JP H0566794A JP 3230141 A JP3230141 A JP 3230141A JP 23014191 A JP23014191 A JP 23014191A JP H0566794 A JPH0566794 A JP H0566794A
Authority
JP
Japan
Prior art keywords
input
recognition
item
standard pattern
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP3230141A
Other languages
English (en)
Other versions
JP2639249B2 (ja
Inventor
Atsushi Oogumo
篤 大蜘蛛
Toshiyuki Morii
利幸 森井
Kazuya Nomura
和也 野村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP3230141A priority Critical patent/JP2639249B2/ja
Publication of JPH0566794A publication Critical patent/JPH0566794A/ja
Application granted granted Critical
Publication of JP2639249B2 publication Critical patent/JP2639249B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 複数個の異なる項目の一連の音声入力を行う
場合において、認識結果の確認、訂正を行う場合にキー
操作を必要とせず、ただ言い直すだけで容易に入力訂正
を行なえる音声認識装置を得ることを目的とする。 【構成】 音声を入力するためのマイク11と、認識結
果を出力する結果出力部13と、複数の入力項目の全て
の標準パターンを格納する標準パターン格納部14と、
認識に用いる標準パターン群の指定等のタスク制御を行
う制御部15と、どの認識項目を入力中であるかを示す
入力項目ポインタ16と、2つの標準パターンを使用し
て入力された音声がいずれの標準パターンのものかを計
算処理しかつ正しく認識した場合の確認と訂正を判断す
る認識処理部12とを備えることを特徴とする音声認識
装置。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、マイクにより入力され
る音声が正しいかどうか認識処理して、複数項目の一連
の入力を行う場合の認識結果を、キー操作することなく
確認及び訂正する音声認識装置に関するものである。
【0002】
【従来の技術】近年、音声認識技術は機器への新しい入
力手段として注目されてきており、認識性能の向上に伴
って、ワープロやVTRのタイマー予約等の種々の機器
への応用が進められている。しかし、音声認識技術はま
だ完成された技術ではなく、100%正しく認識するわ
けではない。つまり、従来の音声認識装置においては、
発声者の音声の差異、発声の仕方、ノイズの影響等によ
って誤認識することがある。
【0003】詳細にいうと、従来の音声認識装置におけ
る誤認識対策は、入力された音声の認識結果を発声者に
何らかの方法により知らせ、発声者が正しい場合の確認
や訂正を、キー操作で行う方法が一般的である。例え
ば、音声認識装置は音声が入力されると認識結果を表示
器に出力し、使用者はその結果を見て認識状態を確認
し、認識結果が正しければ正しく認識したことを確認す
るキーを押し、間違っていれば訂正機能のキーを押して
認識結果の修正を行ったり、再度認識を行うことで誤認
識への対策をしている。
【0004】
【発明が解決しようとする課題】ところで、前述した音
声認識装置における誤認識対策技術にあっては、発声者
が自ら認識状態を見てキー操作により確認し、または訂
正する方法であるから、音声入力する際に種々の異なる
項目が複数個ある場合には、種々の問題を含むことにな
る。
【0005】即ち、異なる各項目毎に音声を入力をする
都度、いちいち確認のためのキー操作が必要となり、か
えって手間がかかり、音声によって入力する利点が薄れ
てしまう。だからといって、全項目を入力した後に一括
して確認作業を行うと、全て正しく認識した場合は問題
ないが、一つでも誤認識があるとその項目を呼出し訂正
するのに面倒な操作が必要となったり、訂正を忘れるこ
とがある。従って、このように音声による入力項目が複
数個ある場合は、音声認識装置の確認、訂正の操作性が
非常に悪くなってしまうという欠点があった。
【0006】本発明の目的は前述した従来の音声認識装
置の課題を解決するもので、複数個の異なる項目の一連
の音声入力を行う場合において、認識結果の確認、訂正
を行う場合にキー操作を必要とせず、ただ言い直すだけ
で容易に入力の訂正を行うことが可能な音声認識装置を
提供するにある。
【0007】
【課題を解決するための手段】この目的を達成するた
め、本発明は、音声を入力するためのマイクと、認識結
果を出力する結果出力部と、複数の入力項目の全ての標
準パターンを格納する標準パターン格納部と、認識に用
いる標準パターン群の指定等のタスク制御を行う制御部
と、どの認識項目を入力中であるかを示す入力項目ポイ
ンタと、2つの標準パターンを使用して入力された音声
がいずれの標準パターンのものかを計算処理しかつ正し
く認識した場合の確認と訂正を判断する認識処理部とを
備える音声認識装置を提案するものである。
【0008】
【作用】前述した本発明の構成によると、認識処理部で
は入力項目ポインタにより指示する入力項目と、その直
前に入力した項目の2つの標準パターンを同時に使用
し、これらの標準パターンに対して認識結果が比較判断
されることになる。従って、認識により得られた結果が
直前に入力した項目の言葉であれば、その入力が前の認
識結果の訂正であることが判断され、次の項目の言葉で
あれば、前回の入力が正しく認識されていることを確認
され、しかも次の項目が入力されたことが判断される。
この結果、確認や訂正のキー操作を一切必要とせずに、
認識結果の確認及び訂正を行うことができ、複数個の項
目の入力を行う場合でも、非常に操作性の良い音声認識
装置を実現できる。
【0009】
【実施例】以下、図面を用いて本発明の一実施例の詳細
を説明する。
【0010】図1は本発明による音声認識装置のブロッ
ク図であり、この音声認識装置は、音声を入力するマイ
ク11を有している。つまり、このマイク11からの音
声は、認識のための計算処理を行う認識処理部12に入
力され、この認識処理部12からの認識結果が表示器や
音声合成器等の結果出力部13に出力される。また、同
音声認識装置は、複数個の項目の全ての標準パターンを
格納する標準パターン格納部14、及び、どの認識項目
を入力中であるかを示す入力項目ポインタ16を有し、
制御部15が認識の際に入力項目ポインタ16の指示に
より標準パターン格納部14から2つの標準パターンを
指定する等のタスク制御が行なわれる。
【0011】このように構成された音声認識装置におい
て、複数項目の入力を必要とするシステムの一例とし
て、劇場のチケット予約を行う場合について説明する
と、劇場のチケット予約をする場合、必要となる入力項
目は、日付(月・日)、席の種類、チケット枚数であ
り、この4項目について、月・日、席の種類、枚数の順
序で必ず入力するものとする。
【0012】まず、認識に用いる標準パターンを用意す
る必要があり、この標準パターンは入力項目ごとにグル
ープ化されて標準パターン格納部14に記憶されてい
る。この例の場合は、「月」の項目の標準パターンとし
て、1月から12月の12語、「日」の項目の標準パタ
ーンとして、1日から31日の31語である。また、
「席の種類」の項目の標準パターンとして、S席、A
席、B席、C席の4語である。更に、「枚数」の項目の
標準パターンとして、1枚から10枚の10語である。
そして、この4つのグループの標準パターンが、予め標
準パターン格納部14に記憶されている。
【0013】入力項目ポインタ16は、どの認識項目を
入力中であるかを示すポインタであり、この例では上述
の4つの入力項目のうちの一つを指示し、指示する項目
は順次「月」から「枚数」へ移動する。入力操作を開始
するときには、最初の入力項目である「月」を指示する
ように初期化されるが、ここでは説明の都合上「月」の
項目の入力はすでに終わり、「日」の項目を指示してい
るものとする。
【0014】制御部15は、認識を行う際に、まず入力
項目ポインタ16を参照してその指示する項目の標準パ
ターンと、その一つ前の認識項目の標準パターンとを、
標準パターン格納部14より選択して認識処理部12に
入力する。この例では入力項目ポインタ16が上述のよ
うに「日」の項目を指示しているので、「日」の項目の
標準パターンと、その一つ前の認識項目である「月」の
項目の標準パターンが認識処理部12に入力されること
になる。
【0015】認識処理部12は、この入力された2つの
項目の標準パターンを同時に用いて、マイク11からの
次の入力音声に対して認識を行なわれるが、この例では
「月」と「日」の2つの項目の入力待ち状態となってい
る。
【0016】一方、結果出力部13は認識結果を出力す
るけれども、この例において「日」の項目の音声入力前
の時点では、前の認識項目である「月」の項目の入力に
対する認識結果が出力される。
【0017】次に、この例の場合の音声入力による認識
の作用について説明する。まず、発声者は結果出力部1
3による前の認識項目である「月」の認識結果を見て、
この認識結果が正しいものであれば、次の「日」の項目
の言葉を発声する。すると、その発声がマイク11によ
り認識処理部12に入力して、既に標準パターン格納部
14から入力されている「月」と「日」の2つの項目の
標準パターンとマッチング等の計算処理を行う。そこ
で、認識結果が「日」の項目の31語の中の言葉であれ
ば、前の「月」の項目の入力は正しく認識されて、次の
「日」の項目の入力を行ったものと判断され、この認識
結果が結果出力部13に出力される。また、認識結果は
制御部15にも入力され、この制御部15は新たに入力
項目ポインタ16を次の「席の種類」の項目に移動する
ように指示する。
【0018】一方、発声者が結果出力部13による前の
認識項目である「月」の認識結果を見て、この認識結果
が誤っている場合は、再び「月」の項目の言葉を発声す
る。すると今度は、その発声がマイク11により認識処
理部12に入力され、「月」と「日」の2つの項目の標
準パターンとマッチングされる際に、「月」の項目12
語の中の言葉であるため、前の「月」の項目の認識が誤
りでかつ訂正が行われたと判断される。そして、この訂
正された認識結果が再び結果出力部13に出力され、こ
の場合は制御部15で入力項目ポインタ16は移動しな
いように指示が行われる。
【0019】よって、このような処理が繰返し行なわれ
ると、順次必要な項目の入力が行われ、同時に認識結果
の確認が行われる。つまり、前述したチケット予約の例
では、キー等の操作を一切することなく、「月」、
「日」、「席の種類」、「枚数」の4つの入力項目をた
だ発声し、認識の間違いをした場合には、繰り返しその
項目を発声するだけでよいことになる。そして、最後の
「枚数」の項目の入力が終了したときには、チケットの
予約が完了する。
【0020】以上、本発明の実施例について説明した
が、音声入力される複数個の項目がいくつで、いかなる
順序の場合にも適応できるのは改めて指摘するまでもな
い。
【0021】
【発明の効果】以上説明したように、本発明の音声認識
装置によれば、認識に際して音声入力を2つの標準パタ
ーンと比較して確認または訂正を判断するように構成さ
れているので、確認や訂正のためにキー操作等の特別な
操作が不要になる。複数項目の音声入力の場合に、ただ
入力項目を次々に発声し、認識間違いをした場合にはそ
の都度その項目を発声し直すだけで、一連の項目の入力
を行うことができるので、簡単で操作性に優れた音声認
識装置を実現できる。
【図面の簡単な説明】
【図1】本発明の一実施例における音声認識装置のブロ
ック図
【符号の説明】
11 マイク 12 認識処理部 13 結果出力部 14 標準パターン格納部 15 制御部 16 入力項目ポインタ

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】音声を入力するためのマイクと、認識結果
    を出力する結果出力部と、複数の入力項目の全ての標準
    パターンを格納する標準パターン格納部と、認識に用い
    る標準パターン群の指定等のタスク制御を行う制御部
    と、どの認識項目を入力中であるかを示す入力項目ポイ
    ンタと、2つの標準パターンを使用して入力された音声
    がいずれの標準パターンのものかを計算処理しかつ正し
    く認識した場合の確認と訂正を判断する認識処理部とを
    備えることを特徴とする音声認識装置。
  2. 【請求項2】認識処理部は、直前に入力した項目の標準
    パターンと次に入力する項目の標準パターンを使用し、
    認識結果が直前に入力した項目のものであれば前の認識
    結果の訂正を判断し、次に入力する項目のものであれば
    前回の入力が正しいことを確認すると共に次の入力を判
    断することを特徴とする請求項1記載の音声認識装置。
  3. 【請求項3】標準パターン格納部は、複数の入力項目毎
    の標準パターンを、所定の順序で格納することを特徴と
    する請求項1記載の音声認識装置。
  4. 【請求項4】制御部は、入力項目ポインタにより指示さ
    れる項目の標準パターンと、その一つ前の項目の標準パ
    ターンとを標準パターン格納部から認識処理部に転送す
    ることを特徴とする請求項1記載の音声認識装置。
JP3230141A 1991-09-10 1991-09-10 音声認識装置 Expired - Lifetime JP2639249B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3230141A JP2639249B2 (ja) 1991-09-10 1991-09-10 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3230141A JP2639249B2 (ja) 1991-09-10 1991-09-10 音声認識装置

Publications (2)

Publication Number Publication Date
JPH0566794A true JPH0566794A (ja) 1993-03-19
JP2639249B2 JP2639249B2 (ja) 1997-08-06

Family

ID=16903230

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3230141A Expired - Lifetime JP2639249B2 (ja) 1991-09-10 1991-09-10 音声認識装置

Country Status (1)

Country Link
JP (1) JP2639249B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001083990A (ja) * 1999-09-09 2001-03-30 Toshiba Corp 音声認識装置および方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6027018A (ja) * 1983-07-22 1985-02-12 Casio Comput Co Ltd 音声入力方式
JPS6481998A (en) * 1987-09-25 1989-03-28 Nec Corp Voice recognition equipment
JPH0225897A (ja) * 1988-07-14 1990-01-29 Ricoh Co Ltd 音声ダイヤリング装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6027018A (ja) * 1983-07-22 1985-02-12 Casio Comput Co Ltd 音声入力方式
JPS6481998A (en) * 1987-09-25 1989-03-28 Nec Corp Voice recognition equipment
JPH0225897A (ja) * 1988-07-14 1990-01-29 Ricoh Co Ltd 音声ダイヤリング装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001083990A (ja) * 1999-09-09 2001-03-30 Toshiba Corp 音声認識装置および方法

Also Published As

Publication number Publication date
JP2639249B2 (ja) 1997-08-06

Similar Documents

Publication Publication Date Title
EP1430474B1 (en) Correcting a text recognized by speech recognition through comparison of phonetic sequences in the recognized text with a phonetic transcription of a manually input correction word
EP1619661A2 (en) System and method for spelled text input recognition using speech and non-speech input
JPS58195957A (ja) 音声によるプログラム実行方式
JPH0566794A (ja) 音声認識装置
EP1187441B1 (en) Audio recognition method and device for sequence of numbers
JPH1168920A (ja) 音声電話番号設定装置
JPH06161488A (ja) 音声認識装置
JPH1195792A (ja) 音声処理装置および文字入力方法
JPH08335094A (ja) 音声入力方法およびこの方法を実施する装置
JPS59117632A (ja) 音声入力方式
JPH04184398A (ja) 音声認識装置
JPH01191199A (ja) 音声入力装置
JPH0226239B2 (ja)
KR0173914B1 (ko) 음성 다이얼링 시스템에서의 명칭 검색 방법
JPH01154100A (ja) 音声認識結果確認方式
JPS6281699A (ja) 音声ワ−プロ装置における辞書作成及び更新方法
JPH05216493A (ja) オペレータ支援型音声認識装置
JPH06289899A (ja) 音声認識装置
JPS59144946A (ja) 音声タイプライタ制御方式
JPH0351898A (ja) 音声認識装置
JPS60120429A (ja) 音声入力装置
JPS5917597A (ja) 音声認識方式
JPH04177956A (ja) 音声ダイヤル装置のキーワード認識方法
JPH0567960B2 (ja)
JPH10124085A (ja) 音声認識装置及び認識方法

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080425

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090425

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100425

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110425

Year of fee payment: 14

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120425

Year of fee payment: 15

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120425

Year of fee payment: 15