JP2000010586A - 音声認識応答装置及び認識結果確認方法 - Google Patents

音声認識応答装置及び認識結果確認方法

Info

Publication number
JP2000010586A
JP2000010586A JP17516198A JP17516198A JP2000010586A JP 2000010586 A JP2000010586 A JP 2000010586A JP 17516198 A JP17516198 A JP 17516198A JP 17516198 A JP17516198 A JP 17516198A JP 2000010586 A JP2000010586 A JP 2000010586A
Authority
JP
Japan
Prior art keywords
recognition result
recognition
speech
input
result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP17516198A
Other languages
English (en)
Inventor
Naoko Yaoya
直子 八百屋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP17516198A priority Critical patent/JP2000010586A/ja
Publication of JP2000010586A publication Critical patent/JP2000010586A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 短時間でかつ容易に音声認識確認を行うこと
ができる方法を提供する。 【解決手段】 音声認識部1によって音声認識された認
識結果は、認識結果蓄積部2に蓄積されるとともに、音
声合成部3により合成されて発声される。入力者が合成
音を確認した結果、認識誤りが発生している場合には、
誤認した部分のみを再入力し、元の認識結果に、再入力
した認識結果を添付して、認識訂正アルゴリズム部5へ
送出する。認識訂正アルゴリズム部5では、元の認識結
果と再入力した認識結果を参照することによって、入力
音声の認識結果を訂正する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、任意の音声入力に
対して音声認識を行い、認識結果を合成音声によって出
力する音声認識応答装置における認識結果確認方法に関
する。
【0002】
【従来の技術】従来、音声入力装置において、入力され
た音声がどのように認識されたのかを確認する方法とし
て、認識結果から音声を合成し、合成された音声によっ
て入力者が入力内容を確認する方法が採用されている。
そして、入力誤りや認識誤りが発生した場合には、合成
音声によって再入力を促して入力を再度行う方式や、認
識率の高い単語や文節に区切って入力−認識−合成−確
認を常に繰り返す方法(特開昭60-98494号公報)等によ
り誤認識を防いでいる。
【0003】図6は、従来の音声認識応答装置における
認識結果確認方法における、認識誤りのあった場合に再
度初めから入力する例を示す処理フロー図である。図6
の方法においては、音声入力がすべて終了した時点で、
入力者が入力内容の確認の指示を出すと、音声応答装置
は、認識結果を合成音声によって出力する。認識誤りが
なければ、それを確認して終了するが、認識誤りがあれ
ば、再度始めから音声入力を行い、認識誤りがなくなる
まで繰り返す。
【0004】図7は、従来の他の処理フローの例を示す
図であり、音声を単語や文節に区切って入力し、一語毎
に確認し、誤りがあった場合に再入力するものであっ
て、図6の場合と比較して、認識効率をあげることがで
きる。
【0005】図8は、従来の音声認識結果を蓄積する認
識結果蓄積部の一例を示すものであり、図8(a)で
は、初めの認識結果に誤認があった場合には、同じ音声
入力の音声認識結果が再度蓄積される例を示しており、
メモリ容量が小さい場合には、図8(b)のように、初
めに蓄積した認識結果に誤認があった場合には、再度入
力された認識結果によって認識結果蓄積部を更新する。
【0006】図9及び図10は、従来の音声認識応答装
置における認識結果確認方法における、正常時及び認識
誤り発生時の処理シーケンスを示している。
【0007】
【発明が解決しようとする課題】図6に示した従来の方
法によれば、入力音声の大部分には認識誤りがなく、一
部にのみ認識誤りがある場合であっても、再度すべての
音声を入力し直す必要があり、入力から確認までの時間
がかかる為、例えば、電話回線経由で音声入力を行った
場合には、入力から確認までにかかった時間に対しても
課金されるため、入力者に対する負担が大きくなるとい
う問題がある。また、図7のように、認識効率をあげる
ために、単語や短い文節に区切って発音し入力する方法
では、入力者の手間がかかる上に、不自然に区切られた
場合や、類似語句が多い場合のときには逆に認識効率が
低くなるという問題点がある。
【0008】本発明の目的は、上記の問題点に鑑み、短
時間でかつ容易に音声認識確認を行うことができる方法
を提供することにある。
【0009】
【課題を解決するための手段】本発明の音声認識確認方
法は、音声認識応答装置によって音声認識された認識結
果を、入力者が確認した結果、認識誤りが発生している
場合には、誤認した部分のみを再入力し、元の認識結果
に、再入力した認識結果を添付して、認識訂正アルゴリ
ズム部へ送出し、認識訂正アルゴリズム部において、元
の認識結果と再入力した認識結果を参照することによっ
て、入力音声の認識結果を訂正することを特徴としてい
る。
【0010】具体的には、入力音声の認識結果は、逐次
認識結果蓄積バッファに蓄積される。入力終了や認識終
了を意味するDTMF(Dual Tone Multifrequency)を
入力者が入力すると、解析処理部は、認識結果蓄積バッ
ファに対して蓄積内容を音声合成部に出力するための制
御信号を出力する。
【0011】認識結果蓄積バッファより読み出された内
容は、音声合成部において音声合成され、出力音声とし
て出力される。
【0012】入力者は、この出力音声を確認し、認識誤
りがない場合には、確認完了を意味するDTMFを制御
信号として入力する。もし、認識誤りがある場合には、
入力者は、訂正したい部分のみを再度入力し、再入力し
た訂正部分に対して、同様の認識確認動作を行う。
【0013】認識結果蓄積バッファには、先の認識結果
と再入力された訂正部分の認識結果の両方が記憶され、
この両方の認識結果が認識訂正アルゴリズム部によって
読み出される。
【0014】認識訂正アルゴリズム部では、認識結果蓄
積バッファに記憶された最初の認識結果と再入力された
訂正部分の認識結果を照合し、例えば、両者の各文節の
類似度からその訂正個所を判定し、訂正を行って次処理
部へ出力する。
【0015】なお、制御信号は、必ずしもDTMFで入
力する必要はなく、仮に、入力者との明確なインタフェ
ースの中で、制御信号を出力する手段が別にあれば、そ
の手段を採用することができる。
【0016】
【発明の実施の形態】図1は、本発明の音声認識確認装
置の実施の形態を示すブロック図である。図1におい
て、音声認識部1は、入力音声を認識し、認識結果を認
識結果蓄積部2に出力する機能を有している。
【0017】認識結果蓄積部2は、音声認識部1から入
力された認識結果を蓄積し、解析処理部4からの制御信
号により、蓄積結果を音声合成部3あるいは認識訂正ア
ルゴリズム部5へ出力する機能と、訂正分を先の蓄積結
果に添付して認識訂正アルゴリズム部5あるいは音声合
成部3へ出力する機能を有している。
【0018】音声合成部3は、認識結果蓄積部2から出
力された情報に基づいて音声合成を行い、出力音声とし
て合成音声を出力する機能と、解析処理部4からの制御
信号によっては合成音声を認識結果蓄積部2に蓄積する
機能を有している。
【0019】解析処理部4は、入力信号を解析し、認識
結果蓄積部2、音声合成部3及び認識訂正アルゴリズム
部5に対して、それぞれ所定の制御信号を出力する機能
を有している。
【0020】認識訂正アルゴリズム部5は、認識結果蓄
積部2から入力された認識結果を参照して、所定の認識
結果訂正処理を行う機能を有している。
【0021】次に、本発明の音声入力動作について、図
1及び図2を参照して説明する。音声入力が開始されて
から入力終了信号が入力されるまでに入力された音声
は、音声認識部1で認識され、その認識結果は、認識結
果識別部2に蓄積される。
【0022】入力終了信号が解析処理部4に入力される
と、解析処理部4からの制御信号により、認識結果蓄積
部2に蓄積されている認識結果が音声合成部3に読み出
され、音声合成部3によって音声合成され、合成された
音声が出力される。
【0023】音声入力者は、この合成音声を確認し、出
力結果に認識誤りがない場合には確認完了制御信号を入
力する。その結果、この認識結果が認識訂正アルゴリズ
ム部5で訂正されることなく次処理部に出力される。
【0024】一方、出力結果に誤りが確認されたとき
は、入力者は、誤っていた文節のみを再度音声入力す
る。音声認識部1では、再入力された音声を認識し、そ
の認識結果を認識結果蓄積部2に蓄積する。そして、入
力終了信号が入力された時点で、音声合成部3により再
入力部分を認識結果蓄積部2から読み出し、音声合成し
て出力する。
【0025】音声入力者は、この合成音声を確認し、出
力結果に認識誤りがない場合は、解析処理部4へ確認完
了制御信号を入力する。解析処理部4は、この確認完了
制御信号を受けると、認識訂正アルゴリズム部5に対し
て、認識結果蓄積部2から、最初の認識結果及び訂正さ
れた文節部分の認識結果の両方を読み出すことを指示す
る。
【0026】認識訂正アルゴリズム部5では、認識結果
蓄積部2から読み出した、最初の認識結果と訂正された
文節部分とを照合して、訂正された文節部分を、最初の
認識結果の該当部分と置き換えることにより、認識結果
を訂正して次処理部へ出力する。
【0027】なお、再入力された文節部分の合成音声の
出力結果にも誤りが確認されたときは、誤っていた文節
の音声入力を再度行い、認識誤りがなくなるまで同様の
動作を繰り返す必要があるが、一般的には、その回数が
2回以上となることは希である。
【0028】また、音声入力者が本発明の認識結果確認
方法を有する音声認識確認装置の近傍に位置する場合に
は、解析処理部4への入力は、例えばスイッチによる入
力であってもかまわない。また、解析処理部4は、DT
MF受信部を有することができ、電話回線を経由した音
声入力の場合には、これを用いる様に設定することがで
きる。
【0029】図3は、本発明の認識結果蓄積部2におけ
る認識結果の蓄積状態の例を示しており、初めの認識結
果を記憶している領域の次の領域に、1度目の誤認部分
を再入力した認識結果が記憶され、更にその次の領域
に、1度目の誤認部分を再入力した認識結果に対する誤
認部分を再入力した認識結果が記憶される。
【0030】図4及び図5は、本発明の実施例の動作を
示すに処理シーケンスを表しており、図4は出力結果に
誤りがなかった場合、図5は出力結果に誤りが確認され
た場合の処理シーケンスを示している。
【0031】以下、図5を参照して本発明の実施例の動
作について説明する。音声入力が開始されると、音声識
別部1に対して、音声「住所変更のお知らせをします」
が入力されて音声認識が行われ、認識結果は、認識結果
蓄積部2に蓄積される。
【0032】続いて解析処理部4に入力終了制御信号が
入力されると、認識結果蓄積部2に蓄積された認識結果
が音声合成部3に読み出され、音声合成されて合成され
た音声「ジュウショヘンコウノオシラセヲシマス」が出
力される。
【0033】音声入力者は、この合成された音声に誤り
がないことを確認すると、解析処理部4に確認完了制御
信号を入力する。確認完了信号を受けた解析処理部4
は、認識結果蓄積部2に蓄積されている認識結果を、そ
のまま次処理部へ出力するように制御する。
【0034】次に、音声識別部1に対して、音声「千葉
県市原市」が入力され、同様に音声認識が行われ、認識
結果は、同様に認識結果蓄積部2に蓄積される。続いて
解析処理部4に入力終了制御信号が入力されると、認識
結果蓄積部2に蓄積された認識結果が音声合成部3に読
み出され、音声合成される。
【0035】このとき、合成された音声は「チバケンイ
チカワシ」と出力されているので、出力結果に誤りがあ
ることが確認され、音声入力者は、誤りのある文節「イ
チカワシ」に対して、音声にて「イ・チ・ハ・ラ・シ」
と再度入力した後、解析処理部4に入力終了制御信号を
出力する。
【0036】音声認識部1により認識された再入力音声
の認識結果は、同様にして認識結果蓄積部2に蓄積され
る。続いて解析処理部4に入力終了制御信号が入力され
ると、この蓄積された認識結果は音声合成部3に読み出
され、音声合成されて「イ・チ・ハ・ラ・シ」と出力さ
れる。
【0037】音声入力者は、この合成音声に誤りがない
ことを確認すると、解析処理部4に確認完了制御信号を
入力する。確認完了信号を受けた解析処理部4は、認識
結果蓄積部2に蓄積されている、元の認識結果「チバケ
ンイチカワシ」と再入力された認識結果「イ・チ・ハ・
ラ・シ」の両方を、認識訂正アルゴリズム部5へ出力す
るように制御する。
【0038】認識訂正アルゴリズム部5では、この両方
の認識結果「チバケンイチカワシ」と「イ・チ・ハ・ラ
・シ」を照合し、各文節の類似性を判断することによ
り、認識結果を「チバケンイチハラシ」と訂正して次処
理部へ出力する。
【0039】以上説明したように、本発明の確認方法
は、誤った文節の訂正のみを行えばよく、再入力する音
声が少なくてすむので、訂正が容易であり、また処理時
間も短縮される。
【0040】なお、前記実施の形態においては、認識結
果の確認を、音声合成部から出力した合成音声により行
っているが、次処理部に渡した結果を参照して認識結果
を確認することも可能である。例えば、次処理部にテキ
スト変換部を用意し、次処理部の出力として、テキスト
変換した結果をディスプレイ表示することによって確認
してもよい。
【0041】
【発明の効果】本発明の音声認識結果確認方法によれ
ば、従来のように認識率を向上させ、誤認識を低下させ
るべく単語毎に入力と確認を行っていく方法と比較し
て、はるかに短時間で認識確認を終了することができ
る。また、認識パターンの比較をおこない、確からしい
ものから順に出力して入力者に確認させる方法と比較し
て、誤認識の発生の有無によらず認識の度に確からしい
ものを数種類蓄積し誤認識に備えた処理を行わずにすむ
ため、余分な蓄積処理部を持たずにすみ、かつ、より高
速に認識を終了することができる。
【図面の簡単な説明】
【図1】本発明の構成を示す図である。
【図2】本発明の処理フローを示す図である。
【図3】本発明の認識結果蓄積部の一例を示す図であ
る。
【図4】本発明の処理シーケンス(正常時)を示す図で
ある。
【図5】本発明の処理シーケンス(認識誤り発生時)を
示す図である。
【図6】従来の処理フロー(認識誤りのあった場合に再
度初めから入力する例)を示す図である。
【図7】従来の処理フロー(一語毎確認し、誤りがあっ
た場合に再入力する例)を示す図である。
【図8】従来の認識結果蓄積部の一例を示す図である。
【図9】従来の処理シーケンス(正常時)を示す図であ
る。
【図10】従来の処理シーケンス(認識誤り発生時)を
示す図である。
【符号の説明】
1 音声認識部 2 認識結果蓄積部 3 音声合成部 4 解析処理部 5 認識訂正アルゴリズム部

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 音声入力を認識する音声認識手段と、前
    記音声認識手段によって認識された認識結果を蓄積する
    認識結果蓄積手段と、前記認識結果を確認する認識結果
    確認手段と、前記認識結果蓄積手段から読み出された認
    識結果に対して、所定の訂正処理を行う認識結果訂正処
    理手段と、入力信号を解析し前記認識結果蓄積手段、前
    記認識結果確認手段及び前記認識結果訂正手段に対して
    所定の制御信号を出力する解析処理手段とを備えた音声
    認識応答装置において、 前記認識結果蓄積手段は、最初に入力された音声の認識
    結果と、前記認識結果の訂正部分を蓄積する機能を有
    し、前記認識結果訂正手段は、前記認識結果蓄積手段に
    蓄積された前記最初に入力された音声の認識結果及び前
    記認識結果の訂正部分を基にして訂正された認識結果を
    出力する機能を有していることを特徴とする音声認識応
    答装置。
  2. 【請求項2】 前記認識結果確認手段は、前記認識結果
    蓄積手段から読み出された認識結果に基づいて音声合成
    を行い、合成音声を出力する音声合成手段によって構成
    されていることを特徴とする請求項1記載の音声認識応
    答装置。
  3. 【請求項3】 前記認識結果確認手段は、前記認識結果
    蓄積手段から読み出された認識結果をテキスト変換し、
    該テキスト変換された結果をディスプレイ表示する手段
    によって構成されていることを特徴とする請求項1記載
    の音声認識応答装置。
  4. 【請求項4】 前記認識結果訂正手段は、前記認識結果
    蓄積手段に蓄積された前記最初に入力された音声の認識
    結果及び前記認識結果の訂正部分を読み出し、両者を照
    合して、前記訂正部分を、前記最初に入力された音声の
    認識結果の該当部分と置き換えることにより、認識結果
    を訂正する機能を有していることを特徴とする請求項1
    記載の音声認識応答装置。
  5. 【請求項5】 入力者が発声する音声を入力して音声認
    識を行い、該音声認識した結果を確認して訂正する音声
    認識応答装置における認識結果確認方法において、 前記認識結果に認識誤りが確認されたときには、誤認し
    た部分のみを再音声入力して音声認識を行い、元の認識
    結果の前記誤認した部分を、前記再音声入力した認識結
    果により置き換えることを特徴とする音声認識応答装置
    における認識結果確認方法。
  6. 【請求項6】 前記元の認識結果及び前記再音声入力し
    た認識結果を照合することにより、前記元の認識結果を
    訂正することを特徴とする請求項5記載の音声認識応答
    装置における認識結果確認方法。
JP17516198A 1998-06-22 1998-06-22 音声認識応答装置及び認識結果確認方法 Pending JP2000010586A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP17516198A JP2000010586A (ja) 1998-06-22 1998-06-22 音声認識応答装置及び認識結果確認方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP17516198A JP2000010586A (ja) 1998-06-22 1998-06-22 音声認識応答装置及び認識結果確認方法

Publications (1)

Publication Number Publication Date
JP2000010586A true JP2000010586A (ja) 2000-01-14

Family

ID=15991339

Family Applications (1)

Application Number Title Priority Date Filing Date
JP17516198A Pending JP2000010586A (ja) 1998-06-22 1998-06-22 音声認識応答装置及び認識結果確認方法

Country Status (1)

Country Link
JP (1) JP2000010586A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002325103A (ja) * 2001-04-26 2002-11-08 Nec Corp 電子メールシステム、その処理方法及びそのプログラム
KR100560915B1 (ko) * 2001-06-30 2006-03-14 주식회사 케이티 음성인식 결과값을 이용한 인식음성의 저장방법
CN105210147A (zh) * 2014-04-22 2015-12-30 科伊基股份有限公司 用于改进至少一个语义单元集合的方法、设备及计算机可读记录介质
JP2017167368A (ja) * 2016-03-16 2017-09-21 株式会社東芝 音声認識誤り修正装置、方法及びプログラム

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002325103A (ja) * 2001-04-26 2002-11-08 Nec Corp 電子メールシステム、その処理方法及びそのプログラム
KR100560915B1 (ko) * 2001-06-30 2006-03-14 주식회사 케이티 음성인식 결과값을 이용한 인식음성의 저장방법
CN105210147A (zh) * 2014-04-22 2015-12-30 科伊基股份有限公司 用于改进至少一个语义单元集合的方法、设备及计算机可读记录介质
JP2016521383A (ja) * 2014-04-22 2016-07-21 キューキー インコーポレイテッドKeukey Inc. 少なくとも一つの意味論的単位の集合を改善するための方法、装置およびコンピュータ読み取り可能な記録媒体
CN110675866A (zh) * 2014-04-22 2020-01-10 纳宝株式会社 用于改进至少一个语义单元集合的方法、设备及计算机可读记录介质
CN110675866B (zh) * 2014-04-22 2023-09-29 纳宝株式会社 用于改进至少一个语义单元集合的方法、设备及计算机可读记录介质
JP2017167368A (ja) * 2016-03-16 2017-09-21 株式会社東芝 音声認識誤り修正装置、方法及びプログラム

Similar Documents

Publication Publication Date Title
US6725197B1 (en) Method of automatic recognition of a spelled speech utterance
US5832063A (en) Methods and apparatus for performing speaker independent recognition of commands in parallel with speaker dependent recognition of names, words or phrases
US7974843B2 (en) Operating method for an automated language recognizer intended for the speaker-independent language recognition of words in different languages and automated language recognizer
JP2001509285A (ja) 話者依存及び話者非依存音声認識を用いた多局ネットワークの音声制御された機能を作動する方法及び装置
JPH10187709A (ja) 音声認識中に可変数の代替ワードを表示する方法及びシステム
JPH10133684A (ja) 音声認識中に代替ワードを選択する方法及びシステム
JPH10187406A (ja) 音声認識中に認識されたワードをバッファする方法及びシステム
JPH10133685A (ja) 連続音声認識中にフレーズを編集する方法及びシステム
EP0848536A2 (en) Statistical database correction of alphanumeric account numbers for speach recognition and touch-tone recognition
JP2006505002A5 (ja)
US6212497B1 (en) Word processor via voice
US5781887A (en) Speech recognition method with error reset commands
JP2000259178A (ja) 音声認識装置
JP2000010586A (ja) 音声認識応答装置及び認識結果確認方法
JP2006058390A (ja) 音声認識装置
EP1500081A1 (en) Method and system for speech recognition of symbol sequences
EP1187441B1 (en) Audio recognition method and device for sequence of numbers
JPH10187184A (ja) 認識された音声を修正するときに認識されたワードを選択する方法及びシステム
JP2004046106A (ja) 音声認識装置及び音声認識プログラム
JP2646080B2 (ja) 音声認識方法
JPH08328580A (ja) 単語列認識方法及び装置
JP4282354B2 (ja) 音声認識装置
US20200168221A1 (en) Voice recognition apparatus and method of voice recognition
JP2005283797A (ja) 音声認識装置および音声認識方法
JPH1063295A (ja) 認識結果を自動訂正する単語音声認識方法およびこの方法を実施する装置