JPH02265000A - 音声対話装置 - Google Patents

音声対話装置

Info

Publication number
JPH02265000A
JPH02265000A JP1085652A JP8565289A JPH02265000A JP H02265000 A JPH02265000 A JP H02265000A JP 1085652 A JP1085652 A JP 1085652A JP 8565289 A JP8565289 A JP 8565289A JP H02265000 A JPH02265000 A JP H02265000A
Authority
JP
Japan
Prior art keywords
user
input
recognition
voice
section
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1085652A
Other languages
English (en)
Inventor
Takashi Aso
隆 麻生
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP1085652A priority Critical patent/JPH02265000A/ja
Publication of JPH02265000A publication Critical patent/JPH02265000A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は音声により人間と対話をする音声対話装置に関
するものである。
[従来の技術] 音声により人間と対話をする音声対話装置の使用例とし
ては、電話による座席予約システム(飛行機や列車など
)がある、このシステムでは、音声対話装置が使用者に
対して必要事項を順に尋ねていき、使用者がその項目に
ついて数字や他の指定された簡単な単語(“ハイ““イ
イエ”など)で答えて、予約作業を進める。
このようなシステムを音声コミュニケーション・システ
ムと呼ぶことにする。
[発明が解決しようとしている課題] しかしながら、従来の音声認識技術では不特定な話者に
対して100%の認識率が保障されていないために、入
力された音声が正しく認識できているかを使用者に聞き
かえしたり、認識できなかった場合にはもう一度発声を
うながすといった工夫が講じられてきた。すなわち1次
に示す例のような対話がなされてきた。
1)認識結果を使用者に確認させる例 システム:「何時の列車ですか、」 使用者:「8時、」 システム:「8時ですね、」 使用者:「ハイ、」 2)認識不可能で聞き返す例 システム: 「何時の列車ですか、」 使用者:「8時、」 システム: 「認識できません、もう−度お願いします
使用者:「8時、」 システム:「8時ですね、」 使用者=「ハイ、」 このように、従来の音声対話装置を使用した音声コミユ
テーシヨン・システムでは対話内容に重複部分が多く、
使用者からすると非常にまどろっこしく、効率的ではな
いという欠点があった。また、誤認識あるいは認識でき
なかった場合に、どのような原因あるいは理由で誤!g
識が生じあるいは認識できなつかたのかが使用者にフィ
ードバックされないために、使用者が再入力する際にど
こに注意して発声したら良いがわからず、再入力の繰返
しという悪循環が生じるという欠点があった。
本発明は、前記従来の欠点を除去し、再入力の際に使用
者が容易に認識結果を知り、再入力の際の認識を容易に
する音声対話装置を提供する。
[課題を解決するための手段] この課題を解決するために、本発明の音声対話装置は、
音声による対話が可能な音声対話装置であって、 入力音声の認識できなかった区間の検出を行なう認識不
可能区間検出手段と、該認識不可能区間検出手段により
得られた認識できなかった区間を認識結果の情報を付加
して使用者に報知する認識不可能区間報知手段とを備え
る。
[作用] かかる構成にお、いて、認識できなかった区間を認識結
果の情報を付加して使用者に報知することにより、使用
者が容易に認識結果を知り、再入力の際の認識を容易に
する。
[実施例] 第1図は本実施例の音声対話装置の構成を示すブロック
図である。
同図において、1は入力音声波形を認識処理に適したパ
ラメータに変換するパラメータ変換部、2はパラメータ
変換部1より得られる入力パラメータと標準パターンの
パラメータとの距離計算を行ない入力音声の認識を行な
う認識部、3は標準パターンのパラメータを記憶してお
く標準パターン記憶部、4は認識部2の距離計算の結果
(これを得点ということにする)の比較を行なう得点比
較部、5は音声対話装置全体の制御を行なう対話制御部
、6は認識部2で認識できなかった区間を検出する認識
不可能区間検出部、7は使用者に対して再入力を促すた
めのメツセージを作成する任意文章生成部、8は使用者
に対して出力する定まったメツセージを予め登録してお
く定型文章記憶部、9は任意文章生成部7あるいは定型
文章記憶部8からの文章を音声波形に変換して使用者に
出力する音声生成部である。
第2図は本実施例の音声対話装置の動作を示すフローチ
ャートである。以下、第2図のフローチャートに沿って
、本実施例の音声対話装置の動作を説明する。
まず、ステップS1で対話制御部5は利用者に対して入
力を促すようなメツセージを定型文章記憶部8より選ん
で、音声生成部9で音声に変換して利用者に出力する。
ステップS2で利用者からの上記メツセージに対する答
えの入力を待つ、音声が入力されたならばステップS3
に進んで、パラメータ変換部1において特徴パラメータ
に変換する0次に、ステップS4では認識部2でパラメ
ータ変換部1で生成された入カバターンのパラメータ列
と、標準パターン記憶部3に記憶されている標準パター
ンのパラメータ列との距離計算を行う、この距離計算の
方法としては、DPマツチングの手法などの従来の技術
を用いることができ、距離が小さいものに対して高い得
点を与える。
ステップS5で標準パターン中に入カバターンに類似し
たパターンが存在するか否かを判断する。この判断方法
には、例えばステップS4における距離計算の得点結果
がある値以上になる標準パターンが一つも存在しなけれ
ば、入力音声は認識不可能であると判断する方法などが
考えられる。ステップS5において認識不可能であると
判断された場合はステップS6へ進み、標準パターン中
に入カバターンと類似したパターンが存在する場合には
、得点の高いものからいくつかを候補として出力してス
テップS8へ進む。
ステップS6では、認識できない区間の検出を行う0例
えば本例の“イチ・サン・ゴ・ハチ(1358)“とい
う入力音声に対して認識不可能という判断が下された場
合に、どこで認識できなくなったかを調べる。このため
の方法としては、DPマツチング法の場合を例にとれば
、時間伸縮関数(DPパスの糸路)を調べていき整合窓
と交わる時点において認識不可能になったと判断する方
法などが考えられる。
第3図は上記DPマツチング法による認識不可能の判断
方法を説明する図である。
第3図に示すようにDPマツチング法には、時間軸の伸
縮を所定範囲内に制限して禁止領域を設け、無意味な伸
縮を押さえ誤認識を防いでいる。禁止領域以外の伸縮を
容認する範囲を整合窓と呼び、又整合窓と禁止領域を区
分けする直線の傾きを傾斜制限と呼んでいる。
ここで、本例では実線で示すように整合窓内にその糸路
を持つDPパスの場合は、認識可能な対象とするが、破
線で示すようにDPパスが整合窓から境を越えて禁止領
域に入ってしまう場合、これを整合窓と交わると呼び、
この時点で認識不可能になったと判断する。尚、傾斜制
限により判断を行っても良い。
いま、前列において“ゴの部分が認識できなかったとす
る。ステップS7では任意文章生成部7において認識で
きなかったことを使用者に伝えるための再入力用メツセ
ージを作成する。このとき使用者に対して、どこまで認
識できてどこからできなかったのかを知らせて、再入力
時に使用者が発声し易いような環境を作る。
例えば、前列においては システム:r13(イチ・サン)まで認識できましたが
、そのあとが認識できま せんでした。もう−度発声して 下さい」、あるいは システム、r13(イチ・サン)のあとが認識できませ
んでした。3(サン)の 次よりもう一度発声して下さい」 といったメツセージを作成する。
ステップS7で作成されたメツセージは、ステップSl
lで音声生成部9で音声化され、ステップS2に戻って
使用者からの再入力を待つ。
ステップS5で標準パターン中に入カバターンの候補が
存在する場合には、ステップS8に進んで、得点比較部
4において候補の得点を比較する。そして、ステップS
9で、1番目の候補と2番目以降の候補の得点に大きな
差がある場合には候補が唯一にしぼられたと判断し、得
点の1番高い候補を認識結果として対話制御部5に出力
する。対話制御部5は確定された入力情報を外部の処理
装置に渡す、この場合、すべての入力処理が終了してい
なければ、ステップS12からステップSSIに戻って
次の対話に制御を移す。
ステップS8の得点比較において、1番目の候補と2番
目の候補の得点差が小さい場合には、候補を1つにしぼ
ることができないので、ステップS9からステップSI
Oに進んで、使用者に対して再入力を要請するためのメ
ツセージを作成する0例えば、使用者が”イチ・サン・
ゴ・ハチ(l・3・5・8)”と発声した入力に対して
、認識部2において“イチ・サン・り・ハチ(1・3・
9・8)”と“イチ・サン・ゴ・ハチ(1・3・5・8
)”の2つの候補が近い得点で認識されたとき、任意文
章生成部9では、 システム: [398(イチ・サン・キュー・ハチ)か
1358(イチ・サン・ ゴ・ハチ)なのかわかりません。
もう−度発声して下さい」 あるいは システム: r1398 (イチ・サン・キュー・ハチ
)ですか1358(イチ・ サン・ゴ・ハチ)ですか、もう 一度発声して下さい」 といったメツセージを作成する。ステップSIOで作成
されたメツセージは、ステップSllで音声生成部9に
より音声化され、使用者に対して出力される。そして、
ステップS2にもどって使用者からの再入力を待つ。
なお、本実施例に限定されることなく、種々の変形が可
能である9例えばステップSIOにおいて作成されるメ
ツセージ内容は、上記実施例では第1番目の候補と第2
番目の候補を両方ともメツセージに織り込むようになっ
ているが、どちらか一方だけをおり込むようにしてもよ
い。
その場合、 システム、r1398 (イチ・サン・キュー・ハチ)
でよろしいですか、よろし ければ“へイ“ ちがうときは もう−度発声して下さい」 といったメツセージを作成する。
またこのとき、わざと第2番目の候補だけをメツセージ
に織り込むようにしてもよい、このときは、第1番目の
候補は音声対話装置中に保持しておき、再入力された音
声の認識処理の結果、再入力の第1番目の候補が保持さ
れている前の第1番目の候補と同じであれば、再入力の
候補の得点差に関係なく、その候補が認識結果として出
力されるようにする。
例をあげると、 利用者の発声がr1398Jであった場合に、認識シス
テムでの認識結果の第1候補が「1398」第2候補が
r1358Jであり、利用者に対して確認を求めたい場
合にメツセージとしては、次のように第2候補をメツセ
ージに織り込む。
システム:「1358(イチ・サン・ゴ・ハチ)でよろ
しいですか、よろし ければ“ハイ“ ちがうときは もう−度発声して下さい」 このようなメツセージを作成すれば、利用者はどの部分
が認識されていないかを確かめた上で再入力発声をする
ことができる。
以上説明したように、音声コミュニケーション・システ
ムにおいて、音声対話装置側からの応答メツセージに認
識時の誤認識に対して、どのように誤認識したのか、あ
るいはどの部分が認識できなかったのかなどの誤認識情
報を織り込み、使用者にフィードバックさせることによ
り、使用者にとっては再入力し易く、又、音声対話装置
にとっても再入力の際の認識を容易にする効果がある。
[発明の効果] 本発明により、再入力の際に使用者が容易に認識結果を
知り、再入力の際の認識を容易にする音声対話装置を提
供できる。
【図面の簡単な説明】
第1図は本実施例の音声対話装置の構成を示すブロック
図、 第2図は本実施例の音声対話装置の動作を示すフローチ
ャート、 第3図はDPマツチングにおける認識不可能の判断方法
を説明する図である。 図中、l・・・はパラメータ変換部、2・・・認識部、
3・・・標準パターン記憶部、4・・・得点比較部、5
−・音声対話制御部、6・・・認識不可能区間検出部、
7・・・任意文章生成部、8・・・定型文章記憶部であ
る。

Claims (1)

    【特許請求の範囲】
  1. (1)音声による対話が可能な音声対話装置であつて、 入力音声の認識できなかつた区間の検出を 行なう認識不可能区間検出手段と、 該認識不可能区間検出手段により得られた認識できなか
    つた区間を認識結果の情報を付加して使用者に報知する
    認識不可能区間報知手段とを備えることを特徴とする音
    声対話装置。
JP1085652A 1989-04-06 1989-04-06 音声対話装置 Pending JPH02265000A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1085652A JPH02265000A (ja) 1989-04-06 1989-04-06 音声対話装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1085652A JPH02265000A (ja) 1989-04-06 1989-04-06 音声対話装置

Publications (1)

Publication Number Publication Date
JPH02265000A true JPH02265000A (ja) 1990-10-29

Family

ID=13864761

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1085652A Pending JPH02265000A (ja) 1989-04-06 1989-04-06 音声対話装置

Country Status (1)

Country Link
JP (1) JPH02265000A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05241589A (ja) * 1991-12-05 1993-09-21 Internatl Business Mach Corp <Ibm> 非ユーザ基準データから生成される話者依存的プロトタイプを有する音声コード化装置
JPH07219961A (ja) * 1994-01-31 1995-08-18 Hitachi Ltd 音声対話システム
JP2002502992A (ja) * 1998-02-03 2002-01-29 デテモビール ドイチェ テレコム モビールネット ゲーエムベーハー 音声認識システムにおける認識率向上方法及び装置
WO2011145169A1 (ja) * 2010-05-18 2011-11-24 三菱電機株式会社 エレベーターの呼び登録装置
TWI482038B (zh) * 2012-12-12 2015-04-21 Univ Nat Sun Yat Sen 近似複本之偵測方法

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05241589A (ja) * 1991-12-05 1993-09-21 Internatl Business Mach Corp <Ibm> 非ユーザ基準データから生成される話者依存的プロトタイプを有する音声コード化装置
JPH07219961A (ja) * 1994-01-31 1995-08-18 Hitachi Ltd 音声対話システム
JP2002502992A (ja) * 1998-02-03 2002-01-29 デテモビール ドイチェ テレコム モビールネット ゲーエムベーハー 音声認識システムにおける認識率向上方法及び装置
WO2011145169A1 (ja) * 2010-05-18 2011-11-24 三菱電機株式会社 エレベーターの呼び登録装置
CN102892697A (zh) * 2010-05-18 2013-01-23 三菱电机株式会社 电梯呼梯登记装置
JP5423884B2 (ja) * 2010-05-18 2014-02-19 三菱電機株式会社 エレベーターの呼び登録装置
TWI482038B (zh) * 2012-12-12 2015-04-21 Univ Nat Sun Yat Sen 近似複本之偵測方法

Similar Documents

Publication Publication Date Title
WO2021159688A1 (zh) 声纹识别方法、装置、存储介质、电子装置
JP3284832B2 (ja) 音声認識対話処理方法および音声認識対話装置
US5860059A (en) Transaction system based on a bidirectional speech channel by status graph building and problem detection for a human user
EP0121248B1 (en) Speaker verification system and process
US20170194000A1 (en) Speech recognition device and speech recognition method
US8185400B1 (en) System and method for isolating and processing common dialog cues
WO2006083020A1 (ja) 抽出された音声データを用いて応答音声を生成する音声認識システム
JP2008033198A (ja) 音声対話システム、音声対話方法、音声入力装置、プログラム
JPH02265000A (ja) 音声対話装置
JP2002123289A (ja) 音声対話装置
JP7339116B2 (ja) 音声認証装置、音声認証システム、および音声認証方法
Litman et al. Predicting user reactions to system error
WO2007111169A1 (ja) 話者認識システムにおける話者モデル登録装置及び方法、並びにコンピュータプログラム
JPH11175093A (ja) 音声認識確認応答方法
JP6966374B2 (ja) 音声認識システム及びコンピュータプログラム
JPH08263092A (ja) 応答音声生成方法および音声対話システム
JPH11143488A (ja) 音声認識装置
KR20230070523A (ko) 텍스트 종속 화자 검증 피처들의 자동 생성 및/또는 사용
JPH09230889A (ja) 音声認識応答装置
JP6999236B2 (ja) 音声認識システム
CN111055291A (zh) 引导机器人系统和引导方法
JP2001236091A (ja) 音声認識結果の誤り訂正方法およびその装置
JPH06161488A (ja) 音声認識装置
JP2018173456A (ja) 対話ロボットおよびロボット制御プログラム
Niimi et al. Analysis of interactive strategy to recover from misrecognition of utterances including multiple information items