JP3077746B2 - 音声対話方法及び音声対話装置 - Google Patents
音声対話方法及び音声対話装置Info
- Publication number
- JP3077746B2 JP3077746B2 JP09207935A JP20793597A JP3077746B2 JP 3077746 B2 JP3077746 B2 JP 3077746B2 JP 09207935 A JP09207935 A JP 09207935A JP 20793597 A JP20793597 A JP 20793597A JP 3077746 B2 JP3077746 B2 JP 3077746B2
- Authority
- JP
- Japan
- Prior art keywords
- voice
- guidance
- output
- recognition
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Document Processing Apparatus (AREA)
- Telephonic Communication Services (AREA)
- Machine Translation (AREA)
Description
【0001】
【発明の属する技術分野】本発明は、主として音声ガイ
ダンスの出力及びユーザの音声入力に際して動作処理を
行う音声対話方法及び音声対話装置に関する。
ダンスの出力及びユーザの音声入力に際して動作処理を
行う音声対話方法及び音声対話装置に関する。
【0002】
【従来の技術】従来、この種の音声対話装置では、利用
方法を熟知したユーザが使用した場合には音声ガイダン
スの内容を全て聞く必要が無いため、ユーザが効率的な
対話を行い得るように音声ガイダンスの内容を適切なタ
イミングで停止する動作処理が必要になっている。
方法を熟知したユーザが使用した場合には音声ガイダン
スの内容を全て聞く必要が無いため、ユーザが効率的な
対話を行い得るように音声ガイダンスの内容を適切なタ
イミングで停止する動作処理が必要になっている。
【0003】こうした動作処理機能を考慮した周知技術
としては、例えば特開平8−265440号公報に開示
された音声認識応答装置が挙げられる。この音声認識応
答装置では、電話を介して行われる音声対話に際し、ユ
ーザが予め決められた番号のPBトーン入力を行うこと
により、出力中の音声ガイダンスの内容をスキップする
ことが可能となっている。
としては、例えば特開平8−265440号公報に開示
された音声認識応答装置が挙げられる。この音声認識応
答装置では、電話を介して行われる音声対話に際し、ユ
ーザが予め決められた番号のPBトーン入力を行うこと
により、出力中の音声ガイダンスの内容をスキップする
ことが可能となっている。
【0004】又、特開平8−146991号公報に開示
された情報処理装置及びその制御方法では、音声ガイダ
ンス出力中に音声入力があったときにその音声ガイダン
スの内容を動作停止し、音声入力の認識結果に応じて音
声ガイダンスを出力再開するか、或いは音声ガイダンス
を出力停止するかを決定するようになっている。
された情報処理装置及びその制御方法では、音声ガイダ
ンス出力中に音声入力があったときにその音声ガイダン
スの内容を動作停止し、音声入力の認識結果に応じて音
声ガイダンスを出力再開するか、或いは音声ガイダンス
を出力停止するかを決定するようになっている。
【0005】因みに、音声対話及び音声認識に関連する
その他の周知技術としては、例えば特開平5−3239
93号公報に開示された音声対話システム、特開平6−
208389号公報に開示された情報処理方法及び装
置、特開平7−72895号公報に開示された音声対話
システム、特開平8−263092号公報に開示された
応答音声生成方法及び音声対話システム、特開平8−2
97498号公報に開示された音声認識対話装置等が挙
げられる。
その他の周知技術としては、例えば特開平5−3239
93号公報に開示された音声対話システム、特開平6−
208389号公報に開示された情報処理方法及び装
置、特開平7−72895号公報に開示された音声対話
システム、特開平8−263092号公報に開示された
応答音声生成方法及び音声対話システム、特開平8−2
97498号公報に開示された音声認識対話装置等が挙
げられる。
【0006】
【発明が解決しようとする課題】上述した音声ガイダン
スの内容を適切なタイミングで停止する動作処理機能を
有する装置の場合、ユーザの発声による音声入力を音声
認識処理した認識結果に対応して予め定められた内容の
音声ガイダンスがユーザに対して出力されるものである
ため、現在出力中の音声ガイダンスの内容をスキップさ
せたり、或いは停止させるのみであり、ユーザはそれ以
降の対話で仮に音声ガイダンスの冒頭部を聞いた後にス
キップや停止することが可能であっても、依然として不
必要な音声ガイダンスを聞かざるを得ないという問題が
ある。
スの内容を適切なタイミングで停止する動作処理機能を
有する装置の場合、ユーザの発声による音声入力を音声
認識処理した認識結果に対応して予め定められた内容の
音声ガイダンスがユーザに対して出力されるものである
ため、現在出力中の音声ガイダンスの内容をスキップさ
せたり、或いは停止させるのみであり、ユーザはそれ以
降の対話で仮に音声ガイダンスの冒頭部を聞いた後にス
キップや停止することが可能であっても、依然として不
必要な音声ガイダンスを聞かざるを得ないという問題が
ある。
【0007】又、ユーザが如何にしてアプリケーション
プログラム(AP)と対話して良いか分からない場合
や、ユーザが特異な話者であって入力音声の認識が円滑
に行われない場合等の処理保留中には音声ガイダンスの
情報を十分に入手することができなくなるという欠点も
ある。
プログラム(AP)と対話して良いか分からない場合
や、ユーザが特異な話者であって入力音声の認識が円滑
に行われない場合等の処理保留中には音声ガイダンスの
情報を十分に入手することができなくなるという欠点も
ある。
【0008】本発明は、このような問題点を解決すべく
なされたもので、その技術的課題は、不必要な音声ガイ
ダンスの内容を効果的に排除するための動作処理を行い
得ると共に、処理保留中にも音声ガイダンスの内容を十
分に入手し得る音声対話方法及び音声対話装置を提供す
ることにある。
なされたもので、その技術的課題は、不必要な音声ガイ
ダンスの内容を効果的に排除するための動作処理を行い
得ると共に、処理保留中にも音声ガイダンスの内容を十
分に入手し得る音声対話方法及び音声対話装置を提供す
ることにある。
【0009】
【課題を解決するための手段】本発明によれば、ユーザ
の発声による音声入力を音声認識処理した認識結果に対
応して予め定められた内容の音声ガイダンスを該ユーザ
に対して出力する音声対話方法であって、ユーザによる
使用開始時に音声ガイダンスにおける所定の内容のもの
を出力すると共に、音声入力による発声の音声認識処理
に際して該音声ガイダンスにおける認識結果に対応する
特定の情報が存在する特定の位置を検索し、該検索した
該特定の位置までスキップして該特定の情報の出力を行
う音声対話方法が得られる。
の発声による音声入力を音声認識処理した認識結果に対
応して予め定められた内容の音声ガイダンスを該ユーザ
に対して出力する音声対話方法であって、ユーザによる
使用開始時に音声ガイダンスにおける所定の内容のもの
を出力すると共に、音声入力による発声の音声認識処理
に際して該音声ガイダンスにおける認識結果に対応する
特定の情報が存在する特定の位置を検索し、該検索した
該特定の位置までスキップして該特定の情報の出力を行
う音声対話方法が得られる。
【0010】一方、本発明によれば、ユーザの発声によ
る音声入力を音声認識処理した認識結果に対応して予め
定められた内容の音声ガイダンスを該ユーザに対して出
力する出力制御手段を備えた音声対話装置であって、出
力制御手段は、ユーザによる使用開始時に音声ガイダン
スにおける所定の内容のものを出力すると共に、音声入
力による発声の音声認識処理に際して該音声ガイダンス
における認識結果に対応する特定の情報が存在する特定
の位置を検索し、該検索した該特定の位置までスキップ
して該特定の情報の出力を行う音声対話装置が得られ
る。
る音声入力を音声認識処理した認識結果に対応して予め
定められた内容の音声ガイダンスを該ユーザに対して出
力する出力制御手段を備えた音声対話装置であって、出
力制御手段は、ユーザによる使用開始時に音声ガイダン
スにおける所定の内容のものを出力すると共に、音声入
力による発声の音声認識処理に際して該音声ガイダンス
における認識結果に対応する特定の情報が存在する特定
の位置を検索し、該検索した該特定の位置までスキップ
して該特定の情報の出力を行う音声対話装置が得られ
る。
【0011】又、本発明によれば、上記音声対話装置に
おいて、音声ガイダンスの内容を記憶したガイダンス記
憶手段と、音声ガイダンスの内容における音声認識処理
による認識結果に対応する特定の情報が該音声ガイダン
ス中のどの位置に存在するかを示す特定の位置を検索可
能に記憶する情報位置記憶手段と、装置の使用開始及び
使用終了を検出する装置使用検出手段とを備え、出力制
御手段は、装置使用検出手段が使用開始を検出したとき
に音声ガイダンスの所定の内容のものを出力指示すると
共に、認識結果に従って対話の流れを管理し、該認識結
果が送られてきたときに情報位置記憶手段における該音
声ガイダンスにあっての特定の情報に対応する特定の位
置を検索して調べて該特定の情報を出力する対話制御部
を備えた音声対話装置が得られる。
おいて、音声ガイダンスの内容を記憶したガイダンス記
憶手段と、音声ガイダンスの内容における音声認識処理
による認識結果に対応する特定の情報が該音声ガイダン
ス中のどの位置に存在するかを示す特定の位置を検索可
能に記憶する情報位置記憶手段と、装置の使用開始及び
使用終了を検出する装置使用検出手段とを備え、出力制
御手段は、装置使用検出手段が使用開始を検出したとき
に音声ガイダンスの所定の内容のものを出力指示すると
共に、認識結果に従って対話の流れを管理し、該認識結
果が送られてきたときに情報位置記憶手段における該音
声ガイダンスにあっての特定の情報に対応する特定の位
置を検索して調べて該特定の情報を出力する対話制御部
を備えた音声対話装置が得られる。
【0012】更に、本発明によれば、上記音声対話装置
において、ユーザが発声により音声入力を入力する音声
入力手段と、音声入力に対して音声認識処理を行う音声
認識手段と、音声認識処理に際して用いる認識用辞書デ
ータを記憶した認識用辞書記憶手段とを備え、音声認識
手段は認識結果を認識用辞書データを用いて音声認識処
理した結果により得て対話制御部へ送出する音声対話装
置が得られる。
において、ユーザが発声により音声入力を入力する音声
入力手段と、音声入力に対して音声認識処理を行う音声
認識手段と、音声認識処理に際して用いる認識用辞書デ
ータを記憶した認識用辞書記憶手段とを備え、音声認識
手段は認識結果を認識用辞書データを用いて音声認識処
理した結果により得て対話制御部へ送出する音声対話装
置が得られる。
【0013】加えて、本発明によれば、上記何れかの音
声対話装置において、出力制御手段は、対話制御部から
の出力指示に従ってガイダンス記憶手段における音声ガ
イダンスの内容を出力する音声出力手段を備えた音声対
話装置が得られる。
声対話装置において、出力制御手段は、対話制御部から
の出力指示に従ってガイダンス記憶手段における音声ガ
イダンスの内容を出力する音声出力手段を備えた音声対
話装置が得られる。
【0014】他方、本発明によれば、上記音声対話装置
において、音声出力手段は、対話制御部の制御により情
報位置記憶手段から特定の位置を示す情報が送られたと
きに音声ガイダンスにおける出力中の内容のものを停止
して該特定の位置までスキップした後に該特定の位置に
対応する該特定の情報を再出力する音声対話装置が得ら
れる。
において、音声出力手段は、対話制御部の制御により情
報位置記憶手段から特定の位置を示す情報が送られたと
きに音声ガイダンスにおける出力中の内容のものを停止
して該特定の位置までスキップした後に該特定の位置に
対応する該特定の情報を再出力する音声対話装置が得ら
れる。
【0015】
【発明の実施の形態】以下に実施例を挙げ、本発明の音
声対話方法及び音声対話装置について、図面を参照して
詳細に説明する。
声対話方法及び音声対話装置について、図面を参照して
詳細に説明する。
【0016】最初に、本発明の音声対話方法の概要を簡
単に説明する。この音声対話方法は、ユーザの発声によ
る音声入力を音声認識処理した認識結果に対応して予め
定められた内容の音声ガイダンスをユーザに対して出力
する際、ユーザによる使用開始時に音声ガイダンスにお
ける所定の内容のものを出力すると共に、音声入力によ
る発声の音声認識処理に際して音声ガイダンスにおける
認識結果に対応する特定の情報が存在する特定の位置を
検索し、検索した特定の位置までスキップして特定の情
報の出力を行うものである。これにより、不必要な音声
ガイダンスの内容を効果的に排除でき、使用環境やユー
ザによって音声認識処理を行うことが困難である場合や
音声入力されない場合等の処理保留中にもユーザが音声
入力を放置して音声ガイダンスに従うことで十分な情報
入手が可能になる。
単に説明する。この音声対話方法は、ユーザの発声によ
る音声入力を音声認識処理した認識結果に対応して予め
定められた内容の音声ガイダンスをユーザに対して出力
する際、ユーザによる使用開始時に音声ガイダンスにお
ける所定の内容のものを出力すると共に、音声入力によ
る発声の音声認識処理に際して音声ガイダンスにおける
認識結果に対応する特定の情報が存在する特定の位置を
検索し、検索した特定の位置までスキップして特定の情
報の出力を行うものである。これにより、不必要な音声
ガイダンスの内容を効果的に排除でき、使用環境やユー
ザによって音声認識処理を行うことが困難である場合や
音声入力されない場合等の処理保留中にもユーザが音声
入力を放置して音声ガイダンスに従うことで十分な情報
入手が可能になる。
【0017】この音声対話方法を適用した音声対話装置
では、ユーザの発声による音声入力を音声認識処理した
認識結果に対応して予め定められた内容の音声ガイダン
スをユーザに対して出力する出力制御手段を備えた基本
構成において、出力制御手段は、ユーザによる使用開始
時に音声ガイダンスにおける所定の内容のものを出力す
ると共に、音声入力による発声の音声認識処理に際して
音声ガイダンスにおける認識結果に対応する特定の情報
が存在する特定の位置を検索し、検索した特定の位置ま
でスキップして特定の情報の出力を行うものとなる。
では、ユーザの発声による音声入力を音声認識処理した
認識結果に対応して予め定められた内容の音声ガイダン
スをユーザに対して出力する出力制御手段を備えた基本
構成において、出力制御手段は、ユーザによる使用開始
時に音声ガイダンスにおける所定の内容のものを出力す
ると共に、音声入力による発声の音声認識処理に際して
音声ガイダンスにおける認識結果に対応する特定の情報
が存在する特定の位置を検索し、検索した特定の位置ま
でスキップして特定の情報の出力を行うものとなる。
【0018】図1は、本発明の音声対話方法を適用した
一実施例に係る音声対話装置の基本構成を示したブロッ
ク図である。この音声対話装置は、ユーザが発声により
音声入力を入力する音声認識手段としての音声入力部1
01と、音声入力に対して音声認識処理を行う音声認識
手段としての音声認識部102と、音声認識処理に際し
て用いる認識用辞書データを記憶した認識用辞書記憶手
段としての認識用辞書記憶部103と、音声ガイダンス
の内容を記憶したガイダンス記憶手段としてのガイダン
ス記憶部106と、音声ガイダンスの内容における音声
認識処理による認識結果に対応する特定の情報が音声ガ
イダンス中のどの位置に存在するかを示す特定の位置を
検索可能に記憶する情報位置記憶手段としての情報位置
記憶部105と、装置の使用開始及び使用終了を検出す
る装置使用検出手段としての装置使用検出部108と、
装置使用検出部108が使用開始を検出したときに音声
ガイダンスの所定の内容のものを出力指示すると共に、
認識結果に従って対話の流れを管理し、認識結果が送ら
れてきたときに情報位置記憶部105における音声ガイ
ダンスにあっての特定の情報に対応する特定の位置を検
索して調べて特定の情報を出力する対話制御部104
と、対話制御部104からの出力指示に従ってガイダン
ス記憶部106における音声ガイダンスの内容を出力
し、対話制御部104の制御により情報位置記憶部10
5から特定の位置を示す情報が送られたときに音声ガイ
ダンスにおける出力中の内容のものを停止して特定の位
置までスキップした後に特定の位置に対応する特定の情
報を再出力する音声出力手段としての音声出力部107
とを備えて成っている。
一実施例に係る音声対話装置の基本構成を示したブロッ
ク図である。この音声対話装置は、ユーザが発声により
音声入力を入力する音声認識手段としての音声入力部1
01と、音声入力に対して音声認識処理を行う音声認識
手段としての音声認識部102と、音声認識処理に際し
て用いる認識用辞書データを記憶した認識用辞書記憶手
段としての認識用辞書記憶部103と、音声ガイダンス
の内容を記憶したガイダンス記憶手段としてのガイダン
ス記憶部106と、音声ガイダンスの内容における音声
認識処理による認識結果に対応する特定の情報が音声ガ
イダンス中のどの位置に存在するかを示す特定の位置を
検索可能に記憶する情報位置記憶手段としての情報位置
記憶部105と、装置の使用開始及び使用終了を検出す
る装置使用検出手段としての装置使用検出部108と、
装置使用検出部108が使用開始を検出したときに音声
ガイダンスの所定の内容のものを出力指示すると共に、
認識結果に従って対話の流れを管理し、認識結果が送ら
れてきたときに情報位置記憶部105における音声ガイ
ダンスにあっての特定の情報に対応する特定の位置を検
索して調べて特定の情報を出力する対話制御部104
と、対話制御部104からの出力指示に従ってガイダン
ス記憶部106における音声ガイダンスの内容を出力
し、対話制御部104の制御により情報位置記憶部10
5から特定の位置を示す情報が送られたときに音声ガイ
ダンスにおける出力中の内容のものを停止して特定の位
置までスキップした後に特定の位置に対応する特定の情
報を再出力する音声出力手段としての音声出力部107
とを備えて成っている。
【0019】このうち、対話制御部104及び音声出力
部107は、合わせてユーザの使用開始時に音声ガイダ
ンスの所定のものを出力すると共に、音声入力による発
声の音声認識処理に際して音声ガイダンスにおける認識
結果に対応する特定の情報が存在する特定の位置を検索
し、検索した特定の位置までスキップして特定の情報の
出力を行う出力制御手段として働く。又、音声認識部1
02は、認識結果を認識用辞書データを用いて音声認識
処理した結果により得て対話制御部104へ送出するよ
うに働く。
部107は、合わせてユーザの使用開始時に音声ガイダ
ンスの所定のものを出力すると共に、音声入力による発
声の音声認識処理に際して音声ガイダンスにおける認識
結果に対応する特定の情報が存在する特定の位置を検索
し、検索した特定の位置までスキップして特定の情報の
出力を行う出力制御手段として働く。又、音声認識部1
02は、認識結果を認識用辞書データを用いて音声認識
処理した結果により得て対話制御部104へ送出するよ
うに働く。
【0020】以下は、この音声対話装置の動作処理につ
いて説明する。ここでは、先ず装置使用検出部108が
ユーザによる装置の使用開始を検出すると、対話制御部
104では音声出力部107に対して音声ガイダンスの
内容を先頭から出力するように指示する。これにより、
音声出力部107はガイダンス記憶部106に記憶され
た音声ガイダンスの内容を先頭の内容より出力(上述し
た所定の内容のものを示す)する。
いて説明する。ここでは、先ず装置使用検出部108が
ユーザによる装置の使用開始を検出すると、対話制御部
104では音声出力部107に対して音声ガイダンスの
内容を先頭から出力するように指示する。これにより、
音声出力部107はガイダンス記憶部106に記憶され
た音声ガイダンスの内容を先頭の内容より出力(上述し
た所定の内容のものを示す)する。
【0021】次に、ガイダンス出力後、ユーザが音声入
力部101に対して音声入力を行うと、音声入力部10
1は音声入力を音声認識部102へ送出する。音声認識
部102では認識用辞書記憶部103に記憶されている
認識用辞書データを用いて音声認識処理を行い、その認
識結果を対話制御部104へ送出する。対話制御部10
4では送られた認識結果に相当する音声ガイダンスにお
ける特定の情報に対応する特定の位置を情報位置記憶部
105の記憶内容に基づいて検索して調べ、音声出力部
107に対して特定の情報に関する出力指示並びにそれ
を特定する特定の位置を出力する。音声出力部107で
は、対話制御部104より特定の情報に関する出力指示
及び特定の位置が送られたときに現在出力中のガイダン
ス記憶部106に記憶された音声ガイダンスの内容の出
力動作を停止し、ガイダンス記憶部106の特定の位置
に対応する特定の情報までスキップし、その後にユーザ
に対して特定の情報を再出力し続ける。この状態で装置
使用検出部108からユーザの使用終了が検出され、こ
のユーザの使用終了が対話制御部104に送出される
と、対話制御部104では出力停止指示を音声出力部1
07へ送出し、これにより音声出力部107は音声ガイ
ダンスの再出力を停止する。
力部101に対して音声入力を行うと、音声入力部10
1は音声入力を音声認識部102へ送出する。音声認識
部102では認識用辞書記憶部103に記憶されている
認識用辞書データを用いて音声認識処理を行い、その認
識結果を対話制御部104へ送出する。対話制御部10
4では送られた認識結果に相当する音声ガイダンスにお
ける特定の情報に対応する特定の位置を情報位置記憶部
105の記憶内容に基づいて検索して調べ、音声出力部
107に対して特定の情報に関する出力指示並びにそれ
を特定する特定の位置を出力する。音声出力部107で
は、対話制御部104より特定の情報に関する出力指示
及び特定の位置が送られたときに現在出力中のガイダン
ス記憶部106に記憶された音声ガイダンスの内容の出
力動作を停止し、ガイダンス記憶部106の特定の位置
に対応する特定の情報までスキップし、その後にユーザ
に対して特定の情報を再出力し続ける。この状態で装置
使用検出部108からユーザの使用終了が検出され、こ
のユーザの使用終了が対話制御部104に送出される
と、対話制御部104では出力停止指示を音声出力部1
07へ送出し、これにより音声出力部107は音声ガイ
ダンスの再出力を停止する。
【0022】以下は、この音声対話装置の動作処理につ
いて、更に具体例を参照して説明する。但し、ここで
は、ユーザがプロ野球の試合経過情報を得ることができ
るサービスを行うものとする。このようなサービスを行
うインフラとしては、例えば専用の電話番号に電話をか
ける構成のもの、街頭の情報端末を用いる構成のもの等
がある。
いて、更に具体例を参照して説明する。但し、ここで
は、ユーザがプロ野球の試合経過情報を得ることができ
るサービスを行うものとする。このようなサービスを行
うインフラとしては、例えば専用の電話番号に電話をか
ける構成のもの、街頭の情報端末を用いる構成のもの等
がある。
【0023】図2はガイダンス記憶部106に記憶され
ている音声ガイダンスの内容を例示したものであり、図
3は認識用辞書記憶部103に記憶されている認識用辞
書データを例示したものであり、図4は情報位置記憶部
105に記憶されている認識結果に対応する情報位置の
内容を例示したものである。
ている音声ガイダンスの内容を例示したものであり、図
3は認識用辞書記憶部103に記憶されている認識用辞
書データを例示したものであり、図4は情報位置記憶部
105に記憶されている認識結果に対応する情報位置の
内容を例示したものである。
【0024】因みに、図3に示す音声認識用辞書データ
は、左欄に登録されている表記、右側欄に登録されてい
る読みが記述されている。音声認識部102では入力音
声とここでの読みとを用いてパターンマッチングを行
い、認識結果として表記を出力する。又、例えば図4中
のロッテの認識結果は図2中の音声ガイダンスの内容に
おいて23.6秒の時点から存在していることが分か
る。
は、左欄に登録されている表記、右側欄に登録されてい
る読みが記述されている。音声認識部102では入力音
声とここでの読みとを用いてパターンマッチングを行
い、認識結果として表記を出力する。又、例えば図4中
のロッテの認識結果は図2中の音声ガイダンスの内容に
おいて23.6秒の時点から存在していることが分か
る。
【0025】そこで、ユーザが本サービスとの対話を開
始したもの(専用の電話番号に電話をかける構成であれ
ば通話が開始された場合、街頭の情報端末による構成で
あればSTARTボタンが押された場合)とする。この
とき、装置使用検出部108は対話開始の情報を対話制
御部104へ送出する。対話制御部104では、音声出
力部107に対して音声ガイダンスの内容を冒頭より出
力するよう指示する。音声出力部107はこの指示によ
り、ガイダンス記憶部106に記憶されている図2に示
されるような音声ガイダンス(『プロ野球情報です。東
京ドームで行われている…,日本ハムがリードとなって
おります。』)をユーザに対して出力する。音声出力部
107は、ユーザからの音声入力があるまで、音声ガイ
ダンスを出し続ける。尚、図2に示す音声ガイダンスの
最後まで出力し終ったならば、再び音声ガイダンスを始
めから出力し直しても良い。
始したもの(専用の電話番号に電話をかける構成であれ
ば通話が開始された場合、街頭の情報端末による構成で
あればSTARTボタンが押された場合)とする。この
とき、装置使用検出部108は対話開始の情報を対話制
御部104へ送出する。対話制御部104では、音声出
力部107に対して音声ガイダンスの内容を冒頭より出
力するよう指示する。音声出力部107はこの指示によ
り、ガイダンス記憶部106に記憶されている図2に示
されるような音声ガイダンス(『プロ野球情報です。東
京ドームで行われている…,日本ハムがリードとなって
おります。』)をユーザに対して出力する。音声出力部
107は、ユーザからの音声入力があるまで、音声ガイ
ダンスを出し続ける。尚、図2に示す音声ガイダンスの
最後まで出力し終ったならば、再び音声ガイダンスを始
めから出力し直しても良い。
【0026】ここで、音声ガイダンス出力中にユーザが
オリックスと音声入力し、音声認識部102が正しく認
識できたものとすれば、このとき対話制御部104は、
音声認識部102より送出された認識結果であるオリッ
クスの情報位置を情報位置記憶部105の記憶内容より
調べる。図4からはこのオリックスの情報が17.6秒
の時点であることが分かるので、対話制御部104は音
声出力部107に対して17.6秒の時点から出力する
よう指示を送る。そこで、音声出力部107はこのよう
な指示を受け、現在出力中の音声ガイダンスを停止し、
17.6秒の時点から音声ガイダンス(『西武球場の西
武・オリックス戦は…,日本ハムがリードとなっており
ます。』)を再出力する。この後、再びユーザからの音
声が入力されるか、或いはユーザの使用終了に至るま
で、音声ガイダンス(『西武球場の西武・オリックス戦
は…,日本ハムがリードとなっております。』)を出力
し続ける。
オリックスと音声入力し、音声認識部102が正しく認
識できたものとすれば、このとき対話制御部104は、
音声認識部102より送出された認識結果であるオリッ
クスの情報位置を情報位置記憶部105の記憶内容より
調べる。図4からはこのオリックスの情報が17.6秒
の時点であることが分かるので、対話制御部104は音
声出力部107に対して17.6秒の時点から出力する
よう指示を送る。そこで、音声出力部107はこのよう
な指示を受け、現在出力中の音声ガイダンスを停止し、
17.6秒の時点から音声ガイダンス(『西武球場の西
武・オリックス戦は…,日本ハムがリードとなっており
ます。』)を再出力する。この後、再びユーザからの音
声が入力されるか、或いはユーザの使用終了に至るま
で、音声ガイダンス(『西武球場の西武・オリックス戦
は…,日本ハムがリードとなっております。』)を出力
し続ける。
【0027】図5はユーザが特定の情報のみを入手した
場合の対話例を模試的に示したものである。ここでは、
ユーザが阪神と近鉄とに関する情報のみを入手した場合
の対話例を示している。この場合、ユーザが装置使用開
始後のシステムにおける音声ガイダンス(『プロ野球情
報です。東京ドームで行われている…,日本ハムがリー
ドとなっております。』)に対し、ユーザが必要な情報
として阪神を音声入力してそれに関する音声ガイダンス
出力(『甲子園球場で行われている阪神・中日戦は2対
3で中日が勝ちました。西武球場の』)が終了した時点
で次に近鉄を音声入力してそれに関する音声ガイダンス
出力(『マリンスタジアムで行われているロッテ・近鉄
戦は9回表で1対1の同点、福岡ドームの』)を得てか
ら装置使用終了とすることにより、不要な音声ガイダン
スを聞かずに済む(不必要な音声ガイダンスを効果的に
排除できる)ようにした様子を示している。
場合の対話例を模試的に示したものである。ここでは、
ユーザが阪神と近鉄とに関する情報のみを入手した場合
の対話例を示している。この場合、ユーザが装置使用開
始後のシステムにおける音声ガイダンス(『プロ野球情
報です。東京ドームで行われている…,日本ハムがリー
ドとなっております。』)に対し、ユーザが必要な情報
として阪神を音声入力してそれに関する音声ガイダンス
出力(『甲子園球場で行われている阪神・中日戦は2対
3で中日が勝ちました。西武球場の』)が終了した時点
で次に近鉄を音声入力してそれに関する音声ガイダンス
出力(『マリンスタジアムで行われているロッテ・近鉄
戦は9回表で1対1の同点、福岡ドームの』)を得てか
ら装置使用終了とすることにより、不要な音声ガイダン
スを聞かずに済む(不必要な音声ガイダンスを効果的に
排除できる)ようにした様子を示している。
【0028】更に、使用環境やユーザによって周囲雑音
等の理由から音声認識処理を行うことが困難である場合
や、音声入力が可能であること(使用方法)が分からな
かったり、音声入力できない等の理由により音声入力さ
れない場合等の処理保留中の状態も起こり得る。このよ
うな場合でも、音声ガイダンスを最後まで出力し終った
時点で再び音声ガイダンスを始めから出力し直すように
していれば、ユーザは何も音声入力を行わなければ、或
る程度不必要な情報も聞かなければならないが、やがて
は必要な音声ガイダンスの情報を入手できるため、処理
保留中の状態であっても音声ガイダンスの情報を十分に
入手し得る。
等の理由から音声認識処理を行うことが困難である場合
や、音声入力が可能であること(使用方法)が分からな
かったり、音声入力できない等の理由により音声入力さ
れない場合等の処理保留中の状態も起こり得る。このよ
うな場合でも、音声ガイダンスを最後まで出力し終った
時点で再び音声ガイダンスを始めから出力し直すように
していれば、ユーザは何も音声入力を行わなければ、或
る程度不必要な情報も聞かなければならないが、やがて
は必要な音声ガイダンスの情報を入手できるため、処理
保留中の状態であっても音声ガイダンスの情報を十分に
入手し得る。
【0029】
【発明の効果】以上に述べたように、本発明の音声対話
方法及び音声対話装置によれば、ユーザの使用開始時に
音声ガイダンスの所定の内容のものを出力すると共に、
発声による音声入力による発声の音声認識処理に際して
音声ガイダンスにおける認識結果に対応する特定の情報
が存在する特定の位置を検索し、検索した特定の位置ま
でスキップして特定の情報の出力を行うため、ユーザは
音声入力することで必要な音声ガイダンスの内容を即時
に入手でき、しかも不要な音声ガイダンスの内容を聞か
ずに済むようになり、しかも使用環境やユーザによって
音声認識処理を行うことが困難である場合や音声入力さ
れない場合等の処理保留中に際しても、ユーザは何もせ
ずに全ての音声ガイダンスを順に聞くことで音声ガイダ
ンスの内容を十分に入手できるため、結果としてユーザ
にとって音声対話の使い易さが向上し、産業上極めて有
益となる。
方法及び音声対話装置によれば、ユーザの使用開始時に
音声ガイダンスの所定の内容のものを出力すると共に、
発声による音声入力による発声の音声認識処理に際して
音声ガイダンスにおける認識結果に対応する特定の情報
が存在する特定の位置を検索し、検索した特定の位置ま
でスキップして特定の情報の出力を行うため、ユーザは
音声入力することで必要な音声ガイダンスの内容を即時
に入手でき、しかも不要な音声ガイダンスの内容を聞か
ずに済むようになり、しかも使用環境やユーザによって
音声認識処理を行うことが困難である場合や音声入力さ
れない場合等の処理保留中に際しても、ユーザは何もせ
ずに全ての音声ガイダンスを順に聞くことで音声ガイダ
ンスの内容を十分に入手できるため、結果としてユーザ
にとって音声対話の使い易さが向上し、産業上極めて有
益となる。
【図1】本発明の音声対話方法を適用した一実施例に係
る音声対話装置の基本構成を示したブロック図である。
る音声対話装置の基本構成を示したブロック図である。
【図2】図1に示す音声対話装置の動作処理を具体的に
説明するためにガイダンス記憶部に記憶されている音声
ガイダンスの内容を例示したものである。
説明するためにガイダンス記憶部に記憶されている音声
ガイダンスの内容を例示したものである。
【図3】図1に示す音声対話装置の動作処理を具体的に
説明するために認識用辞書記憶部に記憶されている音声
認識用辞書データを例示したものである。
説明するために認識用辞書記憶部に記憶されている音声
認識用辞書データを例示したものである。
【図4】図1に示す音声対話装置の動作処理を具体的に
説明するために情報位置記憶部に記憶されている認識結
果に対応する情報位置の内容を例示したものである。
説明するために情報位置記憶部に記憶されている認識結
果に対応する情報位置の内容を例示したものである。
【図5】図1に示す音声対話装置の動作処理を具体的に
説明するためにユーザが特定の情報のみを入手した場合
の対話例を模試的に示したものである。
説明するためにユーザが特定の情報のみを入手した場合
の対話例を模試的に示したものである。
101 音声入力部 102 音声認識部 103 認識用辞書記憶部 104 対話制御部 105 情報位置記憶部 106 ガイダンス記憶部 107 音声出力部 108 装置使用検出部
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI H04M 11/08 G06F 15/20 568Z (56)参考文献 特開 平8−146991(JP,A) 特開 平2−103599(JP,A) 特開 平6−110650(JP,A) 特開 平8−265440(JP,A) 特開 平5−323993(JP,A) 特開 平6−208389(JP,A) 特開 平7−72895(JP,A) 特開 平8−263092(JP,A) 特開 平8−297498(JP,A) 特開 平9−237278(JP,A) 特開 平10−143187(JP,A) 特開 昭57−174768(JP,A) 特開 平8−161299(JP,A) 特開 昭57−197677(JP,A) 特開 平3−9648(JP,A) 特公 平8−31021(JP,B2) 特公 平6−100959(JP,B2) 特公 平3−52635(JP,B2) 特公 平3−30879(JP,B2) 特公 平7−56595(JP,B2) 実公 昭58−31226(JP,Y2) 実公 平4−10640(JP,Y2) 古井「ディジタル音声処理」(1985− 9−25)東海大学出版会 p.160−161 (58)調査した分野(Int.Cl.7,DB名) G10L 15/22 G06F 3/16 330 G06F 17/21 G10L 13/00 H04M 11/00 - 11/10
Claims (6)
- 【請求項1】 ユーザの発声による音声入力を音声認識
処理した認識結果に対応して予め定められた内容の音声
ガイダンスを該ユーザに対して出力する音声対話方法で
あって、ユーザによる使用開始時に前記音声ガイダンス
における所定の内容のものを出力すると共に、前記音声
入力による前記発声の音声認識処理に際して該音声ガイ
ダンスにおける前記認識結果に対応する特定の情報が存
在する特定の位置を検索し、該検索した該特定の位置ま
でスキップして該特定の情報の出力を行うことを特徴と
する音声対話方法。 - 【請求項2】 ユーザの発声による音声入力を音声認識
処理した認識結果に対応して予め定められた内容の音声
ガイダンスを該ユーザに対して出力する出力制御手段を
備えた音声対話装置であって、前記出力制御手段は、ユ
ーザによる使用開始時に前記音声ガイダンスにおける所
定の内容のものを出力すると共に、前記音声入力による
前記発声の音声認識処理に際して該音声ガイダンスにお
ける前記認識結果に対応する特定の情報が存在する特定
の位置を検索し、該検索した該特定の位置までスキップ
して該特定の情報の出力を行うことを特徴とする音声対
話装置。 - 【請求項3】 請求項2記載の音声対話装置において、
前記音声ガイダンスの内容を記憶したガイダンス記憶手
段と、前記音声ガイダンスの内容における前記音声認識
処理による前記認識結果に対応する前記特定の情報が該
音声ガイダンス中のどの位置に存在するかを示す前記特
定の位置を検索可能に記憶する情報位置記憶手段と、装
置の使用開始及び使用終了を検出する装置使用検出手段
とを備え、前記出力制御手段は、前記装置使用検出手段
が前記使用開始を検出したときに前記音声ガイダンスの
所定の内容のものを出力指示すると共に、前記認識結果
に従って対話の流れを管理し、該認識結果が送られてき
たときに前記情報位置記憶手段における該音声ガイダン
スにあっての前記特定の情報に対応する前記特定の位置
を検索して調べて該特定の情報を出力する対話制御部を
備えたことを特徴とする音声対話装置。 - 【請求項4】 請求項3記載の音声対話装置において、
ユーザが発声により前記音声入力を入力する音声入力手
段と、前記音声入力に対して前記音声認識処理を行う音
声認識手段と、前記音声認識処理に際して用いる認識用
辞書データを記憶した認識用辞書記憶手段とを備え、前
記音声認識手段は前記認識結果を前記認識用辞書データ
を用いて前記音声認識処理した結果により得て前記対話
制御部へ送出することを特徴とする音声対話装置。 - 【請求項5】 請求項3又は4記載の音声対話装置にお
いて、前記出力制御手段は、前記対話制御部からの出力
指示に従って前記ガイダンス記憶手段における前記音声
ガイダンスの内容を出力する音声出力手段を備えたこと
を特徴とする音声対話装置。 - 【請求項6】 請求項5記載の音声対話装置において、
前記音声出力手段は、前記対話制御部の制御により前記
情報位置記憶手段から前記特定の位置を示す情報が送ら
れたときに前記音声ガイダンスにおける出力中の内容の
ものを停止して該特定の位置までスキップした後に該特
定の位置に対応する該特定の情報を再出力することを特
徴とする音声対話装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP09207935A JP3077746B2 (ja) | 1997-08-01 | 1997-08-01 | 音声対話方法及び音声対話装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP09207935A JP3077746B2 (ja) | 1997-08-01 | 1997-08-01 | 音声対話方法及び音声対話装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH1152981A JPH1152981A (ja) | 1999-02-26 |
JP3077746B2 true JP3077746B2 (ja) | 2000-08-14 |
Family
ID=16547986
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP09207935A Expired - Fee Related JP3077746B2 (ja) | 1997-08-01 | 1997-08-01 | 音声対話方法及び音声対話装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3077746B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102081034B1 (ko) | 2019-12-11 | 2020-02-24 | 주식회사 티원 | 방열 제어가 가능한 고효율 엘이디 등기구 |
-
1997
- 1997-08-01 JP JP09207935A patent/JP3077746B2/ja not_active Expired - Fee Related
Non-Patent Citations (1)
Title |
---|
古井「ディジタル音声処理」(1985−9−25)東海大学出版会 p.160−161 |
Also Published As
Publication number | Publication date |
---|---|
JPH1152981A (ja) | 1999-02-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2927891B2 (ja) | 音声ダイヤル装置 | |
US7881938B2 (en) | Speech bookmarks in a voice user interface using a speech recognition engine and acoustically generated baseforms | |
US6185537B1 (en) | Hands-free audio memo system and method | |
JP2002032213A (ja) | ボイス・メール・メッセージを転記する方法およびシステム | |
TW200540649A (en) | Method and apparatus for automatic telephone menu navigation | |
JP2007529831A (ja) | 音声対話型メッセージング方法及び装置 | |
US20100178956A1 (en) | Method and apparatus for mobile voice recognition training | |
US20050124322A1 (en) | System for communication information from a server via a mobile communication device | |
JP3077746B2 (ja) | 音声対話方法及び音声対話装置 | |
JP2009104047A (ja) | 情報処理方法及び情報処理装置 | |
JP2001331196A (ja) | 音声応答装置 | |
JP2002023996A (ja) | 音声対応スクリプト動作装置 | |
KR20080013541A (ko) | 휴대용 단말기의 음성 제어 장치 및 방법 | |
JP2005164944A (ja) | 動作パラメータ決定装置、電子装置、音声合成装置、対話システム、動作パラメータ決定方法、及びコンピュータで読み取り可能な制御プログラム | |
KR19990011023A (ko) | 기능모드의 음성 인식이 가능한 디지털 휴대용 전화기 및 그 인식방법 | |
JP4042435B2 (ja) | 音声自動質問応答装置 | |
JP2002297179A (ja) | 自動応答対話システム | |
JP2004301980A (ja) | 音声対話装置及び音声対話代行装置並びにそれらのプログラム | |
JP4408665B2 (ja) | 音声認識用発話データ収集装置、音声認識用発話データ収集方法、及びコンピュータプログラム | |
JP2007233249A (ja) | 音声分岐装置、発話訓練装置、音声分岐方法、発話訓練支援方法およびプログラム | |
JP3231693B2 (ja) | 音声対話装置 | |
JP2005210497A (ja) | 携帯情報端末 | |
JP2004029457A (ja) | 音声対話装置、および音声対話プログラム | |
US20150073810A1 (en) | Music playing method and music playing system | |
JP3597398B2 (ja) | 音声認識装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20000517 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080616 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090616 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100616 Year of fee payment: 10 |
|
LAPS | Cancellation because of no payment of annual fees |