JPH11265196A - 音声出力装置 - Google Patents

音声出力装置

Info

Publication number
JPH11265196A
JPH11265196A JP10084998A JP8499898A JPH11265196A JP H11265196 A JPH11265196 A JP H11265196A JP 10084998 A JP10084998 A JP 10084998A JP 8499898 A JP8499898 A JP 8499898A JP H11265196 A JPH11265196 A JP H11265196A
Authority
JP
Japan
Prior art keywords
utterance
output device
length
voice
sentence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10084998A
Other languages
English (en)
Inventor
Yuichi Kojima
裕一 小島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP10084998A priority Critical patent/JPH11265196A/ja
Publication of JPH11265196A publication Critical patent/JPH11265196A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 ユーザにとって負担の少ない形で音声情報を
出力することの可能な音声出力装置を提供する。 【解決手段】 ユーザに伝えるべき情報を保持する知識
データベース1と、知識データベース1をもとに発話文
を生成する発話文生成部2と、発話文を用いて音声合成
を行なう音声合成部3とを有する音声出力装置におい
て、音声出力装置の1回当りの発話の長さを制御する発
話長制御部4をさらに有し、発話文生成部2は、発話文
の生成に用いるパラメータとして発話文長の指標をも
ち、このパラメータを発話長制御部4から受け取る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、ユーザに情報を伝
達するための音声出力装置および情報記録媒体に関す
る。
【0002】
【従来の技術】従来、例えば特開平5−323993号
には、音声でユーザに情報を伝達し、なんらかの対話的
な処理を行なう音声対話システムが示されている。この
種の音声対話システムは、音声出力とともにグラフィッ
ク情報や画像,アニメーション等の視覚データの表示を
行なうマルチメディア対話システムとして有効であり、
話者がマイクロホンに向かって発話すると、この音声を
認識し、これに対する音声応答をスピーカから出力して
人間との対話を行なうものである。
【0003】このような音声対話システムを、例えばハ
ンバーガーショップで用いた例を説明する。先ず、客が
マイクロホンに向かって「ハンバーガー2個とジュース
3個」と発話すると、システムはこれを認識し、「ハン
バーガー2個とジュース3個ですね」と確認を示す発話
が出力される。その後、客が「はい」と返事をすれば、
注文がハンバーガー2個とジュース3個であることが確
認され、従業員に通知される。
【0004】
【発明が解決しようとする課題】ところで、上述のよう
な音声対話システムにおいて、何らかの情報をユーザに
伝えようとする場合、同じ発話であっても、ユーザによ
って理解度が異なる。例えば、基本となる知識がユーザ
Aでは豊富であり、ユーザBでは貧弱である場合、同じ
発話内容でもユーザBには理解しにくいことが考えられ
る。また、ユーザの置かれている状況(忙しくてあまり
発話理解に時間を割けない、あるいは音声出力装置の前
で出力を待っている)によっても理解のしやすさは異な
る。
【0005】音声で作業を支援する場合、作業を進める
ための支援、作業の理解を深めるための支援という2つ
の観点が考えられるが、いずれの場合も、ユーザにとっ
て負担の少ない形で音声情報を出力することが望ましい
が、従来では、音声出力に関してこのような考慮はなさ
れていなかった。
【0006】本発明は、ユーザにとって負担の少ない形
で音声情報を出力することの可能な音声出力装置を提供
することを目的としている。
【0007】
【課題を解決するための手段】上記目的を達成するため
に、請求項1記載の発明は、ユーザに伝えるべき情報を
保持する知識データベースと、知識データベースをもと
に発話文を生成する発話文生成部と、発話文を用いて音
声合成を行なう音声合成部とを有する音声出力装置にお
いて、音声出力装置の1回当りの発話の長さを制御する
発話長制御部をさらに有し、発話文生成部は、発話文の
生成に用いるパラメータとして発話文長の指標をもち、
このパラメータを発話長制御部から受け取ることを特徴
としている。
【0008】また、請求項2記載の発明は、請求項1記
載の音声出力装置において、知識データベースは、ある
一定の手順に沿った作業の知識を保持することを特徴と
している。
【0009】また、請求項3記載の発明は、請求項1記
載の音声出力装置において、発話長制御部は1発話の開
始時点からユーザ反応が帰るまでの時間を計測し、この
時間に比べて装置の1発話の時間が長すぎる場合には、
発話文長を短くするように、発話文長の指標を更新する
ことを特徴としている。
【0010】また、請求項4記載の発明は、請求項1記
載の音声出力装置において、音声認識部がさらに設けら
れており、発話文生成部は、音声認識部からの音声認識
結果に基づいて、発話すべき内容を決定し、発話長制御
部は、ユーザ発話に対して、音声出力装置が“該当デー
タなし”の情報伝達を行なった回数をカウントし、一定
時間内にこの回数が一定値を超えた場合、発話文長を長
くするように、発話文長の指標を更新することを特徴と
している。
【0011】また、請求項5記載の発明は、請求項1記
載の音声出力装置において、音声認識部がさらに設けら
れており、発話文生成部は、音声認識部からの音声認識
結果に基づいて、発話すべき内容を決定し、発話長制御
部は、用意された知識データに対する、発話された知識
の割合を、随時、計測し、この割合が小さい場合には、
発話文長を短くするように、発話文長の指標を更新する
ことを特徴としている。
【0012】また、請求項6記載の発明は、請求項1記
載の音声出力装置において、発話長制御部は、ユーザ発
話に対する音声出力装置の発話の割合を、随時、計測
し、ユーザ発話の割合が一定値よりも小さい場合には、
発話文長を短くするように、発話文長の指標を更新する
ことを特徴としている。
【0013】また、請求項7記載の発明は、請求項1記
載の音声出力装置において、音声認識部がさらに設けら
れており、発話文生成部は、音声認識部からの音声認識
結果に基づいて、発話すべき内容を決定し、発話長制御
部は、音声認識部のリジェクト発話の回数を、随時、計
測し、一定時間内にリジェクト発話が一定値よりも大き
い場合には、発話文長を長くするように、発話文長の指
標を更新することを特徴としている。
【0014】
【発明の実施の形態】以下、本発明の実施形態を図面に
基づいて説明する。図1は本発明に係る音声出力装置の
第1の構成例を示す図である。図1を参照すると、この
音声出力装置は、ユーザに伝えるべき情報を保持する知
識データベース1と、知識データベース1をもとに発話
文を生成する発話文生成部2と、発話文を用いて音声合
成を行なう音声合成部3と、音声出力装置の1回当りの
発話の長さを制御する発話長制御部4とを有し、発話文
生成部2は、発話文の生成に用いるパラメータとして発
話文長の指標をもち、このパラメータを発話長制御部4
から受け取るようになっている。また、図1の音声出力
装置には、さらに、入力音声を認識するための音声認識
部5が設けられており、音声認識部5の音声認識結果
は、発話文生成部2に与えられ、これにより、発話文生
成部2は、認識結果(すなわち、入力音声)に対する応答
文を知識データベース1をもとに発話文として生成し、
音声合成部3から出力させるようになっている。
【0015】また、発話文生成部2は、作業段階および
発話履歴に応じて、知識データベース1中の特定の知識
に焦点をもち、この焦点から下位に位置する知識を発話
文生成の対象にしている。
【0016】図2は知識データベース1に格納されてい
る知識の一例を示す図である。知識の一例としては種々
考えられるが、図2の例では、知識データベース1に格
納されている知識は、作業内容として、料理の支援を考
え、その中でも「辛口の白ワインを大さじ2杯分、小鍋
の中の香草スープに入れる」というものとなっている。
すなわち、図2の例からもわかるように、知識データベ
ース1は、ある一定の手順に沿った作業の知識を保持す
るようになっている。
【0017】次に、このような構成の音声出力装置の処
理動作について説明する。いま、図1の音声出力装置の
音声合成部3から、例えば「香草スープに白ワインを入
れてください」という音声が出力された場合を考える。
これに対し、ユーザが、例えば、「白ワイン?」と問い
かけたとする。この問いかけ,すなわち、ユーザの入力
音声は、図1の音声認識部5に加わり、音声認識部5で
は、ユーザの発声する特定の語を認識する。この認識結
果「白ワイン」に応答して、発話文生成部2は、応答す
べき発話文を生成する。すなわち、発話文生成部2は、
作業段階および発話履歴に応じて、知識データベース1
中の特定の知識に焦点をもち、この焦点から下位に位置
する知識を発話文生成の対象にしており、発話文生成部
2は、ユーザの問いかけに応じて、焦点を移動する。い
まの場合、ユーザの問いかけは「白ワイン」であるの
で、「白ワイン」が知識データベース1中の焦点にな
る。
【0018】図3(a)には、図2の知識データベース1
において、「白ワイン」の知識(太線で示す)が焦点とな
ったときの発話文生成の対象部分(網をかけた部分)が示
されている。発話文生成部2はこれらの知識をもとに、
知識を適用できる文生成テンプレート(図3(b)に示す
文生成テンプレート)を用い、発話文を図3(c)に示す
ように複数生成する。図3(c)において、複数の発話文
は文節数によってソートされ、発話長制御部4から送ら
れる指標に基づいて実際に発話される文が決定される。
【0019】具体的に、発話長制御部4からは、簡単に
(長く/短く)という指標が送られるものとする。いま、
例えば「長く」という指標が送られているとすると、発
話文生成部2は、例えば、発話文の中で最長の発話文を
選択する。図3(c)の例では、「白ワインは大さじ2杯
分で中程度の辛口です」が選択される。選択された発話
文は音声合成部3に送られ、音声として出力される。
【0020】この際、発話長制御部4は、例えば、音声
出力開始時点から音声入力が開始される時点までの時間
を毎回、計測し、これをもとに発話長の指標を決定する
ことができる。この指標決定までの方法も種々、考えら
れるが、例えば、次式のような正規化音声入力開始時間
に基づいて、発話長の指標を決定できる。
【0021】
【数1】正規化音声入力開始時間=(音声入力開始時間
−音声出力開始時間)/(音声出力終了時間−音声出力開
始時間)
【0022】すなわち、数1の値は、音声出力が開始さ
れてから、どれくらいのタイミングでユーザが音声入力
を行なったかを意味し、値が1より小さな時には、音声
出力の終了前に音声入力が始められたことになる。これ
はつまり、ユーザが出力終了を待ちきれなかったのでは
ないか、と推測することができる。このことを勘案し、
いま、余裕をみて、数1の値が1よりも小さな場合でな
く、例えば、0.5よりも小さな場合には、音声出力の
時間をより短くする方向に制御することができる。ま
た、同様に、数1の値が1よりも大きな場合には、音声
出力の終了後、しばらく待ってユーザが発話を開始した
ことになる。これは、ユーザが、まだ発話があるのでは
ないかと予想していたと考えられ、このような場合に
は、音声出力の時間をより長くする方向に制御すること
ができる。従って、数1の値を、例えば過去5回分、平
均し、この値が0.5よりも小さい場合は、指標のラン
クを短い方に下げ、一方、この値が1よりも大きかった
ら指標のランクを長い方に上げるよう、指標を決定する
ことができる。
【0023】すなわち、図1の構成例では、発話長制御
部は1発話の開始時点からユーザ反応が帰るまでの時間
を計測し、この時間に比べて装置の1発話の時間が長す
ぎる場合には、発話文長を短くするように、発話文長の
指標を更新するようになっている。
【0024】図4は本発明に係る音声出力装置の他の構
成例を示す図である。図4を参照すると、この音声出力
装置は、ユーザに伝えるべき情報を保持する知識データ
ベース1と、知識データベース1をもとに発話文を生成
する発話文生成部2と、発話文を用いて音声合成を行な
う音声合成部3と、音声出力装置の1回当りの発話の長
さを制御する発話長制御部4とを有し、発話文生成部2
は、発話文の生成に用いるパラメータとして発話文長の
指標をもち、このパラメータを発話長制御部4から受け
取るようになっている。また、図4の音声出力装置に
は、さらに、入力音声を認識するための音声認識部5が
設けられており、音声認識部5の音声認識結果は、発話
文生成部2に与えられ、これにより、発話文生成部2
は、認識結果(すなわち、入力音声)に対する応答文を知
識データベース1をもとに発話文として生成し、音声合
成部3から出力させるようになっている。
【0025】図4の音声出力装置において、知識データ
ベース1の構成および発話文生成部2の構成(動作)につ
いては図1の音声出力装置と同様であるが、図4の音声
出力装置では、発話文生成部2は、音声認識部5からの
音声認識結果に基づいて、発話すべき内容を決定し、発
話長制御部4は、ユーザ発話に対して、音声出力装置が
“該当データなし”の情報伝達を行なった回数をカウン
トし、一定時間内にこの回数が一定値を超えた場合、発
話文長を長くするように、発話文長の指標を更新するよ
うになっている。
【0026】具体的に、発話長制御部4は、発話文生成
部2からの出力を監視し、例えば「わかりません」とい
う文字列の出現をカウントする。一例としてユーザが
「中程度の?」と問いかけた場合、「中程度」について
はそれ以上、詳細なデータがないため、発話文は、「該
当データなし」という意味で「中程度についてはわかり
ません」と出力する。発話長制御部4は、例えば、過去
5分間でのこのカウント値が例えば5回を超えた場合に
は、発話文長の指標を長い方に更新し、過去5分間での
このカウント値が例えば0回だった場合には、発話文長
の指標を短い方に更新する。
【0027】図5は本発明に係る音声出力装置のさらに
他の構成例を示す図である。図5の音声出力装置では、
発話文生成部2は、音声認識部5からの音声認識結果に
基づいて、発話すべき内容を決定し、発話長制御部4
は、用意された知識データに対する、発話された知識の
割合を、随時、計測し、この割合が小さい場合には、発
話文長を短くするように、発話文長の指標を更新するよ
うになっている。
【0028】すなわち、図5の構成例では、発話長制御
部4は、知識データベース1を参照する機能をもち、発
話文生成部2の出力によって知識データベース1中の既
出データにチェックを振るようになっている。
【0029】図6には、知識データベース1中の既出デ
ータにチェックを振る様子が示されている。図6のよう
にチェックが振られた時点で、ユーザが「次は何ですか
?」と問いかければ、この作業段階は終了し、発話文生
成部2の焦点は、次の作業データに移動するが、この時
点で、発話された知識データの割合は、「チェックのつ
いた知識データ/すべての知識データ」の計算によって
求まる。図6の例では、発話された知識データの割合
は、5÷9=0.56と求まる。発話長制御部4は、こ
の値が例えば0.3を下回れば発話文長の指標を短い方
に更新し、例えば1.0になれば発話文長の指標を長い
方に更新する。
【0030】換言すれば、図5の音声出力装置は、音声
出力がある程度まとまった単位で行なわれると(1発話
が長くなると)、ユーザの質問は少なくなる傾向を利用
したものである。すなわち、本発明の音声出力装置は、
前提として対話的システムなので、用意した知識のすべ
てを単純に読み上げるという手段を除外して考えれば、
できるだけユーザ側に知識を引き出させる(質問させる)
というアプローチが考えられる。従って、発話された知
識データの割合の値が0.3を下回る場合には、システ
ム側(音声出力装置)が用意した知識のうち、ほんの少し
しかユーザに伝わっていないことがわかるので、ユーザ
の質問を増やすように発話長を短めにする。また、発話
された知識データの割合の値が1.0の場合には、ユー
ザが非常に多くの質問をして、システム側(音声出力装
置)がすべての知識を提供していることがわかるが、お
そらくユーザはシステム(音声出力装置)の用意した知識
の範囲内で質問したりしないので、1.0の場合にはシ
ステム側が「わかりません」と答える場面も多くなるこ
とが推測される。こうなると、システム発話に関しては
有効な知識伝達の割合が低下しているわけで、システム
はたくさん発話するのに、含まれる情報はあまりない、
ということになる。これを避けるために、ここでは、発
話された知識データの割合の値が1.0の場合には、質
問を少なめにするように、発話長を長めにする。
【0031】また、図7は本発明に係る音声出力装置の
さらに他の構成例を示す図である。図7の音声出力装置
では、発話長制御部4は、ユーザ発話に対する音声出力
装置の発話の割合を、随時、計測し、ユーザ発話の割合
が一定値よりも小さい場合には、発話文長を短くするよ
うに、発話文長の指標を更新するようになっている。す
なわち、発話長制御部4は、音声入力の時間(ユーザ発
話時間)および音声出力の時間(音声出力装置の発話時
間)を例えばそれぞれ過去5分間で計測し、ユーザ発話
に対する音声出力装置の発話の割合、すなわち、音声入
力時間/音声出力時間が、0.5よりも下回れば、発話
文長の指標を短い方に更新し、音声入力時間/音声出力
時間が、2.0よりも上回れば、発話文長の指標を長い
方に更新する。
【0032】また、図8は本発明に係る音声出力装置の
さらに他の構成例を示す図である。図8の音声出力装置
では、発話文生成部2は、音声認識部5からの音声認識
結果に基づいて、発話すべき内容を決定し、発話長制御
部4は、音声認識部のリジェクト発話の回数を、随時、
計測し、一定時間内にリジェクト発話が一定値よりも大
きい場合には、発話文長を長くするように、発話文長の
指標を更新するようになっている。
【0033】すなわち、図8の構成例では、発話長制御
部4は、発話文生成部2の出力を監視し、例えば「もう
一度お願いします」という出力の回数をカウントする。
一例として、作業中にユーザが「なにかコツはあります
か?」というような発話をした場合、認識対象として、
そのような文章を想定していない場合は、「もう一度お
願いします」という発話文が生成され、リジェクトとし
て発話長制御部4でカウントされる。そして、例えば、
過去10分間のリジェクト回数が例えば5回を超える場
合には、発話文長の指標を長い方に更新し、過去10分
間のリジェクト回数が例えば0回の場合には、発話文長
の指標を短い方に更新する。
【0034】図9は図1,図4,図5,図7,または図
8の音声出力装置のハードウェア構成例を示す図であ
る。図9を参照すると、この音声出力装置は、例えばパ
ーソナルコンピュータ等で実現され、全体を制御するC
PU21と、CPU21の制御プログラム等が記憶され
ているROM22と、CPU21のワークエリア等とし
て使用されるRAM23と、音声を入力するための音声
入力部(例えばマイクロフォン)24と、合成音声を出力
するための音声出力部(例えばスピーカ)25と、知識デ
ータベース1が構築されるハードディスク等26とを有
している。
【0035】ここで、CPU21は、図1,図4,図
5,図7,または図8の発話文生成部2,音声合成部
3,発話長制御部4,音声認識部5の機能を有してい
る。
【0036】なお、CPU21におけるこのような発話
文生成部2,音声合成部3,発話長制御部4,音声認識
部5等としての機能は、例えばソフトウェアパッケージ
(具体的には、CD−ROM等の情報記録媒体)の形で提
供することができ、このため、図9の例では、情報記録
媒体30がセットさせるとき、これを駆動する媒体駆動
装置31が設けられている。
【0037】換言すれば、本発明の音声出力装置は、マ
イクロフォン,スピーカ等を備えた汎用の計算機システ
ムにCD−ROM等の情報記録媒体に記録されたプログ
ラムを読み込ませて、この汎用計算機システムのマイク
ロプロセッサに音声出力制御処理を実行させる装置構成
においても実施することが可能である。この場合、本発
明の音声出力制御処理を実行するためのプログラム(す
なわち、ハードウェアシステムで用いられるプログラ
ム)は、媒体に記録された状態で提供される。プログラ
ムなどが記録される情報記録媒体としては、CD−RO
Mに限られるものではなく、ROM,RAM,フレキシ
ブルディスク,メモリカード等が用いられても良い。媒
体に記録されたプログラムは、ハードウェアシステムに
組み込まれている記憶装置、例えばハードディスク装置
にインストールされることにより、このプログラムを実
行して、本発明の音声出力制御機能を実現することがで
きる。
【0038】
【発明の効果】以上に説明したように、請求項1乃至請
求項7記載の発明によれば、ユーザに伝えるべき情報を
保持する知識データベースと、知識データベースをもと
に発話文を生成する発話文生成部と、発話文を用いて音
声合成を行なう音声合成部とを有する音声出力装置にお
いて、音声出力装置の1回当りの発話の長さを制御する
発話長制御部をさらに有し、発話文生成部は、発話文の
生成に用いるパラメータとして発話文長の指標をもち、
このパラメータを発話長制御部から受け取るので、ユー
ザの対応に応じて、生成され出力されるべき1発話の長
さを柔軟に変更することが可能となり、ユーザにとって
負担の少ない形で音声情報を出力することが可能とな
る。
【0039】特に、請求項2記載の発明によれば、知識
データベースは、ある一定の手順に沿った作業の知識を
保持するようになっており、知識データは、特にユーザ
と複数回のやりとりを行ないながら情報提示を行なうも
のであることから、知識データを効率良く使用して発話
文の生成,制御を行なうことができる。
【0040】また、請求項3記載の発明によれば、発話
長制御部は1発話の開始時点からユーザ反応が帰るまで
の時間を計測し、この時間に比べて装置の1発話の時間
が長すぎる場合には、発話文長を短くするように、発話
文長の指標を更新するので、ユーザ側の自然な対話のテ
ンポを推定することが可能になり、ユーザに負担の少な
い円滑な情報提示を行なうことが可能となる。
【0041】また、請求項4記載の発明によれば、請求
項1記載の音声出力装置において、音声認識部がさらに
設けられており、発話文生成部は、音声認識部からの音
声認識結果に基づいて、発話すべき内容を決定し、発話
長制御部は、ユーザ発話に対して、音声出力装置が“該
当データなし”の情報伝達を行なった回数をカウント
し、一定時間内にこの回数が一定値を超えた場合、発話
文長を長くするように、発話文長の指標を更新するの
で、ユーザ側の要求が、知識データベースに用意された
以上の詳細な知識を求めることになってしまう場面を制
御できる。すなわち、音声出力がある程度のまとまった
単位で行なわれると、ユーザはその情報で満足し、必要
な場合以外は詳細に立ち入った質問を行なわない傾向に
ある。また、短い単位の音声出力では、常により詳細な
補足事項を求めるため、用意された知識データよりも詳
細な質問が行なわれやすい。これらの知見から、音声出
力の長さをコントロールすることによって、質問ができ
るだけ知識データベースの範囲内に収まるように導くこ
とが可能となる。
【0042】また、請求項5記載の発明によれば、請求
項1記載の音声出力装置において、音声認識部がさらに
設けられており、発話文生成部は、音声認識部からの音
声認識結果に基づいて、発話すべき内容を決定し、発話
長制御部は、用意された知識データに対する、発話され
た知識の割合を、随時、計測し、この割合が小さい場合
には、発話文長を短くするように、発話文長の指標を更
新するので、特に教育的な目的で使う場合に、知識デー
タベースに用意された知識をできるだけ多く提示するよ
うにユーザ質問を導くことが可能となる。
【0043】また、請求項6記載の発明によれば、発話
長制御部は、ユーザ発話に対する音声出力装置の発話の
割合を、随時、計測し、ユーザ発話の割合が一定値より
も小さい場合には、発話文長を短くするように、発話文
長の指標を更新するので、特に知育的な目的で使う場合
に、一方的な知識の提供だけでなく、ユーザ側からも装
置に働きかける発話を引き出すことが可能となる。
【0044】また、請求項7記載の発明によれば、請求
項1記載の音声出力装置において、音声認識部がさらに
設けられており、発話文生成部は、音声認識部からの音
声認識結果に基づいて、発話すべき内容を決定し、発話
長制御部は、音声認識部のリジェクト発話の回数を、随
時、計測し、一定時間内にリジェクト発話が一定値より
も大きい場合には、発話文長を長くするように、発話文
長の指標を更新するので、ユーザ側の要求がシステムで
想定していた範囲を逸脱していた場合に、質問ができる
だけ知識データベースの範囲内に収まるように導くこと
が可能となる。
【図面の簡単な説明】
【図1】本発明に係る音声出力装置の構成例を示す図で
ある。
【図2】知識データベースに格納された知識の一例を示
す図である。
【図3】発話文生成部における発話文の生成例を示す図
である。
【図4】本発明に係る音声出力装置の他の構成例を示す
図である。
【図5】本発明に係る音声出力装置のさらに他の構成例
を示す図である。
【図6】図5の音声出力装置の処理を説明するための図
である。
【図7】本発明に係る音声出力装置のさらに他の構成例
を示す図である。
【図8】本発明に係る音声出力装置のさらに他の構成例
を示す図である。
【図9】図1,図4,図5,図7,または図8の音声出
力装置のハードウェア構成例を示す図である。
【符号の説明】
1 知識データベース 2 発話文生成部 3 音声合成部 4 発話長制御部 5 音声認識部 21 CPU 22 ROM 23 RAM 24 音声入力部 25 音声出力部 26 ハードディスク等 30 情報記憶媒体 31 媒体駆動装置

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】 ユーザに伝えるべき情報を保持する知識
    データベースと、知識データベースをもとに発話文を生
    成する発話文生成部と、発話文を用いて音声合成を行な
    う音声合成部とを有する音声出力装置において、音声出
    力装置の1回当りの発話の長さを制御する発話長制御部
    をさらに有し、発話文生成部は、発話文の生成に用いる
    パラメータとして発話文長の指標をもち、このパラメー
    タを発話長制御部から受け取ることを特徴とする音声出
    力装置。
  2. 【請求項2】 請求項1記載の音声出力装置において、
    知識データベースは、ある一定の手順に沿った作業の知
    識を保持することを特徴とする音声出力装置。
  3. 【請求項3】 請求項1記載の音声出力装置において、
    発話長制御部は1発話の開始時点からユーザ反応が帰る
    までの時間を計測し、この時間に比べて装置の1発話の
    時間が長すぎる場合には、発話文長を短くするように、
    発話文長の指標を更新することを特徴とする音声出力装
    置。
  4. 【請求項4】 請求項1記載の音声出力装置において、
    音声認識部がさらに設けられており、発話文生成部は、
    音声認識部からの音声認識結果に基づいて、発話すべき
    内容を決定し、発話長制御部は、ユーザ発話に対して、
    音声出力装置が“該当データなし”の情報伝達を行なっ
    た回数をカウントし、一定時間内にこの回数が一定値を
    超えた場合、発話文長を長くするように、発話文長の指
    標を更新することを特徴とする音声出力装置。
  5. 【請求項5】 請求項1記載の音声出力装置において、
    音声認識部がさらに設けられており、発話文生成部は、
    音声認識部からの音声認識結果に基づいて、発話すべき
    内容を決定し、発話長制御部は、用意された知識データ
    に対する、発話された知識の割合を、随時、計測し、こ
    の割合が小さい場合には、発話文長を短くするように、
    発話文長の指標を更新することを特徴とする音声出力装
    置。
  6. 【請求項6】 請求項1記載の音声出力装置において、
    発話長制御部は、ユーザ発話に対する音声出力装置の発
    話の割合を、随時、計測し、ユーザ発話の割合が一定値
    よりも小さい場合には、発話文長を短くするように、発
    話文長の指標を更新することを特徴とする音声出力装
    置。
  7. 【請求項7】 請求項1記載の音声出力装置において、
    音声認識部がさらに設けられており、発話文生成部は、
    音声認識部からの音声認識結果に基づいて、発話すべき
    内容を決定し、発話長制御部は、音声認識部のリジェク
    ト発話の回数を、随時、計測し、一定時間内にリジェク
    ト発話が一定値よりも大きい場合には、発話文長を長く
    するように、発話文長の指標を更新することを特徴とす
    る音声出力装置。
JP10084998A 1998-03-16 1998-03-16 音声出力装置 Pending JPH11265196A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10084998A JPH11265196A (ja) 1998-03-16 1998-03-16 音声出力装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10084998A JPH11265196A (ja) 1998-03-16 1998-03-16 音声出力装置

Publications (1)

Publication Number Publication Date
JPH11265196A true JPH11265196A (ja) 1999-09-28

Family

ID=13846309

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10084998A Pending JPH11265196A (ja) 1998-03-16 1998-03-16 音声出力装置

Country Status (1)

Country Link
JP (1) JPH11265196A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016057508A (ja) * 2014-09-10 2016-04-21 シャープ株式会社 音声対話装置、音声対話装置の制御方法、および制御プログラム
CN112331219A (zh) * 2020-11-05 2021-02-05 北京爱数智慧科技有限公司 语音处理方法和装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016057508A (ja) * 2014-09-10 2016-04-21 シャープ株式会社 音声対話装置、音声対話装置の制御方法、および制御プログラム
CN112331219A (zh) * 2020-11-05 2021-02-05 北京爱数智慧科技有限公司 语音处理方法和装置
CN112331219B (zh) * 2020-11-05 2024-05-03 北京晴数智慧科技有限公司 语音处理方法和装置

Similar Documents

Publication Publication Date Title
US7143038B2 (en) Speech synthesis system
JP3940363B2 (ja) 階層言語モデル
US10713289B1 (en) Question answering system
KR100668297B1 (ko) 음성인식방법 및 장치
CN100371926C (zh) 通过响应输入语句而输出应答语句的交互对话装置和方法
US11869495B2 (en) Voice to voice natural language understanding processing
US7797146B2 (en) Method and system for simulated interactive conversation
US20190318758A1 (en) Adjusting speed of human speech playback
US7739113B2 (en) Voice synthesizer, voice synthesizing method, and computer program
US20020123894A1 (en) Processing speech recognition errors in an embedded speech recognition system
JP4729902B2 (ja) 音声対話システム
JP2001215993A (ja) 対話処理装置および対話処理方法、並びに記録媒体
US20030014253A1 (en) Application of speed reading techiques in text-to-speech generation
US20040176957A1 (en) Method and system for generating natural sounding concatenative synthetic speech
JP2004226881A (ja) 会話システム及び会話処理プログラム
JPH08106296A (ja) 単語認識システム
JP2003271194A (ja) 音声対話装置及びその制御方法
US7885391B2 (en) System and method for call center dialog management
US20040122668A1 (en) Method and apparatus for using computer generated voice
KR20210123545A (ko) 사용자 피드백 기반 대화 서비스 제공 방법 및 장치
JPH11265196A (ja) 音声出力装置
JPH10260976A (ja) 音声対話方法
JP2004279436A (ja) 音声合成装置及びコンピュータプログラム
JP2980382B2 (ja) 話者適応音声認識方法および装置
KR20060109865A (ko) 음성인식방법 및 장치

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040514

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040602

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040727

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20041124