JPH11237971A - 音声応答装置 - Google Patents

音声応答装置

Info

Publication number
JPH11237971A
JPH11237971A JP10040873A JP4087398A JPH11237971A JP H11237971 A JPH11237971 A JP H11237971A JP 10040873 A JP10040873 A JP 10040873A JP 4087398 A JP4087398 A JP 4087398A JP H11237971 A JPH11237971 A JP H11237971A
Authority
JP
Japan
Prior art keywords
voice
instruction
user
interrupt
reaction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10040873A
Other languages
English (en)
Inventor
Tasuku Shinozaki
翼 篠崎
Masanobu Abe
匡伸 阿部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP10040873A priority Critical patent/JPH11237971A/ja
Publication of JPH11237971A publication Critical patent/JPH11237971A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 応答音声を確実に伝達し、人間同士の会話と
同様にスムース゛で自然なインタラクションを行ってユーサ゛フレント゛リネスを
提供し、ヒューマンインターフェース効率を向上させる。 【解決手段】 入力INはユーサ゛の動作やユーサ゛による操作
の検出結果である。解釈装置3は入力INに応じたシステム
動作を記述した文脈スクリフ゜ト2を解釈する。リアクションセット4
はインタラフ゜ト音声や指示音声の音声テ゛ータである。出力履歴
保存装置12はユーサ゛への応答音声の出力履歴を保存す
る。リアクションモート゛決定装置6は擬人的性格を記述した性格
モート゛5と出力履歴から応答音声に変化を与えるためのリア
クションモート゛を決定する。インタラフ゜ト音声生成装置7はユーサ゛の
動作に割り込むインタラフ゜ト音声を生成する。指示音声生成
装置8はユーサ゛への指示音声を生成する。出力装置1はリア
クション音声RVを出力するにあたり、インタラフ゜ト音声を出力
してから指示音声を出力するなどの制御を行う。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、合成音声による応
答を行う音声応答装置に関するものである。
【0002】
【従来の技術】音声による応答は、電話による応答装
置,金融機関のCD(現金自動支払機)やATM(現金
自動預入支払機),各種の自動販売機,電卓,しゃべる
おもちゃ,コンピュータ,音声対話システム,自動受付
システム,CAI(コンピュータ援用教育)システムと
いったものに利用されている。これらの機器に用いる音
声としては、予め録音した自然音声、予め録音した音声
をつなぎあわせた音声(「録音編集合成音声」)、日本
語文章を所定の規則に従って変換した音声(「規則合成
音声」)、音韻記号とF0 (基本周波数),継続時間.
パワーといった韻律パラメータを操作して合成した音声
(「パラメータ合成音声」)、波形編集合成音声などが
考えられる。
【0003】
【発明が解決しようとする課題】上述したそれぞれのシ
ステムでは、システムを利用する人間(以下、「ユー
ザ」)に対し、これらの音声を用いて応答を行ってい
る。そのため、ユーザがシステムに対して集中して何ら
かの操作を行っている途中であるとか、ユーザの注意が
他のことに向けられているためにシステムから注意がそ
れていると、システムからの応答に気づかなかったり応
答内容を聞き逃したりするといった問題が起こる。
【0004】こうした問題を回避するため、応答内容を
伝える音声を発する前にブザーやベルによって注意を喚
起することが考えられるが、ユーザを必要以上に驚かせ
たりイライラさせたりすることがある。そのためこうし
た状況では、ユーザとシステムの間でスムーズで自然な
やりとり(以下、「インタラクション」)を行わせるこ
とは困難であって、ヒューマンインタフェースの見地か
らユーザフレンドリなインタフェースとは言い難い。
【0005】また、従来は、システムの応答音声がそれ
ぞれのシステムを利用するユーザの入力に対応して一意
に決められてしまっている。そのため、ユーザが何度か
システムを利用していると、「○○をすると××といっ
た応答音声を出力する」といったことが予想できてしま
い、システムに対して一本調子,機械的,単調といった
印象を抱いてしまうという問題もある。このような問題
点を解決するために、システムからの応答音声をランダ
ムな順序で出力することも考えられなくはない。しかし
ながら、単にランダムな順序で出力するのでは、システ
ムに一貫した特徴を持たせることが困難であったり、シ
ステムとして達成すべき目的を実現することが困難であ
ったりする。
【0006】本発明は上述した点に鑑みてなされたもの
であって、その目的は、以下に述べる課題を解決するこ
とのできる音声応答装置を提供することにある。 ユーザの動作/操作の何れか又は双方に対して音声
による応答を行う際、応答音声をユーザに伝える前に、
ユーザの注意を引くための注意音声を出力するように
し、それによって、応答音声を確実にユーザに伝える。 ユーザの注意を引くために、ブザーやベルではなく
間投詞や指示語といった音声を用いるようにする。 システムの動作が記述されている文脈スクリプトに
従って一貫性のある特徴を持った多様なリアクション音
声を返し、ユーザがシステムに対して持つ一本調子,機
械的,単調といった印象を解消する。そうすることで、
我々人間同士で会話を行うときと同様に、ユーザとシス
テムの間でスムーズで自然なインタラクションを行わせ
るとともに、システムをユーザフレンドリ化すること
で、ユーザがシステムを使う気になる,システムを使っ
て楽しい,システムを使って面白い,システムに親しみ
を持つ,システムを使いやすい等と感じられるようにし
て、ヒューマンインタフェースの効率を向上せしめる。
【0007】
【課題を解決するための手段】以上の課題を解決するた
めに、請求項1記載の発明は、ユーザの動作や該ユーザ
による操作を検出する検出手段と、前記検出手段の検出
結果に応じたシステム動作が記述された文脈スクリプト
を解釈して解釈結果を出力する解釈手段と、前記ユーザ
に応答を行った応答音声の出力履歴を保存してゆく履歴
保存手段と、擬人的性格が記述された性格モードと前記
出力履歴に基づいて、前記応答音声に変化を与えるため
のリアクションモードを決定するリアクションモード決
定手段と、前記検出結果,前記解釈結果および前記リア
クションモードに基づいて、前記ユーザの動作に割り込
むインタラプト音声を生成するインタラプト音声生成手
段と、前記検出結果,前記解釈結果および前記リアクシ
ョンモードに基づいて、前記ユーザに対する指示音声を
生成する指示音声生成手段とを具備することを特徴とし
ている。
【0008】また、請求項2記載の発明は、請求項1記
載の発明において、前記指示音声生成手段は、前記検出
結果と前記解釈結果に基づいて前記ユーザに指示すべき
指示項目を決定する指示項目決定手段と、前記指示項目
と前記リアクションモードに基づいて指示メッセージを
生成する指示メッセージ生成手段と、前記リアクション
モードに基づいて前記指示メッセージを修飾する指示メ
ッセージ修飾手段とから成ることを特徴としている。ま
た、請求項3記載の発明は、請求項1又は2記載の発明
において、音声データを集めたリアクションセットが予
め記憶されているリアクションセット記憶手段をさらに
具備し、前記インタラプト音声生成手段は、生成すべき
インタラプト音声に対応する音声データを前記リアクシ
ョンセットの中から選択することで、前記インタラプト
音声の生成を行うことを特徴としている。
【0009】また、請求項4記載の発明は、請求項3記
載の発明において、前記リアクションセットは、汎用的
な応答音声データを集めた汎用リアクションセットと、
前記文脈スクリプトに依存する音声データを集めた特定
リアクションセットからなることを特徴としている。ま
た、請求項5記載の発明は、請求項3又は4記載の発明
において、前記リアクションセットを構成する音声デー
タは、韻律を整合した合成音声の韻律パラメータで表さ
れることを特徴としている。また、請求項6記載の発明
は、請求項1〜5の何れかの項記載の発明において、前
記インタラプト音声生成手段から前記インタラプト音声
を出力させたのちに、前記指示音声生成手段から前記指
示音声を出力させる出力制御手段をさらに具備すること
を特徴としている。
【0010】また、請求項7記載の発明は、請求項1〜
6の何れかの項記載の発明において、前記インタラプト
音声生成手段又は前記指示音声生成手段の少なくとも一
方は、前記インタラプト音声又は前記指示音声を合成音
声により生成することを特徴としている。また、請求項
8記載の発明は、請求項7記載の発明において、前記合
成音声は、録音編集合成音声,波形編集合成音声,規則
合成音声,パラメータ合成音声の何れかであることを特
徴としている。また、請求項9記載の発明は、請求項1
〜8の何れかの項記載の発明において、CAIシステム
に組み込まれ、或いは、該CAIシステムとともに用い
られることを特徴としている。
【0011】
【発明の実施の形態】以下、図面を参照して本発明の一
実施形態について説明する。本実施形態では、音声によ
りインタラクティブな指示を行う「CAIペン習字シス
テム」へ音声応答装置を適用した場合を例に挙げる。こ
のシステムは、ユーザが液晶画面付きペンタブレットを
用いて、画面に表示されたお手本をペンでなぞってペン
習字の練習を行うものである。そして、ユーザが液晶画
面上に表示されたお手本をなぞると、書きはじめの位置
やストローク(一筆)のずれについて、音声による指示
をインタラクティブに行うほか、正しくなぞなれている
場合には褒めるといったことも行う。
【0012】このように、本実施形態のシステムは、ユ
ーザのペン入力に対してリアクション音声を返してイン
タラクティブに教示を行うものである。その際、同時に
リアクション音声を通して「やさしい先生」であるとか
「厳しい先生」といったような個性をシステムに与える
ことも考えている。こうしてインタラクティブな教示と
個性を与えることで、ユーザがシステムに対して人間っ
ぽさや親しみを感じて楽しくペン習字を行えるユーザフ
レンドリなシステムを目指している。
【0013】さて、図1は本実施形態による音声応答装
置の構成を示すブロック図である。同図において、入力
INは、キーボード,マウスやタッチパネルやペンタブ
レットといったポインティング装置,ジョイスティッ
ク,ジョイパッド,その他の機器からの入力のほか、マ
イクロホンセンサ,磁気センサ,光センサ,圧力セン
サ,静電容量センサ,超音波センサ,画像認識装置,音
声認識装置,動画像認識装置,PB(プッシュボタン)
信号認識装置,その他の物理量を検出するセンサなどか
らの入力である。つまり、これら入力機器やセンサによ
って、ユーザの動作やユーザによる操作を認識するのに
必要とされるデータが入力INとして得られる。
【0014】出力装置1は音声/画像の何れか又は双方
を出力するもので、この出力装置1を使用することによ
って、システムの状態やユーザに対する指示,質問,応
答について、音声出力/画像表示の何れか又は双方を行
う。文脈スクリプト2は図示省略した記憶装置に格納さ
れており、入力INに基づくユーザへの指示,質問,応
答を行うためのシステムの動作が記述されている。解釈
装置3はこの文脈スクリプト2を解釈してその解釈結果
を出力するものである。
【0015】リアクションセット4は、図示省略した記
憶装置にインタラプト音声や指示音声の音声データを格
納したものであり、図1ではn(自然数)個のリアクシ
ョンセット4-1〜4-nが格納されている様子を示してあ
る。これらの音声は、波形データ,韻律(F0 ,パワ
ー,継続時間長)データ及び音韻記号列,日本語テキス
トデータ,制御タグ付きテキストや制御記述言語といっ
た形で格納されている。リアクションセット4の音声デ
ータとして、韻律を適切に整合した合成音声の韻律パラ
メータの形で用意することで、自然で多様な韻律を持ち
なお且つコンパクトなものも利用できるようになる。
【0016】また、リアクションセット4は「汎用リア
クションセット」および「特定リアクションセット」の
2種類のリアクションセットに大別される。「汎用リア
クションセット」は、「怒った感じ」,「哀しい感
じ」,「喜んだ感じ」,「楽しい感じ」,「のりのよい
感じ」,「すました感じ」といった感情を表現できる相
槌や合いの手、「えっ」や「あー」等の間投詞といった
システムの応答として汎用的に利用できる音声データを
集めたものである。これに対し、「特定リアクションセ
ット」は「右から」,「長く」などといった文脈スクリ
プト2やタスクに依存する音声データを集めたものであ
る。このようにリアクションセットを2つに分けておく
と、文脈スクリプト2及び「特定リアクションセット」
を交換することによって、リアクション音声の生成に関
連する機構を他のシステムへ適用できるようになる。
【0017】一方、性格モード5は、「やさしい性
格」,「厳しい性格」,「のりのよい性格」,「クール
な性格」といったようなシステムの擬人的な性格を記述
したものである。この性格モード5は、図示省略した記
憶装置上に格納されており、その記述内容についてはユ
ーザが適宜変更できるようになっている。
【0018】リアクションモード決定装置6は、予め設
定しておいた性格モード5と、後述する出力履歴保存装
置12に保持されているリアクション音声RVの出力履
歴をもとにして、「リアクションモード」を決定する。
ここで言うリアクションモードとは、インタラプト音声
や指示音声に感情表現やバリエーションを付けるための
もので、「怒った感じ」,「哀しい感じ」,「喜んだ感
じ」,「楽しい感じ」,「のりのよい感じ」,「すまし
た感じ」等といったものである。本実施形態では、こう
したリアクションモードにより、ユーザへ与える印象に
変化をつけている。
【0019】例えば、ユーザが何度も同じ誤りを繰り返
していると次第に口調が厳しくなって「怒った感じ」の
リアクションモードになり、また、ユーザとシステムと
のやりとりが正しくスムーズに進んでいると次第に口調
がやわらかくなって「楽しい感じ」のリアクションモー
ドになる。また、例えば性格モード5が「やさしい性
格」と「厳しい性格」とでは、リアクションモードが
「怒った感じ」のモードになるまでのモード変化の仕方
を変えるようにしている。このように、人間同士の会話
でも見られるリアクションモードの切り替えを行うこと
によってユーザに与える印象を変化させ、それにより、
知的な振る舞いや人間っぽい振る舞いをシステムで表現
している。
【0020】インタラプト音声生成装置7は、入力I
N,解釈装置3の出力(文脈スクリプトの解釈結果),
リアクションモード決定装置6の出力(リアクションモ
ード)をもとに、リアクションセット4の中から音声デ
ータを選択してインタラプト音声を生成する。ここで生
成されるインタラプト音声は、例えば、「えっ」「え
ー」「あっ」「あー」(驚いた感じや躊躇した感じ,し
ゃべりはじめの言葉等)といった間投詞,「そこ」「そ
れ」といった指示語,「そうそう」「そう」「うーん」
(納得した感じ,了解した感じ)といった了解を表す言
葉,「まって」「ちょっと」「うーん」(疑問を持った
感じ)といった言葉等の短い音声である。
【0021】指示音声生成装置8は、指示項目の決定,
指示メッセージの生成,指示メッセージの修飾といった
処理を行ってユーザへの指示音声を生成する。指示音声
生成装置8において、まず指示項目決定部9は、入力I
Nおよび解釈装置3の出力をもとに、ユーザに対してど
ういった指示を出すのかを決定する。この指示として
は、お手本との位置のずれやユーザに対する次の操作の
指示などが挙げられる。
【0022】次に、指示メッセージ生成部10は、指示
項目決定部9の出力とリアクションモード決定装置6の
出力に基づいて、具体的な指示メッセージを生成する。
この指示メッセージは例えば、「右から左」とか「上
に」といった指示や「待って」といったシステムの状態
を表すものである。
【0023】次いで、指示メッセージ修飾部11は、指
示メッセージ生成部10で生成された指示メッセージに
対し、リアクションモード決定装置6の出力に基づいて
修飾を行う。例えば、「右から」というメッセージに対
しては、「もっと右から」や「もう少し右から」といっ
たように「程度」を付加したり、出力履歴保存装置12
内の履歴情報をもとにして「今度は右から」や「まだ右
から」といったようにする。また、「怒った感じ」や
「楽しい感じ」といった感情表現も行うようにする。そ
して、修飾されたメッセージに対応する音声データをリ
アクションセット4の中から選択して指示音声を生成す
る。
【0024】出力履歴保存装置12は、インタラプト音
声生成装置7の出力(インタラプト音声),指示音声生
成装置8の出力(指示音声),応答画像生成装置13の
出力(応答画像)に関する出力履歴を保持している。応
答画像生成装置13は、入力INと解釈装置3の出力を
もとにして応答画像を生成する。そして、上述した出力
装置1は、出力履歴保存装置12を介して送られるイン
タラプト音声生成装置7の出力,指示音声生成装置8の
出力,応答画像生成装置13の出力のうちの少なくとも
1つを制御してリアクション音声RVを出力する。例え
ば、指示音声生成装置8からの指示音声と応答画像生成
装置13の画像との間の同期を取るようにしたり、指示
音声生成装置8からの指示音声を待たずにインタラプト
音声生成装置7からのインタラプト音声を出力する際、
指示音声がインタラプト音声にかぶらないようにしたり
する。
【0025】次に、図2を参照しつつ、上記構成による
音声応答装置を用いたリアクション音声の生成手順につ
いて説明する。ここで、文字ごとに指示を行うポイント
と、インタラプトメッセージを出す/出さない等の制御
情報を文脈スクプリト2に予め記述しておくようにす
る。また、性格モード5として「やさしい先生」や「厳
しい先生」といったモード(以下、特に「教師モード」
という)を予め設定しておくものとする。
【0026】いま、ユーザのペン入力によって「書きは
じめ」の位置のずれといったイベントが発生すると、こ
のイベントが入力INとして音声応答装置に与えられる
(ステップS1)。これによって以下に詳述する通り、
発生したイベントに対し、文脈スクリプト2に基づい
て、異なる2本のメッセージ生成パスでインタラプトメ
ッセージ(インタラプト音声)及び指示メッセージ(指
示音声)を生成する。
【0027】まず、インタラプト音声生成装置7は、イ
ベントの発生により与えられた入力INと解釈装置3に
より解釈された文脈スクリプト2に基づいて、リアクシ
ョンセット4から音声データを選択してインタラプト音
声を生成し、これを出力履歴保存装置12へ出力する
(ステップS2)。出力履歴保存装置12は生成された
インタラプト音声を出力履歴として保存する一方、出力
装置1は、このインタラプト音声をリアクション音声R
Vとして出力(ステップS3)する。これにより、「あ
っ」とか「そこっ」といったような間投詞や指示代名詞
を用いてユーザの注意を引き、ユーザの動作をインタラ
プトする。
【0028】一方、指示項目決定部9は、イベントの発
生で与えられた入力INと解釈装置3で解釈された文脈
スクリプト2を比較して、ユーザに対してどういった指
示を出すべきかを決定する(ステップS4)。次に、指
示メッセージ生成部10は、決定された指示に基づいて
「右から」とか「大きく撥ねて」といった具体的な指示
メッセージを生成する(ステップS5)。次いで、指示
メッセージ修飾部11は、リアクションモード決定装置
6が決定(ステップS6)したリアクションモードに基
づいて、生成された指示メッセージに対して以下に述べ
るような修飾を行う(ステップS7)。
【0029】すなわち、リアクションモード決定装置6
は、設定しておいた性格モード5(図2では教師モード
15)と、今までに出力した出力履歴保存装置12内の
リアクション音声の履歴をもとに、指示メッセージへ感
情表現やバリエーションを付け加える。例えば、何度も
同じ誤りを繰り返しているような場合には次第に口調を
厳しくして「怒った」印象を与える一方、うまく書ける
ようになっていれば次第に口調を柔らかくして「明るく
のりのよい」印象を与えるなどする。その際、教師モー
ド15が「きびしい先生」と「やさしい先生」とでは、
「怒る」までの誤りの繰り返し回数の閾値を変える。こ
のようにして、システムに個性を与えてユーザへ与える
印象に変化を付けている。このように、人間同士の会話
でも見られるリアクションモードの切り替えを行うこと
によって、ユーザへ与える印象を変化させ、知的な振る
舞いや人間っぽい振る舞いを表現している。
【0030】次に、指示メッセージ修飾部11は、修飾
の施された指示メッセージに対応した音声データをリア
クションセット4から取り出し、これを出力履歴保存装
置12に出力する。出力履歴保存装置12はこの音声デ
ータを出力履歴として保存(ステップS8)してから出
力装置1へ送出する。こうして、出力装置1は、指示音
声生成装置8からの指示音声をリアクション音声RVと
して出力する(ステップS3)。以上のように、本実施
形態におけるリアクション音声生成の特徴は、指示音声
による指示を行う前にインタラプトメッセージを出力す
るようにした点に加えて、教師モードとリアクション音
声の出力履歴をもとにして、感情表現やバリエーション
を付ける機構を有する点にある。
【0031】以上詳述した通り、本実施形態によるシス
テムでは、ユーザへ応答音声を伝える前に注意音声を出
力することで、システムの応答である応答音声を確実に
ユーザに伝えることができる。また、注意音声として間
投詞や指示語といった音声を用いることにより、我々人
間同士で会話を行うときと同様に、ユーザとシステムの
間でスムーズで自然なインタラクションを行わせること
ができる。したがって、従来の技術が抱える問題点、即
ち、ユーザの注意を引くためにブザーやベルといった音
を使用しているがために、ユーザとシステムの間でスム
ーズかつ自然なインタラクションを行うのが困難である
という問題を解消できる。さらに、システムの動作が記
述されている文脈スクリプトに従って一貫性があり特徴
的で多様なリアクション音声を返しているため、一本調
子,機械的,単調といったユーザがシステムに対して持
つ印象を解消して、システムをユーザフレンドリ化する
ことが可能となる。
【0032】
【発明の効果】以上説明したように、本発明によれば、
注意を引くための合図として、ブザーやベル等ではな
く、間投詞や指示語といったインタラプト音声を用いて
いる。また、予め設定した性格モードおよび応答音声の
出力履歴に基づいてリアクションモードを決定して指示
音声を生成している。さらに、システム動作が記述され
た文脈スクリプトに従って一貫性のある特徴を持った多
様なリアクション音声を返している。これらによって、
ユーザに対して多様かつある程度の秩序を持った応答を
行うことができるとともに、システムに対する擬人的な
印象をユーザへ強く与えることができる。また、我々人
間同士で会話を行うときと同様に、ユーザとシステムの
間でスムーズで自然なインタラクションができるように
なる。したがって、システムを使う気になる,システム
を使って楽しい,システムを使って面白い,システムに
親しみを持つ,システムを使いやすいなどとユーザに感
じさせることができ、ユーザフレンドリネスを持ったシ
ステムを提供することができる。また、特に、CAI等
のコンピュータを使った教育システムや対話システム、
アミューズメント機器といったものに適用することで、
これらシステムのヒューマンインターフェースの効率を
向上させることができる。
【0033】また、請求項4記載の発明によれば、リア
クションセットを汎用リアクションセットと特定リアク
ションセットから構成するようにしている。これによ
り、文脈スクリプトと特定リアクションセットを交換す
ることで、リアクション音声の生成に関連する機構を他
のシステムへ適用することができる。また、請求項5記
載の発明によれば、韻律を整合した合成音声の韻律パラ
メータでリアクションセットの音声データを表してい
る。これにより、自然で多様な韻律を持ちかつコンパク
トなリアクションセットを実現することができる。ま
た、請求項6記載の発明によれば、ユーザの動作やユー
ザによる操作に対し、ユーザの注意を引いてユーザ動作
に割り込むためのインタラプト音声を注意音声で行って
から、応答内容を伝える応答音声を指示音声によって返
すようにしている。これにより、ユーザに対して応答内
容を確実に伝達することができる。
【図面の簡単な説明】
【図1】 本発明の一実施形態による音声応答装置の構
成を示すブロック図である。
【図2】 同音声応答装置におけるリアクション音声の
生成手順の流れを模式的に表した説明図である。
【符号の説明】
1 出力装置 2 文脈スクリプト 3 解釈装置 4,4-1〜4-n リアクションセット 5 性格モード 6 リアクションモード決定装置 7 インタラプト音声生成装置 8 指示音声生成装置 9 指示項目決定部 10 指示メッセージ生成部 11 指示メッセージ修飾部 12 出力履歴保存装置 13 応答画像生成装置 15 教師モード IN 入力 RV リアクション音声

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】 ユーザの動作や該ユーザによる操作を検
    出する検出手段と、 前記検出手段の検出結果に応じたシステム動作が記述さ
    れた文脈スクリプトを解釈して解釈結果を出力する解釈
    手段と、 前記ユーザに応答を行った応答音声の出力履歴を保存し
    てゆく履歴保存手段と、 擬人的性格が記述された性格モードと前記出力履歴に基
    づいて、前記応答音声に変化を与えるためのリアクショ
    ンモードを決定するリアクションモード決定手段と、 前記検出結果,前記解釈結果および前記リアクションモ
    ードに基づいて、前記ユーザの動作に割り込むインタラ
    プト音声を生成するインタラプト音声生成手段と、 前記検出結果,前記解釈結果および前記リアクションモ
    ードに基づいて、前記ユーザに対する指示音声を生成す
    る指示音声生成手段とを具備することを特徴とする音声
    応答装置。
  2. 【請求項2】 前記指示音声生成手段は、 前記検出結果と前記解釈結果に基づいて前記ユーザに指
    示すべき指示項目を決定する指示項目決定手段と、 前記指示項目と前記リアクションモードに基づいて指示
    メッセージを生成する指示メッセージ生成手段と、 前記リアクションモードに基づいて前記指示メッセージ
    を修飾する指示メッセージ修飾手段とから成ることを特
    徴とする請求項1記載の音声応答装置。
  3. 【請求項3】 音声データを集めたリアクションセット
    が予め記憶されているリアクションセット記憶手段をさ
    らに具備し、 前記インタラプト音声生成手段は、生成すべきインタラ
    プト音声に対応する音声データを前記リアクションセッ
    トの中から選択することで、前記インタラプト音声の生
    成を行うことを特徴とする請求項1又は2記載の音声応
    答装置。
  4. 【請求項4】 前記リアクションセットは、汎用的な応
    答音声データを集めた汎用リアクションセットと、前記
    文脈スクリプトに依存する音声データを集めた特定リア
    クションセットからなることを特徴とする請求項3記載
    の音声応答装置。
  5. 【請求項5】 前記リアクションセットを構成する音声
    データは、韻律を整合した合成音声の韻律パラメータで
    表されることを特徴とする請求項3又は4記載の音声応
    答装置。
  6. 【請求項6】 前記インタラプト音声生成手段から前記
    インタラプト音声を出力させたのちに、前記指示音声生
    成手段から前記指示音声を出力させる出力制御手段をさ
    らに具備することを特徴とする請求項1〜5の何れかの
    項記載の音声応答装置。
  7. 【請求項7】 前記インタラプト音声生成手段又は前記
    指示音声生成手段の少なくとも一方は、前記インタラプ
    ト音声又は前記指示音声を合成音声により生成すること
    を特徴とする請求項1〜6の何れかの項記載の音声応答
    装置。
  8. 【請求項8】 前記合成音声は、録音編集合成音声,波
    形編集合成音声,規則合成音声,パラメータ合成音声の
    何れかであることを特徴とする請求項7記載の音声応答
    装置。
  9. 【請求項9】 CAIシステムに組み込まれ、或いは、
    該CAIシステムとともに用いられることを特徴とする
    請求項1〜8の何れかの項記載の音声応答装置。
JP10040873A 1998-02-23 1998-02-23 音声応答装置 Pending JPH11237971A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10040873A JPH11237971A (ja) 1998-02-23 1998-02-23 音声応答装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10040873A JPH11237971A (ja) 1998-02-23 1998-02-23 音声応答装置

Publications (1)

Publication Number Publication Date
JPH11237971A true JPH11237971A (ja) 1999-08-31

Family

ID=12592643

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10040873A Pending JPH11237971A (ja) 1998-02-23 1998-02-23 音声応答装置

Country Status (1)

Country Link
JP (1) JPH11237971A (ja)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001209820A (ja) * 2000-01-25 2001-08-03 Nec Corp 感情表出装置及びプログラムを記録した機械読み取り可能な記録媒体
KR20030002999A (ko) * 2001-06-30 2003-01-09 주식회사 케이티 스크립트 생성기법을 이용한 음성인식 시스템 시험장치 및그 방법
KR100446627B1 (ko) * 2002-03-29 2004-09-04 삼성전자주식회사 음성대화 인터페이스를 이용한 정보제공장치 및 그 방법
JP2005249817A (ja) * 2004-03-01 2005-09-15 Pioneer Electronic Corp 対話装置及び方法
KR100527512B1 (ko) * 2002-12-13 2005-11-09 현대자동차주식회사 차량 전자장비의 제어 방법 및 시스템
KR100554397B1 (ko) * 2003-03-25 2006-02-22 조승호 대화형 음성 인식 시스템 및 방법
KR100580619B1 (ko) * 2002-12-11 2006-05-16 삼성전자주식회사 사용자와 에이전트 간의 대화 관리방법 및 장치
JP2015135419A (ja) * 2014-01-17 2015-07-27 株式会社デンソー 音声認識端末装置、音声認識システム、音声認識方法
JP6170604B1 (ja) * 2016-09-20 2017-07-26 株式会社カプコン 音声生成装置
JP2018025706A (ja) * 2016-08-12 2018-02-15 株式会社カプコン 音声生成装置
JP2018072805A (ja) * 2017-04-20 2018-05-10 株式会社カプコン 音声生成プログラムおよびゲーム装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0333796A (ja) * 1989-06-29 1991-02-14 Matsushita Electric Ind Co Ltd 対話システム
JPH06301328A (ja) * 1993-04-13 1994-10-28 Mitsubishi Electric Corp Cai学習装置
JPH07104778A (ja) * 1993-10-07 1995-04-21 Fuji Xerox Co Ltd 感情表出装置
JPH0981174A (ja) * 1995-09-13 1997-03-28 Toshiba Corp 音声合成システムおよび音声合成方法
JPH09244680A (ja) * 1996-03-11 1997-09-19 N T T Data Tsushin Kk 韻律制御装置及び方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0333796A (ja) * 1989-06-29 1991-02-14 Matsushita Electric Ind Co Ltd 対話システム
JPH06301328A (ja) * 1993-04-13 1994-10-28 Mitsubishi Electric Corp Cai学習装置
JPH07104778A (ja) * 1993-10-07 1995-04-21 Fuji Xerox Co Ltd 感情表出装置
JPH0981174A (ja) * 1995-09-13 1997-03-28 Toshiba Corp 音声合成システムおよび音声合成方法
JPH09244680A (ja) * 1996-03-11 1997-09-19 N T T Data Tsushin Kk 韻律制御装置及び方法

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001209820A (ja) * 2000-01-25 2001-08-03 Nec Corp 感情表出装置及びプログラムを記録した機械読み取り可能な記録媒体
KR20030002999A (ko) * 2001-06-30 2003-01-09 주식회사 케이티 스크립트 생성기법을 이용한 음성인식 시스템 시험장치 및그 방법
KR100446627B1 (ko) * 2002-03-29 2004-09-04 삼성전자주식회사 음성대화 인터페이스를 이용한 정보제공장치 및 그 방법
KR100580619B1 (ko) * 2002-12-11 2006-05-16 삼성전자주식회사 사용자와 에이전트 간의 대화 관리방법 및 장치
KR100527512B1 (ko) * 2002-12-13 2005-11-09 현대자동차주식회사 차량 전자장비의 제어 방법 및 시스템
KR100554397B1 (ko) * 2003-03-25 2006-02-22 조승호 대화형 음성 인식 시스템 및 방법
JP2005249817A (ja) * 2004-03-01 2005-09-15 Pioneer Electronic Corp 対話装置及び方法
JP2015135419A (ja) * 2014-01-17 2015-07-27 株式会社デンソー 音声認識端末装置、音声認識システム、音声認識方法
JP2018025706A (ja) * 2016-08-12 2018-02-15 株式会社カプコン 音声生成装置
JP6170604B1 (ja) * 2016-09-20 2017-07-26 株式会社カプコン 音声生成装置
JP2018049069A (ja) * 2016-09-20 2018-03-29 株式会社カプコン 音声生成装置
JP2018072805A (ja) * 2017-04-20 2018-05-10 株式会社カプコン 音声生成プログラムおよびゲーム装置

Similar Documents

Publication Publication Date Title
McTear Conversational ai: Dialogue systems, conversational agents, and chatbots
CN106653052B (zh) 虚拟人脸动画的生成方法及装置
US5357596A (en) Speech dialogue system for facilitating improved human-computer interaction
Crumpton et al. A survey of using vocal prosody to convey emotion in robot speech
Pietquin A framework for unsupervised learning of dialogue strategies
Ball et al. Emotion and personality in a conversational agent
JP3125746B2 (ja) 人物像対話装置及び人物像対話プログラムを記録した記録媒体
JP4729902B2 (ja) 音声対話システム
JPH05216618A (ja) 音声対話システム
Delgado et al. Spoken, multilingual and multimodal dialogue systems: development and assessment
JPH11237971A (ja) 音声応答装置
JP2002169590A (ja) 模擬会話システム、模擬会話方法、および情報記憶媒体
JP2006068489A (ja) 対話型ペットロボット
JP3667615B2 (ja) 音声対話方法及びそのシステム
Anderson et al. Language learning with interactive virtual agent scenarios and speech recognition: Lessons learned
Bourguet Towards a taxonomy of error-handling strategies in recognition-based multi-modal human–computer interfaces
Turunen Jaspis-a spoken dialogue architecture and its applications
DeMara et al. Towards interactive training with an avatar-based human-computer interface
CN111695777A (zh) 教学方法、装置、电子设备以及存储介质
Madhusha et al. Mobile Base Sinhala Book Reader for Visually Impaired Students
WO2013085863A1 (en) Methods and systems for teaching a non-native language
JPH1185178A (ja) 合成音声応答方法及び装置及び合成音声応答プログラムを格納した記憶媒体
WO2013086575A1 (en) Speech visualisation tool
JP2007122510A (ja) 提示装置及び提示プログラム
Granström et al. Speech and gestures for talking faces in conversational dialogue systems

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040511

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040518

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20040928