JP2007122510A - 提示装置及び提示プログラム - Google Patents
提示装置及び提示プログラム Download PDFInfo
- Publication number
- JP2007122510A JP2007122510A JP2005315264A JP2005315264A JP2007122510A JP 2007122510 A JP2007122510 A JP 2007122510A JP 2005315264 A JP2005315264 A JP 2005315264A JP 2005315264 A JP2005315264 A JP 2005315264A JP 2007122510 A JP2007122510 A JP 2007122510A
- Authority
- JP
- Japan
- Prior art keywords
- sentence
- dialogue
- presentation
- presenting
- sentences
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- User Interface Of Digital Computer (AREA)
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【課題】文章の各文を提示する際の文の提示順を変更する。
【解決手段】文章の文を対話形式で提示する提示装置において、入力装置から操作コマンドが入力されると、これが次のドキュメントを指示するコマンドが格納されているか否かを判断する(154)。次のドキュメントを指示するコマンドの場合、次のドキュメントに移行するための処理を実行する(164)。次のドキュメントを指示するコマンド以外の他の操作命令のコマンドの場合、今回のコマンドに対応するテキストを検索し、提示できるように処理する(156)。
【選択図】図10
【解決手段】文章の文を対話形式で提示する提示装置において、入力装置から操作コマンドが入力されると、これが次のドキュメントを指示するコマンドが格納されているか否かを判断する(154)。次のドキュメントを指示するコマンドの場合、次のドキュメントに移行するための処理を実行する(164)。次のドキュメントを指示するコマンド以外の他の操作命令のコマンドの場合、今回のコマンドに対応するテキストを検索し、提示できるように処理する(156)。
【選択図】図10
Description
本発明は、提示装置及び提示プログラムにかかり、より詳細には、文章の文を対話形式で提示する提示装置及び提示プログラムに関する。
現在、インターネット等の通信方法を用いて提示される情報は、書き手が一方的に叙述するモノローグ的な文章である。しかしながら、モノローグ的な文章は、万人向けの情報提示手段ではなく、専門的なモノローグ的文章よりも、重要な部分を質問応答形式で表した会話形式の文章の方が一般的に親しみやすく、理解の度合いも高い傾向にある。そこで、従来、モノローグ的文章に基づいて、それをより親しみやすく理解しやすい会話表現に変換する会話表現生成装置が提案されている(特許文献1参照)。この装置では、電子掲示板に入力された一方的に叙述する文章、例えば、イベントの内容を紹介する文章などを取得し、取得した文章を文毎に区切り、各文の文末表現、例えば、「〜がある」、「〜だそうだ」に応じて分類し、予め各分類に応じて定められたコメントを各分類された文に対応させ、キャスターのイメージ画像を動かしながらコメントを音声出力し、アナウンサーのイメージ画像を動かしながら文を音声出力している。
特開2004−102764号公報
上記会話表現生成装置では、確かに、モノローグ的文章に基づいて、それを会話表現に変換して提示しているので、より親しみやすく理解しやすくなる。
しかしながら、その提示される文の順番はもとの文章に依存し固定されている。従って、ユーザにとって必要な文の前に不要な文が配置されていると、ユーザは、必要な文を認識するまでに不要な文を認識しなければならず、これはユーザにとってわずらわしい。
本発明は、上記事実に鑑み成されたもので、文の提示順を変更することの可能な提示装置及び提示プログラムを提供することを第1の目的とする。
また、上記特許文献1における装置では、各文をその文末表現に基づいて分類し、各分類に応じたコメント(対話文)を対応づけている。例えば、「〜がある」に対しては単に『どうだったの?』、「〜だそうだ」に対しても単に『どんななの?』等である。このように、文の文末表現に基づいた分類では、コメントは文の内容自体を問うことはできない。従って、文の内容自体を問わないコメントが提示されても、どのような種類の文が提示されるのかをユーザは認識できず、対話形式で文を提示しても理解の補助としては不十分である。なお、各文をその文末表現に基づいて分類することが、提示される文の順番がもとの文章に依存し固定してしまう原因でもある。
本発明は、上記事実に鑑み成されたもので、文の内容を問う対話用文を提示することの可能な提示装置及び提示プログラムを提供することを第2の目的とする。
上記第1の目的を達成するために請求項1に記載の発明は、取得手段により取得された複数の文から構成される文章の文章データにおいて分類手段により分類された文と、分類に応じて予め定められた対話用文とが対応付け手段により対応づけられ、提示手段により、該対応付けられた文と対話用文とを対応づけて提示する提示装置であって、対話用文を指定するための指定手段を更に備え、前記提示手段は、前記指定手段により前記対話用文が指定された場合、指定された対話用文と該対話用文に対応付けられた文とを提示することを特徴とするものである。
即ち、取得手段は、複数の文から構成される文章の文章データを取得し、分類手段は、前記文章の文を分類し、対応付け手段は、分類された文と分類に応じて予め定められた対話用文とを対応づける。そして、提示手段は、前記対応付けられた文と対話用文とを対応づけて提示する。
なお、上記取得手段、分類手段、及び対応付け手段は、本提示装置に備えなくても備えてよい。これらの手段を提示装置に備えていない場合には、上記のように対応付けられた文と対話文とを入力し、提示手段が、これらの文と対話文とを対応付けて提示する。なお、提示手段は提示装置に備えられている。
ここで、従来では、上記のように、その提示される文の順番はもとの文章に依存し固定されている。従って、ユーザにとって必要な文の前に不要な文が配置されていると、ユーザは、必要な文を認識するまでに不要な文を認識しなければならず、ユーザにとってわずらわしい。
そこで、本発明の指定手段は、対話用文を指定し、提示手段は、指定手段により対話用文が指定された場合、指定された対話用文と該対話用文に対応付けられた文とを提示する。なお、指定手段は、音声を認識する音声認識手段を構成要素として用い、ユーザの音声を認識することにより対話用文を指定したり、表示手段及び表示手段の表示画面のどの個所がタッチされたのか検出するタッチ位置検出手段を構成要素として用い、表示手段の表示画面に指定可能な対話用文を表示し、ユーザが対話用文をタッチし、このタッチ位置をタッチ位置検出手段が検出することにより、いずれの対話用文が指定されたかを検出することにより対話用文を指定したり、してもよい。
このように、対話用文が指定された場合、指定された対話用文と該対話用文に対応付けられた文とを提示するので、文の提示順を変更することができる。
ところで、従来では、各文をその文末表現に基づいて分類しているので、文の文末表現に基づいた分類では、対話用文は文の内容自体を問うことはできない。従って、文の内容自体を問わない対話用文が提示されても、どのような種類の文が提示されるのかをユーザは認識できず、対話形式で文を提示しても理解の補助としては不十分である。
そこで、請求項2記載の発明の分類手段は、文の内容に応じた種類毎に文を分類する。具体的には、請求項3記載の発明のように、前記内容の複数の種類各々について、自立語を予め対応付けておき、前記分類手段は、前記文から自立語を抽出し、抽出された自立語と、前記内容の複数の種類各々について対応づけられた自立語とに基づいて、文を、文の内容に応じた種類毎に分類する。
このように、文の内容に応じた種類毎に文を分類するので、文の内容を問う対話用文を提示することができる。
請求項4記載の発明は、請求項1乃至請求項3の何れか1項に記載の発明において、前記対応付け手段は、複数の文の内、最初に提示するように定められた文以外の少なくとも1つの文には、対話用文として、文のつながりを円滑にするための表現を対応付けることを特徴とする。
ここで、文のつながりを円滑にするための表現としては、例えば、相槌やうながしの文や文節、例えば、「それで?」や「なるほど」等である。このように、文のつながりを円滑にするとは、文のつながりの理解を円滑にする意味である。
対応付け手段は、前記分類手段により複数の文が同一の分類に分類された場合に、上記のように、複数の文の内、最初に提示するように定められた文以外の文には、対話用文として、文のつながりを円滑にするための表現を対応付けるようにしてもよい。
また、請求項5記載の発明は、請求項1乃至請求項4の何れか1項に記載の発明において、前記提示手段は、文の提示を担当する第1の提示主体と対話用文の提示を担当する第2の提示主体とを用いて、文と対話用文とを対応づけて提示することを特徴とする。
ここで、上記第1の提示主体及び前記第2の提示主体の少なくとも一方は、仮想的な提示主体でも、実在的な提示主体でもよい。なお、仮想的な提示主体としては、例えば、表示画面上に表示された提示主体、例えば、キャラクタ画像である。また、実在的な提示主体としては、例えば、実在空間において現実に動作可能なロボットである。
請求項6記載の発明は、請求項1乃至請求項5の何れか1項に記載の発明において、前記提示手段は、文と対話用文との提示の履歴を提示することを特徴とする。
請求項7記載の発明は、請求項1乃至請求項6の何れか1項に記載の発明において、前記提示手段は、前記指定手段により指定可能な対話用文を更に提示することを特徴とする。なお、提示手段は、指定手段により対話用文が提示される際に、前記指定手段により指定可能な対話用文を提示するようにしてもよい。
請求項8記載の発明は、請求項1乃至請求項7の何れか1項に記載の発明において、前記提示手段は、視覚的方法及び聴覚的方法の少なくとも一方の方法で提示することを特徴とする。
ここで、視覚的方法としては、提示表示画面に表示したり、被印刷媒体に印刷したりすることが該当する。また、聴覚的方法としては、音声出力することが該当する。
より具体的には、上記のように、仮想的な提示主体を採用した場合、表示画面に表示されたキャラクタ画像が、文ないし対話用文を音声出力するかのように動作し、文ないし対話用文を画面上に表示する場合が該当する。画面上に表示することに代え又はこれと共に、文ないし対話用文を音声出力する場合も該当する。
また、実在的な提示主体としては、例えば、現実に動作可能なロボットを採用した場合、文ないし対話用文を音声出力する場合が該当する。なお、ロボットの何れかの個所に表示画面を設け、文ないし対話用文を画面上に表示する場合も該当する。
請求項9記載の発明は、取得手段により取得された複数の文から構成される文章の文章データの文が分類手段により分類された文と、分類に応じて予め定められた対話用文とが対応付け手段により対応づけられ、提示手段により、該対応付けられた文と対話用文とを対応づけて提示する提示処理をコンピュータに実行させる提示プログラムであって、前記提示手段は、対話用文を指定するための指定手段により前記対話用文が指定された場合、指定された対話用文と該対話用文に対応付けられた文とを提示することを特徴とする。なお、本発明の作用・効果は、上記発明と同様であるので、その説明を省略する。
請求項10記載の発明は、取得手段により取得された複数の文から構成される文章の文章データの文が分類手段により分類された文と、分類に応じて予め定められた対話用文とが対応付け手段により対応づけられ、提示手段により、該対応付けられた文と対話用文とを対応づけて提示する提示装置であって、前記分類手段は、文を、文の内容に応じた種類毎に分類することを特徴とする。
請求項10記載の発明と請求項1記載の発明と比較すると、請求項1記載の発明は、対話用文を指定するための指定手段を更に備え、前記提示手段が、前記指定手段により前記対話用文が指定された場合、指定された対話用文と該対話用文に対応付けられた文とを提示するのに対し、請求項10記載の発明は、分類手段は、文を、文の内容に応じた種類毎に分類する点で相違する。
請求項10記載の発明は、従来では、各文をその文末表現に基づいて分類しているので対話用文は文の内容自体を問うことはできない点に鑑み、文を、文の内容に応じた種類毎に分類すことにより、文の内容を問う対話用文を提示することができるようにしたものである。
請求項11記載の発明は、複数の文から構成される文章の文章データにおいて分類された文と、分類に応じて予め定められた対話用文とが予め対応づけられ、提示手段により、該対応付けられた文と対話用文とを対応づけて提示する提示装置であって、対話用文を指定するための指定手段を更に備え、前記提示手段は、前記指定手段により前記対話用文が指定された場合、指定された対話用文と該対話用文に対応付けられた文とを提示することを特徴とする。
以上説明したように第1の発明は、対話用文が指定された場合、指定された対話用文と該対話用文に対応付けられた文とを提示するので、文の提示順を変更することができる。
また、第2の発明は、文を、文の内容に応じた種類毎に分類するので、文の内容を問う対話用文を提示することができる。
以下、図面を参照して、本発明の実施の形態を詳細に説明する。
図1に示すように、本実施の形態の対話文生成装置は、CPU12、ROM14、RAM16、マウスやキーボードなどや音声入力装置により構成される入力装置18、通信装置20、記憶装置22、及び、音声出力機能も有する表示装置24を、バス26を介して相互接続して構成されている。
上記記憶装置22には、通信装置20により受信された、例えば、図2に示すような、飲食店を紹介する文章(一方的に叙述する文章)が記憶されている。この文章は、飲食店を紹介する複数の文、「隠れ家のような雰囲気でゆったりできるお店です。」、「和食の達人が作る繊細な料理が楽しめます。」、「さらに、素材にもこだわりとてもヘルシーです。」等から構成されている。
また、記憶装置22には、図3に示すように、上記一方的に叙述する文章から対話形式で該文章の各文を提示するためのデータを記憶するテーブルも記憶されている。
ここで、対話は、一方的に叙述する文章の情報(文)を提示する第1の提示主体(システムの代理「SYS」)と、上記情報の提示を要求する要求情報(操作命令)を提示する第2の提示主体(ユーザの代理「USR」)との間で行われる。
テーブルには、第1の提示手段(SYS)により提示される情報(文)32と、第2の提示手段(USR)により提示される要求情報(対話用文に対応する操作命令)を識別するコマンドID34とを1組として、複数組を、1つの文章(ドキュメント)ごとに記憶している。なお、本実施の形態ではこの1組をムーヴと定義する。
コメントIDとしては、具体的に、「どんなお店ですか?」等のように、一定種類の情報の提示を要求(コマンド)するものと、要求情報の提示をさせないことを命令するもの(コマンドがないことを示すN/A)とがある。
N/AでないコマンドIDから始まる組から、次のN/AでないコマンドIDから始まる組までを一つの単位としてエクスチェンジと呼ぶ。各エクスチェンジにはID36とそのエクスチェンジが提示されたか否かを示す既読フラグ38と呼ばれる情報が付与される。あるドキュメントの最後を示す特別なIDとしてEODを用いる。一つのデータには1から始まりEODで終わる複数のドキュメントが格納される。なお、各ドキュメントは、図示しないドキュメントIDにより識別される。
次に、本実施の形態の作用を説明する。まず、上記一方的に叙述する文章(ドキュメント)から対話形式で該文章の各文を提示するためのデータを作成する対話形式データ作成プログラムを、図4を参照して説明する。なお、対話形式データ作成プログラムは、ユーザにより一方的に叙述する文章が指定されて、本プログラムの実行が命令されたとき、又は、一方的に叙述する文章が取得されたときに実行される。
まず、ステップ42で、本プログラムで使用する各種の変数(後述するt、s、c、ts)を0に初期化する。
ステップ44で、ドキュメント内の各文(テキスト)を識別する変数tを1インクリメントし、ステップ46で、テキストtから、文の内容を表すクラスを意味する主題を抽出し、ステップ48で、テキストtに主題を対応づける。具体的には、テキストtから自立語を抽出する。本実施の形態では、複数の主題と、各主題に対応する自立語とを予め対応させている。そして、抽出された自立語から、該自立語に対応する主題を選択し、これをテキストtに対応づける。なお、上記主題とは、上記のように、文の内容を表すクラスのことであり、言語学上の主題とは異なる意味である。
例えば、上記「隠れ家のような雰囲気でゆったりできるお店です。」の文を例にとり説明すると、この文に含まれる自立語は、「隠れ家、よう、雰囲気、ゆったり、できる、店」である。そして、1つの主題としては『店』があり、本実施の形態では、『店』に対応して「隠れ家」を定めておく。上記文から抽出された自立語(隠れ家、よう、雰囲気、ゆったり、できる、店)と、各主題に対応して定めた自立語とに基づいて、上記文の主題を抽出する。
ステップ50で、変数tが、テキストの総数Tか否かを判断することにより、今回取得したドキュメントのすべてのテキストから主題を抽出したかを判断する。変数tがテキストの総数Tでないと判断された場合には、ステップ44に戻って以上の処理(ステップ44〜50)を繰り返す。
一方、変数tがテキストの総数Tである場合には、ステップ52で、上記テキストに対応づけた各種主題を識別する変数sを1インクリメントし、ステップ54で、主題sに対応づけられたテキストの数が所定個以上か否かを判断する。主題sに対応づけられたテキストの数が所定個以上であると判断された場合には、ステップ56で、テキストを分類するためのクラスを識別する変数cを1インクリメントし、ステップ58で、主題sに対応する各テキストにクラスcを付与し、ステップ60で、クラスcのテキストを上記テーブルに記憶する。
ここで、図5を参照してステップ60の処理を詳細に説明する。
ステップ72で、クラスcの各テキストを識別する変数tsを1インクリメントし、ステップ74で、変数tsの直前の発話がクラスcか否かを判断する。変数tsの直前の発話がクラスcである場合には、クラスcの最初のテキストであると判断できるので、ステップ76で、クラスcに対応するコマンドIDを、図6に示すように予め定めたデータテーブルから取得し、取得したコマンドIDを、図3に示すように、話者USRに対応して記憶する。次のステップ78で、テキストtsをコマンドIDに隣接させて記憶する。
ステップ82で、変数tsがクラスcのテキストの総数TSか否かを判断し、変数tsがクラスcのテキストの総数TSであると判断された場合には、図4のステップ62に進み、変数tsがクラスcのテキストの総数TSでないと判断された場合には、ステップ72に戻って、以上の処理(ステップ72〜82)を繰り返す。ステップ74で、変数tsの直前の発話がクラスcでないと判断された場合には、クラスcの2番目以降のテキストであり、このテキストに対応して、同様のコマンドIDを記憶したのでは、テキストを提示する際、同じ種類のテキストを提示するたびに同じ対話が行われてしまい、ユーザに違和感を与えてしまう。そこで、本実施の形態では、ステップ80で、コマンドIDとして、上記N/Aを記憶して、ステップ78に進む。
図4のステップ62で、変数sが、今回取得したドキュメントの主題の総数S0か否かを判断し、変数sが総数S0でないと判断された場合には、ステップ52に戻って、以上の処理(ステップ52〜62)を繰り返す。
一方、変数sが今回取得したドキュメントの主題の総数S0であると判断された場合には、ステップ64で、同じ主題のテキストの数が所定個以上ないテキストにクラスc0を付与し、ステップ66で、クラスc0が付与されたテキストを記憶する。なお、本ステップ66でも上記ステップ60と同様の処理を実行するが、コマンドIDはすべてN/Aである。
次に、図7を参照して、ドキュメントのテキストを対話形式で提示するテキスト対話形式提示プログラムを説明する。ステップ102で、テーブルに含まれる最初のドキュメントのドキュメントIDを変数docに格納する。ステップ104で、変数docに格納されるエクスチェンジのうち、既読フラグがたっていない最初のエクスチェンジを変数excに格納する。また本処理と同時にexcに対応するデータ中の既読フラグをセットする。ステップ106で、excがEODであるか否かを判断し、excがEODであれば、ステップ136で、変数docのドキュメントを既読とし、ステップ138で、記憶装置22から既読でないドキュメントを探し出し、変数docに格納する。ステップ140で、docがNULL、すなわち全てのドキュメントが既読か否かを判断し、docがNULLであれば本システムの実行を終了する。
一方、ステップ106で、excがEODでない場合は以下の処理を繰り返し実行する。始めにステップ110で、変数moveに変数exc中に含まれる未提示の最初のムーヴの情報を格納する。ここでムーヴは、上記のように、図3中の各行に含まれる情報(話者と発話)を指す。
ステップ112で、変数moveがNULLの場合、すなわち1エクスチェンジ中の情報を全て提示したか否かを判断し、変数moveがNULLの場合は、ステップ104に戻って、変数excに次のエクスチェンジの情報を格納する処理を再実行する。そうでない場合は、ステップ114で、変数spkに変数moveから話者の情報を格納する。
ステップ116で、話者がユーザ役である第2の提示主体(USR)か否を判断し、話者がユーザの場合には、ステップ118で、変数comにmoveのコマンドIDの情報を格納し、さらに、図8に示すコマンドIDと提示テキストの対応表から、提示するテキスト情報を検索し変数uttに格納する。
ステップ120で、コマンドIDがN/Aか否かを判断し、コマンドIDがN/Aの場合はuttに何も格納せずに、ステップ130に進む。一方、spkがSYSの場合は、ステップ122で、変数moveから発話の情報を取り出し、変数uttに格納する。
ステップ130では、このように決定されたuttを、変数spkに対応するシステムまたはユーザの代理表象を選択し提示し、ステップ110に戻って、この処理を変数excに格納されているムーヴが空になるまで繰り返す。
ここで、上記ステップ130における提示方法の一例を説明する。この例では、上記のように決定されたuttを視覚的及び聴覚的に提示する。具体的には、図9に示すように、ユーザとシステムの代理を表す表象(提示主体)として、ロボットのキャラクタ(第1の提示主体)と犬のキャラクタ(第2の提示主体)とを用いる。手前の犬のキャラクタがユーザの代理を表す表象であり、奥のロボットのキャラクタがシステムの代理を表す表象の例である。犬のキャラクタとロボットのキャラクタにより音声により上記提示を行う場合には、各々の音声を異ならせることにより、2つの表象を区別し、音声合成のパラメータを変数spkに応じて切り替えることによって実現する。更に、図9に示すように、文字でテキストや操作命令を表示する。
また、図9に示すように、提示主体間の対話の履歴を示すことにより、ユーザの対話文脈に対する理解を補助することができる。本処理(図7の(A)のステップ130)として、発話文のFIFO型の履歴バッファを用意し、変数uttの内容をバッファにストアした上で、バッファの内容を画面に提示することで実現できる。
次に、図10を参照して、テキスト提示順変更プログラムを説明する。本プログラムは、入力装置18から操作コマンドが入力されたタイミングで動作を開始する。すなわち、入力装置18から操作コマンドが入力されると、図7に示すテキスト対話形式提示プログラムが実行中であっても、本プログラムが割り込んで実行される。
本プログラムがスタートすると、ステップ152で、変数ucomに入力装置18から得たコマンドidが格納される。ここで、コマンドidには、次のドキュメントを指示するコマンド、その他の操作命令(図6参照)のコマンドがある。
ステップ154で、変数ucomに次のドキュメントを指示するコマンドが格納されているか否かを判断し、変数ucomに次のドキュメントを指示するコマンドが格納されている場合には、ステップ164で、変数docに対応するドキュメントの全ての既読フラグをセットして、図7のステップ104に戻りテキスト選択処理を続行する。
一方、変数ucomに次のドキュメントを指示するコマンド以外の他の操作命令(図6参照)のコマンドが格納されている場合には、ステップ156で、変数docに対応するドキュメントで既読フラグが成立していないエクスチェンジのうち、第1ムーブのコマンドIDがucomに等しいエクスチェンジを検索し変数nexcに格納する。ステップ158で、nexcがNULL、すなわち前述の検索処理の結果、該当するエクスチェンジが見つからなかったか否かを判断し、nexcがNULLである場合、ステップ162で、図11に示すようなエクスチェンジを動的に生成し、excに生成したエクスチェンジを格納して、図7のステップ110に進み、また、nexcがNULLでない場合には、ステップ160で、変数excにnexcを代入し、図7のステップ110に進み、テキスト選択処理を継続する。
以上説明した実施の形態では、情報を伝達する際、独話形式のドキュメントを読み上げるよりも、二者間の対話形式で文脈に即した情報を挿入しながら伝達する方が、聞き手の理解度が高いことの報告に鑑み、文脈に即した操作命令テキストを挿入することによって当該効果を得ている。
例えば、飲食店の情報を提示する例において、「他のお店について教えて」や「もういいや」などの操作コマンドを用意することによって、本システムではユーザがある飲食店の情報に興味がない場合、前述のコマンドをシステムに命令することが可能である。このコマンドに従ってシステムが別の飲食店の情報を伝達することによって、ユーザの興味に従って提示するドキュメントを任意に変更することができる。
従来のシステムでは、ユーザは操作マニュアルなどを予め読み、操作コマンドを覚える必要があった。しかしながら本システムではユーザの代理役が提示するテキスト情報はシステムへの操作コマンドそのものであるため、システムからの情報を得る過程でシステムの代理役とユーザの代理役のふるまいを必然的に観察することになる。これはシステムへの操作を間接的に学習すること等価であるので、ユーザにはユーザの代理役の発話を模倣するよう教示することによって、システムの操作法を分かりやすく伝えることが出来る。
次に、本実施の形態の種々の変形例を説明する。
前述した実施の形態では、図7のステップ120で、コマンドIDがN/Aか否かを判断し、コマンドIDがN/Aの場合はuttに何も格納せずに、ステップ130に進むようにしているのは、同一の分類で既に何らかのテキストを提示した後、これと異なる内容のテキストを提示する場合にも、操作命令を提示してしまったのではユーザに違和感を与えることを考慮したものである。
しかし、人間同士の会話では通常、あいづちやうながしなどの表現を用いて相手の発話を理解していることを示したり、あるいは談話の切れ目で、それを示すような発話(例:「話は変わるけど」「そういえば××の件なのだけど」など)を挿入したりすることで、これから話す話題と先行文脈との関係を示し、聞き手の理解を助けるといったことが自然になされている。
そこで、本変形例ではこれを実現するものである。即ち、図12の(A)(ステップ126)では、図3のID=2のエクスチェンジにおける2番目のムーヴのように、ユーザの代理の発話がない場合に、「うん」「それで?」「なるほど」のようなあいづちや、相手の話を促す機能を持つ文のつながりを円滑にするための発話を挿入するための処理を実行する。
また、本変形例では、図12の(B)(ステップ108)では、変数excがドキュメント先頭のエクスチェンジが否かを判定することによって、ドキュメントの切れ目においてシステムの代理が「次のお店を紹介するね」のような発話を挿入するための処理を実行する。この例ではシステム役がドキュメントの切れ目におけるイニシエーションをとっているが、変数spkにUSRを代入し、 uttを「次のお店の紹介をして」のようにユーザ役の発話に変更することによって、ユーザ役がこの役割を担う事ができるよう容易に変更できる。
更に、前述した実施の形態では、発話がユーザの場合には、操作命令のみを提示するようにしているが、本変形例では、操作命令以外の内容を提示するものである。即ち、図14に示すように、エクスチェンジID=1におけるUSRの発話フィールドにコマンドIDではなく、任意のテキストを格納する。これに伴い、図7の動作フローの(B)の部分(ステップ118〜124)を図13のように変更する。具体的には、まず、ステップ172で、発話フィールドがコマンドIDか否かの判定を行い、コマンドIDでなければ、ステップ128で、テキストの内容をuttに格納する。
ここで、操作命令以外の発話をユーザの代理が行うため、その内容によっては発話が操作命令なのかそれ以外の発話であるのかがユーザにとって区別にしにくくなることも考えられる。ユーザの発話を視覚的に提示する場合は、テキストやふきだしの色情報によってそれらを区別したり、音声によって提示する場合は、声質を変更したり、コマンドIDの提示前に提示音を付加するなどの方法によってこの問題を解決することが可能である。
上記テキスト提示順変更プログラム(図10)は、入力装置18から操作コマンドが入力されたタイミングでスタートするが、この操作コマンドの入力は所定のID番号を、入力装置18を介して入力するようにしてもよいが、以下のように実行することもできる。
入力装置として音声認識装置を用いる場合、PTT(Push-To-Talk)ボタン押下時に、図15に示すように、使用可能なコマンドを表示装置24に表示し、操作命令を音声入力する。なお、図10の処理終了時に、同画面を対話時の画面(図9)に切り替えることにより、視覚的に使用可能なコマンドを明示することができ、システムの透過性をさらに向上させることができる。
この処理に必要な現在使用可能なコマンドは変数docに含まれるエクスチェンジのうち、既読フラグが成立していないエクスチェンジに含まれるユニークなコマンドIDを列挙し、さらにNEXT_DOCのようなデータに依存しないコマンドを追加することによって得ることが出来る。
また、前述した実施の形態では、テキストの分類は、テキスト内の主題からその内容に応じて行っているが、次のように、クラス識別問題として定式化して実施することも可能である。
すなわち、1テキストに対応する特徴量ベクトルx=(x1、 …、 xM)から、コマンドIDに対応する有限個のクラスcjのうちいずれかを判定する。ここで識別方法としてナイーブベイズ則を用いるとすると次の式から解を得ればよい。
具体的には、ドキュメントに含まれる全ての自立語をそれぞれ1要素とする特徴量ベクトル空間xを考える。そしてテキストが与えられたとき、ベクトルの各要素にはテキスト中に含まれる各々対応する自立語の数を格納するものとする。
例えば、ドキュメントに次のようなテキストが含まれているとする。
隠れ家のような雰囲気でゆったりできるお店です。(第1のテキスト)
和食の達人が作る繊細な料理が楽しめます。(第2のテキスト)
さらに素材にもこだわりとてもヘルシーです。(第3のテキスト)
このドキュメントに含まれる自立語は、「隠れ家、よう、雰囲気、ゆったり、できる、店、和食、達人、作る、繊細、料理、楽しめる、さらに、素材、こだわり、とても、ヘルシー」である。各テキストに対応する特徴量ベクトルは、
第1のテキストについては、
(1, 1, 1, 1, 1, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0)
第2のテキストについて、
(0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 0, 0, 0, 0, 0)
第3のテキストについては、
(0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1)
である。
隠れ家のような雰囲気でゆったりできるお店です。(第1のテキスト)
和食の達人が作る繊細な料理が楽しめます。(第2のテキスト)
さらに素材にもこだわりとてもヘルシーです。(第3のテキスト)
このドキュメントに含まれる自立語は、「隠れ家、よう、雰囲気、ゆったり、できる、店、和食、達人、作る、繊細、料理、楽しめる、さらに、素材、こだわり、とても、ヘルシー」である。各テキストに対応する特徴量ベクトルは、
第1のテキストについては、
(1, 1, 1, 1, 1, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0)
第2のテキストについて、
(0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 0, 0, 0, 0, 0)
第3のテキストについては、
(0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1)
である。
そして、あらかじめ、別の学習データから各クラスの出現確率p(c)および各クラス中に含まれる各自立語の確率pを求めておくことで、式(1)によって各テキストに対応するコマンドIDを求めることが出来る。
なお、前述した例では、複数の文から構成される文章の文章データを通信装置20により受信し、該文章の文を分類し、分類された文と、分類に応じて予め定められた対話用文とを対応づけ、対応付けられた文と対話用文とを対応づけて提示するようにしているが、本発明はこれに限定されるものではなく、予め上記のように対応付けられた文と対話用文とを入力し、該入力した文と対話用文とを対応づけて提示するようにしてもよい。
12 CPU
18 入力装置
22 記憶装置
24 表示装置
18 入力装置
22 記憶装置
24 表示装置
Claims (11)
- 取得手段により取得された複数の文から構成される文章の文章データにおいて分類手段により分類された文と、分類に応じて予め定められた対話用文とが対応付け手段により対応づけられ、提示手段により、該対応付けられた文と対話用文とを対応づけて提示する提示装置であって、
対話用文を指定するための指定手段を更に備え、
前記提示手段は、前記指定手段により前記対話用文が指定された場合、指定された対話用文と該対話用文に対応付けられた文とを提示する
ことを特徴とする提示装置。 - 前記分類手段は、文の内容に応じた種類毎に文を分類することを特徴とする請求項1記載の提示装置。
- 前記内容の複数の種類各々について、自立語を予め対応付けておき、
前記分類手段は、前記文から自立語を抽出し、抽出された自立語と、前記内容の複数の種類各々について対応づけられた自立語とに基づいて、文を、文の内容に応じた種類毎に分類することを特徴とする請求項2記載の提示装置。 - 前記対応付け手段は、複数の文の内、最初に提示するように定められた文以外の少なくとも1つの文には、対話用文として、文のつながりを円滑にするための表現を対応付けることを特徴とする請求項1乃至請求項3の何れか1項に記載の提示装置。
- 前記提示手段は、文の提示を担当する第1の提示主体と対話用文の提示を担当する第2の提示主体とを用いて、文と対話用文とを対応づけて提示することを特徴とする請求項1乃至請求項4の何れか1項に記載の提示装置。
- 前記提示手段は、文と対話用文との提示の履歴を提示することを特徴とする請求項1乃至請求項5の何れか1項に記載の提示装置。
- 前記提示手段は、前記指定手段により指定可能な対話用文を更に提示することを特徴とする請求項1乃至請求項6の何れか1項に記載の提示装置。
- 前記提示手段は、視覚的方法及び聴覚的方法の少なくとも一方の方法で提示することを特徴とする請求項1乃至請求項7の何れか1項に記載の提示装置。
- 取得手段により取得された複数の文から構成される文章の文章データにおいて分類手段により分類された文と、分類に応じて予め定められた対話用文とが対応付け手段により対応づけられ、提示手段により、該対応付けられた文と対話用文とを対応づけて提示する提示処理をコンピュータに実行させる提示プログラムであって、
前記提示手段は、対話用文を指定するための指定手段により前記対話用文が指定された場合、指定された対話用文と該対話用文に対応付けられた文とを提示することを特徴とする提示プログラム。 - 取得手段により取得された複数の文から構成される文章の文章データにおいて分類手段により分類された文と、分類に応じて予め定められた対話用文とが対応付け手段により対応づけられ、提示手段により、該対応付けられた文と対話用文とを対応づけて提示する提示装置であって、
前記分類手段は、文を、文の内容に応じた種類毎に分類することを特徴とする提示装置。 - 複数の文から構成される文章の文章データにおいて分類された文と、分類に応じて予め定められた対話用文とが予め対応づけられ、提示手段により、該対応付けられた文と対話用文とを対応づけて提示する提示装置であって、
対話用文を指定するための指定手段を更に備え、
前記提示手段は、前記指定手段により前記対話用文が指定された場合、指定された対話用文と該対話用文に対応付けられた文とを提示する
ことを特徴とする提示装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005315264A JP2007122510A (ja) | 2005-10-28 | 2005-10-28 | 提示装置及び提示プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005315264A JP2007122510A (ja) | 2005-10-28 | 2005-10-28 | 提示装置及び提示プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2007122510A true JP2007122510A (ja) | 2007-05-17 |
Family
ID=38146274
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005315264A Pending JP2007122510A (ja) | 2005-10-28 | 2005-10-28 | 提示装置及び提示プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2007122510A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009093654A (ja) * | 2007-10-05 | 2009-04-30 | Fujitsu Ltd | 文書の具体性の決定 |
JP2021522612A (ja) * | 2018-05-07 | 2021-08-30 | アリババ・グループ・ホールディング・リミテッドAlibaba Group Holding Limited | ヒューマンマシン会話方法、クライアント、電子デバイス、およびプログラム |
-
2005
- 2005-10-28 JP JP2005315264A patent/JP2007122510A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009093654A (ja) * | 2007-10-05 | 2009-04-30 | Fujitsu Ltd | 文書の具体性の決定 |
JP2021522612A (ja) * | 2018-05-07 | 2021-08-30 | アリババ・グループ・ホールディング・リミテッドAlibaba Group Holding Limited | ヒューマンマシン会話方法、クライアント、電子デバイス、およびプログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20220230374A1 (en) | User interface for generating expressive content | |
CN106653052B (zh) | 虚拟人脸动画的生成方法及装置 | |
Raman | Auditory user interfaces: toward the speaking computer | |
US8340956B2 (en) | Information provision system, information provision method, information provision program, and information provision program recording medium | |
Johar | Emotion, affect and personality in speech: The Bias of language and paralanguage | |
JP4729902B2 (ja) | 音声対話システム | |
JPH05216618A (ja) | 音声対話システム | |
WO2014160316A2 (en) | Device, method, and graphical user interface for a group reading environment | |
US10650089B1 (en) | Sentence parsing correction system | |
WO2014151884A2 (en) | Device, method, and graphical user interface for a group reading environment | |
Kim et al. | Designers characterize naturalness in voice user interfaces: Their goals, practices, and challenges | |
Delgado et al. | Spoken, multilingual and multimodal dialogue systems: development and assessment | |
Aylett et al. | Building and designing expressive speech synthesis | |
JP3667615B2 (ja) | 音声対話方法及びそのシステム | |
CN107945802A (zh) | 语音识别结果处理方法及装置 | |
JPWO2020036195A1 (ja) | 話し終わり判定装置、話し終わり判定方法およびプログラム | |
Saunders et al. | Towards using prosody to scaffold lexical meaning in robots | |
JPH11237971A (ja) | 音声応答装置 | |
JP2006236037A (ja) | 音声対話コンテンツ作成方法、装置、プログラム、記録媒体 | |
JP2007122510A (ja) | 提示装置及び提示プログラム | |
JP6641680B2 (ja) | 音声出力装置、音声出力プログラムおよび音声出力方法 | |
JP4840051B2 (ja) | 音声学習支援装置及び音声学習支援プログラム | |
Wersényi | Auditory representations of a graphical user interface for a better human-computer interaction | |
KR20160138613A (ko) | 이모티콘을 이용한 자동통역 방법 및 이를 이용한 장치 | |
JP2003271532A (ja) | コミュニケーションシステム、当該システムのデータ転送方法、当該システムのサーバ、当該システムのための処理プログラム、および、記録媒体 |