JP2007122510A

JP2007122510A - 提示装置及び提示プログラム

Info

Publication number: JP2007122510A
Application number: JP2005315264A
Authority: JP
Inventors: Ryuta Terajima; 立太寺嶌
Original assignee: Toyota Central R&D Labs Inc
Current assignee: Toyota Central R&D Labs Inc
Priority date: 2005-10-28
Filing date: 2005-10-28
Publication date: 2007-05-17

Abstract

【課題】文章の各文を提示する際の文の提示順を変更する。
【解決手段】文章の文を対話形式で提示する提示装置において、入力装置から操作コマンドが入力されると、これが次のドキュメントを指示するコマンドが格納されているか否かを判断する(154)。次のドキュメントを指示するコマンドの場合、次のドキュメントに移行するための処理を実行する(164)。次のドキュメントを指示するコマンド以外の他の操作命令のコマンドの場合、今回のコマンドに対応するテキストを検索し、提示できるように処理する(156)。
【選択図】図１０

Description

本発明は、提示装置及び提示プログラムにかかり、より詳細には、文章の文を対話形式で提示する提示装置及び提示プログラムに関する。

現在、インターネット等の通信方法を用いて提示される情報は、書き手が一方的に叙述するモノローグ的な文章である。しかしながら、モノローグ的な文章は、万人向けの情報提示手段ではなく、専門的なモノローグ的文章よりも、重要な部分を質問応答形式で表した会話形式の文章の方が一般的に親しみやすく、理解の度合いも高い傾向にある。そこで、従来、モノローグ的文章に基づいて、それをより親しみやすく理解しやすい会話表現に変換する会話表現生成装置が提案されている（特許文献１参照）。この装置では、電子掲示板に入力された一方的に叙述する文章、例えば、イベントの内容を紹介する文章などを取得し、取得した文章を文毎に区切り、各文の文末表現、例えば、「〜がある」、「〜だそうだ」に応じて分類し、予め各分類に応じて定められたコメントを各分類された文に対応させ、キャスターのイメージ画像を動かしながらコメントを音声出力し、アナウンサーのイメージ画像を動かしながら文を音声出力している。
特開２００４−１０２７６４号公報

上記会話表現生成装置では、確かに、モノローグ的文章に基づいて、それを会話表現に変換して提示しているので、より親しみやすく理解しやすくなる。

しかしながら、その提示される文の順番はもとの文章に依存し固定されている。従って、ユーザにとって必要な文の前に不要な文が配置されていると、ユーザは、必要な文を認識するまでに不要な文を認識しなければならず、これはユーザにとってわずらわしい。

本発明は、上記事実に鑑み成されたもので、文の提示順を変更することの可能な提示装置及び提示プログラムを提供することを第１の目的とする。

また、上記特許文献１における装置では、各文をその文末表現に基づいて分類し、各分類に応じたコメント（対話文）を対応づけている。例えば、「〜がある」に対しては単に『どうだったの？』、「〜だそうだ」に対しても単に『どんななの？』等である。このように、文の文末表現に基づいた分類では、コメントは文の内容自体を問うことはできない。従って、文の内容自体を問わないコメントが提示されても、どのような種類の文が提示されるのかをユーザは認識できず、対話形式で文を提示しても理解の補助としては不十分である。なお、各文をその文末表現に基づいて分類することが、提示される文の順番がもとの文章に依存し固定してしまう原因でもある。

本発明は、上記事実に鑑み成されたもので、文の内容を問う対話用文を提示することの可能な提示装置及び提示プログラムを提供することを第２の目的とする。

上記第１の目的を達成するために請求項１に記載の発明は、取得手段により取得された複数の文から構成される文章の文章データにおいて分類手段により分類された文と、分類に応じて予め定められた対話用文とが対応付け手段により対応づけられ、提示手段により、該対応付けられた文と対話用文とを対応づけて提示する提示装置であって、対話用文を指定するための指定手段を更に備え、前記提示手段は、前記指定手段により前記対話用文が指定された場合、指定された対話用文と該対話用文に対応付けられた文とを提示することを特徴とするものである。

即ち、取得手段は、複数の文から構成される文章の文章データを取得し、分類手段は、前記文章の文を分類し、対応付け手段は、分類された文と分類に応じて予め定められた対話用文とを対応づける。そして、提示手段は、前記対応付けられた文と対話用文とを対応づけて提示する。

なお、上記取得手段、分類手段、及び対応付け手段は、本提示装置に備えなくても備えてよい。これらの手段を提示装置に備えていない場合には、上記のように対応付けられた文と対話文とを入力し、提示手段が、これらの文と対話文とを対応付けて提示する。なお、提示手段は提示装置に備えられている。

ここで、従来では、上記のように、その提示される文の順番はもとの文章に依存し固定されている。従って、ユーザにとって必要な文の前に不要な文が配置されていると、ユーザは、必要な文を認識するまでに不要な文を認識しなければならず、ユーザにとってわずらわしい。

そこで、本発明の指定手段は、対話用文を指定し、提示手段は、指定手段により対話用文が指定された場合、指定された対話用文と該対話用文に対応付けられた文とを提示する。なお、指定手段は、音声を認識する音声認識手段を構成要素として用い、ユーザの音声を認識することにより対話用文を指定したり、表示手段及び表示手段の表示画面のどの個所がタッチされたのか検出するタッチ位置検出手段を構成要素として用い、表示手段の表示画面に指定可能な対話用文を表示し、ユーザが対話用文をタッチし、このタッチ位置をタッチ位置検出手段が検出することにより、いずれの対話用文が指定されたかを検出することにより対話用文を指定したり、してもよい。

このように、対話用文が指定された場合、指定された対話用文と該対話用文に対応付けられた文とを提示するので、文の提示順を変更することができる。

ところで、従来では、各文をその文末表現に基づいて分類しているので、文の文末表現に基づいた分類では、対話用文は文の内容自体を問うことはできない。従って、文の内容自体を問わない対話用文が提示されても、どのような種類の文が提示されるのかをユーザは認識できず、対話形式で文を提示しても理解の補助としては不十分である。

そこで、請求項２記載の発明の分類手段は、文の内容に応じた種類毎に文を分類する。具体的には、請求項３記載の発明のように、前記内容の複数の種類各々について、自立語を予め対応付けておき、前記分類手段は、前記文から自立語を抽出し、抽出された自立語と、前記内容の複数の種類各々について対応づけられた自立語とに基づいて、文を、文の内容に応じた種類毎に分類する。

このように、文の内容に応じた種類毎に文を分類するので、文の内容を問う対話用文を提示することができる。

請求項４記載の発明は、請求項１乃至請求項３の何れか１項に記載の発明において、前記対応付け手段は、複数の文の内、最初に提示するように定められた文以外の少なくとも１つの文には、対話用文として、文のつながりを円滑にするための表現を対応付けることを特徴とする。

ここで、文のつながりを円滑にするための表現としては、例えば、相槌やうながしの文や文節、例えば、「それで？」や「なるほど」等である。このように、文のつながりを円滑にするとは、文のつながりの理解を円滑にする意味である。

対応付け手段は、前記分類手段により複数の文が同一の分類に分類された場合に、上記のように、複数の文の内、最初に提示するように定められた文以外の文には、対話用文として、文のつながりを円滑にするための表現を対応付けるようにしてもよい。

また、請求項５記載の発明は、請求項１乃至請求項４の何れか１項に記載の発明において、前記提示手段は、文の提示を担当する第１の提示主体と対話用文の提示を担当する第２の提示主体とを用いて、文と対話用文とを対応づけて提示することを特徴とする。

ここで、上記第１の提示主体及び前記第２の提示主体の少なくとも一方は、仮想的な提示主体でも、実在的な提示主体でもよい。なお、仮想的な提示主体としては、例えば、表示画面上に表示された提示主体、例えば、キャラクタ画像である。また、実在的な提示主体としては、例えば、実在空間において現実に動作可能なロボットである。

請求項６記載の発明は、請求項１乃至請求項５の何れか１項に記載の発明において、前記提示手段は、文と対話用文との提示の履歴を提示することを特徴とする。

請求項７記載の発明は、請求項１乃至請求項６の何れか１項に記載の発明において、前記提示手段は、前記指定手段により指定可能な対話用文を更に提示することを特徴とする。なお、提示手段は、指定手段により対話用文が提示される際に、前記指定手段により指定可能な対話用文を提示するようにしてもよい。

請求項８記載の発明は、請求項１乃至請求項７の何れか１項に記載の発明において、前記提示手段は、視覚的方法及び聴覚的方法の少なくとも一方の方法で提示することを特徴とする。

ここで、視覚的方法としては、提示表示画面に表示したり、被印刷媒体に印刷したりすることが該当する。また、聴覚的方法としては、音声出力することが該当する。

より具体的には、上記のように、仮想的な提示主体を採用した場合、表示画面に表示されたキャラクタ画像が、文ないし対話用文を音声出力するかのように動作し、文ないし対話用文を画面上に表示する場合が該当する。画面上に表示することに代え又はこれと共に、文ないし対話用文を音声出力する場合も該当する。

また、実在的な提示主体としては、例えば、現実に動作可能なロボットを採用した場合、文ないし対話用文を音声出力する場合が該当する。なお、ロボットの何れかの個所に表示画面を設け、文ないし対話用文を画面上に表示する場合も該当する。

請求項９記載の発明は、取得手段により取得された複数の文から構成される文章の文章データの文が分類手段により分類された文と、分類に応じて予め定められた対話用文とが対応付け手段により対応づけられ、提示手段により、該対応付けられた文と対話用文とを対応づけて提示する提示処理をコンピュータに実行させる提示プログラムであって、前記提示手段は、対話用文を指定するための指定手段により前記対話用文が指定された場合、指定された対話用文と該対話用文に対応付けられた文とを提示することを特徴とする。なお、本発明の作用・効果は、上記発明と同様であるので、その説明を省略する。

請求項１０記載の発明は、取得手段により取得された複数の文から構成される文章の文章データの文が分類手段により分類された文と、分類に応じて予め定められた対話用文とが対応付け手段により対応づけられ、提示手段により、該対応付けられた文と対話用文とを対応づけて提示する提示装置であって、前記分類手段は、文を、文の内容に応じた種類毎に分類することを特徴とする。

請求項１０記載の発明と請求項１記載の発明と比較すると、請求項１記載の発明は、対話用文を指定するための指定手段を更に備え、前記提示手段が、前記指定手段により前記対話用文が指定された場合、指定された対話用文と該対話用文に対応付けられた文とを提示するのに対し、請求項１０記載の発明は、分類手段は、文を、文の内容に応じた種類毎に分類する点で相違する。

請求項１０記載の発明は、従来では、各文をその文末表現に基づいて分類しているので対話用文は文の内容自体を問うことはできない点に鑑み、文を、文の内容に応じた種類毎に分類すことにより、文の内容を問う対話用文を提示することができるようにしたものである。

請求項１１記載の発明は、複数の文から構成される文章の文章データにおいて分類された文と、分類に応じて予め定められた対話用文とが予め対応づけられ、提示手段により、該対応付けられた文と対話用文とを対応づけて提示する提示装置であって、対話用文を指定するための指定手段を更に備え、前記提示手段は、前記指定手段により前記対話用文が指定された場合、指定された対話用文と該対話用文に対応付けられた文とを提示することを特徴とする。

以上説明したように第１の発明は、対話用文が指定された場合、指定された対話用文と該対話用文に対応付けられた文とを提示するので、文の提示順を変更することができる。

また、第２の発明は、文を、文の内容に応じた種類毎に分類するので、文の内容を問う対話用文を提示することができる。

以下、図面を参照して、本発明の実施の形態を詳細に説明する。

図１に示すように、本実施の形態の対話文生成装置は、ＣＰＵ１２、ＲＯＭ１４、ＲＡＭ１６、マウスやキーボードなどや音声入力装置により構成される入力装置１８、通信装置２０、記憶装置２２、及び、音声出力機能も有する表示装置２４を、バス２６を介して相互接続して構成されている。

上記記憶装置２２には、通信装置２０により受信された、例えば、図２に示すような、飲食店を紹介する文章（一方的に叙述する文章）が記憶されている。この文章は、飲食店を紹介する複数の文、「隠れ家のような雰囲気でゆったりできるお店です。」、「和食の達人が作る繊細な料理が楽しめます。」、「さらに、素材にもこだわりとてもヘルシーです。」等から構成されている。

また、記憶装置２２には、図３に示すように、上記一方的に叙述する文章から対話形式で該文章の各文を提示するためのデータを記憶するテーブルも記憶されている。

ここで、対話は、一方的に叙述する文章の情報（文）を提示する第１の提示主体（システムの代理「ＳＹＳ」）と、上記情報の提示を要求する要求情報（操作命令）を提示する第２の提示主体（ユーザの代理「ＵＳＲ」）との間で行われる。

テーブルには、第１の提示手段（ＳＹＳ）により提示される情報（文）３２と、第２の提示手段（ＵＳＲ）により提示される要求情報（対話用文に対応する操作命令）を識別するコマンドＩＤ３４とを１組として、複数組を、１つの文章（ドキュメント）ごとに記憶している。なお、本実施の形態ではこの１組をムーヴと定義する。

コメントＩＤとしては、具体的に、「どんなお店ですか？」等のように、一定種類の情報の提示を要求（コマンド）するものと、要求情報の提示をさせないことを命令するもの（コマンドがないことを示すＮ／Ａ）とがある。

Ｎ／ＡでないコマンドＩＤから始まる組から、次のＮ／ＡでないコマンドＩＤから始まる組までを一つの単位としてエクスチェンジと呼ぶ。各エクスチェンジにはＩＤ３６とそのエクスチェンジが提示されたか否かを示す既読フラグ３８と呼ばれる情報が付与される。あるドキュメントの最後を示す特別なＩＤとしてEODを用いる。一つのデータには１から始まりＥＯＤで終わる複数のドキュメントが格納される。なお、各ドキュメントは、図示しないドキュメントＩＤにより識別される。

次に、本実施の形態の作用を説明する。まず、上記一方的に叙述する文章（ドキュメント）から対話形式で該文章の各文を提示するためのデータを作成する対話形式データ作成プログラムを、図４を参照して説明する。なお、対話形式データ作成プログラムは、ユーザにより一方的に叙述する文章が指定されて、本プログラムの実行が命令されたとき、又は、一方的に叙述する文章が取得されたときに実行される。

まず、ステップ４２で、本プログラムで使用する各種の変数（後述するｔ、ｓ、ｃ、ｔｓ）を０に初期化する。

ステップ４４で、ドキュメント内の各文（テキスト）を識別する変数ｔを１インクリメントし、ステップ４６で、テキストｔから、文の内容を表すクラスを意味する主題を抽出し、ステップ４８で、テキストｔに主題を対応づける。具体的には、テキストｔから自立語を抽出する。本実施の形態では、複数の主題と、各主題に対応する自立語とを予め対応させている。そして、抽出された自立語から、該自立語に対応する主題を選択し、これをテキストｔに対応づける。なお、上記主題とは、上記のように、文の内容を表すクラスのことであり、言語学上の主題とは異なる意味である。

例えば、上記「隠れ家のような雰囲気でゆったりできるお店です。」の文を例にとり説明すると、この文に含まれる自立語は、「隠れ家、よう、雰囲気、ゆったり、できる、店」である。そして、１つの主題としては『店』があり、本実施の形態では、『店』に対応して「隠れ家」を定めておく。上記文から抽出された自立語（隠れ家、よう、雰囲気、ゆったり、できる、店）と、各主題に対応して定めた自立語とに基づいて、上記文の主題を抽出する。

ステップ５０で、変数ｔが、テキストの総数Ｔか否かを判断することにより、今回取得したドキュメントのすべてのテキストから主題を抽出したかを判断する。変数ｔがテキストの総数Ｔでないと判断された場合には、ステップ４４に戻って以上の処理（ステップ４４〜５０）を繰り返す。

一方、変数ｔがテキストの総数Ｔである場合には、ステップ５２で、上記テキストに対応づけた各種主題を識別する変数ｓを１インクリメントし、ステップ５４で、主題ｓに対応づけられたテキストの数が所定個以上か否かを判断する。主題ｓに対応づけられたテキストの数が所定個以上であると判断された場合には、ステップ５６で、テキストを分類するためのクラスを識別する変数ｃを１インクリメントし、ステップ５８で、主題ｓに対応する各テキストにクラスｃを付与し、ステップ６０で、クラスｃのテキストを上記テーブルに記憶する。

ここで、図５を参照してステップ６０の処理を詳細に説明する。

ステップ７２で、クラスｃの各テキストを識別する変数ｔｓを１インクリメントし、ステップ７４で、変数ｔｓの直前の発話がクラスｃか否かを判断する。変数ｔｓの直前の発話がクラスｃである場合には、クラスｃの最初のテキストであると判断できるので、ステップ７６で、クラスｃに対応するコマンドＩＤを、図６に示すように予め定めたデータテーブルから取得し、取得したコマンドＩＤを、図３に示すように、話者ＵＳＲに対応して記憶する。次のステップ７８で、テキストｔｓをコマンドＩＤに隣接させて記憶する。

ステップ８２で、変数ｔｓがクラスｃのテキストの総数ＴＳか否かを判断し、変数ｔｓがクラスｃのテキストの総数ＴＳであると判断された場合には、図４のステップ６２に進み、変数ｔｓがクラスｃのテキストの総数ＴＳでないと判断された場合には、ステップ７２に戻って、以上の処理（ステップ７２〜８２）を繰り返す。ステップ７４で、変数ｔｓの直前の発話がクラスｃでないと判断された場合には、クラスｃの２番目以降のテキストであり、このテキストに対応して、同様のコマンドＩＤを記憶したのでは、テキストを提示する際、同じ種類のテキストを提示するたびに同じ対話が行われてしまい、ユーザに違和感を与えてしまう。そこで、本実施の形態では、ステップ８０で、コマンドＩＤとして、上記Ｎ／Ａを記憶して、ステップ７８に進む。

図４のステップ６２で、変数ｓが、今回取得したドキュメントの主題の総数Ｓ０か否かを判断し、変数ｓが総数Ｓ０でないと判断された場合には、ステップ５２に戻って、以上の処理（ステップ５２〜６２）を繰り返す。

一方、変数ｓが今回取得したドキュメントの主題の総数Ｓ０であると判断された場合には、ステップ６４で、同じ主題のテキストの数が所定個以上ないテキストにクラスｃ０を付与し、ステップ６６で、クラスｃ０が付与されたテキストを記憶する。なお、本ステップ６６でも上記ステップ６０と同様の処理を実行するが、コマンドＩＤはすべてＮ／Ａである。

次に、図７を参照して、ドキュメントのテキストを対話形式で提示するテキスト対話形式提示プログラムを説明する。ステップ１０２で、テーブルに含まれる最初のドキュメントのドキュメントIDを変数docに格納する。ステップ１０４で、変数docに格納されるエクスチェンジのうち、既読フラグがたっていない最初のエクスチェンジを変数excに格納する。また本処理と同時にexcに対応するデータ中の既読フラグをセットする。ステップ１０６で、excがEODであるか否かを判断し、excがEODであれば、ステップ１３６で、変数docのドキュメントを既読とし、ステップ１３８で、記憶装置２２から既読でないドキュメントを探し出し、変数docに格納する。ステップ１４０で、docがNULL、すなわち全てのドキュメントが既読か否かを判断し、docがNULLであれば本システムの実行を終了する。

一方、ステップ１０６で、excがEODでない場合は以下の処理を繰り返し実行する。始めにステップ１１０で、変数moveに変数exc中に含まれる未提示の最初のムーヴの情報を格納する。ここでムーヴは、上記のように、図３中の各行に含まれる情報（話者と発話）を指す。

ステップ１１２で、変数moveがNULLの場合、すなわち1エクスチェンジ中の情報を全て提示したか否かを判断し、変数moveがNULLの場合は、ステップ１０４に戻って、変数excに次のエクスチェンジの情報を格納する処理を再実行する。そうでない場合は、ステップ１１４で、変数spkに変数moveから話者の情報を格納する。

ステップ１１６で、話者がユーザ役である第２の提示主体（USR）か否を判断し、話者がユーザの場合には、ステップ１１８で、変数comにmoveのコマンドIDの情報を格納し、さらに、図８に示すコマンドIDと提示テキストの対応表から、提示するテキスト情報を検索し変数uttに格納する。

ステップ１２０で、コマンドIDがN/Aか否かを判断し、コマンドIDがN/Aの場合はuttに何も格納せずに、ステップ１３０に進む。一方、spkがSYSの場合は、ステップ１２２で、変数moveから発話の情報を取り出し、変数uttに格納する。

ステップ１３０では、このように決定されたuttを、変数spkに対応するシステムまたはユーザの代理表象を選択し提示し、ステップ１１０に戻って、この処理を変数excに格納されているムーヴが空になるまで繰り返す。

ここで、上記ステップ１３０における提示方法の一例を説明する。この例では、上記のように決定されたuttを視覚的及び聴覚的に提示する。具体的には、図９に示すように、ユーザとシステムの代理を表す表象（提示主体）として、ロボットのキャラクタ（第１の提示主体）と犬のキャラクタ（第２の提示主体）とを用いる。手前の犬のキャラクタがユーザの代理を表す表象であり、奥のロボットのキャラクタがシステムの代理を表す表象の例である。犬のキャラクタとロボットのキャラクタにより音声により上記提示を行う場合には、各々の音声を異ならせることにより、２つの表象を区別し、音声合成のパラメータを変数spkに応じて切り替えることによって実現する。更に、図９に示すように、文字でテキストや操作命令を表示する。

また、図９に示すように、提示主体間の対話の履歴を示すことにより、ユーザの対話文脈に対する理解を補助することができる。本処理（図７の(A)のステップ１３０）として、発話文のFIFO型の履歴バッファを用意し、変数uttの内容をバッファにストアした上で、バッファの内容を画面に提示することで実現できる。

次に、図１０を参照して、テキスト提示順変更プログラムを説明する。本プログラムは、入力装置１８から操作コマンドが入力されたタイミングで動作を開始する。すなわち、入力装置１８から操作コマンドが入力されると、図７に示すテキスト対話形式提示プログラムが実行中であっても、本プログラムが割り込んで実行される。

本プログラムがスタートすると、ステップ１５２で、変数ucomに入力装置１８から得たコマンドｉｄが格納される。ここで、コマンドｉｄには、次のドキュメントを指示するコマンド、その他の操作命令（図６参照）のコマンドがある。

ステップ１５４で、変数ucomに次のドキュメントを指示するコマンドが格納されているか否かを判断し、変数ucomに次のドキュメントを指示するコマンドが格納されている場合には、ステップ１６４で、変数docに対応するドキュメントの全ての既読フラグをセットして、図７のステップ１０４に戻りテキスト選択処理を続行する。

一方、変数ucomに次のドキュメントを指示するコマンド以外の他の操作命令（図６参照）のコマンドが格納されている場合には、ステップ１５６で、変数docに対応するドキュメントで既読フラグが成立していないエクスチェンジのうち、第１ムーブのコマンドIDがucomに等しいエクスチェンジを検索し変数nexcに格納する。ステップ１５８で、nexcがNULL、すなわち前述の検索処理の結果、該当するエクスチェンジが見つからなかったか否かを判断し、nexcがNULLである場合、ステップ１６２で、図１１に示すようなエクスチェンジを動的に生成し、excに生成したエクスチェンジを格納して、図７のステップ１１０に進み、また、nexcがNULLでない場合には、ステップ１６０で、変数excにnexcを代入し、図７のステップ１１０に進み、テキスト選択処理を継続する。

以上説明した実施の形態では、情報を伝達する際、独話形式のドキュメントを読み上げるよりも、二者間の対話形式で文脈に即した情報を挿入しながら伝達する方が、聞き手の理解度が高いことの報告に鑑み、文脈に即した操作命令テキストを挿入することによって当該効果を得ている。

例えば、飲食店の情報を提示する例において、「他のお店について教えて」や「もういいや」などの操作コマンドを用意することによって、本システムではユーザがある飲食店の情報に興味がない場合、前述のコマンドをシステムに命令することが可能である。このコマンドに従ってシステムが別の飲食店の情報を伝達することによって、ユーザの興味に従って提示するドキュメントを任意に変更することができる。

従来のシステムでは、ユーザは操作マニュアルなどを予め読み、操作コマンドを覚える必要があった。しかしながら本システムではユーザの代理役が提示するテキスト情報はシステムへの操作コマンドそのものであるため、システムからの情報を得る過程でシステムの代理役とユーザの代理役のふるまいを必然的に観察することになる。これはシステムへの操作を間接的に学習すること等価であるので、ユーザにはユーザの代理役の発話を模倣するよう教示することによって、システムの操作法を分かりやすく伝えることが出来る。

次に、本実施の形態の種々の変形例を説明する。

前述した実施の形態では、図７のステップ１２０で、コマンドIDがN/Aか否かを判断し、コマンドIDがN/Aの場合はuttに何も格納せずに、ステップ１３０に進むようにしているのは、同一の分類で既に何らかのテキストを提示した後、これと異なる内容のテキストを提示する場合にも、操作命令を提示してしまったのではユーザに違和感を与えることを考慮したものである。

しかし、人間同士の会話では通常、あいづちやうながしなどの表現を用いて相手の発話を理解していることを示したり、あるいは談話の切れ目で、それを示すような発話（例：「話は変わるけど」「そういえば××の件なのだけど」など）を挿入したりすることで、これから話す話題と先行文脈との関係を示し、聞き手の理解を助けるといったことが自然になされている。

そこで、本変形例ではこれを実現するものである。即ち、図１２の(A)（ステップ１２６）では、図３のID=2のエクスチェンジにおける２番目のムーヴのように、ユーザの代理の発話がない場合に、「うん」「それで？」「なるほど」のようなあいづちや、相手の話を促す機能を持つ文のつながりを円滑にするための発話を挿入するための処理を実行する。

また、本変形例では、図１２の(B)（ステップ１０８）では、変数excがドキュメント先頭のエクスチェンジが否かを判定することによって、ドキュメントの切れ目においてシステムの代理が「次のお店を紹介するね」のような発話を挿入するための処理を実行する。この例ではシステム役がドキュメントの切れ目におけるイニシエーションをとっているが、変数spkにUSRを代入し、 uttを「次のお店の紹介をして」のようにユーザ役の発話に変更することによって、ユーザ役がこの役割を担う事ができるよう容易に変更できる。

更に、前述した実施の形態では、発話がユーザの場合には、操作命令のみを提示するようにしているが、本変形例では、操作命令以外の内容を提示するものである。即ち、図１４に示すように、エクスチェンジID=1におけるUSRの発話フィールドにコマンドIDではなく、任意のテキストを格納する。これに伴い、図７の動作フローの(B)の部分（ステップ１１８〜１２４）を図１３のように変更する。具体的には、まず、ステップ１７２で、発話フィールドがコマンドIDか否かの判定を行い、コマンドIDでなければ、ステップ１２８で、テキストの内容をuttに格納する。

ここで、操作命令以外の発話をユーザの代理が行うため、その内容によっては発話が操作命令なのかそれ以外の発話であるのかがユーザにとって区別にしにくくなることも考えられる。ユーザの発話を視覚的に提示する場合は、テキストやふきだしの色情報によってそれらを区別したり、音声によって提示する場合は、声質を変更したり、コマンドIDの提示前に提示音を付加するなどの方法によってこの問題を解決することが可能である。

上記テキスト提示順変更プログラム（図１０）は、入力装置１８から操作コマンドが入力されたタイミングでスタートするが、この操作コマンドの入力は所定のＩＤ番号を、入力装置１８を介して入力するようにしてもよいが、以下のように実行することもできる。

入力装置として音声認識装置を用いる場合、PTT(Push-To-Talk)ボタン押下時に、図１５に示すように、使用可能なコマンドを表示装置２４に表示し、操作命令を音声入力する。なお、図１０の処理終了時に、同画面を対話時の画面（図９）に切り替えることにより、視覚的に使用可能なコマンドを明示することができ、システムの透過性をさらに向上させることができる。

この処理に必要な現在使用可能なコマンドは変数docに含まれるエクスチェンジのうち、既読フラグが成立していないエクスチェンジに含まれるユニークなコマンドIDを列挙し、さらにNEXT_DOCのようなデータに依存しないコマンドを追加することによって得ることが出来る。

また、前述した実施の形態では、テキストの分類は、テキスト内の主題からその内容に応じて行っているが、次のように、クラス識別問題として定式化して実施することも可能である。

すなわち、１テキストに対応する特徴量ベクトルx=(x₁、 …、 x_M)から、コマンドIDに対応する有限個のクラスcjのうちいずれかを判定する。ここで識別方法としてナイーブベイズ則を用いるとすると次の式から解を得ればよい。

具体的には、ドキュメントに含まれる全ての自立語をそれぞれ１要素とする特徴量ベクトル空間xを考える。そしてテキストが与えられたとき、ベクトルの各要素にはテキスト中に含まれる各々対応する自立語の数を格納するものとする。

例えば、ドキュメントに次のようなテキストが含まれているとする。
隠れ家のような雰囲気でゆったりできるお店です。（第１のテキスト）
和食の達人が作る繊細な料理が楽しめます。（第２のテキスト）
さらに素材にもこだわりとてもヘルシーです。（第３のテキスト）
このドキュメントに含まれる自立語は、「隠れ家、よう、雰囲気、ゆったり、できる、店、和食、達人、作る、繊細、料理、楽しめる、さらに、素材、こだわり、とても、ヘルシー」である。各テキストに対応する特徴量ベクトルは、
第１のテキストについては、
(1, 1, 1, 1, 1, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0)
第２のテキストについて、
(0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 0, 0, 0, 0, 0)
第３のテキストについては、
(0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1)
である。

そして、あらかじめ、別の学習データから各クラスの出現確率p(c)および各クラス中に含まれる各自立語の確率pを求めておくことで、式(1)によって各テキストに対応するコマンドIDを求めることが出来る。

なお、前述した例では、複数の文から構成される文章の文章データを通信装置２０により受信し、該文章の文を分類し、分類された文と、分類に応じて予め定められた対話用文とを対応づけ、対応付けられた文と対話用文とを対応づけて提示するようにしているが、本発明はこれに限定されるものではなく、予め上記のように対応付けられた文と対話用文とを入力し、該入力した文と対話用文とを対応づけて提示するようにしてもよい。

本実施の形態の対話文生成装置のブロック図である。一方的に叙述する文章の一例である。一方的に叙述する文章を対話形式で提示するためのデータを記憶するテーブルである。対話形式データ作成プログラムを示すフローチャートである。図４のプログラムのステップ６０のプログラムを示すフローチャートである。コマンドＩＤのデータテーブルである。テキスト対話形式提示プログラムを示すフローチャートである。コマンドＩＤと発話の内容を示すデータテーブルである。一方的に叙述する文章を対話形式で提示する態様を示す図である。テキスト提示順変更プログラムを示すフローチャートである。要求された種類のテキストがない場合に提示する情報とそのコマンドＩＤを示す図である。変形例におけるテキスト対話形式提示プログラムを示すフローチャートである。変形例におけるテキスト対話形式提示プログラムの一部を示すフローチャートである。変形例における一方的に叙述する文章を対話形式で提示するためのデータを記憶するテーブルである。テキストの提示順の変更のためにユーザが指定できるコマンドＩＤに対応する要求情報を表示した図である。

符号の説明

１２ＣＰＵ
１８入力装置
２２記憶装置
２４表示装置

Claims

取得手段により取得された複数の文から構成される文章の文章データにおいて分類手段により分類された文と、分類に応じて予め定められた対話用文とが対応付け手段により対応づけられ、提示手段により、該対応付けられた文と対話用文とを対応づけて提示する提示装置であって、
対話用文を指定するための指定手段を更に備え、
前記提示手段は、前記指定手段により前記対話用文が指定された場合、指定された対話用文と該対話用文に対応付けられた文とを提示する
ことを特徴とする提示装置。
前記分類手段は、文の内容に応じた種類毎に文を分類することを特徴とする請求項１記載の提示装置。
前記内容の複数の種類各々について、自立語を予め対応付けておき、
前記分類手段は、前記文から自立語を抽出し、抽出された自立語と、前記内容の複数の種類各々について対応づけられた自立語とに基づいて、文を、文の内容に応じた種類毎に分類することを特徴とする請求項２記載の提示装置。
前記対応付け手段は、複数の文の内、最初に提示するように定められた文以外の少なくとも１つの文には、対話用文として、文のつながりを円滑にするための表現を対応付けることを特徴とする請求項１乃至請求項３の何れか１項に記載の提示装置。
前記提示手段は、文の提示を担当する第１の提示主体と対話用文の提示を担当する第２の提示主体とを用いて、文と対話用文とを対応づけて提示することを特徴とする請求項１乃至請求項４の何れか１項に記載の提示装置。
前記提示手段は、文と対話用文との提示の履歴を提示することを特徴とする請求項１乃至請求項５の何れか１項に記載の提示装置。
前記提示手段は、前記指定手段により指定可能な対話用文を更に提示することを特徴とする請求項１乃至請求項６の何れか１項に記載の提示装置。
前記提示手段は、視覚的方法及び聴覚的方法の少なくとも一方の方法で提示することを特徴とする請求項１乃至請求項７の何れか１項に記載の提示装置。
取得手段により取得された複数の文から構成される文章の文章データにおいて分類手段により分類された文と、分類に応じて予め定められた対話用文とが対応付け手段により対応づけられ、提示手段により、該対応付けられた文と対話用文とを対応づけて提示する提示処理をコンピュータに実行させる提示プログラムであって、
前記提示手段は、対話用文を指定するための指定手段により前記対話用文が指定された場合、指定された対話用文と該対話用文に対応付けられた文とを提示することを特徴とする提示プログラム。
取得手段により取得された複数の文から構成される文章の文章データにおいて分類手段により分類された文と、分類に応じて予め定められた対話用文とが対応付け手段により対応づけられ、提示手段により、該対応付けられた文と対話用文とを対応づけて提示する提示装置であって、
前記分類手段は、文を、文の内容に応じた種類毎に分類することを特徴とする提示装置。
複数の文から構成される文章の文章データにおいて分類された文と、分類に応じて予め定められた対話用文とが予め対応づけられ、提示手段により、該対応付けられた文と対話用文とを対応づけて提示する提示装置であって、
対話用文を指定するための指定手段を更に備え、
前記提示手段は、前記指定手段により前記対話用文が指定された場合、指定された対話用文と該対話用文に対応付けられた文とを提示する
ことを特徴とする提示装置。