WO2022137485A1

WO2022137485A1 - 情報処理装置、制御方法、及び制御プログラム

Info

Publication number: WO2022137485A1
Application number: PCT/JP2020/048640
Authority: WO
Inventors: 壮平大澤
Original assignee: 三菱電機株式会社
Priority date: 2020-12-25
Filing date: 2020-12-25
Publication date: 2022-06-30
Also published as: JPWO2022137485A1; JP7523589B2

Abstract

発表者装置（１００）は、聴講者が用いる聴講者装置と通信する。発表者装置（１００）は、発表者が用いる装置である。発表者装置（１００）は、取得部（１２０）と生成部（１４０）と提供制御部（１５０）とを有する。取得部（１２０）は、聴講者が理解していないことを示す情報を取得する。生成部（１４０）は、当該情報が取得された場合、発表者への出力情報を生成する。提供制御部（１５０）は、出力情報が発表者に提供されるように、制御を行う。

Description

情報処理装置、制御方法、及び制御プログラム

　本開示は、情報処理装置、制御方法、及び制御プログラムに関する。

　近年、ネットワークを介したプレゼンテーションが行われている。例えば、プレゼンテーションは、アバタを用いて、行われる。ここで、アバタに関する技術が提案されている（特許文献１を参照）。

特開２０２０－０８０１５４号公報

　ところで、発表者が熱中してプレゼンテーションなどを行っているとき、発表者は、聴講者の反応に気付かない場合がある。

　本開示の目的は、聴講者の反応を発表者に気付かせることである。

　本開示の一態様に係る情報処理装置が提供される。情報処理装置は、聴講者が用いる聴講者装置と通信し、かつ発表者が用いる装置である。情報処理装置は、前記聴講者が理解していないことを示す情報を取得する取得部と、当該情報が取得された場合、前記発表者への出力情報を生成する生成部と、前記出力情報が前記発表者に提供されるように、制御を行う提供制御部と、を有する。

　本開示によれば、聴講者の反応を発表者に気付かせることができる。

実施の形態１の通信システムを示す図である。実施の形態１の発表者装置と聴講者装置とが有するハードウェアを示す図である。実施の形態１のディスプレイの具体例を示す図である。実施の形態１の発表者装置が有する機能のブロック図である。実施の形態１の管理テーブルの例を示す図である。実施の形態１の発表者装置が実行する処理の例を示すフローチャートである。実施の形態１の発表者装置が実行する処理の具体例を示す図である。実施の形態１の変形例１の発表者装置が実行する処理の例を示すフローチャートである。実施の形態１の変形例２の発表者装置が実行する処理の例を示すフローチャートである。実施の形態１の変形例３の発表者装置が実行する処理の例を示すフローチャートである。実施の形態１の変形例４の発表者装置が実行する処理の例を示すフローチャートである。実施の形態２の通信システムを示す図である。実施の形態２のサーバが有する機能のブロック図である。実施の形態２の通信システムで実行される処理の例を示すシーケンス図である。実施の形態２の変形例１の通信システムで実行される処理の例を示すシーケンス図である。実施の形態２の変形例２の通信システムで実行される処理の例を示すシーケンス図である。実施の形態２の変形例３の通信システムで実行される処理の例を示すシーケンス図である。実施の形態２の変形例４の通信システムで実行される処理の例を示すシーケンス図である。実施の形態３の通信システムを示す図である。実施の形態３の聴講者装置が有する機能のブロック図である。実施の形態３の通信システムで実行される処理の例を示すシーケンス図である。実施の形態３の変形例１の通信システムで実行される処理の例を示すシーケンス図である。実施の形態３の変形例２の通信システムで実行される処理の例を示すシーケンス図である。実施の形態３の変形例３の通信システムで実行される処理の例を示すシーケンス図である。実施の形態３の変形例４の通信システムで実行される処理の例を示すシーケンス図である。

　以下、図面を参照しながら実施の形態を説明する。以下の実施の形態は、例にすぎず、本開示の範囲内で種々の変更が可能である。

実施の形態１．
　図１は、実施の形態１の通信システムを示す図である。通信システムは、発表者装置１００と聴講者装置２００とを含む。発表者装置１００と聴講者装置２００とは、ネットワークを介して、通信する。

　発表者装置１００は、発表者が用いる装置である。発表者装置１００は、情報処理装置とも言う。発表者装置１００は、制御方法を実行する装置である。聴講者装置２００は、聴講者が用いる装置である。例えば、発表者装置１００と聴講者装置２００とは、ノート型、デスクトップ型、又はタブレット型のコンピュータである。

　発表者は、発表者装置１００を用いて、プレゼンテーション、オンラインの講演などを行う。プレゼンテーションなどを聴講する聴講者の数は、１以上である。そのため、発表者装置１００は、１以上の聴講者装置と通信する。ここで、以下の説明を簡単にするため、図１では、１つの聴講者装置が例示されている。よって、聴講者装置の数は、２以上でもよい。

　次に、発表者装置１００と聴講者装置２００とが有するハードウェアを説明する。
　図２は、実施の形態１の発表者装置と聴講者装置とが有するハードウェアを示す図である。発表者装置１００は、プロセッサ１０１、揮発性記憶装置１０２、及び不揮発性記憶装置１０３を有する。

　プロセッサ１０１は、発表者装置１００全体を制御する。例えば、プロセッサ１０１は、ＣＰＵ（Ｃｅｎｔｒａｌ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）、ＦＰＧＡ（Ｆｉｅｌｄ　Ｐｒｏｇｒａｍｍａｂｌｅ　Ｇａｔｅ　Ａｒｒａｙ）などである。プロセッサ１０１は、マルチプロセッサでもよい。発表者装置１００は、処理回路を有してもよい。処理回路は、単一回路又は複合回路でもよい。

　揮発性記憶装置１０２は、発表者装置１００の主記憶装置である。例えば、揮発性記憶装置１０２は、ＲＡＭ（Ｒａｎｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ）である。不揮発性記憶装置１０３は、発表者装置１００の補助記憶装置である。例えば、不揮発性記憶装置１０３は、ＨＤＤ（Ｈａｒｄ　Ｄｉｓｋ　Ｄｒｉｖｅ）、又はＳＳＤ（Ｓｏｌｉｄ　Ｓｔａｔｅ　Ｄｒｉｖｅ）である。

　発表者装置１００には、ディスプレイ３００、マイク３１０、及びスピーカ３２０，３２１が接続されている。また、発表者装置１００は、ディスプレイ３００、マイク３１０、及びスピーカ３２０，３２１のうちの少なくとも１つを有してもよい。ディスプレイ３００は、発表者が見るディスプレイである。ディスプレイ３００、マイク３１０、及びスピーカ３２０，３２１は、発表者側のディスプレイ、マイク、及び複数のスピーカと呼んでもよい。また、スピーカの数は、１つでもよい。
　ここで、ディスプレイは、表示装置とも言う。また、マイクは、マイクロフォンである。

　聴講者装置２００は、発表者装置１００と同様に、プロセッサ、揮発性記憶装置、及び不揮発性記憶装置を有する。聴講者装置２００には、ディスプレイ４００、マイク４１０、撮像装置４２０、及びスピーカ４３０が接続されている。聴講者装置２００は、ディスプレイ４００、マイク４１０、撮像装置４２０、及びスピーカ４３０のうちの少なくとも１つを有してもよい。ディスプレイ４００は、聴講者が見るディスプレイである。ディスプレイ４００、マイク４１０、撮像装置４２０、及びスピーカ４３０は、聴講者側のディスプレイ、マイク、撮像装置、及びスピーカと呼んでもよい。また、スピーカの数は、２つ以上でもよい。

　上述したように、発表者は、発表者装置１００を用いて、プレゼンテーションなどを行う。以下、発表者は、プレゼンテーションを行うものとする。ここで、発表者がプレゼンテーションを行っているときのディスプレイ３００の例を示す。

　図３は、実施の形態１のディスプレイの具体例を示す図である。例えば、発表者は、ディスプレイ３００を見ながら、今月の売上のプレゼンテーションを行う。ディスプレイ３００には、アバタ３０１、アバタ３０２、及び範囲３０３が表示されている。

　アバタ３０１は、発表者のアバタである。発表者は、アバタ３０１を用いて、プレゼンテーションを行ってもよい。例えば、発表者がアバタ３０１を用いることで、アバタ３０１は、発表者の発話に合わせて発話する。例えば、アバタ３０１は、リップシンクの技術によって、発表者の発話に合わせて発話する。

　アバタ３０２は、出力情報を発表者に提供するアバタである。出力情報については、後述する。
　範囲３０３は、チャットの内容が表示される範囲である。例えば、聴講者が入力した文字が、範囲３０３に表示される。
　ディスプレイ３００に表示されている画面は、ディスプレイ４００にも表示されている。そのため、聴講者は、ディスプレイ４００を見ながら、プレゼンテーションを聞くことができる。
　なお、図３には、２つのアバタが例示されている。アバタの数は、３つ以上でもよい。

　次に、発表者装置１００が有する機能を説明する。
　図４は、実施の形態１の発表者装置が有する機能のブロック図である。発表者装置１００は、記憶部１１０、取得部１２０、解析制御部１３０、生成部１４０、及び提供制御部１５０を有する。

　記憶部１１０は、揮発性記憶装置１０２又は不揮発性記憶装置１０３に確保した記憶領域として実現してもよい。
　取得部１２０、解析制御部１３０、生成部１４０、及び提供制御部１５０の一部又は全部は、処理回路によって実現してもよい。また、取得部１２０、解析制御部１３０、生成部１４０、及び提供制御部１５０の一部又は全部は、プロセッサ１０１が実行するプログラムのモジュールとして実現してもよい。例えば、プロセッサ１０１が実行するプログラムは、制御プログラムとも言う。例えば、制御プログラムは、記録媒体に記録されている。

　記憶部１１０は、様々な情報を記憶する。
　取得部１２０は、聴講者が理解していないことを示す情報を取得する。当該情報は、聴講者が発表者の説明を理解していないことを示す情報と表現してもよい。例えば、取得部１２０は、当該情報を聴講者装置２００から取得する。

　例えば、当該情報は、聴講者からの詳細な説明の要求を示す情報、又は聴講者からの質問を示す情報である。詳細な説明の要求又は質問は、聴講者が理解していない場合に、発表者に提示されるものである。そのため、詳細な説明の要求又は質問を示す情報は、聴講者が理解していないことを示す情報と言える。

　また、取得部１２０は、管理テーブルを取得する。例えば、取得部１２０は、管理テーブルを記憶部１１０から取得する。また、例えば、取得部１２０は、管理テーブルを外部装置から取得する。例えば、外部装置は、クラウドサーバである。ここで、管理テーブルを説明する。

　図５は、実施の形態１の管理テーブルの例を示す図である。管理テーブル１１１は、管理情報とも言う。例えば、管理テーブル１１１は、記憶部１１０に格納されている。管理テーブル１１１は、アバタ、担当、及び個性の項目を有する。

　アバタの項目には、アバタの名称が登録される。なお、図５のアバタＡは、アバタ３０１である。図５のアバタＢは、アバタ３０２である。
　担当の項目には、アバタの役割が登録される。例えば、図５は、アバタＡ（すなわち、アバタ３０１）が発表を行うアバタであることを示している。また、例えば、図５は、アバタＢ（すなわち、アバタ３０２）が出力情報を発表者に提供するアバタであることを示している。
　個性の項目は、アバタの個性を示す情報が登録される。

　図４に戻って、発表者装置１００の機能を説明する。
　解析制御部１３０の機能は、後で説明する。
　生成部１４０は、聴講者が理解していないことを示す情報が取得された場合、発表者への出力情報を生成する。
　提供制御部１５０は、出力情報が発表者に提供されるように、制御を行う。言い換えれば、提供制御部１５０は、出力情報が発表者に提供されるための制御を行う。また、上述したように、出力情報は、アバタ３０２から提供される。

　以下の説明では、聴講者が理解していないことを示す情報は、詳細な説明の要求又は質問であるものとする。なお、例えば、発表者が“ｘｘｘは、このようになります。”と発話した場合、詳細な説明の要求は、“ｘｘｘを詳しく教えてください。”である。また、例えば、発表者が“ｘｘｘは、このようになります。”と発話した場合、質問は、“ｘｘｘとは、ｙｙｙということですか。”である。

　次に、発表者装置１００が実行する処理を、フローチャートを用いて、説明する。
　図６は、実施の形態１の発表者装置が実行する処理の例を示すフローチャートである。
　（ステップＳ１１）取得部１２０は、文字情報を取得する。例えば、取得部１２０は、文字情報を聴講者装置２００から取得する。取得部１２０は、外部装置を介して、文字情報を取得してもよい。
　文字情報は、１以上の文字を含む情報である。文字情報は、聴講者の操作により、聴講者装置２００が生成した情報である。例えば、文字情報は、聴講者のキーボード操作により、聴講者装置２００が生成した情報である。

　（ステップＳ１２）解析制御部１３０は、文字情報を解析する。例えば、解析制御部１３０は、形態素解析を用いて、当該文字情報が示す文章が詳細な説明の要求又は質問であるか否かを解析する。
　（ステップＳ１３）解析制御部１３０は、解析の結果が、詳細な説明の要求又は質問であるか否かを判定する。条件を満たす場合、処理は、ステップＳ１４に進む。条件を満たさない場合、処理は、終了する。

　（ステップＳ１４）取得部１２０は、管理テーブル１１１を記憶部１１０から取得する。生成部１４０は、管理テーブル１１１と文字情報とに基づいて、アバタの個性に応じた文章を生成する。具体的に、処理を説明する。生成部１４０は、管理テーブル１１１の担当の項目を参照し、発表者に情報を提供するアバタＢ（すなわち、アバタ３０２）を特定する。生成部１４０は、管理テーブル１１１の個性の項目を参照し、アバタ３０２の個性を特定する。生成部１４０は、アバタ３０２の個性を示す情報と文字情報とに基づいて、アバタの個性に応じた文章を生成する。例えば、解析の結果が、質問であることを示している場合、生成部１４０は、文字情報が示す文章に基づいて、発表者に対して質問が届いていることを示す文章を生成する。生成部１４０は、当該文章をフレンドリーな文章に加工する。例えば、生成部１４０は、当該文章の語尾をフレンドリーな文字に加工する。これにより、アバタの個性に応じた文章が、生成される。また、生成部１４０は、文字情報が示す文章を要約し、要約された文章に基づいて、発表者に対して質問が届いていることを示す文章を生成し、当該文章をフレンドリーな文章に加工してもよい。

　（ステップＳ１５）生成部１４０は、生成された文章に基づいて、音情報を生成する。音情報は、音ファイルと呼んでもよい。
　（ステップＳ１６）生成部１４０は、アバタ３０２を含む画面を生成する。例えば、生成部１４０は、口が開いているアバタ３０２を含む画面を生成する。

　（ステップＳ１７）提供制御部１５０は、出力情報として、生成された音情報に基づく音と、生成された画面とが、発表者に提供されるように、制御を行う。例えば、提供制御部１５０は、当該音情報に基づく音がスピーカ３２０及びスピーカ３２１の少なくとも１つから出力されるための制御を行う。また、例えば、提供制御部１５０は、当該画面がディスプレイ３００に表示されるための制御を行う。
　これにより、発表者は、アバタ３０２が発話する当該音を聞くことができる。

　次に、発表者装置１００が実行する処理の具体例を示す。
　図７は、実施の形態１の発表者装置が実行する処理の具体例を示す図である。聴講者装置２００は、“ｘｘｘを詳しく教えてください。”という文字情報を発表者装置１００に送信する。

　発表者装置１００は、文字情報を取得する。発表者装置１００は、文字情報を解析する。発表者装置１００は、文字情報が詳細な説明の要求であることを検出する。発表者装置１００は、アバタ３０２の個性に応じた文章を生成する。例えば、発表者装置１００は、“ｘｘｘについて質問が来ているよ。”という文章を生成する。発表者装置１００は、生成された文章に基づいて、音情報を生成する。発表者装置１００は、アバタ３０２を含む画面を生成する。発表者装置１００は、音情報に基づく音と、画面とが発表者に提供されるように、制御を行う。
　これにより、発表者は、アバタ３０２が発話する当該音を聞くことができる。

　ここで、例えば、範囲３０３には、聴講者が入力した文字“ｘｘｘを詳しく教えてください。”が、表示される。しかし、発表者が熱中してプレゼンテーションを行っているとき、発表者は、範囲３０３を見ない場合がある。すなわち、発表者は、聴講者の反応に気付かない場合がある。

　実施の形態１によれば、発表者は、アバタ３０２が発話する音を聞く。そのため、発表者は、聴講者の反応に気付く。よって、発表者装置１００は、当該音が発表者に提供されるための制御を行うことで、聴講者の反応を発表者に気付かせることができる。
　また、例えば、発表者は、アバタ３０２が発話する音を聞けば、詳細な説明の要求を知ることができる。そのため、発表者は、範囲３０３を読まなくて済む。よって、発表者装置１００は、発表者の負担を軽減できる。

　発表者は、アバタ３０２の個性に応じた文章に基づく音を聞く。すなわち、発表者は、アバタ３０２の一貫した話し方を聞く。ここで、例えば、アバタ３０２が複数の話し方を行う場合、発表者は、話し方の変化が気になり、アバタ３０２の発話を聞き逃すことがある。そのため、発表者装置１００は、一貫した話し方の音をスピーカ（例えば、スピーカ３２０）から出力させる。これにより、発表者装置１００は、発表者がアバタ３０２の発話を聞き逃すことを防ぐことができる。また、アバタ３０１とアバタ３０２とが画面に表示されている場合、発表者は、アバタ３０２の個性に応じた文章に基づく音がスピーカから出力されることで、どちらのアバタが発話しているのかを認識できる。そのため、発表者は、混乱せずに、アバタ３０２の発話を聞くことができる。また、後述するように、発表者装置１００は、アバタ３０２が発話する音を聴講者が聞くように、聴講者装置２００を制御することができる。これにより、聴講者は、アバタ３０２の個性に応じた文章に基づく音を聞く。すなわち、聴講者は、アバタ３０２の一貫した話し方を聞く。発表者に対する効果と同様に、発表者装置１００は、聴講者がアバタ３０２の発話を聞き逃すことを防ぐことができる。また、聴講者は、混乱せずに、アバタ３０２の発話を聞くことができる。

　また、発表者装置１００は、文章を発表者に提供してもよい。詳細に処理を説明する。生成部１４０は、文字情報に基づいて文章を生成する。なお、当該文章は、アバタ３０２の個性に応じた文章ではない。すなわち、当該文章は、一般的な文章（例えば、丁寧な文章）である。提供制御部１５０は、出力情報として当該文章が、発表者に提供されるように、制御を行う。例えば、提供制御部１５０は、当該文章がディスプレイ３００に表示されるための制御を行う。このように、発表者装置１００は、当該文章が発表者に提供されるように、制御を行うことで、聴講者の反応を発表者に気付かせることができる。

　また、生成部１４０は、当該文章（例えば、丁寧な文章）に基づいて、音情報を生成してもよい。提供制御部１５０は、生成された音情報に基づく音が発表者に提供されるように、制御を行ってもよい。例えば、提供制御部１５０は、音情報に基づく音がスピーカ３２０から出力されるための制御を行う。

　さらに、生成部１４０は、当該文章（例えば、丁寧な文章）に基づいて、音情報を生成し、アバタ３０２を含む画面を生成してもよい。提供制御部１５０は、生成された音情報に基づく音と当該画面が発表者に提供されるように、制御を行ってもよい。

　提供制御部１５０は、次の処理を実行してもよい。提供制御部１５０は、生成された画面がディスプレイ３００に表示されるように、制御を行う。提供制御部１５０は、画面の中のアバタ３０２の位置に音像が形成されるように、制御を行う。例えば、提供制御部１５０は、アバタ３０２の位置に音像が形成されるように、スピーカ３２０とスピーカ３２１とを制御する。このように、アバタ３０２の位置に音像が形成されることで、発表者は、アバタ３０２が本当に話しているように感じることができる。

　また、提供制御部１５０は、生成された音情報に基づく音と、生成された画面とが、聴講者に提供されるように、制御を行ってもよい。例えば、提供制御部１５０は、当該音情報と当該画面とを聴講者装置２００に送信する。また、提供制御部１５０は、当該音情報に基づく音の出力指示と当該画面の表示指示を聴講者装置２００に送信する。これにより、聴講者は、アバタ３０２が発話する音を聞くことができる。そして、聴講者は、文字情報が示す詳細な説明の要求又は質問が発表者に伝わっていることを認識できる。

　さらに、提供制御部１５０は、ディスプレイ４００に表示される画面の中のアバタ３０２の位置に音像が形成されるように、制御を行ってもよい。例えば、提供制御部１５０は、音像の形成指示を聴講者装置２００に送信する。聴講者装置２００は、アバタ３０２の位置に音像が形成されるように、聴講者側の複数のスピーカを制御する。このように、アバタ３０２の位置に音像が形成されることで、聴講者は、アバタ３０２が本当に話しているように感じることができる。

　生成部１４０は、画面に表示されるアバタの数を変更してもよい。詳細には、生成部１４０は、発表者の発表中に、画面に表示されるアバタの数を変更してもよい。例えば、アバタ３０２が発話する場合、生成部１４０は、アバタ３０２のみが表示されている画面を生成する。すなわち、アバタ３０１は、画面に表示されない。これにより、発表者は、どのアバタを注目して話を聞いたらよいのか分かる。

　実施の形態１では、聴講者が理解していないことを示す情報として、文字情報を例示した。実施の形態１の変形例１～４では、当該情報が文字情報以外である場合を説明する。

実施の形態１の変形例１．
　図８は、実施の形態１の変形例１の発表者装置が実行する処理の例を示すフローチャートである。
　（ステップＳ２１）取得部１２０は、音声信号を取得する。例えば、取得部１２０は、音声信号を聴講者装置２００から取得する。また、取得部１２０は、外部装置を介して、音声信号を聴講者装置２００から取得してもよい。音声信号は、聴講者の音声の信号である。なお、聴講者装置２００は、音声信号をマイク４１０から取得することができる。
　また、提供制御部１５０は、当該音声信号に基づく音がスピーカ（例えば、スピーカ３２０）から出力されるための制御を行う。さらに、提供制御部１５０は、当該音声信号に基づく発話内容が、チャットの内容として、ディスプレイ３００に表示されるための制御を行ってもよい。

　（ステップＳ２２）解析制御部１３０は、音声信号に基づいて、聴講者の発話内容を検出する。例えば、解析制御部１３０は、公知の音声認識技術と音声信号とを用いて、聴講者の発話内容を検出する。例えば、発話内容は、“ｘｘｘを詳しく教えてください。”である。また、例えば、発話内容は、“ｘｘｘとは、ｙｙｙということですか。”である。
　このように、解析制御部１３０は、文字情報である発話内容を検出することができる。

　（ステップＳ２３）解析制御部１３０は、聴講者の発話内容を解析する。例えば、解析制御部１３０は、形態素解析を用いて、発話内容が詳細な説明の要求又は質問であるか否かを解析する。
　（ステップＳ２４）解析制御部１３０は、解析の結果が、詳細な説明の要求又は質問であるか否かを判定する。条件を満たす場合、処理は、ステップＳ１４に進む。条件を満たさない場合、処理は、終了する。

　（ステップＳ２５）取得部１２０は、管理テーブル１１１を記憶部１１０から取得する。生成部１４０は、管理テーブル１１１と発話内容である文字情報とに基づいて、アバタ３０２の個性に応じた文章を生成する。例えば、生成された文章は、“ｘｘｘについて質問が来ているよ。”である。

　（ステップＳ２６）生成部１４０は、生成された文章に基づいて、音情報を生成する。
　（ステップＳ２７）生成部１４０は、アバタ３０２を含む画面を生成する。例えば、生成部１４０は、口が開いているアバタ３０２を含む画面を生成する。
　（ステップＳ２８）提供制御部１５０は、出力情報として、音情報に基づく音と画面とが、発表者に提供されるように、制御を行う。
　これにより、発表者は、アバタ３０２が発話する当該音を聞くことができる。

　ここで、例えば、スピーカ３２０から聴講者の音声が出力される。例えば、音声内容は、“ｘｘｘを詳しく教えてください。”である。しかし、発表者が熱中してプレゼンテーションを行っているとき、発表者は、当該音声に気付かない場合がある。すなわち、発表者は、聴講者の反応に気付かない場合がある。

　実施の形態１の変形例１によれば、発表者は、改めて、アバタ３０２が発話する音（すなわち、聴講者の音声内容に基づく音）を聞く。そのため、発表者は、聴講者の反応に気付く。よって、発表者装置１００は、当該音が発表者に提供されるための制御を行うことで、聴講者の反応を発表者に気付かせることができる。

　また、発表者がディスプレイ３００を見ており、アバタ３０２の口が開いており、かつアバタ３０２が発話する音を発表者が聞いた場合、発表者が気付く確率が、向上する。

　また、提供制御部１５０は、生成された音情報に基づく音と、生成された画面とが、聴講者に提供されるための制御を行ってもよい。これにより、聴講者は、アバタ３０２が発話する音を聞くことができる。そして、聴講者は、自分の発話が示す詳細な説明の要求又は質問が発表者に伝わっていることを認識できる。

実施の形態１の変形例２．
　図９は、実施の形態１の変形例２の発表者装置が実行する処理の例を示すフローチャートである。
　（ステップＳ３１）取得部１２０は、音声信号を取得する。例えば、取得部１２０は、音声信号をマイク３１０から取得する。音声信号は、発表者の音声の信号である。
　（ステップＳ３２）解析制御部１３０は、音声信号に基づいて、発表者の発話内容を検出する。例えば、解析制御部１３０は、公知の音声認識技術と音声信号とを用いて、発表者の発話内容を検出する。例えば、発話内容は、“ｘｘｘは、このようになります。”である。
　このように、解析制御部１３０は、文字情報である発話内容を検出することができる。

　（ステップＳ３３）解析制御部１３０は、発話内容を記憶部１１０に格納する。解析制御部１３０は、発話内容を外部装置に格納してもよい。

　ここで、ディスプレイ４００には、ボタンが表示されている。当該ボタンは、聴講者が発表者の説明を理解できない場合に押下される。例えば、聴講者は、発表者の説明を理解できない場合、マウスを用いて、当該ボタンを押下する。聴講者装置２００は、当該ボタンが押下された場合、ボタン情報を生成する。ボタン情報は、聴講者が理解していないことを示す情報である。聴講者装置２００は、ボタン情報を発表者装置１００に送信する。

　（ステップＳ３４）取得部１２０は、ボタン情報を取得する。例えば、取得部１２０は、ボタン情報を聴講者装置２００から取得する。取得部１２０は、外部装置を介して、ボタン情報を聴講者装置２００から取得してもよい。

　（ステップＳ３５）取得部１２０は、管理テーブル１１１を記憶部１１０から取得する。生成部１４０は、管理テーブル１１１と発話内容である文字情報とに基づいて、アバタの個性に応じた文章を生成する。例えば、生成された文章は、“ｘｘｘの説明を再びお願い。”である。

　（ステップＳ３６）生成部１４０は、生成された文章に基づいて、音情報を生成する。
　（ステップＳ３７）生成部１４０は、アバタ３０２を含む画面を生成する。例えば、生成部１４０は、口が開いているアバタ３０２を含む画面を生成する。
　（ステップＳ３８）提供制御部１５０は、出力情報として、生成された音情報に基づく音と、生成された画面とが、発表者に提供されるように、制御を行う。
　これにより、発表者は、アバタ３０２が発話する当該音を聞くことができる。

　ここで、発表者が熱中してプレゼンテーションを行っているとき、発表者は、聴講者の反応に気付かない場合がある。また、発表者が、聴講者の反応に気付かないで、発話を続けることは、聴講者の理解度を低下させる。

　実施の形態１の変形例２によれば、発表者装置１００は、ボタン情報を取得した場合、アバタ３０２が発話する音が発表者に提供されるための制御を行う。これにより、発表者は、アバタ３０２が発話する音を聞く。発表者は、当該音を聞くことで、聴講者が理解していないということ（すなわち、聴講者の反応）に気付く。よって、発表者装置１００は、当該音が発表者に提供されるための制御を行うことで、聴講者の反応を発表者に気付かせることができる。

　また、提供制御部１５０は、生成された音情報に基づく音と、生成された画面とが、聴講者に提供されるための制御を行ってもよい。これにより、聴講者は、アバタ３０２が発話する音を聞くことができる。そして、聴講者は、自分が発表者の説明を理解していないことが、発表者に伝わっていることを認識できる。これにより、聴講者は、発表者が再び説明してくれることを期待できる。

実施の形態１の変形例３．
　図１０は、実施の形態１の変形例３の発表者装置が実行する処理の例を示すフローチャートである。
　（ステップＳ４１）取得部１２０は、音声信号を取得する。例えば、取得部１２０は、音声信号をマイク３１０から取得する。音声信号は、発表者の音声の信号である。
　（ステップＳ４２）解析制御部１３０は、音声信号に基づいて、発表者の発話内容を検出する。例えば、解析制御部１３０は、公知の音声認識技術と音声信号とを用いて、発表者の発話内容を検出する。例えば、発話内容は、“ｘｘｘは、このようになります。”である。

　（ステップＳ４３）解析制御部１３０は、発話内容を記憶部１１０に格納する。解析制御部１３０は、発話内容を外部装置に格納してもよい。

　ここで、聴講者装置２００は、聴講者の目を含む画像を撮像装置４２０から取得する。聴講者装置２００は、当該画像を発表者装置１００に送信する。

　（ステップＳ４４）取得部１２０は、当該画像を取得する。例えば、取得部１２０は、当該画像を聴講者装置２００から取得する。取得部１２０は、外部装置を介して、当該画像を聴講者装置２００から取得してもよい。
　（ステップＳ４５）解析制御部１３０は、当該画像に基づいて、聴講者の視線を解析する。例えば、解析制御部１３０は、当該画像に含まれている目の瞳孔の位置に基づいて、聴講者の視線を解析する。

　（ステップＳ４６）解析制御部１３０は、解析の結果に基づいて、聴講者が理解しているか否かを判定する。例えば、解析の結果が、聴講者の視線が上方向であることを示している場合、解析制御部１３０は、聴講者が理解していないと判定する。
　聴講者が理解している場合、処理は、終了する。聴講者が理解していない場合、処理は、ステップＳ４７に進む。

　（ステップＳ４７）取得部１２０は、管理テーブル１１１を記憶部１１０から取得する。生成部１４０は、管理テーブル１１１と発話内容である文字情報とに基づいて、アバタ３０２の個性に応じた文章を生成する。例えば、生成された文章は、“ｘｘｘの説明を再びお願い。”である。

　（ステップＳ４８）生成部１４０は、生成された文章に基づいて、音情報を生成する。
　（ステップＳ４９）生成部１４０は、アバタ３０２を含む画面を生成する。例えば、生成部１４０は、口が開いているアバタ３０２を含む画面を生成する。
　（ステップＳ５０）提供制御部１５０は、出力情報として、生成された音情報に基づく音と、生成された画面とが、発表者に提供されるように、制御を行う。
　これにより、発表者は、アバタ３０２が発話する当該音を聞くことができる。

　実施の形態１の変形例３によれば、発表者装置１００は、聴講者が理解していないことが、解析された場合、アバタ３０２が発話する音が発表者に提供されるための制御を行う。これにより、発表者は、アバタ３０２が発話する音を聞く。発表者は、当該音を聞くことで、聴講者が理解していないということ（すなわち、聴講者の反応）に気付く。よって、発表者装置１００は、当該音が発表者に提供されるための制御を行うことで、聴講者の反応を発表者に気付かせることができる。

実施の形態１の変形例４．
　図１１は、実施の形態１の変形例４の発表者装置が実行する処理の例を示すフローチャートである。
　（ステップＳ５１）取得部１２０は、音声信号を取得する。例えば、取得部１２０は、音声信号をマイク３１０から取得する。音声信号は、発表者の音声の信号である。
　（ステップＳ５２）解析制御部１３０は、音声信号に基づいて、発表者の発話内容を検出する。例えば、解析制御部１３０は、公知の音声認識技術と音声信号とを用いて、発表者の発話内容を検出する。
　（ステップＳ５３）解析制御部１３０は、発話内容を記憶部１１０に格納する。解析制御部１３０は、発話内容を外部装置に格納してもよい。

　ここで、聴講者装置２００は、聴講者の顔を含む画像を撮像装置４２０から取得する。聴講者装置２００は、当該画像を発表者装置１００に送信する。

　（ステップＳ５４）取得部１２０は、当該画像を取得する。例えば、取得部１２０は、当該画像を聴講者装置２００から取得する。取得部１２０は、外部装置を介して、当該画像を聴講者装置２００から取得してもよい。
　（ステップＳ５５）解析制御部１３０は、当該画像に基づいて、聴講者の表情を解析する。例えば、解析制御部１３０は、当該画像と学習済モデルとを用いて、聴講者の表情を解析する。

　（ステップＳ５６）解析制御部１３０は、解析の結果に基づいて、聴講者が理解しているか否かを判定する。例えば、解析の結果が、聴講者の表情が理解していないときの表情であることを示している場合、解析制御部１３０は、聴講者が理解していないと判定する。
　聴講者が理解している場合、処理は、終了する。聴講者が理解していない場合、処理は、ステップＳ５７に進む。

　（ステップＳ５７）取得部１２０は、管理テーブル１１１を記憶部１１０から取得する。生成部１４０は、管理テーブル１１１と発話内容である文字情報とに基づいて、アバタ３０２の個性に応じた文章を生成する。
　（ステップＳ５８）生成部１４０は、生成された文章に基づいて、音情報を生成する。
　（ステップＳ５９）生成部１４０は、アバタ３０２を含む画面を生成する。例えば、生成部１４０は、口が開いているアバタ３０２を含む画面を生成する。

　（ステップＳ６０）提供制御部１５０は、出力情報として、生成された音情報に基づく音と、生成された画面とが、発表者に提供されるように、制御を行う。
　これにより、発表者は、アバタ３０２が発話する当該音を聞くことができる。

　実施の形態１の変形例４によれば、発表者装置１００は、聴講者が理解していないことが、解析された場合、アバタ３０２が発話する音が発表者に提供されるための制御を行う。これにより、発表者は、アバタ３０２が発話する音を聞く。発表者は、当該音を聞くことで、聴講者が理解していないということ（すなわち、聴講者の反応）に気付く。よって、発表者装置１００は、当該音が発表者に提供されるための制御を行うことで、聴講者の反応を発表者に気付かせることができる。

実施の形態２．
　次に、実施の形態２を説明する。実施の形態２では、実施の形態１と相違する事項を主に説明する。そして、実施の形態２では、実施の形態１と共通する事項の説明を省略する。
　実施の形態１では、発表者装置１００が主な処理を行う場合を説明した。実施の形態２では、サーバが主な処理を行う場合を説明する。

　図１２は、実施の形態２の通信システムを示す図である。通信システムは、サーバ５００、発表者装置６００、及び聴講者装置７００を含む。サーバ５００、発表者装置６００、及び聴講者装置７００は、ネットワークを介して、通信する。

　サーバ５００は、情報処理装置とも言う。例えば、サーバ５００は、クラウドサーバである。サーバ５００は、制御方法を実行する装置である。サーバ５００は、プロセッサ、揮発性記憶装置、及び不揮発性記憶装置を有する。サーバ５００は、処理回路を有してもよい。

　発表者装置６００は、発表者が用いる装置である。例えば、発表者装置６００は、ＰＣ（Ｐｅｒｓｏｎａｌ　Ｃｏｍｐｕｔｅｒ）である。発表者装置６００には、ディスプレイ、マイク、及び１以上のスピーカが接続されている。また、発表者装置６００は、ディスプレイ、マイク、及び１以上のスピーカのうちの少なくとも１つを有してもよい。当該ディスプレイ、当該マイク、及び当該１以上のスピーカは、発表者側のディスプレイ、マイク、及び１以上のスピーカと呼んでもよい。

　聴講者装置７００は、聴講者が用いる装置である。例えば、聴講者装置７００は、ＰＣである。聴講者装置７００には、ディスプレイ、マイク、撮像装置、及び１以上のスピーカが接続されている。聴講者装置７００は、ディスプレイ、マイク、撮像装置、及び１以上のスピーカのうちの少なくとも１つを有してもよい。当該ディスプレイ、当該マイク、当該撮像装置、及び当該１以上のスピーカは、聴講者側のディスプレイ、マイク、撮像装置、及び１以上のスピーカと呼んでもよい。

　発表者は、発表者装置６００のディスプレイに表示された画面を見ながら、プレゼンテーションなどを行う。実施の形態１と同じように、当該画面は、聴講者側のディスプレイにも表示されている。

　次に、サーバ５００が有する機能を説明する。
　図１３は、実施の形態２のサーバが有する機能のブロック図である。サーバ５００は、記憶部５１０、取得部５２０、解析制御部５３０、生成部５４０、及び提供制御部５５０を有する。

　記憶部５１０は、サーバ５００が有する揮発性記憶装置又は不揮発性記憶装置に確保した記憶領域として実現してもよい。
　取得部５２０、解析制御部５３０、生成部５４０、及び提供制御部５５０の一部又は全部は、サーバが有する処理回路によって実現してもよい。また、取得部５２０、解析制御部５３０、生成部５４０、及び提供制御部５５０の一部又は全部は、サーバ５００が有するプロセッサが実行するプログラムのモジュールとして実現してもよい。例えば、当該プロセッサが実行するプログラムは、制御プログラムとも言う。例えば、制御プログラムは、記録媒体に記録されている。

　記憶部５１０は、様々な情報を記憶する。例えば、記憶部５１０は、管理テーブル１１１を記憶する。
　取得部５２０は、聴講者が理解していないことを示す情報を取得する。当該情報は、聴講者が発表者の説明を理解していないことを示す情報と表現してもよい。例えば、取得部５２０は、当該情報を聴講者装置７００から取得する。また、例えば、当該情報は、聴講者からの詳細な説明の要求、又は聴講者からの質問である。

　解析制御部５３０の機能は、後で説明する。
　生成部５４０は、聴講者が理解していないことを示す情報が取得された場合、発表者への出力情報を生成する。
　提供制御部５５０は、出力情報が発表者に提供されるように、制御を行う。言い換えれば、提供制御部５５０は、出力情報が発表者に提供されるための制御を行う。

　次に、通信システムで実行される処理を、シーケンス図を用いて、説明する。
　図１４は、実施の形態２の通信システムで実行される処理の例を示すシーケンス図である。上述したように、サーバ５００は、発表者装置１００と同様の処理を行う。そのため、詳細な説明は、省略する。
　（ステップＳＴ１０１）聴講者装置７００は、文字情報をサーバ５００に送信する。
　これにより、文字情報は、取得部５２０に取得される。また、取得部５２０は、外部装置を介して、文字情報を取得してもよい。
　（ステップＳＴ１０２）解析制御部５３０は、文字情報を解析する。
　（ステップＳＴ１０３）解析制御部５３０は、解析の結果が、詳細な説明の要求又は質問であるか否かを判定する。解析の結果が、詳細な説明の要求又は質問であるものとする。

　（ステップＳＴ１０４）取得部５２０は、管理テーブル１１１を取得する。例えば、取得部５２０は、管理テーブル１１１を記憶部５１０から取得する。また、例えば、取得部５２０は、管理テーブル１１１を外部装置から取得する。生成部５４０は、管理テーブル１１１と文字情報とに基づいて、アバタ３０２の個性に応じた文章を生成する。
　（ステップＳＴ１０５）生成部５４０は、生成された文章に基づいて、音情報を生成する。

　（ステップＳＴ１０６）生成部５４０は、アバタ３０２を含む画面を生成する。
　（ステップＳＴ１０７）提供制御部５５０は、出力情報として、生成された音情報に基づく音と、生成された画面とが、発表者に提供されるように、制御を行う。例えば、提供制御部５５０は、当該音情報と当該画面を発表者装置６００に送信する。提供制御部５５０は、当該音情報に基づく音の出力指示と当該画面の表示指示とを発表者装置６００に送信する。

　（ステップＳＴ１０８）発表者装置６００は、当該音情報に基づく音が１以上のスピーカから出力されるための制御を行う。また、発表者装置６００は、当該画面がディスプレイに表示されるための制御を行う。
　これにより、発表者は、アバタ３０２が発話する音を聞くことができる。

　実施の形態２によれば、発表者は、アバタ３０２が発話する音を聞く。そのため、発表者は、聴講者の反応に気付く。よって、サーバ５００は、当該音が発表者に提供されるための制御を行うことで、聴講者の反応を発表者に気付かせることができる。

　また、発表者装置６００は、文章を発表者に提供してもよい。詳細に処理を説明する。生成部５４０は、文字情報に基づいて文章を生成する。なお、当該文章は、アバタ３０２の個性に応じた文章ではない。すなわち、当該文章は、一般的な文章（例えば、丁寧な文章）である。提供制御部５５０は、出力情報として当該文章が、発表者に提供されるように、制御を行う。例えば、提供制御部５５０は、当該文章と、当該文章の表示指示を発表者装置６００に送信する。発表者装置６００は、当該文章が発表者側のディスプレイに表示されるための制御を行う。これにより、当該文章が、発表者に提供される。

　また、生成部５４０は、当該文章（例えば、丁寧な文章）に基づいて、音情報を生成してもよい。提供制御部５５０は、生成された音情報に基づく音が発表者に提供されるように、制御を行ってもよい。

　さらに、生成部５４０は、当該文章（例えば、丁寧な文章）に基づいて、音情報を生成し、アバタ３０２を含む画面を生成してもよい。提供制御部５５０は、生成された音情報に基づく音と当該画面が発表者に提供されるように、制御を行ってもよい。

　提供制御部５５０は、次の処理を実行してもよい。提供制御部５５０は、生成された画面が発表者側のディスプレイに表示されるように、制御を行う。また、提供制御部１５０は、当該画面の中のアバタ３０２の位置に音像が形成されるように、制御を行う。例えば、提供制御部５５０は、音像の形成指示を発表者装置６００に送信する。発表者装置６００は、アバタ３０２の位置に音像が複数のスピーカによって形成されるための制御を行う。これにより、アバタ３０２の位置に音像が形成される。

　また、提供制御部５５０は、生成された音情報に基づく音と、生成された画面とが、聴講者に提供されるように、制御を行ってもよい。例えば、提供制御部５５０は、当該音情報と当該画面とを聴講者装置７００に送信する。また、提供制御部５５０は、当該音情報に基づく音の出力指示と当該画面の表示指示を聴講者装置７００に送信する。これにより、聴講者は、アバタ３０２が発話する音を聞くことができる。

　さらに、提供制御部５５０は、聴講者側のディスプレイに表示される画面の中のアバタ３０２の位置に音像が形成されるように、制御を行ってもよい。例えば、提供制御部５５０は、音像の形成指示を聴講者装置７００に送信する。聴講者装置７００は、アバタ３０２の位置に音像が複数のスピーカによって形成されるための制御を行う。これにより、アバタ３０２の位置に音像が形成される。

　生成部５４０は、画面に表示されるアバタの数を変更してもよい。詳細には、生成部５４０は、発表者の発表中に、画面に表示されるアバタの数を変更してもよい。例えば、アバタ３０２が発話する場合、生成部５４０は、アバタ３０２のみが表示されている画面を生成する。すなわち、アバタ３０１は、画面に表示されない。これにより、発表者は、どのアバタを注目して話を聞いたらよいのか分かる。

実施の形態２の変形例１．
　実施の形態２の変形例１では、実施の形態１の変形例１と同様の処理をサーバ５００が実行する。そのため、詳細な説明は、省略する。
　図１５は、実施の形態２の変形例１の通信システムで実行される処理の例を示すシーケンス図である。
　（ステップＳＴ１１１）聴講者装置７００は、音声信号をサーバ５００に送信する。なお、音声信号は、聴講者の音声の信号である。
　これにより、音声信号は、取得部５２０に取得される。また、取得部５２０は、外部装置を介して、音声信号を取得してもよい。
　また、提供制御部５５０は、当該音声信号に基づく音が発表者側のスピーカから出力されるための制御を行う。さらに、提供制御部５５０は、当該音声信号に基づく発話内容が、チャットの内容として、発表者側のディスプレイに表示されるための制御を行ってもよい。

　（ステップＳＴ１１２）解析制御部５３０は、音声信号に基づいて、聴講者の発話内容を検出する。
　（ステップＳＴ１１３）解析制御部５３０は、聴講者の発話内容を解析する。
　（ステップＳＴ１１４）解析制御部５３０は、解析の結果が、詳細な説明の要求又は質問であるか否かを判定する。解析の結果が、詳細な説明の要求又は質問であるものとする。

　（ステップＳＴ１１５）取得部５２０は、管理テーブル１１１を記憶部５１０から取得する。生成部５４０は、管理テーブル１１１と発話内容である文字情報とに基づいて、アバタ３０２の個性に応じた文章を生成する。
　（ステップＳＴ１１６）生成部５４０は、生成された文章に基づいて、音情報を生成する。

　（ステップＳＴ１１７）生成部５４０は、アバタ３０２を含む画面を生成する。
　（ステップＳＴ１１８）提供制御部５５０は、出力情報として、生成された音情報に基づく音と、生成された画面とが、発表者に提供されるように、制御を行う。例えば、提供制御部５５０は、当該音情報と当該画面を発表者装置６００に送信する。提供制御部５５０は、当該音情報に基づく音の出力指示と当該画面の表示指示を発表者装置６００に送信する。

　（ステップＳＴ１１９）発表者装置６００は、当該音情報に基づく音が１以上のスピーカから出力されるための制御を行う。また、発表者装置６００は、当該画面がディスプレイに表示されるための制御を行う。
　これにより、発表者は、アバタ３０２が発話する音を聞くことができる。

　実施の形態２の変形例１によれば、サーバ５００は、聴講者の反応を発表者に気付かせることができる。
　また、提供制御部５５０は、生成された音情報に基づく音と、生成された画面とが、聴講者に提供されるための制御を行ってもよい。

実施の形態２の変形例２．
　実施の形態２の変形例２では、実施の形態１の変形例２と同様の処理をサーバ５００が実行する。そのため、詳細な説明は、省略する。
　図１６は、実施の形態２の変形例２の通信システムで実行される処理の例を示すシーケンス図である。
　（ステップＳＴ１２１）発表者装置６００は、音声信号をサーバ５００に送信する。なお、音声信号は、発表者の音声の信号である。
　これにより、音声信号は、取得部５２０に取得される。また、取得部５２０は、外部装置を介して、音声信号を取得してもよい。

　（ステップＳＴ１２２）解析制御部５３０は、音声信号に基づいて、発表者の発話内容を検出する。解析制御部５３０は、発話内容を記憶部５１０に格納する。
　（ステップＳＴ１２３）聴講者装置７００は、ボタン情報をサーバ５００に送信する。
　これにより、ボタン情報は、取得部５２０に取得される。また、取得部５２０は、外部装置を介して、ボタン情報を取得してもよい。

　（ステップＳＴ１２４）取得部５２０は、管理テーブル１１１を記憶部５１０から取得する。生成部５４０は、管理テーブル１１１と発話内容である文字情報とに基づいて、アバタ３０２の個性に応じた文章を生成する。
　（ステップＳＴ１２５）生成部５４０は、生成された文章に基づいて、音情報を生成する。

　（ステップＳＴ１２６）生成部５４０は、アバタ３０２を含む画面を生成する。
　（ステップＳＴ１２７）提供制御部５５０は、出力情報として、生成された音情報に基づく音と、生成された画面とが、発表者に提供されるように、制御を行う。例えば、提供制御部５５０は、当該音情報と当該画面を発表者装置６００に送信する。提供制御部５５０は、当該音情報に基づく音の出力指示と当該画面の表示指示を発表者装置６００に送信する。

　（ステップＳＴ１２８）発表者装置６００は、当該音情報に基づく音が１以上のスピーカから出力されるための制御を行う。また、発表者装置６００は、当該画面がディスプレイに表示されるための制御を行う。
　これにより、発表者は、アバタ３０２が発話する音を聞くことができる。

　実施の形態２の変形例２によれば、サーバ５００は、聴講者の反応を発表者に気付かせることができる。
　また、提供制御部５５０は、生成された音情報に基づく音と、生成された画面とが、聴講者に提供されるための制御を行ってもよい。

実施の形態２の変形例３．
　実施の形態２の変形例３では、実施の形態１の変形例３と同様の処理をサーバ５００が実行する。そのため、詳細な説明は、省略する。
　図１７は、実施の形態２の変形例３の通信システムで実行される処理の例を示すシーケンス図である。
　（ステップＳＴ１３１）発表者装置６００は、音声信号をサーバ５００に送信する。なお、音声信号は、発表者の音声の信号である。
　これにより、音声信号は、取得部５２０に取得される。また、取得部５２０は、外部装置を介して、音声信号を取得してもよい。

　（ステップＳＴ１３２）解析制御部５３０は、音声信号に基づいて、発表者の発話内容を検出する。解析制御部５３０は、発話内容を記憶部５１０に格納する。
　（ステップＳＴ１３３）聴講者装置７００は、聴講者の目を含む画像をサーバ５００に送信する。
　これにより、当該画像は、取得部５２０に取得される。また、取得部５２０は、外部装置を介して、当該画像を取得してもよい。

　（ステップＳＴ１３４）解析制御部５３０は、当該画像に基づいて、聴講者の視線を解析する。
　（ステップＳＴ１３５）解析制御部５３０は、解析の結果に基づいて、聴講者が理解しているか否かを判定する。例えば、解析の結果が、聴講者の視線が上方向であることを示している場合、解析制御部５３０は、聴講者が理解していないと判定する。解析の結果が、聴講者が理解していないことを示しているものとする。

　（ステップＳＴ１３６）取得部５２０は、管理テーブル１１１を記憶部５１０から取得する。生成部５４０は、管理テーブル１１１と発話内容である文字情報とに基づいて、アバタ３０２の個性に応じた文章を生成する。
　（ステップＳＴ１３７）生成部５４０は、生成された文章に基づいて、音情報を生成する。

　（ステップＳＴ１３８）生成部５４０は、アバタ３０２を含む画面を生成する。
　（ステップＳＴ１３９）提供制御部５５０は、出力情報として、生成された音情報に基づく音と、生成された画面とが、発表者に提供されるように、制御を行う。例えば、提供制御部５５０は、当該音情報と当該画面を発表者装置６００に送信する。提供制御部５５０は、当該音情報に基づく音の出力指示と当該画面の表示指示を発表者装置６００に送信する。

　（ステップＳＴ１４０）発表者装置６００は、当該音情報に基づく音が１以上のスピーカから出力されるための制御を行う。また、発表者装置６００は、当該画面がディスプレイに表示されるための制御を行う。
　これにより、発表者は、アバタ３０２が発話する音を聞くことができる。

　実施の形態２の変形例３によれば、サーバ５００は、聴講者の反応を発表者に気付かせることができる。
　また、提供制御部５５０は、生成された音情報に基づく音と、生成された画面とが、聴講者に提供されるための制御を行ってもよい。

実施の形態２の変形例４．
　実施の形態２の変形例４では、実施の形態１の変形例４と同様の処理をサーバ５００が実行する。そのため、詳細な説明は、省略する。
　図１８は、実施の形態２の変形例４の通信システムで実行される処理の例を示すシーケンス図である。
　（ステップＳＴ１４１）発表者装置６００は、音声信号をサーバ５００に送信する。なお、音声信号は、発表者の音声の信号である。
　これにより、音声信号は、取得部５２０に取得される。また、取得部５２０は、外部装置を介して、音声信号を取得してもよい。

　（ステップＳＴ１４２）解析制御部５３０は、音声信号に基づいて、発表者の発話内容を検出する。解析制御部５３０は、発話内容を記憶部５１０に格納する。
　（ステップＳＴ１４３）聴講者装置７００は、聴講者の顔を含む画像をサーバ５００に送信する。
　これにより、当該画像は、取得部５２０に取得される。また、取得部５２０は、外部装置を介して、当該画像を取得してもよい。

　（ステップＳＴ１４４）解析制御部５３０は、当該画像に基づいて、聴講者の表情を解析する。
　（ステップＳＴ１４５）解析制御部５３０は、解析の結果に基づいて、聴講者が理解しているか否かを判定する。例えば、解析の結果が、聴講者の表情が理解していないときの表情であることを示している場合、解析制御部５３０は、聴講者が理解していないと判定する。解析の結果が、聴講者が理解していないことを示しているものとする。

　（ステップＳＴ１４６）取得部５２０は、管理テーブル１１１を記憶部５１０から取得する。生成部５４０は、管理テーブル１１１と発話内容である文字情報とに基づいて、アバタ３０２の個性に応じた文章を生成する。
　（ステップＳＴ１４７）生成部５４０は、生成された文章に基づいて、音情報を生成する。

　（ステップＳＴ１４８）生成部５４０は、アバタ３０２を含む画面を生成する。
　（ステップＳＴ１４９）提供制御部５５０は、出力情報として、生成された音情報に基づく音と、生成された画面とが、発表者に提供されるように、制御を行う。例えば、提供制御部５５０は、当該音情報と当該画面を発表者装置６００に送信する。提供制御部５５０は、当該音情報に基づく音の出力指示と当該画面の表示指示を発表者装置６００に送信する。

　（ステップＳＴ１５０）発表者装置６００は、当該音情報に基づく音が１以上のスピーカから出力されるための制御を行う。また、発表者装置６００は、当該画面がディスプレイに表示されるための制御を行う。
　これにより、発表者は、アバタ３０２が発話する音を聞くことができる。

　実施の形態２の変形例４によれば、サーバ５００は、聴講者の反応を発表者に気付かせることができる。
　また、提供制御部５５０は、生成された音情報に基づく音と、生成された画面とが、聴講者に提供されるための制御を行ってもよい。

実施の形態３．
　次に、実施の形態３を説明する。実施の形態３では、実施の形態１と相違する事項を主に説明する。そして、実施の形態３では、実施の形態１と共通する事項の説明を省略する。
　実施の形態１では、発表者装置１００が主な処理を行う場合を説明した。実施の形態３では、聴講者装置が主な処理を行う場合を説明する。

　図１９は、実施の形態３の通信システムを示す図である。通信システムは、聴講者装置８００及び発表者装置９００を含む。聴講者装置８００及び発表者装置９００は、ネットワークを介して、通信する。

　聴講者装置８００は、情報処理装置とも言う。聴講者装置８００は、制御方法を実行する装置である。聴講者装置８００は、プロセッサ、揮発性記憶装置、及び不揮発性記憶装置を有する。聴講者装置８００は、処理回路を有してもよい。
　聴講者装置８００は、聴講者が用いる装置である。聴講者装置８００には、ディスプレイ、マイク、撮像装置、及び１以上のスピーカが接続されている。聴講者装置８００は、ディスプレイ、マイク、撮像装置、及び１以上のスピーカのうちの少なくとも１つを有してもよい。当該ディスプレイ、当該マイク、当該撮像装置、及び当該１以上のスピーカは、聴講者側のディスプレイ、マイク、撮像装置、及び１以上のスピーカと呼んでもよい。

　発表者装置９００は、発表者が用いる装置である。例えば、発表者装置９００は、ＰＣである。発表者装置９００には、ディスプレイ、マイク、及び１以上のスピーカが接続されている。また、発表者装置９００は、ディスプレイ、マイク、及び１以上のスピーカのうちの少なくとも１つを有してもよい。当該ディスプレイ、当該マイク、及び当該１以上のスピーカは、発表者側のディスプレイ、マイク、及び１以上のスピーカと呼んでもよい。

　発表者は、発表者装置９００のディスプレイに表示された画面を見ながら、プレゼンテーションなどを行う。実施の形態１と同じように、当該画面は、聴講者側のディスプレイにも表示されている。

　次に、聴講者装置８００が有する機能を説明する。
　図２０は、実施の形態３の聴講者装置が有する機能のブロック図である。聴講者装置８００は、記憶部８１０、取得部８２０、解析制御部８３０、生成部８４０、及び提供制御部８５０を有する。

　記憶部８１０は、聴講者装置８００が有する揮発性記憶装置又は不揮発性記憶装置に確保した記憶領域として実現してもよい。
　取得部８２０、解析制御部８３０、生成部８４０、及び提供制御部８５０の一部又は全部は、聴講者装置８００が有する処理回路によって実現してもよい。また、取得部８２０、解析制御部８３０、生成部８４０、及び提供制御部８５０の一部又は全部は、聴講者装置８００が有するプロセッサが実行するプログラムのモジュールとして実現してもよい。例えば、当該プロセッサが実行するプログラムは、制御プログラムとも言う。例えば、制御プログラムは、記録媒体に記録されている。

　記憶部８１０は、様々な情報を記憶する。例えば、記憶部８１０は、管理テーブル１１１を記憶する。
　取得部８２０は、聴講者が理解していないことを示す情報を取得する。当該情報は、聴講者が発表者の説明を理解していないことを示す情報と表現してもよい。また、例えば、当該情報は、聴講者からの詳細な説明の要求、又は聴講者からの質問である。

　解析制御部８３０の機能は、後で説明する。
　生成部８４０は、聴講者が理解していないことを示す情報が取得された場合、発表者への出力情報を生成する。
　提供制御部８５０は、出力情報が発表者に提供されるように、制御を行う。言い換えれば、提供制御部８５０は、出力情報が発表者に提供されるための制御を行う。

　次に、通信システムで実行される処理を、シーケンス図を用いて、説明する。
　図２１は、実施の形態３の通信システムで実行される処理の例を示すシーケンス図である。上述したように、聴講者装置８００は、発表者装置１００と同様の処理を行う。そのため、詳細な説明は、省略する。
　（ステップＳＴ１５１）取得部８２０は、文字情報を取得する。例えば、文字情報は、聴講者のキーボード操作により、入力された文字である。

　（ステップＳＴ１５２）解析制御部８３０は、文字情報を解析する。
　（ステップＳＴ１５３）解析制御部８３０は、解析の結果が、詳細な説明の要求又は質問であるか否かを判定する。解析の結果が、詳細な説明の要求又は質問であるものとする。

　（ステップＳＴ１５４）取得部８２０は、管理テーブル１１１を取得する。例えば、取得部８２０は、管理テーブル１１１を記憶部８１０から取得する。また、例えば、取得部８２０は、管理テーブル１１１を外部装置から取得する。生成部８４０は、管理テーブル１１１と文字情報とに基づいて、アバタ３０２の個性に応じた文章を生成する。
　（ステップＳＴ１５５）生成部８４０は、生成された文章に基づいて、音情報を生成する。

　（ステップＳＴ１５６）生成部８４０は、アバタ３０２を含む画面を生成する。
　（ステップＳＴ１５７）提供制御部８５０は、出力情報として、生成された音情報に基づく音と、生成された画面とが、発表者に提供されるように、制御を行う。例えば、提供制御部８５０は、当該音情報と当該画面を発表者装置９００に送信する。提供制御部８５０は、当該音情報に基づく音の出力指示と当該画面の表示指示を発表者装置９００に送信する。

　（ステップＳＴ１５８）発表者装置９００は、当該音情報に基づく音が１以上のスピーカから出力されるための制御を行う。また、発表者装置９００は、当該画面がディスプレイに表示されるための制御を行う。
　これにより、発表者は、アバタ３０２が発話する音を聞くことができる。

　実施の形態３によれば、発表者は、アバタ３０２が発話する音を聞く。そのため、発表者は、聴講者の反応に気付く。よって、聴講者装置８００は、当該音が発表者に提供されるための制御を行うことで、聴講者の反応を発表者に気付かせることができる。

　また、発表者装置９００は、文章を発表者に提供してもよい。詳細に処理を説明する。生成部８４０は、文字情報に基づいて文章を生成する。なお、当該文章は、アバタ３０２の個性に応じた文章ではない。すなわち、当該文章は、一般的な文章（例えば、丁寧な文章）である。提供制御部８５０は、出力情報として当該文章が、発表者に提供されるように、制御を行う。例えば、提供制御部８５０は、当該文章と、当該文章の表示指示を発表者装置９００に送信する。発表者装置９００は、当該文章が発表者側のディスプレイに表示されるための制御を行う。これにより、当該文章が、発表者に提供される。

　また、生成部８４０は、当該文章（例えば、丁寧な文章）に基づいて、音情報を生成してもよい。提供制御部８５０は、生成された音情報に基づく音が発表者に提供されるように、制御を行ってもよい。

　さらに、生成部８４０は、当該文章（例えば、丁寧な文章）に基づいて、音情報を生成し、アバタ３０２を含む画面を生成してもよい。提供制御部８５０は、生成された音情報に基づく音と当該画面が発表者に提供されるように、制御を行ってもよい。

　提供制御部８５０は、次の処理を実行してもよい。提供制御部８５０は、生成された画面が発表者側のディスプレイに表示されるように、制御を行う。提供制御部１５０は、当該画面の中のアバタ３０２の位置に音像が形成されるように、制御を行う。例えば、提供制御部８５０は、音像の形成指示を発表者装置９００に送信する。発表者装置９００は、アバタ３０２の位置に音像が複数のスピーカによって形成されるための制御を行う。これにより、アバタ３０２の位置に音像が形成される。

　また、提供制御部８５０は、生成された音情報に基づく音と、生成された画面とが、聴講者に提供されるように、制御を行ってもよい。これにより、聴講者は、アバタ３０２が発話する音を聞くことができる。

　さらに、提供制御部８５０は、聴講者側のディスプレイに表示される画面の中のアバタ３０２の位置に音像が形成されるように、制御を行ってもよい。これにより、アバタ３０２の位置に音像が形成される。

　生成部８４０は、画面に表示されるアバタの数を変更してもよい。詳細には、生成部８４０は、発表者の発表中に、画面に表示されるアバタの数を変更してもよい。例えば、アバタ３０２が発話する場合、生成部８４０は、アバタ３０２のみが表示されている画面を生成する。すなわち、アバタ３０１は、画面に表示されない。これにより、発表者は、どのアバタを注目して話を聞いたらよいのか分かる。

実施の形態３の変形例１．
　実施の形態３の変形例１では、実施の形態１の変形例１と同様の処理を聴講者装置８００が実行する。そのため、詳細な説明は、省略する。
　図２２は、実施の形態３の変形例１の通信システムで実行される処理の例を示すシーケンス図である。
　（ステップＳＴ１６１）取得部８２０は、聴講者側のマイクから音声信号を取得する。なお、音声信号は、聴講者の音声の信号である。
　また、提供制御部８５０は、当該音声信号に基づく音が発表者側のスピーカから出力されるための制御を行う。さらに、提供制御部８５０は、当該音声信号に基づく発話内容が、チャットの内容として、発表者側のディスプレイに表示されるための制御を行ってもよい。
　（ステップＳＴ１６２）解析制御部８３０は、音声信号に基づいて、聴講者の発話内容を検出する。

　（ステップＳＴ１６３）解析制御部８３０は、発話内容を解析する。
　（ステップＳＴ１６４）解析制御部８３０は、解析の結果が、詳細な説明の要求又は質問であるか否かを判定する。解析の結果が、詳細な説明の要求又は質問であるものとする。

　（ステップＳＴ１６５）取得部８２０は、管理テーブル１１１を記憶部８１０から取得する。生成部８４０は、管理テーブル１１１と発話内容である文字情報とに基づいて、アバタ３０２の個性に応じた文章を生成する。
　（ステップＳＴ１６６）生成部８４０は、生成された文章に基づいて、音情報を生成する。

　（ステップＳＴ１６７）生成部８４０は、アバタ３０２を含む画面を生成する。
　（ステップＳＴ１６８）提供制御部８５０は、出力情報として、生成された音情報に基づく音と、生成された画面とが、発表者に提供されるように、制御を行う。例えば、提供制御部８５０は、当該音情報と当該画面を発表者装置９００に送信する。提供制御部８５０は、当該音情報に基づく音の出力指示と当該画面の表示指示を発表者装置９００に送信する。

　（ステップＳＴ１６９）発表者装置９００は、当該音情報に基づく音が１以上のスピーカから出力されるための制御を行う。また、発表者装置９００は、当該画面がディスプレイに表示されるための制御を行う。
　これにより、発表者は、アバタ３０２が発話する音を聞くことができる。

　実施の形態３の変形例１によれば、聴講者装置８００は、聴講者の反応を発表者に気付かせることができる。
　また、提供制御部８５０は、生成された音情報に基づく音と、生成された画面とが、聴講者に提供されるための制御を行ってもよい。

実施の形態３の変形例２．
　実施の形態３の変形例２では、実施の形態１の変形例２と同様の処理を聴講者装置８００が実行する。そのため、詳細な説明は、省略する。
　図２３は、実施の形態３の変形例２の通信システムで実行される処理の例を示すシーケンス図である。
　（ステップＳＴ１７１）発表者装置９００は、音声信号を聴講者装置８００に送信する。なお、音声信号は、発表者の音声の信号である。
　これにより、音声信号は、取得部８２０に取得される。また、取得部８２０は、外部装置を介して、音声信号を取得してもよい。

　（ステップＳＴ１７２）解析制御部８３０は、音声信号に基づいて、発表者の発話内容を検出する。解析制御部８３０は、発話内容を記憶部８１０に格納する。
　（ステップＳＴ１７３）取得部８２０は、ボタン情報を取得する。取得処理を説明する。聴講者側のディスプレイには、ボタンが表示されている。当該ボタンは、聴講者が発表者の説明を理解できない場合に押下される。例えば、聴講者は、発表者の説明を理解できない場合、マウスを用いて、当該ボタンを押下する。聴講者装置８００は、当該ボタンが押下された場合、ボタン情報を生成する。取得部８２０は、生成されたボタン情報を取得する。

　（ステップＳＴ１７４）取得部８２０は、管理テーブル１１１を記憶部８１０から取得する。生成部８４０は、管理テーブル１１１と発話内容である文字情報とに基づいて、アバタ３０２の個性に応じた文章を生成する。
　（ステップＳＴ１７５）生成部８４０は、生成された文章に基づいて、音情報を生成する。

　（ステップＳＴ１７６）生成部８４０は、アバタ３０２を含む画面を生成する。
　（ステップＳＴ１７７）提供制御部８５０は、出力情報として、生成された音情報に基づく音と、生成された画面とが、発表者に提供されるように、制御を行う。例えば、提供制御部８５０は、当該音情報と当該画面を発表者装置９００に送信する。提供制御部８５０は、当該音情報に基づく音の出力指示と当該画面の表示指示を発表者装置９００に送信する。

　（ステップＳＴ１７８）発表者装置９００は、当該音情報に基づく音が１以上のスピーカから出力されるための制御を行う。また、発表者装置９００は、当該画面がディスプレイに表示されるための制御を行う。
　これにより、発表者は、アバタ３０２が発話する音を聞くことができる。

　実施の形態３の変形例２によれば、聴講者装置８００は、聴講者の反応を発表者に気付かせることができる。
　また、提供制御部８５０は、生成された音情報に基づく音と、生成された画面とが、聴講者に提供されるための制御を行ってもよい。

実施の形態３の変形例３．
　実施の形態３の変形例３では、実施の形態１の変形例３と同様の処理を聴講者装置８００が実行する。そのため、詳細な説明は、省略する。
　図２４は、実施の形態３の変形例３の通信システムで実行される処理の例を示すシーケンス図である。
　（ステップＳＴ１８１）発表者装置９００は、音声信号を聴講者装置８００に送信する。なお、音声信号は、発表者の音声の信号である。
　これにより、音声信号は、取得部８２０に取得される。また、取得部８２０は、外部装置を介して、音声信号を取得してもよい。

　（ステップＳＴ１８２）解析制御部８３０は、音声信号に基づいて、発表者の発話内容を検出する。解析制御部８３０は、発話内容を記憶部８１０に格納する。
　（ステップＳＴ１８３）取得部８２０は、聴講者の目を含む画像を、聴講者側の撮像装置から取得する。
　（ステップＳＴ１８４）解析制御部８３０は、当該画像に基づいて、聴講者の視線を解析する。

　（ステップＳＴ１８５）解析制御部８３０は、解析の結果に基づいて、聴講者が理解しているか否かを判定する。例えば、解析の結果が、聴講者の視線が上方向であることを示している場合、解析制御部８３０は、聴講者が理解していないと判定する。解析の結果が、聴講者が理解していないことを示しているものとする。

　（ステップＳＴ１８６）取得部８２０は、管理テーブル１１１を記憶部８１０から取得する。生成部８４０は、管理テーブル１１１と発話内容である文字情報とに基づいて、アバタ３０２の個性に応じた文章を生成する。
　（ステップＳＴ１８７）生成部８４０は、生成された文章に基づいて、音情報を生成する。

　（ステップＳＴ１８８）生成部８４０は、アバタ３０２を含む画面を生成する。
　（ステップＳＴ１８９）提供制御部８５０は、出力情報として、生成された音情報に基づく音と、生成された画面とが、発表者に提供されるように、制御を行う。例えば、提供制御部８５０は、当該音情報と当該画面を発表者装置９００に送信する。提供制御部８５０は、当該音情報に基づく音の出力指示と当該画面の表示指示を発表者装置９００に送信する。

　（ステップＳＴ１９０）発表者装置９００は、当該音情報に基づく音が１以上のスピーカから出力されるための制御を行う。また、発表者装置９００は、当該画面がディスプレイに表示されるための制御を行う。
　これにより、発表者は、アバタ３０２が発話する音を聞くことができる。

　実施の形態３の変形例３によれば、聴講者装置８００は、聴講者の反応を発表者に気付かせることができる。
　また、提供制御部８５０は、生成された音情報に基づく音と、生成された画面とが、聴講者に提供されるための制御を行ってもよい。

実施の形態３の変形例４．
　実施の形態３の変形例４では、実施の形態１の変形例４と同様の処理を聴講者装置８００が実行する。そのため、詳細な説明は、省略する。
　図２５は、実施の形態３の変形例４の通信システムで実行される処理の例を示すシーケンス図である。
　（ステップＳＴ１９１）発表者装置９００は、音声信号を聴講者装置８００に送信する。なお、音声信号は、発表者の音声の信号である。
　これにより、音声信号は、取得部８２０に取得される。また、取得部８２０は、外部装置を介して、音声信号を取得してもよい。

　（ステップＳＴ１９２）解析制御部８３０は、音声信号に基づいて、発表者の発話内容を検出する。解析制御部８３０は、発話内容を記憶部８１０に格納する。
　（ステップＳＴ１９３）取得部８２０は、聴講者の顔を含む画像を、聴講者側の撮像装置から取得する。
　（ステップＳＴ１９４）解析制御部８３０は、当該画像に基づいて、聴講者の表情を解析する。

　（ステップＳＴ１９５）解析制御部８３０は、解析の結果に基づいて、聴講者が理解しているか否かを判定する。例えば、解析の結果が、聴講者の表情が理解していないときの表情であることを示している場合、解析制御部８３０は、聴講者が理解していないと判定する。解析の結果が、聴講者が理解していないことを示しているものとする。

　（ステップＳＴ１９６）取得部８２０は、管理テーブル１１１を記憶部８１０から取得する。生成部８４０は、管理テーブル１１１と発話内容である文字情報とに基づいて、アバタ３０２の個性に応じた文章を生成する。
　（ステップＳＴ１９７）生成部８４０は、生成された文章に基づいて、音情報を生成する。

　（ステップＳＴ１９８）生成部８４０は、アバタ３０２を含む画面を生成する。
　（ステップＳＴ１９９）提供制御部８５０は、出力情報として、生成された音情報に基づく音と、生成された画面とが、発表者に提供されるように、制御を行う。例えば、提供制御部８５０は、当該音情報と当該画面を発表者装置９００に送信する。提供制御部８５０は、当該音情報に基づく音の出力指示と当該画面の表示指示を発表者装置９００に送信する。

　（ステップＳＴ２００）発表者装置９００は、当該音情報に基づく音が１以上のスピーカから出力されるための制御を行う。また、発表者装置９００は、当該画面がディスプレイに表示されるための制御を行う。
　これにより、発表者は、アバタ３０２が発話する音を聞くことができる。

　実施の形態３の変形例４によれば、聴講者装置８００は、聴講者の反応を発表者に気付かせることができる。
　また、提供制御部８５０は、生成された音情報に基づく音と、生成された画面とが、聴講者に提供されるための制御を行ってもよい。

　以上に説明した各実施の形態における特徴は、互いに適宜組み合わせることができる。

　１００　発表者装置、　１０１　プロセッサ、　１０２　揮発性記憶装置、　１０３　不揮発性記憶装置、　１１０　記憶部、　１１１　管理テーブル、　１２０　取得部、　１３０　解析制御部、　１４０　生成部、　１５０　提供制御部、　２００　聴講者装置、　３００　ディスプレイ、　３０１　アバタ、　３０２　アバタ、　３０３　範囲、　３１０　マイク、　３２０，３２１　スピーカ、　４００　ディスプレイ、　４１０　マイク、　４２０　撮像装置、　４３０　スピーカ、　５００　サーバ、　５１０　記憶部、　５２０　取得部、　５３０　解析制御部、　５４０　生成部、　５５０　提供制御部、　６００　発表者装置、　７００　聴講者装置、　８００　聴講者装置、　８１０　記憶部、　８２０　取得部、　８３０　解析制御部、　８４０　生成部、　８５０　提供制御部、　９００　発表者装置。

Claims

　聴講者が用いる聴講者装置と通信し、かつ発表者が用いる情報処理装置であって、
　前記聴講者が理解していないことを示す情報を取得する取得部と、
　当該情報が取得された場合、前記発表者への出力情報を生成する生成部と、
　前記出力情報が前記発表者に提供されるように、制御を行う提供制御部と、
　を有する情報処理装置。
　聴講者が用いる聴講者装置と通信し、かつ発表者が用いる発表者装置と通信する情報処理装置であって、
　前記聴講者が理解していないことを示す情報を取得する取得部と、
　当該情報が取得された場合、前記発表者への出力情報を生成する生成部と、
　前記出力情報が前記発表者に提供されるように、制御を行う提供制御部と、
　を有する情報処理装置。
　発表者が用いる発表者装置と通信し、かつ聴講者が用いる情報処理装置であって、
　前記聴講者が理解していないことを示す情報を取得する取得部と、
　当該情報が取得された場合、前記発表者への出力情報を生成する生成部と、
　前記出力情報が前記発表者に提供されるように、制御を行う提供制御部と、
　を有する情報処理装置。
　解析制御部をさらに有し、
　前記取得部は、文字情報を取得し、
　前記解析制御部は、前記文字情報を解析し、
　前記生成部は、前記解析の結果が、詳細な説明の要求又は質問を示している場合、前記文字情報に基づいて文章を生成し、
　前記提供制御部は、前記出力情報として前記文章が、前記発表者に提供されるように、制御を行う、
　請求項１から３のいずれか１項に記載の情報処理装置。
　解析制御部をさらに有し、
　前記取得部は、前記聴講者の音声の信号である音声信号を取得し、
　前記解析制御部は、前記音声信号に基づいて、前記聴講者の発話内容を検出し、前記発話内容を解析し、
　前記生成部は、前記解析の結果が、詳細な説明の要求又は質問を示している場合、検出された前記発話内容である文字情報に基づいて文章を生成し、
　前記提供制御部は、前記出力情報として前記文章が、前記発表者に提供されるように、制御を行う、
　請求項１から３のいずれか１項に記載の情報処理装置。
　解析制御部をさらに有し、
　前記取得部は、前記発表者の音声の信号である音声信号を取得し、
　前記解析制御部は、前記音声信号に基づいて、前記発表者の発話内容を検出し、
　前記取得部は、前記聴講者が理解していないことを示す前記情報を取得し、
　前記生成部は、検出された前記発話内容である文字情報に基づいて文章を生成し、
　前記提供制御部は、前記出力情報として前記文章が、前記発表者に提供されるように、制御を行う、
　請求項１から３のいずれか１項に記載の情報処理装置。
　解析制御部をさらに有し、
　前記取得部は、前記発表者の音声の信号である音声信号を取得し、
　前記解析制御部は、前記音声信号に基づいて、前記発表者の発話内容を検出し、
　前記取得部は、前記聴講者の目を含む画像を取得し、
　前記解析制御部は、前記画像が取得された場合、前記画像に基づいて、前記聴講者の視線を解析し、前記解析の結果に基づいて、前記聴講者が理解しているか否かを判定し、
　前記生成部は、前記聴講者が理解していない場合、検出された前記発話内容である文字情報に基づいて文章を生成し、
　前記提供制御部は、前記出力情報として前記文章が、前記発表者に提供されるように、制御を行う、
　請求項１から３のいずれか１項に記載の情報処理装置。
　解析制御部をさらに有し、
　前記取得部は、前記発表者の音声の信号である音声信号を取得し、
　前記解析制御部は、前記音声信号に基づいて、前記発表者の発話内容を検出し、
　前記取得部は、前記聴講者の顔を含む画像を取得し、
　前記解析制御部は、前記画像が取得された場合、前記画像に基づいて、前記聴講者の表情を解析し、前記解析の結果に基づいて、前記聴講者が理解しているか否かを判定し、
　前記生成部は、前記聴講者が理解していない場合、検出された前記発話内容である文字情報に基づいて文章を生成し、
　前記提供制御部は、前記出力情報として前記文章が、前記発表者に提供されるように、制御を行う、
　請求項１から３のいずれか１項に記載の情報処理装置。
　前記生成部は、前記文章に基づいて、音情報を生成し、
　前記提供制御部は、前記出力情報として前記音情報に基づく音が、前記発表者に提供されるように、制御を行う、
　請求項４から８のいずれか１項に記載の情報処理装置。
　前記生成部は、アバタを含む画面を生成し、
　前記提供制御部は、前記出力情報として、前記画面と前記音情報に基づく音とが、前記発表者に提供されるように、制御を行う、
　請求項９に記載の情報処理装置。
　前記生成部は、画面に表示されるアバタの数を変更する、
　請求項１０に記載の情報処理装置。
　前記取得部は、前記アバタの個性を示す管理情報を取得し、
　前記生成部は、前記管理情報と前記文字情報とに基づいて、前記アバタの個性に応じた前記文章を生成する、
　請求項１０に記載の情報処理装置。
　前記提供制御部は、前記発表者が見る表示装置に前記画面が表示されるように、制御を行い、前記表示装置に表示される前記画面の中の前記アバタの位置に音像が形成されるように、制御を行う、
　請求項１２に記載の情報処理装置。
　前記提供制御部は、前記画面と前記音情報に基づく音とが、前記聴講者に提供されるように、制御を行う、
　請求項１２に記載の情報処理装置。
　前記提供制御部は、前記聴講者が見る表示装置に表示される画面の中の前記アバタの位置に音像が形成されるように、制御を行う、
　請求項１４に記載の情報処理装置。
　聴講者が用いる聴講者装置と通信し、かつ発表者が用いる情報処理装置が、
　前記聴講者が理解していないことを示す情報を取得し、
　当該情報が取得された場合、前記発表者への出力情報を生成し、
　前記出力情報が前記発表者に提供されるように、制御を行う、
　制御方法。
　聴講者が用いる聴講者装置と通信し、かつ発表者が用いる発表者装置と通信する情報処理装置が、
　前記聴講者が理解していないことを示す情報を取得し、
　当該情報が取得された場合、前記発表者への出力情報を生成し、
　前記出力情報が前記発表者に提供されるように、制御を行う、
　制御方法。
　発表者が用いる発表者装置と通信し、かつ聴講者が用いる情報処理装置が、
　前記聴講者が理解していないことを示す情報を取得し、
　当該情報が取得された場合、前記発表者への出力情報を生成し、
　前記出力情報が前記発表者に提供されるように、制御を行う、
　制御方法。
　聴講者が用いる聴講者装置と通信し、かつ発表者が用いる情報処理装置に、
　前記聴講者が理解していないことを示す情報を取得し、
　当該情報が取得された場合、前記発表者への出力情報を生成し、
　前記出力情報が前記発表者に提供されるように、制御を行う、
　処理を実行させる制御プログラム。
　聴講者が用いる聴講者装置と通信し、かつ発表者が用いる発表者装置と通信する情報処理装置に、
　前記聴講者が理解していないことを示す情報を取得し、
　当該情報が取得された場合、前記発表者への出力情報を生成し、
　前記出力情報が前記発表者に提供されるように、制御を行う、
　処理を実行させる制御プログラム。
　発表者が用いる発表者装置と通信し、かつ聴講者が用いる情報処理装置に、
　前記聴講者が理解していないことを示す情報を取得し、
　当該情報が取得された場合、前記発表者への出力情報を生成し、
　前記出力情報が前記発表者に提供されるように、制御を行う、
　処理を実行させる制御プログラム。