WO2024062779A1

WO2024062779A1 - 情報処理装置、および情報処理システム、並びに情報処理方法

Info

Publication number: WO2024062779A1
Application number: PCT/JP2023/028226
Authority: WO
Inventors: 明香松原; 智朗詫摩; 弘就星野; 宏一郎高島
Original assignee: ソニーグループ株式会社
Priority date: 2022-09-22
Filing date: 2023-08-02
Publication date: 2024-03-28

Abstract

通信ネットワークを介して会話を実行するユーザ端末の表示部に表示する表示データを制御して、ユーザ状態や会話状態を可視化した表示データを生成する。通信ネットワークを介して会話を実行するユーザ端末からの受信データを解析し、解析結果に基づいてユーザ端末に提供するユーザ発話対応のテキストを含む発話テキスト表示領域を有する表示データの制御を実行する。表示データ制御部は、発話テキスト表示領域のサイズ、または位置、または色、または動き、または発話テキスト表示領域周囲の出力画像の少なくともいずれかを制御して、会話を実行するユーザのユーザ状態、または会話状態の少なくともいずれかの状態を可視化した表示データを生成する。

Description

情報処理装置、および情報処理システム、並びに情報処理方法

　本開示は、情報処理装置、および情報処理システム、並びに情報処理方法に関する。さらに詳細には、リモート会議等、通信ネットワークを介した会話に参加するユーザ発話のテキスト出力に加え、参加ユーザの感情や会話の盛り上がりなど、ユーザ状態や会話状態を可視化した表示データを生成してユーザに提示する情報処理装置、および情報処理システム、並びに情報処理方法に関する。

　昨今、ネットワークを介したリモート会議、リモート打ち合わせ、リモート飲み会、リモート商談等、通信端末を利用して音声、画像データを送受信して行うリモートミーティングが盛んに行われている。

　例えばネットワークを介したリモート会議では、会議参加者各々が所有するＰＣやスマホ（スマートフォン）などのユーザ端末をインターネット等の通信ネットワークで接続し、各端末間で画像や音声を送受信して会議を行う。

　また、例えば聴覚障がい者でもリモートミーティングに参加できるように、ユーザ発話をテキストに変換してユーザ端末の表示部に表示するシステムも利用されている。
　例えば特許文献１（特開２０２１－０７１６３２号公報）は、複数地点のユーザ間のコミュニケーションにおける発話を文字情報として表示するシステムを開示している。

　しかし、このような通信端末を利用したリモートミーティングでは、対面形式のミーティングと異なり、相手側の感情や状態を把握しづらいという問題がある。
　特に、聴覚障がい者の場合、ユーザ発話の内容はユーザ端末に表示されるテキストで理解できるが、発話を行ったユーザの感情等を把握することは困難である。
　また、会議全体の雰囲気、例えば盛り上がり状態などについても理解し難いという問題がある。

特開２０２１－０７１６３２号公報

　本開示は、例えば、上記問題点に鑑みてなされたものであり、通信ネットワークを介したリモート会議等の参加ユーザの状態や会話状態を可視化した表示データを生成し、生成した表示データをユーザ端末に提示する情報処理装置、および情報処理システム、並びに情報処理方法を提供することを目的とする。

　本開示の第１の側面は、
　通信ネットワークを介して会話を実行するユーザ端末からの受信データを解析するデータ解析部と、
　前記データ解析部の解析結果に基づいて、前記ユーザ端末に提供するユーザ発話対応のテキストを含む発話テキスト表示領域を有する表示データの制御を実行する表示データ制御部を有し、
　前記表示データ制御部は、
　前記発話テキスト表示領域または背景領域の少なくともいずれかの表示態様を制御して、会話を実行するユーザのユーザ状態、または会話状態の少なくともいずれかの状態を可視化した表示データを生成する情報処理装置にある。

　さらに、本開示の第２の側面は、
　通信ネットワークを介して会話を実行する複数のユーザ端末と、前記会話を管理するサーバを有する情報処理システムであり、
　前記ユーザ端末は、
　マイクを介して取得した音声データとカメラが撮影した画像データを前記サーバに送信し、
　前記サーバは、
　前記ユーザ端末から受信する音声データと画像データを解析し、
　解析結果に基づいて、前記ユーザ端末に提供するユーザ発話対応のテキストを含む発話テキスト表示領域を有する表示データの制御処理として、
　前記発話テキスト表示領域または背景領域の少なくともいずれかの表示態様を調整して、会話を実行するユーザのユーザ状態、または会話状態の少なくともいずれかの状態を可視化した表示データを生成して前記ユーザ端末に送信し、
　前記ユーザ端末は、
　前記サーバの生成した発話テキスト表示領域を含む表示データを表示部に表示する情報処理システムにある。

　さらに、本開示の第３の側面は、
　情報処理装置において実行する情報処理方法であり、
　データ解析部が、通信ネットワークを介して会話を実行するユーザ端末からの受信データを解析するデータ解析ステップと、
　表示データ制御部が、前記データ解析ステップにおける解析結果に基づいて、前記ユーザ端末に提供するユーザ発話対応のテキストを含む発話テキスト表示領域を有する表示データの制御を実行する表示データ制御ステップを有し、
　前記表示データ制御ステップは、
　前記発話テキスト表示領域または背景領域の少なくともいずれかの表示態様を制御して、会話を実行するユーザのユーザ状態、または会話状態の少なくともいずれかの状態を可視化した表示データを生成するステップである情報処理方法にある。

　本開示のさらに他の目的、特徴や利点は、後述する本開示の実施例や添付する図面に基づくより詳細な説明によって明らかになるであろう。なお、本明細書においてシステムとは、複数の装置の論理的集合構成であり、各構成の装置が同一筐体内にあるものには限らない。

　本開示の一実施例の構成によれば、通信ネットワークを介して会話を実行するユーザ端末の表示部に表示する表示データを制御して、ユーザ状態や会話状態を可視化した表示データを生成する構成が実現される。
　具体的には、例えば、通信ネットワークを介して会話を実行するユーザ端末からの受信データを解析し、解析結果に基づいてユーザ端末に提供するユーザ発話対応のテキストを含む発話テキスト表示領域を有する表示データの制御を実行する。表示データ制御部は、発話テキスト表示領域のサイズ、または位置、または色、または動き、または発話テキスト表示領域周囲の出力画像の少なくともいずれかを制御して、会話を実行するユーザのユーザ状態、または会話状態の少なくともいずれかの状態を可視化した表示データを生成する。
　本構成により、通信ネットワークを介して会話を実行するユーザ端末の表示部に表示する表示データを制御して、ユーザ状態や会話状態を可視化した表示データを生成する構成が実現される。
　なお、本明細書に記載された効果はあくまで例示であって限定されるものではなく、また付加的な効果があってもよい。

本開示の情報処理システムの構成と実行する処理の概要について説明する図である。情報処理装置（サーバ）が生成する表示データの概要について説明する図である。情報処理装置（サーバ）が生成する表示データの概要について説明する図である。情報処理装置（サーバ）がユーザ端末各々から受信するデータの例について説明する図である。情報処理装置（サーバ）の構成例について説明する図である。情報処理装置（サーバ）が生成する表示データの基本的な構成要素である発話テキスト表示円の詳細構成について説明する図である。情報処理装置（サーバ）が実行する表示データ制御処理の具体例について説明する図である。情報処理装置（サーバ）が実行する表示データ制御処理の具体例について説明する図である。情報処理装置（サーバ）が実行する表示データ制御処理の具体例について説明する図である。情報処理装置（サーバ）が実行する表示データ制御処理の具体例について説明する図である。情報処理装置（サーバ）が実行する表示データ制御処理の具体例について説明する図である。情報処理装置（サーバ）が実行する表示データ制御処理の具体例について説明する図である。情報処理装置（サーバ）が実行する表示データ制御処理の具体例について説明する図である。情報処理装置（サーバ）が実行する表示データ制御処理の具体例について説明する図である。情報処理装置（サーバ）が実行する表示データ制御処理の具体例について説明する図である。情報処理装置（サーバ）が実行する表示データ制御処理の具体例について説明する図である。情報処理装置（サーバ）が実行する表示データ制御処理の具体例について説明する図である。情報処理装置（サーバ）が実行する表示データ制御処理の具体例について説明する図である。情報処理装置（サーバ）が実行する表示データ制御処理の具体例について説明する図である。情報処理装置（サーバ）が実行する表示データ制御処理の具体例について説明する図である。情報処理装置（サーバ）が実行する表示データ制御処理の具体例について説明する図である。情報処理装置（サーバ）が実行する表示データ制御処理の具体例について説明する図である。情報処理装置（サーバ）が実行する表示データ制御処理の具体例について説明する図である。情報処理装置（サーバ）が実行する表示データ制御処理の具体例について説明する図である。情報処理装置（サーバ）が実行する表示データ制御処理の具体例について説明する図である。情報処理装置（サーバ）が実行する表示データ制御処理の具体例について説明する図である。情報処理装置（サーバ）が実行する表示データ制御処理の具体例について説明する図である。情報処理装置（サーバ）が実行する表示データ制御処理の具体例について説明する図である。情報処理装置（サーバ）が実行する表示データ制御処理の具体例について説明する図である。情報処理装置（サーバ）が実行する表示データ制御処理の具体例について説明する図である。情報処理装置（サーバ）が実行する表示データ制御処理の具体例について説明する図である。情報処理装置（サーバ）が実行する表示データ制御処理の具体例について説明する図である。情報処理装置（サーバ）が実行する表示データ制御処理の具体例について説明する図である。情報処理装置（サーバ）が実行する表示データ制御処理の具体例について説明する図である。情報処理装置（サーバ）が実行する表示データ制御処理の具体例について説明する図である。情報処理装置（サーバ）が実行する表示データ制御処理の具体例について説明する図である。情報処理装置（サーバ）が実行する表示データ制御処理の具体例について説明する図である。ユーザによるユーザ端末を利用した表示データの制御処理例について説明する図である。ユーザによるユーザ端末を利用した表示データの制御処理例について説明する図である。ユーザによるユーザ端末を利用した表示データの制御処理例について説明する図である。ユーザによるユーザ端末を利用した表示データの制御処理例について説明する図である。情報処理装置（サーバ）がユーザ端末各々から受信するデータの例について説明する図である。情報処理装置（サーバ）の構成例について説明する図である。ユーザ端末の構成例について説明する図である。情報処理装置、ユーザ端末のハードウェア構成例について説明する図である。

　以下、図面を参照しながら本開示の情報処理装置、および情報処理システム、並びに情報処理方法の詳細について説明する。なお、説明は以下の項目に従って行なう。
　１．本開示の情報処理システムの構成と実行する処理の概要について
　２．情報処理装置（サーバ）が実行する処理と、情報処理装置（サーバ）の構成例について
　３．情報処理装置（サーバ）が実行する表示データ制御処理の具体例について
　４．ユーザ端末における表示データ制御処理について
　５．ユーザの生体情報等を利用した表示制御を実行する実施例について
　６．ユーザ端末の構成例について
　７．情報処理装置、およびユーザ端末のハードウェア構成例について
　８．本開示の構成のまとめ

　　［１．本開示の情報処理システムの構成と実行する処理の概要について］
　まず、図１以下を参照して本開示の情報処理システムの構成と実行する処理の概要について説明する。

　図１は、リモート会議やリモート打ち合わせ等のリモートミーティング、すなわち通信ネットワークを介した会話を実行する情報処理システムの構成例を示す図である。
　図１には、通信ネットワークを介した会話の参加ユーザであるユーザａ，１１ａ～ユーザｅ，１１ｅと各ユーザが利用するユーザ端末ａ，２１ａ～ユーザ端末ｅ，２１ｅと、リモートミーティング実行環境を提供するサーバである情報処理装置（サーバ）５０を示している。

　ユーザ端末ａ，２１ａ～ユーザ端末ｅ，２１ｅと情報処理装置（サーバ）５０は通信ネットワーク３０を介して接続され、通信端末間で音声、画像を相互に送受信してリモートミーティングが行われる。

　ユーザ端末２１ａ～２１ｅは、例えばＰＣ、スマホ（スマートフォン）、タブレット端末等の通信可能な情報処理装置によって構成される。
　これらユーザ端末２１ａ～ｅの各々は、マイクとカメラを有しており、ユーザ端末２１のマイクが取得したユーザ発話等の音声データと、カメラが撮影した各ユーザの顔画像等の画像データは情報処理装置（サーバ）５０に送信される。

　情報処理装置（サーバ）５０は、ユーザ端末２１ａ～ｅ各々から受信する音声データと画像データを利用して、ユーザ発話対応のテキストデータを生成し、さらに、ユーザ状態やミーティングの状態などを可視化した表示データを生成する。

　ユーザ端末２１ａ～ｅ各々は、情報処理装置（サーバ）５０を介して各ユーザの発話音声を受信してスピーカーから出力する。さらに、情報処理装置（サーバ）５０が生成した表示データは各ユーザ端末に提供され、ユーザ端末の表示部に表示される。

　ユーザ１１ａ～１１ｅは、ユーザ端末２１ａ～ｅの表示部に表示される表示データを見ることで、ミーティング参加者の発話をテキスト情報として確認することが可能となり、さらにユーザ状態や会話状態についても把握することができる。

　例えば発話音声を聞き取りにくい、あるいは聞くことができない聴覚障がい者も情報処理装置（サーバ）５０が生成した表示データを見ることで、発話をテキスト情報として確認でき、さらにユーザ状態や会話状態も把握することができる。

　図２、図３を参照して情報処理装置（サーバ）５０が生成する表示データの概要について説明する。

　図２に示す表示データは、リモートミーティング参加ユーザの１人であるユーザａ，１１ａが利用するユーザ端末ａ，２１ａの表示部に表示される表示データの例である。その他のリモートミーティング参加ユーザのユーザ端末にも同様の表示データが表示される。
　この表示データは、情報処理装置（サーバ）５０が生成する表示データである。

　図２に示すように、表示データは、ミーティング参加ユーザの発話をテキスト化して表示した発話テキスト表示円７１の時系列データによって構成される。発話テキスト表示円７１は、表示部の左下から右上に向かって移動する。
　すなわち、最新のユーザ発話に対応する発話テキスト表示円が画面左下に表示され、その表示円が時間経過とともに画面の右上方向に移動する。発話テキスト表示円が表示部の右上に達すると、その後、その発話テキスト表示円は、表示部の右上から、順次、消えていく。

　なお、図に示す点線矢印は、発話テキスト表示円７１の流れ（移動方向）を示す矢印であり、実際の画面上には表示されない。

　図に示す例では、発話テキスト表示円７１－１が過去の最も古いユーザ発話に対応する発話テキスト表示円であり、その後の時間経過に伴う発話対応の発話テキスト表示円が、発話テキスト表示円７１－２～７１－６となる。
　図に示す例では、発話テキスト表示円７１－６が最も新しいユーザ発話対応の発話テキスト表示円である。

　このように、図に示す複数の発話テキスト表示円７１－１～７１－６は、時系列のユーザ発話を右上から左下に並べて示した発話テキスト表示円であるる
　具体的には、リモートミーティングにおいて、以下のユーザ発話が、順次、実行されたことを示している。
　ユーザ発話＝いいレストランないかな
　ユーザ発話＝この前行ったミラノダイニングおいしかったよ
　ユーザ発話＝私も行ったことある
　ユーザ発話＝なんのお店
　ユーザ発話＝イタリアン
　ユーザ発話＝この前行った居酒屋もよかったよ

　図に示すように、発話テキスト表示円７１－２～７１－６は、ユーザ発話対応のテキストと発話ユーザの顔画像を含むデータとして生成され、表示される。
　また、発話テキスト表示円７１－２～７１－６は、円のサイズ（大きさ）や、円の色等が異なる設定となっている。なお、図では白黒画として示しているが、実際の表示データでは、発話テキスト表示円７１－２～７１－６は様々な色に設定される。

　これら、発話テキスト表示円７１のサイズや色は、情報処理装置（サーバ）５０が、各ユーザ発話の発話音量（声の大きさ）や、発話内容の解析結果に基づいて決定する。
　情報処理装置（サーバ）５０が実行するこれらの表示データ制御処理については、後段で詳細に説明する。

　図３は、図２と同様、ユーザａ，１１ａが利用するユーザ端末ａ，２１ａの表示部に表示される表示データの例であるが、図２に示す表示データの表示後、一定時間経過した後の表示データの例である。

　図２に示す表示部の画面左下に示す最新の発話テキスト表示円７１－６（ユーザ発話＝この前行った居酒屋もよかったよ）が、図３に示す表示データでは、画面右上に移動している。

　図３に示す表示データは、発話テキスト表示円７１－６に示す、
　ユーザ発話＝この前行った居酒屋もよかったよ
　このユーザ発話の後に発話されたユーザ発話に対応する発話テキスト表示円７１－７～１１を示している。

　具体的には、リモートミーティングにおいて、
　ユーザ発話＝この前行った居酒屋もよかったよ
　このユーザ発話の後に、以下のユーザ発話が、順次、実行されたことを示している。
　ユーザ発話＝どこのお店
　ユーザ発話＝六本木の駅からすぐのところ
　ユーザ発話＝和食系？
　ユーザ発話＝さわがしいところは苦手だな～
　ユーザ発話＝静かなフレンチがいいね

　図３に示す発話テキスト表示円７１－６～７１－１１も、ユーザ発話対応のテキストと発話ユーザの顔画像を含むデータである。これらも円のサイズ（大きさ）や、円の色等が異なる設定である。

　前述したように、発話テキスト表示円７１のサイズや色は、情報処理装置（サーバ）５０が、各ユーザ発話の発話音量（声の大きさ）や、発話内容の解析結果に基づいて決定する。これらの処理については後段で詳細に説明する。

　　［２．情報処理装置（サーバ）が実行する処理と、情報処理装置（サーバ）の構成例について］
　次に、情報処理装置（サーバ）５０が実行する処理と、情報処理装置（サーバ）の構成例について説明する。

　前述したように、情報処理装置（サーバ）５０は、リモートミーティングを実行中のユーザが利用するユーザ端末２１各々から音声データと画像データを受信して、ユーザ発話対応のテキストデータを生成し、さらに、ユーザ状態やミーティングの状態などを可視化した表示データを生成する。

　図４を参照して、情報処理装置（サーバ）５０がユーザ端末２１各々から受信するデータの例について説明する。

　図４には、リモートミーティングを実行中の複数のユーザ１１ａ～ｅ各々が利用するユーザ端末２１ａ～ｅと、情報処理装置（サーバ）５０を示している。
　図４に示すように、情報処理装置（サーバ）５０は、リモートミーティングを実行中の複数のユーザ１１ａ～ｅ各々が利用するユーザ端末２１ａ～ｅ各々から音声データと画像データを受信する。

　図４に示すように、情報処理装置（サーバ）５０は、ステップＳ１１～ステップＳ１２の各処理を実行する。

　すなわち、ステップＳ１１において、ユーザ端末２１ａ～ｅから受信する入力データ（音声データ、画像データ）に対する解析処理を実行する。
　次に、ステップＳ１２において、ステップＳ１１のデータ解析結果を用いて表示データを生成する。
　具体的には、図２、図３を参照して説明した発話テキスト表示円７１の時系列データによって構成される表示データを生成する。

　情報処理装置（サーバ）５０が生成する表示データは、リモートミーティング参加ユーザの発話内容をテキスト表示した発話テキスト表示円７１の時系列データによって構成され、例えば、発話テキスト表示円の大きさや色や動きによって、発話ユーザの状態や、ミーティングの状態（盛り上がり度など）を視覚的に理解可能とした表示データである。

　情報処理装置（サーバ）５０の構成例について図５を参照して説明する。
　図５に示すように、情報処理装置（サーバ）５０は、通信部５１、音声データ取得部５２、音声データ解析部５３、画像データ取得部５４、画像データ解析部５５、表示データ制御部５６、表示データ生成部５７を有する。

　通信部５１は、リモートミーティングを実行中のユーザ端末２１から音声データと画像データを受信する。
　受信する音声データは、ユーザ端末２１のマイクが取得した音声データであり、ユーザ発話音声や、笑い声、手をたたく音、環境音などが含まれる音声データである。
　また画像データは、ユーザ端末２１のカメラが取得した画像データであり、ユーザの顔画像が含まれる画像データである。

　なお、通信部５１は、さらに、音声データ取得部５２が取得したユーザ発話等の音声データと、表示データ生成部５７が生成した表示データを、リモートミーティングを実行中のユーザ端末２１各々に送信する。
　各ユーザ端末２１は、情報処理装置（サーバ）５０から受信するユーザ発話等の音声をユーザ端末２１のスピーカーや、ユーザ端末に装着したヘッドホンを介して出力し、情報処理装置（サーバ）５０から受信する画像データをユーザ端末２１の表示部に表示する。

　音声データ取得部５２は、通信部５１が受信したデータから音声データを選択取得して音声データ解析部５３に入力する。

　音声データ解析部５３は、音声データ取得部５２から入力した音声データの解析処理を実行する。
　解析対象とする音声データは、ユーザ端末２１のマイクが取得した音声データであり、前述したようにユーザ発話音声や、笑い声、手をたたく音、環境音などが含まれる音声データである。
　音声データ解析部５３における音声解析結果は表示データ制御部５６に入力される。

　音声データ解析部５３は、音声データ中のユーザ発話の音量解析処理、トーン（声色）解析処理、音声認識処理、意味解析処理等を実行する。さらに、笑い声や唸り声、さらに拍手など発話以外の音声解析処理も実行する。

　音量解析処理は、ユーザ発話各々についての音量、すなわち声の大きさを算出する処理である。算出した各ユーザ発話の声の大きさは表示データ制御部５６に入力される。

　トーン（声色）解析処理は、ユーザ発話各々のトーン（声色）を解析する処理であり、具体的には例えば各ユーザ発話が明るいトーンで実行されたか、あるいは暗いトーンで実行されたかといった解析処理である。解析結果は表示データ制御部５６に入力される。

　音声認識処理は、ユーザ発話のテキスト変換処理である。音声データ解析部５３は、例えばＡＳＲ（Ａｕｔｏｍａｔｉｃ　Ｓｐｅｅｃｈ　Ｒｅｃｏｇｎｉｔｉｏｎ）機能を有し、音声データを複数の単語から構成されるテキストデータに変換する。生成したユーザ発話対応のテキストデータは、表示データ制御部５６に入力される。

　意味解析処理は、音声認識処理によって生成したテキストデータに対する発話意味解析処理や構文解析処理などである。音声データ解析部５３は、例えば、ＮＬＵ（Ｎａｔｕｒａｌ　Ｌａｎｇｕａｇｅ　Ｕｎｄｅｒｓｔａｎｄｉｎｇ）等の自然言語理解機能を有し、テキストデータからユーザ発話の意図（インテント：Ｉｎｔｅｎｔ）や、発話に含まれる意味のある要素（有意要素）である実体情報（エンティティ：Ｅｎｔｉｔｙ）の推定処理などを実行し、ユーザ発話に含まれるキーワード抽出処理を実行する。
　さらに、時系列の複数発話から、中心的発話や支配的発話を選択する処理も実行する。
　これらの解析結果も表示データ制御部５６に入力される。

　画像データ取得部５４は、通信部５１が受信したデータから画像データを選択取得して画像データ解析部５５に入力する。

　画像データ解析部５５は、画像データ取得部５４から入力した画像データの解析処理を実行する。
　画像データ解析部５５における画像解析結果は表示データ制御部５６に入力される。

　画像データ解析部５５が解析対象とする画像データは、ユーザ端末２１のカメラが取得した画像データであり、ミーティング参加ユーザの顔画像を含む画像データである。

　画像データ解析部５５は、例えばユーザの顔画像の解析により顔の表情を判定する。例えば笑っているか、困っているか、怒っているか、悲しんでいるか等、ユーザの顔の表情がどのような表情であるかを解析する。

　さらに、例えば笑い顔やうなずくような肯定的なアクションを行っているか、困った顔や悲しい顔、さらに顔を横に振るような否定的なアクションを行っているか等のユーザアクションの解析処理等を実行する。
　さらに、手を振るアクションなど、顔以外の体の動きについても解析する。
　これら、画像データ解析部５５における画像解析結果は表示データ制御部５６に入力される。

　表示データ制御部５６は、音声データ解析部５３が解析した音声データ解析結果と、画像データ解析部５５が解析した画像データ解析結果を入力し、これらの入力データに基づいて、ユーザ端末２１に提供する画像データ、すなわち先に図２、図３を参照して説明したリモートミーティングの発話テキストを含む発話テキスト表示円の時系列表示データの制御処理を実行する。

　表示データ制御部５６は、例えばユーザの声の大きさに応じて発話テキスト表示円のサイズを決定する処理、ユーザの声のトーンに応じて発話テキスト表示円の色を決定する処理、ユーザ発話がどの先行発話に対してなされたかの解析結果に応じて発話テキスト表示円の表示位置や動きを決定する処理などを実行する。

　このように、表示データ制御部５６は、リモートミーティングの参加ユーザの感情や状態、さらにミーティング全体の盛り上がり度などの雰囲気などを可視化した表示データを生成するための表示データ制御処理、すなわち表示データを構成する発話テキスト表示円のサイズ、色、動き、その他のエフェクト表示態様等の決定処理、背景の色などの決定処理など、様々な表示データ制御処理を実行する。
　この表示データ制御処理の具体例については、次の項目において詳細に説明する。

　表示データ制御部５６の制御情報は、表示データ生成部５７に入力される。
　表示データ生成部５７は、表示データ制御部５６が決定した発話テキスト表示円のサイズ、色、動き、背景画像の態様に従った表示データを生成する。
　表示データ生成部５７が生成した表示データは、例えば先に図２や図３に示す表示データであり、この表示データが各ユーザ端末２１に提供され、ユーザ端末２１の表示部に表示されることになる。

　　［３．情報処理装置（サーバ）が実行する表示データ制御処理の具体例について］
　次に、情報処理装置（サーバ）が実行する表示データ制御処理の具体例について説明する。

　図４を参照して説明したように、情報処理装置（サーバ）５０は、リモートミーティングを実行中の複数のユーザ１１ａ～ｅ各々が利用するユーザ端末２１ａ～ｅ各々から音声データと画像データを受信し、これら受信データ（音声データ、画像データ）を解析して表示データを生成する。

　すなわち、図２、図３を参照して説明した発話テキスト表示円７１の時系列データによって構成される表示データを生成する。
　情報処理装置（サーバ）５０が生成する表示データは、リモートミーティング参加ユーザの発話内容をテキスト表示した発話テキスト表示円７１の時系列データによって構成され、例えば、発話テキスト表示円の大きさや色や動きによって、発話ユーザの状態や、ミーティングの状態（盛り上がり度など）を視覚的に理解可能とした表示データである。

　また、図５を参照して説明したように、情報処理装置（サーバ）５０の表示データ制御部５６が、声データ解析部５３が解析した音声データ解析結果と、画像データ解析部５５が解析した画像データ解析結果を入力し、これらの入力データに基づいて、ユーザ端末２１に提供する画像データ、すなわち先に図２、図３を参照して説明したリモートミーティングの発話テキストを含む発話テキスト表示円の時系列表示データの制御処理を実行する。

　すなわち、表示データ制御部５６は、例えばユーザの声の大きさに応じて発話テキスト表示円のサイズを決定する処理、ユーザの声のトーンに応じて発話テキスト表示円の色を決定する処理、ユーザ発話がどの先行発話に対してなされたかの解析結果に応じて発話テキスト表示円の表示位置や動きを決定する処理などを実行する。

　このように、表示データ制御部５６は、リモートミーティングの参加ユーザの感情や状態、さらにミーティング全体の盛り上がり度などの雰囲気などを可視化した表示データを生成するための表示データ制御処理、すなわち表示データを構成する発話テキスト表示円のサイズ、色、動き、その他のエフェクト表示態様等の決定処理、背景の色などの決定処理など、様々な表示データ制御処理を実行する。
　以下、この表示データ制御処理の具体例について説明する。

　まず、図６を参照して、情報処理装置（サーバ）５０が生成する表示データの基本的な構成要素である発話テキスト表示円７１の詳細構成について説明する。
　図６には、１つの発話テキスト表示円７１を示している。
　発話テキスト表示円７１には、発話テキスト７２と、ユーザアイコン７３が含まれる。

　なお、図６には、円形タイプの発話テキスト表示円７１を示しているが、この形状は一例であり、円形以外の四角形、六角形等の多角形、あるいは楕円形など様々な形状とした発話テキスト表示領域を利用する構成としてもよい。
　ここでは、一実施例として円形の発話テキスト表示円７１を利用した例について説明する。

　発話テキスト表示円７１には、発話テキスト７２と、ユーザアイコン７３が含まれる。
　発話テキスト７２は、図５を参照して説明した情報処理装置（サーバ）５０の音声データ解析部５３が生成したテキストデータであり、ユーザ端末２１のマイクを介して入力されたユーザ発話に対応するテキストデータである。

　なお、発話テキスト表示円７１内に表示される発話テキスト７２は、例えばキーワード部分を拡大して表示、あるいは他のテキスト部分と異なる色のテキストとして表示するなどの表示制御処理が行われる場合がある。
　これらの表示制御処理は、先に図５を参照して説明した情報処理装置（サーバ）５０の表示データ制御部５６において実行される。これらの処理の具体例については後述する。

　ユーザアイコン７３は、発話テキスト表示円７１内に表示される発話テキスト７２の発話ユーザを示す画像等によって構成される。具体的には、例えば、以下のいずれかのデータである。
　ａ．発話ユーザのカメラ撮影画像（動画）
　ｂ．発話ユーザのカメラ撮影画像（静止画）
　ｃ．発話ユーザを示すアバター画像
　ｄ．発話ユーザを示すその他のアイコン
　ｅ．発話ユーザの名前、ニックネーム

　なお、図６の右側に示すように発話の無いミーティング参加ユーザについては、発話テキスト表示円７１を表示することなく、ユーザアイコン７３のみを表示する処理を行ってもよい。
　例えば、予め設定した期間内に全く発話がなく、表示画面内にそのユーザの発話テキスト表示円７１が表示されていない場合などにユーザアイコン７３のみを表示する処理を行うなどの処理を行う。

　さらに、先に図５を参照して説明したように、情報処理装置（サーバ）５０の表示データ制御部５６は、リモートミーティングの参加ユーザの感情や状態、さらにミーティング全体の盛り上がり度などの雰囲気などに応じて、発話テキスト表示円７１のサイズ、色、動き、その他のエフェクト表示態様などを決定して制御する。
　すなわち、表示データ制御部５６は、リモートミーティングの参加ユーザの感情や状態、さらにミーティング全体の盛り上がり度などの雰囲気などを可視化した表示データを生成するための表示データ制御処理を実行する。
　図７以下を参照して、情報処理装置（サーバ）５０が実行する表示データ制御処理の具体例について説明する。

　図７～図１４に示す表は、情報処理装置（サーバ）が実行する表示データ制御処理の具体例について説明した表である。
　図１５以下には、図７～図１４に示す表の説明に対応する具体的な表示例を示している。

　図７～図１４の表は、以下の項目（ａ）～（ｄ）を対応付けて示している。
　（ａ）可視化要素
　（ｂ）解析対象とする入力データ
　（ｃ）入力データに対する解析処理
　（ｄ）表示データ制御部による表示データ制御処理

　（ａ）可視化要素とは、情報処理装置（サーバ）５０が生成する表示データを見ることでユーザが認識可能となる発話ユーザの状態や会話状態（ミーティング状態）の要素である。
　具体的には、発話の声の大きさや声のトーン等が可視化要素である。

　（ｂ）解析対象とする入力データとは、上記の「（ａ）可視化要素」を表示データ中に表現するために解析する対象となるデータであり、情報処理装置（サーバ）５０がユーザ端末２１から入力する音声データ、画像データの少なくともいずれかのデータである。

　（ｃ）入力データに対する解析処理は、上記の「（ｂ）解析対象とする入力データ」に対する具体的なデータ解析処理についての説明である。

　（ｄ）表示データ制御部による表示データ制御処理は、上記の「（ｃ）入力データに対する解析処理」の結果に基づいて、表示データ制御部が実行する表示データ制御処理の具体例の説明である。

　図７～図１４の表には、（ａ）可視化要素として、以下の１３種類の可視化要素を列挙している。
　（１）ユーザの声の大きさ
　（２）ユーザの声の明暗
　（３）ユーザ発話中のキーワード
　（４）ユーザ発話の時系列情報
　（５）ユーザ発話が、会話の中心的発話や支配的発話であること
　（６）ユーザ発話が、先行するどの発話に対してなされたか
　（７）ユーザ発話が、先行発話に対する賛同発話であること
　（８）ユーザ発話が、先行発話に対する否定発話であること
　（９）ユーザのポジティブアクション
　（１０）ユーザのネガティブアクション
　（１１）会話全体の盛り上がり
　（１２）会話全体の盛り下がり
　（１３）意見の分類

　情報処理装置（サーバ）５０は、例えば先に図２、図３を参照して説明した表示データを制御して、上記（１）～（１３）の可視化要素を含めた表示データを生成する。

　情報処理装置（サーバ）５０が実行するこの表示データ制御処理によって、ミーティング参加ユーザはユーザ端末に表示された表示データから、各ユーザの発話の大きさやトーン、さらに、各ユーザ発話の先行発話に対する賛否、またユーザがポジティブな状態にあるかネガティブな状態にあるか、またミーティングが盛り上がっているか否かなど、様々なユーザ状態や会話状態を認識することが可能となる。

　以下、図７～図１４に示す可視化要素（１）～（１３）の各々についての具体的処理例について、順次、説明する。

　（１）ユーザの声の大きさ
　情報処理装置（サーバ）５０は、ミーティング参加ユーザの「ユーザ発話の声の大きさ」を表示データ上で表現するための表示データ制御処理を実行する。

　「ユーザ発話の声の大きさ」を表示データ上で表現するための表示データ制御処理に利用する解析対象データは、「図７に示す表の項目（１）の（ｂ）」に示すようにユーザ端末２１のマイクが取得するユーザ発話音声である。
　「ユーザ発話の声の大きさ」を表示データ上で表現するために実行するデータ解析処理は、「図７に示す表の項目（１）の（ｃ）」に示すように、音声データ解析部５３におけるユーザ発話音声の音量解析である。

　さらに、「ユーザ発話の声の大きさ」を表示データ上で表現するために、表示データ制御部５６が実行する表示データ制御処理は、「図７に示す表の項目（１）の（ｄ）」に示すように、発話テキスト表示円のサイズを制御する処理である。すなわち、発話音量が大きいほど大きなサイズとする処理を実行する。

　表示データ制御部５６が実行する処理の具体例、すなわち、「ユーザ発話の声の大きさ」を表示データ上で表現する処理の具体例を図１５に示す。
　図１５に示すグラフは、横軸に声の大きさ、縦軸に発話テキスト表示円のサイズを設定したグラフである。
　横軸に示す声の大きさは、音声データ解析部５３によって解析された発話音量に相当する。

　表示データ制御部５６は、音声データ解析部５３によって解析された発話音量に応じて、例えば図１５に示すグラフに従って、表示データ上に出力する発話テキスト表示円のサイズを決定する。
　すなわち、発話音量が大きいほど、発話テキスト表示円のサイズを大きなサイズとする処理を実行する。

　（２）ユーザの声の明暗
　情報処理装置（サーバ）５０は、ミーティング参加ユーザの「ユーザ発話の声の明暗」を表示データ上で表現するための表示データ制御処理を実行する。

　「ユーザ発話の声の明暗」を表示データ上で表現するための表示データ制御処理に利用する解析対象データは、「図７に示す表の項目（２）の（ｂ）」に示すようにユーザ端末２１のマイクが取得するユーザ発話音声である。
　「ユーザ発話の声の明暗」を表示データ上で表現するために実行するデータ解析処理は、「図７に示す表の項目（２）の（ｃ）」に示すように、音声データ解析部５３におけるユーザ発話音声のトーン（声色）解析である。

　さらに、「ユーザ発話の声の明暗」を表示データ上で表現するために、表示データ制御部５６が実行する表示データ制御処理は、「図７に示す表の項目（２）の（ｄ）」に示すように以下の処理の少なくてもいずれかの処理である。
　ａ．発話テキスト表示円の色を制御（明るいトーンの場合は明るい色や暖色系の円、暗いトーンの場合は暗い色や寒色系の円を表示）
　ｂ．発話テキスト表示円の円周囲にエフェクト画像を出力（明るいトーンの場合は輝きを示すエフェクト画像を出力、暗いトーンの場合は雲のエフェクト画像を出力）

　表示データ制御部５６が実行する処理の具体例、すなわち、「ユーザ発話の声の明暗」を表示データ上で表現する処理の具体例を図１６、図１７に示す。
　図１６は上記ａの処理の処理例、図１７は上記ａの処理と上記ｂの処理を併せて実行した場合の処理例を示している。

　上記ａの処理の処理例を示す図１６に示すグラフは、横軸に声の明暗、縦軸に発話テキスト表示円の色を設定したグラフである。
　横軸に示す声の明暗は、音声データ解析部５３によって解析された発話の明暗に相当する。
　縦軸に示す発話テキスト表示円の色は、下側が寒色系の色（ブルー、グレー等）で、上側が暖色系の色（オレンジ等）である。

　表示データ制御部５６は、音声データ解析部５３によって解析されたユーザ発話の明暗状態に応じて、例えば図１６に示すグラフに従って、表示データ上に出力する発話テキスト表示円の色を決定する。
　すなわち、発話トーンが明るいほど、発話テキスト表示円の色をオレンジ等の暖色系の色に設定し、発話トーンが暗いほど、発話テキスト表示円の色をブルーやグレー等の寒色系の色に設定する処理を実行する。

　また、上記ａの処理と上記ｂの処理を併せて実行した場合の処理例を示す図１７に示すグラフも、図１６と同様、横軸に声の明暗、縦軸に発話テキスト表示円の色を設定したグラフである。
　横軸に示す声の明暗は、音声データ解析部５３によって解析された発話の明暗に相当する。
　縦軸に示す発話テキスト表示円の色は、下側が寒色系の色（ブルー、グレー等）で、上側が暖色系の色（オレンジ等）である。

　表示データ制御部５６は、音声データ解析部５３によって解析されたユーザ発話の明暗状態に応じて、例えば図１７に示すグラフに従って、表示データ上に出力する発話テキスト表示円の色を決定する。
　発話トーンが明るいほど、発話テキスト表示円の色をオレンジ等の暖色系の色に設定し、発話トーンが暗いほど、発話テキスト表示円の色をブルーやグレー等の寒色系の色に設定する処理を実行する。

　さらに、図１７に示す例では、発話テキスト表示円円周囲に発話トーンに応じたエフェクト画像を出力している。具体的には、明るいトーンの場合は例えば輝きを示すエフェクト画像を出力し、暗いトーンの場合は例えば雲のエフェクト画像を出力する。

　（３）ユーザ発話中のキーワード
　情報処理装置（サーバ）５０は、ミーティング参加ユーザの「ユーザ発話中のキーワード」を表示データ上で表現するための表示データ制御処理を実行する。

　「ユーザ発話中のキーワード」を表示データ上で表現するための表示データ制御処理に利用する解析対象データは、「図７に示す表の項目（３）の（ｂ）」に示すようにユーザ端末２１のマイクが取得するユーザ発話音声である。
　「ユーザ発話中のキーワード」を表示データ上で表現するために実行するデータ解析処理は、「図７に示す表の項目（３）の（ｃ）」に示すように、音声データ解析部５３におけるユーザ発話音声の意味解析である。

　さらに、「ユーザ発話中のキーワード」を表示データ上で表現するために、表示データ制御部５６が実行する表示データ制御処理は、「図７に示す表の項目（３）の（ｄ）」に示すように、発話テキスト表示円内に表示する発話テキスト内のキーワード部分を強調表示する処理である。例えばキーワード部分を拡大表示、あるいは赤等の強調色で表示する処理などを実行する。

　表示データ制御部５６が実行する処理の具体例、すなわち、「ユーザ発話中のキーワード」を表示データ上で表現する処理の具体例を図１８に示す。
　図１８には、２つの発話テキスト表示円を示している。

　それぞれの発話テキスト表示円に表示されている発話テキストには、音声データ解析部５３におけるユーザ発話音声の意味解析によって抽出されたキーワードが含まれる。
　左上の発話テキスト表示円の発話テキストは、
　「いいレストランないかな」
　である。
　音声データ解析部５３は、このユーザ発話の意味解析を実行し、以下のワードをキーワードとして抽出する。
　「レストラン」

　この場合、表示データ制御部５６が実行する表示データ制御処理は、キーワード「レストラン」の文字を拡大表示、または赤等の強調色で表示する処理となる。

　さらに、右下の発話テキスト表示円の発話テキストは、
　「この前いったミラノダイニングおいしかったよ」
　である。
　音声データ解析部５３は、このユーザ発話の意味解析を実行し、以下のワードをキーワードとして抽出する。
　「ミラノダイニング」

　この場合、表示データ制御部５６が実行する表示データ制御処理は、キーワード「ミラノダイニング」の文字を拡大表示、または赤等の強調色で表示する処理となる。

　（４）ユーザ発話の時系列情報
　情報処理装置（サーバ）５０は、ミーティング参加ユーザの「ユーザ発話の時系列情報」を表示データ上で表現するための表示データ制御処理を実行する。

　「ユーザ発話の時系列情報」を表示データ上で表現するための表示データ制御処理に利用する解析対象データは、「図８に示す表の項目（４）の（ｂ）」に示すようにユーザ端末２１のマイクが取得するユーザ発話音声である。
　「ユーザ発話の時系列情報」を表示データ上で表現するために実行するデータ解析処理は、「図８に示す表の項目（４）の（ｃ）」に示すように、音声データ解析部５３におけるユーザ発話音声の時系列解析である。

　さらに、「ユーザ発話の時系列情報」を表示データ上で表現するために、表示データ制御部５６が実行する表示データ制御処理は、「図８に示す表の項目（４）の（ｄ）」に示すように、以下のａ，ｂの少なくともいずれかの処理である。
　ａ．発話テキスト表示円の表示位置を、順次、変更して表示する。例えば時系列に下から上に表示する。
　ｂ．発話テキスト表示円の表示色を、順次、変更して表示する。例えば、古くなるほど表示色の彩度を低下させる。
　なお、これらａ，ｂの処理は単独で実行する設定としてもよく、併せて実行する構成としてもよい。

　表示データ制御部５６は、「ユーザ発話の時系列情報」を表示データ上で表現するために、上記ａ，ｂの処理の少なくともいずれかの処理を実行する。

　表示データ制御部５６が実行する処理の具体例、すなわち、「ユーザ発話の時系列情報」を表示データ上で表現する処理の具体例について図１９以下を参照して説明する。

　図１９は、上記ａの処理に相当する具体例である。すなわち発話テキスト表示円の表示位置を、順次、変更して表示する例である。
　図１９に示す例は、先に図２を参照して説明した表示データと同様の表示データであり、発話テキスト表示円７１を左下から右上に移動するように表示するものである。最新の発話に対応する発話テキスト表示円は、左下に表示され、その後、右上方向に移動し、画面の右上の表示利用域から、順次、消去される。図に示す例では、右上端の発話テキスト表示円７１－１が最も過去の発話に対応する発話テキスト表示円であり、左下端の発話テキスト表示円７１－６が最も新しい発話対応の発話テキスト表示円でとなる。

　なお、図１９に示す例は、発話テキスト表示円７１を左下から右上に移動するように表示する例であるが、移動方向はこの例に限らず、様々な移動方向の設定が可能である。例えば図２０に示す（ｐ）～（ｓ）のような移動方向の設定が可能である。

　（ｐ）は、発話テキスト表示円を時間経過とともに左上から右下に移動させる設定である。
　（ｑ）は、発話テキスト表示円を時間経過とともに左から右に移動させる設定である。
　（ｒ）は、発話テキスト表示円を時間経過とともに右から左に移動させる設定である。
　（ｓ）は、発話テキスト表示円を時間経過とともに上から下に移動させる設定である。
　なお、これらの例以外の移動方向の設定も可能である。

　図２１は、上記ｂの処理に相当する具体例である。すなわち発話テキスト表示円の表示色を、順次、変更して表示する例であり、古くなるほど表示色の彩度を低下させる例である。

　図２１に示すグラフは、横軸に発話時間、縦軸に発話テキスト表示円の彩度を設定したグラフである。
　横軸に示す発話時間軸は左側が古く、右側が新しい設定である。この発話時間は音声データ解析部５３によって解析される発話時間である。

　表示データ制御部５６は、音声データ解析部５３によって解析された発話時間に応じて、例えば図２１に示すグラフに従って、表示データ上に出力する発話テキスト表示円の色の彩度を決定する。
　すなわち、発話時間が新しい（現在時間に近い）ほど、発話テキスト表示円の色の彩度を高く（鮮やか）に設定し、発話時間が古い（現在時間から遠い）ほど、発話テキスト表示円の色の彩度を低く設定する。

　なお、前述したように上記ａ，ｂの処理は併せて実行する構成としてもよい。
　すなわち、処理ａ＝発話テキスト表示円の表示位置を、順次、変更して表示する処理と、処理ｂ＝発話テキスト表示円の表示色を、順次、変更して表示する処理、これら２つの処理を併せて実行する構成としてもよい。

　（５）ユーザ発話が会話の中心的発話や支配的発話であること
　情報処理装置（サーバ）５０は、ミーティング参加ユーザの「ユーザ発話が会話の中心的発話や支配的発話であること」を表示データ上で表現するための表示データ制御処理を実行する。

　「ユーザ発話が会話の中心的発話や支配的発話であること」を表示データ上で表現するための表示データ制御処理に利用する解析対象データは、「図８に示す表の項目（５）の（ｂ）」に示すようにユーザ端末２１のマイクが取得するユーザ発話音声である。

　「ユーザ発話が会話の中心的発話や支配的発話であること」を表示データ上で表現するために実行するデータ解析処理は、「図８に示す表の項目（５）の（ｃ）」に示すように、音声データ解析部５３におけるユーザ発話音声の意味解析である。

　さらに、「ユーザ発話が会話の中心的発話や支配的発話であること」を表示データ上で表現するために、表示データ制御部５６が実行する表示データ制御処理は「図８に示す表の項目（５）の（ｄ）」に示すように、以下のａ，ｂの少なくともいずれかの処理である。
　ａ．ユーザ発話が会話の中心的発話や支配的発話である場合、その発話テキスト表示円の位置や、サイズを制御して表示、例えば表示領域の中心部に大きく表示する。
　ｂ．ユーザ発話が会話の中心的発話や支配的発話である場合、その発話テキスト表示円に接触させた「会話中心識別アイコン（例えば二重線のアウトライン円や、赤一色の塗りつぶし円等）」を表示する。
　なお、これらａ，ｂの処理は単独で実行する設定としてもよく、併せて実行する構成としてもよい。

　表示データ制御部５６は、「ユーザ発話が会話の中心的発話や支配的発話であること」を表示データ上で表現するために、上記ａ，ｂの処理の少なくともいずれかの処理を実行する。

　表示データ制御部５６が実行する処理の具体例、すなわち、「ユーザ発話が会話の中心的発話や支配的発話であること」を表示データ上で表現する処理の具体例について図２２以下を参照して説明する。

　図２２は、上記ａの処理に相当する具体例である。すなわち、ユーザ発話が会話の中心的発話や支配的発話である場合、その発話テキスト表示円を表示領域の中心部に大きく表示する処理例を示している。

　図２２に示す例では、発話テキスト表示円７１は時間経過とともに、表示領域の左下から右上に移動する。
　ここで、発話テキスト表示円７１の表示幅は、図中央部に示すような矢印の幅であるとする。この場合、ユーザ発話が会話の中心的発話や支配的発話である場合、その発話テキスト表示円７１は、表示幅の中心位置に配置するように表示する。図に示す発話テキスト表示円７１は時間経過とともに、表示領域の左下から右上に表示幅の中心線に沿って移動することになる。

　図２３と、図２４に示す例は、上記ｂの処理に相当する具体例である。すなわち、ユーザ発話が会話の中心的発話や支配的発話である場合、その発話テキスト表示円に接触させた「会話中心識別アイコン（例えば二重線のアウトライン円や、赤一色の塗りつぶし円等）」を表示する例である。

　図２３（ｐ）に示す発話テキスト表示円７１が会話の中心的発話や支配的発話である。この場合、この発話テキスト表示円７１に接触させた「会話中心識別アイコン（二重線のアウトライン円）８０」を表示する。

　なお、図２３（ｐ）の例は、会話中心識別アイコン（二重線のアウトライン円）８０を、会話の中心的発話や支配的発話である発話テキスト表示円７１に接するように表示している例であるが、例えば、図２３（ｑ）に示すように、会話中心識別アイコン（二重線のアウトライン円）８０を、会話の中心的発話や支配的発話である発話テキスト表示円７１に重なるように表示する設定としてもよい。

　図２４は、会話中心識別アイコンとして赤一色の塗りつぶし円を表しした例である。
　（ｐ）に示す発話テキスト表示円７１が会話の中心的発話や支配的発話である。この場合、この発話テキスト表示円７１に接触させた「会話中心識別アイコン（赤丸）８０」を表示する。

　なお、図２４（ｐ）の例は、会話中心識別アイコン（例えば赤丸）８０を、会話の中心的発話や支配的発話である発話テキスト表示円７１に接するように表示している例であるが、例えば、図２４（ｑ）に示すように、会話中心識別アイコン（赤丸）８０を、会話の中心的発話や支配的発話である発話テキスト表示円７１に重なるように表示する設定としてもよい。

　なお、前述したように上記ａ，ｂの処理は併せて実行する構成としてもよい。
　すなわち、処理ａ＝ユーザ発話が会話の中心的発話や支配的発話である場合、その発話テキスト表示円を表示領域の中心部に大きく表示する処理と、処理ｂ＝ユーザ発話が会話の中心的発話や支配的発話である場合、その発話テキスト表示円に接触させた「会話中心識別アイコン（例えば二重線のアウトライン円や、赤一色の塗りつぶし円）」を表示する処理、これら２つの処理を併せて実行する構成としてもよい。

　（６）ユーザ発話が先行するどの発話に対してなされたか
　情報処理装置（サーバ）５０は、ミーティング参加ユーザの「ユーザ発話が先行するどの発話に対してなされたか」を表示データ上で表現するための表示データ制御処理を実行する。

　「ユーザ発話が先行するどの発話に対してなされたか」を表示データ上で表現するための表示データ制御処理に利用する解析対象データは、「図９に示す表の項目（６）の（ｂ）」に示すようにユーザ端末２１のマイクが取得するユーザ発話音声である。
　「ユーザ発話が先行するどの発話に対してなされたか」を表示データ上で表現するために実行するデータ解析処理は、「図９に示す表の項目（６）の（ｃ）」に示すように、音声データ解析部５３におけるユーザ発話音声の意味解析である。

　さらに、「ユーザ発話が先行するどの発話に対してなされたか」を表示データ上で表現するために、表示データ制御部５６が実行する表示データ制御処理は、「図９に示す表の項目（６）の（ｄ）」に示すように、以下の処理である。
　発話テキスト表示円を、その発話がなされる要因となった先行発話の発話テキスト表示円に接触、または近づいていくように移動表示する。ただし、発話が先行発話に対する賛同、否定を示す場合は以下の（７），（８）の表示制御を優先する。

　表示データ制御部５６が実行する処理の具体例、すなわち、「ユーザ発話が先行するどの発話に対してなされたか」を表示データ上で表現する処理の具体例について図２５以下を参照して説明する。

　図２５（ａ）は、表示データ制御部５６が実行する処理の一例を示す図である。
　図２５（ａ）の表示例は、先行発話の発話テキスト表示円８１に後続関連発話の発話テキスト表示円８２を接触させて表示した例である。

　図２５（ｂ）も、表示データ制御部５６が実行する処理の一例を示す図である。
　図２５（ｂ）の表示例は、先行発話の発話テキスト表示円８１に後続関連発話の発話テキスト表示円８２が近づくように移動させて表示した例である。

　図２５（ｂ）に示すような移動表示の後、図２５（ａ）に示すような接触表示を行う構成としてもよい。

　図２６（ｃ）も、表示データ制御部５６が実行する処理の一例を示す図である。
　図２６（ｃ）の表示例は、先行発話に対して、複数の関連発話が発生している場合の表示例である。
　先行発話の発話テキスト表示円８１に対して、２つの後続関連発話の発話テキスト表示円を示している。すなわち、
　第１の後続関連発話の発話テキスト表示円８２－１と、
　第２の後続関連発話の発話テキスト表示円８２－２、
　である。

　このような場合、表示データ制御部５６は、図に示すように、複数の後続関連発話の発話テキスト表示円８２－１，２を先行発話の発話テキスト表示円８１の円周上にならんで接触するように表示する。

　さらに、図２６に示す例では、後続関連発話の発話テキスト表示円８２－２に対する関連発話の発話テキスト表示円８２－３を示している。
　発話テキスト表示円８２－３に示す発話は、後続関連発話の発話テキスト表示円８２－２に対する関連発話であり、発話テキスト表示円８２－２に接触するように表示する。

　（７）ユーザ発話が先行発話に対する賛同発話であること
　情報処理装置（サーバ）５０は、ミーティング参加ユーザの「ユーザ発話が先行発話に対する賛同発話であること」を表示データ上で表現するための表示データ制御処理を実行する。

　「ユーザ発話が先行発話に対する賛同発話であること」を表示データ上で表現するための表示データ制御処理に利用する解析対象データは、「図９に示す表の項目（７）の（ｂ）」に示すようにユーザ端末２１のマイクが取得するユーザ発話音声である。
　「ユーザ発話が先行発話に対する賛同発話であること」を表示データ上で表現するために実行するデータ解析処理は、「図９に示す表の項目（７）の（ｃ）」に示すように、音声データ解析部５３におけるユーザ発話音声の意味解析である。

　さらに、「ユーザ発話が先行発話に対する賛同発話であること」を表示データ上で表現するために、表示データ制御部５６が実行する表示データ制御処理は、「図９に示す表の項目（７）の（ｄ）」に示すように、以下の処理である。
　ユーザ発話が先行発話に対する賛同発話である場合、発話テキスト表示円を、賛同する先行発話の表示円に近づくように移動させて表示（さらに２つの円を同系色の色に設定して表示してもよい）。

　表示データ制御部５６が実行する処理の具体例、すなわち、「ユーザ発話が先行発話に対する賛同発話であること」を表示データ上で表現する処理の具体例について図２７を参照して説明する。

　図２７には、先行発話の発話テキスト表示円８１と、後続賛同発話の発話テキスト表示円８３を示している。

　後続賛同発話の発話テキスト表示円８３を、先行発話の発話テキスト表示円８１に近づくように移動させて表示する。
　なお、この処理に併せて、後続賛同発話の発話テキスト表示円８３を先行発話の発話テキスト表示円８１の色と同色、または同系色に設定する制御を行ってもよい。

　（８）ユーザ発話が先行発話に対する否定発話であること
　情報処理装置（サーバ）５０は、ミーティング参加ユーザの「ユーザ発話が先行発話に対する否定発話であること」を表示データ上で表現するための表示データ制御処理を実行する。

　「ユーザ発話が先行発話に対する否定発話であること」を表示データ上で表現するための表示データ制御処理に利用する解析対象データは、「図９に示す表の項目（８）の（ｂ）」に示すようにユーザ端末２１のマイクが取得するユーザ発話音声である。
　「ユーザ発話が先行発話に対する否定発話であること」を表示データ上で表現するために実行するデータ解析処理は、「図９に示す表の項目（８）の（ｃ）」に示すように、音声データ解析部５３におけるユーザ発話音声の意味解析である。

　さらに、「ユーザ発話が先行発話に対する否定発話であること」を表示データ上で表現するために、表示データ制御部５６が実行する表示データ制御処理は、「図９に示す表の項目（８）の（ｄ）」に示すように、以下の処理である。
　ユーザ発話が先行発話に対する否定発話である場合、発話テキスト表示円を、否定する先行発話の表示円から離れるように移動させて表示（さらに２つの円を反対色等、異なる色の色に設定して表示してもよい）。

　表示データ制御部５６が実行する処理の具体例、すなわち、「ユーザ発話が先行発話に対する否定発話であること」を表示データ上で表現する処理の具体例について図２８を参照して説明する。

　図２８には、先行発話の発話テキスト表示円８１と、後続否定発話の発話テキスト表示円８４を示している。

　後続否定発話の発話テキスト表示円８４を、先行発話の発話テキスト表示円８１から離れるように移動させて表示する。
　なお、この処理に併せて、後続否定発話の発話テキスト表示円８４を先行発話の発話テキスト表示円８１の色の反対色、または異なる色に設定する制御を行ってもよい。

　（９）ユーザのポジティブアクション
　情報処理装置（サーバ）５０は、ミーティング参加ユーザの「ユーザのポジティブアクション」を表示データ上で表現するための表示データ制御処理を実行する。

　「ユーザのポジティブアクション」を表示データ上で表現するための表示データ制御処理に利用する解析対象データは、「図１０に示す表の項目（９）の（ｂ）」に示すようにユーザ端末２１のマイクが取得するユーザ発話音声、笑い声、叫び声、驚きの声等、さらに、ユーザ端末２１のカメラが取得するユーザの顔画像、例えば、笑い顔、うなずき等のアクションを示す画像である。

　「ユーザのポジティブアクション」を表示データ上で表現するために実行するデータ解析処理は、「図１０に示す表の項目（９）の（ｃ）」に示すように、音声データ解析部５３におけるユーザ発話の音声解析、意味解析等と、さらに、画像データ解析部５５におけるユーザ画像の解析処理である。

　さらに、「ユーザのポジティブアクション」を表示データ上で表現するために、表示データ制御部５６が実行する表示データ制御処理は、「図１０に示す表の項目（９）の（ｄ）」に示すように以下の処理である。
　すなわち、ポジティブアクションを示したユーザの発話テキスト表示円、またはユーザアイコンに対して、以下のａ～ｄの少なくともいずれかの表示制御を実行する。
　ａ．揺れ（縦揺れ、ゆっくり回転、飛ぶように移動等）、
　ｂ．サイズの拡縮、
　ｃ．色の変化（明るい色に変化、または明るい色との交互変化（点滅））、
　ｄ．発話テキスト表示円の円周囲にエフェクト画像を出力（ポジティブなアクションの場合は輝きを示すエフェクト画像を出力）
　なお、これらａ，ｂ，ｃ，ｄの処理は単独で実行する設定としても、併せて実行する設定としてもよい。

　表示データ制御部５６は、「ユーザのポジティブアクション」を表示データ上で表現するために、上記ａ，ｂ，ｃ，ｄの処理の少なくともいずれかの処理を実行する。

　表示データ制御部５６が実行する処理の具体例、すなわち、「ユーザのポジティブアクション」を表示データ上で表現する処理の具体例について図２９を参照して説明する。

　図２９には、ユーザのポジティブアクションの動機付けとなった先行発話の発話テキスト表示円８１と、「ユーザのポジティブアクション」の表示データ例として、上記のａ，ｂ，ｃの処理に対応する表示データ例（ａ）～（ｃ１）を示している。

　図２９（ａ）は、上記の「ａ．揺れ（縦揺れ、ゆっくり回転等）」に相当する表示制御例である。図２９（ａ）には、ポジティブアクションを示したユーザの発話テキスト表示円を縦に揺らす表示制御例と、回転方向に揺らす表示制御例を示している。

　図２９（ｂ）は、上記の「ｂ．サイズの拡縮」に相当する表示制御例である。図２９（ｂ）には、ポジティブアクションを示したユーザの発話テキスト表示円を拡縮表示する表示制御例を示している。

　図２９（ｃ１）は、上記の「ｃ．色の変化（明るい色に変化）」に相当する表示制御例である。図２９（ｃ１）には、ポジティブアクションを示したユーザの発話テキスト表示円の色を明るい色に変化させる表示制御例を示している。

　図３０には、上記のｃ，ｄの処理に対応する表示データ例（ｃ２）～（ｄ）を示している。
　ユーザのポジティブアクションの動機付けとなった先行発話の発話テキスト表示円８１と、「ユーザのポジティブアクション」の表示データ例（ｃ２）～（ｄ）を示している。

　図３０（ｃ２）は、上記の「ｃ．色の変化（明るい色との交互変化（点滅））」に相当する表示制御例である。図３０（ｃ２）には、ポジティブアクションを示したユーザの発話テキスト表示円の色を、一時的に明るい色に変化させる表示制御例を示している。例えば瞬間的に１～２秒、明るい色に変化させる表示制御や、元の色と明るい色を交互に表示する点滅処理等を行う。

　図３０（ｄ）は、上記の「ｄ．発話テキスト表示円の円周囲にエフェクト画像を出力（ポジティブなアクションの場合は輝きを示すエフェクト画像を出力）」に相当する表示制御例である。図３０（ｄ）には、ポジティブアクションを示したユーザの発話テキスト表示円の円周囲にエフェクト画像を出力する例として、輝きを示すエフェクト画像を出力した例を示している。

　（１０）ユーザのネガティブアクション
　情報処理装置（サーバ）５０は、ミーティング参加ユーザの「ユーザのネガティブアクション」を表示データ上で表現するための表示データ制御処理を実行する。

　「ユーザのネガティブアクション」を表示データ上で表現するための表示データ制御処理に利用する解析対象データは、「図１１に示す表の項目（１０）の（ｂ）」に示すようにユーザ端末２１のマイクが取得するユーザ発話音声、失笑、沈黙等、さらに、ユーザ端末２１のカメラが取得するユーザの顔画像、例えば、困った顔、首振り等の否定的アクションを示す画像である。

　「ユーザのネガティブアクション」を表示データ上で表現するために実行するデータ解析処理は、「図１１に示す表の項目（１０）の（ｃ）」に示すように、音声データ解析部５３におけるユーザ発話の音声解析、意味解析等と、さらに、画像データ解析部５５におけるユーザ画像の解析処理である。

　さらに、「ユーザのネガティブアクション」を表示データ上で表現するために、表示データ制御部５６が実行する表示データ制御処理は、「図１１に示す表の項目（１０）の（ｄ）」に示すように以下の処理である。
　すなわち、ネガティブアクションを示したユーザの発話テキスト表示円、またはユーザアイコンに対して、以下のａ～ｃの少なくともいずれかの表示制御を実行する。
　ａ．揺れ（激しい横揺れ、のろのろ移動等）、
　ｂ．サイズの拡縮、形状の歪み（つぶれた楕円などに変形等）
　ｃ．色の変化（暗い色に変化、または暗い色との交互変化（点滅））、
　ｄ．発話テキスト表示円の円周囲にエフェクト画像を出力（ネガティブなアクションの場合はネガティブ状態を示すエフェクト画像を出力）
　なお、これらａ，ｂ，ｃ，ｄの処理は単独で実行する設定としても、併せて実行する設定としてもよい。

　表示データ制御部５６は、「ユーザのネガティブアクション」を表示データ上で表現するために、上記ａ，ｂ，ｃ，ｄの処理の少なくともいずれかの処理を実行する。

　表示データ制御部５６が実行する処理の具体例、すなわち、「ユーザのネガティブアクション」を表示データ上で表現する処理の具体例について図３１を参照して説明する。

　図３１には、ユーザのネガティブアクションの動機付けとなった先行発話の発話テキスト表示円８１と、「ユーザのネガティブアクション」の表示データ例として、上記のａ，ｂ，ｃの処理に対応する表示データ例（ａ）～（ｃ１）を示している。

　図３１（ａ）は、上記の「揺れ（激しい横揺れ等）」に相当する表示制御例である。図３１（ａ）には、ネガティブアクションを示したユーザの発話テキスト表示円とユーザアイコンを横に激しく揺らす表示制御例を示している。

　図３１（ｂ）は、上記の「ｂ．サイズの拡縮、形状の歪み（つぶれた楕円などに変形等）」に相当する表示制御例である。図３１（ｂ）には、ネガティブアクションを示したユーザの発話テキスト表示円をつぶれた楕円に変形して表示する表示制御例を示している。

　図３１（ｃ１）は、上記の「ｃ．色の変化（暗い色に変化）」に相当する表示制御例である。図３１（ｃ１）には、ネガティブアクションを示したユーザの発話テキスト表示円の色を暗い色に変化させる表示制御例を示している。

　図３２には、上記のｃ，ｄの処理に対応する表示データ例（ｃ２）～（ｄ）を示している。
　ユーザのネガティブアクションの動機付けとなった先行発話の発話テキスト表示円８１と、「ユーザのネガティブアクション」の表示データ例（ｃ２）～（ｄ）を示している。

　図３２（ｃ２）は、上記の「ｃ．色の変化（暗い色との交互変化（点滅））」に相当する表示制御例である。図３２（ｃ２）には、ネガティブアクションを示したユーザの発話テキスト表示円の色を、一時的に暗い色に変化させる表示制御例を示している。例えば瞬間的に１～２秒、暗い色に変化させる表示制御や、元の色と暗い色を交互に表示する点滅処理等を行う。

　図３２（ｄ）は、上記の「ｄ．発話テキスト表示円の円周囲にエフェクト画像を出力（ネガティブなアクションの場合はネガティブ状態を示すエフェクト画像を出力）」に相当する表示制御例である。図３２（ｄ）には、ネガティブアクションを示したユーザの発話テキスト表示円の円周囲にエフェクト画像を出力する例として、ネガティブな状態にあることを示すエフェクト画像を出力した例を示している。

　（１１）会話全体の盛り上がり
　情報処理装置（サーバ）５０は、ミーティング参加ユーザの「会話全体の盛り上がり」を表示データ上で表現するための表示データ制御処理を実行する。

　「会話全体の盛り上がり」を表示データ上で表現するための表示データ制御処理に利用する解析対象データは、「図１２に示す表の項目（１１）の（ｂ）」に示すようにユーザ端末２１のマイクが取得するユーザ発話音声、笑い声、叫び声、驚きの声等、さらに、ユーザ端末２１のカメラが取得するユーザの顔画像、例えば、笑い顔、うなずき等のアクションを示す画像である。

　「会話全体の盛り上がり」を表示データ上で表現するために実行するデータ解析処理は、「図１２に示す表の項目（１１）の（ｃ）」に示すように、音声データ解析部５３におけるユーザ発話の音声解析、意味解析等と、さらに、画像データ解析部５５におけるユーザ画像の解析処理である。

　さらに、「会話全体の盛り上がり」を表示データ上で表現するために、表示データ制御部５６が実行する表示データ制御処理は、「図１２に示す表の項目（１１）の（ｄ）」に示すように以下の処理である。
　すなわち、盛り上がりを示す会話を構成する複数の発話テキスト表示円、またはユーザアイコンに対して、以下のａ～ｃの少なくともいずれかの表示制御を実行する。
　ａ．揺れ（縦揺れ、ゆっくり回転、飛ぶように移動等）、
　ｂ．サイズの拡縮、
　ｃ．色の変化（明るい色に変化）、
　なお、これらａ，ｂ，ｃの処理は単独で実行する設定としても、併せて実行する設定としてもよい。

　これらの処理は、先に図２９を参照して説明した「（９）ユーザのポジティブアクション」に対する表示制御処理と同様の処理である。
　さらに、「会話全体の盛り上がり」を表示データ上で表現すると独自の処理として、表示データ制御部５６は、以下のような表示データ制御処理を実行してもよい。
　すなわち、盛り上がりを示す会話を構成する複数の発話テキスト表示円や、ユーザアイコンの背景領域の色を変化（明るい色に変化）させる表示制御処理である。
　この処理の具体例について図３３を参照して説明する。

　図３３には、複数の発話テキスト表示円を示している。表示データ制御部５６は、これらの複数の発話によって構成される会話が盛り上がっていると判定した場合、図に示すように、これら発話テキスト表示円の背景領域の色を変化（明るい色に変化）させる表示制御処理を実行する。

　さらに、図３４に示すように、発話テキスト表示円の背景領域の色を変化（明るい色に変化）させるとともに、輝き等を示すエフェクト画像を表示する制御を行ってもよい。

　（１２）会話全体の盛り下がり
　情報処理装置（サーバ）５０は、ミーティング参加ユーザの「会話全体の盛り下がり」を表示データ上で表現するための表示データ制御処理を実行する。

　「会話全体の盛り下がり」を表示データ上で表現するための表示データ制御処理に利用する解析対象データは、「図１３に示す表の項目（１２）の（ｂ）」に示すようにユーザ端末２１のマイクが取得するユーザ発話音声、失笑、沈黙等、さらに、ユーザ端末２１のカメラが取得するユーザの顔画像、例えば、困った顔、首振り等の否定的アクションを示す画像である。

　「会話全体の盛り下がり」を表示データ上で表現するために実行するデータ解析処理は、「図１３に示す表の項目（１２）の（ｃ）」に示すように、音声データ解析部５３におけるユーザ発話の音声解析、意味解析等と、さらに、画像データ解析部５５におけるユーザ画像の解析処理である。

　さらに、「会話全体の盛り下がり」を表示データ上で表現するために、表示データ制御部５６が実行する表示データ制御処理は、「図１３に示す表の項目（１２）の（ｄ）」に示すように以下の処理である。
　すなわち、盛り下がりを示す会話を構成する複数の発話テキスト表示円、またはユーザアイコンに対して、以下のａ～ｃの少なくともいずれかの表示制御を実行する。
　ａ．揺れ（激しい横揺れ、のろのろ移動等）、
　ｂ．サイズの拡縮、形状の歪み（つぶれた楕円などに変形等）
　ｃ．色の変化（暗い色に変化）、
　なお、これらａ，ｂ，ｃの処理は単独で実行する設定としても、併せて実行する設定としてもよい。

　これらの処理は、先に図３１を参照して説明した「（９）ユーザのネガティブアクション」に対する表示制御処理と同様の処理である。
　さらに、「会話全体の盛り下がり」を表示データ上で表現すると独自の処理として、表示データ制御部５６は、以下のような表示データ制御処理を実行してもよい。
　すなわち、盛り下がりを示す会話を構成する複数の発話テキスト表示円や、ユーザアイコンの背景領域の色を変化（暗い色に変化）させる表示制御処理である。
　この処理の具体例について図３５を参照して説明する。

　図３５には、複数の発話テキスト表示円を示している。表示データ制御部５６は、これらの複数の発話によって構成される会話が盛り下がっていると判定した場合、図に示すように、これら発話テキスト表示円の背景領域の色を変化（暗い色に変化）させる表示制御処理を実行する。

　さらに、図３６に示すように、発話テキスト表示円の背景領域の色を変化（暗い色に変化）させるとともに、盛り下がりを示すエフェクト画像を表示する制御を行ってもよい。

　（１３）意見の分類
　情報処理装置（サーバ）５０は、ミーティング参加ユーザの「意見の分類」を表示データ上で表現するための表示データ制御処理を実行する。

　「意見の分類」を表示データ上で表現するための表示データ制御処理に利用する解析対象データは、「図１４に示す表の項目（１３）の（ｂ）」に示すようにユーザ端末２１のマイクが取得するユーザ発話音声、さらに、ユーザ端末２１のカメラが取得するユーザの顔画像、例えば、笑い顔、困った顔、首振り、その他賛成、反対を示す画像である。

　「意見の分類」を表示データ上で表現するために実行するデータ解析処理は、「図１４に示す表の項目（１３）の（ｃ）」に示すように、音声データ解析部５３におけるユーザ発話の音声解析、意味解析等と、さらに、画像データ解析部５５におけるユーザ画像の解析処理である。

　さらに、「意見の分類」を表示データ上で表現するために、表示データ制御部５６が実行する表示データ制御処理は、「図１４に示す表の項目（１３）の（ｄ）」に示すように以下の処理である。
　ａ．複数の意見グループ各々について、個別の発話テキスト表示円のデータ系列を生成し、異なる意見の系列と分離したデータ系列として表示
　ｂ．同一、類似意見の発話の発話テキスト表示円は、同一、または同系色の色に設定して表示
　なお、これらａ，ｂの処理は単独で実行する設定としても、併せて実行する設定としてもよい。

　情報処理装置（サーバ）５０の表示データ制御部５６が実行する表示制御処理の具体例を図３７に示す。

　図３７には、複数の発話テキスト表示円を示している。発話テキスト表示円７１－１は、
　発話＝「ペットは何が好き」
　このような各ユーザの意見を求める発話である。

　この発話に対して、図に示すように、犬好きのグループと猫好きのグループの２つのグループが設定されたとする。
　発話テキスト表示円７１－２と、発話テキスト表示円７１－４は、犬好きのグループのユーザの発話である。
　一方、発話テキスト表示円７１－３と、発話テキスト表示円７１－５と、発話テキスト表示円７１－６は、猫好きのグループのユーザの発話である。

　このような場合、表示データ制御部５６は、それぞれのグループ単位で個別の発話テキスト表示円のデータ系列を生成して表示する。すなわち、図に示すように、犬好きのグループのユーザの発話である発話テキスト表示円７１－２と、発話テキスト表示円７１－４を並べて配置する。
　さらに、猫好きのグループのユーザの発話である発話テキスト表示円７１－３と、発話テキスト表示円７１－５と、発話テキスト表示円７１－６を、上記の犬好きのグループの発話円と離れた位置に並べて配置する。

　このような表示を行うことで、各ユーザの意見がどちらであるかを容易に判別することができる。

　　［４．ユーザ端末における表示データ制御処理について］
　次に、ユーザ端末における表示データ制御処理について説明する。

　先に図１等を参照して説明したように、リモートミーティングを実行しているユーザ１１は、ユーザの利用するユーザ端末２１を利用して、図２に示すような発話テキスト表示円７１の時系列データから構成される表示データを見ながらミーティングに参加することができる。

　前述したように、各ユーザ１１のユーザ端末２１に表示される表示データは、リモートミーティングのプラットフォームを提供しミーティングの管理処理を実行する情報処理装置（サーバ）５０が生成する表示データである。

　一方、ユーザ１１は、ユーザ端末２１を利用して、情報処理装置（サーバ）５０から提供される表示データの表示制御を行うことができる。
　図３８以下を参照して、ユーザ１１によるユーザ端末２１を利用した表示データの制御処理例について説明する。

　図３８は、ユーザ１１が利用するユーザ端末２１に表示される表示データ制御用のＵＩ（ユーザインタフェース）の一例である。

　図３８に示すＵＩ（ユーザインタフェース）は、可視化要素各々について、可視化設定を有効化（ＯＮ）するか、無効化（ＯＦＦ）とするかを設定し、さらに有効化（ＯＮ）の設定とした可視化要素について可視化レベル（Ｍｉｎ～Ｍａｘ）を設定可能としたＵＩ（ユーザインタフェース）である。

　図に示す例では、例えば、「可視化要素＝声の大きさ」についての設定は、有効化（ＯＮ）の設定で、その可視化レベルの設定は、約５０％の設定となっている。
　この場合、先に図１５を参照して説明したユーザ発話の声の大きさに応じた発話テキスト表示円の拡大率が５０％に削減された表示データが情報処理装置（サーバ）５０において生成され、ユーザは、そのような表示データを見ることが可能となる。

　また、例えば、「可視化要素＝会話中心」や、「可視化要素＝会話の盛り上がり」についての設定は、無効化（ＯＦＦ）の設定となっている。
　この設定の場合、先に図２２、図２４を参照して説明したユーザ発話が会話の中心である場合の表示制御や、図３３を参照して説明した会話の盛り上がりに応じた表示制御が実行されていない表示データが情報処理装置（サーバ）５０において生成され、ユーザは、そのような表示データを見ることが可能となる。

　なお、情報処理装置（サーバ）５０は、各ユーザの設定に応じたユーザ対応の様々な表示データを生成し、各ユーザに提供する処理を行う。

　さらに、様々なミーティンググループが同時に異なるテーマでリモートミーティングを行っている場合、ユーザ１１は、ユーザ端末２１を利用して、これら複数のミーティングのテーマを確認することが可能となる。

　このミーティングテーマ確認処理に利用されるＵＩ（ユーザインタフェース）の例を図３９に示す。
　図３９に示すＵＩ（ユーザインタフェース）も、ユーザ１１が利用するユーザ端末２１に表示されるＵＩである。

　ＵＩ画面の左側には、現在、リモートミーティングを実行中の複数のグループの会話のテーマ情報が表示されている。このテーマは、情報処理装置（サーバ）５０における会話解析処理、例えば中心的発話の選択処理やキーワード選択処理によって推定されたテーマである。

　ユーザは、これらのグループから１つを選択すると、そのグループ対応の発話テキスト表示円の時系列データが右側に表示される。
　例えば、タッチパネルの場合、図に示すように１つのグループアイコン（グループｂ）を指でタップする。あるいはＰＣ等の場合、カーソルを１つのグループアイコン（グループｂ）上に移動させるマウスオン、あるいはマウスオーバー処理などのグループ選択処理を行う。このグループ選択処理によって、選択したグループ対応の発話テキスト表示円の時系列データが右側に表示される。

　図に示す例では、グループｂのレストランをテーマとしたミーティングの発話テキスト表示円の時系列データが表示されている。

　このように、ユーザ１１は、自身が利用するユーザ端末２１を利用して、様々なグループにおいて実行されているミーティングのテーマを確認し、さらに、各グループにおけるユーザ発話の時系列データを確認することができる。
　また、右側のユーザ発話の時系列データは、先に説明した様々な可視化要素を可視化した表示データであり、ユーザは、この表示データを見ることで、例えば会話が盛り上がっているか否かなどを容易に確認することができる。

　複数のグループが異なるテーマで、それぞれミーティングを実行している場合、ユーザ１１は、ユーザ端末２１を利用して、１つのグループに関するユーザ発話の時系列データを観察できるのみならず、複数のグループに関するユーザ発話の時系列データも確認することができる。

　図４０は、先に図２等を参照して説明したと同様、１つのグループにおけるユーザ発話の時系列データを表示した表示データである。
　ユーザ１１がこの表示データの表示部を縮小させるための操作、例えばＰＣのキーボード操作や、タッチパネルにおける２本の指を閉じるピンチイン動作などを行うと、図４１に示すように、表示部に、複数のミーティンググループのユーザ発話の時系列データの縮小版が表示される。

　ただし、このような小さなユーザ発話の時系列データの縮小版中に発話テキストを表示しても見えにくいため、各グループのミーティングテーマのみを表示する。
　ユーザはこのような表示データによって、同時に実行されている複数のミーティンググループのミーティングテーマを確認することができる。

　また、ミーティングテーマのみの表示以外の表示バリエーションとして、発話テキスト中のキーワードのみ残して表示するようにしてもよい。例えば、「この前行ったミラノダイニングおいしかったよ。」という発話テキストであれば、ユーザ発話の時系列データの縮小版には、「ミラノダイニング」というキーワードのみ表示する。また、発話テキストが十分短く、キーワードのみ残す必要がない場合には、発話テキストをそのままユーザ発話の時系列データの縮小版に表示するようにしてもよい。例えば、「なんのお店？」という発話テキストであれば、十分短いため、そのまま「なんのお店？」と表示してもよい。また、ユーザ発話の時系列データの縮小版には、表示円の中にユーザアイコンを引き続き表示するようにしてもよい。

　なお、さらに、図４１に示す複数のミーティンググループのユーザ発話の時系列データの縮小版の表示データから、ユーザ１１が１つのグループを選択して拡大する処理、例えばタッチパネルにおいて２本の指を開くピンチアウト操作を行えば、そのグループのユーザ発話の時系列データを拡大した表示データが表示され、各ユーザの具体的な発話テキストを確認することが可能となる。

　　［５．ユーザの生体情報等を利用した表示制御を実行する実施例について］
　次に、ユーザの生体情報等を利用した表示制御を実行する実施例について説明する。

　上述した実施例は、例えば図４、図５を参照して説明したように、情報処理装置（サーバ）５０がユーザ端末２１からユーザ端末２１のマイクの取得音声と、カメラの撮影画像を入力して、リモートミーティング参加ユーザの状態やミーティングの状態を解析して解析結果に応じた表示データを生成する実施例である。

　以下に説明する実施例は、情報処理装置（サーバ）５０が、ユーザ端末２１からの入力情報として、マイクの取得音声とカメラの撮影画像のみならずユーザ１１の生体情報も入力し、これらの入力情報の解析処理を実行して、より詳細なユーザ状態を推定して表示データの制御処理を実行する実施例である。

　ユーザ端末２１から入力するユーザ１１の生体情報は、例えば、ユーザの視線方向や、脈拍、心拍、体温、血圧などの様々な生体情報である。これらは、ユーザ１１自身に装着したセンサーや、ユーザ１１周囲に取り付けられたセンサーが取得し、ユーザ端末２１を介して情報処理装置（サーバ）５０に送信される。

　図４２は、本実施例におけるユーザ端末２１と情報処理装置（サーバ）５０間のデータの流れを説明する図である。
　図４２は、先の実施例で説明した図４と同様、リモートミーティングを実行中の複数のユーザ１１ａ～ｅ各々が利用するユーザ端末２１ａ～ｅと、情報処理装置（サーバ）５０を示している。

　図４２に示すように、情報処理装置（サーバ）５０は、リモートミーティングを実行中の複数のユーザ１１ａ～ｅ各々が利用するユーザ端末２１ａ～ｅ各々から音声データと画像データ、さらにに、ユーザ生体情報を受信する。

　ユーザ生体情報とは、前述したように、例えば、ユーザの視線方向や、脈拍、心拍、体温、血圧などの様々な生体情報である。これらは、ユーザ１１自身に装着したセンサーや、ユーザ１１周囲に取り付けられたセンサーが取得し、ユーザ端末２１を介して情報処理装置（サーバ）５０に送信される。

　図４２に示すように、情報処理装置（サーバ）５０は、ステップＳ１１～ステップＳ１２の各処理を実行する。

　すなわち、ステップＳ１１において、ユーザ端末２１ａ～ｅから受信する入力データ（音声データ、画像データ、ユーザ生体情報）に対する解析処理を実行する。
　次に、ステップＳ１２において、ステップＳ１１のデータ解析結果を用いて表示データを生成する。
　具体的には、先の実施例において説明した例えば図２、図３に示すような発話テキスト表示円７１の時系列データによって構成される表示データを生成する。

　情報処理装置（サーバ）５０は、例えばユーザの視線方向を解析することで、ユーザ１１のミーティングに対する集中度や、興味関心度を解析することが可能となり、これら集中度や、興味関心度を可視化した表示データを生成して表示することが可能となる。

　また、ユーザの体温や脈拍、血圧などを解析することで、ユーザの冷静度、興奮度などを解析し、これらのユーザ状態を可視化した表示データを生成して表示することも可能となる。

　本実施例における情報処理装置（サーバ）５０の構成例について図４３を参照して説明する。
　図４３に示すように、情報処理装置（サーバ）５０は、通信部５１、音声データ取得部５２、音声データ解析部５３、画像データ取得部５４、画像データ解析部５５、表示データ制御部５６、表示データ生成部５７、さらに、ユーザ生体情報取得部６１、ユーザ生体情報解析部６２を有する。

　これらの構成中、通信部５１、音声データ取得部５２、音声データ解析部５３、画像データ取得部５４、画像データ解析部５５、表示データ制御部５６、表示データ生成部５７、これらは、先の実施例において、図５を参照して説明した構成部と同様の構成部である。

　通信部５１は、リモートミーティングを実行中のユーザ端末２１から音声データと画像データと、ユーザ生体情報を受信する。

　受信する音声データは、ユーザ端末２１のマイクが取得した音声データであり、ユーザ発話音声や、笑い声、手をたたく音、環境音などが含まれる音声データである。
　また画像データは、ユーザ端末２１のカメラが取得した画像データであり、ユーザの顔画像が含まれる画像データである。
　ユーザ生体情報は、前述したように、例えば、ユーザの視線方向や、脈拍、心拍、体温、血圧などの様々な生体情報である。

　音声データ取得部５２と音声データ解析部５３の実行する処理は、先に図５を参照して説明した処理と同様の処理である。すなわち、ユーザ端末２１のマイクが取得した音声データ、例えばユーザ発話音声や、笑い声、手をたたく音、環境音などが含まれる音声データを解析して解析結果を表示データ制御部５６に入力する。

　画像データ取得部５４と、画像データ解析部５５の実行する処理は、先に図５を参照して説明した処理と同様の処理である。すなわち、ユーザ端末２１のカメラが取得した画像データであるミーティング参加ユーザの顔画像を含む画像データを解析して、
顔の表情や、笑い顔やうなずくような肯定的なアクション、困った顔や悲しい顔、さらに顔を横に振るような否定的なアクション等の解析処理を実行し、解析結果を表示データ制御部５６に入力する。

　ユーザ生体情報取得部６１は、通信部５１を介した入力データから、ユーザ生体情報を選択取得し、取得したユーザ生体情報をユーザ生体情報解析部６２に転送する。

　ユーザ生体情報取得部６１が取得するユーザ生体情報は、前述したように、例えば、ユーザの視線方向や、脈拍、心拍、体温、血圧などの様々な生体情報である。これらは、ユーザ１１自身に装着したセンサーや、ユーザ１１周囲に取り付けられたセンサーが取得し、ユーザ端末２１から送信されるデータである。

　ユーザ生体情報解析部６２は、各ユーザ端末２１から受信するユーザ生体情報を解析する。
　例えばユーザ端末２１から受信するユーザの視線方向を解析して、ユーザ１１のミーティングに対する集中度や、興味関心度を解析する。
　また、ユーザの体温や脈拍、血圧などを解析して、ユーザ１１の冷静度、興奮度などを解析する。
　これらの解析結果は、表示データ制御部５６に入力される。

　表示データ制御部５６は、音声データ解析部５３が解析した音声データ解析結果と、画像データ解析部５５が解析した画像データ解析結果、さらに、ユーザ生体情報解析部６２が解析したユーザ生体情報解析結果を入力し、これらの入力データに基づいて、ユーザ端末２１に提供する画像データ、すなわち先に図２、図３を参照して説明したリモートミーティングの発話テキストを含む発話テキスト表示円の時系列表示データの制御処理を実行する。

　本実施例では、表示データ制御部５６は、ユーザ生体情報解析部６２が解析したユーザ状態を反映した表示データ制御処理を行うことが可能となる。
　具体的には、ユーザの視線方向の解析結果に基づいて推定されるユーザのミーティングに対する集中度や、興味関心度を可視化した表示データの生成を行う。
　また、ユーザの体温や脈拍、血圧などから推定されるユーザの冷静度、興奮度などを可視化した表示データを生成する。

　表示データ制御部５６は、リモートミーティングの参加ユーザの感情や状態、さらにミーティング全体の盛り上がり度などの雰囲気などを可視化した表示データを生成するための表示データ制御処理、すなわち表示データを構成する発話テキスト表示円のサイズ、色、動き、その他のエフェクト表示態様等の決定処理、背景の色などの決定処理など、様々な表示データ制御処理を実行する。

　ユーザ１１は、ユーザ端末２１の表示部に表示される表示データを見ることで、ミーティング参加者の発話をテキスト情報として確認することが可能となり、さらにユーザ状態や会話状態（ミーティング状態）の確認も可能となる。

　　［６．ユーザ端末の構成例について］
　次に、ユーザ端末の構成例について説明する。

　図４４を参照してユーザ１１が利用するユーザ端末２１の構成例について説明する。
　図４４に示すように、ユーザ端末２１は、入力部３１０と、出力部３２０、および通信部３３０を有する。
　入力部３１０は、音声入力部（マイク）３１１と、画像入力部（カメラ）３１２と、ユーザ入力部（ＵＩ）３１３、およびセンサー検出値入力部３１４を有する。
　出力部３２０は、音声出力部（スピーカ）３２１と、画像出力部（表示部）３２２を有する。

　入力部３１０の音声入力部（マイク）３１１は、ユーザの声などの音声データを取得する。取得音声データは通信部３３０を介して情報処理装置（サーバ）５０に送信される。
　画像入力部（カメラ）３１２は、ユーザの顔画像などの画像データを取得する。取得画像データは通信部３３０を介して情報処理装置（サーバ）５０に送信される。

　ユーザ入力部（ＵＩ）３１３は、例えばキーボード、マウス、タッチパネル等であり、例えば先に図３８～図４１を参照して説明したようなＵＩを利用した表示データ設定などの処理に用いられる。

　センサー検出値入力部３１４は、例えば視線方向検出センサーや、脈拍、心拍、体温、血圧等の計測センサー等、生体情報等のユーザ状態を取得するセンサーの検出値を入力する。入力データは通信部３３０を介して情報処理装置（サーバ）５０に送信される。

　　［７．情報処理装置、およびユーザ端末のハードウェア構成例について］
　次に、情報処理装置（サーバ）や、ユーザ端末のハードウェア構成例について説明する。

　図４５は、本開示の情報処理装置（サーバ）５０や、ユーザ端末２１のハードウェア構成の一例を示す図である。
　以下、図４５に示すハードウェア構成について説明する。

　ＣＰＵ（Ｃｅｎｔｒａｌ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）５０１は、ＲＯＭ（Ｒｅａｄ　Ｏｎｌｙ　Ｍｅｍｏｒｙ）５０２、または記憶部５０８に記憶されているプログラムに従って各種の処理を実行する制御部やデータ処理部として機能する。例えば、上述した実施例において説明したシーケンスに従った処理を実行する。ＲＡＭ（Ｒａｎｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ）５０３には、ＣＰＵ５０１が実行するプログラムやデータなどが記憶される。これらのＣＰＵ５０１、ＲＯＭ５０２、およびＲＡＭ５０３は、バス５０４により相互に接続されている。

　ＣＰＵ５０１はバス５０４を介して入出力インタフェース５０５に接続され、入出力インタフェース５０５には、各種スイッチ、キーボード、マウス、マイクロホン、センサーなどよりなる入力部５０６、ディスプレイ、スピーカーなどよりなる出力部５０７が接続されている。ＣＰＵ５０１は、入力部５０６から入力される指令に対応して各種の処理を実行し、処理結果を例えば出力部５０７に出力する。

　入出力インタフェース５０５に接続されている記憶部５０８は、例えばハードディスク等からなり、ＣＰＵ５０１が実行するプログラムや各種のデータを記憶する。通信部５０９は、Ｗｉ－Ｆｉ通信、ブルートゥース（登録商標）（ＢＴ）通信、その他インターネットやローカルエリアネットワークなどのネットワークを介したデータ通信の送受信部として機能し、外部の装置と通信する。

　入出力インタフェース５０５に接続されているドライブ５１０は、磁気ディスク、光ディスク、光磁気ディスク、あるいはメモリカード等の半導体メモリなどのリムーバブルメディア５１１を駆動し、データの記録あるいは読み取りを実行する。

　　［８．本開示の構成のまとめ］
　以上、特定の実施例を参照しながら、本開示の実施例について詳解してきた。しかしながら、本開示の要旨を逸脱しない範囲で当業者が実施例の修正や代用を成し得ることは自明である。すなわち、例示という形態で本発明を開示してきたのであり、限定的に解釈されるべきではない。本開示の要旨を判断するためには、特許請求の範囲の欄を参酌すべきである。

　なお、本明細書において開示した技術は、以下のような構成をとることができる。
　（１）　通信ネットワークを介して会話を実行するユーザ端末からの受信データを解析するデータ解析部と、
　前記データ解析部の解析結果に基づいて、前記ユーザ端末に提供するユーザ発話対応のテキストを含む発話テキスト表示領域を有する表示データの制御を実行する表示データ制御部を有し、
　前記表示データ制御部は、
　前記発話テキスト表示領域または背景領域の少なくともいずれかの表示態様を制御して、会話を実行するユーザのユーザ状態、または会話状態の少なくともいずれかの状態を可視化した表示データを生成する情報処理装置。

　（２）　前記表示データ制御部は、
　前記発話テキスト表示領域のサイズ、または位置、または色、または動き、または前記発話テキスト表示領域周囲の出力画像の少なくともいずれかを制御して、会話を実行するユーザのユーザ状態、または会話状態の少なくともいずれかの状態を可視化した表示データを生成する（１）に記載の情報処理装置。

　（３）　前記データ解析部は、前記ユーザ端末から受信する音声データと画像データを解析し、
　前記表示データ制御部は、
　前記データ解析部が解析した音声データの解析結果、または画像データの解析結果の少なくともいずれかの解析結果に基づいて、前記ユーザ端末に表示する表示データの制御を実行する（１）または（２）に記載の情報処理装置。

　（４）　前記表示データ制御部は、
　前記データ解析部が解析したユーザ発話の声の大きさに応じて、前記発話テキスト表示領域のサイズを変更する（１）～（３）いずれかに記載の情報処理装置。

　（５）　前記表示データ制御部は、
　前記データ解析部が解析したユーザ発話の明暗に応じて、前記発話テキスト表示領域の色を変更、または前記発話テキスト表示領域の周囲にエフェクト画像を出力する（１）～（４）いずれかに記載の情報処理装置。

　（６）　前記表示データ制御部は、
　前記データ解析部が解析したユーザ発話内のキーワードに応じて、前記発話テキスト表示領域に表示するユーザ発話対応のテキスト中のキーワード領域を拡大表示、または色の変更表示の少なくともいずれかの処理を実行する（１）～（５）いずれかに記載の情報処理装置。

　（７）　前記表示データ制御部は、
　前記データ解析部が解析したユーザ発話の時系列情報に応じて、前記発話テキスト表示領域の表示位置の変更、または前記発話テキスト表示領域の色を変更する（１）～（６）いずれかに記載の情報処理装置。

　（８）　前記表示データ制御部は、
　前記データ解析部が複数のユーザ発話から選択した中心的ユーザ発話、または支配的ユーザ発話に対応する発話テキスト表示領域について、表示位置またはサイズの制御処理、または会話中心識別アイコンの追加表示処理の少なくともいずれかの処理を実行する（１）～（７）いずれかに記載の情報処理装置。

　（９）　前記表示データ制御部は、
　前記データ解析部の解析結果として、ある後続ユーザ発話が特定の先行発話に対する発話であるとの解析結果を入力した場合、
　前記後続発話の発話テキスト表示領域を、前記先行発話対応の発話テキスト表示領域に接触、または近づくように移動させて表示する（１）～（８）いずれかに記載の情報処理装置。

　（１０）　前記表示データ制御部は、
　前記データ解析部の解析結果として、ある後続ユーザ発話が特定の先行発話に対する賛同発話であるとの解析結果を入力した場合、
　前記後続発話の発話テキスト表示領域を、前記先行発話対応の発話テキスト表示領域に近づくように移動させて表示する表示制御、または、
　前記後続発話の発話テキスト表示領域の色を、前記先行発話対応の発話テキスト表示領域の色の同系色の色とする表示制御の少なくともいずれかの表示制御処理を実行する（１）～（９）いずれかに記載の情報処理装置。

　（１１）　前記表示データ制御部は、
　前記データ解析部の解析結果として、ある後続ユーザ発話が特定の先行発話に対する否定発話であるとの解析結果を入力した場合、
　前記後続発話の発話テキスト表示領域を、前記先行発話対応の発話テキスト表示領域から離れるように移動させて表示する表示制御、または、
　前記後続発話の発話テキスト表示領域の色を、前記先行発話対応の発話テキスト表示領域の色と異なる色とする表示制御の少なくともいずれかの表示制御処理を実行する（１）～（１０）いずれかに記載の情報処理装置。

　（１２）　前記表示データ制御部は、
　前記データ解析部がユーザのポジティプアクションを検出した場合、
　ポジティブアクションを示したユーザの発話テキスト表示円、またはユーザアイコンを揺らす制御、またはサイズの拡縮制御、または色を明るい色に変化させる色変更制御の少なくともいずれかの表示制御を実行し、
　前記データ解析部がユーザのネガティブアクションを検出した場合、
　ネガティブアクションを示したユーザの発話テキスト表示円、またはユーザアイコンを揺らす制御、またはサイズの拡縮制御、または色を暗い色に変化させる色変更制御の少なくともいずれかの表示制御を実行する（１）～（１１）いずれかに記載の情報処理装置。

　（１３）　前記表示データ制御部は、
　前記データ解析部が会話の盛り上がりを検出した場合、
　ユーザの発話テキスト表示円、またはユーザアイコンを揺らす制御、またはサイズの拡縮制御、または色を明るい色に変化させる色変更制御、または盛り上がりを示す会話を構成する複数のユーザ発話に対応する発話テキスト表示領域を含む背景領域の色を明るい色に変化させる背景色変更制御の少なくともいずれかの表示制御を実行する（１）～（１２）いずれかに記載の情報処理装置。

　（１４）　前記表示データ制御部は、
　前記データ解析部が会話の盛り下がりを検出した場合、
　ユーザの発話テキスト表示円、またはユーザアイコンを揺らす制御、またはサイズの拡縮制御、または色を暗い色に変化させる色変更制御、または盛り下がりを示す会話を構成する複数のユーザ発話に対応する発話テキスト表示領域を含む背景領域の色を暗い色に変化させる背景色変更制御の少なくともいずれかの表示制御を実行する（１）～（１３）いずれかに記載の情報処理装置。

　（１５）　前記表示データ制御部は、
　前記データ解析部から、複数のユーザ発話対応の意見の分類結果を入力した場合、
　複数の意見グループ各々について個別の発話テキスト表示領域データ系列を生成して表示する表示制御、または、同一、または類似意見の発話テキスト表示領域の色を同系色に設定して表示する表示制御の少なくともいずれかの処理を実行する（１）～（１４）いずれかに記載の情報処理装置。

　（１６）　前記ユーザ端末からの受信データは、ユーザの生体情報を含み、
　前記データ解析部は、前記ユーザ端末から受信するユーザの生体情報を解析し、
　前記表示データ制御部は、
　前記データ解析部が解析したユーザの生体情報の解析結果に基づいて、前記ユーザ端末に表示する表示データの制御を実行する（１）～（１５）いずれかに記載の情報処理装置。

　（１７）　前記表示データ制御部は、
　前記ユーザ端末から入力するユーザ設定情報に従った表示データを生成する（１）～（１６）いずれかに記載の情報処理装置。

　（１８）　前記ユーザ設定情報は、個別の可視化要素のオンオフ設定情報、または個別の可視化要素の可視化レベル設定情報の少なくともいずれかを含む（１７）に記載の情報処理装置。

　（１９）　通信ネットワークを介して会話を実行する複数のユーザ端末と、前記会話を管理するサーバを有する情報処理システムであり、
　前記ユーザ端末は、
　マイクを介して取得した音声データとカメラが撮影した画像データを前記サーバに送信し、
　前記サーバは、
　前記ユーザ端末から受信する音声データと画像データを解析し、
　解析結果に基づいて、前記ユーザ端末に提供するユーザ発話対応のテキストを含む発話テキスト表示領域を有する表示データの制御処理として、
　前記発話テキスト表示領域または背景領域の少なくともいずれかの表示態様を調整して、会話を実行するユーザのユーザ状態、または会話状態の少なくともいずれかの状態を可視化した表示データを生成して前記ユーザ端末に送信し、
　前記ユーザ端末は、
　前記サーバの生成した発話テキスト表示領域を含む表示データを表示部に表示する情報処理システム。

　（２０）　情報処理装置において実行する情報処理方法であり、
　データ解析部が、通信ネットワークを介して会話を実行するユーザ端末からの受信データを解析するデータ解析ステップと、
　表示データ制御部が、前記データ解析ステップにおける解析結果に基づいて、前記ユーザ端末に提供するユーザ発話対応のテキストを含む発話テキスト表示領域を有する表示データの制御を実行する表示データ制御ステップを有し、
　前記表示データ制御ステップは、
　前記発話テキスト表示領域または背景領域の少なくともいずれかの表示態様を制御して、会話を実行するユーザのユーザ状態、または会話状態の少なくともいずれかの状態を可視化した表示データを生成するステップである情報処理方法。

　また、明細書中において説明した一連の処理はハードウェア、またはソフトウェア、あるいは両者の複合構成によって実行することが可能である。ソフトウェアによる処理を実行する場合は、処理シーケンスを記録したプログラムを、専用のハードウェアに組み込まれたコンピュータ内のメモリにインストールして実行させるか、あるいは、各種処理が実行可能な汎用コンピュータにプログラムをインストールして実行させることが可能である。例えば、プログラムは記録媒体に予め記録しておくことができる。記録媒体からコンピュータにインストールする他、ＬＡＮ（Ｌｏｃａｌ　Ａｒｅａ　Ｎｅｔｗｏｒｋ）、インターネットといったネットワークを介してプログラムを受信し、内蔵するハードディスク等の記録媒体にインストールすることができる。

　なお、明細書に記載された各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。また、本明細書においてシステムとは、複数の装置の論理的集合構成であり、各構成の装置が同一筐体内にあるものには限らない。

　以上、説明したように、本開示の一実施例の構成によれば、通信ネットワークを介して会話を実行するユーザ端末の表示部に表示する表示データを制御して、ユーザ状態や会話状態を可視化した表示データを生成する構成が実現される。
　具体的には、例えば、通信ネットワークを介して会話を実行するユーザ端末からの受信データを解析し、解析結果に基づいてユーザ端末に提供するユーザ発話対応のテキストを含む発話テキスト表示領域を有する表示データの制御を実行する。表示データ制御部は、発話テキスト表示領域のサイズ、または位置、または色、または動き、または発話テキスト表示領域周囲の出力画像の少なくともいずれかを制御して、会話を実行するユーザのユーザ状態、または会話状態の少なくともいずれかの状態を可視化した表示データを生成する。
　本構成により、通信ネットワークを介して会話を実行するユーザ端末の表示部に表示する表示データを制御して、ユーザ状態や会話状態を可視化した表示データを生成する構成が実現される。

　　１１　ユーザ
　　２１　ユーザ端末
　　５０　情報処理装置（サーバ）
　　５１　通信部
　　５２　音声データ取得部
　　５３　音声データ解析部
　　５４　画像データ取得部
　　５５　画像データ解析部
　　５６　表示データ制御部
　　５７　表示データ生成部
　　６１　ユーザ生体情報取得部
　　６２　ユーザ生体情報解析部
　　７１　発話テキスト表示円
　　７２　発話テキスト
　　７３　ユーザアイコン
　３１０　入力部
　３１１　音声入力部（マイク）
　３１２　画像入力部（カメラ）
　３１３　ユーザ入力部（ＵＩ）
　３１４　センサー検出値入力部
　３２０　出力部
　３２１　音声出力部（スピーカ）
　３２２　画像出力部（表示部）
　３３０　通信部
　５０１　ＣＰＵ
　５０２　ＲＯＭ
　５０３　ＲＡＭ
　５０４　バス
　５０５　入出力インタフェース
　５０６　入力部
　５０７　出力部
　５０８　記憶部
　５０９　通信部
　５１０　ドライブ
　５１１　リムーバブルメディア

Claims

　通信ネットワークを介して会話を実行するユーザ端末からの受信データを解析するデータ解析部と、
　前記データ解析部の解析結果に基づいて、前記ユーザ端末に提供するユーザ発話対応のテキストを含む発話テキスト表示領域を有する表示データの制御を実行する表示データ制御部を有し、
　前記表示データ制御部は、
　前記発話テキスト表示領域または背景領域の少なくともいずれかの表示態様を制御して、会話を実行するユーザのユーザ状態、または会話状態の少なくともいずれかの状態を可視化した表示データを生成する情報処理装置。
　前記表示データ制御部は、
　前記発話テキスト表示領域のサイズ、または位置、または色、または動き、または前記発話テキスト表示領域周囲の出力画像の少なくともいずれかを制御して、会話を実行するユーザのユーザ状態、または会話状態の少なくともいずれかの状態を可視化した表示データを生成する請求項１に記載の情報処理装置。
　前記データ解析部は、前記ユーザ端末から受信する音声データと画像データを解析し、
　前記表示データ制御部は、
　前記データ解析部が解析した音声データの解析結果、または画像データの解析結果の少なくともいずれかの解析結果に基づいて、前記ユーザ端末に表示する表示データの制御を実行する請求項１に記載の情報処理装置。
　前記表示データ制御部は、
　前記データ解析部が解析したユーザ発話の声の大きさに応じて、前記発話テキスト表示領域のサイズを変更する請求項１に記載の情報処理装置。
　前記表示データ制御部は、
　前記データ解析部が解析したユーザ発話の明暗に応じて、前記発話テキスト表示領域の色を変更、または前記発話テキスト表示領域の周囲にエフェクト画像を出力する請求項１に記載の情報処理装置。
　前記表示データ制御部は、
　前記データ解析部が解析したユーザ発話内のキーワードに応じて、前記発話テキスト表示領域に表示するユーザ発話対応のテキスト中のキーワード領域を拡大表示、または色の変更表示の少なくともいずれかの処理を実行する請求項１に記載の情報処理装置。
　前記表示データ制御部は、
　前記データ解析部が解析したユーザ発話の時系列情報に応じて、前記発話テキスト表示領域の表示位置の変更、または前記発話テキスト表示領域の色を変更する請求項１に記載の情報処理装置。
　前記表示データ制御部は、
　前記データ解析部が複数のユーザ発話から選択した中心的ユーザ発話、または支配的ユーザ発話に対応する発話テキスト表示領域について、表示位置またはサイズの制御処理、または会話中心識別アイコンの追加表示処理の少なくともいずれかの処理を実行する請求項１に記載の情報処理装置。
　前記表示データ制御部は、
　前記データ解析部の解析結果として、ある後続ユーザ発話が特定の先行発話に対する発話であるとの解析結果を入力した場合、
　前記後続発話の発話テキスト表示領域を、前記先行発話対応の発話テキスト表示領域に接触、または近づくように移動させて表示する請求項１に記載の情報処理装置。
　前記表示データ制御部は、
　前記データ解析部の解析結果として、ある後続ユーザ発話が特定の先行発話に対する賛同発話であるとの解析結果を入力した場合、
　前記後続発話の発話テキスト表示領域を、前記先行発話対応の発話テキスト表示領域に近づくように移動させて表示する表示制御、または、
　前記後続発話の発話テキスト表示領域の色を、前記先行発話対応の発話テキスト表示領域の色の同系色の色とする表示制御の少なくともいずれかの表示制御処理を実行する請求項１に記載の情報処理装置。
　前記表示データ制御部は、
　前記データ解析部の解析結果として、ある後続ユーザ発話が特定の先行発話に対する否定発話であるとの解析結果を入力した場合、
　前記後続発話の発話テキスト表示領域を、前記先行発話対応の発話テキスト表示領域から離れるように移動させて表示する表示制御、または、
　前記後続発話の発話テキスト表示領域の色を、前記先行発話対応の発話テキスト表示領域の色と異なる色とする表示制御の少なくともいずれかの表示制御処理を実行する請求項１に記載の情報処理装置。
　前記表示データ制御部は、
　前記データ解析部がユーザのポジティプアクションを検出した場合、
　ポジティブアクションを示したユーザの発話テキスト表示円、またはユーザアイコンを揺らす制御、またはサイズの拡縮制御、または色を明るい色に変化させる色変更制御の少なくともいずれかの表示制御を実行し、
　前記データ解析部がユーザのネガティブアクションを検出した場合、
　ネガティブアクションを示したユーザの発話テキスト表示円、またはユーザアイコンを揺らす制御、またはサイズの拡縮制御、または色を暗い色に変化させる色変更制御の少なくともいずれかの表示制御を実行する請求項１に記載の情報処理装置。
　前記表示データ制御部は、
　前記データ解析部が会話の盛り上がりを検出した場合、
　ユーザの発話テキスト表示円、またはユーザアイコンを揺らす制御、またはサイズの拡縮制御、または色を明るい色に変化させる色変更制御、または盛り上がりを示す会話を構成する複数のユーザ発話に対応する発話テキスト表示領域を含む背景領域の色を明るい色に変化させる背景色変更制御の少なくともいずれかの表示制御を実行する請求項１に記載の情報処理装置。
　前記表示データ制御部は、
　前記データ解析部が会話の盛り下がりを検出した場合、
　ユーザの発話テキスト表示円、またはユーザアイコンを揺らす制御、またはサイズの拡縮制御、または色を暗い色に変化させる色変更制御、または盛り下がりを示す会話を構成する複数のユーザ発話に対応する発話テキスト表示領域を含む背景領域の色を暗い色に変化させる背景色変更制御の少なくともいずれかの表示制御を実行する請求項１に記載の情報処理装置。
　前記表示データ制御部は、
　前記データ解析部から、複数のユーザ発話対応の意見の分類結果を入力した場合、
　複数の意見グループ各々について個別の発話テキスト表示領域データ系列を生成して表示する表示制御、または、同一、または類似意見の発話テキスト表示領域の色を同系色に設定して表示する表示制御の少なくともいずれかの処理を実行する請求項１に記載の情報処理装置。
　前記ユーザ端末からの受信データは、ユーザの生体情報を含み、
　前記データ解析部は、前記ユーザ端末から受信するユーザの生体情報を解析し、
　前記表示データ制御部は、
　前記データ解析部が解析したユーザの生体情報の解析結果に基づいて、前記ユーザ端末に表示する表示データの制御を実行する請求項１に記載の情報処理装置。
　前記表示データ制御部は、
　前記ユーザ端末から入力するユーザ設定情報に従った表示データを生成する請求項１に記載の情報処理装置。
　前記ユーザ設定情報は、個別の可視化要素のオンオフ設定情報、または個別の可視化要素の可視化レベル設定情報の少なくともいずれかを含む請求項１７に記載の情報処理装置。
　通信ネットワークを介して会話を実行する複数のユーザ端末と、前記会話を管理するサーバを有する情報処理システムであり、
　前記ユーザ端末は、
　マイクを介して取得した音声データとカメラが撮影した画像データを前記サーバに送信し、
　前記サーバは、
　前記ユーザ端末から受信する音声データと画像データを解析し、
　解析結果に基づいて、前記ユーザ端末に提供するユーザ発話対応のテキストを含む発話テキスト表示領域を有する表示データの制御処理として、
　前記発話テキスト表示領域または背景領域の少なくともいずれかの表示態様を調整して、会話を実行するユーザのユーザ状態、または会話状態の少なくともいずれかの状態を可視化した表示データを生成して前記ユーザ端末に送信し、
　前記ユーザ端末は、
　前記サーバの生成した発話テキスト表示領域を含む表示データを表示部に表示する情報処理システム。
　情報処理装置において実行する情報処理方法であり、
　データ解析部が、通信ネットワークを介して会話を実行するユーザ端末からの受信データを解析するデータ解析ステップと、
　表示データ制御部が、前記データ解析ステップにおける解析結果に基づいて、前記ユーザ端末に提供するユーザ発話対応のテキストを含む発話テキスト表示領域を有する表示データの制御を実行する表示データ制御ステップを有し、
　前記表示データ制御ステップは、
　前記発話テキスト表示領域または背景領域の少なくともいずれかの表示態様を制御して、会話を実行するユーザのユーザ状態、または会話状態の少なくともいずれかの状態を可視化した表示データを生成するステップである情報処理方法。